479 - Telegram Web

Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
479 - Telegram Web

David's random thoughts

😆核显跑deepseek r1的32B蒸馏模型CoT速度有点感人，内存也不够大

1.82K views14:22

David's random thoughts

用了几天Kinoite才感受到Debian KDE6体验多么支离破碎。比如Fedora sddm自动按edid配缩放而Debian需要改配置，Debian的task switcher不全等等。

想想早年Fedora给我的坏印象是GNOME不稳定导致，以至于后来换KDE还因为刻板印象坚持Debian也有点无语。。只能说把桌面发行版做好也没那么容易吧🙃

#碎碎念

2.1K views13:30

David's random thoughts

完全就是浪费沙子

https://x.com/karminski3/status/1883434859429024073

X (formerly Twitter)

karminski-牙医 (@karminski3) on X

速报，寄了嗷，NVIDIA Project Digits 内存带宽只有 275GB/s. 意味着跑 70B-int4 速度只能到 6.8 token/s. 如果跑 DeepSeek-R1-Distill-Qwen-32B-Q5_K_M, 大概是 12.5 token/s. 就是个更便宜的 MacMini M4 Pro。

如果信了老黄的说法，用这个跑200B的大模型，一分钟也就能吐出来2句话。

😁25👍1

2.71K views08:59

David's random thoughts

画了一大堆ARL-H的各种能效曲线（单线程/全核/6大核/8小核），越来越感到TSMC救不了Intel😅

😁17🤣9

1.61K views14:42

David's random thoughts

与其相信一个新的大模型恰好在模型发布后的一周、论文发布后的第五天能让芯片板块蒸发一万亿市值，还不如大年初一去医院看看脑子是不是有什么毛病……

https://x.com/TechPowerUp/status/1884145246931480992

X (formerly Twitter)

TechPowerUp (@TechPowerUp) on X

Trump Administration Plans to Impose 25-100% Tariffs on Taiwan-Sourced Chips, Including TSMC https://t.co/LMuxf5z15M

👍32

2K views03:45

David's random thoughts

RTX 50 8.0%

https://videocardz.com/pixel/nvidia-rtx-5080-is-on-average-8-3-faster-than-rtx-4080-super-according-to-first-review

😁15🤯3🍾2

1.5K views09:46

David's random thoughts

光追开倒车可还行

https://www.guru3d.com/review/review-nvidia-geforce-rtx-5080-founders-edition-reference/page-25/

😁22🐳7

2.17K views03:09

David's random thoughts

也许是唯一真正还有那么一点点值得看一眼的Surface

https://twitter.com/pavandavuluri/status/1884982425526399418

X (formerly Twitter)

Pavan Davuluri (@pavandavuluri) on X

We're thrilled to introduce the latest additions to our @Surface for Business Copilot+ PC family: Surface Pro and Surface Laptop, now available with the latest Intel Core Ultra processors. And for the first time ever, we’re adding cellular connectivity to…

👀5

1.57K views17:25

David's random thoughts

看起来mesa 24.3.x的vulkan驱动可以用核显的XMX

👍13

1.73K views14:03

David's random thoughts

Fedora rawhide的master branch内核可以用主线amdxdna NPU驱动了，可以考虑试着拿onnx跑个什么模型。

（图中为Debian LXC container）

2.08K views05:17

David's random thoughts

TSMC救不了Intel：酷睿Ultra 7 255H（Arrow Lake H45）测试

https://blog.hjc.im/tsmc-cant-save-intel-core-ultra-255h-arrow-lake-h-review.html

👍26

2.23K views16:44

David's random thoughts

好日子还在后面呢，特意留了H45平台4核Lion Cove的数据就等着明年测PTL对比。

👍7

1.7K views18:48

David's random thoughts

昨天ARL文章发出去之后有质疑为何用gcc 12 -march=alderlake而非gcc 14 -march=arrowlake进行SPEC测试。

去年我确实考虑升级编译器重做排行，后来用gcc 14测了21个CPU后我得出gcc近年性能完全在摸鱼的结论于是就没怎么继续做了。

既然有人提到，这里给出gcc 14 -march=arrowlake的测试。高了1%。

😁28👍5

1.87K views09:01

David's random thoughts

如果一个人以前从来没有聊过Qwen以及DS 2.5之前的版本却在DS R1/V3出来之后大吹特吹，基本可以认为是在蹭热度。

👏32

1.42K views02:18

David's random thoughts

双路epyc现在能堆出1.1 TB/s的带宽，跑单请求LLM理论上吐字速度已经不逊于5090以下的任何显卡。Xeon那边理论上用MCR-8800内存能堆到1.7 TB/s而且AMX有更高的算力，但是现在这内存全网都找不到几条卖的，只有闲鱼卖ES。。

https://x.com/Hydrogen0E7/status/1888771102056603752

👍13🤯2🐳1

1.86K views02:23

David's random thoughts

在我看来两者性质没有什么太本质的区别，diffusion model无法生成真正符合现实世界逻辑的图像，而LLM并不真正理解编程语言的语法，吐出的代码甚至没法保证过编译。

只不过无效的代码不会被人到处截图传播来恶心码农但AI图不一样，要是每天有不懂写码的人到处晒AI生成的过不了编译的代码也会很烦（逃

https://x.com/NankyuSeiichi/status/1889223578710888692

👍26🤡2

1.5K views02:22

David's random thoughts

VLIW NPU拿来跑计算密集的prefill问题不大。前阵子私底下试过基于OGA的AMD XDNA+RDNA的混合LLM方案（NPU跑prefill，GPU跑decode），NPU可以在2.5W内实现llama 8B 350+ t/s的pp。

这个性能大致相当于16CU的RDNA 3.5火力全开跑llama.cpp的水平，如果软件支持跟上了能真正用起来的话还是相当不错的。

https://x.com/karminski3/status/1889566828919214152

👍14

1.56K viewsedited 08:05

David's random thoughts

🙃唉还想着等Asahi Linux支持M4 Pro之后把现在这一大堆LLM server搬过去，现在有点堪忧了

https://www.phoronix.com/news/Hector-Martin-Resigns-Asahi

😁17😢4🕊1

1.53K views16:53

David's random thoughts

主流游戏卡真的是一点都不能用，说是双槽卡但是上下都要恰好入侵到相邻插槽，实际上就是个4槽卡。

🔥16👍5🤬4

1.52K views11:50

2025/07/09 19:49:16
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>