Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
479 - Telegram Web
Telegram Web
😆核显跑deepseek r1的32B蒸馏模型CoT速度有点感人,内存也不够大
用了几天Kinoite才感受到Debian KDE6体验多么支离破碎。比如Fedora sddm自动按edid配缩放而Debian需要改配置,Debian的task switcher不全等等。

想想早年Fedora给我的坏印象是GNOME不稳定导致,以至于后来换KDE还因为刻板印象坚持Debian也有点无语。。只能说把桌面发行版做好也没那么容易吧🙃

#碎碎念
画了一大堆ARL-H的各种能效曲线(单线程/全核/6大核/8小核),越来越感到TSMC救不了Intel😅
😁17🤣9
与其相信一个新的大模型恰好在模型发布后的一周、论文发布后的第五天能让芯片板块蒸发一万亿市值,还不如大年初一去医院看看脑子是不是有什么毛病……

https://x.com/TechPowerUp/status/1884145246931480992
👍32
看起来mesa 24.3.x的vulkan驱动可以用核显的XMX
👍13
Fedora rawhide的master branch内核可以用主线amdxdna NPU驱动了,可以考虑试着拿onnx跑个什么模型。

(图中为Debian LXC container)
TSMC救不了Intel:酷睿Ultra 7 255H(Arrow Lake H45)测试

https://blog.hjc.im/tsmc-cant-save-intel-core-ultra-255h-arrow-lake-h-review.html
👍26
好日子还在后面呢,特意留了H45平台4核Lion Cove的数据就等着明年测PTL对比。
👍7
昨天ARL文章发出去之后有质疑为何用gcc 12 -march=alderlake而非gcc 14 -march=arrowlake进行SPEC测试。

去年我确实考虑升级编译器重做排行,后来用gcc 14测了21个CPU后我得出gcc近年性能完全在摸鱼的结论于是就没怎么继续做了。

既然有人提到,这里给出gcc 14 -march=arrowlake的测试。高了1%。
😁28👍5
如果一个人以前从来没有聊过Qwen以及DS 2.5之前的版本却在DS R1/V3出来之后大吹特吹,基本可以认为是在蹭热度。
👏32
双路epyc现在能堆出1.1 TB/s的带宽,跑单请求LLM理论上吐字速度已经不逊于5090以下的任何显卡。Xeon那边理论上用MCR-8800内存能堆到1.7 TB/s而且AMX有更高的算力,但是现在这内存全网都找不到几条卖的,只有闲鱼卖ES。。

https://x.com/Hydrogen0E7/status/1888771102056603752
👍13🤯2🐳1
在我看来两者性质没有什么太本质的区别,diffusion model无法生成真正符合现实世界逻辑的图像,而LLM并不真正理解编程语言的语法,吐出的代码甚至没法保证过编译。

只不过无效的代码不会被人到处截图传播来恶心码农但AI图不一样,要是每天有不懂写码的人到处晒AI生成的过不了编译的代码也会很烦(逃

https://x.com/NankyuSeiichi/status/1889223578710888692
👍26🤡2
VLIW NPU拿来跑计算密集的prefill问题不大。前阵子私底下试过基于OGA的AMD XDNA+RDNA的混合LLM方案(NPU跑prefill,GPU跑decode) ,NPU可以在2.5W内实现llama 8B 350+ t/s的pp。

这个性能大致相当于16CU的RDNA 3.5火力全开跑llama.cpp的水平,如果软件支持跟上了能真正用起来的话还是相当不错的。

https://x.com/karminski3/status/1889566828919214152
👍14
🙃唉还想着等Asahi Linux支持M4 Pro之后把现在这一大堆LLM server搬过去,现在有点堪忧了

https://www.phoronix.com/news/Hector-Martin-Resigns-Asahi
😁17😢4🕊1
主流游戏卡真的是一点都不能用,说是双槽卡但是上下都要恰好入侵到相邻插槽,实际上就是个4槽卡。
🔥16👍5🤬4
2025/07/09 19:49:16
Back to Top
HTML Embed Code: