David's random thoughts
🙃 再也无法相信Linux主线内核的amdgpu驱动了,换成ROCk的out of tree module之后一大堆ROCm相关的玄学问题瞬间消失,无语。
Linux 6.10.1 的主线驱动似乎好了不少,我又能相信主线了!
😁2
Zen 5首发给大部分媒体送测超轻薄笔记本的后果是你甚至找不到几个单核跑满了频率没降频的Cinebench测试……
🤣17👍1
Zen 5 补充测试 (1/2): 更多微架构细节 https://blog.hjc.im/zen-5-more-details-1.html
👍4
🙃NPU 1W左右功耗,50 TOPS int8 + 50GB/s带宽,被宣传的感觉价值至少得有个3000块了。。
明天试试看移植个模型会不会比之前用7840U顺利点。
明天试试看移植个模型会不会比之前用7840U顺利点。
另外关于NPU,从samples拿了个llama.cpp,prompt processing / text generation 的功耗大概是图里这样。
7B q4_0的实际性能:prompt processing大约20 token/s和火力全开的28W 4+8 CPU差不多,text generation大约6 token/s是2CCX CPU的一半(NPU内存带宽也相当于单个CCX)
跑LLM只能说聊胜于无吧。
7B q4_0的实际性能:prompt processing大约20 token/s和火力全开的28W 4+8 CPU差不多,text generation大约6 token/s是2CCX CPU的一半(NPU内存带宽也相当于单个CCX)
跑LLM只能说聊胜于无吧。
至于为什么等效延迟是1而不是0.5,这是我目前遇到的一个主要问题。
目前版本的微码似乎单个线程是无论如何都看不到两个解码器的,也就是出了op$或者关掉op$之后前端直接就变成4-wide并且只能每周期1 taken了(无论带不带分支跳转)。这个显然跟AMD宣传的单线程可以用两个decoder不符,需要更多调查。
目前版本的微码似乎单个线程是无论如何都看不到两个解码器的,也就是出了op$或者关掉op$之后前端直接就变成4-wide并且只能每周期1 taken了(无论带不带分支跳转)。这个显然跟AMD宣传的单线程可以用两个decoder不符,需要更多调查。
果然不出所料的看到知乎上有人分析地洋洋洒洒,讲Intel是个好公司,它越来越不行本质上是美国不行了。
嗯,我觉得他说的全都对,因为抢走Intel营收的NVIDIA是印度公司,AMD是越南公司,Apple是朝鲜公司。先进半导体行业早就没美国什么事了,散了散了。
嗯,我觉得他说的全都对,因为抢走Intel营收的NVIDIA是印度公司,AMD是越南公司,Apple是朝鲜公司。先进半导体行业早就没美国什么事了,散了散了。
😁31🤣20🤡3
David's random thoughts
服了华硕,新机器发出来不给驱动下载,于是我wipe掉自带的预装系统弄了个24H2 LTSC之后就有个谜之ACPI设备感叹号在这儿…… 我在犹豫要不要去UEFI菜单里联网恢复自带系统,就为了捞这一个驱动出来!
实在忍不住强迫症还是下载了个原版镜像,看起来是这玩意,给触摸板实现手势用的HID filter。
LNL本身整体综合看表现还是不错的,但是唯独定低价这一点完全不可能……全身上下都在打金币弹的金贵玩意
https://x.com/cherylnatsu/status/1820032097253490968
https://x.com/cherylnatsu/status/1820032097253490968
😁12🤔1
更新Ryzen AI 9 HX 370 (名字真难念)的大/小核心测试成绩。大核能摸到M2附近,小核是8cx gen 3的大核水平,正好这两组对比的缓存容量接近,不过ARM两家有一些SLC
目前测的内容感觉凑不齐一篇文章,后面等桌面出了再慢慢凑吧…其实PMC比较让人意外,还需要一些时间来分析。
目前测的内容感觉凑不齐一篇文章,后面等桌面出了再慢慢凑吧…其实PMC比较让人意外,还需要一些时间来分析。
👍4