昨天说LNC是拿3nm做了个Zen4,看起来还是太保守了。
事实上很明显LNC约等于Zen4这事只在功耗最高的一个点成立,往下无论单核还是带着12个SKM核心的多核测试都无法与Zen4竞争。
截至目前Linux PMC仍未很好支持LNC/SKM所以做不了很细致的分析,只收集了一些基本数据。文章不想写了,各位将就看着办吧。
事实上很明显LNC约等于Zen4这事只在功耗最高的一个点成立,往下无论单核还是带着12个SKM核心的多核测试都无法与Zen4竞争。
截至目前Linux PMC仍未很好支持LNC/SKM所以做不了很细致的分析,只收集了一些基本数据。文章不想写了,各位将就看着办吧。
昨天多次提到L2/L3/内存延迟问题,有人可能会问:ARL的能效这么差,是不是完全因为L2/L3/内存延迟?
那么不妨挑两个几乎纯粹用L1跑的子项(531/548)单独拉一条曲线出来。
答案显然是否定的,LNC在这些完全与缓存不沾边的测试里能效和性能也都非常差。Lunar Lake的LNC能效有些许改进,但依然不占优。
那么不妨挑两个几乎纯粹用L1跑的子项(531/548)单独拉一条曲线出来。
答案显然是否定的,LNC在这些完全与缓存不沾边的测试里能效和性能也都非常差。Lunar Lake的LNC能效有些许改进,但依然不占优。
David's random thoughts
果然不出所料的看到知乎上有人分析地洋洋洒洒,讲Intel是个好公司,它越来越不行本质上是美国不行了。 嗯,我觉得他说的全都对,因为抢走Intel营收的NVIDIA是印度公司,AMD是越南公司,Apple是朝鲜公司。先进半导体行业早就没美国什么事了,散了散了。
想起来之前吐槽过这条,现在大家看到Intel扔给台湾制造的东西是什么样了吗?
所以你可以认为造船是美国制造业问题,或者说把波音洛马诺格出事,把通用福特乃至特斯拉的麻烦归结于美国制造都行。但唯独芯片这种非劳动力密集型却极其耗电耗水怕地震的高端制造业输给台湾,只有公司自己不行一个结论。
所以你可以认为造船是美国制造业问题,或者说把波音洛马诺格出事,把通用福特乃至特斯拉的麻烦归结于美国制造都行。但唯独芯片这种非劳动力密集型却极其耗电耗水怕地震的高端制造业输给台湾,只有公司自己不行一个结论。
👍18😁7🔥1
David's random thoughts
265K单线程SPEC IA能效这方面,大核测试出了非常奇怪的曲线,似乎在4.3 - 5.4 GHz之间的电压会偏高,导致曲线凹下去一段。看起来目前电源管理依然不成熟 在最高功耗的区间,LNC单线程展现出了与Zen 4相近的性能与功耗,但是低功耗则与竞争对手渐行渐远 SKM相比RPL的表现与Intel给出的数据基本一致。
私底下聊了会,我大概知道曲线为什么画成这样了,很有趣
14-19W区间的265K确实电压偏高,主板疑似将ring频率定在了最高点,带高整个IA rail电压
在功耗减半的4GHz,缓存延迟敏感的523子项IPC出现cliff,此时大概ring频率终于下降,导致输入电压降低
正常曲线应该是图2紫色这样,不过这并不改变结论
14-19W区间的265K确实电压偏高,主板疑似将ring频率定在了最高点,带高整个IA rail电压
在功耗减半的4GHz,缓存延迟敏感的523子项IPC出现cliff,此时大概ring频率终于下降,导致输入电压降低
正常曲线应该是图2紫色这样,不过这并不改变结论
😁7👍3
JEDEC桌面DDR本身在开倒车是最大的原因。主流消费级平台需要的是低延迟,但是标压DDR为了迎合服务器提升能耗比和吞吐的需求降低电压,延迟每代上升。到现在桌面DDR的延迟甚至已经连最新手机LPDDR都不如了。
但是我依然是反对XMP/EXPO的,我认为应该标准化一个高电压版“HP” DDR并且提供完整的warranty
往不好听的说,XMP是带有欺骗性质的行为。不止一次遇到有人问为什么京东自营买3200内存在支持3200的OEM机上只能开2133,一看发现3200是XMP,SPD里JEDEC频率是2133
事实上也是如此,把4800内存加个压就标8000+频率卖,无异于给i9-13900K标9GHz的频率。你上不上的了9GHz是你自己的事,反正我LN2 LHe能。
https://x.com/hjc4869/status/1850928387684278743
👍29
才发现有的头部数码媒体连CMC prefetcher的作用和应对方法都不知道,对着Cortex-X用常规工具测出来的访存延迟曲线瞎分析强行解释一通,说它能访问别的核心的private L2……晕了
😁17🥰1
更新SD8E大/小核测试成绩,以及一些Lakefield Tremont小核的娱乐跑分。其中SD8E大核应该有一些降频。 https://blog.hjc.im/spec-cpu-2017
👍5❤1
David's random thoughts
更新SD8E大/小核测试成绩,以及一些Lakefield Tremont小核的娱乐跑分。其中SD8E大核应该有一些降频。 https://blog.hjc.im/spec-cpu-2017
这次高通8E之所以往榜上写大核第一轮分数,主要还是由于没有经过我以往测手机的低温处理所以降频比较严重,后两轮在500/502/525/548这些高负载测试里分数下降比较明显。当然这并不是说第一轮就没有降频,我跟别的群友对了下成绩依然偏低。小核则是3轮基本同一个分数。
原始的报告大概是这个样子。
原始的报告大概是这个样子。
你还是没有回答我的问题,为什么9575F的540GB/s内存可以做到30元1GB,同样带宽的M4 Max就有justification去让我花更贵的价格购买?
而且Apple本身都不支持你的这个说法。我不知道你有没有发现本代M4 Max加内存比M4 base便宜。按照你的带宽/位宽理论,它应该贵4倍而不是便宜一半。
所以我一直在说不要通过做加减乘除算术题的思路去论证Apple给内存和SSD定价的合理性,更不要跟正经PC/Server行业去试图比价格。
它卖得贵真的只是因为有人买而已。
https://x.com/hjc4869/status/1852215806626795894
X (formerly Twitter)
David Huang (@hjc4869) on X
@shivinkoo 你还是没有回答我的问题,为什么9575F的540GB/s内存可以做到30元1GB,同样带宽的M4 Max就有justification去让我花更贵的价格购买?
而且Apple本身都不支持你的这个说法。我不知道你有没有发现本代M4 Max加内存比M4 base便宜。按照你的带宽/位宽理论,它应该贵4倍而不是便宜一半。
而且Apple本身都不支持你的这个说法。我不知道你有没有发现本代M4 Max加内存比M4 base便宜。按照你的带宽/位宽理论,它应该贵4倍而不是便宜一半。
👏32👍9
写golang写多了想把copilot键映射到一键输出 if err != nil { return nil, err }
😁32
更新Snapdragon 8E的测试成绩: https://blog.hjc.im/spec-cpu-2017
其中Oryon-L依然不是全程维持4.32 GHz的最高频率,通过linux perf频率监测可以得知各个子项的平均频率在3.8-4.3 GHz之间。将所有子项的全程平均频率再进行几何平均计算可以得到4GHz的结果,因此频率一栏使用4GHz这个数值。
😅 再没人说我是高通黑了吧!(小声
其中Oryon-L依然不是全程维持4.32 GHz的最高频率,通过linux perf频率监测可以得知各个子项的平均频率在3.8-4.3 GHz之间。将所有子项的全程平均频率再进行几何平均计算可以得到4GHz的结果,因此频率一栏使用4GHz这个数值。
❤13🥰1