新iPhone发售之后,对A17 Pro只能给个喜忧参半的评价
CPU两个P核总面积跟高通一个X核差不多,说一句PPA全方位遥遥领先也不过分。不过圈子里不止一人反馈日常发热比前代严重,至少目前没调校好。
另一方面,新GPU在占了将近20mm²,以及坐享24M SLC的情况下能效居然远不如6M SLC的Adreno,有点丢人了。
CPU两个P核总面积跟高通一个X核差不多,说一句PPA全方位遥遥领先也不过分。不过圈子里不止一人反馈日常发热比前代严重,至少目前没调校好。
另一方面,新GPU在占了将近20mm²,以及坐享24M SLC的情况下能效居然远不如6M SLC的Adreno,有点丢人了。
❤5
Valve: 给proton/dxvk做shader pre-caching解决第三方优化不佳的游戏出现shader编译卡顿
Also Valve: 2023年发布CS 2,一进游戏就是满脸的shader编译卡顿🙃
Also Valve: 2023年发布CS 2,一进游戏就是满脸的shader编译卡顿🙃
😁8🔥3❤1👍1
为什么 AMD 放弃了 APU 产品线?
Client做了6年HSA APU都没有什么实际的场景能很好地应用zero-copy、cache coherency等APU专属的功能,但这些功能的开发与验证却需要在独显与CPU以外投入相当多的资源。顺应实际需求图简单做成“集成独显”是正确的选择。
但是HPC领域的软硬件产品依然在沿用HSA的老底子,从MI250X开始就可以把CPU端的指针扔给GPU直接读取数据(CPU、GPU为非对称的NUMA节点,Grace Hopper也是类似),MI300A更是把CPU/GPU做成了真正的UMA。
这才是真正符合APU最初构想的应用场景,而不是做给桌面端买前生产力,买后打游戏。
https://www.zhihu.com/question/624630242/answer/3251458427
Client做了6年HSA APU都没有什么实际的场景能很好地应用zero-copy、cache coherency等APU专属的功能,但这些功能的开发与验证却需要在独显与CPU以外投入相当多的资源。顺应实际需求图简单做成“集成独显”是正确的选择。
但是HPC领域的软硬件产品依然在沿用HSA的老底子,从MI250X开始就可以把CPU端的指针扔给GPU直接读取数据(CPU、GPU为非对称的NUMA节点,Grace Hopper也是类似),MI300A更是把CPU/GPU做成了真正的UMA。
这才是真正符合APU最初构想的应用场景,而不是做给桌面端买前生产力,买后打游戏。
https://www.zhihu.com/question/624630242/answer/3251458427
👍14
AI PC?
生成式AI火了一年多了,然而微软至今没有主动为Windows用户开发哪怕一款纯本地运行的生成式AI应用。给Windows 11和Office做了那么多AI功能集成,仔细一看全都是接入Bing或者Office365推广自家线上服务和订阅。
与之同时,微软放着大量算力不俗、AI-capable的现成Windows软硬件,以及适合本地AI集成的应用场景不管,不提供纯本地部署运行的完整解决方案。不说AI,甚至连Excel加个python功能都是用发送到云端运行返回结果到本地的方式实现。卖云、卖订阅制服务早就已经深入骨髓,成为了微软的头号优先战略,任何其它事情都不可动摇。
就这状况居然会有人吹什么AI PC能掀起什么波澜,是真的没想明白还是心里清楚但是还是因为某些原因当装傻?且不说现在所谓的AI PC/NPU的算力、精度和编程模型能实现几个真正可用的本地生成式AI应用,连Windows生态里综合实力最强的微软自己都是本地AI的头号叛徒,我看各家蹭个AI热度还是差不多得了。
生成式AI火了一年多了,然而微软至今没有主动为Windows用户开发哪怕一款纯本地运行的生成式AI应用。给Windows 11和Office做了那么多AI功能集成,仔细一看全都是接入Bing或者Office365推广自家线上服务和订阅。
与之同时,微软放着大量算力不俗、AI-capable的现成Windows软硬件,以及适合本地AI集成的应用场景不管,不提供纯本地部署运行的完整解决方案。不说AI,甚至连Excel加个python功能都是用发送到云端运行返回结果到本地的方式实现。卖云、卖订阅制服务早就已经深入骨髓,成为了微软的头号优先战略,任何其它事情都不可动摇。
就这状况居然会有人吹什么AI PC能掀起什么波澜,是真的没想明白还是心里清楚但是还是因为某些原因当装傻?且不说现在所谓的AI PC/NPU的算力、精度和编程模型能实现几个真正可用的本地生成式AI应用,连Windows生态里综合实力最强的微软自己都是本地AI的头号叛徒,我看各家蹭个AI热度还是差不多得了。
👍15😁5❤1
2023年有两种室温超导材料,第一种存在于韩国人无法重现的实验,第二种存在于贴吧吧友们脑海中想象的Meteor Lake
Intel独创的超导供电,PCB、SoC供电平面完全由超导材料组成,使VID电压与晶体管电压完全相等,因此可以将RWC的晶体管电压直接与RPL的VID放在一张图里比较!
(全文阴阳怪气,别真信了)
Intel独创的超导供电,PCB、SoC供电平面完全由超导材料组成,使VID电压与晶体管电压完全相等,因此可以将RWC的晶体管电压直接与RPL的VID放在一张图里比较!
(全文阴阳怪气,别真信了)
🤡5
🔥8
我现在有一个想法:把所有设备上的Telegram客户端回滚并永久锁定在支持Telegram Premium之前的最后一个版本
👍5
Apple M3的CPU性能实在是没太多好说的,这点提升连挤牙膏都不算,如挤!
不过GPU微架构非常有看点,感觉CU的设计是主流图形GPU转入RISC SIMD以来最独特的一次改变,同时也解释了之前关于A17 GPU运行传统跑分的PPA为何如此平庸的疑惑。等什么时候有机会摸到硬件一定要写几个microbench好好品鉴一番……
不过GPU微架构非常有看点,感觉CU的设计是主流图形GPU转入RISC SIMD以来最独特的一次改变,同时也解释了之前关于A17 GPU运行传统跑分的PPA为何如此平庸的疑惑。等什么时候有机会摸到硬件一定要写几个microbench好好品鉴一番……
❤1
AMD设计SEV居然有这么大一条漏网之鱼……malicious hypervisor能随意drop guest的dirty cache可太刺激了。
https://twitter.com/InstLatX64/status/1724656517993959614
https://twitter.com/InstLatX64/status/1724656517993959614
🤯3👍1
早些时发现523.xalancbmk这个子项在x86平台非常的cache latency bound,而较大且低延迟的L2是M1/M2的一大特色,12-16M提供足够高的命中率又能维持比x86低得多的延迟。M1可以在这个子项里达到同频将近两倍于Zen3/4的性能可能就有一个主要原因在此。
不过前段时间经过观察发现M3 max的L2延迟以及延迟周期数都有显著增加,可能是为了做6核cluster以及同时拉高频率导致。那么523.xalancbmk的ipc掉的这么狠也不难理解了……
JamesAslan - M3Pro的败北:太阳底下没有新鲜事,即便是苹果也。。。。
不过前段时间经过观察发现M3 max的L2延迟以及延迟周期数都有显著增加,可能是为了做6核cluster以及同时拉高频率导致。那么523.xalancbmk的ipc掉的这么狠也不难理解了……
JamesAslan - M3Pro的败北:太阳底下没有新鲜事,即便是苹果也。。。。
知乎专栏
M3Pro的败北:太阳底下没有新鲜事,即便是苹果也。。。。
CPU体系结构“自古以来”就有两个流派:speed demon和brainiac。用现代CPU来举例,那么Intel与AMD就是前者的典型代表:冲击极限频率,搭配尚可的PPC性能(IPC),获得极高的总性能。Apple与Arm则是后者的中坚力量…
👍1🔥1
❤🔥1
MI300X:一个主要为了高精度HPC场景设计的平台,“恰好”在AI所需要的低精度矩阵计算这方面也非常有竞争力。于是它在现在这个市场环境下被AMD将错就错拿来当AI芯片营销,发布会后AMD喜提股价大涨10%。
https://www.zhihu.com/question/633725195/answer/3319382295
https://www.zhihu.com/question/633725195/answer/3319382295
❤1