自从三年前AMD Zen架构的处理器发布以来,AMD Yes的口号就喊得没停过,AMD确实打了一场漂亮的翻身仗,从而为今后数代产品的改良与提升打下了坚实的基础。那么在正式介绍Zen3架构之前,我觉得有必要先回顾一下Zen1和Zen2架构的主要特点,这样才能更深刻的理解Zen架构的演进之路以及新一代产品的特性。
一、Zen架构回顾1、Zen(一代),14nm,Ryzen 1000系列
Zen一代架构的起点就相当高,比推土机架构效能提升50%之多,幅度很恐怖主要是之前太弱了。当同核心同频率时(注意同频率这个前提),Zen1与当年Intel 6代酷睿单核效能接近,多核效能则实现反超,这是一个非常可喜的进步,代表了Zen架构的潜力。
但可惜的是,由于当年GF 14nm工艺依然落后于Intel 14nm半代,所以Zen1的频率上不去,较低的默认主频,导致Zen1的单核效能依然偏低,不过多核效能与Intel不相上下,核心数越多,AMD的优势会越明显。
Zen1,单芯片8核心,由两颗4核心CCX组成
Zen是单芯片原生8核心设计,但其内核依然是由两颗独立的4核CCX组成的。Zen灵活的CCX架构设计可以轻而易举的通过多芯片策略,制造出双芯片16核甚至4芯片32核(Zen1并未开放32核,Zen1+才开放),所以AMD的策略就是以更低的成本提供更多的核心数量,从而在需要绝对多核性能的高端CPU市场站稳了阵地。
Zen1的极致产品,线程撕裂者1950X,内部4颗芯片,只开放了2颗,组成16核32线程
Zen把主流桌面级CPU带入了8核心时代,以极高的性价比,为用户提供了强悍的视频编辑、转码、压缩、渲染等计算性能,不过游戏性能依然存在差距。2、Zen+,12nm,Ryzen 2000系列
Zen一代的频率上不去,GF 14nm工艺拖了后腿,所以AMD改用了台积电12nm工艺,这就是Zen+,频率提升了100-300MHz,但架构不变,也没有质的变化,就不多做介绍了。
Zen+最大的优势就是AMD敢把4颗芯片组合成一颗32核心64线程的超级产品,这就是Ryzen Threadripper 2990WX。3、Zen2,7nm+12nm,Ryzen 3000系列
Zen2时代,有了台积电7nm工艺的加持,单CCX内部4核心所搭配的L3缓存得以翻倍至16MB,再加上一级缓存、指令集、分支预测、整数运算单元的改进,综合来说获得了15%的效能提升。
16核心32线程Ryzen 9 3950X结构
Zen2的另一大改变,就是把原本北桥的功能(内存控制器+PCIE控制器)又从CPU内核中拆分了出来,一方面可以使用便宜且成熟的上代工艺来制造,另一方面多颗芯片的组合将会更加灵活。AMD用“胶水大法”把8颗CCD再加一颗大“北桥”整合在了一块CPU上,达到了恐怖的64核心128线程!
8颗8核,组成了64核128线程
从此Zen2在多核心高端CPU市场已经所向无敌了,成为多少算力都不够的工作站级首选。Zen2的单核效能虽然也有所提升,但Intel也没有原地踏步,所以依然未能实现反超。这就导致AMD Yes了那么久却始终无法俘获消费级市场最大的客户群体——游戏玩家的芳心。
现在Zen3来了,工艺保持7nm+12nm不变,完全依靠架构的改良,彻底逆转战局,游戏玩家们准备好了吗?
二、Zen3的架构与特性1、重新设计CCD:只含1组CCX,从4+4核变为真8核,整合L3缓存,从4核共享16MB变为8核共享32MB
前面说了,Zen1和Zen2的单芯片CCD结构是一样的,内含2组CCX,Zen2只是把单CCX内部的L3缓存翻倍到了16MB,每组CCX各自拥有独立的16MB L3,所以就是4+4核心,16+16MB L3的分离式设计。而Zen3单芯片CCD内部只有1组CCX,直接就是8核心32MB L3:
好处是显而易见的,每颗核心可访问的L3缓存容量翻倍,可以大幅减少核心对内存的访问,整块L3缓存池可以有效降低核心与核心之间的延迟。重新设计的环形通信结构,也降低了核心与缓存之间的延迟。而对缓存访问与CPU核心之间通信延迟最敏感的应用,就是各种游戏了,游戏一般会有一条主导进程,它会频繁调用缓存。官方称,从Zen2到Zen3,1080p的游戏性能平均提升幅度达26%,而LOL、CS、PUBG的提升幅度更是高达40-50%。
另外一个好处是,Zen2在应用调用核心超过4颗后,可能会发生跨CCX的通信,延迟会增加3倍以上,而Zen3是真正8核设计,不存在额外的跨CCX延迟,这对于多核效能的提升也很有帮助。2、IPC效率提升19%:L1缓存翻倍,分支预测改进,指令并行度增加,优化存储性能
Zen3是整个Zen系列中最重要的架构更新,是全方位的、跨越前后端的整体改款,涉及端到端的优化、缓存、载入/存储、执行单元、预取、调度、解码等。
L1分支预取缓冲区容量翻倍,达到1024个,分支预测带宽增加,延迟降低,分支预测失败后恢复更快。从而达到了更高效的指令和缓存预取,尤其是长指令。
Zen3的浮点及整数执行单元的宽度和灵活性得到增强,以实现更低的延迟提供更多的执行能力。3、复用Zen2的12nm IOD,保证完美的主板兼容性
其实就是传统意义上的北桥芯片,由GF 12nm代工,和Zen2上的一摸一样,如此一来就能保证完美的兼容性,事实上各大主板厂商都已经为Zen3升级了BIOS。
Zen3的最佳芯片组自然是X570,GF 14nm工艺制造,额外提供PCI-E 4.0支持,CPU连接芯片组的4条通道带宽自然也受益于PCI-E 4.0而翻倍了,挂在南桥上的万兆有线网卡、Wi-Fi 6无线网卡、USB3.1 Gen2、SATA6等都将受益,总带宽的提升可以大幅缓解存储设备并发传输数据时的拥堵情况,毕竟所有的外部设备都要共享这4条PCI-E通道。Intel芯片组与CPU之间的DMI总线其实也是4条PCI-E通道,当然只是3.0版本的。
其实最需要PCI-E 4.0通道的还不是显卡,而是新一代4.0的M.2 SSD,X570可以额外提供一个全速M.2接口,再加上CPU内部IOD提供的全速M.2,够发烧友们使用了。
当然B550和A520芯片组也可以支持Zen3处理器,其中B550可以利用CPU内部IOD提供的PCI-E 4.0全速M.2,也是极具性价比的选择。
现有的AMD 500系列主板通过简单的BIOS更新,就可以立即支持AMD锐龙5000系列台式处理器。而从明年1月开始,AMD 400系列主板也将通过BIOS更新提供支持,如果对PCI-E 4.0没有需求的话,用旧主板换新CPU非常简单方便,还省钱。
三、性能测试1、Zen3 vs. Zen2,新架构提升有多大?
我用Ryzen 9 5900X对比上代的Ryzen 9 3900XT,这两颗CPU的工艺相同、核心数相同、频率也十分接近,所以它俩之间的性能差异,几乎都是由Zen3架构所带来的:
可以看到,单线程性能提升很大,约20%左右,而多线程性能有所收窄,只有10%左右。原因也不难理解,Zen3 L3缓存的整合对于单线程帮助最大,相当于L3翻倍了,而全核满载的话总的L3都是64MB,不占优势。另外5900X睿频略高基础频率略低也是个原因。2、5950X vs. 5900X,更多的核心能强多少?
渲染、压缩、转码等能把所有核心都压榨到极限的应用,提升会很大。而负载较低的就不明显了,毕竟架构相同,全靠频率。3、5900X vs. 10900K,同价位对比
终于,不必再区分单线程与多线程了,全面领先。当然,由于5900X多2颗核心,所以在多线程和重负载项目中的领先优势会更大,优势高达20-40%。最关键的其实是单线程项目,10900K在拥有高睿频优势的情况下,依然输给了5900X,Zen3可以说完全依靠架构优势取得胜利,单线程领先幅度在10%左右。4、游戏性能:
业余跑测试的我没有条件进行大量游戏的对比测试,所以我这里引用其它媒体的数据:
可以看到,5950X和5900X的游戏性能几乎没区别,毕竟很少有游戏能用到那么多核心,但比频率差不多的Zen2旗舰有了显著提升,这就是Zen3架构的力量,也是Zen架构自诞生以来在游戏方面取得的最大幅度提升,足以逆袭Intel的幅度。
测试数据来自快科技
需要提醒的是,这是1080p分辨率下的游戏性能,这种测试虽然会放大CPU对游戏帧数的贡献,但也很有参考价值,随着144Hz甚至240Hz高刷新电竞显示器的普及,玩家们在玩竞技游戏时需要更高的帧数,此时仅靠顶级显卡可能还不够,也需要顶级CPU的支持,所以在上百帧的游戏中,Zen3所带来的贡献可达20-30%之多,十分可观了。
但如果是4K全特效玩游戏大作,当帧数挣扎在及格线上时,CPU之间的性能差距其实不会有这么大。四、选购建议
首批Zen3架构的处理器共4款,现在应该已经上架JD开卖了,规格与价格如下:
Zen1我用的是Ryzen 7 1700X,Zen2我用的是Ryzen 7 3800XT,Zen3我依然推荐8核心的产品,也就是Ryzen 7 5800X。因为我很少干视频转码的事,不会把所有的核心资源都利用上,主要是玩游戏,那么原生8核心且频率更高的5800X就是首选了,更多的核心对我来说没用。当然考虑性价比的话5600X也是可以的,少两颗核心在游戏中影响不大,也就差了100MHz频率而已。
有计算需求的,推荐Ryzen 9 5950X/5900X,核心越多越好
对于游戏玩家,我更推荐Ryzen 7 5800X/5600X
当然如果你压缩编码渲染等计算需求,而且预算不是问题,那就无脑上多核,选5950X。但如果从性价比角度考虑的话,Zen2的多核性能也不错,3000系列也是超值之选,毕竟Zen3要贵一些。总结
测试成绩是振奋人心的,在Zen3这一代,AMD将IPC效率大幅提升,尤其是单核效能大幅提升,终于在消费级用户最在意的游戏领域战胜Intel,从而完成了彻底超越。回顾三代Zen架构可以发现,AMD之所以赢得了胜利实现全面超越,既要靠自身的努力,也要靠历史的进程。
自身的努力就是对架构的不断优化,IPC效能持续提升,CCD与CCX结构灵活调整,将IOD(我作为老玩家愿意称之为北桥)拆分出来是神来之笔,正所谓CPU大势,分久必合合久必分,此举既降低了成本,又可以放手施展堆芯片战术,轻松的用单Die 8核堆出来了16核32核甚至64核128线程的撕裂者怪兽。而Intel坚持单Die原生多核战术,规模很快就遇到了瓶颈,而且Die越大良率越低成本成倍提高,所以在超高端超多核市场,Intel是既没有性能优势也没有价格优势。想当年“胶水多核”战术可是Intel发明的,现如今被AMD运用到炉火纯青的地步,不由得让人感慨十二年河西十二年河东(还记得胶水双核奔腾D、胶水四核Core 2 Quad吗?)。
历史的进程就是半导体制程进入了瓶颈期,AMD最先遇到困难,后来搭上了台积电12nm和7nm的顺风车,7nm工艺除了帮助AMD提高主频之外,也大幅降低了功耗,从而助力Zen2和Zen3在每瓦性能方面大幅领先于Intel,也使得AMD放手堆叠更多芯片生产超多核处理器成为可能。而Intel船大掉头难,无法抛弃自家工厂,在10nm受阻之后,只能死守14nm不停的打磨,但也不得不服Intel固守14nm依然拥有主频和超频优势,但功耗实在是收不住了,超多核市场失守。而随着Zen3的发布,Intel在IPC与游戏性能的优势也不复存在,彻底被动了。
我是非常乐意看到不断进取的AMD打破僵局,取得对Intel的全面胜利。但我也对Intel感到惋惜,牙膏厂这些年旧牙膏挤得真是太久了,不仅打磨工艺挤牙膏,Skylake架构也在挤牙膏,希望Zen3的出现能加速Intel挤完14nm Skylake这管牙膏,赶紧换一管新的,这样以后的竞争才会更有趣。
2020年是神奇的一年,我们见证了很多悲剧也见证了很多奇迹,而在PC行业最大的奇迹,那就是AMD CPU时隔15年再次完成对Intel的全面超越。而今年我们还有可能见证AMD显卡的觉醒,AMD告别了旗舰级无卡可卖的窘境,从官方公布的消息来看,RX6800XT足以硬刚NVIDIA RTX3090,但实际表现究竟如何,AMD到底能不能完成CPU与GPU同时逆袭?拭目以待吧!???