NVIDIA的RTX 30系列显卡已经在今年9月份正式发布了,作为GPU市场弱势的一方,AMD当时在高端市场并没有什么新产品进行应对。不过千呼万唤始出来,A粉们的耐心等待得到了回报。在“RDNA 1”架构显卡上小试牛刀,大幅度提升能耗比略有成果之后,AMD在10月份正式发布了基于“RDNA 2”架构的RX 6000系列显卡,在发布会上我们看到新架构的表现比很多人的预期要好得多,在RDNA 1架构的基础上继续大幅度提升了能耗比与性能,核心面积也从之前的小核心变成了大核心,在诸多方面都有着显著的提升,这次AMD来真的了。
同时,我们也准备了视频版的评测,欢迎前往观看。RDNA 2架构解析:更快频率、更高能耗比、更强性能
RDNA 2架构三大改进点:
· 高频率设计:RDNA 2架构相比RDNA 1架构实现了同功耗下30%的MAX频率提升;
· 无限缓存设计:可以消除带宽瓶颈,极大的提升了等效带宽并降低功耗,有助于提升能耗比;
· 支持DX12U、DS API:紧随时代潮流,让A卡支持光追等高级API特性。
RDNA 2架构是一个强大的游戏架构,它这次相比RDNA 1代架构主要有三个大改进。首先AMD在RDNA 2上实现了突破性的高频率设计,在拥有高频率的同时维持较好的能耗表现。其次AMD专门为RDNA 2研发了革命性的AMD Infinity Cache无限缓存技术,多达128MB的无限缓存在提供非常可观的等效带宽的同时还更节能,能耗表现更上一层楼。第三个改进点就是支持了DX12 Ultimate的高级特性,包括DXR、DirectStorage等API,让AMD的显卡也加入到支持DX12 Ultimate的大家族中。改进1:唯快不破,RDNA 2架构主打高频设计
我们先来看频率改进,RDNA 2实现了突破性的高频率设计,虽然与RDNA都是相同的7nm制程工艺但是进步巨大。通过这张图表我们可以看到,以每个计算单元CU为例RDNA 2架构实现了相同功耗30%的频率提升,而如果是相同的频率则功耗只有RDNA的一半还少一些,也就是能耗比提升50%以上。
注意图片,此时的能耗比计算频率被定在了RX 5700 XT的公版Boost频率,也就是1905MHz左右,这也是上一代公版显卡的峰值频率,RDNA 2在这个频率下功耗大大降低,因此在功耗可控的范围内,借助能耗比的提升AMD在RDNA 2上有信心提高显卡的核心频率上限,突破2GHz自然也是水到渠成了。改进2:消除带宽瓶颈,引入“Infinity Cache”技术
RDNA 2的成功源自于RDNA 1的研发经验,在RDNA 1代架构上AMD在两组CU单元组成的Dual Compute Unit中添加了L0级缓存,全新设计的L1缓存及减少拥塞的4MB共享L2缓存,让RDNA架构提升了缓存带宽、减少了缓存的延迟及功耗。最终通过256-bit位宽14Gb/s显存速率的GDDR6显存达到了448GB/S的显卡带宽,看起来还是很不错的。
但后来AMD发现这种设计有一个致命的缺点,那就是L2缓存在游戏中命中率很低,这也导致RX 5000系列显卡的性能表现没能发挥到极致。AMD GPU研发团队看到了这一点并着手改进,针对缓存进行调整,他们同时还要完成一个挑战,那就是在翻倍CU单元、提高核心频率的同时解决掉带宽紧缺的问题。
那么这个挑战如何解决呢?AMD给出了自己的解决方案——“Infinity Cache”中文译名“无限缓存”,还记得"ZEN"架构中的“Infinity Fabric”总线吗?AMD特别喜欢“Infinity”无限这个单词,这次既然缓存不够用、命中率也低,那我直接搞一个大缓存也就是所谓的“无限缓存”不就完了吗?
咳咳,说回正题,这项技术的实现多亏了CPU部门的研发经验,AMD解决思路其实就是把原本用于EPYC霄龙服务器处理器上的高密度SRAM专门为GPU加以优化, 并且为其加上AMD在Zen架构上大获成功的“Infinity Fabric”无限总线, 两者合二为一就成为了“Infinity Cache”无限缓存这个新一代带宽利器。
“无限缓存”技术的使用最终给RDNA 2架构带来了丰厚的收益,首先是在带宽方面,256-bit的GDDR6显存配合128MB的无限缓存相比于传统的384-bit GDDR6显存可以实现2.17倍的等效带宽,同时功耗仅为对方的90%,这样的表现是值得称赞的。高等效带宽的加入也显著的提升了游戏性能,并降低了大约34%显存延迟,提升了缓存的命中率,让RDNA 1架构在缓存上的缺陷得以解决。
OK,让我们把之前的优化都放到一起,就能看到RDNA 2通过“无限缓存”大带宽,低功耗的帮助实现了IPC的提升、同时提高工作频率,完成每个时钟指令的功耗也下降明显。最后把三项提升综合到一起,就可以让RDNA 2架构在RDNA 1架构的基础上能耗比继续大幅度提升,多达54%。改进3:紧随时代潮流,全面支持DX12U、DS API
我们再来看RDNA 2架构上第三个改进点,支持更多的高级特性。AMD在RDNA 2上终于全面支持了DirectX 12 Ultimate、DirectStorage API等高级特性,让A卡也可以使用诸如DirectX光线追踪、可变速率着色、网格着色器、采样器反馈等技术。· 光线加速器 Ray Accelerator
实时光线追踪是一个能让游戏画面更真实、提高玩家沉浸感的重要技术。它的优点相信大家都知道,这里不再赘述。实时光线追踪最大的缺点就是对显卡的计算能力要求极高,传统的CU单元运行实时光线追踪的效率非常低,为了让实时光线追踪的画面更为流畅,AMD在RDNA 2架构的每一个CU计算单元里都放入了一个"Ray Accelerator"光线加速器, 由此可推断CU计算单元越多,RDNA 2架构显卡的实时光线追踪性能就越强大。
"Ray Accelerator"光线加速器是用于处理光线相交计算的专用硬件。与软件方案相比,其相交计算性能可提高10倍。AMD还提到实时光线追踪性能也可以吃到“无限缓存”带来的增益,并且由于RDNA 2覆盖市场的全面性,PC与主机都能享受到实时光线追踪的技术。· 可变速率着色 Variable Rate Shading
可变速率着色(Variable Rate Shading)是DirectX 12 Ultimate的加速着色特性。简单来说,VRS的原理是通过改变单次像素着色器操作所处理的像素数量,来改变屏幕不同区域的着色质量。简单来说,它可以改变同个画面中不同部分的渲染精细度,它的用处是提高画面帧数。
在不开启VRS的情况,也就是正常情况下,一帧画面的所有像素都是独立着色的;而开启VRS之后,原本独立的像素被分成了一个个像素块,它们会共享着色结果,此时GPU会根据程序员设定的重要性分级为所有像素块分配不同的着色精细度。拿上面的图片为例,车辆和远景部分的像素仍然是独立着色的,但快速变动的道路和路边的像素块就是区块共同着色的,此时由于显卡的计算资源得到了节约,所以游戏的帧数会有所提高。此前的RDNA 1代架构不支持这项技术,但在RDNA 2架构上,AMD加入了VRS可变速率着色的支持。· 网格着色器 Mesh Shaders
在过去的二十年中,传统的几何图形处理管线已经增加了好几个阶段了,不过它的核心理念仍然基于传统的光栅化预着色方法的,放在今天已经过于复杂,并且拖累处理效率。硬件和软件开发者都希望改变这一现状,于是,DirectX 12 Ultimate引入了Mesh着色器,它为开发者提供了前所未有的可编程能力。
原本的管线中,GPU硬件的并行能力被隐藏,或者说是被自动化了,硬件会帮助打包操作然后并行执行它,这很高效,但也存在问题——灵活性不够。Mesh着色器就完全改变了这一过程,它不再是针对单一顶点或图元的单一函数,而是工作在整个计算线程组中。在某一阶段中,Mesh着色器的每个线程都是针对一个顶点,而在另外一个阶段,每个线程针对着一个图元。整个线程组的内存是共享的,访问灵活度很高,同时开发人员对硬件的控制权也更大,甚至还能启发新的技术,节约内存使用量和内存带宽。
由于现在游戏场景很复杂、规模也很宏大,如果用原本的方式生成三角形,会消耗太多的CPU draw call,而Mesh Shaders引入了一种更灵活的模型,可以让开发人员能够规避CPU性能瓶颈并使用更高效的算法来生成三角形,本质上就是Mesh Shader生成三角形给光栅器,不用CPU慢慢跑三角形。补全之前的遗憾,AMD的RDNA 2架构显卡正式支持了网格着色器 Mesh Shaders这项技术。· 采样器反馈 Sampler Feedback
采样器反馈 Sampler Feedback是允许游戏引擎去跟踪纹理采样器的使用方式,让后者向引擎提供反馈,方法是生成“反馈图(Feedback Map)”,它会记录不同纹理区域的不同驻留等级,然后程序可以根据这些反馈信息来做决策——包括该如何使用纹理采样器和要在显存中保留哪些资源等。这比原先的流程更为精确,可以更好地分配计算资源。简单来说它的实际效果就是用更少的显存渲染更大、更详细的纹理。
另外,采样器反馈还允许了一项新技术——纹理空间着色。它可以在不栅格化对象的情况下进行对象着色,其中心目的就是缓存和重用着色结果,减少GPU的计算量。采样器反馈的使用可以让游戏拥有更好的视觉质量、更短的加载时间和更少的卡顿。它的核心思想实际上就是让程序只加载必要的纹理,把资源交给更有需要的地方。Adrenalin新驱动解析
AMD这次在驱动软件层面继续给玩家们带来新的功能,其中一些功能在RX 5700系列显卡上已经展示过但并没有大规模使用,AMD承诺他们将与游戏厂商继续深度合作,把Adrenalin驱动中的“好功能”带给更多的玩家。考虑到一些同学对之前的A卡特性不是特别熟悉,在讲解完新功能之后还会对老功能回顾一下。· Radeon Rage Mode:狂暴模式一键提升性能
AMD这次提供了三种超频选项供玩家选择,驱动自动超频与手动超频是之前就拥有的,AMD专门为RX 6800 XT与RX 6900XT提供了一个“Rage Mode”狂暴模式,用户仅需在驱动软件中轻轻点击即可进入“狂暴模式”,在该模式下你的显卡会被提高最多6%的TGP功耗上限,从而提升性能,并且也无需担心显卡的安全问题,该模式并不影响显卡保修,关于狂暴模式的性能提升我们下面的性能测试中会提到。
自动超频模式则是显卡自动进行小幅度的频率提升,但是可能会因为芯片体质的差异造成黑屏掉驱动的问题,是一个老的超频方案,相比起“狂暴模式”来说稳定性稍微低一些。而对于“高玩老司机来说”,手动模式依旧是最值得信赖的模式,你可以非常精确的调整非常多的显卡参数,根据自己显卡的芯片体质进行摸索,挖掘出显卡的最大潜能。· AMD Smart Access Memory:智能寻址显存技术
AMD是目前唯一一家能同时提供顶级CPU与GPU的厂商,多年以来A粉一直期盼着CPU、GPU两个领域能进行“联动”,3A平台神秘加成的故事一直在流传但从未实现过。现在,未来已来,AMD在发布会上隆重介绍了AMD Smart Access Memory智能寻址显存技术,这是AMD借助PCIe4.0的高速带宽实现的一项新技术。
在传统基于Windows的PC系统中,CPU处理器一次只能同时访问GPU的一部分显存(VRAM)并非整个显存,这限制了性能的发挥。PCIExpress技术的Base Address Register基址寄存器可以定义映射多少个离散的GPU内存空间,一般来说,处理器只能访问显存的一小部分,通常仅限于256MB大小的映射内存,这个大小放在今天是远远不够用的,由于数据传输效率较低,CPU与GPU的性能并没有完全发挥出来。
现在AMD Smart Access Memory技术可以凭借PCIe4.0的高速带宽扩展数据通道,一次访问所有的内存,大大提升了数据传输效率,消除了之前的传输瓶颈以提升性能。AMD提早布局CPU、主板芯片组、显卡的PCIe4.0支持终于收到了成效。
这项技术的使用是有一定要求的,首先你需要一个AMD Ryzen 5000系列的处理器,其次一块AMD Radeon RX 6000系列显卡也是必不可少的,最后是一块芯片组为X570/B550的主板。这项功能在显卡发售时,主板厂商就会更新一版可以支持AMD Smart Access Memory 的BIOS,只需要在BIOS中开启即可享受到平均6%的性能提升,算是这次AMD RDNA 2架构显卡一个锦上添花的好技术,我们在下面的实际测试中也会针对性的看看AMD Smart Access Memory在游戏中能带来多少帧数提升。· FidelityFX:开源工具包,提供多种游戏优化技术
大型游戏开发通常是一项大工程,需要在一定的时间内程序、美术、等人员多方面的通力合作,因此在整个开发周期中难免会存在一些问题。此外各家游戏厂商使用的游戏引擎不同,开发人员对游戏引擎的熟练度也不同,游戏的帧数优化也是很让人头疼的。为了更好的画面表现,GPU开发商会与游戏厂商进行合作,为游戏进行专属优化,增强游戏画面表现。不过这项工作通常比较繁琐,需要花费很多精力。
AMD为了帮助开发者提升游戏画面保真度,推出了FidelityFX SDK(软件开发程序包),帮助开发者提高游戏画质,AMD FidelityFX 是基于RDNA架构优化的解决方案,可供开发人员在游戏中部署。 FidelityFX让游戏开发者能够以超低的系统性能开销实现卓越的视觉质量,释放更多显卡资源帮助玩家畅玩游戏。
需要说明的是FidelityFX本身是一个开源工具包,自己并不是某一种技术,而是一个总称。FidelityFX 里面有很多技术,打个比喻就是AMD盖了一个叫“FidelityFX”的“少林寺”,少林寺里面有很多独门武功,AMD现在免费邀请进寺庙学武的游戏开发商学习,多种武艺任游戏开发者挑选,可以学习其中一种,也可以都学,AMD表示他们正在增加并优化FidelityFX的功能,让开发者可以轻松的实现各种游戏画面优化技术。
在RX 5700系列显卡发布的时候,AMD发布了FidelityFX中的一种功能——高对比度自适应锐化功能(Contrast Adaptive Sharpening,CAS),可以让原本由于抗锯齿技术导致的模糊画面更加锐利、对比度更高。同时自适应锐化功能还支持在动态分辨率的情况下使用。AMD称这项技术是由FXAA抗锯齿开发者开发的,可以轻易集成并且支持任何GPU。
这项技术的使用效果还是非常明显的,我们看到上方F1赛车的轮胎以及赛道细节,明显开启了CAS技术后的画面更锐利,诸如《F1》《古墓丽影:暗影》《无主之地3》等游戏其实已经加入了CAS技术的支持。除了CAS之外,AMD FidelityFX目前还拥有屏幕空间反射技术(SSSR)、自适应环境光遮蔽(CACAO)、HDR贴图技术(LPM)、单通采样器技术(SPD)等5种开源画面优化技术供游戏开发者使用。
此外,为了缓解实时光线追踪技术带来的帧数下降,竞争对手利用AI张量单元推出了深度学习超采样抗锯齿技术作为一种缓解策略,而AMD也不想落入下风,他们正在紧锣密鼓的与游戏开发人员进行合作研发一种名叫“FidelityFX Super Resolution”的技术,只不过现在没有任何细节透漏出来,我们也只能期待一下后面的驱动更新了。· Radeon Anti-Lag:优化调度,减少输入延迟
在我们玩游戏时,我们点击键鼠或手柄时向电脑输入操作指令,而电脑根据我们发送的指令来渲染游戏画面。从我们点击鼠标/键盘/手柄到显示画面的时间成为“输入延迟”。对于一些玩家尤其是电竞选手对降低输入延迟有着极高需求。
具体来说,显卡完成画面渲染需要CPU调用,CPU向显卡发送指令渲染游戏画面。所以在这种情况下,优化CPU调用效率、提高GPU负载就成为解决如数延迟的关键。而这也可以通过软件的指令调度优化。显卡与CPU之间的软件媒介是驱动,通过驱动对CPU指令调度GPU渲染进行优化,可以降低输入延迟,响应更快,提升体验。AMD Radeon Anti-Lag技术最大的特点是你只需要一块AMD显卡就能使用,相比竞争对手的降低输入延迟技术要显示器鼠标显卡都要进行认证来说,它的使用门槛更低,关于它的效果我们之后有时间会单独进行测试。· Radeon Boost:动态调整分辨率,智能提升帧数
在推出Radeon Anti-Lag之后,为了照顾一些显卡性能较差的老用户,AMD又推出了Radeon Boost技术,这项技术其实没什么特别的,简单说就是当年静止不动时画面会渲染原生的分辨率,当画面出现剧烈变化时,Radeon Boost就会开始工作,自动降低游戏的渲染分辨率,由于人眼对高速移动的模糊物体不是特别敏感,所以这个技术在一定程度上能“欺骗”你的大脑。
由于渲染分辨率降低,因此帧数在画面剧烈变化会有一定提升,只不过这毕竟是低分辨率渲染,画面表现其实是比较差的,所以除非是显卡性能是真的不够用,一般情况下不推荐大家开启这个功能。即便是开启也要找那些针对Radeon Boost深度优化的游戏,比如《无主之地3》,美漫风格的画面降低一些分辨率渲染效果还算是能让人接受,这个时候Radeon Boost还是有一定价值的。· Radeon Imaging Sharpening:更通用的锐化技术
AMD Radeon Imagining Sharpening(RIS)是一个经常被大家忽略的功能,事实上它可以通过算法对玩家的游戏画面进行锐化,在一些老游戏或者贴图质量相对模糊的游戏中的表现非常令人印象深刻,在诸如《地下城与勇士》《命运2》等游戏中开启RIS都会让原本比较模糊的画面更加清晰,视觉效果提升明显。
早前多年前为了消除画面中的锯齿,从硬件开发商到游戏厂商都在想方设法解决这个问题,于是推出了如TAA、FXAA等抗锯齿技术。虽然这些技术让画面边缘更加平滑,但也不可避免的导致了边缘模糊。玩家现在已经可以通过更高的分辨率获得锐利的画面,只不过不是所有人的显卡都能在高分辨率下保持高帧率,为了缓解玩家们的“尴尬”,AMD适时的推出了Radeon Imaging Sharpening锐化技术。
AMD在2019版的Adrenalin驱动中添加了Radeon Imaging Sharpening功能,通过这个功能锐化画面、恢复游戏清晰度。而且AMD让这项技术更具普适性,在首发时即可在DirectX 9、DirectX 12以及Vulkan图形API中使用,同时基于AMD的算法,RIS技术几乎可与所有抗锯齿技术同时开启,在保证效果的同时不会产生过度锐化产生的振铃效应。到了2020年,之前不能开启RIS的DirectX 11游戏也得到了支持,这让RIS技术大大提升了实用性,毕竟很多老游戏只有DX 11模式,他们的画面表现可以通过RIS技术再上一层楼,因此RIS是一个足够低调但也足够实用的技术。· Radeon Chill:智能动态调节功耗
显卡在渲染画面时几乎一直处于高负载运行,即使是在画面静止时显卡也一直以高帧率渲染画面,这浪费了很多电能。所以AMD在软件层面添加了Radeon Chill功能,在画面静止时以低帧率渲染画面,当驱动监测到画面变化后,会迅速调用GPU重新以高帧率渲染画面,实现了流畅游戏与节能之间的平衡。
这个技术我自己使用过很多次,你可以自己设定Chill时的最低帧与最高帧,当过场动画、菜单、或者你临时有事没有移动画面的时候,Radeon Chill就开始工作降低到你预设的帧数,从而降低功耗。此外,由于你还设置了一个最高帧数,这种办法也可以用来限制游戏帧数上限,从而节约功耗降低显卡发热。最后无论玩家的显示器是否支持FreeSync技术,Radeon Chill功能都会显示器刷新率自动设置帧率目标,保证画面流畅顺滑。Radeon RX 6800 XT/6800规格介绍
下面是Radeon RX 6800 XT/6800两张新显卡与Radeon RX 5700 XT/5700的规格对比表:
我们看到今年的两张RDNA 2架构新显卡与之前的RDNA 1架构显卡一样,都是采用了TSMC的7nm制程工艺,只不过核心面积则是从251平方毫米增加到了519平方毫米,足足翻了一倍。与此对应的晶体管数量也从RDNA 1代的103亿暴增到268亿,数量翻了一倍多,这样计算下来AMD的RDNA 2架构的晶体管密度是有提升的。
在RDNA 2架构上AMD继续沿用了CU计算单元,每个CU计算单元内拥有64个流处理器。之前GCN时期CU单元的数量由于功耗问题始终无法突破64组,但在RDNA 2架构大幅度提升能耗比的情况下,AMD终于可以突破这个限制了,在RX 6800 XT上AMD拥有72组CU计算单元,4608个流处理器,而RX 6800也拥有60组CU计算单元,3840个流处理器。相比之下一代RDNA 1架构的CU数量就是“小巫见大巫”了,最高规格的RX 5700 XT也不过40组CU计算单元,2560个流处理器而已,因此在硬件规格层面,RDNA 2架构显卡提升巨大。
实时光线追踪对计算单元压力极大,为了缓解这种压力,AMD为RDNA 2架构引入了专门的硬件加速单元“Ray Accelerator光线加速器”。在RDNA 2中每一个CU计算单元内部都具备一个RA光线加速器单元,因此RX 6800 XT具备72个RA单元,RX 6800具备60个RA单元,RDNA 2架构中CU计算单元的数量越多,RA单元也就越多,实时光线追踪性能也就越强大。而RDNA 1架构则不具备RA单元。AMD这次还提升了负责抗锯齿与传统光栅能力的ROP单元与纹理单元,其中RX 6800 XT具备128个光栅单元,288个纹理单元;RX 6800具备96个光栅单元,240个纹理单元。这些单元的数量提升相比上一代显卡都很大,可以极大的加强RDNA 2架构显卡的传统光栅能力以及抗锯齿性能。
在频率上RDNA 1代架构引入了游戏频率这个概念,这个指标的含义就是指显卡在重度负载游戏下的最低工作频率,也就是游戏时频率的“低保线”。而根据之前RX 5700系列显卡的经验来看,RDNA 1代架构玩游戏时的频率是远高于游戏频率的,甚至是可以超过Boost频率。在频率方面,RDNA 2架构显卡进步明显,RX 6800 XT基础频率为1825MHz,游戏频率2015MHz,Boost加速频率达到了2250MHz!这个数字在之前的RDNA 1代显卡上如果想要出现是非常困难的,RDNA 2在频率上的突破会成为它能大放光彩的重要基础。而定位稍低一些的RX 6800表现也不错,虽然基础频率与游戏频率都是1815MHz,但是Boost频率达到了2105MHz,也是突破了2GHz的大关,这个时候上一代的RX 5700 XT 1905MHz的Boost频率就有点不够看了,RDNA 2在频率上的提升不可谓不大。
频率的提升反映到了单精度浮点性能上,这个参数在一定程度上可以反映显卡的游戏性能,与竞争对手直接翻倍FP单元造成的单精度浮点性能“虚高”不同,AMD这边是实打实的单精度浮点性能。在RX 5700 XT上单精度浮点性能为9.75TFLOPS,还不到10TFLOPS,而RX 6800 XT的单精度浮点性能直接达到了20.74TFLOPS,翻了一倍还要多!而RX 6800也有16.17TFLOPS的单精度浮点性能,这些数字都可以间接说明RDNA 2的游戏性能是多么强大。
显存方面,RDNA 2架构依旧采用GDDR6显存,只不过容量翻倍到16G,显存速率也从14Gb/s升级到16Gb/s,显卡的带宽也从448GB/s提升到了512GB/s,提升并不大。为了缓解带宽不足的问题,RDNA 2架构显卡引入了“AMD Infinity Cache”,RX 6800 XT/6800均配备128MB大小的“Infinity Cache”。
最后是功耗方面,由于规格的大幅增加,功耗相比之前有所提升。RX 6800 XT的TGP功耗为300W,RX 6800的TGP功耗为250W,且两者均采用双8PIN标准供电接口。建议零售价RX 6800 XT为5099元人民币,RX 6800为4599元人民币,两者差距仅为500元。Radeon RX 6800 XT/6800公版显卡外观
两张新A卡的外观设计语言趋于一致,都放弃了之前的涡轮散热方案,改用开放式的三风扇散热,这种设计最大的好处就是提高散热效果,同时更为静音。正面有亮银色、灰色两种颜色进行搭配,两张显卡实际的观感比图片中还要高级不少,3个带有“R”标志的80mm风扇周围的边框会随着光线转变的角度折射光芒。
RX 6800公版显卡
RX 6800 XT公版显卡
虽然设计语言十分相像,但两张显卡还是有区别的,图中左侧的就是RX 6800它中间风扇的周围并没有任何额外设计,而右边的RX 6800 XT中央风扇的周围有一个“X”字样的贴片设计,宣示着自己属于“XT”系列显卡。
在背板的设计上两张卡都是一样的,中间大面积的银白色配合上下两条灰色的条状设计,有一种当年VEGA 64 LC的味道,不过实话实说VEGA 64 LC的颜值可能是历史上公版显卡的巅峰了,其他显卡很难超越。
我们再把镜头转向侧面,两张卡如出一辙,只不过“Radeon”的信仰LOGO颜色并不相同,不过别担心,上机之后都会变成红色的。
值得一提的是,AMD在公版显卡的供电设计上并没有跟随竞争对手的激进设计策略,而是继续使用了常见的标准双8PIN供电,并且供电的位置位于显卡最右侧,没有放在中间,这对机箱的理线美观度会有一定的帮助。
在接口方面,两张显卡都是一样的,均配备了一个HDMI2.1接口、两个DisplayPort1.4接口和一个USB Type-C接口。其中前两种接口比较常见,这里就不赘述了,USB Type-C接口是一个非常方便的接口,它可以做到“一线通”,即一根线同时完成显示器的供电与信号传输,非常的实用,它甚至还可以给你的手机充电,让这个地球真正“环保”。
顺带一提,AMD这次还提升了显卡的视频输出以及解码编码能力。RDNA 2架构显卡支持VP9格式的4K 90帧、8K 24帧解码;H.264格式的1080P 600帧、4K 150帧的解码,1080P 360帧、4K 90帧的编码;支持H.265格式1080P 360帧、4K 90帧、8K 24帧的解码,1080P 360帧、4K 60帧的编码;以及AV1格式的8K 30帧解码能力。
在尺寸方面,两张显卡的长度完全一致,RX 6800 XT与RX 6800两者的长度均为267mm,高度均为120mm。厚度上RX 6800 XT为2.5槽设计,RX 6800则为双槽设计,这两张显卡的尺寸可以兼容绝大多数机箱,AMD也在官网表示这是有意为之,他们希望自己的公版显卡可以更轻松的安装在更多人的机箱中。显卡拆解RX 6800 XT公版显卡拆解
RX 6800 XT公版 PCB正面
RX 6800 XT公版显卡用料非常扎实,标准的双8PIN供电位于PCB右侧,显卡共计15相供电。6相供电位于PCB左侧,9相供电位于PCB右侧。
RX 6800 XT公版 PCB背面
RX 6800 XT公版核心背面的陶瓷电容
RX 6800 XT公版采用了8颗2GB容量的GDDR6显存,总容量16GB,显卡位宽256-bit、显存速率16Gbps,显卡带宽512GB/s,显存制造商为三星。
RX 6800 XT公版的供电MosFET来自英飞凌,型号为TDA21472,单个最大电流为70A。
RX 6800 XT公版的供电PWM共有三颗芯片,分别是IR35217、英飞凌的XDPE132G5D、CYPD5137-40LQXI,正面一颗,背面两颗。
RX 6800 XT公版采用真空腔均热板进行散热,这相比铜管散热更为高效,在显存、供电MosFET上均配备导热贴,方便散热器快速的带走这些关键零部件的热量。此外核心散热并没有采用硅脂,而是与RX 5700系列公版一样的石墨烯散热片方案,理论上这种设计的热传导效率会更好一些。
RX 6800 XT公版背板RX 6800公版显卡拆解
RX 6800公版 PCB正面
RX 6800公版显卡用料也非常扎实,在长度上与之前的RX 6800 XT公版PCB保持一致,同样的标准双8PIN供电,显卡共计15相供电。6相供电位于PCB左侧,9相供电位于PCB右侧。
RX 6800公版 PCB背面
RX 6800公版核心背面的陶瓷电容
RX 6800公版同样采用了8颗2GB容量的GDDR6显存,总容量16GB,显卡位宽256-bit、显存速率16Gbps,显卡带宽512GB/s,显存制造商为三星。
RX 6800公版显卡的供电MosFET型号为5470QE,这款MosFET的具体信息在网上还没有查到。
RX 6800公版的供电PWM共有三颗芯片,并且与RX 6800 XT完全相同,分别是IR35217、英飞凌的XDPE132G5D、CYPD5137-40LQXI,正面一颗,背面两颗。
RX 6800 XT公版散热同样采用了真空腔均热板散热器,只不过厚度比RX 6800 XT要小一些,在显存、供电MosFET上同样具备导热贴,方便散热器快速的带走这些关键零部件的热量。此外核心散热并没有采用硅脂,而是与RX 5700系列公版一样的石墨烯散热片方案,理论上这种设计的热传导效率会更好一些。
RX 6800公版显卡背板测试平台与说明
AMD最新发布的5000系列处理器在游戏方面有重大提升,并且原生支持PCIe4.0以及AMD Smart Memory功能,因此我们今天选择的CPU是AMD Ryzen 7 5800X处理器。显卡我们找来了在发布会上AMD为RX 6800 XT/6800“钦点”的两位对手RTX 3080/2080 TI显卡,让我们看看在实际的测试中两张A卡是否能对竞争对手占据优势。
注意本次测试A卡均开启SAM技术,关于这项技术的关闭影响会在后面单独讨论,故如无特殊说明跑分、帧数等成绩都是默认开启SAM技术的。3DMark理论性能测试
我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme、Port Royal以及DirectX七个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal以及DirectX是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3DMark显卡单项的得分。
在传统项目理论测试中,两张A卡的表现都很不错。在传统的优势项目Fire Strike系列跑分中,RX 6800 XT与RX 6800都双双领先竞争对手15%-19%不等。而在N卡的传统优势项目Time Spy系列跑分中,RTX 3080仅仅是在4K下取得了略微的优势,在2K的Time Spy中甚至被RX 6800 XT反超,RTX 2080 Ti则是在任何传统测试中都不敌RX 6800。
但是光追理论测试就大反转了,竞争对手毕竟是发展了两代的RT Core,在光追测试中优势十分明显,Port Royal理论跑分里RX 6800 XT勉强达到了RTX 2080 Ti的水平,3DMark最新推出的DirectX测试中两张A卡则是完全处于下风,帧数表现均不敌RTX 2080 Ti。
我们同时还开启了狂怒模式进行测试,从结果上看理论跑分确实相比默认有一点提升,不过并不大,这个模式提升的性能十分有限。实际游戏性能测试
因为AMD Radeon RX 6800 XT/6800两张显卡的主要目标是在2K、4K分辨率下进行游戏,因此本次的测试重点放在了2K、4K的光追与传统光栅化游戏的测试,所有游戏测试时均开启最高特效(地铁:离去为Ultra模式),并且图形API均选择游戏支持最新的API。现在随着次时代主机的发布,我特意挑选了几款“次时代”游戏进行测试,这些游戏对显卡的要求极高,更能体现显卡在新游戏中的表现。考虑到买3A平台回家的玩家没有理由不开启SAM,故下面的测试中如无特殊说明,均开启了SAM技术进行测试。
注意:以下测试AMD显卡均开启了SAM技术,关于SAM开关对比我们会单列出一个对比表格。2K游戏性能测试传统光栅化游戏性能测试
在传统光栅化游戏的测试中,比拼的就是显卡的硬实力了。在这些项目中两张A卡优势明显,在大多数游戏中RX 6800 XT与RX 6800均分别对位领先RTX 3080以及RTX 2080 Ti。RX 6800 XT的领先幅度为0%-32%不等,在传统游戏中大幅度领先了RTX 3080显卡。而RX 6800的领先幅度也是达到了2%-26%,大幅度领先了RTX 2080 Ti显卡,这与之前的理论性能跑分趋于一致,在2K分辨率下A卡的传统游戏性能十分强悍。A家的两张显卡内战差距符合了两者硬件规格的差距,仅需500块钱就有近20%的提升,RX 6800 XT的性价比毋庸置疑。
此外,狂怒模式的表现聊胜于无,这毕竟是集成在驱动内的“小超”模式,在性能的提升上并不明显。光追游戏性能测试
注意:以下游戏测试中支持DLSS1.0技术的开启DLSS,支持DLSS2.0技术的开启DLSS质量模式。
光追游戏的结果也跟之前的理论跑分趋于一致,竞争对手第二代的光追性能领先了AMD不少。大多数情况下RX 6800 XT的光追性能会领先RTX 2080 Ti,只不过还不能跟RTX 3080展开竞争。RTX 3080的光追性能不但领先所有参测显卡,更重要的是凭借DLSS深度学习超采样抗锯齿技术,在画面质量最大保留的DLSS质量模式下,NVIDIA的两张显卡还能继续提升帧数,让游戏体验更加流畅。考虑到这毕竟是AMD的第一代光追显卡,对这样的表现我还是保持理解的。狂怒模式下的光追游戏表现提升与传统光栅化表现提升是一样的微小,并不能立竿见影的提升性能。4K游戏性能测试传统光栅化游戏性能测试
让我们再把测试战场转移到4K Gaming,在4K传统光栅游戏测试中我们发现AMD的显卡依旧拥有优势,只不过领先优势相比2K分辨率有所下降,在《重返德军总部:新血脉》《看门狗:军团》《古墓丽影:暗影》中RTX 3080甚至帧数会更高一点点,以微弱的优势反超,在其余游戏中则是AMD的两张显卡高歌猛进。RX 6800 XT的领先幅度受到了4K的影响下滑到了0%-23%,但总体上依旧领先RTX 3080。RX 6800的领先幅度为0%-19%,总体上也领先RTX 2080 Ti。光追游戏性能测试
注意:以下游戏测试中支持DLSS1.0技术的开启DLSS,支持DLSS2.0技术的开启DLSS质量模式。
4K光追测试的结果与理论跑分乃至2K光追游戏测试如出一辙,NVIDIA凭借着更老道的光追经验领先了AMD,DLSS的帮助更是让N卡的表现更上一层楼,提供更流畅的光追体验。
总结一下,实际游戏的表现与之前的理论跑分趋向一致,RDNA 2架构在光追性能上还处于第一代RTX图灵显卡的水平,可以抗衡DLSS的FSR超分辨率技术现在也还在开发中,光追性能对上RTX 30系显卡并没有取得优势。传统性能测试方面则是AMD大胜利,这点在2K分辨率时尤为突出。虽然4K分辨率领先幅度有所下降,但这不能改变RX 6000系列显卡传统性能十分强大的客观事实。
这里我猜测在4K分辨率下游戏对显卡带宽的压力变大,“无限缓存”技术可能因此受到了影响,最终导致RX 6000系列显卡性能不如2K分辨率时亮眼。我们拿到的毕竟是早期的驱动版本,看看未来AMD能不能在驱动层面对这个问题加以优化。Smart Access Memory性能测试
我们上方的成绩均开启了Smart Access Memory技术,如果关掉这个技术,帧数能差多少呢?我们对两张显卡继续进行Smart Access Memory性能对比测试。2K性能测试
在2K分辨率下,SAM技术提升的幅度从1%-9%不等,这与之前AMD宣传的平均提升6%的性能差不多。这项技术是一个锦上添花的作用,并不能直接大幅度的提升性能,因此即便你不是AMD CPU的用户也无需担心性能下降太多,可以放心购买。而AMD CPU用户则“不开白不开”,免费提升性能的事谁不愿意呢。4K性能测试
在4K分辨率下,SAM提升的性能幅度就更加有限了,基本上就是1%-4%之间,几乎可以忽略不计,结论也跟之前的2K分辨率测试一样,不是AMD CPU的用户也没关系,如果是那就更好,免费提升平均6%的性能。根据AMD官方数据某些游戏下SAM的提升还是比较可观的,可以达到11%的帧数提升,只不过由于时间关系这次的SAM测试只是挑选了部分游戏,我们后续会专门针对这个功能进行更为详尽的测试。温度测试:表现良好,打破A卡公版温度高的固有印象
温度测试是在裸机平台的环境下进行,环境温度约为25℃,使用3DMark Time Spy Extreme压力测试作为满载项目,数据通过GPU-Z的Log to File功能记录,以下为满载温度的测试曲线:
首先我们来看一下RX 6800 XT的散热表现,改进的三风扇散热确实效果不错,公版RX 6800 XT显卡满载最高温度为77℃,待机的话也不过50℃。这相比之前饱受诟病的涡轮散热来说,提升确实不小,更加喜人的是,在烤机期间RX 6800 XT的风扇转速始终在1700RPM左右,风噪真的很低,相比之前的公版显卡安静的不知道哪里去了,同时这款公版显卡支持低温风扇停转技术。总结一下,RX 6800 XT凭借着3风扇设计达到了温度、噪音双丰收的好成绩。
RX 6800的散热器虽然只是双槽厚度,但由于核心发热量更低,在体积更小的情况下,温度表现与RX 6800 XT保持一致,最高温度也是77℃。并且两张显卡的满载时都很静音,风扇的转速始终保持在1700RPM左右,风噪很低,这张卡同样支持低温停转技术。改进的三风扇开放式散热设计确实让公版显卡受益良多,之前A卡公版又热又吵的“帽子”终于在RDNA 2架构显卡上被甩掉了,表现非常良好。频率测试:核心频率2200MHz常态化
在运行3D Mark的Time Spy Extreme压力测试时,我顺便记录了AMD Radeon RX 6800 XT/6800显卡满载运行时的核心频率变化。
AMD这次的频率调教更为“自适应”,即便是TSE压力测试核心频率依旧可以维持在2200MHz左右。根据我实际游戏时对显卡的监控数据,在实际游戏中RX 6800 XT的工作频率是可以Boost到更高的频率大约为2480MHz左右,不过这种情况要根据实际的游戏负载而定,不管怎样,在核心频率上AMD在RDNA 2架构上实现了重大突破,之前的风冷显卡常态化2200MHz遥不可及的时代要过去了。
RX 6800同样在核心频率上表现出彩,只不过峰值频率为2237,会比RX 6800稍低一些。与RX 6800 XT一样,RX 6800在玩游戏时最高的Boost频率在2350Mhz左右,都远超了标称的“游戏频率”。天下武功,唯快不破,从这两张卡实际运行的频率来看,AMD的“高频率策略”取得了成功。功耗测试:符合官方宣传的TGP功耗
在频率、温度等方面都取得了良好成绩的RDNA 2显卡,实际的功耗表现又会怎样呢?我们继续进行功耗测试,显卡的功耗测试使用的是专门的PCIe测量工具,可以精确测量显卡PCI-E与外接电源接口的实际功率。显卡满载功耗在3DMark Time Spy Extreme压力测试中获得。
在经历了RDNA、RDNA 2连续两代的能耗比大进步之后,AMD显卡相比竞争对手的能耗比劣势终于被扭转了,RX 6800 XT TGP300W的功耗所言不虚,峰值功耗最高值为322.412W,大部分时间整卡功耗就在300W左右,这与RTX 3080 FE相比低了很多,后者的峰值功耗甚至可以达到415W,对电源的压力也更高。从这个角度来说,RX 6800 XT在能耗方面占据优势,官方推荐的750W电源也是非常的稳健,完全不用担心整机平台带不动的问题。
RX 6800官方宣称TGP250W,在实际的测试中,RX 6800的峰值功耗为264.491W,大部分时间的功耗为250W左右,官方推荐的650W电源是完全够用的。与竞争对手RTX 2080 Ti FE相比,后者功耗在300W上下,比A卡要多50W功耗。当然这里必须要指出的一点是竞争对手使用的三星8nm工艺制程相比TSMC的7nm确实存在差距,能耗比领先对手也很正常。只不过竞争对手之前依靠先进的架构去弥补制程工艺落后的差距的老办法在今天不管用了,RDNA 2架构的高能耗比设计令人印象深刻。
A卡上拥有一个功耗小Bug,就是当用户使用高刷屏的时候,比如144Hz显示器,待机时你可以明显看到显存频率是降低不下去的,待机功耗也涨到40W左右,如果你使用60Hz的普通屏幕就没有这个问题,待机功耗仅仅为8W左右,这个问题我已经向AMD反映,希望可以通过后续的驱动解决掉这个Bug。超频测试:充满潜力,期待非公版本更高的核心频率RX 6800 XT超频测试
我们在驱动中直接把功耗提升15%(15%为上限),将RX 6800 XT的频率直接拉到2700MHz,并将显存拉至2100MHz,最终成功通过了FSE与TSE的测试,成绩如下:
在跑分时通过检测核心峰值频率确实达到了2670MHz左右,但是由于公版功耗墙的原因,+15%的功耗并不能让这种状态维持过久,但仍然比默频强了4%-7%左右,如果非公版放开功耗限制,相信RX 6800 XT的实际运行频率还会更上一层楼。RX 6800超频测试
RX 6800也是如法炮制,我们在驱动中直接把功耗提升15%(15%为上限),将RX 6800的频率直接拉到2500MHz,并将显存拉至2100MHz,最终成功通过了FSE与TSE的测试,成绩如下:
不带“XT”型号反而更能超频是AMD显卡的“传统艺能”了。RX 6800公版可以超频到2500MHZ,并且大部分时间核心频率都在2420MHz左右,最后在跑分中有9%-10%的提升,这个数值要超过RX 6800 XT的提升幅度,这更加让人期待非公版的RX 6800在更宽松的功耗墙下,会拥有一个什么样的表现了。总结:RDNA 2利刃出鞘,RX 6800 XT性价比更高
通过这次的测试,我们欣喜的看到了AMD在RDNA 2上的巨大进步,时隔多年在高端市场上再次发起冲击,并在传统性能上取得了优势,这样的成绩足以让玩家们感到兴奋。2020年对AMD来说是重要的一年,RDNA 2架构的意义与压力相信每一个AMD人都知道,无论是游戏主机还是传统PC甚至是MAC,大把客户的高端显卡需求让AMD不敢怠慢,好在他们顶住了压力,完美的交出了自己的RDNA 2架构答卷。
AMD最让我高兴的是,他们按照自己的计划一步一个脚印的前进,完美的完成了从GCN到RDNA 1再到RDNA 2的能耗比提升目标,甚至超额完成任务!让RDNA 2架构显卡放心提高频率、提升性能的同时不用担心功耗过高的问题,这是RDNA 2成功的要诀。而能让RDNA 2不更换制程工艺还能大幅度提高能耗比的基石则是开创性的“无限缓存”技术,有了“无限缓存”RDNA 2架构显卡相比竞争对手的等效带宽更大,功耗更低,这一点在低分辨率下尤为明显。
显卡迷你天梯榜 (完整显卡天梯榜)
AMD提早布局PCIe4.0的做法在今天也是得到了回报,凭借着自己可以同时提供CPU+GPU的能力,AMD开发出了Smart Access Memory智能寻址显存技术,这项技术让AMD的显卡平均再额外提升6%的性能,同时可以引导玩家们选购自家的CPU进行搭配,是一个一箭双雕的优秀市场策略。3A平台战3A,这句话在今天终于成功实现,两大领域的突破成功让3A平台成为玩家们青睐的对象。
回到产品本身,先来谈一下RX 6800 XT,这张卡在发布会上与RTX 3080展开竞争,通过实际测试可以看到在传统性能上RX 6800 XT是要明显领先RTX 3080的,极高的频率配合翻倍的ROP单元让它在传统光栅化游戏中无所畏惧,性能更高功耗更低。只不过到了光追环节,RTX 3080毕竟是第二代光追显卡,在光追测试里优势还是非常明显的,再加上DLSS深度学习超采样抗锯齿技术的采用,可以继续提高开启光追时的游戏体验。与此对应AMD的技术FidelityFX Super Resolution还处于开发阶段,一些技术细节不得而知,希望这项技术可以早日到来,提高A卡在光追游戏时的体验。
RX 6800定位比RX 6800 XT更低一档,它在发布会上的对手是老旗舰RTX 2080 Ti,在传统性能上RX 6800要甩开RTX 2080 Ti一个身位,在能耗比上也领先对手,看样子2020年的今天“老旗舰”是真的没啥牌面,至于光追环节,RTX 2080 Ti还是有一定优势的,只不过由于RTX 2080 Ti的光追核心是第一代的,光追性能差距就没有RTX 3080与RX 6800 XT大了。
购买建议的话两张A卡我更推荐RX 6800 XT,在性能上相比RX 6800约有20%左右的领先,但是价格仅仅多了500元,这么大的提升500块钱还是很超值的。在传统性能上A卡的性价比超级高,与对位显卡相比价格上有一定优势,显存容量也都是16GB,完全可以“战未来”。至于光追性能,相信AMD可以通过后期更新的FSR超分辨率技术进行补强,让A卡的弱项得到弥补。
我这里想着重再提一下AMD现任显卡部门负责人王启尚(David Wang)先生,这位当年一手缔造GCN架构的“大佬”在AMD显卡部门遇到困难时选择回归,并立即研发出了RDNA 2架构,扭转了AMD多年以来在能耗比上的劣势,堪称这次RX 6000系列显卡成功的第一大功臣,这是毋庸置疑的。受命于危难之际,奉命于危难之间,王启尚在AMD最需要他的时候站了出来,他接受了Lisa Su的邀请重回AMD并立即开展新架构的研发工作。“大佬”就是“大佬”,完全由他主导的RDNA 2架构,在工艺制程保持不变的情况下仅凭架构革新就一举把之前多年的差距几乎追平,这样的人你怎能不尊敬?
总结一下,AMD的RDNA 2架构显卡在传统性能上均明显领先对手,在低分辨率时尤为明显,同时能耗比表现也更佳。考虑到这是第一代AMD光追显卡,光追性能不如竞争对手也算是情有可原吧,公版显卡的超频潜力是有的,只不过由于功耗墙限制并不能长时间维持高频率,因此考虑极限性能的玩家可以耐心等待一波非公版RX 6000系列显卡,这些非公版显卡通过更强的散热与供电可以充分发挥RDNA 2架构的潜能。
如果非要用一句话总结RDNA 2架构显卡的话,我的评价是“RDNA 2 天下武功唯快不破”,更通俗点的说法就是更快的频率、更高的能耗比、更强的性能造就出“Revolution DNA”。AMD显卡在RDNA 2上实现了传统性能的大进步,它的继任者RDNA 3架构上光追性能会有大进步吗?至少此时此刻,AMD扭转了之前在GPU市场的颓势,再次与竞争对手在高端市场展开竞争,我们对这样充满拼搏精神的公司表示尊敬,同时也对即将到来的“真旗舰”RX 6900 XT充满期待。