2020年9月2日对于全球的RTX2080Ti用户来说,可能都是灾难性的一天。因为就在凌晨,NVIDIA正式宣布了全新的RTX 30系列,根据目前官方公布的信息来看,即便是已知定位最低的RTX3070,其光追游戏性能也已经超过了前代的消费级旗舰RTX2080Ti;而此次顶级卡皇RTX3090性能更是达到了2080Ti的两倍,同时上市价格相比2080Ti甚至还略有下降。
很显然,如此一来,那些前不久才刚刚花了大价钱购买“前任卡皇”的用户,就会有一种自己成为了冤大头的感觉。而对于此前已经攒好了钱,准备观望RTX 30系新卡的消费者来说,这次新品性能的提升幅度之大,定价之保守,则的确让他们有理由大呼“良心”。
当然,这种新品直接把前代旗舰拍死在沙滩上的换代,在显卡领域其实是很常见的现象。往早了说有当年的TNT2 M64、GeForce 2MX系列;之后有6600GT、GTX260;就算放到近些年来看,NVIDIA在10系的时候其实也曾令GTX1060在性能上“干翻”过前代高端980。从这一点来看,其实用户的“哀叹”大多数也都只是一种,对于新品性能提升超乎预期的调侃罢了。
言归正传,我们三易生活当然也与大家一样对全新的“卡皇”感到兴奋。但兴奋之余我们发现,NVIDIA这一次的大杀器除了性能高之外,其实还暗含了相当多的细节信息。
比如,你真的知道它有多少个核心吗?
众所周知,RTX 30系新显卡性能提升幅度是非常巨大的。那么问题就来了,这种巨大性能提升的幅度,到底是怎么来的呢?
可能很多朋友第一反应会讲,那还用说,新制程让显卡的核心数量再次大幅上涨了呗!你看3090,核心数量不是都已经超过一万了吗。
的确,在NVIDIA官网上明明白白的写着,这次RTX3090拥有高达10496个“CUDA核心”。但是如果大家还记得今年早些时候,NVIDIA用于高性能科学计算的Telsa A100,所采用的GPU核心GA100,就会意识到一个很重要的问题。那就是采用7nm制程,核心面积更大、晶体管数量更多,性能定位也更极致的GA100,理论上最多只有8192个流处理器,但是如今制程较差(8nm)、面积更小、晶体管数量也更少的GA102(RTX3090)却拥有更多的核心,这是怎么一回事呢?
要解答这个问题,我们就需要理解此次面向消费级的RTX 30系列在核心架构上做出的一项重大改动。举例而言,上图是计算大核心GA100的半个SM(流式多处理器集群)架构,其中包含32个32位浮点单元、32个32位整数单元、再加上16个双精度浮点单元,以及两组张量加速器单元。但问题就在于,当我们计算显卡的“核心”数量时,并不是把以上所有这些单元加起来数,而是只统计FP32(32位浮点)单元的数量。
图片来自Anandtech
话说到这,可能有的朋友就已经明白了。与先前发布的计算卡版本安培架构相比,新的游戏卡安培架构有一点很大的不同,就是它将FP32单元与INT32单元的数量关系,从1:1加倍到了2:1。其中以GA102核心(RTX3090)为例,它其实只有5248个INT32单元,比GA100核心的8192个少了不少,但是由于它内部每个整数单元对应的浮点单元数量被翻了一倍,所以如果以浮点单元为标准去统计“核心数量”的话,就变成了一款拥有一万枚以上“核心”的GPU了。
可能有的朋友要说,这不是类似当年AMD的推土机吗,这样的核心数量岂不是在吹水?Emmmm……问题在于,对于当今的3D游戏来说,浮点单元确实是比整数单元要常用得多,所以多堆一倍的浮点单元,真的就能带来高一倍的性能提升。因此,我们可以说老黄这次的游戏卡架构设计有点取巧,但确实并不是在吹牛。
新显卡需要新游戏才能发挥?这次可能不需要
讲完了硬件上的变化,我们来聊聊软件方面。与基础计算架构的重大变革不同,全新的RTX 30系列在软件功能上的改变其实并没有大家想象的那么多。虽然昨天老黄一口气发布了包括新的AI视频直播、新的游戏低延迟优化等一系列软件方面的新特性,但它们实际上全部都能支持此前的RTX 20系显卡,有些新功能甚至在“古老”的麦克斯韦架构GTX900系上都能正常运作。
这意味着什么呢?简单来说,RTX 30系列的性能提升的确很大,但它在游戏渲染方面的技术则基本上没有改变。这使得它更像是一个“极巨化”的RTX 20系显卡,只不过确实快了一倍而已。
说实在的,这其实是一个非常好的现象。因为这意味着游戏开发商不需要重新去适应新的画面构建工具,玩家也不一定非得要新游戏才能体会到RTX 30系列的性能提升。不仅如此,大家反而可以借此机会进一步消化和普及诸如光线追踪、DLSS、Mesh Shader这些其实已经很超前的次时代画面处理技术,让它在更多的现有游戏中发光发热。
君不见昨天晚上老黄拿来演示的游戏,就是加入了光线追踪的《堡垒之夜》吗?很显然,这意味着RTX 20系的玩家今后也会有更多的光追游戏可玩。因此“2080Ti”的用户,自然也就无需哀叹了。
然而要想用好新卡,你可能还是得升级些东西
当然,我们说RTX 30系显卡不需要新游戏就能体现出它的性能进步,但这并不意味着玩家不需要升级他们的电脑,来兼容新卡皇。
首先值得注意的是,全新的安培架构显卡目前都支持PCIE 4.0。这意味着如果你将它插在只有PCIE 3.0的老平台(比如Intel的九代酷睿,或者AMD的2代锐龙)上,它的性能是可能受到制约的。那么要想充分释放新卡皇的性能,目前最好的选择可能就是AMD的3代锐龙平台,或者是明年即将登场的Intel 11代酷睿RocketLake处理器。唯一值得欣慰的是,11代酷睿不会更换插槽,所以现在正在用Z490主板的朋友届时只需要升级CPU即可,毕竟很多高端Z490主板从走线上就已经预留了PCIE 4.0的支持能力。
其次,从今年年初开始,NVIDIA就已经将自家的光线追踪技术并入了微软的DirectX 12 Ultimate标准。而未来的新光追游戏也将基于这些新的微软官方API来进行开发。这就意味着,不管你是RTX 20系的老用户,还是打算升级RTX 30系显卡的发烧友,要想充分兼容未来的游戏,你都必须要将操作系统升级到Windows 10的2004或者更高版本才行。当然,你也可以选择“一步到位”,直接申请测试Windows 10 21H1版本,这样理论上会获得最全最新的图形技术加成。
最后,如果大家有看过我们三易生活此前对XBOX Series X的解析,可能还记得微软在那台次时代游戏机上搞了个“系统加速架构”,能够让SSD的游戏加载速度大为提升。实际上,它如今也降临到了Windows 10操作系统里,并得到了RTX 30系显卡的硬件支持。
根据NVIDIA官方的说法,这个名为“RTX IO”的新功能,可以配合最新版的Windows 10系统,让显卡的AI单元接管以往需要CPU进行调度的SSD IO任务,从而解放CPU算力,并大大提升游戏加载的体验。当然要想使用这项新功能,除了新显卡和新系统之外,你可能也需要购买一块足够高端的PCIE 4.0旗舰SSD,比如刚刚发布的三星980PRO才行。
【本文图片来自网络】