APP下载

“ 钛”上驾临, 谁与争锋

2021-07-13《微型计算机》评测室

微型计算机 2021年12期
关键词:领先差距架构

《微型计算机》评测室

坦白讲,如果不是受过去大半年时间内疯狂的ETH挖矿影响,我们估计这款GeForce RTX 3080 Ti应该在更早的时间内与玩家见面。其实,早在2020年NVIDIA全球首发RTX 30系显卡时,我们就曾说过,RTX 3090的规格略显曲高和寡,难以成为游戏显卡市场的顶级普及性代表,更多的可能还是在创作市场显威;而RTX 3080虽然在性能表现上足以接班RTX 2080 Ti,继续扛起游戏市场旗舰级显卡的大旗问题不大,但无论是10GB的GDDR6X显存配置,还是并不算太出色的CUDA核心数配置,都感觉略差了那么一丝戴上皇冠的味道。后来,随着AMD RadeonRX 6900XT、RX 6800XT的发布,在顶级游戏显卡市场上RTX3090虽然性能一骑当先,但却背负着沉重的价格压力,而RTX3080也被RX 6800XT和RX 6900XT两头挤压,颇有些“憋屈”的味道。

很明显,在RTX 3080和RTX 3090的规格参数对比上,近2000个CUDA核心和14GB显存的巨大差距让NVIDIA有非常大的操作空间,几乎所有人都想到了“RTX 3080 SUPER”、“RTX 3080 Ti”的存在可能性。果不其然,GeForce RTX3080 Ti就这样浮出了水面。

一脉相承,NVIDIA Ampere架构加持

近距离接触RTX 3080 Ti之前,先让我们复习一下RTX3080 Ti GPU传承的创新性NVIDIA Ampere架构的相关知识。

以前我们也多次讲过,RTX 30系列GPU在架构上最大的变化是改用了全新的NVIDIA安培(Ampere)架构,本次发布的RTX 3080 Ti自然也不会例外。之前NVIDIA在发布A100 GPU的时候,无论是GPU本身还是架构设计都更偏向于计算,在面向图形应用时,偏向计算的架构显然是无法适应图形计算的需求的,因此NVIDIA在同为安培架构、面向不同计算场合的芯片设计上,采用了针对性的改进。可以这样理解,目前我们看到的RTX30系列GPU,采用的是面向图形的安培架构,它和面向计算的安培架构有一定的相似之处,但是侧重点完全不同。

全新的SM模块,CUDA数量翻倍

SM(Streaming Multi- processer,流式多处理器模块)模块一直是NVIDIA GPU的计算核心,在新的GA102核心的安培架构上,由于计算任务的变化,GA102的SM模块也有了巨大的变化。和RTX 3090、RTX 3080等完全一致,RTX 3080 Ti的SM的计算单元内部,依旧配置了1个warp调度单元和1个派遣单元、16384×32bit寄存器和后端LD/ST、SFU单元,但是在计算的部分却包含了1组16个可自由执行FP32和INT32计算的双功能计算单元(ALU)—它们既可以完成FP32计算,又可以完成INT32计算,另外还包含了1组16个FP32计算单元和1个新的第三代张量核心。这样,同为4个SM计算单元组成的SM模块,GA10X安培架构拥有等效128个CUDA核心(极致情况下),相当于图灵核心的两倍。我们知道,图形和计算操作和算法、现代着色器工作负载通常混合使用FP32算术指令。FP32加速也有助于光线追踪降噪着色器。光线追踪渲染工作负载越大,相对于上一代产品的性能提升越大。

第二代RT Core光追核心

图灵架构为游戏引入实时光线追踪,轰动一时,为游戏带来了逼真的光照、图像质量、游戏玩法和沉浸感、阴影和特效,并带来超出想象的游戏画质表现。Ampere架构的第二代RT Core的性能提升一倍,带来2倍于Turing第一代RT Core的吞吐量,同时支持光线追踪和着色,使光线追踪性能达到全新高度。换而言之,光线追踪使用率越高,速度提升越大!同时第二代RT Core还引入了动态模糊等重要特性。NVIDIA Ampere架构的RT Core将光线交汇处理速度提高一倍,同时支持光线追踪与着色。光线三角形吞吐量增加一倍,Ampere架构的RT Core可达39.7 RTTFLOPS,Turing架构为23.8 RT TFLOPS,提升巨大。

第三代Tensor Core张量核心

面向图形的安培架构也加入了第三代张量计算核心,专门为稀疏矩阵优化。RTX 3080 Ti所配置的Tensor Core可加速用于深度神经网络处理功能的线性代数,这是现代AI的基础。全新第三代Tensor Core加速AI功能,例如用于AI超分辨率的NVIDIADLSS和用于AI增强的声画处理技术NVIDIA Broadcast应用。

从本质上讲,Tensor Core让DLSS能够加快游戏速度,同时带来高画质图像,甚至更细致的图像。借助第三代Tensor Cores的性能,NVIDIA Ampere架构GPU上的DLSS性能得到进一步增强。当前的NVIDIA DLSS已经进化到了2.1版本,支持最高9X的游戏帧速率加速,这对于防止在高分辨率下开启光追效果后的游戏帧率下跌有着非常重要的意义。

支持HDMI 2.1与AV1解码

支持H D M I 2 .1将总带宽从1 8 G i g a b i t s / 秒提高到48Gigabits/秒,并增加对高动态范围(HDR)的支持,支持更高对比度的明亮图像和更鲜艳的色彩,以及更好的阴影和高光。而AV1解码与现有的H.264、HEVC和VP9等编解码器相比,它能提供更好的压缩和质量,比H.264节省50%~55%的容量;RTXIO,在DirectStorage加持下,下一代游戏将能够在降低CPU负载的同时,充分利用RTX IO硬件,缩短加载时间,打造更宽阔的开放世界。

支持NVIDIA Reflex低延迟电竞技术

游戏玩家通过鼠标按键触发的效果最终呈现在显示器画面上之前,按键触发的电信号需要先途径CPU進行逻辑运算,得到详实且准确的信息之后再提交给GPU进行渲染,并且将渲染后的数据最终以像素点填充的方式呈现到显示器上。在这个过程中,电信号从触发、传输再到显示的过程所产生的耗时便被称之为系统延迟。

而NVIDIA Reflex低延迟电竞技术便是在这个过程中起到至关重要的作用—它能够通过提升GPU的运行频率和动态的降低渲染队列,并由此降低CPU反压,使得系统能够在最后时刻采样外设的输入数据,从而最大化提高系统的响应速度,进一步提升玩家操作的准确度。通俗来讲,就是它能提高玩家从点击鼠标到显示器画面产生对应变化的速度,从而加快玩家的操作速度,带来更符合玩家水准且更为流畅的游戏体验。

另外,为了帮助玩家直观地查看系统延迟的具体情况,NVIDIA还将系统延迟根据鼠标输入信息到显示器过程拆分为鼠标输入延迟以及PC+显示器延迟两个部分。同时,玩家们可以通过最新版的GeForce Experience开启实验性功能,进而在性能覆盖显示的功能界面中获取游戏延迟和帧率等性能指标,查看当前PC的状态。它通过革命性的GeForce和G- SYNC新技术来优化和测量竞技游戏中的系统延迟,从而更快地获取目标,做出反应,并提高瞄准精度。

支持NVIDIA Broadcast

NIDIA Broadcast这项AI驱动的声画处理技术的基础是NVIDIA Encoder,支持高质量直播。用户可以通过RTX 30系显卡和Broadcast将自己的家改造成直播室,通过AI驱动的噪音消除、虚拟背景和自动取景等将直播和视频聊天提升到一个新水平。通过在GeForce RTX显卡上加速AI驱动的Tensor Core,AI网络能够保证高质量直播的实时运行

RTX 3080 Ti概览,新游戏GPU旗舰

复习完了NVIDIA Ampere架构的核心技术特色,接下来让我们来具体看看GeForce RTX 3080Ti这款最新的NVIDIAAmpere架构GPU的情况。

从GeForce RTX 3080 Ti的规格参数上可以看出,这完全就是RTX 3090的小简化版。完整的GA102核心一共拥有84组SM模塊,也就是10752个CUDA核心、84个RT Core以及336个Tensor Core。当然真正完整的GA102核心目前只用在了专业级显卡的NVIDIA RTX A6000身上,即使如RTX 3090这种庞然大物,也只配置了82组SM单元。

相比RTX 3090,RTX 3080 Ti仅仅比前者少了2组SM,包括256个CUDA核心、8个Tensor Core、2个RT Core和8组纹理单元TMUs,因此这也造就了RTX3080 Ti高达80组SM模块,即10240个CUDA的强悍规格。在显存部分,RTX 3080 Ti相比RTX 3090则落后较多,几乎是惨遭“腰斩”,不过12GBGDDR6X显存的配置仍然是目前游戏市场上N卡除RTX 3090之外的最高规格配置。从我们之前的测试情况来看,RTX 3090的24GB GDDR6X显存即使相对于RTX 3080的10GB同等配置也没能表现出特别明显的强大优势,因此我们完全有理由相信在游戏方面,如果不涉及8K+的游戏设置,RTX 3080 Ti的12GB配置也应该完全够用了,相比RTX 3090在4K及以下分辨率游戏中应该不会有太过明显的差距。

与RTX 3080相比,12组SM模块的差异让RTX 3080 Ti在规格参数上与RTX 3080拉开了不小的差距。在之前测试RTX3080 Vs. RTX 3090时,二者之间的性能差距大约在8%~15%之间,因此可以预估RTX 3080与RTX 3080 Ti的游戏性能差距大概会在5%~10%左右。当然具体差距到底有多大,还需进行详细测试才能见分晓,后文将会为您详细解答。

RTX 3080 Ti FE赏析

和RTX 3080 FE一样,RTX 3080 Ti FE也将前一代图灵核心产品设计中正面右侧的散热风扇移至背面,并且显卡的内部的风道也和上一代公版显卡大不一样。RTX 3080 Ti FE正面的散热风扇将冷空气吹进显卡内部,热空气则从显卡的输出面板这一侧流出,这种风道设计和GTX 10系列公版显卡有些类似。RTX3080 Ti FE背面的散热风扇则是将冷空气从显卡正面吸入,并将热空气从显卡背面吹出。换而言之,如果将RTX 3080 Ti FE装入机箱内部,背面这个散热风扇的风道就是“下进上出”,这也更符合目前绝大多数机箱内部散热风道的设计思路。

其大量散热鳍片采用的是开放式设计,而不是像上一代公版显卡那样将这些散热鳍片封闭在显卡内部,前者的这种散热鳍片设计不仅能在一定程度上提升散热效率,同时也让这款显卡在视觉上的线条感愈加强烈。不仅如此,RTX 3080 Ti FE正面和背面的两个散热风扇均升级至轴流风扇。这种风扇能够让通过扇叶的气流更加集中,从而提升进风量和风压。不过考虑到RTX 3080 Ti与RTX 3090在规格上非常接近,而且TGP设计也比RTX 3080高了30W以上,所以采用RTX 3080这套散热系统会不会对RTX3080 Ti带来一定的散热压力呢?我们将在后文中详细测试。

实测:强击RX 6900XT,直逼RTX 3090

毫无疑问,从规格与产品命名定位上来看,RTX 3080 Ti应该是性能介于RTX 3080与RTX 3090之间的产品,而且对AMDRadeon RX 6900XT还有较强的竞争针对性。所以,RTX 3080Ti能否完成既定的目标任务?面对RX 6900XT与RX 6800XT包围RTX 3080的局面它是否能够顺利破局并反将AMD一军呢?

3DMark理论性能测试

从理论性能的测试结果来看,基本在我们的预料之中。整体测试结果可以看出,RTX 3080 Ti相对于RTX 3080在3DMark各项测试中的平均领先幅度在10%左右,而和RTX 3090比较的话,由于二者在规格上的差距并不太大,所以实际理论性能测试的平均差距仅有3%~4%,RTX 3080 Ti只有极小幅度的落后。而在与前一代的旗舰级GPU RTX 2080 Ti对比上,在各项测试中RTX 3080 Ti的领先幅度均超过了50%,在DXR光追性能上的领先程度更是超过了80%。

面对竞争对手Radeon RX 6800XT和RX 6900XT,在基于DX 11的3DMark Fire Strike三项测试中,RTX 3080 Ti均有小幅度落后,与RX 6900XT的理论性能差距约为9%,与RX 6800XT的理论性能差距约为6%。不过在DX 12的3DMarkTime Spy测试中,RTX 3080 Ti则实现了反超,性能分别超过RX 6900XT约10%,超过RX 6800XT约13%。

在有关光追性能的两项理论测试成绩上,凭借第二代光追核心的强势表现,RTX 3080 Ti的表现更为优秀,Port Royal的测试成绩领先RX 6900XT 36%,领先RX 6800XT超过了40%。DXR性能测试中更是相对AMD的两款竞品领先幅度达到了100%以上。

游戏性能测试

在游戏性能的评测部分,我們分为了两个竞赛小组,分别是普通非光追环境下的游戏性能测试与光追环境下的游戏性能测试。由于目前少数光追游戏仅支持NVIDIA GPU或仅支持AMDGPU,我们在光追游戏的选择上过滤了这种单一GPU光追支持的游戏,选择的是对NVIDIA和AMD GPU都有良好支持的光追游戏。

非光追游戏测试

在非光追游戏环境下,RTX 3080 Ti的表现仍然是比较抢眼的。在各款游戏测试中,RTX 3080 Ti平均性能与RTX 3090相比仅有3%~4%的差距,而相比RTX 3080来看,RTX 3080 Ti的平均性能领先幅度约在7%左右。相较于上一代的旗舰RTX 2080Ti,RTX 3080 Ti的性能领先幅度仍然在50%以上。

在大部分的非光追游戏环境中,RTX 3080 Ti的性能表现都持平或略强过AMD Radeon RX 6900XT,而相对于RX6800XT来说,RTX 3080 Ti在大部分非光追游戏中都有10%或更高的性能领先程度。不过比较例外的是《生化危机:村庄》这款游戏,在关闭光追效果后,Radeon RX 6900XT反而领先RTX 3080 Ti达到10%以上,即使RX 6800XT也领先RTX3080 Ti 6%左右。或许这款游戏针对AMD显卡的优化相对是比较好的吧!

光追环境游戏性能测试

在测试中,我们一共选择了包括最新的《生化危机:村庄》在内的7款同时支持NVIDIA和AMD显卡的光追游戏进行了体验。而结果也是一点都不例外,凭借强悍的第二代光追核心,RTX3080 Ti除了在4K分辨率下的《看门狗:军团》游戏测试中略略小负于RTX 6900XT之外,在其余所有光追游戏测试中,无论是1440p分辨率,还是4K分辨率下,都遥遥领先于RX 6900XT,根据不同游戏幅度在10%~80%不等。而相对于RX 6800XT来说,RTX 3080 Ti相对它在光追游戏下的性能更是平均领先了60%以上,个别游戏中领先程度甚至超过了100%。

在与RTX 3090的对比上,RTX 3080 Ti与之相比仍然存在3%~4%的细微性能差距,而与RTX 3080相比,RTX 3080Ti在光追环境下游戏性能平均要强9%~10%。相比上一代RTX2080 Ti这款旗舰产品,RTX 3080 Ti的光追游戏性能更是领先近60%。

DLSS性能测试

DLSS作为NVIDIA RTX系列显卡的黑科技,一直都在高分辨率、高画质以及光追游戏中扮演着重要的角色,作为最新推出的RTX 30系家族成员,RTX 3080 Ti自然也是完全支持DLSS的。为此,我们也特意看了看RTX 3080 Ti及对比产品在DLSS游戏环境下的表现。出于显卡的定位需求,在这部分测试中,我们统一选择了4K分辨率在开启光追的环境下,就开/关DLSS进行了对比测试。

DLSS果然是不愧为NVIDIA的超级游戏黑科技,在同等设置下,开启DLSS之后,RTX 3080 Ti在4K分辨率/最高画质设置下的平均游戏帧率提升达到了60%以上,在《赛博朋克2077》游戏中的帧率提升幅度更是达到了120%以上的“恐怖”程度。开启DLSS之后,RTX 3080 Ti更是将Radeon RX 6900XT甩在了很远很远的身后,游戏性能的领先幅度已经达到了平均150%以上。

温度及功耗测试

正如我们之前所预料的一样,在核心规格逼近RTX 3090的情况下,RTX 3080 Ti采用了RTX 3080的散热结构设计,很可能会导致RTX 3080 Ti的散热表现相对于RTX 3080和RTX3090都要差一些,而事实上也正是如此,满载76℃的核心温度只能说是中规中矩而并不算特别优秀,相比RTX 3090的满载63℃有较大的差距。不过在能耗比上,RTX 3080 Ti相对于RX6800XT仍然优势非常明显,不仅核心温度更低,而且在功耗上也相差无几,但整体性能却要强得多。(由于在进行到这一步测试之前,我们评测用的R X 6900XT显卡出现了一个不可预料的故障而导致无法正常工作,因此在这一测试项中并未加入RX6900XT的测试成绩)

Studio创作性能测试

在评测的最后,我们选择了几款常用的创作软件或专业应用的Benchmark就Studio性能对RTX 3080 Ti进行了简单测试(要首先说明的是由于到截稿时Studio Driver尚未更新支持RTX3080 Ti,因此本部分测试暂时采用的是测试版Game ReadyDriver,结果仅供参考)。测试结果也让人比较满意,就Studio创作性能而言,RTX 3080 Ti相对于上一代RTX 2080 Ti表现了几近翻倍的性能提升,即使相对RTX 3080来说也有10%或更高的性能增幅,而且各项测试成绩都非常接近RTX 3090,差距仅在3%~5%左右。

由于在测试Studio性能之前,我们评测用的RX 6900XT显卡发生了故障无法正常运行,因此在这部分测试中作为对比我们仅加入了与RX 6800XT的比较,不过考虑到以前测试的结果,RX 6900XT与RX 6800XT在专业应用性能上的差距不到10%,因此RX 6800XT的对比测试结果还是具有一定的参考性。从测试结果来看,在Blender Cycles、D5渲染器等应用软件中,RTX3080 Ti的创作性能远胜RX 6800XT,领先幅度达到了100%甚至更高,由此也大致能推斷出RTX 3080 Ti相对于RX 6900XT来说,在Blender Cycles或D5渲染器等软件的创作性能上领先幅度应该也会达到接近100%或更高的程度。

“钛”上降临,RTX 3090定位或将有变?

NVIDIA公布的RTX 3080 Ti显卡首发指导价格为8999元起,这也就意味着非公版显卡将从此价位开始起跳。不过考虑到目前显卡市场价格非常混乱的情况,最终非公版RTX 3080 Ti到底会以何种价位出现在市场上,目前尚不可轻易定论,但不出意外可能会在万元左右或更高,玩家对此需有心理准备。另一方面,从我们测试的情况来看,本次RTX 3080 Ti的确将ETH挖矿的哈希值算力进行了大幅度的削减,仅有60MH/s的算力加上近期虚拟数字货币市场的“血崩”,或许会在一定程度上减弱矿主们的兴趣从而让RTX 3080 Ti能够维持一个相对稳定的状态。

而在经过一系列的测试之后,相信大家都已经能够得到针对RTX 3080 Ti的比较清晰的定位与结论了。首先,RTX 3080Ti在各方面的性能表现上非常接近RTX 3090,与RTX 3080有5%~10%的性能差距,很好地填补了RTX 3080和RTX 3090之间的顶级旗舰GPU空缺。这无疑会一举击破RTX 3080被RX 6800XT和RX 6900XT包围的局面,为NVIDIA桌面显卡市场开拓出新的领地,而4K游戏无疑将会是它的主战场。

其次,从竞品定位上来看,RTX 3080 Ti很明显瞄准的是竞争对手的RX 6900XT,而源自GA102的这款衍生产品也再次切中了要害—RTX 3080 Ti在游戏性能上的综合表现并不逊色于RX 6900XT,甚至犹有过之。尤其是在光追环境下,更是将RX 6900XT甩开了不小的距离。当很多玩家在考虑顶级游戏显卡时常常会因为RTX 3090高昂的价格转而选择RX 6900XT或RTX 3080,但现在RTX 3080 Ti的出现则给了他们一个或许是非常不错的新选择。

最后来说点个人见解,我们估计RTX 3080 Ti背负的另一个任务很可能就是结束RTX 309 0在顶级的游戏显卡市场上曲高和寡的局面,以非常接近的性能和相对低的价格,将RTX3080 Ti打造成顶级游戏显卡市场上的新“王”。而对RTX 3090来说,RTX 3080 Ti的出现很有可能会逐步蚕食掉它在游戏市场上的份额,从而转型为一款专为Studio创作性能和8K+顶级游戏准备的云端产品,使得RTX 3090成为极少数专注于8K+游戏的玩家的私人珍藏,这是很有可能的。当然,在Studio创作领域内,RTX 3090凭借24GB大显存在超高分辨率渲染上仍然有不可替代的优势,依旧是众多有此需求的创作者的首选。

8999元起的RTX 3080 Ti真的来了,哈希算力的限制于无限接近RTX 3090的性能的确让人对其充满了期待。新“钛”上降临,我们只想代表玩家真切地说一句,“不要空气卡,让我们都能买到吧!”

猜你喜欢

领先差距架构
基于FPGA的RNN硬件加速架构
功能架构在电子电气架构开发中的应用和实践
我国铁钌接力催化氨合成技术国际领先
潍柴:从领先到引领
难分高下,差距越来越小 2017年电影总票房排行及2018年3月预告榜
LSN DCI EVPN VxLAN组网架构研究及实现
缩小急救城乡差距应入“法”
一种基于FPGA+ARM架构的μPMU实现
幻想和现实差距太大了