APP下载

RTX40系主力战舰4K光追新霸主强势登场

2022-12-02戴寅

电脑报 2022年45期
关键词:旗舰功耗引擎

戴寅

采用NVIDIAAdaLovelace架构的RTX4090显卡已经开始在市场中销售,其空前强大的性能获得了发烧级玩家的一致追捧。而在9月20日与RTX4090同时发布的RTX4080,也在约定的时间正式登场。作为RTX40系列目前的次旗舰,RTX4080也具备AdaLovelace架构的一系列新特性与黑科技,如第三代RTCores与第四代TensorCores,当然也包括可以让游戏的视觉效果与帧率大幅提升的DLSS3,而价格方面则相对更甜品一些。因此,RTX4080也受到了游戏玩家与高性能用户的广泛关注,而11月15日RTX4080也正式迎来了性能解禁。本次测试我们使用的是来自NVIDIA的GeForceRTX4080FoundersEdition(以下简称RTX4080FE),想知道这款原厂信仰级神器到底实力如何?那就和我们一睹为快吧。

Ada Lovelace架构全面升级,RTX 4080堪称旗舰中的甜品

之前我们对NVIDIA Ada Lovelace架构进行过全面的解析,这里先简单概括一下它的技术亮点。

●NVIDIA Ada Lovelace架构中全新设计的流式多处理器具有最高 83 TFLOPS 的着色能力,吞吐量超过上代产品2倍。

●第三代 RT Cores 有效光线追踪计算能力达到 191 TFLOPS,是上代产品的 2.8 倍。

●第四代 Tensor Cores 新增FP8引擎,具有高达 1.32 PFlops 的张量处理性能,超过上代 5 倍。

●支持着色器执行重排序(SER),通过即时重新安排着色器负载来提高执行效率。SER可为光线追踪带来最高3倍的性能提升,整体游戏性能可最高提升 25%。

●新增Ada光流加速器帶来2倍的性能提升,使DLSS 3能够预测场景中帧和帧之间的运动变化,让神经网络能够在保持图像质量的同时提高帧率。

●架构进行大幅改进,采用TSMC定制4N工艺,此工艺专为GPU优化,实现高达2倍的能效飞跃。

●12GB显存及以上型号提供双NVIDIA编码器(NVENC),可最多缩短一半的视频导出时间,并提供了对AV1的硬件编码支持。

Shader Executing Reordering(SER)着色器执行重排序

着色器执行重排序技术可以带来更高的效率

GPU在完成大量并行计算的时候效率最高,而随着游戏中光追效果越来越复杂,着色器面临的可能就是大量发散的、无序的低效率工作任务,从而影响了渲染效率。SER技术的出现,就可以把这些杂乱的工作任务进行分类,动态重组为更高效的任务,从而提升着色器的执行效率。从NVIDIA官方数据来看,SER技术大约会带来2倍的着色器性能提升。

第三代RT Cores

第三代RT Core 新增了“微映射透明度引擎”和“微网格置换引擎”

从RTX 20到RTX 30再到RTX 40,RT Cores进化到了第三代。简单地从有效光线追踪计算能力来看,NVIDIA Ada Lovelace 架构GPU的第三代RT Cores吞吐量达到了191 TFLOPS,是上一代的2.8倍之多。

另外,NVIDIA Turing和Ampere 架构GPU中的RT Cores包括了用于加速边界体积层次(BVH)数据结构遍历的加速单元,并执行射线三角形和光线边界框相交测试计算。Ampere的RT Cores中,BVH遍历由Box Intersection Engine进行加速,射线三角形相交测试由三角形相交引擎进行加速,这已经被证明是迄今为止处理光追工作负载最高效的引擎。而在Ada GPU的第三代RT Cores中,除了以上两个功能外,还引入了“微映射透明度引擎”(OMM)和“微网格置换引擎”(DMM)。

微映射透明度引擎的作用是优化光线追踪渲染,大幅降低着色器的工作负载,这对于处理复杂物体光追特性来讲提升是很大的。具体的原理是将光线追踪特性烘焙到不透明的蒙版中,让那些不规则的形状与半透明的对象都能更快更精准地被渲染出来。

微网格置换引擎则可以将面数非常多的复杂图形做简化,创造出更加简单的模型,从而实现用基本三角形渲染复杂几何图形的目的,大大减少了计算量和对显存的占用。从官方数据来看,微网格置换引擎可以让光线追踪的BVH速度最多提升15倍以上,而显存占用最多可降低到原先的1/20,总之就是越复杂的模型,微网格置换引擎的优化效果越突出。

第四代Tensor Cores

在Ada GPU上,Tensor Cores已经进化到了第四代,而这次Tensor Cores的升级尤其重磅。它配备了全新的FP8引擎,张量处理性能高达1.32 PetaFlops(相对上代提升了五倍之多)。第四代Tensor Cores最具革命性的进步当然是全新加入的光流加速器(Optical Flow Accelerator),而它就是NVIDIA DLSS 3黑科技的核心所在。

DLSS 3技术

DLSS3技术带来了全新的光学多帧生成技术

DLSS技术作为RTX系列显卡提升画质与帧率的专用黑科技,到RTX 40这一代进化到了DLSS 3,跨度之大证明其改进是革命性的,NVIDIA官方称其代表了“神经网络渲染新时代”。

和之前的DLSS不同,DLSS 3在原有的超分辨率功能基础上进一步引入了光学多帧生成技术,简单来说就是可以通过AI计算生成新的帧,而不像之前那样只是生成像素。而这个帧生成的工作,是在Ada架构中新的光流加速器完成的,当然这就意味着DLSS 3中的“光学多帧生成”功能是RTX 40独享的。

光流加速器可以在DLSS 2的基础上计算两帧之间的光流场,捕捉游戏画面中从第1帧到第2帧之间变化的方向与速度,包含粒子、光线照射、反射等像素信息,通过计算运动矢量和光流场来精确重建画面。

实时光学多帧生成技术可以直接生成帧而不是单独的像素

总的来说,DLSS 2做的是通过AI计算出画面上剩余的像素,而DLSS 3则在此基础上还能计算出下一帧完整的画面,这样算下来DLSS 3等于是完全重建了实际显示画面7/8的像素,也可以说是重建了相当于实际渲染像素7倍的像素。此外,由于DLSS 3的“帧生成”在GPU中后处理,所以即便是CPU性能出现瓶颈,也能提升游戏帧率。

按照官方数据,DLSS 3最多可带来4倍的游戏性能提升。DLSS 3包含了“光学多帧生成”、“超分辨率”和“NVIDIA Reflex”三大部分,开发者只要整合DLSS 3,就可默认支持DLSS 2。目前DLSS 3已经得到了游戏开发者与游戏引擎的广泛支持,在后面的详细测试中我们会进一步介绍DLSS 3游戏的情况。

NVIDIA Studio优化

在生产力方面,NVIDIA GPU打造的CUDA生态圈已经是业界无可匹敌的存在,RTX显卡也是设计师们优先考虑的高效工具,因此RTX 40系列配合NVIDIA Studio 驱动也将会为内容创作者们提供更加出色的選择。总的来说,目前RTX 可以加速 110 多款主流创意应用,此外,SDK的提供使这些应用更加高效,并提供独家的功能,例如Optix、DLSS和Maxine。NVIDIA Studio 还提供了全套创意应用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。

AV1与AI直播

AV1相比H.264等编码方式可以在同码率下提供更加清晰的视频画面,而且AV1还支持一些更先进的编码特性,例如HDR与低延迟。RTX 40的编码器(显存12GB以上的RTX 40系列,当然包括RTX 4080,都提供了NVENC A V1双编码器)提供了对AV1硬件编码的支持,而OBS和Discord等推流软件都将在不久之后提供对NVENC AV1的支持,让玩家享受到更加精美而流畅的直播视频画面。解码方面,RTX 40的NVENC也继承了RTX 30上的第5代硬件解码器,支持MPEG-2、VC-1、H.264(AVCHD)、H.265(HEVC)、VP8/9以及AV1的硬件解码。AI直播部分,NVIDIA在直播应用技术上的更新有:面部表情预估、眼神追踪(让你看起来像是在看摄像头),以及虚拟绿幕的质量改进,而开发者可以很容易地在自己的APP中集成NVIDIA Broadcast SDK的这些功能。

RTX 4080规格解析

那么RTX 4080作为RTX 40系列的次旗舰,规格如何呢?RTX 4080采用了AD103芯片,AD103相对AD102进行了一些削减,GPC为7组,另外其中1个GPC还缩减了2组TPC只有4组。而RTX 4080在此基础上进一步减少了两组TPC,总共拥有38组TPC。

因此,RTX 4080 GPU具有 9728个CUDA 核心,可提供 49 Shader-TFLOPS 传统光栅渲染能力;304个第四代Tensor Cores 为AI处理和DLSS提供780 Tensor-TFLOPS的计算性能;76个第三代RT Cores具有113 RT-TFLOPS的计算性能,为下一代光线追踪提供强劲动力;配备256 bit/16 GB美光GDDR6X显存。根据官方数据来看,RTX 4080的性能最高可达RTX 3080 Ti的2倍,而功耗则降低了近10%。当然,RTX 4080也具备Ada Lovelace架构的多项技术,包括着色器执行重排序(SER)、第三代 RT Cores 以及DLSS 3。

此外,细心的玩家也许注意到RTX 4080的RT Cores/Tensor Cores/TUs数量甚至要比RTX 3080 Ti少一些,显存位宽也要低一些,那它是怎么做到性能反而更高的呢?前面已经说过了,RTX 4080的SM单元经过了进一步优化且支持SER技术,同时RT Cores与Tensor Cores都要高出一代,效率自然不可同日而语,此外GPU的二级缓存是RTX 3080 Ti的10.7倍,核心频率更是高出50%以上,综合这些因素,RTX 4080最终的性能其实是远远超过RTX 3080 Ti的。而在TGP方面,RTX 4080设定为320 W,比RTX 3080 Ti还低30 W,可见其先进的制程确实带来了极高的能效比。

完整的AD103 GPU核心图

RTX 4080 GPU核心图

“90旗舰”同款信仰级散热方案,RTX 4080 FE实物赏析

NVIDIA的Founders Edition长期以来都是N饭心目中的信仰神器,在工业设计方面可以说是独具特色,除了性能强悍之外也具备极高的收藏价值,而且在电气性能方面也是众多AIC厂商的参考标杆。

RTX 4080 FE的外观造型与RTX 4090 FE完全相同,银色与黑色的搭配相得益彰,显卡中央的X造型尽显科技与信仰的力量。散热器正面有一只轴流风扇负责推风,另一只轴流风扇位于显卡背面负责拉风,从而在机箱中制造出更为高效的散热风道,提升整体的散热效果。

RTX 4080 FE散热器也搭载了新的散热鳍片和气流设计,相比上代旗舰的FE散热器,RTX 4080 FE可产生的最大气流高出20%,在同噪声等级情况下,气流可以高出15%,从而提供更高的散热效率。

和RTX 4090 FE一样,RTX 4080 FE的厚度已经达到了3.5槽,重量接近2.2kg,散热器的体积相当的夸张,旗舰的霸气感十足。辅助电源接口当然也是12Pin+4Pin,包装盒也附送了一条12Pin+4Pin转4×8Pin的转接线。在RTX 4080 FE的侧面,配备了GeForce RTX信仰灯,通电后会亮起白光,信仰感爆棚。显卡尾部设计了一个磁吸盖板,打开后会露出机架安装孔位,方便在服务器机柜中安装。

接口部分,RTX 4080 FE提供了3个DP 1.4接口和1个HDMI 2.1接口,可以支持8K/60Hz HDR10输出。

RTX 4080 FE和上代FE一样采用了异形PCB设计,整体布局和RTX 4090 FE在细节上有些不同,总供电相数为16,强大的供电设计可以提供更加平稳的高负载输出曲线,让RTX 4080 GPU稳定发挥全部性能。

实战测试:RTX 4080飞跃式升级,性能倍增

测试平台

显卡:NVIDIA GeForce RTX 4080 Founders Edition

处理器:Intel酷睿i9 13900K

内存:金士顿 DDR5 6000 16GB×2

主板:华硕ROG MAXIMUS Z790 HERO

硬盤:WD_BLACK SN850 2TB

电源:华硕ROG雷神Ⅱ 1200W

操作系统:Windows 11 专业版 22H2

测试中我们解锁处理器功耗墙,并开启BIOS中的Resize BAR选项。内存选择XMP DDR5 6000模式,分频设定为自动。此外,还选用了RTX 3080 Ti与RTX 4090进行对比。

基准性能测试

首先是3DMark GPU基准测试部分,不管是基于DX11的FireStrike系列还是基于DX12的TimeSpy系列,RTX 4080都相对RTX 3080 Ti领先了43%~46%。

3DMARK在近期更新了针对DX12 Ultimate的测试SpeedWay,能够更好地展现次世代GPU在使用DX12U API的次世代游戏中的表现。在这个测试中,RTX 4080相对3080Ti的提升同样达到了40%。

光追性能方面,PortRoyal测试中,RTX 4080比RTX 3080Ti提升了39%。在对GPU压力较大的DXR纯光追场景测试中,更是领先RTX 3080 Ti大约55%之多,Ada Lovelace的第三代RT Cores确实在效率方面更胜一筹。

DLSS部分,RTX 4080也保持了巨大的优势,在DLSS 2模式下,也领先RTX 3080 Ti大约45%。在DLSS 3项目中,RTX 3080 Ti不支持光学多帧生成,所以只相当于运行DLSS 2的4K测试,而内置光流加速器、完整支持DLSS 3的RTX 4080自然效率更高,领先RTX 3080 Ti大约128%!可谓飞跃式的升级了。同时,我们也可以看到,RTX 4080的基准性能为RTX 4090的70%~77%,和它的芯片规模是比较符合的。

光栅化游戏性能测试

光栅化游戏部分,《古墓丽影:暗影》在2K分辨率下,RTX 4080比3080Ti多出了75 fps,提升幅度为44%,在4K分辨率下多出了37 fps,提升达到了39%。和RTX 4090相比,4K下的性能大约为它的67%。

《COD 19》中,RTX 4080无论在2K还是4K下相对3080Ti都有接近40%的帧率提升,在4K下则大约有RTX 4090的73%,相比《古墓丽影:暗影》表现要好一些。

《荒野大镖客:救赎2》算是比较公平的游戏,RTX 4080相对RTX 3080 Ti无论在2K还是4K下的提升都超过了30%,4K下的提升略高一点达到了38%。它在4K下的帧率大约为RTX 4090的76%,差距不算太大。

育碧系游戏《刺客信条:英灵殿》,RTX 4080相对于RTX 3080 Ti同样在2K和4K下都有30%出头的优势,而在这里它只比RTX 4090低了15%左右。

《孤岛惊魂6》对旗舰显卡的优化也不是很到位,2K下RTX 4080和RTX 4090只有5%的差距,有可能在处理器方面出现瓶颈问题了。而到了4K下,差距就拉大到了21%。RTX 4080在4K下比RTX 3080 Ti的帧率也高出了30%左右。

RTX 3080 Ti跑4K的《看门狗:军团》勉强能到60 fps多一点,而RTX 4080还是能接近90 fps,提升大约有38%。RTX 4080在4K下有RTX 4090大约75%的帧率。

优化超好的3A大作《毁灭战士:永恒》中,RTX 4080在4K下能超过240 fps,虽然RTX 3080 Ti帧率也不低,但是RTX 4080的提升已经接近50%了,增幅非常可观。

同样有这么大性能差距的游戏还有《杀手3》,RTX 4080在2K和4K下相对RTX 3080 Ti的帧率优势都超过了45%。

RTX 4080在《Control》中的表现相对平淡一些,相比RTX 3080 Ti在4K下大约有28%的帧率优势,相比RTX 4090则落后了29%。

赛车游戏《极限竞速:地平线5》,4K下RTX 4080比RTX 3080 Ti多了35%的帧率,比RTX 4090低了18%。2K下的帧率和RTX 4090比较接近,显然是处理器又出现了瓶颈。

再来看几款电竞网游。玩《绝地求生》的话RTX 4080也能达到最高画质4K/144Hz的标准,在4K下比RTX 3080 Ti高了33%,比RTX 4090低了31%,正好在中间位置。

暴雪的《守望先锋2》里RTX 4080同样也能达成最高画质4K/144Hz的标准,相比RTX 3080 Ti在4K下的帧率提升也有34%,而比RTX 4090则是低了29%。

《最终幻想14》的表现则符合之前的差距,RTX 4080相比RTX 3080 Ti提升30%左右,相比RTX 4090在4K下落后26%。

从这这些主流游戏的光栅化游戏性能测试结果来看,2K下RTX 4080相对于RTX 3080 Ti的提升在24%~50%之间,平均为36%。4K下提升在28%~46%之间,平均也是36%。相比RTX 4090,2K下的平均差距为15%,4K下大约有25%。

光追游戏性能测试

当然,光追和DLSS才是RTX显卡真正的精髓,我们当然要用极限画质下的光追游戏来考验RTX 4080的强悍性能。

同样先来看看《古墓丽影:暗影》。之前在4K下不开光追,RTX 4080比RTX 3080 Ti的提升有39%,开启光追后,提升进一步加大到了43%,虽然光追核心不如RTX 3080 Ti多,但RTX 4080的光追单元毕竟高出一代,同时频率也高很多,所以性能大幅提升也是情理之中。

《地铁:离去 增强版》4K下,RTX 3080 Ti不开DLSS已经只有35 fps了,即使开启DLSS质量模式也达不到60 fps。RTX 4080在4K下的优势达到了49%,开启DLSS还可以跑到80 fps。

《看门狗:军团》的硬件要求也比較高,也是同样的情况,RTX 3080 Ti在开启DLSS的情况下才能勉强达到4K/60 fps,RTX 4080在4K下有接近40%的优势,开启DLSS更是可以跑到79 fps。

《Control》中的表现也没有什么意外,不过在这里RTX 4080相对于RTX 3080 Ti的优势稍微小一些,4K下提升为26%,开启DLSS后提升为31%。

《孤岛惊魂6》再次展现了它对旗舰显卡的优化不足,游戏中2K分辨率下RTX 4080和RTX 4090的帧率居然是一样的。不过4K下的表现就比较正常了,RTX 4080比RTX 3080 Ti高了27%。

硬件杀手游戏《我的世界》RTX版里,DLSS默认就是和光追绑定的,开光追默认就开DLSS,如果手动关掉的话,RTX 3080 Ti就只有36 fps了,不过RTX 4080还是能接近60 fps,提升达到了50%,如果开启DLSS的话,优势可以达到55%。

赛车游戏《F1 22》中,RTX 4080相对于RTX 3080 Ti的提升同样在30%以上,自己则落后RTX 4090大约25%。

此外,我们还测试了《光明记忆:无限》《毁灭战士:永恒》《生化危机8》,在这3款游戏中,开启光追后RTX 4080相对于RTX 3080 Ti在4K下的提升也都在40%以上。

总体来看,综合这些游戏的表现,在开启光追后,RTX 4080相对于RTX 3080 Ti的提升大约为40%,达到了RTX 4090大约72%的性能。开启DLSS后,RTX 4080相对于RTX 3080 Ti的提升为41%,和RTX 4090的差距大约为26%。

DLSS 3测试

我们知道,DLSS 3是RTX 40系列的重头戏,它由DLSS 2超分辨率+帧生成+REFLEX三大部分组成。从RTX 4090发布到现在支持DLSS 3的游戏也越来越多了,这次我们选取了其中几款进行了测试(使用NVIDIA FramView工具监测帧率与PCL延迟)。

《赛博朋克2077》在4K超级光追预设下,RTX 4080开启DLSS 3性能模式后,帧速从30 fps暴增至114 fps,如果和RTX 3080 Ti开DLSS 2性能模式相比,则提升了近一倍。

《生死轮回》中RTX 4080开启DLSS 3后可以提升近100 fps,RTX 3080 Ti开DLSS 2的话只有92 fps,RTX 4080的DLSS 3优势还是比较明显。

《瘟疫传说:安魂曲》原生4K最高画质下RTX 4080能跑到接近60 fps,开DLSS 3后暴增至160 fps,接近原生的2.8倍。对比RTX 3080 Ti开DLSS 2的表现,则是1.7倍。

二次元游戏《幻塔》这次在新技术的支持上终于还是走到了老对头米哈游前面,新版将加入光追和DLSS 3。从测试来看,开启DLSS 3后RTX 4080的帧率是不开的3.3倍,对比RTX 3080 Ti开DLSS 2则是1.6倍。这种游戏画风开DLSS对画质的影响其实很小,加入DLSS是个不错的选择。

《光明记忆:无限》开启DLSS 3后,RTX 4080能跑到原生4K约2.5倍的帧率,约是RTX 3080 Ti开DLSS 2的1.5倍。

《微软模拟飞行2020》在最新的UPDATE11更新后,性能表现变得更好。测试选用重庆到成都的航线,原生4K下RTX 4080能跑到74 fps,开启DLSS 3性能模式后可以提升到172 fps,大概是原生的2.3倍。

延迟方面,由于RTX 40系自带光流加速器,通过DLSS 3的光学多帧生成实现了更高的帧率,并通过Reflex有效降低了延迟,所以我们可以看到所有测试的游戏中,开启DLSS 3的情况下PCL延迟都是远远低于4K原生设置的。因此,用RTX 40系显卡玩支持DLSS 3的游戏,请一定记得在游戏中打开DLSS 3,不但画面细节更丰富、游戏帧率更高,操控延迟也会变得更低,体验也就更加迅捷丝滑了。

DLSS 3画质方面,从《赛博朋克2077》的截图可以看到,即便是DLSS 3性能模式,画面细节方面和原生也几乎没有什么差别,质量模式更是完全看不出差别了。玩家完全可以放心开启DLSS 3,同时享受精美的画面与流畅的帧率。

此外,在RTX 40系列发布之后,众多DLSS 3游戏也陆续到来。当11月15日GeForce RTX 4080发售时,已有10款DLSS 3游戏发布,包括《瘟疫传说:安魂曲》《光明记忆:无限》《毁灭全人类2:重新探测》《暗影火炬城》《F1 2022》《逆水寒》《生死轮回》《漫威蜘蛛侠:重制版》《微软模拟飞行》和《超级人类》。此外《WRC Generations》《极品飞车:不羁》和《战锤40K:暗潮》在RTX 4080推出后不久就会发布,圣诞节前玩家就可畅玩这些DLSS 3游戏。

生产力测试

SPEC包含了大量的工业软件测试项目,在最新的2020V3.1版本中,RTX 4080相對于RTX 3080 Ti的提升还是比较明显的。其中Energy能源测试集的提升最大,是RTX 3080 Ti的2.1倍。其实RTX 4080的表现甚至比RTX 3090 Ti还好。

常规的3D渲染软件方面,Blender Benchmark 3.3中,RTX 4080对比RTX 3080 Ti提升也比较明显,其中monster和classroom的性能是RTX 3080 Ti的1.6倍左右,而junkshop也有30%的提升。

RTX 4080在V-Ray中的表现也还可以,无论是使用RTX还是CUDA相对于RTX 3080 Ti都能实现50%的渲染效率提升。而OC渲染器中的性能提升则高达35%以上。

视频剪辑方面,从PR2022来看,RTX 4080依旧要强过RTX 3080Ti,这还是在PR不支持双编码器的情况下。

至于达芬奇的话,做MagicMask魔法遮罩的效率提升也非常明显,RTX 3080 Ti需要31秒完成的工作RTX 4080只要20秒就可以搞定。

至于新的AV1编码,我们简单看看达芬奇的输出效率,RTX 4080和RTX 4090在输出时间上的区别非常小,但是双编码器相对RTX 3080 Ti来说确实做到了成倍的效率提升。

此外,如果不考虑显存容量的话,RTX 4080的单卡生产力性能甚至比RTX 3090 Ti还好一点。

总而言之,RTX 4080可以说是RTX 4090之下最强的消费级生产力GPU,3D渲染方面的综合性能超越RTX 3080 Ti接近50%,视频编码性能更是成倍地提升,再考虑到CUDA與NVIDIA Studio生态圈在业界无可匹敌的地位,RTX 4080确实非常值得设计师用户选择。

DLSS3画质对比

功率与温度测试

温度方面其实完全没有什么可担心的,毕竟RTX 4080 FE采用了和RTX 4090 FE一样大的散热器,既然这套散热器搞定RTX 4090都没问题,那应付TGP 320W的RTX 4080就更没问题了。

说到功耗,这里就不得不多说几句了,从RTX 4090发布到现在RTX 4080上市,很多玩家可能看到这一代的旗舰和次旗舰的标称TGP功耗都不算低。对于TGP功耗而言,其实它是GPU运行在Boost状态下的上限,用更容易理解的话来说,它其实是功耗墙上限。而作为功耗上限,并不是指GPU在日常使用和游戏中必须会达到的功耗。

由于采用了新的TSMC 4N NVIDIA定制工艺,使得RTX 40系列GPU有着更好的能耗比,在实现相同甚至更高的性能时,功耗更低。这就带来一个现象,那就是在RTX 40系列GPU跑到TGP功耗上限前,频率或电压可能就已经达到了上限,所以它无需更高的功耗才能满足性能释放需求。而在上一代Ampere架构的GPU上,通常就需要跑到极限功耗才能完成最高性能释放。从而造成了为什么RTX 40系列GPU总是跑不满功耗的错觉,实际上这是因为能耗比提升,无需更高功耗。

我们使用NVIDIA FramView工具监测了一些RTX 4080 FE在一些游戏4K分辨率下的功耗表现,可以看到在这些游戏中的平均功耗都没有达到320W的TGP功耗。但是作为对比的上代对位的RTX 3080 Ti,几乎都是顶着350W的上限在跑。

以《微软模拟飞行2020》(原生4K最高画质下)为例,在该游戏中RTX 4080的帧速是RTX 3080 Ti的1.32倍左右,但功耗只有后者的73%。这样可以计算出在该游戏中RTX 4080的能耗比达到了RTX 3080 Ti的1.7倍以上,可以说是表现非常出色了。

作为测试传统,我们同样也跑了一下3DMark Speedway的循环考机,并使用NVIDIA FramView工具监测功耗,可以看到,在该测试中,RTX 4080 FE的功耗为308W,GPU最高温度也只有60℃,节点温度也就70℃,GPU最高频率跑到了2820MHz。新的TSMC 4N NVIDIA 定制工艺带来的能效比提升确实是相当可观的。

总结:旗舰中的甜品,Ada Lovelace“80”新战力定义4K光追极致体验

NVIDIA Ada Lovelace GPU架构为RTX 40系列带来了革命性的进步,除了从TSMC 4N NVIDIA定制工艺获得的超大芯片规模与高频率增益之外,第三代RT Cores和第四代Tensor Cores也大显神威,特别是全新加入的光流加速器,让DLSS 3技术的光学多帧生成得以实现,从而大幅增加了游戏帧率并降低了延迟。

RTX 4080作为RTX 40系列的次旗舰,从实测来看在DLSS的加持下也能让主流游戏以4K极致光追设定高帧率流畅运行,在支持DLSS 3的游戏中帧率提升更是惊人,算得上是发烧级玩家的甜品级旗舰。

距离RTX 4090上市仅过去了一个月左右,就已经有10款以上游戏加入并支持DLSS3,后期也将有更多游戏对该技术提供支持,这和NVIDIA提供了方便的集成开发工具也是分不开的,这不仅仅是纸面上的新技术,而是立马能实装的新技术,这样才能真正让玩家获得全新的体验。

此外,从前面的生产力测试也可以看到,具备16GB大显存的RTX 4080在3D渲染输出与视频剪辑方面相对RTX 3080 Ti也有巨大的性能增幅,特别是视频编码性能甚至做到了翻倍,对生产力应用来讲也可以称得上是非常实用的高效工具。

在性能大幅提升的同时,RTX 4080的能耗比表现同样也是比较不错的。大部分游戏中的实际功耗都在300W以下,在提供高性能的同时,也能更好地缓解玩家的功耗焦虑。

因此,对于追求发烧级游戏体验的玩家和追求高效率的设计师用户来讲,RTX 4080绝对算得上是当前的“甜品旗舰”选择。而GeForce RTX 4080 Founders Edition作为来自NVIDIA原厂的信仰级游戏神器,不但能提供4K光追游戏极致体验和出色的生产力性能,还拥有极高的收藏价值,非常值得N饭第一时间入手!

猜你喜欢

旗舰功耗引擎
电动旗舰来了!试驾BMW i7
基于任务映射的暗硅芯片功耗预算方法
沃尔沃发布全新纯电旗舰SUV EX90
旗舰,你是谁
蓝谷: “涉蓝”新引擎
揭开GPU功耗的面纱
数字电路功耗的分析及优化
IGBT模型优化及其在Buck变换器中的功耗分析
无形的引擎
基于Cocos2d引擎的PuzzleGame开发