RTX40系主力战舰4K光追新霸主强势登场

2022-12-02戴寅

电脑报 2022年45期

戴寅

采用NVIDIAAdaLovelace架构的RTX4090显卡已经开始在市场中销售，其空前强大的性能获得了发烧级玩家的一致追捧。而在9月20日与RTX4090同时发布的RTX4080，也在约定的时间正式登场。作为RTX40系列目前的次旗舰，RTX4080也具备AdaLovelace架构的一系列新特性与黑科技，如第三代RTCores与第四代TensorCores，当然也包括可以让游戏的视觉效果与帧率大幅提升的DLSS3，而价格方面则相对更甜品一些。因此，RTX4080也受到了游戏玩家与高性能用户的广泛关注，而11月15日RTX4080也正式迎来了性能解禁。本次测试我们使用的是来自NVIDIA的GeForceRTX4080FoundersEdition（以下简称RTX4080FE），想知道这款原厂信仰级神器到底实力如何？那就和我们一睹为快吧。

Ada Lovelace架构全面升级，RTX 4080堪称旗舰中的甜品

之前我们对NVIDIA Ada Lovelace架构进行过全面的解析，这里先简单概括一下它的技术亮点。

●NVIDIA Ada Lovelace架构中全新设计的流式多处理器具有最高 83 TFLOPS 的着色能力，吞吐量超过上代产品2倍。

●第三代 RT Cores 有效光线追踪计算能力达到 191 TFLOPS，是上代产品的 2.8 倍。

●第四代 Tensor Cores 新增FP8引擎，具有高达 1.32 PFlops 的张量处理性能，超过上代 5 倍。

●支持着色器执行重排序（SER），通过即时重新安排着色器负载来提高执行效率。SER可为光线追踪带来最高3倍的性能提升，整体游戏性能可最高提升 25%。

●新增Ada光流加速器帶来2倍的性能提升，使DLSS 3能够预测场景中帧和帧之间的运动变化，让神经网络能够在保持图像质量的同时提高帧率。

●架构进行大幅改进，采用TSMC定制4N工艺，此工艺专为GPU优化，实现高达2倍的能效飞跃。

●12GB显存及以上型号提供双NVIDIA编码器（NVENC），可最多缩短一半的视频导出时间，并提供了对AV1的硬件编码支持。

Shader Executing Reordering（SER）着色器执行重排序

着色器执行重排序技术可以带来更高的效率

GPU在完成大量并行计算的时候效率最高，而随着游戏中光追效果越来越复杂，着色器面临的可能就是大量发散的、无序的低效率工作任务，从而影响了渲染效率。SER技术的出现，就可以把这些杂乱的工作任务进行分类，动态重组为更高效的任务，从而提升着色器的执行效率。从NVIDIA官方数据来看，SER技术大约会带来2倍的着色器性能提升。

第三代RT Cores

第三代RT Core 新增了“微映射透明度引擎”和“微网格置换引擎”

从RTX 20到RTX 30再到RTX 40，RT Cores进化到了第三代。简单地从有效光线追踪计算能力来看，NVIDIA Ada Lovelace 架构GPU的第三代RT Cores吞吐量达到了191 TFLOPS，是上一代的2.8倍之多。

另外，NVIDIA Turing和Ampere 架构GPU中的RT Cores包括了用于加速边界体积层次（BVH）数据结构遍历的加速单元，并执行射线三角形和光线边界框相交测试计算。Ampere的RT Cores中，BVH遍历由Box Intersection Engine进行加速，射线三角形相交测试由三角形相交引擎进行加速，这已经被证明是迄今为止处理光追工作负载最高效的引擎。而在Ada GPU的第三代RT Cores中，除了以上两个功能外，还引入了“微映射透明度引擎”（OMM）和“微网格置换引擎”（DMM）。

微映射透明度引擎的作用是优化光线追踪渲染，大幅降低着色器的工作负载，这对于处理复杂物体光追特性来讲提升是很大的。具体的原理是将光线追踪特性烘焙到不透明的蒙版中，让那些不规则的形状与半透明的对象都能更快更精准地被渲染出来。

微网格置换引擎则可以将面数非常多的复杂图形做简化，创造出更加简单的模型，从而实现用基本三角形渲染复杂几何图形的目的，大大减少了计算量和对显存的占用。从官方数据来看，微网格置换引擎可以让光线追踪的BVH速度最多提升15倍以上，而显存占用最多可降低到原先的1/20，总之就是越复杂的模型，微网格置换引擎的优化效果越突出。

第四代Tensor Cores

在Ada GPU上，Tensor Cores已经进化到了第四代，而这次Tensor Cores的升级尤其重磅。它配备了全新的FP8引擎，张量处理性能高达1.32 PetaFlops（相对上代提升了五倍之多）。第四代Tensor Cores最具革命性的进步当然是全新加入的光流加速器（Optical Flow Accelerator），而它就是NVIDIA DLSS 3黑科技的核心所在。

DLSS 3技术

DLSS3技术带来了全新的光学多帧生成技术

DLSS技术作为RTX系列显卡提升画质与帧率的专用黑科技，到RTX 40这一代进化到了DLSS 3，跨度之大证明其改进是革命性的，NVIDIA官方称其代表了“神经网络渲染新时代”。

和之前的DLSS不同，DLSS 3在原有的超分辨率功能基础上进一步引入了光学多帧生成技术，简单来说就是可以通过AI计算生成新的帧，而不像之前那样只是生成像素。而这个帧生成的工作，是在Ada架构中新的光流加速器完成的，当然这就意味着DLSS 3中的“光学多帧生成”功能是RTX 40独享的。

光流加速器可以在DLSS 2的基础上计算两帧之间的光流场，捕捉游戏画面中从第1帧到第2帧之间变化的方向与速度，包含粒子、光线照射、反射等像素信息，通过计算运动矢量和光流场来精确重建画面。

实时光学多帧生成技术可以直接生成帧而不是单独的像素

总的来说，DLSS 2做的是通过AI计算出画面上剩余的像素，而DLSS 3则在此基础上还能计算出下一帧完整的画面，这样算下来DLSS 3等于是完全重建了实际显示画面7/8的像素，也可以说是重建了相当于实际渲染像素7倍的像素。此外，由于DLSS 3的“帧生成”在GPU中后处理，所以即便是CPU性能出现瓶颈，也能提升游戏帧率。

按照官方数据，DLSS 3最多可带来4倍的游戏性能提升。DLSS 3包含了“光学多帧生成”、“超分辨率”和“NVIDIA Reflex”三大部分，开发者只要整合DLSS 3，就可默认支持DLSS 2。目前DLSS 3已经得到了游戏开发者与游戏引擎的广泛支持，在后面的详细测试中我们会进一步介绍DLSS 3游戏的情况。

NVIDIA Studio优化

在生产力方面，NVIDIA GPU打造的CUDA生态圈已经是业界无可匹敌的存在，RTX显卡也是设计师们优先考虑的高效工具，因此RTX 40系列配合NVIDIA Studio 驱动也将会为内容创作者们提供更加出色的選择。总的来说，目前RTX 可以加速 110 多款主流创意应用，此外，SDK的提供使这些应用更加高效，并提供独家的功能，例如Optix、DLSS和Maxine。NVIDIA Studio 还提供了全套创意应用，包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。

AV1与AI直播

AV1相比H.264等编码方式可以在同码率下提供更加清晰的视频画面，而且AV1还支持一些更先进的编码特性，例如HDR与低延迟。RTX 40的编码器（显存12GB以上的RTX 40系列，当然包括RTX 4080，都提供了NVENC A V1双编码器）提供了对AV1硬件编码的支持，而OBS和Discord等推流软件都将在不久之后提供对NVENC AV1的支持，让玩家享受到更加精美而流畅的直播视频画面。解码方面，RTX 40的NVENC也继承了RTX 30上的第5代硬件解码器，支持MPEG-2、VC-1、H.264（AVCHD）、H.265（HEVC）、VP8/9以及AV1的硬件解码。AI直播部分，NVIDIA在直播应用技术上的更新有：面部表情预估、眼神追踪（让你看起来像是在看摄像头），以及虚拟绿幕的质量改进，而开发者可以很容易地在自己的APP中集成NVIDIA Broadcast SDK的这些功能。

RTX 4080规格解析

那么RTX 4080作为RTX 40系列的次旗舰，规格如何呢？RTX 4080采用了AD103芯片，AD103相对AD102进行了一些削减，GPC为7组，另外其中1个GPC还缩减了2组TPC只有4组。而RTX 4080在此基础上进一步减少了两组TPC，总共拥有38组TPC。

因此，RTX 4080 GPU具有 9728个CUDA 核心，可提供 49 Shader-TFLOPS 传统光栅渲染能力；304个第四代Tensor Cores 为AI处理和DLSS提供780 Tensor-TFLOPS的计算性能；76个第三代RT Cores具有113 RT-TFLOPS的计算性能，为下一代光线追踪提供强劲动力；配备256 bit/16 GB美光GDDR6X显存。根据官方数据来看，RTX 4080的性能最高可达RTX 3080 Ti的2倍，而功耗则降低了近10%。当然，RTX 4080也具备Ada Lovelace架构的多项技术，包括着色器执行重排序（SER）、第三代 RT Cores 以及DLSS 3。

此外，细心的玩家也许注意到RTX 4080的RT Cores/Tensor Cores/TUs数量甚至要比RTX 3080 Ti少一些，显存位宽也要低一些，那它是怎么做到性能反而更高的呢？前面已经说过了，RTX 4080的SM单元经过了进一步优化且支持SER技术，同时RT Cores与Tensor Cores都要高出一代，效率自然不可同日而语，此外GPU的二级缓存是RTX 3080 Ti的10.7倍，核心频率更是高出50%以上，综合这些因素，RTX 4080最终的性能其实是远远超过RTX 3080 Ti的。而在TGP方面，RTX 4080设定为320 W，比RTX 3080 Ti还低30 W，可见其先进的制程确实带来了极高的能效比。

完整的AD103 GPU核心图

RTX 4080 GPU核心图

“90旗舰”同款信仰级散热方案，RTX 4080 FE实物赏析

NVIDIA的Founders Edition长期以来都是N饭心目中的信仰神器，在工业设计方面可以说是独具特色，除了性能强悍之外也具备极高的收藏价值，而且在电气性能方面也是众多AIC厂商的参考标杆。

RTX 4080 FE的外观造型与RTX 4090 FE完全相同，银色与黑色的搭配相得益彰，显卡中央的X造型尽显科技与信仰的力量。散热器正面有一只轴流风扇负责推风，另一只轴流风扇位于显卡背面负责拉风，从而在机箱中制造出更为高效的散热风道，提升整体的散热效果。

RTX 4080 FE散热器也搭载了新的散热鳍片和气流设计，相比上代旗舰的FE散热器，RTX 4080 FE可产生的最大气流高出20%，在同噪声等级情况下，气流可以高出15%，从而提供更高的散热效率。

和RTX 4090 FE一样，RTX 4080 FE的厚度已经达到了3.5槽，重量接近2.2kg，散热器的体积相当的夸张，旗舰的霸气感十足。辅助电源接口当然也是12Pin+4Pin，包装盒也附送了一条12Pin+4Pin转4×8Pin的转接线。在RTX 4080 FE的侧面，配备了GeForce RTX信仰灯，通电后会亮起白光，信仰感爆棚。显卡尾部设计了一个磁吸盖板，打开后会露出机架安装孔位，方便在服务器机柜中安装。

接口部分，RTX 4080 FE提供了3个DP 1.4接口和1个HDMI 2.1接口，可以支持8K/60Hz HDR10输出。

RTX 4080 FE和上代FE一样采用了异形PCB设计，整体布局和RTX 4090 FE在细节上有些不同，总供电相数为16，强大的供电设计可以提供更加平稳的高负载输出曲线，让RTX 4080 GPU稳定发挥全部性能。

实战测试：RTX 4080飞跃式升级，性能倍增

测试平台

显卡：NVIDIA GeForce RTX 4080 Founders Edition

处理器：Intel酷睿i9 13900K

内存：金士顿 DDR5 6000 16GB×2

主板：华硕ROG MAXIMUS Z790 HERO

硬盤：WD_BLACK SN850 2TB

电源：华硕ROG雷神Ⅱ 1200W

操作系统：Windows 11 专业版 22H2

测试中我们解锁处理器功耗墙，并开启BIOS中的Resize BAR选项。内存选择XMP DDR5 6000模式，分频设定为自动。此外，还选用了RTX 3080 Ti与RTX 4090进行对比。

基准性能测试

首先是3DMark GPU基准测试部分，不管是基于DX11的FireStrike系列还是基于DX12的TimeSpy系列，RTX 4080都相对RTX 3080 Ti领先了43%～46%。

3DMARK在近期更新了针对DX12 Ultimate的测试SpeedWay，能够更好地展现次世代GPU在使用DX12U API的次世代游戏中的表现。在这个测试中，RTX 4080相对3080Ti的提升同样达到了40%。

光追性能方面，PortRoyal测试中，RTX 4080比RTX 3080Ti提升了39%。在对GPU压力较大的DXR纯光追场景测试中，更是领先RTX 3080 Ti大约55%之多，Ada Lovelace的第三代RT Cores确实在效率方面更胜一筹。

DLSS部分，RTX 4080也保持了巨大的优势，在DLSS 2模式下，也领先RTX 3080 Ti大约45%。在DLSS 3项目中，RTX 3080 Ti不支持光学多帧生成，所以只相当于运行DLSS 2的4K测试，而内置光流加速器、完整支持DLSS 3的RTX 4080自然效率更高，领先RTX 3080 Ti大约128%！可谓飞跃式的升级了。同时，我们也可以看到，RTX 4080的基准性能为RTX 4090的70%～77%，和它的芯片规模是比较符合的。

光栅化游戏性能测试

光栅化游戏部分，《古墓丽影：暗影》在2K分辨率下，RTX 4080比3080Ti多出了75 fps，提升幅度为44%，在4K分辨率下多出了37 fps，提升达到了39%。和RTX 4090相比，4K下的性能大约为它的67%。

《COD 19》中，RTX 4080无论在2K还是4K下相对3080Ti都有接近40%的帧率提升，在4K下则大约有RTX 4090的73%，相比《古墓丽影：暗影》表现要好一些。

《荒野大镖客：救赎2》算是比较公平的游戏，RTX 4080相对RTX 3080 Ti无论在2K还是4K下的提升都超过了30%，4K下的提升略高一点达到了38%。它在4K下的帧率大约为RTX 4090的76%，差距不算太大。

育碧系游戏《刺客信条：英灵殿》，RTX 4080相对于RTX 3080 Ti同样在2K和4K下都有30%出头的优势，而在这里它只比RTX 4090低了15%左右。

《孤岛惊魂6》对旗舰显卡的优化也不是很到位，2K下RTX 4080和RTX 4090只有5%的差距，有可能在处理器方面出现瓶颈问题了。而到了4K下，差距就拉大到了21%。RTX 4080在4K下比RTX 3080 Ti的帧率也高出了30%左右。

RTX 3080 Ti跑4K的《看门狗：军团》勉强能到60 fps多一点，而RTX 4080还是能接近90 fps，提升大约有38%。RTX 4080在4K下有RTX 4090大约75%的帧率。

优化超好的3A大作《毁灭战士：永恒》中，RTX 4080在4K下能超过240 fps，虽然RTX 3080 Ti帧率也不低，但是RTX 4080的提升已经接近50%了，增幅非常可观。

同样有这么大性能差距的游戏还有《杀手3》，RTX 4080在2K和4K下相对RTX 3080 Ti的帧率优势都超过了45%。

RTX 4080在《Control》中的表现相对平淡一些，相比RTX 3080 Ti在4K下大约有28%的帧率优势，相比RTX 4090则落后了29%。

赛车游戏《极限竞速：地平线5》，4K下RTX 4080比RTX 3080 Ti多了35%的帧率，比RTX 4090低了18%。2K下的帧率和RTX 4090比较接近，显然是处理器又出现了瓶颈。

再来看几款电竞网游。玩《绝地求生》的话RTX 4080也能达到最高画质4K/144Hz的标准，在4K下比RTX 3080 Ti高了33%，比RTX 4090低了31%，正好在中间位置。

暴雪的《守望先锋2》里RTX 4080同样也能达成最高画质4K/144Hz的标准，相比RTX 3080 Ti在4K下的帧率提升也有34%，而比RTX 4090则是低了29%。

《最终幻想14》的表现则符合之前的差距，RTX 4080相比RTX 3080 Ti提升30%左右，相比RTX 4090在4K下落后26%。

从这这些主流游戏的光栅化游戏性能测试结果来看，2K下RTX 4080相对于RTX 3080 Ti的提升在24%～50%之间，平均为36%。4K下提升在28%～46%之间，平均也是36%。相比RTX 4090，2K下的平均差距为15%，4K下大约有25%。

光追游戏性能测试

当然，光追和DLSS才是RTX显卡真正的精髓，我们当然要用极限画质下的光追游戏来考验RTX 4080的强悍性能。

同样先来看看《古墓丽影：暗影》。之前在4K下不开光追，RTX 4080比RTX 3080 Ti的提升有39%，开启光追后，提升进一步加大到了43%，虽然光追核心不如RTX 3080 Ti多，但RTX 4080的光追单元毕竟高出一代，同时频率也高很多，所以性能大幅提升也是情理之中。

《地铁：离去增强版》4K下，RTX 3080 Ti不开DLSS已经只有35 fps了，即使开启DLSS质量模式也达不到60 fps。RTX 4080在4K下的优势达到了49%，开启DLSS还可以跑到80 fps。

《看门狗：军团》的硬件要求也比較高，也是同样的情况，RTX 3080 Ti在开启DLSS的情况下才能勉强达到4K/60 fps，RTX 4080在4K下有接近40%的优势，开启DLSS更是可以跑到79 fps。

《Control》中的表现也没有什么意外，不过在这里RTX 4080相对于RTX 3080 Ti的优势稍微小一些，4K下提升为26%，开启DLSS后提升为31%。

《孤岛惊魂6》再次展现了它对旗舰显卡的优化不足，游戏中2K分辨率下RTX 4080和RTX 4090的帧率居然是一样的。不过4K下的表现就比较正常了，RTX 4080比RTX 3080 Ti高了27%。

硬件杀手游戏《我的世界》RTX版里，DLSS默认就是和光追绑定的，开光追默认就开DLSS，如果手动关掉的话，RTX 3080 Ti就只有36 fps了，不过RTX 4080还是能接近60 fps，提升达到了50%，如果开启DLSS的话，优势可以达到55%。

赛车游戏《F1 22》中，RTX 4080相对于RTX 3080 Ti的提升同样在30%以上，自己则落后RTX 4090大约25%。

此外，我们还测试了《光明记忆：无限》《毁灭战士：永恒》《生化危机8》，在这3款游戏中，开启光追后RTX 4080相对于RTX 3080 Ti在4K下的提升也都在40%以上。

总体来看，综合这些游戏的表现，在开启光追后，RTX 4080相对于RTX 3080 Ti的提升大约为40%，达到了RTX 4090大约72%的性能。开启DLSS后，RTX 4080相对于RTX 3080 Ti的提升为41%，和RTX 4090的差距大约为26%。

DLSS 3测试

我们知道，DLSS 3是RTX 40系列的重头戏，它由DLSS 2超分辨率+帧生成+REFLEX三大部分组成。从RTX 4090发布到现在支持DLSS 3的游戏也越来越多了，这次我们选取了其中几款进行了测试（使用NVIDIA FramView工具监测帧率与PCL延迟）。

《赛博朋克2077》在4K超级光追预设下，RTX 4080开启DLSS 3性能模式后，帧速从30 fps暴增至114 fps，如果和RTX 3080 Ti开DLSS 2性能模式相比，则提升了近一倍。

《生死轮回》中RTX 4080开启DLSS 3后可以提升近100 fps，RTX 3080 Ti开DLSS 2的话只有92 fps，RTX 4080的DLSS 3优势还是比较明显。

《瘟疫传说：安魂曲》原生4K最高画质下RTX 4080能跑到接近60 fps，开DLSS 3后暴增至160 fps，接近原生的2.8倍。对比RTX 3080 Ti开DLSS 2的表现，则是1.7倍。

二次元游戏《幻塔》这次在新技术的支持上终于还是走到了老对头米哈游前面，新版将加入光追和DLSS 3。从测试来看，开启DLSS 3后RTX 4080的帧率是不开的3.3倍，对比RTX 3080 Ti开DLSS 2则是1.6倍。这种游戏画风开DLSS对画质的影响其实很小，加入DLSS是个不错的选择。

《光明记忆：无限》开启DLSS 3后，RTX 4080能跑到原生4K约2.5倍的帧率，约是RTX 3080 Ti开DLSS 2的1.5倍。

《微软模拟飞行2020》在最新的UPDATE11更新后，性能表现变得更好。测试选用重庆到成都的航线，原生4K下RTX 4080能跑到74 fps，开启DLSS 3性能模式后可以提升到172 fps，大概是原生的2.3倍。

延迟方面，由于RTX 40系自带光流加速器，通过DLSS 3的光学多帧生成实现了更高的帧率，并通过Reflex有效降低了延迟，所以我们可以看到所有测试的游戏中，开启DLSS 3的情况下PCL延迟都是远远低于4K原生设置的。因此，用RTX 40系显卡玩支持DLSS 3的游戏，请一定记得在游戏中打开DLSS 3，不但画面细节更丰富、游戏帧率更高，操控延迟也会变得更低，体验也就更加迅捷丝滑了。

DLSS 3画质方面，从《赛博朋克2077》的截图可以看到，即便是DLSS 3性能模式，画面细节方面和原生也几乎没有什么差别，质量模式更是完全看不出差别了。玩家完全可以放心开启DLSS 3，同时享受精美的画面与流畅的帧率。

此外，在RTX 40系列发布之后，众多DLSS 3游戏也陆续到来。当11月15日GeForce RTX 4080发售时，已有10款DLSS 3游戏发布，包括《瘟疫传说：安魂曲》《光明记忆：无限》《毁灭全人类2：重新探测》《暗影火炬城》《F1 2022》《逆水寒》《生死轮回》《漫威蜘蛛侠：重制版》《微软模拟飞行》和《超级人类》。此外《WRC Generations》《极品飞车：不羁》和《战锤40K：暗潮》在RTX 4080推出后不久就会发布，圣诞节前玩家就可畅玩这些DLSS 3游戏。

生产力测试

SPEC包含了大量的工业软件测试项目，在最新的2020V3.1版本中，RTX 4080相對于RTX 3080 Ti的提升还是比较明显的。其中Energy能源测试集的提升最大，是RTX 3080 Ti的2.1倍。其实RTX 4080的表现甚至比RTX 3090 Ti还好。

常规的3D渲染软件方面，Blender Benchmark 3.3中，RTX 4080对比RTX 3080 Ti提升也比较明显，其中monster和classroom的性能是RTX 3080 Ti的1.6倍左右，而junkshop也有30%的提升。

RTX 4080在V-Ray中的表现也还可以，无论是使用RTX还是CUDA相对于RTX 3080 Ti都能实现50%的渲染效率提升。而OC渲染器中的性能提升则高达35%以上。

视频剪辑方面，从PR2022来看，RTX 4080依旧要强过RTX 3080Ti，这还是在PR不支持双编码器的情况下。

至于达芬奇的话，做MagicMask魔法遮罩的效率提升也非常明显，RTX 3080 Ti需要31秒完成的工作RTX 4080只要20秒就可以搞定。

至于新的AV1编码，我们简单看看达芬奇的输出效率，RTX 4080和RTX 4090在输出时间上的区别非常小，但是双编码器相对RTX 3080 Ti来说确实做到了成倍的效率提升。

此外，如果不考虑显存容量的话，RTX 4080的单卡生产力性能甚至比RTX 3090 Ti还好一点。

总而言之，RTX 4080可以说是RTX 4090之下最强的消费级生产力GPU，3D渲染方面的综合性能超越RTX 3080 Ti接近50%，视频编码性能更是成倍地提升，再考虑到CUDA與NVIDIA Studio生态圈在业界无可匹敌的地位，RTX 4080确实非常值得设计师用户选择。

DLSS3画质对比

功率与温度测试

温度方面其实完全没有什么可担心的，毕竟RTX 4080 FE采用了和RTX 4090 FE一样大的散热器，既然这套散热器搞定RTX 4090都没问题，那应付TGP 320W的RTX 4080就更没问题了。

说到功耗，这里就不得不多说几句了，从RTX 4090发布到现在RTX 4080上市，很多玩家可能看到这一代的旗舰和次旗舰的标称TGP功耗都不算低。对于TGP功耗而言，其实它是GPU运行在Boost状态下的上限，用更容易理解的话来说，它其实是功耗墙上限。而作为功耗上限，并不是指GPU在日常使用和游戏中必须会达到的功耗。

由于采用了新的TSMC 4N NVIDIA定制工艺，使得RTX 40系列GPU有着更好的能耗比，在实现相同甚至更高的性能时，功耗更低。这就带来一个现象，那就是在RTX 40系列GPU跑到TGP功耗上限前，频率或电压可能就已经达到了上限，所以它无需更高的功耗才能满足性能释放需求。而在上一代Ampere架构的GPU上，通常就需要跑到极限功耗才能完成最高性能释放。从而造成了为什么RTX 40系列GPU总是跑不满功耗的错觉，实际上这是因为能耗比提升，无需更高功耗。

我们使用NVIDIA FramView工具监测了一些RTX 4080 FE在一些游戏4K分辨率下的功耗表现，可以看到在这些游戏中的平均功耗都没有达到320W的TGP功耗。但是作为对比的上代对位的RTX 3080 Ti，几乎都是顶着350W的上限在跑。

以《微软模拟飞行2020》（原生4K最高画质下）为例，在该游戏中RTX 4080的帧速是RTX 3080 Ti的1.32倍左右，但功耗只有后者的73%。这样可以计算出在该游戏中RTX 4080的能耗比达到了RTX 3080 Ti的1.7倍以上，可以说是表现非常出色了。

作为测试传统，我们同样也跑了一下3DMark Speedway的循环考机，并使用NVIDIA FramView工具监测功耗，可以看到，在该测试中，RTX 4080 FE的功耗为308W，GPU最高温度也只有60℃，节点温度也就70℃，GPU最高频率跑到了2820MHz。新的TSMC 4N NVIDIA 定制工艺带来的能效比提升确实是相当可观的。

总结：旗舰中的甜品，Ada Lovelace“80”新战力定义4K光追极致体验

NVIDIA Ada Lovelace GPU架构为RTX 40系列带来了革命性的进步，除了从TSMC 4N NVIDIA定制工艺获得的超大芯片规模与高频率增益之外，第三代RT Cores和第四代Tensor Cores也大显神威，特别是全新加入的光流加速器，让DLSS 3技术的光学多帧生成得以实现，从而大幅增加了游戏帧率并降低了延迟。

RTX 4080作为RTX 40系列的次旗舰，从实测来看在DLSS的加持下也能让主流游戏以4K极致光追设定高帧率流畅运行，在支持DLSS 3的游戏中帧率提升更是惊人，算得上是发烧级玩家的甜品级旗舰。

距离RTX 4090上市仅过去了一个月左右，就已经有10款以上游戏加入并支持DLSS3，后期也将有更多游戏对该技术提供支持，这和NVIDIA提供了方便的集成开发工具也是分不开的，这不仅仅是纸面上的新技术，而是立马能实装的新技术，这样才能真正让玩家获得全新的体验。

此外，从前面的生产力测试也可以看到，具备16GB大显存的RTX 4080在3D渲染输出与视频剪辑方面相对RTX 3080 Ti也有巨大的性能增幅，特别是视频编码性能甚至做到了翻倍，对生产力应用来讲也可以称得上是非常实用的高效工具。

在性能大幅提升的同时，RTX 4080的能耗比表现同样也是比较不错的。大部分游戏中的实际功耗都在300W以下，在提供高性能的同时，也能更好地缓解玩家的功耗焦虑。

因此，对于追求发烧级游戏体验的玩家和追求高效率的设计师用户来讲，RTX 4080绝对算得上是当前的“甜品旗舰”选择。而GeForce RTX 4080 Founders Edition作为来自NVIDIA原厂的信仰级游戏神器，不但能提供4K光追游戏极致体验和出色的生产力性能，还拥有极高的收藏价值，非常值得N饭第一时间入手！