APP下载

Ampere架构加持,主流显卡畅玩光追 技嘉魔鹰GeForce RTX 3060赏析

2021-06-20《微型计算机》评测室

微型计算机 2021年9期
关键词:光线架构频率

《微型计算机》评测室

早在NVIDIAGeForceRTX20系显卡的时代,我们就曾通过大量支持光追的游戏测试它们在这类游戏中的实际性能^现。遗憾的是,由于工艺、架构的1素,当时的玩家们只有购入RTX2070SUPER及其以上性能的显卡才能够在流畅运^戏的条件下,真正体会到光线追踪为游戏画面带来的前所未有的技术革新。但_RTX30系显卡的到来,这样的情况开始出现变化,特别是于近期推出的RTX3060,这款可以在合理的售价内被购义且显卡性會@伏y异的主流产品,凭借着第二代RTCore与第三代TensorCore,带领着主流玩家一脚跨入光线追踪的游戏画面时代。同时,随着RTX3060显卡的全面上市,NVIDIAGeForceRTX30系列显卡从主流市场到高端市场的布局业已完成。

熟悉的全金属装甲,冷酷超级范儿

依靠着在显卡市场多年深耕经验,NVIDIA在产品研发与推广过程中慢慢总结出清晰的产品划分以及定价策略。从过往历史来看,NVIDIA旗下的“70”“80”“90”等系列产品在推出时主要面对高端与发烧级用户,这类用户有着资金充裕的共性,并且对显卡性能擢升有着严苛的需求。而在主流市场中,NVIDIA则主要依靠性价比能打的“60”系列产品臝得大众玩家的青睐,并且这类产品一经推广往往容易成为经典产品,比如几年前的GTX960、GTX1060等依然保有量可观且在二手市场上流通量巨大。即便是在30系显卡的时代,NVIDIA的策略也依旧如此。那么有望成为又一经典的RTX3060又有怎样的特性呢?

改进架构,带来更多可能

NVIDIAGeForceRTX30系列基于NVIDIA最新推出的NVIDIAAmpere架构,通过三星8nm定制工艺制成,RTX3060也是如此。相比起NVIDIATuring架构,NVIDIAAmpere架构采用改进后的StreamingMultiprocessor(SM)单元 其提供了数量翻倍的FP32单元。这也意味着,它的每个AmpereSM分区每时钟能够执行32个FP32操作,四个AmpereSM分区组合在一起,每个时钟可执行128FP32操作,实现128bitFMA浮点运算。事实上,图形、计算操作、算法以及现代着色器的工作负载通常混合使用FP32算术指令。FP32加速能够有助于光线追踪降噪着色器。同时,光线追踪渲染工作负载越大,相对于上一代产品的性能提升越大。不仅如此,NVIDIAAmpere架构具备全新的L1缓存/材质系统,能够提供双倍的L1缓存带宽与缓存分区尺寸,总容量提升达到了33%。

另外,型号为GA106-300的RTX3060GPU还拥有三顼基础处理技术——包括可编程着色器、用于加快光线三角形和光线边界框相交的RTCore以及被称为“TensorCore”的AI处理管线。其中,搭载GA106-300核心的RTX3060在可编程着色器的处理能力上达到了RTX2060的两倍,实际数据由RTX2060的6.5-Shader-TFLOP/s提升到12.7Shader-TFLOP/s。同时,GA106-300的光线三角形吞吐量也远超RTX2060,处理稀疏网络的速率也达到了上代产品的两倍。这也使得NVIDIAGeForceRTX3060在光线追踪以及深度学习方面相比RTX2060有着巨大优势。那么具体到实际应用中的差异到底有多大?也容我们先卖个关子。

规格升级,提升潜力

由于AmpereSM设计有所变化,NVIDIAAmpere架构与NVIDIATuring架构的CUDA核心数量出現明显差异一NVIDIAAmpere架构使用INT32和FP32双功能设计、并额外增加FP32单元,所以它搭载的CUDA核心数量能够得到明显提升。从规格来看,代号为GA106-300的RTX3060GPU拥有132.5亿个晶体管、28个SM单元、3584个CUDA核心以及28个第二代RTCore、112个第三代TensorCore。而采用NVIDIATuring架构的RTX2070SUPER和RTX2060,它们的CUDA核心数量则分别为2560个和1920个。基础频率方面,相比起RTX3060Ti,RTX2070SUPER,RTX2060SUPER、RRTX2060,RTX3060要稍低一点,为1320MHz。但在核心Boost频率方面,RTX3060则达到了1777MHz,比以上四款显卡的核心Boost频率要更高一些,因此RTX3060可以根据玩家的实际使用情况在高性能与低能耗之间进行变换。

值得一提的是,RTX3060的显存容量得到了大幅度的提升,总容量达到12GB,这样的数据不仅是RTX2060的两倍,甚至比我们此前评测的首批上市的RTX3080还要多。事实上,根据我们一直以来的测试经验来看,大容量显存往往能在内容创作应用中的表现更出色,包括渲染复杂的模型、多开设计创作应用等。同时,部分3A游戏还会提示显存需求,高分辨率、高画质以及高抗锯齿的调整往往会带来显存需求的大幅提升,所以更多容量的显存可以保证游戏过程的稳定。另外,RTX3060的显存位宽为192bit,显存频率为7501MHz,显存带宽为360GB/s。其中,RTX3060与RTX2060的显存位宽保持一致,但前者的显存频率更高,显存带宽也自然水涨船高。

应用广泛,玩法多样

即便是GeForceRTX30系列中的“弟弟”,“大哥们”有的应用功能,RTX3060也少不了,比如我们之前详细介绍过的NVIDIAReflex和NVIDIABroadcast。

其中,NVIDIAReflex可以有效降低从点击鼠标到显示器画面产生对应变化的系统延迟,从而提高射击精度,帮助玩家真正实现“所按即所得”。从目前来看,NVIDIAReflex低延迟电竞技术面对的应该是专业级的玩家,毕竟当前大多数主流玩家很难感受到系统延迟为游戏操作带来的微妙差异,但NVIDIA不这样认为,所以即便是面向主流玩家的RTX3060也支持该功能。

NVIDIABroadcast

随着视频分享、网络会议逐渐成为主流趋势,NVIDIA也为这些应用带来了新的通用插件一NVIDIABroadcast。目前,NVIDIA旗下的GeForceRTX、TITANRTX以及QuadroRTXGPU均支持此插件,并且使用其专用Al处理器TensorCoreAI网络与玩家的游戏一起实时运行。在使用界面中,NVIDIABroadcast提供了易于使用的音频和视频效果,例如“降噪”“虚似背景”和“自动构图”等。这也意味着,它能帮助用户更好地应对视频直播、游戏分享、多人连线、视频会议等多种应用场景。

ResizableBAR

在NVIDIAReflex和NVIDIABroadcast之外,NVIDIA近期发布的ResizableBAR功能,RTX3060也同样支持。而ResizableBAR是一项标准化的PCIe接口技术,通过它,系统可以更具实际需求进行资源请求,并以整体方式将其进行传送,所以CPU便能有效访问整个帧缓存。另外,如果存在多个请求,传输可同时进行,而不是排序候命。对于游戏玩家而言,ResizableBAR最直观的感受便是能有效提升游戏帧率。

仅从规格参数来看,RTX3060会是RTX30系列显卡中最富性价比的产品,同时应对上代产品也会有着不小的优势,那么它在实际使用中到底有着怎样的表现呢?为了得到这个答案,我们通过技嘉魔鹰GeForceRTX3060、NVIDIAGeForceRTX3060Ti、NVIDIAGeForceRTX2070SUPER、NVIDIAGeForceRTX2060SUPER以及NVIDIAGeForceRTX2060开启基础性能、游戏性能、散热性能以及超频性能的实际测试,希望大家能够通过测试成绩对RTX3060有更直观的认知。

测试平台一览

GPU:技嘉魔鹰GeForceRTX3060

NVIDIAGeForceRTX3060Ti

NVIDIAGeForceRTX2070SUPER

NVIDIAGeForceRTX2060SUPER

NVIDIAGeForceRTX2060

处理器:AMD锐龙95950×

内存:DDR4360032GB双通道

主板:X570

血统传承、风之力加持

从属于魔鹰系列的技嘉魔鹰GeForceRTX3060依然没有跳脱出该系列的设计风格,它的正面外观采用颇具视觉层次感的装甲设计——丰富的切线以及诸多棱角让它有着不错的观感。同时该显卡的背面采用经过喷砂工艺处理的一体式金属背板。魔鹰系列都有背光,技嘉魔鹰GeForceRTX3060也不例外,它的顶部Logo设计了RGB灯效,且支持RGBFusion2.0灯效同步技术,玩家可以通过AORUSENGINE软件轻松调节其灯光色彩和灯效模式,甚至可以与同样支持该灯效同步技术的主板、内存、外设等硬件實现灯效联动,帮助玩家组建灯效出色的MOD主机。

出色散热系统是魔鹰系列引以为傲的设计,技嘉魔鹰GeForceRTX3060亦是如此一它搭载了风之力三风扇散热系统,正面3个散热风扇的扇叶采用特殊的刀刃式扇叶设计,可以在同转速下为显卡内部带来更强烈的风压。同时,散热风扇还支持正逆转气流导向技术,有助于将风流导向相同方向,减少风流,从而帮助显卡更好地排出热量,进一步加强整体散热能力。另外,一体式金属背板拥有大面积镂空设计,它可以让气流直接贯穿显卡内部的散热鳍片,增加散热效率。在拆解技嘉魔鹰GeForceRTX3060之后我们可以发现,散热器内部采用大面积直触式散热底座与GPU相连,同时3根软磁粉复合式热管将散热底座和大量散热鳍片连接起来,增大散热面积。值得注意的是,技嘉魔鹰GeForceRTX3060的GDDR6显存和供电电路部分也同样采用了散热贴片,能有效控制这部分的发热量。

核心方面,技嘉魔鹰GeForceRTX3060采用代号为GA106-300-A1的GPU——它拥有3584个CUDA核,并搭载第二代RTCore和第三代TensorCore,其基础频率为1320MHz,核心Boost频率为1837MHz,比NVIDIA官方指导建议高出60MHz,拥有更出色的性能表现。同时,技嘉魔鹰GeForceRTX3060内置了由6颗三星2GBGDDR6,其显存位宽为192bit,显存带宽达到360GB/S。出色的供电能保障显卡的性能稳定,技嘉魔鹰GeForceRTX3060采用6+2相供电设计,并配备5K黑金电容、封闭式电感等元器件。那么扎实的做工以及不错的用料还会为技嘉魔鹰GeForceRTX3060带来怎样的性能发挥呢?

性能测试:可比上代高端显卡

此次测试,除了3DMark理论性能测试之外,我们主要通过数款支持光追的游戏大作,深入测试RTX3060在应对未来游戏趋势时到底能够有着怎样的表现?它的性能是否值得主流玩家期待?为此,我们除了热门游戏大作之外,还挑选了《赛博朋克2077》《德军总部:新血脉》《看门狗:军团》等数款光追游戏进行测试。在对比显卡方面,则挑选了RTX2060FE、RTX2060SUPER、RTX2070SUER和RTX3060Ti这4款产品。同时,为了减少其他硬件对显卡测试成绩的影响,我们挑选了AMD锐龙95950×处理器、DDR4360032GB双通道内存和X570主板为核心硬件。考虑到RTX3060的定位,测试分辨率则主要为1080p、2.5K、4K分辨率,同时画质我们均设置为最高(包括光线追踪等级),部分支持多种DLSS模式的游戏,我们统一挑选既不会过于影响画质,同时能适当提高游戏帧率的“平衡”模式。

3DMark理论性能测试

3DMark理论性能测试可以很好地反映新架构为RTX3060带来的性能优势,从测试成绩来看,技嘉魔鹰GeForceRTX3060的理论性能位于RTX2070SUPER和RTX2060SUPER之间,完全超越了RTX2060—与RTX2060显卡的对比时,技嘉魔鹰GeForceRTX3060的综合理论性能领先约25%。特别是在考察对显卡性能相对严苛的3DMarkFireStrikeUltra测试场景中,技嘉魔鹰GeForceRTX3060的测试成绩领先RTX2060接近23%,3DMarkDirectX光线追踪测试成绩领先RTX2060接近52%。另外,技嘉魔鹰GeForceRTX30600勺综合性能落后RTX2070SUPER约11%,领先RTX2060SUPER约7%。不过,在3DMarkDirectX光线追踪功能测试中,技嘉魔鹰GeForceRTX3060的表现比RTX2070SUPER更出色,而这便是第二代RTCore为其带来的优势。另外,基于同一架构下制作且CUDA核心数量、显存带宽明显不及RTX3060Ti的RTX3060综合表现落后前者约33%。整体而言,新架构确实为技嘉魔鹰GeForceRTX3060赋予了“越级打怪”的能力。

游戏性能实测

以往推出的3A级游戏只需自身画质制作足够精良即可,但随着光线追踪的逐渐普及,该功能也逐渐成为不少新3A级游戏的标配,同时也有不少网游逐渐加入了对它的支持,比如前段时间推出的《赛博朋克2077》《看门狗:军团》等3A级游戏以及目前比较热门的《魔兽世界》《逆水寒》等网络游戏。当趋势到来之时,我们除了需要了解游戏自身的渲染需求之外,更要清楚显卡对光线追踪的支持到底达到了怎样的高度,玩家们能否通过目前显卡完整体验到光线追踪为游戏画面带来的技术革新。

从实际表现来看,技嘉魔鹰GeForceRTX3060让人满意——它完全能够在1080p、最高画质且开启光线追踪和DLSS的情况下,流畅地运行款3A大作,《赛博朋克2077》和《看门狗:军团》的平均帧率达到53fps和59fps,《德军总部:新血脉》的平均帧率更是达到181fps之高。而当我们提高分辨率至2.5K之后,它的表现依然符合我们预期,《德军总部:新血脉》《我的世界》等部分支持光追游戏的平均帧率依然超过了60fps,那么它的性能对比其他显卡到底如何呢?

从结果来看,它的综合游戏性能仍然处于RTX2070SUPER和RTX2060SUPER之间。不过,技嘉魔鹰GeForceRTX3060与RTX2070SUPER的差距得到明显的缩小,落后约3%,领先RTX2060SUPER的成绩也成功拉开至15%。此外,显存容量的优势在此刻也得到体现,比如RTX2060SUPER在运行4K分辨率、最高画质下的《德军总部:新血脉》《看门狗:军团》时就存在显存容量不足的情况。对比RTX2060SUPER尚且如此,RTX2060更不在话下,即便是将主战场放到RTX2060擅长的1080p与2.5K分辨率,技嘉魔鹰GeForceRTX3060依然展现出碾压的态势,在1080p分辨率下的综合游戏性能RTX3060领先约38%,2.5K分辨率下的综合性能技嘉魔鹰GeForceRTX3060领先约56%。

散热性能及功耗测试

显卡性能固然重要,稳定性依然是重中之重,为此我们通过Furmark软件让技嘉魔鹰GeForceRTX3060滿载运行半个小时,在室温23℃的情况下,技嘉魔鹰GeForceRTX3060的核心温度仅为64℃,颇为清凉,由此可见风之力三风扇散热系统确实为其带来强劲的散热能力。同时,我们还通过功耗仪测得满载时的平台总功耗为330W左右,相比RTX3060Ti和RTX2070SUPER的功耗要低不少,并且仅比RTX2060SUPER和RTX2060高出15W左右。不仅如此,满载情况下的技嘉魔鹰GeForceRTX3060带来的噪音较小,我们在距离显卡正面约30cm的位置通过噪音计测得成绩约为46分贝(环境噪声约42分贝),当我们靠近它时也依然难闻其噪音,可以预见即便是在安静的夜晚使用技嘉魔鹰GeForceRTX3060,玩家们也不用担心打扰到他人。

超频性能测试

从良好的散热以及不错的内部用料来看,即便是技嘉魔鹰GeForceRTX3060已经进行了一定的预超频处理,我彳门还是认为它有着不错的超频潜力,为此我们通过AORUSENGINE对技嘉魔鹰GeForceRTX3060进行手动超频,经过多次调校之后最终将其Boost频率稳定至2000MHz,相比1837MHz的默认Boost频率高出163MHz。同时,在该频率下,我们成功完成3DMarkFireStrikeUltra场景测试,并得到5557的显卡总分,其实际性能提升效果明显,幅度高达8.2%。

主流市场新晋霸主,畅玩1080p光线追踪游戏

随着显卡性能的提升以及众多3A游戏中的逐渐普及,光线追踪也从“新鲜产物”变成了“未来趋势”,那么怎样才能在1080p环境下,既能够通过DLSS功能流畅地享受到光线追踪带来的逼真游戏体验,同时还不必花费大价钱呢?NVIDIA给出了答案,那就是光追世界下的“真甜级”产品——RTX3060。而且,通过限制RTX3060的哈希率,“挖矿”能力大打折扣的RTX3060显卡对加密货币从业者的吸弓|力有所降低,玩家们也终于有机会从市场上预约购入这款凸显平价的NVIDIAGeForceRTX30系列显卡,比如售价为3799元且用料、做工可圈可点的技嘉魔鹰GeForceRTX3060。如果你还在用GTX1060苦玩“幻灯片”游戏,此刻购入技嘉魔鹰GeForceRTX3060,即可进入光线追踪的世界,饱餐游戏盛宴。

规格参数

核心架构:NVIDIAAmpere

核心代号:GA106-300CUDA

核心数量:3584个

GPU频率:1320MHz?1837MHz

显存容量:12GBGDDR6

显存频率:15Gbps

显存位宽:192bit

供电接口:8Pin

视频输出接口:DP1.4ax2、HDMI2.1x2

参考价格3799元

猜你喜欢

光线架构频率
基于FPGA的RNN硬件加速架构
功能架构在电子电气架构开发中的应用和实践
振动与频率
“你看不见我”
LSN DCI EVPN VxLAN组网架构研究及实现
极限频率
淘气的光线
流动的光线
一种基于FPGA+ARM架构的μPMU实现
导航频率源的同步与控制