随着电竞显示器价格的不断下探,我们开始有机会以更合理的价格买到高分辨率高刷新的型号。特别是27英寸2KHz左右的电竞显示器售价刷到了千元出头,配主流新机时有充足的理由成为首选。这时候压力就来到了GPU这边,能否有一款在p和2K分辨率下满足最高画质、高刷新的显卡,眼前的iGameGeForceRTXTiAdvancedOC给出了一个不错的答案。
作为GeForceRTX40系列首发阵营的第三块GPU,GeForceRTXTi曾被赋予GeForceRTXGB的称号,而在iGameAdvanced全新武装下,性能也得到进一步释放。那么问题来了,iGameGeForceRTXTiAdvancedOC能否帮我们解决2K分辨率最高画质运行3A大作的需求?在性能解禁之际,让我们奉上iGameGeForceRTXTiAdvancedOC首发评测。
AD的首次登场
在AdaLovelace架构GPU的命名中,NVIDIA首次在GeForceRTX上使用了AD单数的命名规则,以至于iGameRTXTiAdvanced一步到位承接了AD的称号,核心型号为AD--A1,同时也成为AD的首次登场。
重点就在一步到位。iGameRTXTiAdvanced与GeForceRTX一样,仅在不影响游戏表现的NVENC和NVDNC编解码器上略微缩减,其余元素完全保留,与完整的AD看齐。
在结构上,AdaLovelace架构GPU中包含了若干个GPC(GraphicsProcessingClusters,图形处理集群),GPC下包含若干个TPC(TextureProcessingClusters,纹理处理簇),再往下就是SM、CUDA、RTCore、TensorCore等等。而完整的AD包含5个GPC,每个GPC包含6组TPC,每组TPC包含2个流式多处理器(StreamingMultiprocessors,SM)。
流式多处理器SM中,包括了近几年大热的深度学习超采样DLSS加速TensorCore,用于实时光线追踪特效加速的RTCore等诸多处理模块,并延续了从Maxwell架构开始引入的处理块(Sub-Core)理念,在每个SM下面包含了4个处理快单元。
如果再往下探究,每个处理块包含1个64KB寄存器堆,1个L0指令缓存,1个Warp调度器,1个调度单元,4个加载/存储单元,1个特殊功能单元(SpecialFunctionUnit,SFU)用于执行超越函数指令(比如正弦、余弦、倒数、平方根等)和图形差值算法指令。每个SM下的个CUDACore随处理快分成4组,每组CUDA由16个专门用于FP32的CUDACore,16个可以在FP32和INT32之间切换的CUDACore组成。
由于iGameRTXTiAdvanced使用了近乎完整的AD核心,即5个GPC、30个TPC、60个SM,以及6个32-bit内存控制器组成的-bit内存接口,整个芯片包含亿个晶体管,DieSize为mm2。
因此iGameRTXTiAdvanced使拥有个CUDACore,60个第三代RTCore,个TensorCore,个纹理单元和80个ROPs。同时还包含7,KB一级缓存,15,KB寄存器堆,以及49,KB二级缓存,并搭配-bit12GBGDDR6X。可以看到iGameRTXTiAdvanced的二级缓存是上一代对标型号GeForceRTXTi的12倍以上,是RTX的8倍,为后续的第三代RTCore性能发挥奠定了重要基础。
全新武装的iGameAdvanced
与RTX30系列的Advanced系列的棱角分明不同,iGameRTXTiAdvanced多了几分金属光泽的圆润感,在设计风格上更为讨喜。按照iGame的说法,iGameRTXTiAdvanced用银灰色金属外装甲构造出的宇宙陨铁设计作为基础,并引入引力之环作为外观视觉停留要素,在确保散热的同时,也暗示iGameRTXTiAdvanced的性能不俗。
引力之环在很大程度上继承了iGameAdvanced系列经典的红圈设计,使用了一套双RGB灯组构建力量核心寓意,同时也给iGameCenter灯光调节留下了更多玩法。
值得多说一句,从GeForceRTX40系列开始,iGameCenterUI进行了全面升级,界面不仅酷炫,也更浅显易懂。比如在硬件调控中能够对引力之环的闪烁模式、速度、亮度、色彩进行进一步的调节,同时超频控制也融入到了第二页中,搭配风扇散热、功耗、频率进行进一步的调节。
不仅如此,iGameCenter本身还提供了丰富的性能监控小窗口,可以在任意画面下置顶性能监控,跟踪GPU在游戏中的实际表现。
当然也少不了iGame玩家俱乐部的成就系统,以及用来预判游戏在不同分辨率下能否流畅运行的游戏领域。不过目前游戏领域的游戏库数据还在更新状态,随着后续不断升级iGameCenter的玩法注定愈发丰富。
让我们回到显卡本身。与正面引力之环和宇宙陨铁设计遥相呼应的是颇为文艺的散热金属背板,在增大iGameRTXTiAdvanced散热面积的同时,也使用了与正面相同的色调,以强调前后设计的统一性。
不仅如此,显卡后侧的镂空设计也与正面的引力之环遥相呼应,并增加了带着图腾象征的雕花纹理,配合着金属色泽,格调一下子就上来了。
为了加强iGameRTXTiAdvanced散热性能,显卡使用了一套双环形mm+96mm九翼扇叶,也就是左右两侧风扇直径为mm,中间风扇为96mm,每个风扇均使用了双滚珠轴承,配合iGameRTXTiAdvanced性能闲置时智能启停技术,能让风扇运行寿命进一步拉长。
风扇之下则是更大面积的散热鳍片模组,iGameRTXTiAdvanced不仅使用了更大的鳍片增加效率,还使用了6根8mm的热管提升热量流动效率,并以回流焊工艺使热管与鳍片严丝合缝。
与GPU接触部分则使用了真空冰片技术,通过密闭的腔体内注入冷凝液,通过相变原理在GPU发热之后更快的将热量分发给热管与鳍片,获得更好的散热效果,这样的设计基本上也已经成为iGame显卡的标配。
同时我们也能看到iGameRTXTiAdvanced身材相比GeForceRTX40首发的前两位同门在身材上更紧凑了一些,会占用主板大约2.5个槽位。为了支撑显卡本身庞大的散热模组,iGameRTXTiAdvanced也为模组本身增加了一套全铝中框作为固定,以增加显卡本身的可靠性。
iGameRTXTiAdvanced输出面板接口则与公版看齐,包括3个DisplayPort1.4a接口和1个HDMI2.1接口。同时在输出接口面板上增加一个物理超频按钮也已经是iGame系列的标配。并且这一次超频按钮同样使用了金属设计,并在面板上增加超频示意图,无论是质感还是细节也更为到位。
GeForceRTXTi在NVIDIA设计中默认Boost频率为MHz,在一件超频加持之后,iGameRTXTiAdvanced可以达到MHz。而在我们进行实际超频测试过程中,iGameRTXTiAdvanced最高可以达到MHz左右。
与此同时GPU核心温度在压力测试下为66℃左右,红外线压力测试图表现如下。
这里值得说明TGP功耗反应的是GPU运行功耗上限,也就是功耗墙。实际上GPUBoost表现是由功耗、散热情况、负载等多重因素决定,即使GPUBoost到最大频率也未必接近TGP值。事实上无论是GeForceRTX还是GeForceRTX运行4K分辨率画面时能耗也低于TGP值,2K和P分辨率更是如此。
因此在测试过程中,我们分别对iGameRTXTiAdvanced的p、2K分辨率最高画质的功耗进行比较,涉及游戏包括主流游戏、压力测试DEMO。可以看到iGameRTXTiAdvanced的最高功率接近W,符合iGame官方给出W/WTDP功耗建议,建议在配置新机的时候尽可能选择W以上的整机电源进行支撑。
iGameRTXTiAdvanced的电源接口同样为新版的16pin接口,随机搭配了2个8pin转16pin的电源转换线,当然你也可以使用ATX3.0电源专门为新GPU准备的16pin电源线。
顺带一提iGameRTXTiAdvanced包装中搭配的附件也相当丰富,包括可换刀头的吸附式螺丝刀,质感不错的显卡支架,配件排开,气势拉满。
实践出真知
现在进入喜闻乐见的跑分环节。如果对RTX40系列略有了解的同学,会发现新一代GPU性能提升除了归功于新制程、更大的缓存设计之外,还将最重要的RTCore和TensorCore分别升级到了第三代和第四代。
其中第三代RTCore在第二代RTCore的基础上,再次将射线/三角形求交测试吞吐量。意味着射线/三角形求交测试模块由原来的2个再次增加到4个,相对Turing架构的1个射线/三角形求交测试模块翻了4倍,并额外增加了下图左下角的透明度微图引擎(OpacityMicro-Map,OMM)和右下角的位移式微型网面引擎(DisplacedMicro-Mesh,DMM)。
同时第三代RTCore还引入了着色器执行重排序(ShaderExecutionReordering,SER)技术,通过与游戏设计团队配合,更有效的分配次级射线的排序权重,从而获得更高效的线程排序执行,避免光追运算陷入无意义的次级射线运算深渊。
第四代TensorCore在效率提升的同时,更进一步与DLSS3、光流加速器强绑定,避免了CPU性能跟不上GPU所导致帧率的损失,同时还原生支持Reflex技术避免AI生成的帧率影响系统响应速度。
在测试之前,照例先搬出我们的测试平台,这里使用了英特尔Corei9-K,七彩虹ColorfulCNVDDR5-GBx2,CVNZD5GAMINGFROZENV20主板,W电源作为基准,确保iGameRTXTiAdvanced性能可以进一步释放。
在基础测试中,我们先引入DirectX11和DirectX12的3DMarkTimeSpy,3DMarkTimeSpyExtreme,3DMarkFireStrikeExtreme,3DMarkFireStrikeUltra,PortRoyal和VRMarkBlueRoom进行检测。
可以看到常规测试中GeForceRTXTi相对GeForceRTX提升有12%左右提升,相对RTXTi提升平均提升幅度更是超过50%。
这里我们也搬出了几个喜闻乐见的3A游戏进行对比,这里主要使用4K分辨率光追最高画质,以及《地铁:离乡》的p最高画质作为参考。能够看到GeForceRTXTi相对GeForceRTX提升在10%左右,相对GeForceRTXTi提升将近%。
畅游2K分辨率
事实上,iGameRTXTiAdvanced真正发力的地方在2K最高画质的3A级游戏中。第四代TensorCore性能提升幅度巨大,包括的FP16、BF16、TF32、INT8、INT4性能相对前一代提升两倍以上,并支持商业HopperGPU架构中出现的FP8TransformerEngine。更重要的是,iGameRTXTiAdvanced所采用的DLSS3技术已经从DLSS2.X独立的技术,升级到了一套高效的游戏运行方案。
NVIDIA在DLSS3中找到了一套将光流加速器(OpticalFlowAcceleration,OFA)与DLSS相结合的办法,构建出了一个更为立体的分析方式,将卷积自编码器的输入源扩展到几个部分,分别是:之前帧与当下帧,由光流加速器生成的光流场、游戏运动矢量和深度等数据。这时候DLSS3甚至承担起渲染过程中7/8的工作,让CPU和GPU进完成其中1/8的渲染即可,从而节省出大量的计算资源专注到更有用的地方。
这意味着游戏一旦支持DLSS3,那么效率将是成倍的提升。但也需要注意,DLSS3运行的前提是GeForceRTX40的第四代TensorCore,第三代以及第三代以前TensorCore仅能支持到DLSS2.X,即实现DLSS3的部分功能,帧率提升虽然也很明显,但幅度没有DLSS3来得更为夸张。
这里我们引入3DMarkDLSS22K、3DMarkDLSS34K、3DMarkDLSS38K进行对比,可以看到iGameRTXTiAdvanced相对RTX提升了50%到70%,特别是RTXTi在8K分辨率触及60FPS的水准,相对GeForceRTXTi提升了将近%。
最后让我们进入2K分辨率游戏测试环节,在iGameRTXTiAdvanced与RTXTi的较量中,能够看到DLSS3一旦开启,平均性能在50%到80%的提升,部分场景更是直接从不能玩到了流畅运行的级别,比如《传送门》RTX版提升了%。
再来对比RTX,在DLSS开启后,iGameRTXTiAdvanced相对RTX平均提升也超过了30%,这同样也意味着RTXTi在2K游戏中的实际表现同样也优于RTXTi。
完成创意闭环
解决了游戏问题,最后轮到愈发热门的内容创意环节。得益于NVIDIAStudio在软硬件上的结合,对于大多数消费者、内容创作爱好者、UP主无需购买专业显卡,仅依靠GeForceRTX就能完成所有工作内容,iGameRTXTiAdvanced的12GBGDDR6X也正好符合了NVIDIA启用AV1双编解码器的策略。
AV1编码是由英特尔、微软、亚马逊、谷歌、网飞等网络巨头组成的开放多媒体联盟AOMedia所推出的免费编码格式,在国内已经获得了哔哩哔哩、爱奇艺支持。即在相同文件体积下拥有更高清的画质,或者相同清晰度的画质下拥有更小的体积,因此它现阶段可以进行p串流视频的带宽,实现p甚至更好的画质,比如同样的带宽占用下,在哔哩哔哩可以轻松播放2K或者4K的视频,而播放4K的带宽也将可以用来播放更高分辨率的内容。
在好莱坞拥有统治地位的DaVinciResolve18是率先支持AV1编解码专业软件之一,因此也提供了对iGameRTXTiAdvanced的编解码支持。基本上,我们在电影院线看到的大成本特效制作、剪辑、调色有很多都来自于DaVinciResolve。
由于动则4K、8K视频后期调色将会耗费大量的系统计算资源和时间,利用AV1加速编码自然成为必选项,这里我们分别对一段4KProRes和8KProRes视频进行编码输出,可以看到无论是4KProRes到4KH.的输出,iGameRTXTiAdvanced相对GeForceRTXTi提升了一倍以上。而8KProRes到8KH.的输出,也节省了将近1/3的时间。
这里我们也利用ON1ResizeAI考验GPU的AI性能,通过低分辨率图片无损提升至高分辨率图片进行测试,可以看到iGameRTXTiAdvanced相对GeForceRTXTi效率提升将近40%。
SPECviewperf则是通过建模对象或渲染体的旋转和缩放检视,来检测在各种专业设计领域(包含能源勘探、医学、建筑设计、机械设计、汽车设计、飞机设计等各种领域)的图形性能,这里包含了我们从大学专业软件课开始就接触的3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks等主流软件。iGameRTXTiAdvanced在部分场景中与GeForceRTXTi持平,部分场景则提升了21%的性能,相对GeForceRTXTi更是提升40%到%。
而在ProcyonPhotoshopEditing的测试中,也可以看到iGameRTXTiAdvanced比RTX提升9%左右,相比RTXTi提升13%。
如果前阵子有