GeForce RTX 4080 16GB终于在今晚迎来解禁。本期我们就率先上手了一款采用了360冷排的RTX 4080一体水冷显卡--七彩虹iGame GeForce RTX 4080 16GB Neptune OC,如此豪华的规格无疑让它的散热能力非常让人期待。
GeForce RTX 4080 16GB显卡采用的是AD 103-300显示核心,该核心基于TSMC 4N工艺和Ada Lovelace架构核心进行制造,其芯片面积为378.6 平方毫米,晶体管密度为459亿。
其中,Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。
根据NVIDIA官方的介绍,Ada Lovelace架构核心所采用的第 3 代 RT Core 不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能提高了一倍之多。第 3 代 RT Core 还配备了全新的 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎,进一步提升了光追计算的性能以及减少计算开销,带来了更好的光线追踪效果表现。Ada Lovelace架构核心配备的第四代Tensor Core更是引入了来自专业级H100数据中心GPU的 FP8 Transformer 引擎,从而带来了更加强悍的AI算力。
▲第三代RT Core结构示意图,相比前代,增加了2个功能
Ada Lovelace架构核心在SM单元上引入了Shader Execution Reordering(SER 着色器执行重排序 )技术来更好的对于着色器的工作进行调度排序,在使用上可以根据不同的负载需求来执行渲染,可对负载较为统一的画面进行渲染,降低工作开销。
根据英伟达官方的介绍,这一个SER功能将作为API开放给开发者使用。英伟达官方宣称,SER功能的加入最 高可带来两倍RT Core性能上的改善,对于光追游戏来说更可带来体验的升级。根据NVIDIA官方的数据,全新的SM(流式单元处理器)可带来最 高两倍的性能以及能效升级,升级幅度是非常明显的。
▲Ada Lovelace架构核心 SM结构图
Ada Lovelace架构核心除了第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流多处理器)的升级以外,带来了全新的第八代NVENC双硬件编码器,这一全新的第八代NVENC双硬件编码器整合了对AV1视频编码格式的支持,可以在传统的H.264等格式之外,加入了对AV1这一主流新标准的支持,可以进行对于AV1格式的编码与解码,有效提升了生产力方面的表现,对于创作型用户、游戏主播等群体来说更是如虎添翼。来自NVIDIA官方的数据显示,第八代NVENC双硬件编码器在AV1的效率上比H.264编码器的效率提高了40%,这一提升非常明显。
除了核心上的升级以外,Ada Lovelace架构核心还大幅度提升了其L2缓存,GeForce RTX4080 16GB拥有64MB的L2缓存,大容量的L2缓存带来了数据命中率的有效提升。在现阶段显存带宽提升有效的情况下,通过升级更大容量的L2缓存,可以提升数据命中表现,带来性能方面的升级,根据NVIDIA官方的说法,大容量L2缓存的加入为GPU的一系列操作带来了更高的收益,尤其是在光线追踪等场景下,表现更为明显。
▲RTX 4080 16GB核心架构图
Ada Lovelace架构的一系列升级还带来了全新的DLSS 3技术的独占以及NVIDIA Reflex方面的体验提升。
DLSS 3包含有DLSS 2(DLSS超分辨率技术),以及全新加入的DLSS帧生成技术,这一项DLSS帧生成技术依托于Ada Lovelace架构的独立光流处理器以及Tensor Core的AI算力。在一项技术在运行过程中,其通过光流处理器所得到的一系列数据后,以光流加速技术(Optical Flow Acceleration,简称为OFA)来生成画面信息,而AI算力则负责来对画面进行进一步的优化,从而在游戏中加入了更多的帧画面,进行帧数的提升。
DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程,而通过这一个流程的循环,可在提升帧数的同时节省资源开销,进一步带来更好游戏体验。
而在DLSS 3的帧生成技术上,由于可能带来延迟的增加,因此DLSS 3在使用上也将通过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而根据NVIDIA官方的说法,DLSS 3通过整合NVIDIA Reflex以及一系列的技术,可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。
得益于更加先进的制程工艺,GeForce RTX 40系列显卡在晶体管密度与核心频率上都有着相当显着的提升。此次测试的RTX 4080 16GB的CUDA核心数已经可与上代旗舰型号RTX 3090 Ti比肩,并且公版卡就实现了高达2.5GHz的加速频率。我们此次测试的iGame GeForce RTX 4080 16GB Neptune OC更是实现一键超频至2.6GHz的加速频率。同时,它们的功耗,仍远远低于RTX 3090 Ti。
七彩虹iGame GeForce RTX 4080 16GB Neptune OC采用了颇显质感的银白合金外甲,其标志特征由上一代的圆环形的海洋之眼进化成为了双波浪曲线,并且具有RGB灯效,令其“海神”的象征性更加鲜明。
3个大尺寸风扇不仅拥有也能带来更大范围的灯光效果,结合上七彩虹iGame GeForce RTX 4080 16GB Neptune OC显卡本体上的灯光效果,可以具有超出风冷显卡上限的灯效展示区域。
得益于360冷排的散热设计,七彩虹iGame GeForce RTX 4080 16GB Neptune OC显卡本体部分可以做到仅仅只有两槽的厚度,也是这次RTX 40系高端卡中的纤薄选手了。
七彩虹iGame GeForce RTX 4080 16GB Neptune OC显卡提供四个视频输出接口,包括三个DisplayPort 1.4a和一个HDMI 2.1接口,均可实现至多4K 120Hz的视频输出,并可实现最多4屏输出,支持HDCP 2.3,HDMI 2.1接口还支持8K 60Hz HDR以及HDMI 2.1a 接口的可变刷新率功能。
上机点亮,七彩虹iGame GeForce RTX 4080 16GB Neptune OC在灯效加持下可以模拟水的流动方向,具有灵动活力感。
官网下载新版iGame Center还可以支持硬件监测、灯光同步、手动超频等丰富功能。
拆开显卡可以看到,七彩虹iGame GeForce RTX 4080 16GB Neptune OC采用了显卡的供电具体分布是22相供电给核心,4相供电给显存,远超公版规格。
显卡基于AD103-300-A1核心打造,旁边的是12颗来自美光的GDDR6X显存,每颗显存都是2GB的容量,组成24GB的总容量。PCB背面没有布置显存,主要是布置包括聚合物电容在内的各式贴片元件,以及供电控制的PWM芯片。
冷头部分有很大的纯铜底座与GPU核心接触,可以及时的传导热量,各种高发热的电子元器件位置也都布满导热贴加强导热效果,七彩虹iGame GeForce RTX 4080 16GB Neptune OC显卡具有一块金属背板,保护PCB的同时也有辅助散热的作用,背板内侧面上覆盖有大面积的绝缘层来增加电气性能的稳定性。
强大的CPU单核性能对如今高端显卡的性能释放非常重要,此次测试我们选择了13代酷睿i5-13600K平台,并将大核手动超频至5.7GHz,尽量减少CPU造成的显卡性能瓶颈。
从GPU-Z可以看到,七彩虹iGame GeForce RTX 4080 16GB Neptune OC在默认模式下的加速频率是和公版一致的2505 MHz,默认TGP也同样是320W,最大解锁至350W.
按下一键切换BIOS按钮后,显卡的加速频率达到了2640MHz,默认TGP也提升到380W,最大还能通过软件解锁到470W,这也为超频带来了很大的操作空间。后面的测试我们也将采用这一模式进行。
在3DMark基准测试当中,iGame GeForce RTX 4080 16GB Neptune OC跑分已经全面超越了前代卡皇RTX 3090 Ti,而且领先幅度甚至高达20%以上。
在DLSS基准测试中,iGame GeForce RTX 4080 16GB Neptune OC在DLSS 2模式下的4K性能提升了159%,DLSS3模式下更是提升了235%。
RTX 4080强劲的理论性能我们已经有目共睹,接下来是游戏帧数方面的测试。这里我们先分别在2K与4K分辨率下测试四款经典的游戏。
传统游戏测试
在《绝地求生:大逃杀》当中,iGame GeForce RTX 4080 16GB Neptune OC的表现如预期般超过了RTX 3090 Ti,领先幅度在15%左右。
在其它大多数的大型游戏场景中,iGame GeForce RTX 4080 16GB Neptune OC的表现也都稳稳超过了RTX 3090 Ti,领先幅度分别在15-20%。RTX 4080开启DLSS 2模式对比原生分辨率的性能提升则有30-120%不等。
仅仅除了在2K分辨率DLSS模式下测试《永劫无间》时,可能是由于帧率太高造成了CPU瓶颈,导致显卡占用不满,对比原生2K的实际帧率表现并没有提升,导致还不及RTX 3090 Ti的情况。
DLSS 3与Reflex专项测试
接下来,我们再测试几款含有NVIDIA新一代DLSS 3技术的游戏,游戏的画质都会调至全高,看看这些游戏分别在原生画面、DLSS 2超分辨率、DLSS 3帧生成之下,性能与延迟的差别。
首先我们看看Reflex低延迟功能究竟有多大的作用,在《守望先锋 归来》当中g开启Reflex功能的延迟低了一半以上,而且对帧率几乎没有影响。这一功能可以很好地减轻DLSS 3补帧功能增加的延迟,所以开启DLSS 3也会同步开启Reflex。对于延迟追求更高的玩家来说,使用Reflex+Boost还可以有进一步增强,不过效果就没有那么明显了,而且还会造成小幅的帧率损失。
在基于Unity的《Enemies》DLSS 3测试Demo里面,RTX 4080原生4K下只能跑到22帧,这种极低帧的模式下帧生成时间是很长的,所以延迟来到了192ms。而在打开DLSS 3后,帧率达到3倍以上,延迟也降到了56ms。
同样的情况也出现在《赛博朋克:2077》当中,原生4K下30帧的平均帧带来了117ms的画面延迟,画面卡顿、操作迟滞。而在开启DLSS 3后帧率提升到了95帧,延迟49ms,甚至还比DLSS 2不开Reflex状态要更低。
类似的,在《幻塔》测试版中,由于这款游戏没有单独开启Reflex的选项,所以DLSS 3模式的延迟也要比DLSS 2下面更低。
赛博题材的横版3D游戏《生死轮回》里面,DLSS 3在实现原生分辨率近3倍性能的同时,延迟控制在了仅仅32ms。
在《瘟疫传说:安魂曲》里面,DLSS 3同样带来了较原生分辨率不止翻倍的提升,延迟的增加也不明显。
《暗影火炬城》里面,RTX 4080在DLSS 3模式的平均帧和DLSS 2模式差不多,应该是碰到帧率上限了,但前者在1%低帧的表现上有了比较明显的提升。
在《毁灭全人类》里面,开启DLSS 3的RTX 4080也有着比原生画质翻倍的性能,以及更低的延迟。
画质方面,使用OBS分别对DLSS和原生画质进行高码率录制。从下图对比可以看到,开启DLSS模式的画质(下图左半部分),甚至比原生分辨率(下图右半部分)的纹理细节更加清晰。
据了解,截止11月15日GeForce RTX 4080发布时,将已有10款DLSS 3游戏发布。如《瘟疫传说:安魂曲》、《光明记忆:无限》、《毁灭全人类2:重新探测》、《暗影火炬城》、《逆水寒》、《生死轮回》、《漫威蜘蛛侠:重制版》、《微软模拟飞行》、《超级人类》。WRC Generations, 《极 品飞车:不羁》和 《战锤40K:暗潮》三款支持DLSS 3的游戏也将在RTX 4080推出后不久发布,圣诞节前玩家就可畅玩这些DLSS 3游戏。
除了游戏以外,如今从游戏主播、内容创作者,到视频编辑、3D 建模和渲染等生产力工作,也没有一样离得开 GPU 的性能支持。
在渲染能力方面,我们先围绕 Blender Benchmark 进行,在 Moster、Junkshop、Classroom 按个场景中,iGame GeForce RTX 4080 16GB Neptune OC相对 GeForce RTX 3090 Ti 至多提升了 52% 的性能。
同样 V-Ray 5 Benchmark 中,会同时考验到 GPU CUDA 性能和光线追踪性能表现,能够看到iGame GeForce RTX 4080 16GB Neptune OC相对 GeForce RTX 3090 Ti的RTX渲染效率效率提升了38%。
在SPECviewperf 2020集成的8款工业软件测试中,iGame GeForce RTX 4080 16GB Neptune OC相比RTX 3090 Ti也是全面领先。
Octane Render RTX 经常被用作于场景建模,特别是开启光线追踪之后,对实时预览性能以及渲染输出都有着极高的要求,与 GPU 以及 GPU 的 RTX 性能直接挂钩。在这一项目中,iGame GeForce RTX 4080 16GB Neptune OC相对 GeForce RTX 3090 Ti 性能提升 30% 以上。
视频内容创作方面,在使用达芬奇渲染同一段4K H.265视频的任务中,iGame GeForce RTX 4080 16GB Neptune OC也比RTX 3090 Ti快了20%以上。
同时,GeForce RTX 40系列显卡还首次加入了 AV1 双编码器。AV1 编码是由英特尔、微软、亚马逊、谷歌、网飞等网络巨头组成的开放多媒体联盟 AOMedia 所推出的免费编码格式,在国内已经获得了哔哩哔哩、爱奇艺支持。它的特点是能在相同文件体积下拥有更高清的画质,或者相同清晰度的画质下拥有更小的体积。
下图是AV1(左)和AVC(右)的画质对比。
GeForce RTX 40系列显卡是目前市面上较少可以支持硬件AV1渲染加速的GPU,实测渲染导出同一段AV1视频,其效率对比纯CPU软件编码效率高了4倍左右。
与此同时,对游戏主播而言,GeForce RTX系列显卡支持的Broadcast工具还可以一键实现人像跟踪、视频去噪、噪音和回声消除、消除/虚化背景等实用功能。
使用Furmark对iGame GeForce RTX 4080 16GB Neptune OC进行10分钟满载压力测试。功耗稳定在380W左右,此时核心温度仅低至56.8°C,表现相当冷静。
这么强悍的散热表现,再结合前文提到的,这款显卡在高性能BIOS中还可以一键解锁470W的TGP,不得不让人想要手动超频试试了。
笔者很轻松地将显卡的核心加速频率拉到了3GHz,显存物理频率从1400MHz拉到1600MHz,此时3D Mark TSE跑分超过了1.5万分,相比公版频率的1.37万分提升幅度约10%
在《赛博朋克:2077》4K DLSS 2光追超级画质下,平均帧率也从64帧提升到69帧,游戏中低于60帧的情况更少了,效果还是挺明显的。
超频后运行游戏的实际功耗也仅仅不到350W而已,就轻松实现了远超RTX 3090 Ti显卡450W功耗下的性能,可见RTX 4080 16GB的能效比相当出色。
更重要的是,在这样一番幅度不小的超频过后,iGame GeForce RTX 4080 16GB Neptune OC还能以99%的稳定度通过3DMark TSE的20轮压力测试,可见这张显卡的散热对于超频玩家都是绰绰有余啊。
不过需要注意的是,我们观察到超频后的烤机功耗已经来到了450W左右,所以对于超频玩家而言,保险起见还是建议要在官方指导的750W电源标准上再加一些,选配不低于850W的电源。
RTX 4080 16GB显卡再次展现了RTX 40系强大的能效表现,它仅以300W左右的功耗就实现了超越上代旗舰450W功耗下的性能,必定成为4K级发烧玩家的新宠。而作为首批旗舰非公型号,iGame GeForce RTX 4080 16GB Neptune OC这款显卡颜值出众,它强大的散热表现和超频能力也令人印象颇为深刻。
测试过程中我们也进一步看到,如今高端卡的一个显着特征就是好卡也要配好U,否则显卡表现很容易受处理器单核性能不足的桎梏。但高性能的CPU同样会作为机箱内不可忽视的发热大户,这种情况下风冷显卡还总免不了让CPU“吃尾气”,为了更高的散热效率,又不得不迫使玩家加装更多的风扇,导致整机噪音增加。所以对于预算充裕的玩家而言,无论如何折腾机箱的风道组建,可能都不如来上这么一款高端的水冷非公体验好。
据悉11月16日晚10点,七彩虹将在京东、天猫、抖音、快手等电商平台及线下授权零售经销渠道正式以现货发售或预售的形式同时上架多款iGame、战斧GeForce RTX 4080显卡,包含 iGame GeForce RTX 4080 16GB Vulcan OC、 iGame GeForce RTX 4080 16GB Neptune OC、 iGame GeForce RTX 4080 16GB Advanced OC、iGame GeForce RTX 4080 16GB Ultra OC及战斧GeForce RTX 4080 16GB 豪华版,感兴趣的话可以去了解一下。
作者:陈沐梁
延伸阅读: