在历经GeForce RTX 4070 SUPER、GeForce RTX 4070 Ti SUPER首发评测之后,SUPER的性价比愈发坐实,就差一款旗舰级定位的SUPER来给NVIDIA这次GeForce RTX GPU SUPER更新画上句号,而这个重任落在了GeForce RTX 4080 SUPER身上。

打开网易新闻 查看精彩图片

从定位和参数上看,GeForce RTX 4080 SUPER就已经相当能打,不仅比GeForce RTX 4080最初定价还便宜了200美元,官方8099元的起售价更为亲民,在性能上也一步到位,摸到了AD103的天花板。是的,GeForce RTX 4080 SUPER如果再向前提升一点点,就真的可以归入RTX 4090系列了。

打开网易新闻 查看精彩图片

玩笑归玩笑,GeForce RTX 4080 SUPER展现出的性价比再次让我们感受到了NVIDIA对SUPER系列升级下足了本钱,这也意味着这块GPU在生成式AI、DLSS和光线追踪游戏、内容创作上有更强劲的战斗力。

那么事实是否真的如此?现在就让我们奉上NVIDIA GeForce RTX 4080 SUPER Founders Edition首发评测。

打开网易新闻 查看精彩图片

AD103的终极进化

GeForce RTX 4080 SUPER最让人印象深刻的就是这块代号AD103-400-A1核心。我们知道AD103保留了所有AD102的主要功能,并使用源自于台积电4N定制工艺的Ada Lovelace架构,拥有459亿个晶体管,核心面积379mm²。

在Ada Lovelace架构中,GPU中包含了若干个GPC(Graphics Processing Clusters,图形处理集群),GPC下包含若干个TPC(Texture Processing Clusters,纹理处理簇),若干个流式多处理器(Streaming Multiprocessors,SM),再往下就是CUDA、RT Core、Tensor Core等等。每个GPC之间包含的TPC数量相等,当GPU进行定位区分的时候再进行GPC、TPC的物理屏蔽实现。

打开网易新闻 查看精彩图片

完整的AD103包含7个GPC,但每个GPC包含的TPC并不相同。如下图所示,在6个GPC各拥有6组TPC的同时,还有1个GPC仅有4组TPC。比如,在RTX 40系列发布时,GeForce RTX 4080是通过屏蔽1组TPC实现的。

有意思的地方来了,同样采用AD103的GeForce RTX 4080 SUPER显然不会再做任何核心配置上的让步,光从核心代号AD103-400-A1就知道这块GPU并不简单。是的,GeForce RTX 4080 SUPER即是完整的AD103,包含10,240个CUDA核心、80个RT Core、320个Tensor Core、320个纹理单元和112个ROPs。在内存子系统上则总共包含10,240KB L1缓存,20,480KB寄存器堆,以及65,536KB的L2缓存。

打开网易新闻 查看精彩图片

不过需要注意,相对专业级GPU的3个第八代NVENC和3个第五代NVDEC配置, GeForce RTX 4080 SUPER编码器配置为2个第八代NVENC和1个第五代NVDEC,以此做出区分,这是消费级GPU常规操作,对游戏性能和AI加速性能影响不大。

打开网易新闻 查看精彩图片

不仅如此, GeForce RTX 4080 SUPER的Boost频率也来到了2.55GHz,搭配256-bit的16GB GDDR6X,显存带宽来到736GB/s,TGP则仍然和RTX 4080持平,为320W。值得一提的还有不做删减的64MB L2缓存,这比GeForce RTX 3080的5MB L2缓存提升了12.8倍,这让游戏中的这让光线追踪,尤其是路径追踪从中获得巨大收益。所搭配的第三代RT Core、第四代Tensor Core,更是能更好的发挥出L2缓存的效果。

打开网易新闻 查看精彩图片

至此,CES2024上发布的三款GeForce RTX SUPER发布完毕,这里不妨让我们用RTX 4080做对比,大致规格对比如下。

打开网易新闻 查看精彩图片

黑色装甲参上

SUPER版本的Founders Edition最大的不同是用作加固的黑色中框变成了深黑色,一下子显得高级了很多。不过在整体设计思路上变化不大,主要依靠错位风扇搭配异形PCB的对称设计,以此改善GPU的散热情况。

打开网易新闻 查看精彩图片

在材质选择上,GeForce RTX 4080 SUPER Founders Edition讲究一体成型,散热鳍片由99%铝合金打造,结合重量轻、刚性可靠、导热性好的特点。同时散热鳍片再度加厚,变成了三槽位设计,边框末端的支架孔被隐藏在磁吸的挡板下,仅凭指甲就能撬开,而复原的时候只需要将贴片放回,磁力便会自动吸附。

打开网易新闻 查看精彩图片

在风扇选择上,GeForce RTX 40系列Founders Edition基本将扇叶直径提升到116mm,在全速运作的时候,每分钟产生的气流足以充满3.5个篮球。并且风扇叶片由增强型玻璃纤维组成,具有弹性,搭配动态轴承可以获得更好的静谧性。

打开网易新闻 查看精彩图片

风扇下面则是使用了6热管搭配散热鳍片的设计,供电则继续使用了最新的16pin(12VHPWR)接口,机包装配送了3x8pin转接线,TGP是320W。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

在实际游戏测试中,GeForce RTX 4080 SUPER Founders Edition表现出的效能特别高,4K游戏环境中,功耗普遍都被控制在了250W以下。

打开网易新闻 查看精彩图片

接口设计则包括了3个DisplayPort 1.4a和1个HDMI 2.1接口。

打开网易新闻 查看精彩图片

在压力测试中,GeForce RTX 4080 SUPER Founders Edition的GPU温度和表面温度都不高。比如GPU温度仅在58℃,红外线检测可以看到整个外壳都处在相当清凉的状态。

打开网易新闻 查看精彩图片

开启SUPER战斗力

现在让我们进入测试环节,测试平台包括了Core i9-14900K、ROG MAXIMUS Z790 DARK HERO、G.SKILL Trident Z5 DDR5-7200 16GBx2,并配以1250W电源作为支持。

打开网易新闻 查看精彩图片

在基础性能测试中,主要参考检测DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal。可以看到GeForce RTX 4080 SUPER比RTX 4070 Ti SUPER提升有20%左右,而如果对比上一代的RTX 3080,提升幅度最高70%。

打开网易新闻 查看精彩图片

因此如果使用DLSS 2及以前的常规游戏,GeForce RTX 4080 SUPER在4K最高画质下,相对RTX 3080 Ti提升幅度起步45%,最高可达80%。而用GeForce RTX 4080 SUPER对比GeForce RTX 2080 SUPER,提升就相当夸张了,可以从150%到250%。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

GeForce RTX 40系列带来的DLSS 3和DLSS 3.5技术才是重头戏,由于第四代Tensor Core性能提升幅度巨大,并辅以光流加速器(Optical Flow Acceleration,OFA)与DLSS相结合的办法,构建出了一个更为立体的分析方式,让GPU实际执行过程压缩到原本的 1/8。

DLSS 3.5则是一套基于AI的算法,让画质和帧率同时提升的解决方案,同时包含DLSS帧生成(FG)与光线重建(RR, Ray Reconstruction)技术搭配,再加上超分辨率(Super Resolution)、DLAA、帧生成(Frame Generation)多种技术融合。

打开网易新闻 查看精彩图片

如果用RTX 3090作为比较就会发现,即便是拥有24GB显存加持,RTX 3090无论4K还是8K分辨率,在画面流畅度上都弱于GeForce RTX 4080 SUPER。

打开网易新闻 查看精彩图片

而在DLSS 3以后版本的游戏中,GeForce RTX 4080 SUPER的战斗力就体现出来了。这里我们直接开启4K最高画质,开启光线追踪或者路径追踪。可以看到,GeForce RTX 4080 SUPER对比RTX 3080 Ti提升幅度最高可以从60%到200%以上,而对比RTX 2080 SUPER,最高超过800%,当然是因为GPU无法推动导致的,而从普遍的结果而言,GeForce RTX 4080 SUPER相对RTX 2080 SUPER提升300%上下不成问题。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

甚至DLSS 3与Reflex的融合,也让GeForce RTX 4080 SUPER在竞技类游戏中有更惊人的表现。特别是在1080p分辨率下,《无畏契约》《反恐精英2》等游戏都获得了300FPS以上帧率,并通过Reflex将系统延迟降低到了10ms以下。

打开网易新闻 查看精彩图片

这里我们用开启DLSS 3.5的《赛博朋克2077》进行画质对比,可以看到在DLSS 3.5光线重建加持下湿漉的倒影变得清晰自然,同时物体边缘在暗影中仍然会提现出光反射效果,重点这是在获得更高帧率前提下实现的。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

AI与创作都很能打

接下来是AI测试环节。GeForce RTX 4080 SUPER搭配16GB GDDR6X对生成式AI而言提供了巨大的进步。这里我们不妨以Stable Diffusion XL作为参考,Stable Diffusion XL本身运行需要依靠Transformer变换器和卷积神经网络实现,这两者均需要GPU进行大规模并行计算,这无疑是NVIDIA最擅长的事情。也正因为如此,近几年AI的飞速发展,很大程度上就是NVIDIA GPU技术发展所推进的。

打开网易新闻 查看精彩图片

这里选择的Stable Diffusion XL在模型体量上相当Stable Diffusion 1.5扩大了3倍,从而导致计算的数据量提升,但也带来了更好的画质。这里以Stable Diffusion Web UI + TensorRT进行配置,用更短的语言描述生成10张分辨率为768x768的星际航行图片,每次运算1张图片,即总共执行10次,采样步数设置为50。

文字描述部分为:epic space battle over a water planet, many ships, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting。通过记录时间,推算出每分钟推算图片效率,参考公式为60 / (TotalTime / (BatchSize * BatchCount)) = Images Per Minute。

GeForce RTX 4080 SUPER轻松超过近期参与评测的一众GPU,哪怕是对比同显存的RTX 4070 Ti SUPER,也有超过25%的性能提升,提升幅度相当明显。这意味着利用GeForce RTX 4080 SUPER就已经可以很好的进行本地AI部署,无论是现在的文生图加速、图生图,乃至视频生成,或者大语言模型加速,GeForce RTX 4080 SUPER都已经提供了相当充实的算力基础。

打开网易新闻 查看精彩图片

与此同时,国产软件D5渲染器还对DLSS 3.5 AI加速提供了支持。由于DLSS 3.5使用了比DLSS 3多5倍的数据训练,因此也可以更好的识别光线追踪效果,在时间、空间数据中做出更合理的判断,从而实现高效率的扩展。

实际测试的Minimalist Villa 1场景中,GeForce RTX 4080 SUPER一下子让D5渲染器的运行程度变得极为流畅,轻松超过了60FPS的流畅度,就算相比一周前的RTX 4070 Ti SUPER也提升了35%以上。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

不仅如此,DLSS 3.5的加入还让场景发生了质变。当DLSS 3.5关闭后,地面的反光变得非常粗糙,左侧的玻璃也丧失了折射效果与通透性,同时帧率也降低到了不到原来的一半。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

最后一项AI测试,则是利用ON1 Resize AI 2022对图片分辨率进行提升。可以看到GeForce RTX 4080 SUPER用最短的时间完成了照片的分辨率提升,相对RTX 3080节省了一半的时间。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

海量的CUDA Core和RT Core同样也是GeForce RTX 4080 SUPER的强项。在V-Ray 5 Benchmark中,会分别对CUDA Core和RTX进行检测,借助更多的CUDA Core数量,GeForce RTX 4080 SUPER无论CUDA性能还是光线追踪都有很强劲的表现,相对RTX 3080提升60%。

打开网易新闻 查看精彩图片

另外一个Octane Render RTX则是用来测试GPU的光线追踪性能表现,在复杂场景下考验GPU每秒产生的样本率,提升幅度很高,GeForce RTX 4080 SUPER比RTX 3080提升了50%。

打开网易新闻 查看精彩图片

另外Blender Benchmark引入的Moster、Junkshop、Classroom三个参考场景,GeForce RTX 4080 SUPER相对RTX 3080提升最高超过80%。

打开网易新闻 查看精彩图片

在专业软件创作环节,我们引用了SPECviewperf 2020作为参考,这是一款专门考验OpenGL和Direct X API下运行的系统的3D图形性能,软件包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。GeForce RTX 4080 SUPER能够做到相对RTX 3080在专业应用领域,从50%到将近90%的帧率提升。

打开网易新闻 查看精彩图片

写在最后:定义SUPER天花板

GeForce RTX 4080 SUPER厉害的地方在于,用相对RTX 4080更便宜定价策略就达成了当前SUPER天花板的成就,满配的AD103 GPU没有让人失望,在相对RTX 4080功耗没有提升的状态下,战斗力表现惊人,在4K分辨率下DLSS 3游戏的表现。

事实上,GeForce RTX 4080 SUPER已经是一款可以特效拉满,在4K分辨率下流畅运行所有大作的GPU,你要做的就是进入游戏,由游戏的检测系统自动调整最高配置,或者手动将画质滑块拉到头,体验上玩游戏从不看画质设置的人生巅峰,这时候8099元的定价就会显得特别划算。

打开网易新闻 查看精彩图片

在游戏之外,GeForce RTX 4080 SUPER也展现出了自己全能的地位,无论用Stable Diffusion XL加速生成式AI,用DLSS 3.5加速D5渲染器,或者海量的CUDA Core加速3dsmax、CATIA等专业软件,或者换上NVIDIA Studio驱动,接入NVIDIA Omniverse的元宇宙。

GeForce RTX 4080 SUPER所加持的PC可以轻易变成全能型选手,就算你是专业的艺术创作、设计、游戏开发人员,也可以从这块GPU或者专业应用加速的畅快感。特别是GeForce RTX 4080 SUPER与16GB GDDR6X大显存配合下的卓越AI表现,可以让用户不再给在线的AI服务付费,依靠GeForce RTX 4080 SUPER的本地AI性能,轻松实现文生图、视频生成、大语言模型加速,为即将到来的本地化AI时代提供充分的算力基础。

而这款代表着当下SUPER系列最高天花板的产品,也很好的诠释了性价比。如果你想获得充足的AI性能,并以4K最高画质流畅运行3A大作,还想轻松应对视频、图像或是专业软件工作,那么GeForce RTX 4080 SUPER就是现在最合适的那一款GPU。

打开网易新闻 查看精彩图片