GeForce RTX 4080 SUPER评测：性价比的超级进化，游戏与AI很能打|ai|cuda|geforce|gpu|nvidia|rtx|性价比|高分辨率

在历经GeForce RTX 4070 SUPER、GeForce RTX 4070 Ti SUPER首发评测之后，SUPER的性价比愈发坐实，就差一款旗舰级定位的SUPER来给NVIDIA这次GeForce RTX GPU SUPER更新画上句号，而这个重任落在了GeForce RTX 4080 SUPER身上。

从定位和参数上看，GeForce RTX 4080 SUPER就已经相当能打，不仅比GeForce RTX 4080最初定价还便宜了200美元，官方8099元的起售价更为亲民，在性能上也一步到位，摸到了AD103的天花板。是的，GeForce RTX 4080 SUPER如果再向前提升一点点，就真的可以归入RTX 4090系列了。

玩笑归玩笑，GeForce RTX 4080 SUPER展现出的性价比再次让我们感受到了NVIDIA对SUPER系列升级下足了本钱，这也意味着这块GPU在生成式AI、DLSS和光线追踪游戏、内容创作上有更强劲的战斗力。

那么事实是否真的如此？现在就让我们奉上NVIDIA GeForce RTX 4080 SUPER Founders Edition首发评测。

AD103的终极进化

GeForce RTX 4080 SUPER最让人印象深刻的就是这块代号AD103-400-A1核心。我们知道AD103保留了所有AD102的主要功能，并使用源自于台积电4N定制工艺的Ada Lovelace架构，拥有459亿个晶体管，核心面积379mm²。

在Ada Lovelace架构中，GPU中包含了若干个GPC（Graphics Processing Clusters，图形处理集群），GPC下包含若干个TPC（Texture Processing Clusters，纹理处理簇），若干个流式多处理器（Streaming Multiprocessors，SM），再往下就是CUDA、RT Core、Tensor Core等等。每个GPC之间包含的TPC数量相等，当GPU进行定位区分的时候再进行GPC、TPC的物理屏蔽实现。

完整的AD103包含7个GPC，但每个GPC包含的TPC并不相同。如下图所示，在6个GPC各拥有6组TPC的同时，还有1个GPC仅有4组TPC。比如，在RTX 40系列发布时，GeForce RTX 4080是通过屏蔽1组TPC实现的。

有意思的地方来了，同样采用AD103的GeForce RTX 4080 SUPER显然不会再做任何核心配置上的让步，光从核心代号AD103-400-A1就知道这块GPU并不简单。是的，GeForce RTX 4080 SUPER即是完整的AD103，包含10,240个CUDA核心、80个RT Core、320个Tensor Core、320个纹理单元和112个ROPs。在内存子系统上则总共包含10,240KB L1缓存，20,480KB寄存器堆，以及65,536KB的L2缓存。

不过需要注意，相对专业级GPU的3个第八代NVENC和3个第五代NVDEC配置， GeForce RTX 4080 SUPER编码器配置为2个第八代NVENC和1个第五代NVDEC，以此做出区分，这是消费级GPU常规操作，对游戏性能和AI加速性能影响不大。

不仅如此， GeForce RTX 4080 SUPER的Boost频率也来到了2.55GHz，搭配256-bit的16GB GDDR6X，显存带宽来到736GB/s，TGP则仍然和RTX 4080持平，为320W。值得一提的还有不做删减的64MB L2缓存，这比GeForce RTX 3080的5MB L2缓存提升了12.8倍，这让游戏中的这让光线追踪，尤其是路径追踪从中获得巨大收益。所搭配的第三代RT Core、第四代Tensor Core，更是能更好的发挥出L2缓存的效果。

至此，CES2024上发布的三款GeForce RTX SUPER发布完毕，这里不妨让我们用RTX 4080做对比，大致规格对比如下。

黑色装甲参上

SUPER版本的Founders Edition最大的不同是用作加固的黑色中框变成了深黑色，一下子显得高级了很多。不过在整体设计思路上变化不大，主要依靠错位风扇搭配异形PCB的对称设计，以此改善GPU的散热情况。

在材质选择上，GeForce RTX 4080 SUPER Founders Edition讲究一体成型，散热鳍片由99%铝合金打造，结合重量轻、刚性可靠、导热性好的特点。同时散热鳍片再度加厚，变成了三槽位设计，边框末端的支架孔被隐藏在磁吸的挡板下，仅凭指甲就能撬开，而复原的时候只需要将贴片放回，磁力便会自动吸附。

在风扇选择上，GeForce RTX 40系列Founders Edition基本将扇叶直径提升到116mm，在全速运作的时候，每分钟产生的气流足以充满3.5个篮球。并且风扇叶片由增强型玻璃纤维组成，具有弹性，搭配动态轴承可以获得更好的静谧性。

风扇下面则是使用了6热管搭配散热鳍片的设计，供电则继续使用了最新的16pin（12VHPWR）接口，机包装配送了3x8pin转接线，TGP是320W。

在实际游戏测试中，GeForce RTX 4080 SUPER Founders Edition表现出的效能特别高，4K游戏环境中，功耗普遍都被控制在了250W以下。

接口设计则包括了3个DisplayPort 1.4a和1个HDMI 2.1接口。

在压力测试中，GeForce RTX 4080 SUPER Founders Edition的GPU温度和表面温度都不高。比如GPU温度仅在58℃，红外线检测可以看到整个外壳都处在相当清凉的状态。

开启SUPER战斗力

现在让我们进入测试环节，测试平台包括了Core i9-14900K、ROG MAXIMUS Z790 DARK HERO、G.SKILL Trident Z5 DDR5-7200 16GBx2，并配以1250W电源作为支持。

在基础性能测试中，主要参考检测DirectX 11和DirectX 12性能的3DMark Time Spy，3DMark Time Spy Extreme，3DMark Fire Strike Extreme，3DMark Fire Strike Ultra，Port Royal。可以看到GeForce RTX 4080 SUPER比RTX 4070 Ti SUPER提升有20%左右，而如果对比上一代的RTX 3080，提升幅度最高70%。

因此如果使用DLSS 2及以前的常规游戏，GeForce RTX 4080 SUPER在4K最高画质下，相对RTX 3080 Ti提升幅度起步45%，最高可达80%。而用GeForce RTX 4080 SUPER对比GeForce RTX 2080 SUPER，提升就相当夸张了，可以从150%到250%。

GeForce RTX 40系列带来的DLSS 3和DLSS 3.5技术才是重头戏，由于第四代Tensor Core性能提升幅度巨大，并辅以光流加速器（Optical Flow Acceleration，OFA）与DLSS相结合的办法，构建出了一个更为立体的分析方式，让GPU实际执行过程压缩到原本的 1/8。

DLSS 3.5则是一套基于AI的算法，让画质和帧率同时提升的解决方案，同时包含DLSS帧生成（FG）与光线重建（RR, Ray Reconstruction）技术搭配，再加上超分辨率（Super Resolution）、DLAA、帧生成（Frame Generation）多种技术融合。

如果用RTX 3090作为比较就会发现，即便是拥有24GB显存加持，RTX 3090无论4K还是8K分辨率，在画面流畅度上都弱于GeForce RTX 4080 SUPER。

而在DLSS 3以后版本的游戏中，GeForce RTX 4080 SUPER的战斗力就体现出来了。这里我们直接开启4K最高画质，开启光线追踪或者路径追踪。可以看到，GeForce RTX 4080 SUPER对比RTX 3080 Ti提升幅度最高可以从60%到200%以上，而对比RTX 2080 SUPER，最高超过800%，当然是因为GPU无法推动导致的，而从普遍的结果而言，GeForce RTX 4080 SUPER相对RTX 2080 SUPER提升300%上下不成问题。

甚至DLSS 3与Reflex的融合，也让GeForce RTX 4080 SUPER在竞技类游戏中有更惊人的表现。特别是在1080p分辨率下，《无畏契约》《反恐精英2》等游戏都获得了300FPS以上帧率，并通过Reflex将系统延迟降低到了10ms以下。

这里我们用开启DLSS 3.5的《赛博朋克2077》进行画质对比，可以看到在DLSS 3.5光线重建加持下湿漉的倒影变得清晰自然，同时物体边缘在暗影中仍然会提现出光反射效果，重点这是在获得更高帧率前提下实现的。

AI与创作都很能打

接下来是AI测试环节。GeForce RTX 4080 SUPER搭配16GB GDDR6X对生成式AI而言提供了巨大的进步。这里我们不妨以Stable Diffusion XL作为参考，Stable Diffusion XL本身运行需要依靠Transformer变换器和卷积神经网络实现，这两者均需要GPU进行大规模并行计算，这无疑是NVIDIA最擅长的事情。也正因为如此，近几年AI的飞速发展，很大程度上就是NVIDIA GPU技术发展所推进的。

这里选择的Stable Diffusion XL在模型体量上相当Stable Diffusion 1.5扩大了3倍，从而导致计算的数据量提升，但也带来了更好的画质。这里以Stable Diffusion Web UI + TensorRT进行配置，用更短的语言描述生成10张分辨率为768x768的星际航行图片，每次运算1张图片，即总共执行10次，采样步数设置为50。

文字描述部分为：epic space battle over a water planet, many ships, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting。通过记录时间，推算出每分钟推算图片效率，参考公式为60 / (TotalTime / (BatchSize * BatchCount)) = Images Per Minute。

GeForce RTX 4080 SUPER轻松超过近期参与评测的一众GPU，哪怕是对比同显存的RTX 4070 Ti SUPER，也有超过25%的性能提升，提升幅度相当明显。这意味着利用GeForce RTX 4080 SUPER就已经可以很好的进行本地AI部署，无论是现在的文生图加速、图生图，乃至视频生成，或者大语言模型加速，GeForce RTX 4080 SUPER都已经提供了相当充实的算力基础。

与此同时，国产软件D5渲染器还对DLSS 3.5 AI加速提供了支持。由于DLSS 3.5使用了比DLSS 3多5倍的数据训练，因此也可以更好的识别光线追踪效果，在时间、空间数据中做出更合理的判断，从而实现高效率的扩展。

实际测试的Minimalist Villa 1场景中，GeForce RTX 4080 SUPER一下子让D5渲染器的运行程度变得极为流畅，轻松超过了60FPS的流畅度，就算相比一周前的RTX 4070 Ti SUPER也提升了35%以上。

不仅如此，DLSS 3.5的加入还让场景发生了质变。当DLSS 3.5关闭后，地面的反光变得非常粗糙，左侧的玻璃也丧失了折射效果与通透性，同时帧率也降低到了不到原来的一半。

最后一项AI测试，则是利用ON1 Resize AI 2022对图片分辨率进行提升。可以看到GeForce RTX 4080 SUPER用最短的时间完成了照片的分辨率提升，相对RTX 3080节省了一半的时间。

海量的CUDA Core和RT Core同样也是GeForce RTX 4080 SUPER的强项。在V-Ray 5 Benchmark中，会分别对CUDA Core和RTX进行检测，借助更多的CUDA Core数量，GeForce RTX 4080 SUPER无论CUDA性能还是光线追踪都有很强劲的表现，相对RTX 3080提升60%。

另外一个Octane Render RTX则是用来测试GPU的光线追踪性能表现，在复杂场景下考验GPU每秒产生的样本率，提升幅度很高，GeForce RTX 4080 SUPER比RTX 3080提升了50%。

另外Blender Benchmark引入的Moster、Junkshop、Classroom三个参考场景，GeForce RTX 4080 SUPER相对RTX 3080提升最高超过80%。

在专业软件创作环节，我们引用了SPECviewperf 2020作为参考，这是一款专门考验OpenGL和Direct X API下运行的系统的3D图形性能，软件包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。GeForce RTX 4080 SUPER能够做到相对RTX 3080在专业应用领域，从50%到将近90%的帧率提升。

写在最后：定义SUPER天花板

GeForce RTX 4080 SUPER厉害的地方在于，用相对RTX 4080更便宜定价策略就达成了当前SUPER天花板的成就，满配的AD103 GPU没有让人失望，在相对RTX 4080功耗没有提升的状态下，战斗力表现惊人，在4K分辨率下DLSS 3游戏的表现。

事实上，GeForce RTX 4080 SUPER已经是一款可以特效拉满，在4K分辨率下流畅运行所有大作的GPU，你要做的就是进入游戏，由游戏的检测系统自动调整最高配置，或者手动将画质滑块拉到头，体验上玩游戏从不看画质设置的人生巅峰，这时候8099元的定价就会显得特别划算。

在游戏之外，GeForce RTX 4080 SUPER也展现出了自己全能的地位，无论用Stable Diffusion XL加速生成式AI，用DLSS 3.5加速D5渲染器，或者海量的CUDA Core加速3dsmax、CATIA等专业软件，或者换上NVIDIA Studio驱动，接入NVIDIA Omniverse的元宇宙。

GeForce RTX 4080 SUPER所加持的PC可以轻易变成全能型选手，就算你是专业的艺术创作、设计、游戏开发人员，也可以从这块GPU或者专业应用加速的畅快感。特别是GeForce RTX 4080 SUPER与16GB GDDR6X大显存配合下的卓越AI表现，可以让用户不再给在线的AI服务付费，依靠GeForce RTX 4080 SUPER的本地AI性能，轻松实现文生图、视频生成、大语言模型加速，为即将到来的本地化AI时代提供充分的算力基础。

而这款代表着当下SUPER系列最高天花板的产品，也很好的诠释了性价比。如果你想获得充足的AI性能，并以4K最高画质流畅运行3A大作，还想轻松应对视频、图像或是专业软件工作，那么GeForce RTX 4080 SUPER就是现在最合适的那一款GPU。