采用全新Blackwell架构的RTX 5090 D终于在1月24日正式迎来性能解禁时间点。华硕全新打造的ASTRAL夜神系列发烧级游戏显卡也在第一时间加入了RTX 5090 D的型号,其中的ROG ASTRAL夜神RTX5090 D O32G GAMING(以下简称RTX 5090 D夜神),则堪称比ROG STRIX系列更高端的信仰级旗舰神器。

ROG ASTRAL 夜神 RTX 5090 D上机搭载展示

 DLSS 4大显神威,RTX 5090 D信仰卡皇降临 ROG ASTRAL 夜神 RTX 5090 D首发测评
打开网易新闻 查看更多视频
DLSS 4大显神威,RTX 5090 D信仰卡皇降临 ROG ASTRAL 夜神 RTX 5090 D首发测评

01 RTX 5090 D官方规格介绍

▲RTX 5090 D采用GB202芯片(上图),在此基础上减少了一部分SM单元和编解码器

RTX 50系采用了全新打造的Blackwell架构,有关Blackwell架构的技术解析请参考我们之前的文章(),这里就不再赘述,而是直接进入GPU规格介绍环节。

RTX 5090 D GPU采用GB202芯片,这款GPU芯片面积高达744mm²,相对上代RTX 4090 D的AD202芯片增加了大约22%,CUDA单元数量提升了49%,升级幅度非常可观。

由于新架构改进了设计,RTX 5090 D内置的第四代RT Core和第五代Tensor Core相对上代RTX 4090 D巨幅提升,算力升级幅度分别达到了87%和102%。考虑到Blackwell整体设计思路就是面向AI渲染和新的DLSS 4黑科技,所以这样的升级也完全合理。

传统的纹理单元和光栅单元方面,RTX 5090 D相对RTX 4090 D分别提升了49%和9%。显存部分,RTX 5090 D是全球首款使用GDDR7的GPU,显存位宽更是达到了512bit,传输速率提升到28Gbps,因此显存带宽相对RTX 4090 D增加了78%,不管是对于高分辨率光追游戏还是AIGC应用,显存系统的大幅升级都会带来更多的收益。

视频编解码器方面,RTX 5090 D搭载了三个第九代编码器和两个第六代解码器,相对RTX 4090 D的两个第八代编码器和一个第五代解码器来讲也是巨幅升级。而且RTX 5090 D增加了对H.265/10bit/4:2:2格式视频编解码的支持,实用性也大大增加。

RTX 5090 D官方给出的整板功率为575W,配备16Pin辅助供电,而像RTX 5090 D夜神这样的超公版,则会将功率上限升级到600W,从而提供更强的性能。

接下来就让我们一起看看RTX 5090 D夜神显卡实物。

02 ROG ASTRAL夜神RTX5090 D O32G GAMING图赏

ROG ASTRAL夜神RTX5090 D O32G GAMING采用了全新的ROG Astral系列外观设计,灵感源自广袤无垠、美轮美奂的宇宙,彰显对探索与开拓新边界的不懈追求。从整体视觉来看,相对之前的ROG STRIX系列显得更加沉稳大气,定位也更高。

ROG ASTRAL 夜神 RTX5090 D创新使用了四风扇设计,除了正面三个轴流风扇之外,还在背面进气格栅位置添加了一个风扇,提升20%气流和风压,带来更好的散热效果。此外,显卡还搭载了华硕专利真空腔均热板、MaxContact镜面直触技术、3.8槽散热片、相变GPU导热垫,为RTX 5090 D提供强大的散热支援。

用料部分,ROG ASTRAL 夜神 RTX5090 D配备了80A晶体管,比标准规格高出35%的功率支持,大幅增强了供电稳定性和超频潜力。显卡还使用了保护性电路涂层,采用全自动化制程,有效提升了显卡的可靠性和耐用度。因此,它的整板功率上限高达600W,相比公版的575W规格更高,GPU频率也提升到了2580 MHz,高于公版的2410 MHz,性能自然也高于公版。

此外,ROG ASTRAL 夜神 RTX5090 D还配备了超硬的金属外壳,采用压铸金属框架、护盖、背板和304不锈钢I/O挡板,配备显卡支架,让显卡的防护能力达到超高的水准。

在显卡顶部,可以看到显卡提供了双FanConnect II风扇接口,可以将机箱风扇直接连接到显卡上,根据CPU和GPU温度来调节风扇转速,改善整个机箱的散热环境。

显卡配备16pin辅助供电接口,同时还提供了双BIOS开关,可以在静音模式和性能模式之间快速切换,满足玩家不同的使用需求。

个性化方面,显卡当然支持AURA SYNC神光同步,而且在顶部提供了一条灯带,视觉效果酷炫而不过分张扬。

接口部分,显卡提供了三个DP 2.1b和两个HDMI 2.1b,最多可以支持四屏输出。

接下来,让我们看看它在测试中的实战表现。

03 实战测试:DLSS 4威力惊人,4K帧率暴增数百

测试平台

显卡:ROG ASTRAL 夜神 RTX5090 D

处理器:锐龙7 9800X3D

内存:佰维DDR5 6000(C28) 16GB×2

主板:ROG CROSSHAIR X870E HERO

硬盘:WD_BLACK SN850X 2TB

电源:ROG雷神Ⅱ1600W

操作系统:Windows 11专业版24H2

测试平台部分,我们选择了锐龙7 9800X3D,将处理器部分的瓶颈效应控制在最小,同时还使用上代的RTX 4090 D与之进行对比。此外,考虑到RTX 5090 D的定位和发烧级玩家实际的使用环境,我们本次游戏实测都使用4K分辨率。

DLSS 4应用与游戏测试

本次RTX 50系最大的升级就是带来了DLSS 4,在全新Transformer模型加持下,DLSS 4不但能够提供更好的画质和效率,还能通过多帧生成技术巨幅提升游戏帧率,让4K游戏大作能够实现像电竞网游那样数百帧的超高流畅度。因此,我们决定先来看看DLSS 4游戏测试的情况。

首发宣布支持DLSS 4的游戏与应用有75款,到目前为止已经有一部分随着RTX 5090 FE的性能解禁更新了对DLSS 4的支持补丁。当然,由于我们测试在此时间之前已经完成,所以使用的是NVIDIA提供的几个游戏的DLSS 4测试分支。在原生支持DLSS 4的游戏中,我们可以选择多帧生成的倍率(4×、3×、2×),而在非原生支持DLSS 4的部分游戏中,我们也可以通过NVIDIA APP来设置使用的模型(新的Transformer或者上代的CNN)与多帧生成倍率。

在3DMark新增的DLSS 4测试中,开启4×多帧生成的RTX 5090 D领先只支持2×帧生成(DLSS 3)的RTX 4090 D的幅度高达162%。同时,我们也可以看到,开启4×帧生成之后,RTX 5090 D的帧率相对原生帧率提升了449%,相对RTX 4090 D的原生帧率提升幅度更是高达714%,可见DLSS 4的多帧生成效果确实非常给力。

在《赛博朋克2077》的DLSS 4测试分支版本中,我们可以详细比较RTX 5090 D使用Transformer模型的DLSS 4模式不同倍率帧生成设置下的帧率,也可以比较CNN和Transformer模型同在2×帧生成下的效率(使用CNN模型的DLSS 3只支持2×帧生成)。在DLSS 4模式下,启用4×、3×和2×帧生成,RTX 5090 D的帧率相对原生分别提升746%、571%和377%。同时,使用Transformer模型实现2×帧生成相对DLSS 3的CNN模型也有7%的帧率提升。RTX 4090 D在《赛博朋克2077》中只能选择使用CNN模型的DLSS 3模式,因此只支持2×帧生成,而拥有4×帧生成的RTX 5090 D帧率比它高160%,相对它的原生帧率更是提升了夸张的1038%。

《霍格沃兹之遗》的测试分支中,4×帧生成和3×帧生成使用了Transformer模型,在2×帧生成模式下,则使用了CNN模型。RTX 5090 D使用DLSS 4和4×帧生成,相对原生的帧率提升了309%,3×提升了195%,使用上代的DLSS 3 + 2×帧生成模式提升了97%。和RTX 4090 D的DLSS 3 + 2×帧生成相比,最高提升幅度达到了108%,和RTX 4090 D原生帧率比,提升幅度最高432%。此外,从我们的测试来看,使用4×帧生成的渲染延迟与平均PC延迟与2×帧生成相比并没有明显变化,所以大家完全不用担心这个问题。

《漫威争锋》可以在NVIDIA APP中使用Override模式来开启DLSS 4和多帧生成。在 4×/3×帧生成模式下,RTX 5090 D的帧率相对于原生分别提升了289%和217%,而在2×帧生成模式下,使用Transformer模型相对CNN模型也提升了6%。RTX 5090 D采用4×帧生成的帧率相对采用DLSS 3 + 2×帧生成的RTX 4090 D提升了137%,和原生比更是提升了419%。延迟部分,可以看到RTX 5090 D在几种帧生成比例下的渲染延迟与PC延迟差别都很小,可见对于玩家来讲直接启用DLSS 4的4×帧生成无疑是获得高帧率和流畅操作的最佳选择。

DLSS 4在3D渲染类生产力软件中也能大幅提升预览效率,目前D5渲染器可以通过Override模式来支持DLSS 4和多帧生成。开启DLSS 4和4×帧生成,RTX 5090 D的帧率相比原生(关闭超分辨率、光线重建和帧生成)提升了291%,比DLSS 3和2×帧生成模式的RTX 4090 D提升了207%,比它的原生帧率提升了561%。可以说这对于设计师用户来说堪称史诗级的体验升级。

基准性能测试

前面DLSS 4的测试成绩确实让我们非常惊喜,而接下来我们继续从基准测试项目来了解RTX 5090 D在规模提升之后相对上代的常规理论性能提升。

3DMark的DX11和DX12光栅化渲染测试项目中,RTX 5090 D相对RTX 4090 D的优势都超过了35%,在DX12项目中的优势更高一些,最高甚至可达44%。在DX12U和光追项目(SpeedWay和Port Royal)中,RTX 5090 D的优势更大,最高的项目提升了57%,新的光追单元效率确实更高。综合传统基准性能部分的成绩来看,RTX 5090 D平均领先RTX 4090 D的幅度大约为44%。

常规游戏性测试

接下来我们看看4K极限画质设定下光栅化游戏性能的表现。RTX 5090 D相对RTX 4090 D的平均帧率提升幅度从24%到59%不等,平均提升幅度大约为35%,其中《赛博朋克2077》《永劫无间》提升幅度都非常惊人,都超过了50%。而在影响游戏流畅度的1% Low帧方面,RTX 5090 D在《博德之门3》中甚至领先了RTX 4090 D大约60%,综合全部游戏平均领先的幅度是34%。

光追与DLSS游戏测试

在打开光追和DLSS(CNN模型)的主流3A游戏中,RTX 5090 D相对RTX 4090 D的平均帧优势大约在16%~39%,平均升级幅度大约为29%。1% Low帧部分,RTX 5090 D相对RTX 4090 D的领先幅度最高达39%,平均领先21%。可见无论是绝对帧率还是游戏平滑度,RTX 5090 D都是大幅超越上代RTX 4090 D的存在。

生产力性能测试

RTX 5090 D提供了更多的CUDA单元和更为强大的32GB/512bit/GDDR7显存,因此在各种3D设计工具软件中也会提供更高的执行效率。从测试结果来看,RTX 5090 D在Blender中相对RTX 4090 D有32%~45%的提升;在V-Ray GPU RTX渲染中有37%的提升;在SPECView2020V3.1中的平均提升幅度则为12%。由此可见,对于经常要用到3D设计工具的用户来讲,RTX 5090 D相对上代提升巨大,是更加高效的升级选择。此外,RTX 5090 D新增了对4:2:2/10bit格式视频编解码的支持,我们使用Davinci Resolve 19 + Voukoder进行了编码测试对比,有明显的提升。

RTX 5090 D在视频解码方面同样十分强大,它配备的两个第六代解码器在剪映中可以同时流畅解码5条H.265/4:2:2/10bit视频不掉帧。但如果用CPU解码,就算是拥有16核32线程的锐龙9 9950X也会出现严重卡顿。可见对于视频剪辑师来说,RTX 5090 D新一代的编解码器确实会带来更高的工作效率。

AI性能测试

Blackwell架构的一大革新就是内置的第五代Tensor Core支持FP4精度的计算,相对Ada架构的Tensor Core性能提升了一倍。我们这里使用UL Procyon的AI生图测试来考查RTX 5090 D的在FP8和FP4精度下的AI性能。

从测试来看,同样使用FLUX.1模型生成1024×1024的图片,RTX 5090 D在FP4下的出图速度相当于FP8模式下的170%,显存占用也减少了20%左右。RTX 4090 D不支持FP4模式,所以从FP8模式切换到FP4模式出图时间几乎增加了一倍。RTX 5090 D在FP4模式下出图速度大约比RTX 4090 D快了413%。由此可见,对于需要快速AI出图、且对精度要求并不苛刻的用户来讲,支持FP4精度的RTX 5090 D无疑是高效神器。

功率与温度表现

我们对RTX 5090 D夜神进行满载考机测试,可以看到这时候整板功率达到了600W上限,GPU功率则保持在230W水平。得益于3.8槽的四风扇散热器,RTX 5090 D夜神的GPU考机温度仅有66℃左右,噪声也控制得很好,达到了旗舰风冷显卡中的顶级水平,即便发烧级玩家长时间高强度玩游戏或AI创作,也不用担心过热的问题。

04 总结:信仰卡皇,尝鲜DLSS 4与AI渲染的终极选择

Blackwell架构从硬件层面完成了从传统渲染时代到AI渲染时代的进化,突破了制造工艺、功率等硬件条件带来的性能瓶颈,为业界指明了GPU设计的方向。毫无疑问,未来的GPU完全拥抱AI是不可阻挡的趋势,NVIDIA在这方面是没有争议的领军者,整套生态圈的优势无可匹敌。

以Blackewell架构为基础,RTX 5090 D带来了一系列基于AI技术的新功能,为玩家提供了更加极致的游戏体验。RTX 50系GPU独享采用Transformer新模型的DLSS 4以及多帧生成技术,不但可以让游戏帧率暴增数倍,还可以实现比DLSS 3更好的画质,这对于发烧级玩家来说确实拥有不可抵挡的吸引力。

在AI和生产力方面,RTX 5090 D新增对FP4精度的优化支持,能够提供更快的AI计算速度(也为AI渲染提供了强大的硬件基础),同时它还拥有当前最高规格的32GB/512bit/GDDR7显存配置,对于AIGC用户来讲是当下最高效的工具。此外,它还内置了3×第九代编码器和2×第六代解码器,新增支持4:2:2/10bit编解码,对于视频剪辑用户来说也能大幅提升工作效率。此外,在3D设计方面,RTX 5090 D也提供了远超上代RTX 4090 D的性能。综上所述,对于追求极致效率的设计师用户来讲,RTX 5090 D是目前毫无争议的顶配之选。

RTX 5090 D夜神作为RTX 5090 D中的信仰级旗舰代表作,拥有600W的顶级性能释放能力,配备强大的3.8槽四风扇散热系统,拥有全新打造、霸气十足、坚固无比的旗舰外观,确实堪称专为发烧级玩家和高端设计师用户打造的信仰级卡皇。