万众瞩目的NVIDIA Geforce RTX4090在10月11日正式解锁评测。作为今年“当量”最大的游戏显卡,RTX4090再一次刷新了游戏性能的高度。而今天,RTX4090非公显卡也正式解锁评测,作为公版显卡的补充选择,非公会有什么独到的选择呢?今天我们首先来解密一张最强的入门RTX4090。

——七彩虹 Geforce RTX4090 战斧
NVIDIA Ada构架解析
硬件改进:

Ada Lovelace,中文译名可以翻译为阿达·洛芙莱斯,是著名英国诗人拜伦之女,数学家。计算机程序创始人,建立了循环和子程序概念。NVIDIA构架一直喜欢使用这些杰出的计算机科学家作为自己的构架名,我们中文可以简称为阿达构架。
Ada构架的完整体是AD102,相比于原来的GA102,AD102中央有一块超大的L2缓存,这也是现在传统处理器常用的优化方法——堆缓存。这种做法粗暴简单,但是坏处就是需要做好各种优化支持,以及不可避免的制作价格、核心面积等方面的开销。如果未来的处理器设计仍找不出新的突破口,这种形式的设计会让处理器越来越臃肿+高功耗。
AD102共计又12个GPC(Graphics Processing Cluster,图像计算集群),每个GPC中包含6个TPC(Texture Processing Cluster,像素计算集群),12个SM,16个ROP。整个AD102拥有384Bit的显存控制器。在每个SM中,包含了128个CUDA,2个FP64浮点计算单元,1个RT光追单元,4个Tensor张量计算单元,4个TMUs。
因此算下来,完整的AD102会有
18432个CUDAs(上一代为10752,↑71.4%)
192ROPs(上一代为112,↑71.4%)
576TMUs(上一代为336,↑71.4%)
144RTCores(上一代为84,↑71.4%)
576TensorCores(上一代为336,↑71.4%)
从这些数字中可以看出,Ada和上一代的Ampere构架主要变化是在GPC数量的增加,说白了就是数量更多。


GPC在结构上并没有太大的变化,主要还是在一些小SM内做了改进。如第三代RTCore,第四代TensorCore,完整支持NV1的双解码器等。



三代光追的新计算特性这里就不多说了。提升主要来自算法上的优化。他们总共提出了三个主要的提升。总结下来就是三点:

光追单元变多+功能分化,满足算法变化需求
光追看不见的地方交给传统光栅单元算,反正你也看不出来
光追看得出来的地方少算,反正光晕下你也看不出来

四代TensorCore单元的变化主要是集成了Hopper构架独有的FP8计算单元,实现了最高1.3PFlops的计算性能。
除了构架上的小幅改进,Ada构架也把制程进一步提升到了TSMC 4N定制工艺。相比于原来的三星8nm工艺,全新的TSMC 4N制程使得AD102在与GA102面积相当,甚至更小的情况下拥有76.3B的晶体管数量,是原来2.69倍(如果只按71%来算,最多48.3B,配合最新工艺大概也在400mm²左右,现在你知道多的晶体管数量去了哪里了吧)。
软件改进:

DLSS3是随着Ada构架推出的新功能。过去大家对DLSS的评价褒贬不一,主要原因在于虽然DLSS提升性能,但是所带来的画面撕裂与模糊感非常强烈。新的DLSS3除了保留了DLSS2的功能外还引入了类似传统插针的优化方法。这种方法的好坏不做评价。但是如果能让游戏从PPT变成电影,那也无法否认其存在价值。
只是现在DLSS最大的问题还是对游戏的普及度不够,什么时候DLSS能像传统AA抗锯齿一样让大部分游戏都受益,这时候DLSS才能展现其真正的价值吧。
显卡一览

七彩虹战斧系列一直是入门的代表,哪怕是到了RTX4090也是如此。新的40系战斧采用了全新的设计。不再是原来棱角分明的爆裂装扮,而是变成了方方正正的风格。

全新的12Pin接口,最高提供600W的功率输出。但是战斧的TDP限制在了450W,所以如果准备定制线的话可以稍微不那么多花钱了。

这一代RTX4090基本全员三槽半起步。因此想要组双卡的朋友们基本没戏了。当然后续不排除推出标准三槽或者涡轮显卡。那么此时真的要看谁家本事大了。
显示接口方面吧和上一代基本没差,3DP+1HDMI设计。

灯光方面,战斧基本没有什么灯光,非常的朴素。

这一代应该不会有上一代的电容问题了。不过说实话当初的始作俑者已经不做显卡了。也没什么好说了。

分体一览,标准的外壳+三风扇散热+PCB+背板。


三套风扇的直径为9cm,都采用风扇环提高风扇的可靠性。风扇来自GECOTHERM,型号GFY09020H12BPA。基本参数为12V 0.5A。




散热厚度达到三槽,采用6热管设计,四根热管贯穿整个散热器,两根在芯片位置停止延伸。和以前的散热器一样,均会覆盖所有的供电MOS以及少部分的电感。散热器的设计并没有什么新意,主要是更厚更重了。

背板尾部做了镂空,和上一代RTX3090非公的设计类似,PCB都不是三风扇的长度。最后一个风扇会直吹热量到机箱上方。

AD102本体。


RTX4090 PCB完整照片。


采用AD102-300芯片,并不是完整版本的AD102。设计上和上一代没有很大的差别。

PWM控制器和上一代基本没差,仍旧是两颗uP9512R控制整套电路,配合uS5650Q监控电路。这里不再赘述了。

MOS为万代55A级一体MOS,最高提供120A 10us的瞬时电流。战斧的TDP设计为450W,所以这套供电是正正好好不高不低的满足了需求。

显存为美光GDDR6X颗粒,D8BZC,与3090Ti同款,容量为16Gb,速率为21Gbps。

12+4Pin供电,这个接口将在ATX3.0的电源中逐步普及,如果你是用的是老的电源,大部分显卡厂商都会配送一个12+4Pin转显卡8PIN的转接口。各位如果想自己买,优选12+4Pin转三个8Pin甚至更多的线。新的接口和以往一样存在可靠性寿命问题,因此尽量减少插拔次数,具体次数就要依据你的线材质量决定。
性能测试



选用的电源为鑫谷KL1250G,支持ATX3.0,所以附带了一根12+4Pin接口,能够提供最高600W的供电输出。
环境温度 26℃,本次测试选用了三张显卡进行对比,分别是
七彩虹 Geforce RTX4090 战斧
七彩虹 Geforce RTX3090 战斧
蓝宝石 Radeon RX6900XT 毒药
所有基准均以七彩虹 Geforce RTX3090 战斧为基准。

目前GPU-Z 2.50已经完整支持RTX4090规格识别。

战斧的频率最高能Boost到2700MHz左右,目前部分非公卡已经可以推到3000MHz,但是功耗会达到600W,所以用战斧就不要考虑太多超频了。即使他的温度很低。
这一代战斧没有检测显存温度,也没有检测12+4Pin供电的电流与电压,这可能和少了一个的uS5650S有关系。
理论性能测试:



AIDA64理论性能对比,RTX4090综合性能是RTX3090的1.95倍。虽然说RTX3090和RTX4090的理论带宽很接近,但是RTX4090内部的超大带宽让RTX4090的内部显存复制速度超过了2TB/s。浮点,整数的提升基本来自与CUDA数量和频率的提升。SHA1没有提升应该是算法瓶颈了。

3DMARK基准测试,可以看到RTX4090综合性能是RTX3090的1.77倍。除了入门游戏基准基本没有提升,1080P、2K、4K游戏均有明显的性能提升。DirectX光追性能更是有2.45倍的性能提升。

DLSS性能对比,RTX4090支持DLSS3,而RTX3090不支持,因此在RTX3090 DLSS3对比中,以DLSS2的性能做对比。可以看到在没有DLSS的加持下,RTX4090平均性能是RTX3090的1.92倍。而在2K,4K的分辨率下,RTX4090的DLSS2的性能提升幅度是不如RTX3090的,只有在8K下DLSS2的性能提升优于上代构架。这也并不奇怪,毕竟RTX4090构架内部也有所变化。
但是在DLSS3下,RTX4090的性能就完全优于RTX3090的DLSS2。非常合理。最终RTX4090综合性能达到RTX3090的2.06倍。

VRMARK对比Blue Room比较吃性能,RTX4090比RTX3090高出1.89倍,合理。

Unreal Engine 5和Unity引擎动画对比,RTX4090支持DLSS3,RTX3090支持DLSS2。综合对比RTX4090有2.27倍的性能提升。在DLSS3的加持下,RTX4090能够获得更好的性能表现。

Superposition (UE2) 和 Heaven Bench,RTX4090依旧有接近两倍的性能提升,综合为1.72倍。

所有游戏综合对比,RTX4090的综合性能是RTX3090的1.88倍。对于大部分游戏来说,基本性能提升都在1.7倍以上。而支持DLSS3的游戏(逆水寒和赛博朋克2077等)帧数提升能达到2倍以上。
DLSS3 画质对比
作为40系最大的卖点之一,DLSS3的对性能提升的同时又对画质有多少影响呢?这里准备视频和图文一起进行对比。
DLSS3 VS 原生:

DLSS OFF

由于人的视线首要集中在可以清晰的画面上,而如果不清晰的画面拥有过多细节,就会引起一种反直觉。开启DLSS后,中远景的过分细节被“删减”,视觉感受会有所加强,同时近景光影也得到了进一步的改善。就能让人有更好的视觉感受。

左DLSS OFF; 右DLSS3 ON
我们把开关后的画面放在一起,可以清晰的看到开启DLSS后的画面的线条颗粒有所减少。视觉感官上更接近与真实的图像画面。

不过DLSS系列的问题仍旧无法避免。优于通过裁剪光源附近的面数,开启后的部分场景在放大后能明显看到锯齿。如果截图不经意之间放大可能就会发现,此时就要好好利用NVIDIA nsight了。
DLSS3 VS DLSS2:
DLSS3对比不开启当然非常明显,但是对比DLSS2呢?


DLSS2与DLSS3其实基本看不出太大的差距,如果硬要说,最多是光影之间的小部分差距。尤其是树叶能看到更多的光影细节。

左DLSS2; 右DLSS3
但是如果放大对比后,DLSS3对比DLSS2确实能看出差别,DLSS2的画质感偏向于裁剪面数以及锐化,因此画面总有一股胶状感,而DLSS3则很好的解决了这个问题。

DLSS2

DLSS3
在一有光影的瓷钻、树木纹理表现上,DLSS3能够明显的看出细节,而DLSS2优化后的纹理就像打了一层胶一样。非常的模糊。

左DLSS2; 右DLSS3
放大后这些树木的纹理差别就非常明显了。
总的来说,DLSS3的优化效果还是非常明显的,不过考虑到目前游戏支持有限,外加DLSS3具体的表现不知道在更低端的显卡表现如何,我们静静期待其后续表现。
功耗与温度
不好意思,这是一个大核弹
RTX4090 战斧因为定位入门,所以最终的功耗上限只开到了450W,通过调节功耗墙可以解锁到105%的功耗,也就是472.5W。使用大部分的Furmark基本都没法烤满450W的功耗,因此这里直接采用OCCT烤鸡,完全吃满了RTX4090的TDP限制。

此时温度仅69.1℃,热点温度81.1℃,风扇转速只有43%(1700RPM+)。如果开满转速,此时温度只有60.1℃,热点温度70.8℃。噪音测试也不算特别明显。如果解锁剩下的5%的功耗,此时频率能再稍微提升7%。此时整机功耗628.5W,12+4Pin流过电流为36.38A,也就是说显卡的功耗基本来自于外接供电,已经不从主板取电了。解锁5%后功耗658.4W。12+4Pin流过电流38.92A。
要注意!此时还没有烤CPU,如果加上恐怕要就直接破900W了!
总结
毫无疑问,RTX4090再一次巩固了NVIDIA旗舰显卡的地位,而这个性能提升也和往年NVIDIA旗舰显卡的提升水平相符。RTX4090战斧虽然定位入门,但是其表现也完全让人满意。目前大部分的RTX4090起步价格都只有12999,某些地方的售价甚至低于此。如果想用最少的钱获得RTX4090的体验,战斧的表现已经完全合格。当然前提是应该不会抢不到吧?
复制这条信息,1(微出地心说有着子下起去出信)/,到【手机淘宝app】即可查看

关注B站@电脑吧评测室
热门跟贴