文/氪新抢先看

RTX 40系GPU自发布以来就一直饱受玩家们的好评,在DLSS 3这样的AI上采样+帧生成技术加成下玩家可以流畅享受高分高刷高画质的RTX游戏体验。不过,要想体验DLSS3的强悍实力,一块RTX 40系GPU可以说是必不可少,因此RTX 4060 Ti的发布可以说是入坑DLSS3的天赐良机。

凭借3199元起的售价,NVIDIA宣称RTX 4060 Ti是 1080p 分辨率下畅享最新游戏的不二之选。它的性能相较于GDDR6版的RTX 3060Ti有15%到70%的提升,对比之前的一代大众神卡RTX 2060 Super更是从60%到160%不等。同时,32MB的超大L2 Cache、DLSS3与NVIDIA Reflex技术使得大众的1080P分辨率下能够享受高帧率低延迟的完美游戏体验。不过,这款全新GPU的表现究竟如何?请跟随我们的脚步一起来看看吧。

外观

外观

打开网易新闻 查看精彩图片

我们这次拿到的NVIDIA GeForce RTX 4060 Ti Founders Edition延续了NVIDIA在RTX 40系的公版卡上统一使用的设计语言,从包装到内里皆是如此。

打开网易新闻 查看精彩图片

GPU整体采用了黑色与银色的撞色设计,通过X字形的金属线条分隔成四个部分。整体设计颇具科幻风格,但却并不张扬,十分的独特。作为一张双槽GPU,NVIDIA GeForce RTX 4060 Ti Founders Edition 延续了之前发布的RTX 4070 GPU的迷你身材,不仅因为无越肩设计机箱兼容性无出其右,配合整体设计语言观感也仍然十分惊艳。

打开网易新闻 查看精彩图片

翻到正面,除了第二个风扇与金属分隔线之外整张GPU正面只有大量的散热鳍片。这种一进一出的设计不仅能够高效地将GPU运行时产生的热量排除,还能够有效提升整机的气流表现,优化散热系统的综合性能。

打开网易新闻 查看精彩图片

顶部和底部被分割开来的散热鳍片也十分具有设计感,配合左右两侧的银色边框与右侧的GEFORCE RTX字样在高度对比的撞色中进一步呈现科技感。

打开网易新闻 查看精彩图片

作为ATX 3.0标准的一部分,12VHPWR接口从去年的RTX 3090 Ti GPU开始就与玩家们见面,如今市场上支持这类接口的电源也让人眼花缭乱。尽管NVIDIA GeForce RTX 4060 Ti Founders Edition的TGP只有160W,但12VHPWR单接口就能提供最高600W的电力供应,可以说是十分的强悍了。

打开网易新闻 查看精彩图片

GPU挡板部分包括四个图形输出接口以及散热系统的出风口。三个DP 1.4a与一个HDMI2.1意味着玩家可以轻松应对多屏高分高刷需求。尤其是在RTX 40系GPU强悍的DLSS 3和Reflex技术加持下,能够将游戏体验推向一个全新的高度。

测试平台

测试平台

打开网易新闻 查看精彩图片

本文接下来要涉及的全部测试均在该配置下进行,以尽可能消除运行时的显卡瓶颈。

理论性能与规格参数

理论性能与规格参数

打开网易新闻 查看精彩图片

NVIDIA GeForce RTX 4060 Ti Founders Edition采用了一颗偏向能耗比的核心AD106-350-A1,在GPU-Z软件中可以看到,这颗核心拥有4352颗CUDA核心、8GB的GDDR6显存。默认频率2310MHz,Boost频率达到了2535MHz。

打开网易新闻 查看精彩图片

在3DMark Speed Way这项针对DirectX 12 Ultimate的最新测试中,NVIDIA GeForce RTX 4060 Ti Founders Edition取得了3200分的高分成绩,与3DMark数据库中RTX 3060 Ti的平均分2950分相比性能提升十分显著。

打开网易新闻 查看精彩图片

在其他3DMark的理论测试项目中,表现也基本延续了这一趋势。

打开网易新闻 查看精彩图片

同时,由于采用了台积电定制4N制程工艺,在30分钟的FurMark烤机测试下,我们的NVIDIA GeForce RTX 4060 Ti Founders Edition在160W左右维持了2.7GHz的频率,此时GPU温度仅有63.2摄氏度,最热点也只有72.4度,同时风扇转速只有35%左右,可以说是极为安静+低温了。

打开网易新闻 查看精彩图片

如此强悍的能耗表现除了制程工艺的进步与GPU图形架构的改进之外,着色器执行重排序技术(下文使用缩写SER指代)也是不可忽视的大功臣。对计算机原理略有了解的读者可能知道我们电脑使用的现代CPU都支持乱序执行,这样可以最大限度利用CPU内部的流水线并行处理更多的指令,避免遇到各种指令依赖或延迟导致的停滞。而GPU是一个比CPU更并行的处理器,尤其是在加入光线追踪、DLSS超分辨率、倍帧等新技术之后,着色器需要实现的任务的复杂程度指数级提升,因此遇到的问题也是类似的。加入SER后,GPU就可以通过对线程进行动态重排序来缓解停滞带来的性能损失,自然也会在能耗比上拥有更优秀的表现。

打开网易新闻 查看精彩图片

与此同时,Ada GPU在内的存储子系统上的改进也值得大书特书。GPU上采用的GDDR显存从名字上就可以看出是针对图形需求(Graphics)特化的DDR内存,因此它在各方面其实都与DDR内存十分类似,这其中就包括功耗模型。由于GPU十分依赖能够快速访问的内存以最大程度发挥性能,大部分中高端GPU都采用了较宽的显存总线配合相对更高频的GDDR显存颗粒,而这就意味着显存子系统的能耗也会成为整卡功耗中一个不可忽视的环节。

打开网易新闻 查看精彩图片

RTX 40系GPU统一采用了较小显存位宽搭配大容量L2缓存的策略,例如本次受测的NVIDIA GeForce RTX 4060 Ti Founders Edition就采用了128位的8GB GDDR6显存(未来也有16GB大容量显存版本)搭配32MB L2缓存的策略,这种搭配可以使得烤机时非GPU功耗仅有30W左右,表现惊人。同时,由于L2缓存离GPU核心更近,它的访问效率也更高,这意味着实际游戏中的性能表现也不会受到太多影响,可以说是一种既要也要的方案。

打开网易新闻 查看精彩图片

我们测试了这张显卡在一些日常应用环境下的功耗表现。可以看到,在日常办公上网等对显卡调用不频繁的场景中,RTX 4060 Ti GPU的能耗甚至不到30W,即使在游戏时整卡的功耗也在140W左右,仅有少数极端工况下显卡的功耗才会飙到160W满载功耗附近,十分出类拔萃

NVIDIA Reflex

NVIDIA Reflex

打开网易新闻 查看精彩图片

NVIDIA Reflex是一项包含 GPU 和 G-SYNC 显示器,以及可测量和降低竞技游戏延迟(也就是从点击到显示之间的延迟)的软件技术的全套低延迟游戏解决方案。通过对系统整体图形渲染管线的优化,它可以有效降低计算机系统内部的渲染延迟,对于游戏玩家来说能够带来极强的竞争力。目前,包括《Apex英雄》、《彩虹六号:围攻》、《瓦洛兰特》、《使命召唤:战区》在内,共有70余款广受好评的游戏与应用支持了NVIDIA Reflex技术。

打开网易新闻 查看精彩图片

我们在三款常见的主流电竞游戏中对NVIDIA Reflex技术进行了测试。可以看到,NVIDIA GeForce RTX 4060 Ti Founders Edition GPU强大的游戏性能在三款电竞游戏中都取得了十分不错的表现,而延迟方面,NVDIA Reflex技术在DOTA 2上将系统延迟降低了一半以上,从36ms降低到14ms,这意味着玩家在激烈的团战中可以更轻松地施放技能,轻松拿下对手的基地;彩虹六号围攻在保持平均帧接近600、1% Low达到370帧的同时的延迟从27ms降低到10ms,对于这样一款极度依赖精准且迅速的移动与拉枪的MMOFPS网游来说效果是立竿见影的。而三款游戏中最年轻的瓦洛兰特/无畏契约对于NVIDIA Reflex技术的支持可以说是最佳的,从23ms降低到不到9ms,直接降低了接近2/3的渲染延迟。配合最新推出的兼容NVIDIA Reflex技术的鼠标与360Hz高刷新率显示器,玩家可以自由征战各种电竞游戏。

NVIDIA DLSS3

NVIDIA DLSS3

作为今年RTX 40系GPU在功能性上的当家花旦,DLSS 3是一个对于游戏玩家十分重要的技术。通过利用AdaGPU内置的光流加速器和第四代Tensor Core,DLSS 3不仅提供了画质更好的DLSS体验,还能够利用全新的DLSS 卷积自动编码帧生成器无中生有创造全新的游戏帧。在三百余款支持DLSS技术的游戏与应用中,已有30款以上的游戏与应用对DLSS3进行了支持,这其中包括众多广受好评的游戏大作,例如《瘟疫传说:安魂曲》、《原子之心》、《赛博朋克2077》。

打开网易新闻 查看精彩图片

这其中,Ada Lovelace GPU新加入的光流加速器起到了至关重要的作用。它可以分析两个连续帧并通过计算分析出描述像素移动方式的光流场,配合游戏引擎提供的几何信息(例如地理位置、运动向量、速度和深度),就可以无中生有地生成全新的游戏帧。配合现有的DLSS超分辨率技术,在极限情况下游戏画面中可以只有12.5%的像素需要使用GPU渲染,其他的像素都是通过AI生成的,十分强悍。而且,DLSS 3运行在专门的加速器上,与图形渲染管线和CPU都没有多少关系,这意味着在一些瓶颈严重的游戏(例如微软模拟飞行)里,DLSS 3带来的性能增益会更为明显。

打开网易新闻 查看精彩图片

在3DMark的NVIDIA DLSS功能测试中,可以看到在2K质量档下,DLSS3对帧率的提升接近三倍,从37.24一跃升至接近90,表现十分喜人。

打开网易新闻 查看精彩图片

当然,游戏超采样技术古来有之,DLSS3真正革命性的地方在于它在提升游戏帧数的同时几乎不会造成可感知的游戏画质损失。以这两张来自《蜘蛛侠:迈尔斯·莫拉雷斯》的游戏截图为例,可以明显看出在开启DLSS3之后,墙体的细节整体更加清晰可辨,画面观感更好。可以说,DLSS3真正做到了画质、帧数我全都要,在近年来的游戏硬件来说算是一枚重磅的核弹。

为了全面展现DLSS3的强劲性能,我们挑选了几款游戏来进行测试,它们分别是《原子之心》、《巫师3:狂猎》、《赛博朋克2077》、《战锤40K:暗潮》、《极限竞速:地平线5》。游戏统一运行在1080P最高画质预设下,且开启光线追踪功能。同时,我们还使用RTX 3060Ti显卡进行了一轮测试,来做一个更全面的对比。

打开网易新闻 查看精彩图片

在《原子之心》这款游戏中,玩家扮演一位名叫P3的前苏联特工,降落到代号为3826的一片神秘诡异的工业区,在那里探索机器人叛乱的真相。游戏凭借精妙绝伦的故事、融合了1950年代苏联风格与复古未来主义的美术以及扎实的手感广受好评,发售之后热度也居高不下。技术上来说,尽管这款游戏虽然不支持光线追踪,但仍然支持DLSS 3,自然也在我们的狩猎范围内。

打开网易新闻 查看精彩图片

我们可以看到,DLSS 2加持下的RTX 3060 Ti在这款游戏里取得了平均114、1% Low 80的成绩,延迟也仅有35ms左右,表现已经可以称得上不错了,但开启DLSS 3之后,游戏的表现还能够有显著的提升,平均帧直接跃进至169帧,同时1% Low也提升到133帧。尤其需要注意的是,DLSS3是强制需要同时开启NVIDIA Reflex的,这意味着除了帧数之外,玩家的操作延迟也得到了显著的改善,从35ms降低到29ms以下,表现十分出色。

打开网易新闻 查看精彩图片

我们今天测试的第二款游戏是《巫师3:狂猎》。这款曾经的TGA年度游戏在次世代进化之后无论是画面表现力还是游戏体验都更上一层楼,尤其是包括配音在内的中文本地化也让中国玩家能够以一种全新的方式体验杰洛特的冒险之旅。当然,这些全新的功能都对玩家设备的性能提出了更高的要求,因此PC版的次世代更新同样包括光线追踪、DLSS3等一众现代图形技术。

打开网易新闻 查看精彩图片

由于巫师3支持光线追踪与NVIDIA HairWorks这类高级图形技术,且优化相对不算优秀,搭载DLSS2技术的RTX 3060 Ti还是略有吃力,30帧不到的1% Low帧数对于游玩体验来说还是有很明显的影响的。同时,接近100ms的输入延迟也使得玩家在战斗中更容易误失良机。而在NVIDIA GeForce RTX 4060 Ti Founders Edition上开启DLSS3之后,游戏体验马上得到显著提升,不仅平均帧率近乎翻倍,1% Low帧率甚至直接提升接近300%,输入延迟也直接砍半,在探索中能够有更流畅的发挥。

打开网易新闻 查看精彩图片

接下来受测的游戏是同样来自CDPR的《赛博朋克2077》。自从发布以来,这款游戏就凭借一流的艺术风格与极高的性能需求成为各项硬件评测的常客,当然我们也不例外。毕竟,无论是夜之城各个颇具特色的区域还是激烈的黑客攻防、格斗与枪战,想要在这座光鲜亮丽的赛博朋克大都市生存下去,流畅的操作对玩家们来说是必不可少的。在DLSS3与NVIDIA Reflex技术的加持下,赛博朋克2077的表现究竟如何呢

打开网易新闻 查看精彩图片

事实上,赛博朋克2077对性能的要求还是比较严苛的,尤其是它十分适合光线追踪技术的整体艺术风格对显卡提出了更高的考验。因此,即使在DLSS2的加持下,RTX 3060 Ti显卡也只能勉强维持一个平均66、1% Low 50的性能表现。而反观NVIDIA GeForce RTX 4060 Ti Founders Edition这边,在开启DLSS3之后,赛博朋克2077的性能表现提升十分显著,平均115、1% Low 97的帧数表现可以说是丝滑流畅,无论是枪战还是黑客战玩家都能抢夺先机瞬间制敌。

打开网易新闻 查看精彩图片

《战锤40K:暗潮》的故事依托战锤40K世界观的宏大背景而展开:在帝皇带领人类征服银河系的第41个千年,帝皇统治下的星系暗流涌动,混沌的力量正在腐化帝国底层,在巢都特提恩催生了不同力量组成的帝国叛军。由于精英部队正忙于征战,帝皇直属的审判庭人手不足,只好从监狱的罪犯中挑选精英组成打击小队奋战在平叛最前线。玩家可以选择帝国老兵、灵能者、狂热信徒、欧格林四个角色之一进行游戏,争取通过功勋来摆脱罪犯的身份。

打开网易新闻 查看精彩图片

可以看到,在这款游戏中,DLSS3对游戏性能的体验提升也是十分显著。对比开启DLSS2的RTX 3060Ti来说,DLSS3的性能提升幅度也是感知颇强。对于一款多人合作PVE割草游戏来说,这样的性能表现已经是完全可以接受的了。

打开网易新闻 查看精彩图片

《极限竞速:地平线5》是《极限竞速》系列的最新作品,将游戏的舞台从英国搬到了墨西哥,同时对墨西哥的天气环境、人文景观做出了十分逼真的还原。作为微软第九世代主机的首发护航作品,地平线5不仅拥有顶级的画面表现力,其性能优化也十分强悍。

打开网易新闻 查看精彩图片

可以看到,在开启DLSS3之后,极限竞速地平线5的帧数表现无论是平均帧还是1% Low都有明显的提升,系统延迟也砍到一半左右,游戏性能提升十分显著,玩家在驾驶时操控能够更加准确,这对于一款在真实街道而非禁锢在赛车场内的竞速赛车游戏来说是体验十分明显的。

生产力应用性能

生产力应用性能

Ada Lovelace GPU除了在游戏性能上凭借DLSS3有显著的进步之外,它也是一张生产力猛兽。它所搭载的第八代NVENC视频编解码器对最新的AV1视频编解码提供硬件加速支持,在包括DaVinci Resolve、剪映Pro在内的非编视频软件与OBS这类视频录制/直播软件里拥有极强的性能表现。除此之外,在HEVC这样的传统视频编码格式上也有最高可达两倍的性能提升。

打开网易新闻 查看精彩图片

最新的DaVinci Resolve 18已经支持了使用NVIDIA GPU进行硬件加速AV1视频编解码功能,我们使用索尼ZV-E1相机拍摄了一段H.265/HEVC格式的视频素材,在该软件中导出成AV1格式的视频素材。

打开网易新闻 查看精彩图片

可以看到,导出仅花费了32秒的时间,这与之前RTX 3060 Ti GPU相比可以说是提升十分显著。尤其是在未来16GB大显存版本上市之后,使用RTX 4060 Ti GPU应对4K甚至8K视频的工作流也会效率倍增。

打开网易新闻 查看精彩图片

而在偏向传统工业应用的SPECViewperf中,RTX 4060 Ti的表现也十分优秀,尤其是maya软件中斩获438分的高分。可以说,对于那些入门级工业设计用户(包括大学生和职场新人)来说,RTX 4060 Ti显卡,尤其是之后推出的16GB大容量显存版,将会是一张性价比极高的专业计算卡。

总结

总结

从上面的众多性能测试可以看出,RTX 4060 Ti作为一块主打1080P画质拉满光追拉满帧数也拉满的游戏GPU其表现令人十分惊艳。尤其是在DLSS3与NVIDIA Reflex技术加持下,无论是电竞网游还是单机游戏的体验都丝般流畅,同时整卡160W的烤机功耗在能耗比上也堪称无敌。无论你是追求1080P下超高帧率体验的硬核电竞玩家,还是购买了一些电源功率较低整机难以升级高功率显卡的生产力用户,RTX 4060 Ti都可以说是目前市面上最强的选择之一。