NVIDIA发布Vera Rubin AI平台，推理性能提升5倍，成本降至十分之一|gpu|rubin|十分之一|推理|黄仁勋

NVIDIA发布Vera Rubin AI平台，推理性能提升5倍，成本降至十分之一

金融界

2026-01-06 11:26 ·北京 ·金融界网站官方账号优质财经领域创作者

在拉斯维加斯举办的CES 2026展会上，英伟达创始人兼首席执行官黄仁勋发表主题演讲，宣布其新一代AI超级计算平台Vera Rubin已开始全面生产。

该平台以六款新型芯片的协同设计为核心，构建了一套从计算到网络、存储的完整系统。其核心组件Rubin GPU搭载第三代Transformer引擎，实现了显著的性能跃升。根据会上公布的信息，Rubin GPU在NVFP4数据格式下的推理算力达到50 PFLOPS，为前代Blackwell平台的5倍。同时，其训练性能也达到Blackwell的3.5倍，HBM4带宽为前代的2.8倍，达到22TB/s，晶体管数量则为3360亿个。

黄仁勋在演讲中阐述了此次发布背后所应对的人工智能发展趋势。他指出，AI的发展重心正从“生成式AI”向“代理式AI”与“物理AI”演进，未来的模型将具备主动推理、解决问题并与物理世界交互的能力。英伟达方面表示，Vera Rubin平台的目标是系统性地解决长期运行AI推理任务时面临的算力、网络和存储瓶颈。

依托这套全新架构，新的平台有望带来可量化的效率提升。据英伟达公布的数据，在对比中，采用Rubin平台进行推理时，大型混合专家模型（MoE）的token生成成本可降至Blackwell平台的十分之一；进行相同规模的MoE模型训练时，所需的GPU数量则可缩减至四分之一。

围绕“物理AI”这一主题，发布活动还涵盖了英伟达在多个前沿应用领域的进展。在自动驾驶领域，英伟达开源了名为Alpamayo的视觉-语言-行动推理模型。黄仁勋宣布，首款搭载英伟达完整自动驾驶技术栈的梅赛德斯-奔驰CLA车型预计将于2026年第一季度在美国道路推出。

此外，为应对AI智能体长期运行产生海量上下文数据带来的存储挑战，英伟达推出了由BlueField-4 DPU驱动的推理上下文内存存储平台。该平台旨在在GPU高速内存与传统存储之间建立一个新型“记忆层”，以提高AI应用的运行效率。

在产业合作方面，已有包括亚马逊网络服务（AWS）、谷歌云、微软Azure和甲骨文云在内的多家云服务商计划在2026年部署基于Vera Rubin平台的实例。同时，基于该平台的产品预计将于2026年下半年通过合作伙伴渠道正式向市场推出。

市场有风险，投资需谨慎。本文为AI基于第三方数据生成，仅供参考，不构成个人投资建议。

本文源自：市场资讯

作者：观察君