在拉斯维加斯举办的CES 2026展会上,英伟达创始人兼首席执行官黄仁勋发表主题演讲,宣布其新一代AI超级计算平台Vera Rubin已开始全面生产。
该平台以六款新型芯片的协同设计为核心,构建了一套从计算到网络、存储的完整系统。其核心组件Rubin GPU搭载第三代Transformer引擎,实现了显著的性能跃升。根据会上公布的信息,Rubin GPU在NVFP4数据格式下的推理算力达到50 PFLOPS,为前代Blackwell平台的5倍。同时,其训练性能也达到Blackwell的3.5倍,HBM4带宽为前代的2.8倍,达到22TB/s,晶体管数量则为3360亿个。
黄仁勋在演讲中阐述了此次发布背后所应对的人工智能发展趋势。他指出,AI的发展重心正从“生成式AI”向“代理式AI”与“物理AI”演进,未来的模型将具备主动推理、解决问题并与物理世界交互的能力。英伟达方面表示,Vera Rubin平台的目标是系统性地解决长期运行AI推理任务时面临的算力、网络和存储瓶颈。
依托这套全新架构,新的平台有望带来可量化的效率提升。据英伟达公布的数据,在对比中,采用Rubin平台进行推理时,大型混合专家模型(MoE)的token生成成本可降至Blackwell平台的十分之一;进行相同规模的MoE模型训练时,所需的GPU数量则可缩减至四分之一。
围绕“物理AI”这一主题,发布活动还涵盖了英伟达在多个前沿应用领域的进展。在自动驾驶领域,英伟达开源了名为Alpamayo的视觉-语言-行动推理模型。黄仁勋宣布,首款搭载英伟达完整自动驾驶技术栈的梅赛德斯-奔驰CLA车型预计将于2026年第一季度在美国道路推出。
此外,为应对AI智能体长期运行产生海量上下文数据带来的存储挑战,英伟达推出了由BlueField-4 DPU驱动的推理上下文内存存储平台。该平台旨在在GPU高速内存与传统存储之间建立一个新型“记忆层”,以提高AI应用的运行效率。
在产业合作方面,已有包括亚马逊网络服务(AWS)、谷歌云、微软Azure和甲骨文云在内的多家云服务商计划在2026年部署基于Vera Rubin平台的实例。同时,基于该平台的产品预计将于2026年下半年通过合作伙伴渠道正式向市场推出。
市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:观察君
热门跟贴