通过跨 NVIDIA Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太网交换机的极致协同设计,大幅缩短训练时间,降低推理 token 生成成本。
- Rubin 平台采用软硬件极致协同设计,将推理 token 成本最多降低至 NVIDIA Blackwell 平台的十分之一,在 MoE 模型训练中使用的 GPU 数量仅为 Blackwell 平台的四分之一。
- NVIDIA Spectrum-X 以太网硅光交换机系统可将能效和持续运行时间提高 5 倍。
- 搭载 NVIDIA BlueField-4 存储处理器的全新 NVIDIA 推理上下文记忆存储平台加速代理式 AI 推理。
- 微软旗下搭载 NVIDIA Vera Rubin NVL72 机架级扩展系统的新一代 FAIrwater AI 超级工厂,将扩展至搭载数十万个 NVIDIA Vera Rubin 超级芯片。
- CoreWeave 作为率先提供 NVIDIA Rubin 的首批企业之一,将通过 CoreWeave Mission Control 进行管理,兼顾灵活性和高性能。
- 扩大与红帽的合作,借助红帽企业 Linux、红帽 OpenShift 和红帽 AI,提供针对 Rubin 平台优化的完整 AI 堆栈。
NVIDIA 今日发布 NVIDIA Rubin 平台,开启了新一代 AI 之旅,该平台由六款专为打造超凡 AI 超级计算机而设计的全新芯片组成。NVIDIA Rubin 树立了新的标杆,能以最低的成本构建、部署和安全运行全球最大型、最先进的 AI 系统,以助力加速主流 AI 的采用。
Rubin 平台对六款芯片——NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink™ 6 交换机、NVIDIA ConnectX®-9 SuperNIC、NVIDIA BlueField®-4 DPU 和 NVIDIA Spectrum™-6 以太网交换机——进行极致协同设计,从而大幅缩短训练时间并降低推理 token 成本。
NVIDIA 创始人兼首席执行官黄仁勋表示:“训练和推理的 AI 计算需求不断激增,Rubin 的问世恰逢其时。凭借我们每年推出一代新 AI 超级计算机的节奏,以及对跨六款全新芯片的极致协同设计,Rubin 向 AI 的下一个前沿迈出了关键一步。”
Rubin 平台以 Vera Florence Cooper Rubin 命名,这位具有开创精神的美国天文学家,她的发现改变了人类对宇宙的理解。Rubin 平台包括 NVIDIA Vera Rubin NVL72 机架级扩展解决方案和 NVIDIA HGX Rubin NVL8 系统。
Rubin 平台引入了五项创新技术,包括新一代 NVIDIA NVLink 互连技术、Transformer 引擎、机密计算和 RAS 引擎以及 NVIDIA Vera CPU。这些突破将以 NVIDIA Blackwell 平台低至十分之一的 token 成本加速代理式 AI、高级推理和超大规模混合专家(MoE)模型推理的发展。NVIDIA Rubin 平台在 MoE 模型训练中使用的 GPU 数量仅为前代平台的四分之一,从而可加速 AI 的采用与普及。
以上为新闻摘要内容,如需阅读新闻全文,请点击链接:NVIDIA 发布 Rubin,开启新一代 AI 平台——六款全新芯片,一台超凡 AI 超级计算机 | NVIDIA 英伟达博客
热门跟贴