6月1日,在COMPUTEX 2026期间举办的NVIDIA GTC Taipei大会上,英伟达创始人兼CEO黄仁勋发表演讲。

打开网易新闻 查看精彩图片

他上台发布了Cosmos系列的第三代Cosmos 3。

Cosmos 3是一个面向物理AI的世界基础模型,提供“理解物理世界、预测会发生什么、决定怎么做”的底层能力。

打开网易新闻 查看精彩图片

Cosmos的早期版本主要面向机器人和自动驾驶开发者,做的是视频生成和物理世界模拟,Cosmos 3混合了Transformer,首次把视觉推理、世界生成和动作预测统一到了一个系统里。

它能原生理解并生成文本、图像、视频、环境声音和动作,在物理准确性上达到领先水平,是全球首个完全开放的全能模型。它有望把物理AI的训练和评估周期从过去的数月压缩到数天,它为开发者提供了代际飞跃的能力,用于构建能够在物理世界中感知、推理、规划和行动的机器人、自动驾驶汽车和视觉AI。

黄仁勋预测,得益于多模态推理语言、视觉和世界模型的突破,物理AI的大爆炸即将来临。

英伟达现场还与宇树联合发布H2 Plus——一台为研究和开发者准备的人形机器人样板机。宇树负责机器人本体,英伟达负责软件和计算平台,两边把硬件和软件预先整合好,开发团队拿到就能直接开始做技能开发,不用自己再花时间解决底层对接问题。它也是全球首款基于NVIDIA Isaac GR00T开发平台构建的开放式人形机器人。

英伟达表示,之前,研究团队拿到一个机器人本体,往往要花大量时间在底层拼凑上,真正的技能开发反而被一再推后。H2 Plus就是让研究团队跳过底层集成,直接进入技能开发和真实场景验证。

黄仁勋认为,人形机器人将为全球最大的产业带来物理AI,开启数万亿美元的经济机遇,而H2 Plus是把前沿研究往工厂、仓库、物流系统这些真实场景推进的起点。英伟达正式开源一套物理AI Skills(技能)工具集,覆盖机器人、自动驾驶、视觉AI和工业数字孪生等核心场景。智能体接到一个任务将自己自动跑完,不需要人去操作每个环节。