6 月 1 日,英伟达创始人黄仁勋在 2026 年台北国际电脑展发表主题演讲,这次演讲长达近 2 个小时,演讲中播放的多个短片基本都是黄仁勋亲自配音。
黄仁勋宣布了一个重要消息:从今年秋季开始,戴尔、联想等主流 PC 品牌将陆续推出搭载 RTX Spark 超级芯片的笔记本及台式机。这款由英伟达联合联发科共同研发的产品,集成了处理器与显卡,可运行微软 Arm 架构版 Windows 系统。英伟达正式进军个人电脑芯片市场,意在推动 PC 设备适配 AI 时代的发展需求。
整场演讲的核心信息是:有用的 AI 已经到来,Agent AI 正在成为新的计算范式,而英伟达已经为这个时代准备好了从云端到 PC 再到物理世界的完整基础设施。
NVIDIA RTX Spark:重新定义 PC
微软与英伟达共同推出了 RTX Spark,这是一个全新的 PC 产品线。双方用了三年时间重新思考 PC 的工作方式,目标是在 Agent AI 时代让个人电脑获得真正的智能。
RTX Spark 包含三个产品形态:笔记本、台式机和工作站。它们 100% 兼容 Windows 系统,100% 支持 CUDA,100% 集成英伟达 AI Tensor Core。这意味着过去所有为 Windows 开发的软件以及英伟达生态系统中的所有应用都能在这些设备上运行。
核心芯片是 N1X,由英伟达与联发科合作打造。它采用台积电 3 纳米工艺,集成 700 亿个晶体管,拥有 128GB 统一内存。Blackwell RTX GPU 提供 6,144 个 CUDA 核心和 1 PFLOPS 的 AI 算力,搭配定制的 20 核 Grace CPU,通过 NVLink 实现高速互联。这颗芯片可以运行英伟达全部软件栈,从数字生物学到天体物理,从计算机图形到 AI 推理等等。
RTX Spark PC 最特别的地方在于它可以本地运行 AI Agent。用户可以在设备上部署 Nemotron 3 Ultra 等大模型,Agent 能够 7x24 小时持续工作,帮助处理文件、做研究、管理智能家居设备。桌面版 RTX Spark 甚至可以作为家庭 AI 中枢,连接摄像头、家电、安防系统,随着时间的推移变得越来越智能。
黄仁勋在现场展示了一个设计房子的案例。本地运行的 Agent 在 Open Shell 沙箱中调用 Hermes 控制框架,连接到云端的 Claude 模型,自主操作 Rhino 和 Blender 等专业软件完成从场地建模到材质渲染的全流程。曾经复杂的工作流被 Agent 简化,设计速度大幅提升。
Adobe 等英伟达的合作伙伴已经针对 RTX Spark 进行了优化。Photoshop 和 Premiere 的核心架构被重新设计,运行速度翻倍,同时通过 MCP 服务器让 Agent 可以直接调用这些专业工具。华硕、微星等几乎所有主流 PC 厂商都加入了 RTX Spark 生态。
黄仁勋认为,就像当年智能手机重新定义了手机一样,RTX Spark 正在重新定义 PC。未来每个家庭或许都会有一台 AI 超级计算机,它更像 R2D2 或 C3PO,而不只是一个工具。
Vera Rubin:专为 Agent AI 设计的超大规模系统
Vera Rubin 并非首次亮相,不过本次演讲中黄仁勋宣布它已全面投产。这个平台专为 Agent AI 打造,而不是为传统训练或推理设计。
Agent AI 的工作方式与过去不同,Agent 需要观察、推理、规划、使用工具,管理大量上下文,同时处理工作记忆和长期记忆,还能按需启动子 Agent。这种分布式、解耦的计算模式对硬件提出了全新要求。
Vera Rubin 是一个多机架规模的系统,单个 Vera Rubin NVL72 机架包含 18 个计算托盘和 9 个 NVLink 交换机托盘,全部采用液冷散热。新一代背板设计取消了电缆,可靠性大幅提升。过去组装一个 Grace Blackwell 机架需要两小时,现在 Vera Rubin 只需五分钟。
Vera Rubin 的供应链规模是 Grace Blackwell 的两倍。在中国台湾地区,数百万平方英尺的工厂车间已经为量产做好准备,150 家供应链合作伙伴参与其中。黄仁勋还在演讲中公开展示了 Vera Rubin 实物机架,包括 CPU 机架、存储处理系统和全球首款 CPO 以太网交换机。
Vera CPU:为 Agent 时代从头设计的处理器
黄仁勋展示了全新的 Vera CPU,这是为 Agent 构建的处理器。
传统 CPU 的租用模式以秒为单位,用户按核心数付费。但 Agent 没有耐心,它们的时间单位是纳秒。每次工具调用、每次数据库访问,Agent 都希望响应时间尽可能短。等待会让 Agent 无法进入下一步,这直接影响了 AI 工厂的收入。
Vera CPU 采用全新 Olympus 核心架构,每个时钟周期可以获取、解码和执行 10 条指令,单线程性能世界第一。88 个核心通过第二代可扩展一致性结构连接在单片网格上,核心之间不跨小芯片分割,通信速度比传统 CPU 快 50%。
内存带宽方面,Vera CPU 首次支持 LPDDR5X 内存,峰值内存延迟比 X86 架构低 40%。它同时是第一款支持 PCIe Gen 6 的 CPU,内部和外部带宽都是行业最高水平的三倍。
能效同样是 Vera CPU 的设计重点,AI 工厂的电力预算有限,CPU 不能占用太多本该用于 Token 生成的电力。Vera CPU 在保证性能的同时实现了高能效。
实际工作负载测试中,Vera CPU 运行 SQL 查询的速度是传统 CPU 的三倍,实时流处理速度达到六倍。目前,纽约证券交易所已经部署了基于 Vera CPU 的实时处理系统。
Nemotron 3 Ultra:完全开源的高效大模型
黄仁勋还介绍了 Nemotron 3 Ultra,据了解这是世界上第一个采用混合 SSM 状态空间模型与混合专家 MoE 架构的开源模型。
这种混合架构让 Nemotron 3 Ultra 的推理速度提升五倍,运行成本降低 30%。与同类开源模型相比,它在保持智能水平的同时实现了更快的响应速度。
英伟达将模型权重、训练脚本以及训练所用数据集全部开放。开发者可以在此基础上继续训练,添加自己的数据,构建专有模型。Nemotron 3 Ultra 的训练数据来自一个由多家合作伙伴组成的联盟,大家共同贡献数据,构建了目前规模最大的长期推理和工具使用数据集之一。
Cosmos 3:物理世界的基础模型
Cosmos 3 是英伟达为物理 AI 打造的开放全模态基础模型,它能够理解物理世界,生成物理上准确的合成数据,并作为仿真器为机器人策略训练提供闭环。
传统大模型训练依赖互联网上的文本和图像,这些数据来自人类的第三人称视角。物理 AI 需要机器人第一人称的感知数据,现实世界中这类数据很难规模化采集。Cosmos 3 解决了这个问题。
据介绍,Cosmos 3 采用混合 Transformer 架构,像素、动作、声音和语言信息流入全模态聚合 Transformer 进行推理和规划,再由扩散 Transformer 生成接下来的内容。作为世界模型,它可以逐帧预测物理世界的未来状态。经过后训练后,Cosmos 3 还能变成世界行动模型,直接为机器人生成动作。
英伟达同样将 Cosmos 3 开源,包括模型、数据和训练方法。开发者可以用它来训练工厂机器人、服务机器人或任何需要理解物理世界的 AI 系统。
AlpaMile 2:会推理的自动驾驶模型
AlpaMile 2 是全球首个具备推理能力的自动驾驶模型。它能够实时理解路况、预测其他车辆和行人的意图,并将决策过程以自然语言形式输出。
现场演示中,搭载 AlpaMile 2 的车辆能够识别静止的前车、礼让行人、应对突然插入的车辆、避开路边停靠的货车,同时用语音解释每一步决策的原因。黄仁勋开玩笑说,如果让它一直说话,乘客会受不了,不过这种内部思考正是自动驾驶安全性的关键。
全球 80% 的汽车制造商已经采用英伟达 Hyperion 平台,97% 的出行服务公司与英伟达建立连接。AlpaMile 2 将运行在 Hyperion 运行时和 Halos 操作系统上,可以接入全球范围的服务网络。
Isaac GROOT:人形机器人开放平台
人形机器人是 AI 的下一个重要方向。不过每个研究团队都需要从零开始搭建模拟器、遥操作系统、数据流水线和训练基础设施,耗费数月时间才能开始真正的研究。
英伟达 Isaac GROOT 是一个完全开放的人形机器人开发平台。它包含仿真环境 Isaac Lab、遥操作系统 Isaac Teleop、基于 Omniverse 和 Cosmos 的合成数据生成器、策略训练与评估系统 Isaac Lab Arena,以及运行在 Jetson 和 Thor 芯片上的部署框架 Isaac ROS。
GROOT 平台的所有模块都开放,开发者可以使用英伟达提供的组件,也可以替换成自己的方案。
英伟达还推出了基于 GROOT 平台的参考人形机器人。它高约 1.8 米,重约 68 公斤,每只手有 25 个自由度,全身共 31 个自由度,由夏普制造。机器人运行 Thor 芯片和完整的英伟达软件栈,可以直接用于学术研究和工业开发。黄仁勋自嘲这个机器人的身高和体重跟自己差不多。
企业 AI Agent 工具包:每家公司的专属 Agent
黄仁勋在演讲中提出了一个核心判断:每家公司都会成为 Agent 公司,每家公司内部都会有 Agent 在运行。Agent 不是要取代现有软件公司,反而会创造有史以来最大的商业机会。
英伟达企业 AI Agent 工具包包含四个部分:大模型、控制框架、工具和技能、运行时。模型方面,企业可以使用 Nemotron 3 Ultra 等开源模型进行微调。控制框架方面,英伟达 Open Shell 是一个开源的安全沙箱,保护 Agent 的隐私、权限和身份。
工具和技能方面,CUDA X 库现在可以作为技能被 Agent 直接调用。过去二十年英伟达积累的数千个加速库覆盖了计算光刻、决策优化、稀疏求解器、微分物理、基因组学等几乎所有科学和工程领域。Agent 使用这些库的效率甚至超过人类。
运行时方面,整个工具包针对英伟达 AI 平台进行了优化,可以在任何云端、本地服务器甚至边缘设备上运行。
Cadence 已经利用这套工具包构建了芯片设计超级 Agent。过去需要数周的 RTL 验证周期现在缩短到几小时,验证速度提升了四十倍。
AI 工厂基础设施:从芯片到电网的全栈方案
AI 工厂是当前全球最大的基础设施建设浪潮。到本十年末,将有 100 吉瓦的 AI 工厂上线。单个吉瓦级 AI 工厂的投资已经达到 500 亿到 600 亿美元,未来将达到 800 亿到 1,000 亿美元。
英伟达 DSX 平台提供了 AI 工厂的完整蓝图。从 DSX SIM 开始在 Omniverse 数字孪生中进行设计和验证,规划布局、模拟电力和冷却、设计网络,到 DSX OS 接管后的配置、运营、监控和修复,整个生命周期都被覆盖。
DSX Max LPS 技术解决了 AI 工厂的电力效率问题。传统工厂过度配置电力高达 40%,DSX Max LPS 允许运营商在相同电力预算内安全部署更多 GPU。45 摄氏度热液体冷却比传统方案使用更少的水和能源。
动态电力分配将电力从闲置机架导向工作机架,机架内电力平滑化抑制峰值电流。DSX Flex 还能读取实时电网信号,在电网需要时动态调整工厂功耗,让 AI 工厂成为灵活的能源资产与电网协同运行。
Agent AI 正在改变计算的一切
整场演讲贯穿着一个清晰的逻辑:Agent AI 的到来正在改变计算的每一个层面。
在应用层面,用户不再需要点击和打字来使用软件,取而代之的是向 AI 表达意图,AI 自动生成代码或调用工具产生输出。在系统层面,Agent 变成了由模型、控制框架、工具和运行时组成的复杂结构。在芯片层面,CPU 不再是为人类租用设计的,而是为纳秒级响应的 Agent 重新构建。
总的来说,Vera Rubin 的全面投产、Vera CPU 的发布、RTX Spark 对 PC 的重定义、Nemotron 和 Cosmos 等开源模型的推出,以及 Isaac GROOT 对人形机器人的开放,所有这些产品和服务共同构成了 Agent AI 时代的基础设施。
在演讲最后,黄仁勋感谢了中国台湾地区供应链合作伙伴二十多年来的支持。从 PC 时代的 Windows 95 到今天的 Agent AI,计算机行业正在经历又一次重大变革,英伟达和它的伙伴们已经为此做好了准备。最后是一则动画歌曲,里面再一次展示了黄仁勋喜欢的台湾夜市。
参考资料:
https://www.nvidia.cn/gtc/taipei/keynote/
热门跟贴