Web3SkyCity.AI
NVIDIA GTC 台北2026:智能体时代的算力革命与 AI 工厂
在 2026 年6月1号的台北,英伟达(NVIDIA)创始人兼首席执行官黄仁勋回到了他的家乡,不仅带回了他的父母,更带来了一场重塑全球计算产业的革命性演讲。在这一次的 GTC 大会上,黄仁勋正式宣告:人工智能已经跨越了简单的生成式阶段,全面进入“智能体时代”(Agentic AI)。这不仅仅是技术的更迭,更是一场从数据中心到底层架构,再到个人电脑与物理机器人的全栈式范式转移。
目录
全局摘要和核心观点
智能工厂:Tokens 开启的新前沿
台湾生态系统:从供应链到 AI 工厂
实用 AI 与智能体:重塑生产力
智能体计算模型与工具使用
Vera Rubin 与 AI 工厂蓝图
算力经济:买得越多,赚得越多
Vera CPU:专为智能体打造的“指挥家”
企业级 AI 工具包与 Nemotron 模型
RTX Spark:重塑个人电脑产业
物理 AI 与机器人:Cosmos 3 与 Isaac Groot
总结:迈向下一个飞跃
全局摘要
在本次 GTC Taiwan 主题演讲中,NVIDIA 创始人兼首席执行官黄仁勋(Jensen Huang)宣布了 AI 产业的重大转型——从生成式 AI 迈向智能体 AI(Agentic AI)时代。演讲涵盖了从数据中心到个人电脑的全栈创新,包括新一代 Vera Rubin 架构、首款为智能体设计的 Vera CPU、重构个人电脑的 RTX Spark 平台,以及面向物理 AI 的 Cosmos 3 模型,强调了台湾生态系统在这一全球基础设施建设浪潮中的核心地位。
核心观点
- 实用的智能体时代到来
:AI 已经从简单的问答演变为能够观察、推理、规划并使用工具执行复杂任务的智能体,这将带来数倍的生产力提升。
- 算力即营收
:在 AI 工厂时代,每一个生成的 Token 都是利润单位,单位瓦特的吞吐量直接决定了企业的收入。
- Vera Rubin 架构与定制 CPU
:Vera Rubin 是首款专为智能体时代打造的多机架集群超级计算机,而 Vera CPU 则打破了传统 CPU 为人类设计的逻辑,专注于为智能体提供极低延迟与极高带宽。
- 重塑个人电脑 (PC)
:与 Microsoft 合作推出的 RTX Spark 将 PC 转化为个人 AI 智能体终端,标志着 40 年来计算平台的首次彻底重塑。
- 物理 AI 与 Cosmos 3
:通过 Cosmos 3 和 Isaac Groot 平台,NVIDIA 正在解决物理 AI 数据稀缺的问题,推动通用人形机器人进入现实世界。
01
智能体:重塑生产力的全新计算范式
黄仁勋在演讲开篇便抛出了一个震撼的数据:全球三四千万名软件工程师创造了约 3 万亿美元的薪资价值,并带动了 100 万亿美元的全球产业。而现在,智能体的介入让这一产出曲线发生了斜率突变。“实用的 AI 已经到来。在 2026 年的头几个月,代码提交量几乎翻了三倍,这意味着我们用同样的薪资成本创造了三倍的生产力”。
他详细定义了“智能体”的结构:它不再是单一的大型语言模型,而是一个由执行框架、工作记忆、长期记忆和工具链组成的复杂系统。智能体能够像人一样思考、观察环境、制定计划并调用各种工具。黄仁勋强调,“未来将会有数量庞大的智能体,世界将不再受限于人口数量,这些智能体将比以往任何时候都更频繁地使用各类工具”。这种转变意味着软件公司不会倒闭,反而会因为智能体对工具的极度渴求而迎来爆发式增长。
02
算力经济学:每一瓦电力都是利润
在黄仁勋的视野中,未来的数据中心不再只是存储数据的机房,而是“生产智能”的工厂。他提出了一个极具商业洞察的观点:“算力即营收,算力即利润。在 AI 工厂里,每一个生成的 Token 都是可以计量的盈利单位”。
这一逻辑彻底改变了数据中心的建设标准。过去,人们关注芯片的单价;而现在,效率和吞吐量才是核心。“如果你拥有一吉瓦的电力,单位瓦特的吞吐量就是你的收入。仅仅因为芯片更便宜而选择错误的架构,是无法转化为效益的。买得越多,赚得越多”。为了支撑这种高强度的智能生产,英伟达推出了 DSX AI 工厂蓝图,通过数字孪生技术,在破土动工前就完成电力、散热和网络部署的模拟。黄仁勋指出,到本十年末,全球将有 100 吉瓦的 AI 工厂上线,而英伟达的目标是确保每一瓦电力都能发挥出最高效的代币生成能力。
03
Vera Rubin 与专为智能体打造的 CPU
作为全场关注的焦点,新一代 Vera Rubin 架构正式亮相。黄仁勋强调,这不仅仅是一个图形处理器(GPU),而是一个专为智能体时代打造的多机架集群超级计算机。“Vera Rubin 是我们公司历史上最雄心勃勃的壮举,它是首款专为处理智能体循环而构建的系统”。
为了解决智能体在调用工具时的延迟瓶颈,英伟达推出了具有革命意义的 Vera CPU。黄仁勋直言:“过去所有的 CPU 都是为人类构建的,人类习惯于秒级的响应;但智能体是不耐烦的,它们生活在纳秒的世界里”。Vera CPU 采用了全新的 Olympus 内核,拥有世界级的单线程性能和超高的内存带宽。它不再追求传统意义上的核心租赁,而是专注于协调 GPU、管理内存缓存以及极速启动各种 AI 工具。“CPU 现在是指挥家,而 GPU 是管弦乐队。Vera CPU 的出现,是为了确保智能体的思考和执行过程不被任何环节阻塞”。
04
RTX Spark:重塑个人电脑的 40 年
在消费电子领域,黄仁勋宣布与微软深度合作,通过 RTX Spark 平台重塑个人电脑。“Windows 95 让 PC 实现了个人化,而 40 年后的今天,我们将彻底重塑 PC 的运作方式”。
RTX Spark 笔记本电脑搭载了集成 20 核 Grace CPU 和 Blackwell GPU 的 SoC 芯片,具备惊人的 AI 算力。黄仁勋演示了一个场景:一个运行在本地的智能体通过简单的草图和提示词,自主在专业建模软件中完成房屋设计、结构优化并生成渲染图。“未来的 PC 将不再是点击和输入的工具,它会变成一个 24 小时运行的个人助手,它了解你的需求,能够观察、协助并为你做研究”。他预言,未来每个家庭可能都会拥有一台运行各种智能体的 AI 超级计算机,它对人类生活的意义将如同当年的智能手机。
05
物理 AI:通用机器人的黎明
演讲的最后,黄仁勋将目光投向了物理世界。他认为,物理 AI 是目前最具挑战性的领域,核心困难在于数据的稀缺。“语言模型有互联网数据,但要让机器人学会动作,必须从机器人的第一人称视角获得数据”。
为此,英伟达发布了 Cosmos 3 物理 AI 基础模型,它能够理解物理规律、生成合成视频并进行闭环仿真。通过“计算即数据”的思路,英伟达正在利用 Omniverse 模拟器大规模生成训练数据。同时,参考人形机器人 Isaac Groot 的发布,标志着英伟达已经打通了从模型训练、数据生成到硬件运行的全流程。“人形机器人是 AI 的下一个大飞跃。我们构建了一个开放平台,让全世界的研究人员都能在这个基础上开发属于自己的机器人”。
06
结语:一个全新的起点
从台北出发,黄仁勋向全球科技界展示了一个由智能体驱动的未来。在这个世界里,计算不再是昂贵的支出,而是创造财富的生产线;PC 不再是冷冰冰的机器,而是数字化身的承载者。正如他所言:“计算机行业已经彻底改变了,明年将会更加精彩”。随着 Vera Rubin 全面投产,智能体时代的大幕已经正式拉开,而英伟达正站在这个新纪元的最前哨。
完整访谈
天空之城全文| NVIDIA GTC 台北2026:智能体时代的算力革命与 AI 工厂
智能工厂:Tokens 开启的新前沿
旁白
这就是智能的创造方式。一种全新的工厂。
Tokens 的生成器,即 AI 的构建基块。Tokens 开辟了新的前沿,将数据转化为知识、推理和行动。
它们揭示了复杂性中的模式。我们此前从未见过的模式。映射我们的城市以保障我们的安全。
并将我们带向更高处。
并将我们带向更高处。
Tokens 助力机器人向我们学习。
与我们并肩工作。
它们去往我们无法企及之地。
它们去往我们无法企及之地。
并非如此。为我们提供助力,伸出援手。
缩短希望与疗愈之间的距离,让我们能更轻松地呼吸。让幼小的心灵跳动得更加强劲。Tokens 正在帮助我们开辟新的领域。以一种从未尝试过的规模。
因此我们能够抵达 Star Cloud One,分离确认,奔向无限,超越无限。我们共同迈向下一个伟大的飞跃,奔向一个为全人类而构建的光明未来。而这一切,始于 Taipei。
台湾生态系统:从供应链到 AI 工厂
主持人
女士们、先生们,女士们、先生们,欢迎来到 NVIDIA,创始人黄仁勋,有请 NVIDIA 创始人兼首席执行官 Jensen Huang 上台。
黄仁勋
大家好。欢迎参加 GTC Taiwan。
很高兴见到大家。回到家感觉真好。我把我的父母带回家了。我的父母在哪里?请大家为我的父母鼓掌。
再为我的父母鼓掌。
也为我们的赛前表演嘉宾 Superstars 鼓掌,女士们、先生们。看看他们有多可爱。台湾的超级巨星们。今天这里有这么多人在场。
我们目前正向其他 70 个观看派对进行同步转播,遍布台湾各地。70 场不同的会议正在同时进行。大家都在观看这场主题演讲。我们有太多的内容要告诉大家,也有太多的合作伙伴需要感谢。我们在台湾的生态系统发展得如此庞大,简直令人难以置信。
大多数时候,当人们想到生态系统时,他们想到的是我们的软件栈,他们想到的是在 Nvidia 构建的计算系统之上的开发者生态系统。但 Nvidia 的生态系统涵盖了从台湾所有上游供应链——一切的起点,一直到下游的数据中心,最终触达终端用户的全过程。今天,我们将讨论几乎所有的生态系统。有太多人需要感谢。我热爱这里的生态系统。
这里有太多的公司,还有一些我喜爱的生态合作伙伴,以至于我甚至记不清了。抱歉。太多了。太多了。
台湾丰富的生态系统,这个生态系统。
最丰富的生态系统。最丰富的生态系统。最佳供应链生态系统。不可思议。那么,感谢大家今天来到这里。今年,我们的业务正在共同实现令人难以置信的增长。
事实上,昨晚有人告诉台湾的年度 GDP 增长率将接近 10%。不可思议。不可思议。
实用 AI 与智能体:重塑生产力
好了,我们有很多内容要谈。我们开始吧。两年前,当我在这里时,我开始向大家探讨 AI 是如何从生成式 AI 演变,以及即将到来的其他 AI 浪潮。下一波 AI 浪潮是代理式 AI。今天,我们可以说代理式 AI 已经到来,实用的 AI 已经到来。
那么,这意味着什么呢?这是 GitHub。当然,代理式 AI 最早的应用场景之一就是软件编码。这是最有价值的职业之一,拥有极其庞大的生态系统。全球有 3000 万到 4000 万名专业软件开发人员,可能还有另外几亿名学生和爱好者等等,但可以说全球有 3000 万到 4000 万名软件开发人员是以编程为生的。而这代表了他们中的大多数。
这是 GitHub。拉取请求(pull request)是指他们下载软件并进行修改,而提交(commit)则是指他们将其推送回去。
明白吗?如果观察一下,2023 年的提交次数是 3 亿次。
2024 年是 4 亿次,2025 年是 5 亿次。提交次数。
在 2026 年的最初几个月里,这一数字几乎翻了三倍。
那么,这意味着什么呢?3000 万名软件开发人员创造了约 3 万亿美元的 GDP,他们每年获得的薪资总额为 3 万亿美元,这为其他行业带来了经济增长。
可以说,价值 100 万亿美元的全球产业受到了这 3 万亿美元薪资的影响或由其带动。
那 3 万亿美元,抱歉,那 3 万亿美元的薪资现在创造出的产出几乎是原来的三倍。
实际上,这相当于用 3 万亿美元的薪资成本创造了 9 万亿美元的生产力。
这有道理吗?这种差异极其惊人。这就是潜力所在。这就是 AI 的愿景。软件工程师的人数实际上正在增加。人们谈论 AI 会减少就业岗位,这完全是无稽之谈。这促使了更多软件工程师被录用,原因非常简单。如果你能雇佣一名软件工程师并创造出价值 9 万亿美元的生产力成果,你为什么不想雇佣更多的软件工程师呢?
如果那条曲线是平坦的,那么人们显然会减少软件工程师的招聘。但正因为产出如此惊人,人们才想要雇佣更多的软件工程师。这在不久的将来会以某种方式在我们的经济中显现出来。
所以,首先一点是:实用的 AI 已经到来。那么,从行业的角度来看,这意味着什么呢?从行业的角度来看,这意味着 Tokens 现在需求非凡,因为如果你能做到这一点,你就会想要生产更多。并且因为 Tokens 现在是盈利单位。Tokens 现在是创收的盈利单位。因为现在有利可图,AI 公司想要构建更多的 token,生成更多的 token,建设更多的 AI 工厂,这就是台湾地区算力需求激增的原因。
这正是你们大家如此忙碌、业务如此兴隆的原因。事实上,这在你们的部分股票价格中已经有所体现。算力模式已经改变了。一切都变了。所以第一个观点是:实用的 AI 已经到来。AI 现在是利润的创造者。AI 现在是 GDP 的创造者。在这背后,是一种全新的计算模式。不仅仅是大型语言模型,而是智能体。今天,我们要讨论的几乎所有内容都将基于此。
智能体计算模型与工具使用
那么,请允许我花点时间向大家展示我所指的内容。在这里面,这是一个智能体。它是一个智能体应用程序。在过去,这会是应用程序,这会是代码,而这会是操作系统。应用程序,在应用程序内部运行的代码,以及在操作系统内部。而今天,它是智能体,由一个或多个大型语言模型构成,它们驻留在一个执行框架内,该框架协助并编排它们去完成生产性工作。这是输入。
当输入进入时,它必须进行理解、观察、推理、行动并使用工具,该工具可以是电子表格、网页浏览器、数据处理引擎或数据库引擎等。
这是经过编排的,这一执行框架在每次涉及处理上下文、理解正在发生的事情、推断后续行动、制定可付诸实施的计划时,都会对信息流向进行编排,这一编排路径是由某种软件来控制的。因此,这从根本上就是一个智能体。
它处理被称为工作记忆的短期记忆,以及长期记忆,就像我们人类一样,我们也拥有长期记忆。所以内存管理系统极其重要。整个系统被称为智能体。大语言模型被用来进行思考,而支撑框架则将一切连接在一起,就像操作系统一样。
明白了吗?这就是新的计算模型,这就是智能体。它能够完成不可思议的事情。这就是重大的突破。大语言模型能够出色地进行思考、推理、规划和使用工具,再加上我们现在拥有了管理记忆和调度工具的支撑框架,这几者的融合促成了这一切。我们现在可以完成惊人的事情。
让我给你们举几个例子。这是一个提示词。这就是那个提示词。这是生成的代码。然后就输出了这个。这是输入。这是输入。这就是输出。大家觉得怎么样?
非常神奇,我们这里使用的是 cloud code,但 code exit 也表现得非常出色。
这是另一个例子。这是输入内容。创建一个 GIF,NVIDIA,黑色背景上的绿色散点,形成台北 101 大楼,变形为 GTC, Taipei, 2026,再变形为 Nvidia I logo,然后散开并循环。你刚才看到了。这就是提示词。
这是下一个例子。我弄丢了遥控器的电池盖。它长这样。创建一个 CAD 文件。它使用一种工具,创建一个 CAD 文件,准备好进行 3D打印,从而创造出一个全新的产品。这合理吗?
这正是新的计算范式。过去我们习惯启动应用程序、点击并输入,而现在我们取而代之的是向 AI 解释我们的需求和意图,由 AI 生成代码或使用工具,并产出必要的成果。这就是未来计算机的工作方式。这就是 Agentic AI。两年来,我们一直朝着这个目标努力,现在它已经成为现实。
当然,目前的重大突破之一就是工具使用。很多人都说,Jensen,AI 时代即将来临,Agentic AI 时代即将来临。因此,所有的软件公司都将面临倒闭。我说过,事实恰恰相反。
因为未来将会有数量庞大的智能体(agent),世界将不再受限于人口数量。
因此,这些智能体将比以往任何时候都更频繁地使用各类工具。对于软件公司而言,这实际上是一个不可思议的时代。但软件必须以智能体能够使用的方式呈现给它们。这是一个巨大的突破。
事实上,我们需要呈现给智能体的内容。正如你所知,所谓的 Nvidia 宝藏,其实就是我们所有的 CUDA 库。我称它们为 CUDA 库。这就是 Nvidia 的宝藏。今天,我们现在能够将这些 CUDA-X 库提供给智能体使用,它们能比人类更有效地运用这些库。因此,现在是 CUDA-X 库发展的绝佳时期。
让我们来看一看。多年前,我们构建了 CUDA,这是一个用于加速计算的单一架构。我们重塑了计算。上千个 CUDA-X 库正在帮助开发者在科学和工程的各个领域取得突破。CUDA-X 库是智能体的工具。用于计算光刻技术的 cuLitho。用于决策优化的 cuOpt。
用于直接稀疏求解器的 cuDSS。AIQ 用于对结构化和非结构化文档进行深度研究。用于 AI-RAN 的 Aerial。用于可微物理的 Warp。
用于基因组学的 Parabricks。它们的基础是算法。
而且它们很美。我不知道。我不知道。我不知道。我不知道。我不知道。你知道。我要为数学献上一轮掌声。
数学是美的。计算模式,软件的计算模式即将发生改变。事实上,让我们回到这一点。这就是 Agent。它是终极的解耦与分布式计算模型。为了处理这个 Agent,将有如此多不同的计算机被激活。Agent 由模型、工具链、工具与技能,以及运行时组成。
所有这些都在数据中心的不同位置运行。你可以把模型看作大脑。
把驱动框架看作身体,它所使用的工具在运行时环境下工作,就像一个车间。
所以这就像一个人,一名在车间里使用工具的工人。当然,这一切都是在极大规模下完成的。每一个步骤都在计算机的不同部分运行。你可以看到大型语言模型正在思考。处理上下文、观察、理解环境、推理、制定计划并执行该计划。每一次发生这种情况,整整一个机架的 Grace Blackwell NVLink 72 都会被激活。它正在用大型语言模型进行思考。
每当使用一个工具时,都会用到 CPU。该工具可能是 C 编译器。可能是 Python。也可能是 JavaScript。
亦或是加速计算。当下的智能体是相对简单的工具使用者。未来,它们将成为非常复杂的工具使用者,这也是我向你们展示的 CUDA-X 库将会受到智能体极度青睐的原因。它们解决了当今世界所知的最重要的一些问题。
并且我们所有的 CUDA-X 库现在都将配备 AI 可以学习使用的技能。因此,CUDA-X 库加上一些技能,基本上就是一本手册,AI 阅读后会说,啊,原来是这样使用的。智能体使用这些库的能力将是不可思议的。因此,这些工具在 CPU、GPU 和大语言模型上运行。
安全防护层在 CPU 和名为 DPU(即 NVIDIA 的 BlueField)的安全处理器上运行。所有这一切的编排均在 CPU 上运行。这是整个防护架构,而 CPU 负责编排所有工作。最困难的部分之一是内存。
你可以试想一下。工作内存被称为 KV cache。要记住什么?如何紧凑化(不只是压缩),以及如何检索?你是检索结构化数据吗?你是检索非结构化数据吗?你是将其所有这些不同的数据检索至其自身吗?整个处理过程极其复杂。AI 的内存系统将彻底改变现有的存储系统。
正如你所见,这种计算模型、这种计算模式以及这种被称为 agent 的新应用的方方面面,都与过去应用程序的运行方式有着本质的区别。大量的软件驻留在二进制文件中,驻留在操作系统内部。这正是我们构建下一代产品的核心原因:解决这种解构式、分布式、异构化的计算问题。
Vera Rubin 与 AI 工厂蓝图
Vera Rubin 不仅仅是一个芯片。
Vera Rubin 不仅仅是一个 GPU。它始于 GPU,但不仅限于此。但 Vera Rubin 非常惊人。一切始于 GPU。不可思议。整个系统核心是 Vera Rubin。从始至终贯穿全局。
它配备了 GPU、Vera Rubin 和 NVLink,以及 72。
它由我接下来要详细介绍的 Vera CPU 协同调度。存储系统实现了革命性的飞跃,Vera 配合 CX9、我们的软件栈 Doca,以及内置的安全处理器,确保一切数据皆可加密。无论数据处于静态、传输中还是使用中。由于 AI 模型极其珍贵,整个系统的每个环节都受到安全保护。这就是整个系统遵循机密计算的原因。
这些系统中的每一个单独拿出来,都将是一场彻底的革命。Vera Rubin 是我们公司历史上最雄心勃勃的壮举。整个公司致力于在所有 40,000 名工程师中推动 Vera Rubin 项目。更不用说在座的各位了。你们所有人都参与了整个系统的创建。Vera Rubin 确实是一个奇迹,它不仅仅是一艘飞船。而是如此之多。甚至远不止于此。
很久以前,Nvidia 曾经是一家 GPU 公司。
但多年来,我们已经进化成为一家系统公司。
你们现在看到的正是这一点。这是有史以来设计的最复杂、最底层且最复杂的系统。但归根结底,我们的客户和合作伙伴并不想购买计算机。他们想要构建 AI 工厂。这就是 NVIDIA 真正开始再次自我转型的原因。
你可以看到,我们众多的技术目前都已达到整个基础设施的规模。我们的合作伙伴也处于基础设施规模。发电机、冷却系统、电网供应商,如此多的工业公司现在都是我们生态系统的一部分,因为归根结底,我们正试图构建整个技术栈,就像 GPU 一样,就像我们在构建 Grace Blackwell NVLink 72 时那样,也正如现在所做的那样,我们正在构建一个全栈系统,以便我们的客户能够构建出令人惊叹的 AI 基础设施。
让我们来看一下。世界正在竞相建设 AI 工厂,这是人类历史上最大规模的基础设施建设。AI 工厂在每一个层面都极其复杂。芯片、机架、网络、电力、散热、电网,必须进行端到端的协同设计,因为计算即营收。Nvidia DSX 是构建和运营 AI 工厂的蓝图,即一套参考设计。旨在实现最高效率与盈利能力。
这始于 DSX-Sim。借助 DSX-Sim Omniverse Blueprint,合作伙伴可以在安装第一个机架之前,先行设计并验证 Nvidia Vera Rubin AI 工厂。他们规划布局。模拟电力和散热系统。设计网络。验证每一项集成。在数字孪生中测试每一次变更。
工厂启动。DSXOS 接管预留、运行、监控并修复基础设施。将已安装的系统转化为可信赖的、多租户的、弹性且具备 AI 就绪能力的算力资源。如今的 AI 工厂电力过度配置高达 40%。DSX Max LPS 让运营商能在相同的电力预算内安全部署更多的 GPU。从而增加数十亿美元的年收入。突破性的 45 摄氏度高温液冷技术减少了水资源和能源的消耗。让更多的电力用于产生收入的计算任务。
令人难以置信。动态功率分配可将电力从一个机架引导至另一个机架,回收闲置瓦特,并将其输送到工作负载所在的位置。机架内电力平滑,能够消除峰值电流尖峰和电涌。在整个工厂中,AI agent 团队与 DSX Max LPS 协作,持续协调以平衡冷却和电力,从而满足工作负载需求。DSX AI 工厂是灵活的能源资产,能够与电网协同运作。DSX flex 可以读取实时电网信号,并在电网需要减压时动态调整工厂电力。
到本十年末,将有 100 吉瓦的 AI 工厂上线。
NVIDIA DSX AI 工厂以最高效率运行,能够以最低成本生成 token,并增强电网的稳定性。
我曾向大家展示过过去的生态系统幻灯片,其中 NVIDIA 的计算层、软件以及计算栈被集成到他人的平台、第三方平台和市场服务库中。那是一个计算生态系统。这是一个 AI 工厂生态系统。这在你们所有人的下游。
我的上游是你们所有人,而我们的下游就是这个生态系统。因为归根结底,我们不仅是在制造 GPU,也不仅是在构建系统,我们是在帮助客户建设这些 AI 工厂,即那些极其复杂的 AI 基础设施。
每一个千兆瓦级别的项目起步成本就是 200 亿到 300 亿美元。
现在已经达到 500 亿到 600 亿美元,很快每千兆瓦的成本将达到 800 亿甚至 1000 亿美元。向一座 AI 工厂投入 1000 亿美元。它必须一次运行成功,并且必须立即投入使用。其资本成本高得惊人。其复杂程度也高得惊人。正如你们所见,我们过去是在电脑里设计芯片。后来,我们在电脑里模拟整个系统。而今天,你们刚才所看到的,一切都是在 Omniverse 中构建完成的。我和大家一起使用 Omniverse 已经很长一段时间了。这梦想成真了,使我们能够在数字框架、数字模拟器以及数字世界中构建这些规模宏大的系统,远在正式破土动工和投入资金之前即可完成。
这就是我们的生态系统。我们称之为 DSX。RTX 是针对我们的 GPU。DGX 是针对我们的系统,而现在的 DSX,基本上就是基础设施。正是因为我们在这里所做的工作,横跨了整个技术栈,包括我们的系统和软件,才使得我们能够与小型公司合作,并助力它们成为世界级的 AI 云服务商。我接下来要向大家展示的每一家公司在不久前都还是小型公司,而现在 CoreWeave 的估值已达到 500 亿、600 亿、700 亿美元,并且还在以惊人的速度增长。最近我们与 Nebius 进行了合作,同样,他们也正在以惊人的速度增长。这些云服务商每一家都有着令人瞩目的客户。
软件编程公司 Cursor、Black Mountain Labs、图像生成公司、World Labs、世界基础模型、领先的金融服务 AI 公司 Revolut 以及 Shopify。这是又一家公司。这是 N-scale,他们的客户包括 British Telecom、Google;Google 正在使用我们的其中一个 AI 云,Thinking Machines 是一家 Frontier Labs 旗下的公司,这非常令人兴奋。
这是韩国的 Naver Cloud、Bank of Korea、Hyundai,有这么多不可思议的公司。
这是印度的一家公司,Yoda,非常出色的公司。这是一个位于新加坡、在澳大利亚进行建设的项目,还有 Together AI,以及新加坡的项目。这是印度尼西亚的一个项目。这些公司中的每一家,每一家公司,都在服务于区域及全球客户。AI 将会在各个地方运行。每家公司都将由它驱动。每个地区都将构建它。这是印度尼西亚的 Indosat。这是台湾的 GMI。
这是台湾的 GMI。鼓掌是可以的。
所以,这些令人难以置信的公司,有着令人难以置信的机会,但它们都需要几样东西。当然,它们需要计算栈。这整个底层的技术栈。这就是让 NVIDIA 成名的原因。我们所有的硬件、软件和库,以及我们与全球第三方开发者生态系统的连接,使得任何人都有可能建立起一个 AI 云。
然而,如今的 AI 云非常复杂。这是软件版本。这是计算机科学版本。这是财务版本。资产版本就是我之前向你们展示的那样。这是一个巨大的工厂。仅拥有这种能力是不够的,这就是 Nvidia 成为一家 AI 基础设施公司的原因。如今,把这件事做好,并极其擅长帮助客户构建 AI 工厂并部署 AI 工厂,显得至关重要。
算力经济:买得越多,赚得越多
其原因如下。算力即营收。算力即利润。缺乏营收和利润即为亏损。因此,必须意识到这就是一个 AI 基础设施上线的案例,它可能上线得很快,也可能需要一段时间;它的吞吐量可能很高,也可能很低;它的弹性和可靠性可能很好,也可能很差;其有效寿命可能很长,也可能很短。因为这代表了 500 亿、600 亿,乃至将要达到 1000 亿美元的规模,所以这条曲线至关重要,这条曲线影响巨大。
这就是 Nvidia 成为如此出色的合作伙伴的原因。与我们合作,得益于我们全面集成的能力,我们所提供的不仅仅是一份 PowerPoint 演示文档。我们构建了完整的底层基础设施。我们将一切连接在一起。我们亲手打造了数十亿计的组件,以确保一切运作良好。因此,我们的首字延迟、首次推理时间以及训练启动时间都大幅缩短。
其次,得益于我们世界领先的单位瓦特吞吐量及单位瓦特 Token 处理能力。其原因在于我们将所有环节进行集成,从底层开始全面设计,对整个系统进行仿真,并采用了极致的协同设计。正如我刚才向大家展示的 Vera Ruben Rack 一样,一切设计旨在实现这种卓越的吞吐量。如果你的数据中心或工厂拥有 1 吉瓦的电力,它不会再有更多。1 吉瓦就是 1 吉瓦。你所能完成的发电量就只有这些了。
如果你拥有一吉瓦的电力,那么单位瓦特的吞吐量就是收入。
因为每一个 Token 都是盈利的。每一个 Token 都是收入。这就是未来。算力即收入。单位瓦特的性能就是你的收入。仅仅因为芯片更便宜而选择错误的架构,是无法转化为实际效益的。这在逻辑上是不通的。你需要确保你的单位瓦特收入是多少?
买得越多,赚得越多。
那么,是以什么为单位的 Token?那么,是以什么为单位的 Token?
最后,非常轻松地,第二,第三点是可靠性。如果你有机会参观这些数据中心,你会发现那里有无数的运动部件和数以百万计的线缆。让所有这些计算机和谐协同工作的能力,其可靠性极低。这极其困难。我们进行超大规模运营已经有很长一段时间了。这种经验至关重要。这就是差异所在。意思是,中断之间的间隔时间,这极其重要。
最后一点,这非常困难。
这些系统的生命周期,这些系统的生命周期,软件一直在不断变化。四年前,也就是在 Hopper 的时代,AI 已经彻底改变了。六年前,这是 Ampere 的时间框架。AI 已经彻底改变了。我们起初谈论的是 CNN。而现在我们处于这个阶段。接着我们谈论了 transformers。然后我们谈论了 mixture of experts。现在我们谈论的是 agentic systems。每一个世代,每隔几个月,软件行业就会涌现出新技术。如果你的架构缺乏灵活性,如果你的生态系统不够丰富,那么这条曲线就不可能长久。你无法预测你的系统能持续多久。
但我可以。Nvidia 系统遍布世界各地。软件开发者从 Nvidia CUDA 开始。因此,根据定义,其生命周期、生态系统以及有用资产的存续时间都会长得多。其区别本质上在于成本。你可以将其视为收入,但收入的另一面是成本。如果资产的生命周期不长。那么总拥有成本(TCO)就很低。这就是区别所在。这就是算力呈现出的样子。买得越多,赚得越多。
赚得越多。
现在,你们所有人都正在与我一同经历这一切。难道不是吗?你们所有的需求。你们的工厂正在全力运转。你们的人民在整个台湾地区都在努力工作,因为每个人都想赚钱。他们意识到 AI,即实用的 AI,已经到来。盈利的 AI 已经到来。算力。需求高得惊人。而算力需求正是制约因素。
因此,让我们加倍努力,助力全球构建 AI。
各地的工厂。这就是为什么它如此重要。我感到非常高兴。我正站在你们面前。
Vera Rubin 正处于全面生产阶段。
Vera Rubin 正处于全面生产阶段。我们为 Vera Rubin 创建的供应链规模是 Grace Blackwell 的两倍。没错,这太不可思议了。过去组装一个 Grace Blackwell 机架需要两个小时,现在只需要五分钟。因此,不仅容量更高,吞吐量也快得多,我们需要这一切来满足需求。这个生态系统非同寻常,数百万平方英尺的设施已经上线以支持 Grace Blackwell,目前正在为 Vera Rubin 进行筹备和扩产。我想感谢你们所有人。Vera Rubin 现已全面投产。
谢谢。
让我们来看一下。大语言模型负责生成答案。现在 AI 智能体可以执行工作了。但处理智能体化 AI 是一个完全不同的问题。智能体通过观察、推理、规划并使用工具来运作。它们管理着海量的上下文,并在工作记忆与长期记忆之间进行调度。它们启动子智能体,即按需调用的专家。
NVIDIA Vera Rubin 是一款多机架集群规模的系统,专为处理智能体 AI 而构建,现已全面投入生产。贯穿整个供应链的制造、自动化和编排,这堪称见证了一个奇迹。我们的征程始于推出首款 AI 超级计算机 NVIDIA DGX-1。在接下来的十年里,我们将每一款芯片和系统都推向了极限,从 Pascal 和首款 NVLink,到 Grace Blackwell,再到首款机架级 AI 超级计算机。
而现在,Vera Rubin 来了,这是首款专为智能体时代打造的多机架集群规模超级计算机。一切始于 TSMC。构成 Vera Rubin 的 7 款新芯片通过数百道工艺步骤逐步成型。3 纳米工艺、CoWoS-R 和 CoWoS-L 封装、HBM 格式。来自 Micron、SK Hynix 和 Samsung。Vera Rubin 计算板。单块主板集成了 6 万亿个晶体管和超过 18,000 个组件。
Vera Rubin NVL-72 负责思考、提示词与上下文理解、推理及规划。接下来是一款全新的模块化计算机,采用了全新的 PCB 中板设计、超级芯片、Connect X9 SuperNix 以及 Bluefield 4 DPU,所有组件均原位组装且无电缆连接,以实现 AI 工厂规模下的高可靠性。包含 18 个计算托盘、9 个可热插拔的 NVLink 交换机托盘、新型高效歧管及液冷母线,承载电流超过 5000 安培,相当于 20 辆全速加速的电动汽车。总计 130 万个组件构成了这一第三代 MGX 机架设计。
祝贺 Microsoft 成功部署其 Vera Rubin NVL-72 工程机架。同时也祝贺 Dell 和 CoreWeave 成功建立各自的 Vera Rubin NVL-72 工程机架。随后是 Vera CPU 机架,在单个液冷机架中容纳 256 个 CPU,负责编排模型、调度内存以及启动工具。
在 Foxconn 和 Quanta,GB200 NVL72 正在成型。16 个托盘中集成了 256 个 GB200 LPU,提供每秒 40 PB 的 SRAM 带宽以实现超低延迟。当 NVL-72 以最高吞吐量生成 Token 时,GB200 NVL72 则以最低延迟完成生成。Vera Bluefield 4 STX,AI 的记忆存储之地。
由 Bluefield 4 加速的存储处理,连接了内存、存储和芯片内安全技术。
以及 NVIDIA Spectrum X Ethernet Photics。这是全球首款采用 200 千兆位共封装光学的以太网交换机,融合了 TSMC 的 COUPE 工艺、芯片级封装,以及磷化铟上的超高功率激光染料技术。Vera Rubin 5 连接的机架级系统,这是一款专为 AI Agent 打造的超级计算机,涵盖了台湾 150 家供应链合作伙伴,数百万平方英尺的工厂车间,数百个站点,以及将芯片、封装、系统和数据中心推向尺寸、功耗和规模极限的工程成果。这就是我们所谓的极限代码设计。
我们与台湾共同完成了这一切。我们携手重塑了 AI 时代的计算。台湾从一开始就与我们同行。今天,当我们向世界推出 Vera Rubin 时,依然如此。谢谢你,台湾。
女士们,先生们,Vera Rubin。Vera Rubin 不仅仅是为了 AI 而生。
AI。Vera Rubin 并非仅仅为了运行 AI 而构建。Vera Rubin 是为了运行智能体而构建的。这是一个智能体系统。想象一下其复杂程度。这就是为什么智能体是计算机科学的最后一次重大突破。智能体历经多年才得以实现其潜力并发挥作用。因此,运行它的计算机是世界上最先进的,这合情合理。这就是 Vera Rubin。让我们来看一下。可以请 Vera Rubin 上台吗?
谢谢。Janine,我们有那些机架和系统了吗?
看起来很重。这是 Vera Rubin。Vera Rubin NVLink 72。这是 GB200 LPU。在下一届 GTC 上,我将和大家分享更多相关内容。今天,我们要告诉大家的内容非常多。这是 Vera CPU 机架,包含 256 个 CPU,全部采用液冷散热。稍后我再详细介绍 Vera。
这是 Vera Bluefield 存储处理系统以及安全系统。
当然,还有我们的 Mellanox 网络技术,这是全球首款 CPU。这就是 Vera Rubin。令人难以置信的技术正在汇聚于此。
那么,我们在构建 Hopper 时,正如你们所知,我们构建 Hopper 是为了进行预训练。
预训练是当时我们所从事的最重要的应用,也是最重要的工作负载。后来当我们研发 Grace Blackwell 时,每个人都说,Jensen,NVIDIA 在预训练方面真的很强。推理太简单了。你还记得吗?人们过去常说推理很简单。我们也完全能做到。但正如你们所知,推理意味着金钱。而这些模型,也就是 MOE,非常复杂。要同时实现极高的响应速度、快速的交互性以及高吞吐量,是一件极其困难的事情。这就是我们创建 NVLink 72 的原因。
如今,Nvidia 的 Token 成本是全球最低的,不是降低了 10%,而是降低了数倍乃至数个数量级。这一切都归功于我们极致的代码优化。这一切都源于我们理解了计算模型以及推理的计算模式,从而能够创造出 NVLink 72。现在,随着 Vera Rubin 的推出,它已超越了推理。它现在是智能体系统中的推理。这就是 Vera Rubin。没有电缆,没有软管,没有风扇。
上次我向你们展示的时候,到处都是电缆。那些电缆看起来确实非常壮观。但现在中间有一块 PCB,它连接了双侧。过去需要两小时的工作,现在只需五分钟。Vera Rubin 的可靠性和稳健性将达到极高的水平。这是我们的 Vera CPU 托架。
这是有史以来建造的最先进的 CPU。
我马上就向你们展示这一点。只需片刻。
这是我们的存储托架。
两个 Vera CPU,四个 CX9,以及海量的软件。这是我们全新的 LPX,LPU 30,即 GB200 系统,专为超低延迟推理而设计。其吞吐量由 Vera Rubin 提供,并通过 NVLink 72 进行扩展。如果还要进一步扩展,还可以使用 GB200 LPU。这里展示的是 Vera Rubin、NVLink 以及交换机托盘。
这是位于中间的交换机,它们具有革命性意义。得益于 Vera Rubin、NVLink 72 以及我们自主研发和创造的 NVLink 交换机,还有我们用于横向扩展的以太网交换机。令人惊叹的是,我们推出了这两款系统,它们专为 Grace Blackwell 而打造。如今,Nvidia 已成为全球最大的网络公司。我为我们的网络团队感到无比自豪。这对我们所做的一切来说,都是极其重要的赋能者。
Vera CPU:专为智能体打造的“指挥家”
现在,我将与各位探讨我们将要参与的下一个重大产业。谢谢。
Janine。谢谢。
我想后面有 2,000 人在为此努力。
好的,让我们谈谈 CPU。Vera CPU。
专为 AI 时代打造的 CPU。迄今为止所有的 CPU 都是为人类而创造的。我们曾是用户。我们曾是用户。我们曾是租用者。我们使用 CPU 的方式,生活在一个以秒计算的世界里。我们在云端租用 CPU 的方式是:你拥有的 CPU 核心越多,能租用的就越多。旧时代的经济模式、旧时代的用例、旧时代的 CPU,以及旧时代 CPU 的经济性,与智能体有着根本上的不同。
智能体是不耐烦的。
它们所处的世界不是以秒为单位的。它们所处的世界是以纳秒为单位的。
当它使用工具时,它希望响应时间尽可能快。
当它访问数据库时,它必须尽快得到返回结果。
智能体等待的每一刻,都会阻碍它进行下一步、下一步、下一步、下一步。
至关重要的是,我们要让 CPU 尽可能降低延迟,尽可能提高交互性。
因此,我们为人工智能时代打造了 Vera CPU。现在,在我们的系统中,它有三种不同的用途。
第一种方式,当然是用 Vera Rubin 进行思考。在 Vera Rubin 机架内,已经配备了两个 CPU。如你所知,我们正在制造并销售数百万台 Vera Rubin。我们已经售出了数百万台 Grace Blackwell。Nvidia 现在已经是全球最大的 CPU 制造商之一。
在 Vera Rubin 机架中配备了两个 CPU。其中一个用于协调和管理 GPU、管理 KV cache,并处理机架内运行的所有软件。
我们还有用于安全和隔离的 Grace Bluefield。Vera 计算单元用于支持 AI 模型的调度与编排、工具使用以及数据库访问。
数据服务器就在这里,即 Vera Bluefield。这是世界上有史以来打造的最快存储系统、最快的存储服务器。之所以如此关键,是因为智能体(agents)访问内存的速度快得惊人。这些系统,即存储服务器和 CPU,现在已成为数据中心中最昂贵部分的必要路径。
这一部分最昂贵是有充分理由的。AI 工厂的经济学即 Token 的经济学。而 Token 正是在这里被创建出来的。因此,你当然希望制造并生成尽可能多的 token。这就是你投入所有经济考量的地方。而且这必须不能成为阻碍。
Vera CPU 对 CPU 架构施加了巨大的压力,这就是我们从零开始构建全新架构的原因。一款世上前所未见的 CPU。前所未见。我们将其命名为 Vera。这是专为智能体打造的 CPU。过去所有的 CPU,我们都是为人类构建的。而这款 CPU 是为智能体构建的。
那么,有四件事需要牢记。四个要点。第一个要点是 Vera 的每时钟周期指令数必须非常出色,因为我们需要缩短延迟。我们需要这个过程。时间。单线程性能。而非吞吐量。单线程性能必须达到世界级水平。绝对是最好的。单线程性能,这就是 Vera 的 IPC 即每时钟周期指令数如此之高的原因。它是世界上最高的。每个时钟周期获取、解码并执行 10 条指令。
第一点。第二点,CPU 数据输入输出所需的带宽必须达到世界顶尖水平。第二件事是每个核心的带宽。第三点就是带宽,毫无疑问。我们正在推进——记住我之前所说的——代理系统从根本上是解耦且分布式的。解耦且分布式。当计算呈现解耦和分布式时,网络就成了核心问题。因此,我们必须尽可能快地在 CPU 核心之间、以及 CPU 与存储、CPU 与 GPU 之间传输数据。整个系统周围以及 CPU 核心内部的带宽必须达到世界顶尖水平。
这是长期以来首款真正达到极端极限的 CPU,其连接所有 CPU 核心的结构具备光速级的传输能力。每秒 3.6 太字节。没有小芯片(chiplet)带来的额外开销,也不存在跨越芯片边界的问题,因为我们需要整合所有部件,确保 CPU 核心之间能够以极高的带宽进行通信。它们并非以逐个核心租赁的方式运行,而是协同工作。
Vera 的横截面带宽水平超乎寻常。它是首款支持 PCI Express Gen 6 的产品。它也是首款搭载 LPDDR5 并达到每秒 1.2 太字节带宽的产品,其带宽是目前市面上最高性能 CPU 的 2 到 3 倍,内部带宽、单核心带宽以及整体带宽均处于世界领先水平。请记住,我之前展示过,CPU 核心数量及 CPU 整体数量将会非常庞大。原因非常简单。
过去我们是为了人类而创造 CPU。
而人类,我们总共只有 10 亿之众。未来将会有数十亿个智能体。这些智能体将会使用 CPU,但由于它们旁边的 GPU 成本过高,它们会显得非常缺乏耐心。
因此,它们显得过于昂贵。
过于珍贵。因此,这些 CPU 不仅需要高性能,还必须具备极高的能效,这样我们才能在不占用用于 Token 生成的电力资源的前提下,在工厂中尽可能多地部署 CPU,毕竟我们知道 Token 生成才是盈利的来源。这四个特性,即每时钟周期指令数(IPC)或单线程性能、单核心带宽、芯片内外的总带宽以及能效,定义了 Vera。它是绝对世界级的。
当将其与最高性能的 X-86 进行对比时,它的表现简直超乎寻常。当在真实的单线程性能、真实的性能表现上进行比较时,它是顶尖的。CPU 能实现 5% 的性能提升是令人难以置信的。这简直不可思议。能够实现 10% 的提升更是令人难以置信。但这种性能提升速度简直是闻所未闻。这就是 Nvidia Vera。你觉得怎么样?
让我们来看一下。
Agentic AI 改变了 CPU 的角色。CPU 现在是指挥,而 GPU 是管弦乐队。
传统的 CPU 是为不同的时代而构建的,旨在最大化每个插槽的核心数。将它们切分、虚拟化,并按小时租赁。在智能体时代,CPU 如今已成为 GPU 利用率的瓶颈,直接影响到 Token 吞吐量、延迟和用户体验。
Nvidia Vera 是专为智能体循环构建的 CPU,它将 NVIDIA 的定制化数据中心 CPU 核心与可扩展的一致性架构相结合,在性能核心与带宽之间实现了恰当的平衡,从而最大化 AI 工厂的产出。Vera 的核心是为现代数据中心工作负载构建的 Nvidia Olympus 内核,能够处理分支密集型的 Python 运行时、工具调用以及沙箱代码执行。
每个核心都针对吞吐量进行了调优,并配备了一个神经分支预测器,每个周期可评估两个跳转分支。10 宽度的解码引擎每个周期能处理更多任务。大型乱序执行引擎确保指令持续运行。具备新型图引擎的先进预取器,可预测下一个数据路径。但只有当数据准确且及时到达时,高速核心才有意义。
Vera 是首款使用 LPDDR5X 内存的 CPU,能够在不牺牲带宽的情况下同时纠正多个错误。
相比 X86,Vera 的峰值内存延迟降低了 40%,通过检索、分析和沙箱执行,确保核心能及时获得数据。
NVIDIA 的第二代可扩展一致性架构(scalable coherency fabric)将全部 88 个 Olympus 核心统一在单一网格上,并为内存和 I.O. 分离了裸片。核心不会跨小芯片拆分,从而实现了比传统 CPU 快 50% 的核心间通信速度。此外,支持内存一致性的 NVLink 芯片间互连技术可将 GPU 直接连接至该架构。
除了 GPU 之外,NVLink 芯片间互连技术还能将 Vera 扩展至多个插槽,从而在 CPU 之间实现海量带宽。Vera 的智能代理沙箱性能是 X86 CPU 的 1.8 倍。独立的 Vera 机架可运行代理沙箱、工具、代码和数据管道。Vera 与 Ruben GPU 紧密耦合,确保加速工作流程持续推进。Nvidia Vera Bluefield 4 STX。为上下文记忆和 AI 存储提供动力。计算、网络、存储。Vera 是智能体时代的 CPU。
这将成为我们新的主要增长驱动力。
测评已经陆续发布,表现相当出色。
这是非常棒的产品。请记住,Grace 和 Vera 也是 AI 领域中认证度最高的 CPU,因为每一个数据中心、每一个云服务商、每一个企业,以及每一家与 Nvidia 在 AI 领域合作的公司都已经完成了对 Grace 的认证,整个软件栈也已经针对 Grace 进行了优化。
每家公司都将对 Vera 进行认证。Vera 将成为全球最适合智能体运行的优化 CPU。仅仅因为我们将采用 Vera Rubin,仅仅因为我们完成了那次重大而艰难的转型。事实上,在 Grace Blackwell 过渡期间,最大的风险在于从外部 CPU X86 转向 Grace Blackwell。那次过渡极其、极其危险,但我们凭借卓越的执行力完成了它。现在 Grace 实际上已成为 Grace Blackwell 的代名词。当人们提到 Blackwell 时,他们指的就是 Grace Blackwell。因为它现在完全普及了。
每家公司的软件栈都已针对它进行了优化。每个人的安全栈都已针对它进行了优化。
而现在 Vera 来了。我对它感到无比兴奋。
现在来看看一些性能数据。速度提升是一方面。这极其困难。提升 SQL 的速度非常困难。SQL 是有史以来最著名的领域特定语言,即 DSL。在 SQL 之前,在 CUDA 之前,就已经有了 SQL。在 OpenGL 之前,就已经有了 SQL。IBM 发明了 SQL。如今,它是全球通用的结构化数据库引擎。
每个人都在使用 SQL。这就是 SQL。
运行速度提升了三倍,不是 10% 或 25%,而是 10 倍、三倍的提升。令人难以置信。这是实时处理,接下来是实时流处理。记住,你的 AI 不仅仅是读取文档。你的 AI 将会监测遥测数据,特别是在工厂内部或证券交易所内部。
你们将拭目以待。
持续监测遥测数据。涌入的数据突发流进入了 CPU。这就是正在为 New York Stock Exchange 运行实时流处理的 Vera CPU。New York Stock Exchange 总裁 Lynn Martin 非常慷慨地与我们达成了合作。该系统在全球范围内运行实时流处理。Vera CPU 性能提升了 6 倍,这完全得益于带宽、单线程指令执行能力、核心内部带宽以及外部带宽的优化。Vera 是彻底的革命性产品。
这就是 Vera。要知道,当人们谈论 GPU 时,通常会提到 X-factors。
在涉及 CPU 的实际工作负载中谈论 X-factors 是非常罕见的。所以我为团队感到无比自豪。你们做得非常出色。我们有着非同寻常的路线图。但真正令人振奋的是,几乎每个人都在支持 Vera。他们和我们一样兴奋。这就是 Vera 的开放。它开启了一个全新的市场。智能体,智能体是一种新的工作负载。
过去,我们为人类构建 CPU。我们需要为智能体构建 CPU。智能体系统,它们的特性各不相同。为什么旧的 CPU 会是一样的呢?我们正在制造数以百万计的错误,数以百万计的错误。为了与我们共同进入市场,台湾的 ODM 和电脑制造商,所有的 OEM,你们可以看到那些早期采用者。早期采用者是那些具有代理能力的智能体公司。这是一个新市场的开端。一个前所未有的市场。它不会取代旧有的市场,但这是一个全新的市场。面向智能体的 CPU。而这个市场注定会比上一个市场更加庞大。原因在于,未来智能体的数量将远超人口数量,而且这些智能体非常缺乏耐心。
黄仁勋
所以,NVIDIA,Vera,CPU。谢谢。
企业级 AI 工具包与 Nemotron 模型
黄仁勋
这确实是最重要的一张幻灯片。这是核心要点。此处的核心要点在于,这就是应用模式。
这是未来十年的计算模式。Agents。Harnesses。编排 large language models。
每家公司都会运行它。每家公司都将成为 Agent 公司。每家公司都将拥有正在运行的 Agents。侧面。每一家公司都会意识到,智能体将需要属于自己的操作系统。每一家公司都在问我们:我们该如何安全地运行智能体?我们该如何为自己的工作负载构建智能体?
因此,我们推出了面向企业级 AI 的 NVIDIA agent toolkit。大家一直以来都在见证我公开构建这一技术。如你们所知,NVIDIA 几乎所做的一切,如果你回顾我 5 年前或 10 年前的 GTC,你会在今天看到其实现的成果。关于这一点,我已经谈论好几年了,因为我们一直在为这一时刻进行构建。
企业若要构建“智能体即服务”或构建可运行的智能体,需要具备四个要素。
第一,你需要模型。
当然,指的就是大语言模型。
模型越智能越好,成本越低越好,速度越快越好,速度越快越好。更好。其次,你需要一个框架来编排整个流程。第三,这些模型需要使用工具。而这些工具自带相应的技能。我向你们展示了 CUDA-X 库。未来这些将成为智能体极为出色的工具。
最后,你需要一个运行时环境。
你需要一个将这一切整合在一起的操作系统。这就是 NVIDIA 推出的智能体工具包。它包含了一些你可以进行修改的 NVIDIA 世界级开放模型。我想向您展示更多内容。您可以运行来自任何人的智能体。您可以运行云端代码、incredible agent、codex 以及 incredible agent。您可以将其运行在一个名为 OpenShell 的框架内,这对于企业内部而言将具备高度的安全性。
该 Shell 能够保护智能体,并使其稳固地遵循安全策略。
隐私得到保护。赋予其相应的权利和特权。保护其身份信息。因此,这个 OpenShell 正在全球范围内被广泛采用。NVIDIA OpenShell 是开源的。你将会看到许多公司采用它。
Red Hat、Canonical、Microsoft。它将被无处不在地采用。
这是一个重要的部分,这就是运行时(runtime)。而这个运行时针对 NVIDIA AI platform 进行了全面优化,该平台已普及至各个领域。因此,你可以在任何云端、本地服务器,甚至是终端设备上运行 OpenShell。现在,你们拥有了可以使用的工具和库。你们拥有可以修改或直接使用的模型,或者你们拥有智能体(agents)。这就是 open-clothed。Hermes,另一个令人难以置信的工具框架(harness)。这些智能体框架现在可以在本地或任何地方为你运行。
好吗?那么有四件事。这代表了现代企业的操作系统。那么,我们该如何使用它呢?我最喜欢的代理应用案例之一是芯片设计。这是 NVIDIA 所做的最重要的事情。因此,我们当然必须与 Cadence 合作,共同构建一个超级代理,即芯片设计超级代理。它由 Codex 或 Claude 云端代码进行编排。它以 RTL、架构图、原理图或规格说明书作为输入,并处理任何你需要修复的内容。我们共同创建了一些超级代理。
这些代理针对 NVIDIA 运行时环境和 Nemotron 进行了优化。让我们来看一下。
这真是令人难以置信。Cadence 与 NVIDIA 正在合作构建芯片设计智能体。数十万颗 NVIDIA 芯片汇聚在一起,构建起为全球前沿 AI 模型提供算力的 AI 工厂。设计这些芯片及其运行的系统是工程领域最艰巨的挑战之一。数以万亿计的晶体管、三维电路、微观尺度,每一个逻辑门、每一根导线,都要精确同步到皮秒级,必须在零误差的情况下完美协作。
物理原型制作速度太慢,且成本过于高昂。因此,工程师们在数字领域进行工作。每一颗芯片最初都是一套架构规范,随后被转化为 RTL,即芯片设计的语言。RTL 必须在仿真环境中经过验证。哪怕是一个小小的漏洞,都可能导致芯片交付延迟数月。在 NVIDIA,数以千计的工程师、每年数十亿小时的计算时长、数百万次测试,均经过编写、运行与调试。这是一个耗费团队数周时间才能完成的周期。
为压缩这一周期,Cadence 与 NVIDIA 构建了一个设计验证智能体。Codex 负责统筹整个流程。Cadence chip stack 启动了由 Nemotron 驱动并由 NVIDIA OpenShell 保障安全的 RTL 验证循环,调动了在 RTL 生成、测试平台创建、回归测试以及调试方面具备专家能力的子智能体。该系统实现了自我驱动。
这些 chip stack 智能体利用 Cadence Excellium 运行数百次模拟,通过 Jasper 进行形式验证,揭示设计缺陷,修复代码中的错误。曾经需要数周的时间,现在仅需数小时。验证周期缩短了 40 倍以上。NVIDIA 与 Cadence 正携手利用 AI 智能体重塑芯片设计。从几周,从几周到几小时,从几周到几小时,从几周到几小时,从几周到几小时。
NVIDIA 拥有数以千计的芯片设计师。我们打算雇佣数十万名 Cadence 超级智能体与我们协同工作,以便加速我们公司的发展,让我们能够更加雄心勃勃,创造出更加令人惊叹的成果。让事情运行得更快。
你们刚才看到了,工具包中包含了模型、工具框架(harness)以及工具;在此案例中,这些工具指的就是 Cadence 仿真器、验证器以及形式化验证系统。
这就是为什么我们如此努力地与 Cadence 合作,在 CUDA 上加速他们所有的工具,因为这些智能体非常迫切。智能体想要立即得到答案。因此,模型、模型、工具框架、经 CUDA 加速的库与工具,以及运行环境,缺一不可。你们刚才所见,正是所有这一切的整合。
现在,这一切的起点是一个出色的模型,Cadence 可以对其进行修改和微调,使其成为 Cadence 员工队伍和专业知识领域的专家,从而创建出专属于 Cadence 的、拥有其专有知识的超级智能体。他们必须从一个出色的模型开始。
我们将其命名为 Nemotron。NVIDIA 致力于为全球构建开源模型,以便你们所有人,即我们所有人,都能创造属于自己的智能体。
今天,我们要发布 Nemotron 3 Ultra。没错,这是我们的下一个开源模型。
而且它非常聪明。Nemotron 模型不仅提供模型本身,我们还提供用于训练该模型的所有数据。得益于我们拥有由众多卓越合作伙伴组成的联盟——你们可以看到下方的所有合作伙伴——我们共同协作,互相贡献数据。Nemotron 是基于全球最大的长序列推理模型、长序列任务解决、工具及任务解决工具套件之一进行训练的。这得益于我们所有伟大的合作伙伴关系,从而能够使用这些数据集。
所有这一切,从模型、训练脚本到数据,都将完全向你们开放。这就是最优秀的开源模型。全球最佳的开源模型系统策略。其简单的目标是让你能够获取所有内容,并在此基础上进行增补。使其变得更好。使其成为你自己的产品。
Nemotron 3 Ultra。速度提升了五倍。这是世界上首个基于 SSM 状态空间模型与混合专家模型混合架构的模型。该架构速度极快。我们追求速度,是为了让你能够实现快速思考。当你能够快速思考时,便能在同等成本下进行更长时间的思考。速度提升了五倍。
成本也降低了 30%。
降低了 30%。低了 30%。其在总浮点运算次数和总推理时间上的运行成本,甚至比全球最具成本效益的模型还要低。我们正在与全球最优秀的开源模型进行对比。前沿智能。速度提升了五倍。成本降低了 30%。完全开源。我们对此全心投入。
现在是 Nemotron 3。我们目前正在研发 Nemotron 4。因此,这一整套工具包,涵盖了模型、工具、技能和运行时环境,正是全球每一家企业现在都有能力构建自有智能体的原因,就像 Cadence 利用其超级智能体所做的那样。
我们正与众多公司合作,包括 Cadence、Crowdstrike、DeSoe、Palantir、SAP 和 Service Now。人们总是说,Jensen,智能体将会颠覆这些市场。我说恰恰相反,现在你们已经可以看到了。智能体将为我的合作伙伴和朋友们创造有史以来最大的机遇。
我们拥有 NEMO,即 NVIDIA Agentic Toolkit for Enterprise AI,以帮助他们实现这一目标。就是这样。
RTX Spark:重塑个人电脑产业
黄仁勋
首先,Vera Rubin 已全面投产。第二,Vera CPU。这是为新一代智能体打造的 CPU。第三,NVIDIA 的企业级 AI 工具包,旨在让每一家企业和每一家企业软件公司都能构建智能体。
我和你们的关系就是从这里开始的。你们当中许多人,我的许多朋友和合作伙伴在台湾,你们的公司也是从这里起步的。
从很多方面来看,这就是现代计算机工业的开端,距今已有 40 年了。
NVIDIA 已经成立 33 年了。当时 PC 工业已经开始进入 Windows 1、Windows 2 以及 Apple 1 和 Apple 2 的时代。等到我们出现的时候,Windows 3.1 已经成为了 PC 的代名词。如你们所知,Windows 95 让 PC 真正实现了个人化。它将 PC 从企业和公司的办公环境带入了消费电子领域。每个人都应该拥有一台,事实也的确如此。这仅仅是一个开始。
这个计算平台在几个方面做得极其聪明。Windows 不仅仅是一个……正如你所知,Windows 进行了恰当的抽象。它的架构设计恰到好处。系统 BIOS、开放的芯片组、带有驱动程序的操作系统,以及能够在运行时连接和安装的驱动程序,还有带有多媒体 API 的抽象层,这些将 PC 带向了我们今天所熟知的样子。每一个要素对于促成 PC 的普及都至关重要。
40 年后,Microsoft 和 NVIDIA 将重塑 PC。这就是全新的 PC。那么,明天晚上,我想按我们的时间是明天晚上,我将与 Satya 在一起。我们将更深入地探讨双方正在进行的合作。Microsoft 和 NVIDIA,在过去三年里。
我们花费了这么长的时间来彻底重塑 PC 的运作方式,以便为这一时刻做好准备。正如我之前提到的,那种被称为 Agent 的计算模式。
它将在 AI clouds 中运行。它将在企业内部运行。它也将在你的 PC 上运行。当 PC 拥有了自主 Agent,一个能够协助你、理解你的 Agent 时,将会发生什么呢?
你可以与它交谈。它能够观察你。你可以让它重新整理文件、为你提供协助、进行一些研究。它还能做更多事情,稍后我将为您演示。当然,新的操作系统本质上就是旧的操作系统加上大语言模型。大语言模型在许多方面都是现代版的 DirectX。它当然具备输入和输出功能,并能理解提示词。它能够理解计算机视觉。它能够生成视频。它能够生成音频。它是个人电脑、即计算机的现代扩展,也是其智能层面的扩展。
除此之外,正如我之前提到的,应用程序将被一种智能体运行时所取代。而这就是现代应用程序,即智能体。现在让我们来看看他能做些什么。这始于一个灵感,一个设想,即在 AI 时代,40 年来首次重塑 PC。在一个智能体(agents)的世界里,我们的个人电脑将变成什么样?
智能体在本地运行,连接至模型,无论是在本地还是云端;这是我们的个人 AI,为了安全而置于沙盒中,持续运行,处理工作。芯片、Earth 和 OS 必须进化。隆重推出 RTX Spark,我们将过去 33 年所学的一切,浓缩进这一枚芯片中。Blackwell RTX GPU 拥有 6,144 个 CUDA Cores,具备 1 petaflop 的 AI 算力,搭载与 MediaTech 合作定制的 20 核 Grace CPU,并由 NVLink 融合封装。128 GB 统一内存。采用 TSM3 纳米工艺,包含 700 亿个晶体管。
此外,通过与 Microsoft 的紧密合作,我们打造了一个专为智能体设计的 Windows 平台。
我们正在重塑个人电脑。
用于创作。用于游戏。用于智能体。
这是一场全新个人计算革命的黎明。而它始于 NVIDIA RTX Spark。
...我得向你们展示最精彩的部分,那就是电子游戏。这也是最精彩的部分,那就是电子游戏。
它同样也是最贴近我们内心的事物。
这是 Forza。顺便说一下,这是 007。
新款 007 游戏,我很期待玩它。我长得有点像他。
女士们、先生们,这是 NVIDIA 的 RTX Spark 笔记本电脑。好了,好了,谢谢你们。
我口袋里的东西太多了。这是世界上打造出的最令人惊叹的芯片。
这是我们与 Media Tech 合作打造的 N1X。
我想我刚才看到 Rick 了。这是 N1X。这是一块精美的芯片。这就是一个...一块坦白说需要 33 年才能构建出来的芯片。其原因在于 NVIDIA 的软件栈 100% 都在这里运行。如果你充当数字生物学研究,没问题。如果你想进行地震处理,没问题。你想进行天体物理学研究,没问题。所有与 CUDA 相关的,所有的物理学、所有的生物学、所有的基因组学、所有的 AI,没问题,所有的计算机图形学,也没问题。每一个 NVIDIA 曾经创造的应用程序,以及每一个 Windows 曾经运行过的应用程序。Microsoft 和 NVIDIA。它一丝不苟地优化了一切,使得这台计算机实际上能够运行这个世界所创造的一切。
此外,它现在可以运行智能体。
一台不可思议的计算机。我为此感到非常自豪。好的。现在,我希望你在接下来我要展示的视频中记住这一点。试想一下。这里的一切都将在你的个人电脑上运行。现在,那台计算机可以运行本地的 Nemotron 3 Ultra 模型或 Nemotron 3 supermodel。或者它也可以通过云端、代码、Codex,或是云端或网络上的其他模型来实现。它将会运行并做出一些惊人的事情。让我们播放它。
每一所房子都始于一个构想。从构思到设计需要无数的工具、专业知识和大量的时间。现在,一个在 RTX Spark 上本地运行的智能体可以利用我笔记本电脑上的工具,通过运行 Hermes harness 的开放式沙盒连接到云端的 Claude Sonnet,从而协助我进行房屋设计。我选定场地,分享我的概念草图以及用于激发设计灵感的风格情绪板。以及提示词,即对需求、要求和设计意图的文本描述。
我的智能体开始工作。它利用我笔记本电脑上的工具,打开 Rhino 并开始对场地进行建模,塑造地形、退界线以及建筑体量。随后,它提出建筑形式,并针对成本、舒适度和质量进行优化。在确定了建筑形式后,我的智能体生成了内部布局。
墙体、交通流线和房间开始显现雏形。
我随时可以介入,进行调整和修改。门、窗和结构元件会自动放置。我的智能体能检测到自身的错误并进行修正。
当我批准后,智能体将模型从 Rhino 导出到 Blender。材质和对象属性在保持设计上下文完整的前提下进行迁移。我发现了两处不同。调整材质,以获得理想的外观。
然后,我选取镜头。Blender 对房屋进行渲染。我的智能体使用结合 Flux 2 模型的生成式 AI,使其呈现出照片级的真实效果。多视角。光照条件。曾经复杂的工作流程,现在通过我的 Agent 得到了引导和简化。
与我共同开发 RTX Spark。以想象力的速度进行设计。
他正在 Agent 的世界中进行观察。开发者们对此感到非常兴奋。这是一台不可思议的计算机。所有的加速性能,所有与之相关的软件能力,都在与每一位开发者合作,使其为你们所有人带来卓越体验。下一个是 Adobe。当然,这是一个被全球数千万人使用的不可思议的工具套件。他们已经重新设计了 Adobe 的核心架构。Adobe Photoshop 和 Premiere,他们将为其发布 RTX Spark 版本。速度提升了两倍。它本身就已经很快了。现在它的速度将提升一倍。而且它在设计上也对智能体更加友好。凭借其 MCP server,它现在可以与你笔记本电脑上的智能体进行交互。有如此多的客户和合作伙伴对将 RTX Spark 推向市场感到兴奋,这简直令人难以置信。要知道,这是 40 年来 PC 重塑全线产品中的首次创新。
我非常高兴你们所有人以及全球生态系统能够加入我们。
基本上所有人都在这里了。所有人都会支持 RTX Spark,并将与我们一起打造极其智能、强大且精美的笔记本电脑。非常感谢大家。但这还不是全部。但这还不是全部。
全部。
RTX Spark 是对笔记本电脑的重塑。但事实上,Microsoft 和 NVIDIA 正在重塑整个 PC 产业。今天我们宣布推出一个全新的系列。三款革命性的 Windows 机器,涵盖台式机、笔记本电脑和工作站。全部 100% 兼容 Windows,100% 支持 CUDA,100% 支持 NVIDIA AI TensorFlow 和 Tensor Core。你在世界各地不同平台上看到的、运行的一切,在这里都能运行。这是 40 年来首次对 PC 进行彻底的重新设计和重塑。现在,真正令人惊叹的是这一点。这就是 RTX Spark 笔记本电脑。
这是台式机。这一台来自 MSI。Joseph,这是你的。好的,看看它有多漂亮。
这个智能体可以 24 小时全天候运行,且无需计量收费。你可以下载你的智能体。你可以在这里饲养你的龙虾。这是你的钳子。它一直在运行。没有计量焦虑。它就坐在这里,连接着你的整个房子、你的笔记本电脑、你的显示器、所有的摄像头、你的烘干机、你的饮水机、你的热水器,以及你想要的任何一切。你的安全系统,所有一切都连接到这里,它就成为了你的个人人工智能,你的个人人工智能代理。而且它会随着时间的推移变得越来越聪明,因为今天我们有 Nemotron 3 Ultra。明天我们会有 Nemotron 4,然后是 Nemotron 5、Nemotron 6,我们会不断让它变得越来越聪明。与此同时,它就放在家里帮你处理各种事务。如果你想预订旅行,没问题。如果你想要一个卓越的系统,这就是一款 Windows 版的 DGX station,它兼容 Windows,支持 Windows 中的所有功能,并且拥有 768 GB 的内存。所以你可以运行一个万亿参数的模型。这简直难以置信。20 Petaflops 的算力。
每秒 8 TB 的内存带宽,而且它就放在你的办公桌旁。
基本上,如果你是一名大型语言模型开发者,或者是一名智能体开发者,将它放在你的办公桌旁,就能为你提供所需的一切算力,当你需要部署时,再将其上传到云端即可。现在,如果你观察并思考这件事,你会发现有些事情正在发生。回想一下,15 到 20 年前,我们曾有一个被称为“电话”的概念。如今,我们有一个被称为“PC”的概念。现在当你想到你的手机时,你唯一不会做的事情就是打电话。你几乎用它做其他所有事情。因此,这部手机对你而言,其意义与过去的电话大相径庭。我敢肯定,未来会发生的情况是,10 年后的 PC,与你今天所认知的那个用来启动应用程序、点击和打字的工具完全不同。
这台 PC 将彻底改变。
这是我的理论。我完全可以想象,就像今天每个家庭都有家庭影院——或者说许多家庭拥有家庭影院、大尺寸电视一样。还有割草机、洗碗机。我完全可以想象,总有一天你的家里真的会有一台 AI 超级计算机。它运行着你所有的智能体。它运行着你所有的智能助手。它们随时随地为你处理各种事务。你必须把它安放在家里,就像你在家里安装家庭影院、音响设备或游戏主机一样,你会拥有运行 AI 智能体的家用计算机。久而久之,它们对你来说会更像是 R2D2。
比起个人电脑,它会让你感觉更像是 C3PO。
毫无疑问,这种对计算机的重塑,其意义不亚于手机向我们如今所熟知的智能手机的演变。因此,这仅仅是这段旅程的开始。这是一个全新产品系列的开端。因此,我们制定了相应的路线图。这对我们来说是一个全新的产品系列。在每一代架构中,我们都将涵盖台式机、笔记本电脑、工作站,以及后续的台式机、笔记本电脑和工作站。令我感到无比欣慰和荣幸的是,全球 100% 的 PC 产业界都已加入我们的行列,共同重塑 PC。
一条新产品线,一个新起点。谢谢大家。
物理 AI 与机器人:Cosmos 3 与 Isaac Groot
黄仁勋
如你们所知,Agentic AI 就是一种数字机器人。
它能够理解、推理、规划、采取行动并使用工具。Agentic AI 将运行在所有这些计算机上。过去一段时间里,你们已经看到我谈论过其中的每一个产品。我们正在开发用于人类或机器人的计算机,以及各种类型的机器人计算机。我们正在开发自动驾驶汽车计算机。我们正在开发卫星。你拥有具备 Tensor Cores 的 G-Force。我刚刚谈到了全新的个人电脑产品线。农业设备、制造设备、重工业设备都将具备智能体特性。你甚至会拥有属于自己的小型智能体助手。即使是你的基站,即未来的无线电台,也将具备智能体特性。通过理解流量并思考如何与其他基站协调,以实现尽可能低的能耗,从而提高利用率和频谱效率。因此,一切都将运行智能体。
今天,NVIDIA 在很大程度上处于这一领域的核心地位。但我相当确定。随着时间的推移,将会有数百亿甚至数千亿个智能体系统和智能计算机在全球范围内运行。最大的问题是数据。就语言模型而言,我们训练所用的互联网上的所有英语及其他语言内容,都是基于人类的视角。这些内容是由我们撰写的,也是由我们阅读的。然而,为了给 AI 机器人创造数据,它必须处于机器人的感知与视角之中。而世界上绝大多数视频数据都是第三人称视角,而非第一人称视角。
因此,对于智能体系统、机器人系统以及物理 AI 而言,数据是最棘手的问题。
你们已经看到我们在这一领域不断进阶。我们从远程操作开始,这本质上就是人类演示。这与强化学习人类反馈带来的重大突破别无二致。在此之后,我们使用仿真技术。这就是 Omniverse 发挥作用的地方。这与强化学习中可验证的奖励机制没有区别。
明白吗?我们正是利用这些系统来引导物理 AI 模型。
最终,我们能够通过第三人称视角进行学习,并将其重投影为第一人称视角。现在,通过引导学习,我们最终拥有了一个世界模型基础,能够从你想要的任何视角理解物理世界。无论是第三人称、第一人称、外部视角还是内部视角,都没有关系。这确实是一个巨大的突破。
今天,我们正式发布 Cosmos 3。
Cosmos 3 代表了物理人工智能的最前沿。在语言模型领域,我们也处于前沿阵地。有许多人正致力于此。然而,在物理人工智能领域,我们绝对是世界领先的。我为团队能取得这一成就感到无比自豪。这是各位所有工作的基石模型。无论您是想制造机器人、工厂机器人,还是任何涉及物理世界的机器人,现在您都有了一个得力助手——Cosmos 3。它具备理解与推理能力,能够进行生成,并能实现闭环仿真。它甚至可以直接作为决策策略本身。它在世界各地的排行榜上均名列前茅。我对 Cosmos 感到无比自豪,今天我们正式宣布推出 Cosmos 3。让我们来看看。
现实世界是无限且不可预测的。
物理 AI 需要数据,但现实世界的数据无法扩展。对于物理 AI 而言,计算即数据。
这就是 Cosmos。一个用于物理 AI 的开放式前沿全能模型,构建于一种新型的 Transformers 架构混合体之上。像素、动作、声音和语言汇入自回归 Transformer 中,它负责推理、规划并指导生成式 Transformer,从而生成下一时刻的内容。开发者们跨越不同的具体形态和应用场景对 Cosmos 进行训练后微调。
作为 VLM,Cosmos 观察物理世界,理解正在发生的事情,描述场景并标记出重要信息。作为世界模型,Cosmos 能从图像、文本或视频中生成符合物理规律的合成视频。作为模拟器,Cosmos 为策略训练和评估构建了闭环。作为 NVIDIA Omnodreams(一种动作条件世界模型)的基础,Cosmos 能逐帧预测未来。经过后训练,Cosmos 演变为世界动作模型。
感知、推理、规划、生成动作。
适用于各类机器人。适用于一切事物。一种新型数据,一种由计算机生成的全新教师。Cosmos。物理 AI 时代的开发者基础。
它结合数据与算力,为您提供 AI。如今既然有了 AI,算力即是数据。
因此,利用 Cosmos 3 训练出众多的 AI 模型。Cosmos 是一个如此出色的开源模型系统。这与 Nemotron 完全一致。我们公开了该模型。我们公开了数据。甚至公开了我们的训练方法,这样你们就可以自行对其进行增强,将 Cosmos 转化为你们的专属模型。我们拥有如此多优秀的合作伙伴,与我们在众多不同行业中共同协作。
当然,模型本身是 AI 技术栈中最容易理解的部分,但 AI 技术栈非常复杂。
它包含生成器、模型、模拟器和运行时环境,正如其在其他领域的应用一样。
对于智能体系统而言,这些汽车本质上是实体 AI,即作为自动驾驶车辆的智能机器人,同样具备这种复杂的技术栈。
今天,我们宣布推出 Alpamayo 2,这是一款面向自动驾驶汽车的开源模型。我们正在与全球各地的汽车公司展开合作。
如果你关注那些已签署 NVIDIA Hyperion 协议并正在制造 NVIDIA Hyperion 汽车的品牌,这代表了全球约 80% 的汽车份额。这些制造商代表了全球 80% 的汽车产量。我们将拥有大量的 NVIDIA Hyperion 系统,它们能够运行 Alpamayo 或其他任何人的自动驾驶技术栈。我们也与移动出行服务建立了连接。全球约 97% 的移动出行服务正在与我们对接,因此当我们在搭载 HALOS 操作系统的 Hyperion 上部署 Alpamio 时,我们将能够连接到全球所有的这些服务。让我们来看看这个。
Hey Mercedes,带我去我最喜欢的那个三明治店。
AI语音
正在为您规划前往目的地的路线。车道畅通,正在驶出以开始行程。由于前方静止的引导车辆阻挡了车道,正在向左微调避让。减速并在控制路口的停车标志前停下。停车礼让行人,因为该行人位于我们的车道上。礼让切入车辆及来自左侧的车辆。向左微调以避开右侧停放且阻碍通行的车辆。与切入车辆保持距离,因为其正在汇入我们的车道。由于右侧车道被停放的厢式货车阻挡,需向左微调避让。它们位于我们的车道上。停车以与前车(即本车道正前方的车辆)保持距离。与本车道正前方的车辆保持距离。在停车标志处停车,因为路口设有停车标志。停车以礼让横向交通。在横向交通处停车。跟紧前方车辆。由于卡车挡住了车道右侧,向右轻微移动。我们车道的左侧。让我们向左绕过那辆挡在车道右侧的卡车。您的目的地在右侧。
视频旁白
Alpamayo,世界上首款具备推理能力的自动驾驶车辆。
黄仁勋
如果你让它一直说个不停,它会让你抓狂的。但我们很高兴它能这样。它一直在进行自我对话。这被称为思考。因此Alpamayo 是一款具备推理能力的汽车。
我们所创造的技术同样适用于人形机器人。
当然,还有许多新的突破亟待实现。NVIDIA Isaac Groot 是我们的人形机器人技术栈。包括模型、数据生成、仿真、运行时环境,以及操作系统。这就是 Groot 平台,即 Isaac Groot 平台。正如你所见,我们的每一个系统都遵循完全相同的模式,无论是云端智能体系统、个人电脑智能体系统、自动驾驶汽车机器人系统,还是人形机器人系统,全部如出一辙。
当然,在每一个案例中,我们都是从头到尾完整构建。
我们是从头到尾完整构建一切。纵向且完全地与代码设计、极致代码设计相集成,然后我们向所有人开放,供大家选择使用任何喜欢的部分。无论你想使用什么,我们甚至能协助你进行修改。但目前还缺失的一点是,我们需要一个用于机器人系统的参考平台。
这些机器人系统非常复杂,拥有太多的电机、太多的传感器,而且极其脆弱,因此我们需要一种方式来交付这些参考平台,就像我们在 PC、DGX、云平台和自动驾驶汽车上所做的那样,现在我们要为机器人实现这一点。
今天,我们发布 NVIDIA Isaac Groot,这是一个参考人形机器人,全部完全集成,每只手拥有 25 个自由度,由 Sharpa 制造,机器人本体拥有 31 个自由度,身高 6 英尺,体重 150 磅,和我一模一样。第一个数字我稍微矮点,第二个数字我稍微重些。除此之外,相当接近。该平台运行着全新的 Thor 以及我们全套的软件栈。数据生成栈、数据仿真栈、运行时环境,所有这一切都集成在一个专为所有人使用而设计的机器人中。我们构建它是为了高等教育和大学研究人员使用,因为对他们来说,自行构建这样的系统难度极大。那么,让我们来看一下这一点。
AI 的下一个飞跃是通用机器人,即人形机器人,但制造它们非常困难。每个团队都从零开始,需要拼凑模拟器、远程操作系统、数据流水线和训练基础设施。在研究开始之前需要花费数月时间进行设置。NVIDIA Isaac Groot,一个用于人形机器人的开放开发平台。提供开放模型、仿真与训练库以及数据生成器。
此外,还有机器人计算机。全流程贯通,数小时内即可投入使用。首先,在 Isaac Lab 中设置仿真环境。利用 Isaac Teleop 在真实或模拟机器人上捕捉演示数据。
使用 Omniverse 和 Cosmos 生成合成数据。实现单一演示的规模化扩展。将单次演示进行扩展。扩展至数千次。训练策略。
在 Isaac Lab Arena 中进行评估。通过 Isaac Ross 进行部署。在 Jet 和 Thor 上运行。以及 Thor。
每一个要素。
模块化。开放式。
使用现有资源或替换为您自己的资源。
Groot 正在为从研究实验室到工厂车间的各个领域、每一门学科的机器人研究提供支持。
一个开放平台。现在,迎来了一项新的补充。Isaac Groot 引用了设计机器人。基于 NVIDIA 的开放平台构建。为前沿研究做好准备。适用于任何实验室,任何地点。机器人时代从这里开启。
NVIDIA Isaac Groot。如此多的机器人。如此多的机器人。
总结:迈向下一个飞跃
黄仁勋
我们正在与全球几乎所有从事机器人或机器人系统工作的人员合作。让我告诉你我之前告诉过你的内容。计算机行业已经彻底改变了。在过去的六个月里,一切都改变了。
一切的改变源于 Agent 的实现,并与最新的前沿模型实现了融合。
这使得 AI 现在能够完成实际且有用的工作。这种计算范式将会反复地重演。这是一种计算范式,即作为一个模型的 Agent,配有一个利用技能调用工具并运行在运行时环境中的系统。该运行时环境取决于它是在云端、本地服务器、程序、个人电脑还是机器人上运行。对于所有这些场景,其计算范式完全一致。你会因为个人偏好而使用不同的配套系统。你会因为个人偏好而使用不同的模型。你会为了自身专有用途而对它们进行改进。你可以创建超级智能体,并将它们出租给其他人以协助他们完成工作。
这种智能体平台、这种智能体模式,NVIDIA 拥有企业级 AI 工具包。
这对你们所有人来说,都是一种参与 AI 的绝佳方式。而对我们而言,这是一个极好的增长机会。Vera Rubin 已全面投产。Grace Blackwell 是为处理 AI,特别是推理任务而打造的。而Vera Rubin 是为运行智能体而打造的。它已全面投产。它远不止是一个 GPU。它是一整套解耦的、分布式智能体处理系统。NVIDIA 已经真正成为了一家基础设施公司。不仅仅是一家 GPU 公司,不仅仅是一家系统公司,而是一家致力于帮助您实现最大化营收和最大化利润,并尽可能快地达成目标的基建公司。智能体时代,这是一种全新的计算方式,如今构建的 CPU 是为智能体而生,而非为了人类。面向智能体的 CPU 有着其独特的要求,而我们的 NVIDIA Vera 极具革命性。我对它的产量爬坡感到非常高兴。
订单情况。
它已经注定将成为我们公司历史上速度最快、最成功的产品发布。NVIDIA 与 Microsoft 共同打造了全新的 PC 产品线。这是一个崭新的开始。当然,我刚才描述的那种完全相同的智能体模式、生成式处理模式和计算模式,也将运行在各类设备上。我提到了 PC。但在未来,它将应用于机器人、卫星、基站和工厂。在云端、本地数据中心以及边缘侧。这种模式,即智能体 AI 系统,这种智能体计算模式,将在世界各地的计算机中被复制。我们对个人电脑的认知很可能会发生改变。我要感谢你们所有人的合作与友谊,没有我们共同完成的一切,我们无法走到今天。我为你们在过去一年中所取得的巨大成功感到自豪。
明年将会更加精彩。
我还有一件事要告诉大家。
让我们来看一下。
视频原声
在 Computex 上完成的展示。Jensen 向世界展示了未来趋势。实用的 AI 已经到来。智能体将协助你左右。但为了防止你错过了我们今天所说的内容,台北,我们将为你详细拆解。Agent 过去常被误解。
过去只有好莱坞的电影明星才拥有他们。现在我们都有了能让梦想成真的团队,在客厅里建立公司,但他们需要大量的计算资源,我们听到了你们的需求。这就是我们创建 Vera 的原因。Rubens。所以演示是真实的。最便宜的 Token 即将到来。十倍速的推理天堂。比 007 还要多的特殊 Agent。Bluefield 保持 Agent 记忆的准确性。现在,让我们谈谈它的 CPU。速度提升 50%。这太离谱了。这对 Vera 来说并非如此。它是为智能体构建的。NVLink fusion 巧妙地融合了 A6。欢迎所有人加入 NVLink 的派对。如果你喜欢那段介绍,Vera Rubin 已经全面投产了。Nemotron Ultra 推出了运行。工作效率提升了 5 倍。Nemotron 确保了防护栏的稳固。OpenShell 保持了沙盒的严密。你的代码已完成迁移并经过审查。在这首歌结束之前的一切。
AI 就像一个五层蛋糕。计算收益。毋庸置疑。
全球 AI 云构建了海量的吉瓦电力。DGX 通过连接各节点保持精简的电力运行。
每一瓦电力都为您优化。
这样您就可以拥有您的蛋糕。也能享用它。RTX,分叉的一年真有趣。40 年来 PC 领域最重要的时刻。代理(Agents)赋能所有工作流。在 Windows 支持的任何地方运行。任务在 CPU 上运行,模型在 GPU 上疾驰。Cosmos 构建机器人所需的世界。将转向和计算转化为合成足部动力。Alpamayo 观察并进行推理分析。像人类一样理解道路。它们是如何学习移动的?学习技能并寻找成长。这棵树由思想驱动。
未来是光明的。来看看接下来会发生什么。
黄仁勋
谢谢你,Taiwan。欢迎来到 Computex。谢谢。
谢谢。谢谢。感谢这精彩的一年。感谢你们所有的友谊与支持。谢谢。保重。祝你度过一个愉快的 Computex。
风险提示及免责条款:市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资责任自负。
点个在看支持一下❤️
热门跟贴