出品 | 网易智能

作者 | 小小

编辑 | 王凤枝

全球近四千万软件工程师,一年薪水三万亿美元。AI让他们产出增加到九万亿。

6月1日,中国台北。英伟达CEO黄仁勋发表演讲,他开场说这里有“世界上最丰富的供应链生态系统”。但没等暖场结束,他就切入了真正的正题:有用的AI来了。

他算的账来自软件领域。全球约三千万到四千万专业开发者,薪资价值约三万亿美元,而AI正在把这部分人力的产出推向数倍增长。黄仁勋想证明的不是AI会简单替代程序员,而是当单位人力产出大幅提升,企业会更愿意扩大开发能力。

由此,他抛出了整场演讲的关键判断:Token正在成为收入和利润单位。AI公司要生产更多Token,就需要更多AI工厂;而AI工厂的效率,取决于芯片、网络、存储、电力、冷却和软件的整体协同。

这背后的计算模式也在变化。过去的AI是模型,你问它答;现在的AI是Agent,它有模型作为大脑,有编排系统作为身体,还能调用软件工具、管理记忆、执行任务。为了运行这种系统,英伟达推出Vera Rubin,把GPU、Vera CPU、NVLink、BlueField、安全、存储和网络整合成面向Agent的多机架计算平台。

在企业侧,英伟达推出Agent工具包和Nemotron 3 Ultra,希望让公司能基于开放模型、训练数据、编排系统和工具链构建自己的“数字员工”。在个人端,它与微软合作,四十年来首次重塑PC,推出RTX Spark,让本地电脑也能运行个人Agent。

演讲最后,黄仁勋把这套逻辑延伸到物理世界:自动驾驶、人形机器人和物理AI也会成为Agentic AI的重要场景。

这场演讲真正想说的是:Agent正在重新定义计算,Token正在重新定义商业模型,而英伟达想成为从云端AI工厂到个人电脑、机器人和汽车的全栈基础设施公司。

打开网易新闻 查看精彩图片

以下为黄仁勋演讲全文:

很高兴见到大家。回家真好!

我带了父母回来,请用掌声欢迎我的爸爸妈妈。为我们的暖场巨星鼓掌,女士们先生们,看看他们多可爱,台湾的超级巨星。

今天来了这么多朋友,我们也正向其他70个国家和地区转播。各地观众都在同步参与,台湾也有70个不同的会议正在同时收看这场主题演讲。

我们有太多事情要告诉各位,有太多合作伙伴要感谢。英伟达在台湾已经形成了令人难以置信的生态系统。通常人们想到生态系统,会想到软件堆叠、开发人员,也就是英伟达在运算系统上建立的生态。但英伟达的生态系统跨越所有上游供应商,遍布台湾的供应链,一切从这里开始。下游则延伸至所有数据中心,最终到达用户手中。

今天,我们要谈谈这几乎整个生态系统。这里有如此多的公司,其中不乏我最喜欢的合作伙伴。台湾拥有世界上最丰富、最棒的供应链生态系统,真的令人惊叹。谢谢大家。

今年我们与企业共同成长,成绩斐然。事实上,昨晚有人告诉我,台湾地区每年的GDP几乎将成长10%,实在难以置信。

我们有很多事要说。开始吧!

01说AI会减少就业,完全是一派胡言

两年前我在这里的时候,谈到了人工智能如何改变世界,从生成式AI到后续的几波浪潮。下一波是Agentic AI。而今天可以说,一个巨大且有用的AI,已经到来了。

打开网易新闻 查看精彩图片

这是什么意思呢?

来看看GitHub。最早的AI应用之一就是软件编码,这是世界上最有价值的职业领域之一,拥有巨大的生态系统。全球大约有三千万到四千万专业软件开发人员,还有数百万学生和爱好者,总共大约4000万人以编写程序为生。

数据很能说明问题。2023年,代码提交量是3亿次;2024年,4亿次;2025年,5亿次。到了2026年的头几个月,这个数字几乎增加了两倍。

这代表什么?这3000万名软件开发人员,他们的薪资价值约3万亿美元,并支撑起约100万亿美元的全球产业。现在,相当于3万亿的薪水投入,换来了近3倍的产出,也就是约9万亿美元的生产力。

这组数字的差距非同寻常,而这正是AI的潜力所在。

人们总说AI会减少工作,这完全是误解。因为产出的价值如此惊人,企业自然会想雇用更多软件工程师。如果产出曲线是平的,那确实可能会减少招聘。但现在有了如此巨大的价值增长,人们只会想要雇用更多的人。这个趋势很快会在我们的经济中体现出来。

所以,第一件事是,有用的AI来了。

从产业的角度来看,这意味着对Token的需求将异常庞大。因为一旦你能创造这样的价值,你就会想生产更多的Token。同时,Token现在是有利可图的,它们是能产生收入的基本单位。AI公司想要建立更多的生成式AI工厂来生产Token,这就导致了运算需求的暴涨,也正是台湾运算需求激增的原因所在。这就是你们如此忙碌、生意如此兴隆的缘由。

运算模式已经彻底改变了。

02 Agent将成为终极的分布式运算模式

第一个关键想法是,有用的AI已经到来,AI现在是利润的来源,是GDP的组成部分。而新的运算模式,不仅仅是大型语言模型,而是Agent。今天,我们讨论的一切几乎都建立在这个基础上。

让我解释一下什么是Agent。这将是未来的应用程序形态。

它包含代码和操作系统,应用程序代码在其中执行。今天,Agent由一个或多个大语言模型,以及一整套工具组成。这套工具能协助处理企业信息,并进行协调,以完成有成效的工作。Agent需要接收输入,并理解、观察、推理、行动,使用各种工具,比如电子表格、网页浏览器、数据处理引擎、数据库引擎等。

这一切由一个协调中枢来精心安排,它根据上下文理解正在发生的事,推理下一步该做什么,制定行动计划,并调用企业信息。这个协调路径由特定软件执行。

打开网易新闻 查看精彩图片

所以,这基本上就是Agent。它和我们人类一样,会处理短期记忆、工作记忆和长期记忆,因此记忆管理系统极其重要。整个这套系统,就称为Agent。其中,大型语言模型负责思考,而协调中枢则像操作系统一样,把所有东西连接在一起。

这就是全新的计算模型。Agent能做许多惊人的事情,这是一个重大突破。大型语言模型在思考、推理、规划和使用工具方面的能力已大幅融合提升,我们如今拥有了这些能力来管理记忆、进行协调并使用工具,就能做到了不起的事。

让我举几个例子。这是一个提示,AI生成了相应的代码。这是输入,这是输出,很惊人吧?我们使用的是云端代码。

另一个例子:输入指令是“创建一个GIF,英伟达的绿点在黑色散点背景上,台北101大楼变形为GTC,再输入两个2026,变形为NVIDIA AI标志,比散射,向右重复”。这就是提示。下一个例子:有人丢了遥控器的电池夹子,于是输入需求,AI使用工具建立了一份用于3D打印的CAD档案。有道理吗?

这就是新的计算模式。过去我们要启动一个应用程序,点击、打字;现在,我们只需要向AI解释我们的意图,由AI生成代码或调用工具,产生我们需要的输出。未来的计算机,就会像这样运算。

我们为此努力了两年,现在它已真正到来。其中一项重大突破,就是工具的使用。

打开网易新闻 查看精彩图片

很多人说,AI来了,生成式AI来了,所有软件公司都要倒闭。我的看法恰恰相反,因为未来会有数不清的Agent。世界将不再受限于人口数量,而这些Agent会使用比以往更多的工具。这其实对软件公司来说是不可思议的时代。但关键在于,软件必须以一种Agent能够使用的方式呈现出来。

这是一项重大突破。大家知道英伟达的宝藏是什么,就是我们所有的CUDA函数库,称为CUDA-X函数库。今天,我们能让这些函数库为Agent所用,而且它们使用起来比人类更高效。这对CUDA-X函数库来说,是一个美妙的时刻。

20年前,我们创建了CUDA,为加速运算提供了单一架构,重塑了上千种运算。CUDA-X函数库帮助开发者在各个科学与工程领域取得突破。它们现在就是Agent的工具库,用于光刻运算、购物决策最佳化、直接稀疏求解器等,涵盖了结构化与非结构化数据、AI训练、可微分物理、基因组学等诸多领域。这些算法本身就很优美,让我们为数学鼓掌,数学是美丽的,运算模式也是。

03 Vera Rubin:为Agent而生

让我们回到Agent这个主题。它是终极的分解式、分布式运算模式。有非常多不同的计算机在同时运算,来处理这个Agent。Agent包含模型、协调中枢、工具、技能和一个运行时环境,所有这些都在数据中心的不同位置执行。

你可以把模型想象成大脑,协调中枢是身体,它在一个车间式的环境里使用工具。每个步骤都在计算机的不同部分运算。你会看到,当大型语言模型进行思考、上下文处理、观察环境、推理、计划并行动时,整个机架的Grace Blackwell NVLink系统都会被启动。每当它使用工具时,就会用到CPU,那可能是C编译器、Python、JavaScript,也可能是加速运算。

今天的Agent还算是相对简单的工具使用者,但明天,它们将变得极其复杂。这就是我展示CUDA-X函数库的原因,Agent将会非常需要它们。它们能解决世界上一些最重要的问题。我们所有的CUDA-X函数库,现在都将附带“技能”,相当于一本AI可以学习的操作手册。对Agent而言,使用这些函数库的能力将变得难以置信。

在运行中,工具运行在CPU和GPU上,大语言模型也是如此。安全程序运行在独立的安全处理器上,还有DPU,也就是英伟达的BlueField。而这一切的协调,都在CPU上执行,整个协调中枢都在CPU上统筹工作。

其中一个最棘手的部分就是记忆体。你可以想象工作中的记忆体,也就是我们说的缓存。要记住什么,如何压缩,如何撷取结构化或非结构化数据,数据之间的关联是什么……这整个过程极其复杂。AI的记忆体系统,正在导致存储系统的彻底革新。

你可以看到,运算的每一个层面,都在这种称为Agent的新应用模式下变得全然不同,应用程序执行一大堆软件的方式也彻底改变了。这就是为什么我们需要分解式、分布式的异构计算架构。

这正是新一代Vera Rubin的用武之地。Vera是一个CPU,而Rubin虽然始于GPU,但又远不止于此。Vera Rubin是一个从端到端的整体系统,它拥有GPU、由Vera CPU来统筹,并通过NVLink 72互联。我要告诉你们更多关于这个系统的细节,它还包括革命性的存储、CX9网络,以及名为Doka的软件堆叠,还内建了安全处理器,确保数据在静态、传输和使用中都全程加密。因为AI模型如此珍贵,整个系统都遵循机密运算的标准。

这其中的每一个系统,本身都是一次彻底革命。Vera Rubin是我们公司历史上最具雄心的项目,整个公司4000名工程师都在为此努力,更不用说在座各位的参与。Vera Rubin不只是一个芯片,它的内涵要丰富得多。

打开网易新闻 查看精彩图片

多年前,英伟达曾是一家GPU公司,但这些年来,我们已经进化成一家系统公司。你现在看到的是史上最复杂的系统之一。但最终,我们的客户和合作伙伴想要的不是买一台计算机,而是建立AI工厂。

这也是英伟达自身再次转型的原因。你们可以看到,我们的技术如今贯穿在整个基础设施的各个层面,我们的合作伙伴都是基础设施规模级的,涵盖发电机、冷却系统、电网供应商。最终,我们是在尝试建立一个完整的堆叠,就像我们过去构建GPU,构建Grace Blackwell NVLink 72机架一样。现在我们正在构建一个完整的系统堆叠,让客户能以此建立惊人的AI基础设施。

全世界都在竞相打造AI工厂,这是人类历史上最大规模的基础设施建设。AI工厂复杂得令人难以置信,从芯片、机架、网络、电源到冷却系统,每一层都必须从头开始协同设计,因为在这里,运算能力直接等于收入。

打开网易新闻 查看精彩图片

英伟达的DSX就是为此而生的蓝图,它为最高效率和获利能力的AI工厂提供了构建和运营的参考设计。从DSX SIM开始,合作伙伴可以借助Omniverse蓝图,在第一个机架落地前,就设计并验证一个英伟达的AI工厂。他们能在数字孪生里规划布局、模拟电源和冷却、设计网络,并验证每一项整合测试。

一旦投入运营,DSX OS就会接手,负责操作、监控并修复基础设施,把已安装的系统变成可信赖的、多租户的、有弹性的AI就绪容量。现在很多AI工厂会过度配置高达40%的电源,而我们的DSX Max LPs技术能让运营商在相同的电力预算下,安全地部署更多GPU,从而增加数十亿的年收入。突破性的45°C温热液冷技术,使用更少的水和能源,把更多能源导向真正产生营收的运算上。动态电源分配技术可以在机架间引导电力,回收被搁置的瓦数,将电力送到需要的地方,并平滑化峰值电流。

贯穿整个工厂,AI Agent的工作团队会持续协调、平衡冷却和电源,以满足工作负载需求。DSX AI工厂还是一个能与电网灵活协作的资产。它能实时读取电网信号,动态调整工厂电力,在电网需要缓解时提供支持。在这十年结束前,将有100GW的AI工厂上线。由英伟达DSX驱动的AI工厂,能以最高效率、最低成本生产Token,还能让电网更强大。

04运算就是收入,选择错的架构等于烧钱

过去我向你们展示的生态系统,是英伟达的运算层和软件堆叠融入第三方平台,去服务终端市场。那是运算生态。

而现在,我要讲的是AI工厂生态。我的上游是在座的各位,下游则是这个生态系统。英伟达不只是在打造GPU或系统,我们正在帮助客户构建这些极其复杂的AI基础设施。每一个工厂的规模从起初的200亿到300亿美元,正发展到500亿、600亿美元,很快将达到每千兆瓦800亿到1000亿美元的投资。如此巨大的资本,必须一次建成、一次成功。资本成本高得惊人,复杂程度也一样。

打开网易新闻 查看精彩图片

如你们所见,我们设计一个芯片,再设计计算机,然后模拟整个系统。如今,一切都是在Omniverse中搭建起来的。我为此研究了很久,这就像是梦想成真。我们现在可以在数字世界、在仿真器中,建造这些只要世界有需要、规模就能达成的巨大系统,并在真正动工前完成验证。我们把这一切称为DSX。

如果说RTX是我们的GPU,DGX是我们的系统,那么DSX本质上就是我们为之工作的基础设施。这就是我们的生态系统,它让我们能与小型公司合作,并帮助它们成长为世界级的AI云服务商。例如CoreWeave,现在价值五六百、甚至七百亿美元,成长惊人。还有最近合作的Mebius,成长速度也令人难以置信。这些云平台都有着优秀的客户,比如软件编码公司Cursor、图像生成的Black Forest Labs、世界基础模型公司World Labs、领先的金融AI公司Revolut,以及Shopify。还有Nscale,客户包括英国电信和Google。Google正在使用我们的一家AI云端公司Thinking Machines,还有Frontier Labs,非常令人兴奋。韩国的Neighborhood Cloud服务着韩国银行、现代等公司。印度的Yotta、新加坡和印尼的公司,每一家都在服务区域乃至全球的客户。

AI将会无处不在,每家公司都将由它驱动,每个地区都将构建它。

在台湾,我们有GMI。请给他们掌声,这是令人难以置信的公司,代表着不可思议的机遇。

但它们都需要几样东西。当然,它们需要最底层的运算堆叠,这正是英伟达的成名领域,我们所有的硬件、软件、函数库,以及连接全球第三方生态系统的能力,让任何人都能建立AI云。但AI云极其复杂,运算技术只是其中一部分,资产与金融层面同样关键。

这就是英伟达能成为世界级AI基础设施公司的原因。擅长帮助客户建立并部署AI工厂至关重要,因为运算就是收入,就是利润,无法产生收入就意味着亏损。当AI基础设施上线时,它可能很快见效,也可能需要一段时间;吞吐量可能很高,也可能很低;弹性与可靠性更是千差万别。而它的使用寿命长短,因为这代表着500亿到1000亿美元的资产,所以性能曲线非常重要。

这正是英伟达和伟大合作伙伴们协作的原因,因为我们提供了完全整合的能力。我们不只提供一张幻灯片,我们构建了整个基础设施,把每样东西连接在一起,并自我构建了数十亿的规模来确保一切运转良好。因此,我们拿到第一个Token的时间更短,训练就绪的时间更快。

其次,我们每瓦产生的Token数量是世界级的。原因在于我们整合一切,从头开始协同设计,并模拟整个系统,就像我刚才展示的Vera Rubin机架一样。一切都是按序设计,以提供惊人的吞吐量。如果你的数据中心拥有一千兆瓦的电力,那就只有这么多,每个Token都有利润,都是收入。这意味着,每瓦效能就等于你的收入。仅仅因为某个芯片便宜而选择错误的架构,毫无意义,你需要确保每瓦运算带来的收入。瓦数就代表你能买得越多,赚得越多。

第三点,也是至关重要的一点,是可靠性。如果你有机会看到这些数据中心,有数百万条电缆和无数移动部件,要让所有计算能力和谐运作、保持高可靠性,是非常困难的。我们已经在大规模运营上深耕了很久,这些经验至关重要,直接关系到系统平均故障间隔时间的差异。

最后,软件的演变决定着系统的使用寿命。从几年前的Hopper时代到现在,AI已经完全改变。我们经历了CNN,然后是Transformer,再到专家混合模型,如今是Agent系统。每隔几个月,软件行业就会出现新技术。如果你的架构不够灵活,生态系统不够丰富,资产的生命周期曲线就不可能长。由于全球开发者都在使用英伟达的CUDA,它的使用寿命、生态系统和有用资产将持续得更久。这本质上就是成本差异。你可以把运算看作收入,但收入的另一面是成本。资产寿命越长,总拥有成本就越低,这就是差异所在。

归根结底就是一句话:买得越多,省得越多。现在,你们所有人都在亲身经历这一点。需求如此之高,你们的所有工厂都在全速运转,台湾的每一位员工都在努力工作。因为每个人都意识到,有用的、能盈利的AI已经到来,对运算的需求高得惊人。需求就是我们的制约,所以,让我们一起超级努力,帮助全世界建立起无处不在的AI工厂。

05 Vera Rubin全面投产

我站在你们面前,非常开心。Vera Rubin现已全面投产。我们为Vera Rubin打造的供应链,规模是Grace Blackwell的两倍。而且现在组装一个Grace Blackwell机架需要两小时,而Vera Rubin只需要五分钟。不仅容量更大,吞吐量也快了很多。我们需要这一切来满足需求。这个生态系统非同寻常,数百万平方英尺的厂房已经就绪,为Grace Blackwell和Vera Rubin做准备。我要感谢你们所有人。Vera Rubin现已全面投入生产。

过去,大型语言模型生成答案。现在,AI Agent能够执行任务。但处理生成式AI是完全不同的问题。Agent需要观察、推理、计划和使用工具,他们要处理大量的上下文、工作记忆和长期记忆,还会衍生出子Agent专家。英伟达的Vera Rubin正是一个多机架集群规模的系统,专为处理Agent式AI程序而设计,现已全面投产。整个制造业供应链的自动化与协调,堪称奇迹,见证了我们一路的旅程。

打开网易新闻 查看精彩图片

从我们推出第一台AI超级计算机DGX-1开始,在过去十年,我们将每个芯片和系统都推向了极限。从Pascal和第一代NVLink,到Grace Blackwell,第一台机架级AI超级计算机,再到如今的Vera Rubin,第一台为Agentic时代而生的多机架集群级超级计算机。

一切从台积电开始。构成Vera Rubin的七颗新芯片需要经过数百道工序。3纳米制程,CoWoS-L封装,来自SK海力士和三星的HBM高带宽记忆体。Vera Rubin运算板上集成了数万亿个晶体管和超过18,000个元件。Vera Rubin NVLink 72负责处理提示、上下文理解、推理与规划。接着是全新的模块化运算托盘,采用全新PCB中板精简设计,通过超级芯片连接X9超级网卡和BlueField-4 DPU,全程无缆线设计,弹性面向AI工厂规模。18个运算托盘、9个热处理器、可抽换式NVLink交换机、新的高效率液冷歧管,汇流排承载超过5000安培电流,相当于20辆全力加速的电动汽车的动力总和。超过130万个元件组成了这第三代MGX机架设计。

祝贺微星,带来了Vera Rubin NVLink 72工程机架。祝贺戴尔和CoreWeave,以及他们的Vera Rubin NVLink 72工程机架。

接下来是Vera CPU机架,在单一液冷机架中集成256个CPU,负责模型协调和记忆体数据调度,由富士康和广达推出。Grok 3 LPU初具雏形,256个Grok 3 LPU横跨16个托架,拥有每秒40PB的SRAM带宽和超低延迟,能够以最高吞吐量生成Token,延迟最低。

Vera BlueField-4 ST是AI保存记忆的地方,通过BlueField实现存储处理加速、记忆体和存储的连接以及片上安全。还有英伟达Spectrum-X以太网光子学技术,这是全球首款共封装光学以太网交换机,由台积电合作制造,在磷化铟上实现了芯片级封装和超高功率激光模块。

Vera Rubin,由五个互连的机架规模系统组成的超级计算机,为AI Agent而生。全台湾150家供应链合作伙伴,数百万平方英尺的厂房,数百个据点,将芯片、系统与数据中心推进到功率与规模的极限。这就是我们所说的极限协同设计。我们与台湾一起做到了这一点。我们一起为AI时代重塑了运算。台湾从一开始就和我们在一起,今天也在这里,把Vera Rubin带给全世界。谢谢台湾。

打开网易新闻 查看精彩图片

女士们先生们,Vera Rubin不只是为AI而生,它是为运行Agent而生的。Agent是计算机科学最新的突破,花了多年时间才让其潜力得以发挥并变得有用。而Vera Rubin,作为世界上最先进的运算计算机,正是其得以立足的根基。

这是Vera Rubin NVLink 72,这是Grok LPU,将在下次GTC详谈。这是Vera CPU机架,256颗CPU,全液冷。这是Vera BlueField存储处理与安全系统。还有我们Mellanox的网络,世界上第一个共封装光学产品。

当我们构建Hopper时,预训练是最重要的应用。到了Grace Blackwell,很多人说,预训练很棒,但推理很简单。但事实上,推理就等于金钱,而模型又极其复杂,要在极短的反应时间内实现高吞吐量,极其困难。这正是NVLink 72的意义。

今天,英伟达的Token成本是全球最低的,不是低10%,而是以数量级计算的因子。这全都归功于我们的极限协同设计和对运算模式的深刻理解,我们因此才能创造出NVLink 72。

现在,Vera Rubin更进一步,它是在Agent系统中进行推理。看看它,没有电缆、没有软管、没有风扇。上次我给你们看的时候,到处都是电缆。现在有了PCB中板连接两边,原来需要两小时的工作,现在只需五分钟。Vera Rubin的可靠性和弹性将非同寻常。

这是我们的Vera CPU托盘,有史以来最先进的CPU。这是存储托盘。这是我们全新的LPU,Grok系统设计专为极低延迟推理。这是Vera Rubin NVLink交换机托盘,革命性的设计。这是我们的以太网扩展交换机。为Grace Blackwell打造的这两个系统,让今天的英伟达成为了最大的网络公司之一,我为网络团队感到骄傲。

06史上第一款“不是为人设计”的CPU

现在,我们来谈谈CPU。Vera CPU,是为AI时代打造的CPU。

至今所有的CPU都是为人而造的。我们是使用者,生活在以秒为单位的世界,在云端按小时租赁CPU,所以希望核心越多越好。但Agent不同,Agent很没有耐心。它们生活在纳秒级的世界里。当它调用工具或访问数据库时,需要响应越快越好。Agent等待的每一刻,都会阻碍它进入下一步。所以,我们必须让CPU的互动延迟尽可能低。因此,我们创造了Vera CPU。

打开网易新闻 查看精彩图片

在我们的系统中,它被用于三种方式。第一,用于思考。在Vera Rubin机架内,有两颗CPU,一颗负责编排、管理GPU和KV缓存,处理所有运行软件;同时还有BlueField负责安全和隔离。

第二,用于统筹。Vera Compute负责运行AI的协调中枢,进行模型工具的使用编排,访问数据库和数据。服务器就在此。

第三,是Vera BlueField,用于构建世界上最快、有史以来最快的存储系统。这之所以如此重要,是因为Agent正在以难以置信的速度访问记忆体。这些存储服务器和CPU现在是数据中心中成本最高昂的部分,也是关键路径。AI工厂的经济就是Token,而Token就在这里被创造出来,所以你必须制造尽可能多的Token,绝不能让它成为瓶颈。

这对Vera CPU架构提出了极高要求,一个从零开始的全新架构。我们称之为Vera,这是专为Agent打造的CPU。

有四个要点。第一,是每时钟周期的指令数,我们需要极低的延迟和极高的单线程效能。Vera的每时钟指令数是全球最高的,能在一个周期内读取、解码并执行10条指令。

第二和第三,都是带宽。数据移入移出CPU的带宽必须是世界级的。因为Agent系统的本质是分解和分布式的,网络就成了关键。因此,CPU核心之间、CPU与存储之间、CPU与GPU之间的数据移动都必须尽可能地快。Vera是第一款用极限带宽连接所有CPU核心的芯片,没有Chiplet的跨芯片边界损耗,横截面带宽极高。它还是首款采用PCIe Gen 6的产品,也是首款使用LPDDR5X的产品,内存带宽是外界最高性能产品的2到3倍。

第四,是能效。必须极度节能,因为我们想在有限的电力下塞进尽可能多的CPU。因为Token的生成就是赚钱的方式,而昂贵的GPU在等待时成本太高,所以CPU必须同样高效。

这四项属性,即单线程效能、每核心带宽、芯片内外总带宽和能源效率,定义了Vera。与最高性能的x86相比,它的实际单线程效能提升是前所未见的。这就是英伟达的Vera。

Agentic AI改变了CPU的角色。CPU现在是指挥家,GPU是乐团。传统CPU的时代追求最大化每个插槽的核心数并进行虚拟化以按时租赁。但在Agent时代,CPU已成为GPU利用率的瓶颈,直接影响Token的吞吐量、延迟和用户体验。

NVIDIA Vera正是为Agentic循环而打造的CPU,结合了定制化数据中心CPU核心与可扩展的一致性架构,来达到效能与带宽的适当平衡。核心是NVIDIA Olympus Core,专为工具调用和沙盒代码执行等现代工作负载而打造。每个核心都针对吞吐量进行了调整,拥有神经分支预测器、十宽译码引擎,以及大型乱序执行引擎。快速的核心只有在数据准时、正确地到达时才有意义。Vera是首款能在不损失带宽的情况下,用LPDDR5X内存同时修正多个错误的CPU。它还能将峰值内存延迟相较于x86降低40%,保持核心饱和工作。

第二代可扩展连贯性架构将全部88个Olympus核心统一在单一网格上,不分割Chiplet,使得核心间通讯速度比传统CPU快50%。通过NVLink芯片到芯片直接连接,可将多个Vera插座纵向扩展,实现巨大的CPU间带宽。在Agentic沙盒性能上,Vera是x86的1.8倍。

评论已经开始出现,反响非常好。

记住,Grace和Vera也是最受欢迎的、合格的CPU。因为每一个数据中心、云服务商、企业都与英伟达在AI上合作,整个软件堆叠都已为Grace优化。每个公司也将为Vera取得资格认证。Vera将是优化得最好的Agentic CPU,这得益于我们在转换过程中付出的巨大努力。事实上,从外部x86 CPU过渡到Grace Blackwell曾是最大的风险,但我们以惊人的执行力完成了。现在,Grace已经是Grace Blackwell的代名词,无处不在,每家公司的软件和安全堆叠都为它进行了优化。现在,Vera来了,我对此非常兴奋。

看一些效能数据。加速著名的领域特定语言SQL,Vera让它跑快了三倍,不是10%,不是25%,而是三倍。在纽约证券交易所实时串流处理这类应用上,Vera CPU的运行速度是六倍。这都归功于其带宽和单线程指令执行能力。当谈及GPU时,在真实工作负载上谈论数倍的提升很罕见,而这和CPU有关。我为团队感到骄傲,我们有非凡的发展蓝图。

真正令人兴奋的是,每个人都在支持Vera。这是一个全新的市场。过去我们为人制造CPU,现在我们需要为Agent制造CPU。Agentic系统的属性不同,CPU怎么能一样呢?Agent数量会比人多得多,而且它们很没耐心。所以,NVIDIA Vera CPU将开启一个比过去更大的市场。

07每家公司都将拥有自己的“超级Agent员工”

这就是我们的心得,这是下一个十年的应用程序和运算模式:Agent,包含协调中枢、大型语言模型。每家企业都会运行它,都将成为Agent公司。每家公司都在问我们,如何安全地执行Agent?如何为自己的工作负载构建Agent?

为此,我们推出了英伟达的企业AI Agent工具包。公司构建Agent有四项需求:第一,需要模型,越聪明、越便宜、越快越好。第二,需要一个协调中枢。第三,模型需要使用工具和相关的技能,我之前展示的CUDA-X函数库就是极佳的工具。最后,需要一个运行环境,一个能承载一切的操作系统。

打开网易新闻 查看精彩图片

这个工具包包括了可修改的开放模型。其中,OpenShell是一个高度安全的工具包,能让Agent在内部运行,保护其安全,落实安全政策,保护隐私和权限。它是开源的,Red Hat、Canonical、Microsoft等企业都会采用。这个运行环境完全针对英伟达的AI平台优化,因此你可以在任何云、本地部署甚至设备上运行它。

在工具和模型方面,我们有开放的Claude、Hermes等协调中枢。这些Agent可以运行在任何地方。

我最喜欢的Agent用例之一是芯片设计师。我们与Cadence合作,共同构建了用于设计芯片的超级Agent。数十万个英伟达芯片为AI工厂提供动力,而设计这些芯片和系统是最困难的工程挑战之一。在数字领域,一个错误就能让芯片延迟数月,这意味着数千名工程师和数十亿小时的运算被浪费。

Cadence和英伟达的设计验证Agent由Codex协调流程,使用Nemotron模型并由OpenShell保护。它能调用专家子Agent,自动执行RTL生成、测试平台建立、回归测试和调试。它使用Cadence的仿真和形式化验证工具,在代码中自动揭示和修正错误。曾经需要数周的工作,现在只需数小时,验证周期快了40多倍。英伟达有数千名芯片设计师,我们还将“聘请”数十万个Cadence超级Agent一起工作,以加速发展。这也解释了为何我们如此努力地在CUDA上加速Cadence的所有工具,因为Agent没有耐心,想要立刻得到答案。

打开网易新闻 查看精彩图片

而这一切,都需要从一个伟大的模型开始。为此,我们宣布推出Nemotron 3 Ultra,我们的下一个开放模型。它不仅提供模型,还提供所有用于训练的数据。因为我们有一个合作伙伴联盟,大家携手贡献数据。Nemotron是世界上最大的长程推理、工具使用模型之一。由于我们伟大的合作伙伴关系,模型、训练脚本和数据都完全可用。开放模型的最好形态,就是让你可以拿走一切,添加到其中,使其成为你自己的。

Nemotron 3 Ultra使用了状态空间模型与混合专家等混合架构,速度快了五倍,让你能以同样的成本思考更长时间。同时,它便宜了30%。前沿智慧,五倍速度,便宜30%,完全开放。我们完全致力于此,并已在研发Nemotron 4。

整个工具包,即模型、协调中枢、工具和技能、运行环境,就是每家企业创建自己Agent的方式,就像Cadence那样。我们正与CrowdStrike、SAP、ServiceNow、Palantir等许多公司合作。人们总说Agent会扰乱市场,事实恰恰相反,Agent将为我的合作伙伴和朋友们创造有史以来最大的机遇。我们称之为英伟达的企业AI Agent工具包,简称NeMo。

08联手微软打造RTX Spark,重塑AI PC

首先,Vera Rubin已全面投产,包含两颗为Agent新时代打造的Vera CPU。其次,我们推出了英伟达的企业AI工具包,让每个企业和软件公司都能构建Agent。

我与台湾许多朋友和合作伙伴的关系,在很多方面,正是现代计算机工业的起点。40年过去了,英伟达也33岁了。

个人电脑产业始于Windows 1、2和Apple 1、2。当Windows 95出现时,它将PC从企业工具变成了个人化的消费电子设备,每个人都应拥有一台。那个运算平台做对了几件了不起的事:架构被恰当地抽象化,系统、芯片组、操作系统、可动态加载的驱动程序、多媒体API,这些开放的元素共同造就了PC的普及。

40年后,微软与英伟达合作,计划重塑PC。我们为此紧密合作了三年,才完全重塑了PC的运作方式,为这一刻做好准备。未来的个人计算机,将拥有一个能理解你、与你对话、帮你做研究的自主Agent。

打开网易新闻 查看精彩图片

新的操作系统是旧操作系统加上大型语言模型。大型语言模型在很多方面是现代版的DirectX,负责理解提示、视觉、生成影音,作为个人计算机的智能延伸。而现代的应用程序,就是Agent。

让我们看看它能做什么。这一切始于一个火花,一个为AI时代重塑PC的想法。在Agent的世界里,个人AI应是本地连接、沙盒化以保证安全、并持续执行任务的。芯片和操作系统必须进化。

为此,我们推出了RTX Spark。它凝聚了我们33年的所学,提炼成一颗芯片:Blackwell RTX GPU,拥有6144个CUDA核心,1 Petaflop的AI性能,并搭配与联发科合作定制的20核Grace CPU,通过NVLink融为一体,拥有128GB统一内存。它采用台积电3纳米工艺,包含700亿个晶体管。

我们与微软紧密合作,为Agent重塑了个人计算。对创作和游戏而言,这都是新的曙光。比如这款新的007游戏,我很期待去玩。

女士们先生们,这就是搭载RTX Spark的笔记本电脑。这是我们与联发科合作打造的N1X芯片。这颗美丽的芯片耗费了我们33年才打造完成,因为它能100%运行英伟达的整个软件堆叠。你想做数字生物学、地震处理、天体物理学,任何与CUDA相关的领域,都没问题。所有AI,所有计算机图形,所有Windows上运行过的应用程序,都能在这台机器上很好地运行。更重要的是,它现在还能执行Agent。

打开网易新闻 查看精彩图片

想象一下,你可以在家里的RTX Spark计算机上,本地运行一个Nemotron 3 Ultra模型,或连接到云端的Claude等模型,然后让它做出惊人的事情。例如,设计一栋房子。你的Agent可以连接到云端的模型来理解你的草图、风格,然后使用你笔记本上的工具开始工作。它会打开Rhino进行建模,优化成本与舒适性,生成内部布局,自动侦测并修正错误。批准后,它会导出到Blender,调整材质、渲染,甚至使用生成式AI生成逼真的多视角效果图。曾经需要多个专业软件和工作流的复杂过程,现在由你的Agent在本地RTX Spark上引导和简化。

开发者对此非常兴奋。Adobe也已为RTX Spark重新设计了Photoshop和Premiere的核心架构,速度提升两倍,并且通过MCP服务器使其对Agent友好,能与笔记本上的Agent互动。

但这还不是全部。微软正在重塑所有PC。我们宣布推出三款革命性的Windows机器,涵盖台式机、笔记本电脑和工作站,全部100%兼容Windows,100% CUDA,100% NVIDIA AI Tensor Core。这是40年来首次完全重新设计的PC产品线。

这台台式机可以24小时不间断运行你的个人Agent,连接你家里的所有设备,成为你的个人AI。它会随着Nemotron模型的更新而越来越聪明,帮你预订旅行,处理各种事务。而DGX工作站,拥有768GB内存,可以在你的办公桌上运行万亿参数模型,为开发者提供所需的一切运算力。

想想看,15到20年前,我们手里的“电话”不再主要用来打电话。现在,PC也在发生同样的变化。十年后的个人电脑将与今天的完全不同。完全可以想象,未来每个家庭都将拥有一台AI超级计算机,运行你所有的Agent和助手,无时无刻为你服务。这种重塑,其重要性不亚于智能手机的诞生。所以,这是一个全新产品线的开始。我们为此制定了发展蓝图,每一代都会有对应的台式机、笔记本和工作站。我感到无比荣幸,全球PC业界都加入了我们,共同重塑PC。谢谢大家。

09 80%的汽车厂商已加入英伟达生态

大家都知道,生成式AI就像一个数字机器人。Agentic AI已经启程,它将运行在各种计算机上:人类机器人、自动驾驶汽车、卫星、农业和制造业设备,甚至是未来的基站。将有数十亿、数千亿的Agent系统在世界各地运行。

这其中最大的问题是数据。我们过去用人类书写的语言训练模型,但为了构建物理AI,我们需要从机器人的第一人称视角获取数据。我们从远程操作的人类示范开始,结合强化学习,再使用Omniverse进行仿真,最终通过世界基础模型,从第三人称视角生成第一人称数据。

打开网易新闻 查看精彩图片

今天,我们宣布推出Cosmos 3,前沿的物理AI。在语言模型方面有很多人在研究,但在物理AI方面,我们绝对是世界领先。Cosmos 3是基础模型,无论你想创造哪种与物理世界交互的机器人,它都是你的伴侣。它能理解、推理、生成、在循环中仿真,甚至成为策略本身。它建立在全新的混合Transformer架构上,能处理像素、动作、声音和语言流。开发者可以对它进行后训练,使其成为世界模型、仿真器或世界行动模型,用于感知、推理、规划并产生行动。Cosmos 3也是一个完全开放的模型系统,我们开放模型、数据甚至训练方法,让你能将其转化为自己的专有模型。

打开网易新闻 查看精彩图片

模型本身虽然是AI堆叠中最容易理解的部分,但整个堆叠非常复杂。对于物理AI和自动驾驶汽车而言,同样如此。我们宣布推出Alpamayo 2,这是一个为自动驾驶汽车打造的开放模型。全球约80%的汽车制造商正基于NVIDIA Hyperion构建汽车,约97%的移动服务与我们连接。当我们在Hyperion运行时上部署Alpamayo和Halos操作系统时,就能连接全球所有这些服务。Alpamayo是一辆会推理的汽车,能在行驶中不断观察、思考和交互。

对于人形机器人,英伟达的Isaac GR00T是我们的平台,包含模型、数据生成、仿真和运行时环境。就像Agent系统一样,它是完全整合的。今天,我们发布NVIDIA Isaac GR00T参考人形机器人。它是一个完全整合的平台,拥有25个自由度的身体和每只手31个自由度,由Sharpa制造。它运行新的Thor芯片和我们整个软件堆叠,专为研究人员设计,让他们能立刻开始研究,无需从零搭建复杂的管道。

结语:Agentic AI时代,从台湾开始

运算机产业在过去六个月里,一切都变了。因为Agent的推理能力和前沿模型的融合,AI现在可以做有用的工作。这种“模型-协调中枢-工具-技能-运行时”的运算模式将不断重复,贯穿云端、本地、PC和机器人。

Vera Rubin已全面投产,它是为运行Agent而生的、完整的分布式处理系统。英伟达已真正成为一家AI基础设施公司。我们为Agent制造了革命性的Vera CPU。英伟达和微软共同开创了全新的PC产品线。这一切,都标志着Agentic AI时代的开始。

感谢各位的合作与友谊,没有你们,我们无法取得这些成就。为你们的努力感到骄傲。下一年,我们要更上一层楼。

欢迎来到Computex。祝Computex顺利举行。感谢这精彩的一年,感谢各位的友谊与支持。谢谢,保重。