演讲实录|40年来首次PC重设计！黄仁勋发布首款“不是为人设计”的中央处理器|gpu|nvidia|pc|英伟达|黄仁勋

出品 | 网易智能

作者 | 小小

编辑 | 王凤枝

全球近四千万软件工程师，一年薪水三万亿美元。AI让他们产出增加到九万亿。

6月1日，中国台北。英伟达CEO黄仁勋发表演讲，他开场说这里有“世界上最丰富的供应链生态系统”。但没等暖场结束，他就切入了真正的正题：有用的AI来了。

他算的账来自软件领域。全球约三千万到四千万专业开发者，薪资价值约三万亿美元，而AI正在把这部分人力的产出推向数倍增长。黄仁勋想证明的不是AI会简单替代程序员，而是当单位人力产出大幅提升，企业会更愿意扩大开发能力。

由此，他抛出了整场演讲的关键判断：Token正在成为收入和利润单位。AI公司要生产更多Token，就需要更多AI工厂；而AI工厂的效率，取决于芯片、网络、存储、电力、冷却和软件的整体协同。

这背后的计算模式也在变化。过去的AI是模型，你问它答；现在的AI是Agent，它有模型作为大脑，有编排系统作为身体，还能调用软件工具、管理记忆、执行任务。为了运行这种系统，英伟达推出Vera Rubin，把GPU、Vera CPU、NVLink、BlueField、安全、存储和网络整合成面向Agent的多机架计算平台。

在企业侧，英伟达推出Agent工具包和Nemotron 3 Ultra，希望让公司能基于开放模型、训练数据、编排系统和工具链构建自己的“数字员工”。在个人端，它与微软合作，四十年来首次重塑PC，推出RTX Spark，让本地电脑也能运行个人Agent。

演讲最后，黄仁勋把这套逻辑延伸到物理世界：自动驾驶、人形机器人和物理AI也会成为Agentic AI的重要场景。

这场演讲真正想说的是：Agent正在重新定义计算，Token正在重新定义商业模型，而英伟达想成为从云端AI工厂到个人电脑、机器人和汽车的全栈基础设施公司。

以下为黄仁勋演讲全文：

很高兴见到大家。回家真好！

我带了父母回来，请用掌声欢迎我的爸爸妈妈。为我们的暖场巨星鼓掌，女士们先生们，看看他们多可爱，台湾的超级巨星。

今天来了这么多朋友，我们也正向其他70个国家和地区转播。各地观众都在同步参与，台湾也有70个不同的会议正在同时收看这场主题演讲。

我们有太多事情要告诉各位，有太多合作伙伴要感谢。英伟达在台湾已经形成了令人难以置信的生态系统。通常人们想到生态系统，会想到软件堆叠、开发人员，也就是英伟达在运算系统上建立的生态。但英伟达的生态系统跨越所有上游供应商，遍布台湾的供应链，一切从这里开始。下游则延伸至所有数据中心，最终到达用户手中。

今天，我们要谈谈这几乎整个生态系统。这里有如此多的公司，其中不乏我最喜欢的合作伙伴。台湾拥有世界上最丰富、最棒的供应链生态系统，真的令人惊叹。谢谢大家。

今年我们与企业共同成长，成绩斐然。事实上，昨晚有人告诉我，台湾地区每年的GDP几乎将成长10%，实在难以置信。

我们有很多事要说。开始吧！

01说AI会减少就业，完全是一派胡言

两年前我在这里的时候，谈到了人工智能如何改变世界，从生成式AI到后续的几波浪潮。下一波是Agentic AI。而今天可以说，一个巨大且有用的AI，已经到来了。

这是什么意思呢？

来看看GitHub。最早的AI应用之一就是软件编码，这是世界上最有价值的职业领域之一，拥有巨大的生态系统。全球大约有三千万到四千万专业软件开发人员，还有数百万学生和爱好者，总共大约4000万人以编写程序为生。

数据很能说明问题。2023年，代码提交量是3亿次；2024年，4亿次；2025年，5亿次。到了2026年的头几个月，这个数字几乎增加了两倍。

这代表什么？这3000万名软件开发人员，他们的薪资价值约3万亿美元，并支撑起约100万亿美元的全球产业。现在，相当于3万亿的薪水投入，换来了近3倍的产出，也就是约9万亿美元的生产力。

这组数字的差距非同寻常，而这正是AI的潜力所在。

人们总说AI会减少工作，这完全是误解。因为产出的价值如此惊人，企业自然会想雇用更多软件工程师。如果产出曲线是平的，那确实可能会减少招聘。但现在有了如此巨大的价值增长，人们只会想要雇用更多的人。这个趋势很快会在我们的经济中体现出来。

所以，第一件事是，有用的AI来了。

从产业的角度来看，这意味着对Token的需求将异常庞大。因为一旦你能创造这样的价值，你就会想生产更多的Token。同时，Token现在是有利可图的，它们是能产生收入的基本单位。AI公司想要建立更多的生成式AI工厂来生产Token，这就导致了运算需求的暴涨，也正是台湾运算需求激增的原因所在。这就是你们如此忙碌、生意如此兴隆的缘由。

运算模式已经彻底改变了。

02 Agent将成为终极的分布式运算模式

第一个关键想法是，有用的AI已经到来，AI现在是利润的来源，是GDP的组成部分。而新的运算模式，不仅仅是大型语言模型，而是Agent。今天，我们讨论的一切几乎都建立在这个基础上。

让我解释一下什么是Agent。这将是未来的应用程序形态。

它包含代码和操作系统，应用程序代码在其中执行。今天，Agent由一个或多个大语言模型，以及一整套工具组成。这套工具能协助处理企业信息，并进行协调，以完成有成效的工作。Agent需要接收输入，并理解、观察、推理、行动，使用各种工具，比如电子表格、网页浏览器、数据处理引擎、数据库引擎等。

这一切由一个协调中枢来精心安排，它根据上下文理解正在发生的事，推理下一步该做什么，制定行动计划，并调用企业信息。这个协调路径由特定软件执行。

所以，这基本上就是Agent。它和我们人类一样，会处理短期记忆、工作记忆和长期记忆，因此记忆管理系统极其重要。整个这套系统，就称为Agent。其中，大型语言模型负责思考，而协调中枢则像操作系统一样，把所有东西连接在一起。

这就是全新的计算模型。Agent能做许多惊人的事情，这是一个重大突破。大型语言模型在思考、推理、规划和使用工具方面的能力已大幅融合提升，我们如今拥有了这些能力来管理记忆、进行协调并使用工具，就能做到了不起的事。

让我举几个例子。这是一个提示，AI生成了相应的代码。这是输入，这是输出，很惊人吧？我们使用的是云端代码。

另一个例子：输入指令是“创建一个GIF，英伟达的绿点在黑色散点背景上，台北101大楼变形为GTC，再输入两个2026，变形为NVIDIA AI标志，比散射，向右重复”。这就是提示。下一个例子：有人丢了遥控器的电池夹子，于是输入需求，AI使用工具建立了一份用于3D打印的CAD档案。有道理吗？

这就是新的计算模式。过去我们要启动一个应用程序，点击、打字；现在，我们只需要向AI解释我们的意图，由AI生成代码或调用工具，产生我们需要的输出。未来的计算机，就会像这样运算。

我们为此努力了两年，现在它已真正到来。其中一项重大突破，就是工具的使用。

很多人说，AI来了，生成式AI来了，所有软件公司都要倒闭。我的看法恰恰相反，因为未来会有数不清的Agent。世界将不再受限于人口数量，而这些Agent会使用比以往更多的工具。这其实对软件公司来说是不可思议的时代。但关键在于，软件必须以一种Agent能够使用的方式呈现出来。

这是一项重大突破。大家知道英伟达的宝藏是什么，就是我们所有的CUDA函数库，称为CUDA-X函数库。今天，我们能让这些函数库为Agent所用，而且它们使用起来比人类更高效。这对CUDA-X函数库来说，是一个美妙的时刻。

20年前，我们创建了CUDA，为加速运算提供了单一架构，重塑了上千种运算。CUDA-X函数库帮助开发者在各个科学与工程领域取得突破。它们现在就是Agent的工具库，用于光刻运算、购物决策最佳化、直接稀疏求解器等，涵盖了结构化与非结构化数据、AI训练、可微分物理、基因组学等诸多领域。这些算法本身就很优美，让我们为数学鼓掌，数学是美丽的，运算模式也是。

03 Vera Rubin：为Agent而生

让我们回到Agent这个主题。它是终极的分解式、分布式运算模式。有非常多不同的计算机在同时运算，来处理这个Agent。Agent包含模型、协调中枢、工具、技能和一个运行时环境，所有这些都在数据中心的不同位置执行。

你可以把模型想象成大脑，协调中枢是身体，它在一个车间式的环境里使用工具。每个步骤都在计算机的不同部分运算。你会看到，当大型语言模型进行思考、上下文处理、观察环境、推理、计划并行动时，整个机架的Grace Blackwell NVLink系统都会被启动。每当它使用工具时，就会用到CPU，那可能是C编译器、Python、JavaScript，也可能是加速运算。

今天的Agent还算是相对简单的工具使用者，但明天，它们将变得极其复杂。这就是我展示CUDA-X函数库的原因，Agent将会非常需要它们。它们能解决世界上一些最重要的问题。我们所有的CUDA-X函数库，现在都将附带“技能”，相当于一本AI可以学习的操作手册。对Agent而言，使用这些函数库的能力将变得难以置信。

在运行中，工具运行在CPU和GPU上，大语言模型也是如此。安全程序运行在独立的安全处理器上，还有DPU，也就是英伟达的BlueField。而这一切的协调，都在CPU上执行，整个协调中枢都在CPU上统筹工作。

其中一个最棘手的部分就是记忆体。你可以想象工作中的记忆体，也就是我们说的缓存。要记住什么，如何压缩，如何撷取结构化或非结构化数据，数据之间的关联是什么……这整个过程极其复杂。AI的记忆体系统，正在导致存储系统的彻底革新。

你可以看到，运算的每一个层面，都在这种称为Agent的新应用模式下变得全然不同，应用程序执行一大堆软件的方式也彻底改变了。这就是为什么我们需要分解式、分布式的异构计算架构。

这正是新一代Vera Rubin的用武之地。Vera是一个CPU，而Rubin虽然始于GPU，但又远不止于此。Vera Rubin是一个从端到端的整体系统，它拥有GPU、由Vera CPU来统筹，并通过NVLink 72互联。我要告诉你们更多关于这个系统的细节，它还包括革命性的存储、CX9网络，以及名为Doka的软件堆叠，还内建了安全处理器，确保数据在静态、传输和使用中都全程加密。因为AI模型如此珍贵，整个系统都遵循机密运算的标准。

这其中的每一个系统，本身都是一次彻底革命。Vera Rubin是我们公司历史上最具雄心的项目，整个公司4000名工程师都在为此努力，更不用说在座各位的参与。Vera Rubin不只是一个芯片，它的内涵要丰富得多。

多年前，英伟达曾是一家GPU公司，但这些年来，我们已经进化成一家系统公司。你现在看到的是史上最复杂的系统之一。但最终，我们的客户和合作伙伴想要的不是买一台计算机，而是建立AI工厂。

这也是英伟达自身再次转型的原因。你们可以看到，我们的技术如今贯穿在整个基础设施的各个层面，我们的合作伙伴都是基础设施规模级的，涵盖发电机、冷却系统、电网供应商。最终，我们是在尝试建立一个完整的堆叠，就像我们过去构建GPU，构建Grace Blackwell NVLink 72机架一样。现在我们正在构建一个完整的系统堆叠，让客户能以此建立惊人的AI基础设施。

全世界都在竞相打造AI工厂，这是人类历史上最大规模的基础设施建设。AI工厂复杂得令人难以置信，从芯片、机架、网络、电源到冷却系统，每一层都必须从头开始协同设计，因为在这里，运算能力直接等于收入。

英伟达的DSX就是为此而生的蓝图，它为最高效率和获利能力的AI工厂提供了构建和运营的参考设计。从DSX SIM开始，合作伙伴可以借助Omniverse蓝图，在第一个机架落地前，就设计并验证一个英伟达的AI工厂。他们能在数字孪生里规划布局、模拟电源和冷却、设计网络，并验证每一项整合测试。

一旦投入运营，DSX OS就会接手，负责操作、监控并修复基础设施，把已安装的系统变成可信赖的、多租户的、有弹性的AI就绪容量。现在很多AI工厂会过度配置高达40%的电源，而我们的DSX Max LPs技术能让运营商在相同的电力预算下，安全地部署更多GPU，从而增加数十亿的年收入。突破性的45°C温热液冷技术，使用更少的水和能源，把更多能源导向真正产生营收的运算上。动态电源分配技术可以在机架间引导电力，回收被搁置的瓦数，将电力送到需要的地方，并平滑化峰值电流。

贯穿整个工厂，AI Agent的工作团队会持续协调、平衡冷却和电源，以满足工作负载需求。DSX AI工厂还是一个能与电网灵活协作的资产。它能实时读取电网信号，动态调整工厂电力，在电网需要缓解时提供支持。在这十年结束前，将有100GW的AI工厂上线。由英伟达DSX驱动的AI工厂，能以最高效率、最低成本生产Token，还能让电网更强大。

04运算就是收入，选择错的架构等于烧钱

过去我向你们展示的生态系统，是英伟达的运算层和软件堆叠融入第三方平台，去服务终端市场。那是运算生态。

而现在，我要讲的是AI工厂生态。我的上游是在座的各位，下游则是这个生态系统。英伟达不只是在打造GPU或系统，我们正在帮助客户构建这些极其复杂的AI基础设施。每一个工厂的规模从起初的200亿到300亿美元，正发展到500亿、600亿美元，很快将达到每千兆瓦800亿到1000亿美元的投资。如此巨大的资本，必须一次建成、一次成功。资本成本高得惊人，复杂程度也一样。

如你们所见，我们设计一个芯片，再设计计算机，然后模拟整个系统。如今，一切都是在Omniverse中搭建起来的。我为此研究了很久，这就像是梦想成真。我们现在可以在数字世界、在仿真器中，建造这些只要世界有需要、规模就能达成的巨大系统，并在真正动工前完成验证。我们把这一切称为DSX。

如果说RTX是我们的GPU，DGX是我们的系统，那么DSX本质上就是我们为之工作的基础设施。这就是我们的生态系统，它让我们能与小型公司合作，并帮助它们成长为世界级的AI云服务商。例如CoreWeave，现在价值五六百、甚至七百亿美元，成长惊人。还有最近合作的Mebius，成长速度也令人难以置信。这些云平台都有着优秀的客户，比如软件编码公司Cursor、图像生成的Black Forest Labs、世界基础模型公司World Labs、领先的金融AI公司Revolut，以及Shopify。还有Nscale，客户包括英国电信和Google。Google正在使用我们的一家AI云端公司Thinking Machines，还有Frontier Labs，非常令人兴奋。韩国的Neighborhood Cloud服务着韩国银行、现代等公司。印度的Yotta、新加坡和印尼的公司，每一家都在服务区域乃至全球的客户。

AI将会无处不在，每家公司都将由它驱动，每个地区都将构建它。

在台湾，我们有GMI。请给他们掌声，这是令人难以置信的公司，代表着不可思议的机遇。

但它们都需要几样东西。当然，它们需要最底层的运算堆叠，这正是英伟达的成名领域，我们所有的硬件、软件、函数库，以及连接全球第三方生态系统的能力，让任何人都能建立AI云。但AI云极其复杂，运算技术只是其中一部分，资产与金融层面同样关键。

这就是英伟达能成为世界级AI基础设施公司的原因。擅长帮助客户建立并部署AI工厂至关重要，因为运算就是收入，就是利润，无法产生收入就意味着亏损。当AI基础设施上线时，它可能很快见效，也可能需要一段时间；吞吐量可能很高，也可能很低；弹性与可靠性更是千差万别。而它的使用寿命长短，因为这代表着500亿到1000亿美元的资产，所以性能曲线非常重要。

这正是英伟达和伟大合作伙伴们协作的原因，因为我们提供了完全整合的能力。我们不只提供一张幻灯片，我们构建了整个基础设施，把每样东西连接在一起，并自我构建了数十亿的规模来确保一切运转良好。因此，我们拿到第一个Token的时间更短，训练就绪的时间更快。

其次，我们每瓦产生的Token数量是世界级的。原因在于我们整合一切，从头开始协同设计，并模拟整个系统，就像我刚才展示的Vera Rubin机架一样。一切都是按序设计，以提供惊人的吞吐量。如果你的数据中心拥有一千兆瓦的电力，那就只有这么多，每个Token都有利润，都是收入。这意味着，每瓦效能就等于你的收入。仅仅因为某个芯片便宜而选择错误的架构，毫无意义，你需要确保每瓦运算带来的收入。瓦数就代表你能买得越多，赚得越多。

第三点，也是至关重要的一点，是可靠性。如果你有机会看到这些数据中心，有数百万条电缆和无数移动部件，要让所有计算能力和谐运作、保持高可靠性，是非常困难的。我们已经在大规模运营上深耕了很久，这些经验至关重要，直接关系到系统平均故障间隔时间的差异。

最后，软件的演变决定着系统的使用寿命。从几年前的Hopper时代到现在，AI已经完全改变。我们经历了CNN，然后是Transformer，再到专家混合模型，如今是Agent系统。每隔几个月，软件行业就会出现新技术。如果你的架构不够灵活，生态系统不够丰富，资产的生命周期曲线就不可能长。由于全球开发者都在使用英伟达的CUDA，它的使用寿命、生态系统和有用资产将持续得更久。这本质上就是成本差异。你可以把运算看作收入，但收入的另一面是成本。资产寿命越长，总拥有成本就越低，这就是差异所在。

归根结底就是一句话：买得越多，省得越多。现在，你们所有人都在亲身经历这一点。需求如此之高，你们的所有工厂都在全速运转，台湾的每一位员工都在努力工作。因为每个人都意识到，有用的、能盈利的AI已经到来，对运算的需求高得惊人。需求就是我们的制约，所以，让我们一起超级努力，帮助全世界建立起无处不在的AI工厂。

05 Vera Rubin全面投产

我站在你们面前，非常开心。Vera Rubin现已全面投产。我们为Vera Rubin打造的供应链，规模是Grace Blackwell的两倍。而且现在组装一个Grace Blackwell机架需要两小时，而Vera Rubin只需要五分钟。不仅容量更大，吞吐量也快了很多。我们需要这一切来满足需求。这个生态系统非同寻常，数百万平方英尺的厂房已经就绪，为Grace Blackwell和Vera Rubin做准备。我要感谢你们所有人。Vera Rubin现已全面投入生产。

过去，大型语言模型生成答案。现在，AI Agent能够执行任务。但处理生成式AI是完全不同的问题。Agent需要观察、推理、计划和使用工具，他们要处理大量的上下文、工作记忆和长期记忆，还会衍生出子Agent专家。英伟达的Vera Rubin正是一个多机架集群规模的系统，专为处理Agent式AI程序而设计，现已全面投产。整个制造业供应链的自动化与协调，堪称奇迹，见证了我们一路的旅程。

从我们推出第一台AI超级计算机DGX-1开始，在过去十年，我们将每个芯片和系统都推向了极限。从Pascal和第一代NVLink，到Grace Blackwell，第一台机架级AI超级计算机，再到如今的Vera Rubin，第一台为Agentic时代而生的多机架集群级超级计算机。

一切从台积电开始。构成Vera Rubin的七颗新芯片需要经过数百道工序。3纳米制程，CoWoS-L封装，来自SK海力士和三星的HBM高带宽记忆体。Vera Rubin运算板上集成了数万亿个晶体管和超过18,000个元件。Vera Rubin NVLink 72负责处理提示、上下文理解、推理与规划。接着是全新的模块化运算托盘，采用全新PCB中板精简设计，通过超级芯片连接X9超级网卡和BlueField-4 DPU，全程无缆线设计，弹性面向AI工厂规模。18个运算托盘、9个热处理器、可抽换式NVLink交换机、新的高效率液冷歧管，汇流排承载超过5000安培电流，相当于20辆全力加速的电动汽车的动力总和。超过130万个元件组成了这第三代MGX机架设计。

祝贺微星，带来了Vera Rubin NVLink 72工程机架。祝贺戴尔和CoreWeave，以及他们的Vera Rubin NVLink 72工程机架。

接下来是Vera CPU机架，在单一液冷机架中集成256个CPU，负责模型协调和记忆体数据调度，由富士康和广达推出。Grok 3 LPU初具雏形，256个Grok 3 LPU横跨16个托架，拥有每秒40PB的SRAM带宽和超低延迟，能够以最高吞吐量生成Token，延迟最低。

Vera BlueField-4 ST是AI保存记忆的地方，通过BlueField实现存储处理加速、记忆体和存储的连接以及片上安全。还有英伟达Spectrum-X以太网光子学技术，这是全球首款共封装光学以太网交换机，由台积电合作制造，在磷化铟上实现了芯片级封装和超高功率激光模块。

Vera Rubin，由五个互连的机架规模系统组成的超级计算机，为AI Agent而生。全台湾150家供应链合作伙伴，数百万平方英尺的厂房，数百个据点，将芯片、系统与数据中心推进到功率与规模的极限。这就是我们所说的极限协同设计。我们与台湾一起做到了这一点。我们一起为AI时代重塑了运算。台湾从一开始就和我们在一起，今天也在这里，把Vera Rubin带给全世界。谢谢台湾。

女士们先生们，Vera Rubin不只是为AI而生，它是为运行Agent而生的。Agent是计算机科学最新的突破，花了多年时间才让其潜力得以发挥并变得有用。而Vera Rubin，作为世界上最先进的运算计算机，正是其得以立足的根基。

这是Vera Rubin NVLink 72，这是Grok LPU，将在下次GTC详谈。这是Vera CPU机架，256颗CPU，全液冷。这是Vera BlueField存储处理与安全系统。还有我们Mellanox的网络，世界上第一个共封装光学产品。

当我们构建Hopper时，预训练是最重要的应用。到了Grace Blackwell，很多人说，预训练很棒，但推理很简单。但事实上，推理就等于金钱，而模型又极其复杂，要在极短的反应时间内实现高吞吐量，极其困难。这正是NVLink 72的意义。

今天，英伟达的Token成本是全球最低的，不是低10%，而是以数量级计算的因子。这全都归功于我们的极限协同设计和对运算模式的深刻理解，我们因此才能创造出NVLink 72。

现在，Vera Rubin更进一步，它是在Agent系统中进行推理。看看它，没有电缆、没有软管、没有风扇。上次我给你们看的时候，到处都是电缆。现在有了PCB中板连接两边，原来需要两小时的工作，现在只需五分钟。Vera Rubin的可靠性和弹性将非同寻常。

这是我们的Vera CPU托盘，有史以来最先进的CPU。这是存储托盘。这是我们全新的LPU，Grok系统设计专为极低延迟推理。这是Vera Rubin NVLink交换机托盘，革命性的设计。这是我们的以太网扩展交换机。为Grace Blackwell打造的这两个系统，让今天的英伟达成为了最大的网络公司之一，我为网络团队感到骄傲。

06史上第一款“不是为人设计”的CPU

现在，我们来谈谈CPU。Vera CPU，是为AI时代打造的CPU。

至今所有的CPU都是为人而造的。我们是使用者，生活在以秒为单位的世界，在云端按小时租赁CPU，所以希望核心越多越好。但Agent不同，Agent很没有耐心。它们生活在纳秒级的世界里。当它调用工具或访问数据库时，需要响应越快越好。Agent等待的每一刻，都会阻碍它进入下一步。所以，我们必须让CPU的互动延迟尽可能低。因此，我们创造了Vera CPU。

在我们的系统中，它被用于三种方式。第一，用于思考。在Vera Rubin机架内，有两颗CPU，一颗负责编排、管理GPU和KV缓存，处理所有运行软件；同时还有BlueField负责安全和隔离。

第二，用于统筹。Vera Compute负责运行AI的协调中枢，进行模型工具的使用编排，访问数据库和数据。服务器就在此。

第三，是Vera BlueField，用于构建世界上最快、有史以来最快的存储系统。这之所以如此重要，是因为Agent正在以难以置信的速度访问记忆体。这些存储服务器和CPU现在是数据中心中成本最高昂的部分，也是关键路径。AI工厂的经济就是Token，而Token就在这里被创造出来，所以你必须制造尽可能多的Token，绝不能让它成为瓶颈。

这对Vera CPU架构提出了极高要求，一个从零开始的全新架构。我们称之为Vera，这是专为Agent打造的CPU。

有四个要点。第一，是每时钟周期的指令数，我们需要极低的延迟和极高的单线程效能。Vera的每时钟指令数是全球最高的，能在一个周期内读取、解码并执行10条指令。

第二和第三，都是带宽。数据移入移出CPU的带宽必须是世界级的。因为Agent系统的本质是分解和分布式的，网络就成了关键。因此，CPU核心之间、CPU与存储之间、CPU与GPU之间的数据移动都必须尽可能地快。Vera是第一款用极限带宽连接所有CPU核心的芯片，没有Chiplet的跨芯片边界损耗，横截面带宽极高。它还是首款采用PCIe Gen 6的产品，也是首款使用LPDDR5X的产品，内存带宽是外界最高性能产品的2到3倍。

第四，是能效。必须极度节能，因为我们想在有限的电力下塞进尽可能多的CPU。因为Token的生成就是赚钱的方式，而昂贵的GPU在等待时成本太高，所以CPU必须同样高效。

这四项属性，即单线程效能、每核心带宽、芯片内外总带宽和能源效率，定义了Vera。与最高性能的x86相比，它的实际单线程效能提升是前所未见的。这就是英伟达的Vera。

Agentic AI改变了CPU的角色。CPU现在是指挥家，GPU是乐团。传统CPU的时代追求最大化每个插槽的核心数并进行虚拟化以按时租赁。但在Agent时代，CPU已成为GPU利用率的瓶颈，直接影响Token的吞吐量、延迟和用户体验。

NVIDIA Vera正是为Agentic循环而打造的CPU，结合了定制化数据中心CPU核心与可扩展的一致性架构，来达到效能与带宽的适当平衡。核心是NVIDIA Olympus Core，专为工具调用和沙盒代码执行等现代工作负载而打造。每个核心都针对吞吐量进行了调整，拥有神经分支预测器、十宽译码引擎，以及大型乱序执行引擎。快速的核心只有在数据准时、正确地到达时才有意义。Vera是首款能在不损失带宽的情况下，用LPDDR5X内存同时修正多个错误的CPU。它还能将峰值内存延迟相较于x86降低40%，保持核心饱和工作。

第二代可扩展连贯性架构将全部88个Olympus核心统一在单一网格上，不分割Chiplet，使得核心间通讯速度比传统CPU快50%。通过NVLink芯片到芯片直接连接，可将多个Vera插座纵向扩展，实现巨大的CPU间带宽。在Agentic沙盒性能上，Vera是x86的1.8倍。

评论已经开始出现，反响非常好。

记住，Grace和Vera也是最受欢迎的、合格的CPU。因为每一个数据中心、云服务商、企业都与英伟达在AI上合作，整个软件堆叠都已为Grace优化。每个公司也将为Vera取得资格认证。Vera将是优化得最好的Agentic CPU，这得益于我们在转换过程中付出的巨大努力。事实上，从外部x86 CPU过渡到Grace Blackwell曾是最大的风险，但我们以惊人的执行力完成了。现在，Grace已经是Grace Blackwell的代名词，无处不在，每家公司的软件和安全堆叠都为它进行了优化。现在，Vera来了，我对此非常兴奋。

看一些效能数据。加速著名的领域特定语言SQL，Vera让它跑快了三倍，不是10%，不是25%，而是三倍。在纽约证券交易所实时串流处理这类应用上，Vera CPU的运行速度是六倍。这都归功于其带宽和单线程指令执行能力。当谈及GPU时，在真实工作负载上谈论数倍的提升很罕见，而这和CPU有关。我为团队感到骄傲，我们有非凡的发展蓝图。

真正令人兴奋的是，每个人都在支持Vera。这是一个全新的市场。过去我们为人制造CPU，现在我们需要为Agent制造CPU。Agentic系统的属性不同，CPU怎么能一样呢？Agent数量会比人多得多，而且它们很没耐心。所以，NVIDIA Vera CPU将开启一个比过去更大的市场。

07每家公司都将拥有自己的“超级Agent员工”

这就是我们的心得，这是下一个十年的应用程序和运算模式：Agent，包含协调中枢、大型语言模型。每家企业都会运行它，都将成为Agent公司。每家公司都在问我们，如何安全地执行Agent？如何为自己的工作负载构建Agent？

为此，我们推出了英伟达的企业AI Agent工具包。公司构建Agent有四项需求：第一，需要模型，越聪明、越便宜、越快越好。第二，需要一个协调中枢。第三，模型需要使用工具和相关的技能，我之前展示的CUDA-X函数库就是极佳的工具。最后，需要一个运行环境，一个能承载一切的操作系统。

这个工具包包括了可修改的开放模型。其中，OpenShell是一个高度安全的工具包，能让Agent在内部运行，保护其安全，落实安全政策，保护隐私和权限。它是开源的，Red Hat、Canonical、Microsoft等企业都会采用。这个运行环境完全针对英伟达的AI平台优化，因此你可以在任何云、本地部署甚至设备上运行它。

在工具和模型方面，我们有开放的Claude、Hermes等协调中枢。这些Agent可以运行在任何地方。

我最喜欢的Agent用例之一是芯片设计师。我们与Cadence合作，共同构建了用于设计芯片的超级Agent。数十万个英伟达芯片为AI工厂提供动力，而设计这些芯片和系统是最困难的工程挑战之一。在数字领域，一个错误就能让芯片延迟数月，这意味着数千名工程师和数十亿小时的运算被浪费。

Cadence和英伟达的设计验证Agent由Codex协调流程，使用Nemotron模型并由OpenShell保护。它能调用专家子Agent，自动执行RTL生成、测试平台建立、回归测试和调试。它使用Cadence的仿真和形式化验证工具，在代码中自动揭示和修正错误。曾经需要数周的工作，现在只需数小时，验证周期快了40多倍。英伟达有数千名芯片设计师，我们还将“聘请”数十万个Cadence超级Agent一起工作，以加速发展。这也解释了为何我们如此努力地在CUDA上加速Cadence的所有工具，因为Agent没有耐心，想要立刻得到答案。

而这一切，都需要从一个伟大的模型开始。为此，我们宣布推出Nemotron 3 Ultra，我们的下一个开放模型。它不仅提供模型，还提供所有用于训练的数据。因为我们有一个合作伙伴联盟，大家携手贡献数据。Nemotron是世界上最大的长程推理、工具使用模型之一。由于我们伟大的合作伙伴关系，模型、训练脚本和数据都完全可用。开放模型的最好形态，就是让你可以拿走一切，添加到其中，使其成为你自己的。

Nemotron 3 Ultra使用了状态空间模型与混合专家等混合架构，速度快了五倍，让你能以同样的成本思考更长时间。同时，它便宜了30%。前沿智慧，五倍速度，便宜30%，完全开放。我们完全致力于此，并已在研发Nemotron 4。

整个工具包，即模型、协调中枢、工具和技能、运行环境，就是每家企业创建自己Agent的方式，就像Cadence那样。我们正与CrowdStrike、SAP、ServiceNow、Palantir等许多公司合作。人们总说Agent会扰乱市场，事实恰恰相反，Agent将为我的合作伙伴和朋友们创造有史以来最大的机遇。我们称之为英伟达的企业AI Agent工具包，简称NeMo。

08联手微软打造RTX Spark，重塑AI PC

首先，Vera Rubin已全面投产，包含两颗为Agent新时代打造的Vera CPU。其次，我们推出了英伟达的企业AI工具包，让每个企业和软件公司都能构建Agent。

我与台湾许多朋友和合作伙伴的关系，在很多方面，正是现代计算机工业的起点。40年过去了，英伟达也33岁了。

个人电脑产业始于Windows 1、2和Apple 1、2。当Windows 95出现时，它将PC从企业工具变成了个人化的消费电子设备，每个人都应拥有一台。那个运算平台做对了几件了不起的事：架构被恰当地抽象化，系统、芯片组、操作系统、可动态加载的驱动程序、多媒体API，这些开放的元素共同造就了PC的普及。

40年后，微软与英伟达合作，计划重塑PC。我们为此紧密合作了三年，才完全重塑了PC的运作方式，为这一刻做好准备。未来的个人计算机，将拥有一个能理解你、与你对话、帮你做研究的自主Agent。

新的操作系统是旧操作系统加上大型语言模型。大型语言模型在很多方面是现代版的DirectX，负责理解提示、视觉、生成影音，作为个人计算机的智能延伸。而现代的应用程序，就是Agent。

让我们看看它能做什么。这一切始于一个火花，一个为AI时代重塑PC的想法。在Agent的世界里，个人AI应是本地连接、沙盒化以保证安全、并持续执行任务的。芯片和操作系统必须进化。

为此，我们推出了RTX Spark。它凝聚了我们33年的所学，提炼成一颗芯片：Blackwell RTX GPU，拥有6144个CUDA核心，1 Petaflop的AI性能，并搭配与联发科合作定制的20核Grace CPU，通过NVLink融为一体，拥有128GB统一内存。它采用台积电3纳米工艺，包含700亿个晶体管。

我们与微软紧密合作，为Agent重塑了个人计算。对创作和游戏而言，这都是新的曙光。比如这款新的007游戏，我很期待去玩。

女士们先生们，这就是搭载RTX Spark的笔记本电脑。这是我们与联发科合作打造的N1X芯片。这颗美丽的芯片耗费了我们33年才打造完成，因为它能100%运行英伟达的整个软件堆叠。你想做数字生物学、地震处理、天体物理学，任何与CUDA相关的领域，都没问题。所有AI，所有计算机图形，所有Windows上运行过的应用程序，都能在这台机器上很好地运行。更重要的是，它现在还能执行Agent。

想象一下，你可以在家里的RTX Spark计算机上，本地运行一个Nemotron 3 Ultra模型，或连接到云端的Claude等模型，然后让它做出惊人的事情。例如，设计一栋房子。你的Agent可以连接到云端的模型来理解你的草图、风格，然后使用你笔记本上的工具开始工作。它会打开Rhino进行建模，优化成本与舒适性，生成内部布局，自动侦测并修正错误。批准后，它会导出到Blender，调整材质、渲染，甚至使用生成式AI生成逼真的多视角效果图。曾经需要多个专业软件和工作流的复杂过程，现在由你的Agent在本地RTX Spark上引导和简化。

开发者对此非常兴奋。Adobe也已为RTX Spark重新设计了Photoshop和Premiere的核心架构，速度提升两倍，并且通过MCP服务器使其对Agent友好，能与笔记本上的Agent互动。

但这还不是全部。微软正在重塑所有PC。我们宣布推出三款革命性的Windows机器，涵盖台式机、笔记本电脑和工作站，全部100%兼容Windows，100% CUDA，100% NVIDIA AI Tensor Core。这是40年来首次完全重新设计的PC产品线。

这台台式机可以24小时不间断运行你的个人Agent，连接你家里的所有设备，成为你的个人AI。它会随着Nemotron模型的更新而越来越聪明，帮你预订旅行，处理各种事务。而DGX工作站，拥有768GB内存，可以在你的办公桌上运行万亿参数模型，为开发者提供所需的一切运算力。

想想看，15到20年前，我们手里的“电话”不再主要用来打电话。现在，PC也在发生同样的变化。十年后的个人电脑将与今天的完全不同。完全可以想象，未来每个家庭都将拥有一台AI超级计算机，运行你所有的Agent和助手，无时无刻为你服务。这种重塑，其重要性不亚于智能手机的诞生。所以，这是一个全新产品线的开始。我们为此制定了发展蓝图，每一代都会有对应的台式机、笔记本和工作站。我感到无比荣幸，全球PC业界都加入了我们，共同重塑PC。谢谢大家。

09 80%的汽车厂商已加入英伟达生态

大家都知道，生成式AI就像一个数字机器人。Agentic AI已经启程，它将运行在各种计算机上：人类机器人、自动驾驶汽车、卫星、农业和制造业设备，甚至是未来的基站。将有数十亿、数千亿的Agent系统在世界各地运行。

这其中最大的问题是数据。我们过去用人类书写的语言训练模型，但为了构建物理AI，我们需要从机器人的第一人称视角获取数据。我们从远程操作的人类示范开始，结合强化学习，再使用Omniverse进行仿真，最终通过世界基础模型，从第三人称视角生成第一人称数据。

今天，我们宣布推出Cosmos 3，前沿的物理AI。在语言模型方面有很多人在研究，但在物理AI方面，我们绝对是世界领先。Cosmos 3是基础模型，无论你想创造哪种与物理世界交互的机器人，它都是你的伴侣。它能理解、推理、生成、在循环中仿真，甚至成为策略本身。它建立在全新的混合Transformer架构上，能处理像素、动作、声音和语言流。开发者可以对它进行后训练，使其成为世界模型、仿真器或世界行动模型，用于感知、推理、规划并产生行动。Cosmos 3也是一个完全开放的模型系统，我们开放模型、数据甚至训练方法，让你能将其转化为自己的专有模型。

模型本身虽然是AI堆叠中最容易理解的部分，但整个堆叠非常复杂。对于物理AI和自动驾驶汽车而言，同样如此。我们宣布推出Alpamayo 2，这是一个为自动驾驶汽车打造的开放模型。全球约80%的汽车制造商正基于NVIDIA Hyperion构建汽车，约97%的移动服务与我们连接。当我们在Hyperion运行时上部署Alpamayo和Halos操作系统时，就能连接全球所有这些服务。Alpamayo是一辆会推理的汽车，能在行驶中不断观察、思考和交互。

对于人形机器人，英伟达的Isaac GR00T是我们的平台，包含模型、数据生成、仿真和运行时环境。就像Agent系统一样，它是完全整合的。今天，我们发布NVIDIA Isaac GR00T参考人形机器人。它是一个完全整合的平台，拥有25个自由度的身体和每只手31个自由度，由Sharpa制造。它运行新的Thor芯片和我们整个软件堆叠，专为研究人员设计，让他们能立刻开始研究，无需从零搭建复杂的管道。

结语：Agentic AI时代，从台湾开始

运算机产业在过去六个月里，一切都变了。因为Agent的推理能力和前沿模型的融合，AI现在可以做有用的工作。这种“模型-协调中枢-工具-技能-运行时”的运算模式将不断重复，贯穿云端、本地、PC和机器人。

Vera Rubin已全面投产，它是为运行Agent而生的、完整的分布式处理系统。英伟达已真正成为一家AI基础设施公司。我们为Agent制造了革命性的Vera CPU。英伟达和微软共同开创了全新的PC产品线。这一切，都标志着Agentic AI时代的开始。

感谢各位的合作与友谊，没有你们，我们无法取得这些成就。为你们的努力感到骄傲。下一年，我们要更上一层楼。

欢迎来到Computex。祝Computex顺利举行。感谢这精彩的一年，感谢各位的友谊与支持。谢谢，保重。