打开网易新闻 查看精彩图片

当地时间2026年3月16日,被称为“AI行业年度朝圣”的英伟达GTC2026大会在圣何塞拉开帷幕。黄仁勋身着标志性皮夹克登场,用一场超两小时的演讲,彻底重构了AI产业的商业逻辑与技术版图。他不再只谈芯片,而是以“Token工厂经济学”为核心,宣告英伟达从“芯片公司”向“AI基础设施与工厂公司”的蜕变,同时抛出“2027年至少1万亿美元需求”的震撼预期,将AI算力的价值与未来,推向了全新高度。

打开网易新闻 查看精彩图片

一、万亿需求的底气:Token工厂经济学,算力即收入

黄仁勋开场便直击市场最关心的问题——AI算力需求是否见顶、英伟达增长空间几何。他给出的答案,是从5000亿美元直接翻倍至1万亿美元,且强调“实际需求会比这高得多,我们甚至会供不应求”。这一数字瞬间引爆市场,英伟达股价盘中一度涨超4.3%。

打开网易新闻 查看精彩图片

支撑万亿预期的,是黄仁勋提出的全新商业思维——Token工厂经济学。他重新定义了数据中心:不再是存储文件的仓库,而是生产Token(AI生成的基本单位)的“工厂”。而所有工厂的命脉,都被“电力”牢牢锁住——1GW的工厂永远变不成2GW,这是物理定律。在固定功率下,每瓦Token吞吐量,直接决定生产成本与商业竞争力。

他将AI服务划分为五大商业层级,从免费层到超高速层,Token单价从0飙升至每百万150美元。模型越大、上下文越长,AI越聪明,但Token生成速率越低;而吞吐量和生成速度,会直接转化为企业的真实收入。英伟达的核心优势,正是让客户在免费层实现极高吞吐量,同时在最高价值的推理层级,将性能提升35倍。

目前,英伟达60%业务来自全球前五超大型云服务商,剩余40%覆盖主权云、企业、工业、机器人、边缘计算等全领域。这种“通用+多元”的布局,让万亿投入能被充分利用,拥有长久生命周期,也让“成本最低的AI基础设施”的定位,成为万亿需求的坚实基础。

打开网易新闻 查看精彩图片

二、技术硬核:VeraRubin与Groq,两年350倍加速的算力革命

在Token工厂的物理极限下,英伟达拿出了史上最复杂的AI计算系统——VeraRubin。黄仁勋直言,提到Hopper是一块芯片,提到VeraRubin,是一整套系统。这套100%液冷、无传统线缆的系统,将机架安装时间从两天压缩至两小时,通过端到端软硬件协同设计,实现了算力的跨越式突破。

短短两年,VeraRubin将Token生成速率从2200万提升至7亿,增长350倍,而同期摩尔定律仅能带来约1.5倍提升。其NVL72机架通过NVLink6技术,连接72块RubinGPU与36块VeraCPU,仅需上一代1/4的GPU即可完成混合专家模型训练,相同电力下推理吞吐量提升50倍,每百万Token成本降低35倍。

为解决极速推理(1000Tokens/秒)的带宽瓶颈,英伟达整合收购的Groq,推出非对称分离推理方案。Groq芯片拥有500MBSRAM,主打极致速度;Rubin芯片拥有288GB内存,主打极致容量。两者通过Dynamo框架协同:Pre-fill和Attention交给VeraRubin处理,Decode阶段的Token生成卸载给Groq,延迟直接减半。这种组合,让高端推理性能再涨35倍,解锁了此前不存在的极速推理场景。

打开网易新闻 查看精彩图片

三、模型生态:OpenClaw与Nemotron联盟,智能体时代的操作系统

AI从“工具”走向“智能体”,是黄仁勋演讲的另一核心。他将OpenClaw定义为Agent计算机的“操作系统”,称其是“人类历史上最受欢迎的开源项目,几周内超越Linux三十年成就”。为此,英伟达推出NemoClaw软件栈,主打“一键部署”,内置安全沙箱与隐私保护,让企业轻松构建自定义智能体。

在模型层面,英伟达构建了覆盖全领域的自研模型矩阵:Nemotron大语言模型、Cosmos世界基础模型、GROOT通用人形机器人模型、Alpamayo自动驾驶模型、BioNeMo数字生物学模型、Phys-AI物理AI模型。其中,Nemotron3Ultra被称为“史上最强基础模型”,支持各国构建主权AI;Nemotron3已跻身全球三大最佳模型之列。

为加速模型迭代,英伟达宣布成立Nemotron联盟,投资数十亿美元推进基础模型研发,成员包括BlackForestLabs、Mistral、Perplexity、印度Sarvam、MiraMurati的ThinkingMachines等全球顶尖AI团队。越来越多企业软件公司将NeMoClaw参考设计与英伟达智能体工具包整合,推动企业IT从“工具时代”全面迈入“智能体时代”。

打开网易新闻 查看精彩图片

四、物理AI爆发:机器人、自动驾驶,具身智能的规模化落地

如果说数字智能体在虚拟世界“干活”,物理AI则是让智能体走进现实世界——机器人。本次GTC有110款机器人亮相,几乎覆盖全球所有机器人研发企业。英伟达提供“三台计算机+完整软件栈+AI模型”的全栈方案:训练计算机负责模型训练,仿真计算机通过Omniverse模拟真实世界,机载计算机(如Jetson)让机器人实时感知与行动。

演讲最后,迪士尼Olaf雪宝机器人登台互动,成为全场亮点。它搭载Jetson计算机,在Omniverse中通过Newton求解器(英伟达与迪士尼、DeepMind联合开发)学会走路,动作自然、对话流畅。黄仁勋畅想,未来迪士尼乐园将满是这样的机器人角色,而这只是物理AI落地的缩影。

自动驾驶领域,黄仁勋宣告“ChatGPT时刻已经到来”。英伟达RoboTaxiReady平台新增比亚迪、现代、日产、吉利四大伙伴,四家车企年总产量达1800万辆,加上此前的奔驰、丰田、通用,自动驾驶版图覆盖全球主流车企。同时,英伟达与Uber达成合作,将在多城市部署RoboTaxiReady车辆,接入Uber出行网络。

工业领域,ABB、库卡、优傲等头部机器人企业与英伟达合作,将物理AI模型与仿真系统结合,推动机器人进入全球制造产线;卡特彼勒、T-Mobile则将AI融入工程机械与电信基站,让无线基站成为NVIDIAAerialAIRAN,实现智能化边缘计算与节能增效。

五、时代拐点:推理即核心,AI工厂重构全球产业

整场演讲,黄仁勋反复强调一个核心结论:AI已进入推理拐点。推理成为AI最核心的工作负载,Token成为新的大宗商品,推理性能直接决定企业收入。数据中心从存储设施变为Token生产工厂,未来每家公司的竞争力,都将由“AI工厂效率”衡量。

从万亿需求的商业逻辑,到VeraRubin与Groq的技术突破,再到OpenClaw智能体生态与物理AI的规模化落地,英伟达完成了从“芯片供应商”到“AI基础设施定义者”的彻底转型。黄仁勋用一场演讲,不仅给出了英伟达未来两年的增长蓝图,更指明了整个AI产业的发展方向——算力不再是成本,而是核心生产力;智能体不再是概念,而是企业标配;物理AI不再是实验室产物,而是改变现实世界的核心力量。

GTC2026之后,AI产业的竞争逻辑已彻底改变。谁能掌握Token工厂的效率,谁能构建完善的智能体生态,谁能推动物理AI落地,谁就能在未来的AI时代占据先机。而英伟达,已经站在了这场变革的最前沿。