★ 设为星标 | 只讲人话,带你玩转AIGC。

英伟达一年一度的 GTC 已经变成了一个行业盛会,而今年的 GTC 热度不仅没减,人数反而创了历史新高,比去年多了 5000 多人(20%)。

这样的规模使得圣何塞会议中心都塞不下,老黄的演讲最近几年都在更大的 SAP Center 举行。(用来办演唱会的地方)

打开网易新闻 查看精彩图片

图:SAP Center

尽管如此,挤了 3 万多人的 SAP Center 还是没扛住,现场 WIFI 和手机信号全部瘫痪了,所以很多人还是选择在家看直播。

1. 那些被低估的前菜:CUDA 二十岁与 DLSS 5

老黄一上来没急着发新卡,而是先大打感情牌,庆祝了自家护城河 CUDA 的 20 岁生日。

打开网易新闻 查看精彩图片

图:CUDA 20 周年

他还调侃了一句大实话:“GeForce 就是英伟达史上最成功的营销活动。”

确实,没有当年咱们买游戏显卡的钱,哪来今天满世界的 AI 计算?

顺带一提,老黄还给游戏党和渲染党发了个福利:DLSS 5 来了,主打一个“3D引导的神经渲染”,画面党狂喜。

打开网易新闻 查看精彩图片

图:DLSS5

但前菜过后,正餐立刻端了上来。

老黄甩出一个极其夸张的预测:因为 ChatGPT 和像 Claude Code 这种具备“推理和行动”能力的 AI 爆发,到 2027 年,全球对算力的需求将高达 1 万亿美元!

打开网易新闻 查看精彩图片

那么,这泼天的富贵,英伟达打算怎么接?

2. 算力终极巨兽:Vera Rubin 与“插满 GPU 的墙”

这就得请出今天的主角:Vera Rubin 平台。

打开网易新闻 查看精彩图片

图:Vera Rubin NVL72

如果你还停留在“买张显卡插在电脑里”的思维,那格局就小了。

打开网易新闻 查看精彩图片

图:Vera Rubin Node

现在的 AI 算力,根本不是按“张”卖,而是按“柜”卖,老黄在感叹他现在不能再只举起一块芯片了。

这次最震撼的硬件形态,是Rubin Ultra 配合全新的 Kyber 机架。

这玩意儿有多离谱?它不是像抽屉一样横着推进机柜的,而是垂直安装的!

打开网易新闻 查看精彩图片

图:Kyber Midplane

打开网易新闻 查看精彩图片

图:NVLink 后置板

前面全是算力卡,后面全是 NVLink 互联网络。一个机柜里密密麻麻塞了 144 颗 GPU。

而且,传统风冷早就压不住这些核弹了。

老黄直接展示了 45 度温水液冷技术:未来的数据中心,连一根杂乱的线缆都看不见(全部移除了),全靠水流带走恐怖的热量。

打开网易新闻 查看精彩图片

图:传Vera Rubin Nodes

同时,老黄还顺手发布了独立的 Vera CPU 机架,以及搭配 BlueField-4 DPU 的上下文内存存储平台(KV Cache),把存储厂商全拉上了自己的贼船。

3. 豪掷 200 亿买下 Groq,底牌终于揭晓

接下来,是全场最硬核,也是业内最关注的焦点:英伟达去年底花了 200 亿美元收购的当红炸子鸡 Groq,到底拿来干嘛?

打开网易新闻 查看精彩图片

图:Groq LPU 2

懂行的朋友可能会问,英伟达自家 GPU 吞吐量那么猛,图啥?

老黄现场给出了答案,这也是我认为整场发布会最精妙的商业阳谋:“分离推理”(Disaggregated Inference)。

打开网易新闻 查看精彩图片

图:分离推理

我打个通俗的比方:Vera Rubin 就像是大学里的老教授(GPU擅长吞吐和预填充),能一口气读完一万本书。而 Groq 的 LPU 就像是反应极快的抢答选手(LPU擅长极低延迟的解码)。

老黄用自家的软件把这俩缝合在一起:让 Rubin 负责读题,让 Groq 负责飞速往外蹦答案。

打开网易新闻 查看精彩图片

图:Groq

这套组合拳一出,在高频对话场景下,硬生生把性能拉高了 35 倍!这也解决了 NVL72 带宽不足的问题。

这意味着,如果你的公司只做高吞吐,买 Rubin 就行。如果要做实时语音交互的 AI,那你得再买点 Groq 的芯片加进去。

老黄还剧透了:今年下半年三星代工的 Groq LP3 就会发货。

打开网易新闻 查看精彩图片

图:Groq 3 LPX

老黄透露,Vera Rubin的采样进展非常顺利。Azure已经完成了他们的第一个机架部署。“我们已经全面投产了”

而且 2028 年,下一代代号为 Feynman(费曼) 的 GPU 和新 CPU Rosa 已经在路上了。

打开网易新闻 查看精彩图片

图:NVIDIA Roadmap

这更新速度,根本不给对手喘息的机会。

4. 属于全人类的“HTML 时刻”:OpenClaw 诞生

小龙虾 OpenClaw 几乎一夜之间爆炸,老黄将它视为过去 30 年来最重要的开源发展之之一。

打开网易新闻 查看精彩图片

图:OpenClaw github star 增长

老黄极其隆重地推出了一个英伟达版的小龙虾:NemoClaw。

打开网易新闻 查看精彩图片

图:英伟达 NemoClaw Deamo

他甚至用了最极端的词来形容:“这玩意儿的意义,堪比当年互联网诞生时的 HTML!”

简单来说,这是一个专门用来“捏” AI Agent(智能体)的操作系统。

这一点我非常认同,OpenClaw 就像一个操作系统,而我们安装的各种 Skills 就是那些 APP。

打开网易新闻 查看精彩图片

图:AI Agents

以前企业想搞个 AI 员工,得养一帮程序员。现在,在 NemoClaw 上像搭积木一样,就能配出一个会自己读文件、发邮件、跟进客户的赛博打工人。

老黄甚至预言,未来每个工程师入职,公司除了发电脑,还会给你发一笔“Token(算力)预算”。(老黄不知道?中国已经有公司这么做了)

NVIDIA 正在与 OpenClaw 开发者合作,使OpenClaw 适用于企业使用。

英伟达甚至推出了“小龙虾”OpenClaw 智能体平台的 NemoClaw 软件栈,主打“一键安装”体验。

打开网易新闻 查看精彩图片

看来小龙虾的火,不止在中国。

5. 从虚拟到现实:上天、建厂与造人

最后,英伟达的野心彻底冲出了屏幕。

老黄反复强调一个词:物理 AI(Physical AI)。

  • 建厂: 发布 DSX AI 工厂平台,帮你像玩《模拟城市》一样,在电脑里完美模拟和调度整个真实的数据中心。

  • 上天: 掏出了一个叫 Space-1 的太空模块,AI 算力直接干到了外太空。

打开网易新闻 查看精彩图片

图:Space-1

造人(机器人): 联合比亚迪、丰田搞自动驾驶就不说了,现场甚至牵出了迪士尼那个会走路的雪人机器人 Olaf。

打开网易新闻 查看精彩图片

图:Olaf2

虽然在 30 度的圣何塞展示雪人有点黑色幽默,但意思很明确:未来的 AI 是长着手脚、能在真实世界里干活的。

天快亮了。

2 个多小时的发布会看下来,我似乎变得比以往平淡了很多,没有以往那么振奋。

老黄的演讲流程似乎都固化了,但除了性能又提高了多少倍,似乎没什么真正让我觉得震撼的东西。(记得有一年跟一排机器人在一起,还是让人眼前一亮)

当然也可能是市场终于回归一种理性了,不再爆出各种让人一惊一乍的“黑科技”了。

好了,通宵码字实在肝不动了。你觉得这次发布会有啥亮点?评论区聊聊,我去补觉了。