打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

真正的创新,不是把事情做得更快,而是把事情做得更“便宜、更稳定、更可复制”。

作者 | 思岭

一、一个判断


刚刚的CES 2026上,黄仁勋带着Vera Rubin超算架构向全世界走来!Rubin的推理性能比Blackwell提升了5倍,训练性能提升3.5倍,成本降低10

但是,Vera Rubin,不是一代芯片,而是一种算力生产方式的升级如果你只把Vera Rubin 看成“Blackwell 的 5 倍性能版”,那你低估了它。

Vera Rubin真正做的事情只有一句话:

把 AI 算力,从“昂贵的科研资源”,变成“可以工业化生产的基础设施”。

这和当年从蒸汽机到电力的跃迁,本质是同一件事。

二、为什么 Blackwell 不够了?

我们先回到一个基本问题:

今天的AI,卡在了哪里?

答案不是模型,也不是算法,而是——系统规模化

  • 万亿参数模型→ 不是“单卡更强”,而是多卡协同更高效

  • Agentic AI、长上下文 → 不是“算得更快”,而是存得住、调得动

  • 企业级部署→ 不是“性能峰值”,而是单位Token成本

Blackwell 解决了单卡极限问题而 Rubin 解决的是——系统工程问题

这,是一次典型的“范式转移”。

三、Vera Rubin 的技术原理

不再堆卡,而是把数据中心设计成一台计算机

Blackwell 像一辆性能炸裂的超跑;

Rubin,则是把整个高速公路系统重新设计了一遍

它的关键创新,不在某一颗芯片,而在整体架构的协同设计

可以把Rubin的技术拆成四个层面看。

1️⃣算力层:NVFP4 +第三代Transformer Engine

Rubin GPU 的核心,是NVFP4精度体系

它不是简单“更低精度”,而是:

  • 逐层分析Transformer计算特性

  • 动态调整精度、路径和算子

结果是:

  • 推理性能:5

  • 单 Token 成本:1/10

  • MoE 训练 GPU 数量:减少到1/4

这是一种算法-硬件共设计(Co-design的典型范式。

2️⃣调度层:Vera CPU的战略意义

很多人忽略了 Vera CPU。

但我认为,这是 Rubin 架构里最被低估的一步棋

  • 88 个自研 Olympus 核心

  • Armv9.2 全兼容

  • NVLink-C2C 高速直连 GPU

它解决的不是“算力”,而是——GPU等数据的空转浪费

在 Agentic AI 时代,调度效率=真实算力

3️⃣互联与存储:NVLink 6 + BlueField-4

AI 推理真正的瓶颈是什么?

不是算,是KV Cache上下文

Rubin 用了一个极聪明的做法:

在 GPU 内存和传统存储之间,创造“第三层上下文内存”。

由 BlueField-4 DPU 统一管理。

结果是:

  • 推理吞吐提升5

  • 72 GPU 像一个超级GPU协同

  • 推理成本直接降到1/7

4️⃣系统级封装:NVL72 + DGX SuperPOD

这一步,才是“工业化”的关键。

  • 72 GPU → 一个 NVL72

  • 8 个 NVL72 → 一个 SuperPOD

  • 数千 Agent、百万 Token 上下文 → 开箱即用

英伟达不再卖零件,而是卖工厂

四、从知识产权角度看,英伟达做对了什么?

1️⃣芯片专利升级为系统专利

Rubin 的护城河,不是某一项发明,而是:

  • GPU 微架构

  • 精度体系

  • CPU-GPU 协同

  • 互联协议

  • DPU 调度

  • 机架级封装

这是专利组合拳(Patent Thicket

你绕过一项,绕不过系统。

2️⃣软硬一体,锁死可替代性

  • NVFP4 精度标准

  • NVLink 私有互联

  • BlueField 数据路径

  • Omniverse / Cosmos / Isaac 软件栈

即使硬件被模仿,生态无法复制。

这是典型的:

以架构为核心的知识产权战略

3️⃣开源,不是放弃IP,而是定义标准

Cosmos、GR00T、AlphaMayo 全家桶开源,表面看是“开放”。

但本质是:

  • 定义物理 AI 的数据格式

  • 定义仿真的世界模型范式

  • 定义训练-推理-仿真的三计算机体系

谁掌握标准,谁掌握未来的许可权。

五、Vera Rubin 上市后,对 AI 产业意味着什么?

判断一:


算力焦虑将从技术问题,变成工程问题

  • 万亿模型→ 不再是“烧钱竞赛”

  • 企业级 AI → 成本首次可预测

  • 长上下文、Agent → 真正跑得起来

AI从科研,走向产业。

判断二:


云厂商与模型公司,将进一步绑定英伟达

AWS、Azure、Google Cloud、OpenAI、Meta 首批部署 Rubin。

这意味着:

  • 下一代 GPT / Gemini / Claude

  • 底层假设:Rubin级系统存在

这会形成新的路径依赖

判断三:


物理AI,将成为下一个十年的主战场

AlphaMayo、Cosmos、Isaac GR00T 不是“自动驾驶 demo”。

它们代表的是:

AI 从“理解文本”,走向“理解世界”。

机器人、汽车、工厂、医疗设备,都会被重构。

六、给知产人和企业的三点建议

最后,说点IP人“能用的”。

建议一:

别只盯模型专利,要盯系统协同专利

未来的高价值专利,一定是:

  • 算法× 架构 × 调度 × 数据流

单点创新,越来越难防守。

建议二:

提前布局推理侧上下文管理

训练专利红利期正在过去,

推理效率、成本、隐私计算才是下一个金矿。

建议三:

关注标准型开源的隐性IP价值

不是所有开源,都是放弃控制。

有些开源,是为了:

让全世界,按你的方式思考问题。

结 语

真正的创新,不是把事情做得更快,而是把事情做得更便宜、更稳定、更可复制

Vera Rubin 做到的,正是这件事。

当算力像电一样被生产出来,一个由物理 AI 驱动的新世界,已经不可逆地开始了。

而英伟达,正在用系统级创新与知识产权,

站在这个世界的“总开关”旁边。

——这,才是Vera Rubin真正的意义。

(本文仅代表作者观点,不代表知产力立场)

封面来源 | AI