算力，终于像电一样被“发明”出来了|gpu|rubin|上下文|深度思考按钮|算力|算法

真正的创新，不是把事情做得更快，而是把事情做得更“便宜、更稳定、更可复制”。

作者 | 思岭

一、一个判断

刚刚的CES 2026上，黄仁勋带着Vera Rubin超算架构向全世界走来！Rubin的推理性能比Blackwell提升了5倍，训练性能提升3.5倍，成本降低10倍

但是，Vera Rubin，不是一代芯片，而是一种“算力生产方式”的升级如果你只把Vera Rubin 看成“Blackwell 的 5 倍性能版”，那你低估了它。

Vera Rubin真正做的事情只有一句话：

把 AI 算力，从“昂贵的科研资源”，变成“可以工业化生产的基础设施”。

这和当年从蒸汽机到电力的跃迁，本质是同一件事。

二、为什么 Blackwell 不够了？

我们先回到一个基本问题：

今天的AI，卡在了哪里？

答案不是模型，也不是算法，而是——系统规模化。

万亿参数模型→ 不是“单卡更强”，而是多卡协同更高效
Agentic AI、长上下文 → 不是“算得更快”，而是存得住、调得动
企业级部署→ 不是“性能峰值”，而是单位Token成本

Blackwell 解决了单卡极限问题，而 Rubin 解决的是——系统工程问题。

这，是一次典型的“范式转移”。

三、Vera Rubin 的技术原理

不再堆卡，而是把数据中心设计成一台计算机

Blackwell 像一辆性能炸裂的超跑；

Rubin，则是把整个高速公路系统重新设计了一遍。

它的关键创新，不在某一颗芯片，而在整体架构的协同设计。

可以把Rubin的技术拆成四个层面看。

1️⃣算力层：NVFP4 +第三代Transformer Engine

Rubin GPU 的核心，是NVFP4精度体系。

它不是简单“更低精度”，而是：

逐层分析Transformer计算特性
动态调整精度、路径和算子

结果是：

推理性能：5倍
单 Token 成本：1/10
MoE 训练 GPU 数量：减少到1/4

这是一种算法-硬件共设计（Co-design）的典型范式。

2️⃣调度层：Vera CPU的战略意义

很多人忽略了 Vera CPU。

但我认为，这是 Rubin 架构里最被低估的一步棋。

88 个自研 Olympus 核心
Armv9.2 全兼容
NVLink-C2C 高速直连 GPU

它解决的不是“算力”，而是——GPU等数据的空转浪费

在 Agentic AI 时代，调度效率=真实算力。

3️⃣互联与存储：NVLink 6 + BlueField-4

AI 推理真正的瓶颈是什么？

不是算，是KV Cache和上下文。

Rubin 用了一个极聪明的做法：

在 GPU 内存和传统存储之间，创造“第三层上下文内存”。

由 BlueField-4 DPU 统一管理。

结果是：

推理吞吐提升5倍
72 GPU 像一个超级GPU协同
推理成本直接降到1/7

4️⃣系统级封装：NVL72 + DGX SuperPOD

这一步，才是“工业化”的关键。

72 GPU → 一个 NVL72
8 个 NVL72 → 一个 SuperPOD
数千 Agent、百万 Token 上下文 → 开箱即用

英伟达不再卖“零件”，而是卖“工厂”。

四、从知识产权角度看，英伟达做对了什么？

1️⃣芯片专利升级为系统专利

Rubin 的护城河，不是某一项发明，而是：

GPU 微架构
精度体系
CPU-GPU 协同
互联协议
DPU 调度
机架级封装

这是专利组合拳（Patent Thicket）。

你绕过一项，绕不过系统。

2️⃣软硬一体，锁死可替代性

NVFP4 精度标准
NVLink 私有互联
BlueField 数据路径
Omniverse / Cosmos / Isaac 软件栈

即使硬件被模仿，生态无法复制。

这是典型的：

以架构为核心的知识产权战略

3️⃣开源，不是放弃IP，而是定义标准

Cosmos、GR00T、AlphaMayo 全家桶开源，表面看是“开放”。

但本质是：

定义物理 AI 的数据格式
定义仿真的世界模型范式
定义训练-推理-仿真的三计算机体系

谁掌握标准，谁掌握未来的许可权。

五、Vera Rubin 上市后，对 AI 产业意味着什么？

判断一：

“算力焦虑”将从技术问题，变成工程问题

万亿模型→ 不再是“烧钱竞赛”
企业级 AI → 成本首次可预测
长上下文、Agent → 真正跑得起来

AI从科研，走向产业。

判断二：

云厂商与模型公司，将进一步“绑定”英伟达

AWS、Azure、Google Cloud、OpenAI、Meta 首批部署 Rubin。

这意味着：

下一代 GPT / Gemini / Claude
底层假设：Rubin级系统存在

这会形成新的路径依赖。

判断三：

物理AI，将成为下一个十年的主战场

AlphaMayo、Cosmos、Isaac GR00T 不是“自动驾驶 demo”。

它们代表的是：

AI 从“理解文本”，走向“理解世界”。

机器人、汽车、工厂、医疗设备，都会被重构。

六、给知产人和企业的三点建议

最后，说点IP人“能用的”。

建议一：

别只盯“模型专利”，要盯“系统协同专利”

未来的高价值专利，一定是：

算法× 架构 × 调度 × 数据流

单点创新，越来越难防守。

建议二：

提前布局“推理侧”与“上下文管理”

训练专利红利期正在过去，

推理效率、成本、隐私计算，才是下一个金矿。

建议三：

关注“标准型开源”的隐性IP价值

不是所有开源，都是放弃控制。

有些开源，是为了：

让全世界，按你的方式思考问题。

结语

真正的创新，不是把事情做得更快，而是把事情做得更“便宜、更稳定、更可复制”。

Vera Rubin 做到的，正是这件事。

当算力像电一样被生产出来，一个由物理 AI 驱动的新世界，已经不可逆地开始了。

而英伟达，正在用系统级创新与知识产权，

站在这个世界的“总开关”旁边。

——这，才是Vera Rubin真正的意义。

（本文仅代表作者观点，不代表知产力立场）

封面来源 | AI

算力，终于像电一样被“发明”出来了

热搜

热门跟贴

热搜

热门跟贴

相关推荐

发明它的人真是天才，能造“闪电”，还能隔空导电

数字时代要完了！量子计算机让电脑变算盘，免费能源时代来了？

不得不感叹，科技的力量真是强大

也不知道哪位人才研究的，真的太实用了，科技的尽头原来是它！

消息：《寻秘自然：地球往事》参加全国科普月校园公益放映活动

便捷高效，不得不佩服劳动人民的智慧

电车续航的问题，终于解决了，这下终于实现自给自足

键盘本身就变成了一台完整的电脑！

美国彻底失势！中国冲向电气化文明，人类未来格局已定

万万没想到现在电工竟然这么先进，接电缆这么省事，真是大开眼界

究竟是谁发明的动力传输机，真是太有才了

真听懂了，好强的大脑

关键时刻，得相信科技的力量

这个开关出来的电，可不是抖抖这么简单了，稍有不慎直接见阎王！

学了半辈子，终于装到了

终于可以充电了

电脑绣花机的效率，怕不是人工的数十倍，发明者妥妥的天才！

用哈气代替大脑，用代码代替思考

《麻省理工科技评论》发布2026年“十大突破性技术”

分体、全景、机械臂！六大玩家CES交卷：影像赛道打法变了