汽车开始"思考"了？英伟达掏出320亿参数新模型|物理世界|自动驾驶|英伟达|黄仁勋

黄仁勋这次的话说得挺满："汽车开始具备自主推理能力，不再只是单纯行驶。"这话从别人嘴里出来可能就是个比喻，但英伟达刚发布的Alpamayo 2 Super，确实在尝试把"思考"这个能力塞进自动驾驶系统里。

6月1日，英伟达正式推出了Alpamayo 2 Super。这是一款拥有320亿参数的视觉-语言-动作模型——业内通常叫VLA模型。它的定位很明确：一个开源的、"教师"级别的基础模型，专门用来训练更小的车载模型。简单说，它不是直接跑在车上的那个，而是负责把知识蒸馏出来、喂给轻量化版本的那个"老师傅"。

但这次升级不只是一个模型。英伟达同时发布了一套完整工具链：AlpaGym负责闭环强化学习训练，OmniDreams能生成逼真的长尾驾驶场景，还有基于Omniverse NuRec的神经重建能力，可以从真实车队视频里批量制造合成数据。打通的是从数据采集、仿真训练到实车部署的全流程。

Alpamayo 2 Super跟前代比，参数规模从100亿直接拉到320亿，翻了3倍。但数字涨了不是最关键的。关键是能力边界拓宽了：以前只负责生成轨迹，现在覆盖推理、规划和执行整个链条。它支持逻辑推理、自动标注、场景理解、模型评估，还能把大模型知识蒸馏到轻量化版本里。目标是L4级自动驾驶——那种不需要人类随时接管的水平。

技术上几个升级值得拆开看。第一是全车环视。传统方案大多靠前置摄像头感知前方，Alpamayo 2 Super换成360度全景环境感知，覆盖前、侧、后方视野，变道、并线、路口通行这些操作有了完整环境信息。第二是新增"元动作输出"——不再只是预测下一帧方向盘转多少度，而是能做出"礼让"、"变道"、"停车"这类高层级驾驶决策预判，附带因果链溯源，解释为什么做这个决策。

第三个升级直接关系到开发效率：推理式自动标注。自动驾驶数据标注一直是个烧钱烧时间的活，传统方式动辄几个月。Alpamayo 2 Super搭载了结合二维目标定位的推理式自动标注功能，号称能把标注周期从数月压缩到数日。这意味着数据链路的成本和效率被大幅优化。

黄仁勋的表态里还提了一点：可解释性。他说这套系统"让车辆识别极端场景、解释决策逻辑、建立安全信任"。这对应的是合规监管需求——L4上车，监管部门不可能接受一个"反正模型说该这么走"的黑箱。你得说清楚为什么刹车、为什么变道。Alpamayo 2 Super的因果链溯源能力，就是在解决这个问题：模仿学习在长尾场景下容易出错，现在模型能追溯决策依据。

训练框架上也有变化。传统开环训练只看历史录制数据，模型输出一次动作就结束了。AlpaGym提供的是闭环强化学习平台：模型在仿真环境里持续循环"决策-感知"，每次制动、转向都会实时改变仿真环境。这意味着静态数据集发现不了的累积误差和极端场景故障，会被逼出来，模型在实战模拟里持续学习。英伟达还在GitHub上开源了因果链自动标注流程，基于原始行车视频全自动生成带决策依据的标注数据，不需要人工参与。

Alpamayo系列近期拿了台北国际电脑展的最佳选择奖，车载技术与智能座舱类别。下载量接近40万次。开源平台附带后训练脚本，方便开发者结合自有数据集和驾驶策略做二次适配。Alpamayo 2 Super的推理代码预计今年夏天上线GitHub，模型权重同步发布在Hugging Face。

英伟达公布的采用名单里，包括比亚迪、吉利、极氪、小米和小马智行。这些中国车企和自动驾驶公司已经在用或者正在基于NVIDIA Hyperion平台开发智驾系统。从百亿参数的Alpamayo 1 Nano到320亿参数的Alpamayo 2 Super，整个教师模型体系完成迭代后，后来者不需要从零搭建自动驾驶核心基础设施，可以直接继承高水准的推理和感知能力。

说到底，这轮发布的核心逻辑是：英伟达不仅卖芯片，还在构建一个从模型到仿真工具到数据的完整开发生态。让车企能快速搭出L4级自动驾驶系统，并且这套系统能解释自己的行为——这对监管、对用户信任、对规模化部署到数百万辆车，都是硬前提。