黄仁勋这次的话说得挺满:"汽车开始具备自主推理能力,不再只是单纯行驶。"这话从别人嘴里出来可能就是个比喻,但英伟达刚发布的Alpamayo 2 Super,确实在尝试把"思考"这个能力塞进自动驾驶系统里。
6月1日,英伟达正式推出了Alpamayo 2 Super。这是一款拥有320亿参数的视觉-语言-动作模型——业内通常叫VLA模型。它的定位很明确:一个开源的、"教师"级别的基础模型,专门用来训练更小的车载模型。简单说,它不是直接跑在车上的那个,而是负责把知识蒸馏出来、喂给轻量化版本的那个"老师傅"。
但这次升级不只是一个模型。英伟达同时发布了一套完整工具链:AlpaGym负责闭环强化学习训练,OmniDreams能生成逼真的长尾驾驶场景,还有基于Omniverse NuRec的神经重建能力,可以从真实车队视频里批量制造合成数据。打通的是从数据采集、仿真训练到实车部署的全流程。
Alpamayo 2 Super跟前代比,参数规模从100亿直接拉到320亿,翻了3倍。但数字涨了不是最关键的。关键是能力边界拓宽了:以前只负责生成轨迹,现在覆盖推理、规划和执行整个链条。它支持逻辑推理、自动标注、场景理解、模型评估,还能把大模型知识蒸馏到轻量化版本里。目标是L4级自动驾驶——那种不需要人类随时接管的水平。
技术上几个升级值得拆开看。第一是全车环视。传统方案大多靠前置摄像头感知前方,Alpamayo 2 Super换成360度全景环境感知,覆盖前、侧、后方视野,变道、并线、路口通行这些操作有了完整环境信息。第二是新增"元动作输出"——不再只是预测下一帧方向盘转多少度,而是能做出"礼让"、"变道"、"停车"这类高层级驾驶决策预判,附带因果链溯源,解释为什么做这个决策。
第三个升级直接关系到开发效率:推理式自动标注。自动驾驶数据标注一直是个烧钱烧时间的活,传统方式动辄几个月。Alpamayo 2 Super搭载了结合二维目标定位的推理式自动标注功能,号称能把标注周期从数月压缩到数日。这意味着数据链路的成本和效率被大幅优化。
黄仁勋的表态里还提了一点:可解释性。他说这套系统"让车辆识别极端场景、解释决策逻辑、建立安全信任"。这对应的是合规监管需求——L4上车,监管部门不可能接受一个"反正模型说该这么走"的黑箱。你得说清楚为什么刹车、为什么变道。Alpamayo 2 Super的因果链溯源能力,就是在解决这个问题:模仿学习在长尾场景下容易出错,现在模型能追溯决策依据。
训练框架上也有变化。传统开环训练只看历史录制数据,模型输出一次动作就结束了。AlpaGym提供的是闭环强化学习平台:模型在仿真环境里持续循环"决策-感知",每次制动、转向都会实时改变仿真环境。这意味着静态数据集发现不了的累积误差和极端场景故障,会被逼出来,模型在实战模拟里持续学习。英伟达还在GitHub上开源了因果链自动标注流程,基于原始行车视频全自动生成带决策依据的标注数据,不需要人工参与。
Alpamayo系列近期拿了台北国际电脑展的最佳选择奖,车载技术与智能座舱类别。下载量接近40万次。开源平台附带后训练脚本,方便开发者结合自有数据集和驾驶策略做二次适配。Alpamayo 2 Super的推理代码预计今年夏天上线GitHub,模型权重同步发布在Hugging Face。
英伟达公布的采用名单里,包括比亚迪、吉利、极氪、小米和小马智行。这些中国车企和自动驾驶公司已经在用或者正在基于NVIDIA Hyperion平台开发智驾系统。从百亿参数的Alpamayo 1 Nano到320亿参数的Alpamayo 2 Super,整个教师模型体系完成迭代后,后来者不需要从零搭建自动驾驶核心基础设施,可以直接继承高水准的推理和感知能力。
说到底,这轮发布的核心逻辑是:英伟达不仅卖芯片,还在构建一个从模型到仿真工具到数据的完整开发生态。让车企能快速搭出L4级自动驾驶系统,并且这套系统能解释自己的行为——这对监管、对用户信任、对规模化部署到数百万辆车,都是硬前提。
热门跟贴