当一辆车开始学会“观察、思考、然后行动”,它就不再仅仅是一个交通工具。2025年,随着理想i8的交付,全球首个量产的VLA(视觉-语言-行为)司机大模型驶入现实。这并非一次寻常的辅助驾驶升级,而是一次关乎AI如何理解物理世界的本质跃迁。理想的VLA,将引领我们去往何处?答案或许远超辅助驾驶本身。

打开网易新闻 查看精彩图片

从“模仿”到“思考”的必然

理想汽车的辅助驾驶演进历程,在某种程度上,是中国智能汽车产业技术攻坚与认知深化的一面镜子,也深刻揭示了VLA的里程碑式意义。理想汽车辅助驾驶早期应用的BEV鸟瞰图、NPN先验网络、无图方案均属于“人工时代”的产物,依赖工程师编写的海量规则,其天花板是无法穷尽的极端场景。随后到来的“端到端+VLM”架构让理想汽车辅助驾驶迈入了“AI时代”,本质是通过模仿人类驾驶数据来学习,但理想汽车董事长兼CEO李想认为端到端方案仍是“猴子开车”——能模仿行为,却不理解物理世界背后的逻辑。

真正的转折点出现在2025年初。当端到端模型的训练数据超过1000万Clips(视频片段)后,理想汽车研发团队发现性能提升放缓。同时,“模仿学习”固有的缺陷开始显现:模型缺乏深度推理能力,导致驾驶行为有时违反常理,在面对复杂博弈时安全感不足。VLM视觉语言模型的引入试图补足“大脑”,但其与端到端控制模型之间的“沟通壁垒”和较慢的推理速度,成了新的瓶颈。

打开网易新闻 查看精彩图片

正是在此背景下,VLA技术路线被推至台前。但与此同时,行业内也同步出现了选择世界模型作为车端推理模型的技术路线。一时间,行业内外对于两种新兴的技术路线产生了分歧,选择VLA路线的认为世界模型受到车端算力等约束,而选择世界模型的则认为VLA路线是“过渡技术”。理想汽车自动驾驶高级副总裁郎咸朋的观点一针见血:“空谈架构不如看疗效。”他表示,坚持VLA有两个原因:第一,因为理想汽车拥有超过150万辆车提供的海量真实数据,同时理想汽车构建了数据闭环(意味着可以将海量数据真正应用于VLA司机大模型的训练,提升辅助驾驶性能);第二,在当前的算力下,VLA能够让辅助驾驶的驾驶水平接近人类驾驶员。截至2025年底,VLA司机大模型推送后月使用率达到80%,VLA指令使用次数达到1225.4万次“从目前用户使用的反馈看,在某些场景下理想的VLA已经具备了对物理世界的认知涌现。具体表现是用户会越来越多的发现之前端到端没有的拟人行为。”郎咸朋说。

郎咸朋提到的“拟人行为”实际上正是理想汽车面向未来的关键。拟人行为背后不再是简单模仿人类,而是需要模型能看到物理世界并且会思考。这也是李想眼中,AI演进的必然结果——从昆虫动物智能(对应规则算法)到哺乳动物智能(对应端到端+VLM),再到人类智能(对应VLA司机大模型)。VLA司机大模型具备思维链式的推理能力,更贴近人类理解世界的方式,并且可以把人类语义融入行为判断,最显性的能力就是用户可以通过语音指挥车辆。VLA,正是为汽车赋予“人类智能”的关键一步。

打开网易新闻 查看精彩图片

从辅助驾驶到具身智能基座的野望

VLA的价值,远不止于提升辅助驾驶的通行效率和拟人化程度。在理想的规划中,它正成为下一代AI系统的技术基座。在2025年第三季度电话会上,李想将公司的未来赛道明确为“具身智能”,在他看来,将汽车定义为“具身智能产品”,而非简单的电动车或智能终端,是价值升维的关键。这意味着汽车将从被动响应指令的工具,转变为能自动、主动提供服务的机器人。

VLA,正是这个“机器人大脑”的核心基座。它让汽车开始具备“思维链”推理能力,能理解复杂场景并做出决策;其语言智能使得人车自然交互成为可能;而通过行为强化学习,它还在不断进化,无限逼近人类驾驶的“老司机”体感。这一能力的持续进化近期迎来了一个新的节点。2026年1月21日,随着OTA 8.2正式推送,AD Max平台的VLA司机大模型迎来重磅升级。理想汽车自动驾驶研发高级副总裁郎咸朋对新版本的VLA司机大模型总结道:“这个版本用户体验提升最明显的就是更加像人在开车了,大幅度减少了机械感的顿挫以及无效变道。” 他进一步透露,团队针对早期版本为保障安全而妥协的舒适性与效率,通过对数据重新清洗和筛选,并替换约200万段优质驾驶数据进行强化训练,使模型能力获得了显著提升。基于过去两个月在北京、上海、深圳、杭州等多地累计上千公里的实际对比测试,郎咸朋认为:“我非常确认OTA 8.2后的VLA就是行业领先。”

打开网易新闻 查看精彩图片

当VLA的能力边界随着数据与算力持续扩展,最终突破L3/L4级自动驾驶门槛时,汽车就将蜕变为真正的“汽车机器人”。理想在辅助驾驶上的深耕,实质上是在锻造一套通用的具身智能AI系统:感知、模型、操作系统、算力、本体。

更具深远意义的是,理想的探索正在引发广泛的产业涟漪。2025年以来,部分领先的辅助驾驶企业、汽车企业,均开始关注或探索VLA路线。这验证了其技术方向的前瞻性。理想的实践,不仅为其自身构筑了深厚的技术护城河,更如同一个探针,为行业验证了一条将大规模数据、先进算法与工程化能力深度融合,从而锻造出可进化、能思考的“硅基生命体”的可行路径。

理想汽车向具身智能的坚定转型,或许正释放出一个强烈信号:辅助驾驶产业的终极形态,可能并非只是“无人驾驶”,而是孵化出成熟的具身智能产品;传统汽车产业与人工智能的深度融合,催生的将是一个全新的“具身智能产业”。

打开网易新闻 查看精彩图片

这场变革的核心,不再是功能的简单叠加或单一技术的突破,而是如何系统性地打造一个能理解物理世界、可学习进化、并能安全高效交互的AI系统。VLA司机大模型,是理想给出的当下答案,也是它面向那个更广阔未来所交出的第一张船票。当汽车开始真正学会观察、思考与行动,一场关于出行、关于机器人、乃至关于人机共存的产业新叙事,才刚刚拉开序幕。