如果你对智能车感兴趣,那么从去年开始,无论是刷资讯、看发布会还是探店,你大概率会反复看到一个词——VLA。
它就像智能车圈的“顶流黑话”,不懂它,就好像没有完全挖掘这台车的价值。
VLA是什么?
厂家会告诉你:视觉-语言-动作大模型。
翻译一下就是——给车装了一个“会看、会理解、会动手”的数字大脑。
VLA的概念最早是在2023年提出,率先应用于机器人领域,再扩散到智能驾驶领域,从去年开始集中量产。
有了VLA的参与,一台车确实有了具身智能的雏形。
语言层的参与,让它既可以应用于智能座舱,让车内的AI智能体具备理解、记忆、沟通的功能;
也可以应用于辅助驾驶,让车辆可以结合语言思维去推理,驾驶动作更合常理。
那么VLA上车,将会把我们的实际用车方式变成什么样呢?
我们放下配置表,直接来体验。
这台魏牌V9X,搭载了长城最新的双VLA架构——行车VLA负责辅助驾驶,座舱VLA负责交互。
来看看掌握语言技能的魏牌V9X,在辅助驾驶和智能座舱方面表现如何。
作为9系,魏牌V9X有着近5.3m的车长,操控起来确实更需要眼观八方的技术。
我们开着魏牌V9X走了一条难度偏高、多拥挤狭窄的路线,设置完导航就原地开启了VLA领航辅助驾驶。
首先从开车范围上,魏牌V9X的VLA辅助驾驶就和我们手动驾驶一样,能从车位到车位。
它不仅可以原地开启领航,驶出车位,还能通过闸机,连接主路。
接下来我们按城中村表现、日常表现以及语音控车三个方面来分享它的体验。
城中村
大车走城中村的最大压力就是控制好和繁杂障碍物的距离。
在这段路上,两边停满了车,车道线都起不了作用,魏牌V9X就像我们自己“凭感觉”一样,从中间的空位穿过。
当然,毕竟是靠传感器,魏牌V9X对于周围距离有更“数据化”的判断方式。
比如这次窄路会车,表现非常惊艳。
绝大部分辅助驾驶系统感知到和周围障碍物过近时,都会选择原地停车并发出距离过近的警示音,以免犯错刮蹭。
但魏牌V9X的系统很积极,它对通行狭窄距离的阈值还是比较高,能在更苛刻的空间条件下保持运行。
即使这种路况已经窄到360° 全景影像都触发了,它还是在分析空间后主动寻找通行路径,实时测距并成功通过。
在桥洞这种明暗交替的环境中,它也能捕捉到对向从亮处驶进桥洞的两轮车,谨慎地绕过两边行人和车。
日常
在日常开启辅助驾驶的过程中,小魏同学都会通过图片和文字的方式展示自己的思考过程。
这是小魏同学通过语言知识来推理当前路况如何处理的体现。
我们也可以通过这些信息了解这套系统的思路,如果产生分歧那我们可以提前介入操作,和系统更好地搭档。
比如在潮汐车道路段,它就实时汇报了所见,驶过路口后也是进入了唯一可行的车道。
面对有红绿灯的环岛路段,即使我们设置了一整圈路线,都没有干扰它找到正确的出口。
对VLA辅助驾驶来说,比按路线行驶更难学的是像人类一样因为情绪去调整一些驾驶细节。
我们在体验时,发现小魏同学就有这样一些让我们感到舒适的动作调整。
比如右转时,右侧有遮挡视线的树,左侧有直行的车,魏牌V9X就进行了防御性减速。
车身转过来后视野变开阔,再自然提速。
如果这时候系统不做这样的减速,我们可能会因为担心盲区风险而不信任系统,但它做出了和我们同频的反应。
这不是写死的规则,而是一整段思考的过程,另外一段绕行展示的更明显。
魏牌V9X转进巷子后,迅速发现前方一台临停车并起意绕行。
当靠近想绕时,由于对向两次来车,系统都选择了避让。
这时候前方障碍车往前挪了一点意思意思,我们就缓缓跟,再找时机绕了过去。
全程的节奏非常正常,即使这段路受阻,我们也不会觉得烦躁,因为让驾驶员接管也会这么开。
面对各种路况,VLA能做到高度拟人的原因,除了从各种数据抓规律学习,它还用“语言知识”补课了。
就像我们看就能看会几分,但如果有人教了我们几句,像哪种情况应该怎么做,那我们就能有更明确的概念。
VLA系统在训练时也会通过语言作为融合的纽带,给看到的视觉画面加深对应的特征。语言能够覆盖相当一大类场景,系统理解场景就更透彻。
像施工场景,每次的布置方式都不一样,能走的路也不一样,全靠举一反三、理解场景。
当我们碰到了施工侵占左转道,而当时我们正要左转。
理解了场景的小魏同学,并没有因为失去左转道迷茫,而是安心走在最左侧的直行道上。
并且这次施工的延伸部分已经完全挡住左转路口,系统选择回了个大弯去找左转路口,顺利完成左转。
这都是因为系统会边看边理解场景,有绕过所有施工物体去找目标车道的清晰概念。
作为辅助驾驶,由于需要考虑普适性,可能有人会觉得它的防御性驾驶、完全卡限速等行为有点慢。
但其实在稳的基础上,魏牌V9X也是注重效率的,会优先选择快车道。
或者,你也可以通过语音指令控制它按照你的喜好去行驶。
语音控车
我们可以直接告诉小魏同学“开快点或慢点”,也能直接说一个具体时速,小魏同学会根据我们的语音指令调整驾驶风格。
我们甚至能让它靠边停车。
当我们下达“靠边停车”的指令以后,系统不会鲁莽刹停,而是慢慢减速,找个好下车的路口,并开启双闪。
这也证明了VLA的思维不只是考虑动作完成度,它会联想到在真实的世界中,我们是怎么用车的。
座舱
过去,智能座舱通常使用固定的触发词来识别指令,让语音助手执行。
但VLA的加入,让小魏同学从语音助手进化到了AI agent。
它有一颗自己的大脑,能用来跟你沟通,它也会作为一个专属角色融入到你的生活里。
初次见面,我们可以和小魏同学互相介绍,接下来它就会牢牢记住你是谁。
认识以后,小魏同学就可以提供一些专属服务。
比如记住你调节过的功能,当你下次上车时会主动询问上次没看完的电影要继续播放吗?
我们也能对这位朋友说,提醒我做什么事。
比如:过1分钟提醒我们给某某打电话。
有了VLA,我们能让它像朋友一样叫得动。
当我们双手提满行李时,用车外语音指令就能开启后备箱。
从走近车门的那一刻起,这位朋友就已经开始在合适的时候给我们“搭把手”了。
语言不是目的,而是一种打开世界的方式。对车来说也一样。
给魏牌V9X装上了VLA,它就理解了在窄巷里如何博弈,在盲区前谨慎行事。
从规则驱动到理解场景,VLA不仅在重新定义辅助驾驶像人的边界,它甚至让车与人的关系正在从“工具”向“伙伴”滑动。
今天的VLA还不是终点,但它已经让我们看到了用智能催生智慧的可能,一台车可以变得更有意思。
热门跟贴