你下班开车遇上右转红灯排了长队,旁边直行道空空荡荡,绿灯亮得晃眼,这会儿你会怎么选?换做开了十年车的老司机我,多半先打方向拐去直行道等着。毕竟谁没遇过右转道第一辆车,绿灯亮半天还低头刷消息,纹丝不动留出来老大空档,瞅准距离切进去,算不上加塞还能省十多分钟,这操作够机灵吧。你想不到,现在连AI都学会这手了。
这波机灵操作不是我教的,是蔚来NWM 2.0世界模型自己想出来的。变道稳准狠不说,连“等红灯找空位切入”这种老司机才有的小心思都摸透了。说白了这套辅助驾驶,已经能自己读懂预测路况规律了。搞不好人类驾驶员被完全取代,真的就差最后一步。
早先的辅助驾驶一点都不玄乎,全靠工程师堆规则堆代码。摄像头拍到红灯就得刹车,拍到绿灯能起步,看到斑马线必须让行,一条条写得明明白白。可真开上路就露怯,怎么看怎么不聪明,毕竟大千世界路况太复杂,几十万条规则扔进去都不够填。
就说绿灯起步这事儿,按规则绿灯亮了就得走,可你抬头一看斑马线上站着个行人,你走不走?要是那行人根本不是真的,只是公交车身印的公益广告,你还停在那不走,这不纯纯堵路吗。再拿路上的皮球说,规则没写见着皮球必须停,可谁都知道,滚到路中间的皮球,后头多半跟着追球的小孩,该停还得停。规则写不完就算了,规则和规则还经常打架,遇上没写过的新情况直接抓瞎。
后来大伙想出了端到端的路子,不用拆成认车道、算距离、做决策的流水线,也不用写死一堆规则,直接让AI看着人类开车的自己学。本质就是AI跟着大多数人类驾驶员的反应走,一百个老司机遇上情况都踩刹车,AI就跟着选刹车。它都不用知道自己为啥要踩,跟着做就行。
玩端到端拼的就是数据量,谁家卖的车多,谁家的端到端就做得好。一千万辆车在路上跑,就有一千万个摄像头帮着收集全世界各地的路况,哪个司机遇上特殊情况踩了刹车,这条数据就会传回数据中心,训练完再更新到所有车的系统上,越跑越聪明,形成正向循环。
端到端也没完美到哪儿去,缺点明明白白摆着。它只会处理见过的路况,遇上从来没碰到过的场景,比如路上躺了个沙发造型的三轮车,或是突然冒出来的施工围挡,它不会临时变通,直接就乱开。它还容易学坏,训练数据里老司机加塞、压线、超速的操作多,它也跟着学这些坏毛病,程序员都没法直接改代码禁止,只能重新拿数据再训练一遍。
现在有了更好的路子,就是咱们开头说的世界模型,国内最早玩这个的,说出来你可能想不到,居然是蔚来。之前大伙提起蔚来,都夸车子做的不错,配置足服务也好,唯独辅助驾驶只能说一般,算不上第一梯队。原来大伙都扎堆卷端到端的时候,蔚来一直在憋大招,憋的就是这个世界模型。
说直白点,世界模型就是靠着当下拿到的画面、声音、光线这些信息,先在AI的“脑子”里重建一个和现实一模一样的物理世界。再靠着物理世界的规律,推演自己每一种操作会带来什么样的结果,最后挑出最好的那个方案来执行。就像电影里奇异博士翻完一千多万种未来,找出那个唯一能赢的结局一样。
最开头说的那波操作,先去直行道等空位,瞅准机会再切入右转道,就是蔚来NWM 2.0试了无数种策略之后,挑出来的成功率最高的方案,拿到现实里直接用。这套思路和老司机开车真的没差,都是摸透规律出来的最优选择。
为了让模型的策略更准,蔚来工程师还给NWM 2.0加了一整套闭环强化学习的奖惩机制。拿真实场景里收集来的量产数据,做了一个仿真环境,把各种复杂奇葩的场景都放进去,让模型一遍遍练策略。做得又快又好就给奖励,做砸了就惩罚,练得多了,模型自己就能摸透操作细节背后的因果逻辑。
摸得越深理解得越多,放到现实路上开,就越像开了十几年车的老司机。从实际跑下来的结果看,这套带世界模型和闭环强化学习的NWM 2.0,表现真的挺惊艳。过去辅助驾驶搞不定的选ETC匝道、拐弯边蠕行边让人、小路上错开逆行的电瓶车三轮车,它做得几乎和真人一模一样。
之前辅助驾驶一直表现平平的蔚来,靠着这套NWM 2.0,直接重新杀回了辅助驾驶的第一梯队。你顺着发展脉络看,从最开始死守代码规则,到模仿人类驾驶,再到现在能推演未来自主决策的世界模型。智能驾驶已经跨过了最关键的起步门槛。
AI不再是被动执行人类写好的指令,它能像人一样读懂路况、预判风险、挑出最优的走法,它和真人驾驶员的差距正在飞快缩小。等哪天不管是车上的乘客还是路边的行人,都分不出开车的是AI还是真人,那L4级别的无人驾驶也就真的来了。
真到那个时候,为了整体的交通安全,还允不允许人类自己手动握方向盘,大概率会变成一个争议不小的新问题。现在还爱握着方向盘自己开,享受踩油门打方向感觉的朋友,真的要多珍惜现下的日子。智能驾驶主导出行的时代,真的已经近在眼前了。
参考资料:人民日报 我国智能驾驶产业发展观察
热门跟贴