打开网易新闻 查看精彩图片

作者 | 王秋凤

2月18日,特斯拉Robotaxi车型Cybercab,在德州奥斯汀工厂下线。该车双座、没有方向盘、油门和刹车,依靠FSD系统运行。本次下线只具有象征意义,真正的量产最早将于4月开始。

和此前预料的不同,马斯克虽然发文庆祝,但措辞谨慎:“祝贺特斯拉团队制造出第一辆量产型Cybercab!”这和他2024年预言该车型时的表态风格不符。

24日,马斯克在网上回答提问时表示,2027年前,该车定价将低于3万美元,运营费用将低于0.2美元/英里(约合人民币0.89元/公里)。该车产量将高达200万辆/年(没说何时实现)。他聚焦于成本、价格、产量等商业要素,未提及任何宏大叙事。

2024年10月Cybercab原型车亮相时,马斯克当时表示,特斯拉“已经”实现L5级自动驾驶”。这是老马典型的“未来完成时”表述,很多国内媒体照着字面引用,都上多少回当了,当当都一样。

打开网易新闻 查看精彩图片

当前的Cybercab,远非“完成体”

善意的理解,他的意思恐怕是,Cybercab的硬件“支撑”实现L5,这和其本身具备L5能力,绝对是两回事。

2月15日,特斯拉推送了FSD V14.2.2.5,基于HW4.0硬件。而HW3.0硬件只能停留在V12版本。在官方免责声明中,特斯拉照例强调,V14是需要驾驶员全程监督的L2级辅助驾驶系统。也就是说,今年生产的Cybercab还得用AI4芯片为核心的HW4.0系统。

那么指望什么?2025年10月All-In 峰会上,马斯克表示,“特斯拉开发的AI4芯片可实现比人类好 2、3 倍的自动驾驶安全性”;AI5芯片,将是当前AI4(HW4.0的Soc)芯片组的巨大升级,“AI5 将比 AI4 好 40 倍”;而2nm的AI6,性能则较AI5还要强一倍。

总结一下,就是更好、非常好、超级无敌霹雳爆炸好。

可惜,按照规划,AI5将于2027年量产,AI6将于2028年量产。两枚芯片都采用台积电和三星美国两个代工商生产。现在还谈不到两个代工商生产同一种芯片,如何对齐品控和性能的问题,因为AI5、AI6暂时都是饼。

虽然三星美国芯片生产线将于2026年“晚些时候”全面竣工,但三星声称已获得临时许可,在全面竣工前就能有限运营,生产AI5。看上去甲方很急要,而乙方正挖空心思想拿大单,但未全面竣工的生产线,如何稳产3nmN3P工艺的芯片,有点令人摸不到头脑。

即眼下的Cybercab,从硬件上来说不是“完全体”,如果想具备L5能力,至少要换装AI5,升级到HW5.0。

“贷款”暂未落实的硬件,特斯拉如何建立实现L5的路径?我们可以猜一下。

所以,如果看到Cybercab没有方向盘和刹车油门,就联想到它具备L5,应该是想多了。

打开网易新闻 查看精彩图片

Cybercab有现实商业价值

那么,是不是Cybercab和L5就是骗局呢?当然并非如此,这两件事得分开说。

Cybercab马上就可以投入运营,接替正在使用的Model 3/Y。与Waymo一样,特斯拉的Robotaxi也有电子围栏。目前运营区域为德州奥斯汀、旧金山、洛杉矶三座城市,两家公司还在较劲,争取“围栏”面积压过对手。

目前根据美国机动车安全标准,必须配备方向盘等控制装置。特斯拉可以申请豁免,条件是每年最多部署2500辆车,而且限于特定城市。

与Waymo强调的全天候运营不同,特斯拉当前仍处于限时服务,而且副驾座位上还有安全员。

马斯克的意图,不仅要拓展运营地盘、突破运营时间限制,更重要的,是要在Cybercab上试用更高等级的自动驾驶系统。至于获取实车数据,不是重点。因为允许上路的车数量有限,刚好和初期产能匹配。

2025年特斯拉全球销量163.6万辆,同比下跌了8.6%。落后于中企对手的趋势很难逆转,马斯克希望在Robotaxi上开辟新赛道。特别在算力中心(Cortex)支持下,与具身智能(Optimus)业务,形成同底座技术体系,重新找回成本优势。

既然运营是现实的,那么Robotaxi追求的技术状态必然是L4、L5。特斯拉对L3兴趣不大,与中国这边循序渐进的做法不同。眼下的“三无”(无方向盘、油门、刹车),虽然只是表达了通往L5的决心,但当前至少特斯拉的自动驾驶研发进展,走在前面。

到目前为止,特斯拉的Robotaxi的方案,仍是端到端,特斯拉也是率先做到将这一技术实际运用的公司。

中国这边,所有Robotaxi运营商,一旦车辆被困住后,都采用后台人工驾驶。而特斯拉则采用世界模型自主推理和决策,自主脱困,而非等待后台操作。这倒不是为了耍帅,而是美国多数城市,尚未实现5G网绵密部署,在市区也经常出现空白或者降格。

在美国多数城市,运行Robotaxi没那么难。凤凰城和奥斯汀,路况比中国城市简单多了,Waymo的Robotaxi遇到最多困境,是乘客下车不关门。为此Waymo雇了骑手骑车飞奔过去关车门。

打开网易新闻 查看精彩图片

此云非彼云

既然直白追求L5,就喻示着特斯拉使用的“世界模型”,与中企的思路存在很大不同。我们选取华为的世界模型(WAWE)作为比较对象。

在马斯克的构想里,AI5和AI6,既用来放在车端,也用来放在云端(Optimus机器人也会用AI5)。前者推理,后者训练。特斯拉的“训推一体”,意思是将超算芯片集成到FSD系统里面。这么做的好处显而易见,就是简化了芯片供应链,量大便宜,同时解除了对英伟达算力芯片的战略依赖。

马斯克显然对解散Dojo超算中心耿耿于怀。特斯拉被迫回到英伟达怀抱,重回Cortex单轨。因为Cortex超算中心用的是英伟达的H100,初期就部署10万张卡。

而华为车端和云端,都用的是海思昇腾系列,只不过车端用的是昇腾610,而云端则当前大量采购910B(未来3年还要上950PR/DT、960、970)。截止2025年10月,华为乾崑智驾云的算力达到45EFLOPS,在国内属于顶尖水平。

貌似两者都走的是芯片资源复用的路子,但其构建世界模型的思路不一样。

先说两者的相同点:都在云端生成场景、都在车端做决策、都有数据飞轮。世界模型都具有长期记忆和自进化,即以前的所有训练都有效,并在不同场景和任务下活学活用。

而两者的差异在于,把世界模型放在哪。

华为的世界模型,从名称就能看出来,世界引擎(WE)部署在云端,世界行为模型(WA)部署在车端。云端是车端的“教练”,车端负责“解题”;在云端造出大量难例,教车端模型学会应对。车端无须想象未来,只须执行。在工程上比较稳妥,先覆盖绝大多数场景,剩下的靠数据飞轮(来自实车数据)慢慢补。这是典型L2的思路,不适合Robotaxi。

而特斯拉的世界模型(顺便说一句,特斯拉官方从来未提及自己的云端大模型为“世界模型”,只不过其模式符合世界模型的定义),要求车端也具备预测能力,后者是和华为的区别之一。

打开网易新闻 查看精彩图片

区别之二,在于云端本身。特斯拉的世界模型,是一个神经世界模拟器(Neural World Simulator)。该模拟器在驾驶策略指令下,按照因果关系生成可交互的未来。意思是不仅基于历史数据重放验证,还能生成合成对抗性极端场景,用于安全边界测试。

特斯拉AI副总裁埃鲁斯瓦米(Elluswamy)暗示,比起其他厂商用的云端世界模型,特斯拉模拟器不仅能生成高保真场景,还能预测未来几秒的世界变化,用来想象和评估行动结果,其实就是个因果预测系统。

这下有意思了,特斯拉的世界模型,在云端和车端,都有预测能力。车端(预测)用于决策,云端则用来评估车端的决策。

之所以出现车端预测要求的区别,可能和特斯拉仍然坚持纯视觉有关。FSD有能力每秒处理36帧全分辨率视觉输入,28ms内决策输出。实时预测当然不能由云端来做,否则车早撞了。

也就是说,特斯拉的世界模型,不仅是教练,也是选手的一部分。

再提炼一下,华为的WA(车端的世界行为模型),是被训练出来的执行者;而特斯拉的车端模型,是被训练成能自己推演的决策者,后面还跟着一个事后评估者。出于同样的原因,华为排除了VLA路径,而特斯拉不排斥VLA,反而将音频也作为输入信息之一。

打开网易新闻 查看精彩图片

结 语

大家可能笼统地觉得,凡是世界模型都有预测能力。对于具体预测了什么,并不关心。重要的是,从高维(真实世界)感知,获得了低维映射(世界模型)之后,必须在给定候选动作条件下(比如只有加速、制动、变道,不考虑原地转圈),生成多步推理。这种推理,不仅是时间上的外推,更是因果推理。比如,如果我这样,其他参与者会怎样,场景会如何变化。

回到最初的问题,特斯拉相信这一套系统,能够最终进化到L5,这是其生产Cybercab的技术逻辑基础。它现在就能投入运营,但想达到最佳状态,仍然要等软件进化到位。

也就是说,这个饼看起来画得非常潦草,但特斯拉认为,做饼的路径非常可靠,以至于可以先把车体硬件做出来。不得不说,这份技术自信,还是相当值得佩服的。

- E N D -

秋凤空间

无肇因之始,无自限之垣

品茗聚友,坐而论道。