秋凤空间 | 特斯拉无人车，画饼先要自己信|埃隆_马斯克|无人车|汽车先行者大会|特斯拉(公司)|秋凤空间|自动驾驶|英伟达

作者 | 王秋凤

2月18日，特斯拉Robotaxi车型Cybercab，在德州奥斯汀工厂下线。该车双座、没有方向盘、油门和刹车，依靠FSD系统运行。本次下线只具有象征意义，真正的量产最早将于4月开始。

和此前预料的不同，马斯克虽然发文庆祝，但措辞谨慎：“祝贺特斯拉团队制造出第一辆量产型Cybercab！”这和他2024年预言该车型时的表态风格不符。

24日，马斯克在网上回答提问时表示，2027年前，该车定价将低于3万美元，运营费用将低于0.2美元/英里（约合人民币0.89元/公里）。该车产量将高达200万辆/年（没说何时实现）。他聚焦于成本、价格、产量等商业要素，未提及任何宏大叙事。

2024年10月Cybercab原型车亮相时，马斯克当时表示，特斯拉“已经”实现L5级自动驾驶”。这是老马典型的“未来完成时”表述，很多国内媒体照着字面引用，都上多少回当了，当当都一样。

当前的Cybercab，远非“完成体”

善意的理解，他的意思恐怕是，Cybercab的硬件“支撑”实现L5，这和其本身具备L5能力，绝对是两回事。

2月15日，特斯拉推送了FSD V14.2.2.5，基于HW4.0硬件。而HW3.0硬件只能停留在V12版本。在官方免责声明中，特斯拉照例强调，V14是需要驾驶员全程监督的L2级辅助驾驶系统。也就是说，今年生产的Cybercab还得用AI4芯片为核心的HW4.0系统。

那么指望什么？2025年10月All-In 峰会上，马斯克表示，“特斯拉开发的AI4芯片可实现比人类好 2、3 倍的自动驾驶安全性”；AI5芯片，将是当前AI4（HW4.0的Soc）芯片组的巨大升级，“AI5 将比 AI4 好 40 倍”；而2nm的AI6，性能则较AI5还要强一倍。

总结一下，就是更好、非常好、超级无敌霹雳爆炸好。

可惜，按照规划，AI5将于2027年量产，AI6将于2028年量产。两枚芯片都采用台积电和三星美国两个代工商生产。现在还谈不到两个代工商生产同一种芯片，如何对齐品控和性能的问题，因为AI5、AI6暂时都是饼。

虽然三星美国芯片生产线将于2026年“晚些时候”全面竣工，但三星声称已获得临时许可，在全面竣工前就能有限运营，生产AI5。看上去甲方很急要，而乙方正挖空心思想拿大单，但未全面竣工的生产线，如何稳产3nmN3P工艺的芯片，有点令人摸不到头脑。

即眼下的Cybercab，从硬件上来说不是“完全体”，如果想具备L5能力，至少要换装AI5，升级到HW5.0。

“贷款”暂未落实的硬件，特斯拉如何建立实现L5的路径？我们可以猜一下。

所以，如果看到Cybercab没有方向盘和刹车油门，就联想到它具备L5，应该是想多了。

Cybercab有现实商业价值

那么，是不是Cybercab和L5就是骗局呢？当然并非如此，这两件事得分开说。

Cybercab马上就可以投入运营，接替正在使用的Model 3/Y。与Waymo一样，特斯拉的Robotaxi也有电子围栏。目前运营区域为德州奥斯汀、旧金山、洛杉矶三座城市，两家公司还在较劲，争取“围栏”面积压过对手。

目前根据美国机动车安全标准，必须配备方向盘等控制装置。特斯拉可以申请豁免，条件是每年最多部署2500辆车，而且限于特定城市。

与Waymo强调的全天候运营不同，特斯拉当前仍处于限时服务，而且副驾座位上还有安全员。

马斯克的意图，不仅要拓展运营地盘、突破运营时间限制，更重要的，是要在Cybercab上试用更高等级的自动驾驶系统。至于获取实车数据，不是重点。因为允许上路的车数量有限，刚好和初期产能匹配。

2025年特斯拉全球销量163.6万辆，同比下跌了8.6%。落后于中企对手的趋势很难逆转，马斯克希望在Robotaxi上开辟新赛道。特别在算力中心（Cortex）支持下，与具身智能（Optimus）业务，形成同底座技术体系，重新找回成本优势。

既然运营是现实的，那么Robotaxi追求的技术状态必然是L4、L5。特斯拉对L3兴趣不大，与中国这边循序渐进的做法不同。眼下的“三无”（无方向盘、油门、刹车），虽然只是表达了通往L5的决心，但当前至少特斯拉的自动驾驶研发进展，走在前面。

到目前为止，特斯拉的Robotaxi的方案，仍是端到端，特斯拉也是率先做到将这一技术实际运用的公司。

中国这边，所有Robotaxi运营商，一旦车辆被困住后，都采用后台人工驾驶。而特斯拉则采用世界模型自主推理和决策，自主脱困，而非等待后台操作。这倒不是为了耍帅，而是美国多数城市，尚未实现5G网绵密部署，在市区也经常出现空白或者降格。

在美国多数城市，运行Robotaxi没那么难。凤凰城和奥斯汀，路况比中国城市简单多了，Waymo的Robotaxi遇到最多困境，是乘客下车不关门。为此Waymo雇了骑手骑车飞奔过去关车门。

此云非彼云

既然直白追求L5，就喻示着特斯拉使用的“世界模型”，与中企的思路存在很大不同。我们选取华为的世界模型（WAWE）作为比较对象。

在马斯克的构想里，AI5和AI6，既用来放在车端，也用来放在云端（Optimus机器人也会用AI5）。前者推理，后者训练。特斯拉的“训推一体”，意思是将超算芯片集成到FSD系统里面。这么做的好处显而易见，就是简化了芯片供应链，量大便宜，同时解除了对英伟达算力芯片的战略依赖。

马斯克显然对解散Dojo超算中心耿耿于怀。特斯拉被迫回到英伟达怀抱，重回Cortex单轨。因为Cortex超算中心用的是英伟达的H100，初期就部署10万张卡。

而华为车端和云端，都用的是海思昇腾系列，只不过车端用的是昇腾610，而云端则当前大量采购910B（未来3年还要上950PR/DT、960、970）。截止2025年10月，华为乾崑智驾云的算力达到45EFLOPS，在国内属于顶尖水平。

貌似两者都走的是芯片资源复用的路子，但其构建世界模型的思路不一样。

先说两者的相同点：都在云端生成场景、都在车端做决策、都有数据飞轮。世界模型都具有长期记忆和自进化，即以前的所有训练都有效，并在不同场景和任务下活学活用。

而两者的差异在于，把世界模型放在哪。

华为的世界模型，从名称就能看出来，世界引擎（WE）部署在云端，世界行为模型（WA）部署在车端。云端是车端的“教练”，车端负责“解题”；在云端造出大量难例，教车端模型学会应对。车端无须想象未来，只须执行。在工程上比较稳妥，先覆盖绝大多数场景，剩下的靠数据飞轮（来自实车数据）慢慢补。这是典型L2的思路，不适合Robotaxi。

而特斯拉的世界模型（顺便说一句，特斯拉官方从来未提及自己的云端大模型为“世界模型”，只不过其模式符合世界模型的定义），要求车端也具备预测能力，后者是和华为的区别之一。

区别之二，在于云端本身。特斯拉的世界模型，是一个神经世界模拟器（Neural World Simulator）。该模拟器在驾驶策略指令下，按照因果关系生成可交互的未来。意思是不仅基于历史数据重放验证，还能生成合成对抗性极端场景，用于安全边界测试。

特斯拉AI副总裁埃鲁斯瓦米（Elluswamy）暗示，比起其他厂商用的云端世界模型，特斯拉模拟器不仅能生成高保真场景，还能预测未来几秒的世界变化，用来想象和评估行动结果，其实就是个因果预测系统。

这下有意思了，特斯拉的世界模型，在云端和车端，都有预测能力。车端（预测）用于决策，云端则用来评估车端的决策。

之所以出现车端预测要求的区别，可能和特斯拉仍然坚持纯视觉有关。FSD有能力每秒处理36帧全分辨率视觉输入，28ms内决策输出。实时预测当然不能由云端来做，否则车早撞了。

也就是说，特斯拉的世界模型，不仅是教练，也是选手的一部分。

再提炼一下，华为的WA（车端的世界行为模型），是被训练出来的执行者；而特斯拉的车端模型，是被训练成能自己推演的决策者，后面还跟着一个事后评估者。出于同样的原因，华为排除了VLA路径，而特斯拉不排斥VLA，反而将音频也作为输入信息之一。

结语

大家可能笼统地觉得，凡是世界模型都有预测能力。对于具体预测了什么，并不关心。重要的是，从高维（真实世界）感知，获得了低维映射（世界模型）之后，必须在给定候选动作条件下（比如只有加速、制动、变道，不考虑原地转圈），生成多步推理。这种推理，不仅是时间上的外推，更是因果推理。比如，如果我这样，其他参与者会怎样，场景会如何变化。

回到最初的问题，特斯拉相信这一套系统，能够最终进化到L5，这是其生产Cybercab的技术逻辑基础。它现在就能投入运营，但想达到最佳状态，仍然要等软件进化到位。

也就是说，这个饼看起来画得非常潦草，但特斯拉认为，做饼的路径非常可靠，以至于可以先把车体硬件做出来。不得不说，这份技术自信，还是相当值得佩服的。

- E N D -

秋凤空间

无肇因之始，无自限之垣

品茗聚友，坐而论道。