一直以来,特斯拉入华的脚步从未停歇。
随着近期特斯拉宣布中国被列入“FSD(Supervised)监督版”可用地区,关于FSD正式入华的讨论迅速升温,不少媒体甚至将其描述为“特斯拉辅助驾驶正式登陆中国”。
与此同时,特斯拉中国官网更新了高级智能驾驶选装包的页面信息。原有的英文简称“FSD”以及“完全自动驾驶功能”“智能辅助驾驶”等字样被全部移除,官方中文名称正式变更为“特斯拉辅助驾驶”。
此次更名并非单一名称调整,而是特斯拉适配国内法规监管要求、推进高阶智能驾驶功能本土化落地的重要举措。虽然特斯拉FSD对于中国市场志在必得,但政策合规、技术适配、本土竞争、市场定价等现实壁垒,注定让其入华之路没有那么平坦。
五年等待与本土化落地
FSD最早于2016年10月面向北美用户推送,彼时仅能实现基础的高速辅助驾驶。此后数年,特斯拉持续迭代算法架构,从模块化规则逐步转向端到端神经网络驱动。到2025年年底,FSD V13版本实现“车位到车位”的端到端驾驶。
截至今年5月上旬,FSD监督版车队全球累计行驶里程突破100亿英里,重大碰撞事故率为每853万公里1起,低于美国人类驾驶员的每106万公里1起。值得指出的是,监督版并非是“中国特供阉割版”,而是表明:驾驶员仍须时刻关注路面情况,并手握方向盘,系统启用时DMS(驾驶员监控)若检测分心超3秒将报警甚至刹停。
FSD入华经历了5年的准备周期。早在2021年,特斯拉在上海临港设立数据中心,实现中国道路数据本地化存储,满足数据不出境的监管要求。
随后的2022年至2025年,FSD入华的传闻反复出现,但因审批、数据安全、算法适配等问题多次搁浅。今年2月,上海临港AI训练中心正式投用,完成了“数据存储-本土训练-算法优化”的全链路闭环。此后,特斯拉在9城密集招募智驾测试技师,FSD获得部分监管批准,目标在今年第三季度获得全面商用许可。
虽然FSD入华已取得重大进展,但关键门槛仍未完全突破。FSD入华需要通过工信部(准入)、公安部(道路安全)、网信办(数据出境)三部门终审,目前仅完成部分合规(如上海临港AI训练中心投用、数据本地存储),同时由于美国出口管制,高算力芯片依然受限,美国与中国道路的巨大差异也使复杂路况适配成为关键挑战。
FSD V14.3是被马斯克称为“最后一块拼图”的更新,是一次实现无监督端到端自动驾驶前的最后一项重大架构升级,此次更新将完成从“肌肉记忆”式反应向逻辑推理能力的底层进化。
和国内常见的智驾系统相比,FSD的最大特点在于其以算法为核心驱动,通过模拟人类的视觉系统实现对复杂驾驶场景的理解。
FSD纯视觉感知仅靠8个摄像头,通过HydraNets(九头蛇网络)提取多任务特征,借助“RegNet(正则网络结构)+BiFPN(双向特征金字塔网络)”作为主干网络提取图像特征,再由“BEV(鸟瞰图)空间转换层+Transformer”构建3D环境向量空间,实现时空一致感知。
从FSD V12起,全面取消规则引擎,转向神经网络直接输出控制指令,基于UniAD类全栈Transformer架构,将“感知-预测-规划”一体化,支持从像素到转向/油门的端到端可导训练。
Occupancy Network(占用网络)则替代了传统3D框检测,对非结构化空间(如路沿、锥桶、飞来物)建模为体素网格,提升遮挡与复杂场景鲁棒性。
同时,利用全球超10亿英里真实数据(中国版训练用30亿公里本土数据)进行4D向量空间标注,并结合 Dojo超算(720+TOPS算力)训练,形成“数据→模型→OTA→再采集”闭环。
当然,FSD也并没有那么完美。纯视觉方案的问题依然比较明显,比如当光线的急剧变化或者黑暗光线造成的错觉,依然会导致系统出现不稳定,例如进入隧道突然刹车,垃圾袋飞起导致车辆急刹车的情况都有出现。同时,视觉方案需要大量的数据供神经网络学习训练,当进入到一个陌生环境,这个环境中的参与者、交通标志、障碍物如果有诸多不同,那么系统也会成为“睁眼瞎”。
从市场反馈看,特斯拉FSD在北美市场渗透率超30%,虽然纯视觉方案在美国表现出了优异性能,但可能低估了中国路况的复杂程度。这对于纯视觉方案来讲,都需要用大量的中国本土数据进行重新训练。同时国内不同区域、不同省份的红绿灯也有诸多区别,这对FSD也是一项大挑战。
然而,中国复杂路况所带来的本土化挑战也为国产方案提供了差异化的生存空间。中国城市道路在人车混行、非标行为等方面具有独特复杂性,在极窄路、复杂博弈等场景下,中国场景中训练的大模型已展现出局部领先的优势。这意味着,FSD入华后,行业不会出现“一种路线通吃”的局面,而是在全球通用能力与本土场景适配的双重竞争格局下,形成技术迭代的良性加速循环。
纯视觉 VS 多模态感知融合
早在2021年,马斯克在接受媒体采访时就曾声称:“自动驾驶汽车应当使用与人类司机相同的感觉驾驶汽车,人依靠眼睛和智力驾驶汽车,自动驾驶汽车也应当这样。”
马斯克认为,道路和交通规则本身是基于人类视觉设计的,纯视觉方案能最贴近人类驾驶习惯,是通向完全自动驾驶的“第一性原理”。
他多次批评激光雷达是“错误的解决方案”,称其在复杂道路环境中效率低下,而视觉系统结合生物神经网络才是最优解。之所以特斯拉只采用视觉方案,是为了让车载计算机更加“专注”,一旦增加雷达等相关数据,会使系统获得超过它处理能力的冗余数据,如此会对软件产生负面影响。
近年来,随着计算机视觉和深度学习技术的快速发展,纯视觉方案的感知能力显著提升,尤其是在物体检测、目标跟踪和路径规划等关键任务上取得了突破性进展。
从方案部署角度,纯视觉方案主要依靠摄像头这一单一硬件,降低了系统集成难度和硬件成本。但其依赖的算法对场景的高效感知与理解,特别是在恶劣天气(如大雾、大雨或积雪环境)和受光照条件影响较大的复杂工况下,如何确保可靠性仍是其核心挑战之一。其次,该方案需要处理大量的图像数据,这对自动驾驶系统的数据处理和存储能力提出了更高的要求,增加了系统的复杂性和能耗。
为了克服单一传感器的局限性,多模态感知融合成为自动驾驶领域另一条主流技术路径。相比于依靠摄像头的纯视觉感知方案,激光雷达与摄像头的融合感知方案,可以带来全局信息获取能力的提升,为行驶安全增添了多重保障。
激光雷达最大优势在于测距精度非常高,通常可以达到厘米级别,远高于传统的雷达和摄像头技术。通过高密度、高精度的三维点云数据,激光雷达能够精确感知周围环境中的物体位置、形状和距离,被广泛应用于构建周围环境的几何模型,特别是在复杂城市场景中,它的高空间分辨率和测距能力极大地提高了障碍物识别和建图精度。激光雷达不依赖环境光照条件,能够在白天、夜晚以及光线复杂的环境中工作,这使得激光雷达特别适用于多变的户外环境,如城市街道、隧道和夜间驾驶等场景。
摄像头作为模拟人眼的视觉工具,能捕获丰富的语义信息,用于识别车道线、交通标志、行人和车辆类型等。摄像头在晴天和光照良好的条件下表现出色,但强光、阴影和夜间等复杂光照条件会显著降低其性能。
毫米波雷达在感知速度和距离信息方面表现优异,尤其在雨雪天气和低可见度环境中,能够可靠工作。但其空间分辨率不足以精确识别静态或复杂形态的物体。
超声波雷达则更多应用于如泊车场景中的障碍物检测短距离环境感知,但其探测距离较短,无法满足复杂场景需求。
比如Waymo的第五代Robotaxi,配备了8颗摄像头、5颗雷达以及3颗激光雷达,而第六代Robotaxi更是配备了13颗摄像头、4颗激光雷达、6颗毫米波雷达以及一系列外部音频接收器,为驾驶员提供360度环视视野,最远探测距离达500米,极大提升了车辆在不同光照条件、极端天气下的适应能力。
在2024年12月的理想AI Talk对话节目中,理想汽车CEO李想被问及“特斯拉没有用激光雷达,你们为什么要用”时,他坦言保留激光雷达是为了安全。
李想表示,中国路况与美国不同,深夜驾驶时可能会遇到尾灯损坏的大货车,甚至大货车会停在主路上。在这种情况下,激光雷达可以看到200米远的距离,而摄像头在无光环境下的可视距离只有100多米。这使得激光雷达能够实现130公里/小时的AEB自动紧急制动功能。
AEB的关键性能指标包括刹停速度与误报率,激光雷达能实现更远距离的探测,对物体的检测也更加灵敏,在高速场景里保证了更高的刹停速度,在城区里则有效降低误报率。因此,不少业内人士认为,激光雷达除了承担安全冗余的角色,更是实现AEB功能必不可少的感应器,是“功能件”。
事实上,纯视觉与感知融合的路线分歧本质是“算法驱动”与“硬件驱动”的理念之争。特斯拉压押注于通过海量数据训练出“全能算法”,最终实现“无雷达”的纯视觉自动驾驶;而国内车企则选择用硬件堆砌安全冗余,通过多传感器互补应对复杂场景。
单一技术的安全威胁在于安全冗余能力的不足,视觉可能“看不见”,激光雷达可能“看不懂”。在真实场景中,一场大雾足以让视觉系统失效,一个反光物体可能让激光雷达误判,任何单一传感器的“脆弱性”都可能成为系统性风险的导火索。
通过将激光雷达、摄像头、毫米波雷达等多种传感器的感知数据进行融合处理,能够提供更为准确、完整的环境信息。这种融合感知技术能够充分利用各种传感器的优势,通过在时间和空间上对不同传感器的信息进行对齐和优化,从而弥补单一传感器的缺陷。
不过,融合感知技术的推广仍面临成本、技术和法规等多方面的挑战。首先,融合感知技术需要集成多种传感器,这增加了系统的复杂性和成本。其次,不同传感器之间的数据融合需要高精度的校准和同步,这对技术实现提出了很高的要求。
内部人“信任危机”仍待解除
就在特斯拉FSD入华进行得如火如荼,一场由内部员工引发的“信任危机”又将FSD安全性推上风口浪尖。
5月29日,路透社发布深度调查报告,直指特斯拉FSD软件的安全宣传存在数据漏洞。特斯拉此前宣称FSD安全性达人类驾驶员10倍,但核查显示该结论在统计口径、对比逻辑上均站不住脚,多位内部数据标注员与工程师亦公开表示不认可FSD的自动驾驶安全性。
这些数据标注员的核心工作,是审核海量FSD行车影像并训练系统修正错误。他们透露,工作中频繁看到FSD车辆出现超速行为,但这类高频基础问题,并未得到工程师和管理层的优先重视,资源反而更多投向罕见的极端场景。除了超速,FSD还多次出现无法避让紧急车辆、在校车旁未停车、险些撞到行人甚至撞击动物等危险情况,这些真实发生的隐患,让内部人员对系统安全性彻底丧失信心。
在数据对比层面,特斯拉将FSD触发安全气囊的事故率与联邦政府覆盖各类轻微事故的整体事故率进行对标,这一口径差异使安全性倍数被人为放大。卡内基梅隆大学教授菲利普·库普曼直言:“这就好比说‘我的喷气式飞机比你的二战轰炸机快’,所以呢?”十余位交通安全领域专家一致认定,此类统计属于误导性营销表述,而非严谨的安全评估。
特斯拉的Robotaxi试点同样暴露了依赖人工兜底的现实。犹他州数据标注团队在Cybercab发布会前夕翻倍至300人,提前数月对特定路线进行标注训练。有前员工将此形容为“提前拿到期末考试答案”。奥斯汀运营近一年后,实际部署车辆仅约50台,且仅限精心圈定的有限区域运行。
对此,美国国家公路交通安全管理局已将FSD相关调查升级,涉及约320万辆车。荷兰、瑞典、芬兰、丹麦和挪威等欧洲多国监管机构也对其安全性提出质疑,导致FSD在欧洲的审批遇阻。
随着辅助驾驶正从早期试点迈向规模化普及阶段,这一过程需要技术创新与用户体验的平衡共进。纯视觉与多传感器感知融合并没有绝对的优劣之分,无论技术路径如何选择,以用户为中心的安全体验远胜于技术“炫技”。
在关乎生命安全的领域,稳步构建可靠的技术体系,让用户在每一次出行中感受到有温度、可信赖的技术守护,才是辅助驾驶技术普惠大众的正确打开方式。FSD入华带来的行业碰撞,也将反向倒逼国内高阶智驾技术加速迭代,在良性竞争中推动整个国内智能辅助驾驶产业走向成熟。
热门跟贴