在国内智驾牌桌上,特斯拉要出王炸了。五年免息再立减一万尾款的权益之后,明年一季度前,特斯拉在中国酝酿了两件大事,一个是推动国产新 Model Y ( 参数 丨 图片 )上市,一个是引入FSD落地中国。关于新车,大致是用新电机,新外观,新电池,主打长续航+低能耗;重点是后者,根据特斯拉官方最新消息,12月1日已经向美国地区全系车主推送了FSD V13.2,从V12.5正式跨入第13代系统,这意味着,从数据规模到模型规模,再到自动驾驶效果,新系统的各项性能,都要比第12代版本更进化,那么问题来了,新版本的智驾能力,大概是什么水平?将近210万的中国车主,能正常用新系统吗?FSD来中国后,谁又能接招呢?
接管率降10倍,210万中国车主都能用V13.2?
比起FSD V12.5,这次的V13.2升级了11项内容,注意,不是新增11项功能,而是基于前12代累计训练结果给出了更具体的优化。从体验层面看,有三项更新,首先,P挡驻车状态下,给出目的地指令后,一键就能启用FSD,解锁了之前只有在行驶过程中的开启限制,不过就这项功能而言,华为A DS 3 .0在今年9月已经率先实现了落地;其次,基于主动绕行的决策逻辑上,新系统可以提前检测到封闭或施工道路,进而自主选择优先路径,同时中控屏上会显示多条路线供选择;最后,优化了预碰撞逻辑,目的是尽可能减少降级次数(接管),从海外车主的多条实测视频来看,在光照环境较差的无标线停车场,面对盲区出现的人车移动障碍物,整套系统给出的方案是,先基于限速缓行,识别到障碍物后观察、预判其运动轨迹,在安全距离条件下直接通过,没有选择长时间停车礼让,这明显是corner case的一次细节优化。
除此之外,还有两个细节值得注意,一个是新版本集成了自动泊车、倒车和停车功能,也就是车辆在启动FSD后,自己就能完成进出停车位动作,在端到端大模型下,华为、理想、小米、小鹏等多家国内品牌给出的智驾方案,也都能实现所谓的“车位到车位”功能,不过,根据多位海外车主实测发现,V13.2甚至会自己选择停泊在目的地附近的充电站,也就是说,系统会参考往返全程预计所需要消耗的电量,进而判断是否需要在此刻补电,从技术层面看,实现起来并不难,在CNN大模型中写入能读取车辆关键数据的代码就能实现,所以这明显也是学习训练后的一个体验细节完善。
另外V13.2还预告了下一版本会改进的内容,其中一项是收集共享音频片段,通过声音检测对救护车、警车、校车等特殊车辆作出避让,比起通过摄像头获取标定数据,警报声明显更容易被提前感知,换句话说,就是当车辆听到警报声就会提前规划避让,而不是特殊车辆已经驶至后方时才进行变道避让,整体下来的智驾逻辑更符合类人操作,所以在大模型里写入音频数据并训练,是值得其他智驾技术方案学习的。再回到软件层面来看,之所以V13.2能给到更具体的细节优化,背后其实是有高敏锐度数据作支撑的,比如,新版本的数据规模是上一代的4.2倍,训练计算规模提升了5倍,深度的海量学习后,成绩自然就有进步。
另外,这套新系统直接用HW 4.0芯片来思考,36赫兹全分辨率视频信号输入,就是1秒能反复看36次清晰的视频,因此基本就不需要小鹏的那套Lofic架构,来甄别暗光环境的数据可靠性了,总数据带宽为每秒1.3千兆像素,以36赫兹运行,捕获和推理之间的延迟接近0,另外在这套芯片性能上,特斯拉减少了光子计数到控制域的延迟,从看到到行动,速度比之前快了一倍,按照马斯克的话来说,新系统在接管前的自动行驶里程,是上一代的6-10倍,也就是说,接管率最大降低了10倍左右,当然了,大量的实测视频,也证明了全程零接管的真实性,即便是被暴雪覆盖的无划线道路,车辆依然能在不降级的情况下自动完成全程。
既然如此,中国的特斯拉车主是否也能正常用呢?前面已经提到,V13的一处重大变化,就是完全基于HW 4.0芯片开发,所以V12.5是HW 3.0的最后一代自动驾驶版本,再具体一些来讲,特斯拉在今年2月1号才量产搭载HW 4.0芯片的车型,所以在这个节点之前,现款的国产Model Y和老款的 Model 3 是无法通过OTA升级V13.2的,不过,马斯克在今年第三季度财报电话会议中公开宣布,如果硬件无法支持无人监督的FSD,特斯拉官方将为车主免费更换HW4.0芯片,这意味着迄今210万中国车主,在未来都有机会用上FSD和最新功能,而接下来,就只剩下FSD具体的入华节点,以及对应的价格规则了。
FSD吃高算力和数据优势,入华后只有华为能接招?
不出意外,真正具有变革性的FSD功能,至少也是在V14甚至更远的V15版本之后才有,毕竟按照《汽车驾驶自动化分级》的标准来看,L3可以在特定条件下自主完成动态驾驶任务,但需要驾驶员随时接管,而L4属于高度自动驾驶,全程自主完成所有操作,驾驶员无需集中注意力,所以从某种程度上讲,这次特斯拉更新的FSD V13.2,基本是已经具备准L3级自动驾驶能力的,而纵观国内智驾技术领域,目前只有华为的动作最快,在尊界S800上首次应用到了L3架构,同样是计划在2025年第一季度上市,如此一来,国内首款量产L3车型的头衔,可能就变成了新款Model Y和尊界S800之间的竞争,倘若特斯拉更快一步推出新Model Y,并且FSD V13.2同时引入国内,这岂不就变成了,特斯拉新车主省100万就能使用L3技术了?当然了,这还要看特斯拉FSD在国内的首秀,究竟是V12.5还是V13.2了。
眼下FSD入华倒计时已不足百日,特斯拉又赶在年末发布V13.2,对于中国而言,很难不令外界推测新版本引入国内的可能性,即便没给中国车主新版本,V12.5也足以给国内其他智驾选手带来相当大的技术压力和竞争压力。要知道,特斯拉在去年首次推出的V12,底层逻辑发生了明确的改变,删代码换有深度学习能力的神经网络,类似Chat GPT的使用逻辑,即只要学习能力够强、投喂模型够多,就会越来越好用,华为的GOD大网、理想的VLM+E2E、小鹏的AI鹰眼,都是一样的端到端逻辑,那,谁才能接住FSD的王炸大招,或者是有机会超过FSD呢?
回答这个问题,有必要先弄清楚背后的技术框架,现阶段,除了极越和小鹏,华为、理想、小米等都是通过激光雷达来实现高阶智驾,之前我们曾从技术角度剖析过,马斯克之所以拒绝使用激光雷达方案,一方面是其认为投入产出比预期不佳,另一方面则是认为激光雷达会限制端到端大模型的性能上限,至于这两种技术方案谁更先进,不在本篇文章的讨论重点,通过激光雷达这个感知硬件,折射的其实是算力问题,毕竟,从工作原理和技术层面看,激光雷达更像是一个能直接处理感知信号和数据的集成性系统,其中的芯片,就能解决一部分智驾感知难题,比如华为的192线,实时扫图能把周围环境构建成多维立体模型,再配合毫米波雷达、超声波雷达、摄像头甚至是ToF传感器获取到的更为精确的数据,最终投喂给大模型的是准确、规模性的真实数据,简单理解,就是激光雷达就算是一个具备小型算力的感知机制,这就拓宽了大模型在思考、决策、执行上的算力要求,也算是解放了一部分算力压力,而纯视觉技术方案,获取环境数据只能是通过摄像头,获取到的数据直接交给了大模型去思考,所以也可以这样讲,就目前的技术趋势而言,纯视觉方案仅适合高算力平台,而高算力平台又不一定是纯视觉的专属,多传感器融合技术方案,更多的是在算法之外给安全冗余兜底,所以,要想实现L3甚至L4,两条技术路劲都离不开高算力。
而在数据闭环的实现过程中,计算能力是支撑大规模数据处理和模型训练的基础,在这方面,特斯拉有自研的Dojo计算机,和传统的GPU架构相比,Dojo系统的核心就是高带宽和低延迟的训练体系,3年前推出的D1芯片拥有362 TFLOPS的算力,这能够让特斯拉在短期内完成大规模的神经网络训练,如今,整套系统的算力已经到了100EFLOPS,参考目前比较主流的几家智驾品牌,华为7.5EFLOPS、理想5.4EFLOPS,小鹏1.5EFLOPS,相比之下,算力储备几乎是去年全球的(910EFLOPS)11%,如此来看,特斯拉确实没有任何必要再选择用激光雷达,这也就意味着,极越和小鹏要想尽快迭代更高级的智驾效果,就得尽快补算力的坑。
既然短期内算力储备追不上特斯拉,那华为、理想、小米等融合激光雷达的多传感器智驾方案,在软件层面上,能和基于积卷神经网络CNN的FSD竞争吗?华为和理想、小米,其实在今年已经走了两条效果类似但技术不同的路,首先,华为在ADS 3.0系统里,把负责全局视角的BEV网络,和主要负责预判的PDP网络,都放到了GOD网络中形成一张大网概念,从感知到思考再到规控,逻辑非常类似特斯拉追求的one Model形态,感知元件获取信息后,直接给大模型处理,而眼下理想的VLM+E2E,是把所有环境分成两套系统,“快系统”直接规控,相当于华为的PDP,“慢系统”用来学习和思考,世界云端模型相当于错题本,把未知的corner case反复学习,再输给VLM架构。
至于小米,则是通过变焦BEV技术和超分辨率Occuopancy占用网络以及道路大模型做出来的,优势在数据精度和探测准确性,从某种程度上讲,小米更像是采纳了特斯拉早期的Transformer+BEV+Occuopancy方案,在这个基础上对激光雷达和BEV做了技术改进,所以就目前国内各家的技术来看,能和特斯拉FSD正面对招的,似乎只有华为这一家了,而小米和理想,最快可能在明年会有更清晰的答案。
热门跟贴