在智能汽车技术中,高阶自动驾驶是各大厂商以及大多数互联网巨头都在全力攻克的难题。谁能够率先推动高阶自动驾驶技术的落地,谁就能够在汽车销售上占尽先机。而在高阶自动驾驶技术中,如今被各方势力讨论最多的就是端到端模型。

打开网易新闻 查看精彩图片

和之前的模型相比,端到端似乎已经成为高阶自动驾驶的必经之路。那么端到端模型是什么?国内的端到端模型发展态势如何?这些问题都值得人们关注。

什么是端到端模型?

说起端到端模型,自然离不开今年大火的ChatGPT。ChatGPT本身就是一个端到端模型,即通过输入文字,客户就能够得到自己想要的答案。

无论是PPT还是视频,ChatGPT以及其他大模型都有可能吐出来。在这个过程中,最为关键的就是AI模型。它能够去洞察用户的需求,并产出用户需要的内容。

打开网易新闻 查看精彩图片

在自动驾驶领域,最为知名的端到端模型莫过于特斯拉的FSD V12。这套模型的输入端是摄像头获取的各种图像数据;输出端则是车辆控制指令,包括转向、加速和刹车。而中间,则是特斯拉引以为傲的大模型。

端到端模型场景下,当车辆识别到了某些交通指示信号或者遇到各种情况下,其会根据过往学习的情况来自动进行判断,而不会像传统模型一样根据事先设定好的各种前置条件,在代码中寻找处理解决这个问题的方法。

端到端模型的优势是什么?

相比之下,过去传统的自动驾驶模型都是基于工程师事前设定好的工况来执行。包括变道、泊车甚至超车等驾驶行为的选择,都已经被前期设定好。这样就会带来两个问题:

自动驾驶模型越来越复杂。由于每一个模块通常只会执行一个驾驶行为,因此自动驾驶算法需要把人类驾驶员的驾驶行为都尽可能纳入其中。因此,传统的自动驾驶技术的代码通常都有几十万行代码。这就会带来对智驾芯片算力越来越高的要求。而特斯拉的FSD V12只有2000行代码;而FSD V11则有惊人的30多万行代码。

打开网易新闻 查看精彩图片

无法解决长尾工况。无论在前期试验和认证有多么的充分,没有一个自动驾驶算法能够说把所有的长尾工况都纳入其中。那么一旦遇见新的长尾工况,就很有可能发生交通事故甚至导致人生伤害事故的出现。

最好的案例就是通用旗下的Cruise在加州运营的Robotaxi项目在上马伊始就遇到各种之前试验阶段没有碰到过的工况,并导致人员伤亡,逼得加州公路局一度暂停了Cruise的营运牌照。

端到端的难点在哪里?

要想达成端到端模型,主要有两个限制因素:海量的数据和大算力。只有在这两个因素的加持下,端到端模型才有落地的可能。为了能够让端到端模型更加贴近人类驾驶员,其大模型往往需要包含上亿的参数量。只有参数量越多,才能越好地来模拟人类驾驶员的驾驶特点和习惯,模型的性能才会更好。而在这两个领域,特斯拉都占据了比较明显的先发优势。

打开网易新闻 查看精彩图片

不久前,特斯拉刚刚得到国内的数据安全和隐私保护的认证,并被允许进入政府部门大院。而之前特斯拉未能得到相关认可的原因就是因为其每辆车上的摄像头都在实时采集各类数据,并上传到服务器,供其训练FSD算法的使用。

放眼全球,特斯拉每年新销售的车型正在源源不断为FSD V12算法提供数据,供后者持续优化学习。

值得一提的是,特斯拉的车上还有一个“影子模式”。它会比较车主的驾驶行为和自动驾驶系统决策出来的驾驶行为之间的偏差,并将相关数据一并上传,同样也来对算法进行优化。

打开网易新闻 查看精彩图片

同时,为了能够对收集上来的海量的数据进行计算,特斯拉还需要有一个超算中心。而超算中心的核心就是大算力芯片。为此,特斯拉不仅大量购买了英伟达H100芯片,甚至还自研了Dojo芯片。前者的单价高达3.5万美元,至于后者的研发成本投入更是数以亿计。

对于任何企业来说,这都是一笔不小的开销。国内车企基本都还没有能力自研大算力芯片。而英伟达H100芯片早已经成为美国出口管制清单上的产品,国内车企要想获得难度不小。

https://www.xhspx.com/index.php/vod/detail/id/244941.html