原标题:毫末智行率先推出自动驾驶认知大模型DriveGPT

ChatGPT备受关注,源自于它在知识问答、文本生成等方面的表现惊艳众人。ChatGPT这类人工智能可以借助高速的计算能力、强大的存储空间、精准的操作能力,提升人们的工作效率和决策能力,起到辅助人类工作的作用。随着ChatGPT成为国内外市场高度关注的热点,国内不少企业也加入了该赛道,而认清ChatGPT的特质后,对这类技术的应用才会事半功倍。

ChatGPT特殊之处在于它是有着足够多数据量的大模型,并且可以涉及其他领域的赋能应用。以自动驾驶这一赛道为例,今年2月,国内自动驾驶独角兽企业毫末智行就宣布旗下人驾自监督认知大模型正式升级为DriveGPT,这也是全球首个自动驾驶认知大模型。

ChatGPT采用的技术,其本质是Transformer大模型以及“人类反馈强化学习(RLHF)”技术。自动驾驶领域,毫末在国内最早将Transformer大模型引入到数据智能体系MANA当中。在今年1月的HAOMO AI DAY上,毫末智行CEO顾维灏介绍,毫末推出的人驾自监督认知大模型就已借鉴了ChatGPT的实现思路,采用RLHF(人类反馈强化学习)技术,通过引入真实人驾接管数据,对自动驾驶认知决策模型进行持续优化。这也是为什么毫末能在短时间内推出DriveGPT的原因。

同样是在1月的HAOMO AI DAY上,毫末正式发布智算中心雪湖·绿洲(MANA OASIS)。作为中国自动驾驶行业最大智算中心,MANA OASIS由毫末与火山引擎联合打造,每秒浮点运算达67亿亿次,存储带宽每秒2T,通信带宽每秒800G。

MANA OASIS强大的算力支撑也让毫末的大模型有了更大的发挥空间,带来MANA五大模型全新亮相升级。其中,人驾自监督认知大模型,也就是DriveGPT,主要就是解决业界更难的自动驾驶认知问题。

大模型助力下MANA最新的车端感知架构是一个更加端到端的架构,过去分散的多个下游任务都集成到了一起,除了车道线、车辆、红绿灯等任务,还包括通用障碍物识别、局部路网、行为预测这些任务,实现了一个跨代升级,能够更好地支持毫末跨入自动驾驶的3.0时代。

毫末的认知决策算法则是经历了三个阶段的进化。第一阶段是引入个别场景的端到端模仿学习,直接拟合人驾行为。第二阶段是通过认知大模型,引入海量正常人驾数据,通过Prompt的方式实现认知决策的可控、可解释。第三阶段,也就是当前阶段,通过引入真实接管数据,并且在大模型中开始尝试使用RLHF算法,对人驾接管数据进行学习。同时,毫末构建了自动驾驶决策的奖励模型(reward model),从而在各种规划场景下做出最优的决策。通过这一大模型,在掉头、环岛等公认的困难场景中,场景通过率提升30%以上。

目前,毫末DriveGPT已完成模型搭建和第一阶段数据的跑通,参数规模可对标GPT-2的水平。接下来,DriveGPT将持续引入大规模真实接管数据,通过人驾数据反馈的强化学习,来不断提升测评效果,同时也将DriveGPT作为云端测评模型,用来评估车端小模型的驾驶效果。毫末也透露,DriveGPT最新重要进展将在4月举行的第八届HAOMO AI DAY上公布。

今年两会,政府工作报告中用“大力发展”来描述推进数字经济,报告中提到加快传统产业和中小企业数字化转型,着力提升高端化、智能化、绿色化水平。而以毫末智行为代表的新兴科技企业正在脚踏实地做好核心技术创新,为实现高水平科技自立自强贡献力量。