《车市纵览》是车市物语旗下自媒体,始终关注海内外所有汽车企业。

关于“ChatGPT”,相信很多人都已经不陌生了。一众大佬的背书,加上媒体的炒作,让这一新生事物瞬间成为继元宇宙之后的又一“科技宠儿”。国内的头部科技公司也迅速跟进,出现了文心一言、通义千问等类似产品。

有人把它当成聊天机器人,也有人将其称之为开启新一轮科技革命的钥匙。它们的出现改变着人类与机器的交互方式,同时也影响着其他产业的发展进程。360集团创始人周鸿祎曾说,ChatGPT不仅仅是搜索引擎的加强版,也不仅仅是一个聊天机器人,它通过SaaS方式所提供的人工智能服务将重塑所有的数字化应用和所有行业。

打开网易新闻 查看精彩图片

5月23日,百度Apollo汽车智能化业务展示了以文心大模型为基础的新一代AI智舱探索成果。其中包括出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力,另外还有在当前智舱命令式交互下覆盖全车多音区、毫秒级响应、免唤醒全时交互的体验。

百度阿波罗智舱业务部产品架构师徐嘉南表示:“大模型的能力给汽车加上了智商和情商,这也是过去系统不具备的能力。”

从交互工具到智能助手

随着新能源汽车的快速渗透,汽车智能化的步伐也在加快。过程中,主机厂、科技公司、一级供应商等玩家纷纷下场,开展智能座舱、自动驾驶方面的研发和应用。而在整个智能化的拼图中,智能座舱俨然已经成为排头兵,考验着每家企业的技术和产品实力。

打开网易新闻 查看精彩图片

据汽车之家研究院《2023中国智能汽车发展趋势洞察》报告显示,智能座舱相关配置近年来渗透率均处于增长态势,特别是网联化配置。其中车联网每年稳步保持上升十个百分点以上,至2022年市场渗透率已超过70%。OTA升级2022年达到近50%,较2018年提升了19倍。

百度也对进智能座舱进行了不少用户调研和拆解分析,结果显示,智能化的功能搭载率排在首位的是语音交互。“语音交互未来的覆盖量还会快速拓展,从我们原来的高技术,到后面的普及率是越来越高。预计到2025年会超过95%的车搭载。”徐嘉南说道。

同时,百度认为未来智能汽车不是有四个轮子的大号手机,而是一个真正可以互动、可以学习的“汽车机器人”。语音交互是智能机器最重要的交互方式。

实际上,语音交互在汽车上的应用已经有接近10年的发展历程,从最开始命令式的语音摇控器,到后来成为准确率越来越高,理解能力越来越强的交互工具,它可以替代手去点击屏幕。在百度看来,语音交互接下来的发展方向就是理想态的智能助理,它不再是单向下命令,而是可以双向互动、对话,理解复杂的需求表达。同时它还会具备更有智商、情商的创造能力。

打开网易新闻 查看精彩图片

“它不再是交互工具,而是真正能够陪伴用户的一个助手。接下来五年会朝这样的方向去进行发展。我们接下来的语音会有大语言模型,推动真正地对话式交互。”徐嘉南介绍道。

相比而言,这会产生两方面变化。一个是用户体验,过去的语音交互纯靠人工设计,堆产品经理、堆研发、堆设计师,这也导致语音交互所能实现的功能还是非常有限的。而大语言模型能真正把通用的语音模型带到设备上,可以在不同的场景下化身不同的助手,解决用户专业的问题。

其次是产业层面。过去车企需要培养一批语音开发人员,去具体进行功能设计。而未来车企会配备提示词工程师这样的岗位,专门调教大模型,让车机有更好的响应和结果,满足用户需求。

打开网易新闻 查看精彩图片

“想要达到这样的变革,就需要更坚实的技术支撑。百度在整个行业里有非常好的AI技术积累,拥有全栈自研的AI架构,从底层的芯片——昆仑芯,到上层深度学习架框——飞浆,以及模型层。我们是基于文心大模型的能力达到这样的体验。”徐嘉南表示。

大模型赋能后的优势

正是基于这样的判断,百度在智能座舱上开展了多项产品化探索。

目前百度的智能座舱分成两大部分,一部分是小度车载SDK,另一部分是小度车载OS。2019年,百度推出了小度车载OS,已在多个车型上实现300多万的搭载量。

打开网易新闻 查看精彩图片

据徐嘉南介绍,根据市场行业发展,目前车企更多希望做个性化、定制化的智能化产品,以便突出自身的品牌调性。为了满足这些客户的需求,百度推出了小度车载SDK,其具备更开放性的设计,可以让车企进行差异化设计。整体内容分为三部分,一是语音SDK,其次是车载生态,第三部分是核心的智慧增强包。

其中小度车载语音基于大模型本地化技术开发。所谓的大模型本地化,是把云端参数非常大的模型通过蒸馏和裁剪方式,把整个体积和运行资源占用变得更小,然后移动到端上,利用本地化算力去做加速运行,从而带来更极致的语音交互体验。

这样做有以下优势,首先是体验更流畅,用户可以在任何位置、任何时间直接交流,没有交互屏障,不像原来要不断进行唤醒,真正做到全时免唤醒,不需要再唤醒。另外,小度车载语音还支持多路同时交互,车内每个位置都有专属的服务语音交互,其背后比较大的挑战就是拒识能力,具体来说就是区分人是不是在和车说话,如果是和车说话,就应该有响应,如果不是和车说话,就应该忽略。

打开网易新闻 查看精彩图片

目前,小度车载语音通过语音加语义的多模拒识,可以达到非常高的拒识准确率,并且是全时。

其次是极速、更快的响应,小度车载语音可以做到全领域毫秒级响应,速度会达到端到端的800毫秒。只有做到全领域才能带来持续的交互体验。

据徐嘉南介绍,“相比于整个行业的主流产品来说,我们提升了一倍速度。如果是唤醒,最快的速度是接近1.5秒,这基本上是极限了,而我们真正可以做到全领域。同时,因为它具备本地化能力,可以把大量的人机交互数据保存在本地,极大地保护了用户隐私。”

第三是全场景。一直以来,更多车企会将语音交互集中在自研应用上,很多第三方应用是无法使用的。这主要是因为整个开发过程中有非常高的适配成本,车企需要生态,就需要跟应用方进行深度开发和合作,付开发费。一旦页面改变,以前的工作都可能全部推倒重来。

打开网易新闻 查看精彩图片

现在通过本地注册能力,小度车载可以通过自动识屏方式,自动识别屏幕上的按钮,帮助OEM节省成本,给用户带来全场景体验。车里所有的功能都可以语音交互,而不是只在某些应用里面才能使用。

第四,小度车载语音在文心大模型的加持下变得更聪明了。

为车企提供两种方案

这里不得不提到百度推出的车载智慧增强包。相对于原来命令型、任务型的智能,车载智慧增强包给其加上了真正的智商和情商,可以让每个车载场景更智慧,更能够去帮助用户解决实实在在的用车需求。其背后需要强大的逻辑理解能力,包括对话式交互能力、策略规划和知识问答。

总结下来,车载智慧增强包含有两个基础功能和两个结合功能。两个基础功能是指超级闲聊、灵感画画。基于此可以实现百变人设,用不同人设的风格进行语音回复,其次是AI新车导购,可以通过一个模拟导购员的方式与人进行互动。

打开网易新闻 查看精彩图片

“从整个发展角度来看,我们认为未来文心大模型会重塑车内的应用和交互,基于文心这样的能力,把过去可能我们想到的体验,但是过去的技术做不到的能力,去进行一次优化,一次重构,给大家带来全新体验。”徐嘉南说道。

据他透露,目前很多车企都很感兴趣,在和百度进行探索。车企感兴趣的主要包括几个方面,第一是大模型的整个能力能不能快速上车,这是车企最关注的。

第二部分是上车合作的方式。目前主要有两种方案,一是小度车载智慧增强包,这是标准化产品,可以快速给到车企,车企可以直接放到车上和系统进行融合。其次是满足车企的个性化需求,比如要自己去设计一些场景,设计一些能力,百度则通过引擎的方式和车企进行合作。

当然,百度基于大模型能力还在进行更多功能探索。比如在出行场景下的行程规划、个性化的驾驶空间、用车顾问、儿童益智场景等等。从某种程度上说,大模型已经成为汽车智能化的核心驱动力,而百度Apollo也将作为一个“赋能者”,持续助力车企在智能化赛道上获得领先。

打开网易新闻 查看精彩图片