版权声明:本文版权为网易汽车所有,转载请注明出处。

网易汽车7月26日报道 强大的座舱语音能力,一直是小鹏的杀手锏之一,近期小鹏开始内侧全新AI声音,这个全新AI声音有啥特点和新能力,可以通过一次测试一探究竟。

这个全新的AI声音有啥特点呢?

小鹏全新AI声音采用了在线神经网络引擎+小型离线拼接引擎的技术组合,这两个名字有点复杂,简单的说,通过在线加本地离线拼接的技术,可以让车载声音听起来更细腻自然,更接近真人,甚至还可以表达诸如愉快、严肃、不满、生气、害怕等人类情绪。

小鹏官方也表示,语音合成的方式有很多种,主流方法有单元拼接、合成器、基于深度神经网络合成等几种方式,不同技术有不同的特点。基于深度神经网络合成的小鹏新AI声音,技术会比上一代更加自动化,运算力更强。

小鹏P7全新AI声音自我介绍
打开网易新闻 查看更多视频
小鹏P7全新AI声音自我介绍

“小P新声音在网络良好时支持24K/16Bit的超高清采样,可输出HiFi级高保真音质,这是决定音质好坏最重要的两个指标。相比之下,旧声音只有16K,与当前市面上大部分车载产品水平相当。新旧声音对比来听,会有非常明显的差距。”小鹏汽车产品经理郝超如是说。

除了主观感受外,语音质量评测可以参考MOS,MOS是一项国际通用的语音质量评测方法,它通过与真人声音对比,判断机器声音多大程度像真实人声。满分为5分,评分越高越接近真人。

经MOS语音质量评测,小鹏全新AI声音得分为4.49,是目前微软MOS语音质量评测得分最高的车载语音助手。

小鹏全场景语音演示
打开网易新闻 查看更多视频
小鹏全场景语音演示

这款声音在线合成会费流量吗?

由于这个全新AI的声音主要采用在线神经网络引擎合成,会有很多用户对其流量使用量及弱信号甚至无信号下的表现担忧。

此前,通过在线技术生成声音的业务主要应用在智能音箱领域,汽车领域寥寥无几,原因就是音箱的网络稳定性很高。行车场景常有弱网和无网的情况,如果不解决弱网无网的声音问题,体验会非常差。

小鹏官方表示,因为采用了自研的端云融合多级缓存技术,通过预加载算法,提前预合成提高整体体验,在弱网或无网络环境下,依然带来高音质语音播报,并且已向国家申报专利。通过这一系列技术,保证在线率达到97%。

如果真的遇到没有信号,声音仍旧会保证离线兜底,在线播报延迟也会低于500ms,这其中产生网络流量成本由小鹏自己承担。

真实体验如何?

实测不输人声

为此,我们也参与了小鹏全新AI声音的众测,通过测试项目对全新AI声音进行体验。

按照小鹏官方说法,此次测试标准的设定是基于用户视角的,不需要专业工具辅助。评测角度的设定也都是贴近日常用车需求。

小鹏设定了多、快、好、爽4个评价维度,每一项的成绩分越高,代表着使用语音的体验也就越好。

多,主要考察可用语音操作的功能,测试按照音频类、导航、应用控制、车控和信息查询5大项目,每个项目5-10个测试命令,语音指令涵盖简单与高难度多个维度,比如定外卖、播放收藏、歌曲快进、调整地图比例尺、查询车辆参数等指令挑战难度并不低。

快,考察语音操作的反应速度,测试1分钟内,连续通过语音发出指令,看车辆能完成的指令数量,参考指令则有60余个。

好,语音播放的舒适度,这一项偏向主观感受,测试方法是通过对比声音与真人的相似程度,音质是否清晰细腻及喜欢该声音的程度,进行主观打分。

爽,语音交互的自由度,也就是能否接近或超越与真人交流的体验,测试用户通过不同的指令和语音操作,测试车辆是否支持连续对话、语义打断、可见即可说、多音区识别等功能。

测试现场,来自媒体及用户的数位体验人员,针对市面常见品牌的车载语音系统进行了众测,尤其是在“好”语音播报的舒适程度测试方面,小鹏安排了 盲测环节,由小鹏P7及播音主持真人录音在内的9个声音依次唤醒并播报同样内容,测试人员在隔板另外一边,无法看见声音来源的情况下,对每个声音进行评价。

最终,小鹏P7收集有效数据44份,平均得分7.41分,位列全场第一,领先于排名第二位的真人录音的6.23分。同时,在同样40条高频指令的测试下,小鹏P7平均可完成指令为35条,1分钟可完成指令平均为13条,交互自由度评价获平均8.70分,在“多”、“快”、“好”、“爽”四个维度均位列第一。

何时推送给用户?

据悉,全新AI声音将通过整车OTA首先搭载在小鹏P7上,并将随Xmart OS 2.6.1版本一同发布,目前已进入小范围公测阶段。

车内语音交互已经成为智能汽车的必备功能,只是当前各车企的体验存在很大差异,此次即将上线的小鹏P7全新AI语音,凭借全场景语音能力和更拟人化音色输出,进一步拉进了与用户间的距离,语音能力从能用到好用,再到无感使用,小鹏正在持续扩大自己的领先优势,我们对这套语音系统未来能力边界也充满期待。