比真人声还好听? 小鹏P7全新AI语音有点不一样|ai|录音

网易汽车7月26日报道 强大的座舱语音能力，一直是小鹏的杀手锏之一，近期小鹏开始内侧全新AI声音，这个全新AI声音有啥特点和新能力，可以通过一次测试一探究竟。

这个全新的AI声音有啥特点呢？

小鹏全新AI声音采用了在线神经网络引擎+小型离线拼接引擎的技术组合，这两个名字有点复杂，简单的说，通过在线加本地离线拼接的技术，可以让车载声音听起来更细腻自然，更接近真人，甚至还可以表达诸如愉快、严肃、不满、生气、害怕等人类情绪。

小鹏官方也表示，语音合成的方式有很多种，主流方法有单元拼接、合成器、基于深度神经网络合成等几种方式，不同技术有不同的特点。基于深度神经网络合成的小鹏新AI声音，技术会比上一代更加自动化，运算力更强。

“小P新声音在网络良好时支持24K/16Bit的超高清采样，可输出HiFi级高保真音质，这是决定音质好坏最重要的两个指标。相比之下，旧声音只有16K，与当前市面上大部分车载产品水平相当。新旧声音对比来听，会有非常明显的差距。”小鹏汽车产品经理郝超如是说。

除了主观感受外，语音质量评测可以参考MOS，MOS是一项国际通用的语音质量评测方法，它通过与真人声音对比，判断机器声音多大程度像真实人声。满分为5分，评分越高越接近真人。

经MOS语音质量评测，小鹏全新AI声音得分为4.49，是目前微软MOS语音质量评测得分最高的车载语音助手。

这款声音在线合成会费流量吗？

由于这个全新AI的声音主要采用在线神经网络引擎合成，会有很多用户对其流量使用量及弱信号甚至无信号下的表现担忧。

此前，通过在线技术生成声音的业务主要应用在智能音箱领域，汽车领域寥寥无几，原因就是音箱的网络稳定性很高。行车场景常有弱网和无网的情况，如果不解决弱网无网的声音问题，体验会非常差。

小鹏官方表示，因为采用了自研的端云融合多级缓存技术，通过预加载算法，提前预合成提高整体体验，在弱网或无网络环境下，依然带来高音质语音播报，并且已向国家申报专利。通过这一系列技术，保证在线率达到97%。

如果真的遇到没有信号，声音仍旧会保证离线兜底，在线播报延迟也会低于500ms，这其中产生网络流量成本由小鹏自己承担。

真实体验如何？

实测不输人声

为此，我们也参与了小鹏全新AI声音的众测，通过测试项目对全新AI声音进行体验。

按照小鹏官方说法，此次测试标准的设定是基于用户视角的，不需要专业工具辅助。评测角度的设定也都是贴近日常用车需求。

小鹏设定了多、快、好、爽4个评价维度，每一项的成绩分越高，代表着使用语音的体验也就越好。

多，主要考察可用语音操作的功能，测试按照音频类、导航、应用控制、车控和信息查询5大项目，每个项目5-10个测试命令，语音指令涵盖简单与高难度多个维度，比如定外卖、播放收藏、歌曲快进、调整地图比例尺、查询车辆参数等指令挑战难度并不低。

快，考察语音操作的反应速度，测试1分钟内，连续通过语音发出指令，看车辆能完成的指令数量，参考指令则有60余个。

好，语音播放的舒适度，这一项偏向主观感受，测试方法是通过对比声音与真人的相似程度，音质是否清晰细腻及喜欢该声音的程度，进行主观打分。

爽，语音交互的自由度，也就是能否接近或超越与真人交流的体验，测试用户通过不同的指令和语音操作，测试车辆是否支持连续对话、语义打断、可见即可说、多音区识别等功能。

测试现场，来自媒体及用户的数位体验人员，针对市面常见品牌的车载语音系统进行了众测，尤其是在“好”语音播报的舒适程度测试方面，小鹏安排了盲测环节，由小鹏P7及播音主持真人录音在内的9个声音依次唤醒并播报同样内容，测试人员在隔板另外一边，无法看见声音来源的情况下，对每个声音进行评价。

最终，小鹏P7收集有效数据44份，平均得分7.41分，位列全场第一，领先于排名第二位的真人录音的6.23分。同时，在同样40条高频指令的测试下，小鹏P7平均可完成指令为35条，1分钟可完成指令平均为13条，交互自由度评价获平均8.70分，在“多”、“快”、“好”、“爽”四个维度均位列第一。

何时推送给用户？

据悉，全新AI声音将通过整车OTA首先搭载在小鹏P7上，并将随Xmart OS 2.6.1版本一同发布，目前已进入小范围公测阶段。

车内语音交互已经成为智能汽车的必备功能，只是当前各车企的体验存在很大差异，此次即将上线的小鹏P7全新AI语音，凭借全场景语音能力和更拟人化音色输出，进一步拉进了与用户间的距离，语音能力从能用到好用，再到无感使用，小鹏正在持续扩大自己的领先优势，我们对这套语音系统未来能力边界也充满期待。

你关注的车又降价啦！

点此看热门车型本地最新降价信息

比真人声还好听? 小鹏P7全新AI语音有点不一样

你关注的车又降价啦！

热搜

热门跟贴

你关注的车又降价啦！

热搜

热门跟贴

相关推荐

官员请人拍自传，结果误将贿赂情况录音，拍完不久就落马

AI仅用21天研究出来的发动机有多离谱？

男子晒用AI做一家三口画面，结果越修改越“疯狂”

其实大家包括博主本人都能意识到这些问题，我只是把没人讲的话讲出来

ai演绎：如果你每天都跑五公里，身体会有什么变化！

耿同学打假技能AI化，轻松揪出造假论文 这样的草台班子，需要狠人戳穿

三个新大学生必备的AI使用技巧

如何养一只懂事的小龙虾？养虾达人10天速成班

高考前的一次听力课，录音换成了各科老师的祝福，笑着笑着就哭了

豆包的奴性#豆包 #豆包互动 #ai助手

风行CEO易正朝：真正的全产业杀手应用是AI编程，相比AI视频，AI编程对企业经营的意义更大

不是普通的伴手礼，给宾客的专属录音邀请，这份仪式感太戳人了！

AI实时渲染的无限流可视化浏览器Flipbook

Claude觉醒惊爆全网，五角大楼深夜拔网线！AI界奥本海默时刻

陈露录音内容被公布，听完真的颠覆三观，看清她是怎样的人

安心养虾！从OpenClaw 看云上AI安全落地路径

我的新上班搭子，居然是个超靠谱的AI-5

你学任何东西最慢的方式，就是等“准备好”

AI谄媚可能让人陷入妄想症

博士生如何用龙虾做知识管理？

耿同学打假技能AI化，轻松揪出造假论文这样的草台班子，需要狠人戳穿