网易科技讯9月15日消息,网易科技主办的第49期五道口沙龙——智能音箱抢滩站,今天下午举行。出门问问公司产品副总裁林宜立分享了《智能音箱的语音交互技术标准》演讲。他认为中国智能音箱的征程才刚开始,路还很长。

林宜立表示,百箱大战的背后存在着慢AI与中国快市场的矛盾,小市场与大玩家的矛盾。他认为智能音箱的征程才刚开始,以后的路还很长,中国还在启动器,美国可能即将进入高速发展期。

从4月份到现在,出门问问做了很多公测。什么是合格的智能音箱?林宜立表示需要在设计、音质、智能、内容服务和智能家居等方面没有任何短板。

关于语音交互体验好不好,标准是什么?林宜立说出了五个标准:远、快、准、全、深。智能音箱能否改变生活主要取决于语音交互技术能够做到多好。(静静)

演讲原文:

林宜立:各位好。在这里我也跟大家分享一下出门问问的一些思考和智能音箱的情况。

今年来智能音箱非常火,很多人问为什么要做智能音箱,其实每家公司都有自己的路径、基因和对行业的理解,我们其实是2012年成立的一家公司,我们走了一条自己回头看有点不一样的路,我们最早是算法公司,2012年时做机器翻译、机器学习的算法,当时甚至连App都没有,后来我们的创始人回国以后有一个小团队,从一开始没有产品经理也没有市场,什么都没有,就是做了一些小App、小Demo,当时能做一些简单的人机对话,发现好像活不下去,2013年开始,当时智能硬件的大潮已经开始出现了,谷歌眼镜,微信也火起来,在这之上我们做了一些语音对话,挺有意思的,但由于我们依附的平台(谷歌眼镜)没起来,所以就下去了,微信语音助手倒是小火一把,但现在也不稀奇了,因为现在很多公众号,像小冰这样的都可以跟它聊,包括谢总的Bot也非常有意思,挺强大的。

2014年我们开始觉得如果我们不做to B,那么我们可能是to C,有没有可能把我们的技术和产品打包成C端的产品让用户直接用,所以从2014恩年我们做了一些软硬件的尝试,做智能手表,了解的朋友知道我们做了Ticwatch手表,相当于是垂直整合,从算法到软件,从操作系统到硬件设计和开发都自己做。

再往下今年开始我们重新发布升级了我们的手机智能语音助手App,这是我们公司的路径。

其实音箱这事儿启动还蛮早的,2016年8月就开始说要做这事儿,对造型设计和研讨都做了很充分的准备,2017年4月份比较早就发布了音箱的发布会,上个月开了正式发布会,一些朋友都去了,现在正在众筹的最后期间,估计下个月就能发货。

刚才说到这个行业特别热闹,百箱大战,我们作为一家成长型的中小公司怎么看这事儿,有媒体说你们起了大早赶了晚集,好像晚了一点,确实有很多竞品都发了,还有一些特别好的媒体朋友说了智能音箱的下场可能跟智能手表差不多,那天有篇文章说我们不就是又做智能手表又做智能音箱的公司吗?太精准了。当然,写这篇稿子的朋友是我很好的朋友,Pingwest。

首先我们手表做得还是可以的,我们觉得手表这个品类和音箱类似,会有一个爬坡的路径,如果大家回头去想iPhone这么革新级的产品到第几代才真正爆发?iPhone一代二代是比较小众的产品,我觉得手表,尤其到明年,大家可以看苹果刚刚发的独立4G模块,现在市面上这款Ticwatch其实已经配置了4G模块,智能手表慢慢不需要依赖手机,它作为一个品类也会越来越成熟,我们刚刚在北美发的一款表还不错。

我们反思是我们太慢了还是这个行业太快?其实现在一个很明显的矛盾是用户和市场需求非常快,大家对于音箱的性能、对于AI的理解由于媒体和最近的报道大家都希望这是一个非常聪明的音箱,你必须懂我,什么都要特别好,但其实这个技术是比较慢的,真正行业里的人知道,真正想要把技术打磨好其实没有那么快。

第二,玩家很多,尤其很多大玩家,其实这个市场真的很大吗?未必的,在这个阶段,整个中国一年智能音箱的量能有多少?可能跟其它手机比还是非常小的,所以这里面有很多矛盾。

这张图大家经常看,是这样一个曲线,我们觉得美国可能比中国要快一点,中国通常起伏比较大,所以我们觉得这阶段可能马上要有一个爬坡的趋势出来了,今年、明年、后年,但可能中国市场的后劲非常大,只要是中国人想做的事儿应该没什么做不了,并且一定能做到最快。

4月份到现在我们做了一些什么?其实也做了很多公测,跟行业很多公司都学习了,做智能产品,尤其智能软硬件,如果不跟用户在一起,不去迭代,不去贴近市场,最后这个产品肯定好不了,所以公测也好、内测也好,包括对于音质、外观等各方面的设计迭代都在进行。

什么是合格的智能音箱?在这几个领域,如果一款音箱调度好,或多或少都得做,不能有短板。

1、设计。因为这是一款要放在家里的音箱,刚才宋总说的那个设计特别好看,我当时其实特别想买一台,但国内好像买不到。

2、音质。早期做是让大家尝鲜,成本上有一些控制,所以音质上有一些限制,但对我们来说第一天我们就觉得音质是不能妥协的东西,待会儿我会讲一下这块的设计、喇叭的功耗、音质的优化。

3、智能。云交互、足够智能,智能家居。

这款是我们即将发布的音箱,获得了德国的红点设计奖,非常简洁干净,简单到不能再简单,但在材质上和用色上做了很多打磨和功夫,也就是说这款音箱我们认为放在家里怎么放,都应该非常好看非常搭。

音质上今天不展开细节,可能我们这款音箱相对比较大一点,因为好的箱体,好的音质需要一定的结构设计以及相应的喇叭(呈现),圆锥体、360度功放声波。

语音交互好不好,当时我们在发布会上提了,有这么五个字:

远,场景远近;

快,不光是唤醒快,还有反应要快;

准,我想问的东西你要给我准确的信息;

全,很多高频需求也有很多长尾需求,但用户拿到产品后永远会问一些你想不到的问题,这个过程中需要尽量把覆盖的场景做得广一点;

深,出了一问一答或单次对话你有没有办法接住用户的深度对话,也就是能不能接住多轮对话。

在这几个方面我们下了很多功夫,希望通过我们自己的迭代和行业品牌一块儿把行业标准建立起来。“远、快、准、全、深”英文叫FFABD。

能否改变生活,取决于语音交互技术能够做到多好,尤其是在一些高频场景,能否帮到用户。

刚才嘉宾问有谁用Siri,我举了手,每天用的我也举了手,因为我用它设闹钟,大家特别困的时候你对Siri说帮我设一个明天几点钟的闹钟,但打开App还要半分钟,大家可以试一下,试过就知道,非常好用。

除了做硬件以外我们的手机App也一直在迭代,如果大家感兴趣可以下载出门问问的App,安卓版本可能会跑得更快一点,功能更全一点。

除了可以在助手上做语音交互和体验当前比较新的语音技术,这款App可以帮助你跟以下智能硬件配合,比如智能手表、智能音箱还有一些智能家居的产品。

我们认为好的VPA有这么几个指标:

1、自然交互;2、海量内容;3、个性服务;4、无处不在。

无处不在很重要,我们谈音箱的时候只关注音箱,谈智能手表只关注手表,但对用户而言他并不在乎你这个是什么,最重要的是这些设备之间是不是能互相打通和理解,所以我们做的一些尝试,穿戴、Ticwatch,今年到明年如果大家买智能手表,它可以跟其它硬件做配合,车载这块我们也有深度合作。

我们的意思并不是无所不能,但我们看到一个趋势,在行业早期如果你能够垂直整合的话是能够比较快地在一些点上打通用户体验,做技术和产品的人体会很深,一件事如果你有三个合作伙伴,用了三家的技术,你想把它做好,这里面有太多扯皮的事儿,不是大家愿不愿意一起做事,而是这个事情的复杂度天然就比较高,所以有些脏活累活我们内部自己先做了,但未来我们会在一些品类上希望和更多合作伙伴做各种各样的合作,不管是软件还是硬件。

这一页是说智能音箱有哪些核心场景,我们这边其实也是提供另一个维度,音乐电台、新闻资讯、生活服务、智能家居、时间管理,以及很多实用的小工具。

当然也需要很多合作伙伴的帮助,我们跟很多国内一线都进行了对接,在音乐上我们是目前市面上第一家跟QQ音乐有内容整合的音箱,所以我们的音箱自带一年的QQ音乐VIP会员,因为你作为一个很好喇叭,没有一个很好的音源支持其实挺浪费的,在我们的内测中我明显感觉到当我们切到头几天,微信群里挺热闹的,大家明显感觉音质不一样。

主要就是这些内容,一会儿可以再交流。