打开网易新闻 查看精彩图片

5月31日,由福建省人工智能学会、厦门市人工智能行业协会、厦门会展集团股份有限公司联合主办的“链接未来人工智能应用场景高峰论坛”于厦门国际会展中心成功举办。快商通COO刘晓葳博士在大会上发表了题为《AI产业落地的路径优化》的主题演讲。以下为演讲实录:

「何谓路径优化」

各位来宾下午好,很荣幸能应协会的邀请,代表快商通在这里分享。今天分享的主题是「AI 产业落地的路径优化」,这听起来是一个很虚的主题,那么我在讲述的时候就要很实在。AI 无疑对生产力产生了巨大的革命性作用,我本人从事 AI 相关的研究和应用到现在已经十年的时间,经历过自己创业,也正在经历快商通公司的高速发展,所以我也结合自己的专业、一些实践工作的经验,谈谈 AI 产业落地过程中,我们是怎么看到机会,如何推动技术的场景化,怎么看待市场和组织团队的。

路径优化是一个很贴切的词汇,因为它本身是一种生物体质的词汇,早在凯文凯利写《失控》的时候,第一篇章就写了「群氓的智慧」,蜂这种低智能的生物,却具备着群体的高度智力化,能够用最优路径完成许多生存目标。我们在从事路径优化的人工智能算法任务中,有着以数学求解为主的最优解方法,以及从观察生物行为而得到的启发式算法,比如蚁群算法。

我对 AI 产业落地的路径优化的定义是:寻找资源使用效率,社会效益,变现能力和长期增长的最优解的过程。显然这是一个复杂求解过程,比较适合使用启发式算法,在这里我们没法给出诸如「何谓最佳场景」的答案,而是试图构建一种机制,让我们不断接近最优解。所以在这里我们谈谈方法论。

在不断的实践过程中,如何优化路径?整体的思路有两个:

1. 探求 AI 对生产力的变革路径,以此打造核心竞争力,寻找构建最佳场景的思路

2. 明确市场的作用,抽象出 AI 创业团队的结构要素

「AI 的核心变革能力」

陆奇在 5 月 18 日清华演讲中对于 AI 的核心作用有如下观点:世界变化的核心驱动是知识,人类历史的进展都源于知识层次的提高,AI 等机器系统帮助人类提升了获得知识的效率,并用知识改造重建任何一个行业,实现商业创新。

我们看到很多将生物系统研究应用于智能化的观点案例,人类在发展中向有机世界学到很多,有机生命的核心是什么?就是通过广义上的「学习」,使用知识来适应环境。对于智能有机体来讲,则是创造适应自身的环境。所以我们定义 AI 的核心变革能力,要回归对于智能有机体的观察。

打开网易新闻 查看精彩图片

人们对智能系统和有机体之间曾有明显的认知边界。我们曾将战略定位为做人工智能引擎平台,现在我们更愿意叫它大脑。其实引擎这个词汇是 60 年工业文明发展的产物,它有什么特性呢?

- 被制造而非自发展

- 完成简单业务目标

- 自诞生起便走向损耗,无法自学习

所以这能唤起我们对于推动 AI 产业落地的一些思考,无论是技术还是产品场景,人工智能本质上是一种构建全局有机发展的过程。这对应到商业层面,就是推动我们去利用 AI 建立一种自学习的,长期增长的,能够达成复杂业务目标的商业模式。对于从事人工智能创业对公司来讲,不妨考量一下技术之外,自己的模式是否足够智能。

在这个世界中,人是是智能世界的主宰的和交互主体。所以我们在探求 AI产业落地路径优化的过程中,其实是从一种回归对人观察的视角开始的。

「构建最佳场景的思考方式」

我们在观察之中逐步形成了以下观点:

- 标注 uid,即识别智能系统的中的每个个体,是一个系统运行的基础工作

我们在做客户分类这样的具体业务中,数据库维护的过程中,甚至简单的代码书写,都涉及到识别个体的工作,更不要说你在任何场景做身份的确认和登陆。

- 回归对人的观察,生物特征是最便捷自然的识别方法,无论是从应用方还是用户体验的角度。要识别人,最优方式就是通过人自己

打开网易新闻 查看精彩图片

「构建场景之路」

基于这两点观察,快商通一直以来都致力于智能生物特征识别大脑的研发,这张架构图(图略)便是我们的智能生物识别大脑及应用场景。

打开网易新闻 查看精彩图片

生物特征识别除了符合人类体验之外,还具备唯一性、安全性和易用性的特征

同时熟悉我们的朋友都知道,声纹是快商通智能生物识别中一个关键环节,我们有李海洲教授这样的顶尖专家,也在 2018 年的 NIST SRE 比赛中获得了世界第三,大中华区第一的成绩。

对于声纹识别的研发投入,源于人类至少 99%的信息交流是语言输出,而通信网络中,沉淀了海量的声音数据,这些数据便是算法的天然养料和应用端必不可少的数据资源。同时在大量的语音交互场景中,声纹识别是唯一可用的识别方式

我们打造了声纹技术的绝对竞争优势。这是我们的技术方案图(图略)。我们的技术架构考虑了活体检测,从而应对录音反欺诈、合成反欺诈和和拼接反欺诈;提供了面对混响和噪声的预处理方法;在特征提取方面考虑了环境影响、跨信道、口语识别和稳健型问题;提供了基于注意力机制的端到端的身份特征向量提取解决方案。通过多任务深度学习框架,最终打造成为包含身份信息、性别信息、情绪状态、语种信息、年龄区间和事件信息提取的综合解决方案。并获得了广泛的行业应用。

很多人会好奇为什么我们能够在 2013 年开始踩中声纹这个重度垂直的技术风口,同时又布局智能生物识别大脑。其实这一切都基于长期以来的思考与推演。

我刚才用一半的篇幅分享了一下通过更加底层的思考我们是如何寻找一个好场景的,同时也为大家介绍了一下声纹识别技术,我总结一下,前面讲了几点:

- AI 产业落地的路径优化问题,是一个典型的启发式问题,没有捷径,我们需要构建的是接近最优解的模式

- AI 的核心变革力在于加快知识获取效率,从而更加快速和广泛的建立智能有机体

- 用叙事视角观察人以及人的交互行为,构建用户故事,是场景构建的核心方法,从中快商通摸索出了智能生物识别大脑和声纹识别技术的方向

打开网易新闻 查看精彩图片

那么在方向的探索实践中,我们有哪些战略控制点,是每个企业的内功呢?

「AI 时代的创业要素」

这里有几个结构化要素可以为大家分享

- 人才密度

- 数据资源

- 技术底层(极限生存假设)

- 场景迁跃能力。

打开网易新闻 查看精彩图片

人才密度:我们一般会从一个区域的体量去提人才聚集性的问题,其实对于企业也一样。因为在 AI 企业,很多创意来自于团队的自组织,比如工程师难以忍耐数据标注过程,于是诞生了自动化标注工具。对优秀人才的最佳激励是同一群优秀的人一起创造伟大的事业,所以高人才密度本身就是将企业打造为有机体的一个方法。

数据资源:如果说 AI 的核心变革能力是加快知识获取效率,那么数据资源无疑就是知识来源,我们会发现很多工作都可以被归纳为对数据的理解和知识抽取,从统计学视角,就是对数据生成过程的一种还原,那么什么数据资源的价值更大?应该是入口级的数据和真正贴近业务产出的数据。

底层技术:这几天我们都在华为的身上学到一个很实际的东西,就是极限生存假设,如果没有海思悲壮的技术长征,不会有今天华为的硬气。基于这个假设,纯粹的 ai 技术提供公司,一定要构建自己的自主技术和知识产权。

打开网易新闻 查看精彩图片

快商通资质荣誉(部分)

在这个部分的最后,我想谈谈场景迁跃能力,这也是我想谈的重点。场景这个词其实在 2016 年之前在行业层面还很少有人提及,但是时至今日逢人必谈场景。今天我们在这个概念上稍微做一些心得上的创新,我们要谈的是场景的「迁跃」。在这里我先举一个很通俗的算法例子,也就是迁移学习的例子。比如我们在图像识别中,用图片训练出了大象和犀牛的区别,那么在分辨老虎和狮子的时候,算法需要重新训练吗?不需要,这就是一种迁跃。

打开网易新闻 查看精彩图片

迁跃能力在算法本身非常重要,又是一种业务理解能力,这也是我们需要建设的基本能力,毕竟人工智能本身就是一种高度抽象业务,并给出解决方案的过程,同时,从多场景的视角讲,这种能力可以使得我们打造产业的纵深和外延,所以从这个意义上它又是一种风险抵抗能力。

快商通声纹的最初实践是在金融领域,而在金融领域的构建过程中,我们的工程师是一定会深入到一线去了解应用方业务运转的,所以我们能把这种身份识别的场景迁跃到了公检法和终端领域,这就是大家看到今天我们可以涉及到众多行业范畴的能力构建。

「市场是什么」

我们谈谈市场,作为今天的结束。在我看来,在面对市场时,要清楚市场的两种作用:

打开网易新闻 查看精彩图片

- 转换器,市场就是技术转化为产业落地,产生效益的最佳地段,它很残酷,也很现实

- 节拍器,就像节拍器帮助乐手控制演奏,或者球队核心帮助球队调节节奏,市场是理性的,不理性的是市场的参与者。我很反感一味的反对新技术泡沫的说法,因为唯有在前的厮杀和关注,才有真金白银的诞生。最终的不理性行为会被市场调节到回归商业的本质:做好产品,然后卖出去。

这就是我的全部分享,希望我们每一位 AI 的创业者,多一些思考,探求 AI 的本质性问题,具备构建场景的能力,同时勇于面对市场,脚踏实地的完善团队的结构化要素。谢谢大家!