【网易智能讯11月9日消息】近日,第26届CIKM于11月6号在新加坡开幕。CIKM全称为“信息和知识管理国际会议”(Conference on Information and Knowledge Management),是信息检索、知识管理和数据库领域中顶尖的ACM会议。

中国创业企业智言科技(Webot Technology)在现场做了基于问答对和知识图谱的单轮问答,基于非结构文档的知识性问答,以及基于知识图谱的多轮问答。其中,多轮问答中还采用了情绪识别技术,用以增强客户体验。

智言科技的创始人周柳阳 (Leo)称,智言采用了无监督方法作为冷启动;在标注数据上,使用了state-of-the-art的监督模型,而且基于强化学习的模型具有持续更新的特点。智言科技的整个系统(Webot)主要包含五个模块,事实性问答;基于知识图谱的问答;基于非结构化文本的问答;任务型多轮问答以及基于业务逻辑的排序模型。

对于基于知识图谱的问答,智言能够从结构化、半结构化、非结构化的文本数据中抽取知识,得到RDF的表示,并通过查询语句在图数据库中检索答案。在这个模块中,Leo表示,智言使用OpenIE,Bootstrapping和Data programming等技术,从非结构化文本中抽取三元组。获取足够的用户数据后,再使用有监督学习方法抽取三元组,包括使用Bi-LSTM+CNN+CRF做实体识别以及基于CNN/LSTM的文本分类算法。构建好知识库后,会使用智言自主研发的Wegraph存储大规模三元组,并使用对应的查询语言模型进行答案抽取和生成。

由于自然语句的复杂性,他解释道,主要使用人工加算法的方式产生多粒度的查询条件,并生成相应的查询语句,在这里使用Seq2Seq+RL的模型结合attention机制等直接从自然语言句子产生对应的抽取要素,同时,也使用deep walk等算法,直接根据自然语句在子图上做random walk。

最后,Webot结合单轮问答的技术和对话管理技术,完成对轮对话的模型构建。同样,在冷启动阶段,智言使用有限状态机模型,根据业务逻辑,手动构建对话状态和状态转移矩阵。得到大量非标态对话数据后,智言使用端到端的层次编解码模型,结合隐变量,能够完成无监督、半监督和强化学习的对话建模,融合前面提到的知识图谱查询模型,为用户提供更为精准和流畅的用户体验。此外,智言还引入情绪建模,即SentiBot,能够根据用户的情绪,做出安抚、进一步推荐产品等功能,帮助企业减少客户投诉并增加销量。

在会上,Leo和Flipkart(印度最大的电子商务零售商)、Shopee(东南亚最大的电商平台)等国际性电商平台做了深入的交流,探讨了智能对话机器人在电商领域的应用。目前,智言科技已经成功地与互联网金融、在线教育、保险、在线旅游等新兴行业以及物流等传统行业的公司进行了深入的合作,为客户开发定制化的智能客服系统。

从各类对话系统落地的成功案例来看,成熟的智能人机交互少不了自然语言理解(NLU),对话管理(DM),自然语言生成和文本或语音输出这几个重要环节。上述分享大多谈及这几方面技术。但是,由于垂直领域的信息复杂情况,还需要进行不断的细分,需要找到特定的方案来解决;就这点来说,像智言科技分享的经验将对细分领域智能对话系统开发提供有价值的借鉴。

值得一提的是,本届获奖的best full paper, best short paper以及runner up全是中国人。

未来,人机智能交互领域的知识体系建构会越来越完善。学术和垂直行业的紧密结合,会有更多和更好的人机交互的场景应用。本次CIKM大会让我们有理由期待更多成功的智能对话交互的落地。(易智)