“形式化知识和参数化知识在表现形式上一直都是大家考虑的问题,ChatGPT和知识图谱两种技术都应该有自己的定位与价值所在。”

这段时间,人工智能聊天机器人ChatGPT刷爆网络。不少朋友在和ChatGPT聊天后评价它经常“一本正经地胡说八道”,是个十足的高情商“老油条”。

毕竟,高达数十亿量级的语料库和同等量级的参数,意味着对各种问题能做到一力降十会,而作为基于GPT-3.5大型语言模型的应用,这家伙对形式语言的造诣已臻化境,所以回答的语法完整,形式逻辑无误,看起来像模像样。

比如在写情书方面:

套路很完整,连表情符号也很会。chatGPT的高情商好像彻底治愈了“人工智障”,让人重燃交互欲望。而在此之前,智能对话解决的核心问题更侧重于回答的准确性和即时性,对于交互过程中的语气、情感、修辞的训练则相对匮乏,表现出回答生硬、冰冷的不良体验。

换句话说,ChatGPT彻底改变了自然语言生成领域,可以提供人们在聊天中所需要的情绪价值,而不仅仅是信息反馈。

01

“高情商”ChatGPT因智商翻车?

然而,就像任何机器学习模型都有其局限性。

ChatGPT的局限性之一是它缺乏对其生成文本的上下文和背景知识的理解。例如,如果要求写一个特定的主题,它可能生成的文本在语法上是正确的,但缺乏该领域专家的深度理解。另一个限制是它无法在不同概念之间进行推理和建立逻辑联系,虽然它可以生成逻辑流动的文本,但它缺乏根据所提供的信息进行推断和得出结论的能力。

例如:在秦始皇摸电线这个问答中,第一个问题,基操稳定,了解懂文化常识。

连续问第二个问题时,也知道秦始皇摸电线是不可能发生的,但是却错误指出电线是图灵发明的。

在第三个反问时,它承认了自己回答有误,还对图灵做了简单介绍,却又错误地说尼古拉·特斯拉发明电线。

由此可见,ChatGPT在其未经大量语料训练的领域缺乏“人类常识”和引申能力。ChatGPT在很多领域可以“创造答案”,但当用户寻求正确答案时,ChatGPT也有可能给出有误导的回答。

如何让这么一个说话风趣、条理清晰,让人如沐春风的“高情商”系统,能够融通古今,有思想有高度,还拥有批判性思维呢?

那可能需要再配上一个高级大脑。

02

从逻辑正确到精准化应答

远传科技做对了什么?

远传科技认为,生成式AI与检索式AI的结合,或将产生更好的落地效果,而检索式中基于知识图谱的问答已是大势所驱。

知识图谱是一种描绘实体间关系的语义网络,用图模型来描述知识和建模事务之间关联关系。与传统的关系数据库相比,它能够更准确、更直观地表示现实世界的概念及其连接,并允许轻松访问和查询,不断逼近最匹配的意图,解决chatGPT回答不准确的难题。

知识图谱最重要的应用之一是搜索问答。

现实生活中,在检索问答上输入的查询问题类型非常多样,表达形式也是千变万化。有些问题是直接围绕实体进行相关的查询,比如“远传核心产品”,“远传发展历程”等等。还有一些问题可能需要进行更进一步的推理和计算才能得到,比如“芹菜的斑枯病是否会传染”,“浙江的农贸市场上的芹菜的批发价格”等等。具体来说,

对于那些直接围绕实体相关的查询,我们会用一些基于知识库问答的技术进行处理,包括自动挖掘模板进行语义解析,进行文法和语义端到端子图匹配等等。

远传科技知识库检索,就是从海量结构化和非结构化数据中进行实体、关系、属性和事件的信息提取,将知识存储到知识库中,从而可以精确查找出目标实体及其相关内容。

然而,对于需要进行推理计算的问题,我们则需要基于动态函数计算、规则逻辑推理等方式进行处理。也就是说我们针对不同问题类型,研发适用的问答技术方案。

远传科技聊天机器人就可以根据用户的浏览历史、兴趣、统计数据来通过使用知识图谱,将信息合并到文本生成中,从而产生更有信息量和更准确的输出,创建个性化的聊天机器人体验。

知识图谱的另一大应用场景是智能推荐。

基于知识图谱的语义关联,以不同概念链接在一起的结构化方式,将所提供的信息进行推理并得出结论,从而提高了模型的推理能力,把文章背后蕴含的内容模型通过知识图谱关联起来,为智能推荐提供更具知识关联的特性。

远传科技的营销服务机器人就是基于获得用户和物品的精确画像,进行准确的匹配和有针对性的决策,实现场景化、任务型的推荐。

由此可见,虽然ChatGPT是一个强大的语言模型,但它在最新信息、上下文理解、概念间的逻辑关系等方面存在局限性。若想在产业应用中能够真正实现降本增效,知识图谱技术将大放异彩。

在未来很长的一段时间内,知识图谱还会继续发挥其关键的作用,来帮助企业更好地管理、利用知识资产,提高工作效率和客户满意度,让智能交互实现 “智商”、“情商”的“双商”在线。