01
主打交互的对话式AI
在诸多AI落地场景中,对话式AI无疑是最容易引起大众共鸣的存在。ChatGPT崛起之初也是依靠的兼具理解力、创造力和记忆力的对话模型。相较苹果 Siri、微软小冰等 AI服务,ChatGPT 最大的亮点之一在于它可以理解用户需求并创造内容、协助代码编写、能够针对用户的追问在后续对话中进行修正或补充。
除了逻辑严密的创造能力之外,ChatGPT 具有记忆能力,在连续的对话中无需用户提供重复信息,其语言组织和表达能力也更接近人类水平,使对话更自然流畅。目前的 ChatGPT 局限性也较为明显,官网提示无法保证 ChatGPT 生成内容的准确性,此外部分创作内容或涉及版权问题。
而随着国内各家大模型训练的崛起,中文大型预训练模型的出现,也使得国内对话式AI的生成能力和智能水平得到了飞跃式的提升,对话式AI成为资本市场的香饽饽的同时,各界玩家便也都对对话式AI表现出极大的兴趣。而继文心一言(百度)、天宫AI助手(昆仑万维)后,字节跳动也带来了独立的AI对话产品——“豆包”,整个赛道显得热闹非凡。下面,我们就选择文心一言、天宫AI助手、豆包三款拥有独立APP的对话式AI产品为大家进行横向比较,看看如今对话式AI差距究竟在哪儿。
02
三款独立对话式AI亮相
探寻角色与定位
当前不少拥有大模型的平台都将对话式AI功能整合到了旗下主推软件的内部,如哔哩哔哩的AI智能搜索以及快手“AI对话-快意”,具有极强的工具属性,并非独立存在的个体,而文心一言、天宫AI助手、豆包三款对话式AI目前均拥有独立APP,用户需要单独下载安装才能使用,一定程度上弱化了平台流量的支持,但更强的独立性也能赋予这些产品未来更多可能性。
启动三款对话式AI软件后,首先向他们提出“你可以介绍一下你自己吗?”的问题,三款AI的回答内容中,“文心一言”最为简单,不过反而更符合人类对话的语言逻辑,毕竟豆包和天工将自己的母公司背景介绍出来,虽然详尽,可却少了些拟人化元素。
在具体的功能划分上,豆包和文心一言较为简洁的归类为“提供游泳的信息和支持,以帮助人们解决问题和获取知识”,而“天工”则是非常具体的表示“我的AI生成能力可以满足文案创作、知识问答、逻辑推演、数理推算、代码编程等多元化需求。”
然而,这里我们需要明确一个事情,对话式AI同细分赛道的大模型是有一定差异的,诸如通义听悟、学而思MathGPT这样的大模型本身属于垂直细分赛道的产品,其应用强调的是“专精”,而对话式AI更像是通用大模型的附属品,用户通过针对性极强的问题,索取解决方案、相关只是内容,无所不知的“虚拟助理”和懂你的“知己(情感交互)”才是这类对话式AI应该扮演的角色。
ChatGPT能成为现象级的对话式AI,在于其能在与用户展开对话的过程中,能够“回答后续问题,承认自己的错误,质疑不正确的前提,并拒绝不适当的请求”,因此,我们在对话问题和聊天内容设计上不再会以“将军饮马”“古诗翻译”“文章撰写”等为参考点,而是选择以“旅游方案建议”和“小学生自主学习能力培养”两条主线展开,考校三款对话式AI综合能力。
03
旅游方案建议
豆包优势明显
通过“帮忙制定一份10月国庆节,从重庆出发到北京的旅游计划,一共2名成年人,1名小孩(10岁),6天5夜,倾向研学游。”的问询指令开启对话,让三款AI给出建议。然而,比较让人失望的是文心一言对于目的地的识别出现了错误,竟然给出了包含重庆的旅游计划,这显然对于表述理解不清。
相较之下豆包和天宫AI助手都非常准确地识别了出发地和目的地,且根据计划天数安排好了每日的行程,不过细看的话豆包安排的计划明显优于天宫AI助手,虽然两者都将时间分成上午、下午和晚上三个时间段,但以第一天为例,天工AI助手仅考虑到了入住酒店和休息,但豆包这边不仅安排了博物馆行程,更明确建议晚上的北京特色美食名称。同时,天工AI助手虽然提到了让孩子们也可以在旅途中享受美食,可除第一天对美食一笔带过外,就根本没提了,豆包在安排合理性上更胜一筹。
当然,豆包比较有意思的是其第一次给出计划仅安排到了第五天,当笔者再次输入“第六天和返程如何安排?”时,豆包又给出了补充答案,有趣的是补充答案衔接倒是非常自然,对话属性拿捏准确。
豆包、天宫AI助手给出的旅游计划更偏框架性,本身落地执行明显需要更多信息,而这也是对话式AI的优势所在。笔者接下来提出“北京这些博物馆是否需要预约,如何预约”的模糊性问题,看两款APP是否能顺利接上。
从测试结果看,虽然笔者故意在“这些博物馆”中用“这些”一词进行模糊指代,但两款APP均明确给出了方案中博物馆的预约方式和注意事项,对于信息检索式问题的应对表现非常出色。
04
育儿话题
回答滴水不漏
相对旅游方案,“如何培养小学生自主学习的能力”的育儿话题更为灵活,对话类AI需要对信息进行综合整理并分析,才能给出答案内容,而三款APP这一次均给出了自己的建议和规划,从学习兴趣、思考能力等多个方面讲述对培养小学生自主学习能力的见解。
当然,从真正育儿的角度看,这些方法和建议多少有些心灵鸡汤的味道,但从聊天的角度出发,这样的情感陪护式聊天同样也是解决问题的一种方式,至少在“听君一席话胜似一席话”之后,能够释放出内心的焦虑感。
而面对“小学生有没有必要学习奥数”这种争议性极大的问题,三款AP表现反而让人有些惊喜,基本能从正反两面讲述学习奥数的好处和不足,最终给出的建议是“根据个人情况不同,结合小孩子兴趣来作选择”,回答可谓滴水不漏。
05
期待AI对话个性化
值得关注的豆包
AI能力的提升,让我们对对话式AI能达到的水平有了更高的要求。除希望AI可以产生一些与上下文更相关、更连贯、更一致的对话外,我们更希望对话也应该对于风格、偏好等更隐式的信息有一个更好的适配。显然,从上面测试近乎公式化的文字表达来看,AI对话风格距离人性化恐怕还有一段较长的路要走。
目前布局AI大模型的玩家数不胜数,但由于各大厂算力水平接近、数据量相差不大、技术上也没有重大突破,反而多面临同质化难题。而字节注重用户体验的打法,则与其他巨头寻求增长的打法大相径庭。字节构建出了“视觉语言模型+火山高速训练引擎+火山机器学习平台+行业应用”的AI生态体系,不仅与其他玩家形成了显著差异,也能有效避免其对话式AI产品走向同质化,这才使得豆包一出场就能同文心一言、天工AI助手正面对决。
而在庞大流量和独特算法的加持下,豆包未来完全能够根据用户的兴趣和行为,为其提供定制化的内容,得益于此,这一产品也就能吸引到更多用户的关注和留存。
编辑|张毅
审核|吴新
爆料联系:cpcfan1874(微信)
壹零社:用图文、视频记录科技互联网新鲜事、电商生活、云计算、ICT领域、消费电子,商业故事。《中国知网》每周全文收录;中国科技报刊100强;2021年微博百万粉丝俱乐部成员;2022年抖音优质科技内容创作者
热门跟贴