字节跳动“豆包”能否后发先至？AI对话赛道竞速|ai|字节跳动|张毅|美食|翻译|豆包

主打交互的对话式AI

在诸多AI落地场景中，对话式AI无疑是最容易引起大众共鸣的存在。ChatGPT崛起之初也是依靠的兼具理解力、创造力和记忆力的对话模型。相较苹果 Siri、微软小冰等 AI服务，ChatGPT 最大的亮点之一在于它可以理解用户需求并创造内容、协助代码编写、能够针对用户的追问在后续对话中进行修正或补充。

除了逻辑严密的创造能力之外，ChatGPT 具有记忆能力，在连续的对话中无需用户提供重复信息，其语言组织和表达能力也更接近人类水平，使对话更自然流畅。目前的 ChatGPT 局限性也较为明显，官网提示无法保证 ChatGPT 生成内容的准确性，此外部分创作内容或涉及版权问题。

而随着国内各家大模型训练的崛起，中文大型预训练模型的出现，也使得国内对话式AI的生成能力和智能水平得到了飞跃式的提升，对话式AI成为资本市场的香饽饽的同时，各界玩家便也都对对话式AI表现出极大的兴趣。而继文心一言（百度）、天宫AI助手（昆仑万维）后，字节跳动也带来了独立的AI对话产品——“豆包”，整个赛道显得热闹非凡。下面，我们就选择文心一言、天宫AI助手、豆包三款拥有独立APP的对话式AI产品为大家进行横向比较，看看如今对话式AI差距究竟在哪儿。

三款独立对话式AI亮相

探寻角色与定位

当前不少拥有大模型的平台都将对话式AI功能整合到了旗下主推软件的内部，如哔哩哔哩的AI智能搜索以及快手“AI对话-快意”，具有极强的工具属性，并非独立存在的个体，而文心一言、天宫AI助手、豆包三款对话式AI目前均拥有独立APP，用户需要单独下载安装才能使用，一定程度上弱化了平台流量的支持，但更强的独立性也能赋予这些产品未来更多可能性。

启动三款对话式AI软件后，首先向他们提出“你可以介绍一下你自己吗？”的问题，三款AI的回答内容中，“文心一言”最为简单，不过反而更符合人类对话的语言逻辑，毕竟豆包和天工将自己的母公司背景介绍出来，虽然详尽，可却少了些拟人化元素。

在具体的功能划分上，豆包和文心一言较为简洁的归类为“提供游泳的信息和支持，以帮助人们解决问题和获取知识”，而“天工”则是非常具体的表示“我的AI生成能力可以满足文案创作、知识问答、逻辑推演、数理推算、代码编程等多元化需求。”

然而，这里我们需要明确一个事情，对话式AI同细分赛道的大模型是有一定差异的，诸如通义听悟、学而思MathGPT这样的大模型本身属于垂直细分赛道的产品，其应用强调的是“专精”，而对话式AI更像是通用大模型的附属品，用户通过针对性极强的问题，索取解决方案、相关只是内容，无所不知的“虚拟助理”和懂你的“知己（情感交互）”才是这类对话式AI应该扮演的角色。

ChatGPT能成为现象级的对话式AI，在于其能在与用户展开对话的过程中，能够“回答后续问题，承认自己的错误，质疑不正确的前提，并拒绝不适当的请求”，因此，我们在对话问题和聊天内容设计上不再会以“将军饮马”“古诗翻译”“文章撰写”等为参考点，而是选择以“旅游方案建议”和“小学生自主学习能力培养”两条主线展开，考校三款对话式AI综合能力。

旅游方案建议

豆包优势明显

通过“帮忙制定一份10月国庆节，从重庆出发到北京的旅游计划，一共2名成年人，1名小孩（10岁），6天5夜，倾向研学游。”的问询指令开启对话，让三款AI给出建议。然而，比较让人失望的是文心一言对于目的地的识别出现了错误，竟然给出了包含重庆的旅游计划，这显然对于表述理解不清。

相较之下豆包和天宫AI助手都非常准确地识别了出发地和目的地，且根据计划天数安排好了每日的行程，不过细看的话豆包安排的计划明显优于天宫AI助手，虽然两者都将时间分成上午、下午和晚上三个时间段，但以第一天为例，天工AI助手仅考虑到了入住酒店和休息，但豆包这边不仅安排了博物馆行程，更明确建议晚上的北京特色美食名称。同时，天工AI助手虽然提到了让孩子们也可以在旅途中享受美食，可除第一天对美食一笔带过外，就根本没提了，豆包在安排合理性上更胜一筹。

当然，豆包比较有意思的是其第一次给出计划仅安排到了第五天，当笔者再次输入“第六天和返程如何安排？”时，豆包又给出了补充答案，有趣的是补充答案衔接倒是非常自然，对话属性拿捏准确。

豆包、天宫AI助手给出的旅游计划更偏框架性，本身落地执行明显需要更多信息，而这也是对话式AI的优势所在。笔者接下来提出“北京这些博物馆是否需要预约，如何预约”的模糊性问题，看两款APP是否能顺利接上。

从测试结果看，虽然笔者故意在“这些博物馆”中用“这些”一词进行模糊指代，但两款APP均明确给出了方案中博物馆的预约方式和注意事项，对于信息检索式问题的应对表现非常出色。

育儿话题

回答滴水不漏

相对旅游方案，“如何培养小学生自主学习的能力”的育儿话题更为灵活，对话类AI需要对信息进行综合整理并分析，才能给出答案内容，而三款APP这一次均给出了自己的建议和规划，从学习兴趣、思考能力等多个方面讲述对培养小学生自主学习能力的见解。

当然，从真正育儿的角度看，这些方法和建议多少有些心灵鸡汤的味道，但从聊天的角度出发，这样的情感陪护式聊天同样也是解决问题的一种方式，至少在“听君一席话胜似一席话”之后，能够释放出内心的焦虑感。

而面对“小学生有没有必要学习奥数”这种争议性极大的问题，三款AP表现反而让人有些惊喜，基本能从正反两面讲述学习奥数的好处和不足，最终给出的建议是“根据个人情况不同，结合小孩子兴趣来作选择”，回答可谓滴水不漏。

期待AI对话个性化

值得关注的豆包

AI能力的提升，让我们对对话式AI能达到的水平有了更高的要求。除希望AI可以产生一些与上下文更相关、更连贯、更一致的对话外，我们更希望对话也应该对于风格、偏好等更隐式的信息有一个更好的适配。显然，从上面测试近乎公式化的文字表达来看，AI对话风格距离人性化恐怕还有一段较长的路要走。

目前布局AI大模型的玩家数不胜数，但由于各大厂算力水平接近、数据量相差不大、技术上也没有重大突破，反而多面临同质化难题。而字节注重用户体验的打法，则与其他巨头寻求增长的打法大相径庭。字节构建出了“视觉语言模型+火山高速训练引擎+火山机器学习平台+行业应用”的AI生态体系，不仅与其他玩家形成了显著差异，也能有效避免其对话式AI产品走向同质化，这才使得豆包一出场就能同文心一言、天工AI助手正面对决。

而在庞大流量和独特算法的加持下，豆包未来完全能够根据用户的兴趣和行为，为其提供定制化的内容，得益于此，这一产品也就能吸引到更多用户的关注和留存。

编辑｜张毅

审核｜吴新

爆料联系：cpcfan1874（微信）

壹零社：用图文、视频记录科技互联网新鲜事、电商生活、云计算、ICT领域、消费电子，商业故事。《中国知网》每周全文收录；中国科技报刊100强；2021年微博百万粉丝俱乐部成员；2022年抖音优质科技内容创作者