现阶段的AI到底在背答案，还是在推理答案？

司普科技

2024-10-30 11:03 ·广东

最近逛知乎，有网友对现阶段AI 生成的回答，到底是背出来的，还是推理出来的，表示很疑惑。

老实说，经历过预置问答和基于固定规则的模板式对话的人们来说，早前的AI，的确遵循“背答案”的逻辑。

因为理解能力和灵活性差，全靠照搬语料库。一旦超纲（提到语料库未涉及的内容），很容易“一问三不知”，更别说连续对话了。

到了自然语言处理（NLP）的阶段，人们和机器对话时，文本分类、自动翻译、问题回答、文本生成等方面的能力提升很多。但对话仍显得生硬、机械，极少上下文记忆，所以大多数情况下依然止步于简单、重复性的回答。

不过，现阶段的AI，因为有大语言模型（LLM）的助力，不管是对话理解还是内容生成，这方面的能力都已经好太多。

虽然不排除有时大模型也会“偷懒”，会将预训练（ Pre training ）和后训练（Post -training）相关的数据集“拿来即用”，或者因为数据过拟合，导致回答的内容高度贴合训练数据集。

但现在的AI在意图理解、关键信息检索、知识整合、重要级排序、创造性等方面，足以高出以往的AI几个level，AI生成的答案，也逐渐告别“死记硬背”，走向“触类旁通”、“举一反三”。

举个简单的例子。当此刻的我们用AI搜索相关答案，即便生成的答案附带相应的信息源，但对比原文，我们依然能被AI的信息整合和提炼能力震惊到。

选择重新生成，还能秒速出来另一个相关的回答。更换不同的提示词、在不同时间去尝试生成，出来的答案还能呈现差异化。

对比传统背答案的“千篇一律”，现阶段的AI能做到“千人千面”、“多元解法”、“随机应变”，光从这一点，其实就能重新认识AI的推理能力。

其次，AI生成内容的创造性，也能验证AI在推理上的能力进化。

比如笔者曾针对一些网上的文笔挑战，利用司普AI写作助手生成相应的对联、诗句、歌词等内容。其中，AI生成的答案原创度高，让人忍不住被其“文采”惊艳到。

比如司普AI写作助手以“梅花”为题，写的一首五言诗：

寒雪阻归路，孤芳自赏时。雪中一点梅，清香入梦诗。

还有司普AI写作助手以“观镜人已老，推门草正青”续写的诗句：

观镜人已老，推门草正青。岁月如流水，人生如浮萍。
镜中容颜改，门前花儿开，且将心事寄，草木皆有情。

虽有化用典故，但整体意境和情感流露，早已脱离“背答案”的范畴，到了推理后的融会贯通，出神入化的地步。

而在复杂任务场景中，随着思维链（CoT）、思维树（ToT）等的加入，AI的推理能力得到进一步增强。现阶段对话生成的答案，行文流畅、知识丰富、富有创意，足以媲美甚至高于人类基本水平。

综合以上几点，目前的AI到底在背答案，还是在基于上下文语境和语言规律在做推理后的生成，其实大家心里或许已经有了答案。

值得一提的是，AI擅长在推理后生成回答，但最终的生成效果，和训练的语料的丰富性、质量、时效性、训练程度等有很大关系。当训练及推理不充分或泛化能力差，仍有可能出现“背”答案的情况，影响模型的整体性能，这种则要另当别论了。

而大多数主流的AI模型经推理生成的内容，已经具有较高的真实性、完整性和创造性，尤其是高性能的模型，推理和生成的内容质量还会更明显。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴