最近逛知乎,有网友对现阶段AI 生成的回答,到底是背出来的,还是推理出来的,表示很疑惑。
老实说,经历过预置问答和基于固定规则的模板式对话的人们来说,早前的AI,的确遵循“背答案”的逻辑。
因为理解能力和灵活性差,全靠照搬语料库。一旦超纲(提到语料库未涉及的内容),很容易“一问三不知”,更别说连续对话了。
到了自然语言处理(NLP)的阶段,人们和机器对话时,文本分类、自动翻译、问题回答、文本生成等方面的能力提升很多。但对话仍显得生硬、机械,极少上下文记忆,所以大多数情况下依然止步于简单、重复性的回答。
不过,现阶段的AI,因为有大语言模型(LLM)的助力,不管是对话理解还是内容生成,这方面的能力都已经好太多。
虽然不排除有时大模型也会“偷懒”,会将预训练( Pre training )和后训练(Post -training)相关的数据集“拿来即用”,或者因为数据过拟合,导致回答的内容高度贴合训练数据集。
但现在的AI在意图理解、关键信息检索、知识整合、重要级排序、创造性等方面,足以高出以往的AI几个level,AI生成的答案,也逐渐告别“死记硬背”,走向“触类旁通”、“举一反三”。
举个简单的例子。当此刻的我们用AI搜索相关答案,即便生成的答案附带相应的信息源,但对比原文,我们依然能被AI的信息整合和提炼能力震惊到。
选择重新生成,还能秒速出来另一个相关的回答。更换不同的提示词、在不同时间去尝试生成,出来的答案还能呈现差异化。
对比传统背答案的“千篇一律”,现阶段的AI能做到“千人千面”、“多元解法”、“随机应变”,光从这一点,其实就能重新认识AI的推理能力。
其次,AI生成内容的创造性,也能验证AI在推理上的能力进化。
比如笔者曾针对一些网上的文笔挑战,利用司普AI写作助手生成相应的对联、诗句、歌词等内容。其中,AI生成的答案原创度高,让人忍不住被其“文采”惊艳到。
比如司普AI写作助手以“梅花”为题,写的一首五言诗:
寒雪阻归路,孤芳自赏时。雪中一点梅,清香入梦诗。
还有司普AI写作助手以“观镜人已老,推门草正青”续写的诗句:
观镜人已老,推门草正青。岁月如流水,人生如浮萍。
镜中容颜改,门前花儿开,且将心事寄,草木皆有情。
虽有化用典故,但整体意境和情感流露,早已脱离“背答案”的范畴,到了推理后的融会贯通,出神入化的地步。
而在复杂任务场景中,随着思维链(CoT)、思维树(ToT)等的加入,AI的推理能力得到进一步增强。现阶段对话生成的答案,行文流畅、知识丰富、富有创意,足以媲美甚至高于人类基本水平。
综合以上几点,目前的AI到底在背答案,还是在基于上下文语境和语言规律在做推理后的生成,其实大家心里或许已经有了答案。
值得一提的是,AI擅长在推理后生成回答,但最终的生成效果,和训练的语料的丰富性、质量、时效性、训练程度等有很大关系。当训练及推理不充分或泛化能力差,仍有可能出现“背”答案的情况,影响模型的整体性能,这种则要另当别论了。
而大多数主流的AI模型经推理生成的内容,已经具有较高的真实性、完整性和创造性,尤其是高性能的模型,推理和生成的内容质量还会更明显。
热门跟贴