打开网易新闻 查看精彩图片
很多人用过ChatGPT后都有个困惑:它知识渊博,但有时会胡说八道,比如编造一篇根本不存在的论文,或者把两个历史人物混为一谈。这种现象叫“AI幻觉”。更麻烦的是,对于企业来说,通用大模型根本不知道公司内部信息——比如产品价格、售后政策、员工手册。如何解决?答案是RAG。
什么是RAG?
RAG全称Retrieval-Augmented Generation,即“检索增强生成”。它的流程分为两步:
- 检索:当用户提问时,系统先从外部知识库(如企业文档、FAQ、产品手册)中检索最相关的几个片段。
- 生成:将检索到的片段和原始问题一起发给大模型,让模型基于这些真实信息来生成答案。
简单说:大模型不再是靠“背”下来的知识回答,而是先“查资料”再回答。
为什么大模型自己会有幻觉?
大模型的本质是“文字接龙”。它通过海量文本训练学会了词语之间的统计规律,但它并不理解“事实对错”。当它遇到不知道的问题时,它会根据概率编造一个最通顺的答案,而不是说“我不知道”。这在闲聊时没问题,但在专业场景(医疗、法律、技术)中就可能造成严重后果。
RAG如何消除幻觉?
- 知识来源可控:只让模型从授权知识库中检索,不依赖它的内部参数知识。
- 可溯源:答案可以附上引用来源,用户能点击查看原文。
- 实时更新:知识库可以随时增删改,不需要重新训练模型。
RAG vs 微调,哪个更好?
微调是指用行业数据继续训练大模型,让它“学会”新知识。但微调成本高(需要GPU算力)、周期长,而且容易导致模型遗忘原有能力。RAG则像给模型配了一本随时可查的工具书,低成本、易维护。因此,目前绝大多数企业落地AI时都优先选择RAG,而不是微调。
企业知识库搭建步骤
- 文档整理:把Word、PDF、网页、FAQ等非结构化数据整合起来。
- 文档切片:把长文档切成几百字的小段落,便于检索。
- 向量化存储:用嵌入模型把文本转换成向量,存入向量数据库。
- 检索与生成:用户提问后,计算问题的向量,从数据库中找最相似的片段,再调用大模型生成答案。
- 反馈与优化:记录用户对答案的评价,定期调整切片方式和检索参数。
实际案例(不涉及具体公司)
- 电商客服:把产品参数、退换货政策、常见问题建成知识库,AI客服可以自动回答80%的重复咨询。
- 企业内部IT支持:员工问“怎么重置VPN密码”,AI从IT文档中检索步骤,一步步指导。
- 医疗咨询:基于权威医学指南和药物说明书,AI回答非诊断类问题(如药品用法、副作用),且标注来源。
RAG的局限
- 如果知识库本身有错误,AI会放大错误。
- 对于需要综合推理的问题,检索到的片段可能不完整。
- 长上下文场景下,检索质量需要人工调优。
未来展望
随着大模型上下文长度扩展到百万甚至千万级别,有人觉得可以把整本教材直接丢给模型,不需要RAG。但这样做成本极高(处理长文本的算力贵),而且检索式方法在精确性上仍有优势。未来很可能是“长上下文+RAG”混合使用。
给普通读者的建议
如果你只是个人用AI,不需要自己搭知识库。但如果你是企业员工或管理者,可以考虑:哪些工作内容可以写成文档?哪些重复问题可以让AI基于文档回答?把零散经验沉淀为知识库,就是企业数字化的第一步。
热门跟贴