2025年,检索增强生成(RAG)技术始终笼罩在“临时性方案”“将被替代”的争议中。

一边是AI Agents成为大模型应用的绝对焦点,分流了行业对RAG的关注度;另一边是企业级AI落地进入深水区,中大型组织对RAG的投入反而愈发深入系统化。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

协同成为主流范式

行业逐渐形成共识,核心命题并非“取代”,而是“协同”。

打开网易新闻 查看精彩图片

据Anthropic 2025年Q4技术报告显示,采用该协同模式的企业,问答准确率平均提升37%,成本降低62%。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

“两难权衡”到“精准组装”

打开网易新闻 查看精彩图片

目前融合两者优势的混合架构成为主流,据Gartner 2025年AI技术成熟度曲线报告,采用混合架构的RAG系统在复杂问答场景的落地率已从2024年的18%提升至45%。

随着AI Agent的蓬勃发展,RAG正从“问答知识库”向“Agent数据基座”演进。

打开网易新闻 查看精彩图片

与传统ETL处理结构化数据不同,RAG的注入管道以LLM为核心,在转换阶段完成树状结构生成、知识图谱抽取等语义增强操作。

微软2025年企业AI架构实践案例显示,搭建标准化注入管道后,企业非结构化数据的AI利用率从23%提升至68%。

这意味着RAG已成为企业AI中台的核心基石,为所有AI应用提供唯一可信、实时更新的知识来源。

打开网易新闻 查看精彩图片

多模态RAG蓄势待发,工程化瓶颈待突破

2025年多模态RAG虽未实现大规模产品化,但技术价值已得到验证。

打开网易新闻 查看精彩图片

目前行业主要通过向量量化、Token剪枝等技术压缩成本,Google DeepMind已推出支持自适应Token剪枝的多模态嵌入模型原型,预计2026年将有成熟产品落地。