打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

RAGFlow v0.25.2 已于 2026 年 5 月 10 日发布。这一版本的关键词非常明确:API 继续统一、数据源删除同步能力增强、权限控制更严格、性能瓶颈被修复、兼容性持续维护。如果你正在关注 RAGFlow 的升级节奏,v0.25.2 是一次覆盖面非常广的版本更新,既有架构层面的持续演进,也有大量面向生产可用性的修补与增强。

一、v0.25.2 版本总览

本次版本主要分为三大方向:

1)API 继续重构与统一

RAGFlow 持续推进 Web API 向 RESTful 规范迁移,同时强调保持旧接口兼容。这意味着新旧客户端在迁移过程中不会被强制打断,整体升级更平滑。

2)数据源删除文件同步能力增强

本次新增了一个轻量级 snapshot 机制,用于同步多个数据源中的已删除文件,并尽可能真实反映远端数据源状态。该能力覆盖多个数据源,说明 RAGFlow 在“同步一致性”方面进一步强化。

3)大量 bug 修复与安全/性能提升

从元数据可见性问题、重复 chat 输出、过滤性能瓶颈,到权限检查、兼容性路由、导出下载、数据集访问控制等,本次版本对生产环境中的关键问题做了系统性修正。

二、核心改进:API 统一继续推进,旧接口保持兼容

v0.25.2 延续了前几个版本的方向:Web API 向 RESTful 风格持续重构和统一。这类改动通常意味着:

  • 路由命名更统一

  • • 资源表达方式更清晰

  • • 接口层次更适合长期维护

  • • 客户端调用体验更一致

更重要的是,本次更新特别强调了一个原则:所有 legacy 端点都保持向后兼容。也就是说,虽然内部接口正在逐步规范化,但旧版本的调用方式仍然可用。这对于正在使用 RAGFlow 的团队非常关键,因为它降低了升级风险,也减少了迁移成本。

这次还出现了多个与 RESTful 重构相关的更新点,例如:

  • • 文档预览/下载迁移到 RESTful API

  • • 文档下载增加兼容路由

  • • 完整的旧文档 API 向后兼容维护

  • • 路由名称调整

  • • legacy 系统健康检查路由保留

这说明 RAGFlow 并不是简单地“换接口”,而是在做一套渐进式 API 重构:新规范逐步落地,老调用继续可用,保证系统演进不中断。

三、数据源同步重大升级:删除文件同步机制上线

本次最值得关注的功能之一,是轻量级 snapshot 机制的引入。它的目的很明确:用于同步远端数据源中被删除的文件,从而让本地状态更忠实地反映远端真实变化。

这项能力覆盖了多个数据源,包括:

  • • Moodle

  • • DingTalk AI Table

  • • RSS

  • • WebDAV

  • • Asana

  • • Zendesk

  • • IMAP

  • • Seafile

以及本次还扩展到:

  • • dingtalk-ai-table

  • • moodle

  • • rss

  • • webdav

  • • asana

  • • zendesk

  • • seafile

  • • rdbms

从更新描述看,这不是单点修补,而是一次跨数据源的能力扩展。它解决的是同步系统中非常现实的问题:远端数据源删了文件,本地如果不知道,就会产生脏数据、误检索、误展示、甚至误引用

这个机制带来的直接价值

  • • 删除内容能够被更及时识别

  • • 数据源状态更一致

  • • 检索结果更可靠

  • • 数据同步更贴近真实远端状态

  • • 后续文档管理与权限控制更容易保持正确性

此外,这次更新中还包含了多个与同步相关的修复:

  • • 数据源空列表同步修复

  • • 文件批量删除优化

  • • 文档删除权限检查补充

  • • 删除文档 UUID 校验移除

  • • 连接器服务时间设置与日志间隔修正

  • • 同步文档 ID 按连接器作用域隔离,避免跨知识库冲突

可以看出,v0.25.2 不只是“支持删除同步”,而是顺手把整条同步链路的稳定性、隔离性、正确性都加强了一遍。

四、性能优化:元数据过滤从内存处理下沉到 Elasticsearch

这次版本里有一个非常明确的性能改进点:元数据过滤不再在内存中处理,而是下推到 Elasticsearch

这项优化非常重要,因为内存过滤通常会带来以下问题:

  • • 数据量大时性能明显下降

  • • 过滤逻辑难以扩展

  • • 会产生额外的内存开销

  • • 检索链路容易出现瓶颈

本次改动后,过滤逻辑交给 Elasticsearch 执行,说明系统更合理地利用了检索引擎能力。对于大规模数据集场景,这种优化往往能带来非常明显的收益。

除此之外,性能类修复还包括:

  • • 避免 embedding 累积中的 O(n²) 数组增长

  • • RocksDB 元数据并发 CREATE/DROP 冲突重试

  • • 图谱构建中的合并并发和 checkpoint 恢复

  • • 文件批量删除优化

  • • 任务日志数量上限放宽

  • • 继续优化数据过滤与检索链路

这些变化表明,v0.25.2 不只是修小 bug,而是在处理大数据量、大并发环境下的真实使用问题

五、聊天与多模态能力增强

本次在 chat 体验方面也有较多更新:

  • • 简化 chat,并支持多模态 chat

  • • 支持多模态 chat 流式输出

  • • 修复聊天页面 LaTeX 公式无法显示

  • • 修复双重转义的 LaTeX 反斜杠和 HTML 实体

  • • 修复重复 chat 输出

  • • 修复非流式工具调用追加到 chat history 的异常

  • • 修复对话中的思考显示折叠与深度研究检索标签分离

  • • 修复聊天页中书写公式显示问题

  • • 修复部分输出与消息展示错误

这些修复说明 RAGFlow 在对话层的目标并不是只做“能聊”,而是进一步让复杂能力在前端表现上保持稳定。例如:

  • • 公式内容能正确渲染

  • • 多模态请求可流式返回

  • • 工具调用历史更稳定

  • • deep research 的展示标签更清晰

  • • 聊天输出重复问题被处理

这类体验修复对最终用户感知非常明显,尤其是在知识问答、文档分析、多模态辅助场景里。

六、权限控制全面收紧:多处接口补上授权检查

v0.25.2 在安全性方面非常明显的一点,就是权限检查更严格了。多个接口都补上了 tenant 级别的授权控制或 IDOR 防护,避免越权访问和跨租户泄露。

本次涉及的安全与权限修复包括:

  • • 文档删除权限检查

  • • beta 文档下载授权检查

  • • 文档下载 endpoint 加强租户授权

  • • chatbot SDK endpoint 强制 tenant 级授权

  • • memory 与 message endpoint 强制 tenant 权限

  • • 文件 ancestry 接口补权限检查

  • • /files/link-to-datasets 授权缺失修复

  • • 私有数据集访问检查中的越权修复

  • • agent 权限问题修复及回滚

  • • team member 无法编辑 agent 的修复

  • • hybrid 模式下认证问题修复

  • • CLI 登录、注册、注销相关修复

  • • document download 兼容路由同时保留授权逻辑

这些修复共同指向一个目标:多租户环境下的数据隔离必须严格。这对于企业部署尤其重要,因为一旦权限边界不清晰,就可能造成数据泄露或者误操作。

七、模型与推理能力持续扩展:更多 provider 接入

v0.25.2 中,模型接入能力继续扩展,新增或完善了多个 provider 支持,包括:

  • • FuturMix

  • • Vllm

  • • Ollama

  • • xAI

  • • lm-studio

  • • OpenAI

  • • Nvidia

  • • OpenRouter

  • • HuggingFace

  • • 阿里云相关能力

  • • ZhipuAI 的 Rerank

  • • Gitee AI 的 Rerank

  • • SiliconFlow 的 Balance

  • • DeepSeek 的 Balance

  • • Aliyun 的 Encode(embeddings)

  • • Bedrock 相关修正

  • • MiniMax GroupId header 支持

  • • 继续优化 model service 的统一调用逻辑

同时还有以下相关改进:

  • • 使用统一的 GetChatModel,减少重复函数

  • • 修正 IMAGE2TEXT 到 CHAT 的 fallback 与 model_type 归一化

  • • 修复本地模型连接检查的全局状态污染

  • • 修复不同 provider 的 ListModels 和 CheckConnection 接口对接

  • • 修复 agent completion 的兼容性

  • • 支持 non-stream runtime agent completion

这意味着 RAGFlow 的模型生态继续变宽,同时内部调用链也在变得更统一、更可维护。

八、数据集、文档、检索与 RAG 相关修复

围绕数据集与文档的修复非常多,覆盖面很广:

  • • 允许搜索多个数据集

  • • 修复数据集文件页面路由错误

  • • 修复数据集文件过滤 API

  • • 修复 document api 的向后兼容

  • • 修复知识库 prompt 中 document_metadata 为空导致的 citation 崩溃

  • • 修复 tag parser id

  • • 修复 handle id as keyword

  • • 修复 kb_ids 在 SQL 拼接前的 UUID 校验

  • • 修复文档导出元数据丢失

  • • 修复文档生成器输出补充 base64

  • • 修复文档转换的向后兼容

  • • 修复过滤条件下 rerank 不应绕过阈值

  • • 修复嵌入模型切换后已有 chunks 的恢复问题

  • • 修复 shared dataset 访问时的私有数据集授权绕过

  • • 修复 file ancestry 相关越权

  • • 修复 dataset search 多数据集 UI

  • • 修复删除 last file 的问题

  • • 修复 sync 中 document IDs 按 connector 作用域隔离

  • • 修复 filter api 在 dataset document 中的行为

这些更新集中体现了 RAGFlow 的核心定位:文档检索、数据集管理、RAG 召回、rerank、导出、转换、权限控制必须形成闭环。任何一个环节不稳定,最终都会影响问答、引用和业务结果。

九、开发者与 CLI 能力增强

本次版本也强化了 Go 相关能力与 CLI 工具链,包括:

  • • CLI 支持 text、image、video 聊天

  • • CLI 登录修复

  • • CLI 注册修复

  • • CLI 注销修复

  • • Go CLI 支持数据集搜索

  • • Go CLI 支持 embed 和 rerank

  • • Go 管理 ingestion tasks

  • • Go 侧日志模块迁移到 common

  • • Go 侧 auth 修复

  • • Go 侧 provider 实现持续扩展

这些内容说明 RAGFlow 不只是 Web 产品,也在持续建设命令行和程序化使用能力,方便自动化、调试和运维集成。

十、其他值得关注的细节修复

除了上面的大方向,这次版本还有不少细节修复,同样影响生产稳定性:

  • • 版本信息修复

  • • 任务日志更多展示

  • • 路由名称调整

  • • 树形图/画布运行路径感知修复

  • • 文档预览下载元数据保留

  • • 兼容历史健康检查路由

  • • 支持 local provider 的代码执行组件

  • • 去除部分过时模型

  • • Turkish 本地化字符串更新

  • • SSL 证书配置指南补充

  • • README 与版本引用更新

  • • release notes 和发布时间同步修正

  • • docs 全面更新到 v0.25.2

这些内容虽然看起来零散,但它们是成熟产品持续迭代中非常重要的一部分:让系统更稳定、文档更准确、升级更顺畅、运维更友好

十一、v0.25.2 的整体意义

如果把这次更新浓缩成一句话,那就是:

RAGFlow v0.25.2 是一次以兼容性为前提、以稳定性和安全性为重点、以同步与检索性能优化为亮点的综合升级。

它没有只做单一功能,而是同时推进了:

  • • REST API 统一

  • • 删除文件同步

  • • 多数据源一致性

  • • 权限与安全

  • • 检索性能

  • • 多模态聊天

  • • 模型 provider 扩展

  • • CLI 与 Go 侧增强

  • • 向后兼容维护

这类版本通常最适合生产环境关注,因为它解决的不是表面功能,而是实际落地中的关键痛点。

十二、总结

代码地址:github.com/infiniflow/ragflow

RAGFlow v0.25.2 这次更新内容非常密集,覆盖范围也非常广。从 API 重构到数据源删除同步,从元数据过滤性能到聊天展示修复,从租户权限到多 provider 支持,再到 CLI 与 Go 侧完善,几乎可以说是一次“全栈型”的版本升级。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。