RAGFlow 迎来了具有里程碑意义的版本 ——v0.24.0。这一版本在 AI 记忆系统、代理管理、检索优化、生态数据库支持、模型接入以及多沙箱体系架构等多个方向上都进行了深度升级。可以说,v0.24.0 是一次真正意义上的“全栈强化版本”,不仅优化了开发者体验,也极大提升了系统稳定性、可扩展性和易用性。
本文将带你系统梳理 RAGFlow v0.24.0 的所有新增功能、优化亮点和修复更新,让你全面掌握这一版本的核心变化。
一、版本概览与核心方向
RAGFlow v0.24.0 的开发重点主要围绕以下几大核心方向展开:
1.Memory(记忆系统)正式上线:支持 SDK 与 API 接入,同时提供控制台日志查看。
2.Agent(智能代理)全面升级:引入会话管理、对话保持、多沙箱机制。
3.Dataset(知识库)增强:支持批量 Metadata 管理,ToC 更名为 PageIndex。
4.Chat 模块革新:移除过时的 Reasoning 配置,引入全新的 Thinking 模式与流式输出。
5.Admin 管理优化:多管理员体系上线,权限控制更灵活。
6.Model 接入中心拓展:支持更多模型并引入连接测试功能。
7.Ecosystem(生态拓展):全面支持 OceanBase 数据库,并新增 PaddleOCR-VL 支持。
8.数据源集成增强:支持 Zendesk、Bitbucket、Seafile、MySQL、PostgreSQL 等多数据源。
除此之外,v0.24.0 还包含了大规模的 Bug 修复、性能优化与架构重构,为企业级开发提供了更加稳定可靠的底层支撑。
二、Memory 模块全面上线:AI 具备“记忆力”的时代到来
RAGFlow v0.24.0 中最具突破性的更新之一,就是正式引入了Memory 系统。
2.1 全新 API 与 SDK
新的 Memory 模块不仅提供了内部集成,还配备了API 与 SDK,供开发者在自定义应用中调用。
无论是构建智能助手,还是实现用户上下文持久化,开发者可以直接访问 RAGFlow 的记忆接口,实现动态对话累积。
2.2 记忆提取日志可视化
控制台新增 Memory 提取日志功能,研发者可以清晰查看记忆存取过程,便于排错与追踪。
这对于调试复杂多轮对话逻辑和系统记忆提取的工作流尤其有帮助。
2.3 Memory 分类显示与状态追踪
系统支持按照类别查看 Memory 信息,同时新增 Memory 状态显示。这意味着开发者能够轻松追踪每个记忆单元的使用与提取状态,为 AI 系统的长期学习与推理提供坚实基础。
三、Dataset 模块:Meta 数据管理进入批量时代
v0.24.0 对 Dataset 管理进行了核心改进。
3.1 批量 Metadata 管理
知识库支持对 Metadata 进行批量操作,这极大增强了管理能力。
以往需要单条编辑、同步的元数据,现在可通过批处理一键更新,节省大量手工时间。
3.2 ToC 更名为 PageIndex
为提升规范性与通用性,原 “ToC(Table of Contents)” 已更名为 “PageIndex”,新的命名更直观、统一,也减少了歧义。
3.3 Metadata 逻辑优化
v0.24.0 优化了 Metadata 逻辑结构,支持树形结构展示、精确时间选择、批量删除时自动清除已选项,并新增 Metadata 条件过滤与值搜索添加功能,让知识管理更加灵活高效。
四、Agent 模块:全新多会话与多沙箱体系
智能 Agent 模块是本次版本的又一核心亮点。
4.1 会话管理界面全面重构
新增类似 Chat 的对话管理界面,允许代理保留 Sessions 与会话记录。用户可以在不同 Session 中自由切换,实现长期记忆式交互体验。
4.2 多沙箱机制(Multi-Sandbox System)
RAGFlow v0.24.0 引入了「多沙箱机制」,目前支持:
•本地 gVisor 沙箱
•阿里云沙箱
此外,该机制也兼容主流沙箱 API。开发者可以在管理后台自行配置,安全性与隔离性得到全面提升。
4.3 新增对话流功能与操作改进
代理对话历史保留、系统变量包含历史字段,同时优化了消息展示逻辑、分类操作符支持连续操作、修复多轮循环中的变量指派问题。
4.4 新增多文件上传与会话批量删除
用户现可一次上传多个文件到聊天或代理流程中,并支持一次性批量删除会话历史,便于清理存储与隐私管理。
五、Chat 模块革新版:更智能的对话体验 5.1 全新 Thinking 模式
过去的 Reasoning(推理)配置项被移除,取而代之的是更灵动的Thinking Mode。
在该模式下,模型能够以逐步思考方式展示推理过程,提升输出质量与交互透明度。
5.2 深度检索策略优化
深研场景下的检索逻辑得到全面强化,Recall 准确率显著提升,为文档问答、知识对齐等复杂任务提供更可靠的支持。
5.3 Streaming 流式输出
新增流式输出功能,回复将分块实时显示,用户可边看边互动,大幅提升对话流畅度与实时感知体验。
5.4 交互体验优化
• 支持输入框自动伸缩。
• 加入“思考”按钮,用户可主动触发推理模式。
• 支持 Web Search 一键检索整合外部信息。
• 滚动条优化,可适应大模型快速输出场景。
RAGFlow v0.24.0 支持多个管理员协同管理系统。各 Admin 用户拥有独立授权,可以分配或取消超级用户权限。
6.2 CLI 工具全面升级
Admin CLI 改进为RAGFlow CLI,新 CLI 支持以下命令:
• 用户授权管理(grant/revoke)
• 模型连接测试
• Ping 连通性测试
• 检索测试命令
• 系统设置与配置环境列表展示
CLI 工具现已成为开发调试必备组件,为平台运维与自动化提供强大支持。
七、模型配置中心:更多模型,更智能的集成体验
在 v0.24.0 中,模型接入中心迎来了全面升级。
7.1 新增模型支持
本次新增支持以下模型:
•Kimi 2.5
•Stepfun 3
•doubao-embedding-vision
•PaddleOCR-VL-1.5
• 更新了Gemini、Hunyuan、Kimi-k2.5等引擎的适配。
模型新增连接测试按钮,管理员在添加模型时可快速验证配置正确性,以防运行时报错。
7.3 模型验证与校验逻辑优化
引入模型 verify 功能,可检测 LLM Key 可用性,并支持语义大词组增强(boost bigrams),提升语言理解力。
八、生态与数据库扩展:OceanBase 领衔新生态
v0.24.0 在数据库支持方面展现出强大的生态兼容能力。
8.1 OceanBase 全面支持
OceanBase 现已被正式纳入官方支持范围,成为 MySQL 外的强力替代方案。
• 新增 OceanBase内存存储机制。
• 支持 OceanBaseText-to-SQL Agent、表解析器与性能监控机制。
• 支持 OceanBase 到 Elasticsearch 的迁移工具。
引入 SeekDB,作为 OceanBase 的轻量化版本,为中小型企业部署提供更高性价比方案。
8.3 其他生态增强
•Peewee ORM 支持:OceanBase 可作为主数据库直接集成。
•ElasticSearch → OceanBase 迁移工具上线。
•OceanBase 性能监控与健康检测集成。
通过以上增强,RAGFlow 已成为支持多数据库、多引擎、多生态的 AI 数据管理平台。
九、数据源与连接器扩展
v0.24.0 带来了众多数据源连接器更新,覆盖更广泛的业务系统。
新增支持:
•Zendesk(工单系统)
•Bitbucket(代码库)
•Seafile(文件同步)
•MySQL 与 PostgreSQL 数据源
除此之外,还优化了 WebDAV、GitLab、Aliyun OSS、MinIO 等已有连接器的稳定性、安全签名和数据同步机制。
十、安全性与性能优化
RAGFlow v0.24.0 在安全层面同样进行了全方位强化。
•SQL 注入防御增强。
•压缩文件解压漏洞修复。
•CVE 安全漏洞修复。
•密码保留机制优化(防止连接初始化失效)。
•pipeline 图像缩略图显示修复。
同时,在性能层面,通过异步任务、线程池控制、索引优化、缓存刷新等机制,大幅提升了系统响应速度与并发性能。
十一、文档与开发者支持完善
v0.24.0 的文档体系也完成了大规模重构,新增和更新包含:
• Memory SDK 文档
• Python SDK 开发示例
• Ingestion Pipeline 快速入门
• Admin 配置指南
• Webhook 特定配置提示
• Copilot 设置与命名规范
此外,UI 改版采用了全新的shadcn 框架,文档体验更加现代,阅读与操作更加直观。
十二、界面与用户体验优化
新版 UI 进行了大量细节优化:
• Memory、Agent、Chat、Dataset 页面全部通过 shadcn 重构。
• 页面交互流畅度明显提升,组件风格统一。
• 修复了 VSCode 语法提示失效、登录页样式错误、对话窗口异常滚动等问题。
• 增加“Explore 页面”,“Translation Page Index”多语言展示支持。
此外,新增德语界面元素,在国际化层面进一步拓展全球化部署能力。
十三、大量 Bug 修复与架构重构
新版本共合并上千项提交,进行了系统性的代码优化和问题修复,如:
• 修正 Infinity 检索逻辑、Chunk 重复返回问题。
• 修复 DOCX、PDF 解析、表格旋转、页码异常。
• 优化 Excel 行计数、RDBMS 字段分隔符、任务取消逻辑。
• 修复多模型输出异常、Token 计数不准问题。
通过这些修复,RAGFlow 的健壮性和容错性迈上新台阶。
十四、总结:面向智能化生态的关键版本
代码地址:github.com/infiniflow/ragflow
RAGFlow v0.24.0 是一个跨越式版本。它不仅在功能上更全面,也在“AI 记忆化”、“多数据生态化”、“智能对话流化”和“系统企业化”方向完成了重要升级:
• Memory 模块代表 RAGFlow 真正具备“持久智能”的能力;
• Agent 多会话与多沙箱奠定企业级多任务并行的基础;
• OceanBase、SeekDB 的接入标志数据库生态拓宽;
• 新模型体系扩展了算法兼容的广度;
• 大量错误修复与优化让产品更稳定可靠。
可以预见,RAGFlow v0.24.0 将成为企业搭建知识驱动型 AI 应用的重要版本节点,为后续的 v0.25.x 系列打下坚实基础。
结语:
RAGFlow v0.24.0 不仅是一份更新,更是一份宣言:
它标志着一个真正具备「记忆」、「深度研究」与「开放生态」能力的智能系统正式成型。无论你是开发者、企业架构师,还是 AI 系统集成商,都应该亲手体验这一版本带来的创新突破。
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。