一位工程师将数百页技术手册批量转成Markdown后喂给自建的RAG(检索增强生成)系统,但检索结果频繁答非所问——这是文档处理中常见的尴尬。
正方工具,如MinerU,把重点放在高效、保结构的解析上,能快速输出规整的Markdown文本。对很多文档管理场景来说,这似乎已经足够。
打开网易新闻 查看精彩图片
但反方Knowhere团队给出不同判断。他们在实践中发现,单纯转成Markdown会割裂文档原有的层级关系、丢掉图片和表格等多模态信息,后续的知识图谱根本无法构建。Knowhere的做法是打通全流程:重新编排文档结构、将图像与表格作为可检索的多模态素材,再用记忆图谱把离散内容织成一张网,直接支撑Agent系统的调用。
这个对比暴露了一个被忽视的事实:RAG和智能体系统对文档“原材料”的要求,远比传统搜索高。一份Markdown文件只是文本的线性罗列,而结构化的信息组织、多模态语义的保留,才是检索质量的分水岭。当你的应用需要精确回答“第三章图表里的异常值在哪一页”时,仅靠文本解析已经不够用了。
热门跟贴