研究者都经历过这种困境:桌上堆着一摞论文,隐约觉得它们之间存在某种重要联系,却没时间深挖。单篇论文回答的是具体问题,真正的突破往往藏在论文之间的缝隙里。

一位开发者基于谷歌Gemma 4模型搭建了LitSynth——一套完全本地运行、无需联网的研究合成引擎。它能一次性处理最多15篇科学PDF,跨文献进行推理,最终输出四类结构化结果:跨论文共识、带有机制解释的冲突点、按重要性排序的研究缺口分析,以及可证伪的新假设。每个假设都要经过多轮对抗性同行评审才会呈现给用户。

打开网易新闻 查看精彩图片

这套系统的核心依赖Gemma 4的128K上下文窗口和推理模式。传统RAG(检索增强生成)管道只能近似模拟这种能力,Gemma 4则真正实现了长文本的深度理解。

打开网易新闻 查看精彩图片

LitSynth采用七阶段推理流程,将一组科学论文视为单一证据库而非独立文档集合。第一阶段并行解析PDF,用pdfplumber工具并发处理,切成8000字符片段后进入提取环节。第二阶段批量提取主张,每次调用处理3个片段,要求Gemma 4每段提取最多4个具体、可证伪、有数据支撑的主张,并按论文ID和片段索引命名空间防止冲突。6个并行工作线程将耗时压缩至顺序处理的三分之一。

第三阶段识别共识,用单条长上下文提示打包所有主张(在token预算内),让Gemma 4找出跨论文的趋同发现,并标注具体主张ID作为证据而非仅提及论文名称。第四阶段检测冲突,按实验方法对主张分组,每个集群独立线程运行。冲突提示要求输出:各论文的精确主张文本、冲突的机制解释、以及调和方案(如不同人群、测量条件等)。

第五阶段分析研究缺口,将缺口追溯至揭示它们的特定主张和冲突,并按关键/高/中/低四级重要性排序。提示词明确要求回答:"现有证据暗示了什么问题,但没有任何论文解答?"第六阶段生成假设,这是整个系统的核心。生成提示在提示词层面强制规定:每个假设必须引用≥2个具体主张ID、必须指明所填补的缺口ID、机制字段必须命名具体信号及其来源层/模块和下游效应、必须包含零假设、实验设计必须指定自变量。

打开网易新闻 查看精彩图片

第七阶段是假设的对抗性评审,模拟同行评审流程对生成的假设进行多轮质询。

整套系统完全离线运行,所有处理都在本地完成。对于需要处理大量文献、又担心数据外泄的研究者来说,这种架构解决了核心痛点。128K上下文窗口意味着模型能真正"记住"15篇论文的全部内容并进行关联推理,而非像RAG那样仅检索片段后拼凑答案。

从工程角度看,这套流水线的设计亮点在于对并行度的精细控制——PDF解析、主张提取、冲突检测三个阶段都采用了多线程策略,在消费级硬件上实现了可接受的响应速度。同时,通过主张ID和缺口ID的强制引用机制,确保了输出的可追溯性,每个结论都能定位回原始文献的具体位置。