这个离线工具让AI同时读15篇论文，还能互相挑错|上下文|实验|推理|文献|新论文|离线工具|索引

研究者都经历过这种困境：桌上堆着一摞论文，隐约觉得它们之间存在某种重要联系，却没时间深挖。单篇论文回答的是具体问题，真正的突破往往藏在论文之间的缝隙里。

一位开发者基于谷歌Gemma 4模型搭建了LitSynth——一套完全本地运行、无需联网的研究合成引擎。它能一次性处理最多15篇科学PDF，跨文献进行推理，最终输出四类结构化结果：跨论文共识、带有机制解释的冲突点、按重要性排序的研究缺口分析，以及可证伪的新假设。每个假设都要经过多轮对抗性同行评审才会呈现给用户。

这套系统的核心依赖Gemma 4的128K上下文窗口和推理模式。传统RAG（检索增强生成）管道只能近似模拟这种能力，Gemma 4则真正实现了长文本的深度理解。

LitSynth采用七阶段推理流程，将一组科学论文视为单一证据库而非独立文档集合。第一阶段并行解析PDF，用pdfplumber工具并发处理，切成8000字符片段后进入提取环节。第二阶段批量提取主张，每次调用处理3个片段，要求Gemma 4每段提取最多4个具体、可证伪、有数据支撑的主张，并按论文ID和片段索引命名空间防止冲突。6个并行工作线程将耗时压缩至顺序处理的三分之一。

第三阶段识别共识，用单条长上下文提示打包所有主张（在token预算内），让Gemma 4找出跨论文的趋同发现，并标注具体主张ID作为证据而非仅提及论文名称。第四阶段检测冲突，按实验方法对主张分组，每个集群独立线程运行。冲突提示要求输出：各论文的精确主张文本、冲突的机制解释、以及调和方案（如不同人群、测量条件等）。

第五阶段分析研究缺口，将缺口追溯至揭示它们的特定主张和冲突，并按关键/高/中/低四级重要性排序。提示词明确要求回答："现有证据暗示了什么问题，但没有任何论文解答？"第六阶段生成假设，这是整个系统的核心。生成提示在提示词层面强制规定：每个假设必须引用≥2个具体主张ID、必须指明所填补的缺口ID、机制字段必须命名具体信号及其来源层/模块和下游效应、必须包含零假设、实验设计必须指定自变量。