面对科学文献,尤其是化学反应的爆炸式增长,研究人员正面临前所未有的信息过载挑战。每年有数十万个新反应被报道,然而,将这些海量知识转化为实验室中可执行的具体方案,却严重依赖专家的个人经验与耗时的手动检索,效率低下且难以规模化。尽管大型语言模型(LLMs)在化学领域已展现出应用潜力,但现有系统难以可靠地处理各种全新化合物的复杂转化,且在提供可重复、完整、带可信度评估的实验方案方面存在明显不足。

为此,耶鲁大学Victor S. Batista 教授与Timothy R. Newhouse教授提出了一个革命性的解决方案——MOSAIC框架。该研究开发了一种名为“多优化专家AI辅助化学预测”的计算框,旨在让化学家能够利用数百万反应方案的集体知识。MOSAIC(图1)基于Llama-3.1-8B-instruct架构,通过在Voronoi聚类空间中训练2,498个专项化学“专家”,能够生成具备置信度指标、可重复且可直接执行的复杂合成实验方案。实验验证取得了71%的整体成功率,实现了超过35种新化合物的合成,涵盖药物、材料、农用化学品和化妆品等多个领域。尤为重要的是,MOSAIC甚至能够发现训练数据中未曾出现过的新反应方法,这为加速化学合成发现提供了通用且可扩展的新范式。相关研究成果以题为“Collective intelligence for AI-assisted chemical synthesis”发表自最新一期《nature》上。Haote Li为本文一作。

打开网易新闻 查看精彩图片

【定量评估揭示模型精准预测能力】

研究首先对MOSAIC生成完整化学流程的能力进行了定量评估。在产率预测分析中,模型通过处理包含试剂、溶剂和过程描述的整个实验程序来预测结果(图2a)。尽管基于令牌的预测方式会引入系统误差,但MOSAIC的预测区间中值与真实产率中位数仍呈现了显著相关性( R 2 =0.811 ,图2b),表明其能有效捕捉不同反应类型的产率模式,而非简单记忆常见反应。

打开网易新闻 查看精彩图片

图 1. MOSAIC框架

试剂溶剂预测准确性方面,研究采用差异度量(D)进行评估。结果显示,在一次性预测中,试剂和溶剂的完全匹配率分别为22.4%和29.8%;而当聚合最多三位专家的预测结果时,试剂的完全匹配率大幅提升至43.0%。更重要的是,在多位专家预测模式下,至少能部分预测出正确试剂或溶剂的成功率高达94.8%(图2d, e)。这证明MOSAIC几乎总能识别出相关的反应组分,即使未能提供完全一致的条件。分析指出,在许多未匹配的情况下,模型提供的是化学上可行的替代方案(例如在硝基还原反应中预测铁而非氯化亚锡),这恰恰体现了其细致入微的的专家知识(图2f, g)。

为了凸显领域专业化的价值,研究将MOSAIC与ChatGPT-4o mini、Claude 3.5系列等通用大语言模型在12类重要反应上进行了对比。评估围绕化学理解与实验可行性设计评分标准。结果显示,仅拥有80亿参数的MOSAIC,其性能超越了参数规模可能大数个数量级的通用模型(图2i)。这表明在专业领域,有针对性的微调与化学特异性优化能够克服原始参数数量的优势。研究同时发现,遵循指令的稳定性对于实际应用至关重要,而一些通用模型在此方面表现不一致,成为其应用于实际合成的障碍。

打开网易新闻 查看精彩图片

图 2. Promt设计和定量指标

【成功指导合成各类全新化合物】

为验证框架的实用性、通用性与可靠性,研究进行了广泛的实验验证,合成了众多在分子或转化层面具有新颖性的化合物。MOSAIC成功指导了布赫瓦尔德-哈特维希胺化反应,精准预测了挑战性条件,并展示了提出钯催化、铜催化等不同可行替代路线的化学洞察力(图3 1a-c)。此外,在铃木偶联、赫克反应、烯烃复分解、Sonogashira偶联等对药物和材料开发至关重要的催化反应中,MOSAIC均成功预测了条件,实现了高效组装及此前未能实现的转化(图3 2a-c, 3a-d, 4a,b, 5a)。

框架的能力还延伸至选择性控制和复杂底物修饰。例如,实现了季戊四醇衍生物的可控氧化(图3 7a),以及单萜烯香芹酮的共轭加成和L-紫苏醛的立体选择性烯化等(图3 7b, c)。在复杂天然产物clearolide的异戊烯化(图3 7e)及多功能分子hesperetin的位点选择性硅基单保护中(图3 7d),系统展现出了从训练数据中捕捉既定选择性原理的能力。

打开网易新闻 查看精彩图片

图 3. 计算指导下的化合物从头合成

【推动跨产业转化应用与全新方法学发现】

MOSAIC的实践影响通过多领域的真实应用得以体现。在制药领域,它助力新型类药分子设计与战略性的治疗性修饰(图4 8a-d);在催化领域,辅助合成工业过程专用配体及新型光催化剂(图4 9a-c);其应用还广泛覆盖材料科学、农业化学及消费品领域(图4 10a,b, 11a-c, 12a,b)。

最具突破性的是,MOSAIC展示了驱动新方法学发现的潜力。一个典型案例是,针对现有方法无法合成的5-氮杂吲哚衍生物,MOSAIC引导开发了一种通过杂芳基二卤化物与N-烷基烯丙胺进行未曾报道的环化反应来合成多种氮杂吲哚的新方案(图4 13a-d)。该反应与最近专家质心的距离高达320,远超典型置信阈值(<150),表明这是一个从预测专家视角看全新的转化。通过利用集体知识,MOSAIC将传统的试错探索转变为有信息的探索,加速了对化学空间未知区域的访问。

在总计实现的37个化合物中,有35个在首次尝试使用最高排名预测时即获成功研究者进一步探究了最近专家质心距离(置信度指标)与实验成功率之间的关系(图2j),发现了一个清晰的预测框架:距离<100时,成功率超过75%;距离增大,成功率则降至约50%。这为实验优先级排序和资源分配提供了量化依据。

打开网易新闻 查看精彩图片

图 4. 合成用于跨化学产业转化应用的化合物

【总结与展望:作为化学家探索新空间的指南针】

MOSAIC的开发体现了一个核心原则:利用计算搜索的方法能够随着数据和资源的增加而有效扩展。通过将浩瀚的化学反应空间划分为可搜索的Voronoi区域并分配专项专家,MOSAIC能够持续扩展其覆盖范围与精度。这种架构避免了严格反应类型定义的局限,允许系统直接从Voronoi单元中发现和利用转化模式间的相似性。

研究人员将MOSAIC比作现代化学合成的“指南针” 。其价值并非取代化学家的专业知识,而在于能够快速审视广阔的化学空间,识别出那些原本需要大量文献调研和积累经验才能发现的有潜力的实验方向,将确定合适条件的繁琐过程缩短至几分钟内。展望未来,尽管MOSAIC在涉及全新试剂的突破性发现和产率优化精度上存在局限,但其模型无关的框架设计使其能够无缝融入未来更强大的语言模型与化学表征方法。通过整合实验与建模技术,这一框架有望在缩小计算预测与实验结果差距的同时,持续拓展合成化学可及空间的边界。