研究人员开发AI框架加速合金发现|ai框架|合金|实验|材料|科学|高熵

研究人员开发了一个AI for Science（人工智能科学应用）框架，该框架能够提取并融合跨学科专家知识与实验数据，以加速合金发现和科学洞察。

高熵合金是具有挑战性应用领域中极具前景的先进材料，但由于可能存在的元素组合数量庞大，发现有用的组成成分既困难又昂贵。如今，研究人员开发了一种新颖的AI驱动框架，该框架整合了实验数据、计算模型以及从科学文献中提取的跨学科专家知识。通过以一种考虑不确定性的方式结合这些来源，他们的方法即使对于研究较少的合金组成也能做出可靠预测，超越了仅依赖训练数据的传统数据驱动机器学习方法。

高熵合金是指由五种或五种以上元素以接近等原子比例(通常各元素含量在5-35%之间)混合而成的合金体系。与传统合金以一两种元素为主、其他元素为辅的设计理念截然不同。熵是衡量系统混乱度的物理量，当多种元素以接近等比例混合时，系统的混合熵显著增高，因此得名"高熵合金"。

研究提出了一个将材料数据与AI提取的科学知识相集成的混合框架，实现了不确定性感知的发现。关于合金中元素替代的证据来自两个独立来源：材料数据集，其中具有匹配性能的合金对表明可替代的元素；以及通过五个科学领域查询的大语言模型。这些"证据流"使用Dempster-Shafer理论进行组合，以评估候选合金，同时明确量化预测置信度与不确定性，引导研究人员指向有前景的候选者，同时标记出现有知识不足的区域。

现代技术的进步依赖于先进材料，例如用于飞机发动机的合金以及能够在工业环境中抵抗腐蚀和高温的组件。在此背景下，高熵合金已成为材料科学中最有前景的研究领域之一。通过将近等量的几种元素结合，这些材料能够实现卓越的强度、稳定性和耐久性。然而，发现有用的高熵合金极其困难和昂贵，因为每增加一个元素都会急剧增加可能组合的数量。随着对可持续能源技术和下一代电子产品需求的增长，加速先进材料的发现变得越来越紧迫。

全球研究人员已转向人工智能(AI)作为材料研究的强大助手——但这也有其局限性。大多数机器学习模型擅长插值，即能够对与其训练数据中已有材料相似的材料做出预测。当研究人员超越熟悉的领域并考虑真正新颖的组成时，模型的准确性会下降。与此同时，关于元素在高熵合金中如何相互作用和相互替代的数十年专家知识分散在科学文献中，没有明确的方法将这些专业知识整合到数据驱动的AI工具中。

在此背景下，由日本先进科学技术研究所(JAIST)的Hieu-Chi Dam教授领导的研究团队开发了一种新的AI驱动的高熵合金发现框架。他们的研究于2025年12月19日发表在《Digital Discovery》（数字探索）期刊上，合著者包括日本学术振兴会(JSPS)的研究员Minh-Quyet Ha博士、JAIST的博士生Dinh-Khiet Le、来自日本HPC Systems的Viet-Cuong Nguyen博士、日本统计数学研究所的Hiori Kino教授以及美国杜克大学的Stefano Curtarolo教授。

团队旨在将实验和计算材料数据与直接从科学论文中提取的跨学科专家知识相结合，创建一个专门设计用于在数据稀缺和未探索区域工作的系统。该方法的核心是合金设计中一个众所周知的理念，称为元素替代。在最佳条件下，化学性质相似的元素可以相互替代，而不会显著影响材料的性能和稳定性。

研究人员首先通过比较仅相差一个元素的合金，直接从大型材料数据集中识别出替代模式。然后，他们使用最先进的大语言模型(LLM)，包括GPT-4o、GPT-.5、Claude Opus 4和Grok3，从与五个关键科学学科相关的文献中提取专家判断：冶金学、固态物理、材料力学、材料科学和腐蚀科学。每个信息源提供的是证据片段而非最终答案，这些片段使用称为Dempster-Shafer理论的数学框架进行组合。与标准概率方法不同，该框架可以明确表示不确定性甚至无知，正如Dam教授所解释的："传统分类器即使在信息不足时也强制进行二元'是或否'的预测。我们的方法明确量化不确定性，允许'我们无法判断'作为合法的科学结果。"简单来说，提出的系统在探索未知领域时不会假装知道超出其能力范围的信息。

在多个合金数据集上测试时，团队的框架始终优于传统机器学习模型，尤其是在信息较少的情况下。最引人注目的是，它能够预测包含训练数据中完全不存在的元素的合金行为，准确率在86%到92%之间。研究人员还根据文献中55个实验确认的四元合金验证了他们的方法，表明它优于计算成本高得多的方法，如自由能模型。

除了单个预测外，提出的方法还可以生成组成图，显示预测可靠的区域以及不确定性仍然较高的区域。这使研究人员能够将实验集中在组成空间中最有前景和信息量最大的区域。

据Dam教授介绍，这项工作的更广泛意义在于展示了如何将AI用于科学发现。"基于LLM的提取结合正式的证据融合，可以将数十年来分散的专家知识转化为可搜索、可比较和定量可用的资源，这对于相关见解跨越多个领域的跨学科问题特别有价值，"他说。