在热电、隔热、防热涂层等多个功能材料领域,晶格热导率是衡量材料性能的核心指标之一。尤其是超低晶格热导率的半导体材料,因其在废热回收与高效热管理中的巨大潜力,一直是材料研究的热点。此外,在当前数据驱动的材料设计背景下,传统材料的研发面临着两大挑战:复杂物性如晶格热导率的精准计算非常复杂,通常依赖昂贵的第一性原理方法(如求解声子玻尔兹曼输运方程),而基于机器学习的材料性质预测常常受限于稀缺的标注数据,如何在百万级化学空间中高效寻找具有复杂目标物性的材料成为一个难题。
针对这些挑战,同济大学物理科学与工程学院/上海自主智能无人系统科学中心任捷教授团队提出了一种层级增强的漏斗学习(HiBoFL)新范式(如图1),创新地整合了无监督学习、高通量计算和可解释监督学习,并成功应用于筛选具有超低晶格热导率的半导体。通过从数十万种材料中结合无监督学习筛选,仅对少量(数百个)目标材料进行训练,实现了对超低晶格热导率材料的高效且可解释的有监督预测,从而避免了在缺乏明确目标下进行大规模的暴力从头计算。最终,不仅筛选出一批具有潜在热电应用价值的超低晶格热导率的候选材料,还发现了一个对晶格非简谐性具有显著影响的新物理因子。
Figure 1. Hierarchy-boosted funnel learning (HiBoFL) framework for accelerating the discovery of functional materials.
本文所提出的HiBoFL框架,主要有四个部分:
一、数据准备:初步高通量筛选
从Materials Project获取超过十万种材料,通过多级筛选,考虑热力学稳定性(凸包能量)、半导体特性(带隙)、计算可行性(原子数)、排除无关元素等,获得2675种三维结构的稳定半导体材料,构成一级数据集(如图2a)。
二、无监督学习:识别相似热导率材料
针对一级数据集中的材料,产生基于化学组分描述符:元素电负性、熔点等,以及晶体结构描述符:原子局部环境体积、配位数等,标准化后通过PCA降维,进一步结合K-means算法,依据“肘部法则”和轮廓系数确定最佳聚类(如图2b),将这些材料聚成七类(如图3)。类C1和C2包含了已知低热导率材料(如Tl₃AsSe₃的κL= 0.23 W/mK),而C7包含已知高热导率材料(如SiC的κL= 490 W/mK)。因此,搜索空间从2675种材料缩小至704种材料(C1+C2),效率大大提升了73%。
Figure 2. Dataset preparation and unsupervised learning optimization.
Figure 3. Unsupervised learning result in the first-level dataset.
三、数据标注:低成本高通量计算构建本地数据库
基于弹性性质与晶格热导率的经验公式,进一步低成本高通量计算了704种材料的热导率,建立了本地数据库。其中,将近70%材料的热导率低于2 W/mK(如图4),硫族化合物(S/Se/Te)占比最高。Cs₂SnSe₃与Cs₂GeSe₃被进一步进行声子热输运机制分析(如图5),结果表明,声子谱软化、Cs原子的rattling效应是导致超低热导的原因,而Ge-Se键的强共价性(COHP显示反键态更少)增强了非谐性,使Cs₂GeSe₃的κL比Cs₂SnSe₃具有更低的热导率,这也在后续可解释监督学习中得到论证。
Figure 4. HTC-based data annotation for statistical analysis and material discovery in the second-level dataset.
Figure 5. Mechanisms of phonon thermal transport properties based on first principles calculations.
四、有监督学习:超低热导的高效可解释预测
为了进一步修正无监督学习结果,基于本地数据库构建了直接预测超低热导率材料的有监督学习模型。对比了决策树、随机森林、XGBoost等几种常用算法,其中CatBoost表现出最优结果并被用于后续建模。进一步结合SHAP值分析了影响超低热导率的关键描述符,如最小原子质量、结构填充率、最小相对键长等。其中,最小相对键长被用于量化键长分布,作为关联结构非谐性的新物理因子。该因子揭示了其主导Cs₂GeSe₃的超低κL优势,即更小的最小相对键长,增强了结构的非谐性,缩短了声子寿命,从而降低晶格热导率。
Figure 6. Supervised learning in the local database and interpretable analysis.
本研究所提出的HiBoFL框架为不仅创新了复杂热输运材料发现的新方法,也也为材料科学中的小样本挑战提供了有潜力的解决方案。
https://www.nature.com/articles/s41524-025-01583-9
热门跟贴