近日, 加州大学伯克利分校的Bingqing Cheng提出了一种新的描述静电相互作用的方法——隐空间内的Ewald求和(Latent Ewald Summation, LES), 其代码可作为通用模块加入绝大多数短程机器学习力场(machine learning force field, MLFF), 对具有离子性和强极性的体系进行更精准的研究. 该工作在 npj Computational Materials 发表 [1] .

近年来, MLFF的飞速发展使得以接近第一性原理的精度和接近传统反应力场的速度进行原子模拟成为可能. 很多MLFF将整个体系的能量分解为原子的贡献之和, 将原子周围某个截断半径内化学环境(描述符)作为输入, 通过神经网络得到原子对体系总能量的贡献. 这种分解方式使得原子的贡献几乎不依赖于截断半径之外的信息, 其合理性是基于Kohn提出的所谓近视性原则(nearsightedness), 然而近视性原则的前提是体系中没有离子之间的长程相互作用, 如静电能 [ 1 , 2 ] . 因此若要对离子性和强极性体系如离子晶体, 熔盐, 盐溶液等进行准确描述, 需要向这些短程的MLFF增加可以表示长程相互作用的机制.

早在2011年, Behler等人就在其提出的名为HDNNP的MLFF中加入了静电能修正用于描述氧化锌, 其通过和HDNNP相同架构的额外的一组神经网络来预测原子所带电荷, 再用Ewald求和以获得体系静电能, 称之为第三代HDNNP [3] . 后续Behler等人又提出第四代HDNNP, 通过神经网络预测电负性, 再通过电荷均衡(charge equilibration, QEq)来获得具体电荷数值 [4] . 类似的机制还包括鄂维南带领深度势能团队提出的DPLR, 其中需要拟合的则是Wannier轨道中心(Wannier centers) [5] . 这些直接增加静电能修正的机制符合物理直觉, 但是其训练过程分为两步: 首先需要拟合原子所带部分电荷, 然后从能量和力中扣除静电修正后再进行短程相互作用的拟合. 而且部分电荷并非可观测量, 不同的布居分析方法会给出不同的部分电荷数值, 从而影响实际静电能的贡献. 也有一些机制不直接增加静电能, 而是通过长程的消息传递(message passing)隐式学习长程相互作用, 比如Ceriotti等人提出的LODE和LOREM [ 6 , 7 ] , Gunnemann等人提出的EwaldMP [8] , 郑南宁等人提出的Neural P3M [9] 等. 这些基于长程消息传递的方法也都参考了倒空间内的Ewald求和, 因为最原始的Ewald求和就可视作标量特征的长程消息传递. 其优点在于不受静电相互作用形式局限, 可以将矢量甚至张量特征进行长程消息传递, 因此可以学习到更复杂的相互作用. 然而由于没有将部分电荷纳入模型, 如果要在电场中进行模拟就不甚容易.

Bingqing Cheng提出了隐空间内Ewald求和(Latent Ewald Summation, LES)这样一种新的描述静电相互作用的方法 [1] , 通过MLFF的标量描述符同时读出部分电荷和短程能量贡献, 再通过Ewald求和或者实空间内长程部分的求和来获得静电能, 相加后得到总能量. 即若 i 原子的标量描述符为 Bi , 则其对短程能量的贡献为 Ei = MLP E ( Bi ), 其带的部分电荷为 Qi = MLP Q ( Bi ), 总能量 E = ∑ iEi + E lr({ Qi })为 Bi 的函数, 这里MLP E 和MLP Q 为两个用于读出的多层感知机(multilayer perceptron, MLP), E lr为静电能求和. LES的独特之处在于无需分两步拟合部分电荷和短程部分, 而是通过一步拟合总能量和力来隐式学习部分电荷. 这就避免了前述不同布居分析方法对部分电荷数值的影响, 使得静电力和短程力更相容.

为检验LES方法表示静电相互作用的效果, Cheng在分子/离子二聚体, 界面水和体相水等体系中都进行了基准测试, 在增加LES模块后测试的短程MLFF都取得了更准确的结果. 在分子/离子二聚体体系中, 短程MLFF在二聚体间距超过截断半径后预测的结合能只能为0, 定性上不正确, 而增加LES后结合能曲线和参考值一致, 预测的力也更符合参考值( 图1(a) ). 在界面水和体相水体系中短程MLFF对水的偶极特性的描述也存在问题, 在界面水体系中界面偶极没有被恰当地屏蔽而是穿透到体相当中( 图1(b) ), 在体相水体系中偶极密度关联函数的径向部分在长波( k →0)处增大( 图1(c) ), 增加LES模块后这些问题也都得到了解决. 后续工作中Cheng等人还推导了LES框架下Born有效电荷(Born effective charge, BEC)的计算方法 [10] , 对比了RPBE-D3方法下密度泛函微扰法计算的和LES学习到的体相水的BEC, 发现两者吻合较好, 说明LES方法能够隐式地学习到静电响应特性( 图1(d) 插图). 利用线性响应范围内BEC张量乘以电场即为电场力, 他们在不同外加电场中进行了模拟并获得了体相水的红外光谱, 观察到电场下的峰位移动和DFT分子动力学一致, O–H伸缩振动模式红移, 低频分子间模式蓝移, 也证明了LES方法在外加电场中仍然是有效的( 图1(d) ).

打开网易新闻 查看精彩图片

图1

LES方法在不同体系中的基准测试 [ 1 , 10 ] . (a) 分子/离子二聚体体系, 从左到右为离子-离子(charged-charged, CC)、离子-分子(charged-polar, CP)和分子-分子(polar-polar, PP)二聚体体系的基准测试, 包括短程MLFF(short-ranged, SR)和加入LES后的长程MLFF(long-ranged, LR)计算的结合能和受力与基准结果的对比; (b) 界面水体系, 消息传递层数 T = 0和1时, SR和LR模拟的偶极取向cos θ 的平均值, 其中 θ 为水分子偶极和真空层方向的夹角; (c) 体相水体系, 消息传递层数 T = 0和1时, SR和LR模拟时倒空间内的偶极密度关联函数的径向部分, 插图展示长波部分; (d) 电场下的体相水体系, 不同电场强度下LR模型模拟得到的水的红外光谱, 插图展示LR模型隐式学习到的Born有效电荷(Born effective charge, BEC)和真实值(DFT)的比较

综上, Bingqing Cheng提出的LES方法能够不依赖额外的参考数据, 仅从总能量和力学习长程的静电相互作用, 且能够在线性响应范围内进行外加电场的模拟. 其代码结构简单, 物理图像清晰, 具有很好的可解释性, 可以作为一个通用的模块加入绝大多数短程MLFF, 提升其精度和电荷表示能力, 使其能够对具有离子性和强极性的体系进行研究. 该研究揭示了机器学习方法具有内在地学习到材料电荷响应行为的能力, 有望增强基座大原子模型对电荷的理解, 并推动具有特殊电学性能的材料的高通量筛选和理性设计.

参考文献

[1] Cheng B. Latent Ewald summation for machine learning of long-range interactions . npj Comput Mater , 2025 , 11: 80

[2] Prodan E, Kohn W. Nearsightedness of electronic matter . Proc Natl Acad Sci USA , 2005 , 102: 11635 -11638

[3] Artrith N, Morawietz T, Behler J. High-dimensional neural-network potentials for multicomponent systems: applications to zinc oxide . Phys Rev B , 2011 , 83: 153101

[4] Ko T W, Finkler J A, Goedecker S, et al. A fourth-generation high-dimensional neural network potential with accurate electrostatics including non-local charge transfer . Nat Commun , 2021 , 12: 398

[5] Zhang L, Wang H, Muniz M C, et al. A deep potential model with long-range electrostatic interactions . J Chem Phys , 2022 , 156: 124107

[6] Grisafi A, Nigam J, Ceriotti M. Multi-scale approach for the prediction of atomic scale properties . Chem Sci , 2021 , 12: 2078 -2090

[7] Rumiantsev E, Langer M F, Sodjargal T E, et al. Learning long-range representations with equivariant messages.

[8] Kosmala A, Gasteiger J, Gao N, et al. Ewald-based long-range message passing for molecular graphs.

[9] Wang Y, Cheng C, Li S, et al. Neural P 3M: a long-range interaction modeling enhancer for geometric GNNs .

[10] Zhong P, Kim D, King D S, et al. Machine learning interatomic potential can infer electrical response.

转载、投稿请留言

| 关注科学通报 | 了解科学前沿