打开网易新闻 查看精彩图片

主要内容

有机光伏器件(OPVs)因具备轻质、柔性、低成本的太阳能转换潜力,成为可再生能源研究中最具活力的领域之一。近年来,已报道的给体-受体(D/A)材料数量呈指数级增长,形成了庞大的化学设计空间,传统试错法实验已难以对其进行有效探究。机器学习(ML)作为变革性工具应运而生,可大幅加速材料发现与性能预测进程,其能以前所未有的效率和可扩展性,建立分子结构、器件制备与光伏效率之间的内在关联。国家纳米科学中心周惠琼、巴拉那联邦大学Prof.CristianoFranciscoWoellner以及北京航空航天大学张渊等人的相关研究表明,机器学习模型的预测精度关键取决于描述符的选择——描述符是将分子或器件信息转化为可计算特征的数值量。本文综述了基于描述符的有机光伏器件机器学习研究的概念框架与最新进展,系统探讨了数据生成与预处理、描述符的分类及解析,以及预测模型的构建与评估,详细分析了本征描述符、电子描述符和光学描述符的作用,并重点关注沙普利加性解释(SHAP)、皮尔逊相关分析等特征选择技术,这类技术可为相关研究提供可靠的可解释性与定量分析依据。

机器学习已深刻重塑有机光伏材料的发现与优化进程,张渊团队联合周惠琼、Prof.CristianoFranciscoWoellner等人进一步证实,通过对描述符的合理选取与精准设计,机器学习模型可精准预测器件性能,筛选出具有应用潜力的给体-受体材料组合,并挖掘出此前难以捕捉的隐藏结构-性质关联规律。其中,本征描述符用于表征分子的基础结构特征,电子与光学描述符实现分子结构与电荷产生、传输过程的有效关联,宏观描述符则搭建起实验室制备工艺与器件级实际运行之间的沟通桥梁,将这些不同层级的描述符整合至统一的机器学习框架中,已成为当前有机光伏器件研究的前沿方向。

尽管该领域研究已取得显著进展,但诸多核心挑战仍为后续研究划定了重点方向。周惠琼、Prof.CristianoFranciscoWoellner及张渊等人在研究中明确指出,其中一个关键局限是形貌感知型描述符的纳入仍显不足,而该类描述符正是实现分子结构与纳米尺度电荷传输路径关联的核心纽带。例如,从吸收光谱中提取、用于评估材料无序度的乌尔巴赫能,目前尚未在有机光伏领域的机器学习研究中得到广泛应用。如今,自动化图像分析与分子动力学模拟技术的快速发展,已能实现对畴区纯度、渗流特性、界面面积等关键形貌特征的定量提取,这些特征可有效纳入预测模型;针对多组形貌图像的分析需求,生成式模型有望成为不同图像数据间相互转换与融合的核心桥梁,既能显著提升微观表征质量,也能生成逼真的模拟数据,为解决这一局限提供了可行路径。

此外,器件稳定性的预测研究目前仍缺乏一套可量化描述该特性的完整物理理论,这对预测结果的可靠性造成了不利影响。在周惠琼、Prof.CristianoFranciscoWoellner与张渊等人看来,同样重要的研究方向是开发融合实验数据、计算数据与成像数据的多模态标准化数据集。当前,高通量机器人化制备与自动化表征技术逐步落地,很快将能生成规模适配深度学习的高质量数据集;而主动学习框架可通过筛选信息价值最高的实验,持续提升模型的预测性能。新兴的物理信息融合框架与生成式人工智能框架,有望将机理性认知与逆向分子设计有机结合,其中物理信息神经网络将激子与电荷传输方程直接嵌入学习过程,即便在数据有限的情况下,也能保证模型的物理合理性;与此同时,变分自编码器、扩散网络等生成式模型,可设计出具有目标电子结构的新型给体或受体分子,将其与基于描述符的预测模型耦合,能够构建起自主化的设计-优化闭环,为有机光伏材料的高效研发提供有力支撑。

可重复性与研究透明度仍是该领域的核心要求,VERDE材料数据库、哈佛大学有机光伏数据集(HOPV15)等开源的版本控制型数据仓库,为新模型的性能基准测试奠定了重要基础。Prof.CristianoFranciscoWoellner联合周惠琼、张渊等人呼吁,建立基于描述符的机器学习研究统一报告标准与评估指标,将有效推动领域研究进展,并显著提升不同研究团队之间的成果可比性。最终,向可解释、人机可理解的人工智能方向发展,将确保数据驱动方法是对科研人员直觉判断的补充,而非替代。目前,注意力机制与可解释图神经网络已能清晰阐释特定特征调控器件性能的内在原因,为化学与工程领域研究者开展更具理性的材料设计提供科学指导;将这些方法与实验室自动化技术、云基数据基础设施相结合,有望构建出自主式实验室,将有机光伏材料的发现与优化周期从数年大幅缩短至数日。

在这一新兴研究格局下,描述符已不再仅仅是单纯的数值输入,更是连接物理现实与数字智能的核心桥梁。周惠琼、Prof.CristianoFranciscoWoellner、张渊等人总结认为,对描述符的精心设计、合理选取与科学解析,将持续决定机器学习在有机电子学研究,以及更广泛的数驱材料发现领域的应用成效与发展前景。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

文献信息

DescriptorEngineeringforMachine-Learning-BasedPerformancePredictioninOrganicSolarCells:AMiniReview

HaiboMao,HongZhang,YuanZhang,CristianoFranciscoWoellner,HuiqiongZhou

https://pubs.acs.org/doi/10.1021/acsaelm.5c02314