可解释人工智能在工业智能诊断中的挑战和机遇：先验赋能|人工智能|先验|大模型|工业智能|神经网络|算法|鲁棒性

本期阅读

文章信息

可解释人工智能在工业智能诊断中的挑战和机遇：先验赋能

严如强, 商佐港, 王志颖, 许文纲, 赵志斌, 王诗彬, 陈雪峰

10.3901/JME.2024.12.001

引用本文：

严如强, 商佐港, 王志颖, 许文纲, 赵志斌, 王诗彬, 陈雪峰. 可解释人工智能在工业智能诊断中的挑战和机遇：先验赋能[J]. 机械工程学报, 2024, 60(12): 1-20.

YAN Ruqiang, SHANG Zuogang, WANG Zhiying, XU Wengang, ZHAO Zhibin, WANG Shibin, CHEN Xuefeng. Challenges and Opportunities of XAI in Industrial Intelligent Diagnosis: Priori-empowered[J]. Journal of Mechanical Engineering, 2024, 60(12): 1-20.

原文阅读（摘要）

摘要：进入“大数据”时代，人工智能技术因其强大的数据挖掘与学习能力，成为工业智能诊断领域的重要方法，在机械装备的异常检测、故障诊断和寿命预测等方面发挥重要作用。随着机械装备日益向大型化、高速化、集成化和自动化发展，诊断方法的可信度变得至关重要。因此弱可解释性正成为人工智能技术在诊断领域实际应用的巨大障碍。为了推动人工智能技术在工业智能诊断领域的发展，对可解释人工智能方法进行综述。首先介绍可解释性技术的概念与作用原理，并对目前可解释性技术的主要观点与分类进行总结。接着，从工业诊断中常用的信号处理先验和物理知识先验角度，概述内在可解释的先验赋能可解释技术的研究现状。最后指出先验赋能可解释技术存在的挑战与机遇。

关键词：智能诊断；可解释性；先验赋能；信号处理；物理知识

中图分类号：TH17

前言

随着以深度学习为代表的人工智能(Artificial intelligence，AI)技术的不断发展，许多具有重要意义的深度学习模型和算法被开发出来，应用于计算机视觉、自然语言处理、语音处理、生物医疗、金融应用等众多行业领域。深度学习先进的数据挖掘、训练和分析能力来源于深度神经网络的海量模型参数以及高度非线性。也正因为深度学习算法的高度复杂性，许多模型往往难以解释其内部工作原理，这导致这些模型被称为缺乏可解释性的“黑箱模型”。

随着AI应用渗透到各行各业，AI的科技伦理受到广泛的关注。而科技伦理的一个核心议题就是可解释人工智能 (eXplainable AI，XAI)。从社会科学角度，可解释性是指人对决策原因的理解程度，可解释性越高，人就越能理解为什么做出这样的决策。对应于AI领域，可解释性是指能够在一定程度上揭示AI模型内部工作机制和对模型结果的进行解释，帮助用户理解模型是如何做出预测或决策。

可解释性不仅能够增强用户对AI模型的理解与信任，还可以帮助用户在发现模型的不足之处时进行改进和优化。因此，可解释性在AI的行业应用中具有重要意义。特别是对于故障诊断、自动驾驶、医疗服务、国防安全、金融等风险敏感领域，一个可信任可解释的AI系统尤为重要。2021年联合国通过的《人工智能伦理建议书》提出的十大AI原则就包括“透明与可解释性”。欧盟于2019年出台《可信人工智能的伦理指南》提出可信AI包含可解释性的需求。美国电气和电子工程师协会于2016年和2017年连续颁布了《人工智能设计的伦理准则》白皮书，强调了人工智能和自动化系统应有解释能力。美国国防高级研究局也提出了可解释人工智能的计划。中国于2019年通过了《国家科技伦理委员会组建方案》，全面启动了包含“知识可解释”在内的科技伦理建设工作，以确保人工智能安全、可靠、可控。

为了实现XAI，国内外学者开展了大量研究与探索，并出现一系列的综述文章对XAI的发展进行跟踪与总结。为促进XAI在具体行业领域中的应用与发展，相关研究者们对XAI进行了更为细致的分析。TJOA等对医学可解释人工智能方法进行了综述，并将可解释研究分为感知可解释性和数学结构可解释性。XU等对智能电网中的可解释人工智能方法进行了综述，并将可解释研究分为模型预可解释、模型中可解释与模型后可解释。SENEVIRATHNA等对超5G网络安全中的可解释方法进行了综述。ZABLOCKI等对基于视觉的自动驾驶系统的可解释性方法从模型内在透明性和事后可解释性以及解释完善性角度进行了综述。AHMED等对工业4.0场景中采用的可解释人工智能进行全面综述并从是否模型无关、全局与局部等角度对基于可解释人工智能的方法进行分类。

进入大数据时代，AI方法也在工业智能诊断领域得到了广泛的研究与应用。在工业智能诊断任务中，核心为机械装备运行状态的准确评估。对于航空发动机、燃气轮机、大型盾构掘进设备、高速列车等具有高价值与高风险性的重大机械装备，一旦失效会造成巨大的经济损失和人员伤亡。因此其诊断算法必须是结果可解释的，不仅能增加人们对算法的信任，还能够帮助工程师进行故障归因和算法改进。然而目前大部分的AI算法由于多层的非线性映射导致其具有“黑箱”特性，无法提供决策依据和结果解释。因此，机械故障诊断中的可解释性人工智能方法成为近年来的研究热点。虽然有学者对目前可解释人工智能在工业智能诊断中的研究进行了总结，但其所覆盖的文献数量较少，方法介绍与分析较为简略。为对工业智能诊断中的XAI研究进行更为全面与深入的总结，促进可解释性技术在工业智能诊断中的进一步发展，本系列综述从XAI的先验赋能与归因解释的角度分别对相关工作进行总结与分析。本篇为XAI在工业智能诊断中的应用与挑战系列的上篇：先验赋能XAI。本文首先介绍了工业智能诊断中可解释性技术的概念及分类。随后总结了先验赋能XAI中两种重要的可解释性方法的相关研究：信号处理先验赋能可解释网络与物理知识先验赋能可解释网络，并分别给出实例分析。最后讨论了先验赋能XAI的机遇与挑战，展望未来的发展趋势。

智能诊断中的可解释性技术

可解释性是人对决策原因的理解程度，XAI的目的在于增强使用者对于算法的理解与信任。虽然不同学科和行业对于可解释性的具体需求不尽相同，但AI模型的不可解释的原因都在于AI算法其高度非线性的端到端映射。

而在工业智能诊断中，AI模型通过一系列权重与非线性操作的组合从设备复杂监测信号中直接获取最终的异常检测、故障诊断、寿命预测、维护决策等结果。从使用者来讲，无法借助自身已有的诊断领域先验知识体系去理解模型的映射关系，因而也就无法理解AI模型的推理过程以及决策原因。

因此，实现XAI的关键在于构建起AI模型中映射关系与使用者先验知识的直接联系，增加使用者对决策原因的理解程度，从而实现可解释智能诊断的最终目的，即可信任的诊断系统。从这一原理出发，出现了两类实现可解释的路径。

(1) 基于使用者的先验知识设计透明可理解的算法映射关系，提高模型内在可解释性。这也通常称为主动解释、事前解释及模型相关解释。

(2) 设计算法，将已有算法的非线性映射关系解构成符合先验知识的可理解的线性低维映射，这也通常称为被动解释、事后解释及模型无关解释。

本系列综述将这两种方式简述为先验赋能与归因解释技术，也分别对应着诊断算法的模型透明性与结果可溯源性。两种方法的对比如表1所示。

尽管通常认为先验赋能XAI与AI模型的表示能力之间存在权衡关系，但在相关的研究中已验证了先验赋能的可解释性可以有效提高模型的性能。从模型表征空间角度理解，额外的训练数据、损失函数、特殊的模型设计约束对深度学习提供了额外的监督，使得模型的表征空间缩小，并能引导系统学习先验知识信息，从而提供更有效更本质的表征。因此额外的先验知识约束是模型可解释性的核心，合理的先验选择对于模型性能十分重要。

对于工业智能诊断，信号处理方法以及物理机理建模的方法是两种广泛应用的方法，经过了长期的实践与应用并发展出了较为完善的理论体系，被使用者所认可。从可解释性的接受程度与方法性能角度，利用信号处理先验与物理知识先验赋能AI智能诊断方法，使得其拥有可解释性与更好的特征学习能力是智能诊断领域先验赋能可解释性的重要方向。因此，本文接下来将从信号处理赋能与物理先验赋能角度对XAI在工业智能诊断中的应用进行总结。

而归因解释XAI通过对训练完成的模型结果进行分析以理解模型做出决策的原因，模型决策与解释是两个独立的过程而不会相互干扰。归因解释XAI在智能诊断中的相关研究与应用将在本系列下篇中予以详细介绍。

信号处理先验赋能

信号处理先验赋能的XAI基于故障诊断信号分析方法对深度学习算法模型结构以及优化目标进行修改，以期获得信号处理领域专家认可并能理解的模型内在的可解释性。信号处理先验赋能的可解释神经网络称为信号处理信息神经网络(Signal processing informed neural networks，SPINN)，如图1所示，信号处理信息神经网络网络从网络输入、网络结构以及网络损失对网络进行设计，从网络设计的先验来源可将信号处理信息神经网络网络分为知识先验赋能型网络与方法先验赋能型网络。

2.1 信号处理知识先验赋能型网络

根据对机械设备信号的分析与处理，可以获取设备故障信号的知识先验。基于信号的知识先验，国内外学者们探索了可解释模型的设计与应用。

为将先验知识嵌入神经网络，SHEN等提出了数据与物理驱动的损失函数用于轴承故障诊断。在交叉熵损失优化函数之外，使用先验知识导出的阈值模型对信号进行故障评估，并根据阈值模型结果对网络分类输出进行约束。如图2所示，基于轴承故障频率先验知识，MARX等提出了无监督的轴承故障检测方法，其根据轴承故障特征频率对健康数据的平方包络进行故障类型增强，并通过对健康及增强故障数据的自编码隐层表示进行方向与幅值约束以提高特征的特征表示能力，通过计算的健康指标识别轴承故障类型。基于风电机组故障特征频率，XIE等提出具有强区分性的故障频率先验特征，设计频率先验学习分支结构与对应的损失函数以提取信号的故障频率先验特征，故障频率先验特征与深度网络分支所提取特征共同用于风电机组故障诊断。为利用机械故障先验知识增强深度迁移学习，YIN等提出知识数据双驱动迁移学习网络用于工业机器人故障诊断，首层为可学习的带通滤波器，根据包络分析确定滤波器初值并添加相应线性相位约束。为将设备转速与故障特征频率等先验知识嵌入网络中，SADOUGHI等将谱峭度、包络分析、傅里叶变换嵌入卷积神经网络预处理层并基于特征频率设计卷积核用于提取轴承故障特征。基于信号的稀疏分布先验，LI等对网络注意力权重施加了稀疏先验约束，设计基于变分注意力的transformer网络用于旋转机械故障诊断。

2.2 信号处理方法先验赋能型网络

网络局部设计是从信号处理方法出发，通过设计可解释的滤波器、激活函数、以及网络层等，引入信号处理先验知识，在提高网络性能的同时使得网络局部可解释。

随着深度神经网络的发展，国内外学者对数字滤波器与卷积神经网络之间的联系开展了长期的研究。基于滤波与时频变换与一维卷积操作的相似性,并且由于原始信号的初步处理对于网络后续特征提取十分重要，大量研究集中在设计基于信号处理的可解释网络第一层。如图3所示，基于内积变换小波变换作为一种经典的滤波变换方法，被广泛的被用于嵌入神经网络以提高网络可解释性，其中ψ为小波基函数，a为小波尺度因子，b为小波时移因子，W为小波系数。基于小波变换与一维卷积操作的相似性，GANGULY等将六种小波基作为卷积网络第一层中的卷积核的初始化值，并使得网络取得了更快的训练收敛速度、更高的电子设备内部局部放电源定位表现。基于连续小波变换，LI等将连续小波函数的尺度参数与平移参数作为卷积核的可学习参数，实现了连续小波卷积层，替换基础神经网络首层并应用于故障诊断。考虑到时频分析方法的内在相似性，CHEN等将短时傅里叶变换，Chirplet变换，Morlet小波变换以及Laplace小波变换分别嵌入卷积层，提出了时频卷积层。LI等将一维振动信号编码为二维图像，利用可学习的二维Gabor滤波器提取多尺度与多方向的故障特征，并设计动态自适应池化用于保留局部关键特征。为使网络第一层在有明确物理定义的同时使得网络具有更高的性能，ABID等基于RAVANELLI等的SincNet提出了Deep-SincNet应用于感应电机故障诊断，并验证了其对噪声的鲁棒性。Deep-SincNet将普通深度网络的第一层替换为由参数化的Sinc函数组成的带通滤波器，并使带通滤波器的上下截止频率由数据驱动学习，从而定位特征频率带，提取故障特征。针对现有时频分析方法使用固定基函数的问题，KIM等提出了健康自适应时间尺度表示并作为第一层嵌入卷积神经网络用于齿轮箱故障诊断。多通道多尺度的卷积核作为自适应的基函数对信号进行多尺度变换从而获取有效融合故障信息的健康自适应时间尺度表示。基于快速傅里叶变换与二次复数域方程，PU等提出了可解释的受限稀疏频域空间用于表征轴承故障特征。该方法首先使用一维卷积对频谱进行滤波，在此基础上使用基于多通道融合机制以提取稀疏频域特征并进行融合，随后提取立方功率频域特征并用于最终诊断。针对传感器图信号，LI等提出了同时提取低通和带通特征的谱图小波网络。

基于基本的变换方法之上，学者们也探索了如何对特征更进一步的处理以及。ZHU等将基于连续小波卷积层与能量池化的MobileNet部署到嵌入式设备，并使用全局平均池化层替换全连接层用于最终诊断以减少网络参数。LIAO等使用小波函数作为卷积核，并使用能量池化提取不同频带的能量特征，有效的提高了网络提取信号时频局部特征的能力。在所提取的特征基础上使用多核最大均值差异将特征进行迁移，实现跨域的轴承故障诊断。使用压缩感知提取信号特征好，TAI等使用连续小波变换层提取特征并使用能量池化层提取特征，对各激活层额外添加的范数引入了稀疏约束。SHANG等考虑信号中存在的噪声以及小波基函数难以选择的问题，采用多种尺度参数可学习的小波函数。并对所提取的小波稀疏进行自适应软阈值降噪，并由后续神经网络模块实现故障诊断。

为提高网络特征提取能力，学者们基于多层分解的时频分析变换方法设计了多层的网络结构用于提取特征。PAN等基于第二代小波理论提出了提升网络用于故障诊断，其使用神经网络近似二代小波分解过程，提出了可学习的剖分层，预测层，以及更新层。通过多层级联的剖分-预测-更新循环提取信号特征并使用全连接层进行故障诊断。基于第二代小波变换性质，YUAN等使用包含2个可学习参数的智能提升小波核生成对应的预测层以及更新层，所提取的特征由后续网络处理进而实现故障诊断。提升小波层实现了数据驱动的第二代小波变换，能构造并选择与期望故障特征最适合的基函数，并且对智能提升小波核的初值不敏感。XIONG等将小波包变换嵌入了卷积神经网络并提出了小波包层用于自适应的信号时频特征提取。小波包层包含可学习的低通滤波器，高通滤波器由低通滤波器通过小波滤波器约束条件生成，且小波分解所对应的滤波器滤波器系数和约束由相应的优化损失保证。三层小波包变换所提取的特征由后续网络继续处理并用于轴承故障诊断。LIU等基于小波散射变换提出了小波散射卷积网络。其将小波散射变换使用固定参数的卷积层、模量非线性激活函数与池化层实现，所提取的特征由全连接层映射并进行故障分类。基于小波散射卷积网络，LIU等提出了归一化小波散射卷积网络，从理论上说明了归一化散射特征对线性时不变系统的不变性，提高了网络的对于不同传递路径的域泛化能力。

小波变换中分解与合成与自编码器的相似性为全局可解释的网络设计提供了支撑。MICHAU等基于Mallat小波算法逐级展开，使用一维卷积操作替换小波滤波器，每层分解加入可学习的硬阈值去噪函数，提出了自编码器结构的可学习稀疏降噪小波网络，完成了无监督的高频时间序列信号的健康监测。如图4所示，GAETAN等将小波包分解变换分解与重构展开为神经网络，获得了对信号中高频成分更高的分辨率，其中x是信号，Y是对应的小波包系数分解输出，θ是可学习的小波滤波器参数，是可学习的去噪硬阈值。考虑到声音信号中的噪声较多，DAI等利用较为振动信号的小波特征对使用可学习稀疏降噪小波网络所提取的声音信号小波特征进行对齐约束，所提取的鲁棒的特征用于多类支持向量机并实现板式轨道状态监测。为实现更好的去噪效果，FRUSQUE等利用带阈值去噪的可学习小波包变换对时序信号进行降噪。

针对生成对抗网络生成数据困难训练不稳定的问题，LIU等提出了小波胶囊生成对抗网络用于轴承数据增强。其利用Harr小波变换的平移不变特性以及局部特性增加神经网络的特征学习能力，并进一步使用胶囊网络替换卷积神经网络以提高网络的特征捕捉能力。基于信号处理先验的网络也被应用于设备的寿命预测。针对基于红外成像信号的寿命预测，JIANG等提出了时空降噪小波网络，4维小波卷积层在处理二维图像的同时考虑时间帧维度与图像颜色空间维度，并使用深度图像流去噪层对时空特征进行进一步降噪处理，获取高精度的预测结果，并通过多个并行的预测网络集成获取综合的不确定性描述。

基于形态学滤波，YE等提出了深度形态滤波网络。如图5所示，深度形态滤波网络采用可学习的形态学算子结构元素对信号进行形态学运算提取特征并基于峭度对特征加权用于齿轮故障诊断。在深度形态滤波网络的基础上，YU等提出了形态学滤波动态卷积自编码器用于振动信号冲击成分的提取。形态学滤波动态卷积自编码器的使用基于峭度融合的形态学滤波以及动态卷积运算对信号进行编码，所提取的隐层特征输入分类器进行齿轮箱故障诊断。

基于信号的稀疏滤波方法，LEI等提出了无监督的稀疏滤波层，学习得到的稀疏特征被softmax回归分类层用于机械故障诊断。稀疏滤波层优化目标为滤波后特征的稀疏度量(l1范数)，且稀疏滤波的权重与Gabor函数高度拟合，可将稀疏滤波器看作自适应的Gabor滤波器。MIAO等基于信号的稀疏表示提出稀疏表示层，其中信号经过卷积层获得卷积稀疏图(字典)，随机向量经过全连接层映射获取稀疏系数向量。通过包含信号保真项和稀疏正则项的约束项优化，稀疏表示层获取信号的稀疏表示，在降噪的同时保留振动信号冲击特性。

稀疏理论作为信号特征提取的重要方法，随着GREGOR与LECUN在2010年将软阈值迭代算法展开为可学习的网络，其成为国内外学者设计可解释网络的一种主流方法。针对多层稀疏编码，AN等将嵌套迭代软阈值算法展开为网络用于提取有意义的稀疏特征，用于后续网络诊断，而该稀疏特征的重构可视化进一步验证了该方法的有效性与可解释性。为提高网络对噪声的鲁棒性，ZHAO等基于多层稀疏编码模型提出跨越不同层的广义稀疏编码(General sparse coding，GSC)，进一步推导出层级GSC理论并将其展开为层级稀疏编码网络。如图6所示，输入信号x通过展开的GSC进行编码获得稀疏表征Z，并通过由池化层、丢弃层以及全连接层组成的分类器h进行诊断，获取故障类别。GSC中包含表征字典D，先验相关对角矩阵Λ，噪声相关对角矩阵Γ，迭代次数K，软阈值操作SΓ。文中深入探讨所提出网络与卷积神经网络的联系。

信号降噪作为信号处理的重要研究领域，也受到国内外学者的关注，并通过引入基于信号处理的降噪模块提高网络可解释性与抗噪能力。ZHAO 等基于软阈值去噪函数以及通道注意力机制提出了深度残差收缩网络。网络去噪模块通过分支网络学习去噪阈值并使用软阈值去噪函数对输入信号进行去噪。基于再生核希尔伯特空间，ZHAO等提出了可解释的降噪层并作为标准神经网络的第一层。可解释降噪层可视为低通滤波器，其滤波器带宽作为唯一可学习参数由数据驱动确定。基于离散图小波框架，LI等提出了图小波降噪卷积，通过对原始图节点特征的分解、降噪、滤波、重构获取噪声鲁棒的特征。

基于极限学习机与稀疏测度分解理论，WANG等提出了全可解释的机器状态监测网络，小波变换、平方包络和傅里叶变换被引入信号预处理层以提取重复瞬态获得平方包络谱，随后稀疏测度指标嵌入原始极限学习机作为节点使得网络全可解释。网络小波参数与输出权重由迭代优化策略确定。基于统计学习视角，WANG等设计物理可解释的原型网络用于机器状态监测以及故障诊断，并将其网络物理权重解释为对应的故障特征以识别出机器的健康状况。

2.3 方法对比分析

信号处理信息神经网络因为合理的先验知识的嵌入，在增强网络可解释性的同时有着比数据驱动网络更好的性能。一般来说，根据嵌入先验知识的来源可分为知识先验赋能型网络与方法先验赋能型网络。

基于信号处理知识先验的网络要求设计者具备专家经验，使用信号处理工具从数据中获取信号的模式与先验知识，并将其转化为网络结构以及优化目标。其本质为结合神经网络设计合理的特征工程，此类方法使网络受到已知经验知识的约束，有着可理解的网络设计原则与学习目标；能降低数据驱动的学习优化对数据量的需求；并有效缓解过拟合问题，从而提高网络泛化能力。然而信号先验的获取严重依赖专家经验，不合理的信号先验会严重影响网络性能；部分设计中仅关注网络输入与输出，网络内部结构仍旧无法理解。此类研究目前数量较少，主要应用于故障诊断和迁移学习等领域。

基于信号处理方法先验的网络是近年来的研究热点，其主要范式为将常用的信号处理方法或流程作为网络特征提取模块，使用深度学习模块完成其功能或将信号处理方法参数化使其可学习。根据信号处理方法分类，可以大致分为小波变换及短时傅里叶变换等滤波器类、稀疏表征及理论展开类、降噪类及统计方法类。这类方法的网络参数量受信号处理方法先验约束，降低了对数据量的要求，能有效缓解网络过拟合并提高网络泛化能力；并且此类方法有着丰富且坚实的信号处理理论支撑，因此网络结构设计可理解。然而，由于网络结构受信号处理方法限制，通常难以通过堆叠网络深度以提升性能，无法构建大模型；并且大部分方法仅实现可解释的特征提取网络构建，从特征到决策的可解释仍旧亟待解决。此类研究已应用于数据生成、时频谱分析、信号降噪、异常检测、故障诊断、寿命预测上。

总的来说，借助信号处理知识和方法的先验，国内外学者们不断改进深度学习网络以提升其在可解释、抗噪鲁棒性、诊断性能等方面的表现。另一方面，借助深度学习数据驱动的能力，国内外学者也在积极探索深度学习驱动的信号处理方法，以提供更好的数据滤波效果、时频分辨率、降噪效果等。

物理知识先验赋能

物理知识先验赋能XAI从系统的物理特性归纳先验知识对网络输入、网络结构与网络优化目标进行修改以期获得领域专家认可的可解释性。

物理知识先验赋能可解释网络多是以物理信息神经网络(Physics-informed neural networks，PINN)为基础。WILLARD等从应用场景方面归纳了PINN的主要目标，包括外推预测、参数化、降阶模型、降尺度、不确定性量化、反向建模、方程发现、求解微分方程、生成数据九种；同时总结了物理损失函数、物理信息初值先验、物理驱动网络架构设计、残差建模和混合模型物种方法。KARNIADAKIS等总结了PINN的主要模式框架：观测偏置、归纳偏置和学习偏置，分析了优点和局限性，列举了应用案例。CUOMO等综述了相关文献，总结了PINN模型的三大模块：神经网络模型、物理知识嵌入和反馈机制，大多数研究都集中在通过不同的激活函数、梯度优化技术、神经网络结构和损失函数结构定制PINN。XU等将PINN分为构建物理损失和构建物理网络两大类。

通过调研PINN在PHM中的应用，从对网络结构的作用阶段来说，可以分为物理信息初值先验、物理驱动网络架构设计以及物理损失函数，如图7所示。其中x代表网络输入，p代表物理知识先验，表示网络输出结果，y为观测结果，表示权重系数，为物理损失项。DENG等在轴承刚度退化过程的预测问题上，分别应用了这三种类型的PINN模型，试验结果表明使用物理损失函数的预测精度最高，表明物理损失函数使物理知识与神经网络的结合更加紧密，物理驱动的网络架构次之。

3.1 物理信息初值先验

物理初值先验是从系统特性中导出归纳出仿真数据，与系统观测数据进行融合，之后输入神经网络模型，引导神经网络在先验知识的背景下从观测数据中发现可解释的知识，如图8所示。

国内外学者对物理信息初值先验开展了相关应用研究。部分学者使用物理模型得到仿真数据，作为网络模型的输入，引导网络学习具有物理意义的知识。KIM等引入了低保真的物理约束，使得网络预测输出满足一定的物理规律，降低纯数据驱动网络在剩余寿命预测问题中的不确定性。GUC 等直接使用系统动力学求解产生的数值解作为模型输入，提出了基于物理信息神经网络的传感器故障诊断方法并实现了机械故障与传感器故障的分离。LI等将高阻抗电路模型的仿真结果输入卷积自编码器模型中，解决缺乏故障数据标签的问题；并提出物理保留图网络架构，实现电路系统节点级故障定位。

由于系统的物理模型不能得到高保真的解，部分学者采用机器学习方法简化物理模型，获取近似解。WANG等提出了基于物理的混合数据驱动模型，应用数据驱动方法来简化仿真模型和近似解，以降低计算成本提高了模型透明度、可解释性和分析能力。SILVA等基于动态模态分解方法拟合时滞系统的线性时不变模型，仿真传感器数据，之后使用卡尔曼滤波器预测测量结果，以此检测传感器潜在故障。

为了保证先验物理知识的保真度，一些学者采用有限元等仿真模型，导出物理信息。KOHTZ等建立了电池退化模式的有限元模型，并将计算结果与试验数据进行融合，构建了电池健康状态的在线估计模型。SUN等基于电化学-热-固电解质界面形成模拟的物理信息，结合自适应进化的长短时记忆网络模型，提高了电池健康估计的准确性。

针对系统观测数据不足的问题，国内外学者将观测数据与物理模型结合，以此生成物理模型中的系统隐变量，增强网络输入空间。CHAO等使用基于物理的航空发动机性能退化模型推断未观察到的过程变量，以增强神经物理模型的输入数据及其表示能力，从而实现更准确的故障检测和隔离，继而生成具有物理增强特征的数据驱动预测模型。YAN等通过物理模型计算系统隐变量数值，并结合观测信号构建11维特征信号，弥补了故障诊断问题中的训练样本不足的问题。BOUSHABA等使用物理知识处理观测数据进行数据增强，之后使用卷积神经网络进行电机电流特征分析，以实现感应电机的断条检测。ZGRAGGEN等使用物理模型增强网络训练数据，检测太阳能电池板跟踪系统的故障，增强了检测结果的准确性和鲁棒性。LUI 等基于电池退化物理模型估计的退化参数，结合神经网络模型实现了准确保守的退化参数外推。XING等建立动态线路模型，并使用动态状态估计方法融合物理信息与测量数据，实现了电力系统的准确故障定位。

当前研究对象多是物理规律明晰的简单系统，或者依赖仿真软件产生仿真数据，较难适用于复杂系统。物理信息初值先验需要可靠的系统物理模型，以产生与观测数据相容的仿真数据，继而使用仿真数据约束观测数据，产生有价值的融合，保证神经网络模型的训练结果具有物理可解释性。

3.2 物理驱动网络架构设计

物理驱动网络架构设计是将网络模型的数学计算与物理模型的求解过程联合起来，使网络的参数具有特定的物理意义，从而增强可解释性。常见的物理驱动网络架构包括残差神经网络(Residual network，ResNet)与离散常微分方程融合，如图9所示，以及融入物理知识的循环神经网络(Recurrent neural network，RNN)单元，如图10 所示。前者利用ResNet的残差连接特性，将其与离散常微分方程的求解过程结合，而后者则与RNN单元结合，之后使网络模型拟合一个特定的物理函数，增强网络的可解释性。

在物理驱动的网络架构设计上，国内外学者针对不同的研究对象，开展了一系列研究，使用神经网络模型近似系统控制方程，将网络中的权重与方程中的物理量联系起来，增强网络的可解释性。MA等基于长短时记忆网络(Long short-term memory，LSTM)的多输入神经网络对电静液执行器系统进行退化建模和预测，将电静液作动器的动态控制方程融入LSTM单元，实现其退化预测。SHI等提出基于物理的LSTM网络模型，将电池退化模型与LSTM层结合，预测不同工况下锂离子电池的退化行为。NASCIMENTO等使用Nernst和Butler-Volmer方程的降阶模型表示电池的总体放电，并将所得物理模型与RNN结合，建模电池的退化特征。DOURADO等在NASCIMENTO模型的基础上，提出了一种融入物理知识的RNN单元，解释累积损伤模型中的损伤整合，RNN状态表示给定时间步长的损伤水平，使用自定义单元实现基于物理的、数据驱动的或混合累积模型，将输入和先前累积的损伤映射为损伤增量。LI等采用分段拟合方法使用神经网络拟合经验方程，从观测数据中发现物理规律，应用于刀具磨损预测。YUCESAN等使用了物理驱动的RNN单元，将物理信息层和数据驱动层合并到深度神经网络中，建立了基于轴承L10疲劳寿命风电设备主轴承的累积损伤模型。LU等使用变分自编码结构近似偏微分方程，从有噪声的时空数据中提取可解释的物理参数，并建立了系统的可迁移模型。GONG 等使用神经网络模型逼近航天控制力矩陀螺仪的物理机理，之后提取退化特征，构建性能指标。ZHOU等使用神经网络模型参数化剩余寿命轨迹的控制方程，提出了动态控制网络进行时变轨迹建模，并设计了非负有界函数约束轨迹空间，获得了优异的预测性能。WESSELS等提出了神经粒子法，将系统控制方程与边界条件与神经网络有机结合，用于计算流体力学中的不可压缩流体欧拉方程的求解，获得了准确且稳定的数值解。LI等将底层风机系统的物理信息集成到数据驱动模型中，使用残差循环神经网络描述物理方程数值解，提升了模型的计算效率和准确性。ZHAO等结合电路系统的控制方程，提出了电子电力转换器的参数估计方法，将深度神经网络与转换器无缝耦合，克服了数据驱动方法准确性和稳健性的挑战。

物理驱动的网络结构设计使得物理知识与神经网络的结合更加紧密，直接或者间接地将物理模型与神经网络的数学模型结合，赋予了网络内部参数物理含义，使网络模型具有一定的物理可解释性。

3.3 物理损失函数

由于系统的控制方程多为微分方程，为了构建以物理信息为基础的网络损失函数，通常通过神经网络建模观测物理量y与其时间t和空间坐标x之间的关系，如图11所示，然后使用自动微分算法计算拟合出的物理量的在时间和空间上的导数，从而构造出仿真结果对应的控制方程，计算方程的误差。物理损失函数是在使用神经网络模型拟合物理参数的基础上，以网络损失函数的形式表示物理控制方程，借此将网络的优化目标设置为使物理方程的误差最小。除了物理损失函数之外，神经网络的损失函数还需要包含其他正则项，整体损失函数可以表示如式(1)所示

物理控制方程所描述的量纲与数量级可能不同，因此需要合理设计权重系数，平衡物理损失项与其他正则项。

国内外学者在不同的研究对象上开展了物理损失函数的研究。NABIAN等利用已知的物理规律，并通过添加物理正则项来约束数据驱动的深度神经网络模型。RUSSELL等将领域知识融入物理损失项，例如频率内容对机器故障诊断的重要性，减轻多重不相交操作条件对工业大数据重建保真度的负面影响。XIE等将传热规律嵌入到神经网络的损失函数中，采用非线性物理数据混合方法，对单层和多层直接能量沉积中的温度场进行建模，降低了网络外推预测的误差。CHEN等提出了退化一致性递归网络，研究退化物理特性，并通过损失函数形式约束网络训练，提高了轴承的故障预测结果的准确性和解释性。

ZHAO等根据物理方程和有限差分方法构造物理损失，引导网络在没有标记数据的情况下学习从热源布局到稳态温度场的映射。CHEN等提出了一种基于物理信息神经网络的超参数选择策略，利用物理知识生成故障数据，并以网络损失函数的形式最大化健康状态和物理信息故障状态之间的差异，选择网络的超参数，提升其故障检测能力。FREEMAN等提出了一种新的物理引导转子叶片不平衡故障检测框架，该框架将从涡轮机的电力信号获得的非侵入性故障特征与环境条件数据相结合，为神经网络定制损失函数，以增强故障检测能力。XU等提出了物理引导的损失函数权重设计方法，为减小损伤预测误差提供了保证。COFRÉ-MARTEL等使用神经网络模型拟合观测变量的函数表示，并通过建立偏微分方程误差来描述系统的退化机理，用于剩余使用寿命估计。XU等将电池状态方程加入物理损失函数，提升了电池寿命预测模型的精度。KOHTZ等提出了一种锂离子电池容量在线估计方法，使用卡尔曼滤波器结合物理信息神经网络建模可观测测量值与隐藏状态之间的关系，并将这种物理约束加入网络损失函数中，显著改进网络性能。ZHOU等构建了基于深度学习的系统可靠性评估模型，并开发了一种基于物理的生成对抗网络方法，以促进不确定性量化和传播，将控制方程的求解误差加入网络损失函数中，使测量数据融合并纳入系统可靠性评估。JADHAV等提出了物理信息神经网络模型实时估计空气预热器内的污垢状况，作为实时传感器测量的函数加入网络的损失函数，以跟踪其健康状况，预测污垢区域。ZHANG等在结构健康检测问题中，设计了一个基于物理的损失函数来评估神经网络模型输出与有限元模型更新之间的差异，提高检测结果的准确性和可解释性。XU等提出了物理约束的变分神经网络用于外齿轮泵磨损状态评估，使用谱方法建立齿轮泵压力脉动模型，并将其转化为物理损失项，约束神经网络的学习过程，是学习到的特征具有物理含义。

损失函数决定了网络优化的方向，物理损失函数的加入，使物理知识直接约束网络优化进程。根据任务与目标系统的不同设计相应的损失函数，同时根据其所描述物理量的数量级平衡损失函数内各项的权重，使物理知识与神经网络的结合更加清晰，增强网络的可解释性。

3.4 方法对比分析

深度网络因其强大的表征能力，成功应用于异常检测、故障诊断、寿命预测等问题中，但本身不具备可解释性，属于“黑箱”模型。为了克服这一不足，将物理模型与深度网络技术相结合是一个很有前途的发展方向。具体而言，可以将网络结构映射到试验数据，并将现有物理模型与数据驱动方法进行融合。根据物理模型对网络结构的作用，可以分为物理信息初值先验、物理驱动网络架构设计以及物理损失函数等三个方面。通过这些方法，可以提高深度网络的可解释性，使其更好地适应实际应用场景。

由于深度网络模型在训练之前对模型参数需要进行初始选择，大量学者已经研究了不同的方法来选定模型的初始状态。然而，如果可以使用物理信息或其他先验知识来预设合理的初始权重，则可以加速或改进模型训练。另外，物理损失函数通常是将物理模型嵌入到深度网络的损失函数中，约束和引导网络输出更加符合物理规律，同时减小搜索空间。前两种方法在一定程度上增强了深度网络的可解释性，但网络架构仍然属于“黑箱”，而物理驱动网络架构设计可以增强网络架构的可解释性，比如将物理知识嵌入深度网络模型的节点或层中。

物理信息初值先验的学习范式类似于迁移学习，避免了网络从头开始学习，提高训练效率；同时具有良好的初始化权重，避免网络陷入局部最小；此方法利用物理模型产生的模拟数据来预训练深度网络模型，缓解了数据匮乏的问题；同时可以利用替代模型抵消模拟的高成本，节省计算资源。但此方法网络模型内部依然是黑箱模型；且依赖仿真软件产生仿真数据，针对复杂的物理系统，很难得到高保真的仿真数据。物理信息初值先验方法主要应用在数据生成、异常检测、故障诊断、剩余寿命预测和迁移学习等领域。

物理驱动的网络架构设计使用领域知识指定网络中的节点连接，以捕获变量之间的物理依赖关系；此外，物理指导的网络结构设计可以使之前的黑箱算法更易于解释，这是物理建模中使用深度网络模型的一个理想但通常缺失的特征；同时，在深度网络架构中添加上物理中间变量，可以帮助提取物理上有意义的、可以解释的隐藏表示；而将神经网络中的一个或多个权重固定为物理意义上的值或参数，既可以增加中间变量的可解释性，同时使得训练更加稳健；按这种方式构建的基于物理的神经网络，能够量化不同应用的不确定性和各种类型的先验知识。但这种模式下的网络结构的设计通常取决于模型结构，而不同应用场景需要特定的网络结构；物理模型的结构要求较高，使用复杂的物理模型较为困难。此类模式主要应用于异常检测、故障诊断、剩余寿命预测和物理方程求解上。

物理损失函数引入物理损失作为一种正则化项缓解过度拟合问题，减少对大训练数据集的需求，从而提高训练模型的鲁棒性，以实现更可靠的预测；同时使神经网络的输出更符合物理规律，增强了神经网络输出的可解释性；缩小了网络参数W和b的搜索空间，因此可以减少对训练样本数量的需求；并通过将物理知识整合到损失函数中，克服了使用噪声数据和高维数据建模的困难；同时在训练物理约束的神经网络时，允许使用未标记或不带标签的数据；且使得机器学习模型可以推广到训练数据以外的符合相同物理规律的场景。但建立的物理模型一般是低保真的，不同应用场景物理规律相差较大，通用性较差；且建立复杂物理现象的模型比较困难；同时网络内部结构仍然是黑箱模型。此类模式多用于异常检测、故障诊断、剩余寿命预测和数据生成上。

先验赋能可解释网络实例

4.1 信号处理信息神经网络实例

在此案例中，基于信号处理方法中常用的“滤波-特征-决策”的故障诊断流程提出了故障感知降噪小波网络，根据小波变换、阈值去噪、特征频带选择设计对应的深度学习模块与损失并嵌入到网络中，提高网络的特征提取能力、抗噪性能以及泛化性能，最终实现智能故障诊断。

小波分析作为经典的时频分析方法，其拥有多分辨分析以及坚实的数学理论基础。其本质是通过母小波伸缩与平移获取小波滤波器将信号分解为不同频带的子信号以提取特征信息。小波变换其基本操作为滤波器与信号的内积运算，因此可将小波基作为一维卷积层的卷积核用于滤波层

式中， W 1 为小波系数，x为信号，

为小波基函数， a 为尺度系数， b 1 为平移参数(在卷积层中被步长参数 b 2 取代), * 为卷积操作符， W 2 为卷积获得系数， w 为卷积核。如图12所示，在式(2)基础上使用多种小波基函数提取不同特征，并通过网络生成权重向量 p 以自适应选择。

在特征的进一步处理时，由于实际信号中常常包含噪声信号，降低所提取特征的质量，因此常常需要进行去噪处理。对通过小波滤波器所提取的频带内噪声，常使用的方法为阈值去噪，通过比较系数与阈值大小确定是否保留系数。而结合深度网络的数据驱动能力可更简便的决定系数的保留与否。

式中，为网络对小波系数的鉴别值，鉴别为噪声时逼近1，鉴别为特征信号时逼近0。如图12所示，并通过网络 D (·) 使用局部卷积获取尺度内系数关系，全连接捕捉尺度间关系以获取更好的去噪效果。

在带内去噪获取干净信号后，常需要选择关键频带的特征用于最终的故障诊断。小波系数能量作为典型的故障指示指标，嵌入网络中作为不同频带重要性计算基础并对不同频带系数赋值

式中， I 为所提取的特征信息， E 为小波系数能量， sigmoid (·) 为将输入缩放到 (0,1) 区间的激活函数， conv (·) 为一维卷积。

处理后的特征 I 被随后的决策网络 NN用于最终的故障诊断，实现最终的决策。

4.2 物理信息神经网络实例

这个例子中，提出了一种用于外啮合齿轮泵磨损状态评估的物理变分神经网络，将物理模型中推导出的显式的表达式嵌入到网络中，作为物理损失来优化网络的性能，最终实现齿轮泵磨损状态的评估。齿轮泵因其容积效率高、工作可靠、价格低廉等原因在工业中得到广泛应用，尤其是在航空发动机燃油控制系统中齿轮泵常作为主燃油泵。因此，齿轮泵良好的工作性能是航空发动机的安全运行的重要保障。然而，齿轮泵内部结构复杂，齿轮相互啮合过程中内部容积有突变，导致齿轮泵出口流场存在明显的湍流特性。首先，利用谱方法建立了齿轮泵出口幅频调制的多尺度压力脉动模型

式中，和为谱系数，是调幅系数，是调频系数。是调幅函数, 。是调频函数, 。和是相位角。 N

和 N x 是正整数， c 0 为偏置项。

同时，构建了一个基于卷积神经网络模块、递归神经网络模块和注意力机制模块的复合神经网络，从压力脉动信号中提取特征，网络结构如图13所示。然后，通过将响应模型分解为具有确定性调制结构的基函数和表示能量分布的物理系数，将学习到的特征作为物理系数带入到响应模型中完成重构信号，从而获得物理约束目标函数。最后，通过物理特征测量距离，实现齿轮泵磨损状态评估。

挑战与机遇

5.1 先验知识的获取与类型

在实际的复杂机械系统中，针对不同的任务，获得和选取合适的先验知识仍是核心挑战。除此之外，如何将知识转化为网络模型设计，避免引入错误先验，并取得先验与数据驱动之间的平衡也是先验赋能可解释网络模型设计所面临的一系列挑战。

然而，也应看到其中的机遇。通过将合理的先验知识融入神经网络架构、数据生成、优化损失中，信号处理信息神经网络以及物理信息神经网络可以有效提高模型可解释性。并且，先验约束的引入可以提高神经网络模型对于特定任务的特征提取能力，增强模型的准确性、稳定性和鲁棒性。

此外，故障诊断领域学者们所拥有的先验知识大多来源于信号处理方法以及系统物理建模，因此本文仅给出了基于信号处理和物理模型的先验可解释性网络的应用。但基于统计推理、信息理论、因果理论等先验知识的可解释网络在故障诊断领域也有着广阔的发展空间。

5.2 内在可解释性完善与补充

目前大部分的内在可解释的网络属于部分可解释，无法获得对整个网络流程的解释，或是仅能构造浅层全可解释网络。特别是基于信号处理的可解释方法，往往只能设计可解释的特征提取器，从特征到最终决策的过程仍旧是隐式的。如何实现完全可解释的故障诊断模型，完善内在可解释性是目前的重要挑战。

但也应看到，在内在可解释之外，若事后对网络学习结果进行再解释，以使用者能理解的方式对内在可解释模型进行补充，能有力增加模型可信度。如通过对内在可解释模型的事后分析，补充可理解的模型内部特征、学习过程与目标，形成完善的可解释交互系统为用户理解与信任模型提供支撑。

5.3 可解释评价标准

随着故障诊断领域中可解释性算法的不断发展，多样化的可解释算法被提出。然而，目前并没有可用的可解释性评价标准对所提出的方法进行可解释程度的评估，阻碍了可解释智能诊断算法的健康发展。因此，建立可解释评价标准对方法进行评价是当前的重要挑战。

但也应看到，可解释性是人对决策原因的理解程度，不同行业学科，不同任务对于可解释性的需求往往是不同的。因此，学者们可以提出基础评评价标准，并在此之上针对不同任务提出不同的可解释评价标准。如在模型结果稳定性与鲁棒性基础上，评判算法所提取特征与退化趋势相关性，特征频带定位准确性等。

5.4 可解释网络的改进与应用

虽然基于先验知识与数据驱动的方法是实现高可靠性模型的有效途径，但网络设计无法像普通深度学习网络灵活，在模型性能与表现上仍旧存在不足。如物理信息神经网络很难精确地逼近高维偏微分方程，尤其是很难学习复杂的物理现象，比如流体动力学中表现出多尺度、混沌和湍流行为的解。因此，如何平衡可解释性以及模型性能是一个巨大挑战。

但也应看到，由于知识驱动的约束，可解释网络往往具有更少的参数，在泛化性和收敛速度上表现更优。并且适合的数据先验约束能够使得网络学习到更本质鲁棒的特征。因此可以有效利用这一特性并将可解释网络应用于小样本、样本不平衡、变工况、强噪声等复杂问题。

此外，虽然目前本文所介绍工作都是利用物理先验以及信号处理先验提升模型在工业智能诊断任务中的性能，但也可以利用数据驱动的特性去实现更好的物理系统建模以及信号处理分析等。

总结与展望

随着以深度学习为代表的AI技术广泛应用于工业智能诊断，用户对稳定可信的系统的需求与深度学习的“黑箱”特性成为目前智能算法在高风险工业场景下应用中的主要矛盾。因此，研究可解释性技术是实现智能诊断算法落地的关键步骤之一。可解释性不仅能增加系统决策的可信度，还能提供决策依据的解释，以便分析错误发生原因并对系统进行改进。

作为XAI在工业智能诊断中的应用系列综述的上篇，本文将XAI分为先验赋能技术与归因分析技术，并对内在可解释的先验赋能技术的研究进行了概述。考虑诊断领域知识，本文主要介绍了内在可解释深度学习中信号处理先验赋能可解释网络以及物理知识先验赋能可解释网络在工业智能诊断中的应用，并分别进行了分类与对比分析。最后我们从四个方面讨论了先验赋能XAI的挑战和机遇：先验知识的获取和类型、内在可解释性完善与补充、可解释标准评价、可解释网络的改进与应用。

我们希望本系列综述有助于增加本领域研究者对XAI最新进展的了解，并推动XAI在智能诊断中的发展与应用。

作　　者：严如强

责任编辑：赵子祎

责任校对：恽海艳

审　　核：张　强

JME学院简介

JME学院是由《机械工程学报》编辑部2018年创建，以关注、陪伴青年学者成长为宗旨，努力探索学术传播服务新模式。

欢迎各位老师扫码添加小助理-暖暖为好友，由小助理拉入JME学院官方群！

欢迎关注JME学院视频号~

寻觅合作伙伴

有一种合作叫做真诚，有一种发展可以无限，有一种伙伴可以互利共赢，愿我们合作起来流连忘返，发展起来前景可观。关于论文推荐、团队介绍、图书出版、学术直播、招聘信息、会议推广等，请与我们联系。

感谢关注我们！《机械工程学报》编辑部将努力为您打造一个有态度、有深度、有温度的学术媒体！