【试验工程师·公益学习营】第十期第5讲

【试验工程师·公益学习营】总第50讲,于2020年12月25日如期举行,本期讲师北京瑞风协同科技股份有限公司董事长,数值分析专家赵旷博士。他毕业于西北工业大学,留学美国取得威斯康星大学博士学位。在设计仿真和数值计算领域耕耘30余年,拥有大型跨国公司研发战略运营管理经验。带领瑞风团队自主研发出DENOVA®、FastADS®、TDM3000®等系列工业软件。

本期课程重点分为以下三个方面:发动机剩余使用寿命预测的背景及概况、发动机剩余使用寿命预测的研究过程梳理和发动机剩余使用寿命预测的总结与展望。

一、发动机剩余使用寿命预测的背景及概况

随着航空发动机日趋复杂化、自动化和智能化,维修人员采用传统方法进行故障诊断具有很大的局限性。发动机智能故障诊断指通过检测发动机的气动热力、机械性能参数等,实现对发动机的状态监控,进而实现对故障的预测。为了提高发动机的使用效率,降低维护时间和费用,提高发动机在翼时间,采用故障智能诊断系统对发动机进行故障诊断是非常必要的。航空发动机剩余使用寿命的维护预测是故障预测与健康管理(PHM)的关键技术之一。

基于相似度算法预测的维护方法是一种数据驱动方法,从运行中的喷气式发动机收集的数据用于执行预测维护建模。该项目的目标是建立一个预测模型,基于类似喷气式发动机集群从运行到故障的数据,以估计剩余使用寿命(RUL)的喷气发动机。

为构建完整的发动机剩余使用寿命预测体系,基于相似度预测算法使用了包括:预处理、选择趋势特征、通过传感器测量数据融合构造健康指标、训练RUL相似性估计器等步骤,进一步对数据进行深度挖掘及学习,并挖掘拟化出最优模型进行预测分析。

打开网易新闻 查看精彩图片

二、发动机剩余使用寿命预测的研究过程梳理

打开网易新闻 查看精彩图片

基于相似度算法预测涡扇发动机剩余使用寿命

1、数据挖掘

• 整体数据概况

打开网易新闻 查看精彩图片

整体数据概况

• 整体训练集数据概况

打开网易新闻 查看精彩图片

目前阶段,进行初步整理的数据无法建立与发动机剩余使用寿命的高度相关性,因此我们需要找到数据中可以与发动机剩余使用寿命建立强关联的数值,通过强关系分析,进行可视化处理。

• 训练集中某一台发动机数据的可视化概况

打开网易新闻 查看精彩图片

通过粗略的观测分析,我们可以发现,在每一台发动机由运行至不适航的训练集数据之中,某些传感器参数之间存在正/负的完美强相关性。由此,我们可以继续深入寻找这些参数之间的相关性,选择提取其特征值,寻找其时间序列和变量的数据列分布概况。

• 寻找相关性

打开网易新闻 查看精彩图片

全部训练集数据分布情况

• 寻找时序关系

在对每一组发动机数据进行相关性数据观测以及调试后,提取随时间变化的原始特征数据,方便挖掘发动机数据之间的差异性。

打开网易新闻 查看精彩图片

2、分组聚类

• 工况分组

在之前的数据挖掘过程中,因为工况与时间没有呈现出相关性,因此我们对三种工况进行分组处理,使用分组算法(Clustering Algorithm)将工况分为六个聚类群,并使用K均值算法(K-Means Algorithm)对三种工况数据实现局部最优,选择最低成本的结果,即找到每一个聚类群的重心(Centroid)。

打开网易新闻 查看精彩图片

对工况的特殊分组处理是为下一步对传感器参数深入处理的基础,虽然在上述处理过程中,三种工况均未呈现与时间的相关性,但不能单凭数据测量进行判断而忽视这一重要步骤。

3、数据深度处理

• 标准化处理

根据上一步中已经确定的六个工况聚类群,对传感器参数进行分组标准化处理。其中,相对恒定的传感器参数值对于剩余使用寿命(RUL)的测量没有用处,将被剔除。若传感器参数有各自意义,则在此步骤中,需针对性处理,选择性保留并找出其相关性。

较高的相关性趋势可能意味着对发动机不适航的可预测性更精准,因此需要检查传感器参数作为周期函数的发展趋势。

由此思路为:对归一化后的每一个传感器参数建立一个线性退化模型,并对其线性斜率绝对值进行排序。

• 线性趋势

打开网易新闻 查看精彩图片

可观测到,某些传感器参数值的退化趋势明显,这有助于下一步的回归分析。

4、数据融合

• 建立PHM健康指标

发动机初始运行状态赋值为1,不适航时状态赋值为0。即形成发动机随时间推移从1(健康状态)线性退化到0(不适航状态),这种线性退化被用来帮助融合传感器参数值。

打开网易新闻 查看精彩图片

• 参数值融合为单一健康指标

根据最具趋势性的8个传感器参数值建立基于PHM健康指标的线性回归模型,为确定每一种工况下的各个参数值与时间之间的依赖关系。至此,训练集中某一台发动机的六种工况下的传感器参数值融合结果呈现出指数模型,进行可视化,之后会将其应用于所有训练集数据。

打开网易新闻 查看精彩图片

5、建立SBRUL模型

• 模型确立

在应用训练集建立了初步模型后,应用验证集重复上述的数据预处理及数据挖掘工作,并对处理后的验证集传感器参数与健康模型进行融合。

给定验证集中的数据,训练模型最终将预测50个数值并形成概率分布,选取预测分布的中位数作为剩余使用寿命(RUL)的估计值,形成剩余使用寿命预测。

打开网易新闻 查看精彩图片

6、验证模型

• 模型评估

使用50%、70%、90%的样本数据对模型的预测进行检验,验证其剩余使用寿命是否按照预测值实现。

打开网易新闻 查看精彩图片

截取使用寿命达到50%的样本数据及其临近值,并将预测值与真实使用寿命、预估使用寿命概率分布进行比较分析。此时,预估值与真实值之间误差较大。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

截取使用寿命达到70%的样本数据及其临近值,并将预测值与真实使用寿命、预估使用寿命概率分布进行比较分析。在增加了20%的数据后,剩余使用寿命的预估能力增强。

打开网易新闻 查看精彩图片

截取使用寿命达到90%的样本数据及其临近值,并将预测值与真实使用寿命、预估使用寿命概率分布进行比较分析。当发动机接近不适航时,预测值与实际值更加贴近,预测精度更加准确。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

7、计算误差值

• 统计评估

对全部试验数据重复以上相同步骤,计算预测值与实际值之间的误差值,并将50%、70%、90%三个断电的误差值进行统计分析和概率分布可视化。

打开网易新闻 查看精彩图片

此时,可清晰观测到,随着数据的增加,误差值越来越小并且趋近于0,即为异常值减少。因此,随着发动机使用时间的增加,本模型对于发动机剩余使用寿命的评估越发精准。

打开网易新闻 查看精彩图片

8、输入新数据

三、发动机剩余使用寿命预测的总结与展望

1、过程总结

• 通过初步数据预处理,找到数据之间的关联

• 在数据的深度挖掘过程中,提取特征值,进行分组聚类、降维处理,挖掘其之间的关联

• 将特征数据进行融合,建立训练模型

• 验证模型

• 模型评估

2、模型总结

基于相似度预测算法根据实际情况,对发动机的不同工况进行了最优分组,在此基础上建立了基于不同工况条件下形成的传感器参数与时间的相关性。同时,在相似型基础构架、相似度量方法、预测效果检验等方面进行了深入研究,对数据进行了有效利用与挖掘。

同时,随着数据量的增加,即发动机使用数据增加,此模型对发动机剩余使用寿命的所有预测值均小于且趋近于其真实使用寿命,可为发动机维修保护进行良好的提前预测。