APP下载

基于GA-LSSVM的航空发动机气路故障诊断

2021-08-04胡鹤翔

中国民航大学学报 2021年3期
关键词:气路适应度故障诊断

田 静,胡鹤翔

(中国民航大学航空工程学院,天津 300300)

据相关资料统计,航空发动机气路系统部件故障占发动机故障的90%[1]。采用智能故障诊断方法可有效诊断发动机气路故障,提高航空发动机的安全性,节约维修成本和维修时间。

目前,对航空发动机气路故障诊断的研究主要有3 种方法:基于模型的故障诊断[2],基于数据的故障诊断[3-5]和基于知识的故障诊断。由于气路故障数据具有非线性、维数大、样本数量少的特点,非线性分类是一种行之有效的诊断方法。

支持向量机[6](SVM, support vertor machine)是由Vapnik 提出的针对有限样本的机器学习算法,可有效解决非线性、高维和样本不足的问题。最小二乘支持向量机[7](LSSVM,least square support vector machine)是对标准支持向量机的优化,将SVM 优化的非等式约束用等式约束替换,降低了求解的复杂性。目前SVM和LSSVM 广泛应用于航空发动机部件的故障诊断,如徐启华等[8]用SVM 模型对航空发动机气路部件的单一和复合故障进行诊断,但该方法忽略了SVM 正则化参数C的随机性;王旭辉等[9]利用模式搜索法优化LSSVM 参数,并将优化后的模型应用于航空发动机气路故障诊断,但该优化方法限制搜索方向,容易陷入局部值;王修岩等[3]将SVM 和SNN(spiking neural network)相结合用于区分发动机气路故障诊断过程中的相似故障;陈扬文[10]提出将Adaboost 与SVM 结合用于发动机气路单一故障的诊断,但该优化方法不能保证最优解且对噪声很敏感;Du 等[11]将HPSO-TWSVM 应用于发动机气路故障诊断,但该优化方法对于小样本问题可以找到最优解,对于大规模问题只能找到较优解。

虽然LSSVM 在发动机故障诊断中应用广泛,但是没有一种确定方法用来选取合适的正则化参数C和核参数g。而遗传算法(GA,genetic algorithm)具有多个体并行比较、自适应调整搜索方向、鲁棒性高且易于与其他算法结合的寻优特点。因此采取遗传算法优化LSSVM 参数,并用优化的LSSVM 模型对发动机气路故障进行诊断,最后从诊断精度、计算时间、抗噪能力3 个方面与SVM、LSSVM 和GA-SVM 进行比较,验证GA-LSSVM 在气路故障诊断中的有效性。

1 最小二乘支持向量机(LSSVM)

SVM 算法通过核函数将需要输入的向量映射到一个高维特征空间,其次选择分类核函数,最后在新的高维特征空间中构造最优分类面。假定训练集为{(x1,y1),…,(xm,ym)},m 表示样本总数,xi∈Rn表示第i个样本输入,yi为样本输出,SVM 算法原理如图1 所示。

图1 SVM 算法原理图Fig.1 Schematic diagram of SVM algorithm

LSSVM 在SVM 的基础上进行了延伸和优化,其损失函数采取最小二乘线性函数,将SVM 优化问题中的非等式约束用等式约束替换,等式约束形式如式(1)所示,该替换极大方便了Lagrange 乘子的求解,进而提高了模型分类的准确度。

式中:W 为分类超平面法向量;b 为超平面偏移量。

LSSVM 模型主要通过分类函数建立最优分类平面,从而对数据进行分类,即

式中:αi为对应于xi的Lagrange 乘子;k(x,xi)为核函数。

2 基于遗传算法的LSSVM 优化

LSSVM 建模过程中正则化参数C 及核参数g 的选择极其重要,但标准LSSVM 算法中C 和g 的随机选取可能会造成算法的过拟合或欠拟合,影响诊断精度。遗传算法具有全局优化功能,故选择遗传算法[12]对C和g 进行寻优,以找到LSSVM 的最佳参数。

2.1 GA-LSSVM 模型实现

1)参数初始化

采用二进制对参数C 和g 进行编码,其中C∈[0,1 000],g∈[0,100]。

2)适应度函数

遗传算法对一个解的评价取决于适应度值,适应度函数的选取直接影响遗传算法的收敛速度和寻优效果。为找到最优的(C,g)解,选取LSSVM 3 折交叉验证下的准确率作为适应度函数的值。当种群适应度值大于98%时,则跳出循环;否则对该种群进行选择、交叉和变异以产生新的群体。

3)选择、交叉和变异

计算种群个体的适应度值,适应度高的值留下,剩下的染色体采用精英锦标赛策略进行选择;采用两点交叉算子和二进制变异算子,连续迭代N 次,可得到适应度最高的个体,找到最优参数C 和g。

2.2 GA-LSSVM 参数流程

GA-LSSVM 算法流程如图2 所示。

图2 GA-LSSVM 算法流程图Fig.2 Flowchart of GA-LSSVM algorithm

3 气路故障诊断实例分析

3.1 数据描述

实验所用数据为文献[13]中单一部件故障测量数据,为选定工作参考点的相对偏差量(百分比)。5 种故障形式如表1 所示。

表1 故障类型与标签Tab.1 Fault type and label

采用30 个发动机正常状态下的数据样本,部分数据如表2 所示。发动机气路单一部件故障数据共40组,每一类部件故障数据有10 组,部分数据如表3所示。

表2 正常样本Tab.2 Normal samples

表3 故障样本Tab.3 Fault samples

3.2 参数选择对算法的影响

1)核函数

LSSVM 的核函数为只依赖于输入和样本内积的一种映射,这种内积计算使得LSSVM 可以利用核函数解决线性不可分的情况,而核函数的选取直接影响分类结果。采用不同的核函数对测试样本进行训练,结果如图3 所示,可知核函数为rbf 时,分类准确率高于其他核函数,故LSSVM 模型均采用rbf 作为核函数。

图3 核函数对算法准确率的影响Fig.3 Influence of kernel function on algorithm accuracy

2)参数C 和g

正则化参数C 表示模型对误差的宽容度,C 越大,说明越不能容忍出现误差,容易过拟合;C 越小,则越容易欠拟合。C 过大或过小,泛化能力变差。以收集到的数据为例,验证C 和g 对LSSVM 算法精度的影响,试验结果如图4~图6 所示。可以看出:在核函数为rbf 的情况下,合理选择C 和g 是提高LSSVM 算法精度的关键,对算法训练耗时也有影响。

图4 C 和g 对训练集准确率的影响Fig.4 Influence of C and g on training set accuracy

图5 C 和g 对测试集准确率的影响Fig.5 Influence of C and g on test set accuracy

图6 C 和g 对SVM 模型训练耗时的影响Fig.6 Influence of C and g on training time of LSSVM model

4 计算结果分析

利用遗传算法优化的LSSVM 对测试样本进行诊断,设置种群数量N=20,迭代次数T=100,染色体长度L=20,随着迭代次数的增加,自动算出模型的最优参数C 和g。图7 展示了随着迭代的不断进行,适应度的提升过程。可见GA-LSSVM 的适应度值高于GASVM 且最后稳定在95.23%,此时C=3.575,g=0.841。之后将优化得到的最优参数输入LSSVM 模型中,输入测试数据集(样本比例为3 ∶2)诊断结果如图8所示。

图7 GA-LSSVM 和GA-SVM 适应度曲线Fig.7 Fitness curve of GA-LSSVM and GA-SVM

图8 诊断结果Fig.8 Diagnosis result

为验证GA-LSSVM 算法的有效性,从诊断精度、抗噪能力和训练耗时3 方面与SVM、LSSVM 和GA-SVM进行比较,结果如表4 所示。

表4 实验结果的比较Tab.4 Comparison of experimental results

GA-LSSVM 的诊断精度达到95.23%,高于其他3种算法。抗噪能力方面,实际工况下,从传感器收集到的发动机样本数据经常受到环境因素、机器因素等的影响,抗噪效果并不理想,因此为样本添加不同程度的高斯白噪声(即1%、2%、3%、4%、5%)以模拟真实数据。随着噪声程度的增加,各算法的诊断精度均有明显下降,但GA-LSSVM 和GA-SVM 的下降速度较慢,且GA-LSSVM 的诊断精度保持在80%以上,抗噪能力优于GA-SVM。训练耗时方面,影响训练耗时的因素有算法结构、迭代次数,此外,也与计算机性能有关。在迭代次数为100 的情况下,GA-LSSVM 和GA-SVM 的训练时间比较长,这是因为要寻找最优参数C 和g,而寻优过程需要计算种群适应度,反复执行多次,导致训练时间过长。但对于航空发动机气路故障诊断而言,能够得到较高的诊断率,训练耗时稍长也是能接受的。

5 结语

通过GA 寻优得到C 和g 的最优值,可使LSSVM诊断精度达到95.23%。将GA-LSSVM 算法应用于发动机气路故障诊断,结果表明,添加不同程度高斯白噪声后,算法的诊断精度均有所下降,但GA-LSSVM 算法的诊断精度下降速度较慢,且保持在80%以上。在训练时间方面,GA-LSSVM 算法由于算法结构、寻优迭代次数和计算机性能的影响,其训练时间比较长。

猜你喜欢

气路适应度故障诊断
改进的自适应复制、交叉和突变遗传算法
基于包络解调原理的低转速滚动轴承故障诊断
煤中CH4渗透率估算方法研究
贝克曼库尔特DxI 800免疫分析系统气路故障维修研究
钻井工程项目中综合录井施工方法探讨
数控机床电气系统的故障诊断与维修
启发式搜索算法进行乐曲编辑的基本原理分析
基于量子万有引力搜索的SVM自驾故障诊断
基于人群搜索算法的上市公司的Z—Score模型财务预警研究
江淮同悦纯电动汽车无倒档故障诊断与排除