APP下载

基于多特征选择算法的功率变换器故障分类方法

2022-07-22池程芝潘震徐钊张一童

西北工业大学学报 2022年3期
关键词:特征选择时域电压

池程芝, 潘震, 徐钊, 张一童

(1.中国航空无线电电子研究所 航空电子系统综合技术重点实验室, 上海 200233;2.西北工业大学 电子信息学院, 陕西 西安 710072)

在某些特定的作战环境中,极端的作战环境会使航电系统中的器件参数更容易产生变化,进而影响飞机系统的安全性和可靠性[1-2],如何保障作战效率成为目前亟待解决的问题。在航电系统中,电源转换模块(power conversion module,PCM)的功能是将飞机电源系统的供电电压转换为飞机内部机架的直流电压,通过控制电源阵列开关给各模块供电;DC-DC功率变换器是PCM模块中的核心部分,其健康状态会影响到其他所有模块,是其他模块正常工作的基础。在DC-DC功率变换器中有各种不同的电压电流信号,如果不能对电压电流信号进行有效处理,会使得宝贵的监测信号资源变为“数据爆炸”,且占用航电系统中较大的计算资源,整个航电系统的时效性和稳定性会受到影响。因此对功率变换器进行特征选择至关重要[2-3]。

为此国内外学者开展了大量的研究工作,文献[3-5]分析了特征选择和特征降维在故障诊断方向的作用和意义。文献[6]提出了基于主成分分析和极限学习机相结合的故障诊断算法,利用主成分分析和方差贡献率对原始数据进行降维。文献[7]对特征信号进行了微分,是一种快速的检测和识别方法。文献[8]提出堆叠降噪自动编码器的特征降维方法,对原始特征信号进行数据压缩,从而达到降维效果。文献[9]基于一维卷积神经网络进行自适应特征提取。随着大规模集成系统的使用,传感器数量指数型增长,特征降维所需时间大大增加,传统的方法在处理集成度较高的系统时,会存在精度较低,泛化能力较弱等问题,特征选择能够大大缩短对大规模数据进行数据挖掘的时间。本文利用统计分析、智能优化算法等不同技术之间的差异性和互补性,提出更为有效的多模型融合的特征选择技术,使得所选特征对于不同分类器能有更好的鲁棒性。

1 DC-DC变换器失效器件分析

在DC-DC变换器中常见且易损器件有铝电解电容、开关晶体管和功率二极管,上述元器件是功率变换器中较易出现故障的部分。铝电解电容吸收输出电压的波动从而使得输出电压更加稳定,且去除噪声导致的输出电压中的交流部分。开关晶体管是整个变换器的核心器件,该器件作用是功率转换。功率二极管用于整波整流。上述器件对于DC-DC变换器的正常工作有着致命性的影响,因此利用特征选择和故障诊断算法对上述器件进行分类研究非常有必要。

本文以图1所示的DC-DC变换器电路为研究对象,在Cadence仿真环境中搭建电路。通过仿真软件中“探针”采集原始数据信息,用于后续数据挖掘与特征选择工作。

图1 基于Sepic拓扑结构的电路模型

2 多模型融合框架

本文的故障诊断框架如图2所示。主要包含了数据预处理、特征提取、多特征选择算法融合、故障诊断。数据预处理对异常数据清洗和缺失数据添补整理;特征提取利用不同算法对原始信号进行分析及数据挖掘。特征选择模块是本文的重点部分,利用不同的选择算法对提取出的大量特征进行选择;最后通过BP神经网络算法建立所选特征变量与故障类型之间的对应关系。

图2 故障诊断框架

3 仿真验证

3.1 基于ReliefF算法的特征选择

ReliefF算法是多分类特征选择算法。ReliefF给特征以不同的权重,选择权重较大的特征,进行分类。ReliefF在处理多类问题时,先从训练集中随机选取一个样本R, 从R相同类别的样本中找K个近邻样本,从不同类别的样本中找K个近邻样本,更新不同特征权重,其权重计算准则如(1)式所示

(1)

式中:Δ(A,R,Hj)是样本R与Hj在特征A上的差;C为与样本R不同的类别;P(C)为第C类的概率;Cclass(R)为样本R所在的类;Mj为类别C中与样本R的第j个最近邻样本;Δ(A,R,Mj(C))为样本R与样本Mj在特征A上的差。

3.2 基于SVM-RFE算法的特征选择

递归特征消除法(recursive feature elimination,RFE)反复多次创建模型,并在每次迭代时保存最好的特征,在下一次迭代时,采用上一次建模中没有用过的特征来构建下一个模型,最终找到一个性能最优的特征子集。

SVM-RFE特征选择算法利用支持向量机(support vector machine, SVM)的分类性能作为特征选择评价标准。SVM-RFE起始于全部特征,然后每次移去一个特征直到特征集合为空,移去的特征是所有特征中‖ω‖2最小的一个,ω为支持向量机中的超平面法向量。这样对某一变量i,排序评价准则如(2)式所示。

(2)

图3 SVM-RFE算法流程图

3.3 基于随机森林算法的特征选择

随机森林算法(random forest,RF)是基于决策树(decision tree,DT)算法,其利用多棵决策树对样本进行训练并预测。算法的流程图如图4所示。

图4 随机森林算法基本思路

CART决策树(classification and regression tree,CART)算法使用基尼系数来选择划分属性。基尼系数可表示为

(3)

式中:D表示数据集;k表示第k类样本;Pk和Pk′分别表示不同类别标签的概率。可根据(3)式,计算出属性a的基尼系数,获得基尼指数定义

(4)

式中:属性a有V个可能的取值{a1,a2,…,aV},使用a来对样本集D进行划分,会产生V个分支节点,其中第v个分支结点包含了D中所有在属性a上取值为av的样本,记为Dv。 在候选属性集合A中,选择基尼指数最小的属性作为最优划分属性,既a*=argminGini-index(D,a)。

3.4 特征系数加权融合

多特征选择算法融合模型可用(5)式表示

(5)

4 仿真验证

本部分的故障诊断算法研究主要针对于DC-DC变换器中硬故障类型,如易损器件的短路和开路故障,故对前述的3个易损器件分别进行开路和短路的故障仿真,由于开关晶体管的开路故障无法在仿真软件中实现,所以本部分对其余5种故障进行特征选择和分类研究。DC-DC变换器的主要参数为输出电压,在正常状态和故障状态下的输出电压值会有明显的差异。采集不同故障类型下的输出电压值,可以根据输出电压的特征信息进行有效的分类。在实际电路中,电压信号可以采取直接测量的方式获取,而对于电流信号,电路中往往不存在采样输出接口,需要利用电磁感应的原理来获取,因此本文选择输出电压作为信号特征。

对输出电压提取时域特征如表1所示。

表1 时域信号

DC-DC变换器是典型的数模混合电路,当电路发生故障时,信号各频段的能量较正常值必定发生一定的变化,利用离散小波变换只保留了低频信息,丢失了高频信息,而利用小波包分解能同时保留低频和高频信息,得到较为完备的故障信息。所以在时频域中,对输出电压进行3层小波包分解。

采用以上特征对各输出电压信号进行特征提取,对5种不同的故障类型各取10组进行示例,对特征提取部分获得的故障特征向量进行归一化处理,以消除不同特征分量之间的量纲之间的差异。时域和时频域特征提取部分如图5~6所示。

由上述的时域特征矢量和小波包分解、重构各频段小波能量频域特征矢量可知,初选特征矢量维度较高,特征分量间存在较大的信息冗余,如果直接用于BP神经网络训练,得出的模型精度不高且计算时间较长。故采用多特征选择算法对其进行数据挖掘工作,ReliefF算法、RFE-SVM及随机森林3种特征选择算法的仿真结果如图7~9所示。

图5 时域特征统计量曲线 图6 时频域特征统计量曲线 图7 ReliefF模型特征选择结果

图8 RFE-SVM模型特征选择结果 图9 随机森林特征选择结果图10 加权平均算法结果图

由图7~9可以看出,不同的选择算法对特征的选择有着相似性,也有差异性。在ReliefF算法中,时域信号中输出电压的偏度和峰峰值具有较大的贡献度,在时频域中,重构系数中第三和第四系数权重较大。RFE-SVM算法的返回值为布尔值,可以看出除了ReliefF算法中权重较大部分外,输出电压的标准差也被选为主要特征之一。而随机森林算法和前两者具有较大的差异,主要体现在时频域中,重构系数的第一和第二系数大于第三和第四系数;但在时域中,输出电压的标准差、偏度及峰峰值和其他算法结果相似。

仿真实验产生不同故障类型各40组,共200组为训练集,利用训练集对模型进行训练;留出不同故障类型各10组,共50组为测试集,进行故障诊断准确率的评估。如图10所示,根据加权平均算法的结果,本文仿真实验中采用时域中输出电压标准差、偏度及峰峰值和频域中第三和第四系数作为特征矢量,首先将上述所选出的5个特征作为特征矢量,利用KNN算法进行分类研究。结果如图11所示。

选出的5个特征组成的特征矢量能够在KNN分类算法下实现100%准确率。为了更进一步验证算法效果,按照权重系数的大小,利用KNN算法分别对5组被选取特征进行分类研究。诊断结果如表2所示。

表2 不同特征分类结果图

从表2可以看出,输出电压峰峰值和标准差都能在KNN算法中实现100%的准确率,为了验证多特征选择算法融合的鲁棒性,将输出电压峰峰值特征放入BPNN网络中进行验证,从图12可以看出,真实测试集和预测的测试集结果完全一致,在仿真实验的条件下,诊断精度也能达到100%。结合图11和图12的分类结果可以得到,本文提出的多特征选择算法模型仅用最高权重系数的特征即输出电压的峰峰值,就能够在不同的分类器中得到较高的准确率。

图12 基于BPNN模型硬故障分类结果示意图

5 结 论

本文对DC-DC变换器不同故障进行失效模型分析,考虑到实际电路信号采集问题,选择了对DC-DC变换器影响最小的输出电压信号,通过仿真获取原始数据并进行特征提取、多特征选择算法降维,得到特征矢量,建立了BP神经网络分类模型。仿真结果表明本文提出的多特征选择模型融合方法能够进行多故障分类的任务。

相比于传统数据,高维数据中的数据量更多、特征之间的相关性也更为复杂,尽管部分机器学习的算法模型对高维数据也能实现分类预测等功能,然而在实际工程中,泛化性较弱的问题是非常常见的。本文在特征选择方面提出了多模型融合的算法,可以有效避免“过拟合”和“维数爆炸”问题,且增强了模型的泛化能力,相较于特征降维,对于研究人员而言,该方法更易理解。下一步工作是利用更多的数据集去验证算法模型的鲁棒性和准确性。

猜你喜欢

特征选择时域电压
OFDM 系统中的符号时域偏差估计
晚霞浅淡少年糖
基于智能优化算法选择特征的网络入侵检测
谈谈电压
故障诊断中的数据建模与特征选择
reliefF算法在数据发布隐私保护中的应用研究
一种多特征融合的中文微博评价对象提取方法
两种常用漂浮式风力机平台动态特性分析
不同入射角风波流海上漂浮式风力机频域与时域动态特性
我们身边的电压