APP下载

基于字典相干性优化的稀疏分类在发动机空燃比故障识别中的应用

2017-12-15吴士力唐振民

中国机械工程 2017年23期
关键词:相干性字典原子

吴士力 唐振民 刘 奇

1.南京理工大学计算机科学与工程学院,南京,2100942.南京交通职业技术学院长安福特汽车有限公司联合实验室,南京,211188

基于字典相干性优化的稀疏分类在发动机空燃比故障识别中的应用

吴士力1唐振民1刘 奇2

1.南京理工大学计算机科学与工程学院,南京,2100942.南京交通职业技术学院长安福特汽车有限公司联合实验室,南京,211188

稀疏分类直接把故障样本作为原子会造成分类字典相干性较高,进而影响稀疏分类精度,为此提出一种通过有效降低分类字典相干性来提高稀疏分类效果的优化算法。该方法首先通过传播聚类算法获取分类子字典的代表原子,然后基于极分解和子空间旋转法对子字典进行相干性优化。在某型发动机上的实验结果表明,该算法在低相干性字典上能够对怠速和2000 r/min工况下的5种常见空燃比故障进行高精度识别。

稀疏分类;字典相干性;汽油发动机;空燃比故障识别

0 引言

近年来,基于数据驱动的汽油机故障识别算法得到越来越多的关注。稀疏分类(sparse representations classification,SRC)是由WRIGHT等[1]提出的一种有别于神经网络、支持向量机等传统分类的数据驱动方法。稀疏分类在人脸识别、图像和信号处理等领域的应用取得了较好的效果[2-7]。在汽油机机故障识别与诊断领域,直接使用故障样本构建字典的方法虽然简单直观,但是其应用效果存在一定的局限性。这是因为很多发动机故障的特征往往存在一定的相似性,从而导致分类字典具有较大的相干性。相干性的存在对稀疏分类的精度造成了负面影响[8]。文献[9]明确指出,低的相干性有利于减小字典的冗余度,从而获得更好的稀疏信号重构效果和更高的分类精度。

目前,低相干性字典的求解思路主要有两种:一种是在现有的字典学习算法上增加额外的相干性优化步骤;另一种是通过迭代方法直接求解低相干性字典[10-11]。MAILHE 等[12]提出的INK-SVD算法通过对字典中高相干性的原子进行聚类,然后在其基础上进行迭代解耦来降低相干性。BARCHIESI 等[13]提出的IPR算法采用交替投影法优化字典的Gram 矩阵并构造Grassmannian 框架,获得低相干性的字典后再进行旋转优化,从而提高稀疏表示精度。CRISTIAN[14]提出的IDCO算法先优化字典原子间的最大内积,根据凸优化方法对相干性高的原子进行迭代解耦,以此最小化字典的相干性。汤红忠等[15]提出对字典进行极分解的PDIDL算法,在降低字典相干性的同时具有较小的稀疏表示误差。上述方法主要用于稀疏表示字典的优化,如果应用于分类字典,会改变子字典的内部结构,导致稀疏分类的准确率下降。目前,针对如何降低分类字典的相干性的研究还非常少。

本文在PDIDL算法的基础上,根据分类字典的结构特征对分类字典进行优化。首先对由各个子字典的代表原子组成的字典进行相干性优化,再对各个子字典中其他原子进行处理,最后通过子空间旋转法对字典进行整体优化。通过趋势分析获得汽油发动机的故障样本后,在优化后的分类字典上对故障样本进行稀疏分类,实现对汽油机故障类型的识别。

1 SRC算法

SRC算法认为待分类样本只能由同类别样本来线性表示。设包含C个类别的训练样本集生成的矩阵Am×n=[A1A2…AC],m≪n,子矩阵Ai是第i个类的训练样本子集。SRC将A作为分类字典D,其分类过程如下:

(1)将任意测试样本tm×1在字典D上进行稀疏分解,即求解优化问题:

(1)

式中,y为测试样本t的表示系数向量;λ为惩罚因子。

(2)用向量y重构样本t,然后根据最小重构误差进行分类:

(2)

其中,yi是y中第i种分类的稀疏系数。根据所求得的i即可得到样本t所属的分类。

2 字典学习的目标

由SRC算法的原理可知,字典对信号的稀疏分解和重构有着至关重要的影响。DONOHO等[16]指出,低相干性的字典是获得稀疏最优解的重要条件之一。字典相干性用字典原子(归一化后)间内积的最大绝对值进行度量,该值反映了原子间最相似的程度,具体定义如下:

μ(D)=max|〈di·dj〉|∈[0,1]

(3)

其中,di、dj是字典D中的两个原子,i≠j。

汽油发动机的故障样本之间往往都存在一定的相似性,如喷油器无法全部开启和进气系统漏气故障发生时都会出现空燃比过稀、怠速抖动等现象,因此如果直接用故障样本来构建分类字典,会对稀疏分类的分类效果产生较大影响。此外,当故障样本数量很大时,会导致字典冗余度增加,进而影响分类效率。因此有必要从发动机故障样本中学习优化分类字典,使其具有较好的稀疏表达能力和低相干性。

设包含C个类别的字典D的学习模型为

T=DX

(4)

D=[D1D2…DC]

其中,Di是第i个类的子字典。T=[T1T2…TC]是训练用的故障样本集,Ti是第i个类的故障样本子集。X=(X1,X2,…,XC)是训练样本T在字典D上的投影系数向量。Xi是Ti在D上的投影系数向量,Xi=(Xi1,Xi2,…,XiC),其中,Xij是Ti在Dj上的投影系数向量。根据稀疏分类思想,相同类别的训练样本Ti只能够用Di进行稀疏表示,而不能用Dj(i≠j)来表示,即Xij=0。为了进一步提高稀疏分类精度,还需要字典D中不同类原子间的相干性尽可能的低。综上所述,本文提出分类字典优化的目标函数为

(5)

其中,‖X‖1是稀疏约束项。

显然,式(5)是一个双变量的非凸优化问题,一般通过反复迭代法来获取最优解,其求解步骤如下:①初始化随机字典D(已归一化);②固定字典D,求稀疏表示系数X;③固定X,求解低相干性字典D;④反复运行步骤②、步骤③直到满足停止条件。

3 字典学习算法

由上述分析可知,分类字典的优化效果主要取决于稀疏系数和低相干性字典的求解结果。

3.1 求解稀疏系数

在字典已知的情况下,一般采用匹配追踪法对投影向量进行稀疏求解,其具体过程如下。

(1)首先初始化残差e0=Tij,Tij是第i个类的第j个故障样本;

(2)从分类字典DM中找到与e0的内积绝对值最大的原子dφi;

(3)e0减去其在dφ1所张成空间上的正交投影,得到残差e1,即

e1=e0-〈e0·dφ1〉dφ1

(6)

(4)迭代执行步骤(2)、步骤(3)直到满足停止条件:

em+1=em-〈em·dφm+1〉dφm+1

(7)

其中,dφm+1是字典D中与em的内积绝对值最大的原子,则X=(〈e0·dφ1〉,〈e1·dφ2〉,…,〈em·dφm+1〉,…)。

3.2 相干性优化

3.2.1稀疏字典的相干性优化

字典的相干性在理论上具有边界值。TROPP等[17]根据等角紧框架理论,得出对于归一化的过完备稀疏字典Dm×n,n≤m(m+1)/2 ,其相干性满足:

(8)

(9)

采用梯度下降法对式(9)进行求解,可得字典D的更新公式:

D←D-2[(DΦT-rI)Φ+λ(ΦΦTD-Φ)]Δs

(10)

其中,I为单位矩阵;Δs为迭代步长。

3.2.2分类字典的相干性优化

(1)先求出子字典Di的代表原子dei,获得代表字典De=(de1,de2,…,deC) ;

(3)更新di,获得低相干性的分类字典D′;

(4)通过子空间旋转法对D′进行优化;

整个分类字典的相干性优化过程如图1所示。

图1 分类字典相干性优化过程Fig.1 Optimization process for the coherence of dictionary

本文中,各分类字典代表原子的求取通过近邻传播聚类(affinity propagation,AP)算法来实现,以提高整个算法的鲁棒性。AP算法[18]基于相似度矩阵进行聚类,并获得聚类结果和类代表点。由于分类字典原子的类别是已知的,所以可以加入先验约束信息来提高聚类的精度和效率。获取DM中各个子字典代表原子的算法如下。

用相似度矩阵[s(di,dj)]刻画DM中原子di和dj间的距离,其元素s(di,dj)=-‖di-dj‖2。由于不同类别的原子不可能分在一组,所以在相似度矩阵[s(di,dj)]中加入强制约束s(di,dj)=-∞。构建代表矩阵[r(di,dj)]和适选矩阵[a(di,dj)],其中,元素r(di,dj)描述原子dj适合作为di所属类代表原子的代表程度。元素a(di,dj)用于描述原子di选择dj作为其所属类代表原子的合理程度,默认为0。通过以下步骤不断更新矩阵[r(di,dj)]和[a(di,dj)]:

构建一个由所有代表原子组成的K×C维的字典De,其中,K为原子的维数。则De的相干性μ(De)=max|〈dei·dej〉|。由式(9)可得,μ(De)的优化问题:

(11)

De←De-2[(DeΦT-rI)Φ+λ(ΦΦTDe-Φ)]Δs

(12)

将分类子字典Di中其余原子dxi(dxi≠dxe,x=1,2,…,Li)都加上偏移Δi,其中,Li为Di中的原子数,即可得到一个新的分类字典D′。该字典既保持了子字典的内部结构,也降低了各子字典之间的相关程度。

4 故障识别算法

汽油发动机发生空燃比故障后,闭环控制系统会在一定范围内对发动机状态进行修正,因此,及时获取发动机故障发生时的数据流对下一步的分析来说很重要。本文通过监控短期燃油修正值(short term fuel trim,STFT)的趋势变换来捕捉空燃比故障的发生时刻。发动机在无故障状态下,STFT基本保持稳定(急加速或废气再循环系统会导致STFT出现小幅度短时间的波动)。一旦空燃比故障发生后,STFT值会出现明显的趋势变化异常,闭环系统难以在短时间内进行快速修复。这为获取故障状态下的发动机数据流提供了空间。本文采用文献[20]提出的方法来获取STFT趋势发生异常变化的时间段,然后开始记录发动机在该时间段内的数据流。提取相应特征后由训练好的分类字典进行稀疏分类,最终实现故障识别。本文提出的LC-SRC算法的流程如图2所示。

图2 LC-SRC算法流程示意图Fig.2 Process of LC-SRC algorithm

5 实验

5.1 实验环境

目前,汽油发动机控制系统都通过车载自诊断(on-board diagnostic,OBD)系统对电气故障进行监控和诊断,但一般难以捕获一些轻微的机械故障或电气故障,如进气系统漏气、进气流量信号偏低等。该类故障如果不能及时处理,往往会对发动机寿命甚至行车安全造成威胁。在这种背景下,同时考虑到实验的可操作性和安全性,本文针对发动机在运行过程中出现的曲轴箱强制通风阀漏气(EL)、喷油器卡滞(IS)、进气总管漏气(IL)、进气流量信号偏低(IFL)和节气门位置信号偏低(TPL)共5种会引起空燃比失衡的常见故障进行识别。实验车辆采用长安福特的2013款福克斯手动基本型,发动机型号为1.8L Duratec型自然吸气式。故障设置方法如下:①在曲轴箱强制通风阀与进气歧管的连接软管上开一个直径约为3 mm的孔;②由汽修单位直接提供一个因卡滞无法全开的喷油器,替换实验车辆上的无故障喷油器;③松开进气总管和节气门体的紧固螺母;④堵住空气流量计计量孔1/3的面积;⑤在节气门位置传感器TP1信号线中串联30Ω电阻。

通过诊断仪从OBD接口读取发动机在正常工况和故障状态下的相应工况数据流。根据待识别故障的特点,每组数据流包括发动机转速发动机转速、负荷、加速踏板位置、节气门位置、进气流量、点火提前角和STFT值。在发动机怠速工况下,采集了无故障状态和5种故障状态下(EL、IS、IL、IFL和TPL)的数据流各120组;在发动机2000 r/min工况下,采集了上述6种状态下的数据流各100组。每条数据流都包含200个样本点。图3所示的是发动机在喷油器卡滞故障状态下所采集的某一组原始数据流样本。

图3 喷油器卡滞故障时的数据流样本Fig.3 Data stream sample of injector clamping fault

车辆在行驶过程中,发动机工况随着驾驶行为的变化而变化,即使没有发生故障,发动机的工况参数也会因为运行环境的变化、自然老化、磨损等发生缓慢的漂移。因此直接把原始数据流作为故障样本很难获得满意的故障识别效果,一般都需要对原始数据流进行特征提取。根据待识别故障的特点,所提取的特征包括发动机转速、负荷、节气门位置和点火提前角信号的振幅,节气门位置、加速踏板位置、进气流量、点火提前角和短期燃油修正信号的均值,发动机转速和负荷的相关系数、发动机转速和进气流量的相关系数、发动机转速和节气门位置的相关系数。因此,对表1中的原始数据流样本进行特征抽取后可分别获得维度为12×720的怠速工况故障特征样本集和维度为12×600的2000 r/min工况故障特征样本集。

5.2 实验结果与分析

根据式(8)对字典行列数的约束,用随机向量初始化2个12×84的分类字典:

D=[D1D2…D6]

其中,每个子字典的原子数都相同。进行归一化后分别用于怠速工况和2000 r/min工况下的发动机故障识别。由式(9)可得这2个字典的相干性边界值均为0.2689。故障识别算法的参数如下:字典学习算法的终止条件为迭代50次,匹配追踪法的终止条件为误差变化小于10-5或迭代100次,λ=Δs=0.1。

从特征样本集中随机选取70%的样本作为训练样本集,其余30%作为测试样本集,共进行10次交叉验证。为了验证LC-SRC算法的性能,分别使用INK-SVD、IDCO、IRP和PDIDL算法求解相应的低相干性分类字典DM,并利用所得字典进行稀疏分类,将所得结果和LC-SRC算法以及传统SRC算法的分类结果进行比较。图4所示为怠速工况和2000 r/min工况下各算法对字典相干性进行优化的过程。

(a)怠速工况字典相干性优化过程

(b)2000 r/min工况字典相干性优化过程图4 故障字典相干性的优化过程Fig.4 Optimization process for the coherence of faults dictionary

由图4可知,IDCO、IRP、PDIDL和LC-SRC算法分类字典的相干性都随着迭代次数的增加明显下降。其中,PDIDL算法训练的字典在两种工况下的相干性最小,分别达到0.2772和0.2721,已经非常接近理论下界值。LC-SRC算法字典的最小相干性分别为 0.3172和0.3121,略高于IDCO和PDIDL算法。这是因为LC-SRC算法并没有对字典整体的相干性进行最小化,而只是优化分类子字典间的相干性。INK-SVD算法对字典相干性的优化不明显,两种工况下字典的相干性分别为0.5230和0.5310。因为SRC没有对字典进行迭代优化,其字典相干性分别为0.582和0.564。

表1所示为各算法对5种故障和无故障状态共6种模式进行识别的平均准确率。

表1 故障识别正确率

可以看到,虽然LC-SRC训练的字典相干性不是最低,但其获得的平均识别准确率却优于具有更低相干性的IDOC和PDIDL算法。这是因为IDOC和PDIDL算法只以获得低相干性为目标,并没有考虑分类子字典的内部结构和稀疏表达意义,这在一定程度上制约了分类精度的进一步提高。对于其他三种具有较高相干性字典的算法来说,其分类精度也明显较高。这表明分类字典较低的相干性对提高稀疏分类精度是有明显意义的。此外,由于不同工况下的故障特征会发生变化(比如怠速工况下EL的故障症状会比2000 r/min工况下明显),所以同一种故障的识别率在怠速工况下和2000 r/min工况下是不同的。

6 结语

本文提出了一种基于分类字典相干性优化的汽油发动机故障识别算法(LC-SRC)。该算法根据短期燃油修正值STFT趋势的异常变化来获取有效的故障样本,从中提取特征后交给稀疏分类器进行识别。由于直接使用故障样本作为原子的字典相干性较高,且字典体积容易过大,因此本文先使用近邻传播算法来获取每个分类子字典的代表原子,然后对由所有代表原子组成的字典进行相干性优化,接着根据代表原子的优化结果对分类字典中每个原子进行调整,在最小化分类字典相干性的同时保持子字典的内部结构,最后使用子空间旋转完成字典的学习和稀疏分类器的训练。在长安福特福克斯发动机上的实验结果表明,LC-SRC算法在所获得的低相干性字典上,能够以较高的准确率对怠速和2000 r/min工况下5种空燃比故障进行识别。

[1] WRIGHT J, YANG A Y, GANESH A. Robust Face Recognition via Sparse Representation[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2009, 31(2):210-227.

[2] 李继猛,张金凤,张云刚,等. 基于自适应随机共振和稀疏编码收缩算法的齿轮故障诊断方法[J].中国机械工程,2016 , 27 (13) :1796-1801.

LI Jimeng, ZHANG Jinfeng, ZHANG Yungang, et al. Fault Diagnosis of Gears Based on Adaptive Stochastic Resonance and Sparse Code Shrinkage Algorithm[J]. China Mechanical Engineering,2016 , 27 (13) :1796-1801.

[3] 胡正平, 高红霄, 赵淑欢. 基于低秩分解的联合动态稀疏表示多观测样本分类算法[J].电子学报,2015, 43(3) :440-446.

HU Zhengping,GAO Hongxiao,ZHAO Shuhuan. Multiple Observation Sets Classification Algorithm Based on Joint Dynamic Sparse Representation of Low-rank Decomposition[J]. ACTA Electronica Sinica,2015, 43(3) :440-446.

[4] 杨利平,龚卫国,辜小花,等.完备鉴别保局投影人脸识别算法[J]. 软件学报,2010 , 21 (6) :1277-1286.

YANG Liping, GONG Weiguo, GU Xiaohua, et al. Complete Discriminant Locality Preserving Projections for Face Recognition[J]. Journal of Software,2010, 21(6): 1277-1286.

[5] 马小虎,谭延琪.基于鉴别稀疏保持嵌入的人脸识别算法[J]. 自动化学报. 2014, 21 (6) :1277-1286.

MA Xiaohu, TAN Yanqi. Face Recognition Based on Discriminant Sparsity Preserving Embedding[J]. CAA Journal of Automatica Sinica. 2014, 21 (6) :1277-1286.

[6] PLENGE E , KLEIN S S , NIESSEN W J, et al. Multiple Sparse Representations Classification[J]. Plos One, 2015,10(8): e0136827.

[7] SCHÖLKOPF B , PLATT J , HOFMANN T. Sparse Representation for Signal Classification[J]. Conference on Advances in Neural Information Processing Systems, 2006, 19: 609-616.

[8] LIN T, LIU S, ZHA H. Incoherent Dictionary Learning for Sparse Representation[C]//Int. Conf. Pattern Recognition, ICPR. Tsukuba Science City, JAPAN, 2012:1237-1240.

[9] 练秋生,石保顺,陈书贞. 字典学习模型、算法及其应用研究进展[J].自动化学报. 2015, 41 (2) :240-260 .

LIAN Qiusheng, SHI Baoshun, CHEN Shuzhen. Research Advances on Dictionary Learning Models, Algorithms and Applications[J]. CAA Journal of Automatica Sinica, 2015, 41 (2): 240-260.

[10] LI Zhenni, DING Shuxue, HAYASHI T, et al. Incoherent Dictionary Learning with Log-regularizer Based on Proximal Operators[J]. Digital Signal Processing, 2017, 63: 86-99.

[11] BAO Chenglong, QUAN Yuhui, JI Hui. A Convergent Incoherent Dictionary Learning Algorithm for Sparse Coding[J]. Computer Vision-ECCV 2014, 86(94): 302-316.

[12] MAILHE B, BARCHIESI D, PLUMBLEY M D. INK-SVD: Learning Incoherent Fictionaries for Dparse Tepresentation[C]//Proceedings of the 2012 International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Kyoto, 2012: 3573-3576.

[13] BARCHIESI D, PLUMBLEY M D. Learning Incoherent Dictionaries for Sparse Approximation Using Iterative Projections and Rotations[J]. IEEE Transactions on Signal Processing, 2013, 61(8): 2055-2065.

[14] CRISTIAN R. Design of Incoherent Frames via Convex Optimization[J]. IEEE Signal Processing Letters, 2013, 20(7): 673-676.

[15] 汤红忠,张小刚,陈华. 带边界条件约束的非相干字典学习方法及其稀疏表示[J].自动化学报, 2015, 41(2):312-319 .

TANG Hongzhong, ZHANG Xiaogang, CHEN Hua. Incoherent Dictionary Learning Method with Border Condition Constrained for Sparse Representation[J]. CAA Journal of Automatica Sinica, 2015, 41(2): 312-319.

[16] DONOHO D L, TSAIG Y. Fast Solution of l1-norm Minimization Problems When the Solution May be Sparse[J]. IEEE Transactions on Information Theory, 2008, 54(11): 789-812.

[17] TROPP J A, DHILLON I S, HEATH R W, et al. Designing Structured Tight Frames via an Alternating Projection Method[J]. IEEE Transactions on Information Theory, 2005, 51(1): 188-209.

[18] FREY B J, DUECK D. Clustering by Passing Messages between Data Points[J]. Science Magazine, 2007, 315: 972-976.

[19] BARCHIESI D, PLUMBLEY M D. Learning Incoherent Dictionaries for Sparse Approximation Using Iterative Projections and Rotations[J]. IEEE Transactions on Signal Processing, 2013, 61(8): 2055-2065.

[20] WU Shili, TANG Zhenmin, GUO Zhaosong. Lightweight Mixture Faults Detection Method for Gasoline Engine Using On-line Trend Analysis[J]. International Journal of Automotive Technology, 2017 , 18 (3):365-375.

RecognitionApplicationsforAirFuelRatioFaultsofGasolineEnginesUsingSparseRepresentationClassificationBasedonOptimizationofDictionaryCoherence

WU Shili1TANG Zhenmin1LIU Qi2

1.School of Computer Science and Engineering,Nanjing University of Science and Technology, Nanjing,210094 2.Nanjing Vocational Institute of Transport Technology-Chang’an Ford Joint Research Laboratory, Nanjing,211188

Sparse representation classification directly took fault samples as atoms which would result in higher coherence of classification dictionary. Thus, accuracy of sparse classification would be affected. A new optimization algorithm was proposed to improve effectiveness of sparse classification by effectively reducing the coherence of classification dictionary herein. Firstly, the representative atom of each sub-dictionary was obtained by affinity propagation clustering algorithm. Secondly, all the sub dictionaries consisted of representative atoms were optimized based on polar decomposition and subspace rotation methods. The experimental results of an engine show that, the novelty classification algorithm achieves high accuracy of recognition for five common faults in idle and 2000 r/min operating conditions using the dictionary with lower coherence.

sparse representation classification; coherence of dictionary; gasoline engine; air-fuel ratio fault recognition

TP274

10.3969/j.issn.1004-132X.2017.23.001

2016-11-28

国家自然科学基金资助项目(61305134)

(编辑张洋)

吴士力,男,1980年生。南京理工大学计算机科学与工程学院博士研究生。主要研究方向为智能故障诊断技术、智能控制系统等。发表论文6篇。E-mail: wsl_wushili@163.com。唐振民,男,1961年生。南京理工大学计算机科学与工程学院教授、博士研究生导师。刘奇,男,1983年生。南京交通职业技术学院智能交通实验室实验师。

猜你喜欢

相干性字典原子
关联退极化量子信道中qutrit-qutrit系统的量子相干性演化*
原子究竟有多小?
原子可以结合吗?
带你认识原子
两体系统量子相干性的动力学和守恒
字典的由来
大头熊的字典
乒乓球运动员在经验相关图形识别中的脑电相干性分析
正版字典
Analysis of InSAR Coherence Loss Caused by Soil Moisture Variation