APP下载

基于空间几何法和距离法的柴油机异常热工参数检测方法

2019-12-30曾存胡以怀胡光忠李方玉李凯

上海海事大学学报 2019年4期
关键词:柴油机变量样本

曾存 胡以怀 胡光忠 李方玉 李凯

摘要:

为快速检测柴油机异常情况,分别采用空间几何法和

距离法对记录的35组MAN B&W 6S35ME-B9型船用低速柴油机在25%、50%、75%和90%负载下的热工参数进行异常数据检测,确定异常数据样本。通过两种方式的交叉验证,发现检测结果相近,论证了两种方法的可行性。

关键词:

船用柴油机; 异常数据检测; 空间几何; 马氏距离

中图分类号:U664.121.1

文献标志码:A

Diesel engine abnormal thermal parameter detection method

based on space geometry method and distance method

ZENG Cun, HU Yihuai, HU Guangzhong, LI Fangyu, LI Kai

(Merchant Marine College, Shanghai Maritime University, Shanghai 201306, China)

Abstract:

In order to detect the abnormal situation of diesel engines quickly, for 35 groups of thermal parameters of MAN B&W 6S35ME-B9 marine low-speed diesel engine under load conditions of 25%, 50%, 75% and 90%, the abnormal data are detected by the space geometry method and the distance method, respectively. The abnormal data samples are determined. Through the cross-verification of two methods, it is found that their detection results are similar, and the feasibility of the two methods is demonstrated.

Key words:

marine diesel engine; abnormal data detection; space geometry; Mahalanobis distance

收稿日期: 2019-01-13

修回日期: 2019-06-04

作者簡介:

曾存(1995—),男,江苏盐城人,硕士研究生,研究方向为智能船舶故障诊断,(E-mail)zc.shmtu@foxmail.com;

胡以怀(1964—),男,江苏高邮人,教授,博导,博士后,研究方向为船舶主机振动、故障诊断和系统仿真,

(E-mail)yhhu@shmtu.edu.com

0 引 言

数据预处理主要包括数据筛选、相关性能分析、趋势分析等,其中数据筛选是数据处理的前提。传统的异常数据筛选检测方法主要有原始残差、杠杆值法等[1],采用这些方法筛选后直接将异常数据影响降至最低或直接剔除,这可能会导致重要数据信息丢失,造成“屏蔽效应”[2]。现有检测异常试验数据的方法主要有基于统计的方法、基于距离的方法、基于偏离的方法、基于密度的方法,以及高维数据异常点检测法和基于聚类的异常点检测算法[3]。本文从支持向量机(support vector machine, SVM)角度分别采用空间几何分析法和稳健式马氏距离方法结合最小距离分类器的原理进行检测,交互验证筛选异常数据。

笔者记录了MAN B&W 6S35ME-B9型船用低速柴油机在25%、50%、75%、90%和100%负载下的部分热工参数,包括转速、功率、机舱温度等共19个参数,变量尺度和样本跨度都较大。MAN B&W 6S35ME-B9型船用低速柴油机的基本技术参数见表1。

1 数据检测

1.1 最小马氏距离

常用的距离有明氏距离、兰氏距离、杰氏距离和马氏距离等[4],其中马氏距离是一种多元数据异常值检验的重要方法,它表示多元数据在协方差矩阵下的距离,是一种与尺度无关的独立数据。

设一组变量矩阵为X=X11…X1n

XN1…XNn,其中,Xi表示为第i列向量(i=1,2,…,n,n为样本参数个数),Xa和Xb分别表示第a和b行向量(Xa、Xb为两个样本的变量向量,a,b=1,2,…,N,N为样本个数),则样本之间的明氏距离[5]为

D=ni=1Xa-Xbk1k(1)

当k=2时,明氏距离即为欧氏距离。在实际情况下,为消除尺度之间的互相影响,常用处理方式有两种:一是将变量矩阵进行归一化处理,进行尺度变化;二是将欧氏距离通过协方差矩阵变为马氏距离。

D=(X-XT)

Σ-1(X-X)(2)

式中:Σ为X的协方差矩阵,其对角元素反映了X的方差大小即样本空间内各变量的变化速度,其余各元素反映相关系数大小即各变量间的包含关系;

X为均值变量。

对X去中心化后,

展开Σ可得Σ=XTX,则式(2)变为

D=XT(XTX)-1

X(3)

若样本空间呈正态分布,则可从置信区间着手确定D的范围,进而检测出异常数据。然而,用这种方式确定异常数据位置不够精确、快速,因此本次数据检测结合稳健式马氏距离进行改进。

P(xj)=exp(-D2/2)/((2π)n/2Σ1/2)

(4)

1.2 穩健式马氏距离

传统马氏距离不能精确检测的主要原因在于,因异常数据的存在使整个样本空间的变量均值不够稳健,进而影响式(3)中的去中心矩阵

X和协方差矩阵XTX的稳健性。就此,王斌会等[1]提出一种基于迭代原理的稳健式马氏距离求解方法,张红飞等[6]利用改进马氏距离对空压机进行状态评估,盖炳良等[7]也利用

稳健式马氏距离模型对马氏距离的二元退化的可靠性进行了分析。

由于异常数据的数量有限,在重复进行迭代的过程中,发现迭代至3次以上异常数据基本剔除,其均值向量与协方差矩阵的行列式数值接近,对监测结果影响不大。通过式(4)可以发现,距离大小与数据正常的可能性成反比,因此笔者提出如下的简化和假设:

(1)为体现柴油机的不同状态,将主机转速和功率两个变量确定为固定变量,并且假定柴油机的某种状态可以达到均值变量。

(2)为消除尺度影响,不对传统的协方差矩阵求逆,而通过样本之间的相对距离进行距离的计算[8]。

(3)由于数据样本有限,且绝大部分数据为真实数据,随着迭代次数的增加,其数据异常的可能性越来越小,所以对马氏距离的迭代次数进行限制,通过距离的排列确定异常数据的概率大小。

1.3 空间几何判定机理

对于线性可分的样本数据,SVM可实现非线性映射,把样本空间映射到一个高维乃至无穷维的特征空间,再寻找最优线性超平面,实现数据样本的分类[9]。本文根据空间几何分类的思路在三维空间内找出特定的超平面实现正常数据点与异常数据点隔离。SVM是寻求最优的

Y=αX+β

进行分类的,即在三维样本空间内通过平面进行分类。结合球面坐标的表示方式,利用方位角进行异常数据检测,即通过三维空间进行数据筛选。

数据点球坐标(Φ,θ,r)由方位角Φ、仰角θ和距离r构成,与直角坐标系的转化关系如下:

tan Φ=x2+y2z

tan θ=yx

r=x2+y2+z2(5)

若忽略仰角θ的变化而将其取为2π,即将柴油机转速和功率归一化后取a=x2+y2为同一状态,则因变量z仅与方位角Φ有关。

以主机转速、功率和增压器转速为例,当三维空间内的方位角一定时增压器转速和对应的主机转速与功率会形成圆锥面(图1),本文利用这种圆锥面对异常数据位置进行排列,并与利用距离法得到的异常数据的结果进行对比。

2 马氏距离与空间几何

设马氏距离的测量尺度为D,空间几何的测量尺度为E,根据式(3)和(5)可得

D2=(X-a)2+(Y-b)2+

X2+Y2E2+c2-2cZ

(6)

式中:a、b和c为通过稳健式马氏距离得到的中心矩阵元素,即均值变量的无量纲常量;X和Y为固定变量的无量纲常量;Z为检测变量的无量纲常量。由于X和Y为固定变量,当检测不同变量时Z可以被看成为扰动项。式(6)可改写为

D2=c1E2+c2(7)

式中:c1=X2+Y2;c2=

(X-a)2+(Y-b)2+c2-2cZ。当检测同一变量时,c1和c2为常量,此时D与E单调,则通过马氏距离和空间几何来检测异常数据具备可行性。

3 数据检测分析

由于柴油机故障数据不易得到,本文参照文献[10]的大型二冲程柴油机的数学模型利用MATLAB/Simulink建立整个机型的“平均值法”模型,通过真实数据验证模型基本正确。柴油机仿真模型框图见图2,图中具体参数符号可参考文献[10-11]。由于一些数据缺少能比其更为贴近真实的测量数据,整个模型做了3个方面的变动:

(1)压气机和涡轮的效率和流量不是采用文献[10]中的插表,而是采用s-function调用MATLAB内置的RBF进行拟合的方式[12]。

(2)柴油机的排气温度不是通过排气温度升高因子K计算,而是直接采用真实排气温度的升高量与仿真的过量空气系数拟合的方式[13-14]。

(3)没有建立调速机构模型,喷油量是给定值,所有仿真计算均是在稳态负载下进行的。

图2 柴油机仿真模型框图

笔者以MAN B&W 6S35ME-B9型船用低速柴油机为计算对象,记录了19个热工参数共35个样本(包含自动化机舱的真实热工参数、正常仿真热工参数和异常热工参数),并将真实热工参数与正常仿真热工参数进行对比(表2)用以验证模型。异常热工参数是通过改变上述模型的单项参数进行模拟得来的,包括改变涡轮背压、空冷器水路进口温度等。

以25%负载和75%负载下的样本数据为例。先取25%负载下的部分热工参数进行归一化处理,得到样本点排布见图3,其横坐标为样本点,纵坐标为各样本参数在样本空间里的相对距离。从图3中可以看出,虽然部分样本参数偏离数据的整体趋势,但其整体变化规律并不明显,不能很好地找出异常数据的位置。

对图3中部分数据分别运用空间几何法和马氏距离法进行异常数据检测。由于处理方法不同,得出结果的尺度亦不同,进行归一化处理后可绘制出如图4和5的数据点分布。对比图4和5可以发现,两种方法对柴油机热工参数检测的整体趋势相近,但利用空间几何判别会使整个样本点的距离更远,数据分布进一步离散化,各变量参数之间的差距拉大,便于判断样本参数异常可能性的大小。

再取75%负载下的部分热工参数进行归一化处理,得到的样本点排布见图6。

分别运用空间几何法和马氏距离法

对75%负载下的柴油机的热工参数进行异常数据筛选,得出结果见图7和8。

对比图7和8可以发现,用这两种方法判断的数据变化趋势大体近似,但是利用空间几何法会使样本点进一步离散化,利于区分异常参数与样本点。对比发现这两种方法对具体样本参数的处理尺度有差异,这是因为75%负载下各参数值相应增大程度不同,某些参数相对变化值较小,两种方法的处理尺度愈加接近,而筛选尺度的不同以及一些参数相对变化较大使得部分筛选结果在图中反映的结果亦不相同,具体可参考图9~12重合度不一致说明。

图9~12是利用上述两种异常数据检测方法绘制的所有样本的增压器转速、空冷器水路进口压力和透平前后温度异常可能性的变化情况。可以发现,尽管经两种方法处理后的样本在空间内的相对距离不一致,但数据的变化趋势显著

相近,即样本异常的可能性排列一致。

图9~12的变化趋势有较大差异,结合式(7)

分析原因可知,当X、Y固定时,D与E的变化趋势

与测量

变量Z有较大的关系。然而,当测量变量较大时,Z值不易受测量变量影响,因此Z值变化较小,c2的影响变小,则D与E的差异会缩小,使得图9中曲线变化趋势重合度比图11和12中的高得多;图10中空冷器水路进口压力的变化趋势重合度远远高于图11和12中透平后温度的变化趋势重合度。

结合图9~12可看出,样本1的增压器转速、空冷器水路进口压力、透平前后温度均有较大变化,而样本13的空冷器水路进口压力、透平前后温度也有较大变化,可能为设置的异常数据,而其余样本如21、28等也有个别参数变化,可能为仿真误差,与实际仿真数据对比可知验证正确。

利用空间几何法和马氏距离法对柴油机的热工参数进行异常数据检测,对其可能性的大小进行排列,表3即为利用两种方法对25%、50%、75%负载下柴油机部分热工参数异常可能性进行排列的样本序号。从表3可以看出,由于数据间的差异较小,两种方法判别的效果降低,使得前几位序号的排列显著一致,但后几位序号排列相差较大。

将本文中的17个参数分别编号,分别为1,2,…,17,计算25%负载下11个样本的17个参数角

度尺度的归一化值并作图(图13),找出异常样本。

通过各个样本的性能分析即计算上述各样本尺度之

和的倒数(见表4)可以发现,样本1与样本10的热

工参数异常的可能性最大。经过验证发现:样本1中的增压器转速和柴油机功率都相应地降低,这是由于改变了模型中的涡轮背压;样本10中各参数虽有异常却并不明显,这是由于提高了空冷器冷却水温度。

4 结束语

异常数据检测是现代数据处理的热点问题,如何保证数据信息的全面性、数据处理的精确性和处理过程的灵敏性是未来数据检测的趋势。本文对记录的35组MAN B&W 6S35ME-B9型船用低速柴油机在25%、50%、75%、90%负载下的热工参数分别采用

空间几何法和马氏距离法进行异常数据检测,通过两种方式的交叉验证,发现处理结果相近,论证了两种方法的可行性。

利用空间几何法和距离法进行筛选只能确定异常数据样本,无法判断数据异常原因即故障源位置,也不能给出具体的排除故障的手段,因此可以结合模糊理论[15]、专家系统、灰色关联度等方法进行优化。

参考文献:

[1]王斌会, 陈一非. 基于稳健马氏距离的多元异常值检测[J]. 统计与决策, 2005(6): 4-6. DOI: 10.13546/j.cnki.tjyjc.2005.06.002.

[2]王建州, 馬志新, 李廉. 基于混沌的异常数据的动态识别与挖掘[J]. 清华大学学报(自然科学版), 2005, 45(s1): 1753-1756. DOI: 10.16511/j.cnki.qhdxxb.2005.s1.006.

[3]王元明, 熊伟. 异常数据的检测方法[J]. 重庆工学院学报(自然科学版), 2009, 23(2): 86-89.

[4]韩亚娟. 基于马氏田口的多元系统稳健性优化与诊断分析研究[D]. 天津: 天津大学, 2007.

[5]赵泽茂, 何坤金, 胡友进. 基于距离的异常数据挖掘算法及其应用[J]. 计算机应用与软件, 2005, 22(9): 105-107.

[6]张红飞, 夏霜, 程志友. 基于改进马氏距离的空压机健康状态评估[J]. 电测与仪表, 2018, 55(17): 32-36.

[7]盖炳良, 滕克难, 唐金国. 基于马氏距离的二元退化可靠性分析[J]. 系统工程与电子技术, 2019, 41(3): 686-692. DOI: 10.3969/j.issn.1001-506X.2019.03.31.

[8]刘罡, 王兴成, 杨昺崧. 基于融合距离法的柴油机故障诊断方法[J]. 大连海事大学学报, 2017, 43(1): 61-66. DOI: 10.16411/j.cnki.issn1006-7736.2017.01.010.

[9]詹玉龙, 翟海龙, 曾广芳. 基于支持向量机的船舶柴油机故障诊断的研究[J]. 中国航海, 2007(2): 89-92.

[10]王海燕. 大型低速船用柴油机建模与系统仿真[D]. 大连: 大连海事大学, 2006.

[11]李淑英. 船舶动力装置仿真技术[M]. 哈尔滨: 哈尔滨工程大学出版社, 2013: 94-105.

[12]帥英梅, 高世伦. 涡轮增压柴油机的平均值模型及仿真[J]. 柴油机设计与制造, 2004(2): 19-23.

[13]冯国胜, 杨绍普. 柴油机及其电控系统仿真[J]. 系统仿真学报, 2005, 17(9): 2276-2279.

[14]赵泉华, 李晓丽, 赵雪梅, 等. 结合马氏距离的区域化模糊聚类遥感图像分割[J]. 中国矿业大学学报, 2017, 46(1): 222-228.

(编辑 贾裙平)

猜你喜欢

柴油机变量样本
直击高考中的用样本估计总体
随机微分方程的样本Lyapunov二次型估计
南京尚德柴油机有限公司
基于支持向量机的测厚仪CS值电压漂移故障判定及处理
柴油机三种滤清器常见问题及保养要点
分离变量法:常见的通性通法
七年级数学下册期末检测题(B)
河柴重工新型船用高速柴油机上线装配
不可忽视变量的离散与连续
船舶柴油机密封条