APP下载

基于多分布特征的航天器遥测动态加权异常检测算法

2018-07-31卢言华

兵器装备工程学报 2018年7期
关键词:遥测航天器基准

杜 莹,王 飞,孙 超,卢言华,杨 翔

(中国人民解放军63758部队, 福建 厦门 361023)

为改善航天器的在轨管理、提高航天器的在轨性能,需要分析航天器的运行状态,对其进行有效的异常分析与检测,以确定航天器是否处于危险状态[1-5]。由于受噪声、干扰、复杂空间环境以及短期保持稳定运行模式等因素的影响,反映在轨航天器工作状态的遥测数据多呈现长期趋势非平稳、短期局部变化相对平稳的模式,其特征是数据序列虽具有非平稳变化特性,但在短时期局部范围内基本保持恒定模式。本文将具有该特征的遥测数据称为局部趋势满足平稳条件的遥测数据,简称为局部平稳遥测序列,其局部范围内数据序列的变化特性反映了航天器在轨短期运行的复杂动态。研究在轨航天器局部平稳遥测序列的异常检测算法,有助于及时发现遥测时序数据的异常变化,提前预测航天器潜在故障,从中挖掘出各部件及器件的异变信息,对航天器在轨管理与安全可靠运行具有特别重要的意义。

当前,时序数据的异常检测方法主要有基于距离的异常检测算法,基于自回归的异常检测算法和基于统计的异常检测算法[6-16]。

1) 基于距离的异常检测方法。将时间序列以滑动窗口的方式划分为一个个连续的子序列,通过计算子序列中的最大近邻距离来检测异常子序列,该方法简单高效,但运算复杂[6-7,14]。

2) 基于自回归的方法。采用自回归模型获取当前数据序列的估计值,通过与实际序列值比较,将偏差超出某门限的序列判为异常序列;缺点是该方法建立在序列平稳特性的假设上,且其检测的准确性依赖于自回归模型的选择和门限的合理设置[8]。

3) 基于统计的异常检测方法[10,15]。假定数据满足固定的分布,通过构建数据的统计分布模型,将异常时间序列检测出来;该方法具有坚实的数学理论基础,其关键在于选择合适的特征及相应的特性算子来全面体现数据的统计分布信息,难点在于数据分布特性的识别与描述。由于在轨航天器局部平稳遥测短期局部区域范围满足固定分布要求,其统计分布特性不随时间变化,可采用固定分布准确描述数据统计特性。因此,在基于统计的异常检测方法中,建立一个能够全面描述遥测统计特性的模型非常重要,合理有效的特征表示与特征选择决定了航天器遥测异常检测的准确性。

本文面向在轨航天器局部平稳遥测数据,针对单一特征难以全面描述数据统计分布特性的不足,通过分析基于距离与基于统计的异常检测算法的各自特点,构建了一种基于分布特性算子表示的模型匹配航天器遥测异常检测算法。该算法利用分布特性算子对航天器局部平稳遥测统计分布的集中特性、离散特性、形状特性和边界特性进行融合描述,定义多维特征向量异常检测模板,并依照此模板,对不同异常分布模式下的特征进行动态加权,建立一种高效的局部平稳遥测联合多分布域检测基准模型,以此为基础,实现航天器局部平稳遥测序列的异常检测;同时,针对遥测数据的复杂变换特性,采用数据驱动模式进行检测基准模型的动态加权,能够有效适应复杂空间环境下在轨航天器遥测数据的变化特性。某型号航天器电源分系统遥测序列异常检测的对比实验表明:相对于取单一特征、非加权多特征的检测方法,融合多特征的加权算法能够最大限度地减少漏判,抑制虚警,具有较高的异常判读准确率,可有效检测遥测数据的形态、幅值、趋势等复杂异变情况,检测效果具有鲁棒性。

1 融合多特征的加权分别异常检测框架

本文提出融合多特征的在轨航天器局部平稳遥测加权分布异常检测方法(Anomaly Detection for Locally Stationary Telemetry Data of Spacecraft Based on Fusing Multiple Weighted Distribution Features,ADMF),基于此进行遥测序列异常检测。图1给出了融合多特征的航天器局部平稳遥测加权分布异常检测框架。

图1 ADMF算法框架

由图1可知,本文提出的算法主要有以下4个关键:

1) 多维特征向量模板结构定义。通过统计分布域算子对航天器遥测参数统计分布的不同特性进行描述,定义多维特征向量模板结构。

2) 联合多分布域检测基准模型构建。在多维特征向量模板结构的基础上,提取遥测参数样本信息统计分布的集中特征、离散特性、形状特性和边界特性,并根据其所属类别赋予各特征不同的权值,建立联合多分布域检测基准模型。

3) 局部平稳遥测异常检测。将待检测局部平稳遥测序列的特征模型与检测基准模型匹配,加权处置后得到联合分布距离差,根据联合分布距离差进行局部平稳遥测序列的异常检测。

4) 联合多分布域检测基准模型动态加权。由于受到系统自身特性以及轨道、环境因素的影响,需要进行检测模板的动态加权,以适应在轨航天器遥测的最新变化趋势。本文采用数据驱动模式,对当前分布域模型及以往遥测的模型赋予不同权值,实现检测基准模型的动态加权。

2 ADMF算法

2.1 多维特征向量模板结构定义

航天器局部平稳遥测参数在时序散布图中表现为有时间维度、带明显线性边界的区域,呈现了数据统计分布的多重特性。因此,检测模板以遥测参数时序散布图的统计特性为基础,通过统计分布域算子分别对统计分布的集中、离散等多统计分布特性进行描述,并将其有效融合,保留统计分布的特征信息。统计分布域由若干个域组成,每个域都表示各个时间序列点在特征空间的一种特性。通过分布域定义算子,实现在轨航天器遥测时序数据在统计分布域中的描述:

(1)

式(1)中:R为遥测散布图;T为时间坐标;w为统计分布域窗宽;X={xt,xt+1,…,xt+w-1}为遥测从t时刻至t+w-1时刻的参数实值;l为遥测参数在统计分布域下的层值;f为遥测参数在t时刻、w窗宽下统计分布域第l层的特征值。

在分布域特征选取上,本文选取在轨航天器遥测参数统计分布的集中特征、离散特征、形状特征和边界特征,全面定义数据的统计分布特性。其中,集中特征能体现遥测数据总体分布的中心趋势特性,反映了遥测数据向某一中心值靠拢的倾向;离散特征能体现遥测数据分布的散布特性,描述了遥测数据个体值之间参差不齐的程度,可以比较全面的表现遥测数据的变异情况;形状特征能体现遥测数据的形态特性,描述了遥测数据分布的形状是否对称,偏斜的程度;边界特征能体现遥测数据分布的边缘特性,描述了遥测数据分布的形状信息。

在分布域定义上,对于统计分布的集中特征可根据数据的统计分布特性,选择均值、中位数进行描述;当数据呈现正态分布时,可选用均值进行描述;当数据分布呈现左偏或右偏时,常选用中位数进行描述;统计分布的离散特性可采用极差、四分位数极差以及数据的方差和标准差进行描述;四分位数极差常用于离群值显著的数据,是一种稳健的数据散布描述;当数据值集中域范围较窄且极端值个数较少时,方差或标准差能够有效反映遥测数据总体分布状态;而极差用于标识最大散布,易受极端值影响,不能反映全部数据分布状态。因此,统计分布的离散特性选用四分位数极差与数据方差。统计分布的分布形状特性采用偏度、峰度、偏斜度描述。其中偏度表示数据分布形态的不对称性,反映数据分布的偏斜程度;峰度表示数据分布形态的尖锐性,反映数据分布的扁平程度;偏斜度表示遥测数据的偏斜方向以及偏斜程度。统计分布的边界特性采用上边界、下边界描述。

采用分布域定义算子,得到了在轨航天器局部平稳遥测数据的集中分布子域Mc、离散分布子域Md、形状分布子域Ms和边界分布子域Mb,共同构成分布域联合模型Mu,如图2。

在w统计窗宽为常值的情况下,得到tl×(c+h+s+b)维的特征。其中:tl表示遥测时序数据大小;前c层表示集中分布层(值为2);后h层表示离散分布层(值为2);后s层表示形状分布层(值为3);最后b层表示边界分布层(值为2)。融合4类特征值的多维特征向量模板最大化地表现了遥测数据的统计分布特征。

图2 多维特征向量模板构建

2.2 构建联合多分布域检测基准模型

为进行在轨航天器局部平稳遥测数据的异常检测,需要提取遥测正常样本参数,依照多维特征向量模板,建立局部平稳遥测参数的联合多分布域检测基准模型。联合多分布域检测基准模型,描述的是在轨航天器遥测样本参数的统计分布特性,由统计分布域的4类特征子域组成,其合适大小的统计窗口决定了遥测样本参数分布特性描述的合理性与准确性,因此,统计窗宽的合理设置成为检测基准模型构建的关键。

考虑在轨航天器遥测参数呈现一种以轨道周期为基准的起伏状态,因此,在选择统计窗宽时参考航天器轨道运行规律的影响,建立以轨道周期+时间间隔Δt为窗宽长度的方法。统计窗宽可描述为

W=Torbit+Δt

(2)

式(2)中:W为统计窗宽;Torbit为轨道周期;Δt为时间间隔。

对于当前时刻i,确定统计窗宽大小Wi后,其遥测样本数据的基本统计窗口为DI={xi,xi+1,…,xi+wi-1}。根据此统计窗口的样本数据,采用动态滑动窗模式,逐个构建检测基准模型下的统计集中分布子域模型Mc、离散分布子域模型Mh、形状分布子域模型Ms和边界分布子域模型Mb。在轨航天器遥测参数统计分布域子域检测基准模型通过的构建如表1。

考虑航天器局部平稳遥测参数发生异常时,其异变特性往往集中在遥测参数分布域的某一类或某几类特征中,通常表现出明显的异变幅值以及较长的异变时段。检测基准模型的完整构建必须根据实时检测过程中各分布特征的异变程度,对待检测遥测特征进行动态加权,对异变明显的分布域特征分配相对较大的权值,对异变不明显的分布域特征分配相对较小的权值,以增加异变特征在检测基准模型的影响力,增强区分度,提高模型检测的准确性,获取较精准的异变检测时刻。遥测参数统计分布域特征通过下式动态加权:

(3)

σ1=Q2+2×(Q2+Q3)+ε

(4)

式(4)中ε为常数,通常取0.5。

表1 统计分布域子域检测基准模型

2.3 局部平稳遥测异常检测

在轨航天器局部平稳遥测序列异常检测前,需要对序列中存在的采样间隔不等、实时遥测与延时遥测部分重复、噪声/野值干扰等问题,进行插值、重采样、滤波、去重等数据清洗工作,提高异常检测结果的准确性。接着,由于同一轨道周期窗宽内的连续周期类与连续非周期类遥测序列的统计分布特性不同,因此,需要对清洗后的遥测序列数据分类,区分连续周期类遥测序列与连续非周期类遥测序列。其中,非连续周期类统计分布特性值,随参数起始点位置的改变而变化;而连续周期类遥测参数,由于其周期特性,各统计分布特征值在同一轨道周期内保持固定不变,不会因参数起始点位置的变化而变化。因此需要依据2.1节中分类方法对清洗后的遥测时序数据进行数据分类,区分连续周期类遥测时序数据与连续非周期类遥测时序数据。

连续周期类局部平稳遥测时序数据,因其周期循环特性,各统计分布特征值在同一轨道周期内保持固定不变,待检测模型与检测基准模型为一对一关系,可直接进行异常检测。具体检测流程如下:

步骤1 建立待检测遥测序列的统计分布模型,即采用滑动窗模式,将遥测序列划定为一系列与检测基准模型统计窗宽相同大小的子序列,依次提取各子序列的集中分布子域模型、离散分布子域模型、形状分布子域模型和边界分布子域模型。

步骤2 逐一计算待检测子域模型与检测子域模型的距离残差di,得到距离残差序列Si={di1,di2,…,din},获取异变幅值最大值Ri_Max以及异变时长Li,并基于2Q准则,依据式(4),计算异常检测门限阈值,获取异常判定上限σi1。通过

计算各分布子域模型的待检测子域模型与检测子域模型的异常度yi,并通过

对异常度进行归一化处理,获取异变时长Li范围内的异常度序列Sai={ui1,ui2,…,uil},计算获取异常判定上限σi1时的异常度uiσ。

步骤3 通过式(3),计算各子域下的动态权值pi;通过式(5)求取综合异常度值mk;

(5)

通过

σz=pkc×uσc+pkd×uσd+pks×uσs+pkb×uσb

求取综合异常门限σz z。建立在轨航天器遥测时序数据联合多分布域动态检测基准模型M,见式(6)。

(6)

逐点求解动态检测基准模型的综合异常度的累积和,如果值超出σz,则计算停止,并判定该序列为异常序列,且当前时刻点为异常时刻点,否则继续求解,直至超出异变时长Li范围;如果值小于σz,则判定该序列为正常序列。

非连续周期类局部平稳遥测时序数据,随参数起始点位置的改变而变化,待检测模型与检测基准模型为多对一关系,因此需要提前进行模型匹配,寻找与当前起始点位置下遥测待检测模型相异度最小的检测基准模型,再根据待检测模型与最匹配联合多分布域动态检测基准模型的距离差进行异常检测,后续步骤与上述连续周期类局部平稳遥测异常检测步骤相同。

异常检测算法设计模型如图3所示。

图3 异常检测算法设计模型

2.4 检测基准模型动态加权

随着航天器的在轨运行,为了能满足遥测时序数据局部平稳条件,需要对检测基准模型进行动态加权,以满足遥测时序数据局部平稳条件。本文从在轨航天器遥测数据中寻找规律,采用数据驱动模式构建动态加权检测基准模型。在动态加权基准模型构建中,对当前遥测时序数据构建分布域模型,以及以往遥测时序数据(通常取前两次滑动数据窗)的基准模型进行加权。权重分配的原则是离当前时刻越远权重越小,越近权重越大。通过下式实现检测模板动态加权:

(7)

式(7)中:α为加权系数,通常取0到1之间的常数,即0<α<1;m为根据当前遥测时序数据构建的联合多分布域检测基准模型;mn-1,mn-2分别为前一次、前两次滑动数据窗下的检测基准模型。在检测基准模型检测结果正常的情况下,本文对当前遥测数据帧、前一次及前两次滑动数据帧共3部分信息进行动态加权,以更新检测基准模型,通过权重,设置对以往遥测数据的“记忆”长度来适应在轨航天器遥测数据序列的变化。

3 实验及结果分析

3.1 实验数据集及实验设置

实验硬件环境是Intel Core i3 3.30 GHz,内存3.37 Gb,操作系统为Windows XP,仿真软件为Matlab 2011a。为验证本文提出的融合多特征的在轨航天器局部平稳遥测加权分布异常检测方法的有效性,实验选取某型号在轨运行航天器的遥测传感器参数,即某运行时段551 s下540组传感器电压参数序列X1(t)和传感器电流参数序列X2(t),变化曲线如图4所示。

图4 参与测试的在轨航天器局部平稳遥测参数序列曲线

由图4可知:给定的遥测数据均为局部平稳序列,其中,传感器分流电压为连续周期类,传感器电流参数为连续非周期类,数据曲线均存在形态、幅值、趋势等异常信息。经数据整理、补点和洁化处理,消除间隔不等、局部重复和野值之后,从检测精度、虚警率等两方面进行实验对比。

实验分为两部分:实验1对比加权多分布特性与单一特征的异常检测算法;实验2对比动态加权参数的模型与未加权参数的模型。本节中的所有参数图横坐标为点序,纵坐标为归一化后的无量纲单位。

3.2 加权多分布特性、单一特征及多特征检测对比

实验1对比ADMF、统计分布域下各单一特征(Single Feature,SF)及多特征(Multi Feature,MF)。传感器电压参数和传感器电流参数统计分布域下不同分布子域特征模型如图5所示,其异常度如图6所示。其中,SF为统计分布域下单一特征的分布域异常检测,实验中取有普遍代表性的集中分布子域均值特征;MF是结合统计分布域集中特征、离散特征、形状特征和边界特征的分布域异常检测,这部分实验是为了突出多分布特征融合以及异常明显特征加权的优势。

ADMF,SF及MF在传感器电压参数和传感器电流参数上的异常检测结果如图7所示。在图4(a)传感器电压参数中,MF出现较大误差,异常检测结果不符合检测要求,SF异常检测结果次优,出现3次虚警。ADMF检测异常时刻点提前于报警时刻点,与实际吻合,且无虚警,检测结果最优。在图4(b)传感器电流参数中,MF出现1个点的检测误差和4次虚警,SF异常检测结果优,但异常识别度不足。ADMF检测结果与实际相符,且精度高,无虚警。因此,ADMF检测效果最好。

ADMF,SF 及MF 在传感器电压参数和传感器电流参数上的检测正确率和检测时间精度对比如表2所示,表中粗体代表精度最优,下划线代表精度次优。

由表2可知:ADMF由于基于多分布特征及对密集特征进行加权处理,在这2个序列上获得最优的检测效果,其检测精度与抑制虚警情况最优;在传感器电压参数中,ADMF的检测时刻点为267点,比多特征MF提前8个点,比SF虚警率提高6个百分点;在传感器电流参数中,ADMF的检测时刻点为268点,比多特征MF 虚警率提高5.9个百分点,比SF提前1个点。

图5 统计分布域下不同分布子域特征模型

图6 统计分布域下不同分布子域特征的异常度

图7 SF,MF及ADMF检测对比

遥测参数检测算法异常子序列编号异常时刻点序号虚警率/%x1(t)ADMFS2562670.00SFS2562676.11MFS2642751.67x2(t)ADMFS2572680.37SFS2582690.93MFS1125.93

3.3 动态加权模型参数分析

实验2通过对检测基准模型中加权系数α的动态设定,决定采用最新遥测数据帧的速率,体现在少量基于前两次自适应检测基准模型的基础上,更多地考虑当前帧信息进行加权的重要性,这样既保证检测基准模型的记忆连续性,又考虑到数据的复杂变化特性。这部分实验是为了分析本文采用的模型动态加权方式的合理性。

本实验及前面的两个对比实验中,自适应检测基准模型中α=0.6时的结果表示为ADMF1,也就是本文提出的检测基准模型动态加权算法。当α=1时,用当前遥测数据帧构建的目标模型取代自适应目标模型,在实验中表示为ADMF2。当α=0时,舍弃自适应检测基准模型中当前遥测数据帧构建的模型信息,在实验结果中表示为ADMF3。3种算法传感器电压参数和传感器电流参数上的检测结果如图8所示,图8中依次为ADMF1结果、ADMF2 结果以及ADMF3结果。在图8(a)中, ADMF1检测结果最优,异常时刻点为267点,无虚警;ADMF2检测结果次优,虚警率为2.59个百分点;ADMF3虚警率最高,为5.91个百分点。在图8(b)中,ADMF1、ADMF2检测结果基本一致,无虚警;ADMF3检测的虚警率为0.93个百分点。

ADMF1,ADMF2,ADMF3在传感器电压参数和传感器电流参数上的异常检测时刻点与虚警率的对比如表3所示,表中粗体代表误差最小,下划线代表误差次小。

表3 局部平稳遥测数据集的异常检测结果参数

由表3 可知:采用本文的检测基准模型动态加权方式在这2个序列上获得最优的检测效果,检测精度与抑制虚警情况最优;ADMF2在传感器电流参数序列的检测效果与ADMF1一致,在传感器电压参数序列的检测效果次优。ADMF3检测效果最次,虚警率最高。

3.4 实验结果分析ADMF,SF 及MF

从SF,MF及ADMF的异常检测对比可发现:MF检测效果明显优于SF,而ADMF检测正确率最高,表明ADMF在融合特征空间分布的多种特征信息,并且考虑异常明显特征的重要性后,取得较稳定的检测效果。

在检测基准模型动态加权参数设定分析的实验表明:本文既考虑到检测基准模型的连续性和稳定性,又考虑数据的变化特性,通过设置对以往遥测数据的“记忆”长度小部分基于以往检测基准模型的基础上,主要考虑当前帧的最新信息进行检测模型的动态加权是合理的,与其他加权方式相比获得相对较好的检测效果。

图8 ADMF异常检测

4 结论

1) 基于分布特性算子,提出结合统计分布的集中特性、离散特性、形状特性和边界特性等在轨航天器局部平稳遥测数据异常检测算法,通过分布特性算子对各个特征的描述,较全面地提取了遥测数据的统计分布特征信息。

2) 通过对异常表现不同的分布特征进行加权,突出异常变化明显特征在模型匹配中的作用,提高异常检测的准确率。同时,为适应局部平稳遥测数据的变化特性,采用数据驱动模式进行检测基准模型的动态加权,有效适应了复杂空间环境下航天器局部平稳遥测数据的变化需求。

3) 实验表明:本文算法不仅在数据的形态、幅值、趋势等方面具有良好地异常检测能力,而且能有效降低虚警率,提高检测准确性,可进行长时间有效的检测。

猜你喜欢

遥测航天器基准
2022 年第二季度航天器发射统计
前馈复合控制在提高遥测跟踪性能中的应用
浅谈机械制造加工中的基准
2019 年第二季度航天器发射统计
远程控制式遥测地面站关键技术研究
基于WPF的遥测CAS信息实时监控系统设计开发
自适应模糊PID控制的遥测方舱温度调节方法
2018 年第三季度航天器发射统计
2018年第二季度航天器发射统计
应如何确定行政处罚裁量基准