APP下载

智能手机检测车辆振动加速度数据预处理方法

2019-04-25从建力杨翠平李成辉

数据采集与处理 2019年2期
关键词:成份变化率信噪比

从建力 王 源 杨翠平 王 平 李成辉

(1.西南交通大学土木工程学院,成都,610031;2.西南交通大学高速铁路线路工程教育部重点实验室,成都,610031)

引 言

基于列车车体振动加速度来评估轨道平顺状态和车辆运行舒适性[1],对铁路线路养护维修来说是一种便捷、有效的方法,但这类评估方法对车体加速度数据的体量需求巨大。为了适应城市轨道交通、高速铁路的轨道平顺性评估,本文考虑借助智能手机作为感知终端[2],通过铁路职工的智能手机所测量得到的加速度数据,为铁路线路养护提供重要的数据源。相对于精密加速度传感器和添乘仪,使用手机测试车体振动响应的主要优点是不会影响行车安全和旅客乘车体验,并且成本低、数据体量巨大。

该项工作面临的主要问题是由于测试环境的复杂性、测量终端的流动性等原因导致智能手机所获取的数据存在较强的误差干扰,原因包括:(1)因手机后台运行多种App导致手机采样频率不稳定;(2)因乘客上下车和随意走动引起的偶然干扰;(3)因手机内置传感器信噪比低引起的随机误差。因此必须经过系统性的数据预处理才可发挥该类数据的价值。本文的主要工作即是针对智能手机测量数据,研究其数据清洗方法,以增强该类数据的实用价值。

合理剔除测量数据异常值是各工程领域遇到的问题,对于不能确定总体分布类型的数据,需做适当的数据变换使数据正态化[3]。为发挥数据价值,需对数据进行清洗[4-8],其过程一般包括两个方面:(1)异常值的识别定位,如设定阈值筛选异常值[9];(2)异常值的处理,如小波分析具有较好的信号降噪效果[10-11],中值滤波可剔除信号中较大误差[12-13]。智能手机传感数据可能的异常类型较多,而上述文献中采用单一的异常值识别和处理方法,无法直接满足手机检测数据清洗需求,需要研究系统性的数据异常识别-分类处理框架。

基于此,本文基于统计方法,根据不同的异常值产生原因,首先提出数据异常值识别方法:P值筛选、一阶变化率识别与小波分析3种方法相结合;进而提出对应的数据异常处理方法:区段删除、中值滤波、小波滤波3种处理方法相结合。实例分析表明,本文方法处理后的智能手机传感数据具有较稳定的时域、频域特性,可为评估轨道平顺状态和列车运行品质提供可靠的数据保障。

1 数据预处理模型

基于智能终端采集地铁车辆振动加速度时,为使数据能够服务于地铁系统,包括评价轨道平顺状态、车辆舒适性[14-16],需对手机检测数据进行质量分析。智能手机主要承担数据采集任务,添乘人员将检测数据及时上传至服务器,依靠服务器较大的存储空间和较快的计算速度进行数据预处理工作,具体内容包括:(1)因手机采样频率不稳定,需基于检测数据进行重采样得到等时间间隔数据序列;(2)受测试环境变化及传感器信噪比低等多种因素影响,手机检测数据含有随机误差,需对数据异常值进行识别与分类;(3)针对数据异常值进行分类处理;(4)数据清洗后应用分析。本文主要阐述前3部分,数据预处理流程如图1所示。

图1 数据预处理流程Fig.1 Data preprocessing process

2 数据重采样

因手机后台同时运行多种应用软件引起手机采样频率不稳定,其实际采样频率f在理论采样频率F上下变动,造成手机检测数据并不是等间隔时间序列。本文采用线性插值法对手机检测原生数据进行重新采样,生成等间隔时间序列,采样原理示意图如图2所示。

图2 线性插值示意图Fig.2 Linear interpolation diagrammatic sketch

等间隔时间序列计算公式如下

式中:yi'为原生数据 i位 置插值后数值;xi,xi+1为原生数据 i,i+1 位置数值;ti,ti+1为原生数据 i,i+1位置数据采集时刻;ti'为理论采样频率F下i位置处数据采集时刻。

3 异常值识别与分类

因手机检测数据中的异常值是由多种原因引起的,本文基于P值筛选识别出的数据异常值定义为第一类异常值;基于检测数据一阶变化率并结合“3σ准则”识别超出设定阈值的数据定义为第二类异常值;基于小波分析分解因传感器信噪比低引起的随机误差定义为第三类异常值。上述异常值识别方法描述如下:

(1)P值筛选:设置数据始端至末端的移动窗口长度为N,通过设定阈值T并计算移动窗口中超出阈值T范围的概率P,其公式如下

式中:n为窗口元素xi超出阈值T的个数;N为移动窗口长度;P0为自定义概率常数。xi'为1时表示手机检测数据属于第一类异常值。

(2)一阶变化率识别:根据手机检测数据一阶变化率并结合“3σ准则”将超出阈值的一阶变化率视为异常值。其一阶变化率计算公式如下

式中:xi,xi+1为 i,i+1 位置的手机检测数据;ti,ti+1为相应手机检测数据时间;yi为 i位置处一阶变化率值。

根据“3σ准则”设置一阶变化率超限阈值,其阈值范围可表示为

式中:μ为一阶变化率均值;σ为一阶变化率标准差;yi为i位置一阶变化率值;N1为数据一阶变化率长度。

由于手机检测数据受测试环境影响,手机检测数据局部会发生突变,表现为一阶变化率幅值超限。为了避免将幅值较大的手机检测有效数据识别为异常值,当手机检测数据一阶变化率满足式(5)时,可保证手机检测数据具有较高可信度(99.74%)。由式(8)识别一阶变化率超限位置。

式中yi'为1时表示i位置处手机检测数据为第二类异常值。

(3)因手机加速度传感器信噪比低引起的随机误差,该类随机误差识别方法如下:根据手机采样频率F确定小波分解层数n,将手机检测信号分解为低频成分和细节成分,这里的细节成分包含因手机加速度传感器信噪比低引起的成分。由于在时域分析中离散傅里叶变换没有局部化能力,而小波分析可对时域信号局部信息进行分解,这里借鉴小波分析具有的局部化能力,对手机检测数据局部波动较大位置进行多层分解。小波尺度a和平移t是基小波两个重要参数,这里选择经典小波尺度a=2,t为手机采样间隔Δt  ,便可得出小波分解过程中每层对应的中心频率fc,其计算公式如下

式中:F为手机标准采样频率;n为小波分解层数。

手机检测数据可视为离散数据信号,且信号能量有限,即

式中:L2(R)为R上平方可积函数构成的函数空间;Wx为信号能量且有限。

这里选择基小波ψa,b(t)(a=2,b=Δt),将基小波经过伸缩和平移后,就可以得到一个小波序列,即

将基小波ψ2,Δt(t)与手机检测数据进行卷积实现分解

式中:xi为长度N的离散随机信号;xi,ψ2,Δt为xi与 ψ2,Δt的内积。

4 异常值处理

本文根据3种类型异常值的分布特征,确定了相对应的异常值处理方法,具体如下:

(1)第一类异常值幅值波动较大,波动个数与窗口元素个数比例P超出设定阈值P0,且幅值远远超出车体正常振动加速度范围,这是受明显干扰因素影响的数据,不能真实反映车体振动响应,采取区段删除方法直接剔除。

(2)第二类异常值幅值波动较小,该类异常值含有车体振动响应有效成份,可采取中值滤波方法滤除该类型异常值对车体振动响应的影响,其原理描述如下:该方法需提前设置长度为N(奇数)的移动窗口,以异常值所在位置为窗口中心位置,将窗口内手机检测数据按升序或降序重新排列,用产生的新序列数据的中值元素代替异常值,可表示为

式中:xi为移动窗口内i位置对应的元素;xi-(N-1)/2,xi+(N-1)/2为移动窗口两端元素;median表示取移动窗口中值元素;xi'为窗口元素重新排序后的中值元素。

(3)本文采用小波滤波去除因手机加速度传感器信噪比低引起的随机误差,其步骤为:首先选择合适的小波函数进行分解计算;接着选择半软阈值函数对各个分解尺度下的细节成份进行阈值量化处理;最后将小波分解的最低层低频系数和阈值量化处理后的各层细节成份进行重构,其基本原理数学描述如下。

半软阈值函数

式中:sgn为阶跃函数;w为高频系数;I为两数取小;T1,T2为常数,且 0<T1<T2。当 w>0,sgn=1;w=0,sgn=0;w<0,sgn=-1。

由小波重构基本关系式Vn-1=Vn⊕Wn可知

式中:xn-1为第n-1层待重构信号;xin为已完成小波重构的第n层低频系数;di

n为已完成小波重构的第n层高频系数;φni(t)为尺度函数;ψni(t)为小波基函数。

5 实例分析

5.1 现场实测数据

本试验测试路线为成都地铁1号线火车北站至高新站,共12个车站,11个区段,将智能手机放置在相对稳定的车厢地板上采集车体振动响应,依据文献[14,16]确定手机安放位置,手机标准采样频率为100 Hz,手机检测数据如图 3(a)所示。

结合现场测试情况可知,因手机测试开始和结束时,测试人员触碰手机点击“启动测试”和“关闭测试”,数据始端和末端出现较大波动;在测试过程中受乘客上下车和随意走动影响,手机检测数据局部出现较多“毛刺”,为观察数据局部细节,对260~500 s区间手机检测数据进行局部放大,如图3(b)所示。

5.2 数据重采样

手机标准采样频率100 Hz,对应的标准采样间隔为10 ms,但实际采样间隔的统计结果显示:智能手机采样时间间隔在区间[0,11),[11,21)ms所占比例分别为51%和48%,其他占1%(剔除),如图4所示。对手机原生数据采取线性插值法进行数据重采样,可得均匀时间序列,如图5所示。

图4 手机采样间隔区间统计结果Fig.4 Statistical results of phone sampling interval

图5 手机检测数据(插值后)Fig.5 Phone detection data(interpolation)

5.3 异常值识别

(1)根据上述异常值识别方法,首先基于P值筛选识别第一类异常值,设置了窗口长度N=100,手机横向加速度阈值Tx=0.7 m/s2,纵向加速度阈值Ty=1.25 m/s2,垂向加速度阈值Tz=1.6 m/s2,P0取为10%,则手机第一类异常值位置如图6中蓝色区域(幅值为1位置)。

(2)依据“3σ准则”识别手机检测数据一阶变化率超限位置,手机第二类异常值分布位置如图6中红色部分(幅值为0.5位置)。

(3)针对手机加速度传感器信噪比低引起的随机误差,依据小波分析将手机检测数据分解为低频成份和细节成份,基于手机采样频率100 Hz和影响人体舒适度的频率范围0.5~80 Hz确定分解层数n=8,选择尺度大小为2的Daubechies小波作为基小波,以手机垂向加速度为例,第7层、第8层细节成份幅值较小包含随机误差,其分解效果如图7所示。

图6 手机检测数据异常值分布位置Fig.6 Distribution of abnormal value of mobile phone detection data

5.4 异常值处理

(1)根据第4节异常值处理方法,因手机检测数据第一类异常值严重“失真”,采取区段删除将手机检测数据第一类异常值予以剔除,如图8所示。

图7 手机检测数据小波分解Fig.7 Wavelet decomposition of mobile phone detection data

(2)针对手机检测数据第二类异常值,其含有车体振动响应有效成份,将识别出的第二类异常值采用中值滤波依次处理,设置移动窗口N=5,其滤除效果如图9所示。

图8 剔除第一类异常值后手机检测数据Fig.8 Detection data after eliminating the first kind of abnormal value

图9 剔除第二类异常值后手机检测数据Fig.9 Detection data after eliminating the second kind of abnormal values

(3)根据第4节小波去噪原理,设置半软阈值将细节成份进行阈值量化,将随机误差成份滤除而保留手机检测数据有效成份,并将低频成分和细节成份逐层卷积求和实现重构,其处理效果如图10所示。

对比滤波前后手机检测数据局部细节,选取图8,图10中第一个运行区间[0,108]s手机检测数据,如图11所示,经中值滤波和小波滤波后,数据“毛刺”和随机误差被剔除。

图10 小波分析滤波后手机检测数据Fig.10 Mobile phone detection data after wavelet analysis filtering

图11 小波分析滤波后局部手机数据对比Fig.11 Comparison of local mobile phone data after wavelet analysis filtering

6 结束语

因手机检测数据异常值由多种原因引起,本文设置了相适应的异常值识别方法,可准确地识别出3种类型异常值的分布位置。同时为更好地滤除不同类型异常值,设置了相对应的剔除方法,为正确评价轨道平顺状态和车辆运行舒适性提供数据保障。本文研究可得以下结论:

(1)通过设置移动窗口N=100,设置横向、纵向、垂向加速度阈值,当P>P0可定义为第一类异常值;将手机检测数据一阶变化率结合“3σ准则”,若yi>μ+3σ或yi<μ-3σ可定义为第二类异常值;基于小波分析将手机检测数据分解为低频成份和细节成份,其中幅值较小的细节成份含有因传感器信噪比低引起的随机误差。

(2)提出了3种异常值适应性剔除方法:因手机受较大干扰引起第一类异常值,可予以剔除;因手机测试过程中偶然干扰引起第二类异常值,其含有车体振动有效成份,基于中值滤波滤除第二类异常值;因传感器信噪比低引起的随机误差可基于小波滤除。

(3)可实现高频次检测车体振动响应,弥补轨检车检测周期较长的不足。

猜你喜欢

成份变化率信噪比
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
基于电流变化率的交流滤波器失谐元件在线辨识方法
例谈中考题中的变化率问题
基于深度学习的无人机数据链信噪比估计算法
绩优指数成份变更与一周表现
两市主要成份指数中期成份股调整
Variational Mode Decomposition for Rotating Machinery Condition Monitoring Using Vibration Signals
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
相位差变化率的快速高精度测量及精度分析
不同信噪比下的被动相控阵雷达比幅测角方法研究