APP下载

一种基于小波包和PCA 的超声缺陷识别方法

2019-02-12万陶磊常俊杰曾雪峰钟海鹰陈志恒

失效分析与预防 2019年3期
关键词:波包特征值时域

万陶磊 ,常俊杰 ,2,*,曾雪峰 ,钟海鹰 ,陈志恒

(1.无损检测技术教育部重点实验室(南昌航空大学),南昌 330063;2.日本探头株式会社,日本横滨 2 320033)

0 前言

板状结构广泛应用于建筑、航空等重要领域。但板状结构在加工成形的过程中容易产生缺陷,为了避免发生安全事故,及时检测出薄板结构中的缺陷,并对缺陷进行分析就显得尤为重要[1]。超声兰姆波由于具有传播速率快、衰减小和检测距离远等优点,已经在板状结构的检测和评估中得到了广泛的应用。目前,对缺陷进行定位和定量的方法已经发展的比较成熟,然而对缺陷的类型进行识别的分析还没有获得满意的研究成果。如何准确提取缺陷信号的特征量决定了缺陷类型识别的结果[2]。根据接收信号在时域的幅值大小信息虽然能够判断缺陷的存在,但是获得的特征信息非常有限,为了获得更多缺陷信号的特征信息来提高缺陷识别率,对信号进行频域分析也是非常有必要的[3]。

针对特征量的提取,相关学者做了大量的研究。戴波等[4]提取A 扫描数据作为特征量,并结合向量机对管道的缺陷进行了有效的识别;郑善朴等[5]提取了缺陷信号的波峰时刻和幅值作为特征量,识别了不同类型的脱粘缺陷;李娟等[6]将信号进行EMD 经验模态分解后提取了IMF 分量信号的最大幅值、中心频率和信号能量作为特征量进行缺陷的识别,取得了较好的效果;杨琳瑜等[7]对信号进行小波包变换,从近似系数及细节系数提取样本的特征量对复合材料进行缺陷识别,并证明了该方法能够进行有效分类。

本研究提出一种基于小波包分解和主成分分析的方法对缺陷类型进行识别。以铝板为例,使用空气耦合超声技术在铝板中激励A0 模态兰姆波进行实验,提取时域信号中的峰度系数、偏度系数和离散系数共3个时域无量纲特征参数;提取信号进行小波包分解后的各频段能量占比作为频域特征量组成多维联合特征向量集;结合PCA 对联合特征向量进行降维处理[8],以累计贡献率达到95%及以上的特征值个数选取主成分个数,得到融合特征量;最后将融合特征量输入BP 神经网络系统进行缺陷类型的分类,实现了对缺陷类型的识别。

1 主成分分析理论

主成分分析(PCA)[9-11]是将原数据进行重组,得到一组新的互不相关且相互独立的数据,来达到以较少的数据表现原数据特征信息的目的。对于一组有N个指标的数据组,进行主成分分析后利用新的组合形式表征原数据组合。在所有的线性组合中选取方差Var(N)最大的组合称为第一主成分,记为Q1;当主成分Q1 不足以表征原数据信息时,选取新的组合形式来补充表征原数据信息,称为第二主成分Q2。Q2 不应与Q1 的信息重合,Q1 与Q2 满足COV(Q1,Q2)=0,依次类推直到主成分个数能够表征原信息特征。PCA 分析步骤如下:

1)假设有一组样本记为K,首先对样本进行标准化处理得到标准化样本矩阵R。

2)计算标准化样本的相关系数矩阵B:

3)设特征值为λ,则可以计算出相关系数矩阵B的特征方程,由特征方程可以得到m个特征根。

根据计算出的特征值λi(i=1,2,3,…,m),可得到单位特征向量P1,P2,P3,…,Pm。

主成分个数的选取根据主成分累计贡献率来确定,对各主成分组合确定的数据矩阵及其矩阵的转置矩阵,求出其协方差矩阵V及其特征值。主成分贡献率Ai、累计贡献率Ci可由式(4)、式(5)确定。

其中,m为确定的主成分组合个数,当主成分累计贡献率大于90%时,可认为前P个主成分组合包括了原数据的大部分特征信息。

2 缺陷信号特征量的提取

2.1 时域特征量的提取

由于超声兰姆波信号在薄板中传播时遇到不同类型的缺陷会在时域与频域中产生差异,所以缺陷信号的时域特征仍然值得关注。在此选择信号的峰度系数、偏度系数和离散系数共3个时域无量纲特征参数[12]来表征缺陷信号在时域的特征。

峰度系数(Ku):

偏度系数(Sk):

离散系数(v):

其中:N为波形信号数据点的个数,Fj为波形信号在j处的幅值,为波形信号的平均幅值。

2.2 小波包能量特征值的提取

小波包分解是一种使用小波基为基底信号将信号f(t)表示为小波函数线性组合的方法。Mallet 在多分辨率分析的基础上提出了正交小波变换分解与重构的快速算法:信号f(t)的N层小波包分解是将信号以尺度N变换到空间L2=(R)的2个正交子空间VN与WN上,由VN得到离散近似值cAN,由WN得到离散近似值cDN,下一层以尺度N+1 继续将cAN分解到子空间VN+1和WN+1,不断分解下去,进行多分辨率分解。

由于小波包分解不仅能够对信号分解后的低频分解系数进行分解,还能够对信号分解后的高频系数进行再分解,得到更精确的频谱成分,提供不同频段上信号的构成信息。所以不同类型的缺陷信号经小波包分解后,在各频带的能量分布是不同的。针对不同类型的缺陷信号,对不同频率段的能量分布进行数值量化可以作为表征缺陷信息的特征[13-14]。

假设对缺陷信号进行7 层小波包分解,可以将信号频率范围分解成128个频段。当前N个频段为信号能量分布的有效频段时,计算出小波包分解后第7 层前N个频率段中每个频段的能量值所占第7 层前N个频段总能量的比值,即可得到一个N维矩阵LN=(b1,b2,b3,…,bN)作为信号在频域内的特征量。

式中:xi(i=1,2,3,…,N)为小波包分解后第7 层中第i个频段的能量,A7为小波包分解后第7 层前N个频段的总能量值。

3 缺陷分类实验

3.1 缺陷信号的采集

试验装置由JPR-600C 高功率信号发射接收器、外置信号放大器、电脑、扫查架、数据采集卡、铝板和空气耦合超声探头组成,其中空气耦合超声探头中心频率为400 kHz,晶片尺寸为14 mm×20 mm,采样频率设置为5 MHz,采样数据点为1 001个。铝板厚度为2 mm,在铝板上分别设置10 mm×5 mm 的长方形凹窄槽(缺陷1)、直径5 mm的圆形孔洞(缺陷2)和10 mm×10 mm 的方形孔洞缺陷(缺陷3)。

实验使用空气耦合超声探头在铝板中激励A0 模态兰姆波进行缺陷的检测。由Disperse 软件计算得到厚度为2 mm 铝板的频散曲线可知,当频率为0.4 MHz 时A0 模态对应的相速度为2 200 m/s。根据Snell 定理(式10),得到空气耦合超声发射探头与接收探头的角度为8.8°。

式中,θ为声波入射角度,c为空气中的声速,cp为相速度。实验采用如图1 所示的透射回波检测方式,将探头在铝板同侧对向设置。

图1 空气耦合超声探头设置方式Fig.1 Method of setting air-coupled ultrasonic probe

使用信号发射接收器发射电压为180 V(峰峰值)、周期数为7 的矩形脉冲波激励空气耦合超声探头。空气耦合超声探头在无缺陷区域以及3种不同类型的缺陷区域进行实验,接收到的波形如图2 所示。

由图2 可知,有缺陷区域接收到的兰姆波信号比无缺陷区域接收到的兰姆波信号的幅值明显小很多,这充分说明空气耦合超声兰姆波能够检测出薄板中的缺陷。对比3种类型缺陷的兰姆波信号,从时域幅值方面来说无明显区别,不足以对缺陷类型进行识别,所以需要对缺陷信号从时域和频域进行更多的特征量提取。

3.2 时频域特征值的提取

针对无缺陷及3种类型缺陷情况,根据式(6)~式(8)提取时域信号的3个时域无量纲特征参数进行计算,部分计算结果如表1 所示。

使用db9 小波基对无缺陷和3种缺陷信号进行小波包7 层分解,分解后可得到128个频段,提取第7 层中前30个频段的能量值,并由式(9)计算出每个频段所占总能量的比值作为缺陷信号在频域内的特征量。4种信号经过小波包7 层分解后前30个频段的能量占比分布如图3 所示。

图2 无缺陷区域接收信号及3种类型的缺陷信号Fig.2 No defect signal and three different types of defect signals

表1 4种信号的特征参数Table 1 Characteristic parameters of the four signals

从图3 可知,4种信号在前30个频段内的能量分布明显存在差异,说明频段能量分布可以作为区分缺陷类型的特征量。根据对缺陷信号提取的时、频域特征量,每个信号最终可以得到33个特征量。对此采集200个样本信号(无缺陷信号和3种缺陷信号各50个)进行同样的时、频域特征量提取,最后可以得到一组200×33 的联合特征量矩阵。为了提高数据的分析效率以及降低数据信号的冗余度,使用PCA 主成分分析的方法对联合特征量矩阵进行降维处理得到融合特征量。首先,根据式(1)将数据标准化预处理;然后,根据式(2)~式(5)分别计算出相关系数矩阵、特征值、对应的特征向量、特征贡献率和特征累计贡献率;最后,将其全部特征值按由大到小的顺序依次排列,并根据特征值累计贡献率大于95%的特征值个数确定降维后的矩阵维度。200×33 的矩阵经过PCA 处理后共可得到33个特征值,其前4个特征值及其贡献率和累计贡献率如表2 所示。

从图4 所示的特征值贡献率可知,随着主成分特征值数量的增加其特征贡献率越来越低,这说明各个主成分特征值能够表征4种信号特征的能力越来越低。为了避免信息冗杂,提高信号类型识别率,且根据图5 所示的特征值累计贡献率可知,当特征值的数量达到2个时,其累计贡献率就已经达到了95%,所以前2个特征值就已经能够表征4种类型信号的大部分信息,所以选取前2个特征值可得到一个200×2 的融合特征量矩阵。

3.3 结果分析

针对200 组数据进行PCA 降维后获得的融合特征量,以及未经PCA 处理的联合特征量,分别取4种类型的样本信号各30个组成训练样本,剩下的80 组(各20个)样本组成测试样本。将缺陷1~3 和无缺陷共4种类型的信号融合特征量进行类型的编码,4种类型的编码分别为1000、0100、0010 和0001。

图3 信号能量分布直方图Fig.3 Histogram of energy distribution

表2 前4个主成分特征值Table 2 Characteristic values of the first 4 principal components

图4 特征值贡献率Fig.4 Contribution rate of eigenvalue

图5 特征值累计贡献率Fig.5 Cumulative contribution rate of characteristic values

将样本归一化后输入BP 神经网络进行训练和识别。本研究构建的BP 神经网络的具体结构为:输入层、隐含层及输出层[15],包括的神经元个数分别为2、20、4。选取Log-sigmoid 作为神经网络传递函数,训练次数设为3 000 次,训练误差值为0.03。经过多次神经网络训练后,未经PCA 处理的联合特征量经过277 步训练达到了性能参数要求,经过PCA 处理后的融合特征量经过92 步训练就已经达到了参数要求,收敛结果如图6 所示。将训练后神经网络输出的编码结果与预先设定的类型编码结果进行对比,得到的分类测试结果如表3 所示。

图6 测试结果收敛图对比Fig.6 Comparison of convergence diagram of test results

表3 4种信号的分类结果Table 3 Classification results of the four signals

由表3 可知,选取时域无量纲参数以及提取小波包分解后的频段能量分布值作为识别缺陷信号特征量的方法是可行的,且经过PCA 处理后BP 神经网络对缺陷信号的识别率明显得到了提高。

4 结论

1)时域无量纲参数和小波包分解后的频段能量占比能够作为表征信号特点的特征量。

2)通过构造特征向量结合BP 神经网络可以对缺陷的类型进行识别。

3)对经过PCA 降维后的特征量与未经过PCA 降维的特征量进行分类测试,前者能够有效提高分类测试结果的准确率。

猜你喜欢

波包特征值时域
一类内部具有不连续性的不定Strum-Liouville算子的非实特征值问题
一类带强制位势的p-Laplace特征值问题
基于支持向量机和小波包变换的EOG信号睡眠分期
基于一类特殊特征值集的扩散算子逆谱问题
单圈图关联矩阵的特征值
基于小波包分解和K最近邻算法的轴承故障诊断方法
基于复杂网络理论的作战计划时域协同方法研究
山区钢桁梁斜拉桥施工期抖振时域分析
一种用于高速公路探地雷达的新型时域超宽带TEM喇叭天线
背景和共振响应的时域划分及模态耦合简化分析