APP下载

应用变分模态分解和随机森林特征选择算法的扬声器异常声分类

2022-10-27周静雷

振动与冲击 2022年20期
关键词:子集特征选择扬声器

周静雷, 周 智, 崔 琳

(西安工程大学 电子信息学院,西安 710600)

扬声器被广泛的应用在手机、耳机、智能音箱、家庭影院、笔记本电脑等设备上,其品质的好坏直接决定人们的音效体验。因此无论在扬声器的研发、制样及生产环节,都需要对扬声器进行异常声检测。有无异常声已是扬声器的关键必检特性之一。而检测的准确性、时效性和自动化,对于扬声器生产而言,具有重要意义[1]。

扬声器异常声检测一般由激励及响应捕捉、响应信号的特征提取、特征选择以及分类构成。由于扬声器的异常声信号是非线性非平稳信号[2]。对于此类信号,一般采用时频域分析的方法,以提取最佳的信号特征[3]。特征提取的方法主要有高阶谐波失真(high-order harmonic distor-tion)[4]、短时傅里叶变换(short-time Fourier transform,STFT)[5]、小波包分解(wavelet packet decomposition,WPD)[6]、经验模态分解(empirical mode decomposition,EMD)[7]。高阶谐波失真提取法需要有经验的工程师设置合理的门限;STFT分辨率单一,依赖选择的窗函数,缺乏自适应性[8];WPD虽然可以同时分解低频与高频信号,但是其受小波函数、信号采样频率等影响,存在能量泄露问题[9];EMD分解具有良好的自适应性,但是易出现模态混叠和端点效应[10]。VMD分解[11]相比EMD,有更好的抗模态混叠和降噪性能[12]。VMD分解被广泛的应用在机械故障诊断[13]以及心音信号[14]处理,本论文在文献[15]的研究基础上,着重讨论特征选择及不同分类方法在异常声检测中的应用。

特征选择[16]是为了筛选出最有效的特征、降低特征空间维数以达到最高的分类精度。依据评价方式,可分为过滤式(Filter)和封装式(Wrapper)[17]两种。Filter式采用某种评价准则或搜索策略进行特征子集选择,计算效率比较高[18],但不能与具体的分类器结合,特征子集的冗余较高、分类效果较差;Wrapper式则直接以分类性能的好坏作为特征子集的评价标准,在合理的学习算法中得到的较好的特征子集和分类性能[19]。随机森林(random forest,RF)是一种典型的Wrapper式特征选择算法,其内置了特征重要性评价机制,在高效特征选择的同时,还能保持着较好的选择效果。为了选取最优的特征选择效果,提出了基于随机森林结合递归特征消除[20](random forest and recursive feature elimination,RF-RFE)的特征选择算法。

扬声器异常声检测中,通常采用特征距离公式、BP神经网络[21]、支持向量机(support vector machine,SVM)[22]等方法对异常声进行分类。但是特征距离公式通常只能检测出是否有异常声,不能判断异常声的类别;SVM虽然可以进行多分类,但其依赖选择的核函数,消耗时间较长。RF是一种集成模型,相比SVM有着更强的鲁棒性和分类效果,适用于多分类问题,本文选用RF作为分类器。

为了更好提取扬声器异常声最佳的信号特征、有效提高诊断系统分类性能,本文提出了基于VMD与RF-RFE的扬声器异常声分类方法。首先,对扬声器单元的声响应信号进行VMD预分解,根据中心频率相近法确定VMD分解后的模态K的个数,之后以确定的K值对扬声器单元声响应信号进行VMD分解,提取每个模态的时、频域特征构成原始特征数据集;其次使用RF-RFE模型对原始特征集进行特征选择,确定最优特征个数以及最优特征子集;最后将得到的最优特征子集输入至RF算法中进行判断,输出分类结果。试验表明本文提出的方法能够有效地诊断扬声器的故障类型。

1 基于VMD的特征提取

1.1 VMD基本原理

VMD以各模态带宽最小和原则,采用非递归方式搜寻变分模型最优解。其实质为如式(1)所示的变分约束问题的求解

(1)

其具体求解步骤为:

步骤2更新迭代次数n=n+1;

步骤3fork=1∶K

(2)

(3)

步骤4采用对偶上升法,更新

(4)

式中:n+1为迭代次数;τ为噪声容限,一般情况下τ=0。

步骤5重复步骤1~步骤4,直到满足收敛条件

(5)

式中,ε为收敛精度,大小通常为10-6。

1.2 特征提取

VMD分解之后,分别求得各模态波形因子(Es)(X1)、波峰因子(Ec)(X2)、脉冲因子(Ed)(X3)、最大值(X4)、平均值(X5)、标准差(X6)、均方根值(X7)、方差(X8)、最小值(X9)、峰峰值(X10)、均方幅值(X11)、平均幅值(X12)、峭度(Eku)(X13)、偏度(Esk)(X14)、能量熵(Eentropy)(X15)、排列熵[23](X16)、过零点数(X17)、VMD分解中心频率(X18)以及VMD-Hilbert时频熵(Et)(X19)构成原始的特征向量。对长度为N的模态分量ui,部分特征的计算公式为

(6)

(7)

(8)

(9)

(10)

(11)

(12)

2 基于随机森林的特征选择算法

2.1 随机森林基本原理

随机森林是一种集成算法,由多颗子树构成,每一颗子树均通过Bootstrap抽样方法产生,每一颗子树的分布相同且独立,最后由分类树投票的多少决定新数据的分类。随机森林算法不仅具有模型简单、分类效果好的特点,同时其鲁棒性强,不易过拟合,因此被广泛的应用在各种分类、预测以及特征选择等相关问题当中[24]。

2.2 随机森林特征选择算法

利用RF-RFE进行特征选择包含特征重要性计算和递归特征消除两个部分。特征重要性计算是RF内嵌的功能,以袋外(out-of-bag,OOB)数据分类准确率的变量为评价准则。

假设有bootstrap样本k=1,2,…,K,K表示训练样本的个数,每个样本有N个特征,特征重要性排序的计算步骤如下:

步骤1初始化k=1,创建决策树Tk;

步骤4对于k=2,3,…,K重复步骤1~步骤3。

步骤5特征Xj的重要性度量Pj通过式(13)计算

(13)

步骤6对Pj降序排列,得到特征重要性排序。

将排序好的特征输入至递归特征消除算法中,反复构建模型,选出得分最高的特征放到最优特征子集中,之后剩余的特征重复上述过程,直到遍历所有特征后停止,最终得到最佳的特征数量和最优的特征子集。

3 扬声器异常声分类

本文提出的分类方法分为 VMD信号分解及特征提取、基于 RF-RFE的特征选择和基于RF的分类 3个阶段,如图1所示。

第一阶段,对采集到的扬声器响应信号进行VMD分解,得到K个模态分量,分别提取每个模态的时域及频域特征,构成原始的特征数据集;

第二阶段,将原始的特征数据集输入至RF中,得到特征重要性排序,再通过RFE得到最佳的特征数量和最优的特征子集,将特征子集划分为训练样本和测试样本;

第三阶段,使用训练样本集训练RF分类器,之后使用测试样本集对训练所得的RF模型进行测试,最后输出分类结果。

4 试验分析

4.1 试验数据采集

试验采用谐振频率为180 Hz的3580-3型彩电扬声器单元,阻抗为6 Ω,额定功率为10 W,该型号扬声器异常声多发于低频段,扬声器单元在其谐振频率的附近振幅将达到最大,更容易激发出潜在的异常声。在进行扬声器单元测量时,使用高频到低频的扫描方式可以有效减少其稳定时间[25]。因此,本次试验采用1 800~20 Hz的连续对数扫频信号,其时域图如图2所示,由高频到低频的扫描方式激励被测扬声器单元,激励时长为1 s,激励电压为1 V。本次试验所采用的平台如图3所示。

本次试验共测试了良品、异物、缺胶、碰圈、脱盆架、音小、纸盆声7种状态下的扬声器单元,每种状态下的扬声器单元各14个。其中异物指扬声器单元中存在铁屑等松散颗粒,缺胶指防尘帽或压边缺胶,碰圈指音圈变形或支架不平导致与磁体发生碰撞,脱盆架指盆架安装松动,音小指支片沾有胶水或者磁钢未充磁,纸盆声指纸盆破裂变形等。对上述七种扬声器单元状态,分别贴标签为1、2、3、4、5、6、7。对每个扬声器单元进行5次测试,减小随机信号对数据影响的同时也增加了样本的数量。

4.2 VMD分解

本试验中所用消声箱体积较小,在低频段,箱内声场接近压力场,如图4、图5分别为合格扬声器在自由场和消音箱条件下声响应信号的频域图,采样时间为1 s,采样频率为44.1 kHz。对扬声器信号进行VMD分解前需要确定模态数K。本文采用观察中心频率法来确定K值,不同K值的中心频率如表1所示。

表1 不同K值对应的中心频率Tab.1 Center frequency corresponding to different K values

当K=7时,出现中心频率为1 204 Hz和1 300 Hz两个模态,认为其中心频率较近,出现过分解。因此选择K=6,同时α设定为2 000,此时可以取得理想的分解效果。如图6、图7分别为VMD分解所得的扬声器在不同状态中各模态的时域和频域图。

由图6、图7可以看出, VMD分解不仅能将合格扬声器单元的声响应信号分解到各个频带中,同时也能将各种异常扬声器单元的声响应信号分解到各个频带中,每一个频带对应着一个模态分量,并且各频带的频率中心未出现交叉和过分解,且不存在混叠现象,充分体现出VMD分解的优势。

4.3 特征选择

针对上述7种扬声器声响应信号,将其分解为6个模态分量,分别提取每个模态的X1-X18特征,以及VMD-Hilbert变换后的X19特征。由此得到109维原始特征向量,维数较高,可能存在冗余特征,影响后续分类结果,因此利用RF-RFE模型对其进行特征选择,筛选出具有较高鉴别力的特征。由于RF中受决策树数量(T)、树的最大深度(D)、每棵树每个节点分裂所需最小样本数(S)影响较大,因此首先使用随机搜索策略[26]对其进行寻优,寻优范围及结果如表2所示。

表2 随机森林参数优化Tab.2 Random forest parameter optimization

将原始特征向量输入至调参后的RF-RFE模型中,采用十折交叉验证法,从当前的109个特征中修剪最不重要的特征。在修剪的集合上递归地重复该过程,直到最终到达所需特征的数量,在交叉验证中得到最佳特征的数量如图8所示,最优特征子集重要性排序如图9所示。

由图8可得出最佳的特征数量为22个,相比较原始特征集减少了87个特征,得到最优特征子集重要性排序如图9所示,其中u6X15表示模态u6的特征X15。由图9可得,所筛选出的22个特征重要性之和为0.554(所有特征重要性和为1),说明此特征选择的方法不仅极大程度减少了特征数量、去除了冗余特征,同时所筛选出的特征鉴别能力也较强。

4.4 分类试验

将选择好的最优特征数据集输入至RF算法中进行分类识别。在分类试验中,将最优特征数据集随机分为5i(1≤i≤5)份,其中第i份为测试集,其余4份为训练集,将5次结果取平均值作为最后测试结果,结果如表3~表5所示。这样可以有效减少测试集、训练集选取不同样本带来的误差,使得结果更为真实有效。

表3 随机森林分类混淆矩阵Tab.3 Random forest classification confusion matrix

混淆矩阵[27]描绘了各测试样本数据的真实属性和预测结果之间的关系,可以用于评价分类算法的性能,如表3为随机森林分类准确率的混淆矩阵,其第一行为实际类别,第一列为预测类别。由表看出异物与脱盆架的识别率达到100%,良品识别率为99.06%,同时可以计算出平均识别率为98.61%,说明该方法分类效果好,同时具有更好的特征区分度。

同时为了说明本文方法的优势,进行了对比试验。对7种扬声器单元进行WPD分解;分解之后对每个子带提取特征后进行特征选择;最后使用RF、Adaboost及SVM进行分类试验,分类结果如表4所示。

表4 不同分解方法及不同分类器结果对比Tab.4 Comparison of different decomposition methods and results of different classifiers

表5 特征选择方法对比Tab.5 Comparison of feature selection methods

由3个分类器的平均分类准确率可以看出,经VMD分解后,分类效果要优于WPD,说明VMD分解算法能将非平稳的复杂信号较好地分离开,避免了能量泄露和端点效应。在分类器方面,RF分类效果要优于Adaboost和SVM,说明了RF分类效果好,抗噪能力强。

RF-RFE与序列前项选择(sequential forward selection, SFS)在耗时和选择效果上进行了对比,信号分解方法为VMD,分类器为RF。表5给出了不同特征选择方法下的结果对比,其中的耗时是全部数据的总处理时间。可以看到未经过特征选择算法由于存在冗余特征导致分类准确率降低,同时RF-RFE在特征选择和耗时上比 SFS 更好,RF-RFE在耗时和选择效果上取得了较好的平衡。充分表明了本文所提方法在扬声器异常声分类中的具有更好的效果。

5 结 论

论文提出了一种结合VMD和随机森林特征选择的扬声器异常声分类的方法,分别提取各模态的时频域特征,并利用RF-RFE算法筛选出最优特征子集,输入随机森林中进行分类识别。通过对采集到的扬声器响应信号进行分析和试验,结论如下:

(1)针对论文中7种扬声器单元状态,利用VMD分解可以将扬声器声响应信号较好的分离为各个模态,具有更好的自适应性和能量聚焦性,其分解效果优于WPD分解。

(2)结合随机森林特征重要性排序和递归特征消除算法,能更加有效的从多维特征中选择出鉴别能力较好的特征,在特征选择速度和分类精度上均优于SFS。

(3)提出的基于随机森林的分类方法在平均准确率上均高于SVM和Adaboost。表明了本文所提分类方法在扬声器异常声分类中有着更好的分类准确度和泛化能力。

扬声器单元故障类型繁多,本文只选择了7种进行分类,未来还需对多种不同的故障种类进行诊断,同时还需分析何种激励信号能更好的激发扬声器异常声。

猜你喜欢

子集特征选择扬声器
魅力无限的子集与真子集
拓扑空间中紧致子集的性质研究
Focal&Naim同框发布1000系列嵌入式扬声器及全新Uniti Atmos流媒体一体机
搭载革命性Uni-Core技术 KEF宣布推出KC62超低音扬声器
大地震 正式发布Cinenova系列扬声器
泉州大剧院选用L-ACOUStiCS、DiGiCo
基于智能优化算法选择特征的网络入侵检测
故障诊断中的数据建模与特征选择
reliefF算法在数据发布隐私保护中的应用研究
一种多特征融合的中文微博评价对象提取方法