APP下载

基于模态分析的机械声信号识别*

2019-11-28贺文红

舰船电子工程 2019年11期
关键词:梅尔模态聚类

贺文红

(海军装备部 北京 100071)

1 引言

机械声音信号中关键信息的提取和挖掘对机械故障诊断、机械内部结构分析有着重要的作用。然而,由于声音传递介质复杂性,以及噪声的不可描述性,使得水下声音信号中含有大量的不可建模的噪声,在此情况下,对机械声音信号的挖掘和提取有效信息就显得尤为困难。因而在该情形下,对强干扰下的弱信号的有效特征提取就成为提高识别能力的关键要素。本论文在一维信号识别的框架下,通过提取水下声音信号中的深度特征,利用半监督学习的方法,构建适应于机械声音信号的分类模型,以实现试验场景下和真实场景下对机械发动机转速信息的高精度提取和识别。

2 相关原理介绍

2.1 Huang变换

Huang变换[1]是由Norden E.Huang在1998年提出的,用以解决非线性非稳态信号的Hilbert变换(主要是Hilbert变换要求信号的瞬时频率唯一,这样通过对信号的空间重构便可以直接通过相位的导数求得具有物理意义瞬时频率)。他是通过大量的实验得出,通过对原始信号不断地求上下包络,然后用原信号减去包络平均,通过本征模态的筛选,就可以将原始信号分解成多个本征模态,而这多个本征模态的瞬时频率基本唯一,从而实现了对原始信号的分解。

Huang变换的主要算法是EMD算法[2~4],其主要原理是根据Norden E.Huang对本征模态的判定来,判定条件如下。

1)信号的上包络和下包络的平均值趋近于0;

2)原始信号的极值点个数(包括极大值点个数+极小值点个数)和原始信号同y=0的交点个数之差不能大于1(小于等于1)。

EMD算法的框图如图1。

图1 EMD算法框图

图3 到图5是用EMD算法,对p20的声音信号的10000个采样点提取IMF的结果,可以看出,信号的主要的能量集中在前几个IMF里。

图2 p20Huang变换后1MF~4IMF及其频谱示意图

图3 p20Huang变换后5IMF~8IMF及其频谱示意图

2.2 梅尔倒谱系数

在对原始信号做完Huang变换后,对提取的前4个本征模态做梅尔倒谱变换,提取其梅尔倒谱系数。在该分类器中本文主要使用14维的梅尔倒谱系数作为分类的决定性特征。梅尔倒谱是基于仿生学,对人耳分辨声音的原理进行模拟,将频谱弯曲,构建出梅尔谱,从而实现对人声的更好的分辨。倒谱和梅尔频率倒谱的区别在于,梅尔频率倒谱的频带划分是在梅尔刻度上等距划分的,它比用于正常的对数倒频谱中的线性间隔的频带更能近似人类的听觉系统。这种频率弯曲可以更好地表示声音。

图4 p20Huang变换后9IMF~12IMF及其频谱示意图

提取的过程如图5所示。

图5 梅尔倒谱系数提取过程

先对输入的音频信号做预处理(预加重、分帧、加窗),然后基于窗函数用快速傅里叶变换对其做短时傅里叶变换,然后对变换后的结果取模长,取对数,最后做离散余弦变换(DCT)得到梅尔倒谱系数,这个过程是用梅尔谱代替频谱进行变换,而整个变化方式是用求倒谱的变换方式,故而得到的特征不仅具有频谱的稳定性还有基于人耳识别声音的生物学原理。

2.3 半监督粗糙模糊拉普拉斯特征映射维数约简(SSFRLE)

对提取的四个本征模态的梅尔倒谱系数特征,我们采用一种半监督的基于局部的保类流形降维的方法对原始特征降维[5],从而得到新的特征,而所降的维度由PCA自适应的确定。

SSFRLE算法主要思想是先用模糊相似度量构建出该数据集的属性重要度,然后综合类信息,利用带有属性重要度的数据构建模糊相似矩阵,然后基于该模糊相似矩阵构造近邻粗糙模糊集,从而确定每一类样本的隶属度,然后将隶属度与核距离组合起来,加上类信息从而构造出权值,如下:

其中xi∈Rm表示第i个数据点,而 Nk(xi)表示i的k近邻集,μ-NXj(xi)则表示xj的模糊相似类且为模糊矩阵RS中的第i列Xj关于近邻关系N的下近似在X上的一对模糊集,由扩张原理可知其计算公式如下:

并且,为描述半监督数据集中的监督信息,SSFRLE方法构造了一个类相关图GC。如果样本xj的标记信息为 t∈{1,2,…,f},且 RS(xi,xj)可以解释为样本xi属于第t类的隶属度,令WC=(WiCt)n×f为图GC的权矩阵:

基于移速分析[5],构造如下优化问题:

其中,γ是一个实参数且γ∈[0,1],它为了权衡近邻样本间的距离与样本与类中心间的距离对函数值的影响,yi∈Rd表示原始数据xi对应的低维表示,ct表示降维后第t个聚类中心,f表示类数。

整理得:

对上述矩阵形式做变换[6],令

且 D是一个 (f+n)×(f+n)的对角矩阵,L=D-W 是一个(f+n)×(f+n)半正定的拉普拉斯矩阵。

为了确保优化问题有解,加入两个限制条件[7]:

通过拉格朗日乘子法,求上述优化问题,则有:

我们可以得到列向量z1,z2,…,zd是的前d个最小的非负特征值 0≠λ1≤λ2≤…≤λd对应的特征向量,则矩阵[z1z2…zd]的前 f行是数据集 X在低维空间中的类中心[9],矩阵 [z1z2…zd]的后 n 行是数据集X在低维空间中的表示。

2.4 模糊C均值(FCM)

模糊C均值是一种无监督的动态聚类方法[6~9],对于一个数据集,FCM算法需要我们事先规定聚为几类,假设聚为C类。则对于每个数据点,其属于某一类的隶属度可以组成一个模糊分类矩阵,对于此矩阵有如下要求:

其中μik表示第K个数据属于第i类的隶属度,故而式(1)是表示每个数据点属于所有类隶属度之和是1,式(2)表示每一类中至少有1个点,至多有n个点。

基于隶属度便可以依据距离定义能量函数,如式(3):

其中第k个点到底i类聚类中心的距离定义为欧氏距离(vij表示第i个聚类中心的第j维):

然后用梯度下降法极小化式(3)可得:

则式(4)即为聚类中心的最优表达式[10~13],采用交叉迭代法来更新聚类中心至最优[14~15]。

3 半监督机械声音信号的识别方法

本文主要对一维声音信号处理,提取其多级特征,然后使用模糊C均值(FCM)对所得特征进行聚类,如图6所示。

图6 模型综述

对于所给信号,本文首先选用Huang变换对每个信道的声音进行处理,削弱信号中骑行波等对声音特征提取的影响,并选择前四个能量最大的本征模态(IMF)作为一级特征。然后,基于声学中耳朵听声原理,对每个IMF提取14维的梅尔倒谱系数(MFCC)作为高维二级特征(维度数为1728)。对于此高维信号,因其所处的数据空间为嵌入到高维空间中的低维流形,因此我们使用半监督模糊粗糙拉普拉斯映射(SSRFLE)对其做流形降维从而构建三级特征。最后使用FCM对其进行聚类,得到数据的识别结果。

为了验证上述特征提取方式的可行性,本文通过对其特征空间的可视化分析,得出机械声音信号的深度特征分布情况,如图7,灰色和黑色分别表示有负载时机械转速(p20)和无负载机械转速20(w20)特征空间的第2维和第5维分布情况。

从图7中可以发现,这两组数据按照上述模式提取的深度特征成簇状分布,且分属于两个簇中,可以认为在本文所提出的特征提取的框架下,机械声音信号的本征特征可以很好地提取出来。并且,对于成簇状分布的特征,采用FCM可以有效地对其进行聚类识别。

图7 p20和w20的第2维和第5维特征空间示意图

4 试验结果及分析

本文利用真实场景下18声音接受装置对机械发动机不同转速下声音信号的采样结果,在采样频率为5000Hz下,选取其中连续的100000个采样点,利用上述框架,分别提取各类数据的深度特征,并使用FCM对所提取的特征进行聚类识别,得到最终的试验结果如下。

表1和表2分别展示了p0和p20试验组与其他组各个信号数据的识别精度。通过表1和表2可以发现,本文所提出的识别模型在多数的识别试验组上有较好的识别精度。而对于组p0-w0组而言,此时试验组间的区别仅在于是否还有负载发动机的声音,而此种声音在强背景噪声下很难区分,因而在此中情形下,数据本身差异较小,故而在提取其本征特征时,得到的特征空间的分布差异较小,致使最终聚类识别精度较低。

表1 各个接受设备p0试验组与其他组的识别精度表

对于多个信号融合情况,本文将各个声音信号接受装置所搜集的数据按维度排列,得到一个超维的数据列表,然后利用流形学习对其进行维度约减和属性融合,从而得到更丰富、更符合数据本征特征的数据特征向量。表3分别展示了信号融合前和信号融合后转速50与转速80的识别精度,从该表中可以发现,融合后数据的聚类精度相较与未融合时平均提升了0.3,如上分析,在此种数据特征融合下,数据的本征特征得以更好地表达和刻画。

表2 各个接受设备p20试验组与其他组的识别精度表

表3 各类接受信号融合后转速50与转速80的识别精度表

5 结语

基于半监督流形学习的机械声音信号识别方法可以对于真实场景下机械声音信号的识别有较强的性能。对于单一信道的声音识别,通过该方法提取的特征在某些试验组中存在着分离性较差的情况,可能原因是:不同的接收器接受到的声音受混响反射等因素的影响,导致单个接收器接受到的声音信息失真。将所有的接受器接受到的信号组合起来,增大了数据的信息量,能在一定程度上减少信号的失真比例,从而能更好地实现数据的分离。另外,本文通过非线性的半监督流形降维,利用数据标号信息,在一定程度上将数据类与类拉开,从而增大数据的可分性。此方法是考虑半监督样本领域内数据的类信息,通过该标号情况构造一个近邻粗糙模糊集,在领域内我们采用的是取最小隶属度原则,这样对一个无标号信息的样本就可以用其领域信息来判读其属于各类的隶属度。

猜你喜欢

梅尔模态聚类
一种傅里叶域海量数据高速谱聚类方法
联合仿真在某车型LGF/PP尾门模态仿真上的应用
多模态超声监测DBD移植肾的临床应用
一种改进K-means聚类的近邻传播最大最小距离算法
跨模态通信理论及关键技术初探
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
梅尔:我的追求塑造了梦
梅尔维尔鲸
“熊”视眈眈
基于Spark平台的K-means聚类算法改进及并行化实现