APP下载

基于ICEEMDAN-MLP的肺音信号识别研究

2021-01-21裴振伟朱平

电子设计工程 2021年1期
关键词:哮鸣音特征向量分量

裴振伟,朱平

(中北大学仪器与电子学院,山西 太原 030051)

肺音听诊法能更早地判断出肺部早期病症,是医生确诊的重要参照指标[1]。随着5G时代的来临,电子智能听诊器将会普及到家庭,可以完整地采集肺音数据并作出分析,通过信号识别判断出可能存在的疾病,减少就诊的时间成本[1-2]。由于肺音信号是高度非平稳的微弱信号,采集时极易受到采集装置和其他生理信号的干扰,增加了信号特征后期识别的难度,目前的研究中最让研究人员关注的一点就是如何从复杂的干扰信号中过滤出目标肺音信号[3]。

将信号分解为多个分量是一种有效的数字信号处理技术,已广泛地应用于滤波和数据压缩。国内外学者在时频域分析方面提出了不同于小波变换的信号分解方法,Huang等人[4-6]提出的经验模态分解(Empirical Mode Decomposition,EMD)是在时间尺度上将自身信号分解成多个固有模态函数(Intrinsic Mode Function,IMF),取消了基函数对分解结果的限制,从而使该方法极具适应性,让研究人员可以剖析到信号深处的涵义。国内外研究人员相继提出了EMD族的算法理论,一步步削减初代EMD理论分解结果的诸多弊端。理论算法方案从集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)发展到互补集合经验分解法(Complete Ensemble Empirical Mode Decomposition,CEEMD)、具有自适应噪声的完全 EEMD(Complete EEMD with Adaptive Noise,CEEMDAN)和改进的CEEMDAN(ICEEMDAN)。ICEEMDAN方案[7]尽可能地消除模态混合的遗留问题,而且大大减少了IMF中的残余分量,从而使信号重构结果更强于之前的方案。基于EMD族的技术已经应用于处理各种生理采集信号,特别用于呼吸音信号降噪以及特征向量构建等[8]。

由于深层学习理论的进一步发展,多层感知器(MLP)这种早期机器学习方法重获研究人员关注。它是一种前向结构的ANN人工神经网络,解决了感知器不能对线性不可分数据进行识别的问题,普遍应用于图像辨别、模式匹配分类、优化过程等领域[9]。

该文采用ICEEMDAN方案将非平稳肺音信号转化后使用测量频谱平坦度参数筛选出适合的IMF分量,实现肺音信号特征向量的有效构建,然后加载到多层感知机进行识别训练,最终完成正常呼吸音、干罗音、哮鸣音和中湿罗音的训练,并且进行测试。测试表明,该方案可用于智能听诊器的信号处理。

1 肺音信号特征构建与识别

1.1 ICEEMDAN算法

EMD算法[10]基于所选信号的极大值和极小值求出局部均值,并计算出所选信号与局部均值之间的残差。这个结果必须满足IMF的条件,如果不满足,则重复该过程,但将计算的剩余量作为输入。这个迭代过程称为筛选。当最后一个残余分量不超过两个极值时,分解结束。分解得到一个按频率排序的IMF族,每个IMF包含频率分量依次降低。CEEMDAN[11]在分解的每个阶段添加一个特定的噪声,并通过计算一个唯一的余数来获得每个IMF,从而使其模式实现完全的无噪声重建,但实际上在分解的早期阶段仍然包含一些残余噪声,存在非对应模式。ICEEMDAN通过进一步降低CEEMDAN模式中的残余噪声和避免虚假模式,为IMF提供更多的物理意义。ICEEMDAN算法估计的是局部平均值,而不是模式,并且只使用白噪声的模式,而不是白噪声本身。其算法如下[12]:

步骤1:给原始信号 x添加白噪声E1[w(i)],得到式(1):

其中,w(i)表示被添加的第i个白噪声;

步骤2:由式(2)计算模态分量IMF1:

其中,M(·)为产生局部均值函数。

步骤3:由式(2)计算IMF2值:

步骤4:计算第k个模态分量IMFk的值:

其中,k=2,3,…,N。

1.2 MLP算法

多层感知器(Multi-layer Perceptron,MLP)信息处理结构是输入层转入隐藏层再到输出层,其模型如图1所示。

图1 多层感知器结构

在网络特征方面,层内神经元没有互联,层间神经元也没有反馈联络,所以也被叫做前馈神经网络。隐藏层节点映射采用非线性函数,输出层节点映射采用线性函数。神经网络分类器采用比例共轭梯度反向传播学习算法进行训练,避免了其他二阶训练算法的缺点[13]。这种训练算法使用用户独立的参数,解决了时间和内存问题。输入行为各分量的加权和输入层中神经元的输出,比传统的反向传播算法更快。

2 ICEEMDAN-MLP的肺音识别

肺音分析分为4个阶段:信号分解前处理、肺音信号周期判断、典型特征参数构建和MLP分类。图2表示了肺音信号识别过程,具体步骤如下:

1)由于记录仪器增益、受试者年龄和性别等各种因素差异会引起振幅的变化,需要先进行振幅归一化。设f(n)为第n个样本的值,M为样本空间中绝对最大值。归一化信号fn(n)为:

图2 肺音信号分析流程

其中,n=1,2,3,…,n表示信号中的样本数。该归一化信号为fn(n),其值在振幅的±1范围内。

2)采用一阶微分法降低信号中的仪器噪声。信号的一阶导数由式(6)计算:

其中,yd(n)是输入信号y(n)对n的导数输出,Δt是采样时间。

3)前期准备的肺音信号被转化后可以得到不同数量的分量和残留余量。最短的肺音记录用EMD分解成9个IMF,用ICEEMDAN分解成15个IMF,最长的记录用EMD分解成12个IMF,用ICEEMDAN分解成19个IMF。考虑到肺音记录被分解的最小IMF数是7,该文将两种技术的所有肺音记录分解为7个IMF。研究中使用了前7个IMF和残余分量。这些IMF包含相对较高的频率分量,可以通过测量频谱平坦度参数来选择。频谱平坦度测量(SFM)是通过将几何平均值(GM)除以不同频率段的功率谱的算术平均值(AM)来计算的[10]。

其中,γj(i)是编号i的频率点大小,zn是频率分量的数量。当信号的功率谱在模式中变得完全平坦时,其SFM值将为1;对于正弦信号,其SFM值为零。统计IMF和残余分量的特征,为下一阶段的构造做准备。

4)用于分类声音的特征是根据统计矩计算的,如平均值(μ)、标准偏差(σ)、偏度(γ)和峰度(k)[14]。将这些统计属性构造成多维特征向量加载到MLP在神经网络中。特征向量(FVEMD)如式(8)所示。

式中,i=1,2,…,8表示7个选定的IMF分量以及残余分量。

3 数据及分析

该文采用3M公司的3200型电子听诊器采集肺音正常肺音、哮鸣音、干罗音和中湿罗音4类肺音信号,临床肺音采集过程中尽可能处于安静环境来减少环境噪声和人造伪影,每类采集18例,共72组数据作为肺音样本进行研究。

图3 该文信号的时域波形图

该文使用多层感知机MLP对4种类型肺音信号识别匹配。在4类数据中每组分别随机选取12组共48组数据作为训练样本,其余24组作为测试样本。对随机选取的训练样本数据处理后进行ICEEMDAN分解,构造出特征向量后加载到MLP进行训练,对24组测试数据同样构造出特征参数进行验证。图4和图5分别表示正常肺音与哮鸣音的ICEEMDAN分解结果。

训练时,正常肺音信号设置为1,哮鸣音信号设置为2,干罗音信号设置为3,中湿罗音信号设置为4。训练中MLP分类4种信号的误差一步步降低,从图6可以看出误差率降低至11.52%。多次训练预测误差稳定后随机样本神经网络分类测试结果与实际肺音类型对比如图7所示。

为了进一步分析MLP的识别能力,随机采样了10 组样本数据,同 时使用 ELM[15]和 BP 网络[1,16]进行对比。表1给出了10次分类的精准率和计算时间。如表1所示,MLP具有较高的分类精准率,ELM次之,BP网络的分类精准率最差。在计算机性能相同时,BP神经网络由于要反复迭代需要较长的时间。ELM在训练时由于连接权值w和隐含层阈值b是随机选择的[15],因此预测时间次之。MLP在3种方案中具有较快的匹配速度和较高精准率。

图4 正常肺音信号的ICEEMDAN分解结果

图5 哮鸣音信号的ICEEMDAN分解结果

图6 MLP分类肺音信号的误差变化

图7 单次随机样本MLP分类结果

表1 基于MLP、ELM、BP的分类结果

4 结论

该文采用适用于高度非平稳和非线性的IC EEMDAN算法对72组正常肺音、哮鸣音、干罗音和中湿罗音肺音数据信号进行特征提取,采用多层感知机为分类器,分类精度达到91.67%,综合性能高于其他方法。此方法对于肺音信号的处理切实可行,可为今后获得更多类型的肺音数据识别更多的病理状况。

猜你喜欢

哮鸣音特征向量分量
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
帽子的分量
布地奈德联合特布他林治疗儿童支气管哮喘的临床疗效
一物千斤
论《哈姆雷特》中良心的分量
一类特殊矩阵特征向量的求法
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
孟鲁司特联合舒利迭治疗支气管哮喘的临床研究
基于瞬时对称分量法的三相四线制D-STATCOM控制研究