APP下载

改进的高斯混合模型在心音信号分类识别中应用

2014-09-05张文英郭兴明

振动与冲击 2014年6期
关键词:心音波包特征参数

张文英, 郭兴明, 翁 渐

(重庆大学 生物工程学院,生物流变科学与技术教育部重点实验室,重庆 400044)

心音作为人体重要生理信号之一,包含心脏各部分及瓣膜功能状态的生理、病理信息[1],直接反映心脏及大血管机械运动状况。因此心音分析对心脏疾病诊断具有重要意义。心音信号分类识别旨在据不同心音信号特征判定所属疾病类型。目前主流研究方法为由心音信号中提取特征参数,借助于分类器对心音信号进行分类识别。李战明等[2]利用S变换提取心音信号特征,用于不同类型心音信号识别;Olmez等[3]利用小波变换提取心音信号的时、频域特征参数,训练人工神经网络(Artificial Neural Networks,ANNs)作为分类器对7种不同心音信号的分类识别,识别率达99%,但ANNs的频域计算繁琐,计算量大,识别过程运算时间过长;Choi[4]用小波包变换对信号进行分解并提取小波包能量均值及标准差,利用支持向量机(Support Vector Machine,SVM)较好识别出瓣膜性心脏病。SVM为基于小样本统计学习理论方法,不适应大量数据处理;Saracoglu[5]利用离散傅里叶变换提取心音信号的频域特征参数,通过主成分分析方法对该特征参数降维处理,用隐马尔科夫模型(Hidden Markov Models,HMM)分类识别,获得较ANNs与传统K-近邻分类器更高的识别率,但单独使用HMM的分类决策能力较差;Rios-Gutierrez等[6]采用离散小波变换及短时时频变换方法提取心音信号特征参数,再借助矢量化(Vector Quantization,VQ)模型对4种常见心杂音分类识别,获得67.05%的识别率。因VQ模型用离散数值表示各种矢量,故识别率有限。

高斯混合模型(Gaussian Mixture Model,GMM)为近年生物识别中常用模式识别方法之一,并在HMM基础上发展。为单一高斯概率密度函数的延伸,且能平滑近似任意形状的密度分布,在语音识别中得到广泛应用[7]。传统的GMM利用K-means算法对参数初始化,再通过期望最大化(Expectation Maximization, EM)算法估计参数,为每类心音信号建立GMM。识别时,提取待识别信号特征参数与训练模型匹配,计算其与各模型间的似然函数值,当该值达到最大时对应的模型即为待测心音信号分类识别结果。由于EM算法对初始值要求较高,本文对传统的GMM进行改进,利用加权可选择模糊C均值算法(Weighted Optional Fuzzy C-Means,WOFCM)代替K-means算法对参数初始化,所得数据较接近实际模型均值,从而提高了GMM算法性能与识别率。

1 特征参数提取

特征参数提取旨在获得含较少维数且能描述心音信号特征的参数,并用于GMM训练过程中以提高识别率。在提取特征参数之前,需对心音信号预处理,确保提取的特征参数更准确。

1.1 心音信号采集

本文所用97例心音数据由重庆博精医学信息研究所的运动心力监测仪(ECCM,专利号01256971.2,第一代产品注册证号:渝药管械(试)字99第220007)在重庆医科大学附属第一医院采集。包括18例二尖瓣狭窄、15例主动脉瓣狭窄、14例室间隔缺损及50例正常心音。采样频率11.025 kHz,量化值8 bit,采集信号最终以wav格式保存。全部病理数据为经临床医生确诊的单一病例,健康人群均无心血管及家族病史。

1.2 预处理

预处理包括去噪、预加重、分帧加窗及端点检测四个步骤:

(1)去噪。心音信号在采集过程中会引入人为及环境干扰噪声,而噪声会影响特征参数提取的准确性,故在充分考虑心音信号频率分布特点及小波变换原理基础上,本文选sqtwolog-coif3小波函数对心音信号进行消噪预处理。正常心音信号去噪结果见图1。由图1可知,该去噪方法基本去除了噪声分量,保留了有用信号成分,减少毛刺等对高频信号波形干扰,去噪效果较好。

图1 正常心音信号去噪及预加重效果

图2 正常心音信号端点检测结果

(2)预加重。本文采用预加重滤波器H(z)=1-0.95z-1对心音信号预加重,突出信号高频部分,结果见图1。

(3)分帧加窗。本文采用Hamming窗对心音信号进行分帧及加窗处理,提高特征参数提取精度。常用Hamming窗为:w(n)=0.54-0.46cos[2πn/(N-1)],其中0≤n≤N-1,N为每帧取样点数。

(4)端点检测。为减少计算量,提取有用帧,本文分别为短时能量与过零率设置两门限值,通过双门限检测算法,对心音信号主要成分第一心音(S1)与第二心音(S2)进行定位,获得较好结果,见图2。

1.3 特征参数提取

1.3.1 MFCC特征

Mel频率倒谱系数(Mel Frequency Cepstrum Coefficients, MFCC)为广泛应用于语音相关识别中的特征参数,其为在Mel标度频率域提取的倒谱系数[8],提取流程见图3。其中Mel频率滤波器作用为利用三角形滤波器组对语音信号幅度平方谱进行平滑;对数操作作用有两点:①压缩心音频谱动态范围;②将频域中乘性成分变成对数谱域中加性成分,以便滤除乘性噪声。离散余弦变换主要用于对不同频段频谱成分进行相关处理,使各向量间相互独立。

图3 MFCC提取过程

提取MFCC后,将提取其一阶差分系数记为ΔMFCC,提取表达式为:

(1)

式中:c,d为一帧心音信号序列;k为常数,通常取2。由式(2)看出ΔMFCC为信号帧前后四帧参数的线性组合。

1.3.2 Delta特征

对心音特征向量序列在时序上作一次傅里叶变换,即得对应于该特征的Delta特征。具体实现时可简化为:

(2)

其中:dt为第t帧特征的Delta特征;Θ为考虑第t帧时序变换信号帧数量。

1.3.3 DWPTMFCC提取

由滤波器角度分析,图3中所用为一组Mel尺度三角形滤波器,而小波包变换实质相当于信号通过一系列不同频带范围的带通滤波器,进而获取信号在每个频带内的信息。因此可用小波包变换代替MFCC提取过程中FFT与Mel滤波器组两处理部分,此处理后提取的参数记为DWPTMFCC。由于心音信号为非线性信号,临界频带划分类似Mel滤波器组在频带的分布及带宽。因此心音信号通过小波包分析后,选出与Mel滤波器组频带一致范围内的小波包变换系数。

本文所用心音信号采集频率11.025 kHz,即最高频率约5500 Hz,据小波包系数选取原理,利用db6小波包函数进行6层小波包分解,选出24个分解节点频带,所用节点为第6层:(6,0)、(6,1)、(6,2)、(6,3)、(6,4)、(6,5)、(6,6)、(6,7);第5层:(5,4)、(5,5)、(5,6)、(5,7)、(5,8)、(5,9)、(5,10)、(5,11);第4层:(4,6)、(4,7)、(4,8)、(4,9)、(4,10)、(4,11);第3层:(3,6)、(3,7)。对心音信号预处理后,DWPTMFCC参数提取过程为:

(1)对各帧心音信号进行小波包分解,计算所选24个节点频带内信号的对数能量,计算式为:

Sk=ln∑[x(n)]2,(k=1,2,…,K)

其中:K=24为所选频带数目;x为心音信号。

(2)将Sk经DCT处理后可得DWPTMFCC,用C(i)表示为:

(0≤k≤K,i=1,2,…,M)

其中:M为常数,是取定DWPTMFCC的维数。该参数一阶差分系数提取亦由式(1)获得,记为ΔDWPTMFCC。

2 识别模型-GMM

2.1 高斯混合模型

高斯混合模型概率密度函数定义为:

(3)

(4)

由式(3)知,高斯概率密度函数为M个加权密度之和。其中M为高斯混合分量个数,即GMM阶数。一个完整的高斯混合模型为由混合权重、均值向量与协方差矩阵三参数共同描述,即一个模型λ可表示成三元组:

λ={ωi,μi,Σi|i=1,2,…,M}

(5)

2.2 EM估计法

对各类心音信号建立GMM前,先通过模型训练估计GMM参数。常用方法为最大似然函数估计[9]。设心音信号特征矢量序列为X={x1,x2,…,xT},GMM的似然函数可表示为:

(6)

2.3 改进的EM算法

由于EM算法对初始值要求较高,初值不正确可能导致算法收敛到局部最大值或鞍点上获得错解。因此EM迭代算法初始化极其重要。而传统初始化采用的K-means算法实质为只用均值作为类代表,即仅当每个类中各分量协方差近似相等时,才会有较好识别结果。但对心音信号而言,各分量协方差不等,故其初始化效果不很理想。

本文所用加权可选择模糊C均值聚类算法为综合近似模糊C均值聚类算法(Approximate Fuzzy C-Means, AFCM)与加权模糊C均值聚类算法(Weighted Fuzzy C-Means, WFCM)优点。即AFCM通过改变一般距离定义方式的聚类算法,旨在改变样本的不均衡问题[11]。WFCM考虑样本各特征对分类结果影响程度不同,在目标函数中增加权值,使各类中样本到聚类中心的加权距离平方和达最小,从而解决含噪声或不均衡样本识别率低的问题[12-13]。WOFCM算法实现过程为:设心音信号特征矢量集合为Xt={x1,x2,…,xT},模糊集为C={y1,y2,…,yN},其中y1,y2,…,yN为N个聚类中心,故C又称类中心矩阵。该算法目标函数为:

权值可通过迭代方法计算,用于改变隶属函数值。隶属函数中各值代表样本对分类影响程度大小。迭代式为:

(8)

pt=U(i,t)/U(i+1,t+1)

(9)

利用式(8)、(9),可得新模糊隶属度矩阵U,各样本代表的权值P即为新矩阵变换发生的概率转换,即将权值与隶属度函数值紧密联系在一起,从而改善样本含噪声问题。

在以上约束条件下,WOFCM算法迭代过程为:

(1)设定聚类数目N=4与模糊参数m值,其最佳选择区间[14]为[1.5,2.5],本文取m=2;

(2)计算各样本点对样本分类影响程度权值P;

(3)初始化聚类中心矩阵C;

(4)利用当前聚类中心,计算模糊隶属度矩阵U;

(5)使用当前模糊隶属度矩阵U,计算新的各类聚类中心,迭代函数见式(8)、(9);

(5)重复迭代,直至各样本隶属度μit稳定。

WOFCM收敛时,即可获得各类的聚类中心及各样本隶属度值,完成参数初始化。进而即可获取所需GMM参数。获取公式为:

3 识别结果及分析

对本文采集的97例心音数据按训练样本与测试样本约1∶2比例进行实验,即32例心音信号用于训练,65例(异常心音21例,其中二尖瓣狭窄7例,主动脉瓣狭窄7例,室间隔缺损7例,正常心音44例)信号用于测试。训练与识别的流程见图4。按此识别过程,识别模型选择为改进后的GMM模型,其识别结果见表1。实验平台为Microsoft Windows XP下的matlab7.1版本,算法运行时间由Matlab中的‘tic、toc’获得。

表1 不同特征参数下系统识别性能对比

图4 心音分类识别流程图

对表1横向分析发现,随高斯混合模型阶数的增加,系统识别率随之提高,模型训练时间相应延长。当阶数增加到32阶以上时,识别率增加较小,而训练时间大大延长。且当阶数过大时,识别模型的鲁棒性受到影响,过高阶数不但不能提高系统识别率,甚至会因模型训练不充分导致识别率下降。因此,不可盲目通过加大GMM阶数提高识别性能。在综合考虑系统总体识别性能基础上选择模型阶数,本文选阶数M= 32。对表1进行纵向分析可知,对识别率,利用小波包变换对MFCC进行改进所得新特征参数DWPTMFCC结合其一阶差分系数效果最佳。MFCC只反映心音信号的静态特性,忽略信号动态特性,而ΔMFCC可较好反映心音信号动态变化。将两者结合可获得较MFCC更好的识别性能。同理,DWPTMFCC+ΔDWPTMFCC的识别性能较 DWPTMFCC更好;对识别时间,由于DWPTMFCC所得参数维数较MFCC增多,故使识别时间稍有延长,但差异不大。上述4个特征参数均只考虑信号帧内关系,而未考虑信号帧间关系。心音信号为连续性信号,获取信号帧特征之间的时变特性Delta特征用于心音信号识别,可提高识别率,但会使识别时间明显延长。故本文选取DWPTMFCC+ΔDWPTMFCC为识别特征参数。

表2 不同小波包函数对应识别性能比较

由表2看出,不同小波包函数获得识别率不同,db6效果最优,bior2.4效果最差。说明不同小波包函数所提心音信号特征信息不同。因此本文选db6函数进行小波包处理。选取阶数与识别特征参数后,比较改进的GMM与传统的GMM识别效果,结果见表3。

表3 不同分类器识别结果对比

由表3可知,无论对正常心音信号或异常心音信号,利用改进GMM的识别率明显高于传统的GMM,尤其对异常心音信号,改善更明显;由于本文所提改进GMM中所用改进EM算法在实现参数初始化过程中用WOFCM算法存在多次迭代,故使识别时间有一定程度延长,但相差不大。因此本文的改进GMM较传统的GMM识别性能更优越。

4 结 论

本文提出的将小波包变换Mel频率倒谱系数与基于WOFCM初始化改进高斯混合模型相结合的心音分类识别方法,通过对临床采集97例心音信号试验分析,结论如下:

(1)用小波包变换对MFCC改进所得DWPT MFCC参数较普通倒谱系数识别性能高。

(2)通过在传统GMM基础上利用WOFCM算法对EM算法进行改进,使心音信号分类识别率极大提高,识别时间虽稍有延长,但识别性能较传统GMM高,尤其对异常心音信号,提高程度更显著。

(3)本文所提心音分类识别方法能有效提高心音分类识别准确率,对进一步实现心脏疾病诊断具有重要参考价值。

参 考 文 献

[1]黄林洲,郭兴明,丁晓蓉.EMD近似熵结合支持向量机的心音信号识别研究[J].振动与冲击,2012,31(19):21-25.

HUANG Lin-zhou,GUO Xing-ming,DING Xiao-rong. Heart sound recognition based on EMD approximate entropy and SVM[J]. Journal of Vibration and Shock, 2012,31(19):21-25.

[2]李战明,韩 阳,韦 哲,等.基于S变换的心音信号特征提取[J].振动与冲击,2012,31(21):179-183.

LI Zhan-ming,HAN Yang,WEI Zhe,et al. Heart sound feature extraction based on S transformation[J].Journal of Vibration and Shock,2012,31(21):179-183.

[3]Olmez T,Dokur Z. Classification of heart sounds using an artificial neural network[J]. Elsevier, Pattern Recognition Letters, 2003,24(1):617-629.

[4]Choi S. Detection of valvular heart disorders using wavelet packet decomposition and support vector machine[J]. Expert Systems with Applications,2008,35(4):1679-1687.

[5]Saracoglu R. Hidden markov model-based classification of heart valve disease with PCA for dimension reduction[J]. Engineering Applications of Artificial Intelligence, 2012, 25(7): 1523-1528.

[6]Rios-Gutiérrez F, Alba-Flores R, Ejaz K, et al. Classification of four types of common murmurs using wavelets and a learning vector quantization network[C]//IEEE International Joint Conference on Neural Networks, 2006: 2206-2213.

[7]LIU Ming-hui, XIE Yan-lu, YAO Zhi-qiang, et al. A new hybrid GMM/SVM for speaker verification[C]//18th International Conference on Pattern Recognition, 2006 : 314-317.

[8]赵 力.语音信号处理[M].北京:机械工业出版社,2003:45-56.

[9]Charalambous C D, Logothetis A. Maximum likelihood parameter estimation from incomplete data via the sensitivity equations: the continuous-time case[J]. IEEE Transactions on Automatic Control, 2000, 45(5): 928-934.

[10]Reynolds D A, Rose R C. Robust text-independent speaker identification using gaussian mixture speaker models[J].IEEE Transactions on Speech and Audio Processing,1995,3(1):72-83.

[11]Provost F. Machine learning from imbalanced data set[C]//Proc of the 17th National Conference on Artificial Intelligence, Workshop on Imbalanced Data Sets,2000:71-73.

[12]付 辉.模糊C均值FCM聚类算法的改进[J].科学技术与工程,2007,7(13):3121-3123.

FU Hui. Improvement of fuzzy C-means clustering algorithm [J].Science Technology and Engineering, 2007,7(13):3121-3123.

[13]LI Yan, LI Lei. A novel split and merge EM algorithm for gaussian mixture model[C]//2009 Fifth International Conference on Natural Computation, 2009 : 479-483.

[14]Pal Nikhil R, Bezdek James C. On cluster validity for the fuzzy C-means model [J].IEEE Transactions on Fuzzy Systems, 1995, 3(3):370-379.

猜你喜欢

心音波包特征参数
基于支持向量机和小波包变换的EOG信号睡眠分期
冕洞特征参数与地磁暴强度及发生时间统计
基于小波包分解和K最近邻算法的轴承故障诊断方法
基于交通特征参数预测的高速公路新型车检器布设方案研究
基于双阈值的心音快速分段算法及其应用研究
双声道心音能量熵比的提取与识别研究
基于PSO-VMD的齿轮特征参数提取方法研究
基于视频的车辆特征参数算法研究
基于香农熵的心音信号检测方法研究
一种心音小波神经网络识别系统