APP下载

基于CI-HMM的运动想象脑电信号分类*

2013-06-20满海涛佘青山

传感技术学报 2013年12期
关键词:识别率测度特征提取

孟 明,满海涛,佘青山

(杭州电子科技大学智能控制与机器人研究所,杭州310018)

在人们想象肢体动作的规划和执行阶段,大脑皮层对侧主感觉运动区会出现特定节律波衰减的现象,称为事件相关去同步电位ERD(Event-Related Desynchronization);而在动作执行结束后,则会出现特定节律波增强的现象,称为事件相关同步电位ERS(Event-Related Synchronization)[1]。基于 ERD/ERS模式进行意图识别是脑机接口的一种重要方式,相对于P300、VEP等诱发电位方式,运动想象具有无需外界刺激、可实现异步通讯等优点,在脑机接口研究当中被广泛关注[2]。这种自发的脑电信号EEG(Electroencephalogram,)更为微弱,并具有显著的非平稳性和非线性,这给EEG的特征提取和运动想象分类带来很大的挑战。

在马尔科夫模型基础上发展起来的隐马尔科夫模型(HMM)是一种用于描述随机过程统计特性的通用模型[3],已成功应用于语音识别领域,因而也被尝试用于运动想象EEG这类多元时序信号的分类。Souza等[4]采用幅值平方相干函数提取EEG特征,然后分别利用HMM和多层感知器(MLP)对手指动作的实际运动和运动想象进行识别,HMM方法的识别准确率优于MLP方法。Argunsah等[5]利用HMM结合自回归模型(AR)和主成分分析(PCA)方法对左手、右手、双脚和舌头4类运动想象EEG进行分类,平均识别率为74%。Yang[6]等采用AR模型方法提取左手和右手两类运动想象EEG的特征,利用最大边际估计方法进行HMM的参数重估,再用该HMM进行分类,相对于传统期望最大化(EM)重估方法的HMM识别率提高了5%。虽然HMM可以有效地对EEG进行分类,但是识别正确率并不理想。一个重要的原因在于,EEG信号序列之间具有一定的关联性,但HMM却存在内部独立性假设,要求信号之间独立,因此,如何消除这种独立性假设的影响显得至关重要。

以模糊集理论为基础的模糊数学,可以有效地处理不确定性现象。Sugeno[7]1974年以模糊集理论为基础,提出了模糊测度的概念,以其更广泛的单调性取代了概率测度的可加性。Mohamed等[8]利用模糊测度上的Choquet积分,将传统HMM推广为模糊HMM,并通过手写字符识别的实例表明模糊HMM在处理序列信号时有更好的适应性,可以得到更高的识别率。本文利用基于Choquet积分的模糊HMM,即Choquet积分HMM(Choquet integral HMM,CI-HMM),建立一种运动想象EEG分类方法,以放宽HMM对EEG信号的独立性假设要求,并采用BCI Competition 2008 Data Sets 1运动想象EEG数据进行了分类方法的实验验证和分析。

1 CI-HMM基本原理和算法

1.1 模糊测度

设X是任意的非空集合,Ω是X的子集所构成的非空集类,g:Ω→[0,1]为定义在Ω上的一个函数集,如果g满足如下性质,那么称g是Ω上的一个模糊测度[9]。

(1)边界条件:g(φ)=0,g(X)=1;

(2)单调性:∀A,b∈Ω,若 A⊆B,则有 g(A)≤g(B);

(3)连续性:如果∀Fn∈Ω,1≤n<∞,且序列{Fn}是单调的,则有

1.2 Choquet积分

Choquet积分是定义在模糊测度基础上的一种集合函数[10]。设(X,Ω)是一个可测空间,h:X→[0,1]为Ω上一可测函数,对A⊆Ω,可测函数h关于模糊测度g在集合A上的Choquet模糊积分定义为:

其中 Aα={X|h(X)≥α},α∈[0,1]。

对于有限集 X,设 Ai={xi,xi+1,…,xN},h(x1)≤h(x2)≤…≤h(xN)则X上的Choquet模糊积分为:

1.3 CI-HMM 算法

与经典HMM一样,CI-HMM也是一个双重内嵌式随机过程,其中一个是Markov链,另一个是描述了状态和观察值之间对应关系的随机过程。对于一个给定的观察序列,CI-HMM隐含了一个与此观察序列对应的状态序列,其中状态之间的对应关系由模糊测度给出。类似地,CI-HMM也可以用一个三元组^λ=(^π,^A,^B)来表示[11]。CI-HMM模型的状态集合记为 S={S1,S2,…,SN},N 为状态数目,则

2.1.1 加大各方面投入力度。①加大人力资源投入,尤其是选配好相关专业人员,确保在红色文献的收集、整理、开发、研究及服务等方面,有一支能力素养较强的专兼职人员队伍;②增加专项资金投入,满足红色文献的收集整理需要,并添置必要的现代技术设备设施。

(1)^π={^πi}表示初始状态模糊密度向量,^πi=^πs({Si})是初始状态的模糊密度;

(2)^A=[^aij]为转移模糊密度矩阵,其中 ^aij=^aY({yi}|xi)是Y关于X的条件模糊测度,表示转移模糊密度,其中xi为t时刻的状态,yj为t+1时刻的状态;

(3)^B=[^bi(Ot)]是观察值的概率密度矩阵,其中^bj(Ot)是定义在模糊测度上的模糊密度,是对状态为Sj时观察到符号Ot的确定性程度的度量。

1.4 CI-HMM模型的前后向算法

随着模糊积分的引入,经典HMM中输出概率的计算也相应变为对输出模糊测度^P(O|^λ)的求解。在给定模型^λ时,可以通过前后向模糊变量求得。

记^αt(i)为前向模糊变量,表示t时刻,状态为xi时观察序列是{O1,O2,…,Ot}的确定性程度。对应的^βt(i)为后向模糊变量,表示t时刻,状态为xi条件下观察子序列是{Ot+1,Ot+2,…,OT}的确定性程度。前、后向模糊变量的计算步骤如下:

(1)初始化:

其中∧为模糊交算子。

(2)迭代:

类似地,后向模糊变量计算为:

利用式(2)计算前向后向的Choquet积分,则有

在式(5)计算前向模糊变量时,将联合测度^αΩY({O1,O2,…,Ot}×{yj})分别定义在观察序列O1,O2,…,Ot及状态yj上的两个模糊测度的联合形式,并没有假设该测度可以以乘积的形式分解,类似的,计算后向模糊变量时,做了同样的处理,因此CIHMM的统计独立性比HMM的统计独立性假设要弱。

2 运动想象EEG信号的分类

2.1 EEG信号的特征提取

CI-HMM的输入为特征向量序列,因此首先要将运动想象EEG信号按顺序分成段,再从每段中分别提取特征,构成EEG信号特征序列。本文采用窗口重叠滑动的分段方式,设数据滑动窗口Si长度为LW个采样点,窗口重叠长度为LO个采样点,即每次窗口滑动的间隔为(LW-LO)个采样点,如图1所示。

图1 EEG的特征提取分段示意图

将EEG信号分段后,对每段信号分别选取时域方法和时频域小波包方法提取特征。其中时域特征采用绝对均值和波长两类特征[12];时频域特征采用小波包分解和重构特定频段信号,然后提取各频段的相对能量作为特征[13-14]。运动想象脑电信号的ERD/ERS现象一般在alpha节律(8 Hz~14 Hz)和beta节律(14 Hz~30 Hz)比较明显,首先根据信号的频率范围,用db5小波包基函数将信号进行多层分解,然后根据alpha节律和beta节律的频段范围,选择适当的小波包子频带进行叠加重构对应的频段信号,然后计算该频段能量相对全部频段能量的比值作为特征。

2.2 CI-HMM结构的选取

在运用CI-HMM进行EEG信号分类时,可以按进行动作运动想象过程的不同阶段来对应确定模型的状态拓扑结构。想象动作是一个连续过程,当大脑皮质某区域被激活,该区域的代谢和血流增加,导致脑电波相关节律幅度降低,出现ERD,而在大脑静息或惰性状态下表现出幅度明显增高,出现ERS,针对这个过程中EEG信号的模式特点,本文选取无跨越从左至右型的CI-HMM结构,如图2所示。在该结构中每个状态下的输出测度采用混合模糊密度形式,以适应EEG信号的非平稳性和非线性。

图2 无状态跨越CI-HMM拓扑结构图

2.3 基于CI-HMM的EEG分类

应用CI-HMM对EEG信号进行模式分类时,分为训练和识别两个阶段。首先需要对每种运动想象动作所对应的模型进行训练,然后利用得到的模型进行识别操作,整个系统的原理框图如图3所示。

图3 基于CI-HMM的EEG模式分类系统

在训练阶段,首先设定模型的初始参数,然后将每种运动想象EEG的样本数据集提取特征构成特征序列集合,利用Baum-Welch算法进行样本训练得到重估后的CI-HMM参数。在识别阶段,待分类的EEG信号经特征提取得到特征序列后,输入到每种运动想象动作的CI-HMM模型中,经前后向算法分别计算出各模型^λ的输出模糊测度P(^λ),然后选取最大输出模糊测度P(^λ)对应的运动想象动作作为模式分类结果。

3 实验结果与分析

为验证所提出分类方法的有效性,对来源于由Berlin BCI研究组[15]提供的2008 年BCI Competition IV Datasets1的实验数据进行了分类实验。该数据集包含分别采集于七名健康的受试者的七组数据,其中5名受试者为左手和右手运动想象,另外2名受试者为左手和脚运动想象。实验采用双导联方式记录59个通道的EEG信号,带通滤波的范围是0.5 Hz~200 Hz,采样频率为1 000 Hz,但提供的数据进行了频率为100 Hz的下采样。

每次采集实验的过程如图4所示,首先受试者安静准备2 s,同时在屏幕上显示十字符号,在第2 s时,出现向左、向右、向下的箭头,分别提醒受试者进行左手、右手以及脚的运动想象运动,想象时间持续4 s,紧接着出现2 s黑屏,表示本次实验结束。每个受试者进行200次运动想象,单次实验持续8 s。

图4 运动想象实验时序图

本文选取4位受试者a、b、f、g的标定数据进行分类实验,其中a、f进行的是左手和脚的运动想象,b、g进行的是左手和右手的运动想象。在各通道信号中选取了运动想象分类常用的C3、C4两路通道的数据用于特征提取。为了获取较好的分类效果,同时考虑到特征提取中的小波包分析,在每次实验记录的数据中,选取受试者在执行运动想象阶段的400个采样点,以及开始运动想象之前和停止运动想象之后的各56个采样点,共512个采样点进行特征提取。

在CI-HMM的训练和识别过程中需要进行大量的模糊测度计算,如果模型拓扑结构中的状态数和混合数比较大的话,不仅增加计算量,而且需要估计的参数个数也明显增多,在有限的样本条件下,导致分类性能下降。为了尽可能地减少计算量和对训练样本的需求,根据运动想象EEG信号的特点,将CIHMM的状态数N、每种状态的模糊密度混合数M,分别设置在3~7和2~4的范围内,并分别在这个范围内组合计算对应结构模型的识别率,以寻找最优的CI-HMM结构。采用不同状态数和混合数的模型进行分类的识别结果如图5所示,其中纵坐标表示不同N、M下的平均识别率,横坐标表示受试者的状态数N,不同的标记符号表示不同的混合数M:正方形表示M=2,上三角形表示M=3,下三角形表示M=4。特征选取时域特征和小波包特征的混合特征。从图中可知,对于受试者 a、f,当 N=4,M=4时,本实验的EEG信号的分类效果最为理想;对于受试者b、g,当N=5,M=4时,分类效果最为理想。

图5 不同N、M的CI-HMM的识别率

特征提取中利用滑动窗对信号进行分段,窗口的长度LW和重叠长度LO也会影响到后续分类器的分类效果。为了分析滑动窗口的影响,取CI-HMM的最优N、M参数,选取时域特征和小波包特征的混合特征,对不同的LW和LO组合下4位受试者的分类平均识别率如图6所示,其中横纵标为滑动窗口长度和重叠长度的组合LW/LO。可以看出,对于4位受试者具有一致的结果,重叠长度对于分类结果的影响更为明显,其中128/64的组合获得的平均识别率最高。

对提取得到的不同类型特征的选择也会直接影响到信号的分类效果。本文提取了时域和小波包能量两类特征,为了探讨特征选择对于CI-HMM分类效果的影响,选择了时域、小波包能量和两类混合等3种不同特征集合进行分类实验,同时为与经典HMM分类效果进行比较,对每种特征集合分别采用CI-HMM和HMM两种分类方法进行实验,分类识别的结果如图7所示,其中T表示时域特征,W表示小波包能量特征,C表示两类混合特征。

图6 不同滑动窗下的识别率

由图7可以看出,在两种模型分类方法中,单独的时域特征集合都得到最高的识别率,表明时域特征更适合于HMM这种对随机过程建模的方法。4位受试者在3种特征集合下CI-HMM的平均识别率分别为82.4%、79.1%、82.1%,HMM 的平均识别率分别为 75.2%、72.5%、74.3%,即对于不同的特征集合,CI-HMM方法的识别性能均优于HMM方法。在CI-HMM方法中,因为模糊测度和模糊积分具有的单调性,使CI-HMM避免了独立性假设的约束,能够更一致地描述运动想象过程中的EEG信号,最终获得了高于经典HMM的分类效果。

为了进一步说明CI-HMM分类方法的有效性,采用混合特征集合的CI-HMM方法与EEG分类中常用的共空间模式(CSP)及其改进方法在同一运动想象数据集上获得的识别率[16]进行比较,如表1所示。与基本CSP方法相比,CI-HMM方法的识别率明显提高,相对于改进的滤波器组共空间模式(FBCSP)方法,单个受试者的最高识别率较低,但整体平均识别率略有提高,表明CI-HMM方法对不同受试者的适应性较好,分类结果更为稳定。CIHMM方法在单个受试者和整体平均识别率上都比邻接矩阵分解(AMD)方法要低,但CI-HMM方法只使用了 C3、C4两路通道的 EEG信号,而 CSP和AMD方法中使用了全部59路通道的EEG信号,在数据采集上的要求更高。

图7 4位受试者在不同的特征集合的分类效果

表1 不同分类方法的平均识别率比较

4 结论

本文提出运用CI-HMM对运动想象EEG信号进行分类的方法。CI-HMM利用模糊积分的单调性,有效地解决了经典HMM在计算观察序列概率时的独立性假设,从而提高了EEG信号分类的准确率。对两类运动想象动作的分类实验表明,CIHMM方法应用于运动想象EEG信号的分类中具有可行性,并能够得到较高的识别准确率。

[1] Pfurtscheller G,Neuper C.Motor Imagery and Direct Brain-Computer Communication[J].Proceedings of the IEEE,2001,89(7):1123-1134.

[2] Mak J R,Wolpaw J R.Clinical Applications of Brain-Computer Interfaces:Current State and Future Prospects[J].IEEE Reviews in Biomedical Engineering,2009(2):187-199.

[3] Rabiner L R.A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition[J].Proceedings of the IEEE,1989,77(2):257-285.

[4] Souza A P,Filho S A,Felix L B,et al.Classification of Imaginary Movements Using the Magnitude-Squared Coherence Feature Extractor[C]//Proceedings of the 2012 ISSNIP Biosignals and Biorobotics Conference,2012:1-6.

[5] Argunsah A O,Cetin M.AR-PCA-HMM Approach for Sensorimotor Task Classification in EEG-Based Brain-ComputerInterfaces[C]//Proceedings of the 20th International Conference on Pattern Recognition,2010:113-116.

[6] Yang Y,Yu Z L,Gu Z H,et al.A New Method for Motor Imagery Classification Based on Hidden Markov Model[C]//Proceedings of the 7th IEEE Conference on Industrial Electronics and Applications,2012:1588-1591.

[7] Sugeno M.Theory of Fuzzy Integrals and Its Applications[D].Tokyo Institute of Technology,1974.

[8] Mohamed M A,Gader P.Generalized Hidden Markov Models-PartⅡ:Application to Handwritte Word Recognition[J].IEEE Transactions on Fuzzy Systems,2000,8(1):82-94.

[9] Ralescu D,Adams G.The Fuzzy Integral[J].Journal of Mathematical Analysis and Applications,1980,75(2):562-570.

[10] Klement E P,Mesiar R,Pap E.A Universal Integral as Common Frame for Choquet and Sugeno Integral[J].IEEE Transactions on Fuzzy Systems,2010,18(1):178-187.

[11] Mohamed M A,Gader P.Generalized Hidden Markov Models-Part I:Theoretical Frameworks[J].IEEE Transactions on Fuzzy Systems,2000,8(1):67-81.

[12]孟明,佘青山,罗志增.HMM在下肢表面肌电信号步态识别中的应用[J].华中科技大学学报(自然科学版),2011,39(S2):177-179.

[13]黄思娟,吴效明.基于能量特征的脑电信号特征提取与分类[J].传感技术学报,2010,23(6):782-785.

[14]颜世玉,刘冲,赵海滨.基于分解的意识脑电特征提取[J].仪器仪表学报,2012,33(8):1749-1752.

[15] Blankertz B,Dornhege G,Krauledat M,et al.The Non-Invasive Berlin Brain-Computer Interface:Fast Acquisition of Effective Performance in Untrained Subjects[J].NeuroImage,2007,37(2):539-550.

[16]佘青山,昌凤玲,范影乐.基于邻接矩阵分解的脑电特征提取与分类方法[J].传感技术学报,2012,25(9):1204-1209.

猜你喜欢

识别率测度特征提取
三个数字集生成的自相似测度的乘积谱
R1上莫朗测度关于几何平均误差的最优Vornoi分划
非等熵Chaplygin气体测度值解存在性
Cookie-Cutter集上的Gibbs测度
基于类图像处理与向量化的大数据脚本攻击智能检测
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
基于Daubechies(dbN)的飞行器音频特征提取
提升高速公路MTC二次抓拍车牌识别率方案研究
Bagging RCSP脑电特征提取算法