APP下载

基于AAR模型和累积频带能量的特征提取方法

2013-06-05李红利魏熙乐

关键词:频带分类器能量

李红利,王 江,邓 斌,魏熙乐

基于AAR模型和累积频带能量的特征提取方法

李红利1,2,王 江1,邓 斌1,魏熙乐1

(1. 天津大学电气与自动化工程学院,天津 300072;2. 天津工业大学电气工程与自动化学院,天津 300387)

提出了一种自适应自回归(AAR)模型参数和累积频带能量相结合的特征提取方法,该特征应用于基于运动想象脑-机接口(BCI)之中,实现左右手运动想象分类,改善BCI系统的性能.首先,对头皮EEG数据进行小波分解和重构,去除EEG中的噪声,得到不同频带的EEG数据.然后,提取EEG数据的AAR模型参数特征和不同频带的频带能量特征,提出了累积频带能量特征和AAR与累积频带能量相结合的特征提取方法,分别以AAR模型参数、频带能量、累积频带能量和AAR+累积频带能量为特征,利用线性判别分析(LDA)分类器对左右手运动想象任务进行特征分类.最后,对不同特征的分类结果进行比较,得出以AAR+累积频带能量作为特征在BCI系统中的优越性能.

脑-机接口;运动想象;自适应自回归模型;累积频带能量

脑-机接口(brain-computer interface,BCI)是不依赖于外周神经和肌肉,直接在大脑与外部设备之间建立的交流通道,实现人脑与计算机或其他电子设备的通信和控制[1-2].BCI在康复、军事和娱乐等领域具有重大应用价值.BCI作为连接生物智能系统与人工智能系统的一个复杂平台,涉及神经科学、康复工程、生物医学工程、计算机科学、以及自动控制等多学科的交叉研究.

根据BCI采用的输入信号种类,BCI可以分为基于视觉诱发电位的BCI、基于P300的BCI、基于运动想象的BCI和基于皮层慢电位的BCI等.其中,基于运动想象的BCI系统最大的优点是,EEG信号只是通过想象产生,不依赖任何视觉或声音刺激,实验设计简单,属于真正意义上的BCI系统[3-4].

在BCI系统中,EEG数据特征提取和分类是关键.目前常用的基于运动想象EEG特征有功率谱[5-7]、AR模型和AAR模型参数[8-9]、频带能量[10]以及几种特征的组合等.常用的分类方法有神经网络分类器[11]、线性判别分析[12-14]、支持向量机[15]、规则化判别分析[16]和多分类器结合等[17].目前,现有BCI系统的识别正确率和识别速率、性能稳定性等关键技术还需要解决.这些因素限制了脑-机接口的实际应用.就BCI目前的发展状况而言,虽然有很大进步,但距离实际应用还有一段很长的路要走.大多BCI系统还都处于实验室测试阶段,仍没有投入商业运作[18-20].

笔者研究了基于左右手运动想象的BCI系统,根据记录的头皮EEG数据,实现左右手运动想象的分类.头皮EEG属于微伏级弱信号,频率范围在0.5~100,Hz之间.由于EEG是非平稳的信号,利用AAR模型可以更好地描述非平稳的信号,因此,本研究首先以AAR模型参数作为EEG特征,采用卡尔曼滤波方法估计AAR模型参数.本研究还提取了EEG的频带能量特征,所选频带范围是7.5~15,Hz,该频带范围包含了mu节律,与感觉运动密切相关.采用LDA分类器分别对2种特征进行分类.针对以AAR模型参数和频带能量作为特征所得分类结果的缺点,提出以累积频带能量作为特征向量,将分类结果与以频带能量作为特征的分类结果相比较,得出累积频带能量作为特征的优势.最后,将AAR模型参数与累积频带能量相结合作为特征向量,将所得结果与单独采用AAR模型、频带能量或累积频带能量作为特征的结果进行了比较.

1 实验数据

实验数据来自第二届国际BCI大赛上的数据DataIII[21],由奥地利的Graz科技大学提供.受试者是一位25岁的女性.受试者坐在一个有扶手的椅子上,全身放松.意识任务是按照屏幕提示通过想象左右手运动来控制反馈进度条.屏幕提示想象左手或右手运动的顺序是随机的.

实验分7组进行,每组包含40次实验,共280次实验.所有实验均在1,d内完成,每组实验之间有几分钟的休息时间.图1所示为电极位置和实验过程示意,每次实验的时间为9,s.在最初2,s时,受试者思维处于放松状态,不进行任何想象活动.在t=2,s时,系统发出提示音,提示受试者集中注意力,等待想象指令,显示屏上出现一个持续1,s的十字光标,此时受试者开始准备运动想象.在t=3,s时,屏幕显示向左或向右的箭头提示,受试者根据提示内容,分别想象左右手运动,控制屏幕上进度条的箭头向左或向右移动.受试者的想象活动一直持续到第9秒.使用3组双极性导联方式记录头皮EEG数据,电极放置在C3、Cz、C4 3个位置前后各2.5,cm处,前正后负,电极为Ag/AgCl电极.采样频率为128,Hz,采样数据经过0~30,Hz滤波器进行带通滤波.

图1 电极位置和实验过程示意Fig.1 Electrode positions and experiment process

分类器的训练样本和测试样本从实验数据中随机选择,各包含140次实验数据.数据以Matlab数据文件格式保存.共包含3个数组X_train、X_test和Y_train;X_train数组为训练样本集,维数为1,152× 3×140,1,152为单次实验的采样数目,3表示每3个通道的实验数据,140表示共140次实验.Y_train数组维数是140×1,对应每次实验的运动想象标签,数组中的元素由1和2组成,分别用来表示左手和右手运动想象.X_test数组格式与X_train的完全相同,作为测试样本.

2 特征提取

2.1 小波滤波

传统的信号分析建立在Fourier变换基础上,可以分析信号的全局性频率特征,但不能反映信号的局部时间特征.虽然短时Fourier变换可以进行时频分析,但该方法的精度受到窗口尺寸的限制.小波变换是一种新的信号变换分析方法,它继承和发展了短时Fourier变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的时间-频率窗口,是进行信号时频分析和处理的理想工具.它通过伸缩和平移等运算功能,可对函数或信号进行多尺度的细化分析,解决了Fourier变换不能解决的许多困难问题.因而,小波变化被誉为“数学显微镜”.利用小波分解和小波重构技术可以在频域范围内对信号进行多分辨率分析,降低信号的噪声,这相当于对信号进行不同频带的滤波.

本研究中,原始采样EEG数据经过0~30,Hz滤波器带通滤波后,得到数据s.采用三阶Daubechies小波变换对EEG数据s进行3层小波分解.然后,利用小波逆变换分别重构各个子频带的EEG信号,得到d1(15~30,Hz)、d2(7.5~15,Hz)、d3(3.75~7.5 ,Hz)和a3(0~3.75,Hz)4个子频带的EEG数据.本研究以信号s和4个子频带的信号作为数据,研究不同运动想象任务的分类问题.图2给出了某次实验单个通道(C4通道)部分数据(前500个)的EEG信号s和利用小波逆变换重构的4个子频带的EEG.

图2 EEG信号s和小波重构的各子频带EEGFig.2 EEG s and sub-bands EEG reconstructed with wavelet

2.2 基于卡尔曼滤波的AAR模型特征

由于EEG数据的非平稳性,本研究采用AAR模型,对EEG数据进行建模,AAR为

式中:vk是均值为零、方差为σv2(k)的高斯白噪声;下标k表示离散时间序列的时间点;p为模型阶数;yk表示当前时刻的EEG采样值;yk-i(i=1,…,p)表示当前时刻以前的p个采样值;ai,k表示时变的AR模型参数.与AR模型相比,AAR模型参数并非常数,而是允许其值随着时间而自适应变化,这是AAR模型和AR模型的区别.正是由于这一点,使得AAR模型可以描述EEG数据的非平稳特征.

AAR模型参数估计有多种方法,如最小均方误差(LMS)准则、递归最小二乘法、递归方法、卡尔曼滤波(KF)方法等.这里介绍用卡尔曼滤波算法估计AAR模型系数[22],该方法具有时间分辨率高、计算量小的特点,非常适合用于脑电数据的在线分析.卡尔曼滤波算法是一种迭代递推算法,用于估计系统状态空间方程中的状态向量.AAR模型写成状态空间方程的形式为

卡尔曼滤波估计算法就是利用观测信号ky估计状态向量ka.其中式(2)为状态方程,式(3)为观测方程.

基于该算法的AAR模型参数估计算法为

式中:ek为单步预测误差;Ak为先验状态误差协方差矩阵;Qk为预测协方差;Vk为协方差;Kk为卡尔曼增益矩阵;Zk为后验状态误差协方差矩阵.式(5)中单独计算(AY)k-1是因为式(6)、式(7)和式(9)中都用到了这个结果,因此计算并存储该值可以提高运算效率.ak的初始值a0为零向量,Ak的初始值A0设定为p阶单位矩阵.

本研究采用AAR模型分别对C3和C4通道的数据进行建模,通过不同模型阶数的仿真比较,同时考虑运算速度和模型的精度,最终选择AAR模型阶数为三阶.因此,AAR模型特征向量中含有6个元素.观测噪声协方差Vk和过程噪声协方差Wk的选择可参照文献[22]中表1和表2所列的结果选择,本研究中选择Vk计算式为

式中UCR为更新系数,本研究设置为0.001.选择kW计算式为

2.3 频带能量特征

采用频带能量进行EEG特征提取.对于基于运动想象的BCI系统,频带能量是一种很好的特征提取方法.计算频带能量时,对EEG数据进行逐点平方后取平均值,最后取自然对数.通过分析比较,频带能量计算时,采用的频带为d2子频带7.5~15,Hz,该频带与大脑感觉运动密切相关,时间滑动窗选为1,s.分别对C3和C4通道EEG数据提取频带能量特征,组成特征向量,因此频带能量特征向量含有2个元素.

2.4 累积频带能量特征

针对频带能量作为特征进行分类时,分类正确率的波动问题,提出了累积频带能量特征.将所得的C3和C4通道频带能量进行非线性变换,即

式中:d为对数频带能量;y为变换后的频带能量.然后,对变换后的频带能量求累积平均,将所得累积频带能量作为EEG特征,用于分类. 其计算式为

式中:ky为第k个采样时刻的频带能量非线性变换后的数值;N为当前时刻以前的所有采样样本数.

从式(15)可以看出,利用累积频带能量作为特征进行分类时,实际上考虑了当前时刻以前所有频带能量特征的综合,而不是只考虑当前时刻的频带能量特征,可以期望获得较平稳的分类结果.另外,计算累积频带能量时,从第4秒开始累积计算,也就是求累积平均时,并不包括第4秒以前的频带能量.之所以从第4秒开始计算,从图1中的实验过程可以看出,受试者第3秒才开始运动想象,第4秒后真正进入运动想象状态,这时的EEG特征对于运动想象分类才有意义.这一点从后面图3中的分类误差也可以看出,从图3(a)、(b)可以看出,第4秒以后分类误差才开始明显下降,也就是第4秒之后的EEG分类特征才明显.

图3 4种EEG特征的分类误差曲线Fig.3 Classification error curves of the four EEG features

2.5 AAR模型和累积频带能量相结合的特征

AAR模型可以描述EEG数据的非平稳特性,累积频带能量可以考虑当前时刻以前所有的频带特征,可以使分类结果波动较小,因此,将2种特征组合作为运动想象BCI的特征向量,期望获得更好的分类性能.组合后的特征向量包含8个元素,其中6个元素为C3和C4通道的AAR模型参数,另外2个元素为C3和C4通道的累积频带能量.

3 分类器

分类是BCI系统中的重要环节,选择LDA作为分类器.之所以选择LDA分类器,是因为从以往几届的BCI大赛结果可以看出,LDA的分类性能甚至要好于某些非线性分类器,而且几乎所有获胜队伍的分类器均为线性分类器.LDA分类器为

式中:Σi为第i类的协方差矩阵;μi为第i类的均值;x为特征向量;D( x)为分类器的输出.如果D( x)大于0,则为右手运动想象;如果D( x)小于等于0,则为左手运动想象.

4 仿真结果及讨论

如图3所示为4种EEG特征的分类误差曲线.图中的虚线为采用4折交叉验证所得的平均分类误差,每秒钟分类8次,也就是每16个采样点分类1次.实线为对每个采样点进行分类,每秒钟分类128次所得的分类结果.从图中可以看出,图3 (a)以AAR的模型参数作为特征,所得的分类误差较大,分类正确率较低.图3(b)以频带能量作为特征,误差曲线呈“V”字形,即在第6秒附近所得的分类误差小,而其他时间分类误差较大,而且分类误差的波动较大.图3(c)以累积频带能量作为特征,所得的分类误差较小,而且误差波动较小,从第7秒以后,分类误差一直保持较小数值.图3(d)以AAR+累积频带能量作为特征,所得分类误差曲线与图3 (c)相似.

图4为4种EEG特征分类结果的Kappa系数.Kappa系数是用来检验分类结果正确程度的量,Kappa系数的值在[-1,+1]范围内.Kappa系数的值越大说明判别一致性越好.Kappa系数大于等于0.75时,两者一致性较好;Kappa系数大于等于0.40,小于0.75时,两者一致性一般;Kappa系数小于0.40时,两者一致性差.从图中可以看出,图4(a)的Kappa系数在第5秒后,位于0.40~0.70之间,说明分类结果的一致性一般.图4(b)的Kappa系数在第6秒左右达到最大值,然后又减小,数值波动较大,说明分类结果的一致性一般.图4(c)中,Kappa系数在6.5,s左右达到较大数值,然后一直保持较大数值,说明分类结果一致性较好.图4(d)中Kappa系数的变化趋势与图4(c)相似,但Kappa系数值更大,说明分类结果一致性好.

图4 4种EEG特征的Kappa系数Fig.4 Kappa coefficients of the four EEG features

图5 为4种EEG特征的互信息(MI).互信息是基于Shannon信息论原理提出的,互信息既考虑了分类器输出的符号标识,又考虑了分类器的输出幅值大小.与分类误差比起来更具有鲁棒性.在本研究用互信息来评价不同EEG特征的质量和效果.互信息越大说明分类效果越好.从图4可以看出,AAR+累积频带能量作为特征的互信息最大,说明分类效果最好;AAR参数作为特征的互信息最小,分类效果最差.

图5 4种EEG特征的互信息Fig.5 Mutual information of the four EEG features

表1中给出了4种特征向量分类结果,分别以最小分类误差、最大Kappa系数和最大互信息值作为BCI系统分类结果的评价指标.从表1中可以看出以AAR模型参数作为特征,所得的3个评价指标均最差,说明单纯以AAR模型参数作为特征,所得BCI系统的分类性能最差.单纯以频带能量作为特征时,从表1中可以看出,所得的3个性能指标较好.但从图2~图4中可以看出,3个性能指标只在某一特定时间范围内较好,其余时间较差,性能指标波动较大.因此,在进行BCI系统实际应用时,若以频带能量作为特征,需要寻找性能指标最好的时刻作为最佳分类时刻,而实际的最佳分类时刻因人而异,很难统一.表中以累积频带能量作为特征时,所得的3个性能指标均较好,而且,从图2~图4中还可以看出,性能指标在第7秒以后一直保持较好数值,这给实际BCI系统分类时间的选择提供了很大的柔性.从表1中还可以看出,当以AAR+累积频带能量作为特征时,所得的3个性能指标均最好,略好于以累积频带能量作为特征时的性能指标,而且从图2~图4中也可以看出,性能指标在第7秒以后一直保持较好数值,这与将AAR模型参数与累积频带能量相结合有关.AAR模型参数可以体现EEG的非平稳性,而累积频带能量可以综合考虑当前分类时刻以前的所有特征,因此,所得BCI系统的性能最好.

表1 4种特征的分类结果Tab.1 Classification results of the four features

5 结 语

基于左右手运动想象BCI系统,讨论了4种EEG特征的性能.从仿真结果可以看出以累积频带能量作为特征的BCI系统,不仅考虑了当前时刻EEG的频带能量特征,而且考虑了当前时刻以前的频带能量特征,获得了较好的分类性能.而以AAR模型参数和累积频带能量相结合作为特征,既体现了EEG的非平稳性,又包含了累积频带能量,因此,获得了最佳分类性能,可作为基于运动想象的BCI系统特征提取的优先选择.

[1] Vidal J J. Real-time detection of brain events in EEG [J].Proceedings of IEEE,1977,65(5):633-641.

[2] Pfurtscheller G,Allison B Z,Brunner C,et al. The hybrid BCI[J]. Frontiers in Neroscience,2010,4:1-11.

[3] Hochberg L R,Serruya M D,Friehs G M,et al. Neuronal ensemble control of prosthetic devices by a human with tetraplegia [J]. Nature,2006,442(13):164-171.

[4] Pfurtscheller G,Solis-Escalante T,Ortner R,et al. Self-paced operation of an SSVEP-based orthosis with and without an imagery-based “brain switch:” A feasibility study towards a hybrid BCI [J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering,2010,18(4):409-414.

[5] McFarland D J,Sarnacki W A,Vaughan T M,et al. Brain-computer interface(BCI)operation:Signal and noise during early training sessions [J]. Clinical Neurophysiology,2005,116(1):56-62.

[6] Koyama S,Chase S M,Whitford A S. Comparison of brain-computer interface decoding algorithms in openloop and closed-loop control [J]. J Comput Neurosci,2010,29(1/2):73-87.

[7] Pfurtscheller G,Muller-Putz G R,Pfurtscheller J,et al. EEG-based asynchronous BCI controls functional electrical stimulation in a tetraplegic patient [J]. EURASIP Journal on Applied Signal Processing,2005,2005(19):3152-3155.

[8] Schloegl A,Lugger K,Pfurtscheller G. Using adaptive autoregressive parameters for a brain-computer interface experiment [C] // Proceedings of 19,th Annual Int Conf of the IEEE Engineering in Medicine and Biology Society. Chicago,USA,1997:1533-1535.

[9] Schloegl A,Neuper C,Pfurtscheller G. Subject specific EEG patterns during motor imaginary [C] // Proceedings of 19,th Annual Int Conf of the IEEE Engineering in Medicine and Biology Society. Chicago,USA,1997:1530-1532.

[10] Wang Shuxin,Xiao Xuezhong,Wang Yanhui,et al. Denoising method for shear probe signal based on wave let thresholding[J]. Transactions of Tianjin University,2012,18(2):135-140.

[11] Hung C I,Lee P L,Wu Y T,et al. Recognition of motor imagery electroencephalography using independent component analysis and machine classifiers [J]. Ann Biomed Eng,2005,33(8):1053-1070.

[12] Muller-Putz G R,Scherer R,Pfurtscheller,et al. EEG-based neuroprosthesis control:A step towards clinical practice [J]. Neurosci Lett,2005,382(1/2): 169-174.

[13] Vidaurre C,Schlögl A,Cabeza R,et al. A fully online adaptive BCI [J]. IEEE Transactions on Biomedical Engineering,2006,53(6):1214-1219.

[14] Vidaurre C,Schlögl A,Cabeza R,et al. Study of online adaptive discriminant analysis for EEG-based brain computer interfaces [J]. IEEE Transactions on Biomedical Engineering,2007,54(3):550-556.

[15] Tomioka R,Müller K-R. A regularized discriminative framework for EEG analysis with application to braincomputer interface [J]. NeuroImage,2010,49(1):415-432.

[16] Fatourechi1 M,Ward1 R K,Birch G E. A self-paced brain-computer interface system with a low false positive rate [J]. Journal of Neural Engineering,2008,5(1):9-23.

[17] Glassman E L. A wavelet-like filter based on neuron action potentials for analysis of human scalp electroencephalographs [J]. IEEE Trans Biomd Eng,2005,52(11):1851-1862.

[18] 高上凯. 浅谈脑-机接口的发展现状与挑战 [J]. 中国生物医学工程学报,2007,26(6):801-809.

Gao Shangkai. Comments on recent progress and challenges in the study of brain-computer interface [J]. Chinese Journal of Biomedical Engineering,2007,26(6):801-809(in Chinese).

[19] 马 赟,王毅军,高小榕,等. 基于脑-机接口技术的虚拟现实康复训练平台[J]. 中国生物医学工程学报,2007,26(3):373-378.

Ma Yun,Wang Yijun,Gao Xiaorong,et al. Virtual reality rehabilitation training platform based on brain computer interface(BCI)[J]. Chinese Journal of Biomedical Engineering,2007,26(3):373-378(in Chinese).

[20] 万柏坤,李 佳,明 东. 用于肢体运动系统的神经假体研究进展[J]. 中国医疗器械杂志,2006,30(4):235-240.

Wan Baikun,Li Jia,Ming Dong. Research on the progress of neuroprosthesis for the limb motor system [J]. China Journal of Medical Instrumentation,2006,30(4):235-240(in Chinese).

[21] Schloegl A. The Electroencephalo-Gram and the Adaptive Autoregressive Model:Theory and Applications [D]. Graz: Department of Medical Informatics,University of Graz,2000.

[22] Blankertz B. BCI Competition 2003[EB/ OL]. http:// ida. first. fhg. de/projects/ bci/ competition/.

Feature Extraction Method Based on AAR Model and Accumulated Band Power

Li Hongli1,2,Wang Jiang1,Deng Bin1,Wei Xile1
(1. School of Electrical Engineering and Automation,Tianjin University,Tianjin 300072,China;2. School of Electrical Engineering and Automation,Tianjin Polytechnic University,Tianjin 300387,China)

A feature extraction method based on the combination of adaptive autoregressive(AAR)model parameters and accumulated band power was presented. The combination feature was used as feature vector to discriminate the left and right hand motor imagery in the brain-computer interface(BCI)system based on motor imagery. The performance of BCI was improved through this method. Firstly,wavelet transformation and inverse transformation were adopted to decompose and reconstruct scalp electroencephalogram(EEG). Noises in EEG data were filtered through this process. Different frequency band EEG signals were obtained. Secondly,the AAR model parameters and band power of different frequency bands were extracted. Then the feature extraction method based on accumulated band power feature and the combination of AAR with the accumulated band power were presented. With the AAR model parameters,the band power,the accumulated band power and the combination of AAR with the accumulated band power as feature vectors respectively;the linear discriminant analysis(LDA)classifier was used to discriminate left and right hands motor imagery tasks. Lastly,a comparison of classification results among the different features was conducted. The results show that the combined feature of AAR with the accumulated band power is superior to others in the BCI system.

brain-computer interface(BCI);motor imagery;adaptive autoregressive model(AAR);accumulated band power

R318.04

A

0493-2137(2013)09-0784-07

DOI 10.11784/tdxb20130904

2011-11-27;

2012-02-19.

国家自然科学基金资助项目(61072012);国家自然科学基金青年基金资助项目(50907044,60901035).作者简介:李红利(1978— ),男,博士研究生,lihongliln@163.com.

王 江,jiangwang@tju.edu.cn,eejwang@tju.edu.cn.

猜你喜欢

频带分类器能量
Wi-Fi网络中5G和2.4G是什么?有何区别?
基于Bark域的电子耳蜗频带划分分析和拟合研究
能量之源
单音及部分频带干扰下DSSS系统性能分析
诗无邪传递正能量
基于差异性测度的遥感自适应分类器选择
基于实例的强分类器快速集成方法
开年就要正能量
LTE-U
基于层次化分类器的遥感图像飞机目标检测