APP下载

基于CSP和RR的多类运动想象脑电信号的识别分类研究

2018-01-02曹胜海张建平冷传涛

软件 2017年12期
关键词:脑电电信号特征提取

曹胜海,彭 尧,张建平,冷传涛

(昆明理工大学信息工程与自动化学院,云南 昆明 650000)

基于CSP和RR的多类运动想象脑电信号的识别分类研究

曹胜海,彭 尧,张建平,冷传涛

(昆明理工大学信息工程与自动化学院,云南 昆明 650000)

脑-机接口通过大脑皮层的EEG活动或者大脑里单个神经元活动使得用户可以来控制设备。这方面最具挑战性的问题之一就是如何提高脑电信号的识别精度。本文采用少通道以及共同空间模式-岭回归分析的模式识别方法,并将其应用到四种运动想象脑电的识别分类。首先对原始数据进行有效的预处理,有漂移矫正,滤波,改进的ICA(Independent Component Analysis)去除伪迹;再利用CSP(Common Space Pattern)和HHT(Hibert-Huang Transform)分别对预处理好的数据进行特征提取;最后再将两种算法提取的特征分别进行 SVM(Support vector machine),LDA(Linear Discriminant Analysis)和RR(Ridge Regression)进行分类。实验结果证明,共同空间模式-岭回归分析最后的分类效果是最好的,平均分类识别率约为82.93%,数据中9名被试的最高和最低的分类识别率之间的标准差为1.37%。

脑-机接口;预处理;岭回归分析(RR);特征提取

0 引言

在 21 世纪的科学研究中,人类对大脑的深入探索将是一个重大的热点研究领域,一些国家或研究团体已经提出了“21世纪大脑研究计划”[1-5]。这一计划的目标之一是“理解脑”,然后“利用脑”,并通过“利用脑”进一步“理解脑”,更进一步是通过培育生物脑细胞和网络而“创造脑”[6]。脑-机接口(Brain-computer interface,BCI)是人类在“理解脑”的基础上,“利用脑”绕过大脑外周神经和肌肉的参与,由脑信号实现大脑与外部设备直接的通信和控制[6-8]。BCI这一国际重大前沿研究热点不仅战略性地可望用于国防军事目的[9-10],而且可望为严重运动残障人士提供一种新的用思维直接控制外部设备或机器人的通道[8],从而改善他们的生活质量;更可望为正常人提供在特殊情况下控制外部设备或机器人的新方式[11-13],从而也增加他们生活的质量。BCI的研究已经取得了一些重大突破,目前正快速发展[14-16]。与具有很大局限性的侵入式BCI相比,非侵入式采集的脑电(Electroencephalograph,EEG)实现的BCI具有潜在的实用前景[17]。

迄今为止,基于左右手的脑电信号的二分类的识别研究已经取得了很可观的成果,大多文献表明两类任务的分类准确率在80%-95%之间[18-19]。在近两次的 BCI竞赛中,共同空间模式(CSP)算法为多数参赛者使用,同时在两类任务的运动想象特征提取上它得到大多数使用者的青睐,已然成为了运动想象特征提取研究的热点。然而,目前二分类的运动想象越来越不能满足研究者的需求,其信息传输速率较慢、实用性较差,应用于现实需求具有很大的局限性。目前用于多类运动想象脑电分类的方法并不多,由于共空间模式在两类运动想象分类中已经取得了很好的效果,致使多类脑电的研究很多也是利用CSP来对运动想象模式进行特征提取。

本文主要就多类运动想象的脑电信号特征提取和分类方法进行了研究。首先将采集的原始脑电信号进行预处理,再分别使用CSP和HHT算法来提取四类脑电的特征,从而进行分类,我们设计了三种分类的算法,有 SVM(支持向量机),LDA(线性判别分析),RR(岭回归分析)。通过对比分类结果来观察同一数据在同一提取算法不同分类方法下的分类效果。

1 材料和方法

1.1 脑电采集

本研究的数据为第四届脑机-接口国际竞赛中的2a数据集,采集设备是利用22个Ag/AgCl电极的EEG放大器(每个电极间的距离为3.5 cm)进行试验,该放大器常规参数如下:采样率为250 Hz,采用左侧乳突作为记录参考电极,带通滤波器:0.5-100 Hz,放大器灵敏度为100 μV,此外50 Hz陷波滤波用来去除工频干扰。如下图1所示。

图1 22导联脑电帽脑电采集的电极位置Fig.1 22 Electrode position for EEG acquisition of lead EEG cap

1.2 预处理

最常见的方法之一就是线性滤波法。脑电信号的伪迹会出现在特定的频带之中,不会与原始脑电信号进行重叠的,低通滤波器适用于滤除肌电所产生的伪迹,而高通滤波器可以去除眼电产生的伪迹。同时由于脑机接口系统里的运动相关的电位一般隐藏在低频的脑电神经信号里,以上说的方法似乎解决不了这些问题,因这些神经信号可能会在同一频带内进行重叠,使得它们和眼电伪迹一样区分不了。然而,对于BCI系统来说这种方法在高频带(如β或μ节律)的神经信号使用是很有效的。

另一个就是ICA方法。ICA是一种基于高阶统计信息的盲源分离方法,即主要从多个通道数据中分离出相互独立的源。该算法假定源是非高斯分布,分离后的源信号具有最大的独立性。由于EEG信号具有非高斯性,且各个局部神经皮层产生的神经活动可近似认为相互独立,所以可利用ICA算法从头皮 EEG信号分离出具有明确神经电生理意义的神经活动。

假设 N个通道采集的脑电数据 x(t)=[x1(t),…,xn(t)]T是由多个隐含源脑电信号 s(t)=[s1(t),…,sn(t)]T经过线性混合而成的,如下式(1)所示:

x(t)=As(t) (1)

其中为A混合矩阵,混合矩阵A和s(t)是未知的。由于源脑电瞬时相互独立,可以找到一个线性变换分离矩阵W,使得输出信号最近似等于源信号s(t),则与(1)对应的分离模型如(2)式:

y(t)=Wx(t) (2)y(t)=Wx(t)=WAs(t) (3)式中(2)中,W是分离矩阵,y(t)=[y1(t),…,yn(t)]T是对源信号s(t)的近似估计,y(t)中的各个分量要是相互独立存在的。由以上可以得到分离变换矩阵W,本文所采用的是实验室改进的ICA算法,其中是利用FastICA算法来得出最优W。

1.3 特征提取

研究发现,当想象身体不同部位或不同肢体运动时,大脑皮层运动体感区上的脑电信号将会发生节律性能量波幅的增强和减弱现象[20];我们将波幅增强的现象称为事件相关同步(event related synchronization,ERS);而将波幅减弱的现象称为事件相关去同步(event related desychronization, ERD)。实验表明人在想象左手运动时,大脑皮层 C4导区域将会出现ERD现象,在想象右手运动时,大脑皮层C3导区域将会出现ERD现象,在想象双脚运动时,大脑皮层Cz导区域将会出现ERD现象,而在想象舌头运动时,大脑皮层Cz导区域将会出现ERS现象。因此我们可以根据这些区域能量波幅的差异提取出相应的脑电特征。

本文对经预处理后的数据进行特征提取的方法分别为CSP和HHT,使用这两种方法之前需要描述频带的特征,μ(8-13 Hz)和β(14-30 Hz)频带对代表右手运动想象的C3,左手想象的C4以及舌头和脚运动想象的Cz的分类有着至关重要的作用。本文重点是CSP方法的使用,HHT方法就简单介绍一下。

1.3.1 CSP(共同空间模式)

使用共同空间模式(CSP)进行特征提取,将单次任务实验的脑电数据表示为一个维的矩阵 E,其中N是脑电测量时的通道数,T是脑电采集时每个通道的采样点数,则归一化的脑电数据协方差矩阵可以表示为:

分差矩阵,它们可以通过计算每种实验的平均协方差矩阵别使用和代表左和右两种情况下的空间协方来获得,合成的空间协方差矩阵可以表示为:

而可以表示成,其中是矩阵的特征向量,是相应的特征值,在这一变化过程中,将特征值按照降序进行了排列,其相应的特征向量也重新进行了排列,接下来应用主成分分析法,求出白化变换:

则协方差矩阵和可以变换为:

与拥有共同的特征向量B,将白化后的EEG信号投影在特征向量B的前m和后m列特征向量上,就能够得出最佳的分类特征,投影矩阵,则单次任务实验的脑电数据E可以变换为Z=WE。最后将投影后的信号(p=1,…,2m)做如下变化后作为特征值。

1.3.2 HHT(希尔伯特-黄变换)

希尔伯特-黄变换(HHT)由美国工程院院士黄锷所提出[21],HHT能够很好地适用于分析非线性非平稳信号。HHT主要包括两部分,第一部分是经验模态分解,第二部分是 Hilbert谱分析(Hilbert spectrum analysis,HSA)。

经验模式分解(EMD)是为了获得本征模态函数(IMF),它具有自适应性、正交性、完备性、IMF分量的调制特性[22]。EMD满足如下两个条件:信号极值点的数量与零点数相等或相差是 1;信号的由极大值定义的上包络和由极小值定义的下包络的局部均值为零。

EMD过程后,进行Hilbert谱分析(HSA),以下式对每个IMF分量进行Hilbert谱变换分别求得瞬时幅值、瞬时相位,再利用提取的瞬时幅值来求能量值。

1.4 特征分类

本文对三种分类性能较好的方法进行了研究:SVM,LDA和 RR。支持向量机(support vector machines,SVM)是基于统计学习理论的一种机器学习方法,它通过适当的非线性映射将输入向量映射到一个高维的特征空间,使得数据(属于两类)总能被一个超平面分割。所谓最优分类面就是要求分类面不但能将数据正确分开,而且使分类间隔最大。

线性判别分析(Linear Discriminant Analysis,LDA)是Fisher在1936年提出的,它是有监督模式识别。线性判别分析是寻找一个方向使分类信息从高维特征向量映射到一维。线性判别分析的算法如下:

本文运用的线性判别分析是 Matlab自带的Classification Discriminant.fit函数。

岭回归分析方法实质上是一种改良的最小二乘估计法(Least-squares estimation)。岭回归分析解决了最小二乘估计法的缺点,它是一种专用于共线性数据分析的有偏估计回归方法,该方法放弃最小二乘的无偏性,损失部分信息,以放弃部分精确度为代价来寻求效果稍差但更符合实际的回归方程[23]。岭回归分析的基本思想是当自变量间存在共线性时,解释变量的相关矩阵行列式近似为零,是奇异的,也就是说它的行列式的值也接近于零,此时最小二乘估计将失效。此时可采用岭回归估计。

2 数据描述与结果

本文的实验数据采用由奥地利工业大学提供的第四届脑-机接口国际竞赛中的 2a数据集[23]。实验一共由 9名健康的被试参与此次 EEG数据采集实验,所有的试验(trials)都在每天的固定时间段进行,实验包括 6组,每组有 48个trials,总共 288个。每个trial持续时间为8 s左右,首先提示音提示被试试验开始,在前 2 s时间里显示器屏幕呈现"+"字型图案,被试应做好运动想象的准备;t=2 s时,显示器屏幕中央出现向左,向右,向上及向下的箭头,提示被试按提示的箭头方向对应的想象左手,右手,舌头及脚的运动;t=3 s至6 s期间,被试按照提示箭头的指示进行保持该动作的想象;6 s后显示器白屏,被试停止想象,进行休息。运动想象脑电采集范式如图2所示。

试验范式如图2所示。所有的实验数据来自C3,Cz和C4三个通道的数据,三个通道的电极均是双极导联,采样频率为250 Hz,且数据已经过0.5到100 Hz模拟带通滤波和50 Hz的工频陷波。

如前所述,μ节律(8-12 Hz)和β(24-30 Hz)节律对运动想象相关脑电信号的分类有着至关重要的作用。本文采用了改进的 ICA方法,针对 EEG信号较容易收到漂移、EOG信号、ECG信号的干扰,采用了漂移矫正,用改进ICA方法去除EOG信号和ECG信号,这样的处理就能的得到较为干净的实验数据,方便进行特征提取和分类[24]。数据处理都是基于MATLAB平台进行的。

在进行上述的滤波和改进的ICA处理之后,试验的EEG脑电数据就变得较为干净了,接下来进行数据的特征处理,本文使用上面已经详细介绍过的CSP和HHT对试验的EEG脑电数据进行特征的提取。SVM,LDA和RR是目前最受欢迎的且性能较好的三种分类器,其中 RR是它们中性能最好的分类器。表1显示了CSP,HHT特征提取方法和SVM,LDA及RR分类方法的结果。图3显示了用CSP,HHT特征提取方法分类的结果。图 4显示了使用SVM,LDA及RR分类器得到分类结果。由此可知,在我们这么多种的特征提取和分类方法中,能得到最优的分类结果的是CSP+RR组合的方法。图5简明地说明了本文的新颖之处。

图2 每个trial的实验范式Fig.2 Experimental paradigms for each trial

表1 9名被试的平均分类准确率Tab.1 The average classification accuracy of 9 subjects

图3 CSP和HHT特征提取方法分类结果Fig.3 Classification results of CSP and HHT feature extraction methods

图4 SVM,LDA及RR分类器得到分类结果Fig 4 Classification results of SVM, LDA and RR classifiers

3 讨论

BCIs能为严重残疾用户提供通信交流,还能用大脑对外界设备进行控制。人工手作为它们的一种应用越来越受到人们的重视。此外,它还能控制机器的运转。因此,为了实现以上这些目标,对脑电信号的处理和分析显得尤为重要。特征提取和分类是其中最关键的两个阶段。在这些方面研究者已经提出了好几种方法。Wei-Yen Hsu对每个trial的运动想象 EEG数据提出了一种自适应的模糊神经分析方法(AFNN)。[25]作者使用增强分段选择的有效性和小波-分形的特征以及对左右手运动想象数据进行自适应模糊神经网络的识别精度。他们将这种方法与现下最流行的三种有监督的分类器结合以及比较,并且他们在BCI研究中也取得了显著的成果。这三种分类器为线性判别分析(LDA),多层感知器和支持向量机(SVM)。用AFNN和SVM的方法分别能实现最高平均识别率82.3%而使用LDA分类器获得了最低的平均识别率 79.3%。此外,近年来易等人的研究表明,他们用基于CPS的三种改进的方法,有混合CPS,混合GECPS和混sTRCPS,分别得到的平均识别率依次为 70.07%,68.73%和70.43%。[26]然而,在本研究中,最重要的脑电模式识别和分类方法已经过测试和评估。在特征提取阶段,CSP和HHT两种方法在已经被使用[27]。此外,SVM,LDA和RR作为分类的方法也已在文献[29]中被使用。

图5 数据处理的流程框图Fig.5 Flow chart of data processing

从结果来看,使用CSP和HHT特征提取算法的分类识别率分别为50和60。然而,如果用SVM进行分类的话,CSP算法不如HHT算法分类的性能好;如果使用 LDA和 RR的话,CSP算法相比较HHT算法分类效果更好。因此,对于特征提取而言CSP算法有更好的性能。此外,研究结果显示在分类阶段RR算法相比较SVM和LDA算法表现出更好的分类性能。

对于所有被试,CSP+RR方法的平均分类识别率约为82.93%,数据中9名被试的最高和最低的分类识别率之间的标准差为1.37%。与Hsu的研究相比,除了取得了更好的结果,并且参加实验的被试人数也比其多类50%,因此本研究的结果更具可靠性。此外,相比易等人的研究,[26]混合CPS,混合GECPS和混sTRCPS方法具有较低的分类识别率和较高的标准差。这意味着上述方法的可靠性较低。

4 结论

本文是针对少通道的 EEG脑电信号更是基于共同空间模式和岭回归的算法对运动想象的四种类别进行分类的研究,比较了两种特征提取算法和三种分类的算法的识别分类的精度。通过比较和组合,得出了最优的特征提取和分类的算法。该研究的思路和方法可望为后续的相关研究做好铺垫,同时也为四分类的研究打下一个基础。

本研究对进一步的多分类任务相关的运动想象脑机接口研究提供了一些经验,未来应用领域有:(1)残疾患者可以依据此研究所研发的设备做多任务得出想象运动,从而实现对外接设备的控制以及交流,尽可能助于其康复;(2)依据多任务的特点可以实现对脑机接口设备进行多任务的,多角度的操作,以满足现实环境的复杂多样的需求。本研究也有不足之处,目前的研究是离线进行的未进行在线的实现,这就需要做进一步的研究得以改进。

[1] Underwood E, Kaiser J. Brain Project Draws Presidential Interest [online], Science, available: http: //news. sciencemag.org/scienceinsider/2013/02/brain-project-draws-presidential.html?ref=hp/, February 27, 2013.

[2] 段歆涔. 《科学》详解美国大脑活动图谱项目—关于人类大脑活动图谱的9 个问号. 《中国科学报》, 2013, 第3 版(国际)

[3] Alivisatos A P, Chun M, Church G M, Greenspan R J,Roukes M L, Yuste Y. The Brain Activity Map Project and the Challenge of Functional Connectomics. Neuron, 2012,74(6), 970-974.

[4] Yuste R, Alivisatos A P; Church G M; Greenspan R J,Roukes M L. The Whole Brain Activity Map: Merging Nanoscience and Neuroscience for Technology and Health.Reports: 2011 http: //hdl.handle.net/10022/AC:P:13503.

[5] 李山. 石墨烯和人脑工程入选欧盟旗舰技术项目[online],available: http://www.stdaily.com/stdaily/content/2013-01/30/content_568220.htm/, 2013/3/8.

[6] Kawato M. Brain controlled robots. HFSP Journal, 2008, 2(3),136-142.

[7] Brain-computer interface From Wikipedia, the free encyclopedia [online], available: http://en.wikipedia.org/wiki/Braincomputer_interface/, December 02, 2012.

[8] Wolpaw J R, Birbaumer N, McFarland D J, Pfurtscheller G,Vaughan T M. Brain-computer interfaces for communication and control. Clinical Neurophysiology, 2002, 113(6): 767-91.

[9] Vidal J J. Toward direct brain-computer communication.Annual Review of Biophysics and Bioengineering, 1973, 2(1):157-180.

[10] Vidal J J. Real-time detection of brain events in EEG.Proceedings of IEEE, 1977, 65(5): 633-641.

[11] Blankertz B, Tangermann M, Vidaurre C, et al. The Berlin brain-computer interface: non-medical uses of BCI technology [J]. Frontiers in Neuroscience/Neuroprosthetics, 2010,4(Article 198): 1-17.

[12] 伏云发, 王越超, 李洪谊, 徐保磊, 李永程. 直接脑控机器人接口技术. 自动化学报, 2012, 38(8): 1229-1246.

[13] 高上凯. 神经工程与BCI [J]. 生命科学, 2009, 21(2):177-180.

[14] 高上凯. 基于节律性脑电信号的BCI [J]. 生命科学, 2008,20(5): 722-724.

[15] 高上凯. 浅谈BCI 的发展现状与挑战[J]. 中国生物医学工程学报, 2007, 26(6): 801-803, 809.

[16] 高上凯. 无创高通讯速率的实时BCI 系统[J]. 中国基础科学·研究进展, 2007, 3: 25-26.

[17] 刘冲, 赵海滨, 李春胜, 等. 基于CSP与SVM算法的运动想象脑电信号分类[J]. 东北大学学报, 2010, 31(8): 1098-1021.

[18] Fabien Lotte, Guan Cuntai. Regularizing common spatial patterns to improve BCI designs: unified theory and new algorithms[J]. IEEE Transactions on Biomedical Engineering,2011, 58(2): 355-362.

[19] Li Yan, Koike Yasuharu. A real-time BCI with a small nutuber of channels based on CSP[J]. Neural Computing&Applications, 2011, 20(8): 1187-1192.

[20] Reinhold Scherer, Alois Schloeg, Felix Lee, Horst Bischof,Janez Jansa, Gert Pfurtscheller. The Self-Paced Graz Brain-Computer Interface: Methods and Applications[J]. Computational Intelligence and Neuroscience. 2007, 10: 1-9.

[21] Hilbert-Huang Transform from Wikipedia [Online], available:http://en.wikipedia.org/wiki/Hilbert-Huang_transform, August 13, 2015.

[22] 王浩华, 李胜军. 岭回归中参数估计的探讨. 海南大学学报, 2009, 27(1): 5-7.

[23] R. Leeb, C. Brunner, G. R. Muller-Putz, A. Schlogl, and G.Pfurtscheller BCI Competition 2008 -Graz data set B. Institute for Knowledge Discovery, Graz University of Technology, Institute for Human-Computer Interfaces, Graz University of Technology, Austria.

[24] 李松, 伏云发, 等. 基于左右手运动想象单通道脑电信号的预处理研究[J]. 生物医学工程, 2016, 33(5): 862-866.

[25] Hsu WY. Motor imagery electroencephalogram analysis using adaptive neural-fuzzy classification. Int J Fuzzy Syst 2014; 16: 111-20.

[26] Yi W, Qiu S, Qi H, Zhang L, Wan B, Ming D. EEG feature comparison and classification of simple and compound limb motor imagery. J Neuroeng Rehabil 2013; 10: 106.

[27] 孙会文, 伏云发, 熊馨, 等. 基于HHT运动想象脑电模式识别研究[J]. 自动化学报, 2015, 41(9): 1686-1692.

[28] He J, Ding L, Jiang L, Ma L, editors. Kernel ridge regression classification. 2014 International Joint Conference on Neural Networks (IJCNN); IEEE. 2014.

Recognition and Classification of Multi-class Motor Imagery EEG Signals Based on CSP and RR

CAO Sheng-hai, PENG Yao, ZHANG Jian-ping, LENG Chuan-tao
(Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650000, China)

Users are equipped with the capability of controlling devices through EEG activity of cerebral cortex and one single neuronal activity in the brain, based on the brain-computer interface. In this regard, the most challenging problem lies in how to improve the identification precision of electroencephalogram signals. The paper adopts an identification method called fewer channels and common spaces mode-ridge regression analysis, to identify and categorize four motor imagination EGGs. Original data is pretreated effectively at first, and then drift correction, filtration and modified ICA (Independent Component Analysis) are undertaken to remove artifacts; CSP(Common Space Pattern) and HHT (Hibert-Huang Transform) are used to extract features of pretreated data; The features extracted by two algorithms are categorized in terms of SVM (Support vector machine), LDA (Linear Discriminant Analysis) and RR (Ridge Regression) in the end. Experimental results show that common spaces mode-ridge regression analysis is the most effective tool when it comes to categorization, with an average identification rate of almost 82.93%. The standard deviation between the highest identification rate and the lowest identification reaches 1.37% out of nine samples to be categorized.

Brain-computer interface; Pretreatment; Ridge regression analysis (RR); Feature extraction

曹胜海,昆明理工大学信息工程与自动化学院,硕士学历在读研究生,主要研究方向为:脑机接口和控制工程领域;彭尧,昆明理工大学信息工程与自动化学院,硕士学历在读研究生,主要研究方向为:脑网络和模式识别;张建平,昆明理工大学信息工程与自动化学院,硕士学历在读研究生,主要研究方向为:脑机接口和控制工程;冷传涛,山东中烟工业有限公司青州卷烟厂,工学学士,主要研究方向电气控制。

TN911.7

A

10.3969/j.issn.1003-6970.2017.12.044

本文著录格式:曹胜海,彭尧,等. 基于CSP和RR的多类运动想象脑电信号的识别分类研究[J]. 软件,2017,38(12):223-228

猜你喜欢

脑电电信号特征提取
基于联合聚类分析的单通道腹部心电信号的胎心率提取
基于Code Composer Studio3.3完成对心电信号的去噪
基于Daubechies(dbN)的飞行器音频特征提取
基于随机森林的航天器电信号多分类识别方法
Bagging RCSP脑电特征提取算法
现代实用脑电地形图学(续)
现代实用脑电地形图学(续)
现代实用脑电地形图学(续) 第五章 脑电地形图的临床中的应用
现代实用脑电地形图学(续) 第五章 脑电地形图在临床中的应用
基于MED和循环域解调的多故障特征提取