APP下载

一种基于参数优化C-SVM 的脑电信号分类方法及应用

2014-02-23刘毅坚

关键词:电信号轮椅分类器

张 毅,刘毅坚,罗 元

(重庆邮电大学智能系统及智能机器人研究所,重庆 400065)

0 引言

脑机接口(brain-computer interface,BCI)是指一种不依赖于大脑外围神经与肌肉等正常输出通道的通讯控制系统。它通过对人体的脑电信号进行采集,并进行特征提取和分类识别后转化为特定的控制指令,这样,人们就可以直接通过大脑来表达自己的思想或者操纵外部设备,而不需要语言或者肢体动作的辅助[1]。

脑电信号特征分类技术是BCI系统的关键技术之一。由于脑电信号本身极其微弱和脑电信号的复杂性,要使得从其中高效率地区分不同意识活动的成分成为可能,对模式识别理论有着更高的要求[2]。

支持向量机(support vectormachine,SVM)是在统计学理论的基础之上提出的一种机器学习方法,它集成了最大间隔超平面、Mercer核、凸二次规划和松弛变量等多种理论[3-5]。支持向量机根据结构风险最小化的原则,提高了机器学习的泛化能力,它将优化问题转化为求解一个凸二次规划的问题,二次规划所得的解是唯一的且为全局最优解,这样就不存在一般神经网络的局部极值问题。SVM由于较好地解决了小样本、非线性、高维数、局部极小点等实际问题,因此,在脑电信号特征分类领域方面有极高的应用价值。但是由于SVM是借助二次规划来求解支持向量,而求解二次规划将涉及m阶矩阵的计算(m为样本的个数),当m数目很大时该矩阵的存储和计算将耗费大量的机器内存和运算时间,因此,对大规模训练样本难以实施。

通过小波变换[6]对基于运动想象的脑电信号进行特征提取[7-9],并使用 C-SVM 的方法对提取的特征进行了训练和分类,应用在控制智能轮椅运动之上。在大量实验的基础上,对C-SVM的参数进行了优化,使得分类的准确率有了进一步的提高。

1 实验数据采集

本文所使用的脑电信号数据是通过Emotiv SDK Headset来采集的。采集所用的14个电极位置分别为 AF3,F7,F3,FC5,T7,P7,O1,O2,P8,T8,FC6,F4,F8,AF4。该脑电数据采集设备所采用的14个电极在国际10-20导联系统位置图中的具体位置分布如图1所示。

图1 Emotiv Headset与国际10-20导联系统位置图Fig.1 Emotiv Headset and international10-20 system

该系统的采样频率为128 Sample/s,从图1中的电极位置可以看到,这14个电极中的上半部分的8个电极基本上覆盖了大脑的前中部的区域,医学证明,这正是人脑的中央运动区,人体四肢的运动与这部分的脑域息息相关,这就为提取脑部的运动想象信号提供了途径。

2 数据处理方法

将采集到的运动想象信号进行小波变换后得到想要的特征向量,并将其归一化处理以后,通过支持向量分类机(support vector classification,SVC)来进行特征分类,从而进一步将脑电信号转化为希望得到的智能轮椅控制指令。

2.1 C-SVC原理

2.2 C-SVC模型的参数优化

在给定训练样本集和确定使用RBF核函数后,C-SVC模型还需要确定惩罚参数C和核参数σ,C的作用是调节C-SVC置信范围和经验风险的比例,取其折衷以使其泛化能力最好,σ又称为核宽度,它反映出训练样本数据的分布特性,确定局部领域的宽度,较大的σ意味着较低的方差。所以,这2个参数在很大程度上决定了C-SVC的学习能力和泛化能力[9]。

通过对训练样本集进行训练,得到分类模型后,利用测试集样本对分类器进行检验,得到的准确率就反应了分类器分类效果(这里将损失函数都取为0-1损失函数)。但是,注意到这种评价是有缺陷的,原因是它只关注了经验风险,下面给出一个例子来说明这一观点。设给定的训练集样本如下,T={(x1,y1),…,(xl,yl)}∈(X × Y)l,其中,xi∈X=Rn,yi∈Y={- 1,1},i=1,…,l,没有自相矛盾的点,构造决策函数如下

易知,以上决策函数的分类正确率达到100%,但这显然不是理想的结果。

基于以上的原因,为了量化地表示C-SVC的学习能力和泛化能力,在评价算法方法上,本文采用了n 折交叉检验(n-fold cross-validation)的方法[10]。首先,将l个样本点随机的分成n个互不相交的子集,每个子集的大小大致相等。然后,取其中一个子集作为样本测试集,剩余n-1个子集作为样本训练集,由此显然可以进行n次不同的训练测试,从而得到n个不同的的pi值,通过求得平均的分类正确率,就可以量化地判断该分类器的优劣。同时,交叉检验也能很好地避免参数C取值过大所带来的过拟合现象。

由于使用常用的穷举法(如网格搜索[11]等)来确定参数的最优值会使得计算任务过于繁重,导致寻优时间过长,因此,在确定C和σ的取值上,本文通过求解LOO误差上界的凸二次规划问题,来寻求最优的参数取值。对任意核函数,首先将对偶算法(3)式变形得到

3 实验数据分析

实验中,首先在离线状态下对5位受试者的脑电信号数据进行了分析。每位受试者分别进行想象左右手运动的任务,各取其中的150组样本,即组成了一个样本数为300的训练集样本,对着5组数据分别进行分析,得到了一些有用的结果。

取其中一位受试者数据观察并分析分类器的训练情况,如图2所示。图2是在网格搜索下的参数C和σ的不同取值所对应的分类准确率等高线图,及其所对应的3D视图(C,g的寻优取值为2-8~28)。从图2中可以看到,通过网格搜索得到最优参数C=0.176 78和σ=0.5(注意由于参数形式不同,这里σ2=1/g),得到最优分类准确率为95.3%。而本文通过LOO误差上界的方法求得最优参数C=0.193和σ=0.471,分类准确率为95%。不仅在最优取值的区域上基本相同,而且分类的准确率并没有下降,由于避免了网格搜索等穷举法,使得运算效率大大提高。同时,由图2中可以看出,较大的C值时同样有很好的分类准确率,但是这可能是过拟合现象所带来的。通过交叉检验的方法,可以很好地避免C值过大的情况,得到较为理想的参数取值。

图2 SVC参数网格寻优Fig.2 Grid sreach method for C-SVC

图3是经验参数下的分类器ROC曲线图和优化参数下的ROC曲线图的比较,其中,实线和虚线分别是1,-1两类样本的ROC曲线。从图3中可以清楚地看到,优化后的曲线更接近左上角,同时下面积也更大,具有更好的分类效果。

表1为5组受试者的训练样本分别的分类效果比较。通过与经验参数(一般取C=1,σ=0.1)下分类效果进行比较,可以看到,在优化参数后,分类器的分类准确率有了明显的上升。

图3 分类器的ROC曲线Fig.3 ROC curve for classification

表1 受试者脑电信号数据在两类分类器下的表现Tab.1 Performance of two kinds of classifiers

实验中还比较了固定训练样本集的情况下各类分类器的训练时间,如表2所示。表2中分别比较了经验参数下、网格搜索寻优参数下和LOO误差上界寻优参数下C-SVC分类器的训练时间,每种分类器在固定样本集(样本数为300)的情况下分别进行了20次的训练。虽然在不同的硬件环境下,计算时间不尽相同,但是可以看到,LOO误差上界寻优参数下C-SVC分类器的训练时间不仅远低于网格搜索寻优参数下的训练时间,同时相较经验参数下分类器的训练时间仍在可接受范围之内。

表2 3类C-SVC分类器的训练时间Tab.2 Training time of three kinds of C-SVC classifiers

4 智能轮椅BCI系统的实现

Emotiv通过其自带的无线连接方式连接到PC,PC在处理采集数据后通过wifi局域网将控制指令传输给智能轮椅,如此就组成了一个完整的BCI系统,如图4所示。

图4 智能轮椅BCI控制系统Fig.4 BCIsystem of intelligentwheelchair

目前将基于运动想象脑电信号运用到实际控制中的案例很少,所采用的信号处理方法也不尽相同,其分类准确率一般[2,13,14]在 65% -80% 。实验中,5位受试者通过想象左右手运动控制轮椅左转和右转,每位受试者在他人的指示下随机的进行40次想象,左右手分别20次,得到实验结果如表3所示。

由表3可以看出,脑电信号应用在控制轮椅中的总体分类的效果有较好的表现,优化参数后的样本分类器的效果达到较为理想的效果。

表3 运动想象脑电信号控制智能轮椅效果测试Tab.3 Accuracy ofmotor imagery signal controlling the intelligentwheelchair

5 结束语

本文提出了一种基于参数优化C-SVM的脑电信号控制方法。通过采集多名受试者的脑电信号并控制智能轮椅进行验证,取得了较为满意的效果。从实验中,得出以下几点结论:①通过C-SVM在满足较好的实时性的前提下,能够较好地解决了脑电信号特征分类非线性、高维数的问题,在本文提出的参数优化条件下,分类的准确率也得到了进一步的提高;②在基本的交叉检验方法之上,结合ROC曲线,比较真实地反应了分类器的学习能力和泛化能力,为之后的优化参数验证提供了理想的实验平台;③根据LOO误差上界理论求得较为理想的惩罚参数C和核函数参数的方法,仿真实验和实际在智能轮椅上的应用证明了该优化参数的性能,同时大大缩短了寻优时间。

注意到,LOO误差上界并没有求出理论上的误差最小值,它只是一个误差的上界,因此,在准确率上分类器仍有提升的空间。同时,本文只是对脑电信号进行二分类研究,而多分类在控制上明显有更大的优势。未来的工作也将主要集中在完善这两部分的内容上。

[1]JONATHAN RW,NIELSB,DENNISJM,etal.Braincomputer Interfaces for Communication and Control[J].Clinical Neurophysiology,2002,113(6):767-791.

[2]徐宝国.基于脑电信号的人机接口技术研究[D].南京:东南大学,2009.

XU Baoguo.The Research on Human-machine Interface Technology Using EEG Signal[D].Nanjing:Southeast University,2009.

[3]邓乃扬,田英杰.数据挖掘中的新方法:支持向量机[M]. 北京:科学出版社,2004:96-97.

DENG Naiyang,TIAN Yingjie.A New Method of Data Mining:Support Vector Machine[M].Beijing:Science Press,2004:96-97.

[4]GUO Lei.Classification of Mental Task From EEG Signals Using Immune FeatureWeighted Support Vector Machines[J].IEEE Transactions on Magnetics,2011,47(5):866-869.

[5]DANIEL J S,JAMES A B.Support Vector Machine Techniques for Nonlinear Equalization [J].IEEE Transactions on Signal Processing,2000,48(11):3217-3226.

[6]徐宝国,宋爱国,王爱民.基于小波包能量的脑电信号特征提取方法[J].东南大学学报:自然科学版,2010,40(6):1203-1206.

XU Baoguo,SONG Aiguo,WANG Aimin.EEG Feature Extraction Method Based on Wavelet Packet Energy[J].Journal of Southeast University:Natural Science Edition,2010,40(6):1203-1206.

[7]ELENA LG.AWavelet-like Filter Based on Neuron Action Potentials for Analysis of Human Scalp Electroencephalographs[J].IEEE transactions on bio-medical engineering,2005,52(11):1851-1862.

[8]BAYRAM I,SELESNICK IW.Frequency Domain Design of Overcomplete Rational Dilation Wavelet Transforms[J].IEEE Transactions on Signal Processing,2009,57(8):2957-2972.

[9]唐晓初.小波分析及其应用[M].重庆:重庆大学出版社,2006:32-43.

TANG Xiaochu.Wavelet Analysis and its Application[M].Chongqing:Chongqing University Press,2006:32-43.

[10]YIN Jinliang,ZHU Yongli,YU Guoqin.Power Transformer Fault Diagnosis Based on Support Vector Machine with Cross Validation and Genetic Algorithm[C]//IEEE.Advanced Power System Automation and Protection.Beijing:IEEE Press,2011,1:309-313.

[11]VLADIMIR N V.Statistical Learning Theory[M].A-merica:Wiley-Interscience,1998.

[12]CARL S.Parameter Selection for Support Vector Machines[EB/OL].(2002-06-06) [2011-09-03].http://www.hpl.hp.com/techreports/2002/HPL-2002-354R1.html.

[13]SUN Aiqin,FAN Binghui,JIA Chaochuan.Motor Imagery EEG-based Online Control System for Upper Artificial Limb[C]//IEEE.International Conference on Transportation,Mechanical and Electrical Engineering.Chang-Chun:IEEE Press,2011,1:1646-1649.

[14]ALESSANDRO B B,TEODIANO F B,MáRIO S F.Proposal of Brain-Computer Interface Architecture to Command a Robotic Wheelchair[C]//IEEE.International Symposium on Industrial Electronics.Gdansk:IEEE Press,2011,1:2249-225.

张 毅(1966-),四川潼南人,教授/博士生导师,2002年于华中科技大学获得博士学位;2002年9月进入东南大学移动通信国家重点实验室从事博士后的研究工作,2005年10月博士后出站;2004年6月-2005年6月为英国Essex大学的访问学者。现任重庆邮电大学自动化学院副院长,中国计量测试学会高级会员,重庆市人工智能学会理事,智能系统及机器人研究所所长,国家信息无障碍工程研发中心主任。长期从事智能系统与机器人、多传感器信息融合,无线定位技术、智能检测与仪表、现代信号处理的教学、科研工作。E-mail:zhangyi99@263.net。

刘毅坚(1987-),男,在读硕士研究生。2009年于武汉大学获得通信工程专业学士学位,现于重庆邮电大学攻读控制理论与控制工程专业硕士学位,现工作于国家信息无障碍工程研发中心。主要研究方向为人机接口系统,脑机接口,智能系统及人工智能方向。E-mail:oophoenixoo@126.com。

罗 元(1972-),贵州贵阳人,教授,光纤通信技术重庆高校重点实验室主任。SPIE会员、美国光学学会会员、中国光学学会高级会员、中国仪器仪表学会高级会员、重庆市光学学会副理事长、重庆市照明学会理事。科研方面,主要研究领域为数字图像处理、微机电系统(MEMS)、智能信号处理。E-mail:luoyuan@cqupt.edu.cn。

(编辑:刘 勇)

猜你喜欢

电信号轮椅分类器
基于联合聚类分析的单通道腹部心电信号的胎心率提取
轮椅上的爱
我的轮椅
基于Code Composer Studio3.3完成对心电信号的去噪
基于随机森林的航天器电信号多分类识别方法
轮椅上的姑娘(外三首)
基于实例的强分类器快速集成方法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
轮椅