基于CSP变换的新特征提取方法研究*

2020-10-26莫云李智赵紫宁张绍荣

桂林航天工业学院学报 2020年3期

莫云李智赵紫宁张绍荣

1 桂林电子科技大学电子工程与自动化学院,广西桂林 541004; 2 桂林航天工业学院电子信息与自动化学院,广西桂林 541004

运动想象脑电信号是大脑活动自发产生的脑电信号，不需要外部的刺激，在脑机接口(brain computer interface，BCI)中得到了广泛应用。实现稳定可靠的BCI系统关键在于脑电信号的特征提取。但是运动想象脑电信号随机性强，信噪比低，容易受生理和非生理噪声干扰[1]，从运动想象脑电信号中提取有效的特征非常困难。因此，特征提取一直是BCI系统研究的重点和难点。

共空域模式(common spatial pattern，CSP)可以有效地捕获在运动想象过程中产生的事件相关同步(event related synchronization，ERS)和事件相关去同步(event related desynchronization，ERD)现象，从而提取具有判别性的特征，因此CSP在运动想象脑电(electroencephalogram，EEG)解码中得到了广泛的应用[2]。但是CSP的性能依赖于最优频带和时间窗的选择[3]。针对CSP这两方面的缺陷，已有大量的研究工作对CSP进行了改进。Ang等人[4]对CSP进行了改进，提出了滤波器组共空域模式(filter bank common spatial patterns，FBCSP)，此方法将原始的脑电信号滤波成多个不重叠的子带成分，再对每个子带成分用CSP算法得到能量特征，然后使用互信息的方法选取最具有判别性的特征用于分类。后面还有一系列的文章对FBCSP进行改进和优化。近期，Kumar等人[5]对这一系列的文章做了较为详细的论述。文献[6]使用滑动时间窗技术选择最佳的时间窗。文献[7]同样使用滑动时间窗技术，但是时间窗宽度可变，通过移动时间窗的起点和终点选择最优的时间窗，此种方法在训练阶段非常耗时。文献[3]和文献[8]联合考虑了时间窗和频带的选择。值得指出的是，以上方法需要把脑电信号滤波成多个频带和时间窗，工作量大，计算耗时。

本文从另外一个角度出发，对CSP特征提取方法进行改进。传统的CSP特征提取方法在进行CSP变换之后提取信号的对数方差作为特征。本文假设脑电信号在CSP变换之后，有比对数方差更具判别性的特征。基于此想法，我们提出了基于CSP变换的新特征提取方法。首先，对原始的脑电信号进行8～30 Hz带通滤波，滤除与运动想象无关的脑电成分。其次，对滤波的信号进行CSP变换。然后，对CSP变换后的信号提取对数方差、自回归(auto regressive，AR)系数、带通功率和小波能量以及融合特征作为特征。最后，使用Fisher线性判别分析(Fisher Linear Discriminant Analysis，FLDA)、最小绝对值收缩和选择算子(least absolute shrinkage and selection operator，LASSO)、融合LASSO(fused LASSO)和弹性网络(elastic net，EN)四种分类器进行分类。实验结果表明基于CSP变换的新特征提取方法提高了分类准确率，优于传统的CSP特征提取方法。

1 方法

图1给出了本文方法的整体流程图。首先，对输入的原始EEG信号进行预处理，具体预处理过程将在下文详细介绍。其次，对预处理的数据进行CSP变换。然后进行特征提取，所提取特征包括对数方差、AR系数、带通功率和小波能量，并计算4种特征的融合特征。最后，采用FLDA、LASSO、fused LASSO和EN分类器进行分类。

图1 整体流程图

1.1 预处理流程

对输入的EEG原始信号进行预处理，详细处理方法如下：

(1)使用共同平均参考(common average reference，CAR)对原始信号进行空间滤波，降低容积传导效应的影响。

(2)使用6阶的Butterworth滤波器对每个通道的脑电信号进行8～30 Hz的带通滤波，滤除与运动想象无关的脑电成分。

(3)提取单试次数据。数据集选取的时间窗为0.5～3.5 s，其中0 s表示运动想象任务开始的时间。

1.2 CSP变换

CSP寻找一组空间滤波器，使投影滤波后的脑电信号在一类运动想象任务的方差最大，而在另一类任务的方差最小。由于在给定频带内的脑电信号方差对应该频带内的信号功率，因此CSP也可以认为是基于频带功率特征实现对脑电信号的识别。

空间滤波器w的计算是通过对两类样本协方差矩阵同时进行对角化，具体如下：

(1)

(2)

式(2)中，trace(·)表示矩阵的迹的求解；Nk表示第k类任务的样本数，即第k类任务的单试次数据个数；D(k,n)∈C×T代表第k类任务的第n个试次的数据，其中C为脑电信号通道总数，T为各通道样点数。

公式(1)可转化为式(3)广义特征值的求解问题[9]。

(3)

对新的单试次数据，空间投影信号为：

Z=WTD

(4)

传统的CSP特征提取方法，提取空间滤波信号的对数方差作为特征，具体如下：

(5)

式(5)中，var(·)表示信号的方差。最后通过公式(5)可以计算得到单试次数据的特征向量，表示为x=[f1,f2,…,f2m]。

1.3 新特征提取方法

在1.2节中，通过式(4)得到空间滤波信号Z后，分别提取信号Z的AR系数、带通功率和小波能量作为特征，并计算4种特征(包含对数方差)的融合特征。

(1)AR系数

自回归(Autoregressive Model，AR)模型是利用自身做回归变量的过程，即用前期若干时刻随机变量的线性组合来描述后期某时刻随机变量的线性回归模型，是时间序列中一种常见的形式。AR模型通常表示为

(6)

式(6)中，y(t)是随机时间序列。φi是模型参数，εt是白噪声序列，p为AR模型阶数。

(2)带通功率

带通功率使用文献[11]的方法计算，功率谱估计使用Welch方法，窗口函数使用海明窗，滤波频带为：8～12 Hz、12～16 Hz、16～20 Hz、20～24 Hz和24～30 Hz。信号序列的带通功率计算如下：

(7)

式(7)中，pi,j[t]表示第i个通道，第j个频带的信号序列的带通功率。计算各个频带的平均功率作为特征，记为pi,j。由于本文选择了5个滤波频带，所以每个通道的带通功率特征维数为5。

(3)小波能量

本文使用小波包分解(wavelet packet decomposition，WPD)对信号Z的每个通道进行小波分解，WPD的详细推导公式可以参考文献[12]。针对所选数据集，选用‘db4’小波基，进行3层小波分解。对各个子带的小波系数计算小波能量。子带j的小波能量计算公式为：

(8)

其中，N为相应子带小波系数的个数，di,j为第j个子带的第i个小波系数。

(4)融合特征计算

把脑电信号每个通道的特征(包括对数方差、AR系数、带通功率和小波能量)逐行进行连接，最终得到一个特征向量，该特征向量的维数等于每通道的特征维数乘以通道总数。

2 实验结果与分析

采用一个公开的BCI竞赛数据集验证所提出方法的性能，并选用FLDA、LASSO、fused LASSO和EN分类器进行实验。其中，LASSO、fused LASSO和EN分类器具有特征选择功能。LASSO、fused LASSO和EN分类器模型参数通过10重交叉验证进行选择，LASSO和EN分类器超参数备选集合均为：λ∈0.1×{1,2,…,30}，fused LASSO分类器的超参数备选集合为：λ1,λ2∈0.1×{1,2,…,30}。FLDA参考文献[13]实现，LASSO、fused LASSO和EN使用SLEP工具箱[14]实现。

2.1 数据说明

下面将简要介绍所用到的数据集：

BCI竞赛III(2005)数据集IVa[15]。该数据集共包括118个电极通道，采样率为100 Hz。5个健康被试(aa、al、av、aw、ay)分别执行左、右手和右脚3类运动想象任务。由于竞赛只提供了右手和右脚的运动想象脑电数据，因此只对这两类任务数据进行分类。每个被试包含280个单试次的脑电数据，其中aa、al、av、aw、ay各个被试的训练集样本个数分别为168、224、84、56、28，其余为测试集。

2.2 实验结果

在使用AR系数作为特征时，AR系数的阶数选择对最终的分类结果影响比较大。因此，我们通过实验选择AR系数特征的最优阶数。图2给出了使用AR系数作为特征时，采用FLDA等4种分类方法得到的整个数据集平均分类准确率随AR阶数(1至20阶)的变化曲线。从图2中可以明显地看出，对于4种分类器，平均分类准确率均在阶数为4左右时，达到最高值。其中，FLDA、LASSO和fused LASSO分类器在4阶时，分类准确率最高；EN在3阶时，分类准确率最高。总平均分类准确率先随着阶数的增加而增加，在阶数为4时达到峰值，之后随着阶数的增加准确率连续下降。通过图2我们可以看出，当使用AR系数作为特征时，AR阶数为4时，效果最佳。因此，在本文的后续实验中，AR阶数选择为4。

图2 平均准确率随AR阶数的变化曲线

为了准确地比较各种特征提取方法的分类效果，表1-4分别展示了在不同分类方法下每个被试对应不同特征提取方法得到的分类准确率。表中准确率最高的数据用黑体加粗标注。

表1 (FLDA)分类准确率

表2 (LASSO)分类准确率

表3 (fused LASSO)分类准确率

表4 (EN)分类准确率

表1的分类方法为FLDA。在表1中可以看出，AR系数特征的平均分类准确率最高，并且优于传统的CSP特征提取方法，即对数方差特征。其他特征提取方法低于对数方差特征，其中带通功率特征的平均分类准确率最低。

表2的分类方法为LASSO。在表2中可以看出，AR系数特征的平均分类准确率最高，AR系数特征和融合特征都优于对数方差特征。但是，融合特征的平均分类准确率几乎和对数方差特征的一致。

表3的分类方法为fused LASSO。在表3中可以看出，AR系数特征的平均分类准确率最高，并且优于对数方差特征。其他特征提取方法低于对数方差特征。

表4的分类方法为EN。在表4中可以看出，AR系数特征的平均分类准确率最高，其次是融合特征，这两种特征提取方法的分类结果都优于对数方差特征。其他特征提取方法低于对数方差特征。

对比表1-4的结果，无论使用哪种分类器，带通功率特征的分类效果都是最差的，而AR系数特征则是最佳的。当分类方法具备特征选择功能时，融合特征优于对数方差特征，比如LASSO和EN。但是使用fused LASSO分类器时，融合特征的分类准确率低于对数方差特征。其主要原因是：fused LASSO分类器可以选择具有局部光滑特性的特征，但是我们所提取融合特征没有这样的特性。

为了更加直观地查看不同特征提取方法使用不同分类器所取得的分类效果，图3给出了不同特征提取方法使用不同分类器的情况下取得的平均类准确率。图3中可以清晰地看到AR系数特征效果最佳，其次是对数方差和融合特征。带通功率特征提取方法的分类效果最差，且在不同分类方法的分类结果中差异较大。

图3 不同特征提取方法的平均准确率

3 讨论

当使用AR系数作为特征时，AR阶数对准确率的影响比较大，所以选择合适的AR阶数比较重要。在使用不同数据集进行实验时，最佳的AR阶数有可能不同，需要实验进行选择。从图3来看，AR系数在分类性能上相较于对数方差、带通功率、小波能量和融合特征，对各分类器有更好的适应性。

另外，AR系数特征使用4种分类方法得到的平均准确率都是最高的，且都维持在82%～83%之间。验证了使用新特征来代替传统的对数方差特征的可行性和有效性。

表4中使用EN作为分类器，AR系数虽然选择了4阶，没有选择准确率最高的3阶，但仍在所有特征中保持最高的分类准确率，且在aa、al、av三个被试中均取得最高的分类准确率，进一步验证了提取AR系数作为特征的优势。

4 总结

基于CSP变换，本文使用AR系数、带通功率、小波能量和融合特征代替传统CSP提取方差，并选用FLDA、LASSO、fused LASSO和EN四种分类方法进行分类。实验结果表明AR系数作为新的特征可以代替对数方差特征取得更好的分类效果，其他特征提取方法则效果不佳。AR系数特征显著地提高了脑电信号的分类准确率，验证了新特征提取方法的可行性。相比其他CSP改进方法，本文提出的方法计算量少，实时性较好，可以有效地提高BCI系统的性能。

在未来的工作中，我们将进一步研究新的特征提取方法。另外，本文只选取了一个数据集作为实验，可能得到的分类结果具有一定的片面性。在后面的工作中，我们将使用更多的数据集进行实验，进一步验证方法的有效性。