APP下载

癫痫发作预测模型:斯托克韦尔变换的生成对抗与长短时记忆网络半监督方法

2023-02-27廖家慧李涵懿詹长安

南方医科大学学报 2023年1期
关键词:时频癫痫发作

廖家慧,李涵懿,詹长安,杨 丰

南方医科大学生物医学工程学院,广东 广州510515

癫痫是由脑内神经元异常超同步化、阵发性电活动引起的神经紊乱。癫痫发作具有猝发性,常见临床表现为突然的意识丧失、全身抽搐以及精神异常等[1]。癫痫发作预测通常依赖经验丰富的神经内科医生对海量EEG信号进行人工标定和回溯分析[1,2]。因EEG信号具有随机性和非平稳性等特点,其强度微伏级且持续伴随各种干扰信号。这造成临床人工标定工作效率低、耗时长且误差大[3-5]。因此,计算机辅助癫痫发作预测是应对日益快速增长临床需求的必然趋势。

早期的癫痫发作预测主要采取基于阈值的方法:识别发作前状态某些特征值增加或减少趋势。当所提取特征的值超过激活阈值时,预测即将有癫痫发作[6-8]。基于阈值的预测算法可解释性强,简单直观,但通常局限于单个特征,目前没有一种特征能有效地作为表征发作前状态的标准特性,因此这类算法的预测性能大多不佳。机器学习综合利用统计学和计算机科学技术,系统地使用算法挖掘数据里的隐藏特征和内在联系。以经典机器学习为基础的癫痫发作预测算法的研究主要集中于:特征空间优化与分类器检测性能之间结合,对癫痫发作前状态检测具有较好精度[9-16]。但是癫痫发作的EEG模式在不同患者之间差异很大,甚至当癫痫发作发生在同一患者的不同大脑区域时也存在较大偏差。因此,这类算法研究需要针对患者定制的特征工程,复杂度高且过程繁琐,算法泛化性差不易推广[17-20]。深度学习方法实现端到端训练分类器,极大改善了经典机器学习方法中特征提取问题,取得良好的效果[21-23]。但这类算法仍需要大量标记的EEG数据训练预测模型,同属于机器学习中的有监督学习。对于EEG数据的标记而言,这又依赖于临床医生的经验,其过程耗时且易发生人为错误[24-26]。

为克服获取大量标注数据的困难,无监督特征学习成为深度学习在癫痫预测应用中的发展方向。无监督特征提取不仅在EEG记录期间实时执行,省去数据标定的工作,而且无需为每个患者定制特征工程[6,12]。在无监督特征学习方面,目前采用的技术主要基于两种:自编码器(AE)和深度卷积生成对抗网络(DCGAN)[25-28]。无监督学习不依赖于任何标签,仅通过挖掘数据本身蕴含的结构或特征,完成相关任务。然而,由于前述的癫痫EEG信号具有随机、非平稳且强度微弱等特点,仅使用无监督学习执行预测任务通常出现训练无效、模型稳定性差等问题,最终导致预测性能不佳。这也是目前尚未有模型稳定,性能可靠的无监督癫痫发作预测模型的主要原因。半监督学习利用少量标记样本的辅助信息来引导对大量无标记数据学习与训练,既减轻有监督训练对海量标记数据的需求,也改善无监督学习模型失效、模型不稳定的问题[27,28]。

受到上述工作的启发,本文提出一种结合斯托克韦尔变换(ST)、基于梯度惩罚的Wasserstein生成对抗网络(WGAN-GP)以及基于Bi-LSTM分类网络的半监督癫痫发作预测算法,即ST-WGAN-GP-Bi-LSTM。一是采用ST对癫痫EEG信号时频变换,ST自适应调节分辨率,能够精准地定位癫痫EEG信号的时频成分。二是采用WGAN-GP作为无监督特征学习模型。WGANGP的优势在于其损失函数采用Earth-Mover(EM)距离代替传统GAN中的Jensen-Shannon(JS)散度,克服模型坍塌与训练不稳定的问题,保证生成样本的丰富性[29,30]。三是采用基于Bi-LSTM分类网络作为后端分类器,用少量带标签的ST 时频图引导分类(预测)任务。Bi-LSTM作为处理序列数据的网络,能有效挖掘EEG信号中的时序信息,进而提供分类(预测)性能[31]。在公开的波士顿儿童医院癫痫数据集(CHB-MIT)[32]上验证本文方法可以有效提升预测性能,并进一步改善无监督特征学习模型的稳定性。

1 材料和方法

癫痫发作预测通常将EEG记录划分为4个基本状态:发作间期,发作前期,发作期和发作后期[12,13](图1)。发作间期为远离发作的“正常”大脑状态,发作前期紧接癫痫发作,是发作间期和发作期的过渡状态,发作期指癫痫发作发生的时间段,发作后期是癫痫发作后至大脑回归到“正常”大脑状态前的一段时间。基于分类算法的计算机辅助癫痫发作预测致力于检测分析EEG信号的发作前状态,执行发作前期和发作间期的分类任务。

图1 癫痫发作预测的4种EEG状态Fig.1 Four EEG states of epileptic seizure prediction.

本研究算法流程(图2)主要包括:(1)无监督特征学习模型训练。对未标记的EEG信号进行ST获得二维视频特征图,结合特定患者的EEG 数据无监督训练WGAN-GP模型,目的是生成高性能的特征提取器;(2)分类(预测)器模型训练。将经过训练WGAN-GP的判别器作为特征提取器,以基于Bi-LSTM构建分类网络,用少量带标记的EEG信号ST时频图训练分类器模型。

图2 本文提出的ST-WGAN-GP-Bi-LSTM算法框架Fig.2 Framework of the proposed ST-WGAN-GP-Bi-LSTM algorithm.

1.1 时频分析方法

由于EEG信号具有非线性、非平稳特性,通常采用时频域分析方法获取EEG信号特定时刻的精确频率信息,如短时傅里叶变换(STFT),连续小波变换(CWT)和ST等[12,13]。由于STFT的窗函数一旦选定,其时间窗和频率窗不能随着时域和频域的位移而改变。从信号时频分析的有效性考虑,在低频部分应采用比较窄的窗宽,而在高频部分则应用比较宽的窗宽。CWT通过将数据分解成多个尺度,每个尺度代表信号的特定分辨率来克服STFT窗函数固定的问题。而CWT存在选择最佳母小波困难、丢失数据的绝对相位以及具有冗余性的问题。

斯托克韦尔等[33]提出的ST变换是CWT和STFT的拓展。ST是一种有效的时频分解方法,它在低频出具有高频率分辨率,在高频处具有高时间分辨率,能在时域和频域上精准定位癫痫发作时EEG信号的瞬态特征。因此,本研究采用ST对癫痫EEG信号进行时频表示,将一维信号转换二维时频矩阵(时频图)。连续时序信号x(t)的ST表示为:

信号x(t)的CWT表示为:

其中d为f的倒数(d=1/f),ω(t,f)为高斯母小波,其定义为:

结合式(1)、(2)和(3),连续时序信号x(t)的ST表示为:

根据式(3),ST的窗宽取决于频率f,即低频时窗宽增大获得高频率分辨率,高频时窗宽减小获得高时间分辨率[34]。

1.2 无监督特征学习模型

无监督特征学习通过对GAN的训练完成。利用GAN的判别器作为癫痫EEG信号的高阶特征提取器,关键在于网络训练,改善传统GAN(包括DCGAN)训练时出现梯度消失和迭代更新不稳定的问题[30,35]。因此,本文采用WGAN-GP作为无监督学习模型改善模型训练的稳定性。WGAN-GP 的关键优势在于采用Wasserstein距离(又称EM距离)衡量生成分布与真实分布之间距离[36]。同时,在WGAN中加入梯度惩罚(GP)进一步改善网络训练时收敛缓慢问题。

1.2.1 WGAN-GP网络结构 所采用WGAN-GP的生成器网络结构设计(图3),生成器从均匀分布U(-1,1)中随机采样形成1×100维的向量作为输入,输入层与8192维的全连接隐藏层相接,然后将其维度重塑维64×4×32。隐藏层后接三个深度反卷积层,卷积核大小为5×5,步长为2×2,卷积核个数分别为32,16,n=16为EEG数据的通道数。与卷积层的作用相反,反卷积层增加输入的长和宽,减小输入的深度直至在最后一层达到预期的输出维度。因为生成数据和真实数据都将作为判别器的输入,所以将生成器的输出设为与真实ST时频图相同的维度。

图3 无监督特征学习模型(WGAN-GP)的网络结构Fig.3 Architecture of the unsupervised feature learning models(WGAN-GP).A:Generator.B:Discriminator.

判别器由3个深度卷积层组成,卷积核大小为5×5,步长为2×2,卷积核个数分别为16,32和64。在网络训练期间,生成器生成与真实ST时频图尽可能相似的样本,判别器通过调整其在3个深度卷积层的参数,学习提取癫痫EEG信号中的关键特征,最终检测判别生成数据与真实数据。

1.2.2 无监督特征学习模型的损失函数 生成器的输入为从均匀分布U(-1,1)采样得到的随即向量z,输出为生成ST时频图;判别器的输入为真实EEG数据的ST时频图和生成ST时频图,输出为判别数据来源的概率值。此训练过程不向网络提供标签(发作前或发作间期),采用无监督学习策略通过最小化损失函数对网络进行优化。生成器的损失函数Gloss和判别器的损失函数Dloss分别定义为:

1.3 分类(预测)器模型

建立上述无监督特征学习模型后,分类(预测)器模型需自适应地学习鉴别特征,将输入数据分类到相应的类别(发作前期或发作间期),输出预测概率值。由于大脑在某个时间点的活动与过去的信号数据相关,也可从未来的信号数据进行分析。为提高预测精度,分类(预测)器模型需具备分析高阶时频特征之间时序相关性的能力。

为了获得癫痫EEG信号ST时频图两个方向的相关性,本研究采用Bi-LSTM 作为后端分类(预测)器模型。这是因为Bi-LSTM不仅能学习标准LSTM中先前的上下文信息,还能学习未来的上下文信息[27,37-39]。Bi-LSTM将时间序列x0,…,xn输入至两个LSTM模块,同时在两个相反方向上进行网络学习(图4)。在前向传播学习中,从无监督特征学习器生成的特征向量从x0到xn依次输入,后向传播学习以相反的顺序处理相同的数据。因此,使用Bi-LSTM作为分类器,提取ST时频图中重要的时间特征,结合无监督特征学习器中提取的空间特征,旨在进一步提升预测精度。

图4 分类(预测)器模型的网络结构Fig.4 Architecture of the classifier(prediction)model.A:Feature extractor after unsupervised training.B:Back-end classifier.

1.3.1 分类(预测)器模型网络结构 本研究将上述无监督训练后的WGAN-GP判别器的3个深度卷积层作为特征提取器,用于提取EEG信号的高阶特征,与基于Bi-LSTM构建的分类网络相连接,组成分类器(预测器)模型。图4展示了分类器模型结构:分类网络将特征提取器所提取的关键癫痫特征展平接一层全连接层,将展平的特征向量映射到32维以降低后端分类网络的复杂度,再连接一层Bi-LSTM层提取ST时频图中蕴含的时间特征,最后连接两个全连接层进一步提取特征,前者使用Sigmoid激活函数,输出大小为256;后者使用Soft-max激活函数,输出大小为2。

1.3.2 分类(预测)器模型的损失函数 分类器网络以带标签的真实EEG数据的ST时频图作为输入,输出样本的类别概率预测值,并采用有监督学习策略通过最小化交叉熵函数对网络进行优化。所提分类器模型的损失函数表示为:

1.4 实验设计

1.4.1 实验数据集 CHB-MIT数据集为美国波士顿儿童和麻省理工的合作项目,总共包含24例患者经专家标记的头皮EEG数据[32]。本文提出的ST-WGAN-GPBi-LSTM模型致力于改善半监督深度学习模型的预测性能,优化无监督特征提取效果。基于此目标设定输入筛选标准:(1)发作事件前至少有30 min的可用数据。设定这一标准首先是为保证有足够的发作前期训练数据。其次是考虑到癫痫发作预测系统在实际临床应用中,除准确预测即将到来的癫痫发作,还需留有足够的时间进行临床干预[40];(2)仅考虑癫痫发作次数少于10次/d的患者执行预测任务。因为对平均每两小时就有一次以上癫痫发作的患者执行预测的意义不大,这类患者的病情已非常危急,需要医护人员的实时看护或进行手术干预治疗。基于前述标准,本研究从CHB-MIT数据集中筛选出13例患者数据验证提出的预测模型。

1.4.2 预处理 为了提高数据的有效性,摒弃不相关信息的通道,以及降低计算复杂度,采用自动通道选择方法为每位患者选择16个通道数据[41]。根据EEG信号具有非平稳性以及临床医生逐秒标定癫痫EEG信号[1],本文首先滑动1s时间窗分段EEG信号,采样率为256 Hz,且相邻段间无重叠。由于癫痫EEG信号的频率成分主要集中在0~30 Hz以内[13],本研究对每段EEG数据进行0~32 Hz范围内的ST以获得二维时频矩阵,同时无需在ST之前去除60 Hz工频干扰。

1.4.3 实验设置与对比方法 本研究所提的改进的半监督发作预测模型使用TensorFlow框架实现与测试,使用一个内存为32GB的NVIDIA GeForce GTX 3090图像处理单元(GPU)进行训练。所提的预测模型分两步训练:首先是无监督特征模型训练,将经过无监督训练的特征学习器接分类网络后组成分类(预测)器模型进行有监督训练。

无监督特征学习模型训练细节:(1)对生成器进行两次更新,设置早停监视器跟踪生成器和判别器的损失[28]。若连续Κ 个训练批次的Dloss大于Gloss,停止WGAN-GP的训练。本研究设置Κ=20;(2)设置生成器和判别器的初始学习率分别为5e-4和1e-3;(3)批处理参数为64,训练次数(epoch)为10;(4)采用数据集平衡技术[22],避免发作间期的EEG数据通常远多于发作前的EEG数据的情况,使两种状态的EEG数据达到平衡后,再训练WGAN-GP模型;(5)此训练过程不向网络提供任何标签(包括发作前或发作间期),因此网络受无监督癫痫发作训练。

分类(预测)器模型训练细节:(1)固定高阶特征学习的网络参数;(2)为训练稳定,加速收敛,在每层网络加入批归一化;(3)采用RMSP优化器,设置初始学习率为1e-4;(4)为防止过拟合,最后两层神经网络均使用0.3的dropout率;(5)训练样本数据集中发作前和发作间期25%的样本作为验证集,其余数据用于训练网络。

为验证ST、WGAN-GP以及Bi-LSTM对整个半监督发作预测模型的贡献程度,本文首先从时频图的区分性,以及对无监督特征学习效果的提升两方面反映ST的效果优于STFT,即对比STFT-DCGAN和ST-DCGAN的性能,具体实验结果在2.1节呈现。其次从迭代训练的稳定性和生成时频图质量两方面反映WGAN-GP作为无监督特征学习模型的优越性,即对比ST-DCGAN和ST-WGAN-GP 的性能,具体实验结果在2.2 节呈现。接着在2.3节验证使用Bi-LSTM作为后端分类器的效用。最后为进一步验证ST-WGAN-GP-Bi-LSTM的预测性能,在2.4节与现有的预测方法进行比较。其中,基于CNN的有监督预测模型(STFT-CNN)[22]将对癫痫EEG信号进行STFT后,采用基于CNN的特征提取模型,以带标记的STFT时频图作为模型输入,训练生成高阶特征提取器,再接两层全连接网络作为后端分类器。半监督预测模型STFT-DCGAN为本文的主要对比方法。与本文提出的ST-WGAN-GP-Bi-LSTM 相同,STFT-CNN与STFT-DCGAN均为在CHB-MIT数据集上以相同的病例数据进行验证。

1.4.4 评估标准(1)系统评估:为了评估癫痫发作预测算法的性能,研究者们定义了两个重要的时间参数:癫痫预测区间(SPH)和癫痫发作区间(SOP)。SOP指预测在此时间段内有癫痫发作,SPH指发出预测警报到SOP开始时间点之间的时期(图5)。对于一次正确的癫痫预测,应该是在警报发出后的SPH范围内,不出现癫痫发作,而在SOP范围内出现癫痫发作,具体发作的时间点可以有所不同,除此之外的所有情况都是错误预测[42]。考虑实际临床应用,SPH需较长以允许足够的干预或预防措施,SOP不应太长以减轻患者的焦虑[43]。因此,本研究设置SPH为5 min,SOP为30 min;(2)评价指标:为了获得稳健的评估,每位受试者都遵循留一交叉验证法。本实验使用的评价指标包括AUC,灵敏度(Sensitivity)和特异性(Specificity)指标。AUC为受试者曲线下面积,用以衡量模型的分类能力。灵敏度和特异性分别表示发作前预测的正确率和发作间期的判断能力。这些指标值均从每个患者留一交叉验证期间的所有癫痫预测值计算得来。

图5 SPH和SOP定义示意图Fig.5 Schematic diagram of the definition of SPH and SOP.

其中,真阳性(TP)表示正确分类的发作前期,假阴性(FN)表示错误分类的发作间期,真阴性(N)表示正确分类的发作间期,假阳性(FP)表示错误分类的发作前期。

2 结果

2.1 时频变换对比实验

由于Truong等[28]使用STFT将每段28s的EEG信号转换成由频率-时间所组成的二维时频矩阵,本文先对28s的EEG信号段分别做STFT和ST,再截取其中1s的EEG信号分别做STFT和ST。图6A第一行从左至右依次为28s的发作期EEG信号及其对应的STFT和ST 时频图,第二行为其中1s EEG 信号及其对应的STFT和ST时频图,图6B则为对应的发作间期EEG信号对应的时频变换图。从图6AB可知,无论是28s还是1s的ST时频图相较于STFT能更好地呈现出EEG信号的时频信息,进一步地,1s EEG信号的ST时频图相较于28s 能展示出更丰富的时频细节。

其次,图6C展示在相同的DCGAN模型下,比较EEG信号的STFT时频图和ST时频图分别对判别器和生成器的网络训练影响。从上至下,分别为ST-DCGAN和STFT-DCGAN的判别器和生成器训练曲线。模型所用数据均来自9号病人。从图6C可知,ST时频图用于网络训练,其判别器和生成器的损失函数的振荡较小,梯度的总体变化趋势更平缓。

图6 不同时频变换对比Fig.6 Comparisons of different time-frequency transform methods.A: Comparisons of ictal EEG segments.B: Comparisons of inter-ictal EEG segments.C:Convergence performance of discriminator and generator of STFT-DCGAN and ST-DCGAN.

从表1~3第3~4列数据比较可知:在DCGAN模型参数完全相同前提下,ST-DCGAN模型所获得的AUC,灵敏度和特异性值在病人平均水平下分别高于STFTDCGAN模型的7.87%,4.75%和45.18%。

2.2 网络稳定性对比实验

GANs训练的稳定性与其判别器和生成器的损失函数变化,以及相应梯度变化密切相关[30]。因此,对癫痫EEG信号进行ST预处理的前提下,比较DCGAN和WGAN-GP 生成器和判别器的网络迭代训练稳定性。图7分别展示使用20号病人(图7A)和21号病人(图7B)数据训练DCGAN和WGAN-GP,对比所得判别器和生成器的损失函数收敛情况。由图7可知,不管是生成器还是判别器,WGAN-GP的损失函数曲线震荡幅度都远小于DCGAN,其梯度总体变化趋势相较于DCGAN同样更加平缓。

图7 DCGAN和WGAN-GP作为无监督特征学习模型的收敛性能分析Fig.7 Convergence performance analysis of DCGAN and WGAN-GP as unsupervised feature learning models.A: Convergence performance analysis of discriminator(left)and generator(right)of ST-DCGAN and ST-WGAN-GP obtained from Patient 20.B: Convergence performance analysis of discriminator (left) and generator(right)of ST-DCGAN and ST-WGAN-GP obtained from Patient 21.

此外,GANs生成样本的质量也是提现网络稳定的重要指标之一。图8A和B分别使用20号病人和21号病人训练DCGAN和WGAN-GP,比较迭代训练5个epoch和迭代结束时生成的ST时频图。随着训练加深,无监督特征学习模型生成的ST时频图质量都得到提升。其中,WGAN-GP 生成的ST 时频图更接近真实EEG信号的时频图,其生成图含有明显的特定频率成分,且随迭代次数增加,该频率成分细节进一步增强。而DCGAN生成的时频图倾向于无序的噪声分布,与真实时频图存在一定的差距。这进一步验证WGAN-GP具有良好的无监督特征学习能力。

图8 DCGAN和WGAN-GP的生成时频图Fig.8 Generated time-frequency spectra of DCGAN and WGAN-GP.A:Generated time-frequency spectra obtained from Patient 20.B:Generated time-frequency spectra obtained from Patient 21.

从表1~3第4~5列数据比较可知:在相同的ST预处理下,采用WGAN-GP所得AUC,灵敏度和特异性在病人平均水平下分别优于DCGAN的5.14%,6.34%和3.39%。

2.3 后端分类器性能对比实验

从表1~3第5~6列数据比较可知:在相同的ST预处理,WGAN-GP作为无监督特征学习模型且模型参数完全相同的情况下,后端分类器采用Bi-LSTM 所得AUC,灵敏度和特异性分别优于采用全连接层的4.72%,4.32%和5.09%。

表1 CHB-MIT数据集在不同预处理方式或无监督特征学习模型下的癫痫发作预测性能AUC值(%)对比Tab.1 Comparison of AUC (%) of epileptic seizure prediction performance of CHB-MIT dataset obtained by different preprocessing methods or unsupervised feature learning models

表2 CHB-MIT数据集在不同预处理方式或无监督特征学习模型下的癫痫发作预测性能灵敏度值(%)对比Tab.2 Comparison of sensitivity(%)of epileptic seizure prediction performance of CHB-MIT dataset obtained by different preprocessing methods or unsupervised feature learning models

表3 CHB-MIT数据集在不同预处理方式或无监督特征学习模型下的癫痫发作预测性能特异性值(%)对比Tab.3 Comparison of specificity(%)of epileptic seizure prediction performance of CHB-MIT dataset obtained by different preprocessing methods or unsupervised feature learning models

2.4 与其他算法的比较

表4是本文提出的方法与其他文献提出的癫痫发作预测方法的性能对比结果。在使用CHB-MIT数据集中相同的病例数据的情况下,本文提出的方法在AUC、灵敏度和特异性指标上均优于已有的半监督预测模型STFT-DCGAN,且每个指标的极差都低于STFT-DCGAN(由表1~3第2与6列的最后一行Range比较可知),并与有监督预测模型STFT-CNN性能持平。

表4 本研究与现有方法的比较Tab.4 Comparison of the performance of the algorithm in this study with extant literature

3 讨论

本文提出一种改进的半监督癫痫发作预测模型:ST-WGAN-GP-Bi-LSTM。对为标记的EEG信号进行ST获得时频图作为WGAN-GP模型的输入,WGANGP在迭代训练中学习如何从时频图中获取可用于癫痫发作预测任务的特征,生成高阶特征提取器。经过无监督训练的特征提取器(WGAN-GP的判别器)与基于Bi-LSTM的后端分类网络相接,用少量带标记的EEG信号ST时频图训练分类(预测)器模型。WGAN-GP的判别器与强劲的后端分类网络组成半监督深度学习癫痫发作预测模型。

针对癫痫发作预测问题,良好的输入数据有益于后续的无监督特征学习和预测模型的训练。图6表明ST无疑比STFT更能捕捉到EEG信号中细致的频率成分,ST后的数据之间更具区分性,从而提升了预测性能。从表1~3第3~4列定量评估结果可知,STFT-DCGAN在病例数据上所得特异性普遍较低,平均水平仅33.03%,这说明该模型易将发作间期样本数据检测为发作前期,若将此模型应用于实际临床中会出现大量误报情况,造成医疗资源浪费,以及增加患者的心理负担。本文提出由ST替代STFT,极大地提升了模型的特异性(ST-DCGAN的特异性为78.21%),凸显ST作为预处理方式的优越性。

实验证明利用Wasserstein距离与梯度惩罚能够进一步改善无监督特征学习模型的稳定性,提高时频图生成质量。图7和图8分别从训练模型的收敛性能和生成时频图质量两方面定性说明WGAN-GP的优势。从表1~3 第4~5 列定量评估结果可进一步说明,采用DCGAN作为无监督特征学习模型,常出现某项评价指标非常低的情况,例如ST-DCGAN中2号病人的灵敏度仅3.94%,3号病人的特异性仅38.31%等。这意味着DCGAN在学习过程中对其中一类数据有倾向性,是模型不稳定的表现之一,如前述此种模型对实际临床应用的意义不大。采用WGAN-GP 能够有效改善这种情况,即ST-WGAN-GP在病人数据验证所得各项评估指标较均衡,同时相比ST-DCGAN,各项指标得到进一步提升。相对于经典人工特征设计而言,这种无监督学习的深度特征不仅在概念表达方面具有较强的鲁棒性和较复杂的抽象性,还很大程度地减轻了繁重且复杂的EEG信号标记工作的负担。

由2.2节可知,结合ST和WGAN-GP执行发作预测任务,已较大地提升预测性能。虽然基于CNN的高阶特征提取器能够充分挖掘癫痫EEG信号的关键空间信息,但不能高效地提取时序信息,而多通道EEG信号不仅包含各通道之间的空间信息,还具备单通道内的时间属性,这意味着癫痫EEG信号间的时序相关性对预测任务具有重要意义。因此,本研究采用能够同时提取过去时刻和未来时刻信息的Bi-LSTM作为后端分类网络,进一步提升了预测性能。

本文提出的ST-WGAN-GP-Bi-LSTM 模型在CHB-MIT数据集上验证,得到病人平均水平下的AUC为90.40%,灵敏度为83.62%和特异性为86.69%。表4是本文提出的方法与其他文献提出的癫痫发作预测方法的性能对比。Hosseini等[25]无监督训练堆叠自编码器(SAE)后作为高阶特征提取器。虽然该方法首次采用无监督特征提取技术,但由于同时使用传统特征提取方法提取EEG信号的时频域特征,因此无法得知SAE所提取的高阶特征对最终预测性能的贡献程度。Daoud 等[27]将无监督训练后的深度卷积自编码器(DCAE)作为特征提取器,从原始EEG信号中提取空域特征,采用Bi-LSTM 进行后端分类预测。相较于Hosseini等人的工作,该算法只使用无监督特征学习技术获取抽象高阶特征,在发作预测任务上表现极佳。然而从技术角度而言,该方法在无监督训练DCAE后并未固定网络层,与后端Bi-LSTM相接后再次有监督训练,因此该方法并非半监督癫痫发作预测模型,这也是该方法获得如此优越表现的重要原因。其次从临床应用角度而言,该方法没有定义SPH,且预测时间长达1 h,临床上应用该模型会造成无干预时间,病人心理负担过重等问题。Troung等[28]采用STFT对EEG信号时频变换,将获得的STFT时频图输入DCGAN无监督训练后生成高阶特征提取器,该特征提取器与两层全连接网络网络连接,组成深度学习半监督癫痫发作预测模型,即STFT-DCGAN。该方法仅使用无监督学习技术获取特征,并且首次将GAN应用于癫痫发作预测。但是,在STFT-DCGAN模型中,一是STFT中窗口的有限宽度导致时域和频域的分辨率恒定,因而无法在低频提供适当的频率分辨率和在高频提供良好的时间分辨率。二是DCGAN 模型训练时存在梯度消失和不稳定的问题[29,30]。三是后端分类器——两层全连接网络对于时频特征的分析学习能力不足,这是造成预测精度仍有待提升的另一重要原因[31]。本文的方法针对STFTDCGAN的不足之处逐一改进,由表4可知,综合各项性能指标,ST-WGAN-GP-Bi-LSTM半监督模型对于癫痫发作预测任务,性能不仅优于STFT-DCGAN,甚至超越基于CNN的有监督预测模型[22]。

本研究也存在一定的局限性与不足之处。首先,尽管本文致力于将ST-WGAN-GP-Bi-LSTM与现有的半监督方法STFT-DCGAN,在共同的数据集以同样的病例数据进行性能对比,突出ST-WGAN-GP-Bi-LSTM的创新之处与性能优势,但未来若能在更多的病例数据,乃至临床数据上进行验证,所提方法的有效性和泛化性将得到进一步认可。其次,本研究对EEG信号采用1秒时间窗进行无重叠分段,未能探讨窗宽和步长这两个重要参数对预测性能的影响。从以往的研究中总结的规律表明:窗宽越大且步长越大,样本量就越少,可以大大降低预测模型的计算量,保证预测的实时性,但可能会降低预测性能;反之窗宽越小且步长越小,样本量就越多,能有效提升预测性能,但对计算设备性能要求更高,数据处理耗时更长。因此,将在下一步工作中进一步探索如何权衡这两者之间的关系以更好地提升预测模型性能。

猜你喜欢

时频癫痫发作
PTGD联合择期LC在胆囊结石伴慢性胆囊炎急性发作的应用
癫痫中医辨证存在的问题及对策
玩电脑游戏易引发癫痫吗?
基于时频分析的逆合成孔径雷达成像技术
左氧氟沙星致癫痫持续状态1例
对采样数据序列进行时频分解法的改进
穴位埋线治疗发作期偏头痛32例
中医针药治疗脑卒中后癫痫临床观察
中西医结合治疗盆腔炎反复发作43例
双线性时频分布交叉项提取及损伤识别应用