APP下载

叠加去噪自动编码器结合深度神经网络的心电图信号分类方法

2019-04-15胡玉平

计算机应用与软件 2019年4期
关键词:准确率神经网络分类

颜 菲 胡玉平

1(柳州铁道职业技术学院信息技术学院 广西 柳州 545616) 2(广东财经大学信息学院 广东 广州 510320)

0 引 言

心电图ECG(Electrocardiogram)是一种非入侵性的心脏测试信号,广泛应用于各类潜在的心脏病的预测[1-2]。近些年,国内外学者归纳出了检测和分类心律失常信号的三个基本步骤[3-4],即:预处理(消除噪声和伪影,增强ECG信号),特征提取(基于特征描述或降维方法,从波形中提取特征),特征分类(基于获取的特征获得分类器的判别函数)。然而,这些方法得到的分类结果很难满足美国医疗器械促进协会AAMI(Association for the Advancement of Medical Instrumentation)的评估标准。

为了解决以上问题,研究人员不仅对方法性能的评判标准进行了研究,而且提出了允许医学专家进行在线交互的半自动分类方法。例如,文献[5]通过介绍心电信号预处理、心搏分割技术、特征描述方法和学习方法,介绍了基于心电信号的自动异常心搏分类方法的研究现状,描述了用于评估由AAMI开发的、ANSI/AAMI 2008中的性能评价数据库,同时提出了方法性能的评价流程。文献[6]提出了一种用于心电图诊断的决策支持方法,假设使用数字助理的半自动解释为最优的心电人机解释模型。为了提高解释精度,减少漏诊,设计了采用网络技术的微分诊断方法,通过将传统方法与提出的半自动方法进行实验比较可知,提出的方法可以大幅度提高诊断的准确率,这表明通过引入决策支持工具,并将相关方法与认为诊断相结合,确实具有非常好的诊断效果。此外,文献[7]提出了一种用于设计半自动分类方法的通用集成架构,在对已有方法进行应用验证的基础上,开发了一种新的方法设计软件。然而,这些半自动方法过度依赖于选择机制,而这些选择机制并没有统筹考虑可以提升分类器准确率的样本,因此诊断精度受到了较大限制。

随着人工智能技术及需求的不断发展,深度神经网络逐渐成为数据分析与信息处理领域的研究热点[8-11],并在医疗图像分析等症多领域得到了广泛应用。文献[12]是一篇非常有价值的学术论文,论文作者基于主成分分析和小波变换的特征提取技术以及基于模糊C均值聚类方法的数据缩减技术,同时利用基于多层感知器与反向传播方法的神经网络结构,构造了四种不同的ECG分类方法。针对10种不同心律失常信号进行的分类实验表明,所提方法均具有非常好的分类精度。这些方法的提出,为科研人员进行后续的研究指明了方向。例如,文献[13]将深度学习方法引入心电信号分类中,利用堆叠式稀疏自编码器建立分类器,获取高层特征,同时将软最大回归与SAE网络相结合来完善分类器,从而实现更高精度的心电信号分类,实验结果证实了所提深度网络方法在心电信号分类中具有非常好的性能。文献[14]使用多分辨率小波方法和Gabor滤波器从心电信号中提取波段特征和其他纹理特征,并利于基于支持向量机与神经网络相结合的方法对特征进行分类,实现了心律失常的快速、高精度分类。

本文在上述研究成果的启发下,提出一种基于深度神经网络DNN(Deep neural network)[15]与叠加去噪自动编码器SDA(Stacked denoising autoencoder)[16]的新型ECG信号主动分类方法,主要创新点包括:

1) 基于稀疏约束的SDA对给定可用训练数据进行学习,得到具有无监督学习模式的特征描述;

2) 在DNN的隐藏层添加回归层来构建一种新的DNN,并在AAMI的标准下进行分类;

3) 利用主动调节技术降低专家对标签数据实例的影响,完善分类器。

为了验证所提方法的有效性,在三个机构提供的ECG数据库中对所提方法及另外两种最新的ECG分类方法进行了实验对比,结果证明了所提方法在准确率和快速性方面具有明显的优越性。

1 新型ECG信号主动分类方法

图1 本文方法的流程

1.1 无监督特征学习与SDA

SDA由编码和解码量部分组成。在编码阶段,通过非线性激活函数f(·)将包含噪声的输入映射到隐藏层hi∈Rl:

(1)

式中:W∈Rl×d为编码权重矩阵;b∈Rl为编码偏移向量;激活函数f(a)=1/(1+exp(-a))。

在解码阶段,同样通过非线性激活函数g(·)映射隐藏层来重建输入向量xi,即:

ri=g(M·hi+q)

(2)

式中:M∈Rd×l为解码权重矩阵;q∈Rd为解码偏移向量;激活函数g(a)=max(a,0)。

为了确定SDA运算过程中的参数向量δ=(W,M,b,q),需要求解如下所示代价函数的最小值:

(3)

(4)

式中:ρ为隐藏层节点的目标激活函数;表示第j个隐藏层节点的平均激活函数,其表达式如下:

(5)

为了优化式(3)的代价函数,首先将参数向量初始化为接近于01×4的向量,然后使用拟牛顿方法对其进行更新。为了减少参数数量,在优化过程中将编码层的权重学习关联到解码层,即令W=M。

1.2 深度神经网络构建与微调

在完成数据与训练后,给出一种计算量较小的,包含H个隐含层的深度神经网络框架构建方法,进而通过在隐含层顶端添加回归层来完成信号分类,最后通过梯度下降方法最小化式(6),实现DNN的优化。整个过程的流程如图3所示。

(6)

式中:κ为网络参数;Wsm为层权重,通过将Wsm初始化为较小的随机值来估计参数向量σ=(Wi,bi,Wsm),i=1,2,…,H,通过在预训练阶段获取的编码权重来初始化H个隐藏层权重。

图3 深度神经网络构建流程

1.3 DNN主动调节方法

在上述步骤的基础上,提出一种DNN主动调节方法,从而避免已有方法忽略可以提高分类准确性信号的缺点,同时在交互过程中允许专家标记与ECG测试最相关的样本数据。为了选择最相关的ECG信号,采用基于熵的信号选择标准:计算每个测试信号的熵值,然后标记具有最高熵值的信号sme(高熵值意味着可以使用较低可信度对ECG 进行分类),通过将这些ECG信号添加至训练集合来进一步改善特征空间中分类器的决策区域。

为了避免由训练数据集中的不确定数据引起的过拟合问题,选用基于进化计算中的优胜劣汰原则来融合当前迭代和先前迭代中DNN的输出值,可以保证网络的稳定性。具体的方法如下所示:

(1) 设置输入数据:训练数据集S,测试数据集C,DNN参数γ1、γ2、γ3,迭代次数a,每次迭代标记的ECG信号数量sme;

(2) 最优化式(3),使用拟牛顿方法计算DAE权重δ;

(3) 利用δ初始化DNN,通过最小化式(6),使用反向传播计算σ;

(4) 使用预训练的DNN分类测试记录,假设P1为估计的后验概率;

(5) 假设初始化的训练集合为空集T=∅;

(6) fori=1:a

① 使用P1计算每个测试数据的熵;

② 根据不确定性排序测试C;

③ 专家标记位于序列顶端的sme个信号;

④ 使用新标记的信号扩展训练数据集;

⑤T=[T|Ss_me];

⑥ 使用T更新DNN权重;

⑦ 使用更新的DNN分类测试记录C;

⑧ 假设P2是当前估计的后验概率,使用最大规则更新P2:P2=max(P1,P2);

⑨ 假设P1=P2,根据最大P1选择测试数据C的标签;

(7) end

(8) 输出最终分类结果

分类时,首先使用100 ms宽中值滤波器对所有ECG信号进行预处理,滤除去除P波和QRS复合波;其次,使用400 ms宽中值滤波器去除T波;再次,从原始信号中减去滤波后的信号,得到校正后的ECG信号;并使用截止频率为20 Hz的低通滤波器滤除高频噪声;最后,利用剩下的数据集构架ECG信号初始训练数据。此外,由于时间信息对识别非常重要,因此需要在数据集中添加相应的时间特征。

为了评估方法的性能,使用分类方法中的标准度量,包括灵敏度、总体准确率和阳性预测值,给出心室异常跳动结果。

2 实验与分析

为了验证所提方法的有效性,采用三个典型ECG数据库进行相关实验,包括中国心血管疾病数据库CCDD(Chinese cardiovascular disease database),美国心脏协会AHA(American Heart Association) 心律失常数据库,欧盟心电图通用标准CSE(Common Standards for Electrocardiography)数据库,这三个数据库的相关信息如表1、表2所示。此外,为了验证所提方法的优越性,在实验中将本文方法与目前较新的两种方法(文献[13]、文献[14])进行了对比分析。

表1 ECG数据库

表2 训练样本与测试样本数量

2.1 初始化DNN

首先,以CCDD数据库为例,利用SDA、回归层和反向传播微调构建DNN的初始化架构,相应的参数为:δ∈[-0.01, 0.01],ρ=0.1。图4、图5给出了CCDD数据集中每种配置得到的训练结果,通过对比两幅图可以看出,与传统的神经网络相比,提出的方法使用DNN主动分类能产生较好分类结果。这是因为DNN主动调节方法,在信号交互过程中允许专家标记与ECG测试最相关的样本数据,采用基于熵的信号选择标准,计算每个测试信号的熵值,标记具有最高熵值的信号,能够选择出最相关的ECG信号,通过将这些ECG信号添加至训练集合进一步改善了特征空间中分类器的决策区域。可见基于过完备描述方法的DNN具有更好的分类结果,过完备描述增加了神经网络的信息完整性,可以避免各类扰动度UI训练结果的不利影响。

图4 基于传统神经网络的CCDD分类精度

图5 基于深度神经网络的CCDD分类精度

2.2 数据库CCDD中的实验结果

在CCDD数据库中对比了三种方法(本文方法,文献[13],文献[14])在ECG信号分类中的性能,如图6至图8所示。

图6 数据库CCDD中三种方法的灵明度对比

图7 数据库CCDD中三种方法的总体准确率对比

图8 数据库CCDD中三种方法的阳性预测值对比

由图6至图8可知,相比文献[13-14]提出的方法,本文提出的方法具有更优的性能。这是由于本文提出的方法网络架构更为简洁,通过特征学习来确定一种合适的深度架构模型,并增加了深度神经网络构建与微调操作,一定程度上提升方法的总体性能。

图9所示为三种算法的模型训练收敛速度对比实验结果。由图可知,在进行模型的离线训练时,提出的方法可以在保证总体准确率最优的情况下,大幅度降低模型训练所需时间,可以加快参数的快速优化与迭代训练,即相比文献[13]和文献[14]方法,所提方法训练时的收敛速度更快。分析可知,提出的方法在完成数据预训练后,给出一种计算量较小的、包含H个隐含层的深度神经网络框架构建方法对DNN进行优化,可以有效提升收敛速度。

图9 数据库CCDD中三种方法的模型训练速度对比

表3给出了基于优胜劣汰概率方法的分类结果,由该表可知,提出的方法能够有效滤除不确定信号造成的不稳定行为。

表3 数据库CCDD分类结果 %

2.3 数据库AHA中的实验结果

在AHA数据库中对比了三种方法(本文方法,文献[13],文献[14])在ECG信号分类中的性能,如图10至图13所示。

图10 数据库AHA中三种方法的灵敏度对比

图11 数据库AHA中三种方法的总体准确率对比

图12 数据库AHA中三种方法的阳性预测值对比

图13 数据库AHA中三种方法的模型训练速度对比

图10至图13分别给出了三种方法在AHA数据库中的性能指标。由这些实验截图可知,与数据库CCDD中的情况类似,与文献[13-14]中的方法相比,提出的方法获具有更好的分类性能,同时具备更好的动态特性。表4给出了分类结果的具体数值指标,由该表可知,提出的方法具有更高的性能指标,可以实现ECG信号的高精度分类。

表4 数据库AHA分类结果 %

2.4 数据库CSE中的实验结果

在CSE数据库中对比了三种方法在ECG信号分类中的性能,如图14至图17所示。

图14 数据库CSE中三种方法的灵明度对比

图15 数据库CSE中三种方法的总体准确率对比

图16 数据库CSE中三种方法的阳性预测值对比

图17 数据库CSE中三种方法的模型训练速度对比

图14-图17中的结果与数据库CCDD、AHA中的情况类似,此处不做赘述。表5给出了分类结果的具体数值指标,所得结论不再赘述。

表5 数据库CSE分类结果 %

2.5 隐含层实验结果

最后,在包含多个隐藏层的神经网络上重复上述实验,实验中考虑H=3,4,5三种情况,每种情况对应的节点分别为{100,70,100}、{100,70,100,70}和{100,70,100,70,100},这些节点表示了稀疏和密集之间的交替变换。图18-图20给出了提出的方法在三种数据库上获取的实验结果(实验只针对所提方法,由于实验结果与结论类似,因此不再赘述文献[13]、[14]中的方法)。从图中可以看出,基于一个和两个隐藏层的DNN获取的分类准确率较高。但是,随着隐藏层数量的增加到3层或者4层、5层,分类准确率降低较为明显。提出的方法在使用较少训练样本时,分类准确性严重下降,由此可见,在利用所提方法进行ECG分类时,较少的训练样本不能够有效更新复杂网络。

图18 数据库CCDD中多隐含层分类结果

图19 数据库AHA中多隐含层分类结果

图20 数据库CSE中多隐含层分类结果

3 结 语

在基于神经网络技术的已有研究的启发下,针对ECG信号分类,提出一种基于深度神经网络和叠加去噪自动编码器的新方法。该方法不仅继承了深度学习在特征分类中所具备的精度优势,而且充分发挥了带有稀疏约束的叠加去噪自动编码器在对原始数据进行特征学习的优点。提出的方法为心电图分类的后续研究提供了一定的借鉴意义,同时具备较好的实际应用价值。然而,提出的方法在使用较少训练样本时,分类准确性下降严重,较少训练样本不能够有效更新复杂网络。下一步将重点研究在复杂网络环境下提高分类准确率,降低信号交互次数,例如,研究其他更有效的深度框架,定义并联合适用于深度框架的主动学习条件。

猜你喜欢

准确率神经网络分类
基于递归模糊神经网络的风电平滑控制策略
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
按需分类
教你一招:数的分类
说说分类那些事