APP下载

基于相空间重构的心冲击信号房颤检测方法

2021-11-25蒋芳芳王浩乾程天庆洪楚航

东北大学学报(自然科学版) 2021年11期
关键词:维数节律分类器

蒋芳芳, 王浩乾, 程天庆, 洪楚航

(东北大学 医学与生物信息工程学院, 辽宁 沈阳 110169)

近年来心血管疾病的发病率逐年上升,其高致残率和高死亡率严重危害人类健康[1].房颤作为一种常见的心律失常疾病,其发病率也呈现逐年上升趋势,且易导致心房血栓、缺血性脑卒中等恶性事件[2].由于房颤的发作具有时间不确定、临床表现不明显等特征,故研究其日常实时、连续监测与诊断的方法尤为重要.

目前,临床上多以心电图(electrocardiogram, ECG)作为房颤诊断的金标准.其主要表现为:由心房活动异常引起的P波消失,以及R-R间期紊乱等特征[3-5].由于ECG的检测过程需要在人体体表安装电极等装置,且需要特定的检测设备及检测人员,不但会对受试者的皮肤产生刺激,其活动范围也会被约束,不适于日常长期监测使用.因此,面向家庭监测的非接触式房颤检测方法成为当今研究热点.

心冲击(ballistocardiogram, BCG)信号记录由心脏搏动与大动脉血液循环所导致的与心跳同步的身体振动,是一种非接触式的心脏功能实时检测方法[6].目前,BCG在心率提取、心律变异等方面已取得较为显著的研究成果[7-8].关于房颤诊断的研究,近几年也呈现上升趋势.Bruser等[9]提取了BCG信号的经典时频特征,并应用机器学习算法开展了对房颤、窦性心律和体动的三分类研究.Yu等[10]通过小波变换提取BCG信号的时频特征,应用机器学习分类器实现了房颤与非房颤的二分类诊断.Wen等[11]将BCG转换为能量信号,并提取了新型的数据序列特征,最终通过机器学习算法检测房颤.综上,当前基于BCG信号的房颤诊断研究,主要集中于应用机器学习分类器对信号的时频特征进行分类,并取得了初步的成果,能够证明应用BCG信号进行房颤检测的可行性.

但是,基于时频特征的检测方法较为依赖于信号的波形变化,而BCG信号受个体差异、不同检测装置、外界干扰等因素影响较大,故难以保证房颤诊断精度的稳定性.因此,本文提出应用相空间重构理论提取BCG信号的二维节律特征,并结合卷积神经网络,提高房颤诊断的自适应性与稳定性.通过对相空间重构过程中嵌入维数与时间延迟等参数的讨论,探索面向房颤诊断的BCG信号新型特征提取方法,为其在房颤等心血管疾病诊断中的实际应用提供一种可行的解决方案和崭新的研究方向.

1 实验数据

本文采用基于聚偏氟乙烯(polyvinlidene fluoride, PVDF)压电薄膜传感器的卧姿BCG信号检测装置和CT-08S动态心电记录仪分别采集同步的BCG信号和ECG信号,采样频率分别为125 Hz和200 Hz.其中,ECG信号作为房颤诊断的金标准,主要起到为同步BCG信号设置标签的作用.共有59名受试者参与该实验,男性34名,女性25名,年龄分布为27至93岁.记录时间均为8h(晚上12点至次日8点),记录环境为医院病房卧姿采集方式.

为了解决不同采样率的问题,本文对ECG信号进行降采样,统一采样率为125 Hz.并根据房颤诊断的常用分帧方法,设定分帧长度为24 s,共计3 000采样点[12].将BCG数据分为房颤(AF)和非房颤(NAF)两类,设定标签0为NAF,1为AF.通过对原始信号进行筛选和预处理,滤除波幅过大的体动及波幅过小的离床时段,最终共获得2 000帧较为纯净的BCG数据,其中AF与NAF各1 000帧.

2 方 法

2.1 方法描述

本文所提方法流程如图1所示.

图1 所提方法流程框图

主要工作包括:选取合适的嵌入维数m和时间延迟τ进行相空间重构,以保证所提二维节律特征对房颤的表征性能;构建适于对二维节律特征进行分类的卷积神经网络模型.下面分别介绍这两部分的具体方法.

2.2 基于相空间重构的二维节律特征提取

相空间重构是一种用于分析复杂系统的数学方法,其将离散的一维时间序列x(t)转化为x(t)与x(t+τ),…,x[t+(m-1)τ]共同形成的m维空间,其中τ为时间延迟,m为嵌入维数[13-15].通过高维映射实现对波形形态的实时量化,在保证与原始序列相同的动态行为前提下,挖掘时间序列中所隐含的动态信息,从而弥补经典时频特征中有可能被丢失的潜在信息,更适于处理较长的非平稳数据.因此,考虑将一维BCG信号映射到高维的相空间中,从而获取表征房颤节律异常的特征参数.

设单个时间序列x(t)=(x1,x2,…,xN),其中N为x(t)中数据采样点数,则延迟重构的状态向量为vi=(xi,xi+τ,xi+2τ,…,xi+(m-1)τ).基于时间序列x(t)的相空间重构表示为

(1)

该方法的具体实现过程主要包括以下三步:

1) 确定延迟参数τ和嵌入维数m;

2) 通过延迟τ个采样点,将BCG信号映射到m维相空间中,获取其m维相空间轨迹;

3) 将m维相空间轨迹映射到二维平面上,以提高其输入神经网络进行分类的效率.其中,二维映射平面的选择要遵循高维信息最大化描述准则[13],从而获取最优二维节律特征.

2.2.1 延时参数τ的确定

延迟参数τ的选取,直接影响重构相空间轨迹的表征性能.若τ选取过小,则相空间轨迹会挤压于同一位置,反之则会使各分量相互独立,无法得到有效的特征[16].因此选取合适的τ值,不仅能够有效反映心血管系统的特性,而且能够提高后期房颤诊断的分类性能.目前,τ的选取方法主要包括:自相关函数法(autocorrelation, AC)、互信息法(mutual information, MI)、嵌入窗法等[17-18].本文采用AC法和MI法两种方法,对其所选τ值的分类性能进行比较,以获取最优重构参数.

AC法所估算的τ值为自相关函数的过零点[19],其计算公式为

(2)

MI法所估算的τ值为互信息函数的局部最小值点[20],其计算公式为

(3)

式中:pi为x(t)值为i的概率;pi,j为x(t)为i,x(t+τ)为j的联合分布概率.

AC法和MI法在估算τ值的过程中理论上仅需要提取首个过零点和局部最小值点.然而,在实践中,由于噪声和微小波动的存在,真实的τ值之前可能会出现伪过零点或伪局部最小值点,从而导致无法绘制出最优的相空间轨迹.因此,本文选取了前三个过零点或局部最小值点τ1,τ2和τ3,作为最优τ值的候选项,而后通过实验确定最终的τ值.图2为AC法前三个过零点处的τ1,τ2和τ3.图3为MI法前三个局部最小值点处的τ1,τ2和τ3.

图2 AC法估算τ值

图3 MI法估算τ值

2.2.2 嵌入维数m的确定

嵌入维数m决定时间序列重构相空间的维度,若m较小,则吸引子无法完全展开,反之则会使得计算量剧增,误差变大[16].因此,本文选择常用的虚假最近邻点法(false nearest neighbor, FNN)来选择最适合BCG信号重构的嵌入维数,有效避免信息被隐藏的同时,减小噪声的影响[21-23].该方法的原理为:在足够大的维度d上相邻的两个点在维度d+1上并不相邻,即虚假邻点.随着d的增大,相空间重构轨迹会逐渐展开,虚假邻近点也会逐步被消除,从而得到能够还原动力学系统的相空间轨迹.当邻近点减少至可忽略,则选取此时的d为嵌入维数m.该算法通过计算d与d+1维相空间之间欧氏距离的平方来确定邻近点数量,其计算公式为

(4)

(5)

其中:r为最近邻点的数目;τ为通过2.2.1节所估算的最优延迟参数.

理论上,若式(4)右侧第二项接近于零,则选择此时的d作为相空间重构的最优嵌入维数.但由于虚假最近邻点接近零的过程耗时较长或无法完全实现,因此实际情况下当虚假最近邻点小于某一阈值(1%或5%),即选定d为合适的嵌入维数.将%FNN作为函数来表征d增加过程中虚假最近邻点的变化,公式为

(6)

其中:FNN为当前虚假最近邻点的个数;totalN为最初虚假最近邻点的个数.

图4为将BCG信号作为输入时所得FNN的变化情况.

图4 虚假最近邻点法估算m值

由图4可见,当m为3时%FNN值已小于5%,故本文选取3作为BCG信号相空间重构的最优嵌入维数.

2.3 基于卷积神经网络的房颤智能检测

卷积神经网络(convolutional neural network, CNN)是一种包含卷积或相关计算且具有深度结构的前馈神经网络[24].由于卷积核参数的共享性和层间连接的稀疏性,使得卷积神经网络能够以较少的计算量实现网格状的拓扑特性,从而更适用于图像分析.

2.3.1 神经网络的输入

由于信号的检测时间较长,体动等因素的干扰致使信号出现基线漂移、不稳定等问题.本文沿(1,1,1)方向对相空间轨迹进行了坐标轴转换[25],转换公式为

(7)

(8)

(9)

经过以上坐标转换,信号x(t)的垂直移动即u(t)的变化,不会引起v和w的变化.此时,将三维相空间轨迹投影到(v,w)平面上,可避免信号垂直基线漂移的影响,以突出描述波形形状和频率随时间的变化.因此,本文将相空间轨迹垂直于向量(1,1,1)平面的投影定义为二维节律特征,以作为卷积神经网络的输入.

2.3.2 神经网络结构

本文基于相空间重构得到的二维节律特征,设计了一个16层的卷积神经网络:8层卷积层、4层池化层、1层flatten层、3层全连接层,其框图如图5所示.卷积层不仅可以对数据深入分析,提取高维特征,而且可以通过共享权值参数提高训练速度,同时卷积之后的dropout操作提高了模型抗过拟合能力.池化层可以在保留特征的同时减少特征矩阵和网络参数,也可以增加阻力避免过拟合.最后,Flatten层和全连接层对前向传播的特征进行处理,并由softmax函数激活,输出二分类结果.

图5 所设计的卷积神经网络结构

3 实验与结果

3.1 确定相空间重构参数

3.1.1 时间延迟τ的选择

为确定适于BCG 信号房颤检测的时间延迟τ,分别应用经典的AC法和MI法估算的AF与NAF数据的τ1,τ2和τ3值,并绘制统计直方图如图6、图7所示.

图6 AC法估算τ值直方图

图7 MI法估算τ值直方图

由图6与图7可见,通过AC法估算的τ值直方图分布较为杂乱,无法显著区分AF与NAF.而MI法所估算的τ值直方图均趋于正态分布,且对AF和NAF有一定的区分度.由此可见,MI法较AC法能避免噪声和其他微小波动对τ值计算的影响,更适合于延迟参数的选择.此外,通过比较图7中τ1,τ2与τ3的直方图分布,可见τ2和τ3较τ1可更明显地区分出AF和NAF,而τ3相对于τ2具有更小的偏度,这表明在大多数情况下τ3使得x(t)与x(t+1)有最小的依赖性.因此,初步选定τ3为最佳延迟参数.

为定量验证以上结论,分别应用两种方法估算了全部BCG分帧的τ值,并绘制了τ1,τ2和τ3的分布箱线图,如图8、图9所示.

图8 AC法估算τ值箱线图

图9 MI法估算τ值箱线图

通过比较可见,在相同BCG数据下,MI法的异常值较少,具有较好的鲁棒性,箱体的上下线分布对于AF与NAF的区分度也最为明显,与直方图分布显示结果一致.因此,最终选定τ3为最佳延迟参数.

3.1.2 嵌入维数m的选择

为定量验证2.2.2中初步选定的嵌入维数3,本文应用FNN算法分别估算嵌入维数m1,m2和m3,并绘制AF与NAF的分布箱线图,如图10所示.

由图10可见,m1,m2与m3的平均值均介于2和3之间.同时,根据相空间重构理论,嵌入维数的选取应尽可能足够大,以充分还原系统的动力学特性.因此,最终选定m=3为最佳嵌入维数.

图10 FNN估算m值箱线图

3.2 分类结果与性能比较

3.2.1 二维节律特征获取

应用m=3,τ=τ3绘制BCG信号的相空间轨迹,并将其投影到与向量(1,1,1)正交的二维平面上.所获取的二维节律特征如图11所示.

由图11可见,通过选取适合的相空间重构参数,所绘制的二维节律特征图可较为显著地区分出AF与NAF.

图11 BCG信号的二维节律特征图

3.2.2 分类性能比较

为验证所提方法的检测性能,本文复现了文献[26]中的基于BCG信号的经典房颤诊断方法.通过提取BCG信号的17个经典时频特征(6个时域特征,11个时频域特征),作为机器学习分类器的输入,以实现AF与NAF的区分.本文共比较了5个机器学习分类器,分别为support vector machine(SVM),naive Bayesian(NB),bootstrap aggregated decision trees(BAT),random forests(RF)和decision tree(DT).

性能参数方面选取了准确率(Acc)、灵敏度(Sen)、精确度(Pre)、特异性(Spe)四个参数以评估所提方法的分类性能.其计算公式分别为

Acc=(TP+TN)/(TP+FP+TN+FN) ,

(10)

Sen=TP/(TP+FN) ,

(11)

Pre=TP/(TP+FP) ,

(12)

Spe=TN/(TN+FP) .

(13)

其中:TP为真阳数据值;TN为真阴数据值;FP为假阳数据值;FN为假阴数据值,均由混淆矩阵计算所得.

最终十折交叉验证所获得的混淆矩阵及对应的分类结果如表1、表2所示.

表1 十折交叉验证混淆矩阵

表2 分类性能对比

通过对比可见:

1) 对于基于经典时频特征的机器学习分类方法, RF分类器的性能最佳,这一结论与文献[26]的结论一致.但分类的绝对精度低于文献[26],这主要由于本文所采用的实验数据量与受试者的人数均高于文献[26],更接近日常筛查的数据环境,而经典的时频特征对数据波形的差异性依赖较大,从而导致分类精度的下滑.

2) 本文所提方法的分类性能总体优于基于经典时频特征的RF分类器.这主要由于本文所提取的二维节律特征,较经典时频特征,对房颤的异常节律信息有更显著的区分度.此外,神经网络分类器较机器学习分类器具有更高的自适应性,因此更适于多受试者的数据分类.由此验证了所提方法在日常房颤筛查中的优越性.

4 结 论

1) 通过讨论相空间重构过程中的时间延迟τ和嵌入维数m的最优解,获取了BCG信号针对房颤诊断的最优重构参数.较经典时频特征,提出了二维节律特征,并在房颤检测方面取得了较为理想的表征效果,为BCG信号相空间重构理论在心血管疾病诊断领域的应用提供了参考依据.

2) 针对重构轨迹的二维节律,设计了自动诊断房颤的CNN分类器.并通过与经典机器学习分类器进行对比,获得了更优的房颤分类性能.从而验证了端对端分类器的优越性,为基于BCG信号的心血管疾病智能监测提供了新的研究思路.

猜你喜欢

维数节律分类器
少样本条件下基于K-最近邻及多分类器协同的样本扩增分类
一类一维齐次Moran集的维数结果
学贯中西(6):阐述ML分类器的工作流程
GmELF3s调控大豆开花时间和生物钟节律的功能分析
基于SVD 与数学形态学分形维数谱的战场声特征提取*
砂糖橘皮破坏效果的分形描述
基于朴素Bayes组合的简易集成分类器①
老年人工作记忆成功恢复
一种自适应子融合集成多分类器方法
爱的节律