APP下载

改进的集合经验模态分解在人体行为识别中的应用

2018-10-19王华华周远文

关键词:特征提取分类器均值

王华华,黄 龙,周远文

(重庆邮电大学 重庆市移动通信技术重点实验室,重庆 400065)

0 引 言

近年来,基于可穿戴传感器的人体行为识别的研究吸引了越来越多国内外学者的目光,通过将不同类型的传感器穿戴于身体的不同位置可实现对一些日常人体行为的识别与监测,另外在智能家居方面也具有广泛的应用前景[1-7]。基于惯性传感器的人体行为识别的整个流程中,特征提取是非常重要的一个环节,如何提取更加新颖更能代表分类行为的特征至关重要。文献[8]提出基于小波分解的特征提取方法,提高了5种分类行为的识别准确率,另外对步行、上楼和下楼3种容易混淆的行为的识别准确率也有明显提高。文献[9]提出了一种基于Kinect手语识别问题,考虑了手语的手型、手的位置和手的方向,结合了多种聚类算法,实现较好的分类效果。文献[10]提出将加速度计与陀螺仪结合使用的方法,验证了二者融合使用可以提高识别准确率的结论。但上述研究提取的特征不够新颖,从而导致易混淆行为的识别准确率较低,那么如何提取更少更优异性能的特征来提高分类行为的识别准确率是本文的研究重点。

针对上述提到的问题,本文提出一种改进的自适应集合经验模态分解法,该方法有效解决集合经验模态分解法无法自适应的筛选出对不同分类行为更加有用的固有模态函数的问题,通过对不同分类行为筛选的不同固有模态函数提取窗口均值差异、窗口均值趋势等新颖特征,有望在不同的分辨率下得到更准确、更有效的原信号特征信息,利用三轴加速度计与陀螺仪的传感器采集的原始数据,建立与用户无关的行为识别模型,不仅对行为分类中易混淆的步行、上楼和下楼3种行为有较好的分类效果,而且对本实验分类的是7种行为的平均识别准确率都有明显提高。

1 基于改进的EEMD分解的特征优选

1.1 原始信号EEMD分解

经验模态分解(empirical mode decomposition,EMD)法由Huang[11]在1998年提出的一种自适应多尺度分解方法。EMD方法利用信号本身的时间尺度特征,通过一定的筛选条件可以将非线性非平稳信号中的不同尺度的波动或趋势进行逐级分解为若干个固有模态函数(IMF)和一个余项,因此,在分析和处理非线性、非平稳信号方面具有一定优势,该方法在信噪比较高时有较好的滤波效果。集合经验模态分解(ensemble empirical mode decomposition,EEMD)法[12-13]是EMD的改进算法,它相对于EMD法的优点在于其能够抑制幅度较低的脉冲干扰产生的模态混叠。

本文对传感器采集的原始信号进行EEMD分解。图1为正常步行合加速度信号及经EEMD分解并挑选的前8个IMF。通过图1可以看出,从原始信号分解的IMF分量很好地保留了原始信号的基本信息,并且实现了对原始信号的平滑处理,去除了高频噪声信号成分。

1.2 改进的EEMD分解方法

受传感器佩戴位置松动的影响,惯性传感器采集的原始信号中含有大量的噪声,当信噪比较低时,EMD法与EEMD法分解得到的IMF仍然存在有用信号与噪声的混叠现象,另外,并非所有分解所得的IMF都有利于各种行为的分类,需要针对不同的分类行为自适应的筛选出对分类有用的IMF进行后续的特征提取,最终实现更好地识别准确率。基于此提出了一种改进的自适应EEMD方法,该方法依据白噪声的统计特性及不同分类行为的特点筛选不同的IMF,然后对筛选后的IMF提取窗口均值趋势等新颖特征,最后用于训练不同分类器。改进的自适应EEMD方法如图2所示,步骤如下。

1)对原始数据信号进行低通滤波,去除原始信号中噪声成分;常见的去噪方式主要包括低通滤波、平滑滤波和取导数操作等方式,通过对3种不同方法去噪结果比较,本文采用的是FIR低通滤波器。有研究表明[14-15],人体动作的信号频率不超过18 Hz,因此,本文采用的低通滤波器截止频率设置为18 Hz,以去除原始信号中的高频噪声成分。

2)将去噪后的信号进行EEMD分解,得到若干IMF分量和一个余项。

3)对分解得到的每个IMF分量计算能量密度与平均周期,然后依此作为对不同分类行为有用的IMF分量的筛选条件,具体判别过程包括:设每个IMF的能量密度与其平均周期的乘积为

Pi=Ei·Ti,i=1,2,…,m

(1)

图1 步行合加速度信号及EEMD分解所得IMF1-IMF8Fig.1 Acceleration signal of walking and its IMF1-IMF8 decomposed by EEMD

(1)式中,Ei与Ti分别表示不同IMF分量的能量密度与平均时间周期。设筛选条件系数Ci为

Ci=pi/pi-1,i=2,…,m

(2)

当Ci≥2时,表示第i个IMF分量的能量密度与平均周期的乘积与第i-1个IMF分量相比成倍增加,此时有用信号将代替噪声成为各IMF能量的主导,基于此可以将第i个IMF分量作为筛选的有用分量,这样就实现去除噪声,自适应的获取IMF分量。

图2 改进的EEMD特征提取方法流程图Fig.2 Flow diagram of improved EEMD feature extraction method

4)设置筛选的IMF分量个数的最大值K;为了使分解得到的IMF分量在幅值和频率上不失去其应有的物理意义,必须控制迭代筛选次数,为此需要设置筛选过程的终止条件,习惯上用分解得到的2个连续的IMF分量之间的标准偏差SD表示。在实际应用中SD为[0.2,0.3]时,既能保证IMF分量的线性和稳定性,又能使各IMF分量在幅值和频率上都有明确的物理意义。然而K的取值与SD相关,本文将SD的值设置为0.25。

5)对筛选的IMF分量提取窗口均值趋势,窗口均值差异等特征。

1.3 基于改进的EEMD特征提取及其行为相关性分析

为了验证通过改进的EEMD分解方法提取特征的有效性,笔者将对分类中易混淆的3种行为(上楼、下楼和步行)提取特征,首先将数据采集模块置于人体手腕位置分别对3种行为提取三维加速度信号,具体步骤如下。

步骤1按照(3)式计算三维加速度信号的合加速度

(3)

(3)式中:ax,ay,az分别为加速度计的x轴、y轴及z轴方向加速度值;a为合加速度值。

步骤2对所求合加速度信号通过本文提出的改进的EEMD特征提取方法进行分解提取特征,并将筛选的有用IMF个数K设置为4,采用时间长度为2.5 s的滑动窗对所筛选的IMF信号进行分窗,然后按照(4)式对每个窗样本中的4个IMF分别计算窗口均值趋势并进行求和计算,以作为一组特征向量。

(4)

(4)式的含义为将每个样本窗分成n个更小的样本,并对每个小样本求均值,然后将相邻小样本均值求差值,并对这些差值的平方求和,其中,μT为窗口均值趋势;n为分成更小样本的个数;i表示第i个小样本。本实验中n取值为9。

为了验证该特征提取方法的性能,分别提取均方根特征及本实验提出的特征提取方法:通过对3种动作提取特征并分析其性能,实验结果分别如图3和图4所示。

另外,为了进一步说明通过改进EEMD方法提取特征的有效性,我们还将传感器置于脚踝处进行实验,通过相似的方法,通过(5)式提取了基于改进的EEMD分解的窗口均值差异作为特征向量,实验结果如图5所示。

(5)

(5)式的含义为将每个样本窗分成n个更小的样本,并对每个小样本求均值,然后将分窗后的每个小样本均值与样本窗均值求差值,并对这些差值进行求和计算。其中,μD为窗口均值差异;n为分成更小样本的个数;i表示第i个小样本;μ为样本窗均值。本实验中n取值为9。

图3 步行、上楼、下楼3种易混淆行为分类(手腕)Fig.3 Walking, upstairs, downstairs three easy to confuse behavior classification(wrist)

图4 步行、上楼、下楼3种易混淆行为分类(手腕)Fig.4 Walking,upstairs,downstairs three easy to confuse behavior classification(wrist)

图5 步行、上楼、下楼3种易混淆行为分类(脚踝)Fig.5 Walking,upstairs,downstairs three easy to confuse behavior classification(ankle)

从图3可以看出,步行、上楼和下楼3种行为的均方根存在很多交叉点,很容易造成3种分类行为的混淆;从图4和图5可以看出,步行、上楼和下楼3种行为经过EEMD分解提取的窗口均值趋势值和窗口方差趋势值都只有一个交叉样本点,总体来说,不同行为之间界限分明,与图3相比,可以很清晰地看出本实验提出方法的有效性。为了进一步提高不同行为分类识别的准确率,我们除了提取了均值、方差、频域能量等常见时域频域特征及图4和图5中介绍的2种特征,还提取了其他几种新颖的特征[16]。

窗口方差趋势为

(6)

(6)式中:σT2为窗口方差趋势;n为分成更小样本的个数;i表示第i个小样本。本实验中n取值为10。

窗口方差差异为

(7)

(7)式中:σD2为窗口方差差异;n为分成更小样本的个数;i表示第i个小样本;μ为样本窗方差。本实验中n取值为10。

然后将生成特征数据集用于后续的训练与测试行为分类模型。

2 实验设计与结果分析

2.1 实验数据集的获取

本文使用的数据集是来自德国埃尔朗根-纽伦堡大学提供的DaLiAc数据[17],该数据集包含了一些常见人体行为动作,采用4个传感器节点,每个节点由一个三轴加速度计和一个三轴陀螺仪组成,可以采集三轴加速度信号和三轴角速度信号,设备采样频率为204.8 Hz。4个传感器结点分别固定在实验者的右臀部、胸口、右手腕以及左脚踝4个部位。实验提取了数据集中的18名实验者的数据包括坐、站、躺、步行、上楼、下楼、跑步等7种人体行为数据。在数据分割阶段,本实验采用的滑动窗口长度同样设置为2.5 s,窗口重叠率为50%,本数据集一共包含3 780个样本,为了建立与用户无关的人体行为识别通用模型,实验采用留一交叉验证法(leave-one-out,LOO)进行验证测试,根据不同分类行为将数据集划分为训练集和测试集,分别用于训练和测试分类模型,对不同行为每次测试时从18名实验者中不重复的抽取一名实验者的数据用于待测样本集,剩余17名实验者样本集用于训练样本集,循环进行18次并对识别准确率求平均得出最终识别结果。表1为每次用于训练与测试时的样本数的划分。

表1 样本数据集表

2.2 实验结果分析

为了验证本文提出方法对多种不同行为分类的有效性,实验分别通过提取常见时域特征包括均值、方差、四分位值、相关系数和在此基础上另外添加本文提出的方法提取的特征集,即基于改进的EEMD分解后提取的特征集,然后依次训练KNN分类器与SVM分类器模型进行比较,下面简单介绍下本实验中KNN与SVM分类器的工作原理及参数设置。

KNN分类器的基本工作原理是,根据计算出的待分类样本x与所有训练样本间的距离,并从中选出x的k个近邻,然后统计这k个近邻的类别,并将x归入k个近邻中得票最多的那一类。根据经验规则,k一般小于训练样本数的平方根,因此本实验将k的值设为12。SVM 分类器能有效解决非线性、小样本、维数灾难和“过学习”等分类问题,常见的核函数包括有线性核函数、多项式核函数和径向基核函数等。设有H种不同分类行为,则共需要P=H(H-1)/2个两类分类器,本实验采用的SVM模型选用径向基核函数,表示为

K(x,xi)=exp(-γ|x-xi|2)

(8)

(8)式中,γ=1/H,损失函数C=1,本文中有7种分类行为,实验中H的值设为7。

本实验采用留一交叉验证算法进行验证,实验结果如表2和图6所示,其中,FS表示常见方法提取的特征集,FS+proposed表示在此基础上添加本文方法提取的特征集。

从表2的分类结果可以看出,不管是使用KNN分类器还是SVM分类器进行分类,本文提出的方法对7种分类行为识别准确率都有明显提高,从图6可以看出,使用2种不同分类器分类的7种行为的总的平均识别准确率提高明显,使用KNN分类 器提高了17.20%,达到了95.11%;使用SVM分类器提高了10.19%,达到了93.14%,2种分类器都达到较高的识别准确率。针对易混淆的步行、上楼和下楼3种行为也达到较好的识别效果,2种分类器的识别准确率分别提高29.22%(KNN)和15.79%(SVM)。

表2 各行为分类识别准确率

图6 平均识别准确率(1表示FS 2表示FS+proposed)Fig.6 Total average recognition accuracy(1-FS 2-FS+proposed)

为了进一步验证本文提出的改进的EEMD特征提取方法的有效性,实验使用本文方法提取特征与其他几种传统有效的特征提取方法提取特征进行对比,包括自回归模型AR系数,db2的小波系数能量,FFT变换得到的前4个FFT系数的幅度值,传统的EEMD分解提取前4个IMF分量的窗口均值趋势等特征,分别用于训练SVM分类器,实验结果如表3。由表3可以看出,本文提出的改进的EEMD特征提取方法的平均识别准确要明显高于其他几种方法的识别准确率,相比于EEMD分解的特征提取方法,改进的EEMD的特征提取方法通过去除不必要的噪声,提取了更加有用的IMF分量,最终实现更好的分类识别准确率。由此验证了本文提出方法的有效性。

表3 不同特征提取方法的识别准确率

3 结 论

针对在人体行为识别的研究中提取的特征不够新颖、识别准确率不高的问题,特别是对步行、上楼、下楼3种易混淆行为的识别,本文提出一种改进的自适应EEMD特征提取方法,该方法能自适应的筛选出对不同分类行为更有用的固有模态函数,通过对不同分类行为筛选不同固有模态函数并提取窗口均值差异等新颖特征,有望在不同的分辨率下得到更准确、更有效的原信号特征信息。实验分别用典型时域特征与本文方法提取的特征训练KNN与SVM分类器。结果表明,该方法不仅对3种易混淆行为的平均识别准确率分别提高了29.22%(KNN)和15.79%(SVM),对实验分类的7种不同行为也实现较高的平均识别准确率,分别达到了95.11%(KNN)与93.14%(SVM)。另外,本文提出的改进的EEMD特征提取方法的平均识别准确要明显高于其他几种方法的识别准确率,相比于EEMD分解的特征提取方法,改进的EEMD的特征提取方法通过去除不必要的噪声,提取了更加有用的IMF分量,最终实现更好的分类识别准确率。由此验证了本文提出方法的有效性。

猜你喜欢

特征提取分类器均值
基于Gazebo仿真环境的ORB特征提取与比对的研究
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
基于Daubechies(dbN)的飞行器音频特征提取
基于实例的强分类器快速集成方法
Bagging RCSP脑电特征提取算法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
关于均值有界变差函数的重要不等式
基于MED和循环域解调的多故障特征提取