APP下载

基于Relief特征选择算法与多生理信号的焦虑状态识别

2014-06-08雷沛王静周昕炜柴新禹

中国医疗器械杂志 2014年3期
关键词:特征选择生理样本

雷沛,王静,周昕炜,柴新禹

上海交通大学生物医学工程学院,上海市,200240

0 引言

焦虑是一种在感到被威胁的环境中产生的复杂的心理过程。通常是由于自身行为有可能无法完成既定目标而产生的情绪状态[1]。焦虑既是一种复合的情绪状态,又是一种内驱力。处于焦虑情绪状态下的个体有外在的行为表现与躯体内部的生理变化。其中心理症状有担忧、紧张、烦躁等。躯体症状多系交感神经兴奋的反应性症状,如气短、气促、心慌等[2]。

利用多种生理信号参数进行人的特定情绪状态的识别研究目前得到广泛的研究。生理信号是由人的自主神经系统和内分泌系统控制的,不受人的社会因素影响而产生的生物电信号、生物阻抗或生理外形特征变化信号[3]。利用生理信号参数进行的情绪状态识别更为真实和客观。其基本研究思路是通过情绪诱发实验,得到与特定情绪相关的单一或多种生理信号参数,经信号预处理及特征提取,建立用于识别算法或模型的特征空间。提出或采用的识别算法或模型根据特征空间进行调整优化,以提高算法或模型识别特定情绪的可靠性。Pichard带领的MIT实验室记录了五种生理参数,提取了40种特征,探索了基于多生理参数进行情绪识别的可行性[4]。Kim等[5]利用音频材料以及视频片段作为诱发材料,采集了200名被试的四种生理参数,采用支持向量机算法来对四种情绪进行分类识别,发现利用同样的算法当情绪识别种类增加时,识别率会略有下降。在国内,西南大学研究小组分别利用多种单一生理参数,如呼吸信号、心电信号、皮肤电信号,通过电影、图片等方式来诱发情绪,采用多种不同算法对多情绪进行识别[6-8]。上海交通大学的相关小组,利用国际情感诱发图片库及任务驱动诱发方式,采集了压力状态下血氧饱和度、心电、血压等信号,建立起压力状态下的情绪识别模型[9]。这其中有些研究者依据模式识别研究领域的思路与方法,会进行特征归一化及特征优化选择的处理,在保证识别准确率的同时以降低整个识别算法模型的复杂度。常见的特征选择算法有粒子群算法[9]、进化算法[10]、禁忌搜索[11]等,这些算法在取得较好的选择效果的同时,往往要占用较大的计算资源和牺牲一定的计算效率。Relief算法计算复杂度比较小,容易实现,可以优化选择特征,提高分类器的分类正确率,减小用于分类的特征维数[12]。

对于焦虑情绪的识别判断,目前多集中于通过问卷和观察的方式。本文通过任务驱动的方式诱发焦虑情绪,利用焦虑状态-特质问卷(State-trait Anxiety Inventory, STAI)评价被试焦虑状态的主观反映。并基于与焦虑情绪相关的心电、呼吸、血容量搏动、皮肤电生理信号参数,提出将Relief特征选择算法用于生理信号特征的优化选择分析。最后分别采用k近邻(k-Nearest Neighbor,kNN)算法和最小二乘支持向量机(LS-SVM)算法,实现焦虑情绪状态的识别和判断。

1 焦虑状态识别算法

1.1 Relief算法

Relief算法[12]是一种计算量较小的特征选择算法。通过选择出与数据总体相关性高的特征,使特征维数得到了降低。这种算法分别为每维特征赋予相应的权值,并以此表征与类别的相关性。

Relief算法从训练样本中随机选择m个样本,计算出假设间隔,并进行累加,作为最后特征每个维度的权值,样本x中某维特征p的权值的更新为

若p离散,则

若p连续,则

其中,max(p)、min(p)分别是p的上界与下界。

Relief算法的输入为属性值向量和样本量,输出为对每个属性的权值估计的流程如下:

设初始权值向量 W[A]= 0;

for i =1:m do begin;

随机选择一个样本R;

找到同类最近点 H 和非同类最近点 M;

or A =1:特征维数 do;

W[A]= W[A]-diff(A, R, H)/m + diff(A, R, M)/m;

end。

1.2 kNN算法

kNN 算法是一种机器学习算法:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。本文选择k=3,即该对象被简单地分配给一个相近3个样本点中数量多的类别。

1.3 SVM算法

支持向量机算法在非线性、高维、小样本数据的处理上具有独特的优势。支持向量机的基本思想就是将在N维空间中难以划分的样本点,在高维的空间中,通过找到一个最有利于分类的平面,来把不同类别的样本点区分开来。而最小二乘支持向量机算法不仅具有经典支持向量机算法的特点,且还具有计算效率高和所需计算资源少等优点。同时,支持向量机算法中利用核函数来提高计算效率,因此本文采用核函数为高斯核函数的最小二乘支持向量机。

1.4 分类识别流程

将Relief算法与两种分类器进行结合,来进行实验所采集的生理参数数据的特征选择和分类。两种算法结合应用的详细的流程为:

(1) 初始化特征权重值;

(2) 利用Relief计算出每个维度的特征的权重,淘汰掉权重值较小的特征;

(3) 将选择后的特征向量利用分类器进行分类计算;

(4) 得到分类结果,并与实际结果进行比对,计算识别率;

(5) 调整参数,直到取得最优识别率,确定最终的算法模型。

2 焦虑状态诱发实验

2.1 实验材料

目前情绪诱发主要通过被试的回忆想象、利用视频或图片刺激以及任务驱动等方式[13]。本研究中焦虑状态的诱发采用任务完成方式。实验采用了一款赛艇模拟游戏(Aquadelic GT, Hammerware, s.r.o.,Czech),以仿真诱发运动竞赛中的焦虑情绪状态。这款游戏需要被试操纵键盘的方向键控制赛艇前进方向。而游戏过程中容易出现方向偏离、赛艇搁浅进而影响游戏完成的情况。因此会使被试因为在一定时间内无法完成相应任务而产生焦虑情绪。

焦虑状态-特质问卷(State-trait Anxiety Inventory,STAI)是由Spielberger编制[14]的用于被试自我评价焦虑状态的测量工具。根据所测分数来判断被测试者的焦虑状态和程度。同时它能够区分状态焦虑(当前的焦虑状态)和特质焦虑(一贯的焦虑状态)。该测量工具测试简便,结果直观,并能比较准确地反应测试者的主观感受。

2.2 实验被试

8名被试参与正式实验,其中4名为男性,4名为女性。年龄在(20~25)周岁之间,身心健康、视觉听觉正常,过往无精神及神经性疾病史。实验前一周内未服用任何药品,4 h内无剧烈运动。实验开始前4 h进行STAI问卷测试,STAI结果达到一定标准(男性:STAI总分≤109;女性:STAI总分≤112)能够进一步参与正式试验。整个实验严格遵守赫尔辛基宣言。

2.3 实验平台

实验任务的操作平台采用高性能计算机(Intel (R)CoreTMi5-2310 CPU @2.90 GHz,4 GB DDR3 RAM,联想,中国;17英寸专业显示屏,300 cd/m2,分辨率为1280×768,垂直刷新率为75 Hz)。被试观察距离约50 cm。采用NeXus-10 MKII(Mind Media B.V., 荷兰)进行生理参数的检测与记录。NeXus-10 MKII是一款10通道的可显示生理数据及生物反馈的设备,通过8个独立的24 bit转换器,每秒最高采样2 048次,具有高带宽,广动态范围和高精确度。可同步采集皮肤温度、皮肤电、呼吸、血容量搏动等多种生理信号,各数据集成传感器的精度均为 ± 2%。

2.4 实验过程

正式实验前,对被试进行两部分问卷的复测,处于正常水平的被试进行正式实验,并测量其各生理参数。

实验包括训练和正式试验两个部分。训练用于被试熟悉实验任务和操作过程。正式实验进行三组难度递增的赛艇任务,每组进行三次,并在其进行实验任务时同步采集各种生理参数。被试在虚拟环境中驾驶赛艇通过相应数目的标识点。三组任务分别是在90 s、75 s、60 s时间内分别通过8,9,10个点。每次实验后,进行STAI问卷状态焦虑测试。

为了保证焦虑状态的有效诱发,在正式实验前,会告知被试相应的奖惩措施,被试对提供的奖励进行排序。随后按照被试选择的奖励安排不同难度的实验任务,即完成最高难度后发放被试最倾向的奖品,来增强被试完成任务的迫切感和必要感。为了保证每次实验被试都能尽量投入,整个实验过程中不明确告诉被试每次的成绩。实验全部完成后,请被试休息约5 min,再进行一次状态焦虑问卷的测试,若问卷反映被试状态归于平静,则再进行一段时间的生理参数的采集,以再次得到该被试平静状态下的各生理参数。

2.5 实验数据预处理和分析

得到原始数据后,利用自适应滤波去噪。由于生理参数具有比较明显的个体差异性[3],将实验前后两次平静状态相关的生理数据的均值作为基线数据。因有研究表明,去除情感基线的生理数据能够达到更佳的识别准确率[9]。对各生理数据进行特征提取后去除基线数据,所提取的特征集合如表1所示。

表1 生理参数及特征Tab.1 The physiological signals and the features

通过单因素方差分析法分析诱发条件(实验任务)对各生理数据的影响,并采用Dunnett校验进行不同诱发条件下与平静状态生理数据的比较。数据分析通过SPSS(Statistical Product and Service Solutions2010, IBM SPSS Inc.New York, USA)完成。最后将所得到的样本数据归一化[15],用于特征选择和分类。

3 实验结果与分析

通过实验室情绪诱发实验,共获得8位被试的心率、呼吸率、血容量搏动率、皮肤电四种生理参数,共88个生理参数样本数据,其中平静生理数据样本16个,焦虑情绪样本72个。

对各被试STAI状态焦虑问卷结果分析,发现平静状态的自评分数均低于三组实验中焦虑情绪状态的自评分数。说明被试主观感受反映了焦虑情绪的诱发成功。

3.1 平静生理数据与焦虑情绪下生理数据均值特征差异性分析

对于每种生理参数均值特征的11组数据(平静状态2组、第一组实验状态3组、第二组实验状态3组、第三组实验状态3组),本文通过SPSS软件来完成11组数据的单因素方差分析以及Dunnett后校验。分析结果显示,呼吸率均值受实验任务影响显著(P<0.001)。并且实验组呼吸率均值均显著高于平静状态组(P<0.01)。平静状态下和第二组实验状态下心率均值受实验任务影响显著(P<0.05)。血容量搏动率均值受实验任务影响显著(P<0.05),且平静状态与第一组、第二组实验状态的血容量搏动率受实验任务影响显著(P<0.01)。皮肤电均值受实验任务影响显著(P<0.01),且平静状态与第二组、第三组实验状态的皮肤电均值受实验任务影响显著(P<0.05)。以上结果表明,实验任务刺激下,生理参数的变化具有显著性差异,由于第二组实验状态下的各生理参数均值与平静状态相比具有显著差异,因此,采用第二组实验状态与平静状态下的心电、血容量搏动、皮肤电、呼吸信号特征进行后续的特征选择和分类,以评估所提出的Relief-kNN算法与Relief-SVM算法的有效性。

3.2 分类结果分析

经过分析和筛选,得到每位被试16个平静状态样本和第二组实验24个焦虑状态样本,将40个样本中16个样本子集作为训练集(8个平静状态样本,8个焦虑状态样本),24个样本作为测试集(8个平静中状态样本,16个焦虑状态样本),进行特征选择和分类,共分两类。采用Relief-kNN与Relief-SVM得到仿真识别结果如表2所示。

表2 Relief-kNN算法和Relief-SVM算法对两组样本的分类结果Tab.2 The classi fication results of two data groups using Relief-kNN

由结果可以看出,优化选择后的多种生理参数特征组合比单一生理参数特征更能提高识别算法的识别效果。在样本训练中,各生理参数方差、呼吸率一阶差分均值,皮肤电最大最小值差等特征计算出的权重值(即对分类的贡献大小程度)比较高,说明其对于焦虑状态的识别具有重要意义。Relief算法与SVM算法结合时比与kNN算法结合所选择的特征数量更少,且识别准确率更高。因此,在焦虑状态识别中,Relief算法与SVM分类器的结合优于与kNN算法的结合。并且与之前的研究相比[9],仿真环境下的基于多生理信号的情绪状态的识别率更高。

4 总结与展望

本文采用任务完成的方式来实现焦虑情绪的诱发,建立基于多生理参数的焦虑情绪状态下的情绪识别仿真模型。通过Relief特征选择算法找到了对于识别有效的特征向量,并用kNN算法和SVM算法实现了焦虑状态下的情绪识别。实验结果表明,Relief算法与SVM算法结合时比与kNN算法结合所选择的特征数量更少,且识别准确率更高。利用多生理参数进行情绪识别优于利用单一信号。未来的工作将在继续完善焦虑状态下基于多生理参数的情绪识别仿真模型,并将其推广到应用领域,用来对焦虑情绪进行识别并对相关的心理调节提供辅助作用。

[2]张作记.焦虑的基本问题及临床处理[J].中国行为医学科学,2004, 13(2): 238-240.

[3]Ekman P, Levenson RW, Friesen WV.Autonomic nervous system activity distinguishes among emotions[J].Science, 1983,221(4616): 1208-1210.

[4]Picard RW.Affective computing[M].Cambridge(MA): The MIT Press, 1997.

[5]Kim KH, Bang SW, Kim SR.Emotion recognition system using short-term monitoring of physiological signals[J].Med Biol Eng Comput, 2004, 42(3): 419-427.

[6]王彬.基于呼吸信号的情感识别研究[D].西南大学, 2010.

[7]徐亚.基于心电信号的情感识别研究[D].西南大学, 2010.

[8]蔡菁.皮肤电反应信号在情感状态识别中的研究[D].西南大学,2010.

[9]孙洪央, 徐祖洋, 王静, 等.基于 PSO-kNN 算法与多生理参数的压力状态下情绪识别[J].中国医疗器械杂志, 2013, 37(2): 79-83.

[10]郝敏.进化算法在选取 ECG 信号情感特征中的研究[D].西南大学, 2009.

[11]肖丽, 刘光远, 方永慧.基于禁忌搜索的模糊神经网络分类器设计[J].西南大学学报 (自然科学版), 2007, 29(1): 73-76.

[12]Kira Kenji, Rendell Larry A.A practical approach to feature selection[C].Proc 9th Int Workshop Machin Learn, 1992: 249-256.

[13]陈姝娟.情绪研究方法述评[J].中山大学学报论丛, 2006, 26(3):57-60.

[14]Spielberger CD.State‐Trait anxiety inventory//Corsini Encyclopedia of Psychology[M].2010.

[15]Picard RW, Vyzas E, Healey J.Toward machine emotional intelligence: analysis of affective physiological state[J].IEEE Trans Pattern Anal Mach Intell, 2001, 23(10): 1175-1191.

猜你喜欢

特征选择生理样本
网络入侵检测场景下的特征选择方法对比研究
用样本估计总体复习点拨
大脑如何知觉音乐的形式美?——来自电生理的证据
肉鸡铬需要量及其营养生理作用
基于BP神经网络的旋转血泵生理控制
规划·样本
妈妈们产后的生理烦恼
基于最大信息系数和近似马尔科夫毯的特征选择方法
随机微分方程的样本Lyapunov二次型估计
Kmeans 应用与特征选择