APP下载

基于脑功能网络连接的隐藏信息检测研究

2018-10-18常文文化成城王翘秀

电子科技大学学报 2018年5期
关键词:范式分类器量子

常文文,王 宏,化成城,王翘秀,原 玥,刘 冲

(东北大学机械工程与自动化学院 沈阳 110819)

近年来,基于大脑认知事件相关电位(event related potential, ERP)的隐藏信息测试方法得到快速发展[1-3],其相关研究主要涉及以下几个方面:首先,要能够成功地诱发出被试者试图隐藏的信息,实验刺激范式的设计特别重要;其次,如何对诱发得到的脑电位信号进行信息解读,也即提取到能够正确表征隐藏信息所诱发脑电信号的特征量;最后,结合不同的应用场合,选择和开发快速、高效和准确的分类识别算法也是非常关键的一个方面。

目前主流的隐藏信息测试范式都是基于图片刺激对被试诱发ERP来完成[1-2],同时文献[3]研究通过听觉刺激范式实现对隐藏信息的测试,发现听觉刺激测量得到的判别准确率低于视觉刺激,整体测试效果视觉刺激范式相对较好。本文设计了视听同步刺激实验范式,并同视觉刺激进行了对比分析,旨在探究视听同步刺激对隐藏信息测试的效果。同时大量相关研究基于单通道或少数通道(Cz,Pz,Fz)信号的时域和频域分析为主[1-2,4-5],随着近几年脑网络分析方法在大脑认知研究中的广泛发展和成功应用[6-8],本文把该方法应用到基于脑电信号的隐藏信息测试中,将功能网络参数作为特征量,从而从空间域的角度探究在隐藏信息测试过程中大脑功能状态的变化。对不同状态脑网络特征参数进行分类时,考虑到主流分类器如支持向量机和人工神经网络,存在参数选择困难、容易产生区部最优解以及训练速度慢等特点[4-5],本文设计了基于量子神经网络(QNN)的特征分类方法,对视觉刺激和视听同步刺激的ERP脑功能网络特征进行模式分类和对比分析。

本文设计了基于听觉刺激和视听同步刺激的隐藏信息测试实验,使用Neuroscan-32导脑电记录系统完成被试信号的采集,提取出对隐藏信息敏感的P300信号[9],通过计算全脑区各电极导联之间的互信息来构建脑功能连接网络,以功能网络的基本特征参数作为QNN分类器的输入量,完成对试图隐藏信息状态的检测。同时本文证实了脑网络分析方法和QNN分类器在隐藏信息测试中的可行性以及视听同步刺激在隐藏信息测试范式设计中的效果。

1 实验过程和数据预处理

1.1 实验过程

20名被试参加实验(均值:23.6岁, SD:5.3,7名女性),实验前,每名被试提供两张照片,一张为被试的导师,另一张是被试的家庭成员,并告知实验人员照片对应的名字。所有照片处理成相同分辨率、亮度和对比度的灰度图片,大小为37.3 mm×50.3 mm;对应名字通过文字−声音转换软件转换成音频文件(.wav格式,男声,48 kHz采样,16位),并调整到相同的声压级。每个声音刺激都由汉字组成,声音持续时间为1 000 ms。

实验为两种不同的刺激范式:视觉和视听同步刺激[10-11],通过STIM2软件来呈现刺激,声音刺激通过立体耳机呈现给被试。视觉刺激中,只呈现照片,每张照片持续时间为1 000 ms,窗口时间为1 500 ms,间隔时间为1 700 ms。视听同步刺激中,照片和声音同时呈现,照片和音频刺激的时间都为1 000 ms,间隔时间也为1 700 ms。靶刺激(Target, T)为被试导师,无关刺激(Irrelevant, I)为被试不认识的人,探测刺激分两类,其中被试不熟悉的人为探测刺激1(Probe1, P1),被试熟悉的人为探测刺激2(Probe2, P2),以便于进行对比分析。

20名被试分成5组,每组4名被试,对某组中的某名被试,刺激由2张该被试自己提供的照片和音频文件(T和P2),以及其他3名被试提供的6张照片和音频文件(1个P1和5个I)组成,也即一个刺激序列有8张照片/音频刺激。每一个实验模块(block)设计成oddball范式,T、P1、P2和I呈现的次数分别为15、15、15和75,每个block重复3次(每名被试总训练(trial)数为45)。要求被试对出现的照片或声音做按键操作,当T出现时,按YES,对不熟悉的人按NO,并告诉被试试图隐藏对P2的信息,将其归类到自己不认识范围(即“说谎”),然后按NO。先完成视觉刺激,每个block中途休息3 min。被试坐在舒适的座椅上,眼睛到显示屏距离80 cm,对视听同步刺激范式,被试要求眼睛注视显示器中央。

1.2 数据预处理

实验刺激呈现和EEG数据记录采用neuroscan32导采集系统,该系统为10-20国际电极标准,采样频率为1 000 Hz,参考电极为左右耳垂,前额接地,在线采样频带为0~100 Hz,垂直眼电电极位于左眼上下2 cm,两眼外眼角处为水平眼电电极。在EEGLAB软件中对脑电初始信号进行去眼电、去除漂移较大和噪声污染严重的数据段等,完成伪迹处理。截取−100~923 ms的数据点为一个epoch数据段(1 024个点),也即一个ERP片段数据,之后对所有epoch进行平均,得到每位被试的ERP数据,对有效被试的ERP进行总平均得到如图1所示的总平均ERP信号(图中为Pz导联上的ERP)。通过对ERP数据的7层小波包分解和对delta波段(0.48~3.9 Hz)的重构得到对隐藏信息敏感的P300信号[9]。

图1 视觉刺激和视听同步刺激诱发ERP信号(Pz导联)

同时对图1中Pz导联处说谎(P2)和说真话(P1)状态下P300幅值信号计算均值并做t检验,对视听刺激,P1:Mean=8.380 1,SD=1.954 3,P2:Mean=12.394 4,SD=1.358 1,t=2.408,p=0.027;对视觉刺激,P1:Mean=4.712 5,SD=1.730 5,P2:Mean=6.544 9,SD=1.429 9,t=2.156,p=0.039。可以看出被试在说谎和说真话时P300幅值信号之间有显著的差异。

2 脑功能网络特征提取

研究表明,人的大脑在处理认知任务的过程中需要全脑不同功能区域的协调和合作,但是不同脑区对应于不同的认知功能分配[7,12],因此最为直接的研究手段是探究不同脑区之间信号的相关程度,来了解不同认知任务在不同脑区的活跃程度以及全脑功能状态的变化。目前文献中有关信号间相互依赖性的算法有很多[13-14],但互信息(mutual information,MI)能够同时表征两个时间序列之间的线性和非线性统计特性[15],可以成功地表现脑区连接中的信息传递关系。因此本文采用互信息来计算全脑区不同电极之间的依赖关系,并构建对应的脑功能网络。

在信息论中,熵用来度量两个信号间的不确定性。对于一离散随机序列X,其对应的输出量为Xi,为序列点数,每一个输出对应的概率为pi,对应该序列的Shannon熵定义为[14-15]:

基于对熵的定义,可以定义序列X和Y之间的同步关系,将其互信息定义为:

一般脑网络表示为G(V,E),其中,V为网络的节点,对应脑电信号中不同的导联,本文采集有效数据导联为30;E为网络的边[6-7],对应脑电信号中不同导联之间的相互依赖关系,本文中即为上述讨论的MI值。对以上20名被试中有效被试(视听刺激为17名,视觉刺激为16名)在不同实验范式和不同刺激类型下各导联ERP总平均信号计算其各导联之间的MI值,得到不同导联之间的邻接矩阵(30×30),并表示为大脑拓扑结构图的形式,如图2所示。可以直观地看到,“说谎”组脑网络拓扑连接密度整体大于“说真话”组,同时被试对熟悉人的拓扑连接密度大于对陌生人的连接密度,而视觉刺激和视听同步刺激拓扑结构存在细微差异,但定性表征的差异不够明显。

图2 不同状态下脑功能网络拓扑连接

为了定量表征脑网络特征,本文重点讨论了脑功能网络的两个基本特征量[6-7]:聚集系数C(clustering)和特征路径长度L(path length)。聚集系数表示的是网络的局部聚集能力。对于节点i,如果周围和它相连的节点数为k,也即有k个邻居节点,则将节点i的聚集系数定义为该节点邻居节点间实际的连接边和最多可能的连接边的比值:

式中,w为不同节点i,j,k之间的加权连接边;N为网络的总节点数。则整个网络的聚集系数定义为:

特征路径长度表征了网络的全局特性,对于加权网络,为了处理网络中的孤立节点,一般用全局效率的倒数来计算特征路径长度。首先将某条路径上所有边的长度之和定义为这条路径的加权长度,选择Lij为节点i和j之间的最短路径长度,整个网络的加权长度定义为所有节点对之间最短路径长度的总平均:

计算所有有效被试以上不同刺激范式和不同状态下的C和L,如图3所示,图中“*”表示p<0.05。

可以看出,不管是对视觉刺激还是视听同步刺激,I状态下的C值和L值和P1状态下的值接近,T状态和P2状态的特征值接近。同时就说谎组和真实组的脑网络参数进行了t检验,其结果显示不管是对视听刺激还是视觉刺激,聚集系数和特征路径长度都有显著性差异(视听刺激,C:t=3.975,p=0.001,L:t=3.612,p=0.002;视觉刺激,C:t=3.167,p=0.006,L:t=2.830,p=0.013)。可以得出大脑对熟悉人的信息和陌生人的信息诱发的脑网络参数是有差异的,整体来讲对熟人刺激产生的脑功能网络的C值相对增大,而L值相对减小,表明被试在受到熟人信息刺激的时候大脑各区域局部聚集能力增强,全局连接能力变弱,大脑活动更加集中在某些特定区域内。从图中并不能直观得到视觉刺激和视听刺激之间的差别,因此考虑通过对脑网络参数的量子神经网络分类,来判断和验证脑网络特征对隐藏信息分析的作用。

图3 不同刺激范式和不同刺激状态下脑网络特征参数均值及t检验结果

3 模式分类与对比分析

3.1 量子神经网络分类器

量子神经网络将量子计算的方法应用到人工神经网络中,使其具有较小的网络规模和简单的拓扑结构、更好的稳定性和有效性,具有快速学习和高速信息处理能力[16-17]。本文设计了基于量子门节点的神经网络分类器(quantum gated neural network,QGNN),如图4所示[18-19]。其中,网络输入为隐层输出为神经网络输出为

图4 量子门节点神经网络模型

对于n维样本空间第k个样本表示为k,有为样本总数,则其对应的量子态表述为:

式中,

将网络的误差定义为:

3.2 判别分析

本文计算了所有有效被试在所有刺激类型下的脑网络参数C和L,表1为所有有效被试对应参数值。考虑到实验设计中靶刺激和无关刺激的作用,定义了隐藏信息特征判别系数为:

分别计算不同刺激范式下对应的Cindex和Lindex,作为量子门神经网络的输入向量,对视觉刺激和视听同步刺激分开处理。

表1 所有有效被试在不同状态下脑功能网络特征参数值(聚集系数:C,特征路径长度:L)

本文通过最小梯度法构建量子神经网络学习算法,通过训练数据得到分类器最佳参数,然后使用测试数据进行分类测试。通过十则交叉验证,最后得到平均分类准确率分别为:视觉刺激80.25%,视听同步刺激81.69%。可以看到视觉刺激和视听同步刺激诱发脑网络特征参数结合量子神经网络对隐藏信息测试能够得到较高的识别准确率,同时视听同步刺激的分类识别率稍高,主要是因为实验过程中视听同步刺激相对单调的视觉刺激更能引起被试注意力的集中以及对隐藏信息的响应。为了同常用分类器进行对比,用SVM对上述同样的参数进行了分类讨论,得到分类正确率为:视觉刺激82.19%,视听同步刺激84.23%。可以看出,对两种刺激范式,SVM分类器能够得到较高的识别率,而且高于本文中重点讨论的QNN分类器。这主要是由于本文中样本数量偏小,QNN的优势并没有表现出来,同时对量子神经网络分类器的结构也有待优化提升。但是这并不影响将QNN引入到隐藏信息测试中,相信随着对QNN研究的深入,将会有更多更加高效的优质QNN分类器出现。

4 结束语

本文使用Neuroscan脑电实验设备,对模拟说谎状态下的20名被试进行了隐藏信息监测,分别在视觉刺激和视听同步刺激范式下完成实验和脑电信号采集,利用互信息构建了不同状态下脑功能网络,计算脑网络特征参数作为本文的基本特征量;最后设计了量子门节点神经网络分类器,对被试在说谎和没说谎这两种状态下的脑网络特征量进行了分类。结果显示,两种刺激范式都有较高的识别正确率,视听同步刺激的识别率要稍微高于视觉刺激,说明利用脑网络基本特征参数可以较好地识别被试的说谎状态,同时表明由于视听同步刺激给被试的刺激信息要大于单纯的视觉刺激,在实验过程中对隐藏信息能够产生更多的脑区活动,更容易对其进行辨识。量子神经网络作为一种新型高效神经网络算法,由于其特有的优点在隐藏信息监测等模式分类研究中发挥独特的作用。随着脑与认知科学研究的深入,特别是近几年脑成像技术的发展,融合多范式多特征以及特定分类算法的隐藏信息检测研究将会是未来研究的重点,本文也是对多种方法融合的一种尝试。

猜你喜欢

范式分类器量子
《量子电子学报》征稿简则
以写促读:构建群文阅读教学范式
范式空白:《莫失莫忘》的否定之维
孙惠芬乡土写作批评的六个范式
决定未来的量子计算
新量子通信线路保障网络安全
管窥西方“诗辩”发展史的四次范式转换
一种简便的超声分散法制备碳量子点及表征
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器