APP下载

基于主成分分析的超声人脸识别算法研究

2013-09-11王婧瑶曹本希

计算机工程与设计 2013年8期
关键词:传声器识别率人脸

王婧瑶,许 勇,曹本希,杨 军

(1.中国科学院声学研究所 通信声学实验室,北京100190;2.中国科学院声学研究所 噪声与振动重点实验室,北京100190)

0 引 言

人脸识别[1]作为一种新兴的生物识别技术,具有使用方便、不易仿冒、识别精度高等特点,近几年受到极大的关注。在计算机视觉领域已取得了大量的研究成果,但在较复杂的环境下,诸如对人脸表情的识别、光照补偿与光照模型的建立、年龄变化的处理、多种检测数据的融合等方面还缺乏确实有效的方法。热红外成像人脸图像是由人脸组织与结构的红外辐射决定的,具有抗干扰性强、不受可见光源影响等优点,可以在很大程度上弥补可视图像人脸识别技术的不足,但图像对比度低,分辨细节能力差。与传统的可视图像人脸识别、热红外成像人脸识别相比,超声探测人脸识别具有对光照、温度等环境条件不是特别敏感的优势。

1995年,Itile E.Dror等人尝试用超声波信号探测不同表情的人脸,从回波信号中提取特征,并用人工神经网络进行分类,在人数不多于5个时,识别率可以达到96%,但当数目增加到7个时,不能识别出结果。2005年,澳大利亚 Wollongong大学Phillip McKerrow等人利用连续发射调频 信 号 (continuous transmitted frequency modulated,CTFM)实现了人脸识别。他们提出了人脸回波模型,认为回波携带着人脸的特征信息。2006年,Phillip McKerrow等人改进了实验系统,在识别10个人的静态脸时,识别率能达到99.73%。2007年,中科院声学所苗振伟等人设计并实现了一个100人的超声人脸数据库[2],首次在大样本的情况下分析了超声波人脸识别的识别性能[3]。结果表明斜上方探测到的面部信息更能够反应人脸之间的差异。

在实际生活中,静态脸仅仅是一种理想状态,自由表情脸更贴近实际应用。我们采用多方向探测的方式取得多通道的人脸自由表情数据,运用主成分分析[4](principal component analysis,PCA)方法

对原始特征向量进行降维,得到优化样本特征向量,再利用 KNN[5](K-nearest neighbor classifier)算法和感知器算法[6]对降维后的特征向量分类,进行了100人的自由表情脸识别仿真实验,识别正确率最高可达80%以上。

1 超声人脸识别

1.1 基本原理

依据多散射中心模型[7],在超声探测模式下,人脸可等效成一系列散射中心。不同人脸的多散射中心主要包括两个方面的不同,散射中心相对位置和散射中心在超声波激励下频率响应特性。超声人脸识别的主要思想是从回波中提取散射中心的相对位置信息,以及散射中心在超声波激励下频率响应信息,并通过有效地处理,从这些信息中提取人脸特征,进行分类识别。超声探测原理请参见文献 [8]。

1.2 Chirp信号

Chirp信号 (又称作线性调频信号)为一宽带信号,通过解线性调频处理后,能够达到较高的距离分辨率,且具有较高的信噪比。Chirp信号是一种频率随时间匀速上升或匀速下降的宽带信号,它的幅度与时间无关,其数学表达式为

式中:t——chirp信号的发射时间,A——幅度,m——扫频信号的频率变化率,称为调频率,且m= (fh-fl)/T,T是扫频周期。由传声器接收到得回波信号是发射信号的延迟,如图1所示。理想情况下,回波信号与发射信号有相同的时频特性,只是相对发射信号有一个固定的时间延迟τ,频率差fa的大小与τ成正比,且fa=mτ。

图1 回波信号与发射信号的时频关系

实际情况下,接收到的回波由每个散射中心的回波叠加组成,其数学表达式为

式中:F (f,ri,θi)——传递函数,由换能器、传声器、周围环境和第i个散射中心点决定。

解调信号是由发射信号与接收到的回波信号相乘得到,其数学表达式为

可表示为下式

式 中:Slow_D(t)——SD(t)的 差 频 部 分,Shigh_D(t)——SD(t)的和频部分。Slow_D(t)的频率是常数mτi,正比于发射信号与每一个散射中心回波的时延τi。因此,距离分辨率ρr结合公式d=cτi/2可推出,如下式

式中:d——距离,c——声速,T——信号周期,△f——扫频频率带宽,在我们的实验中,△f=75kHz,距离分辨率根据式 (7)可得0.0023m。

1.3 实验平台的搭建

为方便调整传声器、静电换能器的上下位置、距离以及相对于人脸的俯仰角度,实验设计制作了一个固定传声器及静电换能器的不锈钢支架。该支架有多个自由度,由两部分组成:一部分是竖直的支座,一部分是球冠状不锈钢架。传声器、静电换能器收发对可以布置在球冠状不锈钢架钢管上的任意位置。

本系统[9]由4组收发对组成,从而能从不同的角度对人脸进行探测,得到更多的人脸信息。一组收发对由一个SensComp仪器级超声波换能器和一个G.R.A.S.S传声器组成,换能器发射信号,传声器接收信号,两者的中心距离为4.3cm。4组收发对固定在球冠状的不锈钢架上,位置分别为 (0°,0°),(30°,300°),(45°,0°)和 (30°,120°)。相应地,换能器和传声器命名为T0,R0,T1,R1,T2,R2和T3,R3,如图2所示。这里,以球冠形不锈钢架的中心为坐标轴的原点,水平方向为x轴,竖直方向为y轴。在实验的过程中,被试者需要把他们的鼻尖放在球冠性铁架的中心。当一个换能器发射25kHz-100kHz的扫频信号时,其余4个传声器同时在接收回波信号。这样,数据采集完毕后,用基于Matlab平台编写的程序通过滤波、解调等信息处理,就能够得到16通道的有效信息。

图2 换能器及传声器的空间位置

2 目标信号特征提取

2.1 一维距离像特征

超声波入射到人脸后产生回波,回波中包含人脸的结构信息。在数据处理过程中,用面部超声回波的一维距离像[10](high resolution range profile,HRRP)作 为 特 征 向量。图3为人脸模型与回波信号关系图。图中曲线为用Chirp信号探测人脸模型所得到的一维距离像,纵坐标为归一化强度,横坐标单位为米。左图为传声器从正前方接收到的回波信号,第一个尖峰为鼻尖反射的信号。右图为传声器从斜上方接收到的回波信号,这时额头反射信号为第一尖峰。可见,同一模型在不同探测方式条件下,所得到的一维距离像不同,回波携带的信息也有所差异。为了更充分的利用回波信息,我们对不同通道的特征进行了数据融合。结果表明,多通道信息的识别结果优于单通道信息。识别率提高的同时,随之带来了运算复杂度增加以及分类效率下降的问题。我们需要找到一种能够降低特征维数的方法,让新的特征向量既降低了维数,又能较好的反映原特征信息。

2.2 基于PCA方法的特征提取

为了提高感知器网络的整体运行速度,考虑对感知器网络的输入数据维数进行降维处理。目前主要的降维处理有主成分分析 (principal components analysis,PCA),线性鉴别分析 (linear discriminant analysis,LDA)和独立主元分析 (independent component analysis,ICA)。

PCA算法是统计学中分析数据的一种有效方法,其目的是在数据控件中找一组向量以尽可能地解释数据的方差,将数据从原来的R维空间降维投影到M 维空间 (R>M),降维后保存了数据中的主要信息,用较少的特征量对数据样本进行描述,从而使数据更易于处理。它从人脸信息整体代数特征出发,基于人脸的总体信息进行分类识别。

图3 人脸模型与回波信号关系

由于主成分分析方法具有两个我们期望的特性:一是不同的主成分之间互不相关;二是每个主成分都是原有原始特征的线性组合,而且主成分分析方法实现起来较容易,所以将主成分分析方法应用到人脸识别系统的特征提取中合适可行。因此,本文采用主成分分析方法对人脸特征进行降维处理,通过感知器网络识别后发现并不降低识别准确率,且缩短了训练和识别时间,具有有效性和可行性。本研究取数据库中100人自由表情脸的一维距离像作为训练集,根据各样本求出协方差矩阵S,计算S的特征值和特征向量,根据设定的累积方差贡献率90%,找出前个m(m<n)最大特征值所对应的特征向量。然后用经过PCA处理后的新特征向量,作为分类器的输入进行模式识别。表1为经过PCA方法处理人脸特征信息后的维数对比数据。处理时间是指基于Matlab运行平台,用1500个测试样本的特征作为输入,通过训练好的分类网络进行识别,得到一个正确识别率的时间。

3 分类算法

3.1 K邻近算法

K近邻 (K-nearest neighbor,KNN)分类算法,是一种典型的非参数、有效的惰性学习方法。K近邻分类器的分类规则实在训练数据中,寻找测试样本的k个最近邻,将这k个最近邻中出现次数最多的类作为测试样本的类。尽管判决思路简单,但k近邻分类器的分类准确性却很高。

k值的设定和样本集的分布是影响KNN算法分类准确度的主要因素。k值对分类效果有很大影响,但目前没有很好的确定k值的方法,通常是根据实验测试结果调整k值的大小。本研究根据训练库中不同人所包含人脸信息样本的数量来确定不同的k值,即每个分类都有一个专属于自己的k值。另外,在本研究中,样本的选取尽量分布均匀,人均取20个自由表情样本共2000个进行训练,这样的样本集选取能尽可能真实的反映整个数据的真正分布。

表1 PCA方法处理前后数据对比

3.2 感知器算法

感知器算法在分类问题上是有效的。它可以很好的划分线性可分的输入矢量,感知器网络的设计完全由需要解决的问题所限制,其输入节点和神经元数是由输入矢量和输出矢量所确定的。

想要通过一个判决函数把一个类别从其它所有类型中区分开来,对于c类模型,要建立c个判决函数:di(x)=wTix (i=1,…,c),其中每一个判决函数都具有:di(x)≥0,x∈wi,di(x)<0,xwi,这样就把c类问题转变为c个属于wi和不属于wi的两类问题。其缺点是样本可能同时属于两个以上的区域或不属于任何区域,这时就不能判别样本属于哪一类型。

传统的感知器算法在修正权值时采用固定的校正量,只要样本是线性可分的,固定增量算法总能在有限步内得到正确分类。但当样本集不是线性可分时,固定增量算法就可能导致样本分类错误。这时候,引入一个变增量η(k),让η(k)随前两次数据的误差项进行动态调整,同时对权向量的各分量进行修正,加大差异性,从而能降低少数 “坏”样本造成的破坏性效果。本文采用动态调整权向量和自适应学习速率相结合的改进感知器算法。

在改进感知器算法中,权值的修正由下式完成

自适应学习速率的调整公式

其中,SSE (sum of squares for error)即误差项平方和。

以4通道数据为例,本实验中,输入维数取27,即经过PCA处理后的特征向量的增广向量的维数。然后对100人的自由表情样本共2000个进行训练,之后用训练好的感知器网络对目标进行识别。感知器网络输入层、中间层、输出层神经元个数分别为27、12和100,共迭代1187次找到了正确的权向量。用传统的感知器算法需要迭代3345次,而且可能出现在算法终止时还存在模式不能得到有效判别的情况。改进的感知器算法不仅可以节省运算时间,也可以较好的解决样本集不是线性可分的问题。

4 实验结果及分析

取100人的自由表情样本共3500个,其中训练样本2000个,测试样本1500个。采用KNN和改进的感知器两种算法进行识别,识别结果分别见表2和表3。表中识别率均为目标分类正确的识别率,计算公式为:识别率=正确的分类数目/总的测试样本数目。

表2 KNN和感知器算法

表3 KNN、感知器算法和改进的感知器算法

表中的实验结果可以看出,多通道的数据融合增加了更为丰富的信息,能有效提高识别率;PCA算法在降低特征维数降低的同时能保持原有的识别率。虽然KNN算法的识别效果略优于感知器算法,但分析可能的原因是由于KNN针对同一次采集的数据具有较好的分类效果,而在实际的识别过程中,训练集和测试集是不同时间的数据,基于这个思路,我们有必要研究算法的鲁棒性,感知器算法是一种基于神经网络的算法,更具学习性,这也是我们今后研究的方向。

5 结束语

本文围绕超声探测人脸识别方法开展研究,从数据融合的角度对现有特征进行了优化处理。采用了基于PCA的特征提取算法对多通道探测数据的一维距离像进行特征提取,降低特征维度最高超过85%,并通过实验验证了方法的有效性。实验结果表明相对单通道数据,多通道数据融合能增加新的信息,提高识别率;PCA算法降低了特征数据的维数,减少了运算的复杂度,有效解决了多通道数据冗余的问题。在降低特征维数的基础上,提出了一种新的感知器识别算法,该算法不仅能降低训练、识别的运算量,而且能较好的解决由于样本类别数量过多而造成的线性不可分问题。进一步的工作包括两方面:一是建立含多次采集数据的随机模型,从而能够对新的感知器算法的鲁棒性进行严格的理论分析;另一方面值得研究的是到实际应用中去验证和改进算法。

[1]WU Jinyi,ZHOU Delong,Survey of recognition [J].Application Research of Computers,2009,26 (9):3205-3209 (in Chinese).[吴巾一,周德龙.人脸识别方法综述 [J].计算机应用研究,2009,26 (9):3205-3209.]

[2]XU Yong,MIAO Zhenwei,YANG Jun.Design and implementation of a novel ultrasonic human face database [C]//Wuhan:The Acoustical Federation of China,Youth Conference,2007(in Chinese).[许勇,苗振伟,杨军.一种新型超声人脸数据库的设计和实现 [C].武汉:中国声学学会青年学术会议,2007.]

[3]MIAO Zhenwei,JI Wei,XU Yong,et al.A novel ultrasonic face recognition system [C]//Shanghai:Acoustic Conference,2008(in Chinese).[苗振伟,纪伟,许勇,等.一种新型的超声人脸识别系统 [C].上海:全国声学学术会议,2008.]

[4]SUN Chongxuan.Human face recognition with PCA method[J].Journal of Yunnan Nationalities University,2010,19(6):399-443 (in Chinese).[孙崇璇.基于PCA主成分分析的人脸检测实现与分析 [J].云南民族大学学报,2010,19(6):399-443.]

[5]SUN Xiaoyan,ZHANG Huaxiang,JI Hua.Improved KNN algorithm in classification of imbalanced data sets [J].Computer Engineering and Applications,2011,47 (28):143-145 (in Chinese).[孙晓燕,张化祥,计华.用于不均衡数据集分类的KNN 算 法 [J].计 算 机 工 程 与 应 用,2011,47 (28):143-145.]

[6]LIU Jianwei,SHEN Fanglin,LUO Xionglin.Research on perceptron learning algorithm [J].Computer Engineering,2010,36 (7):190-192 (in Chinese).[刘建伟,申芳林,罗雄麟.感知器学习算法研究 [J].计算机工程,2010,36 (7):190-192.]

[7]McKerrow P,Yoong K K.Classifying still faces with ultrasonic sensing [J].Robotics and Autonomous Systems,2007,55(9):702-710.

[8]Patricia Worth,Phillip McKerrow.An approach to object recognition using CTFM sensing [J].Sensors and Actuators A,2012(179):319-327.

[9]MIAO Zhengwei,JI Wei,XU Yong,et al.Human face classification using ultrasonic sonar imaging [J].Japanese Journal of Applied Physics,2009,48 (7):1-5.

[10]YU Guishui,LU Jianbin,WEI Zhongji,et al.Progress of radar target recognition based on range profiles [J].Modern Rader,2010,32 (6):5-10 (in Chinese).[余贵水,卢建斌,魏钟记,等.基于一维距离像的雷达目标识别研究进展 [J].现代雷达,2010,32 (6):5-10.]

猜你喜欢

传声器识别率人脸
有特点的人脸
一起学画人脸
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
三国漫——人脸解锁
提升高速公路MTC二次抓拍车牌识别率方案研究
电容传声器声中心的测量及其对互易校准的影响
高速公路机电日常维护中车牌识别率分析系统的应用
长得象人脸的十种动物
传声器拾音技术