APP下载

基于环形对称Gabor多通道纹理加权的人脸识别

2014-10-26王昱蓉张雪英

太原理工大学学报 2014年1期
关键词:训练样本识别率人脸

王昱蓉,白 静,张雪英

(太原理工大学 信息工程学院,太原 030024)

人脸识别技术作为多学科领域的具有挑战性的难题,覆盖了数字图像处理、模式识别、计算机视觉、心理学、数学等诸多学科的内容,同时也广泛地应用于国家安全、军事以及家庭生活等方面[1]。人脸识别算法的优劣,很大程度上取决于人脸的特征提取及其精准表示,良好的人脸表示可以使最简单的分类器达到最好的识别效果。Gabor变换(Gabor Transform,GT)不仅可以获取时间和频率的最小不确定性,而且与人的视网膜神经细胞的接受场模型具有惊人的相似性[2],是一种经典的人脸特征提取方法。但是目前普遍采用的GT至少存在两方面的缺陷:

1)GT通常取5尺度,8方向的基函数,变换后的特征维数是变换前的40倍,致使系统冗余增加。

2)旋转不变性对图像识别非常重要,而GT的方向选择性使其不具备旋转不变性,在人脸图像的平面旋转时性能下降。

为解决上述问题,首先采用一种变形的GT,即环形对称Gabor变换(Circularly Symmetrical Gabor Transform,CSGT)[3-5],用于提取人脸的多通道特征,它可以有效地克服GT的上述缺陷,并对各种干扰具有一定的鲁棒性。然后,为了充分利用CSGT的特性,进一步提高特征提取的准确性以及实际应用的灵活性,本文对CSGT提取的多通道特征进行了优化选择和融合,有效地结合了纹理图像检索的纹理统计特征提取算法[6]和自适应加权算法[7],提出了一种基于CSGT的人脸特征提取改进算法——CSGT多通道纹理加权(Weighted Multichannel Texture of Circularly Symmetrical Gabor,CSGT-WMT)算法,该算法充分获取了CSGT的鲁棒局部纹理特征,有效解决了识别的“误配准问题”[8],提取出鉴别能力强的特征,减少数据冗余。最后,采用PCA加权算法降维,使用简单的欧氏距离得到分类识别结果,实现人脸识别。

分别在ORL,Yale和FERET人脸库上进行实验,相比于GT和其它传统算法,以及CSGT和其改进算法,本文算法识别率高,数据量小,可行性高,对光照、姿态、表情、局部形变等干扰具有很好的鲁棒性,且灵活适应于不同的人脸库,具有很好的分类性能和实际应用能力。

1 环形对称Gabor变换

传统Gabor滤波器核函数定义如下:

将式中与方向有关的频率向量kuv加以修改,忽略补偿直流成份,得到CSGT核函数,定义为:

可见,CSGT是一个高斯函数约束的平面波。

σ决定窗口的宽度和波长的比例关系,

式中:φ为滤波器倍频程带宽;σ一般取2π。

对于一幅人脸图像,经过CSGT变换,即人脸图像I(x,y)与CSGT核函数ψv的卷积,定义为:

Ov(x,y)为复数,其幅值 Mv(x,y)为:

式中:Re(Ov(x,y))和Im(Ov(x,y))分别为 Ov(x,y)的实部和虚部。

因此,得到v(v=1,2,…,5)个尺度的幅度响应Mv(x,y),因其比较稳定,通常作为人脸图像的CSGT多尺度特征[5],如图1所示。

图1 人脸图像的CSGT多尺度特征

CSGT具有传统GT的突显局部纹理、多尺度分析等性质,还具有两个重要性质:

1)冗余降低。CSGT的基函数明显比传统GT减小。传统GT得到40个变换结果,而CSGT仅保留5个尺度上的变换结果,冗余量是传统GT的1/8。

2)严格的旋转不变性。旋转不变性对图像识别非常重要,而在实际应用中,图像的旋转是任意的。GT的方向选择是离散的,使其不具备旋转不变性。如图2,图3所示。对于传统GT,图像先变换再旋转,与图像先旋转再变换,有所差别;而CSGT则不同,具有严格旋转不变性。

图2 传统GT的旋转敏感性测试

图3 CSGT的旋转不变性测试

2 基于CSGT的人脸特征提取改进算法

2.1 算法描述

人脸特征提取算法流程如图4所示,在得到CSGT多尺度特征之后进行改进,提出了一种基于CSGT的人脸特征提取改进算法,具有两点重要改进。

2.1.1 CSGT特征优选

CSGT变换后的幅度图像突显出了局部的纹理信息,但数据量是变换前图像的5倍。因此,有必要对CSGT特征进行优选,减少冗余,提取重要的且利于识别的纹理信息。本文将纹理图像检索的纹理统计特征(Texture Statistical Feature,TSF)提取方法[6]与CSGT相结合,构成了算法CSGT-TSF。该算法使用统计特征提取方法,有效解决识别的“误配准问题”;并结合子图像的处理方式,充分获取CSGT的鲁棒局部纹理特征,减少数据冗余。由此构建了人脸图像的CSGT多通道纹理特征。

2.1.2 自适应加权融合

在CSGT-TSF算法的基础上,为了区分不同通道纹理统计特征的重要性,让鉴别能力强的特征占主导地位,减少干扰因素的影响,提出了一种基于CSGT的人脸特征提取改进算法——CSGT多通道纹理加权算法。该算法采用自适应加权融合,动态调整不同通道特征的权值w(1,2,…,10),融合得到最具鉴别能力的特征,即自适应加权的CSGT纹理特征。该特征灵活适应于不同的干扰变化。

图4 CSGT-WMT人脸特征提取算法流程示意图

2.2 CSGT-TSF算法

CSGT-TSF算法首先将得到的人脸图像的CSGT多尺度特征划分子图像,然后分别对每个子图像进行纹理统计特征提取,最后分别在各尺度上级联子图像纹理统计特征提取结果。

对于人脸图像I,在CSGT多尺度特征图像Mv(x,y)上划分大小相同的子图像,假设子图像大小为m×n,个数为K,每个子图像Ik(k=0,1,…K-1)的纹理统计特征均值μv,k和标准差σv,k分别为:

然后,在各尺度上分别级联其子图像的纹理统计特征均值μv,k和标准差σv,k,分别得到各尺度的均值纹理特征μv和标准差纹理特征σv,由它们构成了人脸图像I的多通道CSGT纹理特征(CSGT Texture Features,GTF),GTF用G表示,定义为:

CSGT-TSF算法得到的统计特征GTF克服了先前点对点识别的“误配准问题”,数据量为纹理统计前的2/(m×n)。

2.3 CSGT多通道纹理加权(CSGT-WMT)算法

人脸图像的每一个尺度信息在人脸识别中的贡献大小是不同的,如果直接将得到的所有尺度的纹理统计特征直接级联势必会造成冗余及降低识别率[9]。因此,有必要区分不同通道的纹理统计特征的重要性,然后根据重要程度进行特征的融合。

自适应加权融合算法,灵活适应于光照、姿态、表情、局部形变等干扰及人脸库的变化,CSGTWMT算法在CSGT-TSF算法基础上采用线性判别分析的优化思想[10],得到训练样本各个通道的纹理统计特征GTF在不同类别样本的集中和离散程度,动态调整不同通道GTF的权值大小,融合得到最具鉴别能力的特征。

首先分别计算GTF在第l(l=1,2,…,10)通道上的类内方差和类间方差,定义为:

Gi,j,l为第i类第j样本在第l通道上的GTF矢量。Gi,j,l(q)是特征矢量的第q个元素标量。εi,l(q)是第i类训练样本Gi,j,l(q)的均值,εl(q)是全部训练样本Gi,j,l(q)的均值。N 为训练样本总数,k为样本类别数,ni为第i类样本数。

式中:q∈{1,2,…,d};d为 GTF矢量长度。

因此,得到通道l的权值wl:

于是,可以根据wl(l=1,2,…,10)衡量每个通道的GTF的鉴别能力,进一步,将所有通道的GTF加权求和,得到自适应加权的CSGT纹理特征(A-daptive Weighted CSGT Texture Features,WGTF),WGTF用W 表示,定义为:

人脸样本经过CSGT-WMT算法,进行CSGT特征优化选择和融合得到的样本特征WGTF,提取并融合了最具鉴别能力的特征,削弱了鉴别能力不强的特征,以及减少光照、姿态等干扰,并且数据量减少为原始样本的1/(m×n)。

3 PCA加权降维及空间分类

为进一步降低样本维数实现空间分类,在没有足够的先验知识情况下,应该平等的看待PCA的特征向量的每一个独立分量,每个分量应具有相同方差,因此本文采用PCA加权(Weighted PCA,WPCA)[11],对 CSGT-WMT 得到的人脸特征 WGTF进行降维,经过WPCA,训练和测试样本分别得到其对应的投影向量。最后,采用简单的欧氏距离进行分类器设计,实现最终的人脸识别。

4 实验结果与分析

实验分别在ORL、Yale和FERET 3个人脸库上进行,采用5尺度CSGT,5尺度8方向GT,下采样和TSF分块大小均为4×4,WPCA降维方式和欧氏距离分类器。首先,在ORL人脸库上,对降维算法PCA和WPCA进行对比,将GT+WPCA、CSGT+WPCA、CSGT-TSF+WPCA 和 CSGTWMT+WPCA进行对比实验。然后,在Yale和FERET人脸库上分别进行CSGT基础上的改进实验及其对比。

ORL人脸库包括40组人脸样本,每组10张,共400张。每组是一个人包括姿态、表情和面部饰物等变化图像,大小为112×92。表1给出了每种算法分别取不同数目训练样本对应得到的识别率结果,在训练样本数为2~8时,分别随机选取训练样本进行30次实验,实验结果取平均;训练样本数为9时使用排一法得到结果。表2给出了各算法在取不同数目的训练样本下分别使用排一法识别的CPU运行时间。从表1和表2可以看出,降维算法WPCA的识别率优于PCA,且识别时间有所减少;CSGT+WPCA相比GT+WPCA的平均识别率有所提高,且数据量减少,识别时间明显降低;改进的CSGT-WMT+WPCA算法相比CSGT+WPCA,不仅识别率提高了,最高识别率可达到98.47%,而且数据量及运行时间也有大幅度的减少。通过实验验证了CSGT优于GT以及本文算法CSGT-WMT的有效性和可行性。

表1 ORL人脸库上各种算法识别率 %

表2 ORL人脸库各种算法识别时间 s

Yale人脸库包括15个志愿者,每人11幅,共165幅人脸图像,图像大小为100×100。本文选择每人前6张图像作为训练样本,其余作为测试样本进行实验。实验包括表情和光照的变化,对比了CSGT+WPCA和其改进实验:CSGT-TSF+WPCA和CSGTWMT+WPCA。实验结果如图5所示。

图5 CSGT及其改进算法在Yale上的实验比较

FERET人脸库包括200个志愿者,每人7幅图像,图像大小为128×128。本文选取其中60个人的图像,每人前4幅作为训练样本,其余作为测试样本进行实验。实验包括丰富的表情、光照和姿态等变化,对比了CSGT和其改进算法。实验结果如图6所示。

图6 CSGT及其改进算法在FERET的实验比较

由图5、图6可见,CSGT-TSF识别率相比CSGT有所改进,算法CSGT-WMT识别率在CSGT-TSF基础上有很大提高,自适应加权融合了最具鉴别能力的人脸特征,使之能降低不同干扰(光照,姿态,表情)对其影响,其识别率在FERET人脸库干扰增多的情况下与Yale人脸库中的相比减小幅度不大,因此可以灵活适用于不同的人脸库,具有很好的实际应用能力。

5 结论

提出的CSGT-WMT算法,识别率高,对光照、姿态、表情等影响具有很好的鲁棒性,灵活适应于不同的人脸库,并且数据量小识别时间短可行性强,相比CSGT和GT等方法具有明显的优势,具有很高的实用价值。但随着不同人脸库干扰因素的增多,影响了识别率,因此有必要进一步对各种干扰因素进行综合分析深入研究,使用复杂的分类器进一步提高识别效果。

[1]张翠平,苏光大.人脸识别技术综述[J].中国图象图形学报,2000,5(11):885.

[2]张国云,郭龙源,吴健辉,胡文静.计算机视觉与图像识别[M].北京:科学出版社,2012.

[3]Zhu Zhenfeng,Tang Ming,Lu Hanqing.A New Robust Circular Gabor Based Object Matching by Using Weighted Hausdorff Distance[J].Pattern Recognition Letters,2004,25(4):515-523.

[4]Wang Huiyuan.Face Recognition Approaches Based on Linear Subspace and Circularly Symmetrical Gabor Transforms[D].Jinan,China:School of Information Science and Engineering,Shandong University,2007(in Chinese).

[5]王进军,王汇源,吴晓娟.基于环形对称Gabor变换和PCA加权的人脸识别算法[J].模式识别与人工智能,2009,22(4):635-638.

[6]Manjunath B S,Ma W Y.Texture features for browsing and retrieval of image date[J].IEEE Trans.on PAMI,1996,18(8):837-842.

[7]杨青山,郭成安,金明录.基于Gabor多通道加权优化与系数表征的人脸识别方法[J].电子与信息学报,2011,33(7):1620-1621.

[8]余磊,何中市.Gabor小波变换在人脸识别中的应用研究[D].重庆大学计算机学院,2009.

[9]Amin M A,Yan H.An empirical study on the characteristics of Gabor representations for face recognition[J].International Journal of Pattern Recognition and Artificial Intelligence,2009,23(3):401-431.

[10]李文辉,高璐,林逸峰.特征选择模糊加权多通道Gabor人脸识别[J].湖南大学学报(自然科学版),2013,40(4):87-93.

[11]Wang Huiyuan,Wu Xiaojuan.Weighted PCA Space and Its Application in Face Recognition[C]//Proc of the 5thInternational Conference on Machine Learning and Cybernetics,Guangzhou,China,2005,Ⅶ:4522-4527.

猜你喜欢

训练样本识别率人脸
有特点的人脸
一起学画人脸
人工智能
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
三国漫——人脸解锁
提升高速公路MTC二次抓拍车牌识别率方案研究
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
高速公路机电日常维护中车牌识别率分析系统的应用