APP下载

差异性Shearlet特征的快速稀疏描述人脸识别

2016-10-13张英俊潘理虎

光电工程 2016年6期
关键词:训练样本人脸人脸识别

黄 玉,张英俊,潘理虎,2



差异性Shearlet特征的快速稀疏描述人脸识别

黄 玉1,张英俊1,潘理虎1,2

( 1. 太原科技大学 计算机科学与技术学院,太原 030024;2. 中国科学院地理科学与资源研究所,北京 100101 )

针对稀疏描述方法因计算复杂度高难以满足实际需求以及对训练样本个数敏感的问题,提出一种差异性Shearlet 特征的快速稀疏描述人脸识别方法。首先对人脸图像采用Shearlet变换得到多尺度多方向的人脸特征;然后利用匹配得分融合策略对Shearlet特征进行融合,构成差异性特征;进而构造针对每个测试样本的“最佳”稀疏表示并计算其相关系数;最后依据训练样本在描述测试样本中所做贡献的大小,实现对测试样本图像的分类识别。在ORL和YALE人脸库上的实验结果表明,所提算法在保证高识别率优势的同时大大降低了时间复杂度。

人脸识别;稀疏描述;Shearlet变换;匹配得分融合

0 引 言

近年来,稀疏描述方法的提出与发展,为计算视觉与模式识别领域提供了一种新的技术手段。采用稀疏描述思想及其优化算法进行人脸识别成为此方向的研究热点。如Gao等[1]提出了基于核稀疏表示方法,有效减少特征量化误差,提高了稀疏编码性能,并成功运用在人脸识别方向上。基于稀疏描述的人脸识别方法(Sparse Representation based Classification,SRC[2])与常规降维方法有明显区别。常规降维方法仅利用全体训练样本产生一个最优描述,然后将所有测试样本投影到此最优“轴”上,显然这种方法对于测试样本并不一定是最优的;而稀疏描述方法是将“当前”测试样本与全体训练样本产生一个最优描述,它是充分考虑了测试样本的一种描述方法。但稀疏描述方法也存在一些缺点:首先,稀疏描述方法在求解稀疏非零系数时存在L0范数的优化问题,是一个NP难问题,即使可以近似转换为L1范数的优化问题,但此方法仍需要进行迭代计算,高时间复杂度是稀疏描述走向应用的最大障碍;其次,稀疏描述人脸识别需要有足够数量的训练样本来包含人脸的各种变化,但现实情况下难以达到这个要求。因此,若直接利用图像的全局特征进行稀疏描述很难避免因为光照和局部遮挡等因素造成的负面影响[3]。

目前稀疏描述算法大都是将图像或图像块向量化后进行处理,这种处理方式破坏了图像或图像块各像素之间的空间结构关系,且易生成高维向量导致“维数灾难”。一种可行的解决方式是针对多图像块、多时相图像、多波段图像和多模图像等进行描述建立二阶甚至高阶张量的更优的稀疏表示模型; 另一种则将稀疏表示与多尺度相结合,构建多尺度稀疏表示模型。为更好地捕捉目标的有用特征,本文采用第二种解决方式。以Gabor变换、Contourlet变换等为代表的多尺度几何分析方法是图像稀疏表示的有效途径。Gabor 变换虽然具有良好的时频局部化特性及方向选择能力,但变换后的数据维数较高[4]。Contourlet变换虽比Gabor变换具有更多的方向信息,但在其变换过程中使用了拉普拉斯金字塔滤波器,在分解过程中需要进行下采样计算,因此结果并没有平移不变性[5]。Labate和Guo等通过特殊的合成膨胀的仿射系统,提出一种新的多维函数稀疏表示工具——剪切波(Shearlet)变换[6],它具有最优非线性逼近性能和多分辨分析特性,而且在方向变换上没有数目的限制,具有良好的时频局部特性,数学结构更简单,对图像数据具有更强的稀疏表示能力。目前,对Shearlet特征的融合多是在特征层和决策层。例如:Zhou等[7]先对图像进行分块,最终在决策层进行融合;文献[8]将Shearlet特征在特征层进行了融合。但这些融合方法仍有改进的空间:首先,决策层的融合往往不能发掘更多的特征信息;其次,特征层的融合平等对待所有特征,忽视了不同特征会对分类有不同的影响。匹配得分融合方法相比于以上两种融合方法往往能取得较优的鉴别性能:相比于决策层只对表示类别的整数进行融合,匹配得分融合是以实数形式的匹配得分进行融合,因此融合了更多的信息;相比于特征层融合它首先独立对待待融合的各特征,在得到其各自的识别结果之后再进行融合,更好地运用了各特征。

基于以上分析,为进一步提高人脸识别性能,本文提出一种差异性Shearlet特征的快速稀疏描述人脸识别方法。首先,对图像采用Shearlet变换得到多尺度多方向的人脸特征,利用匹配得分融合策略对各个尺度下Shearlet特征的幅值和相位编码进行融合,构成具有差异性的特征;进而,利用得到的融合特征构造针对每个测试样本的“最佳”稀疏表示并计算相关系数;最后,依据某类在描述测试样本中所做的贡献大小,实现对测试样本的分类识别。

1 Shearlet变换基本原理

1.1 连续Shearlet变换

在二维情况下,具有合成膨胀的仿射系统定义为

1.2 离散Shearlet变换

连续Shearlet变换的离散化方法包括时域法和频域法。本文利用频域法,时域法请参阅文献[9]。

式中包含2个主要步骤:

如图1为2个尺度下离散化的Shearlet变换示意图。

图1 离散Shearlet变换示意图

2 Shearlet特征的差异性稀疏描述人脸识别算法

2.1 Shearlet多尺度多方向的特征融合

运用匹配得分融合策略对各个尺度下Shearlet特征的幅值和相位编码进行融合,构成具有差异性的特征。根据文献[10]对图像进行4个尺度、8个方向的分解。融合步骤如下:

首先对各个尺度利用不同方向的特征幅值构建幅值矩阵;同时对各个尺度利用所有的特征相位编码来构建相位矩阵。如果有个尺度,那么每幅人脸图像就对应个幅值矩阵和个相位矩阵。

这里令为Shearlet特征,使用1、2、3、4对“相位”编码结果如下:

然后,采用归一化的匹配得分:

最终匹配得分公式为

2.2 基于差异性Shearlet特征的快速稀疏描述算法

稀疏描述分类方法在训练样本足够充分时,测试样本可用其同类的训练样本线性表示,而其他类的线性系数为零或接近于零。本文针对实际情况下训练样本数量有限,仅选用“最佳”训练样本对测试样本进行线性表示,从而排除远离测试样本或与测试样本很不相似的训练样本对分类决策的负面影响。算法的主要步骤如下:

首先,假设共有个类别图像,根据式(12)把个和测试样本距离最小的训练样本作为“最佳”训练样本,并记录这些“最佳”训练样本的类别标签。假设测试样本的个“最佳”训练样本为,则这些“最佳”训练样本的类别标签组成的集合为。显然,必定小于与,即为集合的一个子集。

然后,将变换后的测试样本表达为所确定的个“最佳”训练样本的线性组合。

的范数最小。因此将下式的最小化作为我们的目标函数,即:

稀疏描述方法的最优解为

式中是单位矩阵。

最后,某一测试样本的个“最佳”训练样本中来自第类的所有“最佳”为,则第类对于测试样本的贡献为

令:

这里根据贡献度的大小确定测试样本的类别。若d越小,则第类在描述测试样本中所做的贡献越大。因此,测试样本被分到第类。算法步骤框图如图2所示。

图2 算法框图

3 实验结果及分析

为了验证本文算法的有效性,分别在ORL库与YALE库上进行实验,并与已有算法:基于Gabor的最近邻算法(Gabor+KNN)与稀疏描述算法(Gabor+SRC)、基于Contourlet的最近邻算法(Contourlet+KNN)与稀疏描述算法(Contourlet+SRC)、基于Shearlet的最近邻算法(Shearlet+KNN)与稀疏描述算法(Shearlet+SRC)以及一种基于Shearlet的自适应加权融合的稀疏描述算法[8](AWF_SSRC)进行比较。

3.1 ORL库人脸识别实验

ORL人脸库包含40人,每人包含不同角度、光照和面部表情变化的10幅图像,共400幅图像。图3给出了ORL库中某类样本的10幅图像。

本文算法的目标函数中有一个“最佳”训练样本个数的参数,这里没有方法来确定参数的设置,为确定最佳参数,只能进行实验来估计合适的参数值。图4就本文分类算法、全局描述算法和K近邻三种算法分别在每类样本中分别包含5个及6个训练样本的识别错误率与“最佳”训练样本个数之间的关系进行统计,其中“(ORL,)”表示在ORL人脸库上每类样本包含个训练样本。

图4 ORL库中“最佳”样本个数与分类错误率关系图

下面进行算法性能比较。在ORL人脸库中随机选取每个人的6幅图像构成训练样本集,剩余图像构成测试样本集,这个过程重复进行10次,最后取平均值作为识别结果。为了降低计算复杂度、噪音以及避免小样本问题,用PCA作为Gabor+KNN、Gabor+SRC、Contourlet+KNN、Contourlet+SRC、Shearlet+KNN、Shearlet+SRC和AWF_SSRC的一个预处理方法。图5给出了在ORL人脸库中以上8种算法在不同特征维数下的识别率。

图5 ORL库中8种算法随特征维数变化的识别率曲线

由该图可以看出,所有算法的识别率随着特征维数的增加呈现先升高然后基本保持稳定的结果。表1给出了此8种算法在特征维数为100维时的识别率和对应的运行时间。实验在操作系统为Windows 7、CPU为酷睿I5、内存为4GB的计算机上进行。

表1 ORL库中不同算法识别性能比较

3.2 YALE库人脸识别实验

为进一步验证算法的有效性,本节采用YALE人脸库进行实验。YALE人脸库包含15人,每人包括不同光照、表情和小幅遮挡变化的11幅图像,共165幅图像。参照文献[11-13],本文采用前6幅作为训练图像,后5幅作为测试图像,当所有的测试图像循环一遍之后,将识别结果的平均值作为最后的统计识别结果。图6给出了YALE库中某类样本的11幅图像。表2给出了本文算法与Gabor+KNN、Gabor+SRC、Contourlet+KNN、Contourlet+SRC、Shearlet+KNN、Shearlet+SRC和AWF_SSRC在YALE库上的平均识别率和识别时间。

图6 YALE库中某类样本的全部图像

表2 YALE库中不同算法识别性能比较

由表1、2可知,利用SRC分类方法在识别率上相对于KNN分类方法有很大的提高,但识别时间上相对于KNN方法没有优势;利用Shearlet变换对图像进行处理相较于Gabor变换与Contourlet变换识别率和识别时间都更具优势;与文献[8]加权融合的稀疏表征人脸识别算法相比,本文算法在保证高识别率的同时加快了识别速度。

4 结 论

本文将稀疏表示与多尺度相结合,提出差异性Shearlet特征提取融合的快速稀疏描述人脸识别方法,运用了一种基于匹配得分策略的融合办法,更多的考虑了“当前”测试样本,且本方法只利用了训练样本集的一个子集来表示测试样本,排除了与测试样本很不相似的训练样本对分类的干扰,相当于一个粗分类与一个细分类决策的过程。除了第一步选择“最佳”的计算代价外,本文方法计算代价主要是第二步求解一个线性方程组,相比于原有稀疏描述方法基于迭代的算法,降低了计算复杂度。

[1] GAO S H,TSANG I W,Chia T L. Kernel Sparse Representation for Image Classification and Face Recognition [C]// Proceedings of International Conference on Computer Vision,Crete,Greece,Sep 5-11,2010,6314:1-14.

[2] WRIGHT J,YANG A,GANESH A,. Robust Face Recognition via Sparse Representation [J]. IEEE Transaction on PAMI(S0162-8828),2008,31(2):210–225.

[3] WAGNER A,WRIGHT J,GANESH A,. Towards a Pratical Face Recognition System:Robust Alignment and Illumination by Sparse Representation [J]. IEEE Transactions on PAMI(S0162-8828),2012,34(2):372-386.

[4] PEREZ C,CAMENT L,CASTILLO L. Methodological Improvement on Local Gabor Face Recognition Based on Feature Selection and Enhanced Borda Count [J]. Pattern Recognition(S0031-3203),2011,44(4):951-963.

[5] YANG Yongmi,YANG Xingqiang,ZHANG Caiming. An Efficient Method for Face Feature Extraction and Recognition Based on Contourlet Transform [J]. ICIC Express Letters(S1881-803X),2014,8(1):123-129.

[6] GUO K,LABATE D. Optimallt Sparse Multidimensional Representation Using Shearlet [J]. Siam Journal on Mathematical Analysis(S0036-1410),2007,39(1):298-318.

[7] 周霞,张鸿杰,王宪. Shearlet多方向特征融合与加权的直方图的人脸识别算法 [J]. 光电工程,2013,40(11):89-94.

ZHOU Xia,ZHANG Hongjie,WANG Xian. Face Recognition Based on Shearlet Multi-orientation Features Fusion and Weighted Histogram [J]. Opto-Electronic Engineering,2013,40(11):89-94.

[8] 张鸿杰,王宪,孙子文. Shearlet 多方向自适应加权融合的稀疏表征人脸识别 [J]. 光电工程,2014,41(12):66-71.

ZHANG Hongjie,WANG Xian,SUN Ziwen. Face Recognition Based on Shearlet Multi-orientation Adaptive and Weighted Fusion and Sparse Representation [J]. Opto-Electronic Engineering,2014,41(12):66-71.

[9] EASLEY G,LABATE D,WANG Q,. Sparse Directional Image Representations Using Discrete Shearlet Transform [J]. Applied and Computational Harmonic Analysis(S1521-1398),2008,25(1):25-64.

[10] YI S,LABATE D,EASLEY G. A Shearlet Approach to Edge Analysis and Detection [J]. IEEE Transactions on Image Processing(S1057-7149),2009,18(1):929-941.

[11] YANG Meng,ZHANG Lei,SHIU Simon C K,. Gabor Feature Based Robust Representation and Classification for Face Recognition with Gabor Occlusion Dictionary [J]. Pattern Recognition(S0031-3203),2013,46(7):1865-1878.

[12] KUTYNIOK G,LIM W. Compactly Supported Shearlets are Optimally Sparse [J]. Journal of Approximation Theory(S0021-9045),2011,163(11):1564-1589.

[13] WAGNER A,WRIGHT J,GANESH A,. Towards A Practical Face Recognition System:Robust Alignment and Illumination by Spares Representation [J]. IEEE Transaction on Pattern Analysis and Machine Intelligence(S0162-8828),2012,34(2):372-386.

Face Recognition Algorithm Based on Differences Shearlet Characteristic of Fast Sparse Description

HUANG Yu1,ZHANG Yingjun1,PAN Lihu1,2

( 1. School of Computer Science and Technology, Taiyuan University of Science and Technology, Taiyuan 030024, China; 2. Institute of Geographic Science and Natural Resource Research, Chinese Academy of Science, Beijing 100101, China )

For the high computational complexity of sparse description which results in the difficulty in meeting the actual needs and the number of samples sensitive training, we proposed a differences Shearlet characteristic of fast sparse description method to describe face recognition. First, Shearlet was used to get multi-scale and multi-direction facial image. Then a matching score fusion strategy was used to integrate Shearlet characteristics, and discriminative characteristics were constituted. Furthermore, configured the "best" sparse description for each test sample and calculated the correlated coefficient. Finally, according to the contribution size of the training sample in a test sample description, achieved the test sample image classification. Experimental results on ORL and YALE face database show that the algorithm ensuring a high recognition rate advantage as well as significantly reducing the time complexity.

face recognition; sparse description; Shearlet transform; match score fusion

1003-501X(2016)06-0025-07

TP391

A

10.3969/j.issn.1003-501X.2016.06.005

2015-08-10;

2015-11-17

山西省自然基金资助项目(2012011011-5);山西省科技攻关项目(20141039);山西省-中科院合作项目(20141101001);山西省科技重大专项(20121101001)

黄玉(1990-),女(汉族),山西临汾人。硕士研究生,主要研究方向是计算机视觉与模式识别。E-mail: 385967759@qq.com。

猜你喜欢

训练样本人脸人脸识别
人脸识别 等
有特点的人脸
一起学画人脸
揭开人脸识别的神秘面纱
人工智能
人脸识别技术的基本原理与应用
三国漫——人脸解锁
人脸识别在高校安全防范中的应用
宽带光谱成像系统最优训练样本选择方法研究
基于稀疏重构的机载雷达训练样本挑选方法