APP下载

局部二值淘汰模式进行人脸图像协同表达

2017-02-03袁永顺

电子设计工程 2017年21期
关键词:训练样本直方图人脸

袁永顺

(江苏科技大学计算机学院,江苏镇江212003)

随着数学的发展,线性表达学习方法受到了关注并取得了一定的成果。协同表达作为其中的一种策略,已经成功的应用于多个领域,显示出了稀疏表达学习在实际应用的巨大潜力和优势。

协同表达的基本思想是用所有类别的所有训练样本对测试样本进行线性表达。通过评估每一类训练样本对测试样本的表达能力,将测试样本划分到表达能力最强即贡献值最大的那一类中。尽管协同表达可以有效的挖掘出样本集的协同特性,它却没法处理由于光照、表情和姿态所导致的同一类样本图像间的巨大差异。为了解决这个问题,Rodriguez和Sapiro[1]研究了稀疏表达框架下的鉴别字典并且对图像编码后进行分类。Thiagarajan[2]针对有监督和无监督学习提出了多核稀疏表达,与此同时,Yang[3]利用gabor occlusion dictionary来解决人脸遮挡问题,目的在于减少计算量。另外,Yang[4]还将特征的相似性和区别性引入到协同表达中,提出了一种更通用的模型。Liu[5]通过评估测试样本的重建误差来提高协同表达的准确率。最近徐勇在[6-10]中提出了一系列简单但有效的模型来获得较好的识别效果。

通过上面的研究,我们自然的得出一个结论:传统的表达学习方法通过对训练字典的稀疏学习可以获得有鉴别性的信息。然而,如果这些算法没有得到不同类别各自的属性信息的话,可能是因为冗余和不确定度,导致测试样本没法被分类器精确的分类。

尽管在表达学习分类模型上的研究较多,然而利用LBP特征挑选有竞争力的样本然后结合淘汰的策略,却没有引起太多的关注。为此,我们提出了LBP特征和表达学习相结合进行人脸识别的一种新的协同表达方法。它可以被视作一种评估方法,将表达学习模型和评估方法的优点结合起来。这篇论文的贡献体现在4个方面,首先,我们获取所有训练样本的分块后LBP特征;接着我们利用LBP特征和欧式距离来获得与测试样本最相近的训练样本,即优质样本;然后我们利用这些获得的更有竞争力的样本来对测试样本进行线性表达。最后我们回归到分块,用一种块与块比较然后综合判断的方式来给出最终的分类结果。和传统的表达分类方法相比,该方法采用LBP特征来获得所有类别中更具竞争力的训练样本,据此来减少表达学习中的误差。在优化样本中,这可以视作一种有意义的淘汰策略。

1 LBP训练样本优化

1.1 原始LBP

局部二值模式(LBP)[11]算子是统计特征的一种,其特点是快速简单,并且提取的特征鲁棒性很强。LBP算子首先应用在纹理提取方面,后来它的应用扩展到了诸多领域。

2004[12]第一次将局部二值模型应用于人脸识别,取得了较好的效果。但是原始的LBP算子面临一个问题:作为局部特征提取算子,其不包含全局信息,这限制其在人脸识别领域的进一步应用。为了解决这个难题,众多学者进行了研究。论文[13]采取的是分块策略:即根据先验知识,对人脸区域进行划分。根据区域的不同配以不同的权值,其中有效特征密集的双目和嘴部的区域权重最大,其余区域权重较小。然后将小块的特征直方图进行特征融合,最后分类,大大提高了人脸的识别率。

1.2 统一模式LBP

二值模式的数量与LBP算子的采样点个数P存在指数关系,模式总数为2p。如果采样点个数为8,则模式总数为28;如果采样点个数为32,则模式总数为232。由此可见,LBP模式较多,如果全部使用,则信息将产生冗余,并不利于分类。而且计算量过大,难以在实际中应用。通常的做法是利用直方图工具来统计各类模式出现的次数。大量的研究表明,代表图像基本属性的模式出现的十分频繁,有时候高达90%以上。将这类模式统一称为统一模式[14]。公式定义如下

该模式的特点是在一串二值编码中,0到1的变化最多有两个。例如11111111有零个码元变化;00111111有一个码元变化;00011100、11110001有两个码元变化。采样点为P、半径为R的统一模式可以用表示。对于P=8,R=1,原始的LBP有256种模式,而只有59种统一模式,运算量大大降低。

根据上文的讨论可知,在利用LBP算子提取人脸特征时,首先将人脸图像划分为u×v区域,其中u和v都是恰当的正整数。经实验发现,当u=v=5,即划分为25块时,分类效果最好。

每一个小区域利用LBP统一模式进行特征提取。

i=1,2,…,25,Pi代表第i个小区域的LBP特征。

然后将这些小区域的LBP直方图串联起来,得到特征融合后的LBP特征。

这样一个人脸样本就唯一对应一个LBP向量P(1475*1)。据此我们就可以利用LBP特征进行样本优化。

m是训练样本的总数,pj(j=1,2,…,m)代表每一个训练样本xj(j=1,2,…,m)所对应的LBP特征向量。P代表的是测试样本的LBP特征向量。这样,在测试样本和每一个训练样本之间我们就产生了m个度量。然后我们对这些得到的m个度量进行降序排列,得到

根据公式(5),借助于欧式距离我们选择最优的L个度量来优化训练样本。所以这些与测试样本联系更紧密,更具竞争力的样本最终被挑选了出来。然后我们利用这些具有更好表达能力的训练样本重建测试样本来进行更有效的分类。

1.3 利用优质样本进行分类

下一步就是根据所提出的L-CRC算法,用上文得到的L个最近邻的训练样本来线性表示测试样本。假设以下等式是成立的

β=[β1,…,βL]T,如果X′是非奇异矩阵,可以解出β=X′-1y,否则,β=(X′TX′+μI)-1X′Ty,μ是很小的正常数,I是单位矩阵。

由于测试样本的最优训练样本有可能是来自于不同的类别,在表达测试样本中我们会计算来自于同一类别的最优训练样本贡献值的和,然后将测试样本划分到具有最大贡献值的那一类中。更具体地说,如果来自于第K类样本的最优样本为ξs…ξt,则在表达测试样本中,它们的贡献值可以表示为

所以yk和y的偏差可以表示为

2 算法分析

在本章节中,我们将讨论所提出算法的特性和原理。算法的基本思想是利用训练样本集中具有最优表达能力的子集对测试样本进行线性表达。目的是找到对测试样本更好的表达,来达到更好的分类效果。根据特征提取的相关理论,来自同一类的样本应该具有相似的特征。这启示我们利用LBP直方图来直观的反映样本的特征。在本方法中,我们利用LBP算子来提取样本的特征,目的是对训练样本进行淘汰。首先,我们对样本进行分块。根据我们的实验结果发现,当样本分成5*5的区域时,能够达到最好的效果。然后用统一模式直方图提取每一个人脸区域块的特征。这样我们就得到了25个59*1的向量。每一个向量代表对应小区域的LBP特征。然后将这25个向量串联起来,就得到了一个1475*1的向量。该向量表示整个图像的LBP特征。这样,对图像样本的讨论自然就转换到了对其LBP特征的讨论。一般来说,两个样本间的距离越小,两者的相似度越大。在前面的章节中,我们已经讨论了利用LBP特性来分析样本之间相似性程度的可行性。在这个阶段,我们会更多的阐述我们是如何利用LBP特征直方图来优化训练样本的。具体来说,每个图像的LBP特征直方图可以看作一个一维的向量。所以评估两幅图像的相似程度可以很容易的转换成评估他们对用的LBP特征直方图,也即对两个一维向量进行评估。和其他的距离度量方式相比,基于LBP特征直方图的评估在时间消耗和空间复杂度方面获得了较好的平衡。有两方面的原因,首先,对于一个1475维的一维向量,其复杂在容忍的范围内。另一方面,在特征提取方面,我们做了两个工作,一是分块,二是特征融合。这就使的该1475*1的向量最大程度的保留了原始的信息,所以在利用该特性进行训练样本优化时,能够极大的减少信息的损失。

3 实验结果

分别在ORL和FERET人脸库进行了对比实验。选取的方法有主成份分析(PCA)、局部二值模式(LBP)、协同表达分类(CRC)。实验结果呈现在图1和表1中。

4 结论

文中提出了一种利用LBP特征并结合综合判定的新的表达学习方法。所提出的方法目的在于利用拥有最佳表达贡献值的更具竞争力的样本来对测试样本进行线性表达。通过LBP算子的特征提取,所有训练样本的重要特征信息被提取然后评估。紧接着我们可以配合着欧式距离度量来获得与测试样本最近接近的样本,从而获得良好的分类效果。我们相信我们优异的分类性能可以激发在特征提取、协同表达和综合判断方面更多更有意义的探索,找到更好表达学习分类的解决方案。

图1 不同方法在ORL上的识别效果

表1 FERET人脸库上不同样本、不同方法的识别率

[1]Rodriguez F,Sapiro G.Sparse representations for image classification:Learning discriminative and reconstructive nonparametric dictionaries[R].Minnesota Univ Minneapolis,2008.

[2]Thiagarajan J J,Ramamurthy K N,Spanias A.Multiple kernel sparse representations for supervised and unsupervised learning[J].IEEE Transactions on Image Processing,2014,23(7):2905-2915.

[3]Yang M,Zhang L.Gabor feature based sparse representation for face recognition with gabor occlusion dictionary[M].Computer Vision ECCV 2010.Springer Berlin Heidelberg,2010.

[4]Yang M,Zhang L,Zhang D,et al.Relaxed collaborative representation for pattern classification[C]//Computer Vision and Pattern Recognition(CVPR),2012 IEEE Conference on.IEEE,2012:2224-2231.

[5]Liu Z,Pu J,HuangT,etal.A novel classification method for palmprint recognition based on reconstruction error and normalized distance[J].Applied Intelligence,2013,39(2):307-314.

[6]Xu Y,Zhang D,Yang J,et al.A two-phase test sample sparse representation method for use with face recognition[J].Circuits and Systems for Video Technology,IEEE Transactions on,2011,21(9):1255-1262.

[7]Xu Y,ZuoW,FanZ.Supervised sparse representation method with a heuristic strategy and face recognition experiments[J].Neurocomputing,2012(79):125-131.

[8]Xu Y,Fang X,Li X,et al.Data uncertainty in face recognition[J]. IEEE transactions on cybernetics,2014,44(10):1950-1961.

[9]Xu Y,LiX,Yang J,etal.Integrating conventional and inverse representation for face recognition[J].IEEE Transactions on Cybernetics,2014,44(10):1738-1746.

[10]Xu Y,Zhang B,Zhong Z.Multiple representations and sparse representation for image classification[J].Pattern Recognition Letters,2015(68):9-14.

[11]Ojala T,Pietikäinen M,Harwood D. A comparative study oftexture measures with classification based on featured distributions[J].Pattern recognition,1996,29(1):51-59.

[12]Ahonen T,Hadid A,Pietikäinen M.Face recognition with local binary patterns[C]//European conference on computer vision.Springer Berlin Heidelberg,2004:469-481.

[13]Ahonen T,Hadid A,Pietikainen M.Face description with local binary patterns:Application to face recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2006,28(12):2037-2041.

[14]Ojala T,Pietikainen M,Maenpaa T.Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(7):971-987.

[15]Zhang L,Yang M,Zhang D,et al.Collaborative representation based classification for face recognition[R].2012.

[16]Yang M,Zhang L,Yang J,et al.Regularized robustcoding for face recognition[J].Image Processing,IEEE Transactions on,2013,22(5):1753-1766.

猜你喜欢

训练样本直方图人脸
符合差分隐私的流数据统计直方图发布
有特点的人脸
一起学画人脸
人工智能
用直方图控制画面影调
三国漫——人脸解锁
中考频数分布直方图题型展示
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法