APP下载

基于相似度空间寻优的开集人脸识别方法

2010-07-25张凯

微型电脑应用 2010年6期
关键词:超平面识别率分值

张凯

0 引言

人脸识别已成为生物统计学的一个重要方向,在安防、考勤、门禁等方面有着广泛的应用[1]。人脸识别分为闭集识别和开集识别两种,闭集识别假定测试样本一定属于人脸库中的某个已知类,识别过程中只需要找出测试样本最相似的类别即可;而开集识别则假定测试样本可能不属于人脸库中的任何一个已知类,它首先需要判断测试样本是否不属于人脸库,再找出测试样本与人脸库中最相似的类。

由于开集识别更符合人脸识别系统在安防、门禁等场合的实用环境,因此具有更广泛的研究价值。在已有的开集人脸识别方法中,最近邻方法[2]获得测试样本与已知类样本中相似度最大者,与一个预先设定的阈值进行比较,若高于该阈值,则接受样本为已知类,反之拒绝;归一化方法[3]为了减小在识别过程中受到的光照,年龄等影响,对相似度最大值求取最小的归一化的距离,以提高其分辨能力;文献[4]引入传导原理进行集内集外的判定,将求取的距离通过传导公式转化为置信度,再取置信度最高者与阈值做比较。虽然归一化和传导原理方法相比最近邻都提高了相似度最大者的分类能力,在同等错误拒绝率的情况下,降低了错误接受率,但是它们同最近邻方法一样,都只利用了相似度最大者这一个维度的信息进行判别。

然而判别的信息并不仅存在于相似度最大者这一个维度中,测试样本与各个已知类样本求取的一系列相似度都包含了部分可用于开集判别的信息,这些信息在上述的方法中都没有得到利用。为了充分利用这些信息,提高判别的准确率,本文将所获取的相似度构成相似度空间,利用多个维度的相似度信息找寻最优的超平面,利用该超平面划分需要拒绝的样本。

1 基于相似度空间寻优的判别方法

1.1 相似度空间

在开集人脸识别中,测试样本与人脸库中已知类样本进行比较,通过各种识别方法获得了与每一个已知类之间的相似度。在最近邻的方法中,直接利用相似度最大者,将其与一个预先设定的阈值进行比较,当大于该阈值时,则接受测试样本为已知类样本,否则拒绝为未知样本。该方法仅利用了相似度最大者这一维的信息,为了利用相似度中包含的完整信息,我们将获取的相似度按照从大到小排序,获得相似度向量(如图1)。

图1 相似度向量的获取方法

如果测试样本带有标识,我们可以对相似度向量进行分类。假设相似度最大者对应类 A,共有三种情况:1、测试样本属于已知类别,且类别A为正确分类;2、测试样本属于已知类别,但类别A为错误分类;3、测试样本不属于已知类别。开集问题进行的判别,就是将第一种情况的相似度向量与第二三种情况分开。于是将第一种情况的向量归为0类,第二三种情况的向量归为1类,通过大量带标识的测试样本,获得两类相似度向量在空间中的分布。我们在FERET库上使用PCA(Principle Component Analysis)+欧氏距离进行实验,获取相似度向量的前两维表示出来得到的分布如图2。

图2 PCA+欧式距离求取的相似度向量前两维在FERET库上的分布

图2中,三角形表示的是应该被接受的测试样本,星型表示的是应该被拒绝的测试样本,虚线表示的是使用最近邻方法进行判别的情况,实线表示的是寻找相似度空间最优超平面进行判别的情况。从中明显可以看出,仅使用相似度最大者进行判别的方法,相当于以垂直相似度最大者所在维度的超平面切割相似度空间,进行开集判别,并没有利用相似度空间所提供的全部判别信息,而利用多维的相似度空间找出的最优超平面,能够获得更强的判别能力。

1.2 寻找最优切割超平面

为了寻找最优的切割超平面,先寻找一根法向量,再在该法向量上求取最优的分割点,这根法向量和分割点便确定了一个超平面。其寻优指标为该超平面的分类能力,获取方法如下:首先用带标识的测试样本通过各种识别方法,获得与各已知类样本的相似度,然后由各相似度构成该接受的和该拒绝的相似度向量。在相似度空间中,需要获得一根法向量的分类能力指标时,将相似度空间中所有的向量向该法向量做映射。得到数轴如图3:

图3 两类的相似度向量向法向量映射(三角形为正确分类,星形为错误分类)

为了寻找这根轴上最优的阈值,假设样本数为m,再假设当前选定的阈值是eval[j](1 <j<m),为当前数轴上第j个映射值。计算两类样本在该阈值下的集中程度:

其中yk为分类值,当第k个值属于第0类时为-1,属于第1类时为+1。curleft反应了样本在该阈值左边的集中程度,若curleft > 0,表明左边1类样本较为集中,若curleft < 0,表明左边0类样本较为集中。同样curright也反应了样本在该阈值右边的集中程度。由此计算两类样本在该阈值下的分散程度:

一个最好的阈值必然使得左右两边的分散程度达到最低,因此(curlerror+currerror)反应了该阈值的分类能力。当该值越小,分类能力越强。因此,当获得一根法向量时,我们对法向量上的所有阈值进行遍历,就可以找寻分类能力最强的阈值。同时也获得了该法向量的分类能力评价。

依照该分类能力的指标,用黄金分割法逐一寻找最优法向量的各维度的系数。为了求取一根n维的最优法向量[a1,a2…an],首先取a1=1,用黄金分割法搜索出最优的a2,然后固定[a1,a2],搜索出最优的a3,依次类推,直至搜索出[a1,a2…an]。

2 实验与分析

2.1 实验描述

为了说明建议的方法的优良性能,本文基于FERET[5]和 CAS[6]人脸库共进行两组实验,实验结果采用错误接受率(False Accept Rate,FAR)和错误拒绝率(False Reject Rat,FRR)相等时的正确识别率进行评估。

图像均经由人眼定位、校准(根据双眼位置平面内旋转)、大小归一化、加掩模,直方图均衡等处理。然后,依次通过 Gabor变换,PCA特征降维和 LDA(Linear Discriminant Analysis)特征选择等过程。接着,选取不同的相似度求取方式,获得相似度向量。在寻优超平面过程中将人脸库中一部分图像作为训练集,找出最优超平面,最后根据该超平面在非训练集进行开集判别;在最近邻方法中,选取相似度向量最大者,与阈值进行比较进行开集判别。

2.2 性能分析

表1和表2为当FAR和FRR相等时的本文所述LDA方法和最近邻方法的正确识别率的统计。在FERET数据库中,本文所述方法在不同的识别方法中分别使识别率提高31.8%,12.3%,20.3%,6.3%;而在 CAS数据库中,新算法在不同的识别方法中分别使识别率提高 39.1%,31.5%,3.8%,23.6%。由表1、表2可以看出,本文提出的新算法由于引入了更加丰富的相似度空间信息,显著地提高了开集识别的性能。

表1 在FERET上FAR=FRR时正确识别率

表2 在CAS上FAR=FRR时正确识别率

图4为超平面寻优引入前后分值的直方图分布的比较。图4中,人脸库采用FERET,特征采用灰度特征,分类方法为 PCA,相似度求取方式为欧氏距离。同类分值分布曲线根据集内样本分值大小统计,异类分值分布曲线根据集外样本分值大小统计。在最近邻方法中,分值是指相似度最高值,在本方法中,分值是指相似度向量向最优法向量映射后得到的值。图中实线为本方法的分值分布,虚线为最近邻方法的分值分布。

不难看出,引入寻优超平面方法之后,分值交叠区域大大减小,也就是说引入该方法后,集内分值和集外分值更为分开,说明本方法在利用了相似度空间中更多信息之后,相较最近邻方法而言,提取出的分值具有更强的分类能力。

图4 引入机器学习前后分值比较

新算法对于各种特征和分类器具有良好的鲁棒性。无论采用Gabor或灰度特征,在多种识别方法和相似度求取方式下,正确识别率明显提高。

3 结论

现有最近邻方法仅利用了相似度分布中一个维度的信息,为了充分利用相似度空间的信息,以提高识别率,本文针对整个相似度空间进行寻优,寻找最优超平面来分隔接受样本和拒绝样本,并通过判断与超平面的相对位置实现集内集外的判别过程。本文所述相似度空间寻优方法对于各种特征和分类器具有良好的鲁棒性,无论采用 Gabor或灰度特征,在多种识别方法和相似度求取方式下,识别正确率总在寻优后明显提高。算法简便,易于实现,适于多种人脸库、多种特征以及识别方法。实验表明该算法在判别准确率上,明显高于传统的最近邻判别方法。

[1]Jain A K, Ross A and Prabhakar S: An Introduction to Biometric Recognition[J].IEEE Trans on Circuits and Systems for Video Technology, Special Issue on Image and Video Based Biometrics, 2004, 14(1): 4-20.

[2]Richard O,Duda, Peter E.Hart, David G.Stork. Pattern Classification[M]. New York: John Wiley & Sons,Inc.2001:146-160.

[3]Jain A K, Nandakumar K, Ross A A. Score Normalization in Multimodal Biometric Systems[J].Pattern Recognition,2005, 38(12): 2270-2285.

[4]Fayin Li,and Harry Wechsler.Open Set Face Recognition Using Transduction[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(11): 1686-1697.

[5]Phillips P J, Moon H.et al. The FERET evaluation methodology for face-recognition algorithms[J].IEEE Trans on Pattern Analysis and Machine Intelligence, 2000,22(10): 1090-1104.

[6]Wen Gap, Bo Cao.Shiguang Shan et al. The CAS-PEAL Large-Scale Chinese Face Database and Evaluation Protocols[R],Joint Research & Development Laboratory,CAS, No.JDL_TR_04_FR_001, 2004.

猜你喜欢

超平面识别率分值
一起来看看交通违法记分分值有什么变化
全纯曲线的例外超平面
涉及分担超平面的正规定则
基于类图像处理与向量化的大数据脚本攻击智能检测
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
以较低截断重数分担超平面的亚纯映射的唯一性问题
体育考核新方案出炉 项目分值变化大
按病种(病组)分值结算:现状、做法和评价
提升高速公路MTC二次抓拍车牌识别率方案研究
一种基于支持向量机中分离超平面求取的算法*