APP下载

基于高次曲线拟合的人脸特征表示

2014-09-12张树功

吉林大学学报(理学版) 2014年4期
关键词:子块子集人脸

刘 宏,张树功

(吉林大学数学研究所,长春 130012)

基于高次曲线拟合的人脸特征表示

刘 宏,张树功

(吉林大学数学研究所,长春 130012)

基于数字化曲线拟合技术,提出一种新的人脸图像不变特征表示方法.该方法先将人脸边缘图像分割为高次多项式及抛物线段构成的特征曲线段集合,再运用极惯性矩度量不同人脸图像在特征曲线段两侧的局部纹理及形态差异.实验结果表明,该方法与直线边缘图法和抛物线边缘图法相比,能更好地描述人脸图像的分布特征.

边缘提取;曲线拟合;高次多项式;极惯性矩

1 人脸边缘图像的曲线表示及相应不变特征的提取

1.1 边缘提取及线段拟合

对于待识别的人脸图像,首先要进行图像边缘的提取.本文采用Canny边缘提取算子[9],该算子较其他算子对图像随机噪声更不敏感,提取出的边缘图像较平滑和稳定.在得到边缘图像后,即可利用文献[10-11]中的线段拟合方法将其分割成若干直线段、抛物线段或高次多项式线段组成的线段图.该线段拟合方法称为数字曲线结构性拟合,其思想是利用数字曲线各点间的拓扑关系限制,对待拟合曲线中选取的若干点集进行拟合误差估计,从而在避免对待拟合曲线全体点集进行拟合误差估计的前提下,求出拟合误差小于预设值的多项式拟合曲线.该方法可简要表述如下:

对由n个点组成的数字曲线

令G为l次多项式拟合函数构成的向量空间,l≪n.其中任意函数g(x)可表示为

记g(x)对曲线C的拟合误差为

则对曲线C的最优拟合函数误差可表示为

此时,拟合多项式为l次多项式,则待拟合曲线C中所有点数为l+2的子集均可用来估计最优拟合多项式及其拟合误差[10].这些子集称为曲线C的基础子集,记这些基础子集的集合为M.

对某基础子集D∈M,

即使用基础子集可对整个曲线的拟合误差进行估计[10].特别地,当基础子集M具有一定拓扑关系限制,如坐标间距为固定值且点与点之间关系为四连通或八连通时,用基础子集M的刚性子集[11]的拟合误差~r(c)即可对r(C)进行估计.显然,数字图像中构成曲线的点集即满足该条件.

刚性子集的选取有多种选择.以直线拟合为例,对有i+1个点的点集C=(p1,p2,…,pi,pi+1),其中的任意三点均构成该点集的基础子集,而如(p1,pi/2+1,pi+1),(p1,pi,pi+1)等则可构成其刚性子集[11].进行误差估计时,既可使用其中某一刚性子集,也可同时使用多个刚性子集.当使用多个子集时,其中之一的拟合误差超过准许上限后即结束拟合.图1为若干点构成的一条数字曲线,如对其进行直线段拟合,则可选取刚性子集(p1,pi,pi+1)进行拟合误差估计.

利用该方法,可将边缘图像分割为若干直线段或多项式曲线段.图2(A)为人脸边缘图像;图2(B)为对边缘图像进行直线段拟合后的结果;图2(C)为抛物线段拟合的结果.

比较边缘图像和拟合结果可见,由于面部轮廓线多呈现出曲线特性,仅使用直线段进行拟合,易导致原本连续的曲线特征被人为截断,破坏了特征的整体性,弱化了特征的判别力.在该问题上,抛物线拟合比直线段拟合的效果更好.但仅使用抛物线进行拟合,仍然有明显的局限性.图3(A)框中为人脸鼻翼侧自然褶皱形成的连贯边缘线段,图3(B)和图3(C)分别为抛物线段拟合和高次多项式线段拟合结果.由图3可见,高次多项式线段更真实地还原了原始图像的分布特征.

对人脸图像进行边缘提取后,部分区域的边缘线曲线特征不明显,长度也较短,使用直线段或抛物线段拟合,可使特征提取简化,同时又不会产生特征的破碎化.而对如图3中所示的若干区域,使用高次多项式曲线则能最大限度地还原原始图像的分布特性,提高拟合精度.在实验中,利用面部器官分布的先验知识,集中对此类区域中(如鼻翼、脸颊、唇边)的边缘进行高次多项式线段拟合,比仅采用单一的低次曲线类型更易取得较好结果.

图1 刚性子集Fig.1 Rigid subcollection

图2 面部边缘图像的不同曲线拟合结果Fig.2 Different curve fitting result for face edge images

图3 高次曲线拟合Fig.3 High-order curve fitting

1.2 不变特征的选取

如图4所示,对人脸图像(A)进行边缘提取及线段拟合后,可得到线段图像(B).对图像(B)中箭头处所指线段,取原始图像中该线段所在位置两侧一定宽度内的像素点,构成该线段的相关区域,如图4(C).然后将该相关区域均分成若干子块,以每子块中心位置像素值作为参考,与该子块内其他像素进行比较,将与其灰度值相近的像素提取出来,即可有效刻画出各线段附近像素的分布情况.图5(A)为相关区域中一子块;图5(B)中C,S,D点分别表示子块的中心点、与中心点相似的点及与中心点相异的点;图5(C)为经过分类后,子块所体现出的分布特征.

图4 原始图像中抽取的特征Fig.4 Features extracted from original face image

称相似点构成的区域为相似区域S,相异点组成的区域为相异区域D.图6给出了子块内若干种可能出现的区域分布情况,其中灰色区域表示子块内的相似区域,白色区域表示相异区域.此时可将各子块视为二维平面上非均匀分布的具有不规则外形的几何图形,对其特性的量化描述可使用极惯性矩的概念.

图5 相关区域分成的两类子块Fig.5 Two types of blocks divided from correlative area

图6 子块的不同分布Fig.6 Distribution of the blocks

如图7所示,A为某平面图形面积(对应上述子块的相似区域),C为该图形形心.对于C,可给出极惯性矩J的一般性定义易证,J为不受图像坐标平移、旋转影响的不变量[12].利用这一特性,可有效刻画图像的局部分布特性.由图6可见,通过对子块内不同区域的划分,实际上体现出了人脸图像局部纹理的固有分布特性.显然,在面部姿态和表情未发生显著变化的情况下,这些分布特性不会出现大的改变.

在LEM方法中,不变特征的提取和比对仅考虑了直线段图像间的差异,而未考虑原图像的像素分布差异,无法有效利用图像纹理中蕴含的判别信息.而PEM方法虽然在识别过程中,加入了计算线段两侧像素点差异的内容,但仅沿线段提取了若干孤立的像素点,未能充分体现线段两侧相关区域的整体分布特征.当局部光照条件发生变化或面部表情发生小幅度变化时,即有可能导致采样点发生较大改变,从而影响识别的准确性.相较于这两种方法,本文选取的不变特征则能较好地避免上述问题.

图7 极惯性矩Fig.7 Polar moment of inertia

2 算法的实现

在提取边缘前,须对人脸图像进行归一化处理,根据CSU人脸识别评估体系中提出的人脸图像归一化方法[13],对来自于FERET[14]人脸图片库的人脸图像进行以下操作:

1)几何归一化.利用眼球中心坐标将人脸图像旋转为水平状态,并使图像具有相同外尺寸;

2)椭圆轮廓化.使用一椭圆面具对人脸图像外边缘进行剪裁,仅使额头、下巴和两颊以内部分可见;

3)直方图均衡化.对椭圆面具内像素进行直方图均衡化处理.

处理结果如图8所示,图8(A)为原始图像,图8(B)为处理后的图像.

然后利用Canny算子,对图像进行边缘提取.在提取的边缘图像上,利用曲线拟合方法,完成线段分割.提取线段后,即可对原图像中该线段对应的相关区域进行分析.如图9所示,对于提取出的线段AB(图9(A),(B),(C)中,AB分别为直线段、抛物线段和高次多项式线段),沿该线段两端点连线的垂线方向,将AB向其两侧分别平移若干像素,得到新线段A′B′和A″B″.这两条新线段和直线段A′A″及B′B″构成了一个封闭图形.该封闭图形在原图像中围出的区域即为线段AB在原图像中的相关区域.等距平移线段A′B′至A″B″,将相关区域等分为m份,再等距平移A′A″至B′B″,将区域均分为n份,即可将相关区域划分为m×n个子块(以图9为例,m=n=6,则区域被划分为36个子块).此时,当子块长宽均为奇数个像素时,可直接得到中心像素的坐标,并提取其灰度值;若子块一边为偶数,则取位于中心位置两点灰度值的均值;若子块长宽均为偶数,则取位于中心位置的四点灰度值均值.为了克服随机噪声对实验的影响,可用中心点及其周围邻域中值滤波后的灰度值代替原灰度值.利用该灰度值,考察相关子块中像素分布情况.再利用极惯性矩,求各子块关于相关区域中心点的不变特征.用极惯性矩平行移轴公式[12],可得该像素关于某点(x,y)的极惯性矩

图8 均一化人脸图像Fig.8 Unified face images

图9 相关区域网格Fig.9 Correlative area grid

图10 极惯性矩的计算Fig.10 Calculation of polar moment of inertia

即先求得子块内某像素关于自身中心的极惯性矩,再求出其关于整个相关区域中心的极惯性矩.

进一步,考虑到像素灰度值可视为人脸在一定光照条件下的反射响应,可给出能量函数的定义

其中:Eij为i行j列像素的能量函数;αij为与人脸物理特性相关的权重系数;Gij为i行j列像素的灰度值.对某相关区域内第k个子块内所有相似点的能量函数求和,记为Ek.因此,以各子块能量函数组成该相关区域的特征序列,即每个相关区域的特征序列均由m×n个特征构成(以图9为例,该相关区域的特征为36个),而每个相关区域的特征序列又可视为整个图像的一个特征.

分别获得待测图像和样本图像的特征序列后,对待测图像中某线段,可在样本图像中寻找与其坐标最接近的线段作为对应线段,比较二者间相关区域不变特征序列间的差异.考虑到这两个相关区域未必完全重叠,且显然两区域重叠度越高,二者间的差异越具有判别性,故在计算最终差异时,需加入重叠度的计算.图11(A)和图11(B)分别表示两个对应线段的相关区域,图11(C)中阴影区域即二者的重叠部分.

图11 重叠区域Fig.11 Overlap area

考虑两个对应线段(即坐标最相近的两线段)的相关区域,两者中较大区域的面积记为Amax,重叠区域面积记为Aol,重叠率R=Aol/Amax.设参加比对的两个样本分别有M1,M2个相关区域,M1<M2,每个相关区域有K个子块,记某样本第j个相关区域内第i个子块的相似区域Sij对应的能量函数为eij,则第j个相关区域的能量函数为

若分别记两样本对应的某相关区域的能量函数为Eaj和Ebj,则样本间差异为

3 实 验

选取图片库中150人作为实验对象,对其多幅图像提取边缘并进行高次多项式拟合及不变特征提取.通过对边缘提取及拟合阶段各阈值的调整,可控制每幅图像相关区域的数量.此时,可视每个相关区域为图像的一个特征,该特征由其内部特征序列描述.随后,取每个实验对象若干图像作为该实验对象的标记样本组,其余图像则为待测样本.当待测样本与某标记样本组中的一幅图像特征差异最小,且两者确属同一人的图像时,认为识别成功.如图12(A)所示,A,B,C三组数据分别表示使用3,2,1个图像作为标记样本时,在不同特征数量(即相关区域的数量)下,算法识别率的变化情况.如图12(B)所示,A,B,C三组数据分别表示使用直线段、高次多项式与抛物线混合线段、抛物线段提取特征后,在不同特征数量下算法的效果.

图12 不同实验方法的结果Fig.12 Results by different experiment methods

由图12可见,当其他条件相同时,使用同一人的多张图像构成样本能更充分体现其在不同光照、表情等情况下的特性,从而取得更好的识别结果.另一方面,当样本特征数量由5开始逐步增加时,识别率有明显提高,但数量增加到一定程度后,识别率反而有所下降.经分析认为,当线段及其相关区域达到一定数量后,即能有效刻画人脸特征的分布情况,如继续增加特征数量,相关区域间的重叠情况会明显增加,过多的冗余信息反而弱化了最具判别力的若干单个特征在特征比对中的作用,从而影响了算法的效果.因此,特征数量的控制及特征的选择能在很大程度上控制识别结果的优劣.本文目前主要从图像边缘的强弱和线段的长度等方面对特征进行筛选,当图像小范围内出现多条长度和强度都相近的边缘线段时,这些线段都将参与最终的特征比对,而最有效的方法则是在其中挑选出最具代表性的线段,从而避免信息冗余对判别带来的干扰.

综上所述,本文采用高次多项式曲线拟合算法分割图像边缘,在获得图像较精确描述的同时,与直线段相比,提高了算法复杂度.实验结果表明,在相同条件下,分别使用两种拟合方法对同一图片进行拟合运算时,高次多项式曲线拟合与直线段拟合的时间开销相比虽有一定程度增加,但仍属10ms量级.因此,其计算成本是可接受的.

[1] Patil A M,Kolhe S R.2DFace Recognition Techniques:A Survey[J].International Journal of Machine Intelligence,2010,2:74-83.

[2] Biederman I,Ju G.Surface versus Edge-Based Determinants of Visual Recognition[J].Cognitive Psychology,1988,20(1):38-64.

[3] Bruce V,Hanna E,Dench N,et al.The Importance of“Mass”in Line Drawings of Faces[J].Applied Cognitive Psychology,1992,6:619-628.

[4] Takács B.Comparing Face Images Using the Modified Hausdorff Distance[J].Pattern Recognition,1998,31:1873-1881.

[5] ZHAO Wenyi.Face Processing:Advanced Modeling and Methods[M].Burlington:Elsevier,2006:254-286.

[6] GAO Yongsheng,Leung M K H.Face Recognition Using Line Edge Map[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(6):764-779.

[7] DU Cheng,SU Guangda,LIN Xinggang.Face Recognition Using a Modified Line Segment Hausdorff Distance[C]//Proceedings of the Second International Conference on Machine Learning and Cybernetics.Xi’an:IEEE,2003:3016-3020.

[8] Deboeverie F,Veelaert P.Face Recognition Using Parabola Edge Map[J].Advanced Concepts for Intelligent Vision Systems Lecture Notes in Computer Science,2008,5259:994-1005.

[9] Canny J.A Computational Approach to Edge Detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1986,8(6):679-685.

[10] Veelaert P,Teelen K.Fast Polynomial Segmentation of Digitized Curves[J].Discrete Geometry for Computer Imagery,2006,4245:482-493.

[11] Veelaert P.Constructive Fitting and Extraction of Geometric Primitives[J].Graphical Models and Image Processing,1997,59(4):233-245.

[12] 范钦珊.工程力学教程[M].北京:高等教育出版社,1998.(FAN Qinshan.Engineering Mechanics[M].Beijing:Higher Education Press,1998.)

[13] Bolme D S,Beveridge J R.The CSU Face Identification Evaluation System:Its Purpose,Features and Structure[J].Computer Vision Systems,2003,2626:304-313.

[14] Phillips P J,Moon H J.The FERET Evaluation Methodology Face-Recognition Algorithms[EB/OL].2011-02-15.http://www.nist.gov/itl/iad/ig/colorferet.cfm/.

(责任编辑:韩 啸)

Face Eigen Expression Based on High-Order Curve Fitting

LIU Hong,ZHANG Shugong
(Institute of Mathematics,Jilin University,Changchun130012,China)

We proposed a new method to extract invariant features from human face image.With the help of digital curve fitting,we represented face binary edge map with high-order polynomial and parabola segments.Then,the polar moment of the inertia of pixel block beside the curve segments was used to measure the difference between local texture and shape.From the analysis of the experimental result,it is concluded that compared with line edge map and parabola edge map,this method can give a better way to describe the feature distribution of face images.

edge extraction;curve fitting;high-order polynomial;polar moment of inertia

TP391.4

A

1671-5489(2014)04-0746-07

在人脸识别领域,相对于三维图像和红外图像等数据来源,二维图像具有更便于获取和处理的优势,因此,基于二维图像的人脸识别技术得到了广泛应用[1].其中特征脸法、弹性模板匹配法和Bayes法等分别利用了二维图像中蕴含的矩阵特征、小波分布特征和概率分布特征.研究表明[2-5],面部边缘图像中已蕴含了丰富的、可供辨识的信息.因此,除上述几种方法外,还有一种算法,试图通过提取边缘图像中相应的几何分布特征完成对人脸的分类或识别.如Gao等[6]提出的LEM(line edge map,即直线边缘图)方法,利用人脸图像的边缘图像,生成相应的直线段图集,并由此提取其中具有辨识力的特征[7].Deboeverie等[8]提出了PEM(parabola edge map,即抛物线边缘图)方法,运用抛物曲线完成人脸边缘图像的分割和特征提取,使这种算法有了进一步的发展.以上两种方法均使用单一类型的线段提取图像特征,虽然便于数据处理和存储,但在处理某些相对复杂的面部曲线时,会不可避免地将原来具有整体性的特征碎片化,从而使算法的误差增大、判别能力降低.本文针对该问题,充分利用人脸器官轮廓线分布规律的先验知识,引入高次曲线对边缘图像进行分割,使提取出的线段特征更具整体性和稳定性,并在此基础上,引入新的不变特征提取方法,取得了较好的实验效果.

10.13413/j.cnki.jdxblxb.2014.04.22

2013-10-18.

刘 宏(1982—),男,汉族,博士研究生,从事数值计算和模式识别的研究,E-mail:hongliu07@mails.jlu.edu.cn.通信作者:张树功(1958—),男,汉族,博士,教授,博士生导师,从事数值计算和计算机代数的研究,E-mail:sgzh@mail.jlu.edu.cn.

国家自然科学基金(批准号:11171003)和吉林省自然科学基金(批准号:20101597).

猜你喜欢

子块子集人脸
基于八叉树的地震数据分布式存储与计算
拓扑空间中紧致子集的性质研究
有特点的人脸
一起学画人脸
基于特征值算法的图像Copy-Move篡改的被动取证方案
连通子集性质的推广与等价刻画
关于奇数阶二元子集的分离序列
基于波浪式矩阵置换的稀疏度均衡分块压缩感知算法
三国漫——人脸解锁
基于分布式ICA-PCA模型的工业过程故障监测