一种有效提升识别率的面部图像预处理方法

2012-12-28谭阳，贺璐

湖南广播电视大学学报 2012年3期

关键词：识别率人脸预处理

谭阳，贺璐

(湖南网络工程职业学院，湖南长沙 410004)

一种有效提升识别率的面部图像预处理方法

谭阳，贺璐*

(湖南网络工程职业学院，湖南长沙 410004)

面部关键特征点的定位和取样直接关系到面部识别率的高低，本文提出了一种对人类面部图像进行细节提取，并进行了方向场化突出，最后将其特征2值化的预处理的方法，有效地抑制了面部图像中提取的特征点样本模糊的现象。实验证明，通过这种方法对面部图像的预处理，能够较好地提升一般面部识别算法的识别率。

人脸识别;表情识别;关键点定位;特征提取

一、引言

Ekman将人脸表情划分为6种基本类型［1］:高兴、悲伤、愤怒、恐惧、惊讶和厌恶。并认为这是人类所共有的6种基本表情，且不受种族、文化及性别等差异的影响。但是直到目前为止，使用机器对人脸表情信息准确地识别仍存在一些技术性困难。

当前，绝大多数关于人脸识别算法和人脸表情分析算法在提取人脸特征之前，需要根据人脸特征点的位置(如眼角，嘴角)对面部图像进行几何归一化处理，所以对于面部特征点的精确定位是一个关键的步骤。目前所有面部识别工具遇到的问题是:面部表情的变化是一个随时间变化的动态过程，即使在已知人脸大概位置的情况下，其面部特征点的位置也时常处于定位模糊的状态，并且这主要是由外部干扰和脸部的形变等不可预测的因素所造成的。

二、面部特征点定位的预处理方法

近年来，针对不同个体、姿态、光照条件下的人脸表情图像识别方面的研究有了新的进展［2］－［4］。国内外的学者们提出先通过对关键特征部位(眼角、鼻翼、嘴角)进行取样，然后对取样的图像进行归一化处理并按照一定的方法来进行模式匹配，最后再对所获取的表情进行分类和归纳。可以看出，对面部特征点的定位在很大程度上决定了取样图像的质量;目前较为常见的特征点的确定方法是先随机收集面部特征点的样本(正/负)，并对样本进行类比和对比后确定。为了进一步提高人脸的识别率，首先必须要能够较为精确地定位特征信息点的具体位置。为了实现这一目标，本文提出通过对人像图像进行预处理的方式来提高正负样本的差异性，以提高后期算法对人像表情的识别率。具体方法步骤如下:

1.图像规格处理。通过感光设备捕获的原始图像中，由于存在各种不确定因素的影响(如光照强度过少或过多)，会使得捕获图像中的表情细节变得模糊及难以识别。为了突出原始图像之间的细节差异并为后续处理提供较为统一的规格，首先需要对采集到的图像进行规格化处理，即统一成灰度基本一致的图像。这一过程会导致部分面部细节的丢失，因此需要加强并突出人像中的面部表情关键点及图像边缘的特征。Lin等人提出了式(1)所示的特征处理函数［5］，能够有效地对图像的总体灰度进行平衡，为后续处理步骤提供较为统一的操作前提。并且还能够有效突出人像中面部表情中的线状及点状特征。

其中，I为N×N大小的原始图像，I(i，j)表示原始图像中像素点(i，j)的灰度值，G为处理后的图像。

2.方向场处理。面部图像中的皮肤和五官在表情表达的时候会具有特定的方向性，这也是对面部表情进行识别的另一个主要参考因素，并且这些方向还具有真实、渐变等特点。对其进行提取的准确性将直接影响表情的识别效果。为此，国内外学者在方向场的计算提取上提出过很多种方法，其中由Mehtre提出的邻域方向模板法［6］是一种计算简单且效果较好的方法。本文采用改进的Mehtre方法如式(2)。

图1 5×5方向处理模板

计算点方向图，采用5×5的模板，如图1所示，以每π/8为一个计算方向，计算每个像素点在8个不同方向上的均值Aver［i］和方差 Var［i］。其中，Pdik为方向上的第k个像素的灰度值。

将计算得到的8个Aver［i］值分成4组，1和5一组，2和6一组，3和7一组，4和8一组;并计算每个组的Aver［i］值的绝对差值，并取方差值最大的方向。

3.面部图像2值化。为了突出图像中的表情特征信息，本文在Gabor函数［7］的基础上进行改进，并采用改进后的函数作为滤波变换算子对灰度图像进行2值化处理，为了能更好地突出原始图像中的特征信息，本文对Gabor算子进行了偶对称变换，如式(3)所示。

其中θ、f分别为函数滤波的方向和频率，人脸图像的特征纹线(面部皱纹)方向以水平方向为主，差值在±π/12之间，所以本文方法将方向θ和频率f均设置为0、δi、δj分别为沿X轴及Y轴方向上的高斯包络常数，其不同的取值会对处理后的图像产生不同的影响:取值越大其去噪的能力越强，但对图像细节的影响也随之变大。考虑到要保证在不同光照环境下获得的人像图像质量，这里将经方向场处理完成后图像的平均灰度值(Average Gray Value，AGV)作为 δi及 δj的参数。

图2 本文方法对人像图像处理的过程

图2中为对Sadness、Joy两类基本图像，采用本文3个处理步骤所得到的图像。因Gabor算子具有较强的消除图像中模糊及断点部分的能力，在保留原函数良好的频域选择和方向选择特性的同时，还能够在频域的不同尺度及方向上保留相关的特征信息，且还能较多地保留在时域与频域连接处的信息量。

三、对比及分析

1.正负样本对比。由于篇幅的关系，本文以左嘴角为例，如图3所示，对每张人脸图片以左嘴角为匹配中心点，割取16×16的嘴角样本作为正样本。再以左嘴角为中心，半径为16个像素的圆上随机选4个点作为中心点，割取16×16的样本作为负样本。

在图3中原始Sadness图像为S图;原始Joy图像为J图。经本文方法预处理后的Sadness图像为S＇图，Joy图像为J＇图。其中，对于处理后得到的2值化图像，为了能有效区分样本提取区域和2值化图像本身，对2值化图像做了80%灰度处理。

截取得到的样本图像如下图4所示，可以看出无论是对于正样本还是负样本而言，处理后的图像对于面部特征部分都更加充分的凸显，且对面部关键特征点的提取更加精确、有效。经过本文方法进行预处理后得到的样本图像可以使得面部识别率得到有效提升，并降低误判的几率。

2.常规面部识别算法的对比。Chang［8］等人提出了基于流形的表情分析方法(Manifold Based A-nalysis of Facial Expression，MBAF);Lee［9］等人提出了一种流形学习与张量分解相结合的表情识别算法(Facial Expression Analysis Using Nonlinear Decomposable Generative Models，NDGAF);Shan［10］等人提出了一种基于监督式保局投影(Supervised Locality Preserving Projections，SLPP)的表情识别方法。本文以上述三种算法作为对比算法，在Cohn－Kanade和JAFFE人脸库［11］上进行对比测试。使用上述三种标准算法分别对不经处理的面部图像和按本文提出方法进行预处理后的面部图像进行识别。

图3 对原始图像及处理图像的正负样本点的提取

图4 两种处理方法正/负样本的对比

通过表1可以看出无论是对Cohn－Kanade测试库还是JAFFE测试库，三种面部识别算法的识别率均有所提高，这也证明了本文方法的有效性。

四、结语

本文提出了一种对人类面部图像进行细节提取，并进行了方向场化突出，最后将其特征2值化的预处理的方法;有效地抑制了面部图像中提取的特征点样本模糊的现象。实验证明，通过本文方法对面部图像的预处理，能够较好地提升一般面部识别算法的识别率。

表1 Cohn－Kanade人脸库与JAFFE人脸库上的人脸和表情识别率

［1］Ekman P.Emotion in the Human Face.New York:Cambridge University Press，1982.

［2］胡步发，黄银成，陈炳兴.基于层次分析法语义知识的人脸表情识别新方法［J］.中国图象图形学报，2011，16(3):420－426.

［3］于真.基于支持向量机的人脸识别技术研究［J］.计算机仿真，2011，28(12):296 －299.

［4］党力，孔凡让.独立子空间下的草图人脸合成与识别［J］.中国科学技术大学学报，2012，42(1):60－66.

［5］Lin Hong，Wan Yi－ fei，Anil Jain.Finger print image enhancement algorithm and performance evaluation［J］.IEEE Transactions on Patten analysis and Machine intelligence 1998，20(8):777－789.

［6］赵磊，杨路明，吴建辉.指纹图像预处理新方法［J］.计算机应用2007，27(4):929－931.

［7］雷琳，王壮，粟毅.基于多尺度Gabor滤波器组的不变特征点提取新方法［J］.电子学报，2009，37(10):2314－2319.

［8］Chang Y，Hu CB，Turk M.Probabilistic expression analysis on manifolds.In:Proc.of the IEEE Computer Society Conf.on Computer Vision and Pattern Recognition(CVPR 2004)，Vol.2.2004.520 －527.

［9］Elgammal A，Lee CS.Separating style and content on a nonlinear manifold.In:Proc.of the IEEE Computer Society Conf.on Computer Vision and Pattern Recognition(CVPR 2004)，Vol.1.2004.478 －485.

［10］Shan CF，Gong SG，McOwan PW.Dynamic facial expression recognition using a Bayesian temporal manifold model.In:Proc.of the British Machine Vision Conf.(BMVC 2006)，Vol.1.2006.297 －306.

［11］续爽，贾云得.基于表情相似性的人脸表情流形［J］.软件学报，2009，20(8):2191 －2198.

An Effective Method to Increase the Recognition Rate of Facial－image Preprocessing

TAN Yang，HE Lu

Positioning and sampling of the facial feature points are directly related to the level of facial recognition rate.This paper proposes a new preprocessing method to extract details from human facial image，highlighted by line element field，and finally characterized by two values.It effectively suppresses the blurred sample of feature points in facial image extraction.The experiments show that this method of facial image preprocessing could enhance the recognition rate of the general face－recognition algorithms.

facial recognition;expression recognition;key point positioning;feature extraction

TP391.41

1009－5152(2012)03－0060－05

2012－07－02

谭阳(1979－ )，男，湖南网络工程职业学院讲师，工程师，计算数学硕士;贺璐(1982－ )，女，湖南网络工程职业学院讲师。