受限直方图均衡化的低频DCT系数重变换算法

2015-04-17魏锐，徐亮

实验室研究与探索 2015年5期

关键词：均衡化子集识别率

魏锐，徐亮

(黄淮学院信息工程学院，河南驻马店 463000)

受限直方图均衡化的低频DCT系数重变换算法

魏锐，徐亮

(黄淮学院信息工程学院，河南驻马店 463000)

针对现实人脸识别中由于光照、表情、姿态或其他物体引起的面部遮挡而严重影响识别率的问题，提出了受限直方图均衡化的低频DCT系数重变换算法。首先，将图像划分成多个互不重叠的局部小块，使用受限直方图均衡化对局部子块进行局部对比拉伸以实现去噪；然后，通过缩减适当数目的低频DCT系数来消除人脸图像中的光照变化；最后，利用核主成分分析进行特征提取，最近邻分类器完成最终的人脸识别。在ORL、扩展Yale B及1个户外人脸数据库上的实验验证了所提算法的有效性及鲁棒性，表明相比几种线性表示算法，本文算法在处理鲁棒人脸识别时取得了更高的识别率。

人脸识别；自适应直方图均衡化；低频离散余弦变换；系数重变换

0 引言

作为一种使用非常广泛的技术，人脸识别[1]吸引了很多学者的研究兴趣，它已经在执法、安全、选民验证和建筑区、门、汽车或网络访问等领域得到了广泛地应用。在约束环境下人脸识别系统的性能已经达到了一个令人满意的水平[2]，但其性能往往会因光照、表情、姿态、遮挡等条件的影响而大大降低[3]，因此，为自动人脸识别规范化这些变化是非常有必要的[4]。

学者们也提出了基于局部特征的方法，将人脸图像划分成几个局部块，独立处理每个块，最终基于所有块混合的分类结果进行决策[5]。例如，文献[6]中提出了基于鲁棒主成分分析的人脸子空间重构算法；文献[7]中提出基于低秩子空间恢复的联合稀疏表示算法；文献[8]中提出稀疏表示的重构算法；文献[9]中提出基于分类的协同表示，这类方法要求每个人有足够多的样本来形成探针图像(即查询人脸图像)，但实际的情况往往是脸部在受光照等影响，导致识别率低，因而这些方法在现实环境中并不总是可行的。也有学者首先将遮挡图像划分成子块，在子块中提取特征，然后基于每个成对块的相似度执行匹配过程，为了减小因遮挡块造成的匹配误差，通过训练产生不同的权重值分配给不同的块，例如，文献[10]中提出了一种局部匹配的人脸识别算法；文献[11]中提出部分相似性算法；然而，训练过程通常是数据依赖的。文献[12]表明，重新换算离散余弦变换(Discrete Cosine Transform, DCT)的低频系数在所有其他光度规范化技术中能得到的性能最佳。文献[13]中使用核函数可有效地计算高维特征空间的主成分。文献[14]中指出，线性判别分析(Linear Discriminant Analysis, LDA)方法旨在寻找类特定线性投影，目的是最大化投影图像类间散射矩阵与类内散射矩阵的比率，但是它需要的训练时间比主成分分析(Principal Component Analysis, PCA)多，因为它使用PCA作为预处理步骤。

在现有研究的基础上，为了提高降低光照变化对人脸识别的影响，更好地解决鲁棒人脸识别问题，提出了受限直方图均衡化的低频DCT系数重变换算法。它借助于DCT规范或补偿光照变化，使用核PCA(Kernel PCA, KPCA)提取高维特征向量，利用最近邻分类器完成人脸的识别。

1 系统设计

为了提高光照变化条件下人脸识别系统的识别率，提出人脸识别系统架构，如图1所示，其算法流程如下。

(1) 将训练图像和测试图像顺序地分割成一系列连续均匀且不重叠的8×8的子块，经过对比度受限自适应直方图均衡化(CLAHE)处理后，图像灰度差别增大，对比度增强，更多细节被分割出来，所含噪声也相应减少；

(2) 对每个经过CLAHE处理后的8×8的子块进行DCT，可相应地得到8×8的系数矩阵。然后，利用标准的亮度量化矩阵对每个系数进行均匀量化，得到量化后的系数矩阵。所得到的系数矩阵分为直流系数DC和交流系数AC两个部分，而从DCT可以看出，能量集中在少数的低频系数中，然后通过重新变换缩减低频DCT系数消除光照变化的影响；

(3) 得到规范化图像(即自由光照变化)后，使用KPCA提取图像特征，KPCA能提取高阶统计，其中核函数使用高斯核；

(4) 使用最近邻分类器对提取的特征进行分类、识别。

图1 本文所设计的系统架构

1.1 对比度受限自适应直方图均衡化

图像的直方图是指图像内的强度分布，直方图均衡化均匀调整图像的强度值，从而提高图像的全局对比度，这是非常有用的预处理步骤，能够给出增强的规范化图像，但是，图像内感兴趣的特征需要局部加强，所以要想规范化人脸图像，应该局部增强对比度。

于是，系统没有使用传统的直方图均衡化，而是使用CLAHE[15]，受限直方图均衡化在图像的小范围内操作，称为瓦片。该方法是对HE法的一种改进，结合了对比度受限和自适应直方图均衡化两项技术的优点，在增强图像对比度的同时能有效抑制噪声干扰，更好地突出图像细节，而且实现过程不复杂。因此，系统设计采用CLAHE技术增强图像的对比度。

CLAHE图像预处理主要实现步骤：

(1) 分块。将原始图像划分成M×N个连续均匀且不重叠的子区域；子区域越大，对比度增强效果越明显，但图像细节和边缘成分丢失越多。因此，本文采用8×8连续不重叠子区域较为合理。

(2) 计算每个子区域灰度直方图。每个直方图灰度级记为i，可能出现的灰度级数记为NGray，则每个子区域对应的直方图函数表示为H(i)，0≤i≤NGray-1。

(3) 对每个子区域进行灰度直方图“剪切”。将超出剪切限幅值的像素平均分布到其他灰度级中。

(4) 对每个子区域对比度受限后的灰度直方图进行均衡化处理。

(5) 获得每个子区域中心点，将这些点作为样本点。

(6) 对图像的每个像素使用下式进行灰度线性插值处理，得到新的灰度，

(1)

式中：

M(x,y)代表点(x,y)处灰度值；I--代表求值点左上方样本点x-的灰度值；同理，I-+,I+-,I++分别代表其他3个方位的样本点灰度值。

采用HE和CLAHE法的对比图如图2所示。

(a)原始图像(b)直方图均衡后的图像(c)对比度受限自适应直方图均衡化后的图像

图2 采用HE和CLAHE法的对比图

1.2 离散余弦变换

DCT中，用一系列的有限多个数据点来表示不同频率下余弦函数震荡总和，DCT有DCTⅠ、DCTⅡ、DCTⅢ和DCTⅣ四个类型，DCTⅡ大多数用在信号处理中，通常简称为DCT。2DM×NDCT定义如下：

(2)

式中：u=0,1,2,…,M-1；v=0,1,2,…,N-1，称为频域变换因子；C(u,v)为变换结果，也称为DCT系数；α(u)、α(v)分别定义为：

相应的2D离散余弦反变换(IDCT)由下式给出：

(3)

式中：x=0,1,2,…,M-1；y=0,1,2,…,N-1。

所设计的系统中，DCT应用在完整的人脸图像上，将其转换为人脸图像的频率成分，由于低频DCT与光照变化有关，所以光照变化通过缩减低频DCT系数来补偿，缩减的DCT系数数目和因子由实验得到。图3所示为不同数目的低频DCT系数重新变换的DCT规范化结果。

(a)原始图像(b)重新变换系数=20(c)重新变换系数=30(d)重新变换系数=27

图3 不同重变换系数的对比图

1.3 核主成分分析

特征提取是人脸识别系统的主要步骤，因为它能降低脸部图像的维度，最流行的特征提取技术是主成分分析(PCA)。但PCA技术的表示形式是基于图像集的第二次序统计，该方法不能表示图像集依赖的高阶统计，图像的高阶统计包括像素强度值的非线性关系，包含了识别的重要信息。本系统使用核主成分分析(KPCA)提取高阶统计，算法过程描述如下：

给定n个样本集xk，其中，xk=[xk1,xk2,…,xkn]T∈Rn。PCA旨在找到最大化方差的投影C，即从协方差矩阵中找到特征值，问题变成求解特征值：

(6)

式中：λ≥0是特征值；v∈Rn是特征向量。

KPCA中，输入空间的每个向量都通过非线性映射函数φ:Rn-Rf被投影到一个高维特征空间Rf中。

因此，KPCA的特征值计算如下：

(7)

vφ的所有λ≠0的解都位于φ(x1),…,φ(xn)范围内，存在系数αi，如：

(8)

定义N×N核矩阵K，由

(9)

将式(8)乘以φ(xj)，代入式(9)，得到：

(10)

该特征值问题的解可表示为更简单的特征值问题：

(11)

特征空间的投影由下式执行：

(12)

因此，不需要大量计算，使用核函数就能提取k个非线性主成分，选取高斯核函数：

因为它在许多模式分类应用中具有优越的性能。

1.4 最近邻分类

分类在任何人脸识别系统中都是非常关键的一步，k-最近邻分类器是最简单、使用最广泛的非参数化分类器，基于特征空间最接近训练实例对对象进行分类。特征提取完成后，本系统计算测试样本特征与每个训练样本特征之间的欧氏距离，然后利用最近邻分类器完成最终的分类、识别。

2 实验结果与分析

实验使用Matlab 7.0在个人计算机上实现，计算机配置为：Windows XP操作系统、迅驰酷睿2处理器、2.53 GHz主频、4 GB RAM。

在公开数据库ORL标准人脸库、扩展Yale B及一个户外人脸数据库[15]上进行了大量的实验。在ORL人脸数据库针对本文算法选取不同的DCT系数数量对人脸识别率和识别速度的影响。使用扩展Yale B数据库测试本文算法对光照变化的鲁棒性。户外人脸数据库包含大街上光照不受控制的陌生人脸图像的正面照，遮挡源包括眼镜、帽子、头发和放在脸上的手，除了遮挡，这些图像也包含表情变化和姿势变化。

2.1 重变换DCT系数

实验在ORL人脸库上进行，ORL人脸库包括400幅人脸图像，共有40个人，其中包含了每个人在不同时间、不同光照、不同头部角度、不同面部表情和不同人脸细节条件下的10幅人脸图像。每幅图像灰度级为256，分辨率均为112×92像素。实验比较了选择不同的DCT系数对本文算法性能的影响，包括识别的精度和识别的速度(整个算法平均耗时)，重新调节DCT系数分别取7、13、19、27、37、47。图4给出了不同的系数对识别精度和识别速度的影响曲线。由图4可以看出，随着DCT系数数量的增加，识别精度呈上升趋势，但是当系数数量增加到一定程度时，曲线呈现平缓趋势，进一步增加系数不再对识别率的提升发挥显著作用，说明删除的系数对图像重建和人脸识别的影响已经微乎其微了。而随着系数递增对识别时间影响是很大的，选择的系数越多，计算的时间开销越大，系统的识别时间越长。所以实验也证明了要获得较理想的识别率和识别速度可以通过选择合适的DCT系数数目来实现。

本文算法是基于在系统达到较理想识别率的同时尽可能提升算法识别速度满足人脸识别实时性要求来确定合适的DCT系数数量，通过分析图4不同的系数数目对识别率和识别速度影响曲线，本文使用27个DCT系数取得的识别效果最佳，所使用DCT系数的数量与所取得的识别率并不成正比，使用太多的DCT系数并不一定能取得最好识别率，反而增加了运算时间开销。故以下实验中，重变换DCT系数数量取为27。

图4 不同的系数数目对识别精度和识别速度的影响曲线

2.2 规范化分析

扩展的Yale B数据库[3]包含38个对象在64种不同光照条件下的图像，每个对象在不同光照条件下有5个子集，子集1包含每个人的7幅图像，子集2～5分别包含每人12、12、14、19幅图像，子集数目越大，光照变化就越明显。实验将所有的图像统一剪裁为64×64大小，如图5所示为扩展的Yale B人脸数据库上剪裁后的人脸图像示例。

图5 扩展的Yale B数据库裁剪后人脸图像示例

实验中，子集1用于训练，因为它接近于正面光照，子集2～5用于测试，DCT系数数目设置为27，KPCA的主成分数设置为50，高斯核函数k(x,y)参数设置为γ=2(n-20)/2.5γ0，n=0,1,…,20，其中，γ0是训练集的标准差。除了对本文算法进行测试外，还对3种技术进行了实验，分别为不进行任何光照规范化、仅使用直方图均衡、使用重新调节低频DCT系数与直方图均衡化，表1所示为几种规范化技术在扩展Yale B数据库上的识别结果。

从表1可以看出，没有进行任何规范化时，对子集5的识别率为6.509 7%，这是非常低的，由此也能看出对这个测试集的识别实际上是很困难的。通过使用IN技术，如直方图均衡化，识别率提高至38.080 3%，这个识别率也是具有挑战性的。通过使用有HE的重新变换低频DCT系数，识别率提高为94.763 2%，表明该方法有巨大的改善能力。通过使用所提的CLAHE结合DCT对光照规范化，子集5的识别率可高达98.160 9%，这个识别率已经非常高了。

表1 不同光照规范化技术的识别率 %

所提出的规范化技术对子集2、3给出了最佳的100%的识别率，对子集4的识别率为97.556 4%，通过使用CLAHE结合DCT，将子集5的识别率从6.509 7%提高至98.160 9%，这是显著的改进，表明了本文算法的有效性。

2.3 光照变化人脸识别

为了体现本文算法的优越性，将本文算法的识别率与其他几种算法进行了对比，包括对数转换[2]、伽马射线强度校正[4]、同态过滤[8]、单尺度Retinex[7]、小波规范化[9]、小波去噪[10]。实验仍然以子集1作为训练集，剩下的子集2～5用于测试，识别结果如表2所示。

表2 各算法在扩展Yale B上的识别率比较 %

从表2可以看出，在所有的子集上，本文算法的识别率均高于其他所有比较算法，各算法在子集2、3上的识别率均很高，故不能明显体现出本文算法的优越性；在识别非常困难的子集4、5上，本文算法的识别率仍然保持在97%、98%以上；而对数转换、伽马射线强度校正、同态过滤的识别率却以降至50%以下，甚至低至31.6150%。由此可以体现本文算法在识别率方面的可靠性以及对光照变化的鲁棒性。

2.4 户外人脸识别

最后，在实际条件下采集的人脸数据库上测试本文算法。实验选择包含55个对象的一个图像集，如图6所示为户外人脸图像示例。对于每个对象，分别选择K=1,3,5,8幅未遮挡的图像作为训练集，有不同遮挡类型的110幅图像用于测试，每个训练集与探针集均不相交。从每幅图像的背景中裁剪出人脸区域，调整大小为64×64。识别结果如表3所示，不同于先前在室内条件下采集到的测试图像，这些图像是在完全不受约束的现实环境中采集到的。

图6 户外人脸数据库中的图像示例

从表3可以看出，由于自然遮挡的挑战，所有算法的整体识别率相对较低，但相比其他几种算法，本文算法仍能获得最好的识别性能，由此可见其可靠性及强鲁棒性。

2.5 性能比较

仅识别率高于其他算法还不足以说明本文算法的优越性。因此，实验记录了各算法的运行时间，包括训练总完成时间、测试一张图像的时间，记录结果如表4所示。

表4 各算法在扩展Yale B上的运行时间比较 s

从表4可以看出，本文算法的训练总完成时间仅高于小波规范化0.013 2 s，比其他几种比较算法耗时都少很多，测试一张图像所用时间仅有2.894 1 s，明显低于其他各个算法，由此体现了本文算法的优越性。

3 结语

为了改善“恶劣”条件下人脸识别正确率，提高算法的鲁棒性，本文提出了基于受限直方图均衡化的低频DCT系数重变换算法。该项研究使用CLAHE技术代替HE进行对比拉伸，即在较小的称作瓦片的区域上操作来代替在整个人脸图像上操作。然后通过重新变换缩减低频DCT系数消除光照变化，使用核PCA来提取图像的高阶统计，并利用最近邻分类器分类。对识别非常困难的扩展Yale B子集5给出了高达98.160 9%的最佳识别率，通过与其他几种较为先进算法的比较，表明了本文算法的有效性及优越性。

未来会将本文算法运用到其他的人脸数据集上，结合其他先进的技术，进行大量的实验，在提高识别率的同时，进一步降低算法的运行时间，以更好地运用于实时鲁棒人脸识别系统。

[1] 苏煜, 山世光, 陈熙霖, 等. 基于全局和局部特征集成的人脸识别[J]. 软件学报, 2010, 21(8): 1849-1862.

[2] 田玉敏, 云艳娥, 马天骏. 判别近邻保持嵌入人脸识别[J]. 西安电子科技大学学报, 2011, 38(3): 24-28.

[3] 李晓莉, 达飞鹏. 基于排除算法的快速三维人脸识别方法[J]. 自动化学报, 2010, 36(1): 153-158.

[4] 李晓莉, 达飞鹏. 基于侧面轮廓线和刚性区域的3维人脸识别[J]. 中国图象图形学报, 2010, 15(2): 266-273.

[5] 尹洪涛, 付平, 沙学军. 基于DCT和线性判别分析的人脸识别[J]. 电子学报, 2009, 37(10): 2211-2214.

[6] 葛微, 李桂菊, 程宇奇, 等. 利用改进的Retinex进行人脸图像光照处理[J]. 光学精密工程, 2010, 18(4): 1011-1020.

[7] 孙劲光, 李扬, 孟祥福, 等. 改进的单尺度Retinex及其在人脸识别中的应用[J]. 计算机应用研究, 2011, 28(12): 4790-4793.

[8] 焦竹青, 徐保国. 基于同态滤波的彩色图像光照补偿方法[J]. 光电子. 激光, 2010, 21(4): 602-605.

[9] Zhang T, Fang B, Yuan Y,etal. Multiscale facial structure representation for face recognition under varying illumination [J]. Pattern Recognition, 2009, 42(2): 251-258.

[10] Li Y, Meng L, Feng J. Lighting Coefficients Transfer Based Face Illumination Normalization [M]. Pattern Recognition. Springer Berlin Heidelberg, 2012: 268-275.

[11] 李建科, 赵保军, 张辉, 等. DCT和LBP特征融合的人脸识别[J]. 北京理工大学学报, 2010, 30(11): 1355-1359.

[12] P Vishwakarma V, Pandey S, Gupta M N. An illumination invariant accurate face recognition with down scaling of DCT coefficients [J]. Journal of Computing and Information Technology, 2010, 18(1): 53-67.

[13] 卢桂馥, 林忠, 金忠. 基于核化图嵌入的最佳鉴别分析与人脸识别[J]. 软件学报, 2011, 22(7): 1561-1570.

[14] 邹建法, 王国胤, 龚勋. 基于增强Gabor特征和直接分步线性判别分析的人脸识别[J]. 模式识别与人工智能, 2010, 23(4): 477-482.

[15] Celik T, Tjahjadi T. Automatic image equalization and contrast enhancement using Gaussian mixture modeling [J]. Image Processing, IEEE Transactions on, 2012, 21(1): 145-156.

Low Frequency DCT Coefficients Retransformed Algorithm of Contrast Limited Adaptive Histogram Equalization

WEIRui,XULiang

(College of Information Engineering, Huanghuai University, Zhumadian 463000, China)

In view of the reality in face recognition due to illumination, expression, pose or other objects caused by facial shade seriously affects the recognition rate of the problem, this paper puts forward a method for some heavy low frequencies by using discrete cosine transform (DCT) coefficients retransformed algorithm of contrast limited adaptive histogram equalization. Firstly, the image is divided into several non-overlapping locally small blocks, and denoising is achieved by using the contrast limited adaptive histogram equalization about local sub-block for local contrast stretching; Secondly, using the appropriate number of low frequency DCT coefficients eliminates the illumination change in face image; Finally, by using kernel principal component analysis for feature extraction, the nearest neighbor classifier completes the final face recognition. By ORL, extended Yale B and an outdoor experiment on face database the effectiveness of the proposed algorithm and robustness is verified. The experimental results show that compared with several kinds of linear algorithm, this algorithm in dealing with a robust face recognition has achieved higher recognition rate.

face recognition; adaptive Histogram equalization; low frequency discrete cosine transform; coefficients retransformed

2014-07-14

国家科技支撑计划项目(2012BAH12B01)；河南省教育厅重点科技攻关项目(13A520786)

魏锐(1979-)，男，河南驻马店人，硕士，讲师，主要研究方向：计算机应用、数字图像处理。

Tel.:13525316658；E-mail:edaqq@sina.com

TP 391

1006-7167(2015)05-0016-05