基于深度学习与二维离散小波分解特征相融合的adaboost人脸识别模型

2020-03-23黄健

软件工程 2020年2期

黄健

摘要：为了提高人脸识别的效率，本文提出了一种将小波分析、深度学习和adaboost分类器相结合的人脸识别方法。传统的基于小波变换的人脸识别算法仅仅提取了小波分解的低频分量用于分类图像的特征，为了更有效地提取人脸图像特征，提出了一种将传统特征和深度特征相融合的人脸识别算法。首先，通过二维离散小波变换函数对人脸图像进行二维离散小波变换，提取出人脸图像的低频部分作为特征值，接着通过深度残差网络提取人脸深度特征，最后将融合后的特征应用adaboost分类器进行分类识别。通过在ORL人脸库实验证明，融合后的方法能有效地提高分类识别率。

关键词：小波变换;人脸识别;残差网络;Adaboost分类

中图分类号：TP393 文献标识码：A

1 引言（Introduction）

人脸图像的特征提取是进行人脸识别的首要前提[1]。目前的一些识别方法大多数是基于K均值、神经网络、支持向量机和线性鉴别的方法[2-4]。文献[5]设计了三种基于BP神经网络的人脸分类识别方法，即通过最大分量值辨别法、门限阈值归类法和中心区域分类法对待辨识数据进行特征归类和人脸识别。Chien等人[6]最早提出了应用二维离散小波变换对人脸图像进行特征提取，通过对图像进行多尺度分解，将提取到的低频分量作为图像特征，然后进行分类识别。在2015年，He K M等人[7]提出的新的神经网络结构，改变了深度学习的发展方向，其中包含的残差单元有效地解决了网络由于过深而出现的退化问题。

本文分别用二维离散小波变换提取人脸图像的低频特征和深度残差网络提取出的深度特征作为输入，将提取的人脸特征分别放入adaboost分类器中进行特征分类。由于传统特征的每个区域会有独立的特征表达，而深度特征只有唯一的一个针对整体区域的特征，这样会造成特征在数量上和维度上都存在很大差异。同时为了能够使传统特征完整地实现有效区域判断操作，该算法最终将深度特征和传统特征进行融合操作。

2 人脸图像的特征提取（Feature extraction of face image）

2.1 二维离散小波提取特征

小波可以简单地描述为一种函数，这种函数在有限时间范围内变化，并且平均值为0。同时，小波变换还具有变化的频率，持续时间也是有限的，同时具备多分辨率和多尺度分析的优点。

二维图像小波分解，就是竖直和水平的高通和低通算子先后作用于图像的行和列的过程。假设给定平方可和二维离散图像，令，。

则二维图像小波分解递推公式1为：

其中，是图像的低频成分，而D1、D2、D3是图像在LH、HL、HH三个方向上的高频成分。我们采用多尺度二维小波变换来提取面部特征。使用二维小波变换，我们通过相对于列向量和阵列像素的行向量的高通和低通滤波将图像数据分解为四个子图像。它是一维小波变换的扩展技术，其中沿垂直方向进行分解，然后是水平方向。图1中展示了二维小波分解的基本元素，其中G和H分别代表高通和低通滤波器，↓2表示为子采样。

在一个2D滤波器组中，我们在原始图像阵列的列向量中采用一维小波变换，图像被分解成对应于高通频带和低通频带的子图像。假设原始图像是由像素组成的矩阵，得到的子图像和变为的矩阵。在第二阶段，我们沿行向量方向分解图像和，又将上一层的高频、低频子带生成、、子带，所有的子图像都变成像素大小的矩阵。如图2所示，为我们展示一层分解后的各分量和二层分解后的图像。我们将经过二次小波分解后的低频分量作为最终的人脸特征向量。

2.2 改进后的深度残差网络

越深的网络效果越好，但是随着网络层数的增加，存在的问题也随之而来：首先是梯度的消失和发散，导致了训练难以收敛。

我们在研究过程中同样构建了ResNet深度残差网络并在其基础上进行了改进，与传统的深度网络相比，通过深度残差网络结构，如图3所示，并加入了y=x（恒等映射层），这样可以使得随着网络层数的加深并不会出现梯度消失的现象，同时具有良好的收敛效果。由于我们所选用的样本数量较小，较深的网络层次，反而会导致精度下降，因此我们通过叠加14个卷积层，构建一个ResNet-14网络模型。

首先在第一层卷积选取上，我们使用大小为5×5的卷积核，设置其步长为1，Padding的大小同样也为1，这样可使得卷积的输入与输出能够具有相同的特征图，接着再进行平均池化。为了减小特征图的大小，简化网络计算复杂度，选择2×2的滤波器，步长为2，输入第一个残差单元。

我们提出的深度残差网络模型包含6个残差单元，并且每个残差单元使用相同的结构，也不改变每个残差单元输入与输出的尺寸大小。首先使用BN算法對每次输出的数据进行标准化处理，这样可使有效参数稳定网络收敛，防止深度网络过拟合。为了增加神经网络各层次之间的非线性关系，我们使用Relu激活函数对经过BN算法处理后的数据进行激活，通过Relu实现稀疏后的模型能够更好地挖掘数据特征，拟合训练数据。接着再将激活后的数据输入到下一个卷积层中，为确保具有相同的输入输出，我们只改变卷积核的大小为3×3，步长和Padding仍为1;同上，继续使用BN算法和Relu函数对数据进行操作，输入到第二个卷积层，相关参数不改变;最后将第二个卷积的输出与残差元的输入通过矩阵相加运算作为下一个残差单元的输入，最终实现深度残差网络中核心思想，将需要学习的特征映射转换为F（x）+x。

在通过六个残差单元后，紧接着连接一个均值下采样层，最后再连接一个全连接层作为输出。其中各层次的参数如表1所示，通过各层次滤波器的不同组合，对输入的人脸图像进行特征学习，最终输出人脸深度特征。

2.3 Adaboost分类器原理

Adaboost算法[8]是一种分类器算法，其基本思想是通过一定的方法将大量分类能力一般的简单分类器叠加起来，经过层层叠加得到一个分类能力很强的强分类器。理论研究表明，当每个简单分类器的分类能力比随机猜测要好时，只要简单分类器个数趋于无穷时，那么强分类器的错误率将趋于零。算法流程图如图4所示，一个弱分类器由特征、阈值，以及偏置位（指明了不等式方向的量）组成，将一个个弱分类器经过T次迭代获得T个最佳分类器再组合成一个强分类器，最后将预测函数做为最后的分类函数来判断是否是同一人的人脸图像。

3 算法实现（Algorithm implementation）

在利用传统二维离散小波进行特征提取时，我们只选取了二维分解后的低频子图作为最后的特征，而舍弃了高频子图、和。又因为传统特征的每个区域都有其独立的特征表达，所以这种直接舍弃高频子图，只选取低频子图的分类识别方法存在明显不足。考虑到深度特征具有唯一的一个针对整体区域的特征，但是其容易造成数量和维度上的差异。基于此，我们想到将这两种特征进行分类识别后进行信息融合。本算法的流程图可大致如图5所示。

算法的具体实现步骤如下：

（1）根据公式（1）对处理后（人脸库）的人脸图像进行二维离散小波变换。

（2）提取步骤（1）小波分解后的四个分量并只选取低频分量拉平输出。

（3）利用改进后的深度残差模型进行深度特征提取。

（4）将提取到的传统特征和深度特征作为人脸图像的特征并将所有样本分为训练集和测试集，选择合适的分类参数，训练得到adaboos分类模型。再把测试样本提供给分类器，由adaboost给出最终识别结果。

（5）由于传统方法和深度学习方法有各自的优缺点，我们再进行决策层的融合，通过加权平均的方法如公式（2）所示，对分类后的一列概率进行取均，这样可以取长补短，有些预测错误的分类进行取均后可以被判断正确，预测出概率最大的一列向量作为我们最后的实验结果。

4 实验结果与分析（Experimental results and analysis）

本次实验采用的是ORL人脸数据库，该人脸库中共有40个不同年龄、不同性别和种族的人，并且每人各十幅角度、表情各不相同的人脸图像，每幅图像的大小为112*92，共计400幅灰度图像，部分人脸图像如图6所示。我们选取每个人的前n张图像作为测试集，剩余的10-n张图像作为训练集，则最终的测试集由40*n张图像构成，训练集图像则为40*（10-n）张。

因此，我们要设计出9组比较实验，分别记录下测试集为n时，所对应的分类识别率，另外我们还设置了随机参数i，对输入的图片进行随机分割，以选择出最佳的分割效果，提升准确率。经过多次实验比较，可取到一个合适的参数i来提升实验的准确率。为验证该算法分类模型的可行性，分别在不同的分类器下进行分类识别实验，实验结果如图7所示。

可以清晰地看到在Adaboost分类模型下，将基模型的决策树模型换成逻辑回归具有较好的识别率。

在方法可行性上，本实验通过与文献[9]基于改进的深度卷积网络算法相比，在精确度上有所提高;与文献[10]同样在二维离散小波基础上进行改进的方法相比，在准确率上略有增长。最终实验结果如表2所示。

由表2可以看出，随着测试样本的增多，训练样本的减少，准确率也在逐渐地下降。由于我们所选取的人脸样本集相对来说比较小，深度学习的方法体现不出其强大的优势，但同传统方法相融合，在分类识别上还是能有效提高准确率。

5 结论（Conclusion）

现如今基于传统方法的人脸识别在准确率上已经很难继续提升，越来越多的学者将研究方向转移到深度学习上，本文将传统方法和深度学习方法相融合，取最后的加权平均后的结果作为最终的结果，实验证明该方法具有识别率高的优点，该方法只在静态的人脸上进行了实验，如何在动态人脸或者增加样本数量以进行有效识别，是今后研究的方向。

参考文献（References）

[1] LI W，LIU L，GONG W.Multi-object uniform design as a SVM model selection tool for face recognition[J].Expert Systems with Application，2011，38（6）：6689-6695.

[2] 姜文涛，刘万军，袁妲.一种基于曲量场空间的人脸识别算法[J].计算机学报，2012，8（35）：1740-1750.

[3] FU L，LIN Z，ZHONG J.Face recognition using discriminant locality preserving projections based on maximum margin criterion[J].Pattern Recognition，2010，43（14）：3572-3579.

[4] 胡峰松，张茂军，邹北骥，等.基于 HMM 的单样本可变光照、姿态人脸识别[J].计算机学报，2009，7（32）：1424-1433.

[5] 温洲，邵晓巍，龚德仁.基于BP神经网络的人脸识别后续分类算法[J].计算机应用，2011，31（2）：133-136.

[6] Chien J T，Wu C C.Discriminant waveletfaces and nearest feature classifiers for face recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence，2002，24（12）：1644-1649.

[7] He K，Zhang X，Ren S，et al. Deep Residual Learning for Image Recognition[C].The IEEE Conference on Computer Vision and Pattern Recognition （CVPR），2016：770-778.

[8] Viola P，Jones M.Fast and Robust Classification using Asymmetric AdaBoost and a Detector Cascade[J].Advances in neural information processing systems，2002（14）：1311-1318.

[9] 龍海强，谭台哲.基于深度卷积网络算法的人脸识别方法研究[J].计算机仿真，2017，34（1）：322-325.

[10] 陈霖，蒋念平.基于离散小波变换和主成分的人脸识别[J].信息技术，2017，37（6）：155-158.

作者简介：

黄健（1996-），男，硕士，工程师.研究领域：图形图像处理，机器学习.