APP下载

基于小波分析和复矩阵稀疏表示的人脸识别方法

2021-04-08曹玉涛吴爱弟

天津职业技术师范大学学报 2021年1期
关键词:子带分块识别率

曹玉涛,吴爱弟

(天津职业技术师范大学理学院,天津 300222)

人脸识别研究可以追溯到20 世纪六七十年代,经过几十年的发展已日趋成熟。人脸识别技术的发展分为3 个阶段:第1 阶段为简单背景中的人脸识别;第2 阶段为人机交互中的人脸识别;第3 阶段为机器自动识别。小波分析具有很好的局部化特征,在图像处理和人脸识别方面应用广泛。文献[1-2]仅对低频成分提取特征进行人脸识别,由于缺少高频成分,往往识别效果不佳;文献[3]验证了尽管高频子带不像低频子带那样包含较多的信息,但也包含反应脸部细节的边缘及轮廓的重要信息。因此,对于高频特征(包含信息较少)只需提取主要特征,采用分块的方式选取出信息较多的子块。

人脸图像特征可以细分为全局和局部2 种特征。全局特征主要是体现图像的整体轮廓,包含图像的大多数信息,而局部特征则是对整体特征的一个补充,注重于细节部分。全局特征方法如PCA(principal components analysis)[4-5]、LDA(linear discriminant analysis)[6-7]和LPP(linear performance pricing)[8]等广泛应用于人脸识别,图像的局部特征提取可以通过分块子图像方法[9-11]实现。全局特征和局部特征所描述的内容和作用各不相同,基于全局特征的方法往往缺乏对人脸光照、表情等细节的描述;而单纯基于局部特征的方法又忽略了局部特征间的联系,从而损失了部分全局特征。本文提出一种高频子带和低频子带融合为复矩阵的人脸识别方法,不仅能体现整体特征与局部特征的不同优势,避免简单地融合为列向量,以及因维数灾难导致的识别效果不佳,而且还能进一步提高识别率。

1 人脸识别的相关理论

1.1 小波原理

令 L2(R)表示平方可积函数空间,函数 f∈L2(R)的一维连续小波变换定义为

对 a 和b 进行离散,令a=2n且b=2nk,该过程即为离散小波变换。经过1 层小波变换和2 层小波变换的图像分别如图1 和图2 所示。

图1 1 层小波分解图像

图2 2 层小波分解图像

1.2 稀疏表示

设 X 是 M × N 的矩阵,X 中的绝大多数元素非0。稀疏表示[12-13]的含义为:用K×N 的系数矩阵A 以及M×K 字典矩阵B,使X 尽可能地表示为B×A 的线性组合,且A 中尽可能多的元素为0。A 便是X 的稀疏表示。设 A=[a1,a2,…,aN],X=[x1,x2,…,xN],则利用l1范数最小化问题可以求得稀疏系数

也可以使用l2范数最小化问题

式(3)为最小化二乘问题,其解

1.3 加权顺序字典更新

式(2)只求解稀疏系数,字典没有同步更新。而稀疏表示的效果关键在于字典的选择,对字典的更新可以得到更好的稀疏表示,从而提高人脸的识别率。加权顺序字典更新[14]模型为

式中:残差矩阵M=X-BA;M 的协方差对角线元素构成对角矩阵的逆矩阵为Rm×m;tr 为矩阵迹的运算符。

权重矩阵R 能够对上述残差矩阵M 的不同方差给予不同大小的权重值。采取交替优化的方法可以求解约束ai的l0的解。

可采用凸松弛的方法,实现稀疏系数的求解,此时字典不更新,采用l1范数最小化方法求解稀疏系数

实验中采用OMP 方法[15]解决上述稀疏系数求解问题。在字典更新阶段,顺序更新第k 个字典bk和稀疏矩阵A 的第k 行使用交替最小二乘法近似得到的的1 级矩阵,从而获得不同于SVD 分解字典更新的方法。其优化问题可表述为

利用惩罚回归方法可以求解上式的优化问题。固定 bk且‖bk‖2=1,可以通过式(5)最小化求得的值

其中,v 是属于RN的全为1 的行向量。由于R 的加权作用,因此就产生了不同的新的更新规使R 中较大方差的相关项权重系数降低,该相关项有更大的可能缩减为0。随后保持不变,式(6)的最小化bk为

1.4 基于复矩阵的主成分分析

设A 和B 分别为M×N 的矩阵,定义复矩阵C=A+Bi,Cj是C 的列向量。将复矩阵的协方差矩阵定义为其中为 C 的均值,并且(GC)H=GC(H 为共轭转置),GC是埃尔米特矩阵。埃尔米特矩阵的所有特征值均为实数,因此GC的特征值能够确定变换轴,将特征值降序排列,可以根据前若干个特征值对应的特征向量决定变换轴。设定Y1,Y2,…,Yd前d 个最大特征值对应的特征向量为变换轴,则对样本Cj变换后的结果为Rj=CjY,Y=[Y1,Y2,…,Yd]。

2 基于复矩阵的人脸识别

首先,对测试样本和训练样本依次进行2 层小波分解,并提取第 2 层 HH,HL,LH 和 LL 共 4 部分,对得到的3 个高频子带分别做分块处理,依次选取信息量多的若干子块,组成新的高频子带,将新的高频子带与未处理的低频子带组合为1 个复矩阵。然后,应用复矩阵的主成分分析进行降维,应用加权顺序字典更新方法对字典进行更新。最后,根据得到的稀疏表示进行分类,算法流程如图3 所示。

图3 算法流程图

具体步骤如下:

(1)对测试样本和训练样本做2 层小波分解,并提取第 2 层 HH、HL、LH 和 LL 4 部分。

(2)LL 不做处理,依次将 HH、HL、LH 做分块处理,依次计算每一个子块的能量值,根据能量值进行降序排列,然后依次选出HH、LH、LH 中排序靠前的若干块,选出的块组成1 个新的高频子带gH。

(3)把gH 和LL 融合为1 个复矩阵。

Fw= α*LL+(1- α)*gHi

(4)先对Fw 降维处理,得到降维后的特征向量Fw。

(5)将Fw 利用加权顺序字典更新方法进行更新。

已知:初始化字典B=Fw,参数ρ 和迭代次数τ。

①通过误差矩阵计算R 矩阵,并由式(6)得到稀疏系数矩阵A。

② 对于字典 B 的每一列 bk,k=1,2,…,K。

(6)利用稀疏分类算法,给出分类结果。

3 仿真结果与分析

本文在ORL 和AR 人脸图像数据库中验证算法的可行性。ORL 人脸图像数据库包含40 个人的数据信息,根据面部表情、光照情况以及脸部遮挡物等不同条件,每人收集10 张照片,本文选取200 张灰度图像,包含10 人的数据信息,将每个人的人脸图像分为两部分,选取5 张作测试集,其他5 张作训练集。AR人脸图像数据库包含126 人的数据信息,约有4 000张人脸图像,每个人根据面部表情、光照以及脸部遮挡物等不同条件收集26 张照片,本文选取260 张灰度图像,包含10 人的数据信息,将每个人的人脸图像分为两部分,13 张作测试图像,13 张作训练图像。在ORL 人脸图像数据库中,采用的分块数为9,组合为Fw=0.22*LL+0.78*gHi;在AR 人脸图像数据库中,采用的分块数为12,组合为Fw=0.26*LL+0.74*gHi。权重系数由多次实验确定。

3.1 样本数不变,不同算法识别率

利用低频部分进行识别的算法记为f1,将高频和低频直接合为列向量进行识别的算法记为f2,本文提出的算法记为f3,同时也与传统的PCA[16]、PCA+LDA[17]方法进行比较。ORL 和AR 人脸图像数据库中不同算法下的识别率如表1 所示。

3.2 改变样本数,不同算法的识别率

图4 和图5 分别给出了本文提出的算法与传统方法的比较结果。从图4 和图5 中可以看出,本文算法具有明显的优势,尤其在样本数增加的情况下。

表1 ORL 和AR 人脸图像数据库中不同算法下的识别率

图4 ORL 人脸图像数据库中不同算法的识别率

图5 AR 人脸图像数据库中不同算法的识别率

3.3 改变分块数,不同算法的识别率

图6 和图7 为改变分块数时2 种算法的识别率。从图6 和图7 中可看出,ORL 人脸图像数据库中,分块数为9 时算法识别率较佳;AR 人脸图像数据库中,分块数为12 时算法的识别率较佳。

图6 ORL 人脸图像数据库中不同算法的识别率

图7 AR 人脸图像数据库中不同算法的识别率

4 结 语

本文对传统的人脸识别方法进行了改进,传统的人脸识别方法一般都只是单独利用全局信息或者局部信息进行人脸识别,不能将全局信息和局部信息融合为一个整体进行人脸识别,而本文提出的基于小波分析的人脸识别方法,既能充分利用高频信息(局部信息)和低频信息(整体信息),又能避免将高频和低频简单融合为列向量,因维数过高导致识别效果不佳的问题。因此,本算法对于提高识别率效果显著,但是融合系数的确定为手动填入,如何自动确定融合系数将是今后研究的重点。

猜你喜欢

子带分块识别率
面向量化分块压缩感知的区域层次化预测编码
超高分辨率星载SAR系统多子带信号处理技术研究
钢结构工程分块滑移安装施工方法探讨
一种基于奇偶判断WPT的多音干扰抑制方法*
关于4×4分块矩阵的逆矩阵*
子带编码在图像压缩编码中的应用
分块矩阵初等变换的妙用
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
高分辨率机载SAR多子带合成误差补偿方法
档案数字化过程中OCR技术的应用分析