APP下载

基于深度信念网络和多任务学习的人脸识别

2016-07-23李鑫张俊

电脑知识与技术 2016年17期
关键词:人脸识别

李鑫++张俊

摘 要:针对如何提高人脸识别率的问题,该文引入多任务学习机制,通过在深度信念网络中构建多任务分类器。利用多个相关任务的并行处理能够使分类器从输入端获得更多信息,来提高分类器的分类能力。并可以通过多个相关任务权值竞争,减小过拟合对分类器的影响。实验结果表明,利用深度信念网络构造多任务学习分类器,相对于单任务学习而言,多任务学习机制能够有效提高人脸识别精度。

关键词:深度信念网络;多任务学习;人脸识别

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2016)17-0165-04

Abstract:Aiming at improving face recognition rate, this paper introduces multi-task learning mechanism, constructing multi-task learning classification in output layer of deep belief network. Related tasks using multiple parallel processing enables the classifier to get more information from the input terminal, to improve the ability of classifier. And through multiple related tasks weight competition ,the impact of over-fitting classifier is reduced. Experimental results show that the deep belief network learning classifier constructed multi-task, with respect to single-task learning, the multi-task learning mechanism can effectively improve the recognition accuracy.

Key words:deep belief network; multi-task learning; face recognition

如今人脸识别技术在生活中扮演着越来越重要的角色,人脸识别技术被广泛应用于各类智能系统,如图片自动归档系统、身份验证系统等。人脸识别也成为机器学习领域中的一个研究热点。

深度信念网络(Deep Belief Network, DBN)作为一种特殊的人工神经网络其具有良好的特征提取能力,它通过无监督的预训练和有监督的微调获得较好的网络权值,逐层地对特征进行抽取,进而获得较好特征。文献[1]利用了DBN优异的特征表示能力,在图像识别问题中得到了较好的识别率。

多任务学习是一种打破传统研究观念的研究方法,利用在多个相关任务并行处理过程中权值共享可以提高系统的泛化能力特性,进而可以解决因样本相对不足而造成的分类器泛化能力不强的问题。在神经网络中引入多任务学习机制,可以利用多个相关任务的权值共享来减弱过拟合对神经网络的影响。文献[2]将深度信念网络与多任务学习结合用于表情识别获得了较好的效果。文献[3]提出了一种基于多任务学习的人脸方法也获得了较好的识别效果,提高了图像识别的精度,文献[4,5]将多任务学习应用在图像分类中,文献[6,7]将多任务学习与神经网络结合应用于分类问题都取得不错的效果。

针对如何提高人脸识别率的问题,本文利用深度信念网络提取图像特征并在DBN输出层构建有监督多任务学习分类器对人脸图像进行识别,提高了人脸识别的精度。

1 深度信念网络与多任务学习

1.1 RBM受限玻尔兹曼机

受限玻尔兹曼机(Restricted Boltzmann Machine, RBM)为两层随机网络结构,RBM的两层分别为可视层(v层)与隐含层(h层),可视层与隐含层之间的连接为全连接,隐含层与可视层层内均无连接,v层偏置为b, h层偏置为c,其结构示意图如图1所示。

Roux等人证明了只要h层节点足够多,RBM能够拟合任意离散分布[8]。RBM网络结构中隐含层为二值变量,可视层为二值变量或者[0 1]之间的数值。假设隐含层有m个节点,可视层有n个节点,对于一组状态(v, h),RBM系统具备的能量定义为:

公式中参数vi表示可视层第i个节点状态,参数hj则表示隐含层第j个节点的状态。[θ]为RBM结构参数,即[θ]={Wij,bi ,cj }。当[θ]确定时,得到RBM结构基于(v,h)状态的概率p为:

Z([θ])为归一化项。由RBM网络层间全连接层内无连接结构特性可知,当可视层节点值给定时各隐含层节点之间激活概率相互独立,由网络的对称性可知,当隐含层节点值给定时,RBM网络的可视层节点之间激活概率相互独立。第i个可视层节点的激活概率p(vi=1|h,[θ])可由公式得出,第j个隐含层节点的激活概率p(hj=1|h,[θ])可由公式得出。

公式(4)和(5)中sigmoid(x)为激活函数,其公式为sigmoid(x)=1/1+e-x。由上述公式可以得出RBM对于观测数据v的概率分布如公式(6)。

为确定该分布,需要调节参数[θ]即调节W,b,c。可以利用对比散度(Contrastive Divergence, CD)算法对训练样本M进行训练,训练RBM模型的过程中采用训练公式(7)-(2)进行训练。其中[v(0)=M],[α] 为学习速率。

大量实验证明RBM网络是一种有效的特征提取机制,堆叠多个RBM组成网络能够在大部分分类和特征学习中提取更加抽象的特征,经过无监督的预训练与有监督的全局微调后可以得到较优化网络模型。

1.2 DBN深度信念网络

自Hinton[9]等人在神经网络的基础上提出深度信念网络以来,DBN在机器学习及人工智能领域得到了广泛的应用,DBN作为一种概率生成模型在特征提取及分类问题上均表现出良好的性能。经典深度信念网络由若干层受限玻尔兹曼机及输出层组合而成,以包含两个RBM的DBN网络为例进行说明,其模型结构如图2所示。在深度信念网络中,RBM层训练属于无监督训练过程,其利用对比散度方法进行逐层贪婪预训练,每一层的训练结果作为下一层的输入,顶层为有监督训练模型。本文利用经典DBN网络进行实验,在预训练完成后再实现对DBN网络整体的权值进行微调。

实验中输入为多维图像像素数据,输入数据与第一层隐含层构成RBM网络进行训练,训练过程采用CD算法进行逐层训练。当第一层训练完成后,将产生的参数W0作为固定参数输入第二层RBM中进行训练,依此顺序进行逐层训练直至训练出顶层RBM网络参数完成预训练,并将所得参数输入到下一层进行有监督的训练并利用误差反向传播算法对整体网络权值进行微调,进而增加整体网络模型的准确性和各层间联系程度。

1.3 多任务学习

多任务学习最早由Caruana提出[10],多任务学习打破传统任务分而治之的思想,对多个相关任务进行并行训练能够考虑到相关任务之间的联系,提高输入相关信息的获取量,进而可以解决因样本相对不足而造成的分类器泛化能力不强的问题。并可以通过多个相关任务之间的权值共享进而提高网络模型的泛化能力,同时多个任务的权值进行竞争能够有效抑制模型的过拟合程度,提高模型的识别精度,多任务学习结构示意图如图3所示。

本文在输入端输入多个任务训练数据,需要说明的是一个整体数据中包含多任务信息而非分别输入三个任务信息,并通过在深度信念网络的输出层构建多任务分类器使训练过程中分类器能够充分利用多个相关任务所包含的信息,进而来提高人脸的识别的精度。其结构如图4所示。

2 实验及结果分析

本文使用的数据集为CMU人脸数据集。因数据集中存在极少几张图片损坏,用数据集中同种类别替代。最终数据集中包含640张人脸图像,图像信息包括人脸信息,人脸的方向(直,向上,向左,向右),人眼信息(是否佩戴墨镜)。本次实验使用数据集中128*120分辨率的图像。任务1为识别人脸,构造任务2为识别人脸方向,任务3为人眼是否佩戴墨镜。取数据集中480张为训练集,160张为测试集进行测试,数据集部分图像如图5所示。

3 结束语

深度信念网络能够有效提取图像特征,并通过输出层进行有效的分类,对深度信念网络做进一步研究有很强的实用价值。在DBN网络中应用多任务学习构建多任务分类器,能够在样本相对不多的情况下使分类器同时关注多个相关任务即在训练过程中多个相关任务权值共享,进而使分类器从输入端获取更多的相关信息量,同时可以利用多个相关任务权值竞争减少过拟合对分类器的影响,进而提高对人脸的识别率。

参考文献:

[1] Liu P, Han S, Meng Z, et al. Facial expression recognition via a boosted deep belief network[C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2014: 1805-1812.

[2] Xia R, Liu Y. Leveraging valence and activation information via multi-task learning for categorical emotion recognition[C]. Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on. IEEE, 2015: 5301-5305.

[3] 周茜. 基于多任务学习的人脸识别方法[D]. 西北大学, 2013.

[4] 刘成, 彭进业. 基于多任务学习的自然图像分类研究[J]. 计算机应用研究, 2012, 29(7): 2773-2775.

[5] Ding C, Xu C, Tao D. Multi-task pose-invariant face recognition[J]. Image Processing, IEEE Transactions on, 2015, 24(3): 980-993.

[6] Huang Z, Li J, Siniscalchi S M, et al. Rapid Adaptation for Deep Neural Networks through Multi-Task Learning[C]. Sixteenth Annual Conference of the International Speech Communication Association. 2015.

[7] Ye Q, Munro P W. Improving a Neural Network Classifier Ensemble with Multi-task Learning[C]. Neural Networks, 2006. IJCNN'06. International Joint Conference on. IEEE, 2006: 5164-5170.

[8] Le Roux N, Bengio Y. Representational power of restricted Boltzmann machines and deep belief networks[J]. Neural computation, 2008, 20(6): 1631-1649.

[9] Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507.

[10] Caruana R. Multitask learning[M]. Learning to learn. Springer US, 1998: 95-133.

猜你喜欢

人脸识别
人脸识别 等
揭开人脸识别的神秘面纱
人脸识别技术的基本原理与应用
人脸识别技术在高速公路打逃中的应用探讨
基于(2D)2PCA-LBP 的人脸识别方法的研究
浅谈人脸识别技术
人脸识别在高校安全防范中的应用
巡演完美收官 英飞拓引领人脸识别新潮流
人脸识别在Android平台下的研究与实现
基于Metaface字典学习与核稀疏表示的人脸识别方法