APP下载

人脸识别技术研究与分析

2017-12-29作者向花仪重庆第八中学校

电子制作 2017年16期
关键词:特征提取人脸人脸识别

作者/向花仪,重庆第八中学校

1.人脸识别发展概述与技术难点

人脸识别技术是自本世纪六七十年代就兴起的,计算机视觉领域的典型应用,由于其涉及生理学、模式识别和认知科学等多个领域,因此其发展也受到这些领域难点的限制。

人脸识别主要包括人脸检测定位和人脸特征提取识别。前者是从背景中分割出人脸目标,经过归一化处理,后者要求特征提取算法具有不变性。前者面临的技术难点在于人脸目标模式的多样性和背景的复杂性。因此,对背景情境做合理假设以简化问题是非常必要的。在此基础上,高维空间人脸模型的构建是最复杂的部分,因为建立精确估计需要充足的负样本,负样本的产生和利用是研究热点之一。与其他机器学习应用类似,统计与知识相结合能达到更好效果。后者面临的技术难点在于人脸是弹性模型,建模难度高于刚体建模。因此, 任何基于刚体特性的特征抽取方法都很难达到满意的效果。此外,人脸的多变性与心理学和生理学特征相关,因此,将弹性建模与人类视觉特点相结合效果更好。

2.人脸检测定位与人脸特征提取识别技术概述

本篇将分别综述人脸检测定位技术和特征提取识别技术。

人脸检测定位技术使依据统计或知识或两者结合的方法进行建模, 再判断待测区域与人脸模型的匹配度。统计方法是将人脸看做高维向量, 从而将问题转化为高维信号分布检测,主要包括分类法和子空间法、空间陪陪滤波器法等三种方法。最常用的是分类器法,将人脸检测看做人脸与非人脸的二分类问题。知识方法是建立规则, 将问题转化为验证假设问题。主要包括以下五类规则[1]:(1)分布规则:人脸器官何有差别,但其分布稳定,所以可将人脸检测转化为是否存在符合分布的规则块。包括“自上而下”和“自下而上”两种方法。Yang等人提出Mosaic方法属于前者,后者需先对器官分布位置做检测,然后组合各位置点, 再利用分布规则筛选出可能人脸。此外,人脸各器官分布具有对称性,也可加入特征工程提高检测精度和速度。(2)轮廓规则:人脸的轮廓近似椭圆,基于此规则,Goyind提出认知模型,人脸建模为上下两个弧和两条直线, 问题转化为对直线和弧的检测。(3)纹理和颜色规则[2]:利用颜色信息可将人脸与背景分割开来,此处的重点是处理复杂背景下目标物体的检测。(4)运动规则:在动态场景的人脸检测任务中,可利用说话、眨眼等信息更方便分割人脸目标和背景。

在人脸检测定位后,特征检测前,需要做归一化处理。几何归一化是对大小和位置做调整,灰度归一化是做光线变化。

人脸特征提取与识别方法主要有以下几种[3]:(1)几何特征法。人脸各组成部件自身的差异性和组合结构的多样性是两大类特征。经典算法有参数法和可变模板法。(2)特征脸算法。该方法基于特征变换,实用且简单,但由于其依赖于训练集和测试集图像的相似性,局限性较大。(3)弹性模型法。人脸可看做畸变不变性物体,再应用动态链接模型将该目标描述为稀疏图,以此作为弹性模型的特征从而做人脸识别。

3.深度学习算法解决人脸识别问题

2006年以前,超过三层的神经网络模型效率低下,其后,Geoあrey教授在Science上发表的一篇关于深度学习的论文,再次引发了神经网络的研究热潮。该文章有两大观点:一是多隐含层的神经网络特征学习效果突出,能学习到图像的本质特征;二是多层神经网络的优化复杂度可以通过“逐层初始化”得到克服。正是这两个核心观点的出现加之研究学者的不断努力,使得神经网络攻克难以训练的危机,再次成为大数据和人工智能时代的主角。

在传统的图像处理技术主要包括特征提取和分类器两部分,特征提取算法的设计复杂性与应用局限性、稳定性,以及特定的特征提取算法与特定的分类器相结合的多样性限制着图像处理技术的发展。神经网络的出现,使端到端的图像处理成为可能,当网络的隐藏层发展到多层时便称之为深度学习,但同时需要用逐层初始化技术解决深层次网络训练难度大的问题,之后深度学习便成为时代的主角。而卷积神经网络(CNN)便是深度学习与图像处理技术相结合所产生的经典模型,实现该模型的网络实例在特定的图像问题处理上都卓有成效。

神经网络之所以能和图像领域相结合,并呈现巨大的发展前景,是有生物学依据的。人类视觉信息处理机制的发现,是19世纪19年代生物学界的重大发现之一,它证明了大脑可视皮层是分级存在的。人的视觉系统是一个反复抽象和迭代的过程。而卷积神经网络,就模拟了这个过程。首先,每一个卷积层,便是将具体信息做抽象的过程,而多个卷积层串联操作,便是将上一层的抽象结果再做抽象处理的过程,称之为迭代。在这个抽象迭代的过程中,不断抽取大脑可感知的高维度特征。如当一幅图像经过视网膜进入视野,首先会将光线像素等信息抽象为图像边缘信息,然后再抽象为目标物体的某一部位,再抽象为物体轮廓形成对整个目标的感知。

卷积神经网络包括卷积池化层操作和全连接层操作[4]。该网络基于传统神经网络,主要做了参数数量和训练难度方面的优化。后者各层网络之间采用的是全连接,导致参数数量较多,由此便需要足够多的训练数据才可能达到较好的训练效果,这限制了网络的深度和大小。前者采用局部视野和参数共享机制,大大较少了参数数量。局部视野就相当于人再观察世界时,并不是全局观察,而是分局部观察,每个局部会观察到一些特征,这些特征组合起来便是整个视野的特征。参数共享就好比是每个人观察不同的物体时所用的都是同样的视觉系统,而不同人的视觉系统则不同。而全连接层用的便是传统的神经网络加上分类器,最后一层神经元个数等于分类结果的个数,分类器多选择LR或SoftMax。

卷积神经网络已成功应用到多种图像处理应用中,如分类、检索、图像语义分割、手写识别等。深度学习算法在人脸识别上的应用比起传统方法优势明显, 因为对人脸识别的许多规律或规则进行显性的描述是相当困难的, 而神经网络方法则可以通过学习的过程获得对这些规律和规则的隐性表达, 适应性更强且更容易实现。

用CNN替代特征提取算法后,人脸识别技术实现了端到端处理[5],不再需要复杂的处理流程和巧妙的模型搭配即可完成。正是因为端到端的属性,使得包括CNN在内的深度学习算法像黑盒子一样被应用于各个任务中。虽然深度学习用逐层处理化解决了神经网络训练难的问题,CNN又用局部视野和权重共享解决了神经网络参数过多的问题,但其同样面临着模型负责,调参难度大,所需训练数据量大的困难。在此基础上,又出现了残差网络、迁移学习等技术使得深度学习应用更加广泛。迁移学习应用于图像处理领域,便是如R–CNN算法所示,用到其他任务上所训练出的中间结果,如多个卷积层所得到的4096维向量,最后根据需求加上自己的全连接层即可。迁移学习大大解决了训练难度大所带来的领域难题。

4.人脸识别应用创新

人脸识别的用途现在越来越广,各行各业都在尝试用人脸识别提升客户体验、优化服务水平,除了百度进行的以图搜图应用以外,还有如通过用户所上传的图片自动识别人脸按人物进行相册分类,或通过人脸识别进行物理防盗,找通缉犯,和进行安保系统的设计,本文接下来将以人脸识别部分的现有理论为基础,提出部分创新应用。

(1)脸盲症应用。这一现象在社交恐惧和生理疾病的人群中较为常见。例如在观察电影中,这类人群并不能在帧快速切换中记住每个人物,基于人脸识别技术,可以对影像视频每一帧中出现的人物做人名标注。

(2)特殊人物侦查系统。在开放空间做精确快速的人脸识别可能并不实际,但在特定数据库中做人脸检索却切实可行。基于此特性,可以开发一款识别特定人物的应用。如“老板来了”,在职员浏览非工作屏幕时,如果摄像头捕捉到某人出现在电脑后方某区域,并检测出该人是老板,便自动报警,切换电脑屏幕至工作页面。

(3)社交软件的应用。① 好友度计算。可在用户上传某人照片时,在用户的三度好友数据库中查找该人照片,作为好友推荐的一个特征,若该人已是用户好友,则可作为好友亲密度的一个特征。② 相亲交友网站功能提升。我们可先向用户展示大量不同类型的异性照片,记录用户在该照片上注意力停留时间,对停留时间较高的照片做聚类,作为对象推荐的一个特征。

5.人脸关键点检测应用创新

目前已有大量的美颜、化妆、拍照等软件可利用面部特征点检测做个体年龄,性别,职业,身体状况信息分析,从而实现人脸图像处理。本文提出了部分创新应用。

(1)虚拟化妆和卸妆。用户可上传照片后,用户可以对导入到软件中的数码照片进行如去涂抹口红、唇线、面部涂粉、描绘眼线和添加饰品等(如耳饰、头饰、项链、眼镜等)虚拟化妆操作,也可进行相反的卸妆处理,可让用户提前看到自己选择的发型或妆容是否符合自己。

(2)跨年龄人脸识别和跨代人脸识别。① 通过父母的照片,把父母的共同点融合快速的合成为未来孩子的照片。② 在一系列父母小孩照片中找出具有亲缘关系的一家人。③ 用户上传照片并标明年龄,然后对其进行各个年龄段的长相预测

(3)微表情检测。① 用户上传照片后,与心理学,微表情学相结合,识别心情,或是否撒谎等。② 利用微表情控制程序,如疲劳驾驶时主动提醒,或通过表情控制家具,如锁门,启动烘干机等。

人脸识别系统的研究始于20世纪60年代,80年代后随着计算机技术和光学成像技术的发展得到提高,而真正进入初级的应用阶段则在90年后期,并且以美国、德国和日本的技术实现为主;人脸识别系统成功的关键在于是否拥有尖端的核心算法,并使识别结果具有实用化的识别率和识别速度;目前“人脸识别系统”已经集成了模式识别、机器学习、模型理论、专家系统、视频图像处理等多种专业技术取得了长足进步。人脸识别核心技术的实现,展现了弱人工智能向

* [1]易军. 人脸识别中的特征提取与度量学习算法研究[D].北京邮电大学,2015.

* [2]胡敏,程天梅,王晓华. 融合全局和局部特征的人脸识别[J].电子测量与仪器学报 ,2013,(09)∶817—822.

* [3]汤德俊. 人脸识别中图像特征提取与匹配技术研究[D].大连海事大学,2013.

* [4]吴正文. 卷积神经网络在图像分类中的应用研究[D].电子科技大学,2015.

* [5]汪济民. 基于卷积神经网络的人脸检测和性别识别研究[D].南京理工大学,2015.

猜你喜欢

特征提取人脸人脸识别
人脸识别 等
有特点的人脸
一起学画人脸
揭开人脸识别的神秘面纱
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
人脸识别技术的基本原理与应用
人脸识别技术研究与应用进展概述
基于Daubechies(dbN)的飞行器音频特征提取