APP下载

人脸数据库发展的特点及方向

2021-05-04梁元锴

计算机与网络 2021年4期
关键词:人脸识别发展趋势

梁元锴

摘要:根据人脸数据库发展至今的历史,划分了人脸数据库发展的2个主要历史时期,介绍了这2个历史时期中一些典型的人脸数据库,以此归纳出这2个历史时期中人脸数据库的主要特点。通过列举人脸数据库在不同历史阶段发展时产生的变化并加以分析,总结出了这些变化发生的原因。同时还依据人脸数据库发展的特点,提出了一些未来可能出现并发展的人脸数据库及其使用方法。

关键词:人脸数据库;人脸识别;发展趋势

中图分类号:TP392文献标志码:A文章编号:1008-1739(2021)04-64-4

0引言

如中科院计算所著名研究员山世光所说:“人脸识别技术史本质是测评人脸库更替史”。人脸数据库的核心功能是供人脸识别技术进行算法性能的分析和测试。其中,人脸识别技术是人脸识别、人脸检测、关键点识别等检测技术的统称。人脸数据库的发展历史大致可以划分为2000年以前和2000年以后2个发展阶段,本文将对这2个阶段的典型人脸数据库进行分析和对比,说明它们之间的差异以及产生差异的原因,并展望人脸数据库未来可能的发展。

1早期人脸数据库

早期的人脸数据库是指产生于2000年以前的人脸数据库。一般认为,对人脸识别的研究始于1964年Bledsoe和Chan[1]于Panoramic Research Inc上发表的一份关于人脸自动识别的报告。1964-1990年,人脸识别的发展较为缓慢,且被视为一般的识别问题。此阶段的处理方法包括基于剪影分析的人脸识别、基于人脸低维表示的人脸识别[2]等方法。

1990年初,美国吸引了大量面部识别领域的专家参与人脸识别研究,激发了全球范围内一批典型人脸数据库的产生,这一时期的人脸数据库突出显示了早期人脸数据库的特点。

1.1 ORL人脸数据库

ORL人脸数据库是典型的用于进行人脸识别测试的人脸数据库,内含来自40名对象,每人10张,共400张的256级灰度人脸图像,均为PGM格式,大小均为92 pixel×112 pixel。这些人脸图像拍摄时的表情、面部细节、光照条件各异,所有图像中的人脸位于图像正中,占图片整体面积比例较大,有些图像中的人脸有一定程度的侧向偏移。

ORL人脸数据库中的人脸受到了较强的限制,如人脸在图像中的位置和比例、被摄者的拍摄姿势、面部偏转角度等变化较少,因而适用于一些基于图像分割的人脸识别算法[3-4],例如连续密度隐马尔可夫模型法[5]。此类方法较依赖人脸数据库中人脸图像的自然特性,迁移性较差。ORL人脸数据库是早期人类数据库中格式规范化的典型代表。

1.2 FERET人脸数据库

FERET人脸数据库是自1994年起逐步建立的人脸数据库,内含超过14 000张在不同姿态、光照条件下拍摄的,来自近1 200名被摄对象的灰度人脸图像。FERET人脸数据库中的一些图像是相同对象在不同时间拍摄的,这些图像被称为“重复集”。重复集的提出意味着人脸数据库在建立时首次考虑了时间这一被识别对象的外观变化尺度。

FERET人脸数据库拥有相较于同时代产品大得多的样本量,已初步具有近期人脸数据库大容量的特点,成为了具有相对客观评价测试能力的人脸数据库,但对被摄对象仍限定较多。故FERET人脸数据库可被视为早期和近期人脸数据庫的分界。

早期的人脸数据库被摄者人数较少、拍摄环境布置刻意、被摄者配合,导致人脸图像的格式统一,因而适用的识别算法一般只在较为理想的环境下表现良好,实际应用价值较低。

2近期人脸数据库

人脸识别技术于2001年首次被用于大规模犯罪分子搜查活动,标志着人脸识别正式转化为具有经济社会价值的技术。此阶段逐渐产生了包括人脸检测、人脸关键点检测、情绪识别在内的不同类型、多种侧重的人脸识别算法需求。

2.1 Wider Face人脸数据库

Wider Face人脸数据库[6]适用于进行人脸检测测试,其中包含3万多张大小为1024 pixel×1024 pixel的彩色图片,共计有约40万张人脸,且其中大量的人脸尺度较小。图片中的人脸几乎均有标注,其中最小者可至10 pixel×10 pixel。

Wider Face人脸数据库是目前难度最大的人脸检测测试集之一。该人脸数据库中的人脸图片基于61种事件类型进行分类,同时包含了姿态、遮挡、化妆、光照及模糊等各类人脸识别难点。

从属于每种类型事件的图片被随机分为训练集、验证集和测试集,占比依次为40%,10%,50%,其中测试集未对人脸进行标注,需将测试结果交由官方比对,保证了检验结果的公正性。

Wider Face人脸数据库中的图像划分为Easy,Medium,Hard三个检测难度,一些典型算法在这3种难度下识别的准确率[7]如图1所示。

2.2 FRGC人脸数据库

FRGC人脸数据库[8]基于FRGC项目产生,用于人脸识别,其中的50 000张人脸图像于2002-2004年间采集。在FRGC人脸数据库的一个图像组中,含有同一被摄对象的4张在限制条件下的图像、2张非限制条件下的图像和1张三维图像,其中三维图像包括三维形状信道和纹理信道,如图2所示。

FRGC人脸数据库中的图像分为训练集和验证集,其中训练集包括一个静止训练集和一个三维训练集。前者包括来自222名被摄者的6 388张受限静态图像和6 388张非受限静态图像;后者是来自943个主题的图像集(包括三维扫描图像以及对应的受限和非受限静态图像)的图像构成的,可用于训练三维或三维到二维算法的训练集,验证集由来自466个主题的4 007个图像集构成。

2.3 LFW人脸数据库

LFW人脸数据库[9]适用于人脸识别测试,含13 000多张图像,来自互联网上的超过5 700名国外名人,其中有1 600多人在LFW人脸数据库中有2张及以上的图像,剩下约4 000人只有1张。所有图像的格式均为250 pixel×250 pixel的JPEG图像,大多数为彩色。

LFW人脸数据库中的人脸几乎不受任何限制(唯一要求是可被典型的Viola-Jones检测器识别)。其中被摄对象有性别、种族、年龄、装饰等区分,图像中的人脸有不同的姿态、光影条件、背景等区别,甚至一张图片中会有多张人脸(只有包含图像中心像素的人脸会被标记)。

使用LFW人脸数据库时,一般从中抽取6 000对人脸对(其中约3 000对来自同一名人物,其余则不然),再逐次输入一对人脸对,由识别算法判断是否为同一人,即可计算算法的判断准确率。这种方法简单易懂,而由于LFW人脸数据库对包含其中的人脸图片要求很少,几乎没有规律可循,故算法测试一般能取得较好效果。

3不同时期典型人脸数据库产生的变化及原因

3.1近期人脸数据库相对于早期人脸数据库产生的变化

3.1.1人脸图像的质量提升

相较于早期人脸数据库,近期人脸数据库质量的提升主要体现在:

①图像的数量大量增加:近期人脸数据库内所含图像数量一般为10 000~50 000张。

②被摄对象特征更加多样:近期人脸数据库一般为数百人到数千人,被摄对象本身的特征更加多样,除神态、表情、姿势等方面外还出现了肤色、发型、图案、特定装饰等更多样的人脸特征。

③清晰度显著提升:近期产生的人脸数据库,如Wider Face人脸数据库中的图像大小与ORL人脸数据库相同,但达到了1 024 pixel×1 024 pixel。

④由灰度图像为主变为彩色图像为主:近期的人脸数据库中的人脸图像多为彩色,被摄对象的特征更加明显[10]。3.1.2人脸图像的理想程度降低

早期人脸数据库中的人脸被严格控制,使得人脸在图像中处于自然分布,导致其中图像与实际应用场景有较大不同。多数近期的人脸数据库中人脸的放置更贴近实际场景,特殊化处理较少,如Wider Face人脸数据库。

3.1.3满足的识别需求类型更加多样化

针对某种特定的目的或需求,近期人脸数据库的设计性更强。设计性的增强不代表对人脸的限制性增强,体现在图片的数量和某一类图片在人类数据库中所占的比例上等非图像本身的属性进行规划,而限制性体现的是对人脸的控制。

3.1.4提供者对人脸数据库的后续更为关注

近期人脸数据库的提供者对人脸数据库的更新更加频密,例如LFW人脸数据库会不定期更新,更新消息将会被发布于官网[11],甚至出现了由商业公司提供并维护的人脸数据库,如BioID人脸数据库。

3.2变化产生的原因

3.2.1技术条件的提高

主要有计算机储存容量和计算能力的提升、图像处理技术的发展[12]和资源獲取手段的增多3个方面。

近年来互联网的迅猛发展、公共社交平台与新兴媒体的兴起拓宽了数据库的样本,特别是非限制场景下样本的来源。同时,拍摄工具轻便化和拍摄结果的优质化提高了非限制场景,特别是偶发场景下所拍摄图像的可用性。

3.2.2高效而通用的识别算法的提出和发展

1990年前,人脸识别建模方法主要是基于人脸本身特征的方法;1990-2000年主要是基于线性子空间的距离比较或统计学方法;2000年后,光照锥技术、支持向量机等方法出现[13]。2006年出现的深度学习,至今仍是主流人脸识别方法。总体上看,提出时间越晚的算法往往有越高的识别能力和效率,使得一些早期人脸数据库的使用价值被挖掘殆尽,如ORL人脸数据库和FERET人脸数据库的首选识别率均已达到99%[14]。近年来,基于深度学习,FRGC人脸数据库和LFW人脸数据库也正在接近使用价值上限。

另一方面,适用于人脸识别的算法的通用性增强,可应对非限制条件,这是人脸识别具备实际应用价值的基础条件。

3.2.3人脸识别等技术应用场景的增加

伴随人脸识别技术与产业经济的日渐融合,人脸识别技术的应用场景随之多样化。例如,在身份识别这一应用领域,利用了人脸检测、人脸识别及人脸关键点识别等技术。身份识别还可细化地应用于人口出入境管理、嫌疑人身份鉴别、敏感人物动向监视、游戏自动登录、家政机器人服务对象识别等方面,每一个细化方面对人脸识别技术的精准度、正确率和反应速度等都有不同要求。

3.2.4研究氛围的改善

人脸识别技术已广泛受到各大高校和研究所的重视,研究人脸识别技术的气氛相较早些年更加浓厚。同时,人脸识别技术的商业价值也吸引了商业公司的注意,为人脸识别研究提供了资金来源。

4人脸数据库的发展方向

4.1针对复杂运动对象的人脸数据库

在一个人群密度较大且不断运动的场地中,试图捕捉一个特定对象的运动轨迹,则目标对象的人脸会产生正向、侧向乃至背向的变化,并会被遮挡。对动态视频,可以将其分解为静态图像来处理,但这可能导致一些问题:运动中的人脸在静态图像中会呈现较严重的晃动和模糊、人脸在运动中发生的改变(如佩戴眼镜)可能影响识别结果和目标的隐匿会使识别出的运动路径失去连贯性。

因此,可建立一个以视频为人脸图像主要载体的人脸数据库,其中包含一定数量被捕捉对象的人脸在复杂环境下发生偏转、特征改变和被遮挡等运动的视频。

针对此人脸数据库,一种建模方法为:将被捕捉对象的人脸视为三维空间中的结构,将人脸的移动视为结构的位移,将采样工具捕捉到的人脸视为结构在平面上的投影。此过程中需对人脸进行特征点检测,利用特征点之间的角度变化来判断人脸的运动方向,并以结构运动的连续性确保人脸运动的连续性,保证人脸不因佩戴装饰物而改变识别结果。

目前,已有基于动态对象的人脸数据库被建立,如COX人脸数据库,但其更侧重人脸运动时的远近与角度变化,较少考虑人脸中移动的遮挡问题。

4.2基于相似人脸的人脸数据库

相似人脸在大样本人脸数据库中出现概率较大,是人脸识别尚未突破的难点。鉴于相似人脸在实际应用场景中的低比例,可先对待识别的人脸样本做一般识别,将被识别为同一人的样本归为一类,再额外检验是否发生了相似人脸的误判。

对于额外检验算法的训练,可以在基于相似人脸的人脸数据库中录入一定数量的相似人脸图像对,并标注2幅图像是否为同一人。在使用该人脸数据库时,只需随机抽取一定数量的人脸对,交由算法做出判断,并以正确率作为训练指标。

4.3模糊特征的人脸数据库

在实际应用场景中,若要求算法在短时间内学习并识别大量的人脸(如快速学习并寻找某人群聚集场景中的嫌犯),而在其训练和测试中使用的图像细节过多,则会降低效率。

为训练具有快速模糊特征检测机能的算法,可建立模糊特征的人脸数据库,其中包含大量的人脸图像及对应的压缩模糊图像。压缩方式为,对待检测图像进行適当的模糊,仅保留人脸大体特征,如毛发特征、五官大致大小比例和距离比例等。在对比检测过程中,当2张模糊人脸的相似度超过某一阈值时再利用高清晰度人脸图像进行细节对比。

5结束语

通过对不同时期提出的典型人脸数据库特征的分析对比,提出未来人脸数据库将向容量更大、图像质量更高、信息种类更丰富、目的性和设计性更强以及维护更专业的方向发展,也据此为将来人脸数据库的设计及利用提供了一些可行的途径。

参考文献

[1] BLEDSOE W W, CHAN H. A Man-Machine Facial Recognition System: Some Preliminary Results[C]//Technical Report, PRI 19A.Palo Alto: Panoramic Research Incorporated,1965: 1-10.

[2] SIROVICH L,KIRBY M.Low-dimensional Procedure for the Characterization of Human Faces[J]. Journal of the Optical Society of America,1987,4(3):519-24.

[3] SAMARIA,FS. Face Recognition Using Hidden Markov Models[D]. Cambridge: University of Cambridge,1995.

[4] BALLOT J S S. Face Recognition Using Hidden Markov Models[D]. Matieland: University of Stellenbosch,2005.

[5] SAMARIA F S,HARTER A C. Parameterisation of a Stochastic Model for Human Face Identication[C]//Sarasota(Florida):Proceedings of the 2nd IEEE Workshop on Applications of Computer VisionSarasota:IEEE, 1994:138-142.

[6] ANON.IEEE Conference on Computer Vision and Pattern Recognition(cvpr 2020)[J].智能系统学报,2019,14(6):1137.

[7] WIDER FACE: Results [EB/OL]. (2015-11-19)[2020-5-10]. http://shuoyang1213.me/WIDERFACE/WiderFace_Results. html.

[8] PHILLIPS P, FLYNN P, SCRUGGS T, et al. Overview of the face Recognition Grand Challenge[C]// Computer Society Conference on Computer Vision and Pattern Recognition, 2005:947-954.

[9] HUANG G B, RAMESH M, BERG T, et al. Labeled Faces in the wild: A Database for Studying Face Recognition Inunconstrained Environments[C]//Technical Report, University of Massachusetts,Amherst,2007.

[10] WILDER J, PHILLIPS P, CUNHONG J,et al.Comparison of Visible and Infra-red Imagery for Face Recognition[C]// 2nd International Conference on Automatic Face and Gesture RecognitionKillingtan:IEEE, 1996:182-187.

[11] The BioID Face Database [EB/OL]. (2020-3-17)[2020-5-23]. https://www.bioid.com/facedb/.

[12] KUMAR P, PARMAR A. Versatile Approaches for Medical Image Compression: A Review[J]. Procedia Computer Science,2020,167(1):1380-1389.

[13]山世光.Deep Models for Face Processing with "Big" or"Small" Data[R].北京:北京邮电大学,2015.

[14]山世光.深度化的人脸检测与识别技术—进展与展望[R].太原:中国计算机学会,2016.

猜你喜欢

人脸识别发展趋势
人脸识别的“国标”来了
中科视拓开放商业版本人脸识别算法
人脸识别好用但不能滥用
荣耀畅玩7C:人脸识别
iPhoneX来了!
“人脸识别”人工智能测谎仪研发成功