APP下载

基于卷积神经网络的人脸识别检测分析

2023-08-22褚新建

电子产品世界 2023年8期
关键词:卷积神经网络网络结构人脸识别

褚新建

关键词:人脸识别;卷积神经网络;网络结构;检测精度

0 引言

人脸识别技术的关键就在于人脸检测,作为重要研究方向广泛应用于模式识别和计算机识别领域[1]。人工设计特征作为传统人脸检测方法的重要监测依据。目前由于人脸检测算法表现出较高的检测精度,因而应用于多个领域[2]。人脸检测算法结合深度学习在卷积神经网络得到广泛应用下逐渐获取进一步发展,早已作为主流研究方法应用于各领域,检测准确率高于传统方法,超过95%[3],拓展人脸识别研究具有重要的意义。

近年,人脸识别技术早已被Facebook、Google、商汤科技、旷世科技应用融入到各个领域,尤其是在卷积神经网络不断持续进步发展的趋势[4]。很多挑战和问题在实际应用环节始终存在。尽管从识别准确度来看,在LFW 数据集中应用多种方式均可获取较佳结果,人眼识别能力也得到显著提升,然而必须要选取大量训练样本训练各深度模型,倘若研究机构场所小型化或属于高校,实现相对较为困难[5]。所以目前亟需解决的主要问题就在于怎样训练可满足人脸匹配要求和快速区别人脸特征的性能佳且结构简單[6]。本文应用卷积神经网络到人脸识别领域,并开展网络训练以及测试优化分析。

1 基于卷积神经网络的人脸检测算法

图1 给出了AlexNet 网络模型结构图。网络模型中全连接层和卷积层分别为3 个和5 个,总共为8 层。将ReLU、局部响应归一化及池化层增加至前两层后,将Dropout 和池化加入到第6、7 层,并在第8 层应用softmax 分类器[7]。

将Dropout 技术引进全连接层中,这种情况下全连接层在AlexNet 网络模型训练整个流程中的连接概率为固定且以随机稀疏方式为主,将部分神经元丢弃,有利于网络复杂度降低,参数计算量得到减少,过拟合现象也会在某种程度上减小[8]。需采取局部归一化操作方式处理输出结果,有效抑制局部神经元,进而促进网络泛化能力的进一步强化。

网络模型算量与卷积核结构尺寸大小相关,感受也随着卷积核尺寸增大而扩大,尽管图片特征信息提取效率有效增加,但计算参数急剧增加。小尺寸的卷积核被更多研究学者应用,可有效增加模型的宽度和深度。网络参数模型训练时长将得到显著减少,同时还有利于降低第一层的参数计算量。

在人脸检测时应用本文提出的网络模型,需提前区分人脸及非人脸区域,为确保降低神经网络参数,将第2 个全连接层删除,仅将第1、第3 个全连接层保留。按照1×1 卷积核尺寸标准修改第1 个全连接层,用全连接神经网络替代原有神经网络,任意大小的尺寸均可输入卷积神经网络,人脸分类选用第2 个全连接层。本文所用的网络结构参数见表1 所示。本文所用的网络结构逻辑见图2 所示。

2 实验结果分析

2.1 数据集

作为评测数据集,FDDB 常用于人脸检测。灰度和彩色图共2 845 张图片均包含在数据集中,共有5 171人脸标注数据,人脸拍摄环境为自然状况。测试集挑战性较高,同时低分辨率、遮挡等情况都包含在内,拍摄环境与日常应用场景都十分贴近。

作为人脸检测的大型基准数据集,WIDERFace 由香港中文大学建立而成。采用手工标注数据集,人脸总数为4 万张,光照及遮挡等不同场景下人脸图像变化情况均包含在内。

2.2 网络模型训练设置

本文在训练改进卷积神经网络时,将Tensorfl ow 深度学习开源平台作为重要应用工具,选取NVIDIAGTX1050 型GPU 加速,训练数据用SSD 固态硬盘缓存,完成CUDA9.0GPU 并行计算库的安装。

网络训练基于网络参数完成,同时将0 作为卷积层学习率,训练的卷积层为候选框生成网络特有,为确保能实现卷积神经网络中人脸分类及候选框生成网络间的共享,最后环节需要微调人脸分类网络。

2.3 实验结果分析

在人脸检测中对本文改进的模型结构性能进行验证,选取测试的数据集为FDDB 人脸数据集。召回率要求在实际使用过程中的严格程度更深,所以评估本算法应用的评价指标以FDDB 为主,Falsepositive 表示横轴,即FP,误检数为检测出人脸但实际非人脸的数量,Truepositiverate 表示纵轴,即recall 召回率。如图3 所示,为测试曲线图。

本文对比了CascadeCNN 及MTCNN 等较为经典的人脸检测算法,测试评价方法均选用FDDB 数据库实现,另外还对比了各检测方法所耗费的时长,下图为各检测算法对应的数据结果。

算法比较结果见表2。其中,fps 表示检测速度,即每秒传输的帧数。通常算法检测速度随帧数增长而加快。本文主要是在GPU 上完成检测速度的统一测试。与CascadeCNN、MTCNN,两种算法相比,本文算法表现出较高的召回率,对比表中数据得出准确率最高,相比于MTCNN 和CascadeCNN 检测速度较低,人脸签到系统的基础需求得到满足。

为了确保人脸检测算法多个特征能更直观且清晰地显示,在开展人脸检测验证前采用随机方式挑选图片,图4 为检测具体结果。侧脸及戴头盔遮挡的单人照片依次如图(a)(b)所示,通过观察对比得出,检测人脸图片的准确度及清晰度均相对较高,这意味着对于部分遮挡人脸或侧脸采用本文算法展示的鲁棒性较佳。

3 结束语

本文开展基于卷积神经网络的人脸识别检测分析,得到以下有益结果:

1)本文算法表现出较高的召回率,人脸签到系统的基础需求得到满足。

2)对于部分遮挡人脸或侧脸采用本文算法展示的鲁棒性较佳。

猜你喜欢

卷积神经网络网络结构人脸识别
人脸识别 等
揭开人脸识别的神秘面纱
基于深度卷积神经网络的物体识别算法
基于互信息的贝叶斯网络结构学习
知识网络结构维对于创新绩效的作用机制——远程创新搜寻的中介作用
沪港通下A+ H股票网络结构演化的实证分析
复杂网络结构比对算法研究进展
基于类独立核稀疏表示的鲁棒人脸识别
基于K-L变换和平均近邻法的人脸识别