APP下载

基于聚合特征的人群定位与检测分析*

2021-11-24欧阳爱国张文穗刘燕德曾体伟

传感器与微系统 2021年11期
关键词:人头行人背景

欧阳爱国, 张文穗, 刘燕德, 曾体伟

(华东交通大学 光机电技术及应用研究所,江西 南昌 330013)

0 引 言

为了提高人们在公共区域的安全性,对行人的检测识别和状态分析是目前最受关注的研究内容[1],因此需要探索精度更高的人群检测与定位方法。Zhou T等人[2]提出了一种基于多核学习(multi-kernel learning,MKL)的人群人头检测框架,先检测出运动候选区域,之后采用模型检测人群。此方法一般适用于中低密度,对于复杂背景遮挡严重的情况检测效果有限。为了克服这些问题,Conte D等人[3]提出一种间接的方法对拥挤人群进行计数,通过对检测人群的运动信息,提取SURF特征角点数与人群数间存在的对应关系,来估计人群数量。Zhang Y Y等人[4]和Sam D B等人[5]提出基于多级卷积神经网络的人群计数方法,方法在人群密度极高场景下检测精度较高。但深度学习的方法往往存在网络训练成本较高,需要大量的目标标注数据,并且可解释性较差,硬件成本较高。

本文基于视频的帧间时空特征,优化的聚合通道特征(aggregation channel feature,ACF),兼顾外观与动态信息,提出了两种窗口融合策略改进非极大值抑制(non-maximum suppression,NMS)算法,使用软级联分类器对特征建模,对人群目标进行检测与定位。

1 行人目标检测与定位分析

首先提取运动区域,对运动区域进行目标检测,区分出行人目标与非行人目标。视觉背景提取(visual background extraction,ViBe)在分类前景和背景像素点时应用的是固定阈值,使得在动态背景中很容易造成扰动,影响检测结果;在检测由静转动和由动转静的目标时,算法存在鬼影和拖影现象,提升了后续检测的误检率[6]。另外,在检测过程中由于运动目标与周围背景颜色相近,容易出现目标区域缺失现象。

对此,提出了融合区域相关信息的ViBe算法,在ViBe算法的基础上加入区域相似信息,以增强运动目标与背景模型的区分度,去除鬼影现象,运动目标得以增强。通过自定义膨胀结构元素和形态学开闭运算方法进行处理,之后做检测目标的最小外接矩形。

计算背景帧掩模B与当前帧掩模D直方图相似度,记为H1和H2,两区域直方图相似度

相似度低于阈值T,判定掩模区域为鬼影区域,用当前帧像素点替换,并重新局部初始化。相似度高于阈值T,判定该区域为目标区域,背景模型不做更新。

采用改进后的ViBe算法分割得到的运动区域可以去除鬼影和区分与背景相似的运动目标,得到更完整的运动区域,提出的运动区域分割算法可以准确检测运动目标,为后续的检测降低了背景干扰。

2 基于优化聚合通道模型的行人检测

针对传统行人整体检测存在的行人遮挡和行人外观不稳定现象造成的漏检,本文基于ACF算法采用行人头部检测代替行人整体,行人头部检测相对于行人整体而言形变较小,形状较为固定,并且在拥挤的人群场景情况下,也不易被遮挡。ACF算法的目标检测框架主要包括三个部分组成:特征提取阶段、训练阶段、分类阶段。

2.1 ACF

ACF是将3通道LUV颜色通道特征、1个梯度幅度通道特征,6个梯度方向直方图通道特征结合在一起形成的10通道聚合特征,并对于每一个检测窗口将多个不同类型的特征聚合为一个特征向量进行学习和分类,由于融合了多种通道特征的信息,使得算法能够更全面表达行人目标。

大型土壤动物群落各指数的分析表明,群落多样性与均匀度呈正相关而与丰富度指数无关。群落内物种分布越均匀,则优势度越小。

2.2 优化的ACF特征

针对行人头部目标具有的类圆性和旋转不变性以及局部纹理的特征,ACF特征融合局部二值模式(local binary pattern,LBP)特征检测人头目标,LBP特征具有灰度不变性和旋转不变性并且计算简单,能较好地描述人头信息的特点,提高检测的准确性[7]。与ACF特征提取类似,将LBP通道分成4×4大小的图像块,之后将特征向量串起来作为新的特征通道,即可得到改进的11通道特征,融合公式如下

2.3 优化的NMS算法

在前人研究的基础上[8~10],针对处于抑制窗口边缘、重合面积较小、得分和尺寸均明显小于抑制窗口的误检窗口,在原NMS算法的基础上提出结合得分信息比与尺度比进行抑制,设抑制窗口得分为Sy高度为hy,被抑制窗口得分Sb和高度hb两者重合面积阈值Sr0为

式中α为抑制窗口得分与被抑制窗口得分比值,β为抑制窗口高度与被抑制窗口高度比值。当α≥1.4或β≥2时,认为抑制窗口附近存在尺度较小的或得分较低的人头误检目标,通过动态的调整重合面积阈值Sr0进行去除。

对于背景场景存在类圆性目标干扰检测的情况,提出全局得分最高最低比设置动态阈值的方式进行抑制。设N个抑制窗口BY={B1…Bi…BN},得分数为SY={S1…Si…SN},全局最低得分阈值为Fmin。公式如下

3 实验结果对比分析

在两个数据集中进行测试,即PETS2009数据集和校园监控数据集。两个数据集中行人的人头部位像素尺寸均在25~55像素左右,行人目标行进方向和速度都是随机的,包含各种不同的情况,实验中,从定性与定量两个方面对本文算法与已有算法进行了对比。

3.1 改进ACF性能分析

采用自建人头数据库的方式验证[11],通过对INRIA数据集标注,选择INRIA数据库训练集中614张行人正训练样本和1 218张负样本作为训练集,INRIA数据集测试集中288张行人测试样本图片作为测试集,采用手工标注的方式,并且在标注的过程中,剔除部分人头相对较小的样本,最终生成共标注1 413张人头作为人头训练正样本标注文件和604个人头测试负样本标注文件。测试中包含原始ACF、ACF+LBP、ACF+改进NMS、ACF+LBP+改进NMS共4个人头检测模型。绘制MR-FPPI(miss rate against false positives per image)[12]曲线作为评价指标。

从图1中ROC曲线可知,在本文建立的行人人头数据集中进行检测结果为:在取图像平均误检个数FPPI值为1时,原始ACF算法的平均对数误检率为40.03 %,而本文提出的改进的ACF—改进NMS的平均对数误检率为37.41 %,降低了2.62 %,ACF+LBP为34.74 %,相比于ACF特征,融合LBP通道特征的改进ACF特征更能有效表达人头目标信息,其中ACF+LBP+改进NMS的方法平均对数误检率为32.53 %,相较于原始ACF算法平均对数误检率降低了7.5 %,误检数减少了150个,因此本文对ACF人头检测模型改进能够有效避免产生漏检,提高检测的有效性。

图1 四个模型的检测性能对比

3.2 仿真实验结果

3.2.1 PETS2009数据集

PETS2009数据集视频图片尺寸为768×576,行人头部尺寸均在20像素×20像素左右,检测效果如图2所示。从图中可以看出,即便存在部分遮挡的情况下仍能比较准确地定位到单个行人,进行准确行人检测。

图2 在VIEW_001序列上检测效果

将待检测图像分为R0,R1和R2区域[13],如图3(a)所示,并采用平均绝对误差(mean absolute error,MAE)和平均相对误差(mean relative error,MRE)来评估行人检测效果,从定量上分析提出的算法的检测性能。定义公式如下

图3 检测图像区域和检测结果

式中C(i)和T(i)分别为预测人数和实际人数,N为总帧数。

如图3(b)显示了在S1.L1.13—59序列段上的人群检测预测结果,由式(5)计算得出评价指标平均绝对误差MAE与平均相对误差MRE,如表1所示,其中,R0区域MAE值达到了1.88,并与相关算法进行对比[2,3,14],如表2所示,得出本文方法的检测效果较好。

表1 R0,R1,R2区域检测性能MAE值与MRE值

表2 四种算法检测结果对比

3.2.2 校园实时监控数据集

PTZ摄像机拍摄的图像为1 920×1 080的高清图像,为了提高检测速度将图像尺寸缩放至1 200×675,并在选取其中200帧作为测试数据,图像中行人的人头部位像素尺寸均在25~55像素左右,行人目标行进方向和速度都是随机的,检测结果如图4所示。

图4 室外校园环境下检测结果示例

选择HOG-Adaboost,HOG-SVM+ORB-Adaboost,ACF和ViBe+ACF算法在测试视频序列中评估检测结果,表3是算法检测准确率、误检率和综合评价指标F值的对比表。

表3 检测结果对比

由表3中可以看出,聚合特征相对与传统HOG,ORB等特征应用多种特征的通道信息聚合特征能够更全面表达目标特征,在准确率和召回率上提升明显,并且由于应用前景检测算法去除了复杂的背景信息,只在候选区域进行目标检测,进一步优化了候选区域排除了误检框,使得算法对于人头目标和非人头目标的识别得到增强,准确率和召回率达到了91.4 %和91.6 %,虽然由于改进ViBe算法和改进ACF算法单个算法复杂度有所增大,但是两者结合之后由于应用在候选区域检测目标的方法,分类器检测区域变小,这部分的速度得以提升,其中ACF的平均检测速度为0.115 s,ViBe+ACF方法为0.052 2 s,本文算法为0.091 3 s,整体算法的检测速度与ACF算法相差不大或小有提升,并且检测准确率、召回率得到很大改进。

4 结 论

在监控视频人群检测的问题中,针对ViBe算法的鬼影问题与检测前景不完整现象,提出了一种基于改进ViBe算法的运动候选区域分割方法,对于鬼影能够快速检测并进行抑制,对于背景灰度值相近的目标通过优化候选区域可以快速完整检出,降低了后续检测计算的干扰。在检测分类阶段,基于ACF目标检测框架,提出了结合LBP特征和ACF特征的多通道聚合特征,较好表征了行人头部的轮廓特性。在目标窗口融合阶段,提出了基于得分与尺度信息比的改进NMS算法和基于全局得分比的动态阈值方式,可以较好去除多余误检框,提升检测精度。在校园监控数据集和PETS数据集上的实验结果表明,相对于已有的算法,本文算法对于人群目标检测的准确率更高。

猜你喜欢

人头行人背景
“新四化”背景下汽车NVH的发展趋势
毒舌出没,行人避让
《论持久战》的写作背景
山西省立法禁止野外用火成效显著 林草防火责任明确到山头地头人头
假人头防盗大法
路不为寻找者而设
朋友圈
我是行人
曝光闯红灯行人值得借鉴
晚清外语翻译人才培养的背景