APP下载

基于分层模型和鲁棒字典学习的背景差分炸点检测

2016-07-01计宏磊杨清文秦晓燕陆军军官学院远程火箭炮系安徽合肥3003陆军军官学院管理工程系安徽合肥3003

兵工学报 2016年4期

计宏磊,杨清文,秦晓燕(.陆军军官学院远程火箭炮系,安徽合肥3003;.陆军军官学院管理工程系,安徽合肥3003)



基于分层模型和鲁棒字典学习的背景差分炸点检测

计宏磊1,杨清文1,秦晓燕2
(1.陆军军官学院远程火箭炮系,安徽合肥230031;2.陆军军官学院管理工程系,安徽合肥230031)

摘要:针对背景差分炸点检测方法中背景模型难以更新背景估计和运算复杂等问题,提出一种分层模型下基于鲁棒字典学习的背景差分炸点检测方法。为提高运算效率,该方法对图像帧建立3层金字塔分层模型,在每层将图像帧分割为互不重叠块,逐层以图像块为单位通过改进的鲁棒字典学习方法进行背景估计,与当前图像帧作背景差分实现炸点检测。采用炮弹炸点图像序列对所提出的方法进行了实验验证。实验结果表明,与现有炮弹炸点检测方法相比,该方法在准确率、误检率和鲁棒性方面均具有优越性能。

关键词:兵器科学与技术;炸点检测;背景差分;分层模型;鲁棒字典学习

杨清文(1966—),男,教授,硕士生导师。E-mail:Zgy49@126. com;

秦晓燕(1980—),女,讲师。E-mail:wht_horse@ sohu. com

0 引言

炸点检测为毁伤评估、射击校射和反火力打击中敌方火力位置估计提供重要依据,而利用图像信息快速、精准地实现炸点检测已成为该领域的研究热点。基于图像的炸点检测问题的本质是目标检测,其方法主要有利用单帧图像和多帧图像的目标检测[1]。

利用单帧图像的目标检测,其思想是利用已知的模板或特征在单帧图像中检测目标,具有代表性的方法是基于模板匹配和基于特征内容的匹配算法。文献[2]提出了基于Adaboost算法的炸点检测方法,该方法在一般Haar特征的基础上,增加了一种中心环绕Haar特征,利用Adaboost分类器实现炸点检测。此类方法计算简单、耗时短,但依赖于模板和特征内容的选取,精确性方面往往差强人意。另外,由于炸点的形态多种多样,建立一个完备的训练样本库难度较大。

利用多帧图像的目标检测,其思想是利用多帧图像构造背景模型,计算输入图像帧与背景模型的差值来检测前景目标。背景差分法(BGS)[3]是此类方法中重要的一种,决定此方法性能的关键是背景模型的更新,最简单的情况为背景静止不变,当前帧减去当前背景,通过差分后的像素位置确定目标位置。然而实际中背景往往发生动态变化,如光照变化、背景动态变化以及摄像头移动导致的背景扰动等,因此背景模型需要不断更新。近些年来发展起来的稀疏表示方法为目标检测研究提供了新的思路[4]。研究者们在提高背景模型更新的鲁棒性和自适应性等方面进行了深入研究,对BGS方法不断地改进,得到了多种有效方法[5 -7]。Huang等[8]基于压缩感知理论提出一种基于动态组稀疏(DGS)的BGS方法,通过对前景目标的动态组稀疏恢复和背景的稀疏表示实现目标检测。Zhao等[9]提出的基于鲁棒字典学习(RDL)的BGS方法是用视频前几帧图像作为训练样本建立背景字典,将背景视为背景字典的线性组合,并通过字典学习更新背景模型,在一定程度上避免了背景的动态变化对目标检测的影响。但此类方法在图像列向量化和构造单位矩阵辅助运算的过程中,不可避免使观测矩阵的规模成指数倍增长,导致单次循环计算量过大。

本文对基于鲁棒字典学习的BGS方法进行改进,引入时间窗参数动态选取图像帧建立和更新字典,并控制字典规模,通过背景字典更新提高背景估计的鲁棒性。提出建立分层检测模型,将一帧图像按不同分辨率尺寸进行3层金字塔结构分层,将每层图像分为互不重叠块,并以图像块为单位运行算法,提高运算效率。

1 基于鲁棒字典学习的BGS炸点检测

1. 1 BGS方法

定义观测矩阵L =[I1,…,In]∈Rl×n,其中Ii∈Rl(i =1,…,n)为一帧图像按列存储形成的向量,l为列向量的维数,n为图像帧数。每帧图像可分解为炸点目标Oi和背景Bi为

假设背景差分检测到第t +1帧,背景字典即为D =[D1,…,Dt]∈Rt×t,Di为背景子字典。炸点目标作为前景通常只占单帧图像的少量像素值。根据DGS理论[8],第t +1帧时,Ot +1是DGS的数据,Bt +1可由背景字典D稀疏表示,则有Bt +1= Dxt +1,其中xt +1为稀疏系数,非零值个数k≪l.

新输入图像帧与背景模型的差分值定义为εt +1= ‖It +1- Dxt +1‖2,通过判定差分值大小将图像中相应的像素归入背景或前景,L2范数‖x‖2=,表示欧氏空间距离。差分值目标判定函数为

式中:Ti为检测阈值。当前帧图像与背景模型的差分值在阈值范围内,则判定为背景,否则判定为炸点目标。

1. 2 背景稀疏表示

基于稀疏表示的BGS模型可以重新描述。

对于给定图像帧Ii,背景估计为Bi= Dxi,前景目标为Oi= Ii- Dxi,通过求解下述优化问题得到稀疏表示系数xi为

式中:‖xi‖0是L0范数,表示xi中非零元素的个数;λ为稀疏性惩罚因子,用来平衡稀疏度和误差。求解L0正则化的优化问题是多项式复杂程度的非确定性(NP)完全的,目前无法有效求解。应该注意到,L1正则化项是L0正则化的一种很好的近似[10]。一方面,L1正则化可以得到凸优化问题;另一方面,如果优化问题的解具有稀疏性,在一定条件下,L1正则化确实可以求解特征稀疏问题[11]。因此,(3)式可转化为求解L1正则化优化问题:

式中:E为与D相同尺寸的单位矩阵。

优化问题(4)式的求解过程可视为固定字典下的L1正则化线性最小二乘问题。近年来,学者们求解此类问题多采用软阈值坐标下降方法[12 -13]。此类方法在字典原子间相关性较低时,运算快速高效,但当字典原子间相关性较强时,其表现并不理想。文献[14 -15]通过实验证明LARS-Lasso算法表现不逊色于软阈值坐标下降方法,尤其在字典原子间相关性较强时,有着更高的准确性和鲁棒性。本文中利用多幅图像学习生成背景字典,原子间相关性往往较强,故而采用LARS-Lasso算法。算法详述参见文献[16]。

1. 3 基于鲁棒字典学习的BGS炸点检测方法

正如引言中所述,BGS方法的关键在于背景更新,本文方法通过字典学习来实现背景更新。首先选取视频前若干帧图像作为训练样本,随机生成初始字典,然后通过字典学习不断更新字典,使所有训练样本能在字典下最为稀疏地表出,且误差最小,即求解优化问题:

式中:Im为大小为M的训练样本集中的第m个样本;xm为字典D下的稀疏表达系数。

与传统的字典学习不同,在字典更新中选取L1范数代替L2范数,能够更好地处理奇异值[17]。采用L1范数的优化问题形式为

矩阵形式为

式中:I =[I1,…,Im]为观测矩阵。

对字典进行更新时,(7)式第2项为常数项,可不予考虑。(7)式可改写为

字典中的原子相互线性无关,逐个单独更新。字典更新策略为

式中:dk为字典D的第k个原子;d为dk的第i行元素;xk是X的第k行(与dk相对应的系数);Ii和Ij分别为I的第i行和第j列。

优化问题(4)式和(8)式中都含有D和xm两个未知变量,此类问题的一般解法为交替固定一个变量D或xm,而优化另一个变量。如此往复循环运算,直至目标函数值达到阈值时终止循环,输出解~D 和~x,得到背景估计B =~~ Dx,设定合理的检测阈值Ti,筛选得出炸点目标Oi= Ii-~~ Dx,i = m +1,….

对于较长的图像序列,建立过完备字典将导致构建的字典D =[D1,…,Dt]∈Rm×t过大,不符合实际的运算要求。针对此种情况,本文参照文献[8],根据操作平台硬件实际情况设定时间窗参数τ,控制字典D =[Dt -τ+1,…,Dt]∈Rm×(t -τ)维数,只保留靠近当前帧的几帧图像作为训练样本学习得出的字典。基于鲁棒字典学习的BGS方法伪码如表1所示。

2 分层模型下的检测方法

在通过字典学习对背景模型进行更新的过程中,需使用单位矩阵辅助运算,其维数为当前图像分辨率的平方,如处理图像帧的分辨率为100×100时,转换为列向量的维数达到10 000×10 000,这造成计算量骤增,算法耗时过长。然而,现实中军事摄像仪器得到图像的分辨率往往很高,这将势必导致运算量和复杂度过大。本文采用3层金字塔分层结构,将每层图像分成无重叠块,以图像块为操作单位,利用基于鲁棒字典学习的背景差分方法检测炸点,有效提高了运算效率。分层模型概述如下:

1)第1层,对当前图像帧Ii采样得到原图像1/16分辨率的图像J,分为4个不重叠块,通过算法筛选出包含炸点的图像块;

2)第2层,重新对图像帧Ii进行采样,得到原图像1/4分辨率的图像J,分为16个不重叠块,通过算法筛选出包含炸点的图像块;

表1 基于鲁棒字典学习的BGS方法伪码Tab. 1 Pseudo code of BGS via robust dictionary learning

图1 分层模型下的检测方法示意图Fig. 1 Hierarchical model of blast point detection

3 实验与分析

3. 1 实验环境

为了验证本文所提出的基于分层模型和鲁棒字典学习的BGS炸点检测方法,实验采用100组真实炸点图像序列进行测试。实验数据是利用可见光摄像机在晴好天气获取的图像序列,帧频为24帧/ s,分辨率为320×280,水平视场角14. 5°,垂直视场角10. 9°,观目距离为1. 5~2. 5 km.实验硬件环境为CPU Pentium Dual-Core 2. 13 GHz、内存4 GB的PC机,软件环境为Microsoft Windows 7操作系统,在MATLAB R2014a平台上进行实验。本文方法对图像序列采用一致参数,具体设置如下:训练样本10帧,稀疏性惩罚因子λ= 0. 01,时间窗参数τ= 5,字典遗忘因子为0. 99.金字塔分层模型的最底层保持原图像分辨率,中间层分辨率为160×140,最上层分辨率为80×70.图2分别给出部分炮弹炸点爆炸前图像帧、爆炸后图像帧以及利用爆炸前图像帧样本学习得到的背景字典。

图2 图像帧样本与背景字典Fig. 2 Image frame data and background dictionary

3. 2 实验分析

3. 2. 1 非结构变化

非结构变化是指在实际场景中的雨雪、烟雾、水面波动、光照变化等引起的背景变化。在无学习过程的背景差分目标检测方法中,场景的非结构变化常常导致大量噪声,可能无法有效检测出炸点。如图3所示,视频中的光线变化和因风导致的树冠抖动造成了整个背景的非结构动态变化,从第11帧开始出现炸点。文献[8]提出的无学习过程的DGS背景差分方法,得到的背景估计是固定的,虽然检测出炸点,但出现了明显的噪声,严重影响对炸点的精确判定。本文方法利用多帧图像进行字典学习,利用得到的背景字典对当前帧图像做更为精确和鲁棒的背景估计,在分层模型下进行背景差分得到炸点,检测出的炸点轮廓更加完整清晰,噪声较少。

图3 场景非结构变化下的检测结果对比Fig. 3 Detected results of two methods in the non-structural change of background

3. 2. 2 局部变化

局部变化是指实际场景中的背景物体闪现、遮挡等引起的背景变化。炸点检测关注的目标为炸点,因此希望尽可能避免检测到其他非兴趣目标,如附近公路上陆续通过的行驶车辆、飘动的旗帜等。如图4所示,视频中公路上陆续通过的车辆导致了背景的局部变化,文献[8]方法不可避免地将其检测出来作为候选炸点。由于训练样本中有多帧若干车辆陆续通过的图像帧,本文方法利用这些样本学习得到的字典进行背景估计,将陆续过往车辆作为背景的一部分,克服陆续通过的车辆等背景局部变化对炸点检测的影响。

图4 场景局部变化下的检测结果对比Fig. 4 Detection results of two methods in the local change

采用3层金字塔结构分层模型的目的是提高运算效率。在分辨率最低的第1层中,由于降低了分辨率,减小了单次运算计算量,可直接利用检测方法对全图扫描检测,锁定炸点目标所在图像块。在分辨率较高的第2层中,只需检测第1层炸点目标对应的图像块,大幅度减少了计算量。最后,在原分辨率的第3层中,做与第2层的相同操作,在对应的图块上进行检测,得到更为精确的炸点检测结果,如图5所示。在自适应设定差分阈值过程中,图像帧分辨率越高,差分阈值就越大,因而在分层模型中图像帧分辨率较高的层中差分得到的炸点目标更精确,视觉上来看,得到的炸点区域越小。

图5 模型中3层的检测结果对比Fig. 5 Detected results of three tiers in the pyramid hierarchical model

为说明本文方法在检测精度方面的优越性,利用目标检测常用的评价方法召回率和准确率(RPC)曲线[18],与DGS背景差分方法[8]和基于Adaboost的炸点检测方法[2]进行比较,其中,TP为正确检测的炸点个数,FN为漏检的炸点个数,FP为误检的炸点个数,R为召回率,P为准确率。

由于本文和文献[8]是利用图像序列实现炸点检测,而文献[2]是对单帧图像进行检测,因此本文规定对同一个炮弹爆炸后在不同帧出现的炸点定义为一个炸点,任何一个炸点在包含该炸点的若干帧图像中任何一帧中被检测到,均认定检测成功。本文炸点检测方法得到的RPC曲线采用分层模型最终检测结果数据绘制,同时给出文献[2,8]方法的RPC曲线,如图6所示。通过对比3种方法的RPC曲线,可以看出本文方法在误检率和精确度方面性能优于文献[2,8]方法。需要注意的是,文献[2]中的方法为基于单帧图像的目标检测法,在进行目标检测前完成分类器训练,而本文方法是处理多帧图像的目标检测法,尤其字典学习环节使得整个检测过程耗时较长,100组实验数据检测的平均检测时间为2. 33 s,基本能满足评估系统要求,但其快速性、实时性不如文献[2]方法。

图6 3种方法的RPC曲线对比Fig. 6 RPCs of three methods

4 结论

针对文献[2]方法易漏检、错检以及文献[8]方法鲁棒性较差的不足,本文提出了基于分层模型和鲁棒字典学习的炸点检测方法。该方法在分层模型下,利用图像序列中前几帧图像作为训练样本建立背景字典,通过字典学习更新背景,对背景作出估计,继而与当前帧图像背景差分得到炸点。实验表明,本文方法与文献[2,8]方法相比具有更好的鲁棒性,而且在精确度上具有良好性能,但在炸点检测快速、实时方面略显不足,需要进一步改进。例如:求解稀疏系数和字典学习优化问题的算法可进一步借鉴机器学习领域中高效的算法;金字塔结构模型虽然通过筛选候选炸点图块减小了计算量,缩短了一定的运算时间,然而在特殊情况下,如同一时间内炸点较多的情况下,候选目标图块增多,这使得该模型减小计算量的效率降低。因此,如何改进模型,使其处理好较多炸点同时出现的情况,也是下一步改进方向。

参考文献(References)

[1] Yilmaz A,Javed O,Shah M. Object tracking:a survey[J]. Acm Computing Surveys,2006,38(1):81 -93.

[2] 秦晓燕,王晓芳,陈萍,等.基于Adaboost算法的炮弹炸点检测[J].兵工学报,2012,33(6):682 -687. QIN Xiao-yan,WANG Xiao-fang,CHEN Ping,et al. Artillery blast point detection based on Adaboost algorithm[J]. Acta Armamentarii,2012,33(6):682 -687.(in Chinese)

[3] Benzeth Y,Jodoin P M,Emile B,et al. Comparative study of background subtraction algorithm[J]. Journal Electronic Imaging,2010,19(3):1 -12.

[4] 高仕博,程咏梅,肖利平,等.面向目标检测的稀疏表示方法研究进展[J].电子学报,2015,43(2):320 -332. GAO Shi-bo,CHENG Yong-mei,XIAO Li-ping,et al. Recent advances of sparse representation for object detecion[J]. Acta Electronica Sinica,2015,43(2):320 -332.(in Chinese)

[5] Piccardi M. Background subtraction techniques:a review[C]∥International Conference on Systems,Man and Cybernetics. Hong Kong,China:IEEE,2004:3099 -3104.

[6] Zhou X,Yang C,Yu W. Moving object detection by detecting contiguous outliers in the low-rank representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(3):597 -610.

[7] Lei H,Mei K,Zheng N,et al. Learning group-based dictionaries for discriminative image representation[J]. Pattern Recognition,2014,47(2):899 -913.

[8] Huang J Z,Huang X L,Metaxas D. Learning with dynamic group sparsity[C]∥International Conference on Computer Vision. Kyoto,Japan:IEEE,2009:64 -71.

[9] Zhao C,Wang X,Cham W K. Background subtraction via robust dictionary learning[J]. Eurasip Journal on Image & Video Processing,2011,2011(10):2919 -2929.

[10] 孔康,陶卿,汪群山,等.基于次梯度的L1正则化Hinge损失问题求解研究[J].计算机研究与发展,2012,49(7):1494 -1499. KONG Kang,TAO Qing,WANG Qun-shan,et al. A sub-gadient based solver for L1-rgularization + Hinge -loss problem[J]. Journal of Computer Research and Development,2012,49(7):1494 -1499.(in Chinese)

[11] 孔康,汪群山,梁万路. L1正则化机器学习问题求解分析[J].计算机工程,2011,37(17):175 -177. KONG Kang,WANG Qun-shan,LIANG Wan-lu. Solution analysis of L1 regularized machine learning problem[J]. Computer Engineering,2011,37(17):175 -177.(in Chinese)

[12] Friedman J,Tibshirani R. Pathwise coordinate optimization[J]. Annals of Applied Statistics,2007,1(2):302 -332.

[13] Wu T T,Lange K. Coordinate descent algorithms for lasso penalized regression[J]. Annals of Applied Statistics,2008,2(1):224 -244.

[14] Efron B,Tibshirani R. Least angle regression[J]. Annals of Statistics,2004,32(2):404 -451.

[15] Zou H,Hastie T. Regularization and variable selection via the elastic net[J]. Journal of the Royal Statistical Society,2005,67(2):301 -320.

[16] Zhao P,Yu B. On model selection consistency of lasso[J]. Journal of Machine Learning Research,2006,7(3):2541 -2563.

[17] Bonnans J F,Shapiro A. Optimization problems with perturbations:A guided tour[J]. Siam Review,1998,40(2):228 -264.

[18] Wright J,Yang A Y,Ganesh A,et al. Robust face recognition via sparse representation[J]. IEEE Transactions on Pattern A-nalysis & Machine Intelligence,2009,31(2):210 -227.

Detection of Blast Point Based on Hierarchical Model of Background Subtraction via Robust Dictionary Learning

JI Hong-lei1,YANG Qing-wen1,QIN Xiao-yan2
(1. Department of Long-range Rocket Gun,Army Officer Academy of PLA,Hefei 230031,Anhui,China;2. Department of Management Engineering,Army Officer Academy of PLA,Hefei 230031,Anhui,China)

Abstract:For the background estimation and huge computation problems of background model in the background subtraction blast point detection method,a blast point detection method is proposed based on a hierarchical model of background subtraction via robust dictionary learning. To improve the operation efficiency,a three-tier pyramid hierarchical model is established to divide each frame image into non-overlapping blocks. The blast points are detected from the subtraction between current frame image and image background estimation by using the improved robust dictionary learning method layer by layer. Experimental results on a large number of blast point image sequences show that the proposed method has superior performance in correct detection rate,false positive rate and robustness in comparison with the existing blast point detection method.

Key words:ordnance science and technology;blast point detection;background subtraction;hierarchical model;robust dictionary learning

中图分类号:TP301. 6

文献标志码:A

文章编号:1000-1093(2016)04-0705-07

DOI:10. 3969/ j. issn. 1000-1093. 2016. 04. 019

收稿日期:2015-07-03

基金项目:安徽省自然科学基金项目(1508085QF114)

作者简介:计宏磊(1986—),男,硕士研究生。E-mail:jihonglei_hlj@ sina. com;