APP下载

基于神经网络的运动目标检测算法研究

2019-01-10黄有山秦宏帅施刚强胡一奇

智能物联技术 2018年3期
关键词:高斯分量卷积

黄有山,候 鸣,秦宏帅,徐 玲,施刚强,胡一奇

(1.浙江新纳陶瓷新材有限公司,浙江 东阳 322100;2.滁州市质监局,安徽 滁州 239000;3.杭州电子科技大学,浙江 杭州 310018)

0 引言

运动目标检测是目前智能视频监控的基础技术之一,其核心是利用计算机视觉技术和数字图像处理技术来对获取的视频进行自动分析处理进而判断其中是否有运动目标存在的一种技术。运动目标检测广泛应用于机动车辅助驾驶、智能视频监控、机器人以及人体行为分析等领域。在一些特定区域如机场、政府、军事区等对安全性要求比较高的场景,需采用运动目标检测对一些危险情况进行及时报警。运动目标检测还可用于对运动目标的跟踪和运动分析,不仅能用于安防方面的人员追踪,还能为人体运动研究、运动目标个体行为研究等提供支持。

随着人工智能、机器视觉技术的不断进步,人们对该技术的需求也越来越高。但在实际应用中,因运动目标图像容易受到光照、穿着、姿态、遮挡以及拍摄角度的多样性等影响,运动目标检测成为计算机视觉领域的研究难点与热点。当前制约该技术发展的因素有以下几个:虚警问题,即计算机把不是运动目标的物体或者背景当做了运动目标;检测率不理想,即计算机把运动目标当做了非运动目标来处理;检测速度慢,即计算机每秒能处理的视频帧数少。

芮挺[1]等提出了基于卷积神经网络(CNN)的运动目标检测算法,最终确定深度卷积神经网络结构共分7层,卷积核大小为9×9,隐含层输出特征维数为360维左右时效果最佳。Carlos Ismael Orozco[2]等提出了一个深度卷积网络架构,将之前生成的候选区域划分为运动目标或非运动目标——使用一个简单的金字塔滑动窗口方法。卷积神经网络在这个系统中不需要预先分类阶段的帮助,也不需要特殊的模糊步骤或首字母条件,就能从非运动目标图像中对运动目标进行分类,使其比其他基于卷积神经网络的解决方案更直接。胡洋[3]等提出了基于回归窗口和全局概率的运动目标检测方法,并进一步探索端到端的网络结构与传播方式,以保证较高的检测准确度。薛璐晨[4]等设计了基于OpenCV的运动目标异常检测系统,通过金字塔Lucas-Kanade方法跟踪分析特征点光流,获得特征点在图像中的光流特性,进行运动估计。Sanjukta Ghosh[5]等提出了一种利用训练有素的深度卷积神经网络来检测运动目标的新方法,该方法避免了通过边界框对训练数据中运动目标位置的不确定定位。岳颀[6]等采用PCA非监督学习方式获取导向性初始化参数数值方法,并基于对网络误差的传播分析,提出指数自适应弹性动量参数学习方法。靳培飞[7]等根据SVM(Support Vector Machine)检测运动目标时所表现出的特点,快速提取出运动目标ROI区域,然后在提取的ROI内部使用可变形部件模型(DPM)检测运动目标。谢林江[8]提出一种改进的卷积神经网络模型,即在第一个卷积层前加入一个选择性注意层,模拟人眼的选择性注意功能,选取LBP纹理预处理和梯度预处理为该层运算。

本文首先为了全面描述运动目标的特征属性,使用HOG(Histogram of Oriented)特征和颜色特征相结合的特征融合方法,克服了单特征描述能力不全面的问题,并使用主成分分析法对特征维度进行降维,克服了多个特征数据量大的问题;其次为了能高效识别运动目标,使用经过调优结构后的BP神经网络,克服了检测时间长的问题。

1 运动目标检测算法[9][10]

运动目标检测的任务是将运动的物体(感兴趣的物体)从背景中最大程度地提取出来,一般使用黑白二值图来表示运动目标的检测。Stauffer C[9]等提出了基于利用高斯分布来描述像素点的方法。该方法通过不断更新高斯分布的参数来实现对背景的适应,同时通过维护一组权值较高的高斯分布(一般是3~5个)来实现对动态背景的拟合。

存在像素X,则其混合高斯模板为:

其中δw为提前设好的阈值,ωtk代表了第K个高斯分量的权重。

在判断当前点属于前景还是背景时需要经过以下几个步骤:

(1)高斯分量按照权重从大到小与像素X逐一对比,判断像素X是否落在高斯分量的中心2.5σ以内;

(2)若落在其内则判定为背景,落在其外则继续对比下一个高斯分量;

(3)重复2步骤直到最后一个高斯分量,若依然没有落入相应的高斯分量的2.5σ以内则判定为前景。

混合高斯模板的高斯分量更新只在前景检测的结果为前景或前景检测结束时Q的数量小于设定的上限时对其维护的高斯分量进行维护。当前景检测结果为背景且Q的数量小于设定的上限,则为该像素X建立一个高斯分量并加入到已有的高斯分量组中,若Q等于设定的上限则将权重最小的高斯分量删除并为该像素X建立一个高斯分量并加入到已有的高斯分量组中。

混合高斯模板为像素X所维护的高斯分量数据中的不同参数的公式如下:

其中α和β为更新系数,由一般经验得知α和β通常为0.02。

对于所有维护的高斯分量的权重ωtk、ωt+1k的更新如下:

其中式(5)是像素X中权重最大的高斯分量的权重的更新公式;式(6)是其余高斯分量权重的更新公式;式(7)是对已有的高斯分量进行系数归一化的公式,这样设置是为了削弱除权重最大的高斯分量之外的其余高斯分量的权重。

算法通过视频序列的第一帧图像来初始化混合高斯模板,并在后续的视频序列检测中继续完善混合高斯模板的高斯分量。混合高斯模板对前景的提取效果好、结构简单,对计算机的要求也相对低,在较小系统消耗的情况下能做到每秒20帧左右的速度,该方法已经能满足视频处理中的实时性要求。

2 人工神经网络优化

人工神经网络是研究人员在人脑神经网络的启发下通过模拟人脑神经网络工作方法来实现的一种模式识别方法。在图1中,最左侧为输入层,中间为隐藏层,最右侧为输出层。相同层之间无连线,不同层中间全部连线。每一条线段代表一个权值。除输入层以外每层点的求值公式如下:

图1 神经网络拓扑结构

式(8)中wi为第i个点对应的权值,为第i个点的值。训练神经网络的过程就是寻找最优权值组的过程。以BP神经网络为例,其通过反向传播来实现对权值组的最优调整,通过寻找使上层网络的实际输出与下层网络的实际值之间的平方误差最小化。误差求和公式如下:

式中outputs指神经网络中输出层单元的集合,tkd和okd指训练样本d在第k个输出层的值。

该方法需要在解空间中寻找能使平方误差和E最小的权值组。同时为了防止神经网络在训练时陷入无限循环的问题,一般给其设立了3个结束训练的条件:

(1)迭代次数超标;

(2)平方误差和E降低到了预先规定的值;

(3)当其在测试样本中达到预先要求。

3 测试结果与分析

使用pets2001标准视频进行测试。pets2001标准视频由测试视频和训练视频共5个部分组成,由于其中第一部分有树木遮挡、第五部分为车载镜头拍摄,使用其中第二部分和第四部分作为算法的室外场景来对算法进行实验。

在特征提取步骤中,首先利用获取的代表运动目标位置的矩形框坐标从原始图像帧中截取相应位置的图像作为运动目标图像,并将其归一化到预先设定的大小以便后续的特征提取操作,使用的归一化大小是64×128像素。

其次,从运动目标图像中按照HOG特征和颜色特征的提取方法获取描述运动目标属性的特征数据组。然后通过主成分分析法将获取的描述运动目标属性的特征数据组维度降低。

模式识别步骤中,BP神经网络在得到降维后的代表运动目标属性的特征数据组之后,调用事先使用INRIA运动目标数据库中的训练样本训练好的BP神经网络来对运动目标进行智能判定,并输出该运动目标为运动目标的概率和非运动目标的概率。通过BP神经网络输出的代表运动目标为运动目标的概率和非运动目标的概率来判断运动目标检测环节检测出来的目标是否为运动目标:若其为运动目标则将代表该运动目标位置的矩形框标记成蓝色;否则不做反应,直接将输入图像帧作为输出图像帧输出。

图2显示了算法在pets2001标准视频上的部分实验结果。算法检测出了视频中的运动的运动目标,并对其作出了标记。

根据检测结果,从检测率、检测速度、对运动目标错误检测为非运动目标的概率、对背景或非运动目标检测为运动目标的概率共4个指标来对算法进行效果和性能的评估。实验证明,采用基于神经网络算法的运动目标检测在使用单隐层结构BP神经网络、隐层节点数为80、阈值为运动目标概率为1.4,非运动目标概率为0.4的时候达到最佳值,算法表现如表1。将本样本集运用目前主流的HOG特征+支持向量机SVM算法进行运动目标检测,结果对比如表2。

表1 检测方法性能指标

表2 不同算法的识别率比较

图2 pets2001标准视频检测试验结果

上述对比结果进一步表明基于神经网络算法的运动目标检测能够更好地提取运动目标特征并完成对运动目标的检测,与HOG特征+支持向量机SVM算法相比,正确率有明显提升,识别速度也有所提高。

4 结语

在室外场景下基于神经网络算法进行运动目标检测,使用HOG特征和颜色特征相结合的特征融合方法,并使用主成分分析法对特征维度进行降维。实验证明,算法对视频中的运动目标检出效果好。同时,通过与目前使用较多的HOG特征和支持向量机SVM的方法进行对比,在总识别率上有明显提升,在检测速度上也有所提高。

猜你喜欢

高斯分量卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络的分析与设计
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
数学王子高斯
天才数学家——高斯
从滤波器理解卷积
论《哈姆雷特》中良心的分量
基于傅里叶域卷积表示的目标跟踪算法
从自卑到自信 瑞恩·高斯林