APP下载

MFR-MAP相结合的运动目标检测方法研究

2010-04-16赵彤洲王海晖

电脑与电信 2010年10期
关键词:空域时域像素

赵彤洲王海晖

(1.武汉工程大学智能机器人湖北省重点实验室,湖北武汉430073;2.武汉工程大学计算机科学与工程学院,湖北武汉430073)

1.引言

运动目标检测就是在视频序列中检测出图像变化的区域,并将运动目标从背景中提取出来,以获得运动目标的运动参数,从而为运动目标的行为理解等更高一级的任务提供分析依据[1]。在目标检测过程中,如何保证提取到的目标边界尽量准确的同时,还要使目标尽量完整,符合人类的视觉感受。一直是我们研究的方向。运动目标检测方法的研究往往与静态图像分割算法密切相关。静态图像由于不含有时间信息,因此这类图像的分割算法是在空域进行的;而视频序列不仅含有空间信息,还与时间有密切相关性,因而这类算法往往在时域内进行。本算法采用基于Markov Random Field-Maximum Posterior Probability(MRF-MAP)框架的时-空联合的目标检测手段。首先,进行空域检测。利用Mean-Shift算法在图像域和特征域寻找概率密度较大的区域,并进行标注;其次,进行图像分割。对标注过的图像用优化的分水岭算法进行图像分割;第三,进行时域检测。利用帧间差分法对图像进行运动检测,以获得运动目标的估计;最后,进行时-空联合检测。在MRF-MAP框架下,将序列图像包含的时域信息和单帧图像内部的空域信息相结合,以达到更为精准的检测结果。

2.MRF-MAP框架

MRF-MAP框架是基于MRF模型和Bayesian判据理论的时-空联合检测方法。MRF模型能在连续的两个运动分割之间建立某种时间链接,并且可以按照目标要求构造能量函数,现已成为研究运动目标检测方法的主要手段。MAP是MRF建模中最常用的最优化准则,在给定数据观测场的条件下,使数据标记场基元的全局后验概率分布达到最大[2]。

由相关数学知识已知,Gibbs随机场模型能够有效地描述一个质点的局部统计特征和随机场的联合统计特性,MRF以局部性为特征,而Gibbs随机场以全局性质为特征,Hammersley-Clifford定理描述了这两个模型的等效性[2,3]。因此,MRF的局部特性可以从Gibbs组合分布中获得,如果定义了Gibbs随机场的能量函数,就可以确定MRF。

2.1 MRF-MAP框架下的目标检测问题描述

为了在MRF-MAP框架下对目标检测问题进行描述,有如下假设:

设观测到的图像为(观测场):g=(g1,g2,……gk),其中gk是像素为k的灰度值;

人工标记的图像为(标记场):f=(f1,f2,……fk),其中fk是标记类别;

根据Bayesian定理,在给定观测场g的条件下,标记场f的概率为[4]:

对一帧图像而言,(1)式中的P(f)是标记场的先验概率,该值可由Gibbs分布得到,P(g)是常数,P(g|f)是给定标记场f时的观测图像g的条件概率。目标检测就是在上述观测数据的基础上,求P(f|g)的最大分割,即:

2.2 利用优化能量函数求解目标检测问题

由MRF与Gibbs分布之间的等价性关系,可以通过优化能量函数的方法来求解P(f|g)的最大分割。

在Gibbs随机场中,标记场f的概率表示为[4]:

其中,U(f)是先验能量函数,Z是概率分布归一化因子。同理,后验概率为:

其中U(f|g)=U(g|f)+U(f)。因为Z为常数,所以最大化后验概率P(f|g)等价于最小化后验能量函数U(f|g),因此帧内像素类别划分的问题也就转化为最小化后验能量函数的问题,即MAP估计。将(4)式代入(2)式有:

因此,如果在目标检测过程中,将待求的标记场作为一个随机场,将观测值作为满足该随机场条件的一个先验分布P(g|f),目标检测问题将转化为公式(5)。

3.时空联合的检测方法实现

3.1 利用Mean-Shift算法进行空域检测

Mean-Shift算法是一种非参数的密度梯度估计方法[5]。它在估计概率密度的峰值时,无需搜索整个特征空间,且算法复杂度小,是无参数算法,易于与其它算法集成,采用加权直方图建模,对目标旋转、轻微变形和部分遮挡不敏感,近年来已广泛应用在实时目标跟踪领域中。利用Mean-Shift算法进行空域检测过程如下:

(1)图像预处理。进行空域检测的目的是为获得较为清晰的目标轮廓和形状。通常,利用边缘检测可以获得目标边界,但是,如果单纯对图像进行边缘检测,往往受目标背景和物体内部细小纹理的影响较大,会产生不连续的、零散的边缘线段,不能形成较为连续的轮廓。同时考虑到图像的噪声,因此,本算法对图像进行了一些预处理,首先进行图像平滑处理,再进行Sobel边缘检测。

(2)颜色空间转换。我们常用的RGB色彩空间是一种非均匀的颜色空间,在分割前,要将图像从RGB色彩空间转换至LUV空间。

(3)图像聚类。用Mean-Shift算法在图像的特征空间先进行聚类预处理,使用颜色直方图分布作为特征对跟踪的目标区域进行描述,使具有足够视觉分辨能力的、相似度性较高的色彩能够被分割在相同区域内。同时,对这些区域进行标注。标注的目的是为了防止过分分割,为下一步图像分割做准备。颜色建模中使用核密度估计技术,避免了必须保存完整数据的麻烦。

在特征空间的一次搜寻过程可归结如下:

①设定搜索窗球半径hLuv,并在特征空间中选择一个初始位置xi;

②计算搜索窗内像素的Mean-Shift向量;

③根据Mean-Shift向量移动搜索窗;

④goto step②,直到收敛到相应的局部密度极大值处;

⑤先在该局部极大值处做标记,假设其为本章需要的视觉关注区,后面将映射回图像空间做进一步确认。

(4)图像分割。本算法将对经过Mean-Shift算法进行聚类标注过的区域采用分水岭算法进行分割。分水岭算法的基本思想是把图像看作是测地学上的拓扑地貌,图像中每一点像素的灰度值表示该点的海拔高度,每一个局部极小值及其影响区域称为集水盆,而集水盆的边界则形成分水岭[6]。该算法包括排序和浸水两个部分。首先对每个像素的灰度级进行从低到高排序,然后在从低到高实现淹没过程中,对每一个局部极小值在h阶高度的影响域采用先进先出(FIFO)结构进行判断及标注。由于传统分水岭算法容易产生过分分割问题,破坏目标的整体性,因此,采用改进的Vincent-Soille算法,即将各个已标注区域的特征值置为其特征空间收敛点的值,并依次编号,然后再使用分水岭算法。

3.2 利用在显著性水平约束下的帧间差分法进行时域检测。

帧间差分法由于运算速度快、便于实现,广泛应用于时域检测。但是,这种方法对于运动目标内部的色彩一致性区域不易检测,且对噪声敏感,提取结果往往存在大量不连续的细小区域,因此,对于判定像素是否为背景还是运动目标,我们采用如下的假设检验:

H0:像素属于背景;H1:像素属于运动目标;则背景像素的概率为[7]:

在点(x,y)附近取一个小的邻域,记为w(x,y),(x,y)∈w(x,y)。一般情况下,w(x,y)内的像素应该具有相同的状态,即或者都属于背景,或者都属于运动目标区域。在邻域w(x,y)内求累计能量,记为(x,y),有:

3.3 基于MFR的时-空联合检测

在前述理论基础之上,设计了基于MFR的时-空联合检测方法,该方法首先构造时-空联合的MFR模型,进而构造出相应的能量函数。具体如下:

(1)构造时-空联合的MFR模型。将空间Markov随机场模型在时间域上扩展,将时域检测得到的运动信息作为标记场f,在连续两场标记场上建立时-空联合MFR模型:即将当前时间的初始标记场作为标记场的先验条件,并用前序时间标记场和时、空域的检测信息作为约束条件,来优化当前时间标记场。从而为构造时-空联合的MFR能量函数奠定理论基础。

(2)构造能量函数。这里能量函数包含先验能量函数和似然能量函数。在此将能量函数表示为U(f,g)=U1(f)+U2(f,g),其中,U1(f)是先验能量函数,U2(f,g)是似然能量函数。因此,运动目标检测问题转化为求能量函数的最优值问题。

定义2:似然能量函数:将时域和空域检测得到的信息分别作为约束条件,则定义的似然能量函数为时域平滑信息和空域平滑信息之和。即:

其中,第一项是时域检测得到的运动信息导致的时域平滑项,描述了像素之间的运动相关性;第二项是由空域检测得到的区域信息导致的空间平滑项,描述了像素对在空间区域上的相关性。

(3)优化能量函数。当构造了能量函数后,就可以对上述能量函数U(f,g)进行优化,寻找最优解。本算法首先计算图像中的每个像素在取不同标记状态时的能量函数,并用迭代法选取使能量函数U(f,g)最小的状态作为该随机变量的标记,直到达到收敛条件或迭代次数,最终得到理想的目标检测结果。

4.结论

采用基于MFR的时-空联合检测方法,由于算法综合利用了序列图像之间的时域信息,及单帧图像内部的空域信息,可以在很大程度上保证被提取目标边界准确的同时,使目标对象尽量完整,以符合人的视觉感受。该方法在图像处理和视频分析领域有广泛的应用,不仅具有理论研究价值,在实际工程应用中也有很高的应用价值。

[1]卢晓鹏.视频序列中目标跟踪技术研究[D].北京:中国科学院研究生院,2007.

[2]覃剑.视频序列中的运动目标检测与跟踪研究[D].重庆:重庆大学,2007.

[3]陈木法.随机场概论[J].数学进展,1989,18(3):294-322.

[4]Geman S,Geman D.Stochastic relaxation,Gibbs distribution and Bayesian restoration of images[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,2008,6:721-741.

[5]Cheng YZ.Mean shift,mode seeking and clustering[J].IEEE Trans.on.Pattern Analysis and Machine Intelligence,2005,17(8):790-799.

[6]Vincent L.and Soille P.Watersheds in digital spaces:an efficient algorithm based on immersion simulations[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,1991,13(6):583-598.

[7]Geiger,D.,Yuilli,A.A common framework for image segmentation[J].Int’l.J.Comput.Vis.,2006,6(3):227-243.

猜你喜欢

空域时域像素
像素前线之“幻影”2000
我国全空域防空体系精彩亮相珠海航展
“像素”仙人掌
基于时域信号的三电平逆变器复合故障诊断
ÉVOLUTIONDIGAE Style de vie tactile
基于极大似然准则与滚动时域估计的自适应UKF算法
基于贝叶斯估计的短时空域扇区交通流量预测
浅谈我国低空空域运行管理现状及发展
基于能量空域调控的射频加热花生酱均匀性研究
高像素不是全部