APP下载

一种基于GMM和Graph Cuts的图像分割方法

2014-08-25

测绘工程 2014年12期
关键词:曲线图高斯混合

陈 超

(江苏省基础地理信息中心,江苏 南京 210013)

一种基于GMM和Graph Cuts的图像分割方法

陈 超

(江苏省基础地理信息中心,江苏 南京 210013)

图像分割是图像处理中的基础问题。研究利用GMM构造T链的可行性,并探索一种可以兼顾精度与速度的确定GMM中K值的方法,结合GMM和Graph Cuts理论完成了对不同图像的分割实验。实验表明,文中的分割方法准确、有效。

图像分割;高斯混合模型;图割;图论;T链

图像分割是图像处理的一个基础问题,是实现目标检测、图像分析和模式识别的首要工作。按照图像分割模型,可将图像分割分为基于区域分割、基于边缘分割、结合区域与边缘分割以及一些基于特定理论的方法等3种类型。基于区域分割的代表方法有阈值法[1]、区域生长法[2]和模糊聚类法[3];基于边缘的分割方法包括微分算子法[4]和边界跟踪法[5];基于特定理论的算法则有小波变换[6]、Snake模型[7]、水平集算法[8]以及一些其它相关理论算法[9-10]。

本文首先研究了利用高斯混合模型GMM(Gaussian Mixture Model)构造T链的可行性,并探索了一种可以兼顾精度与速度的确定GMM中K值的方法,最后结合了GMM和Graph Cuts理论得到了一种分割图像的方法。

1 高斯混合模型

高斯混合模型是单高斯模型的混合、叠加,它能够平滑地近似任意形状的密度分布,近年来在语音识别、图像处理等方面得到大量运用[11-13]。高斯混合模型的概率密度函数为

(x|μk,∑k),

(1)

其中,

(2)

式(1)表示高斯混合模型由K个单高斯模型组成,式(2)为第k个单高斯模型的概率密度函数。

式(1)、式(2)中,x为已知的D维样本数据;αk为第k个单高斯模型,μk和∑k分别为样本数据的均值和协方差,3个参数均未知。当通过样本数据获得未知参数后,就得到了高斯混合模型的概率密度函数。本文通过EM(Expectation Maximum)算法获得模型中所有未知参数。

1.1 GMM构造T链的可行性

在利用EM算法得到GMM的概率密度函数后,首先将GMM用于图像的聚类分析,并且分别与K均值、FCM算法获得的结果比较,以验证利用GMM构造T链的可行性。

聚类分析实验1如图1所示。图1(a)为随机生成的散乱样本数据,分别利用FCM、K均值和GMM将样本数据分为3类。从图1(b)、图1(c)、 图1(d)中可看出,由于数据简单,3种方法最终的分类结果完全一致。

图1 聚类分析实验1

实验2选择了武汉地区分辨率为30 m的TM影像,实验影像由近红外、红、绿3个波段组成。人眼可以从影像中区分的类别大致包括长江、城区、深色湖泊、浅色湖泊、森林、农田和裸地等七大类。对该影像聚类分析时,考虑到可能存在漏判的区域,将影像分为9类。

从聚类分析实验2的结果(见图2)可知:与FCM以及K均值的聚类结果相比较,GMM的聚类结果更平滑,不存在过多零散区域,更符合实际情况。

图2 聚类分析实验2

由以上两组聚类实验可知:①对于简单数据,GMM、FCM和K均值3种方法获得的结果一致。②对于表现形式复杂的数据,GMM可得到更准确、更符合实际情况的结果。由分析可知,利用高斯混合模型构建T链是可行的。

1.2 一种确定K值的方法

观察式(2)可知,高斯混合模型中唯一需要人工确定的参数为K,一般通过目视观察的方法确定。对同一幅影像而言,不同的K值会对运行时间、最终的结果产生不同的影响。一般情况下,K值越小,运行时间越短,但是精度将受到影响;K值越大,精度将得到保证,但运行速度可能会变慢。本文探讨了一种可以兼顾精度与速度的确定K值的方法,该方法最终得到可供选择的K值范围。

以图2中的实验影像为例,确定K值的方法如下:

1)从影像中选择样本数据;

2)为影像构造一个高斯混合模型;

3)选择不同的K值,利用步骤1)的样本数据并结合EM算法获取高斯混合模型中的所有参数,同时记录解算参数所需的运行时间,获得“K值—时间”曲线图。

图3 图2的“K值-时间” 曲线图

按照上述3个步骤,获得图2中实验影像的“K值—时间”曲线图,见图3。从曲线图中可以看出:当K值在2~5之间时,消耗的时间较少,但K值与实际情况明显不符;当K值在6~9之间时,消耗的时间处于平稳的状态;当K值大于9时,时间代价迅速增加。而在图2的聚类实验中,通过人眼判断分辨出7类地物,最终将K值设定为9。因此可知,将K值设为曲线图中处于平稳状态的6~9时,可兼顾精度与速度。

再选择另外一幅实验影像图4(a),同样获得其 “K值—时间”曲线图,见图4(b)。首先目视观察图4(a),可知影像中大致可分为6类不同的地物。再观察图4(b),该图与图3的分布规律基本一致:当K分别为2、3和4时,运行时间较短,但此时K值明显过少,因此精度并不可靠;当K分别为5~7中的一个值时,消耗的时间基本维持在一个较为平缓的状态;当K的取值大于7时,运行时间开始增加,尤其当K的取值大于10时,时间代价迅速上升。结合对图4(a)的分析可知,将K选取为5~7中的一个数将兼顾精度与速度。

图4 “K值-时间” 曲线图

两组实验说明可将K值设置为曲线图中呈平稳状态的一个数值。

不过该方法自动化程度较低,因此对简单的图像有较好的效果;而对地物要素复杂的影像,不同的样本间差异较大,本文方法未必能获得理想的K值。

2 基于高斯混合模型的图割算法

2.1 图割基本理论

图割(Graph Cuts)是一种基于图论的图像分割方法,近年来在图像分割中已得到较为深入的研究[14-16]。

(3)

式(3)为图割所需的能量函数,等号右边第1项为数据项,体现了像素点p与某一类别的相似性;右边第2项Vpq(fp,fq)为边缘项,体现了相邻像素点之间的相似性;λ1是数据项和边缘项之间的权值,用于调节两者间的比例,为非负值,数据项和边缘项分别对应一幅图像的T链与N链。图割不能直接解算式(3),必须先由图像构造出满足式(3)的T链与N链。解算T链与N链后才能完成对图像的分割。

2.2 T链与N链的构造

按照上文所述,利用GMM构造T链,具体步骤如下:

1)在待分割影像上分别选择若干有代表性的目标样本和背景样本;

2)利用1)的样本,得到目标区域模型和背景区域模型的概率密度函数pF(x)和pB(x);

3)将待分割影像的像素值分别代入pF(x)和pB(x),得到每一像素点分别属于目标模型和背景模型的概率密度值,并进行相关后处理即得到T链。

沿用Boykov[15]的方法构造N链。得到N链与T链之后,利用最大流最小割算法[16]解算即得到分割结果。

3 实验与分析

第1组分割实验选择来自Berkeley数据库的4幅影像,见图5。影像上的椭圆与矩形区域分别表示选择的目标样本与背景样本数据,同时分别代表了前景高斯混合模型和背景高斯混合模型中的K值数目。

图5 分割实验1原图

分割结果见图6、图7。从分割结果可得出结论:①较为完整、有效地得到了目标物体,并且基本排除了其它物体的干扰;②部分目标未被分割出来(图6椭圆标记处),或者部分背景物体被误分割出来(图6矩形标记处)。

图6 分割实验1结果

图7 分割实验2

第2组实验选择了前文已出现的两幅遥感影像,分别分割图中的道路和长江。结果显示,已基本完整地得到了道路和长江。但由于遥感影像较为复杂,尤其道路和周围地物非常相似,同时分割出了大量的干扰物

两组实验表明,本文的分割方法能较为有效地分割出目标,但当目标和背景的光谱值非常相似时,即使利用高斯混合模型构造T链也不能将其区分开。如果在分割过程中加入除光谱信息外的其它信息,如纹理信息和形状先验信息,则可能会消除这些问题。

4 结束语

本文首先验证了GMM用于图像分割的可行性;然后探索了一种获取GMM中K值的方法。该方法兼顾了模型运算精度和速度;最后利用GMM构造T链,并基于图割理论分割影像。分割实验表明,该方法能够较为准确地得到目标物体。

对于较为复杂的影像,可能会产生误分割和未分割的现象。如果在分割过程中引入纹理特征、形状先验等一系列其它信息,有可能会消除这些问题。

[1]韩思奇,王蕾.图像分割的阈值法综述[J].系统工程与电子技术,2002,24(6):91-94.

[2]潘婷婷,李朝锋.基于区域生长型分水岭算法的卫星图像道路提取方法[J].计算机工程与设计,2008,29(19):4987-4989.

[3]王明华.一种基于模糊聚类的车牌图像分割方法[J].黑龙江工程学院学报:自然科学版,2013,27(1):41-44.

[4]雷丽珍.数字图像边缘检测方法的探讨[J].测绘通报,2006(3):40-42.

[5]田军委,尚雅层,王洪喜,等.基于方向预估计的边界跟踪算法[J].应用光学,2011,32(3):441-445.

[6]韩冰,赵银娣,戈乐乐.遥感图像分割的迭代上下文融合小波域HMT模型[J].测绘学报,2013,42(2):233-238.

[7]石云峰.基于Snake模型的图像分割方法研究及应用[D].西安:西安电子科技大学,2009.

[8]王昆,贾士军,朗博.先验形状约束的水平集分割模型[J].测绘通报,2013(6):31-34.

[9]魏超,刘智,王番,等.压缩感知理论及其在图像融合中的应用[J].测绘工程,2013,22(2):30-33.

[10]杨智翔,何秀凤,危来龙.一种多极化SAR图像融合研究[J].测绘科学,2014,39(2):14-18.

[11]李贺,秦志远,许龙.基于多尺度图分解的极化SAR图像分割算法[J].测绘科学,2014,39(1):110-113.

[12]余鹏,封举富.基于高斯混合模型的纹理图像分割[J].中国图象图形学报,2005,10(3):281-285.

[13]崔宣,孙华.基于SVM-GMM混合高斯模型说话人辨认的研究[J].黑龙江工程学院学报:自然科学版,2009,23(4):54-57.

[14]刘嘉,王宏琦.一种基于图割的交互式图像分割方法[J].电子与信息学报,2008,30(8):1937-1976.

[15]BOYKOV Y,JOLLY M P.Interactive Graph Cuts for Optimal Boundary & Region Segmentation of Objects in N-D Images[J].Imaging and Visualization Department Siemens Corporate Research,2001:105-112.

[16]BOYKOV Y,KOLMOGOROV V.An Experimental Comparison of Min-Cut Max-Flow Algorithms for Energy Minimization in Vision [J].IEEE Transactions on PAMI.2004,26:1124-1137.

[责任编辑:刘文霞]

An image segmentation method based on GMM and Graph Cuts

CHEN Chao

(Jiangsu Geomatics Center,Nanjing 210013,China)

Image segmentation is a foundational task in image processing.The possibility of obtainingT-link is presented based on GMM in the first place,and a method of determiningKwith accuracy and speed is proposed. Finally the segment experiments are made on different images successfully with GMM and Graph Cuts.Experiments show that the method is accurate and feasible.

image segmentation;Gaussian mixture model;graph cuts;graph theory;T-Link

2013-11-03;最后修改日期:2014-12-03

国家自然科学基金资助项目(41271420);江苏省测绘地理信息科研项目(JSCHKY201421)

陈 超(1987-),女,硕士研究生.

TP391.41

:A

:1006-7949(2014)12-0052-04

猜你喜欢

曲线图高斯混合
混合宅
秦皇岛煤价周曲线图
秦皇岛煤价周曲线图
一起来学习“混合运算”
秦皇岛煤价周曲线图
秦皇岛煤价周曲线图
数学王子高斯
天才数学家——高斯
从自卑到自信 瑞恩·高斯林
混合所有制