APP下载

一种自适应图像数据源的花卉图像分割方法

2016-03-17王钰婷廖周宇

计算机应用与软件 2016年2期
关键词:数据源像素点分量

王钰婷 李 珺 廖周宇

1(兰州交通大学电子与信息工程学院 甘肃 兰州 730070)

2(河池学院计算机与信息工程学院 广西 宜州 546300)



一种自适应图像数据源的花卉图像分割方法

王钰婷1李珺1廖周宇2

1(兰州交通大学电子与信息工程学院甘肃 兰州 730070)

2(河池学院计算机与信息工程学院广西 宜州 546300)

摘要为解决自然场景下各种颜色花朵目标的提取问题,提出一种基于自适应图像数据源的彩色图像分割方法。该方法中,一幅图像的不同数据源对应着此图像不同的色彩分量信息。由于模糊C均值聚类算法(FCM)是一种局部搜索算法,因此新方法中首先利用细菌觅食优化算法(BFO)的全局寻优性与FCM结合,从而寻得一幅图像在多个色彩分量下各自的全局最优聚类中心;然后利用一种新的综合的模糊聚类评价函数求得此图像在其不同色彩分量下即不同数据源下的分类质量;最后输出分类质量最好的分类结果。通过对真实场景中采集的10幅具有代表性的图像进行实验,结果证明新方案能适应目标颜色和背景因素的变化,分割出更接近期望的目标。

关键词自适应图像数据源彩色图像分割新的模糊聚类评价函数FCMBFO目标提取

A FLOWER IMAGES SEGMENTATION METHOD BASED ON ADAPTIVE IMAGE DATA SOURCES

Wang Yuting1Li Jun1Liao Zhouyu2

1(School of Electronic and Information Engineering,Lanzhou Jiaotong University,Lanzhou 730070, Gansu, China)2(School of Computer and Information Engineering,Hechi University, Yizhou 546300, Guangxi, China)

AbstractTo solve the problem of extracting the goal of flowers in various colours under natural scene,this paper presents a colourful image segmentation method which is based on self-adaptive image data source. In this method,different data sources of an image correspond to different colour component information in image. Since fuzzy c-means clustering algorithm (FCM) is a local search algorithm,therefore the new method first uses the global optimisation property of bacterial foraging optimisation (BFO) algorithm and combines it with FCM,so as to find the respective global optimal cluster centre of an image under multiple colour components; then,the new method uses a new integrated fuzzy clustering evaluation function to obtain the classification quality of the image under different colour components,i.e. different data sources; finally,the new method outputs the classification results with best classification quality. The paper experiments on ten representative images in real scene acquisition,results prove that the new scheme can adapt to the changes of the target colours and background factors,and segments the targets closer to expected goal.

KeywordsSelf-adaptive image data sourceColourful image segmentationNew fuzzy clustering evaluation functionFCMBFOTarget extracting

0引言

图像分割是目标提取与识别的基础,分割结果的好坏直接影响着图像处理的最终结果。目前,图像处理技术越来越多地被应用于目标的自动识别系统,其中需要解决的首要问题就是图像中目标的准确分割。国内外许多学者对植物目标的分割方法或技术进行了大量的研究,提出了许多不同的色彩模型和分割方法。Perez等[1]利用RGB色彩空间中的颜色特征因子的组合(G-R)/(G+R)作为图像分割的数据源,实现了土壤和植物的分割。Zhou等[2]使用RGB色彩空间中的色差法G-R和R-B分割出树上的苹果目标。崔永杰等[3]通过不同颜色空间的对比,利用R-G色差分量实现了自然环境中猕猴桃的识别。王新忠[4]在HIS色彩空间下实现了成熟番茄目标的识别。王玉德等[5]融合CIELAB和HSV色彩空间信息,实现了复杂背景下甜瓜果实目标的分割。

在上述研究中,主要利用一种或多种色彩空间颜色分量的组合作为某一特定农作物图像分割的固定数据源。由于其方法主要针对某种特定的农作物提出,从而不具备普遍适用性。

基于现有的研究,本文提出一种基于细菌觅食模糊聚类算法和自适应图像数据源方案的彩色图像分割方法,实现了不同颜色花朵目标在各种复杂背景下的有效分割。

1模糊C均值聚类算法

近年来,将模糊理论应用于图像分割领域已成为热点,由于图像本身具有模糊性与不确定性,而模糊理论正好具有处理这种模糊性与不确定性的天然优势。基于模糊理论的图像分割算法有很多,其中最著名的要数模糊 C 均值聚类算法FCM。FCM算法的策略是通过迭代不断更新目标函数,当目标函数收敛于极小值时则寻得全局最优解[6]。

从很多文献可以看出FCM算法本身存在一些不足:(1) FCM对初始聚类中敏感[7],初始聚类中心的选取会直接影响到最终的聚类结果;(2) FCM对噪声较为敏感[8];(3) 由于其计算数据是基于每个像素点的,故其算法计算量较大。

为了解决此算法对初值敏感、易陷入局优的缺陷,有学者利用智能算法的全局寻优性与FCM进行结合,如文献[9]结合蚁群算法、文献[10]结合粒子群算法、文献[11]结合遗传算法分别针对FCM进行了改进。虽然改进算法的全局搜索力得到了改善,但是由于引入智能算法使得新算法搜索时间变长,算法收敛速度较慢,特别是当数据量较大时容易出现早熟现象。而BFO是一种全局性的寻优算法,且其算法简单、具有鲁棒性、相对较快的收敛速度[12]和精细的搜索特性[13],使其在学术研究和工程应用方面都具有重大的价值。故本文将BFO和FCM进行结合,从而使新算法具有更快的收敛速度、更强的全局寻优能力和更好的寻优精度。

2细菌觅食算法介绍

细菌觅食算法,是模仿大肠杆菌在人体肠道内寻找食物行为的一种仿生算法。该算法主要通过三大操作迭代计算来求解问题,这三大操作分别为:趋向性操作、繁殖操作和迁徙操作[14]。趋向操作是细菌向环境好的区域聚集的行为,它包括两种模式(翻转和前进)。翻转是指细菌向着任意的一个方向移动一个单位步长,前进是指在翻转后细菌个体的适应度值得到改善,则它沿着上一步的方向继续移动,直到其适应度值不再变好,或达到预定的最大连续移动步数。趋向性操作结束后,进入繁殖阶段,首先根据趋向过程中各个细菌的适应度值进行排序,然后让适应度较差的一半个体继承适应度较好的一半个体的位置信息,此过程模仿了自然界的“优胜劣汰”行为。在繁殖操作完成后,细菌将按一定的概率被迁徙到搜索空间中的一个随机位置,此操作被称为迁徙操作。在此算法中,通过菌群不断依次重复这三大操作,形成了高效快速的寻优模式。文献[15,16]表明此算法收敛速度快,具有较强的全局寻优能力。

3自适应数据源的图像分割算法

由于自然环境中鲜花的颜色是多种多样的,在一幅包含鲜花目标的图像中,背景大多为绿色的枝叶。作为目标的花朵虽然有各种颜色但其颜色相对于背景它的红色分量较大,于是在本文中选用了RGB色彩空间。图像分割的实质是将目标和背景进行分离,让它们分属于不同的一类。如果目标和背景的差距越大,目标就分割得更明确,属于目标的像素点就不会被误分给背景类,其分割效果也将越好。由于同一图像在不同的色彩分量下其目标和背景有着不同的差距,也就是说如果某一色彩分量下目标与背景的差距最大,则其分割效果将会最好。因此要想取得好的分割效果,我们只需将目标与背景差距最大时的色彩分量作为数据源进行处理即可。本着这样的思路进行了本文的实验。针对鲜花目标图像的分割,本文选用了RGB色彩空间下的R分量、G分量、B分量和R-G色差分量作为图像分割的数据源。

3.1R-G色差分量

R-G色差分量在农业领域的成熟果实目标的分割中运用得相当广泛[17-19 ],由于成熟果实的分割和鲜花目标的分割具有一定的相似性,故将其色差分量选为鲜花目标分割的数据源之一。

由于R、G、B各自的分量取值范围是[0,255]而R-G的取值范围为[-255,255],故将R-G的数据进行转化使其取值范围同样为[0,255]。这样做的目的类似于数据的标准化。数据转换如下[19]:

(1)

其中,Fi代表图像中第i个像素点的R-G的分量值,Ri为第i个点的R分量值,Gi为该像素点的G分量值。于是式(1)的取值范围变为[-1,1],再通过式(2)的转换[19],其取值范围便是[0,255]。

(2)

3.2BFO与FCM的结合

通过将FCM的目标函数作为BFO的寻优目标函数,让BFO替代FCM进行全局寻优,从而迅速找到在各个颜色分量下具有较高精度的全局最优聚类中心。并根据聚类中心求得每个颜色分量下每个像素点到对应聚类中的隶属度值,再根据最后的结果利用新的评价函数计算每个颜色分量下的聚类质量。

由于图像本身的数据量较大,为了降低计算量,减少大尺寸图像给算法带来过重的计算压力,故采用基于直方图的快速FCM算法,即参与运算的数据为图像数据的直方图,而非图像中每个像素点的数据。

3.3新的模糊聚类评价函数

针对模糊聚类结果的评价函数有很多,常用的有划分系数[20]、划分熵[21]、Xie-Beni指标[22]等。

划分系数表示类与类之间的重叠量,其值越大表示分割效果越好。对于给定的聚类中心数c和隶属度矩阵U,划分系数F(U;c)定义为:

(3)

划分熵代表类别本身的模糊程度,其值越小分割效果越好,其函数如下:

(4)

Xie-Beni指标即类间关联度,其值越小分割效果便越好,其函数定义为:

(5)

本文的评价函数是建立在以上3个指标上的。为了评价在不同颜色分量下的聚类结果的好坏,本文中新的评价函数综合了以上三个指标。当其综合指标最优,则其对应颜色分量下的聚类结果最好。为了公式的简洁,下面将划分系数用Vpc代替,划分熵用Vpe代替,Vxb则表示Xie-Beni指标。

新的评价函数中,首先通过式(6)中的3个子公式分别将每个颜色分量下的3个指标进行标准化,这样可以避免不同指标的取值范围差异对评价结果造成影响。其中k=4,因为选用了4个颜色分量的数据源。新的综合评价函数如下:

(6)

(7)

3.4对分割结果的修正

在图像分割领域,图像的分割结果常受到噪声的影响[23-25]。为了分割出更加符合人们期望的目标,本文利用邻域像信息对其最优分割结果中的噪声点进行了修正。首先定义一种邻域信息函数,用于计算和保存每个像素点的领域像素信息。其表示如下:

(8)

式中,Aij代表以像素点xi为中心的一个正方形(亦可设置成其他形状)邻域内,所有像素点隶属于第j类的平均隶属度值。N(xj)代表以xi为中心的邻域内所有像素点。num代表邻域内像素点的个数。

噪声点的判断条件如下:

(9)

当像素点xi属于j类的隶属度小于属于p类的隶属度,且邻域像素属于j类的平均值大于属于p类的平均值,那么此时xi即为噪声点。简而言之,当周围像素大部分都属于j类,而此像素却属于p类时,此点即为噪声点。

修正方式:如果一个点被判断为噪声点,该点对于每个聚类中心的隶属度将被修改为Aij。最后根据每个像素点对于每个聚类中心隶属度值的大小将此点判属于隶属度值最大的聚类中心。

3.5新的图像分割方法的处理流程

为了找到具有最优分割结果的数据源和其对应的最优分割结果,文中方案的整体处理流程如图1所示。

图1 文中方案的流程图

流程图中的说明:1) 计算颜色分量i的直方图是为了大大减少参与计算的数据量,即不再采用传统方法中逐像素点的计算方式,而参与计算的仅为256个色阶值和每个色阶出现的频率,从而使得图像尺寸的大小对算法效率的影响没有明显的变化。2) 将BFO和FCM结合,即将FCM的目标函数作为BFO的目标函数,让BFO代替FCM的迭代过程去改进FCM全局寻优的性能,从而迅速找到较高精度的各个颜色分量下的全局最优聚类中心。3) 新的聚类质量评价函数是为了综合评价聚类结果的质量。4) 修正分割结果的目的是为了减少图像中噪声和背景因素造成的一些误分割。

4实验结果及其分析

为了验证本文方法的可行性及其效果,特于2014年5月24日(天气:小雨转阴)在兰州植物园拍摄了多张花卉图片,最终选取了其中10张包含不同颜色的花朵目标和不同背景因素的图片作为实验素材。实验前图片大小均被重设为512×512。算法的实现平台为Visual C++6.0,编码是通过C语言实现。算法处理的初始图像数据是由Matlab将图片转换成的数组,图像分割处理结果的显示也用到了Matlab,再将数组用图片的方式显示出来。

首先对实验涉及的10幅图片的背景因素和对分割构成干扰的因素说明如表1所示。

表1 图片背景因素和干扰因素的说明

按照3.5节的处理流程,分别对10幅图片在其R分量、G分量、B分量、R-G分量下进行了分割实验,并利用最优分割结果对目标进行了提取。同时也进行了标准FCM对传统数据源(灰度图数据)进行分割的实验,并将其传统方法的分割结果与本文方法进行对比。以下所有实验均是将图片分成3类。由于印刷效果为黑白,故将彩色的原图和结果图转换为灰度图列于表2中,并在图编号列中特别标明花朵目标的颜色,实验结果如表2所示。

表2 不同色彩分量下的分类结果

从表2中我们可以看出一般情况下黄色花朵适合用R分量作为数据源,红色系花朵适合R-G分量作为数据源,白色系花朵适合G分量,蓝色系花朵适合B分量,但是相同颜色的花朵目标随着背景的变化,其最优数据源也会发生变化,如图中4、5号图片的分割效果。从十幅图的实验结果可见,本文方法选择出的最优数据源的分割结果比传统方法(标准FCM对灰度图的分割)的分割结果要更加完整和准确,而传统方法的分割结果严重受到了背景因素的影响致使目标对象不能被准确地分割出。实验过程中尽管花朵目标颜色在变化,其背景因素也在变化,本文方法均能在无人工干预的情况下较完整地分割出人们期望的目标。

表3记录了每张实验图每个色彩分量下分割结果的划分系数(Vpc)、划分熵(Vpe)、Xie-Beni指标(Vxb)、本文综合指标HFV的值以及用传统方法(标准FCM对灰度图的分割)的实验结果数据。根据各个指标系数的特点可知:划分系数越大分割效果越好,划分熵和Xie-Beni指标越小分割效果越好,HFV越小越好。表3中对每幅图的最优数据源的分割结果进行了加粗显示。

表3 不同色彩分量下的分类量化结果

通过表3中的实验数据可见,本文方法选择的最优数据源的分割结果比传统方法的分割结果更好,从而自适应数据源的图像分割方案是可行的,其新的综合模糊聚类评价函数也是有效的。该方法对目标颜色的变化和背景的变化有很强的适应性,它能自适应地找出最优数据源并得到最优分割结果,让分割结果更符合人们的期望。

5结语

本文通过细菌觅食优化算法和FCM相结合来改进FCM的全局搜索性能和算法的收敛速度,并提出了新的模糊聚类评价函数去评价一幅图像在不同数据源下分割结果的好坏,从而使本文的图像分割方法在不同颜色的花卉目标和复杂的自然背景下均能取得较好的分割结果。同时,本文方法还存在一些不足,目标的分割还是会受到一些和目标颜色非常相似的因素的干扰,这是后续需要研究和改进的地方。

参考文献

[1] Perez A J,Lopez F,Benlloeh J V,et al. Color and shape analysis techniques for weed detection in cereal fields[J]. Computers and Electronics in Agriculture, 2000,25(3):197-212.

[2] Zhou R,Damerow L,Sun Yurui,et al. Using color features of cv. ‘Gala’ apple fruits in an orchard in image processing to predict yield[J]. Precision Agriculture, 2012,13(5):568-580.

[3] 崔永杰,苏帅,王霞霞,等.基于机器视觉的自然环境中猕猴桃识别与特征提取[J]. 农业机械学报,2013,44(5):247-252.

[4] 王新忠. 温室番茄收货机器人选择性收获作业信息获取与路径规划研究[D].江苏:江苏大学,2012.

[5] 王玉德,张学志.复杂背景下甜瓜果实分割算法[J].农业工程学报,2014,30(2):176-181.

[6] Bezdeck J C, Ehrlich R,Full W. FCM: the fuzzy C-means clustering algorithm[J]. Computers and Geoscience, 1984,23(2):16-20.

[7] 李积英,党建武.量子蚁群模糊聚类算法在图像分割中的应用[J].光电工程,2013,40(1):126-131.

[8] 周绍光,贾凯华,殷楠.一种利用像素邻域信息的模糊聚类图像分割算法[J].测绘科学,2013,38(1):153-155.

[9] 白杨.蚁群算法在磁共振图像分割中的应用[J].中国医学影像技术,2007,23(9):1402-1404.

[10] 陈治亚.一种基于微粒群的模糊聚类算法[J].计算机工程,2007,33(2):198-199.

[11] 杨凯,蒋华伟.模糊C均值聚类图像分割的改进遗传算法研究[J].计算机工程与应用,2009,45(33):179-183.

[12] 张豫婷.量子菌群算法的研究及应用[D].南京:南京邮电大学,2013.

[13] 许鑫.细菌觅食优化算法研究[D].吉林:吉林大学,2012.

[14] Passino K M. Biomimicry of bacterial foraging for distributed optimization and control[J]. IEEE Control Systems Magazine,2002,22(3):52-67.

[15] 周雅兰.细菌觅食优化算法的研究与应用[J].计算机工程与应用,2010,46(20):16-21.

[16] 杨大炼,李学军,蒋玲莉.一种细菌觅食算法的改进及应用[J].计算机工程与应用,2012,48(13):31-34.

[17] 吕继东,赵德安,姬伟. 苹果采摘机器人目标果实快速跟踪识别方法[J]. 农业机械学报,2014,45(1):65-72.

[18] 陈科尹,邹湘军,熊俊涛,等.基于视觉显著性改进的水果图像模糊聚类分割算法[J].农业工程学报,2013,29(6):157-165.

[19] 李寒,王库,曹倩,等.基于机器视觉的番茄多目标提取与匹配[J].农业工程学报,2012,28(5):168-172.

[20] Bezdek J C. Cluster validity with fuzzy sets[J]. Cybernetics and Systems,1973,3(3):58-73.

[21] Bezdek J C. Mat hermetical models for systematic and taxonomy[C]∥Proceedings of Eight International Conference on Numerical Taxonomy. San Francisco: IEEE,1975:1432166.

[22] Xie X L, Beni G.A validity measure for fuzzy clustering[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,1991,13(8):841-847.

[23] Peng J M,Xia Y. A new theoretical framework for K-means clustering[C]//Foundation and recent advances in data mining, Berlin:Springer Verlag,2005:79-96.

[24] 张一行,王霞,方世明,等.基于空间信息的可能性模糊C均值聚类遥感图像分割[J].计算机应用,2011,31(11):3004-3007.

[25] 何俊,葛红,王玉峰.图像分割算法研究综述[J].计算机工程与科学,2009,31(12):58-61.

中图分类号TP301

文献标识码A

DOI:10.3969/j.issn.1000-386x.2016.02.042

收稿日期:2014-08-17。甘肃省教育厅科研基金项目(1204-13)。王钰婷,助教,主研领域:智能计算,图像分割。李珺,副教授。廖周宇,助教。

猜你喜欢

数据源像素点分量
帽子的分量
基于局部相似性的特征匹配筛选算法
一物千斤
基于5×5邻域像素点相关性的划痕修复算法
论《哈姆雷特》中良心的分量
Web 大数据系统数据源选择*
基于canvas的前端数据加密
基于不同网络数据源的期刊评价研究
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割
基于真值发现的冲突数据源质量评价算法