APP下载

基于图像处理和模糊识别技术的烟叶病害识别研究

2015-07-09王建玺等

现代电子技术 2015年8期

王建玺等

摘 要: 为快速有效地诊断识别烟叶病害,提高烟草病害诊断水平,首先采用自适应中值滤波技术对采集的角斑病和野火病图像进行去噪处理,然后采用快速模糊C?均值聚类算法对病斑进行分割,最后提取烟叶病斑颜色、形状和纹理方面的特征,采用模糊识别技术对病害进行自动识别。实验测试表明,该模型对病害样本进行处理识别的正确率较高,能够满足生产的实际需求。

关键词: 烟叶病害; 自适应中值滤波; 快速模糊C?均值聚类; 模糊识别

中图分类号: TN964?34 文献标识码: A 文章编号: 1004?373X(2015)08?0004?04

Research on tobacco disease auto?recognition based on image processing and

fuzzy recognition technology

WANG Jian?xi, XU Xiang?yi

(Pingdingshan University, Pingdingshan 467000, China)

Abstract:To diagnose and identify tobacco diseases quickly and effectively, and improve the diagnostic level of tobacco diseases, the adaptive median filtering technology is used to perform the noise removal of the collected images of tobacco angular leaf spot and wildfire, the fast fuzzy C?means clustering algorithm is adopted to segment the lesion, and then the fuzzy recognition technology is used for the Auto?Recognition of the disease according to the characteristics of color, shape and texture of tobacco spot disease. Test results show the model has high recognition rate for the disease samples, and can meet the actual production requirements.

Keywords: tobacco disease; adaptive mean filtering; fast fuzzy C?means clustering; fuzzy recognition

烟叶病害对烟叶质量影响很大,而烟叶质量直接影响到烟制品质量和烟民的健康,及时准确地发现烟叶病害,快速识别烟叶病害的种类是烟叶病害防治的基础和前提。农作物病害识别诊断技术在玉米、小麦、大豆、黄瓜等作物方面研究较多,对于烟叶病害的研究较少[1?5]。中国是世界第一烟叶生产大国,2012年,全国种植烤烟2 118万亩,收购烤烟273.7万吨。因此,研究烟叶病害识别诊断方法具有重要的意义。本文利用图像处理和模式识别技术,针对烟叶种植中常见的角斑病和野火病,提出了一种新的烟叶病害自动识别诊断方法。

1 病斑图像预处理

1.1 图像采集

为提高病斑图像采集的准确性,本文采集的烟叶病斑图像是在植保科技人员的指导下,用数码相机在大田自然光照环境下拍摄获取的,以RGB格式导入计算机系统中,使用常用的图像处理软件去除图像中无关的背景,统一图像尺寸大小,供后续图像处理使用。

1.2 图像去噪处理

在图像采集时,使用数码相机采集的病斑图像常有脉冲噪声[6],需去除噪声,在进行去噪处理时,由于数码相机采集的真彩色图像占用存储空间大,处理所用时间较长,为了提高处理速度,需先把彩色图像转换为灰度图像。常用的中值滤波技术对烟叶病害图像进行过滤,能很好地过滤噪声,但存在一定的细节损失,从而导致在去除噪声干扰的同时使图像变得模糊[7]。

本文采用自适应中值滤波算法过滤图像中的噪声,该算法不像中值滤波利用排序结果的中值直接代替原中心像素灰度值,而是采用自适应中值比较算法判定该点是否是噪声[8],如果是噪声则替换,否则噪声保留该点原始像素灰度值,这样既可以过滤掉脉冲噪声,同时也保存了非噪声的原始图像,优化了单纯中值滤波的效果。简单的中值滤波是采用[3×3]的窗口滤波器,而自适应中值滤波增加了[5×5]窗口滤波器。该算法思想可描述为:首先在[3×3]采样窗口模式下,计算采样窗口像素的中值Xmed是否在采样窗口像素最大值Xmax和最小值Xmin之间,如果在两者之间,说明中值Xmed不是极值。接着判断采样窗口中心像素值Xxy是否在最大值Xmax和最小值Xmin之间,假如在二者之间,说明中心像素值Xxy不是极值,这样就不需用中值替换中心像素值,直接输出中心像素值即可;否则中心像素值是极值,需要用中值Xmed替换中心像素值。

假如上述步骤中中值Xmed并没有处于像素最大值Xmax和最小值Xmin之间,表示中值Xmed是极值,这时需要将采样窗口增大到[5×5],重复执行以上步骤,假如还是找不到一个合适的中值Xmed,则输出[3×3]窗口模式下求出的中值结果,否则输出[5×5]窗口模式中求出的结果。该算法步骤如下:

(1) 如果Xmax-Xmed>0且Xmed?Xmin>0,则转步骤(2);

否则增加窗口模式;

如果采样窗口大小≤Smax,则重复转到步骤(1);

否则输出Xmed;

(2) 如果Xmax-Xxy>0且Xxy-Xmin>0,则输出Xxy;

否则输出Xmed;

Smax取5×5窗口模式。

该算法能有效平滑噪声,较好地保留了图像原来的像素值、细节和边缘信息,并能根据情况自动扩展采样窗口,提高了图像的滤波效果,为后续的病斑特征提取和图像识别提供了很好的图像素材。本文对采集到的野火病病斑图像采用自适应中值滤波进行平滑处理,处理前后的图像如图1和图2所示。

[图1 野火病灰度图像 图2 野火病滤波后图像]

1.3 图像分割

在对病斑图像进行识别和判断前,需要把病斑从图像中分割出来,图像分割的好坏对以后的图像识别至关重要。本文采用快速模糊C?均值聚类算法对病斑图像进行分割,为提高该算法的处理速度,用灰度级替换数字图像的病斑样本[9]。算法步骤如下:

(1) 计算图像中的灰度级k=0,1,2,…,L-1,其中L-1表示图像中的最大灰度级,设定好阈值ε,类别数c和权重系数m,初始化迭代次数和隶属矩阵U{0};

(2) 计算c个聚类的中心{Vi{r}},聚类中心计算公式为:

[vi=K=0L-1μijmh(k)kK=0L-1μijmh(k),i=1,2,…,c] (1)

式中:[μij] 表示隶属度;m为加权参数,在[1,∞]取值,用来控制模糊度;[h(k)] 表示数据点k的灰度值。

(3) 计算新的模糊分类矩阵U(r?1),根据距离式(2),用U(r)替代V(r)即可得到:

[(dik)2=k-vi2, k=0,1,2,…,L-1] (2)

式中:[dik]表示第k个数据集与第i类中心的欧氏距离。

步骤4:满足[U(r-1)-U(r)<ε]时停止计算。否则r++,转到步骤(1),重新计算;

当该算法收敛时,根据最大隶属度原则,把各灰度级k划归到最大隶属度的类别中,并把各个类别的标号分配给相应的像素。

在实现快速模糊C?均值聚类图像分割算法时,该算法中的参数如类别数c,指数m的选择直接影响着实验结果[10?11]。m在实际中的最优取值范围为1.5~2.5之间。在对所处理的烟叶病斑有一定了解的基础上,根据实际情况取得c的值。在聚类中心相对分散的情况下,需要采用迭代法确定c的值。本文取c的值为2,m的值为2,[ε]的值为0.05,对烟叶病斑图像进行分割,并对分割后的图像进行数学形态处理,处理后的病斑图像见图3。

图3 野火病分割后图像

2 病斑图像特征提取和模式识别

2.1 图像特征提取

对分离出来的病斑进行识别,需确定病斑的相关特征,然而传统的分析方法如借鉴经验法和病理学分析法都会出现较大偏差[12]。本文根据烟叶角斑病和野火病分割出来的病斑,从形状、纹理及颜色三方面特征出发,根据易区分、可靠、不相关性及复杂度适度的原则,提取了5个特征参数:形状特征病斑圆形度C和复杂度S,纹理特征的熵WE和对比度WC,颜色特征中的H均值,它们计算方法如下:

(1)形状特征病斑圆形度C:圆形度是描述病斑接近圆形的程度,计算公式为:

[C=4πx=1Nfx,yL2] (3)

式中f(x,y)为图形的像素点;L为病斑区域周长;C的取值范围为[0,l],C越大,则区域越接近圆形。

(2) 形状特征病斑复杂性S:复杂性计算公式为:

[S=L2x=1Nfx,y] (4)

复杂性表示单位面积上病斑周长长度,值越小表示图形越简单;反之表示图形越复杂。

(3) 纹理特征熵WE:纹理特征熵WE和对比度WC可以从共生矩阵p中计算出来,根据角斑病和野火病病斑像素灰度变化构造[d=1,θ=0°]的灰度共生矩阵。当病斑图像中无纹理时,其灰度共生矩阵p(i,j|d,θ)中元素全是零,这时熵值WE就接近于0;如果图像中细纹理很多,那么灰度共生矩阵p(i,j|d,θ)中的元素值接近相等,则这时熵值WE就很大。熵WE的计算公式为:

[WE=-i=0L-1j=0L-1pi,j|d=1,θ=0°log2pi,j|d=1,θ=0°] (5)

(4) 纹理特征对比度WC:对比度反映了图像的清晰程度,表示了两像素点间灰度差情况,当对比度WC值越小时,表示灰度差越小,图像纹理和视觉效果越模糊,计算公式如下:

[WC=n=0L-1n2i=0L-1j=0L-1pi,j|d=1,θ=0°] (6)

式中n=[i-j]。

(5) 颜色特征H均值:[H=Sum Hx=1Nfx,y],Sum H指的是病斑图像部位像素点H分量的灰度总和。

2.2 模糊模式识别分类器设计

模糊识别技术是图像识别中常用的识别技术[13],它根据待识别模式和标准模式之间的隶属度或贴近度对待识别元素进行分类。本文通过计算待识别病害模糊集与已知病害模糊集的贴近度来对待识别病害进行识别。根据实际需要建立一个模糊模式识别分类器。首先建立烟叶角斑病和野火病的标准模式库,根据实际情况建立合适的隶属度函数,接着计算待测病害样本与标准样本的隶属度,依据隶属度最大原则将待识别病害划分到相近的一个类别中,实现对病害的自动识别。

本实验采用正态分布型函数定义待识别的第k个病害样本xk的隶属度函数:

[μAi(xk)=e-xk-vidmax2] (7)

式中,dmax表示xk与各特征模式中聚类中心的最大距离。

本文主要研究角斑病和野火病这两种病害,在植保技术人员的指导下,选取病害特征较明显的烟叶样本图像经预处理后,进行有监督的学习。采集角斑病和野火病这两种病害各100个建立两种类别的标准特征库,故c=2,把选择100个样本的5个特征参数矩阵提取出来输入计算机,根据提取的特征参数计算出两类病害组成的聚类中心集v={v1,v2},根据公式(8)计算出用5个特征参数表示的角斑病和野火病的聚类中心vi(i=1,2)。

[vi=1nix∈Aix] (8)

通过对采集的100个病害样本进行训练,建立了两种病害的标准模式库,把计算出的聚类中心vi={m1,m2,…,m5}(i=1,2)保存到特征库中,作为以后进行分类识别的依据。

3 病害识别系统设计与实现

采用Visual C++ 2012作为烟叶病害识别系统的开发平台。按照本文模式识别实际情况,设计出两种病斑自动识别系统的流程如图4所示。

图4 烟叶病斑自动识别系统流程图

通过自适应中值滤波技术和快速模糊C?均值聚类算法对采集到的图像进行处理后,提取出选择的5个特征参数,然后将特征值存入数据库;用获得的特征值训练这两个病害的数值特征,建立两种病害模型库,并输出获得的模式文件。进行样本病害识别时,首先将待识别烟叶病斑的特征提取出来,计算出待识别烟叶病斑特征的隶属度,依据隶属度最大原则得到分类结果。图4中虚线箭头表示训练样本的流程,实线表示识别的流程。本实验采集100张包含角斑病、野火病、赤星病和蛙眼病待识别病害图像,把待识别的病害图像进行去噪、分割和特征提取,计算待识别的100个样本与聚类中心v1,v2的距离,根据隶属度函数计算最大隶属度,识别该病斑的类别。识别结果见表1。

表1 烟叶病害识别结果

从实验的结果可见,在植保专家的指导下选取的样本得到了很好的训练结果,所以两种病害的识别率很高,达到了实验的要求,验证了本文技术手段的可行性。在对100个验证样本集进行识别时,角斑病和野火病的识别率是很高的,存在很少的误识情况,实现了烟叶病害的自动识别。因为本文没有建立赤星病和蛙眼病的标准模式特征库,所以二者的拒识率非常高,这需要采集更多种类的烟叶病害图像,建立相关的特征库。

4 结 语

本文研究了基于图像处理和模糊模式识别的烟叶病害识别方法,描述图像去噪、分割和病害特征提取及模糊模式识别的过程,采用模糊识别中的最大隶属度原则实现了病害的自动识别,设计的自动病害识别系统对烟叶发生率较高的角斑病和野火病的识别率较高,这充分证明本研究选取的特征参数和采用的模糊模式识别的方法是可行的。实际生产中烟叶的病害种类较多,病害的复杂度也较高,故本研究应在健全模式特征库,增强病害的识别精度和烟叶受害程度等方面做进一步深入研究。

参考文献

[1] 王静,张云伟.一种烟叶病害的图像增强处理方法[J].中国农学通报,2011,27(6):469?472.

[2] SASAKI Yutaka, SUZUKI Masato. Construction of the automatic diagnosis system of plant disease using genetic programming which paid its attention to variety [C]// ASAE Meeting Presentation. [S.l.]: ASAE, 2003: 111?120.

[3] 马德贵,邵陆寿,葛婧,等.水稻稻瘟病及水稻纹枯病病害程度图像检测[J].中国农学通报,2008,24(9):485?489.

[4] 田有文,李天来,李成华,等.基于支持向量机的葡萄病害图像识别方法[J].农业工程学报,2007,23(6):175?180.

[5] 谭峰,马晓丹.基于叶片的植物病虫害识别方法[J].农机化研究,2009,31(6):41?43.

[6] 王晓峰.植物叶片图像自动识别系统的研究与实现[D].合肥:中科院合肥智能机械研究所,2005.

[7] SONKA Milan, HLAVAC Vaclav, BOYLE Roger.图像处理、分析与机器视觉[M].艾海舟,苏延超,译.北京:清华大学出版社,2011.

[8] 郑群辉,唐延东.基于图像统计信息的去椒盐噪声算法[J].计算机应用,2009,29(7):1943?1946.

[9] 徐月芳.基于遗传模糊C?均值聚类算法的图像分割[J].西北工业大学学报,2002,20(4):549?553.

[10] HUMPHRIES S, SIMONTON W. Identification of plant parts using color and geometric image data [J]. Transactions of the ASAE, 1993, 36(5): 1493?1500.

[11] 任燕.基于模糊C?均值聚类图像分割技术研究[J].科技通报,2012,28(4):206?208.

[12] 宋凯.基于计算机视觉的农作物病害识别方法的研究[D].沈阳:沈阳农业大学,2008.

[13] MURAKAMI S, HOMMA K, KOIKE T. Detection of small pests on vegetable leaves using GLCM [J]. American Society of Agricultural Engineers Paper Number, 2012, 9(5): 56?76.

[14] TAKUJI kaburagi, TAKEUCHI Hiroya, FUJII Hirofumi, et al. Initial experience of individualized chemoradiotherapy for superficial esophageal cancers based on the sentinel lymph node concept [J]. Esophagus, 2012, 9(3): 147?152.