APP下载

基于区分矩阵的属性约简算法的作物病害识别方法

2015-04-17张会敏张云龙张善文

江苏农业科学 2015年1期
关键词:图像分割粗糙集

张会敏 张云龙 张善文 等

摘要:利用作物叶片症状进行作物病害识别是植保中的一个重要研究内容。提出了一种基于区分矩阵属性约简的黄瓜病害叶片图像分割与病害识别方法。首先,利用最大类间方差法对黄瓜病害叶片图像进行病斑分割;其次,提取病斑图像的36个分类特征;再次,利用基于区分矩阵的属性约简算法对36个特征进行特征选择;最后,利用最近邻分类器进行病害识别。在3种常见黄瓜病害叶片图像数据库上的试验结果表明,该方法是有效可行的,能够为基于病害叶片的作物病害识别系统研究提供参考。

关键词:粗糙集;图像分割;最大类间方差法;病害识别;黄瓜叶片病斑

中图分类号: TP391.41文献标志码: A文章编号:1002-1302(2015)01-0387-03

收稿日期:2014-03-19

基金项目:河南省郑州市科技攻关(编号:131PPTGG426);安徽省自然科学基金(编号:1208085MF94、1208085MF98);河南省科技攻关(编号:142102310518);河南省教育厅科学技术研究重点项目(编号:14B520064)。

通信作者:张会敏(1981—),女,河南漯河人,讲师,研究方向为计算机应用技术。E-mail:zhangshanwen1965@163.com。作物病害严重影响我国农业生产的产量和质量。及时、快速地发现并识别农作物病害对正确地采取相应措施防治病害、减少病害带来的损失具有重要意义。但由于实际病害叶片的形状、纹理和颜色多种多样,使得从叶片图像中提取的病害分类特征也各种各样,各种特征对病害识别的贡献不同,因此需要进行特征选择[1]。粗糙集(rough sets,RS)是一种经典的特征选择方法,能够直接从给定问题的描述集出发,通过不可分辨关系和等价关系类给出问题的近似域,从而得到该问题的内在规律。多年来,RS已被成功应用于人工智能、模式识别、智能控制、机器学习、信息处理、数据挖掘、医疗诊断、专家系统以及决策分析等领域[2-3]。属性约简是RS的一个重要应用[4],基于RS的属性约简是在保持信息系统分类或决策能力不变的前提下,通过对知识的化简,导出分类问题的分类规则和决策。基于区分矩阵的属性约简策略是建立在两两互异目标上属性集合的区分矩阵[5]。区分矩阵的元素代表能够区分2个目标的属性组合。实际应用中可以将区分矩阵中出现次数多少作为属性重要性的判断依据,即出现次数越多的属性的重要性越大。本试验在研究作物病害叶片图像分割的基础上,将基于区分矩阵的属性约简策略应用于病害叶片图像分类特征选择中,提出了一种有效的作物病害识别方法。

1作物病害叶片图像特征提取

作物病害叶片病斑图像分割是病害识别的一个重要步骤。最大类间方差(Otsu)阈值法因其分割精度高、适用范围广而成为广泛采用的一种图像阈值分割方法[6],其原理是:将病害叶片图像像素分为病斑和正常2类,再通过计算划分出2类病害的类间方差值,若类间方差值小于某一给定值,合并初始划分的2类。然后计算此时所有类的类间方差值和分离因素的F值,若F值大于某个给定值,则退出该算法;否则,就按顺序在已存在的类中继续对图像分割。最后得到叶片病斑图像。

由于实际得到的病害叶片图像为RGB模式,该色彩模式对光照比较敏感,而HIS色彩模式能够克服采集过程中光照对病害识别率的影响,因此在作物病害识别中须要将RGB转换成HIS,HIS颜色模型反映了人的视觉对色彩的感觉[7-8]。由RGB转换HIS的公式如下:

I=(R+G+B)/3

S=1-3(R+G+B)[min(R,G,B)]

H=θG≥B

θ-2πG

式中:θ=arccos[(R-G)+R-B]/2(R-G)2+(R-B)(G-B)。

在本试验中,利用Matlab中的Imread函数分别提取彩色叶片图像中R、G、B 3个通道的图像,再利用式(1)将其转换为H、I、S模式。然后,采用Otsu阈值法分别将H、I、S图像转换为二值化图像,以提取叶片病斑区域。不妨将得到的病斑二值化图像仍记为H、I、S。

为了得到能区分作物病害的颜色特征值,分别计算病害叶片图像R、G、B分量和分割后的病斑图像的H、I、S分量的均值、方差、偏度、峰值、能量、熵,共6×6=36个统计特征参数[9]。计算公式如下:

p(b)=h(b)/s

b=∑b=1bp(b)

bk=1/δ3∑(b-b)3p(b)

δ2=∑b=1(b-b)2p(b)

bF=1/δ4∑b=1(b-b)4p(b)-3

bN=∑b=1[p(b)]2

bE=∑b=1p(b)lg[p(b)]。(2)

式中,p(b)为灰度级,h(b)为直方图,s为图像的面积,b为灰度均值,b为b的均值、bk为偏度,bF为峰值,bN为能量,bE为熵。

若直接把提取的36个病害图像特征参数用于构建病害识别模型,则识别效果的稳定性较差,因为各个特征对识别结果的贡献不同,有些特征甚至会影响识别结果。因此,须要对得到的特征进行选择。笔者使用基于区分矩阵的属性约简方法对得到的36个特征进行选择。

2基于区分矩阵的属性约简方法

基于区分矩阵的属性约简方法基本思想:将属性在区分矩阵中出现的次数作为目标属性的重要性判断函数。计算各属性的重要性判断函数f,由此可以确定第1个重要属性,此时重要属性的判断函数f值最大。在第1个重要属性简单求出后,进一步快速简单地求出后续的重要属性。设决策表S的核值集合为Core,其属性约简过程如下:

输入S的属性约简矩阵RM;输出S的属性约简Redu;

(1)初始化,令Redu=Core,H=;

(2)令Q={RM(aj)|aj∈Redu或AFI(aj)=0},则RM=RM-Q,B=A-Redu-H;

(3)对aj∈B,计算f(aj)=Max{ak},(k=1,2,…,m),其中f(x)为属性重要性判断函数;

(4)Redu←Redu∪{aj};

(5)对每个aj∈B,令H2(aj)∩RM(ak),H3(aj)=|H2(aj)|;

(6)对所有aj∈B,令RM(aj)←RM(aj)-H2(aj),f(aj)←f(aj)-H3(aj);若f(ak)=0,则H1=∪{ak};

(7)重复步骤(2)~(6),直到判断函数AFI为零向量;

(8)输出Redu 。Redu为信息表的一个属性约简。

3基于病害叶片的作物病害识别方法

由以上分析可得作物病害识别步骤如下:

(1)将采集到的每幅病害叶片图像转换为HIS模式;

(2)采用Otsu阈值法分别将叶片图像的H、I、S分量进行病斑分割,再转换为二值化图像,不妨还记为H、I、S;

(3)利用式(2)分别提取H、I、S的36个分类特征,得到一个特征向量,然后生成包括条件属性集合和结论属性集合的满足粗糙集数据处理要求的二维关系规则表;

(4)将关系表中的每类特征属性进行归一化和离散化处理;

(5)利用基于区分矩阵的属性约简方法对关系表进行属性约简,依次消去可省略的属性(列)和合并重复的对象(行),再对每一个对象进行简化,消去冗余的属性值;

(6)根据一定的评选准则选取有效识别规则的属性简化表,最终获得优选的最简单判定规则;

(7)利用最近邻分类器对植物病害进行识别。该分类器的基本思路是计算待测试样本与训练样本之间的欧式距离的最小值,由此确定待识别测试样本的类别。

4结果与分析

为了验证本研究提出的作物病害识别方法,采集温室黄瓜常见的细菌性角斑病、黄瓜炭疽病和黄瓜褐斑病的病害叶片各100幅,其中50幅图像作为训练集,其余50幅作为测试集。本研究所使用的病害样本图像均是在陕西杨凌农业示范区科学园黄瓜温室采集得到的,黄瓜品种为中农26号。以白色为背景色,在自然光照的非强光条件下对自然发病的黄瓜叶片进行图像采集得到黄瓜病害叶片图像。以Matlab 7.X软件中自带的图像处理工具箱为图像处理和分析平台,计算以上特征参数,数据统计分析采用常用统计分析SAS软件。

采用Otsu阈值法分别将病害叶片进行病斑分割,分割定位待识别的黄瓜叶片病害部分病斑,利用式(2)提取病害叶片病斑的36个分类特征。图1为3种黄瓜病害叶片图像及对应的分割病斑图像的H分量。

首先将得到的36个特征进行离散化,即把每个特征划分成有限个区域,本试验中取5个区域,使得每个区域中对象的决策值相同。然后利用基于区分矩阵的属性约简方法对这36个特征进行属性约简,得到6个重要的属性,分别为病斑分量H的均值、方差、能量,病斑分量I的均值,病斑分量S的方差和能量。再将这6个属性组成一个特征向量来表示这个样本。最后利用最近邻分类器对病害种类进行分类,结果见表1。为了说明本研究所提出方法的有效性,表1中给出了基于全部36个特征和基于其他2种方法[10-11]的识别结果。由表1看出,本研究提出的方法的识别率最高,对黄瓜褐斑病的识别率高达94.26%,表明该方法用于黄瓜叶部病害图像识别是有效可行的。

表1不同黄瓜病害识别方法的识别结果

方法识别率(%)36个特征识别法78.59文献[10]82.88文献[11]90.35本研究所提出的方法94.26

叶片图像采集和识别试验结果显示:(1)病害识别中并非特征越多越好,应对识别特征进行优化组合或特征选择;(2)即使同一病害样本在不同成像环境下拍摄,图像特征向量也会存在一定差异;(3)不同黄瓜品种、不同发病时期的病症表现差异较大。这些差异应与识别效果相结合,可以通过制定图像的采集规范予以解决。

5结论

本研究利用最大类间方差法分割黄瓜病斑图像,再提取病斑图像的36个特征,然后利用粗糙集对36个特征进行属性约简,得到6个重要特征,最后利用最近邻分类器对病害进行分类。该方法提取病斑具有操作简单、分割效果好的特点。本试验结果表明该方法是有效可行的。由于病害叶片拍摄状态和光照等环境因素对颜色特征存在影响,发病程度及病斑的典型性也可能对识别准确率有影响,这些因素对拍摄照片中颜色特征的定量关系有待进一步研究。对于某些颜色、形状特征非常相似的其他黄瓜病症,还应进一步提取病斑的颜色、形状和纹理等特征,综合考虑决定黄瓜病害症状的物理特征,以实现对病害的有效识别。

参考文献:

[1]李旺,唐少先. 基于图像处理的农作物病害识别研究现状[J]. 湖南农机,2012,39(1):176-178.

[2]Qian Y H,Liang J Y,Pedrycz W,et al. An efficient accelerator for attribute reduction from incomplete data in rough set framework[J]. Pattern Recognition,2011,44(8):1658-1670.

[3]胡可云,陆玉昌,石纯一. 粗糙集理论及其应用进展[J]. 清华大学学报:自然科学版,2001,41(1):64-68.

[4]樊持杰,陈丽敏,夏春艳. 基于RS的属性约简算法[J]. 微计算机信息,2010,26(2):222-223.

[5]李智玲,胡彧. 一种改进的区分矩阵属性约简算法[J]. 计算机系统应用,2008,17(10):51-55.

[6]王祥科,郑志强. Otsu多阈值快速分割算法及其在彩色图像中的应用[J]. 计算机应用,2006,26(增刊1):14-15.

[7]虎晓红,李炳军,席磊. 基于多示例图的小麦叶部病害分割方法[J]. 农业工程学报,2012,28(13):154-159.

[8]Tushar H J, Ravindra D B, Prashant G P. Crop disease detection using image segmentation[J]. World Journal of Science and Technology,2012,2(4): 190-194.

[9]Revathi P,Revathi R. Knowledge discovery in diagnose of crop diseases using machine learning techniques[J]. International Journal of Engineering Science and Technology,2011,3(9): 7187-7190.

[10]岑喆鑫,李宝聚,石延霞,等. 基于彩色图像颜色统计特征的黄瓜炭疽病和褐斑病的识别研究[J]. 园艺学报,2007,34(6):1425-1430.

[11]贾建楠,吉海彦. 基于病斑形状和神经网络的黄瓜病害识别[J]. 农业工程学报,2013,29(增刊1):115-121.于翰林,卢泽民,朱咏莉. 基于嵌入式Web服务器的pH值检测系统的设计[J]. 江苏农业科学,2015,43(1):390-393.endprint

猜你喜欢

图像分割粗糙集
基于二进制链表的粗糙集属性约简
优势直觉模糊粗糙集决策方法及其应用
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
两个域上的覆盖变精度粗糙集模型