APP下载

农业采摘苹果目标识别算法研究

2018-08-07陕西师范大学锦园中学徐伟森

电子世界 2018年14期
关键词:霍夫背景聚类

陕西师范大学锦园中学 徐伟森

1.引言

近些年来,随着计算机科学与人工智能的不断发展,人们对于目标识别的关注度已愈来愈高。目标识别技术,是指利用图像处理算法或者机器学习的理论和方法来确定图像中是否存在感兴趣的目标并得出目标在图像中的位置。[1]事实上,在我们的生活中,在许多领域都可以见到目标识别与人工智能的应用。特别是在农业方面,随着人工成本的增加和农业机械化的发展,如何能准确识别果实已成为当下研究的一个热点。本文针对目标识别算法在果实采摘方面的应用进行比较和分析,并对其未来进行展望。

2.传统目标识别算法

传统的目标识别算法主要是利用图像处理的基本知识,对图像进行空间域或者频率域上的处理,使图像达到想要的标准,传统目标识别算法,原理较为清晰,过程较为简单,对于不太复杂的图像场景,有很好的应用价值。

2.1 目标系统的构成

要进行目标识别,首先需要解决的问题就是图像的采集。用于采集图像的设备大致有单目摄像头、双目摄像头、kinect等,如图1所示。单目摄像头只有一个镜头,双目摄像头有两个镜头,类似于人眼结构,并且可以通过计算得出像素的深度值,kinect有一个rgb摄像头和一个红外摄像头,也可以得出像素深度信息。其次是图像处理部分,可采用计算机处理和DSP芯片进行处理等,针对不同的处理需求,采用不同性能的处理芯片。最后是图像输出部分,可采用LED或者LCD显示屏进行输出。具体的步骤总结起来可分为六步:采集图像-预处理-特征生成-特征选择-检测-输出图像。

图1 采集图像设备

2.2 预处理

在很多情况下,图像在采集和传输过程中可能会受到一定的干扰,从而产生各种噪声,使得图像的质量并不满足实际处理的要求。对此,预处理就变得十分必要了。为了减少图像的噪声,可以采用滤波方法进行处理[2]。具体的滤波方法可采用平均滤波法,中值滤波法等。经过预处理后的图像质量可得到一定的提升。

2.3 颜色空间的选择

在进行彩色图像处理时,采用不同的颜色空间可以产生不同的处理效果。在果园中进行苹果采摘时,由于需要采摘的苹果与枝叶等背景在颜色特征上差异较大,即苹果主要是红色信息成分、背景是绿色的枝叶等为绿色信息成分,故可以基于图像的颜色特征对苹果图像进行分割。若采用基于颜色特征的图像分割算法,则颜色空间的选择就很重要,选择不同的颜色空间可以有不同的分割效果,常用的于本采摘环境相关的颜色空间有:RGB颜色空间和Lab颜色空间等[3]。

RGB颜色空间是图像处理中最基础,最常用的颜色空间,分别代表红绿蓝三色空间,一般常用于图像的显示。R代表红色空间、G代表绿色空间、B代表蓝色空间,RGB颜色空间虽然较为常用,并且在苹果图像处理过程中只需要通道提取而不需要进行额外的空间转换,但是RGB颜色空间的缺点也很明显:本身由于采集到的苹果图像会一定程度上受到光照、阴影等因素的影响,而RGB颜色空间受亮度影响比较大。所以RGB颜色空间更适用于图像的采集与显示,若作为苹果图像分割采用的颜色空间,则效果较为一般

Lab颜色空间Lab颜色空间是一种类似于人眼视觉感知的颜色系统,反映在坐标系中L表示亮度信息,a表示颜色从红色到绿色的变化,b表示颜色从蓝色到黄色的变化,所以在对苹果图像识别时,若采用Lab空间,只用a分量即可,而不用L和b分量,这样既利用了苹果图像中红色与绿色的颜色信息,也可以降低光照等因素的影响。

2.4 分割方法

在选择好颜色空间后,便要进行图像背景与目标分割。分割方法有颜色聚类法,OTSU法等。不同的分割方法有不同的优点与缺点,要根据实际情况进行选择。

颜色聚类法,主要原理是让不同的颜色聚集为不同的群,首先需要根据实际情况确定聚类的数目。苹果图像识别在采用颜色聚类法时主要是通过让绿色和红色聚为不同的类,从而将绿色和红色信息分开,提取出苹果信息[4]。该方法较为直观、容易实现。在进行聚类时,首先需要确定聚类类别数与初始聚类中心,由于采集到的苹果图像红色分量较大且红色分量是苹果果实部分,所以可以直接采用RGB颜色空间中的R分量最大作为苹果果实类,G分量最大的作为背景类,也就是选取聚类数为K=2,之后进行二值化,将果实类别中的像素值赋255,也就是将果实类别进行填充白色,背景类别中的像素值赋0,将背景信息填充黑色,从而将苹果果实与背景进行分割。

OTSU法又叫最大类间方差法,属于基于阈值的分割方法。基于阈值的苹果图像分割算法主要是利用图像中枝叶等背景与苹果目标的颜色特征差异,即红色与绿色等其他背景的差异,通过选定一个能够将目标与背景区分的中间值,从而实现对苹果图像的分割,中间值的一边为背景,另一边为果实。基于阈值的分割算法可以分为两种,分别是固定阈值法和自动阈值法。自动阈值法是通过分析目标与背景在颜色空间上的分布差异,自动选择阈值实现分割。OTSU方法属于自动阈值法,原理是利用图像中的灰度直方图,以目标和背景之间的最大方差为自动分割阈值,对目标和背景进行分割。这样在苹果识别时,可以将苹果目标与绿叶枝干等背景分离开来,从而将苹果目标提取出来。该方法较为简单,处理速度较快,不需要进行阈值的选择,输入一幅图像,可以自行选择最大类间方差的阈值进行分割、适用范围较广。

2.5 图像分割后的后处理

得到的分割图像具有一定程度的噪声并且有一定的误分类点,一般有两类误分类点:第一类:苹果目标区域被分类成背景,即将苹果部分分割成了背景部分;第二类:枝叶背景被误分类为目标区域,即将背景部分分割为了苹果部分;为了将这些误分类的区域修正,需要对分割后的图像进行一定程度的处理,处理流程可以包括:降噪处理、形态学处理(腐蚀、膨胀、开运算、闭运算),基于这些基本运算还可推导和组合成各种数学形态学实用算法,用它们可以进行图像形状和结构的分析及处理。

2.6 霍夫变换检测

霍夫变换是一种图像处理方法,能够用来识别图像中的基本形状在目标检测领域中具有广泛的应用[5]。

霍夫变换最早是用来检测直线的,根据两点确定一条直线的原理,将直线的方程转化为参数空间的方程在在图像中的像素点可以两两组合成多组直线,对应参数空间中就是一个个的点。统计这些点出现的次数,找出出现次数最多的那个点,便能够得出最有可能的直线的方程。

在苹果检测过程中,利用了霍夫变换圆型检测。圆在xy坐标系中的方程为(x-a)2+(y-b)2=r2,将此方程同样转化为参数空间当中根据三个点能够确定一个圆的原理,统计空间当中像素点能够形成的圆的种类与次数找出出现次数最多的那个圆,这个圆便是我们检测出来的苹果的轮廓。

霍夫变换具有很多的优点:它具有很好的稳定性,并且具有很好的容错性。如果分割后的图像还存在一些噪声点和干扰点,霍夫变换也能够将圆检测出来。当然,霍夫变换也有一些缺点,缺点是霍夫变换运算较为复杂,处理时需要耗费较多的时间。

通过霍夫变换,可以将苹果圈出来并能够得到苹果圆的圆心。如图2所示:

图2

3.深度学习目标检测

深度学习仿造人的神经网络对图像当中的特征进行识别,人的神经网络包含非常多的神经元与非常多的神经层数,深度学习也是通过构造人工神经网络对目标信息进行学习并进行预测,判断等。

深度学习的网络包含多层,每一层都可以感知图像中目标的不同特征信息,有一些是图像目标中的具体信息,例如:形状信息、色彩信息等,有一些则是一些无法直观感受到的抽象信息。深度学习基本的神经网络图如图3所示:

图3 深度学习基本的神经网络图

图3中的圆形为神经元,直线为神经元连接线。第一层为输入层,将苹果图像的数据输入进去,第二层为隐藏层,能够感知苹果图像中的目标苹果特征,隐藏层可以有多层,层数越多,学习的就较为充分,最后一层为输出层,输出最终得结果。

用深度学习对苹果图像进行识别的优点在于:不需要掌握数字图像处理的基本知识,只需要深度学习相关的知识,便可以进行处理与识别。并且只要构造的人工神经网络合理,识别率就会较高。缺点在于,深度学习方法前期需要用大量数据进行训练,训练的过程类似于人类的学习过程,如果不方便获取大量的数据,或者数据不准确,则会给苹果的识别带来难度。

4.结语

本文研究讨论了苹果目标识别的识别过程,具体包括颜色空间的选择,分割算法的选择,分割图像后处理和霍夫变换圆检测。最后还对当下的深度学习目标检测方法进行了讨论比较。

猜你喜欢

霍夫背景聚类
冰山与气候变化
“新四化”背景下汽车NVH的发展趋势
世界之巅的花园——库肯霍夫
《论持久战》的写作背景
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
晚清外语翻译人才培养的背景
基于霍夫变换的铭牌OCR图像旋转矫正方法
一种层次初始的聚类个数自适应的聚类方法研究
基于霍夫变换的简单手绘表情的智能识别