APP下载

基于视觉词袋模型的茶机智能化控制方法

2014-03-07谭和平徐海卫胡常安汤江文徐传娣

中国测试 2014年6期
关键词:向量茶叶神经网络

谭和平,徐海卫,胡常安,汤江文,徐传娣

(中国测试技术研究院,四川 成都 610021)

基于视觉词袋模型的茶机智能化控制方法

谭和平,徐海卫,胡常安,汤江文,徐传娣

(中国测试技术研究院,四川 成都 610021)

因3类名优茶在颜色上并无太大区分,纹理特征也不明显,所以在茶机智能化控制方法中主要依靠人为的主观判断进行名优茶分类,准确度较低。针对这个问题,提出一种基于视觉词袋模型的分类方法,首先对采集的茶叶图片通过数字图像处理的方法调整对比度,然后利用视觉词袋模型提取每一张图像的SIFT特征并生成视觉单词,最后将每一张图像表示成一个包含视觉单词的向量,输入到BP神经网络中进行训练并分类。实验结果表明:该方法合理有效,可以被广泛应用到茶叶分类问题中。

茶机;数字图像处理;视觉词袋模型;SIFT特征;BP神经网络

0 引 言

我国是茶叶的发源地,也是茶叶生产和出口的大国[1-2]。近年来,随着茶文化在世界上的广泛流行,茶叶的出口量呈现逐年增长的趋势;但是,我国的茶叶分类技术落后于日本等国。为了保持我国茶叶的出口地位,提出准确合理的茶叶分类模型十分重要[3]。

茶叶检测中比较重要的是名优茶的外观分类,因为它包含难以准确区分的3个本质类别:芽茶、一芽一叶和一芽两叶[4]。实际应用中只能靠人眼去辨别,非常耗时且不能大规模的推广;另外,3种茶叶颜色上并没有明显区别,电子设备也很难进行准确的分类,所以,我国的茶叶分类技术还有待提高[5-6]。基于这个问题,国内学者提出了基于视觉词袋模型[7]和BP神经网络模型[8]的名优茶外观分类方法,在茶叶分类领域有较好的应用前景。

1 视觉词袋模型

近年来,随着信息技术以及计算机网络的迅速发展,数字图像的质量以及信息量日益增加,从图像中得到的信息也越来越多。如何准确合理地挖掘图像的信息,并对图像进行识别、分类已然成为一个新兴的研究领域。从20世纪70年代起,逐渐兴起了图像检索的相关研究[9]。

基于视觉词袋模型(bag of visual word,BOVW)的图像表示近年来受到了强烈关注,该模型简单有效地将一个图像表示成为一个由多种视觉单词组成的视觉向量;因为往往一张清晰的图像有近3MB,而一个1000维的向量只占用8000bits,这无论是在存储图像还是计算中都是一个重要的模型,对于图像检索的效果和效率非常重要,尤其是应用在大量的图像数据集中。

视觉词袋模型主要可以分为3部分:

1)提取特征。在数字图像中,我们关心的往往是一些拥有局部特征的像素点,比如图像的边缘、颜色。常用的图像特征有纹理特征、颜色直方图、灰度直方图等,将图像表示成向量,基于这些特征的信息量较少,特征也不稳定,所以图像识别、分类等模型的效果并不理想。在视觉词袋模型中,最常用的是尺度不变特征转换(scale-invariant feature transform,SIFT),由于其具有尺度不变、旋转不变、光照不变等多种稳定的优良特性,近几年成为应用最广泛的局部特征。

2)生成视觉单词。由于SIFT特征个数太多,并且很多特征是相似的,所以需要通过聚类算法将特征量化生成视觉单词。首先抽取所有茶叶图片的SIFT特征,然后利用K-means算法对这些特征进行聚类,生成视觉单词。

3)用词频向量表示图像。在生成视觉单词之后,每一个图像便可以用一个向量表示,向量中每一个元素表示视觉单词在这张图像里面出现的个数;显然,这个向量中的元素都是正整数。经过这种表示方法,每一个图像都从很高的维度降低为一个向量,既保存了图像间的区分性又降低了计算量。

2 人工神经网络

人工神经网络兴起于20世纪60年代,最初通过电阻、放大器等电路原件进行仿真,其主要思想是通过将一系列功能与人脑中细胞类似的神经元按照一定的规则和权值连接起来,构成含有输入层和输出层的网络。

根据不同的网络假设,人工神经网络有很多种类型:Hopfield神经网络、RBF神经网络、SOM神经网络等,其中最为著名的是BP神经网络[10]。由于BP神经网络具有非常优秀的非线性拟合能力,所以被广泛应用于识别、预测等领域。常见的BP神经网络由3层结构组成,输入层、输出层还有介于这两层结构之间的隐含层。神经网络结构图如图1所示。

图1 BP神经网络的基本结构

BP神经网络的目标函数为输出层的数据与训练数据的均方差MSE,每次迭代将当前的误差反馈给网络,通过不断调整权值调整来达到网络的训练目标。

3 实验设计与仿真结果

实验的流程图如图2所示。实验设计主要分为4个步骤:1)对图像进行采集和初步处理;2)对图像的SIFT特征进行提取并生成视觉单词;3)将图像表示为词频向量;4)将一部分图像输入到BP神经网络中进行训练,并对剩余的图像进行分类。

图2 名优茶分类模型流程图

3.1 图像采集和预处理

为保证图像的采集环境尽可能一致,实验中所用到的图像均在同一组设备和仪器参数下进行采集(相机镜头为Navitar DO-2595,分辨率500万像素,采集软件为Baumer,镜头到白色纸板距离372 mm,光源到纸板距离131 mm)。名优茶在外型上通常被人为地分成3类:芽茶、一芽一叶和一芽两叶,如图3所示。随机地从原料中选择等量茶叶,每类茶叶选择100个样本分别置于白色纸板上;然后放置在直径50mm、高度20mm的玻璃皿中;最后,用之前构架好的采集设备进行采集。

图3 预处理后的名优茶叶图片

尽管拍摄环境一致,但还是会受到光照等一些难以避免的外部因素的影响;所以,先对图像进行灰度处理,然后调整对比度,再将处理后的图像做为实验数据。

3.2 SIFT特征提取和视觉词袋模型

尺度不变特征转换(scale-invariant feature transform,SIFT)特征是一种常用于计算机视觉的局部特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量[11]。SIFT特征由David Lowe在1999年所提出,并于2004年完善总结。SIFT提取算法主要分为4步:

1)尺度空间极值点检测。建立高斯尺度金字塔,对图像中所有位置进行检测,寻找到满足尺度不变性和旋转不变性的特征点。

2)特征点定位。因为数字图像是离散的,所以需要插值来得到特征点的准确位置。

3)计算特征点方向。统计特征点附近的梯度,计算主方向。

4)对特征点进行描述。在特征点周围的邻域内4×4窗口对8个方向的梯度进行统计,生成128维的描述符对SIFT特征进行表示。

经过上述4个步骤,茶叶图片的SIFT特征提取结果如图4所示。

图中,每一向量代表着一个相应的SIFT特征,剪头代表特征的主方向,长短代表特征的梯度大小。可以看出,不同种类茶叶的特征点的信息和梯度大小都有一定区别;另外,SIFT特征具有旋转不变性和尺度不变性,所以,无论从什么角度拍摄,茶叶都不会对特征提取的结果产生影响。

图4 茶叶图片的SIFT特征

在抽取SIFT特征之后,采用K-means方法对特征进行聚类,相应的聚类中心便是视觉单词,可以统计每一张图像中各个视觉单词出现的次数,并将每一张图像表示成一个包含词频的向量。

3.3 BP神经网络分类预测

文中分别对每类茶叶收集了100张图像,同时选择生成了300个视觉单词。这样,便得到300×300的一个矩阵,并对3类茶叶进行人为标注:芽茶(0)、一芽一叶(0.5)和一芽两叶(1)。然后,选择一半的图像作为训练样本,其余的作为检验数据,建立神经网络模型。部分训练结果的近似值如表1所示。

表1 BP神经网络训练结果

从表1中可以看出,大部分的训练结果都是准确无误的,尤其以芽茶的精度最高。BP神经网络在训练完成之后,其最后的权值和阈值作为知识,剩余的数据被输入到训练好的BP神经网络中进行训练,部分识别结果的近似值如表2所示。

由表2可知,分类准确度非常高,并且在150张图的分类结果中,有127张图被正确分类,准确度达84.67%。并且,在得到训练好的神经网络后,对于新的图片,只需要根据视觉词袋模型生成相应的向量便可以输入到网络中进行识别,大大提高了识别的效率和精度。

表2 BP神经网络分类结果

在BP神经网络训练过程中,设置算法的迭代次数为300次,也同时设置了训练的期望误差为10-15。由于训练的数据量比较大,一般情况下还没有达到期望的误差就达到训练的次数,如图5所示,为BP神经网络运行一次情况下的系统误差,系统误差的初始值为1.51,最后能达到的训练误差为1.3×10-5,在训练到200次的时候,系统基本稳定在10-5数量级上。增加算法的迭代次数可以增加算法的精确度,影响到结果的判断,同时也会增加时间[12]。目前来讲,还没有相关的文献提到如何来权衡两者。

图5 BP神经网络训练误差

4 结束语

茶机智能化控制方法中名优茶的分类,往往需要具有专业经验的工人进行人工鉴别,不能广泛应用到大规模操作中。由于3类茶叶的颜色特征和纹理特征均不明显,所以利用数字图像的方法很难达到需求的准确率。本文提出了基于视觉词袋模型和BP神经网络模型的名优茶分类方法:首先提取每张图像的SIFT特征,其次利用K-means方法生成视觉单词,并将图像表示成词频向量,最后利用BP神经网络进行训练,实验结果证明了该方法的合理性和准确性。

虽然SIFT特征具有多种稳定的性质,但是单独考虑一种特征并不能包含图像的所有信息,并且视觉词袋模型的单词个数并不能准确的进行界定。所以,未来的工作可以通过增加特征和改善视觉词袋两个方面来提高分类的精度。

[1]管曦.中国出口茶叶产品的比较优势探讨:基于不同类别和包装的分析[J].中国农村经济,2010(1):28-34.

[2]闫振宇,徐家鹏.基于品种细分的中国茶叶国际竞争力实证分析[J].湖北农业科学,2011,50(8):1713-1716.

[3]汪新贵.提升越乡品牌 打造茶叶强市[J].中国茶叶,2012(11):18-19.

[4]骆耀平,唐萌,蔡维秩,等.名优茶机采适期的研究[J].茶叶科学,2008,28(1):9-13.

[5]田波平,孙秋梅,廖庆喜,等.6CZZ-600型针形名优茶做形机及成型工艺优化[J].农业工程学报,2005,21(4):65-68.

[6]王云,李春华.名优茶氨基酸含量变化规律及其影响因素研究[J].西南农业学报,2006,19(6):1121-1126.

[7]许明,韩军伟,郭雷,等.利用模型选择确定视觉词袋模型中词汇数目[J].计算机工程与应用,2011,47(31):148-150.

[8]陆江锋,单春芳,洪小龙,等.基于数字图像的茶叶形状特征提取及不同茶叶鉴别研究[J].茶叶科学,2010,30(6):453-457.

[9]李志欣,施智平,李志清,等.融合语义主题的图像自动标注[J].软件学报,2011,22(4):801-812.

[10]汪镭,周国兴,吴启迪.人工神经网络理论在控制领域中的应用综述[J].同济大学学报:自然科学版,2001,29(3):357-361.

[11]纪华,吴元昊,孙宏海,等.结合全局信息的SIFT特征匹配算法[J].光学精密工程,2009,17(2):439-444.

[12]李晓峰,徐玖平,王荫清,等.BP人工神经网络自适应学习算法的建立及其应用[J].系统工程理论与实践,2004(5):1-8.

Tea machine intelligent control method based on BOVW and BP neural network

TAN He-ping,XU Hai-wei,HU Chang-an,TANG Jiang-wen,XU Chuan-di
(National Institute of Measurement and Testing Technology,Chengdu 610021,China)

Classification of famous tea has been a difficult problem precisely,because the three types of famous tea have obviously little distinction in color and ARTS features.So,practical applications mainly rely on subjective human judgment.To address this problem,a novel method based on bag of visual words was proposed.The authors first collected images through digital image processing methods to adjust the contrast,and then used the bag of visual words model,to extract SIFT features from each images and generated to visual words.Finally,each image was expressed as a vector containing a visual representation of the words.Then,the vectors were entered into the BP neural network to train BP and classify tea pictures.Experimental results show that the proposed method is reasonable and effective.This method can be widely applied to tea classification problems.

tea machine;digital image processing;bag of visual words;SIFT features;BP neural network

TB99;TH741;TP391.4;TS272.5

:A

:1674-5124(2014)06-0084-04

10.11857/j.issn.1674-5124.2014.06.022

2014-05-11;

:2014-07-13

国家“863”计划项目(2012AA10A508)

谭和平(1957-),男,重庆市人,研究员,享受国务院政府津贴专家,从事生物化学茶产业链研究。

猜你喜欢

向量茶叶神经网络
《茶叶通讯》简介
基于递归模糊神经网络的风电平滑控制策略
向量的分解
聚焦“向量与三角”创新题
藏族对茶叶情有独钟
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
香喷喷的茶叶
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线