APP下载

基于C—SVM的碎米检测算法研究

2017-02-15梁诗华林毅鑫何金成

湖北农业科学 2016年20期
关键词:碎米特征提取

梁诗华+林毅鑫+何金成

摘要:提出了一种基于支持向量机(C-SVM)区分整精米和碎米的方法,首先对大米图像进行阈值分割、平滑处理等图像预处理,并根据大米的粒形特点,提取米粒的面积、周长等6个形态特征,利用Orange Canvas数据挖掘软件对C-SVM中核函数参数进行预判,最终选择线性核函数的C-SVM作为分类器进行分类。对8组大米样本图像进行碎米测试,可达到较好的分类效果。试验结果表明,线性核函数的支持向量机对精整米与碎米识别分类准确率为95.6%。

关键词:碎米;特征提取;Orange Canvas;C-SVM

中图分类号:TS212;TP391.4 文献标识码:A 文章编号:0439-8114(2016)20-5368-04

DOI:10.14088/j.cnki.issn0439-8114.2016.20.051

Abstract: A method based on support vector machine(C-SVM) to distinguishbetween head rice and broken rice was proposed. Firstly,it did the image threshold segmentation,then proceeded the smooth processing. And according to the characteristics of rice grain shape,extracted six morphological characteristics such as area,perimeter and so on. Then using Orange Canvas data mining software to predict kernel function parameter. Finally,linear kernel function was selected as classifier.Eight groups of broken rice samples had been tested,which achieved a preferable classification result. The test results showed that linear of SVM can identify head rice and broken rice with classification accuracy at 95.6%.

Key words: broken rice;feature extraction;Orange Canvas;C-SVM

碎米含量是稻米加工品質好坏的重要评价指标之一,也是稻米分级的重要依据,且与稻米加工企业的经济效益密切相关[1]。人工检测碎米需耗费很多时间,操作复杂,且易受到人为因素的影响。碎米分为大碎米和小碎米,碎米在国家标准GB1354-2009中定义:留存在直径2.0 mm圆孔筛上,不足正常整米2/3的碎粒为大碎米;通过直径2.0 mm圆孔筛,留存在直径1.0 mm圆孔筛上的碎粒为小碎米[2]。利用机器视觉对碎米检测已经成为了未来的发展趋势,国内外许多学者已进行了一些相关的研究,多采用是通过面积、周长或长轴长度等特征进行判别。毋桂萍等[3]和戴丹[4]利用大米子粒长轴计算碎米。王大溪等[5]比较分析了长轴和面积特征识别碎米算法,提出了面积特征在粳米识别中取得较好的效果。孙翠萍[6]与方华等[7]利用面积特征对碎米进行检测。崔雯雯[8]建立贝叶斯逐步判别、概率神经网络判别两种碎米模型,得出神经网络判别碎米,正确率高。万鹏等[9]利用BP神经网络检测碎米,对碎米识别准确率为92.09%。Harpreet等[10]选择支持向量机的径向基核函数进行碎米识别,识别准确率高于86%。

本研究结合大米粒形特点提取米粒的面积、周长、长、宽、长宽比及圆度6个特征参数,比较分析支持向量机常见4种核函数对碎米识别检测的预测准确度,为后续碎米检测提供基础。

1 材料

1.1 试验材料

试验用大米为江西省岱宝山产的软丁优米,按照国家标准(GB1354-2009)中的碎米分法分为整精米、大碎米、小碎米。

1.2 试验设备

以相机获取的米粒图像,易受到光照的影响,且不同环境光源下所得到影响差异较大,相比之下,以扫描仪获取的图像较为稳定。本研究选择扫描仪作为原始图像获取的装置。采用300 dpi进行灰度扫描,图像以JPG格式进行存储。操作系统为Windows XP,以Qt5.5.1为开发工具,借助Opencv3.0进行图像处理和分析。

为了防止米粒发生粘连、重叠的问题,本研究使用置米盘将米粒进行分开,置米盘如图1所示。

2 计算机视觉碎米检测方法

碎米检测流程如图2所示。

2.1 图像处理

图3a为采集的样品图像。为了将目标与背景进行分割,同时也为后续特征提取,需要将大米图像进行分割去除背景,本研究运用Otsu算法设定最优阈值,将图像分为背景和目标两个部分,从而将大米从背景中分割出来(图3b),再将其进行二值化处理。为了能够消除图像的噪声,对大米图像进行中值滤波(图3c),滤波后图像轮廓清晰,颗粒状噪声得到很好抑制,最后利用canny算法提取大米轮廓,为后续大米特征提取奠定基础如图3d所示。

2.2 特征提取

大米的粒形取决于面积、周长、长、宽、长宽比及圆度6个几何特征参数[11],特征参数见表1。

3 分类算法

3.1 支持向量机

支持向量机(Support Vector Machines,SVM)是建立在统计学习理论基础上的机器学习算法,主要解决小样本、非线性及高维模式识别问题,其基本思想是通过核函数将数据从原始特征空间映射到高维特征空间,来实现最优分类超平面,并用此超平面实现对未知样本的判断[12]。

SVM常用的核函数有:

同时,SVM中重要参数是惩罚因子C,会对试验结果造成一定程度的影响,其值越小,分类错误率越小,反正越大[13]。

3.2 算法评价与指标

本研究利用分类模型评估标准—混淆矩阵(Confusion matrix)进行准确性分析,并采用正确率(Accurate,ACC)、命中率(Precision,P)、召回率(Recall,R)及F1度量(Recall和Precision的调和平均数)4个计算指标对结果进行评价。指标计算式(5)~式(8)所示:

式中,TP表示正确预测到正例的数量,TN表示正确预测到负例的数量,FP表示负例预测到正例的数量,FN表示正例预测到负例的数量。ACC是表示评估分类器好坏的指标,正确率越高,分类器越好。

命中率是精确度的度量,是指分类模型判为正的所有样本中有多少是真正的正样本,而召回率覆盖面的度量,是所有正样本有多少被分类模型判为正样本。F1是将命中率和召回率的方法组合到一个度量上的指标,其赋予命中率和召回率相等的权重。本研究将用上述指标进行对分类模型的判断,其值越大,表示分类效果越好。

3.3 核函数的确定及参数选择

本研究是利用Orange Canvas数据挖掘软件先对核函数进行预判,预判结果见表2。本研究最终选择用线性核函数作为SVM的核函数建立识别模型,并经试验选择模型参数C=1,其分类效果最佳。

4 检测结果与分析

4.1 数据处理与分析

为了证实所提取的大米特征能反映大米的真实信息,采用主成分分析方法对所提取的特征值进行分析。大米粒形特征值的标准偏差、各特征值的贡献率以及累计贡献率见表3。从表3可知,所提取的大米特征参数基本上能够反映大米粒形的全部信息。

4.2 检测结果与分析

本研究以国家标准,进行对整精米、大碎米、小碎米进行区分,各选取粒数100粒,作为样本的训练样本,另外再取8组作为测试样本进行识别,识别结果见表4所示。从表4可看出,采用图像处理技术及SVM方法,正确率为95.6%,能达到较好的分类效果,整精米、大碎米以及小碎米的命中率分别为99.5%、63.6%和82.3%,而召回率分别为96.5%、94.9%和66.6%。F1值则分别为98%、76.1%和73.6%。说明利用SVM进行整精米和碎米的识别是可行的。但有时整精米有时会被误判为大碎米,导致其F1值下降,同理,小碎米有时也会被误判为大碎米,使F1值下降,原因在于:一方面,碎米在国家标准的定义是完整米长度的2/3,而SVM是根据给定的训练样本进行自行分类;另一方面,米粒的受生长环境的影响,造成本身的形状扭曲,使其粒形宽度小于正常粒形宽度,误判为小碎米。

5 结论

本研究使用平板扫描仪获取大米粒形图像,并利用SVM的方法,对碎米进行了识别研究。

1)采用SVM的Linear对整精米和碎米的分类正确率达到95.6%,相比Harpreet学者选择SVM的RBF进行碎米识别,效果更佳显著。

2)丰富了大米图像识别研究,为大米外部品质识别提供了客观可行的方法。同时,研究中主要采用了南方具有代表性的大米品种,具有很好的科研价值。

3)该装置具有良好的扩展性,中国稻米种类繁多,利用SVM可以对不同品种进行广泛的取样与试验,但是目前本研究只针对一种粒形的大米进行研究,还需要对不同类型和品种展开试验研究及算法等进一步校正和完善。

参考文献:

[1] 周显青.稻谷精深加工技术[M].北京:化学工业出版社,2006.

[2] GB1354-2009,大米[S].

[3] 毋桂萍,沈二波,杨红卫.图像处理法在大米碎米率检测中的精度分析[J].中国粮油学报,2009,24(10):94-97.

[4] 戴 丹.粘连大米的碎米率检测技术研究[J].农机化研究,2015(2):222-225.

[5] 王大溪,卢嘉敏,胡 波.粳米分级中基于面积特征的碎米识别算法[J].安徽农业科学,2010,38(29):16536-16537.

[6] 孙翠萍.基于机器视觉的大米自动分级算法的研究[D].南宁:广西工学院,2010.

[7] 方 华,孙翠霞,胡 波.针对子粒连接的碎米检测算法的研究[J].农机化研究,2010(11):53-56.

[8] 崔雯雯.基于图像处理的大米品质检测系统研究[D].长春:吉林大学,2015.

[9] 万 鹏,孙 瑜,孙永海.基于计算机视觉的大米粒形识别方法[J].吉林大学学报(工学版),2008(2):489-493.

[10] HARPREET K,BALJIT S. Classification and grading rice using Multi-Class SVM[J].International Journal of Scientific and Research Publications,2013,3(4):1-4.

[11] 袁佐云,牛兴和,刘传云.基于最小外接矩阵的稻米粒形检测方法粮食与饲料工业[J].粮食与饲料工业,2006(9):7-8.

[12] 梁 龙,房桂干,吴 珽,等.基于支持向量机的近红外特征变量选择算法用于树种快速识别[J].分析测试学报,2016(1):101-106.

[13] RUIXI Y,ZHU LI,GUAN X H,et al. An SVM-based machine learning methed forac-curate internet traffic classification[J].Information Systems Frontiers,2010(12):149-156.

猜你喜欢

碎米特征提取
大米加工中的碎米去哪里了?
浅谈酿酒原料大米碎米含量测定方法的适用性
基于Daubechies(dbN)的飞行器音频特征提取
碎米桠化学成分的研究
Bagging RCSP脑电特征提取算法
基于MED和循环域解调的多故障特征提取
越南大米报价降低;其他亚洲大米报价不变
Walsh变换在滚动轴承早期故障特征提取中的应用