APP下载

高光谱技术结合GLCM的油桃品种判别研究

2021-02-28黄锋华燕红文苗荣慧

农业技术与装备 2021年12期
关键词:中油油桃特征值

黄锋华,燕红文,苗荣慧

(山西农业大学 信息科学与工程学院,山西 太谷 030801)

油桃具有极高的营养价值,口感较好,经济效益可观,深受消费者青睐[1],研究油桃品种分类对提高油桃的品质及市场竞争力具有重要意义。高光谱成像技术检测精度高,实时性强,是果蔬分类应用研究的常用技术[2]。赵旭婷等[3]选用CARS 和ELM 对油桃品种进行了判别,谷静思[4]对油桃的内部品质与品种通过近红外光谱与介电频谱进行检测研究,在品质预测时近红外光谱预测性能均优于介电频谱,在进行品种判别时二者均可快速鉴别。本研究采用420~1 700 nm 波段高光谱成像技术,选用PLS、LS-SVM 和ELM 模型对同产地的“曙光”“中油4号”“中油5号”“中油9号”进行分类研究,以期得出最优模型。

1 材料与方法

1.1 样本采集

为保证研究的可靠性,采摘时以形状相近、成熟度统一、果质量均匀为选取样本的根本原则,采集地点位于山西省运城市某果园。样本划分及各品种数目见表1。图1 为在可见近红外波段下油桃品种样本图,图2 为近红外波段下油桃品种样本图。

表1 油桃品种样本数Tab.1 The number of nectarine varieties

图1 420~1 000 nm波段不同油桃品种图Fig.1 The different nectarine varieties in 420~1 000 nm band

图2 900~1 700 nm波段不同油桃品种样本图Fig.2 The samples of different nectarine varieties in the 900~1 700 nm band

由图2可知,在近红外波段下的油桃图像是伪彩色的,无法显示样本表面的颜色及纹理信息,可分辨性较低。但相对图1,该波段具有较强穿透性,可获得更多的果皮和果肉信息,而不同品种间油桃样本的组成成分存在明显的差异,因此可选用该波段对不同油桃进行判别分类。

1.2 纹理特征提取

纹理是表征图像特征的重要参数,纹理特征的有效提取是图像分类与分割的重要过程[5],因此本研究采用纹理特征描述不同品种油桃之间的差异。灰度共生矩阵(Gray Level Co-occurrence Matrix,GLCM)可表示图像灰度方向、间距、幅度等相关变化信息,适应性强,可有效的表征纹理[6]。其统计了图像灰度为i、j距离为d 的像元同时出现的频度,公式如(1)所示:

式中:θ——GLCM的生成方向,文中θ取0°。

表征纹理采用以下6个参数,如公式(2)~(7)所示[7]:

均值:

对比度:

相关性:

P(i,j)——GLCM,且i、j代表2 个像素点的灰度级;μx、σx——相应行灰度均值及标准差;μy、σy——相应列灰度均值及标准差。

能量:

同质性:

熵值:

1.3 建模方法

本试验选用PLS、LS-SVM、ELM 3 种模型对油桃进行分类,对其评价使用标准差(RMSEC)和相关系数(R2),目标模型的R2高而RMSEC低。

偏最小二乘(PLS)将输入数据进行区分并按权重线性组合后重新表征输入数据,模型具有较强的预测能力[8];最小二乘支持向量机(LS-SVM)使用核函数将二次规划问题转化为线性方程组的求解[9];极限学习机(ELM)的基础网络为SLFN,SLFN 训练难度大,ELM 则克服了上述缺点,具有泛化误差小、训练高效的优势[10]。

2 油桃品种判别试验过程

模型对4 种油桃判别时,使用数值代表其类别:1 代表“曙光”,2 代表“中油4 号”,3 代表“中油5 号”,4 代表“中油9号”,误差为0.5。模型判别出的代表油桃类别的值分别在[0.5~1.5)、[1.5~2.5)、[2.5~3.5)、[3.5~4.5)之间,预测类别值不在以上区间的为异类样本。

2.1 图像纹理特征提取

在ENVI 环境中提取不同油桃的目标区域,本试验中选取油桃图像中部50×50 像素的目标区域,对该区域采用1.2中的6个评价指标对其纹理特征进行处理,结果如表2所示。

由表2 可知,不同品种油桃样本在可见/近红外波段下提取得到的图像纹理特征值具有较为明显的差异;而在近红外波段下提取得到的图像纹理特征值差异不明显,6 项纹理指标值在4类品种间的差异不显著,数据非常接近。因此,不可使用近红外波段下的纹理指标值对该4类油桃样本进行品种间的区分。

表2 4类样本的GLCM纹理特征值Tab.2 The GLCM texture characteristic values of four types of samples

2.2 品种判别模型构建

2.2.1 PLS建模

使用可见/近红外波段下的图像纹理特征值建立多品种油桃样本的PLS品种分类判别,预测集判别结果,见图3。

图3 PLS模型判别结果Fig.3 The PLS model discrimination results

由图3 可知,在该集合中,14 个“曙光”样本被判别为“中油4 号”,2 个“曙光”样本被判别为异类样本;“中油4 号”中有8个被错判为“曙光”,有1个判别为“中油5号”。

“中油5 号”中有1 个样本被判为“中油4 号”,5 个被判为“中油9 号”;11 个“中油9 号”样本被判为“中油5 号”样本,2个“中油9 号”样本被判为异类样本;该模型在预测集取得78.95%准确率。

2.2.2 LS-SVM 建模

使用可见/近红外波段下的图像纹理特征值建立多品种油桃样本的LS-SVM品种分类判别,预测集判别结果见图4。

图4 LS-SVM模型判别结果Fig.4 The LS-SVM model discrimination results

由图4 可知,在预测集样本中,17 个“曙光”样本被误判,其中15 个样本被误判为“中油4 号”样本,2 个样本被误判为异类样本;8 个“中油4 号”样本被判为“曙光”,1 个“中油4号”样本被判为“中油5 号”;2 个“中油5 号”样本被判为“中油4号”,5个“中油5号”样本被判为“中油9号”;11个“中油9号”样本被判为“中油5 号”,1 个样本被误判为异类样本;由此计算其预测集准确率分别为78.47%。

2.2.3 ELM建模

使用可见/近红外波段下的图像纹理特征值建立多品种油桃样本的ELM品种分类判别,预测集判别结果,见图5。

图5 ELM模型判别结果Fig.5 The discrimination result of ELM model

由图5 可见,在预测集样本中,17 个“曙光”样本被误判,其中13 个样本被归类为“中油4 号”,4 个样本被划分为异类样本;8 个“中油4 号”样本判别为“曙光”,4 个“中油4 号”样本判别为“中油5 号”;5 个“中油5 号”样本预测为“中油4号”,2 个“中油5 号”预测为“中油9 号”;9 个“中油9 号”样本被误判为“中油5 号”样本,4 个样本被误判为异类样本;ELM的准确率达到76.56%。

2.2.4 多种建模方式比较

本试验基于GLCM 选用3 种模型对4 种油桃的纹理特征进行分析并据此对其品种进行了预测,试验结果,见表3。

表3 各模型对油桃品种分类结果Tab.3 The classification results of nectarine varieties by various models

由表3可知,PLS对油桃品种判别效果最优:校正集模型精度R2 和RMSEC 分别达到0.839 和0.437,校正集与预测集判别正确率分别为84.02%、78.95%,平均判别准确率为81.49%。

3 结论

本研究基于GLCM 选用3 种模型对采收期同产地4 种油桃品种进行了分类判别研究,结果如下:不同品种油桃样本在可见/近红外波段下提取得到的图像纹理特征值具有较为明显的差异;对于可见/近红外波段下的图像纹理特征值采用PLS 模型建立的判别精度最高,其整体模型的判别正确率达到81.49%;为了提高判别精度与可靠性,在后续的研究中可采用光谱主成分和图像纹理数据进行融合从而实现对油桃品种的判别研究。

猜你喜欢

中油油桃特征值
科研人员揭示油桃果实表皮不长毛的奥秘
一类常微分方程第二特征值的研究
单圈图关联矩阵的特征值
黄腐酸肥料对日光温室中油5号桃的增产提质效果
油桃价格下跌
求矩阵特征值的一个简单方法
“中油平台”正式上线旨在打造联动生活平台
棚室油桃附加值高
这里的油桃缘何滞销
一类非线性矩阵方程组性质的研究