APP下载

赣南脐橙可溶性固形物近红外光谱在线无损检测

2016-11-12刘燕德欧阳玉平朱丹宁韩如冰肖怀春吴明明孙旭东

广东农业科学 2016年9期
关键词:方根脐橙赣南

刘燕德,胡 军,欧阳玉平,朱丹宁,韩如冰,肖怀春,吴明明,孙旭东

(华东交通大学机电工程学院,江西 南昌 330013)

赣南脐橙可溶性固形物近红外光谱在线无损检测

刘燕德,胡 军,欧阳玉平,朱丹宁,韩如冰,肖怀春,吴明明,孙旭东

(华东交通大学机电工程学院,江西 南昌330013)

通过应用近红外漫透射光谱技术结合最小二乘支持向量机等算法,探索脐橙可溶性固形物含量在线无损检测的可行性。139个样本被分成建模集和预测集(103∶36),分别用于建立检测模型和验证检测模型的预测能力。漫透射近红外光谱,经过一阶微分、多元散射校正和移动窗口平滑组合预处理后,分别建立了偏最小二乘、偏最小二乘支持向量机模型,经比较发现,偏最小二乘支持向量机模型的预测能力更强,模型预测的均方根误差和相关系数分别为0.6423%、0.9059。通过对比发现,主成分分析和径向基函数有利于提高最小二乘支持向量机模型的预测能力。结果表明:采用近红外漫透射光谱技术结合最小二乘支持向量机算法能够很好地实现脐橙可溶性固形物含量的在线无损检测。

近红外光谱;漫透射;赣南脐橙;可溶性固形物;最小二乘支持向量机

刘燕德,胡 军,欧阳玉平,等. 赣南脐橙可溶性固形物近红外光谱在线无损检测[J].广东农业科学,2016,43(9):105-111.

赣南脐橙营养丰富,可溶性固形物含量较高。可溶性固形物是单糖、双糖、多糖等可溶性糖类的总称,是衡量脐橙成熟度和口感品质的主要指标之一[1]。可溶性固形物一般采用切开后压榨果汁进行测量,该方法测量相对准确,但是对赣南脐橙损耗很大,且消耗人力物力,不能满足大批量水果分选的要求[2-3]。随着赣南脐橙产量的增加,亟需一种脐橙可溶性固形物检测方法,实现无损检测,通过脐橙可溶性固形物的含量进行分级,从而实行按质定价。

在近红外光谱中包含了有机物中所有含氢基团的相关信息,且信息量相当丰富。在被测对象近红外光谱与目标组分真实值之间进行回归分析,建立定量分析模型,可实现未知样品目标组分的快速无损检测[4]。近红外光谱技术已被证明是农产品内部品质检测的有效方法之一,近红外光谱技术也从静态实验室检测逐步迈向在线动态检测[5]。王伟明等[6]采用平滑去噪处理后的近红外漫反射光谱,建立了橙子的糖度含量数学模型,模型预测标准偏差为0.019%。徐惠荣等[7]建立了橙子可溶性固形物的多种数学模型,表明多元散射校正算法结合最小二乘支持向量机模型效果最优。在传统在线检测系统中,脐橙和果杯紧密配合比较困难,可能造成生产线零部件反射的杂散光直接进入检测器,从而影响检测精度。本研究采用弹性遮光圈和透光孔组合结构,克服了绝大部分杂散光,提高了在线检测精度,找到一种最适合赣南脐橙的可溶固形物检测模型。

1 材料与方法

1.1试验材料

赣南脐橙由江西某果业公司提供,脐橙的横向直径范围为60~76 mm,纵向直径范围为62~91 mm。擦掉表皮灰尘后依次编号,在脐橙顶部每间隔120º做1个标记,每个样品共标记3个点,在室温(25℃)静置12 h后,每个点均用仪器采集一次近红外光谱。

1.2近红外漫透射光谱在线检测装置

脐橙光谱的采集和分选采用自行设计的在线检测装置(图1)完成。在线检测装置的光谱仪选用海洋QE65000型光谱仪,光源为12 V、100 W的卤钨灯10盏,在波长350~1 150 nm,积分时间100 ms、光照强度1 000 W的条件下沿样品传送线两侧沿环形分布,每侧布置5盏,由直流稳压电源供电,且电压和电流可调。样品运动时,两侧各5盏光源均匀地照射至样品上。果杯上装有弹性避光圈,水果置于果杯上时依靠自重,实现水果与弹性避光圈的紧密配合。果杯底部为直径5 mm的透光孔,弹性避光圈和透光孔的组合式结构,可以有效避免杂散光进入检测探头。检测探头安装透光孔正下方,距离果杯底部约2 mm。光谱仪与检测探头间使用1 000 µm×2 m光纤连接。

图1 近红外漫透射在线检测系统结构

1.3近红外漫透射光谱的在线采集

在光谱采集前需要预热,每次开机需预热30 min,用白色特氟龙球作参比,校正可见近红外漫透射光谱在线检测装置,在光谱查看界面观察能量谱强度标准差变化,当变化范围在1%内,电压稳定,即可以开始光谱采集。每个脐橙沿赤道标号部位采集3条光谱,共150个样品。将样品依次进行编号,每个样品沿着赤道部位等间弧度标记3个点,间隔约120°;试验时采用人工上果,将赣南脐橙赤道部位放置到果杯凹槽内,保证赣南脐橙果顶与果柄连线方向与传送带运动方向一致。传送链带动果杯移动,经过探头位置,通过硬件触发使光谱仪触发,采用自主开发的光谱采集软件采集并保存1条光谱。如图2所示,硬件触发过程如下:链轮与编码盘都安装在主轴上,链轮每4个齿对应编码盘1个齿,且链轮4个齿位置安装1个果杯。霍尔传感器位于编码盘下方2 mm处,编码盘每转1齿,使得链轮传动1个果杯的行程,并触发传感器发出1个高电位信号,触发光谱仪采集1条光谱,并在相应的软件中保存光谱。共用赣南脐橙150个,每个点测1条光谱,分别求出3条光谱的平均光谱作为该样品的光谱值。剔除3条空光谱,剔除8条异常光谱,共139条,赣南脐橙每个标记点均对应测量可溶性固形物含量真实值。数据处理中每条平均光谱均视为1个样品的光谱,按照3∶1的比例随机划分,得到建模集样品103个,预测集样品36个。图3为光谱在线检测设备实物图。

图2 在线检测设备的光谱数据采集原理图

1.4可溶性固形物含量真实值测量

赣南脐橙可溶性固形物含量真实值采用PR-101α糖度计测量。表1为建模集和预测集的可溶性固形物真实值分布统计结果。所有光谱采集完成后,切下标记点果肉适量挤汁于糖度计测试窗口上,重复测量3次,取样品平均值作为样品可溶性固形物含量的真实值。

表1 建模集和预测集的可溶性固形物真实值分布统计结果

图4 赣南脐橙近红外漫透射原始光谱

图3 光谱在线检测设备实物

2 结果与分析

2.1赣南脐橙近红外漫透射光谱响应特性

图4为可溶性固形物含量高、中和低3个代表样品对应的光谱,光谱中存在2个波峰和1个波谷,波峰处于725、820 nm处。从波形来看,赣南脐橙近红外漫透射光谱集中分布在550~950 nm之间。由于光谱两端存在一些噪声信号,建模选取550~950 nm之间波段。赣南脐橙表皮呈黄绿色,含有较高的叶绿素,730 nm附近的波谷可能由于O-H三倍频伸缩振动导致[12]。

由表2对比可知,一阶微分、移动窗口平滑和多元散射校正组合预处理后的效果最好。建模集和预测集光谱经一阶微分、平滑和多元散射校正组合处理后,用于后续建立可溶性固形物数学模型和模型预测。

表2 近红外漫透射检测方式结合不同预处理方法下赣南脐橙SSC的PLS建模结果

2.2光谱预处理方法比较

从图5可以看出,在500~700、700~800、800~950 nm 3个波段范围存在明显的基线漂移。微分可以消除基线漂移,放大细节和高频噪声信息,通常微分后要进行平滑处理,以消除高频噪声[13]。多元散射校正可以消除样品大小不均而产生的散射效应。本实验分别采用多元散射校正(MSC)、一阶微分(1D)及其组合方法处理光谱数据。不同预处理方法的参数设置如下:Savitz-ky Golay一阶微分窗口宽度5点2阶多项式、移动窗口平滑窗口3点。由表2可知,一阶微分、平滑和多元散射校正的组合光谱预处理方法结果最优,建模相关系数为0.920,建模均方根误差为0.174%,模型预测相关系数为0.910,预测集均方根误差为0.652%。

图5 赣南脐橙近红外漫透射预处理后光谱

图6为光谱经不同光谱预处理后PLS建模的主成分因子数变化曲线,为可溶性固形物含量高、中和低3个代表样品对应一阶微分、平滑和多元散射校正组合处理后的光谱。主成分因子数是决定PLS模型性能的关键因素之一,最佳主成分因子数由留一法交互验证决定,交互验证均方根误差(RMSECV)最小值对应的主成分因子数即为PLS最佳主成分因子数。

图6 赣南脐橙的可溶性固形物中主成分因子决定图

2.3可溶性固形物在线检测数学模型

2.3.1偏最小二乘数学模型 图7为建模集的均方根误差(RMSEC)和预测集的均方根误差(RMSEP)随主成分因子数的变化曲线。建模时所选主成分因子数(PC)过低,可能忽略部分有效光谱信息,导致模型精度降低,出现“欠拟合”现象,例如PC为5或6,模型预测精度尚未达到最优;而当所选PC过高时,易出现“过拟合”现象,如建模PC为8或9,RMSEC值更低,但RMSEP值较PC为8时略高。因此,本试验PLS模型中,最佳主成分因子数为7。

图8为校正集和预测集赣南脐橙可溶性固形物预测值与真值的散点图。建模的相关系数rc为0.978,建模的均方根误差RMSEC为0.169 %,预测的相关系数rp为0.901,预测的均方根误差RMSEP为0.665%。

图7 赣南脐橙建模集的均方根误差和预测集的均方根误差随主成分因子数的变化曲线

图8 校正集和预测集赣南脐橙可溶性固形物预测值与真值的散点图

通过模型回归计算获得回归系数,即不同波长点处对应的光谱变量的权重值,将回归系数与光谱变量通过加权求和再加上截距b=12.17,即可得到脐橙糖度的定量判别(图9)。

图9 赣南脐橙回归系数曲线

2.3.2最小二乘支持向量机数学模型 影响最小二乘支持向量机(LS-SVM)性能的关键因素有输入向量、核函数和其参数。输入向量数量维数影响LS-SVM模型的计算速度和复杂程度[8-14]。本实验采用两种策略,将139个近红外光谱波长变量降维后作为LS-SVM的输入向量。一是采用主成分分析(PCA)方法,将近红外光谱数据压缩成若干个主成分得分向量,考察不同主成分得分向量对LS-SVM预测结果的影响。图10为赣南脐橙的可溶性固形物PCALS-SVM建模方法中输入变量PC决定图,设PCA最大主成分因子数为20,随着输入LSSVM主成分得分向量数量增加,预测均方根误差先减小后增大,当主成分的得分向量数量为8时,预测均方根误差达到最小为0.642%。二是采用连续投影算法(SPA),根据每个波长变量正交投影信息量,从139个近红外光谱波长变量中,选取可溶性固形物敏感波长变量作为LS-SVM输入向量。设置SPA选取最大和最小变量数分别为30和10,选取结果如图8所示。共21个变量被选为LS-SVM的输入向量,预测的均方根误差为0.371。全谱533个波长变量作为PCA和SPA的对比组,也被用作LSSVM的输入向量,依据预测均方根误差最小原则,PCA运行结果最优,主要8个主成分得分向量累计贡献率为99%,几乎包含了全光谱的信息,而SPA可能在选择过程中损失了极少部分可溶性固形物相关的光谱信息。

图10 赣南脐橙的可溶性固形物PCA-LS-SVM建模方法中输入变量PC决定图

LS-SVM的两种典型核函数分别为径向基核函数(RBF_kernel)和线性核函数(Lin_kernel)。由表3可知,依据模型相关系数越大、预测均方根误差越小、模型预测能力越强的原则,径向基核函数运行结果优于线性核函数。原因可能是径向基核函数泛化能力强,可以逼近任意非线性函数,收敛速度快,可成功处理可溶性固形物含量与光谱数据间的非线性关系。采用二步法优化LS-SVM核函数参数,首先以较大步长搜索最佳核函数参数范围,然后以较小步长在初步定位的范围内,进一步确定最优参数,结果见表3。

表3 近红外漫透射检测方式结合不同类型核函数的赣南脐橙SSC的LS-SVM建模结果

3 结论与讨论

本研究对比PLS和LS-SVM模型发现:一阶微分、移动窗口平滑和多元散射校正组合预处理后建立的PCA-LS-SVM数学模型预测结果最优,预测均方根误差为0.6423%。徐惠荣等[15]采用近红外透射光谱技术可溶性固形物的含量,模型预测的均方根误差为0.723%,比本实验结果略差,原因可能是本实验装置采用了弹性避光圈和透光孔的组合结构,更有效地抑制了杂散光,同时,PCA-LS-SVM方法在解决小样本非线性问题方面更具优势。

本试验结果表明,应用可见近红外漫透射光谱技术结合主成分分析、最小二乘支持向量机,可以很好地实现赣南脐橙可溶性固形物含量的在线无损检测。运用一阶微分、移动窗口平滑和多元散射校正组合等多种预处理方法有效地消除了基线漂移和光散射效应。对比模型发现使用最小二乘支持向量机的数学模型预测能力优于偏最小二乘建立的数学模型,模型预测均方根误差和相关系数分别达到0.6423%和0.9059。与连续投影算法相比,主成分分析更适于选取最小二乘支持机的输入向量。基于径向基核函数的最小二乘支持向量机模型略优于线性核函数。本研究为其他农产品品质近红外漫

透射光谱的在线检测提供相关参考依据。

[1]Wang A C,Xie L J. Technology using near infrared spectroscopic and multivariate analysis to determine the soluble solids content of citrus fruit[J]. Journal of Food Engineering,2014,143:17-24.

[2]王蒙,冯晓元. 梨果实近红外光谱无损检测技术研究进展[J]. 食品质量安全检测学报,2014,5(3):681-690.

[3]Magwaza L S,Opara U L,Nieuwoudt H,et al. NIR spectroscopy applications for internal and external quality analysis of citrus fruit—A review[J]. Food and Bioprocess Technology,2012,5:425-444.

[4]朱丽伟,马文广,胡晋. 近红外光谱技术检测种子质量的应用研究进展[J]. 光谱学光谱分析,2015,35(2):346-349.

[5]Viegas T R,Mata A L M L. Determination of quality attributes in wax jambu fruit using NIRS and PLS[J]. Food Chemistry,2016,190:1-4.

[6]王伟明,董大明,郑文刚,等. 梨果糖浓度近红外漫反射光谱检测的预处理方法研究[J]. 光谱学光谱分析,2013,33(2):359-362.

[7]许文丽,孙通,胡田,等. 基于变量优选和快速独立成分分析的黄花梨可溶性固形物可见/近红外光谱检测[J]. 光谱学光谱分析,2014,34(12):3253-3256.

[8]许禄,邵学广. 化学计量学方法[M]. 第二版.北京:科学出版社,2004.

[9]刘雪梅,章海亮. 基于DPLS和LS-SVM 的梨品种近红外光谱识别[J]. 农业机械学报,2012 43(9):1000-1298.

[10]王加华,韩东海. 便携式近红外水果糖度分析模型简化研究[J]. 食品安全质量检测技术,2009,1(1):32-38.

[11]严衍禄. 近红外光谱分析基础与应用[M]. 北京:中国轻工业出版社,2005.

[12]尼珍,胡昌勤,冯芳. 近红外光谱分析中光谱预处理方法的作用及其发展[J]. 药物分析杂志,2008,28(5):824-829.

[13]Li J B,Huang W Q,Zhao C J,et al. A comparative study for the quantitative determination of soluble solids content,pH and firmness of pears by Vis/NIR spectroscopy[J]. Journal of Food Engineering,2013,116:324-332.

[14]张利华,马钧钊,勒国庆,等. 基于BP神经网络的仓储烟草霉变预测[J]. 华东交通大学学报,2013,30(6):71-76.

[15]徐惠荣,陈晓伟,应义斌. 基于多元校正法的香梨糖度可见/近红外光谱检测[J]. 农业机械学报,2010,41(12):1000-1298.

(责任编辑 白雪娜)

Online detection of soluble solids content for Gannan navel by visible-near infrared diffuse transmission spectroscopy

LIU Yan-de,HU Jun,OUYANG Yu-ping,ZHU Dan-ning,HAN Ru-bing,XIAO Huai-chun,WU Ming-ming,SUN Xu-dong
(School of Mechatronics Engineering,East China Jiaotong University,Nanchang 330013,China)

The feasibility was investigated for online detection of soluble solids content(SSC) of Gannan navel orange by visible-near infrared(visible-NIR) diffuse transmission spectroscopy coupled with least square support vector machine(LS-SVM) algorithm. 139 samples were divided into the calibration and prediction sets(103∶36)for developing calibration models and assessing their performance. The partial least square(PLS) regression and LS-SVM model were developed with the pretreatment by the combination of first derivative(1D),Smoothing and multiplicative scattering correction(MSC). The new samples of prediction set were applied to evaluate the performance of the model. Compared with PLS model,the performance of LS-SVM model was better with the root mean square error of prediction(RMSEP) of 0.6423% and the correlation coefficient of prediction of 0.9059. And the spectral dimension reduction method of principal component analysis(PCA) and the kernel function of radial basis function(RBF) were suitable to improve the predictive ability of LS-SVM model. The results suggested that it was feasible for online detection of SSC of Gannan navel orange by visible-NIR diffuse transmission spectroscopy combined with LS-SVM algorithm.

near infrared spectroscopy;diffuse transmission;Gannan navel orange;soluble solids content;least squares support vector machine

S24

A

1004-874X(2016)09-0105-07

2016-06-30

“十二五”国家863计划项目(SS2012AA101306);江西省优势科技创新团队建设计划项目(20153BCB24002);南方山地果园智能化管理技术与装备协同创新中心项目(赣教高字[2014]60号)

刘燕德(1967-),女,博士,教授,E-mail:1825868002@qq.com

猜你喜欢

方根脐橙赣南
脐橙连上物联网 扫码便知“前世今生”
赣南采茶戏《一个人的长征》简介
我们爱把马鲛鱼叫鰆鯃
赣南脐橙整形修剪技术
赣南早脐橙在几种中间砧木上高接换种的表现
永远的歌谣(赣南采茶歌舞剧)
均方根嵌入式容积粒子PHD 多目标跟踪方法
奉节脐橙
数学魔术——神奇的速算
数学魔术