APP下载

基于高光谱成像的贵长猕猴桃硬度快速预测

2023-03-12冯树南吴美芝陈海江孟庆龙

食品工业科技 2023年6期
关键词:猕猴桃硬度光谱

尚 静,冯树南,谭 涛,吴美芝,陈海江,孟庆龙,

(1.贵阳学院食品与制药工程学院,贵州贵阳 550005;2.贵州省农产品无损检测工程研究中心,贵州贵阳 550005)

贵长猕猴桃产于贵州省修文县,其果肉细嫩而且多浆、果汁酸甜可口,受到广大消费者的喜爱[1−3]。猕猴桃属于后熟水果,采收后需要贮藏在室温条件下继续熟化,待完全熟透后才可以食用。但是假如食用过早,猕猴桃果会因生硬而影响口感,如果放置时间太久,猕猴桃果就会太软而易腐烂。猕猴桃的硬度是判别其成熟度和品质的重要指标,我国水果硬度的传统测定方法(利用果实硬度计的探头压入果肉中测定)虽然准确性相对较高,却拥有破坏检测对象、效率低、费时等缺陷[4];而依靠经验主观判断水果成熟度和品质就无统一标准,导致结果存在随意性,对品质的分选就不准确。因此,在水果品质的分选方面,无论是传统的检测方法还是个人经验主观判断都造成了水果品质参差不齐,难以体现我国水果的市场竞争优势。由此可见,建立一套快速无损的猕猴桃果实的硬度检测方法对于监控其成熟度和品质、指导市场价格是具有实际意义的。

基于精密光学检测仪器的研发和化学计量学的飞速发展,以及近红外光谱技术与高光谱成像技术具有的可实现无损检测的优势[5]。国内外科研学者应用近红外光谱技术以及高光谱成像技术开展了关于草莓[6]、猕猴桃[7−8]、橙子[9]、樱桃[10−11]、葡萄[12]和蓝莓[13]等诸多水果内部品质的分析与研究。高升等[14]采用可见/近红外漫反射光谱技术实现了红提葡萄硬度的无损检测,获得的预测集相关系数:0.93,均方根误差:8.36 N。刘卉等[15]利用近红外光谱技术结合偏最小二乘法实现了冷藏期间“华优”猕猴桃硬度的无损检测,其校正集和预测集相关系数分别为0.96和0.85。而高光谱成像技术是一种集光谱信息与图像信息于一体的无损检测技术,能全面反映水果的内外部品质信息[16]。Xie等[17]使用高光谱成像结合特征变量筛选方法构建了检测香蕉硬度的偏最小二乘模型,获得的预测集的决定系数仅为0.76。Li等[18]基于高光谱成像构建了评价李果实品质的多种检测模型。邵园园等[19]采用高光谱成像技术结合人工神经网络实现了不同成熟度肥城桃可溶性固形物含量和硬度的高光谱检测。但是,基于高光谱成像以及化学计量学检测贮藏期内贵长猕猴桃硬度的研究与分析还未见报道,而且高光谱技术应用在水果品质无损检测领域面临的主要问题是数据量冗余。因此,对获取的高光谱数据进行降维处理尤为必要。

本文通过高光谱成像以及化学计量学实现贵长猕猴桃硬度的检测。运用竞争性自适应重加权与连续投影算法筛选特征变量,基于特征变量和测得的硬度参考值构建检测贵长猕猴桃硬度的误差反向传播神经网络和多元线性回归模型,依据预测效果得到最优模型。以期为水果成熟度以及内部品质的快速检测提供一定的理论基础。

1 材料与方法

1.1 材料与仪器

贵长猕猴桃 来自贵州省修文县龙关口猕猴桃果园。从不同的果树上采摘并挑选没有病虫害且没有损伤的猕猴桃果子,猕猴桃果子摘取后马上运送到实验室,并贮藏在温度为20±2 ℃的实验室环境下,每隔3 d取40个猕猴桃样品进行测量,共进行4次实验,总计160个样品。每次实验前用软纸小心地除掉猕猴桃果子表面的灰尘,逐一编号获取高光谱图像并测定硬度。

TA.XT.Plus质构仪 英国SMS公司;GaiaField-F-V10高光谱成像系统 江苏双利合谱科技有限公司。图1展示了高光谱成像系统结构框图,其中,光谱波长范围:390~1030 nm,CCD相机的曝光时间:12.6 ms,猕猴桃样品距离镜头大约:40 cm,仪器其他参数见参考文献[20]。

图1 高光谱成像系统框图Fig.1 Schematic diagram of hyperspectral imaging system

1.2 实验方法

1.2.1 高光谱图像获取与校正 将猕猴桃样品按编号顺序依次放在电动平移台上,挨个扫描样品,获取猕猴桃样品的高光谱图像。为消除因光源强度分布不均匀和猕猴桃样品的形状差异等带来的噪声干扰,采集完所有猕猴桃样品的高光谱图像后,在相同的系统参数下获取全白以及全黑的标定图像,在SpecVIEW软件中对所有猕猴桃样品的原始高光谱图像进行校正,公式如下:

式中:Rref为校正后的图像;Roriginal为原始的图像;Rwhite和Rblack分别为全白和全黑的标定图像。

1.2.2 猕猴桃硬度测定方法 在完成猕猴桃高光谱图像采集后,采用质构仪测定猕猴桃硬度,质构仪的探头直径:2 mm,探头压入猕猴桃果实的深度:10 mm,仪器测试时的速度:1 mm/s,测前和测后的速度都是2 mm/s。硬度测定前先将猕猴桃样品测定部位去皮,每个样品分别测定三个位置(如图2所示),分别将每一个猕猴桃三次测定值的平均值作为此样品的硬度参考值。

图2 硬度测量位置Fig.2 Firmness measured position

1.2.3 建模方法

1.2.3.1 反射光谱提取及预处理 采用ENVI 5.4软件从校正后的高光谱图像中选取猕猴桃样品硬度测量的三个位置(如图2所示)作为感兴趣区域(regions of interest,ROIs),并获取反射光谱,将ROIs区域的反射率平均值作为此猕猴桃样品的原始的反射光谱。通过前期探究多种光谱预处理方法(标准正态变换、多元散射校正、二阶导数等)对原始反射光谱的预处理效果,得出标准正态变换是相对较优的预处理方法[20−21],因此本文采用标准正态变换(standard normal variation,SNV)进一步消除反射光谱中的噪声信号[22],计算公式如下:

式中:Zij代表标准化的光谱;xij代表原始的光谱;是原始光谱平均值;Si表示标准偏差,i=1,2,···,n;j=1,2,···,p;n为猕猴桃样本个数;p为光谱点个数。

1.2.3.2 特征变量筛选 运用竞争性自适应重加权(competitive adaptive reweighted sampling,CARS)与连续投影算法(successive projection algorithm,SPA)筛选特征变量,两种算法详见参考文献[20]。

1.2.3.3 预测模型及评价方法 实验基于误差反向传播(error back propagation,BP)神经网络[23]与多元线性回归(multi linear regression,MLR)分别构建了检测贵长猕猴桃硬度的快速无损检测模型。MLR回归方程如下:

式中:Y为硬度值;Xnm表示特征变量;β0,β1,β2,···,βm为待定系数;ε1,ε2,ε3,···,εn为n个独立且服从同一正态分布的随机误差变量;m为特征变量数;n为猕猴桃样本个数。

通过建模集与预测集的相关系数rc与rp,均方根误差RMSEC与RMSEP,以及剩余预测偏差RPD衡量模型性能优劣的关键指标。若RPD<1.4,证明构建的检测模型无法完成预测;1.4≤RPD<1.8,则模型仅可粗略地预测;1.8≤RPD<2.0,证明构建的模型可完成相对较好的预测;RPD≥2,证明模型可以完成非常好的预测[24−25]。

式中:SD代表预测集中猕猴桃样本硬度参考值的标准偏差。

1.3 数据处理

利用软件Spectral SENS采集所有猕猴桃样品的高光谱图像,采集获得的猕猴桃高光谱图像数据在ENVI 5.4和MATLAB R2016b软件中进行处理与分析。

2 结果与分析

2.1 硬度测定结果

在建立无损检测模型时,通过获取的反射光谱以及测定的硬度参考值将所有贵长猕猴桃样品分成建模集和预测集。通过光谱-理化值共生距离方法[26]从160个猕猴桃样品选择120个样品用于建模集,其余的40个用于预测集。表1列出了建模集和预测集中贵长猕猴桃硬度参考值统计结果,从表1明显得出,建模集中硬度的参考值范围大于预测集中硬度的参考值范围,这样分成的建模集和预测集有利于构建准确、稳定的检测模型。

表1 猕猴桃硬度值Table 1 Values of kiwifruit firmness

2.2 猕猴桃反射光谱及预处理

由于原始反射光谱中包含一些噪声,为了提升贵长猕猴桃无损检测模型的精准度及稳定性,运用SNV进一步消除原始的反射光谱中的噪声,所有猕猴桃样品的原始的反射光谱以及经过SNV预处理后的相对反射光谱如图3所示。从图3可以看出,波长675 nm附近的吸收峰是由叶绿素的吸收引起的,体现了猕猴桃的颜色信息,波长980 nm附近的吸收峰是由水分的吸收引起的,反映了猕猴桃中的水分含量。对比图3a与图3b可以发现,预处理后的相对反射光谱曲线要比原始的反射光谱曲线相对平滑些,证明SNV预处理去掉了部分噪声以及背景干扰信息。

图3 猕猴桃的反射光谱Fig.3 Reflectance spectra of kiwifruit

2.3 特征变量筛选

2.3.1 采用SPA筛选特征变量 应用SPA筛选特征变量时,基于均方根误差来筛选出相对较优的特征变量。图4a给出了均方根误差随着SPA中变量数的改变规律,从图4a可以明显看出,当模型中包含的变量个数小于22时,均方根误差随着变量数的增多而减小,而当模型中包含的变量个数大于22时,均方根误差趋于稳定,因此将这22个变量(占256个总变量的8.59%)确定为特征变量,这22个变量分别为:427.5、439.2、451.0、500.7、522.2、541.4、604.4、673.2、703.0、773.3、821.6、847.2、873.0、878.2、885.9、888.5、924.9、932.7、993.2、1004.0、1012.0、1020.0,单位均为nm。图4b给出了采用SPA筛选的22个特征变量分布情况。

图4 SPA筛选特征变量结果Fig.4 Results of feature variables selected by SPA

2.3.2 采用CARS筛选特征变量 运用CARS筛选特征变量时,依据交叉验证均方根误差的最小值来筛选出相对较优的特征变量。图5a和图5b分别给出了交叉验证均方根误差和采样变量数随着采样次数的改变规律,从图5a和图5b可以观察到,第21次采样获得的交叉验证均方根误差最小(2.28),该变量集中包括了35个特征变量(占256个总变量的13.67%),这35个变量分别为:427.5、429.8、448.6、455.7、484.1、601.9、616.6、648.5、651.0、670.7、673.2、685.6、695.5、758.2、763.2、773.3、796.1、803.8、806.3、829.3、847.2、862.7、865.3、873.0、896.3、909.3、922.3、932.7、940.6、982.6、987.9、990.5、1004、1012、1017,单位均为nm。图5c给出了应用CARS筛选的35个特征变量分布情况。对比图5c与图4b可以看出,CARS筛选的特征变量相对集中,主要位于波段427.5~484.1、601.9~695.5、758.2~940.6 nm以及982.6~1027 nm之间,而SPA筛选的特征变量要离散一些。

图5 CARS筛选特征变量的结果Fig.5 Results of feature variables selected by CARS

2.4 基于特征光谱的建模结果

基于CARS和SPA筛选出的特征变量以及建模集和预测集中硬度的参考值,分别构建检测贵长猕猴桃硬度的BP神经网络和MLR快速无损检测模型。表2列出了基于特征变量构建的检测模型对贵长猕猴桃硬度的检测结果,从表2可以得出,基于SPA筛选的特征变量构建的SPA-BP和SPA-MLR两种无损检测模型仅可粗略地预测贵长猕猴桃硬度,其1.4≤RPD<1.8;而基于CARS筛选的特征变量构建的CARS-BP和CARS-MLR两种无损检测模型可以较好地实现贵长猕猴桃硬度的预测,其RPD分别为2.02和2.47,表明CARS特征变量筛选方法比SPA方法相对较好。对比CARS-BP和CARS-MLR检测模型可以看出,构建的CARS-MLR检测模型拥有最大的rc=0.95和rp=0.92,以及较小的RMSEC=1.65 kg/cm2和RMSEP=1.99 kg/cm2,且RPD(2.47)大于2,相关文献报道的猕猴桃硬度定量检测模型的rp为0.85[15],小于本研究构建的CARS-MLR检测模型的rp,进一步证实本研究构建的猕猴桃硬度检测模型具有更好的预测效果。同时,运用CARS从256个变量中筛选出35个特征变量,大大提高了检测模型的运算效率,即对比基于全光谱与特征变量构建的检测模型运算效率,得出基于特征变量构建的模型的运算效率比全光谱模型的运算效率提升了近11倍(运算时间从5.84 s降到了0.54 s)。综上所述,基于特征变量构建的CARS-MLR检测模型对检测贵长猕猴桃硬度拥有非常好的预测性能,且运算效率得到了较明显提升。图6展示了CARS-MLR模型对贵长猕猴桃硬度的检测结果。

表2 猕猴桃硬度BP和MLR检测模型Table 2 BP and MLR detection models for the firmness of kiwifruit

图6 猕猴桃硬度参考值与预测值Fig.6 Reference and predicted values of the firmness of kiwifruit

3 结论与讨论

本研究采用高光谱成像技术结合化学计量学,得到了一种能够快速、无损预测贵长猕猴桃硬度的方法。其中,为消除原始反射光谱中的部分噪声和背景干扰信息,运用SNV方法对原始光谱进行预处理,得出预处理后的相对反射光谱曲线要比原始的反射光谱曲线相对平滑些。基于SPA和CARS筛选特征变量,得出构建的SPA-BP和SPA-MLR两种无损检测模型仅可粗略地预测贵长猕猴桃硬度,其1.4≤RPD<1.8,而构建的CARS-BP和CARS-MLR两种无损检测模型可以较好地实现贵长猕猴桃硬度的预测,其RPD分别为2.02和2.47,证明CARS特征变量筛选方法比SPA方法相对较好。基于特征变量构建的CARS-MLR检测模型拥有较大的rc=0.95与rp=0.92,以及较小的RMSEC=1.65 kg/cm2和RMSEP=1.99 kg/cm2,且RPD大于2,证明CARSMLR模型可以非常好的预测贵长猕猴桃硬度。相对于文献报道的基于全变量构建的猕猴桃硬度无损检测模型[15],本研究采用CARS从全变量中筛选出35个特征变量,大大提高了模型的运算效率,即CARS-MLR模型的运算效率比全变量模型的运算效率提升了近11倍(运算时间从5.84 s降到了0.54 s)。为水果成熟度以及内部品质的快速检测提供一定的理论基础。此次实验样本仅采摘于一个猕猴桃果园,为了提高模型的适用性和稳定性,后期将进一步扩充和完善实验。

猜你喜欢

猕猴桃硬度光谱
基于三维Saab变换的高光谱图像压缩方法
硬度测量法测定20号钢球化等级的实验
终轧温度对F460海工钢组织及硬度影响
摘猕猴桃
猕猴桃落果咋应对
提取猕猴桃的DNA
摘猕猴桃
星载近红外高光谱CO2遥感进展
苦味酸与牛血清蛋白相互作用的光谱研究
超声波光整强化40Cr表层显微硬度研究