APP下载

稻谷储藏过程中理化特性变化的研究

2021-03-26高彥彬

科学与生活 2021年33期

高彥彬

摘要:在中国,为了方便生产和销售,一些稻谷被加工成粮食成品以满足市场需求。因此,稻谷的质量控制已迫在眉睫,如何快速、准确地判断出稻谷储藏过程中理化特性变化情况就显得尤为重要。

关键词:稻谷储藏过程;理化特性;变化研究

前言:稻谷储藏过程中理化特性会发生很多变化,其中主要以脂肪酸的指标变化为重要代表,脂肪酸值可作为判定稻谷理化特性发生变化程度的标准之一。本文设计并组装了便携式近红外光谱(NIRS)系统,用于判断稻谷储藏过程中的脂肪酸的变化情况。

1.材料及样品

1.1稻谷储藏试验及样品制备

稻谷的近红外(NIR)光谱包含了多种有机成分的大量信息,应用近红外光谱技术检测稻米品质的光谱仪大多为商用仪器,不利于现场快速分析。因此便携式近红外光谱系统可以实现稻谷储藏过程中脂肪酸值的动态监测。偏最小二乘(PLS)回归算法是建立光谱化学计量学模型最常用的方法之一。当分析样品为固体颗粒时,收集的近红外光谱中将存在严重的乘性散射效应,这将严重影响PLS模型的性能。乘法散射校正(MSC)和标准正态变量(SNV)是近红外光谱散射校正中应用最广泛的方法。然而,当原始光谱包含较大的化学变化时,MSC和SNV方法表现不佳。因此,可以引入加权乘性散射校正变量选择(WMSCVS)算法对原始光谱进行校正,以获得更可靠的PLS监测模型。试验中使用的稻谷从当地超市购买,每袋5公斤。稻谷是在25°C的恒温下购买和储存的。每月对储存的稻谷进行取样,使用便携式NIRS系统进行光谱采集。采样时,从每个袋子的不同位置采集四个样本,每个样本为20克(精确到0.01克),每月采集20个样本。因此,在6个月内总共可以获得120个样本。

1.2近红外光谱采集

便携式NIRS系统由五个部件组成:光源(卤素(HL-2000))、光强衰减器(中国上海爱德光学仪器有限公司)、反射模块、光谱仪(NIRQuest512海洋光学)和个人计算机。在光谱数据采集之前,使用SpectraSite软件(海洋光学)设置仪器参数并记录光谱数据。仪器参数设置如下:光谱积分时间为5s;平滑度设置为3;收集的光谱范围为899.20 nm至1724.71 nm,共有512个变量。收集光谱数据时,室内温度保持在25°C。将稻谷样品置于内径为6 cm的皮氏培养皿中。使用便携式近红外光纤探针对样品进行三次扫描,将三个测量光谱的平均光谱作为样品的原始光谱。

1.3数据分析

使用变量选择的加权乘性散射校正算法(WMSCVS)是Wu等人于2019年开发的一种近红外光谱校正和特征选择方法。该算法受变量优化可以有效地提取一些特征的启发,提出在多元参数估计过程中使用变量选择来获得加权最小二乘(WLS)的权重系数。在运行WMSCVS算法的过程中,变量的选择基于去除基线的光谱。变量选择算法设计基于模型总体分析(MPA)。在每次迭代中,使用加权自举采样(WBS)生成变量子集,并使用指数递减函数(EDF)控制采样变量的数量。在WMSCVS算法中,当考虑使用基于MPA的变量选择来设置WLS的权重时,有两个优点。一是变量的选择可以保证散射校正性能的最优性。二是MPA从大量子模型中提取信息,有利于变量选择的稳定性。

2.结果与讨论

2.1校准集和预测集样本的划分

在数据分析之前,根据以下规则划分校准集和预测集的样本。首先,将所有120份稻谷样品的脂肪酸值从小到大排列。然后,每四个样本中的两个中间样本中的任何一个被放入预测集中,其余三个被放入校准集中。因此,校准集有90个稻谷样本,而预测集有30个稻谷样本。

2.2特征波长的选择

WMSCVS算法的设计思想是基于MPA而成立的,它使用WBS在迭代过程中生成变量子集,EDF控制采样变量的数量。这会导致优化特征波长的数量和位置在每次运行WMSCVS算法后发生变化。因此,为了消除这些不确定性对最终特征波长选择和PLS模型结果的影响,在相同的参数设置下,WMSCVS算法独立运行50次,并在本研究中对50次独立运行后的结果进行统计分析。虽然WMSCVS算法每次运行后选择的特征波长有一些差异,但有几个波长区域选择的频率较高,这些变量对应的波长选择频率越高,对稻米脂肪酸值的贡献越大,与稻米脂肪酸值的变化相关值的联系程度也随之越高,可以更好地反映出稻谷贮藏过程中的脂肪酸值的变化情况。

2.3基于特征波长的PLS模型结果

研究得出了WMSCVS算法50次独立运行后获得的特征波长变量建立的最佳PLS模型的结果。50个最优PLS模型的平均RCV 2值为0.9737,方差为0.0011。其RMSECV的平均值为0.3566,方差为0.0015。这些结果表明,尽管WMSCVS算法具有一定的随机性,根据多次运行WMSCVS算法后获得的波长变量,它们的RCV 2和RMSECV值都有小的波动。尽管WMSCVS算法的随机性导致每次获得的特征波长存在一些差异,但每次获得的波长组合与目标属性高度相关。这进一步验证了NIRS中包含的信息实际上是被检测对象的综合信息。因此,在建立定量模型之前,有必要对特征波长进行优化。此外,50个最优PLS模型的最优LVs均为10。

2.4特征波长优化过程的结果

在特征变量优化过程中,WMSCVS算法采用EDF策略减少每次迭代的变量空间,并在此过程中通过五次交叉验证确定保留的特征波长。随着迭代次数的增加,波长变量空间变得越来越小,无用信息逐渐被移除,PLS模型的RMSECV值也随着无用信息的移除而降低。在第31次迭代中,PLS模型的RMSECV值达到最小值0.3528,此时,对应的波长数为18,然后,随着迭代次数的不断增加,波长变量空间进一步压缩,PLS模型的RMSECV值开始逐渐增加,直到迭代结束。PLS模型的RMSECV值增加的原因是,随着变量空间的进一步压缩,一些有用的信息将被删除。因此,在此过程中,PLS模型的性能下降是合理的。原始光谱中存在严重的加性基线偏移和倍增效应,通过WMSCVS算法进行正交投影预处理后,可以很好地消除额外的基线效应和可能的光谱变化。包含较大光谱形状变化的波长变量主要包含关于乘法散射效应的信息,而WMSCVS算法中的WLS可以将非信息变量的权重设置为零,从而最小化乘法散射效应的影响。因此,WMSCVS算法选择的特征波长是波长周围区域变化较小的波长变量。

2.5不同散射校正方法下PLS模型结果的比较

本次研究还得出了基于不同散射校正方法预处理的光谱的最优PLS模型的结果。在研究的过程中,基于散射校正光谱建立的PLS模型的性能明显优于基于原始光谱建立的PLS模型。此外,与SNV和MSC方法相比,基于WMSCV校正和优化光谱的PLS模型具有最好的性能。基于原始光谱建立的最优PLS模型的性能,特别是预测过程中的泛化性能并不令人满意,这主要是因为光谱散射效应的存在严重影响了LVs的挖掘。因此,基于散射校正光谱的三种最优PLS模型的性能明显优于基于原始光谱的最优PLS模型。其次,尽管MSC和SNV都可以对光谱进行散射校正,但它们都可以对全光谱数据进行散射校正。当原始光谱包含较大的化学变化时,MSC和SNV的校正性能较差。然而,WMSCVS算法应考虑到在實际应用中无法获得纯组分光谱的信息,因此它可以选择部分变量来估计散射参数,这不仅可以压缩变量空间,而且可以减少非信息变量的影响。因此,基于WMSCVS算法校正和优化的波长变量建立的PLS模型可以帮助本研究获得更好的预测性能。

4.结语

本研究开发了一套便携式近红外光谱系统来监测稻谷储藏中脂肪酸的含量。在建立化学计量学模型的过程中,引入WMSCVS算法对便携式近红外光谱系统获得的原始光谱进行散射校正和特征波长优化,验证了算法的稳定性。结果表明,采用WMSCVS算法对光谱数据进行校正和优化,可以有效地提高PLS回归模型的检测性能。因此,可以推断,随着化学计量学的发展,便携式近红外检测系统在稻谷储藏过程中理化特性变化研究中的应用将越来越成熟。

参考文献:

张瑛,吴先山,吴敬德,杨世祥,童继平,郑乐娅,佘德红,吴跃进.稻谷储藏过程中理化特性变化的研究[J].中国粮油学报,2003(06):20-24+28.

张欣,施利利,汤云龙,汪楠,汪健,柳刚刚,张琴,漆国杰.稻谷储藏过程中主要品质的变化研究[J].食品科技,2018,43(03):122-125.