APP下载

基于SVM和PLS的山楂果实硬度的近红外光谱预测模型

2022-08-19刘冬冬李春花滕佳鑫王雪妹赵志磊赵昕

食品工业 2022年8期
关键词:预处理硬度光谱

刘冬冬,李春花,滕佳鑫,王雪妹,赵志磊,赵昕

1. 河北大学质量技术监督学院(保定 071002);2. 计量仪器与系统国家地方联合工程研究中心(保定 071002);3. 河北省能源计量与安全检测技术重点实验室(保定 071002)

山楂(Crataegus pinnatifida)是我国重要的原产经济作物[1]。由于其口味酸甜,营养丰富,是深受广大消费者青睐的果品之一,以山楂为主材的常见零食种类多样,包括有冰糖葫芦、山楂糕、山楂饮品等。此外山楂还是药食两用的大品种中药材。中医认为山楂具有消食化积、活血养生的功效[2]。现代医学研究发现,山楂中的黄酮类、萜类、酚酸类、多糖类等物质具有降血糖、血脂、血压,抗动脉粥样硬化,抗氧化、抗肿瘤等药理作用[3]。

果实硬度是果实质构的重要特征之一。主要由细胞结构,果胶、纤维素、醇不溶性固形物、木质素等组成物质,以及脂氧化酶、果胶甲酯酶、多聚半乳糖醛酸酶等关键酶所决定[4]。山楂果实硬度是判断山楂成熟度,以及进行采后贮藏和加工,评估鲜果货架期和裂果的重要依据[5]。在山楂果实的生产加工销售流通环节中,对硬度指标的实时监测具有重要经济和社会意义。

近红外光谱具有快速、无损和绿色的检测优点,可以取代传统抽样检测方法,对果实样品实现100%的质量指标监测,能够提高检测效率,降低拒绝率,节省检测成本。近年来随着近红外光谱技术的发展,其在农产品品质的分析检测应用越来越广泛,很多学者在苹果[6]、梨[7]、西葫芦[8]、猕猴桃[9]、枣果[10]等多种果蔬的硬度和品质指标方面进行检测研究。然而关于山楂果实的品质和硬度等的检测研究尚未见报道。

试验利用近红外光谱技术结合化学计量学算法和不同经典回归建模方法,研究构建山楂果实硬度指标的预测模型,并对模型进行对比分析,评估不同预处理和建模方法对山楂果实硬度模型预测能力的影响。

1 材料与方法

1.1 材料

试验所用山楂样品购自超市,从中选取176个果型正常并且大小、色泽均匀的完好无机械损伤的山楂果实。试验前样品于冰箱中冷藏储存,试验时将其取出,置于室温下放置一段时间达到室温后,对表面擦拭干燥后,逐个采集数据。

1.2 光谱采集

采用德国布鲁克公司的MPA型傅里叶变换近红外光谱仪采集山楂果实的近红外光谱数据。采集模式采用积分球漫反射,光谱采集范围为4 000~12 500 cm-1(800~2 500 nm),设置光谱分辨8 cm-1、扫描次数32次。

1.3 硬度测量

采用美国质FTC构仪,在P2探头下对山楂果实进行穿刺试验。每个山楂样品在赤道部分选定合适刺入点,刺入点位置与光谱采集位置相对应。试验步骤参照M-T戳穿试验法,结合优化过程的设置参数,质构仪检测过程中的参数设置为测试速度60 mm/min、起始力0.2 N、穿刺距离3.00 mm、回程距离45 mm。

1.4 光谱预处理

近红外光谱数据维数多、数据量大,存在冗余和多重共线性等问题,无效信息或噪声被叠加放大,从而影响有效信息的提取利用。此外,吸光度还易受到环境光、温度、仪器暗电流和样品尺寸大小等的影响[11]。因此选用合适的预处理方法对光谱数据进行去噪非常必要。采用5种常用的光谱预处理方法,包括移动平均平滑(moving average smoothing,MAS)、标准正态变量变换(standard normal variate,SNV)、单位矢量归一化(unit vector normalization,NOR)、基线校正(baseline correction,BAS)和去趋势(de-trending,DET)。5种预处理方法在Unscrambler X软件中计算实现。

1.5 模型建立

支持向量机(support vector machines,SVM)是一种经典的非线性监督学习建模方法,基于拉格朗日乘数方程统计学习理论。其建模原理是利用非线性变换函数(核函数)将输入空间变换为高维线性特征空间,在高维线性特征空间中构造最优的线性分离平面[12]。SVM对于数据集较小,输入变量维度较高的非线性关系分析建模具有突出优势[13]。SVM模型性能主要受到核参数(g)和惩罚因子(c)的影响。g参数通过调节核函数的幅度来控制SVM的泛化能力,而c参数用于权衡最小化训练误差和最大化边缘[14]。SVM建模中的关键问题之一是g和c的参数优化问题,试验采用网格寻优经典方法进行优化。偏最小二乘(partial least squares,PLS)是多元回归分析中最经典的线性建模方法之一。它结合典型相关分析、多元线性回归和主成分分析的优点。建模原理是在新的正交空间里从原始变量数据X中构建潜变量(latent variables,LVs),以最大化X空间对预测变量Y空间的预测能力[15]。PLS同时对自变量矩阵和因变量矩阵进行分解,提取的主成分能反映自变量矩阵信息且具有较好的因变量预测能力,对于自变量多重相关和自变量数据冗余情况下的建模问题具有较好的性能[16]。

1.6 模型评价

以训练集和预测集的相关系数(rc和rp)和均方根误差(RMSEC和RMSEP)作为回归模型的预测性能评价指标。相关系数绝对值|r|的取值范围为0~1,数值越接近1表明模型预测性能越好。均方根误差数值越低表明模型性能越好[17]。

1.7 微生物的测定

菌落总数,按GB 4789.2—2016《食品安全国家标准 食品微生物学检验 菌落总数测定》测定[11];霉菌计数,按GB 4789.15—2016《食品安全国家标准 食品微生物学检验 霉菌和酵母计数》测定[12];大肠菌群计数,按GB 4789.3—2016《食品安全国家标准 食品微生物学检验 大肠菌群计数》[13]。

2 结果与分析

2.1 山楂硬度分析

对测量所得的硬度指标数据进行统计分析,结果如表1所示。176个硬度指标的数值分布范围为1.42~5.69 N。对硬度分布做进一步细化分析,其在“硬度<2,2≤硬度<3,3≤硬度<4,4≤硬度<5,5≥硬度”五个区间的分布情况如图1所示,整体呈正态分布。分别在5个区间中以2∶1随机划分训练集和预测集,训练集样品用于模型建立,预测集样品用于模型对未知样品的预测评估。

表1 山楂样品的硬度指标分布分析

图1 硬度分布直方图

2.2 原始光谱分析

对获取的山楂果实样品原始光谱进行初步分析发现,800~1 164 nm范围内光谱数据噪声较大,且谱线平滑,有效信息较少,故截取1 165~2 500 nm范围数据进行后续数据分析。截取后的原始光谱曲线如图2所示。光谱数据中存在随机噪声和基线漂移等,需要预处理方法进行去噪处理。

图2 山楂果实原始光谱

2.3 光谱预处理

采集到的光谱数据不仅受到内部仪器暗电流、外部环境光变化、山楂样品尺寸大小和杂散光等不良因素的影响,同时本身还存在冗余性和多重共线性等问题。因此在建模之前需要采用合适的预处理方法对数据进行去噪。采用移动平均平滑(MAS)、标准正态变量变换(SNV)、单位矢量归一化(NOR)、基线校正(BAS)和去趋势(DET)5种不同预处理方法。5种不同预处理后的光谱曲线分别如图3所示。观察图3可以发现,MAS方法可以有效去除谱线中的毛刺,SNV和NOR可以不同程度上降低光谱样品点之间的散射差异,BAS和DET不同程度地校正原始光谱基线漂移的问题[18]。

图3 不同预处理方法后的山楂光谱曲线

2.4 模型建立

分别采用经典线性方法偏最小二乘和非线性方法支持向量机建立不同预处理后光谱数据与山楂果实硬度指标的定量预测模型。建模结果如表2所示。SVM模型整体预测能力优于PLS模型,表明对于山楂硬度数据,SVM方法表现出更好的建模效果。对比不同的预处理方法,MAS、SNV和NOR这3种预处理方法对应的PLS模型优于无预处理的PLS模型,表明3种预处理方法一定程度上去除了部分噪声信息。对于SVM模型,尽管SNV和BAS提高校正集的预测效果,但是对于预测集的预测效果并没有提高,无预处理的原始光谱建模效果最好,RMSEC为0.918,RMSEP为0.895。整体来说,山楂硬度模型的相关系数r≤0.412,模型预测性能有待提高,基于NIR的山楂果实硬度评估方法仍需进一步研究。

表2 山楂硬度不同预处理方法下的PLS和SVM预测模型

3 结论

利用近红外光谱技术研究山楂果实硬度的快速无损检测方法,研究分析山楂样品的硬度分布特征。样品整体硬度取值范围为1.42~5.69 N。其中,硬度在2~5 N范围内的山楂数量最多,<2和5≥的数量较少,整体呈正态分布规律。

对比5种不同光谱预处理方法的去噪效果,MAS方法可有效去除毛刺噪声,SNV和NOR可以降低样品散射引入的光谱差异,BAS和DET用于校正光谱数据的基线漂移。分别采用线性和非线性的经典建模方法,偏最小二乘和支持向量机。模型结果表明,非线性支持向量机方法所建模型整体优于偏最小二乘回归模型。不同建模方法下,不同预处理方法对模型的优化效果不同。MAS、SNV和NOR这3种预处理方法提高PLS模型的预测能力。对于SVM模型,SNV和BAS只提高校正集的预测效果,预测集的预测能力反而有一定减弱。基于原始光谱的SVM模型预测性能最好,RMSEC为0.918,RMSEP为0.895。整体来说,山楂硬度模型的相关系数均≤0.412,预测性能有待进一步提高,基于NIR的山楂果实硬度评估仍需进一步研究。

猜你喜欢

预处理硬度光谱
非水溶剂预处理木质纤维原料研究进展
不同预处理对铁皮石斛热风干燥特性及品质的影响
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
软硬度
手术器械预处理在手术室的应用
污泥预处理-厌氧消化体系的能源经济性评价
郭守敬望远镜获取光谱数破千万
浅析光谱技术在200 nm以上和以下尺度范围内的不同
金属表面镀层硬度的测量方法
生命的硬度