APP下载

基于MCCV-CARS-RF建立红提糖度和酸度的可见-近红外光谱无损检测方法

2018-04-20付丹丹王巧华

食品科学 2018年8期
关键词:糖度方根酸度

许 锋,付丹丹,王巧华*,肖 壮,王 彬

红提是葡萄中一个较受欢迎的品种,也是最具商业价值的品种之一,别名晚红、红地球、红提子,具有果穗大、整齐度好、肉质坚实、香甜可口的优点。

红提品质评价指标有糖度、酸度、糖酸比、芳香物质含量等。其中,糖度是指单位质量红提浆果中所含糖类的总量,又可反映果汁的可溶性固形物含量。糖是葡萄果实中重要的营养物质,也是乙醇发酵的重要基质。其中总糖含量对果实的风味以及其他营养成分有很重要的影响,也是葡萄成熟度的衡量标准和重要指标[1]。酸度常称为可滴定酸含量,是指单位质量红提浆果中所含酸类有机物的总量,酸度是影响葡萄品质的重要指标之一,也是影响葡萄果实风味的重要因素,同时酸类有机物也是发酵的良好基质。红提的糖酸比在不同用途中要求也不尽相同:鲜食用途:高糖度且中酸度的红提相对其他品种风味更浓;加工用途:由于要求有机基质含量越多越好,则高糖且高酸度的红提更适用于酿酒和制作饮料等。所以,研究糖度和酸度共同评价红提品质具有重要意义。

测定葡萄、红提品质的常规方法为破坏性抽样检测,繁琐费时,已远远不能满足生产实际的需求。随着计算机技术的快速发展,以及多元校正技术在化学计量学中的广泛运用,光谱技术得以在多领域的运用得到推广。近年来,国外对葡萄品质检测的相关研究有较多报道[2-10],但是专门研究糖度和酸度的文献较少。在国内也有葡萄品质相关的报道[11-19],在基于光谱技术糖度的检测研究中[20-24],吴桂芳等[24]利用偏最小二乘(partial least squares,PLS)法及神经网络建立的葡萄糖度预测模型检验参数为0.908,预测均方根误差为0.112,模型准确度不够高。郭成等[21]利用随机森林预测结合PLS法建立的糖度预测模型交叉验证决定系数为0.93,有待进一步提高。吕刚等[20]运用可见-近红外光谱技术对4 种葡萄品种探究糖度的预测研究,最终粒子群算法优化的支持向量机模型预测效果最好,预测决定系数为0.87~0.95,误差为0.77%~1.23%。在上述研究中,对糖度的预测模型研究较多,糖度模型准确度需要提高和优化,消除轻微的过拟合现象。红提酸度预测模型的探究鲜见报道。

本实验拟基于可见-近红外光谱技术,探究红提糖度和酸度的快速无损检测技术,进一步提高红提糖度预测模型的性能,得到准确度较高的红提酸度预测模型。本研究对光谱数据进行预处理,结合蒙特卡罗交叉验证(Monte-Carlo cross-validation,MCCV)的奇异样本筛选法和竞争自适应重加权采样(competitive adaptive reweighted sampling,CARS)降维法建立随机森林(random forest,RF)预测模型,为红提品质进行无损分级检测提供技术支持。

1 材料与方法

1.1 材料与试剂

实验所用样品为不同成熟度的新疆红提,在每穗红提的穗节部、穗中部、穗内部和穗尖部分别采剪红提样本,共208 粒。简单地去除表面较大的脏污,并将红提编号装入样本袋备用。

NaOH、酚酞 国药集团化学试剂有限公司;其他试剂均为国产分析纯。

1.2 仪器与设备

USB2000+微型光纤光谱仪(配有镖旗光谱采集软件) 美国Oceanoptics公司;申光WAY(2WAJ)阿贝折射仪 上海仪电物理光学仪器有限公司。

1.3 方法

1.3.1 实验步骤

首先搭建一个能够准确采集单粒葡萄可见-近红外光谱信息的实验平台,采集每个红提样本的光谱数据,然后采用传统理化分析的方法准确测定红提的糖度、酸度值,再用Matlab进行数据预处理与分析,并建立糖度和酸度预测模型。

1.3.2 光谱采集

搭建光谱采集实验平台,如图1所示。其中,暗箱的长宽高分别为66.3、53.0、38.0 cm;接收器距离载物台3.7 cm,光源距离载物台2.9 cm。

图1 光谱采集实验平台Fig. 1 Schematic of spectral acquisition device

安装调试好光谱采集平台,打开光源与光谱仪以及镖旗光谱检测软件,将系统预热30 min。首先,通过调整采集参数,观察光谱曲线的变化,在保证曲线响应迅速的情况下,曲线尽量光滑。最后确定的参数为积分时间50 ms、平均次数30 次、平滑宽度5 nm、波段范围400~1 000 nm。将光源亮度调至最小,通过镖旗软件设置暗电流;再缓慢调大光源,直至计数图谱的最大值稳定在58 000左右(设备能够稳定工作的范围)。将红提样本放至载物台,等待光谱稳定后点击保存按钮,完成可见-近红外光谱数据的采集。

1.3.3 糖度测定

参照NY/T 2637—2014《水果和蔬菜可溶性固形物含量的测定 折射仪法》测定并作适当修改:先将阿贝折射仪校零后并将红提榨汁取上清液,用胶头滴管滴加2~3 滴红提果汁,通过目镜读取糖度数据。

1.3.4 酸度测定

参照GB/T 12456—2008《食品中总酸的测定》方法并作适当修改:用分析天平称取1 g左右红提果汁上清液,溶于50 mL蒸馏水中,加入0.2 mL 1%的酚酞试剂。用0.01 mol/L NaOH标准溶液进行滴定,待溶液变成浅红色,并30 s不褪色。记录所消耗NaOH标准溶液的体积;并按照上述方法做空白滴定实验,记录所消耗NaOH标准溶液的体积。按下式计算酸度:

式中:c为NaOH标准溶液浓度/(mol/L);V为样本滴定时消耗NaOH溶液的体积/mL;V0为空白实验消耗的NaOH溶液体积/mL;K为换算系数(葡萄中主要为酒石酸,K取0.075);m为样品质量/g。

2 结果与分析

2.1 光谱数据预处理

图2 样本原始谱图和S_G预处理后的光谱图Fig. 2 Original and S_G pretreated spectra of samples

光谱有效信息的提取是光谱分析中至关重要的工作,通常光谱信息存在信噪比低、光谱变动、背景复杂及谱峰重叠的问题,这几类问题都会直接导致建模效果不佳。先将光谱数据进行平滑降噪预处理,再进行样本奇异点剔除,最后运用CARS降维算法选取特征波长后运用RF算法建立预测模型。平滑处理是一种能够对数据进行降噪处理的预处理方法,使用SavitZky-Golay卷积平滑法(SavitZky-Golay,S_G)。为清晰地看到图谱效果,随机选取部分样本,如图2所示,预处理后的图谱较为理想。

2.2 MCCV法剔除奇异点

MCCV法是最近提出的一种通过机器产生随机数进行模拟交叉验证,计算模型的PRESS值,按大小排列后计算频次,再根据出现的频次判断样本奇异点。MCCV法相比传统方法有较高的识别奇异点的能力[25]。

首先用PLS确定最佳主成分数;再利用随机数按照4∶1的比例分别建立校正集和预测集进行建模分析,并循环2 500 次;计算每个样本预测残差的均值和方差,并绘制均值-方差图。对糖度和酸度分别进行奇异样本剔除,结果如图3和图4所示,糖度模型剔除1、2、70、71、89号5 个样本。酸度模型剔除1、2、17、50、69号5 个样本。

图3 糖度的均值-方差分布图Fig. 3 Mean value and variance distribution of sugar content

图4 酸度的均值-方差分布图Fig. 4 Mean value and variance distribution of acidity

2.3 CARS降维与RF建模

2.3.1 校正集和验证集的建立结果

CARS算法思想是借鉴了进化论的“适者生存”的理论[26-27]:利用PLS建模方法结合CARS技术,筛选出PLS模型中系数绝对值较大的子集,去掉权重较小的波长点;再结合交叉验证的方法选出模型均方差最小的子集,以达到有效地选取最优建模波长组合。尝试使用CARS提取特征波长,研究设计基于特征波长的发光二极管专用光谱检测装置的可行性。

RF算法是一种统计学习理论,具有很高的预测准确率[28]。建模难度小,不容易出现过拟合现象。近年来RF发展迅速,Maj等[29]在改进稳健RF回归算法的基础上提出了booming算法、Coussement法等,运用RF预测客户流失,并与其他模型比较,RF都表现更好[30-33]。本实验采用RF算法来进行预测模型的建立。校正集和预测集使用Matlab产生随机数的方式,将样本集分成3∶1的两个集合,分别对应为校正集和验证集。

2.3.2 糖度模型的建立

在去除糖度的5 个奇异点后,进行CARS降维,由图5a可知,选取变量数与运行次数之间的关系,符合递减规律[34]。图5b显示的是交叉验证均方根误差(root mean squared error cross validation,RMSECV)的变化趋势,当RMSECV变小时,剔除了无效信息;当RMSECV变大时,剔除了有效信息。由图5c可知,当运行次数为27时(中线位置),得到的RMSECV最小。选取此时对应的波长子集为621、657、670、671、687、735、736、755、756、792、793、798、806、838、839、840、843、844、851、853、856、886、887、897 nm,总共24 个波长点。再进行RF建模分析,校正集相关系数和均方根误差分别是0.955 8和0.315 8;验证集相关系数和均方根误差为0.956 8和0.318 5;从表1可以看出,原始图谱下的RF模型出现严重的过拟合,S_G+MCCV+CARS处理模型有显著的改善。模型预测值和测量值对比如图6所示,可见该RF葡萄糖度预测模型达到运用的要求。

表1 不同处理方法的糖度RF预测模型预测效果Table 1 Sugar content prediction of RF models with different pretreatment methods

图5 CARS工作过程的可视化Fig. 5 Visualization of CARS

图6 糖度模型预测值和测量值对比Fig. 6 Comparison between the predicted and measured values of sugar content

2.3.3 酸度模型的建立

在去除糖度的5 个奇异点后,进行CARS降维,方法同糖度模型,最后选取的波长集合为681、682、192、259、261、296、850、873、876、884、887 nm。再建立RF模型,校正集相关系数和均方根误差分别是0.945 6和0.300 1;验证集相关系数和均方根误差为0.940 5和0.311 2。从表2可以看出,原始图谱的RF模型出现严重的过拟合,S_G+MCCV+CARS处理对酸度预测模型也有显著改善。模型预测值和测量值对比如图7所示,酸度预测模型的预测能力没有糖度预测模型准确,但是该RF葡萄酸度预测模型也可达到运用的要求。

表2 不同处理方法的酸度预测模型预测效果Table 2 Acidity prediction of RF models with different pretreatment methods

图7 酸度模型预测值和测量值对比Fig. 7 Comparison between the predicted and measured values of acidity

3 结 论

运用可见-近红外光谱技术探究快速无损检测红提糖度和酸度的方法。用S_G法、MCCV法和CARS法降维,最终建立RF预测模型效果良好。所得糖度预测模型的校正集相关系数和均方根误差分别为0.955 8和0.315 8;验证集相关系数和均方根误差为0.956 8和0.318 5。酸度预测模型的校正集相关系数和均方根误差分别是0.945 6和0.300 1;验证集相关系数和均方根误差为0.940 5和0.311 2。结果表明,该方法适用于红提糖度和酸度的快速无损检测。可见,在尝试消除过拟合的方法之后,所建模型的校正集相关系数和均方根误差与验证集的较为接近,且都得到了较高的相关系数和较小的均方根误差。说明模型具有较好的稳定性和较高的准确度。另外,由于RF算法的特性,模型还具有较高的运算效率。该糖度和酸度预测模型可以通过Java与Matlab混编的方式开发相应的检测软件,能够实现红提糖度、酸度的快速无损检测。软件具有并行运算快、模型更新容易、易于移植等优点。经过实际检验,每个样本只需要0.01 s左右即可完成糖度和酸度的检测。基于该检测软件,可以开发一种基于特征波长的专用型检测装置,用于检测红提糖度和酸度。基于特征波长的模型输入变量较少,系统计算量少,从而可以降低设备制造成本。本实验所得到的模型本身具备准确度高、运算效率高的优点,再配合软硬件技术的支持,将促进该方法用于生产实践。

参考文献:

[1] 司合芸. 干红葡萄酒关键工艺研究[D]. 无锡: 江南大学, 2006: 4-10.

[2] MUSINGARABWI D M, NIEUWOUDT H H, YOUNG P R, et al. A rapid qualitative and quantitative evaluation of grape berries at various stages of development using Fourier-transform infrared spectroscopy and multivariate data analysis[J]. Food Chemistry, 2016, 49(16): 72-76. DOI:10.1016/j.foodchem.2015.05.080.

[3] NOGALE-SBUENO J, HERNÁNDEZ-HIERRO J M, RODRÍGUEZPULIDO F J, et al. Determination of technological maturity of grapes and total phenolic compounds of grape skins in red and white cultivars during ripening by near infrared hyperspectral image: a preliminary approach[J]. Food Chemistry, 2014, 152: 586-591. DOI:10.1016/j.foodchem.2013.12.030.

[4] RODRÍGUEZ-PULIDO F J, BARBIN D F, SUN D, et al. Grape seed characterization by NIR hyperspectral imaging[J]. Postharvest Biology and Technology, 2013, 76: 74-82. DOI:10.1016/j.postharvbio.2012.09.007.

[5] POREP J U, ERDMANN M E, KÖRZENDÖRFER A, et al. Rapid determination of ergosterol in grape mashes for grape rot indication and further quality assessment by means of an industrial near infrared/visible (NIR/VIS) spectrometer-a feasibility study[J]. Food Control,2014, 43(5): 142-149. DOI:10.1016/j.foodcont.2014.03.008.

[6] PARPINELLO G P, NUNZIATINI G, ROMBOLÀ A D, et al.Relationship between sensory and NIR spectroscopy in consumer preference of table grape (cv Italia)[J]. Postharvest Biology and Technology, 2013, 59: 47-53. DOI:10.1016/j.postharvbio.2013.03.013.

[7] GIOVENZANA V, CIVELLI R, BEGHI R, et al. Testing of a simplified LED based vis/NIR system for rapid ripeness evaluation of white grape (Vitis vinifera L.) for Franciacorta wine[J]. Talanta, 2015,144: 584-591. DOI:10.1016/j.talanta.2015.06.055.

[8] NOGALES-BUENO J, BACA-BOCANEGRA B, RODRIGUEZPULIDO F J, et al. Use of near infrared hyperspectral tools for the screening of extractable polyphenols in red grape skins[J]. Food Chemistry, 2015, 172: 559-564. DOI:10.1016/j.foodchem.2014.09.112.

[9] DIAGO M P, FERNANDEZ-NOVALES J, FERNANDES A M,et al. Use of visible and short-wave near-infrared hyperspectral imaging to fingerprint anthocyanins in intact grape berries[J]. Journal of Agricultural and Food Chemistry, 2016, 64(40): 7658-7666.DOI:10.1021/acs.jafc.6b01999.

[10] LAFONTAINE M, BOCKAJ Z, FREUND M, et al. Non-destructive determination of grape berry sugar concentration using visible/near infrared imaging and possible impact on wine quality[J]. Tm-Technisches Messen, 2015(12): 633-642. DOI:10.1515/teme-2015-0045.

[11] 陈姗姗. 基于高光谱成像技术的酿酒葡萄成熟期酚类物质检测方法研究[D]. 西安: 西北农林科技大学, 2015: 5-7.

[12] 吴迪, 宁纪锋, 刘旭, 等. 基于高光谱成像技术和连续投影算法检测葡萄果皮花色苷含量[J]. 食品科学, 2014, 35(8): 57-61.DOI:10.7506/spkx1002-6630-201408010.

[13] 李敏. 基于机器视觉的红提果粒大小无损检测技术[D]. 武汉: 华中农业大学, 2013: 13-15.

[14] 杨春霞. 基于离子交换-电导检测法对酿酒葡萄中有机酸含量进行分析[J]. 分析测试学报, 2016(9): 1162-1166. DOI:10.3969/j.issn.1004-4957.2016.09.016.

[15] 鲁伟奇. 葡萄成熟度无损检测研究[D]. 杭州: 中国计量学院, 2013:18-20.

[16] 杨杰, 马本学, 王运祥, 等. 葡萄可溶性固形物的高光谱无损检测技术[J]. 江苏农业科学, 2016(6): 401-403. DOI:10.15889/1002-1302.2016.06118.

[17] 杨杰. 葡萄内部品质的高光谱成像检测研究[D]. 石河子: 石河子大学, 2016: 15-17

[18] 袁雷明, 蔡健荣, 孙力, 等. 鲜食葡萄果穗形状颜色的多视角投影成像检测[J]. 现代食品科技, 2016(4): 218-222. DOI:10.13982/j.mfst.1673-9078.2016.4.034.

[19] 陈辰, 鲁晓翔, 张鹏, 等. 红提葡萄VC含量的可见/近红外检测模型[J]. 食品与机械, 2015(5): 70-74. DOI:10.13652/j.issn.1003-5788.2015.05.017.

[20] 吕刚. 基于光谱和多光谱成像技术的葡萄内部品质快速无损检测和仪器研究[D]. 杭州: 浙江工业大学, 2013: 18-20.

[21] 郭成, 马月, 梁梦醒, 等. 基于近红外光谱结合波长优选检测单颗葡萄的SSC含量[J]. 食品与机械, 2016, 32(9): 39-43. DOI:10.13652/j.issn.1003-5788.2016.09.009.

[22] 徐洪宇, 张京芳, 卢春生, 等. 近红外光谱技术在酿酒葡萄品质检测中的应用现状及展望[J]. 中国食品学报, 2012, 12(8): 148-155.DOI:10.16429/j.1009-7848.2012.08.006.

[23] 陈辰, 鲁晓翔, 张鹏, 等. 可见/近红外漫反射光谱检测马奶葡萄表皮色泽[J]. 食品工业科技, 2015, 36(19): 308-311. DOI:10.13386/j.issn1002-0306.2015.19.054.

[24] 吴桂芳, 黄凌霞, 何勇. 葡萄浆果糖度可见/近红外光谱检测的研究[J].光谱学与光谱分析, 2008, 28(9): 2090-2093. DOI:10.3964/j.is sn.1000-0593(2008)09-2090-04.

[25] 李水芳, 单杨, 范伟, 等. 基于MCCV奇异样本筛选和CARS变量选择法对蜂蜜pH值和酸度的近红外光谱检测[J]. 食品科学, 2011,32(8): 182-185.

[26] 张华秀, 李晓宁, 范伟, 等. 近红外光谱结合CARS变量筛选方法用于液态奶中蛋白质与脂肪含量的测定[J]. 分析测试学报, 2010,29(5): 430-434. DOI:10.3969/j.issn.1004-4957.2010.05.002.

[27] 孙通, 许文丽, 林金龙, 等. 可见/近红外漫透射光谱结合CARS变量优选预测脐橙可溶性固形物[J]. 光谱学与光谱分析, 2012, 32(12):3229-3233. DOI:10.3964/j.issn.1000-0593(2012)12-3229-05.

[28] 方匡南, 吴见彬, 朱建平, 等. 随机森林方法研究综述[J]. 统计与信息论坛, 2011(3): 32-38.

[29] MAJ J R, DONALD E B. Improving the robust random forest regression algorithm[D]. Virginia: University of Virginia, 2006.

[30] COUSSEMENT K, VAN DEN POEL D. Churn prediction in subscription services: an application of support vector machines while comparing two parameter-selection techniques[J]. Expert Systems with Applications, 2008, 34(1): 313-327. DOI:10.1016/j.eswa.2006.09.038.

[31] BUREZ J, VAN DEN POEL D. Handling class imbalance in customer churn prediction[J]. Expert Systems with Applications, 2009, 36(3):4626-4636. DOI:10.1016/j.eswa.2008.05.027.

[32] COUSSEMENT K, VAN DEN POEL D. Improving customer attrition prediction by integrating emotions from client/company interaction emails and evaluating multiple classifiers[J]. Expert Systems with Applications, 2009, 36(3): 6127-6134. DOI:10.1016/j.eswa.2008.07.021.

[33] BUCKINX W, VERSTRAETEN G, VAN DEN POEL D. Predicting customer loyalty using the internal transactional database[J]. Expert Systems with Applications, 2007, 32(1): 125-134. DOI:10.1016/j.eswa.2005.11.004.

[34] 陈华舟, 潘涛, 陈洁梅. 多元散射校正与Savitzky-Golay平滑模式的组合优选应用于土壤有机质的近红外光谱分析[J]. 计算机与应用化学, 2011(5): 518-522. DOI:10.3969/j.issn.1001-4160.2011.05.002.

猜你喜欢

糖度方根酸度
糖度高、类型多、瓜味足 “炫彩”系列小西瓜 亩产值3.5万元
柴油酸度和酸值测定结果差异性研究
我们爱把马鲛鱼叫鰆鯃
火焰原子吸收法测定高含量银的最佳酸度条件选择
均方根嵌入式容积粒子PHD 多目标跟踪方法
甜菜块根糖度检测使用重复检测进行质量控制的方法
牛乳新鲜度与牛乳酸度关系的探讨
基于不同物候期苹果树叶片光谱特征预测果实糖度
数学魔术——神奇的速算
数学魔术