APP下载

光谱技术在水产品品质检测中的应用研究进展

2021-05-11李鑫星白雪冰杨铭松

光谱学与光谱分析 2021年5期
关键词:水产品预处理光谱

李鑫星,郭 渭,白雪冰,杨铭松

1.中国农业大学信息与电气工程学院食品质量与安全北京实验室,北京 100083 2.山东省烟台市森林资源监测保护服务中心,山东 烟台 264000

引 言

随着我国消费者对于水产品的需求快速增加,水产养殖业和加工业也随之急速发展,目前我国的水产品养殖规模位于世界首位。根据《2018年中国渔业统计年鉴》,2018年全国水产养殖面积约为7 449.03千公顷,水产品总产量达6 457.7万吨。同时水产品进出口总额超300亿美元,进出口总量超过900万吨,产生了巨大的经济效益[1]。鱼虾贝等水产品是重要的白肉来源,白肉肌肉纤维细腻、富含蛋白质、不饱和脂肪酸等多种人体必需元素,同时具有脂肪含量低、胆固醇含量低等特点,为广大消费者所喜爱[2],为国人的饮食结构丰富性提供了重要的保障。

水产品品质检测主要包括新鲜度检测、质量分级、掺假分析、有害物残留等方面[3-5],传统实验室物理化学分析方法难以实现大批量样品的快速、无损检测,并且由于操作相对繁琐而易出现人为误差。近年来在水产检测行业新兴的光谱技术利用样品测得的光谱特性来定性或定量研究物质结构和组成,具有快速、无损、测试重现度好,精度高、成本较低、方法简便等优点[6]。目前,在基于光谱的水产品品质检测技术当中,近红外光谱技术起步早,相对成熟,属于分子振动吸收光谱;高光谱成像技术将物体的光谱信息和图像信息进行了融合,可精确采集每个像素点信息,并对检测结果进行可视化;拉曼光谱是一种散射光谱,可与近红外光谱相互补充以更好地研究分子振动状态[7-9]。

分析了水产品质检测中常用的各类光谱技术的优势以及局限性,综述了国内外光谱检测技术在水产品品质检测应用中的研究进展,及光谱数据预处理和建模的主要方法,最后,分析了水产品光谱检测技术的未来发展趋势。

1 水产品质检测中光谱技术概述

基于光谱分析技术对水产品质进行检测已成为近年来的一个研究热点,光谱技术在水产品新鲜度检测、有害物残留检测、有害微生物含量检测、质量分级、掺假分析等方面具有良好的应用前景[10]。几种常用的光谱技术特点如表1所示。

表1 水产检测中3种常用光谱技术特点Table 1 Characteristics of three common spectral techniques for aquatic products quality inspection

1.1 光谱检测技术的优势

(1)快速。不需要对样品进行繁琐处理即可进行光谱采集,通过建立预测模型能迅速检测水产中化学组分的含量或性质,大大缩短了检测周期。Yu等利用高光谱成像技术结合深度学习算法快速预测冷藏期间太平洋白虾的TVB-N含量,模型计算时间仅为3.9 ms[11]。

(2)无损。光谱检测过程不会对样品本身产生影响,待测样品从外观到内部的物质结构与性质都不发生变化,只需应用相关装置采集光谱信息即可。鉴于这一特性,光谱检测技术可以良好应用于水产品加工流水线及消费者市场。

(3)测试重现度高。样品测得的每个特征波段处光谱特性可以代表相应物质的特性,根据特征波长处的波谱可推算出样品中的物质组分与含量。由于光谱测量过程很少受外界因素的干扰,且仪器操作相对简便不容易出现人为失误,测量结果相对平稳。

(4)成本低。面向大规模检验时,光谱分析不消耗样品和试剂,不论用于定性判别样品性质还是定量检测样品成分都无需雇佣专业人员进行检测[12]。通过多参数耦合建模,可有效同时预测多个指标含量,相对于传统实验室分析方法,显著降低了大量检测费用。

1.2 光谱技术局限性

(1)前期投入较高。模型的可靠性依赖于足够的样品数量,因此光谱分析的实现需提前选取大量代表性样品进行定性或定量检测,这一过程需要雇佣专业的检验员并且检测周期长、成本高[13]。此外,研究人员建模过程相对复杂,精度符合要求的光谱分析仪器价格也相对昂贵,较难普及到大众市场。

(2)模型普适性差且需持续维护。不同光谱方法适用于不同物质检测,且不同检测对象所适用的特征波段不同,难以实现同一方法全覆盖检测。另外,建模后难免会遇到模型对某些样品预测效果差的情况,所以需要不断对模型进行优化、修正和完善。鉴于以上特点,光谱分析技术适合于大规模连续检测却不适用于分散性样品检测。

(3)每种光谱技术都有其局限性和缺点。近红外光谱灵敏度相对较低,谱带较宽波峰易重叠,易受干扰,信噪比较低[14];高光谱每个像素都含有连续的波谱信息,数据量极大,临近波段冗余且间距狭窄导致了数据处理难度增加[15-16];拉曼光谱波峰易重叠,且拉曼散射信号较弱[17]。

2 水产品质光谱检测中的数据解析

利用光谱技术检测水产品品质依赖于数学模型的建立。首先,要将样本集划分为训练集和验证集,建立训练集模型的样本应在组成及性质上与验证集样品基本一致。建立模型之前应先消除与样本无关的信息与噪声,并对光谱进行特征波段的提取。最后,需要对模型的泛化能力进行性能度量并不断改进和优化。本文主要对水产检测中常用的光谱预处理算法及光谱建模方法的研究进展进行讨论和分析。

2.1 光谱数据的预处理

光谱采集过程中常遇到各种噪声影响,主要为环境光噪声,因此光谱数据预处理算法尤为重要。光谱数据预处理可以有效过滤无关信息和干扰因素对光谱或图像的影响进而提高信噪比,从而保证模型预测结果的精度。目前水产品光谱检测技术中的光谱数据预处理方法通常包括:SG平滑算法、导数法、标准正态变换法、多元散射校正法等。4种常见的光谱预处理算法的对比分析如表2所示。

表2 4种常用光谱预处理对比分析Table 2 Comparative analysis of fourcommon pretreatment algorithms of spectroscopy

2.1.1 SG平滑算法

SG平滑算法(Savitzky-golay Smoothing)基于最小二乘原理,是一种通过多次求光谱数据均值来降低误差的多项式平滑算法,又称卷积平滑算法,由Savizkg和Golag于1964年提出。可以过滤高频信号来提高光谱数据的平滑性,提高信噪比[26]。Federico等基于可见光光谱检测吲哚浓度,使用具有10点窗口的Savitzky-Golay平滑算法降低模型误差,更好地确定了虾的品质[27]。陈伟华采集罗非鱼片近红外光谱数据与鱼肉TVB-N含量进行拟合,通过Savitzky-Golay卷积平滑对光谱进行预处理获得了良好的去噪效果[28]。这种方法具有算法简单、运行速度快的优点,随着SG平滑算法窗口尺度选取的改变,滤波的效果也随之发生改变,因而特别适合光谱数据的实时处理分析。

2.1.2 导数

在已经规定的国家和国际层面,以及相关行业的技术标准上,要采取针对性的措施。为达到水利信息化建设的标准要求,进行有效的针对性管理。

导数法(derivative)可以对波谱信号进行提取,消除基线漂移和斜率并提高分辨率,是常用的光谱预处理方法之一[29]。Vongsvivut等基于傅里叶变换的红外光谱测定鱼油中的脂肪酸组成,期间使用9点SG算法计算光谱二阶导数[30]。Dai等使用11点的SG平滑算法计算VIS/NIR高光谱数据一阶和二阶导数,有效降低了提取数据的噪声水平,提高对虾分类的模型精度[31]。为了降低求导造成的噪声影响,通常需要预先对原始光谱进行平滑处理,Savitzky-Golay卷积平滑法是常用的平滑处理方法。另外,若存在复杂干扰或使用了不合适的平滑参数,求导的结果可能无效。

2.1.3 标准正态变换

标准正态变换(standard normal variate transformation,SNV)可以消除光谱数据中的加性效应和乘性效应。在SNV转换中,将每个光谱居中,然后按相应的标准偏差进行缩放,可以减少散射的乘法效应[32]。Nonthawong等利用SNV预处理的近红外高光谱数据建立PLSR模型,用以识别金枪鱼粉中的虾粉[33]。吴浩等建立对冷冻和解冻状态下鱼糜的等级评定模型,使用标准正态变量变换法对近红外光谱进行预处理,有效地消除了样品表面的散射效应[34]。Grassi等使等用SNV对NIR数据进行预处理,用以区分大西洋鳕鱼和黑线鳕的鱼片[35]。进行SNV处理的前提是,光谱之间的变化主要通过整个波长范围内的均匀乘法效应来建模。当不满足该前提条件时,不适当的预处理可能降低信噪比。

2.1.4 多元散射校正

多元散射校正(multiple scattering correction,MSC)定义了一个参照光谱(通常是校准数据的平均光谱),将每个光谱的基线和放大效应校正为参照光谱,MSC的目的与SNV 基本相同,主要是消除固体表面颗粒不均匀导致的散射影响[36-37]。Alamprese等建立了鉴别不同种类鱼片的预测模型,通过MSC算法对NIR数据进行标准化达到降噪的目的[38]。Rahman等利用鱼眼液的紫外线-可见(UV-Vis)光谱预测鱼肉K值,结果显示基于MSC预处理光谱数据为回归模型提供了更好的性能[39]。MSC是常用的多波长光谱建模方法,能有效增强与样品成分含量相关的波谱信息。它和SNV可相互转换,是减少粒径影响的两种替代方法。

2.2 水产品质光谱检测常用数据模型

光谱技术和化学计量学方法以及机器学习方法的结合为水产光谱检测奠定了基础,继而可以建立稳定、可靠的分析模型,模型的好坏决定着预测精度的好坏,实际应用中应当根据任务复杂程度和训练数据量的不同选择合适的建模方法以达到最佳效果。4种常见的建模方法对比分析如表3所示。

表3 4种常用光谱建模方法对比分析Table 3 Comparative analysis of four common modeling methods of Spectroscopy

2.2.1 多元线性回归

多元线性回归(multiple linear regression,MLR)可以拟合单特征和多样本之间的线性相关关系,通常也被称为逆最小二乘法。光谱技术中多元线性回归的原理为:多个光谱特征波长处的吸收谱带深度与样品的某种化学组分性质高度相关,从而可以找出与某种指标显著相关的波段进行多元回归得到多元线性回归模型的参数[40]。Shi等基于高光谱数据最佳波长,建立了MLR校准模型,实验结果表明,高光谱成像技术结合MLR方法可在线快速预测形状不圆的虾的水分含量以及分布[41]。Cheng等利用400~1 000 nm的高光谱波段测量草鱼鱼肉中的大肠杆菌菌落数,研究表明,简化的MLR模型在预测大肠杆菌菌落数方面显示出良好的有效性和鲁棒性,并且可用来转移图像中的每个像素,以对大肠杆菌的空间分布可视化[42]。MLR方法适用于线性关系良好的简单体系,只需知道样品中被测组分的浓度和性质即可建立校正模型,计算过程简单清晰明了,无需考虑交互干扰效应和非线性因果关系,但MLR方法在遇到多重共线性或者噪声较强时往往预测效果不佳。

偏最小二乘回归(partial least squares regression,PLSR)是一种拟合多因变量和多自变量的建模方法,常用于构建光谱数据的线性回归模型,能有效去光谱数据的高度共线性[43-44]。Prieto等基于NIR的偏最小二乘判别分析正确地将100%的纯化鲑鱼片进行分类[45]。Masoum等的研究证明,PLSR结合NIRS技术非常适合于评估鱼粉的蛋白质和水分含量[46]。徐富斌等采集大黄鱼背部的NIR光谱,建立了全波段PLSR模型用以预测挥发性盐基氮含量和菌落总数[47]。Yang等通过近红外光谱技术对纯鱼粉进行偏最小二乘法建模,将掺假样本区别出来[48]。Tito等研究了基于近红外光谱方法检测大西洋鲑需氧菌落数的方法,建立了PLSR预测模型,校准方程拟合良好(R2=0.95)。结果表明,通过进一步的模型开发,可使用NIR来预测海产品保存期限[49]。PLSR方法吸收融合了多元线性回归(MLR)、典型相关分析(CCA)以及主成分分析(PCA)等方法的长处,简化了数据结构,消除了变量间多重共线性。在光谱数据的多元线性回归中,样本量过少且变量间有多重相关性时,宜选用PLSR方法,该方法能有效降低计算量提升模型性能。

2.2.3 最小二乘支持向量机

最小二乘支持向量机(least squares support vector machine,LS-SVM)是SVM的变体,它与SVM一样是基于边际最大化原理的分类器,训练模型只与支持向量相关。它使用核函数解决非线性问题中边界划分[50]。Wu等使用高光谱数据建立LS-SVM模型来预测虾样品的明胶浓度,结果表明,高光谱成像技术能良好应用于对虾明胶掺假检测[51]。章海亮等用高光谱成像技术检测鱼的新鲜度,采用最小二乘支持向量机作为分类模型,验证集准确率达到98%[52]。Jun等利用高光谱成像技术对冷藏草鱼片硬度进行分析,实验结果表明LS-SVM性能优于PLSR[53]。LS-SVM适合于小样本的学习环境,它继承了SVM出色的泛化性能且更容易训练,核函数将光谱数据映射到更高维特征空间,并求得最大化余量的超平面进行分类。超参数(正则化参数和内核参数)的选择会影响LS-SVM的性能。

2.2.4 人工神经网络

人工神经网络 (artificialneural networks,ANN)是一种自学习自适应的非线性建模方法,它由大量相互联系的基本单元组成,处理信息的方式类似于人类大脑,随着硬件设备计算能力的剧增,人工神经网络的优势也越来越明显。其中,误差反向传播神经网络(back Propagation)是人工神经网络的传统代表,它的模型共分输入层、隐层和输出层3层,基于负梯度方向的梯度下降法对误差函数进行训练,通过误差逆向传播调节连接权值和阈值[54]。深度学习是近年来兴起的一种复杂多隐层神经网络模型,可对光谱图像的每一个像素进行标记,通过大量数据训练可有效降低模型过拟合导致的泛化不良[55]。Huang等融合近红外光谱技术和计算机视觉技术预测鱼的TVB-N含量,基于反向传播(BP)人工神经网络建立了非线性预测模型。结果显示,训练集和预测集的识别率分别达到96.67%和93.33%[56]。Wu等利用VIS/NIS光谱结合堆叠式降噪自动编码神经网络(SDAE-NN)算法,建立了预测鲑鱼冷藏时间模型。结果表明,SDAE-NN比PLSR等常规方法具有更好的性能,且无需光谱预处理[57]。Yu等用堆叠式自动编码器(SAE)和逻辑回归(LR)组成的深度学习算法(SAEs-LR)建立了基于高光谱数据用以区分虾新鲜度的模型。其中SAE算法用于高光谱图像特征提取,LR算法用于高光谱图像分类。实验中,大量像素光谱(每只虾800个随机像素光谱)被用作输入大数据集,通过像素光谱训练完成后,将SAEs-LR应用于平均光谱,以区分虾的新鲜度等级。结果表明,SAEs-LR分别在校准集和测试集中对虾的新鲜度准确率达到了96.55%和93.97%[58]。人工神经网络具有大规模并行数据处理能力,但容易遭遇过拟合,可通过正则化来降低泛化误差。其中,近年来兴起的深度学习可以用于处理高维光谱数据量过大所引起的特征选择和建模难度增加,深度学习与高光谱图像技术的结合在水产品质检测中显示出良好应用前景。

3 发展趋势

随着光谱技术在水产品质检测领域的研究推进,其快速、无损、测试重现度好,精度高、成本低等优势正逐渐体现出来。目前光谱技术在水产品质检测应用尚处于研究阶段,实际生产中应用较少,未来的研究关键点主要集中在以下几点:

(1)建立精确、统一、全面、完善的水产品光谱分析模型库,采用更加标准化的技术手段来促进水产品质光谱检测的平台化,真正实现水产品质的在线实时分析。另外,为了便于光谱检测更多应用于消费者市场,应进一步降低设备成本,促进设备一体化和小型化,使光谱检测具有低价、灵活、稳定、精确等优势。

(2)能反应水产品质变化的指标较多,仅选取单一指标对品质进行预测,往往难以反映样品真实品质。因此,可考虑结合多个检测指标,同时增加波段范围,使用多波段组合等方法进行指标相关性分析,从而对水产品质做出更加客观准确的评价。

(3)样品的光谱采集过程容易受到外界环境噪声干扰,从而影响检测结果的准确性。为了应对这种缺陷,应同时从设备层面和算法层面对环境干扰进行屏蔽,并且进一步改进光谱特征波段提取的算法,消除重复性检测结果的随机性,从而推动光谱技术实时在线检测的产业化发展。

猜你喜欢

水产品预处理光谱
基于三维Saab变换的高光谱图像压缩方法
冰岛2020年水产品捕捞量102.1万吨
多数水产品价格小幅下跌
水产品批发市场价格行情
基于预处理MUSIC算法的分布式阵列DOA估计
浅谈PLC在预处理生产线自动化改造中的应用
星载近红外高光谱CO2遥感进展
络合萃取法预处理H酸废水
基于自适应预处理的改进CPF-GMRES算法
苦味酸与牛血清蛋白相互作用的光谱研究