APP下载

多元校正模型传递方法的进展与应用

2019-05-13史云颖李敬岩褚小立

分析化学 2019年4期
关键词:近红外光谱评述

史云颖 李敬岩 褚小立

摘 要 多元校正模型与光谱分析技术结合可完成对物质的快速分析,但仪器、附件更换或温度等外界环境条件改变时,会导致已有的模型“失效”,重建模型需要耗费大量的时间和成本。模型传递技术的出现和发展较好地解决了这一问题,通过校正光谱或选择变量等手段增强模型的适应性及稳健性。对模型的推广使用极为重要。本文综述了近年来新发展的一些模型传递方法及其相关应用,对传统模型传递方法、新方法以及新策略进行介绍,评价了各算法的使用情况及特点。

关键词 多元校正; 模型传递; 仪器标准化; 近红外光谱; 评述

[HK][FQ(32,X,DY-W][CD15]

2018-10-09收稿;2018-12-26接受

本文系国家自然科学基金项目(No. 21365008)和国家重点研发计划项目(No. 2017YFB0306501)资助

* E-mail: chuxl.ripp@sinopec.com

1 引 言

多元校正模型是样品的目标值与其光谱参数之间建立的一种函数关系[1]。通常情况下,通过多元校正模型与近红外光谱(Near infra-red spectroscopy,NIR)结合可以达到定性或定量分析的目的。近年来,该分析技术已被广泛应用于农产品及石油化工等行业。然而,在通常条件下建立的多元校正模型常针对一台仪器。随着仪器的老化、更换或仪器测量条件等改变,会导致之前建立的模型无法使用或预测结果产生较大偏差。解决这类问题的过程称之为模型传递[1]。一般认为量测信号是样品本征信号与外部影响信号的复合[2],不同仪器上的量测信号间差异是由外部影响信号引起的,通过模型传递可以消除外部干扰因素对量测信号的影响。确保原模型能够继续使用,从而减少重建模型所需要的大量人力与财力。

之前已有文献对模型传递方法进行了总结。Fearn[2]从校正对象的角度对模型传递进行分类,并对不同传递方法的适用情况进行了概述。褚小立等[3]从增强模型适应性和提高模型稳健性两个方面对模型传递方法进行了归纳。Feudale等[4]将模型传递定义为狭义的标准化方法,分为模型系数标准化、光谱响应值标准化和预测值标准化三类标准化方法,同时, 将模型更新、全局建模等视为模型传递的一些策略,对各类方法的有效性和适用性进行了评估。近期,张进等[5]从算法的角度进行分类,对近年来出现的一些新算法进行了梳理。本文在已有文献的基础上,对近年出现的一些模型传递新方法、新策略进行了评述,并着重介绍这些方法的应用。

2 模型传递算法与应用

2.1 传统模型传递方法

早期出现的模型传递方法包括直接校正法(Direct standardization,DS)[6]、分段直接校正法(Piecewise direct standardization,PDS)[6]、Shenk's算法[7]、斜率偏差校正法(Slope/bias, SBC)[8]。这些方法也被称为标准化方法,其中DS、PDS和Shenk's算法通过使用标准样本集S对从机光谱Ss进行校正,使得校正后的从机光谱Ss与主机光谱Sm达到最大相似度,进而利用主机模型对其进行性质值预测。SBC算法则是一种目标值校正方法,通过建立主机与从机目标值间的数学关系对未知样本从机目标值进行校正。这些算法出现时间较早,发展和应用较为成熟,在模型传递过程中被广泛应用。

近年来,DS和PDS方法在各领域应用广泛。在果品检测方面,PDS算法被证明可用于消除光照变化对水果NIR糖度分析模型的干扰影响[9]。在电工制造业中,可利用DS和PDS对控制硅片镀铜过程的原位伏安传感器进行温度补偿[10]。在生物能源研究中,已经证实可通过PDS方法将畜禽排泄物厌氧消化过程的在线过程分析NIR光谱转移至实验室仪器进行监控[11]。在高光谱遥感技术中,发现可以使用DS方法降低土壤湿度差异对土壤有机质Vis-NIR模型预测能力的影响[12]。除了对多元定量模型的传递外,PDS和DS方法对于分类判别模型也具有良好的传递能力,Milanez等[13]使用DS、PDS方法实现了荧光光谱和数字成像识别橄榄油掺假判别模型在两台仪器间的传递; 吉纳玉等[14]发现可以利用DS和PDS方法实现同一组分分析模型在不同物种间的传递。

基于目标值校正的SBC算法较为简便,一般适用于校正线性仪器偏差[8]。吉纳玉等[14]发现,通过SBC算法可以实现单一水果可溶性固形物NIR分析模型在相近种类水果间的传递。Shenk's算法是一种单变量校正方法,分别对波长和吸光度进行校正。Qin等[15]比较了SBC、PDS和Shenk's算法对烟草总糖NIR模型在粉末状与非均匀薄片状间的传递效果,结果表明,只有Shenk's算法传递后的预测结果符合要求。

FIR算法[16]是一种无标样模型方法,具有操作简便的特点,但窗口大小对模型传递效果影响较大。宋海燕等[17] 通过对土壤有机质NIR预测模型在不同采集批次间的传递研究发现,当以从机预测值相关系数和预测标准差为依据选择合适的窗口大小时,FIR算法可取得良好的传递效果。

2.2 近年来的新算法

21世纪初期,NIR分析技术在农业、石化、制药行业中的应用得到快速发展[9~14],光谱间的模型传递问题再次成为了制约其发展的主要因素。传统PDS方法容易受到高斯噪声影响、传递非线性光谱差异能力较差等缺陷逐渐显现,一些研究学者开发出一些新方法。本文针对2000年以来开发的模型传递方法及其应用进行概述,按照模型传递方法的基本原理差异将其分为三类。

2.2.1 基于因子分解的方法 主成分分析(Principal component analysis,PCA)是一種多元统计分析技术,其中心思想是将原变量进行转换,使少数几个新变量的线性组合代替原变量[18]。基于PCA的模型转移方法通过提取光谱特征信息,利用光谱特征构造具有低秩特征的投影矩阵,从而达到模型转移的目的。与传统传递方法相比,这类方法具有降低数据维度、减少噪声、降低过拟合现象等特点。目前已成为一类较成熟的传递算法。

王艳斌等[19]在2005年基于PCA技术提出了一种目标因子分析(Calibration transfer based on target factor analysis,TTFA)模型传递方法,该方法为模型传递过程提供了一个新方向。具体操作步骤包含:

(1)对主机的标样光谱进行主成分分析, 得到得分和载荷矩阵:Xm=Tm×PTm;

(2)同样对从机的标样光谱进行主成分分析, 得到载荷和得分矩阵: Xs=Ts×PTs;

(3)建立主机与从机得分阵数学关系:Tm=T×Ts;

通过广义逆运算求解变换阵:T=Tm×TTs×(Ts×TTs)

(4)则任意从机光谱可以表示为: Xs=Xm×Pm×T+×PTs。

分离出传递矩阵F=Pm×T+×PTs, 通过虚拟标样和真实标样的模型传递效果将TTFA与PDS方法作比较。结果表明,TTFA所需样本数较多,但在校正光谱吸光度非线性变化方面更具优势。

典型相关性分析(Canonical correlation analysis,CCA)技术是一种通过在主机和从机传递样本集中进行典型性分析找到规范向量,经过规范向量间的转化完成模型传递的方法[20]。CCA的基本属性决定该方法的使用需要足够的传递样本数,研究结果表明,在传递样本充足的情况下,CCA方法对烟草氮含量[20]、谷物水分[21]、药物有效成分[22]等NIR分析模型在不同型号仪器间的传递效果优于PDS。光谱回归(Spectral regression,SR)是一种将数据映射到低维框架中进行转换的方法,与PCA、CCA等子空间学习方法相比,该技术避免了稠密矩阵特征值分解的过程,大大提高了运算效率。Peng等[23]将SR用于药片和玉米NIR光谱的传递研究,证实了该算法的有效性。

2011年,Du等[24]提出了一种光谱空间模型传递法(Spectral space transformation,SST),通过将主机和从机测得的标准集光谱X1、 X2结合,得到光谱阵Xcomb=[X1,X2],对其进行因子分解:

Xcomb=Us,Un∑s∑nVs,Vn=TsPT1,PT2+E

其中,下标s、n分别表示光谱中的信号与噪声,通过与朗伯比尔定律Xcomb=CsST1,ST2+E进行比较可得: CST1=TsPT1,CST2=TsPT2,从而利用该函数关系对从机测试光谱Xtest进行转换:

xtrans=xtest+xtestPT2+PT1-xtestPT2+PT2

轉换矩阵 F=I+PT2+PT1-PT2,与其它因子分析方法相比,SST算法结构简单,在较低的标准样本数下仍能保持良好的预测结果。吴进枝等[25]通过SST算法将烟叶粉末化学组分的离线NIR预测模型传递为该组分的在线预测模型,实现了烟丝烟碱和总糖质量的在线监测。Liu等[26]在SST的基础上提出交替三线性分解法(Alternating trilinear decomposition,ATLD),将3台仪器上得到的三维数据矩阵分解为样品浓度A、光谱B、仪器效应C矩阵,利用其C矩阵建立不同仪器间的光谱差异关系。对玉米油含量及烟草氮含量NIR模型在3台仪器间的传递结果表明, 该方法的预测准确性与PDS、SST相当,该方法为多仪器间模型传递提供了一种新思路。

2.2.2 基于机器学习的方法 由于传递光谱对象间经常出现吸光度偏差、波长偏移以及谱峰宽度不一致等问题,仪器间可能存在非线性关系。而PDS、CCA等方法本质上仍属于建立仪器间线性相关关系的传递方法[27],对于仪器间非线性差异校正存在传递效果不理想情况。近年来, 随着计算机技术的快速发展,一些机器学习方法被用于解决这一问题。

支持向量机(Support vector machine , SVM)是20 世纪末出现的一种新型模式识别方法, 在解决小样本、非线性的问题上具有优势[14]。赵龙莲等[28]在2008年提出一种移动窗口SVM方法用于模型传递研究(Support vector machine regression,SVR),具体操作步骤如图1所示。与PDS方法类似,该方法在从机i波长点附近取一个窗口,利用SVM建立该窗口吸光度矩阵与主机i波长点处吸光度矩阵间的回归模型,移动主机波长点i及从机对应窗口,求出每个波长点处的传递参数,建立传递矩阵。研究表明, 该方法可成功用于两台仪器间玉米粉末样本的NIR模型传递,传递后的预测误差符合要求。

极限学习机(Extreme learning machine,ELM)是Huang等[29]提出的一种前馈神经网络学习方案,具有学习速度快,易于操作和人为干预少等优点,可以显著降低主机和从机间的系统差异。极限学习机自编码(Extreme learning machine auto-encoder,TEAM)是ELM中的一种特例,用输出层数据代替输入层,选择隐含层中权重与偏差相互正交的节点。Chen等[27]提出将TEAM用于NIR光谱模型传递,用3个公开的NIR光谱数据集比较了TEAM、PDS、CCA的传递效果,证明TEAM在预测结果和稳定性方面均优于上述其它方法。

随机森林是一种噪声容忍度较高且稳定性较好的深度学习算法,孔清清等[30]提出利用随机森林结合博弈论进行特征变量选择,建立稳健性较高的烟叶产地模式识别模型,与SVM和全光谱判别模型相比,该方法对烟叶产地识别成功率最高。

2.2.3 其它方法 杨辉华等[31]认为,不同波长点处的吸光度相对独立,利用在主机与从机相同波长点处建立了一元线性回归函数(Simple linear regression direct standardization,SLRDS)进行模型传递。该方法解决了不同仪器间光谱差异的局部不等性问题,对玉米样本[31]及苹果中可溶性固形物含量的NIR光谱传递[32]结果表明,SLRDS技术在消除仪器间光谱差异、提高模型精度方面均优于PDS、SBC及Shenk' s算法。随后,Galvo等[33]引入判别条件对一元线性回归函数的系数进行约束,通过对汽油辛烷值含量NIR光谱分析模型的传递研究,发现此技术可以显著提高模型预测精度; 同时,指出该方法尤其适用于滤光片等产生隔离波长点类型的仪器,解决了PDS无法传递隔离波长点的问题。

普鲁克分析(Procrustes analysis,PA)是一种分析形状分布的统计方法,通过旋转、平移和缩放对两个形状进行归一化处理。Li等[34]研究表明,可以利用PA进行原油密度、总酸值的MIR定量模型实现不同型号仪器间的传递。

Chen等[35]提出了一种载荷空间标准化(Loading space standardization,LSS)新型模型传递方法,用于消除温度变化对NIR校正模型定量分析结果的影响。史新珍等[36]将LSS用于卷烟生产过程中的在线监控,结果令人满意。

2017年, Folch-Fortuny等[37]从另一个角度出发,将模型传递看作从机光谱的数据遗失问题,利用修剪得分回归(Trimmed scores regression,TSR)和组合Y值偏最小二乘回归(Joint-Y partial least squares regression,JYPLS)作为最大似然估计-主成分分析(Maximum-likelyhood-PCA)重建遗失数据的迭代计算方法。通过对汽油性质的NIR光谱模型传递研究表明,这项技术传递后的预测值远高于PDS,接近于子集重建模型, 同时,该技术也可用于不同分辨率条件下的光谱传递。

3 提升模型传递效果的策略

通过选择合适的预处理方法、稳健的波长段以及代表性更强的标准样本,可以显著提高模型传递方法的能力。当光谱差异较小时,通过这些策略建立的稳健性模型,可以获得优于PDS等模型传递方法的效果。

3.1 基于光谱预处理策略

光谱预处理一般是指利用导数,平滑,多元散射校正(Multiplicative scatter correction,MSC)等方法消除光谱中的散射效应以及仪器偏差等影响,从而达到移除光谱中吸光度差异、提升模型稳健性以及可传递性的目的。

Watari等[38]發现使用MSC预处理后建立的熔融状态下无规聚丙烯和块状聚丙烯中乙烯含量的NIR光谱模型稳健性强,具有温度补偿的作用。Liang等[39]提出使用SG一阶导平滑预处理方法对PDS进行改进。通过对不同仪器以及同一仪器不同分辨率下乙烯-醋酸乙烯共聚物中醋酸乙烯的NIR分析模型进行传递发现, SG一阶导预处理方法优于WT技术。Liu等[40]将利用秸秆热值NIR预测模型比较了SBC、光谱差异法(Difference spectrum)以及局部中心化(Local centering,LC)预处理方法在消除温度和仪器附件干扰方面的效果,证实LC预处理方法对于消除系统化光谱差异的效果最优。

通过将光谱投影到与干扰因素正交的空间中可达到稳健性建模的目的。按照选取干扰因素子空间不同,这些技术包括正交空间回归(Orthogonal regression, OSR)、外部参数正交化(External parameter orthogonalisation, EPO)、正交投影(Transfer by orthogonal projection, TOP)、动态正交投影(Dynamic orthogonal projection, DOP)和正交移除干扰法(Error removal by orthogonal subtraction, EROS)。与DS、PDS方法相比,这些方法将待测量及外部干扰因素信息考虑在内,能够更好地去除光谱信息中干扰因素的影响,可以作为对传统方法进行改进的预处理手段,或作为一种稳健的建模方法。

正交信号校正(OSC)是一种基于目标值矩阵参与的光谱预处理方法,将光谱分解后,仅去除与待测量无关的光谱信息。贾一飞等[41]将DOSC作为SBC方法的预处理手段,用于金银花水提和醇沉制剂过程不同批次间的模型传递,使预测准确度得到提升。Lin等[42]提出利用虚拟标准样本集(Virtual standard samples,VSS)结合OSC方法建立稳健性模型,对药片活性组分NIR分析模型的传递结果表明,VSS-OSC方法传递后的预测准确度优于PDS,且无需标准样本,传递过程更为简便。王安冬等[43]将OSR稳健性建模成功用于不同样本批次间金银花在线水提过程绿原酸含量NIR分析模型传递。

外部参数正交化(EPO)通过将原始光谱投影到主机和从机差异光谱的正交空间中, 去除外部干扰因素的影响。在消除土壤有机碳模型的水份干扰影响[44]及水果糖度模型的温度干扰影响方面均取得有效成果。Preys等[45]将OSC与EPO方法结合,解决了OSC没有考虑外部干扰影响及EPO在外部因素对目标值影响过高时预测性能大幅降低的问题。Nouri等[46]证明TOP算法可用于实验室土壤数据库和机载高光谱土壤图像间的传递。Zeaiter等[47]通过将校正过程嵌入模型对TOP方法进行改进,提出动态正交投影(DOP)多元校正模型维护方法,通过对监控酒精发酵过程的NIR光谱模型证实了DOP在批次及温度干扰影响下对模型的维护效果良好。

Zhu等[48]将光谱重复测量中的可变性结构视为 “干扰空间”,通过PCA识别该空间,将原始光谱投影到与之正交的子空间中建立稳健性模型,提出投影移除误差(EROS)提高模型稳健性的方法。通过对临床研究结肠病变诊断模型的预测准确性证明了该技术的可行性。

随着信号处理技术的发展,小波转换技术(Wavelet transformation,WT)作为一种预处理手段被广泛应用于模型传递过程。WT技术通过将时域谱转化为频域谱,依据信息和噪声组分频率分布不同特点,丢弃无用频谱,保留目标频谱,具有同时进行扣基和滤噪的突出优点。Tan等[49]利用WT将光谱重构,然后使用DS/PDS分别对重构后的低频逼近谱和高频细节谱进行传递,解决了DS/PDS在不同频域内稳健性不一致的问题。Yoon[50]和田高友[51]等将压缩小波系数作为预处理手段分别对DS和PDS算法进行改进,通过对苯含量、军用柴油NIR模型的传递研究表明该技术可减少建模、提高校正的处理速度。Bin等[52]将WT与CCA结合,使CCA方法传递非线性光谱差异的能力得到了进一步提升。Du等[53]使用离散小波变换(Diverse wavelet transform,DWT)作为预处理手段, 在3台仪器间建立烟草中主要化学成分的NIR模型,结果表明,该技术可显著提高模型的转移能力。Wu等[54]通過研究乙醇定量模型证实了DWT技术可作为模型的有效降噪工具。

3.2 优化稳健模型参数

影响模型传递效果的参数通常包括样本代表性以及建模所用的波长范围。通过选择可以覆盖光谱变异范围广的代表性样本,以及受外界因素干扰较小的波长范围,可以提高模型传递方法的能力。

标准样本集的确定对NIR模型的稳健性至关重要,一般认为理想的建模样本应满足:(1)在浓度范围内应覆盖全部未来预测样本; (2)应将未来预测样本的物理和化学性质变化考虑在内, 并在样本空间均匀分布。常见的样本筛选法包括KS(Kennard-Stone)和SPXY(Sample set partitioning based on joint X-Y distance)方法。其中KS方法依据光谱向量欧式距离最远原则选出分散度最高的标准样本集,SPXY在KS的基础上同时考虑光谱和目标值信息选出标准样本集。2016年,Liang等[55]提出Rank方法, 通过样本目标值排列后分割区间, 对传统KS方法进行了改进,利用烟草中糖苷和生物碱含量NIR模型比较了KS-PDS与Rank-KS-PDS的传递效果,结果表明,同等传递效果下, Rank-KS方法可减少所需标准样本数。Sun等[56]将Rank方法与SPXY结合,用于乙醇沉淀测量血清总蛋白含量的NIR模型在不同批次及仪器间的传递研究,结果表明,与Rank-KS相比,Rank-SPXY在提高传递集与验证集的样本相似度方面更具优势。

通过选择稳健性较高、代表性较好的波长点建模,也可提高所建模型的稳健能力。王菊香等[57]利用样品性质信息,选择代表性波长点建模对DS算法进行了改进,对航空煤油NIR分析模型仪器间的传递研究表明,该方法可有效提高转移后的预测结果。张晓羽等[58]在2014年采用竞争自适应重加权采样(Competitive adaptive reweighted sampling,CARS)法选出对测样参数不敏感的稳健波长变量建立模型,对谷物NIR分析模型在不同仪器间的传递表明SCARS方法所建模型的稳健性优于OSC预处理手段。吉纳玉等[59]利用无信息变量消除法联合连续投影算法 (UVE-SPA)选择特征波长,实现了数据的降维,提高了模型的稳定性; 同时证明该方法对仪器间的非线性差异传递效果良好。倪力军等[60]提出对仪器间光谱信号比值进行分析筛选波长,选出仪器间一致性较好且样本间差异较大的光谱特征波长,通过对黄芩样本中黄芩苷含量NIR预测模型研究,表明该方法建立的模型预测效果与 PDS 转移效果相当。

此外,也有一些文献指出可以通过对模型参数或模型转移算法参数进行优化, 以提高模型预测能力。曹玉婷等[61]提出利用光谱间夹角大小(Spectra-angle,SA)作为判定准则来选择PDS传递参数,使模型传递过程不受样品化学参考值影响。Zhang等[62]采用样本误差分布分析(Sampling error profile analysis, SEPA)方法优化PDS参数。在校正模型参数方面,Wang等提出校正不同仪器预测结果的双模型策略[63]以及对从机模型参数校正的线性模型校正(Linear model correction,LMC) [64]法, 用以维护模型。Chen等[65]提出了一种基于自动峰检测\, 洛伦兹拟合和三次多项式拟合结合的自动标准化方法,用于消除不同拉曼光谱仪间光谱漂移。这些方法的发展为无标样稳健模型的建立提供了可能性。

3.3 模型更新

模型更新(Model updating,MU)通过将少量新条件下的样本加入初始模型中,对模型进行修正,避免了重复建模的繁琐过程,达到对模型进行维护的效果。

林兆洲等[66]提出一种利用正交空间样本选择进行模型更新的方法。在经过OSC 校正后的光谱空间内挑选新样本,提高了所选新样本的特异性。通过对不同批次间金银花醇沉过程中绿原酸含量的NIR模型进行传递,证明该方法所选样本代表性优于KS算法。

Haaland等[67]提出了一种预测增强经典二乘(Prediction-augmented classical least-squares,PACLS)结合PLS的模型更新方法,通过将已知或经验性变化嵌入模型,在PACLS部分中利用少量从机测试光谱获得仪器差异, 并将其加入模型,之后重新建模。通过对三组分溶液NIR模型在不同温度下进行传递,证明该方法可以有效消除溶液中温度差异。之后, 该团队[67,68]又分别使用PACLS/PLS、子集重建模型以及PDS对有机样品的氯苯和庚烷NIR模型进行了3台不同仪器间的传递,结果表明PACLS/PLS方法优于子集重建,且与背景校正后的PDS方法相当。对于从机仪器漂移复杂情况下的预测能力更强。

Chen等[69]利用载荷空间标准化(LSS)和奇异值分解等数学手段,直接在从机测试集光谱Xtest和目标组分浓度Ctest之间建立数学关系,提出了一种系统预测误差校正法(Systematic prediction error correction,SPEC), 用于维护不同批次间发酵过程预测模型。 与传统传递方法相比,SPEC无需进行光谱转换操作,只需少量从机标准样本光谱及其浓度,大大简化了模型传递的复杂度。

Kalivas等[70]提出了一种基于吉洪诺夫正则化(Tikhonov Regularization,TR)的模型维护方法,通过引入新条件下的干扰变量(数学矩阵表示为L),将L阵进行加权修正后加入建模阵X,使更新后的模型适应性更强。分别使用TR和APLS(Augmented PLS)对温度和仪器差异进行校正,结果表明, TR与APLS均能提高模型预测效果,但TR法所需参数更少。Khaydukova等[71]分别使用TR系数和DS方法对电位滴定多传感器系统的镧系元素定量分析模型进行了传递,表明使用TR系数传递后模型的预测效果最好。Yan等[72]在此基础上提出了一种基于耦合任务学习(Transfer sample-based coupled task learning,TCTL)的新型算法。通过将TR项合并到目标函数中,减少了所需模型系数,降低了过拟合现象,证明可以对电子鼻烟监控系统的漂移现象进行补偿。

王家俊等[73]提出一种基于扩展光谱的模型更新方法,利用少量标准样本光谱得到主机与从机间的光谱差异,接着通过修正系数将主机建模集样本传递至从机,使用传递后的从机光谱建立分析模型。烟草样本在3台NIR光谱仪间进行总氮含量模型的传递结果表明,经过扩展光谱模型转移后, 光谱间差异减小,一致性得到显著提高,利用转移后的光谱建立的模型可以得到准确的预测结果。

Saranwong等[74]提出了一种补偿相近NIR仪器差异的简易方法(Difference spectrum adjusted,DSA),通过使用少量的标准样本得到主机和从机上各自的平均光谱,接着在从机测试光谱i波长点处加上平均光谱差异值,即可完成主机与从机间的光谱匹配。Hayes等[75]分别使用MU、PDS、DSA对在线短波NIR硅光二极管阵列仪器间进行模型传递研究,通过比较发现,DSA-MU方法与PDS方法转移后的预测能力相当,但考虑到DSA-MU需要的样本数较少,因此更适合用于在线同型号仪器间的模型传递。

4 结 论

随着化学计量学模型在各个学科的快速应用,越来越多的模型传递方法也得到了广泛应用,其中, DS和PDS模型传递方法仍是使用最多的方法。随着计算机技术的发展,机器学习技术由于泛化能力强、稳定性高等优点也被用于模型传递研究。模型更新法则更适合用于过程控制领域。每种模型传递方法都有优点和不足,因此, 在进行模型传递之前,首先需要了解造成模型失效的主要因素,考虑是否可以基于对仪器的评估,通过预处理方法和选择变量等构建稳健模型来实现模型的共享。对于仪器之间差异较小的情况,采取模型更新的方式是较为可靠的方法。如果确实需要进行模型传递,则应尽可能选择简单、可行的传递算法,避免复杂的数学计算过程。

References

1 LU Wan-Zhen. Modern Near infrared Spectroscopy Analytical Technology. Beijing: China Petrochemical Press, 2007: 87

陸婉珍. 现代近红外光谱分析技术(第二版). 北京: 中国石化出版社, 2007: 87

2 Fearn T. J. Near Infrared Spectrosc., 2001,  9(1): 229-244

3 CHU Xiao-Li, YUAN Hong-Fu, LU Wan-Zhen. Spectroscopy Spectral Analysis, 2001, 21(6): 881-885

褚小立, 袁洪福, 陆婉珍. 光谱学与光谱分析, 2001, 21(6): 881-885

4 Feudale R N, Woody N A, Tan H W, Myles A J, Browm S D, Ferré J. Chemometr. Intell. Lab. Syst., 2002, 64(2): 181-192

5 ZHANG Jin, CAI Wen-Sheng, SHAO Xue-Guang. Prog. Chem., 2017, 29(8): 902-910

张 进, 蔡文生, 邵学广. 化学进展, 2017, 29(8): 902-910

6 Wang Y D, Veltkamp D J, Kowalski B R. Anal. Chem., 1991, 63(23): 2750-2756

7 Shenk J S, Westerhaus M O. US 4866644, 1989

8 Osborne B G, Fearn T. J. Food Technol., 1983, 18(4): 453-460

9 ZHANG Wen-Jun, TANG Hong. Hubei Agricultural Sciences, 2017, 56(5): 969-972

张文君, 唐 红. 湖北农业科学, 2017, 56(5): 969-972

10 Jaworski A, Wikiel H, Wikiel K. Electroanalysis, 2016, 29(1): 67-76

11 Krapf L C, Nast D, Gronauer A, Schmidhalter U, Heuwinkel H. Bioresource Technol., 2013, 129(2): 39-50

12 CHEN Yi-Yun, QI Kun, LIU Yao-Lin, HE Jian-Hua, JIANG Qing-Hu. Spectroscopy Spectral Analysis, 2015, 35(6): 1705-1708

陈奕云, 漆 锟, 刘耀林, 何建华, 姜庆虎. 光谱学与光谱分析, 2015, 35(6): 1705-1708

13 Milanez K D T M, Nóbrega T C A, Nascimento D S, Insausti M, Pontes M J C. Microchem. J., 2017, 133: 669-675

14 JI Na-Yu, LI Ming, L Wen-Bo, LIU Ran, ZHANG Yu-Ying, HAN Dong-Hai. Spectroscopy Spectral Analysis, 2017, 37(1): 227-231

吉纳玉, 李 明, 吕文博, 刘 然, 张雨颖, 韩东海. 光谱学与光谱分析, 2017, 37(1): 227-231

15 Qin Y H, Gong H L. Infrared Phys. Technol., 2016, 77: 239-243

16 Blank T B, Sum S T, Brown S D, Monfre S L. Anal. Chem., 1996, 68(17): 2987-2995

17 SONG Hai-Yan, QIN Gang. Spectroscopy Spectral Analysis, 2015, 35(12): 3360-3363

宋海燕, 秦 刚. 光谱学与光谱分析, 2015, 35(12): 3360-3363

18 CHU Xiao-Li. Molecular Spectroscopy Analytical Technology Combined with Chemometrics and its Applications. Beijing: Chemical Industry Press, 2011: 55

褚小立. 化學计量学方法与分子光谱分析技术. 北京: 化学工业出版社, 2011: 55

19 WANG Yan-Bin, YUAN Hong-Fu, LU Wan-Zhen. Spectroscopy Spectral Analysis, 2005, 25(3): 398-401

王艳斌, 袁洪福, 陆婉珍. 光谱学与光谱分析, 2005, 25(3): 398-401

20 Wei F, Liang Y Z, Yuan D L, Wang J J. Anal. Chim. Acta, 2008, 623(1): 22-29

21 YANG Yu, PENG Yan-Kun, LI Yong-Yu, FANG Xiao-Qian, ZHAI Chen, WANG Wen-Xiu, ZHENG Xiao-Chun. Spectroscopy Spectral Analysis, 2018, 38(3): 824-829

杨 宇, 彭彦昆, 李永玉, 房晓倩, 翟 晨, 王文秀, 郑晓春. 光谱学与光谱分析, 2018, 38(3): 824-829

22 HAN Jun, HAO Yuan, FANG Hong-Zhuang. J.Yunnan Nationalities University: Natural Sciences Edition, 2017, 26(5): 365-368

韩 君, 郝 远, 方洪壮. 云南民族大学学报(自然科学版), 2017, 26(5): 365-368

23 Peng J T, Peng S L, Jiang A, Tan J. Spectrochim. Acta A, 2011,  78(4): 1315-1320

24 Du W, Chen Z P, Zhong L J, Wang S X, Yu R Q, Nordon A, Littlejohn D, Holden M. Anal. Chim. Acta, 2011, 690(1): 64-70

25 WU Jin-Zhi, LI Jun, DU Wen, PENG Sheng-Ming, WANG Zhi-Guo. Tobacco Science & Technology, 2017, 50(10): 69-73

吴进芝, 李 军, 杜 文, 彭圣明, 王志国. 烟草科技, 2017, 50(10): 69-73

26 Liu Y, Cai W S, Shao X G. Anal. Chim. Acta, 2014, 836: 18-23

27 Chen W R, Bin J, Lu H M, Zhang Z M, Liang Y Z. Analyst, 2016, 141(6): 1973-1980

28 ZHAO Long-Lian, LI Jun-Hui, ZHANG Wen-Juan, WANG Jian-Cai, ZHANG Lu-Da. Spectroscopy Spectral Analysis, 2008, 28(10): 2299-2303

赵龙莲, 李军会, 张文娟, 王建才, 张录达. 光谱学与光谱分析, 2008, 28(10): 2299-2303

29 Huang G B, Wang D H, Lan Y. Int. J. Machine Learning Cybernetics, 2011, 2(2): 107-122

30 KONG Qing-Qing, DING Xiang-Qian, GONG Hui-Li, LI Zhong-Ren, TANG Xing-Hong, YU Chun-Xia. Journal of Instrumental Analysis, 2017, 36(10): 1203-1207

孔清清, 丁香乾, 宫会丽, 李忠任, 唐兴宏, 于春霞. 分析测试学报, 2017, 36(10): 1203-1207

31 YANG Hui-Hua, ZHANG Xiao-Feng, FAN Yong-Xian, XIE Pu-Mo, CHU Xiao-Li. Chinese J. Anal. Chem., 2014, 42(9): 1229-1234

杨辉华, 张晓凤, 樊永显, 谢谱模, 褚小立. 分析化学, 2014, 42(9): 1229-1234

32 YANG Hao, XIONG Zhi-Xin, CHEN Tong. Chinese Journal of Analysis Laboratory, 2018, 37(2): 163-167

杨 浩, 熊智新, 陈 通. 分析试验室, 2018, 37(2): 163-167

33 Galvo R K, Soares S F, Martins M N, Pimentel M F, Araújo M C U. Anal. Chim. Acta, 2015, 864: 1-8

34 Li J Y, Chu X L, Tian S B. China Petroleum Process. Petrochem. Technol., 2015, 17(1): 1-5

35 Chen Z P, Julian Morris A, Martin E. Anal. Chem.,  2005, 77(5): 1376-1384

36 SHI Xin-Zhen, WANG Zhi-Guo, DU Wen, YI Hao, ZHANG Juan, CHEN Zeng-Ping, YU Ru-Qin. Chinese J. Anal. Chem., 2014, 42(11): 1673-1678

史新珍, 王志国, 杜 文, 易 浩, 张 娟, 陈增萍, 俞汝勤. 分析化学, 2014, 42(11): 1673-1678

37 Folch-Fortuny A, Vitale R, Denoord O E, Ferrer A. J. Chemometrics, 2017, e2874

38 Watari M, Ozaki Y. Appl. Spectrosc., 2004, 58(10): 1210-1218

39 Liang C, Yuan H F, Zhao Z, Song C F, Wang J J. Chemometr. Intell. Lab. Syst., 2016, 153: 51-57

40 Liu X, Huang C J, Han L. Energy Fuels, 2015, 29: 6450-6455

41 JIA Yi-Fei, ZHANG Ying-Ying, XU Bing, WANG An-Dong, ZHAN Xue-Yan. China Journal of Chinese Materia Medica, 2017, 42(12): 2298-2304

贾一飞, 张盈盈, 徐 冰, 王安冬, 詹雪艳. 中国中药杂志, 2017, 42(12): 2298-2304

42 Lin Z, Xu B, Li Y, Shi X Y, Qiao Y J. J. Chemometrics, 2013, 27(11): 406-413

43 WANG An-Dong, WU Zhi-Sheng, JIA Yi-Fei, ZHANG Ying-Ying, ZHAN Xue-Yan, MA Chang-Hua. Spectroscopy Spectral Analysis, 2018, 38(4): 1082-1088

王安冬, 吳志生, 贾一飞, 张盈盈, 詹雪艳, 马长华. 光谱学与光谱分析, 2018, 38(4): 1082-1088

44 Roudier P, Hedley C B, Lobsey C R, Rossel R A V, Leroux C. Geoderma, 2017, 296: 98-107

45 Preys S, Roger J M, Boulet J C. Chemometr. Intell. Lab. Syst., 2008, 91(1): 28-33

46 Nouri M, Gomez C, Gorretta N, Roger J M. Geoderma, 2017, 298: 54-66

47 Zeaiter M, Roger J M, Bellon-Maurel V. Chemometr. Intell. Lab. Syst., 2006, 80(2): 227-235

48 Zhu Y, Fearn T, Samuel D, Dhar A, Hameed O, Bown S G, Lovat L B. J. Chemometrics, 2008, 22(2): 130-134

49 Tan H W, Brown S D. J. Chemometrics, 2001, 15(8): 647-663

50 Yoon J, Lee B, Han C. Chemometr. Intell. Lab. Syst., 2005, 64(1): 1-14

51 TIAN Gao-You, CHU Xiao-Li, YUAN Hong-Fu, LU Wan-Zhen. Chinese J. Anal. Chem., 2006, 34(7): 927-932

田高友, 褚小立, 袁洪福, 陆婉珍. 分析化学, 2006, 34(7): 927-932

52 Bin J, Li X, Fan W, Zhou J H, Wang C W. Analyst, 2017, 142(12): 2229-2238

53 Du W, Ren J X, Zhang W L, Shao X G. Acta Tabacaria Sinica, 2005, 11(5): 9-18

54 Wu X M, Lou P Y, Yang X H. Adv. Mater. Res., 2013, 834-836: 1006-1010

55 Liang C, Yuan H F, Zhao Z, Song C F, Wang J J. Chemometr. Intell. Lab. Syst., 2016, 153: 51-57

56 Sun Z Y, Wang J Y, Nie L, Li L, Cao D W, Fan J J, Wang H Y, Liu R C, Zhang Y R, Zang H C. Chemometr. Intell. Lab. Syst., 2018, 181: 64-71

57 WANG Ju-Xiang, LI Hua, XING Zhi-Na, GUO Heng-Guang. Journal of Instrumental Analysis, 2011, 30(1): 43-47

王菊香, 李 华, 邢志娜, 郭恒光.  分析测试学报, 2011, 30(1): 43-47

58 ZHANG Xiao-Yu, LI Qing-Bo, ZHANG Guang-Jun. Spectroscopy Spectral Analysis, 2014, 34(5): 1429-1433

张晓羽, 李庆波, 张广军. 光谱学与光谱分析, 2014, 34(5): 1429-1433

59 JI Na-Yu, HAN Dong-Hai. Journal of Food Safety & Quality, 2014, 5(3): 712-717

吉纳玉, 韩东海. 食品安全质量检测学报, 2014, 5(3): 712-717

60 NI Li-Jun, XIAO Li-Xia, ZHANG Li-Guo, LUAN Shao-Rong. Journal of Instrumental Analysis, 2018, 37(5): 539-546

倪力军, 肖丽霞, 张立国, 栾绍嵘. 分析测试学报, 2018, 37(5): 539-546

61 CAO Yu-Ting, YUAN Hong-Fu, ZHAO Zhong. Spectroscopy Spectral Analysis, 2018, 38(3): 973-981

曹玉婷, 袁洪福, 赵 众. 光谱学与光谱分析, 2018, 38(3): 973-981

62 Zhang F, Chen W C, Zhang R Q, Ding B Y, Yao H M, Ge J, Ju L, Yang W Y, Du Y P. Chemometr. Intell. Lab. Syst., 2017, 171: 234-240

63 Wang J, Li Z, Wang Y, Liu Y, Cai W S, Shao X G. Spectrosc. Lett., 2016, 49(5): 348-354

64 Liu Y, Cai W S, Shao X G. Spectrochim. Acta A, 2016, 169: 197-201

65 Chen H, Zhang Z M, Miao L, Zhan D J , Zheng Y B, Liu Y, LU F, Liang Y Z. J. Raman Spectrosc., 2015, 46(1): 147-154

66 LIN Zhao-Zhou, XU Bing, SHI Xin-Yuan, QIAO Yan-Jiang. Modernization of Traditional Chinese Medicine and Materia Medica-World Science and Technology, 2012, 14(6): 2178-2182

林兆洲, 徐 冰, 史新元, 乔延江. 世界科学技术-中医药现代化, 2012, 14(6): 2178-2182

67 Haaland D M, Melgaard D K. Appl. Spectrosc., 2001, 55(55): 1-8

68 Wehlburg C M, Haaland D M, Melgaard D K. Appl. Spectrosc., 2002, 56(7): 877-886

69 Chen Z P, Li L M, Yu R Q, Littlejohn D, Nordon A, Morris J, Dann A S, Jeffkins P A, Richardson M D, Stimpson S L. Analyst, 2010, 136(1): 98-106

70 Kalivas J H, Siano G G, Andries E, Goicoechea H C. Appl. Spectrosc., 2009, 63(7): 800-809

71 Khaydukova M, Panchuk V, Kirsanov D, Legin A. Electroanalysis, 2017, 29(9): 1-7

72 Yan K, Zhang D. Sens. Actuators B, 2016, 225: 288-297

73 WANG Jia-Jun, ZHE Wei, LIU Yan, CAI Wen-Sheng, SHAO Xue-Guang. Acta Tabacaria Sinica, 2014, 20(6): 1-5

王家俊, 者 為, 刘 言, 蔡文生, 邵学广. 中国烟草学报, 2014, 20(6): 1-5

74 Saranwong S, Kawano S. J. Near Infrared Spectrosc., 2004, 12(1): 359-365

75 Hayes C, Walsh K, Greensill C. J. Near Infrared Spectrosc., 2016, 24(1): 59-68

猜你喜欢

近红外光谱评述
浅析智力资本的测量评价方法
基于近红外光谱法的藜麦脂肪含量快速检测
农村居民低碳消费行为研究评述
《中小企业促进法》的评析与完善
中美贸易摩擦形成原因的文献综述
利用油水稳定化和支持向量回归增强近红外光谱测定油中水分的方法
基于一元线性回归的近红外光谱模型传递研究