APP下载

近红外结合Si-ELM检测食醋品质指标

2012-12-27姣蔡建荣张海东陈全胜

食品与机械 2012年1期
关键词:食醋可溶性区间

丁 姣蔡建荣张海东陈全胜

(1.江苏大学食品与生物工程学院,江苏 镇江 212013;2.云南农业大学工程技术学院,云南 昆明 650201)

近红外结合Si-ELM检测食醋品质指标

丁 姣1蔡建荣1张海东2陈全胜1

(1.江苏大学食品与生物工程学院,江苏 镇江 212013;2.云南农业大学工程技术学院,云南 昆明 650201)

为了提高近红外光谱技术检测食醋中可溶性无盐固形物含量(SSFSC)的精度和稳定性,提出采用联合区间偏最小二乘(Si-PLS)筛选光谱特征区间,再利用极限学习机(ELM)算法建立非线性回归模型,并对该方法的优越性进行系统比较;试验通过交互验证优化模型相关参数,以预测时的相关系数(Rp)和预测均方根误差(RMSEP)作为模型的评价指标。结果表明,Si-PLS结合ELM算法(Si-ELM)所建模型最佳,预测结果:Rp=0.973 9,RMSEP=1.232 g/100 m L。说明利用近红外光谱技术可以快速准确检测食醋中的SSFSC,Si-ELM的应用可以适当提高该预测模型的精度。

近红外光谱;联合区间偏最小二乘法;极限学习机;食醋;可溶性无盐固形物含量

食醋在中国是一种很受消费者欢迎的传统酸性调味品,在中国具有至少四、五千年的应用历史[1]。其营养价值高,含有丰富的氨基酸、糖类物质和有机酸。GB/T 18187——2000[2]中指出可溶性无盐固形物含量(SSFSC)是评价食醋品质的一个重要指标。SSFSC是指除水、食盐、不溶性物质外的其他物质含量,主要包含蛋白质、肽、糖类、有机酸等物质。SSFSC不达标产品直接侵害了消费者利益,也对产品品牌造成不利影响。因此,SSFSC的快速准确测定对食醋的质量监督检测有着重要意义。

食醋SSFSC的测定一般采用化学滴定法,该方法操作要求高、费时费力,且不能实现实时在线测量。近红外光谱分析技术可充分利用全谱或多波长下的光谱数据进行定性或定量分析,具有样本无需预处理、操作简单、分析成本低、速度快、精度高等优点,易于实现实时在线监测。目前国内外很少有涉及到SSFSC的研究。另外,研究大多采用经典的偏最小二乘法(PLS)来建立预测模型,但该方法在某些特定场合存在一定的局限性[3]。

本试验提出利用联合区间偏最小二乘(synergy interval partial least-squares,Si-PLS)筛选近红外光谱特征区间,然后利用极限学习机(extreme learning machine,ELM)算法建立非线性回归模型,以提高近红外光谱技术检测食醋中SSFSC的精度和稳定性。

1 材料与方法

1.1 试验材料与仪器

1.1.1 试验材料

食醋:东湖陈醋、东湖江南醋、东湖保健醋、水塔陈醋、恒顺香醋、恒顺宴会香醋、恒顺无糖香醋、恒顺凉拌醋、北固山姜汁香醋、老恒和玫瑰醋、老恒和米醋、老恒和蟹醋、宝鼎白醋、宝鼎康乐醋、宝鼎枸杞醋和松盛园玫瑰米醋,镇江市售;

硝酸银、铬酸钾:分析纯,国药化学试剂有限公司。

1.1.2 主要仪器

傅里叶变换近红外光谱仪:AntarisⅡ型,美国Thermo Fisher公司;

电子天平:感量0.1 mg,Sartorius,北京赛多利斯公司;

电热鼓风干燥箱:1010C-3D型,上海实验仪器有限公司。

1.2 方法

1.2.1 样品的选择及预处理 以市面上常见的16个种类和品牌的食醋为样品,各样品生产日期在2010年5月到7月,且同种食醋购买的生产日期均不相同,最大限度地保证了样品的多样性。每种食醋10个样本,共160个样本。根据每个种类校正集与预测集数量比为2∶1的原则,随机选取107个样本作为校正集,剩下的53个样本作为预测集。试验前,将样本编号置于25℃的实验室中48 h,使样本温度与环境温度一致。

1.2.2 光谱采集和参数设定 采用傅里叶变换近红外光谱仪的透射模式。光谱扫描范围:10 000~4 000 cm-1;扫描次数:16次;分辨率:8 cm-1;数据采样间隔3.856 cm-1。每个样品的每条光谱共含有1 557个变量。样品池采用光程5 mm的标准管(仪器标配),可盛装大约1 m L样品,以仪器内置背景为参比。在试验过程中,室内温度和湿度基本保持不变,温度保持在25℃左右。每个样本在不同时间段和不同位置分别采集4次光谱,取这4次采集得到的光谱的平均值作为该样本的原始光谱。

1.2.3 化学测定 可溶性无盐固形物按GB 18187——2000测定。每个样品做3组平行测定,并且3组平行的最大相对误差在3%以内,试验测得的可溶性无盐固形物含量的统计结果见表1。

表1 食醋样本统计描述Table 1 Descriptive statistics for vinegar samples

1.2.4 光谱预处理 从图1(a)中可以看出在波数5 155 cm-1和6 944 cm-1的附近各有一个很明显的吸收峰。这是因为纯水中的O-H伸缩振动的一级倍频区位于6 944 cm-1(波长1 440 nm)附近,它的一个合频区位于5 155 cm-1(波长1 940 nm)附近,在这两个波长附近是水分吸收的敏感区[4]。而且采集近红外光谱时,会受到高频随即噪音、基线漂移、样本不均匀以及光散射等影响,需要对光谱进行预处理。本试验先采用Moving average smoothing平滑,选用平滑点数为7,此时能很好滤除各种因素产生的高频噪音,再选用一阶导数(first derivative,D1)对光谱进行预处理,一阶求导可以有效去除基线漂移和背景的干扰,区分重叠峰,提高分辨率和灵敏度。原始光谱经过平滑+一阶求导后的图像见图1(b)。

图1 食醋样本的原始光谱及平滑+一阶求导预处理之后的光谱Figure 1 Raw spectra and Smooth-D1 preprocessing spectra of vinegar samples

1.2.5 数据处理及分析 数据处理首先采用Si-PLS筛选特征子区间,用交互验证方法确定最优联合区间,以交互验证均方根误差(RMSECV)作为衡量标准来筛选特征区间;然后对筛选的变量进行主成分分析,以主成分因子为模型输入建立ELM模型,用交互验证确定模型的主因子数和隐层节点数,以验证集中的预测均方根误差(RMSEP)和相关系数(Rp)作为指标对模型的性能进行评价。本试验中所有试验数据分析均基于 MATLAB V7.1(Mathworks Co.USA)软件平台。

2 结果与讨论

2.1 特征光谱区间筛选

食醋是一种发酵食品,其成分复杂且含有大量水分,除了水分,食醋中的大量有机成分的含氢基团(如O-H、CH、N-H等)都能在近红外光谱区产生各级倍频和合频吸收,造成一定程度的信息冗余,而且有些光谱区的噪音信息和非相关信息也会对模型的精度和稳定性造成一定的影响,因此需要筛选出与食醋可溶性无盐固形物相关的特征谱区。Si-PLS法的基本原则是将整个光谱区域划分为若干个小区域,距离相等,然后将局部模型精度较高的几个子区间联合起来预测指标。其算法步骤:① 将整个光谱区域划分为多个等宽的子区间;② 结合2个、3个或4个子区间进行偏最小二乘回归,分别建立待测品质在各联合区间的“局部回归模型”;③ 以校正均方根误差RMSECV值为衡量各局部模型精度的标准,最小RMSECV值(即为精度最高)所对应的子区间组合为特征波谱区间组合。为了考察不同数目的子区间划分和不同的子区间组合对模型精度的影响,将预处理后的光谱区域分别划分为10~25个不同数目的子区间,在各相同子区间数目下又分别联合2~4个子区间分别建立可溶性无盐固形物含量的Si-PLS模型。最佳Si-PLS模型根据全局最小的RMSECV来确定。

图2 可溶性无盐固形物含量的最佳Si-PLS模型选择的最佳子区间Figure 2 Optimal spectral region selected by Si-PLS model for SSFSC

试验结果显示,当光谱区间划分为24时获得采纳的主因子数为7,联合第7、第8和第15等3个子区间时,所对应的RMSECV值全局最低,[7,8,15]区间组合试验选取特征光谱区间,它们所对应的光谱范围为5 503.84~5 750.69 cm-1,5 754.54~6 001.39 cm-1和 7 509.45~7 756.29 cm-1,共195个变量(见图2)。在此特征光谱区间内,存在大量与食醋中糖类和氨基酸等有效成分相关的含氢基团倍频或合频吸收,这些有效成分又与食醋的可溶性无盐固形物有关[5,6]。同时,由图2和图1(b)对比看出,Si-PLS筛选出来的区间避开了两个水强吸收峰,有效避免了水分对模型精度和稳定性的干扰。

2.2 模型建立及结果

极限学习机是(ELM)是单隐层前馈神经网络的一种新型学习算法。算法执行过程中只需要设置网络的隐层节点个数,不需要调整网络的权值及隐层单元的偏置,并且产生唯一的最优解[7]。ELM具有很好的全局搜索能力,不需要繁琐的确定参数的过程,所以学习速度快、简单易行。本试验中,以主成分因子作为模型输入,激励函数选择Sigmoidal函数,隐层节点个数初始化为10,以5为周期增加隐层节点数,通过交互验证的手段对ELM的主成分因子数和隐层节点数进行优化。结果表明当主成分数为7、隐层节点为55时建立的ELM模型RMSECV最小。校正集交互验证均方根误差(RMSECV)和相关系数 (Rc)分别为1.098 2 g/100 m L和0.978 9,预测集的预测均方根误差(RMSEP)和相关系数(Rp)分别为1.231 6 g/100 m L和0.9739。图3是校正集和预测集样本的预测值与参考测量值之间的散点图。

图3 校正集和预测集样本的预测值与参考测量值之间的散点图Figure 3 Reference measurement versus NIR prediction in calibration set and prediction set

2.3 模型比较与讨论

在预测模型建立过程中,为了显示Si-ELM模型的优越性,将其预测性能与经典偏最小二乘(PLS)模型、Si-PLS模型和全光谱区域的ELM模型相比较,结果见表2。由表2可知,通过Si-PLS进行光谱区间优选后建立的模型要好于全光谱范围建立的模型;非线性ELM模型的性能要强于线性的PLS模型。分析原因可以归纳如下:

(1)近红外光谱区域存在大量含氢基团倍频与合频吸收,这就造成全光谱区域内存在大量的共线性变量,存在一定程度的信息冗余。食醋中可溶性无盐固形物是包含能溶于水的多糖、氨基酸和矿物质等多种成分的复杂体系。在某些近红外区域(特别是水的强吸收峰区域),食醋的光谱信息与其SSFSC之间缺乏相关性,这就造成一定的噪音信息。在模型建立过程中,这些噪音和冗余信息的介入容易扩大估计方差,降低模型的精度和稳定性[8]。Si-PLS模型通过区间划分的手段,把与可溶性无盐固形物含量相关性较大的几个子区间联合起来,既剔除了全光谱中大量噪音信息或冗余的信息,又保留了大量与SSFSC相关的光谱信息。因此,模型精度有了很大的提高。

(2)食醋中可溶性无盐固形物是复杂体系,其含量(SSFSC)取决于食醋中多种有效成分,例如:多糖、氨基酸和矿物质等。正因为如此,SSFSC与近红外光谱之间的相关性往往倾向于非线性关系。对本试验中近红外光谱与SSFSC之间的非线性关系进行了相应的诊断,试验通过APRP(augmented partial residual plot)法和Runs test结合的方法估算近红外光谱与SSFSC之间的非线性度|z|[9]。结果表明,全光谱范围内,非线性度|z|=4.67,特征区间范围内,非线性度|z|=10.37,均超过其临界值(|z0|=1.96),所以本试验中食醋的近红外光谱与SSFSC之间相关性并非简单的线性关系,而更倾向于非线性关系。ELM是一种非线性方法,所以整体效果要优于线性方法。且ELM具有很好的全局搜索能力,可以克服传统梯度算法(支持向量机等)常有的局部极小、过拟合和学习率选择不合适等问题,并且有更好的泛化能力,所以其模型精度要高于线性模型;再利用Si-PLS对特征区间进行筛选,模型精度得到了进一步的提高。

表2 基于几种不同模型的近红外预测结果的比较Table 2 Comparison of NIR prediction results based on different models

3 结论

本试验尝试利用近红外光谱技术检测食醋中可溶性无盐固形物含量(SSFSC)的可行性,并提出利用联合区间偏最小二乘(Si-PLS)筛选光谱特征区间,然后利用极限学习机(ELM)算法建立非线性回归模型,以提高检测结果的精度。试验结果为食醋可溶性无盐固形物含量快速检测提供理论依据,同时拓宽了Si-PLS和ELM等算法的实际应用范围。

1 刘杨岷,张家骊,王利平,等.食醋风味比较研究[J].食品与机械,2005,21(5):26~27.

2 国家国内贸易局.GB/T 18187——2000酿造食醋[S].北京:中国标准出版社,2000.

3 郭志明,赵杰文,陈全胜,等.特征谱区筛选在近红外光谱检测茶叶游离氨基酸含量中的应用[J].光学精密工程,2009,17(8):1 839~1 844.

4 Ni L J,Zhang L G,Xie J,et al.Pattern recognition of Chinese flue-cured tobaccos by an improved and simplified K-nearest neighbors classification algorithm on near infrared spectra[J].Analytica Chimica Acta.,2009(633):43~50.

5 Cen H Y,He Y.Theory and application of near infrared reflectance spectroscopy in determination of food quality[J].Trends in Food Science & Technology,2007,18(2):72~83.

6 Rambla F J,Garrigues S,De la Guardia M.PLS-NIR determination of total sugar,glucose,fructose and sucrose in aqueous solutions of fruit juices[J].Analytica Chimica Acta.,1997(344):41~53.

7 潘华贤,程国建,蔡磊.极限学习机与支持向量机在储层渗透率预测中的对比研究[J].计算机工程与科学,2010,32(2):131~134.

8 Chen Q S,Jiang P,Zhao J W.Measurement of total flavone content in snow lotus(Saussurea involucrate)using near infrared spectroscopy combined with interval PLS and genetic algorithm[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2010,76(1):50~55.

9 Centner V,De Noord O E,Massar D L.Detection of nonlinearity in multivariate calibration[J].Analytica Chimica Acta.,1998,(376):153~168.

Measurement of quality index in vinegar using near infrared(NIR)combined with Si-ELM

DING Jiao1CAI Jian-rong1ZH ANG Hai-dong2CHEN Quan-sheng1

(1.Food and Biological Engineering,Jiangsu University,Zhenjiang,Jiangsu212013,China;2.Faculty of Engineering and Technology,Yunnan Agricultural University,Kunming,Yunnan650201,China)

To address the performance of NIR predicted model in measurement of soluble salt-free solid content(SSFSC)in vinegar,synergy interval partial least square(Si-PLS)was employed to select efficient spectral regions,and then extreme learning machine(ELM)algorithm was employed to develop the non-linear regression model.The relevant parameters of the model were optimized by cross-validation.The performance of the model was evaluated according to the correlation coefficient(Rp)and root mean square error of prediction(RMSEP)in prediction set.Experimental results showed that the model based on Si-PLS and ELM(i.e.Si-ELM model)was superior to others,and the optimum results were achieved as follows:Rp=0.973 9,RMSEP=1.232 g/100 m L.The work demonstrated that NIR spectroscopy can be applied in rapid measurement of SSFSC in vinegar,and Si-PLS and ELM algorithms has the potentials in increasing the performance of NIR prediction model.

NIR spectroscopy;synergy interval PLS(Si-PLS);extreme learning machine(ELM);vinegar;soluble salt-free solid content(SSFSC)

10.3969/j.issn.1003-5788.2012.01.023

博士后特别资助项目(编号:201003559)

丁姣(1985-),女,江苏大学在读硕士研究生。E-mall:dingjiaonumber2@163.com

陈全胜

2011-11-11

猜你喜欢

食醋可溶性区间
你学会“区间测速”了吗
关于《食品安全国家标准食醋》(GB 2719—2018)的探讨
全球经济将继续处于低速增长区间
鲜地龙可溶性蛋白不同提取方法的比较
食醋与人类生活
催陈食醋工艺技术研究前沿
区间对象族的可镇定性分析
防晕车
可溶性Jagged1对大鼠静脉桥狭窄的抑制作用
可溶性ST2及NT-proBNP在心力衰竭中的变化和临床意义