APP下载

近红外光谱技术结合遗传算法用于苹果醋总酸定量分析

2016-09-26李子文熊雅婷张海红李宗朋王健冯斯雯熊贤平尹建军

食品与发酵工业 2016年1期
关键词:苹果醋总酸波段

李子文,熊雅婷,张海红,李宗朋,王健,冯斯雯,熊贤平,尹建军

1(宁夏大学 农学院食品科学系,宁夏 银川,750021)2(中国食品发酵工业研究院,北京,100015) 3(天地壹号饮料股份有限公司,广东 江门,529000)4(华南理工大学 轻工与食品学院,广东 广州,510640)



近红外光谱技术结合遗传算法用于苹果醋总酸定量分析

李子文1,2,熊雅婷2,张海红1*,李宗朋2,王健2,冯斯雯2,熊贤平3,4,尹建军2

1(宁夏大学农学院食品科学系,宁夏 银川,750021)2(中国食品发酵工业研究院,北京,100015) 3(天地壹号饮料股份有限公司,广东 江门,529000)4(华南理工大学 轻工与食品学院,广东 广州,510640)

利用近红外光谱法对苹果醋中的总酸含量进行定量分析,通过PLS法建立苹果醋总酸定量分析模型,同时采用间隔偏最小二乘法(iPLS)、后向间隔偏最小二乘法(BiPLS)和组合间隔偏最小二乘法(SiPLS)以及遗传偏最小二乘法(GA-PLS)对整个谱区进行光谱特征波段筛选。用决定系数(R2)、校正标准偏差(RMSEC)、预测标准偏差(RMSEP)以及最佳主因子数对模型进行评价,确定最佳建模方法。结果表明:进行特征波段筛选能够对模型起到优化作用,并提高模型运算速度,其中GA-BiPLS及GA-SiPLS优化效果最为明显,在极大减少苹果醋总酸建模变量的同时,模型的R2分别达到0.989和0.986,RMSEP分别为0.042和0.044,有效地提高了模型的稳定性与准确度,表明了遗传算法在果醋品质分析方面的巨大潜力。

苹果醋;近红外光谱技术;定量分析;波段筛选;遗传算法

苹果醋是苹果深加工的一个重要方向,它是以苹果、苹果汁等为原料,经酒精发酵、醋酸发酵酿制而成的一种营养丰富、风味优良的酸性保健调味品。因其用途广泛、功效卓越,已经成为果醋家族中的重要一员[1]。但是,目前果醋市场较为混乱,一些不法商家使用所谓的“三精一水”(香精、糖精、醋精)勾兑来进行果醋生产,严重影响了果醋行业的良性发展,长期饮用还会对消费者的健康造成危害。苹果醋品质与其内部理化指标密切相关,其中总酸含量是衡量苹果醋品质的重要指标之一。目前,国家标准所规定的测量方法为化学滴定法,整个检测过程复杂耗时,且对检测人员的技术水平要求较高,不能满足苹果醋品质快速检测的要求。

近红外光谱分析技术作为一种快速无损的检测技术,具有无需样品前处理,分析效率高,操作简单等优点[2],近年来在食醋果醋安全检测等方面得到了广泛应用:郝勇等[3]采用近红外光谱分析技术对食醋中的总酸和还原糖进行快速定量分析,为食醋品质的检测提供了技术支持。黄晓玮等[4]利用不同偏最小二乘法对食醋中总酸含量进行了快速检测,且比较了各算法对模型建立的影响。王莉等[5]应用最小二乘支持向量机分析方法建立了果醋糖度快速检测模型。以上研究均表明了近红外光谱技术在食醋、果醋品质控制,成分分析中的巨大潜力,但目前对于苹果醋总酸指标的近红外分析研究仍较少,且未对模型进行深入优化。

本文拟对苹果醋中的重要品质指标——总酸进行快速无损分析,采用间隔偏最小二乘法(iPLS)、后向间隔偏最小二乘法(BiPLS)和组合间隔偏最小二乘法(SiPLS),以及遗传偏最小二乘法(GA-PLS)对整个谱区进行光谱波段筛选。比较分析各种光谱波段筛选方法对苹果醋总酸预测模型的影响,降低模型的复杂程度,提高模型精度及运算速度。

1 材料与方法

1.1仪器设备

实验使用QC-leader傅里叶变换近红外光谱仪(北京中安信达科技有限公司)。光谱仪光源为卤钨灯,检测器为温控InGaAs,配有固体测量池及透反射盖。光谱范围为10 000~4 000cm-1,分辨率为8cm-1,扫描次数为32次;利用配套软件NIRWareOperator采集苹果醋样品的近红外光谱信息。

1.2材料

本试验所用苹果醋样品共227个,由广东天地壹号饮料有限公司提供,采用透反射方式扫描采集苹果醋的近红外光谱,标准正态变量变换(SNV)方法对光谱进行预处理。苹果醋总酸值根据GBT12456—2008《食品中总酸的测定》,采用NaOH酸碱滴定法测定。

1.3实验方法

1.3.1校正集与验证集的划分

在剔除掉3个异常点的基础上,随机保留50个苹果醋样本作为独立测试集,以3∶1的比例对剩余174个样本进行样本集和验证集划分。本实验采取Kennard-Stone(K-S)法[6]进行样本集划分。最终选择了校正集样本129个,验证集样本45个。校正集与验证集的总酸值统计如表1所示。

表1 校正集与验证集统计结果

1.3.2光谱变量选择

遗传偏最小二乘法GAPLS[7-8]是以生物进化论为基础,模拟生物界物种竞争选择的进化机制而建立的一种优化方法,以适应度函数为依据,通过对群体中个体施加遗传操作来实现群体的迭代优化。但当变量数较多时,运行GAPLS可能会导致过拟合的风险[9],因此本实验先采用iPLS[9-10]、BiPLS[11]及SiPLS[12]法对全光谱1501个变量进行预选择,再结合GAPLS优化建模变量,最终构建定量预测模型。

1.3.3数据处理与分析

IPLS、BiPLS、SiPLS、GaPLS等程序均在MATLAB环境下运行,偏最小二乘计算应用UnscramblerX10.3光谱分析软件(挪威CAMO公司)实现,模型的精确度与稳定性通过决定系数R2、校正标准偏差RMSEC、预测标准偏差RMSEP来评价,R2越接近1,RMSEP越接近0,RMSEC与RMSEP越接近,表明模型效果越好[13]。

2 结果与讨论

2.1光谱波段优选

2.1.1间隔偏最小二乘波段选择法(intervalPLS,iPLS)

考虑到区间分割数对选择结果及模型的影响,将苹果醋全光谱数据共1 501个波数点等分为k个子区间(k=10~40,间隔5),在每种分割情况下用间隔偏最小二乘法(iPLS)进行处理。当分割数为30时,iPLS所得RMSECV值最小为0.046,处理结果如图1所示。其中,纵坐标代表各波段交叉验证均方差(RMSECV),而虚线则表示全光谱区建模时的RMSECV值[14]。从图1中可以看出第2、3、10和11个区间上的偏最小二乘模型的RMSECV值比全谱模型的RMSECV值小,因此本实验选择位于虚线以下的此四个波段进行建模,所对应的信息区间分别是4 196~4 596、5 800~6 196cm-1。

图1 各区间模型的RMSECV值与全谱模型的RMSECV值比较图Fig.1 Comparison of interval model’s and full spectrum’s RMSECV

2.1.2后向间隔偏最小二乘波段选择法(backwardintervalPLS,BiPLS)

将整条光谱分为k个子区间(k=10~40,间隔5),在每种分割情况下运行BiPLS程序,采用留一法来计算RMSECV值。当分割数为15时,BiPLS所得RMSECV值最小为0.040 7,如表2所示。入选子区间为[2 12 14 13 6],所对应的信息区间分别是4 400~4 796cm-1、6 000~6 396cm-1和8 396~9 596cm-1,BiPLS共选择了500个波长点,占全谱的33.3%。

表2 15个区间数的BiPLS优化结果

2.1.3组合间隔偏最小二乘波段选择法(synergyintervalPLS,BiPLS)

在使用SiPLS法进行波段选择时,不同的子区间数也会对选择结果造成影响,同时相同的子区间数、不同的组合数的选择结果也不尽相同[15]。因此在本实验中,同样将苹果醋光谱分为k个子区间(k=10~40,间隔5),在不同分割数下,分别就不同组合数(1~4)进行计算。

当分割数为15时,入选子区间为[2 11 12 14],所得RMSECV值最小为0.039 7,所对应的信息区间分别是4 400~4 796cm-1、8 000~8 796cm-1和9 200~9 596cm-1,SiPLS共选择了400个波长点,占全谱的26.6%,如图2所示。

图2 Si-PLS所选择的最佳子区间Fig.2 Spectral region selection accomplished by Si-PLS

2.1.4遗传偏最小二乘波段选择法(geneticalgorithmsPLS,GAPLS)

本实验采用GAPLS分别对iPLS、BiPLS以及SiPLS删选出的波数变量进行进一步筛选。

GAPLS运行参数设置为:种群数30,变异概率Pm=0.01,交叉概率Pc=0.5,最大因子数10,遗传迭代次数100次,计算每个数据点标识为“1”的概率,以RMSECV值确定出最佳的建模变量。

图3-a、图3-b与图3-c分别显示了GA-iPLS、GA-BiPLS与GA-SiPLS运算过程中各变量被选用的频次,分别共选择了68、126及123个波长点,占

全谱的4.5%、8.3%及8.2%。

a-GA-iPLS; b-GA-BiPLS; c-GA-SiPLS图3 各变量被选用的频次图Fig.3 The frequency of each variable by chosen

2.2模型建立与评价

在上述各变量筛选方法的基础上,分别建立苹果醋总酸指标的全光谱-PLS,iPLS-PLS,BiPLS-PLS,SiPLS-PLS,GA-iPLS,GA-BiPLS以及GA-SiPLS定量模型,并通过计算得出最佳主因子数,同时对决定系数R2、校正标准偏差RMSEC和预测标准偏差RMSEP进行比较,以此来评价模型效果,模型计算结果如表3所示。

表3 苹果醋总酸的不同PLS模型及性能评价结果

从表3可以看出,与全光谱相比,经光谱波段选择之后,变量数显著减少, R2相对增大,而RMSEP值明显减小,主成分数有不同程度的减少,模型运算速度均有不同程度的提高,说明波段筛选能够有效地优化模型。

GA-BiPLS与GA-SiPLS是在BiPLS及SiPLS的基础上进一步对变量进行筛选,避免了BiPLS及SiPLS在2个相邻波段或是一个小的区间中存在的共线变量[18],使R2进一步提高到0.989和0.986,同时RMSEP也分别减小到0.042和0.044。在保证了模型预测精度的同时,将变量数极大减少,同时有效保留了关键特征波长,降低了模型的复杂程度,加快了运算速度。而GA-iPLS是在iPLS法预选出的波段上进行优选,虽然减少了建模变量数,但RMSEC与RMSEP值并无十分明显的变化。可能是由于iPLS法只能分别在1个子区间内建模的局限性,致使其他区间有效信息的遗失限制了模型效果的提高。对于苹果醋样本而言,相对于其余波段优化方法所建模型,GA-BiPLS与GA-SiPLS模型获得了更好的效果。

2.3模型验证

将50个未参与建模的样品光谱分别带入经GA-BiPLS和GA-SiPLS优化的模型中进行验证,由图4可以看到,各个理化指标的实测值与预测值点呈对角线分布,且经成对t检验,各项指标预测值与实测值无明显差异(P>0.90)。经验证,GA-BiPLS验证模型R2为0.971,RMSEP为0.044;GA-SiPLS验证模型R2为0.965,RMSEP为0.047;说明模型预测结果较为准确。

a-GA-BiPLS; b-GA-SiPLS图4 苹果醋总酸GA-BiPLS和GA-SiPLS模型理化值与预测值分布Fig.4 Predicted vs. reference values of total acid in apple cider vinegar by GA-BiPLS and GA-SiPLS model

3 结论与讨论

4种波段优化方法所建模型均获得了较高的模型精度,不仅充分说明了近红外光谱技术可用于苹果醋总酸定量分析,也证明了优化波段对建模分析的重要性。

比较4种波段优化方法,BiPLS和SiPLS模型效果优于iPLS模型,同时2种方法所选择的波长范围部分重叠,反映出了这2种方法波段优选的一致性及苹果醋总酸的特征吸收。而GA-BiPLS和GA-SiPLS模型的稳定性及准确性均高于其余3种方法所建模型,同时所用变量最少,实现了波长选择的目标,表明了遗传算法在果醋品质分析方面的巨大潜力。遗传算法结合BiPLS及SiPLS方法所建立的苹果醋总酸定量分析模型,具有快速、稳定、准确的特点,可实现对苹果醋总酸含量的快速无损检测。

[1]许超群,王亚利,黄从军,等. 苹果醋的开发与研究综述[J]. 中国调味品,2011,36(2):7-10.

[2]孙炳新,匡立学,徐方旭,等. 苹果脆度的近红外无损检测[J]. 食品与发酵工业,2013,41(5):185-189.

[3]郝勇,余永建,朱胜虎. 食醋总酸和还原糖含量近红外光谱检测模型的优化研究[J]. 西北农林科技大学学报(自然科学版),2013,41(5):94-98,107.

[4]黄晓玮,王开亮,石吉勇,等. 近红外光谱结合不同偏最小二乘法无损检测食醋中总酸含量[J]. 中国调味品,2011,36(1):107-110,113.

[5]王莉,李增芳,何勇,等. 应用近红外光谱技术快速检测果醋糖度[J]. 光谱学与光谱分析,2008,28(8):1 810-1 813.

[6]陆婉珍.现代近红外光谱分析技术[M].北京:中国石化出版社,2007:59-90.

[7]褚小立,袁洪福,王艳斌,等. 遗传算法用于偏最小二乘方法建模中的变量筛选[J]. 分析化学,2001,29(4):437-442.

[8]屠振华,籍保平,孟超英,等. 基于遗传算法和间隔偏最小二乘的苹果硬度特征波长分析研究[J]. 光谱学与光谱分析,2009,29(10):2 760-2 764.

[9]NØRGAARDL,SAUDLANDA,WAGNERJ,etal.Intervalpartialleastsquaresregression(iPLS):acomparativechemometricstudywithanexamplefromnear-infraredspectroscopy[J].AppliedSpectroscopy,2000,54(3):413-419.

[10]CHENQuan-sheng,JIANGPei,ZHAOJie-wen.Measurementoftotalflavonecontentinsnowlotus(Saussureainvolucrate)usingnearinfraredspectroscopycombinedwithintervalPLSandgeneticalgorithm.[J].SpectrochimicaActaPartA:MolecularandBiomolecularSpectroscopy,2010,76(1):50-55.

[11]邹小波,赵杰文,黄星奕. 用向前和向后间隔偏最小二乘法建立苹果糖度近红外光谱模型[A]. 中国机械工程学会.2006年中国机械工程学会年会暨中国工程院机械与运载工程学部首届年会论文集[C].中国机械工程学会,2006:6.

[12]彭海根,彭云发,詹映,等. 近红外光谱技术结合联合区间间隔偏最小二乘法对南疆红枣糖度的测定[J]. 食品科技,2014,39(6):276-280.

[13]HEKai-xun,CHENGHui,DUWen-li,etal.OnlineupdatingofNIRmodelanditsindustrialapplicationviaadaptivewavelengthselectionandlocalregressionstrategy[J].ChemometricsandIntelligentLaboratorySystems,2014,134(15):79-88.

[14]吕强,何绍兰,刘斌,等. 班菲尔脐橙可溶性固形物近红外光谱特征谱区选择![J]. 农业机械学报,2012,43(增刊):211-214.

[15]王加华,王军,王一方,等. 基于近红外光谱技术的腐竹脂肪定量分析[J]. 食品科学,2014,35(18):136-140.

[16]蔡健荣,汤明杰,吕强,等. 基于siPLS的猕猴桃糖度近红外光谱检测[J]. 食品科学,2009,30(4):250-253.

[17]JERRYWorkman,JRLOISWEYER. 近红外光谱解析实用指南[M].褚小立,许育鹏,田高友,译.北京:化学工业出版社,2009.

[18]彭云发,詹映,彭海根,等. 用遗传算法提取南疆红枣总糖的近红外光谱特征波长[J]. 食品工业科技,2015,36(3):303-307.

Determinationoftotalacidcontentinapplecidervinegarbynearinfraredspectroscopycombinedwithgeneticalgorithm

LIZi-wen1,2,XIONGYa-ting2,ZHANGhai-hong1*,LIZong-peng2,WANGJian2,FENGSi-wen2,XIONGXian-ping3,4,YINJian-jun2

1(CollegeofAgriculture,NingxiaUniversity,Yinchuan750021,China) 2(ChinaNationalResearchInstituteofFood&FermentationIndustries,Beijing100015,China) 3(TianDiNo.1BeverageCo.Ltd.,Jiangmen529000,China) 4(CollegeofLightIndustryandFood,SouthChinaUniversityofTechnology,Guangzhou510640,China)

Thetotalacidofapplecidervinegarwasanalyzedquantitativelybynearinfraredspectroscopytechnology,andthequantitativeanalysismodelwasestablishedbypartialleastsquares(PLS).ThecharacteristicwavebandswereselectedfromthewholespectrumareausingiPLS,BiPLS,SiPLSandGA-PLS;themodelswereevaluatedusingR2,RMESC,RMSEPandtheoptimalnumberofmainfactorsindeterminingthebestmodelingmethod.Theresultsshowedthatthecharacteristicwavebandselectionwasvitaltomodeloptimization,andimprovedthemodeloperatingspeed.TheoptimizationeffectofGA-BiPLSandGA-SiPLSwasthemostsignificant.Whilegreatlyreducingthevariables, R2ofGA-BiPLSandGA-SiPLSmodelswere0.989, 0.986respectively,andtheirRMSEPwere0.042, 0.044separately.Thetwomethodseffectivelyimprovedthestabilityandaccuracyofthemodelandrevealedthehugepotentialofthegeneticalgorithminfruitvinegarqualityanalysis.

applecidervinegar;nearinfraredspectroscopy;quantitativeanalysis;bandselection;geneticalgorithm

10.13995/j.cnki.11-1802/ts.201601036

硕士研究生(张海红教授为通讯作者,E-mail:nxdwjyxx@126.com)。

2015-07-08,改回日期:2015-08-31

猜你喜欢

苹果醋总酸波段
全发酵型苹果醋加工工艺及其调配研究
初探影响液态法米酒总酸总酯的因素
食品中总酸的测定方法确认报告
百色当地产圣女果主要营养成分的测定
每天一杯苹果醋有益健康
滴定法测定食醋中总酸含量及其不确定度评定
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性
L波段雷达磁控管的使用与维护
高招