APP下载

基于近红外光谱的纯花生油掺伪快速鉴别方法研究

2011-12-06吴静珠刘翠玲孙晓荣

食品科学技术学报 2011年1期
关键词:棕榈油花生油大豆油

吴静珠, 刘翠玲, 李 慧, 孙晓荣

(北京工商大学计算机与信息工程学院,北京 100048)

基于近红外光谱的纯花生油掺伪快速鉴别方法研究

吴静珠, 刘翠玲, 李 慧, 孙晓荣

(北京工商大学计算机与信息工程学院,北京 100048)

针对目前国内缺乏快速鉴别花生油掺伪鉴别技术的现状,提出基于近红外光谱的纯花生油掺伪快速鉴别方法.实验分别配制了掺入大豆油、菜籽油、棕榈油和调和油的4类掺伪花生油样品共40个,纯花生油样品5个,采集样品近红外全谱,通过支持向量机技术建立纯花生油掺伪鉴别模型.结果表明,选取径向基函数为支持向量机核函数,通过网格搜索和k折校验法确定核参数γ为1,惩罚参数c为1 024,建立纯花生油掺伪鉴别模型的识别率和预测率均达到100%,基于近红外光谱的花生油掺伪快速检测技术具有较好的可行性和实用性.

纯花生油;掺伪鉴别;近红外光谱;支持向量机

花生油是我国第三大食用油,以其营养丰富著称,在市场上属于价格较高的食用油之一.目前市场上频频出现不法商贩为谋取暴利,将价格相对较低的油脂如菜籽油、大豆油和棕榈油等掺入花生油进行销售的现象.为了保护消费者权益以及维护市场秩序,在加强对花生油生产和销售监管的同时,研究花生油掺伪快速鉴别方法在目前形式下尤为重要和迫切.

目前国内检测花生油掺伪的方法主要有常规理化检测方法和气相色谱法等.这些方法具有较高的准确度和可靠性,但需借助于昂贵的设备或是严格的实验室条件对样品进行复杂的前处理,且分析速度慢,不能满足市场快速检测的需要.20世纪70年代迅速发展起来的近红外光谱分析技术(Near Infrared Spectroscopy,简称NIR)是利用近红外谱区包含的物质信息,用于有机物质定性和定量分析的一种分析技术[1].该方法具有快速、高效、无污染、无需前处理、无损分析及多组分同时测定等优点.西方国家最早将近红外技术应用于油脂检测,在橄榄油、坚果油及其他植物油的检测中已得到成功应用.我国刘福莉[1]以8种食用油纯油的43个样品为对象,采用近红外透射光谱结合聚类分析法快速鉴别食用油种类,判别模型对预测集样品的准确率达到100%.范璐[2]等人利用气相色谱和傅里叶变换红外吸收光谱,对21种花生油、20种棕榈油及两者的4种调和油进行分析,对花生油和棕榈油做了科学的识别分析.

现有的基于近红外食用油定性鉴别研究主要是针对食用油种类,而对食用油掺伪鉴别的研究甚少.但是目前国内将低价油掺入高价油的现象频频出现,屡禁不止.基于国内实际情况,本文研究基于近红外光谱技术的花生油掺伪快速鉴别方法,探索其作为一种快速无损鉴别食用油掺伪方法的可行性.

1 材料与方法

1.1 样品制备

综合市场上目前出现的在花生油中掺伪的主要是大豆油、菜籽油、棕榈油等植物油,因此购买了如下样品:花生油(超市,鲁花压榨一级,非转基因),大豆油(超市,福临门一级浸出,转基因),菜籽油(超市,洪井源,非转基因),棕榈油(市场),调和油(超市,福临门天然谷物调和油).

分别将大豆油、菜籽油、棕榈油、调和油以一定比例掺入纯花生油.以大豆油为例,掺伪比例如表1.菜籽油、棕榈油、调和油的掺伪比例同大豆油,样品编号分别以hcXX,hzXX,htXX命名.实验共配置掺伪样品40个.纯花生油样品以hsXX编号,共采集5份纯花生油样品.

表1 大豆油掺入花生油的配比Tab.1 Mix proportion of soybean oil and peanut oil

1.2 光谱采集

实验采用德国Bruker公司的VERTEX 70红外光谱仪.采集光谱波数范围:4 000~12 500 cm-1,分辨率:8 cm-1,每个样品重复扫描次数:32次,采样点:1 102.使用液体光纤探头采样,光程:2 mm.

全部样品未经任何化学处理,将光纤探头插入装有样品的小瓶中,逐一扫描样品,每次测量前均用石油醚清洗探头,避免样品间交叉污染.以表1中的样品为例,其近红外谱图如图1.

图1 掺伪(大豆油)花生油样品近红外谱图Fig.1 Near-infrared spectrum of adulteration peanut oil mixed with soybean oil

1.3 支持向量机分类器

基于近红外光谱的快速定性检测技术目前被逐渐应用于质量控制中,但是,样本少以及近红外光谱的高维数给近红外定性识别模型的建立带来很大困难.支持向量机[3](Support Vector Machines,简称SVM)是一种新的通用的机器学习方法,以其小样本下良好的推广能力而被广泛用于各种模式分类问题.

设训练集为{xi,yi},i=1,…,n,xi∈Rn,yi∈{ -1,1},则SVM分类器的一般形式如下所示:

其中,K(xi,x)是核函数,通过在约束条件和0≤ai≤c,i=1,…,n 下最大化下式(2)求得.其中,c为惩罚参数.

2 结果与分析

实验采用MATLAB 7.0和LIBSVM模式识别与回归的软件包(http://www.csie.ntu.edu.tw/~ cjlin/libsvm免费下载)实现SVM的分类算法,目前的最新版本为libsvm-2.91.LIBSVM使用的一般步骤如下.

1)按照LIBSVM软件包所要求的格式准备数据集;

2)对数据进行简单的缩放操作;

3)考虑选用RBF核函数;

4)采用交叉验证选择最佳参数c与r;

5)采用最佳参数e与r对整个训练集进行训练获取支持向量机模型;

6)利用获取的模型进行测试与预测.

本实验采用上述步骤逐步建立基于近红外-支持向量机的花生油掺伪鉴别模型.

2.1 数据的归一化

归一化有助于提高支持向量机的性能,可以避免数值范围较大的属性控制数值范围较小的属性,并且可以避免计算时的数值困难问题.本文采用的归一化的计算公式如下式所示:

其中,xj,max,xj,min是光谱矩阵 x 中第 j列的最大值和最小值,OUTmax,OUTmin是归一化后输出范围设定的最大最小值,xij,zij为归一化前后光谱矩阵.本文设定归一化后光谱矩阵的数值在[-1,1]内,则归一化公式如下式所示.

需要注意对预测集也要进行与训练集相同的归一化,即对预测数据归一化时用的最大最小值是训练数据的最大最小值.本文采用MATAB提供的premnmx函数进行归一化.

2.2 核函数和参数的选择

本文采用RBF径向基函数为支持向量机的核函数,通过网格搜索和k折交叉验证方法搜索最佳惩罚参数c和RBF核参数γ的最佳组合,设定初步搜索范围 c=[2 -10,…,210],γ =[2 -10,…,210].网格搜索过程在Matlab 7.0中编程实现.实验设定参数如下.

纯花生油样品用1标记,各种掺伪样品用-1标记.

测试集样品的选择:纯花生油hs02,hs04,根据掺伪浓度的梯度选择掺大豆油样品 hc02,hc04,hc06,hc08,掺菜籽油,棕榈油,调和油样品也同上类似选择;其他样品为训练集样品.

SVM类型采用C-SVC,交互校验采用K重交叉验证,K=5.

根据上述设定的参数进行最佳参数的网格搜索,结果如图2.图中所示曲线为参数组合log2(c)和log2(γ)下,SVM分类模型的交叉校验预测率的等高线图,等高线上标注的为预测率.选取SVM模型交叉校验预测率为100%时的一组最佳参数c=1 024,γ =1.

图2 SVM模型交叉校验预测率等高线图Fig.2 Contour map of cross validation prediction rate of SVM model

2.3 模型建立与预测

在Matlab 7.0中调用SVM模式识别与回归的软件包 LIBSVM.“svmtrain”和“svmpredict”是软件包中两个重要函数,分别用来实现SVM的训练和预测过程.根据网格搜索得到的最佳参数训练SVM模型,在MATLAB中调用形式:

模型参数为,支持向量数11,rho(即式1中的参数 b)为0.683 9.

采用模型预测训练集和测试集,调用形式为,

这里的训练集或是测试集的光谱数据都是经过归一化后的数据.实验结果如下所示:

实验结果表明,采用近红外光谱-SVM建立花生油掺伪定性鉴别模型的预测效果较好.

2.4 与系统聚类的比较

目前近红外光谱分析中采用聚类分析法快速鉴别食用油种类研究较多,效果也较好[4].本文尝试采用系统聚类法对本实验中掺伪样品集近红外光谱进行鉴别分析,光谱矩阵经标准化预处理后,采用OPUS软件提供的7种不同的聚类方法:singl linkage,average linkage,weighted Av,L inkage,median algorithm,centroid algorithm 和 Ward’s algorithm,聚类结果均不理想.以Ward’s Algorithmn,为例,聚类结果如图3.因此从本实验来看,对于掺伪鉴别,支持向量机较系统聚类法具有更好的性能.

3 小结

本文根据市场上纯花生油主要的掺假类型,配置了4种不同类型的纯花生油掺伪样品,通过支持向量机技术,建立了基于近红外光谱的纯花生油掺伪快速定性鉴别模型,对实验中预测集和测试集的预测率均能达到100%.实验表明基于近红外光谱的纯花生油掺伪快速检测技术具有较好的可行性和实用性.

图3 Ward’s Algorithmn聚类结果图Fig.3 Cluster result based on Ward’s Algorithm

[1]刘福莉,陈华才,姜礼义,等.近红外透射光谱聚类分析快速鉴别食用油种类[J].中国计量学院学报,2008,19(3):278-282.

[2]范璐,吴娜娜,霍权恭,等.气相色谱分析和傅里叶变换红外吸收光谱识别花生油中棕榈油[J].河南工业大学学报:自然科学版,2008(1):12-16.

[3]Cristianini N,Shawe-taylor J.支持向量机导论[M].李国正,王猛,曾华军,译.北京:电子工业出版社,2004:1-176.

[4]吴静珠,刘翠玲,李慧,等.近红外光谱技术在食用油种类鉴别及脂肪酸含量检测中的应用[J].北京工商大学学报:自然科学版,2010(5):56-59.

(责任编辑:王 宽)

Study on Identifying Peanut Oil Adulteration Based on Near Infrared Spectroscopy

WU Jing-zhu, LIU Cui-ling, LI Hui, SUN Xiao-rong
(School of Computer Science and Information Engineering,Beijing Technology and Business University,Beijing 100048,China)

A new method based on near infrared spectroscopy technology was established to detect peanut oil adulteration quickly.Four kinds of adulteration samples of soybean oil,rapeseed oil,palm oil and blend oil and five samples of pure peanut oil were collected for detection.Near Infrared spectrums of the samples were normalized as the input variables to SVM.The kernel function of SVM was RBF.The best combination of penalty parameter c and RBF kernel parameter γ were selected by gird search and K –fold cross validation(c=1 024,γ=1).The recognition ratio and prediction ratio were 100%.The experiments showed that the fast detection technology based on NIR and SVM was practicable for identifying peanut oil adulteration.

peanut oil;adulteration identification;NIR;SVM

TS207.3

A

1671-1513(2011)01-0075-04

2010-12-31

北京市优秀人才培养资助项目(20081D0500300130).

吴静珠,女,副教授,博士,主要从事基于近红外光谱的农产品及食品检测技术方面的研究.

猜你喜欢

棕榈油花生油大豆油
马来西亚一年多来首次提高毛棕榈油出口税
精炼大豆油回色因素及延缓回色工艺的研究
6月棕榈油市场监测分析
7月油棕市场监测分析
EMS诱变对花生油酸、蛋白质含量的影响
大豆油基生物柴油氧化动力学方程研究
低温和高温压榨花生油性质的比较研究
肉豆蔻挥发油抑菌及抗花生油氧化作用研究
实时荧光聚合酶链式反应检测食用大豆油中动物源成分
酶法酰化儿茶素EGCG及其产物在大豆油中的抗氧化性