APP下载

基于SVM对不同品牌阿胶的聚类分析

2017-04-20刘晓倩魏纪平王俊全梁静芬

食品研究与开发 2017年7期
关键词:阿胶预处理红外

刘晓倩,魏纪平,王俊全,梁静芬

(1.天津天狮学院,天津301700;2.天津现代职业技术学院,天津300350)

基于SVM对不同品牌阿胶的聚类分析

刘晓倩1,魏纪平2,王俊全1,梁静芬1

(1.天津天狮学院,天津301700;2.天津现代职业技术学院,天津300350)

提出利用支持向量机(SVM)对不同品牌阿胶进行鉴别,首先对不同品牌阿胶的红外光谱图进行分析,同时系统分析了阿胶谱图的预处理过程,建立3种品牌阿胶的鉴别模型。并对4种不同的聚类分析算法(KNN、Bayes、LDF和SVM)进行方法比对。试验表明,不同品牌的阿胶聚类模型以SVM的识别率和拒绝率最高。试验结果表明该方法能快速对不同品牌阿胶进行鉴别。

傅里叶变换红外光谱;支持向量机;阿胶;鉴别

红外光谱技术是一种高效快速的现代分析技术,它综合运用了计算机技术、光谱技术和化学计量学等多个学科的最新研究成果[1],具有极强的指纹特征性,物质在结构或含量上的变化都会在其红外光谱上表现出来[2]。因此,可以根据红外光谱上的差异对不同的样本进行整体鉴别,与传统方法相比,该方法具有快速、样品预处理简单、多组分同时测定、环保、无污染等优点[3]。

阿胶历来被誉为“补血圣药”、“滋补国宝”,与人参、鹿茸一起被誉为“中药三宝”[4-5]。鉴于当今阿胶市场出现的产品质量良莠不齐的局面,各种鉴别方法因运而生。传统的采用外观性状和理化性质、旋光性检测,SDS-聚丙稀酰胺凝胶电泳(SDS-PAGE)、高效液相色谱法和PCR等方法[1]对阿胶进行真伪鉴别[6-7],但是这些方法样品处理繁琐费时,很难实现对阿胶快速鉴别。

本文利用聚类分析算法使红外光谱和计算机技术相结合,克服现有阿胶检测方法的局限性,尤其使红外光谱技术同化学计量学等方法建立数据处理模型[8-11],实现对阿胶产品进行快速鉴别。

1 材料与方法

1.1 材料

1.1.1 试剂

从市场上购买OTC认证的品牌A阿胶(18个)、品牌B阿胶(15个)、品牌C阿胶(16个)不同批次的产品;KBr:美国PerkinElmer。

1.1.2 仪器设备

拓普FTIR920傅里叶变换红外光谱仪:天津市拓普仪器有限公司,分辨率为1.0 cm-1,扫描次数累加16次,环境温为15℃~28℃,环境湿度为低于65%。

1.2 方法

1.2.1 试验流程

红外光谱:采用红外光谱压片法对样品进行碾磨、压片处理。本试验以福牌阿胶来测试仪器的稳定性,同条件下制得多组样品而后扫描得到谱图。确定仪器稳定后,对其它阿胶样品进行测试得到谱图。

1.2.2 聚类分析流程

中红外谱图必须经过基线校正、标准归一化、消除噪声和去除异常样本等预处理过程。把预处理过后的80%红外谱图经聚类建模。把剩余20%红外谱图输入模型,对所建分类模型进行测试。

2 结果与讨论

2.1 阿胶红外吸收峰的指认

对阿胶红外谱图的指认是利用红外光谱对阿胶鉴别的基础,3种阿胶红外谱图见图1,阿胶红外光谱吸收峰的指认见表1。

图1 3种品牌阿胶红外谱图Fig.1 Threebrandsof Ejiao of IR spectra

表1 阿胶红外光谱吸收峰的指认Table1 Identification of IR absortion peaksof Ejiao

根据表1可以看出,阿胶红外光谱在1 655 cm-1和1 538 cm-1为吸收强的蛋白的酰胺I和II带的特征峰,这和阿胶主要来源与驴皮的胶原蛋白有关,也是阿胶中蛋白和多肽的总的红外吸收。而1 742 cm-1的红外吸收则和驴皮中脂肪酯键的C=O吸收相关,这说明阿胶在加工过程中脂肪没去除干净。另外1 054 cm-1的红外特征峰为蔗糖的C-O伸缩振动峰,蔗糖为阿胶加工过程中主要的辅料之一,因此在红外谱图上可以看到糖的红外吸收。

从一维红外特征峰提供的物质信息相对较少,其指纹峰主要反映阿胶的一些质量信息。为了从红外整体信息角度分析阿胶,本文利用SVM算法,对3种品牌阿胶进行聚类建模,以期达到对不同品牌阿胶的快速鉴别。

2.2 基于SVM的不同品牌阿胶的鉴别

2.2.1 阿胶红外谱图预处理

本文搜集了OTC认证的品牌A阿胶(18个)、品牌B阿胶(15个)、品牌C阿胶(16个)不同批次的产品作为训练集进行聚类建模,模型验证采用交叉验证。

为了使阿胶的鉴别模型更加稳定,首先对所采集的阿胶红外谱图进行预处理,包括:基线校正、消除噪声、标准归一化和剔除异常样本点。谱图预处理主要是消除仪器在采集谱图时所产生的各种误差,首先红外光源的波动,压片造成的红外光的散射,检测器产生的误差,会使谱图产生基线漂移,并使谱图形成噪声,另外压片厚度不均,通过标准归一化可获得一致性高的谱图。以此通过预处理后的谱图分别为处理前后的比较(见图2)。

图2 红外图谱预处理Fig.2 IR spectra pretreatment

而剔除异常样本点是保持模型稳定的又一保证,利用PCA算法通过对红外谱图降维,取前5个主成分,然后计算其马氏距离,并求总马氏距离的均值,各个谱图的马氏距离大于均值1.5倍为异常样本点。图3显示所去除的异常样本点。

图3 PCA算法剔除异常样本点Fig.3 Theabnormalsam ple pointselim inated by PCA algorithm

2.2.2 基于SVM的不同品牌阿胶聚类分析

不同品牌的阿胶由于原料、工艺控制水平的不同,产品质量不同。3个不同品牌的阿胶红外谱图进行预处理后,利用SVM算法进行聚类分析。同时,比较3种KNN、Bayes和LDF的聚类结果,从3个不同品牌的聚类分析的识别率和拒绝率来看,SVM的结果最佳。表2显示了4种算法(利用matlab进行计算)的聚类分析结果。这主要是因为,SVM非常适合小样本样品问题,而且红外光谱为非线性问题,算法通过提高谱图的维数解决非线性问题,并能得到全局的最优解。因此,利用SVM能快速鉴别不同品牌阿胶。

表2 不同聚类算法聚类分析比较Table2 Comparison of clustering analysisbased on different clustering algorithms

3 结论

运用红外光谱结合聚类分析对不同品牌的阿胶进行了全面的研究,建立了3种品牌阿胶的鉴别模型。并对4种不同的聚类分析算法(KNN、Bayes、LDF和SVM)进行了方法比对。试验表明,不同品牌的阿胶聚类模型以SVM的识别率和拒绝率最高。通过对3种品牌阿胶建模分析,可以得出结论,利用聚类分析对红外光谱是解决阿胶快速鉴别的有效方法。

[1]胡钢亮.近红外光谱技术在中药领域中的应用研究[D].杭州:浙江大学,2003:5-6

[2]沈漪,潘颖,刘全,等.近红外漫反射光谱法对阿莫西林胶囊的定性及定量分析[J].药物分析杂志,2005,25(4):385-389

[3]刘晓宣.近红外光谱定性定量技术在中药质量控制中的应用研究[D].杭州:浙江大学,2004:10-12

[4]张喆,胡晶红,李佳,等.阿胶基本属性管见[J].中成药,2014,36 (9):2000-2001

[5]郭中坤,王可洲,籍国霞,等.阿胶的成分,鉴别方法及药理作用研究进展[J].辽宁中医药大学学报,2015,17(4):71-74

[6]李峰,韩家珩.阿胶的凝胶电泳鉴别[J].时珍国医国药,1999,10 (5):346-347

[7]屈凌波,刘浩,相秉仁,等.BP型神经网络对阿胶的模式识别及容错分析[J].计算机与应用化学,2002,19(4):411-414

[8]Y Lecun,L Bottou,Y Bengio,et al.Gradient-Based learning applied to document recognition[J].Proceedingsof the IEEE,1998,86 (11):2278-2324

[9]Cortes C,Vapnik V.Support-vector networks[J].Machine learning, 1995,20(3):273-297

[10]O Ivanciuc.Applications of support vectormachines in chemistry [J].In:Reviews in ComputationalChemistry,2007,23:291-400

[11]Wise BM,Gallagher N B.The process chemometrics approach to chemicalprocess fault detection and supervision[J].Journal of ProcessControl,1996,6(6):329-348

Clustering Analysis of Different Brands of Ejiao Based on SVM

LIUXiao-qian1,WEIJi-ping2,WANG Jun-quan1,LIANG Jing-fen1
(1.TianshiCollege,Tianjin 301700,China;2.Tianjin Modern Vocational Technology College,Tianjin,300350,China)

An identifyingmethod fordifferentbrandsof Ejiaoby using supportvectormachine(SVM)was introduced.First,SVM analyzed the infrared spectrumsofdifferentbrandsof Ejiao,researching the pre-processing of Ejiao spectrums systematically at the same time and the discrimination models of three brands of Ejiao were established.Method comparison was used to discriminate the four different clustering analysis algorithms(KNN,Bayes,LDFand SVM).The experimentproved that the recognition rate and rejection rate of SVM were the highest in the clustermodels of differentbrandsof Ejiao.The results showed that thismethod could identify different typesof Ejiaoeffectively.

FTIR;supportvectormachine;Ejiao;identification

10.3969/j.issn.1005-6521.2017.07.029

2016-05-13

大学生创业创新项目(201510859005)

刘晓倩(1994—),女(汉),本科/学士,研究方向:食品科学。

猜你喜欢

阿胶预处理红外
网红外卖
欢迎来到2060年!
欢迎来到2060年!
闪亮的中国红外『芯』
阿胶的小脾气
TS系列红外传感器在嵌入式控制系统中的应用
基于预处理MUSIC算法的分布式阵列DOA估计
基于快速递推模糊2-划分熵图割的红外图像分割
浅谈PLC在预处理生产线自动化改造中的应用
络合萃取法预处理H酸废水