APP下载

基于枸杞红外光谱人工神经网络的产地鉴别

2016-06-15刘明地吉守祥

光谱学与光谱分析 2016年3期
关键词:产地枸杞青海

李 仲, 刘明地, 吉守祥

1. 青海民族大学物理与电子信息工程学院, 青海 西宁 810007

2. 青海民族大学化学与生命科学学院, 青海 西宁 810007

基于枸杞红外光谱人工神经网络的产地鉴别

李 仲1, 刘明地2, 吉守祥2

1. 青海民族大学物理与电子信息工程学院, 青海 西宁 810007

2. 青海民族大学化学与生命科学学院, 青海 西宁 810007

应用红外光谱技术, 快速鉴别枸杞药材产地。 利用傅里叶变换红外光谱, 测定了45个来自青海省不同产地的枸杞样品的红外光谱。 以常规预处理方法和小波变换对红外光谱原始数据进行了预处理。 对比常用的窗口移动平滑预处理、 标准正态变换以及多元散射校正, 小波变换是一种有效实用的光谱预处理方法。 为了提高神经网络的训练速度, 在利用人工神经网络建立模型之前, 通过小波变换的方法对光谱变量进行了压缩, 同时对建立的模型的相关参数进行了详细的讨论。 结果表明, 红外光谱数据压缩到原来的1/8, 其分析精度与原始光谱数据基本相当。 以压缩了的光谱数据作为反向传播(BP)网络的输入变量, 产地类别作为神经网络的输出变量, 建立3层人工神经网络。 其中隐含层神经元个数为5个, 输出层神经元个数为1个。 隐层的传递函数是tansig, 输出层传递函数是purelin, 网络训练函数trainlm, 权阈值的学习函数是learngdm。 net.trainParam.epochs=1 000, net.trainParam.goal=0.001。 对10个未知枸杞产地类别进行了预测, 预测结果准确率达100%。 实验表明, 建立的模型能够正确地对枸杞样品快速地进行产地鉴别。 红外光谱法结合人工神经网络可作为中药材产地分类鉴别的一种新的现代化方法。

枸杞; 傅里叶变换红外光谱; 小波变换; 人工神经网络

引 言

青海枸杞主产地柴达木盆地的产品, 因独特的生态环境, 具有微量元素种类多以及富含多糖和黄酮等特点[1], 目前市场十分广阔[2]。 文献上有采用新的光谱学方法鉴别宁夏、 新疆等非青海出产的枸杞质量的报道[3-4]。 考虑到青海柴达木盆地幅员辽阔, 面积达25.78万km2, 各枸杞产地生态环境等方面存在差异, 必然导致其化学组分的种类和含量存在细小差别。 据此前期工作曾采用红外光谱结合聚类方法鉴别青海柴达木盆地枸杞产地[5-6]。 但聚类方法产地鉴别比较粗糙, 不能细分产地。 本研究提出在小波变换红外光谱数据的基础上, 采用神经网络建模, 通过神经网络结构参数的优化, 可实现对青海柴达木盆地枸杞产地的细分鉴别。

1 实验部分

1.1 试样采集

为了使试样更具有代表性, 增加结果的可信度, 研究中选用的枸杞试样在原有18个样品的基础上增加至45个[6], 分别采自青海省柴达木盆地各枸杞产地。 为方便品质比较, 也包括青海省外枸杞质量优良的宁夏回族自治区中宁产品。 全部试样由植物分类学家王占林研究员鉴定, 符合中华人民共和国药典有关枸杞成熟果实性状之规定[7]。 详细产地列于表1。

Table 1 Origin of the samples

1.2 试样预处理

由于青海柴达木盆地出产的枸杞糖类成分高, 枸杞试样预处理时, 若环境湿度较高, 则不利于晾晒。 试样晾晒后要尽快移至干燥箱内, 于(60±2) ℃干燥至恒重, 取出粉碎至粒径应小于0.05 mm装袋密封备用。

1.3 仪器与药品

仪器与药品同文献[5]。

1.4 试样红外谱测定

根据精密度、 重现性及稳定性试验, 选定光谱测定条件。 待仪器工作稳定后, 将混匀有少量枸杞试样的溴化钾压片置于红外仪样品池中扫描即可获取红外光谱(参见图1)[6]。 一般试样至少重复测定3次, 以平均值记录谱图数据。

Fig.1 Infrared spectroscopy of the samples

2 神经网络建模

2.1 普通方法预处理红外光谱

直接采用带噪声的红外光谱数据建模通常会带来偏差。 从研究实际预处理效果看, 采用普通光谱预处理Derivation, Standard Normal Variation, Multi-scatter Calibration等方法[8], 消噪效果不理想, 更达不到压缩红外数据的目的。

2.2 小波变换预处理红外光谱

新近兴起的小波变换预处理红外光谱包括光谱信号的降噪和压缩。 利用MATLAB中的Wavelet箱函数编程可以实现[9]。 在建立评价小波信号降噪和压缩性能指标的基础上[10], 通过筛选小波母函数、 优化得出合适的分解层次和确定具体的消噪阈值等变换步骤, 可成功地实现光谱数据降噪和压缩, 其近2 000个数据可以被压缩至241。

2.3 神经网络建模

2.3.1 枸杞试样产地的聚类分析鉴别

采用聚类方法对青海枸杞试样进行产地鉴别。 试样的红外光谱数据矩阵为X35×241, 表示35个试样和241个红外光谱数据。 选择标准欧氏距离测度和沃特法聚类, 结果35个试样明显分成3类。 但8和23号诺木洪试样出现分类错误, 落入到青海德令哈产区类别。 因此拟采用准确度高的神经网络建立鉴别模型。

2.3.2 神经网络建模

工作中曾采用概率神经网络应用于藏药诃子产地鉴别[11]。 但这里考虑到试样输入数据个数较多, 仍使用分类见长的概率神经网络不适合。 因此使用常见的误差反向传播算法的神经网络(BP-ANN)来建立鉴别模型[12-13]。 为了尽可能减少隐含层神经元, 提高网络训练速度, 经试算, 建立一个前向级联BP网络, 可以满意地完成枸杞产地的鉴别。 MATLAB中的Neural Network箱中newcf函数可以方便地创建前向级联BP网络。 网络的主要参数如下: 网络结构241-5-1, 即输入神经元241个, 对应每个枸杞试样小波压缩后的数据长度, 隐层5个神经元, 输出层神经元1个, 对应枸杞试样类别, 以1.0代表青海枸杞粉制品(含化学品处理过的枸杞样品), 2.0代表诺木洪农场、 格市大格勒乡(含宁夏中宁)的枸杞试样, 以3.0代表德令哈市和乌兰县与都兰县的枸杞试样。 隐层传递函数tansig, 输出层传递函数purelin, 网络训练函数trainlm, 权阈值学习函数learngdm。 net.trainParam.epochs=1 000, net.trainParam.goal=0.001。 网络训练误差图见图2。 由图2可以看出, 仅9步网络训练误差即达标。

Fig.2 Training errors of the network

作为本研究的延续, 还尝试利用数据挖掘软件Clementine12中的C5.0算法, 以变量对分类的重要性(Importance)为依据, 从输入的241个红外数据(以X1,X2, …,X241共计241个光谱数据作为变量)筛选出11个特征数据(X35,X42,X59,X64,X77,X84,X162,X184,X192,X201,X232)。 以此11个特征数据作为神经网络输入, 网络输入节点大为减少, 其余网络参数不变, 训练、 预测精度均达标。

2.4 结果分析

通过网络性能仿真测试, 可以对模型的预测能力作出估计。 35个试样回判的细分结果即3类产地鉴别正确率达100%。 用未参加建模训练的10个已知产地类别的检测集对网络预测能力进行检验, 细分3类结果即产地鉴别正确率也达100%, 结果令人满意。 总体来看, 枸杞产地上述分类结果与当前实际情况一致。 诺木洪农场与格市大格勒乡位于盆地南缘, 两地靠近, 生态环境等相似, 因而枸杞品质相似, 以质量优良著称[14-15]。

诺木洪农场种植的枸杞有相当一部分产地引种了中宁枸杞品种宁杞1—7号, 因而宁夏中宁枸杞与诺木洪农场和格市大格勒乡枸杞判别属于同一类就容易理解了。 而其他产地如德令哈市、 乌兰县和都兰县等, 位于柴达木盆地东北缘, 与盆地南缘的诺木洪农场、 格市大格勒乡自然生态环境存在较大的不同, 品质也就不同, 自然归于另一类。

值得指出的是, 市场出现了不良商贩用化学品(例如Na2SO3等)处理的伪劣枸杞或枸杞粉(制粉时使用化学添加剂), 显然化学组成更为复杂, 已与纯天然绿色枸杞有较大的不同, 自然归于另类。

3 结 论

采用小波消噪和压缩技术对红外光谱数据进行预处理, 既保留了样品全光谱(4 000~400 cm-1)的特征, 又有效地减少了光谱变量, 用于红外光谱数据处理是合适的。 据此结合BP神经网络建立了青海枸杞产地鉴别模型。 神经网络结构参数优化后的模型对柴达木盆地产地鉴别预测效果很好, 还能鉴别伪劣枸杞或枸杞制成品, 正确识别率达到100%, 因而有较大的实用性, 适合无损快速鉴别应用。

[1] RUKEYA·Jiapaer, SUN Yu-jing, ZHONG Lie-zhou, et al(如克亚·加帕尔, 孙玉敬, 钟烈州, 等). Journal of Chinese Institute of Food Science and Technology(中国食品学报), 2013, 8: 161.

[2] MA De-cun, MA Li-ya, WANG Yan-ming(马得存, 马丽雅, 汪延明). Economist(经济师), 2012, 12: 69.

[3] LIU Nan, YANG Zong-xue, LIN Hai-ming, et al(林 楠, 杨宗学, 蔺海明, 等). Journal of Gansu Agricultural University(甘肃农业大学学报), 2013, 48(2): 34.

[4] XU Chun-jin, ZHANG Rui, YU Xiu-zhu, et al(徐春瑾, 张 睿, 于修烛, 等). Food Science(食品科学), 2014, 35(22): 164.

[5] DUOJIE Zha-xi, LI Zhong, LIU Ming-de(多杰扎西, 李 仲, 刘明地). Journal of Anhui Agri. Sci.(安徽农业科学), 2014, 42(12): 3704.

[6] LIU Ming-de, LI Zhong, WU Qi-xun , et al(刘明地, 李 仲, 吴启勋, 等). Journal of Huazhong Normal University·Nat. Sci.(华中师范大学学报·自然版), 2014, 48(6): 857.

[7] XU Chang-qing, LIU Sai, XU Rong, et al(徐常青, 刘 赛, 徐 荣, 等). China Journal of Chinese Materia Medica(中国中药杂志), 2014, 39(11): 1979.

[8] WEI Xue-min, WU Qian, LIU Qiang, et al(魏学敏, 吴 倩, 刘 强, 等). Chinese Journal of Pharmaceutical Analysis(药物分析杂志), 2013, 33(8): 1447.

[9] LI Su-yi, JI Yan-ju, LIU Wei-yu, et al(李肃义, 嵇艳鞠, 刘伟宇, 等). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2013, 33(4): 968.

[10] ZHU Jian-jun, ZHANG Zhe-tao, KUANG Cui-lin, et al(朱建军, 章浙涛, 匡翠林, 等). Geomatics and Information Science of Wuhan University(武汉大学学报·信息科学版), 2015, 40(5): 699.

[11] AN Sheng-mei, WU Qi-xun, JI Shou-xiang(安生梅, 吴启勋, 吉守祥). Hubei Agricultural Sciences(湖北农业科学), 2014, 53(20): 4977.

[12] LUAN Guo-hong, HE Kai-xun, CHENG Hui, et al(栾郭宏, 贺凯迅, 程 辉, 等). Computers and Applied Chemistry(计算机与应用化学), 2014, 31(1): 63.

[13] GUO Zhi-ming, HUANG Wen-qian, PENG Yan-kun, et al(郭志明, 黄文倩, 彭彦昆, 等). Chinese Journal of Analytical Chemistry(分析化学), 2014, 42(4): 513.

[14] LI Mei-lan(李梅兰). Journal of Anhui Agri. Sci.(安徽农业科学), 2012, 40(8): 4521.

[15] LIU Ming-de, LI Zhong, WU Qi-xun, et al(刘明地, 李 仲, 吴启勋, 等). Computers and Applied Chemistry(计算机与应用化学), 2014, 31(12): 1553.

The Identification of the Origin of Chinese Wolfberry Based on Infrared Spectral Technology and the Artificial Neural Network

LI Zhong1, LIU Ming-de2, JI Shou-xiang2

1. College of Physics and Electronic Information Engineering, Qinghai University for Nationalities, Xining 810007, China

2. College of Chemistry and Life Sciences, Qinghai University for Nationalities, Xining 810007, China

The Fourier Transform Infrared Spectroscopy (FTIR) is established to find the geographic origins of Chinese wolfberry quickly. In the paper, the 45 samples of Chinese wolfberry from different places of Qinghai Province are to be surveyed by FTIR. The original data matrix of FTIR is pretreated with common preprocessing and wavelet transform. Compared with common windows shifting smoothing preprocessing, standard normal variation correction and multiplicative scatter correction, wavelet transform is an effective spectrum data preprocessing method. Before establishing model through the artificial neural networks, the spectra variables are compressed by means of the wavelet transformation so as to enhance the training speed of the artificial neural networks,, and at the same time the related parameters of the artificial neural networks model are also discussed in detail. The survey shows even if the infrared spectroscopy data is compressed to 1/8 of its original data, the spectral information and analytical accuracy are not deteriorated. The compressed spectra variables are used for modeling parameters of the back-propagation artificial neural network (BP-ANN) model and the geographic origins of Chinese wolfberry are used for parameters of export. Three layers of neural network model are built to predict the 10 unknown samples by using the MATLAB neural network toolbox design error back propagation network. The number of hidden layer neurons is 5, and the number of output layer neuron is 1. The transfer function of hidden layer is tansig, while the transfer function of output layer is purelin. Network training function is trainl and the learning function of weights and thresholds is learngdm. net.trainParam.epochs=1 000, while net.trainParam.goal=0.001.The recognition rate of 100% is to be achieved. It can be concluded that the method is quite suitable for the quick discrimination of producing areas of Chinese wolfberry. The infrared spectral analysis technology combined with the artificial neural networks is proved to be a reliable and new method for the identification of the original place of Traditional Chinese Medicine.

Chinese wolfberry (LyciumbarbarumL.); FTIR(Fourier transform infrared spectroscopy); Wavelet transform; Artificial neural networks

Apr. 23, 2014; accepted Aug. 18, 2014)

2014-04-23,

2014-08-18

国家自然科学基金项目(81160554), 国家教育部春晖计划(Z2012108)资助

李 仲, 女, 1964年生, 青海民族大学物理与电子信息工程学院教授 e-mail: 13709736484@163.com

O641

A

10.3964/j.issn.1000-0593(2016)03-0720-04

猜你喜欢

产地枸杞青海
是酸是碱?黑枸杞知道
大美青海
宁夏六月枸杞红
警惕“洗产地”暗礁
枸杞到底是怎么养生的?
食物离产地越远越好
测定不同产地宽筋藤中5种重金属
RP-HPLC法同时测定7个产地天麻中5种成分
青海行七首(录二)
青海 管放相宜 渐入佳境