APP下载

近红外光谱结合化学计量学鉴别防风原产地

2022-06-15白文明

中成药 2022年5期
关键词:波数因变量防风

李 斌, 莲 花, 布 仁, 渠 弼, 白文明

(内蒙古医科大学,内蒙古 呼和浩特 010110)

防风为伞形科植物防风Saposhnikoviadivaricate(Turcz.)Schischk.的干燥根,主产于我国内蒙古、辽宁、河北等北方或东北地区[1],具有祛风解表、胜湿止痛、止痉等功效[2]。防风中含有丰富的香豆素、色原酮、多糖、聚乙炔类成分[3],研究发现,防风具有抑制类风湿关节炎、阵痛、消化性溃疡,保护神经系统,抗痉挛、抗炎、抗肿瘤等活性[4-8]。东北三省和内蒙古是防风的道地产区,其在我国境内的分布较广,受到生长环境的影响,药效成分的含量及临床药效等均可能出现较大差异[9]。加之,我国中药材市场普遍存在混用、乱用及以次充好等现象,使得防风产地的鉴别非常重要。

近红外分光谱法以其能够进行快速、无损分析的特点,已广泛应用于中药材质量控制的研究[10-13]。虽然有报道基于(中)红外光谱法可有效地判别不同产地的防风[14],但该方法需要将样品压片,耗时费力,无法满足在线分析的要求。

本研究采集并购买内蒙古自治区(赤峰)、辽宁(阜新)、河北、甘肃、黑龙江这5个产地防风,利用漫反射方式采集近红外光谱,结合主成分分析(PCA)和偏最小二乘判别分析(PLS-DA)等方法,建立预测防风产地属性的快速无损分析方法。

1 材料

1.1 仪器 NIRMaster傅里叶变换近红外光谱仪(瑞士Buchi公司);DFY-1000C中药粉碎机(上海左乐仪器有限公司);JET1002G/00电子天平(瑞士梅特勒-托利多公司)。

1.2 防风 防风共5批,分别为2019年采自内蒙古自治区赤峰、辽宁省阜新境内的2批,以及2018年购自河北、甘肃、黑龙江防风市场的3批,经内蒙古医科大学药学院生药教研室渠弼副教授鉴定为正品,按每份约50 g的量分成若干份,中药粉碎机粉碎,共得到内蒙古产15份、辽宁产15份、河北产30份、甘肃产30份、黑龙江产30份。

2 方法

2.1 分析条件 温度24~26 ℃;相对湿度45%~50%;粉末累积扫描次数32次;扫描范围10 000~4 000 cm-1;分辨率为8 cm-1。

2.2 样品测定 采用积分球漫反射法,将防风粉末置于样品杯中,自动旋转测量3个位置的近红外光谱,结果见图1。

2.3 数据分析 本研究采用主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)建立判别不同产地防风的判别模型,并通过外部未知样品对判别模型进行验证。为了使不同产地防风光谱之间具有可比性,在建立相应模型前将对漫反射近红外光谱进行K-M转换[15];为了分离重叠吸收峰,并校正基线漂移和光散乱对近红外光谱有效信息的影响,采用基于Savitzky-Golay算法的微分处理法(1阶、2阶微分)和标准正态变量变换处理法(SNV)对光谱进行前处理。

图1 不同产地防风近红外光谱图

将不同产地防风进行随机分组,分别为校正组95份(内蒙古、辽宁产各10份,河北、甘肃、黑龙江产各25份)、验证组25份(各产地5份)。参照文献[16-17]报道,基于校正组防风的近红外光谱进行PCA分析,将近红外光谱在各载荷上的得分投影到坐标系中,确定能表征不同产地防风差异的2个载荷,相同产地防风近红外光谱将出现在坐标系的相近区域,而不同产地的将出现在坐标系的较远区域,从而可进行区分。为了评价所建立模型的优劣,选用校正组以外的防风(验证组)来验证模型对未知样品的鉴别能力。

参照文献[18]报道,定义验证组防风的95个近红外光谱为自变量(X),各近红外光谱的分组信息为因变量(Y)。由于本研究所用防风来源于5个产地,所以每1个近红外光谱(自变量)对应的因变量数为5个,每1个因变量代表1个产地,当该因变量代表的产地与对应的近红外光谱的产地一致时取值1,否则取值-1,再基于验证组防风的自变量及因变量数据,利用PLS2算法建立判别防风产地的数学模型。为了避免监督学习算法出现过拟合现象,选用验证组的样品对预测模型的优劣进行评价,由于PLS2算法给出的预测结果为5个变量数值,故最接近1的变量所代表的产地即为防风原产地。另外,也可通过主成分分析对预测得到的因变量数据(PLS2模型获得的预测数值)进行降低维度处理后,以二维坐标散点图中的样品分布区域(99.9%等概率区域)来判断防风原产地,即相同产地防风出现在二维坐标系的相近区域内,不同产地的出现在较远的区域。然后,采用坐标系散点图的方式表示原产地预测结果,数据解析均基于FreeMat v4.0软件完成。

3 结果

3.1 PCA 图2显示,除校正组(图2a)外,其余各组前处理光谱建立的模型都能将不同原产地防风进行分离,并且无重叠;99.9%等概率区域(椭圆处)无重叠,其中基于2阶微分加SNV处理光谱的鉴别模型对校正组中不同产地防风的分离效果最佳,并对验证组防风具有同样的鉴别效果(图2f),原产地鉴别的准确率为100%,故确定该模型为防风原产地的鉴别模型;内蒙古自治区、辽宁省产防风的等概率椭圆区域相对较大,即相同原产地的组内差异比其他原产地大,其原因可能是建立判别模型时上述2个产地的防风较少,导致通过PCA获得的主成分所代表的与这2个产地防风特征有关的信息量降低,从而使组内差异变大。

图2 基于校正组近红外光谱建立的鉴别模型及验证组防风鉴别结果(Ⅰ)

图3显示,4 344、4 444 cm-1位置附近的载荷值较大,表明近红外吸收对判别模型的判别结果起到了显著作用,是不同产地防风差异的关键因素;该处吸收峰主要来源于C-H基团的合频振动,在近红外光谱的对应位置(图1a)上可观察到强度较大者。另外,通过观察经前处理(2阶微分+SNV)后的低波数段的扩大图(图1b)发现,上述2个波数位置附近吸收强度及吸收峰形状有较大差异。

图3 主成分分析载荷图

图4显示,不同产地防风近红外光谱差异主要出现在低波数段,表明与该波数段吸收源对应的成分在不同产地防风中含量或分布状况可能存在明显差异,可得到很好的分离。

3.2 PLS-DA 图5显示,光谱前处理的有无对防风原产地判别结果的影响较小,即产地鉴别模型能很好地将不同产地防风进行分离,而且99.9%等概率区域(椭圆处)无重叠。综合考虑散点图上校正组防风各点的分散情况和模型对验证组防风的预测准确度(图5e),最终选择基于二阶微分处理光谱的PLS2算法为建立模型的方法,发现内蒙古自治区、辽宁省产防风的等概率椭圆区域相对较大,表明这2个产地防风组内差距比其他产地大,与PCA结果一致,其主要原因为当地防风数较少。

图6显示,5 028、4 924、4 664、4 472 cm-1附近的取值较大,表明上述波数处吸光度对判别结果的贡献率较高,与上述波数对应的吸收源(成分)可能是不同产地防风差异的关键因素;该处吸收峰主要来源于C-H基团的合频振动,近红外光谱(图1a)对应位置上可观察到明显较强的一系列吸收峰,与PCA结果一致,进一步证明是该波数段对应成分的含量或分布状况等在不同产地防风之间产生差异,可得到很好的分离。

图4 不同产地防风差光谱散点图

图5 基于校正组近红外光谱建立的鉴别模型及验证组防风鉴别结果(Ⅱ)

图6 PLS-DA模型的回归系数散点图

4 讨论

防风是典型的道地药材,药用价值与原产地有着密切的关系,所以防风的原产地鉴别是其质量控制的重要环节。本研究基于近红外光谱结合化学计量学的方法,建立通过防风的近红外光谱预测原产地的快速、无损分析方法,且该方法的预测精度符合实际应用的要求。不同产地防风的药效存在较大差异,而造成药效差异的原因非常复杂,可能是多个药效成分协同作用的结果,所以很难用单一或几个化学成分的含量来评价其药用价值。近红外光谱的吸收主要来源于分子中含氢基团的倍频和合频振动,理论上中草药中含有的全部有机物都将在该波段产生光谱吸收,即防风的近红外光谱几乎包含了所有药效成分的光谱信息。利用近红外光谱法对防风原产地进行鉴别分析,实际上是以防风中含有的绝大部分药效物质为基础进行的判别分析。所以,判别结果反映的是防风整体性质的差异,迎合中药质量控制过程中整体评价药材属性的最新研究思路。本研究建立的防风原产地鉴别方法的操作非常简单,仅需要将防风进行粉碎后采集近红外光谱,并将近红外光谱带入数学模型即可。不仅分析速度快、样品前处理简单,而且光谱检测前后药材的药用属性不发生变化,有潜力作为制剂过程中中药材原产地筛选的在线分析技术,提高中药材质量控制的现代化程度。

猜你喜欢

波数因变量防风
基于ATR-FTIR光谱的γ-PGA发酵批次分类研究
一种基于SOM神经网络中药材分类识别系统
港口大型机械防风安全发展形势及防风安全体系建立
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
大楼的防风攻略
Regularity of Wind-dispelling Medication Prescribed by LI Dong-Yuan: A Data Mining Technology-based Study
二维空间脉动风场波数-频率联合功率谱表达的FFT模拟
标准硅片波数定值及测量不确定度
偏最小二乘回归方法
谈谈如何讲解多元复合函数的求导法则