APP下载

青海不同产地枸杞营养成分和活性成分的因子分析和聚类分析

2020-03-18金建华李永元

关键词:都兰德令哈原始数据

金建华,李永元

(青海民族大学 青藏高原资源化学与生态环境保护实验室,青海 西宁 810007)

枸杞是茄科的一种落叶小灌木,长成的果实可作为一味中药材使用,其含有丰富的多糖、黄酮、灰分(无机元素)、类胡萝卜素、粗蛋白等活性成分和营养成分,具有降血糖、抗病毒、抗氧化、护肝、增强免疫和抗癌等功效[1-6]。青海不同产地枸杞受种植地域的影响,品质具有差异性,为此,笔者采用因子分析法、聚类分析法从枸杞营养成分和活性成分角度,综合分析了青海不同产地枸杞品质的特征指标和聚类情况[7-9]。

1 因子分析和聚类分析原理

因子分析法是将众多的变量综合为少数几个因子,并且保证原有信息损失最小,因子间不具有显著的相关性的一种多元统计分析降维方法。聚类分析法是按“物以类聚”的原则研究事物分类的一种多元统计分析方法。

2 结果与分析

采用SPSS 13. 0统计软件,对原始数据进行标准化处理后进行因子分析和聚类分析,涉及的原始数据均来自文献[1],数据见表1。

表1 青海不同产地枸杞营养成分和活性成分含量Tab.1 Contents of nutritional and bioactive composition of Lycium barbarum from different habitats in Qinghai

注:栽培柴达木枸杞果实:采集于青海省共和县、都兰县、乌兰县、格尔木和德令哈等12个不同地区,1~12号样品依次分别来自于共和县下塔迈村、都兰县下朝阳、都兰小夏滩村、宗加乡、诺木洪农场、大格勒龙羊村、格尔木河东农场、格尔木河西农场、德令哈塔湾克里、德令哈克鲁克基地、怀头塔拉、乌兰县柯柯镇。

2.1 不同产地枸杞的因子分析

2.1.1 原始数据的标准化处理

对原始数据进行标准化处理,即对同一变量减去均值,再除以标准差,以消除原始数据之间的量纲影响,使标准化的数据具备可比性,并遵从正态分布规律(0,1)。

2.1.2 变量的相关系数矩阵

由表2可知,75%以上数据的绝对值大于0.3,变量之间有一定的相关性,即这些变量之间有共同因子,可以进行因子分析。

表2 变量的相关系数矩阵Tab.2 Correlation matrix of variables

2.1.3 主因子方差解释

利用因子载荷矩阵求解变量相关矩阵,解得相关矩阵的特征根,根据特征根的大小确定因子数量。从表3数据可知,前3个特征根的3个因子可解释原始变量总方差的89.643%,前3个因子可较好地解释原始变量。

2.1.4 方差最大化旋转

为了更好地说明因子的含义,对因子模型进行旋转,得到方差最大化后的因子载荷矩阵,见表4。

表3 主因子方差解释Tab.3 Explanation of variance of principal factor

表4 旋转后的因子载荷矩阵Tab.4 Factor Load Matrix after rotation

从表4可知,第一主因子和多糖具有较高的正相关系数,多糖是第一主因子的代表;第二主因子与总黄酮有较高的正相关系数,总黄酮是第二主因子的代表;第三主因子与灰分有较高的相关系数,灰分是第三主因子的代表。利用回归法得到得分函数:

F1=0.501X多糖+0.249X总黄酮-0.246X灰分-0.029X粗蛋白+0.142X粗纤维-0.086X粗脂肪+0.261X总糖+0.301X类胡萝卜素

F2=0.302X多糖+0.466X总黄酮+0.218X灰分+0.409X粗蛋白+0.200X粗纤维-0.454X粗脂肪+0.182X总糖+0.176X类胡萝卜素

F3=0.444X多糖+0.193X总黄酮+0.695X灰分+0.031X粗蛋白+0.494X粗纤维+0.425X粗脂肪+0.193X总糖-0.215X类胡萝卜素

把原始数据经标准化的值带入方程,计算得主因子得分值、综合因子得分值,见表5。

表5 主因子得分值、综合因子得分值Tab.5 Main factor score and comprehensive main factor score

枸杞品质排名顺序是共和县下塔迈村、格尔木河东农场、德令哈克鲁克基地、都兰宗加乡、大格勒龙羊村、德令哈怀头塔拉、德令哈塔湾克里、都兰县下朝阳、乌兰县柯柯镇、都兰诺木洪农场、都兰小夏滩村、格尔木河西农场。从图1也可直观反映枸杞品质排名顺序。

这一综合评价与实际情况相符[10-12]。文中建立的综合评价函数,避免了人为确定权数的缺陷。

图1 因子得分图Fig.1 Principal factor score

2.2 不同产地枸杞聚类分析

采用SPSS 13.0统计软件,对原始数据进行标准化处理,以离差平方和法和欧式距离平方进行聚类分析,结果见图2。由图2可知,12批枸杞样品可聚分为3大类,S1、S4、S5、S6、S9、S10、S11聚为一类,多糖平均含量为4.35%~5.01%,总黄酮平均含量为0.86%~1.11%,灰分平均含量为3.21%~4.07%;S2、S3、S7、S12聚为一类,多糖含量为5.06%~5.62%,总黄酮平均含量为0.83%~1.10%,灰分平均含量为3.30%~5.06%;S8为一类,多糖含量平均含量为5.32%~5.36%,总黄酮平均含量为0.85%~0.87%,灰分平均含量为6.21%~6.37%。而在欧氏距离大于20外,样本又全部归为一类,表明12种样品具有相同的功效。

图2 聚类分析树状图Fig.2 Cluster analysis tree diagram

3 结语

采用SPSS 13.0统计软件,对青海不同产地枸杞进行了因子分析和聚类分析。因子分析结果表明多糖、总黄酮、灰分是评价青海省不同产地枸杞质量的特征指标,枸杞品质排名顺序是共和县下塔迈村、格尔木河东农场、德令哈克鲁克基地、都兰宗加乡、大格勒龙羊村、德令哈怀头塔拉、德令哈塔湾克里、都兰县下朝阳、乌兰县柯柯镇、都兰诺木洪农场、都兰小夏滩村、格尔木河西农场。聚类分析显示12个区域样品被聚分为3大类,S1、S4、S5、S6、S9、S10、S11聚为一类,S2、S3、S7、S12聚为一类,S8为一类,其与植物生长地理环境和生态环境有关,因子分析和聚类分析结果可为枸杞研究提供一定理论依据。

猜你喜欢

都兰德令哈原始数据
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
德令哈,没了“海子”你还剩下什么
受特定变化趋势限制的传感器数据处理方法研究
蒙古族青年长调歌者——都兰
德令哈的雪
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
都兰吐蕃三号墓石刻考析
都兰吐蕃古墓考古研究综述
德令哈 雪山下的光热之都
今夜,我在德令哈