APP下载

主成分和聚类分析评价农产品加工企业周边地下水的水质

2018-11-06纵翼飞

安徽农学通报 2018年15期
关键词:聚类农产品加工

纵翼飞

摘 要:为评价农产品加工对企业周边地下水水质的影响,采用主成分和聚类分析10个不同类别的农产品加工企业周边地下水样的8个水样指标,测定其pH 值、铵态氮(NH4+-N)、 CODMn、总硬度、硫酸盐、砷、阴离子表面活性剂和溶解性总固体。通过主成分分析提取出3个主成分,应用聚类分析对该3个主成分的得分进行聚类,聚类分析后水样划分为4类,相同类型的农产品加工企业位于一类,根据加工企业的类型可分析和判别其可能的污染情况。

关键词:地下水,水质评价,主成分分析,聚类分析

中图分类号 X824 文献标识码 A 文章编号 1007-7731(2018)15-0157-03

Abstract:To evaluate the effect of processing agricultural products on the quality of surrounding groundwater,principal component and cluster analysis were used to analyze 8 indexes of 10 water samples from different categories of agricultural products processing enterprises . pH,ammonium nitrogen,CODMn,total hardness,sulfate,arsenic,anion surfactant and TDS were detected separately. 3 principal components were extracted by principal component analysis. Then cluster analysis was used to cluster the scores of the three principal components. After cluster analysis,the water sample is divided into 4 categories. The same type of processing agricultural products is located in one category. Therefore,the possible pollution situation can be analyzed and distinguished according to the type of processing enterprises.

Key words:Groundwater;Water quality assessment;Principal component analysis;Cluster analysis

水是人类生活和社会生产必需的基本资源,是生态环境的控制性要素。近年来,随着农产品加工业的快速发展,大量工业废水的排出,可能会对周边地下水形成污染[1]。地下水水质受诸多因素影响[2],在进行评价时应考虑反映不同方面的各项指标。因此,需要一种方法对水评价指标进行分类、筛选及优化,达到能够利用较少指标最大反映水质量之目的。近年来国内外学者已将多种方法用于地下水水质评价,常用的评价法有综合污染指数法[3]、模糊综合法[4]、层次分析法[5]、人工神经网络法[6]、灰色聚类法[7]等,这些方法各有其特点。近年来,主成分分析和聚类分析在水文地质科学研究中得到广泛应用[8-9],但将主成分分析和聚类分析方法结合对地下水水指标进行分类及筛选的方法还少见报道。因此,本研究采用主成分分析和聚类分析方法结合分析地下水质量和加工企业之间的相关性,为地下水资源的保护提供指导。

1 实验方法

1.1 不同农产品加工企业周边地下水 选择10个不同類型的农产品加工企业,选其周边的水井为取样点,井深一般大于5m。选取pH、总硬度、溶解性总固体、硫酸盐、砷、NH4+-N、CODMn和阴离子表面活性剂8个代表性指标。S1、S2为果蔬加工排放水,S3、S4为肉制品加工排放水,S5、S6为乳制品加工排放水,S7、S8为焙烤加工企业排放水,S9为发酵果汁加工企业排放水,S10为白酒加工企业排放水。不同农产品加工企业周边地下水的质量指标如表1所示。

1.2 数据分析 利用数据分析软件SPSS19.0进行主成分分析与聚类分析。

2 结果与讨论

2.1 主成分分析 由于地下水样的质量指标较多,各质量指标直接评价十分复杂,因此采用主成分分析(PCA)对其进行处理。主成分分析是设法将原有的指标重新组合成1组新的互相无关的几个综合指标。根据实际需要从中选取尽可能少的综合指标,达到尽可能多的反映原来较多指标的信息目的。

采用SPSS主成分分析法对组分进行分析,程序运行结果变量间的相关矩阵见表2,方差分解主成分提取分析结果见表3,初始因子载荷矩阵见表4。

从表3可知,提取3个主成分,即m=3。从表4可知,pH、溶解性总固体、硫酸盐、砷、NH4+-N、CODMn等在第1主成分上有较高的载荷,说明第1主成分基本反映了这些指标的信息;总硬度、砷、阴离子表面活性剂在第2主成分上有较高的载荷,说明第2主成分基本反映了这些指标的信息,溶解性总固体第3主成分上有较高的载荷,说明第3主成分反映了该指标的信息。取前3个特征值,累计贡献率达85%以上,表明前3个主成分基本上包含了全部变量所具有的信息。

2.2 聚类分析 根据3个主成分的贡献率(F)生成公式F=0.38669 PC1+0.31727 PC2+0.15109PC3,得到综合得分,并以主成分的综合得分作为评价新指标,采用组间连接法,间距以欧氏距离计算,将关联系数全部分组,用水平方向显示全部聚类柱图。通过聚类分析进一步确定影响因子之间的贴近度,明晰因子之间的差异程度,计算机SPSS处理后输出的反映聚类全过程的树形图见图1。

确定以类间距离不大于5作为本次研究对象标准,由图1得出类间距离不大于5时,10个水样点被分为4组;如图所示,S1、S2聚成一类(用类1表示),是果蔬加工企业周边地下水,这些企业主要是植物性原料加工;S7、S8(用类2表示)是焙烤加工企业周边地下水,这些企业主要采用粮食加工;S3、S4聚成一类(用类3表示),为肉制品加工企业周边地下水,这些企业主要是肉制品原料;S5、S6、S10、S9聚成新的一类(用类4表示),这些企业为乳制品加工企业周边地下水、发酵果汁加工企业周边的地下水和白酒加工企业周边地下水。其中乳制品企业周边地下水中蛋白质含量丰富,发酵果蔬饮料和发酵酒在发酵过程中,菌体也产生大量蛋白质。从聚类结果可见,不同加工类别的企业周边的地下水能够很好的聚类。

3 结论

通过对不同农产品加工企业周边地下水的聚类分析发现,不同加工类别的企业周边的地下水能够很好的聚类;采用聚类分析法对加工企业周边的地下水成分检测数据进行处理,可对该地区可能存在的污染情况进行预测和判断。

参考文献

[1]朱新玉,胡云川,芦杰,等. 豫东黄河故道湿地土壤生物学性状及土壤质量评价[J] 水土保持研究,2014,24(2):27-32.

[2]姚文艺,冉大川,陈江南.黄河流域近期水沙变化及其趋势预测[J].水科学进展,2013,24(5):608-614.

[3]Huan H,Zhang B T,Kong H M,et al.Comprehensive assessment of groundwater pollution risk based on HVF model: A case study in Jilin City of northeast China[J].Science of The Total Environment,2018,628-629(7):1518-1530.

[4]Hiratsuka,Dhundi,Akira.An integrated GISbased fuzzy pattern recognition model to compute groundwater vulnerability index for decision making [J]. Journal of Hydroenvironment Research,2011,5(1): 63-77.

[5] M. Annie Jenifer,Madan K. Jha.Comparison of Analytic Hierarchy Process,Catastrophe and Entropy techniques for evaluating groundwater prospect of hard-rock aquifer systems[J].Journal of Hydrology,2017,548(5): 605-624.

[6]李世明,王小藝,许继平,等.用基于人工神经网络的河湖蓝藻水华状态评价研究[J].水资源与水工程学报,2017,28(4):93-96.

[7]沃飞,陈效民,吴华山,等.灰色聚类法对太湖地区农村地下水水质的评价[J].安全与环境学报,2006,6(4):38-41.

[8]Yang J,Cheng Q M. A comparative study of independent component analysis with principal component analysis in geological objects identification. Part II: A case study of Pinghe District,Fujian,China [J]. Journal of Geochemical Exploration,2016,149(2): 136-146.

[9]Cary R L,Ghanashym N,Nicolas S,et al.Cluster analysis as a tool for evaluating the exploration potential of Known Geothermal Resource Areas [J].Geothermics,2018,72(5): 358-370.

(责编:王慧晴)

猜你喜欢

聚类农产品加工
农产品网店遭“打假”敲诈 价值19.9元农产品竟被敲诈千元
认识“超加工食品”
后期加工
打通农产品出村“最先一公里”
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
菱的简易加工几法
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例