APP下载

基于主成分分析-多元线性回归的松花江水体中多环芳烃源解析

2016-06-09孟凡生王业耀张铃松

中国环境监测 2016年4期
关键词:松花江污染源线性

陈 锋,孟凡生,王业耀,张铃松,杨 琦

1.中国地质大学(北京)水资源与环境学院,北京 100083 2.北华航天工业学院建筑工程系,河北 廊坊 065000 3.中国环境科学研究院,水污染控制技术研究中心,北京 100012 4.中国环境监测总站,国家环境保护环境监测质量控制重点实验室,北京 100012

基于主成分分析-多元线性回归的松花江水体中多环芳烃源解析

陈 锋1,2,孟凡生3,王业耀1,4,张铃松3,杨 琦1

1.中国地质大学(北京)水资源与环境学院,北京 100083 2.北华航天工业学院建筑工程系,河北 廊坊 065000 3.中国环境科学研究院,水污染控制技术研究中心,北京 100012 4.中国环境监测总站,国家环境保护环境监测质量控制重点实验室,北京 100012

对松花江全流域14个监测断面的16种美国环保局优先控制的多环芳烃(PAHs)的主要来源及其贡献率应用主成分因子分析-多元线性回归模型(PCA-MLR)进行了来源解析。结果表明:松花江全流域为化石和石油燃料的复合PAHs污染,水体环境中PAHs首要污染源为化石燃料燃烧和交通污染,合计贡献率为63.1%,第二大污染源为工业和民用燃煤污染,合计贡献率为36.9%,沿江的石化、石油基地、大型焦化厂、电厂都是PAHs的主要来源。

松花江;水体;多环芳烃;源解析;主成分分析;多元线性回归

近年来随着经济的快速发展,地表环境水体面临着有机、无机等污染物所带来的巨大压力。要想切实有效地控制河流污染、保障环境安全,就必须掌握水环境污染物的来源。水污染物源解析技术是掌握水环境污染物来源的重要方法,不仅能判断出主要的污染源类型,还能定量计算各排放源对环境受体的贡献,可为建立流域水污染源的识别、追踪及预测管理体系提供技术支持。

松花江有毒有机物污染严重,对生态环境造成了一定影响,其中多环芳烃(PAHs)是一类具有明显毒性、难降解的典型持久性有机污染物(POPs)。郭伟等[1]对松花江吉林-哈尔滨段表层沉积物中的18种PAHs的分布特征进行了研究,表明该段PAHs整体污染浓度较高,吉林段大于哈尔滨段。王东辉[2]研究了松花江水环境中PAHs的污染状况,表明其污染是全江性的。史鑫源等[3]对松花江哈尔滨市区段的PAHs污染状况进行了分析,表明以低环芳烃为主。目前对于我国PAHs源解析已有一定研究,但多是使用比值法等定性方法,缺乏对松花江全流域PAHs污染源解析的研究。本研究选取典型特征污染物PAHs中美国环保局(USEPA)优先控制的16种污染物作为源解析对象,根据所确定的研究目标,以主成分分析-多元线性回归方法作为主要的源解析技术手段,对松花江全流域水体环境中的PAHs来源进行解析研究。

1 流域概况

松花江是我国七大河流之一,水资源总量居全国第三位。松花江流域地理位置东经119°52′~129°30′,北纬41°42′~51°38′;流域面积55.68万km2。松花江有2个源头:北源嫩江,发源于大兴安岭支脉伊勒呼里山中段南侧的南瓮河源地;南源第二松花江,发源于海拔2 744 m的长白山主峰上著名的白头山天池。2个江源分头下流至吉林省松原市的三岔河附近汇合后向下,称松花江干流。干流折向东流至黑龙江省同江市附近,由右岸汇入黑龙江。松花江总长:嫩江源合计为2 309 km,第二松花江源合计为1 897 km,干流长939 km,分为上游、中游、下游。采样断面示意图见图1。

注:底图源自中华人民共和国1∶400万自然地理版(南海诸岛),下载地址https://219.238.166.215/mcp/default. html,下载日期2008-06-28,审图号GS(2008)1373号。

2 研究方法

2.1 主成分分析-多元线性回归

主成分分析-多元线性回归(PCA-MLR)是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。主成分分析是一种多元统计数学方法,用其可以解析数据集合,压缩数据维数,分析多个变量之间的关系,其目的在于对大量观测数据使用较少的有代表性的因子来说明众多变量的主要信息。之后对选出的主成分因子进行多元线性回归,其目的是确定不同污染源对样品的百分数贡献率[4]。该方法适合污染源数目较少的源定量解析,尤其是对于那些难以得到其污染源指纹谱的源解析问题。

2.2 研究区域及数据处理

数据来自2009年5月对松花江主要现有国控和省控监测断面的PAHs监测数据,此时松花江处于平水期。检测指标为USEPA优先控制的16种PAHs,共设14个监测断面,数据来源于2007年“水体污染与治理国家科技重大专项”子课题1“松花江水环境特征与水污染控制总体方案研究”,其监测断面及测定值见表1。

表1 监测断面及监测数据表 ng/L

在因子分析过程中,为使因子分析能够均等地处理每一个原始变量,消除由于数值间差别较大而可能带来的一些不合理的影响,在进行主成分因子分析前,需要将各采样点的浓度数值进行标准化处理(其中未检测出的数值用均值代替),按式(1)进行原始数据的标准化计算:

(1)

3 结果与讨论

进行多元线性回归分析时,经常碰到自变量之间强相关的问题,即多元共线问题。主成分分析法则是解决这类问题的好办法,可通过主成分回归来求回归系数。主成分回归是将原自变量的主成分代替原自变量进行回归分析,主成分既保留了原指标的绝大部分信息,又有主成分之间互不相关的特点。所以本分析先采用多元回归分析,进行共线性诊断,再进行主成分分析确定所需主成分个数,最后进行主成分回归分析。

3.1 多重回归分析及共线性诊断

模型拟合优度情况:相关系数Ra为0.949a(a表示对原始数据经过标准化处理之后进行的回归分析,下同),决定系数R2为0.922,R2修正系数为0.882,模型总体的假设检验结果见表2,模型总体拟合良好(R2=0.922),方差分析表显示结果有统计学意义(Sig=0.000)。参数估计及其假设检验结果,模型总体拟合良好,有统计学意义,自变量不存在共线性。

表2 模型方差分析

3.2 主成分分析

通过KOM和Sig检验,得出KMO达到0.85,Sig为0,表示数据取自正态分布,认可了变量之间的相关性,适合进行因子分析。根据Kaiser标准,提取的因子特征值应大于1。从表1可以看出,符合此标准的前2个因子解释了总方差的98.216%,说明提取前2个因子作为主因子合理。水相16种PAHs主成分分析的因子特征值及方差贡献率、因子荷载矩阵分别见表3和表4。

表3 因子特征值和方差贡献率

表4 因子载荷矩阵

第2个主因子F2:其中荧蒽的荷载明显高于其他化合物,芘荷载虽不突出但较其他物质荷载差异明显。有学者研究发现[11],荧蒽和芘主要源于工业燃煤和民用燃煤,因子2可归为燃煤污染源。

3.3 主成分多元现行回归分析

以主成分分析得到的2个因子作为自变量,将样品中16种 PAHs 的总量作为因变量,进行多元线性回归,获得的回归方程的标准化回归系数可以反映各主因子,即各主要污染源的相对贡献率,应用多元线性回归之前先判断数据是否满足线性回归的条件。模型拟合优度情况:相关系数R为0.962a,决定系数R2为0.936,R2修正系数为0.912。

表5是对整个模型的检验结果,它是一个方差分析表。由表5可知,所拟合的回归模型F值为3.472,Sig为0.000,因此拟合的模型是有统计学意义的。

表5 模型方差分析

由此可知,数据的模拟过程满足线性回归的条件,回归结果如式(2)所示。利用公式(3)计算各种污染源的贡献率,其中化石燃料的燃烧源和交通污染源为松花江水体中PAHs的主要污染来源,其贡献率为63.1%,其次为工业和民用燃煤污染源,贡献率为36.9%。

(2)

(3)

式中x1、x2分别代表第1主因子和第2主因子的因子得分,Bi为某因子i的质量浓度。

4 结论

应用主成分分析-多元线性回归方法对松花江全流域14个主要国控和省控监测断面中的16种PAHs进行了污染源解析,得到了松花江全流域水体中PAHs的主要来源,分别为化石燃料燃烧源、交通污染源、工业和民用燃煤污染源。由于研究流域范围较大,每个断面均具有站点特殊性,松花江水体中PAHs的首要的污染源为化石燃料燃烧和交通污染,两者的合计贡献率为63.1%,松花江全流域为化石和石油燃料的复合PAHs污染,沿江的石化、石油基地、大型焦化厂、电厂都是PAHs的主要来源。基于松花江所在地域,地域供暖期较长,加之老工业基地的特点,全流域水相中PAHs的第二大污染源为工业和民用燃煤污染,贡献率为36.9%。

结合松花江全流域沿江的工业和企业分布,对松花江全流域水相中的PAHs进行分段研究,并针对各段的特点,对污染源类别进行细化分析。同时针对松花江全流域PAHs污染问题,应进一步对水体悬浮颗粒物及沉积物中的PAHs污染状况进行对比研究,同时应在“十三五”期间对松花江全流域各监测断面的PAHs污染物值进行重新测定,对比PAHs污染物随时间推移其变化情况,为松花江全流域PAHs的控制和治理提供科学依据。

[1] 郭伟,何孟常,杨志峰,等.松花江吉林-哈尔滨段表层沉积物中多环芳烃的季节分布和来源[C]∥余刚.持久性有机污染物论坛2006暨第一届持久性有机污染物全国学术研讨会论文集.北京:中国环境科学出版社,2006.

[2] 王东辉.松花江水体中多环芳烃污染物的污染研究[J].环境科学与管理,2006,31(9):69-70,73.

[3] 史鑫源,李一凡,张宝杰.松花江哈尔滨市区段水体中PAHs污染状况研究[C]. 余刚.持久性有机污染物论坛2007暨第二届持久性有机污染物全国学术研讨会论文集.北京:中国环境科学出版社,2007.

[4] 刘颖.上海市土壤和水体沉积物中多环芳烃的测定方法、分布特征和源解析[D].上海:同济大学,2008.

[5] MATT F,SIMCIK,STEVEN J,et al.Source apportionment and source/sink relationships of PAHs in the coastal atmosphere of Chicago and Lake Michigan[J].Atmospheric Environment(Oxford,England:1994),1999,33(30): 1 411-1 425.

[6] KHALILI N R,SCHEFF P A,HOLSEN T M.PAH source fingerprints for coke ovebs,diesel and gasoline-engines,highway tunnels,and wood combustion emissions[J].Atmospheric Environment,1995,29:533-542.

[7] LIM L H,HARRISON R M,HARRAD S.The contribution of traffic to atmospheric concentrations of polycyclic aromatic hydrocarbons[J]. Atmospheric Environment,1999,33: 3 538-3 542.

[8] NIELSEN T,JORGENSEN H E,LARSEN J C,et al.City air pollution of polycyclic aromatic hydrocarbons and other mutagens:occurrence,sources and heaith effects[J].Science of the Total Environment,1996,190:41-49.

[9] 张巍,张树才,万超,等.北京城市道路地表径流及相关介质中多环芳烃的源解析[J].环境科学,2008,29(6):1 478-1 483.

[10] LEE J H,GIGLIOTTI G L,OFFENBERG J H,et al.Sources of polycyclic aromatic hydrocarbons to the Hudson River Airshed [J].Atmospheric Environment,2004,38(35): 5 971-5 981.

[11] TIAN F L,CHEN J W,QIAO X L,et al.Sources and seasonal variation of atmospheric polycyclic aromatic hydrocarbons in Dalian,China:Factor analysis with non-negative constraints combined with local source fingerprints[J].Atmospheric Environment,2009,43(17): 2 747-2 753.

The Research of Polycyclic Aromatic Hydrocarbons in the River Based on the Principal Component-Multivariate Linear Regression Analysis

CHEN Feng1,2, MENG Fansheng3, WANG Yeyao1,4, ZHANG Lingsong3, YANG Qi1

1.School of Water Resources and Environment, China University of Geosciences, Beijing 100083, China 2.Department of Architectural Engineering, North China Institute of Aerospace Engineering, Langfang 065000, China 3.Research Center of Water Pollution Control Technology, Chinese Research Academy of Environmental Sciences, Beijing 100012, China 4.China National Environmental Monitoring Centre, State Enviromental Protection Key Laboratory of Quality Control in Environmental Monitoring,Beijing 100012, China

Pricipal Principal Component-Multivariate Linear Regression Analysis (PCA-MLR)was applied to analyze the distribution and sources of polycyclic aromatic hydrocarbons(PAHs) in the surface water from songhua river.Fourteen samples of the Level period were collected from songhua river. Diagnostic ratio analysis illustrated that the songhua river basin as fossil fuel and oil compound pollution of PAHs. The primary sources of PAHs in water songhua river is the burning of fossil fuels and traffic pollution, and both total contribution rate is 63.1%.The second major pollution sources is the industrial and civil coal pollution, and the contribution rate is 36.9%.Petrochemical, oil base along the river, large coking plant, power plants are the main source of PAHs.

Songhua river; water body;Polycyclic Aromatic Hydrocarbon(PAHs);source apportionment;Principal Component Analysis; Multiple Linear Regression(PCA-MLR)

2015-09-07;

2015-11-06

国家水体污染控制与治理科技重大专项(2014ZX07510-001,2014ZX07502-002)

陈 锋(1981-),女, 河北廊坊人,在读博士研究生。

王业耀

X824

A

1002-6002(2016)04- 0049- 05

10.19316/j.issn.1002-6002.2016.04.09

猜你喜欢

松花江污染源线性
渐近线性Klein-Gordon-Maxwell系统正解的存在性
松花江
气相色谱法测定固定污染源有组织废气中的苯系物
线性回归方程的求解与应用
持续推进固定污染源排污许可管理全覆盖
二阶线性微分方程的解法
非齐次线性微分方程的常数变易法
十二五”期间佳木斯市污染源排放状况分析
青海省人民政府关于做好第二次全国污染源普查的通知 青政〔2017〕23号
松花江緑石硯