APP下载

上海市大气污染物时空分布及其相关性因子分析

2021-09-09侯素霞张鉴达李静

生态环境学报 2021年6期
关键词:能见度线性风速

侯素霞,张鉴达,李静

1. 河北科技工程职业技术大学资源与环境工程系,河北 邢台 054000;2. 河北师范大学资源与环境科学学院/河北省环境演变与生态建设省级重点实验室,河北 石家庄 050024;3. 河北交通职业技术学院党政办公室,河北 石家庄 050011

随着中国城市化和工业化进程不断加快,PM10、PM2.5、SO2、NO2、O3等大气污染问题日趋严重(武晓红等,2021)。大气污染不仅影响气候变化、经济和社会发展(De Marco et al.,2019),也对交通安全(Li et al.,2020)及公共健康(Dedoussi et al.,2020)带来极大威胁。2015年全球疾病、伤害和风险因素研究表明,大气污染是造成全球疾病负担,特别是低收入和中等收入国家疾病负担的主要原因(Cohen et al.,2017)。环境颗粒物带来的日益严重的粉尘污染,不仅对全球可持续发展战略产生不利影响,还对居民的健康和寿命产生威胁,大气中 PM2.5质量浓度每增加 10 μg·m−3,全因死亡率将会增加 10%,心血管疾病死亡率会增加 3.76%(Brook et al.,2010)。根据世界卫生组织(WHO)的数据,环境颗粒物污染每年导致西班牙2.5万人过早死亡(Choubin et al.,2020)。一项针对加州大气污染与新型冠状病毒(COVID-19)疫情相关性的研究表明,PM10、PM2.5、SO2、NO2等环境污染物与加州COVID-19疫情存在显著相关性(Bashir et al.,2020)。同时,印度、意大利、法国、西班牙等多个国家的研究者均发现在COVID-19大流行中,位于空气污染更严重的地区可能会面临更高的感染及死亡风险(Chakraborty et al.,2020;Conticini et al.,2020;Saez et al.,2020)。除此之外,长期暴露于污染空气中,也会增加各类肺部疾病及呼吸道疾病的发病率及死亡率(Liu et al.,2016)。

近年来,各国研究者已经对PM10、PM2.5、SO2、NO2、O3等大气污染物进行了大量研究。气象条件是影响大气污染物浓度的重要因素之一,日照增强会导致O3浓度的上升。不同地理区域的污染物也会呈现不同的分布特征,由于冬季降雨量少,华南地区的环境颗粒物水平相对较低,同时华南地区由于燃煤量较少,SO2的浓度普遍低于NO2浓度(Xie et al.,2015;沈楠驰等,2020;叶延琼等,2019)。除此之外,大气中各个污染物之间也存在相互影响关系,化石燃料燃烧排放的CO2,SO2等污染物使得大气中更易形成气溶胶微粒,气溶胶微粒使得气候温度下降,从而掩盖了部分温室气体排放造成的变暖效应(Shindell et al.,2019)。然而,剧毒气溶胶微粒的吸入每年会导致数百万人死亡(Cohen et al.,2017)。

为控制大气污染物对生态环境及人体健康带来的危害,除了研究其形成分布特征及影响因素,还应对污染物浓度进行精准的预测。目前国内关于大气污染物浓度预测的研究相对较少,选用的研究方法有多元线性回归,随机森林模型等。BP神经网络作为一种自适应信息处理方法,在拟合复杂的环境系统方面展现了出色的能力,能够发现离散和噪声相加数据之间的高度非线性关系。

上海市作为中国的经济中心,其空气质量问题一直受到各界广泛关注。本文对上海市2016—2020年的大气主要污染物(PM2.5、PM10、SO2、NO2及O3)质量浓度进行分析,探究各污染物随时间的年度变化、月度规律及星期效应。利用多元线性回归模型及BP神经网络建立污染物与气象因素之间的相关关系,并对其浓度进行预测,分析对比不同模型的预测结果,以期为上海市及周边地区大气污染协同治理提供理论依据。

1 方法

1.1 数据来源

本文从上海市生态环境局上海空气质量发布平台(https://sthj.sh.gov.cn)上收集了2016年1月1日—2020年12月31日上海市19个空气质量监测站点的 PM2.5、PM10、SO2、NO2及 O3的日均质量浓度(μg·m−3)。2016—2020 年上海市气象参数来自气象数据共享平台(https://rp5.ru/),每日气象数据包括温度(℃)、相对湿度(%)、平均风速(m·s−1)和水平能见度(km)。

1.2 数据处理

由于 PM10在监测过程中包含 PM2.5,故 PM10的日均质量浓度理论上应大于PM2.5的日均质量浓度,但实际监测过程中,受到监测仪器及监测环境的影响,数据中可能会出现“PM2.5和PM10倒挂”点(即PM2.5日均值>PM10日均值),后期数据处理过程中将倒挂数据剔除得到PM2.5、PM10、SO2、NO2及O3的日均质量浓度各1512个数据点。

1.3 皮尔逊(Pearson)相关系数法

皮尔逊相关系数(r)是用来反映两个变量线性相关程度的统计量,r的绝对值越大则表明相关性越强。根据文献(Xie et al.,2015),本研究基于2016年1月1日—2020年1月2日1512个监测点的数据,通过皮尔逊相关系数建立了各污染物、污染物与气象因素之间的相关关系。

1.4 多元线性回归模型

多元线性回归(MLR)模型是一种已在全球范围内广泛使用的空气污染预测方法(Abdullah et al.,2020)。在大多数研究,尤其是颗粒物和臭氧研究中,它能够对主要污染物的浓度进行适度准确的预测。该模型能通过简单的计算和易于实现的方法来表示因变量(气态污染物)与几个独立变量(气象因素)之间的关系(Zhao et al.,2018;Liao et al.,2021)。多重共线性表示的是各个自变量之间的相关关系,由于较高的共线性会使模型的预测功能失效,因此在多元线性回归分析之前应对自变量进行多重共线性诊断,剔除有显著共线性的自变量。

本研究首先运用方差膨胀因子(VIF)对气象因素(温度、相对湿度、平均风速、水平能见度)进行多重共线性检验。VIF>10表明自变量间存在多重共线性,当VIF<10表明自变量间不存在多重共线性。其次,利用SPSS软件,在95%的置信区间,对上海市大气污染物中的PM2.5、PM10及O3浓度与气象因素(温度、相对湿度、平均风速、水平能见度)之间的相关性及相关程度进行多元线性回归分析。最后,通过均方误差(RMSE)对模型准确度进行评估,具体计算如公式(1)所示:

式中:

1.5 BP神经网络模型

如图1a所示,人工神经网络是模仿生物神经系统的功能和结构发展起来的信息处理系统,是由大量简单地神经元相互连接构成的复杂网络系统,包括输入层、隐藏层和输入层,对非线性系统具有很强的模拟映射能力。图1b为神经元工作机理,神经元X0通过树突赋予权重W0,每个神经元经过累加,最后通过激活函数,获得单个神经元的输出结果。

图1 人工神经网络(a)及神经元工作机理(b)示意图Fig. 1 Artificial neural network inversion (a) and mechanism of neural unit (b)

2 结果与讨论

2.1 PM2.5、PM10、SO2、NO2和 O3的时间分布特点

2.1.1 各污染物的年度变化

2016—2020年上海市空气 PM2.5、PM10、SO2、NO2及 O3年平均质量浓度变化如图2所示。2016年 PM2.5、PM10、SO2、NO2及 O3年平均质量浓度分别为 44.07、62.81、13.69、42.16 和 71.51 μg·m−3,2020年分别为25.03、40.82、6.00、34.99和70.74 μg·m−3,整体均呈现出下降趋势。这主要归因于近年来上海市政府的积极号召及有关环保部门的努力配合,使得上海市的大气环境治理初见成效,空气质量有了明显改善。自《大气十条》实施以来,国家及各地区对可吸入颗粒物的防治力度明显加大,图中显示上海市PM2.5、PM10年平均质量浓度逐年下降趋势较为明显,防治效果显著。根据《环境空气质量标准》(GB 3095—2012),PM10的年均一级质量浓度限值为 40 μg·m−3。由此可见,到 2020年,上海市 PM10的年平均质量浓度已基本达到标准要求。

图2 2016—2020年上海市PM2.5、PM10、SO2、NO2及O3质量浓度年变化Fig. 2 Annual variation of the concentrations of PM2.5, PM10, SO2,NO2 and O3 in Shanghai from 2016 to 2020

NO2及O3年平均质量浓度在2016—2017年间呈现上升趋势,NO2年平均质量浓度随年份变化波动较大。近5年来,O3年平均质量浓度在2017年达到最大的 78.57 μg·m−3,2017—2019 年逐年下降后,2020年又略有升高。除此之外,图2中还显示出,随着可吸入颗粒物的控制、浓度的下降,O3已逐渐成为上海市大气环境的主要污染物,也成为危害人体健康的主要污染物。已有研究表明,O3污染的健康风险比PM2.5更高(郭云等,2021)。因此,未来应加强对大气中 O3的防治和减排,以保证居民生命健康。

2.1.2 各污染物的月度规律

2016—2020年上海市空气 PM2.5、PM10、SO2、NO2及 O3月平均质量浓度变化如图3所示。图中显示,PM2.5的月平均质量浓度全年变化整体呈“V”型分布,从一月开始基本呈现下降趋势,极小值多集中8—10月,10—12月浓度又逐步上升,表现出明显的季节差异,即PM2.5在冬季月份平均质量浓度较高,夏季月份平均质量浓度最低。与上海市相似,陈兵红等(2021)在研究浙江省的 PM2.5浓度分布时也发现了冬高夏低的明显季节差异。PM10月平均质量浓度在1—5月呈现增长趋势,5—9月逐渐降低到最低值后开始增长,质量浓度最高值也出现在冬季,最低值出现在夏季。Liu et al.(2019)研究发现由于冬季频繁的近地表温度逆温不利于气溶胶污染物在地表边界层的扩散和迁移,从而导致了严重的气溶胶污染。逆温现象影响了气溶胶污染物的迁移扩散,导致PM2.5、PM10的质量浓度值在冬日处于较高水平。逆温现象不仅会影响可吸入颗粒物的迁移扩散,也会影响大气中 NO2的迁移扩散。图中可以看出,近5年来,上海市NO2月平均质量浓度也呈现出冬高夏低的“V”型分布(Wallace et al.,2009)。

图3 2016—2020上海市PM2.5、PM10、SO2、NO2及O3质量浓度月度变化Fig. 3 Month variation of the concentrations of PM2.5, PM10, SO2, NO2 and O3 in Shanghai from 2016 to 2020

O3作为近年来上海市大气主要污染物,极大值多集中于5—6月,整体呈现夏季浓度高,冬季浓度低的趋势。这是由于城市地区地表 O3合成的主要前驱体是氮氧化物(NOx)和挥发性有机物(VOC),冬季可吸附颗粒物污染更为严重,浓度较高,大气能见度较低,削弱了辐射强度,同时冬季气温偏低,均不利于NOx和VOC反应合成O3(Ueno et al.,2019)。2016—2020年O3平均质量浓度最高月份及其浓度值分别为 5 月(100.95 μg·m−3),7 月(103.77 μg·m−3),6 月(103.64 μg·m−3),5 月(99.22 μg·m−3),5 月(96.19 μg·m−3)。虽然高温和强辐射有利于 O3的产生,但图中可以观察到,除2017年外,其余年份上海市空气 O3月平均浓度变化趋势均呈现相似的“M”型分布,在气温最高的7—8月均出现了下降,这表明除了受到气温和辐射的影响,人类活动及工业生产等其它因素也可能会对大气中 O3浓度产生显著影响(Xie et al.,2015)。

2.1.3 各污染物的周变化趋势

2016—2020 年上海市空气 PM2.5、PM10、SO2、NO2及O3质量浓度周变化趋势如图所示。其中,SO2质量浓度最低,其浓度在周内随日期波动较小。2016年,PM2.5、PM10、SO2周内平均质量浓度变化趋势相似,周二至周五浓度上升,周五为污染物浓度极大值点(PM2.5:53.1 μg·m−3,PM10:70.64 μg·m−3,SO2:15.04 μg·m−3),周五至周一浓度下降。NO2(43.25 μg·m−3)及 O3(74.57 μg·m−3)的浓度极大值分别为周三和周二。2017年,O3的平均质量浓度在周六最高(84.77 μg·m−3),PM2.5(39.06 μg·m−3)和PM10(61.69 μg·m−3)浓度最大值点均在周日,周五则是 SO2(11.29 μg·m−3)和 NO2(45.22 μg·m−3)的质量浓度最高点。2019年PM2.5、PM10、SO2、NO2及O3的质量浓度最大值点分别出现在周日(31.15 μg·m−3)、周四(54.11 μg·m−3)、周二(6.55 μg·m−3)、周二(41.66 μg·m−3)及周日(74.56 μg·m−3)。2018及2020年各污染物质量浓度的极大值点均在周内。不难看出,大多数污染物浓度最高值都出现在工作日,这与工作日人们的外出频率、出行方式及次数等社会因素有关。由于社会因素、人为因素的不确定性,同时也导致了污染物在一周内的变化规律不是很明显。

图4 2016—2020上海市PM2.5、PM10、SO2、NO2及O3质量浓度周变化Fig. 4 Weekly variation of the concentrations of PM2.5, PM10, SO2, NO2 and O3 in Shanghai from 2016 to 2020

2.2 各污染物和气象因素之间相关性分析

利用python和可视化安装包seaborn探讨了从2016—2020年各因素(各污染物和气象参数)之间的相关性及分布情况。图5为各参数(污染物和气象参数)层次热力图。

图5 层次热力图:各参数相关性分析Fig. 5 Correlation analysis of various parameters among the heatmap

由图5可知,可吸入颗粒物(PM2.5、PM10)质量浓度与 NO2质量浓度之间存在显著的正相关关系,这是因为大气中的 NO2会经一系列反应生成NH4NO3铵盐,而铵盐正是PM2.5的主要成分之一,致使可吸入颗粒物质量浓度升高(Zhang et al.,2021)。O3质量浓度与NO2质量浓度之间的相关系数为−0.345,呈现显著的负相关关系,O3质量浓度与PM10质量浓度之间的相关系数为0.076,呈正相关关系,而O3质量浓度与PM2.5质量浓度之间的相关系数为0.006,其没有显著的相关关系。针对气象因素(温度、湿度、风速和可见度)而言,除了温度与平均风速之间不存在显著的相关性,其余气象因素之间均存在显著的相关关系。温度与相对湿度、水平能见度之间的皮尔逊相关系数分别为0.191和0.230,存在显著的正相关关系;相对湿度与平均风速、水平能见度的皮尔逊相关系数分别为−0.085和−0.302,存在显著的负相关关系;平均风速与水平能见度之间也存在显著的正相关关系(0.227)。图5显示,NO2质量浓度主要与风速呈负相关关系,其相关性为0.6;O3质量与温度之间的相关系数为正值,表明大气污染物中的O3质量浓度与温度呈正相关关系,此结果与国内外许多学者研究一致。

2.3 模型预测

2.3.1 多元线性模型

通过多元线性回归分析上海市5年来的气象因素(温度CT、相对湿度CRH、平均风速CAWS、水平能见度CHV)与 PM2.5、PM10、NO2、O3之间的相关关系如表1所示。其中,VIF所示为各气象因素之间的多重共线性诊断,VIF均小于10,表明各气象因素之间不存在多重共线性。

表1 多元线性回归模型Table 1 Multiple linear regression models

多元线性回归分析表明,上海市的PM2.5及NO2质量浓度与各气象因素均呈负相关,即随着温度升高、相对湿度的增加、平均气压及水平能见度的增大而减小,相对湿度,平均风速及水平能见度对PM2.5质量浓度有显著影响。NO2质量浓度则受到4种气象因素的显著影响。多元线性回归分析显示PM10质量浓度与温度之间显著性水平为0.303,意味着温度对上海市大气 PM10质量浓度并没有产生显著影响,而相对湿度、平均气压及水平能见度则对PM10质量浓度产生了显著性影响,PM10质量浓度随相对湿度的增加、平均气压及水平能见度的增大而减小。O3质量浓度与温度和平均风速呈正相关,与相对湿度和水平能见度呈负相关。

污染物实测值与预测值的线性拟合如图 6所示,PM2.5、PM10、NO2、O3的调整r2分别为 0.593、0.506、0.595、0.316,均方根误差(RMSE)分别为14.44、20.73、23.79、11.72。说明多元线性回归模型虽然能够解释各污染物与气象因子之间的相关关系,但其预测的污染物质量浓度的精确度较差。

图6 多元线性回归模型实测值和预测值线性拟合图Fig. 6 Linear fitting diagram of the measured and predicted values with the multiple linear regression model

2.3.2 基于BP神经网络的污染物质量浓度预测

图7所示为神经网络预测PM2.5,PM10,NO2和O3质量浓度训练过程中迭代次数与均方误差关系。迭代次数也是BP神经网络训练过程中重要的参数之一。每一次迭代都将更新一次权重,进而运算到损失函数,最后在BP算法中更新参数。图7为不同迭代次数下BP神经网络均方差分布情况。由图7可知,当迭代次数为43次时,BP神经网络训练集和测试集都达到收敛状态,且均方误差在测试集最大值都为0.15。

图7 BP神经网络预测污染物过程中迭代次数与均方误差关系Fig. 7 The relationship between the iteration times and the MSE in the prediction process of air pollutions using BP neural network

通过BP神经网络对各污染物进行预测,实测值与预测值的相关性r2如图8所示,PM2.5、PM10、NO2、O3的 r2分别为 0.986、0.974、0.976、0.983。因此,相比多元线性回归法,BP神经网络根据气象参数预测污染质量物浓度具有更高的准确性,说明BP神经网络在预测污染物质量浓度表现出强大的泛化能力。

图8 BP神经网络预测PM2.5、PM10、NO2、O3性能表现Fig. 8 Performance of concentration prediction of PM2.5, PM10, NO2, and O3 with BP neural network

3 结论

(1)2016—2020年上海市大气污染物PM2.5、PM10、SO2、NO2及O3质量浓度随时间变化整体呈现下降趋势,同时季节变化差异显著,PM2.5及PM10质量浓度呈“冬高夏低”,而O3质量浓度呈“冬低夏高”。

(2)可吸入颗粒物(PM2.5、PM10)质量浓度与SO2、NO2质量浓度之间具有显著相关性,O3质量浓度与 NO2质量浓度之间也存在显著的相关关系。

(3)多元线性回归分析表明相对湿度、平均风速及水平能见度 3个气象因素会对上海市 PM2.5、PM10质量浓度产生显著影响;温度、相对湿度、平均风速及水平能见度 4个气象因素会对上海市 O3质量浓度产生显著影响。

(4)相比多元线性回归法,BP神经网络根据气象参数预测污染物质量浓度具有更高的准确性,表现出强大的泛化能力,PM2.5、PM10与NO2、O3真实值与预测值相关系数分别为98.6%、97.4%、97.6%和98.3%。

猜你喜欢

能见度线性风速
能见度仪在海陀山的应用
邯郸市近46年风向风速特征分析
天津市东丽区低能见度事件特征分析
线性回归方程的求解与应用
基于最优TS评分和频率匹配的江苏近海风速订正
基于时间相关性的风速威布尔分布优化方法
二阶线性微分方程的解法
非齐次线性微分方程的常数变易法
ℝN上带Hardy项的拟线性椭圆方程两个解的存在性
南京市气溶胶和相对湿度对能见度的影响