APP下载

函数型数据视角下湖北省大气污染物特征分析

2021-08-24胡二琴穆新宇

湖北工业大学学报 2021年4期
关键词:均值变异空气质量

魏 玉, 胡二琴, 穆新宇

(湖北工业大学理学院, 湖北 武汉 430068)

大气中高浓度的NO2与氨、水分等在日照等条件下会产生化学反应生成臭氧等二次污染物,不仅严重影响空气质量,而且危害环境效益[1-2],是我国及欧美国家环保部门监测的主要大气污染物。研究发现,长时间暴露在富含高浓度NO2或O3大气环境中,极易导致人群尤其是儿童和老人产生肺部及呼吸系统疾病[3-4]。随着经济的快速发展,我国已经成为全球氮氧化物污染最为严重的地区之一[5-6]。

2017年国家环保部城市质量报告显示,74个实施新标准第一阶段监测的城市中,湖北省武汉市空气质量综合指数排名48,在74个城市中处于下游。湖北省环境质量公告显示,按照《环境空气质量标准》(GB 3095—2012)评价,除神农架以外,2016年至2018年全省其余城市空气质量均未达到二级标准,其中2017年NO2浓度较2016年上升7.7%,O3浓度与2016年持平;2018年,NO2浓度与2017年持平,O3浓度值较2017年上升10.8%。由此可以看出,湖北省治理大气污染问题已刻不容缓。

不少学者已对我国空气质量进行了探究[5,7-14],但大多数是基于传统的统计方法,少有从函数型数据尤其是多元函数型主成分的角度对湖北省的空气质量进行分析。由于空气质量及其相关指标具有函数特征,所以本文从函数型高维数据的角度,采用函数型二元主成分挖掘出相互影响的两种污染气体之间的联合变异方式,最大程度地利用变量之间的关系以及数据提供的信息,这样,根据分析结果去制定相应治理方案会更加准确有效。

1 数据处理

1.1 数据情况

原始数据采自中国环境监测总站。选取湖北省12个省辖市和1个自治州共13个行政区的大气NO2与O3日均浓度数据,时间跨度为2018年10月21日至2019年10月20日,共365天。数据状态良好,每个城市365天的数据缺失值均少于8个,采用该缺失值的相邻前后共4天数据的平均值进行填补。

1.2 曲线拟合

(a)NO2

(b) O3图 1 湖北省13个城市大气中NO2和O3变化趋势

湖北省13个城市大气中NO2和O3变化趋势如图1所示。采用傅里叶基函数对原始数据进行惩罚拟合,通过广义交叉验证法(GCV)确定基函数个数为21个。从图2可见,武汉空气中NO2的含量全年都明显高于其他城市,而咸宁市和孝感市的NO2含量较低。总的来看,湖北省13个城市NO2含量在冬天要更高一些,并且在2月份的时候浓度有一个明显的低谷区域。O3情况恰好与NO2相反,夏季空气中的含量要明显高于冬季,这是因为夏季尤其中午光线较强的时候,光化学反应会更加剧烈空气中O3含量会更高。13个城市中大气中O3含量较低的城市是恩施市。春夏秋三季的O3浓度要高于冬季,但是在7、8两个月O3浓度较低,形成了一个明显的波谷。

(a)NO2

(b)O3图 2 各城市NO2与O3的拟合数据

2 二元函数型主成分分析

2.1 二元函数型主成分

设有两个相互联系的函数型变量(随机函数)x(s)和y(s),s∈T,假设x(s)和y(s)的N次观察分别为xi(s)和yi(s),i=1,2,…,N,s∈T,且二维向量函数mi(s)=(xi(s),yi(s))′。定义x(s)和y(s)主成分权函数为向量函数ξ=(ξ(x)(s),ξ(y)(s))′,其中ξ(x)(s)和ξ(y)(s)分别表示x(s)与y(s)各自的主成分权函数,本文称之为边缘权重函数。定义两个函数型变量的第j个主成分得分

(1)

x(s)和y(s)各自的方差函数记为vxx和vyy,x(s)和y(s)的交叉协方差函数记为vxy(s,t)=cov(x(s),y(t))(t,s∈T)。

与一元随机函数的主成分分析过程类似,二元函数型主成分分析也可以转化为特征方程的求解问题,具体表示为[15]

(2)

(3)

(4)

(5)

2.2 二元主成分权函数的求解

(6)

(7)

进一步,令b(1)*=W1/2b(1),b(2)*=W1/2b(2),γ*=[(b(1)*)T,(b(2)*)T],并带入式(6)可解出γ*,之后就可求出b(1)、b(2),将其带入ξ(x)(s)和ξ(y)(s)的基函数展开式即可得到x(s)和y(s)的权函数ξ(x)(s)和ξ(y)(s)。

3 模型应用

3.1 联合主成分分析

参与O3光化学反应的氮氧化物以NO2为典型代表,所以在实际的空气监测中,O3和NO2大部分时刻是呈现相互转化的情况。因此相对于一元函数主成分分析来说,将这两个变量作为一个整体来进行二元函数型主成分分析会更加科学可靠。

(a)NO2

(b)O3图 3 NO2和O3的特征函数

图3展示了对数据进行联合主成分后提取的NO2和O3前三个特征函数即权函数。黑色实线代表第一主成分权函数,记为PC1;红色虚线和绿色虚线分别代表第二、三主成分权函数,记为PC2和PC3。NO2的3个主成分依次解释了秋季、春夏、秋冬时期对大气中NO2波动特征的贡献;O3的3个主成分依次解释了夏秋、春季、秋季时期对大气中臭氧波动的贡献。为了更加清楚地展示权函数对于均值函数的影响,绘制联合主成分权函数偏离均值函数的效果图(图4),即在同一图中绘制三条曲线,中间由黑色实心点绘制的曲线为13条拟合曲线的均值函数曲线,由“+”构成的曲线是在均值曲线的基础上加上权函数的适当倍数绘制而成,相对地由“-”构成的曲线是在均值曲线的基础上减去权函数的适当倍数绘制而成,这里倍数数值等于权函数对应的特征值开平方后的数值。“+” 、“-”形成的曲线可以理解为湖北省13个城市大气中NO2和O3全年含量的变化特征,前3个联合主成分的累积贡献率达到90.7%。其中:主成分1刻画了NO2秋季和O3夏秋季的变动趋势,解释了变动特征的55.8%,是这两种污染气体随时间变化的主要方式;主成分2刻画了NO2春夏和O3春季的变动趋势,解释了变动特征的24.9%,是两种污染气体随时间变化的第二方式;主成分3刻画了NO2秋冬和O3秋季的变动趋势,其解释能力为10%。

(a)主成分1(1)

(c)主成分2(1)

(d)主成分2(2)

(e)主成分3(1)

(f)主成分3(2)图 4 NO2与O3的联合主成分

3.2 函数型主成分联合变异分析

在二元情况下显示联合主成分的有效方法是构造一个变量与另一个变量的关系图(图5)。图中,以NO2和O3两个变量的均值作为横纵坐标即可得到联合均值曲线,在均值曲线的基础上加上联合主成分权函数倍数,得到联合主成分权函数对平均水平的影响情况,线段的角度反映在不同时间点两个变量对均值曲线影响的强弱区别。通过计算NO2和O3的特征函数占两者总特征函数的比例,可得NO2和O3分别对于第一联合主成分变异程度的贡献。

第一步观察红色数字组成的曲线。它表示两变量在区间内的平均水平(即为联合均值曲线),数字大小表示均值曲线在一年中的走势情况。一月初NO2浓度达到峰值,可以看到NO2浓度达到最大的时候反而是臭氧浓度的最小值点,接着NO2浓度降低并在8月达到最小值,O3浓度在9月取得最大值,但是产生的O3累计到秋季初才达到峰值。符号“+”构成的曲线是在均值函数的基础上加上联合主成分权函数的若干倍后得到,并用蓝色线段将其连接。

从2018年10月开始,箭头指向右上方,第一联合主成分对均值函数有正向影响,6月箭头方向由右偏到左边,联合主成分对于NO2的作用由正向变为负向;9月之后第一联合主成分对于NO2的影响又转为正向,并且保持该状态直至结束,在这期间效应是逐渐凸显的,反映在蓝色线段慢慢加长。通过计算可以得到,NO2和O3两个变量的变化对于第一联合主成分变异的贡献率分别为2.36%和97.64%。因此第一联合主成分的变异绝大部分来自与臭氧的变异贡献。

第二联合主成分变异主要来自NO2,箭头方向基本指向右方,计算得NO2和O3对于第二联合主成分的贡献率分别为70.4%和29.6%。从数字“1”开始(即2018年10月份开始到2019年6月)箭头一直指向右方偏下的位置,这个过程中第二联合主成分对臭氧存在微弱的负向作用;7月份主成分对O3的负向影响变为正向,但效果依然微弱;该影响在10月转回负向,并保持直至结束。整个过程中第二联合主成分都对NO2保持较为强烈正向作用。

(a)第一主成分

(b)第二主成分

(c)第三主成分图 5 前3个主成分的联合变异效果

第三联合主成分的变化形式相对于前两个联合主成分来说较为复杂,NO2和O3对于第三联合主成分的贡献率分别为22.9%和77.1%。曲线刚开始有微弱负向影响作用于O3,但很快转为正向,并且随着春季的到来,该影响逐渐加强,NO2在上述过程中一直是受到联合主成分的正向作用;联合主成分对NO2的作用在5月完成由正到负的转换,而且对O3的正向影响也变弱,但是该状态维持时间很短,6月初时箭头又指回右上方;8月份及以后,联合主成分对于O3保持负向影响,对NO2施加正向作用直至结束。

通过对NO2和O3进行二元联合主成分分析发现,春夏两季NO2的变动为其全年变异的主要方式,夏秋两季则为臭氧变动的主要方式。因此根据全年变异程度的不同,针对性地选择时间段进行大气治理会得到较好的效果。

3.3 基于函数型主成分的K-均值聚类

在利用二元函数型主成分分析对13个城市空气质量变化曲线族进行分析之后,得到NO2和O3的主要变异方式,但是由于每个城市大气中这两种气体的污染程度是不同的,因此采用K-Means聚类对主成分得分对城市进行分类,聚类结果绘制如图6所示。

图 6 K-均值聚类结果

聚类结果显示NO2的污染主要集中在个别受工业污染与城市汽车尾气排放影响比较突出的大中型城市,如武汉、宜昌、鄂州、黄石等地区。第一类的恩施市和十堰市是空气质量较优的,相较于其他11个城市,这两个城市大气中的NO2和O3都是低于平均值的;第二类属于居中水平,被聚到该类的5个城市具有一个普遍的特点就是大气中的O3浓度高、NO2浓度低或是居中水平;最后一类的6个城市,是三类中空气质量最不好的,NO2浓度高、臭氧浓度高或是处于居中水平,治理任务重。

分类后总体可以概括如下:NO2和O3低;O3高但NO2中等或低;NO2高且O3高或中等。对于污染最严重的第三类城市来说,需要专注于春夏两季NO2和夏秋两季O3的治理,污染程度中等的第二类城市则应该先投入到夏秋季O3的治理,由于第一类城市空气质量最优,其余城市可参考第一类城市的大气治理方案,比如恩施地区在构建鄂西生态旅游圈过程中注重旅游业发展,并且烟气脱硝使得减排改善效果明显。

3 结束语

对近一年湖北省大气中NO2和O3浓度数据做二元函数型主成分分析,不仅能够反映各个城市各个时期的空气质量,而且能够反映相互联系的变量之间的联合变异情况。对联合主成分图和联合变异图进行分析后,得出全年中NO2和O3的主要变异时期,同时对主成分得分进行聚类发现,湖北省空气污染在高原和山地较轻,污染主要集中于平原地区。根据分类结果,再结合两个污染气体的主要变异时期,即可对不同地区量身定制治理计划。

猜你喜欢

均值变异空气质量
乌海市雾对空气质量的影响
变异
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
浅谈均值不等式的应用
均值不等式的小应用
变异的蚊子
病毒的变异
应用均值定理“四”注意
形的变异与的主题