APP下载

宁夏沿黄城市群大气复合污染物关联规则挖掘2.5质量浓度为例
——以污染季PM

2021-07-28胡秋灵

关键词:置信度城市群空气质量

胡秋灵, 郭 帅

(陕西师范大学 国际商学院,陕西 西安 710119)

近年来,我国经济社会的高速发展带来了不可忽视的环境污染问题,北方地区作为我国空气污染的重灾区,PM2.5污染日益严重.环保部的公报显示[1],2016年,在全国338个地级及以上城市中,仅有24.9%城市的空气质量达到标准.338个城市共发生重度污染2 464天次、严重污染784天次,可吸入颗粒物(PM2.5,PM10)是我国空气污染的主要污染物.持续性的污染天气极大地危害着居民的身体健康[2],而城市群作为我国城市化和工业化的核心区域,面临着更大的环境压力[3].在城市群空气污染研究领域,我国学者更多地关注京津冀城市群[4—5]、长三角城市群[6—8]和珠三角城市群[9—10],也有少部分学者对山东半岛城市群和辽宁中部城市群的灰霾污染进行了研究[11—12],但绝大多数的城市群都位于我国中东部地区,有关西部城市群的研究较少.其次,在空气污染的研究过程中,关于污染物的时空特征、成分特征与来源解析[13]、影响因素与传导的研究较多[14—15],缺乏对污染物浓度和污染物之间相互关系更深层次的挖掘.基于以上两点,并考虑PM2.5污染对于人体健康以及气候变化的影响,笔者以位于我国西部地区的宁夏沿黄城市群为研究对象,借助空气质量指数(AQI)大数据对城市群污染季PM2.5质量浓度进行统计的同时,利用大数据算法对PM2.5与大气中其他污染物之间的关联规则和序列模式进行挖掘,以期为我国西部城市群的大气污染防治研究提供参考.

1 宁夏沿黄城市群及样本AQI数据

宁夏沿黄城市群位于黄河上游河谷平原,是中国地势第一阶梯向第二阶梯的过渡地带.城市群以银川市为中心,还包括石嘴山、中卫、吴忠3个地级市及其所属部分区县,主体位于宁夏的中部及北部,因4个主要城市依黄河沿岸分布故而得名沿黄城市群.城市群内部4个主要城市间距为55~200 km,交通运输工具的便利性以及运输网的通达性使各城市之间联系紧密,共同构成一个相对完整的城市集合体.此外,各城市除联系紧密外,还拥有相似的产业结构,其煤炭开采、有色冶炼加工、机电、建材、医药等产业均在我国西部地区处于领先地位、区域竞争力强.不同于我国其他西部城市群,宁夏沿黄城市群是唯一一个几乎覆盖整个省域的开放型经济试验区.可以说,宁夏沿黄城市群具备成为我国西部地区经济增长极的基本条件,其规模效应和带动效应明显,城市群的建设可对当地经济发展起到显著的促进作用[16].

宁夏作为“一带一路”发展战略中的沿线少数民族区域之一,为宁夏沿黄城市群提供了重要的发展机遇,使城市群的经济高速协同发展成为可能,但是,如若在经济发展过程中处理不好其与环境保护之间的关系,就无法保证城市群的可持续发展.在如今雾霾天气频发的背景下,我国治理雾霾天气的主要手段以行政命令为主,例如限制污染性企业产能、限制汽车出行、减少煤炭使用量等.由于不同地区造成空气污染的污染源可能存在着一定的差异,这些“一刀切”似的行政命令,不仅缺乏长远的发展眼光,同时在治理空气污染时也存在着针对性不足的问题,从长远看,对空气污染的治理效率极低.因此,有针对性地挖掘宁夏沿黄城市群空气污染物之间的关联规则,对提高城市群空气污染治理效率有着重要意义.

环保部于2012年发布《环境空气质量标准》(GB 3095—2012)[17],并首次将PM2.5平均质量浓度纳入空气质量标准的考察中.在城市群污染季的确定上,借鉴杨丽蓉等对银川市PM2.5污染特征的研究结果,将每年的10月至次年3月确定为宁夏沿黄城市群的污染季[18].因此,笔者选取宁夏沿黄城市群4个主要城市(银川市、石嘴山市、吴忠市、中卫市)2015—2018年污染季(当年10月至次年3月)的空气质量数据进行研究.城市群污染季PM2.5质量浓度由日度数据计算得出.考虑到分时数据的监测频率更高,便于对污染物之间的相互依存关系进行挖掘,因而在进行复合污染物关联规则挖掘时,使用各样本城市的分时空气质量数据.

2 宁夏沿黄城市群污染季PM2.5的描述性统计规律

2.1 日度PM2.5质量浓度统计规律

《环境空气质量标准》针对大气污染物24 h的平均质量浓度划分了污染等级,以PM2.5为例,具体划分标准如表1所示.

笔者采集宁夏沿黄城市群4个主要城市统计期内的PM2.5质量浓度数据并计算其算术平均值,用以近似代表城市群整体的PM2.5质量浓度水平.城市群污染季PM2.5平均质量浓度约为54.77 μg/m3,超出2级空气质量的0.57倍.城市群污染季各等级PM2.5质量浓度所占比例如图1所示.由图1可知,宁夏沿黄城市群PM2.5等级为优和良的比例分别为27%,54%,即城市群4 a累计PM2.5质量浓度非污染级所占比例为81%,污染级所占比例为19%.在此基础上,对银川市、石嘴山市、吴忠市、中卫市的PM2.5质量浓度日度数据分别进行统计,4个城市PM2.5质量浓度在污染季的平均值分别为54.93,60.06,54.38,49.73 μg/m3,PM2.5质量浓度污染级所占比例分别为18.42%,23.96%,19.11%,15.09%.由此可知,位于宁夏沿黄城市群最北方的石嘴山市PM2.5质量浓度在污染季的平均值和超标率均最高,位于城市群最南方的中卫市的最低,银川市和吴忠市的相关指标较接近.

图1 宁夏沿黄城市群在污染季各等级PM2.5所占比例

2015—2018年,沿黄城市群在污染季年度、月度、日均PM2.5质量浓度变化如图2~3所示.由图2可知,2015—2018年,宁夏沿黄城市群各年污染季的PM2.5平均质量浓度分别为61.11,60.41,52.16,45.08 μg/m3,说明城市群PM2.5的污染程度逐年下降,空气质量呈现逐渐转好的趋势.城市群在污染季各月PM2.5平均质量浓度则表现出明显的先上升后下降的趋势,每年12月及次年1月为PM2.5污染最严重的2个月.主要原因是,宁夏沿黄城市群冬季降水偏少、植被干枯,进入集中供暖期后,化石燃料消耗量大,污染物的大量排放导致空气质量变差;同时,秋冬季节北方地区逆温出现的频率更高、厚度更厚、强度更强,不利于PM2.5这类大气污染物的扩散,进一步加剧了空气污染的程度[19].

图2 宁夏沿黄城市群各年污染季PM2.5平均质量浓度

图3 宁夏沿黄城市群污染季各月PM2.5平均质量浓度

2.2 日内分时PM2.5质量浓度变化规律

大气污染物不仅存在年度、月份之间的差异,其在日内不同时段往往也表现出差异性的特征.对宁夏沿黄城市群在污染季PM2.5日内分时变化情况进行统计(图4).由图4可知,城市群PM2.5质量浓度在一天内表现出明显的双峰特征,第一个波峰出现在9:00~12:00,第二个波峰出现在21:00~23:00.人类有规律的活动可能是PM2.5质量浓度双峰波动的原因之一.在早晨,由于人类活动的影响,汽车尾气排放、路面扬尘开始增加,但较低的气温和较弱的空气对流使污染物无法扩散,污染物的浓度一直累积,因而在中午前浓度达到第一个峰值;随着中午气温的上升,空气流动增强,污染物开始逐渐扩散,浓度降至较低水平;傍晚过后,汽车尾气排放量再次增加,且气温逐渐降低,出现逆温层,使污染物浓度达到一天内的第二个峰值;午夜过后,随着人类活动的减弱,污染物的浓度又逐渐降低.

图4 宁夏沿黄城市群污染季PM2.5日内分时变化规律

3 宁夏沿黄城市群大气复合污染物关联规则发现

3.1 关联规则发现的基本理论

关联规则发现是数据挖掘重要的研究方向之一,该方法利用一定的搜索与分析算法,挖掘出隐藏在大型数据集中有意义的规律和信息,其最早是用来分析超市购物篮数据事务中不同商品购买规则之间的有趣联系,进而了解消费者的购物习惯.简单来说,关联规则最早是用来反映顾客的购物篮中出现商品X时,对另一商品Y出现的概率能够产生多大的影响.笔者以PM2.5为例,将关联规则发现从购物篮转移到大气污染物的关联性分析,挖掘出其他污染物对PM2.5不同污染等级出现概率的影响程度,进而根据关联规则的挖掘结果,做到有针对性地解决城市群PM2.5的污染问题.关联规则发现的基本原理:

在关联分析过程中,包含0个或多个项的数据集合叫做项集,给定数据库中所有项的集合I,T为数据库中所有事务的集合,即T={t1,t2,…,tn},每个事务ti均为I集合的子集.对于任意2个项集X,Y,关联规则是形如X⟹Y的蕴含表达式,且满足X⊂I,Y⊂I,X∩Y=Ø.在对数据进行关联规则挖掘的过程中,依靠支持度(S)和置信度(C)度量关联规则的强弱.S,C的计算由下式表示:

(1)

(2)

(1)~(2)式中:X为关联规则的前项(LHS);Y为关联规则的后项(RHS);σ(X)为数据集中仅包含X项集的事务数量;σ(X∪Y)为数据集中同时包含X,Y的事务数量;N为数据集中包含的事务总数.关联规则发现的目的是,找出支持度大于等于阀值并且置信度大于等于置阀值的所有规则.其计算步骤:找到所有满足支持度阀值的项集,即产生频繁项集;从频繁项集中找出所有高置信度的规则,即产生强规则.

为了衡量关联规则的质量水平,研究者在置信度和支持度的基础上又提出了提升度(L)的度量,用于表示置信度和项集与支持度之间的比率,其计算公式为

(3)

L越大,代表所生成的相应关联规则质量越好、价值越高,而L<1的可视为无价值规则.笔者用R语言中Apriori算法进行关联规则时发现,该算法基于支持度剪枝技术,大大减少了候选项集的数量,具体程序代码参照贾瑾的研究[20].

3.2 关联规则方案的设计

在进行大气复合污染物关联规则挖掘前,首先将空气污染物数据进行离散化处理.笔者将收集到的宁夏沿黄城市群4个主要城市的空气质量指数(AQI)分时数据,按照表2的标准对PM2.5,PM10,SO2,NO2,CO 5种污染物进行离散.表2是参考《环境空气质量指数(AQI)技术规定》(HJ 633—2012)中对应污染物24 h平均质量浓度限值和空气质量等级划分方法所得到的,用以离散空气污染物并挖掘污染物之间的关联规则.由于重点关注宁夏沿黄城市群PM2.5超标时大气复合污染物之间的关联性,将关联规则的后项Y设定为PM2.5的离散等级,关联规则的前项X则设定为其他4种污染物的离散等级.

表2 空气污染物的浓度数据离散化规则

3.3 关联规则挖掘结果

在关联规则挖掘的过程中,根据文中的数据类型和数据量特征,不断修正挖掘结果,设定最小支持度为0.000 1,最小置信度为0.7,共生成45条强关联规则.但当PM2.5为1级时,空气质量为优秀,因此,去除PM2.5等级为1的关联规则后剩余14条强关联规.将其可视化后,关联规则的散点如图5所示,挖掘出的具体关联规则如表3所示.

图5 PM2.5强关联规则散点

图5中,每一个点代表一个关联规则.由图5可知,大气污染物关联规则的提升度与置信度成正比,置信度较大的关联规则,其提升度往往也偏大,说明这些规则的可信度较高.由表3可知,PM2.5质量浓度最高为5级,并未挖掘出PM2.5质量浓度为6级的强关联规则,说明宁夏沿黄城市群PM2.5质量浓度出现严重污染的情形并不常见;相比于PM2.5质量浓度为3级和2级,当PM2.5质量浓度为5级时,关联规则的置信度和提升度明显偏高,即PM2.5质量浓度等级越高,其与其他4种大气污染物之间的关联程度越高.

表3 宁夏沿黄城市群PM2.5同其他污染物间的典型关联规则

分析PM2.5质量浓度为5级时的关联规则(关联规则1~10)发现,存在3条置信度为1的关联规则(关联规则1,3,4),表明当宁夏沿黄城市群PM10的质量浓度为4级、SO2的质量浓度也为4级时,发生PM2.5质量浓度为5级污染的概率为100%,说明PM2.5质量浓度为5级与PM10质量浓度为4级、SO2质量浓度为4级之间表现出很强的关联性,当后2种污染物为4级且共存时,更易发生PM2.5质量浓度为5级的污染.由于这3条关联规则的置信度为1,城市群PM2.5污染与PM10,SO2质量浓度之间的关联关系值得空气污染治理有关单位重点关注.

由关联规则2可知,当PM10质量浓度为4级和CO质量浓度为3级共存时,有75%的概率发生PM2.5质量浓度为5级的污染.在此基础上,关联规则5表明,若此时SO2质量浓度达到3级污染,会使PM2.5质量浓度为5级的污染发生概率提升约3%,达到78.94%.由关联规则7可知,当SO2质量浓度由3级变为2级后,且PM10,CO的质量浓度等级均不变时,PM2.5质量浓度为5级的污染发生的概率下降约9%,降至70%.

关联规则8~10的前项中包含4种大气污染物,其中,PM10质量浓度均为4级、CO质量浓度均为2级,3条关联规则之间仅在SO2,NO2污染等级上存在差异.关联规则8中,SO2,NO2的污染等级均为3级,此时发生PM2.5质量浓度为5级的污染概率在这3条规则中处于最高水平,为82.35%.在其他条件不变的情况下,当NO2污染降为2级时(关联规则10),发生PM2.5质量浓度为5级的污染概率下降至78.48%;而当NO2污染仍为3级,SO2污染降为2级时(关联规则9),该概率下降至73.33%,说明SO2污染质量浓度降低对PM2.5质量浓度为5级的污染出现概率产生明显的负影响.

与前10条关联规则对比,关联规则11~14的提升度明显下降.主要原因是这4条关联规则后项中PM2.5污染等级较低,此时PM2.5污染与其他4种污染物之间的关联度相对较低,从中也并未发现污染物之间规律性的关联规则.

4 结论

1)宁夏沿黄城市群整体的空气质量较好,城市群在污染季PM2.5的平均质量浓度为54.77 μg/m3,达标率约为81%,污染季中有约19%的天数处于污染级别;在城市群内部,PM2.5污染程度存在随城市地理位置南移而逐渐减轻的趋势,石嘴山市在污染季PM2.5的污染最严重,平均为61.11 μg/m3,中卫市的污染最轻,平均为45.08 μg/m3.

2)2015—2018年,宁夏沿黄城市群在污染季PM2.5的平均质量浓度呈现逐年下降的趋势,说明政府有关部门对空气污染的治理取得了一定的成效;通过对城市群在污染季月度PM2.5平均质量浓度进行统计,发现PM2.5质量浓度表现出先上升后下降的波动特征,当年12月和次年1月为城市群PM2.5污染最严重的2个月,此时PM2.5质量浓度处于波动过程中的峰值位置.

3)对城市群PM2.5质量浓度日内分时波动情况进行统计,发现PM2.5质量浓度呈现出双峰波动的特征,第一个波峰出现在9:00~12:00,第二个波峰出现在21:00~23:00,且2个波峰的峰值无明显差异,峰值时PM2.5的质量浓度约为62 μg/m3.

4)对宁夏沿黄城市群PM2.5与其他4种大气污染物之间的关联规则进行挖掘,共得到45条高置信度规则,去除PM2.5等级为1的情形,剩余14条强关联规则.其中,PM2.5与PM10,SO2之间的关联性较高,因此需重点关注城市群中SO2的污染等级.本文挖掘出的数条关联规则表明,当SO2污染等级较高时,发生PM2.5高等级污染的概率越大.由于大气中的SO2主要来源于汽车尾气的排放、含硫燃料如煤炭、石油等的燃烧,同时产生一定量的PM2.5和PM10.因此,结合宁夏沿黄城市群的客观情况,亟待开展污染季SO2污染的溯源与过程研究,特别是针对重工业企业和民用燃煤清洁化、改制污染程度高的企业等开展防治模式创新.此外,也可以通过大力推行共享经济,如共享单车、共享清洁汽车等,减少宁夏沿黄城市群汽车尾气排放量.

猜你喜欢

置信度城市群空气质量
基于数据置信度衰减的多传感器区间估计融合方法
乌海市雾对空气质量的影响
一种基于定位置信度预测的二阶段目标检测方法
长三角城市群今年将有很多大动作
《关中平原城市群发展规划》获批发布
把省会城市群打造成强增长极
校核、验证与确认在红外辐射特性测量中的应用
车内空气质量标准进展
重视车内空气质量工作 制造更环保、更清洁、更健康的汽车
中国将形成5个超级城市群