APP下载

一种基于大气CO2浓度时空特征的碳排放分区估算方法

2023-10-26张少卿雷莉萍郭开元吉张辉绳梦雅

中国环境科学 2023年10期
关键词:人为分区偏差

张少卿,雷莉萍,宋 豪,郭开元,吉张辉,绳梦雅

一种基于大气CO2浓度时空特征的碳排放分区估算方法

张少卿1,2,3,雷莉萍1,2*,宋 豪4,郭开元1,2,3,吉张辉1,2,3,绳梦雅5,6

(1.中国科学院空天信息创新研究院,数字地球重点实验室,北京 100094;2.可持续发展大数据国际研究中心,北京 100094;3.中国科学院大学,北京 100049;4.中国地质大学(北京),北京 100083;5.中国公路工程咨询集团有限公司,北京 100094;6.空间信息应用与防灾减灾技术交通运输行业研发中心中咨数据有限公司,北京 100094)

针对人为碳排放的空间分布量级差异大导致排放数据的非正态分布问题,提出了一种基于卫星大气CO2柱浓度(XCO2)时空变化特征聚类分区构建人为碳排放神经网络估算模型方法.通过利用与人为碳排放强相关的卫星XCO2数据时空变化(2010~2021年)特征的聚类分区,利用卫星观测的XCO2和SIF以及夜间灯光、人口密度和人为排放清单数据EDGAR作为训练学习数据,以聚类区为单位分别构建人为碳排放神经网络估算模型,估算了2021年研究区人为碳排放.与EDGAR交叉验证结果显示,相比以中国全区数据作为训练学习样本统一建模方法的估算,本研究提出的分区建模估算结果从相关系数(R)的0.43提高到了0.82;空间分布更为合理;平均偏差由0.039MtCO2降低到0.018MtCO2.研究表明利用多源数据的神经网络训练学习进行人为碳排放的估算,能够为区域碳排放特征和排放清单的不确定性提高提供评估分析依据.

人为碳排放;神经网络;多源数据;机器学习

为应对气候变化,各国都在采取人为碳排放控制措施,人为碳排放监测必然成为评估减排效果的重要途经之一.传统的人为CO2排放估算方法是基于国家或地区尺度能源消耗部门或者行业部门的分类核算,采用清单统计的方式进行[1].目前各个机构发布的主流的人为排放清单数据有EDGAR、ODIAC、CHRED、PKU、MEIC等[2-6],将人为CO2排放根据夜光、人口密度等数据进行时间和空间的再分配.然而由于统计数据不充分,且在分配过程中利用的点源、面源辅助数据存在很大的不确定性,导致不同机构的排放清单数据存在较大的不一致性.特别是发展中国家的高排放区,排放数据不确定性更大[7-8],另外清单数据依赖于行业和部门的统计数据,也存在一定的滞后性.IPCC 2019新方针指出卫星遥感观测数据作为清单数据的补充检验,能够较为客观地掌握人为碳排放量[9].

卫星遥感观测具有观测模式统一、时间序列长、覆盖范围广等优点,可以有效地获取和检测区域及全球大气CO2浓度变化,多源温室气体遥感卫星GOSAT、OCO-2以及OCO-3等已经观测积累了10年以上大气CO2浓度数据[10-13].许多研究表明这些温室气体卫星观测反演的大气CO2柱浓度(XCO2)能够定量检测排放点源和区域人为CO2排放量;已经成为人为碳排检测的重要发展手段[14-15];然而大气CO2浓度的变化不仅受人为CO2排放的影响,还受大气传输、植被生态吸收等多种因素的影响,这些因素的相互作用导致大气CO2浓度变化与人为碳排放呈现非线性的关系,制约了人为碳排放卫星遥感的估算.

多源卫星遥感大数据的发展为机器学习在人为碳排放的应用提供了契机[16].数据驱动的机器学习方法通过数据样本的训练建立多源卫星数据与人为碳排放之间的非线性关系,从而减少了复杂碳循环的影响[17-19].目前通用的一些机器学习算法如GRNN、ICSO-SVM、LASSO、RF等已被应用于人为碳排放的估算.Wen等[20]应用ICSO-SVM混合模型预测了中国上海住宅能源相关的二氧化碳排放;Leerbeck等[21]利用LASSO机器学习算法来预测丹麦投标区电网中的二氧化碳排放强度;Yang等[22]应用GRNN模型对中国区域人为碳排放进行了格网估算;随后Mustafa等[23]同样应用GRNN模型对西亚地区的人为碳排放进行了估算;Zhang等利用RF模型对全球的格网的人为碳排放进行了估算.然而以上研究在碳排放估算的过程中,没有考虑人为排放非正态分布、空间分布不均衡的问题,在模型训练中会引入系统偏差.本研究针对上述问题,选取中国大陆为研究区,提出了一种基于大气CO2浓度聚类特征的分区建模碳排放估算方法,该方法可以极大提高人为碳排放估算精度,为减排措施的制定提供更为准确的数据依据.

1 数据与方法

1.1 数据获取与处理

本研究收集了排放清单数据、卫星XCO2、植被生态通量相关的叶绿素荧光以及与人为排放活动相关的夜间灯光、人口密度等数据.针对中国大陆区域夜光和人口数据可以利用的时间范围,收集了2012年~2021年数据,以2012年~2020年为训练学习数据,构建模型,应用模型估算了2021年中国大陆区域人为碳排放.

为了在建模过程中保持时空分辨率的统一,本研究采用三次卷积内插法(cubic convolution interpolation)对将不同空间分辨率的数据统一为1°´1°格网,随后用简单平均的方法将不同时间分辨率的数据统一为以年为单位.

1.1.1 人为排放清单数据 清单排放数据中, EDGAR(Emissions Database for Global Atmospheric Research)数据更新相对较快,且不确定性较小;因此采用EDGAR 作为模型训练的目标数据,收集了2012~2021 年EDGAR v7.0人为碳排放数据. EDGAR利用了IEA(International Energy Agency)能源统计、BP(British Petroleum)统计、USGS(United States Geological Survey)、世界钢铁协会、GGFR/U.S (Global Gas Flaring Reduction Partnership)、NOAA (National Oceanic and Atmospheric Administration)和IFA (International Fertilizer Association)的统计数据获得排放数据,然后通过人口密度数据,交通网络数据、夜光数据、排放点源数据等空间辅助数据对人为排放进行空间上0.1度格网的分配(https:// edgar.jrc.ec.europa.eu/)[4].

1.1.2 卫星XCO2数据 收集来自多颗温室气体卫星GOSAT、OCO-2、OCO-3观测数据生成的时空连续数据集(Mapping-XCO2).该数据集为融合利用GOSAT、OCO-2、OCO-3卫星反演的XCO2数据基于时空地统计的克里格插值处理生成的2009年4月~2021年12月全球时空连续数据集(1°´1°格网、时间以月为单位)[24-26].该Mapping-XCO2解决了多源卫星观测数据的不一致问题,并填补了卫星观测数据的大量空白[27],该数据集已公开发布在哈佛大学的数据平台上(https://dataverse.harvard.edu/ dataset.xhtml?persistentId=doi:10.7910/DVN/4WDTD8).

1.1.3 其他训练数据 为解释卫星XCO2中包含的植被生态CO2通量信息,收集了太阳诱导叶绿素荧光数据集(GOSIF).相对于基于遥感的植被指数,SIF被证明与植被光合作用关系更紧密,且更能捕捉环境因素导致的变异.该数据集是基于OCO-2的SIF数据、中分辨率成像光谱仪(MODIS)数据和气象再分析数据处理生成[28].GOSIF数据覆盖时期为2000~2021年,空间分辨率为0.05°,间隔为8d.

卫星传感器能够探测到城市灯光、火点、交通等人类活动的信号,且不受大气传输的影响,可以直接作为人类排放活动检测的数据源.因此,收集来自Suomi NPP/VIIRS卫星观测的2012~2021年空间分辨率为500m的夜光数据.NPP-VIIRS卫星运行从2012年至今,数据由Suomi国家极轨道伙伴关系卫星(SNPP)搭载的可见光红外成像辐射仪(VIIRS)拍摄.该数据集对地面微弱辐射信号有很强的探测能力,消除了雾霾和条纹,降低了由杂散光引起的偏移[29].

研究表明,人口因素是影响碳排放的重要因素之一.因此收集了2012~2021年LandScan的全球人口分布数据[30].LandScan利用空间数据和图像分析以及多变量 dasymetric建模方法来分解行政边界内的人口普查计数,其空间分辨率为1km,每年更新1次.

为了分析在排放聚类区的土地覆盖特征,收集全球 500m土地覆盖产品(MCD12Q1) 的空间聚合和再投影数据,空间分辨率为0.05°格网,使用国际地圈生物圈计划(InternationaI Geosphere Biosphere Programme, IGBP)分类方法的土地覆盖类型,该分类方法定义了17个类别,包括11个自然植被类别、三个人为改变类别和三个非植被类别.

1.2 研究方法

以2012年~2020年的XCO2、SIF、夜间灯光、人口密度和EDGAR为训练学习数据构建神经网络人为碳排放估算模型,应用模型估算了2021年研究区人为碳排放.

研究选取GRNN神经网络作为本研究的模型.GRNN是一种前馈式神经网络,不需要事先知道确定方程式,且只有一个超参数光滑因子,可以保证最大程度的减少人为主观参数选择对模型训练的影响,保证模型对比的客观性.GRNN具有较强的非线性映射能力和学习速度,能够较好的预测样本数据较少时的结果.此外,GRNN在利用卫星数据估算目标参数的研究中已经显示了较为成功的应用[22-23].

人为活动在区域上存在很大差异,排放量的空间分布存在不均衡、非正态分布问题,如中国大陆区域的人为活动强烈的东部和活动稀少的西部.利用全区数据进行训练学习建模过程中,由于排放的区域差异太大导致模型拟合效果差.通过大气CO2浓度时空变化特征进行聚类,聚类区域内大气传输以及植被覆盖具有相似特征,进而可以增强区域内来自排放源的CO2排放.据此,本论文提出了一种基于大气CO2浓度时空变化特征聚类的分区建模机器学习方法,利用2009~2020年XCO2、SIF、人口密度、夜间灯光在各个聚类区内分别训练,建立与EDGAR清单数据的关系,并对2021年人为碳排放进行估算,旨在提高人为碳排放估算精度.

1.2.1 神经网络构建参数 1) GRNN理论基础GRNN以概率密度函数(Probability Density Function,PDF)代替固有的方程形式通过执行 Parzen非参数估计[31],计算观测样本中自变量和因变量之间的联结概率密度函数来计算因变量对自变量的回归值.这里的自变量是XCO2、SIF、夜间灯光、人口密度,因变量是EDGAR.设随机向量和的联合概率密度函数为(,),取值为0,对0的回归值式为(1)

式中:为样本容量,为的维数.为高斯函数的宽度系数,即光滑因子.

将式(3)式带入式(2),并交换积分与加和的顺序,将有:

2)GRNN的网络结构

GRNN网络由四层结构构成,分别为输入层(input layer)、模式层(pattern layer)、加和层(summation layer)和输出层(output layer)[38].

(1)输入层直接将输入变量传递给模式层.在本研究中利用的训练样本为XCO2、SIF、夜间灯光、人口密度和EDGAR,输入层神经元的数目与样本向量维数相同.

(2)模式层又称为隐回归层,模式层神经元的数目与训练样本的个数相同.计算训练样本与第个神经单元的学习样本间的Euclid距离平方指数,并输入到加和层.

(3)加和层使用两种模式求和,一种是对模式层的输出进行算数求和,第二类是加权求和,通过模式层中神经元与求和层总神经元的链接传递函数进行加权求和.

(4)输出层通过计算加和层两种求和模式结果的比值,得到估算结果.

3)光滑因子的优化

光滑因子选择的好坏,关系到模型最终结果的输出.为获得模型最优值,本研究采用逐一选取的方式,设置值范围为0.1~2,以0.1步长逐一计算每个值条件下的估算结果,选取最优结果值作为估算模型的光滑因子参数.同时在进行样本训练时,采用折交叉验证的方法避免过拟合现象的出现.

交叉验证是机器学习建立模型和验证模型常用办法,可以在一定程度上减少过拟合现象的发生.本研究将设置为10,将训练数据分为10组,在10次迭代中,9组用于训练,1组用于测试数据集的模型评估.将2012~2020年的训练数据随机分为10份数据,数据间不重复;从中挑选一个子集为测试集,剩余子集用于模型训练;随后训练模型估算测试集并记录估算偏差;重复上述步骤10次,保证每一个子集都成为过测试集;计算10组数据的平均偏差作为模型精度的估计来减少模型对数据的敏感性.

1.2.2 分区构建模型 已有研究证明,卫星观测反演的XCO2与人为排放清单数据在时间和空间上都具有很强的相关性[32-34].因此,本研究利用中国大陆区域长时间序列2009年4月~2021年12月XCO2数据,应用K-means 聚类算法(K-means clustering algorithm)进行了时空特征聚类.K-Means算法是一种基于形心划分数据的无监督聚类算法.该方法是最普及且最常用的聚类方法,其算法收敛速度快,可解释度较强[35].

考虑各聚类区对应的人为排放活动和自然区域特征且具有一定的数据量,聚类XCO2时空变化特征生成了10个聚类区,结果如图1所示.

对照EDGAR的人为排放(图1(b))以及地表覆盖(图1(c))的空间分布,各聚类区综合显示了人为排放活动、地形、以及地表生态等区域特征.在东部高排放大城市区域,人为活动频繁,对应耕地、水体、城市等复杂的地表覆盖特征(图1(d)),京津冀、长三角、和珠三角(D7、D4、D2)显示了各区域特有的CO2浓度变化特征.在西北部低排放区域,对应了裸地、草原等相对简单的地表覆盖特征.

以图1所示聚类区为单位,利用2012年到2020年的XCO2、SIF、夜间灯光、人口密度数据作为训练样本,EDGAR数据为人为CO2排放目标数据,各个聚类区分别构建GRNN模型,共建立起10个GRNN模型.随后将2021年的XCO2、SIF、夜间灯光和人口密度数据,输入到对应聚类区各自的模型中,对聚类区内各格网的人为CO2排放进行估算.为了对比分区建模估算结果,利用相同的训练数据在中国大陆全区构建GRNN模型,应用该模型对全区进行了2021年排放估算.以上分区建模和全区建模的估算结果和对比分析将在下一章在论述.

图1 (a)基于XCO2时空变化特征的聚类结果;以及(b)中国大陆区域EDGAR排放的空间分布、(c)地表土地覆盖和(d)各土地覆盖类型排放统计

Fig 1 (a) Clustering results based on temporal and spatial variation characteristics of XCO2; And (b) spatial distribution of EDGAR emissions in China, (c) land cover and (d) emission statistics of each land cover type审图号:GS(2019)1829

2 结果与讨论

2.1 估算偏差

利用2021年EDGAR排放数据,对比验证了GRNN模型估算结果.图2分别显示了研究区格网点EDGAR排放与分区建模估算和全区建模估算结果的相关性.结果显示分区建模估算结果的相关系数(2=0.82)远高于全区建模的0.43,更高的一致于EDAGR,表明分区建模能够更好地训练学习到人为排放的空间信息.

本研究进一步对比分析模型估算偏差与清单排放量的响应关系(如图3所示),结果显示分区建模估算偏差与清单排放量的相关性2为0.30,显著低于全区建模估算偏差与清单排放量的相关性(2= 0.78).全区建模估算偏差与清单排放量显示出的较好线性关系这一定程度上指出了该估算结果存在较大的系统偏差.

此外,本研究对中国大陆的碳排放估算结果进行统计.2021年EDGAR清单的CO2排放总量为12675Mt CO2,分区模型估算的碳排放量为12473Mt CO2,总体偏差202Mt CO2,标准差14.67Mt CO2,格网平均偏差0.018Mt CO2;全区模型估算的碳排放量为12245Mt CO2,总体偏差430Mt CO2,格网平均偏差0.039Mt CO2,标准差26.57Mt CO2.分区建模估算结果的偏差小于全区建模估算结果的偏差.这表明,采用分区建模方法能够更准确地估算排放量,相对于全区建模方法具有更高的精度和可靠性.

Fig 3 Response of estimated bias to inventory emissions from cluster modeling (a) and whole region modeling (b)

2.2 估算结果的不确定性

2.2.1 排放估算的空间分布 图4结果显示,分区建模(图4(b))和全区建模(图4(c))的估算结果与EDGAR排放(图1(b))均显示了相似的空间分布特征;这表明两种模型都能够比较准确地捕捉到排放量的空间分布规律.然而,在偏差空间分布结果上,分区建模的排放估算在低排放区偏差整体在零值附近,而全区建模偏差结果则显示了较低的偏差,特别是在高排放点源及城市区域,如上海、沈阳等地区偏差较大.这表明采用分区建模方法能够更准确地估算低排放区的排放量.

分区建模和全区建模估算的排放量在高排放大城市如上海、武汉、沈阳等均显示出低于清单排放值,而大城市周围区域排放估算值高于清单值;该结果可能与EDGAR清单数据在空间分配中所使用的点源数据不确定性有关,而其在总排放中占据最大的比例.EDGAR清单数据在点源分配时所使用的CARMA电厂数据[36-37]中点源的地理位置存在较大的偏差[38-39].CARMA电厂数据往往将电厂所在城市的几何中心的坐标作为该电厂的坐标,导致EDGAR以城市为中心分配了过多的排放量,相应在该城市郊区的排放就会低于真实排放.研究对CARMA数据进行了实地调查验证,结果发现接近一半的电厂地理位置存在位置偏差,这与其他研究的结果相一致[40].也有研究指出CARMA数据在中国大陆区域忽略了1300个小型电厂[41].因此本研究的模型估算结果也在一定程度上印证了清单数据的不确定性.

图4所示全区模型排放估算在低排放区整体高于EDGAR,而在沈阳、武汉、上海等大城市区低于EDGAR.这是由于全区建模训练过程中,受区域碳排放空间非正态分布、量级差异大的影响,导致模型拟合误差大,产生系统偏差.

2.2.2 估算偏差的区域性特征 针对小区域的排放估算偏差问题,在研究区选取了如图5所示排放估算偏差较大且具有排放代表性的11个区域(ROI),图中C1~C7为城市区,S1~S4为农村和城镇.

表1的结果进一步验证了基于XCO2时空特征聚类分区建模的排放估算方法的准确性和可行性.相比于全区建模,分区建模的排放估算偏差明显降低,尤其是在沈阳、上海、武汉等大城市区域,减少了约119~211Mt CO2的估算误差,这表明分区建模方法能更好地反映空间分布差异,精确提高排放估算的精度和可靠性.同时,分区建模估算结果中,排放量最高的城市与EDGAR的高排放区和排放顺序相近,再次证明该方法在区域排放估算中的可靠性和实用性.表1的结果证明了基于XCO2时空特征聚类分区建模的排放估算方法的优势,为进一步改善我国大气污染控制和减排方案提供了科学参考.

图4 研究区域2021年(a)分区建模估算的人为碳排放、(b)全区建模估算的人为碳排放,(c)分区建模估算偏差、(d)全区建模估算偏差

审图号:GS(2019)1829

图5 ROI的位置分布,其中C1~C7为城市区域、S1~S4为城镇和农村,底图为分区建模估算结果的偏差(2021年)

审图号:GS(2019)1829

在分区建模排放估算结果中,偏差最大的区域在包头、邯郸和攀枝花,这三个区域都属于高排放点源集中的区域,其中包头是中国重要的基础工业基地[42],邯郸是国家重点建设的老工业基地[43],攀枝花是西南地区最大的铁矿石原料基地和全国最大的钛原料基地,是全国四大铁矿区之一[44].2.2.1节中提到EDGAR数据在点源分配时使用的CARMA点源数据存在较大的不确定性,因此会导致EDGAR在这三个区域的排放分配也存在较大的不确定性.而在成都、广州、开封这样重工业点源相对较少的区域,估算偏差相对较小.训练数据中利用的XCO2是卫星实时观测到的柱浓度,包含了客观的人为CO2排放信息,因此利用卫星观测得到的模型训练结果对排放清单数据的不确定性具有评估验证的参考价值.

表1 ROI区域排放和估算结果统计(Mt CO2)

由表2可见,与通常的碳排放统计结果一致,长三角、京津冀和珠三角这三个聚类区(D4、D7、D2)显示出最大的排放量;而青海和西藏这两个占据面积最大的聚类区(D6)则显示出最小的排放量.同时,在这些区域内进行分区建模估算的结果,其偏差普遍低于整个区域的建模估算结果.

在10个聚类区中,分区模型估算偏差和平均偏差最大区域为京津冀地区和珠三角聚类区(D7、D2),京津冀地区的排放估算高于EDGAR排放188.74Mt CO2;而珠三角地区的排放估算低于EDGAR排放106.51Mt CO2,这些区域分布有多种行业的碳排放企业,人为排放活动复杂多变,使得基于清单统计的EDGAR数据存在较大的不确定性,即EDGAR低估了京津冀地区排放而高估了珠三角地区.另外,长三角地区(D4)显示了分区估算标准偏差(44Mt CO2)明显高于其他区域(均值为11Mt CO2).对照图5所示偏差分布以及上述偏差分析结果,该区域估算偏差显示的高标准差即偏差高离散度也指出了该区域排放点源分布的不确定性问题导致了格网点的高偏差.分区估算偏差较小的区域为新疆、西藏、青海(D5、D6),分别为1.65Mt CO2和1.96Mt CO2,这两个区域地广人稀,人为排放活动少,排放偏差也相对较小.

表2 各聚类区排放统计(Mt CO2)

3 结论

3.1 卫星长时序XCO2数据的时空特征聚类分析揭示了人为碳排放、大气传输以及地表生态通量的区域特征.在东部京津冀、长三角、和珠三角等XCO2聚类区,人为碳排放较高,人为活动频繁,对应人为活动频繁的耕地、水体、城市等复杂的地表覆盖特征.而在西北部XCO2聚类区域,人为碳排放较少,对应裸地、草原等相对简单的地表覆盖特征.

3.2 分区建模的碳排放估算精度高于全区建模.本研究提出的基于卫星XCO2时空变化特征聚类分区建模的人为CO2排放估算方法,与EDGAR清单数据交叉验证结果2=0.82远高于全区建模结果(2= 0.43).格网平均偏差0.018Mt CO2,远低于全区建模的0.039Mt CO2,较好地解决了人为碳排放非正态分布、量级差异大带来的模型训练系统偏差,显示了更高的精度.

3.3 分区建模估算结果在不同尺度的碳排放研究中更有优势.无论是高排放城市点源尺度还是聚类区尺度,分区建模的估算结果偏差均小于全区建模,在区域碳排放分析中可以提供更准确的数据支持.

3.4 揭示出长三角地区人为碳排放具有一定的不确定性.与EDGAR数据的交叉验证结果显示,长三角地区排放估算的偏差较其它地区更大,这可能由于EDGAR在空间分配时所使用的CARMA点源排放数据源的不确定性有关.

[1] Andres R.J, Boden T.A, Higdon D. A new evaluation of the uncertainty associated with CDIAC estimates of fossil fuel carbon dioxide emission [J]. Tellus B Chem. Phys. Meteorol., 2014,66:23616.

[2] Oda T, Maksyutov S. A very high-resolution (1km × 1km) global fossil fuel CO2emission inventory derived using a point source database and satellite observations of nighttime lights [J]. Atmos. Chem. Phys., 2011,11:543–556.

[3] Oda T, Maksyutov S, Andres R.J. The Open-source Data Inventory for Anthropogenic Carbon dioxide (CO2), version 2016 (ODIAC 2016): A global, monthly fossil-fuel CO2gridded emission data product for tracer transport simulations and surface flux inversions [J]. Earth Syst, 2018,10:87–107.

[4] Janssens-Maenhout G, Crippa M, Guizzardi D, et al. Edgar v4.3.2global atlas of the three major greenhouse gas emissions for the period 1970~2012 [J]. Earth Syst, 2017,11:959–1002.

[5] Cai B, Liang S, Zhou J, et al. China high resolution emission database (CHRED) with point emission sources, gridded emission data, and supplementary socioeconomic data [J]. Resour. Conserv. Recycl, 2018, 129:232–239.

[6] Wang R, Tao S, Ciais P, et al. High-resolution mapping of combustion processes and implications for CO2emissions [J]. Atmos. Chem. Phys., 2013,13:5189–5203.

[7] Han P, Zeng N, Oda T, et al. Evaluating China’s fossil-fuel CO2emissions from a comprehensive dataset of nine inventories [J]. Atmos. Chem. Phys., 2020,20:11371–11385.

[8] Andres R.J, Boden T.A, Higdon D.M. Gridded uncertainty in fossil fuel carbon dioxide emission maps, a CDIAC example [J]. Atmos. Chem. Phys., 2016,16:14979–14995.

[9] IPCC, 2019. 2019 Refinement to the 2006 IPCC guidelines for national greenhouse gas inventories [EB/OL]. https:// www.ipcc.ch/ report/2019-refinement-to-the-2006-ipcc-guidelines-for-national-greenhouse-gas-inventories/.

[10] Cai W, Borlace S, Lengaigne M, et al. Increasing frequency of extreme El Niño events due to greenhouse warming [J]. Nature Climate Change, 2014,4:111-116.

[11] Buchwitz M. Retrieval of trace gas vertical columns from SCIAMACHY/ ENVISAT near-infrared nadir spectra: first preliminary results [J]. Advances in Space Research, 2004,34:809-814.

[12] Crisp D, Miller C E, DeCola P L. NASA Orbiting Carbon Observatory: Measuring the column averaged carbon dioxide mole fraction from space [J]. J. Appl. Remote Sens, 2008,2:142–154.

[13] Yoshida T, Yoshida Y, Eguchi N, et al. Global concentrations of CO2and CH4retrieved from GOSAT [J]. First preliminary results, 2009,5:160–163.

[14] Frankenberg C, Fisher J B, Worden J, et al. New global observations of the terrestrial carbon cycle from GOSAT: Patterns of plant fluorescence with gross primary productivity [J]. Geophys, 2011,38: AR L17706.

[15] Morino I, Uchino O, Inoue M, et al. Preliminary validation of column- averaged volume mixing ratios of carbon dioxide and methane retrieved from GOSAT short-wavelength infrared spectra [J]. Atmos. Meas. Tech., 2011,4:1061–1076.

[16] Kort E A, Frankenberg C, Miller C E, et al., Space-based observations of megacity carbon dioxide [J]. Geophysical Research Letters, 2012,39(17):17806.

[17] Belgiu M, Drăgu t L. Random forest in remote sensing: A review of applications and future directions [J]. ISPRS J. Photogramm.Remote Sens, 2016,114:24–31.

[18] Tramontana G, Jung M, Schwalm C R, et al. Predicting carbon dioxide and energy fluxes across global FLUXNET sites with regression algorithms [J]. Biogeosciences, 2016,13:4291–4313.

[19] Mahdianpari M, Salehi B, Mohammadimanesh F, et al. Random forest wetland classification using ALOS-2L-band, RADARSAT-2C-band, and TerraSAR-X imagery [J]. ISPRS J. Photogramm, Remote Sens, 2017,130:13–31.

[20] Wen L, Cao Y. Influencing factors analysis and forecasting of residential energy-related CO2emissions utilizing optimized support vector machine [J]. J. Clean. Prod., 2020,250:119492.

[21] Leerbeck K, Bacher P, Junker R.G, et al. Short-term forecasting of CO2emission intensity in power grids by machine learning [J]. Appl. Energy, 2020,277:115527.

[22] Yang S Y, Lei L P, Zeng Z C, et al. An Assessment of Anthropogenic CO2Emissions by Satellite-Based Observations in China [J]. Sensors, 2019,19:1118.

[23] Mustafa F, Bu L, Wang Q, et al. Neural-network-based estimation of regional-scale anthropogenic CO2emissions using an Orbiting Carbon Observatory-2 (OCO-2) dataset over East and West Asia [J]. Atmos. Meas. Tech, 2021,14:7277–7290.

[24] Sheng M Y, Lei L P, Zeng Z C, et al. Detecting the Responses of CO2Column Abundances to Anthropogenic Emissions from Satellite Observations of GOSAT and OCO-2 [J]. Remote Sens, 2021,13:3524.

[25] Zeng Z C, Lei L P, Hou S S, et al. A regional gap-filling method based on spatiotemporal variogram model of columns [J]. IEEE Trans. Geosci. Remote Sens, 2014,52:3594–3603.

[26] Zeng Z C, Lei L P, Strong K, et al. Global land mapping of satellite- observed CO2total columns using spatio-temporal geostatistics [J]. Int. J. Digit. Earth, 2017,10:426–456.

[27] 吴长江,雷莉萍,曾招城.不同卫星反演的大气CO2浓度差异时空特征分析[J]. 中国科学院大学学报, 2019,36(3):331-337. Wu C J, Lei L P, Zeng Z C. Spatio-temporal analysis of differences among atmospheric CO2concentrations retrieved from different satellite obserbvations [J]. Journal of University of Chinese Academy of Sciences, 2019,36(3):331-337.

[28] Xiao J, Li X, He B, et al. Solar-induced chlorophyll fluorescence exhibits a universal relationship with gross primary productivity across a wide variety of biomes [J]. Glob. Change Biol., 2019,25:e4–e6.

[29] Lee S, Cao C. Soumi NPP VIIRS day/night band stray light characterization and correction using calibration view data [J]. Remote Sensing, 2015,8(2):138.

[30] Sims K, Reith A, Bright E, et al. LandScan Global 2021 [D]. Oak Ridge National Laboratory, 2022.

[31] Parzen E. On estimation of a probability density function and mode [J]. Annals of Mathematical Statistics, 1962,33(3):1065-1076.

[32] Sheng M Y, Lei L P, Zeng Z C, et al. Detecting the responses of CO2column abundances to anthropogenic emissions from satellite observations of GOSAT and OCO-2 [J]. Remote Sens., 2021,13:3524.

[33] Zhang S Q, Lei L P, Sheng M Y, et al. Evaluating Anthropogenic CO2Bottom-Up Emission Inventories Using Satellite Observations from GOSAT and OCO-2 [J]. Remote Sens., 2022,14:5024.

[34] 王震山,绳梦雅,肖 薇,等.基于多源碳卫星融合产品的中国地区XCO2与人为CO2排放时空变化[J]. 中国环境科学, 2023,43(3): 1053-1063. Wang Z S, Sheng M Y, Xiao W, et al. Spatiotemporal variations of XCO2and anthropogenic CO2emissions in China based on multi- source carbon satellite fusion products [J]. China Environment Science, 2023,43(3):1053-1063.

[35] 陶 莹,杨 锋,刘 洋,等.K均值聚类算法的研究与优化[J]. 计算机技术与发展, 2018,28(6):90-92. Tao Y, Yang F, Liu Y, et al. Research and optimization of K-means clustering algorithm [J]. Computer Technology and Development, 2018,28(6):90-92.

[36] Wheeler D, Ummel K. Calculating CARMA: Global estimation of CO2Emissions from the power sector [J]. Working Papers, 2008, DOI:10.2139/ssrn.1138690.

[37] Ummel K. CARMA revisited: An updated database of carbon dioxide emissions from power plants worldwide [M]. Center for Global development. 2012.

[38] Chevallier F, Broquet G, Zheng B, et al. Large CO2emitters as seen from satellite: Comparison to a gridded global emission inventory. Geophys. Res. Lett, 2020,49:e2021GL097540.

[39] Jonas M, Marland G, Krey V, et al. Uncertainty in an emissions- constrained world [J]. Clim. Change, 2014,124:459–476.

[40] Wang R, Tao S, Ciais P, et al. High-resolution mapping of combustion processes and implications for CO2emissions [J]. Atmos. Chem. Phys., 2013,13:5189–5203.

[41] Wang C, Corbett J.J, Firestone J. Improving Spatial Representation of Global Ship Emissions Inventories [J]. Environ. Sci. Technol., 2008, 42:193–199.

[42] 甄江红,成 舜,郭永昌,等.包头市工业用地土地集约利用潜力评价初步研究[J].经济地理, 2004,(2):250-253. Zhen J H, Cheng S, Guo Y C, et al. Preliminary study on land intensive utilization potential evaluation of industrial land in Baotou City [J]. Economic Geography, 2004,(2):250-253.

[43] 段文娇,郎建垒,程水源,等.京津冀地区钢铁行业污染物排放清单及对PM2.5影响[J]. 环境科学, 2018,39(4):1445-1454. Duan W J, Lang J L, Cheng S Y, et al. Emission inventory of iron and steel industry and its impact on PM2.5in Beijing-Tianjin-Hebei region [J]. Environmental Science, 2018,39(4):1445-1454.

[44] 李厚民,王登红,李立兴,等.中国铁矿成矿规律及重点矿集区资源潜力分析[J]. 中国地质, 2012,39(3):559-580. Li H M, Wang D H, Li L X, et al. Metallogenic regularity of iron ore and resource potential analysis of key ore concentration areas in China [J]. Geology in China, 2012,39(3):559-580.

A neural network partitioning method for carbon emission estimation based on spatial-temporal clustering of atmospheric CO2concentration.

ZHANG Shao-qing1,2,3, LEI Li-ping1,2*, SONG Hao4, GUO Kai-yuan1,2,3, JI Zhang-hui1,2,3, SHENG Meng-ya5,6

(1.Key Laboratory of Digital Earth Science, Aerospace Information Research Institute, Chinese Academy of Sciences, Beijing 100094, China;2.International Research Center of Big Data for Sustainable Development Goals, Beijing 100094, China;3.University of Chinese Academy of Sciences, Beijing 100049, China;4.China University of Geosciences (Beijing), Beijing 100083, China;5.China Highway Engineering Consultants Corporation, Beijing 100094, China;6.Space Information Application and Disaster Prevention and Mitigation Technology Transportation Industry R & D Center, Beijing 100094, China)., 2023,43(10):5604~5613

Aiming at the non-normal distribution of anthropogenic carbon emissions due to the large spatial difference of magnitude, a neural network estimation model for anthropogenic carbon emissions was proposed in this study based on the clustering of spatial-temporal variation characteristics of satellite XCO2. Using the spatial and temporal variations of satellite XCO2(2010~2021), which are strongly correlated with anthropogenic carbon emissions, for clustering and partitioning, and utilizing satellite-observed SIF, nighttime lighting, as well as population density and anthropogenic emission inventory(EDGAR) as training data, neural network models for Carbon emission estimation were built respectively in each cluster region, and the anthropogenic carbon emissions of the study area were estimated for the year 2021. Cross-verification results with EDGAR show that compared with the unified modeling method based on the data of the whole study area, the estimation result of the partition modeling proposed in this study increased the correlation coefficient (2) from 0.43 to 0.82, with more reasonable spatial distribution, and the mean deviation decreased from 0.039Mt CO2to 0.018Mt CO2. The study shows that the estimation of anthropogenic carbon emissions using neural network training with multi-source data can provide data support for the characterization of regional carbon emissions and the assessment of uncertainty in emission inventories.

anthropogenic carbon emission;neural network;multi-source data;machine learning

X51

A

1000-6923(2023)10-5604-10

2023-03-09

国家重点研发计划项目(2022YFC3800700);国家重点研发计划项目(2020YFA0607503)

* 责任作者, 研究员, leilp@radi.ac.cn

张少卿(1994-),男,山东青州人,中国科学院空天信息创新研究院博士研究生,主要从事人为碳排放定量估算方面研究.发表论文1篇. zhangsq@radi.ac.cn.

张少卿,雷莉萍,宋 豪,等.一种基于大气CO2浓度时空特征的碳排放分区估算方法 [J]. 中国环境科学, 2023,43(10):5604-5613.

Zhang S Q, Lei L P, Song H, et al. A neural network partitioning method for carbon emission estimation based on spatial-temporal clustering of atmospheric CO2concentration [J]. China Environmental Science, 2023,43(10):5604-5613.

猜你喜欢

人为分区偏差
上海实施“分区封控”
如何走出文章立意偏差的误区
两矩形上的全偏差
山高人为峰
浪莎 分区而治
源正泉自清 山高人为峰
关于均数与偏差
基于SAGA聚类分析的无功电压控制分区
基于多种群遗传改进FCM的无功/电压控制分区
山高人为峰