APP下载

基于Landsat影像和统计数据的北京市人口密度制图

2022-10-11段艳慧赵学胜张晓莹张冰瑞

北京测绘 2022年8期
关键词:人口密度行政区人口普查

段艳慧 郭 伟 赵学胜 张晓莹 张冰瑞

(中国矿业大学(北京) 地球科学与测绘工程学院, 北京 100083)

0 引言

人口数据是最为重要的基础地理数据之一,对于国家和地区的相关情况调查、人口状况、管理以及制定各项方针政策等都具有重要的意义,而精细化的人口分布是当前人口地理学研究的热点和难点。人口分布分散,具有动态特征,不同的人口密度对自然资源和环境条件的影响也不同,因此,为了更好地应对我国城镇化发展所面临的各种环境与资源问题,有必要及时、快速地生成人口密度空间分布结果。传统的人口密度计算方法是根据人口普查数据进行计算,但计算时间长、成本高、更新困难。此外,用于公共用途的人口普查数据难以准确、真实地反映人口在空间上的分布规律,中国的县级人口普查数据对于城市规划和管理等方面来说不够细致,难以满足城市规划和发展的需要。

在过去的几十年里,许多学者探究了利用不同的遥感和辅助数据估算人口的方法。这些研究多针对现有的土地利用数据,而并非所有土地利用类型均有人口分布,例如,水体、耕地、森林等。在土地利用数据中,不透水面(impervious surface area, ISA)是城市中人类活动的主要场所,研究表明,利用ISA可以进行人口估计。同时,利用Landsat影像可以准确地估计ISA。而由于县级尺度的人口普查数据过于粗糙,需要像元尺度的更详细的人口密度数据。但在小尺度上进行的研究很少,在小尺度上快速而准确地估计人口密度的过程尚不为人知。目前尚缺乏绘制人口密度分布图的合适技术或方法。因此,本文试图通过区(县)尺度上的人口密度与遥感影像获取的ISA数据之间的关系来绘制30 m像元尺度上的人口密度分布图。

1 研究区和研究数据

1.1 研究区概况

本文选取北京市为研究区,开展基于Landsat遥感影像的人口密度研究。北京(Beijing)位于中国华北平原北部,背靠燕山,毗邻天津市和河北省,是中华人民共和国首都、直辖市、国家中心城市、超大城市,全国政治中心、文化中心、国际交往中心、科技创新中心。北京位于115.7 °~117.4 °E,39.4 °~41.6 °N。截至2020年,全市下辖16个区,总面积16 410.54 km,常住人口2 189.31万人。北京市经济发展水平较高,人口较为集中分布,路网分布密集,是城市化发展高水平的代表城市之一。

1.2 研究数据

本研究采用美国陆地卫星计划(Landsat)的第八颗卫星(Landsat8)、开源地图(open street map,OSM)、可见光红外成像辐射仪(visible infrared imaging radiometer,VIIRS)-日夜波段(day/night band,DNB)夜间灯光数据、第七次人口普查数据(含乡镇街道级别)、Worldpop数据以及行政边界数据。由于使用的数据源不同,因此,首先要对所有的数据进行重投影以保持各数据之间的一致性。采用线性光谱混合分析法(linear spectral mixture analysis,LSMA)对Landsat8影像进行处理绘制北京市ISA分布。Worldpop数据作为已有人口密度数据用来对本文方法所作结果进行对比分析。

人口普查数据来自北京市第七次全国人口普查公报(第二号)(北京市统计局)。全市16个区中,常住人口在200万人以上的区有4个,分别是朝阳区、海淀区、昌平区和丰台区;在100万人~200万人之间的区有5个,分别是大兴区、通州区、顺义区、房山区和西城区;在100万人以下的区有7个,分别是东城区、石景山区、密云区、平谷区、怀柔区、门头沟区和延庆区。

2 研究方法

利用Landsat8影像与北京市2020年人口普查数据绘制人口密度的基本流程如图1所示。

注:①迭代自组织数据分析算法(iterative selforganizing data analysis,ISODATA)。图1 基于Landsat8与普查数据的人口密度流程图

2.1 利用Landsat8影像绘制ISA分布并评定精度

为了使用LSMA方法有效地处理图像,选择合适的端元是至关重要的。由于影像3、4、5波段基本涵盖所有的地类信息,所以在从Landsat多光谱波段提取3个组分的散点图时,从中选择3个具有代表性的端元高反照率目标、低反照率目标和植被。然后利用混合像元分解的方法将Landsat8多光谱图像分解为三分体图像。

由于ISA主要存在于高反照率目标和低反照率目标的图像中,因此,去除该图像中的非不透水面区域至关重要。以往的研究表明,归一化水体指数(normalized difference water index, NDWI)在从其他土地覆盖类型中分离出水体是有效的,因此,可以利用归一化水体指数来去除水体。由于初步ISA结果可能与其他土地覆盖类型相混淆,因此除水体外,需要进行图像后处理来进一步去除图像中的非不透水面区域。

利用谷歌地球的高空间分辨率图像对提取的ISA进行精度验证,采用随机抽样的方法选择验证样本,共选取600个样本,其中包含400个非ISA样本和200个ISA样本。采用误差矩阵来评估ISA精度,从误差矩阵中计算生产者精度、用户精度和总体精度。

2.2 提取居民区ISA

由于在城市的发展建设中,道路、广场、停车场、机场等地越来越发达,此类设施属于不透水面但并非居住区,因此,为了更加准确地对人口进行估计,需剔除不透水面中的非居民居住区域。OSM旨在为用户提供免费且易于访问的数字地图资源,是现阶段最受欢迎的自发地理信息数据,这类数据与传统的地理空间数据相比,具有丰富、实时、更新速度快等优势。因此,本文利用OSM数据对非居民区进行剔除。

2.3 在行政区划尺度上绘制人口密度并验证

人口密度(人/km)和ISA密度在区划尺度上按行政单位计算。选取16个行政区的人口密度数据作为因变量,相应的ISA密度数据作为自变量。对线性和非线性回归模型进行了探讨。利用决定系数(

R

)确定行政区尺度上人口密度估计的最佳估计模型。

从2020年人口普查数据中可得北京市街道级别的人口数,北京市共有337个街道,随机抽取200个街道进行验证并绘制残差图像。

2.4 绘制30 m像元大小的人口密度分布

区尺度的人口密度分布只是行政单位的平均值,没有考虑不同的土地利用/覆盖类型;因此,这种分布不能准确地表示人口密度分布的空间格局。我们可以假设人口只分布在ISA存在的地方,而没有人口出现在其他土地使用类型,如森林、农业用地和水体等。因此,像元大小处的人口密度可以表示为

(1)

其中,

D

为像元处的人口密度;

D

为行政区的人口密度;

A

为行政区面积;

f

为像元处的不透水面值;

n

为该行政区内的ISA像元个数,非ISA的像元值为0。

3 结果与分析

3.1 ISA精度

要建立基于ISA的人口密度估计模型,关键的一步是对ISA数据进行准确地提取。对ISA的精度评估结果如表1所示,北京市ISA精度的生产者精度和用户精度分别为90.05%和86%,总体精度为92.17%。该研究进一步证实了基于LSMA的方法可以有效地从landsat8影像中提取ISA。

表1 ISA精度评定结果

3.2 行政区尺度人口密度分布

北京市下辖16区,总面积为16 410.54 km,根据2020年全国第七次人口普查数据,北京市总人口为21 893 095人。北京市行政区划人口密度为行政区总人数除以行政区面积,结果如图2所示,可以看出北京市中心城区的人口密度大,围绕中心呈发散状,距离中心城区越远,人口密度越小,西部和北部多为山区,人口密度最小。但由于该方法所得单位面积人口呈均匀分布,在山体、水体或森林等无人居住的地区也存在人口分布情况,因此,需要基于不透水面的像元尺度的人口密度图来解决这一问题。

图2 北京市行政区人口密度[审图号:GS(2019)3333号]

3.3 ISA密度与人口密度间模型建立与验证

3.3.1

30

m

像元的人口密度模型建立

由于行政区人口密度并未考虑人口与ISA之间的关系,为了进行更小尺度的人口密度图绘制,需要建立人口与ISA之间关系的模型。将人口密度与ISA密度之间进行线性和非线性回归分析。图3展示了人口密度与ISA密度的散点图,表明它们之间的关系可以用指数式(2)表示。

(2)

其中,

D

为人口密度;

D

为ISA密度。决定系数

R

=0

.

941 4,表明在行政区尺度上人口密度估计效果较好。

图3 人口密度与不透水面密度关系

利用模型反算行政区划人口密度,并根据式(2)进行30 m像元大小的人口密度的计算,结果如图4(b)所示,图4(a)为基于原始ISA生成的人口密度,可以看出,剔除掉非居民区后的人口密度较之前的图像降低了人口密度低估的问题,更加贴近实际情况。图5为北京市Worldpop人口密度数据,放大后可以看出,其人口分布沿道路扩散,且道路上人口密度最大,而道路明显不属于居民地,图6则为最终北京市30 m像元人口密度及局部放大图,相比目前已有的Worldpop人口密度数据更加精确和细致。其中,核心城区(东、西城区)91%的人口分布在20人以上的像元中,最大可达每像元36人,而密云、怀柔、门头沟和延庆地区每像元的人口均低于20人。该结果与行政区人口密度结果大体相似,依然显示北京市中心城区人口密度大,西、北部山区地区人口密度小。但相比行政区尺度的人口密度图,该图可以显示更多的空间细节,而且弥补了人口出现在无人居住区的不足,更加符合实际人口居住情况。

(a)原始ISA生成的人口密度

(b)居民区ISA生成的人口密度

图5 北京市Worldpop人口密度数据

图6 北京市30 m像元人口密度图

3.3.2

30

m

像元的人口密度模型验证

建立人口密度与ISA密度之间的模型后,需验证该模型是否可用。利用北京市第七次人口普查乡镇街道级数据对该模型进行验证,得出估计人口与参考人口之间的关系如图7所示,表明了良好的线性关系,说明所建立的人口密度与ISA密度之间的模型可用。估计人口残差如图8所示。

图7 估计人口与参考人口关系

图8 估计人口残差

4 结束语

本研究基于北京市行政区人口密度与不透水面密度数据之间的关系,为30 m像元尺度上的人口密度分布图提供了一种新的方法,首先,利用Landsat8遥感影像提取北京市不透水面并验证其精度。其次,建立行政区人口密度与不透水面密度之间的关系。最后,假设人口只存在于不透水面地区,并用OSM数据剔除道路、停车场等非居民区,将人口数据反算到30 m像元尺度,实现人口密度空间化制图。该方法为人口密度分布的空间格局提供了丰富的信息,具有利用遥感数据快速更新人口密度的潜力,对没有普查数据的发展中国家尤其有价值。但在实际发展中,建筑高度是影响人口密度估算的一个重要因素,因此,需要进行更多的研究,将土地利用类型和建筑物高度纳入遥感数据,以便建立更为完善的人口密度估计模型。

猜你喜欢

人口密度行政区人口普查
京字头
人口普查学问多
邮票上的人口普查
邮票上的“人口普查”
人口普查为什么既要“查人”又要“查房”
上榜派出所统计表
上榜派出所统计表
高速铁路与经济增长的因果关系
关于我国房地产价格的思考
厦门市流动人口分布研究