APP下载

基于多源空间数据的山区人口分布模拟

2012-09-07曹伟超陶和平董学智

自然资源遥感 2012年2期
关键词:人口密度居民点缓冲区

曹伟超,陶和平,谭 理,张 云,董学智

(1.四川省第三测绘工程院,成都 610500;2.中国科学院水利部成都山地灾害与环境研究所,成都 610041)

基于多源空间数据的山区人口分布模拟

曹伟超1,陶和平2,谭 理1,张 云1,董学智1

(1.四川省第三测绘工程院,成都 610500;2.中国科学院水利部成都山地灾害与环境研究所,成都 610041)

人口资源是制约山区发展的关键因素,其分布状况在一定程度上反映和决定了山区的资源环境安全状况和社会经济发展水平。在分析川滇黔接壤地区山区人口分布影响因素的基础上,结合已有方法,构建了适合山区人口数据空间化的模型。以2007年人口统计数据为基础,以居民点作为人口分布指示因子,利用GIS软件工具,分析了居民点分布与地貌形态、土地利用、道路以及水系间的关系。基于多源空间数据融合的思想,引进了居民点缓冲区的概念,以较客观的赋权方式确定影响因子权重,实现山区人口统计数据的空间化。结果表明,通过融合产生的人口密度与乡镇级人口密度的相关性均在0.80以上,结果可靠,为进一步分析山区人口分布格局提供了重要的基础数据。

人口分布;统计数据;空间化;地理信息系统;山区

0 引言

中国是个典型山地国家,山地面积约占国土面积的70%,山地区居住人口5.8亿,约占全国人口的45%[1],山区发展也是我国经济发展的重要组成部分,了解山区人口分布特点对指导山区发展有重要的意义。人口在山区的分布具有在水平空间差异大,在垂直空间分布差异明显的双重特征[2]。然而这种定性的描述并不能为决策者提供足够和具体的信息,定量描述人口分布规律非常必要。人口数据空间化是一种可行的方法,它是将人口数据潜在与隐含的空间特征通过最直接的形式予以表达,提供了带有地理空间信息的人口信息,增加了人口数据的信息含量,更好地反映人口空间分布原貌,而且数据本身不受行政区划限制,具有随意分割性,在社会、经济和科研等诸多方面具有重要意义和广阔的研究前景。

在RS和GIS技术的支持下,通过综合分析主要人口分布影响因素与人口分布相关性,实现人口空间化是一个可行的思路[3-6]。如 Sweitzer J 等[7]考虑了各因子对人口分布的影响,但各因子对人口分布影响权重采用主观打分的方式,没有对模型的计算结果进行检验;董春等[8]通过对各因子统计分析得到各因子的权重系数,但没有提供单元人口数量的校验结果;王春菊等[9]基于多源数据融合思路实现了对福建省人口数据空间化,但没考虑城市和郊区的差异,且更适合沿海地区,普适性较差。

本文以典型山区——川滇黔接壤地区作为研究区,以地貌形态、土地利用、道路交通和水系作为影响因素,居民点作为人口分布的指示因子,考虑到城市与郊区的差异,以多源空间数据融合思想实现了人口数据空间化,为进一步分析山区人口分布格局提供了重要的基础数据。

1 研究区概况

研究区是四川、云南、贵州三省的结合部(图1),地理坐标在 E 100°3'~106°43',N25°2'~29°18'间,共含 74 个县(区、市),面积 19.2 万 km2,2007年底人口数为3 747万。本区地处我国第一级阶梯向第二级阶梯过渡地带,青藏高原、横断山地、云贵高原和四川盆地4大地理单元在这里复合,是我国山区分布集中和山地特征较为典型的一个地区,山地和高原占全区面积的80%以上。由于人口较密集,以及资源过度开发,导致人地关系矛盾突出,引发了大量的生态环境问题。从自然环境、经济社会状况和生态环境问题等方面来看,选择该区作为实现山区人口数据空间化的研究区具有典型性和代表性。

图1 研究区域区位示意图Fig.1 Regional location of study area

2 数据源和研究方法

2.1 数据源

本次研究使用的数据包括:①2007年ETM遥感影像数据和SRTM数据(90 m空间分辨率);②研究区2000年1∶25万土地利用数据(以2007年ETM遥感影像对其进行了更新);③研究区2007年县级行政区划数据和部分县乡级行政区划数据;④1∶5万地形图;⑤《四川省统计年鉴》等。

2.2 研究方法

人口分布主要受土地利用、河流水系、地貌形态、道路交通以及居民点分布等因子影响。本文采用多源空间数据融合的思想,具体技术路线见图2。

图2 山区人口分布模拟技术路线Fig.2 Technology roadmap of population distribution modeling of mountain area

首先,确定影响因子对人口分布的影响权重,实现影响因子与居民点数据融合;然后,将影响因子进行加权融合,得到区域内相对人口权重系数;最后,分县市将人口统计数据按照栅格相对人口权重系数分配到各县市栅格中,得到研究区人口密度栅格图。

本文选取典型县区,以乡级行政区划和乡级统计人口数据对结果进行验证,得到最终的人口分布模拟结果。

3 山区人口统计数据空间化

3.1 影响因子的确定和数据获取

人口密度是表现人口分布的主要形式。影响并决定中国人口密度空间分布的主要因素是自然环境条件和基础设施发展水平[10]。通过综合分析,对于川滇黔接壤区,影响人口分布的主要自然条件和基础设施因素可总结为地貌形态、土地利用类型、道路交通、河流水系以及居民点人口数据5大影响因子。

影响因子数据的获取主要是指对道路交通数据、土地利用数据的更新,以及地形数据的获取。道路交通数据的更新由2007年出版的道路交通图为底图进行扫描矢量化实现获得;土地利用数据则是以2000年土地利用数据为基础,通过2007年ETM遥感图像的解译,对其中变化最显著的要素(如居民点范围等)进行矢量化,实现了数据更新;河流水系分布状况数据源自1∶5万地形图数据提取的水系要素;研究区2007年分县人口统计数据和部分乡级人口统计数据取自《四川省统计年鉴》;居民点分布数据的点状数据来自1∶5万地形图,面状数据来自遥感解译;对于地貌形态数据,考虑到单一地形因子如高程、坡度或者起伏度等通常不能表现地形的主要特征,而需要综合考虑多种单一地形因子的影响,研究中采用了基于最佳地形特征空间地貌形态自动识别的方法,基于DEM数据,以坡度、地势起伏度、地表粗糙度、高程、地表累计曲率、高程变异系数、地表切割深度以及坡度变率等8个地形因子作为基础数据,应用相关矩阵法和雪氏熵值法[11]构建最佳地形特征空间,并采用遥感非监督分类中的迭代自组织数据分析法(ISODATA)[12]实现对地貌形态的识别(图3)。

图3 研究区地貌形态分布Fig.3 Geomorphic type distribution of study area

3.2 影响因子权重确定

居民点由于其空间定位特征及分布特征能在很大程度上反映人口分布状况——居民点附近人口密度明显高于远离居民点地区,一般居民点密度大的区域人口密度也大[13],可以作为人口分布的指示因子。下面以1∶5万地形图中的居民点分布数据为源数据,确定各影响因子权重。

3.2.1 地貌形态

将研究区地貌形态数据与居民点分布数据叠加,统计出各地貌形态类型面积、居民点数目和居民点密度(表1),并以居民点密度作为地貌形态对人口分布的影响权重。

表1 居民点在各地貌形态类型中的分布Tab.1 Density of settlements in different geomorphic types

从表1可以看出,地势较平缓的地区(如盆地、河谷平原、丘陵以及岩溶低山等地貌形态)居民点密度值较高,均在2 000个/万km2左右;高山、极高山地区该值最小,仅有98.22个/万 km2,几乎没有人口分布,可谓人烟稀少。说明人口分布与地形之间有着非常密切的联系。

3.2.2 土地利用类型

土地利用类型(特别是居民点、工矿用地和耕地)是人类与自然界相互作用的产物,是人类活动在空间分布上最直接的体现。将通过遥感解译更新后的土地利用数据与居民点分布数据叠加,获取各土地利用类型的居民点密度(表2),并以此作为土地利用对人口分布的影响权重。

表2 居民点在各土地利用类型中的分布Tab.2 Density of settlements in different landuse types

从表2可看出,建设用地中居民点密度最高,达到8 862.94个/万km2,明显高于其他类型;耕地的居民点密度值也较高,均在2 400个/万km2以上;其余土地利用类型中的居民点密度值均较低,最低的为水域及滩地、有林地和其他难利用土地,其值在400个/万km2左右。说明土地利用与人口分布之间存在明显的相关性,尤其是居民点用地和耕地。

3.2.3 道路交通

对研究区内主要道路(包括铁路、高速公路及高等级公路)以500 m间隔做缓冲区,将生成的缓冲区图层与居民点分布数据叠加,获取各缓冲区居民点密度(表3),以此作为道路交通对人口分布的影响权重。

表3 居民点分布与距离主要道路距离关系Tab.3 Density of settlements in different distances to main roads

从表3可看出,随着缓冲半径的增加,居民点密度总体呈现递减的趋势,居民点密度最高为2 213.37个/万 km2,只在1 500 ~2 000 m 距离时略有增加;其余居民点密度均表现为减小,距离3 500 m以外时为最小值1 247.98个/万km2。

3.2.4 河流水系

对研究区内主要河流以1 km间隔做缓冲区,将生成的缓冲区图层与居民点分布数据叠加,获取各缓冲区居民点密度(表4),以此作为河流水系对人口分布的影响权重。

表4 居民点分布与距离河流距离关系Tab.4 Density of settlements in different distances to main rivers

从表4中可看出,随着缓冲区半径的增加,居民点密度总体呈现递减的趋势,在缓冲区距离在1 km以内时居民点密度最高位1 809.42个/万km2;在2~3 km和5~6 km距离时略有增加,其余居民点密度均表现为减小;距离10 km以外时居民点密度为最小值 1 248.80 个/万 km2。

3.2.5 居民点人口

居民点可分为城市居民点和非城市居民点,每个居民点都具有面积属性作为其人口的分布空间。居民点人口以人口密度作为其权重,根据研究区的总体发展水平,应分别确定城市居民点和非城市居民点人口权重[26]。

1)城市居民点人口权重。以研究区城镇总人口除以城市用地总面积得到城市人口密度,作为城市居民点人口权重。2007年研究区非农业人口总数480.13 万人,城市用地总面积为 323.01 km2,计算得到城市平均人口密度,即城市居民点人口权重为14 832.24 人/km2。

2)非城市居民点权重。将非城市居民点分为区镇居民点、村庄居民点及远离居民点地区3类,分别确定其人口权重。首先确定居民点面积,对于村庄居民点,获取2000年土地利用图中各县农村居民点面积均值,并以此计算各县居民点等价半径。考虑到居民点7 a当中的扩张,在此基础上加50 m作为2007年居民点半径;对于区镇居民点,以2007年各县村庄居民点半径的1.5倍为其半径,即初始面积的2.25倍进行计算,这比较符合实际。

以各自半径建立缓冲区作为村庄居民点面积和区镇居民点面积,剩余即为远离居民区面积。通过计算得到区镇居民点面积为253.83 km2,村庄居民点面积为6 584.32 km2,远离居民点面积为184 746.20 km2,则对于非城市人口有公式:

式中:Prural表示非城市总人口;Dtown,Drural及 Drest分别表示区镇居民点、村庄居民点及远离居民点区平均人口密度;Stown,Srural及Srest分别表示区镇居民点、村庄居民点及远离居民点区面积。将各自面积数据带入式(1),则

一般情况下,Drural远大于Drest,而Dtown又明显大于Drural。根据每个县农村人口数、区镇居民区面积、村庄居民区面积以及远离居民区面积进行线性回归分析。将具体数据带入,则可得出 Dtown=5 311.05人/km2,Drural=2 174.27 人/km2,Drest=92.14人/km2,即得到了区镇居民点、村庄居民点及远离居民区的人口权重。

3.3 影响因子加权融合

考虑到人口分布的连续性与渐变性、人口的流动性以及各种居民点的辐射作用,对城市用地和各种居民点缓冲区分别作次级缓冲区和3级缓冲区。按照其对人口分布的辐射范围及强弱,根据居民点类型确定各自缓冲区的半径,并根据居民点类型分别为其赋人口权重(表5),得到最终各类型居民点人口权重。

表5 各级居民点缓冲区半径和人口权重Tab.5 Buffer radius and population weights in different settlements

表5中,R1,R2,R3分别表示各县城市居民点、区镇居民点和农村居民点面积的等效半径;D1,D2,D3分别表示城市居民点、区镇居民点和农村居民点的人口权重。由以上计算得知,D1=14 832.24,D2=5 311.05,D3=2 174.27。

以生成研究区相对人口密度栅格图为目的,进行了影响因子加权融合。主要包括以下几个步骤:

1)获取各因子决定的人口权重相对值Vr,该值使得各因子所得的人口权重值具有可比性,即

式中:Di为因子某个分级(i级)的人口权重值;i表示具体为哪个分级;N为因子分级(类型)的个数;t表示遍历的所有分级。

2)获取各因子人口分布相对值Pr,将各因子决定的人口权重相对值与居民点人口权重结果叠加,得到4个因子分别决定的人口分布相对值图层。

3)获取研究区相对人口密度栅格图,应用层次分析法(AHP)通过加权融合的方法得到,即

式中,Pr0为相对人口密度栅格值;n为因子个数,这里取4;λt为因子影响权重。

应用层次分析法得到的地貌形态、土地利用、道路交通以及河流水系4个因子的影响权重分别为0.371 7,0.275 4,0.158 9 及0.194 0,以此加权求和便得到研究区相对人口密度图。

3.4 人口分布模拟

为了保持与区县级人口统计数据的吻合,本研究分区县进行山区人口分布模拟。首先应将研究区中的河渠、湖泊、永久冰川、沼泽地以及水库坑塘等不适合人类居住的土地类型剔除,并将其人口密度相对值赋值为零。在此基础上按行政区划将研究区裁剪为74个单元,分别按照以下公式进行计算,即

式中,Pri为任意栅格点相对人口密度;Pt为某区县人口总数;Pi为该栅格点上分布人口数;n为某区县栅格数。得到 Pi后再除以单位栅格面积(1 km2),得到最终100 m×100 m栅格的人口密度分布图(图4)。

图4 研究区人口密度分布栅格图Fig.4 Map of population density grid in study area

3.5 结果验证

以研究区典型区(县)域乡级人口统计数据对模拟人口分布数据进行了验证。考虑到结果验证的可靠性,分别取四川省宜宾县、云南省元谋县、贵州省的大方和纳雍县作为验证区域。通过纸质地图扫描和矢量化获得该4县的乡级行政区划,分别具有乡镇数据为:宜宾县27个、元谋县13个、大方县35个、纳雍县26个,即在研究区获取采样点111个。利用研究区模拟人口分布栅格结果计算各个乡镇的人口总数,与各县的统计年鉴的乡级人口数据做相关性分析,得出的相关系数为:四川省宜宾县为0.843,云南省元谋县为 0.993,贵州省大方县和纳雍县分别为0.998和0.852。相关系数值较高,均在0.84以上,说明人口分布模拟结果与实际人口分布比较吻合。

对不同土地利用类型、地貌形态、距河流水系不同距离缓冲区以及距主要道路不同距离缓冲区中人口密度与居民点密度做相关性分析,相关系数分别为0.958,0.850,0.940 和0.965,均具有很高的相关性。说明以居民点密度作为表征人口分布影响因子权重的参考数据是合理的,同时也在一定程度上验证了结果的可靠性。

4 结论

1)通过数学方法研制了研究区人口密度栅格图,将不规则区域人口统计数据统一分布到栅格上,并在此基础上进行了定量的数据统计分析,提高了人口分布在空间上的可对比性,为实现区域人口的定量分析提供了可行的数据描述方法。

2)采用多源空间数据融合的思想,结合GIS技术、地统计分析技术和相关的统计资料,选取合理的人口分布影响因子组合,完成了比较详细、可靠和准确的川滇黔接壤地区人口密度分布栅格图,为山区人口统计数据空间化提供一种思路,打破了传统的以行政区划为单元进行人口分布研究的方法[14]。

3)在居民点面积的确定上,充分考虑到人口分布的连续性和渐变性、人口的流动性以及各种居民点的辐射作用,引进了作用缓冲区的概念,并对作用缓冲区进行分级,取得了理想的效果。

4)由于数据源的限制,城市居民点数据只考虑了其位置和面积大小,没有考虑城市的现代化和经济水平;道路交通数据只考虑了长度,没有考虑其等级和质量;河流水系也没考虑其运输能力,沿岸港口货物吞吐能力等。同时各因素之间的相关性也未充分研究。这些对研究结果的精度均会产生一定的影响。

[1]陈国阶.对中国山区发展战略的若干思考[J].战略与决策研究,2007,22(2):126 -131.

[2]钟祥浩,余大富,郑 霖.山地学概论与中国山地研究[M].成都:四川科学技术出版社,2000.

[3]廖顺宝,孙九林.基于GIS的青藏高原人口统计数据空间化[J].地理学报,2003,58(1):25 -33.

[4]田永中,陈述彭,岳天祥,等.基于土地利用的中国人口密度模拟[J].地理学报,2004,59(2):283 -292.

[5]Ryavec K E,Verigin H.Population and Rangelands in Central Tibet:a GIS - based Approach[J].GeoJournal,1998,44(1):61 -72.

[6]杨小唤,江 东,王乃斌,等.人口数据空间化的处理方法[J].地理学报,2002,57(增刊):70 -75.

[7]Sweitzer J,Langaas S.Modeling Population Density in the Baltic Sea States Using the Digital Chart of the World and Other Small—Scale Data Sets[C]∥In:Gudelis V,Prvilanskas R,Roepstorff A.Coastal Conservation and Management in the Baltic Region.Proceedings of the EUCC—WWF Conference,1994,2 -8.

[8]董 春,刘纪平,赵 荣,等.地理因子与空间人口分布的相关性研究[J].遥感信息,2002(4):61-64.

[9]王春菊,汤小华.基于GIS的福建省人口统计数据空间化[J].地理与地理信息科学,2004,20(4):71-74.

[10]王桂新.中国人口分布与区域经济发展[M].上海:华东师范大学出版社,1997.

[11]宋 佳.基于DEM的我国地貌形态类型自动划分研究[D].西安:西北大学,2006.

[12]赵英时,等.遥感应用分析原理与方法[M].北京:科学出版社,2007.

[13]王春菊,汤小华,吴德文.福建省居民点分布与环境关系的定量研究[J].海南师范学院学报:自然科学版,2005,18(1):89-92.

[14]Martina D.An Assessment of Surface and Zonal Models of Population[J].InternationalJournalofGeographicalInformation Systems,1996,10(8):973 -989.

Simulation of Mountain Population Distribution Based on Multi-source Spatial Data

CAO Wei-chao1,TAO He-ping2,TAN Li1,ZHANG Yun1,DONG Xue-zhi1
(1.Sichuan Third Surveying and Mapping Engineering Institute,Chengdu 610500,China;2.Institute of Mountain Hazards and Environment,Chinese Academy of Science,Chengdu 610041,China)

Population resources are key factors for the development of mountain areas.The distribution conditions of population resources reflect and determine to some extent socio-economic development and sustainable development of mountainous areas.In this paper,a newer population data spatialized model for mountain areas is developed based on existing methods and factors influencing population distribution of mountain areas.Based on population census data in 2007,this paper analyzed the relationships between the distribution of residential areas and terrain,land use,roads,and rivers by using the GIS software and taking the residential area as an important indicator to population distribution.Based on multiple spatial sources data fusion technology,the authors dealt with the concept of settlements buffer,assigned the weight values of affecting factors objectively,and realized the spatialization of population census data for mountain areas completely.The result shows that there are correlations of ratio(>0.80)between the population density generated by data fusion and the actual population census data at the township level,and the result is reliable.The finally generated grid population density lays an important basic data foundation for the further analysis of the pattern of population distribution in mountain areas.

population distribution;census data;spatialization;GIS;mountain area

X 24;P 208

A

1001-070X(2012)02-0061-07

曹伟超(1986-),助理工程师,硕士研究生。研究方向为地理省情监测和地理信息系统。E-mail:cwcchinaabc@163.com。

(责任编辑:李 瑜

)

10.6046/gtzyyg.2012.02.12

2011-08-23;

2011-11-15

中国科学院知识创新工程重要方向项目(编号:KZX2-YW-333)及四川省科技支撑计划项目(项目编号为:2012SZ0091)共同资助。

猜你喜欢

人口密度居民点缓冲区
基于GIS的金海湖居民点空间分布特征及其影响因素研究
基于遥感技术的轩岗矿区农村居民点时空格局变化研究
串行连续生产线的可用度与缓冲库存控制研究*
基于ARC的闪存数据库缓冲区算法①
高速铁路与经济增长的因果关系
关于我国房地产价格的思考
三江源玉树藏族自治州寺院和居民点分布特征与土地利用变化分析
厦门市流动人口分布研究
初涉缓冲区
多目标缓冲区生成算法