APP下载

基于百度迁徙数据的山东省城市网络结构特征研究

2023-11-22张克伟来逢波黄玉娟

地理信息世界 2023年3期
关键词:子群经济圈人口

张克伟,来逢波,黄玉娟

山东交通学院 山东省交通运输与区域发展研究中心,济南 250357

1 引 言

在全球信息化背景下,随着互联网、大数据等信息技术的深度应用及现代化交通基础设施的完善,信息、人口和资本等多要素实现了跨越区域的快速流动。传统的“地方空间”逐渐被“流空间”替代,城市联系状态从静态的城市节点属性的表达转向动态的城市间流数据的多维度表达,利用实体“流”来表征城市网络结构成为近年来国内外研究的新趋势(王姣娥等,2018;游悠洋等,2020)。

在Castells(2007)提出要素流可以反映城市联系网络的观点后,城市网络的内涵逐渐丰富,由最初的引力模型网络扩展为多种类型的实体流网络。交通流视角下的城市网络研究主要集中在公路(李苑君等,2021)、铁路(陈俐锦等,2021)、航空(Matsumoto,2004)和航运(潘坤友等,2017)等交通方式,大多基于高速公路收费站车流量数据、铁路和民航班次数据等客货流数据来分析城市联系网络的空间结构特征、区域效应和演化规律等。信息流视角下的城市网络研究大多基于百度指数大数据,以两两城市间相互的关键词搜索指数来构造城市联系网络,并进行网络结构分析(宗会明等,2022;李春平,2015)。也有研究利用微博数据(甄峰等,2012)、百度贴吧数据(邓楚雄等,2018)等互联网交互数据分析城市间的信息交流网络特征。资本流视角下的城市网络研究集中在企业相关的网络联系,如企业各个集团之间的联系网络(周晓艳等,2020)、基于企业空间分布数据的组织网络(赵新正等,2019)和城市间物流关系网络(宗会明和吕瑞辉,2020);其主要通过企业关联特征反映城市网络的复杂关系、空间分异。

就研究数据源而言,交通流数据侧重于单一交通方式的网络关系,信息流数据存在用户群体的局限性问题,资金流数据往往仅能表征城市的经济联系网络。人口迁徙大数据是基于地理位置服务技术采集和处理所形成的起讫点(origin destination,OD)数据,以百度迁徙数据(张小东等,2021)、腾讯位置数据(刘海洋,2021)和高德迁徙数据(陆杰华和刘烁瞳,2020)为主,具有用户广度高、覆盖交通方式多的优点。同时,人口流动承载了知识、资金等多要素的空间传递,因而可更好地表征城市联系网络。已有的基于迁徙数据的城市网络研究以分析空间结构和影响因素为主(张伟丽等,2021;姚永玲和邵璇璇,2020),并且侧重于对点属性和面属性的测度,少有观测变量的空间相关性分析和线要素的指标分析。基于此,本文利用百度迁徙数据,从“点”“线”“面”三方面对山东省进行城市网络分析和空间聚集性分析,以期为城市协调可持续发展提供科学依据。

2 数据来源与研究方法

2.1 数据来源与处理

迁徙数据来源于百度迁徙平台(http://qianxi.baidu.com)。考虑到节假日、春运等会造成城市间迁徙量激增的情况,为了较好地反映城市间日常的联系强度,选取2021 年5 月15~21 日共一周的山东省16 个地级市间的OD 迁徙数据(包括城市间迁入迁出占比和迁徙规模)。计算出山东省内两两城市间的日均有向迁徙强度值,并构造16×16 的有向OD 网络矩阵。

2.2 研究方法

2.2.1 社会网络分析方法

通过研究网络中节点的特性和节点间的相互作用关系,展现网络的整体结构特征。研究主要从密度、单向迁徙强度、凝聚子群和中心性四个方面定量分析山东省城市发展空间格局(彭庭莹和陈刚,2023)。

1)网络密度

网络密度表达的是一个网络中各个节点之间联系的稠密程度,用实际存在的连线数量与最多可能存在的连线数量的比值表示,有向网络图的密度计算公式如下:

式中,D为网络密度;L为网络图中实际存在的连线数量;a为迁入来源地;b为迁出目的地;n为网络中节点的数量。

2)单向迁徙强度

单向迁徙强度的含义为两个节点之间单向作用关系的最强代表,用两个城市之间的人口迁出强度的最大值表示:

式中,Bij为城市i和城市j之间的单向迁徙强度;Rij、Rji分别为两城市间的迁入、迁出强度。

3)凝聚子群

凝聚子群分析法是依据两两节点间的联系特征,通过迭代、聚类的方法将所有研究节点划分为若干小团体,以此来分析团体内部及团体之间的相互作用关系、组团演化特征等,通常用子群树状图和密度矩阵来表达。

4)中心性

中心性是节点与其他节点的联系强度,用来表征节点的核心地位强弱,通常包括点入度、点出度和点中心度三个指标。点入度是指向该点的其他点的数量和;点出度是该点指向的其他点的数量和;点中心度是点入度和点出度之和。本文对其进行加权、求差处理,引入加权入度、加权出度、加权点中心度和净加权入度四个指标:

式中,d(i)in、d(i)out分别为城市i的加权入度和加权出度;d(i)、d'(i)分别为城市i的加权点中心度和净加权入度。

2.2.2 空间自相关分析

空间自相关用来分析观测变量在空间分布上是否具有集聚性,包括全局空间自相关和局部空间自相关两方面。全局空间自相关用来衡量研究区域内所有个体与相邻个体空间之间依赖性的整体特征,主要采用全局莫兰指数进行度量和标准化统计量Z值用于显著性检验。全局莫兰指数(I)及检验Z值计算如下:

式中,n为研究区域内研究单元个数;xi、xj为相邻研究单元的属性值;w ij为空间权重系数矩阵的第i行第j列元素。I的计算值为-1~1:I> 0表示空间正相关;I< 0表示空间负相关;I= 0表示空间随机分布。

局部空间自相关侧重于特定个体与邻近个体之间关联性的空间分异特征,主要采用莫兰散点图和LISA 集聚图进行研究:

式中,I i为地区i的局部莫兰指数;S2为样本方差。

3 结果与分析

3.1 城市人口流动网络分析

3.1.1 网络密度分析

城市网络密度能反映出各节点城市的空间聚集紧密程度,以有向迁徙矩阵的平均值为阈值,利用Ucinet6.0 构建二值矩阵,并计算网络密度,如表1、图1 所示。

图1 二值化后的人口迁徙拓扑网络Fig.1 Binary topological network of population migration

表1 网络密度Tab.1 Network density

由图1 看出,人口流动网络中共有16 个城市节点,两两城市间都存在相互的人口迁徙,共形成240 条连线(计算得到连线权重的平均值为5.9),其中,超过人口迁徙强度平均值的有向连线共有71条,说明仅有少数城市处于较好的人口输入输出状态,整体上流动强度不均衡。根据城市空间格局演变特性的相关理论,当城市群的网络密度超过某一阈值时,整体会呈现蔓延和连绵成大集团的趋势,其中,空间结构为三角形、正方形、蜂房及连续区的密度阈值分别是0.5、0.593、0.698 和0.5(叶强等,2017)。《山东省国土空间规划(2021—2035 年)》提出要发展形成以省会经济圈、胶东经济圈、鲁南经济圈为重点的城镇空间新格局,因此,可将山东省城市群近似看为三角形点阵。山东省整体网络密度为0.296,远小于对应阈值0.5,说明各城市之间的人流联系程度整体较低,山东省整体的人口流动的联结状态较弱。

由表1 知,胶东经济圈的网络密度最高,说明胶东经济圈内部城市人口相互联系的密集性最高,其次为鲁南经济圈和省会经济圈;省会经济圈高于平均值的边数最多,说明省会经济圈内的城市之间存在更多的高强度人口流动,其次为胶东经济圈和鲁南经济圈。对比发现,省会经济圈虽高于平均值的边数最多,但是网络密度却最低,说明省会经济圈内城市间的人口交流密集程度不高,相对分散。胶东经济圈和鲁南经济圈各自内部城市群的高流量边数不如省会经济圈,但人口迁徙网络密度相对较高,内部人流更稠密。

3.1.2 单向迁徙强度分析

利用ArcGIS10.2,依据自然断点法对单向迁徙强度进行聚类分析,得到五级分布,如图2 所示。

图2 单向迁徙强度空间结构Fig.2 Spatial structure of unidirectional migration intensity

省会经济圈范围内,具有高辐射带动力的济南核心地位突出,除了与东营人口交流相对较弱之外,与其周边的德州、滨州、聊城、泰安和淄博的人口迁徙度均为一级和二级,处于非常紧密的联系状态;济南周边城市相互之间的人口交流程度都较低,整体表现为以济南为核心的“放射状”的空间格局。胶东经济圈范围内,青岛与其临近的潍坊、烟台之间人口交流强度最高,均为一级联系强度;烟台与威海之间的人口交流强度次之;日照与经济圈内的城市人口交流强度均相对薄弱,城市孤立性显著,整体表现为“一点一线型”的空间格局。鲁南经济圈范围内,菏泽、济宁、枣庄、临沂四个城市中的相邻城市之间人口交流强度都在三级及以上,联系强度较高且相对均衡,整体表现为“折线型”的空间格局。在三大经济圈的相接位置,泰安与济宁之间、日照与临沂之间,以及潍坊与淄博、东营之间的人口交流强度以二级和三级居多,在网络中起到了过渡、衔接的关键作用。

综上所述,人口迁徙密集程度较高的区域主要集中在三大经济区圈内部的城市之间及经济圈边界相接的城市之间;城市间的人口迁徙强度的空间近邻效应显著,相互毗邻的城市更易形成人口迁徙流的高强度区域。

3.1.3 凝聚子群分析

以两两城市间的人口迁徙强度为统计变量,利用Ucinet6.0 计算出凝聚子群密度(表2),并以3级为最大切分深度进行聚类分析(图3),并对2 级、3 级分割深度下的城市子群体进行可视化(图4)。

图3 凝聚子群树状图Fig.3 Condensed subgroup tree

图4 凝聚子群空间分布Fig.4 Spatial distribution of condensed subgroup

表2 凝聚子群密度表Tab.2 Condensed subgroup density

从聚类情况来看(表2、图3),山东省16 个城市间的人口联系强度表现出明显的小团体聚集性。16 个研究城市在3 级分割深度下被划分为7 个小团体,其中,成员数量最多的团体为子群5,包括青岛、潍坊、威海和烟台4 个城市;成员数量最少的团体有两个,为济宁和东营,且均为单一城市团体。根据密度矩阵可判断出团体内部及团体之间的联系紧密程度,研究城市多数表现出小团体内部城市的依赖性高于与外部城市的联系特征;其中,子群1 和子群2 内部城市的联系密度远远高于与其他团体的联系,内部稳定性较高。子群4 和子群6由于单一城市成团,内部密度均为0。不同的是,济宁受益于地理位置的优势,与子群3 城市的联系密集程度较高;东营与外部团体不存在较密切的联系,在城市群中的孤立性较明显。

从空间分布来看(图4),在2 级分割深度下7个城市团体被组合为4 个小团体,呈现出明显的“四边形”结构。当从3 级分割深度转换到2 级分割深度时,子群2 被合并于子群1 中,子群4 被合并于子群3 中,子群6 被合并于子群5 中,合并过程表现出明显的空间邻近性。仅有子群7 未发生变化,说明日照和临沂的人口联系非常紧密,团体的稳定性相对较高。

3.1.4 中心性分析

利用Ucinet6.0 计算出有向迁徙网络的中心性指标(表3),并用Netdraw 对加权点中心度进行核心-边缘分析(图5),以此来揭示16 个城市在网络中的辐射力和凝聚力。

图5 加权点中心度拓扑网络Fig.5 Topological network of weighted point centrality

表3 城市中心性Tab.3 Centrality of city

依据表3,计算出16 个节点城市点出度、点入度的极差(分别为155.04、178.26)和标准差(分别为44.51、48.74),发现指标的整体离散性较强,各个城市的人流集散强度差异较大。点出度和点入度的相关系数为0.9959,呈现强相关性,说明大多数城市各自人口的流入与流出较为平衡,几乎不存在大量的人流盈余或亏损,网络中各节点城市人流的凝聚与辐射强度相对均衡。

根据图5,可以划分出核心-边缘区域,核心城市包括济南、青岛、潍坊、济宁、临沂和淄博,此类城市的加权点中心度高于平均水平,与其他城市的人口往来较多,在网络中占据有利地位。济南市的加权点中心度远远高于其他城市,与其他城市的人口交流能力较强,在网络中的控制力和影响力最高。原因是济南市作为省会城市,具有较好的经济吸引力和交通运输优势,因而能成为重要的人流集散枢纽。往往城市的行政等级高,其在人口流动网络中的地位越高;边缘城市与周边地区的人口联系强度较弱,在网络中处于弱势地位。

根据净加权入度的计算结果(表3),可将16个城市分为两类:一类是加权出度大于加权入度的城市,占比69%,包括淄博、烟台、枣庄、威海、济宁、青岛、东营、德州、聊城、菏泽和滨州,此类城市处于一种流失人口资源的状态,其向内的人口资源集聚力较弱,特别是排在最后五位的东营、德州、聊城、菏泽和滨州,对外输出人口资源相对较多,在城市网络中处于弱势地位;另一类是加权入度大于加权出度的城市,占比31%,包括济南、泰安、潍坊、日照和临沂,此类城市的人口资源向内集聚性高于其向外发散性,说明这些城市的交通、经济等方面占据一定优势,在网络中的吸引力较强。济南作为省会城市,其净加权度位于第一,并且远超越其他城市,在网络中的核心地位,凸显了高强的人口资源凝聚力。

3.2 空间自相关分析

为探究城市网络指标是否具有空间依赖性,以各城市人口流动网络的密度、平均迁徙强度(单一城市与其他城市单向联系强度的平均值)和净加权中心度3 项指标为观测变量来反映人口流动水平,利用GeoDa,基于Rook 邻接空间权重矩阵计算全局和局部的莫兰指数。

全局莫兰指数测算的是所有研究单元整体的空间聚集特征,由表4 得出,3 项指标的全局莫兰指数的P值均大于0.05,不具有统计显著性,说明山东省16 个城市的人口流动水平在整体上为随机分布状态,不具有空间聚集性。

表4 全局莫兰指数Tab.4 Global Moran index

为研究各个城市与其周边城市的具体空间关系特征,利用GeoDa 绘制局部莫兰指数散点图和LISA 集聚图(图6、图7),分析特定城市与相邻区域的依赖特性。

图6 人口流动水平莫兰指数散点图Fig.6 Moran’s Index scatter of floating population level

图7 人口流动水平LISA 集聚图Fig.7 LISA agglomeration of floating population level

由图6 看出,密度、平均迁徙强度和净加权中心度3 项指标的散点分布特征具有相似性,大多数点分布在第二象限和第四象限,且回归线的斜率均小于0,说明山东省大部分邻城市之间具有较强的空间负相关趋势,同时反映出相邻城市的人口流动水平差异性较大、人口流动的互惠性较弱的特点。

由图7 看出,在空间分布方面,淄博和日照为网络密度低-高聚集区,并且两者均为经济圈边缘城市,说明在经济圈内部更易形成人口流动密集区,而经济圈边缘的城市往往成为密度低值区;淄博和泰安分别为平均迁徙强度高-高聚集区和低-高聚集区,说明与两城市均为近邻关系的济南平均迁徙强度较高,在周边城市中的核心地位显著,同时两城市周边的滨州、潍坊、济宁和临沂也具有较高的平均迁徙强度;对于净加权中心度,滨州和泰安为低-高聚集区,淄博为高-高聚集区,说明滨州和泰安相对于周边城市的人口输入能力较弱,淄博和其近邻的济南、潍坊三个城市的人口输入相对较多,人口吸引力较强,形成了高值聚集区。

4 结 论

本文基于人口迁徙流数据,从网络结构和空间差异两个角度对山东省16 个地级市的联系特征深入分析,得到如下结论。

(1)山东省城市网络整体上呈弱联结状态,省会经济圈的高强度联系数量多、密度低,而胶东经济圈和鲁南经济圈内部的高强度联系数量少、密度高。省会经济圈、胶东经济圈和鲁南经济圈内部网络分别呈现单核心“放射状”“一点一线型”和“折线型”的结构特征。

(2)山东省城市网络表现出小团体聚集特征,在3 级、2 级分割深度下分别划分为7 个、4 个小团体,且团体内部的城市联系比团体之间的密集度高,分割深度从3 级转换为2 级时,聚类演化过程的空间近邻效应显著。

(3)山东省各个城市节点的要素的流入、流出强度差异较大,但在单一城市层面,要素的流入、流出相对平衡,并且发散性较强的城市占69%,内聚性较强的城市占31%。加权点中心度的核心-边缘结构显著,济南占据最高的网络枢纽地位,其次为青岛、潍坊、济宁、临沂和淄博。

(4)山东省城市网络的密度、平均迁徙强度和净加权中心度在整体上表现为空间随机分布状态,在省会经济圈部分区域表现为空间负相关特征,网络节点属性差异大,节点间的互惠性较低。

猜你喜欢

子群经济圈人口
超聚焦子群是16阶初等交换群的块
《世界人口日》
人口转型为何在加速 精读
子群的核平凡或正规闭包极大的有限p群
人口最少的国家
1723 万人,我国人口数据下滑引关注
首都经济圈建设存在问题及对策建议
恰有11个极大子群的有限幂零群
与Sylow-子群X-可置换的子群对有限群的影响
论兰州经济圈体育公共服务体系建立的必要性