APP下载

我国省会城市城市化发展水平的聚类分析
——基于面板数据的研究

2012-01-08何芳丽桂林电子科技大学广西桂林541004

郑州航空工业管理学院学报 2012年5期
关键词:城市化面板指标体系

何芳丽(桂林电子科技大学,广西 桂林 541004)

一、引 言

城市化是经济发展及社会进步的必然趋势,城市化发展水平是一个国家或地区经济发展水平和人们物质文化生活水平的综合体现。作为社会进步的重要标志之一的城市化,正成为中国区域经济不断增长的动力和源泉。然而,不同城市的经济基础、人口状况、自然资源及政府规划等许多方面是存在差异的,所以其城市化的发展水平是不同的,从而正确地评价我国城市现有的发展水平,并从中找出导致城市化水平差异的原因,是有利于我国经济的进一步快速增长,也能为国家制定相关宏观政策提供依据。

针对城市化发展问题,国内很多学者做了相关的研究,主要是先建立城市化发展水平的评价指标体系,然后利用横截面数据做相应的实证分析。例如,吴永保(2001) 构建了城市现代化的指标体系,并将该指标体系用来对几个城市的对比分析[1];程如轩,李澄清(2005) 构建了我国城市化水平的评价指标体系,并利用聚类分析、因子分析等统计方法对城市的现代化发展水平进行研究,为城市化的发展提供建议和依据[2],等等.另外,张馨文,刘长凯(2007)也建立了评价城市化发展水平的指标体系,并利用面板数据,结合模糊数学的聚类分析方法对城市化发展水平进行定量分析[3]。但是在张馨文的文章中,直接利用加权处理的方式将面板数据转成横截面数据,这样抹杀了指标的发展速度及其动态趋势。

综上所述,就城市化发展问题方面,学者们要么就是用横截面数据做分析,要么就是直接利用加权处理的方式将面板数据转成横截面数据再做分析,其分析结果抹杀了指标的发展速度及其动态趋势。为此,本文在已有研究成果的基础上构建了我国城市化发展水平的评价指标体系,然后再运用面板数据聚类方法,找到了一种能体现指标的水平值、发展速度及其动态趋势的面板数据聚类方法,并将其用于实证分析。

二、城市化发展水平的评价指标体系

1.指标体系

我国城市化发展水平的评价指标体系可以从5个方面去考虑:经济城市化水平、人口城市化水平、生活方式的城市化水平、环境状态城市化水平以及医疗普及的城市化水平[2]。

综合前人的指标体系,本文选取的评价体系见表1。

表1 指标体系

注:除人口自然增长率外,其他指标都是正向指标.

2.面板数据的特征

面板数据(Panel Data)是横截面数据和时间序列数据的组合,从横截面上看,是由N个个体在某一个时刻的m个指标上构成的截面观测值,从纵剖面上看则是一个时间序列。面板数据可以用三个下标变量表示,如xijt,i=1,2,…,N,j=1,2,…,m,t=1,2,…,T(T为时间序列的长度)。

三、面板数据的聚类分析

经典的聚类分析(横截面数据的聚类分析)的方法很多,有系统聚类、动态聚类和有序聚类等,其中系统聚类法是最常见的聚类分析法。而且目前的很多统计软件都可以进行经典的聚类分析,如:SPSS、SAS、MINTAB、R等 ,但是对于面板数据来说却没有这么方便,目前没有相应的分析软件可供使用,所以面板数据在聚类分析方面的研究是很少的.当然,我们可以做些处理,如郑兵云(2008)通过对不同时间的加权,可以将面板数据转换成横截面数据,然后利用经典的方法去做分析,但这样的处理只能表现指标平均变动情况,却不能反映发展速度和动态趋势。也可以设计一些能反映水平值、发展速度和动态趋势的相似性指标的距离距离测度公式,然后利用Ward方法的分类思想,进行编程分析,如李因果,何晓群(2010),但这样做的话编程麻烦,而且全时“综合”距离中的权重比较难确定。

为了说明本文的聚类方法,我们引用李因果,何晓群(2010)的距离测度公式。

1.相似性指标的距离距离测度定义

定义1:个体i和个体j之间的全时“绝对量”距离(Absolute Quantity Euclidean Distance),简记:dij(AQED)。

(1)

dij(AQED)刻画了个体和个体之间在整个时期T内的距离远近程度。

定义2:个体i和个体j之间的全时“增长速度”距离(Increment Speed Euclidean Distance),简记:dij(ISED)。

(2)

其中,Δxikt=xikt-xikt-1,Δxjit-xjkt-xjkt-1,Δxikt和Δjkt表示指标两个相邻时期的绝对量差异。dij(ISED)刻画了指标增量随着时间变化的趋势差异,若两个指标随着时间都呈同方向变化,这种变化越协调,则两者越相似,距离也较小;若两者反向变化,则距离一般较大,两者相似性也差。

定义3:个体i和个体j之间的全时“变异”距离(Variance Coefficient Euclidean Distance),简记:dij(VCED)。

(3)

2.聚类方法

从前面的三个定义可以看出,分别反映水平值、发展速度和波动程度的三个距离已经消除了时间维度,而且三个距离都是欧氏距离,所以稍稍再处理下就可以用经典聚类分析法了。具体处理方法是这样的,先选个个体作为参考个体(实际上相当于一个原点),不妨设为第j0个体,然后计算第i个个体与第j0个体的三个距离,i=1,2,…,N,即分别得到了N个个体相对于第j0个体的三个距离,并将它们称为三个“相对”距离;最后为了消除量纲的影响,把三个“相对”距离标准化,利用标准化的三个“相对”距离做经典的聚类分析。同时,还可以结合SAS软件中的统计量SPRSQ(半偏R平方)、ccc、psf(伪F)和pst2的值来确定分类的个数,其具体的判断方法是:SPRSQ表示每一次合并对信息的损失程度,它的值突然变大时,所对应的前一类的分类较合适;ccc和psf出现峰值时所对应的分类较合适; pst2出现峰值的前一类所对应的分类较合适。

四、实证分析

为了更好地评价我国城市化现有的发展情况,本文按照前面的指标体系,收集了2005~2009年中国30个省会城市(拉萨市的数据不全而被排除)的统计数据,并利用前面提出的面板数据聚类方法,对中国30个省会城市进行聚类分析。数据来源于《中国城市统计年鉴》及各个省会城市的统计年鉴。

1.数据的预处理

2.数据的预分析

为了能够找到一个合适的参考个体,也为了后面能更准确的找出导致城市化水平差异的原因,本文先按照不同的年份,对城市化发展水平指标体系中的10个指标做了因子分析,并以因子的贡献率为权数,求出每个个体(即每个省会城市)的综合得分,得到的排名情况见表2。

表2 五年的综合排名

从表2可看出,五年中城市化发展水平综合排名靠前的有广州、北京、上海、长沙、杭州、福州、呼和浩特;排名靠后的有天津、哈尔滨、南昌、南宁、海口、贵阳、西安、兰州;排名最差的就是重庆,而且重庆的排名情况没有变动。

3.30个省会城市的聚类分析

由前面的预分析发现,重庆的排名是最差的,而且它的排名情况在四年中都没有变动,所以我们将重庆作为参考个体,然后得到每个个体的三个“相对”距离及其相应的标准化距离,见表3。

表3 “相对”距离

其中,da 、di 和dv分别表示“绝对量”距离、“增长速度”距离和“变异”距离,zda 、zdi 和zdv分别为da 、di 和dv的标准化值。

利用SAS软件编程,按照zda 、zdi 和zdv三个指标对我国30个省会城市进行系统聚类。

分析得到的聚类过程图和聚类结果的树状图分别为图1和图2所示。

图2 聚类结果的树状图

从图1中的统计量值,确定分类的个数:

由SPRSQ这列值知:从4类合并成3类时,信息损失突然变大,为0.4159,此时表明聚成4类较合适;由于PSF在当NCL=12,8,3时三次出现峰值,但NCL=3时峰值更陡,此时表明聚成3类较合适; 由于CCC在当NCL=3时出现唯一峰值,表明聚成3类较合适; 由于PST2在NCL=6,2时多处出现峰值,表明聚成7,3等类较合适。综合前面的分析得到: 聚成3类较合适

从图2,可以得到具体的分类情况为:

第一类:北京,上海,长沙,广州;第二类:石家庄;其余各城市为一类。

4.各类城市化发展水平的特点

相对来讲,各类城市化发展水平具有如下特点:

第一类城市:北京,上海,长沙,广州,该类城市化水平很高、增长速度较慢、波动大。

第二类城市:石家庄,该城市单独作为一类,城市化增长速度非常快。石家庄在5年的时间中,其城市化水平由偏低水平飞跃到偏高水平。

其余各城市聚为一类,除呼和浩特、沈阳、杭州、福州和南京的城市化发展水平比较高外,其他20个城市化的发展水平是中等偏下。另外,该类城市化的增长速度较慢、波动较小。

五、结 论

面板数据比单纯的横截面数据和时间序列数据拥有更多的信息,因而如果分析方法合适的话,其分析结果也会更加准确。本文利用面板数据对我国省会城市进行了聚类分析,不仅将30个省会城市进行了分类,而且还得到了每类的城市化发展的水平情况、发展速度情况以及波动情况,结果表明石家庄城市化增长速度非常快,其发展模式对其他城市具有借鉴意义;北京、上海、长沙、广州城市化增长速度较慢,但由于其城市化基础比较好,所以该类城市的城市化水平还是位于全国前列;在其他的城市中,大部分是处于中下水平且增长速度较慢,国家可对这类城市给予重视,并实施相应的政策以提高这类城市的城市化发展水平和速度。

[1]吴永保.城市现代化及其指标体系的构建与应用[J].城市发展研究,2001,(1):9-14.

[2]程如轩,李澄清.我国城市化水平的评价及预期分析[J].经济问题探索,2005,(1):15-18.

[3]张馨文,刘长凯.城市化水平的模糊聚类分析[J].宝鸡文理学院学报(自然科学版),2007,(3):190-193.

[4]朱建平,陈民恳.面板数据的聚类分析及其应用[J].统计研究,2007,(4):11-14.

[5]郑兵云.多指标面板数据的聚类分析及其应用[J].数理统计与管理,2008,(2):265-270.

[6]李因果,何晓群.面板数据聚类方法及应用[J].统计研究,2010,(9):73-79.

猜你喜欢

城市化面板指标体系
2022城市商业魅力指标体系
石材家具台面板划分方法
网络空间攻防对联合作战体系支援度评估指标体系构建
MasterCAM在面板类零件造型及加工中的应用
城市化对经济增长推动作用的经济学研究
Photoshop CC图库面板的正确打开方法
面板塑件凸毂结构优化及模具设计
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
中国早期城市化的动力机制