APP下载

基于聚类与主成分分析的重庆库区经济发展研究*

2015-05-16刘宇琴

关键词:聚类分析主成分分析经济发展

刘宇琴

(重庆工商大学管理学院,重庆400067 )



基于聚类与主成分分析的重庆库区经济发展研究*

刘宇琴

(重庆工商大学管理学院,重庆400067 )

摘要:选取重庆库区万州、云阳、江津等17个区县作为研究目标,以重庆统计年鉴发布的数据为基础,利用主成分分析法选取出代表性的主成分,并对主成分的得分进行聚类;结论显示:重庆库区分为重庆市区为中心和万州为中心的两个主成分,区域中心的发展辐射作用较为明显;最后提出重庆库区经济发展相关建议。

关键词:重庆库区;主成分分析;聚类分析;经济发展

2014年4月,李克强总理在重庆主持召开沿江11省市的长江经济发展带座谈会,他强调中西部具有经济发展最大的回旋余地,建设长江经济带,就是要构建沿海与中西部相互支撑、良性互动的新棋局,他反复强调重庆库区经济带建设的重要性。为此,对重庆库区的经济发展进行研究,具有很大的意义。重庆库区东起巫山县,西至江津区,南起武隆县,北至开县,包括了重庆主城区4个区县在内的17个区县,横跨了都市经济圈和三峡库区生态经济区,经济发展不平衡,特别是郊区县经济发展相对滞后,库区内的经济发展水平表现出巨大的差异,用主成分分析的方法从代表一个城市经济发展水平的7个指标中选取一至两个主成分,再用聚类分析法对17个区县进行聚类,以此来评价地区经济发展水平和区域差异,对指导现阶段经济发展规划和战略、平衡区域差异是很有必要的。

1 指标选取

李芝芳等(2009)认为,由于经济社会发展的复杂性,使得经济发展的评价指标很复杂,认为要遵循简明性、客观性、实用性和动态性的原则[1];惠俊刚等(2007)认为为了更好的反映区域经济的差异,指标的选取应具有综合性、代表性、可比性、可得性和简洁性,特别是在聚类分析中,一般要求样本的容量大于变量的个数[2];熊小刚(2008)运用聚类分析对环鄱阳湖经济圈进行研究,选取了具有弱相关性的指标,比如国内生产总值、财政总收入、工业总产值、经济密度、农民人均收入、城乡居民储蓄年末余额等作为指标体系[3];通过对文献的研究和分析,结合指标选取的可获得性、代笔性、综合性和简洁性的原则[4]选取了财政收入(x1),地区生产总值(x2),工业总产值(x3),农林渔牧业产值(x4),全社会固定资产投资(x5),人均GDP(x6),人均第三产业总值(x7)和社会消费品零售总额(x8)个相关指标,地区生产总值、人均GDP和财政收入反映了一个地区经济发展的综合水平;全社会固定资产投资反映了社各界对生产投资的重视程度及实施;农林渔牧产值、工业产值一级人均第三产业总产值则代表了一个地区的第一、第二和第三产业的发展状况。具体指标结果见表1。

表1 重庆库区各区县主要经济指标

由表1可知利用主成分分析和聚类分析对重庆库区经济进行评价,并给出相应的建议,对于今后库区的长远发展具有理论上的现实意义。

2 数据分析过程

2.1主成分的选择

利用SPSS20.0对数据进行处理,首先对数据做标准化处理,计算相关系数矩阵,计算特征根和特征向量,方差贡献率,见表2。

表2 主成分特征根和贡献率

表3 主成分载荷

一般取累计贡献率达到80%以上少数几个主成分就可以代表原来多个指标的绝大部分信息,由表2可见,取第一,第二个主成分的累计贡献率即可达到92%,且重庆库区的区县有很大一部分农业产业,所以选取代表农林牧渔产业总值的第二主成分也作为分析的目标,第一、第二主成分与其他成分之间的相关系数如表3。

由表3可知,第一主成分与财政收入(x1)、地区生产总值(x2)、工业生产总值(x3)、全社会固定资产投资(x5)、人均GDP(x6)、人均第三产业总值(x7)、社会消费品零售总额(x8)有很大的正相关,与农林渔牧产值(x4)呈负相关,而第二主成分与农林渔牧产值(x4)有显著的正相关性,达到0.97,与其他指标相关性较弱或呈负相关。

由第一主成分和第二主成分的特征向量矩阵可以得到两个主成分:

z1= 0.39x1+ 0.38x2+ 0.37x3-0.01x4+ 0.39x5+ 0.39x6+ 0.34x7+ 0.39x8

z2=-0.09x1+ 0.25x2+ 0.2x3+ 0.84x4+ 0.18x5-0.08x6-0.36x7-0.11x8

对于第一主成分z1,除了x4(农林渔牧产值)以外,其他的指标的系数都在0.35左右,而这几个指标包括了财政收入、地区生产总值、工业总产值等7个指标,这7个指标都是经济发展中的代表性指标,包括了第二产业和第三产业的综合水平、政府财政收入和人们消费能力和财富水平等。所以第一主成分代表了一个地区的经济发展综合水平;第二主成分与x4的系数高达0.84,远远高于其他指标的系数,而与x7(人均第三产业总值)的系数也为0.36,也具有较高的相关性,而农林渔牧则代表了第一产业的发展综合情况,农林牧渔业广义包括了除第一产业的传统种植行业以及饲养业、林业之外,也包含了农用机械、农业服务、新型农业发展、农副产品加工等新型农业与第二和第三产业的结合,所以,第二主成分代表了以第一产业为主的农业及其新型第三产业。根据以上两个主成分的线性组合以及标准化后的原始数据,可以得到两个主成分的得分,如表4。

表4 第一和第二主成分得分及排名

在表4中,第一主成分得分最高的是渝北区,达到了5.49左右,第二是江北区,有4.02分,都远远高于其他城市,然后是南岸区、涪陵、万州等区县,经济发展的综合水平都比较高,得分最低的是巫溪县,只有-2.55 分;第二主成分中得分最高的是江津区,其得分达到了2.21分,第二的是万州区,表明这两座城市的农林牧渔业较发达。

2.2聚类分析

对第一主成分和第二主成分进行标准化处理后,选择欧式距离,采用最短距离法进行聚类,对重庆库区的17个区县进行经济发展综合水平和农林牧渔业发展综合水平进行水平聚类分析,得到最短距离聚类谱系图(如图1、2)

图1 第一主成分聚类树状图

图2 第二主成分聚类树状图

图1是第一主成分的聚类图,由它把库区经济发展综合水平分为四类:第一类是江北区和渝北区,第二类是巴南区、万州区、涪陵区和南岸区,第三类是长寿区和江津区,第四类是丰都县,石柱县等其他区县。根据第一主成分的得分,满足得分的依据,江北和渝北的第一主成分得分都远高于其他区县,经济发展综合水平较高,处于第二层次的长寿、万州等区经济发展综合水平较渝北和江北稍弱,但还是远远领先于其他得分较低的城市。

根据第二主成分的得分对第二主成分进行聚类,如图2。根据图2对第二主成分的聚类可以把重庆库区区县的第二主成分分为四类:第一类是得分最低的江北区,第二类是得分最高的江津区,第三类是得分较低但远远高于江北的巫山县、石柱县、巫溪县、武隆县和南岸区,第四类是处于之间的长寿区、云阳县、渝北区、万州区等。

3 结果分析

3.1第一主成分分析

根据分析,第一主成分的贡献率达到了76%,位于主城区的渝北区和江北区排名第一和第二,分为第一类,且分数都远远超过其他城市。第一主成分的第二类是巴南区、涪陵区、万州区和南岸区,这几个区在第一主成分得分方面均位于前几位,低于渝北和江北,但也远远高于其他区县,除了万州外,都是重庆1 h经济圈的组成部分,受到经济发展的辐射作用,经济发展迅速。第三类是长寿区和江津区,经济发展综合水平较上述城市较弱,长寿和江津都是传统的工业城市,特别是江津,工业较发达,有著名的珞璜工业园和德感工业园,其机械、汽摩产业、农用机械、造纸等均在西部处于领先地位。

最后一类是得分较低的其他区县,这些城市基本都位于渝东南翼和渝东北翼,是传统的经济较薄弱的城市,工业基础差,现代化程度较低,交通不便利。

3.2第二主成分分析

第一类是得分最低的江北区,由于其处于主城区核心,农林牧渔类产业面积较少,且农村人口少,城市化水平很高,其分为第一类。

第二类是得分最高的江津区,江津区的农林牧渔产业发展水平很高,最近新建的江津现代农业园区是全国性的农业园区,农业现代化水平高,农产品附加值较高,产业集中规模化发展,是西南地区乃至全国领先的农业园区,大大促进了现代农业的发展。

第三类是处于中间水平的长寿区、云阳县、渝北区、万州区、涪陵区等,处于渝东北翼的万州、云阳、奉节、忠县等是全国柑橘的重要产地,占据了农林牧渔类产值的大部分,而且受万州经济的影响辐射,这几个城市的农业现代化程度有了明显的提高。

第四类是发展水平较低的巫山县、石柱县、巫溪县、武隆县和南岸区,南岸区是处于重庆主城核心,农业面积小,发展较弱,其余的巫山、石柱、巫溪和武隆农业人口较多,但受其经济综合水平的影响,农业现代化程度很低,并没有形成产业化,水平较低。

4 结论及建议

对于第一主成分和第二主成分分析的结果和聚类的结果来看,渝东北的重庆库区腹心的城市经济水平都偏低,除了万州外,其余的区县都与1 h经济圈的城市呈现巨大的差异,处于1 h经济圈的区县的农林牧渔产业也明显高于渝东北库区腹心,江津更是处于第一位;三峡库区重庆段的全县在经济、农业方面的差异甚至大于全国平均的差异程度,是典型的大城市、大农村的格局。对此提出相关建议:

4.1加大对重庆库区的投资力度,特别是库区腹心

以投资来带动库区经济、农业协调发展,对外部投资依赖很强的重庆库区要实现区域经济、农业协调发展,国家政策性的投资的方式和力度仍然是促进区域协调发展的主要因素。特别是对于渝东北的区县城市,更应该加大投资力度,形成区县间资源互补,协调发展。

4.2发挥好区域中心城市的辐射作用

重庆库区的重庆1 h经济圈内,主城区的快速发展明显带动了1 h经济圈的城市快速发展,取得了非常明显的效果。而渝东北远离主城区,周围没有像重庆一样的特大城市,万州作为唯一的区域中心城市,经济综合水平和农业综合水平都远高于周围的开县、云阳、石柱、忠县等城市,要充分发挥好其大中城市的辐射作用,加大对万州的扶持力度,加大万州的政策支持和优惠。

4.3协调好库区城市的产业结构,加强对库区的产业扶持

三峡库区落后,自我发展能力很弱,国家应加强对库区的产业扶持,库区各个城市要有自己城市的支撑产业,同时也要主要好产业的协调[8],1 h经济圈的库区城市大都经济基础较好,特别是江津和长寿、涪陵,工业基础好,产业协调完善,而渝东北的库区城市没有自身独特的产业,大都是三个产业都比较落后。国家在对渝东北库区腹心的扶持中,不能忽视工业的发展,工业化是经济发展不能逾越的阶段,而农林牧渔等第一产业也要协调发展,同时,可以发挥自身的优势产业,找到经济发展的突破口。

4.4突出区位特色,促进库区现代农业发展

城市的郊区如渝北、万州、涪陵等区县区位条件较优越,农业基础好,以农村城镇化为突破口,形成都市农业和现代农业经济开发区,而渝东北的云阳、奉节等城市现代农业基础薄弱,应充分利用好其农业资源丰富的特点,形成以立体的农业经济综合区,开展观光农业,与一二产业协调发展。

参考文献:

[1]李芳芝,李敏.基于聚类分析的经济发展评价指标体系的构建[J].改革发展,2009(9) : 14-16

[2]惠俊刚,卫海燕.陕西区域经济发展水平的聚类分析[J].兰州商学院学报,2007,23: 55-70

[3]熊小刚,翁贞林.“环鄱阳湖经济圈”县域经济发展水平的聚类分析及评估[J].商业研究,2008(6) : 125-128

[4]周李磊,林孝松.基于主成分分析的重庆市县域经济综合评价[J].重庆工商大学学报:自然科学版,2013,30: 21-26

[5]郑静,吴海伟.山东省17个地级市经济发展水平测度—基于因子分析和聚类分析[J].山西财经大学学报,2010,32(1) : 22-23

[6]张圆.地区经济发展差异的聚类统计分析[J].统计与决策.2013,24: 112-114

[7]刘钦普.数理统计方法在河南地级市经济发展水平和分区研究中的应用[J]数理统计与管理.2002,21(2) : 10-15

[8]万丽娟,徐孝勇.西部大都市区县第三产业发展水平差异分析——以重庆市为例[J].重庆大学学报:社会科学版,2010,16 (22) : 6-10

[9]李炯光.三峡库区区域经济发展状况的实证研究[J].中国人口·资源与环境.2005,15(4) : 63-68

[10]重庆统计信息网[EB/OL].http: / /www.cqtj.gov.cn/

[11]何晓群.多元统计分析[M].北京:中国人民大学出版社,2004

Research on the Economic Development of Chongqing Reservoir Area Based on Principal Component Analysis and Cluster Analysis

LIU Yu-qin
(School of Management,Chongqing Technology and Business University,Chongqing 400067,China)

Abstract:Selecting 17 counties of Wanzhou,Yunyang,Jiangjin,etc.in Chongqing as the research object,according to the data issued by Chongqing Statistical Yearbook,this paper selects representative principal components by principal component analysis and clusters the scores of the principal components.The conclusion shows that the reservoir area of Chongqing is divided into two principal components as Chongqing city and Wanzhou,whose radiation effect is relatively obvious.Finally suggestions for the economic development of Chongqing Reservoir area are put forward.

Key words:Chongqing Reservoir; principal component analysis; cluster analysis; economic development

中图分类号:O29

文献标识码:A

文章编号:1672-058X(2015) 06-0011-06

doi:10.16055/j.issn.1672-058X.2015.0006.003

收稿日期:2014-10-23;修回日期: 2014-11-20.

*基金项目:重庆市科学技术委员会科技创新服务(软科学)项目(CSTC2012CX-RKXA00098).

作者简介:刘宇琴(1991-),女,四川泸州人,硕士研究生,从事人力资源管理研究.

猜你喜欢

聚类分析主成分分析经济发展
主成分分析法在大学英语写作评价中的应用
农村居民家庭人均生活消费支出分析
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
新常态下中国经济发展战略探究
基于省会城市经济发展程度的实证分析
经济“新常态”下产业结构调整与经济发展的关系
信息化管理在公路运输经济发展中的作用研究
我国对外贸易促进经济发展的研究
基于聚类分析的互联网广告投放研究