利用SPSS的沿海开放城市的因子分析
2012-01-11孙晓松朱鹏程
孙晓松,朱鹏程
(1.连云港师范高等专科学校 数学系,江苏 连云港 222006;2.连云港市统计局)
1 因子分析原理
因子分析的核心是用较少的互相独立的因子反映原有变量的绝大部分信息.将这一思想用数学模型表示为:
X=AF+ε
(1)
式中:X=(X1,X2,…,Xp)'为原指标;F=(F1,F2,…,Fk)'为公共因子;ε为特殊因子;A=(aij)p×k(k
2 数据来源
2009年全国14个首批沿海开放城市(大连市、秦皇岛市、天津市、烟台市、青岛市、连云港市、南通市、上海市、宁波市、温州市、福州市、广州市、湛江市、北海市)实现地区生产总值60003.47亿元,占全国国内生产总值(335353亿元)的17.9%,而人口仅占全国总人口的7.1%.本文选取反映经济情况的11项主要指标,通过因子分析对14个城市的经济发展水平进行综合评分,并根据得分情况将14个城市进行了分类.
选取反映经济情况的11项主要指标:地区生产总值X1;人均地区生产总值X2;社会消费品零售总额X3;地方财政一般预算收入X4;工业总产值X5;城镇固定资产投资X6;农村居民人均纯收入X7;进出口总额X8;实际外商直接投资X9;农林牧渔业总产值X10;城镇居民人均可支配收入X11.14个首批沿海开放城市各评价指标数据见表1.
表1 14个沿海开放城市市各评价指标数据 单位:亿元
注:上述数据来自沿海开放网(2009).
3 实证检验
(1)相关矩阵
表2 因子相关矩阵
由表2相关系数,绝大部分相关系数均大于0.3,所以适合进行因子分析.
(2)检验数据的可行性
KMO(Kaiser-Meyer-Olkin)检验是用来比较变量间简单相关系数和偏相关系数的大小,主要用来检验数据是否适合因子分析的.KMO越接近1,意味着变量间的相关性越强,越适合作因子分析,KMO越接近0,意味着变量间的相关性越弱,越不适合作因子分析.
表3 KMO和Bartlett 的检验
表4 解释的总方差
巴特利特(Bartlett)球度检验是以原有变量的相关系数矩阵为出发点的假设检验,也主要用来检验数据是否适合因子分析.若概率P-值小于给定的显著性水平α,则拒绝原假设,认为相关系数矩阵不太可能是单位阵,原有变量适合作因子分析;反之,若概率P-值大于给定的显著性水平α,则接收原假设,认为相关系数矩阵与单位阵无显著差异,原有变量不适合作因子分析.
由表3可以看出,KMO=0.646,巴特利特(Bartlett)球度检验具有高度显著性,说明上述数据适合作因子分析的.
(3)方差解释
从表4中可以看到,大于1的特征值有2个,对应的累积贡献率为85.148%≥85%,再由图1碎石图可以发现特征值由大到小的排列顺序,因此可以确定保留因子数量为2个.
表5 解释的总方差
图1 碎石图
(4)确定因子
表6 因子载荷矩阵
由表6各因子载荷可以看出,两个因子的实际含义比较模糊,对因子载荷矩阵实行正交旋转使因子具有命名解释性.如表7所示.
表7 旋转后的因子载荷矩阵
(5)因子得分
表8 成份得分系数矩阵
根据表8写出以下因子得分函数:
F1=0.130X1+0.047X2+0.131X3+0.145X4+
0.122X5+0.093X6+0.079X7+0.141X8+
0.101X91-0.111X10+0.112X11
F2=-0.041X1+0.322X2-0.063X3-0.178X4+
0.001X5+0.133X6+0.158X7-0.159X8+
0.055X91+0.754X10-0.110X11
以两个因子的方差贡献率为权数,得综合分数:
F=0.72230F1+0.12918F2各沿海城市综合得分及排名如表9所示.
表9 各沿海城市综合得分
由表9可以看出,综合得分上海和广州遥遥领先,反映出这两个城市雄厚的经济综合实力,将这两个城市归于一类.天津、大连、宁波、青岛可归为一类,他们是首批沿海开放城市发展的第二梯度,这四个城市虽不像上海、广州那样具有雄厚的经济实力,但他们也已经取得了较好的成绩,尤其是未来具有更大的发展潜力和发展空间.烟台、南通、温州、福州可归为一类,构成第三梯度,这四个城市发展相对较缓慢.秦皇岛、连云港、北海、湛江可归为一类,是第四梯度.
参考文献:
[1]薛薇.基于SPSS的数据分析[M].北京:中国人民大学出版社,2006.
[2]全涛,孙雪翰.2008年中国足球超级联赛成绩与技术统计因子分析[J].数理统计与管理,2011,30(2):370-380.
[3]丁伟祥,殷晓旺,张文.因子分析法在农村中学生心理健康综合评价中的应用[J].数理统计与管理,2011,30(1):185-190.
[4]彭文斌,邝嫦娥.中国区域经济差距与资本流动的因子分析[J].统计与决策,2010(9).
[5]刘晓娥,康艳芳,王立.河南省区域经济发展比较的因子分析[J].统计与决策,2010(5).
[6]杜茂华,陈国生.基于因子分析法的重庆市城乡统筹发展评价[J].统计与决策,2010(7).