APP下载

基尼系数的一种新的经验测算公式与实证

2012-03-12郭秀荣

统计与决策 2012年16期
关键词:人均收入曲线图基尼系数

郭秀荣

(重庆大学 数学与统计学院,重庆 401331)

0 引言

早在2000年国家统计局就公布了当年的基尼系数为0.412,十多年了,现在的数字怎样了呢?带着这个疑问,我们通过官方中国统计年鉴公布的数字,试图理出一个基尼系数的走势图来。

关于基尼系数的文献众多,国内也有不少的研究。意大利统计学家C.Gini[1]在其1912年发表的Variabilità e Mutabilità一书中,首次提出了一种不均等指数及其计算方法。但直到8年以后才引起国际学术界的广泛重视。英国收入分配专家H.Dalton在1920年的《收入不均等的测量》一文中首次在英文文献中介绍Gini的不均等指数,并把它称之为平均差(mean difference)指数,而且认为该指数可以用来研究收入分配问题。从此以后,Gini的不均等指数逐步受到更多人的重视,并被后人称为基尼系数。

基尼还从数学上论证了基尼系数与洛伦兹曲线的几何含义是一致的(Dalton[2],1920)。基尼系数的原始计算公式如下:

计算公式如下[3][4]:

对有限样本的问题,这两个公式已经再明白不过了,只要获得一国所有公民的收入数据,是不难直接算出Gini系数的。但这样一来,完整的数据获取不宜,二来如果要动态的监测Gini系数,就有必要进行抽样或者在其他已经获得的分层数据中进行估算。如果估算才能尽可能的反映真实的Gini系数,成为今天学术界关注的一个焦点问题,重庆市近年来提出在努力提高GDP的前提下,重点控制好Gini系数,并把Gini系数作为城市经济发展的重要指标进行定期监测,这又提出了如果适时动态的根据抽样或分层数据计算Gini系数的问题。

我国对国民的收入统计分农村和城镇居民分别统计,因此只能分别计算出各自的基尼系数,好在R.M.Sundrum在文献[5]中提出分类计算基尼系数的如下公式:

其中,G1和G2分别表示基于农村居民和城镇居民的Gini系数;P1和P2分别表示农村居民和城镇居民占总人口的比例;μ,μ1和μ2分别为全体居民的人均收入,农村居民人均收入和城镇居民人均收入。这样只要能分别得到城镇居民和农村人口的分类基尼系数,不难获得我国的基尼系数。

1 数据的整理与分析

表1和表2是历年来中国统计年鉴公布的相关数据。

从表中可以看出最高收入的10%城镇人口2000年占比不过20.5,约1/5强,到2009年已经占到25.4,超过1/4了,财富有向富人集聚的明显趋势。2011年以来,由于创业板和中小板的疯狂造富运动,财富进一步向富人集中的趋势在加快。

相对而言,农村居民收入各个层次变化不甚明显。但20%的富人占有40%以上的财富无论农村还是城镇都是一样的。

国家统计局局长马建堂直言不讳的指出,高收入者目前还缺乏好的统计办法,因此目前的统计数字应该还有较大的误差,灰色收入很难统计。同样,对于绝对贫困人口,如城镇5%的困难户,农村20%的最低收入者,也存在统计口径问题。笔者通过大学申请补助的贫困生填写的家庭收入情况登记表统计的结果是占大学生1/3的学生家庭2009年平均家庭人均收入仅2739元,远低于公布的统计数字。而2011年这个数字下降到2456元,可见与富人收入越来越多相对照的是穷人的收入仍在下降,如果没有奖学金等保障措施,供孩子读书越来越不容易。

表1 城镇居民平均每人全部年收入

表2 农村居民平均每人总收入

表3 城镇居民逐年累计人口各个百分点上的累计收入对照表

表4 农村居民逐年累计人口各个百分点上的累计收入对照表

2 一种新的基尼系数经验测算公式

由于数据的原因我们无法通过公式(1)、(2)计算基尼系数。下面讨论如何根据洛仑兹曲线计算历年城镇居民和农村居民的Gini系数。

显然不能简单的进行曲线拟合,考虑到人口比例和收入的现实情况,和最高收入比较,大部分人收入相对较低,因此曲线应该在开始阶段走势比较平缓,进入高收入区后应该相对陡峭,我们发现中心在纵轴正半轴上的椭圆曲线就很合适,也就是如下的模型:

剩下的问题是如何估计参数a和b以及检验模型的显著性了,利用R软件编制程序如下:

获得的结果如下:

模型的检验是显著的,我们由此得到2000年的洛仑兹曲线方程为:

下面的R程序可以画出2000年城镇居民收入累计洛仑兹曲线图(图1、2分别是2000~2009历年城镇居民收入的洛仑兹图)。

图1 2000年城镇居民收入累计洛仑兹曲线图

图2 城镇居民历年收入累计洛仑兹曲线图

plot(x,z0,type="l",main="2000年城镇居民收入累计洛仑兹曲线图",xlab="人口累计率",ylab="收入累计率")

这样我们就能方便的计算出2000年的基尼系数,程序如下:

计算结果为0.3225478 with absolute error<0.00012,从而基尼系数为1-2*0.3225478=0.3549,同样使用模型(4)可以其他年份城镇居民的基尼系数和农村居民的基尼系数,列入表5、6。

表5 城镇居民各年度基尼系数

表6 农村居民各年度基尼系数

由于农村基尼系数缺了2000和2010年的,我们通过时间序列的自回归模型AR(4)进行内插,R程序如下:

运行结果为:

由此得到预测模型为:

下面根据公式(3)来计算全国的基尼系数,对于农村居民收入,我们建议选择纯收入,而不是总收入,这与城镇的收入具有可比性,计算均列入表5。

表5 全国居民收入基尼系数计算表

3 结论

本文的结论表明,根据我们的经验测算公式获得的全国基尼系数比较符合实际。我国仅仅在2000年公布过基尼系数,是0.412,而我们估计的结果是0.413,而到2009年,基尼系数已经是0.49了,这也与大多数学者的预测相符,相信2010和2011全国的基尼系数过0.5没有悬念,这只需要把中国统计年鉴公布的相关数据带入本文介绍的经验测算公式就可以算出来,见表6。

表6 全国各年基尼系数一览表

[1]C.Gini.Variabilità e Mutabilità,Bologna:Tipografia di Paolo Cuppini [Z].1912.

[2]H.Dalton.Measurement of the Inequality of Income[J].Economic Jour⁃nal,1920,(30).

[3]A.Sen.On Economic Inequality,Expanded Edition[M].Oxford:Oxford University Press,1997.

[4]D.G.Champernowne,F.A.Cowell.Economic Inequality and Income Distribution[M].Cambridge:Cambridge University Press,1998.

[5]R.M.Sundrum.Income Distribution in Less Developed Countries,First Published by Routledge[M].New York:Chapman and Hall,l990.

猜你喜欢

人均收入曲线图基尼系数
忠诚村的“棚经济”——村集体资产3025万元,去年村民人均收入2.3万元
这个村子不简单 人均收入十万元
中国人均收入差距分析与预测的实证研究
秦皇岛煤价周曲线图
秦皇岛煤价周曲线图
秦皇岛煤价周曲线图
秦皇岛煤价周曲线图
基尼系数
基尼系数
什么是基尼系数