APP下载

基于内部民调的地方统计数据准确性及影响因素研究

2014-01-01刘锦扬成美纯

统计与信息论坛 2014年2期
关键词:被调查者统计数据年限

朱 胜,刘锦扬,成美纯

(成都信息工程学院 统计学院,四川 成都610103)

一、研究背景和意义

统计数据是统计工作的成果。随着中国经济的持续快速发展,反映中国经济发展的官方统计数据引起了国内外相关机构、学者及大众的广泛关注,统计数据特别是GDP及其增长率数据的准确性成为关注的焦点问题之一。孟连、王小鲁对中国经济增长统计数据进行可靠性研究后认为中国的GDP被高估[1]。Tomas G.Rawski认为中国官方统计明显夸大了经济增长率,GDP数据存在严重的上偏误差[2]。这些文章随后被国内媒体广泛引用,引发了国内外学术界就中国宏观统计数据可靠性问题的大辩论。上述学者的研究结论激发了国内外一些学者对中国宏观经济统计数据可靠性的研究兴趣[3-5][6]51-77[7]5-22。此外,少数学者采用经典计量模型对地区层面上经济统计数据(主要是GDP)的可靠性进行了评估[8-9]。2000年以后山西、广东、黑龙江等22个省(市、区)和多个地市相继出台了统计数据质量评估或控制办法。

2010年1月28日,国家统计局局长马建堂在全国统计工作会议上明确提出2010年全国统计工作的重点是“三个提高”,即提高统计能力、提高统计数据质量和提高政府统计公信力。由此可见,统计数据质量特别是可靠性已越来越受到国家及相关部门的重视,统计数据可靠性程度反映了中国政府统计的公信力。开展中国统计数据准确性及其影响因素的调查研究具有重要的现实意义。

二、调查的基本情况

地方统计数据准确性及影响因素的调查是通过调查从事统计工作的相关人员对目前中国统计数据的可靠程度和准确性的认知,了解在统计系统工作相关人员对统计数据可靠性状态的感受和评价。专门从事统计相关工作的人员对统计数据的来源、收集整理和汇总有着直接的了解和掌握,对统计数据的可靠程度和影响因素了解较透彻,感受最贴近实际情况,更能真实地感知统计数据的可靠性。调查的基本情况如下:

调查项目:统计数据准确性及影响因素专题调查

调查时间:2012年10月至2013年5月;

调查对象:政府统计机构工作人员;

调查内容:统计数据准确性的基本特征评价、地区各主要统计指标数据的准确性评价、统计数据准确性的影响因素;

调查方式:采用问卷调查,抽取参加全国统计干部培训会议的各级政府统计机构的625名工作人员进行调查,收回有效问卷603份。

三、调查结果分析

(一)统计数据准确性的基本特征评价

本次调查了四个反映统计数据准确性的基本特征,分别为:统计数据反映实际情况的准确程度、统计数据的关联项目之间的一致性、统计数据在时间维度上的连续性和不同来源、部门、项目的统计数据可比性,评价程度依次分为高、较高、一般、较低和低五个等级。

为了定量分析被调查者对上述四个基本特征的评价,采用Likert量表法对每个特征的评价进行评分,具体做法为:按照评价高低不同,依次赋予5分、4分、3分、2分、1分,以评价人数比重加权平均计算各质量特征的得分,具体结果见表1:

表1 被调查者对统计数据质量四个基本特征的评价表

1.统计数据反映实际情况的准确程度

调查显示,统计工作者中认为统计数据反映实际情况的准确程度高或较高的占42.13%,认为准确程度低和较低的人数略多于10%。可见被调查者认为,当前中国统计数据基本上能够反映实际情况,但准确性仍然有待提高。

从交叉分组来看,工作年限越长,对统计数据反映实际情况的准确程度的评价越低。工作5年以内、5~10年、10~20年和20年以上的统计人员对统计数据反映真实情况的准确度评分分别为3.48、3.27、3.11和3.33分。

从职务分组来看,职务越高者对统计数据反映实际情况的准确程度的评价越低。一般统计人员对统计数据反映实际情况的准确程度的评分为3.42分,中层干部的评分为3.29分,而单位领导的评分最低,为3.28分。

2.统计数据关联项目之间的一致性

多数被调查者认为统计数据的关联项目之间的一致性处于一般水平以上,人数比重达49.59%,认为一致性高和较高的也超过4成,认为一致性程度低和较低的未超过10%。

交叉分析,随着工作年限的增加,对统计数据关联项目之间的一致性整体评价越低。4个工作年限段的被调查者评价得分依次递减,分别为3.52、3.26、3.26、3.19。同时,职务越高者的评分越低,单位领导、中层干部、一般统计人员的评分依次为3.18、3.24、3.59。

3.统计数据在时间维度上的连续性

被调查者认为中国统计数据在时间维度上的连续性较好。认为连续性高和较高的人数占总人数近一半,而认为连续性较低和低的不足7%。但是,职务越高的被调查者,对该特征的评价也越低,职务从高到低,对该项质量特征的评分依次为3.31、3.54、3.73。

4.不同来源、部门、项目的统计数据可比性

被调查者认为不同来源、部门、项目的统计数据可比性较差。认为可比性高和较高的人数不足15%,而认为可比性低和较低的人数近40%,该特征平均得分仅2.72分,远低于上述三项质量特征的得分。

(二)地区主要统计指标数据准确性评价

根据调查数据整理,得到统计工作者对地区主要统计指标数据与实际水平的差距程度主观判断,具体结果见表2:

表2 统计人员对地区主要统计指标数据与实际水平差距程度的判断表

1.地区生产总值

从调查结果来看,被调查者普遍认为地区生产总值统计数据比实际值偏高。近60%的被调查者认为地区生产总值数据比实际水平大5%以上,甚至超过15%的被调查者认为大了20%以上,只有8.63%的被调查者认为比实际水平小5%以上,而认为地区生产总值比实际水平大或小5%以内的人仅占三成。而且,工作年限越长、职务越高者认为该指标数据偏高的人数比重就越大。工作年限在10年以上者认为地区生产总值被虚增5%以上的人数超过了六成,单位领导中也有六成认为地区生产总值被虚增5%以上。

2.地区工业增加值

与地区生产总值准确性评价结果类似,近六成被调查者认为地区工业增加值比实际水平大5%以上,更有近20%的被调查者认为大了20%以上,仅有7.97%的被调查者认为其值比实际水平小5%以上,认为地区工业增加值比实际水平的差距程度在5%以内的人仅仅占到34.49%。说明被调查者普遍认为地区工业增加值同样存在一定的“水分”。而且,工作年限越长、职务越高者认为该指标数据偏高的人数比重就越大。工作年限在10年以上者和单位领导、中层干部中均有超过六成的人认为地区工业增加值被虚增5%以上。

3.地区全社会固定资产投资额

高达62.69%的被调查者认为地区全社会固定资产投资额统计数据较实际水平偏大5%以上,甚至有24.88%的被调查者认为该项数据大了20%以上,仅5.97%的被调查者认为地区全社会固定资产投资额比实际水平小5%以上,31.34%的被调查者认为地区全社会固定资产投资额比实际水平大或小5%以内。与其它统计指标相比,被调查者中认为全社会固定资产投资额超过真实水平5%以上的人数比重最大。工作年限在10年以上的人以及单位领导中均有超过7成的人认为该指标数据偏大5%以上。

4.城镇居民人均可支配收入

调查结果表明,城镇居民人均可支配收入准确性处于较高水平。被调查者的选择更多地集中在“大或小5%以内”,选择偏高5%以上的人数略多于选择偏低5%以上的人数。与地区生产总值、地区工业增加值和地区全社会固定资产投资额比较,被调查者认为城镇居民人均可支配收入接近真实水平的程度相对较高。有趣的是,单位领导认为该指标数据被低估的比例最大,达到27%。

5.农民人均纯收入

与城镇居民人均可支配收入类似,农村居民人均纯收入准确性也处于较高水平。被调查者的选择更多地集中在“大或小5%以内”,选择偏高5%以上的人数略多于选择偏低5%以上的人数,单位领导认为该指标偏低5%以上的比例最高,达到34.83%。

可见,凡是与收入相关的统计指标,被调查者均认为其被低估的可能性较大,程度较高。这主要是因为被调查者倾向于低报真实收入以及高收入者不愿接受调查所致。

6.粮食总产量

调查显示,45.77%被访者认为粮食总产量比实际水平大或小5%以内,该指标的准确程度较高,但也有42.61%的被访查者认为粮食总产量比实际水平偏大5%以上,该指标数据含有“水分”可能性也较大。与工作年限、职务交叉分析,也呈现出工作年限越长、职务越高的被访者认为该指标数据被高估的比重就越大的特点。

7.地区能源消费总量

调查显示,被调查者认为地区能源消费总量数据的准确性高。近50%的被访者选择“大或小5%以内”,只有28.47%的人认为其值比实际水平大5%以上,在各评价指标中这一比例是最低的。但工作年限越长的人认为它被低估的比率就越大,职务越高者认为被低估的比率也越大。

为了便于综合比较,将各指标赋分如下:大或小5%以内得5分、大或小5%~10%得4分、大或小10%~20%得3分、大或小20%~40%得2分、大或小40%以上得1分。

按人数比重加权计算各指标准确度得分,依次为地区能源消费总量4.15分、粮食总产量4.13分、城镇居民人均可支配收入4.05分、农民人均纯收入4.01分、地区生产总值3.76分、地区工业增加值3.7分、地区全社会固定资产投资额3.52分。从评价的偏态来看,地区全社会固定资产投资额数据严重偏高,地区生产总值、地区工业增加值和粮食总产量数据偏高,地区能源消费总量、城镇居民人均可支配收入、农民人均纯收入数据偏低。

(三)统计数据准确性影响因素评价

影响统计数据准确性的因素是多方面的。本次调查所拟定的影响统计数据准确性的因素主要有社会风气、统计管理体制、领导干预、统计方法制度、统计法律法规、统计队伍状况和统计工作条件。调查结果见表3:

表3 各因素对统计数据准确性的影响程度表

采用Likert量表法对每个因素进行评分,计算各因素的综合得分:

依据上述评分,得分越高表明该因素对中国统计数据准确性影响越大。对影响统计数据准确性的因素排序如下:

领导干预>统计管理体制>统计方法制度>社会风气>统计工作条件>统计队伍状况>统计法律法规。

四、主要结论

1.统计数据的四大质量特征中“统计数据在时间维度上的连续性”的评价最高,“统计数据反映实际情况的准确程度”和“统计数据的关联项目之间的一致性”也得到了多数人的认可,而“不同来源、部门、项目的统计数据可比性”是四大质量特征中评价最低的,仅得到2.71分,评价未能及格。

2.分指标来看,地区能源消费总量、粮食总产量、城镇居民人均可支配收入、农民人均纯收入四个指标的准确性较高,而地区生产总值、地区工业增加值、地区全社会固定资产投资额的准确性较低。从数据的偏态来看,地区全社会固定资产投资额数据严重偏高,地区生产总值、地区工业增加值和粮食总产量数据偏高,地区能源消费总量、城镇居民人均可支配收入、农民人均纯收入数据略显偏低。

3.从职务和工作年限来看,职务越高、工作年限越长的被调查者对地方统计数据准确性的评价就越低。

4.在影响统计数据质量的因素中,领导干预是最为主要的因素,按影响统计数据准确性的重要程度排序依次为:统计管理体制、统计方法制度、社会风气、统计工作条件、统计队伍状况、统计法律法规。

[1] 孟连,王小鲁.对中国经济增长统计数据可信度的估计[J].经济研究,2000(10).

[2] Rawski T.What is Happening to China’s GDP Statistics[J].China Economic Review,2001(12).

[3] 任若恩.中国GDP统计水分有多大—评两个估计中国数据研究的若干方法问题[J].经济学(季刊),2002(4).

[4] Klein LR,Ozmucur S.The Estimation of China’s Economic Growth Rate[J].Journal of Economic and Social Measurement,2002,28(4).

[5] 汪同三.克莱因教授认为中国15项统计指数与GDP增长率相一致[J].数量经济技术经济研究,2002(8).

[6] 周建.宏观经济统计数据诊断—理论、方法及其应用[M].北京:清华大学出版社,2005.

[7] 王华,金勇进.统计数据质量评估[M].北京:中国统计出版社,2010.

[8] 阙里,钟笑寒.中国地区GDP增长统计的真实性检验[J].数量经济技术经济研究,2005(4).

[9] 周国富,连飞.中国地区GDP数据质量评估[J].山西财经大学学报,2010(8).

猜你喜欢

被调查者统计数据年限
创新视角下统计数据的提取与使用
一个可供选择的全随机化模型
影响种公牛使用年限的几个因素与解决办法
国际统计数据
00后阅读偏好的三大特点
2017年居民消费统计数据资料
不同产地、生长年限银杏叶总多酚含量比较
统计数据
外地参保年限可连续计算
你为何不能幸福地工作?