APP下载

基于结构匹配性的我国GDP数据质量评价研究

2022-01-17岳斯玮

云南科技管理 2021年6期
关键词:误差率总量要素

岳斯玮

(重庆商务职业学院,重庆401331)

关键字:GDP;数据质量;结构匹配性;中国

0 引言

随着云计算技术概念的提出和逐步发展,社会经济正在进入大数据时代,大数据技术应用正在向各个行业渗透,数据已经成为一种“资源”,推动社会进步和发展。但是,数据要为决策者提供合理、科学决策依据的前提是数据必须可靠、准确。因此,保证统计数据质量就显得尤为重要。而作为区域经济、社会发展重要信息载体的宏观经济数据质量,随着经济发展,也显得越发重要。而这其中GDP作为重要宏观经济数据,是宏观经济研究中的一项重要指标,其质量好坏直接影响到区域宏观经济数据质量。所以,对GDP数据质量进行评估就显得非常有重要性和必要性。然而,当前对宏观经济数据质量的评估有一定研究,但对GDP数据质量的评估相对较少,而且研究主要集中在参数可靠性、异常值诊断及国际准则等几个方面,但是从数据结构匹配性的维度来评估GDP数据质量还有待深入研究[1-5]。鉴于此,从数据结构匹配性的维度对GDP数据质量进行评估,以期从理论与实践上为宏观经济数据质量的评估提供一定的依据。

1 GDP数据结构匹配性的内涵

数据匹配性指的是从系统的高度,考察数据间的联系。而作为系统,具体层次性和结构性。所以,从结构匹配性的角度对GDP数据质量评估,就是站在系统的角度,通过考察与GDP相关统计数据之间联系,包括投入与产出之间关系、总体与层级之间的关系、指标与指标之间关系等,来刻画GDP数据质量[6-7]。 因此,基于数据结构匹配对GDP数据质量进行评估,主要指3个方面:一是GDP要素投入结构合理性数据质量,即与GDP有关的生产活动中,投入和产出比例相对稳定;二是GDP总量结构匹配性数据质量,即国民经济活动的结构通过实物量结构来反映,并且GDP总量与国民经济活动结构相匹配;三是GDP生产结构稳定性数据质量,即在一定时间段之内,区域经济生产结构是稳定的。

2 基于结构匹配的GDP数据质量评估模型构建

2.1 GDP要素投入结构、总量结构、生产结构数据质量评估模型

根据GDP数据结构匹配性的内涵,可知GDP结构匹配性数据质量可以从要素投入结构、总量结构、生产结构等3个方面来评估,具体构建评价模型如下:

2.1.1 GDP要素投入结构合理性数据质量评估模型

GDP要素投入结构合理性数据质量主要是从投入与产出之间的关系来刻画GDP数据的质量,根据投入与产出比例的结构来反映GDP的数据质量。因此,根据柯布道格拉斯生产函数,构建GDP要素投入结构合理性数据质量评估模型如下:

其中,K是指资产投入,为了便于数据的收集,用固定资产投入来代替;L是指劳动力投入,为了便于数据的收集,用人口总数来代替;记评估模型的误差率为1E。

2.1.2 GDP总量结构匹配性数据质量评估模型

GDP总量结构匹配性数据质量主要是从实物量的结构来刻画GDP数据质量,根据GDP总量与国民经济活动的结构来反映GDP的数据质量。因此,选择通过工业、农业产量来量化GDP总量结构。但是工业产量与农业产量的指标相对较多,因此,为了使评价结果根据客观性,采用主成分回归分析模型,来量化GDP总量结构匹配性,具体模型如下:

其中,iG表示工业产值的第i个主成分,jN表示农业产量的第j个主成分,m和n分别表示工业产量与农业产量主成分的个数,iα,jβ,0A表示回归系数,记评估模型的误差率为2E。

2.1.3 GDP生产结构稳定性数据质量评估模型

GDP生产结构稳定性数据质量主要是从生产结构的稳定性来刻画GDP数据质量,体现了GDP与区域一定时间段内的生产结构是否相匹配。而GDP与区域货物周转、能源消费、社会消费、农业产量、工业产值等有密切关系,因此,选择货物周转量、能源消费总量、工业总产值、农业总产量及社会消费总额等五个指标与GDP总量的耦合情况,来对GDP生产结构性数据质量进行评估,具体模型如下:

其中,zH表示货物周转量,zY表示能源消费总产量,zX表示社会消费总额,zN表示农业总产量,Gz表示工业总产值,记评估模型的误差率为E3。

2.2 基于结构匹配的GDP数据质量综合评估

2.2.1 GDP数据质量评估标准

根据GDP数据结构匹配内涵可知,GDP要素投入结构、总量结构、生产结构3个方面的一致性与GDP数据质量是正相关的,GDP在这3个方面一致性越好,GDP数据质量就越好。因此,通过计算误差率来衡量GDP在这3个方面的一致性,并且取临界值为5%,超过误差率5%的判定为异常值,即该年的GDP在结构匹配方面的数据质量不好[8-9]。

2.2.2 GDP数据质量综合评估模型

前文所构建的3个模型,是从要素投入结构、总量结构、生产结构3个方面对GDP数据质量进行的评估,为了对GDP在结构匹配方面的数据质量进行综合评估,构建基于结构匹配的GDP数据质量综合评估模型,具体如下:

其中,E1,E2,E3分别表示要入投入结构、总量结构、生产结构3个评估模型的误差率,E表示总体误差率,w1,w2,w3表示权重。由于,GDP在要素投入结构、总量结构、生产结构3个方面权重应该是指标系统内部本身所决定的。所以,w1,w2,w3根据以上3个模型的R2值,进行归一化处理来确定。

3 实证研究

3.1 评价数据选择

为使评价结果客观、准确,需要足够的评价年限,由于统计年鉴具有一定的延迟性,选择2000年到2019年这20年作为评价时间段,并利用“国家数据”网站得到各评价指标的数据,缺失值利用线性回归插值进行估计。

3.2 我国GDP要素投入结构合理性数据质量评估

根据所构建GDP要素投入结构合理性数据质量评估模型,利用SPSS23.0进行参数估计,得到我国GDP要素投入结构合理性数据质量评估模型为:

由参数估计结果可知,判定系数R2=0.996,表明该模型具有较好的拟合优度。可以用该模型来评估我国GDP要素投入结构合理性数据质量。在此基础上,用该模型计算出2000年到2019年GDP估计值与真实值之间的误差率1E,得到我国GDP要素投入结构合理性数据质量评估结果,具体见表1。

表1 我国GDP要素投入结构合理性数据质量评估结果

根据表1可知,从要素投入结构的角度来看,我国2000年到2019年20年间的GDP数据是正常的,表明这20年间我国GDP数据质量相对较好。

3.3 我国GDP总量结构匹配性数据质量评估

根据我国2000年至2019年的工业产量与农业产量的各指标数据,利用SPSS23.0分别对工业产值与农业产量进行主成分分析。根据主成分分析主成分的选取原则,工业产值选取4个主成分,记为G1,G2,G3,G4;农业产量选取3个主成分,记为N1,N2,N3。根据工业产量与农业产量的主成分,进行主成分回归分析,得到我国GDP总量结构匹配性数据质量评估模型为:

根据回归分析结果可知,判定系数R2=0.998,表明该模型具有较好的拟合优度。可以用该模型来评估我国GDP总量结构匹配性数据质量。在此基础上,用该模型计算出2000年到2019年GDP估计值与真实值之间的误差率2E,得到我国GDP总量结构匹配性数据质量评估结果,具体表2。

表2 我国GDP总量结构匹配性数据质量评估结果

根据表2可知,从总量结构匹配性的角度来看,我国2000年到2019年20年间,GDP数据有6年异常,其中有3年高估、有3年低估。表明2000年到2019年我国GDP数据有30%的年份存在数据质量误差,说明从总量结构匹配性的角度来看,我国GDP数据质量相对比较差。

3.4 我国GDP生产结构稳定性数据质量评估

根据所构建GDP要素投入结构合理性数据质量评估模型,利用SPSS23.0进行参数估计,得到我国GDP生产结构稳定性数据质量评估模型为:

由参数估计结果可知,判定系数R2=0.999,表明该模型具有较好的拟合优度。可以用该模型来评估我国GDP生产结构稳定性数据质量。在此基础上,用该模型计算出2000年到2019年GDP估计值与真实值之间的误差率3E,得到我国GDP生产结构稳定性数据质量评估结果,具体见表3。

表3 我国GDP生产结构稳定性数据质量评估结果

根据表3可知,从生产结构稳定性的角度来看,我国2000年-2019年20年间,GDP数据有2年异常,其中有1年高估,有1年低估。表明2000年-2019年我国GDP数据有10%的年份存在数据质量误差,说明从生产结构稳定性的角度来看,我国GDP数据质量相对较好,但是还需加强质量提升。

3.5 基于结构匹配性的我国GDP数据质量综合评估

根据GDP要素投入结构、总量结构、生产结构数据质量评估模型的判定系数R2的值,对R2的值进行归一化处理,得到GDP在要素投入结构、总量结构、生产结构3个评估模型误差率的权重为:w1=0.333,w2=0.333,w3=0.334。从而,得到基于结构匹配性的我国GDP数据质量综合评估模型为:

根据综合评估模型,得到基于结构匹配性的我国GDP数据质量综合评估结果,具体见表4。

表4 基于结构匹配性的我国GDP数据质量综合评估结果

首先,根据表4可知,总体来看,我国GDP数据在结构匹配性方面,2000年到2019年20年间有2年数据存在异常(1年高估,1年低估),表明20年间我国有10%年份存在数据误差,但是,异常值主要在2005年以前,表明我国GDP数据质量明显改善。

其次,具体来看,根据表1、表2、表3、表4的数据,作折线图,得到我国结构匹配性评估结果折线图,具体见图1。根据图1可知,在2000年到2019年间,3个评估模型结果有12年存在一致性,其余8年不一致,要么有1个高估,要么有1个低估,表明单模型的误差率一致性较差,说明我国GDP数据质量的内部结构性还不够均衡。而且,从整体来看,2000年到2009年,不管是从要素投入结构、总量结构、生产结构的评估结果来看,还是综合评估结果来看,GDP数据质量误差波动明显,在2010年以后GDP数据质量误差有明显改善,不管是单模型还是综合模型评估,数据质量都比较好。并且,根据图1可见,当前影响我国GDP数据质量,主要是GDP在总量结构方面的数据质量还有待提高。

图1 我国结构匹配性评估结果折线图

4 结论

基于结构匹配性,从要素投入结构、总量结构、生产结构3个方面构建了GDP数据质量评估模型,并利用构建模型,对我国2000年到2019年20年间GDP数据质量进行了评估。根据研究,得出了以下结论:

首先,从要素投入结构的角度来看,我国GDP数据是正常的,表明这20年间我国GDP数据质量相对较好。从总量结构匹配性的角度来看,我国GDP数据有6年异常,在20年间我国GDP数据有30%的年份存在数据质量误差,说明从总量结构匹配性的角度来看,我国GDP数据质量相对较差。从生产结构稳定性的角度来看,GDP数据有2年异常,在20年间我国GDP数据有10%的年份存在数据质量误差,说明从生产结构稳定性的角度来看,我国GDP数据质量相对较好,但是还需加强质量提升。

其次,从3个评估模型结果的一致性来看,有12年存在一致性,其余8年都不一致,要么有1个高估,要么有1个低估,表明单模型误差率一致性较差,说明我国GDP数据质量的内部结构性还不够均衡。

第三,从评估结果的误差率波动来看,在2000年-2009年,不管是从要素投入结构、总量结构、生产结构的评估结果来看,还是综合评估结果来看,我国GDP数据质量误差波动明显,在2010年以后GDP数据质量误差有明显改善。并且,当前影响我国GDP数据质量的主要是GDP在总量结构方面的数据质量还有待提高。

第四,总体来看,在结构匹配性方面,我国GDP数据2000年到2019年20年间有2年数据存在异常(1年高估,1年低估),表明20年间我国GDP数据有10%年份存在数据误差,但是,异常值集中在2005年以前,表明我国GDP数据质量正在明显改善。

综上,从结构匹配性角度来看,我国GDP数据质量总体发展趋势是好的,但是从总量结构匹配性及生产结构稳定性2个方面GDP数据质量还有待提高,因此要加强这2个方面数据的收集、发布、评价等各个环节的监管,保证数据质量的真实有效,从而提高GDP数据的整体质量。同时,积极构建相应保障制度,保障GDP的数据质量,使其能越来越真实、客观、有效反映社会发展状态。

猜你喜欢

误差率总量要素
“十三五”期间山西省与10省签约粮食总量2230万吨
2020年全国农民工总量比上年减少517万人
掌握这6点要素,让肥水更高效
生化检验全程中质量控制管理方式及应用意义
降低评吸人员单料烟感官评分误差率探讨
为何化肥淡储总量再度增加
总量控制原则下排污权有效配置的实施
观赏植物的色彩要素在家居设计中的应用
论美术中“七大要素”的辩证关系
无线传感器网络定位算法在环境监测中的应用研究