APP下载

政府数据开放对数字经济的影响

2023-10-16赵丽丽郝文强

统计与决策 2023年18期
关键词:效应创新能力检验

赵丽丽,郝文强

(复旦大学 国际关系与公共事务学院,上海 200433)

0 引言

在大数据时代,数字经济成为推动经济高质量发展的关键动能。“十四五”规划指出,要加快数字化发展,建设数字中国。数据作为一种新型生产要素成为数字经济发展的重要支撑。政府数据开放运动试图通过数据共享来丰富社会财富生产过程中的数据资本,进而充分释放数据要素的经济红利。然而,政府数据开放中存在的隐私泄露、立法不足、质量不齐、标准不一[1]等问题,导致数据要素的作用难以充分发挥。因此,厘清政府数据开放对数字经济的驱动效应及其机制对于建设数字政府、促进经济高质量发展具有重要意义。

现有文献对于数字经济的研究主要聚焦于数字经济发挥的作用,包括对劳动生产率、城乡融合、产业升级、区域创新、高质量发展[2—5]等方面的影响。但是,鲜有研究关注数字经济的前驱因素,因此,本文立足于数字经济的发展现状,采用多期DID方法,基于2013—2020年省级面板数据,系统分析政府数据开放对数字经济的政策效应;并进一步基于创新理论视角,验证区域创新能力与区域创新环境的调节效应;此外还从不同区域维度考察了政府数据开放对数字经济影响的异质性,从而拓宽了政府数据开放对数字经济发展影响过程的理论外延和研究体系。

1 研究假设

1.1 政府数据开放与数字经济

数据是数字经济发展的核心生产要素,而政府数据开放则为数字经济的发展提供了数据资源支撑。政府数据开放是指将自身所拥有的数据向社会免费开放,人们可以自由地访问、获取、利用政府、事业单位、社会团体等非营利性组织所提供的数据。值得注意的是,政府数据开放不等同于政府信息公开,开放的数据是指没有经过任何二次加工的原始材料,包括数字、图片、声音等,具有原始性、共享性、可复用性、无限供给性的特征。

首先,数据具有原始性。政府数据开放赋予了市场主体调用公共数据的权利,各主体可以根据自身目的对原始数据进行深度处理和使用,并将其转化为驱动数字经济发展的生产力要素[6]。其次,数据具有共享性。政府数据开放直接推动了数据的共享,让不同领域的数据信息在交叉共享过程中得以相互印证,减少了信息不对称,促进新知识的产生[7]。然后,数据具有可重复利用性。政府数据开放推动了数据要素在市场上的不断流动、匹配、交换,经过持续复用和加工,形成的各种大数据产品和服务则成为数字经济的直接构成部分[8]。最后,数据具有无限供给性。尤其是政府数据开放更是直接提供了免费、无限的数据资源,让生产要素的供给不再成为经济增长的制约因素,为数字经济发展提供了可持续性动能。据此,提出本文的研究假设:

假设1:政府数据开放能够促进数字经济发展。

1.2 基于创新理论的调节机制

熊彼特认为,所谓创新就是“生产要素的重新组合”,就是要把一种从来没有的关于生产要素和生产条件的“新组合”引进生产体系中,进而重组生产要素、新建生产流程、改进生产技术[9]。而数字经济是在传统创新理论的基础上进行的一场颠覆性突破,更加强调新理念、新技术、新生态等方面的综合创新。由此可见,区域创新能力和创新环境会显著影响政府数据开放与数字经济之间的关系。

1.2.1 区域创新能力的调节效应

区域创新能力体现为地区吸引和利用生产要素的能力[10]。区域创新能力强的地区,对数据的利用率更高,更能有效激发数据应用与数据增值,推动生产要素的重新组合,从而促进数字经济快速发展。具体而言,创新能力可以通过规模经济效应、创新外溢效应、竞争效应等多种路径对政府数据开放与数字经济发展的关系产生影响[11]。第一,区域创新能力强意味着企业可以通过规模效应降低数据要素的使用成本,并且规避一定的研发风险,从生产投入的源头降低损耗,助推数字经济生产效率提高。第二,创新能力强的地区,企业可以通过开放数据的共享、流转,进一步形成创新外溢效应,从而不断拓展用户和产品边界,推动数字经济发展。第三,创新能力强的地区,企业的竞争力更大,这种竞争效应会倒逼企业不断革新其自身的生产力和生产关系,促进经济发展的数字化转型[12]。据此,提出如下假设:

假设2:区域创新能力在政府数据开放推动数字经济发展的过程中发挥正向调节作用。

1.2.2 区域创新环境的调节效应

创新环境对政府数据开放赋能数字经济发展的调节效应主要体现在人力资源禀赋和信息技术水平两个关键要素上[13]。人力资源禀赋是数字经济发展的基础和先决条件。数据开放赋能数字经济发展依托于知识密集型的高新技术产业,需要通过数字要素与传统产业的深度融合实现,因此对人才的依赖颇为明显。科技人才集聚可以缩短空间距离,降低信息交易成本以及提供丰富的培训和晋升机会,从而推动数字要素更快更好地融入传统产业[14]。据此,提出如下假设:

假设3a:人力资源禀赋在政府数据开放推动数字经济发展的过程中发挥正向调节作用。

信息技术为开放数据的使用提供了资源平台。通过将数据在平台上无限共享,拓展了产品的交换空间,打破了地方保护主义,不仅降低了交易成本,也能进一步实现数据资源的增值。此外,基于互联网平台的分享经济模式能够提升传统服务业的个性化和精准化程度,从而促进传统服务业的数字化升级[15]。据此,提出如下假设:

假设3b:信息技术水平在政府数据开放推动数字经济发展的过程中发挥正向调节作用。

2 研究设计

2.1 模型构建

自2015年国务院发布《促进大数据发展行动纲要》以来,各省级政府相继建立政府数据开放平台,这对于各省份数字经济发展而言是外生事件。考虑到各省份建立政府数据开放平台的时间不一致,本文采用多期DID方法对政府数据开放对数字经济发展的政策效应进行估计。本文将建立政府数据开放平台的省级政府作为实验组,尚未建立政府数据开放平台的省级政府作为对照组,构建双向固定效应双重差分模型。

为检验上述研究假设,先针对直接传导机制构建基准回归模型:

其次,为验证创新能力和创新环境的影响机制,构建调节效应模型:

式(1)和式(2)中,i表示省份,t表示年份。Digeit为被解释变量,表示数字经济发展水平;DIDit为核心解释变量,表示政府数据开放的虚拟变量;Zit代表调节变量,可以将区域创新能力和创新环境变量分别代入;α1为政府数据开放试点的回归系数,代表了政府数据开放试点对数字经济的政策效应;β3代表调节效应;Controlit表示控制变量,μi表示地区固定效应,θt表示时间固定效应,εit是随机扰动项。

2.2 变量说明

数字经济发展水平是被解释变量。本文借鉴刘军等(2020)[16]的做法,选取信息化发展、互联网发展和数字交易发展3个维度共14个测度指标构建了2013—2020年各省级政府的数字经济发展水平评价指标体系(见表1)。测度指标的基础数据均来自《中国统计年鉴》与国家统计局发布的分地区数据。

表1 数字经济发展水平评价指标体系

政府数据开放是核心解释变量。核心解释变量是时间虚拟变量与实验组虚拟变量的乘积。时间虚拟变量是指,若某省份在某年进行了政府数据开放试点,则将这一年及以后的年份赋值为1,否则为0;实验组虚拟变量是指,若该省份进行了政府数据开放试点,则赋值为1,否则为0。

区域创新能力。本文采用中国科技发展战略研究小组联合中国科学院大学中国创新创业管理研究中心编写的《中国区域创新能力评价报告》中的区域创新能力综合效用值来衡量区域创新能力。在该报告中,从知识创造、知识获取、企业创新、创新环境和创新绩效5 个维度出发,构建了包含5 个一级指标、20 个二级指标、40个三级指标和138 个四级指标的区域创新能力综合效用值评价指标体系。

区域创新环境。人才资源与技术条件是制约数字经济发展的两个关键环境要素。因此本文采用人力资源禀赋和信息技术水平作为区域创新环境的代理变量。其中,人力资源禀赋变量采用信息传输、计算机服务和软件业从业人员数量进行测量;信息技术水平采用互联网宽带接入用户数来衡量。

控制变量。本文的控制变量及其测量方式借鉴了赵涛等(2020)[17]、韩璐等(2021)[18]的做法,选取如下可能与数字经济发展相关的区域特征因素。(1)经济发展水平,用人均GDP的对数来控制经济发展水平可能存在的影响。(2)产业结构水平,用第二产业产值占地区生产总值比重表示。(3)金融发展水平,用金融业产值占地区生产总值比重表示。(4)投资发展水平,用地区固定资产投资总额占地区生产总值比重表示。(5)财政分权度,用一般公共预算收入占一般公共预算支出的比重来表示。(6)城市化水平,用人口密度来表示,即年末总人口与区域面积之比。(7)教育科技水平,用教育支出与科学技术支出之和占一般公共预算支出的比重表示。

2.3 样本选取与数据来源

本文采用复旦大学数字与移动治理实验室2020年发布的《中国地方政府数据开放报告》中已经建立政府数据开放平台的省级政府作为实验组,其他未建立政府数据开放平台的省级政府作为对照组。《中国地方政府数据开放报告》还汇报了各省级政府数据开放平台上线时间表。尽管北京和上海政府数据开放平台在2012 年便已经设立,但鉴于其他省级政府数据开放平台都在2015年国务院发布《促进大数据发展行动纲要》之后设立;同时由于2013年之前的数据缺失严重,因此选择2013—2020 年作为研究区间。区域创新能力数据来源于历年《中国区域创新能力评价报告》,其他数据均来源于《中国统计年鉴》和国家统计局官网发布的分地区数据。对于个别缺失值的处理,采用线性插补法进行填补,以保证样本数据的充足性与完整性。基于此,最后形成了我国31 个省份(不含港澳台)2013—2020 年的面板数据作为观测样本。表2 汇报了样本数据的描述性统计结果。

表2 描述性统计结果

3 实证分析

3.1 平行趋势检验

平行趋势检验是使用DID 模型评估政府数据开放对数字经济影响的前提条件。以数字经济发展水平为因变量,构造提前4个年份、滞后3个年份的动态效应模型,如式(3)所示:

检验结果如图1所示。从结果可以看出,建立政府数据开放试点之前的系数在95%的置信区间内不显著异于0,表明政策实施前试点区域和非试点区域的数字经济发展水平有着相同的变化趋势。建立政府数据开放试点之后,组间差异显著高于0,表明政策实施对数字经济发展水平产生显著影响,通过平行趋势假设检验。

图1 数字经济发展水平的平行趋势检验

3.2 基准回归

下页表3 报告了基准回归结果。第(1)列为不加入控制变量的结果,第(2)列为加入控制变量后的结果。结果显示,在加入控制变量之前,政府数据开放的系数在1%的水平上显著为正。加入控制变量后,政府数据开放的系数在5%的水平上仍然显著为正。这意味着政府数据开放能够显著提高数字经济发展水平。假设1 得到验证。

3.3 稳健性检验

3.3.1 基于PSM-DID的检验

为控制样本选择偏误带来的内生性问题,使用PSM-DID方法进一步降低基准回归的选择偏误。本文采取卡尺最邻近匹配(1∶2)方法来计算倾向匹配得分,从而构造了与实验组不存在显著差异的控制组。从下页图2可以看出,在匹配之前,实验组与控制组的核密度曲线图趋势差异较大,匹配之后二者的偏差减小,趋势接近。这说明匹配策略有效,在此基础上,再进行DID估计。

图2 核密度分布图

PSM-DID估计结果如表4所示,第(1)列和第(2)列分别汇报了未加入控制变量和加入控制变量后的PSM-DID检验结果。结果表明,无论是否加入控制变量,回归系数都显著为正。这意味着在使用PSM-DID降低样本选择偏误之后,假设1依旧成立。

表4 基于PSM-DID的实证检验结果

3.3.2 安慰剂检验

区域随时间变化的非观测因素也会影响DID 估计结果的真实性。虽然基准回归中已经加入省份和时间的固定效应,但仍然可能存在其他无法观测的区域特征,可能随着时间变化产生不同影响。本文通过随机划分控制组与实验组,保持政策时间不变,按照式(1)估计虚拟的政策效应,重复1000次。通过观察这1000个估计值的分布,可以发现,t值分布近似于正态分布,结果具有稳健性。

3.3.3 反事实检验

为了进一步排除其他影响数字经济发展水平的随机因素的干扰,本文构建了反事实检验。本文将政府数据开放平台的设立时间分别统一提前1 年(DID-advan1)、2 年(DID-advan2)和3年(DID-advan3)进行验证,具体回归结果如表5所示。

表5 政府数据开放对数字经济发展水平的反事实检验

结果表明,将政府数据开放试点设立时间分别提前1年、2 年、3 年后,政府数据开放对数字经济发展水平无显著影响。说明未建立政府数据开放平台时,虚拟变量DID没有给数字经济发展带来任何影响。因此,基准模型中的结论是可信的。

3.4 调节作用检验

表6 汇报了区域创新能力和创新环境的调节效应。第(1)列检验了区域创新能力的调节效应。结果显示,政府数据开放和区域创新能力的交互项系数在1%的水平上显著为正,说明区域创新能力越高,政府数据开放越有可能驱动数字经济发展。假设2得到验证。

表6 调节效应检验结果

第(2)列检验了人力资源禀赋的调节效应。结果显示,政府数据开放与人力资源禀赋的交互项系数在1%的水平上显著为正,表明人力资源禀赋越高的区域,政府数据开放对数字经济发展的驱动作用越强。假设3a得到验证。

第(3)列检验了信息技术水平的调节效应。结果显示,政府数据开放与信息技术水平的交互项系数在1%的水平上显著为正,表明信息技术水平越高的区域,政府数据开放驱动数字经济发展的作用越明显。假设3b得到验证。

3.5 异质性检验

我国经济发展呈现显著的区域性差异,不同区域的资源条件、经济基础、对外开放水平不同,因此政府数据开放对数字经济发展的政策效应可能存在区域性差异。对此,本文按照国家统计局最新区域划分标准,将31 个省份划分为东部、中部、西部和东北地区①资料来源于http://www.stats.gov.cn/hd/lyzx/zxgk/202107/t20210730_1820095.html。。

异质性检验结果如表7 所示,由于东北地区3 个省份都没有进行试点,无须进行效应检验,因此本文只汇报东、中、西部三个地区的结果。第(1)列呈现了东部地区的回归结果,回归系数在5%的显著性水平上为正,说明东部地区政府数据开放能够显著促进数字经济发展。第(2)列呈现了中部地区的回归结果,回归系数不显著,说明中部地区政府数据开放对数字经济发展的政策效应不显著。第(3)列呈现了西部地区的回归结果,回归系数不显著,表明西部地区政府数据开放没有促进数字经济发展。这一结果可能的原因是:在经济发达、资源充足的东部地区,政府数据开放释放的数据要素能够被充分有效利用,进而促进数字经济发展。而中部和西部地区多为资源密集型产业,其创新能力和创新环境水平也远低于东部地区,因此对数据要素的利用率不高。

表7 异质性检验

4 结论与建议

本文基于2013—2020 年31 个省份的样本数据,采用多期DID 方法实证分析了政府数据开放对数字经济发展的效应,得到以下结论:(1)政府数据开放对数字经济发展具有显著的正向影响。这一结论经过平行趋势检验、倾向匹配得分检验、安慰剂检验、反事实检验后依旧稳健。(2)区域创新能力和区域创新环境是政府数据开放促进数字经济发展的关键调节机制。即区域创新能力越强、人力资源禀赋越好、信息技术水平越高的区域,政府数据开放对数字经济发展的驱动作用越强。(3)政府数据开放对数字经济发展的政策效应存在区域差异。在东部地区,政府数据开放能够显著促进数字经济发展,而在中部和西部地区,政府数据开放对数字经济发展的政策效应不显著。

根据本文研究结论,为促进数字经济更好更快地发展,提出如下三点建议:

(1)加速政府数据开放的纵深推进,为数字经济发展提供丰富的基础资源。目前,我国政府数据开放面临普及范围有限、开放程度较浅、开放阻力较大等诸多困境。对此,应按照“增量先行”的方式,加快建成国家公共数据统一开放平台,加速政府数据开放试点在全国范围内的普及。在此基础上,应以法律形式明确政府数据开放的规则与秩序,积极消除政府数据开放的阻力,建构起国家安全、商业机密与个人隐私的牢固防线,以此推动政府数据开放进程。

(2)提升数字创新能力与支持数字创业活动,加速经济发展的数字化转型。在数字化转型过程中,加强对数字创新技术的研发力度,使我国以拥有自主知识产权的数字技术占据全球数字经济国际竞争格局的有利位置。同时,还应构建“政用产学研”互联互通的创新网络,制定相关政策鼓励数字化转型的相关创业活动,通过利用数字技术充分挖掘数据资源的巨大价值,形成“大众创新、万众创业”的数字经济发展新局面。

(3)营造数据人才聚集、信息设施完善的创新环境,为数字经济发展提供有力保障。一方面,要积极培养数据人才,强化数字领域的人才供给。科研院校应围绕数字经济的基础研究、创新研发、产业发展和行业应用等领域设立相关专业,加强科学型和专业型人才培养;各地方政府也应积极以“政策聚才”“项目引才”“以赛代引”等方式促进数字人才集聚,通过优惠奖补政策、创新激励机制使人才“进得来”也“留得住”。另一方面,要加强5G基站、大数据中心、工业互联网等新基建建设,为数字经济发展奠定扎实基础。

猜你喜欢

效应创新能力检验
高中数学课堂教学中创新能力的培养
铀对大型溞的急性毒性效应
创新能力培养视角下的无机化学教学研究
懒马效应
2021年《理化检验-化学分册》征订启事
推进软件产业创新能力提升
对起重机“制动下滑量”相关检验要求的探讨
基于创新能力培养的高职音乐教育改革探讨
应变效应及其应用
关于锅炉检验的探讨