APP下载

中国地方政府数据开放平台现状研究

2019-09-10王艺枫

新生代·上半月 2019年4期
关键词:大数据

王艺枫

【摘要】:从数据层面和平台层面层面考察各个地方政府数据平台的数据资源建设情况、平台服务情况和使用情况进行比较研究,分析政府数据开放的现状和不足,为我国建设全国性的政府数据开放平台提供经验和建议。通过调查分析,发现各地方政府数据开放平台存在发展地区发展不均衡、数据集开放程度差异较大、用户授权协议描述不全面、数据集的浏览检索方式單一、元数据标准不统一等5个问题,同时为全国统一的政府数据开放平台的建设提出了建议。

【关键词】:政府数据开放 开放数据 政府数据开放平台 大数据

1 引言

政府数据开放是继政府信息公开之后政府加深政务公开、提高政府服务效率、促进政府信息资源共享和公众对政府信息资源利用的一项重大举措。政府数据开放是指政府在其政务活动中产生、收集和拥有的数据,这些数据是不受著作权、专利权,以及其他管理机制所限制,以机器可读的形式开放给社会公众,任何人都可以免费获取和自由使用。

2 研究目的

我国政府数据开放还处于起步阶段,选取几个具有代表性的地方政府数据开放平台,依据政府数据开放的原则、标准对选取的地方政府数据开放平台的进行分析研究。主要从数据层面和平台层面建立评估指标,考察各个地方政府数据平台的数据资源建设情况和平台服务情况进行比较研究,分析各地政府数据开放平台的现状和不足,为我国建设全国统一的政府数据开放平台提供经验和建议。

3 研究方法

3.1 研究范围和样本选择

本次研究选取了部分我国政府数据开放平台作为研究对象。筛选得到符合要求的政府数据开放平台共27个。从27个政府数据开放平台中选取具有代表性和满足研究条件的平台共16个作为研究样本。

3.2 评估框架和指标

本研究在结合前者研究的基础上,选择一些易于考察、获取和比较的指标作为评估指标。整体上分为对“数据、平台”两个层面上对各政府数据开放平台之间和同一个平台中不同主题资源之间使用的情况进行比较分析。

4 研究发现

4.1 数据层面

4.1.1 有用性

4.1.1.1 数据集总量

数据集通常是一组数据的集合,数据集的内容通常以表格形式出现,所对应的是数据库中的表。每列表代表一个特定的变量,并且每个行对应于一个的数据样本。政府数据开放平台的数据集通常是可供下载的数据文件或者可以调用的API接口。

4.1.1.2 数据格式与机器可读

机器可读数据是可由计算机程序自动读取和处理的数据或元数据格式。机器可读格式包括RDF、XML、JSON、CSV、XLS等格式。对各地政府数据开放平台开放的数据格式分析得出,基本上所以的数据开放平台都提供了可供用户下载的数据格式,使用的格式包括CSV、XLS、XLSX、JSON、XML、TXT、RAR、ZIP、PDF、JPG、DOC、网页链接和空间数等据格式类型。

4.1.1.3 元数据

本次研究选取DC元数据和W3C发布的针对开放数据的DCAT元数据的部分元素作为基本元数据来比较各政府数据开放平台的元数据提供情况。主要使用的元数据元素有名称、主题、描述、关键字、提供方、获取权限、发布日期、更新日期、更新频率、下载量、浏览量、格式、字节大小、语种、标识符等15种基本元数据元素。目前我国政府数据开放平台的元数据主要以描述性元数据为主,元数据的机器可读性和互操作性相对较低。

4.1.2 可获取性

4.1.2.1 自由下载

各地政府数据开放平台大部分都要求需要登录才能下载数据资源,只有少部分的平台不需要登录,可以直接下载数据。

4.1.2.2 提供API接口

政府数据开放平台除了提供可下载的数据资源外,还提供部分数据集的API接口。用户可以调用API接口开发相关的程序和应用软件,是开放数据资源产生新的价值。选取的16个政府数据开放平台中有12平台开放了API接口,整体上来说大部分平台都提供了API接口和使用说明并且形成了一定的规模,大部分平台的API接口的调用需要向平台提交申请。

4.1.3 开放授权

开放授权是指通过法律上保证数据的开放性,目前我国还没有出台关于数据开放权的法律,但各地的政府数据开放平台都在网站的使用协议、网站声明、免责条款或服务协议中对开放数据的使用进行了授权和约束。

4.1.3.1 免费获取

目前我国已上线运行的政府数据开放平台还没有对用户收费的项目,提供阅读网站的使用协议、网站声明或免职条款可以看出大部分的政府数据开放平台都对用户免费获取数据资源作了说明,但是各平台的免费范围有所不同,可分为永久免费、现阶段免费和为未明确免费期限三种。

4.1.3.2 非歧视性

只有部分政府数据开放平台的授权协议中提到了非歧视性,其余的政府数据开放平台未明确说明非歧视性。大部分的政府数据开放平台都需要用户注册登录后才能下载数据资源,只有少部分的平台可以直接下载资源,注册用户和未注册用户之间的区别也是一种歧视性的存在。

4.1.3.3 自由使用

部分平台的中声明用户享有基于平台提供的数据进行商业性或非商业性的开发活动、享有增值利用或自由使用的权利。其余各平台为申明用户自由使用的限度,但限制用户有偿转卖或用于商业用途。

4.1.3.4 自由传播与分享

对于用户的自由传播和分享权利了大多数平台的开放授权协议都依据现有的著作权法、专利法等相关的知识产权法进行了约束。部分平台授权协议以知识产权法为依据限制用户复制、传播的权利可能会违背数据开放的原则。

4.2 平台层面

4.2.1 易用性

4.2.1.1 检索与浏览方式

检索功能是用户能够通过【关键词】的查找快速找到所需要的数据资源,基本上每个政府数据开放平台都提供了使用【关键词】对全部数据资源的检索。

良好的浏览方式能够帮助用户方便快捷的找到数据资源,按照数据的主题或来源部门的分类方式进行浏览,同时还要按照数据发布日期、更新日期、浏览量和下载次数进行排列的功能。

4.2.1.2 数据预览功能

数据预览是用户在下载数据前,可以在线查看数据集的全部或者部分内容,根据情况决定是否下载数据,这种功能功能能够把数据集的一些不能通过标题等描述方式的内容呈现给用户,使用户能够发现自己想要的数据资源。

4.2.1.3 数据统计分析与可视化工具

数据统计分析是政府数据开放平台提供的对数据级的总量、分布、使用等情况的统计分析,可能帮助用户了解平台数据资源的构成情况和使用情况。

4.2.1.4 数据应用

政府数据开放平台不但提供开放下载的数据资源,还展示了一些利用开放数据资源开发的应用产品。

4.2.2 交流互动

大部分平台都提供了交流互动的功能,比如咨询建议、问卷调查、需求调查等交流互动方式。还有的平台提供了对数据资源的评价功能,比如给数据资源的满意度进行打分或者评论。

6 建议

6.1 加快数据开放立法工作

数据开放的立法应当立足于开放数据的基本原则,充分保障用户在免于授权许可的条件下自由使用、传播、分享数据的权利,保障用户面授歧视的情况下获取数据。制定数据产权保护、数据开放、隐私保护相关政策法规和标准体系;制定政府数据开放、互联网信息服务管理、数据权属、数据管理等相关立法。

6.2 以用户需求作为数据集开放的导向

政府数开放平台的数据集开放要以用户需求为导向,采用需求调查和数据申请的形式,充分了解用户迫切需要的数据类型和数据格式。分析用户的偏好和潜在需求,提前制定好符合用户需求的数据集开放计划。通过网站和社交媒体上的互动交流,采集公众需求,不断改进完善自身工作,并为基于政府开放数据开发的应用提供充分的展现平台,从而激励社会的数据利用。

6.3 使用机器可读格式和开放格式

政府数据开放平台应当尽可能的提供以机器可读格式和开放格式的数据集,尽可能的为每个数据集提供至少一个机器可读格式。如果原始数据集不是机器可读格式或开放格式,就需要进行必要的格式转换,将原有格式转换成XLS或CSV等机器可读格式或开放格式。

6.4 完善用户授权协议

各地的政府数据开放平台都在网站的使用协议、网站声明、免责条款或服务协议应当详细说明用户的权利与义务,制定出满足用户对数据集自由使用、传播、和复制的使用需求的授权协议。政府数据开放的初衷是利用已有的数据集来创造出新的價值,如果对自由使用的权利进行限制,这就违背了政府数据开放的初衷,不利于数据产生新的价值。

6.5建立统一规范的元数据标准

我国政府应建立规范化和标准化的政府开放数据元数据,借鉴和参考国外政府数据开放平台成熟的元数据方案,依据W3C发布的针对政府数据开放的DCAT元数据的建立我国政府数据开放统一通用的元数据标准,从而提高政府数据开放的元数据描述质量,实现数据资源之间的互操作性。

7 结束语

我国政府数据开放仍处于起步阶段,而且已经有了几年发展的成果和经验,上述研究发现的几个问题都是目前我国地方政府数据开放平台建设存在的不足,但是我国地方政府数据开放平台一些较好的发展模式和建设方式,在建设全国统一的政府数据开放平台时可以借鉴和学习。

猜你喜欢

大数据
基于在线教育的大数据研究
“互联网+”农产品物流业的大数据策略研究
大数据时代新闻的新变化探究
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索