APP下载

政府数据开放研究现状:以数据安全为视角

2016-10-25曹雨佳

特区实践与理论 2016年2期
关键词:数据安全政府

曹雨佳

政府数据开放研究现状:以数据安全为视角

曹雨佳

以数据安全为视角,对国内外政府数据开放领域的研究现状进行了调研。结果表明:国外研究主要集中在数据安全规制、技术保障、许可适用、隐私保护等方面。国内研究存在内容分散,缺乏数据安全的系统性分析;对策建议宽泛,缺乏实践性细节;安全理念相对滞后,缺乏创新性案例等问题。

政府数据开放;数据安全;政府数据;数据开放

政府数据开放是指政府及其控制的实体所产生的对政府活动、公共事务和普通民众有影响的数据资源的开放。随着人们对数据开放的政治、经济、文化、社会、管理和战略价值认识的不断深入,出现了“开放政治”、“开放政府”等口号和主张。近年来,由美国引领的政府数据开放运动,引发了世界各国的广泛关注。2009年美国政府数据开放门户网站Data.gov上线,第二年英国Data.gov.uk也正式上线。在英美政府数据开放运动的影响下,2011年“开放政府联盟”成立,并于当年9月发布了《开放政府宣言》。2015年9月,我国颁布了《促进大数据发展行动纲要》,明确提出要加快推进政府数据开放共享,促进数据的利用创新。政府数据开放促进了政府决策和服务更加开放透明,对于提升政府治理能力和公共服务能力,形成基于数据和事实的决策文化具有重要意义。政府数据开放,涉及数据安全问题。在政府数据中,部分涉及国家秘密、商业秘密和个人隐私。如果开放这些数据,将危及国家安全、经济安全、公共安全和社会稳定。因此,在政府数据开放过程中如何确保数据安全已经成为学界研究的热点和业界亟待解决的难题。

一、国外研究现状

2009年以来,随着美国以“透明性”、“公众参与”、“官民合作”为三大核心的《开放政府指令》的出台,联合国支持的“开放政府合作组织”的成立和世界银行政府数据开放项目的推进,以及英国、加拿大和欧盟各国政府的相继实践,数据开放已经成为国际政府组织数据与信息分享的重大议题,关注度持续上升。近年来国外政府数据开放热度,如下图所示。

国外政府数据开放热度(by G oogle)

政府数据开放能够带来政治、经济和社会价值,但也面临着诸多挑战。Luna Reyes等[1]指出,政府开放的数据只有一部分创造了价值。Karr[2]指出,政府数据开放存在保密性问题。在政府数据开放安全领域,国外机构和学者的研究主要集中在:

(一)数据安全规制

在政府层面,2009年奥巴马在“透明和开放政府备忘录”中指出,开放和保密之间的关键平衡是一个民主政府行使的困难但必要的组成部分,开放政府计划必须保护那些应当合法保护的数据信息,包括公开将威胁到国家安全、侵犯个人隐私、违反保密法,或者损害一些受法律保护的相关利益的数据。2013年G8开放数据宪章第一条原则指出,希望所有的政府数据都能以默认的方式公开,但与知识产权、个人隐私和敏感信息相关的数据,应作为例外。2013年奥巴马又签署了《将政府信息状态新默认为公开和可机读的行政法令》,定义了部分数据开放的阶段性任务,并强调政府部门应当将信息作为一种资产进行管理,把隐私分析纳入信息生命周期的每个阶段。机构必须对收集及创建的数据进行审查和评估,以确定是否向公众公开。如果某类数据不应公开,该机构应该咨询法律总顾问,并用文件形式记录此情况。机构还应充分考虑数据汇集在一起产生的“马赛克效应”,并与高级机关隐私代理官、首席安全官或其他相关官员充分合作,确保隐私得到保护。

Lakhani等[3]指出,政府应建立完善的审查机制,防止在不同数据集的混搭使用下泄露个人隐私和危害国家安全。Nugroho等[4]运用跨国政策比较框架对不同国家的政府数据开放政策进行分析,总结了美国、英国、荷兰、肯尼亚和印度尼西亚等国在限制开放政府数据方面的规定,提出了一些建议,包括建立一套健全的法律框架规范数据开放流程,以及在网上发布政府数据的注意事项;规范日常发布数据集的格式及标准;设立一个指定的专门机构负责政府数据开放;通过计划及激励措施,刺激政府数据需求。

由于缺乏针对隐私和政策敏感性数据的指导原则,许多员工不确定数据集是否适合公开,因此制定指导原则能够帮助员工评估在何种情况下可以发布数据集。Zuiderwijk等[5]对影响数据开放简单、低成本运行的壁垒进行了研究,并为发布数据的流程设计了新的指导原则,包括:设计指导方针,特别是关于隐私以及政策敏感性数据如何处理的指导方针;通过整合参与数据公开流程的其他因素提供决策支持;使数据公开成为日常工作中一个标准化日程。

(二)技术保障

美国政府数据公开网站Data.gov对政府数据的安全开放制定了《国家/国土安全和隐私保密检查表和指南》,指出在扩大开放数据的同时需遵循有效限制,机构必须合作建立适当的风险分析和缓解措施,应对隐私保密和国家安全的泄露问题。公开的数据集内容不得对国家安全造成威胁,不得违反承诺的保密规定或其他协议。为此,国家建立了一个由行政分支机构专门负责安全隐私领域的人员构成的安全工作小组,对数据集的安全开放情况进行评估,对可能出现的马赛克效应进行处理。在数据集向Data.gov网站提交之前,各机构应使用《国家/国土安全和隐私保密检查表和指南》与申请公开的数据集一同提交。检查表包含两个部分,A部分强调潜在的国家或国土安全问题,B部分强调公开数据集的隐私和保密问题。如果数据集涉及国家或国土安全问题,审查人员必须提供开放理由说明,并提供其联系方式;如果数据集涉及隐私和保密问题,审查人员必须提供对数据集中可识别性数据的防护纠正措施。开放数据中心联盟[6]建立一个数据安全框架,提出对数据安全保护的几种技术手段,包括访问控制、信息分类、数据加密、数据屏蔽技术、安全信息和事件管理、备份、存档与删除,等等。

Cresswell[7]指出,电子信息获取需要建立不同层次的安全和机密程度等级,如人口统计局通过技术手段将可识别个人的数据转变为人工合成数据,这些数据不代表真实的人或家庭,但仍保留了原数据的统计特性。Eoghan Mckenna[8]等通过对智能电表消费数据的研究发现,对于精细到分钟的能源消费数据确实在很大程度上会泄露家庭的各项活动,因此他建议通过在网络设计中改善住宅结构分类等“隐私友好型”技术,减少电力供应行业对敏感电力数据的收集。

Napoli、Karaganis[9]两位学者以美国通信政策为例,提出为获取所需数据的具体建议,包括实行强制数据访问;针对商业敏感信息制定利用标准;改善公开模型及程序;除内部审议数据外,其它受信息自由法豁免;成立专门负责数据质量、完整和公开获取的联邦顾问委员会等。Millar[10]通过对美国信息安全情况进行比较分析,提出了一些数据安全设计方面的实践建议,包括制定信息安全政策;专人负责安全计划;采用数据映射方法对数据使用情况进行风险评估及审计;对员工进行培训等。

(三)许可适用

世界经济论坛指出,现有的“告知与许可”机制是一种“二进制”、一次性参与的,用户只能选择或者接受,或者不接受。这种原则应该进行变革:首先,从透明到理解,也就是说,要用新的方法告诉个人并帮助他们理解关于他们的数据是如何被收集和使用的,个人并不需要从复杂专业的隐私条款中获得数据流动的具体细节,但是他们必须对与自己相关的数据即将发生的情况有更为广泛的了解以及掌控。其次,让每个人都同意数据的各种使用是不可能的,与其依靠在数据收集之初的同意或不同意许可,个人需要更为有效的方式并且在数据被使用时能够有力掌控。再者,从非黑即白到灰色地带,鉴于数据时代各种复杂而迅速的变化情况,必须采取灵活的手段,根据数据使用的具体情况同时部署不同但互补的方案。

Nugroho等[11]对不同国家的数据开放许可条件进行调查,指出,美国的开放数据是在法律允许的范围内许可并接受有效的隐私、保密、安全或其他限制,英国则通过许可证方式。

国家教育统计中心提供公开使用和受限使用两种类型文件,同时设立了公开审查委员会。在数据集作为公开使用文件发布之前,公开审查委员会必须对数据集进行审查并向机构负责人做出建议。如果用户想从受限使用文件中获取数据,则必须从国家教育统计中心获取受限数据使用许可证。许可证具有法律约束力,它阐明在哪些情况下可以使用和获取受限数据。同时,国家教育统计中心还会雇佣检查员对用户是否按照许可证规定使用数据进行随机检查。为缓解人们对于隐私数据使用和滥用的担忧,Ian Henshaw(2012)提倡通过新的数据授权协议对数据使用者做出规定和限制。

(四)隐私保护

欧美国家一直以来都比较关注个人的权利和自由,尤其隐私权。欧洲是第一个提出专门数据处理管理体系的地区,同时还制定了大量的个人数据保护相关的法律法规。美国也有保护个人数据的法律。但是,在由多方参与存储和网络化管理的今天,保护个人数据安全变得更为困难。有学者指出,数据开放对个人隐私造成了影响,如Truxillo等[12]就提出不少非结构化的数据,如word以及excel文档、邮件信息、即时通讯、交通信息、博客信息等,在本质上属于敏感信息,可能涉及个人识别信息以及知识产权保护。Kshetri[13]展示了在数据的收集、存储、分享以及获取过程中可能会出现的安全和隐私问题,并指出随着数据集的规模、多样性以及复杂性的增加,安全风险系数也随之增加。

Gritzalis[14]对目前已有的一些网络隐私和匿名安全机制、工具、协议和服务进行了比较分析,对其特点、操作原则和存在的漏洞进行了分析,认为在大数据时代,仅仅通过立法并不能有效保护个人隐私,还必须有一个强有力的技术保障。Cavoukian[15]提出了“设计隐私”概念,即在个人数据被处理的最开始便在其处理方式上设立隐私保护。Kavakli[16]进一步利用“涉及隐私”理念,提出了一个将隐私需求嵌入系统设计流程的安全保障方法论——Pris,将隐私需求,即身份验证、授权、识别、数据保护、匿名、假名、不可链接性以及不可观测性通过系统方式转化为系统模型,将隐私匹配与实施技术进行集成。

Pentland[17]提出一项“数据新政”提案,论述了个人占有、使用和处置数据的权利。首先,个人享有占有自己数据的权利。个人在银行开设数据账户,可以通过匿名方式,在任何时候移走自己的数据。其次,对数据的使用情况具有绝对的掌控。如果你不喜欢某个公司使用你的数据,可以移除。最后,个人拥有处置或者传播自己数据的权利,不管你想销毁或者移除或者在别的地方重新使用,都由个人决定。

二、国内研究现状

与国外相比,国内研究起步稍晚,目前数据开放安全方面的相关研究主要集中在:

(一)数据安全问题

政府数据开放存在哪些潜在的安全问题,胡小明[18]指出“安全问题是政府数据开放带来的新难题,其中隐私权和商业秘密保护难度更大”,政府数据开放程度越大,需要保密的内容就越少,特别是将数据开放给公众之后,如何进一步保护个人隐私和商业秘密成为新难题。

张明[19]认为,政府数据开放从安全理念、技术能力和机制建设三方面挑战中国的网络安全,大数据使“不相关”分析、“马赛克效应”等成为可能,进一步加大了个人隐私泄露的可能性,而我国现有的安全理念和技术能力以及滞后的政企合作机制成为制约自身安全能力建设的短板。

孙丕恕[20]指出,在政府数据开放中遇到的最大问题是没有标准可依,我国与数据安全相关的知识产权法、隐私保护法等法律法规均未健全,数据开放的范围、内容界定不清,并且各地缺乏统一的数据格式和标准,容易造成新的数据孤岛问题。

蔡旭[21]认为,在大数据环境下,大数据的价值会引来不法分子的攻击,政府数据开放使信息安全和个人隐私保护面临更大挑战。

(二)对策建议

国内学者从政策、制度、技术等维度,对政府数据开放情况进行研究,提出了保障数据安全的对策建议。

在政策层面,着重介绍了国外如何通过立法规范政府数据开放中相关主体的行为,对国家安全、商业秘密和个人隐私进行必要的保护。迪莉娅[22]指出,为应对数据开放所涉及的安全问题,欧美普遍的做法,一是制定新的网络数据保护法律,如美国制定了《消费者数据隐私保护法案》,规定了个人消费者在网络环境下的权益;二是修改原有与信息相关的法律,如澳大利亚和欧盟通过修正或改革原有法案的方式,加强对数据开放所带来的隐私和安全问题的保护。洪京一[23]通过对美、英两国政府开放数据的政策和措施中分析,认为要“加大数据的使用、安全和隐私保护,必须推动相关法律和规则的制定,才能应对数据开放带来的挑战”。

于浩[24]指出了大数据时代对国家治理、政府决策、公共服务、组织方式和业务流程的重大影响,提出通过提高数据意识和能力、优化政府职能机构配置、多角度深化领域间合作、建立政府大数据服务平台、完善相关法律规章保障等方式提高政府管理利用数据的能力。连玉明[25]强调,在大数据时代,对于个人隐私的保护应该着重于让数据使用者承担责任而非简单的告知与许可,并且应该及早为数据开放制定规则,不断补充和重塑保护个人隐私的法律规范。

在制度层面,周季礼、李德斌[26]指出应将数据安全发展上升为我国的国家战略高度,加强顶层设计和战略支持,加快研发大数据相关安全技术,大力提升敏感数据监管力度,加快培养大数据相关人才,健全完善大数据安全保障体系,为大数据的发展构建良好的生态环境。陈美[27]对国外政府数据开放的保障机制进行了研究,指出合作是美国政府数据开放的成功之处,具体包括跨部门之间的合作,部门内部连接点与Data.gov项目办公室的合作以及政府与民众的合作。美国各部门首席信息官会在本部门内指定作为连接点的数据管理员,承担着信息发布类型、数量、质量以及安全、隐私、保密工作。

杨东谋等[28]通过观察多个国家和地区政府数据开放门户的运行情况,指出为实施政府数据开放,各国建立了相应的数据开放门户网站,并对保密审查作了相关规定,如英国Data.gov.uk网站隐私政策条例中规定,其收集和使用数据均要遵循1998年的数据保护法。美国Data.gov网站规定“所有提交到网站的数据均不能违反当前隐私法,内容均不能涉及国家安全或其他保密规定”,同时要求“各政府部门应对各自提交的数据做隐私影响评估”。在Data.gov网站中,可以鉴别出个人信息而对个人隐私有损害或与国家安全议题相关的或非属于联邦政府管辖的数据都不在开放的范畴。澳大利亚Data.gov.au网站规定,政府在开放数据时,应进行一系列的审查,与个人隐私、国家安全等相关的数据应进行相应的处理。澳大利亚政府规定:“政府开放某一数据时,必须进行隐私匿名化处理,以避免所开放数据对个人隐私权产生冲击。”同时“还需要考虑开放的数据是否会对国家安全造成危害。如果涉及隐私或会影响国家安全等,则不予公开”。

在技术层面,贺睿、刘叶婷[29]建议对政府数据采取“分对象开放、分领域开放、分阶段开放”三分原则,即根据不同的开放对象,将政府数据分为立即开放、短期内开放、计划开放和暂时无法开放四类,针对公众需求比较集中的特定领域重点开放,循序渐进。侯人华、徐少同[30]建议“设立专门的数据主管部门,负责开放数据的审查和发布,避免发布的数据违反保密、隐私、安全规定,并对政府部门开放的数据质量和数量进行监控,保证政府数据开放工作的持续进行以及公众对于数据的获取需求”。金江军、潘懋[31]建议尽快制定元数据标准、建立电子政务数据仓库,以促进政务数据共享,并提出通过数据挖掘技术开发利用政务资源。

三、小结

(一)国内研究存在的不足

相对而言,国外在政府数据开放领域的研究起步较早、涉及内容宽广,创新理念更为领先。而国内研究存在以下不足:

第一,研究内容分散,缺乏对数据安全的系统性研究。总体来说,国内对于政府数据开放与数据安全保护方面的专门研究比较少,已有的研究主要集中在分析政府数据开放所面临的安全问题,分散提出了一些政策、技术、流程等方面的控制手段,缺乏对数据安全的系统性研究。

第二,对策建议宽泛,缺乏实践性细节。我国政府数据开放相关工作还处于初步实践阶段,相关制度建设和法律规范还处于探索阶段。目前,对策建议多数来源于国外实践经验总结,缺乏联系中国国情因地制宜的落实细节。

第三,安全理念相对滞后,缺乏创新性案例。目前,国内尚未制定个人数据保护法。在大数据时代,如何保护个人隐私、重新定义个人数据与利用者的关系、以及在保护隐私的同时更好地挖掘数据价值,还缺乏更多的思路和开发利用的创新性案例。

(二)展望

近年来,为推动我国大数据产业的发展,国务院先后颁发了《关于运用大数据加强对市场主体服务和监管的若干意见》、《促进大数据发展行动纲要》等系列文件。但目前我国大部分地方政府缺乏开放政府数据的意识和动力,亟需从政策、管理、技术等方面,加大对政府数据开放及安全保障方面的制度设计和研究。

政府数据开放不是盲目地追求开放度,而是在开放和保密之间寻求平衡。在大数据时代,海量数据、自动收集、跨国流动、传播快速等特征使数据安全面临巨大挑战,涉及国家秘密、商业秘密和个人隐私的数据的安全控制越发困难,而泄露后所造成的危害也越发严重。

通过制定我国国家层面的政府数据开放法律法规,加强政府数据安全管理,消除企业、个人对数据收集和开放的顾虑,更好地实现政府数据的再利用、再增值。通过数据安全审查,确保国家秘密、商业秘密和个人隐私不被泄露,有效地保护国家、企业和公民的合法权益。

[1]Luna-Reyesa L F,Chunb S A.Open Government and Public Participation:Issues and Challenges in Creating Public Value[J].Information Polity,2012,17(1).

[2]Karr A F.Citizen Access to Government Statistical Information[M]//Chen H,Brandt L,Gregg V,et al.Digital Government:E-government Research,Case Studies,and Implementation.New York:Springer,2008.

[3]Lakhani K R,Austin R D,Yi Y.Data.gov[R]. Harvard BusinessSchool,2010.

[4]Rininta Putri Nugroho,Anneke Zuiderwijk,Marijn Janssen,Martin de Jong,“A comparison of national open data policies:lessons learned”[J],TransformingGovernment:People,ProcessandPolicy,2015,9(3).

[5]Anneke Zuiderwijk,Marijn Janssen,Sunil Choenni,Ronald Meijer,“Design principles for im-proving the process of publishing open data”[J]. Transforming Government:People,Process and Policy,2014,8(2).

[6]Open Data Center Alliance Usage:Data Security Framework Rev 1.0.[EB/OL].[2015-8-19].https: //www.opendatacenteralliance.org/docs/Data_Security_Framework_Rev1.0.pdf.

[7]Exemplary Practices in Electronic Records and Information Access Programs[EB/OL].[2015-8-12]. http://www.ctg.albany.edu/publications/reports/exemplary_practices/exemplary_practices.pdf.

[8]Eoghan McKenna,Ian Richardson,Murray Thomson.Smart meter data:Balancing consumer privacy concerns with legitimate applications[J].Energy Policy,2012,41.

[9]Philip M.Napol,Joe Karaganis.On making public policy with publicly available data:The case of U.S.communications policymaking[J].Government Information Quarterly,2010(27).

[10]Sheila A.Millar.“Privacy and security:Best practices for global security”,Journal of International Trade Law and Policy,2006,5(1).

[11]Rininta Putri Nugroho,Anneke Zuiderwijk,Marijn Janssen,Martin de Jong,“A comparison ofnational open data policies:lessons learned”[J].Transforming Government:People,Process and Policy,2015,9(3).

[12]Truxillo,C.Five myths about unstructured data and five good reasons you should be analyzing it.[EB/OL].[2015-10-5].http://blogs.sas.com/content/ sastraining/2013/07/08/five-myths-about-unstructured-data-and-five-good-reasons-you-should-beanalyzing-it/.

[13]Nir Kshetri.Big data's impact to privacy,security and consumer welfare[J].Telecommunications Policy,2014(38).

[14]StefanosGritzalis.Enhancing Web privacy and anonymity in the digital era[J].Information Management&Computer Security,2004,12(3).

[15]Ann Cavoukian.Privacy by Design[EB/OL].[2015-9-8].https://www.privacybydesign.ca/.

[16]Evangelia Kavakli,StefanosGritzalis,Kalloniatis Christos,“Protecting privacy in system design:theelectronic voting case”,Transforming Government:People,Processand Policy,2007,1(4).

[17]AlexPentland.RealityMiningofMobile. Communications:Toward a.New Deal on Data[EB/OL].[2015-10-8].http://hd.media.mit.edu/wef_globalit.pdf.

[18]胡小明.从政府信息公开到政府数据开放[J].电子政务,2015,(1).

[19]张明.当前国际政府数据开放进程[J].国际研究参考,2014,(9).

[20]孙丕恕.加大数据开放[EB/OL].[2015-9-20]. http://news.xinhuanet.com/2015-03/14/c_1114638930. htm.

[21]蔡旭.网络强国背景下政府数据开放的探索[J].厦门特区党校学报,2015,(1).

[22]迪莉娅.国外政府数据开放研究[J].图书馆论坛,2014,(9).

[23]洪京一.从G8开放数据宪章看国外开放政府数据的新进展[J].世界电信.2014,Z1.

[24]于浩.大数据时代政府数据管理的机遇、挑战与对策[J].中国行政管理,2015,(3).

[25]大数据战略重点实验室,连玉明.DT时代[M].北京:中信出版社,2015:282~285.

[26]周季礼,李德斌.国外大数据安全发展的主要经验及启示[J].信息安全与通信保密,2015,(6).

[27]陈美.美国开放政府数据的保障机制研究[J].情报杂志,2013,(7).

[28]杨东谋,罗晋,王慧茹,项靖.国际政府数据开放实施现况初探[J].电子政务,2013,(6).

[29]贺睿,刘叶婷.我国公共数据开放的程度、问题及建议[J].领导参考,2013,(10).

[30]侯人华,徐少同.美国政府开放数据的管理和利用分析-以www.data.gov为例[J].图书情报工作,2011,(4).

[31]金江军,潘懋.电子政务数据资源的开发利用[J].地理与地理信息科学,2003,(6).

责任编辑:钟晓媚

D63

A

1673-5706(2016)02-0069-06

全国行政学院科研合作基金课题“政府数据开放安全审查制度研究”(15HZKT113)和教育部人文社科研究青年基金项目“我国政府数据开放保密审查体系构建及保障机制研究”(15YJCZH237)阶段性成果。

2016-02-26

曹雨佳,深圳市委党校图书馆助理馆员。

猜你喜欢

数据安全政府
我国5G数据安全保护供给不足,“四步”拉动产业发展
云计算中基于用户隐私的数据安全保护方法
知法犯法的政府副秘书长
建立激励相容机制保护数据安全
数据安全政策与相关标准分享
大数据云计算环境下的数据安全
云环境中数据安全去重研究进展
依靠政府,我们才能有所作为
用“打包法”衡量政府投入不科学
政府手里有三种工具