APP下载

我国政府数据开放中的安全风险及其防范对策

2022-06-06肖冬梅苏莹

现代情报 2022年6期
关键词:安全风险防范对策

肖冬梅 苏莹

摘 要:[目的/意义]为探究我国政府数据开放中的安全风险,本文对我国已上线的172个地方政府数据开放平台的安全風险及其成因进行分析。[方法/过程]对政府数据开放平台的安全风险类型及相关典型事件进行剖析,探究安全风险致因,寻求风险防范对策。[结果/结论]研究发现,随着各级政府探索从“政府信息公开”走向“政府数据开放”,显性安全风险与隐性安全风险都接踵而至。境内外敌对势力的攻击、数据黑色产业链的发展和数据集爆发式增长加剧了政府数据开放的外部风险,而与外部人员勾结的内鬼有意为之、内部参与者或疏忽大意或能力不足所致的误操作及不作为,都是内部风险产生的缘由。强化数据分级分类管理、以申请开放为补充、加强数据安全标准规范建设、建立数据安全评估与反馈调整机制,能有效防范我国政府数据开放中的安全风险。

关键词:政府数据开放;安全风险;防范对策

DOI:10.3969/j.issn.1008-0821.2022.06.011

〔中图分类号〕G201 〔文献标识码〕A 〔文章编号〕1008-0821(2022)06-0112-09

Abstract:[Purpose/Significance]In order to clarify the security risks in Chinas government data openness,this article analyzes the security risks and causes of the risks of 172 local government data open platforms that have been launched in China.[Methods/Processes]Analyze the types of security risks and related typical events of the government data open platform,explore the causes of security risks,and explore risk prevention countermeasures.[Results/Conclusions]The study found that as governments at all levels explored from“open government information”to“open government data”,both explicit security risks and implicit security risks followed.Various factors have exacerbated the external risks of government data openness,including attacks by hostile forces at home and abroad,the development of the dark data industry chains,and the explosive growth of data sets.Meanwhile,internal risks are caused by the deliberate actions of mole people colluding with external personnel,and misoperations and inactions caused by the negligence or inadequacy of internal participants.To effectively prevent the security risks in Chinas government data openness,following measures should be taken,including strengthening the management of data classification and classification,providing supplementary measures to allow the public to have access to data opening,strengthening the construction of data security standards,and establishing a data security assessment and feedback adjustment mechanism.

Key words:government data openness;security risk;preventive measures

推进数字政府建设是党和国家制定的重要战略,党的十九届四中全会明确要求“推进数字政府建设,加强数据有序共享”。数字政府建设是当前推动政府治理体系和治理能力现代化的着力点和突破口,而近年来政府数据开放平台日渐成为数字政府建设的标配。我国自2012年上海市推出第一个政府数据开放平台起,迄今已上线172个地方政府数据开放平台,其中省级平台21个,副省级和地级平台151个,至此,我国大陆地区66%的省级行政区、73%的副省级和35%的地级行政区已推出了政府数据开放平台[1]。

与政府数据开放蓬勃兴起的实践同步,学界近年来也颇关注政府数据开放问题,杨孟辉[2]、薛智胜等[3]和杨钰祺等[4]对政府数据开放的内涵进行了界定,郑磊[5]则对国内外有关政府数据开放的定义进行了梳理,肖卫兵[6]、陈晓勤[7]对政府数据开放的主体和客体进行了研究,赵润娣[8]和胡逸芳等[9]调研了美国和加拿大的政府数据开放范围,王万华[10]、陈尚龙[11]和高富平[12]则对政府信息公开和政府数据开放进行了比较研究。

业界和学界在政府数据开放的必要性、可行性等问题上,事实上已经达成颇多共识,政府数据开放被认为是加强建设透明政府和服务型政府,让数字红利普惠大众的重要举措,也是释放数据能量、促进数字经济快速发展的基础和关键。但政府数据开放在推进国家治理体系和治理能力现代化的同时,也不可避免地带来了数据泄漏、数据篡改、数据破坏等显性安全风险与被数据画像的隐性安全风险。中外学者如Meijer R等[13]、Zuiderwijk A等[14]、赵需要等[15]、陈朝兵等[16]、杜荷花[17]和郝文强[18]先后对政府数据开放中的隐私风险进行了研究。Kucera J等[19]、 Conradie P等[20]、赵龙文等[21]则关注到政府数据开放对知识产权尤其是商业秘密安全的影响。Shao D D等[22]、苗地[23]和张珺[24]对政府数据开放风险的制度根源进行了探究,才是杰等[25]、邹东升[26]和庄国波等[27]则考察了政府数据开放风险生成的技术根源。现有研究大都只关注传统信息技术带来的显性安全风险,对隐性安全风险的研究还很不够。随着政府数据开放与数据安全之间的冲突日益加剧,对新一代信息技术带来的显性安全风险和隐性安全的研究亟需加强。

1 制度源起与演进:从“政府信息公开”到“政府数据公开”

1.1 政府信息公开起源于美国并推广到全球

兴起于20世纪60年代的政府信息公开,迄今已有半个多世纪的历史。美联社编辑肯特·库珀(Kent Cooper)在二战末期首次提出知情权概念[28]。二战之后知情权在美国迅速发展成为当代公共文化的主流思潮。1966年,知情权被写进美国《信息自由法》,可以说这是现代意义上的政府信息公开立法的开端[29]。10年后,《阳光下的政府法》出台,进一步促进了美国行政公开。随后全球掀起保障知情权的信息公开立法浪潮,各主流国家陆续出台了专门的信息公开立法,确立政府公开政府信息的法定义务[30]。我国于2007年4月公布《中华人民共和国政府信息公开条例》(以下简称《条例》),2008年5月1日起正式实施。《条例》从基本原则、公开的范围、公开的方式和程序、监督和保障等方面进行明确的规定,是我国政府信息公开的基本法规。2019年4月3日修订后的《条例》公布,自2019年5月15日起施行,但修订后的《条例》并没有政府数据开放的内容。

1.2 政府数据开放基于政府信息公开得以推行

自20世纪60年代确立至21世纪初,开放政府理念影响渐深,这为大数据时代公众获取政府数据奠定了思想基础。受益于政府信息公开所建构的开放政府理念和对公众知情权的制度确立,开放政府数据被视为数字政府建设的应有之义[31]。事实上,中美政府数据开放都是以政府信息公开为依托,而逐步得以推行的。由于新技术环境下政府数据开放面临的诸多风险,在政府数据开放的早期,包括美国、英国和中国在内的各国政府基本采用了在政府信息公开制度框架内以政策方式逐步推进的路径。以全球最早施行政府数据开放的美国为例,其2009年就发布《透明与开放政府备忘录》,要求根据《信息自由法》制定《开放政府指令》。根据英国2012年修订的《信息自由法》,如果申请合理可行,政府部门应当给申请者提供其拥有的数据集,同年英国政府还发布了《开放数据白皮书——释放数据潜能》。2015年4月我国国务院办公厅印发《政府信息公开工作要点》,提出要推进政府数据公开,这一要求随后在多个省市得到贯彻,同年9月国务院印发《促进大数据发展行动纲要》(国发〔2015〕50号),对政府数据开放提出明确要求。迄今为止,全国总计有50余个省市两级地方政府出台了近80部政府数据开放相关法律规范。

1.3 政府数据开放拓展了开放政府的内涵

政府信息公开是指政府机构依照法定程序和形式,公开与社会成员利益相关的所有政府信息,并允许公众通过查询、阅览、复制等方式加以利用的行为。政府信息公开的制度目标是提升政府透明度、保障公民知情权、促进民主监督问责。而开放政府数据是指任何人都可以自由、免费地访问、获取、利用和分享政府数据。政府数据开放,意味着數据置放于公共领域,且能以机器可读的格式发布,以便任何人借助通用和免费的软件即可获取和利用,不受密码或防火墙等技术措施的限制[32]。可见,政府信息公开在一定意义上建构了开放政府的理念和制度,新兴的政府数据开放则拓展了开放政府的内涵,并形成独立于政府信息公开的开放平台、运行机制与制度体系[33]。

2 我国政府数据开放现状与发展趋势

2.1 各地政府数据开放平台与海量数据快速上线

政府数据开放是大数据时代的产物。数据作为人类社会的第五大生产要素,与当今社会的精准管理、数字经济发展密切相关,其开发利用蕴含无限商机和创新潜能。《政务信息系统整合共享实施方案》(国办发〔2017〕39号)指出,要建设统一规范、互联互通、安全可控的数据开放网站,推动政府部门和公共企事业单位的原始性、可机器读取、可供社会化再利用的数据集,向社会开放。政府数据开放有助于提升公共服务质量和充分释放数据价值,近年来各国政府纷纷推动数据开放实践。迄今为止,我国东部地区包括北京、天津、上海、江苏、浙江、福建、山东、广东和海南在内的9个省级政府数据开放平台已上线,中部地区包括江西、河南、湖北、湖南、广西在内的5个省级政府数据开放平台上线,西部地区有四川、贵州、陕西、青海、宁夏、新疆和重庆这7个省级政府数据开放平台已上线。这意味着我们目前只有10个省份(包括东部的河北、辽宁,中部的山西、内蒙古、吉林、黑龙江、安徽,西部的云南、西藏、甘肃)还没有上线省级政府数据开放平台。从图1不难看出,我国政府数据开放平台自2012年陆续上线,2017年之前发展缓慢,但2017年之后进入井喷期,2012—2017年5年之内仅上线20个平台,其中省级平台5个,地级(含副省级)平台15个,但到2018年开始各地政府积极落实《政务信息系统整合共享实施方案》(国办发〔2017〕39号)的精神,加快了政府数据的开放进程,2018年、2019年、2020年和2021年上半年,我国上线的地级及以上政府数据开放平台迅速增至56个、102个、142个和172个。

2.2 政府开放有效数据集爆增背后蕴含严重的安全风险

从2017—2021年3月,全国各地的政府开放的有效数据集从2017年的8 398个增长至2021年3月的476 849个,各地有效数据集总量在这接近4年半的时间增长将近56倍,2020年各地平台开放有效数据总量比2019年增长约23%,2021年3月显示的各地平台开放有效数据总量是2020年各地平台开放有效数据总量的9倍,增幅高达825%,目前我国25%的地方政府开放有效数据集已超过1 000个,如先行省份山东的威海、烟台、潍坊等地区开放的有效数据集总量分别为8 564个、14 014个和6 898个。我国地方政府有效数据集爆发式增长与国家大数据战略实施和数据要素市场培育关联甚密。2020年4月,中共中央、国务院公布《关于构建更加完善的要素市场化配置体制机制的意见》,首次将数据纳入生产要素范围,与土地、劳动力、资本、技术等传统生产要素并列,就是要充分发挥数据这一新型要素对其他要素效率的倍增作用,使数据成为推动经济高质量发展的新动能。随着数据成为国家一项基础性战略资源,各地政府数据开放的进程会进一步加快。

但令人担心的是,各地政府在积极上线数据开放平台、推进数字经济发展的同时,数据安全保障措施并没有同步跟上。不少地方政府数据开放平台在设计之初对安全问题并未充分考量,甚至存在仓促上线“裸奔”运行的现象,存在严重的数据安全风险。数据价值越大,遭遇攻击发生泄漏,乃至被破坏被篡改的风险愈高,其价值损失也就可能越大。根据奇安信行业安全研究中心的观察,目前政府是数据安全事件多发的重灾区之一。2019年1月—2020年8月,在被报道出来的420起全球政企机构重大数据安全事件中,有10.7%涉及政府机构、事业单位的数据安全[34]。随着政府数据开放平台上线数据集的日益增多,使得原本分散的、孤立的、价值不高的数据,形成聚集效应,其利用价值陡增,这难免将招致更多的外部攻击和内鬼惦记。因此,在推进政府数据开放进程的同时,须做好数据安全的风险防控。

3 我国地方政府数据开放中的安全风险类型及其成因

3.1 我国地方政府数据开放的安全风险类型

观察近年来发生的数据安全事件,不难发现,既有外部的恶意攻击,也有内部的无意泄露,间或是里应外合的勾结作案;有因为技术漏洞而发生的数据泄露,也有因为管理缺陷而导致的安全威胁。事实上,因外部攻击或内部疏忽导致的安全风险一直被关注,可谓显性数据安全风险,目前国内外有不少机构在持续观察数据安全事件及其成因,评估这类风险的进展与影响,并定期或不定期发布数据安全领域的调研报告。而大数据时代还有一类潜在的安全风险,即由新技术新模式触发的新风险,如数据关联分析背后的安全风险,并未引起足够的重视和应有的关注,可谓隐性数据安全风险。

3.1.1 显性数据安全风险

显性数据安全风险往往能被常规技术手段检测或被技术人员感知,根据风险源进行划分,我国地方政府数据开放的显性数据安全风险又可分为外部风险和内部风险两类。

1)外部风险。近年来因网络攻击导致政府数据泄露、数据被破坏或数据被篡改的事件从未间断,且有愈演愈烈之势。攻击者通过黑词暗链、钓鱼页面、挖矿程序等攻击手段,或利用勒索病毒感染政府机构终端、服务器,进行黑产活动牟利或实施敲诈勒索,随着有些漏洞日渐武器化,勒索软件即服务RaaS盛行,地方政府数据开放的外部风险陡增。根据奇安信的报告,2019年1—12月其安全服务团队共参与和处置的1 029起网络安全急响应事件,攻击者的目标主要分布于政府机构、事业单位以及国家重要基础性建设行业。而补天平台收录漏洞报告数量最多的3个行业依次是教育、政府机构、事业单位和制造业。2019年出现7种新型网络钓鱼攻击,包括指向流氓云存储位置的伪链接、钓鱼网络附件、凭证网络钓鱼链接、虚假短消息、身份仿冒、域名仿冒和域名欺诈[35]。2020年一种新型勒索软件攻击被广泛使用,攻击者在窃取大量数据之后会对其进行加密,若受害者拒絕支付赎金则被威胁泄露其数据[36]。2020年底以色列Ben-Gurion大学公布了一项名为Air-Fi的新技术,该技术可将计算机的内存(RAM卡)等设备转换为无线信号发射器,并从没有外部联网的计算机内部将敏感数据传输出去。而政府部门或一些对计算机设备隐私有极高安全需求的机构被特别提醒,应注意防范这种新型攻击手段[37]。2019年3月,我国部分政府部门和医院等公立机构曾遭遇国外黑客组织利用勒索病毒进行邮件攻击。

软硬件产品安全漏洞若未及时修补将成政府数据开放的一大风险源。虽然我国正在加快推进CPU、操作系统、数据库等基础软硬件的国产自主可控替代计划,但政府部门及其合作伙伴至今尚未做到完全不用开源产品和国外产品,关键技术还未做到自主可控,国家信息安全漏洞共享平台(CNVD)的数据显示,国外服务商提供的Hadoop、Spark和MongoDB等存在权限控制、跨站脚本等多类安全漏洞,并且因此导致数据泄露的情形也时有发生。目前即便是政府部门那些已经实现了国产化替代的信息安全产品也并非没有安全之虞,国内厂商提供的产品也存在安全漏洞。CNVD平台的数据也显示,国内安全厂商如迪元素、安全狗、华为、深信服、天融信等的安全品牌也都存在危急或高危漏洞,位列2020年1—10月国内外新增漏洞数量TOP20。安全漏洞的存在意味着数据泄露的隐患,也是当前网络安全的主要威胁和政企机构面临的重要安全风险之一。根据数字安全领域的全球领导者金雅拓(Gemalto)发布的Breach Level Index(数据泄露水平指数)显示,仅2018年上半年,全球就发生了945起较大型的数据泄露事件,共计导致45亿条数据泄露[38]。InfoWatch发布的2019年第二季度数据泄露报告称,该季度有2.16亿用户数据被泄露,是2018年同期的两倍多,而公共和市政机构的泄密率从15.5%上升到23.8%。也有报道表明,2019年美国各地的市政当局都因勒索软件攻击而破坏了其IT基础架构,需要缴纳赎金方能恢复网络正常。

2)内部风险。整体而言,我国当前对政府数据的管理还处于粗放式管理阶段,这体现在多个方面,如未能对数据进行分级分类便仓促上线、用户协议或隐私政策的提供或内容不合规、开放数据集的格式不标准等。我国各地政府数据开放平台中,仅有不到20%的平台为数据集标示了分级分类的开放属性;约54%的平台提供了数据开放授权协议,约42%的平台上开放的数据集全部符合可机读格式的标准,约27%的平台上开放的数据集全部符合非专属格式的标准,还有约25%的平台提供了RDF格式的数据[39]。这些数据表明我国地方政府数据开放平台不管在数据分级分类管理、用户协议合规性还是格式的标准化方面,都还存在较大局限,这种粗放式的管理方式背后蕴含的安全风险体现在两个方面,一是未能识别重要数据或敏感个人信息,开放不应开放的数据使其成为直接的风险源;二是很难及时发现数据安全风险,从而难以适时采取对策加以防范。

3.1.2 政府数据开放的隐性数据安全风险

马克·吐温曾说,历史不会重演,却自有其韵律。虽然万事皆显出自发偶然之态,但实际上,它远比你想象中的容易预测。全球复杂网络权威巴拉巴西通过研究大胆地认为,93%的人类行为是可以预测的[40]。这意味着,当我们将生活数字化、公式化以及模型化的时候,这种预测变得高为容易和精准。海量数据的开放,为基于数据挖掘、分析行为的精准预测提供了可能性。

虽然数据的收集、分析和使用由来已久,但传统的数据并不曾给社会生活带来如此大的变革和不安,而基于网络技术、云计算等现代技术手段而出现的大数据在改良社会自我管理的同时,也确实给社会生活带来前所未有的威胁[41]。随着政府数据开放平台上海量数据的聚集,以及数据挖掘技术不断升级,加之利用数据爬虫技术的数据分析公司日增,从海量、复杂、看似无关联的分散数据中挖掘出数据集之间的弱关系,通过时空拼图,碎片化的静态单元数据变成了网状化的动态模块数据,如此这般,政府脱敏之后开放的数据极易被再度识。通过对开放数据的二次加工和集成,形成数据画像,据此追溯个人行踪、企业研发或经营轨迹,乃至国家的战略行动,从而威胁到个人隐私、企业商业秘密和国家机密。经过数据收集、数据集成、数据规约、数据清理、数据变换、挖掘分析、模式评估、知识表示等数据挖掘步骤,生成有关个人、企业乃至国家的数据画像,若为别有用心的竞争对手、犯罪组织乃至敌对国家所掌握,其蕴含的威胁和风险是不言而喻的。随着政府数据开放的进程加快,范围扩大,基于海量开放数据关联分析的安全风险将日益加剧。譬如,擅长运用大数据分析人的心理并引导群体行为的英国Cambridge Analytica公司,其在特朗普当选、推动英国成功脱欧等重大政治事件中施加的影响,对国家社会秩序的威胁显而易见。通过爬虫技术抓取平台数据的hi Q Lab、Geofeedia等数据分析公司,通过收集公共数据和社交媒体数据,并进行数据挖掘,引发诸多民众对个人隐私的广泛关注与担忧。

3.2 政府数据开放安全风险的成因

3.2.1 显性数据安全风险形成的原因

弄清导致数据安全风险的原因对于政府数据开放风险治理十分重要。我国地方政府数据开放的外部风险既有可能来自普通的黑客,也有可能是来自有组织的犯罪集团,甚至还有少数情形是因为合作伙伴有意为之或无心之失所致。内部风险既可能源自政府内部人员窃取,也可能因为工作人员误操作或不作为。如根据Verizon发布的《2019年数据泄露调查报告》(DBIR),2019年发生41 686起安全事件中有2 013起数据泄露事件,导致数据泄露的主体有外部人员、内部参与者、合作伙伴、多方当事人、有组织的犯罪集团、民族国家或国家的行为者[42]。

1)外部风险的成因

外部人员导致数据泄露事件占比高达69%,导致数据泄露的外部人员有来自有组织的犯罪集团成员(占比为39%),也有某些国家的代表(占比为23%),甚至还有些数据泄露事件是因为合作伙伴的原因造成的(占比为2%)。这些数据表明我国政府数据开放面临的外部风险主要是因为境内外敌对势力的攻击、数据黑色产业链的发展以及数据集爆发式增长等原因造成的。

①境内外敌对势力的攻击。根据Verizon发布的2018年年度数据泄漏报告(DBIR),由于网络间谍和国家活动的活跃程度不断增强,政府数据泄露排名首次超过医疗、金融行业,位居榜首[43]。2018年政府数据泄漏事件中高达66%的入侵是为了间谍活动,财务诉求只占29%,而一般行业的入侵动机则是71%出于财富诉求,25%属于间谍活动。随着国际形势的日趋复杂,政府数据泄露事件中间谍活动的比例还在增加,2019年出于间谍活动的入侵占比增至68%。2020年境外多个国家和地区对中国发动网络攻击,譬如越南“海莲花”黑客组织利用疫情话题攻击我国政府机构;黑客组织“APT32”向中国官员发出网络钓鱼电子邮件。

敌对势力通过黑客不遗余力地对我国政府机关和涉密单位发动“木马”病毒等方式进行攻擊,大肆窃取、篡改和破坏数据的行径,早已有之。在大数据时代互联网已成为一个没有硝烟、没有国界的新阵地,网络空间是大数据时代国家博弈的新领域,这是我国政府数据开放将长期面临且难以回避的一类外部风险,必须在推动数据流动、挖掘数据要素新动能的同时筑牢数据边疆。

②数据黑色产业链的发展。目前由于我国数据安全法治体系不健全,数据安全和隐私保护水平总体较低,数据安全产业能力尚弱,使得数据黑产问题已成为我国当前乃至未来很长一段时间内都不得不面对的一大挑战。有数据显示,网络攻击、数据窃取、数据交易、诈骗犯罪等数据黑色产业链规模已逾千亿美元,我国成为数据黑产最主要的受害国之一[44]。黑产团伙或黑数据公司是当前数据泄露的罪魁祸首,也是政府数据开放安全风险滋生的重要源头,目前由需求方、入侵者或内鬼、中介以及交易平台四部分构成层次清晰、分工明确的黑色产业链,在线上和线下形成了庞大的市场和分工日趋细化的产业链条,近年来数据黑色产业链的从业人数和产业规模一直呈增长之势,

③数据集爆发式增长将加剧外部风险。各地政府数据开放平台上有效数据集呈爆发式增长态势,而大量聚集的政府开放数据容易成为攻击目标。2019年IDC预计,2025年中国将产生48.6ZB的数据,占全球27.8%,中国将成为最大的“数据圈”[45]。从2017—2021年3月,全国各地政府开放的有效数据集从2017年的8 398个增长至2021年3月的476 849个,各地有效数据集总量在4年多的时间内增长已逾50倍,其中2020—2021年3月的有效数据集增加量尤为明显。随着政府数据开放平台上的有效数据集的不断汇聚,被境内外敌对势力或以数据牟利者作为攻击目标的风险也将日益加剧。

2)内部成因

当前我国政府的数据开放除了要经受日益严峻的外部攻击之外,还面临内鬼的别有用心、内部人员的疏忽大意、政府投入不足与标准规范建设滞后等源自内部(成员和机构)的威胁。

①内鬼的别有用心或内部人员的疏忽大意

在2019年所有数据泄露的事件中有内部参与者的事件占比高达34%,内部参与者中,有些是与外部人员勾结的内鬼,是有意为之;也有内部参与者是因为疏忽大意或者能力不足所致的误操作及不作为,并非有意为之。譬如,Gemalto的Breach Level Index(泄露水平指数)白皮书称,在2018年上半年的945起数据泄露事件中,泄露的45亿项记录中被加密的记录只有1%。无独有偶,Verizon的数据泄露调查报告指出,处理机密信息时缺乏加密和安全性,是最常见的泄密原因之一。而从机构泄露的数据类型来看,主要也分为两类:即个人数据和机密数据,后者是指政府机构内部除个人数据之外的商业机密、技术机密及其他机密信息。

②投入不足导致的安全等级难以达到需求

保证数据安全是政府数据开放的重要前提,但要保证数据安全需要相匹配的投入。政府数据开放平台的建设和运行,不仅需要政府在基础设施建设与维护上投入颇多人力、物力、财力成本,在数据收集、编辑、存储、传播和开放等各个环节也需要持续投入大量的成本。如美国政府数据开放平台data.gov每年大约花费1 000万美元用于平台的建设及维护,法国政府数据开放平台Etalab网站每年的花费约为500万欧元[46]。目前我国整体上而言,在政府数据安全方面的投入还匮乏,不少政府部门存在“重建设轻运维”“重管理轻安全”的情况,无论是资金还是技术和人才方面的投入,都还很不足。在对数据进行分类分级保护方面,难以按需提供,尤其是在重要数据、敏感数据的保护方面,安全等级还难以匹配,这无疑留下了数据安全方面的隐患。

③标准规范的制定与实施滞后于政府数据开放实践

制定数据开放的标准规范,有助于数据开放工作的标准化和规范化推进。但我国有关政府数据开放的多项国家标准正由全国信息安全标准化技术委员会负责研制中,至今尚未发布。相关地方标准虽已有所发布,但仅限于数字生态好的少数地区,如上海、广东、浙江、贵州、山东、江西等省先后制定了专门针对政府数据开放的标准规范。由于全国性的标准缺失且地方性的标准不足,使得我国至今只有7%的地方制定了地方标准或规范指引,只有2.8%的地方制定了地方标准,而且,在标准规范的内容方面,已公布的标准规范虽基本都对数据、元数据等方面都作出了规定,但其中对平台建设和运营作出规定的仅有40%[47]。可见我国地方政府数据开放的标准化和规范化问题不容小觑。标准规范的缺失或局限直接影响政府数据的开放共享,目前在我国已上线的142个地方政府数据开放平台中,有超过80%的平台尚未标示数据的分级分类开放属性,46%的平台未提供数据开放授权协议,有大约58%的平台上开放的数据集全部不符合可机读格式的标准,73%的平台上开放的数据集未能符合非专属格式的标准,约75%的地方平台未提供RDF格式的数据。这意味着即便花费不菲推动政府数据上了线,但其后续的共享和利用活动会因标准规范问题而面临重重障碍或面临安全风险,使得政府数据开放的初衷难以实现,数据获取和挖掘利用受阻,从而导致巨大的浪费。因此,构建我国政府数据开放共享标准规范体系,并推动标准规范的尽快实施,势在必行。

3.2.2 “信息链”视域下隐性数据安全风险的成因

根据“信息链”理论,通过数据挖掘和分析,比传统的信息分析更能还原事实和真相。如图2所示,事实、数据、信息、知识、情报或智能是“信息链”的5个基本节点[48]。事实是客观事物运动的表现,数据是载荷或记录信息且按一定规则排列组合的物理符号,信息是数据被赋予现实意义后在信息媒介上的映射,知识是对信息加工、吸收、提取、评价的结果;智能是被目的所激活的知识[49]。“信息链”即“认知链”。“数据”(data)在拉丁文中是“已知”的意思,也可以理解为“事实”(Fact)[50]。当前人类对“事实”的认识越来越依靠数据,数据被认为是荷载“事实”的最小单位。虽然数据、信息、知识、情报均不能够等同于事实,但都是事实的局部反映,与最接近事实的数据相比,信息、知识、情報有不同程度的主观性,数据是原始素材,信息是加工处理后有逻辑的数据,知识是经过组织的信息,情报是知识的应用,形成如图2所呈现的“信息链”中的5个层次,在这条“链”上每上一层,都是对下一层的提炼、加工、组织或运用的结果,而越接近底层的事实,则其客观性越大而主观性越小,故直接源于数据的“还原”比源于信息的“还原”更加精确。可见,数据天然具有还原事实的能力,那么汇集起来的海量数据中的“事实密度”越高,其还原事实的可能性就会越大。

随着我国各地各级政府上线越来越多的开放平台面向社会提供具备原始性、可机器读取、可供社会化再利用的数据集,将会有很多数据分析的应用被开发出来,使我国加速实现精准管理和现代化治理。但技术应用犹如双刃剑,既能用于行善,也有可能为非法分子用来作恶。海量政府数据的开放必将带来海量数据的聚集,随着我国政府数据开放的范围日益扩大,开放的数量越来越多,被非法分子进行数据挖掘和关联分析,从而威胁个人隐私、商业秘密和国家秘密的隐性安全风险,不可不防。

4 我国政府数据开放安全风险的防范对策

政府数据开放的安全风险防范,需要技术、管理和法律联动,政府部门除了通过选择有实力的合作公司构筑数据安全技术防护体系之外,要重点采取管理措施和制度建设,来防御数据开放的安全风险。我国各地政府应强化数据分级分类管理,以主动开放数据为原则、以申请开放数据为补充,加强数据安全标准规范建设,建立数据安全评估与反馈调整机制,从而有效防范我国政府数据开放中的安全风险。

4.1 强化政府数据开放的安全管理措施

1)制定并落实政府数据分级分类规则。对数据分类分级并匹配相应的开放方式和安全等级,是一种极其重要的安全策略。各地政府数据管理部门应当结合数据安全要求、个人信息保护要求和应用要求等因素,制定数据分级分类规则。具体提供数据的机构则可按照分级分类规则,制定相应的实施细则。《上海市公共数据开放暂行办法》在国内首次提出分级分类开放模式,其将公共数据分为非开放、有条件开放和无条件开放3类,第一类是指涉及商业秘密、个人隐私或法律法规规定不得开放的公共数据;第二类则是对数据安全和处理能力要求较高、时效性较强或者需要持续获取的公共数据;其他公共数据列入无条件开放类。为了更具操作性,上海市还制定了《公共数据开放分级分类指南(试行)》。贵州省曾在2016年出台《政府数据 数据分类分级指南》(DB52/T 1123-2016),2020年10月颁布的《贵州省政府数据共享开放条例》在第二十一条明确了对政府数据进行分类管理,并将政府数据按照开放属性分为无条件开放、有条件开放和不予开放3种类型。这些先行地区的做法值得全国各地政府借鉴。政府数据分级分类规则要落到实处,需要各地政府部门设立数据分级分类部门并招募相关人员,明确数据分级分类安全原则,制定数据分级分类操作指南,建立数据分级分类审批机制、对各级各类数据进行标识和管理、对识别到的敏感数据进行脱敏处理等。如此则能有效避免将不该开放的政府数据予以开放的安全风险。

2)以主动开放数据为原则,以依申请开放数据为补充。政府数据开放并不是开放程度越高越好,而是应该按需开放,尤其要处理好开放与安全的矛盾。政府数据开放和政府信息公开在对公众需求的满足上,可以采取相同的方式,即以主动开放数据为原则,以依申请开放数据为补充,允许公众在认为应开放而未开放时申请开放。如《贵州省政府数据共享开放条例》规定,公民、法人或者其他组织需要使用有条件开放的政府数据的,应当通过政府数据开放平台向数据提供部门提出申请。政府数据提供部门收到数据开放申请时,能够立即答复的,应当立即答复;申请人申请开放政府数据的数量、频次明显超过合理范围的,数据提供部门可以要求申请人说明理由。数据提供部门认为理由不合理的,告知申请人不予处理;数据提供部门认为理由合理的,应当及时向申请人开放。《贵州省政府数据共享开放条例》的这个规定值得我国更多的地区借鉴,也可在我国进行政府数据开放专门立法时予以吸纳。

3)建立数据删除与数据撤回机制。一方面,应及时删除用户在开放平台留下的备份数据和运行数据,因为开放平台的数据获取以文件共享和API接口调用两种方式为主,这存在着数据残留风险;当用户退出平台时,应完全删除备份数据和运行過程中产生的用户数据,但目前缺乏有效的机制、标准或工具来检验是否实施了这一操作;另一方面,应根据安全风险监测和评估结果,或相对人的申请,对有潜在安全风险的数据及时删除。

4.2 设置专门的数据监管部门且配备专业的数据保护官

政府数据开放全生命周期中的安全风险的多发性和数据监管的复杂性,事实上对负责数据开放的政府部门的专业性和知识性都提出了挑战,亟待建立专门的数据监管机构,并配置专业的数据保护官。在我国地方政府目前开放数据面临的首要障碍是缺乏专门的具有专业能力的监管机构,要改变我国当前九龙治水的行政监管格局,可以通过立法将近两年陆续成立的政府数据服务局定位为专门的数据监管机构,明确其法律地位与职责,配置相应的数据监管权,规定数据监管人员的任职资格条件,以确保监管者的专业能力,规范行政监管行为。通过立法或政策支持高校相关学科和专业建设,加快培育专业化的数据保护官,打造能胜任政府数据开放共享业务需求的专业队伍。

4.3 构建我国政府数据开放共享的标准规范体系

按照需求导向这一基本原则,我国需紧紧围绕政府数据开放的全生命周期,构建符合我国国情的政府数据开放标准规范体系。由于缺乏统一的标准和接口,目前部分政府开放平台上的数据难以相互迁移,这不仅影响政府数据的开放和共享,也增加了数据安全隐患。贯穿我国政府数据开放共享全流程的政府数据开放共享标准体系,至少应包括数据创建与汇交标准、数据选择与处理标准、数据描述与组织标准、数据关联与发布标准、数据发现与利用标准和数据管理与评估标准等。研制这些标准应广泛吸纳国内外实践成果,一方面要重视采纳相关国际标准,如国际标准《信息技术安全技术 隐私影响评估指南》(ISO/IEC 29134:2017)对我国政府开放数据安全风险评估标准的研制非常重要。另一方面要充分总结和采纳国内相关标准构建思路和具体内容,譬如,可参考我国大数据标准体系的构建思路,注重与大数据标准化工作的协调;标准规范的具体内容可吸收已经发布并在实施中的地方标准的内容,如我国政府数据开放共享平台接入标准、数据脱敏标准的制定可吸收上海市地方标准《公共数据共享交换工作规范第2部分:平台接入技术要求》和山东省地方标准《公共数据开放第2部分:数据脱敏指南》的相关内容[51]。

此外,比起制定标准规范更值得重视的,是标准规范的实施。我们一方面要推动政府数据开放标准规范的尽快出台;另一方面要在标准规范出台后积极推动上线的政府数据开放平台提供标准化和规范化的数据开放共享。

4.4 建立政府数据开放全生命周期的安全评估与反馈调整机制  由上文分析可知,数据安全风险贯穿政府数据开放的全过程,因此有必要对政府数据开放全生命周期的安全风险进行实时监测和评估,对潜在的安全风险能提前发现,做好预案,实现精准防控。我国于2020年3月起正式实施的国家标准《信息安全技术数据安全能力成熟度模型》(Data Security Maturity Model,简称DSMM)(GB/T 37988-2019),将数据按照生命周期分阶段采用不同的能力评估等级,分为数据采集安全、数据传输安全、数据存储安全、数据处理安全、数据交换安全、数据销毁安全六个阶段。DSMM从组织建设、制度流程、技术工具、人员能力4个安全能力维度的建设进行综合考量。这个标准有必要在各地政府数据开放平台检索于运行过程中予以实施。通过数据安全能力评估可以预知具体的政府部门及其合作方的安全保障情况,持续的常态化的评估,可以有效地预警安全风险,通过及时反馈给开放数据的政府部门及其合作方,可以争取尽快调整,避免数据安全风险的发生。

5 结 语

我国政府数据开放正乘着数字经济的东风步入高速发展的轨道,但若不能正确处理好经济发展和数据安全的关系,则我们对数字红利的美好憧憬将难以成真。不同类型的数据安全风险的成因各有不同,且各类数据安全风险在动态变化,故要有针对性地采取有效防范对策,但这是一个十分复杂的、富有挑战性的任务,还有待更多人关注,进行更深入的探讨。

参考文献

[1]复旦大学数字与移动治理实验室.中国地方政府数据开放报告(2020年下半年)[EB/OL].http://ifopendata.fudan.edu.cn/report,2020-12-12.

[2]杨孟辉.开放政府数据:概念、实践和评价[M].北京:清华大学出版社.2017:1.

[3]薛智胜,艾意.政府数据开放的概念及其范围界定[J].财经法学,2019,(6):13-23.

[4]杨祺钰,陈朝兵.谈政府数据开放与政府信息公开的概念界定及其比较[J].系统工程,2019,(7):32.

[5]郑磊.开放不等于公开、共享和交易:政府数据开放与相近概念的界定与辨析[J].南京社会科学,2018,(9):83-91.

[6]肖卫兵.论我国政府数据开放的立法模式[J].当代法学,2017,31(3):42-49.

[7]陈晓勤.政府数据开放:实践挑战与法律框架建构[J].附件行政学院学报,2019,(6):80-87.

[8]赵润娣.美国开放政府数据范围研究[J].中国行政管理,2018,(3):33-37.

[9]胡逸芳,林焱.加拿大政府数据开放政策法规保障及对中国的启示[J].电子政务,2017,(5):2-10.

[10]王万华.开放政府与修改《政府信息公开条例》的内容定位[J].北方法学,2016,10(6):16-27.

[11]陈尚龙.大数据时代政府数据开放的立法研究[J].地方立法研究,2016,10(6):16-27.

[12]高富平.数据经济的制度基础—数据全面开放利用模式的构想[J].广东社会科学,2019,(5):5-16,254.

[13]Meijer R,Conradie P,Choenni S.Reconciling Contradictions of Open Data Regarding Transparency,Privacy,Security and Trust[J].Journal of Theoretical and Applied Electronic Commerce Research,2014,9(3):32-44.

[14]Zuiderwijk A,Janssen M,Choenni S.Design Principles for Improving the Process of Publishing Open Data[J].Transforming Government:People,Process and Policy,2014,8(2):185-204.

[15]趙需要,彭靖.政府数据开放中个人隐私的泄露风险与保护[J].信息安全研究,2016,(9):792-801.

[16]陈朝兵,郝文强.美英澳政府数据开放隐私保护政策法规的考察与借鉴[J].情报理论与实践,2019,(6):159-165.

[17]杜荷花.我国政府数据开放平台隐私保护评价体系构建研究[J].情报杂志,2020,39(4):172-179.

[18]郝文强.政府数据开放隐私风险识别机制研究[J].电子政务,2021,(3):103-111.

[19]Kucera J,Chlapek D.Benefits and Risks of Open Government Data[J].Journal of Systems Integration,2014,(1):30-41.

[20]Conradie P,Choenni S.On the Barriers for Local Government Releasing Open Data[J].Government Information Quarterly,2014,31:10-17.

[21]赵龙文,孙倩倩.政府数据开放中的商业秘密保护与利益协调[J].图书馆学研究,2019,(4):53-60,75.

[22]Shao D D,Saxena S.Barriers to Open Government Data(OGD)Initiative in Tanzania:Stakeholders Perspective[J].Growth and Change,2019,29:470-485.

[23]苗地.黑龙江省政府数据开放存在的问题与对策研究[J].商业经济,2018,(11):6-7,104.

[24]张珺.中国地方政府数据开放规则的问题与改进[J].大连海事大学学报:社会科学版,2020,19(1):25-31.

[25]才世杰,夏义堃.试论政府数据开放的风险识别与防范[J].图书与情报,2017,(4):104-112,121.

[26]邹东升.政府开放数据和个人隐私保护:加拿大的例证[J].中国行政管理,2018,(6):75-82.

[27]庄国波,韩惠.5G时代政府数据开放共享的安全风险及防范[J].理论探讨,2020,(5):48-54.

[28]Kent Cooper.Truthful News,a Basis for Peace[J].New York Times,January 22,1945.

[29]Harold C,Relyea.Freedom of Information and the Right to Know:The Origins and Applications of the Freedom of Information Act[J].Journal of Academic Librarianship,2001.

[30]宋烁.政府数据开放宜采取不同于信息公开的立法进路[J].法学,2021,(1):34-39.

[31]王萬华.论政府数据开放与政府信息公开的关系[J].财经法学,2020,(1):13-24.

[32]郑磊.开放政府数据的价值创造机理:生态系统的视角[J].电子政务,2015,(7):2-7.

[33]王万华.论政府数据开放与政府信息公开的关系[J].财经法学,2020,(1):13-24.

[34]奇安信行业安全研究中心.中国政企机构数据安全风险研究报告[EB/OL].https://www.qianxin.com/threat/reportdetail?report_id=111,2021-02-12.

[35]MailData.网络防御不可松:2019又出7种新型网络钓鱼攻击[EB/OL].https://www.sohu.com/a/326939824_100155237,2021-03-12.

[36]国家信息中心,瑞星公司.2020年中国网络安全报告[EB/OL].http://it.rising.com.cn/d/file/it/dongtai/20210113/2020.pdf,2021-03-12.

[37]大东BE.万物皆可变无线信号Wi-Fi?[EB/OL].http://www.lecfans.com/d/1425967.html,2021-03-12.

[38]360威胁情报中心.2018政企机构数据泄露形势分析报告[EB/OL].http://zt.360.cn/1101061855.php?dtid=11010625 14&did=610071644,2020-12-12.

[39]复旦大学数字与移动治理实验室.中国地方政府数据开放报告(2020年)[EB/OL].http://ifopendata.fudan.edu.cn/report,2020-12-25.

[40](美)艾伯特-拉斯洛·巴拉巴西.爆发:大数据时代预见未来的新思维[M].马慧,译.北京:北京联合出版公司,2017:310.

[41]肖冬梅,文禹衡.数据权谱系论纲[J].湘潭大学学报:哲学社会科学版,2015,39(6):69-75.

[42]Verizon.2019年数据泄露调查报告[EB/OL].http://www.100ec.cn/detail--6520824.html,2021-03-12.

[43]Verizon.2018 the Online Verizon Data Breach Investigations Report[EB/OL].https://enterprise.verizon.com/resources/reports/dbir/2020/introduction/,2021-03-12.

[44]黄莉玲,李玲.全国政协委员谈剑锋:数据黑产猖獗、互联网寡头数据垄断引担忧白皮书[EB/OL].南方都市报,https://www.sohu.com/a/397378768_161795?spm=smpc.content.fd-d.14.1590318538604JWixIKF,2020-12-12.

[45]IDC.《2025年中国将拥有全球最大的数据圈》白皮书[EB/OL].https://www.asmag.com.cn/news/201902/97598.html,2020-12-12.

[46]庄国波,韩惠.5G时代政府数据开放共享的安全风险及防范[J].理论探讨,2020,(5):48-54.

[47]复旦大学数字与移动治理实验室.中国地方政府数据开放报告(2020年)[EB/OL].http://ifopendata.fudan.edu.cn/report,2020-12-25.

[48]梁战平.情报学若干问题辨析[J].情报理论与实践,2003,(3):193-198.

[49]马费成,宋恩梅,张勤,IRM-KM范式与情报学发展研究[M].武汉:武汉大学出版社,2008:223

[50](英)迈尔-舍恩伯格,库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:104

[51]黄如花.我国政府数据开放共享标准体系构建[J].图书与情报,2020,(3):17-19.

(责任编辑:陈 媛)

猜你喜欢

安全风险防范对策
探析防范高校游泳教学过程中的安全风险对策
变电站倒闸操作的安全风险与防范措施探讨
智慧校园安全管理研究
儿科护理细节中引起护理纠纷的原因与防范对策
电力系统调度控制中存在的安全风险及应对措施
油田企业存在的财务风险与防范对策
浅析第三方支付平台的潜在洗钱风险
会计电算化系统的安全风险及防范
浅谈县级供电局电力调度管理和安全风险的控制