APP下载

人工智能背景下政府数据治理新挑战、新特征与新路径*

2021-03-26彭海艳

关键词:人工智能智能政府

何 振,彭海艳

(湘潭大学 公共管理学院,湖南 湘潭 411105)

随着大数据、云计算、移动互联网等新一代信息技术的飞速发展,全球数据总量呈现爆发式增长,不断积累的数据已经成为国家治理现代化建设的基础性战略资源,是经济转型和社会发展的新引擎。现阶段,我国80%的政府经济社会数据掌握在政府部门手中,如何盘活这些数据资源以释放数据价值是当前政府治理中的一个热点议题。通过数据治理进行政府治理变革与效能提升,已然成为推进国家治理体系与治理能力现代化建设的重要路径。2015年8月31日,国务院发布《促进大数据发展行动纲要》,指出“要加快大数据部署,深化大数据应用”。2017年12月8日,习近平总书记在中共中央政治局第二次集体学习时强调:“要实施国家大数据战略,推进数据资源整合和开放共享,加快建设数字中国,用大数据提升国家治理现代化水平。”可见,政府数据治理是当前事关政府管理创新和政府治理现代化建设的重要问题,是政府治理的一项重要内容,为解决政府治理痼疾、提升政府治理能力提供了新范式。

但迄今为止,国内很少有学者对基于人工智能技术的政府数据治理进行专门研究。本文旨在分析人工智能发展对政府数据治理提出的新挑战,阐述人工智能背景下政府数据治理呈现出的新特征,并提出人工智能背景下政府数据治理的新路径,以期为政府部门开展数据治理工作提供决策咨询参考和可操作性的实践指南,进一步丰富和发展政府治理的理论体系,为该领域的相关研究开辟新的理论视角。

一、人工智能发展对政府数据治理提出的新挑战

人工智能具有超强的数据分析与处理能力,运用人工智能进行政府数据治理已成为社会共识。当前,人工智能在政府领域的深度应用,对传统的政府数据治理方式、数据资产管理、数据质量管控、数据开放共享以及数据安全与隐私保护等提出了新挑战,人工智能背景下的政府数据治理任重道远。

(一)技术嵌入给传统政府数据治理方式带来冲击

人工智能技术的嵌入给传统的政府数据治理方式带来挑战,未来的政府数据治理将更加注重精准治理、整体治理、线上线下融合治理以及多元治理。主要表现在:一是由模糊治理转向精准治理。人工智能技术嵌入政府数据治理,给传统的数据收集、存储、传输、分析与处理方式带来了冲击。利用人工智能技术,可以对海量政府数据进行实时抓取,能够科学分析数据之间的相关关系,挖掘潜在的用户需求和深层次的复杂问题,为政府管理决策提供精准的数据支持,客观上推进政府数据治理从模糊治理走向精准治理。二是由碎片化治理转向整体性治理。人工智能技术具有很强的数据归集与融合能力,传统的碎片化治理方式难以满足人工智能背景下政府数据治理的需求,亟待推进整体性治理,实现政府数据的“三融五跨”和业务协同,提升政府管理效能。譬如,杭州城市大脑利用先进的传感器和算法模型,促进了全量多源异构数据归集和融通,形成了城市运行的全局感知和智能分析,实现了政府数据整体化治理[1]29-42+125。三是由线下治理转向“线上+线下”融合治理。人工智能嵌入政府数据治理,不仅使数据治理的边界从传统线下治理延伸至网络空间治理,还促使数据治理呈现出组织结构扁平化、业务系统化、数据融合化等特征,客观上要求政府数据治理由线下治理向“线上+线下”融合治理转变,真正实现“最多跑一次”“让数据多跑路、群众少跑腿”。四是由一元主导转向多元共治。人工智能的嵌入改变了传统以政府或公共机构作为主导数据治理唯一主体的治理方式,亟需构建“多元共治、多方合作、跨界互动”的数据治理新格局,广泛吸纳社会组织、企事业单位、公众等多元主体共同参与政府数据治理,促进“政企”“政社”“政媒”之间的良性互动。

(二)技术赋能要求进一步强化政府数据资产管理

人工智能赋能政府数据治理要求从宏观上做好政府数据资产管理,盘点数据资产、明确数据权属关系,以更好地促进政府数据的开发利用以及价值的实现,为政府管理提供及时、全面、准确的信息。具体包括:一是亟需顶层设计,要求数据资产管理“一盘棋”。我国政府数据资产管理尚处于起步阶段且面临诸多挑战,譬如,大部分政府部门的数据基础薄弱、数据质量参差不齐、数据“烟囱”林立等。人工智能技术赋能对政府数据治理的顶层设计提出了更高要求,需要从宏观上进行政府数据资产管理顶层设计,加强组织建设,做好总体规划,确保政府数据资产管理“一盘棋”。二是摸清数据“家底”,要求数据“看得懂”。人工智能赋能政府数据治理要求进一步做好数据资产清查,摸清“数据家底”,从数据总量、数据类型、数据质量、数据更新情况等多个方面盘点政府各个部门的数据资源现状,挖掘数据价值,助力我国数字政府建设。2017年,贵州省在全国率先出台《政府数据资产管理登记办法》,促进全省政府数据资产清查工作,为“数字贵州”建设提供“看得懂”的数据。三是对数据进行确权,要求数据“来去明”。人工智能赋能政府数据治理要求进一步加强数据确权,明确数据的权属关系和责任边界,准确划定数据所有权、采集权、管理权、使用权、收益权以及获取权等,保障数据有序流动、合法交易以及安全使用。近年来,虽然我国在数据治理领域出台了一些法律法规,如《网络安全法(2016年)》《数据安全法(草案)(2020年)》等,但是对政府数据确权的相关规定较为缺乏。四是做好数据分级分类,要求数据“管得住”。通过数据资产分级分类,对不同级别和类型的数据采取不同的管理策略,是人工智能时代政府数据资产管理的内在需求,是确保数据“管得住”的必然举措。2019年,深圳市坪山区实施了政务数据分级分类制度,形成了全区数据分级分类目录,促进政务数据资产管理,助力实现政务服务“一网通办”[2]。

(三)技术应用对政府数据质量管控提出更高要求

华为总裁任正非说:“高质量的数据是人工智能发展的前提和基础。”人工智能技术的应用要求加强对数据质量进行层层管控,避免脏数据、死数据、不完整数据等问题。主要包括:一是对质量标准建设提出严要求。数据质量标准建设是数据质量管控的前提,是决定政府数据质量优劣的关键因素。人工智能发展对政府数据质量标准提出严格要求,亟待制定全国统一的政府数据质量标准,同时还要细化其具体条款,对数据的真实性、一致性、准确性、完整性、关联性、可读性等做出详细规定。二是对质量风险防范提出高要求。深度学习训练算法对所输入的数据质量要求极高,一旦输入的数据存在风险,则可能导致输出的结果产生误差。因此,要利用机器学习、自然语言处理等技术对政府业务系统运行的各类数据开展动态、实时的风险监控,通过特征提取和关联比对,及时发现数据不准确、不一致、不完整等异常,提早进行风险防范。三是对质量管控机制提出新需求。人工智能发展要求通过完善政府数据质量管控机制,实现对政府数据进行全程、全域、全要素监控与跟踪,并对质量管控不力和责任落实不到位的政府部门或政府工作人员进行行政问责。同时,要建立科学的数据质量评估体制,对政府数据进行质量动态评估,确保政府数据真实可靠。四是对高质量的训练数据提出新诉求。人工智能的应用对高质量的训练数据提出新诉求,数据质量越高,政府通过人工智能技术所获取的信息可靠度越高,政府决策偏差越小。现阶段,高质量的训练数据仍然较为缺乏,在全国32个省(自治区、直辖市)中56%的地区存在信息内容不完整问题,38%的地区存在多渠道信息内容不一致等问题[3],已经成为政府管理创新的主要瓶颈。

(四)技术依赖容易加剧政府数据开放与共享难度

人工智能技术是一把“双刃剑”。人工智能推送信息的精准化和趋同化,使得人们获取信息存在路径依赖,依赖成瘾,有些人甚至放弃思考[4]44-50。当技术性思维取代制度性思维,机器决策代替自主决策等现象普遍发生的时候,无疑将会加剧政府数据开放与共享难度。主要问题有:一是数据开放共享程度低。推动数据开放与共享是人工智能时代政府数据治理的迫切要求。人工智能技术具有不确定性,一旦过度依赖技术,忽视对数据开放、业务协同、共享融合的政策导向和规划设计,其技术偏见和技术黑箱将会加剧政府数据开放与共享的难度,催生新的“数据壁垒”“数据孤岛”“数字鸿沟”。二是数据开放共享标准不一。人工智能发展亟待制定统一的政府数据开放共享标准规范体系,以促进政府数据的共享开放和综合利用。当前,技术依赖导致各级政府部门的政府数据开放共享标准不一,使得政府数据格式多元、口径多样,影响了政府数据的开放共享。根据《中国政务数据治理发展报告(2020年)》的显示,由于统一的政府数据开放共享标准规范缺失,导致目前我国102个地方政府数据开放平台系统中的71092个数据集异构分散、难以整合,给我国部分政府部门的数据开放共享带来困扰。三是数据开放共享机制不完善。当前,由于受到观念、体制和技术等方面的制约,我国政府数据共享开放机制尚不完善,互联互通机制、协同推进机制、安全保障机制以及考评问责机制等相对缺失,再加上政府工作人员对技术具有较强的依赖性,导致部门利益化“信息寻租”“信息茧房”“画地为牢”等现象依然存在,政府数据开放与共享举步维艰。

(五)技术滥用极易引发数据安全与隐私保护问题

人工智能的技术偏见、算法共振、算法偏见、算法歧视等极易引发新的政府数据安全和个人隐私保护问题,如数据造假、数据泄露、数据过度采集等。主要包括:一是无序数据挖掘加剧数据泄露。运用人工智能技术对存储在政府部门的有关行为模式、生物特征、习惯偏好、地理位置等无序数据进行深度挖掘,通过特定算法生成“数据画像”,将每个人变成“透明人”,该技术的滥用也会加剧数据泄露的风险。譬如,2015年,重庆、上海、山西、沈阳、贵州、河南等超30个省市卫生和社保系统中的数千万用户社保信息被泄露,其中包括社保参保信息、财务、薪酬、房屋等敏感信息[5]。二是数据深度伪造滋生虚假信息。运用深度伪造技术,人工智能可以对所收集的训练数据集进行深度学习和特征提取,并利用算法模型对数据进行操纵和修改,最终生成以假乱真的虚假信息。“深伪”技术的滥用,给国家安全和社会安全带来风险。譬如,2018年,一段美国前总统奥巴马说“特朗普是个彻头彻尾的笨蛋”的“深伪”视频在推特上引起了广泛传播[6],一时虚假信息蔓延。三是智能应用导致数据过度采集。由于政府数据权属关系不清、责任边界不明等情况,智能终端和智能系统的普及也容易引起数据过度采集问题,这些采集行为在没有得到用户充分授权的前提下,会严重侵犯政府利益和个人隐私。譬如,目前大量APP都存在超范围收集个人信息的情况。一些APP在自身功能不必要的情况下,对用户数据进行过度采集和违规获取。广东省公安机关在2019年第二季度APP专项清理整治工作中发现,共有1048款APP存在超范围收集用户信息行为[7]。

二、人工智能背景下政府数据治理呈现的新特征

人工智能技术的发展在给政府数据治理提出新挑战的同时,也给政府数据治理带来前所未有的机遇,使得人工智能背景下政府数据治理呈现一些新特征,政府数据内容更加丰富、政府数据处理更加快捷、政府数据管理更加高效、政府数据决策更加科学、政府数据服务更加精准。

(一)智能采集使政府数据内容更加丰富

智能数据采集是一种利用现代化智能手段采集所需数据的电子技术,目前在政府领域得到了越来越广泛的应用。智能采集技术实现了采集速度的提升、数据量的增大以及数据结构的多源等,使得政府数据内容更加丰富。主要表现在:一是数据体量巨大。根据国际机构Statista的统计和预测,全球数据产生量将从2020年的47ZB上升到2035年的2142ZB,中国数据总量将在2025年跃居世界首位,在全球的占比将达到27%以上[8],而我国的数据资源80%掌握在各级政府部门手里。智能采集终端的普及和应用,能够打破时空和地域限制,对跨系统、跨部门、跨业务的海量数据进行自动采集与归类,从而丰富政府基础数据资源库,形成“数据海”。例如,2018年杭州城市大脑2.0正式发布,覆盖全城420平方公里,接入了4500路视频和1300个路口信号灯,通过智能采集系统,共获取政府数据高达368.32亿条[9]。二是数据结构多元。依托自然语言处理、图像处理、声音识别、深度学习的智能数据采集终端,数据采集节点增多、数据采集频次加快、分布式计算能力增强,既可以实现主动抓取数据,也能够被动输入数据,从而使得所获取的政府数据结构更加多元化,如结构化数据、半结构化数据和非结构数据,单一数据和多维数据等。三是数据类型多样。政府数据是政府在行政管理和公共事务管理中所产生和因需对外获取并保管的数据,政府管理活动的复杂性决定了政府数据类型的多样性。利用智能采集技术可以获取类型多样的政府数据,如元数据、主数据与数据集,图像数据、声音数据和文字数据,静态数据和动态数据等,使得政府数据内容更加丰富。同时,可以对所采集的多样化数据进行归类、分析与整理,自动实现数据去重、降噪和筛选,并根据场景应用需要进行数据标注、提取和转换,为政府决策提供支持。

(二)智能计算使政府数据处理更加快捷

随着5G、物联网以及移动互联网等新兴技术的发展,政府数据呈现爆发式增长。人工智能具有超强的计算能力,通过数据清洗、数据转换、特征提取以及关联分析等手段,快速高效地处理海量数据。具体包括:一是数据处理的速度更快。智能计算可以将传统的查询、分解及数据分析进行分布式并行处理,首先将海量的政府数据分割成若干部分并分给多台处理器进行并行计算,然后再把各台处理器计算后的结果进行统计汇总,从而完成海量数据的并行处理,提升政府数据处理效率。以腾讯公司推出的“数智”平台为例,该平台将传统Hadoop长达20分钟的计算时长缩短到秒级,其数据处理速度提升高达780倍。二是数据处理的结果更好。人工智能能够对海量数据进行精准挖掘和系统化分析,并自动智能生成决策方案,为推动政府治理现代化提供强大的决策智力支持。相比于传统政府数据处理而言,通过智能系统进行计算处理的结果,其时效性更强、精细度更好、准确性更高。譬如,广东省旅游部门应用腾讯公司开发的“数智方略”系统,通过对全国10亿的人群画像和日调用量超过400亿区域的人流分析,成功地对景区的客流量进行实时分析与处理,为旅游资源的优化配置提供决策咨询方案[10]。三是数据处理的流程更优。传统意义上的数据处理流程包括数据采集、转换、分组、组织、计算、存储、检索、排序8个方面,每次处理数据大概都需要使用至少三次软件,费时费力。借助智能计算,基本实现了从采集、计算、挖掘到可视化展现的一站式数据处理。例如,上海的“店小二”政务智能终端3.0简化了数据处理流程,通过数据采集、汇聚、分析等一站式处理,实现了远程视频咨询、帮办、预约服务,打造全年无休的自助智慧政务服务窗口[11]。

(三)智能监测使政府数据管理更加高效

智能监测技术的普及,可以帮助政府对数据进行全方位、多角度的管理,促进政府数据管理高效化和规范化。具体表现在:一是主数据管理高效化。主数据又被称为“黄金数据”,是满足跨部门业务协同需要的、反映核心业务实体状态属性的组织机构的基础信息[12]66-79。人工智能技术可以对大规模的政府数据集进行监控,能够自动鉴别和筛选出主数据,并快速确定主数据的可靠与可信数据来源,构建完整的主数据视图。同时,机器学习、自然语言处理等还可以帮助定义和维护主数据匹配规则,解决同一数据项在多个系统中的匹配和合并问题,让主数据管理变得更加智能和高效。二是元数据管理高效化。元数据是描述数据资源的数据,又称为“数据的数据”,一般包括技术元数据和业务元数据。元数据管理是政府数据管理的基础,也是政府数据治理的关键领域,其主要价值在于为集团数据提供在计算、存储、成本、质量、安全、模型等方面的数据支持。基于语义模型、分类聚类算法的人工智能技术主要通过对非结构化元数据的采集和关键信息提取来管理元数据质量、监控元数据安全、实现元数据整合等,使元数据管理更加高效。三是数据生命周期管理高效化。数据生命周期管理是人工智能背景下政府数据治理的核心内容。依托人工智能引擎,应用机器学习、知识图谱、自然语言处理和文本聚类分类技术,通过对业务数据的获取、清洗、语义计算、数据挖掘、认知计算等,实现对数据收集、分类、存储、分析、传输、利用等全生命周期过程的监控,及时发现异常数据,并进行相应地修补和完善,以此提高政府数据管理效率。

(四)智能感知使政府数据决策更加科学

智能感知技术可以帮助政府获取所需的决策数据,能够自动分析数据之间的关系、深度挖掘隐藏在数据背后的隐性信息、找出事物之间的本质与规律,帮助政府准确掌握决策信息,提高政府决策的科学性。主要包括:一是决策数据更加客观。数据是政府决策的基石,数据的客观性决定了决策的科学性。利用物联网和传感设备构建智能感知系统或平台,能够实时地采集多维度全量感知数据、加快数据耦合与融合、促进数据流动与交换,为政府决策提供海量数据支持。相比于传统的政府数据采集而言,利用人工智能技术获取的政府数据,减少了很多人为因素的干扰,使得决策数据更加客观。二是决策质量显著提升。传统的政府决策大多是建立在人力计算和人为加工信息基础之上的,由于人的时间和精力的有限性,政府决策质量难以保证[13]83-90。人工智能背景下的政府决策是建立在海量政府数据精准挖掘和系统化分析基础之上的,政府可以依靠智能决策支持系统和专家系统对各种类型的数据进行自动化、数字化、精细化、智能化的分析,使政府决策支持信息得以全面提升,打破了决策者凭借领导意志、自身水平、个人经验的“拍脑袋”“一刀切”或是有限数据的决策模式,从而大大提升了政府的决策质量。三是决策方式更加科学。基于挖掘技术、聚类分析技术、并行计算技术、可视化技术等相关智能技术的政府决策,能够实时动态地捕获决策信息,并通过算法模型对政府信息进行精准预测和客观分析,避免主观决策、片面决策,提高了决策的科学性。譬如,泉州市公安局打造了智能感知大数据平台,构筑了多维感知的“智慧警务”系统,目前全市已建设联网智能感知设备超15万路,有力支撑了公安业务应用需求,为政府科学决策提供数据支持[14]。

(五)智能挖掘使政府数据服务更加精准

智能数据挖掘技术的应用让望“数”兴叹逐渐转变为“驱动引擎”。通过数据挖掘,可以从大量的、有噪声的、随机的、不完全的、模糊的以及多源异构的数据中搜索隐含于其中的、潜在的、深层次的信息,并将其转化为有效的预测和决策,从而提升政府数据服务的精准性。主要表现为:一是精准感知服务需求。精确把脉社会需求、推进服务供给精细化,是政府数据服务精准化的基础前提。运用人工智能的数据挖掘技术,政府可以有效绘制公共服务需求的知识图谱以及市民的用户画像,并进行数据关联分析,在“去粗取精”“去伪存真”后,准确提取和凝练公众的现实需求,减少需求信息收集过程中的各种错误、重叠和遗漏,提升政府精准识别服务需求的精细度、精准度和完整度。二是精准开展智能政务。政府部门依托人工智能实现了跨层级、跨地域、跨系统、跨部门、跨业务的数据融合与业务协同,打破了政府部门间的“数据壁垒”“数据孤岛”“数据烟囱”,促进了数据资源的有序流动,为精准开展智能政务提供条件。目前,依托数据挖掘、决策模型、数据仓库、自动感知、自动跟踪等技术手段的人工智能,在政务服务领域的应用日趋广泛,主要包括身份验证、服务推荐、智能客服、政务服务机器人等。三是精准推送个性化服务。人工智能背景下的政府数据治理将实现智能技术与公共服务的有效整合,打造以公众需求为导向的自动感知、高质量、便捷式的信息服务体系[15]85-92。通过人工智能可以实时感知、收集多样化的公众需求,科学分析公众的行为数据,洞悉公众的兴趣偏好,形成个性化的数据档案,从而为社会公众推送个性化的政务服务,使得政务服务更加主动、更加精准、更有温度。

三、人工智能背景下政府数据治理的新路径

习近平总书记指出:“加强人工智能同社会治理的结合,开发适用于政府服务和决策的人工智能系统,运用人工智能提高公共服务和社会治理水平。”[16]因此,应重点从加强顶层设计、推进依法治数、打破数据壁垒、强化风险防控以及注重技术创新等方面来推进人工智能背景下政府数据治理,助力政府管理创新和公共服务能力提升。

(一)加强顶层设计,建立权责明晰的政府数据治理组织架构

有效的顶层设计与合理的组织架构是政府数据治理成功与否的前提,人工智能背景下政府数据治理应进一步加强顶层设计和完善组织架构,为政府数据治理提供行动依据和科学指导。为此,应重点加强以下几方面:一是制定人工智能数据治理战略规划。随着我国数字化进程的加快,从国家宏观层面制定契合人工智能发展的数据治理战略规划势在必行,应重点对人工智能数据治理的目标、重点任务、主攻方向、工作机制、推进机制以及保障措施等进行整体设计。近年来,世界主要经济体相继出台了人工智能发展战略,如美国《国家人工智能研发与发展战略计划》、英国《产业战略:人工智能领域行动》、欧盟《促进人工智能在欧洲发展和应用的协调行动计划》等,对人工智能嵌入数据治理领域的一些关键问题进行总体布局,这些都为我国的人工智能数据治理顶层设计提供了参考。二是建立科学合理的人工智能数据治理组织结构。当前,科层制体制下的组织结构中间层级多、垂直互动困难,导致数据传递速度慢、数据失真的情况时有发生。人工智能背景下的政府数据治理应重点建立扁平化、网格化和集中与分散相结合的组织结构,尽量减少数据管理层,并加强网格化管理,打通政府数据治理“最后一公里”。同时,既要加强数据治理集中统一领导,又要注重发挥不同部门的主动性和能动性。例如,组织管理分散且数据需求较少或复杂程度较低的部门,一般采用“分散模式”;数据需求较多且复杂程度较高的部门,可采用“归口管理模式”“集中+派驻模式”“全集中模式”。三是建立人工智能嵌入数据治理的管理机构。根据《中国政务数据治理发展报告(2020年)》的统计数据,截至2019年底,我国已有22个省份设立了专门的数据管理机构。但是,很多数据管理机构的智能治理理念滞后,多头管理、职能模糊、业务重叠、工作交叉等现象普遍存在。为此,应加强政府数据治理顶层设计,建立权责明晰的管理机构,组建一支具有智能治理理念的数据管理队伍。譬如成立全国统一的政府数据治理委员会、设立专门的政府数据首席数据官和人工智能官(CAIO)等,明确政府在人工智能应用中的权责,并清晰界定各级政府在数据采集、存储、管理、使用等环节中的责任。

(二)推进依法治数,构建体系完备的政府数据治理政策法规

完备的政策法规是政府数据治理的前提和基础,人工智能背景下的政府数据治理应重点从法律法规、政策规章和标准体系三个方面来加强政策法规建设,为政府数据治理工作提供法律依据和行动指南。主要包括:一是制定严密高效的人工智能数据治理法律法规。世界发达国家已建立完备的数据治理法律法规体系,主要涉及信息资源管理、电子政务、隐私保护、信息安全、数据开放和信息公开等与数据治理相关的领域[17]27-33。相对而言,我国的数据治理法律法规建设较为滞后,尚缺乏专门针对人工智能数据治理的法律法规。虽然在2020年颁布实施了我国第一部数据领域的国家法律——《数据安全法(草案)》,但该法未对人工智能发展中的数据治理问题进行规制。因此,应加快制定人工智能数据治理配套的法律法规,重点对人工智能技术嵌入政府数据治理中的数据质量管理、数据安全管理、数据生命周期管理等进行明确规定。二是颁布行之有效的人工智能数据治理政策规章。我国自2010年至今,全国共出台了125份省级政府层面与政务数据治理直接相关的政策文件[18]。但是,现有的政策规章难以满足人工智能发展的需要,如政策协调性不够、政策“打架”现象较为普遍,政策兼容性不强、缺乏连贯性,内容较为宽泛、执行力不强等[19]82-83。因此,应引入智能治理理念,专门制定与人工智能相关的政府数据治理配套政策,完善政府数据智能采集、智能挖掘、智能分析等方面的政策体系,为人工智能背景下的政府数据治理工作提供依据。三是建立统一规范的人工智能数据治理标准体系。“无规矩不成方圆”,人工智能背景下的政府数据治理需要构建统一规范的数据标准体系。建议由国家网信办或者大数据管理局牵头,联合全国信息技术标准化委员会和全国信息安全标准化技术委员会共同成立统一的人工智能数据标准研制部门,专门负责制定与人工智能相关的政府数据治理标准,如主数据标准、元数据标准、业务数据标准、数据质量标准、数据安全标准以及数据生命周期管理标准等。

(三)打破数据壁垒,完善开放共享的基础政府数据资源体系

建设数字中国、促进政府数字化转型,必须要将政府数据资源体系建设放在首位,这也是人工智能发展对政府数据治理提出的要求。为此,可以采取如下措施:一是建立智能化的基础政务数据库。利用人工智能技术对政务大数据进行智能采集、汇聚、分析与处理等,构建各类政务公共数据资源语料库、方法库、模型库和知识库,完善智能化的政务数据资源体系,为政府管理决策和公共服务提供基础数据支持。近年来,我国在基础政务数据库建设方面虽然取得了初步成效,但是与国外发达国家相比,仍有很大的提升空间。根据美国市场研究机构的统计数据,截至2019年第三季度末,美国数据中心的全球占比为40%,而中国、日本、英国、德国和澳大利亚的数据中心合计仅占全球总量的32%。二是构建高质量的人工智能训练数据集。我国在《促进新一代人工智能产业发展三年行动计划》中明确指出要加强高质量的标准测试数据集和训练数据集建设。但是,目前可供人工智能训练的高质量数据集仍然较为缺乏,根据《2019中国地方政府数据开放报告》的数据显示,2019年全国开放数据集总量为62801个,仅有约40%的平台开放了优质数据集。建议由国家层面统筹政府数据集建设,以政府数据开放为牵引、龙头数据为基础、行业数据合作驱动,联合无利益关系的第三方共同构建高质量的人工智能训练数据集。三是打造数据资源“智能共享池”。长期以来,我国政府信息化建设各自为政、条块分割现象较为普遍,导致目前政府数据开放不足、整合不力、共享不畅等问题依然存在,亟需打造以“聚、通、用”为导向的政务数据资源“智能共享池”,将散落在各个委、办、局的政府数据智能整合起来,助力政务数据资源体系建设。当前,一些地方政府利用人工智能技术率先探索数据资源“共享池”建设,积累了一些值得借鉴的宝贵经验。譬如,江苏省常州市政务办全力推进“放管服”重点领域改革,打造“数据共享池”,让群众办事“像网购一样方便”。

(四)强化风险防范,健全科学合理的政府数据安全保障机制

近些年来,随着国内外政府数据安全问题日益凸显,如何有效地保障人工智能背景下的政府数据安全成为当前各级政府部门亟待解决的问题。主要措施包括:一是建立常态化的人工智能数据安全风险防控机制。首先要建立政府数据安全风险智能识别机制。通过利用智能聚合和智能感知等技术对政府数据安全风险源进行特征提取,及时发掘和精准辨识数据安全风险点。其次要建立政府数据安全风险智能监测预警机制。通过数据挖掘、关联分析以及神经网络等算法和模型对各类风险数据进行实时监测和智能分析,并准确研判政府数据安全风险,实现对政府数据安全风险监测预警。最后要建立政府数据安全风险智能管控机制,如预案启动机制、快速决策机制、联动协作机制及信息通报机制等,将防范风险的“先手”与应对和化解风险的“高招”结合起来。二是实施适合人工智能发展的政府数据分类分级保护。我国《数据安全法(草案)》第19条提出“要对数据进行分级分类保护”,但该条款对数据分级分类保护的规定比较宽泛,尚未对不同领域数据分级分类的具体依据和监管要求进行专门的规制。人工智能背景下的政府数据治理应进一步完善政府数据分类分级安全管理制度,明确数据分类分级安全管理的各方主体及其责任,根据政府数据的形态、价值、特征、数量、质量、重要性、敏感程度以及流通场景等关键因素,对政府数据资源分类、分级,并对不同级别的政府数据分别采取不同的安全防护措施。三是织密全流程全覆盖的人工智能数据安全防控网络。人工智能背景的政府数据安全风险来源于政府数据采集、传输、存储、使用、流转等全过程数据管理活动。因此,应全方位织密筑牢政府数据安全防控网络,突出人工智能技术思维和立体防范,注重主动防御、动态防御、整体防护和精准防护。采用物理隔离、病毒防护、加密脱敏、数据备份、身份认证、访问权限等技术手段,有效防止数据违规采集、数据泄露、数据篡改、数据滥用等安全事件发生,切实保障人工智能背景下的政府数据安全。

(五)注重技术创新,打造运行有效的政府数据综合治理平台

通过人工智能技术创新构建有效的政府数据治理平台,是人工智能背景下政府数据治理的重要保障,能够有效解决数据管理混乱、数据难溯源、数据不安全等问题。具体包括:一是加强数据开放智能平台建设。《中国地方政府数据开放报告》的数据显示,截至2020年4月底,我国共有130个地方政府数据开放平台,其中省级平台17个、副省级和地级平台共113个。但是,这些数据开放平台的智能化水平有待提升。为此,应加强以政府数据治理为前提的人工智能技术研发力度,突破小样本学习、迁移学习、联邦学习、差分隐私等人工智能数据安全保护核心关键技术,完善人工智能开源学习框架,建构数据开放智能平台。二是加强数据融合智能平台建设。数据融合是解决跨平台应用、协作、共享的有效手段,可以利用智能云计算节点超融合技术,构建政府数据智能融合平台,针对多、杂、乱、错、冲突、歧义的第一手数据进行整合优化,并根据相应的目标进行数据清洗,统一格式规范,验证数据可靠性,促进数据跨系统、跨部门、跨行业融合。三是加强数据管理智能平台建设。首先加强元数据平台建设,通过梳理各类数据来源,引入人工智能自然语言识别与处理技术、图像识别技术等,实现各政府部门的元数据智能采集,在厘清现有的数据流转流程和数据架构,提供数据血缘分析、影响分析等,最后再形成政务数据可视化地图。其次加强数据质量智能监控平台建设,主要以数据标准为数据检核依据,以元数据为数据检核对象,通过向导化、可视化等简易操作手段,对质量评估、质量检核、质量整改与质量报告等工作环节进行流程整合,形成完整的数据质量管理闭环。四是加强数据服务智能平台建设。以全国一体化政务服务平台建设为依托,利用人工智能技术加大政府数据智能服务平台的建设力度,努力打造全国政务服务“一张网”,全面推进“一网通办”。同时,通过智能推送和智能客服大力提升政府数据服务的效率,促进政府数据服务更加精准化、智能化和高效化。

猜你喜欢

人工智能智能政府
知法犯法的政府副秘书长
2019:人工智能
智能前沿
智能前沿
智能前沿
智能前沿
人工智能与就业
数读人工智能
下一幕,人工智能!
依靠政府,我们才能有所作为