APP下载

档案馆的数据转型策略研究

2020-03-18周文泓贺谭涛杨梓钒

兰台世界 2020年3期
关键词:转型策略档案馆

周文泓 贺谭涛 杨梓钒

摘 要 档案馆数据转型的研究旨在为档案领域应对数据化进程提供实践策略,从而拓展档案理论与方法。本文选取NARA和NAA两个示范性案例呈现档案馆的前沿数据转型行动,从中总结转型要义并提供参考。由此,发现立足国家数字建设框架、融合档案馆本质职能、拓展数据对象认识、显现数据治理思路等转型要点,为我国档案馆的数据转型提出启示:提升数据转型认知、守正档案馆本质定位、升级数据层管理行动、拓展数据治理能力。

关键词 档案馆 数据转型 数字转型 转型策略

Abstract The research on data transformation of archives aims to provide practical strategies for the archival field to deal with data challenges, which contributes to archival theories and methods. With case study of practice of NAA and NARA, the frontier data transformation is presented and key transformation points are concluded to provide reference. Therefore, key dimensions are revealed as focusing on the framework of national digital construction, integrating the fundamental functions of archives, expanding the cognition of data objects, and indicating ideas of data governance. Then strategies are proposed including improvement of cognition of data transformation, upholding essential positioning of archives, upgrading the management actions on data level, and expanding the ability of data governance.

Keyword archives; data transformation; digital transformation; transformation strategy

数据化浪潮正为全球各国与地区带来新一轮发展契机,机遇与挑战并存的背景下数据各利益相关者的参与和协同是重要的助推力量[1]。档案馆作为可信信息管理的监督与指导者以及可信信息资源的保管与共享者,其助力是数据化的强烈现实需求,同时数据化亦是档案馆转型升级的重要内容。因之,档案館在社会数据化进程中应有怎样的定位与具体行动亟待解答,尤其对于数字战略多维推进的中国而言,档案机构在同数据管理机构的协作探索中更需明晰档案馆数据转型的主要内容。

研究层面有一定的回应,一方面,从档案数据化视角将数字档案资源转换为可供阅读、分析和处理的档案数据资源的过程,这从档案信息资源开发框架下数据挖掘和大数据背景下档案数据相关概念界定与行动得以体现[2][3]。另一方面,从数据归档角度探讨如何将数据管理同文件、档案管理相融合,这从机构职能如数据管理机构与档案机构相互关系、数据档案化管理机制与流程等方面有一定探讨[4][5]。此外,亦有研究从数据治理的内容组成尤其是开放数据的视角明确档案馆开放数据的方法、进展、问题与对策[6],然而这些研究对档案馆应如何实现数据转型与展开具体行动尚缺整体把控和细致说明。

对照于现实需求和研究局限,全球各国与地区档案馆正萌发的数据治理能力建设为参与行动提供了探索空间。美国、澳大利亚、英国等均基于各自档案馆职能与档案管理机制有一定部署与具体行动,这些部署与行动在具有实践参照价值的情况下可提供经验借鉴。

一、两个维度:档案馆的数据转型行动

1.立足国家整体数据资源建设的开放数据政策部署:以NARA为例[7]。档案馆作为可信信息资源的保存与利用的核心基地,在政府数据治理背景下的重要职责之一就包括参与数据资源建设且将档案开放同数据开放在机制与流程上融合。因而,开放数据成为档案馆从后端参与政府数据治理的关键切入点。值得说明的是,选取NARA作为示范性案例在于它不仅实施开放数据行动呼应微观的数据管理需求,而且从规则层面制定同治理对照的开放数据政策。对接于美国数字政府和开放政府的战略,NARA从以下方面深化开放数据行动。

(1)构建数字档案资源。NARA的终极目标是将所有文件与档案迁移至数字空间并实现线上利用,因而数据治理中深化开放数据的基点是以“数字化”的过程创建数字副本,为开放数据奠定内容资源基础。为将NARA庞大的档案存储数字化并实现以数据为基本颗粒的管理与利用,NARA通过寻求商务合作伙伴、众包、转移至其他利益相关者,如形成机构、升级优化内部的数据实验室等策略,进行了一系列档案转化工作,NARA正在对包括120亿页文本在内的档案进行数字化,并通过人工与自动化著录结合的方式予以数据挖掘。例如,NARA对1940年人口普查的370万张图片、7.5万张世界大战静态图片和164个(337卷)时长达65小时的内容进行数字化处理,这些档案可以在线获取。此外,公众用户帮助转录完成了177000份档案,NARA的内部数字成像实验室在2015—2016数字化了超过700万幅图像。

(2)开放高价值数据集。为进一步提高透明度和数据公开力度,NARA在庞大的档案资源中以开放高价值的数据集为重要对象,领衔专项开放数据行动。同时,NARA鼓励工作人员对数据资产进行内部提名,并每季度通过对新的数据资产进行审查,以扩大清单中包含的数据资产的数量,丰富元数据,并开放其他数据资产来维护业务数据清单。截至目前,NARA在Data.gov和Archives.gov开放的高价值数据集有十余个,包括:公共数据清单,包含可供公众使用的数据资产,涵盖XML、CSV、PDF和HTML各种格式的数据;美国联邦各项规定与民主化进程的记录,如2007—2009年联邦法规(CFR)、2000—2010年《联邦公报》、修正美国(1787年至2014年“美国宪法”11000多项拟议修正案)、1996年至今的联邦条例法典、2000年至今的联邦登记册(美国政府的官方法律报纸)、“联邦登记册”上公布的“联邦政府总条例”和“永久条例”的编纂工作、美国总统的行政命令、美国总统的公开文件、美国政府手册(有关立法、司法、行政部门机构和准官方机构的全面信息)、1971—1973年尼克松政府的白宫磁带(尼克松政府期间白宫录音系统记录的会议和电话的元数据);NARA档案资源的说明数据,如档案研究目录(ARC)中的档案说明(提供了有关联邦政府在国家档案馆保管中的永久资产的信息)、国家档案馆目录中的档案描述(联邦政府永久财产的档案描述,包括传统的纸张收藏、电子文件和文物)、国家档案目录中的组织描述(联邦和非联邦组织的名称和行政历史的演变)。

(3)开放数据利用工具的优化。开放数据工具的优化,在融合NARA线上档案利用平台的升级中。

一方面,强化国家档案目录这一利用系统的建设,增加线上可利用档案并将利用深化至数据层,提高检索能力。NARA的开发工作侧重于提高系统的性能和可伸缩性,并利用开放源码平台,使其能够有效地提供对数千万条甚至数亿条记录的访问。检索内容包括来自档案研究目录(ARC)的所有数据,一些来自访问档案数据库(AAD)的系列,来自电子文件档案馆(ERA)的电子文件集合、Archives.gov和总统图书馆网站的档案数据。OPA(在线公共利用)系统是NARA文件与档案以及国家档案馆中有关信息的在线门户,提供了对档案库中多种资源的利用,同时也简化了检索方式。其内容包括:NARA近75%的传统馆藏(文本记录)、77%的文物和95%以上的电子文件、所有Archives.gov页面和总统图书馆网页的资源。这些都是开放数据可利用的重要渠道。

另一方面,是做好同各类系统的对接,确保数字原生信息得到数据层的记录,为开放数据工作实现前置的统筹协同。例如,ERA以前端控制方式确保电子文件在联邦政府机构当中形成与流转时,通过元数据记录谁创造了它们、为什么创造它们以及对它们应用了哪些过程的知识。其中,开发应用程序接口(API)是重要举措,从而确保所有新的IT系统都遵循开放的数据、内容和Web API政策,并执行agency.gov/developer页面的要求,以促进公民开发人员重新使用National Archives记录。NARA开发了大量公共应用程序编程接口(API),包括针对网页和移动应用的API。API的使用会极大地扩大公众使用NARA记录和JSON、XML和CSV等多种格式的描述性元数据的可能性,同时也会大大提高NARA与第三方平台(如Wikipedia和美国数字公共图书馆)共享政府记录的能力。为达到开发API的目的,NARA在Github上发布了从数字化工具到包含FederalRegister.gov的代码,也寻求将站点迁移到开源内容管理系统Drupal上。从而在这样一个社会协作编码平台上,公众和工作人员可以更好的进行开放数据的底层代码设计。

目前,可获的API包括国家档案目录API、联邦注册API、美国数字公共图书馆API、Flickr API。以国家档案目录API为例,它是国家档案目录的读写网络API。该API可用于执行對档案元数据的实地搜索、元数据和数字媒体的大量导出以及对记录的贡献。数据集包括档案描述、权威、数字媒体、网页和公众贡献(如标签、转录和评论)。

2.面向数字连续性构建的可信数据管控制度体系设计:以NAA为例[8]。档案馆另一关键职责是对政府各类信息的前端控制,监督、指导与辅助政府机构有序可信地全流程形成、管理和维护信息。数据化深入的背景下,数据类的记录亦涵盖其中,即为政府数据管理建立管控质量的规则体系。以数字连续性为目标的澳大利亚以澳大利亚国家档案馆(以下称NAA)为引领者,从文件与档案管理角度设定澳大利亚政府数据治理联动管理的整体体系。为支持澳大利亚政府数字化转型,NAA于2005年发布《数字连续性2020》政策,其中可互操作的信息、系统和流程是能力建设的三大要求之一。NAA认为,要达成此目标的构件之一是数据规则体系的建立与贯通,从而支持跨业务、安全、法律、语义和技术主题构建互操作性,这也是政府数据治理的要义。因而,NAA基于规范政府数据与信息管理的监督与指导者的职责,主导设计政府数据治理主要内容,并关注到治理同管理的有效对接,将内容整体界定为“政府数据治理与管理”。当前,NAA将政府数据治理与管理的核心活动部署为以下内容。

(1)面向互操作能力构建的元数据设置。元数据是定义和描述数据的结构化信息,在确保用户和系统了解交换的信息和数据的含义方面起着重要作用,是数据治理与管理的重要环节。NAA要求政府机构制定元数据战略和元数据标准作为保障。针对元数据的收集、存储和交换等环节,NAA要求元数据收集应使用自动化工具,从各种来源(如网站)收集元数据描述,机构内不同的元数据存储库应进行集中,以建设中央元数据存储库。同时,机构内元数据相关文件应实时更新,以满足其他机构使用的标准,进而保证元数据的有效交换。

(2)数据的索引与发现。数据的索引与发现包括扫描数据集的存储库和文件存储库,快速有效地在整个机构中查找数据,了解机构当前的数据格局,并充分利用现有数据,这是政府机构进行数据治理与管理的基础。数据索引与发现要求机构进行数据分析并记录机构数据。数据分析通过深入了解数据问题的根源,识别机构数据与目标数据状态之间的差异,研究机构当前的数据流并确定需要改进的领域,帮助机构确定匹配特定计划的理想标准所需的数据转换。记录机构数据指了解机构中拥有的信息和数据,机构应检查相关治理框架,以获取在何处查找有关数据的指导,例如信息资产登记册(用于识别您资产的潜在价值和可能风险)、业务系统注册或软件许可证注册表(其中可能包含有关系统数据的详细信息以及任何相关的系统信息管理计划)。

(3)数据的分类。数据分类是指将信息和数据组织成有意义的组的分类方案,帮助机构将其信息和数据组织成层次关系,以确保可以对其进行有效搜索,查找并正确解释其含义,支持互操作性语义主题的建构。数据分类最简单的形式为通过分类对象间的关系建立层次结构,并使用受控词汇表来管理同义词,确保业务术语得到正确解释,减少歧义。在创建分类方案时,需考虑使用现有数据定义,减少数据转换,正确解释数据和信息的内容。当机构需要创建大型本体,标记和更正现有分类法中的错误以及定期生成大量需要分类的数据时,可以采取自动分类法构建(ATC),利用自动化工具实现文本主体的分类。除了传统分类方案中利用层级结构来描述信息和数据,NAA指出还可以通过其与不在其线性层次结构中的其他对象的关系来进行描述。

(4)数据及其格式的开放。政府数据治理与管理要求机构数据及其格式必须开放才能支持互操作性的构建,其要求为机器可读,没有“锁定”特定技术产品或供应商,可以自由访问,能够在开源或免费技术下使用,同时需考虑相关政策和标准等,满足隐私安全的要求。如机构数据因技术原因无法呈现开放格式,可以使用提取、转换或加载(ETL)等技术将数据轉换为需要的格式。NAA建议政府可以接受数字转型机构使用开放数据改进机构服务的指导,并使用开放数据成熟度的通用模型(如NSW Government Open Data Model新南威尔士州政府开放数据模型)来评估其开放数据的成熟度,监控机构数据及其格式开放的进程。

(5)数据质量的管控。对数据质量的管控可以保证政府数据治理与管理的有效开展。数据质量的管控通过建立数据质量策略来监视和管理数据质量是否符合机构要求,并对其进行有效评估。数据管理协会(DAMA)将数据质量的共同维度定义为:准确性、完整性、一致性、真实性、合理性、及时性、独特性和有效性。数据质量评估通过测量数据的特定维度来对数据质量进行评估,数据质量评估可以显示机构数据是否满足利益相关方要求,并帮助机构确定高价值数据集的补救优先级。NAA提出可以使用数据质量评估工具作为指导,监控数据质量,生成数据质量报告,协助验证数据并为将来的数据修复提供指导。除此以外,良好的元数据对于理解和评估数据质量至关重要。数据质量评估需要确定机构数据是否满足其用户的期望,元数据在表明这些期望方面起着关键作用。例如,机构可以查看元数据是否符合格式要求,或者是否已根据业务规则进行更新。元数据还可用于记录数据质量评估,这意味着元数据存储库可用于在整个组织中存储和共享数据质量评估结果。机构元数据和数据质量团队可以紧密合作,共同开发这些流程。

(6)数据合规性与安全性的保障。所有政府数据均受法律、政策和标准的约束,因此需保障数据合规且安全,才能实现政府数据治理与管理。NAA认为建设互操作性项目需关注数据交换机制、数据隐私和识别数据许可和使用条款中与数据合规性和安全性相关的内容,并遵循保护性安全政策框架(PSPF)和澳大利亚政府信息安全手册(ISM),对敏感和机密信息进行有效管控,防止未经授权的信息访问。数据交换机制可通过参考数字转换机构(DTA)的可信数字身份框架和Gatekeeper公钥基础结构框架,来确保机构流程和系统满足安全数据交换的标准。澳大利亚信息专员办公室(OAIC)提供的澳大利亚隐私原则和隐私原则资料单,可以帮助政府机构了解并满足数据隐私和去识别的要求。为满足数据的合规要求,政府机构还需了解所需数据依据的许可和使用条款,所需数据是否使用其他派生数据集以及是否将派生数据的许可和使用条款转移到新数据集中。

二、档案馆数据转型经验解析

美国与澳大利亚的数据转型行动分别从两个维度展开,二者亦有相交之处,在世界范围内有着近似实践的国家与地区,涵盖英国、加拿大、新西兰、韩国、新加坡等。尽管实践不尽相同,但面对人类世界数据化延展的趋势,它们的行动显示的是对数据转型趋势的发现和正面主动的应对姿态。综合当前以上述两大维度的代表性实践来看,无论实践形态为何,关键要义在于以下方面。

1.立足国家数字建设框架。档案馆的数据转型体现的是主动积极参与社会建构的思路,在当下显示为从数据化的脉络中推动国家的数字建设。数字建设需要数据资源和数据方法的双重助力,这也对各个领域提出需求,亦是各行业同步甚至领衔社会建设的机遇。对兼具信息管理与公共服务职能的档案馆来说,这也是不可错失的契机。因而,积极探查所属外围环境,尤其是国家与地区层面的数字建设框架,成为档案馆数据转型的重要前提。而系统发现数字建设有何需求,并如何对照于档案馆运行目标、方法、对象、内容等各要素的发展则不可或缺。

因而,一方面,NARA与NAA在美国同澳大利亚均着力建设数字政府积极布局国家数据战略的背景下,都提出要展开相应行动,从而表现出同样的数据转型趋势。另一方面,不同国家与地区的数据化规划不同,这也使得NARA与NAA的数据转型路径相异。美国以数字政府和开放政府两大战略为主线,数据层级的行动布局均涵盖其中,由此NARA的开放数据行动相对分散,依据数字政府和开放政府的不同要求展开,例如对照数字政府着力于平台建设,对应于开放政府着重于数据资源建设。相比之下,澳大利亚政府直接提出数据治理战略,NAA则把握主线“集中式”地设计数据治理与管理模块。

2.融合档案馆本质职能。档案馆本质职能的明确是档案馆数据转型的基石,它帮助档案馆明晰数据转型的必要性、转型点、转型方向与具体内容,从而解决如何做的问题。这意味着,档案馆的数据转型重点依旧落于档案馆是什么的问题,所有数据转型显示出的方向都要融合在档案馆职能与各职能维度下的业务活动中。换言之,档案馆的数据转型并不是将已有的档案管理职能弱化,而是要厘清档案馆职能的本质。

NARA和NAA的具体行动,共同显示出档案馆既是具有长久价值档案资源的保管和提供利用方,亦要从专业角度指导与监督各种形式记录的可信全过程管理。由此,一方面,两者积极参与或促进数据资源建设以及质量维护的目标,均在于当下与未来能够留存更多可信数据并实现数据层级的价值挖掘与利用。另一方面,NARA体现为以ERA的积极对接来确保数据层同样实现前端控制,NAA则表现为数据治理与管理板块的服务对象就是政府机构。其中,档案管理的本质愈加深化,即便如NAA这样,将核心术语的常规表达为和前端的业务部门对接选择数据,但可信文件、档案管理的理论与方法论仍深入其中。例如,数据治理与管理板块中业务、法律、技术等多维度的布局,充分表现了文件连续体的基本思想。

3.拓展数据对象认识。数据转型的另一要点是将档案馆的内容对象即档案从形式端予以拓展。一方面,不仅认可档案可以是深化至数据形式的记录,也认为数据逐步成为档案主要的表达形式。并且,由NAA的实践透露出的趋向,就是数据作为术语表达将从形成端贯通至档案利用端。因而,在NAA的官方网站中,从所有政策文本的内容上看,record和archive这样文件、档案的提法极为少见,近年主流的information即信息也逐渐被数据取代,因而NAA直接将信息治理下的主要板块之一设置为数据治理与管理。这一变化在2019年中国电子文件管理论坛上得到澳大利亚国家档案馆馆长助理Linda Macfariane的确认,她的报告中明确提出信息管理的提法将在澳大利亚国家档案馆中凸显以数据为核心术语的表达。另一方面,进一步强化数据化趋向背后更加完整的技术思维,即技术理念的认识和技术的利用,以此将作用对象深化至数据层时,亦能因为颗粒度的变化而创新管理方法和应用技术。例如,NARA创设数据实验室的很大程度受驱动于数据资源建设和提供利用的复杂性与繁杂工作量,数据转型的大量成果导向各类系统的开发或完善。

4.显现数据治理思路。数据转型于档案馆而言还综合表现为凸显数据治理思路,对各要素进行顶层协调与统筹。一方面,对各要素进行联动,将主体矩阵、数据流、配套设施、管理要求相互对照和贯通,从而能将数据管理立体且网络化嵌入各类主体的各项活动之中,这既体现于档案馆自我的档案资源保管与利用如开放数据中,也显示于檔案馆为政府机构设定的可信数据管理上。例如,NARA的开放数据统筹是对各个相关要素的连接,既表现为流程上做好以ERA作为中介的前中后多端流程对接,也体现为主体、平台、资源多方的统筹,如多种组织架构设计以协作构建数据资源。

另一方面,除落实和推进各项数据管理活动,档案馆的数据转型亦在于作为专业机构参与数据管理规则体系建设,共同助力社会数据治理框架搭建。因而,档案馆的数据转型在数据治理思路下强调的是,不仅要作为资源管控方的落实者,而且要为资源可信管理的专业者对各类主体、各项流程、各个行业的数据管理提出可信管理的要求,并为此提供规则或是协作制定规则。以NAA为例,其为澳大利亚政府设计的数据治理和管理活动着重在于数据管理有哪些活动及其关键要求,如从数据管理关键环节如索引与分类或是数据可信的八大属性出发,为此提供标准要求,而非档案馆亲自进行数据管理。

三、策略:档案馆的数据转型空间探讨

于我国,数据治理体系的建设正在进程中,以数据助力国家治理能力现代化的行动正在各领域布局和实施,档案馆为此接收并提供利用的数据资源正在构建中,亦为档案馆的整体运营提供新的思路和要求,在机构改革的背景下更要求档案馆同数据化趋势对接的转型规划。NARA和NAA的数据转型实践经验尽管不能全盘照搬于我国,积极应对甚至引领数据化的意识以及对照档案馆职能所设计的转型内容可提供一定参照。因而,基于我国档案馆数据转型的需求和发展现状,两个维度的数据转型行动可启示以下方面的探索空间。

1.提升数据转型认知。如何提升数据转型认知以实现档案馆对人类世界数据化进程的跟进、同步甚至引领。档案馆在数字技术发展过程中持续演进,从数字化再到数据化的沿革本质上受社会前行而驱动,基于档案网站、数字档案馆、云计算、社交媒体、区块链、人工智能等升级档案馆职能以及相应的业务活动。然而,尽管数字档案馆建设成绩斐然,但对比图书馆、博物馆等相近领域,同技术前沿的跟进程度相对滞后。例如,Web2.0在2010年之前就成为图书馆建设形态2.0的重要支持,而档案馆在2012年左右提到的社交媒体或后续的“互联网+”战略中才有明确的设想。因而,为更快意识到数据转型的契机与重要性,提升数据转型认知是档案馆优质发展的前提。

提升数据转型认知的要点不在于认知本身,而是发现数据转型背后的驱动力与驱动表现,这就意味着档案馆应注重挖掘社会、文化、技术、管理等维度的历史脉络与面向未来的发展趋向。由此,才可发现数据转型在中国处于怎样的战略定位和表现要点,从而能够深刻理解:中国的数据转型有哪些空间,档案馆参与的必要性、紧迫性与潜在效应,档案馆对应这些空间有哪些作用阵地。由此,档案馆的数据转型认知可从意识层深化至可作为的行动布局层。

2.守正档案馆本质定位。数据转型的支点在于档案馆基于自我认识与外界认知结合而成的综合定位,因而明确档案馆的职能与业务活动是数据转型得以分析与落实的基础。一方面,重新定位需要得到认可。在国家治理体系现代化的建设框架下,我国档案事业正迎来多样化的发展契机与挑战,作为主体的档案馆处于重新定位、设计、规划、行动实践中,以期对照人类世界需求完成优质转型。《档案法》修订呈现的数据正纳入档案范畴,机构改革中档案馆寻求新定位而数据相关机构正在各地崛起,使得档案馆在数据化洪流中遍布契机与挑战,这样的冲突中,档案馆本质定位是否要变与变什么均需探索。例如,地方层面的档案馆同当前设立的数据管理机构为什么关系,档案馆如要确保数据资源长期保存的权属要如何拓展职能并反映于政策中。

3.升级数据层管理行动。依托数字档案馆建设,档案馆的数据管理行动得以全面展开。然而,数字档案馆仅是数据转型的起点或是基础维度,除深化数字档案馆建设外,落定于数据层从数据对象出发更新认知、方法论和相应的能力要求更需要综合的升级,要从社会、文化、技术等方面理解数据和数据管理,并映射于档案馆各要素的数据转型中。当前,技术维度强化人才的智力支持是落实数据层管理行动不可或缺的途径,因而各类数据相关技术的钻研与适度应用应是档案馆的常规活动,例如当前将区块链应用于归档数据的可信保存是热点议题。

同时,技术维度之外从社会与文化层认知数据以及带来的管理方法论革新,是破除技术决定论的关键。数据转型不只是将数据纳入档案馆的管理范畴,且并非仅将技术用于档案馆的工具包装中,而是要认识数据与数据管理是否要求档案馆重新认识管理对象、服务对象、管理办法、主体架构、流程机制等,从而实现深层管理行动的整体规划。例如,数据量急剧增大意味着档案馆要扩充社会力量的参与,主体架构的调整绝非仅是口号式地提出多元主体的纳入,而是对协作层级、关系、边界、具体权责、平衡协议等均要有细致考量并设定于具体行动中。

另一方面,档案馆的不变也应得到确认,即无论档案范畴如何变化,档案馆作为不可或缺的公共文化事业单位,是守护党政机构信息资产和社会文化遗产的关键主体,是信息领域的重要践行者。于档案馆而言,明确的内涵界定是能在数据转型大潮中得以孵化生长的所在,从而确保我国档案事业精准耦合我国乃至全球发展趋势,并在其中逐渐拓展档案事业领地、提升业务水平,以此成为信息产业升级与社会治理能力建设的重要力量。

4.拓展数据治理能力。数据治理能力构建是数据转型的综合体现,于我国档案馆而言,就是在优化管理能力的基础上依托数据实现向治理层的升级。数据化的进程使得数据管理不限于微观行动,而是要从组织架构、规范等角度要求建立覆盖各主体、活动、流程、领域的规则体系,即多元主体协同的顶层设计、制度框架和标准规范集成体。因而,档案馆在我国不应只是要做好数据保管与利用等具体的管理性工作,而是要积极成为数据管理规则的制定参与方。这要求档案馆对数据管理的利益相关者、数据管理的内外要素、数据管理的要求等均有整体格局设计与把握,参与甚至引领整个规则体系的统筹和规划,从而提高自身能力要求。

同時,档案馆能在数据治理中获得话语权的前提应得到明确,即档案馆作为可信管理的专业机构亦是部分重要数据资源的保管与提供利用方,这需要档案馆协同权力机关在档案的政策法规中明确表示。例如《档案法》修订案中,对档案的定义尽管提出了将数据纳入,但其表述以及新增的档案信息化的篇章应对数据化有更显性的表达。由此,档案馆才可作为数据资源的权属方与专业管理者参与治理层的构建,匹配形成相应的治理能力。

总言之,数据化浪潮正为档案馆带来从技术工具到司法行政、再到社会文化等多方面的转型驱动。机遇与挑战并存的背景下,本文以NARA与NAA的实践从认知、行动、定位、能力等方面为我国档案馆的数据转型提供了方向性策略。同时,相关问题有待系统与深入的探究,以形成更具指导性的理论、方法与实践方案。

参考文献

[1]安小米等.大数据治理体系:核心概念、动议及其实现路径分析[J]. 情报资料工作,2018(1):6-11.

[2]杨来青.大数据背景下档案信息资源挖掘策略与方法研究[J]. 中国档案,2018(8):60-61.

[3]赵跃.大数据时代档案数据化的前景展望:意义与困境[J]. 档案学研究,2019(5):52-60.

[4]徐拥军,张臻,任琼辉.国家大数据战略背景下档案部门与数据管理部门的职能关系[J/OL].图书情报工作:1-9[2019-12-18].https://doi.org/10.13266/j.issn.0252-3116.2019.18.001.

[5]刘越男.大数据政策背景下政务文件归档面临的挑战[J]. 档案学研究,2018(2):107-114.

[6]陈展. 档案数据开放推进路径探略[J]. 浙江档案,2019(1):20-22.

[7]NARA.Open Government Plan Version 4.0[EB/OL].2020-02-03.https://usnationalarchives.github.io/opengovplan/

[8]NAA.Data governance and management[EB/OL]. 2020-01-31 https://www.naa.gov.au/information-management/building-interoperability/interoperability-development-phases/data-governance-and-management.

猜你喜欢

转型策略档案馆
河北省档案馆馆(省方志办)藏《永壁村保甲册》鉴赏
关于智慧档案馆与数字档案馆的关系探讨
新时期我国商业银行转型发展研究
新时期高校继续教育转型发展探析
从“澎湃新闻”上线的成功看中国传统媒体转型的策略
“互联网+”时代广电媒体面临的困境与转型
大连国际环保展绿色营销的可持续发展分析
when与while档案馆
北京市第三届“档案馆日”活动预告
科隆档案馆突然坍塌