APP下载

2000—2020年国内档案数据化研究可视化分析

2022-01-04王亦曼张朝晖

资源信息与工程 2021年6期
关键词:文献档案管理信息化

王亦曼, 张朝晖, 向 禹,,3

(1.中南大学 生物医学信息系,湖南 长沙 410013;2.中南大学 档案技术研究所,湖南 长沙 410083;3.中国人民大学 档案事业发展研究中心,北京 100872)

0 引言

大数据时代,随着物联网、人工智能、区块链等技术的兴起,档案管理部门面临着工作对象及工作环境的双重变化。飞速增长的档案数据资源与新兴发展的大数据技术,迫使我们探寻新的档案管理模式,档案数据化也因此成为档案学界新的研究热点。有学者从档案数字化发展的新阶段出发,认为“档案数据化”是档案部门以用户、业务需要为导向,将数字档案资源转换为可阅读、分析和处理的档案数据资源的过程[1];还有学者从档案信息价值的实现出发,认为档案信息与档案载体以数据化表达形成分离,从而实现档案信息的确定性、独立性以及可交换性[2]。无论其内涵如何,档案数据化对大数据时代档案工作的转型与发展有着重要意义,促进档案信息资源的深度开发、创新档案服务模式、优化档案管理流程等。

本文从“档案数据化”研究的时间、主题、作者、机构、学科出发,对我国近20年(2000—2020)的“档案数据化”主题研究进行总结和分析,试图探究不同时期“档案数据化”主题研究的内容与特征变化,为相关研究的深化和拓展提供参考。

1 文献分布情况

文章以主题为检索字段、以“档案AND数据化”为检索式,限制时间范围“2000-01-01”至“2020-11-21”,在中国知网进行精确检索,共检索出有效文献351篇。以下按文献发表的时间、主题、作者、机构、学科对这351篇文献进行统计分析。

1.1 文献时间分布

图1为“档案数据化”主题文献的发表年度趋势图。我国“档案数据化”主题研究从年度发文量上大致可分为三个阶段。第一阶段为平稳低发时期,即2000—2006年;第二阶段为曲折缓增时期,即2007—2012年;第三阶段为爆炸增长时期,即2013—2020年。其中以2012年为转折点,“档案数据化”主题文献数量从平缓的线性增长转变为陡峭的指数型增长,且在2019年达到巅峰值。结合当时档案学界研究背景,不难发现造成此现象的原因。1992年,学者冯惠玲在《档案工作现代化的重大课题——论档案计算机检索的数据准备》中提出“计算机环境下与档案相关的数据内容”,率先提出“档案数据”这一概念[3],标志着档案学领域开拓了新的研究内容。2007年,随着信息化建设的大力实施,开始涌现“数字化”“数据化”等概念,“档案数据化”独立于档案,进一步成为档案学领域研究的热门主题。2012年,学者涂子沛著述的《大数据》率先将国外提出的“Big Data”概念引入中国,对包括档案学在内的各类学科产生了深远影响,引发了档案学界对“大数据时代”、“大数据技术”与“档案数据化”等概念的火热讨论,使得“档案数据化”相关文章数量显著上升。2018—2019年,随着全国范围内信息化的实施,大数据技术的进一步发展,档案学界掀起了档案数据化研究的热潮,将档案数据化与档案信息资源建设、档案管理等主题结合进行探讨,且研究热度至今仍居高不下。

图1 “档案数据化”主题文献的发表年度趋势图

1.2 文献主题分布

将检索到的文献生成题录信息导入sati文献题录信息统计工具,生成了如图2所示的关键词频次时间序列。图中的频次是指文献中该词条的在某年出现的次数,反映了我国2000—2020年档案数据化研究的热点。档案数据化的主题分布也大致可以分为三个阶段。第一阶段是2000—2006年,此阶段档案数据化研究主题较为单一,关键词频次低,研究热点主要为档案数据、数据化、信息化、人事档案。第二阶段是2007—2011年,此阶段研究主题明显增多,关键词频次增高,研究热点主要为人事档案、人事档案管理、档案管理、信息化。第三阶段为2012—2020年,此阶段研究主题数量大幅增加,关键词频次爆炸式上升,大数据、大数据时代、数据化、档案管理成为研究热点,“档案数据化”主题研究呈现以大数据、档案管理研究为主全面发展的局面。

图2 “档案数据化”主题文献的关键词频次时间序列图

1.3 作者与机构分布

图3、图4分别为“档案数据化”主题文献作者分布图、“档案数据化”主题文献机构分布图。“档案数据化”研究高频发文作者有杨来青、于英香、郭怀珍、庞宇飞等人;领先发文机构有上海大学图书情报档案系、青岛市档案局、云南大学历史与档案学院、安徽大学管理学院、中国人民大学信息资源管理学院等。结合作者及机构分布,“档案数据化”研究领先发文作者为隶属青岛市档案局的杨来青、上海大学图书情报档案学院的于英香以及中国人民大学信息资源管理学院的钱毅。

图3 “档案数据化”主题文献作者分布图

图4 “档案数据化”主题文献机构分布图

1.4 学科分布

图5为2000—2020年“档案数据化”主题研究所涉及的学科。显而易见,档案及博物馆、计算机软件及计算机应用、高等教育、医药卫生方针政策与法规、宏观经济管理与可持续发展、企业经济是与该主题研究高度相关的学科。其中档案馆及博物馆占据着主导地位,其次是计算机软件及计算机应用科学。这是因为“档案数据化”研究属于档案学领域的研究方向,且在大数据技术发展的影响下,该主题研究与计算机科学密不可分;此外,研究涉及大量高校档案、企业档案和医疗卫生档案,因而又与高等教育、医药卫生方针政策与法规、企业经济学科息息相关。

图5 “档案数据化”主题文献学科分布图

2 “档案数据化”研究的内容与特征

以上从文献发表的时间、主题、作者、机构、学科方面对2000—2020年我国“档案数据化”研究的文献分布情况进行了简单的统计和分析,并根据文献发表的年度趋势及研究主题的发展变化将档案数据化的研究划分为三个阶段。在具体的内容述评中,本文将以技术环境的变化为主线,仍以上文中划分的三个阶段来探究不同技术环境下“档案数据化”研究的内容与特征。

2.1 档案工作自动化与档案信息化初步发展阶段(2000—2006)

20世纪90年代以后,计算机技术在各个行业的应用不断推广,如何利用计算机技术开展档案管理工作以及使用计算机和信息系统所产生的档案相关数据,成为当时档案工作亟待解决的问题。2001年,全国档案工作报告中首次明确提出了档案信息化建设的任务,随后国家档案局制订并发布了《全国档案信息化建设实施纲要》,对档案信息化建设作了系统部署,明确了档案信息化建设的主要内容和发展方向,并成立档案信息化领导小组,将档案信息化纳入地区信息化和电子政务建设的整体框架[4]。将这一时期的“档案数据化”主题文献生成题录信息导入sati文献题录信息统计工具,生成了如图6所示的关键词知识图谱。由图6可知,这一时期的“档案数据化”主题研究主要与档案管理、档案数据与信息化的前期准备工作有关,具体内容可以分为计算机技术管理档案工作与档案信息化建设的初步探讨两个方面。

图6 2000—2007年“档案数据化”主题文献关键词知识图谱

2.1.1 计算机技术管理档案工作

该研究方向主要针对档案工作自动化与信息化环境下管理工作的变化问题,通过档案管理流程中数据管理活动的模式革新与形式变化,对档案的著录、标引等档案工作环节进行革新优化。张彦静针对网络环境下档案馆工作提出,档案馆实现网络化就必须要实现档案工作的标准化、数据化、整体化和共享化,档案工作者的思想也需要改变[5]。王文芳认为计算机技术应用于档案管理工作的重要环节是档案的前处理工作,即将档案由案卷化向数据化转化,主要指包括档案的著录与标引等档案数据的准备工作[6]。

2.1.2 档案信息化建设的初步探讨

2003—2006年“档案数据化”研究向档案信息化建设方向发展,这一时期的研究基于各类档案,探讨不同类型档案的信息化建设方向。方刚、高雅玲、谭丽珍与杨青英等分别针对工程档案、水利档案与人事档案,提出建立专项档案信息化系统,推进档案现代化管理。

2.2 档案信息化进一步发展阶段(2007—2011)

图7为2007—2011年“档案数据化”主题文献关键词知识图谱。此阶段的档案数据化主题研究广度和深度都不断提升,档案管理、信息化、数据化仍是主要研究内容,此外关于人事档案、现代化管理的档案数据化研究显著增多。由于此阶段计算机技术及信息管理系统的广泛应用,加快了档案管理工作自动化及纸质档案的数字化进程,因而这一阶段的“档案数据化研究”针对的档案种类更多,关于档案信息管理系统的探讨也更为深入、全面,具体可以划分为以下三个主题:

图7 2007—2011年“档案数据化”主题文献关键词知识图谱

2.2.1 档案信息管理系统研究

这一时期的档案信息管理系统研究针对更加多样化的档案种类,对档案信息管理系统的探讨也更加深入。程璇、田冬梅及陈小红等分别针对医院科技档案、地质档案资料与高校人事档案,探讨如何确保档案数据的完整和安全,使档案发挥最大的效用。冯九龙在分析档案信息化建设中安全问题的基础上,从促进网络安全、开发先进技术、提高人员素质三个方面对档案信息化建设中的安全工作提出了建议[7]。

2.2.2 档案信息资源的开发与应用

档案信息资源的开发与应用在这一阶段的研究主题中具有重要价值,“档案数据化”的研究内容不再局限于档案信息资源的著录与格式转换,开始探求开发利用、开放与共享的有效途径。沈艺认为开发利用档案信息资源是档案工作的根本目标,只有通过档案信息资源的开发利用,其作用和价值才能得到充分体现[8]。曾予新基于城建系统的档案和信息资源,分析其特点及信息数字化和归属现状,提出要构建城市建设档案和信息数字化框架,从而实现城市建设档案和信息资源共享[9]。

2.2.3 档案中介机构新发展

此外,这一阶段的研究还涌现了新的档案管理机构——档案中介机构,随着档案信息化的发展,档案管理对象的转变促使市场和业务领域发生了转变。欧其健以创新理念为基础,对档案中介服务的领域进行分析研究,寻求符合档案中介机构发展的市场领域,进一步壮大档案事业[10]。刘秀芬则认为档案中介服务机构在立足基本服务的同时,要与时俱进,不断拓展业务领域,提高竞争力,并分析了档案中介服务开展过程中需注意的一些问题[11]。

2.3 档案大数据时代(2012—2020)

图8为2012—2020年“档案数据化”主题文献关键词知识图谱。结合图1、图8可知,“档案数据化”主题研究在大数据时代迅猛发展,主题文献数量与质量均达到巅峰,大数据、档案管理、数据化成为此阶段的主要研究内容。这是由于此阶段云计算、人工智能、物联网等新兴技术的应用与发展对档案管理工作的模式、对象都产生了深刻影响。此阶段的研究大多以“大数据时代”“大数据技术”为立足点,对“档案数据化”的具体内涵及实践应用开展进一步的研究。

图8 2012—2020年“档案数据化”主题文献关键词知识图谱

2.3.1 “档案数据化”理论研究

于英香通过解析档案大数据研究中概念的误读,指出大数据具有实时动态性、决策预测性特征与档案信息的滞后静态性、证据解惑性特征的偏离,因而大数据背景下档案数字化不等同于档案数据化[12]。钱毅从档案信息形成技术环境的发展历程出发,阐述了不同技术环境下对应三态(模拟态、数字态、数据态)的特质、相关要素以及转换过程,认为狭义的数据化指的是针对数字化成果进行的数据著录、抽取与挂接工作,广义的数据化是要面对业务环境形成的各类专门的数据体[13]。随后,于英香与孙逊(2019)也基于技术变迁的角度对数据时代电子文件结构的数据化概念进行了探讨,认为数据时代电子文件结构的数据化是文件与数据的融合,即数据化的电子文件结构可以灵活转换为其他结构,且电子文件数据和对应的版式文档之间存在关联[14]。金波与添志鹏基于大数据背景,从存在粒度、开发方式和价值特性三个方面分析档案数据与传统档案的差异,提出档案数据是数据化的档案信息及具备档案性质的数据记录,具有广源性、共生与互生性、累积性、扩展性和易算性等新的特征[15]。

2.3.2 “档案数据化”实践研究

李斌从档案公共服务信息安全保障角度出发,认为档案数据化建设存在技术、新型信息安全漏洞、法律、实体档案侵权方面的挑战[16]。周丽滨针对高校基建档案,认为大数据时代需加强高校基建档案的物理安全保障和网络安全建设[17]。王协舟和王露露针对“互联网+”时代档案工作的发展理念、网络环境、工作对象、信息用户、媒体格局对档案数据的组织结构、开发模式、管理环节、服务方式、运营战略的挑战,提出了一系列有助于推动“互联网+”与档案工作深度融合和创新发展的对策[18]。任越和倪丽娟基于八所综合档案馆的具体数据资料,指出国内综合档案馆在档案信息资源方面存在着数字档案资源匮乏、数字化标准缺失、档案数据化关联程度不高与信息资源后续开发乏力等问题,并提出了相应的对策[19]。周枫和杨智勇则基于5W1H分析法对档案数据的管理进行研究,认为档案管理应以智慧、知识为基础,运用数据思维,从数据开始管理,通过数据驱动实现知识管理、智慧服务[20]。

3 述评与展望

综上所述,国内近20年“档案数据化”主题研究存在着以下特点:一是以技术环境为导向,研究逐步深入。在档案工作自动化和档案信息化初步发展阶段(2000—2003),“档案数据化”研究与计算机技术在档案管理工作中的应用以及建设档案信息化管理系统息息相关;在档案信息化进一步发展阶段(2007—2011),档案数据化的研究对象除人事档案管理之外,还包括医院科技档案、地质档案、房地产档案等各类档案,研究范围也向档案管理系统的信息安全、档案信息资源的开放与共享等方向拓展;在档案大数据时代(2012—2020),“档案数据化”研究依托“大数据技术”对档案数据化的具体内涵和实践应用进行研究。二是理论与实践研究发展不平衡。从数量上看,“档案数据化”的实践研究文献数量明显多于理论研究文献数量,但从文献被引次数上看,“档案数据化”的理论研究比实践研究影响更为深刻。三是研究作者与机构高度集中。由上文文献分布情况可知,“档案数据化”主题研究的领先作者及机构为上海大学图书情报档案学院的于英香以及人民大学信息资源管理学院的钱毅,这两位学者对“档案数据化”的内涵进行了深入解读,明确了“档案数据化”的具体内涵,正式划定了大数据时代档案学研究的新领域。四是学科交叉程度高。一直以来,“档案数据化”的研究与计算机科学、高等教育学等学科高度交叉,研究思路与研究方法也在不断丰富融合。

随着技术环境和价值认知的变化,国内近20年“档案数据化”主题研究逐步发展,尤其是自2012年引进国外“Big Data”即“大数据”的概念以来,“档案数据化”主题研究依托“大数据技术”、“大数据时代”等迅速发展。本文仅从中国知网这一数据库检索“档案数据化”主题文献,对主题文献的可视化分析主要从主题、时间角度出发,受限于检索范围和样本数量,仍有待于进一步全面、深层次地揭示其研究规律与特点。

猜你喜欢

文献档案管理信息化
关于企业档案管理体制改革的探讨
Hostile takeovers in China and Japan
月“睹”教育信息化
月“睹”教育信息化
月“睹”教育信息化
新形势下档案管理工作创新探析
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
“一核三轴”:信息化时代教学管理模式的探索
新农村建设形势下卫生院档案管理工作探讨
档案管理现代化中档案管理原理的运用分析