APP下载

基于数据分析的新一代数字信息技术档案应用研究趋势与方向

2020-09-26董守霞

河南图书馆学刊 2020年8期
关键词:数字信息档案趋势

董守霞

摘 要:文章简述了档案界新一代信息技术应用研究概况,分析了档案界新一代信息技术研究中大数据、区块链、云计算、物联网、人工智能等单项研究的情况,以期为档案界更好地进行新一代信息技术研究提供借鉴。

中图分类号:G250文献标识码:A文章编号:1003-1588(2020)08-0082-03

关键词:数字信息;信息技术;档案;应用研究;趋势

新一代信息技术是国务院确定的七个战略性新兴产业之一。以移动互联网、云计算、物联网、大数据等为代表的新一代信息技术,正在推动全社会各领域的深刻变革[1]。新一代信息技术的发展使档案形态在数字化基础上进一步实现了智能互联[2]。近年来,档案界在大数据、区块链、云计算、物联网、人工智能等领域的研究日渐升温。

1 档案界新一代信息技术应用研究概况

笔者以中国知网为数据样本来源,以“档案”“大数据”“区块链”“云计算”“物联网”“人工智能”等为检索词进行精确匹配,检索时间为2020年5月20日,时间跨度为18年,共获得相关文献2,888篇。2003—2020年档案界新一代信息技术研究的发文趋势详见图1,其中2020年的发文数量仅统计到5月20日。

图1显示,档案界新一代信息技术应用研究始于2003年,截至目前大致经历了三个阶段,总体呈前慢后快的态势。2003—2009年为第一阶段,该阶段每年发表的相关文献为一位数,共发文16篇,年均2篇;2010—2013年为第二阶段,该阶段每年发表的相关文献从一位数上升到两位数,数量增长明显,共发表文献138篇,是第一阶段的8.6倍,年均35篇;2014年至2020年5月20日为第三阶段,该阶段每年发表的相关文献从两位数上升到了三位数,发文数量大幅增加,持续高速增长,共发表文献2,734篇,年均420篇(2020年按6个月算)。

2 档案界新一代信息技术研究各单项情况分析

大数据、区块链、云计算、物联网、人工智能等是档案界新一代信息技术研究文献中的五大内容,各内容在整体研究中所占的比重,以及研究起步时间、研究规模、发文数量等都存在较大差异。

2.1 各项研究内容占比情况

笔者将大数据、区块链、云计算、物联网、人工智能等关键词分别与档案组成检索词组进行检索,共获得2,913篇相关文献,与前文的2,888篇文献相差25篇,因为文章题目同时涉及两个检索词,考虑到研究的交叉性,因此没有进行剔除。笔者对2,913篇文献进行分析整理后发现,大数据的研究规模最大,共发表相关文献2,300篇,占比78.96%,排第一位;云计算研究共发文315篇,占比10.81%,排第二位;区块链研究共发文121篇,占比4.15%,排第三位;物联网研究发表108篇,占比3.70%,排第四位;人工智能研究发文69篇,占比2.37%,排在最后,详见下页图2。

2.2 各项研究内容年度分布情况

笔者按文献发表时间、文献总量大小以及文献发表的持续性等对2003—2020年档案界新一代信息技术单项研究文献的年度分布进行了统计,见表1。表1显示,大数据研究的相关文献发表时间最早,数量最多,持续性较好;人工智能研究文献的发表时间与大数据研究文献相同,但其发文总量和持续性与大数据研究文献相比存在较大差距;云计算研究和物联网研究同时起步于2009年,持续性好,但云计算研究文献的发文总量比物联网研究文献高出近三倍;区块链研究虽然起步晚、总量小,但持续性好。

在5个单项研究内容中,大数据、人工智能、云计算、物联网等4项研究均起步于2010年前,起步阶段研究规模较小,增速缓慢。自2010年起,大数据、人工智能、云计算、物联网等4项研究出现起伏变化,其中大数据研究自2013年开始明显高于其他3项研究的增速发展,其中云计算研究呈快速平稳发展,人工智能研究和物联网研究虽然有所上升,但幅度和规模始终有限。2016年开始的区块链研究起步晚,增速快,但与大数据相比不在一个数量级上。由此可见,大数据研究在档案界新一代信息技术应用研究中居首要位置。

2.3 各项研究内容交叉研究情况

在本次研究的2,913篇样本文献中,有25篇文献的研究主题涉及两项研究内容,属于新一代信息技术应用研究中的交叉研究,占全部样本文献的0.85%。其中,大数据研究与云计算研究交叉的文献有14篇,大数据研究与物联网研究交叉的有6篇,大数据研究与区块链研究交叉的有1篇,大数据研究与人工智能研究交叉的有1篇,云计算研究与物联网研究交叉的有2篇,区块链研究与物联网研究交叉的有1篇。大数据与其他4项内容均有交叉研究,交叉率最高;物联网与云计算、区块链有交叉研究,交叉率排第二。由此可见,档案界新一代技术研究内容主要集中在大数据和物联网领域。

3 基于网络的档案界新一代信息技术应用研究重点分析

当前,档案界新一代信息技术应用研究以“大数据”为核心群组,包括“大数据时代”“区块链技术”“大数据环境”“大数据背景”“物联网”等在内的高频关键词网络,网络构成紧密、向心性强。在“大数据”主群组中共涉及14个主要关键词,其中使用频率高的有“云计算”“管理”“档案”“高校”“信息化”“信息化建设”等关键词,距离近的有“创新”“管理”“档案”“信息化”等关键词,联系密切的有“管理”“档案”“人事档案”“高校”“信息化”等关键词,详见下页图3。在“大数据”核心聚类群组中,“大数据”的中心度最大,是整个群组的核心。中心度的大小是指在共现网络中通过该节点的任意最短路径的条数,是网络中心节点在整体网络中所起链接作用大小的度量,中心度越大,节点越能成为网络的中心关键節点[3]。此外,“管理”“云计算”“档案”“高校”“信息化”等关键词都处在相对中间的节点位置,并通过与群组中其他关键词的联系与其他非核心群组的关键词保持联系,起着中心单点的作用。

在“大数据时代”“大数据环境”“物联网”“大数据背景”“区块链技术”等5个关键词群组中,“大数据时代”“大数据环境”“物联网”处于“大数据”主群组的中间位置,虽然与主群组其他关键词有多头联系,但3个关键词之间并没有任何关联,这与上文所述的单项文献交叉研究占比情况相对应。此外,“大数据背景”“区块链技术”2个关键词虽然与主群组有联系,但远离主群组,与核心关键词“大数据”没有直接关联,虽然不是当前研究的重点,但日后有可能成为研究热点。

4 档案界新一代数字信息技术应用研究方向分析

综上所述,当前档案界新一代数字信息技术应用研究呈现大数据一枝独秀的趋势,无论是与之同时起步的人工智能研究,还是后来的云计算研究、物联网研究、区块链研究等的体量规模和增速都无法与其相比,从这个意义上讲,档案界新一代信息技术应用研究就是大数据研究。因此,大数据是档案界新一代信息技术产业的强劲推动力[4]。此外,笔者还发现,档案界新一代信息技术应用研究中的人工智能研究虽然起步较早,但并没有出现在关键词共现网络图中,究其原因是其研究体量偏小,在档案界新一代信息技术的整体应用研究中占比较小。由此可见,档案界在进行新一代信息技术应用研究时应向综合性及复合性方向发展,避免偏重单一技术应用,可在档案工作全流程信息化过程中综合应用新一代信息技术,将不同技术应用到最适合的地方,发挥其最大的效能。

参考文献:

[1] 杨现民,李冀红.创客教育的价值潜能及其争议[J].现代远程教育研究,2015(2):23-34.

[2] 魏大威,李春明,温泉,等.万物互联背景下我国公共图书馆新业态发展思考[J].中国图书馆学报,2014(6):22-32.

[3] 武永强,康誉昌,马宗鹏.运用生物力学方法研究老年人运动行为的前沿与热点:基于CiteSpace知识图谱的可视化研究[J].体育世界(学术版),2019(9):1-2.

[4] 程学旗,靳小龙,王元卓,等.大数据系统和分析技术综述[J].软件学报,2014(9):1889-1908.

(编校:徐黎娟)

猜你喜欢

数字信息档案趋势
趋势
初秋唇妆趋势
中国传染病十年新趋势
基于云平台的数据储存与文件管理研究
档案的开发利用在供电公司全面管理中的作用
浅谈北京卫视《档案》的叙述方式
新常态下高校档案工作发展研究
数字信息对图书馆馆藏结构的影响
智慧交易系统趋势攻略之一:趋势线
高校学籍档案信息化管理研究