APP下载

云计算背景下档案管理研究现状

2020-07-04李毅强郑川

兰台内外 2020年13期
关键词:文献计量研究现状云计算

李毅强 郑川

摘 要:本文以NoteExpress为分析工具,对中国知网中云计算档案管理相关论文进行计量分析,对该领域的发文时间及数量分布、核心作者、主要研究机构和来源期刊进行统计分析,通过阅读文献摘要和正文的方式对论文研究主题进行分类,并从理论研究和实践应用两方面概要介绍了主要研究成果,为推动云计算在档案行业的运用提供支持。

关键词:档案管理;云计算;文献计量;研究现状

引言

随着现代信息技术的飞速发展,社交网络、信息系统、电子商务等数字业态的互联网应用迅猛扩张,传统的本地化计算机软硬件管理模为应对每天大量新增的数据存储和运算需求,维护成本水涨船高。为解决这一问题,亚马逊、谷歌等头部互联网公司于2006年提出了“云计算”的技术构想,将运算能力、存储设备、应用程序等建设成可以随时按需访问的互联网基础设施,为用户提供付费计算机资源化服务。随后云计算模式得到学术界和产业界的广泛关注与认可,云计算模型、算法、应用、性能优化等相关问题攻克,目前已有Amazon、IBM、 Google、华为、Microsoft、阿里巴巴、Sun等一大批云计算厂商为社会提供云计算服务,一些企业和机构选择自建云计算资源对单位内部提供相关云服务。为了解档案行业对云计算技术的结合运用情况,对该领域相关文献进行计量分析,分析云计算背景下的档案管理研究现状,为推动云计算在档案行业的运用提供支持。

一、数据来源和研究方法

1.数据来源

以中国知网CNKI为数据来源,在NoteExpress中通过“在线检索”功能选择“CNKI中国知网”,检索数据库=总库,检索条件为:主题=档案 and 云计算(精确匹配);发表时间=不限;文献来源=不限,检索时间为2020年1月10日,检索得到文献题录898条。通过批量获取和下载全文功能分别下载所得题录和对应文献全文,再逐篇阅读文献摘要进行数据清洗,剔除重复题录51篇、新闻资讯12篇、期刊要览5篇、内容无关文献15篇、访谈稿3篇,最终得到812篇云计算档案管理相关文献。

2.研究方法

采用文献计量法和内容分析法结合的方法对云计算档案管理相关论文进行分析。文献计量法是运用数学与统计学方法描述、评价和预测科技文献的外部特征进而推断科学技术现状与发展趋势的定量分析方法,文献计量工具使用文献管理软件NoteExpress和电子表格软件Microsoft Excel。内容分析法是社会科学研究中普遍使用的以文献内容为对象进行客观、系统描述的研究方法,可分别从定性和定量两方面对文献所包含的内容进行加工和处理。

二、云计算档案管理文献计量分析

1.发文时间计量分析

论文发文量是科学研究成果的基本指标,将文献数量按发文时间的分布,可以直观地体现某领域科研的发展情况和研究热度。使用NoteExpress的文件夹信息统计功能对812篇文献的发文年度进行统计,统计结果导入Microsoft Excel绘制发文时间及数量分布曲线如图1所示。

使用二次函数对该曲线进行回归分析,得到趋势线y=2.3462x2+38.345x-48.327, R2=0.8946,我国云计算档案管理研究始于2009年前后,2009年至2014年该领域研究快速发展,年发文量从3篇稳步增长至117篇,2015年至2019年间研究热度趋于稳定并略有下降,年均发文量在100篇左右。总体上看,档案行业对云计算技术的研究热度与云计算技术的成熟与工业应用呈正相关。

2.文献作者计量分析

使用NoteExpress的数据及分词管理器对云计算档案管理相关文献的发文作者进行统计,812篇论文共有作者998人。由普耐斯定律知,发文数量≥的作者为核心作者,单个作者发文量最大为=9篇,故发文量3篇及以上的作者为该领域的核心作者。核心作者共29人,占作者总人数的2.91%,核心作者总发文数量为108篇,占总发文量的13.30%,绘制作者发文数量词频云图如图2所示。距普耐斯定律所述“半数论文由核心作者所撰写,核心作者数量约等于全部作者总数的平方根”有较大差距。说明在档案行业还未形成有效的关注云计算的核心作者群。

3.研究机构计量分析

直接统计文献的署名单位共有652个单位,由于论文署名常为作者所在单位的具体部门,直接统计会有很大误差,故对署名机构进行预处理:署名单位统一以一级单位名进行统计,合著论文只取通讯作者所在单位。处理之后得到发文量5篇及以上的机构如表1所示。可见高等学校是云计算档案管理研究的主要机构,档案局等档案行政管理机构也在一定程度上参与该领域科学研究。

4.来源期刊计量分析

812篇云计算档案管理论文中有学位论文102篇,其余为期刊论文,对710篇期刊论文进行来源分析。使用NoteExpress的数据及分词管理器对“来源”进行统计,发现这些论文分布在210种刊物上,其中载文量8篇以上的期刊如表2所示。根据布拉德福定律对期刊的分类,核心区、相关区和非相关区三类期刊的发文量占总发文量的三分之一,故表2中排名前7的期刊为云计算档案管理领域的核心区期刊,其中《档案学研究》、《中国档案》和《档案管理》为北大中文核心期刊。

三、云计算档案管理文献内容分析

通过阅读文献摘要和正文的方式分析文献研究内容,对文献研究的主题进行分类,总体上云计算档案管理论文研究主题可分为理论研究类和实践应用类,理论研究类涉及数字档案资源云存储、档案信息云共享利用、云环境下档案信息安全、档案云系统构架研究等,实践应用类主要介绍各类档案系统基于云技术构架的具体应用与经验介绍。

1.云计算档案管理理论研究

刘伟谦和李华莹研究了云计算在档案馆信息化过程中的三种运用模式,分别分析了这些模式的优缺点,并提出档案云服务平台应在国家主导下提供服务。高晨翔和黄新荣梳理了云计算环境下数字档案馆各构成要素的安全性,建立了包括信息系统安全要素、数字档案安全要素、云计算技术安全要素、法律法规制度要素、管理控制安全要素、组织内部支持要素以及目标与反馈要素在内的云数字档案馆安全评估指标体系。赵彦昌和毛丽敏讨论了“互联网+”背景下云技术对档案收集、档案工作宣传、档案信息整合与共享、數字档案利用带来的变革与完善。程妍妍对开放档案信息系统模型在云环境下应用的局限性进行了分析,建立数字档案馆的功能结构模型,并采用层次化、模块化方法提出了基于OAIS的新型云数字档案馆功能结构模型。牛力和韩小汀通过引入“云计算”技术解决档案信息资源共享服务中存在的问题,设计了基于“支撑云”、“业务云”和“公共云”的三层次档案云服务平台, 并提出了一种档案信息资源整合与服务模式。

2.云计算档案管理实践应用

薛四新、陶水龙和崔伟以北京市区域性数字档案馆为例,从云计算重组IT应用模式出发,结合数字档案馆建设的重点难点指出了我国数字档案馆区域性集约化建设的发展趋势。杨茜雅介绍了中国联通公司基于云技术建设全国性数字档案馆的思路和方案。刘振鹏、王坤瑞、卞昭玲等人以区域电子健康档案为例,从业务需求和技术需求两方面对基于云计算的电子健康档案系统进行了详细分析。祁天娇和刘越男介绍了基于微服务技术架构以及云服务等新技术而建设的美国国家档案与文件署的电子文件档案馆(ERA)项目,阐述了该项目的建设背景、目标、过程和成果,总结了项目进行的经验,为我国数字档案馆建设提供借鉴。

四、总结

笔者以中国知网为数据来源,以“档案”和“云计算”为检索主题,通过检查策略调整、数据清洗等多种方法和过程,最终得到了也主题高度相关的文献812篇。运用NoteExpress为分析工具进行文献计量分析,再采用文献计量法和内容分析相结合的方法对文献内容进行分析,用管理软件NoteExpress和Excel进行处理。

通过对中国知网中“云计算档案管理”相关论文进行计量分析,对该领域的发文时间进行年度统计,并使用二次函数进行回归分析,现发我国云计算档案研究始于2009年前后,2014年达到峰值,从2009年起的十年间,以2014年为分界点,我国云计算档案管理研究经历了快速发展和稳中略降的发展趋势,总体上档案行业对云计算技术的研究与云计算技术的发展呈正相关。

通过对文献作者进行分析,发现核心作者29人,占总发文量的13.30%。距普耐斯定律的结论有较大差距,说明在档案行业还未形成有效的关注云计算的核心作者群。在对研究机构进行计量分析时看到,高等学校是云计算档案管理研究的主要机构,档案局等档案行政管理机构也在一定程度上参与该领域科学研究。在对来源期刊计量分析时,发现核心期刊的载文量并不高。

通过阅读文献摘要和正文的方式对论文研究主题进行分类,并从理论研究和实践应用两方面概要介绍了主要研究成果,为推动云计算在档案行业的运用提供支持。云计算档案管理的理论研究和实践应用研究均取得了一批重要的研究成果。

参考文献:

[1]罗军舟,金嘉晖,宋爱波,东 方.云计算:体系架构与关键技术[J].通信学报,2011

[2]张建勋,古志民,郑 超.云计算研究进展综述[J].计算机应用研究,2010

[3]朱 亮,孟宪学.文献计量法与内容分析法比较研究[J].图书馆工作与研究,2013

[4]马文峰.试析内容分析法在社科情报学中的应用[J].情报科学,2000

[5]徐 泉,王良勇,刘长鑫.工业云应用与技术综述[J].计算机集成制造系统,2018

[6]姚雪,徐川平,李 杰,冯 甜,舒安琴.基于普赖斯定律和二八定律及在线投稿系统构建某科技期刊核心作者用户库[J].编辑学报,2017

[7]赵 隽.基于布拉德福定律区域法的学术论文分布研究[J].现代情报,2007

[8]刘伟谦,李华莹.云计算在档案馆中的应用模式初探[J].档案学研究,2012

[9]高晨翔,黄新荣.云计算环境下数字档案馆的安全评估体系研究[J].档案学研究,2017

[10]赵彦昌,毛丽敏.“互聯网+”环境下档案信息资源建设若干问题研究[J].档案学研究,2017

[11]程妍妍.基于OAIS的云数字档案馆功能结构模型研究[J].档案学研究,2019

[12]牛 力,韩小汀.云计算环境下的档案信息资源整合与服务模式研究[J].档案学研究,2013

[13]薛四新,陶水龙,崔 伟.数字档案馆云计算建设模式的思考——以北京市区域性数字档案馆为例[J].档案学研究,2012

[14]杨茜雅.中国联通全国性数字档案馆建设实践的理性思考[J].档案学研究,2014

(作者单位:1湖南大学档案馆;

2中南大学档案技术研究所)

基金项目:湖南省教育科学“十三五”规划专项课题(PZ194099) 《档案数据挖掘在高校助学金评定中的应用研究》研究成果之一。

作者简介:李毅强(1975-),男,湖南长沙人,软件工程硕士,工程师,研究方向:档案信息化。

猜你喜欢

文献计量研究现状云计算
我国医学数字图书馆研究的文献计量分析
国内外智库研究态势知识图谱对比分析
国内外政府信息公开研究的脉络、流派与趋势
基于文献计量分析我国生物科学素养研究状况(2001~2016年)
我国环境会计研究回顾与展望
基于云计算的移动学习平台的设计
浅析电力系统谐波及其研究现状
实验云:理论教学与实验教学深度融合的助推器
创新人才培养理论研究现状及未来研究方向
云计算中的存储虚拟化技术应用