APP下载

试论基于大数据时代图书馆馆藏数字资源整合与存储策略

2020-11-17李爽

办公室业务·上半月 2020年10期
关键词:存储图书馆大数据

李爽

【摘要】图书馆从19世纪末就已经开始发展,一直到建国之后,图书馆体系才越来越完善,开始逐步普及全国。在如今公共服务和社会参与等新的图书馆管理理念的推动以及网络化和数字化的应用环境驱动下,图书馆体系正在面临一轮新的转变期,不断适应着现代数据互联网时代下的图书馆当前发展的主要方向。图书馆应当认识到如今存在的问题,根据大数据时代的要求,不断进行创新性发展,完成数字资源的整合与存储。接下来,本人就从介绍大数据背景下图书馆馆藏数字资源整合的必要性和数字存储的意义等方面入手,对大数据时代下图书馆馆藏数字资源整合与存储的策略进行简要分析。

【关键词】大数据;图书馆;数字资源整合;存储;策略

在大数据时代,对图书馆馆藏进行数字资源的整合,是信息组织自动化、动态化的需要,也是信息组织标准化、多模式的需要。图书馆馆藏实现数字资源的整合,有利于更大程度地实现资源共享,提高资源利用率。因此图书馆馆藏应该寻找科学的数字资源整合策略设计方案和存储体系。图书馆应该利用海量图书资源平台,使用大数据处理技术,高效地进行数据获取和整合,为用户提供更加优质的服务。

一、大数据背景下图书馆馆藏数字资源整合的必要性

(一)数字资源整合是信息组织自动化、动态化的需要。在信息技术不发达的时代,图书馆的各项操作都依靠人工完成,耗时耗力,并且出错率高。图书馆在整理资料时同样也使用人工手动的方式,工作人员需要对书籍资料进行标注、分类,并在整理过程中手动添加检索的关键词等书目的各项索引信息。这种传统的录入方式除了给图书管理增加工作量外,也不便于用户对所需信息的查找。如今,互联网技术、云计算技术、多媒体技术等技术产业的快速发展使得网络中可以存储大量资源,这也标志着我们进入了大数据时代。现在网络上许多数字资源都具有时效性,倘若如今我们还用人工的方式进行整理,那么将会延长用户使用资料的时间,造成资源的浪费。因此图书馆应该实现数字资源自动标注分类和整理,数字资源关键词自动化录入,这些都是图书馆当下的重点研究方向。现如今网上的数字资源数量大、种类多、构成成分比较复杂,人工整理的难度加大,这些非文本的资源整理是传统手工整理方式无法实现的。

(二)数字资源整合是信息组织的标准化、应用性的需要。因特网是一个结合多个网络的整合体结构,其中的数字资源分布是杂乱无序的。信息网络主要是以信息处理为主,并且可以进行海量存储,添加和整理的整合型网络结构。不同网络之间实现信息交流,也需要多方面的技术支持,所以要想整合网络资源,就要有信息整理和加工的标准。例如有统一的数据格式索引或者描述语言。在如今的大数据背景下,大部分人都可以接触到手机、平板以及电脑,都可以使用这些互联网终端工具在数字图书馆上进行操作,获取自己想要的资源。但需要注意的是,数字资源平台应该照顾到不同用户的操作水平参差不齐,在设计平台时,应该简洁明了,便于操作,使得所有的用户都能够检索到自己所需要的数字资源,提高平台的使用率,增强便民服务意识。

二、大数据背景下图书馆馆藏数字存储的意义

(一)为资源共享提供技术保障。在大数据背景下,仅仅利用现代化操作手段整合图书馆馆藏数字资源是不够的,还需要在整合资源之后用先进的信息处理技术来存储图书馆馆藏资源,其中珍贵的光盘以及文献制品等都需要重点存储维护。图书馆可以采用简易信息聚合技术、标签技术以及web2.0技术进行资源的存储。这些技术不仅具有技术成熟、应用面广、寿命长等优点,还可以对用户实行个性化的推送服务和检索服务,让用户更快地掌握书籍信息以及检索方式。基于上述的技术图书馆才能够加强与用户的交流,让用户有更多的机会加入信息交流中,并且能够实现个性化的信息资源服务。

(二)有利于提高文献资源的利用率。在图书馆馆藏中许多文献资源十分珍贵,有很多资源都绝无仅有,所以在面临众多用户需求的情况下,必须要实现资源的数字化。这样即可以满足读者的阅读需求,还可以较好的维护文献资源,提高资源利用率。除此之外,数字化资源可以较好地整合信息,如一本书有1000多页,在进行处理之后可以整理成六张平片存储。因此图书馆应该具备音像制品、微缩制品以及光盘管理和存储技术等现代科技资源,否则将无法进行数据化资料信息的整理,存储和共享。

三、大数据时代图书馆馆藏数字资源整合与存储的策略

(一)图书馆资源整合方案。在大数据背景下,图书馆数字资源的整合主要由大数据资源板块、资源过滤和解析板块、资源整合板块、资源整合系统反馈控制板块等组成。首先,在大数据资源层主要负责管理数据,包括系统管理数据和客户管理数据,该层次可以通过数据使用的特点分类存储到不同的管理库中,为整个管理系统提供最基础的信息管理服务。其次,资源过滤与解析层起到承上启下的作用,主要是对数据的初次整理,负责提取数据特征、整理数据和规范数据的格式,以期来提高数据的存储密度和价值度。再次,资源整合层是按照大数据读取和转化的准则,将过滤后的数据转化为可存储在主数据库中的数据。最后,资源整合反馈与控制层是数据最后的整合阶段,该层需要对数据进行评估和优化,并且还會全程监管数据的整合过程,及时的发现和改正问题,不断提高数据的可控性,以便于提供给用户更加安全和准确的数据。

(二)实现数据在采集终端的过滤和整合策略。数字图书馆需要承担起大量数据的处理工作,不仅要收集,还要整合用户数据。图书馆会使用传感器、服务器日志监测系统以及终端数据收集器等系统来收集和整理数据。需要注意的是,由于数字图书馆需要处理大量的数据,必然会面对数据量网络传输之间的负荷承载问题,超负荷会影响数据的传输。因此,数字图书馆应该对收集的信息进行过滤整合,这样会减少网络传输超负荷的情况。

其中对信息进行过滤和整合需要先进的技术,来降低大数据噪音,去除数据的多余信息,提炼有价值数据存储,这样便可以提高数据的有效性和利用率。

(三)图书馆馆藏数字资源的存储系统设计策略。图书馆的数据存储系统将使用云端网络,此系统可以提供高水平的网络计算服务,可以运用分布式技术扩展web网络服务器,还可以为不同地点的图书馆提供检索计算和存储服务。图书馆的数据存储系统主要有应用服务层、平台服务层和基础设施服务层等,以上层次按照不同的功用进行分类。首先,应用服务层是提供具体系统功能的层次,该层次为图书馆存储系统的高层,可以为图书馆提供其所需的基本服务,可以按照用户的需求以租用的方式提供给用户及其他组织。其提供的服务主要有信息订阅服务、信息检索服务、个性化信息服务、用户咨询服务以及企业竞争监管服务等。其次,平台服务层为图书馆存储系统的中层部分,其设立的主要目的就是整合系统的复用性软件和通用性软件。该层次提供的服务主要有六个方面:第一,信息系统管理接口功能,对资源进行专门的分类管理。第二,平台核心服务接口功能,对数据进行分析,整合和检索等。第三,信息发布接口功能,为用户定制信息和资源导航等功能。第四,信息规划接口功能,对信息资源进行整体的规划。第五,信息资源加工接口功能,是对信息数据生产和统计。第六,资源库发布接口功能。最后,基础设施服务层是图书馆存储系统的基础部分,对存储信息的整体框架具有重要的作用。该层次主要有两方面的功能,第一,利用虚拟化和抽象化的方式对数字图书馆中的各个硬件进行整合,使用户使用时能够当成一个整体,便于用户获取所需要的硬件和软件资源。第二,利用虚拟化和抽象化的方式为用户提供备份服务,负载管理服务和存储数据管理等服务。可见基础设施服务层保障着整个存储系统的正常运行。其中,在存储系统中,终端是存储系统的最高层,它不仅联系着用户,也联系着服务器,使得用户只要访问终端就可以登录客户端。

四、结语

如今的大数据背景下,实现数字图书馆的资源共享模式是当今时代的大势所趋,只有顺应时代的发展,图书馆才能够更好地满足用户的需求。图书馆借助数字资源整合技术,实现了对数据的规模化处理,使得互联网上的数据可以互联互通,更大程度上提高了资源的利用率。我们应该大力发展图书馆数字资源整合和存储技术,提高图书馆的管理水平。

【参考文献】

[1]樊伟红,李晨晖,张兴旺,等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012,31(11):63-68,77.

[2]刘芳,卢国强,刘宾娜,等.大數据时代的数字图书馆异构数据集成分析[J].电子技术与软件工程,2015(22):193.

[3]郑飒.大数据时代的图书馆服务初探[J].黑龙江史志,2015(5):268.

[4]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(5):37-40.

猜你喜欢

存储图书馆大数据
图书馆
档案管理中电子文件的存储探究
云计算与虚拟化
基于大数据背景下的智慧城市建设研究
去图书馆