APP下载

我国图书馆数字资源整合的现状与发展趋势研究

2022-06-16袁天舒

河北科技图苑 2022年3期
关键词:整合研究数字资源图书馆

摘要:数字资源整合是图书馆的基础性工作,关系资源采购、服务等多项图书馆业务的发展。探寻我国图书馆数字资源整合的历史演进与发展趋势具有重要意义。文章通过对我国图书馆数字资源整合研究现状的调研,从演进趋势、文献类型、学科领域等方面进行定量分析。从实践、技术与理论三个方面对相关研究进行了梳理和总结。最后,结合定量与定性分析,总结出我国图书馆数字资源整合的发展趋势与研究方向。

关键词:图书馆;数字资源;整合研究

中图分类号:G253   文献标识码:A

DOI:10.13897/j.cnki.hbkjty.2022.0036

0 引言

图书馆数字资源整合是依据一定的需求,综合利用各种技术与手段,对来源不同、建设主体不同、协议不同的分散异构数据通过对数据对象、功能结构以及互动关系的组合,重构形成一个服务更优质的有机数据资源体系。数字资源整合是将各异的数字资源透明地、无缝地集成在一起,为用户提供统一、便捷地检索、浏览和使用服务[1-4]。数字资源整合是图书馆开展知识服务、智能服务以及个性化服务的基础性、奠基性工作,关系图书馆资源采购、学科服务、科学情报传递、智力资源开发等一系列工作。

我国图书馆数字资源整合的研究与实践始于上世纪90年代,为解决数字资源分散、来源广泛、种类繁多、冗余度高、数据孤岛等问题,图书馆开始探索数字资源整合工作。研究初期,数字资源采用元数据进行统一描述,利用导航系统、统一检索、跨库检索、SFX等技术整合分散异构的数据,实现分散数据的统一入口、统一展示、统一利用[5-7]。进入21世纪,以大数据、云计算、物联网为主要特征的新一代信息技术飞速发展,推动图书馆数字资源整合在整合理念、方式、范围与技术等方面突破了原有的发展模式,迈向以知识生产为目的多层次、多类型的数字资源整合发展阶段,基于关联数据[8]、大数据分析[9]、本体构建[10]、知识组织[11-12]、语义挖掘[8-9]的数字资源整合成为研究的主流和发展的重点。

为进一步探寻我国图书馆数字资源整合的历史演进与发展趋势,文章首先从研究趋势、学科领域、文献类型等方面进行定量分析;然后,结合定量研究,从实践、技术与理论三个方面对当前我国图书馆数字资源整合相关研究进行了梳理和总结;最后,指出在研究思路、研究体系、研究范畴、应用技术与整合模式等方面的发展趋势,为后续图书馆数字资源整合的研究与实践提供参考和借鉴。

1 我国图书馆数字资源整合研究特征分析

1.1 数据来源及处理方法

本文选取CNKI为数据源,在CNKI高级检索中设置篇名检索项为“图书馆”,限定检索领域为图书馆领域;主题检索项为“数字资源整合”或者“信息资源整合”,筛选出题目中包含图书馆,主题为信息资源整合或者数字资源整合的文献。检索时间截止日期为2021年12月31日。获取文献数据后,通过人工筛选,去除评论、短文、通知、报纸以及与图书馆数字资源整合相关性不大的文献,得到438篇相关文献。

1.2 我国图书馆数字资源整合的历史演进

研究文献的年代分布可反映出该领域的学术发展轨迹。如图1所示,我国图书馆数字资源整合经历了快速发展、波动下降等几个主要阶段。从图中可以看出,自2002年后,我国数字资源整合研究进入快速发展期,研究文献数量高速增长,2006年达到研究高峰;2007年后,相关研究进入明显的阶段性波动下降时期。

1.2.1 研究上升期

自2002年后,我国图书馆数字资源整合研究进入快速发展期。根据对相关文献的内容分析,相关研究快速增长主要有两方面原因:一方面来源于政策推动。数据资源成为重要的社会资源,我国2004年印发的《关于加强信息资源开发利用工作的若干意见》与2006年印发的《国家信息化发展战略》均将信息资源建设列入重点工作内容,强调数字资源的充分开发与深度利用。数字资源整合是数字资源开发与深度利用的前提,图书馆作为数字资源主要汇聚地,大量研究工作者投入到该项研究中。另一方面来源于内部需求驱动。图书馆数字资源前期分散建设、独立采购的建设模式造成了数字资源分布零散、异构,产生了大量的数字孤岛,严重影响用户获取数字资源的便利性与全面性。2002年有关“数字图书馆”的研究工作进入飞速发展期,部分研究学者开始前瞻性的探索图书馆数字化、智慧化服务转型。数字资源整合是图书馆开展数字化、智慧化服务升级转型的基础性工作,成为研究人员绕不开的主题。在此背景下,大量研究者从资源充分利用的角度重新定义数据资源的组织、整合等基础性工作[12-14],形成了大量研究成果。

1.2.2 研究波动下降期

自2007年起,我国图书馆数字资源整合的研究热度逐渐下降。根据对相关研究文献的内容分析,主要有两方面原因。一方面,研究范式的变化。在大数据的推動下,科学研究正逐步进入“第四范式”,从海量数据中挖掘信息、知识以及变化规律。在此背景下,图书馆顺应科学研究发展趋势,整合碎片化知识,把握数据的内在关联成为“数字资源整合”的新目标。这也直接导致了以资源整合为直接主题词的研究逐渐减少,以知识挖掘、关联数据等为主题的学术文献逐渐增多。另一方面,关于数字资源整合的研究主题与研究方向进一步细化和扩散,产生了更多的细分方向。在新一代信息技术的推动下,数字资源整合的核心从“数字资源整合”到“数字资源融合”的转变,衍生出了更细粒度的研究主题

[9],例如:服务融合、平台融合、数据融合、知识融合、知识组织等细分研究方向,如《大数据时代图书馆数字资源的融合与转化》《社会网络环境下用户参与的图书馆数字资源组织与整合模式研究 ——以高校为例》等学术文献则是为了顺应大数据发展趋势与个性化服务的要求,研究新时期数字资源整合的方法与模式[9,15]。

1.3 学科领域

根据我国图书馆数字资源整合研究文献的刊载期刊、中图分类号、作者研究方向、论文题录、研究内容等信息综合判断,标注出文献的所属学科,并进行统计分析。图书馆数字资源整合研究文献涉及学科广泛,既涉及图书馆学、情报学领域,也涉及了计算机科学、档案学、博物馆学等其他学科。从学科分布来看,图书情报学科占74%;计算机科学占20%,档案及博物馆和其他学科占6%,部分学术文献为多个学科领域合作形成。从上述数据可以看出,图书馆数字资源整合交叉发展趋势显著,相关学术研究逐渐打破了原有图书情报学科边界,与计算机科学、档案学等学科领域的联系不断加强。

1.4 文献类型

我国图书馆数字资源整合的研究文献大致可以划分为3类:期刊论文、会议论文与学位论文。根据对相关文献的类型统计,期刊论文最多,占总论文的92%,学位论文次之,占总体比例的5%,会议论文占比为3%。从分布数据上来看,我国图书馆数字资源整合的研究成果大部分集中在学术期刊中。

2 我国图书馆数字资源整合研究层次分析

图书馆数字资源整合具有明显的交叉学科属性,既涉及图书情报领域,又涉及計算机科学、数据科学等领域。在多个学科交叉作用下,图书馆数字资源整合呈现出了明显的研究层次与研究重点。通过对样本文章的分析,将图书馆数字资源整合研究划分为基础理论研究、基础技术研究、应用与实践研究3个层次,具体层次结构与研究重点如图2所示。

2.1 基础理论研究

基础理论研究是对学科发展过程中的现状、问题、模式、机制的研究,为应用与实践研究提供基础的理论指导。在图书馆数字资源建设过程中,传统分散建设、独立采购的发展模式导致图书馆数字资源在建设主体、组织模式、存储介质、分布形式、服务方式等方面存在较大差异,制约图书馆数字资源整合与利用。为解决上述问题,研究人员通过探索新的发展机制与构建新的整合模式,破解因建设主体不同、数据主体不同、存储方式不同而带来的潜在问题,旨在形成跨部门、跨区域、跨领域的数字资源整合机制,不断扩大图书馆数字资源整合的边界和范围。例如:张任跃等[13]提出引入第三方公共数字资源联合体,建立区域图书馆联盟的发展模式,优化数字资源配置。王洪波等[14]采用比较研究的方法,探讨区域性数字图书馆构建与资源整合策略,推动从以单位为主的“小整合”向以区域为主的“大整合”过渡。吴爽[15]提出基于循证采购的数字资源整合模式以降低数字资源整合中的重复采购问题。穆向阳[10]、周俊烨[16]为实现数字资源在更大范围内进行整合,实现数字资源发挥更大的关联效益、整合效益,借助于本体与关联数据,探讨破解图书馆、博物馆在数字资源整合中存在的机制、体制的问题。

2.2 基础技术研究

基础技术研究是指以技术突破为主要目的基础性研究。研究初期,图书馆数字资源整合基础技术研究多以解决数字资源地理分散、异构问题为主,通过采用OPAC、跨库检索、SFX等技术实现逻辑层面的资源聚合,形成数字资源的统一入口、统一检索、统一呈现。随着信息技术的不断发展与用户信息需求的多元化发展,面向语义的数字资源整合技术的研究成为主流,此类研究多以借鉴计算机科学、数据科学的相关技术为主,结合图书馆数字资源利用的需求对算法进行适配性改造,属于横向的科学研究。例如:曹健[17]指出Hadoop技术在数据分布存储、数据关联管理与大数据分析等方面具有显著优势。在其研究中基于Hadoop搭建了图书馆数字资源整合系统,实现了面向数据应用的图书馆数字资源整合框架。吕莉媛[18]等指出图书馆数字资源网络与复杂网络具有高度相关性。在其研究中,借鉴了复杂网络的技术,提出了基于P2P技术的图书馆数字资源整合方案。欧石燕[19]、赵雷[20]、齐东鸿[21]等学者引入了数据挖掘、关联数据、文本挖掘、本体等算法对图书馆非结构化文本数据进行挖掘、关联与整合,提升了语义层面整合深度,实现了图书馆在语义、知识层面的互联互通。

2.3 应用与实践研究

应用与实践研究是探究理论与技术的应用对策与价值,此类研究旨在结合理论、技术的研究成果形成可解决实际问题的方法、手段与措施。图书馆数字资源整合技术性与应用性较强,其研究成果主要集中在对代表性实践项目的基本思路、整体架构、应用技术、整合模式的深入剖析以及成功经验的实践性总结方面。此类研究成果较多,是对理论的实践及多项信息技术的集成应用。例如:肖楠等[22]以深圳图书馆区域性实践项目“深圳文献港”为例,分析了区域图书馆数字资源整合的系统架构、层次结构以及系统组成。陈黄焱等[23]以福建省图书馆“手机图书馆”为例,介绍了移动设备在数字资源整合服务中的技术与成效。远红亮[24]以清华大学图书馆OPAC系统为例,介绍了OPAC系统整合检索CADAL数字资源详细设计、功能模块、数据流程等,为相关研究提供借鉴。只莹莹[25]以国家图书馆馆藏自建数字资源与纸质文献整合展示项目为例,介绍了基于唯一标识符建设的数字资源与纸质资源的整合实践,为解决自建数字资源与纸质资源分散存在、独立存取的问题,加深了各类数字资源之间的联系。谢宝义等[26]以石家庄铁道大学图书馆数字资源整合为例,介绍了异构资源统一检索平台等整合的实践案例。

3 我国图书馆数字资源整合研究的发展趋势

3.1 研究思路

数字资源整合逐渐由数据库层、信息元层面的整合向知识层面整合转变。从图书馆数字资源整合的发展历程来看,研究初期,学者以数据库与信息元整合为主,以消除不同资源数据库分布的广泛性,在逻辑上实现跨库的统一检索为主要目的。进入21世纪,以大数据、云计算、物联网为主的新一代信息技术推动人类对信息的需求、传递、交流、获取发生史无前例的变革,信息需求呈现了多层次、多元化、细粒度、知识化等特点,在此背景下,图书馆数字资源整合研究迈向以知识元层面的数字资源整合阶段。知识元层面的资源整合打破了传统的资源整合模式,利用语义、数据挖掘、知识图谱、关联数据等技术寻找数据之间的联系,构建知识数据网络,整合碎片化的信息形成新的知识体系。

3.2 研究体系

一是用户需求逐渐成为数字资源整合研究体系的核心内容。图书馆数字化的核心是运用数字化能力为用户提供服务、解决用户阅读与科研需求。近年来,随着个性化推荐与定制化服务的兴起,用户需求成为数字资源整合新的抓手,以用户需求重塑数字资源整合成为必然趋势。早在2006年,张永军等[27]

就指出传统数字资源整合方式不再适应新的要求,以用户为中心重新组织信息资源是个性化服务发展的必然要求。在2018年许湖发表的《高校图书馆数字资源整合与个性化信息检索服务探究》进一步明确了用户与数字资源整合的关系[28]。

二是先进数据处理成为研究体系重要基石。关联数据、数据挖掘、多源数据融合重塑了数据采集、数据融合等数据整合的关键环节。传统数字资源整合多采用OPAC、导航整合以及链接整合等方式,将分布广泛的数字资源统一组织。随着研究范式、研究思路以及研究范畴的不断拓展,数字资源整合的应用技术也发生了改变。以往研究多以结构化数据为主,主要应用技术为分布式存储、检索优化技术、元数据提取等技术。近年来,数字资源在数据形态方面发生本质变化,科研數据、网络资源数据、内容文本数据等非结构数据成为数字资源整合的一部分,整合深度深入到语义层整合,知识图谱、关联数据、文本挖掘等技术成为应用的主流技术。

三是研究边界不断扩大。传统数字资源整合主要以传统馆藏资源整合为主,主要包括图书、期刊、学术文献以及自建数据库,格式相对统一,题录数据相对规范。随着数据需求的不断扩大,图书馆数字资源整合不断将研究范畴从传统的学术期刊文献拓展至古籍馆、博物馆以及档案馆等数字资源范畴[8,10,29-31],研究内容进一步丰富。

3.3 整合模式

从整合模式上来看,原有数字资源整合管理体系逐渐失去其应有价值和功能。从2010年开始,我国图书馆原有的认知体系和信息化管理体系受到诸多挑战和困扰,导致分散建设、独立采购的数字资源建设模式仍处于主流位置,一些基础性工作没有得到应有的重视与坚持,例如:基础信息采集体系建设、数据融合标准与规范化体系建设、数据治理体系建设、云计算中心的规划建设、统一规划与布局等,使得图书馆数字资源整合问题无法取得实质性的进展[32-34]。近年来,数据采集、处理、交换等标准规范建设成为研究的重要方向,如何按照数据关联、可视化对数据底层的要求,考虑实际业务发展,完善和发展数据关联融合的标准与规范成为重要的研究内容。

4 结语

数字资源整合关系资源采购、学科服务等多项图书馆业务的发展,涉及到技术问题、服务模式问题、资源架构以及观念等问题。文章通过对我国图书馆数字资源整合研究文献的分析,从实践、技术与理论三个方面总结了研究现状,分析出我国图书馆数字资源整合的发展趋势与研究方向,以为后续相关研究提供借鉴。

参考文献

[1]穆向阳.图书馆数字资源整合策略研究[J].图书馆学研究,2015(2):46-53.

[2]黄传慧,李娟.我国图书馆数字资源整合研究[J].图书与情报,2009(4):66-69,82.

[3]耿霞,彭新国.图书馆数字资源整合的现状与发展[J].中国科技信息,2008(3):126-127.

[4]马恒通.图书馆变革中的十大新观念[J].广东图书馆学刊,1987(4):44-46.

[5]李希明,土丽艳,金科.从信息孤岛的形成谈数字资源整合的作用[J].图书馆论坛,2003(6):121-122,61.

[6]马文峰.数字资源整合研究[J].中国图书馆学报,2002(4):63-66.

[7]何萍.思考与创新——谈图书馆深化改革应树立的新观念[J].图书馆,1992(6):52-54.

[8]郑燃,唐义,戴艳清.基于关联数据的图书馆、档案馆和博物馆数字资源整合研究[J].图书与情报,2012(1):71-76.

[9]范家巧.大数据时代图书馆数字资源的融合与转化[J].图书馆论坛,2020,40(5):38-44.

[10]穆向阳.本体在LAM(图书馆、档案馆、博物馆)数字资源整合中的局限、问题及解决路径研究[J].图书馆理论与实践,2020(5):73-79.

[11]黄维宁.融合知识组织的数字资源整合配置方法:大数据与数据科学视角[J].四川图书馆学报,2020(5):18-21.

[12]马文峰.基于知识组织理论之上的数字资源整合[J].情报资料工作,2003(1):26-28.

[13]张任跃.试论公共图书馆数字资源整合——引入第三方数字资源联合体的构想[J].图书馆理论与实践,2009(12):75-76.

[14]王洪波,赵莉,耿晓宁.辽宁地区图书馆的数字资源整合现状调查与研究——兼与广东地区图书馆比较[J].数字图书馆论坛,2015(10):34-40.

[15]吴爽.基于循证采购模式的图书馆数字资源整合[J].图书馆学刊,2021,43(5):31-36.

[16]周俊烨.基于关联数据的图书馆、档案馆和博物馆数字资源整合模式构建[J].图书馆,2019(1):70-75.

[17]曹健,秦荣环,孙会清,等.基于Hadoop的高校图书馆数字资源整合利用研究[J].图书馆工作与研究,2018(3):74-78,101.

[18]吕莉媛.基于复杂网络的图书馆数字资源整合[J].情报科学,2009,27(12):1811-1815.

[19]欧石燕,胡珊,张帅.本体与关联数据驱动的图书馆信息资源语义整合方法及其测评[J].图书情报工作,2014,58(2):5-13.

[20]赵雷.基于深度挖掘的图书馆数字资源整合与共享[J].电子设计工程,2022,30(5):42-45,50.

[21]齐東鸿.基于数据挖掘的少儿图书馆数字资源整合与延伸服务研究[J].图书馆学刊,2020,42(1):50-53.

[22]肖楠.区域图书馆数字资源整合及统一服务的探索与实践——以“深圳文献港”为例[J].河北科技图苑,2013,26(4):27-30.

[23]陈黄焱.全媒体时代数字资源整合服务的实践与探索——以福建省图书馆“手机图书馆”为例[J].图书馆理论与实践,2013(12):98-100.

[24]远红亮,张蓓,张成昱,等.CADAL数字资源整合检索研究——以清华大学图书馆OPAC系统为例[J].数字图书馆论坛,2017(8):32-37.

[25]只莹莹,甘蒂,赵金柱.基于唯一标识符的数字资源与纸质文献整合研究与实践——以国家图书馆馆藏自建数字资源与纸质文献整合展示项目为例[J].图书情报导刊,2018,3(5):20-26.

[26]谢宝义.高校图书馆数字资源整合模式研究与实践——以石家庄铁道大学图书馆为例[J].图书馆建设,2011(2):33-35,40.

[27]张永军.试论高校图书馆数字资源整合与个性化信息检索服务[J].情报杂志,2006(8):127-129.

[28]许湖.高校图书馆数字资源整合与个性化信息检索服务探究[J].才智,2018(3):221.

[29]石华.基于关联数据的语义数字档案馆框架设计研究[J].档案管理,2015(4):7-10.

[30]易军凯,周育彬,万静.一种基于关联数据的数字博物馆语义融合方法[J].北京化工大学学报(自然科学版),2014,41(6):103-108.

[31]魏青山,闫晓弟,李娟,等.陕西省图书馆、博物馆与档案馆特色数字资源整合研究与思考[J].图书馆,2014(2):92-94.

[32]孙慧.大数据背景下基于学科服务的图书馆数字资源整合策略研究[J].智能计算机与应用,2019,9(6):302-304.

[33]王杰峰.关联数据在图书馆馆藏数字资源整合中的应用研究[J].农业图书情报学刊,2017,29(6):40-43.

[34]王舒月,姜超.区域性图书馆数字资源共建共享现状与问题研究——以浙江省杭州市为例[J].图书馆论坛,2013,33(1):94-99.

作者简介:袁天舒(1968),男,赤峰学院图书馆馆员。研究方向:数字资源采购与建设。

(收稿日期:2022-02-26 责任编辑:张长安)

Research on the Status and Development Trend of Library

Digital Resource Integration in China

Yuan Tian-shu

Abstract:Digital resource integration is the basic work of libraries, which is related to the development of many library businesses, such as resource procurement, discipline serviceand so on. It is of great significance to explore the historical evolution and development trend of library digital resources integration in China. Through the research on the integration of digital resources in libraries in China, firstly, this paper makes a quantitative analysis from the aspects of evolution trend, document type, discipline field and research level; Then, it combs and summarizes the relevant research from three aspects: practice, technology and theory; Finally, combing quantitative and qualitative analysis, this paper summarizes the development trend and potential research direction of library digital resources integration in China.

Keywords:Libraries; Digital Resources;Integration Research

猜你喜欢

整合研究数字资源图书馆
图书馆
电子白板与小学英语教学整合研究
信息技术与幼儿园语言课程有效整合的应用研究
多媒体技术与高中化学教学的有效整合研究
图书馆员新角色
高校数字资源云服务平台的建设研究
图书馆与出版企业数字资源共享的环境因素分析
壮族山歌融入高师钢琴课程的整合研究
去图书馆