APP下载

互联网免费文献资源的组织与管理方式研究

2014-08-08王曙光

河南图书馆学刊 2014年4期
关键词:图书馆互联网

关键词:图书馆;互联网;免费文献资源;组织与管理

摘要:通过文献调研、网站调研和系统调研,结合现有的各种信息组织理念,分析了当前互联网免费文献资源的组织与管理的几种方式,指出当前信息标准、信息覆盖的全面性、语义异构性等方面存在的问题,并从互联网免费文献资源的标引规范、深层次揭示、筛选与评价、长久保存等角度给出了一些建议。

中图分类号:G25文献标识码:A文章编号:1003-1588(2014)04-0106-04

收稿日期:2014-03-15

作者简介:王曙光(1970-),新疆维吾尔自治区图书馆副研究馆员。1信息组织的概念和目的

信息资源组织是根据信息资源检索的需要,以文本及各种类型的信息源为对象,通过对其内容特征等的分析、选择、标引、处理,使之有序化集合的活动。具体而言,就是要通过对信息的外在特征和内容特征进行表征和有标引,达到信息资源有序化的目的。

信息资源管理的目的不仅在于信息资源的收集,更重要的是实现知识的相互链接。然而,在网络免费文献资源越来越多的情况下,图书馆要凭借自己的人力和物力来将网络所有免费文献进行下载、整理、分类收藏,固化为本馆的数字化资源几乎是不可能的。要充分利用网络免费文献资源,必须对这些资源进行合理的组织和管理。

2信息组织和管理的方式

免费的网络信息资源越来越多,按照资源的类别,可以把网络免费学术信息资源分为以下十种类别:图书、期刊、报告、政府出版物、会议文献、专利文献、学位论文、技术标准、技术档案、产品资料等。对互联网免费信息资源的组织,国内外学者从理论、技术手段、组织方式、呈现方式等多方面进行了研究,产生了许多研究成果。总体而言,互联网免费信息资源的组织方式,大致可分为三类:统一检索工具/搜索引擎、导航系统、发现系统。

2.1统一检索工具/搜索引擎

由于各数据库系统的数据源不同,对数据的标引组织各异,检索方法也有较大差别,千差万别的免费文献资源数据库更是具有各种各样的检索方式,这给读者带来了使用上的极大困难。于是,商业界和图书馆界开始寻求一种统一的检索方式,希望通过整合检索来实现不同数据库的统一检索利用。搜索引擎是互联网上的信息检索工具,目前可用的学术搜索引擎多由商业公司开发。

国内外的科学家们一直致力于研究可以实现跨库检索的集成系统,以及集成搜索引擎。谷歌学术搜索Google Scholar以其专业性强、功能强大、覆盖范围广、查询准确等特点,成为最受欢迎的互联网学术文献检索工具。它以学术文献检索为目标,对互联网上各类学术文献资源进行索引,将所有文献划分为7个学科领域,搜索的范围几乎涵盖所有学科领域的学术研究资料,并提供文献引用次数。德雷赛尔大学Drexel University开发了一个网络文献搜索引擎http://www.ipl.org/,现集合了原先的Internet Public Library (IPL)和Librarians' Internet Index (LII)的文献资源,涵盖了图书馆员选择和评估过的7,000多种网络资源。

统一检索工具/搜索引擎存在的问题主要在于,查准率不足,搜索技术不透明,覆盖的网络资源有限。

2.2导航系统

图书馆作为文献信息的收藏与服务中心,需要对读者使用信息资源进行引导。网络免费资源导航是对网络免费资源做索引,包括学科导航、期刊导航、专题导航、学术站点推荐等内容,大多数图书馆的做法是列举文献资源名称并提供链接。

学科导航是按学科门类将学科信息、学术资源等做搜集、分类和整理,以方便用户按学科查找相关学科信息和学术资源。如加州大学图书馆的INFOMINE(信息矿藏),它是一个因特网学术信息资源汇总,提供资源检索和全文链接,并按学科和资源类型分别进行导航。国内较为成熟的有CALIS(中国高等教育文献保障系统)重点学科网络导航库,收集了各学科重要学术网站与免费学术资源,涉及哲学、文学艺术、历史、经济管理、法律、图书馆学、情报学、社会学等多个学科领域。国家科学数字图书馆提供数理学科、化学化工、资源环境学科、生命科学、图书情报学科信息门户网站。中科院计算机化学研究所主办的化学信息网,提供化学化工信息资源的分类链接。国内很多高校都制作了自己的学科导航系统,这些系统主要包含了站点链接、资源推荐、学术信息等内容。

2.3资源发现系统

资源发现系统是一个近几年才出现的概念,它采用最新的技术手段,通过元数据收割、建立集中的海量元数据仓储,以预索引的方式提供检索服务。它还能对检索结果进行分析处理,使各种类型的文献资源实现高度整合。资源发现系统具有集成检索的功能,是一种跨平台、跨格式、跨内容的新型系统。

自2009年,Series Solution 公司推出全球第一个网络级资源发现系统Summon后,各商家有陆续推出了多个发现系统,如OCLC的 WorldCat Local (WCL) 、Ex Libris 公司的Primo Central、EBSCOhost 公司的EBSCOhost Discovery System(EDS) ,这些资源发现系统以“简单、快速、易用、有效”的检索体验颠覆了传统的图书馆整合检索系统带给用户的感受。2013年,国内的超星公司也推出了自己的资源发现系统,对各类型的中文资源进行了元数据索引和整合。

资源发现系统可以帮助用户从海量资源中快速检索到所需资源,并对返回的结果进行智能化的聚类、去重等处理,如相关度排序、分面导航(faceted navigation)和结果精炼(refine)以及相关资源推荐,帮助用户找到最合适的资源。与传统的针对异构平台实现电子资源整合的一站式检索系统相比,发现系统能够管理更丰富的资源类型,在检索效率、检索结果的有序性及结果的质量等方面都有很大的提升。

3待解决的问题

3.1信息标准不一

信息资源是信息服务的前提,建立丰富、易用、适合的信息资源库,并对其进行合理的组织和管理是提供信息服务的必要条件。系统并有效地对数字资源进行组织和管理是提高图书馆的服务水平和图书利用率的有效手段,同时也给用户的使用创造条件和便利。

然而,网络免费数字资源规模巨大,各种类型、各种层次的文献资源都非常多,要切实提取出对读者有效的信息资源,必须加强对网络信息的评价选择、分类组织等工作。

3.2资源获取全面性不足

目前,图书馆对互联网免费文献资源的开发利用,多基于文本形式,对于多媒体资源的开发组织较少。音频、视频、照片等多媒体资源,由于具有更直观、更丰富、更生动的形式向用户传达信息和知识,越来越受到大众的欢迎。然而,在当前各种免费信息组织方式中,对多媒体资源的揭示还非常弱化。

王曙光:互联网免费文献资源的组织与管理方式研究王曙光:互联网免费文献资源的组织与管理方式研究以资源发现系统为例,由于元数据的要求以及获取渠道的限制,这些发现系统着重于对商业集成数据库的元数据进行组织整理,进而帮助用户快速找到所需信息。但是对于网络免费资源的发掘整理,还不够重视,不能将各种类型的免费资源都整合到其中,当然,要整合这么多免费文献资源,需要大量的财力和物力支撑,各个发现系统商家都在努力扩大自己的资源。

3.3语义异构问题尚未很好解决

图书馆众多格式和媒体的资源要实现互操作的关键就是要解决元数据的互操作问题。由于不同的数据库往往釆用不同的数据模型来描述数据,数据源的语法和语义就存在异构问题[19]。对于语法异构问题,通过元数据以及数据映射方法可以解决。从语义上识别用户输入的条件,使分布异构的数字图书馆系统协同工作必然是信息检索要解决的问题。由于语义可能存在于数据模型、概念模式、应用程序、数据本身等不同的地方,目前还没有一种方式可以很好地解决异构问题。

一些研究人员结合网格技术,提出在网格服务的基础上应用本体技术对不同结构、不同领域的知识进行统一语义定义,并通过服务实现对分布式的知识与数据进行统一的组织、执行以及协调,以便有效地管理语义、数据元、数据挖掘工具以及可视化工具的语义描述[20],在语义检索过程中采用中文分词技术对用户输入进行语义处理。另一些研究人员提出,利用知识地图和语义web技术实现数字图书馆的知识组织,达到语义互联和语义互操作[21]。

4建议

4.1研究制定统一的标引规范

网络信息资源分类与图书分类存在明显的差异,目前网络目录使用的分类法多采用主题分类,给检索带来一定的障碍。从数据字段的选取上看,除了提供刊名、URL、数据库来源、ISSN等字段的标引,还应该有分类、主题、购置情况、收录时间范围、资源类型、出版机构、收录情况、通信地址、简介等字段的标引。现有的统一检索、导航系统,很多都没有标识文献更细致的内容,索引过于简单,不仅不能有效地帮助获取文献信息资源,也影响了文献的二次开发与利用。

4.2检索功能的深层次揭露

从检索结果来看,仅仅基于元数据集中索引很难提供诸如相关度排序等的准确结果。基于全文的深层次检索受到越来越多的关注,部分提供商拥有文献全文或者全文的访问权限,在预先建立集中索引时,能够针对文献全文作深层索引,极大地提高了相关度的准确性。用户在搜索时,文献中的每个词或词组都有可能成为检索点,而不仅仅是关键词、题目、作者等几个有限的检索点。EDS和Summon都可以根据具体图书馆的订阅情况提供部分全文索引和检索,但仅有这些远远不足以满足读者的需要。读者希望通过图书馆的系统,在所有资源里搜索到相关的信息,并进行筛选,最终获得对自己有用的信息,对图书馆资源的要求是全面而又准确。必须通过一定的技术手段,对检索功能进行更多维地开发,并嵌入更多检索分析、综合评价功能,方能更全面、更深入地揭示文献资源,才能为用户构建一个真正有效的互联网免费文献资源知识库。

4.3对免费资源进行有效的评价和筛选

由于互联网免费文献资源缺乏统一的标准,很多是基于用户共同构建的资源池来实现免费使用的,在资源建设过程中,缺乏有效的监督和规范的组织整理,以至于很多资源价值不大、重复严重。图书馆作为信息资源的管理者和服务者,应承担文献建设的职责,向读者提供经过筛选评价的、对读者有用的、可靠性高的资源。

互联网免费文献资源的评价,可以从信息的准确性、涵盖量、新颖性、时效性、权威性、安全性、易用性、层次性、信息下载与引用次数等方面综合进行。其中,网络资源的链接时间和更新时间是判断资源学术价值的一个重要指标,但是,并非所有网络免费资源都有确定的时间。由于网络信息资源具有高度的动态性,内容更新迅速、网站变化快,因此网络免费文献资源组织与管理的过程中,需要特别注意时效性和累积性,随时对最新的信息进行维护,定期测试免费文献信息,及时删除过期资源。

4.4对网络免费资源长久保存的研究

由于网络免费文献资源的不稳定性,要长久发挥这些资源的作用,需要加强整理和保存工作。许多学者认为 ,图书馆作为知识的存储机构,可以承担开放获取期刊的长期保存任务。在有条件的情况下,图书馆有责任开发、引进数字资源长期保存技术,以保存有用的学术信息。但网络信息资源的采集和保存是一项长期的系统工程,目前图书馆面临网络信息资源采集和保存的一系列难题,包括人力、物力、技术等方面。哈佛、斯坦福等大学图书馆在开展数字资源的长期保存项目方面已见成效。斯坦福大学图书馆建立了一个长期保存资产和外购数字资源的数字知识库,并开发了 LOCKSS(Lots of Copies Keeps Stuff Safe)系统,该项目通过多个图书馆参加的分布式联合建设机制,与出版机构合作,对图书馆购买的电子资源统一进行长期存档,保证各个图书馆对其购买的电子资源可以进行永久存取[21]。

然而,从作者的角度来看,任何一个图书馆仅凭一馆之力,想要将这些经过筛选评价的互联网免费文献资源保存到本地,几乎是不可能的,尤其在国内,图书馆经费不足的情况下,更是无法实现。要保存这些资源,不仅需要巨大的存储空间,还需要一个极其强大的管理系统来组织和管理这些文献资源,这不仅涉及技术问题,还涉及人员、经费、管理方式等问题。理想的方式是,在拥有一套功能完备、使用简便、规范统一、性能优秀的管理和存储系统的情况下,寻求一种联合共建的模式,由多个图书馆或机构,采用统一的标准、规范的流程、准确的标引,共同构建互联网免费文献资源的知识仓库,通过元数据搜索引擎等先进的组织揭示工具,提供给读者使用,从而达到永久可靠、使用便捷的目的。

5结论

充分开发利用互联网免费文献资源,对于丰富图书馆的馆藏资源、缓解图书馆的经费压力、扩大图书馆的资源范围等都具有巨大的意义。近年来,互联网免费文献资源的数量和种类增长迅速,如果仅停留于罗列、简单介绍、链接等揭示方式,显然不足以满足读者的需要,也无法适应技术的发展,必须建立互联网免费文献资源的多层次和全方位揭示机制,通过信息抽取、知识组织等技术,实现对分布式免费文献资源的语义组织,支持个性化、学科化服务。图书馆应充分发挥信息职能,密切关注网络免费文献资源,并进行有效地组织和管理,让用户能广泛使用这些免费的文献资源来进行学习与研究。

参考文献:

[1]马张华.信息组织[M].北京:清华大学出版社,2003.

[2]刘丽.网上免费学术资源开发利用研究综述[J].图书情报工作, 2008(1):239-242.

[3]谷歌学术搜索[OL]. [2013-06-15]. http://scholar.google.com/.

[4]ipl2: information you can trust[OL]. [2013-615] http://www.ipl.org/.

[5]Scirus——for scientific information[OL]. [2013-06-15]. http://www.scirus.com/.

[6]OAIster[OL]. [2013-06-16]. http://www.oclc.org/oaister.en.html.

[7]DOAJ: Directory of Open Access Journals[OL]. [2013-06-16]. http://www.doaj.org.

[8]Open Access开放存取(开放获取)资源一站式检索服务平台——Socolar[OL]. [2013-06-16]. http://www.socolar.com/.

[9]中国图书进出口(集团)总公司期刊导航[OL]. [2013-06-16]. http://ejnavor.cnpeak.com/.

[10]李咏梅,袁学良,袁冰.利用开放存取重塑学术型图书馆——以美国加州大学图书馆为例[J]. 四川图书馆学报,2010(3):35-37.

[11]CALIS(中国高等教育文献保障系统)重点学科网络资源导航门户[OL]. [2013-06-17]. http://202.117.24.168/cm/main.jsp.

[12]中国科学院国家科学图书馆[OL]. [2013-06-17]. http://www.las.ac.cn/.

[13]化学信息门户ChIN[OL]. [2013-06-17]. http://chin.csdl.ac.cn/.

[14]Doug Way, The Impact of Web-scale Discovery on the Use of a Library Collection, Serials Review, Volume 36, Issue 4, December 2010, Pages 214-220, ISSN 0098-7913, http://dx.doi.org/10.1016/j.serrev.2010.07.002.

[15]OCLC的 WorldCat Local (WCL) [OL]. [2013-06-18]. http://www.oclc.org/en-US/worldcat-local.html.

[16]Ex Libris通向知识的桥梁, Primo Central[OL]. [2013-06-18]. http://www.exlibrisgroup.com/cn/category/primocentral

[17]EBSCOhost Discovery System(EDS) [OL]. [2013-06-18]. http://www.ebscohost.com/discovery/.

[18]窦天芳,姜爱蓉.资源发现系统功能分析及应用前景[J].图书情报工作, 2012(7):38-43.

[19]黄文忠.基于本体(Ontology)的数字图书馆知识组织研究[J].大家, 2010(2):244-245.

[20]张继东.网格环境下数字图书馆的语义服务开发研究[J].图书情报工作, 2010(15):27-30.

[21]毕强,牟冬梅,刘昆.语义网格环境下数字图书馆知识组织研究[J].图书情报工作, 2006(6):28-33.

[22]王晓山.国外高校数字资源长期保存实践研究[J].兰台世界, 2011(21):27-28.

(编校:严真)

猜你喜欢

图书馆互联网
图书馆
气味图书馆
欢迎到图书馆做客
“互联网+”环境之下的著作权保护
“互联网+”对传统图书出版的影响和推动作用
从“数据新闻”看当前互联网新闻信息传播生态
互联网背景下大学生创新创业训练项目的实施
以高品质对农节目助力打赢脱贫攻坚战
去图书馆