APP下载

基于关联数据的图书馆知识服务策略研究

2012-02-16广东医学院图书馆广东湛江524023

图书馆理论与实践 2012年6期
关键词:关联图书馆资源

●管 进(广东医学院 图书馆,广东 湛江 524023)

关联数据是一组共享数据的最佳集合,它强调数据的相互关联和相互联系。采用RDF(Resource Description Framework) 资源描述框架,利用URI(统一资源标识符)命名数据,在网络上发布和部署实例数据和类数据,通过超文本传输协议(HTTP)揭示并获取这些数据。[1]本文将通过对关联数据的概念、应用情况的论述,论证关联数据对知识服务开展的影响以及策略。

1 关联数据的内涵

关联数据(Linked Data) 是万维网的发明人--蒂姆·伯纳斯·李 (Tim Berners Lee) 于2006年提出的一种万维网上发布数据的方式,是国际互联网协会(W3C)推荐用来发布和联接各类数据、信息和知识的一种规范,其目的是构建一个计算机能理解的具有结构化和富含语义的数据网络,而不仅仅是人能读懂的文档网络。[2]关联数据强调数据的相互关联、相互联系以及有益于人和计算机所能理解的语境信息,它可将两个处于不同机构的数据库建立关系,或者是同一个机构内来自不同系统,无法在数据层面进行相互操作的数据进行关联,甚至可链接至其它外部数据,同样也可被来自外部的数据所链接。

2009年 TED(Technology,Entertainment,Design)大会上,Berners Lee认为创建关联数据有4个原则必须遵循:[3]

原则一:使用URI作为任何事物的标识名称;原则二:使用HTTP URI使任何人都可以访问这些标识名称;

原则三:当有人访问某个标识名称时,提供有用的信息;

原则四:尽可能提供相关的URI,以使人们可以发现更多的事物。

由此可知,关联数据允许用户发现、关联、描述并再利用各种数据,用URI标识网页文件、RDF文件以及各类图像、音视频等特殊编码的文件。与当前的HTML网络不同的是,URI除了具有标识(命名)和定位资源对象的作用之外,还能以此“关联”数据,对网络上的资源进行选择和定位,进而形成很多新的应用和事物。

2 关联数据应用概述

关联数据可以是W3C推荐的数据规范,用来联接和发布各类数据、信息和知识,使互联网上的服务器能够基于内容进行检索而不是简单的全文检索,它的作用是基础性的和多方面的,正在使万维网发生深刻的改变。一些媒体公司、企业、政府部门,如BBC、纽约时报等,已经把他们的海量数据转换成了关联数据。

2007年1月启动Open Linked Data项目是关联数据最典型的应用,其目标是通过定义已存在并可公开使用的数据集,根据关联数据原则将其转换为RDF,并通过HTTP来传递,进而改善数据网络Webof Data。随着项目的逐步壮大,一些大型机构如 BBC、GOOGLE、美国国会图书馆等都积极参与其中。[4]

作为信息收集、组织与处理的专门机构,图书馆界对关联数据的研究与应用非常重视,并进行大力推广与参与。在国外,2010年5月万维网联盟(W3C)宣布成立图书馆关联数据孵化小组(Library Linked Data Incubator Group)以帮助图书馆建立关联数据,主要集中将图书馆的MARC数据、主题标目等数据开放成为关联数据。瑞典国家图书馆是全球首个将国家图书馆级书目数据LIBRIS全部发布为关联数据,美国国会图书馆以SKOS(简单知识组织系统)格式将传统的主题标目LCSH(国会标题表)全部转换为可应用的关联数据,德国国家图书馆将权威文档发布为关联数据的项目,OCLC将杜威分类法及国际虚拟权威档发布为关联数据。而国内关联数据的研究尚不普及,大多集中在对关联数据国外研究的综述,白海燕[5-6]和范炜、邹庆[7]的研究涉及了关联数据项目开发和技术实现,马费成等[8]针对网络信息资源集成所面临的困难,结合关联数据的基本思想,提出一个基于关联数据的网络信息资源集成框架,并依据此框架,设计和实现了以武汉大学为基本单位的免费网络学术资源集成实验系统,李琳探讨关联数据在图书馆界的应用,指出关联数据在图书馆的进一步应用也还面临着用户交互、数据整合、链接维护、隐私保护等方面的挑战。[9]

3 关联数据对知识服务的影响

3.1 关联数据对图书馆信息资源中心地位的冲击

关联数据具有相对于数据库更加开放的环境,允许用户通过某一点关联到更广泛的信息资源。对图书馆而言,如果在其馆藏目录中增加关联信息,这些关联信息将会关联图书馆以外的各种资源,这似乎在让用户远离图书馆。作为知识服务的提供者,图书馆应该从用户的角度出发,确保为用户提供更多的相关资源和知识,而不仅仅是已经订购的资源。因此,对于关联数据,图书馆不单只是利用,还应将一些馆藏数据发布成关联数据。这样,图书馆不仅可以为用户提供外部的资源,同时还可以把用户带回到图书馆服务中来。

3.2 关联数据可扩展知识发现服务

知识发现是一个系统化过程,这个过程的实施是对大量的数据库、数据仓库或知识库进行分析处理,进而深层挖掘,寻找数据间潜在的关联模式、规则、趋势等知识。关联数据为知识发现提供了良好的途径,可以将图书馆的资源与外部的资源有效地相互连接起来,帮助用户获取图书馆以外的资源。无论是对用户还是图书馆馆员,关联数据将超越图书馆的资源,为用户提供新的资源发现和访问服务,使发现资源变得更为容易。

3.3 关联数据将使知识服务中的资源管理更加复杂

关联数据可使来自图书馆不同的信息系统之间的数据关联,也能使不同领域的数据相互关联,使共享网络中不同类型的数据、信息、知识成为可能。通过资源的扩展和关联,提供知识服务的馆员和用户可获取丰富的检索结果。同时,关联数据网络中的数据并不是一成不变的,新的数据会不断加入,旧的数据需要修改或删除,数据之间的关系也会随之变化。因此,关联数据在为图书馆减轻整合分布式异构数据源的复杂性的同时,使资源管理变得更加复杂化。3.4关联数据对知识服务的方式提出了新的要求

关联数据的最大好处是将来自不同数据源的同一个对象进行整合,可以将多个分布式异构数据源整合的关联的访问,返回给用户关于该对象的所有相关信息的统一视图,同时允许用户在不同数据源之间进行浏览,这使得用户所面对的数据和信息呈指数级增长。

网络环境下用户的知识需求也不再限于单纯的文献检索传递服务,他们更希望通过图书馆的知识服务直接获取全面的知识内容和知识关联,要求提供知识密集度较高的知识服务产品,同时还会要求图书馆针对他们的具体专业提供全方位的知识信息保障,这些都对图书馆的知识服务提出了新的要求。

4 基于关联数据的知识服务策略

4.1 建立以关联数据为基础的知识服务资源保障体系

对图书馆而言,馆藏资源往往是有限的,而关联数据的出现,使知识服务的资源保障从传统的馆藏资源进一步关联到整个互联网。建立以关联数据为基础的知识服务资源保障体系,不仅可以帮助用户实现资源发现的相关性和便捷性,更重要的是可以满足用户对热点追踪、新兴或潜在主题发现等高层次科研咨询的需求。

4.2 加强对知识服务的数据整合

关联数据一般来源于分布异构的多个数据源,而对用户而言,他们更倾向于一站式地利用所有资源与服务。这就要求图书馆必须充分利用关联数据,对这些分散、异构的信息资源进行有效组织和集成。

首先,将图书馆“内部的数据”关联起来,消除内部数据的相互隔阂。图书馆“内部的数据”包括图书馆集成管理系统、图书馆检索平台、参考咨询系统等,将这些内部数据进行关联不仅使图书馆能及时了解读者需求,而且读者也可了解图书馆的馆藏状况并充分利用。

其次,整合图书馆内部和外部的资源。通过关联数据,用户所需的信息资源中的知识内容、知识对象以单一语义映像和多层语义互联,可将目前基于文献层面的“整合集成”深化到对其逻辑关系进行深入、系统的语义描述。

需要指出的是,关联数据无法对封闭系统中的资源进行整合。因此,图书馆在数据整合的过程中,必须考虑关联数据与馆内一些相对封闭资源的整合,对于无法融合在一个系统里的数据,则应提供一定的资源导航或术语规范的支持。

4.3 加强知识服务方式的整合

对于开展知识服务的图书馆来说,应基于海量信息资源和数据,利用多种知识挖掘和内容计量手段,扩展检索结果,整合异类资源,进行知识组织系统的构建,为用户提供深度知识服务。这就要求图书馆的知识服务必须融入用户需求,明确针对具体用户的服务责任,充分利用关联数据去调动和集成各种资源、系统和服务,通过系统集成、服务集成、团队工作等多种方式联合利用多种知识、资源来组织和提供知识服务,并根据用户的实际情况动态地选择、分析各种知识,动态地设计、组织、安排和协调有关服务工作和产品形态。

4.4 加强对知识服务的技术保障

图书馆开展的以关联数据为基础的知识服务,需要对海量的知识进行分析、整合和重组;需要运用数据挖掘、智能检索等技术对知识资源进行深度分析,需要通过推送技术、导航技术为用户提供个性化知识服务。由此,如何将本馆的馆藏发布为关联数据,如何建立馆内外关联数据的导航,如何将关联数据嵌入到用户的科研系统,并为用户提供一站式的知识服务等问题,都要求图书馆要有能提供知识服务技术保障的团队。该团队除了要掌握关联数据和互联网的基本技术外,还要充分了解本馆馆藏的实情,清楚读者的需求。

4.5 组建高素质的知识服务团队

图书馆开展的知识服务需要将多种媒体的信息资源进行深层次分析、整合和处理,找出符合用户需求的知识,同时还要求综合利用多种信息技术、网络技术,科学地将知识内容显示出来,并根据用户研究过程中不断出现的新情况,自始至终参与解决问题的过程,通过与用户的交流互动最终形成解决问题的方案。这些过程需要图书馆员具备熟练的计算机操作能力,具备相当的图书情报专业知识、相关学科专业知识、一定的外语水平、良好的沟通能力等素质和技能才能实现。单靠某个或者几个馆员,是无法取得令人满意的服务效果的。因此,在图书馆知识服务中必须依靠团队的力量,而且往往团队所做出的决策要比单一个体所做出的决策更有创意,更能满足用户需求,从而提高图书馆的服务质量。

作为语义网的一种实现方式,关联数据通过发布和链接网上的结构化数据使得来自不同领域的异类、异构数据相互关联,并根据信息内容中的知识对象、知识关系连接和集成相互关联的内容,从而支持基于网络的知识组织和知识发现。随着关联数据规模的不断扩展,其在企业、图书馆和政府部门当中的应用也将日益广泛。关联数据在给知识服务带来挑战的同时,也带来了新的机遇。

[1] Structured DynamicsLLC.Linked DataFAQ[EB/OL].[2010互03互06].http://structured-dynamics.com/linked_data.html.

[2]潘有能,张悦.关联数据研究与应用进展[J].情报科学,2011,29(1):124互130.

[3] Berners-Lee T.Linked Data[EB/OL].[2010互01互20].http://www.w3.org/DesignIssues/LinkedData.htm.

[4]刘炜.关联数据:概念、技术及应用展望[J].大学图书馆学报,2011(2):5互12.

[5]白海燕,朱礼军.关联数据的自动关联构建研究[J].现代图书情报技术,2010,26(2):44互49.

[6]白海燕,乔晓东.基于本体和关联数据的书目组织语义化研究[J].现代图书情报技术,2010(9):18互27.

[7]范炜,邹庆.词表资源关联化[J].情报理论与实践,2010(5):21互25.

[8]马费成,等.基于关联数据的网络信息资源集成[J].情报杂志,2011(2):167互175.

[9]李琳.关联数据在图书馆界的应用与挑战[J].图书与情报,2011(4):58互61.

猜你喜欢

关联图书馆资源
基础教育资源展示
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
一样的资源,不一样的收获
“一带一路”递进,关联民生更紧
资源回收
图书馆
奇趣搭配
资源再生 欢迎订阅
智趣
去图书馆