APP下载

BIBFRAME与图书馆工作的变革*

2015-02-13安晓丽江苏科技大学图书馆江苏镇江212003

图书馆建设 2015年10期
关键词:编目书目关联

安晓丽 (江苏科技大学图书馆 江苏 镇江 212003)

BIBFRAME与图书馆工作的变革*

安晓丽(江苏科技大学图书馆 江苏 镇江 212003)

作为新的书目数据格式,BIBFRAME具有三大创新之处:面向语义网,以关联数据为基础;采用FRBR的“实体-关系”模型和RDF模型;适用范围广。BIBFRAME给图书馆带来了观念上和具体业务流程上(采购、编目和检索)的巨大变革。编目员需转变观念,参加培训,积极应对BIBFRAME。

BIBFRAME(书目框架)图书馆书目数据格式

作为图书馆重要的“大数据”, 书目数据贯穿于图书馆的所有业务流程中,从采访到编目,从馆藏揭示到读者服务。这些“大数据”如果能融入互联网,被全球用户利用,那将是一件很有价值的事情。目前,我们采用的书目数据格式是MARC格式,随着馆藏资源向着数字资源的拓展和互联网的全方位渗透,MARC不适用于网络的弊端已呈现出来,于是BIBFRAME(书目框架)应运而生。

1 BIBFRAME的产生背景、构成

BIBFRAME源于美国国会图书馆的一项全称为Bibliographic Framework Initiative的计划,该计划能使未来的书目描述出现在因特网上,不仅为图书馆具体需求服务,而且服务于更宽泛的信息社区。该计划将带来全新的资源描述方式和资源发布方式:明确区分资源的概念属性和外部表现、明确识别资源的实体(如规范数据)、揭示实体间的关系。在网络世界里,能将作品的概念属性(作者或标题等)和作品的外部形态(页码、是否有附录等)区别开来是一件很重要的事。尽管该计划给我们展示了一种新的有望取代MARC的书目数据格式,但它的目标远不止于此,还包括研究书目描述、数据创造及数据转换的所有影响因素,兼容不同的目录模型和分类规则,探索新的数据输入方法,评估信息交换协议等[1]。该计划的最终目的是形成一套适应互联网的书目信息应用规范(包括模型与实体、术语词表、编码及打包规则),以实现与图书馆以外的网络空间的信息交换[2]。

模型和词汇是BIBFRAME的重要组成部分。BIBFRAME模型作为一种概念模型,将在需详细记录的书目描述、其他文化材料的描述、不需详细描述的记录之间作出平衡。BIBFRAME模型里有4种类或实体:创造性作品(creative work)、实例(instance)、规范(authority)、注释(annotation)。创造性作品能反映待编资源的概念属性;实例是能反映作品的个体和材料组成的资源;规范是能揭示作品和实例之间关系的关键概念的资源,包括人物(people)、地点(places)、主题(topics)、组织(organizations)等,规范数据的一个重要概念是域,负责资源的识别和组织;注释是有助于我们扩充待编资源以外知识的资源,包括书评、摘要和封面设计等。这些被解构的信息资源将被再建构成有关联的数据,当我们利用网络搜索数据时,本地资源集合、特殊资源集合及第三方数据都会呈现给我们,最初的那些书目资源将以一种颗粒化的形式被更加有效的利用[3]。

BIBFRAME词汇是资源描述的关键,如同MARC有一套定义过的元素和属性,BIBFRAME词汇也有一套被定义过的类和属性,一个类代表一种BIBFRAME资源,属性则是对该资源更深层次的描述,可理解为子类。类和属性有严格的设计规则和命名约定,不可随意使用。例如,“an RDF classs”是指一类型事物;“BIBFRAME core classes”是指作品、实例、规范和注释;“domain and range”分别是指一个RDF三元组的主题和一个RDF三元组的目标或被渴望实现的价值;“structured entity”是指被结构化的且被定义了属性的类、子类或核心类等。BIBFRAME词汇使用关联数据模型,并利用RDF建模,使得所有实体、属性及其关系都成为网络资源[4]。

2 BIBFRAME的创新之处

2.1BIBFRAME与MARC

作为目前图书馆界的主流书目数据格式,MARC是由若干条记录组成的数据库,结构化特征明显。其外在表现是一条条具体的记录,每条记录由揭示资源特征的字段和子字段组成。MARC重点关注能单独理解的分类记录,一条记录聚合了概念作品及其物理载体信息,同时借助字符串标识记录之外有价值的个人名称、企业名称、主题等信息[1]。MARC将资源的每种信息都捆绑在一起成为一条完整记录,导致多条记录之间存在重复信息,且不能直接用于图书馆系统之外的环境交流,不能增加评论、视频和声音等。

与MARC相比,BIBFRAME的创新之处表现在以下几点:首先,BIBFRAME面向语义网,以关联数据为基础,决定了其是适用于网络的。语义网是在万维网基础上增加了资源描述框架(RDF)编码,使部分网络资源具有语义表达能力,而关联数据是语义网的简化实现形式,关联数据的重要原则是使用HTTP URI作为任何事物的标识,任何人都能访问这些标识,当有人访问时能提供有用的信息和相关的URI[5]。BIBFRAME的最小单位不是记录,是记录被拆分后的一个个相互关联的更小粒度的语义单元。这些语义单元将被赋予唯一的HTTP URI标识,实现不同命名间的跨网域链接,从而实现整个网络空间的覆盖。其次,BIBFRAME借鉴了FRBR(书目记录功能需求)的“实体-关系”模型,重点关注资源之间的关系(作品之间、作品与实例之间、作品与规范数据之间),并通过可控的人名、地点和语种等标识符达到揭示这种关系的目的。在网络世界中,事物间的关联很重要。RDF模型也是BIBFRAME的精髓,BIBFRAME模型是使图书馆书目数据成为浩瀚网络数据中的一部分的关键所在。BIBFRAME为网络而生,能使书目数据在网络上发布、共享,这是它最显著的特点。最后,BIBFRAME适用性广,不仅可描述图书馆书目,而且可应用于对计算机程序、博客文章、静态动态图象等的描述。

2.2BIBFRAME与RDA

BIBFRAME与RDA(资源描述与检索)关系密切,如同机读目录格式是参照AACR确立的,BIBFRAME同样是参照RDA制定的。作为新的国际编目标准,RDA是以AACR2为基础,以FRBR和FRAD(规范数据功能需求)为模型,解决数字环境下不同类型资源在著录项目、著录格式、著录用标识符等方面的标准问题,进而实现对各类型资源的书目控制。RDA将图书馆编目对象抽象为三类实体:作品、责任者实体(个人、家族和机构团体)、主题类实体(概念、地点、事件和实物),再从属性和关系两方面进行规范控制,改变了AACR2以具体的资源类型分述编目规则的体例。RDA的三大特点是编目标准FRBR化、编目标准适于网络、编目标准适用范围广及兼容性强[6]。

RDA以FRBR为模型,BIBFRAME以RDA为基础,所以BIBFRAME也是在间接吸收FRBR关于实体、属性、实体间关系、实体与属性间关系的概念模型基础上对书目信息进行编码,但BIBFRAME并未完全照搬而是简化了FRBR模型,而RDA是FRBR模型的忠实实践者,所以BIBFRAME与RDA的编目数据并不完全一致。

3 BIBFRAME对图书馆工作产生的变革

技术在进步,社会在发展,图书馆无疑也需要变革。在馆藏资源利用率日趋下降、入馆读者日趋减少的当下,图书馆该如何转型才能在新环境中继续发挥其收藏知识、传播文化的职能?与网络息息相关的BIBFRAME无疑给我们指出了一条新出路。BIBFRAME作为一种新生事物,其实际价值有哪些?对图书馆将产生怎样的变革?

3.1 观念上的变革

BIBFRAME开启了一种“大图书馆”的思维方式,颠覆了传统的狭隘理念。所谓“大图书馆”,是指图书馆的书目资源以更加开放、更加共享的形式融入互联网,书目资源的价值变“大”了,图书馆的利用率变“大”了,与外界的藩篱被打破,图书馆空前的变“大”改变了传统环境下书目资源只能在自身系统内被利用的封闭的“小”格局。我们狭隘的、仅围绕资源和服务的“小”观念将受到冲击。

3.2具体业务工作上的变革

BIBFRAME书目框架与网络有着天然的渊源,从模型到词表再到技术架构等都是为融入网络而设计的,这也决定了图书馆各项业务将在新的以BIBFRAME为格式的系统中完成。而MARC格式下的各项业务是在图书馆自动化管理系统(ILAS、汇文等)中完成,自成一体,与外界不发生信息交流。

3.2.1采购的变革

传统的采购数据是由出版商提供的比较简单的MARC数据,格式固定,维护起来比较麻烦,而BIBFRAME下采购人员在采购阶段就能添加更详细的“作品”“实例”等信息,这些信息反馈给读者,便于读者及早地了解到某资源已在订购中。当订购资源到位后,编目人员看到的也是更新后的全面信息,实现了采购、编目和检索的协作。

3.2.2编目的变革

BIBFRAME对编目这一业务流程影响最大,将实现真正意义上的网络编目。在手工编目时代,每个图书馆都在编目,馆际之间缺少合作,造成书目资源的封闭、浪费、重复;联合编目时代是计算机编目,大多数图书馆可以共享少数几个图书馆的书目资源,人财物得到了节省;时代发展到现在的网络编目,关联的书目数据融入万维网,同时各图书馆既可以使用数据,也可以更新数据,馆际合作空前繁荣,实现了真正意义上的与全球网络的对接及资源的共享共建,对编目员来说,开阔了视野,提高了效率。例如,要对某馆藏作品进行维护,先到BIBFRAME的新系统中找到该作品(相当于一个具有HTTP URI的多种属性的关联数据),再复制到本地系统,赋予其一个本地URI,最后添加相关信息即可[7]。新系统还有个更大的特点,当某作品的关联属性需要更新时,任何图书馆发现后都可以被授权操作,进而更新到系统中,被全网络共享。

3.2.3检索的变革

BIBFRAME和MARC是两种不同的检索方式,其实施过程和检索效率也大不相同。MARC格式下,当我们搜索某种资源时,需要进入图书馆OPAC系统,我们可获得与MARC字段属性保持一致的检索结果,同时也获得了相关资源(包括链接到豆瓣网、Google和Baidu可查看到的相关书评和作者简介等信息),还可以获取该责任者在该OPAC系统中的其他作品。

采用BIBFRAME后将拓宽检索范围,改善服务质量。BIBFRAME以关联数据为实现方式,而关联数据是基于HTTP URI等成熟的网络技术,以HTTP URI标识的数据可方便地链接到网络的数据集中;同时关联数据采用RDF数据模型对数据建模,使数据易被机器识别和处理[7]。所以,基于BIBFRAME的检索结果是可获取到关于某事物的立体化的多种属性,远超越了MARC以文本出现的单一属性,并且万维网的搜索引擎能覆盖到这些书目数据。例如,当我们以题名项属性搜索某种资源时,检索结果是多方位的,不仅包括该题名的资源,还包含与该题名资源的其他属性(ProviderEventRelationLanguage)相关的资源,还包含与注释模型中的一些信息相关的资源(关于作品的评论、关于作者的传记信息、关于出版者介绍等)。对于用户来讲,如此丰富的有关联的检索结果算是一次高质量的检索体验。

4 客观分析并积极应对BIBFRAME

BIBFRAME顺应了技术发展和社会发展潮流,前景良好。但也存在几个疑虑:一是管理层的担忧,BIBFRAME的调试使用需要大量的经济投入,这样的经济投入是否有必要?BIBFRAME到底能带来多大的价值?毕竟新技术的应用说到底是一个经济问题,而不只是与时俱进的观念问题[8]。二是人员的抵触,BIBFRAME使用后将改善编目,改变图书馆所有业务,但前期的新系统的接受适应、观念的扭转、新技能的拓展并不容易,保守的工作人员会有抵触情绪。三是BIBFRAME的规范控制如何实现?既然各个机构都有更新书目数据的权利,其结果可能导致书目质量下降。为保证高质量的书目数据,需进行规范控制,建立配套的书目质量标准和监控体系,还可引入社会化众包模式进行规范档的纠错维护,利用大数据分析进行自动的规范术语的获取[9]。

尽管MARC格式在图书馆界曾做出了巨大贡献,尽管BIBFRAME的被认可、被应用还需要一段时间,但未来发展趋势必将是MARC与BIBFRAME并存或被取代。BIBFRAME对图书馆的影响不仅是编目,而是整个业务流程;不仅是实践上的,更是思维方式上的。我们该如何应对BIBFRAME?作为图书馆,需整合有限的资源以加快促成格式转换这一战略目标的实施,具体做法:一是进行基础设施方面的投入,包括软硬件、网络配置、基于BIBFRAME书目框架的新系统的引进和维护、原自动化管理系统的处置;二是实施培训计划,BIBFRAME彻底颠覆了我们目前的工作和思维,所以进行新系统和新技能的培训很有必要。作为编目员,为适应未来的关联数据目录和工作流程,首先要转变观念,认识到书目信息不再局限于某个系统或某家机构,而是在整个互联网空间传输和交流;其次,需要学习新知识和发展新技能,如关联数据、RDF、HTTP URI技术、规范控制、新系统的理解掌握等。

BIBFRAME计划从提出到现在已有4年之久,其间经历了关联数据模型草案的推出、功能需求和用例的发布、BIBFRAME词表的发布、规范控制的更新等工作。而我们所能做的是多关注、多引介、多参与研究,以推进BIBFRAME早日付诸实践。

[1]Library of Congress.BIBFRAME Frequently Asked Questions [EB/OL].[2015-04-20].http://www.loc.gov/bibframe/faqs/#q02.

[2]刘炜, 夏翠娟.书目数据新格式BIBFRAME及其应用[J].大学图书馆学报, 2014(1):7.

[3]Library of Congress.Overview of the BIBFRAME Model[EB/OL].[2015-04-21].http://www.loc.gov/bibframe/docs/model.html.

[4]Library of Congress.BIBFRAME Vocabulary: Terminology and Conventions[EB/OL].[2015-04-21].http://www.loc.gov/bibframe/docs/vocab-conventions.html.

[5]吴贝贝, 宋文.从MARC走向Bibframe:后MARC时代的书目记录[J].图书情报工作, 2014(5):87.

[6]吴丽坤, 殷洁.文献编目理论研究[M].北京:中央编译出版社, 2013:240.

[7]夏翠娟.面向语义网的书目框架(BIBFRAME):功能需求及实现[J].大学图书馆学报, 2014(6):61.

[8]胡小菁, 李恺.MARC四十年的发展及其未来[J].中国图书馆学报, 2010(3):85.

[9]刘炜, 张春景, 夏翠娟.万维网时代的规范控制[J].中国图书馆学报, 2015(3):9.

安晓丽 女,1979年生,现工作于江苏科技大学图书馆采编部,馆员。

Discussion on BIBFRAME and Transformation of Library Work

As a new kind of bibliographic data format, BIBFRAME has three innovations: Semantic Web oriented, and based on related data, using entity-relation model of FRBR and RDA model, and broad applicability.BIBFRAME brings an enormous transformation on both conceptions and concret work of libraries, including purchasing, cataloging and retrieving.The cataloguer should change their ideas, attend training to face BIBFRAME actively.

Bibliographic Framework; Library; Bibliographic data format

G250.1

A

*本文系江苏科技大学图书馆科研项目“基于关联数据的BIBFRAME(书目框架)与图书馆的变革研究”的成果之一。

猜你喜欢

编目书目关联
推荐书目《初春之城》
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
国家图书馆藏四种古籍编目志疑
“一带一路”递进,关联民生更紧
奇趣搭配
粤剧编目整理之回顾与展望
智趣
CALIS联机合作编目中的授权影印书规范著录
网络环境下图书馆编目工作问题探讨
本刊邮购书目