APP下载

SUSHI-网络电子资源利用与统计数据获取协议

2009-04-16闫晓弟

大学图书馆学报 2009年2期
关键词:统计数据报告数据库

闫晓弟 李 娟

摘要SUSHI是一个数据采集、传递的标准协议,为图书馆提供了更加高效、方便的获取本馆电子资源利用统计数据的手段。该文详细介绍了该规范的起源、架构、核心内容以及相关应用。

关键词SUSHI COUNTER ScholarlyStats电子资源利用与统计

近几年,很多图书馆都在进行着巨大的变革,越来越多的图书馆以网络化电子资源的形式把信息资源提供给用户。图书馆用于购买电子资源的费用逐年递增,美国研究图书馆协会的统计数据表明,该协会大学成员馆平均电子资源花费占文献总经费的比例已经从1992-1993年的3.6%上升到2000-2001年的16.25%,2003-2004年上升到31.33%,2005-2006年更上升到43%;国内一些大学图书馆的电子资源购置费占到全年文献资源建设费的三分之一甚至更高,因此,图书馆希望了解电子资源的使用情况,包括利用统计数据、各用户使用状况等,通过掌握统计数据和相关信息,可以评价电子资源采购的价值、制订和调整电子资源建设政策,开展相应的用户培训服务等,使电子资源成本效益最大化。

虽然各数据库商都提供给图书馆有关统计数据,但是,数据商各自都有一套内部的统计数据处理方法,尤其是国内的数据商提供的统计信息千差万别,这就影响了统计数据收集的一致性和标准性。为了比较不同数据库的使用情况,更科学、可靠地评价本馆电子资源的使用价值,图书馆希望数据库商提供的数据具有可比性,也就是这些统计数据要遵循统一的标准得出,在这种情况下,COUNTER(Counting online usage of Networked Electronic Re-sources)应运而生,它为SUSHI协议的产生提供了前提条件。在介绍SUSHI前有必要了解一下COUNT-ER标准。

1、COUNTER标准简介

COUNTER的目标是研制一系列实施规范,以管理不同类型网上电子资源的使用数据,规范记录和交换这些数据的指标和途径。要求“遵从者”必须向用户提借符合COUNTER标准的使用统计报告,并规范了在线使用数据的定义,使各供应商生成的统计数据具有一致性、可靠性和相互兼容性,并且能方便记录和交换。2005年4月,在COUNTER第2版草案经过一年的试用后,正式发布。

COUNTER报告的内容包括:期刊报告、数据库报告和选择性报告。COUNTER报告的使用,为图书馆科学、客观地评价数据库使用情况提供了准确的数据依据,对于数据库出能做出较为客观的评价。很多数据库商都为用户提供基于COUNTER标准的使用统计。但是另一方面,电子资源种类丰富、各用户所需要数据不尽相同,而且每个出版商提供的数据也不尽一致,依然存在着格式的不一致性,EXCEL并不是最好的导人数据到自动化系统的最好格式,收集和处理报告比较费时,因为有众多的数据库商,很多站点的日志,需要不同的程序处理很多报告。因此迫切需要一个统一的数据统计平台或协议,SU-SHI就是在这种需求下产生的。

2、SUSHI协议

2.1SUSHI项目的由来

电子资源在图书馆馆藏资源中占有越来越重要的位置,图书馆每年会花费不少的经费在电子资源上,但是这些资源的利用情况如何?所购电子资源是否满足读者的需求?图书馆就需要相关的使用统计数据,如何才能更方便地收集、整理和分析统计数据,并使各数据库商提供的使用数据具有可比性、可靠性和一致性?基于对这些因素的考虑,SUSHI(The Standardized Usage Statistics Harvesting Initia-tive)作为一个草案标准版本由NIS0发起,标准定案完成于2006年9月,作为草案标准用于测试使用,试用日期为2006年9月20至2007年5月20日,在测试使用显示比较成功后,对标准进行了小幅的调整,2007年7月被选作为Z39.93-200X标准协议。

SUSHI是一个协议,自动通过一个XML架构将使用数据从一个系统传送到另一个系统,这个XML架构定义了一个请求和响应系统。它是一个XML信息,也是一种在两个系统之间传输信息的方法,以Web Service的方式实现,它使用的是一个SOAP(simple Object Access Protocol)协议。

这个标准协议定义了一个利用web服务框架,自动请求和答复获取电子资源使用数据的模式,它被设计为与COUNTER报告一起使用,SUSHI协议也被扩展到其它类型的使用报告。SUSHI的目标是从日益增长的数据资源提供商那里解决和实现使用统计数据的收割和管理问题,完善了使用格式的一致性并能对数据进行自动化处理。

2.2SUSHI与COUNTER

在使用COUNTER之前,由于网络电子资源和数据库来自不同的出版商或中间商,在提供给用户的报告中,采用的是不同的统计内容、统计标准以及不同的统计格式,用户在比较不同资源在本单位的使用时,会遇到很多麻烦,甚至无法比较。COUNT-ER标准的采用在一定程度上规范了数据库商向用户提供的数据格式、内容、术语等,使各数据库的使用数据具有一定的可比性,解决了图书馆用户和信息工作人员统计数据库利用情况时的难题。

但随着网络电子资源和数据库日益增多,仅仅用COUNTER进行规范也有其局限性,正如前边提到,不是所有的数据库商都提供符合COUNTER标准的数据,依然存在着格式的不一致问题,以及众多的平台和数据库的数据处理问题等。SUSHI在COUNTER标准的基础上,采用统一的协议,来收集这些不同数据库商提供的数据并进行处理,使用户在很大程度上能更系统、高效地收集和分析数据库商提供的使用数据,节省用户在使用数据收集和整理上的时间,使用户有更多的时间进行数据分析,为用户的科学决策提供数据依据。未来,支持SUSHI可能会成为COUNTER依从的必要条件。

2.3SUSHI的结构

SUSHI的结构如图1所示,使用SUSHI的图书馆系统发出一个使用统计报告的请求,SUSHI客户端将这个请求发出,SUSHI服务器收到这个请求后处理这个请求并且利用COUNTER报告,然后将数据报告打包并返回应答,最后SUSHI客户端处理返回的COUNTER报告。

图书馆和内容提供商都连接到互联网上,SU-SHI客户端是一个运行在图书馆服务器上的软件,通常与ERM系统结合在一起。SUSHI服务器是一个运行在内容提供商服务器上的软件,通过它可以访问使用数据。当ERM系统需要一个COUNTER报告时,它向SUSHI客户端发出请求,客户端收到后,向内容提供商提出请求,这个请求详细说明了报

告的具体要求和哪一个图书馆需要这个报告,SU-SHI服务器读到这个请求后,会处理相关的使用数据。之后,SUSHI服务器创建一个XML格式的请求COUNTER的报告,依据SUSHI XML架构,SUSHI服务器准备回复信息,COUNTER报告(XML)被加载到回复信息中,这个响应被传送到客户端,SUSHI客户端会处理这个回复信息并且抽取COUNTER报告,被抽取的COUNTER报告会被传送到ERM系统中做进一步的处理。

2.4SUSHI的应用——SeholadyStats

MPS Technologies公司与美国、澳大利亚及非洲等的团体和学术机构信息工作人员紧密合作,开发了增强图书馆利用统计分析服务。通过合作,MPS了解图书馆希望把利用统计的数据整合成馆藏与价格的对照模式,于是在50多个参与馆的协助下,ScholarlyStats得以成形,并通过一个用户界面友好、以跨平台的方式为各图书馆提供统一的使用情况统计。这套系统在SUSHI协议的基础上,将获得的利用报告用ScholarlyStats加以整理并自动转换成图书馆所需要的数据,进一步减少组织这些数据的时间,并且极大地提高使用效率。

ScholarlyStats为信息人员提供一个单点访问其所有数据库平台的使用情况统计,它可以统一收集、整理来自不同平台的使用报告,将这些使用报告整合为一个综合性报告提供给用户。它是一个因特网架构的入口网站,可以从多个信息来源很方便地承担搜集、整合与分析电子期刊使用量的工作。在COUNTER格式的支持下,图书馆可以通过单一、直观接口查看与下载使用量统计报告,使图书馆工作人员能正确搜集到资源的使用信息并以此作为采购决策的辅助依据。使用统一的ScholarlyStats报表,图书馆工作人员可以掌握期刊和数据库每个题目级别的使用,ScholarlyStats报表提高了进一步分析确定使用的趋势,指出高使用率和低使用率的资源。

ScholarlySmts的工作过程如图2所示,Schd-arlyStats收集和整合书商每月提供给图书馆的期刊和数据库使用统计数据,将这些信息处理为标准的格式,并且将这一系列的报告发送到图书馆的ScholarlyStats门户。ScholarlyStats报告包括一套整理过的统一的报告,这些报告在COUNTER编码标准的基础上显示了所有数据库所提供的数据库的使用情况。为了提高分析使用的趋势,还发送一组增强的图表报告。根据需求,MPS可以将Schol-arlyStats报告传送到其他的图书馆系统,包括ERM系统,因为ScholarlyStats遵循工业标准SUSHI协议,因此可以将这些数据自动地进行传输。

伯明翰大学图书馆也和其他图书馆一样,利用更多的时间收集和分析数据库的使用数据和结果,伯明翰大学信息服务通过10个具体学科的图书馆站点和资源中心向读者提供图书馆服务。他们提供了现代的、高科技的、功能型的学习空间,并将图书馆与计算机设备相结合,提供了16000多种电子期刊。2006年2月他们开始利用ScholarlyStats作为其电子资源分析的平台,在很大程度上能更系统、更有效地收集和分析使用数据。在使用ScholarlyStats之前,伯明翰大学图书馆没有系统地收集任何相关的使用数据,因为没用足够的人力资源按月收集、统计数据,这样做太浪费时间。输入密码、登陆到每个网站,再从五花八门的数据中找到一致性,这个过程相当麻烦。

伯明翰大学的预算都被分配到各个学院,各院的教授通过投票来决定是否重新订购还是取消续订,这种操作的实际反馈率很低,而且给人们的印象是实际操作是不可靠的。目前学院主要的资源都转移到了网络,从而提供可靠有用的数据就变得尤为重要。所以他们下决心通过工具来减轻数据统计的压力,让工作人员有更多的时间去分析结果,并将馆藏情况反馈给学院。

使用了ScholarlySats,他们在统计数据方面取得了很大的进步。ScholarlyStats提供的整合的期刊全文请求和数据库搜索与进程报告,得到一个整体的交叉平台的题名或者一系列题名及数据库的使用情况的图形,也可以用资源报告形式在续订时来评估一些订购的实际价值,无需去数据库商的网站查询。显然,ScholarlyStats为伯明翰大学图书馆提供了一个很好的机会来更好地定性分析他们的期刊馆藏。

同样,奥塔哥大学(The University of Otago)有一个强有力的远程教育系统,教授范围涉及了整个新西兰,同时覆盖了澳大利亚、斐济的一些地区,这意味着他们要为许多个人提供远程支持。而电子信息内容是其中非常重要的一部分,能有效地提供这种电子资源就显得尤为关键。奥塔哥大学图书馆也希望有一个更好更便捷的方式来评估数据库商电子信息内容的使用统计数据。MPS科技为奥塔哥大学推荐了ScholarlyStats,并为奥塔哥大学提供了单独的人口,这样就可以以一种统一的、标准的形式来评估数据库的使用统计数据。

在使用ScholarlyStats之前,每个网络资源提供商都会在不同的时间以不同的形式来提供使用数据。为了使报告中的数据具有一致性、可用性,图书馆工作人员需要花很多的时间来重新整理这些使用数据。管理这些数据要花很长的时间,因此他们通常只在续订时查看统计资料。这样做的最终结果,导致除了那些比较贵的数据库外,大部分信息都被忽略了,失去了更好地评估所有内容的机会。

使用MPS的ScholarlyStats后,他们利用Schol-arlyStats来收集网上的使用统计数据并使其标准化,ScholarlyStats让图书馆能更便利地统一期刊信息和统计在整个数据库商平台上的各个数据库的使用情况,在此基础上,来决定是否要购买。

统一的数据库报告使图书馆员可以了解一个完整的概况,而不是单个数据库资源的使用情况。图表报告也是一个很神奇的工具,它提供了一个快捷的概观。奥塔哥大学图书馆鼓励全体职员定期利用ScholarlyStats对图书馆的使用进行分析。每个星期10到12名图书馆工作人员使用这个平台来存取数据。来自这些职员的反馈一致都很积极,他们觉得该网站非常便于用户使用,设置帐户很容易,查看各种报告和提供的管理工具都非常简便。奥塔哥大学对于ScholarlyStats这样的使用结果非常满意。

从这两个大学图书馆的使用情况来看,Schol-arlyStms容易设置而且用起来很方便,如:添加平台的详细信息只需花费很短的时间,同时可以创建用户帐号。当有可用的新平台时,ScholarlyStats会及时通知用户,用户就可以及时决定是否要包含它们。

ScholarlyStats在SUSHI协议的基础上,很大程度上可以减轻信息工作人员收集和整理电子资源使用报告的工作量,节省了人工统计数据的时间,同时帮助信息专业人员更清晰地揭示院校机构内部的用户如何运用信息。可以让图书馆工作人员有更多的时间去进行使用数据的分析和评估,为图书馆的采访决策提供科学依据。

ScholarlyStats递送整合性统计报告给全球各地的图书馆,透过46种平台提供一份可涵盖7万多种期刊与横跨将近450种数据库清晰的使用量内容。这个网站可以与图书馆所使用的ERM系统相整合,为此Swets已经与三家地区性系统整合伙伴(其中包括Innovative Interfaces)进行合作计划,新的平台与新的合作伙伴仍持续增加中。除了ScholarlyS-tats,Innovative Interfaces、ExLibris等公司也将他们的产品升级支持SUSHI协议,如Innovative Interfaces的ERM。

我国大部分图书馆对于电子资源利用相关信息的收集和分析缺乏经验,因此,国内应该有一个统一的权威机构来规定或者要求和规范数据库商所提供的统计数据的提交格式、提交方式、统计项目、统计数据的可靠性等,规定所有数据商必须提供符合COUNTER标准的统计报告。同时,ScholarlyStats平台在国外的应用也为国内图书馆在收集和分析电子资源利用情况时提供了借鉴。

猜你喜欢

统计数据报告数据库
创新视角下统计数据的提取与使用
国际统计数据
2017年居民消费统计数据资料
一图看懂十九大报告
统计数据