APP下载

基于长尾数据监管的图书馆信息服务模式创新与发展

2019-03-27宋微

福建教育学院学报 2019年10期
关键词:长尾科研项目生命周期

宋微

(福建师范大学协和学院,福建 福州 350117)

网络信息时代数据呈现急速增长,大数据时代已经来临。数据总量的高速增长以及复杂变化给用户带来了更加优质的服务体验,但是海量的数据也给其监管和存储带来了诸多的困难,图书馆的数据管理也面临这一难题。[1]图书馆在现代信息技术的冲击之下,传统的资源数据服务遭到了现代搜索引擎的巨大挑战,用户资源被大量分流,已经逐渐脱离了学术最佳聚合度的中心位置。大数据在大科学领域应用广泛,但是处于数据长尾位置的小科学以及其他新兴学科领域在整个科技研究中缺乏必要的关注度,这些长尾数据包括实验数据的记录以及存储未能展现其真正的学术价值。[2]作为数据监管以及存储的最佳机构——图书馆,此时就展现了对长尾数据的服务优势。这也是本篇文章研究的目的所在。

一、长尾数据及数据监管的概念

有关学者的研究将长尾数据定义为:投资较小的非基金项目研究过程中产生的数据。图书馆对于数据监管的中心在于小科学领域,因此图书馆对于长尾数据的服务需求增长明显。小的科学项目一般是由较小的科研团体推进,产生的数据量虽然小,但是汇聚起来总量很大,这种科研项目一般只注重研究结果,对于研究项目的前期、中期数据没有详细的记录,这些数据有可能带来全新的研究领域,因此具有重要的科研价值。这种长尾数据一般只保存在小型研究团体的科研人员手中,如果图书馆不提供服务进行存储管理,不利于数据的永久保存。[3]

数据监管这个词,在美国的学术界统一被称为“Date Curation”,中国图书馆学者在引用国外专业术语时,将其翻译为数据字典、数据监护、数据监管或者数据管理,不同的翻译表示不同的意义。国外对于数据监管的定义,主要是从数据的全生命周期开始,从数据的产生、存储、利用、维护以及再利用等活动出发。在国内,数据监管的定义主要归纳为两个方面:一个是与国外数据监管相类似的数据选择、存储以及加工,另一个是挖掘数据背后的隐藏价值。[4]引用数据监管这一定义,更加注重数据的动态化以及周期性特点,强调数据监管不仅仅是在整个生命周期对数据进行管理,还需要能够满足用户在数据全生命周期中对数据背后隐藏价值的利用,能够更加有效地实现数据增值,并且为图书馆的可持续利用发展提供自己的动力。

二、长尾理论在图书馆数据监管中的作用

有关研究表明,科学研究的数据来源主要是通过实验的过程以及数据资源库所获得的第一手资料,大的科研项目一般都有专门记录数据的机构,但是对科研项目中的长尾数据,高达80%左右未受到关注。如果要将这些长尾数据永久保存并加以利用,图书馆就必须有针对性地进行收集、存储和监管,才有可能将其再利用。

(一)长尾数据在图书馆数据管理中的需求分析

图书馆的数据资源主要包括学位论文库以及专业数据库,同时包含一部分特色数据库,比如CNKI、Elsevier等标准的数据资源,这些数据资源在图书馆网站上进行集成,构成了图书馆的网络资源数据库。图书馆的长尾数据库,就是在这些数据资源基础上针对小型科研项目的集中数据,包括相应的数据特征、数据的标准形式以及分布特点等,是图书馆整体服务内容的一部分。图书馆在当前面临用户资源被严重分流的情况之下,需要重新构建服务内容,让用户重新聚合在图书馆资源中心之下,这也是当前图书馆面临的主要使命。

图书馆现有的数据管理主要以机构知识库为主,数据库包含有本校师生的期刊论文以及学位论文,但是科学研究中的实验数据以及视频和算法程序等其他数据并没有得到有效管理,存在只注重科研的成果不注重相关支撑数据管理的问题。本文主要研究长尾数据监管中图书馆的服务内容,目的是为了科研数据能够被后期科研再利用,提倡建立存储规范,对科研产生的数据进行全过程存储,以充分挖掘信息价值,达到信息增值的目的。图书馆作为一个非盈利性的服务机构,在向公众提供服务的过程中,不可避免会出现长尾数据。图书馆管理人员应针对长尾理论聚合数据资源,满足用户需求,使用户接触到那些很少被利用的数据,并且运用到自己的研究之中。这也是图书馆在科研数据资源管理中所发挥的中心作用。

(二)图书馆参与数据监管的途径

面对大数据时代的挑战,传统的图书馆服务模式已经不能够满足用户的需求,需要对图书馆的功能进行重新定位,以便于为用户提供更好的服务。今天出现的图书馆数据监管服务,是图书馆进行角色转型的一种新形式。美国国家科学基金会最近规定,新申请的项目必须提交相关数据管理计划,该管理计划强调和重视的就是关于数据的存储和保存方式。图书馆作为主体参与其中,必须适应大数据的时代背景,转变服务方式,开展更高层次的信息资源服务,同时对数据的监管和实践起到积极作用。

图书馆在长期的信息服务中积累了大量关于数据标准的技术文件,再加上本身具有的文献管理优势,能够让其在数据的分类组织、资源详细描述以及对于数据资源编目检索等领域具有较高的专业水平。图书馆在现有的资源数据库的基础上,由原来的关注科研项目的最终成果奖向关注支撑科研项目的数据材料转变,由原来的资源被动收藏者变为主动的知识管理机构。图书馆提供的数据监管服务,能够有效利用图书馆及其管理员的专业知识,且在数据监管服务过程中,相应平台的建立、用户需求的分析以及提供的数据标准形式,都能够与图书馆的服务相结合。

(三)图书馆在长尾数据管理中的生命周期形态

在信息资源日趋集约化的今天,我们还没有找到一个合适的模型来描述小型科研项目中数据的集合形式,这些数据集合在聚合中具有高度的异质性,往往是想要跨越长尾科学以及相关的数据监管形式,在新的生命周期下形成一种监管的新形态,以便于数据的使用。长尾数据自从被纳入科学领域以来,就开始了新的生命周期形态。在后续的科学实验设计、数据分析、得出结论以及资源使用等等都会产生一定量的科研数据,这其中就包括长尾数据的生命周期全过程。

图书馆在这一个生命周期之内,数据监管的中心在于数据的收集和整理,以及对于数据的挖掘,利用长尾聚合以及语义匹配等不同阶段特点进行充分挖掘。这就要求图书馆在不同的数据阶段进行科学的监管,提供不同的服务形态。在科研项目的前期假想实验数据,图书馆对于实验数据进行收集和整理,对数据形成动态的鉴定和选择。然后与相关联的科研工作者进行合作,制定相对应的监管计划,对于长尾数据的产生类型、产生的数量、保存的期限、保存的形式以及访问的权限等都有明确的规定。同时需要规定数据的标准形式,形成统一的格式标准,这样方便统一操作。对于关联数据的方式,可以全生命周期过程进行关联,也可以让不同项目的相似数据或者是同一项目不同研究者之间的数据进行统一的管理,以便于数据结构统一,形成一种资源的聚合效应。图书馆现有的资源平台主要是数据资源库、相关行业的制作标准以及部分流动的网络集合数据,这些数据都可以为图书馆的数据监管提供有利条件。图书馆可以通过自己的技术搭建数据平台,制定统一的数据格式标准,这样才能够有利于长尾数据的存储。在图书馆进行后期服务中,更需要考虑对于数据支持的存储和再利用,同时要特别关注产权的保护,这也是今后需要重点研究的内容。

三、图书馆在长尾数据监管中的对策

在今天高速发达的科技时代,数据密集型是其主要特点,用户需求发生了极大的转变,图书馆应该发挥其在学术研究中的中心地位,展现其本当具有的学术价值,为中小型项目的科学研究以及教学提供数据监管服务,完善他们的科研数据全生命周期管理,同时也需要扩展其在数据长期存储中所发挥的作用。

(一)需要转移数据监管的重心

如果科研项目缺乏相应的监管计划或者是管理制度不够完善,如果科学数据保存在科研人员自己的手中,一旦这个科研计划结题或者结束,那么所保存的相应数据就会被遗忘,达不到数据资源的共享和优势再利用,数据价值因此会被丢失,就无法挖掘其隐含的价值。长尾数据的全生命周期形态,就是要求科研项目在进行项目申报时图书馆的数据监管工作就开始提供相应的管理服务,将原来的监管中心由注重收集研究的成果转向对于科研数据的搜集。在科研项目开展的初期与研究人员进行紧密合作或者是直接加入到研究团队之中,对于在项目中产生的中间数据或者是推导数据进行有效管理,这样形成的最终成果数据,也具有一定的学术价值。当地图书馆要在国家制定的政策基础上,结合自身的实际情况,制定相应的数据监管计划,对于不同的数据类型以及数据形态进行分别归类,弄清楚哪些数据是需要纳入监管计划的,同时考虑如何对数据进行标准化处理,形成统一的格式形态,对于统一的格式进行结构化和自动化处理,数据特点描述要统一,数据的更新周期、内容形式都要包括在共有的监管计划之中,形成实时动态化的监管模式,这样才能够充分发挥数据的价值。

(二)需要对于长尾资源的聚合进行转变

图书馆现有的长尾资源主要集中表现在读者长尾、资源类型的长尾以及服务类型的长尾三个方面,要实现长尾数据的可持续发展,需要转变其资源聚合方式。在科研项目研究前期以及研究中期所产生的数据不仅体量巨大,而且具有一定的动态性和暂时性,这就要求图书馆高度重视科研项目产出的数据内容,加强对这部分数据内容的收集和存储,以便于进行长期保存。图书馆可以利用自身资源整合的技术优势以及资源聚合的优势,对长尾数据进行统一管理,聚合数字相关的资源,从而有效扩展图书馆的服务空间以及内容空间,同时也扩大图书馆的信息容量。需要长期保存的数据资源特别需要图书馆这一资源平台进行数据的维护整理,以便于后期挖掘出隐含其中的长尾用户的潜在需要,积极拓展长尾数据的资源,方便用户发现和利用有效的资源,实现资源的循环利用价值。同时图书馆已经在世界各地形成一个广泛的网络,各大图书馆都有网络进行连接,但是图书馆网的资源聚合程度还有待进一步发展,图书馆的资源数据平台还只是单个体系,没有形成一个统一的标准,相互之间的数据合作很难开展。在现实中图书馆的长尾数据聚合并不仅仅只依靠一个图书馆的力量就能够完全实现,必须是图书馆在网络环境中与其他图书馆进行联网结合,形成一个有机的整体,各图书馆共同参与才能够将数据资源充分纳入到监管体系中,在方便用户需求的同时也能够对数据资源进行统一聚合发展。

(三)保护相应的知识产权信息

图书馆在对数据资源的收集、存储、上传、保存、利用整个过程中都会涉及到数据的存储方式、数据的存储位置、合适访问权限,数据是否共享使用等管理性的安全问题,这就意味着数据的整理工作牵涉到数据的知识产权问题。在科研项目中图书馆拥有巨大的长尾数据,如果没有对数据的使用界限进行厘清,同时给予一定的使用界限,特别是一些军队院校牵涉到一些敏感的数据和项目,信息的使用权和所有权如果不作界定,很容易造成信息泄露,从而影响国家安全。这种情况与我们进行数据监管服务的初衷背道而驰,我们必须对这一问题高度重视。因此,图书馆在提供数据全生命周期的管理之外,对于长尾数据的知识产权保护也是一个重要的内容。鉴于数据备份的监管服务,国外的大学图书馆针对此类情况备份三份,即原始文档备份、外部本地文件备份以及外部的远程备份。同时根据相关签署的版权许可协议以及保存规定,将数据存储在资源数据库中,或者是连接外部站点进行联机发布,我国的图书馆可以借鉴国外这一做法。在对长尾数据的使用过程中,可以根据数据的不同涉密等级,建立相应的浏览权限,并且利用最新的技术对于访问者的身份进行审核,同时要求数据的引用者在数据使用过程中注明出处以及作者的详细信息,确保信息的安全访问。只有保证数据提供者的知识产权受到保护,长尾数据才能够不断地被图书馆存储和利用,这也直接影响到图书馆的可持续发展。

(四)需要转变服务的角色

国外先进的图书馆已经专门设置数据监管的岗位角色,国外的图书馆管理员能够被认为是解决科研项目数据资源的关键角色之一。图书馆的工作服务范围已经扩展到数据服务的范畴,专业的图书馆管理员在与读者进行交流的过程中,其角色定位、职责范围和服务方式都发生了一定的转变。数据监管员的职责就是在整个数据监管的全生命周期中,为了满足用户的需要以及需求的类别,结合小型科研项目的特点与小型项目的科研人员相互交换数据信息,提供图书馆与科研数据之间的连接入口,在研究开始的初级阶段就参与到数据整理的操作过程之中,对于数据的框架和格式进行统一的管理,制定相应的数据管理规范,将数据背后隐藏的信息充分挖掘出来,这样才能为数据共享提供相应的保障服务。这种长尾数据资源管理对于我国现阶段图书馆管理人员的能力提出了比较高的要求,数据监管服务岗位越来越成为图书管理的重要岗位,也代表了新形势下图书馆服务职责的变化。这就要求图书馆在新形势下做好数据监管人才的培养以及储备,进行综合知识的考量,做好重点培训,使相关专业学科负责人成为数据服务人员,根据最新的科学研究成果,立足于长尾数据的管理,积极拓展整个长尾数据的使用技能,这样才能够更好地为用户提供数据服务,保障整个图书馆在数据监管中的中心地位,使其在学术研究中重新回到主流学术中心的位置。

图书馆的数据监管服务为图书馆在大数据时代的生存和发展带来了新的机遇和挑战,特别是对于长尾数据的监管,更是契合了科研项目用户的需求。但是长尾数据监管服务在国内的发展仍然不够成熟,监管的界限也不够明确,这就需要我国图书馆充分参与到科研项目中来,大胆进行进行创新,积极提供数据服务,在未来更广泛的服务中更好地进行实践,这样才能赋予图书馆以新的生命力。

猜你喜欢

长尾科研项目生命周期
我校横向科研项目再创佳绩
全生命周期下呼吸机质量控制
航天科研项目评审工作的思考与探索实践
从生命周期视角看并购保险
民用飞机全生命周期KPI的研究与应用
长尾直销产品图鉴
长尾豹马修
企业生命周期及其管理
追踪长尾豹马修
申请科研项目,不应以职称论高下