APP下载

高校机构知识库构架探究

2011-02-21吴群

中国教育信息化 2011年5期
关键词:知识库学术机构

吴群

(南京工程学院 图书馆,江苏 南京 211167)

高校机构知识库构架探究

吴群

(南京工程学院 图书馆,江苏 南京 211167)

机构知识库是学术研究机构依托互联网而建成的一种学术文献数据库,文章分析了高校建立机构知识库的意义及优势,并就如何构建高校机构知识库进行探讨。

机构知识库;开放存取

一、机构知识库的概念及特点

1.机构知识库的概念

机构知识库(IR,Institutional Repository)是基于开放存取(OA,Open Access)的理念,学术研究机构依托互联网将本机构成员所产生的各种数字化内容进行收集、整理、组织、标识、索引,以开放性和互操作性为原则,实现对数字学术资源的永久保存和广泛传播而运行的一种信息资源管理和服务系统。美国SPARC资深顾问Raym Crow则认为机构知识库是收集并保存单个或数个大学、科研机构知识资源的数字化资源集合。[1]笔者认为,机构知识库是以网络为依托,以收集、整理、保存、检索和提供利用为目的,以本机构成员在工作过程中所创造的各种数字化产品为内容的学术文献数据库。

2.机构知识库的特点

(1)机构性。IR的建设主体和收藏的地域界限是特定的机构,即它的建立和运行是以机构为轴心和主线的,在这一点上区别于学科或专题的知识库。这里的机构既可以是实体的,如一个大学或研究机构,也可以是虚拟的,如虚拟联合实验室等。

(2)多样性。由于许多IR仅提供一个学术信息交流平台,对其中具体交流的信息只有内容质量或格式上的限制,而没有形式方面的限制,所以IR收藏的资源类型多样,有正式发表的学术著作,也有尚未发表的预印本;有人文社会科学的内容,也有自然科学的内容。[2]从出版的形式上看,IR主要包括机构内产生的科学成果如:学术报告、技术报告、工作报告、学术论文、会议论文、多媒体和视听资料、课程资料、教学课件、实验数据等。

(3)互操作性和开放性。这也是机构库的优越性,要保证与其他机构知识库之间的互操作,保证知识库中的内容能够被机构之外的用户方便地访问和使用,并且能够有效地存取其他机构的知识库的内容。

(4)积累性和永久性。IR中所收录的知识资源是长期保存且不断累积的,这就保障了IR资源的完整性与系统性,并可永久获取,IR以此来实现知识的记忆与传承。

除了以上四点之外,数字化与网络化、内容的学术性、综合性与动态性、社区驱动与聚集等也是机构库的独特表现。

二、建立高校机构知识库的意义

1.有效捕获并永久保存数字化学术资源

高校教师与科研人员普遍运用计算机处理各种信息,从而产生了大量的原生数字化学术知识产品,它们是各高校和科研机构重要的学术资源。而这些学术资源大都保存在个人或者院系的电脑上,个人电脑的存储容量有限,这些原生数字信息资源就会随着时间的流逝而丢失。随着计算机存储技术的发展,若干年后,可能不为新的软件支持,因此,需要为这些原生数字信息资源提供一个永久保存的安全场所。另外,把分散的学术资源有效集中起来,把不同格式的数据按照统一标准格式进行加工整理、集中存储、统一管理,为以后用户方便快捷地利用奠定基础。

2.实现学术资源的开放获取

在校园联网的环境下,利用高校IR中丰富的教学信息资源可以提升教学效果。学生可以利用IR中的课件进行学习,教师可以通过IR进行交流,完善教学课件和教学方法。由于各高校之间、各院系之间、各教研室、实验室的物理位置和科研活动的相互独立,造成彼此对相互之间的研究情况和研究成果互不了解,在教学、科研的沟通与交流上存在障碍。构建IR可将各高校、各院系、各教研室、实验室、个体研究者的相关资料和学术研究成果存储下来,在一个共用的网络平台上发布,同时提供无障碍浏览与检索,这样可以进一步促进相互间的学术交流,提高教学质量和科研水平。

3.扩大机构的影响力,提升知名度

IR不仅可促进学术交流,促进学术机构教学、科研水平的提升,更为重要的是,它能展示学术机构的综合实力,集中反映学术机构的科研水平,展示其在科学研究、技术应用、教育教学、经济和社会发展等方面的成就,这些学术成果可以通过互联网免费下载,提高学术成果的被引用率,从而提升这个机构的知名度。[3]对于想要提高影响力的高校来说,建立IR无疑是一个好办法。

三、高校建立机构知识库的优势

1.利用校内的网络资源

校园网是一个具有宽带通路和交互功能的专业性局域网,具有教学、科研、管理和通讯等功能,它使我国高等教育管理向智能化方向发展。目前我国的高校校园网已成为了国家信息网络的重要组成部分,在学术信息资源、人力资源、研发能力等方面具有明显的优势。[4]

高校的IR一般都设在校园的局域网内,便于高校的科研人员向本机构提交学术研究成果以及在知识库内浏览、下载学术信息。

2.利用高校丰富的智力产品

高校不但是一个培养高级人才的机构,还是一个学术研发中心。高校内产生的大量原生数字化学术知识产品,例如:已发表或未发表的期刊论文、学位论文、会议论文、科技报告、数据库、重要学术会议的演示文稿、科研项目数据资料及具有学术价值的多媒体资料等,这些都是高校重要的学术资源。但是,这些学术资源还分散在广大教学和科研人员手中,没有得到系统、完整的保存,学术交流和应用状况也不尽如人意。通过建立高校IR,能为系统、完整地保存这些学术资源提供一个安全场所,完整展示其学术研究成果,并能给本校乃至全球的用户提供一个交流与沟通的平台。

3.利用高校图书馆丰富的数字化信息资源收集管理的经验

高校图书馆员具有熟练的专业技术和独特的专业服务意识,特别是在高校数字图书馆的建设中积累了丰富的经验,最适合承担IR的建设及对其内容实施长期保存的工作,能够最有效地对知识信息进行组织、加工、发布,其元数据标引、各种资源的整合、各类型文献信息的检索和发布均已形成了规范。其与数据库提供商形成的长期的、全面的良性合作关系,有利于资源的整合和应用。

四、如何构建机构知识库

1.前期准备工作

首先,要考察已经构建IR的高校,学习他们成功的方法和经验,针对本机构特点进行需求分析,并调查所在高校当前学术论著、作品的发表和存储方式,计算机网络及其IT设备资源状况。其次,在全面掌握相关情况的前提下,要制定严密科学的IR建设规划。在规划中,要确立一支高水准的建设管理团队,主要包括:领导者、用户服务人员、系统技术人员、法律咨询人员。领导者主要负责项目的推进以及任务的合理分配工作;用户服务人员主要负责与用户的沟通和技术支持,特别是对IR内容提供者的技术支持,主要包括IR系统的用户管理、用户培训(包括图书馆员、IR内容提供者和终端用户的培训)、协调管理IR内容的提交等;系统技术人员主要负责IR系统的技术方面的工作,主要包括IR系统开发、各种技术问题的管理、系统技术培训等;法律咨询人员主要负责解决IR建设中的法律问题。[5]最后,要根据IR的建设规划明确资金的落实,要取得学校领导和相关职能部门(教务处、科研处、研究生处等)的理解和支持,以保证IR建设的顺利进行。

2.内容建设

建设IR的重点和难点就是内容建设,主要包括信息资源的收集,即内容获取将是困扰机构库发展的最大难题,科研人员与教师的参与是成功的关键。这就需要我们从以下几个方面来着手,使IR的内容建设及质量控制有所保障。

(1)广泛宣传

目前国内大部分用户对IR还不甚了解,即使是对IR有所了解的人,同样存在各种疑虑。因此,有必要积极宣传,使教师与科研人员提高对IR的认知度和认可度。如荷兰的“科学奶酪”项目,就是为了提升高校教职工对机构知识库的参与和认同。我们的具体做法可如下:高校可在校园网首页设立专栏,使用户在访问校园网站时即可了解到相关知识,也可在日常的用户培训、文献检索课中介绍有影响力的IR及其使用方法。

(2)内容来源保障

加拿大的M.Kathleen Shearer指出:“资源提供者的输入行为和机构知识库的利用率是决定机构知识库成功的两个重要因素”,[6]可见内容的来源是机构知识库内容建设的重点之一,笔者认为可通过以下三个政策措施使内容的来源有所保障。

1)实施强制提交政策。通过科研处、研究生院等主要学术成果产出单位出台相关强制提交政策:如研究生院可规定所有研究生必须向IR提交学位论文,科研处可规定所有科研人员及工作人员必须按时将科研成果及业务工作资料及时交到IR,所有科研项目结题必须向IR提交课题成果等。强制政策是在建设IR最初阶段最为直接、有效的一种方式。比如,丹麦要求大学将其科学出版物都提交到丹麦的“国家科研数据库”中;比利时的机构仓储的倡导者向国会议员建议让IR成为权威机构决定给大学不同投资的唯一参考标准。

2)实施协助提交政策。主要应用在学术机构内部,存储管理机构收集到作者的知识成果并跟作者直接联系,获得作者的许可,由机构代为把作者的知识成果上传到IR,包括知识成果的整理、格式的转换、提交的程序完成等。

3)实施自愿提交政策。用户通过“自存档”形式将自己的研究成果通过IR提交平台,提交到本机构知识库,并且对研究成果进行元数据标引。可以自由地向库里提交自己有价值的学术成果,并可以免费在库中检索和下载其他用户的文章,也可以对文章发表自己的看法。

(3)内容质量保障

在构建IR过程中为了避免毫无价值的信息混入机构知识库中,影响IR主体的参与,必须建立包括内容质量和元数据质量在内的IR质量控制机制,并对不同类型的信息资源有不同的质量评定方法。如在院系中选择学科专家组成审查小组进行实质内容审查。建立校内成果专家评审或同行评议制度,确保IR的学术质量。

(4)数据标准化保障

标准规范是IR建设的生命,IR建设者应根据不同提交方式设专人(学科馆员、院系联络人)审查元数据,并完善提交表单设计,如可增设分类表和主题词表链接、实时给出反馈信息和修正建议等。

3.构建工具及技术

根据国际组织OSI(Open Society Institute)提供的一份指南,目前比较成熟的IR软件主要有DSpace、Eprints、Fedora等。这些软件都可以免费下载、升级和重新分发,并且严格遵循OAI元数据收割协议OAI-PMH2.0版。[7]

DSpace是一个开放源码的软件平台,由麻省理工学院图书馆(MIT)和惠普实验室(HP)联合开发,最新版本为DSpace1.2。DSpace的代码均用Java语言编写,可以运行于所有UNIX系统,采用对象—关系型数据库管理系统PostgreSOL管理相关数据,使用DC元数据标准,且具有完备的元数据体系,包括管理元数据、结构元数据和描述元数据。DSpace有三个界面,分别服务于系统管理员、资源提交者和查找信息的终端用户,具有很强的灵活性和可定制性。目前已有51个国家的307家机构使用DSpace系统。我国厦门大学图书馆、浙江大学图书馆、香港大学等机构正在使用该系统构建自己的IR。

Eprints是最早的IR构建工具,也是第一个遵循OAI协议的IR软件,由英国南安普顿大学开发,最新版本为Eprints2.3。Eprints代码用Perl语言编写,运行于Linux、GNU或Solaris系统,采用MySQL数据库管理系统,它的元数据格式也是DC。Eprints可自动完成提交资源的完整性检验,并备有缓冲区,使提交的资源在正式进入知识库前受到编辑的检验。目前已有248个知识库使用Eprints软件,Eprints成为众多IR软件系统中使用最多、分布最广的软件。

Fedora系统由弗吉尼亚大学和康奈尔大学共同开发实施,当前版本为Fedora TM2.0。Fedora代码是用Java语言编写, 运行于 Windows2000、NT、XP、Solaris和 Linux系统,也是采用MySQL数据库管理系统。Fedora的内容均是使用元数据编码与传输标准 (METS)的扩展版本存储的,每个对象都有一个DC记录,可以供OAI收割器获取元数据。

[1]李枫林,赵雪芹,胡吉明.机构知识库:开放获取的有效实现形式[J].情报杂志,2007(6).

[2]薛青林.国内机构知识库建设的问题和对策[J].图书馆建设,2009(5).

[3]袁顺波,董文鸳,李宾.西方机构库研究的现状及启示[J].图书馆杂志,2006(8).

[4]杨勇,张建中.机构知识库的构建与高校图书馆的工作创新[J].图书馆理论与实践,2009(1).

[5]连书勤,熊莉君.试论如何构建高校机构知识库[J].科技广场,2009(6).

[6]宛玲,苏娜,厉志红.大学机构知识库组织管理问题研究[J].图书情报工作,2008(4).

[7]徐速.机构知识库[J].图书馆理论与实践,2008(1).

(编辑:金冉)

G258.6

A

1673-8454(2011)05-0030-03

猜你喜欢

知识库学术机构
学术是公器,不是公地
如何理解“Curator”:一个由翻译引发的学术思考
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
对学术造假重拳出击
一周机构净增(减)仓股前20名
一周机构净增(减)仓股前20名
一周机构净增仓股前20名
一周机构净减仓股前20名
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究