APP下载

PMCI与医学期刊文献的开放存取及数字化存储

2015-11-25刘树春

中国中医药图书情报杂志 2015年1期
关键词:生物医学镜像资源库

刘树春

辽宁中医药大学图书馆,辽宁 沈阳 110847

·专题论坛·

PMCI与医学期刊文献的开放存取及数字化存储

刘树春

辽宁中医药大学图书馆,辽宁 沈阳 110847

PMC及其与Europe PMC和PMC Canada共同构建的PMCI被公认为是生物医学期刊文献开放存取和数字化存储的成功典范。本文从PMCI的构成、各个镜像节点的创建和功能特点加以讨论,针对PMC与PubMed以及PMCI各节点之间在存储模式和内容上的差异等进行了比较。并提出了在期刊文献开放存取与数字化存储实践中的几点启示。

PMCI;开放存取;数字化存储;期刊文献

随着生物医学领域相关研究的飞速发展,信息更新日趋频繁。而生物医学期刊的开放存取和数字化存储,顺应了网络时代学术文献信息快速与广泛交流的需要,促进了生物医学科研信息的传播与国际研究合作,同时也进一步扩大了学术期刊的使用范围,提高了期刊的使用率和学术影响力。

在生物医学领域,PubMed Central®(PMC)以及以PMC为基础组建的PMC International(PMCI)被公认为是医学期刊文献开放存取的成功典范,同时也是生物医学期刊文献数字化仓储国际化合作的先驱。

1 PMCI及其成员中心

PMCI是由美国国家卫生研究院(National Institute of Health, NIH)和国立医学图书馆(National Library of Medicine, NLM)、文献来源期刊的出版社,以及其他国家共享NLM存储文献的组织机构共同协作创建的[1]。NLM目前支持两个PMCI中心,即Europe PubMed Central(Europe PMC)和PubMed Central Canada(PMC Canada)。二者与位于美国的PMC共同构成PMCI。两个中心也分别是PMC在英国和加拿大的镜像站,接受和同步共享PMC的内容。

PMCI是NLM的国家生物技术信息中心(National Center for Biotechnology Information, NCBI)与PMCI的各个节点(Europe PMC和PMC Canada)及在PMC存储期刊论文的出版社之间的合作项目,其长期目标是建立数字文献存储网络,并在网络内部共享各自存储的内容,以类似于国际核酸序列数据库合作联盟(GenBank/EMBL/DDBJ)的模式对数据进行存储和交换[2]。作为一个生物医学文献数字仓储库,其核心原则是:即使随着技术的发展可能导致数字文献的格式发生变化,但其收录的全部期刊文献必须提供永久性的免费访问。

1.1 PubMed Central

PMC(http://www.ncbi.nlm.nih.gov/pmc/或http://www. pubmedcentral.gov/)创建于2000年2月,是一个由NLM的NCBI开发与维护的开放存取式生物医学及生命科学期刊文献档案库[3]。在其起步阶段,仅有美国的 PNAS(《美国国家科学院汇刊》)等少量期刊加入。经过十几年的发展,已经有超过2000种期刊加入到PMC的开放存取和数字仓储行列中,全文文献超过330万篇,成为全球生物医学领域规模最大的开放存取机构仓储。2009年,美国总统奥巴马签署了年度《综合拨款法案》,使NIH公共存取政策成为一项永久制度[4]。其条款规定:在遵守版权法的情况下,NIH要求受NIH资助的所有研究者在研究成果正式发表后的12个月之内将其被期刊接受发表的经同行评议的稿件终稿电子版提交至 PMC数字仓储中,并向公众开放访问。

1.2 Europe PubMed Central

Europe PMC(http://europepmc.org/)原名为UK PubMed Central(UKPMC),是由维康信托基金会(Wellcome Trust)发起,并由欧洲生物信息学研究所、曼彻斯特大学及大英图书馆在PMC的基础上共同开发维护的生物医学及生命科学免费数字文献存储库,现受到包括维康信托基金会在内来自于欧洲的24个慈善和政府组织等生命科学及生物医学基金会的支持。2006年,Wellcome Trust宣布,凡是由其资助的研究论文必须在发表后的6个月内通过UKPMC免费向网络开放。2007年1月,UKPMC作为PMCI的一部分和PMC在英国的镜像站正式上线[2]。

2012年7月13日,欧洲学术研究委员会(The European Research Council, ERC)宣布加入到已经有18个英国和欧洲的基金会支持的UKPMC中。正是由于 ERC的加入,以及为了扩展该存储库的服务范围,UKPMC在2012年11月1日改为Europe PMC。

1.3 PubMed Central Canada

PMC Canada(http://pubmedcentralcanada.ca/)作为PMC在加拿大的镜像站点和PMCI数字存储网络的一部分,是在PMC的基础上建立的,由加拿大国家科学图书馆(NRC-CISTI)维护,并与加拿大卫生研究所(CIHR)及美国的NLM建立合作伙伴关系,其目的是基于在加拿大的文献库向用户永久性提供高质量的生物医学及生命科学研究文献的全文免费访问。

PMC Canada全面支持CIHR的开放存取政策,并要求CIHR基金资助者在论文发表后的6个月内通过PMC Canada向网络开放。目前,PMC Canada只接受CIHR资助的作者提交的经同行评议的期刊论文,以后还要扩展接受加拿大其他基金资助机构的研究文献,使位于加拿大的公共开放文献库的价值最大化。

2 创建PMCI网络的原因

PMCI的创立,是NLM和世界各国与PMC具有共同目标的机构建立合作关系,在其他可信的国际文献档案库以相同的原则维护PMC的文献,最大限度地避免文献资料的损坏和遗失。

创建PMCI主要是基于以下原因。第一,如果在世界各地的多个站点上存在活动的档案副本被用户正常使用,就可能加大文献档案的长期存活可能性。第二,研究文献的生产者和资助者更习惯于将其文献资料存储于本地或区域性档案库,而不是在世界其他地方的档案库。第三,每个站点可以将档案库中的期刊论文与其他相关的资源进行整合,如:对用户具有特殊意义的特定国家或地区性的临床指南等。同时,网站的多样性也可以尽可能达到更大的创新,确保PMC的长期持久性。

PMCI中的所有论文都是免费阅读(Free Access)的,即任何人都可以对这些论文进行检索、浏览、阅读和PDF格式下载,但这些论文仍然受到出版社的版权保护。没有版权所有者的明确许可,不可以以任何形式重复应用于研究(比如文本挖掘)或其他商业目的。但PMCI中有超过四分之一的论文属于开放存取(Open Access)的,意味着只要注明来源,即可以以任何形式进行利用。

3 PMC与PubMed的区别

虽然PMC与PubMed都由NLM创建,而且可以实现相互集成、彼此链接和共享检索。但作为两个不同产品和服务平台,其内容存在明显区别。PubMed作为一种文献库,包含着生命科学领域的数百万同行评议的期刊论文题录和摘要,不提供任何全文,但可以提供外部链接到期刊出版社或PMC的免费全文。而PMC作为一种全文资源库,只包含期刊论文的全文信息。

PMCI三个站点中所包含全部论文的题录均被PubMed收录,即PMC中的论文可以利用PubMed进行检索,并可以链接至PMC中的全文。但PubMed包含的论文记录远远多于PMC,即不是PubMed中所拥有的文献记录都可以在 PMC中找到全文。此外,因为PubMed中提供的全文链接是离开PubMed站点指向到外部提供者的全文,即可以指向PMCI站点或期刊出版社的网站。所以,即便是在PubMed中标记有全文链接,在PMC中也不一定能找到全文。

简而言之,如果检索PMC,用户可以直接进入全文,但检索的结果不能涵盖PubMed的所有检索结果。而检索 PubMed,如果检索结果中的记录包含在 PMC中,那么记录中会提供一个链接,引导用户免费获取PMC中的全文。

4 PMCI文献开放存取的特点及镜像之间的内容差异

PMC Canada和 PMC作为一种全文资源库,只包含期刊论文的全文信息。而Europe PMC虽然也是一种全文资源库,但它还包含着PubMed中那些不提供全文的题录和文摘信息。

4.1 PMCI开放存取的模式和论文提交方式

PMCI中的文献内容向网络开放的时间因期刊的不同而不同。大多数期刊在出版的同时就自动将其内容进入 PMCI,向用户开放。有些期刊可能会延迟数月或一年再将全文开放。这些是依据PMC参加协议及PMCI各站点对期刊收录的级别而定。

一种特定的期刊在进入 PMC公开之前,必须与NLM签署一个协议。这个协议决定了期刊在PMCI系统中的开放内容和时间。而且,针对在PMCI中不同级别的期刊,依据NIH公共开放规定,向PMCI提交存储的方式也不同。见表1。

4.1.1 全文存储(Full Participation) 与NLM签署全文存储协议的期刊从某一特定卷期或日期起,将其刊载的全部论文存储于资源库中。针对这些期刊,PMC通常会将存储的全文回溯至期刊的创刊卷期。而且这些期刊上刊载的论文由期刊出版商即时提交给PMC,无需论文作者操作。这种方式提交的论文,虽然期刊是以“Full”的形式加入,但有些(开放存取类期刊)是即时性开放全文访问,有些是延迟一段时间(6~12个月)开放。

4.1.2 NIH档案集(NIH Portfolio) 签署此类协议的期刊从某一特定卷期或日期起,至少将期刊中受NIH资助的论文在出版后的 12个月内存储于资源库中,也可以依据协议选择其他非NIH资助论文存储,但不是期刊中的全部内容。这些期刊中所涉及的论文,是由期刊出版商直接单篇提交给PMC,无需作者操作,而且一般在正式出版后12个月内通过PMCI向网络开放。

4.1.3 选择性存储(Selective Deposit) 签署此类协议的期刊将其刊载的作者选择“Open Access”模式发表的论文,提交给PMC存储。在此类期刊上发表的论文,需要作者与期刊出版商协商支付“开放存取费用”,并提交 PMC开放。目前,已经有 NPG Open Access、Springer Open Choice、Wiley-Blackwell、Lippincott Williams & Wilkins、ACS等商业期刊出版公司或学术团体与NLM签署了此类协议。对于在尚未与NLM签署存储协议的期刊上发表的论文,则需作者自行提交最终版本(final peer-reviewed manuscript)至PMC。有些期刊出版商,如:Elsevier、Karger、John Wiley、NPG等,承诺将符合NIH开放存取规定的经同行评议的最终稿件主动提交给 NIH稿件提交系统(NIH Manuscript Submission,NIHMS),但需要论文作者予以确认,并完成后期提交流程。

4.1.4 停止存储(No longer depositing) 此类期刊不再向PMC资源库中新增存储论文,但以前存储的内容还继续提供全文服务。

4.2 PMCI不同镜像站在内容上的差异

直到2011年,PMCI的三个镜像站的论文检索和浏览方式都是一致的。就所收录的文献而言,PMCI的三个站点动态共享数据。但随着UKPMC的更名及界面的改变,三个站点提供的内容和检索方式也发生了一些变化。

表1 PMCI各镜像站收录期刊及层次差异

与PMC相比,Europe PMC网站界面也有新的特色功能。它既包括PMC的期刊论文全文,还包括PubMed的题录和摘要信息。此外,还包括 500多万条额外的其他相关资源,如:生物医学专利记录、Agricola文摘、临床指南、博士学位论文及研究报告等信息。同时,还整合了文本及数据挖掘工具等。

在美国的PMC中,也存在有少量期刊论文的全文只能通过期刊网站的公共链接获得。即有些期刊尚未同意将其内容镜像至Europe PMC等其他站点,比如:Annals of Surgery(《外科学纪事》)、Journal of Anatomy(《解剖学杂志》)等。因此,在这些期刊上发表的文献虽然能通过Europe PMC检索,但有时检索结果会标注“Only available in US PMC”(只包含在美国的PMC中)。

5 PMCI成员间的关系及内容共享方式

5.1 文献提交方式和接受内容

PMC、Europe PMC和 PMC Canada的区别主要在于每个站点上不同的论文提交系统,而且不同资源库的文稿存储策略也不同。PMC只接受 NIH、Howard Hughes Medical Institute等机构资助的研究成果,同时也接受有合作关系的期刊将论文通过 PMC存储和开放。其接受条件是期刊必须符合出版物的学术质量和数字文件的技术标准,而且必须是以英文出版的生命科学期刊。Europe PMC只接受由 Wellcome Trust、Research Councils UK等几个欧洲资助者的研究成果;而PMC Canada只接受来自CIHR资助的研究成果,并且除英文外,也接受法文文献。

5.2 内容共享方式

提交存储在PMC Canada、Europe PMC中的文献首先传至位于美国的PMC,与PMC自身的数据汇总后,再分别镜像至与其合作的各个站点,共享数据。但并不是PMC的所有内容都已经镜像至所有站点。分别从2006年7月及2009年6月开始,各出版社或杂志社与 PMC签署的合作协议才开始包含将内容镜像于Europe PMC和PMC Canada的许可。

5.3 检索途径及特点

PMC作为NCBI的一个子系统,与NCBI的其他数据库共享一个检索平台,其检索界面和检索途径与PubMed相同,既包括快速检索,也提供文摘词、机构、作者、论文题名、主题词(MeSH)、地址、DOI、图表、全文自由词、期刊名称等字段的检索。此外,也可以对出版日期、文献类型等进行限定。在检索结果界面,可以对NIH基金资助论文进行筛选过滤,也可以直接关联检索NCBI的Gene、Protein、PubMed等其他数据库中的相关数据。

PMC的价值还在于利用通用格式存储并交叉链接库内不同来源的数据。在数字时代,PMC利用其开放存取和数字存储,努力发挥着世界级图书馆的作用。

PMC Canada的检索途径比较简单,只提供对期刊名称和论文的快速检索,以及包括论文题名、作者、期刊名、论文号等途径的高级检索,但不提供MeSH、作者机构等字段的检索途径。

Europe PMC可以检索PMCI镜像的全文存储数据,也可以检索PubMed的题录数据,在其检索界面上提供更多的检索特性和功能,即在常规检索字段的基础上,还可以按资助机构检索。而其高级检索界面所提供的过滤选项中,可以选择在 PubMed/MEDLINE、Agricola、Chinese Biological Abstracts、Patents等不同来源中检索,即通过Europe PMC界面,可以整合和过滤检索多种数据库和多类信息,也可以筛选检索Europe PMC或Open Access的结果,并提供从文献题录至其他公共数据库的链接,如:蛋白质信息库 UniProt以及欧洲核酸资源库(European Nucleotide Archive)的相应记录。检索结果中既可以显示出命中的文摘记录数,也显示可提供免费全文的命中记录数。同时,还提供文献的被引证次数。用户可以对检索结果进行相关性、出版时间和被引证次数排序显示,有利于对某专题的经典文献筛选。此外,可以利用基金项目查找工具(Grant Lookup Tool)检索46 000多个受24个基金会(funders)资助的生物医学研究项目,获得项目名称、受资助人及相关研究信息。

6 PMCI开放存取与数字存储给我们的启示

学术文献的开放存取和数字化存储是扩大学术交流和信息资源共享的发展方向。在PMCI等系统的实践中,也给我们开展相关工作提供了很多启示。

必须得到国家层面的科学研究机构的支持,以及财政、科技、教育、卫生、工信等国家部委的配合,并通过国家立法予以实施。同时,还要得到具有雄厚资金实力的基金管理部门的支撑。

需要选择功能强大和具有国际影响力的服务平台,具有先进的技术保障。要具备统一的数字文献存储格式和完善的论文提交与审核系统,方便数据的永久保存和开放利用,以及存储库之间的数据交换和关联共享。

须得到国际权威期刊出版商和学术研究机构的理解与配合。

大数据环境下的数字文献存储应走国际合作、资源共享的道路。不同的存储库之间分工合作、交换并共享数据,以及通过数据关联,与其他类型的开放数据相整合。

[1]PMC International[EB/OL].[2014-08-20].http://www.ncbi.nlm. nih.gov/pmc/about/pmci/.

[2]McEntyre JR, Ananiadou S, Andrews S, et al. UKPMC: a full text article resource for the life sciences[J]. Nucleic acids research,2011,39(Database issue):D58-D65.

[3]Roberts RJ. PubMed Central: The GenBank of the published literature[J]. Proceedings of the National Academy of Science of USA,2001,98(2):381-382.

[4]The Omnibus Appropriations Act of 2009 Makes the NIH Public Access Policy Permanent[EB/OL].[2014-08-20].http://grants.nih. gov/grants/guide/notice-files/NOT-OD-09-071.html.

PMCI and Open Access and Digital Storage for Medical Periodical Literature

LIU Shu-chun
(Library of Liaoning University of Traditional Chinese Medicine, Shenyang Liaoning 110847, China)

PMC International (PMCI) is constituted of PubMed Central in US, Europe PMC, and PMC Canada, and recognized as the successful model of open access and digital storage for medical periodical literature. In this article, the composition of PMCI, and the establishment and function characteristics of each mirror image node were discussed. The differences in storing pattern and content collected from each mirror image node among PMC, PubMed, and PMCI were compared. Some suggestions were put forward for open access and digital storage practice of periodical literature.

PMCI; open access; digital storage; periodical literature

10.3969/j.issn.2095-5707.2015.01.001

2014-10-30;编辑:张华敏)

刘树春,研究馆员,研究方向为中医药信息分析。

E-mail:scliu45@sina.com

猜你喜欢

生物医学镜像资源库
刍议“生物医学作为文化”的研究进路——兼论《作为文化的生物医学》
幼儿园课程资源库建设之浅见
灵长类生物医学前沿探索中的伦理思考
南京航空航天大学生物医学光子学实验室
健身气功开放课程资源库建设研究
镜像
镜像
国外生物医学文献获取的技术工具:述评与启示
数控加工专业资源库建设中存在问题及对策
基于共享资源库的混合式教学考核模式研究