APP下载

国际电子预印本发展现状实证研究*

2010-09-11徐佳宁徐州师范大学图书馆江苏徐州221116

图书馆建设 2010年10期
关键词:印本文库服务器

徐佳宁(徐州师范大学图书馆 江苏 徐州 221116)

1 预印本、电子预印本、预印本文库的概念

1.1 预印本的概念

所谓“预印本”(Preprint),是指科研工作者的研究成果还未在正式出版物上发表,而出于交流或征询意见的目的自愿先在同行中传播的手稿。根据1996年David的定义,预印本是具有以下一条或一条以上条目的手稿:①经过复审准予出版的手稿;②以出版为目的的、已交出版社送审的手稿,是否予以出版尚未确定;③打算出版,但在送审前,为征求意见而在同行专家间进行传播的手稿[1]。

为了以最快的速度交流最新研究进展和成果,避免从投稿到文章发表再从期刊上读到同行的文章而耽搁半年到一年的时间,工作在最前沿的科学家们习惯于互相交换自己最新工作的论文预印本。

1.2 电子预印本的概念

“电子预印本”是传统纸本预印本的电子版,指由作者提交的、与研究相关的电子学术资源。现在电子预印本的概念已经泛化。首先,电子预印本内涵从期刊论文扩大到涵盖会议论文、技术报告、工作论文、图书的部分章节、研究数据等与研究相关的各种电子学术资源。其次,其外延既包括尚未出版的论文电子版,也包括已经出版的论文及不一定出版的论文的电子版(即仅为了征询同行评议或评论而通过互联网发布的科研论文)。

很多电子预印本服务器既接受正在审稿中的论文,也接受已经审稿录用的或已经在传统学术期刊上发表的由作者提交的论文电子版——后印本(postprint)及未来不会出版或发表的论文(有的电子预印本文献是永远不会投稿给任何期刊的)。 对于一些电子预印本服务器,电子预印本意味着任何电子形式的、与研究相关的、由作者提供的信息,不必是能够出版的[2]。

1.3 电子预印本文库概念

“电子预印本文库”(E-Preprint Server)是集中存储学者们在线提交的论文电子预印本的数据库,它允许任何人在线免费下载文库中的论文。电子预印本的作者可以随时更新其电子预印本,即使在经过同行评审程序之后亦然。

电子预印本文库的出现改变了科学社群内的信息交流方式。它将报道最新研究成果的预印本集中放到互联网上,便于检索和利用,使每个科学家都有机会免费在线发布和获取这些本来只是私人之间流传、只有小圈子精英科学家才能读到的预印本。电子预印本文库具备交流速度快、范围广、发布自由、提供多媒体支持特性等优点。

电子预印本在论文正式出版之前就可以在Web上获得。通过电子预印本文库,研究者可以迅速将其研究成果公布与分享,避免了审稿和等待出版的时滞。并且电子预印本文库在体现网络优越性的同时,更能保证学术交流的可靠性,且能集中、快速地获取,有利于避免重复研究、提高信息交流的时效性、提高科研效率。

2 电子预印本的发展现状

从1991年美国物理学家金斯帕(Paul Ginsparg)在洛斯阿拉莫斯国家实验室的NeXT计算机上建立了世界上第一个电子预印本服务器至今,预印本文库已经历了20年的发展[3-4]。目前预印本文库发生了怎样的变化?因特网上现有多少电子预印本文库?预印本文库中文献收藏量如何?各学科发展情况如何?

为了考察电子预印本的发展现状,我们通过搜索引擎和一些图书馆提供的电子预印本文库列表,对因特网上著名的电子预印本文库进行了在线调查研究。据文献报道,20世纪初世界预印本文库的总数量超过100个[2]。笔者在线调查了60余个电子预印本文库、文献库(其中包含预印本)和电子预印本搜索系统,主要对其名称、网址、运行时段、服务器归属机构、国别、学科、收藏论文数量等数据进行在线收集,并进行统计分析。

经过调查发现,目前因特网上的电子预印本文库有3种:第一种是只收藏电子预印本,且允许所有学者在线提交的,如著名的arXiv、CogPrints 、PhilSci Archive、 SSRN eLibrary Database;第二种是只收藏电子预印本,允许本机构职员提交,但不对公众开放提交的;第三种是收藏多种电子文献的综合型开放存取文库,他们并非纯粹的预印本文库,而是大型学术文献数据库或开放获取资源搜索引擎,但也有电子预印本在线提交系统,允许在线提交论文的电子预印本,如RePEc、PubMed Central (PMC)、CiteSeerX。

据统计,目前世界上有很多电子预印本文库,如美国、英国、德国、法国、瑞士、俄国、挪威、中国、日本等国家均有电子预印本文库,其中美国、英国和德国的电子预印本文库数量最多。被调查的这些电子预印本文库基本上是由高校各学院、科研机构和学术组织构建的,其中高校的各学院建设的数量较多,这与其他类型的资源主要由图书馆建设有所不同,说明科学家是主要建设者;就学科专业电子预印本文库的数量来讲,尤以数学学科的专业电子预印本文库数量最多,物理学专业的电子预印本文库数量次之,再次是生命科学、医学、经济学、统计学等学科的电子预印本文库。一些大型电子预印本文库有研究项目提供技术和资金支持,如NDLTD(Networked Digital Library of Theses and Dissertations,网络博硕士学位论文数字图书馆)由美国国家自然科学基金支持,E-LIS(E-prints in Library and Information Science,图书馆学情报学论文的电子版)是由RCLIS(Research in Computing, Library and Information Science,计算机、图书馆和信息科学研究)项目和西班牙文化部的DoIS(Documents in Information Science,信息科学档案)项目支持的。

关于电子预印本文库的运行情况,通过对收藏电子预印本文献量排序发现,目前电子预印本文库的运行情况各不相同,差距较大。主要分为3种情形: 第一种是发展运行良好,提交量、下载量和浏览量都很大,说明科学家对这些电子预印本文库的认可度和参与度都很高,如著名的arXiv、SSRN eLibrary Database、RePEc;第二种是维持运行,能够正常运行但提交量比较小(有的年提交量仅为10-60篇),这些多是高校学院的二级学科电子预印本文库,由于本身收藏范围窄、影响力也小,所以提交量小,如丹麦南丹麦大学数学与计算科学系电子预印本文档(运行时段为1990年至今,平均年提交量17篇左右)、德国达姆斯坦特大学数学系电子预印本系统(运行时段为1972年至今,年均60篇);第三种是关闭和转并,由于提交量太少、关注度太低或其他原因(如项目结束、资金问题)而关闭不再接受新的提交,或者转入其他电子预印本文库。例如,AKT EPrints Archive由于项目结束而不再接受新的提交 ;美国路易斯安那大学数学系电子预印本系列(LSU Mathematics Electronic Preprint Series)由于提交量较少,年接收论文量20-30篇,于2004年停止接收新的论文;美国国家数学科学研究所电子预印本系列,年收到预印本论文量9-50篇,在1995-2005年正常运行,2006年起不再接收新的论文。

部分国内外电子预印本文库的名称、网址、运行时段、服务器归属、国别、学科、收藏论文数量等具体情况见下页表1。

3 国际电子预印本发展特点

3.1 各学科电子预印本发展情况差别较大

物理学、数学、天文学、计算机科学的电子预印本文库受到同行的认可,其电子预印本文库数量较多,且拥有众多参与者;生命科学、医学、经济学、财经、法律、管理类学科的电子预印本文库的浏览和下载量很高;而化学学科的电子预印本服务器(Chemistry preprint server)由于提交量小,已经停止接收提交论文。就学科而言,物理学是使用电子预印本的先锋和主力军,对于物理学家来讲,电子预印本已经成为正式出版的必要前奏,现在半数的物理学家都会先把论文提交到arXiv。arXiv已经发展成为近50万篇论文的集散地,其用户自由下载不需受权限限制。2007年网站下载量达到4500万篇,每月新递交电子预印本文献5000篇,日浏览量近百万[5]。社会科学研究网e图书馆(SSRN E-Library)现有23万余篇电子预印本论文,每月下载论文全文超过80万篇次[6]。而化学电子预印本服务很难在化学家中推广,2000年8月在美国化学会(The American Chemical Society,简称ACS)年会上推出的化学电子预印本服务器作为论文的一种永久的Web存档方式和免费服务方式向公众开放,由Elsevier提供服务器,结果由于没有足够数量的论文提交,预印本文库于2004年不再接收新提交的论文,只是保留原已提交的论文并提供免费下载和服务。相对于物理学家来讲,比较保守的化学家们对电子预印本并不感兴趣,这可能与知识产权保护有关,化学、生物学研究需要大量的资金支持,科学成果要申请专

利或进行转让,过早发布电子预印本,科学家会顾虑内容被泄露。

表1 著名电子预印本文库的具体情况

3.2 一些学科电子预印本文库向规模化发展

最初,许多数学、物理学的学院和学会建立了自己的小规模电子预印本服务器,20世纪末这种小型电子预印本服务器数量相当可观,可能是考虑到这些分散的电子预印本文库不能达到有效、快速交流和分享的目的,后来一些电子预印本文库被关停或并入大型而有影响力的电子预印本文库,学科电子预印本文库向集中和规模化发展。例如,美国数学会曾建立了覆盖数学学科的电子预印本服务器,几年后他们调整了策略,关闭了服务器,这些电子预印本服务器现在已经全部并入arXiv,但在其网站上保留了一个全部数学电子预印本服务器的列表;美国物理学会(American Physical Society,简称APS)也放弃了学会的电子预印本文库,并且修改其旗下期刊的著作权条款,让学会出版刊物上的文章能够张贴在金斯帕的arXiv电子预印本文库中;化学物理电子预印本数据库(Chemical Physics Preprint Database)和浓缩物质电子预印本也已经转入arXiv。美国、英国、德国的许多大学的学院都建立有电子预印本文库,其中数学学院建立的电子预印本文库最多,我国华东师范大学数学系也建有电子预印本文库。只是这些学科预印本文库规模比较小,有的仅供本院系的教师提交论文电子预印本,无法达到大范围内科学论文的交流和分享的初衷。 目前这些小型电子预印本文库有许多已经不再接受新的提交,只是继续提供已经提交论文的浏览和下载。

3.3 科学交流需求驱动了电子预印本文库的诞生和发展

电子预印本文库基本上是由高校学院、科研机构和学术组织构建的,其创建者主要是科学家,只有极少数是由图书馆代为管理的。世界上第一个电子预印本服务器是由美国物理学家金斯帕(Paul Ginsparg)建立的,后来交由康乃尔大学图书馆维护。CogPrints是由英国南安普敦大学电子与计算机科学学院建立并维护运行的,CiteSeerx属于宾夕法尼亚州立大学信息科学和技术学院。另外,许多高校的院系都建设电子预印本文库,这些预印本文库多是由科学家构建和维护的。可见,电子预印本文库的建设者和参与者都是学者,电子预印本文库的产生和发展是以科学家为主导的,是由科学家自我交流的需求直接驱动的。

3.4 电子预印本文库资源质量较高

尽管电子预印本文库没有质量控制程序,只是进行简单的科研机构邮箱识别注册或同行推荐注册,但其中的论文质量总体来讲仍然较高,大量论文后来在正式期刊及高品质期刊上发表。ESI预印本文库自1999年起开始对其库内电子预印本进行评估,结果表明1993-1999年间共819篇预印本中有669篇(约占82%)已经在正式期刊上发表或成为著述的一部分;其中108篇文章发表在数学物理方面SCI(Science Citation Index,科学引文索引)影响因子位列前10名的刊物上,意味着13%的ESI的预印本论文进入了高品质期刊[7]。统计2010年1月arXiv预印本文库的天体物理学分支接收的1032篇论文发现,其中177篇目前已经在正式期刊上发表(截至2010年5月4日),发表的论文占总数的17.15%。

3.5 电子预印本文库稳定地成为科学交流系统中一种新的交流渠道

电子预印本用最快的速度交流最新的理论和实验进展,避免了论文从投稿到发布的时滞;能够快速将学术信息传播给全世界的学者,使全世界的研究“一体化”,不论是在英国剑桥或印度加尔各答,都将有机会第一时间知道学科领域最新的进展;电子预印本具有交流速度快、范围广,发布自由、门槛低,有利于学术传播及学术性强、可靠性高等特点,可以减少重复研究,提高了研究的品质和科研效率。电子预印本文库利用互联网集中、序化学术信息,加快学术交流,是一种重要的信息组织和学术交流方式。在物理学、数学、计算机科学等学科领域,预印本已经稳定地成为科学家学术交流的重要媒介和科学交流系统中新的交流渠道。一方面,浏览查看电子预印本成为一些学科的科学家了解和获取学科最新研究成果的途径之一,目前许多物理学家已经把上arXiv浏览最新提交的论文作为每天必不可少的工作;另一方面,科学家引用电子预印本文献的数量也不断增加。以物理学为例,其电子预印本系统发展迅猛, 越来越多的人参考、引用电子预印本资料。据笔者统计,2000-2009年间ScienceDirect数据库中的107种全文期刊的8118篇文章引用了arXiv预印本文库的文章,其中著名期刊《 Physics Letters B 》(物理快报)的论文引用arXiv的电子预印本最多,共引1450篇次。发表在2003年天体物理学杂志(Astrophysical Journal)上75%的文章以预印本形式存放于arXiv预印本系统上,这75%的文章获得了90%的引用率,以预印本形式开放获取的文章引用率是非开放获取文章引用率的3倍[8]。

4 影响预印本发展的因素

4.1 期刊出版者对电子预印本的态度是影响学科预印本发展的重要因素

一些很有影响力的期刊编辑部不接收已经先行在网上发布了电子版的论文(包括在电子预印本文库发布的论文),研究人员为了在高质量期刊上发表文章以提高学术地位,只得放弃在电子预印本文库发表论文,这成为电子预印本发展的障碍。如美国化学会既不允许作者发布审稿前和正在审稿的预印本及录用的后印本,也不允许在线发布出版商出版后的PDF格式论文。但目前越来越多的科学期刊,包括《Nature Science》、《Springer Verlag Journals》等,明确表示允许作者在服务器上发布电子预印本。英国诺丁汉大学的RoMEO网站[9]列出了世界上众多期刊学术机构出版物或出版社是否允许作者发布电子预印本的信息,并根据是否允许发布预印本、后印本及已发表文章的PDF全文,将期刊分为绿色(允许预印本和后印本或出版的PDF)、蓝色(允许后印本或出版的PDF)、黄色(允许预印本)、白色(不允许预印本、后印本和出版的PDF)。从RoMEO的期刊一览表可以看出,物理学、天文学、生物学、统计学、经济学学会或官方研究院出版的期刊基本上是绿色或蓝色的。

4.2 科研机构和科学学会积极行动促进了预印本的发展

美国物理学会重视并参与电子预印本这种新的交流活动,修改其旗下期刊的著作权条款,允许学会出版刊物接受已经在arXiv预印本文库中发布的文章。美国国立卫生研究院(National Institutes of Health,简称NIH)获得参议院批准,要求NIH资助完成的所有学术论文必须在发表后一年内提交到PubMed Central预印本文库,免费向公众开放。这些学会和研究机构的积极支持,消除了障碍、强化了意识、促进了电子预印本的发展。

4.3 电子预印本的质量、知识产权保护和优先权等方面的顾虑是阻碍其发展的因素

在竞争的研究环境下,有些作者急于宣告其不成熟的研究结果,而电子预印本未经审查不免有质量方面的顾虑。同时,专利制度会使科学家不愿意先行发布具有商机的信息。另外,科学家因担心文章被篡改、剽窃和被用于商业目的等而远离电子预印本服务。

4.4 电子预印本文库界面设计是否易用、是否便于检索是又一影响因素

简单易用、便于提交和检索下载的电子预印本文库界面设计才能留住更多的用户。目前,大多数预印本文库界面简单,主要提供分类浏览和简单检索。但是有的电子预印本文库检索反应速度慢、提交链接不明显、不便于提交,这会影响科学家的提交意愿。如何管理维护电子预印本资源、建立更成熟完善的管理系统也将是一项必须面对的重要工作。

为便于利用电子预印本资源,一些学术机构和社团还研发了预印本检索系统(搜索引擎),这将促进电子预印本的利用和发展。如E-print Network[10]是由美国能源部科技信息局建立的电子预印本档案搜索引擎,可检索存放在学术机构、政府研究实验室、私人研究组织以及科学家和科研人员个人网站的电子印本资源;MPRESS 数学预印本检索系统[11]提供对十大欧洲预印本文库的整合检索,其中包括arXiv在奥格斯堡的镜像,它是由欧洲数学会的Math-Net项目资助的;SINDAP[12]是中国和丹麦的一个预印本合作项目,提供来自17个预印本网站的检索。另外,Google Scholar也可以检索arXiv的论文,搜索时直接输入论文的关键词或标题即可,arXiv数据库中的论文也会被检出。

5 结 语

在国际学术界,电子预印本已获得广泛的认可,并得到足够的重视。特别是在物理学、数学、计算机科学等学科领域,知识的快速传播很重要,利用电子方式传递预印本成为必要的传播手段,随后的出版过程反而只是一种形式。而且越来越多的电子预印本被正式期刊论文录用和引用,因为信息的及时性总是能加快科学前进的步伐。电子预印本文库已经稳定地成为科学交流系统中一种新的交流渠道,未来电子预印本文库将进一步合并集中、向规模化发展,成为提供一站式服务、资源集中、内容可靠的最新科研成果交流平台。然而,电子预印本文库并未像许多科学家所预料的那样——取代学术期刊的信息传播和交流功能,让学术期刊成为预印本文库的虚拟期刊,而是作为一种并行的传播方式与传统期刊和其他新的交流方式多维地实现科学传播的功能。

[1]吕世炅.预印本系统:国际学术交流的重要平台[J].情报学报,2004(5):547-551.

[2]Sharon M J. Preprint Servers: Status, Challenges, and Opportunities of the New Digital Publishing Paradigm [EB/OL].[2010-04-01]. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.42.5827&rep=rep1&type=pdf.

[3]金斯帕——永远在线的物理学[EB/OL].[2010-04-08]. http://www.qiji.cn/news/open/2003/11/28/20031128232449.htm.

[4]Tomaiuolo N G, Packer J G.Preprint Servers:Pushing the Envelope of Electronic Scholarly Publishing[EB/OL].[2010-04-08].http://www.infotoday.com/searcher/oct00/tomaiuo1o%26packer.htm.

[5]大敞科学之门[EB/OL].[2010-04-10].http://www.douban.com/group/topic/3553143/.

[6]Paper Downloads[EB/OL].[2010-04-08].http://papers.ssrn.com/so13/DisplayAbstractSearch.cfm.

[7]Evaluation of the ESI preprint series[EB/OL].[2010-04-08].http://www.esi.ac.at/preprints/evaluation.html.

[8]The Effect of Open Access and Downloads ('hits') on Citation Impact:a Bibliography of Studies[EB/OL].[2010-04-08]. http://opcit.eprints.org/oacitation-biblio.html.

[9]RoMEO[EB/OL].[2010-04-08].http://www.sherpa.ac.uk/romeo/.

[10]E-Print Network[EB/OL].[2010-04-01].http://www.osti.gov/eprints/.

[11]MPRESS[EB/OL].[2010-04-08].http://mathnet.preprints.org/.

[12]SINDAP[EB/OL].[2010-04-01]. http://egroups.istic.ac.cn/cgi-bin/egw_metasweep/2/screen.tcl/name=welcome&service=sindap&cont ext1=fixed&lang=chi.

猜你喜欢

印本文库服务器
预印本学术交流体系参与主体权益调研与启示
开放融合环境下预印本发展态势分析*
专家文库
优秀传统文化启蒙文库
重视预印本及其系统生态建设
通信控制服务器(CCS)维护终端的设计与实现
关于推荐《当代诗坛百家文库》入选诗家的启事
专家文库
中国服务器市场份额出炉
得形忘意的服务器标准