APP下载

基于WOS的开放存取期刊国外发展状况可视化研究

2019-01-21姚澜

西部论丛 2019年3期
关键词:发展状况

姚澜

摘 要:本文以Webof Science数据库中2003年到2018年年初收录的国外关于开放存取期刊的427篇研究成果为对象,通过使用Excel,XMind与CiteSpace等软件对目前国外开放存取期刊(OAJ)研究的作者、文献、热点与机构作为分析目标并作出分析后的可视化图表,总结出目前国外对开放存取期刊(OAJ)研究的现状、进展与动态。

关键词:开放存取期刊;发展状况;CiteSpace;Web;of;Science

1引言

开放存取(OA)是一种主要用于学术出版的出版模式。根据图书馆协会的解释,开放存取作为一种技术与出版模式,是在基于订阅的传统出版模式以外的另一种选择[1]。开放存取的产生源于20世纪末的“学术期刊危机”。当时,由于技术的发展,学术传播和交流拥有了全新的平台和模式,学术期刊数据库大量的崛起,导致学术期刊的数字化的边际成本极为低廉,使得学术期刊首当其冲。针对这一情况,从20世纪90年代开始,国际学术界、出版界、信息传播界和图书情报界大规模地开始讨论 “学术期刊危机”的应对方法[2]。于是,人们渐渐把目标聚集到“开放存取”这个概念身上。

因此,开放存取的初衷与目的就是为了解决学术期刊的出版危机,推动科研成果的自由传播、促进学术信息的交流与出版、提升科学研究的公共利用程度、保障科学信息的长期保存[3]。基于开放存取的概念下,只要通过新的数字技术和网络化通信,任何人都可以及时、免费、不受任何限制地访问互联网的各类文献——这些文档包括经过同行评议过的期刊文章、参考文献、技术报告、学位论文等全文信息。而将这些文档用于科研教育及其他活动,就能促进学术信息的交流与出版,提升科学研究的共利用程度,从而便于科学信息的广泛传播,保障科学信息的长期保存。

2001年,随着人们关注度和讨论度的增加,《布达佩斯开放获取倡议》(Budapest Open Access Initiative,BOAI)的提出成为了开放存取这一概念在国际学术界的正式“提名”[4]。而作為开放存取的实现方法,OA出版作为一种学术信息共享的自由理念与出版方式也开始兴起,从2002年开始逐渐演变成为了一种出版的商业模式。OA出版的实现途径有OA仓储与OA期刊两种。而开放存取期刊(OA期刊)作为开放存取出版的一种实际应用类型,其作用更是不可小觑。

本文以主要以Webof Science数据库中2003年到2018年初的15年时间收录的关于开放存取期刊的文章为对象,通过使用可视化工具分析研究目前国外对开放存取期刊(OAJ)研究的现状、进展与动态。

2前期分析准备

要研究国外“开放存取期刊”的发展状态,笔者前期为保证检索结果的全面性和准确性,准备先对相关课题进行了解。笔者先在CNKI(中国知网)数据库中的期刊数据库中用题名字段,检索“开放存取期刊”,得到相应的检索结果。选取检索结果中20多篇具有代表性、相关度高的论文,进行了详细地阅读。通过深入阅读开放存取期刊的相关论文,不仅可以了解本次研究对象“开放存取期刊”的同位词,还可以厘清研究对象的上位词与下位词,为之后检索式中的检索词的安排打下基础。

在阅读中笔者为了形象地厘清关于开放存取期刊的内涵与外延,使用了Xmind思维导图软件,通过阅读学习,记录下了关于“开放存取期刊”概念的知识脉络图如图2.1。从图中我们看出,开放存取期刊这个概念在名称上常有不同的表述,同时也有不少相关的平台与出版社颇具代表性,所以在检索时也要对这些检索词语加以考虑。

3数据收集

3.1选择数据库

本文选择的是WOS数据库作为检索数据库,以笔者为例,可以打开南京大学图书馆网站,在首页中找到电子资源项并点击进入,在数据库页面中检索Webof Science,进入“ISI Webof Science平台”,即可在平台中使用WOS数据库检索。

由于本次检索“开放存取期刊”作为检索词,在Web of Science数据库中选取的核心合集中包括Science Citation Index Expanded (SCI-EXPANDED)、Social Sciences Citation Index (SSCI)、Arts & Humanities Citation Index (A&HCI;)数据库。

3.2列出检索式

在列出检索式时,首先考虑上下位词的关系。在先期的试检索中,发现大部分的开放存取数据平台影响力有限,所以在检索中笔者决定在列出检索式时国内部分只考虑最具代表性的Socolar开放存取数据平台,同时兼顾图2.1中开放存取期刊的其他国外平台及出版社。其次,笔者认为在检索式的列出时,可以把“开放存取期刊”的关键词进行分解——开放存取作为一个整体概念是一个部分,期刊是另一个部分。最后,要考虑检索式中的同位词关系。在前期的检索中,笔者注意到以检索词“开放存取期刊”检索到的论文中也常常直接使用其英文缩写OAJ作为表达。同样还要注意的是,Journal作为期刊的单词,在检索中可能是复数或者其它形式,所以使用了*截断符。

结合上述考虑,在Web of Science数据库中选择相应核心合集后,通过使用高级检索检索框输入检索式为(ti=(oa or open access)and ti=(journal*))or ti=oaj or ti='DOAJ' OR TI='OPEN J-gate' or ti=arXiv or ti='PLo s' or ti='BioMed Central' or ti=handawi or ti='MDPI AG' or ti=socalar检索中限制年份为2003年到2018年(检索时间为2018年1月初,所以最后一年的数据是2017年整年)。

3.3检索结果

在WOS数据库中输入前文中准备好的检索式进行检索,截止在2018年1月检索时,共在2003年到2017年末的时间区间检索得到了有427条检索结果。

4数据分析

4.1分析的工具

在对检索结果进行可视化与数据分析前,笔者准备使用WebofScience数据分析工具,CiteSpace可视化软件,Excel软件这三种工具对已知的427条结果进行分析。并且在接下来根据不同的分析目标,选择不同的分析工具,以求得到不同的呈现效果。

4.2整体论文发表趋势

在Web of Science中得到检索结果后,使用Web of Science数据库中的分析检索结果功能来研究开放存取期刊论文的每年发表数量。选择“出版年”,按照此字段排列结果,在设置显示选项中选择显示前25个分析结果,由于检索时有15年的年份限制,只显示出15个年份。于是得出2003到2017(在2018年年初检索,所以2018年的样本较少,不计入图表)的每年度发表数量。根据所得数据在excel中列出表格后,做出折线统计图如4.2.1。

通过计算,在15年间共发表文章427篇,平均每年发表文章28.5篇。从图中可以看出,开放存取期刊的相关文献在2003年到2017年间,整体上基本处于逐年增长的趋势。其中从2013年到2017年间,文章发表数量波动较大,在此阶段中整体来看论文发表的数量较为反复,起伏波动比较大,在间隔的年份数量都有回落;2016年是近年的发文的最高峰,共有58篇文章发表;2017年整年的发表数量降到2010左右的发表数量水平。

4.3作者关系

在CiteSpace软件中,选择网络节点类型为“Author”,对导入的数据进行分析之后,可以获得作者合作关系的知识图谱

在图中,可以看出作者图谱的节点有21个,连接有5条。由于显示数量较少,在软件的articlelabeling选项中调节threshold数值为1,得到的信息如图4.3.1。在图中我们明显可以看到的相互合作的作者有有Bjork·BC分别与Laakso·mo与Solomon·DJ,Yngve·A与Calder·PC,Horri·A与Sotudeh·H,Walters·WH与Linvill·AC。其中Bjork·BC独立与合作发表研究开放存取期刊的文章次数最多,共有9次。处于发表次数第二位的是匿名作者,具体信息不可知。

4.4被引分析

4.4.1被引作者

在CiteSpace软件中,选择网络节点类型“Cited Author”,对导入的数据进行分析之后,可获得高被引作者的知识图谱。在图中,可以看出图谱的节点有254个,连接有927条。

在图中可以看出,对开放存取期刊研究方面产生重要影响的学者前三名有Bjork·BC(被引频次:61,中心度:0.03),Harnad·S(被引频次:54,中心度:0.10),Suber·P(被引频次:48,中心度:0.08)。

对此,我通过资料的收集,了解到被引作者表现出有重要影响力的几位作者中Suber·P是哈佛大学OA项目的负责人,他主要关注OA邻域的实践进展,在网络上建立了名为“Open Access Overview”的网站,该网站能够及时提供国际上OA相关的实践进展列表。Harnad·S是英国南安普顿大学教授,他关注自存储政策以及自存储绩效评价等内容。Bjork·BC为美国密歇根州立大学与芬兰的汉肯经济学院的教授,同样关注OA邻域,在研究中注重研究开放存取期刊的类型研究。

4.4.2被引文献

在CiteSpace软件中,选择网络节点类型“Cited Reference”,对导入的数据进行分析之后,可获得被引文献知识图谱。在图中,可以看出图谱的节点有178个,连接有500条。

从图表中可以看出,被引文献较多的作者与高被引作者是比较重合的。比如Bjork·BC和Laakso·M在最为被引文献最多的作者被引文献次数节点上都有表现。被引频次最高的两篇文章分别为Bjork·BC在2010年的发表的Open Access to the Scientific Journal Literature: Situation 2009(被引頻次17,中心度0.12),这篇研究文章中调查研究后指出三大类OA期刊中直接完全开放存取的期刊是主流,占62%;延迟开放存取的期刊占14%,采用混合模式的OA期刊占总数的24%。还有Laakso·M在2011年发表的The Development of Open Access Journal Publishing from 1993to2009(被引频次18,中心度0.35),这一篇文章则是系统地研究了OA兴起的20世纪90年代到2009年期间开放存取期刊的发展情况。值得注意的是这两篇文章两位作者都有作为第二作者参与,且都发表在Plos One上,说明两位作者互相之间合作紧密。

被引频次较高的前五篇文章中,2010年之后的占据大部分。依据此与之前的文章整体发表折线图可以了解,大部分被引次数较高的文献都是在开放存取期刊发表快速增长的时期中出现的。这说明了整体研究的发展潮流中,个人在整体学术研究氛围中也产出了高质量作品。

4.5文献分析

在Web of Science中使用检索式进行检索,在检索结果页面左侧栏目中有“文献类型”。通过获得数据文献类型分别的数据,在Excel中根据所得数据列出表格后,做出饼状图,直观了解各种类型所占比。从饼状图中可以看出,占比最多的是论文占比为43%,第二位的是编辑资料占比41%。简讯与新闻所占比相同均为6%。其余的为回忆摘要占4%左右。

从中可以知道,在15年中的发表的这427篇中,真正对开放存取期刊进行研究的文章只有183篇左右。可见国外在开放存取期刊的研究方面,一直处于较为小范围的研究热潮。

4.6机构分析

在CiteSpace中,使用网络节点类型“Institution”,绘制机构的共现知识图谱。对导入的数据进行分析之后,可获得高被引机构的知识图谱。在图中,可以看出图谱的节点有26个,连接有4条。

其中可以看到机构之间的相互合作有汉肯经济学院(芬兰)与密歇根州立大学(美),康乃狄克大学(美)和杜克大学(美),设拉子大学(伊朗)和德黑兰大学(伊朗),奥斯陆阿肯修弗斯大学(挪威)和南安普顿大学(英国)。

从图中的情况来看,研究开放获取期刊方向的,多为大学机构。从合作机构中观察,可以发现合作机构有比较明显的地域限制,大多为同一国家的大学之间,或者是同一大洲的大学之间,而其中有芬兰与美国大学合作情况的特例存在是因为Bjork·BC教授在不同时期段在两校任教。

4.6.1 检索结果机构图谱

4.6.2 检索结果机构图表

4.7热点分析

在CiteSpace中,使用网络节点类型“keyword”,绘制关键词共现知识图谱,图谱中有50个节点,160条连接。在软件的articlelabeling选项中调节threshold数值为2,可以得到更多的关键词显示,并调节关键词的字体大小,使图谱显示更清晰。

4.7.1 关键词图谱

4.7.2 关键词图表

从图谱及图表中可以看出,除去“开放存取”,“开放存取期刊”这两个必有关键词,其它出现频次较高的关键词有影响因子、科学、出版、文献、引用分析、网络、文献版面费用、学术交流等词语。在对关键词进行分析之后,可以看出在开放存取期刊主题中,2003年到2017年主要研究热点有OA期刊影响力研究、OA期刊与图书馆、OA期刊与出版、OA期刊数字化领域、OA期刊的运营方面。从中可以看到热点主要还是集中在OA期刊与图书馆、出版行业的交叉领域中,也正复合当前图书馆与出版行业中融合发展、探索前行的趋势。

5结语

5.1检索过程总结

本次检索中,主要对检索结果进行了其整体趋势、作者、被引、机构以及热点的分析,通过这些分析可以大致了解国外的开放存取期刊研究的状况。在数据库的选择上,使用了Web of Science数据库进行检索。在检索式的组织上,笔者参考了自己Xmind绘制的思维导图,并基于Web of Science数据库的检索式中只能单语言检索的情况,笔者列出英文检索式,检索得到的基本为英文文献数据结果。虽然不能完全展现除英文之外的国家研究状况,但是由于本身开放存取期刊的研究一直不算火热,整体数量本身就不多,所以英文文献在国外开放存取期刊的整体研究中,比较具有代表性。在检索出结果后,对检索结果的分析中使用Excel,CiteSpace与Web of Science分析工具进行分析数据与可视化分析,并对于呈现出的特殊关系进行二次检索,理清情况,并作出说明。

5.2检索结果总结

本文中,通过使用Web of Science的核心数据库,Excel和CiteSpace工具,对开放存取期刊的整体发展状况进行了解后发现,虽然对“开放存取期刊”研究的文章数量波动上升,由此看来整体研究态势不够火热,整体涨幅不大。研究只在2010年至今的特定年份呈现小的研究高峰。在此领域影响力最大的作者为Bjork·B,他的被引次数与文献被引数量均处在首位,研究者缺乏多样化。研究中的合作在地域上多有限制,這不仅在被引作者与被引文献之间的总体可互相印证,在作者合作与机构合作的知识图谱中也可以共同看出。也就是说,国外的开放存取期刊的这个学术领域中较为封闭,专注此领域发展的专家学者较少。同时从出现的较高频率关键词中分析可以看出,开放存取期刊在关于图书馆及文献的计量学方面的相关研究热度已经衰退。近年的热点开始向学术出版、数字化资源、版权问题以及OA期刊的经济机制转变,开放存取期刊的研究主要与出版与图书馆行业结合,这正符合当下出版学中的融合热点。

通过本次的检索,我们可以了解到,近年国外的开放存取期刊并没有成为新的研究热点,在研究中研究对象开始相对集中,研究人员比较孤立,研究相关信息流动比较缓慢。通过这些对国外情况的了解,也希望可以此可视化研究,为接下来国内的开放存取期刊研究做一份前期的工作。

参考文献:

[1]相国庆,土丽艳.开放存取:社办科技期刊的新模式[J].科技与出版,2012(10):102-104.

[2]郭书菊,刘宇.国内外学术期刊价格研究综述[J].现代情报,2013,33(09):171-177.

[3]赵媛斌.论共建机构资源库的必要性和可行性[J].湖北档案,2007(06):9-10.

[4]曹平.论学术信息资源开放获取政策的构建[J].情报探索,2011(05):93-95.

猜你喜欢

发展状况
我国网络社团的发展和监管研究
微商发展现状及问题分析
B2C电子商务物流配送的模式、问题与对策
湖南省旅游业发展现状与竞争力研究
我国互联网+环境下内容产业发展态势研究
萍乡市油茶产业发展状况及对策