APP下载

Scopus与Web of Science比较分析

2017-03-25谢暄蒋晓王燕何雨莲康祝圣

科技与创新 2017年4期
关键词:数据源期刊影响力

谢暄++蒋晓++王燕++何雨莲++康祝圣++田江

摘 要:目前,Scopus已打破WoS在利用引文数据提供引证信息统计和评价分析的权威地位,并得到了越来越多科研人员的关注。针对Scopus数据库和WoS数据库,从文献来源与引证指标统计数据源、主要引证指标、引证结果、被应用的情况等方面立体地进行了比较。结果指出,随着科研工作的全球性、跨学科性、合作性的日益增强,相比于仅通过JCR一个评价报告获得期刊与科研成果评价,同时采信Journal Citation Reports(JCR)报告和Scopus数据库引证指标,获得的评价结果更加公正、科学。

关键词:Scopus;Web of Science;Journal Citation Reports(JCR);引证指标

中图分类号:F426 文献标识码:A DOI:10.15913/j.cnki.kjycx.2017.04.008

一直以来,基于科技期刊数据库的科技期刊引证指标都是科技期刊发展评价的重要参考指标,同时,也是科研人员与高校研究生进行科研成果评价的重要参考依据。自20世纪90年代以来,SCI数据库、ISTP数据库、EI数据库一直被我国图书情报工作者称作国际三大检索数据库。其中,SCI数据库的引文数据分析功能在期刊评价与科技成果评价中占有绝对权威的地位。发展至今,SCI数据库已成为Thomson Reuters的最新Web of Science(WoS)核心合集中的一部分。WoS核心合集数据库包括Science Citation Index Expanded(SCIE)、Social Science Citation Index(SSCI)、Conference Proceedings Citation Index(CPCI,原ISTP)、Arts & Humanities Citation Index(A&HCI)4个相互独立的数据库。2004年,世界著名出版公司Elsevier推出Scopus数据库。目前,Scopus数据库已成全球最大的文摘和索引数据库。它的出现挑战了WoS数据库在引文数据分析评价中的权威地位。

随着Scopus数据库影响力的日益提高,国内外图书情报学相关科研人员已分别从系统界面(人机界面)、国家论文数量、数据处理的规范性、某一学科领域期刊引证数据比较、源刊影响力等方面入手撰文比较了Scopus与WoS。大部分学者的研究从特定期刊或特定的某一学科入手,分析了2个数据库的样本。目前来看,尚没有文献全面对比、分析2个数据库从文献来源到被采信应用范围的情况。

本文针对Scopus数据库和WoS数据库,从文献来源与引证报告数据源、主要引证指标、引证结果、被应用的情况等方面比较二者,并为今后的期刊评价和科研成果评价中数据库的选择提出一些建议。

1 文献来源与引证指标统计数据源比较

据Scopus官方说明,Scopus数据库文献来源包括期刊(Journal)、商业期刊(Trade journal)、丛书(Book series)、图书以及有全文的会议文献,总数据源约29 600种。其中主要包括27个学科,被分为四大主题,即生命科学(Life Sciences)、健康科学(Health Sciences)、自然科学(Physical Sciences)和社会科学(Social Sciences)(包含人文与艺术学科)。而期刊是Scopus数据库的主要文献来源。根据Elsevier公司公布的Scopus 2015 title list,Scopus共收录期刊约22 000种,所有Scopus的引证指标都是基于所收录的數据源计算得来的。

WoS数据库包含SCIE、SSCI、CPCI、A&HCI 4个相互独立的数据库。总体来看,WoS数据库中包括期刊、会议、专利等文献类型,它们来自于自然科学、医学、社会科学、人文艺术等学科领域,总数据源约18 900种。由于本文主要关心科技期刊的评价,因此,会重点关注WoS数据库中SCIE和SSCI这2个子数据库。Thomson Reuters公司2015年公布的SCIE&SSCI Full Title显示,WoS在SCIE&SSCI中共收录期刊约12 000种。WoS的引证指标计算结果作为WoS的一项单独服务,以引证报告Journal Citation Reports(JCR)的形式每年出版,分为科学版和社会科学版(Science Edition与Social Science Edition),分别统计来自SCIE和SSCI的数据。

乌利希期刊指南(Ulrichs periodical database)作为全球最大的期刊目录,收录了全世界绝大多数出版中的期刊。因此,以乌利希期刊指南为比较基准,经过严格的ISSN匹配与期刊名称、出版国家人工匹配发现,在生命科学(Life Sciences)、健康科学(Health Sciences)、自然科学(Physical Sciences)和社会科学(Social Sciences)四大主题中,相比于WoS数据库,Scopus数据库所收录的期刊源表现出了更均衡的国家分布、更

强的国际化程度。与此同时,二者均表现出对英国、荷兰、美国等西方国期刊的“过表达”(overrepresented)。不过这种情况并不意外,因为众多优秀的出版公司都在这些国家。

由此可见,在总量和期刊数量上,Scopus数据源均多于WoS数据源,二者均收录了来自医学、理工、人文、艺术等多个学科的文献,所收录的数据源有大部分重复,同时,也各自有部分独有收录的数据源。Scopus数据源在出版国别分布上更加均衡,表现出更好的国际化分布。但是,在引证指标计算统计源的组织形式上二者完全不同。Scopus数据库的引证指标是根据全库数据计算而来的,统计源呈现了明显的多样性;而WoS的引证报告JCR则保留了传统分类,仅按照某个子数据库数据源单独计算,统计源类型仅包括期刊文献。

2 主要引证指标比较

2.1 Scopus主要期刊引证指标

2.1.1 CiteScore

CiteScore是Scopus酝酿多年推出的引证指标,是指在统计年计算期刊近三年在Scopus数据库中收到的总引用量,除以期刊近三年发表的总可被引文章数。

2.1.2 SCImago Journal Rank(SJR)

SJR指标将期刊的互引事件看作一个复杂的网络,每种期刊被看作网络中的一个点(node),基于网络理论(network theory)中“连接(connection)到权重更高的点给源点增加更多的权重”这一基本原理,结合PageRank算法估计某期刊的影响力。即该指标同时考虑了被评价期刊的被引次数以及施引期刊的重要性和声望,从而更加客观地评价期刊的影响力。

2.1.3 Source Normalized Impact per Paper(SNIP)

SNIP基于某学科内总被引次数计算某来源期刊的影响力。在SNIP计算中,一个来自于总引用量更少的学科的引用表达了更高的影响力。我们可将SNIP看作是学科归一化后的影响力评价指标,可以帮助研究人员直接跨学科比较源刊的影响力。

2.2 WoS的主要评价指标

2.2.1 Impact Factor(IF)

IF是指,在统计年计算期刊近两年被WoS中所有收录的期刊的总引用量,除以期刊近两年发表的总可被引文章数。IF是衡量期刊影响力的传统指标。

2.2.2 5-year IF

5-year IF是在统计年采用近5年的数据计算IF。

由此可以看出,Scopus数据库的引证指标中考虑了更多影响因素,更全面、客观,能够在某种意义上消除学科与研究类型的不同对评价指标的影响,从而便于对比不同学科的期刊,但计算方法相对比较复杂。而WoS所采用的引证指标计算方法简单,已使用多年,被广大科研工作者所接受。但是,它无法消除学科间的差别与研究类型不一致而导致的引证指标差别(一般来说,理论研究的文献IF会远高于工程应用文献的IF)。二者的优缺点对比如表1所示。

3 引证结果比较

虽然Scopus数据库与WoS数据库采用的是不同的最终引证指标,但是,所有指标的计算都是从期刊被引次数统计开始的。被引次数是最基本且最不受算法干扰的指标。同時,在Scopus数据库的引证指标计算中,IF也是SCImago中的一个子指标。因此,文献[9]选择从被引频次和学科内IF排名对2个数据库进行差异性分析。

从统计结果来看,期刊被引频次差异最大的学科集中在计算机科学(Computer Science)和医学(Medicine)2个学科,而在其他学科中,2个数据库分别统计得到的期刊被引频次指标一致性比较强。期刊被引频次差异正是来源于文中提到的Scopus数据库和WoS数据库的引证报告统计源组织形式不同。Scopus数据库所有统计数据均来自于全库所有数据源,包含所收录的全部学科和全部文献类型。而WoS的统计仅仅来自于其中一个子数据库,比如JCR的自然科学版只统计来自于SCIE库的数据源,而社会科学版只统计来自于SSCI库的数据源。在计算机科学学科,许多重要科研成果均发表在IEEE或ACM的顶级国际会议中,而JCR的统计不包括国际会议。由此可知,在JCR的统计中,未能计入计算机科学学科中会议对期刊引用数据的贡献。这是导致计算机学科期刊被引频次统计结果在2个数据库中有明显差异的主要原因。而医学学科并无太多会议对期刊的引用,又是什么原因导致二者的差异呢?分析发现,医学期刊多学科之间存在较强的学科交叉关系,特别是与社会科学和心理学之间有较强的交叉关系。虽然SCIE数据库与SSCI数据库有部分共同收录的期刊,但SCIE数据库中社会科学和心理学期刊依然少于Scopus数据库中相应的数量。而JCR统计分为自然科学与社会科学2个版本,无法统计SSCI数据库中社会科学和心理学等期刊对医学期刊的引用,因此,导致医学科学期刊被引频次统计在Scopus数据库和WoS数据库中呈现明显差异。

对于分学科IF排名,分别采用Scopus数据库与WoS数据库统计结果,排名差异明显的学科是计算机学科。这种差异依旧来自于WoS的统计结果未能计入IEEE和ACM等重要会议的引用记录,同时,说明某些期刊会议文献对其引用频次贡献非常大。例如,对于著名的ACM会刊,ACM Trans. on Information and System Security在JCR中IF排名第46位,在SCImago中排名第12位。然而,在2个数据库中分别统计医学学科IF排名并没有太大的变化。笔者认为,有一种原因可能是,虽然JCR自然科学版未统计入SSCI中交叉学科期刊对医学期刊的贡献,但是,这种学科交叉情况广泛而均衡地存在于所统计的绝大多数医学来源期刊中,所以,SSCI数据库引用贡献的缺失并未导致医学期刊IF排名发生明显的变化。这种推测会在将来的工作中进行数据分析、确认。

4 数据库影响力比较

数据库的被认可度和影响力表现为该数据库及其评价指标被使用的情况,特别是被国际刊物采用的情况以及被科研绩效评价与奖励采用的情况。

在国际刊物采用情况统计中(本文界定在期刊介绍或期刊首页使用数据库任一统计指标,即认为该数据库指标被采用),PLoS系列刊物和Elsevier出版刊物(ScienceDirect平台中所展示的刊物)同时采用了Scopus引证指标和WoS引证指标。而Nature出版的部分刊物采用了Scopus统计指标,所有Nature出版刊物均采用了WoS统计指标。Science未采用2个数据库的统计指标。

在科研绩效评价与奖励方面,Elsevier学术之星与高被引作者评价、多个世界高等学校排名(包括Elsevier、英国泰晤士报、Times、QS World Univ. Rankings 等高校排名)以及英国REF大学学科质量评价,均采用了Scopus数据库而未采用WoS数据库。其中,英国REF大学学科质量评价结果将被用于分配下一个REF评价年之前该高校的科研经费。这有非常重要的现实意义。具体数据库采用情况如表2所示。

由表2可知,长期以来,鉴于WoS在期刊与科研评价中的权威地位,目前应该说WoS的影响力还是略高于Scopus的影响力,但是,Scopus确实已经打破了WoS的权威地位,并在不断提升其影响力。特别是在需要综合考虑各种文献类型的场合,比如综合性的大学排名、学科评价,Scopus已占有重要位置,不可或缺。

另外,据不完全统计,Scopus在欧洲及东南亚部分国家,比如新加坡、马来西亚等,已成为学术资格评审(比如博士学位获得条件,职称晋升条件等)认可采用的数据库。

5 结论

从对文献来源与引证统计数据源、主要引证指标、引证结果和数据库影响力等方面的分析入手,综合比较了Scopus数据库与WoS数据库。在文献类型来源、引文数据分析和信息揭示方面,Scopus与WoS相比有相似之处,WoS被接受度高,不过在某些学科评价中,Scopus更加客观、全面。

比较结果显示,在文献来源方面,2个数据库均呈现出多学科、多种文献类型的情况,但是,引证指标计算的数据源组织形式却各有不同,Scopus的指标针采用全数据源计算,而WoS的JCR报告仍采用原来的方法按子库数据源分别计算,且JCR的统计源仅包含期刊。因此,对于有众多重要会议,会对期刊引用产生贡献的计算机学科和学科交叉性比较强的医学学科,2个数据库统计的期刊被引频次呈现出了较大的差异。同时,在计算机科学学科中,2个数据库统计的期刊IF排名也呈现出了较大的变化,而在其他学科,2个数据库统计被引频次与期刊IF排名表现出了较强的一致性。Scopus数据库提出的统计评价指标——SJR和SNIP,致力于消除学科和研究类型对评价指标的影响,但计算方法复杂;而WoS的主要评价指标——IF和5-year IF计算方法简单,使用多年,被接受程度比较高,但是,无法消除学科与研究类型的影响。从数据库被采用的情况看,WoS在重要国际期刊评价中的被采用率高于Scopus,但在科研奖励与大学排名等需要综合考虑多种科研成果形式的场合,Scopus被采用率更高。由此可见,Scopus已经打破了WoS的权威地位,且其影响力在不断提高。

随着科研工作的全球性、跨学科性和合作性的日益增强,相比于仅通过JCR这1个评价报告获得期刊和科研评价结果,建议同时采信JCR报告和Scopus數据库引证指标。这样,获得的评价结果应该会更加全面。更多针对2个数据库的数据研究将在今后的工作中逐步进行。

参考文献

[1]邱均平,叶晓峰,熊尊妍.国外索引工具发展趋势研究——以Scopus为例[J].情报科学,2009,27(6):801-807.

[2]Web of Science核心合集,汤森路透.[EB/OL].http://www.

thomsonscientific.com.cn/productsservices/web_of_science/.

[3]Meho L.I.,Rogers Y.Citation Counting,Citation Ranking,and h-Index of Human—Computer Interaction Researchers:A Comparison of Scopus and Web of Science.Jouma/of the Association for Information Science and Technology,2008,59(11):1711-1726.

[4]Matthew E.Falagas, Eleni I.Pitsouni,George A. Malietzis,Georgios Pappas,Comparison of PubMed,Scopus, Web of Science,and Google Scholar:Strengths and Weaknesses.The FASEB Journal,2008(22):338-342.

[5]Archambauh é,Campbell D,Gingras Y,et a1.Comparing Bibliometrie Statistics Obtained from the Web of Science and Scopus.Journal of the Association for Information Science and Technology,2009,60(7):1320-1326.

[6]Elizabeth S.Vieira,José A. N. F. Gomes.A comparison of Scopus and Web of Science for a typical university.Scientometrics,2009,81(2):587-600.

[7]L.Leydesdorff,F. de Moya-Anegón,V. P. Guerrero-Bote.

Journal Maps on the Basis of Scopus Data:A Comparison

with the Journal Citation Reports of the ISI.Journal of the

Associationfor Information Science and Technology,2010,

61(2):352-369.

[8]傅立云,吴敏琦,谢海华.SCIE和Scopus引文功能的评价分析[J].高校图书馆工作,2009(06):54-56.

[9]刘筱敏,孙媛,和婧.Scopus与SCI来源期刊影响力差异化分析[J].中国科技期刊研究,2014,25(9):1171-1177.

[10]Scopus.[EB/OL].http://www.elsevier.com/online-tools/scopus/.

[11]Scopus Title List.2015.[EB/OL].http://www.scopus.com.

[12]JCR2014.2015.[EB/OL].https://jcr.incites.thomsonreuters.co

m/JCRJournalHomeAction.action?SID=A2-x2FVV3kOziQc

BTe8-18x2d5x2FWQz0x2BsbyUPrQKQ8eH2vwx3Dx3DP9

rRT5PCZt3ao1YomgVtEQx3Dx3D-iyiHxxh55B2RtQWBj2

LEuawx3Dx3D-1iOubBm4x2FSwJjjKtx2F7lAaQx3Dx3D&

SrcApp=IC2LS&Init=Yes&wsid=4CARgCJeFEKMzLpYaR

7.

[13]Philippe Mongeon,Adèle Paul-Hus.[EB/OL].http://www.asis.

org/SIG/SIGMET/data/uploads/sigmet2014/ mongeon.pdf.

[14]González-Pereira,V.P.Guerrero-Bote and F.Moya-Anegón,A new approach to the metric of journals scientific prestige:The SJR indicator.Journal of Informetrics,2010,4(3):379-391.

[15]F. V. P. Guerrero-Bote,F. Moya-Anegón. A further step forward in measuring journals scientific prestige:The SJR2 indicator. Journal of Informetrics,2010,6(4):674-688.

[16]G.Henk,F. Moed.Measuring contextual citation impact of scientific journals.Journal of Informetrics, 2010,4(3):265-577.

————————

作者簡介:谢暄(1983—),女,博士,电子科大学报英文编辑

室主任。

〔编辑:白洁〕

猜你喜欢

数据源期刊影响力
My Hobby
图表中的交互 数据钻取还能这么用
期刊审稿进度表
你凭什么影响别人
基于Excel的照片查询系统开发与应用
期刊审稿进度表
再谈利用邮件合并功能批量生成准考证
期刊审稿进度表
2015中国最具影响力10位商界领袖
数据有增加 图表自适应