APP下载

全球合作应对科研失范现象的效果分析及启示

2016-05-30付中静

出版科学 2016年4期

[摘 要] 收集Web of Science(WoS)数据库的高被引撤销论文数据,分析其分布规律和引证特征。结果发现,TOP20%高被引撤销论文430篇,分布于31个国家,多学科领域最多,35种期刊>3篇。高被引撤销论文撤销时滞和撤销论文总被引频次相关性较弱(P=0.014),和撤销前被引频次相关性较强(P=0.000)。期刊IF和撤销论文数量、撤销论文总被引频次、撤销论文篇均被引频次正相关(P=0.017、P=0.000、P=0.005)。撤销后年均被引频次低于撤销前(P=0.000)。本研究说明IF高的期刊发表的撤销论文对学术界带来的负面影响较大,撤销时滞延长增加了撤销前引用,撤销起到了一定的净化效果,但是净化效果还不理想,建议国内外学者加强对撤销论文及其不良影响的关注。

[关键词] Web of Science 高被引撤销论文 引证特征

[中图分类号] G231 [文献标识码] A [文章编号] 1009-5853 (2016) 04-0077-06

[Abstract] To analysis the distribution and citation characteristics of high cited retracted articles which were obtained from the Web of Science (WoS).There were 430 high cited retracted articles, which were distributed in 31 countries,mostly distributed in multidisciplinary sciences. The number of retracted articles were more than 3 among 35 journals. Time-to-retraction and total citation had a weak association (P=0.004),had a positive correlation with the citation of pre-retraction(P=0.000).There was positive correlation among IF and the number of retracted articles, total citation,perpaper citation(P=0.017、P=0.000、P=0.005). Time-to-retraction and total citation had a weak association (P=0.000). Retracted articles which have published in the higher IF journal have a increasing negative impact on the academic community. With the increase of time-to-retraction, the citation of pre-retraction was becoming larger and larger. The effect of self purification of journal is not perfect. It is recommended that the researcher should pay more attention to retracted articles.

[Key words] Web of Science High cited retracted article Citation characteristics

科学不端曾经一度是学术界的研究热点,各国政府和科学界试图纠正科学不端行为,学者们继续依赖自我调整,最主要的是编辑和同行评审期刊。虽然期刊可以提高应对欺诈的手段,但不是主要的预防方法,期刊编辑应负起责任,对不端学者进行警告,合著者要对工作负责;期刊的作者、同行评审者和编辑有责任监视并维护道德标准,并尽力避免任何形式的不端行为。有科研不端行为的学术成果要及时撤销并发布撤销声明,从而纠正科研不端行为,尽量消除负面影响[1]。撤销论文是指已经发表的论文由于存在错误或者学术不端行为,在作者申请或者是科学共同体成员举报后,经过调查属实的,论文所刊发期刊对其发布正式撤销声明(也有部分未发布)以告知公众的论文[2]。早在1987年,国际医学期刊编辑委员会(ICMJE)就提出,不宜在文献资源中继续保存的或有错误的学术论文要对其进行撤稿。目前Web of Science(WoS)、Pubmed、斯普林格等国际知名数据库已在数据库内标记了撤销论文和撤销声明,Pubmed最为规范。2009年12月,国际刊物《晶体学报》发布社论通告了70篇发表在C或E分卷上的晶体结构报告有造假行为,并进行论文撤销行为,在国内引起学者们广泛关注;而2015年可谓学术界的反省年,“一年三大撤”引发国内学术及期刊界震动——3月,生物医学中心(BioMed Central )43篇论文遭撤稿突显同行评议制度漏洞,41篇作者来自中国;8月斯普林格撤回64篇论文,10月爱思唯尔撤回9篇学术论文,全部来自中国。笔者作为期刊工作者对此也很关注。众所周知,科技期刊是科研人员发布科研成果和进行学术交流的重要平台,如果混入因不端行为或有错误内容的学术成果,危害不可设想。科技期刊及时撤销有问题的学术成果,并发布撤销声明,能起到净化学术氛围、保障学术公平、促进学术进步以及维持学术生态系统平衡的作用[3]。

论文撤销现象备受国内外学者的关注,但国内研究主要集中于撤销论文分布期刊、国家、学科、机构等方面,或是对撤销原因、撤销程序等进行分析[4-5]。国外已陆续开展有关撤销论文的定量研究,发现有些撤销论文的被引频次并不低,撤销声明也有被引用。有学者调查了基于国际出版伦理委员会(COPE)撤销准则,被Pubmed撤销的精神障碍方面的论文,发现2010年及以后撤销24篇(43.65%),2010年以前撤销31篇(56.35%),大量论文在撤销后至少被引用一次[6]。有学者[7]分析了2006—2013年Pubmed出版的生物医学领域的撤销论文数量,发现截至2014年1月30日,《关节炎与风湿病》Arthritis&Rheumatology期刊的5篇撤销论文,在斯高帕斯(Scopus)数据库中的总被引频次达308次,最高达121次,其次为119次、61次、7次,1次篇未被引(2010年发表)。辛格(Singh)等[8]发现1994年发表于《自然》杂志的一篇论文,撤销时滞达19年之久(2013年撤销),WoS数据库中的被引频次高达255,撤销声明发表后该文仍被引用。国内学者姚长青等[9]发现残留引用(撤销后引用)模式的撤销论文生存曲线持续约35年,该类文献影响深远,篇均被引频次达22.53次,最高达930次,撤销后平均被引次数仍达6.41,最高达536次;他还研究了高被引论文的引用网络,发现被引频次最高的一篇论文撤销时滞(撤销时间与发表时间的间隔)历经12年,自我纠正和净化时间成本很高。撤销论文数量和撤销时滞是保证科学能否健康发展的重要指标。撤销论文的引用给期刊界带来的是负影响,撤销论文被引用情况和撤销时滞在评价期刊自我净化效果的研究中不可小觑,尤其是撤销后的引用,但是学者们更多关注撤销行为本身,对撤销行为对学术界产生的净化效果的研究匮乏。

从以上文献可以看出,撤销论文中不乏高被引论文的存在,他们有什么样的引证特征呢?既然已经撤销,为何还有如此高的被引频次呢?是撤销前本来就很高么?那么撤销后净化效果如何呢?撤销时滞和净化效果有关么?基于种种未知,我们统计WoS数据库中高被引撤销论文数量、被引频次、撤销时滞等信息,以探究高被引撤销论文的引证特征,通过分析撤销前后年均被引频次差异分析撤销带来的净化效果。

1 数据来源与方法

1.1 数据收集

登录WoS数据库,按照以下步骤进行检索:(1)以标题ti=retract*or ti=withdiaw paper and文献类型DT=(Correction)检索2004—2013年的撤销论文声明。(2)以标题=Retracted article检索出截至2013年发表的撤销的论文(去掉非撤销论文信息),添加到标记结果列表中,导出撤销论文信息到自建数据库中;并创建引文报告,导出被引频次等信息。(3)按照撤销论文总被引频次排序,选择TOP20%的高被引撤销论文430篇(被引频次≥29)。根据(1)和(2)中数据进行比对收集撤销时滞等信息。

1.2 方 法

统计分析高被引撤销论文国家、期刊、学科的分布情况;统计撤销论文数量、撤销论文的总被引频次、撤销后被引频次、篇均被引频次、撤销时滞等信息,并对高被引撤销论文的引证特征进行分析:(1)分析高被引撤销论文的生存曲线;(2)期刊影响因子对高被引撤销论文数量、被引频次的影响;(3)撤销后与撤销前年均被引频次差异。采用SPSS22.0统计学软件分析数据,Spearman双变量相关检验方法检验各指标之间的相关性。P<0.05为差异有统计学意义。

2 结果分析

2.1 高被引撤销论文的国家分布

TOP20%高被引撤销论文430篇,分布于31个国家(表1),美国最多(192篇),日本第2位(42篇),但是远低于美国,德国第3位(39篇),英国第4位(24篇),中国第5位(18篇)。各国撤销论文总被引频次最高者为美国(16594),其次为日本(4324),但是远低于美国,英国居第3位(3068),中国居第6位(1275)。篇均被引频次最高者是俄罗斯(仅1篇,为2001年发表于《自然》的论文,被引频次422),其次是英国(319,24篇)、法国(224,4篇),第4位的是丹麦(187,3篇),第5、6位是韩国、中国。单篇被引频次最高的论文分别来自日本和英国,被引频次均为943。

2.2 高被引撤销论文的学科分布

430篇高被引撤销论文分布在120个学科领域,表2列出高被引撤销论文数量排名前10位学科分布情况。学科领域≥10的有10个学科。多学科领域(Multidisciplinary Sciences)最多;其次,生物化学与分子生物学细胞生物学(Biochemistry & Molecular Biology); 细胞生物学(Cell Biology) ,排行第三位的是肿瘤学(Oncology)。 高被引撤销论文主要集中于这些学科,说明撤销论文对这些学科领域带来的负影响较大,也说明这些领域净化能力强。40个学科领域≥3篇,16个学科领域为2篇,64个学科领域1篇。篇均被引频次最高的是内科学(Medicine General & Internal)(261),最低的是经济伦理学(Business); (Ethics)(29)见表2。

2.3 高被引撤销论文的期刊分布情况

430篇高被引撤销论文分布于206种期刊,143种期刊发表1篇,28种期刊发表2篇,35种期刊发表论文数量>3篇。表3列出了撤销论文数量排名前10位的期刊。单篇被引频次最高的论文分别来自《科学》(Science)、《柳叶》(Lancet)、《血液》(Blood),被引频次分别为943、943、828。35种>3篇,高被引撤销论文主要集中于这些期刊,说明这些期刊发表的高被引撤销论文较多,撤销论文对这些期刊带来的负影响较大。为分析这些期刊影响因子和撤销论文数量、被引频次等信息的相关性,我们进行了以下研究。

2.4 高被引撤销论文的被引用情况

2.4.1 生存曲线

12.6%(54篇)的高被引撤销论文撤销后被引频次为0,净化效果比较彻底,87.4%(376篇)的高被引撤销论文撤销后截至检索日被引频次仍然>0(撤销后残留引用)[9]。图1中生存时间为撤销时滞,分析了残留引用和撤销后为0/截至检索日为0两种引用模式的生存曲线,撤销后残留引用的论文中,1994年发表于《自然》的一篇论文撤销时滞最长达19年,2013年才撤销,总被引频次260。撤销后为0/截至检索日为0的论文中,撤销时滞最长18年,为1994年发表于《加拿大麻醉杂志》(CANADIAN JOURNAL OF ANAESTHESIA-JOURNAL CANADIEN D ANESTHESIE)的一篇论文,该文2012年撤销,总被引频次49。被引频次最高的一篇论文为943,撤销时滞12年;净化比较彻底的论文被引频次最高也有268,1997年发表于《科学》,撤销时滞8年。在发表当年撤销的论文22篇,被引频次在31-91之间。图1中A组中撤销论文存活时间6.44±0.59,B组为4.49±0.17,可见残留引用模式的生存时间比较长。A组残留引用模式的生存曲线持续延长至18年,对学术界的影响深远。B组在发表后7年累计存活率下降为0.1,也就是说此时99%的论文被撤销,发表后10年基本下降为0,也就是此时净化效果很彻底。

A:撤销后残留引用;B:撤销后为0/截至检索日为0

2.4.2 撤销时滞对被引频次的影响

430篇高被引撤销论文撤销时滞(4.99±3.371),撤销时滞和撤销论文总被引频次相关性较弱(P=0.014),和撤销前被引频次相关性较强(P=0.000)。说明撤销时滞延长增加了撤销前被引频次。

2.4.3 期刊影响因子对被引频次的影响

撤销论文数≥3的期刊35种。IF 1.482—54.420(12.357±13.108),IF和撤销论文数量正相关(P=0.017),和撤销论文总被引频次正相关(P=0.000),与撤销论文篇均被引频次正相关(P=0.005)。

2.4.4 撤销后与撤销前年均被引频次差异

为分析撤销对学术界的净化效果,笔者分析了撤销后年均被引频次(4.99±7.59)与撤销前年均被引频次(27.77±50.83)差异,Levene齐性检验发现发差不齐(F=79.680,P=0.000),基于方差不齐的T检验结果显示,两者差异显著,撤销后年均被引频次低于撤销前(T=10.804,P=0.000),起到了净化效果。

3 总结与讨论

3.1 高被引撤销论文的被引情况与期刊影响因子的关系

430篇高被引撤销论文分布于206种期刊,其中35种期刊高被引撤销论文数>3篇。高被引撤销论文数量前10位的期刊中不乏《科学》《自然》《血液》这些权威名刊,数量分别为2、3、5位,篇均被引频次分别为3、10、9位,总被引频次分别为1、2、5位。可见撤销论文数量可能和被引频次存在一定的一致性,因此,笔者进行期刊影响因子和撤销论文数量、被引频次的相关性分析,结果发现IF和撤销论文数量正相关(P=0.017),和撤销论文总被引频次正相关(P=0.000),和撤销论文篇均被引频次正相关(P=0.005)。通过对期刊影响因子和撤销论文数量的相关性进行分析发现,两者正相关(r=0.255,P=0.026)。有学者[10]认为高影响因子期刊上发表的论文比低影响因子期刊发表的论文更容易撤销。范少萍等[11]通过检索主要科学数据库也发现撤销论文往往发表在IF较高的期刊上,这些期刊的撤销论文往往有较高的被引频次。范少萍等[12]还对期刊撤销论文的篇均被引频次和期刊影响因子5进行相关性分析,发现两者显著相关(r=0.894,P=0.000)。撤销论文总被引频次、撤销后被引频次和期刊影响因子 均呈正相关(r=0.786,P=0.000;r=0.745,P=0.000),梅德洛克布朗(Madlock-Brown)等[13]研究表明撤销后被引频次和期刊影响因子相关(r=0.24,P<0.05),但其未对撤销论文总被引频次进行分析。本研究表明,影响因子越高,高被引撤销论文数量多,撤销论文总被引频次高,篇均被引频次也较高,说明高影响因子期刊上发表的论文,受关注程度高,具有一定的传播效率[14] ,从而使有问题的论文更容易被发现,学术影响力也大,期刊的学术影响力对论文的被引频次有影响,高学术影响力期刊上的论文可以更多地被引用。也说明期刊具有一定的自我净化能力,以保证期刊长期健康稳定发展,但是净化效果还不够理想,提示研究者应加强对高影响因子期刊或者高被引撤销论文的关注,尤其是施引论文的关注,当然并不能说明低影响因子期刊净化效果就十分理想,还与撤销论文数量、受关注程度等有关。

3.2 撤销时滞延长增加了撤销前引用

当已发表的论文确实存在严重的缺陷或者科研不端行为时,需要尽快撤销以便消除其带来的负影响,辛格(Singh)等[15]发现1994年发表于《自然》杂志的一篇论文,撤销时滞达19年之久,WoS数据库中的被引频次高达255,撤销声明发表后该文仍被引用。雷德曼(Redman)等[16]研究发现,高影响因子期刊上发表的论文撤销后仍有大量引用,这些引用必然产生负面影响。由于目前对学术不端行为的论文在举报、调查、确证的过程中仍存在较大难度,科学共同体自我纠错和净化时间成本高,可能误导科学家对研究现状的判断,会引用一些已经撤销过的论文。陈(Chen)等[17]对WoS数据库1980—2012年3月的撤销论文进行分析发现,撤销论文平均在发表后2.57年被撤销,撤销论文的生存时间表明,论文撤销后被引的平均时间为4年(中值2年),论文从发表到引用结束平均需要6年(中值5年)。本文发现残留引用模式的高被引撤销论文对学术界影响深远,被引频次并未因论文的撤销而消失。87.4%(376篇)的高被引撤销论文撤消后截至检索日被引频次仍然>0。高被引撤销论文被引频次和撤销时滞有什么关系呢?前期研究发现撤销时滞和撤销论文总被引频次显著相关(r=0.444,P=0.000)[18],还发现随撤销时滞延长,撤销前被引频次总数、篇均被引频次、秩均值逐渐增加,撤销时滞增加了撤销前引用,2年内撤销为好,撤销时滞≥5年时撤销后被引频次会有所衰减,还可能与撤销论文引起关注以及文献的老化等因素有关。本研究对高被引撤销论文的撤销时滞和撤销论文总被引频次进行相关性分析发现,两者相关性较弱(r=0.122,P=0.014),相关性低于前期研究发现的撤销时滞和撤销论文总被引频次相关性(r=0.444,P=0.000),撤销时滞延长客观上增加了期刊的负面影响,究竟是与撤销前被引频次有关还是和撤销后被引频次有关呢?本研究对此进行分析发现,这与撤销前被引频次显著相关(r=0.479,P=0.000),进一步说明撤销时滞延长增加了撤销前被引频次。即便这种引用是用反面例子佐证自己的新观点,但是这种引用仍是基于撤销论文的负面影响。

3.3 撤销起到了一定的净化效果,撤销后年均被引频次低于撤销前

有学者认为撤销论文的主要原因是学术不端,也有学者调查发现撤销的主要原因是诚实性的数据错误,斯蒂恩(Steen)[19]认为学术期刊自我纠正(self-correction)的主要方式是撤销,大约3/5的论文撤销的原因在于学术不端;韦杰(Wager)等[20]认为诚实性的错误是论文撤销的主要原因而非学术不端;基于撤销论文的数据来源不同,可能会有不同的结论,但不管是何种原因,撤销论文的被引都像零被引论文率一样,同是期刊的反向评价指标[21]。既然论文被撤销,除了说明期刊有一定的传播效率外,还说明期刊具有一定的自我净化效果。穆拉特(Murat)等[22]对撤销论文撤销前后的被引频次研究发现,两者差异显著(P<0.05)。为分析撤销对学术界的净化效果,笔者分析了撤销后年均被引频次(4.99±7.59)与撤销前年均被引频次(27.77±50.83)差异,发现撤销后年均被引频次低于撤销前(P=0.000),起到了净化效果。虽然没有证据表明撤销声明会对作者引用行为产生较大影响,但是有证据表明撤销后论文被引频次降低,高被引撤销论文撤销后被引频次也有所减少。

3.4 国内学术净化氛围有待加强

高被引撤销论文主要集中于美国、日本、德国、中国,撤销论文数、被引频次、篇均被引频次排行均位于前10位的国家有美国、英国、日本、西班牙、韩国、中国,这些国家发表的撤销论文所带来的学术影响也比较大。随着我国学者发表的撤销论文逐渐被披露,引起国内学术界的震惊,也引发一些思考——撤销论文制度的实施可以保证学术文献的可靠性和准确性。1997年成立的国际出版伦理委员会出版的《撤销指南》明确规定了撤销准则,会员包括荷兰的爱思唯尔(Elsevier)、美国的威利·布莱克威尔(Wiley-Blackwell)、德国的斯普林格等共6412余家[23],中国会员已达38家。我国虽然目前已有期刊进行撤销,对于学术不端行为的论文或者有错误的科研成果,除发表前退稿和发表后撤稿外,还应对学术不端论文的作者加大惩罚力度[24]。2009年我国出版了首部《高等学校科学技术学术规范指南》,2010年6月又出版了《高等学校科学技术学术规范指南》,目前中国科协等7个部门联合印发《学术论文“五不准”》 ,督促相关单位对撤稿事件调查处理,这对科研诚信管理起着重要的推动作用。尤其是图书情报领域期刊近年来开展一系列讨论与检测,中国图书馆学会编译出版委员会、图书馆学期刊编辑出版专业委员会于2013年11月8日发布《图书馆学期刊关于恪守学术道德、净化学术环境的联合声明》,2015年11月《图书情报工作》《情报理论与实践》《图书与情报》等期刊再次联合发布《中国图书馆学情报学期刊抵制学术不端联合行动计划倡议》,但是至今还没有建立起明确、细致的撤销论文制度,关于此方面的研究也比较少,我国的出版机制还不够健全,还有待开展出版伦理研究与建设。

本研究通过文献计量学和统计学方法初步揭示了高被引撤销论文引证特征,发现高影响因子期刊发表的、撤销时滞长的撤销论文,可能对学术界带来的负影响越大;撤销时滞较长更容易增加撤销前引用,撤销后年均被引频次低于撤销前;关于期刊通过撤销进行自我净化效果的深入研究还有待于长时间观察撤销后被引频次。本研究肯定国际期刊自身净化效果的同时,还提倡对论文进行撤销时要充分确保是符合撤销准则的、规范的,建议科研管理部门、国内外数据库、期刊编辑和科研人员等加强对撤销论文及其不良影响的关注,尤其加强对撤销论文的标注标准化、规范化,使期刊进行自我净化效果最大化,构建防治一体的出版伦理制度与体系也势在必行。

注 释

[1]Steen RG.Retractions in the scientific literature:do authors deliberately commit research fraud[J].J Med Ethics,2011,37(2):113-117

[2][11]范少萍,张志强.国外撤销论文研究综述[J].编辑学报,2014,26(5):496-502

[3]范少萍,张志强. 期刊撤销影响因子的构建及其与期刊影响因子的关系[J]. 大学图书馆学报,2014( 2):76-84.

[4]朱大明. 学术期刊的论文撤销与其权威性悖论解析[J]. 科技导报,2015(19):109

[5]田瑞强,姚长青,刘洢颖,等.学术论文的撤销条件、原因及程序研究[J].中国科技期刊研究,2014,25(10):1232-1237

[6][19]Steen RG,Casadevall A,Fang FC.Why has the number of scientific retractions increased[J]?PLoS One,2013,8(7):e68397

[7]Gasparyan AY,Ayvazyan L,Akazhanov NA,et al.Self-correction in biomedical publications and the scientific impact[J].Croat Med J,2014,55(1): 61-72

[8][15]Singh HP,Mahendra A,Yadav B,et al.A comprehensive analysis of articles retracted between 2004 and 2013 from biomedical literature–a call for reforms[J].J Tradit Complement Med,2014,4(3):136-139

[9]姚长青,田瑞强,杨冬雨,等.撤销论文及其学术影响研究[J].中国科技期刊研究,2014,25(5):595-604

[10] Fang FC,Casadevall A.Retracted science and the retraction index[J].Infect Immun,2011,79(10): 3855-3859

[12]范少萍,张志强.科学文献数据库中撤销论文分布规律研究:以Web of Science数据库为例[J].情报学报,2014,33(4):375-387

[13] Madlock-Brown CR,Eichmann D.The (lack of) impact of retraction citation networks[J].Sci Eng Ethics,2015,21(1):127-137

[14]张晴,姚长青,潘云涛,等.中文学术期刊撤销论文研究[J].中国科技期刊研究,2014,25(5):611-615

[16]Redman BK,Yarandi HN,Mera JF.Empirical developments in retraction[J].J Med Ethics,2008,34(11):807-809

[17]Chen CM,Hu ZG,Milbank J,et al.A visual analytic study of retracted articles in scientific literature[J].J Am Soc Inform Sci Technol,2013,64(2):234-253

[18]付中静.国际期刊撤销论文引证特征及其自身净化效果分析[J].中国科技期刊研究,2016,27(4):346-351

[20]Wager E,Williams P.Why and how do journals retract articles:An analysis of Medline retractions 1988-2008[J].J Med Ethics,2011,37(9): 567-570

[21]胡泽文,武夷山,袁军鹏.零被引研究文献的知识图谱分析:历史发展脉络、主体和高频主题[J].情报科学,2016,36(3):85-91

[22]Murat C,Faiho,RaulRE.Retraction rates are on the rise[J].EMBO Reports,2008,9(1):2

[23] Atlas MC.Retraction policies of high-impact biomedical journals[J].J Med Libr Assoc,2004,92:242-250

[24]曾元祥,方卿. 中国学术出版伦理建设[J]. 出版科学,2014(5):48-50