预警期刊风险特征研究*

2022-12-26宗张建

情报杂志 2022年12期

宗张建

(南京医科大学图书馆南京 211166)

0 引言

学术期刊是学术成果的重要载体，也是成果传播的重要平台。近年来，伴随着开放获取(Open Access，OA)运动的深入以及学术出版模式的变化，全球出版行业蓬勃发展，学术期刊数量急剧增加[1]，但期刊的质量控制却变得日益复杂。在政策监管不足以及经济利益的驱使下，期刊出版乱象形态层出不穷，不仅严重扰乱了出版业的良性竞争，更助长了学术不端风气，对学术期刊建设和科研诚信建设都产生了严重负面影响[2]。

期刊出版乱象形态其一表现为欺诈。按其欺诈手段的不同，有虚假期刊(Fake Journals)和掠夺性期刊(Predatory Journals)之分。前者常采用伪造期刊或假冒正规期刊的方式，通过创建虚假网站、发送垃圾邮件以骗取稿件及钱财[3]，其本质为非法期刊。而后者一般有正规刊号，但该类期刊不进行(尽管声称有)或虚假、低质量进行同行评审，并假托OA期刊黄金出版模式，通过收取论文处理费(Article Processing Charge，APC)来攫取经济利益[4]。期刊出版乱象形态的另一表现是失范。该类期刊为正规出版期刊，有着相对完善的出版流程和政策标准，甚至被重要的期刊索引(如SCI)所收录，但在后续市场运作、质量管理等方面存在失范行为，笔者暂且称为失范期刊。近年来，国内曝光的多起期刊撤稿、“论文工厂”等学术不端事件中，均存在失范期刊现象。诚然，这些问题论文的作者和“第三方”中介确实存在不可推卸的责任，但期刊出版方内控机制不完善、审核把关不严格，也助长了学术不端的风气。

维护科研诚信是学术期刊的使命和职责。学术期刊除了从管理规范、严格的同行评议、撤稿机制等方面加强内控外，更需要从国家管理部门、社会舆论和同行等方面加强外部监督[5]。2018年5月，中共中央办公厅、国务院办公厅印发《关于进一步加强科研诚信建设的若干意见》(下称《意见》)[6]，首次提出“建立学术期刊预警机制”，并“支持相关机构发布国内和国际学术期刊预警名单，……，将罔顾学术质量、管理混乱、商业利益至上，造成恶劣影响的学术期刊，列入黑名单。”国外，挪威高等教育部门也开始启动类似的政府倡议名单，在其开发的科学期刊、丛书和出版商目录(Norwegian Register for Scientific Journals, Series and Publishers)网站上，2021年9月推出“X级”期刊(level X list)，该类期刊被认为在编审程序和质量上存在不确定性，运营处于“灰色地带”[7]。

2020年12月31日，中科院文献情报中心发布了国内首份全学科期刊预警名单——《国际期刊预警名单(试行)》。名单公开后也立即引起了学术界的广泛关注和讨论。在社交问答网站知乎上，一些研究人员认为名单具有合理性，但也有一些人员提出质疑[8]。这种认识的差异性表明，人们对预警期刊定义、作用、风险特征等基本问题还没有清晰的认识。付凯丽[9]对期刊预警名单进行了分析，认为预警期刊具有地域集中、国际化程度不高等规律，但该项研究仅采用了单因素分析，未能详细描述预警期刊的风险特征。换而言之，预警名单上的期刊风险指标表现如何？其风险特征又是什么？这些问题的答案依然是模糊的。因此，本文以预警名单中的医学期刊为研究对象，首先从期刊经营、期刊影响以及论文学术影响3个维度构建风险指标框架；其次，详细分析每一预警期刊的指标表现，并综合各因素提出关键性风险特征；最后，从建设和完善期刊预警制度的角度上，对未来预警期刊研究工作提出建议，以为相关机构提供参考和借鉴。

1 数据和方法

1.1 研究对象

中科院文献情报中心公开的期刊预警名单涉及10个学科65本期刊。本文以名单中的26本医学类期刊为研究对象。选取这部分期刊的理由是：一方面，无论是SCI收录期刊还是预警名单中的期刊，医学领域期刊数量占比最多；另一方面，近年来国内曝光的影响较为恶劣的学术不端事件中，多数涉及医学领域期刊。综合考虑认为，相对于其他学科，医学领域期刊代表性最好。

1.2 指标框架

中科院文献情报中心公开了预警期刊识别采用的定量指标，包括期刊载文量、国际化程度、拒稿率、APC、期刊超越指数、自引率、撤稿信息等[10]。本文在此基础上，进一步从期刊经营、期刊影响以及论文学术影响3个维度考察预警期刊的表现，具体的风险指标框架如表1所示。

在风险指标框架中，首先采用期刊经营维度指标表征期刊的商业利益。该维度以APC营收总额(A7)为核心指标，指标数值越大，表明出版方获得巨额利润的可能性越大，而巨额利润则存在“掠夺”科研经费的嫌疑。期刊APC营收总额的计算依赖载文量(A1)和APC单价(A6)。其中，载文量是实现期刊巨额营收的前提，期刊载文量巨大或异常扩容(A3)，往往是期刊评审质量下降、出版标准降低的外在表现；而APC单价是期刊营收的基础，APC过高则提示期刊收费不合理以及潜在的暴利行为。本文选用国内发文占比(A4)作为另一项核心指标，该指标虽与官方指标国际化程度不同，但存在高度相关性。对于一本国际化期刊，其稿源是多元的，录用是无地域偏见的。当出现非出版国发文占比过高情况时，表明论文投稿和录用存在不符合常理的选择性偏好。此外，本文还引入载文量学科位次(A2)和国内发文占比位次(A5)两项次要指标，通过考察指标在学科整体中的表现，以印证期刊的风险特征。需说明的是，期刊拒稿率也是一项重要的经营指标，但该指标不易获取，因此本次研究未纳入。

其次，采用期刊影响维度指标表征期刊的质量管理。对于期刊影响力，官方采用期刊超越指数来测度，本文选用了更广泛的期刊影响力计量指标——JCR分区(B1)作为期刊影响力的测度指标。此外，本文将自引率(B2)和撤稿论文数(B3)作为期刊质量管理的另两项核心指标。虽然期刊的自引率存在一定的合理区间，但自引率过高表明期刊可能存在引文操纵的风险。而撤稿作为学术出版进程的一部分，虽撤稿原因复杂，但期刊撤稿数量过大，提示期刊在内控机制上存在问题。

最后，采用论文学术影响力指标表征期刊的学术质量。高影响力论文占比(C1)和零被引论文占比(C2)展示了期刊在两个引用极端的表现，学科规范化引文影响力(CNCI)分布(C3)更是排除了时间、学科等因素，从整体水平观察期刊论文的引用情况。若期刊的高影响力论文占比数值偏低、零被引论文占比数值较高以及CNCI显著低于全球平均水平，提示期刊论文的学术质量不佳。

表1 预警期刊风险指标框架

1.3 研究内容

本文研究主要内容如下：a.查询和计算每一本预警期刊的指标数据，了解指标总体分布情况。b.量化风险指标，讨论预警期刊的关键风险评判指标。c.结合学术期刊预警制度建设的内涵，对预警期刊研究工作提出若干建议。

2 结果分析

2.1 预警期刊经营性和影响性风险指标表现

26本医学类预警期刊划分为高、中、低3个风险等级，其中高风险和低分险期刊各4本，中风险期刊18本。按出版模式划分，17本期刊采取OA出版模式，另9本采取混合出版模式。按ESI学科领域划分，26本期刊分布在5个ESI学科。其中，临床医学17本，药理学与毒理学、生物学与生物化学各3本，分子生物学与遗传学2本，环境学/生态学1本。预警期刊具体经营性和影响性风险指标表现如表2所示。

从期刊经营指标看，预警期刊近两年载文量普遍较大。两年载文量超过1 000篇的期刊有17本，占比达65.4%，其中，载文量超过2 000篇的期刊有13本，载文量学科位次均列居其所在ESI学科的前20位；仅有5本期刊载文量低于500篇，其中载文量低于200篇的期刊有2本(编号9、10)。与载文量分布情况类似，预警期刊国内发文占比也普遍较高。国内发文占比超过50%的期刊达到22本，其中占比超过90%的期刊有8本，这些期刊国内发文占比排名均具有极高的位次。此外，还有2本期刊(编号6、9)发文占比接近50%。仅有2本期刊(编号24、25)国内发文占比低于20%，其中编号24期刊《Journal of Clinical Medicine》国内发文占比低于1%。扩容率方面，26本预警期刊表现存在差异。假定期刊扩容率在0.8～1.2之间为正常波动，那么一半的期刊(13本)近年来载文量在正常范围内波动甚至呈现下降的趋势；扩容率超过2倍的期刊仅6本，但其中包括国内发文占比最低的编号24和编号25期刊，其扩容率分别为9.17和3.29。

APC方面，通过调查期刊主页发现，26本医学预警期刊APC有两种收取模式。第一种是按篇收取，同一本期刊论文不论篇幅长短费用相同。此部分期刊有21本，APC单价在480～3 850美元之间不等，价格表现较为多元。第二种是按版面收取，同一本期刊论文因篇幅等差异而费用不同，此部分期刊有5本。通过计算各期刊APC与期刊载文量的乘积，即可大致估算期刊APC营收总额。为了方便估算第二种收取模式期刊的APC营收总额，本文粗略地假定论文平均篇幅为6页并包含图表各1张。此外，APC支付货币有多种方式时，优先选择或按现价换算为美元。研究发现，两年APC营收在百万美元以上的期刊有19本，其中营收在500万美元以上的期刊约10本，营收在千万美元以上的期刊有3本(编号3、24和25)，尤其是编号25期刊，两年APC营收总额超过3 600万美元。

表2 医学类预警期刊经营性指标和影响性指标表现

从期刊影响性指标上看，26本医学预警期刊并非全为低影响力期刊。期刊JCR分区显示，26本期刊中归属于Q3、Q4的期刊合计为11本，占比约42.3%；而Q1、Q2的期刊分别有5本和10本，二者合计占比高达57.7%。预警期刊JCR分区并没有明显偏向低影响力期刊，表明，期刊影响力指标可能不是预警期刊风险指标。自引率分析显示，大多数预警期刊自引率在8%以下，仅5本期刊自引率超过10%，其中有2本期刊(编号1、21)自引率超出20%。此外，Retraction Watch公开的期刊撤稿数据表明，26本预警期刊撤稿论文数在0～136之间，平均值为24.2。撤稿论文数量超过50篇的期刊有3本(编号1、15和17)，超过20篇的期刊有12本，但也有8本期刊撤稿论文数低于10篇，甚至有2本期刊未查询到撤稿信息。但有一点是明确的，预警等级为高风险的期刊撤稿数均较多。

2.2 预警期刊论文学术影响力分析

2.2.1预警期刊高水平论文情况

被引频次是评价论文学术影响力的重要指标。本部分合并统计了期刊两年刊载论文中Top1%和Top10%论文的情况。Top1%和Top10%属于相对指标，表示论文被引频次在同一出版年和学科领域中位于前1%或10%的论文。因而，Top1%和Top10%论文属于学术影响力较大的文献集合。从高影响力论文数量看，有9本预警期刊Top1%论文数量为0，Top1%论文数量5篇及以下的期刊有19本，Top1%论文数量最多的期刊来自于2本中风险期刊(编号5、22)和3本低风险期刊(编号23、24和25)。Top10%论文数量相较于Top1%普遍增加，但仍有2本期刊(编号4、21)Top10%论文数量为0。从高影响力论文占比看，如图1所示，11本期刊Top1%论文占比低于0.1%，其中有5本期刊(编号3、4、19、21和26)Top10%论文占比低于1%。

图1 预警期刊高水平论文占比分布

2.2.2预警期刊论文零被引情况

零被引率是期刊反向评价指标，其数值随引用时间窗口的延长而缓慢下降直至趋于稳定。期刊的零被引率与文献的老化速度密切相关。论文未被引用的原因很多，既包括论文太平凡或质量太低原因的未被引，也包括有价值但未被发现、或论文出类拔萃、或众所周知等原因的未被引[11]。尽管多数情况下我们认为需要谨慎对待零被引论文，但同时也需认识到，科学中的“睡美人”现象并不常见。本部分统计了期刊2018年和2019年发表论文的零被引情况，见图2。因为论文引用的时间窗口很短，因而设置了两条基准线作为比较依据。两条基准线数值分别是2019年和2020年ESI学科临床医学论文的零被引率。分析显示，26本预警期刊零被引率两年表现高度一致。有11本期刊2020年的零被引率高于基准值(43%)，其中有3本(编号4、21和26)零被引率在95%以上；有8本期刊2019年的零被引率高于基准值(17%)，其中3本(编号4、21和26)零被引率在80%以上。过高的零被引率表明期刊论文总体学术水平不高。

图2 预警期刊零被引率分布

2.2.3预警期刊论文CNCI分布情况

CNCI是归一化指标，其计算方式为论文实际被引次数与同文献类型、同出版年、同学科领域文献的期望被引次数的比值。CNCI值等于1，表明该篇论文的被引表现与全球平均水平相当；当CNCI值大于1，则表明该篇论文的被引表现高于全球平均水平；反之小于1，则低于全球平均水平。CNCI被认为是以负责任计量为主导思想而建立的科学评价指标[12]。本部分利用箱体图呈现预警期刊2019年刊载论文的CNCI值的分布情况。箱体图受极值影响小，箱体图从上到下5条线分别表示最大值、上四分位数、中位数、下四分位数和最小值。

图3 预警期刊论文CNCI值分布

由图3可知，编号4、21和26期刊论文学术影响力表现最差，75%(上四分位数)以上的论文CNCI值低于0.1；其次为编号2、3和19的期刊，约75%(上四分位数)的论文CNCI值低于1且超过50%(中位数)的论文CNCI值低于0.25；编号7、9、12、13、14和17的期刊论文学术影响力稍好，超过50%的论文CNCI值高于0.25，但同时75%以上的论文CNCI值仍低于1。表现最好的期刊是编号为5、6、10和23的4种期刊，期刊中约50%以上的论文CNCI值高于基准值1。

3 结论与讨论

3.1 预警期刊关键风险评判指标

预警期刊的识别依赖于指标风险程度的综合评判。通过量化汇总预警期刊可能的风险特征(表3)，发现国内发文占比可能是权重最大的风险判定指标，92%(24/26)的预警期刊均存在国内发文占比过高的问题。其次为期刊载文量，65%(17/26)的预警期刊载文量较大。最后是期刊扩容程度，尽管本研究显示只有10本期刊扩容率增幅较高，但扩容率最严重的3本期刊中，其中2本正好与国内发文占比过高的24本期刊形成了完整的医学类期刊预警名单。由此初步判定，期刊国内发文占比、载文量和扩容率可能是预警期刊识别的核心指标。

表3 期刊预警可能风险特征汇总

撤稿量大、自引率高和论文学术影响力低是期刊影响力的负向指标。研究发现，4本高风险等级期刊(编号1～4)中，每本都至少涉及两项严重程度较高的负向指标，并同时伴随国内发文占比大、载文量或APC营收总额高等“掠夺性”特征。中风险等级期刊(编号5～22)中，61%(11/18)的期刊不涉及或仅涉及1项负向指标，涉及2项负向指标的期刊也多载文量不大或APC营收总额一般。低风险等级期刊(编号23～26)均存在扩容率较高的特点。其中有两本期刊(编号24、25)还伴有自引率较高的负向指标，虽其载文量大，APC营收总额高，但国内发文占比很低，因而对国内科研经费“掠夺”的特点不显著。编号23期刊是为数不多的影响力较高的期刊，其在高水平论文占比、零被引率上均有较好表现，但该刊撤稿量较大。有意思的是编号26期刊，论文总体影响力表现相当差，且国内发文占比也较高，可能是APC营收总额不甚太高，才被划入低风险等级期刊。总之，上述分析提示，撤稿量大、自引率高和论文学术影响力低等负向指标可能是预警期刊风险程度判定的决定因素。

3.2 预警期刊研究工作相关建议

目前，国内除了中国科学院文献情报中心发布的期刊预警名单外，一些高校及科研院所也发布了一些“负面期刊名单”。但这些名单均存在一些共性问题，比如对预警期刊的定义缺乏统一认识，其制定标准也缺乏统一和公开透明[9]。因此，从建设和完善学术期刊预警制度的角度看，相关名单制定者还需从明确预警期刊的目标定位、树立公信权威以及构建综合识别模型等方面深入。

3.2.1明确预警名单的目标定位

2018年出台的《意见》虽然提出要“建立健全学术期刊管理和预警制度”，但作为政府政策指导性文件，《意见》并未详述如何建立“学术期刊预警制度”，也未明确“预警期刊”的含义和评估标准。百度百科中，预警表述为“灾害发生前发布的紧急信号”，常用于灾害监测、风险管理等场景。因此，笔者初步定义，学术期刊预警就是采用定量和定性方法，对期刊运营管理过程中可能存在的风险行为向公众进行警示的过程，而“黑名单”“预警名单”就是以此而产生的期刊目录。

风险行为按风险程度由高到低可分为触犯法律、违反行业政策标准、违背学术出版道德3种类型，其期刊形态分别对应虚假期刊、掠夺性期刊和失范期刊。在笔者构建的学术期刊治理框架中(见图4)，虚假期刊和掠夺性期刊的欺诈性行为，已经触及法律底线、违反行业标准和规范，符合“罔顾学术质量、管理混乱、商业利益至上、产生恶劣影响”的特征，应列入“黑名单”管理；而失范期刊，应对其失范行为予以警示，列入“预警名单”管理。因此，预警名单的目标定位是存在失范行为或风险的学术期刊。警示目的是，一方面提醒科研人员谨慎选择成果发表平台；另一方面提示出版机构强化期刊质量管理，在社会责任和商业利益之间寻求平衡。事实证明，期刊预警名单已彰显效果。2021年第一季度，预警名单期刊IEEEAccess经历了2019年年中以来的最低季度文章出版量，年度下降24%，3月份同比下降34%[13]。预警名单期刊JournalofCellularBiochemistry和JournalofCellularPhysiology也正采取了一系列积极措施强化期刊质量管理[14]。

图4 学术期刊治理框架

需注意的是，中国科学院文献情报中心在发布期刊预警名单时特别强调：预警名单不是论文评价，更不是否定预警期刊发表的每项成果。本文研究也发现，所涉26种医学预警期刊中，65.4%的期刊刊有Top1%论文，92.3%的期刊刊有Top10%论文。表明，以“预警期刊”评文，既无法逻辑自洽，也无数据支撑。

3.2.2树立预警名单的公信权威

《意见》提出“科技部要建立学术期刊预警机制，支持相关机构发布国内和国际学术期刊预警名单”。在这里，明确了“学术期刊预警机制”的建设主体是科技部，但期刊预警名单的制定或发布者，文件没有明确。这一模糊政策虽为预警名单的制定提供了更多的实践空间，但同时也造成相关预警名单权威性不足。

预警名单的权威性不能仅仅依靠行政命令。从长远角度看，期刊预警名单的制定需秉承专业性、科学性和开放性的理念。所谓专业性，是指预警名单发布机构的专业性以及研究人员的专业性，既要有理论素养深厚的专家学者，又需有长于数据分析的应用人才。中科院文献情报中心作为专业的学术研究机构，具备相关研究的专业基础，因而可充分发挥智库作用，参与学术生态的治理。所谓科学性，是指预警名单产生方法的科学性。预警期刊识别方法是否符合政策导向？是否得到科研人员的广泛认可？是否经得起期刊出版方的质疑？等等。专业性和科学性构成了预警名单公信力和权威性的基础。最后所谓开放性，是指预警名单要有公开的评价准则和动态的调整机制。公开的评价准则有利于预警期刊明确其被纳入预警名单的缘由，也有利于预警期刊采取针对性的措施进行整改。而动态的调整机制表明预警名单不是固定不变的，预警期刊在其规范整顿后可退出预警名单，从而回归到正常的发展轨道上去。

3.2.3构建预警期刊的综合识别模型

本文中，我们把载文量较大、国内发文占比较高作为期刊的重要风险要素。但同时我们也看到，载文量较大的期刊如PLoSOne等，国内发文占比较高的期刊如CancerManagementandResearch等，均不在2020年版预警名单之列。因此，要加强预警名单的说服力，还需构建预警期刊综合识别模型，以加强不同类型数据之间的印证与补充。

目前，国内有两项研究涉及期刊“预警”模型：一是戴琦等[15]针对OA期刊的学术声誉风险，提出的识别异常OA期刊的预警方案；二是芮啸等[16]建立的OA期刊APC监测与异常预警模型。有意思的是，两项研究预警模型观测指标及评判思路完全不同：前者通过分析期刊的发文规模(载文量)、自引行为(自引率、影响因子)、研究价值(被引半衰期、特征因子等)、作者来源与同行评议等指标表现进行综合评判；而后者以APC为单一考察因素，通过最小二乘法拟合期刊APC单价和影响力指数之间的函数关系，并对其中高APC低影响力OA期刊(溢价期刊)进行预警。国外文献中，笔者并未检索到直接表述为“Early Warning Journals”的研究，但类似的，与期刊“掠夺性”风险评估模型多有报道。比如，S. Rele等[17]设计了一张简易期刊可信度评估量表，量表包含与期刊和出版商相关的16个评分项目，当评分低于26分时提示期刊可信度较弱。J. Teixeira da Silva[18]提出了量化的掠夺性评分(Predatory Score)，该评分涉及17项掠夺性因素，包括出版形式、同行评议、稿件处理、沟通渠道等。尽管掠夺性评分的主要目的是评估期刊的掠夺程度，但评分最终给出了红(极具掠夺性)橙(掠夺性)黄(警告！一些掠夺性特征)绿(不具掠夺性)四等级警示，其中，黄色也可认为是对期刊风险行为的一种警示。

综上可见，期刊预警所涉的风险指标是复杂的、多维的，即包括论文出版行为的定性评估，也涵盖期刊运营管理的定量评估。因此，综合性的预警期刊识别模型包括风险行为监测、学术质量监测和APC监测等多元模块。具体讲，风险行为包括发文异常行为、评审异常行为、自引异常行为、互引异常行为等；学术质量监测包括论文引用情况、论文社会影响力情况、学术不端事件等；APC监测包括虚高APC、溢价期刊等。此外，邀请学术界共同参与治理，也是增强预警名单合理性和认可度的有效途径[7]。

4 结语

学术期刊预警机制是科研诚信建设的创新性制度安排，而期刊预警名单是学术期刊预警机制的重要组成部分。预警期刊的识别属于期刊质量评价的一种类型，但其评价方式与一般的学术期刊质量评价体系有很大差异[19]。本文对预警期刊的相关指标表现进行定量分析，总结了预警期刊关键风险评判指标，并对预警期刊研究进一步科学化发展提出建议。未来，随着科研诚信建设以及科研评价机制改革的深入，期刊预警名单制定工作将面临新的挑战，但也终将会实现更大的社会价值。