基于论文下载与被引分区的学术期刊评价研究

2022-03-11俞立平

中国科技期刊研究 2022年2期

■俞立平沈洁

浙江工商大学统计与数学学院，浙江省杭州市江干区学正街18号 310018

下载与引用是广大科研工作者在科研工作中的两个重要行为。网络技术的发展促进了研究者获取资源方式的转变，下载电子资源已经成为学术研究的一大常态化工作，因此，通过网络资源的下载来产生引用的现象也极其普遍，下载与引用行为之间存在着密切联系。科研工作者对科技论文的下载需求巨大，下载行为的产生表明了下载者对论文的关注[1]。对下载行为的研究主要包括下载指标的数据特征、下载指标等影响因素。多数期刊的下载数量呈现布拉福德分布特征[2]，研究者的下载行为则受下载动机、认知和能力、人格情绪等因素的影响[3]。

科研人员的下载与引用行为产生了一系列可用于学术期刊评价的指标。一方面，衡量下载行为的下载量正逐渐成为网络学术交流环境下期刊影响力评价的一大指标；另一方面，基于引证关系的影响力评价一直是学术期刊评价的主要方法。这种评价方式通常以数学、统计学方法为基础，通过对科技论文、科学研究者等研究对象的引证与被引证现象进行量化分析，以挖掘其数量特征与内在规律。无论引用行为发生的动机如何变化，它都是期刊影响力的重要表现，而其中最为基础的指标是被引频次。

可根据论文下载量与被引频次的关系将学术期刊的论文分为4种类型。(1)高下载、高被引论文，这类论文是期刊中的“明星”论文。在多数情况下，产生下载是因为被下载的论文与研究者的研究主题具有一定关联度，能为研究者的研究提供参考。引用行为动机较为复杂，但不可否认的是，能促使大量研究者产生引用并不容易，因此具有高下载、高被引特征的论文通常是受到学术界广泛关注并得到认可的论文。(2)低下载、高被引论文，这类论文在较少的下载行为下却产生了高频的引用行为，一方面与文章质量存在较大关系，另一方面也与研究者的引用行为动机关联较大。(3)低下载、低被引论文。具有此类特征的论文可能质量偏低、研究主题较为冷门，其中包括可能存在的“睡美人”论文。(4)高下载、低被引论文。高下载行为的触发说明了此类论文是研究热点，或者具有重要的参考价值，但与之相对的，它们却并不能凭此带来广泛引用，说明这类论文并不满足引用行为的两类动机。从期刊所包含的这4类论文来看，根据下载与引用行为产生的数据特征进行分类并利用这种关系进行学术期刊评价具有现实基础。

分析下载与引用行为的关系，以及从这个角度研究学术期刊评价具有重要意义。一方面，信息时代背景下，越来越多研究者注意到下载与引用行为的重要性，但对这二者的关系进行深度分析和分类的研究较少，将其应用于期刊评价的研究就更少了。另一方面，常用的期刊评价多基于引证角度进行影响力评价，很少从下载与引用行为关系的角度开展评价。本文从期刊下载与引用行为的分析角度出发，对下载行为与引用行为进行量化，研究量化指标之间的分区关系，进而对学术期刊进行评价，从理论上丰富了文献计量学与学术期刊评价理论，在实践上对于学术期刊策划选题、发展特色等也具有重要的借鉴意义，从而提供了从更细致视角评价学术期刊的技术手段。

1 文献综述

下载与引用行为是期刊影响力产生的主要途径，同时，对这两种行为进行量化以进行学术期刊评价也具有可行性。研究表明，下载量在一定程度上反映了影响力，下载量较高的科技论文，其受众数量更大，产生的影响力更大[3]。杨春华等[4]指出下载量可以在一定程度上反映论文对于用户的贡献，反映用户需求。在期刊学术影响力评价中长期占有领导地位的引文分析框架下：Sharma[5]提出下载量在识别新的研究成果上具有重要作用，且具有时效性；刘思源[6]发现下载量可以在一定程度上弥补从引文角度进行期刊影响力评价时存在的时滞性问题。

基于引用的评价是期刊影响力评价的重要内容。具体评价方法包括单指标、指标体系等。单指标包括总被引频次、影响因子、h指数等，其中，影响因子、h指数均以被引频次为基础计算所得。而学术期刊评价指标体系主要由政府或评价机构制定，考虑的评价维度包括期刊影响因子、学术论著的传播与反响程度(被转载、摘录，被权威检索工具收录情况)和引用情况(他引频次、总被引频次)这三个方面。可以看到，被引频次是期刊评价中重要的基础指标。这一指标首次于1927年由Cross提出，凭借其低成本、易获取的优势[7]，被广泛应用于对论文、期刊、科学研究者、科研机构的学术影响力评价中。理论上，论文的被引频次主要基于其他研究者对研究内容的深入了解而产生，它作为一个绝对数量指标，能反映科技论文、学术期刊的受关注程度，与学术影响力之间呈正向关系[8]，可以作为反映论文质量、影响力与创新水平的指标[9]，也可以用作引用行为的衡量指标。

作为衡量下载与引用的两类指标，下载量与被引频次的关系也受到较多的关注。McDonald[10]利用加州科技机构期刊数据证明下载量与被引频次呈现中度相关。刘筱敏和张建勇[11]基于化学领域期刊数据，发现下载量与被引频次之间呈现正相关关系。吉祥[12]指出期刊下载行为与期刊引用行为的变化趋势基本一致：期刊的下载量较高，其被引频次也较高；期刊的下载量较低，其被引频次也较低。牛昱昕等[13]则发现单篇论文的下载量与被引频次的相关性不显著。曹艺[14]指出被引频次和下载量在论文层次的显著性不强,在期刊层次和机构层次的相关性较为显著,在期刊和机构的评价中可以综合考虑被引频次与下载量。孔秋丽[1]以概率论、数理统计学科的期刊论文数据为分析样本，认为应该将下载量与被引频次同时作为期刊的评价指标。从以上研究结果可以发现，期刊的下载量与被引频次之间普遍存在相关关系，因此在期刊评价中同时应用下载行为数据与引用行为数据是可行的。

通过上述文献梳理可以发现，在网络资源成为研究者的主要研究资源来源的背景下，研究者的下载与引用行为是学术期刊影响力产生的重要途径，同时下载量与被引频次可作为衡量两种行为的指标，且二者之间存在着较为显著的相关关系，下载行为数据应用于期刊评价中可以在一定程度上弥补引文分析的滞后性。采用下载量与被引频次分别作为下载行为与引用行为的指标，并以此进行学术期刊评价有着深厚的理论基础与良好的应用前景。

本文在对传统的引文指标——被引频次和下载量的文献分析基础上，进一步从以下几个角度进行深入研究：(1)基于期刊论文被引频次与下载量数据，从理论上通过对下载行为与引用行为关系的探讨获得不同角度的期刊影响力评价体系；(2)在理论分析的基础上对管理学期刊进行影响力评价，了解管理学期刊的不同影响力的数据分布特征以及期刊排名。

2 理论与方法

2.1 下载与引用关系分区

从被引频次与下载量的关系角度进行期刊影响力评价的分析，以各期刊论文的下载量与被引频次分别为横、纵坐标，以下载量和被引频次的平均值作为划分依据，期刊论文下载量和被引频次的分区如图1所示。

图1 下载量与被引频次分区图

Ⅰ区为高下载量、高被引频次论文的聚集区，称为热点影响力区域。论文的下载行为首先来源于研究者对论文标题、关键词、摘要等的检索，通过阅读分析后才有可能产生引用。论文下载量高，说明相关内容可能是研究热点；论文被引频次高，说明相关内容得到了学术界的进一步关注，并且进行进一步研究。论文的被引频次通常作为反映论文的质量、影响力与创新水平的指标，高被引频次表明这些论文确实是经得起推敲的热点高质量论文。

Ⅱ区为低下载量、高被引频次论文的聚集区，称为新生影响力区域。与Ⅰ区不同，Ⅱ区论文的下载量较低，说明相关研究主题并不是大多数人所关心的，从事相关主题研究的人员较少，因此这类论文的研究主题并不是热点主题，但这部分论文的被引频次较高，并不与下载量正相关，这其中的原因主要是研究者对文章内容的认同，说明论文的研究内容具有较高的学术价值，得到了学术界的共鸣，具有开拓意义，符合新生事物的特征。

Ⅲ区为低下载量、低被引频次论文的聚集区，称为潜在影响力区域。这类论文选题并非当下的热点，被引频次也较低。一般认为，出现低被引论文的原因之一是科技论文的价值较低，无法得到广大学者的认可，这是主要原因。但是有一类特殊的论文也呈现出低被引的特征，这类论文即为“睡美人”论文。“睡美人”是指论文在发表后的某个时间窗口中未受到引用或受到较少引用，但此后持续受到很多引用的现象[15]。一般而言，当大多数期刊达到被引峰值后，如果论文还处于低下载、低被引状态，说明这些论文的评价价值不高，但具体到某一篇论文，不能轻易下此定论。

Ⅳ区为高下载量、低被引频次论文的聚集区，称为经典影响力区域。这类论文的主题受到了广泛关注，但并没有相应产生较大的被引量，主要原因是该领域研究相对成熟，或者创新难度大，突破小，因此下载量大，但被引频次并不高。相关研究发现，高下载、低被引的论文中综述类、应用类论文所占比例较高[16]。一般而言，只有在一个研究领域中有一定研究成果时才有可能产生综述类论文，综述类论文的涉及面较为广泛，引用文献较为充分，从不同角度进行相关研究的研究者都有可能下载同一文章，所以下载量通常较高，但综述类论文较少有独特的观点，一些深度分析往往也是总结和预测性的，因此被引频次往往不高，研究者还是倾向于引用综述论文涉及的原文，这就造成综述论文的被引频次较低的现象。应用型论文中有较大部分仅根据成熟的理论、方法进行重复应用，因此容易出现高下载、低被引的情况。已有研究发现，某一期刊零被引文章中80%以上都是应用类论文[16]。

以上4个影响力分区中，热点影响力与新生影响力分区是期刊评价中是最为重要的部分，这是因为热点文章与创新文章是最受研究者关注的文章，借鉴意义较大，因此成为期刊中最为重要的两类文章，能表征期刊的专业度与创新水平；其次是经典影响力分区，该分区的文章虽然被引频次低，但是对于研究有重要参考意义，也是期刊评价中值得注意的部分；在上述4个分区中，潜在影响力分区是期刊中重要程度相对较低的分区，无法为期刊带来实时的关注，在未来的发展情况也不明朗，在期刊评价中的地位相对较低，尤其在期刊论文达到被引峰值后，如果下载和引用水平还不高，说明该分区论文的质量不够。

需要说明的是，以上分区分析是一种基于时间截面的静态分析，是下载与引用达到相对稳定时的结果，一般应在论文被引频次达到峰值前后时间分析较佳。实际上，从纵向时间来看，任何新发表论文都必然经历低下载、低被引阶段，然后其下载和引用关系再经历各种类型的动态变化。

2.2 基于下载与引用分区的期刊影响力评价指标

为了从论文下载与引用行为关系角度展开期刊评价，需进一步对上述4个分区的影响力进行量化，在计算方法上，借鉴目前最受重视的指标之一——期刊影响因子的计算方法。具体地，热点影响力以热点影响因子(Hotspot Influence Factor, HIF；fHIF)衡量，新生影响力以新生影响因子(Newborn Influence Factor, NIF；fNIF)衡量，潜在影响力以潜在影响因子(Potential Influence Factor, PIF；fPIF)衡量，经典影响力以经典影响因子衡量(Classical Influence Factor, CIF；fCIF)衡量。计算方法为

fHIF=CTC-I/NI

(1)

fNIF=CTC-II/NII

(2)

fPIF=CTC-III/NIII

(3)

fCIF=CTC-IV/NIV

(4)

式中：CTC为热影响力分区的论文被引频次总和；N为热影响力分区的论文总量。

2.3 偏最小二乘回归

常见的文献计量学指标之间往往存在着较为强烈的相关关系，因此在进行回归建模时，应选取可削弱多重共线性的回归方法。

偏最小二乘回归(Partial Least Squares Regression，PLSR)由S.Wold和C.Albano提出[17]，适用于解释变量多于样本点的情况，也可以解决多重共线问题，其核心是利用迭代法提取成分。首先，根据提取成分间相关程度最大和尽可能多地包含原始变量的变异信息的原则，分别在因变量Y(y1,y2,…,ym)和自变量X(x1,x2,…,xn)中提取第一对成分t1与u1；然后，分别进行X与Y对t1的回归，利用X与Y被t1解释后的残余信息提取第二对成分，重复这一步骤直到精度满足要求。若最终提取了r个成分t1，t2，…，tr，偏最小二乘回归将先计算yk(k=1,2,…,m)关于r个成分的回归，再表达成yk关于原变量X的回归方程，得到偏最小二乘回归方程。

3 研究数据与实证结果

3.1 研究数据

本研究实证所采用的关键核心数据是2019—2021年版CSSCI收录的36种管理学期刊单篇论文的下载量与被引频次，该数据来源于中国学术期刊全文数据库的“下载”与“被引”实时数据。为保证两者引文窗口的一致性，并结合数据可获得性的考量，选取上述期刊2017—2018年所载论文自发表至2021年3月30日的下载量与被引频次。由于期刊影响力主要来源于学术论文，因此本研究将学术论文外的会议报告或征稿启事等相关文章的下载量与被引频次予以剔除。此外，本研究实证分析所选用期刊的影响因子、h指数、载文量与总被引频次数据均来源于CNKI中国引文数据库，期刊发文时间为2017—2018年，被引时间为2019年。

在进行期刊数据分析时，将36种样本期刊的所有下载数据和被引频次放在一起计算均值，然后再对每种期刊进行分区比例计算。

3.2 各区论文比例分析

论文不同影响力的划分以下载量与被引频次的关系为基准，不同期刊论文的下载量分布与被引频次分布必然会存在差异。偏度系数是描述数据分布偏离对称性程度的分布特征数。当数据左右对称分布时，偏度系数为0；当偏度系数大于0，即重尾在右侧时，该分布为右偏；当偏度系数小于0时，该分布左偏。通过对期刊论文的被引频次与下载量偏度系数的计算发现，所有期刊的被引频次与下载量偏度系数均为右偏。因此，简单地从期刊下载量与被引频次的分布形态来看，Ⅲ区论文数量占论文总量的比例最大，I区论文所占比例最小。对任何期刊而言，好论文毕竟占少数，而相对一般的论文总是占多数的。

表1所示为实际计算的各期刊在4个分区的论文数占期刊所载学术论文总数的比例。36种期刊中，Ⅰ区(热点影响力分区)论文占比最高的期刊共有8种，分别是《管理世界》《南开管理评论》《会计研究》《公共管理学报》《审计研究》《审计与经济研究》《管理科学》和《经济管理》，这些均是优秀期刊。Ⅱ区(新生影响力分区)论文占比较高的期刊包括《中国管理科学》《会计与经济研究》《科学决策》《科学学与科学技术管理》《软科学》等，这些期刊有独特的创新性。Ⅲ区(潜在影响力分区)论文占比较高的期刊包括《科学与社会》《科学管理研究》《宏观质量研究》《系统管理学报》等，这些期刊需要进一步提高论文质量。Ⅳ区(经典影响力分区)论文占比较高的期刊包括《公共管理学报》《外国经济与管理》《会计研究》等，这些期刊刊载的经典论文较多，被引频次相对较低。

表1 36种样本期刊论文在各影响力分区的占比情况

从平均值来看，在期刊内部，表现期刊潜在影响力的论文占比最高，表现热点影响力的论文占比排名第二，而非占比最低，出现这种情况的原因是期刊中大多数论文的下载量与被引频次存在一定程度的正相关关系，下载量低的学术论文，其被引频次也较低，而下载量高的学术论文获得高被引频次的可能性更大。表现经典影响力的论文占比排名第三，表现新生影响力的论文占比排名第四，但不同期刊的Ⅱ区与Ⅳ区论文所占比例排名并不一致，其中，19种期刊的Ⅱ区论文占比更高，剩余17种期刊的Ⅳ区论文占比更大。综上，大多数期刊中反映新生影响力的论文数量多于反映经典影响力的论文数量，但二者差距较小。

3.3 各分区期刊的影响因子分析

表2所示为36种期刊的各分区影响因子的描述性统计结果。可以看到，36种期刊的分区影响因子中，热点影响因子的平均值最大，新生影响因子的平均值排名第二，经典影响因子的平均值排名第三，潜在影响因子的平均值最小。中位数以及最值的排名情况与均值排名情况一致。经典影响因子的标准差最小，其次为潜在影响因子，说明这两者的波动幅度比较小，在各期刊间分布比较平均，而热点影响因子与新生潜在因子的标准差较大，变动幅度也较大。

表2 各分区期刊的影响因子描述性统计

图2所示为各类影响因子排名前5的期刊情况。新生影响因子中排名前3的期刊分别为《宏观质量研究》《社会保障评论》和《系统管理学报》；热点影响因子中排名前3的期刊依次为《会计研究》《管理世界》和《南开管理评论》；潜在影响因子中排名前3的期刊分别为《研究与发展管理》《审计与经济研究》和《经济管理》；经典影响因子中排名前3的期刊分别为《软科学》《预测》和《系统工程理论与实践》。从排名结果来看，分区影响力排名之间的差异性比较显著，各区影响力排名前3的期刊没有重合，表明管理学期刊优势发展、个性化发展较好。

图2 各影响因子排名前5的期刊情况

3.4 各类影响因子与传统指标的关系

在探究分区影响因子与传统文献计量学指标的关系时，有必要分别进行实证检验。此外，从相关关系分析可以发现，h指数、影响因子(fIF)、载文量(NPPA)与总被引频次(CTC)之间存在显著相关关系，因此将h指数、影响因子、载文量与总被引频次作为自变量时要考虑多重共线性的问题，不适合采用简单最小二乘法，应选用偏最小二乘回归法。

对所有数据取对数，再利用偏最小二乘回归法分别建立传统文献计量学指标对各分区影响因子关系模型。所有模型经检验都提取三个潜在因子，最后回归结果如表3所示。

表3 偏最小二乘回归结果

对于热点影响因子，期刊影响因子、总被引频次与热点影响因子正相关，h指数、载文量与热点影响因子负相关，回归系数最大的为期刊影响因子，其余回归系数均较小，说明热点影响因子与期刊影响因子反映的信息相对比较接近。对于新生影响因子，h指数、期刊影响因子与新生影响因子负相关，总被引频次、载文量与新生影响因子正相关，说明新生影响因子和传统的用于评价期刊影响力的影响因子以及h指数反映的信息较为不同，但受载文量影响较大。对于潜在影响因子，h指数与潜在影响因子负相关，其余均为正相关，h指数是通过期刊中高被引频次论文的被引情况来反映期刊影响力的指标，而潜在影响因子则主要是通过低被引论文的被引情况反映期刊影响力，二者之间反映的信息恰好相反。对于经典影响因子，h指数与经典影响因子负相关，其余为正相关，同样是因为经典影响因子和h指数反映的信息不同。

4 研究结论

(1)分区影响力是对期刊影响力评价体系的重要补充。信息时代下，电子资源已经成为学术研究中主要的信息来源。原有的仅基于引用进行期刊影响力评价的指标不足以对期刊进行全面评价。本研究基于下载行为与引用行为提出的分区影响因子可以全面反映当前学术期刊的不同影响力。在深入分析下载量与被引频次关系的基础上，将期刊影响力分为由高下载量、高被引频次论文反映的热点影响力，低下载量、高被引频次论文反映的新生影响力，低下载量、低被引频次论文反映的潜在影响力与高下载量、低被引频次论文反映的经典影响力。分区影响力的提出不仅能为期刊评价提供新的思路，也有利于促进期刊的特色化发展。

(2)管理学期刊热点影响力和新生影响力表现良好。根据被引频次与下载量划分的4个区间可以获得对期刊分区影响力的初步认知。一方面，从各期刊分区论文的比例来看，反映潜在影响力的论文所占比例最大，其次为反映热点影响力的论文占比，大多数期刊中代表新生影响力的Ⅳ区论文所占比例高于代表经典影响力的Ⅱ区论文所占比例。另一方面，各期刊在热点影响力、新生影响力、经典影响力、潜在影响力的排名存在较大差距，一般情况下，热点影响力和新生影响力较高，经典影响力和潜在影响力相对较低。

(3)h指数、影响因子与热点影响力高度相关。分区影响力与传统文献计量指标反映的信息不同，h指数、影响因子主要体现热点影响因子信息，除热点影响因子外，其余3个影响因子与传统文献计量学指标间的相关关系都较为薄弱，说明分区影响力在学术期刊评价中能挖掘出新的信息。进一步进行的回归分析结果也获得了相同的结论，即这几个指标各自能反映与传统文献计量指标不同的信息。传统的影响因子和h指数反映的是热点影响力，而对新生影响力、经典影响力反映不足。

本研究基于CSSCI管理学期刊论文数据，基于下载与引用关系建立四分区模型，并分别比较了各分区影响因子，相关研究有助于进一步详细分析期刊下载量与被引频次的关系，并给期刊评价引入新的视角。由于学科不同以及研究对象的时间跨度不同，研究结果会有所差异，但作为一种研究范式，可进行更深入的讨论。