审稿周期与论文质量*<br/>——来自SSCI 经济学期刊的经验证据

审稿周期与论文质量*
——来自SSCI 经济学期刊的经验证据

2021-10-20田素华

经济科学 2021年5期

陈宸田素华

(复旦大学经济学院上海 200433)

一、引言

近年来，经济学论文的审稿周期显著变长，以Elsevier 旗下的经济学期刊为例，1990年至2019 年，论文的平均审稿周期从0.32 年增长至0.94 年。①本文作者根据Elsevier 旗下经济学SSCI 期刊的相应数据计算，审稿周期等于论文接受时间减去论文投稿时间。在审稿周期变长和评审流程烦琐的背景下，经济学论文的篇幅不断攀升(Ellison，2002b；Welch，2014；Hadavand 等，2021)；在五大英文经济学期刊②五大英文经济学期刊包括: American Economic Review， Econometrica， Journal of Political Economy，Quarterly Journal of Economics， Review of Economic Studies。上，21 世纪10 年代发表论文的平均长度是20世纪70 年代的三倍以上(Card 和DellaVigna，2013)。一般而言，经济学论文篇幅越长，作者关于结论的稳健性和拓展性研究越多，这能在一定程度上反映论文的质量，但不能代表论文想法的重要性以及对学术研究的贡献程度。曾任世界计量经济学会主席的阿里尔·鲁宾斯坦(Ariel Rubinstein) 也指出:“我们很难见到长度超过15 页且想法的重要性与其篇幅相称的经济学论文。”③“10 Q＆A:Experienced Advice for ‘Lost’ Graduate Students in Economics”，https://arielrubinstein.tau.ac.il/papers/10QA.pdf.由此可见，除提升篇幅外，审稿周期变长能否提高经济学论文的质量，是一个有待深入研究的重要问题。

要探讨审稿周期与论文质量之间的关系，首先需要对论文质量进行严格定义。本文参考Ellison (2002a) 的做法，将论文质量区分为形式质量(r) 和实质质量(q) 两个维度:形式质量指论文的细致性以及对稳健性、扩展性和相关文献的讨论，反映论文标准化程度；实质质量指论文想法的重要性以及对学术的贡献程度，反映论文的核心价值和重要性。从理论上来看，审稿周期变长对论文的形式质量和实质质量有着不同的影响效果。一方面，随着审稿周期变长，审稿人会相应提出更多细致的修改意见，这会促使作者花费更多时间去修改和完善论文的不足之处，从而提高论文的形式质量和实质质量。另一方面，一篇论文的审稿周期越长，与之相似的竞争性论文越有可能抢先发表并抢占其在相应研究领域做出重要贡献的“轨道”，例如在关于新古典增长模型的研究中，罗伯特·索洛(Robert Solow) 和特雷弗·斯旺(Trevor Swan) 都于1956 年独自发表了相应的论文，但前者比后者早发表10 个月，导致后来研究者几乎只称“索洛模型”，而不是“斯旺模型”(Dimand 和Spencer，2009)；同时，审稿周期变长也会阻碍论文中前沿知识的扩散(Lusher 等，2021)，不利于相关领域的发展，反过来削弱了该论文想法的重要程度，从而降低论文的实质质量。在过去的二十年中，理论文章数量显著减少(Hamermesh，2013)，与此同时理论文章被引用量出现了显著的降低(Card 和DellaVigna，2013)，说明一个领域的萎缩会导致该领域论文的被引用量下降。基于此，本文预期审稿周期变长对论文的形式质量有正面的促进效果；而审稿周期变长对论文的实质质量有正反两个方面的效果，其净效应取决于正面效应和负面效应谁占主导。

本文实证检验了上述关于审稿周期和论文质量关系的理论猜想。具体地，本文使用1997—2019 年发表于Elsevier 旗下经济学SSCI 期刊的论文数据，以论文的篇幅代表形式质量，并以论文的被引用量代表实质质量，研究了审稿周期对论文形式质量和实质质量的作用效果。OLS 回归和工具变量回归的结果均表明:审稿周期变长显著提升了论文的篇幅，但会显著降低论文的被引用量。这些结果支持了本文的理论猜想，即审稿周期变长有助于提升论文的形式质量，但对论文实质质量的负面效应大于正面效应。将审稿周期分成多个时间区间的结果显示，最佳审稿周期约为半年至一年，此时能够在不显著降低论文实质质量的情况下最大限度地提升形式质量。进一步的异质性分析结果表明，当学界更加关注形式质量后，相比之前，审稿周期变长对论文形式质量的提升效应相对更大；相比低质量期刊，审稿周期变长对高质量期刊论文形式质量的提升效应以及对实质质量的降低效应都相对更小。

本文的边际贡献包括以下两点:第一，在当前大数据和相关计量方法快速发展的背景下，本文使用论文层面的微观数据进行研究，首次从实证层面回答了审稿周期变长是否会提高论文质量这一重要问题，发现审稿周期变长尽管会使论文看上去越来越细致和标准，但实际上降低了论文想法的重要性以及对学术的贡献程度。第二，本文将论文质量区分为形式质量和实质质量两个维度，从而细化审稿周期对论文质量的作用效果，为理解编辑和审稿人在知识生产过程中所起的“中间人”作用以及为期刊审稿效率改进提供了经验证据。

本文的后续部分安排如下:第二部分在总结既有文献的基础上，提出本文的研究假说；第三部分对数据和实证模型进行介绍，并做描述性统计；第四部分进行实证分析，报告主要的计量检验结果；最后一部分为结论和政策建议。

二、相关文献和研究假说的提出

在学术论文质量的衡量方面，学界一般使用论文所属期刊或被引用量这两个指标(Liebowitz 和Palmer，1984；Gibson 等，2017；Powdthavee 等，2018)。尽管发表在顶级期刊上的论文平均质量相对较高，但在同一本顶级期刊上不同论文的质量还是会参差不齐，因此使用所属期刊来衡量每篇论文的质量过于粗糙(Hamermesh，2018)。使用被引用量衡量论文质量相对客观，在某一期刊上能否发表取决于期刊编辑与审稿人这一少数群体，而是否被引用则由整个学界决定(Taylor，2011；Liebowitz，2013；Card 和Della Vigna，2020)。学界使用被引用量衡量论文质量时，着重于论文思想的重要性及其学术贡献这类实质质量，往往忽略了论文的细致性与稳健性等形式质量。本文参考Ellison(2002a) 的做法，将论文质量划分成形式质量和实质质量两个维度进行分析。

关于影响论文质量的因素的分析，既有文献从作者层面、论文层面和期刊层面展开了一系列研究。在作者层面上，合作者数量对论文的被引用量具有显著的正向作用(Beaver，2004)，但合作者技能差异与论文的被引用量之间存在倒U 形关系(寇宗来等，2019)。另外，被引用量受作者社交网络的影响(White，2001；Head 等，2019)。在论文层面上，论文在当期期刊上的排序位置以及标题长度对其被引用量都具有显著的影响(Laband 和Piette，1994；Feenberg 等，2017；石庆玲和郭峰，2017)。在期刊层面上，期刊声望、可获得性和国际化程度会显著提升论文的被引用量(Moed 等，1985；Vinkler，1987；Yue 和Wilson，2004)，且期刊采用匿名审稿制度也会显著提高论文的被引用量(刘瑞明和赵仁杰，2016)，但是偏爱“关系稿”的期刊会显著降低其论文的被引用量(郭峰和李欣，2017)。

除了以上因素，学术论文的审稿周期也会影响论文的质量。近年来各个学科的论文审稿周期普遍变长，具体表现为投稿到第一次回复意见的间隔延长、修改轮次增多以及每次修改过程更久这三个方面(Huisman 和Smits，2017)。已有文献大多聚焦于审稿周期变长对作者个人的影响(Lehmann 等，2011；Conley 等，2013)，只有Ellison (2002a)从理论上探讨了审稿周期与论文质量之间的关系。本文使用论文层面的微观数据，实证检验了审稿周期变长对论文质量的影响，填补了相关研究的空白。

论文质量既包括细致性和标准化程度，也包括核心价值和重要性程度。本文参考Ellison (2002a) 的做法，将论文质量的以上两个方面分别定义为形式质量和实质质量。形式质量表示论文的细致性以及对研究结果的稳健性、扩展性讨论和相关文献讨论，实质质量表示论文思想的重要性以及对学术的贡献。一般而言，审稿周期越长，编辑和审稿人评阅论文的时间也越长，通过更加仔细地审阅论文，他们能够对论文提出细致的有针对性的修改意见。与此同时，论文作者在获得修改意见后，也有更多时间或更多轮次的机会去修改论文，从而提高论文的细致性，强化论文结论的稳健性，拓展论文的适用性(Frey，2003)。由此，本文提出假说1。

假说1:相较于短审稿周期的论文，长审稿周期论文的形式质量相对更高。

根据上文的分析，审稿周期变长不仅能提高论文的形式质量，还能帮助作者完善论文对学术的贡献，从而提高实质质量。然而，审稿周期变长对论文的实质质量还存在以下两个方面的负面影响:其一是竞争效应，当一篇论文存在相似的竞争性论文时，率先发表的论文往往会受到学界更多的关注和认可；论文的审稿周期越长，竞争性论文出现并发表的概率越大，从而会削弱该论文在学术上的贡献，并降低其重要性程度。其二是反馈效应，过长的审稿周期会阻碍该论文中前沿知识的扩散(Lusher 等，2021)，不利于该领域的发展，而该领域后续新发表论文的减少又会反作用于该论文，从而降低其重要性程度以及对学术的贡献。值得指出的是，竞争效应和反馈效应是互补的。在成熟的学科领域，例如劳动经济学领域，每年论文发表的数量较多，竞争性论文出现的可能性较高，此时竞争效应占据主导影响；而在新兴的学科领域，例如将大数据方法应用在经济学中，过长的审稿周期会显著阻碍该领域内的学术研究发展，此时反馈效应占据主导影响。综合以上分析可知，从理论上来看，审稿周期变长对论文的实质质量存在正负两个方面的作用效果，其净效应取决于正面效应和负面效应孰大孰小。但在现实中，编辑和审稿人针对论文提出的修改意见往往聚焦于形式质量方面(Frey，2003；Rust，2018)，诸如需要补充更多的稳健性检验、与既有文献进行更多对话等，导致作者根据审稿意见进行修改时也会相应地更关注论文的形式质量，将大部分时间用于改进论文的形式质量而非实质质量，因此审稿周期变长对论文实质质量的正面效果往往相对较小。据此，本文提出假说2。

假说2:相较于短审稿周期的论文，长审稿周期论文的实质质量相对更低。

以下，本文将借助微观论文数据来实证检验这些假说。

三、数据、模型与描述性统计

(一) 数据来源与样本选择

本文所使用的论文数据来源于Elsevier。Elsevier 与Springer、Wiley-Blackwell、Taylor＆ Francis、SAGE 这五大国际权威学术期刊出版商，控制了全球50%的科学出版。在2013 年，Elsevier 在全球学术出版市场的份额达到16%，因此其论文数据具有一定的权威性。①关于Elsevier 的维基百科，参见en.wikipedia.org/wiki/Elsevier。本文使用的研究样本限定为Elsevier 旗下经济学SSCI 期刊的论文数据，根据Web of Science 发布的2019 年经济学SSCI 期刊目录，Elsevier 旗下期刊入选79 本，占比达到22%，其中不乏Journal of Economic Theory、Journal of Financial Economics和Journal of Public Economics等领域顶刊，故其经济学论文数据具有一定的代表性。②SSCI 期刊目录参见ssci.isi-database.org。更为重要的是，在公开可得的论文数据中，只有Elsevier 旗下期刊提供论文的投稿时间和接受时间，这是本文计算审稿周期的关键数据。基于以上考虑，本文使用Elsevier 旗下经济学SSCI期刊的论文数据作为研究样本。

在获得相应的论文数据后，本文通过以下几个步骤得到最终的研究样本:首先，剔除编辑介绍与领导发言等非论文样本；其次，剔除审稿周期缺失的论文数量超过其论文总数一半的期刊；再次，剔除被解释变量、解释变量或控制变量缺失的论文样本。最终本文得到1997—2019 年37 本期刊的24 229 篇论文。③因篇幅所限，本文省略了回归样本所包含的期刊，感兴趣的读者可在《经济科学》官网论文页面“附录与扩展”栏目下载。

(二) 实证模型与变量说明

为了检验本文所提出的研究假说，我们构造如下实证模型:

其中i、j、t分别代表论文、期刊和发表年份三个维度。在检验假说1 时，Yijt是论文篇幅，代表论文的形式质量；在检验假说2 时，Yijt是论文的被引用量，代表论文的实质质量。RTijt是论文的审稿周期。Zijt是一组包括论文层面和作者层面的控制变量，以及期刊固定效应、年份固定效应和JEL 分类号固定效应。εijt是随机扰动项。由于本文使用的数据是每一篇论文，属于混合截面数据，因此在基准回归中使用Pooled OLS 方法回归。在实证模型(1) 中，我们主要关心系数β1:在检验假说1 时，若其显著大于0，则说明审稿周期变长会显著提高论文的形式质量；在检验假说2 时，若其显著小于0，则说明审稿周期变长会显著降低论文的实质质量。

表1 报告了各变量定义和具体的计算方法。本文被解释变量有两组。第一组为论文的形式质量，在基准回归中，我们使用论文篇幅来衡量，它等于论文的页数加1 取对数；在稳健性检验中，我们使用参考文献数量和图表数量这两个指标。第二组为论文的实质质量，我们在基准回归中使用被引用量来衡量，它等于截至2020 年8 月1 日的论文被引用量加1 取对数；我们在稳健性检验中使用被提及量和社交报道量这两个指标。核心解释变量为论文的审稿周期，它等于论文的接受时间减去投稿时间(单位标准化为年)。为了控制影响论文的形式质量与实质质量的其他因素，本文加入了论文层面和作者层面的一系列控制变量，这些变量的定义参见表1。与此同时，本文加入了期刊固定效应，用来控制那些不随时间变化但会影响论文质量的因素，例如期刊等级与期刊偏好等；还加入了年份固定效应，用来控制所有论文每年面临的共同冲击，例如每年的论文发表总数等；并且加入了JEL 分类号固定效应，用来控制不同学科领域对论文质量的影响。为了进行内生性检验，本文还构建了两个代表期刊主编对审稿快慢偏好的工具变量，它们的定义参见表1。

表1 变量定义和计算方法

(续表)

(三) 描述性统计

表2 展示了本文主要变量的描述性统计结果。从表2 可以看出，样本期内篇幅的均值为3.030，被引用量的均值为2.760。审稿周期的最小值为1 天，最大值为9.418 年，均值为1.084 年。

表2 描述性统计

为了分析审稿周期和论文质量的关系，我们使用散点图展示了它们之间的相关关系。如图1 左图所示，审稿周期和论文篇幅正相关，这在一定程度上支持了假说1；如图1 右图所示，审稿周期和论文被引用量负相关，这在一定程度上支持了假说2。接下来，本文将以回归分析来更为严谨地验证这两个假说。

图1 审稿周期和论文质量的相关性

四、实证分析

本部分给出所有的计量分析结果:首先，以OLS 方法检验假说1 和假说2；其次，使用工具变量方法来解决内生性问题；再次，通过替换被解释变量、替换解释变量、加入高维固定效应和剔除极端值样本的方法依次进行稳健性检验；最后，从研究范式转变和期刊质量两个维度出发，进行异质性分析。

(一) 基准回归

表3 给出了基准回归的结果。第(1) — (3) 列的被解释变量都是以论文篇幅衡量的形式质量，第(4) — (6) 列的被解释变量都是以论文被引用量衡量的实质质量。在第(1) 列和第(4) 列中，除了核心解释变量审稿周期，我们只控制了期刊固定效应、年份固定效应和JEL 分类号固定效应；在第(2) 列和第(5) 列中，我们进一步加入了论文层面的控制变量；在第(3) 列和第(6) 列中，我们还加入了作者层面的控制变量。第(3)列中审稿周期的系数为0.030，且在1%水平上显著，意味着审稿周期每延长一年，论文页数变长3%，说明审稿周期变长会显著提高论文的形式质量，假说1 得到验证。第(6) 列中审稿周期的系数为－0.107，且在1%水平上显著，意味着审稿周期每延长一年，论文被引用量降低10.7%，说明审稿周期变长会显著降低论文的实质质量，假说2 得到验证。

表3 基准回归结果

在控制变量方面:(1) 当论文为该期期刊的首篇时，其篇幅和被引用量都显著增加，说明首篇论文的形式质量和实质质量都高于非首篇论文，这与现实中编辑往往把高质量的论文放在首篇以吸引读者的现象相一致；(2) 相比不受基金资助的论文，受资助论文的形式质量更高，而实质质量并无显著差异；(3) 论文的关键词数量或JEL 分类号数量越多，其篇幅越长，且被引用量越高，说明跨领域跨专业的论文更受到重视；(4) 论文的作者数量越多，其篇幅和被引用量相对越大，反映了多位合作者能够进行更专业化的分工，从而提升发表论文的质量；(5) 论文作者的能力越强，其实质质量越高，而形式质量并没有显著变化，可以认为这个变量是作者经验的代理变量，说明有经验的作者会将有限的时间更多地用于提升论文的实质质量，而非论文的形式质量。

(二) 内生性检验

尽管我们在基准回归中控制了一系列变量，但其仍然可能存在内生性问题。具体而言，对于形式质量，可能存在反向因果问题，即形式质量较低的论文一般需要更长时间的修改才能达到发表要求，因此它会经历更长的审稿周期，反向因果问题会导致基准回归低估审稿周期对形式质量的作用效果。对于实质质量，同样可能存在反向因果问题，实质质量较低的论文经历更长时间的修改，会导致基准回归低估审稿周期对实质质量的影响。此外，对于实质质量，还可能存在遗漏变量问题，如果论文的思想创新性特别强，那么编辑和审稿人需要更长的时间去理解和审阅该论文，审稿周期延长，遗漏变量问题会导致基准回归高估审稿周期对实质质量的影响。这两类内生性问题都可能存在，导致基准回归中审稿周期对实质质量的影响方向不够明确。

为解决以上两类潜在的内生性问题，本文使用主编对于审稿快慢的偏好作为工具变量。具体地，我们计算主编e第一次担任期刊主编时，该年该期刊的平均审稿周期减去当年全部期刊的平均审稿周期，得到一个审稿相对快慢指标Dise，这个指标不随时间变化；Dise越小，说明该主编越偏好短审稿周期。我们基于“新官上任三把火”的信念，认为主编若要对杂志进行改革，往往都会在上任第一年调整审稿周期等；而之后主编出于维护杂志和自身声誉的考虑，都会稳定审稿制度和审稿周期。因此，Dise可以代表主编e对于审稿快慢偏好的不随时间变化的特征。当主编e在样本期某段时间内担任某期刊的主编时，就使用Dise作为这段时间该期刊所有论文审稿周期的工具变量；当某期刊在某段时间内有多个主编时，就使用多个主编的Dise的平均值作为工具变量。

我们还将样本期内各主编对于审稿快慢的偏好(从快到慢) 进行排名，从而判断哪些主编相对更偏好短审稿周期，即Dise越小，排名取值Ranke越小。进一步本文以Ranke作为主编e担任某杂志主编期间内该杂志所有论文审稿周期的工具变量，类似地，当某期刊在某段时间内有多个主编时，就使用多个主编的Ranke的平均值作为工具变量。

由于不同期刊在同一时间的主编不同，并且同一期刊在不同时间会更换不同的主编，因此以上两个工具变量在杂志和时间两个维度都会有所变化。另外，以上两个工具变量都能满足相关性和排他性两个特征，原因如下:第一，主编对于审稿快慢的固有偏好会直接影响杂志对于论文的审稿快慢；第二，我们认为，主编对于审稿快慢的固有偏好只会通过影响杂志的审稿周期来影响论文质量，不会通过其他途径直接影响论文质量。

工具变量回归结果如表4 所示。①工具变量的第一阶段回归结果请见《经济科学》官网“附录与扩展”。同基准回归的表3 相似，第(1) 列和第(2) 列的被解释变量为形式质量，第(3) 列和第(4) 列的被解释变量为实质质量。第(1) 列和第(3) 列使用Dise作为工具变量，第(2) 列和第(4) 列使用Ranke作为工具变量。在第(1) 列和第(2) 列中，审稿周期的系数仍然显著为正，工具变量回归系数均大于基准回归中的系数，说明对于形式质量，基准回归中确实存在反向因果问题。在第(3) 列和第(4) 列中，审稿周期的系数仍然显著为负，工具变量回归系数的绝对值均大于基准回归中的系数的绝对值，说明对于实质质量，基准回归中遗漏变量问题造成的偏误比反向因果问题更严重。但以上结果都表明，在控制了内生性问题后，假说1 和假说2 仍然成立。②对于工具变量的一个挑战是可能存在策略性投稿，具体而言，作者可能根据期刊的平均审稿周期选择期刊投稿，即高质量论文优先投稿短审稿周期的期刊。如果作者采用这种策略性投稿， Dise 和Ranke 将不满足排他性条件，可能使工具变量回归结果不一致。但是如回归样本显示，现实中高质量期刊的平均审稿周期更长(回归样本中，A 类期刊的平均审稿周期是1.31 年，B 类是1.11 年，而C 类是0.95 年)，这与高质量论文优先投稿短审稿周期的期刊的假设不符，因此我们认为更符合现实的假设是作者根据期刊的质量选择期刊投稿，即高质量论文优先投稿高质量的期刊，而这与工具变量的假设并不冲突，假说1 和假说2 成立。

表4 工具变量结果

(三) 稳健性检验

为了确保本文研究结论的可靠性，我们做了四组稳健性检验。第一，本文使用不同的指标衡量论文的形式质量和实质质量，以论文的参考文献数量和图表数量代表形式质量，以被提及量和社交报道量代表实质质量。第二，本文使用其他方式衡量审稿周期长度，将审稿周期分成多个时间区段并设立虚拟变量。第三，本文在基准回归中加入“期刊—年份”的高维固定效应，以控制期刊随时间变化不可观测特征对论文质量的影响。第四，本文剔除基准回归中各变量1%极端值样本①例如基准回归中存在审稿周期超过九年的样本点，我们担心这类极端值可能会干扰基准回归结果的可靠性，因此做了剔除极端值的稳健性检验。，以考察不包含极端值的样本中审稿周期对论文质量的影响。

使用不同的指标衡量论文质量的回归结果如表5 所示。其中，第(1) 列和第(2) 列分别以参考文献数量和图表数量来度量论文的形式质量，第(3) 列和第(4) 列分别以被提及量和社交报道量来度量论文的实质质量。在第(1) 列和第(2) 列中，审稿周期的系数仍然显著为正，而在第(3) 列和第(4) 列中，审稿周期的系数仍然显著为负，这表明，使用不同的指标衡量论文的形式质量和实质质量，假说1 和假说2 仍然成立。

表5 稳健性检验:替换被解释变量

使用不同方法衡量审稿周期长度的回归结果如表6 所示。其中，第(1) 列和第(2) 列的被解释变量为形式质量，第(3) 列和第(4) 列的被解释变量为实质质量。第(1) 列和第(3) 列的核心解释变量为是否属于长审稿周期论文；我们将审稿周期长于其所属期刊该年中位数的论文归为长审稿周期论文，否则归为短审稿周期论文。第(2)列和第(4) 列的核心解释变量为不同审稿周期区间。在第(1) 列中，长审稿周期的系数仍然显著为正，在第(3) 列中，长审稿周期的系数仍然显著为负，这表明使用不同的方式衡量审稿周期长度，假说(1) 和假说(2) 仍然成立。在第(2) 列中，系数随着审稿周期的延长而逐步增大，但增大速度逐步放缓；计量分析结果显示，与基准组(一季度之内) 相比，两年以上的审稿周期对形式质量的提升效果与一年至两年的审稿周期相近。类似地，在第(4) 列中，系数的绝对值随着审稿周期的延长而逐渐增大，且增大速度逐渐加速；计量分析结果显示，与基准组(一季度之内) 相比，一季度至半年和半年至一年的审稿周期均不会显著降低论文的实质质量。这表明，存在一个最优审稿周期，能够在不显著降低论文实质质量的情况下最大限度地提升形式质量，初步估计最佳审稿周期约为半年至一年。

表6 稳健性检验:替换解释变量

表7 为加入高维固定效应和剔除极端值样本的回归结果。其中，第(1) 列和第(2)列的被解释变量为形式质量，第(3) 列和第(4) 列的被解释变量为实质质量。为了控制不同期刊每年的风格差异对论文质量的影响，我们在第(1) 列和第(3) 列加入“期刊—年份”高维固定效应。为了保证潜在的极端值不会影响实证结论的稳健性，我们在第(2)列和第(4) 列剔除了各变量1%极端值。在第(1) 列和第(2) 列中，审稿周期的系数仍然显著为正，在第(3) 列和第(4) 列中，审稿周期的系数仍然显著为负，且系数大小均与基准回归结果接近。这表明，无论是在控制了期刊层面等随时间变化不可观测因素对论文质量的影响后，还是在剔除极端值的样本中，假说1 和假说2 仍然成立。

表7 稳健性检验:高维固定效应与保留极端值

(四) 异质性分析

通过内生性检验和稳健性检验后，我们认为基准回归的结果是可靠的。那究竟是什么原因导致了审稿周期变长会提高形式质量但会降低实质质量? 我们认为其背后的机制如下:一方面，在审稿过程中编辑、审稿人和作者能够共同改进论文，提高形式质量和实质质量(即提升效应)；另一方面，审稿周期越长，与之相似的竞争性论文越有可能抢先发表并抢占其在相应研究领域做出重要贡献的“轨道”，降低论文的贡献(即竞争效应)，同时审稿周期变长会阻碍论文中前沿知识的扩散(Lusher 等，2021)，不利于该领域的发展，领域发展受限导致该领域新发表论文减少，也会降低论文被引用的概率(即反馈效应)，这两个负面效应都降低了实质质量。我们认为所观察到的审稿周期在总体上降低实质质量的现象，源于审稿过程中编辑、审稿人和作者更侧重形式质量的提升而非实质质量，从而导致提升效应被两个负面效应所抵消。

如果以上机制确实存在，那么我们预期观察到以下两种异质性。

第一，随着计算机科技和计量技术的发展，各种统计软件的功能越来越强大，大数据显著降低了提高论文形式质量的成本，进而有助于整个经济学界的研究范式从理论主导转向实证主导。倘若作者在审稿过程中分配时间用于提升论文质量，我们预期观察到形式质量生产成本的降低会对形式质量和实质质量的生产数量产生两种效应:一方面，给定审稿周期不变，两种质量都会显著提升；另一方面，形式质量相对于实质质量生产成本的降低，会导致形式质量相对于实质质量生产数量的上升。两种效应的总体结果是研究范式转变后，审稿周期同样延长一年所带来的形式质量的提升更大，而实质质量的变化方向不确定，取决于以上两种效应的大小。

第二，高质量期刊的审稿人往往比低质量期刊的审稿人更加专业和负责，因此高质量期刊的审稿人提出的修改意见会更多地关注实质质量，与此同时，作者在修改过程中，也会更侧重实质质量。如果低质量期刊编辑、审稿人和作者共同协作提升论文质量时，比高质量期刊更注重形式质量而相对忽略实质质量，我们预期观察到高低质量期刊的形式质量和实质质量所受影响存在异质性。

为检验研究范式转变的异质性，本文将论文发表时间划分为两个时间段，相比前一时间段，后一时间段统计软件更普及，我们着重比较这两段时间中审稿周期对论文质量的影响是否存在显著差异。既有文献显示，在2006 年前，各种统计软件包括Stata、SAS、SPSS、Matlab 等的使用人数增长都较为缓慢，而在2006 年后，这些统计软件的使用人数开始快速增长(Pinzon，2015)，因此我们以2006 年作为研究范式发生转变的时点。回归结果如表8 所示，其中，第(1) 列和第(2) 列的被解释变量为形式质量，第(3) 列和第(4) 列的被解释变量为实质质量。第(1) 列和第(3) 列为研究范式转变前的子样本回归结果，第(2) 列和第(4) 列为研究范式转变后的子样本回归结果。在第(1) 列和第(2) 列中，审稿周期的系数仍然显著为正，且研究范式转变后的系数显著大于转变前的系数，说明随着学界更加注重论文的形式质量，审稿周期变长对论文形式质量的提升效应更大，符合我们对第一种异质性的预期，表明作者在审稿过程中分配了时间，分别用于提升两种论文质量。

为检验期刊质量的异质性，我们将期刊分为高质量和低质量两类，并进一步比较审稿周期对这两类期刊论文质量的影响是否存在显著差异。我们根据国内对英文经济学期刊的评价，将样本中的期刊分为A 类、B 类和C 类三类①本文对期刊的分类标准参照了国内部分代表性高校(例如北京大学、复旦大学、中国人民大学)对英文经济学期刊分类做法；期刊分类目录请见《经济科学》官网“附录与扩展”。，并将A 类和B 类期刊分为相对而言质量较高的期刊，而将C 类期刊分为相对而言质量较低的期刊。回归结果如表8所示，其中，第(5) 列和第(6) 列的被解释变量为形式质量，第(7) 和第(8) 列的被解释变量为实质质量。第(5) 列和第(7) 列为高质量期刊论文的子样本回归结果，第(6) 列和第(8) 列为低质量期刊论文的子样本回归结果。在第(5) 列和第(6) 列中，审稿周期的系数仍然显著为正，且高质量期刊的系数显著小于低质量期刊的系数，说明相较于低质量期刊，审稿周期变长对高质量期刊论文形式质量的提升效应较小。在第(7) 列和第(8) 列中，审稿周期的系数仍然显著为负，且高质量期刊的系数的绝对值小于低质量期刊的系数的绝对值，说明相较于低质量期刊，审稿周期变长对高质量期刊论文实质质量的降低效应更小。第(5) 列至第(8) 列中系数大小关系符合我们对第二种异质性的预期，表明审稿过程中编辑、审稿人和作者在提升论文时对两种论文质量存在侧重。同时现有文献发现，目前越来越长的审稿周期并不是由审稿人和作者在讨论关于如何提升实质质量所引起的，而是被更多地花在了对形式质量的提升上(Frey，2003；Rust，2018)。本文结合现有文献，认为审稿过程中编辑、审稿人和作者过度重视形式质量导致审稿周期变长在总体上降低了实质质量。

表8 异质性分析:研究范式转变

五、结论

近年来，尽管经济学论文的篇幅在不断变长，但其思想的重要性程度似乎并未随之提高，本文认为这一现象可能与日益变长的审稿周期有关。为验证以上猜想，本文以1997—2019 年Elsevier 旗下经济学SSCI 期刊上发表的论文为研究对象，实证检验了审稿周期变长对论文质量的影响。本文首先将论文质量分为形式质量和实质质量，并以篇幅和被引用量分别作为它们的代理指标。OLS 和工具变量的回归结果均表明:相较于短审稿周期论文，长审稿周期论文的篇幅显著更长，被引用量显著更少。这说明，审稿周期变长会显著提升论文的形式质量，但会显著降低论文的实质质量。进一步异质性分析发现:当学界更加注重论文的形式质量时，审稿周期变长对论文形式质量的提升效应相对更大；相较于低质量期刊，审稿周期变长对高质量期刊论文形式质量的提升效应以及对实质质量的降低效应都相对更小。

根据以上结论，本文提出以下几点政策建议。第一，为了更好地实现审稿对论文形式质量的提升作用并规避审稿对论文实质质量的降低作用，经济学论文的最优审稿周期应该设定在半年至一年左右。比如，针对作者关于缩短论文篇幅和审稿周期的呼声，已经有期刊率先实施试点改革，美国经济协会(AEA) 推出了新期刊AER:Insights，以刊登“同等重要但表达更简洁的论文”。①参见AEA 新闻“与编辑Amy Finkelstein 的Q＆A”，www.aeaweb.org/news/aer-insights-editor-qa。第二，经济学期刊应该更加关注论文的实质质量，而

不是过分偏重形式质量，在挑选论文时不应该遵循“实证优先”或“政策优先”原则，而应该遵循“思想优先”或“学术重要性优先”原则。第三，在实际审稿过程中，期刊编辑应该对审稿人设立“胡萝卜”加“大棒”式的激励机制，例如，在规定时间内完成高质量审稿的审稿人可以获得更多的金钱激励，或者其论文能获得相对更快的审稿流程，而对不能在规定时间内完成审稿或审稿报告质量低下的审稿人的投稿加以一定的限制等。