APP下载

“引用日期”在文字复制比检测中的作用探讨

2016-03-26丁明刚

中国科技期刊研究 2016年3期
关键词:面世收稿不端

■丁明刚

巢湖学院图书馆,安徽省巢湖市半汤路1号 238024

应用学术不端检测系统进行文字复制比检测,旨在通过区分合理复制与不合理复制去判定合理引证与学术不端,以便最终对稿件进行取舍。学术不端检测实践及有关研究成果表明,检测者往往侧重于从表象上关注文字复制率[1-3],常以不高于本刊或本机构规定的文字复制率作为审查“合格”的标准[4],忽视了从时间维度上对文字复制进行细致周到的取舍[5],以致于难以从复制文字使用的维度对复制行为进行深入的剖析与评判。这就使得学术不端检测常常流于检测系统工具理性主导下的主观随意[6-7],缺乏整体性、全面性和合理性。事实上,当作者撰著中的文字复制属于“引证”时,复制即是对已有文献的利用,其行为必然包含着“文献引用的具体日期”“引用文字量的大小”“引用文字如何使用”等三要素,任何一篇文章的检测都离不开这三个维度。本文根据《信息与文献参考文献著录规则》[8](简称“新规则”),提出为引用文献添加“引用日期”的新观点,从而将判定文字复制截止日期由依据“终稿投出日期”[5]转变为依据引文参考文献的“引用日期”,实现了检测引证时间点由“单点”向“多点”的转变;将“引用日期”牵引到引用内容上,实现了检测着眼点由“全文”向“引文”的转变,从而使“引文”“引用文献”及“非引用文献”能够较大程度上按照时间逻辑进行比对,解决了部分引文及其“参考文献”难以核查与判定的难题;并在此基础上提出了从“引用日期”“引用数量”“引文使用”三个维度整体上进行文字复制取舍的构想,以提高检测的准确性和科学性,为科学地进行文字复制比检测提供了新的思路和方法。

1 “引用日期”的著录意义

新规则规定,“参考文献”分为“阅读型参考文献”和“引文参考文献”,前者是“著者为撰写或编辑论著而阅读过的信息资源,或供读者进一步阅读的信息资源”,后者是“著者为撰写或编辑论著而引用的信息资源”[8],即“引用文献”。 作者撰著中的引证使用的是引文参考文献,其引用行为通常发生于不同的时间内,“引用时间”因而成为“引用文献”的重要要素及特征。然而,由于参考文献著录规则的不完善以及科研、编辑出版的传统习惯,使得大家普遍忽视引文参考文献“引用日期”的标注。长期以来,按照《文后参考文献著录规则》(简称“老规则”)的规定,只有“联机文献”标注了“引用日期”[9]。2015年5月15日发布的“新规则”在著录项目必备性方面将老规则规定的“引用日期(联机文献必备,其它电子文献任选)”改为“引用日期”,并给出示例,要求今后所有“引文参考文献”后都须标注“引用日期”[8]。按此规定,“引用日期”应系作者引用每条“引文参考文献”时标注于该文献著录格式中的当日日期,它能够彰显作者对相关文献研习与使用的时间跨度,展示其学术研究的时空性、宽广性以及对面世文献使用的敏捷性和创新性;有利于形成新的学术规范,强化作者学术行为的严谨性、细致性和诚实性;促进学术不端检测的新变革。

2 “引用日期”对文字复制比检测的影响

作者撰文的引用行为在其文章终稿投出日即告终止,文字复制比检测应以该日作为文字复制取舍的分界点[5]。这在老规则情形下是合理和有效的,但在新规则下此做法是否存在着弊端呢?既然引文参考文献要求标有“引用日期”,那么,是否可以用这种日期来取代“终稿投出日”作为文字复制取舍的分界点呢?为了搞清楚这些问题,笔者通过实际检测来进行探究。

2.1 合理地确定“引用日期”

笔者随机选择某大学学报(哲社版)2015年第1期10篇已发表文章(PDF格式)进行检测。该刊为双月刊,规定文字复制率<15%,要求通过编辑系统投稿,文章出版时标有“收稿日期”,该日期视为“终稿投出日”和“文字复制终止日”。这10篇文章的文后参考文献均为引用文献,且只有少数“联机文献”标注了“引用日期”。

日常检测中,被检测出的“参考文献”都标有“出版日期”(公开出版物)、“公告日期”(电子公告)、“公开日期”(专利、档案)等“面世日期”。当科技期刊纸质刊的电子版在线优先出版时,其所载文章在该刊面世当日即可引用(此为最早的“引用日期”),而纸质刊还需经过印刷、发行等环节,一般需2周左右才能与读者见面并被引用(这可以认为是纸质刊最早的“引用日期”,它与电子版最早被引用日期的间隔周期姑且定为15天。事实上,作者最迟的“引用日期”可能为“终稿投出日”。),电子版刊被中国知网等数据库收录提供引用一般还需要1个月左右。因此,全文参考文献的引用日期应该在“引用文献电子版在线出版面世日~作者终稿投送日”之内。

将这10篇文章转化为WORD文档,并把每篇文章文后参考文献表中没有“引用日期”的参考文献逐一添加“引用日期”。为了确定这些日期,假设每篇文章撰写及定稿均在3个月内完成,则有:引用日期在“收稿日之前3个月内某日~收稿日”之内。(1)对于撰稿后期或终稿寄送临近期引用新面世的参考文献,其引用日期在“引用文献电子版在线出版面世日~引用文献纸质版面世日”之内,其最理想、最及时的天数宜选在1~15日之内,以此标准来确定此类文献的“引用日期”。(2)对于非撰文近期内面世的引用文献,为了尽可能地使检测做到客观有效,不妨将“引用日期”随机选择在撰文过程中的前两个月内,择日标注。

2.2 对文字复制率取舍影响显著

经过上述处理后,再通过某省学术文献鉴定中心对这两组文章进行文字复制比检测。检测时,仍然以“收稿日期”作为文字复制取舍的时间分界线,再对添加了“引用日期”的“引用文献”及其“引用内容”进行核查取舍,得出最终检测结果(见表1)。

表1 引用文献有无“引用日期”及“相关参考文献”取舍后的文字复制比

为便于查看,上表中将10篇文章按照PDF文档检测出的文字复制率从低到高排列。

检测显示,文后参考文献是否添加“引用日期”,得到的文字复制比均相同(见表1第2、3列数据),不影响全文的文字复制比。 文章 1、2、4、7、9、10的3列复制比均分别相同,检测显示每篇文章的文后引用文献与引用内容分别对应一致,引用形式规范,无需取舍。

检测中,发现文章3、5、6、8分别出现了不少与各自引用文献“相同”或“相关”的参考文献。“相同”者,为作者标注的引文参考文献,予以保留;“相关”者,既有作者引用而未标注的文献,也有非作者引用而出现的文献,需进一步判断取舍。表中第4列数据是对第3列数据核查后得到的。(1)文章3有一处引用了某著作的内容,作者标注了该条参考文献,检测报告显示某篇期刊文章也引用了该著作中相关的内容,检测结果判文章3引用了该期刊论文。笔者核查了该条参考文献的“引用日期”,发现它早于期刊论文的“出版日期”,于是,将该条“期刊论文参考文献”及其产生的复制率剔除。(2)文章5、6、8中均有参考文献引用了相关期刊的文章,同时,检测显示“其它期刊论文”也引用了这些期刊论文的部分内容,检测系统判文章5、6、8复制了“其它期刊论文”(实为“非引用文献”),给出了文字复制率。根据每条参考文献的“引用日期”,将“面世日期”迟于“引用日期”的“非引用文献”剔除;再根据文章的“收稿日期”,将迟于该日期面世的“非引用文献”剔除。经过上述处理,以上4篇文章的“非引用文献”全部被剔除,文字复制比均有所下降,未发现有引用而不著录的不端行为。这也说明,为什么待发表或已发表文章检测时,检测报告中时常会出现一些作者未引用的“参考文献”,并由此产生出一定的“文字复制比”,令作者和检测者莫名其妙无所适从。

检测还发现,文章9、10的复制比>15%。通过将“引用日期”与“面世日期”比较,发现文章9高出部分的复制率是由于该文作者在文章投出临近期引用了新发表论文,但未列入文后参考文献表并在文中标识,属于抄袭行为,该复制率应计入总复制比;文章10高出部分的复制率也是作者在稿件投出临近期引用了新发表论文,但作者作了相应的著录与标识,可能是文章发表时检测系统因“新发表论文”尚未收入比对库而未能检测出其复制率,尽管如此,该文复制率较高,也不符合刊物规定的要求。

综上所述,给引文参考文献添加“引用日期”,尽管与未添加该日期的全文初检结果一致,但在进一步核查中,这些“引用日期”经与相关文献的“面世日期”比较,就可以按照时间先后的逻辑最大限度地将非作者引用的文献剔除,将作者引用而未标注或引用而未被检测出的文献予以认定,进而初步得出全文文字复制比的“合理”取值。

3 引发文字复制比检测的新变革

由上可知,给参考文献标注“引用日期”,对文字复制比检测影响深刻(见表2),将引发文字复制截止日期、取舍文字复制日期分界点、复制文字的核查范围、复制文字的核查点等发生转变,为剔除非相关引用文献提供有效可靠的依据,从而使检测达到最为理想的状态。

3.1 为检测创造了新条件

每篇被发表论文包含着作者引证、终稿投送、编辑部收稿、复制比检测等环节,每个环节都衍生出了特定的“日期”。当引文参考文献没有标注“引用日期”时,这些日期仅是一个个分散的时点,只有靠检测者进行有限的逻辑迁移才能有所关联,以发挥出演绎、推理、佐证等作用。而在标注了“引用日期”后,对应的“引文”即被赋予了该日期,从而可以对非引用文献进行有效的剔除;参考文献的“引用日期”又可与“收稿日期”进行比较,得出“全文引用的不同日期及最后的准确引用日期”,从而将“引用日期”由全文的“引用终止日期”具化并缩小到一个个日期;“引用日期”还可与非引用文献的“面世日期”进行先后比较,以便有效地剔除后者。这样,“引用日期”就将上述分散的时点有机地连接在一起,形成了独特的时间链,进而将引文、引文参考文献、非引用文献紧密相联,通过相互关联及作用(见图1),最终构成检测的证据链。

该图表明,标注“引用日期”,可将原先依赖“收稿日期”来判定全文“引证终止日期”及“文字复制截止日期”,转变为依据每个“引用日期”来对引用处及全文进行判定,这样,“引用日期”就由间接和潜在变为直接和显现,从而使文字复制点得以尽可能充分地依“时”而查。因此,“引用日期”成为检测的核心要素之一,使得依据时间逻辑来进行检测变得更为充分、规范和有效,为进一步进行文字复制量及引用的核查扫除了一定的障碍。当然,为提高检测比对的准确性,避免产生出误判,“引用日期”应该即引即标和如实标注。

表2 参考文献有无“引用日期”对文字复制比检测的影响

图1 “引用日期”关联要素及其相互作用

3.2 实现了检测手段的新突破

添加“引用日期”,使得“引用日”“投稿日”“发表日”“参考文献面世日”“复制比取舍分界日”等日期可以按照时间逻辑进行比较,最大限度地促成了“引用”与“不端”检测的深刻转变:“引证日期”的揭示,由刊物标注“收稿日期”的间接推断变为由作者标注“引用日期”的直接提供;复制文字取舍点由依据“终稿投出日”的单时点判断转向依据“每个引用日”的多时点准确核对;检测着眼点由侧重“全文总复制比”向依据“每条引用文献及其文字复制比”再到“全文总复制比”的转变;检测方式由“无引用日可依”的过多的主观判断向“依据引用日”的充分的准确定位转变。这样,就使得部分非引用文献难以取舍、新面世文献引用难以检测等长期悬而不决的难题得以有效解决,从而使检测变得更为细致、准确和有效。

3.3 有利于形成三维化的检测新模式

论著中的任何一处引证都是由引用时间、引文量、引文使用等三要素构成的,文字复制比检测实质上是对引证的检测,因此,检测必须统摄于这三个维度。

第一,时化处理。以“引用日期”作为检测的首要要素和先决条件,通过与“面世日期”“收稿日期”“修回日期”等相关时点的比较,率先从时间逻辑上将非引用文献剔除,并将引用而未予标注或引用且标注但未被及时检测出的文献予以确定和保留,从而尽可能减少非引用文献对后续核查的干扰,使文字复制率在时间层面上得以合理呈现。

第二,量化处理。通过对“相关参考文献”时化处理所得到的文字复制比并非一定为合理值,接下来还需从复制量维度来进行量化处理。目前,检测系统[10]、科技期刊[11]、评价机构等都对论文的文字复制比有着严格的规定,随着科研工作者学术规范的不断加强,应对学术不端检测技术手段的不断提高,以及刊物来稿初检、发表前再检等多重检测的推行,使得拟用稿、已发稿的文字复制比几乎都能维持在“较低”且“合格”的限度内,但这未必“合理”[12]。例如,不少文字复制比较低的文章,局部文字复制量却较大,如果仅从复制比合格的角度考量,其中存在着学术不端的文章很容易蒙混过关;部分科技文章出现了较多的冗余参考文献[13];综述性文章因引用文字较多使得文字复制比偏高[14],许多刊物将这类文章拒之门外。因此,即便是文字复制比合格,也应将过分复制判为学术不端;即使是文字复制比偏高,也应将合理的综述性文章予以采纳。

第三,质化处理。从时间、文字量两个维度对文字复制比进行取舍,多是表象化的,作者引证行为是否合理与科学,最终必须从“引文使用”这一层面进行解剖和终极判定,即进行引证质量的监审[15]。在文字复制比“合格”情况下,有些文章存在着与他人或本人已发表论著“观点相同、论证基本一致、所得结论相似、表述意思一致”等严重的隐性重复问题[4],从而违背了“创新”这一学术研究的根本宗旨。科学研究不仅要有继承性,更要有创新性,这应成为学术不端检测的根本标准和审查核心。研究表明,研究型论文中参考文献引证数量在引言、正文及结论中的分布比例依次为61.4%、38.6%和0%,主要起着背景描述、提供事实与理论依据、介绍研究思路及方法、对比分析研究结果等的指示和佐证作用[16],这与CNKI检测系统关于前部重合度(HR)、后部重合度(ER)的规定是一致的,也就是说在“提出问题—分析问题”部分的文字复制比可以高于“解决问题”部分和文章核心句子[17]。“解决问题”部分和文章核心句,是作者分析论证的重点部分,展示了作者的新观点、新方法、新材料,是主要的创新点所在,应作为检测的核心点与焦点,其判定标准唯有“是否具有创新性”,如果没有创新,那么,这种复制就失去了意义,若复制失当,即可划归学术不端之列。因此,通过对引文进行“创新性”这一“质”的分析,不仅可以从根本上判定合理引证与学术不端,而且,还能评判著者的科研态度、科研能力和真实水平。

综上所述,文字复制比检测只有将复制时间、复制文字量和复制文字使用三个方面紧密结合在一起,层层过滤,不断深化,才能进行合理取舍,取得良好的评判效果。

4 结语

引文参考文献的“引用日期”在文字复制比检测中担当着链接有关检测点和提供证据的重要角色,发挥着其它要素难以替代的关键作用,能够有效地清除检测障碍,解决其悬疑问题,形成时间、数量和质量的三维化的理想检测模式。“引用日期”的使用,应该成为新的学术意识、学术习惯和学术规范,推进编辑出版和学术不端防治工作迈上更高的台阶。

[1] 孔琪颖,蔡斐,张利平,等.正确看待“科技期刊学术不端文献检测系统”检测结果[J].编辑学报,2009,21(6):544-546.

[2] 吉家友.学术不端文献检测系统数据分析[J].中国出版,2010(2下):27-29.

[3] 孔艳,颜帅.关于不端文献检测软件的思考[J].中国出版,2010(11下):28-30.

[4] 陆宜新.学术不端检测中的隐性重复现象分析[J].中国科技期刊研究,2015,26(6):552-555.

[5] 丁明刚.适于文字复制比后检测的科技期刊编辑出版规范探讨[J].中国科技期刊研究,2015,26(8):856-861.

[6] 丁明刚.文字复制比检测的误区及其防范[J].出版广角,2015(1):95-97.

[7] 李小萍,武建虎,岳建华.编辑应警惕反抄袭软件应用依赖症[J].中国科技期刊研究,2013,24(3):589-590.

[8] 中华人民共和国国家质量监督检验检疫总局,中国国家标准管理委员会.信息与文献 参考文献著录规则(GB/T 7714—2015)[S].北京:中国标准出版社,2015:1-20.

[9] 中华人民共和国国家质量监督检验检疫总局,中国国家标准管理委员会.文后参考文献著录规则(GB/T 7714—2005)[S].北京:中国标准出版社,2005:1-15.

[10] 崔洁,谭华.对“学术不端文献检测系统”的审稿功能探析[J].中国科技期刊研究,2010,21(3):336-338.

[11] 林汉枫,张欣欣,翟自洋,等.遏止学术不端行为 保护科研原创成果[J].中国科技期刊研究,2009,20(4):580-584.

[12] 颜峻,侯风华,黄莉,等.防范学术不端,净化高校学风[J].编辑学报,2010,22(增刊2):8-10.

[13] 常思敏.科技论文中冗余参考文献分析[J].出版科学,2015(1):43-45.

[14] 谭华,崔洁.学术不端文献检测系统的使用建议[J].编辑学报,2010,22(2):153-155.

[15] 朱大明.参考文献引用质量监审的3个基本要素[J].编辑学报,2015,27(4):334-336.

[16] 朱大明.参考文献引证在研究型论文中的分布特征[J].编辑学报,2008,20(6):481-482.

[17] 赵蔚.学术不端检测结果的修正标准初探[J].中国出版,2011(11下):20-23.

猜你喜欢

面世收稿不端
中国首枚芯片邮票面世
论文作者学术不端行为类型
中国首套人工智能教材2019年面世
教育部首次以部门规章明确6种学术不端情形
《高等学校预防与处理学术不端行为办法》9月1日起正式实施
Perspectives on China′s General Medicine Education,Training,Development and Challenges
《中国医疗美容》学术不端检测方法
《口述雷锋真相》面世前后
Phase selection rules for complex multi-component alloys with equiatomic or close-to-equiatomic compositions
A Presenting with Successful 131I Therapy of Thyroid Storm Accompanying Severe Hepatitis:a Case Repo