APP下载

基于CNKI的计算机科学学科半衰期分析*

2015-11-21王丽雅

图书与情报 2015年1期
关键词:半衰期期刊文献

王丽雅

(南京大学信息管理学院 江苏南京 210023)

基于CNKI的计算机科学学科半衰期分析*

王丽雅

(南京大学信息管理学院 江苏南京 210023)

文章以

计算机;学科半衰期;引文分析;引用半衰期;被引半衰期

1 引言

半衰期作为引文分析法中的一个重要指标,常用来衡量文献老化速度的快慢,揭示文献老化的规律。Gosnell在1944年提出了科技文献老化的问题。英国著名的学者J.D.Berna借用物理学中的放射性物质的衰变性质首次提出来科技文献半衰期的概念。此后,Burton和Kebler提出文献半衰期是指某一学科(专业)目前尚在利用的全部文献中较新的一半是在多上时间内发表的。自半衰期概念提出以来,学者围绕着半衰期这个概念展开了大量的研究。张黄群研究了期刊被引半衰期与有关指标的相关性,并指出被引半衰期可以定量表示期刊的老化速度,反映期刊论文的生命周期。罗式胜对文献半衰期的各种类型及其应用等若干问题进行了初步的论述。其也对期刊引用半衰期和被引半衰期的概念、意义、求法以及期刊引用半衰期和期刊被引半衰期的区别等几个问题进行了初步论述。

计算机作为一门应用型学科,涉及多个领域,近年来受到广泛的关注和研究,计算机科学文献的增长、传播和利用空前繁荣。其科技文献数量庞大,门类繁多,并且新的技术文献更新速度快。关于计算机科学文献的相关研究,尚宁通过《中国引文数据库》统计了2003~2007年计算机核心期刊载文被引情况,根据期刊的被引频次、篇均被引率、自引率、影响因子、即年指标和h指数6项指标对期刊进行定量、定性分析并综合评价和排名。田晓明以《计算机学报》为调查对象,对2000~2004年所刊载的论文,运用引文分析法对其引文数量、文献类型、语种结构、自引分析、引文期刊及年代分布等项目进行统计分析,并做出相应的评价。郭玉,蔚海燕以Web of Science、ESI等数据库为统计分析源,对1996至2006年中国计算机科学的发展现状和发展态势从文献计量学的角度进行了统计分析,通过论文数量、被引频次、篇均被引频次和影响因子等项指标研究了计算机科学论文产出随时间的变化趋势、主要领域的发展状况及刊登论文期刊的影响力。

从以上研究可以看出,关于文献半衰期的研究,目前多以期刊为研究主体,例如期刊引用半衰期和期刊被引半衰期,对于学科半衰期的研究相对较少。因此,本文从学科文献的半衰期入手,通过学科引用半衰期和学科被引半衰期,研究影响计算机学科文献老化速度的相关因素。

2 数据来源

本文以CNKI数据库为数据来源,根据《中国图书馆图书分类法》(第四版)中的学科分类号,统计了计算技术、计算机技术(分类号为TP3)的相关学术文献,以此作为计算机学科引用半衰期和学科被引半衰期研究的数据基础。本文获取的学术文献包括期刊、特色期刊、博士、硕士、硕士、2013增刊、国内会议、国际会议、报纸、年鉴等。本研究统计了2010~2012年计算机学科学术文献的引用情况和2008~2012年计算机学科学术文献的被引情况(文献历年发文情况、引用和被引情况见表1和表2)。

表1 计算机学科(分类号为TP3)引用数据

表2 计算机学科(分类号为TP3)发文及引用被引情况

可以看出,计算机学科的历年发文数量相对稳定,与参考文献数量和被引频次皆处于缓慢上升趋势,这说明计算机学科近几年学科内部以及与其他相关领域的学术交流在加强,计算机学科发展相对稳定成熟,学科研究质量在不断提高。

计算机作为一门应用性较强的学科,其子学科种类多且一些子学科的论文成果数量很大。本文按照中图分类法中计算技术、计算机技术下的各下位类的子学科分别进行数据爬取(子学科分类见表3)。

表3 中图分类法中计算机学科子学科分类表

3 学科半衰期概念及计算方法

3.1 学科引用半衰期的概念及计算方法

文献引用半衰期包括学科著者引用半衰期、期刊引用半衰期、科学家引用半衰期等。学科著者引用半衰期主要研究的是某一个学科内著者的引用行为规律,它是衡量一个学科内的著者在引用文献资料的过程中对什么时间出版的参考文献感兴趣的一个重要指标。学科引用半衰期是研究的一个学科内的一群科学家的引用行为规律,而非针对某一个科学家。从学科的角度来看,是用来衡量该学科对于过去历史文献时效跨度长短要求方面的指标。

本文将学科引用半衰期定义为某学科在某年(1年内)所引用的参考文献中较新的一半是在最近(以当年为第0年)多长一段时间内发表(出版)的。学科半衰期较长,说明该学科比较关注发表时间较长久的文章;学科半衰期较短,说明该学科紧跟时代发展,较多关注短时期内发表的文章。

学科引用半衰期根据定义,其具体计算公式为:

W=U+(50%-X)/(Y-X)

其中,W是指所求的引用半衰期,U为累计百分比小于且最接近50%的年数,X为统计年至U年的引用累计百分比,Y为统计年至U+1年的引用累计百分比。

以计算机子学科计算机软件(TP31)为例,根据以上的公式,计算该子学科2012年的引用半衰期(见表4)。其中,2012年引用次数是指2012年发表的文章中引用这一年发表文章作为参考文献的次数。

表4 2012年计算机软件子学科(TP31)引用参考文献数据

可以看出,计算计算机软件该子学科的引用半衰期:累积百分比接近50%的是2008年的44.57%,其对应年数为4。因此,该子学科2012年的引用半衰期为4.62年,相关计算为:W=4+(50%-44.57%)/(53.27%-44.57%)=4.62(年)。

3.2学科被引半衰期的概念及计算方法

学科被引半衰期是针对某个学科文献的被引过程而言的,它是衡量该学科文献老化速度的指标。学科被引半衰期指某一个学科文献T年被引半衰期,是指该学科在T年(一年时间内)被引用的全部文献中较新的一半是在最近(以T年当年为第0年)多长一段时间内发表的。

一般而言,最新发表的论文特别是能够反映该学科研究热点的论文,会引起其他研究者的关注和引用。随着时间发展,人们对该论文的关注度会降低。学科被引半衰期短,说明该学科受关注的文章更新速度快,被利用的时间短。反之,学科被引半衰期长,说明该学科文献老化速度慢,受关注的时间长。

学科被引半衰期的计算公式与学科引用半衰期的计算公式类似。以计算机子学科计算机应用(TP39)为例,计算计算机应用这个子学科2012年学科被引半衰期,累积百分比接近50%的是2009年的39.98%(见表5),其对应年数为3。因此,该子学科2012年的被引半衰期为3.78年,相关计算为:W=3+(50%-39.98%)/(52.77%-39.98%)= 3.78(年)。

表52012年计算机应用子学科被引用数据

4 学科半衰期在计算机学科中的应用

4.1 计算机学科引用半衰期分析

通过引用半衰期的计算公式,可以计算出计算机学科及子学科2010~2012年的引用半衰期(见表6)。

可以看出,计算机学科引用半衰期三年平均值为4.76年,2010年至2012年引用半衰期分别为4.72年,4.79年和4.77年,变化不大。说明计算机学科近年的研究周期(研究热点、研究前沿被关注的时间)为4.76年左右。

表6 2010年~2012年计算机学科及子学科引用半衰期

计算机子学科中,微型计算机(TP36)、多媒体技术和多媒体计算机(TP37)这两个子学科引用半衰期较短,三年引用半衰期平均值分别为4.16年和3.41年。半衰期的长短与学科研究的内容和发展状况有关。近几年,由于移动化及平板电脑的兴起,微型计算机发展迅速,技术更新较快,学科观点和研究方法不断得到改进和突破,相关研究热点主要围绕嵌入式系统、软件的开发及应用和Arduino原理、开发及应用。在这些研究中,新理论与技术不断涌现,因而学者在引用时较多选用较新的成果,所以引用半衰期较短。高频次被引用文献有陈书益、黄永慧的《开源视频服务器软件MJPG-streamer的研究和应用》,唐辉、贾晓华的《基于ARM的嵌入式计算机系统的低功耗设计与实现》,代敏的《基于Android平台下手机定位程序的设计及实现》等。

引用半衰期较长的子学科是计算技术、计算机技术一般性问题(TP30),计算机理论与方法(TP3-0)和其他计算机(TP38)。相应的三年引用半衰期平均值分别为4.96年,5.23年和5.96年。引用半衰期较长的学科,其生命周期较长。说明学科的学术观点和研究方法相对成熟,经典的研究成果较多。一般来说,学科为基础学科,理论性研究较多,学科的引用半衰期较长。计算机理论与方法(TP3-0)学科主要研究方向有社会感知、网络世界中的自我认知、以及网络对人们的影响等,偏理论研究的文章较多。高频次被引用文献有於志文等的《社会感知计算:概念、问题及其研究进展》,吴琼的《信息时代的设计伦理》,鲍丽娟的《自我认同与化身的文化分析——基于网络角色扮演游戏》等。计算技术、计算机技术的一般性问题(TP30)主要以云计算理论方面的研究为主。高频次被引用文献有叶可江等的《虚拟化云计算平台的能耗管理》、杨健等的《云计算安全问题研究综述》。一些研究观点较偏僻的学科,由于研究学者相对较少,研究观点更新速度较慢,引用半衰期较长。

可以发现,微型计算机(TP36)、其他计算机(TP38)和计算机理论与方法(TP3-0)的引用半衰期处于上升趋势。其中,计算机理论与方法上升幅度较大,但在2010年引用半衰期较小,说明该学科引用近几年的研究热点较为明显,2011年,2012年引用半衰期变长,说明学科研究热点内容趋于稳定,热点的持续时间长。这是因为随着Web2.0兴起,网络虚拟世界成为人们生活的一部分,影响着人们的思想和行为。研究网络对人们的影响成为热点。这些热点新颖且被学者广泛关注,因而计算机理论与方法学科引用半衰期变长。

可以看出,计算技术、计算机技术一般性问题(TP30)和计算机应用(TP39)两个子学科2010~2012年引用半衰期处于下降趋势。计算机学科内部的计算机应用部分近年来发展迅猛,产品的升级换代周期变短,因此计算机应用学科的研究观点更新快,引用半衰期周期变短。应用学科主要包括信息处理(信息加工)和计算机网络两个方面。Web2.0的提出和应用,改变了人们获取信息的方式,伴随着科技的发展,Web3.0和社会化信息交互成为研究热点。知乎、Quora和百度知道等社会化搜寻系统进入人们的生活,如何加工信息和在知识的海洋中将最准确的信息传达给用户成为主要的研究课题。伴随着新技术和理论知识的产生,缩短了计算机应用学科的半衰期。计算技术、计算机技术一般性问题这个学科近年来以研究云计算理论方向为主。云计算也是计算机应用学科的一个热点研究方向。受到计算机应用学科的影响,计算技术、计算机技术的一般性问题该学科的引用半衰期也变短。

同时可以看出,计算机软件(TP31)、电子数字计算机(TP33)和多媒体技术与多媒体计算机(TP37)这三个子学科引用半衰期2010~2012年相对稳定,说明这三个子学科的文献老化速度较为稳定。在提出和应用新观点的同时,也会引用一些经典的研究成果。以计算机软件这个学科为例,其经典研究成果有工作流技术,软件复用与软件构件技术和软件体系结构等。在经典研究成果被高频引用的同时,一些新颖的研究观点也在被高频次引用。如数据仓库、数据挖掘技术,Android的架构与应用开发等。经典研究成果与新观点文章同时被高频次引用,学科的引用半衰期因而相对稳定。

4.2 计算机学科被引半衰期分析

根据计算机学科2009~2012年的被引数据和中图法中计算机学科的分类,通过被引半衰期的计算公式,计算计算机学科以及相应子学科的被引半衰期(见表7)。

表7 2009~2012年计算机学科及子学科被引半衰期

可以看出,计算机学科2009~2012年被引半衰期不断增长,平均被引半衰期为3.328年。说明计算机学科文献老化速度减慢。计算机学科的子学科中,其他计算机(TP38)这个学科的被引半衰期较长,为7.33年;计算机理论与方法(TP3-0)学科半衰期较短,为2.97;其他子学科被引半衰期集中在3~4之间。被引半衰期较长,一方面说明了是学科发展比较成熟,受到关注的时间长,另一方面说明该学科文献更新速度慢,新颖研究突破少。其他计算机这个子分类包括计算机学科的一些比较冷门的学科方向,历年研究成果相对较少,因此文献更新速度比较慢,被引半衰期较长。

相反,微型计算机(TP36)、计算机理论与方法(TP3-0)两个子学科的被引半衰期小于计算机学科的平均水平,分别为3.038年和2.972年。一般而言,新兴学科和应用型学科的被引半衰期较短。此外,学科的研究热点更新速度快,也会导致学科的被引半衰期变短,文献老化速度变快。微型计算机作为一门应用型学科,近年来得到广泛的关注,学科发展迅速,新颖的研究成果不断推出,嵌入式系统尤其是单片机方面的文章被引次数较多。文章主要以系统开发和算法优化为主,应用性较强。随着Web2.0的兴起和发展,有关计算机网络对个人和社会的影响的研究层出不穷,导致计算机理论与方法学科被引半衰期变短。

可以看出,计算机学科2009~2012被引半衰期处于上升状态且每年的增长幅度相近,平均增长幅度为7.9%。被引半衰期的增长,说明该学科的文献老化速度变慢。从文章的角度看,说明计算机学科内的一些观点和文章受到关注的时间长,被长时间关注和引用。同时,文章的更新速度变慢。近5年,计算机学科被引用次数较高的文章分别有阳宪惠的《现场总线技术及其应用》(被引频次:5075次),萨师煊、王珊的《数据库系统概论》(被引频次:4129次),阮秋琦的《数字图像处理学》(被引频次:3557次),杜春雷的《ARM体系结构与编程》(被引频次:3478次),周立功的《ARM嵌入式系统基础教程》(被引频次:3101次)和饶运涛的《现场总线CAN原理与应用技术》(被引频次:3088次)。这些文章的发表时间较早,影响力较长,因而计算机学科的被引半衰期逐渐增长,文献更新速度减慢。

计算机是一个被其他信息学科广泛应用的学科。当学科内部有新的观点或者重大突破时,往往可能会有其他学科从其他角度进行深入研究探讨。一方面,其他学科会以计算机为平台,结合学科自身的知识进行研究。例如通讯、机械、医学、电子、化工、信息等学科。具体引用例如:机械制图与计算机制图的融合,基于计算机视觉的机械零件几何量精密测量技术研究,化工原理精馏过程的计算机辅助计算,化工生产过程计算机仿真控制系统等。另一方面,一些学科会借用计算机学科中的理论方法,例如数学学科会在计算机程序算法的基础上进行进一步研究。同时,计算机学科自身也会对某些研究观点进行进一步研究分析,例如人工智能方向,需要心理学、语言学、人体工程学等方面的知识,在计算机程序算法方面,会引用大量数学学科研究成果。因此计算机学科的一些观点被引用的时间较长。计算机被引半衰期的增长,说明计算机学科的影响力在不断增强。

可以看出,计算机理论与方法(TP3-0)这个子学科的被引半衰期的变化较大,增长较快。计算机理论与方法中一些经典理论被长时间关注,例如计算机科学与技术方法、计算机系统理论、知识科学等。多媒体技术与多媒体计算机(TP37)这个子学科的被引半衰期增长幅度减缓。流媒体、多媒体图像技术和多媒体技术基础作为经典成果被长时间关注,与此同时,云计算技术作为新兴研究领域也成为热点。经典成果与新兴技术的文章同时被高频次引用,导致学科被引半衰期缓慢增长。

计算技术、计算机技术一般性问题(TP30),计算机软件(TP31),电子数字计算机(TP33),微型计算机(TP36)和计算机应用(TP39)这五个子学科的被引半衰期数值较为接近,增长幅度相似。同时发现这五个学科的增长趋势与计算机学科的被引增长趋势相似,这五个子学科被引频次总和占计算机学科被引频次的99.89%,几乎等于计算机学科的总被引频次(见表8)。因此,这五个子学科是计算机学科中的主要研究方向,其被引半衰期的变化趋势影响着整个计算机学科的半衰期趋势。

表8 2009~2012年计算机学科及其五大子学科被引频次数据统计

4.3 计算机学科引用半衰期与被引半衰期对比分析

学科引用半衰期和被引半衰期作为评价一个学科文献老化速度快慢的标准,存在着一定的差别。首先,两者的概念不同。学科引用半衰期指该学科引用本学科和其他领域文章的情况,学科被引半衰期指该学科文章被自身学科和其他学科的文献引用的情况。其次,两者的意义不同。引用半衰期表示学科对多长时间发表的文章感兴趣,引用半衰期长表示该学科对发表时间较长的文章感兴趣,这些文章一般研究观点成熟、经典,传统。相反,引用半衰期短说明学科对近期发表的文章感兴趣,这些文章中的观点大都较为新颖,有继续深入探索的潜力。被引半衰期指该学科内文章老化的速度即被利用的情况。被引半衰期较长,说明文章老化速度慢,利用时间长。反之,说明学科文章老化速度快,被自身和其他学科的利用时间短。

将计算机学科及其子学科2010~2012年三年的引用半衰期和被引半衰期进行比较(见表9)可以看出,计算机学科的引用半衰期相比被引半衰期年度变化而言较为稳定,被引半衰期呈现增长趋势,计算机学科的引用半衰期大于被引半衰期。大部分子学科引用半衰期长的时候,被引半衰期也很长。如果一个学科的研究领域范围只局限于自身学科,那么学科的引用半衰期和被引半衰期相等。在现实情况中,一个学科会关注其他学科的一些研究热点,同时,该学科的研究成果也会被其他领域研究应用。一般而言,学科引用半衰期变长,说明学科引用了早年发表的文献比重在加大。因此,学科的一些早年发表的文章的被引用频次也会增加,导致学科被引半衰期也会变长。虽然存在一些学科间的单引用情况,但是数量很少,一般不会影响数据的变化。因此,被引半衰期和引用半衰期存在着密切的关系。

表9 计算机学科及子学科2010~2012年引用与被引半衰期对比表

本研究中,引用文献数据包括图书、外文文献等数据资源,但是被引数据不包括学科中图书和外文的被引用数据。因而会产生引用半衰期和被引半衰期有差异的现象。一般而言,期刊论文或者学术论文的生命周期小于图书的生命周期。大多数论文在发表后的3~5年其被引频次会急剧减少,图书的生命周期较长,一般为8~10年,有些经典著作其被引半衰期会更长。这导致了学科引用半衰期比被引半衰期长。针对计算机学科,该学科主要关注其他学科中较为传统,相对成熟的研究成果,例如数学学科的研究成果。计算机作为应用型学科,其研究成果较为新颖,成果更新速度快,结合本实验数据引用和被引数据收集的特点以及计算机学科自身情况,导致计算机学科的引用半衰期长于被引半衰期。计算机学科的引用半衰期比较稳定,被引半衰期在不断增长,说明计算机学科的研究成果在其他领域的影响力在不断增强。

计算机学科的子学科中,大部分学科的引用半衰期长于被引半衰期。但是多媒体技术与多媒体计算机(TP37)这个学科引用半衰期短于被引半衰期。多媒体技术与多媒体计算机主要研究热点是多媒体数字内容的传播与展示和数字媒体技术。数字媒体技术为新兴专业和技术,近年来刚刚在国内发展起来,关注的研究热点更新速度快,因而引用半衰期较短。同时,多媒体技术的文章也被自身和其他学科领域广泛应用,例如教育、美术、心理学等学科,因此被引半衰期较长。

5 结语

本文通过分析CNKI数据库中计算机学科的相关数据,得出了计算机学科引用半衰期和被引半衰期的一些特点:从整体来说,计算机学科的引用半衰期相对稳定,引用半衰期三年平均值为4.76年;被引半衰期在不断增长,从被引用情况来看,计算技术、计算机技术一般性问题(TP30)、计算机软件(TP31)、电子数字计算机(TP33)、微型计算机(TP36)和计算机应用(TP39)这五个子学科的被引频次在计算机学科被引频次中占有很大比例;从被引半衰期年度变化来看,主要的子学科被引半衰期都在变长,这表明计算机作为一门应用性较强的学科,与其他学科学术交流较强,近年来学科自身影响力也在不断增强。

[1]王崇德.科技文献半衰期的计算[J].图书情报工作,1983,10(5):7-10.

[2]李玉珍,郭振平.科技文献半衰期的计算[J].延边大学学报(自然科学版),1997,23(4):74-76.

[3]张黄群.期刊被引半衰期与有关指标的相关性[J].学报编辑论丛,2011(6):114-116.

[4]罗式胜.文献半衰期的类型及其应用[J].情报学报,1997,16(1):63-68.

[5]罗式胜.期刊被引半衰期的概念及其应用[J].情报科学,1994,15(1):23-25.

[6]王春霞.计算机科学文献的老化速度[J].晋图学刊,2004(3):4-6.

[7]尚宁.2003~2007年28种计算机科学核心期刊的引文分析[J].科技情报开发与经济,2011,21(35):122-124.

[8]田晓明.《计算机学报》2000~2004年引文统计分析[J].情报探索,2005,11(6):24-25.

[9]郭玉,蔚海燕.我国计算机科学发展态势文献计量分析[J].计算机应用研究,2007,24(12):28-31.

Analysis on Discipline Half-life of Computer Science Based on CNKI

Half-life is a metric to measure literature obsolescence.It is also an important

tandard on measuring the development of a subject.The authors collect the data of computer science from CNKI and classified into several subdisciplines according to the standard of Chinese Library Classification.Through the analysis of the citation data of the computer,we can summarize the characters of literature obsolescence on computer science and take knowledge of the development of computer science.

computer science;discipline half-life;citation analysis;citing half-life;cited half-life

G250.252;T93

A

10.11968/tsygb.1003-6938.2015018

王丽雅(1991-),女,南京大学信息管理学院硕士研究生。

*本文系国家社科基金项目“以创新和质量为导向的哲学社会科学评价体系实证研究”(项目编号:12BTQ037)研究成果之一。

2015-01-20;责任编辑:刘全根

计算机科学子分类号为检索路径,获取CNKI数据库中计算机学科的发文及引用数据。通过计算机学科以及子学科的引用半衰期和被引半衰期计算与分析,总结计算机学科文献老化的特点,反映近年来计算机学科的发展情况。

猜你喜欢

半衰期期刊文献
Hostile takeovers in China and Japan
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
期刊审稿进度表
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
期刊审稿进度表
期刊审稿进度表
基于CNKI数据的历史学学科半衰期探究*
高中化学试题中的半衰期
基于文献计量学的我国化学学科半衰期分析