APP下载

Google学术计量中文期刊H5指数和H5中位数再评价研究

2016-12-15王全红王红

现代情报 2016年10期
关键词:评价

王全红+王红

〔摘要〕本文以2012年和2015年Google学术计量h指数排名前100名的中文期刊为来源数据库,通过R语言测评了Google学术计量h5指数,h5中位数和CNKI期刊h5指数,h5中位数的相关性,分析了2015年Google学术计量h指数的新变化,以了解Google和CNKI期刊h指数之间的差异和联系。统计结果表明:2015年版Google所有期刊h5指数和CNKI期刊h5指数呈线性相关,Google期刊h指数收录范围有所增加,但仍存在h指数值偏低,h指数值过于集中等问题。

〔关键词〕Google学术计量;中文期刊;h指数;CNKI;评价

〔Abstract〕In this study,the paper analyzed the correlation between Google Scholar Metrics(GSM)and CNKI Chinese Journal h index in 2015.The paper compared the new features between Google Scholar Metrics(GSM)and CNKI TOP 100 Chinese Journal h index.The statistical results showed that the Google h index increased and the scope of Google scholar has expanded.But for the same publication,most of the Google publications h indexes were still lower than CNKI publications h index.

〔Key words〕Google Scholar Metrics;chinese journal;h index;CNKI;evaluation

“基于Google Scholar Metrics中文期刊h指数的比较研究”一文以2012年Google Scholar Metrics(以下简称Google)期刊h5指数前100名的中文期刊为样本,比较了同一种期刊在Google和CNKI的期刊h5指数的不同。由于Google在2012年4月以后,每年不定期更新版本,迄今为止,已经公布了5版Google学术计量期刊h指数。本文作者在“基于Google Scholar Metrics中文期刊h指数的比较研究”一文基础上,重新计算了最新版第5版Google学术计量,CNKI期刊与影响因子的相关性,并进一步对Google学术计量h5中位数和CNKI期刊h5中位数进行了相关性评价,以了解Google期刊h指数在推出第五版后,与第一版相比是否在收录范围是否有了新的变化,力图为期刊h指数研究提供新的实证资料。

1相关文献回顾

随着2012年Google的推出,一些学者从不同角度对Google期刊指数的有效性和质量进行了评价。例如Jacso[2]分析Google Scholar Metrics的检索界面,包括浏览、检索、分组等功能。Jacso认为尽管Google Scholar Metrics简单易用,但是h5核心文献的排序功能较差,不利于查找h5核心文献。

Delgado-López-Cózar[3]比较了Google、JCR以及Scimago 3个期刊影响因子数据库的收录范围,检索功能,语种情况,更新时滞等。数据结果表明:Google的覆盖范围最广,其影响因子的统计不仅限于期刊,还包括会议和机构库,Google还覆盖了10个语种的期刊统计情况。在期刊h值评价上,Google和JCR影响因子以及SJR影响因子Spearman高度相关,因此Delgado-López-Cózar认为对于科研人员来说,Google是确定核心期刊非常有帮助的工具,随着Google的不断发展,未来Google将会是现有的期刊评价数据库JCR和SJR的竞争对手。

Repiso[4]借助于Web of Science和乌利希期刊指南数据库,比较了Google Scholar Metrics传媒类期刊的国别,在Web of Science的分区情况以及Google Scholar Metrics的排名情况,对Google Scholar Metrics的传媒类期刊的质量进行了梳理和评价。Orduna-Malea[5]分语种对Google Scholar Metrics的期刊h指数进行了评价。Orduna-Malea提出:Google Scholar Metrics在2012年4月推出后,随后在当年的12月又推出了新的版本,是Google自身数据质量有问题,抑或是其它原因?因此Orduna-Malea对Google 10个语种的期刊h指数最大值,最小值和平均值进行了统计,结果表明,由于不同语言期刊数量和更新时滞的不同,所以不同语言期刊h指数的增长速度不同,但是对于同一语言内部,期刊的排名顺序变化不太,因此Orduna-Malea得出结论认为Google期刊h指数的稳定性比较好。Leal[6]集中分析了2007-2011年Google Scholar Metrics中护理方面期刊h指数,并进行了百分位分区。

Martín-Martín通过分学科分析了Google 2012年第1版与2013年第3版h指数的变化情况,统计数据表明,Google除了将英文期刊的268个类目缩减到261个类目外,其它文献类型,语种,h指数数值的变化都保持了其连续性(Continuity),因此Martín-Martín认为Google Scholar的稳定性使得成为一个衡量期刊质量的稳定性工具(Stability Tool)。随后,Martín-Martín[8]发现了Google包含了大量的计算机方面的英文会议文献,因此Martín-Martín利用Google,对计算机英文会议影响力进行了分析排序。

以上文献尽管对Google分学科,分语种研究了其h指数变化情况,但是对于中文期刊内部h5指数和h5中位数的研究未有涉及,因此本文拟对Google Scholar Metrics 100种中文期刊的h指数在2012-2015年的情况进行统计分析,以了解其在评估期刊影响力方面的变化。

研究对象和数据来源

本文以Google h指数排名前100名的中文期刊为研究对象,以Google和CNKI作为数据源。

因为Google期刊h指数统计时间每年不定期更新1次,最新更新日期为2015年6月,跨度为2010年6月1日到2015年6月1日,为了便于Google和CNKI期刊h指数比较,本文选定上述这一时间段作为收集数据窗口。

研究目的

本文在2012年Google和CNKI期刊h指数数据的基础上,更新了2015年Google期刊h5指数和CNKI数据,并进一步下载了Google期刊h5中位数和CNKI期刊h5中位数数据,以回答以下3个问题:

(1)了解与2012年Google期刊h指数相比,2015年Google期刊h指数新的特点?

()测评2015年Google期刊h5指数和Google期刊h5中位数哪一个更适用于期刊质量评价?

(3)比较2015年Google期刊和CNKI收录范围和更新时滞的不同?

研究步骤

本文为实证研究,研究步骤如下:

3数据统计结果和分析

数据统计结果

通过对数据汇总,得到期刊h指数统计数据。笔者进一步利用R语言,对Google和CNKI收录的期刊h指数以及与影响因子进行相关分析,统计结果如下(见表1~9):

(1)在Google所有期刊h5排名中,h5指数前10位的期刊依次为:《经济研究》、《中华医院感染学杂志》、《中华护理杂志》、《电力系统自动化》、《电力系统自动化》、《会计研究》、《管理世界》、《中国社会科学》、《中国电机工程学报》、《农业工程学报》和《求是》。CNKI排名前10位的期刊依次为《经济研究》、《会计研究》、《中国电机工程学报》、《电力系统自动化》、《金融研究》、《管理世界》、《中国工业经济》、《中华护理杂志》、《中国社会科学》。二者排名差异不大。Google所有期刊h5中位数排名中,除《求是》杂志h5中位数排名较高,排在第二位,其它期刊h5中位数和h5指数排名一样。Google和CNKI期刊h5指数前10位的期刊为与2012年期刊排名相比,《中国高教研究》和《石油学报》跌出了排名。反映了经济,电力和医学方面期刊是一直是国内研究的热点,社会科学和基础科学的研究热度有所降低。

(2)通过计算Google和CNKI期刊“排名”差值显示,在所有学科期刊h5排名的平均排名差值为1929,与2012年2146的差值相比,整体差异不大。在所有期刊中,只有《经济研究》、《电力系统自动化》、《中国工业经济》、《价值工程》、《护理学报》这4种期刊的排名相同,《地理学报》、《临床麻醉学杂志》这2种期刊的排名相差1;《中国社会科学》、《解放军护理杂志》这2种期刊的排名相差2,其它期刊排名差异都比较大。排名差值最大的为《南开管理评论》(80),其次为《应用生态学报》(64);《中国图书馆学报》(49);《护理管理杂志》(43)。从学科内部来看,2012年Google和CNKI“排名”差值差异不大。但是在2015年,学科内部Google和CNKI期刊“排名”差异明显,这是由于Google期刊h5值跨度低,大量期刊存在相同h指数的现象,与此相比,CNKI的期刊主要是由于学科间引文规律不尽相同,h5值跨度比较高,导致了排名差异较大。对期刊h5中位数而言,所有学科期刊h5中位数排名平均排名差值为39375,差值最大的期刊为《地球与环境》(68),45种期刊h5中位数的排名差异都在20以上,反映了Google和CNKI期刊h5中位数排名相差较大。

(3)通过计算Google和CNKI期刊“h5指数”差值显示,差值最大的前5名期刊为《会计研究》(36),《中国电机工程学报》(28),《经济研究》(28),《南开管理评论》(24),《中国工业经济》(24),《金融研究》(24),《电力系统自动化》、《电工技术学报》(24),《电力系统自动化》(24)。在100种期刊中,《新华文摘》、《新华月报》、《中华流行病学杂志》、《中国实用护理杂志》在CNKI数据库中没有找到对应的h指数,除《地球与环境》、《中华医院感染学杂志》、《黑龙江科技信息》、《中国新技术新产品》4种期刊Google的h5指数大于CNKI的h5指数,《图书馆杂志》Google的h5指数等于CNKI的h5指数,其余91种期刊的Google的h5指数均都小于CNKI的h5指数。通过计算Google和CNKI期刊“h5中位数”差值显示,《地球与环境》、《中国新技术新产品》、《护理管理杂志》、《中国循证医学杂志》、《中国实用妇科与产科杂志》、《黑龙江科技信息》、《中华医院感染学杂志》、《中国实用外科杂志》这8种的Google期刊h5中位数大于CNKI,《高等工程教育研究》和《中国护理管理》两者h5中位数相等,其余86种期刊Google的h5中位数均都小于CNKI的h5中位数。尽管与2012年Google期刊h5指数相比,2015年Google期刊h5指数平均值提高了25%(从2 300提高到2 854),但是无论是h5指数还是h5中位数,90%的Google期刊h指数均仍低于CNKI期刊h指数。

(4)通过分析Google的h5指数和CNKI的h5指数相关性(见图),我们发现,所有期刊的Google的h5指数和CNKI的h5指数呈线性相关,p=0000<001,相关系数为0734953,Adjusted R-squared R square值为05353,与2012年Google的h5指数相关系数0285相比,2015年Google和CNKI期刊h5指数相关系数有了显著的提高。从学科来看,基础科学和工程科技类期刊的Google期刊h5指数和CNKI期刊h5指数不线性相关,经济学、医学和社会科学这4个学科的Google期刊h指数和CNKI的h指数线性指数都比较高,信息科技学科的相关指数最高。对于Google的h5中位数和CNKI的h5中位数相关性(见图3),所有期刊的Google的h5中位数和CNKI的h5中位数呈线性相关,相关系数为07234574。经济学科的相关系数最高,其次为信息科技学科,医学学科和社会科学,基础科学和工程科技类学科Google期刊h5中位数和CNKI期刊h5中位数不线性相关。

图所有期刊Google的h5指数和CNKI的h5指数相关性

(5)通过分析Google期刊h5指数,Google期刊h5中位数,CNKI期刊h5指数,CNKI期刊h5指数,h5中位数和影响因子相关性,我们发现,所有期刊的Google的h5指数和影响因子呈线性相关,p=0000<001,其中Google期刊h5指数相关系数为043,Google期刊h5中位数相关系数为042,尽管相关性不十分显著,但是与2012年相关系数0113相比,相关性有所提高。CNKI期刊h5指数和影响因子,CNKI期刊h5中位数和影响因子的相关系数分别为075和079,R square值分别为05647和06146。与2012年R square值为0431相比,相关性也有了显著提高。Google的期刊h指标统计过去五年的数据,体现期刊一段时间的影响力,影响因子统计期刊两年的数据,随着二者相关性的显著提高,这表明,Google期刊h指数和影响因子可以互为补充评价期刊影响力。

(1)收录范围有所增加,2015年Google中文资源不再仅限于2012年Google的两个中文资源合作伙伴:维普和万方两个出版商所收录的资源,增加了以下几个资源的收录和引用情况:

①增加了CNKI学位论文数据库的引用情况。例如,我们通过点击《南开管理评论》的h5核心论文发现,“女性参与高管团队对企业绩效的影响:基于中国民营企业的实证研究”一文的引用来源于发表在中国海洋大学的学位论文“企业CEO背景特征与技术研发支出的相关性分析”,点击“企业CEO背景特征与技术研发支出的相关性分析”,发现该文献来源于CNKI学位论文库。另外发表在《中国全科医学》的“基层卫生人才队伍的现状,问题与建议”一文的引用来自于CNKI学位论文库的“城乡一体化医疗保障成渝模式下城乡居民受益公平性分析”一文。

②增加了会议论文集数据库的收录和引用情况。这些论文集有来源于网上开放资源,也有来源于CNKI会议论文数据库。例如《地球与环境》Google期刊h指数高于CNKI指数,这是由于Google收录了《中国科学院地质与地球物理研究所学术论文汇编》。《中国科学院地质与地球物理研究所学术论文汇编》上的论文引用较高,造成了Google《地球与环境》期刊h指数远高于《地球与环境》CNKI指数。例如收录在《第六届(2011)中国管理学年会——技术与创新管理分会场论文集》的“网络位置、企业能力与知识权力——基于技术创新网络的分析”一文来源于CNKI会议论文库。发表在《创新驱动发展提高气象灾害防御能力——S7应对气候变化与农业气象防灾减灾》论文集的“贵州冻雨频发地区电线积冰的气候特征分析”一文也来源于CNKI会议论文库。

③增加了CNKI期刊论文数据库的引用情况。例如,发表在《情报杂志》上的论文“微博研究综述”一文的引用来自于CNKI期刊论文库“大微博的网络媒介批评机制及其构建”。发表在《中国全科医学》“不同剂量瑞舒伐他汀钙治疗老年冠心病合并高脂血症的疗效及安全性对比分析”的引证文献来源于CNKI期刊论文库“瑞舒伐他汀对老年冠心病患者血清中白细胞介素-10和-17的影响”一文。

④增加了来源于Google图书的引用情况。例如发表于《中国全科医学》上的一文“Antidepressant Drug Effects and Depression Severity”其中的两个引用来源于Google图书“Acceptance and commitment therapy:The process and practice of mindful change”和“The Folly of Fools:The Logic of Deceit and Self-Deception in Human Life”。

⑤增加了来源于其它外文学术数据库的引用情况。例如发表于《中国全科医学》上的一文“Antidepressant Drug Effects and Depression Severity”其中的两个引用“Pursuing happiness in everyday life:The characteristics and behaviors of online happiness seekers”来源于APA数据库,另一个引用“A review of empirically supported psychological therapies for mood disorders in adults”来源于Wiley数据库。发表在《科技管理研究》上的“产业结构变动对我国经济增长影响的实证分析”其中的一个引用来源于IEEE数据库“The causality between Chinas fiscal expenditure on science and technology and industrial structure rationalization:An empirical study”一文。由于Google中文基础科学和工程科技学科部分期刊收录了英文文献,这些英文文献引证文献来源于其它外文学术数据库,导致Google基础科学和工程科技学科期刊h5指数有高有低,造成了Google期刊和CNKI期刊h5指数不线性相关。

⑥增加了来源于其它开放存取网站的收录。Google曾在2012年Google Scholar Metrics发布时,对英文期刊收录范围做了简单介绍,其收录标准包括期刊论文,会议论文,以及来自arXiv,SSRN,NBER RePEC网站的预印本,排除了专利,图书和学位论文。然而我们发现发表于《中国全科医学》上“Is physical rehabilitation for older people in long-term care effective?”一文的引证文献不仅有来源于开放数据库Biomed Central的“Publisher main menuPredictors of attendance to group exercise:a cohort study of older adults in long-term care facilities”期刊论文,还包括来源于德国Karolinska Institutet研究所的学位论文“Individually tailored physical and daily activities for residents in nursing home settings:a Scandinavian multi-centre study”,来源于新加坡国立大学机构库的学位论文“Factors Associated With Rehabilitation Outcomes,Nursing Home Placement and Survival of Patients in Singapore Community Hospitals”以及来源于University College London的学位论文“Development and evaluation of a home-based exercise intervention for frail older people”。

⑦增加了来自其它语种机构库的引证文献。例如发表在《中国全科医学》“Safety of influenza vaccine administration in egg-allergic patients”的引证文献不仅包括来源于UPorto的葡萄牙语文献“Alergias Alimentares na Infncia:Monografia:Food Allergies in Childhood”以及J-STAGE机构库的日文文献“卵アレルギ一のあるへのインフルエンザワクチン接种に阌する保护者ア”ンケ一ト调查”,还包括了来源于Société canadienne de pédiatrie.的法语文献“Rentrer à la maison:faciliter le congé du nourrisson prématuré”。正是由于Google scholar增加了来自其它语种机构库的引证文献,使得几年间Google scholar期刊h5指数不仅有了显著提高,而且Google scholar期刊h5中位数也有了显著的提高。

()收录的学科数量也有变化(见图4)。从图4数据来看,2015年Google排名前100名的期刊中基础科学和工程学科的收录期刊有所减少,《广东气象》、《光学精密工程》、《中国土地科学》、《地震地质》、《第四纪研究》这些基础科学研究期刊没能进入排行榜。信息科技学科收录的期刊增加最多。2015年版信息科技学科一批刊文量较大,引用率较高的期刊,如《电力系统保护与控制》、《图书馆学研究》、《情报杂志》、《电工技术学报》、《高电压技术》进入了排行榜。由于期刊h指数统计兼顾载文量和引文量,并且和学科引证习惯有着密切的关系,基础和工程类期刊进入Google排行榜的数量减少,这也印证了Harzing的研究结果[9]:信息和社会类学科的即时引证率高,基础科学学科的即时引证率低,造成了基础科学类期刊的h指数偏低。因此跨学科比较期刊h指数对于即时引证率低的学科期刊有失公允。

图4Google第1版和第5版收录学科数量对比

(3)与2012年第1版相比,2015年第5版的各个学科h5指数最小值和h5指数最大值都有了显著提高(见图5),各个学科h指数提高的幅度相差不大。这一统计结果也与Martín-Martín统计的Google历年各个语种期刊h指数变化结果相一致:中文期刊h5指数值近年来一直保持稳定增长。正如Martín-Martín所言,正是由于Google期刊h指数具有较好的通用性和稳定性,使得Google期刊h指数对期刊质量测度和影响力衡量标准及其体系产生了深刻的影响。

图5Google第1版和第5版h5指数最大最小值对比

Google期刊h5指数和h5中位数哪一个更适用于期刊质量评价?

(1)对于所有期刊Google期刊h5指数和h5中位数都和CNKI期刊h指数线性相关,相关系数分别为073和072。Google期刊h5指数,h5中位数和影响因子的相关系数分别为043和042,二者也相差不大。对于不同学科来说,除了经济学科和社会科学两个学科的Google期刊h5中位数与CNKI的相关系数略高于Google期刊h5指数外,其它学科Google期刊h5中位数与CNKI的相关系数均略低于Google期刊h5指数,但是二者的差别也不大,因此Google期刊h5指数和h5中位数均可用于期刊质量评价。

()从h值分布来看,与Google期刊h5指数相比,Google期刊h5中位数的h值极差相差更大,Google期刊h指数的分布区间为[,57],跨度范围是34,与此相比,CNKI期刊h指数的分布区间为[36,88],跨度范围是45,并且Google期刊h5中位数中,数值相同的比例远低于Google期刊h5指数,由于h5中位数具有良好的区分度,因此Google期刊h5中位数更适用于期刊质量评价。

32015年Google期刊h指数与CNKI期刊h指数数据的收录范围和更新时滞的比较?

首先,两个数据库收录的学科范围大致相同,Google与CNKI收录的期刊种类有重叠,但由于Google主要合作伙伴包括维普和万方两个数据库,维普数据库收录了很多独家期刊,CNKI也收录了很多独家期刊,因此,二者收录范围并不完全同质化,例如,发表在《黑龙江科技信息》上的“浅谈变电运行的安全管理及故障排除”被期刊《大科技》上的“论变电运行管理的重要性” 以及期刊《科技与生活》上“变电运行中的隐患及措施分析”一文引用,由于《大科技》和《科技与生活》是维普独家期刊,CNKI没有收录,因此造成了这一期刊Google的期刊h指数数值略高于CNKI。另外尽管2015年Google期刊h指数统计扩大了收录范围,但是由于Google只收录了一部分CNKI学位论文和会议论文,造成了Google的期刊h指数较低。例如《一次局地大暴雨的落区分析与预报》一文的引证文献,在CNKI数据库h指数统计中包括了6篇CNKI会议论文数据库,但是Google期刊h指数统计的引证文献只包括其中的一篇会议论文,导致这一期刊的Google期刊h指数数值低于CNKI。另外由于“在数据处理效率、数据处理质量上总体中国知网优于维普和万方”[0],因此2015年版Google期刊更新时滞整体上仍然慢于CNKI,这是Google期刊h指数低于CNKI期刊h指数的另一个原因。

4结语

任何一个计量指标都不可能完美,尽管Google期刊指数可以快速评估学术出版物中的知名度和影响力,h指数为传统的文献计算学研究和科技评价指标提供了一种新的视野。

但由于h指数统计受到学科,期刊发文等因素影响,Google仅靠期刊h指数一个计量指标来评价不同学科期刊质量,显然对发文量低,但引用较高的期刊有失偏颇。例如对图书情报学科来说,《图书馆学研究》在Google期刊排行榜中排在70位,但是影响因子较高,引用也较高的《情报学报》没有进入Google榜单。因此Google期刊h指数不利于评价发文低的期刊文献,如果Google期刊h指数能够配合其它计量指数,例如篇均被引次数或者学科期刊引用百分位来校正,Google期刊h指数无疑会成为其它期刊影响力指标的有力竞争对手]。

参考文献

杨毓丽,陈陶,张苏.Google Scholar Metrics中文期刊H指数评价研究[J].情报杂志,2013,(4):68-72.

[2]Jacsó P.Google Scholar Metrics for Publications[J].Online Information Review,2013,36(4):604-619.

[3]Delgado-López-Cózar E,álvaro CABEZAS-CLAVIJO.Ranking journals:could Google Scholar Metrics be an alternative to Journal Citation Reports and Scimago Journal Rank?[J].Learned Publishing,2013,26(2):101-114.

[4]Repiso R,Lopez-Cozar E D.H Index Communication Journals according to Google Scholar Metrics(2009-2013)[J].EC3metrics,2014,10(7):9-18.

[5]Ordua-Malea E,López-Cózar E D.Google Scholar Metrics evolution:an analysis according to languages[J].Scientometrics,2014,98(3):2353-2367.

[6]Leal L M R,Repiso R,Lopezcozar E D.H Index of scientific Nursing journals according to Google Scholar Metrics(2007-2011)[J].EC3 Reports,2013,5(7):1-9.

猜你喜欢

评价
SBR改性沥青的稳定性评价
中药治疗室性早搏系统评价再评价
自制C肽质控品及其性能评价
写作交流与评价:词的欣赏
基于Moodle的学习评价
关于项目后评价中“专项”后评价的探讨
HBV-DNA提取液I的配制和应用评价
有效评价让每朵花儿都绽放
模糊数学评价法在水质评价中的应用
保加利亚转轨20年评价