APP下载

医学类期刊影响因子与影响力指标的相关性研究
——基于主成分与分位数回归分析

2020-08-18韩曦英侯力铁孙健

世界最新医学信息文摘 2020年60期
关键词:医学类位数影响力

韩曦英,侯力铁,孙健*

(1.长春中医药大学医药信息学院,吉林 长春;2.长春中医药大学图书馆,吉林 长春)

0 引言

学术期刊影响力是体现期刊学术价值的指标之一,它指的是期刊内刊载文献在特定的时期内促进相关学术研究与应用发展的能力。期刊学术影响力首先受刊载文献学术价值与应用价值的直接影响;其次与科研人员的主观认知水平与信息素养有关;再次,期刊本身的传播途径、扩散能力等因素也会影响学术期刊的影响力;在特定时期内的社会因素、政策制度因素等,也是影响学术期刊影响力的因素。2013 年,中国科学文献计量评价研究中心首次提出了一种综合评价学术期刊影响力的方法,并应用于“中国最具国际影响力学术期刊”遴选。随着“中国科技期刊国际影响力提升计划”的实施,我国英文科技期刊的国际影响力有明显提高,但影响因子、总被引频次等计量指标在对该计划实施的绩效评价中饱受争议[1]。

期刊的影响因子(Impact factor,IF),是现阶段评价学术期刊影响力的主要指标,它是某刊在某年被全部源刊物引证该刊前两年发表论文的次数与该刊前两年所发表的全部源论文数之比。不同领域、不同学科的期刊影响因子也存在较大差异[2]。而且根据现行的计算方法,期刊的被引频次与其对科研活动的真实学术贡献程度相比,存在较大差异;时效性对期刊影响力的作用也没有体现,因此胡健飞[3]等提出了基于学术贡献值及被引分布均值的期刊影响力量化修正新解。

基于期刊影响力与影响因子关系的不确定性,笔者采用相关分析、主成分分析和分位数回归的方法,利用文献计量的相关指标,重塑了期刊影响力与影响因子之间的关系,为优化期刊影响力评价体系提供了基础。

1 文献综述

各种评价期刊影响力的不同指标之间的相关关系一直是学者们研究的热点,并且随着科学计量方法与情报学的结合越来越广泛,文献计量研究越来越全面、客观。董敏红[4]、安梅[5]、苏杨[6]、周建[7]等分别利用统计学中主成分分析的方法分析了各种期刊的影响力指标间的关系及其与对期刊影响力的关系。俞立平[8]、薛庆根[9]等利用分位数回归的方法对不同种类期刊的影响力指标进行了分析。但是期刊的各个影响力指标之间的相关关系不同,又存在着信息的交叠,不同影响因子期刊的IF 与影响力指标的关系也不尽相同,单用一种方法并不能全面的分析IF与影响力因子之间的关系。因此,笔者基于实证数据,采用多种多元统计分析的方法,利用不同的维度分析北大核心医学类期刊影响因子与各种影响力指标之间的相关关系。

表2 北大核心医学类期刊影响因子与影响力指标因子的相关系数及显著性

2 研究方案设计

2.1 数据来源

本文数据来自于2016 版《中国科技期刊引证报告》自然科学卷核心版,为了全面、准确、公正、客观的评价期刊,《中国科技期刊引证报告》核心版结合中国期刊实际情况选用了期刊的几种影响力指标:总被引频次、即年指标、他引率、引用刊数、扩散因子、权威因子、被引半衰期等多种指标,根据不同的权重系数对期刊进行综合评价。

由于医学类期刊相对专业性较强、期刊数量较大、传播较广,且北大核心收录的医学类期刊学术水平较高,代表性强。因此,本文选取了北大核心收录的216 种医学类期刊作为研究对象,并对其中的影响因子和各种影响力指标进行分析。

2.2 研究方法

主成分分析是通过正交变换将一组可能存在相关性(信息有一定的重叠)的变量转换为一组线性不相关的变量(主成分)。也就是用几个较少的综合标量尽可能多地反应原来变量的信息,是一种降维的方法。

单从定义看,期刊的各个影响力指标之间是有着相关关系的,即在刻画期刊的影响力方面,影响力指标之间是有信息的重叠的。因此利用统计学的相关分析量化期刊影响力指标的相关关系,同时在明确相关关系存在的基础上利用主成分分析(principal component analysis,PCA)对期刊的影响力指标进行整合,旨在尽可能保留原始变量信息的同时,将信息重叠的变量删去。

分位数回归(quantile regression)由Koenker 和Bassett 在1978 年提出,其通过取0~100%的任意分位数,调节回归平面的位置和转向,确定自变量与不同分位数的因变量之间的线性关系[10]。求解目标函数得到模型的参数估计为

其中ρτ(u)为检查函数,,I(z)为示性函数。与普通的线性回归相比,通过分位数的调节,分位数回归既能在一定程度上代表所有数据的信息,也可以侧重于特定区域的数据,且对数据没有正态性的要求。因此利用分位数回归分析影响力指标与期刊影响因子的关系可以全面明确各个层次的期刊的影响因子与影响力指标的关系。

本文数据采用R 程序R i386 3.4.2 进行分析。

3 研究过程及结果分析

本文选取的北大核心收录的216 种医学类期刊的影响因子和影响力指标的基本情况如表1。

表1 北核医学类期刊影响因子及影响力指标统计描述

由于期刊的影响因子和影响力指标数据并不服从正态分布,因此采用spearman 系数描述各个指标之间的相关关系。

Spearman 相关分析表明,从平均程度上看期刊影响因子与影响力指标中的他引率、开放因子与期刊的影响因子之间关系并不显著(P>0.05),与其他的影响力指标都有显著的相关性(P<0.05)。而影响力指标之间,总被引频次与即年指标、引用刊数、扩散因子、权威因子之间,即年指标与引用刊数、扩散因子、权威因子之间,他引率与引用刊数、开放因子、扩散因子、被引半衰期之间,引用刊数与开放因子、扩散因子、权威因子之间,开放因子与扩散因子之间,扩散因子与权威因子之间存在着显著的相关性(P<0.05)。

鉴于期刊的部分影响力指标之间有着显著的相关性,存在着信息的重叠,应用主成分分析的方法在保留原始信息的同时对期刊的影响力指标进行筛选。结合特征值>1 和累计贡献率>85%即保留原始变量信息超过85%以上的原则,保留了四个影响力指标的主成分。

表3 期刊影响力指标的主成分

表4 分位数回归结果

图1 在各个百分位数与期刊影响因子有显著相关关系的影响力指标

主成分的表达式为:

主成分1=0.970 总被引频次+0.332 即年指标+0.089他引率+0.786 引用刊数+0.142 开放因子-0.664 扩散因子+0.971 权威因子-0.060 被引半衰期

主成分2=-0.057 总被引频次-0.227 即年指标+0.800他引率+0.502 引用刊数+0.911 开放因子+0.604 扩散因子-0.053 权威因子+0.192 被引半衰期

主成分3=0.023 总被引频次+0.219 即年指标+0.236他引率-0.169 引用刊数-0.183 开放因子+0.028 权威因子+0.939 被引半衰期

主成分4=-0.147 总被引频次+0.887 即年指标+0.000他引率+0.006 引用刊数+0.187 开放因子+0.070 权威因子-0.150 权威因子-0.153 被引半衰期

主成分分析结果表明总被引频次和权威因子构成第一主成分;他引率和开放因子构成第二主成分;被引半衰期构成第三主成分;即年指标构成第四主成分。北核医学类期刊的八项影响力指标中的信息主要由其中的总被引频次、即年指标、他引率、开放因子、权威因子、被引半衰期来表达,信息覆盖达到90.260%。

北核医学类期刊2015 年的影响因子的范围为0.237~12.940,跨度较大。可以预见影响因子不同的杂志,其与影响力指标之间的关系也有不同,仅仅针对影响因子的平均数进行分析并不全面。选取不同的分位数进行期刊影响因子与主要的期刊影响力指标见的分位数回归分析。分析结果见表4。

分位数回归分析表明,期刊影响因子相对极低(百分位数=5%)和较低的(百分位数=25%)北核医学类期刊,其期刊影响因子与即年指标之间有显著(P0.05)或极显著的(P<0.01)相关关系;期刊影响因子处于中位的( 百分位数=50%) 的北核医学类期刊,其期刊影响因子与即年指标、开放因子有极显著的相关关系(P<0.01),与被引半衰期有显著的相关关系(P<0.05);期刊影响因子较高的(百分位数=75%)的北核医学类期刊,其期刊影响因子与即年指标有极显著的相关关系(P<0.01),与被引半衰期有显著的相关关系(P<0.05);期刊影响因子相对极高的(百分位数=95%)的北核医学类期刊,其期刊影响因子与即年指标之间有极显著的相关关系(P<0.01)。可见不同百分位数影响因子的期刊,与其影响因子显著相关的影响力指标并不全相同。

4 结论

4.1 影响因子与影响力指标之间的相关分析有助于期刊评价指标的选取

北大核心医学类期刊影响力指标中为总被引频次、即年指标、他引率、开放因子、权威因子、被引半衰期为最主要的指标,在综合刻画期刊影响力时应给予较高的权重。不同分位数的影响因子的北核医学类期刊,其有显著相关关系的影响力指标也不尽相同,在综合评价期刊影响力时应分层次研究分析。

4.2 多元统计分析的方法有助于从多角度、全面、定量地分析期刊评价指标

主成分分析在明确期刊影响因子、多种影响力指标之间有显著的相关关系的前提下,能够在保留绝大多数原始信息的同时,甄选出期刊影响力指标的主要成分。分位数回归分析有利于详细分析影响因子处于不同层次的期刊的影响因素的特点,较普通的以期刊影响因子均数为应变量的多元回归分析更能全面分析与期刊影响因子有显著相关关系的与影响力指标。因此在对期刊影响力做定量分析时,宜采用多种统计分析方法综合分析。但是不同种类的期刊分析方法和结果不尽相同。

作者贡献说明:韩曦英:设计并实施了研究的框架和方法,处理了数据,写作了论文;侯力铁:修正了论文的方向和框架;修改了论文。

猜你喜欢

医学类位数影响力
医疗体育功能在医学类专业体育教学中的应用
基于大数据医学类网络教学资源平台建设探析
——以莆田学院继续教育学院为例
医学类普通高校创业教育课程体系构建研究
比较小数的大小
强化医学类本科生管理制度的背景分析及设想
《两位数除以一位数笔算除法》教学设计
天才影响力
黄艳:最深远的影响力
比大小有窍门
3.15消协三十年十大影响力事件