APP下载

基于灰色关联度分析的 “五计学” 融合发展研究

2020-11-28邱均平宋晓青杭州电子科技大学中国科教评价研究院管理学院

图书馆理论与实践 2020年6期
关键词:计量学关联度灰色

邱均平,宋晓青,b (杭州电子科技大学.中国科教评价研究院,b.管理学院)

随着邱均平教授主持的《我国 “五计学” 融合与图书情报学的方法创新研究》 项目获得批准,以及近几年 “五计学” 相继在相关重要国际会议中的广泛出现,表明 “五计学” 已经得到国内外专家的认可。同时也标志着计量学科这五个较有影响力的重要学科已经形成了一个相对完善且逻辑清晰的体系结构。[1]“五计学” 是继 “三计学” 后,知识计量以及情报学领域发展的新阶段。毫无疑问,“五计学” 的研究对象和研究内容虽然有所不同,但是它们之间都有着千丝万缕的联系。无论是 “三计学” 还是 “五计学” 都是以 “文献计量学” 为起点展开研究的,[2]本文以此为出发点,通过对Web of Science 数据库的相关数据进行聚类和整理,然后进行 “五计学” 关联度分析,探究它们之间的内在联系,以期为 “五计学” 的相关研究提供一定的参考。

1 “五计学” 简述

由于科学技术的快速发展,计量学领域的研究已经由先前的 “三计学” 开始转向 “五计学” 这一新阶段。在第16 届ISSI 大会上 “Five Metrics” 的首次出现标志着 “五计学” 体系的正式确立。[3]“五计学” 主要包含文献计量学、科学计量学、信息计量学、网络计量学、知识计量学五个学科。它是在文献计量学的基础发展起来的,其研究对象也由最初传统的纸质文献资源扩展到科学活动、信息、网络数据、知识等,从而促进了网络计量学、知识计量学等学科的发展。“五计学” 是一个既有联系又存在区别的庞大学科体系,如各学科的研究对象和研究内容都有所不同,但是其研究方法都有定量分析的共同特征。[4]各学科在进行交叉融合的同时又会保持学科的独立创新性是“五计学” 发展的必然趋势。

灰色关联度分析法作为一种多因素统计分析方法,是根据因素之间的发展趋势和内在联系来衡量并分析因素之间的关联性强弱。灰色系统的概念最早由我国控制科学与工程领域的邓聚龙教授提出,灰色系统介于白色系统和黑色系统之间,我们对该系统了解并不全面,仅限于了解部分信息。[5]鉴于我们对 “五计学” 融合发展过程中的信息并非完全知悉,但是又比较了解 “五计学” 现阶段的研究情况,因此采用灰色系统理论进行 “五计学” 的融合发展研究是比较符合实际的。并且灰色关联度分析法适用于对时间序列数据的分析,因而文章采用此方法对 “五计学” 的融合发展进行关联度分析,不仅契合性较强,还具有一定的创新性。

2 “五计学” 的灰色关联分析

2.1 数据的获取

本文以Web of Science 数据库的核心数据集为来源,检索范围为2010 — 2019 年,为了保障数据的完整性,在进行相关学科数据的检索时也要包含每个学科涉及的主要内容和经典理论。如,对文献计量学检索时要包括洛特卡定律、奇普夫定律和布拉德福定律,即采用主题为 “Bibliometrics” or “Science Author Distribution law” or “ Zipf’s Law” or “ Law of Bradford” 进行检索。同样的,以 “Scientometrics” or “Scientific Evaluation” or “Scientific Activities” 为主题对科学计量学进行检索,以主题为 “Informetrics” or “Information Retrieval” or “Information Management” 对 信 息 计 量 学进 行 检 索, 以“ Webometrics” or “ Cited-sites” or“Web Impact Factors” or “Sitation Analysis” 为主题对网络计量学进行检索。由于知识计量学是在国内确立和发展起来的,在国外的相关文献资料中只能找到较少的文章,但是知识计量学的理念和思想早已体现,在这里对知识计量学进行检索时借鉴宋艳辉老师采用的检索方法,[6]以主题为 “Knowledge Unit” or “Knowledge Domain” or “ Knowledge Visualization” or “ Knowledge Measure” or “Knowledge Evaluation” 进行检索。检索的数据涉及到很多个相关性较小的学科领域,因此在Web of Science 核心合集检索结果的聚类分析中选取“Information Science Library Science”(信息科学与图书馆学) 类别中的数据,从而保障数据的有效性和可行性。经过聚类整理后的近十年数据如下表所示。

表 Web of Science 核心数据库中近十年 “五计学” 各学科的发文量

2.2 “五计学” 的灰色关联度计算步骤及实现

2.2.1 确立参考数列和比较数列

在对多个因素进行灰色关联分析之前要确立参考数列和比较数列。参考数列也称为母数列,即能反映系统特征行为的数据序列。由于国内外对文献计量学的研究较早,而且它也是 “五计学” 的起点,故选用文献计量学的数据作为参考序列,科学计量学、信息计量学、网络计量学和知识计量学的数据都作为比较序列。

2.2.2 数据归一化处理

从上表可以看出,由于 “五计学” 各学科出现时间以及研究对象的不同导致了各学科领域发文量存在很大差异。数据的归一化就是将所有数据统一归纳到一定的近似范围内,从而减少数据差异性对计算结果产生的影响。在进行数据归一化处理时常用的方法有均值化、初值化、倍数变换、区间化等。由于 “五计学” 各个学科发文量数据序列的量级差别不大,采用初值化方法对数据进行归一化处理,公式如下。

其中m 是比较数列的个数,n 为各个因素的数据维度,当i=0 时表示参考数列。采用初值化方法,通过让原始数据除以初值就能将所有数据都整理到较近的数值范围附近,从而实现对原始数据的归一化处理且不改变数据序列的变化趋势。“五计学” 各学科发文量经过归一化处理后如图1 所示。

图1 归一化处理之后的数据

2.2.3 计算灰色关联系数

灰色关联系数实质上是参考数列和每个比较数列在各个对应时间节点上的关联性,灰色关联系数越大,表示该比较数列和参考数列的关联性越强,关联系数的计算公式如下。

其中Δ(min)=minimink|x0(k)-xi(k)|,表示两级最小差,Δ(max)=maximaxk|x0(k)-xi(k)|,表示两级最大差;ρ 是一个可调节的分辨系数,取值范围在(0-1),通常情况下取ρ=0.5 比较合适。[7]

从上述公式中可以发现,关联系数是参考数列和比较数列在各个时间维度上对应的关联程度值,因此关联系数的个数和每个因素的维度一致,数量较多且比较分散。为了便于进行整体性比较,通过计算关联系数的平均值可以很好的将各个时间节点的关联系数集中到一起,从而有效地反应各个比较数列和参考数列之间关联程度的强弱,即灰色关联度。在这里用βi

将归一化处理之后的数据代入到关联系数的公式中,求得四个比较数列(科学计量学、信息计量学、网络计量学、知识计量学的论文发表量) 与参考数列(文献计量学的论文发表量) 在各个时间点的关联系数如图2 所示。

借助于MATLAB 软件得出四个比较数列与参考数列的灰色关联度分别为: 0.8959、 0.8177、 0.6230、0.8316,关联度都大于0.5,说明参考数列和四个比较数列都有较强的关联性。由灰色关联度的概念可知,关联度越接近于1 说明关联性越好,根据关联度大小依次排序为:科学计量学、知识计量学、信息计量学、网络计量学。

图2 科学/ 信息/ 网络/ 知识计量学与文献计量学的灰色关联性

3 结果分析

3.1 文献计量学、科学计量学夯实 “五计学” 发展的理论基础

科学计量学和文献计量学的灰色关联度为0.8959。这两门学科几乎是在同一时期发展衍变而成的,除了研究目的有较大差异外,在早期的研究中两者实际上并没有太大的本质区别,其研究对象和研究方法都有很多相同之处。因此在前期的研究中很多学者都是将文献计量学和科学计量学同义使用,较少去深究两者的界限,[8]直到布劳温等人在对科学计量学的深入研究中才逐渐把两者区分开来。文献计量学和科学计量学经过多年的发展已经相当成熟,两者对相关学科领域共同产生的影响是巨大的。无论是从近十年的论文发表量还是从两者的灰色关联度来看,这两门学科仍是学术界研究的热点,并且正在积极推动着 “五计学” 的发展趋势。文献计量学侧重于对科技文献、科研产出等进行定量化研究,而科学计量学属于科学的研究领域,[9]主要以社会环境为背景,注重于科学体系或科学活动的定量化研究,这就超出了文献计量学的研究范畴,因此两者都存在一定的局限性。两门学科在融合发展的基础上不仅会加大理论创新,而且还会根据当下的时代背景去开拓新的实质性研究领域。如,科学计量学可以借助于前沿计算机技术来提升自身学科领域中的研究方法或扩充科学计量学的研究范畴,这都将为 “五计学” 的发展提供新的研究思路和理论支撑。

3.2 信息计量学为 “五计学” 的交叉融合提供依据

信息计量学和文献计量学的灰色关联度为0.8177,两者的关联性可见一斑。这也恰恰诠释了“三计学” 由早期的相互独立的研究状态转变为现阶段与情报学、图书馆学等学科深度融合的研究趋势,对各学科领域的发展起到了积极推动作用。信息计量学早期也被称为情报计量学,在最初的研究中它是被笼统的隐藏在文献计量学和科学计量学中的,[10]直到1979 年信息计量学的概念被昂托纳克剥离出来。随后于1987 年在英国信息科学家布鲁克斯(Brookes) 的提议下,信息计量学才正式成为学术界认定的专业术语,这也为信息计量学的后期发展奠定了坚实的基础。作为科技发展和信息化手段的产物,信息计量学是“三计学” 中最复杂的一门学科,它的理论、方法和应用都得益于文献计量学和科学计量学,但是其研究对象、研究方法以及研究范围又都远远超出前两者。[11]简而言之,文献计量学和科学计量学都是依靠信息的载体或信息的传递来进行研究的,因此两者研究的内容和研究成果自然属于信息计量学的范畴。从信息计量学的发展历程来看,它依靠文献计量学的基础使得“三计学” 的交叉融合研究达到了一个高峰期并走向成熟,在信息计量学庞大的结构框架下,“三计学” 的整合研究也得以实现,这也将为 “五计学” 未来的合流趋势和融合发展提供丰富的研究依据。

3.3 网络计量学促使 “五计学” 互联互通

网络计量学和文献计量学的灰色关联度为0.6230,单从关联度大小来看两者有较强的关联性,但与其他学科相比,其关联度显得相对弱一些,这和网络计量学的研究背景是密不可分的。其实很多学者认为网络计量学是由信息计量学衍生出的一门学科,但是由于信息计量学的范围比较广泛,网络计量学实质上还是对文献信息的计量,[12]特别是随着无纸化时代的来临,书刊等纸质文献的文本信息都能在网上找到,因此赵丹认为网络计量学的概念从一提出就与文献计量学有非常密切的关系。[13]现阶段网络计量学已经与数据挖掘、人工智能等一些深度学习算法技术相结合,促进了一部分高效分析工具及分析软件的开发和应用。这不仅使得网络计量学朝着智能化方向迈进,而且对 “五计学” 的智能化发展也起到积极的推动作用。网络计量学的一些信息化和智能化手段为 “五计学” 的深入研究提供了有效的工具和方法,这促使了各学科之间的内部交流与资源共享。[14]网络计量学的未来发展必须要借鉴并依附于文献计量学和科学计量学的理论方法,知识计量学和信息计量学同样可以借助网络计量学的工具获得较大规模和高质量的数据源。因此,网络计量学的智能化发展不仅提高了自身的便捷性和高效化,而且还加快了 “五计学” 的互联互通。

3.4 知识计量学推动 “五计学” 的革新

知识计量学与文献计量学的灰色关联度为0.8316,关联性仅次于科学计量学。顾名思义,知识计量学是以知识为研究对象,而文献计量学的研究对象是图书、期刊等文献,文献的内容本身就是知识的表现形式,因此在对文献计量学进行研究的同时,也正在对知识进行计量,[15]知识计量学和文献计量学的关系可见一斑。虽然早期人们并没有提出知识计量学的概念,但当时国内外已经开始对其相关理念和思想展开研究。作为 “五计学” 中唯一被国内学者提出并确立的学科,知识计量学更是我国相关学者在情报学以及信息计量等学科领域取得的里程碑成果。[16]作为“五计学” 中的前沿学科,知识计量学不同于其他已经发展成熟的学科,它涉及的范围较广,但还是一个新颖的学科,无论是对知识计量学的相关理论研究还是技术方面的应用研究,这都将成为近几年的研究热潮。邱均平、宋艳辉[17]、王立良[12]等认为知识计量学是在 “四计学”(文献计量学、科学计量学、信息计量学、网络计量学) 的基础上发展而来的,因此笔者认为在相关的研究中,专家和学者们对知识计量学一些创新性的观点必然会融入到 “五计学” 中,这将使得 “五计学” 的相关理念和思想得以革新,从而推动 “五计学” 进入时代发展的崭新阶段。

4 总结

本文以 “五计学” 的起源学科——文献计量学作为参考数列,对 “五计学” 进行了关联度分析,通过MATLAB 软件计算出文献计量学与科学计量学、信息计量学、网络计量学和知识计量学的关联度大小依次为0.8959、0.8177、0.6230、0.8316。虽然各学科侧重点和出发点存在一定差异,但是 “五计学” 的交叉融合是必然趋势,在 “五计学” 融合发展的过程中各学科都将扮演不同的角色,因此文章重点参照关联性的强弱探究了文献计量学和其他学科之间的内在联系,并对它们的作用进行了重新定位和深入研究。研究表明:文献计量学和科学计量学是 “五计学” 中发展相对成熟的学科,它们将继续夯实 “五计学” 的理论基础,是其未来发展的重要基石;信息计量学是一门比较复杂的学科,它使得 “三计学” 的交叉融合研究达到了一个高峰,并将为 “五计学” 的融合发展研究提供一定的经验和依据;网络计量学的信息化和智能化手段加快了各学科的内部交流,将促进 “五计学” 的互联互通;知识计量学作为 “五计学” 中的前沿学科,一些理论方法和技术应用的创新将会围绕着它相继被提出,这些创新性研究自然会推动 “五计学” 的革新。

猜你喜欢

计量学关联度灰色
基于熵值法与灰色关联度分析法的羽毛球技战术综合评价分析
基于熵权法改进的TOPSIS法和灰色关联度分析的压榨脱水过程优化研究
基于Web of Science数据库的老年综合评估文献计量学分析
浅灰色的小猪
中国制造业产业关联度分析
中国制造业产业关联度分析
灰色时代
她、它的灰色时髦观
我国有氧踏板操研究的文献计量学分析
谢文骏与刘翔110m栏分段成绩与总成绩的灰色关联度对比分析