APP下载

我国图情学科学术创新性研究
——基于2009-2019年国内外图情研究主题分析

2022-09-01梁珠芳

图书馆研究 2022年4期
关键词:图情重合创新性

梁珠芳

(桂林理工大学图书馆,广西 桂林 541004)

1 引言

学科学术创新主要体现在论文成果发表方面,其学术创新能力表现在:“一是在开拓研究领域方面是否具有创新性;二是在使用研究方法方面是否具有创新性;三是在运用论证资料方面是否具有创新性;四是在阐述观点或理论方面是否具有创新性”[1]。创新贯穿于人类社会生产实践活动的各个方面。创新是学科发展的不竭动力,学科的学术研究极大地促进了学科领域的发展。学术创新是一个过程,也是一种结果,学术创新需要与时俱进。目前与学术创新、学术创新力相关的研究较多,但直接与学科学术创新性相关的文献比较少。本文在进行文献综述时,不仅参考了学术创新、学术创新力相关的文献,还参考了与学术创新性相似的学术影响以及跨学科学术创新性等方面的文献。

不同时代背景下,每个研究领域都会有不同的研究主题。本文运用文献计量学方法和工具对2009-2019年国内外图情学科研究论文进行分析,分析国内外图情学科研究主题,深入了解我国图情学科的学术创新性,以期为我国图情学科学术创新性提高提供指导。

2 学科学术创新性研究概述

在学术创新性研究中,人们提出了一些指标来量化学科学术成果的创新程度。沈律[2]基于关键词词频定义学科学术科技创新的两大重要指标体系:科技成果重复率和科技成果引用率。在其评价指标中,科技成果的重复率越小,则其创新程度越大,引用率越大则其创新的程度越大。沈阳[3]基于关键词创新度量化文档创新度,认为关键词的频率越低,时间跨度越短,则关键词的创新度越高。杨建林等[4]基于关键词的词频定义学科学术科技成果的重复率和引文率,用来量化学科科技成果的创新性,提出KPTIDF方法用于评估学科学术论文的创新性,认为主题新颖性是用于评价学科学术论文的创新性。曹树金等[5]通过LDA主题模型和共词分析相结合的方法,探究学科学术论文在不同时期研究的内容与主题演化特征,研究发现,学科学术论文于守正创新中仍然保持发展态势。曹树金等[6]还从句子级重新性识别出发,利用了句子结构和语法的特征,采用了信息抽取与机器学习的方法,对近年中外情报学学科论文的创新性进行分析。杨京等[7]提出了一种基于研究主题对比的单篇学术论文创新力评价方法,首先运用Keygraph 算法抽取代表研究主题的关键词,再将提取的研究主题与学科研究前沿研究主题,以评价学科学术研究主题的创新性。

国外学者研究学术创新的切入点一般是从句子级、文档等文本的新颖性入手,从新闻事件和网页文件等角度探讨学术创新,或者从主题的角度分析科技文献的创新,从多种思路探究学术创新性。M.Breja[8]提出了一种基于文档级新颖性检测的新颖性检测方法,采用了句子级来进行创新识别,通过句子的相似度以及新词数混合度量的方式挖掘学术创新性。Phei Er Saw 教授[9]提出了跨学科融合对学术研究的重要性,跨学科融合是指在保留差异的基础上寻求共同点,有助于新时代的学术创新。Gabrilovich Evgeniy等[10]采用新颖分析算法,从文章中演变来分析文档间的动态及创新。目前,国内外图情学科学术创新性的相关研究相对较少,也存在一定的局限,大多从单一的角度来反映学科学术创新性。

实际上,以上所述大多的研究方法本质是一样的,即通过挖掘数据进行对比得出创新性,这些方法存在数据过多、工作量大、识别创新效果质量下降等问题。因此,本文选择国内外图情学科代表性期刊作为研究样本,针对性对国内外图情学科研究主题进行分析,进而更加有目标性去探讨图情学科学术创新性。

3 图情学科学术创新性研究方法及主题获取

3.1 图情学科学术创新性研究方法

本文采用文献计量学中的关键词共现分析方法,对2009-2019 年国内外图情领域核心期刊所刊载的论文进行对比分析,以探索我国图情学科学术创新性。文献计量学通过对各学科研究文献数量进行科学计量分析和比较,便于研究者通过这些规律性的东西去研究现状及预测未来[11]。将所选2009-2019 年国内外图情领域文献,基于寻径网络算法(Pathfinding Network Algorithm),基于关键词分析的主题演化,通过对高频关键词分析,以挖掘知识演化的关键路径与发展前沿。基于词频变化的主题演化研究可以把握相关领域研究重点,高频关键词通过分析关键词出现的频次来把握关注点,频次越高代表该主题的关注度越高,从而准确把握该领域的研究重点[12]。本文所研究的计量对象主要是2009-2019 年国内外图情领域核心期刊所刊载的论文,通过可视化软件进而得出每年的前五十个高频关键词,利用Excel对数据进行汇总与统计分析,统计出重合数及重合词,并绘制直观图表及描绘图形,对国内外图情学科高频关键词进行重合率对比,以统计出的同年及近三年对比的高频关键词当作主要研究对象,将其进行归纳映射到相应主题。并将国内学者发表于国外期刊的论文分析其关键词突现,以探究我国图情学科学术创新路径。

3.2 国内外期刊数据获取

本研究数据为期刊文献数据,为了提高分析的准确性及代表性,对刊物进行严格的筛选,挑选出具有代表性的期刊。本文选择了具有权威性的中文核心期刊,选择了CSSCI 期刊目录中图书情报类目下的科技期刊,在CSSCI(2019—2020 年)收录的图情学科期刊中,剔除了包含档案学在内的两种期刊,选择了具有代表性的包括《图书与情报》《图书情报工作》等在内的18 种图书情报核心期刊。具体期刊名称与综合影响因子见表1 所示。在CNKI 中精确检索,选择18 种图情核心期刊,时间范围设置为从2009 到2019 年,经过数据收集,剔除会议通知、报告、征稿启事、投稿须知等与研究不相关的非学术文献,最终获得论文总数为51 748条有效文献。

表1 文献数据来源期刊目录表

国外研究数据来源于Web of Science 数据库,国外图情期刊选取被SCIE 和SSCI 数据库收录的国外学术价值较高图情期刊。利用2019 年《期刊引证报告(JCR)》,在2019 年JCR 社科版图书情报学(Information Science&Library Science)专业目录下,共收录85 种学术期刊。根据期刊分布中普遍存在的“二八定律”,即20%最具影响力和代表性的期刊可以揭示出整体80%的内容和特征。所以,本文将图书情报学目录下的85 种期刊按照五年影响因子(5-yearly Impact Factor)进行排序,取其中影响力最大的前20%(17 种)的期刊为研究样本。限定学科类别为信息科学与图书馆学(Information Science&Library Science),具体期刊名称与五年影响因子见表2 所示。在WOS 中精确检索,以这17 种期刊的名称作为检索词,时间跨度限定为2009-2019 年,将每种期刊分别检索的论文导出,共检出相关文献12 116篇,检索结果包括各个国家发表的相关文献。国内学者发表在国外期刊的文章为1 363 篇,本研究将1 363 篇归为国内学者发表的数据,通过可视化软件的突现词功能来研究学术创新路径。对其余的国外图情学者发表的期刊论文10 753 篇,下载并保存10 753 篇文献的题录信息作为纯文本进行数据处理和分析。

表2 “图书情报学”领域17种高影响力期刊一览表

4 国内外研究主题对比分析

4.1 前五十个关键词重合率

国内外研究论文前五十个高频关键词超过三年对比重合较少。重合关键词如表3所示,重合相隔时间较长,并无显著特征规律。因此,本研究不选择国内外超过三年对比的关键词。

表3 国内外图情领域高频关键词同年及三年重合数

本文选择国内外图情学科前五十个关键词进行同年及近三年的对比,对国内外图情学科关键词的重合数和重合词进行详细统计,重合数即国内外图情学科关键词进行对比后重合的关键词数量。将重合数绘制成重合时间分布图(见图1),可以更加直观地看出重合数根据时间的变化所出现的频率。

图1 国内外图情学科重合高频关键词时间分布图

将重合数和重合词按照对应的时间填入表格中,可以更加直观地看到同年及近三年对比重合的具体关键词(如表4所示),便于分析。对比国内外图情学科高频关键词的重合率,关于重合率的计算,本研究采用了数学的数值百分比来计算,即:重合率=重合关键词数/总关键词数。其中,重合关键词数为国内外图情学科研究关键词的时间段内相同个数。因以每年前五十个关键词作为研究对象,所以五十为固定分母。

表4 国内外图情学科关键词同年及三年重合词

对国内外同年的重合率进行统计。2009 年,同年重合率为3/50,“model”(模型)、“e-government”(电子政务)、“knowledge sharing”(知识共享)在本年重合。2010 年,同年重合率为1/50,“structural equation model”(结构方程模型)在本年重合。2011年,同年重合率为1/50,“online community”(网络社区)在本年重合。2012年,同年重合率为1/50,“citation network”(引文网络)在本年重合。2014 年,同年重合率为1/50,“machine learning”(机器学习)在本年重合。2015 年,同年重合率为2/50,“altmetrics”(替代计量学)、“science research”(科学研究)在本年重合。2016 年,同年重合率为1/50,“open data”(数据开放)在本年重合。2013年、2017年、2018年、2019年这四年同年重合率为零。这四年国内外图情学科前五十个高频关键词各不一样,每年所研究内容各有千秋。在国内外图情领域,研究的内容存在较大的差异,这四年,最高频的前五十个关键词没有出现重合,每年研究的内容各具特色。

4.2 前五十个关键词映射归纳

自建主题分布研究包括自建主题分类表研究、参照国外已建主题分类表的主题分布研究两部分[13]。张雪梅等在其文章中归纳了两类自建主题分类表:①基于研究热点构建的主题分类表,如初景利等自建的主题分类表[14-15];②基于内容分析构建的主题分类表,如华薇娜的自建主题分类表[16]。目前,国内图书情报学关于自建主题分类表的研究成果较少。国外自建主题分类表研究成果较丰硕,如斯蒂芬创建的主题分类表。邱均平参照斯蒂芬主题分类表的主题分布进行研究,并取得了显著成果[17]。本文借鉴了前人的主题分类法,并根据本文的实际情况,将图情学科的研究关键词映射到相应主题,以便通过关键词间接进行主题分析。

结合图情学科研究特点,通过国内外图情学科研究关键词重合时间分布图和表格,对2009-2019年国内外图情学科研究关键词同年和近三年重合的关键词进行映射,并将关键词映射到相应研究主题。综合关键词分布情况,进行内容分析归纳为五大研究主题:大数据分析主题、社交媒体与信息行为主题、情报学的技术应用主题、数据管理与知识管理主题、其他主题。如表5所示。

表5 2009-2019年国内外图情领域关键词重合映射归纳主题表

4.2.1 大数据分析研究主题

“big data”(大数据)是近几年来的高频关键词。2012 年,国内大数据研究开始出现。三年后,在2015 年我国学者将大数据研究推向国际,涉及数据挖掘、知识管理等领域。大数据时代的到来,为情报学领域的研究带来了研究思路、研究环境与研究技术应用的变革。在大数据时代下,情报学的研究对象从信息到数据,大数据逐渐向智慧数据靠拢,数字化服务也逐渐应用于实践中。大数据分析给人们带来技术上的便利。人工智能、云计算、区块链的应用促进了社会现代化的发展,也给图书情报学的实际应用带来便利。情报学数据分析的技术应用方法也在随着时代的进步不断完善,引起了新一代信息技术变革的浪潮。国内外图情领域区块链研究热点的研究侧重点各不相同。国内学者倾向于研究区块链技术在数据共享和信息资源管理中的应用,主要集中在理论建设方面,而国外学者则热衷于研究政府和行业如何将区块链技术应用于信息治理[18]。区块链技术、大数据与人工智能的结合产物的出现,为从情报分析领域解决信息安全问题提供了方法。

4.2.2 社交媒体与信息行为主题

社交媒体的概念最早由美国学者提出,社交媒体是在Web2.0 技术基础上发展起来的一种应用,更加注重网络用户之间的互动和交流。“Twitter”(推特)等社交软件作为传播信息的重要工具和交流平台,已经被越来越多的图书馆所利用。图书馆的许多功能可以通过网络实现,许多学者在探索图书馆(大部分是数字图书馆、移动图书馆等)如何能够为人们提供更好的定位和服务。从研究内容看,国内学者的研究方向偏理论性,如通过微博等工具开展图书馆服务。国内学者对深度信息的研究和服务模式的应用研究滞后于国外的研究,虽然国内学者每年发表和收录论文较多,但创新和实践相对薄弱[19]。而国外对信息行为和信息服务的研究主要集中在文章发表和社交网络上[20]。社交媒体还涉及在线社区、虚拟社区等。我国图情领域的信息行为和信息服务研究有待完善,研究者可以借鉴国外图情领域的评估方法,注重国内期刊的定量分析,进而提高研究的创新性。

4.2.3 情报学的技术应用主题

新兴的信息技术已经成为情报学的研究对象,情报学的技术应用主题包括了新兴的信息技术、情报分析与处理和计量学。新兴的信息技术包括信息可视化和信息检索;情报分析与处理包括社会网络分析和情感分析;计量学包括科学计量学和替代计量学[21]。在图情领域,学者以用户情感作为图像检索的线索来研究机器学习,提出了基于深度学习的图像检索应用研究,更多研究基于WOS 定量研究主题。早在19 世纪80 年代,著名情报学家布鲁克斯指出:“如果情报学没有实现定量化,那将是一堆碎片化的技术,也不会成为科学。”[22]计量始终是图情领域的研究重点,文献计量分析是图情领域的一种研究方法,常用于分析科技领域的研究绩效。在科学计量和科技文献检索领域中,科学计量学在信息系统研究中的应用越来越多,特别是在评估研究成果和衡量学术影响力方面[23]。信息检索作为情报学技术的基础,是情报学不变的主题。目前的信息检索主要是为用户需求的信息行为服务,基于Web2.0的技术进行整理和分析信息。随着科学计量学理论的完善,图情领域的定量研究呈现出明显的增长趋势。

4.2.4 数据管理与知识管理主题

随着社会的不断发展,数据管理研究有了很大的进步,其广度和深度也在不断提高。从广度上看,政府开放数据、地方政府开放数据和知识共享已经成为图书情报领域关注的焦点,也是人们关注的焦点。在深度上,数据质量备受瞩目。社会资本、知识转移和开放创新也是当前关注的焦点。知识管理的任务是通过发展社会资本来创造知识资本,创造新的知识,知识管理战略旨在发展人与人之间的知识共享和知识转移[24]。Ogiela等通过广泛的自动数据解释和理解系统执行的算法,对获得的结果进行深入的语义分析和解释,以便进行数据质量管理[25]。Thomas Manoj采用数据管理成熟度参考模型框架(DMM)进行了系统的多层级分析,不仅考察了政府机构的数据管理实践的成熟度,也进行系统评估,对完成工作目标有很大帮助[26]。

4.2.5 其他主题

其他关键词分散、零散,较难看出规律,因此将它们归回其他主题较为合适。如“model”(模型)、“impact factor”(影响因素)等。它们特点与上述四个主题无较大联系,且每个主题相对独立。

5 国内图情学科研究创新性分析

5.1 我国图情学科学术创新路径

关键词突现图表借助显著关键词的变化可以反映出某研究前沿发展的变化,呈现某一研究领域内研究主题的演变态势,突显某个特定阶段学术界研究的聚焦点[27]。本文将国内学者于2009-2019 年在国外图情领域(本文所选国外17种期刊)发表的1 363篇期刊论文当做研究数据,以探索我国图情学科学术创新路径。本文利用Citespace 软件的突变词检测的功能,从图情领域文献中检测频次变化率很高的突变词,进而生成图情领域关键词突现图,从时间维度呈现我国图情领域研究的演化路径。图2为基于此功能探测到的2009-2019 这十年间图情领域的突现词出现情况,清晰地展示了2009-2019 年间的我国图情领域研究演进进程。本文通过查阅相关文献,结合我国基本国情,考量了突现词的起止时间及相关背景,也深入探究了节点类型、节点出现时间、突现强度、突现开始时间、突现结束时间。综合结果得出十年间我国图情领域研究进程经历以下三个阶段。

图2 关键词突显表

5.1.1 第一阶段(2011-2012年)

该阶段的突变词为“hirsch index”(赫希指数)、“e- government”(电子政务)、“diffusion”(扩散)、“pattern”(模式)、“citation”(引用)、“common method variance”(共 同 方 法 变 异)、“price”(价格)、“h index”(h 指数)、“social network”(社会网络)等。该阶段突现词突现强度最大是“e-government”(电子政务),说明此时我国图情学科基于以往的理论研究,在国际发文以围绕电子政务建设及其理论体系进行研究。自20世纪90年代电子政务兴起以来,电子政务一直受到世界各国研究者的高度关注,从电子政务的理论研究至国际电子政务研究进入整理治理的阶段[28]。目前,总结了电子政务的建设以及凝练了电子政务理论,并为电子政务建设事业的发展提供了参考,这也是我国图情学科在国际发文研究中的重要前沿。

5.1.2 第二阶段(2013-2015年)

“community”(社区)、“continuance”(延续)、“knowledge management”(知识管理)、“citation analysis”(引文分析)、“web”(网络)、“identity”(识别)、“business value”(业务价值)、“infrastructure”(基础设施)、“engagement”(参与度)等为突变词。“community”(社区)是该阶段突现强度最大的主题词。我国图情学科热衷研究网络社区、问答社区和在线社区,知识管理支持协同创新社区能力建设[29]。此外,我国学者还热衷基于Web的各类实证研究,如基于Web的目录设计[30]等。这些是这一时期的研究热点,在关键词聚类的结果也有体现。

5.1.3 第三阶段(2016-2019年)

第三阶段为2016-2019年,“social media”(社交媒体)、“privacy”(隐私)、“facebook”(脸谱网)、“moderating role”(缓和作用)、“loyalty”(忠诚度)等均为该阶段的突现词。“social media”(社交媒体)为突现值较强的词。随着信息技术快速发展,社交媒体研究从2016 年开始持续至2017 年。社交媒体作为信息传播的重要方式,也因此演化出更为先进的新技术及新应用,如通过企业社交媒体提高员工的敏捷性[31],通过将心理所有权(PO)与技术接受模型(TAM)相结合,进而起到培养社交媒体使用的长期忠诚度方面的作用[32],以及信息安全、脸谱网等,是我国图情学科在国际发文中的研究焦点。

5.2 我国图情学科的学术创新性

学科学术创新分为研究前沿跟随型、引领创新型及自主独特型。本研究将重合词归入研究前沿跟随型或研究前沿引领创新型。从表6可以看出,研究自主独特型数值较大,研究自主独特型是基于2009-2019年国内外图情学科前五个高频关键词比较得出的结果。研究自主独特型拥有我国的研究特色。在国内图情学科中,学者以高校图书馆、公共图书馆等为研究对象,围绕信息服务、知识服务、图书馆服务等展开研究,这一直是图情学科这十年来的研究热点。虽然每年国内都有研究热点,但图情学科大多研究仍是以图书馆为基础。研究前沿引领创新型数值排第二,多为实证研究。研究前沿跟随型是国内研究跟随国外图情研究。总体而言,本研究通过研究关键主题的特点及规律,总结出研究前沿跟随型、研究前沿引领创新型和研究自主独特型。对三种研究类型回归文本分析,可以看出近十年来我国图情学科的学术研究以研究自主独特型为主,并与国外图情研究共同引领学术创新。

表6 三种研究类型数值及关键词表

5.2.1 研究前沿跟随型

这些国内图情关键词均跟随国外图情领域关键词出现,以上这些属于研究前沿跟随型。在国内学者在该研究前沿跟随型中:以信任而言,学者倾向于关注信任模型、信任关系、初始信任值和信任管理等;以绩效而言,学者倾向于关注创新绩效、服务绩效和绩效管理等;以能力而言,学者倾向于关注创新能力、服务能力、知识服务能力和信息能力等。韩国图情学科研究的中心是各类图书馆,研究热点主要包括韩国公共图书馆事业、韩国图书馆的发展和韩国高校图书馆电子资源等;以社交媒体而言,学者比较关注移动社交媒体、政务社交媒体等;以高等教育而言,学者倾向于研究高等教育信息素养、高等教育机构等;以生态系统而言,学者倾向关注信息生态系统、知识生态系统、网络信息生态系统、企业信息生态系统等;以大数据分析而言,学者倾向于关注大数据分析框架、大数据分析研究现状等;以地方政府而言,学者倾向于关注地方政府数据开放、信息公开和网络舆情导控能力等。国内学者研究的以上内容在国外图情学者研究之后出现,跟随国外图情学科研究步伐的同时又探究新兴主题。

5.2.2 研究前沿引领创新型

这些国内图情学科关键词均早于国外图情领域关键词出现,以上研究关键词属于研究前沿引领创新型。这种类型主要是方法研究和应用研究相结合。通过云计算、图像检索、情感分析、区块链、科学计量学等关键词可以看出,图情领域的发展离不开信息技术。信息技术的快速发展给图情学科带来了新的机遇。特别是以AI为代表的技术正在融入图情领域,基于内容的图像检索技术和图像类聚也提升了人们的工作效率。云计算服务、云服务平台等也在发展。现如今,在Web2.0环境下的知识管理和网络信息传播也成为一种常态。总的来说,图书馆仍然以图书馆服务、管理、阅读推广等为主要研究内容。在开放创新方面,学者研究开放式创新平台和开放式社区用户信息等;在传播影响上,学者研究推特内容、传播效果、信息传播和网络舆情信息。以社交网站而言,学者研究社交网站、社交网站用户个人信息、信息传播特征等。国内学者研究的这些关键词具有引领创新型,当国内有些研究关键词逐渐成为热点时,国外学者也沿袭了我国此类方向进行研究。

5.2.3 研究自主独特型

这些节点相对显眼,能够反映当下研究热点。这些国内学者研究较靠前的高频关键词,在国外近十年高频关键词中鲜有出现。该系列为图情学科研究主题的研究自由独特型。在国内图情领域中,“图书馆”排序第一,其次为“高校图书馆”,学者研究高校图书馆学科服务的文章颇多,重点于高校图书馆面向学科的关键问题,以及高校图书馆学科服务信息共享、平台建设、体系建设等内容,后由国内高校图书馆研究转向国内外高校图书馆服务研究。“公共图书馆”在2010 年达到峰值,公共图书馆与公共文化服务发表的论文年份在2019 年较多,探究公共图书馆健康信息服务现状、公共图书馆创新服务等内容。随着互联网的不断发展,面对复杂的数据和众多用户的需求,大数据时代的数字图书馆需要对服务模式进行变革。许多学者改变了对数字图书馆的早期认识,重新研究了数字图书馆的发展趋势。“信息服务”在2010年到达峰值,个性化信息服务、知识信息服务、数字化信息服务等成为当时研究的热点。“知识管理”在2009 年和2010 年达到最高峰,知识管理与知识共享密切相关,学者对高校知识共享问题进行了探讨,分析了高校图书馆知识共享的模式和绩效。“图书馆学”与“情报学”关系密切,学者关注研究图情学的研究热点、图书馆学与情报学的发展。

图书馆信息服务、大数据挖掘、竞争情报等一直占据着主导地位,但近几年已有少量研究分布在图书馆转型、知识关联、知识结构、用户信息行为以及健康信息上,研究比较分散,未能形成稳定的体系结构。在国内图情学科研究的主题中,大部分关键词属于国内的研究特色,在国外同年及近三年前五十个高频关键词鲜有出现。我国图情学科研究主题主要以研究自主独特型为主。国内学者研究的主题基于中国国情,跟随时代潮流,拥有本土研究路线特色。

6 结语

本文采用文献计量、比较分析等方法分析2009-2019年国内外图情学科的研究论文表明,近十年来我国图情学科学术创新性具有研究前沿跟随型、研究前沿引领创新型、研究自主独特型3个特点。我国图情学科学术研究以研究自主独特型为主,并与国外图情研究共同引领学术创新。

猜你喜欢

图情重合创新性
数字时代图情档学科教育的数据化创新
建筑设计中色彩对外立面的创新性应用思考
谈高中作文教学的实用性和创新性
新文科建设背景下的图情档学科建设(笔谈)“新文科”呼唤图情档成为“硬”学科
流动几何的创新性
聚青年学者之睿智 窥图情档学科之未来
——写在《图书与情报》“图情档青年学者专辑”出版之前
电力系统单回线自适应重合闸的研究
中国盲人数字图书馆服务情况及展望
成公绥赋作的模式化与创新性
浅析重合闸