APP下载

国内图书馆界阅读推广研究热点分析

2019-07-11王文涛许新龙甘肃省图书馆

图书馆理论与实践 2019年6期
关键词:共词聚类矩阵

王文涛,李 娜,许新龙(甘肃省图书馆)

1 引言

当前,阅读推广已成为图书馆界实践与理论的重要领域。范并思教授曾指出,阅读推广成为图书馆的主流服务是过去20多年来图书馆事业的最大变化之一。[1]自中国图书馆学会于2004年开展全民阅读宣传活动以来,图书馆界就开始积极开展阅读推广活动,至今已积累了大量的阅读推广优秀案例,阅读推广工作也成为评价公共图书馆服务效能的一个重要指标。2017年,文化部第六次全国县级以上公共图书馆评估指标中的“服务效能”模块,把“年阅读推广活动次数”纳入到评价指标细则中,甚至该指标已成为省级(副省级)公共图书馆上等级的必备指数。在学界,自国家社科基金于2010年批准了首个“图书馆阅读推广”项目之后,到目前为止,国家社科基金项目以阅读为主题的立项课题已有92项,其中关于阅读推广主题的项目有11项(见表1)。通过百度学术搜索可以发现(截至2017年11月6日),图情领域发表有关阅读推广主题的文献达3,888篇,而2010年之前已发表文献的总和仅300余篇,这也说明国家社科基金引领阅读推广研究成果数量的迅猛增长,国内阅读推广研究已形成热点领域。

本文拟采用共词分析法,对国内图书馆界以阅读推广为主题核心的论文进行梳理,筛选出高频关键词并构建共现矩阵,以揭示阅读推广的研究热点,为从事阅读推广研究的学者提供参考。

2 研究方法与数据处理

2.1 研究方法

共词分析方法是目前情报学领域常用的内容分析方法之一,其基本原理是通过统计文献词汇或名词短语的共现情况来反映关键词之间的关联强度,进而确定这些词所代表的学科领域的研究热点、组成范式,并从横向和纵向两个角度分析学科领域的发展过程和结构演化。[2]共词分析法是建立在词频分析法的基础之上,第一步是从相关文献数据库中抽取关键词或主题词,即出现频次超过一定阈值并且能够代表该学科研究主题或研究方向的高频词。接下来,两两统计这些高频词同时出现在有关文献中的累计次数,形成共词矩阵。最后,围绕这个共词矩阵进行分析,探讨这些高频词之间的亲疏关系,进而分析其所代表的研究主题或研究方向。[3]

表1 国家社科基金批准阅读推广主题项目一览表

2.2 数据处理

2.2.1 数据来源

本文选择 CNKI(ChinaNational Knowledge Internet)期刊数据库为样本数据库,文献来源为SCI(Science Citation Index,科学引文索引)来源期刊、EI(EngineeringIndex,工程索引)来源期刊、核心期刊和CSSCI(ChineseSocialSciencesCitationIndex,中文社会科学引文索引)来源期刊,文献发表时间截至2017年12月。文献检索表达式为:主题=“阅读推广”包含“图书馆”或篇名=“阅读推广”包含“图书馆”,检索时间为2017年11月28日,共检索出1,012条题录数据,去掉征文通知、通讯报道等非学术性文献题录67条,有效题录数据945条。2.2.2 筛选高频关键词

为方便起见,本研究按照储节旺等[4]介绍的方法,对Excel表格中的关键词进行分列统计,在获取的文献题录数据中,关键词最少有3个,最多达到10个,共获得关键词1,751个,使用总次数为4,048次。

词是共词分析的基本单元。王昌度等研究发现,目前中文科技期刊文献仍然主要采用关键词自由标引,即不依赖于受控词表,完全由标引者根据文献主题内容自主拟词进行标引。由于标引者的知识背景、选词习惯以及对关键词的理解认识不同,造成当前关键词的标引工作仍存在通用词过多、词性不当、主题词漏选、标引深度不合适以及标引不一致等问题。[5]李纲等认为,使用未经规范化的术语直接作为共词分析的“构建单元”,必然会影响分析结果,因此有必要在高频词选定之前对术语进行规范化整理。[6]本研究对同义进行合并,用上位类词替代下位类词,一些词用规范化术语替代等,如将“大学图书馆”合并到“高校图书馆”,将“儿童”“青少年”“少儿读者”替换为“未成年人”,将“微博”“微媒体”合并到“新媒体”中,将“总分馆制”“总分馆服务”合并入“总分馆”中,将“儿童阅读”合并到“少儿阅读”,将“绘本书”“绘本馆”并入“绘本阅读”,将“真人图书”并入“真人图书馆”,将“服务创新”“创新服务”并入“创新”,将“服务”“服务工作”“服务模式”并入“服务营销”等。在合并过程中,笔者也发现,国内图书馆界有些学者对于关键词的标引过于随意,对关键词重要性的认知水平还有待提高,如在有关“真人图书馆”的研究中出现了“活体图书”这种令人产生歧义联想的关键词。经过同义词合并和归类后,选择词频不低于7次的关键词进行分析,共得到50个高频词。

胡昌平等根据关键词的作用将其分为研究主题、所属领域、限定范围、理论方法、知识点等5类,但关键词的共现关系严重依赖于研究主题和知识点这2类关键词,而除知识点外其他类关键词同类互斥作用较为明显。[7]根据此论述,为了使研究聚焦,笔者舍弃了反映特定范围或所属领域的高频关键词,如舍弃“高校图书馆”“公共图书馆”“少儿图书馆”“台湾地区”“美国”“宁夏图书馆”和“银川图书馆”等专指明确或使用范围较窄的实体词;删除了反映理论方法的高频关键词,如“问卷调查”等。虽然关键词“阅读推广”和“图书馆”的出现频率很高,分别为543次和190次,但是与本文研究主题重合,难以反映研究热点,故予以舍弃,与此相类似的还有“图书馆阅读推广”“阅读”等词。最终确定了能表征阅读推广研究知识点的38个高频关键词,用于进行共词分析(见表 2)。

2.2.3 建立高频关键词共现矩阵

对表2中的38个关键词,运用Excel的数据透视表形成38×38的共词频次矩阵。[4]该矩阵为对角矩阵,主对角线上数据定义为缺失,非主对角单元格数据为两个关键词共同出现的频次,如“互联网+”与“大学生”的共现频次为1,表示有一篇文章共同使用了这两个词。将此矩阵数据导入SPSS中,通过“相关”分析模块中的“距离”分析,使用“余弦”方法得到Ochiia系数的相似矩阵。为减少误差,用数字1与该相似矩阵的每个元素相减,得到相异矩阵(见表3),以方便后续分析。[3]

表2 参与构建共词矩阵的高频关键词

表3 关键词共现相异矩阵(部分)

3 阅读推广研究的共词分析

用于共词分析的多元统计方法主要有因子分析、聚类分析和多元尺度分析等3种。为方便起见,本文采用前两种方法对高频关键词进行聚类分析,以提示阅读推广研究的热点内容。

3.1 因子分析

因子分析是研究多个变量之间相关系数矩阵的内部依赖关系,找出能综合所有变量的少数几个随机变量,这些变量通常称为因子,然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,但不同组间的变量相关性较低。[1]利用因子分析法,可以达到信息浓缩的目的。

将上表所构建的共词矩阵数据导入到SPSS中,选择主成分方法和平均正交旋转方法操作。系统默认显示有9个因子被提取,其累计方差解释贡献率达到84.655%,也就是说把38个高频关键词分为9类,可以浓缩阅读推广研究的84.655%内容。前3个因子的累计方差贡献率达到50.372%,而其中第一个因子的旋转方差贡献率就达到了35.562%,说明第一个因子是国内阅读推广研究的重要领域。通过碎石图可以发现(见图1),第一个因子较为陡峭,代表较高的信息量,而从第六个因子开始图形逐渐变缓,如同高山下的碎石,所以因子提取数可以考虑6-9个,这里按照系统默认为9个,因子命名见表4。

图1 因子分析碎石图

表4 因子分析确定的阅读推广研究热点

3.2 聚类分析

聚类分析是根据数据特征对数据进行分类的方法,它把数据分为若干个类别,使得类别内的差异尽可能的小,而类别间的差异尽可能的大。[8]经典的聚类方法可以分为3类:层次聚类法、非层次聚类法和智能聚类方法。其中,层次聚类法是根据距离的远近,把距离近的数据依次合并为一类,直到数据完全合并入一个类别为止,或者是首先认为所有数据是一个类别,然后通过把距离远的数据逐步分离开来,直到所有数据各自分成一类为止。

本研究采用层次聚类法,对上述已经标准化处理过的矩阵数据进行聚类分析。参考因子分析的碎石图,对相异矩阵设定为2-9类进行分类,在聚类方法中选择离差平方和法(Ward),在距离测度方法中选择计数的Phi方法。通过考察聚类结果,并参考因子分析结果,最终确定聚类数分为6类,得到如图2所示的聚类结果树状图。综合考虑每一类中各关键词的性质,分别命名为:活动宣传载体、阅读推广策略、阅读指导、未成年人服务、大学生阅读行为、阅读基础理论。

3.3 因子分析与聚类分析中的分类结果比较

比较两种分类方法可以看出,分类的结果有很大差异。在聚类分析中,11个因子分析中的因子都产生了分化和重新聚合。如在因子分析中,因子1(阅读推广理论与技术方法)占有很大比重,代表了国内的研究热点主要集中于此,但在聚类分析中,因子1被重新聚类为阅读基础理论、阅读推广策略和活动宣传载体,这表明阅读推广理论与技术方法内部有各自独特的研究方向。聚类“未成年人服务”是整合了因子3(阅读推广活动)、因子5(亲子阅读策略)、因子6(未成年人活动)、因子7(绘本阅读)而成,表明对于未未成年人的阅读推广研究包含上述服务内容。而因子4(图书馆员创新)和因子8(阅读指导)整合为阅读指导,表明图书馆员创新对于阅读指导有更好的促进作用。同时也看到,因子2(大学生阅读行为)变化较小,表明对于大学生阅读行为的研究已形成稳定的方法和内容。总体而言,国内阅读推广研究内容较为分散,研究方向呈多元化态势。

4 结果讨论

通过比较因子分析与聚类分析的分类结果,可有助于描绘出研究内容的主要类别。下面结合相关文献,对国内图书馆界阅读推广的研究热点作简要解读。

4.1 阅读基础理论

图书馆阅读推广属于图书馆实践领域,其主要支撑性理论就是阅读学。阅读学是研究阅读活动的学科,涉及传播学、教育学、心理学、社会学、语言学、图书馆学等学科,是解决阅读过程中所产生的各种基本问题的科学。阅读疗法是以阅读学为基础,以阅读材料为媒介工具,指导读者阅读,并帮助解决读者个人问题。[9]早期阅读是阅读学在幼儿群体中的应用表现,阅读学和阅读疗法构成图书馆开展阅读推广活动的应用性理论基础。服务是贯穿图书馆发展的主线,是图书馆的核心价值观。阅读服务不仅包含传统阅读,还包括网络阅读和移动阅读。图书馆开展阅读推广,就是为读者的阅读或学习提供的服务。

图2 聚类结果树状图

4.2 阅读推广策略

分级阅读起源于发达国家,是按照未成年人不同年龄段的智力和心理发育程度,为其提供科学的阅读计划,提供有科学性和针对性的读物;而立体阅读是将简单的二维阅读转换为多元形象的知识传播渠道。阅读推广人作为阅读推广活动的组织者和实施者,在阅读推广活动中起着至关重要的作用。阅读推广人通过采用分级阅读和构建立体阅读渠道等方式,采用多种阅读形式。如在世界读书日举办阅读活动以鼓励人们阅读,最终目标是通过阅读提升公民素养,使不爱阅读的人爱上阅读,使不会阅读的人学会阅读,使阅读有困难的人跨越阅读障碍。[1]

4.3 阅读指导

阅读指导指在阅读活动过程中对阅读者施予积极有益的指点和辅导,以提升阅读效益的教育活动。经典阅读是读者提升人文素养的主要途径,中国图书馆学会作为阅读指导的主导机构,从2003年开始将全民阅读工作提上议事日程,积极地宣传与推动全民阅读,同时成立学会的阅读推广委员会,将“图书馆努力促进全民阅读”写入《图书馆服务宣言》。在中国图书馆学会的不断努力下,阅读推广成为各级各类图书馆不可或缺的服务,并激发各类图书馆采取创新措施和媒介,积极开展经典阅读和数字阅读,提升全社会的阅读文化。

4.4 未成年人服务

服务活动化是现代图书馆服务的新特征,阅读推广活动已成为公共图书馆服务效能的重要指标。对于未成年人服务,主要以活动化的服务取代传统图书外借阅览服务。在阅读推广时,图书馆员深度地介入读者的阅读过程,通过推荐书目、读书会、绘本阅读等各种策略措施鼓励读者阅读和理解读物。

4.5 活动宣传载体

随着“互联网+”时代的到来,用户获取信息与知识的渠道变得更为多元,网络环境及新媒体的发展促使图书馆阅读推广实践发生改变。微信公众平台因其操作的便捷性、人际交流的高时效性、内容推送的丰富性、消息传递的精准性等特点,使得图书馆可以通过微信公众平台开展馆藏导航、消息推送、活动宣传、阅读分享互动、在线交流等服务。读书节和读书活动也在“互联网+”新技术应用中发生改变。

4.6 大学生阅读行为

大学生群体是高校图书馆的主要读者,而高校图书馆是阅读推广研究的主要阵地。由于互联网的发展,大学生对于经典图书的阅读数量正在下降,而构建常态化经典阅读是高校图书馆阅读推广工作的核心。因此,对大学生阅读行为、阅读现状进行研究是高校图书馆开展阅读推广服务的必要条件和基础。同时,新形势也促使图书馆员创新服务内容和服务模式,需要借助微信、微博等新媒体宣传图书馆服务、引导阅读、指导阅读,通过开展服务营销、采取有效干预等手段,激发在校大学生的阅读热情,让更多的读者了解图书馆、利用图书馆,提高对经典文献的阅读效益。

猜你喜欢

共词聚类矩阵
基于K-means聚类的车-地无线通信场强研究
图书馆与档案馆信息公开研究重点及趋势比较研究
基于Matlab的共词矩阵构造
基于高斯混合聚类的阵列干涉SAR三维成像
初等行变换与初等列变换并用求逆矩阵
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法
矩阵
矩阵
矩阵