APP下载

对外汉语研究主题分析

2016-09-08沈敏佳

现代语文 2016年22期
关键词:网络分析图谱聚类

○沈敏佳

对外汉语研究主题分析

○沈敏佳

本文以中国知网为数据源,在核心期刊中检索和获取了2006-2015十年内与“对外汉语”相关的3378篇论文。利用SATI、ucinet和excel三款软件,通过词频统计、社会网络分析以及聚类分析相结合的方法,分析了近十年内对外汉语的主要研究主题和方向。以此更好地了解和掌握对外汉语研究的现状以及趋势,为今后的研究提供相应的数据支持和方向引导。

对外汉语 主题分析 共词分析 社会网络分析

引言

随着我国经济的持续发展和综合国力的不断增强,汉语热已经在世界范围内形成。对外汉语这一领域的研究也逐渐深入。为了能更科学地了解对外汉语在近十年的研究现状和发展方向,本文以在线文献为实例,通过计量、社会网络分析等方法来展开此项研究。作为了解一个领域研究现状的一种重要途径,文献统计分析对于把握学科研究结构和发展趋势的作用不容小觑。

一、数据采集

中国知网是目前国内最大的汇集各种学术资源的网络平台,提供CNKI源数据库、外文类、工业类、农业类、医药卫生类、经济类和教育类多种数据库。其中综合性数据库为中国期刊全文数据库、中国博士学位论文数据库、中国优秀硕士学位论文全文数据库、中国重要报纸全文数据库和中国重要会议文论全文数据库。核心期刊则具有代表性、前沿性、权威性,在核心期刊上发表的论文在很大程度上揭示了国内在对外汉语领域的研究成果及研究方向。

本文以中国知网中的核心期刊为数据源,采用文献计量学的方法,在中国知网中通过全文高级搜索“对外汉语”,在文献的“哲学与人文科学”学科领域内选择“中国语言文字”下的“语言学”及“汉语”,同时,由于研究对外汉语的论文数量比较庞大,因此本文所选的论文时间跨度在2006年到2015年之间。论文数量如图1所示,这十年间发表在核心期刊上的相关论文数量没有太大的变动。

图1:对外汉语相关论文数年份分布图

同时,本文整理了论文发表数量排在前10的核心期刊,具体名称如表1。

表1:论文数量前10的核心期刊列表

二、数据分析

笔者基于论文关键词共词分析法,以搜集到的3378篇论文为数据,对关键词聚类与多维尺寸分析结果,可以呈现出对外汉语的研究主题,并利用社会网络分析方法,通过绘制共现网络知识图谱,可以进一步揭示该研究领域结构的内部联系及其特征。

共词分析法是内容分析法的一种,其认为两个能够表达论文主题内容的词条在一篇论文中同时出现,则表达二者具有一定的共现关系,共现词数越多,则关系越强。聚类分析和多维尺度分析法,用来构建聚类图和多维尺度图谱,聚在一起的若干关键词可构成一个研究主题领域。研究者利用社会网络分析方法,可绘制网络知识图谱并呈现出各个研究主题在相互作用下的分布情况(核心与边缘),因知识图谱并不能很好地反映领域的成熟度,难以判定某研究领域的成长趋势,还将基于共现矩阵构建战略坐标图,进一步解析各个研究领域的特征以验证结论。

(一)关键词频率分析

本文利用SATI软件,对收集的2278篇论文的所有关键词进行词频统计与分析,并认为词频越高,则该关键词在该领域的研究热度越高。在操作软件过程中,除去与本领域无关的关键词,并对有效关键词进行过滤,本文没有对同义及近义关键词进行合并。如下表2所示为2006-2015年中国知网的核心期刊内关于对外汉语研究的相关论文高频率前30的列表。

表2:核心期刊对外汉语前20高频关键词列表

由表2可大致看出在对外汉语领域多集中在教学方面:“对外汉语教学”“汉语教学”“第二语言教学”和“汉字教学”等,研究主题则有语言文字、语法、语义、词汇及口语等,说明这些主题是2006-2015年这十年间我国对外汉语研究的重点及热点。

关键词的出现频率在一方面反映了对外汉语研究的情况,但仅仅从关键词的词频来推断对外汉语的研究热点和难点还是远远不够的。研究关键词之间的共现关系,构建出关键词内容之间的网状结构对于分析对外汉语领域的研究热点是一个很好的补充。本文利用共现分析法获得关键词的共现频率,再以聚类树状图和多维尺度图谱来揭示对外汉语的研究主题及结构等。

(二)聚类树状图

崔雷(1996)将聚类分析定义为是一组将研究对象分为相对同质的群组的统计分析技术。通过统计聚类分析,揭示实验语音学研究主题结构,读者可以简单、直观地了解到研究内容的大致分类情况,以此展现对外汉语的研究主题结构。同样,本文选取词频前20的高频关键词,得出高频关键词共现相似矩阵,将相似矩阵导入ucinet进行层次聚类分析,得到如图2所示的对外汉语高频关键词聚类树状图。

图2:对外汉语高频关键词聚类树状图

从对外汉语高频关键词聚类树状图中可看出,对外汉语领域的研究多集中在教学方面如对外汉语教学、汉语教学、第二语言教学和汉字教学等,研究主题则有语言文字、语法、语义、词汇及口语等,说明这些主题是2006-2015年这十年间我国对外汉语研究的重点及热点。

(三)网络知识图谱

从关键词频次的角度来探索对外汉语领域的研究热点及现状固然是一个很好的方向,但是略显单薄。本文还将使用网络知识图谱来进一步探究,并使用SATI和ucinet两个软件对以上的20个高频关键词进行共现分析,构建共现网络,如图3所示。

图3:对外汉语高频关键词共现网络

网络知识图谱以关键词为节点,关键词之间的共现为连线,连线越多说明该关键词和其他关键词出现在同一论文中的情况越常见。节点位置越居中则认为该关键词越核心,节点的形状越大便表明该关键词在共现网络中的地位越重要。节点之间的连线越粗则认为关键词之间的关系越紧密。由图3可知,关键词“对外汉语教学”的节点形状最大,与其他关键词之间的连线最多,位置也居中,说明“对外汉语教学”这个关键词在这个共现网络中的地位十分重要。同理可知,其他关键词如“对外汉语”“现代汉语”“汉语教学”等,在这个共现网络中的地位也不容小觑。

三、结语

利用社会网络分析方法及专门的分析工具,可以把某一主题的关键词网络以可视化的方式呈现出来,更加直观地呈现出该研究领域的重点、热点以及内部联系和特征。本文通过这种方法将对外汉语相关论文进行了定量的统计和分析,从中我们可以总结出以下结论:对外汉语领域的研究多集中在教学方面如对外汉语教学、汉语教学、第二语言教学和汉字教学等,研究主题则有语言文字、语法、语义、词汇及口语等,说明这些主题是2006-2015年这十年间我国对外汉语研究的重点及热点。

[1]Callon M,Courtial J P,Laville F.Co-word analysis as a tool for describing the network of interactions between basis and technological research:The case of polymer chemistry[J].Scientometrics,1991,(1):155-205.

[2]Cottrill C A,Rogers E M,Mills T.Co-citation analysis of the scientific literature aditof innovation research traditions:Diffusion of innovations and technology transfer[J].Knowledge,1989,(2):181-208.

[3]崔雷.专题文献高频主题词的共词聚类分析[J].情报理论与实践,1996,(4):49-51.

[4]刘启元,叶鹰.文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例[J].信息资源管理学报,2012,(01):50-58.

[5]汪小帆,李翔,陈关荣.网络科学导论[M].北京:高等教育出版社,2012:158-159.

[6]那日松,齐力格尔.蒙古语语言学研究主题分析[J].蒙古学集刊,2015,(2).

(沈敏佳 浙江杭州 杭州师范大学人文学院 311121)

猜你喜欢

网络分析图谱聚类
基于ISM模型的EPC项目风险网络分析
低轨卫星互联网融合5G信息网络分析与应用
绘一张成长图谱
基于K-means聚类的车-地无线通信场强研究
铁路有线调度通信的网络分析
补肾强身片UPLC指纹图谱
基于高斯混合聚类的阵列干涉SAR三维成像
2016年社交网络分析
主动对接你思维的知识图谱
基于Spark平台的K-means聚类算法改进及并行化实现