APP下载

基于文献计量和形势概念分析的语言学发展态势研究

2019-07-19袁国廷

宜春学院学报 2019年5期
关键词:主题词语言学概念

袁国廷

(济宁医学院 外国语学院,山东 日照 276826)

引言

语言学(Linguistics)是以人类语言为研究对象的学科,探索范围包括语言的性质、功能、结构、运用和历史发展,以及其他与语言有关的问题[1]。随着时代的进步与社会的发展,越来越多的学者投入到了语言学领域的研究当中,并取得了丰硕的成果,其理论主张、研究成果和研究方法也逐渐在相关领域得到了越来越广泛的应用和验证。国际语言学发展态势的探索对我国及时准确把握其发展脉络、深入开展领域相关研究具有重要的启发和借鉴意义。

目前学者们对于语言学相关领域发展态势的研究主要采用调研、归纳、访谈以及文献词频统计等方法。王立非等(2011)采用关键词词频统计和内容分析法,对2006-2010年国家社科基金外国语言学课题指南和立项情况进行分析。结果发现:课题指南与课题立项相互作用,近五年研究热点依次为外语教学、翻译学、语言研究和功能语言学;历年均受关注的领域是二语习得、教学法、语料库研究、语用学、测试与评估等[2]。束定芳(2012)对近10年来国外认知语言学最新进展与发展趋势进行探察,研究表明:就认知语言学本身来说,其传统的研究课题无论在范围还是在深度方面都得到了较大的拓展和深化,发现了很多新的语言事实和现象,提出了许多有一定解释力的假设与理论模型,其研究方法也从传统的以内省为主逐渐过渡到以语料库或以心理和仪器实验为基础的实证研究为主,成为一种跨学科、全方位、多视角的研究[3]。吴珊(2012)对2001-2010年国家社科基金所资助的语言学类项目进行立项年代、项目类别、预期成果、语种及主题词分布等方面的统计分析,探讨国内语言学研究现状和发展趋势。结果表明,立项总量呈逐年递增之势;青年项目数量增长较快;预期成果中专著所占比例较高;有关汉语和英语的立项数量最多,且教学类及语言对比类研究比重较大;目前的研究热点有“方言”、“语料库”、“语法”、“教学”等。总体而言,理论研究有长足进步,应用研究仍是热点,创新性有待提高[4]。王立非等(2015)以2008-2015年国际SSCI期刊论文为语料,采用文献计量分析方法,对国际会话分析的研究热点与进展进行考察和分析[5]。

本文采用文献计量分析法,从发表时间、地域、语种、来源期刊、机构、著者、引文等角度,定量揭示语言学研究的概况与全貌;并利用形式概念分析方法,结合学科知识语义信息,挖掘语言学领域的学科主题特征,以期为语言学学科建设与发展提供一定的参考。

一、研究对象的选择与数据获取

利用美国科学情报研究所(Institute for Scientific Information,简称ISI)出版的国际权威引文数据库Web of Science[6]中的SCI-EXPANDED、SSCI、A&HCI网络数据库进行检索,得到2006-2015年语言学主题中类型为“Article”的文献共49080篇。

考虑到网络数据库的数据更新,为了保持数据的一致性,笔者在2017年3月22日集中采集了数据。

二、数据处理与结果分析

(一)语言学文献外部特征总体分布分析

使用Thomson Data Analyzer(简称TDA)对语言学文献信息进行文本处理,经过数据清洗等步骤后,提取发表时间、地域、语种、来源期刊、机构、著者、引文等文献外部特征信息,以获得语言学研究的概况与全貌,明晰研究主体、研究呈现形式和研究基础理论的集中与分散性。

1.年代分布。2006-2015年,语言学领域历年文献产出量如图1所示。

图1 语言学历年文献分布量

由上图可知,随着时间的推移,语言学领域的文献产出量不断攀升,说明越来越多的科研实体关注并投入到了该领域的研究中,并取得了丰硕的研究成果,语言学领域的探索与创新活动快速发展起来。

2.地域分布。2006-2015年,多达140个国家/地区的科研实体开展了一系列语言学相关研究,其中,排名前十位的地域分布情况如表1所示。

表1 语言学文献的地域分布表(Top 10)

由上表可知,美国是当今语言学领域文献产出最多的国家,约占总量的30.49%,处于世界顶尖水平,是语言学研究的核心国家;其次是英国(10.60%);德国、西班牙、加拿大、澳大利亚和法国分别居于第三至第七位。中国以1733篇文献的产出量居于第八位,但不足美国的八分之一,说明我国的语言学研究虽取得了一定的成果,但还有待进一步加强与完善。

3.语种分布。2006-2015年,语言学领域文献共涉及31种语言,其中,排名前十位的语种分布情况如表2所示。

表2 语言学文献的语种分布表(Top 10)

由上表可知,SCI-EXPANDED、SSCI以及A&HCI国际权威数据库中收录的语言学领域文献的语种分布极不均衡。其中,绝大多数为英文文献,其比例高达83.38%;德语、西班牙语分别位居第二、三位,但其所占比例远小于英语;汉语文献仅有254篇,排名第六。究其原因可能为,当前国际权威数据库中收录的期刊绝大部分为英文刊物,其他语种的刊物仅占极小份额。因此,我国语言学领域学者应重视英文论文的写作,以提升科研成果的国际可见度与影响力。

4.期刊分布。2006-2015年,出版语言学领域文献的期刊共264种,其中,排名前十位的来源期刊分布情况如表3所示。

表3 语言学文献的来源期刊分布表(Top 10)

由上表可知,当前语言学领域的权威期刊为《语用学报》、《语言与听力研究杂志》、《语言学》、《大脑与语言》、《记忆与语言杂志》、《临床语言学与语音学》等刊物。其中,《语用学报》创办于1977年,涉及普通语言学、社会语言学、话语分析、会话分析、认知语言学、语料库语言学等主题,同时鼓励探索语言语用学及其临近学科(如包括非语言交际在内的传播学、发展与实验心理学、语言哲学、包括所有发展和获得性交流障碍在内的语言病理学等)的关联研究[7]。创办于1997年的《语言与听力研究杂志》主要刊登听力、语言、言语障碍及其治疗相关主题文献[8]。《语言学》则聚焦于普通语言学问题,旨在呈现当前语言学各领域的研究热点内容[9]。

5.机构分布。2006-2015年,一万余家科研机构参与到了语言学领域的研究中,其中,排名前十位的机构分布情况如表4所示。

表4 语言学文献的机构分布表(Top 10)

由上表可知,英国的伦敦大学是产出语言学文献最多的机构,其次为爱丁堡大学,比利时的根特大学位列第三。加拿大多伦多大学、美国宾夕法尼亚州立大学、比利时天主教鲁汶大学、美国约克大学、芬兰赫尔辛基大学、英国曼彻斯特大学以及美国伊利诺伊大学亦有大量相关文献发表,且其产出比例分布较为均匀。说明欧美高校为当前语言学领域的主流核心研究机构,且各高校在该领域的科研实力相对均衡。

6.著者分布。2006-2015年,排名前十一位的著者分布情况如表5所示。

表5 语言学文献的著者分布表(Top 11)

由上表可知,除匿名作者外,悉尼大学澳大利亚口吃研究中心的Mark Onslow发表的语言学文献最多(59篇),其主要致力于学龄前儿童早期口吃的流行病学、口吃者的心理健康、口吃的测评以及口吃的本质与治疗等方面的研究[10];该中心的Ann Packman,发文量占文献总量的0.11%,居于第二位;再次为普渡大学跨学科研究学院语言学项目组的Laurence B.Leonard(发文量53篇),其主要研究方向为儿童的语言发展与语言障碍,近期聚焦于不同语种中特殊语言障碍儿童的早期言语、词汇和句法的发展,同时对语言治疗措施的有效性进行探索[11]。查尔斯特大学言语与语言习得Sharynne McLeod教授的研究侧重于儿童言语习得;从身体功能与结构、活动和参与、环境因素、个人因素等方面,将2007年世界卫生组织发布的《国际功能、残疾和健康分类》(ICF-CY)应用于言语障碍儿童的功能诊断、干预、评估和康复;探索儿童语音障碍的患病率与影响,并与政策和服务提供问题进行关联[12]。

7.引文分布。文献之间的引用关系反映了文献在内容或主题上的相通之处,在很大程度上,能说明被引用文献的学术价值及其对其他学术研究的影响[13]。一般来说,被引频次越高,说明文献的质量越好、影响力越大。排名前十二位的语言学文献引文分布情况如表6所示。

表6 语言学文献的引文分布表(Top 12)

由上表可知,当前语言学领域最具影响力的文献为《基于交叉随机效应的被试和项的混合效应建模研究》[14],被引频次高达1574,该文介绍了混合效应模型以分析被试和项作为交叉随机效应的重复测量数据。通过实例展示了如何利用最新软件进行混合效应建模,通过模拟研究证实了混合效应分析相对于Quasi-F检验法、基于被试分析法、基于被试和项目相结合的分析法、随机回归分析法等的传统分析法所具有的优点,并进一步讨论了其在多领域的应用前景。其次为《分类数据分析:从方差分析到混合Logit模型》[15],被引702次,该文探讨了方差分析法在分类结果变量分析中存在的问题,引入了既具有一般Logit模型的优势,又能够解释分析中的随机被试和项目效应的混合Logit模型,并运用心理语言学数据集对多种不同的统计方法进行了比较。《验证性假设检验中的随机效应结构:取最大值》[16]位列第三,该文通过应用蒙特卡洛模拟,基于相关理论基础,论证了随机效应结构对于线性混合效应模型推广性的影响,研究发现应用极大似然估计的线性混合效应模型可以作为心理

语言学等领域进行假设检验的“黄金标准”。

可见,统计学方法等定量分析方法不仅是自然科学领域的重要研究工具,在语言学研究中亦具有重要的作用。

(二)基于形式概念分析的语言学学科主题知识发现

形式概念分析(Formal Concept Analysis,FCA)[17]是Wille提出的一种从形式背景进行数据分析和规则提取的强有力工具,形式概念分析建立在数学基础之上,用于对数据集中的概念结构的识别、排序和显示的数据分析理论。形式概念分析强调以人的认知为中心[18],提供了一种与传统的、统计的数据分析和知识表示完全不同的方法,在数据挖掘、知识发现、信息检索等领域得到了广泛的应用。

本文引入形式概念分析的原理和方法,将学科视为对象,主题词视为属性,将概念视为由学科集合(外延)和主题词集合(内涵)所组成的知识结构单元。构建学科-主题词形式概念背景,即知识单元之间的关联关系。根据形式背景中概念的偏序关系,构建学科知识网络概念格,通过格上作业(层次聚类分析),可视化描述语言学领域演化过程中学科主题知识间的契合、离散关系以及知识属性之间的组分异质性规律。

1.学科分布。学科分布可以反映研究主题的知识利用特点及跨学科性[19]。语言学文献的学科分布情况如表7所示。

表7 语言学文献的学科分布表

序号学科文献量百分比5Audiology & Speech-Language Pathology513510.46%6Rehabilitation44128.99%7Communication20044.08%8Neurosciences & Neurology12282.50%9History7801.59%10Computer Science4840.99%11Arts & Humanities-Other Topics3890.79%12Asian Studies3080.63%13Philosophy2570.52%14Sociology1990.41%15Behavioral Sciences1800.37%16Cultural Studies1440.29%17Anthropology1260.26%18Acoustics1160.24%19Criminology & Penology1060.22%20Archaeology880.18%21Women's Studies860.18%22Science & Technology-Other Topics760.15%23Religion580.12%24Classics60.01%

由上表可知,与语言学领域相关的学科众多,其与文学、心理学、教育与教育研究、听力与语言病理学、康复学、通信学、神经科学与神经学、历史学、计算机科学等24个学科都存在不同程度的知识交叉关联。语言学研究表现出显著的多学科性和学科融合特征。

2.主题词分布。按照关键词词频由高到低进行排序,选取出现160次以上的58个高频关键词(见表8)作为研究样本。在一篇文献中,关键词往往是著者对其研究内容的最准确且最精炼的概括与表达。由于这些关键词是语言学文献中出现频次较高的词,因此它们很大程度上可以体现该领域的研究主题和方向。

表8 语言学文献的高频主题词信息

主题词频次主题词频次主题词频次Stuttering363grammaticalization254aging177phonology352morphology252Chinese169pragmatics351Literacy243English as a foreign language169narrative350Japanese242code-switching167Assessment350interaction229language development165multilingualism327genre227Argumentation163semantics325functional magnetic resonance imaging222translation323corpus linguistics219

由上表可知,双语、会话、话语、身份、二语习得、西班牙语、句法、英语、特殊语言障碍、儿童、失语、口吃、音韵、语用学、叙事、评价、多语制、语义学、翻译等是当前语言学领域的研究热点问题。

3.学科主题形式概念分析。以文献量居于前15位的学科作为对象集,以语言学领域具有实质意义且达到一定阈值的58个高频词作为主题词集,建立学科-高频主题词共现矩阵,即形式概念背景(如表9所示)。

表9 语言学学科主题形式概念背景(部分)

根据形式背景中概念的偏序关系,利用Concept Explorer软件构建概念格,以层次网络的形式重构学科-主题词二分网络。绘制概念格Hasse图(如图2所示),可视化描述与萃取语言学领域的学科主题概念层次结构。

由于上层概念的内涵(主题词)被下层概念所继承,因此最上层概念节点的内涵能够作为学科的主要交叉研究领域,随着概念节点层次的深化,其内涵越丰富,也就是各个研究主题不断细分主题概念,每个主题的关联关键词则可通过与之相连的上层概念的内涵描述出来。而每个主题的关联学科则通过该概念的外延展示出来。越上层的概念主题越宽泛,关联学科越多;越下层的概念主题越具体,关联学科越少[20]。由上图可知,语言学领域与其他学科产生知识交叉关联的主题主要为:话语、隐喻、互动、会话、语言、交流、性别、转换语言、语言习得、语用学等。其中,西班牙语、日语、法语、德语、汉语、英语是这些交叉主题最为常用的研究语种对象。

在语言学领域范畴内,文学、心理学、教育与教育研究、通信学、历史学等学科位于概念格底层,说明其知识内涵最为广泛,与语言学学科关联最为紧密,知识的交叉融合最为深入;神经科学与神经学、亚洲研究次之;再次为听力与语言病理学、康复学;计算机科学位于概念格上层,说明其内涵较为狭窄(即包含的主题特征属性较少),与语言学学科关联相对松散。随着计算机技术的发展,许多语言学理论、方法及成果都是在其基础上或启发下产生和解决的,计算机科学与语言学知识相互协同、渗透,从而衍生出诸多新的交叉领域及科学问题。其中,计算语言学(通过建立形式化的数学模型,来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,从而达到以机器来模拟人的部分乃至全部语言能力的目的)可以说是二者相结合的产物。目前,该领域的研究主要集中在文本信息检索、文献自动分类、自动文摘、语音自动识别与合成、机器翻译以及文本信息提取和过滤等方面。另外,语言资源的建设和基于语料库的语言分析方法也受到了格外关注,取得了较快的进展[21]。

图2 语言学领域学科主题概念格

结论

本文利用文献计量和形式概念分析法,对国际语言学领域的研究现状及学科主题特征进行了全面系统的分析与讨论。得到的主要结论为:

(1)随着时间的推移,语言学领域的探索与创新活动呈攀升趋势。

(2)美国是当今语言学领域文献产出最多的国家。我国的语言学研究虽取得了一定的成果,但还有待进一步加强与完善。

(3)国际权威数据库中收录的语言学领域文献的语种分布极不均衡。其中,绝大多数为英文文献,因此,我国语言学领域学者应重视英文论文的写作,以提升科研成果的国际可见度与影响力。

(4)当前语言学领域的权威期刊为《语用学报》、《语言与听力研究杂志》、《语言学》等刊物。核心著者为Mark Onslow、Ann Packman、Laurence B.Leonard等。

(5)欧美高校为当前语言学领域的主流核心研究机构,且各高校在该领域的科研实力相对均衡。

(6)统计学方法在语言学研究中具有重要的作用。

(7)语言学研究表现出显著的多学科性和学科融合特征。

(8)双语、会话、话语、身份、二语习得、西班牙语、句法、英语、特殊语言障碍、儿童、失语、口吃、音韵、语用学、叙事、评价、多语制、语义学、翻译等是当前语言学领域的研究热点问题。语言学领域与其他学科产生知识交叉关联的主题主要为:话语、隐喻、互动、会话、语言、交流、性别、转换语言、语言习得、语用学等。

猜你喜欢

主题词语言学概念
Birdie Cup Coffee丰盛里概念店
体认社会语言学刍议
《复制性研究在应用语言学中的实践》评介
幾樣概念店
学习集合概念『四步走』
《神经语言学和心理语言学视角下的二语习得》述评
聚焦集合的概念及应用
《中国骨与关节杂志》2016 年第五卷英文主题词索引
我校学报第32卷第5期(2014年10月)平均每篇有3.04个21世纪的Ei主题词
我校学报第32卷第6期(2014年12月)平均每篇有3.00个21世纪的Ei主题词