APP下载

多维尺度聚类方法下本科学生英语逻辑连接词误用研究

2019-12-25顾琦邹琼

校园英语·上旬 2019年12期
关键词:聚类

顾琦 邹琼

【摘要】逻辑连接词是影响英语水平高低的一个重要因素。本研究通过问卷、Spss中的MDS多维尺度聚类方法针对中国学生对逻辑连接词的理解情况做了调查研究。研究发现两组不同水平的学生有相似性和差异性,英语水平和逻辑连接词的掌握情况存在相关性。

【关键词】逻辑连接词;多维尺度;聚类

【作者简介】顾琦(1972.09-),男,汉族,江苏江都人,湖北理工学院外国语学院,副教授,硕士,研究方向:语料库语言学;邹琼(1981.04-),女,汉族,湖北黄石人,湖北理工学院外国语学院,讲师,硕士,研究方向:应用语言学。

【基金项目】湖北理工学院教育教学改革研究项目“多维尺度方法下的本科英语写作逻辑连接词误用研究”(2017 C18)。

引言

英语逻辑连接词是中国大学生在语言习得过程中的难点之一。逻辑连接词的误用直接影响到他们在写作、阅读、对话交流中的逻辑连贯性。

在前期的研究中,众多研究者多通过语料库的方法来统计词频,辅以比较英语本族语者和二语学习者的方法,做出了二语学习者存在过度使用和误用的结论。但这些方法存在不足,只对少数部分逻辑词做了個案分析,但没有在更多数量上有效找到哪些词、哪类词是学生容易误用的。另外,前期的研究对象多是学生的写作文本,处于写作的后端。本研究拟从前端出发,即在写作前,以学生对逻辑连接词的意义、功能的理解、掌握情况作为研究对象。该研究采用多维尺度分析聚类的方法,找到中国学生在逻辑连接词方面的共性问题,有利于在教学中有的放矢解决问题,同时为语料库研究逻辑词引入一个新的方法。

一、文献综述(逻辑连接词)

自Halliday和Hasan(1976)提出衔接理论后,关于连接问题的研究进入了一个新的阶段。Halliday和Hasan认为衔接是语篇连贯的一个重要条件,它包括照应、省略、替代、词汇和连接五种情况,其中连接分为增补、转折、因果和时间等四类。

在理论研究层面,国内有胡壮麟对“连接”这个概念的外延做了明确的界定,他认为连接既包括句间的连接,也包括句内的连接,句内连接一般属于句子语法范畴,句间连接属于语意范畴。朱永生等则对英汉两种语言中连接手段的使用情况进行对比,并分析这种差别主要是英汉两种语言的显性和隐性特点以及不同的断句方式造成的,并从文化、思维和语言的角度分析了产生这些差别的原因,不仅分析了连接手段的运用,还分析了内在原因。

在量化研究层面,国内外的研究者都采取了语料库对比分析的方法,并对比通过计算得出的数据比较本族语者和二语学习者之间的差异。其中Granger & Tyson(1996)对母语为法语的英语学习者和英语本族语者进行对比研究。Alternberg & Tapper(1998)以ICLE为来源,利用其中两个子语料库和他们的自建语料库进行对比研究。另外还有学者进行了更为细致的研究,如对某个连接词进行了详细的分析。比如Lorrita Yeung(2009)对“besides”一词做了深入的研究。

国内学者也采用类似的量化分析方法进行了本土化的研究。赵蔚彬(2003)发现中国学生使用逻辑连计策的密度比本族语者大,但丰富度不足。潘璠、冯跃进(2004)发现中国学生在逻辑连接词的选择上和本族语者相似,但过多使用了某些连接词。

二、实验设计

1.研究方法。

(1)语料库词频统计法。词频统计方法是语料库研究中的一项基本方法。本研究中的逻辑连接词词频统计以语料库LOCNESS为来源。据Halliday(1976)的划分,把173个逻辑连接词分为四类,即时间类、因果类、增补类、转折类。根据频率高低排序,挑选出每个类别中排名前十的词。

(2)问卷调查法。本研究设计《逻辑连接词使用分类调查表》。包括40个逻辑连接词,共计40个题目,要求被试者把逻辑功能类似的词放到一个组,同一组的词之间形成的关系为1,不同组之间形成的关系为0。

(3)多维尺度统计分析方法 。 多维尺度法(Multidimensional Scaling)由Torgerson(1952) 最早提出。Shepard(1962)、 Kruskal(1964)在其基础上进行了扩展。该方法属于多重变量分析的方法之一,是社会学、数量心理学、市场营销等统计实证分析的常用方法。它是一种将多维空间的研究对象(样本或变量)简化到低维空间进行定位、分析和归类,同时又保留对象间原始关系的数据分析方法。Wolff & Song(2003)最早把MDS引入语言学的研究范畴。

2.被试。本研究对象为湖北理工学院非英语专业工科类一年级学生一个班和三年级英语专业类学生一个班。目的一是为了调查比较英语水平不同的英语学习者在逻辑词理解、使用方面有无差异;二是验证英语水平高低和对逻辑词的理解准确度之间有无相关性。

3.实验步骤和数据处理。第一步,遴选列连接词。一是因为它们是四个类别中最常用的,覆盖了日常使用;二是可以降低本研究的难度。首先利用软件AntConc对语料库LOCNESS中的逻辑词进行词频统计,根据频率进行排序,在四个类别中分别挑选排序前十的连接词。为了便于后期研究,随机加上乱序编码:v1-v40。第二步,问卷调查。让被试者在问卷星上对上述40个词进行分类,即具有相同功能的词编为同一个组,导出结果为Excel表格。第三步,多维尺度分析。利用python自制小程序,两个研究组分别汇总成Spss软件MDS方法可识别处理的数据格式,即40个词之间形成1(同组)和0(不同组)两种关系。利用SPSS Statistics 23进行多维尺度方法加工,结果如下:

4.分析和讨论。

发现1:对于这40个词,英语专业组学生聚类成四个关系组,少数词散落在组外;非英语专业学生只能聚类成三个关系组,且较多的词散落在组外。

发现2:专业组聚合的空间关系更为紧密,表明分类较为一致。非专业组虽能聚合,但空间关系较为松散,表明非专业组学生分歧较大。

发现3:为便于观察,将以上述非英语专业组为例,聚类图转换成如下表格。发现两组都存在分类混乱的问题,学生们的分类和Halliday存在一定差异。这表明两组学生对逻辑词意义、功能的理解都存在偏差。这个问题在非英语专业组中更为严重。可推断出那些与所在组不同类的词就是学生没有掌握的。

三、结语

根据以上统计分析,得出以下结论:高年级英语专业学生英语水平高于低年级非英语专业学生公共英语水平,据此推断出逻辑词的掌握情况高低和英语水平的关系呈正相關。英语水平愈高,对逻辑连接词的掌握愈准确。上述被错误分类的逻辑连接词应是今后教学的重点之一,系统性地对逻辑连接词进行教学,有利于提升他们的英语水平,加强写作、口语等输出型的语言能力。

参考文献:

[1]Altenberg, B. & Tapper, M. The Use of Adverbial Connectors in Advanced Swedish Learners Written English. Learner English on Computer [M]. S. Granger(ed). London, New York, 1998:80-93.

[2]Granger, S. & Tyson, S. Connector usage in the English essay writing of native and non-native EFL speakers of English[J]. World Englishes, 1996, 15(1): 17-27.

[3]Kruskal J B. Nonmetric multidimensional scaling: A numerical method[J]. Psychometrika, 1964, 29(2):115-129.

[4]Shepard R N. The analysis of proximities: Multidimensional scaling with an unknown distance function. Part II.[J]. Psychometrika, 1962, 27(2):125-140.

[5]Torgerson, W.S.Multidimensional scaling:I. Theory and method[J].Psychometrika,1952,17 (4):401.

[6]Wolff,P.Direct causation in the linguistic coding and individuation of causal events[J].Cognition,2003,88(1):1-48.

[7]骆文淑,赵守盈.多维尺度法及其在心理学领域中的应用[J].中国考试,2005(4):27-30.

[8]潘璠, 冯跃进.非英专业研究生写作中连接词用法的语料库调查[J]. 现代外语,2004(2):157-162.

[9]赵蔚彬.中国学生英语作文中逻辑连接词使用量化对比分析[J]. 外语教学,2003(2):72-77.

猜你喜欢

聚类
K-means算法概述
K-means聚类方法在图像色彩中的应用
基于模糊聚类和支持向量回归的成绩预测
一种基于广域测量信息的在线同调分群方法
针对Kmeans初始聚类中心优化的PCATDKM算法
基于流形学习的自适应反馈聚类中心确定方法
交通监控中基于模糊聚类的无线传感网MAC协议
基于密度的自适应搜索增量聚类法
数据挖掘的主要技术
K—means算法研究综述