APP下载

基于语料库的同义词组辨析*
——以adhere to,cling to,hold to为例

2016-05-14赵杭飞杭州师范大学外国语学院浙江杭州311200

湖州师范学院学报 2016年3期
关键词:搭配语域词频

赵杭飞(杭州师范大学外国语学院,浙江杭州311200)



基于语料库的同义词组辨析*
——以adhere to,cling to,hold to为例

赵杭飞
(杭州师范大学外国语学院,浙江杭州311200)

摘 要:作为新的语言研究方法,语料库语言学对于语言研究影响重大,基于语料库的研究也已在多个领域得到广泛应用,然而对同义词组的研究甚少。本文借助美国当代英语语料库(COCA)从词频、语域、搭配以及语义韵四方面比较区分同义词组adhere to,cling to,hold to的用法,旨在帮助英语学习者区分这三个词组的含义及用法,以期对教学及词典编纂提供有益借鉴。

关键词:COCA语料库;同义词组;词频;语域;搭配;语义韵

一、引 言

《现代汉语词典》[1](P1265)里的同义词释义为“意义相同或相近的词,如‘教室’和‘课堂’,‘保护’和‘保卫’,‘巨大’和‘宏大’”,近义词[2](P121)则属于“广义上的同义词”,两者均可译为synonym。因此,本文在此不深究这两个词的含义,且根据国内现有研究,统一为“同义词”加以讨论。在知网上以“近/同义词”为关键词,我们可以发现2009-2014年的各类期刊上已出现大量有关基于语料库的同义词辨析研究,国内研究语种主要涉及汉语和英语[3][4][5],研究词性涉及动词(suspect/doubt,adapt/adjust,confused/puzzled 等)、副词(specially/particularly/especially,rather/quite等)、形容词(great/large/huge,mall/little等)、名词(event/affair,convention/regulation等),国外研究情况大致相同,但涉及语种更多,如俄语、西班牙语等[6][7]。然而,由于现代英语同义词组复杂多变,学术界对于phrase的界定仍存有分歧,对英语词组的研究还未形成一定规模[8](P60),因此,国内外少有对同义词组的辨析研究。虽然国内已出现对同义词组辨析的初步探索[9],但其分析不够全面。

计算机的普及和语料库语言学的快速发展,为辨析同义词组提供了新的研究方法。语料库语言学的重要任务之一为如何在此基础上,结合描写与实证分析,定性研究与定量研究来充分解释语言现象[10](P8)。美国当代英语语料库(Corpus of Contemporary of American English,简称COCA)是当今世界上最大的在线免费英语平衡语料库。由于定期更新,目前其语料年限为1990-2012年,单词容量已超4.5亿,适合观察美国英语使用和变化。它具备了一个好语料库的三项最基本条件:规模(size)、速度(speed)、词性标注(annotation)[11](P27)。总之,该语料库检索功能强大,有助于语言学习者和语言学家了解单词、短语及句子结构等相关信息。基于语料库的同义词组分析对于发现同义词组的具体用法意义重大。本文旨在分析英语中三个常见的同义词组adhere to,cling to和hold to。这三个词组可用中文译为“坚持”,但是在用法上却有细微的差别。该文利用COCA检索工具分析三个同义词组的不同用法,对比词典释义,从而对英语教学和语言学习甚至词典编纂有所启发。

二、adhere to,cling to,hold to在COCA中的差异分析

国内现有的相对权威的英语词典或同义词辨析词典虽有给出较详细的辨析,并提供相应的例句,但限于篇幅原因,有些会以词组形式简单代替同义词的辨析,同义词组的全方面辨析则更少。如英语教辅书对三者的区分为“hold to后接名词或从句作宾语,不接不定式,意为‘(使)遵循’,‘坚持’,‘忠于’,与adhere to,cling to差异很小,一般可通用。hold to更常用。”[12]作为权威的英语学习工具书,《新牛津英汉双解大词典》[13]给出如下定义:

adhere to:stick fast to/believe in and follow the practices of/represent truthfully and in detail.

cling to:(of a person or animal)hold on tightly to/adhere or stick firmly or closely to/remain very close to…

hold to:refuse to abandon or change对于英语学习者来说,他们很难从教辅书上获取这三个词组的明显差异,而词典上的释义又存在循环释义的现象,特别是adhere to和cling to。显然,这些释义在很大程度上不能解决学习者的困惑,不利于英语的学习。本文将从词频、语域、搭配和语义韵四方面对这三个同义词组进行对比分析。

(一)词频

为准确把握语料库的数据,首先需要区分“频率”和“频数”,前者指语料库中某一词汇、短语每百万词(per million)出现的频数,而标准化前的频数译为“频数”(occurrences)[5]。由于动词在不同语境中存在多种形态,因而三个词组的输入形式为[adhere]to,[cling]to,[hold]to。在用户注册登录后,分别将这些词组输入SEARCHING STRING一栏中,点击搜索SEARCH后,得到这三个词组的总体出现频率,分别为3053、5337、2334。

由上述数据可知,以上同义词组中出现频率最高的是cling to,出现频率最低的为hold to。根据以上数据,这三个同义词组的频率排序依次为:cling to,adhere to,hold to。依据该结果,在表达“坚持”的含义时,cling to在英语中最常使用,而hold to使用频率最低。尽管总体频率不能给出更多信息,比如如何使用,在何种情况下使用等,但对于英语学习者而言,为了使用语更加地道,在表达“坚持”时可更多选择cling to和adhere to这两个高频词组。

(二)语域

语域(register)是指在语言活动中,因为存在不同因素的差异,如交际双方的性格、兴趣、说话的地点等,新的言语变体在交际中产生,体现为不同的语体风格、用语习惯等[14]。许多同义词组所表达的基本概或意义相同,但使用的场合或使用对象不同。语域常有正式、非正式、正式语体、口语语体之间的变化。本文使用COCA中的图表显示(CHART)进行搜索,返回的结果清晰显示了三个词组在各子语料库中的总词数、各个子语料库词总数、各个子语料库中按每百万词数的呈现比率以及词频分布矩形图,根据研究需要,现只呈现每百万词数的呈现比率。(表1)

表1 三个同义词组在每百万词数中的呈现比率

为了更直观地比较出三个词组的分布差别,本文将所得图表中出现的总频数及五类语域的频数绘制为图1,并且进行比较说明。

图1 adher e to,c l ing to,ho l d t o在COCA中出现的频数图

通过图1,可以直观观察到adhere to在学术文章的所占频数最高,因而语体最为正式。根据五大子语料库中的词频分布矩形图和按每百万词数的呈现比率数字,三者在口语中的频数相差无几,cling to在小说和杂志中出现的频率较高。此外,hold to在学术语域中出现的频率为7.49,远高于cling to,后者的学术比率为5.41。综上所述,这三个同义词组的正式程度为:less formal,adhere to,hold to,cling to,more formal。对于这三个词组如果单从概念意义出发,很难说出它们之间的细微差异,但根据它们在不同语域中的不同频率,学习者便能对它们的语体辨析产生较为直接的感性认识。

另外,根据COCA的CHART功能,还可以得到这三个词组在使用上的历时变化情况。同样,为了更加直观地比较出三个词组在不同年度区间的分布差异,将三张图表中出现的五个年度区间的频数绘制为图2,并且进行比较说明(注:鉴于2010-2012只有三年,本文不作考虑)。

图2 adher e to,c l ing to,ho l d t o在不同年度区间出现的频数图

上图显示adhere to,cling to,hold to在COCA中不同年度区间的“频数”,从1990-2009年间三个词的使用频数一直以cling to为最多,其余依次为adhere to和hold to,这与词组的总频数结论一致,hold to的使用在未来可能存在消失状况。此外,hold to的使用总体上呈下降趋势,adhere to和cling to保持基本平稳态势。这在一定程度上反映了这三个词组在使用上的历时变化状况,对学习者有一定的指导意义。

(三)搭配

“搭配”一词首先由Firth从技术术语的角度提出,意指“词项的习惯性结伴使用”,它是从横组合的角度看待词汇[15](P14)。后来新Firth学派的代表人物Halliday和Sinclair发展了Firth的词项“结伴”说,并认为通过语料库的统计手段如节点词、跨距、搭配词等可以测量“线性共现”,即节点词和搭配词间的相互吸引力[16](P46)。在语料库中,MI值即相互信息值(Mutual Information Value),体现词汇间的搭配强度和具体搭配的显著程度[11](P29)。搭配在英语学习中尤为重要,它是区分同义词组的有效依据之一。本文采用常见的计量方法MI值来进行统计研究。通常来说,MI值大于3的搭配可视为显著搭配。

1.动作的发出者

在COCA语料库中,以这三个同义词组[adhere]to,[cling]to,[hold]to为节点词,搜索三个词组前面的搭配名词,跨距为(4,0),词性设置为noun.ALL,由于互信息容易将低频词视作强搭配,所以本研究将同时参考出现频数和互信值。因此,所有数据按FREQUENCY排序,并将所有的搭配代词以LEMMAS的形式表现出来。点击搜索SEARCH后,取前10个数据,得出以下表格。(表2)

表2 前10个和adhere to,cling to,hold to搭配的名词

由表2可得,在与adhere to的搭配的名词中,显著性较强的有teacher,member,country,law,government等,说明该词的主语通常为国家机构和法律等抽象名词以及学校成员等具体名词。与cling to的搭配中,显著搭配有dust,shirt,hair等无生命的具体名词。通过语境发现,此时cling to的意义多为“粘住,依附”,其余则以people,man,child等人物名词为主,也存在way等抽象名词的搭配。而与hold to的搭配中,其显著搭配为meeting,hearing,conference,election等与政治相关性较强的抽象名词以及gun这一具体名词,其余则为有生命的hand,woman,people等概括性名词居多,也涉及life,time等抽象名词。

因此,从搭配的名词主语来看,adhere to通常为国家机构和法律等抽象名词以及学校成员等具体名词,cling to常与无生命的具体名词搭配表达其他意义,hold to以政治相关性较强的抽象名词为主语出现较多。

2.动词支配的宾语

为了更好地通过搭配词进一步区分这三个同义词组,把这三者均视为及物性动词词组。同样,在COCA语料库中,以这三个同义词组[adhere]to,[cling]to,[hold]to为节点词,跨距为(0,+4),分别输入SEARCHING STRING中的WORD(S),将词性设置为noun.ALL,由于互信息容易将低频词视作强搭配,所以本研究将同时参考出现频数和互信值,因此,所有数据按FREQUENCY排序,并将所有的搭配代词以LEMMAS的形式表现出来。点击搜索SEARCH后,限于篇幅,取前20个数据,得出表3。根据COCA所显示的数据,和adhere to搭配的抽象名词和具体名词比例分别为96%和4%,和cling to搭配的比例分别为24%和76%,而和hold to搭配的名词比例分别为80%和20%。由此可见,adhere to多和抽象名词搭配,很少和具体名词搭配,如guideline,policy,value等,也可以和具体名词搭配,如script,但也多为“粘附”的意义。其次是hold to主要与抽象名词搭配,例如standard,belief,maturity,principle等,也可以和具体名词搭配,多与身体部位相关,如chest,ear,throat,forehead等,但语义变为“紧紧握住等”。最后为cling to,主要与具体词搭配,但意义改变,当意义为“坚持”时,多与抽象词belief,religion等搭配。以上结论如表4所示。

表3 前20个和这三个同义词组搭配的名词(从左到右依次为adhere to,cling to,hold to)

表4 与adhere to,cling to,hold to搭配的抽象名词和具体名词的比例

(四)语义韵

在对同义词组的辨析过程中,学习者易掌握其概念意义,而很难掌握附加意义。因为附加修辞意义是在概念意义的基础上增添了很多态度信息、文化信息、环境信息和其他一些综合信息。因此,需要通过研究其共现语境,即语义韵,从而了解更多附加意义。

语义韵(semantic prosody)是指一定的词项会习惯性地吸引某一类具有相同语义特点的词项构成搭配,而文本中的高频共现会使该词项(节点词)“传染”上了有关的语义特点,形成特殊的语义氛围[17](P156-159)。Stubbs把词语搭配形成的语义韵分为消极、中性和积极三类[18](P176)。由以上COCA语料可所提供的数据可得(详见表3),这三组同义词组的搭配名词基本没有表现出明显的消极语义韵。cling to的搭配名词的语义韵相对其他两个同义词组表现得较为积极,如hope,belief,faith等。而adhere to和hold to所搭配的名词基本表现为中立的语义韵,如它们共同搭配standard,principle,norm等。

三、结 论

通过COCA语料库比较同义词词组adhere to,cling to,hold to的用法,本文得出以下结论:adhere to,cling to,hold to在词频、语域分布、搭配以及语义韵上存在差别,其表现为这三个同义词组的频率排序为cling to,adhere to,hold to;正式程度顺序为adhere to,hold to,cling to;cling to的搭配名词的语义韵较为积极,adhere to和hold to所搭配的名词基本表现为中立的语义韵等。

传统教学中,教师多采取内省或主观经验区分同义词组间的用法,而词典释义往往脱离具体语境,缺乏有效的辨析。因此,除文章提及的四方面外,教师可充分利用语料库开展进一步的研究,如类联接等状况,并结合其他知识技能,将同义词组辨析的各研究成果通过简洁明了的图表方式呈现,使繁琐的教学内容变得可视化、形象化,从而减少学生在学习知识难点时所需付出的认知努力。此外,真实的语料可以为同义词组词典的编纂提供有效建议。由于语料库的检索有一定步骤和要求,在数据的整理和统计上因研究需要会存在不同的标准,其存在的不足和基本模式的形成还需在今后的研究中作进一步的探讨。

参考文献:

[1]中国社会科学院语言研究所词典编辑室.现代汉语词典(第五版)[Z].北京:商务印书馆,2005.

[2]兹古斯塔.词典学概论[M].林书武,等译.北京:商务印书馆.1983.

[3]王春艳.基于语料库的中国学习者英语近义词区分探讨[J].外语与外语教学,2009(6):27-31.

[4]叶桂瑛.汉语同义词“再”与“又”的辨析及其相应泰语词对比[J].江西科技师范学院学报,2014(3):10-17.

[5]霍艳娟.基于BNC语料库的同义词adapt和adjust用法辨析[J].长春师范学院学报,2014(1):83-87.

[6]VIIMARANTA J.The meaning and use of“podportit”on the basis of the Russian National Corpus[J].Russian Linguistics,2014(1).

[7]LÓPEZ R,ANA M.Distinguishing near-synonyms and translation equivalents in metaphorical terms:Crisis vs.recession in English and Spanish[J].Review of Cognitive Linguistics,2011(1).

[8]钱文伟,曾东京.浅论现代英语同义词组的基本特点及其辨析词典的编纂[J].广东外语外贸大学学报,2005(16).

[9]高洁.通过查阅字典和语料库检索进行同义词组辨析的对比研究——以make efforts和take effort为例[J].英语教师,2013(10).

[10]王克非.语料库翻译学探索[M].上海:上海交通大学出版社,2012.

[11]汪兴富,Mark Davies,刘国辉.美国当代英语语料库(COCA)——英语教学与研究的良好平台[J].外语电化教学,2008 (5):27-33.

[12]梁为祥.大学英语四级重难点及新题型精解[M].合肥:安徽科学技术出版社,2000.

[13]JUDY P,PATRICK H,CATHERINE S,STEVENSON A.新牛津英汉双解大词典[Z].庄智象,等译.上海:上海外语教育出版社,2007.

[14]HALLIDAY M A K,MCLNTOSH A,STREVENS P.The linguistic sciences and language teaching[M].London: Longman,1964.

[15]FIRTH J R.Papers in linguistics[M].London:Oxford University Press,1954.

[16]杨春霞.基于语料库的近义词辨析研究:以suspect和doubt为例[J].西南科技大学学报,2014(5):45-49.

[17]LOUW B.Irony in the text or insincerity in the writer?The diagnostic potential of semantic prosodies[A]//FRANCIS M,TOGNINI-BONELLI E.Text and Technology:In Honor of John Sinclair[C].Philadelphia and Amsterdam:John Benjiamins,1993.

[18]STUBBS M.Text and Corpus Analysis[M].Oxford:Blackwell Publishers,1996.

[责任编辑 铁晓娜]

A COCA-based Comparative Study on Synonymous Phrases like“adhere to”,“cling to”and“hold to”

ZHAO Hang-fei
(School of Foreign Languages,Hangzhou Normal University,Hangzhou 311200,China)

Abstract:As a new language research method,the corpus linguistics has made the major impact on language study and the corpus-based study has been widely used in various fields.However,there is little research on the synonymous phrases.Based on COCA corpus,this paper tries to do the research on how to study synonymous phrases with“adhere to”,“cling to”and“hold to”as a case.Through comparing the differences among them from four aspects:frequency,register,collocation and semantic prosody,this paper not only aims to help English learners distinguish the meanings and usages of these three synonymous phrases,but also to benefit English teaching and lexicography.

Key words:COCA corpus,synonymous phrases,frequency,register,collocation,semantic prosody

作者简介:赵杭飞,在读研究生,从事当代语言学、英汉语对比与翻译研究。

*收稿日期:2015-12-30

中图分类号:H315

文献标识码:A

文章编号:1009-1734(2016)03-0102-06

猜你喜欢

搭配语域词频
25年来中国修辞研究的关键词词频统计*——基于国家社科与教育部社科课题立项数据
《约翰·汤普森简易钢琴教程》教材之我见
基于语料库的英语动词open的搭配研究
“反而”的语义韵考察
基于BYU语料库的英语专四词汇试题解析
基于语料库的近义词辨析
词频,一部隐秘的历史
以关键词词频法透视《大学图书馆学报》学术研究特色
汉语音节累积词频对同音字听觉词汇表征的激活作用*
浅析语域的特性及教学模式探讨