APP下载

基于语料库的英语新词研究

2014-01-26贺丽励于桂敏

大连民族大学学报 2014年2期
关键词:高频词构词法新词

贺丽励,于桂敏

(大连民族学院外国语言文化学院,辽宁大连116605)

基于语料库的英语新词研究

贺丽励,于桂敏

(大连民族学院外国语言文化学院,辽宁大连116605)

采用语料库的研究方法,以LOB语料库和BNC语料库的一部分为基础,对英国标准书面语在20世纪50年代末,60年代初到80年代中期和90年代中期的词汇进行对比研究,旨在发现英语新词的特点及规律,以期对英语词汇发展趋势进行预测。结果表明,80年代中期和90年代中期科学技术类词汇在整个新词中占优势。通过对构词法的进一步研究发现:80年代中期和90年代中期的新词更倾向于使用复合法及首字母拼缀词。

语料库;英语新词;语言变化;词汇变化

“新词”,从时间角度上来说,可以指出现在某一时间段内或自某一时间点以来所首次出现的词汇。在语言学上,新词指一个最近铸造的词,或发明词或词组行动。新词的产生大致通过两种途径:借入或构词法。英语在过去的1500年中借入了几乎每个国家的语言[1]。世界各国的相互交流和社会生活各方面的变化给英语带来了大量新词。20世纪是一个社会变革加剧,科学技术飞速发展,计算机技术和通讯产业日新月异的世纪,特别是近50年以来,英语中出现了大量新词。二战后,随着大量新词的出现,英语新词成为备受学者关心的研究领域。美国教授John A.于1993年完成了对Fifty Years among the New Words:A Dictionary of Neologisms,1941~1991一书的编写,详细记录了50年来涌现于各个领域的英语新词,剖析了新词产生的原因。1998年,德国语言学家Fischer R.采取基于语料库的研究方法,对当代英语词汇变化的理论、新词的构词方式、词汇的多产性和词汇变化的动机进行了有力地阐释[2]。Metcalf A.于2004年在他的著作《预测新词:他们成功的秘诀》一书中,研究了由于历史和社会原因而产生的英语新词,分析了一些新词能长期存在的原因,由此预测出21世纪将会在历史舞台长盛不衰的英语单词[3]。与此同时,国内也有许多学者从语义学、构词法等角度撰写了大量论文分析英语新词,汪榕培教授论述了英语新词的来源及展望;徐启龙以网络语料库为基础,对英语新词的用法进行调查研究;邵斌等采用语料库方法从认知语义角度研究英语新词[4-6]。可见,英语新词研究已成为国内外英语语言学研究领域中的一个重要课题。

一、研究设计

用语料库研究英语新词,可以采用比较两个语料库的方法,通过对比建立于不同时期的两个语料库的不同词汇,展示词汇变化。正如Homles J.所言,“研究语言变化的理想情景是采用比较两个语料库的方法,如比较词的频率,这两个语料库采用平行原则,分别建于不同时期,这成为研究语言变化,至少是词汇变化的基础”[7]。我们使用LOB语料库(建于20世纪50年代末-60年代初)和BNC语料库(建于1984-1985年)对大约30年间的词汇进行对比分析。LOB语料库代表了20世纪50年代末60年代初的普通书面英国英语,其语料包括新闻报导、社论、备忘录、宗教材料、侦查小说、科幻小说以及一般小说故事。而BNC语料库代表了1984年至1994年间的普通书面英国英语,其语料涉及所有领域,如应用科学、艺术、抒情散文、商业与金融、自然科学、思维与信仰、休闲、社会科学及国际事务。本文通过比较这两个建立于不同时代的语料库来揭示三十年来产生的新词。采用随机抽样的方法,使用整个100万字的LOB语料库和100万字的BNCS语料库(抽自1亿单词的英国国家语料库BNC语料库)对标准英国书面英语的词汇进行比较。LOB与BNCS的词汇统计数据见表1。

表1 LOB与BNCS的词汇统计数据

检索出两个语料库的形和类符之后,分别检索出LOB独有词汇(即在80年代中期和90年代中期消失的词),BNCS与LOB共有的词汇(即30年间保持不变的词),和BNCS独有的词汇(即在80年代中期和90年代中期新产生的词)。其中,BNCS独有的词汇,即为标准英国书面英语从20世纪50年代末60年代初至80年代中期和90年代中期产生的新词。LOB独有的词汇、LOB与BNCS共有的词汇和BNCS独有的词汇数据见表2。

表2 各语料库词汇量分布

二、英语新词的分布特征及产生原因

1.英语新词中高频词的分布

本文的研究对象为BNCS独有的词汇,即在80年代中期和90年代中期新产生的词。由于高频词更具有时代代表性,我们重点研究BNCS独有的词中的前100个高频词。在词汇量为39 232的BNCS语料库中,BNCS特有的词汇为19 625个,即新词约占50%。这在英语发展史上是空前的,因此90年代被称为“新词革命”。如下为BNCS独有词汇的前100个高频词:UNIX,IBM,software,Microsoft,program,RNA,conservation,disk,interface,Hewlett-Packard,Microcomputer,NT,mainframe,video,dollarm,referral,OSF,workstation,desktop,Intel,EC,CREB,Kinnock,database,UX,LCH,Micro,RISC,EVA,HIV,wildlife,SPARC,DNA,ATF,SCO,MIPS,ICL,FRAC,WACC,Microsystem,Eurobond,PLC,Novell,Eadwine,N-oct,Burun,Zadak,spadefoot,DTI,ethnic,amnesty,Noriega,wabi,Rilla,Merrill,bistable,VDU,Taligent,Minton,AIX,Kiah,intercourse,clone,subunit,Ludens,Liz,default,CDNA,Cagney,Xopen,Steffi,plasmid,netware,geodesic,font,UFO,Solaris,Shamlou,recycle,Nome,Molla,SVR,RSPB,polymerase,CPU,profitboss,ORF,Endill,cursor,Br,arteface,AEA,reportedly,ovulation,Heathcliff, GDR,Fred,Fenari,DCE,update.

2.英语新词的词性分布

英语单词根据其在句子中的功用,可以分为十种词性,分别是名词、动词、形容词、代词、副词、数词、冠词、介词、连词和感叹词。由于名词、形容词、副词和动词相对活跃,特将BNCS独有的词汇的前100个高频词依词类不同进行如下分类:

(1)名词由专有名词(人称名词、地理名词、物体名词和机构名词)和普通名词构成:

专有名词:Dollarm,Kinnock,Eadwine,Bu-run,Noriega,Rilla,Riah,Liz,Cagney,Steffi,Shamlou,Molla,Endill,Heathcliff,Fred,Fenari; Zadak,Nome,Ludens;Unix,IBM,Microsoft,Hewlett-packard,Intel,RNA,EC,CREB,UX,LCH,RISC,EVA,HIV,SCO,MIPS,Sparc,DNA,ATF,ICL,FRAC,WACC,Eurobond,PLC,Novell,N-oct,DTI,Wabi,USL,Merrill,VDU,Taligent,Minton,AIX,CDNA,XOPEN,UFO,Solaris,SVR,CPU,ORF,BR,NT,AEA,GDR,DCE;OSF,RSPB

普通名词:software,program,conservation,disk,interface,microcomputer,mainframe,video,referral,workstation,desktop,database,micro,wildlife,microsystem,spadefoot,amnesty,intercourse,clone,subunit,default,plasmid,netware,font,polymerase,profitboss,cursor,artefact,ovulation

(2)副词:reportedly

(3)形容词:ethnic,bistable,geodesic

(4)动词:recycle,update

从词性上看,名词尤其是专有名词占主导地位。

3.英语新词的语义分布

从语义类别上看,可以说英语新词涵盖了政治、经济、科技、文化、教育、生活各个领域,但是,从数量上分析,源于科技领域的新词居多,以下是BNCS独有的词汇的前100个高频词的主要语义分布:

(1)政治:Zadak,amnesty,Noriega,NT,referral,Kinnock,GDR,reportedly

(2)商业:WACC,Eurobond,PLC,DTI,Merrill,EC,Creb,Ludens,profitboss,AEA

(3)科学技术:EVA,ATF,ICL,interface,video,bistable,VDU,Minton,clone,subunit,

plasmid,geodesic,UFO,recycle,cursor,DNA,RNA,CDNA,polymerase,ORF,Sparc,SCO,FRAC,microsystem,Novell,UNIX,IBM,software,Microsoft,program,disk,microcomputer,mainframe,workstation,desktop,Intel,database,UX,LCH,micro,Taligent,AIX,XOPEN,netware,SVR,CPU,RISC,hewlett-packard,hypertext

(4)电脑技术:MIPS

(5)人与社会:OSF,Kiah,Burun,Nome, font,Molla,BR,Fred

(6)环境:wildlife,spadefoot,RSPB,SOLAS

(7)医疗保健:HIV,N-oct,ovulation

(8)生活方式与休闲:conservation,intercourse,default,artefact

(9)体育:USL,Steffi

(10)艺术和音乐:Eadwine,Rilla,Dollarm,Liz,Cagney,Shamlou,Endill,Heathcliff,Fenari

(11)通俗文化:ethnic

从语义类别上看科技领域里的新词占一半以上,其中,32个是涉及个人电脑的新词。计算机技术发展的速度之快,使新的术语都难以跟上其发展步伐。科技进步影响了大众媒体,也对语言变化产生了深远影响,尽管互联网仍处于早期阶段(万维网于1991年开始运作,大多数人直到90年代中期才会使用),我们已经看到了语言变体的新类型。但似乎使用非正式语言的频率在语言史上比任何阶段都高,我们可以看到地方群体使用标准的迅速出现与强化。这些新的变体一定比以往更可能取得发达的书面表达形式,通过网络的全球扩张,产生深远的国际影响。媒体毫无疑问促进了语言的变体,也在三方面加速了语言变化:首先也是最明显的是,每一种革新都引入了一种新的术语,如印刷业和广播业中大量的科技术语;其次,其中一些术语被用于科技领域之外,发展了其修辞意义或流行含义,用于讽刺、喜剧和其他喜剧性情景中;第三,科技中新的语言形式的运用更令人关注[8]561。英语词汇的创新性与其所处的社会、文化和心理因素息息相关,这表明,政治、科技、艺术在30年间都经历了深刻的变革。50、60年代美苏争霸,而在90年代初,苏联解体,经济全球化使世界变成一个“地球村”。世界各国致力于经济发展规划和改革,这一趋势推进了全球金融、贸易的发展,跨国公司如IBM,Microsoft等在世界各国建立分支机构。科技飞速发展。DNA、RNA展现了新生物技术和基因工程在30年间所取得的重大突破。80年代,基因工程跃然成为一个迅速发展的科技领域,1997年科学家成功克隆出多利羊,克隆技术成为现代科技的最重大突破之一。20世纪60年代性解放在发达国家风行一时,给艾滋病传播加速助威,到了90年代,HIV病毒在全球范围日益肆虐。信息技术成为20世纪科技发展的最重要的成果。关于个人电脑的词汇IBM,Microsoft,software等对人们来说早已耳熟能详。不难发现,在BNCS独有词汇的前100个高频词的电脑技术类词汇中,含micro的词就有3个:microsystem,Microsoft,microcomputer。

4.英语新词的构词法分析

从英语词汇学的角度上看,英语的构词法主要有复合法、派生法、缩略法等。大多数新词是通过这几种构词法构成的,因此,从构词法角度,我们将BNCS独有的词汇的前100个高频词分类如下:

(1)复合法:Hewlett-packard,software,mainframe,workstation,desktop,database,wildlife,spadefoot,netware,profitboss,worldwide,Xopen,update

(2)派生法:conversation,Microsoft,Eurobond,interface,microcomputer,referral,cursor,artefact.subunit,default,polymerase,intercourse,bistable,recycle,geodesic,hypertext,ovulation,reportedly.

(3)首字母缩略词:IBM,RNA,EC,UX,LCH,SCO,ATF,ICL,WACC,PLC,DTI,IV,USL,VDU,RSPB,UFO,SVR,CPU,BR,NT,CDNA,OSF,GDR,AEA.

(4)首字母拼音词:CREB,RISC,EVA,HIV,MIPS,FRAC,ORF.

从构词方式上看,使用频率从高至低依次为:复合法、首字母拼缀法、派生法,这与汪榕培[4]的发现相一致:大多数新词语都是用传统的构词方法构成的,其使用频率依次为复合法、缩略法、派生法、转化法、逆生法和拟声法。现代语言的一个显著特征是复合词家族的发展壮大,这是由于特定文化的流行或科技的发展,如飞机行业的发展带来了相关的复合词air ambulance,airbus[8]19。可见,BNCS特有的词汇除了使用传统构词法复合法、派生法之外,还广泛使用首字母拼缀法,而首字母拼缀法是20世纪极为多产的一种构词方式,它代表了当今以缩略法为基础的最重要的构词方式,是对20世纪以交际为特征的社会的直接反应,以帮助人们在被科技术语包围的今日顺利进行日常交流[9]。一般说来,首字母拼缀词不是有力的构词方式,然而他们在30年间大受欢迎,其主要原因是随着科技的发展,人们生活节奏的加快,首字母拼缀法构词迎合了人们寻求创新的心理,并以其简洁,醒目的特征走入人们的生活并为人们所接受。

三、结 语

在20世纪80年代中期和90年代中期产生的英语新词中,科学技术类词汇占优势,而在科技类词汇中,涉及到个人电脑类的词汇占主导地位。其主要原因是,而80年代中期和90年代中期是科学技术,尤其是电脑技术迅速发展的时代,是科技发展为第一生产力的时代。通过对构词法的进一步研究发现:80年代中期和90年代中期的词更倾向于使用复合法及首字母拼缀法。总之,英语词汇趋于简化,词汇日趋丰富,大量科技词汇日益涌现。

由此可预见英语词汇有以下两种发展趋势:首先,英语新词将继续增加。随着越来越多的国家把英语作为第二语言和经济全球化的加剧,加之网络对人们日常生活乃至语言的影响日益深化,词语的不同表达形式和新词将源源不断地涌入。第二,英语单词形式将更加简化。随着现代生活节奏的加快,人们希望在有限的时间内获取更多的有用信息。所以单词的简化将成为英语词汇发展的另一个趋势。网络、大众传媒都将更关注并使用简单的词语,因而英语中将会有更多的单词以首字母拼写法的形式出现。

[1]LEITH D.A Social History of English[M].London: Routlege&Kegan Paul,1987:87.

[2]FISCHER R.Lexical Change in Present Day English:A Corpus Based Study of the Motivation,Institutionalization,and Productivity of Creative Neologisms[M].Gunter Narr Verlag,1998:64.

[3]METCALFA.Predicting New Words:The Secrets of their Success[M].Houghton Mifflin Harcourt,2004:97.

[4]汪榕培.英语新词的来源及展望[J].外语与外语教学,2000(9):7-11.

[5]徐启龙.基于网络语料库的英语新词用法调查研究——以Google为例[J].外语电化教学,2007(2): 71-76.

[6]邵斌,何莲珍,王文斌.基于语料库的英语新词认知语义研究——以“碳族复合词”为例[J].外语教学理论与实践,2012(4):21-27.

[7]HOMLES J.Inferring Language Change from Computer Corpora:Some Methodological Problems[J].ICAME Journal,1994(18):27-40.

[8]CRYSTAL D.The Stories of English[M].New York: The Overlook Press,2004.

[9]MAIR C.Twentieth-Century English:History,Variation and Standardization[M].New York:Cambridge U-niversity Press,2006:69.

A Corpus-based Study of the New Words in English Language

HE Li-li,YU Gui-m in
(College of Foreign Languages&Cultures,Dalian Nationalities University,Dalian Liaoning 116605,China)

In this corpus-based paper,a setof samplewas drawn randomly from the British National Corpus(BNC)for comparison with the Lancaster-Oslo/Bergen(LOB)corpus to discover the characteristics and the law of the new words in English language and to predict the tendency of the development of the English vocabulary.The results indicate that vocabulary on science and technology shows predominance among the new words in the mid 1980s and mid 1990s.Further investigation ofword formation processes shows that the new words inmid 1980s and mid 1990s tend to adopt compounding and initialism more often than those in the late 1950s and early 1960s.

corpus;new English words;language change;lexical change

H313

A

10.13744/j.cnki.cn21-1431/g4.2014.02.017

1009-315X(2014)02-0165-04

2013-09-16;最后

2013-10-24

中央高校基本科研业务费专项资金资助项目(ZJ13RWYB007)。

贺丽励(1979-),女,山东烟台人,讲师,主要从事外国语言学及应用语言学研究。

(责任编辑 王莉)

猜你喜欢

高频词构词法新词
声音·数字·新词 等
30份政府工作报告中的高频词
省级两会上的高频词
28份政府工作报告中的高频词
省级两会上的高频词
《微群新词》选刊之十四
构词法在英语教学中的应用
小议网络新词“周边”
外教新词堂
说说英语构词法之合成词