APP下载

基于语料库的中美高校网站英文简介的高频词共选研究

2014-08-21郑瑞峰许霄羽

关键词:高频词语料库网页

郑瑞峰,许霄羽

(西北工业大学,陕西 西安 710100)

经济全球化的发展与延伸使高等教育全球化成为教育发展的必然趋势,国际交流逐渐成为高校工作的重心。中国高校若想走出国门,与国际高等教育接轨,除了一流的科研、师资及管理外,对外宣传及国际交流亦尤为重要。作为对外宣传及进行国际交流的窗口,高校门户网站上的英文简介直接影响着中国高校的国际形象。因此,高校网页英文简介的语篇构建及内容逐渐引起语言学研究者的关注,然而多数学者注重对比研究中外高校网站英文简介:从语步的顺序、长度和发生频率等方面对比中美大学英文介绍的语步结构的异同;[1]以中美高校英文简介语篇内容为研究对象,指出中国高校英文简介内容缺乏全面性等。[2]然而,鲜有研究者对比分析中美高校英文简介的词汇共选及修饰语使用差异等问题。

一、理论背景

随着语料库语言学的兴起与发展,与其相关的理论也得到了逐步的发展与完善。共选理论作为新弗斯语料库语言学最重要的理论阐述,将传统语法视为相互分离的词汇、语法及意义有机地统一起来,为语篇分析提供了全新的视角和更为科学客观的理论基础。[3]共选 (co-selection)指语言交际过程中形式与形式、形式与意义的共选。[4]共选理论认为,任何单词、语法与形式的选择并不是孤立进行的,其相互之间存在着共选关系,即单词与单词的共选、单词与语法的共选、单词与形式的共选。

基于共选研究,Sinclair总结出扩展意义单位模型,该意义单位模型由核心词、词汇搭配、类联接、语义趋向和语义韵共同界定。[3]其中,词汇搭配体现了核心词与搭配词之间的共现关系;语义趋向是一个整体短语单位与包含一定语义特征的词汇间的共现;语义韵表明一种态度意义,指说话者在特定语境中的态度,如“愿意”、“强迫”和“勉强”等。语义韵则概括了整个意义单位所实现的功能及交际目的。扩展意义单位由词汇搭配、语义趋向和语义韵三个维度共同界定,概括了形式与意义及词汇间的共选关系,是目前较为全面的语言描述机制。

扩展意义单位有两种基本的表现形式:词汇与语法的共选及词汇间的共选。其中,词汇与语法的共选是指,一旦某个词汇被选定表达某种意义,其相应结构就会同时被选定。[6]另一种基本的共选关系是词汇间的共选,亦称词语搭配,是在文本中实现一定的非成语意义并以一定的语法形式因循组合使用的一个词语序列,构成该序列的词语相互预期,以大于偶然的几率共现。[5]简言之,词汇搭配即是一个词形的选定,直接影响下一个词形的选择,从而导致多个词语一同被选,其中所选定的词成为节点词。节点词亦称关键词,是要在语料库中检索并研究其搭配行为的词语。[7]词汇间的共选由搭配、语义趋向及语义韵三个维度共同界定,以suffer为例,与 suffer搭配的词有 distress,loss,pain,insult,punishment,hardship,torture,grief,drudgery, injustice, persecution, disappointment.可以将这一语义倾向概括为负面影响;其语义韵表现为困境或失望。综上所述,在语篇当中,词汇与词汇的共选会直接影响语言的表达能力及读者的阅读兴趣。本研究将以共选理论为理论框架,以词汇间的共选为重心,自建中美高校网页英文简介语料库,考察高频词 (节点词)的搭配,及其对读者阅读兴趣的影响。

二、语料来源及研究方法

1.语料来源。本研究分别从中美高校中选择18所名校的网站英文简介,此18所高校英文简介均从各校官网下载得到,选择均来自全国公认的大学排名:中国高校网页英文简介由中国管理科学研究院公布的前100名高校的随机抽取所得;美国高校网页英文简介由《纽约时报》于2010年公布的美国前100名高校随机抽选所得。

2.研究方法。分别将中美高校网页英文简介建为中国高校网页英文简介的word格式转换为txt格式,通过简单处理,自建中国高校网页英文简介语料库,型符数为17 130词,在文中用CC(Chinese University English Introduction Corpus)表示;美国高校网页英文简介语料库,型符数为6 248词,在文中用NC(Native English Introduction Corpus)表示。此外,本研究结合语料库检索软件wordsmith 5.0,对CC、NC中的词频分别进行检索,并对其高频词进行统计;进而,选取一个具有代表性的高频词,对其进行词汇共选对比研究。本研究以美国高校网页英文简介本族语语料证据为参照,采用基于数据的方法,分析中国高校网站英文简介高频词的共选,有着一定的实用价值。

三、结果与讨论

1.高频词分析。首先,本研究运用语料库检索软件wordsmith 5.0中的wordlist功能,分别对CC、NC中的词频进行检索,并将前15个高频词进行统计汇总。(为方便研究,本文手工去除高频虚词,只对高频实词进行提取)其结果统计见表1:

表1 中美高校英文简介高频实词统计表

从上表中可以看出,NC、CC中有部分共现的高频 词,如 university,students,research,have,education等。究其原因,可能是两个语料库内容均为高校简介,所以重合高频词均与高校、学生及教育有关。此外,在NC中,第一高频词university所占百分比为1.21%,第十位高频词education为0.46%,中间相差0.75%,且相邻频次高频词间百分比相差甚微,可见,美国高校英文简介中,高频词分布较为均匀;而在CC中,第一高频词university所占百分比高达2.94%,比处于第二位的高频词have(has)高出1.41%,与第十位高频词Chinese相差近2.5%,由此可见,中国高校英文简介中,university出现的频数远远超过其他词语,且CC中高频词使用分配较不均匀。

2.高频实词“university”的词汇共选分析。从表1可以直观看到,CC和NC中,排在第一位的高频实词均为“university”。此外,因本文的研究对象为中美高校网页英文简介,以高频词“university”为代表作为词汇间共选的节点词,对于对比分析中美高校网页英文简介高频词的使用差异,有着深刻的研究意义。综合上述两条原因,本部分以“university”为节点词,借助语料库检索工具wordsmith 5.0中concord功能,分别从CC、NC两个语料库中选择文本,输入关键词“university”,跨距设定为左四到右四,得到“university”分别向左右延伸四个单词的检索结果。

由于检索结果中出现了许多“地名+university”大学名称的结构,如Wuhan University,与本文研究内容关系甚微。因此,为精确研究结果,作者手工对此类结构进行去除,重新将“university”词汇共选内容进行梳理,并将其搭配词语及短语用黑体标出,部分统计结果见表2:

表2 中美高校英文简介高频词“university”词汇共选统计结果

通过对统计结果进行提取,NC中与university共选的词汇independent,national,catholic,research,highly competitive,leading research,global network,public, Jewish-sponsored,uniquely,professional,academic,known,widely acknowledged,world-renowned, key, vibrant, large, one ofthe world's largest,cutting-edge,private,etc.

CC中与 university共选的词汇 national,research,key,comprehensive,medical,normal,the most beautiful, renowned, associated,research-oriented, hydraulic, electric, technical, fastest, the most famous,first,the most prominent,multidisciplinary,well known for,world class,central,science,the most widely known,etc.

通过观察,我们分别可以把CC、NC中与university共选的词汇进一步划分:

NC中,(1)修饰高校地位及名声的university共选词汇:independent,national,research,highly competitive,leading research, globalnetwork, uniquely,professional,academic,known,widely acknowledged,world-renowned, key,vibrant,large,one of the world's largest,cutting-edge.由上述university的搭配词汇,可知其在NC中的语义倾向为褒义修饰语,客观、准确地叙述了美国高校的地位及声誉,其语义韵为以客观、平实的语调突出了高校的声名。由以上节点词university的搭配、语义倾向、语义韵三维度分析可知,在NC中,university的共选词汇较为客观、朴实,不存在过度修饰问题,符合读者的认知心理,具有可读性。另外,上述共选词汇鲜有重复,显示出了其词汇共选的丰富度。(2)说明高校性质的university共选词汇:Catholic,Jewish-sponsored,public,private.

在 (2)中,由university的搭配词汇,可知其在该语境中的语义倾向为中性,基本未使用含有感情色彩的词汇;而其语义韵则为说明学校的性质及特色。

CC中,(1)修饰高校地位及名声的university共选词汇:national,research,key,the most beautiful,renowned,research-oriented,fastest,the most famous,first,the most prominent,multidisciplinary,well known for,world class,central,the most widely known.由以上university的搭配词汇,可知university在该语境中的语义倾向为褒义及最高级修饰语,可以突出中国高校地位及名声的显著,其语义韵为以较为夸张的修饰突出高校的名望。由以上高频词university的搭配、语义倾向、语义韵三维度分析可知,university的共选词汇存在着过度修饰的问题 (修饰词中较多使用了形容词的最高级形式),夸张修饰使用较多,容易给读者产生一种华而不实的感觉。此外,CC中还存在高频词搭配词汇使用较为单一的问题,比如,known,known for,the most widely known,三者来自于同一词源,后者只是前者的扩展,说明中国高校网页英文网站词汇使用欠佳。(2)说明高校性质的university共选词汇:comprehensive, medical, normal, associated,hydraulic,electric,technical,science.

可知university在该语境中的语义倾向为中性,较之于 (1)包含较少的感情色彩;而其语义韵则为表明大学的性质及办学特色。

3.分析与讨论。通过以上分析,作者得出以下结论:(1)CC中较多地使用了形容词的最高级形式修饰高校地位及名声,并且使用first,world class等一些夸张性词汇,增大语篇的华丽性,给目标读者一种语篇重修饰而忽略重点的感觉;并且高频词university的共选词汇较为单一,词汇选用的丰富度有待提高;(2)由高频词分析部分可知,在CC中高频词university所占百分比为2.94%,比在NC中的比例高出1.73%(NC中高频词university所占百分比为1.21%)。可见,CC中高频词university使用频率过高;(3)CC与NC所选语料均为高校英文简介18篇,然而,CC中的型符数近17 000词,接近NC中型符数的3倍。由此可见,中国高校英文简介存在信息繁琐的问题,不利于读者对有效信息的及时提取;(4)对于说明高校性质的university共选词汇,CC中突出学校的办学特色,即以理工为主,或为综合性大学;而NC中则强调高校是公立学校或私立学校。

造成以上中美网站英文简介差异的原因为:由于身处英语语言环境及大量的语言文化输入,本族语者对英语词汇的掌握及使用较为熟练,美国高校在撰写高校英文简介这类特殊语篇当中字斟句酌,以质朴的语言形式达到良好宣传效果;中国高校英文简介撰写者力求所写信息面面俱到,试图为读者提供全方位的信息,因而,造成了篇幅过长的现象,结果适得其反,使目标读者难以准确快速提取信息,获得关键内容;由于中美两国处于不同的文化背景和教育体系中,其对大学的划分存在着差异。中国高校通常根据其办学特色或教学科研重点,划分为综合性大学、师范大学等;而美国高校则为公立、私立大学。此类差异由不同文化传统导致,本研究不做详细分析。

[1]张卫.基于语料库的中外大学主页上院系英文介绍的体裁分析[D].上海:上海交通大学,2009.

[2]李元青.中美高校英文网页介绍文本内容对比研究[J].太原城市职业技术学院学报,2009,(4):157.

[3]Sinclair,J.Trust the Text[M].London:Routledge,2004.

[4]卫乃兴.共选理论与语料库驱动的短语单位研究[J].解放军外国语学院学报,2012,(1):1~4.

[5]卫乃兴.词语搭配的界定与研究体系[M].上海:上海交通大学出版社,2002.

[6]潘潘,冯跃进.语义韵律的语料库调查及应用研究[J].当代语言学,2003,(4):359 ~360.

[7]王均松.扩展语义单位的意义建构模式研究[J].解放军外国语学院学报,2012,(3):10 ~11.

猜你喜欢

高频词语料库网页
30份政府工作报告中的高频词
省级两会上的高频词
28份政府工作报告中的高频词
省级两会上的高频词
《语料库翻译文体学》评介
基于CSS的网页导航栏的设计
基于HTML5静态网页设计
基于URL和网页类型的网页信息采集研究
网页制作在英语教学中的应用
基于JAVAEE的维吾尔中介语语料库开发与实现