APP下载

《牛津高阶英语词典》(第七版)词典信息的计算词典学认知*

2011-04-02廖海宏

辞书研究 2011年2期
关键词:印刷版网络版词条

廖海宏

《牛津高阶英语词典》(第七版)词典信息的计算词典学认知*

廖海宏

文章以《牛津高阶英语词典》(第七版)为基础,从计算词典学的认知角度出发,探析数字化时代高阶英语学习词典的信息建构模式;文章提出“词典认知的宏观概念”,认为词典信息表述多元化是计算词典学的研究重点之一,而《牛津高阶英语词典》(第七版)的词典信息应当是印刷版、光盘版、掌上电子版、机器词典版和网络版词典等的有机统一;研究表明,在数字化生存背景下,只有形成基于计算词典学理论的认知视角,才能有效应用、分析、研究和编纂词典。

《牛津高阶英语词典》(第七版) 信息建构 计算词典学 认知

一、引 言

计算词典学是数字化科技通过词典反映、传播和推进语言创新能力而形成的新型跨学科研究方向,是数字化时代推动辞书现代化发展的理论保证。数字化科技的发展推动了计算词典学理论的发展,而计算词典学理论在词典编纂上的应用推动了人们认知数字化社会的过程。

在数字化科技和电子词典同步发展的社会背景下,牛津大学出版社于2005年在英国推出基于英国国家语料库编纂的《牛津高阶英语词典》(第七版)(Oxford Advanced Learner’s Dictionary,以下简称OALD7);2007年,OALD7英文版由商务印书馆引进出版;2009年6月OALD7英汉双解版出版。计算词典学的编纂理念在该词典中得到充分应用,词典使用者可以同时使用该词典的印刷版、光盘版、掌上电子词典版和免费开放的网络版。

正确认知词典信息在数字化时代显得尤为重要。从语言实用论的角度来说,词典不但记录人类语言发展的事实、反映社会环境发展过程和结果,而且能通过改变人类认知世界的方式,从某种程度上推进某一特定社会发展时期生产力的发展(Ayto 2007:1)。本文将从计算词典学的认知角度出发,分析和研究OALD7的词典信息建构模式,以期推动计算词典学理念在国内双语高阶学习词典编纂方面的应用。

二、OALD的数字化沿革

计算词典学和传统词典学是一种相互依存、共同发展的关系。传统词典学和计算机科学不断结合,产生了新的词典学分支——计算词典学。计算词典学的研究对象主要是基于数字化技术而编纂的各种词典,包括供人使用和供机器使用的词典。供人使用的词典存在形式多样,有些以印刷版词典为蓝本进行数字化转换,有些利用语料库和印刷版词典编纂,有些完全以语料库为基础编纂;这类词典涵盖以数字化科技为基础编纂的印刷本词典、光盘词典、掌上电子词典、手机词典和网络词典等。供机器使用的词典内置于计算机等数字化设备中,帮助实现信息的自动化处理。数字化技术的发展推动计算词典学研究的发展,进而推动词典编纂理念的革新,促使词典编纂技术和词典质量不断提高。

OALD编纂理念的革新与计算词典学研究同步发展。自20世纪六七十年代,国外开始了计算词典学的理论研究,到八九十年代其理论框架和研究范围渐渐趋于明朗(章宜华 2007:19)。20世纪80年代出版的OALD也在这一阶段改造成可适于自然语言处理的机器词典。90年代初期,部分机器词典开始转型为供词典使用者查阅的电子词典,大量进入市场,使词典实现了从印刷版向电子版的转变。同一时期,OALD也开始改造成供查阅的电子词典,实现了词典从印刷版向电子版的转变,为词典使用者提供光盘版,并与掌上电子词典出版商合作。

21世纪是数字化科技发展的重要阶段,计算词典学研究和基于这一研究的词典编纂技术不断进步。同一时期,牛津大学出版社实现了基于大型语料库的词典编纂,不断推出新词典和词典不同载体的版本,尤其重视词典的网络化发展。2005年,OALD推出印刷版第七版,同时上市的还有该词典的光盘版,并免费开放网络版。网络版OALD7实现了即时更新,从某种程度上说,其提供的语言信息比印刷版丰富、及时,为词典使用者提供免费的优质服务,实现资源全球共享,这不能不说是电子词典挑战传统英语学习词典出版观念,服务社会、推进社会发展的一大革新举措。

三、OALD7词典信息的宏观概念

如何实现词典信息表述方式多元化是计算词典学的研究重点之一。数字化环境下,只有建立“宏观认知概念”,才能正确认知词典内容,提高词典的使用效能,正确分析和研究词典。

1.“词典”定义的宏观角度

“词典”一词的定义应当体现“合为时而变”的特性,从宏观的角度辩证地说明词典的存在,既反映纸质词典的特性,又适应词典数字化的事实。给词典下定义并非易事。如果定义过窄,则不能涵盖所有类型的词典;但如果定义过宽,又不能反映词典的特质(姚喜明2008:6)。建立词典的宏观认知概念首先应当正确理解词典的定义。OALD7给“词典”一词下的定义较完整地诠释了传统词典学和计算词典学的关系,既突出了纸质词典的特点,又融合电子词典的特征,有利于引导词典使用者建立认知词典内容的宏观概念。

OALD7中“词典”一词共有三个义项,第三个义项为新增义项。第一个义项指出“词典”指的是按字母顺序汇集词语,提供词的释义或词在另一语言中的对应词的书;第二个义项指出词典是汇集某一领域专业术语,并提供词在该专业领域中的释义的书;第三个义项为新增义项,指出词典是以电子文本形式存在的词的集合,该义项意味着数字化科技发展给“词典”一词带来了新的意义和用法,词典的内涵和外延都发生了变化,把光盘词典、掌上电子词典、手机词典、网络词典和机器词典等各类电子词典融入了词典定义的范畴,体现了词典学与计算机科学相互依存而又相互独立的关系。新增义项完善了词典的概念,突出了计算机技术对词典编纂方式的影响,在一定程度上体现了“词典”的计算词典学理念,暗示计算词典学作为一个新的研究分支在词典学领域的重要性。

数字化环境下,词典信息不再仅仅通过单一的载体形式静态地存在于印刷版词典中,而是综合应用各种载体动态更新、有机存在。从完整意义上说,《牛津高阶英语词典》(第七版)应当涵盖收录于印刷版、光盘版、掌上电子版、机器词典版和网络版等中的相同和不同的词典信息,以不同载体形式存在的词典信息共同构成该词典完整的信息。由于网络版的实时更新特点,词典信息增添了实时更新的动态性。

2.释义和例证的多元化建构

由于受传统印刷版词典存储空间的限制,词条的义项和例证在数量和内容上受到很大的限制。数字化时代,词典业普遍应用语料库编纂词典,并通过纸质载体和数字化载体多渠道地表述词典信息。OALD7建立了多元化提供释义和例证的信息建构模式,充分应用和体现了计算词典学的理念,通过应用OALD7印刷版、光盘版、掌上电子版和网络版相结合的形式,使用者可以同时使用多种词典载体,多层次地获取同一词条的释义和例证信息。通过抽样对比同一词条在印刷版和网络版词典中的不同释义和例证信息,数字化科技在辅助词典多元化建构信息中的优势得到了有力的证明。

“roll over”在印刷版OALD7中以独立词条形式收录,但提供的释义没有涉及该词在计算机科技领域的意义。在网络版OALD7中,提供了详细的词性、释义和例证,用以诠释该词在计算机科技领域的特定含义,网络版词典正文还提供了这个词条的同义词“mouse over sth”,同时开辟专栏,指出“rollover”是计算机和信息技术领域内的新词,说明这类词语毫无疑问是当今英语新词的主要来源,每年都有大量该领域的新词产生,而其中许多以词组的形式存在,还列举了类似的新词,如log on/off,copy sb in(on sth),drill down,grey sth out,page down/up,以及这些词的简单释义和例证。

“google”是一个新词,在印刷版和网络版OALD7的正文中均提供了该词的词性、释义和例证,但在网络版中增加了两条例证,同时开辟专栏,指出这个新词的形成和发展过程,揭示了英语词汇形成的普遍趋势,许多动词短语在新词发展过程中形成,如google sb up,google around for sth,同时指出这两个动词短语的结构源于look sb up和look around for sth这两个旧有的动词短语。

3.词条收录的全球化语境

全球化是数字化时代的主要社会特征,在全球化的驱动下,英语作为国际语言正快速产生大量变体。OALD7通过语料库实时收集英语在全球化语境下产生的各种语言变体,并通过词典信息建构和反映了英语的全球化语境,其网络版更使得实时收录和实时查阅英语语言变体发展情况成为现实。

为了全面反映英语语言的全球化语境,OALD7在页面材料中增设附录R91“世界英语”和附录 R90“英国英语与美国英语”。在原有旧版本基础上,OALD7在词条收录上突出体现了对世界英语变体的反映,增设澳大利亚英语、加拿大英语、东非英语、西非英语、南非英语、印度英语、新西兰英语等语体标注形式,收录了1700个世界英语变体词汇,取消美国英语语体标注形式,把在加拿大、美国等英语国家通用的英语词语归为北美英语,同时收录大量中国式英语、日本式英语、东南亚英语等英语变体词汇。

随着汉语热在全球兴起,带有汉语语言色彩的“中国英语”日益流行。在国际语言学界,中国英语已与印度英语、巴基斯坦英语、澳大利亚英语等共同成为“世界英语”的组成部分。很多涉及中国历史文化、传统食品、风俗习惯、社会现象等的中式英语被收入OALD7正文或“当月词汇”页面,如“English corner”,该词条指出“英语角”是中国特有的社会现象,每周五人们会聚集在广场、咖啡馆等地方练习英语口语,在例证中还提到2008年奥运会期间,北京奥委会的工作人员在工作场所开辟了英语角;在百科信息中指出,“大量国外游客涌入阳朔,这里成了中国最大的英语角”,“中国最有名的英语角每周五在中国人民大学的一个小广场举行,这种练习口语的方式早已风靡全国”。

数字化科技加快了英语全球化的速度,各种英语变体加快了变化和融合的过程。在各类英语学习词典中,OALD7在反映和推进英语全球化语境方面走在前列。

四、OALD7词典信息的数字化建构

1.词条的数字化语用因素

词典是社会的一面镜子,词典词条的收录体现了语言符号与指称对象之间的联系,记录人类对社会发展的认知过程和结果。

20世纪90年代以来,互联网成了实现经济增长的主要力量,信息技术成为人类社会生活的核心,大量反映计算机、网络和信息技术的新语言符号以前所未有的速度产生,反映这一时代发展的语言符号无疑成了各大学习词典收录的主要对象。OALD7应用最具代表性的当代英语语料库之一——英国国家语料库快速跟踪语言发展状况,自动对照、判定、选定和收录词条,客观而真实地反映了数字化科技与社会发展的关系,快速、全面地记录词汇产生的数字化认知语用因素。

OALD7词条收录总体上注重体现人类的数字化语用认知过程,通过新旧语言符号反映计算机、信息科技的发展及其给人类生活带来的影响。词典收录了“bloat ware,bounce,background,corrupt,character code,clone,v-chip”等大量体现计算机科技的词条,收录“active list,Blog,dotcom,emoticon,homepage,HTML,http,MP4,newsticker,outbox,webcam,LAN,Ethernet”等大量体现网络科技的词条,收录“ringtone,SMS,texter,break up,push technology”等大量体现手机应用科技的词条,收录“silver surfer,technophile,phishing,newbie,netizen”等大量体现数字化生存方式的词条。OALD7在新词收录上同样注重体现词条产生的数字化语境,词典中新增的2000多个新词中,与计算机、网络和信息技术及数字化生存方式有关的居多。

显而易见,OALD7在词典信息建构中注重诠释人类认知数字化社会的过程。词典借助语言符号反映人类认知数字化新产品、新时尚、新态度、新工作方式和新社会现象的过程和结果等,进而推动了人类认知数字化社会的进程,推进社会发展的数字化步伐。

2.词条收录的实时化特征

在计算词典学编纂理论基础上,OALD7通过各种载体形式共同建构实时化的新词信息网。

新词可以分为“稳定性新词”、“非稳定性新词”和“一次性用词”。“稳定性新词”指在特定语域广泛应用、接受考验并演变为普通词的新词,OALD7新增了2000多个“稳定性新词”。“非稳定性新词”指在特定语域广泛应用、接受考验并有演变为普通词的巨大可能性的新词;“一次性用词”指的是高度依赖特定语域的“极不成熟新词”,甚至是“生造词”,其发展往往很不稳定,但在很大程度上昭示着语言发展的可能性,是动态语言信息的一部分(王馥芳2004)。由于传统印刷本词典在新词收录方面所受局限很大,所以大多收录的是“稳定性新词”;而网络词典由于容量大、更新及时、动态性强,改变了词典存在的方式,扩大了词典的概念,满足了词典收录“不稳定性新词”,甚至是“一次性用词”的需求。

全球化、数字化的社会背景下,新词语涌现速度加快,语流中存在着大量“不稳定性新词”和“一次性用词”,OALD7没有设计专门的“一次性用词”的语体标注,而是通过OALD7网络正文和“当月新词”专栏,收录“不稳定性新词”和“一次性用词”,上传通过语料库收集、整理、提取的最新词汇,提供因印刷版容量限制而无法收录或最新产生的一些新词,如“cybersquatting,glocalization,podcast,caucus,twitter”等。

“podcast”是2004年产生的新词,它的中文译名尚未统一,但最多的是将其翻译为“播客”。OALD7通过网络版正文提供了“podcast”一词的发音、语法信息、释义、例证、词源信息等,指出该词产生于2004年,是在“iPodTM”基础上合成的一个词,该词可作名词和动词用。“caucus”一词产生于2008年美国总统选举这一社会背景下,OALD7通过“当月新词”专栏收录该词,并提供“Obama supporters need to attend caucuses held on February 5th.”等例证,这些例证选自实时更新的语料库。印刷本OALD7收了“twitter”一词,但只提供“小鸟的鸣叫”一种释义,也未提供例证;网络版OALD7在词典正文中收录“twitter”,增加释义,指出“twitter”是微博的典型应用,并提供了两个相关例证;“当月新词”页面提供了“twitter”的多个例证和丰富的百科信息,以及该词最新的应用情况说明,并以美国总统Barack Obama竞选时充分利用微博这一事实为例,引出“twitter”的名词“twitterer”和固定搭配“twitter through”等。

从这些典型例子可以看出,OALD7通过不同载体为词典使用者实时地提供新词信息。

3.释义和例证的语篇化趋势

由于存储空间的扩展,网络词典提供释义和例证的形式产生了明显的语篇化趋势,许多词条在提供释义的同时还附上了语篇化的解释或百科信息,如“caucus”一词,除提供该词的新旧释义和例证外,还在例证后附上了长达200字的解释。“text messaging”在印刷版中作为“text message”派生的短语收录,所提供的信息也很简单,它在网络版OALD7中以独立词条形式收录,提供了详细的词性、释义和例证,并开辟专栏以语篇的形式诠释该词条在信息科技领域的应用情况。

网络为词典提供了大容量的信息储存空间,使得词典的释义和例证开始呈现语篇化特点,提供丰富而翔实的信息,帮助使用者更透彻地理解、更准确地使用词汇。

五、结 语

OALD7是数字化时代权威高阶英语学习词典的典型代表,反映了这类词典的发展趋势。这类词典广泛应用计算词典学的编纂理念,借助数字化技术,采用多元、动态、多维和实时的模式建构词典信息。词典编纂者只有认可宏观的认知概念,把印刷版、光盘版、掌上电子版、手机版、机器词典版和网络版词典等作为一个完整的整体,才能科学应用、分析、研究和编纂适合数字化社会发展的高阶英语学习词典。

目前,在词典信息的数字化建构模式方面,国内自主编纂出版的双语高阶学习词典还相对滞后,多数还停留在印刷版的发展阶段,这些词典的数字化大多也只是把印刷本内容以数字化的形式存储,在通过网络实时收录、更新信息等方面的发展尤其缓慢。只有大力加强计算词典学编纂理念的应用,建立词典信息的宏观编纂模式,才能加快推进自主研编词典的科学性,改变国外权威高阶英语学习词典一统中国英语学习词典市场的局面。

1.王馥芳.词典编纂如何对待语流中的一次性用词用法.国外外语教学,2004(4):41-47.

2.姚喜明,张霖欣.英语词典学导论.上海:复旦大学出版社,2008:6.

3.章宜华.关于计算词典学理论框架的探讨.辞书研究,2007(6):19.

4.Ayto J.A Century of New Words.Oxford:Oxford University Press,2007:1.

5.OALD7 光盘版:Hornby A S,Sally W.(ed.)The Advanced Learner’s Dictionary of Current English.Oxford:Oxford University Press,2005.

6.OALD7印刷版单语:Hornby A S,Sally W.(ed.)The Advanced Learner’s Dictionary of Current English.Oxford:Oxford University Press,2005.

7.OALD7印刷版双解:Hornby A S,Sally W.(ed.)The Advanced Learner’s Dictionary of Current English.北京:商务印书馆,2009.

8.OALD7 网络版:Hornby,A S,Sally W.(ed.)The Advanced Learner’s Dictionary of Current English.http:∥www.oup.com.Oxford:Oxford University Press,2009.

9.OALD7掌上词典版:Hornby A S,Sally W.(ed.)The Advanced Learner’s Dictionary of Current English.卡西欧ESF-300掌上词典.卡西欧中国公司,2009.

*本文为福建省教育厅2009年社科研究项目阶段性成果。项目编号:JBS09159;项目名称:在线英语词典新词收录的认知语用研究。

(厦门理工学院外语系 福建 361002)

(责任编辑 王慧敏)

猜你喜欢

印刷版网络版词条
你被宰定了
你被宰定了
你被宰定了
你被宰定了
2016年4月中国直销网络热门词条榜
2016年3月中国直销网络热门词条榜
2016年9月中国直销网络热门词条榜
浅析《南方周末》网络版的角色定位
大数据相关词条
大英百科全书“要绝版”