APP下载

多译本语料库的译文对比研究
——以《离婚》五个英译本的对为例

2013-08-05杨坚定

关键词:形符离婚译本

杨坚定

(绍兴文理学院 外国语学院,浙江 绍兴312000)

一、引言

计算机技术的发展为语言研究提供了一种新的研究方法——基于语料库的语言研究方法。语料库(corpus)是指根据一定标准收集和整理的文本的集合。借助语料库可以对文本进行定量研究,使研究更加客观、更加科学。语料库可以分为单语语料库 (monolingual corpus)、多语语料库 (multilingual corpus)、类比语料库 (comparable corpus)以及双语语料库 (bilingual corpus)或平行语料库 (parallel corpus)等。平行语料库通常被用于翻译领域对语言进行对比研究,通过对原文和译文对比可以从词汇、句子和文体层面研究两个文本之间存在的异同。Baker(1995:230-236)指出,平行语料库最重要的贡献在于它使人们认识到翻译研究应从规约性研究向表述性研究过渡。

基于双语平行语料库的翻译研究在国内取得了一些成果 (柯飞,2003,2005;秦洪武,2005,2009;徐欣,2010),为后人研究提供了一套较为成熟的研究思路和方法。本研究通过运用自建的汉英多译本平行语料库对同一篇中文小说的五位不同英译者的翻译文本进行对比分析,定量反映不同译者文本的词汇密度/丰富度、用词偏好、句法特征等,揭示译文的独特性和共同特征。

二、语料及语料库

本研究以鲁迅小说《离婚》的五个英译本为研究素材。《离婚》是鲁迅以现实生活为题材所写的最后一篇小说。它运用对话的形式展开故事情节,介绍人物。这种文学创作形式在当时的文坛是一种创新。也许正是因为其独特的创作手法吸引了译者们对该小说翻译的兴趣。

迄今为止,小说《离婚》共有五个英文译本。按出版年份为序分别为埃德加·斯诺 (Edgar Snow)和姚克合译本 (以下简称斯译本,1936)、美籍华人王际真译本 (以下简称王译本,1941)、杨宪益戴乃迭 (Gladys Yang)夫妇合译本 (以下简称杨译本,1960),美国著名汉学家威廉·莱尔 (William A.Lyell)译本 (以下简称莱译本,1990)和二十一世纪英国青年学者蓝诗玲 (Julia Lovell)译本 (以下简称蓝译本,2009)。绍兴文理学院外国语学院于2009年创建了“鲁迅小说汉英平行语料库”。本研究在该语料库的基础上,自建了一个《离婚》和五个英译本的平行语料库。

三、研究方法

本研究主要采用语料库研究方法,运用语料库检索软件WordSmith Tools 4.0对语料进行检索分析。

3.1 类符/形符比。类符/形符比 (Type/Token Ratio),即TTR值,是指特定语料中类符 (type)与形符 (token)的比率。可以用来统计数量大致相等的单位语料,衡量其词语丰富性 (Lexical Richness)。所谓类符,是指语料中所用的不同词语种类,而形符是指所有的词及其表现形式。二者之比例在一定程度上反映了文本语料的词汇丰富程度。TTR呈现值越高,说明该语料所使用的词汇越丰富,反之则反映作者或译作的词汇相对贫乏。TTR高低可以反映和比较不同语料中词汇或用词变化。Baker(2000:250)曾指出,TTR之比值的高低与词汇丰富性呈正相关关系。如若比较长度不同的文本时,TTR则不足,而需采用标准类符形符比 (STTR)更为可靠。

本文采用标准类符形符比 (STTR)来衡量比较五个译本语料的词汇丰富性,文本标准长度设1,000个形符,分批计算文本的STTR值,再求平均类符形符比以反映文本的信息量大小。

为了比较原文的信息容量与各译文间的信息容量,我们运用中国科学院计算技术研究所在多年研究工作积累的基础上,研制了汉语词法分析系统ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System)进行分词和词性标注。

3.2 词表。词表 (Wordlist)属于语料库索引工具的基本功能。它可根据研究要求由词表工具自动排列,如以形符或类符在语篇中出现的频率高低列出,或根据其字母顺序进行排列。

3.3 词汇密度与个性风格词汇。词汇密度 (Lexical Density)是指文本中实词在总词数中所占的比例,通常可以体现语篇信息量的大小和难度。文本词汇密度若较高,说明该文本使用的实词数在语篇中所占的比例较大,故可以认为其信息容量较大,难度一般认为会相应地增加。反之,词汇密度偏低,则说明语篇的难度小,易于理解和阅读。在多译本比较中,由于受译者个人的话语风格、语言规则、地域方言等差异性因素影响,译者不同,语言运用也会体现出一些差异性,比如,有些所谓的“个性风格词汇”,在A译本里出现的频次高或被高频使用,而在B译本中出现的频次低甚至是零频次使用。分析这些词汇使用的分布范围和出现频度,有助于揭示译者的翻译风格和语言使用规律。

3.4 平均句长。平均句长是指一个语篇的句子的平均长度。它可以反映语篇句子结构的复杂程度,体现语篇的难易度。

四、分析与讨论

依据检索方案,运用WordSmith Tools 4.0进行检索分析、统计,对比五个译本得出下列数据:

4.1 标准类符/形符比

表1 标准类符/形符比

从表1可以看出五个译本的标准类符/形符比存在一定的差异。蓝译本最高,这说明她的译文词汇变化性最大,用词最丰富,其次是斯译本和杨译本,第四是莱译本,王译本的标准类符/形符比最小,说明王译本的用词最不丰富,缺乏变化。另一方面,五个译文的形符告诉我们莱译本的译文最长,蓝译本的译文最短,蓝译本最接近原文的形符数。因此,蓝译本用词丰富且译文的长度接近原文。莱译本的长度是杨译本1.48倍,蓝译本的1.57倍,说明莱译本的译文将原文中的一些隐性表达进行了显化处理,显化现象明显。

4.2 词表

从表2我们发现,五个译本的前10个高频词的差异不大。除了动词was和王译本的Honor和杨译本的Seventh以及蓝译本的Mr.外,其余的高频词全是虚词,其中“the,and,to,of,a,his”这六个词在五个译本中都是前10位的高频词,只是排列顺序略有差异。连词“and”在前四个译本中均排在第二位,而在蓝译本却排在第五位。这说明其他四位译者使用长句和并列句的频率较高,而蓝诗玲则倾向于用短句且意群之间的关系划分较为简练。另一个方面,在10个高频词中,除了杨译本外,代词占了3个,而蓝译本的代词竟高达4个。原文中前10位的高频词中只有一个代词“我”,这符合英语译文倾向指代照应 (anophoric reference)上文已出现名词,代词使用远多于汉语原文的特点。

表2 语料库词表前10位的词

4.3 词汇密度与“个性风格词汇”之计算。词汇密度计算方中,实词是指名词、动词、形容词和副词四类。根据Biber(2000:62),计算公式是:词汇密度=实词数÷总词数×100%。Ure指出,词汇密度可以作为区别语体正式程度的一个指标,某文本的词汇密度越高,则该文本的语体越接近正式端;反之,若该文本词汇密度低,则可以说明,该文本越靠近非正式端,越接近自然口语。据Ure(1971:443-452)的研究,口语的词汇密度大概通常低于40%,而在书面语里,词汇密度通常要超过40%。

表3 词汇密度与个性风格词汇的使用

原文《离婚》是以人物对话展开故事情节的。对话占小说全文的69%。根据表3,原文的词汇密度为30.31%,说明原文是一篇以口语为主的小说。五个译本的词汇密度均低于原文,均属于口语的词汇密度范围。也就是说,五个译者都能较好地保留了原文的口语体风格。

为了进一步验证这一点。笔者又统计了五个译本中两个到四个字母的常用词数量与各个译本的总形符之间的比例,结果如下:

表4 二—四个字母单词总数与总形符的比例

表4显示,五个译者使用的常用词比例都很高。王译本使用的常用词比例最高,其次是杨译本、斯译本、蓝译本和莱译本。这进一步说明他们在翻译小说时基本保留了原文的文体风格。

4.4 平均句长。徐欣 (2010)认为,一般人根据自己阅读经验的直观感觉是,汉语小说原文与翻译的译文相比,其句子和段落一般要短一些,而翻译小说在句子和段落两个层面上都要长于原文。在这方面,Baker(1996)进行了研究,曾对Peter Bush和Peter Clark的多部译著进行了比较,并把平均句长作为一个要素,进行了对比分析,结果发现“平均句长也是一般的译者风格标记”(Baker,1996)。此外,Laviosa通过双语对比语料库比较了作为语料的英语原语和英语译语,研究的结论是,译语的平均句长明显高于原语 (Laviosa,1998:568)。那么本研究的统计结果又是如何呢?

表5 均句长

表5告诉我们,五个译本的总句子数均超过原文。按译文的总句子数排列,分别为莱译本、杨译本、斯译本、王译本和蓝译本。五个译本的总句子数分别高于原文句子数。这提示,各位译者在翻译时以更明显的形式表达原文本的信息,运用了“外显化 (explicitation)”这种翻译策略。从平均句长看,除了杨译本和蓝译本,其他三个译本的平均句长都超过原文。这三个译本的文本长度也超过原文,这也证实了Baker提出构成翻译普遍性假说的特征之一“外显化”(Baker,1996:178)。在翻译过程中,译者往往把内容阐述得更加通俗易懂,如通过采用解释性语句或运用同义词进行重复等手段来明确原文中的一些隐含信息。为了更清楚地传达原文的信息,译者往往会重复前面已经提及的细节或者扩展浓缩的语篇,所有这些翻译策略都有利于提高目标译本的可读性。此外,“外显化”还有一个作用就是使译文更加流畅和连贯” (VER S,1998:567)。斯诺、王译本和莱尔的译文中均采用了“归化 (domestication)”策略。而平均句长在杨译本和蓝译本,都要小于原文。这提示,他通过用简单句式替代复杂冗长的句子,删减修饰性词语,减少句子的信息负载量,可能是在无意识地简化语言或信息,从而达到使译文文体显得更简单、更连贯、更流畅的目的。这也体现了Baker提出的“简略化 (simplification)”特征 (Baker,1996:182)。

五、结语

本文运用语料库检索工具对鲁迅小说《离婚》的五个英译本进行了译文对比分析。研究发现五个译本都较好地再现了原文的内容。五个译本中,蓝译本的译文词汇变化性最大,其用词最丰富;从常用词汇使用的比较看,王译本使用的二到四个字母的常用词汇最多,也就是说他的译文最通俗易懂;从译文的平均句长考察,笔者发现莱译本的译文平均句长最长,说明莱译本在句子结构是五个译本中最复杂的。这一现象表明,莱译本在翻译时对一些文化现象进行了显化处理,为的是使读者更容易理解。当然这些异同与译者的语言习惯和翻译风格有一定关系,笔者将另文讨论,不在此赘述。

[1]Baker,M.Corpus-based Translation Studies:The Challenges thatLieAhead[A〛.In Somers,H.(ed.),Terminology,LSP and Translation:Studies in Language Engineering,inHonourof Juan C.Sager[C〛.Amsterdam-Philadelphia:John Benjamins.1996:175-186.

[2]Biber,D.et al Longman Grammar of Spoken and Written English[M].Beijing:Foreign Language Teaching and Research Press,2000.

[3]Laviosa,S.Core patterns of lexicaluse in a comparable corpus ofEnglish narrative prose[J].Meta,1998,43(4):557-570.

[4]Ure,J.Lexical density and register differentiation[A].In G.E.Perren & J.L.M.Trim(eds.).Applications ofLinguistics:Selected Papers of the Second InternationalCongress ofApplied Linguistics[C].Cambridge:CU P.1971:443-452.

[5]VER S,L.In search of the third code:an investigation of norms in literary translation[J].Meta,1998,43(2):557-570.

[6]柯飞.汉语把字句特点、分布及英译研究[J].外语与外语教学,2003(12).

[7]柯飞.翻译中的隐和显[J].外语教学与研究,2005](4).

[8]秦洪武,王克非.基于语料库的翻译语言研究——以“so...that”的汉语对应结构为例[J].现代外语,2004(1).

[9]秦洪武,王克非.基于对应语料库的英译汉语言特征分析[J].外语教学与研究,2009(2).

[10]王克非,等著.双语对应语料库:研制与应用.北京:外语教学与研究出版社,2004.

猜你喜欢

形符离婚译本
从形符与字义的关系角度论《说文解字》中形声字分类
——以“人”“彳”字部为例
留学生形声字教学实践研究
——以满洲里学院为例
《佛说四人出现世间经》的西夏译本
《通玄记》的西夏译本
“形符”在小学数学课堂中的教学困境、功能与应用策略
英国和欧盟:注定艰难的“离婚”
如果英国和欧盟真的“离婚”了……
如何利用《说文》中的形符教授留学生学习汉语
《孙子兵法》俄译本简介
《孙子兵法》蒙古文译本简介