APP下载

基于语料库的谷歌与有道翻译对比分析
——以Gone with the wind为例

2020-11-13

文化创新比较研究 2020年24期
关键词:句法语料库译文

徐 行

(南京邮电大学,江苏南京 210023)

1 概述

机器翻译就是利用计算机把一种语言(源语言,source language)翻译成另外一种语言 (目标语言,target language),实现各种自然语言之间的自动转换,是人工智能和自然语言处理领域的重要研究方向之一。虽然机器翻译已经发展多年,但现实中仍存在许多问题。我国学者冯志伟先生提出:“从已经推出的实用化MT系统的译文质量来看,还不十分令人满意,对于一些稍长的句子,或结构稍复杂的句子,译文质量就不能令人满意,有时简直不可卒读。”而且,“计算机翻译不适用于文学性很强或文化味很浓的文本,而适用于科普文献,金融商业交易,行政管理备忘录,法律文件,说明书,农业及医学材料,工业专利,宣传册,报纸报道等[1]。”

因此,本文以谷歌与有道翻译关于Gone with the wind的译文为例,分析MT的错译类型,并进行两种翻译引擎之间的对比。

2 机器译文错误类型对比分析

2.1 语料来源和研究方法[2]

本次研究中使用的语料为Gone with the wind第一章的部分节选以及谷歌翻译和有道翻译对应的中文译文,对比的人工译文为上海文艺出版社的陈良廷译本——《乱世佳人》。在对机器译文和人工译文展开全面的平行对比中,对机器译文出现的各种错误根据前人总结的机器译文错误类型(表1)加以标注,并对错误的发生频率进行统计,得到图1所示的谷歌与有道译文错误率和图2所示的谷歌与有道译文三大类型错误率。其中错误译文指机器译文中至少包含表1所列错误类型中的一种错误,错误率为出现错误的机器译文总句数/机器译文总句数*100%。对同一句子中多次出现的同一类型机器译文错误(如词汇词性错误),只进行一次标注和统计。下文将对译文对比中观察到的部分机器译文错误现象加以对比描述。

表1

图1

图2

2.2 机器翻译词汇错译分析[3]

词汇是组成句子的最基本要素,所以也是衡量机器翻译质量的关键。由图2可以看出,谷歌与有道翻译在词汇错译所占比例较大,且谷歌远远高于有道翻译。在对译文进行对比分析的过程中,发现在二级错误中,词汇词性错译、词汇漏译和词汇形容词错译所占比重较大。下面将进行举例说明。

(1)But it was an arresting face, pointed of chin, square of jaw.

有道:但这是一张引人注目的脸,尖下巴,方下巴。

谷歌: 但这是一张令人震惊的脸,指向下巴,下巴直角。

人工:不过这张脸还是挺引人注目,尖尖的下巴颏儿,方方的牙床骨儿。

首先,关于“arresting”,牛津词典的解释是“very attractive”,而谷歌却翻译成“令人震惊的”,不禁让读者对女主人公的外貌产生极大的误解。而“pointed”和“square”在原文中是作为形容词来修饰后面的名词的,谷歌却分别作为动词和名词来翻译。关于“chin”和“jaw”的区别,“chin”的柯林斯词典中的解释为“the part of your face that is below your mouth and above your neck”,而对“jaw”的一种解释为“A person’s or animal’s jaws are the two bones in their head which their teeth are attached to”。 但是两种翻译引擎都简单地翻译成了“下巴”。

(2)...their bodies clothed in identical blue coats and mustard-colored breeches, they were as much alike as two bolls of cotton.

有道:身上穿着一模一样的蓝色外套和墨绿色的马裤,像两团棉花。

谷歌:他们的身体穿着相同的蓝色外套和芥末色的马裤,十分相似作为两个棉铃。

人工:身穿一模一样的蓝上衣,一模一样的芥末色马裤,哥儿俩活像两个一模一样的棉桃。

这里原文之所以将两个人比作棉桃,是为了强调他们作为穿着一样的衣服的孪生兄弟是多么的相似,而有道的译文只翻译出了棉花,却漏译了他们的相似,谷歌就直接字字对应地翻译,将应理解成“像”、“如同”的“as”,翻译成了“作为”,产生了歧义。另外,谷歌将“bodies”直接译成“身体”,读来十分生硬。

(3)The boys looked uncomfortable,recalling their mother's conduct three months ago when they had come home, by request, from the University of Virginia.

有道:两个孩子看上去很不自在,回想起三个月前他们应弗吉尼亚大学的要求回家时母亲的举动。

谷歌:这些男孩看上去不舒服,回想起三个月前他们应弗吉尼亚大学的要求回家时母亲的行为。

人工:哥儿俩想起三个月前他们从弗吉尼亚大学被请回家时他们母亲的管教方式,脸色顿时不大自在。

这里的“uncomfortable”应该理解为“anxious,embarrassed or afraid and unable to relax”,有道翻译比较符合,而谷歌却按“not feeling physically relaxed”理解,翻译成了“不舒服”,与原文不符。而且谷歌对“the boys”的处理也没有联系上文的语境,有道处理地较为恰当。

另外,关于对人名、地名等专有名词的处理,有道大多数翻译恰当,而谷歌常常不译或者错译。对一些指代词的处理,谷歌往往无法结合语境,例如“poor Cracker neighbors”中的“Cracker”应理解为“an offensive word for a poor white person with little education from the southern US”,有道翻译成“穷邻居”较为符合,而谷歌翻译成“贫穷的饼干小邻居”,令人啼笑皆非。

2.3 机器翻译句法错译分析

英语具有“形合”的特征,句法是其“形合”实现的重要方式,是组织零散词汇构成句子的手段,严重的句法错误可能使整个句子变得凌乱不堪,不知所云。由图2可以看出,无论是谷歌还是有道翻译,在句法错译都占了较大的比例[4]。在分析对比的过程中,发现二级错误中的句法动词短语和介词短语错译出现较为频繁,下面将举例分析。

(4)He'll never get finished at this rate.

有道:照这样下去,他永远也完不成。

谷歌:他永远不会以这样的速度完成任务。

人工:这样的话他可休想毕业了。

这句话在原文中是说因为两兄弟总是被学校开除,连累他们的哥哥也不能呆在学校,因此完不成学业。介词短语“at this rate”是“照此情形”、“如此下去”的意思,谷歌却将“rate”直接翻译成了“速度”。有道翻译虽然较为符合,但“完不成”后面的宾语却没有表达完整。

(5)“Not going to be any war! ” cried the twins indignantly, as though they had been defrauded.

有道:“不会有战争!”孪生兄弟愤怒地喊道,仿佛他们被骗了似的。

谷歌:“不会发生任何战争!”这对双胞胎怒不可遏地哭了起来,好像他们已经被骗了一样。

人工:“什么仗也不会打!”哥儿俩愤愤地喊道,仿佛他们上了当似的。

在原文中只是三个朋友因为对战争的看法不同发生了一点争吵,没有到“愤怒”或“怒不可遏”的程度,用“愤愤地”更能表达出两兄弟虽然不满但是为了不让女主人公生气只得停止讨论战争的心情。“cry”在这里是“to shout loudly”,谷歌译成“哭”,脱离了原文的意思。

(6)She was hot-tempered and easily plagued by the frequent scrapes of her four sons, and while no one was permitted to whip a horse or a slave, she felt that a lick now and then didn't do the boys any harm.

有道:她脾气暴躁,四个儿子经常用鞭子抽打她,这使她很难受。虽然家里不许任何人抽打马或奴隶,但她觉得偶尔打一下对孩子们并没有什么害处。

谷歌:她脾气暴躁,容易被四个儿子的经常擦伤所困扰,虽然没有人被允许鞭打马匹或奴隶,但她感到时不时舔舔对男孩没有任何伤害。

人工:她是个火爆性子,动不动就给这四个经常惹是生非的儿子烦死,尽管她不准谁鞭打奴隶和马,可她觉得时常抽孩子几下对他们倒没害处。

“scrape”在这里是名词,表示“(old-fashioned)a difficult situation that you have caused yourself”,同义词有“predicament”,“trouble”,“difficulty”等,而两种翻译引擎分别理解成了“用鞭子抽打”和“擦伤”,严重曲解了原意。而“lick”一词除了“舔”的意思之外,在柯林斯词典中还解释为“If you lick someone or something, you easily defeat them in a fight or competition.” 同义词有“beat”,“defeat”,“overcome”等,而谷歌的翻译与原文的语境严重不符。

3 结语

本次语料库数据统计得出的图1显示,与谷歌翻译相比,有道翻译的准确译文比例较高,错误译文比例较低;图2显示,在词汇错译、句法错译和其他类型中,谷歌错误率高于有道翻译[5]。另外,在对译文二级错误进行对比分析时,发现有道翻译整体译文质量高于谷歌翻译。谷歌偏向于字对字的直译,而有道翻译有时可以转换句式,不囿于原有的英文句式。并且对于人名、地名等专有名词的翻译,有道翻译更加灵活准确,而谷歌翻译对一些习语的处理也比较生硬,建议谷歌翻译借助自身的搜索引擎在互联网中搜索相关的信息作为翻译的参考。当然,有道翻译也存在着许多的问题,在结合语境、加大自身语料库建设方面还有进一步完善的空间。针对谷歌和有道翻译存在的问题,笔者认为可以从以下方面改进翻译引擎质量:进一步加大自身语料库建设,可以通过开放性输入平台的方式最大程度收集双语固定表达形式及对应意思,以尽可能多的识别习语、惯用语等;借助互联网对需要进行翻译的语句进行模糊匹配搜索,找出其他网页或者数据库中的关联信息,作为翻译的参考;通过海量分析识别具有类型化和高重复性特征的错误,在下一次错误触发时进行准确纠错[6]。

最后,作为语言学习者,我们不能过度依赖翻译工具,而应将自己扎实的语言能力作为基础,正确使用翻译软件,找准翻译技巧,提高翻译效率,让工具真正为我们的语言学习服务。

猜你喜欢

句法语料库译文
Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
述谓结构与英语句法配置
平行语料库在翻译教学中的应用研究
《语料库翻译文体学》评介
句法二题
诗词联句句法梳理
弟子规
弟子规
语篇元功能的语料库支撑范式介入
信息结构与句法异位