APP下载

人机英译《镜花缘》质量评测研究①——以林太乙译本与腾讯翻译君译文为语料

2020-08-05韦汇余庞欣张新

现代英语 2020年22期
关键词:镜花缘评测语段

韦汇余 庞欣 张新

一、引言

随着人工智能技术进一步突破,新的机器翻译技术不断应用于口笔译实践中。从最初以规则为主的机器翻译,到统计式机器翻译,再到神经网络机器翻译(即深度学习神经网络模型),技术的提升推动了机器翻译质量的提高。张爱玲等(2018)通过评测认为在科技等特定领域机器翻译的质量与人工翻译质量已经很接近。围绕机器翻译在现代文学作品翻译领域的应用和译文质量,孙靳(2018)采用人工评测的方法,以现代小说《苍天在上》为例分析了谷歌翻译在当代文学作品英译中的优缺点。施雪琴等(2018)使用人工评测和访问调查相结合的方法,对中译英和英译中的通用类文本从短语、句子和段落三个层面分析对比了谷歌翻译和百度在线翻译的译文,指出了机器翻译的不足,提出了改进建议。但到目前为止,很少有研究对机器翻译在近代文学作品翻译领域的应用和译文质量进行评测。基于此,笔者选取腾讯翻译君翻译近代文学作品《镜花缘》产出的译文和林太乙英译本《镜花缘》对应译文构建平行语料库,并进行人工与机器英译译文质量对比分析。

二、研究设计

(一)机器翻译评测对象和语料

“腾讯翻译君”是腾讯出品的机器翻译软件,结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译(腾讯科技有限公司,2020)。在2018WMT(Workshop on Machine Translation)国际翻译大赛中,腾讯翻译软件获得中英翻译冠军,备受翻译界关注,故选取它作为汉英翻译质量评测的工具。

《镜花缘》是清代文人李汝珍创作的长篇古白话小说,作品中蕴含着丰富的中国传统文化,语言文白夹杂,选取《镜花缘》文本作为语料进行腾讯翻译君翻译近代小说译文质量的评测具有一定代表性。

(二)人工翻译评测对象——《镜花缘》林译本

林译本是人工翻译近代小说《镜花缘》的高质量译文范本,是林太乙受联合国文教组织委托翻译的译本:FlowersintheMirror(以下简称林译本)。林译本出版后流传于各国,促进了中国传统文化对外传播。林太乙翻译《镜花缘》时对一些专有名词、成语等蕴含古代文化的词句采用根据上下文解释的方法翻译,易于读者理解。

(三)评测方式和过程

业界对机器翻译质量评测的方式主要有两种:一种是BLEU评测(Bilingual Evaluation Understudy),这是评测机器翻译质量的通用方法,其原理是比较候选译文与参考译文中相同的片段数量(Papineni et al.,2002)。另一种是人工评测,机器译文的人工评测主要考虑两个维度:流畅度和忠实度。流畅度指的是输出译文的语法正确度和惯用程度;而忠实度指的是输出译文与原文表达相同意思的程度,即信息是否丢失、增加或被曲解(邓良艳,2019)。流畅度和忠实度与严复的翻译标准中“达”和“信”相对应,因此本研究从“信、达、雅”三个维度构建了译文质量评测量表(见表1),采取人工评测方式进行评测。

表1 译文质量评测量表

选取的评测样本为蕴含有中国传统文化的字词句和一些含有人名或地名的句子,以及须联系上下文传达文本意思的句子,共50个语段。将50个语段录入腾讯翻译君翻译生成译文,并参照林译本的平行译文,从“信、达、雅”维度对译文质量进行人工评测,分5级进行评分。

评测者是1位通过英语专业八级、有汉英翻译实践且母语为汉语的英语教师Z。

评测时,教师Z先阅读林太乙译文(以下简称林译文)和腾讯翻译君英译《镜花缘》译文(以下简称腾译文)语段,然后根据评测量表逐段打分。在评测过程中评测者Z不知所读语段是人工译文还是机器译文。评分结束后,评测者Z对腾译文“雅”得分低于1.96分的语段进行了原因分析,并做了口头报告。

三、研究结果

测评结束,评测者Z的评分按人工和机器译文进行分类统计,计算出林译文和腾译文得分的最后均值,结果如表2所示。

表2 评测者Z对机器译文和人工译文质量评测的配对样本t检验结果

从表2可以看出腾讯翻译君英译《镜花缘》语段译文质量与对应林太乙译文质量人工评测得分的差异:在“信”的维度得分,腾译文(M=3.08)和林译文(M=3.12)的基本一致,无显著差异(p=0.485);在“达”的维度得分,腾译文得分(M=2.94)低于林译文(M=3.02)0.08分,也无显著差异(p=0.471);在“雅”的维度得分,腾译文(M=1.96)明显低于林译文(M=3.04)达到1.08分。配对样本t检验显示,在“雅”的维度,腾译文和林译文之间呈现出0.01水平的显著性差异(t=-11.481,p=0.000)。在“雅”的维度上评测者Z对林译文的评价得分明显上升。

根据评测标准对两者得分差异分析表明:在“雅”的维度,林太乙在用词以及对于古汉语或者文章的深层次的理解要高于腾讯翻译君。在“信”的维度,腾讯翻译君能达到基本的忠实度,让读者大致明白文章的意思。在“达”的维度,如句子的流畅度,相比较林译文,腾译文君拘泥于原文形式,词句晦涩难懂。总体而言,较于腾译文林译文更被评测者Z所接受,林译文中词语以及句子的运用也更为通俗易懂。所以,林译文更接近“信达雅”的标准,在遵循了原文的流畅度和忠实度的基础上,基本完整地表达了原文要传达的意思。

四、讨论与分析

为了探明测评腾译文在“信达雅”三个维度的缺陷,对评测者Z所报告的腾译文:雅得分低于1.96分的语段进一步分析发现:在信和达的维度上,腾译文错误较多之处基本出现对在一些专有名词、成语等蕴含古代文化的词句翻译中,最终影响了评测者Z对腾译文“雅”的评分。这也印证了王振平(2000)所论严复“信达雅”的真谛:即求“雅”为“达”,求“达”为“信”,最后的落脚点在“信”上,既一元论,同时又我中有你,你中有我,既互为条件,又各自为独立的副标准。因此,对腾译文与林译文“雅”维度的定性对比分析依然要以“信和达”为基础。下面将腾译文中成语、人名和地名等错误译例与林译文进行对比分析,整理归类,以期在分类析因的基础上提出提高腾讯翻译君翻译近代文学作品质量的建议。

(一)因汉语知识缺失导致的误译

1.同形异义词误译

例1:少刻出来,倒要会他一会。

腾译文:Don't carve it,it will take a while to meet him.

林译文:What a marvellous one this must be!We must meet him!

腾译文将表示时间的“刻”误译为动词“carve”(雕刻)。林译文省略了“少刻出来”的翻译,直接译为“We must meet him!”(我们一定要会一会他),不悖原意。

例2:说罢,取过纸笔,开了地名。

腾译文:With that,he took the pen and paper and opened the place name.

林译文:So it was decided,and Lo Lung wrote down their address for them.

“开了地名”,即“写下地址”。腾译文将“开列、写出”之“开”误解为“打开、开启”义。林译文准确传达了原文的信息。

2.专有名词误译

例3:多久公道:……

腾译文:Duo jiu is fair

林译文:said Old Tuo

腾译文将这四个字分开翻译,即为“多久”和“公道”或将这四个字翻译为“how long is justice”,两条译文均没能识别出“多久公”是人名。

例4:且说天下名山,除王母所住昆仑之外,海岛中有三座名山:一曰蓬莱,二名方丈,三名瀛洲。

腾译文:Let's say that there are three famous mountains in the island,except Kunlun,where the Queen Mother lives:first,Penglai,two abbot,and three Yingzhou.

林译文:Of the great mountains under heaven,apart from the Kunlun,where the Western Queen Mother resides,there are known to be three in the islands overseas;the Penglai,the Fangchang,and the Yingchow.

腾讯翻译君根据“方丈”的字面意思译成“abbot”,未识别出是山名;林译文根据汉语习惯用音译法翻译为“the Fangchang”。

3.四字格误译

例5:一日,百花仙子因时值残冬,群劳暂息,既少稽查之役,又无号令之烦,消闲静摄,颐养天和。

腾译文:One day,because it was the end of winter,the Hundred Flowers took a rest from group toil,with less inspection and no orders,so they took pictures of themselves and lived in peace.

林译文:One day it was winter,and there was little the Fairy of a Hundred Flowers had to do.

四字格是汉语词汇的一大特点。“消闲静摄,颐养天和”是指闲暇无事以静养,保养年寿。腾讯翻译君将“静摄”理解为“摄影”,译成“took pictures of themselves”,林译文为了避免不同文化背景的读者理解上产生障碍,采用了省略翻译的策略,只翻译了前面两句。

例6:掩耳盗铃

腾译文:cover his ears and steal the bell

林译文:but of course by hiding it behind a curtain he is only calling attention to it.

因不理解四字成语内涵,腾译文是直接根据成语的字面意思逐字对应翻译,而林译文则是根据上下文将成语结合原文的意思解释出来。

4.句子语气误译

例7:何能找到许多。

腾译文:How can we find a lot of it?

林译文:It is a very rare plant,and it loses its efficacy if it is not freshly picked.

结合上下文,此句是陈述句:“不能再找到更多这样的植物了”,而腾译文则译成疑问句:“怎样才能找到更多呢?”语气理解不当,表达意义和情感与原文完全不同;林译文则直接根据上下译为“这是一种非常稀有的植物”,准确晓畅。

(二)因文化知识缺失而误译

例8:左手执笔,右手执斗

腾译文:The left hand holds the pen,the right hand fights.

林译文:“who was holding a writing brush in her right hand and a dipper in her left.

“笔”在语境中应指“毛笔”,“斗”指的是“长柄勺”,但腾译文译为“pen”(钢笔)和“fights”(争斗)之义,属误译;林译文则分别译为:writing brush和dipper与原文一致。

例9:享受玉食万方皆不足道

腾译文:It is insignificant to enjoy jade food.

林译文:All that you desire will be at your command.

“玉食”此处指美食,腾译文按照字面译为“jade food”,因不解文化而错译,林译文则根据上下文及文化背景译为“您的所有欲望都会得到满足!”符合作者本意。

例10:关前各设“迷魂阵”一座

腾译文:Before Guan,each set up a“ecstasy array”.

林译文:They could cast magic spells before the passes.

“关前”是指重要的要塞或者关口前,根据上下文此处要表达的是四位兄弟在重要的关口前设置了“迷魂阵”。因缺少文化背景知识,腾译文按照字面意思将“关前”译为“before guan”,不符合原文要表达的意思;林译文翻译为“before the passes”(关隘之前),忠实传达了原意。

例11:月狐得了此信,欢喜非常,日盼下凡吉期

腾译文:When Yuehu got this letter,she was very happy and looked forward to an auspicious period.

林译文:When the Heart-Moon Fox received the order,she was delighted,and after deciding on a propitious date for her descent

这句话是讲心月狐收到命令之后盼望着早日下凡。神话中,神仙降至人间称“下凡”。腾译文译为:下一个吉祥的时间,对“下凡”的文化背景不理解而造成误译;林太乙译为:选定了一个吉日降临,符合原文意思。

例12:唐敏得了连捷喜音……

腾译文:Tang Min got Lianjie Xiyin.

林译文:upon hearing the news that he had at last passed the examinations at the capital

“连捷”指科举考试连续中式。“喜音”指喜讯。腾译文不理解词语的意思,使用的是汉语拼音,而林译文符合原意。

例13:小弟一见,不觉大叫一声:‘吓杀我了!’

腾译文:As soon as I saw him,I cried out,“you scared me!”

林译文:I was overpowered by an extremely vile smell which made me almost faint.

“小弟”此处是谦称,用于自称,而腾译文对这个谦称无法辨识,错译为他称“him”(他)。林译文根据上下文正确直译为“I”(我),符合原意。

(三)因忽略语境而误译

例14:都是道路窵远,其高异常。

腾译文:The road is far away and its height is abnormal.

林译文:All are mountains of great height,far away and difficult to climb.

腾译文中“都是”没有翻译出来,“其”译为“its”指代不清。根据上下文“且说天下名山,除王母所住昆仑之外,海岛中有三座名山:一名蓬莱,二名方丈,三名瀛洲。”可知“都是”和“其”应指这些山;而林译文则根据上下文将“mountains”(山)补译出来,全句结构严谨、清晰明了,传形达意、词句优雅。

例15:因唐敖想要去游玩

腾译文:because Tangao is going to play

林译文:But he accompanied Tang Ao on a tour of the country.

句中的“游玩”是指短暂的旅行,腾译文译成“play”是游戏、玩耍的意思,词义选择不当;林太乙联系上下文采用“tour”贴合原文,符合原意。

以上腾译文中信息传递或模糊不清,或意思表达不够准确,往往只是将词句表面意思译出,没有触及文化背景赋予词句的深层内涵,忽略了上下文语境对词语传达信息的影响。

五、结论与启示

从“信达雅”的维度对腾译文与林译文译例进行定量和定性对比分析表明:腾讯翻译君在翻译近代文学作品《镜花缘》文本时能将基本的意思传达清楚,基本忠实于原文,但仍然会出现误译和漏译等问题,特别是涉及汉语语言特点、包含中国传统文化等内容的语段误译和漏译较多。鉴于此,对腾讯翻译君软件的改进提出两点建议:第一,腾讯翻译君可增添同形异义词、专有名词等汉语词句识别标注功能,在译前笔译者录入翻译内容时可利用这个功能进行实时标注。在翻译过程中,当出现相关词句时,笔译者可以选择对应选项,以帮助机器识别实现按规则翻译,避免误译的发生。第二,腾讯翻译君可进一步完善包含近代文学作品的并行语料库。因腾讯翻译君软件对蕴含中国传统文化的语料不熟悉,故会将大部分与此有关的内容译错。建议软件开发者能够导入相关平行语料,完善近代文学作品语料库,进而提高译文的准确性和的流畅度。

总之,随着科技的发展,机器翻译现已渗透到现代生活的方方面面,但机器翻译尚无法企及人工翻译者传情达意之高度。机器翻译在“信”和“达”维度能帮助译者从机械单调的翻译任务中脱身,使译者有更多时间和精力投入到“雅”的维度进行创造性翻译工作。在人工智能发展的现阶段,就翻译工作而言,人工翻译与机器翻译仍然是相辅相成的。人机协同共译是提高语际翻译效率和质量,达成“信达雅”效果的最佳翻译工作模式。

猜你喜欢

镜花缘评测语段
浅谈中年级“语段学习”实践策略
《镜花缘》,果真一番镜花水月?
次时代主机微软XSX全方位评测(下)
次时代主机微软XSX全方位评测(上)
《富贵不能淫》阅读题
镜花缘(2)
语段教学,语文教学之“纲”
镜花缘
镜花缘一唐敖出海
MI评测产品排行榜