论英汉机器翻译的改进之道<br/>——基于《金融时报》人机翻译的比较研究

论英汉机器翻译的改进之道
——基于《金融时报》人机翻译的比较研究

2020-02-23刘莉琼

宜春学院学报 2020年1期

刘莉琼

(江西财经大学外国语学院江西南昌 330032)

一、引言

随着经济全球化的不断延伸和深入，人们对翻译活动的依赖和需求也愈加强烈，这极大地促进了翻译产业的发展，同时也对翻译职业提出了巨大的挑战。机器翻译得益于信息技术的迅猛发展，也有了新的突破，无论是基于实例的机器翻译(EBMT)、统计机器翻译(SMT)、还是最新的神经机器翻译(NMT)都显著地提高了翻译的准确度和可读性。2016年10月，谷歌在其网站发表的论文《谷歌神经机器翻译系统：缩小机器翻译与人工翻译的差距》(“Google’s Neural Machine Translation System：Bridging the Gap between Human and Machine Translation”)中就指出，在多次测试中，谷歌神经机器翻译系统的译文的准确度已经接近于一般水准的双语译者的水平。(“GNMT system approaches the accuracy achieved by average bilingual human translators on some of our test sets.”)[1]为了进一步缩小机器翻译与人工翻译的差距，我们必须了解其差距之所在及其成因。本文选取了英国《金融时报》的“FT每日英语”订阅号的人机翻译PK小游戏中2018年10月12日到12月29日共36期的108个句子的汉译作为研究对象。其中的人类译员是FT中文网的资深翻译，机器翻译系统有谷歌、有道、百度、搜狗、必应。虽然各个机器翻译系统的译文不尽相同，但本文主要针对机器翻译的共性特征，通过对人机译文的对比，从翻译学视角指出机器译文与人工译文的差距并对其成因做统计分析，以期为机器翻译系统的改进提供语言分析基础，提高机器翻译译文质量，或为从事译后编辑(post-editing)工作的译者提供参考意见和建议。

二、人机译文比较的维度

近来，国内有不少学者对英译汉的人机译文进行过比较研究。有的是通过对人机译文语言特征的比较，指出机器译文与人工译文的差距，如，蒋跃在对5篇韩素音翻译竞赛英译汉的机器在线及人工译本语料中13个语言结构特征(词长、句长、型例比、副词比例、名词比例、代词比例、助词比例、惯用语比例、标点符号比例、陈述句比例、疑问句比例、感叹句比例、单现词)的分布做了统计和分析后，得出机器翻译“在词汇的丰富度、变化度、密集度、句法结构的复杂度和变化度上尚与人工翻译有明显差距，助词、指代方式显化尤为明显。”[2](P102)

有的是通过对机器译文出现的错误，指出机器译文与人工译文的差距。如，罗季美和李梅在《机器翻译译文错误分析》一文中通过对汽车技术文献翻译语料库中近10万句译文的逐一比较，确立了词汇、句法、符号三个机器译文一级错误类型。在一级错误类型中再根据具体的错误特征进行二级错误类型分类。其中词汇错译包括术语错译、连词错译、词性错译、词汇缩写错译、词汇漏译、词汇替代错译和词汇不译；句法错译包括词序错译、名词短语错译、动词短语错译、介词短语错译、被动语态错译、动词不定式错译和分词错译，并指出词汇错译发生率所占比例远远高出其他类型的译文错误。[5](P85)

这种条分缕析的描写性分析确实可以使我们更清楚地了解机器译文不足和错误之处的分布和出现的频率，但对于如何改进机器译文的指导性不强，因为描写性分析只能让我们知其然，而不知其所以然，遑论改进之办法。所以，本文尝试从翻译过程的视角寻找不当译文产生的原因和机器翻译的改进之道。

对于人机译文比较数据的选择，本文并没有选择法律文本和科技文本等程式化文本或信息性文本，也没有选择小说、散文和诗歌等表现性文本，而选择了兼具科技文本和文学文本特征的较大众化的新闻文体，且内容几乎覆盖了政治、经济、社会、生活、娱乐等所有领域，以期能让对英汉机器翻译差距的分析更有普遍意义。在对《金融时报》108个英文句子的三个机器译文和一个人工译文进行比较后，我们发现有些机器译文错误严重，完全误导读者，这种译文属于误译；而有些机器译文意思基本清楚，只是表达比较生硬，这种译文属于硬译。两者有本质的差别，误译属于不忠实，问题主要出在理解上；而硬译属于不通顺，问题主要出在表达上。因此，我们首先从翻译学的视角将这108个句子的机器译文分成两类：误译和硬译。现分别举一个例子说明(下划线为本文作者所加)：

(1)Itstrains credibilitythat his recent presidential predecessors would have been left in the dark in similar situations.

1.很难相信在类似的情况下，他之前的几位总统也会被蒙在鼓里。(人工)

2.他最近的总统前任在类似的情况下会被蒙在鼓里，这让他的可信度受到影响。(搜狗)

3.他最近的总统前任会在类似的情况下被蒙在鼓里，这给他带来了信誉。(必应)

4.他最近的总统前任在类似的情况下会被蒙在鼓里，这让公众的信誉变得很紧张。(百度)

原文之意应该是他之前的几位总统也会被蒙在鼓里这件事情本身令人难以置信，而并不是指这件事影响他的可信度、或给他带来了信誉、或让公众的信誉变得很紧张。所以，该句划为误译。

(2)While an effective，some say transformative，mayor，Mr.Bloomberg has never been regarded as a great campaigner.

1.虽然布隆伯格先生是一个有效的，有人说是变革性的市长，但他从来没有被认为是一个伟大的活动家。(搜狗)

2.布隆伯格虽然是一位有效、被某些人称为有变革精神的市长，但他从未被视为伟大的竞选者。(人工)

3.布隆伯格先生虽然是一位有效的，有些人称有变革性的市长，但从未被视为伟大的活动家。(谷歌)

4.尽管布隆伯格是一位有效的、有人说是具有变革性的市长，但他从未被视为一位伟大的竞选者。(有道)

四个译文所表达的意思都准确清楚，但人工译文将原文的主动语态改成被动语态，让译文中的定语部分表达更流畅。另外，“有变革精神的市长”比“有变革性的市长”更符合汉语的表达习惯。所以该句划为硬译。

对108个句子的机器译文进行标记后，我们得出40个句子的机器翻译错误属于误译，68个句子属于硬译。另外，例(1)中既有前面分析的误译，也有硬译，“他最近的总统前任”(his recent presidential predecessors)地道的汉语表达应该是“他之前的几位总统”。但由于这个分类是以句子为单位，我们还是将其归为误译，因为翻译活动，究其根本，是信息的沟通与交流，与一些细节的表达不地道相比，一个句子语义错误无疑重要得多。换言之，68个硬译的译文其实是语义基本准确的译文，占比63%，由此也可以说明机器翻译在传递语义信息方面上基本是合格的，翻译的任务基本是完成了的，这也可以解释为什么市场上的智能翻译机获得了一定程度上的认可。当然，这种翻译学的标记主要是基于作者的主观判断，理论上确实不及语言学的标记客观准确，但这种标记更接近于翻译的本质。翻译并不是语码之间的转换，而是作者和读者之间的沟通。接下来，我们分别从词语和句法两个层面对机器误译和硬译进行分析。

三、机器误译分析

导致机器误译的主要原因对原文句子的理解错误，而对一个句子的理解过程主要包括对词汇语义的确定和对句子结构的把握。因此，我们将机器误译的原因简要分类为：词汇理解错误和结构理解错误。前文例(1)中的机器译文就既有词汇理解错误，“strain”在此处的意思应该是“to strain something means to make it do more than it is able to do.”(使不堪重负)，译作“影响”程度太轻，译作“带来”完全错误，译作“变得很紧张”搭配不当。也有结构理解错误，“credibility”(If someone or something has credibility，people believe in them and trust them.)指的是人们相信这个论述的程度，也就是这个论述的可信度，而不是这位总统的可信度、这位总统的声誉，或公众的信誉。另外，为了分类的简洁，我们将少量的逻辑错误归入结构理解错误。当然也有的句子只犯了两种错误中的一种。如：

(3)What is true，however，is that sanctions are failing to produce the desired effect of acheckon President Putin’s adventurism.

1.然而，真实的是，制裁未能产生对普京总统的冒险主义的检查所产生的预期效果。(谷歌)

2.然而，事实是，制裁未能对普京总统的冒险主义产生预期的效果。(搜狗)

3.然而，事实是，制裁未能产生对普京总统冒险主义进行检查的预期效果。(必应)

4.然而，事实是，这些制裁措施在制止普京总统的冒险主义方面并没有产生预期的效果。(人工)

很明显，三句机器译文的错误主要源于对“check”的理解错误，应该是“制止”而不是“检查”。

(4)Regulatory changes have made banks less willing to hold or buy large volumes of securitiesin a waythat might function as a shock absorber in a falling market.

1.监管改革使得银行不太愿意持有或购买大量证券，而这种方式可能会在市场下跌的情况下起到减震器的作用。(必应)

2.监管变化使得银行不那么愿意持有或买入大量证券，从而无法在市场下跌时起到缓冲作用。(人工)

3.监管方面的变化使得银行不太愿意以某种方式持有或购买大量证券，而这种方式在衰退的市场中可能起到减震器的作用。(百度)

4.监管变化使得银行不太愿意持有或购买大量证券，这种方式可能会在市场下跌时起到缓冲作用。(搜狗)

很有意思的是，这个句子的机器译文和人工译文正好相反。问题在于“might function as a shock absorber in a falling market”(在市场下跌时起到缓冲作用)的逻辑主语是什么？逻辑分析告诉我们应该是“银行持有或购买大量证券”(to hold or buy large volumes of securities)才能在市场下跌时，对其起到减震/缓冲的作用。

在对40个误译句子进行标记后，我们得出28句子误译的主要原因是词汇理解错误，22个句子是结构/逻辑理解错误，其中10个句子两种错误都很明显。

语用学认为，一个人对文本理解来自于将文本的语言学知识与相应的语境信息相结合的推理过程。对于机器翻译而言，文本的语言学知识并不缺乏，所以误译基本上与语境或推理相关。词汇理解错误多与上下文语境有关，如例(3)中的check与冒险主义(adventurism)搭配，与制裁(sanctions)呼应，所以应取“抑制、阻止”之意。结构/逻辑错误则多与背景知识和推理过程的逻辑性有关。如对例(1)中credibility和例(4)中in a way的理解都和逻辑推理有关。

现有计算机的智能模拟是一种基于符号句法属性的认知模拟行为，这使其在语义理解和学习层面上存在着极大的短板：计算机的符号检索和操作行为本质上并没有涉及语义的逻辑推理，而计算机仅有的“联想”能力是建立在符号规则的有限归纳基础上而实现的。[4](P27)换言之，机器翻译的本质还是停留在符号层面上寻找对应关系，并没有深入到语义层面进行逻辑推理。所以，尽管人工智能取得了突破性进展，机器翻译的准确率有了显著提高，但距离取代人工翻译还为时尚早。因此，译后编辑也就变得非常必要和重要，且译后编辑的重点是词语和词语之间的逻辑联系以及语义的合理性。鉴于新闻文本更新快，读者对细节的要求不是很高，本文提及的译后编辑属于快速译后编译(light post-editing)。快速译后编辑尽量多的采用机器翻译的原始输出，重点是修改错译、文化差异的内容、重新组织句式结构，但不修改译文的风格。

四、机器硬译分析

减少硬译其实是对机器翻译提出的更高要求。导致机器误译的主要原因对译文句子的表达生硬，即句子的各个组成部分之间的不连贯或整体上不协调，主要表现在词语搭配不当和句子结构不畅。例(2)的机器译文既存在词语搭配不当(“变革性的市长”)，也存在句子结构不畅(将“有效的”和“有些人称有变革性的”并列作定语)。再如，例(5)中的“微薄的……网络”属于搭配不当。例(6)在“驾车穿越美国”和“清楚表明”之间插入较长的句子成分，和“有多少是无人居住的”都属于句子结构不畅。

(5)Themeager social safety netmakes it imperative to stash money for old age，education or healthcare.

1.微薄的社会安全网使得必须为老年，教育或医疗保健存钱。(谷歌)

2.由于社会保障体系薄弱，为养老、教育或医疗存钱成了绝对必要的事情。(人工)

3.由于社会安全网微薄，必须为老年、教育或医疗存钱。(必应)

4.微薄的社会保障网络使得存钱养老、教育或医疗成为当务之急。(有道)

(6)Driving across America，as opposed to looking down from a plane，makes clearhow muchof this vast country is uninhabited.

1.驾车穿越美国，而不是从飞机上俯瞰，清楚地表明这个庞大的国家有多少是无人居住的。(百度)

2.驾车横穿美国，而不是从飞机上往下看，可以清楚地看到这个幅员辽阔的国家有多少是无人居住的。(有道)

3.与从飞机上俯瞰不同，驾车穿越美国可以清楚地看到这个庞大的国家有多少土地杳无人烟。(人工)

4.驾车穿越美国，而不是从飞机上俯视，这清楚地表明这个广阔的国家有多少是无人居住的。(谷歌)

在对68个硬译的句子进行标记后，我们得出47个句子存在搭配不当，31个句子存在结构不畅，其中10个句子中，这两种硬译的表现都存在。

面对搭配不当，译者在译后编辑时要尽量跳出原文的束缚，更多地从译入语的视角来关照词语之间的衔接和整体的协调。翻译术语时，尤其如此。如例(3)中“safety”应译为“保障”而不是“安全”，因为“为养老、教育或医疗存钱”是属于社会保障的内容而不是社会安全的内容。再如例(7)中的“technical damage”在谈论股市时，应译为“技术性回调”：

(7)Now we have some severetechnical damagein the market going into year-end and investors continue to suffer from fear，uncertainty and doubt.

1.现在我们在进入年底的市场上受到了一些严重的技术破坏，投资者继续遭受恐惧、不确定性和怀疑。(必应)

2.现在我们在年底前市场上受到严重的技术损害，投资者继续受到恐惧、不确定和怀疑的困扰。(谷歌)

3.现在，到年底，市场出现了一些严重的技术损害，投资者继续遭受恐惧、不确定和怀疑。(搜狗)

4.进入年底，目前市场出现了一些严重的技术性回调，投资者继续受到恐惧、不确定性和疑惑的困扰。(人工)

面对结构不畅，译者如果掌握了英汉语言表达法的一些根本性差异，在译后编辑时就更容易做到有的放矢。比如说，“英语句子有严谨的主谓结构。这个结构通常由名词性短语(NP)和动词性短语(VP)构成。主语不可或缺，谓语动词是句子的中心，两者协调一致，提纲挈领，聚集各种关系网络。”[3](P51)“相比之下，汉语的主谓结构要复杂得多。主语不仅形式多样，而且可有可无：它可表示施事、受事，也可表示时间、地点；可用名词、动词，也可用形容词、数量词；句子可以没有主语，也可以省略主语，还可以变换主语并予以隐含。”[3](P58)例(7)中原文中的主语we泛指“人们”，并没有特定含义，基本上是为了满足英语对主谓结构这个必要条件的需求而生，翻译时完全可以省略。所以在对“we have”这个主谓结构的处理时，必应和谷歌的只调整了语序的译文，远不及搜狗的以地点作主语的存现句译文更符合汉语的表达习惯。再如例(7)中对“suffer from fear，uncertainty and doubt”的处理。英语表达多呈现抽象化特征，广泛运用名词，尤其是抽象名词，而汉语擅长具体而形象的表达法。必应和搜狗的译文“遭受恐惧、不确定性和怀疑”从语义上看似乎没有什么问题，但不是汉语习惯之表达。用范畴词使抽象概念具体化，是汉语用来表达英语抽象词义的常用方法之一，所以，我们看到谷歌和人工译文都会在“恐惧、不确定性和怀疑”的后面加上“困扰”一词。

2014年在德国柏林召开的世界翻译大会主题是“人工翻译与机器翻译？翻译工作者与术语学家的未来”(Man vs.Machine ? The Future of Translators，Interpreters and Terminologists)，突出了人工翻译与翻译技术的结合，也凸显了当今翻译研究的技术转向。机器翻译已完全融入我们的生活，人机互补和互动将成为翻译工作的常态。与机器翻译未来的发展前景相比，翻译界现在对机器翻译的研究还远远不够。我们应该明确，提高机器翻译质量的核心问题仍然是语言本身的问题，而不是程序设计的问题。致力于研究翻译活动的本质、提高机器翻译的准确度，也是我们这个时代翻译工作者的使命。

简而言之，现在的机器翻译对句法结构的处理有了很大的提高。“神经网络机器翻译显著提升了译文的可读性，主要是因为其更好地处理了句法问题，如主谓一致、过去分词、双宾语、补足语等问题，还大幅度降低了词序错误、词形变化错误以及功能词错误等”。[6](P53)但对于语义的把握，机器翻译仍存在明显缺陷，单个看词语或句式的翻译可能没有问题，但整体并不等于部分的简单相加，针对原文语义的逻辑推理和保持译文语义的连贯完整仍是机器翻译的短板。所以，我们译后编辑的重点是对词语与词语之间，各个句子成分之间的语义和逻辑关系把握，以确保译文整体的逻辑性和连贯性。