APP下载

“俄汉机器翻译+译后编辑”新型模式

2022-06-02李思迪贺涵薇曾艺梅

中国新通信 2022年6期

李思迪 贺涵薇 曾艺梅

【摘要】    本文通过介绍机器翻译和译后编辑的基本概念,对机器翻译的主要问题加以分析与探讨,在此基础上,根据机器翻译误译类型,以译后编辑的原则设计为指导思想,总结了译后编辑所应采取的处理对策,并着重阐述了“俄汉机器翻译+译后编辑”新模型的结构与意义。

【关键词】    俄汉机器翻译    译后编辑    结构模式

一、俄汉机器翻译和译后编辑

(一)机器翻译的定义

机器翻译(MT)是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程,又叫做自动翻译,但通常也泛指在某些语句或全文与自然语言之间的翻译。机器翻译技术需要通过计算机数据库和翻译软件系统来完成操作,所以机器翻译科技的发展离不开计算机、人工智能、语言学、翻译学等多学科的发展。

(二)译后编辑的基本概念

译后编辑是在机器翻译系统生成的译文经过源语言到目标语言处理后再进行的进一步完善编辑操作。posteditor一方面可以指代人工的译后编辑,另一方面也代表了具有译后编辑功能的译后编辑器。它是完全独立于应用程序以及操作系统的后期编辑模块,需要根据具体操作系统的特点和需求来设计。

译后编辑,通常是指通过少量的手工修改来完善机器生成的翻译的流程。译后编辑的工作量没有定性、因材料而异。根据修改量的多少,译后编辑可分为最小PE、快速PE、部分PE、最大PE和完全PE。

文本标准化水平越高,术语越多,则机器翻译的精准度就越高,且译后编辑的修改工作量也越小。流行的文字表达方式、创新的构词方法以及复杂的句法结构都会造成传统机器翻译系统的译文输出品质低下,从而加大了人工编译与改写的工作量。

二、“俄汉机器翻译+译后编辑”模式的必要性

(一)机器翻译的步骤和常见错误

一般而言,机器翻译包括三步骤。第一步,对源语言文本进行译前编辑,由机器翻译系统在此流程中对源语言文本加以整理和标记,随后再根据原文本的语言规律转化为基于计算机语言编程的中间语。最后,由电脑根据目标语言的句法结构进行对中间语的词序调整,最后输出合乎目的、语法标准的翻译成果。

但由于自然语言存在高复杂性,所以机器翻译的翻译质量往往无法达到人们的实际要求。部分原因如下:1.一般情形下,机器不能根据具体语境去判断多义词语、一般单词和专业词语的真实含义,由此导致词性分类失败,产生误译、漏译现象,进而导致翻译精确度下降。2.由于机器辨别语句结构的能力不强,对各限定词、修饰成分、词首的位置等处理能力也不强。当语句结构复杂,且修饰成分较多时,机器只会按照原文字的语句结构进行翻译,而无法根据语言规范灵活调节,难以判断语言表层下的含义。3.在词篇衔接方面,由于词序不合理、短语和逻辑词之间的连接方式出现偏差以及语气的错误等问题,使得词篇在机器翻译中的衔接程度较低。4.存在译文软件数据库建设更新速度慢、俄汉双语语料库不完整、计算机技术发展瓶颈、大数据编程固有规律等问题,也会对译文的翻译质量产生负面影响。

(二)译后编辑的必要性

译后翻译的最大优势,就在于可以保证质量最高化。机器翻译系统则可保证术语的统一性。因此复杂的、熟悉的工作可以由机器翻译系统完成,但是译文質量问题,则需人工对翻译过程严格把关。

译后的再处理功能,同样是对用户语言进行调节和加工的辅助功能,也有助于降低人工翻译工作量。通常还需加入再处理阶段,以实现对各种关键性要点的归拢合并和译后再处理过程,以此顺利获得一个更高质量的译文输出结果。因此机器翻译得出的译文由人工进行二次修改,并且在人工译后编辑后总结规律、改良系统的方案是现阶段的最佳方案。

三、译后编辑方法及原则设想

(一)译后编辑方法

1.针对上述机器翻译问题的解决策略

上文总结了机器翻译中部分常见的错误类型:语义内容、语句结构、语意连贯,且进行再次细化,针对性修改与编辑。“对症下药”总结出具体的修改方法,即对于语句意义内容和结构,纠正错译、补充漏译、删除多译,修改生硬句和晦涩难懂处,纠正符号使用错误,检查核实、人名、地名、书名、数字、时间和单位等。 对于语意连贯的方面,调整字词顺序、增添语法逻辑词和连接词,修改结构问题、词汇翻译错误和时态语态选择错误等错误类别。

2.已有经验借鉴

国外研究者根据机器翻译的常见错误,总结出五条在翻译后重新编辑时可以使用的策略,依次是:调整句子结构、去除冗余词汇、修改词型、增加遗漏的词语和修改词汇选择。其范围相当宽泛,在进行译后编辑时可以根据文章类别加以细分。

国内学者从词汇、句子和语法三个层面提出了相应的译后编辑策略。在词汇层面,包括检查地名、人名和专有名词的误译和漏译;检查并调整词语的顺序及词汇表现等。在句子层面包括对长句进行断句和平衡句子结构。在语法层面,则提出了确定主语、修改时态和调整语态三大策略。

3.技术创新——利用电脑科技增加云资源库、专业术语库

针对语句内容部分的错译,便可利用电脑端科技建立专业化的云资源库、术语库、缩略词库、高频连词梳理库等,持续增加多种库容量,实现翻译的高匹配度。如此则需借助科学技术的高效研发、创新突破,进一步加固译后编辑与机器翻译的深层合作、必然联系。除强大的科学技术力量支撑外,仍需要译后编辑工作者严谨科学的工作态度、经验积累与付出,不断扩充资源术语库的匹配容量,实现量变到质变的重大突破。在现今出现的软件开发功能基础上,还须加强译后校对的云资源库功能,以重点句子语言句法结构、文化误解等的深层次问题,而不仅仅局限于提升人们对软件编译后所使用的便利性上。在这个步骤之前,先需要进行收集和处理加工语料,同时需要正确地对经机器翻译后的翻译结果进行错误校正和错误分类,从而通过研究总结语言层面上存在的大量类似出错情况,并收集高频出错实例。最后所收集和获得的错误样本都可替换成描述性语言表达,然后再将所描述的研究语言以软件建模的方式构建,接入到翻译平台的下端。

4.人工译后编辑方法

(1)检查是否有错译、漏译、多译的状况,如有上述状况及时修改。(2)检查是否存在专有名词的翻译错误,专有名词的错译会对文章译文产生重大偏差。(3)删改部分过于字面化的翻译方式和生硬的机械化表达。(4)俄汉双语类属不同语系,语言习惯和表达方法有较大差异,需要检查句子成分是否完整。(5)由于汉语语句相对于俄语语句逻辑表述并不明确清晰,需检查翻译后句子的逻辑关系。(6)当出现多个形容词修饰一个名词时,机器翻译往往不能把握句子的核心,这时就需要人工进行处理和加工。(7)注意汉语中长句的俄译,因为汉语中的多个长句往往只能指多个意群,而机器却又无法提出具体的断句,鉴于此,机器常常把某个汉语中长句翻译成了其他的多个短句,这样就造成了很多语法错误和含义上的误差。所以需要人工地切分词句,以增加对译文的理解性和可读性。

(二)译后编辑原则设想

现阶段,国内关于新兴译后编辑方面的研究较少,译后编辑理论尚未完善。但因译后编辑工作者共同承担了译审和翻译工作的双重责任,所以需要相关编译人员的理论思想作为译后编辑工作的原则参考,从而实现译后编辑工作的合理性、科学性。

1.文本层面

(1)补足隐藏信息,指的是原文有此类含义,而字面含义却不能表示,这就涉及了句法、语义、逻辑等信息。通过译后编辑,适当补足源语言的隐藏信息内容。(2)删除烦琐多余信息,指的就是去除了原文的累赘或重复信息,比如:显性重复、范畴词等。因为汉语修辞和习惯上的特点,有时同样的词汇会交错重叠地出现,而在机器翻译时也往往是直接根据原文内容进行逐词的翻译,造成了初次翻译的信息内容比较复杂、冗余,或者烦琐。所以,在初译后的翻译过程中一定要酌情更换或删去冗杂信息。

2.所指层面

(1)根据“名从源主”的原则,来翻译具有突出地方特点的专有名词;按照“名从源主”原则翻译特色专有名词,是指刘法公提出的“从‘源头’上尊重最新公布、最权威部门的译名”。不过,由于在中国传统机械编译法中存在对许多专有名词的错译误译,导致无法直接使用,所以在翻译后的编译人员必须比较严格地按照该准则寻找,才能证实这一译名的真正来历。(2)按原文语境,选择译文的表述。按原文语境选定的翻译表述方式,是指通过俄汉双语中所体现的文化关系,分析主客观原因,从而选定翻译表达方式。所以,译后编者必须根据上下文语境,并且设想预测读者的反应,选用最合适的翻译用语,以补充传统机器翻译的缺陷。

3.衔接层面

(1)利用词语替代进行连接。即通过词语替代衔接是指通过上下文对某个词语加以替代,以便进行语句连接。通过词语替代的方法,以实现语篇文本紧凑与衔接的目的。(2)理清逻辑关系,调节句子结构。即根据中俄文本句法的差异和原文实际含义,适当地调整部分句子结构,以表达翻译的逻辑关系,同时增加文章的衔接和贯通。

4.自然层面

(1)调整词汇的构成方式,使之更符合漢语使用习惯。根据俄语和汉语在表达习惯上的差异,可以适当更换词汇,调整说法。机器翻译大多数会直接根据原文逐字逐句的译文,这使得译者无法符合汉语搭配惯例。而且在译后编辑中需要根据俄语词汇进行相应的汉语词语修改和造句。(2)用词准确,符合文化内涵。译后编辑需要准确的词汇,才能更好地展现中俄文化内涵。

四、“俄汉机器翻译+译后编辑”的结合模式和意义

近年来,机器翻译与译后编辑相结合的模式得到了广泛的应用。本研究在机器预翻译后,先处理常见的机器翻译问题,然后再使用译后编辑器。如使用了一些衔接手段和信息重组安排方式来处理机器翻译的逻辑问题。最后,再经过人工编译后的重新编辑和校正得出最后的译文。

(一)示意图

(二)模式部分概述

1.机器翻译

将选定的俄语文本导入YiCAT在线翻译管理平台, 使用格式删除工具从文本中删除不相关的格式,只留下简单的文本。鉴于目前处于早期探索阶段,还未完全建立完备的俄汉双语语料库,因此暂时选择平台配置的网络翻译来直接用于预翻译。在预翻译后分析俄汉机器翻译中的错误,以便更好地进行译后编辑。

2.译后编辑

在预译后,通常要查看翻译内容是否有遗漏,格式是否正确,以及标点符号是否有错,之后再仔细阅读全文。基于对译文内容的了解,笔者对机器翻译的用词、术语表达、语序、复合句的翻译以及语句中间的连接词等问题加以逐一编辑。在此过程中,把所有的问题都标记在备注栏中,从而对俄汉机器翻译过程中所存在的问题加以分析与汇总,并总结出译文后的具体编辑对策。计算机辅助翻译工具生成的翻译记忆和语料库内容也为翻译实践提供了充分的数据支持,提升了再翻译此类文本的效率,节省了大量时间。

(三)研究“俄汉机器翻译+译后编辑”模式的意义

1.提高翻译准确性、减少误译的存在

机器翻译技术目前已得到广泛应用,它可以缩短编译过程,提高翻译效率。然而,由于机器翻译系统的局限性和俄汉语之间的差异性,机器翻译往往无法达到理想效果。为了取得翻译质量和效率之间的平衡,译后编辑技术已成为一种必不可少的实用辅助手段。人工智能时代的机器翻译融合了经验主义和理性主义方法,将计算机大数据处理技术与人的认知能力紧密结合。俄汉机器翻译与译后编辑技术相辅相成,大大提高了翻译的准确性。

2.缩短翻译所需时间、提升效率的途径

机器翻译+译后编辑"的模式,把传统机器翻译技术与专业的人工译后编辑技术相结合,以实现学生更能适应高要求高质量的译文需求。同时因为翻译后的编辑工作人员大多为经过专业训练的语言人才,所以学生们可以迅速发现原文翻译中需要调整或修正的部分,进而大大地提高了译文品质。通常情形下,从人工翻译是在目标文本中获取同样水平创造力信息的最佳方法,但却需要大量时间。而如果首先使用机器翻译,之后再进行人工处理,该操作过程对于节省时间和提升生产效率来说,无疑是最好的方式。一般情况下,人工翻译是从目标文本中获得同等水平创造力的最好方式,但也需要大量时间。若先使用机器翻译,然后再加以人工处理,该操作过程对节省时间和提高生产效率而言,无疑是极佳的方法。

3.创新模式,跨越多领域发展的助力

在此情况下,译后编辑与俄汉机器翻译有机结合的新模式发展快速,机器翻译翻译成本低、速度快、人工工作量小。而人工则更能够发挥其对翻译精确性的把握,从而提升了翻译的质量水平。二者相结合的创新模式,使得该模式同时具备机器翻译与译后翻译两者的综合优势,高效准确、保质保量。

“俄汉机器翻译+译后编辑”模型,既充分提升了机器翻译的效率(速度),又充分确保了人工翻译的质量 (精确性)。这些模式不但适应了俄汉翻译市场快速增长的需求,同时推动俄汉翻译技术的迅速发展。

4.开发基础软件,动态完善新型模式

该模式是对“俄汉机器翻译+译后编辑”模式的新型探索。通过比较机器翻译译文的准确性,系统地剖析机翻译文的错误成因,总结错误的种类。深入分析了解典型的俄文用词用句错误,并在生成的俄语语法框架下做出形式化说明。最后在自然语言处理领域中,引入一些功能组成部分,如语义字词典、具有分词或语义消歧功能的软件、分析引擎等。使用者可以任意选用功能组成部分并对其进行安装、编译和调试。

五、结束语

本研究结果将有助于人们深入地发展翻译后再编辑的基础软件,将其视为一个关键功能部分,即将它作为一种重要功能组成部分,在基础软件系统之外添加功能到终端,从而动态地完成“俄汉机器翻译+译后编辑”的模型,有效促进相关“机器翻译+译后编辑”模式的不断完善与探索。

作者单位:李思迪    贺涵薇    曾艺梅    中南林业科技大学 外国语学院

参  考  文  献

[1]尹韩君,楚向群.基于译前处理和译后编辑的机器译文质量改善[J].现代商贸工业, 2018,39 26 145-146.

[2]李梅,朱锡明.译后编辑自动化的英汉机器翻译新探索[J].中国翻译, 2013,34(220), 04 85-89.

[3]魏长宏,张春柏.机器翻译的译后编辑[J].中国科技翻译,2007,No.77 03 11+24-26.