APP下载

机器翻译对各类型文本的德汉翻译能力探究

2021-03-07卓键滨刘文娴彭子莉

文化创新比较研究 2021年28期
关键词:语料库人工文本

卓键滨,刘文娴,彭子莉

(广东外语外贸大学 南国商学院,广东广州 510080)

该文旨在对比机器翻译对于不同类型文本的翻译能力,以此希望对读者及译者在翻译过程中对机器翻译的运用和选择有所启发,对翻译质量的提高有所帮助。

1 对于机器翻译的介绍

1.1 机器翻译的发展历程和方法

机器翻译【Maschinenübersetzung(德)】,亦可称作计算机翻译,是通过翻译机器【übersetzungsmaschine(德)】进行翻译的一种手段,是一种利用计算机技术对各种自然语言进行互相转换的技术。机器翻译是自然语言研究领域的一个分支,也是计算语言学的一个分支,涉及了计算机科学、语言学、统计学、信息学等多学科,是建立于这些学科的基础之上的,也是人工智能领域的重要课题。在当今互通互联的世界当中,机器翻译无处不在地发挥着它的作用,因此它也具有重要的现实意义。

机器翻译的想法最早可以追溯到17 世纪的勒内·笛卡尔,他提出“在不同语言中等效使用一个符号”,被视为机器翻译想法的出现。20 世纪40年代,英国工程师Booth 和美国工程师Weaver 提出利用计算机进行翻译并开始研究翻译机器,这是近现代机器翻译发展历程中的重要一笔。但在20 世纪60年代,自动语言处理咨询委员会(ALPAC)的报告显示,对于机器翻译长达10年的研究没有达到预期,机器翻译的研究因此陷入低潮。20 世纪70年代,随着计算能力的发展以及机器翻译的各种实际应用,机器翻译的发展重回正轨。在近几十年的机器翻译发展过程中,主要可以分为4 个发展阶段或者方法,即基于规则的机器翻译、基于统计的机器翻译、基于实例的机器翻译和基于人工神经网络的机器翻译。

基于规则的机器翻译方法也称为理性主义的方法,它主要基于语言学理论、语法规则,由词典和规则库构成知识源(唐业凡,2018)。基于规则的机器翻译方法主要包括:直译法、转换法和中间语法。直译法,就是将源语言的词和句直接转换为目标语言的词和句,必要时进行语序调整。转换法的实质是在原语和译语之间设定能在一定程度上表现语义关系的中间表达式(郑茗元,常霜林,2015)。中间语法的方法就是在源语言与目标语言之间建立一个不依赖于任何单独一种语言的中间表达式。

基于统计的机器翻译的方法和基于实例的机器翻译的方法可以归结为基于语料库的机器翻译方法,同时也称为经验主义的方法。基于语料库的方法以语料库语言学为基础,通过大规模搜集互为译文的双语语料作为获取翻译知识和统计知识的依据,或直接利用语料库进行机器翻译中的分析、 转换和生成(郑茗元,常霜林,2015)。基于统计的翻译方法,就是将翻译的过程放在统计方法的框架之下,将翻译视为一个噪音信道或信息传输问题,而翻译过程就是在庞大的语料库中搜索出与源语言最接近的目标语言。基于实例的翻译方法是由日本学者长尾真教授提出的,这种翻译方法可以简单地理解为:在由大量实例形成的双语对照语料库中,查找出与等待翻译的句子最相似的实例,以此完成翻译过程。

基于人工神经网络的机器翻译,也可称为人工智能翻译,就是将机器翻译系统拟人化,使机器翻译像人脑一样思考后产生翻译结果,这样的翻译系统使得机器翻译译文的整体性有进一步地提高,使得机器翻译译文中前后句子更加流畅,很大程度上解决了行文流畅的问题。基于人工神经网络的机器翻译使机器翻译进入快速发展阶段,在与其他各种机器翻译方法中也具有一定优势。

此外,由于每一种机器翻译方法都有各自的缺点和劣势,各种机器翻译方法也开始借助其他机器翻译方法来完善自身不足的地方,被称为多引擎的翻译方法,即集成多种机器翻译方法构成一个机器翻译系统,各种翻译方法都生成自己的结果,最终综合生成翻译结果,这也是今后机器翻译发展中将会出现的一种趋势。

1.2 机器翻译的大致过程

人类的翻译过程大致是这样的:(1)理解源语言的意义;(2)用目标语言重新组织语言;(3)生成翻译结果。机器翻译的大致过程则是:(1)分析、编码源语言;(2)在相关的语料库、密码库中寻找相对应的编码;(3)将编码所代替的目标语言解析出来,生成译文。无论是机器翻译还是人工翻译都必须将单词、语法规则和句子结构等等因素考虑进去,这也是机器翻译发展中面临的挑战之一,即如何通过编程让计算机接近人脑一样进行翻译。

从机器翻译的性质上来讲, 是以自动依托于计算机技术和信息技术而存在的翻译方法, 从其翻译原理发挥作用的类别上来讲, 机器翻译的方法包括了直观性较强的直译法、 通过衔接和转换实现的转换法以及通过中间语言的反馈达到翻译目的的中间语言法。对于这3 种方法发挥作用的原理,都是通过对语言进行分析和研究,从而达到翻译的目的。在实际应用中, 不同的翻译方法对于语言的解读层次和解读方法存在差异。关于直译法,其实是一种比较直观且不需要对语言进行分析和研究的翻译方法,在翻译工作中属于一种层次比较基础的翻译方法。而后两种方法, 需要在一定程度上对语言进行分析和研究,并在此基础上获得翻译的结果。

2 对机器翻译实际应用的分析

2.1 对比机器翻译和人工翻译对不同类型文本的翻译能力

2.1.1 文本类型理论及工作方法

文本类型理论是由英国语言学家、 翻译理论家纽马克、 德国翻译理论家莱斯根据语言功能对文本进行功能划分的理论。该论文的研究内容主要是基于以谷歌翻译为代表的机器翻译,分析其对不同文本类型的翻译结果,并将此结果与人工翻译相比较。论文中的文本类型主要包括莱斯文本类型理论中的信息型文本、表达型文本和操作型文本,语料基本涵盖了上述3 种文本类型的典型文本,如新闻报道、文学作品、演讲稿和广告。3 种文本类型的人工翻译译本选自得到业内认可的版本,其机器翻译的译本直接通过谷歌翻译得出。在对比本选自得到业内认可的版本,其机器翻译的译本直接通过谷歌翻译得出。在对比机器翻译和人工翻译的过程中,根据用词错误、词序错误、句型错误、信息冗余和其他错误这5 个方面,对两种译本的错误数量进行统计,从而分析其翻译效果。

2.1.2 信息型文本

(1)特点。主要是表现事实、信息、知识、观点等,其语言特点是逻辑性较强。

(2)范畴。参考书是最典型的信息类文本,其中,重内容的文本还包括新闻发布和评论、新闻报道、使用说明书等。

(3)实例。

例1:使用说明书

Der Akku hat möglicherweise das Ende seiner Lebensdauer erreicht, wenn die Nutyungsdauer merklich kürzer wird, obwohl der Akku voll geladen wurde.

谷歌翻译:如果即使电池已充满电,使用时间也会明显缩短,但电池可能已经达到使用寿命。

人工翻译:若电池已充满电后,使用时间明显缩短,这说明电池可能已达到其使用寿命。(铁三角蓝牙耳机说明书,2019)

分析:产品说明书通常具有一定的专业性,句式多为祈使句、简单句,意思简单直白。结合其特点,可以看出谷歌在翻译产品说明书这一信息类文本时,翻译的准确度和译文的可读性都相对较高。

例2:新闻报道

Verkehrsminister Scheuer fiel in den vergangenen Wochen immer wieder durch polarisierende ?u?erungen zum Autoverkehr auf. Auf dem Radverkehrskongress in Dresden schlug der Minister andere Töne an.

谷歌翻译:最近几周,运输部长Scheuer 多次就汽车交通问题发表了两极化的说法。在德累斯顿的自行车大会上,部长采用了不同的语调。

人工翻译: 在过去的几周里,德国交通部部长Scheuer 因为其对汽车出行极端化的评论而引人关注。在德国自行车交通大会上,交通部长发表了其他的意见。(每日德语听力,泡课每日新闻解读,2019)分析:谷歌翻译把句子大意都翻译出来了,但在处理词汇的细节上出现了不够细致、不够准确的错误。我们在研究中也发现,机器翻译在处理词汇时常出现错误。

2.1.3 表达型文本

(1)特点。表达型文本重形式,表达功能的核心在于说话者或作者运用一些话语来表达其思想感情。

(2)范畴。典型的表达型文本有文学作品,包括抒情诗、小说、戏剧等;权威性言论,主要有政治人物的政治演说及文件等,法律法规文献。

(3)实例。

例1:演讲德国总理默克尔在2020年12月9日在联邦议院发表的一场演讲,呼吁德国人遵守防疫规定。

Und deshalb sollten wir schauen, dass wir nicht zu viele Menschenleben zerstören, und gleichzeitig,dass wissen wir damit auch, die Wirtschaft am Laufen halten. Und in diesem Sinne bitte ich Sie. Auch die nächsten nicht einfachen Tage mit uns gemeinsam durchzustehen.

谷歌翻译: 这就是为什么我们应该确保我们不会破坏太多的人命,同时,我们也知道,要保持经济发展。考虑到这一点,我问你。与我们一起度过下一个艰难的日子。

人工翻译: 因此我们会尽量不去摧毁太多人的生活,同时还要保持经济的运转。因此我在这里恳求各位,在接下来艰难的几天里,我们一起坚守,共克时艰。(每日德语听力,2020)

分析: 著名的翻译家和翻译理论家纽马克曾指出,文本的划分并非是绝对的(Newmark,2001)。这篇演讲也不完全属于表达型文本,因为它还具有吁请功能。翻译不可能实现所有价值全体的、无差别的保留,而是必须进行选择。对比这句的翻译,谷歌翻译后的句子成分赘余,不够通顺,有明显的机器翻译痕迹。因为演讲中一般会出现较多的复合词、 长难句,句式较为多变,在使用机器翻译时,翻译出来的句子在句式上往往会拘泥于原句的形式,让目标语读者理解起来比较困难。

2.1.4 操作型文本

(1)特点。以读者群为中心,意在号召读者们按照作者的意图去行动、去思考、去感受。

(2)范畴。告示、宣传手册、广告,以及以取悦读者为目的的通俗小说等都属于操作型文本。

(3)实例。

例1:宜家2017 温情广告“有家的地方,有美好生活”。

Und das Leben müssen wir uns auch kümmern.Das Leben kann manchmal hart sein. Dann hilft uns etwas Weiches. Es ist oft kompliziert.

谷歌翻译:我们也必须照顾生活。生活有时会很艰难。然后一些软的东西可以帮助我们。它通常很复杂。

人工翻译:我们也得去关心照顾生活。生活有时也会很艰难。爱会帮助我们。生活往往也很杂乱无章。(每日德语听力,2018)

分析: 谷歌翻译仅仅把句子的字面意思翻译了出来,却缺乏了广告所需要表达的感情。如“Dann hilft uns etwas Weiches.” 一句中的“etwas Weiches”直译过来是一些软的东西。在生活很艰难的时候,“一些软的东西”可以帮助我们,实际上“etwas Weiches”指代的就是“爱”。

例2:以取悦作者为目的的文本

他终于考上了大学;不经一番寒彻骨,怎得梅花扑鼻香。(CCL,2009)

谷 歌 翻 译:Er wurde schlieβlich zum College zugelassen, es war kein bisschen Kälte, wie konnten die Pflaumenblüten nach einem Geruch riechen.

人工翻译:Endlich hat er die staatliche Aufnahmeprüfung bestanden, um an der Universität studieren zu können. Wie könnte man Erfolge erzielen, wenn man vorher nicht hart gekämpft hätte?(包汉毅,2012)

分析:“不经一番寒彻骨,怎得梅花扑鼻香”出自唐代诗歌《上堂开示颂》。梅花在中国文化中有特别的意义,因为梅花在严冬季节绽放,所以中国人多用梅花比喻“艰苦环境下坚韧的奋斗者”。而这种特定的比喻是有区域性的,其实义是不经历一番艰苦的奋斗,怎么能取得成功? 而谷歌翻译在分析句子时,只能根据原句的字面意思进行翻译然后拼凑,不能在整体上和文化背景上对此进行灵活处理。这对于读者来说在理解上会产生问题。反观人工翻译,采取了转译的方法,用更通俗易懂的话语展示了原句的意思。

3 结语

我们通过研究得出以下结论: 机器翻译最擅长处理信息型文本。其次是表达型文本中的非文学翻译。表达型文本中的文学作品翻译和操作型文本对机器翻译来说比较棘手。机器翻译是科技翻译,是各具体学科、专业翻译的最佳途径。因为这类翻译句式结构较为简单,专业词汇重复量大,而机器翻译速度快、效率高,完全可以在这方面大显身手。

从商业的角度来看,机器翻译的前景是光明的。随着全球经济一体化进程的不断加深,对于翻译的需求势必不断增长。在这种情况下,如果仅依靠人工译者面对大量的翻译文本,可能会影响翻译成果质量。而如果由机器翻译参与大量的基础性的工作,人工译者只需进行前期准备和后期加工、审核,翻译的质量和效率必定都会大大提高。

从与人工翻译的关系来看,机器翻译的前景是暗淡的。机器翻译想要代替人工翻译在短时间内还是不可能的。首先,人可以不断学习新的知识,但机器的学习能力还到达不了这样的地步。其次,机器翻译被发明的目的不是取代人类进行翻译工作,而是协助人类进行翻译工作。换言之,人工译者和机器翻译将在翻译工作中各司其职,本就不存在代替与被代替的关系。

综上所述,机器翻译虽然存在很多局限性,但它的便捷性和高效率同样不可忽视。相信在经济社会、相关技术和人工智能水平的快速发展下,机器翻译的发展也能有更广阔的天地。

猜你喜欢

语料库人工文本
人工3D脊髓能帮助瘫痪者重新行走?
文本联读学概括 细致观察促写作
人工,天然,合成
人工“美颜”
《语料库翻译文体学》评介
在808DA上文本显示的改善
基于doc2vec和TF-IDF的相似文本识别
新型多孔钽人工种植牙
文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻
基于JAVAEE的维吾尔中介语语料库开发与实现