APP下载

计算机类论文摘要机器翻译中的语篇衔接问题

2022-05-09原晋钰高玉芳

中国新通信 2022年5期
关键词:机器翻译

原晋钰 高玉芳

【摘要】    基于神经网络的新型翻译系统使得机译质量大幅提升,为科研人员翻译论文摘要提供了便利。为探究机器翻译在英译中文摘要语篇衔接手段中的问题,本文对比分析了计算机类论文摘要的人工译文和谷歌译文。结果表明,机器翻译能识别出指示照应、主语省略和显性连接,但表现尚不稳定;而机器翻译无法识别出零照应和隐性连接。

【关键词】    计算机类论文摘要    机器翻译    语篇衔接

引言:

科技类论文摘要是论文研究内容和成果的缩影。随着我国科技类研究成果不断涌现以及国内外学术交流日益密切,国内许多著名核心期刊被国际大型检索刊物所收录。英文文摘的质量则直接关乎这些期刊在国外数据库的收录和索引情况,影响其研究成果的国际推广与传播效果[1]。撰写科技类论文双语摘要对多数师生而言并非易事。因此,有些作者常先写出中文摘要,解决摘要的内容和结构等问题,再将其译成英文[2]。

基于神经网络技术的机器翻译迅速发展,机译质量不断提高,为科研人员翻译中文摘要提供了便利。陈妙虹等的一项问卷调查显示78.44%的师生在翻译中文摘要时会使用机器翻译,但他们也认为机译存在诸多问题[3]。孙逸群以材料类英语文摘为例分析了机器译文的词法和句法错误[4],又以海洋类文摘为例剖析了机译中的术语翻译问题和成因[5]。但是,既有研究鲜少讨论机译在语篇层面的衔接问题。而机译错误类型研究不仅要关注词汇和格式等微观层面,还应关注句法和语篇等宏观层面[6]。鉴于此,本文以计算机类论文摘要为例,通过对比分析人工译文和谷歌译文对中文摘要语篇衔接手段的处理方式,探讨机译的语篇衔接问题。

一、学术论文中英文摘要语篇衔接特征

韩礼德和哈桑认为衔接是语篇中一种成分与另一种成分之间的语义联系[7]。正确使用衔接手段是增强语篇连贯性的有效方式。二人提出语法和词汇衔接两种手段,前者通过照应、替代、省略和连接来衔接语篇,后者则通过词汇复现和搭配来衔接语篇。

学术论文摘要内容清晰、语义连贯、结构规范、安置有序,因而是一个独立完整的语篇。中英文摘在语篇层面都应衔接良好,但二者呈现出不同的语篇衔接特征。

国内研究者通过对比分析均由母语作者撰写的中英文摘要,发现省略和替代衔接均较少出现在中英摘要中,照应和连接在英文摘要中的使用率更高,而词汇衔接在中文摘要中的使用率更高[8-9]。

二、學术论文摘要机器翻译中的语篇衔接问题分析

(一)研究方法

本文以国内计算机类核心期刊中的权威学报之一——《软件学报》为语料来源,在该学报于2021年刊发的245篇论文中随机选取10篇论文,以中文摘要作为原文本,已发表的英文摘要作为人工译本,并使用谷歌翻译获取机器译本。本文将首先分析计算机类论文中文摘要的语篇衔接手段,然后对比分析机器译文与人工译文,从而指出机译的语篇衔接问题。

(二)结果分析

1.照应

照应关系指语篇中某一表述为另一表述提供参照。计算机类论文中文摘要中多出现前指照应关系,其一是使用“这”、“该”、“此”等指示代词指代上文所述的研究内容或方法,其二是使用零照应(即没有指示照应词)表示具有明确定指倾向的信息。如下例:

中文摘要:……依次对这3个影响因素的已有研究成果进行总结……对未来值得关注的研究方向进行展望。

人译:…existing research achievements in these three key factors are discussed in sequence…a perspective of the future work in this research area is discussed.

机译:…summarize the existing research results of these three influencing factors…look forward to future research directions worthy of attention.

分析:中文摘要中该句上文提到“3个重要因素”,该句用指示代词“这”进行前指照应。人译和机译均用代词“these”保留原文的照应关系,使译文与上文之间形成深层语义联系。因此,谷歌翻译能识别出原文中的指示照应词,并通过复现照应词来衔接译文。但它无法识别零照应负载的语义信息。基于中文摘要上文信息,该句中“研究方向”指代“该论文所涉研究领域的方向”,具有明确的定指倾向。人译增加了指示照应词“this”使得该句与整个语篇形成连接,但机译未能体现这一照应关系,导致该句与上文语义之间出现衔接断层,语篇连贯性减弱。

2.替代和省略

替代指语篇中的某一个成分被替代词所取代。本研究分析的10篇计算机类论文中文摘要均未使用替代手段。

省略又称为零替代。如果语篇中某一个成分可以从上下文中找到,该成分有时就可省略不提。省略重复性成分,可使语言表达更加简洁,语篇结构更加紧凑。计算机类论文中文摘要中均出现省略“本文”或“作者”等主语的现象。这些无主句以省略的手段衔接句际关系,表达简明且突出重要信息。

例如:

中文摘要:对近些年……取得的成果进行了系统的梳理和总结。

人译:This paper presents a systematic survey of existing research achievements…in recent years.

机译:This paper systematically sorts out and summarizes the achievements…in recent years.

分析:中文摘要省略了主语“本研究”。但英语中完整独立的句子必须有主语,因此在翻译过程中译者需增补逻辑主语或将无主句转换为被动句。在该例中,人译和机译均增补逻辑主语“this paper”,通过照应衔接来处理原文的省略衔接,使译文既符合英文语法规范,又在语篇层面衔接完好。

又如:

中文摘要:①以决策树模型为例,②首先提出一种预筛选+验证的执行方法对查询过程进行优化,③之后给出了从决策树中提取用于预筛选谓词的离线算法,④最后在真实数据集上进行测试。

人译:①This work takes a specific kind of machine learning model, i.e., decision tree, as an example. ②Firstly, a pre-filtering and validation execution workflow is proposed. ③Then, an offline algorithm is used to extract pre-filtering predicates from the decision tree. ④Finally, the algorithm is tested on real world dataset.

机译:①Taking the decision tree model as an example, ②a pre-screening + verification execution method is first proposed to optimize the query process, ③and then an offline algorithm for extracting pre-screening predicates from the decision tree is given, ④and finally tested on a real data set.

分析:在中文摘要中,四个分句都通过省略主語“本研究”来避免重复,结构紧凑,重点突出。人译在句①增补主语“this work”,同时将句②③④转换为被动结构,其隐含的施事者便是句①的主语。被动结构使译文避免重复出现主语“this work”,符合英文摘要的语篇衔接特征,也使译文四个分句衔接完好,语义连贯。谷歌翻译虽识别出原文的主语省略手段,但译文出现逻辑性错误。谷歌翻译将句①译为分词短语,将句②、③译为被动句,句④译为句③被动结构的并列成分。译文看似结构完整、语法规范,但实际上句①中现在分词“taking”的逻辑主语并不是句②被动句的主语,因此二者之间的语义关联逻辑有误,与原文不符。

3.连接

连接手段可用来表达语篇中的各种逻辑关系。连接体现了句或段之间的语义关联,甚至可预示后续语篇的语义发展方向。汉英两种语言的连接手段具有显著差异:汉语偏好隐性连接,而英语则更倾向于显性连接。但学术论文摘要力求语义明确,逻辑严密,因而在使用隐性连接的同时,也多使用显性连接,如“还、此外”等递进连接词、“首先……其次……最后”等时序连接词、“但是、然而”等转折连接词、“如果、即使”等假设连接词、“由于、因此”等因果连接词。以下两个例子分别使用了隐性连接和显性连接。

中文摘要:针对 PR 数据集缺少人工标注的真实标签而无法进行监督学习的问题……

人译:…the supervised learning method cannot be used for training due to the lack of manually labeled tags in the dataset…

机译:…for the problem that the PR data set lacks artificially labeled real labels and cannot perform supervised learning…

分析:中文摘要中连接词“而”隐含了因果关系,即“无法进行监督学习”的原因是“缺少人工标注的真实标签”。人译用显性连接词“due to”表达原文隐含的因果连接关系,句子内部语义形成逻辑关联,衔接良好。然而,谷歌翻译无法识别原文中的隐性连接,错误地将其翻译成由“and”连接的并列关系,译文前后语义关联有误,逻辑混乱。

中文摘要:同时,基于系统文献综述的结果发现,虽然大量微服务的研究都强调……,但是目前……学术文献依然较少,因此将那些……灰色文献也纳入到工作中。

人译:At the same time, it is also found that although a lot of researches on microservices emphasize…, currently there are few scholarly literatures… Hence high quality grey literatures…are also included in this study.

机译:At the same time, based on the results of the systematic literature review, although a large number of microservices studies have emphasized…, there are still few academic literature… High-quality gray literature…is also included in the work.

分析:中文摘要共包含时序、转折、因果和递进四种显性逻辑关系。人译用对应的英文连接词“at the same time”、“although”、“hence”和“also”来复现原文的语义联系和逻辑关系,句际衔接完好。而谷歌翻译识别原文显性连接的表现则时好时坏。机译复现出时序、转折和递进三种显性连接,但漏译了因果连接,导致该句与上句的因果关系丢失,影响读者对语篇逻辑关系的理解。

三、结束语

从语篇层面出发,本文通过对比分析计算机类论文摘要人工译文和机器译文对中文摘要语篇衔接手段的处理方式,发现机器译文的表现时好时坏。机器系统能识别出中文摘要中的指示照应、主语省略和显性连接,但是,当原文句子较长且句中各个分句的衔接手段密集时,机器译文可能引发语义逻辑错误,也可能在识别时发生缺漏,导致译文语篇衔接出现断层。这表明机器翻译系統尚不稳定。而机器系统无法识别出零照应和隐性连接。

参  考  文  献

[1]冯恩玉, 吴蕾. 国内外光学类科技期刊论文英文摘要体裁对比分析[J]. 中国科技期刊研究, 2016, 27(02): 230-236.

[2]于建平. 科技论文英文摘要的写作与翻译剖析[J]. 中国翻译, 1999(05): 32-34.

[3]陈妙虹, 郑咏仪, 黄丽莎, 等. 机器翻译辅助农业科技类论文摘要翻译的探讨——以有道翻译为例[J]. 广州广播电视大学学报, 2020, 20(06): 67-73+111.

[4]孙逸群. 材料类文摘机助翻译的错误剖析[J]. 中国科技翻译, 2018, 31(03): 15-18.

[5]孙逸群. 海洋类论文摘要机辅翻译错误剖析[J]. 中国科技翻译, 2019, 32(02): 31-33+30.

[6]陈胜, 田传茂. 在线翻译平台汉英翻译的问题及译后编辑——以石油地质文献为例[J]. 中国科技翻译, 2021, 34(01):31-34+49.

[7] Halliday M.A.K, Hasan R. Cohesion in English[M]. London: Longman, 1976.

[8]张春芳, 董耐婷. 英汉学术论文摘要语篇衔接对比[J]. 现代语文(语言研究版), 2009(09): 110-113.

[9]胡芳, 陈彧. 英汉学术期刊论文摘要衔接手段的对比研究[J]. 武汉科技大学学报(社会科学版), 2005(03): 83-86.

原晋钰(1996-),女,汉族,山西晋城,硕士在读,研究方向:翻译理论与实践;

高玉芳(1967-),女,汉族,山西大同,英语语言文学硕士,副教授,研究方向:翻译理论与实践。

猜你喜欢

机器翻译
海量数据机器单词中关键语义筛选方法研究
机器翻译不可盲取
信息时代下机器翻译的“可译”与“不可译”
互联网+新时代下人机翻译模式研究
“语联网+行业” 助力中国伟大复兴
大数据背景下石油科技翻译
大数据背景下石油科技翻译
机器翻译不可盲取
基于免费在线翻译工具的机器翻译缺陷探讨
汉哈机器翻译中的文字转换技术研究