APP下载

英语口译实践教学语料库建设

2021-11-04刘雨婷

魅力中国 2021年39期
关键词:口译语料语料库

刘雨婷

(成都理工大学 外国语学院,四川 成都 610000)

一、语料库的产生及其背景

(一)语料库的发展历史

简言之,语料库就是大量单个语料的处理整合。通过计算机语言分析,对语料进行标注解析而建成的大型电子文本语料库。语料库的语料收集也有相应要求,第一,要为真实的实战语言材料。第二,这些语料必须要经过转录转写,加工处理,数据分析才能被使用,成为语料库资源。

从出现开始,语料库就一直在不断的完善与发展,因为不同语言学家的认识和看法不同,导致语料库的定义也不完全相同。如阿特金斯认为语料库是“按照明确的设计标准,为某一具体目的而集成的大型文本库”。赫努认为语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”。分析不同学者的观点可以看出,语料库的作用在于语料的收集和整理,但是收集整合的标准和定义是不一样的。赫努提出的计算机储存与处理正是目前语料库建设的技术特点。语料库不是普通的电子文档,它的建设对于语言的研究,以及实践学习都意义重大。在搜集整理语料时,应考虑到不同领域语料的抽样,且不同类型材料的抽样比应相对平衡。

(二)口译实践教学语料库的内涵

口译实践教学语料库顾名思义是运用于口译教学活动的实践教学语料库,依靠大数据时代,现代计算机技术的运用,依靠口译教学理论为指导,检索应用为一体的多功能口译实践教学资源库。口译实践教学语料库数据应全部来自于真实的实战口译,用一线的实践材料来进行教学。不管是对学生的口译教学还是学生日常的口译训练,最终的目的都是为了口译实践。

口译实践语料库,可划分为若干种不同的实战情况。帮助学生提前在不同的场合,针对不同的对象,进行实战口译训练。时代在不断进步,传统的口译教学模式已经不能满足学生的训练需求,建设口译教学语料库能让学生快速有效的获取实战口译资料,让学生日常口译训练贴近实战,更好更快融入口译员的角色。在传统的口译学习教学中,老师的教学材料非常有限,同时学生使用的口译训练材料也比较老旧,无法紧贴时事。书本中的口译教学材料往往与实践有较大差别,真实的口译实践活动更为复杂,情况也较为多变。

二、建设英语口译实践教学语料库的必要性

(一)口译实践教学语料库现状与不足

1.规模较小

现有的口译语料库都是小规模,专一性的语料库,不具有普遍性,大数据的特点。口译语料库的建设与研究已有近二十年的历史,因为口译语料库建设不足,所以运用不广泛,已建投入使用的口译语料库很少,而口译实践教学语料库更是寥寥无几。已有的语料库都较为单一且数据量不足。相较于笔译语料库,口译语料库的建设难度相对较大。且口译语料库的材料是将现场真实口译活动的音频或视频,通过计算机程序进行转化和标注制成,搜集和转化的复杂程度都要高于笔译语料库。

2.技术局限

近年来,笔译语料库建设加快,很多计算机辅助翻译技术应运而生,但口译语料库发展仍然缓慢。笔译语料库可以做到句句对应,乃至字字对应,但对于口译语料库来说,做到信息对等即可。不能以建设笔译语料库的标准来要求口译语料库。再者,口译语料库的建设难度相对较大。译员在口译时,会出现大量语气词,停顿,口译时还会对讲话人的内容进行重组、解释、增补或省略。因此在建设口译语料库时,应借鉴语言学对于信息单位的界定,处理口译信息单位如何划分的问题,从而实现口译语料库信息对等。

3.搜集困难

口译语料库数据搜集也相对困难,我们一般采用录音、录像等手段对口译数据进行收集,这些数据往往较为零散,且质量不稳定,需要用技术手段对音频进行处理。分析目前已有的口译语料库发现,现有的语料库还没有做到有组织,规范的口译语料数据收集。

(二)口译语料库已取得的发展成果

以前的口译语料库多数只运用于研究,现在越来越多的机构和公司,投入资金来研发研究与实践运用型口译语料库,推动了口译语料库的发展。目前,国外研发较早且比较成熟的口译语料库有日本名古屋大学的英日双语同传语料库(SIDB),但主要运用于英日和日英同传,并不能服务于英中和中英的口译活动。但它为口译语料库的发展开辟道路,具有引领作用。国内较早进行研发的语料库是上海交通大学的“汉英会议口译语料库”(CECIC),收集的语料都来源于一线口译员的实践口译材料。还有两会期间总理答记者问的汉英交替传译语料库(CEIPPC)。以上这些都是口译语料库,并不为口译实践教学活动而服务,因此我们需要建设专门的语料库,为口译实践教学服务。除此之外,国内许多口译语料库来源并非来自于一线口译人员的实战,而是搜集国内一些英语考试的学生口译,数据不够真实与客观。

(三)英语口译实践教学语料库建设的发展趋势

不管是为了帮助英语口译专业学生口译学习,还是提高翻译效率,提升译文准确性,增强检索的针对性,语料库的建设都必不可少,语料库的发展也是大势所趋。随着“一带一路”建设的推进,越来越多的译者去到沿线国家,辅助工程,交通,医疗建设,他们的语料是最新也是最与时俱进的。再者,越来越多的国际会议,我们听到中国声音,中国担当,而这一切交流的基础是语言。因此译员作用体现明显,而口译员的语料对语言学研究,以及一代又一代高端语言人才培养提供助力。口译领域实践范例正是口译专业学生学习所缺乏的,也是口译实践语料研究所需要的。

三、英语口译专业实践口语语料库的建设方案

(一)语料库的设计原则

1.分层原则

通过录影或录音搜集语料,随后通过计算机对原语与译语语料进行严格转写和标注,为后期语料制作做准备。分析现有的口译语料库发现,已建的口译语料库涵盖范围较窄,一般只涵盖一次活动,会议或专题,且语料库容量也大概在10 万至20万之间,研究与实践教学价值有限。对于英语口译专业实践教学语料库建设,我们可以用图表1,分层级的方法划分口译语料库,不同层级的划分与分类,方便语料库整合的同时也方便口译实践教学分专题进行。

图表1

用不同层级划分语料库,一方面有助于口译实践教学,另一方面口译信息存储更加规范便捷,方便调取。

2.动态原则

动态搜集口译语料库数据,是本语料库极具挑战的一部分,也是本英语口译专业实践口译语料库的一大特色。为实现动态原则,建立语料库时需要每月搜集数据分析处理,对语料库进行更新,这样才能确保口译实践教学语料库的时效性,突出口译即时性的特点。帮助学习者动态接触到真实翻译活动中产出的口译语料。

(二)语料库建设的步骤与方法

我们建设英语专业口译实践教学语料库,那么英语专业口译实践教学语料库则作为A 级总库,再根据工作模式、专业领域、场合、语言层级、语种、时间、客户等类别划分B 级子库,图表2 是根据不同类别划分出来的B 级子库。类别选择不同,那么所建立的B 级子库也有所不同,如图表2 所示:

图表2

对B 级子库进行划分以后,我们还可以划分出不同领域更小的分支,即C 级子库。例如,专业领域类别中,B 级子库-经济类,我们可以再细分为金融会议口译语料、亚太经合组织论坛语料、金砖国家论坛口译语料、G20 峰会讲话口译语料、博鳌论坛讲话口译语料和世界贸组织口译语料等,组成C 级子库。

如此,对口译实践教学语料库层层递分,有助于我们将之前已有的口译语料库或零散的口译语料库进行分类分析,形成口译实践教学专用语料库,同时也能推动口译语料库研究,对口译语料库建设做出贡献。

四、英语口译实践教学语料库的应用研究功能

本语料库的建立不仅能帮助学习者从口译实践的角度来学习口译,还能为实践口语语料库的应用研究提供大量可靠数据。英语口译实践教学语料库本身对口译语料库的建设也起到辅助作用,壮大口译语料库。通过口译实践教学语料库,分析译者口译时所使用的单词,短语,句子,甚至连接词、语气词等,分析不同环境下口译者所采用的翻译方法与策略,研究口译活动中语言与文化的发展规律。

五、总结

语料库建设任重而道远,笔译语料库如此,口译语料库更甚。科技的进步和计算机技术的发展,都会加快语料库的建设。目前,许多公司正对语料库进行研发与建设,例如,腾讯AI Lab,YiCAT 等。真实的口译数据、不断完善与进步的语料处理手段、缜密的设计标准,专业的分析软件,都有助于英语口译实践教学语料库的建设与发展。近年来,随着课改的深入,中国对传统的课堂教学模式进行改革,从传统的老师掌控课堂,到现在以学生引领课堂开展教学,新的课堂教学模式越来越倾向于学生的自主学习。与此同时,口译实践教学模式也在与时俱进,不断发展的口译语料库,通过激发学生潜力,有助于他们创造性思维发展。不仅如此,口译大数据给口译学习者带来更多学习便利的同时,也推动了学者们对口译活动的深入研究。

猜你喜欢

口译语料语料库
基于语料库的清末民初日源外来词汉化研究
美国法庭口译制度研究及启示——以夏威夷州法庭口译为例
面向低资源神经机器翻译的回译方法
可比语料库构建与可比度计算研究综述
对中国口译近25年来的研究综述
略论笔译与口译的区别
国内外语用学实证研究比较:语料类型与收集方法
论心理认知与口译记忆
语篇元功能的语料库支撑范式介入
英语教学中真实语料的运用