APP下载

建党100周年背景下基于语料库的南昌红色旅游翻译研究

2021-12-11管淑红

湖北第二师范学院学报 2021年11期
关键词:语料南昌红色旅游

管淑红,刘 源

(华东交通大学 交通与工程应用翻译研究中心,南昌 330013)

一、引言

1993年英国学者Mona Baker发表了《Corpus Linguistics and Translation Studies: Implications and Applications》一文,Baker在文中指出:翻译研究者利用平行对照文本的语料库,并运用语料库研究方法,能够揭示翻译文本作为沟通媒介的本质。[1]随后,语料库翻译学开始引起翻译研究者的重视而逐步发展至今,基于语料库的红色旅游翻译研究便是语料库翻译学中的一项重要应用。2021是中国共产党建党100周年,对于红色旅游发展有着重要的意义。南昌作为中国红色革命的摇篮,享有丰富的红色旅游资源,每年都吸引了大量国内外游客。在建党百年背景下,改进南昌红色旅游翻译不仅在对外宣传、招商引资方面产生着重要意义,更是提升南昌国际形象的有力途径。由于多方面因素,目前南昌红色旅游文本的英译仍存在着许多不足,且许多大型旅游文本语料库并不对外开放,这使得要进行基于语料库的红色旅游翻译研究颇具困难。

二、研究方法

国内英汉旅游翻译文本语料库的研究途径主要有以下三种:英汉旅游文本可比语料库(Comparable Corpus of Original English and Chinese Tourism Texts)。该语料库包括英语旅游文本语料库(Comparable Corpus of Original English Tourism Texts)和汉语旅游文本语料库(Comparable Corpus of Original Chinese Tourism Texts)两个子库,二者之间无任何翻译关系。英语旅游文本可比语料库(Comparable Corpus of English Tourism Texts)库包括英语(English Sub-corpus)以及译自汉语的英语文本子库(Translated Sub-corpus)。汉英旅游文本平行语料库(Parallel Corpus of Chinese-English Tourism):该语料库包括源文本(Sub-corpus Source Chinese)和译文文本(Sub-corpus Target English)两个子库,且两个子库呈翻译关系。[2]根据目前所搜集到的南昌红色旅游文本以及国外红色旅游文本,通过以自建文本为基础的英语可比语料库实验数据结果比较,进一步了解南昌红色旅游英译文本与国外红色旅游文本之间的差异,该研究一方面丰富了南昌红色旅游文本语言特点的语料研究,另一方面,为南昌红色旅游文本翻译的后续研究提供了真实客观的依据。同时,结合笔者自建的可比语料库,分析南昌红色旅游翻译文本所存在的不足,从而得出最适合南昌红色旅游文本的翻译方法,使南昌红色旅游翻译和外宣工作更加高效。

1.语料来源以及语料的处理

为探究并改善南昌红色旅游翻译中存在的不足,笔者自建了一个英语可比语料库,其中包含两个子库,即南昌红色旅游英译文本语料库(Translated English Red Tourism Text Corpus,简称TERTT)和国外红色旅游文本语料库(Original English Red Tourism Text Corpus,简称OERTT)。语料库的文本收集主要从以下几方面进行:南昌红色旅游书籍、纸质版宣传页、南昌红色景点有关介绍的实地拍摄以及南昌旅游网站上的宣传文本和讲解词。英文源语语料库主要来自欧美国家红色革命主题相关的书籍以及国外网站上的红色革命英文电子文本和文献。为提高两个子语料库之间的可比性,现阶段二者库容分别为 30345 词和32486词,主题内容也趋于一致。

2.语料库分析工具

通过网络、人工输入和扫描方式获取的文本中存在各种标准问题,如符号、格式等,所以笔者借助了北京外国语大学语料库团队所开发的语料库软件CorpusWordParser对采集到的语料进行处理,从而得到格式规范的语料。将语料的收集、整理和加工完成后,还需要对两个语料库的英文语料进行赋码处理,使用的赋码软件是北京外国语大学语料库研究团队开发的TreeTagger_Lite_English。赋码完成后,即可使用相关的语料库检索工具进行下一步研究。根据研究内容和方向的契合度,在本研究过程中笔者采用了AntConc这款语料库检索工具。

三、研究过程

语料库的研究过程一般包括语料采集(data capture)、分词处理(tokenization)、词性标注赋码(POS tagging)过程。

1.语料采集

为保证研究结果的准确性,所采集的语料需具有针对性。同时根据语料库检索工具AntConc的要求,所有语料文本均要以.txt的统一格式存储。

2.分词处理

中英文文本采集完成后需要进行分词处理,这是由于未进行分词处理或者只是单纯进行编码转换都会对本研究结果的准确性产生较大的影响,如产生乱码,词句过长导致统计数据不准确等。因此笔者借助了北京外国语大学语料库团队所开发的专业分词软件CorpusWordParser,对语料文本进行分词处理,接着将处理好的分词的中英语料文本分别导入AntConc3.5.8中,构建中英文本语料库接着进行下一步研究。

3.词性标注赋码

由于AntConc并不能直接对实义词进行统计,而需要借助其他工具对词类进行赋码,针对中文文本,笔者使用的是CorpusWordParser,而对于英文文本,借助了北京外国语大学语料库研究团队开发的软件TreeTagger_Lite_English,两种软件能够分别识别中英文文本中的每个词,并在词后自动标注词性。随后将赋码后的文本导入AntConc3.5.8中,并根据名词、动词、形容词和副词所对应的赋码值进行查找统计。

四、词汇特征数据采集与分析

语料库文本总体统计特征通常包括:字节数(bytes)、形符数(tokens)、类符数(types)、类符/形符比(TTR)、词汇密度等。类符/形符比值的高低与文本词汇丰富度成正比关系。[3]通过将文本导入到语料库分析软件AntConc3.5.8中,具体数据结果如表1所示:

表1 基本数据

通过表1统计结果可知,OERTT的的类符形符比高于TERTT,因此OERTT中词汇的变化程度和丰富度都要大于TERTT,表明国外红色旅游文本词汇量更为丰富,略高于南昌旅游英译文本。

1.词汇密度

词汇密度(lexical density):在一个语篇中,小句(clause)实义词(名词、动词、形容词、副词)的平均值。其主要作用是通过分析实义词数与总词数的比值情况,来说明该语篇的内容。[4]Jcan ure提出了词汇密度的计算公式:词汇密度=实际单词数/单词总数*100%。同时指出,词汇密度是区分文体正式程度的标准。库容量趋于一致的情况下,文本中的实义词越多,词汇密度越高,文本正式程度越高,所传递的信息也更加丰富;反之,文本相对正式程度较低,传递的信息量也较少。[5]在表2中,笔者运用了语料库检索工具AntConc3.5.8对于OERTT和TERTT两子库中的实义词及词汇密度进行了数据统计。

表2 实义词及词汇密度统计结果

观察表2可知,OERTT和TERTT两子库的词汇密度分别为55.54%和63.3%,很明显前者的词汇密度小于后者,同时说明TERTT实义词比例高,传递的信息量也更加丰富,语篇难度也越高。[6]同时TERTT中名词数、形容词和副词数分别为12449,3416,996,远大于OERTT中的10455,2496和950。从动词使用量情况可以发现,TERTT中的动词使用量略大于OERTT。因为在汉语中,通常会按照时间顺序和事理推理方法,使用多个动词的组合方式将事情叙述完整。[7]由此可知,该南昌红色旅游文本的译者,受到了一定母语(汉语)负迁移的影响(由于不同文化之间的差异,非母语者在学习和使用第二外语时候,会受到一定来自母语的语言规则和表达习惯的影响)。同时,从形容词和副词的使用量情况对比可知南昌红色旅游英译文本的介绍更加生动形象,充实优美,文体也较国外红色旅游文本更为书面化,这与南昌浓厚的红色文化历史底蕴密不可分。

2.人称代词使用

人称代词在英文中包括以下三种:第一人称(I/we/my/our)、第二人称(you/your 不包括宾格you)和第三人称(he/she/it/they/his/her/its/their 不包括宾格it)。通过观察AntConc3.5.8的检索结果,可以得出人称代词在OERTT和TERTT中的数据统计结果,如表3所示:

表3 人称代词分布对比

从表3可知,OERTT第一人称和第二人称的使用数都要高于TERTT,分别为1.3倍和1.6倍,而第三人称代词和相应物主代词的使用数低于TERTT。在OERTT中第一、第二人称更为频繁出现,可知其更注重描述事物的真实性,同时能够增加亲切感,在无形之中拉近与读者之间的距离,而TERTT则是以客观平实的写作方式对事物进行描述。同时,两子库的第三人称代词最多,甚至要远大于第一人称和第二人称之和,且OERTT的第三人称多于TERTT,经分析主要原因是在指代景点或人物等信息时,TERTT中通常会多次重复使用代词,而OERTT中更倾向于使用原词(非代词)。

3.语态使用

“语态”是说话者叙述事物立场和角度,在思想表达方面,人们倾向于根据自身需要来选择合适的语态。[8]具体统计结果如表4所示:

表4 被动语态使用的统计结果

从表4可知,OERTT中的被动句占该子库句子总数的26.3%,而TERTT中,被动句数量低于OERTT,只占24.8%。而导致该数据结果的主要原因是中西方思维的差异。西方民族的哲学文化传统讲究“天人相分”、“主客对立”,而中华民族的哲学文化传统崇尚“天人合一”、“主客一体”,前者培育了西方人的理性思维和客体意识,而后者培育了中华民族的悟性思维和主体意识。[9]同时语言可以反映出思维的差异。例如,受主观意识的影响,汉语母语者主要从人称视角对事物进行描述;而注重客观叙述的英语母语者,则倾向于从物称视角对事物进行描述。OERTT多从客观角度出发,注重历史沿革、人文风光以及战略位置重要性的介绍,且受到中英思维差异(英式思维惯用被动语态)的影响,因此被动语态的使用量更多。而TERTT注重以人称视角描写,加强与读者的交流,缩短与读者的心理距离,极少有大量叙事的成分,同时亦受到中式思维的影响,因此被动句数量少于OERTT。

五、研究发现

笔者借助一系列语料库分析工具,对自建的红色旅游翻译可比语料库的数据结果进行了统计分析,总结出以下结论:首先,通过对两个语料库的类符形符比的数据对比,OERTT中词汇的变化程度和丰富度都要大于TERTT,表明国外红色旅游文本较南昌红色旅游英译文本用词丰富,阅读难度更高。其次,通过词类分布情况统计分析,TERTT中的实义词多于OERTT,说明南昌红色旅游英译文本传递的信息更丰富,文体更加正式,这与南昌浓厚的红色文化底蕴是密不可分的。接着从语态方面分析,TERTT中的被动句使用数量明显少于OERTT,说明汉语母语者在进行红色旅游翻译时受母语负迁移的影响较大,倾向于使用中文的句法结构进行表达,不符合英文的表达习惯。同时,OERTT中出现第一、第二人称的数量更为频繁,由此可知其更注重描述事物的真实性,而TERTT则是以客观平实的写作方式对事物进行描述。

六、结语

本研究基于自建的红色旅游翻译可比语料库,对比分析了国外红色旅游文本与南昌红色旅游文本的语言特征,目的是以国外红色旅游英文文本为参照,找出南昌红色旅游的英译文本中存在的不足,从而提高英译文本的翻译质量,使语言表达、行文等方面更加符合英文文本的规范。同时借助 “建党100周年”的时代背景,大力推进南昌的红色旅游外宣工作。而笔者所建立的语料库所搜集的相关语料规模还不够庞大,期望未来能够在原有基础上进行更为深入全面的研究,以期为江西省相关部门、单位决策和宣传提供参考意见,更好地将南昌的红色旅游文化和历史传播到国外,吸引更多外国游客来到南昌,领略当地红色旅游文化的魅力,从而加快推进南昌红色旅游走向国际。

猜你喜欢

语料南昌红色旅游
我在南昌 你在哪
南昌是我 南昌是你
基于归一化点向互信息的低资源平行语料过滤方法*
建党百年红色旅游百条精品线路
打造红色旅游小镇 老区遂昌 风景正好
红色旅游助力宗店乡村振兴
东征村:红色旅游助力脱贫换新颜
濒危语言与汉语平行语料库动态构建技术研究
A Syllabus designed for business English
The rationale for Business English Syllabus