APP下载

基于语料库的旅游景点英文文本语言特征研究

2021-08-27赵红霞段怡茹

校园英语·下旬 2021年5期
关键词:语言特征语料库

赵红霞 段怡茹

【摘要】近年来旅游业在全球范围内蓬勃发展。本文通过采集携程旅行网站上旅游景点介绍的英文文本,自建小型语料库,以Brown为参照库,利用语料库研究工具Python对其高频词、主题词及其搭配等进行了分析。研究发现:携程旅行网的英文旅游文本介绍具有明显的旅游语篇特征,旅游文本对park和museum的描述较多,为其吸引游客参观游览的主要场景。景点英文文本介绍充分体现了中国的历史文化特色,但是作为旅游特殊文本,可以选用更多形象生动的形容词来展现景色的自然之美,在更大程度上激发潜在客户的来华旅游兴趣,促进旅游业的发展。

【关键词】旅游文本;语料库;语言特征

【作者简介】赵红霞,段怡茹,西安财经大学国际商务语言与跨文化传播研究中心。

一、引言

中国的自然风光、历史遗产和科技成就将受到更多外国游客的钦佩,在此过程中,高效的旅游宣传与交流就显得尤为突出和重要。旅游英语正是展现民族文化的必不可少的工具。为了吸引更多外国游客的注意力,宣传中国的旅游业,一个优秀的旅游网站就起到重要的作用,其中英语旅游文本在对外旅游网站中占有重要地位。蒲元明(1987)、康宁(2005)认为旅游文本包括旅游景点、旅游资源、服务设施等情况的介绍。近年来,由于新媒体的使用,出现了很多在语言、内容、章节等方面表现出自己特色的海外旅游网站,结合语料库技术,李德超、王克非(2010)、黄晔明(2018)、熊力游和刘和林(2011)、李晓旭、张红(2020)等对双语旅游语料库的设计、建设、文本编译、翻译策略等展开了相关研究。

当今,人们的旅游需求不断变化,旅游文本介绍推陈出新,当今国内的对外英文旅游文本语言特征有什么特点?是否能够反映中国的悠久历史和传统文化,讲好中国的旅游故事?带着这些问题,本研究收集了中国旅游网站的英文文本,使用Python软件对自建小型语料进行高频词、关键词及搭配分析,来研究当今中国旅游网络英文旅游文本的语言特征。

二、语料与方法

本研究选取中国较有影响力的综合性旅行服务公司“携程旅行网”为语料选取对象公司,英文旅游文本来自其英文网站www.trip.com。据携程旅行网网页显示,携程旅行网创立于1999年,总部位于中国上海,是一个集旅游、酒店、机票等全方位旅行服务,在在线旅行服务市场居领先地位,在北京、成都、深圳等95个境内城市和新加坡、首尔等22个境外城市设立分支机构,它被誉为“互联网和传统旅游无缝结合的典范”,连续4年被评为中国第一旅游集团,目前是全球市值第二的在线旅行服务公司。网站景点介绍和度假手册类似,是一种值得分析的有趣文本类型,因为它们是一种具有较强说服力的话语形式,其主要目标是确保潜在客户看完介绍后将被充分打动,从而预订度假行程(Baker, 2006:50)。本研究于2020年4月采集了携程旅行英文网上中国各省共80个旅游景点的英文介绍,景点包括自然风光、历史古迹、人文景观等,语料库容为8077字符,语料均以UTF-8编码纯文档格式存储,在主题词提取时以Brown语料库为参照库。

三、数据分析与讨论

1.高频词。词频是语料库研究的核心概念和基本方法,但是词频不是简单的量化,词频统计可以让读者更好地了解语料文本的类型。本研究中提取的前30位实词高频词见表1。频数较高的 “公园(park)、博物馆(museum)、江(river)、湖(lake)、园林(garden)、寺庙(temple)、海洋(ocean)、塔(tower)以及attraction”这些都是旅游语篇的典型词汇,说明了此语篇的独特性,也突显了主要旅游景区为公园、博物馆等。在描写这些景点时运用了如“朝代(dynasty)、古代(ancient)、清(qing)和文化的(cultural),”展现了中国历史文化形成独有的特点。然而,在钱30位的高频词中,用于描写自然风光特点的形容词并不多,略微缺少了让潜在游客从文本中畅享景色之美的空间。

2.关键词。关键词是通常代表概念上的“标准语言”的词,关键词可能不是最高频的词,但它具有统计意义(Baker and McEnery,2015:2),高频实词主题词研究更能体现文本的体裁特征(Baker,2006:123)。参照Brown语料库,利用Python首先进行词形还原,提取“主题词”并验证“主题性”。如表2所示,通过检查关键词列表发现,关键性最高的词dynasty,museum,attraction,park,lake,tower,temple,garden,river等与表2的高频词显示一致,也体现了旅游文本的独特语篇特征。关键词中都是常用的与旅游产业本身有关的旅游景点、自然风光、河流、建筑等词语,体现了旅游文本特有的语篇特征。在人文景点和自然景点关于历史背景的描述中,dynasty,tang和ancient的使用最为显著,恰好体现了中国历史悠久的特点。

3. 关键词搭配。搭配指文本中两个或多个词汇的共现,为了进一步探析关键性最高的dynasty一词在旅游语篇中通常提及的中国朝代有哪些?与这些朝代有什么关系?我们提取了dynasty的左三右三的搭配(见表3)发现,唐朝、清朝、明朝三个朝代出现较多,尤其是明朝,这与明朝时期的社会经济状况有关。明朝中后期的商品经济有了长足发展,人们的生活方式发生了较大的变化,出现了旅游热潮(滕新才,2001),携程旅行网站关于国内旅游景点的介绍中融入历史的印记,反映了中国旅游胜地的历史底蕴。比如,在介绍拙政园(Humble Administrator's Garden)时有这样一句话:Each part has its own characteristics, especially the central garden, which basically maintains the simple and natural style of the Ming Dynasty gardens and represents the best of the whole garden,本句展现了今天的拙政园依然保留了明朝时的简单和自然的风格,凸显了旅游景点的历史人文价值。

四、结语

语言与社会实践紧密联系在一起,词汇作为语言的一个重要组成部分,对经济、社会的发展变化反应最敏感与直接。通过上述对携程网旅游景点英文文本高频词、关键词及其搭配分析,我们认为携程网的英语旅游文本语篇特征鲜明,文本介绍将旅游与中国历史文化底蕴紧密结合,会提升依其独特的历史风韵吸引海外游客来华旅游的可能性。在描写自然景观时,除了用名词直接指代之外,也可以选用更多的形容词使得景点描写更加生动、形象。期待具有海外营销实力的旅游企业在网站英文文本的选词用词上能够更加丰富多样,使得中国悠久的历史文化特点与美轮美奂的自然景观通过文本的形式得到更好的推广,从而促进涉外旅游业的发展。

参考文献:

[1]Baker P. Using Corpora in Discourse Analysis[M]. London: Continuum, 2006.

[2]Baker P, McEnery T. Corpora and Discourse Studies: Integrating Discourse and Corpora[M]. London: Palgrave Macmillan, 2015.

[3]黄晔明.基于语料库广西旅游外宣资料英译研究[J].佳木斯职业学院学报,2018(11):320-321.

[4]康宁.从语篇功能看汉语旅游语篇的翻译[J].中国翻译,2005 (3):85-89.

[5]李德超,王克非.新型双语旅游语料库的研制和应用[J].现代外语,2010(1):46-54,109.

[6]李曉旭,张红.内蒙古地方政府中、英文网站的汉英平行语料库的创建和应用[J].外语与翻译,2020(2):51-56.

[7]蒲元明.谈谈旅游资料英译的几个问题[J].中国翻译,1987(3):30-33.

[8]滕新才.明朝中后期旅游文化论[J].旅游学刊,2001(6):64-69.

[9]熊力游,刘和林.旅游网页文本的编译策略[J].中国翻译,2011(6): 63-67.

猜你喜欢

语言特征语料库
基于语料库翻译学的广告翻译平行语料库问题研究
浅谈语料库分类及用途
国内外语料库建设研究简述
运用语料库辅助高中英语写作
《哈克贝利?芬历险记》中黑人英语的语言特征
物流英语的语言特征及翻译
茶艺英语的中国英语研究
解构口语化新闻的语言特征
语料库与译者培养探索