APP下载

“一带一路”背景下郑州多语种智能经贸翻译服务平台建设

2021-05-27张红岩刘伍颖闫寒王琳

河南农业·教育版 2021年3期
关键词:多语种平台建设一带一路

张红岩 刘伍颖 闫寒 王琳

关键词:一带一路;经贸翻译服务;多语种;平台建设

引言

随着经济全球化的发展,国际贸易分工日益精细化,世界各国在国际贸易中贡献着不可或缺的力量。作为世界第二大经济体,中国顺应时代发展潮流,不要独奏曲,只要交响乐,习近平总书记于2013年提出“一带一路”倡议,积极发展与沿线国家的经济合作伙伴关系,共同打造政治互信、经济融合、文化包容的利益共同体、命运共同体和责任共同体。“一带一路”建设的核心内容是“政策沟通、设施联通、贸易畅通、资金融通、民心相通”。而实现“五通”,当然需要语言互通[1],因为没有语言互通,政策难以沟通,也将会影响设施联通、贸易畅通、资金融通,更谈不上民心相通[2]。可以说,语言互通是“五通”的基础保障和先导工程,语言是了解一个国家最好的钥匙,“一带一路”需要语言铺路[3]。

据统计,“一带一路”沿线65个国家的官方语言达53种[4],再算上沿线区域民族或部族的语言,重要者不下200种。这些官方语言大多都是非通用语种,分属九大语系,语言状况复杂,因此需要大量的语言人才。但是,我国目前面向非通用语种的语言资源匮乏,语言教育薄弱,语言人才奇缺,语言服务滞后,远远不能满足“一带一路”语言互通的需要[5]。而语言人才的培养周期长,投入大,并且缺乏非通用语专业布点顶层设计机制,培养模式科学性不强,目标不够明确[6],根本无法满足“一带一路”建设过程中的语言人才需求。

但国家间的经贸合作不等人,语言服务不能仅仅依靠语言人才的培养,还应该在其他领域下功夫。“语言服务”的概念在2010年中国第一届国际语言服务行业大会上首次提出,它是一个包括翻译与本地化服务、语言技术工具开发、语言教学与培训、語言相关咨询业务为内容的新兴行业[7]。在科学技术发展如此迅速的今天,我们应该在语言技术尤其是机器翻译上做文章,着力提升翻译速度和质量,以解决当前非通用语种资源匮乏和人才紧缺的需求困境。因此,在“一带一路”倡议下基于“互联网→语联网”的语言服务将成为趋势,语言服务智能平台建设迫在眉睫[8]。

一、翻译自动化技术与语言资源建设

机器翻译(Machine Translation) 是人工智能的终极目标之一,旨在研究如何利用计算机将源语言转换为目标语言,其发展大致经历了三个阶段。

基于规则的机器翻译(Rule- Based Machine Transla?tion) 是最早出现的机器翻译方法,该方法依赖语言学学者总结语言之间的规律,对规则的完备度要求很高,因此翻译的效果不佳。随后出现了基于统计的机器翻译模型(Statisti?cal Machine Translation),该模型是一种通过大规模语料学习语言之间转换的数学模型此类模型翻译效果较于基于规则的机器翻译模型有了显著提升。但是基于统计的机器翻译模型的准确性,在很大程度上取决于翻译建模的质量,且还存在严重依赖特征设计等问题。近年来,基于深度学习的神经机器翻译(Neural Machine Translation) 在资源丰富语言对上取得了理想的效果。在许多语种上,神经机器翻译性能大幅度提升,远远超过了传统统计机器翻译[9]。根据统计机器翻译与神经机器翻译在30种语言对上的对比实验结果,神经机器翻译在其中的27种语言对上超过统计机器翻译[10]。目前,神经机器翻译在模型研究、词汇表受限研究、资源受限研究等方面都取得了一定进展。

在语言资源建设方面,国外开展得较早。美国宾夕法尼亚大学的语言资源联盟(LDC) 自1992年创立至今已积累了众多高价值的语言资源数据集,支持外语到英语的自动处理并主要服务英语国家。借助这些语言资源,美国国防部高级研究计划署(DARPA) 于2014年启动了紧急事件低资源语言(LORELEI) 项目,研发能够处理任意语言的系统;美国高级情报研究计划署(IARPA) 也于2017年初启动了对任意语言信息进行英语检索的机器翻译(MATERIAL) 项目,旨在实现对全球超过7000种语言的文档进行跨语言信息检索。除美国之外,欧洲也极力推动语言资源建设。欧洲议会平行语料库(EPPPC) 就是从欧洲议会的会议记录里抽取出来的多语种平行语料,最新版本包括欧洲21种语言,也是基于英语进行双语对齐的。联合国为了支持Tapta4UN机器翻译系统和会议翻译工作,发布了联合国平行语料库(UN?PC),旨在提供多语言资源,帮助在机器翻译等方面开展研究。

国内语言资源建设方面,2000年以来,在国家“863”和“973”项目支持下,中国中文信息学会创立了中文语言资源联盟(CLDC),发布了一些汉语和国内民族语资源。2005年,教育部语言文字信息管理司发起并成立了国家语言资源监测与研究中心,旨在定量监测语言国情,动态分析语言数据,并运用现代化手段加以处理和利用。2009年成立的中国语言资源开发应用中心负责开发、普及和应用语言学成果,完善国家文化资源体系,开拓产业新领域,实施国家语言战略,注重对外汉语教学资源建设。基于这些语言资源,国内机器翻译从关键技术探索到实用系统研制最初也基本遵循从规则方法到统计方法,再到混合方法的研究路径。近来试图利用网络语言大数据实现全语言覆盖,而且深度学习方法已取代统计方法的主导地位。其中,中科院自动化所、东北大学、北京语言大学、昆明理工大学等国内研究机构和高等学校对语言资源建设和机器翻译研究进行了有益的尝试。

“一带一路”背景下的自由贸易所需语言众多的现实情况已经成为影响贸易国际化和便利化的一大难题,而基于深度学习的神经机器翻译技术成为了破解这一难题的不二选择。

二、郑州多语种智能经贸翻译服务平台建设背景

在“一带一路”国际贸易版图中,郑州也扮演了重要角色。2017年,国务院公开发布了中国(河南) 自由贸易试验区总体方案。建立中国(河南) 自由贸易试验区是党中央、国务院作出的重大决策,是新形势下全面深化改革、扩大开放和深入推进“一带一路”建设的重大举措。在方案所述的自贸试验区中,郑州片区占有举足轻重的地位。与此同时,郑州还是国家支持建设的中心城市,是郑欧班列的起点城市,是航空港实验区、跨境电商综试区、大数据综试区等国家战略的落地城市,对国家重要性不言而喻。

郑州市政府办公厅发布的《郑州市2020年对外开放实施方案》明确提出:“郑州市明确以自贸试验区建设为引领,以航空港实验区为载体,以综合性交通枢纽为依托,以开放体系为保障,走好‘枢纽+开放的路子,着力打造国际交通枢纽门户、对外开放体系高地和参与国际合作高地,加快推进国家中心城市建设,形成更高水平的高质量发展区域增长极。”实现高水平开放,既是中原经济新旧动能转化的抓手,更是郑州乃至河南踏上世界经济主舞台的关键。

随着国际化程度的显著提升,郑州必将在科技、金融、物流、贸易、文化等各领域,与各国产生广泛的互动与交流。这一过程必然会产生丰富多样的语言翻译需求,尤其是对诸如法语、德语、意大利语、波兰语、捷克语、俄语、白俄罗斯语、哈萨克语等“一带一路”沿线国家的语言翻译需求。因此,郑州除了需要提供英语等通用语言翻译服务外,更需要根据不同区域、不同领域、不同层次的需求定位,增强相关语种的翻译服务能力,构建具有国际竞争力的个性化语言友好营商环境。然而,目前郑州乃至河南省并不具备提供相关语言资源服务的能力,而有些城市为了能够更好地实现对外开放,极具前瞻性地依托相关高校、机构、企业等建立了自己的语言服务中心,如北京语言大学建设的语言资源高精尖创新中心、广东外语外贸大学建设的外语研究与语言服务协同创新中心、西安外国语大学建设的丝绸之路语言服务协同创新中心和吉林外国语大学建设的“一带一路”语言文化服务协同创新中心等。在这样的形势下,郑州只有快速强化翻译服务能力、补足短板,才能抓住历史机遇实现跨越式发展。

基于当前郑州发展所面临的语言需求困境,郑州也可以依托省内相关高校、企业等建立自己的语言资源服务协同创新中心,助力郑州乃至河南的发展。而借助“新一代人工智能关键技术”打造的具有郑州特色的多语种智能经贸翻译服务平台,不仅能够从理论上对相关语言资源建设进行建构和完善,还能够直接服务郑州“一带一路”国际贸易交流,助力郑州打造内陆开放高地,为郑州的发展带来可观的经济效益和社会效益。

三、郑州多语种智能经贸翻译服务平台框架设计

借助“新一代人工智能关键技术”打造的具有郑州特色的多语种智能经贸翻译服务平台,从根本上来说,就是要实现人机结合,利用机器辅助人们实现经贸领域的高效精准翻译。具体来说,可以通过三个方面来实现,即打造郑州经贸多语种信息中心,搭建“一带一路”经贸机器翻译实验室和高质量人工翻译协同实验室,简称“一个中心,两个实验室”,具体设计思路如下。

(一) 打造郑州经贸多语种信息中心

中心要秉持“协同、创新、智能、精准”的理念,立足郑州、深耕河南、辐射全国、放眼世界,积极协同有关政府部门、高校、科研院所和技术性企业等,推动中心运营管理模式创新、技术加快革新、语言资源快速更新,着力打造“产、学、研”一体的智能化服务体系,实现对语言资源的精准动态监控、分析与利用,并根据所面临的具体需求精准施策,为郑州“一带一路”建设提供全天候、全方位、全覆盖服务,包括全球行业资讯分析、企业分析、产品分析、行业调查分析、舆情分析和重要决策等等。同时,中心要全力支持“一带一路”经贸机器翻译实验室和高质量人工翻译协同实验室建设,做好“打前阵、保后勤”工作,为两个实验室提供源源不断的支持。

(二) 搭建“一带一路”经贸机器翻译实验室

基于深度学习的神经机器翻译在提高机器翻译精准度方面效果明显,是新时代人工智能领域专家学者们的研究热点。“一带一路”经贸机器翻译實验室的搭建也要充分利用大数据、云计算、人工神经网络等先进科学技术,利用神经机器翻译算法实现经贸领域沿线相关语种到汉语的精准机器翻译,快速处理外语中的庞杂信息,减少机器翻译曲解、错译等现象,提高译文的可读性和精准度,尽可能地为经贸交流提供快速、便捷、精准的对等翻译。与此同时,实验室还应积极推动机器翻译的产品化,积极开发相应的语言翻译软件产品,为用户提供实时便捷的翻译服务,从而实现“一带一路”经贸机器翻译的产业化发展,助力郑州对外经贸交流与合作。

(三) 搭建高质量人工翻译协同实验室

对于机器无法处理的一些不对等、不可译现象,我们需要设立人工翻译实验室对其进行人工干预,并及时将干预结果上报至多语言信息中心,由信息中心对机器翻译实验室进行维护、更新,从而避免以后相同情况的出现,避免重复性工作。因此,为了能够更好地维持高质量人工翻译协同实验室的运转,必须积极建设完备的语言人才服务体系,充分利用语言人才资源和语言信息技术,共同打造语言人才能力模型,基于模型聚集我国乃至世界的语言人才,并建立人才和专家库,为高质量人工翻译协同实验室建设奠定丰富的人才基础,确保人工翻译质量。

综上所述,多语种智能经贸翻译服务平台是基于当前郑州在“一带一路”建设过程中面临的语言翻译服务需求的背景下所提出的极具针对性的建设构想,下设的“一个中心,两个实验室”各司其职却又联系紧密、相互协作,共同致力于打造优质的智能翻译服务平台,为企业走出去引进来提供语言服务支撑,扎实推动郑州自贸区建设稳步向前。

四、郑州多语种智能经贸翻译服务平台价值

多语种智能经贸翻译服务平台搭建在非通用语言资源建设及精准机器翻译实践研究方面都将对郑州“一带一路”建设起到促进作用,兼具理论意义和实际应用价值。

理论意义体现在两个方面。第一,探索非通用语种到汉语的平行语言资源构建方法,能够创新语言资源结构化理论研究,完善计算语言学基础理论体系。第二,探究非通用语种到汉语的精准机器翻译方法,能够创新语义转述智能化理论研究,发展自然语言处理高级理论体系。

实际应用价值体现在三个方面。第一,填补郑州在经贸领域外汉语言资源空白,提升郑州国际经贸语言资源服务能力。21世纪的竞争是数据的竞争,谁掌握数据,谁就掌握未来,语言资源亦是如此。国内非通用语种到汉语的大规模平行语言资源还比较缺乏,因此掌握了海量的外汉平行语言资源就是掌握了对外交流的能力。多语种智能经贸翻译服务平台所依托的非通用语种到汉语的平行语言资源能够在郑州经贸语言资源服务方面提供巨大的数据支撑,确保郑州在语言资源服务领域走在国内同水平城市前列,全面促进郑州国际经贸交流与合作。第二,消除非通用语种机器翻译应用盲区,增强国际经贸关键语言翻译服务能力。目前,非通用语种到汉语精准机器翻译研究成果离实际应用还有较大差距,需要不断探索精准机器翻译方法,提升机器翻译水平。在语义转述智能化理论指导下,研发高效的神经机器翻译算法,能够大幅度提升平台的翻译精准度,为郑州经贸交流扫清语言障碍。第三,研究成果还具有教学与科研价值,能够服务于语言教学,促进国际合作与交流,提升师生国际视野,扎实推进语言与智能人才培养,为国家培养合格的新时代人才。同时,研究成果还能为语言研究提供坚实基础,提高郑州乃至河南科研能力和水平,服务郑州高水平大学建设。

结束语

“一带一路”建设,人心相通语言先行。面对当前非通用语种语言资源稀缺的困境,除了培养相关语言人才外,我们更应该利用先进的科学技术进行稀缺语言资源建设。作为解决不同语言者之间语言沟通屏障问题的关键技术,机器翻译具有重要的科学研究价值和实用价值。随着经济全球化及互联网的飞速发展,机器翻译在促进各国各民族之间政治、经济、文化交流等方面将发挥越来越重要的作用。作为国家“一带一路”建设的重要节点城市,郑州与沿线国家进行经贸合作与交流的机会将越来越多,需要强有力的语言服务体系作支撑,但是郑州在该领域尤其是多语种智能经贸翻译服务方面的发展还相对滞后,与郑州正在扎实推进的国际化发展进程不相匹配。建设多语种智能经贸翻译服务平台对郑州经贸发展大有裨益,它不仅会给郑州带来极大的经济效益和社会效益,还会提升郑州在国际贸易中的竞争力和影响力。因此,郑州应把握时机,先行先试,加快推进多语种经贸翻译服务平台建设工作,服务郑州乃至河南的国际经贸发展,助力国家“一带一路”建设。

猜你喜欢

多语种平台建设一带一路
语联世界,言通天下
70年,上外故事
中国国际广播电台“ China ”系列 多语种移动客户端上线
运用QQ群开展高校学生党建工作研究
高职院校图书馆数字资源绩效提高途径探析
“互联网+”思维在应用型高校课堂管理的思考与探索
从英语硕士到法国博士——我的留学规划和多语种学习之路