APP下载

基于语音合成技术的“大美龙江任我行”多语种智能语音讲解系统的设计与应用

2022-05-01赵聪胡博

民族文汇 2022年5期

赵聪 胡博

摘 要全球化背景下外国游客在国内旅游景区存在的语言障碍问题,本文拟基于Speech Kit、Text-to-Speech等语音翻译平台,研发黑龙江景区俄语、日语、朝鲜语智能语音讲解系统,以期方便外国游客赴龙江旅游,为其旅行带来语言便利,旨在体现黑龙江省旅游服务产业的完善与健全,提升黑龙江省旅游形象。

关键词 讲解系统, 语音合成,黑龙江旅游

旅游业和展览业已经成为一个我国新的经济增长点,然而,在游览过程中,游客参观只是低层次的感官性参观和被动式参观。[1]2020年8月黑龙江省人民政府正式发布《黑龙江省全域旅游发展总体规划(2020—2030年)》。规划指出“黑龙江省旅游资源底蕴优势明显,但制约旅游业发展的瓶颈问题依然突出”,其中,标识系统、游客咨询、智慧旅游等旅游服务功能不健全为亟待解决的问题之一。在旅游市场需求的拉动以及先进科学技术的推动下,旅游业发展呈现出许多新型业态,即各种不同形式的旅游融合类型。[2]越来越多的游客倾向于个性化自助旅游,并且对游览过程中的信息咨询、交通指引和安全保障等公共服务需求日益增加。[3]本文研发的扫码语音讲解系统服务于黑龙江省对外旅游需求,为俄罗斯、日本、韩国、朝鲜等国游客提供景区智慧语音讲解服务。本次多语种智能语音讲解系统是研发依托语音识别技术,经过Yandex平台Speech Kit、Google平台Text-to-Speech等在线语音识别技术的运用,完成黑龙江景区多语种文字介绍到智能语音的合成,并借助“在线二维码生成器”等软件将语音转换为二维码。此系统可为外国游客消除境外游语言障碍,提升旅游质量,有望提升入境游客人数,有助于方便外国游客赴龙江旅游,为其旅行带来便利,促进我省旅游业发展。

多语种智能语音讲解系统通过扫描二维码的方式向游客传递文化旅游信息,无需耗费较大的人力物力和财力,更加低碳环保符合我国对环境与发展的政策。語音讲解系统可统计浏览量等数据,进行大数据对接,有利于景区后期运营调整。同时,也减少了景区维护时间和成本,对景区的品牌宣传和推广起到一定的推动作用。基于多语种智能语音讲解系统,通过非接触式语音操控方式,具有便利性、实用性和人性化的特点,存在广阔的应用价值。在该系统中具备景区地图,避免景区规模过大导致游客迷路,能为游客快速提供信息位置,有助于节省游客在线路上花费的时间。在地图上可将景区经典景点,特色景点表现出来。

1智能语音讲解系统设计

1.1智能语音讲解系统工程框架建立设计

工程框架建立初期,我们确立了以文本分析、韵律生成与合成语音为组成部分的工程框架。基于此框架, 我们在文本输入处输入搜集、翻译、校对好的外语文本,文本信息首先由文本输入模块读入;接着文本分析模块即文本的预处理模块,主要完成自动分词、语句处理、特殊符号的转换、文本的切分等,然后将处理好的数据送入韵律生成模块和合成语音模块;韵律生成模块根据各项合成规则规划出目标音高、音长、音强、停顿及语调等,将规划的结果参数送入合成语音模块;合成语音模块利用合成算法合成出满足目标要求的音节波形数据,将其拼接成语音流数据送入语音输出模块,最后由语音输出模块输出语音并合成文件。

1.2智能语音讲解系统研究思路

基于语音合成技术的智能讲解系统作为智慧旅游景区的主项内容,它需要具备语音识别和控制操作功能。本文的智能讲解系统结构的总体框图 (图1).主要由文本分析模块、声学参数生成模块和二维码生成器模块四部分组成。

当工作进行时,翻译人员在语音合成技术平台输入文本内容,平台通过声学参数生成系统将文本内容转换为所需语言的语音包(如图2)。最后以计算机图像处理技术和在线二维码生成器将语音包转换为二维码。

1.3智能语音讲解系统内容设计

文本分析模块是本系统的核心模块,本文采用由俄罗斯最大的搜索引擎及IT公司扬德克斯(Yandex)研发的Speech Kit以及Google集团研发的 Text-to-Speech进行语音识别。首先选取黑龙江省知名旅游资源,搜集关于旅游资源的信息。待收集整理信息之后将信息内容输入到文本框,平台通过韵律预测和韵律模型技术进行生成声学参数,时长预测以及播放内容类型的自主选择。技术人员借助二维码生成器软件将合成的语音转换为二维码。通过扫描二维码生成为俄语,日语和朝语的灵活切换讲解。

2智能语音讲解系统的实现与测试

2.1系统功能的实现

团队选取以中央大街为中心的周边最受外国游客欢迎的旅游目的地,其中包括马迭尔冷饮厅、圣·索菲亚大教堂、华梅西餐厅、塔道斯西餐厅以及防洪纪念塔等。通过查阅相关书籍和利用网络资源,搜集梳景点的简介,确认介绍内容后将收集来的中文资料翻译为俄语、日语和朝鲜语,然后进行校对,确保翻译好的外语资料信息准确无误、表达准确、用词得当。最后借助Speech Kit和Text-to-Speech平台生成所需语音,采用二维码生成器软件生成二维码。最后将二维码放置到相应的景区,作为国内外旅客对景区了解的参考。当游客通过手机扫描二维码,首先出现俄语、日语和朝语的语音选择,选择完毕后会出现文字介绍,图片展品和语音讲解。扫码语音讲解系统原料简单,打印方便,不会产生污染环境的现象。景区也无需花钱聘请导游指导,解决了淡旺季景区内部导游人数配置不平衡和导游水平参差不齐的问题,也避免了景区导游的吵闹喧哗,有利于提高游客的舒适度。

2.2系统功能的测试

在信息化数字化的时代背景下,相较于传统的导游解说,扫码导览更加符合智能景区的建设趋势。智能语音讲解系统操作简单,景区只需在展品旁贴上对应二维码。如若更换展品内容,则只需通过语音讲解系统智能合成新语音并打印二维码即可。这有效避免了导游,宣传讲解单,自主讲解器等花费成本。景区可把节省下的资源用于完善智慧景区,提高自身知名度。通过智能语音讲解系统生成的二维码有利于游客的分享推广。游客可以进行自主导览和回顾查看,可以加深游客记忆,同时游客可将手机上展览信息分享到社交平台,以达到帮助游客引流和宣传的目的。通过实施扫码语音讲解系统有助于对接大数据。并且进行大数据对接的同时减少了维护时间和成本,对景区的品牌宣传和推广起到一定的推动作用。它可以统计展品的浏览量等数据,通过分析浏览量及时对展品进行调整。

由于二维码导览需要手机联网才可向游客展示文字,图片和语音讲解。在实际应用中发现如下问题:1.搜查景点资料需要花费大量时间查阅众多书籍来丰富景点内涵。2.有些外国游客来到景区后由于手机的问题网络无响应或者景区游客较多,网络超负荷导致用户网络不稳定。这会对游客造成不佳的旅游体验。为此我们采取如下方法;团队的翻译人员努力提高搜寻景点资料效率,并重在总结景区精彩部分,使游客加深对景区的了解并致力于打造数字景区。为提高二维码导览效果和游客的旅游体验感,景区可采用大机量的网关实现WIFI全面覆盖,在高峰期游客流量大时,保证所有游客能顺畅使用WIFI。同时应在景区范围内统一WIFI名称,以此便于景区进行二维码导览讲解及宣传。二维码导览讲解的流畅应用可提高游客的体验舒适度,WIFI全面覆盖也会提高游客的评价满意度,促进加快打造智慧景区以及二维码导览讲解的应用推广。促进景区依托科学技术实施二维码导览系统来成为实现人与自然和谐发展的低碳智能运营景区。

3.讨论

当前智能语音讲解系统发展的突飞猛进,智能语音讲解系统与景区场景的结合应用在促进实现智慧景区等方面表现出巨大的潜力。但是该系统的应用大多集中在景区或者博物馆讲解等方面,当前应用的范围比较狭小。除此之外还可尝试应用在商场的产品介绍,有助于节省成本并减少人力资源。在当前黑龙江省内景区采用二维码导览讲解系统并不多见,根据采用二维码导览系统的景区反馈,表示智能语音讲解系统在提升游客体验服务,扩展有客流量和提高景区资源转化率等方面取得了不错的效果。因此该系统的推广应用有助于打造智慧景区并给游客提供良好的游客体验。本文根据当前浏览景区游客的实际需求,创新性的将智能语音讲解系统应用于景区方面,并解决了景区采用智能语音讲解系统所遇到的问题,使二维码导览系统应用于景区所发挥出最佳的效益。在景区测试及应用智能语音讲解系统也表明二维码导览系统讲解应用于景区等方面是可行的,本系统在努力打造省内智慧景区有积极意义,能够一定程度上使景区掌握智慧旅游所需的智能讲解系统,大数据等核心科技以及共享网络的全覆盖并提高游客的用户体验度。同时智慧景区自身也得到了一定的推广。旅游行业的转型升级,有助于促进景区数字化、智能化发展。游客对智能语音讲解系统的运用,让游客体验更加丰富和完善的同时,打通用户和景区之间的情感链接,增强用户和景区之间的粘性。

眼下,随着社会的不断发展,国内景区百花齐放,客户对景区导览系统设计提出的要求越来越高。正因为此现象的产生,有不少不良景区出于经济效益通过媒体互联网不断宣传自身优点导致不少国内外游客盲目跟风,景区观感并不强烈。好的景区并不仅仅在于宣传,其自身更致力于打造智慧景区,通过运用智能语音讲解系统来提高自身竞争力。同时语言的多样化选择以及在景区导视系统设计中,采用的文字符号色彩材料比重等。景区的内部结构应该对智能语音讲解系统进行合理的布局。在扫描二维码之后出现的选择语言界面和文字介绍可利用字体的感觉,大小等不同的组合来为游客营造出不同的效果。展示景点的图片可以融入该景点的历史底蕴和文化元素并选择该景点著名景点雕像和艺术作品等。使景区的艺术氛围更加的凝练,给游客创造出更好的游览范围。通过智能语音导览系统上的图片展示,有助于体现该景点历史文化内涵并传递文化信息,有助于促进景区文化特色提升并为游客增强信息的冲击力,并提升游客的认知速度。简单直接的语音讲解可将景点的介绍总结出更精炼的语言,并结合该语言本国的日常用语,有助于加深外國游客对该景点的了解。同时结合语音本国的日常用语提高了团队翻译人员搜集资料的难度,有助于翻译人员翻译水平的提升。与传统景区导游不同,智能语音讲解系统没有人工导游,游客可根据自己的需求来选择性收听,讲解配备精彩的图片和文字,能给游客更生动详细的介绍体验,同时也避免了传统导游扩音器带来的噪音,有助于改善游客体验。

本文针对当前景区以及游客所遇到的一些问题,提出并完善了基于语音合成技术的多语种智能语音讲解系统的应用。通过该系统的文字和图片的介绍以及语音讲解游客可以方便的获得所观看展品的信息,使游客的用户体验度达到最佳。同时相较于传统景区枯燥的讲解方式,智慧景区运用智能语音讲解系统的势头越来越猛,游客对品质游的追求水平提高。智能语音讲解系统深度聚合人工智能,移动互联网等技术,让游客通过手机即可获取一对一的深度导览服务,满足游客景区信息查找需求,充分体现了景区以游客为本。应用该系统不仅能够有效节约景区维护时间和成本,特别是对于中文不好的外国游客有更大的应用价值。本文对智能语音讲解系统中应用进行了初步研究,并验证了该系统的可行性。同时也解决了对于应用测试中出现的不足方面;景区可尽力采用大机量实现WIFI的全覆盖,以便发挥出智能语音讲解系统的最佳效果,完善我国景区服务产业。并提升景区的服务质量并提高了有用户的体验度。

参考文献

[1]王忠凯,卢选民,林茂宽,石韫玉.一种基于RFID的感应式智能语音讲解系统[J].计算机应用与软件,2012,29(06):242-243+270.

[2]麻学锋,张世兵,龙茂兴.旅游产业融合路径分析[J].经济地理,2010,30(04):678-681.DOI:10.15957/j.cnki.jjdl.2010.04.028.

[3]张文元,谈国新,孙传明.一种景区智能导游系统的设计与实现[J].测绘地理信息,2018,43(05):79-84.DOI:10.14188/j.2095-6045.2017151.

本文是黑龙江省大学生创新创业项目《基于语音合成技术的“大美龙江任我行”多语种智能语音讲解系统的设计与应用》(s202110214025)阶段性成果