APP下载

融媒体时代数字化词典编纂出版的现状及其问题

2021-09-28唐舒航

关键词:辞书词典模态

唐舒航

广东外语外贸大学外国语言学及应用语言学研究中心 广东广州 510420

融媒体译自英语“media convergence”(媒体融合),该理念自1983年提出以来,已有38年历史①。融媒体的核心要义为“融”(convergence),是在各种传播媒体之间实现“融通”,借助“互联网+”和人工智能技术使文本信息能够跨越媒体边界进行传播。它通过多种媒体(全息媒体)和多种模态(全效媒体)将信息送达任何使用互联网终端的人进行阅读、使用和交换(全员媒体),是一种全程媒体,也被称为全媒体[1][2]。“中共中央政治局1月25日上午就全媒体时代和媒体融合发展举行第十二次集体学习。中共中央总书记习近平在主持学习时强调,推动媒体融合发展、建设全媒体成为我们面临的一项紧迫课题。”②中国辞书学会迅速反应,于3月召开了“融媒体与辞书”专题研讨会,4月召开了“融媒体词典学”研讨会,并在上海、广州等地召开的全国性词典学研讨会上,都将融媒体词典作为第一议题。可以看出,融媒体对词典数字化转型具有十分重要的意义。因此,本文通过对数字化词典的编纂和出版现状进行调查研究,揭示传统词典转型存在的问题,以期为融媒体词典的创新和发展奠定基础。

一、数字化词典编纂的现状及其问题

(一)数字化词典编纂的现状

数字化词典的类型主要包括手持式电子词典、光盘词典、在线词典、exe安装程序和词典APP等。20世纪90年代,权威的主流词典首触互联网,如《牛津英语大词典》(OED)和《美国百科全书》分别于1992年和1995年出版了CD-ROM版词典,牛津、朗文系列先后推出了光盘和网络词典,我国也推出了《汉语大词典》光盘版和洪恩在线等,开启了纸质词典电子化的历程。2012年,有着244年历史的《不列颠百科全书》(《大英百科全书》)全面转向数字出版。同年,麦克米伦首次宣布以后只发布在线版本的词典。纵观国外牛津、朗文、柯林斯等主流词典,虽然国际辞书界尚未提出“融媒体词典”的概念,但他们以光盘和网络等媒介开发了光盘版、在线版、手机版和桌面版等,数字化词典已经成为国际各大辞书出版社的重要出版形式,词典文本已经融入了图片、音频、视频和人机互动等多媒体和多模态元素[2][3]。我国“十二五”出版规划2011年度重大辞书项目《中国大百科全书》(第三版)的修订在立项时即计划推出网络版,权威的学习型词典如新版《现代汉语词典》和《新华字典》、查考型词典如《辞海》和《汉语大词典》等于2019年开始都相继推出APP版和电子版,很快以其实用性、便捷性和创新性广受欢迎,但它们在词典文本与“多媒体”“多模态”等数字元素的应用方面还稍显稚嫩。

因此,本文拟选取最新出版的国外主流的双解学习型词典在国内用户群体中使用较多的数字网络版和APP版作为调研对象,调查它们在编纂原则、体例、词典文本、多模态交互等方面的界面设置和处理情况。它们是五大学习型词典(Big Five),即《牛津高阶英汉双解词典》(第9版)APP版(商务印书馆,2019)、《朗文当代高级英语辞典(英英·英汉双解)》(第5版)ISO版(外语教学与研究出版社,2014)、《剑桥高阶英汉双解词典》(第4版)手机版(外语教学与研究出版社,2010)、《柯林斯COBUILD高阶英汉双解学习词典》(第8版)APP版(外语教学与研究出版社,2017)和《麦克米伦高阶英汉双解词典》(第2版)在线版(外语教学与研究出版社,2018)。其结果如表1所示。

表 1 Big Five数字化词典编纂的界面设置情况

续表 1

(二)数字化词典编纂的问题

通过对Big Five的考察,可以发现主要存在以下四个问题。

1. 混淆多媒体与多模态的概念内涵

从上表可看出,不论是APP版、ISO版、手机版还是在线版,它们的纸质文本在数字界面的立体结构、多模态功能和智能化技术等方面都实现了一定程度的融合,以图形、图像、发音、录音、发音对比、人机对话、虚拟现实等模块功能为主。但我们可以看到,音频、视频等只是词典文本传播的媒体或媒介,其下包含了多种模态。如音频包含了仿真模态和声音模态,视频包含了动态图像、结构图形、动态语音和文本等模态[4][5]。但遗憾的是,Big Five还是存在模糊和混淆“多媒体”和“多模态”的现象,把有图片和发音功能的看作是多模态。如《剑桥高阶英汉双解词典》(第4版)手机版是单机网络词典,它通过联网下载或导入词典数据包进行离线使用,只提供了插图,视频下的模态是缺失的;而《麦克米伦高阶英汉双解词典》(第2版)在线版没有人机交互和人人对话的多模态交互。最主要的问题是,它们都未将媒体中的模态进行融合,也未将模态与文字一样用来表征词条的意义。把媒体与模态的概念内涵混淆,那么词典的数字化便只是纸质版的电子化。

2. 缺乏媒体融合的多模态词典文本

Big Five在界面的结构呈现上基本一致,都是将纸质内容移植到网络或电子设备上后,运用图片和发音来优化查询和显示内容,并增加与内容匹配的视频、动画等新形式。如《剑桥高阶英汉双解词典》(第4版)丰富的资讯收藏功能提供了配套的知识服务;除《麦克米伦高阶英汉双解词典》(第2版)在线版外,其余四部词典都有人机交互的功能,《朗文当代高级英语辞典(英英·英汉双解)》(第5版)ISO版还增加了人人互动模块,为编者和用户架起了沟通的桥梁。但它们都未体现媒体融合的多模态文本特征,文字仍然是正式词典文本最主要的释义模态。虽然Big Five已将图形和声音模态参与其中,朗文当代高级英语辞典(英英·英汉双解)》(第5版)ISO版和《柯林斯COBUILD高阶英汉双解学习词典》(第8版)APP版甚至提供了虚拟现实和手指触发的功能,加入了触觉模态,但其他模态都不直接参与词条的释义和注释,只是充当附加信息和装饰内容的角色。总之,这些单个模态并未融合在一起来正式构建被释义词的多模态文本。

3. 词典文本的组织单位和形态不一致

Big Five基本上是以词典为单位而不是以词条或词条元数据为单位来编写的,所以词条的释义和注释并不全面,表现为被释义词的各种语言属性、语域属性、专业属性及其程度大部分未进行明显的标注和分级,尤其涉及形象化表征语义时提供的图像、音频和视频资源或资料更是如此。仅《柯林斯COBUILD高阶英汉双解学习词典》(第8版)APP版采用了差别化图解释义,《麦克米伦高阶英汉双解词典》(第2版)在线版采用红色星号标示词频高低。由于它们未按规范统一的数字编码格式进行编写,也未在数据库中按立体的组织形式赋予特定标签、存放在特定的地方,因此用户就不能在界面自行设定查询项目、知识分布和词典文本的呈现结构,包括各类模态信息。

4. 缺乏对用户群体的精准服务

除《牛津高阶英汉双解词典》(第9版)APP版和《麦克米伦高阶英汉双解词典》(第2版)在线版外,其余三部词典都可以实现人机对话和虚拟现实;而在用户讨论和互动功能方面却只有《朗文当代高级英语辞典(英英·英汉双解)》(第5版)ISO版采用e-mail的方式让编者与用户、用户与用户之间进行了对话。然而,融媒体传播形态的极度细分和碎片化要求以词条或词条元数据为单位,以便为各层次用户提供或系统或碎片化的精准服务。Big Five 不能通过编者与用户、用户与用户的直接互动来应对用户查阅习惯的改变和适应用户新的查阅需求。如不能及时有效地制作和传递自己对词典使用的动态感想或对词典编写提出意见与建议,也不能根据自己的查阅偏好设置精准的查阅范围和方式甚至定制适合自己的个人词典。

二、数字化词典出版的现状及其问题

我国数字化词典量的增长很可观,据周致欣和白丽敬[6]的统计,2012年数字版词典的数量首次超过纸质版。艾瑞“2012年在线词典发展研究报告”数据显示:2012年网络查词、翻译服务渗透率已达73.7%,在线翻译网站、在线词典、下载版词典软件等市场渗透率都在50%以上,移动端的手机词典APP总下载量超过10亿次。自2013年以来,传统辞书出版量持续下降,据《2019年中国图书出版市场分析报告》发布的最新数据显示,传统辞书出版物在2019年较2018年总出版印刷数下降3.1%,与此同时,数字词典出版增速远高于出版业规模整体增速。据不完全统计,我国现今至少有300种网络词典或词典APP,涉及单语词典、双语词典、综合词典、专科词典、同义词词典等,与传统词典的类型大致相同。通过对它们出版现状的调研,可以总结出以下四个主要问题。

(一)编纂出版平台的不统一

中国辞书学会2001年便成立了辞书编纂现代化技术专业委员会,着力推进传统辞书向融媒辞书方向发展,辞书出版社和研究中心也做出大量探索。商务印书馆研发的“辞书语料库及编纂系统”使词典从编纂到出版存储再到网络在线发布的全过程都形成了自动化流程[7];上海外语教育出版社牵头研发的“双语词典编纂系统”是一个一体化数字平台,可以让词典编纂完全做到无纸化,真正实现数字化[8];广东外语外贸大学词典学研究中心开发的“词典生成系统”在数据库的基础上完成词典的自动生成[9]。但目前这些已建立的词典电子数据分散各地,且目的单一,编纂的标准和格式不一致,难以在统一平台中形成合力,建立起从编纂程序、文本结构到传输方式的多模态词典数据库,实现资源共享。尤其是信息文本的标注和信息文本之间的关联不够规范和深入,使得词典文本得不到深加工。词典文本和多模态的结构化、碎片化和关联化不充分,导致后期的语义细粒度匹配不够,也就不能创建较强通用性和扩展性的词典结构化数据加工规则及验证标准。现商务印书馆基于HTML数据和XML结构化数据加工提出BS类word文件规范和DTD,但融媒体背景下结构化数据进出对多模态词典元数据的开发利用是比词条更小的单位,标引加工难度更大,是当下最难以突破的关口。我们至今没有专用的多模态词典数据库,也就不能以此拓宽词条信息的呈现渠道和方式。

此外,还有从各种媒体如书籍、报刊、广播、电视、网络和社交媒体中提取的辞书资源以及中小型出版机构的小型语料,它们在文本格式和编码方法上更加混乱,为制成适应通用媒体编辑和出版的多模态词典元数据带来了极大的挑战。

(二)词典用户个性化知识需求尚待满足

我们早已熟知,词典用户在词典的整个编纂出版过程中早已不再扮演被动接受者的角色,而是处于中心位置。融媒体背景下人们生活节奏快,工作环境复杂,持续学习成为自我提升的必需品。词典对我们而言不仅仅是查检学习的工具,也是信息内容和知识服务。这直接导致词典用户的知识需求更具体化,在短时间内获得高质量、个性化知识服务的需求增强[10]。相应地,词典的知识服务需要用新兴信息技术和知识经济向目标用户提供高附加值、高层次、知识型的服务,以进一步满足他们的需求,引导他们购买和查阅。各辞书出版社大展拳脚,打造多个数据库、知识服务平台等来解决当前用户需求是目前较为普遍的方式。如《辞海》(第7版)网络版的四大系统(数字资源管理系统、辞书核心网络编纂系统、多元发布系统和在线知识服务系统)和八大数据库(第7版《辞海》数据库、历版《辞海 》数据库、《大辞海》数据库、标准数据库、图片数据库、语文词典数据库、百科辞典数据库和多媒体资源数据库),建立全产业链的数字出版服务平台,最终成为权威的汉语基础知识服务引擎,以适应用户获取、查阅和应用信息的全场景。《中国大百科全书》第3版网络版的中国大百科全书数据库、中国百科术语数据库和专题知识数据库较之第二版的规模更大、内容更丰富、形式更多样,更好地适应了互联网时代读者阅读使用新需求。首批条目已于2021年7月24日发布,并且将根据各方意见进一步修改完善条目内容、优化网站功能体验③。

根据用户需求封装辞书数据库以此提供顶层产品库,在界面设计和呈现上简化了用户获取、使用知识的流程。各移动客户端以及虚拟现实(VR)和增强现实(AR)优化了知识获取的体验感,帮助词典用户对查阅内容的深入理解。为适应互联网、移动应用的普及,知识资源呈现出多模态、多类型等特点。单语词典的语义化趋势逐渐显现,如基于知识对象关联、可视化释义等。这些都为词典释义内容的呈现在便捷性、个性化方面进行了大幅创新,提高了知识服务的层次与质量,增强了用户的产品粘性。

尽管如此,针对具体用户需求的精准服务方面各大辞书数据库都未提出切实的规划,如何契合用户碎片化的动态需求提供即时的服务是需要进一步完善和优化的。融媒体时代,各大辞书数据库需充分运用“互联网+”和人工智能技术设计更完善精准的知识服务系统,嵌入用户查阅检索、获取和利用信息反馈的全过程链,根据每一环节的用户行为来发掘潜在的词典文本需求,进而创新服务模式。

(三)词典文本的新媒介尚待挖掘

词典用户使用需求标签化、信息查阅碎片化、查阅路径网络化,这些使用习惯的新变化让在线查阅和移动终端使用成为全民词典用户的常态[11]。纸质版词典相继推出网络版、在线版等,融合多媒体资源,覆盖各类终端,满足用户随时随地查询的需求。特别是大型辞书出版趋于数字化和新媒体,其数字词典应用的传播媒介引领行业出版的方向,也受到广泛的关注。具体的传播媒介见表2。

表 2 词典文本与传播媒介的融合情况

续表 2

把融媒体应用到词典的第一要务就是要弄清楚词典文本可涉及的传播媒介。融媒体的出版媒介是发布信息内容的不同方法,通常以互联网为基础。可以看到,这些词典的网络版都离不开网络传播和社交网络的渠道,《辞海》(第7版)网络版还可以通过其微信公众号进行使用,是应对用户查阅习惯改变的积极动作。但这些词典在电邮、短信、微博、广播等其他出版媒介方面尚未涉及。而出版媒介传送的逻辑媒介形式多样,除音频、视频、动画、立体模型等基本媒体外,还有VR和AR的视触觉模态的传播处理。值得一提的是,与国外词典逻辑媒介不同的是,除《汉语大词典》(第2版)网络版外,其他词典都运用了我国用户使用较多的二维码链接实现纸媒与网媒的互动,有效兼容了纸质版与数字版的出版与使用。这些媒体适用的终端设备主要有电脑端(包括个人电脑、平板电脑等)、手机客户端、电子阅读器、媒体播放器等,《辞源》(第3版)U盘版还可以由U盘接受和播放。但电子记事本、电子穿戴用品等其他移动阅读终端尚待进一步的挖掘和融合。

(四)盈利新模式尚待开创

融媒体时代数字化词典的编纂出版需要长时间且大量的成本投入和资金支持,虽然国家和教育层面的项目支持可帮助投资建设,但是后期的运营维护、迭代更新都需要辞书出版社保持以一定的销售或盈利收入持续地投入,以此来实现融媒体词典的规模增长。我们以国内最新出版的影响力较大的语文词典数字版为例,抽样调查它们盈利模式的现状。其结果如表3 所示。

表 3 语文数字化词典盈利模式抽样调查

这四部词典其实代表着3种盈利模式:半免费、半收费;前期免费、后期收费和完全收费。半免费和半收费是指基础功能免费对外开放,高端功能如全面、丰富和动态的信息查阅等要求收费。如《现代汉语词典》(第7版)APP版就有不少使用限制,收费版的功能会更加齐全。而前期免费、后期收费是指给用户1到3个月的试用期,试用期内免费,超过期限便收费。如《辞海》(第7版)网络版是汉语的查考型语文词典,在购买纸质版后会赠送5年的数字版使用权,使用期后交费才能使用。而完全收费是指用户只有交钱才能下载或使用[12]。如《汉语大词典》电子版是按年收费,不能一次性买断。

从目前的情况看,由于这些权威词典的纸质版早已占据了国内市场的绝对份额,垄断性强,几乎不可替代。词典本身的销售就是辞书出版商的收益。所以我们从上表可以看出,它们的数字版都采用收费或半收费的盈利模式,且价格普遍偏高。比如《现代汉语词典》(第7版)APP版售价高达98元,与纸质版并无差别;就算是《新华字典》(第12版)APP版只收费40元,也被用户调侃为“价格接近一斤猪肉”。而《辞海》(第7版)网络版和《汉语大词典》电子版都是按年收费,前者每年的售价也高达98元,虽然它每年都会有内容的更新,但从用户的评价可以看到,他们中的大多数还是认为价格过高,按年收费还不如一次性买断。而且这些词典依靠出售登录账号或屏蔽词典功能来盈利,在一定时期内难免会被那些质量不高且长期免费的词典挤压,削弱词典编纂的资金来源。

数字词典多半采用免费或半免费的盈利模式,大多数用户也倾向于使用免费词典,这与纸质词典的盈利模式完全相悖,是辞书出版机构面临的时代难题[13][14][12]。其实我国台湾的一些词典,还有国外的优秀词典在出印刷版的同时也出网络版,大部分免费,只有少数收费。国外权威的辞书出版社让免费词典靠对纸质版的宣传、点击量或广告盈利,收费词典的效益便因此大幅增长,最有代表性的就是《牛津英语大词典》(OED),其网络版收费和盈利都很成功。我国辞书学会的李宇明会长在2019年的新时期辞书学与辞书发展研讨会上建议发挥我们社会主义国家自己的优势,国家层面出面购买这些优秀词典,放到网上供大家免费使用。

事实上,融媒体背景下辞书出版社依靠与技术供应商(网络、语言技术、电子通信技术等)的通力合作[15],形成它们共同的技术基础[16],可为数字化词典尤其是中小型数字化词典的盈利引进新的渠道。这些技术供应商包括信息技术公司、云平台、搜索公司和数字化词典的终端厂商或运营商,他们在产业市场的颇多收益开拓了广阔的多元化经营模式,给辞书出版社的收益分配带来了新的机遇。专业辞书人才编纂优势和技术平台传播优势的强强联合,可开创数字版和纸质版齐头并进的出版模式,数字版丰富全面,纸质版权威规范。

结语

融媒体是词典数字化转型的重大机遇,与此同时,数字化词典的编纂出版仍面临着巨大的挑战。融媒体与词典在编纂出版方面的融合是全方位的,是从资源、文本、模态、媒体到用户的融合,甚至还包括传统词典与融媒体词典的兼容与共存,实现词典资源和信息的呈现由静态到动态的有效整合。具体说来,词典资源涉及人才、语言和数据,其中:人才是后两者发展的先决条件;词典文本涉及词典信息表征的多模态化、词典文本的组织数据化和词典类型的全功能,是融媒体词典创新的实质内容;数字媒体涉及词典文本传输的全媒体化、词典查询智能化和人机交流互动化,是融媒体词典创新的技术保证。而用户涉及最终的数字词典体验,对他们而言,词典不是咨询过程的终点,而是通过词典检索可以获得各类词典的外部信息。词典数字化转型所涉环节之多、领域之广、程度之深是传统词典编纂出版未曾面对的,这需要我们做好当前数字化编纂出版趋势的现状和实践特征的调查来发现现存的主要问题,从而对症下药、攻坚克难。其中,数字化和互联网通信技术、媒体融合技术和语言技术是保障,多模态词典文本和词条元数据是关键,用户智能查阅需求和习惯是落脚点。另外,数字媒体使用的词典文本知识产权在网络空间中的安全问题也是制约融媒体时代数字化词典发展非常现实的问题。

我们提出融媒体词典的概念并不是要否定、取代纸质词典,而是旨在补充和促进数字词典在当今融媒体背景下更细致的研究和更长远的发展,甚至为探索纸质词典与融媒词典的有机融合提供新的视角和参考。从“平面词典”到“融媒词典”的理念过渡是一个持续的过程,改进数据分发和信息检索结构,最终都以设计和用户界面呈现出来的效果为检验标准。现阶段很多汉语的单语学习词典或对外汉语词典等正基于“两微一端”词典信息传播和知识服务现状的调查分析挖掘和突破这种可能。

注释:

①美国麻省理工学院的Ithiel de Sola Pool于1983年在Technologies of Freedom中提出“the convergence of modes“,初步形成“媒体融合”的理念。

②参看中国共产党新闻网的相关报道http://cpc.people.com.cn/n1/2019/0125/c64094-30590946.html。

③参看新华网的相关报道《中国大百科全书》第三版首批条目发布(baidu.com)。

猜你喜欢

辞书词典模态
联合仿真在某车型LGF/PP尾门模态仿真上的应用
多模态超声监测DBD移植肾的临床应用
CISHU YANJIU LEXICOGRAPHICAL STUDIES
大型辞书疑难字考释七则
米兰·昆德拉的A-Z词典(节选)
米沃什词典
词典引发的政治辩论由来已久 精读
模态可精确化方向的含糊性研究
中国辞书学会第五届领导成员名单
漫画词典