APP下载

从《辞海》到“聚典数据开放平台”

2024-01-04毛文涛

出版与印刷 2023年4期
关键词:辞海工具书数字

毛文涛

一、聚典是什么

读者在手机、Pad 等移动终端上阅读电子书的过程中,遇到生僻的字词、生疏的知识,只要划动手指选中它们,点击“查询”按钮,词条的读音、释义等内容瞬间就被推送到读者的终端,并以弹窗的形式呈现出来。这种“屏幕选词、释义立现”的知识查检功能因为查检顺滑快捷,而且不打断阅读过程,体验极佳,深受读者欢迎。弹窗底部的一行小字告诉人们,在这背后提供服务的,就是聚典数据开放平台(简称“聚典”)。

聚典是上海世纪出版集团(简称“世纪集团”)规划设计、上海辞书出版社研发运营的一款创新的互联网数据服务产品,开创了传统工具书数字化转型的新模式。概括起来说,其基本业务逻辑是:①聚合各类优质工具书内容,形成系统可信的云端数据仓库;②开放数据接口,授权应用开发商实时调用;③读者发出查询请求时动态载入词条数据;④查询落空时,及时增补优化,形成业务闭环。

二、聚典做到了什么

聚典于2020 年8 月13 日正式发布上线,已稳定运行了三年,初具规模,还在快速发展。归纳而言,聚典取得了三方面的成果。

1.通过聚典,出版社实现了与读者精准、及时、全面的广泛链接

目前,聚典总用户数超过4800 万人,每月活跃用户数超过600 万人,已经成为一个比较成熟的互联网应用平台。在为用户提供知识查检服务的同时,用户的查询行为也都汇聚到聚典平台。在聚典平台,可以直接观察到用户对各类知识的查询情况,也可以分析把握读者阅读行为的特点和规律,以及区域分布情况等。这些宝贵信息的获得,在过去对出版单位而言是难以想象的。

2.通过聚典,满足了读者一站式知识查检需要,具有很强的带动性和辐射力

目前,聚典已经聚合了世纪集团内外10多家出版社的近200 种权威工具书,共计430 多万条词条,已成为国内最大的工具书数据开放平台,为各类工具书提供了一个一致且完整的数字化解决方案。未来,聚典还会不断增补优质工具书,形成学科覆盖更加全面、词条数据量更大的工具书数据开放平台。

随着技术迭代,聚典还显示了很强的辐射力。聚典已经从最初的数字阅读场景,快速扩展到在线搜索、新闻资讯和智能硬件等多种应用场景,已经在近40 个品牌互联网应用中落地使用,不少还是头部互联网应用。比如,在数字阅读领域,有微信读书、掌阅App、得到电子书、咪咕阅读、起点中文网和七猫小说等;在新闻资讯领域,有澎湃新闻、学习强国和上观新闻等;在在线搜索领域,有百度百科、百度汉语、搜狗汉语、抖音汉语等;在智能硬件领域,有小度词典笔、小寻词典笔、皮皮旸学习机等。

3.通过聚典,出版社站在了数字出版产业链的中心,成为整合上下游的枢纽之一

之所以能做到这一点,是因为聚典独特的商业模式。一直以来,出版社多采用内容授权、内容交付的方式,通过互联网应用开发商为读者提供服务。这种方式的局限性是非常明显的,很大程度上制约了出版社的数字化转型发展。

聚典的商业模式不是典型意义上的B2B模式,也不是典型意义上的B2C 模式,而是独特的BBC 模式,即在商业上是B2B,在数据流上是B2C。也就是说数据是直接发生在用户的终端和聚典的云服务器之间的,这保证了聚典数据的安全。

商业模式的创新是聚典得以快速发展的根本。BBC 模式很好地解决了读者在数字阅读过程中的痛点,提高了阅读效率,改进了阅读体验;很好地平衡了各方利益,C 端用户无需付费,B 端客户付费得到增值服务,在增加其用户黏性的同时,无需进行大规模数据加工,极大节省了成本。聚典在总体上创造增量价值的同时,通过制度的设计很好地平衡了增量价值的合理分配,让各方都分享到其中的一部分,调动了参与各方的积极性。

三、聚典的由来

一言以蔽之,聚典是在辞海网络版建设的过程中衍生出来的一个创新产品。

这一构想大约萌发于2018 年年初。产生这个想法的背景是,当时正在推进辞海网络版这一重大项目的建设。因为世纪集团出版了大量的优质工具书,因此在建设辞海网络版的过程中不可避免地就要思考如何系统解决传统工具书出版的“整体转型”问题,为各类工具书的数字化转型提供一个整体解决方案。

当然,这只是基于出版单位自我发展需要的考虑。只有这个来自自身的动力是不足以设计出聚典的。在不断摸索的过程中,我们也观察到很多互联网公司对《辞海》《汉语大词典》《十万个为什么》等优质出版资源的需求很强烈。这种需求不仅频度高,而且范围广,这让我们认识到工具书的核心价值所在,并形成向多方提供“数据服务”的设想。

有了“数据服务”这个设想之后,如何找到合适的应用场景和突破口成为另一道难关。巧的是,当时Kindle 推出了一个词汇量有限的联机词典查询功能,可以在Kindle 阅读器上划动手指选词之后查询联机词典。这个功能唤醒了我们对PC 时代屏幕选词右键查询的记忆,从而找到了工具书“数据服务”的落地场景。在这个场景中,海量内容都可以“随身携带”“随处使用”,使工具书在移动阅读环境继续发挥“工具”作用。

完整的构想就此形成:即打造一个依托世纪集团下属各出版社丰富且权威的工具书出版资源,通过赋能B 端客户进而满足C 端读者数字阅读过程中的知识查检需要,内容集成、场景泛适、多向赋能的开放性知识应用平台—聚典。

从聚典诞生的整个过程不难看出,“强烈的使命追求、巨大的市场需要、恰当的应用场景”催生了聚典。

四、聚典的启示

我们最重要的一个体会是,对传统出版单位来讲,数字出版一定要深深地扎根在长期积累的优质出版资源的基础之上。对聚典而言,《辞海》《汉语大词典》以及世纪集团各出版社长期积累的大量优质工具书资源,是聚典模式得以成立的物质基础。可以说,没有《辞海》,就没有聚典。

同时,我们也深刻地体会到,如果没有对互联网发展规律的认识和把握,并按照规律办事情,聚典也不会横空出世,并发展到目前的水平。

随着互联网的普及,传统行业在转型发展过程中曾经争论过一个问题:究竟是“互联网+”还是“+互联网”?对于出版行业来说,关键在于搞清楚互联网规律究竟是什么,如何按照互联网规律推动出版的数字化转型发展。结合聚典几年来的发展,在这方面,我们的体会主要有四点。

1.树立用户思维,把心交给读者

出版的数字化首先要回归基本问题,即要首先聚焦于“用户是谁”“用户需要什么”“用户在什么情况下使用”“如何方便用户使用”这些最基本的问题。观察出版行业,不少出版单位在开展数字出版工作的时候,往往还是将图书内容电子化之后,简单平移或者堆积,没有很好地考虑用户的实际应用场景和使用痛点,更疏于不断打磨迭代产品,使得用户体验很不理想,只能落得无人问津的境地。相反,如果以场景化应用为切入口,以用户需求为导向,小应用也会有大市场。聚典就是从一个很小的应用切入,解决了读者一个小小的痛点,后来拓展到众多场景并形成大范围应用的。

2.树立平台思维,充分发挥流量经济价值和规模效应

纵观20 多年来数字经济发展潮流,平台经济占据重要位置,呈现蓬勃生机。出版行业推动数字化转型,最为重要的就是把握平台经济规律,打造真正具有竞争力的数字出版平台。通过平台化实现规模效应,主要体现在:提供一站式海量选择、达到极低的边际成本、实现流量的非线性变现、实现病毒式品牌传播。

行业内称为数字出版平台的数不胜数,真正由传统出版单位建设的成熟的平台,则又屈指可数。我们认为,一个成功的集成性数字出版平台,应当具备三种能力:一是一体化融媒体编辑能力,这是实现传统内容生产方式向数字化内容生产方式转变,适应网络化传播所必须具备的工具和推动组织转型的助推器;二是门户级用户响应能力,这是实现大规模用户链接,形成广泛应用的保证;三是技术驱动的知识服务能力,这是平台依靠传统出版长期积累的优质资源发展起步之后,能否自我造血、迭代前进的动力机制。三种能力缺一不可,三种能力的有机互动,将逐步推动平台形成为一个数字出版生态闭环。

3.树立数据思维,利用好数据这一新的生产要素

对于数字出版而言,数据不仅包括内容数据,还包括用户数据和阅读行为数据等,对这些数据的有效采集、高效存储、科学分析、合理利用,乃至以数据驱动产品研发和服务,这是一篇大文章,是数字出版不能回避的一个重要问题。

用户思维是从产品端考量的,着眼于怎样把产品做得好用;平台思维更多的是从商业端考量,着眼于如何构建一个合理的商业模式;而联系这两者的是数据,基础则是技术。

4.树立技术思维,创新产品与服务模式

“怎样对待技术以及怎样进行有效的技术管理”,这是一个长期困扰传统出版人的问题。在传统出版社数字化转型的过程中,对待数字技术的应用有两种极端的倾向:一是对技术感到恐惧,甚至不想面对它;二是认为技术无用,认为技术问题简单外包给开发公司即可。

在发展聚典的过程中,我们要求持续培育并形成出版单位自己独立、完整的技术队伍和开发能力。其可行性在于,在推进数字化转型的过程中,所需要使用到的都是相对成熟的数字技术,技术方面所做的更多的是集成,而不是做原始创新。对于这类技术,出版单位完全可以掌握。其必要性在于,一是技术要为产品服务、为商业逻辑服务,持续的技术迭代是保持产品和服务具备竞争力的基本要求,否则将制约产品和服务的自主性;二是技术不仅可以为产品提供更好的体验、创新产品形态,甚至还使得某些商业模式得以成立,而这些创新在早期是需要在一定的保密情况下进行的。其实,如果不是因为4G/Wi-Fi 网络提供足够高的数据传输速率,屏幕查词延时超过几秒的话,用户体验就极为糟糕,聚典就不成立了。所以,出版数字化转型一定要建立在技术能力的提升和技术队伍的成长之上。

五、聚典的未来

1.聚典要持续推进以《辞海》为代表的优质内容生产建设,构建更加完整的知识体系

系统、优质的工具书出版资源是聚典发展的基础。知识内容包罗万象,涉及的学科门类众多,仅一两家出版社的工具书难以满足用户的查检需求。因此,在设计聚典的时候,不仅需要考虑对下游客户开放,为所有互联网应用提供服务,也要对上游内容提供方保持开放。聚典不仅整合了世纪集团内几乎所有优质工具书资源,还进一步吸收了世纪集团外其他出版社的优质工具书资源,并将继续保持开放,目标是围绕构建系统权威的知识体系,将聚典打造成数据量最大、学科和专业最齐全的工具书数据开放平台。当然,在聚典整合工具书内容资源的过程中,也不是毫无选择地将所有工具书都收入聚典平台,而是要严格筛选经过市场检验的优质工具书,这也正是聚典与网络百科最大的区别。聚典将为用户严把质量关,过滤掉不可靠信息,在扩大平台数据规模和为用户提供准确内容间找到平衡,让用户既能“有问必应”,又能“有应必准”,让用户获得可信赖的知识服务,降低信息过滤成本和错误信息带来的潜在风险。

随着应用的拓展,聚典已经开始聚合古诗文等非典型的工具书内容。可以预见的是,伴随着聚典的成长,它将逐步整合其他类型的优质出版资源、优秀的经典著作,从“聚合词典”延拓为“聚合词典”与“聚合经典”并重,成为真正聚合中华优秀文化、构建完整知识体系的大平台。

2.聚典要继承和发扬辞海精神,持续迭代发展、与时俱进

围绕“查检更有效、体验更友好、服务更智能”的目标,历时近10 个月,聚典完成了2.0 版的迭代工作,并于2023 年8 月15 日发布。

这次迭代主要在几个方面做了改进。一是改进内容质量,丰富了数据类型。聚典对数据仓库内词条进行了去重、纠错和规范化处理,还对查询落空的情况进行分析筛选,及时补充新词新语,还增补了古诗文等类型的大量内容。二是改善用户体验,通过改进参见系统、扩充同位词和举例词等做法,改变了纸质辞书受限于版面而不得不采用的一些传统做法,改善了用户体验。三是提高了容错能力,对用户的查询内容进行智能化容错,基本实现了对原文错误、切词错误或者切词遗漏等问题的智能容错并提供分词服务。

自2020 年聚典发布,三年来平台迭代工作一直在不断地推进。内容上,通过查询落空反馈机制及时捕捉用户需求,不断充实和改进;技术上,不断适应互联网应用的极限挑战,持续提高响应能力和技术水平;服务上,不断丰富应用场景,改进用户使用体验,提高服务效能。聚典就是这样坚守“一丝不苟、字斟句酌、作风严谨”的辞海精神,坚守“数据服务”的产品定位,不断完善和迭代进步,努力去服务各类应用和最广大的互联网用户。

3.聚典要继承并拓展辞海事业,努力成为数字时代的文化基础设施

1936 年《辞海》(第一版)的“编辑大纲”强调:“为辞书者,自当体察用者之需要,恰如其所需以予之。”聚典发端于《辞海》,也沿袭了《辞海》孜孜以求的事业。

聚典是一个赋能平台,它的使命是“为阅读赋能、为学习赋能、为搜索赋能”。长远来说,我们希望聚典能够像电力、自来水那样,无论何时、何地、何种应用场景,都可以在读者需要的时候以最为快捷、方便的方式,甚至无感地为读者提供完美的知识查检服务,努力“成为数字时代的文化基础设施”。

结语

以“数据服务”为产品定位,以“为阅读赋能、为学习赋能、为搜索赋能”为使命追求,立志“成为数字时代的文化基础设施”的聚典数据开放平台,2023 年8 月在正式上线三周年之际发布了“查检更有效、体验更友好、服务更智能”的2.0 版。谨以此文,记录聚典的诞生,回顾聚典的成长,总结聚典的特点,期许聚典的未来。

猜你喜欢

辞海工具书数字
赵国春与《辞海》的故事
诗词工具书二种
诗词工具书二种
《辞海》的创新之路
答数字
好风凭借力伴我泛书海
——小学语文阅读教学中使用工具书的指导
数字看G20
我国最大综合性辞典《辞海》启动第七版编纂
成双成对
网络时代工具书阅览室的建设