APP下载

构建融通古今的中华数字文明:出版业转型与中华文化数据库建构

2022-05-30林玮

出版广角 2022年16期
关键词:出版业古籍中华文化

【摘要】中华文化数据库的建构需要传统出版业提供丰富的资源,更需要基础、逻辑和传播形态的古今融通。在内容上,出版业的数字化要注重商业性与公共性的协调;在体系上,中华文化数据库的文化性和体系性应充分借鉴传统典籍文献汇编经验,破解“知网难题”和“古籍难题”;在传播上,中华文化数据库要注重文化创新以及其对公众日常生活的嵌入。中华数字文明应以一种官方、学界、商界与公众四维共存、相互制衡的理想文化生态为前景。

【关  键  词】中华文化数据库;数字文明;出版业;转型

【作者单位】林玮,浙江大学影视艺术与新媒体学院。

【基金项目】本文系国家社科基金一般项目“人工智能时代的传播伦理与治理框架研究”(20BXW103)的阶段性成果。

【中图分类号】G239.2【文献标识码】A【DOI】10.16491/j.cnki.cn45-1216/g2.2022.16.010

2022年5月,中共中央办公厅、国务院办公厅印发《关于推进实施国家文化数字化战略的意见》(下文简称《意见》),明确提出8项重点任务,第一项即为“统筹利用文化领域已建或在建数字化工程和数据库所形成的成果,关联形成中华文化数据库”。这是一项具有重大历史意义的文化工程,中华文化数据库的建成将标识着中华文化进入物理层面的元宇宙时代。为推进这一工程,中华文化各领域的基础设施数字化与数据采集、分发和传输标准的统一化亟须提上日程。其中,出版领域具有重要的主体意义,这是因为在电子媒介出现之前,中华文化物态呈现主要体现在出版领域,建构中华文化数据库维系于出版业转型。

即便在互联网高度发达的今天,出版物仍然是信息传输的重要载体。图书馆仍矗立在中心位置,将知识养料输送到社会的每个角落,并经常借助电子网络直达网络空间的最远端[1]。但显而易见的是,这一形态将在元宇宙时代发生改变:物理空间里的图书馆或阅览室可能依然矗立,但其内涵发生了根本性变化——图书馆内迅速流通的不再是大量纸质书籍,而是伴随各种提示灯频繁闪烁的数据流。这种数据流在信息形态上具有标准化特征,二进制代码全球划一。就内涵和架构来说,数字化的中华文化应体现古今融通的中华文明特殊性,从而使中华文化在数字化时代仍然能够存续、衍生和发展,这就需要回到数字文明形态的信息层面来探索出版业转型,研究传统出版业如何融入中华文化数据库。

数据库不是数据的堆砌与集合,而是按照一定格式组织起来存放的,通常是按照数据模型组织起来的,是长期存储在计算机内、有组织、可共享的数据集合[2]。也就是說,数据库具有很强的组织性和结构性,这种结构性本身可能以技术的中立面貌遮蔽其价值立场和理性,计算机语言同样可能包含现代语言所指认的语言结构,后者是一个涉及人们社会存在的显现方式,包含叙述、理性、真理等意义的综合概念[3]。因此,考究出版业转型与中华文化数据库建构关联,有必要从不同维度分析传统出版与数据库传播之间的关系。本文尝试从文化意义上讨论传统出版业融入中华文化数据库建构的不同维度,从中延伸出中华数字文明的核心概念,为中国出版业的转型提供理论参考。

一、基础:数字出版资源的商业性与公共性

《意见》提出,中华文化数据库的形成应统筹利用文化领域已建或在建数字化工程和数据库所形成的成果。对于出版业来说,数字化工程已有较长时间的积累。早在2004年12月,谷歌就与纽约公共图书馆、哈佛大学、斯坦福大学、密歇根大学、英国牛津大学图书馆启动了数字图书馆计划,将全球数千万册图书数字化并上传至网络。同时,谷歌推出Google Scholar检索服务,在一定程度上引领(甚至部分取代)了传统图书馆。不过,不少研究指出,谷歌数字图书馆计划最大的问题在于其商业公司属性,这不仅可能造成数据库结构的倾向和偏见,而且会导致出版资源的商业垄断。

我国出版行业的数字化始终处于多元竞争中。期刊数字化平台建设领域除了知网,还有万方、维普等平台的介入。相比之下,传统图书的数字化虽然前期投入大,收益周期长,但其市场规模巨大,竞争也更加激烈。图书出版的数字化转型主要体现在两个方面。一是商业出版数字化,除纸质图书电商转型之后出现的数字阅读企业(如京东阅读、当当阅读)外,商业出版数字化的主要开发主体是体量极大的电信运营商(如中国移动的咪咕阅读、中国联通的沃阅读、中国电信的天翼阅读)和互联网巨头(如腾讯的QQ阅读、微信读书,百度阅读、网易蜗牛读书等)。此外,以硬件起家的掌阅、海信、文石等数字阅读企业也占有一定的市场。二是古籍出版数字化,目前我国古籍出版的数字化任务主要由代表公共性利益的社会部门如图书馆、博物馆等承担,入选国家珍贵古籍名录的古籍的数字化由省级图书馆承担,各地图书馆、博物馆藏的古籍珍本善本的数字化则由各地自行完成。如山西博物院对馆藏的五千册古籍善本进行数字化;山西大学图书馆对馆藏的三千种碑帖拓片进行数字化;中国国家图书馆从2010年开始与美国哈佛大学图书馆开展古籍善本数字化合作项目,对海外4200多种汉籍善本进行数字化处理后上网免费公布,有效实现了海外汉籍善本的回归;复旦大学图书馆的数字化平台及加工项目将馆藏古籍中独具特色的抄稿本进行数字扫描,研发检索平台,并在网上公布,很好地体现了传统出版的公共性。

商业出版和古籍出版两种出版资源的数字化,各自存在明显的问题。就商业出版而言,其数字化领域迄今仍处于各自为阵的发展阶段,突破性的融合还有待观察。这是因为阅读行为本身偏于私密,各家阅读软件的阅读体验感也不尽相同,因此均有其各自的利基市场。如2015年上线的微信读书,主打“阅读+社交”,口号是“让阅读不再孤独”,其阅读评论设计能够让一本书中的一句话推动数百人互动评论,有效地积累了数字化的出版资源,人们不仅因为图书本身产生阅读行为,而且因评论区中的观点交流而深化阅读体验。相比之下,网易蜗牛阅读则将评论(批注)与问答(提问)分开,突出专业问答体验,使阅读从社交走向知识生产与传播。不同的阅读软件满足不同阅读群体的偏好,均有自己的忠实用户群,在基层逻辑上很难实现统一。就古籍出版而言,其数字化领域面临的最大问题是资金不足。中华古籍卷帙浩繁,尽管早在20世纪80年代,全国图书馆文献缩微复制中心就开始带动各地公共图书馆进行古籍善本的缩微胶片翻拍制作工作,但工作开展至今,缩微胶片能突破的古籍传播困境依旧杯水车薪。此外,目前各大图书馆开展的古籍数字化工程存在标准不一、数据库形态(如分类标签、检索体系等)不一等问题,很难自动与中华文化数据库相关联,呈现割裂趋势。

在基础层上,出版资源的数字化是一个宏观难题。一方面,知识是社会之公器,它不应该被定价和买卖。另一方面,出版资源数字化工程的前期投入和用户体验要求极高,依靠公共部门难以完成。就此而言,以政府投入为主,倡导知识分子广泛参与,借助民间商业力量的中国传统出版格局值得借鉴。盛世修典是中华文治传统的重要体现,大型文化资源的汇编与出版,乃王者所以树风声,流显号,美教政,移风俗[4],历代史书均有经籍志或艺文志加以记载,如明代的《永乐大典》、清代的《古今图书集成》和《四库全书》等,都可视为中华文化数据库的前身,其以官方主导,而其过程主要依靠知识分子。当代中华文化数据库的建构,可以广泛发动网民(用户)参与,在提高入库标准的同时,以互联网思维鼓励多、散、杂、匿的互联网用户投入监督和建议中,或能在一定程度上避免商业出版的“知网难题”和公共出版的“古籍难题”。尽管中华文化数据库基础层的打通主要靠技术推动,但如果没有积极主动的参与者,特别是没有足够彰显官方、学界(包括出版界)和大众的三方互动关系,是很难实现的。

二、逻辑:出版信息检索的文化性与体系性

数据库的建立需要对汇聚的信息进行富有逻辑性的整合,使其易于检索。广罗群籍之后,更重要的是分门别类,才能统为一书。如果说在基础层上,中华文化数据库主要体现的是数据性,那么逻辑层体现的是中华文化数据库的文化性。不同的文化对信息汇编有着不同的认知,从而可能导致不同文化体系的形成。

作为数据库前身的文献信息汇编,在中国曾发生两次巨大转型。一次在乾隆年间,以《四库全书》为代表,汇编原文的全书传统取代了由三国《皇览》开启的类书传统。后者是以类相从的编撰形式,分“天地”“人事”“万物”等篇章,再设不同子目,如《艺文类聚》“人部”下就有“圣”“贤”等子目。乾隆皇帝下诏编修的《四库全书》则网罗天下所有古今载籍的全书,它不分类目,而要“悉载全文,使阅者沿流溯源,一一征其来处”[5],此即论者所言:“当时实为类书时代告终之期,而进于求读原书之新时代。”[6]二是在宣统年间,以《普通百科新大词典》为代表,分条列叙的百科传统进入中国,目的是便于“教员考检、学子自修”[7]。这一演进标志着文化体系的转型,也体现了中西文化交流的成效。有论者指出:“如果说中国传统文化的知识结构是类书型的,那么中国近代文化的知识体系已经转向了百科全书型。”[8]

从类书到百科全书,区别是显著的。类书是分门别类汇集前人著作,百科全书则是把各种知识、事物、人物原原本本地加以叙述,用条目形式编成一篇一篇的文章,特别是把最新的知识作系统的、全面的介绍[9]。而就中华文化数据库的建构来说,类书、全书与百科三者的结合不只是技术性的信息科学,更需要体现中华文明对文化信息和文献汇编的深刻把握,尤其在体例、体系和检索上要突出中华特质,使其逻辑架构具有充分的中华文化性。

不同的文化对知识体系的理解是迥异的。福柯在《词与物》的前言中提及博尔赫斯对“某种中国百科全书”中出现的动物进行分類,曾引发知识界的广泛讨论,很多人认为福柯过分强调了中国文化的特殊性以及中西文化之间的差异性。而有研究者从博尔赫斯的原文考究中发现,作者的原意是“当我们用语言整理世界时,即把文化强加于自然之上时,不论采用什么分类法,都只可能是混乱的”“这是各民族文化的普遍遭遇”,博尔赫斯的论述“正是这种混乱的颂歌”[10]。无论是福柯还是博尔赫斯,思想家总是有其超越时代的判断,但落实到具体的文献汇编中,其信息架构的逻辑必然呈现某种文化性。可见,中华文化数据库在建构过程中应充分吸收我国传统出版业的思想和制度性遗产。

当知识被转化为二进制的代码,数据库的体系性即被隐藏在算法之后。多数数据库文献检索的架构指标无非相关度、发表时间、被引、下载、综合5个维度,工具性强而文化性弱。在互联网信息检索上,百度竞价排名更是一度传为“恶法”,显现了商业性对文化性的侵蚀。中华文化数据库的逻辑架构应力避商业性,同时也不应只具备单纯的工具性,而要在尽可能体现中华文明文化观、价值观的同时,借鉴互联网思维,发挥知识公器价值,突出社交属性、圈层传播,倡导知识社群在数据库中自我繁衍。中华文化数据库可以尝试配套知识社区,将知乎、得道等成熟的知识生产和传播模式纳入其中,以具有公信力和正确价值取向的算法,保证数据库的使用不只是小群体的偏好,这是其在智能互联时代对学者发出“只有使用才能实现古籍文献保存的意义”呼唤的根本性回应[11]。

三、传播:出版文化消费的场景性与体验性

从表面上看,数据库的建构是为了更好地实现文献信息的留存和传播,而其实质是要实现文献信息的利用。在大数据、云计算和区块链等互联网技术从底层逻辑上改变文献信息存在形态的今天,以深度学习—算法推送为进路的知识传播,要求“只有使用”才能不断优化数据库的运行,实现更新迭代。“只有使用”不应局限于知识人群体,中华文化数据库的建构更要着眼于消费场景的创新,特别是增强中华优秀传统文化在当代年轻人生活中的存在感。

目前,由国家图书馆制作的中华古籍资源库,已经可以实现免登录阅览10万部件;中国数字文化集团已经建成国家舞台艺术影像库、中国传统音乐数据库、非物质文化遗产数据库等多个数据库。这些数据库如何在新的文化消费场景中作为信息传播的提供方,以多种形态的相互交织催生新的文化创意、内容叙事,进一步丰富人民群众的日常生活,赋能文化创新,提升国家文化软实力,是中华文化数据库在关联形成过程中要思考的重要问题。

在内容上,不同文化领域已建或在建数字化工程和数据库,在统筹利用的关联过程中,需要高度注重算法问题。再庞大的数据库在使用的过程中也往往是聚焦于个体的。有国家工程背书的中华文化数据库建构,最终也需要贴近用户本身,互联网技术发展的前景就是为用户个人打造一个智慧型和个性化的网络[12]。知识生产与传播的算法推送不同于信息市场的商业策略,其目的绝不是为了卖出广告,也不是为了纯粹的社交(形成圈层)本身,而是激发阅读行为,进而促成文化创新。对此,重要的是对商业算法的反向应用,避免基于浏览记录的简单算法使用户停留在自己的认知舒适圈,应有意迫使其打破成见,产生思考,形成新的知识生产[13]。

在形式上,中华文化数据库的使用应该突破屏幕,在跨屏传播的基础上进一步嵌入人们的日常生活,使“文化数据”无处不在。如借助穿戴式设备,让国家图书馆出版社的中华古籍图典数据库、湖南大学的书院文化数据库立体起来,让中国人民大学出版社的中国思想与文化名家数据库或学者个人制作的“唐宋文学编年地图”“唐代边塞诗文化挖掘研究数据集”等内容“活起来”。事实上,设备更新是文化发展的常态,如15世纪眼镜的出现,“印刷术发明,书籍相对普及之后,眼镜的需求增加”“更多、更好的眼镜可能使得更多读者得以变成更好的读者,买更多的书籍,而为此缘故,眼镜和知识分子、图书馆员、学者關系密切”[14]。把可穿戴设备视为眼镜的重构,无疑是中华文化数据库得以更好地融入群众生活,展示文献信息传布的新前景,这需要信息科学、认知神经科学的持续助力。

在行为上,中华文化数据库的使用应催生出更丰富、更具有沉浸式体验感的文化生活。传统出版激发的主要是阅读行为,它调动的人的感官只有视觉。而进入数据库时代的图书出版,不但融入了“有声书”“气味阅读”“触觉阅读”,还使文化内容叙事化、叙事IP化。如上海交通大学建立的中华文化内容IP数据库,通过举办“当国宝遇见国漫”的公益活动,把传统文化资源与影视、动漫、游戏、直播等数字文化相结合,获得了热烈反响。

四、前景:构建一种融通古今的中华数字文明

文化数字化的核心在于信息的留存与传播。究其质而言,中华文化数字化与古代出版高度赞许的“刊布古书”是一致的。张之洞在《劝刻书说》中说道:“凡有力好事之人,若自揣德业学问,不足过人,而欲求不朽者,莫如刊布古书一法。”[15]这在古代是激发民间广泛参与图书编校出版的重要缘由,正是有“欲求不朽”的冲动,典籍的流传才能成为现实。而进入数字化时代,传统出版业融入数字文明,需要有一种新的理论作为支撑,使中华数字文明更为深刻且具有引领性。

在言及数字文明时,研究者会把目光聚焦在传播界。在传统媒体时代,我们把这种理性交往的语境或者实践交给职业新闻人,即传播者。而进入数字文明时代,当整个社会都变得可编程的时候,编辑作为把关人的缺失,导致一种新的生活形态在崛起初期伴随着非理性(如网络暴力)与混乱(如网络谣言)。面对这一局面,单靠知识界的启蒙作用将无力扭转大局。而借鉴传统出版业,特别是中国出版在历史上形成的官方(政府)、书院(学界)、坊间(商界)三足鼎立的传统模式,以中华文化数据库的建构为核心,将能够形成一种新的数字文化形态。在这一形态中,传统出版格局需要被互联网中的用户打破,形成政府、学界、商界、公众四维形态,四种形态之间有足够的制衡机制,构成一种融通古今的数字文明。

在传统社会,文字普及率不高,公众参与度低,被学界代言的可能性高。而在当下,知识传播需要知识人(学界)对社会进程,尤其是数字文明进程的广泛参与来实现。就此而言,数字文明的形态也许不再以知识生产本身为核心,而是以公众的日常生活为核心。官方参与可以保证文化或文明传承的稳定性,学界参与可以保证其自反性和先锋性,商界则可以不断促发技术的优化,以满足公众的体验感。这固然是一种理想的数字文明形态,也是出版业转型所背负的传统遗产在未来可能实现的愿景。

|参考文献|

[1]罗伯特·达恩顿. 阅读的未来[M]. 熊祥,译. 北京:中信出版社,2011.

[2]陈红顺,黄秋颖,周鹏. 数据库系统原理与实践[M]. 北京:中国铁道出版社,2018.

[3]王一川. 语言乌托邦:20世纪西方语言论美学探究[M]. 昆明:云南人民出版社,1999.

[4]魏征. 隋书[M]. 北京:中华书局,1973.

[5]袁咏秋,曾季光. 中国历代图书著录文选[M]. 北京:北京大学出版社,1997.

[6]郑鹤声,郑鹤春. 中国文献学概要[M]. 上海:上海古籍出版社,2001.

[7]钟少华. 进取集:钟少华文存[M]. 北京:中国国际广播出版社,1998.

[8]于翠玲. 传统媒介与典籍文化[M]. 北京:中国传媒大学出版社,2006.

[9]姜椿芳. 从类书到百科全书[M]. 北京:中国书籍出版社,1990.

[10]车槿山. 福柯《词与物》中的“中国百科全书”[J]. 文艺理论研究,2012(1):24-27+127.

[11]蒋寅. 古籍保护与学术研究[N]. 光明日报,2018-09-03.

[12]伊莱·帕里泽. 过滤泡:互联网对我们的隐秘操纵[M]. 方师师,杨媛,译. 北京:中国人民大学出版社,2020.

[13]林玮. “算法一代”的诞生:美育复兴的媒介前提[J]. 教育研究,2021(7):81-93.

[14]阿尔维托·曼古埃尔. 阅读史[M]. 吴昌杰,译. 北京:商务印书馆,2002.

[15]张之洞,范希曾. 书目答问补正[M]. 上海:上海古籍出版社,1983.

猜你喜欢

出版业古籍中华文化
让中华文化在海外华裔青少年心中“留根”
中医古籍“疒”部俗字考辨举隅
关于版本学的问答——《古籍善本》修订重版说明
以按需出版为抓手,推动出版业数字化转型
汉字对中华文化的影响
关于古籍保护人才培养的若干思考
我是古籍修复师
AR与VR技术在儿童出版业中的应用
对出版业供给侧改革的思考
南宋出版业考述