APP下载

数字记忆建构:缘起、理论与方法

2020-12-24周耀林

山东社会科学 2020年8期
关键词:建构记忆数字

周耀林 刘 晗

(武汉大学 信息管理学院、信息资源研究中心,湖北 武汉 430072)

记忆是一个古老而常新的话题。人类正是因为有了记忆,历史才得以承载,文化遗产才得以留传。从古希腊先哲们将记忆纳入视域,到数字时代人们对全新记忆形态的探求,关于记忆问题的论述方兴未艾,历久而弥新。从历史来看,不同学科从各自认知的视野为记忆的研究提供给养,不断地丰富着关于记忆问题的基本探讨。生理学认为,记忆是大脑活动的机能。心理学认为,记忆是个体对过去经验的保持与再现。信息加工理论认为记忆是信息加工的副产品。社会学则将记忆从个体拓展到集体研究的范畴,在此基础上又进一步延展出社会记忆、历史记忆、文化记忆、媒介记忆、档案记忆等多学科的学术话语。档案记忆的产生受到现代哲学建构论的深远影响,现代的建构论与传统的档案论作为两种广义上的哲学观,影响着对记忆的根本认识。(1)参见Sven Bernecker, Kourken Michaelian, The Routledge Hand-book of Philosophy of Memory, London: Routledge,2017, p.51.传统档案论认为,记忆的存储与再现功能是基于原始或保真之上的复制和重复;而建构论强调的是,记忆本质上是一个动态的重建过程,其在回忆时构造出基于个性化适应的“精准”表征,正是一种超越了被动性的主动记忆。建构论影响之下的档案学科发生范式转换,形成了档案记忆这一新的研究范式——记忆是建构的,档案人员也是选择性地在建构记忆(2)参见Terry Cook, “Evidence, memory, identity, and community: four shifting archival paradigms”, in Archival Science (2013)13, pp. 95-120.,在此基础上产生的“数字记忆”也就具有了建构的基本特征。对记忆属性的多学科探寻,为记忆的研究奠定了基本的学理性基础,记忆建构的本质属性成为本文立论的基础。在数字化时代,计算与人文学科的深度融合形成“数字人文”这一跨学科领域,全面激发着人文研究的进展,与数字身体相伴而生的“数字记忆”变革着人类的记忆方式,与数字人文领域第四层次的“人文领域的创新性破坏和建设”(3)朱本军、聂华:《跨界与融合:全球视野下的数字人文——首届北京大学“数字人文论坛”会议综述》,《大学图书馆学报》2016年第5期。有着诸多相通之处。在数字人文的发展视域之下,如何借助记忆研究深厚的多学科学术资源,系统地梳理数字记忆产生及其建构的历史,厘清其理论发展脉络,探讨总结其实践方法,是数字记忆发展的迫切理论诉求。

一、数字记忆建构缘起

关于数字记忆的概念尚未形成统一明确的定义,但在以下几个方面形成共识:其一,强调对“数字技术”的应用,包括从数据的采集、存储、加工到记忆的呈现与传播整个过程中所采用的一系列技术手段;其二,强调对记忆资源的开发与利用,如“对承载记忆属性的资源进行开发利用”(4)牛力、曾静怡、刘丁君:《数字记忆视角下档案创新开发利用“PDU”模型探析》,《档案学通讯》2019年第1期。、“提供事实、关联、依据和理性”(5)冯惠玲:《档案记忆观、资源观与“中国记忆”数字资源建设》,《档案学通讯》2012年第3期。、“可保存、可关联、可再组、可共享”(6)加小双:《国内外记忆实践的发展现状及趋势研究》,《图书情报知识》2019年第1期。、“全要素与‘全息’数字化”(7)周文泓、苏依纹、代林序等:《进展与展望:面向数字记忆资源建设的网络信息存档》,《图书馆论坛》2020年第2期。等;其三,面向记忆的建构与文化的传承,如“捕获、记录、保存、重现社会记忆”“实现对文化的保护和传承”(8)加小双:《数字记忆视域下非物质文化遗产的保护与传承研究》,《山西档案》2019年第5期。等。基于以上认识,从历史认知和现实需求的角度梳理数字记忆产生的线索,可以看出数字记忆从产生初始就呈现出其显在的建构特征。

(一)逻辑起点:两种认知,深层变革

记忆产生于人类的实践活动。社会记忆理论的代表作《社会如何记忆》(HowSocietiesRemember)阐述了与人类记忆相关的两种实践形式:“体化实践”(Incorporating)和“刻写实践”(Inscribing)(9)参见丁华东:《档案记忆研究的思想资源发掘》,《档案学研究》2013 年第5期。。二者概括了人类记忆积累的不同信息传播方式。其中,体化实践是指依赖人的身体举动,如声音、动作、姿势等来传递信息的一种亲身传播活动,由此而产生的记忆是一种依托身体而存在的记忆;刻写实践则摆脱了对身体的束缚,是因为人类发明出一套表意的符号系统,以刻写化的形式来保存和传递信息。这一套符号系统经历了漫长的演变,从上古时期的“结绳刻契”到书写文字的产生,带来了人类记忆力的不断发展,使得人类的思想、行为得以全面系统地记录、保存,并存储于图书馆、档案馆、博物馆等社会记忆机构中。此后,电子计算机的诞生,以及以计算机为核心的信息技术、互联网技术的发展促成了刻写实践向数字化发展的变革,将数字技术应用于记忆实践中,产生了大量形式多样的原生数字资源内容,如数字文本、数字图片、三维模型、VR全景影像等,而原有的实体或模拟形态的记忆资源也能被轻易地转化为数字内容,实现长期保存、灵活开发和永续利用,这种记忆方式的调整和变化使得记忆资源逐渐信息化和数据化。这一变化反映在观念层面上使现代的纸质文件观逐步过渡到后现代的电子文件观,并引起了个人以及社会对于如何创建和储存记忆的认知变革。这些历史性变化不仅使人类记忆在量上极度扩张,而且促进了更大范围内的记忆的共享与传播。

记忆观念的进化不仅表现为对记忆方式的认知变革,还体现为对记忆类型的思维拓展。在社会学研究之前,记忆概念主要呈现在个体研究的层面,社会学为记忆的研究提供了社会认知的框架,将记忆分成了个人的记忆和社会的记忆,并且进一步指出,人们其实很难区分,甚至不可能真正区分这两种类型的记忆,因为个人的记忆总是依存于一定的社会环境,纯粹的个人记忆可能只是一种极其少见的自说自话。记忆研究所发生的从个体向集体视角的转换、从生理—心理向社会—文化范畴的历史转向,与建构主义哲学观的确立紧密相连。在社会文化的框架之下,记忆的建构属性被普遍认可,《社会记忆:历史、回忆、传承》(DassozialeGedächtnis:Geschichte,Erinnerung,Tradierung)概括性地用“记忆能量”的思想论述了社会记忆的建构作用,揭示了其组成要素和形成过程。在数字化生存的时代,记忆的共享与传播使得个人与集体的联系更为紧密,个人当下的数字体验总是凝结着同一时期社会共同的记忆,渗透着现代信息技术与社会记忆建构的有机结合。从后保管范式的视角出发,记忆机构需要从宏观的视角挑选出反映形成者的最精炼文件永久保存(10)参见徐拥军:《档案记忆观的理论与实践》,中国人民大学出版社2017年版,第41页。,这意味着,数字记忆既要以其巨大的数据体量和更为精确的现场还原度增强记忆的真实性,又要通过某些关键记忆要素的提取印证与重构历史,在虚拟的数据世界中创建信息的关联,唤起记忆主体的情绪、想象与认知,由此形成的社会记忆不是个体记忆的简单相加,而具有整体大于局部之和的效果。

从记忆方式到记忆类型的思维变革,为数字记忆的产生及其建构性奠定了逻辑的起点,赋予了数字记忆的“可加工”范畴。而当现实中以“记忆”之名的各类文化保护运动真正进入数字时代,无论是互联网上的各种原生的数字资源,还是各类实物或模拟资源的数字化迁移实践,都不可避免地卷入社会记忆的建构和演变之中,催生了全球范围内多领域、跨学科、深融合的数字记忆项目的探索性成果。

(二)现实起点:两种资源,多元主题

20世纪90年代以来,各种记忆项目的实践伴随“记忆浪潮”席卷而来,而数字技术的日益成熟则为记忆的建构提供了新的样式,从而使得各种实践活动逐渐呈现出向“数字记忆”发展的趋向。值得一提的是,数字记忆的概念导出主要源于各类实体记忆资源的建构与数字化迁移实践(11)参见周文泓、代林序、杨梓钒、张玉洁、陈怡:《基于数字记忆保存的网络信息存档实践进展研究及启示》,《情报理论与实践》2020年第1期。,事实上以网络原生数字资源为对象的互联网信息保存项目也呈现出面向记忆建构的价值取向。

为了应对现代社会文化遗产的流失和记忆缺失的危机,联合国教科文组织于1992年发起“世界记忆工程”,由此开启了各国社会记忆项目的建设浪潮,世界各国纷纷成立“记忆工程”委员会,组建专业学术团体、协会或社会机构等,开展旨在针对文献遗产保护的记忆工程项目;2003年《保存数字遗产宪章》(CharteronthePreservationofDigitalHeritage)发布,正式将数字遗产纳入保护范围,明确了其构成范围包括原生数字形态或数字化转换而成的两种遗产形态。此后,联合国教科文组织进一步加强了对数字时代文化遗产和世界记忆的保护,推动了记忆实践的数字化转型。美国西蒙斯学院建立的“全球记忆网”(Global Memory Net)显示,目前已有80多个国家的超过2400个数字记忆项目在网上呈现。这些数字记忆项目主题极为丰富,囊括类型多样,有国家记忆如中国记忆、荷兰记忆、新加坡记忆等,城市记忆如上海记忆、纽约市皇后区记忆等,社群记忆如中国江西的知青记忆、澳大利亚土著社群记忆,事件记忆如中国奥运博物馆、“911”数字档案馆,乡村记忆如中国台州古村落数字记忆,等等。它们的共同特征是基于现实实体资源建构,其中很大一部分是史料资源,对于缺少史料资源的记忆对象,记忆项目便会利用各种信息化技术将实体的空间资源直接转化为数字化信息进行固化和释放,如将建筑、街区、文物等空间资源通过三维建模、地理信息可视化、VR全景、球幕光源采集系统等技术手段予以呈现。总体来说,这一类型记忆项目的建构过程,首先是对记忆对象的发展脉络、文化性质、结构特征等进行深入解读,对记忆资源进行多维度拓展和关联,在此基础上通过本体建构建立元数据集,整合各种史料资源和空间资源,采取标准化的数字化加工流程,实现记忆的长期保存与获取。

相比于实体资源的数字记忆项目,针对网络原生数字资源的记忆建构似乎显得姗姗来迟,在规模和实践进展上也有着一定差距,但事实上数字时代更需要“原生数字资源的注入不断修正数字时代的记忆构成”(12)牛力、刘慧琳、曾静怡、韩小汀:《数字时代档案资源开发利用的重新审视》,《档案学研究》2019年第5期。。随着2013年英国“国家数字记忆”工程、2019年中国“国家数字记忆计划”这一类互联网信息保存项目的启动,网络原生数字资源面向记忆建构的需求开始显现。这一类型的项目虽然不都冠以“记忆”之名,但却具有“社会书写记忆”的特征,因为数字化生存将人类世界深深地卷入网络之中,对网络原生数字资源的保存、保护和开发就与记忆的保护及数字遗产的传承紧密联系起来,这在互联网信息保存项目中其实早已显现端倪。与互联网信息保存相关的项目大约有100多个,相对系统或具有代表性的项目有10多个,涉及北美、澳洲、欧洲、亚洲等不同地区,其中较有影响力的有美国互联网档案馆“Archive-It”项目、澳大利亚国家图书馆“PANDORA”项目、欧盟网络存档“EU WA”项目、瑞典国家图书馆“Kulturarw3”项目、中国国家图书馆“WICP”项目、日本国立国会图书馆“WARP”项目等,它们相对成熟且各具特色的实践经验,推动并逐渐建立起通用的互联网信息保存机制。这些项目丰富多元且具有鲜明的记忆取向:从项目承担的主体来看,以传统的记忆资源保存机构为主导,如图书馆主要保存反映国家政治、经济、文化等各方面的互联网信息,档案馆则倾向于负责政府网络信息的收集与保存,公共机构或非营利性组织则专注于社群或个人数字记忆的保存;从项目建设的对象来看,分别有面向国家、机构、社群、个人等不同层级的数字记忆类型;从资源保存的内容来看,其涵盖范围广泛,全面反映具有社会记忆和传承价值的日常生活各个领域;从信息捕捉范围和频次来看有着明确的记忆目标,如“Kulturarw3”项目全面收录了“.se”域名的网站,“EU WA”每年4次自动捕获“europa.eu”域及其子域上的欧盟机构网站;从项目开展的方法与技术来看,注重与记忆需求的关联,采取机器与人工相结合的方式识别并分类汇集资源,建立集成仿真框架实现互联网信息的保真重现,促发用户的记忆需求,传承网络数字遗产。

二、数字记忆建构的基本理论

数字记忆建构的基本理论首先需要探讨数字记忆产生及其建构的实质,在明确其价值取向的建构理路的基础上,梳理数字记忆建构的基本观念,并进一步探讨数字时代记忆与遗忘的深层关系。

(一)数字身体、交往与记忆构成

“记忆的构成”从静态意义上来看,主要包括“主体、客体与中介”,即谁、回忆什么以及如何回忆,这种构成在历史进化的动态过程中不断被重塑。从记忆的主体而言,书写时代的刻写实践使得记忆脱离主体的身体而存在,在数字时代身体却依托技术而重获“身体在场”,以“数字身体”存在于记忆空间。这种存在主义视角的解读,将个人数字痕迹的集合看作主体在虚拟空间的另一个身体。它依据着“图像化身”如头像、自拍、视频、表情符号等传递身份和信息。这样一种崭新的在场传播方式,必然改变着人对自身、他者与世界关系的理解,孕育着新的交往方式与行动可能,从而影响着人们记忆的内容。社会学家莫里斯·哈布瓦赫(Maurice Halbwachs, 1877—1945)论证了记忆的内容与交往中的语言、行为及情感的紧密联系,文化学家扬·阿斯曼(Jan Assmann, 1938—)则进一步提出“交往记忆”的概念,明确其所具有的社会维度和情感维度。在新的社会语境下,当我们的数字身体徜徉于各式各样的网页和各种交互式的社交媒体之中,探究于各种类型的数据库之间,沉浸于在线游戏场景之中,主体的交往实践与情感沟通的途径被极大地拓展了,使得数字记忆的边界越来越广,数字保存的界限也就越来越模糊,传统的记忆保存方法由此而受到挑战。而从数字记忆的形态来看,记忆被外化为一种与书写时代全然不同的数据形式,数据的汇集需要更加智能、更加高效的管理,而数据所提供的也不仅仅是记忆的原材料,更是人们形成自我与认知的历史痕迹。正如我们通过网络搜索而获取信息,这种主动获取行为本身就暗含了人们行动的动机与情感的偏好,以及对自我意识的探寻,凡此种种都会构成我们的记忆。从这个意义上来说,数字记忆实际上是人类数字化生存的历史“印痕”(13)“印痕”一词借用了Sheena Josselyn等人的文章“Heroes of the Engram”中Engram的翻译。,是一种被数据化的记忆。这也同样适用于将现实世界的记忆资源迁移到网络中的数字化实践,因为数字化迁移既通过数字逻辑改造了现实资源而满足于数字身体的需要,又进一步强化了这种数字生存方式的体验性。

上述认知形成了我们对于数字记忆的基本描述:数字记忆基于人类数字化生存而产生,由其所形成的“数据化”印痕而构成,它以数据的形式极大地拓展了记忆的空间和容量,并通过数字技术的处理在各种记忆元素之间建立关联与联想,使得记忆的内容“丰富又活泼”。数字记忆的建构就是要通过对数据的合理选择、标准化编码和深入挖掘,将分散的信息智能关联,形成可视化的知识图谱,如同建立活的神经网络一般将记忆全面激活,再以自动化的检索手段满足各种记忆信息有效提取的需求,由此建构形成的数字记忆既显示出对纵横交错的记忆元素的联通与主题提炼,又能帮助我们确定如何作为个体、群体、公民,实现多元的文化认同,保护并传承人类的数字文明。

(二)数字记忆的建构理路

根据亨利·柏格森(Henri Bergson,1859—1941)关于记忆的分析源于对“记忆什么、如何记忆以及记忆的动力”(14)闫宏秀:《数字时代的记忆构成》,《自然辩证法研究》2018年第4期。等问题的研究,以及记忆的建构要有“普惠意义”(15)杨文:《数字人文视阈下的社会记忆构建研究》,《情报资料工作》2019年第5期。的观点,从数字记忆发展的脉络中,大致可以梳理出以下三种具有普惠价值的数字记忆建构观。

1.面向数字遗产的记忆建构观。遗产保护的观念源于法国大革命时期对重要文化遗产的保护。(16)参见周耀林:《档案保护论纲》,《求索》2018年第5期。此后,随着世界性的文化遗产和自然遗产受到自然因素和人为因素的影响,面临日趋危重的损毁的可能,遗产保护的紧迫性和重要性逐渐被提上日程,并在20世纪的后半叶掀起了遗产保护的“记忆浪潮”。这股浪潮的兴起需要强有力的规约与制度的支撑论证,而由其阐发生成的行动计划也就成为引导这股世界性潮流的推动力。1972年《世界文化和自然遗产保护公约》(ConventionConcerningtheProtectionoftheWorldCulturalandNaturalHeritage)、1976年《世界遗产名录》(WorldHeritageList)、1992年“世界记忆工程”(WorldMemoryProject)、2003年《保存数字遗产宪章》和《保护非物质文化遗产公约》(ConventionfortheSafeguardingoftheIntangibleCulturalHeritage)、2012年《温哥华宣言——数字时代的世界记忆工程:数字化与保存》(VancouverDeclaration-TheMemoryoftheWorldintheDigitalAge:DigitizationandPreservation)等,较为清晰地勾勒出文化遗产保护的演进脉络:从对历史遗产的保护到对濒危遗产、文献遗产的珍视,从对物质文化遗产的重视到对非物质文化遗产、数字遗产的正视,在这一系列具有世界影响的遗产保护框架之下,遗产保护与记忆传承的重要性不断被强调,而数字遗产也就成为数字记忆建构的重要面向。

文化遗产是“一个开放的概念”,基于此产生的“数字遗产”(Digital Heritage)概念,是指基于计算机而产生的数字形态的遗产,既包括原始的数字资源,也包括其他形式的遗产经过数字化转换而形成的资源。数字遗产保护的目的,就是要保存人类生存的数字记忆,强调文化传承的功能与价值,实现文明的延续。对于原生性的数字遗产而言,其数据庞大,包括电子文档、数据库、静止图片、活动影像、声音、图表、软件和网页等,由于数字文件格式、存储介质和计算机系统的不断更新造成对数据有效时间的制约,危及数字遗产在未来的可读性和完整性,需要有意识地建构记忆将其保存。对于实体的或模拟形态的遗产资源而言,包括文献、文物、遗迹等物质文化遗产或音乐、民俗、技艺等非物质文化遗产,一方面是实体的记忆载体不断遭到破坏,另一方面是缺乏“共识符号系统载荷”的非物质文化遗产记忆逐渐濒临消亡,亟待通过数字化的方式进行修复和还原,既能降低记忆实践开展的门槛,又便于形成多元协同的开发、传播和利用格局。系统分析数字遗产及其保护的发展脉络可以发现,数字记忆在各个文化遗产领域得到了广泛的应用,有以中国浙江台州古村落数字记忆、“开放文化遗产”(Open Heritage)为代表的物质文化遗产记忆实践,有以北京童谣、记忆四川、匈牙利民间舞蹈为代表的非物质文化遗产记忆实践,有以台湾数位典藏计划、威尼斯时光机(Venice Time Machine)等为代表的可移动文化遗产记忆实践,以及以“中国国家记忆”“Archive-It”项目为代表的互联网遗产记忆实践等。

2.面向数字知识的记忆建构观。与20世纪后半叶以来的“记忆浪潮”相提并论的是知识经济的到来以及由此而展开的新一轮对知识的研究和描绘,这种描绘将人类社会对信息资源的关注转向对知识资源的关注,并引发了对知识管理、知识服务等核心思想的研究。在知识管理思维的驱动下,各种社会记忆机构纷纷转变思维,从以往的实体保管转向对知识的提供和服务,社会记忆建构的研究也从原来狭义的视角转向更为宏观的视野,并形成了一套针对电子文件管理的“后保管模式”,这是一种“以来源和知识为中心的管理”(17)冯惠玲:《电子文件时代新思维——〈拥有新记忆——电子文件管理研究〉摘要之六》,《档案学通讯》1998年第6期。,意味着电子文件时代对信息的管理应转向到对知识的探求、生发与传递,从建立数据库转向建立知识库,从而将用户从巨量庞杂的数据中解放出来,使其更有裨益于对知识乃至智慧的发现。因此,数字记忆的建构应该利用数字化的知识管理工具与方法,如元数据管理、智能搜索、数据挖掘、知识仓库、知识地图等,挖掘记忆资源中最为“基本、稳定、深层”的要素,不仅为记忆的取用者提供数据和信息,更能创建理解信息的语境,明晰信息之间的各种关联要素,帮助人们获得知识与理性,以数字知识的形式浸入时代的社会记忆中。

事实上,数字时代的记忆建构,无论是传统实体资源的数字化转化,还是网络原生数字资源的保存开发,都强调了知识传播的重要功能,将其作为支持学术研究、辅助教育教学和生成其他形式知识的重要信息来源。“美国记忆”(American Memory)通过记录着大量美国数字化历史文献的同名网站,将这些载有美国历史及其创造力的数字记录,作为“教育和终身学习的资源”服务公众,履行“维持、保存知识和创造力的使命”;在2010年启动的对社交网络原生数字资源的保存计划中,美国国会图书馆也使用了类似的表述——“获取并保存国会和美国人民的知识与创造力的记录”,它通过收集Twitter中的主题性推文和事件性推文,向未来展示这一历史时期以及当前信息流动的趋势,帮助研究者界定与把握当代社会的各种变迁,这与美国互联网档案馆的格言“普及所有知识”相比更具有针对性。在我国,记忆资源也与数字文创、知识服务相结合,如“记忆四川非遗主题”将四川省的非物质文化遗产通过文化创意、思维创新和科技提炼,进行数字化和多媒体化的处理,将其转化为具有知识产权的文化创意产品而服务大众。

3.面向数字人文的记忆建构观。作为人文计算概念的升级,“数字人文”于2001年被正式提出,成为一种遍及全球且“超越历史、跨越媒介”的知识生产与集呈的新方式。通过与文件档案管理等领域的跨界融合(18)参见加小双:《档案学与数字人文:档案观的脱节与共生》,《图书馆论坛》2019年第5期。,数字人文逐步向超文本、图像、照片、网页、视频、音乐、地图、推文、博客以及融入了虚拟现实或三维模型的多媒体产品等对象拓展,展开了对记忆资源的数字保存、文本编码、数据聚合、知识挖掘、信息可视化等方面的应用,创造性地开拓了人类记忆的能力与范畴,拓展了文化遗产的可视性与知识创新的潜能。“建构”意味着在批判与反思基础上的超越。这些融合了档案管理方法的数字人文项目具有数字记忆建构的性质,以一种前所未有的程式,将不同来源或类型的数字化资源以及原生数字资源,汇集成记忆的素材,通过聚类整合与深度挖掘的智能化处理方式,创造出资源更加富集、知识持续创新、分享不断扩大、艺术体验增强、场景趋于真实的记忆场所,既革新了人类遗产保护与传承的方法,又创建了文化知识传播与创新的路径。面向数字人文的记忆建构所激发出的这一系列创造性成果正是对“人文领域的创新性破坏和建设”,其创造性体现了人类发展的本质和内在要求。

以欧洲“时光机项目”(Time Machine Project)为例,它是数字人文领域极具有代表性的范例,不仅是世界文化遗产保护的重要成果,又是面向公众开放的互动性强、细节性高的历史教育工具,从其理论架构、方法设计到实际产出都可窥见一斑。它的基本构想是对欧洲数百万的历史文献、画作和古籍进行数字化,从最初对威尼斯历史的复原,扩展到对阿姆斯特丹、巴黎、安特卫普和布达佩斯等欧洲其他城市的历史资源的数字化,并通过数据分析形成信息网络,再以此为基础进行三维建模还原真实的历史场景,以数字多媒体形式呈现。在方法设计上,通过时空大数据构建跨越数千年的欧洲城市历史地图,建立与过去信息的可达性,改变人类感知世界、历史和文化的方式,在设计执行过程中融合多学科的知识构建,包括计算机专家对于大数据计算的技术、历史学家对于手稿解释的知识、档案管理员对于文档处理的经验。其成果应用也播散到多个领域,所形成的全面而直观的历史素材,包括贸易金融的资料、社会关系的图谱、建筑构造的样本、卫生疾病的记录等,不仅为历史学家所用,也为社会学家、经济学家、建筑学家、医学家的研究提供了数据支持。例如,瘟疫时期城市居民的死亡记录能为流行病专家提供历史经验数据,对于不断被流行病如黑死病、禽流感、SARS、COVID-19所袭击的人类生存来说意义不可小觑。

(三)删除:数字记忆的选择机制

遗忘与记忆一样,也是人类的基本天性,是一种常态。它原本与记忆相伴随,可以看作记忆的另一种形态。社会性的遗忘包括主体选择的遗忘和由于材料、生物和技术等客观原因所带来的被动的遗忘,前者是由于主体在社会记忆的建构过程中出于对数据的选择和鉴定而主动开启“遗忘”机制,后者则由于记录载体和技术等原因而导致自然的忘却。在数字时代,一方面数据遗失损毁的自然风险依然存在,另一方面数据被修复、复制甚至永久保存的技术可能性却大大提升,因为即使数据的存储有一定的期限,但通过多重备份或技术升级也能将其寿命无限延长,这种状况将逐渐打破记忆与遗忘之间原有的平衡,遗忘最终可能成为“例外”(19)[英]维克托·舍恩伯格:《删除:大数据取舍之道》,袁杰译,浙江人民出版社2013年版,第231页。。而当系统习惯以“保存”作为默认模式时,多到无法甄别的数据会自然成为一种负担,意味着“重新定义我们自己的自由度减少了”(20)Luciano Floridi, The Fourth Revolution: How the Infosphere Is Reshaping Human Reality, New York: Oxford University Press, 2014, p. 72.,这迫使我们不得不进行有选择的删除,从而再次凸显出遗忘的价值。事实上,这种记忆选择机制在现实中多次被证实其必要性。美国国会图书馆社交网络保存计划目前已完成部分Twitter信息的收集,当前却无法提供利用,其原因之一就是没有平衡记忆与遗忘的需求。该馆在最初宣布保存Twitter时采取了全面收录的原则,然而推文数量的大幅增长、维护与研究资金的压力、技术上的短板、项目管理能力和规划的缺乏使得其不得不改变策略,2018年起宣布将“非常有选择地”收录推文,只聚焦少数重要的主题和事件,如总统选举、公共政策等。一直以来采取全面保存计划的互联网档案馆其实也面临着类似的窘境,它保存并提供了巨量的数据,但对研究利用者而言,相当一部分却是干扰的噪音和无关的数据。

正是因为数字记忆将人类记忆的能力拓展至趋于无限,遗忘在某种意义上则成为必要的需求。在各国的数据保护中,“被遗忘权”占有不可估量的地位,关于数据安全与隐私保护的一些律法规定为遗忘开启了法律之门,围绕着数据的生产与使用明确了一系列的权责与界限,例如欧盟网络存档项目中有关移除的政策,具体规定了在哪些情况下需要隐藏存档的页面。那么,什么样的数据值得保存?如何使得数据的保存与隐私权或者被遗忘权保有相互的平衡?美国记忆所创建的900多万件数字化馆藏,实际上只占实体资源的一小部分,它基于严格的挑选标准:在历史、文化和教育上的重要性;用户预期的需求;国内图书馆数字决策者的指导与建议;现有技术捕捉、访问和维护其内容的能力;而佛罗里达记忆(Florida Memory)除考虑用户反馈、馆藏利用统计、档案工作人员的建议、用户价值的评估、可能的资源重复等因素之外,还受到材料版权和所有权限制,以及不损坏实体为原则等方面的制约。当然,谁有权决定遗忘和遗忘哪些内容,这不仅仅是一个法律问题或伦理问题,同时还是一个管理问题和技术问题,即如何将责任与义务规约于管理的制度之中,或者将遗忘的机制设置于技术之中。从数据管理的视角,“被管理的遗忘”理论根据一种由大脑启发的方法,将遗忘模型引入数字记忆(21)参见Claudia Niederee, Nattiya Kanhabua, Francesco Gallo, et al.,“Forgetful Digital Memory: Towards Brain-Inspired Long-Term Data and Information Management”,in SIGMOD Record(2015)44, pp. 41-46.,作为“全面保存”的替代,为遗忘开启了管理与技术之门。“I Remember”就是这样一个将人类的生理遗忘机制引入设计中的网站,用户上传了记忆的碎片,便拥有了一个属于自己的记忆星球,网站将其融合成一个“云端大脑”,如同形成浩瀚的宇宙,每一个星球都遵从宇宙生命的法则,呈现出自然的生命周期,最终因系统自动删除而消失。

三、数字记忆建构方法

逻辑主义是人类在认识与实践过程中的一种认识论与方法论,是基于事物的“抽象性质、特征异同”(22)张辑哲:《维系之道——档案与档案管理》,中国档案出版社1995年版,第73页 。,通过归纳、概括、分类等方法获得的类别结果。由于数字记忆建构方法纷繁复杂,运用逻辑主义的方法从主体、数据、技术的角度进行归纳描述,使之对应于“主体、客体、中介”。记忆的建构并非数据的简单堆砌,而是在主体、数据与技术的动态交互中形成的,因此需要从主体逻辑、数据逻辑、技术逻辑的维度进行探寻。

(一)主体逻辑建构的维度

记忆的社会性特征决定了其实践的基本方法,要借助其社会主体及其相应的组织系统来建构。在这一思维引导下,数字记忆建构的主体依据一定的组织方法,形成数字记忆建构的三种方式。

1.垂直式。主体垂直式建构一般体现为以“一元”为主导的模式。数字记忆建构往往跨系统跨区域进行,因而需要建立有效的组织体系和工作机制,借助政府或组织机构的权威力量建立垂直式资源整合模式。(23)参见牛力、赵迪、韩小汀:《“数字记忆”背景下异构数据资源整合研究探析》,《档案学研究》2018年第6期。从中国国情需要考虑,部分学者强调了政府在记忆资源整合中的重要地位,提出由政府出面统一规划部署。一种方法是由政府设立专门的工作小组或组织机构,成立建设工作领导小组,自上而下统一管理进行资源整合。领导小组主要从顶层设计出发进行规划与指导,协调组织形成规章制度、审定工作方案并监督检查工作完成情况、研究解决建设中的重大问题;在领导小组之下建立专家组和联合工作组,专家组根据领导小组安排,为记忆工程建设提供理论指导和技术支撑、参与论证规划方案、参与质量绩效评估、提供咨询与研究性工作;联合工作组则具体负责记忆工程的实施,并下设行政小组、资源小组、技术小组、应用小组执行专项工作任务。(24)参见徐拥军:《档案记忆观的理论与实践》,中国人民大学出版社2017年版,第172页。另一种方法则是通过政府项目带动执行,由政府机构设立项目,与一个或多个信息机构合作签订合同,这些信息机构再与其他信息机构组成合作体实现异构记忆资源整合,如“台州古村落”的数字记忆建构来源于国家档案局开展的科技项目,其建设则由台州市档案局与中国人民大学信息资源管理学院合作共同完成。

2.横向式。主体横向式建构一般体现为“多元协作”的建构方法,表现为不同机构、组织与行业之间的横向合作关系,通过平等协作与优势互补发挥各参与主体资源的最大优势。从数字记忆实践的运行逻辑来看,数字记忆建构的主体协作主要集中在以下三大领域:一是以图书馆、档案馆、博物馆等为代表的社会记忆保存机构,它们具备良好的记忆资源保存基础以及资源整合能力,如“佛罗里达记忆”就是由其州立图书馆和档案馆协作完成的;纽约艺术资源网络保存联盟(NYARC)由布鲁克林博物馆、弗里克收藏馆和现代艺术博物馆等公共机构组成,旨在针对专业的艺术资源开展网络存档计划。二是以专业协会、学术团体、科研院所、公共组织等为代表的记忆研究与组织机构,它们具有相应的实践旨趣、研发能力和组织能力,如“缅因记忆网”(Maine Memory Network)由缅因州历史协会主持,并获得了包括缅因州公园土地局、缅因州档案馆、诺克罗斯遗产信托、巴斯德纪念高中等机构在内的广泛的合作伙伴;英国的互联网信息保存最早就是在归档联盟(UKWAC)的框架之下进行的。三是以大数据技术、知识挖掘技术、人工智能技术、虚拟现实技术等为代表的数字技术公司,它们为数字记忆建构提供技术支撑,如欧洲“时光机”项目所需要的顶级扫描、数据分析、机器学习等前沿技术离不开领先的数字化与人工智能的高科技公司的支持。

3.网状式。主体网状式建构是基于群体智慧的思维启发,旨在凸出全民参与的实现机制,形成网状式建构方法。群体智慧又称集体智慧,强调在“协商一致”的决策之上,调动集体的智慧来实现组织目标,它包含四个方面的问题:做什么、哪些人员参与、产生行为的动机、如何解决,由此而确定一个包含目标、主体、动机与策略的实施框架。(25)参见周耀林、杨文睿、姬荣伟、丁玲:《基于群体智慧的抗疫档案资源库建设研究》,《档案学研究》 2020年第2期。数字记忆从其网络原生形态而言,本身就具有“社会书写”的特性,在其建构过程中更需要激发群体力量,引导群众、民间力量的广泛参与。“新加坡记忆工程”(Singapore Memory Project)显著的特色之一就是实现了全民参与建构记忆,由此而形成的记忆来源广泛,既囊括了各种组织、协会、公司和团体的共同记忆,也纳入了普通人的个人记忆。该工程除有218个组织参与建设之外,还成立了181个记忆团队专门帮助那些有困难的人去记录属于他们的记忆。Fold3公司以提供“战争记忆”为其主要目标,它鼓励其会员进行“记忆”分享,以收纳尽可能多的参战人员的个人信息及历史影像。“北京记忆”平台(Pekingmemory.cn)开辟“我的北京记忆”专栏,允许注册用户通过其记忆账号来分享他们关于北京的记忆。

(二)数据逻辑建构的维度

逻辑主义框架下,数据本身也可以依据一定的逻辑进行组织和整理,但也可以通过非逻辑的方法进行管理,即与逻辑主义相对应的历史主义的方法。作为两种不同的认识论与方法论,它们有各自作用的范围与层次,也可以在不同的方法层面实现融合与统一。

1.历史主义的方法。历史主义的方法是“根据事物的现实状况及界限”采取客观区分及自然划分的方法。(26)参见邓绍兴、陈智为:《档案管理学》,中国人民大学出版社2002年版,第11-12页。面对现实世界的多样性与多变性,历史主义方法能从纷繁复杂的文件管理对象中梳理出清晰可见的宏观组织脉络,能维护和展示文件之间原有的来源关系和历史联系,显示出对文件实体进行管理的相对优越性。对于以历史主义为核心的内容数据的管理与开发,可在历史人文研究的认知方式上采取“自然而客观”的分类,例如从时间、地点、人物、机构、事件等五类实体角度进行分类,在所形成的通用概念的基础上建立“还原历史”的基本框架。如“佛罗里达记忆”共收有艺术文化、政府文件、日记文章三大类型的30多万件藏品,并在其同名的网站中设置了六大模块提供利用,包括摄影汇集、视频汇集、音频汇集、馆藏、展品、在线课堂;纽约市“皇后区记忆”网站提供了基于人物、地点、年度、事件、类型等藏品的快速浏览路径;斯洛伐克的互联网存档项目除了将官方发布的所有网页纳入保存计划之外,还将具有特定意义的主体类型也囊括进来,包括使用其民族语言的网站、其民族作家的网站以及与其国家及公民内容相关的网站。

2.逻辑主义的方法。逻辑主义的方法就是根据事物的抽象属性和观念形态进行分类的方法,即通过内容的相似性或差异性形成不同主题,对文件进行整理开发。如果说历史主义的方法有助于在记忆资源的最初整理时理清其来源和形式等基本信息,那么逻辑主义的方法对于以内容深入挖掘为基础的数据编码则更为有效。在数字人文的深入影响趋势下,数据内容被转化为可分析、可计算文本的数据深度处理需求显得越来越迫切,逻辑联系就被作为数据整理与开发的重要依据,其主要目标是从特定的事件或活动出发,通过纵向的信息整合,总结其所具有的基本特征和主要规律,形成具有一定主题的逻辑框架,换言之就是通过抽取、标引和再组织等方式对特定主题内容进行不同维度的深度挖掘和数据编码,由此建立呈现历史脉络的信息索引和汇集关联数据的知识网络,这正是数字人文的焦点之所在。例如,依据逻辑主义原则建立关于某一人物主题的记忆建构,可从人物的基本属性、关系属性和事件属性层面展开。其中,基本属性包括人物的生平以及人物主要成就等方面的描述框架,关系属性包括具有血缘的亲属关系、具有相同爱好或经历的朋友关系,以及在交往和工作中形成的一般社会关系所形成的描述框架,事件属性则可从人物的工作和生活中所经历的主要活动及事件等方面形成描述框架,由此而构建关于这一人物的知识图谱。

3.历史与逻辑的统一。自从“科学研究纲领方法论”开创了历史与逻辑相统一的理论,历史主义与逻辑主义方法便进一步在不同层面的融合中作用于人的认识与实践活动。如在档案管理领域,专题档案虽然以逻辑主义的方法进行整理,但这种“事由共同性”原则也需基于历史主义的本质来源为前提,而“信息二元组织”也意味着对于档案信息的组织不能决然地单独采用逻辑主义的方法,也需要从历史和逻辑两个方面进行。这一综合性的方法论对于数字人文背景下的创造性记忆建构来说,提供了更为适用性的数据管理和利用的模型,发展出基于历史—逻辑—历史处理的管理路径,具体来说,通过历史信息的联系建立起基础概念模型,在模型中用逻辑方法关联挖掘数据获取关键信息,再通过历史要素的可视化呈现这些信息与知识。彰显数字人文特色的“威尼斯时光机”正是采用了这样一种数据处理的方法,它首先依据时空信息搭建起基础的记忆模型,其时间信息主要来源于记忆载体本身形成的时间以及数据内容所涉及的时间,空间信息主要来源于记忆资源中的建筑草图、地图和城市规划图、施工及修缮账单等地理空间的信息;其次,在元数据著录的基础上进行数据挖掘,提取历史文献所反映的方方面面的信息,如通过地图数据与现有的地域地形、绘画照片等进行比对,获取反映时间和空间变化的地域疆界、道路原貌及重要建筑等城市面貌的具体信息,通过历史文书中的交叉引用人名关系建立起威尼斯的社交网络;最后,基于专题式数据处理所得到的数据集,采用三维建模和可视化的方式,利用历史联系中的时间、人物、地点、事件等要素再现地理空间变化和社会网络关系的历史脉络。(27)参见杨茜茜:《数字人文视野下的历史档案资源整理与开发路径探析——兼论档案管理中的历史主义与逻辑主义思想》,《档案学通讯》2019年第2期。

(三)技术逻辑建构的维度

数字记忆的建构从根本上依托于对新兴数字技术的开发与应用,通过一系列的技术实现技术化的记忆。它不仅强调记忆资源的数字保存,还着重于知识的挖掘与网络构建,更重视记忆资源的提取与利用,通过技术化的体验获取记忆。基于牛力等人提出的数字记忆资源创新开发利用的“PDU”模型(28)模型中的P指的是Preservation,D指的是Development,U指的是Utilization,即保存-开发-利用。,从以下三个方面对数字记忆建构技术方法进行梳理。

1.数字化保存技术。无论是对于原生的数字记忆资源,还是非数字形态的记忆资源,都需要经过标准化的档案管理程序实现长期保存,其中离不开数据采集、鉴定和保管的技术。在数据采集前,需要分析数据来源,明确产权归属,根据主题确认采集的范围,如针对互联网信息可以设置全面采集或选择采集的标准,并利用自动采集工具获取数据;在数据采集的基础上,通过鉴定技术过滤掉那些失真、不完整或不可读的数据信息,进而完成标准化著录与长期保存;在数据保存方面,有多重备份基础上的适时迁移技术、仿真与封装技术、整体保存技术、数据恢复与数据考古技术等。(29)参见马费成:《人民日报大家手笔:保存中国的数字记忆》,人民网2016年3月4日。记忆保存是一个系统工程,对于原生数字记忆资源来说,可以建立兼容原始数据、软件及其操作系统的集成仿真框架,实现数字内容的保真重现,还可以开发基于互联网的网页存档及社交媒体存档等工具,建立互联网资源的长期存取系统;对于非原生数字记忆资源来说,则要借助数字化转化、ORC识别、资源聚合与解析、数据库建设等技术,实现非数字资源的数字化与零散资源的有序化。例如,纽约的“根茎”(Rhizome)组织一方面保存网络数字艺术遗产,一方面开发各种存档工具Colloq、Webrecorder等满足艺术创作需求;“北京记忆”则在史料资源与空间资源采集的基础上架构了基于OAIS的资源长期保存平台。

2.知识化开发技术。数字记忆的核心价值不单单在于拓展了记忆的容量和性能,更在于其对数据的驾驭能力,即一种基于数据分析和知识挖掘的记忆管理。这种管理能力使得记忆远远超出其预期的价值,既传承知识又能创造出新的知识。尽管它需要利用大量的人工细读(Close reading)进行内涵的阐释与定位,但也需要借助数字人文的计算式远读(Distant reading)来实现知识之间的关联。这种智能化的数据驱动模式需要一整套的技术体系支撑,包括基于数据管理的数据开采、文本编码、信息抽取、本体建模、语义技术、智能搜索、数据库设计等管理技术和基于数据分析的内容挖掘、主题分析、文本聚类、时序关联、空间定位、社交网络分析等分析技术。此外,新兴的数字技术既要能从微观的数据单元层面深入篇章字词,细化资源粒度,揭示出丰富的语义关联,又要能从宏观的知识组织层面提供知识导航与指引,就需要借助以机器学习为核心的人工智能技术提升数据开发的深度与广度,也可借助可视化技术如关联呈现、知识地图、信息美学等方法形成生动形象的知识解决路径。例如,“威尼斯时光机”的最前沿技术就在于它的机器学习技能,针对古老而种类繁多的手写字形状,利用机器学习研发出手稿识别算法来识别文字结构,并在不同历史文献中找到相似形体建立关联,在此基础上,利用文本中出现的人名建立起城市的社会关系网络图,用地图数据呈现出历代建筑细节与城市变迁景象。

3.可视化呈现技术。如果说知识挖掘是数字记忆区别于传统刻写记忆的隐性特征,那么,“可视化”基因则是数字记忆的显性特征。在媒介“视觉转向”深入应用的背景之下,数字记忆技术研究的重点越来越凸显如何对记忆资源进行全方位、跨时空的可视化表达,以此激活记忆的感知觉系统,唤起记忆的“通感”。可视化的实现涉及多维层面及相关技术的支撑,首先要在资源组织结构层面实现可视化,需借助网站管理、界面设计、信息组织与检索、信息交互、分享与传播等技术支持;其次在资源形态呈现上实现可视化,需要不断突破文本、图像、影音、动画等传统形式的限制,利用数据统计技术、词云图工具、关系网络技术、三维光学测量系统、全景技术、场景模拟、历史仿真、沉浸技术、GIS技术等实现从记录数据到空间数据的全面可视化;最后在资源终端呈现上不断拓展可视化路径,通过平台开发与升级、大数据可视化大屏、全媒体融合、移动客户端开发等技术支撑,实现跨媒体多平台的可视化展示系统。中国的“北京记忆”“记忆高迁”、美国的“影谷”“地图线”、荷兰的“记忆宫殿”“眼球捕手”、英国的“沃顿小镇”、意大利的“威尼斯时光机”等,无不通过数字可视化技术来创造立体形象化的视觉呈现效果,如“北京记忆”以专题、专类、时间轴、资源地图、互动平台、信息流等多元化方式呈现,其中采用了3D建模、数据可视化、VR/AR/MR技术、GIS定位、移动端游戏、全景球幕光源采集系统、大数据技术、家谱树技术、人脸识别技术等多样化的数字工具和方法。

基于对记忆本身的多元性认识,数字记忆也呈现出不同视角的解读。从其对象范畴来看,数字记忆由人类数字化生存的“数据化”印痕构成,与数字身体和数字交往行为密切相关,这就决定了记忆建构的动力和选择机制始终围绕数字化的核心,形成面向数字遗产、面向数字知识、面向数字人文的建构观,以及基于遗忘视角的数据选择及删除机制;从其过程范畴来看,它是主体与主体之间、数据与数据之间、主体与数据之间技术交互产生的结果,决定了其具有主体逻辑建构、数据逻辑建构、制度逻辑建构的方法维度;从其工具范畴来看,它是寻求认同、建构意义、维护价值的数字化工具,因而数字记忆的建构需要及时地反映人类真实的数字化面貌且长久保存记忆鲜明的数据资源,在数字人文学科与数字记忆思维的交融之中,通过聚类整合将分散的信息智能关联,使不同汇集的数字资源纵横联通,用可视化的体验触发不同主题的记忆元素,全面激活丰富而活泼的记忆神经网络,建构趋于真实、重视体验、享用安全的数字记忆宫殿,为人类文化遗产的传承提供创新性应用,为实现对社会整体所具有的普惠性提供价值。

猜你喜欢

建构记忆数字
论相对独立的刑事涉案财物处置程序之建构
情境—建构—深化—反思
建构基于校本的听评课新文化
答数字
建构游戏玩不够
数字看G20
儿时的记忆(四)
儿时的记忆(四)
记忆翻新
成双成对