APP下载

数字人文的工具属性研究

2019-01-21

图书馆研究 2019年5期
关键词:人文学科可视化工具

(广州大学图书馆,广东 广州,510006)

1 数字人文的定义和研究误区

在媒体环境下,数字人文研究方兴未艾。从2001年英国布莱克威尔出版公司(Blackwell Publishing) 将出版的新书《数字计算指南》(A Companion to Humanities Computing)拟更名为《数字人文指南》(A Companion to Digital Humanities),正式提出了“数字人文”(Digital Humanities)的表述[1-2],距今不足20年。这期间,数字人文研究正成为新的人文社科和数字技术相结合的研究热点。截至2019年1月底,国际数字人文中心网络(Center Net)统计的全球数字人文中心达到了201个[3]。在国内,数字人文研究尽管起步稍晚,但发展却十分迅猛。在研究机构方面,2011年,中国大陆首个数字人文研究中心——武汉数字人文研究中心在武汉大学成立,随后,南京大学等高校相继成立了数字人文研究中心或类似的研究机构,至2018年6月,北京大学已连续举办了3届数字人文论坛;在研究成果方面,笔者在中国知网以“数字人文”为主题进行检索,从2005年廖祥忠在《现代传播》刊物上发表《“超越逻辑”:数字人文的时代特征》开始,至2018年底,主题为数字人文的研究论文达到389篇,其中2018年就发表了174篇。

这些研究成果对数字人文的研究包罗万象,然而,对于什么是数字人文,它的定义、概念仍然没有一个准确的定论,不同的研究者从自己的研究角度给出了不同的定义。例如,布雷特·鲍利(Brett Bobley)认为,数字人文是一个围绕着技术与人文学术诸多不同活动的伞状概念,包含的主题涉及资料的开放获取、知识产权、工具研发、数字图书馆、数据挖掘、原生数字资源保存、多媒体出版、可视化、GIS、数字重建媒介学习等诸多方面[4]。美国伊利诺伊香槟分校图书情报学院院长安斯沃斯教授则指出,数字人文是“一种代表性的实践,一种建模的方式,或者说就是一种拟态、一种推理、一个本体论约定。这种代表性的实践可一分为二,一端是高效的计算,另一端是人文沟通”[5]。而武汉大学数字人文研究中心主任王晓光认为数字人文“更重要的是在传统的人文研究范式之外,提供更多更新颖的问题、方法、工具和平台,推动人文研究范式变革与创新。此外,数字人文还是对数字革命这一单向的、不可逆转的社会趋势的回应”[6]。因此,作为不断发展的数字时代的新兴产物,要对数字人文进行一个标准的定义是不科学的,也是不严谨的,它是一个不断发展的概念,其内涵与内容都在不断地发展之中。

数字人文研究为人文学科的发展带来了新的契机,推动着人文学科的发展。但在研究中,也出现一些偏颇之处,或者说研究的误区。一是过度推崇数字化造成了对人文学科属性的削减。我们知道,数字人文的出现和发展,一定程度上发展和革新了人文学科的核心价值,也因此使得部分人文学者开始对数据中心论、重图轻文、重制作轻思想、重编码轻创作推崇备至。但是依赖和过分强调数字化,只有一种结果,就是将人文学科推往偏技术、保守的、纯实验室的实践研究模式,人文学者的思辨和批判性思维遭到摒弃,这就使得数字人文并未成为人文学科与理工学科之间的沟通桥梁,反而实质疏远了两者的关系[7]。二是在“数字人文”实践的过程中,存在自以为是的闭门研究,脱离了具体的人文学科研究情况和人文社会活动场景,而人文学科的研究或创作带有非常强的个人色彩,而且没有固定的套路,人文研究所要使用的数据集、工具软件或平台一般是小众的,而且指向性非常明确。上述数字人文实践,往往造成只是数字人文项目推动者的狂欢,而没有真正意义上的更多受众[8]。数字人文研究中上述误区的出现,过分强调了数字技术的重要性,却忽视了人文才是数字人文实施、发展的目的和根本。因此,探讨数字人文的性质、特点,厘清数字人文的本质属性显得尤为迫切。

2 工具属性是数字人文的根本属性

属性,是事物所具有的性质、特点。一门学科或者一个研究领域要不断地推动发展,既需要对其定义和内涵进行发展中的阐释,也需要厘清其属性,这是推动学科或领域发展的必然要求,否则就会妨碍学科或领域研究的发展。那么,数字人文又具有什么属性呢?数字人文的产生和升起,一个最重要的原因是数字技术的产生和不断发展。数字人文的前身,人文计算( Humanities Computing)的起源,是意大利神父罗伯托·布萨(Roberto Busa)与IBM公司合作,以计算机为平台、数字为载体编撰拉丁文的意大利典籍[9]。随着数字化技术、数据管理技术、数据分析技术、可视化技术、VR/AR技术和机器学习技术等数字时代新技术的不断出现和发展,也推动着“人文计算”向“数字人文”发展,并不断拓展数字人文的研究领域和研究内容。数字人文依赖和发展的基础,正是不断发展的技术[10]33。在科学研究中,技术被视为研究的一种方法和手段,得到了广泛的应用,网络时代的技术应用正渗透到各学科研究中。数字人文的产生和发展,正是学科研究中泛技术化现象的重要特征[11]。因此,从这个角度而言,数字人文具有工具属性,并且工具属性是数字人文最根本和最重要的属性。

按照《现代汉语词典》的解释,工具有两种层面的解释:进行生产劳动时所使用的器具;比喻用以达到目的的事物。如语言是人们交流思想的工具[12]。所谓数字人文的工具属性,是数字人文的本质特征,它是一种人文学科研究者在开展研究时借助其实现自己的研究设想、推动学科发展的一种工具,也是人们为实现人文社会活动目标的一种工具,包括数字技术思路、技术方法、技术手段。从这个意义出发,数字人文不能称之为一门学科,只能是人文学科研究依托数字技术的一种方法、手段。在开展数字人文研究时,其首要考虑的应该是人文,即实现人文研究本身所要达成的目标,其次才考虑采用何种数字技术或路径来实现人文研究本身,不能本末倒置。

3 基于工具属性的数字人文研究策略

在开展一项人文社会科学项目研究时,一般应该先认真分析项目研究的背景、研究需要解决或回答的人文问题、项目完成需要达成的具体目标等内容,在此基础上,再去考虑选择何种数字技术、方法手段(人文社会科学研究的技术工具)去实现研究的目标。例如,如果需要对文本进行数据分析(包括词条、年代、姓氏等关键词),通过这些大数据来揭示一些社会特征,显然文本挖掘技术可以作为技术工具,用于人文社会科学的数字人文项目研究;如果是以普及人文社会科学知识,提升市民大众的人文素养的人文社会项目,则选择可视化技术、图像技术和3D技术更容易实现项目的初衷、目标。因此,开展数字人文项目研究的策略,第一需要明确人文社会科学项目研究的目的,然后据此选择合适的数字技术来开展项目研究,实现研究目标。下文将以文化典籍数字人文项目为例来阐述这一策略和具体思路。

4 基于文化典籍项目的数字人文工具属性分析

4.1 文化典籍类数字人文项目的内容与目标

文化自信是一个民族、一个国家以及一个政党对自身文化价值的充分肯定和积极践行,并对其文化的生命力持有的坚定信心[13]。如何坚定文化自信?唯有从民族优秀文化经典中去汲取养分,增强民族自豪感和文化自信。在数字时代,经典阅读不仅必要,并且技术的发展为促进经典阅读提供了更多的便利和可能。在蓬勃开展的数字人文项目中,对文化典籍、经典图书的开发和利用,构成了数字人文项目的重要组成部分和主要内容,其最终目的,无疑是为了促进经典阅读,传承文化。为此,需要通过数字技术这一工具,实现文化典籍类数字人文项目的开发目标:

(1)经典的可获得和易获得。在大众所知的文化典籍中,很多经典都存世不多,成为图书馆、博物馆收藏的珍藏、孤本。要让这些经典为人阅读和利用,第一要务是使之数字化,并与大众共享,使普通民众均可以通过一定的渠道来获得其数字化版。借助数字化技术这一工具手段,可以实现经典资源的可获得和易获得。

(2)经典的可读性和易读性。经典著述产生的时代已经距离现代时空遥远,经典的文字和用语,对于许多人来说,往往生涩难懂。普通读者在阅读时会遇到极大的理解困难和记忆障碍,而通过可视化技术,对相关文献信息进行数字处理可以有效降低阅读的难度,提高可读性和易读性,也便于人文学科研究者开展相关研究。

4.2 文化典籍类数字人文项目案例

为实现上述目标,国内外数字人文研究中心、相关研究机构和学者借助数字技术,围绕文化典籍利用、倡导经典阅读这一主旨,开展了大量的文化典籍类数字人文项目的研究。

4.2.1 数字化项目

对经典的数字化,是数字人文项目的基础,也是开展最早、最多的数字人文项目。它通过采样、量化、建模等技术手段,对文献进行统一处理,提高其利用价值。如《四库全书》电子版、《国学宝典》《中国基本古籍库》《广州大典》等经典数字化项目[14]。以《广州大典》为例,它是由中共广州市委宣传部、广东省文化厅策划并组织研究编纂,旨在系统搜集整理和抢救保护广州文献典籍、传播广州历史文化的大型地方文献丛书。它依经、史、子、集、丛五部分类,共收录4064种文献,编成520册图书[15]。为推广《广州大典》的阅读和研究,上述文献全部实现了数字化,并建成了《广州大典》数据库。数据库提供了检索、纪年换算、全文下载等多种功能,极大地便利了人们的阅读和研究开展。在国外,类似的文化典籍类数字化项目也很多,如哥伦比亚大学图书馆将本馆珍贵的人文学科照片、海报、绘画、票证和手稿等档案材料数字化,建设数字资源馆藏库(Digital Library Collections, DLC),并将资源链接到图书馆 OPAC系统中,实现实体资源与数字资源的关联链接[16]。

4.2.2 文本挖掘与可视化项目

近年来,随着数字技术的不断发展,利用文本挖掘技术、可视化技术进行经典的数字人文项目开发也越来越多。所谓文本挖掘是从半结构或非结构的文本信息中挖掘可理解的、有价值的知识,是对人文资料的深层次利用,通常包括文本预处理、语料库构建、特征提取、文本聚类、文本分类等过程,有些文本挖掘项目还伴随着对挖掘成果的可视化处理,即以表格、图像等形式将成果生动地表现出来。类似的项目有普林斯顿大学的映射外籍巴黎项目、耶稣会图书馆起源项目等,前者对旅居巴黎的美国人于1919年创办图书馆的会员数据进行了深入挖掘,展示了1919-1940年间巴黎外籍社区与法国作家、艺术家的联系图像;后者创建了一个虚拟图书馆系统,揭示芝加哥洛约拉大学前身——圣伊格纳修斯大学图书馆耶稣会书籍的获取和使用历史,努力发现保存至今的原版书籍[17]。

针对传统文学文本阅读与研究方式的局限,在信息可视化和文本可视化技术的基础上,斯坦福大学教授 Franco Moretti提出了“远距离阅读(Distant Reading)”理论,为阅读与研究信息量大、复杂度高的文本提供新的解读途径与工具[18]。哈尔滨工业大学教授王妍和她的硕士研究生李欣哲完成的对《诗经》情感可视化阅读,就是“远距离阅读”的一个典型项目案例。《诗经》文本为古汉语,古奥晦涩、生僻字多、词意隐蔽、语境悬隔,这为经典的大众普及设置了障碍,使文化经典的阅读与传承遇到了严峻的现实问题。王妍、李欣哲以“喜、怒、忧、思、悲、恐、惊”来定性《诗经》的情感信息,借助信息时代的数字技术力量,通过对情感信息的处理和计算,运用信息可视化技术对《诗经》的情感信息内容进行信息建构,将《诗经》的文本信息转换为视觉信息,帮助人们高效、快速阅读,以视觉之“阅”的方式进入到《诗经》的情感世界[19]。

4.3 文化典籍类数字人文项目的工具属性分析

通过上述数字人文项目案例,可以清晰地看到,数字人文具有鲜明的工具属性。在这些项目中,为了促进文化典籍利用,倡导经典阅读的目的,利用了不同的数字技术作为技术工具和手段,以达成项目目标。包括数字化技术(扫描,拍摄,采样,捕捉,图形设计,3D建模等)、数据管理技术(文本编码,语义描述,本体建模,数据库设计,语义搜索,API数据服务等)、数据分析技术(文本分析,聚类分类,主题分析,内容挖掘,时序分析,地理空间分析,社会关系分析等)、可视化技术(信息美学,知识地图,主题图,关联呈现,场景模拟,历史仿真等)、VR/AR技术(人机交互,认知,互动测量,游戏化学习等)、机器学习技术(自动分类,图像视频音频识别和分析,深度学习,超级计算等)[10]35等数字时代的各种信息技术被充分融合运用到数字人文项目的开发中,采用“发现(Discovering)、注释(Annotating)、比较(Comparing)、参考(Referring)、抽样(Sampling)、说明(Illustrating)和表示(Representing)”等七种方法[20],实现了文化典籍资源的再利用、再开发,帮助媒体环境下的人们更容易阅读经典、研究经典。

5 结语

数字时代,技术的发展促成了数字人文的兴起,这对促进人文学科的发展和创新提供了更多可能和新的机会。显然,数字人文具有鲜明的工具属性,它的出现,为人文学科的研究提供了一种工具,它可以帮助文学家、历史学家、艺术家、图书馆学家等人文科学研究者以新的思路和技术方法、手段去认识研究问题,探究研究问题,找到通向研究结论的全新道路。

猜你喜欢

人文学科可视化工具
基于CiteSpace的足三里穴研究可视化分析
思维可视化
波比的工具
波比的工具
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
准备工具:步骤:
别再这样为人文学科辩护了
“巧用”工具
再论哲学人学的学术性质