APP下载

出土文献数字化整理简述

2014-12-12尤建辉

黑龙江史志 2014年21期
关键词:资料库数字化

尤建辉

[摘 要]计算机技术的发展为解决出土文献整理难题提供了全新机遇。短短的二十多年间,国内外利用计算机技术编制了大量的出土文献数字化资源。虽然数字化整理取得了很大成就,但仍有一些值得思考的问题亟须我们解决。

[关键词]出土文献;数字化;资料库

出土文献的整理是一门技术性、综合性要求很高的基础工作,在学界甚受重视。王国维《古史新证》中说:“吾辈生于今日,幸于纸上之材料外更得地下之新材料。由此种材料,我辈固得据以补正纸上之材料,亦得证明古书之某部分全为实录,即百家不雅驯之言亦不无表示一面之事实。”(1)以“地下之新材料”补充“纸上之材料”,对于资料相对缺乏的先秦两汉文史哲研究,具有重大作用和重要意义。然而对散佚的简牍、文书、碑刻等进行的收集工作浩繁,整理研究花费时间长,导致这类“遗产”不被重视人成为“危产”,当前对出土文献的抢救、保护、整理和研究,有许多亟待解决的问题,[1]出土文献的数字化整理是解决这一难题最有效的方法。

出土文献数字化整理就是利用计算机技术,将常见的文字或图形符号转化为数字符号的过程。出土文献数字化以其特有的资源特点必将给出土文献整理带来全新的机遇,其重要性和意义在于:一是有利于濒危出土文献的抢救和保护;二是出土文献全文数据库有利于全方位开发利用出土文献;三是有利于古籍文献资源的网络共享。

一、数字化整理成果(2)

在短短的二十多年间,国内外利用计算机技术编制了大量出土文献数字化资源。图书馆和研究机构是出土文献收藏和研究的主要机构,负有对出土文献的保存、利用和研究的重要职责,因此也是出土文献数字化资源建设的主要单位。

日本收藏有大量的中文古籍,随着古籍数字化进程的开展,日本各大科研机构也开始将简帛文献数字化,并提供网络化服务。其中在简帛文献数字化资源的开发与建设方面,以早稻田大学和奈良文化财研究所最具成就。(一)早稻田大学文学部工藤研究室开发的“楚简数据库”由简牍资料库和楚系文字资料库组成,内容包括楚帛书、鄂君启节、天星观楚简、信阳楚墓竹简、包山楚简、郭店楚简、曾侯乙墓竹简、望山楚简等9个地点新出土的帛书和竹简,具备良好的检索功能,使用者可选择特定文本与篇章或全部文献进行检索。(二)奈良文化财研究所制作的“web版木简数据库”包括木简数据库、墨书土器数据库、文书数据库、遗迹数据库等,可提供浏览检索、文字检索和全文影像阅读。

港台地区已开发出许多出土文献数字化资源,其单位主要为港台地区的研究机构和部分数字化公司,其中以香港中文大学中国文化研究所和台湾“中研院”历史语言研究所最具特色。(一)香港中文大学中国文化研究所古文献数据库中心开发制作的“汉达文库”包括甲骨文资料库、竹简帛书资料库、金文资料库、先秦两汉资料库、魏晋南北朝资料库、中国传统类书资料库及中国古代词汇资料库,其中“甲骨文资料库”收录当今海内外七种主要大型甲骨书籍,共计卜辞53834片,约近100万字甲骨卜辞,可同时显示甲骨文字原字形及隶定释文,可通过甲骨单字、关联字串以及句式进行检索;“竹简帛书资料库”收录十二种竹简帛书出土文献,约近140万字,可同时显示简帛图片和对照释文,可提供单字、字串及句式检索文献,检索结果可直接列印或存档。(二)由香港中文大学中国文化研究所与中国社会科学院历史研究所共同开发的“甲骨文全文资料库”主要以胡厚宣主持编纂的《甲骨文合集》13册释文为底本输入所收入的四万余片甲骨上的近百万字卜辞。(三)香港中文大学图书馆与香港中文大学中国语言及文学系张光裕教授共同制作的“郭店楚简资料库”主要为张光裕教授《郭店楚简研究第一卷文字编》乙书载录的《老子》《太一生水》《缁衣》《鲁穆公问子思》《五行》《尊德义》等十六篇道家及儒家著作,可按竹简编号、篇目名称或相关字词检索,支持全文检索,以及于2001年12月新增的“郭店楚简主要参考论著”检索系统,可按作者、书/篇目或出处项检索。(四)台湾“中研院”历史语言研究所开发制作的“简帛金石资料库”包括先秦至魏晋的简牍、帛书、碑刻、官印、镜铭等,收录60余种简帛金石资料及研究书目共3401684字的纯文字数据,以及居延汉简补编(共1324简)等图文资料,支持布尔运算、多项目查询、词组查询、排除字符及自然语言查询。(五)台湾“中研院”历史语言研究所开发制作的“先秦甲骨金文简牍词汇资料库”分为词汇检索与全文检索,收录甲骨文、金文和简牍三种文字材料,依词类、材质作为搜寻条件,展示词汇的词性、时代、书目来源、释文段落,现阶段词汇共收录约13万笔,每个词汇包括出处、编号、上下文,便于使用者回查与检阅,帮助理解词汇意义。

中国大陆地区是简帛文献收藏最为丰富的地区,在简帛文献数据库开发建设上虽起步较晚,但仍取得丰硕成果,参与开发建设的单位主要为科研机构和数字化出版企业。(一)华东师范大学中国文字研究与应用中心研制的“战国楚简帛文字典型形体检索系统”收录的材料范围包括《包山楚简》、《长沙子弹库战国楚帛书研究》、《郭店楚墓竹简》、《九店楚简》、《曾侯乙墓》、《战国楚竹简汇编》、《上海博物馆藏战国楚竹书》一、二、三、四、五及《葛陵新蔡楚墓》等材料,目前可提供GBK编码范围内通用字头的检索。(二)北京时代瀚堂科技有限公司制作的“瀚堂出土文献库”含甲骨文、金文、简帛、印章、钱币和石刻等分库,是目前唯一的集成性的中国出土实物文献数据库,数据库图片清晰,可全文检索,支持复制、打印功能,并附有联机字典。此外,国内各大博物馆还开通了馆藏精品数据库查询,如国家博物馆馆藏精品查询、故宫博物院馆藏精品查询均可进行甲骨文、铭刻、简帛、法书、碑帖等图谱的检索查询,并附有图谱在线功能。

二、数字化整理存在的难题及解决方法

虽然出土文献数字化整理已取得相当大的成就,仍存在一些亟须解决的问题。第一,由于没有统一的组织和机构协调出土文献数字化资源建设,出现了重复建设问题,造成巨大的人力、物力和财力的浪费。第二,由于出土文献数字化制作的主体和各自的利益诉求不同,制作的数据库无法兼容。第三,由于资源封闭和利益保护的弊端,给读者带来了诸多不便,导致资源无法有效共享。第四,文献购置和设备购置成为制约出土文献数字化的两大难题。第五,人才知识的不全面性难以适应出土文献数字化。

针对现阶段出土文献数字化建设中存在的问题,需要做好以下几个方面的工作:第一,建立一套包括数据库结构、检索界面、查询格式、专业用表和组织方式在内的标准体系以适应出土文献载体多样、内容广泛、学科交叉、时间跨度大的特点,有效提高文献数字化的质量和检索效率,降低研发成本。第二,联合计算机界、科研单位、文物部门及其他相关部门设置统一的组织和结构,在遵循全局规划、整体建设、统一实施原则的基础上负责开展出土文献数字化的研究工作,避免重复建设的弊端。第三,通过申请国家专项资金和吸引社会力量投资扩大资金来源渠道,以满足数字化整理所需的巨额资金。第四,在发挥现有专业人才骨干作用的基础上,多渠道、多层次的培养一批既具备一定的计算机、图书馆学等专业知识,又具有整理出土文献的基本技能的更好地适应出土文献数字化建设的复合型人才。

三、小结

出土文献提供大量有价值的佚书和传世古书最早的版本,使我们对古书真伪、时代源流等谜团有了破解,这些都需要多角度考订审核、多层次检讨反思,涉及文字组合、书写释读、校对勘误、词义训诂、音韵探源、版本目录以及古代学术史、思想史等。而出土文献数字化整理是抢救出土文献于“危产”之中,保护、整理和研究出土文献最行之有效的方法;也是适应当前信息化时代,学术研究所必然面临的挑战。只有将出土文献数字化整理之后,才能利用网络共享提高出土文献的利用效率,发挥出土文献应有的贡献。

参考文献:

[1]葛承雍,《出土文献整理:请多一些关怀》,《中国文物报》2005年1月14日第5版。

[2]梁松涛、赵彦平,《浅析我国出土文献数据库建设的制约因素及对策》,《图书馆工作与研究》2008年第4期总第146期,页48~51。

[3]毛建军,《简帛文献数字化述论》,《兰台世界》2011年第8期,页23~24。

[4]郑杰文,《论我国古籍整理的几个重点》,《陕西师范大学学报(哲学社会科学版)》2008年第37卷第5期,页120~123。

注释:

(1)王国维:《古史新证——王国维最后的讲义》,清华大学出版社1994年12月版,第2页。

(2)介绍出土文献数字化整理成果时,笔者在《浅析我国出土文献数据库建设的制约因素及对策》、《简帛文献数字化论述》和《论我国古籍整理的几个重点》基础上参考相关数据库介绍而写就。

猜你喜欢

资料库数字化
揭示数字化转型的内在逻辑
数字化起舞
高中数学“一对一”数字化学习实践探索
中国民族语言的标准与数字化
高中数学“一对一”数字化学习实践探索
小学《科学》教材“资料库”之教学研究
项目全过程资料库系统在电网企业中的研究与应用
珍视“资料库”中那些故事里的事
实现科学教材中资料库的教育价值
走出教学盲区 填充智慧行囊