APP下载

CALIS子项目闽方言文献特色数据库建设实践与反思

2013-06-12程妹芳漳州师范学院图书馆福建漳州363000

图书馆理论与实践 2013年5期
关键词:建库文献数据库方言

程妹芳(漳州师范学院 图书馆,福建 漳州 363000)

《闽方言文献数据库》是漳州师范学院图书馆自建的特色资源库,是中国高等教育文献保障体系(CALIS)三期专题特色数据库子项目之一。本数据库以建设具有国内先进资源整合体系和服务平台为指导思想,利用北京快威公司研发的DIPS数字文献处理系统为技术支撑,主要以漳州师范学院图书馆特色馆藏文献为资源基础,以全文数据为重点,同时扩展整合海峡两岸及东南亚闽方言语言学科的中外文图书、期刊、方言文学作品、视频、音频、课件、网站等各类型资源,建成“辑目索引库”、“图书全文库”、“研究论文库”、“方言文学库”、“其他资料库”等五部分资源子库。

1 闽方言文献特色数据库建设的意义

(1)有利于资源的集中整合与组织。从地域广度来说,闽方言是我国最早流传海外,传播国家最多、流域最广的方言语种之一,文献史料遍布福建、台湾、广东、海南、浙江等省份和港澳地区、日、美、英、东南亚多个国家和地区。从时间跨度而言,自1403年第一部闽方言文献《满剌加国译语》[1]问世至今已有600多年,文献积存较多,涉及专著、论文、辞典、教材、教会文献,[2]以及用闽方言创作的文艺作品等,呈跨国性、散见性、稀有性、多语种等特征。闽方言文献数据库的建设跨越地域与时空,将散落各地的与闽方言相关的文献尽可能的搜集齐全,集中资源,整合信息,将其打造成为闽方言文献集散地。

(2)有利于资源的保存与描述。闽方言被称为古汉语的“活化石”,不管是闽东方言还是闽南方言,亦或是莆仙方言,都保存了自唐宋以来大量的古汉语印记,是重要的文化资源,也是珍贵的非物质文化遗产。闽方言文献数据库的建设,将全面科学地描写、展现、揭示闽方言实态,记录和保存闽方言资料,有效地传承闽文化,展示闽方言生态文化区语言真实面貌。同时也将较全面、客观地再现闽方言的传播区域与传播途径,再现闽方言的学术研究发展历程,凸显以闽南方言为代表的中华语言文化在台湾、东南亚等国家和地区的久远影响。

(3)有利于资源的开发与服务。通过对闽方言相关文献,以及闽方言语料与方言文艺作品等科学、合理、有序的知识整理与组织,利用现代信息技术和数据库技术,开发建设成专题数据库,填补了国内外闽方言专题文献数据库建设的空白,提高了文献资源的有效利用率,促进了福建省语言文献资源的数字信息化进程和资源共享,大大加强了方言文化生态区的开发与建设,更好地为海西区域经济文化发展服务。

(4)有利于区域语言规划研究与决策。“方言是一种区域性语言。”“语言规划的区域性与语言的区域性有关。”[3]闽方言的区域性尤为突出,它主要流行于福建省、台湾省、海南省、广东潮汕与雷州半岛、浙江苍南等地,通行于日、美、英、东南亚等多个国家和地区的华人华侨。在福建省内则有闽东方言、闽南方言、闽北方言、闽中方言、莆仙方言等五大互不相通的次方言。而本数据库的建设,则较为全面的掌握闽方言的语言实态,系统地揭示闽方言的发展历程与传播流域,为闽方言区域语言规划研究提供基础性资料保障与决策依据。

2 闽方言文献数据库建设的实践

(1)数据库目标定位准确。通过前期的调研,与专家学者的多次讨论论证,确定数据库的建库目标,即尽可能多的将散落在各地的与闽方言相关的文献资源搜集齐全,建设成由目录索引、文本、图像、音视频、课件等文献类型组成的资源数据库,使其成为闽方言文献集散地。以全息数据为重点,整合海峡两岸及东南亚闽方言语言学科的中外文各类型资源,形成元数据和对象数据。积极参与到CALIS特色数据库建设中,将本数据库的信息资源上传CALIS特色资源元数据仓储中心,有效地补充了CALIS的信息资源。

(2)数据库大纲设计明晰。这是特色库建设首先要确定的重要一环,设计特色库体系和栏目,需依数据类型、文献内容、数据量等因素综合考虑,合理规划,力求结构清晰,层次分明,分类准确。详见下表。

表 闽方言文献数据库大纲目次

(3)元数据标准和建库系统与CALIS衔接。毋庸置疑,数据库的标准规范对各高校图书馆建设特色数据库是至关重要的。闽方言文献数据库根据国家科技部科技基础性工作专项资金重点项目《我国数字图书馆标准规范建设》的研究成果,[4]结合闽方言文献自身的特点,制定漳州师范学院图书馆《闽方言文献数据库元数据结构与著录准则》,并严格按照这个标准来规范建库。建库系统采用通过CALIS认证的北京快威公司研发的DIPS数字文献处理系统,在本系统的各项功能基础上拟定建库技术方案,再按照建库方案与建库标准逐步实施建设,在实践过程中不断予以修正完善。

(4)数据库文献选取范围广泛。从资源种类与文献类型两方面进行合理界定,尽可能做到文献内容“专”、“精”、“全”,表现形式丰富化。资源种类凡与特色库主题密切相关的内容都尽可能收集。具体而言,从基本的语料字音、词汇、俗语、民谚到歌谣、童谣、谜语、故事、剧本、曲艺等方言说唱话语资料;从报刊杂志所刊载的各色研究性与非研究性闽方言相关文章到各种研讨会中发表的闽方言相关会议论文、项目报告以及学位论文;从教会文献、辞书、教材、专著到与闽方言发展传播相关的史料文献,从纸本文献扫描数字化到网络电子文献,均为闽方言数据库文献资源数据选取的对象。文献类型的载体形式有目录、文摘、全文、图像、音频、视频、课件、多媒体等多种类型数据信息。

(5)精心采集资源,用心加工建库。多渠道、多途径广泛采集相关资源。首先,充分利用馆藏特色资源,将现有馆藏资源数字化;其次,向社会和个人征集相关资源;其三,搜索、挖掘、提炼、整合网络资源;其四,从商业数据库中遴选数据;其五,派遣骨干馆员到福建省内各地、潮汕、海南、台湾、东南亚等国家地区收集相关资料。

资料收集后,对所有收集而来的数据进行筛选,通过扫描、拍照、录入、格式转换、文本全息化等各种技术手段和加工方式,对采集来的各种类型和格式的原始资料进行数据深加工、资源整合、归类存档,并按照《闽方言文献数据库元数据结构与著录准则》对数字化文献进行元数据标引、描述、组织、索引、入库。利用知识组织的方法,将无序、分散的资源内容建设成含目录索引、文摘数据、全文数据三级资源库,对文献资源进行全面揭示。

(6)Web发布与访问服务功能不断提升。利用DIPS软件系统,建立Web发布平台。设计简洁明了的特色库发布界面,含一级子库信息、数据更新时间以及各子库实时访问点击量展示等;建立详细的分类导航树,形象而直观地揭示文献资源完整的体系;设置一般分类导航检索与高级全文检索系统,供用户方便快捷地查找数字资源。数据库采用目前国内各高校较为通用的IP认证与账户认证两者相结合的访问方式,校园网内采用IP认证自动登入,校园网外采用注册账号(用户名/密码)认证登入。数据库面向终端用户24小时全天候开放,免费提供数据浏览、全文信息检索、原文获取、文献传递、网上咨询等服务。

作为CALIS三期特色数据库的建设成果,本数据库项目完成后,全部元数据及文摘级数据均免费提供给CALIS,提供基于WEB方式的公开免费检索;提供OAI服务,以方便CALIS全国高校专题特色数据库中心门户收割全部元数据。CALIS成员馆的用户可通过CALIS中心门户直接访问、利用本数据库。数据库中不涉及知识产权的内容直接提供全文,涉及知识产权的内容以文献传递服务方式提供全文。

(7)及时更新数据,注重日常维护。闽方言文献数据库将数据更新常态化、制度化,除寒暑假外,基本做到月更新,确保数据库文献的时效性和新颖性。重视数据库日常维护,实时做好数据保存,并及时备份。加强对服务器系统的安全管理,有效保障数据的安全性。

3 闽方言文献数据库建设的经验

(1)闽方言文献数据库是一个学科性很强的数据库,需要有专业学科知识的支持。在数据库的选题、目标定位、大纲体系设置、资源采集筛选、功能设计等各个环节,均聘请有关专家学者参与论证指导。特别是在数据库建设之初,科学合理地制定特色数据库的建设目标、价值取向、整体规划、工作流程、实施步骤等,是非常重要的。建库过程中时常与专家学者保持联系,在专家学者的全程参与、系统把关下完成建库。力求保证选题的价值性、数据的权威性和可靠性、大纲体系与功能结构的合理性,避免“走弯路”。

(2)统一的建库标准规范和合理的建库团队是建设高质量数据库的两大保障。规范统一的元数据著入标准是数据库实现资源共享的一大前提。闽方言文献数据库建设团队依据国家科技部的科研成果和CALIS中心的元数据标准,建立健全建库工作所需的各项规范准则与规章制度,如《闽方言文献数据库元数据结构与著录准则》《建库人员岗位职责》等,确保有章可循,有标准可依。在建库过程中严格执行数据库建设规范和元数据标引著录细则,遵循岗位职责,才能确保数据库的建设质量。在此基础上,结构合理、素质优良、业务精湛、富有协作精神的建库队伍,是建设高质量特色数据库的重要人才支持与保证。闽方言文献数据库的建库团队是由研究闽方言的专家学者、会讲闽方言的馆员、英语专业的馆员以及熟悉数据库技术的馆员等骨干力量组成。在工作中群策群力,明确各建库人员的岗位职责,合理分工,团结协作。

4 闽方言文献数据库建设存在的问题与改进措施

(1)建库标准规范有待完善,部分元数据取值、格式不够规范。这个问题的起因一是由于部分海外数据不易获取,如一些海外古籍本身就缺失必备元素,无法复原;还有一些网络资源,虽然文献价值较高,但一些必备元素无法追溯考证,致使文档资料不完整,部分元数据缺失。二是在数据库建设中,由于人手不足,请勤工助学的学生参与部分期刊元数据著录及图书扫描和加工工作,导致有些数据不够规范。三是由于本数据库从最初构思建库、收集资料到如今的初具规模历时多年,许多数据在开始收集时并未按照现在的标准规范来标引,又经多人之手,导致小部分数据模糊。

解决该问题的途径可分两步走。一是逐条检查有问题数据,多渠道、多途径追溯复原,进一步规范完善数据。二是参与CALIS三期特色数据库建设工作,积极向它们的标准规范靠拢。学习CALIS专题特色库的建库标准规范,对本数据库建设具有重要的指导意义。作为一所普通高校图书馆,我们缺乏特色数据库建设的理论指导,在平台搭建、库结构定义、系统发布等方面缺少建设成功数据库的实践经验。而CALIS专题特色数据库建设的标准规范与成功建库经验正是值得我们学习与借鉴的最好个案。双管齐下,一手抓标准,一手抓数据质量,无疑将极大的完善、提升本数据库的知识组织与资源整合水平。

(2)数据库有效利用率有待提高。由于本特色库的建库专题性较强,具有一定的使用针对性,加之缺乏宣传,师生读者对数据库的知晓程度不太高,虽然在海内外闽方言研究界拥有一定的读者群,广东、海南、香港、澳门、台湾、马来西亚、新加坡、日本等国家和地区都有学者前来访问,但数据库的利用价值还远未得到充分发挥。

解决该问题的方法有二。一是从自身建库质量入手,进一步挖掘资源、更新数据,提高数据库的生命活力。二是进一步加强数据库的宣传与推广力度。今后将尝试采用打电话、发E-Mail、邮寄数据库大纲等推送服务的形式,将数据库的内容、特点以及更新信息主动、及时推送给研究闽语的专家、学者。

[1]林连通.《闽方言研究专题文献辑目索引1403-2003》跋[M]//张嘉星.闽方言研究专题文献辑目索引1403-2003.北京:社会科学文献出版社,2004:729.

[2]张嘉星.传教士与闽南方言辞书[J].文献,2006(1):183-189.

[3]薄守生,赖慧玲.当代中国语言规划研究[M].北京:中国社会科学出版社,2009:2.

[4]张晓林,等.我国数字图书馆标准规范[EB/OL].[2012-05-08].http://cdls.nstl.gov.cn.

猜你喜欢

建库文献数据库方言
《感染、炎症、修复》杂志检索数据库
方严的方言
《感染、炎症、修复》杂志检索数据库
方言
说说方言
留住方言
“数字温县”建设项目通过验收
交通规划数据库道路红线规划建库规则
论我国学术文献数据库的质量调控
高校图书馆回溯建库探微