APP下载

水书习俗非物质文化遗产知识元组织与可视化研究

2023-10-07宋雪雁张祥青张伟民

现代情报 2023年10期
关键词:甲子水族习俗

宋雪雁 张祥青 张伟民

(吉林大学商学与管理学院,吉林 长春 130012)

水书习俗涉及水族文化信仰、各类民间知识等内容,融合了天文、地理、历史、文学、哲学、宗教、伦理道德等多学科、多元化的知识,具有重要的研究价值。2002年经贵州省档案馆提名申报,水书入选《中国档案文献遗产名录》。2006年,国务院批准“水书习俗”为“首批国家非物质文化遗产”,“水书习俗”主要是指水族社会中水书先生运用水书文献为水族人民择吉避凶(包括婚嫁、丧葬、起造、农事、出行等)的民俗活动[1]。基于对水书习俗相关研究梳理,发现水书习俗非物质文化遗产内容涉及水书文献、水书先生、水族人民及其生活等内容。国家重视水书习俗非物质文化遗产资源的传承与开发,然而,由于水书先生面临年龄较高、数量较少的状态,水书习俗非遗资源传承与开发利用面临困境与挑战。为了传承与开发水书习俗非遗资源,需要探索可行的知识化开发途径,助力水书习俗非遗资源传承与发展。

1 文献回顾

通过对相关文献的检索与梳理,本研究拟从水书习俗、知识抽取、基于知识元的知识组织3个方面对现有研究展开分析。

1.1 水书习俗相关研究

1.1.1 水书概念与特征

水书具有实用的操作性,广泛运用于民间婚丧嫁娶、生产生活趋吉避凶等诸多方面,对水族社会影响深远[2]。水书反映了水族宗教信仰、天文历法、哲学思想、文字起源、文学艺术、布阵攻守诸多方面的内容,是水族的百科全书,水族的“易经”,既是解读水族社会历史文化的重要典籍,也是进行宗教学、历史学、民族学、民俗学、语言文学等多学科研究的重要资料,水书是中华民族的宝贵文化遗产,具有极高的文物价值、文献价值、史料价值[3]。“水书”的概念主要包含3个方面:在表征上是指水族的古文字系统和书范体系;在内涵上是指用水族古文字书写、编著的水族民间信仰文化和传统知识的成文典籍;在外延上指与其具体应用相关联的民俗事项以及保留在水书先生头脑中无文字记述的口传知识与经验[4]。从学者对水书的概念界定与特征描述中,可以发现水书在水族社会生活中占据重要的地位,是研究水族历史、社会生活重要的载体,具有重要的历史文化价值和文献价值。

1.1.2 水书习俗传承

现有学者关于水书习俗传承研究涵盖的内容主要包括水书传承人、水书传承困境、水书传承影响因素等方面。欧阳大霖[1]从水书先生群体状态对水书习俗传承危机进行了分析,指出水书先生是水书习俗传承的桥梁,在水书传承中发挥重要的作用,由于当前水书先生群体存在数量偏少、年龄偏大、文化程度偏低等问题,使水书习俗的传承面临严峻的危机。戴建国等[5]指出,在水书传承中,主要方式为水书先生口传心授,绝大部分普通水族人不识水字和水书,水书先生主导着水书的传承和发展,而有些水书先生有自身相对狭隘的利益取向,强化了水书神秘性,使得水书只能为少数人掌握和运用,因此阻碍了水书习俗的传承。瞿智琳等[6]指出,水书的传承方式、水书的学习过程等方面影响水书传承和发展,其中,水书的传承方式为家族传承、择徒传承,这种传承方式限制了水书学习群体,水书学习包括举行拜师仪式、学习基础知识等事项,过程漫长且艰辛。从以上学者对水书习俗传承的研究可以发现,水书先生在水书习俗传承中起着主导作用,并且水书先生群体是年龄偏大以及数量较少的,只靠口耳相传的方式限制了水书习俗的传承。从学者的研究可以得出,应探索以数字化的方式对水书习俗进行知识化开发,以此助力水书习俗非遗资源的传承。

1.1.3 水书习俗资源的开发与利用

在水书习俗资源的开发与利用方面,王观玉等[7]认为,对水书习俗开发与利用的途径包括对水书文献进行研究与翻译,并对其进行数字化处理、传承水书习俗活动以及开发水书文化产品,与旅游文化产品相结合,开发的产品如“牛角水书”“马尾绣水书”等。黄天娇等[8]指出,需要在文化传承视域下建设水书古籍档案数据库,分析当下古籍档案数据库存在水书古籍档案资源分布零散、数据库建设标准缺少规范化、古籍数字化缺乏专业人才等问题,从整合资源、规范格式、培养人才等方面对建设数据库提出了建议。水书习俗资源的开发和利用目前主要集中于水书数字化处理、建立数据库等方面的探讨,鲜少涉及对水书习俗资源内容的深层次开发。

1.2 深度学习与知识抽取相关研究

深度学习技术可以实现细粒度的知识元抽取[9]。本研究通过梳理相关文献,发现国内外学者运用深度学习技术对知识进行抽取的研究领域涉及军事领域、医疗领域、非遗领域以及重大突发事件领域等,涉及的层次深入到文本的细粒度知识元抽取。Liao F等[10]提出了基于BiLSTM-CRF的军用命名实体识别方法,应用Attention结合BiLSTM的模型识别实体之间的语义关系,构建了层次清晰、结构灵活、可视化程度高的军事知识体系。李培林[11]将BiLSTM-CRF模型运用到电子病历命名实体中,将Attention组合BiLSTM-CRF的模型运用到电子病历医疗关系抽取中,实现了患者诊断与症状、用药情况及治疗方式之间潜在联系与隐性知识的挖掘。曾刚等[12]利用深度学习技术对万里茶道数字资源进行知识元抽取与知识元关系的分类研究,实现了对细粒度、多维关联知识的揭示与展示。江川等[13]基于BERT模型对突发公共卫生重大事件传染病事件实体知识自动抽取进行了研究,对相关部门及时、可靠、有效地做决策具有借鉴意义。基于既有研究可以发现,深度学习技术可以实现知识的有效抽取,能实现细粒度的知识元抽取,适用的研究领域宽泛。

1.3 基于知识元的知识组织相关研究

1.3.1 知识元概念与特征

基于对知识元相关文献的梳理,发现目前对知识元概念的界定有两种含义。张静等[14]指出,知识元是独立的、表征知识的不可再分割的一个元素,可以是一个公式、一个图片、一个章节、一个概念、一段程序等。温有奎等[15]指出,知识元结构化特征可以表示为(SPO)三元组形式。本研究在梳理既有研究基础上,认为知识元是描述知识的最小单位,其可以用三元组形式结构化表示。比如,《泐金·纪日卷》这本书是文献知识元,〈《泐金·纪日卷》,是,水书文献〉是三元组结构化描述形式下的文献知识元。在知识元特征的研究方面,孙成江等[16]认为,知识元具有独立性、唯一性、完整性、拓扑性、链接性、可组合性、可认知性、可导航性等诸多特点,文庭孝等[17]认为,可以对知识元进行自由切分与存取、自由组织与检索,进而实现对知识本身的自由组合与创造。

1.3.2 知识元描述

毕崇武等[18]借鉴元数据对信息资源的描述方法,提出知识元实体对象结构的描述框架,该框架从知识标识、知识描述、知识关系3个层面构建知识元的实体对象结构,标识组揭示知识元的内在知识内容、知识特征和属性;关系组揭示知识元与其他知识元间的关联关系,以及知识元与实体资源间的关系,将知识元划分为方法型、概念型、事实型和数值型。索传军等[19]认为,平面显性N(通常N≥2,N为正整数)元组是知识的主要表达方式,知识元的描述元素逐渐增加,描述模型日趋完备和全面。在知识元三元组描述模型中,高国伟等[20]描述为〈概念,关系,问题〉。在知识元四元组描述模型中,温有奎等[21]描述为〈名称,属性,操作,导航〉,姜永常[22]描述为〈名称,属性,操作,链接〉。在知识元五元组描述模型中,刘淼等[23]描述为〈编号,名称,来源,类型,特征词内容〉。在知识元六元组描述模型中,姜永常[24]描述为〈对象名称,对象起因,对象内容,对象过程,对象结论,对象引文〉。

1.3.3 基于知识元的图像资源和非物质文化遗产资源知识组织

在基于知识元的图像资源和文化遗产资源知识组织方面,赵雪芹等[25]构建了一种数字人文图像知识元本体模型,运用Protégé实现了图像知识元本体的可视化构建,并以万里茶道图像资源为例进行了数字人文图像语义关联展示,促进了数字人文图像资源的知识组织、语义关联及知识服务。曾刚等[12]构建了知识元语义描述模型,在此模型基础上,利用深度学习技术进行了万里茶道知识抽取与知识组织,实现了万里茶道历史人文资源的细粒度、多维关联知识的揭示与展示,促进了万里茶道数字资源的高效率开发与利用。董坤[26]构建了非遗知识元描述模型,基于该模型对非遗多元知识及其知识之间语义关系进行了抽取,实现了非遗知识的细粒度、多维关联组织与聚合。

基于对既有研究的梳理可以发现,水书习俗非遗资源是研究水族人民生活的重要资料。水书习俗传承方式主要靠水书先生择徒传承,水书先生年龄普遍偏高并且数量较少,这造成了水书传承的困境以及水书习俗难以高效开发和利用的问题。从细粒度知识元层面开发水书习俗非遗资源,将有助于其传承与开发、利用。深度学习技术可以实现命名实体识别和关系抽取,可以从最小粒度知识元层面挖掘水书习俗内容以及建立知识元之间的关联,因此本研究拟利用深度学习技术抽取水书习俗非遗资源知识元,建立知识元之间的关联来实现水书习俗非遗资源的深层次开发与利用。

2 水书习俗非遗资源知识元描述模型构建

2.1 水书习俗非遗资源知识元语义模型

水书习俗非遗资源知识元既需要考虑知识元内部结构化知识的揭示和描述,也需要考虑知识元间多元关联关系,充分挖掘水书习俗资源知识元的内部属性关系与外部多元关联关系。文本借鉴董坤[26]的研究,将水书习俗非遗知识元语义模型定义为:KE=,其中,KE为水书习俗非遗知识元,C表示水书习俗知识元所对应的具有唯一性的编码信息,主要是水书习俗的领域术语。K表示知识项,知识项是知识元的主体信息,是知识元知识内容的具体描述,依据其不同的表现形式将其划分为短语型知识项W与句子型知识项S。P表示知识元属性,R表示关系,主要描述知识元与知识元之间语义关联信息。

基于以上模型对水书习俗非遗资源机构/组织知识元“贵州省水家学会”这一实例进行解析,如表1所示。

表1 机构/组织知识元语义描述模型实例

2.2 水书习俗非遗资源知识元类型及关系

本研究借鉴了曾刚等[12]、董坤[26]关于非遗领域知识元抽取的相关研究,以及本体概念模型“人”“事”“地”“时”“物”基本要素,结合对水书习俗非遗资源的分析,将水书习俗非遗资源的知识元定义为人物知识元、文献知识元、时间知识元、空间知识元、机构/组织知识元、实物知识元、事件/活动/行为知识元、历法知识元、项目知识元9种不同的类型。

人物知识元:包括解读与翻译水书的水书先生,出版、编著相关水书文献的作者等;

文献知识元:包括水书非遗资源相关内容呈现的各类文献形式;

时间知识元:包括水书相关出版时间,水书文化起源时间,以及水族一些事件活动的发生时间等;

空间知识元:包括水书保存的地点位置,水书习俗起源的地点,水族人民聚集的地点等;

机构/组织知识元:包括水书资源保管机构,水家协会,以及大力支持与保护水书习俗非遗资源发展的相关机构/组织等;

实物知识元:包括水族民俗事项、活动等用到的器具等;

事件/活动/行为知识元:包括水族人民生活中发生的各种民俗事件/活动/行为等;

历法知识元:包括水书记载的天干、地支、二十八星宿、六十元甲子等相关的历法知识等;

项目知识元:包括与水书习俗非遗资源相关的项目,例如,非遗项目水族端节、水书马尾绣等。

上述9种水书习俗非遗资源知识元之间存在语义关系,比如,人物知识元与文献知识元存在翻译、出版等关系,人物知识元与历法知识元存在依据、解读等语义关系,文献知识元与时间知识元存在出版时间等语义关系……,根据知识元类型与其语义关系组织水书习俗资源知识元语义网络,可以构建较为系统的水书习俗知识组织体系,实现水书习俗知识元多维关系的关联与展示。依据上述分析,本研究绘制了水书习俗非遗资源知识元类型与关系示例图,如图1所示。

图1 水书习俗非遗资源知识元类型与关系示例

根据图1可以得到,水书文献《水书·九星卷》《泐金·纪日卷》包含了十大天干(甲、已、丙、丁等),十二地支(子、丑、寅、卯等)以及28星宿(东方青龙七宿:角木蛟等,北方玄武七宿:斗木獬等,西方白虎七宿:奎木狼等,南方朱雀七宿:井木犴等)等历法知识。水书先生根据水书记载以及自身头脑中存储的历法知识推算水族端节举行的日期,端节是水族盛大的节日,其举行日期为农历8月的第一个“亥”日开始至10月的亥日结束,历时49天,在端节这一天需要举行祭祀活动,祭祀时需要用到鼓,鼓面的图案需要依据水书历法绘制。《泐金·纪日卷》2007年出版,由贵州省档案局、荔波县人民政府编制,并且存放于荔波县档案馆,荔波县档案馆的地址位于贵州省黔南州荔波县。《水书·九星卷》2015年8月出版,责任者为贵州省民族古籍整理办公室。

基于知识元类型与其语义关系可以构建水书习俗非遗资源知识元语义网络,实现了细粒度知识元层面的水书习俗资源知识组织,形成序化的水书习俗知识结构网络,推动水书习俗非遗资源的开发和传承,促进其理解与利用。

3 基于实体识别与关系抽取的水书非遗资源知识元组织

3.1 基于实体识别与关系抽取的水书习俗非遗资源知识元组织框架

本研究基于实体识别与关系抽取对水书习俗知识元组织进行研究,运用深度学习技术进行水书习俗文本资源语料实体识别与关系抽取。实体识别是对水书习俗资源知识元术语的抽取,实体关系抽取是对知识元术语之间语义关联的抽取。核心思想在于从最细粒度的知识元着手,挖掘知识元知识项及知识元之间具体的语义关联关系,最后链接知识元形成水书习俗非遗资源知识网络与组织体系。该方法主要包括构建水书习俗资源的文本语料库、实体识别、实体与实体关系抽取、实体属性抽取、知识元关联和知识元表征。本研究构建的水书习俗非遗资源知识元组织框架如图2所示。

图2 基于实体识别与关系抽取的水书习俗非遗资源知识元组织框架

3.2 基于实体识别与关系抽取的水书习俗非遗资源知识元抽取实验

本研究将获取的水书习俗非遗资源划分为水书文献、水书先生口述档案、报纸、会议文献、期刊文献、网页文献等类型,采用基于规则的知识元属性抽取方法[27]进行水书习俗非遗资源的知识元抽取。

3.2.1 水书习俗非遗资源数据处理

本文运用正则表达将水书习俗非遗资源各类型文献由篇章级整理为句子级,每个类型下选取代表性的文本,对包含人物、文献、时间、机构/组织、空间、事件/活动/行为、项目、实物、历法知识元的句子进行实体以及实体关系标注。因为相同的文字可能根据语境的不同代表不同的含义,比如“水书”在不同语境下代表“项目”“文献”不同实体含义,“水族马尾绣”在不同语境下可能代表“项目”“实物”不同实体含义,而领域字典对其的方式可能会出现语义表达的错误,并且水书习俗非遗领域目前没有比较全面与权威的可供直接使用的字典,因此运用领域字典的方式实现实体的自动对齐与标注的方式不太适用于本研究,所以本研究运用人工标注对领域文档进行标注,选择水书习俗非遗资源中涵盖实体与实体关系较为全面的代表性文档进行标注,以期获得较为全面、科学的人工标注数据集来进行模型的训练与预测。由于领域文档集数量较大,并且并非所有文本数据都涉及人物、时间、空间、机构/组织、事件/活动/行为等知识元,这会影响文本实体识别与关系抽取预测的结果。因此,本研究分别对各类型文献中含有人物、时间、空间等知识元的关键句进行部分标注,并利用文本分类方法Bert Textcnn训练了一个鲁棒性良好的关键句抽取模型,依次对每篇文档进行关键句和非关键句的预测与识别,最终将预测与识别出的关键句一一放入预先训练好的实体识别和关系抽取的模型,可以实现对水书习俗非遗资源的实体识别和关系抽取。

3.2.2 水书习俗非遗资源知识元抽取实验

1)数据标注。本研究数据标注采用人工标注方式,标注的实体与实体关系示例如图3所示。

图3 实体与实体关系标注示例

2)实体识别模型训练。本研究应用Bert-Bilstm-Crf方法进行水书习俗非遗资源的实体识别,将标注的数据80%用于训练,剩余20%进行预测,获得的实体预测模型结果如表2所示,从表2中可以看出,人物、文献、时间、空间等实体识别的区间准确率达到81.63%,区间召回率达到83.07%,区间F1值达到82.24%,经过实验反复训练,获得了一个鲁棒性良好的实体预测模型,可以实现对水书习俗非遗资源语料的实体识别预测。

表2 水书习俗非遗资源领域实体识别预测模型参数结果 %

3)关系抽取模型训练。本研究应用Bert-Att-Bilstm模型对水书习俗非遗资源领域已标注数据进行实体关系的训练与预测,将随机抽取80%的数据集进行训练,20%数据进行测试,测试的数据集是从未参加过训练的数据,提升测试模型的泛化能力,获得的关系抽取预测结果如表3所示,将实体与实体的关系设定为祭祀对象/纪念对象、推算、聚居于/生活于/起源于、学习/翻译/解读/应用等14种类型,每种关系对应的主题类别、客体类别、准确率、召回率、F1值如表3所示,由数据结果可以得出,本研究训练的预测模型可以较好地实现水书习俗非遗资源人物、时间、空间、文献等实体之间关系抽取。

表3 水书习俗非遗资源领域实体关系识别预测模型参数结果 %

4)模型预测结果。对领域集文档选择具有代表性的文档人工标注特征句,以含有人物、文献、时间、空间、机构/组织、实物、历法实体特征词来标注特征句,运用Bert Textcnn方法对人工标注的文档集进行特征句与非特征句分类的训练与预测,预测模型特征句识别的效果准确率达到了93%,模型鲁棒性较优。将剩余文档集每篇文档一一放入训练好的模型中,共抽取出8 321条数据。将识别出的知识元特征句放入预先训练好的实体识别和关系抽取模型中,经过人工检查与校对,共整理出水书习俗非遗资源人物(水书先生、陆铎公等)、行为/事件/活动(拜师仪式、祭拜陆铎公、占卜算命等)、文献(《二十八卷》《营造卷》等)、空间(贵州省荔波县等)、机构/组织(荔波县档案史志馆等)、历法(一元甲子、七元甲子、水历、天干地支等)、时间(殷商时期、秦汉时期等)、实物(鼓、锣、马尾绣等)、项目(水书、水书习俗、水族马尾绣、水族卯节等)456个核心实体。

3.3 基于知识元链接的水书习俗非遗资源知识元组织网络

水书习俗非遗资源的知识组织包括内部知识单元聚合与外部知识单元聚合,在上述知识元抽取基础上,可以基于知识元链接构建水书习俗非遗资源知识元语义组织网络,本研究以水书习俗非遗资源相关文献知识元、机构知识元、历法知识元为例,构建的知识元语义组织网络如图4所示。

图4 基于知识元链接的水书习俗非遗资源知识元组织网络

从图4可以看出,《泐金·纪日卷》《水书常用字典》是文献知识元,十天干是历法知识元,荔波县档案史志馆是机构知识元。知识元的内部聚合指的是知识元术语与知识项的关联,知识项是知识元自身属性也就是实体属性,例如在《泐金·纪日卷》中,其自身属性是贵州人民出版社出版,2007年10月出版,内容包括七元甲子,贵州省档案局(馆)、荔波县人民政府编著等。知识元的外部聚合指的是知识元与知识元的关联,如图所示,《泐金·纪日卷》《水书常用字典》之间是关联关系,其都包含十天干历法知识元,并且《泐金·纪日卷》保管的机构是荔波县档案馆。

依据知识元之间逻辑依存关系可以构建水书习俗非遗资源知识链,知识链的逻辑组合形成了水书习俗非遗资源知识元语义网络,从而实现由水书习俗非遗资源知识元到知识网络的有效递进。基于知识元聚合组织水书习俗非遗资源实现了复杂语义的表达,助力了水书非遗资源的知识化开发与利用。

4 基于知识元链接的水书习俗非遗资源知识元重组与可视化

知识元具有自由组合的特点,即知识元通过自由的链接实现知识的重组,带来知识的创造与增值,本部分研究以抽取的《泐金·纪日卷》历法知识元为例,对知识元重组与可视化进行探究。

4.1 同一甲子关系链接的知识元重组与可视化

图5 第一元甲子立法知识元

4.2 同一活动关系链接的历法知识元重组与可视化

图6 宜出行活动历法知识元(第一元甲子)

4.3 两类活动关系链接的历法知识元重组与可视化

对于水族人而言,可能在同一天会进行两种或者两种以上的活动/行为,比如以修造鱼塘和修粮仓为例,忌讳进行这两种活动的宿日有甲子虚日鼠、庚申虚日鼠、壬子虚日鼠、戊申虚日鼠、丙子虚日鼠、庚子虚日鼠、丙申虚日鼠等,这些宿日分别属于《泐金·纪日卷》的第一元甲子、第二元甲子、第三元甲子、第四元甲子、第五元甲子、第六元甲子,如图7所示。

图7 忌修造鱼塘粮仓历法知识元

通过对历法知识元重组,可以发现不同链接关系重组知识元,会得到不同的结果,例如,依据《泐金·纪日卷》七元甲子组织,依据活动分类组织。

依据活动分类去重组宿日知识元时,可能会得到交叉重复的结果,宿日既适宜出行,也适宜嫁娶,有可能宿日适宜出行,忌讳做其他的活动。除此之外,根据宿日的属性(吉/凶/吉凶)组织宿日知识元,也会得到不同的结果,依据《泐金·纪日卷》,属性吉的宿日共75个,属性凶的宿日共62个,属性有吉有凶的共283个,而以上属性吉、属性凶以及属性吉凶的宿日分布在不同的甲子中,比如在一元甲子中,属性吉的宿日有12个,属性凶的宿日有9个,属性有吉有凶的宿日39个;在二元甲子中,属性吉的宿日有9个,属性凶的宿日有11个,属性有吉有凶的宿日有40个;在七元甲子中,属性吉的宿日有10个,属性凶的宿日有7个,属性有吉有凶的宿日有43个。因此,一元甲子至七元甲子下的属性吉的宿日可以重组为一个单元,一元甲子至七元甲子下的属性凶的宿日可以重组为一个单元,一元甲子至七元甲子下属性有吉有凶的宿日可以重组为一个单元。

5 水书习俗非遗资源知识元库构建示例

知识元库构建是面向知识构建的[28],知识元库可以存储抽取的水书习俗非遗资源知识元及其语义关联,形成知识内容之间的内在协同关联[29],可以实现水书习俗非遗资源知识元的长久存储、有效管理,为利用者提供高质量的知识检索服务,促进水书习俗非遗资源的深度利用。基于以上研究,本文构建水书习俗非遗资源知识元库示例,如图8所示。

图8 水书习俗非遗资源知识元库示例

根据图8可知,在关联事件/活动/行为知识元下,祭祀神族、婚丧等是水族人民依靠水书的指导进行的各类民俗活动,水族水书先生依据水书利用竹子、石头等实物进行卜卦,以此推算各类活动吉凶时间,拜师仪式是一些水族人向水书先生拜师学习水书的仪式。在关联项目知识元下,水书是中国档案文献遗产,水族端节、水族马尾绣是国家级非物质文化遗产,水族卯节是省级非物质文化遗产。在关联人物知识元下,陆铎公是水族水书的创始人,潘老平、欧金海是水书习俗非遗项目的相关传承人,潘朝霖、蒙耀远是现代研究水书的知名学者。在关联实物知识元之下,豪滩酒、九阡酒等是水族当地祭祀、招待客人的必备食物,鼓、唢呐是水族人民在节日里庆祝、祭祀等活动中用到的重要器具,牛角、钱币等是水书重要的载体。在关联的文献知识元下,《百越留源史》是关于水族人民起源的文献,《水书常用字典》收录了水族常用的水字,《丧葬卷》《超度卷》《祭祖卷》是关于对已逝水族人的出丧以及对祭奠祖先活动的相关文献,《营造卷》《金堂卷》主要关于水族入新房选择吉时的文献,《婚嫁卷》是关于水族婚姻嫁娶活动指导的文献,其他《日历卷》《七元宿卷》等是关于水族历法的相关文献。在关联的空间知识元下,贵州省三都县、荔波县、独山县是水族人民聚居的地区,贵州省黔南布依族苗族自治州是水书习俗申报的地区。在关联的机构/组织知识元下,国家档案局、中央档案馆首批“水书文献”为“中国档案文献遗产名录”,荔波县档案史志馆保管了很多珍贵的水书文献,贵州省水家学会是以水族及水族地区为研究对象的学术机构。关联时间知识元下,传说水族是殷商之后逐步繁衍而形成的单一民族[30],唐宋时期,水族散居于龙江流域黔桂两省区毗邻地带,农历十月初至十一月中旬是水族举行端节的时间,农历五月六月的卯日是水族人民举行卯节的时间。在关联的历法知识元下,十天干、十二地支、二十八星宿之间的不同组合形成水书历法的七元甲子,九宫八卦是古代中国天文学家将天宫以井字划分乾宫、坎宫、兑宫等9个部分。

水书习俗非遗资源知识元库可以展示分类后的具体知识元实例,便于发现知识元之间的逻辑关联,在知识元主题领域划分清晰的前提下,利用者可以高效获取和利用水书习俗相关知识,并发现新的知识。构建知识元库可以实现水书习俗非遗资源的结构化、有序化和语义关联,为利用者提供更为有效的知识服务,促进水书非遗资源的知识化传承与利用。

6 结 语

本文基于实体识别与关系抽取对水书习俗非遗资源知识元组织进行了研究,在知识元及其关系抽取的基础上,进行了知识元重组与可视化,并构建了水书习俗非遗资源知识元库示例。未来将继续丰富水书习俗非遗相关资源知识组织网络,并建立水书习俗非遗资源知识元库以不断深化研究,助力水书习俗非遗资源数字化、知识化开发与传承。

猜你喜欢

甲子水族习俗
明 文震孟 行书甲子除夕诗卷
水族敬酒歌
《梦溪笔谈》“甲子纳音”构造方法的数学分析
天下责任与先秦诸子学说的内在差异
水族经典及其思想信仰
水族动物