APP下载

《中国分类主题词表》与《中文主题词表》对比研究

2010-07-18王彦侨国家图书馆北京100081

图书馆建设 2010年8期
关键词:词表主题词表标引

王彦侨 翟 军(国家图书馆 北京 100081)

1 《中国分类主题词表》与《中文主题词表》概况

《中国分类主题词表》(以下简称《中分表》)是在中国图书馆图书分类法编委会的主持下编修的大型综合性工具书。《中分表》自1987年开始编制,由我国著名文献检索语言学家刘湘生、张琪玉、侯汉青、朱孟杰等领衔主编,40余个图书馆、160多位专家参与了编制工作,并于1994年3月由华艺出版社出版发行。《中分表》是在《中国图书馆图书分类法》(第3版)和《汉语主题词表》的基础上编制而成的,可实现分类检索语言和主题检索语言的兼容互换[1]。2005年出版第2版,其修订的重点包括:主题词增删改及其参照关系的修订、类目与主题词对应关系的修订、研制《中分表》电子版等[2]。

《中文主题词表》(以下简称《中文表》)是以《中文图书标题词表》为蓝本编订的。1984年,为配合台湾图书馆自动化的发展、方便读者检索,台湾“国立中央图书馆”致力于研制一部适用于一般图书馆编目的标题总目,以《中国图书分类法(试用版)》的类目为基础,编制出版了《中文图书标题总目初稿》,其收录的标题以反映当时的中文图书内容为目的。1993年,台湾“国立中央图书馆”对其予以修订,增编分类索引,编撰“编例”、“使用说明”等,并改名为《中文图书标题词表》。1995年,《中文图书标题词表》(修订版)出版发行。1999年,台湾“国立中央图书馆”组成“中文主题词表编订小组”,专责规划、编订等各项事宜。编修过程中,“中文主题词表编订小组”参考了各种关键词库、专科词典、主题词表等,并参酌了文献编目实际经验,坚持“以名词为主原则”、“单义词原则”、“易误词防止原则”、“优选词原则”、“中性词原则”和“自称词原则”等选词原则,于2005年形成《中文表》蓝本,并以台湾“国立中央图书馆”馆藏书目数据库为对象进行标题词转换主题词工作,同时对《中文表》进行全面检核、比对、删并、订正、补充,于2005年12月完成并出版《中文主题词表·2005年修订版》[3]。

2 《中分表》与《中文表》的比较

2.1 相同点

2.1.1 主题标引与分类标引的工具

分类法是先组式语言,主要通过学科系统来揭示主题间的关系,更适用于族性检索;主题法是后组式语言,专指性是其主要特征。无论《中分表》还是《中文表》,都是把分类法和主题法结合起来的文献标引工具,反映了情报检索语言的发展趋势。二者均含有的主题词—分类号对应表可以看作是《中国图书馆分类法》或《中文图书分类法》的索引。《中分表》还包含了分类号—主题词对应表,能够对《中国图书馆分类法》和《汉语主题词表》起到范畴索引的作用,在分类标引的同时还提供了可供选择的主题词。《中分表》与《中文表》作为分类法和主题法相结合的词表,其功能超过了分类法和主题法的功能之和,实现了分类法与主题法、先组式语言与后组式语言在结构、语义和功能等方面的兼容与优化。

表1 《中分表》与《中文表》概况[2-3]

2.1.2 不断修订以维持其新颖性

伴随着科学的发展和技术的进步,主题词表的滞后性逐渐呈现,对其进行修订成为必然。主题词表的修订是一项浩大的工程,从确定主题词的领域、范围和标引对象到确定词表的结构和功能,再到主题词的选择、使用和词间关系的建立,都要耗费大量的人力、物力和财力。《中分表》1994年出版第1版,自2000年开始修订,2005年全部完成;《中文表》由台湾“国立中央图书馆”邀集台湾图书信息界、文教界、图书馆学界专家学者及台湾“国立中央图书馆”人员参与编订,经过6年的努力于2005年修订完成。《中分表》与《中文表》在修订过程中都借鉴了词汇工具和各学科知识,吸收了自然语言的优势,在一定程度上考虑了电子资源标引的需要,其最终修订成果是各学科专家和图书情报界人员集体智慧的结晶[4]。

2.1.3 兼具规范、解释和检索功能

2.2 差异

2.2.1 发展过程不同

《中分表》自产生初始就以主题词(即叙词)的形式出现,第2版电子版研制成功后形成了一些标题,可以部分实现标题词表的功能。《中文表》则最先以标题词表的形式出现,随着时间的推移,标题词表的先组式、不能组配等问题体现出其局限性,促成了《中文主题词表·2005年修订版》的出版。《中文主题词表·2005年修订版》由标题词表转变为主题词表,开辟了台湾地区主题词表的新纪元。

2.2.2 结构不同

从编辑结构看,《中分表》分为3个部分:编例和使用说明、分类号—主题词对应表及主题词—分类号对应表[5];《中文表》由序论(序、编例、使用说明)、主表(主题词—分类号对应表)、附表(中国时代表等9个附表)构成[3]。

从条目结构看,《中分表》的分类号—主题词对应表的条目包括分类号、类目名称、注释(来源于《中国图书馆分类法》第4版)、对应的主题词,主题词—分类号对应表的条目包括主题词、主题词的含义及语义参照、对应的分类号[5];《中文表》的条目由标目词、参考类号、注释文字、参照说明4个部分组成[3]。

2.2.3 版本不同

与《中文表》只有单调的印刷版不同,《中分表》第2版还成功研制出电子版。《中分表》电子版为不同用户设计了个性化的服务界面,以多文档、多窗体的形式用动态手段再现了分类主题一体化的对应转换结构及其语义结构,克服了印刷版的线性结构和检索效率低、查全率和查准率低等缺陷,从而实现了一体化机助标引、基于内容的信息检索等功能[2]。

2.2.4 主题词的增词原则

根据《中分表》的规定,文献收藏单位必须采用正式主题词进行标引。如果确实需要使用某个或某些主题词,可以在610字段进行揭示。对于何种文献标引选用自由词标引,业内同行进行过不少研究。有种观点认为:“应该在尽力保证主题标引查全率的基础上,加大自由词的标引力度。”[6]

《中文表》为减少篇幅、避免选词挂一漏万,部分词型的主题词仅收录了具有代表性的词语,对于未收录的地名、民族名称等主题词,使用者可以在附表中选用合适的词或进一步参考相关规范工具自行增补,如人名、机关会社名称等可参考“中文名称权威资料库”予以增补。这种“自由词”与惯用的“自由词”并非同一概念,包括“人名、人体机构组织名称、化学元素和化合物名称、地名、民族名称、各国文学、家族名称等21类自由词”[3]。此外,词表使用单位可根据其宗旨和目标、藏书规模、性质及特色,就本专业内的主题词进行增补,增补方法与“自由词”相同[3]。

2.2.5 主题词的选用不同

《中分表》第2版共收录分类法类目52 992条、主题词110 837条、主题词串59 738条、入口词35 690条;《中文主题词表·2005年修订版》共收录主题词23 162条,其中主表19 110条、附表4 052条,主表中正式主题词16 939条,非正式主题词2 171条。虽然这两个词表都全方位地反映了各个学科的知识,但受政治、经济、文化、词表编制原则和指导思想等因素影响,单纯比较收录主题词的数量是没有意义的。虽然《中分表》第2版与《中文主题词表·2005年修订版》都形成于2005年,撇开简体和繁体不谈,主题词的选用仍存在很大差异。笔者随机挑选了几个词汇分别在《中分表》与《中文表》中检索,结果见表2。

表2 《中分表》和《中文表》的部分主题词收录差异

2.2.6 反映主题词间关系的符号不同

《中分表》第2版沿袭了第1版的用法,根据我国国家标准《GB/T 13190-91汉语叙词表编制规则》[7],使用“Y”、“D”、“S”、“F”、“Z”、“C”作为叙词词间关系符号,以反映主题词的等同关系、等级关系和相关关系。与之相对,《中文表》直接用汉字“用”、“不用”、“参见”,以展现主题词间的各种关系。

3 《中分表》的改进

3.1 降低词表滞后性的影响

《中分表》修订周期过长,选词和审词早在2003年9月便已初步完成。《中分表》第2版2005年出版时词汇滞后,近年来新出现的流行名词和各国新任领导人名称(如“人肉搜索”、“博客”、“白色污染”、“拼客”、“奥巴马”等)没能涵盖其中。现阶段第2版的修订情况可以在《中国图书馆分类法》网站(http://clc.nlc.gov.cn/ztfxd.jsp)的“修订快讯”栏目中查到,如《中分表》第2版及其电子版出版后的类目修订、主题修订,《中国图书馆分类法》(第4版)出版(1999年)后至《中分表》第2版出版(2005年)前增删改的主要类目等。更新信息的发布为维持《中分表》的动态发展做出一定贡献,但是在知识经济飞速发展的今天,文献出版紧跟时代脚步,新观点、新概念、新词汇层出不穷,无论是印刷版还是电子版的《中分表》,滞后性不可避免。所幸,《中分表》Web版(http://cct.nlc.gov.cn/login.asp)已进入试用阶段。笔者认为,《中分表》的修订亦可仿效台湾做法,制订一整套主题词“增词规则”,在网上提供“增删主题词建议单”,为《中分表》的修订提供现实依据。

3.2 注重主题词选择的科学性与实用性

《中文表》在修订过程中,增改幅度较大的类目主要是学科技术发展较快、与社会经济发展密切相关的类目,如F类、TP类、TN类等。在《中分表》修订过程中,也应根据文献保证原则增补新主题词和删改旧有主题词,增补大量入口词,完善主题词之间的语义关系,以提高检索效率。

《中文表》在修订的最后阶段把馆藏书目数据库转换成修订版的主题词时,发现了部分未考虑到的问题,再度对词表进行了审视与复核,使词表更加符合台湾“国立中央图书馆”主题标引的需要。《中分表》在今后的修订中也可考虑该做法,这将有利于进一步完善词表,将错误和漏洞降到最低,更加突出“实用性”的特点。

3.3 适应网络信息组织的需要

《中分表》在满足印刷版文献标引方面具有良好的性能,在网络资源的信息组织上却显得有些无能为力。笔者认为,可以单独创建互联网分类组织需求的“搜索引擎版《中国图书馆分类法》”[8],使主题词表积极向本体靠拢,从专科主题词表开始抽取核心概念、细化概念、建立关系、创建模型,不断探索并寻找与语义网相适应的路径和方法。

3.4 广泛聆听各方声音

《中分表》在研制过程中对“中国国家书目库”、“中文社科报刊篇名数据库”、“中文科技期刊数据库”所收的主题词、关键词、分类号进行了统计分析,除了主题词的增删改外,还大量增加入口词,加强《中分表》的自然语言检索功能。大量的前期统计调查工作使《中分表》渐趋完善。

目前,百度百科、维基百科、美味书签与豆瓣网等网上“书签”及自由分类法正以其提倡“个性化”、强调“参与性”的特点吸引越来越多人的关注。根据中国互联网络信息中心(China Internet Network Information Center,简称CNNIC)2010年1月发布的《中国互联网络发展状况统计报告》:“截至2009年12月30日,中国网民规模达到3.84亿人,普及率达到28.9%。”[9]虽然网络信息可信度低、随意性强,但网络的力量不可小觑。笔者建议将网络用户使用的“标签”、“分类”作为统计分析对象的一部分,以全面了解新学科、新事物、新主题的关键词在信息资源中的表达形式和使用频率,为确立新增主题词、入口词以及调整主题词的用代关系和表述形式提供参考。

[1] 万小华,刘海燕.大型工具书《中国分类主题词表》简介[J] .山东图书馆季刊,1993(4):55-57.

[2] 卜书庆《.中国分类主题词表》(第二版)及其电子版使用手册[M] .北京:北京图书馆出版社,2006.

[3] 中文主题词表编订小组.中文主题词表[EB/OL] . [2010-02-04] .http://catweb.ncl.edu.tw/sect-2.htm.

[4] 刘春银.中文主题词表——人文社会科学类修订[EB/OL] .[2010-02-04] . http://www.lib.fju.edu.tw/seminar/200408marc/file/st.ppt.

[5] 汪东波.中国分类主题词表 [M] . 2版.北京:北京图书馆出版社,2005.

[6] 邓福泉.谈如何加大自由词标引力度[J] .河北科技图苑,2003(6):58-59.

[7] 国家技术监督局. GB/T 13190-91汉语叙词表编制规则[M] .北京:中国标准出版社,1992.

[8] 陈树年,刘惠敏.从网络信息组织看《中国分类主题词表》[J] .国家图书馆学刊,2006(2):21-27.

[9] 中国互联网络信息中心.中国互联网络发展状况统计报告[EB/OL] .[2010-02-04] . http://www.gmw.cn/content/2010-01/22/content_1043010.htm

猜你喜欢

词表主题词表标引
《〈汉语主题词表〉构建研究》
《〈汉语主题词表〉构建研究》
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
《〈汉语主题词表〉构建研究》
《〈汉语主题词表〉构建研究》
档案主题标引与分类标引的比较分析
本刊对来稿中关键词标引的要求
叙词表与其他词表的互操作标准
本刊对来稿中关键词标引的要求
本刊对来稿中关键词标引的要求