APP下载

数字环境下文献分类法的检索应用及其发展

2011-03-14马张华

大学图书馆学报 2011年4期
关键词:检索系统分类法类目

□马张华

1 分类语言的实际应用迫切需要关注

计算机的广泛应用和互联网的发展为充分发挥检索语言功能提供了十分有利的条件。但在图书馆OPAC开发过程中,明显存在着实际应用与检索语言潜力脱节的现象,其中尤以分类检索最为突出,相应的研究也十分缺乏[1]。这一情况已经延续多年,迫切需要改变。

上述状况至少造成以下问题:

首先,限制了分类语言基本功能的开发。分类检索历来是分类法的主要功能之一。在手工检索阶段,分类目录一直是我国图书馆目录体系的中心目录。但自从机检系统在我国文献单位使用以来,许多大型图书馆的OPAC长期来只提供类号查找功能,使得分类检索途径形同虚设。虽然近年来一些国产软件开始提供分类浏览检索的形式,但由于对类目体系的显示不充分,例如,对组配标引的揭示甚至不如传统手检目录,使得其分类检索功能不能充分发挥。

其次,影响分类语言与检索环境的有效结合。检索语言的应用是与技术环境密切联系的。传统分类语言基本上是根据手工环境的应用需要发展起来的,如何将其有效地与数字环境的特点结合,需要在汲取各种已有经验的同时,对其使用的形式、特点等进行各种试验和改进,发展相应的方法体系。不改变目前的状况,分类语言的有效应用就无法进行。

再次,也限制了分类语言进一步发展的研究和探索的可能。网络环境的出现,不仅改进了分类法应用的条件,同时也极大改变了分类检索的可能性,必然会反过来影响和推动分类语言的发展。而如果缺乏相应的实践,仍然亦步亦趋于原来的传统做法,要进行开拓性的研究和技术探索是不可能的,必然会在分类法研究中随波逐流,失去发言权。

有人根据网络搜索引擎的应用现状,对分类检索系统在文献单位的使用价值缺乏信心,这其实是没有必要的。分类法的长处在于其系统揭示能力,适合于对经过精选的、适度规模的文献资源进行处理,而文献单位的图书资源恰恰是符合其特点的。此外,由于图书排架的需要,文献单位已经配置了分类数据,没有网络分类必须解决的标引问题,只要对检索软件进行相应改进就可以了,这是事半功倍、锦上添花的事,没有任何理由拒绝。就检索功能而言,任何一种检索方法都有其长处,也有其短处,因此一个好的检索系统往往需要多种方法结合使用,这已经成为文献组织领域的共识。分类法对于专业领域的系统揭示能力,是其他检索语言无法比拟的。上世纪80年代美国图书馆界的研究证明,同时结合使用分类法,可以比主题法有更好的检全率,效果好于单独使用主题法[2]。

2 关于文献分类法的检索应用形式

目前国内图书馆的分类检索存在的主要问题,一种是没有采用适合分类特点的形式,从而限制了分类途径的使用,一些只提供类号检索的OPAC大多属于这类情况;另一种,虽然提供分类浏览形式,但由于对分类结构的显示不够完备,从而影响了使用效果,如一些系统将浏览层次限制在前三级,或只提供类表列举的类目、不显示组配类目等,均对用户查检造成消极影响;此外,还存在检索手段单一,不能与计算机功能有效结合等问题,包括如:缺乏灵活的索引形式、分类主题结合不充分等,都是影响分类途径检索效果的因素。

要改变这一状况,必须汲取网络分类目录的使用经验,重视将分类语言的特点与机检环境、用户需求等结合。分类法作为一种按照知识关系构建的系统语言,以等级浏览为主,同时提供从主题角度查找应用的途径,是检索应用中得到普遍接受的比较适合的方式。结合已有探索和文献分类语言的特点,我认为,在数字环境下,特别是在图书馆的OPAC中,分类检索系统应遵循如下做法:

2.1 以等级浏览作为主要显示形式

优点是能较好显示分类语言的关系系统,可以有等级层次形式、树形结构形式或图形显示形式三种。从目前使用的情况看,第一种形式的使用较为普遍。其特点是,能以简明的方式充分揭示所显示层次的类目关系及其相关性。例如,图1中Open Directory“科学”[3]类的浏览界面,不仅完整显示了“科学”类分出的子类,包括重复反映类目(即带@符号的类目)、相关类目(see also下序列的类目),同时还以字母标志的方式,列出了供从语词角度对“科学”类包含的各级下位类进行浏览查找的途径。

图1 Open Directory等级浏览界面示例

2.2 重视显示的易用性

如在类目体系和索引的显示中以类名作为主体,以便利用户使用。网络分类系统因为处理的对象为数字资源,不存在资源排架问题,一般直接显示类名,不显示标记,受到用户欢迎。传统文献分类系统因需强调其与排架文献的联系,类目浏览显示时不一定省略类号,应该是可以接受的;但类目索引返回的结果必须尽可能明确、简练,方便用户理解,并有较高的准确度。

2.3 体系展示充分

目前文献类表的展开深度已考虑了资源情况和用户的使用需要,划分层次适度,完全可以充分展开等级链。同时应注意结合数据情况,补入组配类目的显示,例如,在“各国文学”下可对诸如“法国文学”、“俄国文学”等详细展开子类。这也是分类检索系统与类表的不同之一,它不再只是具有伸缩性的标引工具,而是一个基于标引资源的充分展开的文献检索系统。

2.4 加强检索和应用的灵活性

例如:提前显示重点类目,类目索引的分层设置等。其中,提前显示重点类目,是指将一些受到广泛关注的使用量大的重要类目适当提前,以减少展示的层级,改进系统的直接性。例如,在“文学”类下结合应用超文本链接,将“英国文学”、“美国文学”、“俄国文学”、“德国文学”、“日本文学”等适当提前,与“亚洲文学”、“非洲文学”、“欧洲文学”、“美洲文学”等并列显示如图2,用以改进检索效果。索引灵活设置的一种典型做法见图1中Open Directory的实例。只要点击“科学”类下列出的字母,即可浏览该类下以相应字母开头的所有类目。

图2 在“各国文学”下提前显示重要类目的示例

2.5 必要的多维化改造

即不仅根据类表原有的体系加以展示,而且结合超文本链接,通过增加揭示的维度,对已有结构进行适当改进,使得检索系统成为一个可以从多个角度查检和集中资源的系统。以“中国史”类为例,采用这一方法,就可以通过重复反映,从多个角度完整地集中各种关于中国历史的文献,如图3所示。图3中“中国历史”下的“专科史”、“传记”等原是分散在有关门类或单独设类的,通过超文本链接在本类重复反映,使中国史的收录更加完整;“历史事件”原分散在中国历史下的各个历史时期,此处以重复形式突出反映,便于直接查检。这类调整使得“中国史”的类目更加完备和实用。这一方法可以贯穿在整个历史类文献的设置过程中。

图3 “中国史”下多维揭示的示例

2.6 完善相关关系的揭示

根据手工环境下使用的需要,传统分类法在以类目参照方式揭示相关关系时,控制十分严格,数量较小。机检系统中超文本链接的使用,增加了相关性揭示的便利,因此不少网络分类目录扩大了类目参照的范围。文献分类目录也应当根据使用的需要,对类目参照适当扩充,改进系统对于相关性类目的展示能力。

2.7 改进类下排列

这也是改进使用效果的重要内容。可以根据可能性同时提供多种排列方式,例如,按著者姓名字顺排、按种次号排、按出版年代排、按书名字顺排等,在默认一种的同时,提供类下排列选项,供用户选用。

2.8 加强与其他检索手段的结合

除改进类目索引的结合应用外,还应广泛结合主题以及其他途径,以便建立起多途径结合的、完备的知识关系的网络。《中国图书馆分类法》类目与主题词的结合应用,可以充分利用《中国分类主题词表》这一成果,同时还应参考文献标引数据中分类号与主题词、主题标题之间的联系,在此基础上发展出相应的结合应用形式。

可以看出,上述各条中的多数内容,属于传统目录形式如何在数字环境下结合应用的问题。包括组配类目的显示在内,都可以直接在标引数据的基础上直接实施。以组配类目的显示为例,可以选择按标引数据,充分显示所有收入资源的类目;也可以根据类下资源的分布情况,只展开其中的重点类目,对资源较少的类目适当压缩、简化。例如,在“英国文学”、“法国文学”等类下详细列出类目等级,而对资源比较少的国家的文学,只设置国家类目,甚至显示到洲以下一级就可以了。传统的卡片式目录基本上也是按类似方式实施的。

上述应用中出现的一些新形式,则属于结合数字环境的特点调整改造的内容,如提前显示重点类目、多维化揭示、类目参照的扩充等,多数为网上分类检索工具中使用较为普遍的形式。这类新形式的使用,虽然仍然是初步的,存在进一步优化改进的需要,但同时也是技术环境的变化决定的,带有发展趋势的特点。由于传统文献分类法有其不同于网络分类的特点,如何将这些形式有效地结合进文献分类法体系,还需要进行分析、试验。与此同时,还存在着对新的可能形式的探索问题。而要在这一过程中发展出与新的应用环境匹配的理论、技术和方法体系,则需要进一步从数字环境提供的可能性,及与文献分类法特点结合的角度研究和探索。

3 重视数字环境对文献分类法发展的影响

数字化应用带来的变化是多方面的,尤其是超文本链接的应用拓展了对知识关系揭示的能力,为分类语言的发展带来了巨大的可能性,分析和认识其影响是十分必要的。

首先,类表的结构发生了变化,从单线结构变为双层结构或也可以称为多层结构[4]。传统类表中,虽然也使用了揭示横向关系的形式,包括交替类、类目参照等,但是在手检系统中,其数量是严格控制的,因此基本上仍然是单线结构。超文本链接的使用,使得分类系统除标引类表以外,还可以根据使用的需要,在此基础上构建供检索使用的上层结构,发展一系列新的显示形式,上文提到的提前显示重点类,多维化展示,类目参照的改进等,即为这类显示形式的典型应用。通过上层结构的引入,各种重复反映的使用,使得分类法从原来的单维系统发展为多维结构,从而可以从多个角度,更加灵活地、充分地揭示类目之间的联系,满足用户的使用需要。与此同时,索引的应用,其他要素(如作者名等)的引入,也都可以采用多层次方式,在各种范围内使用。

其次,技术方法上发生了变化,需要结合应用环境的变化,探索和发展适用的方法,研究使用的规律和要求,发展相应的技术方法体系。包括如:

处理好分类体系的数字化显示形式。除了选定的浏览显示形式外,还存在如何结合数字环境,合理解决各种类目的灵活显示问题。例如,在传统手检目录中,通常根据揭示类目体系的需要和资源情况,有选择地设置类目指导片,类似上文提到的,“按照资源数量充分展开重点类目,对资源较少的类目适当压缩、简化”,这类方式在数字环境下是否可以使用?应采用何种解决方案?再如,索引的显示应采用哪些形式,尤其在采用多维结构的情况下,如何进行才能达到最好效果?这类问题,都需要在应用过程中通过分类系统与数字环境的结合,予以解决。

作好重复反映类目的选择。包括提前显示类目的选择、多维化改造中维度的确定,参照类目的扩展等,均应经过探索,发现其规律,并逐步发展相应方法。例如,根据使用需要,将有较大的访问量的类目提前显示,逐步从开始时根据经验处理,发展到依据用户访问量数据,作为提前设置的依据;再如,根据用户需求和知识关系揭示的特点,进行维度选择,使得增加的维度能促进检索的有效性、易用性等。

作好度的控制。重复反映并不是越多越好,需要有度的把握,应当综合检全、检准的需要,在对知识关系进行系统研究的基础上加以控制,如在多维系统控制的研究中,应结合分面理论和实用数据,对维度的数量从理论与实践结合的高度加以控制,并逐步建立相应规范;再如,目前文献分类法的类目参照数量过少,有较大任意性,对涉及类型、范围、选择依据等的把握不如主题法,应结合叙词法等的研究成果加以探讨。当然,度的确定也是与检索系统对分类法功能的定位相联系的,因此还应根据检索系统的构成及各种检索语言分工的基础加以控制。

合理处理数字化应用对类目设置的影响。多维化系统的构建,是以原有的类目体系为基础的,通常应在已有类目设置的基础上进行,以便在已有类目体系稳定的情况下,充分利用已有分类成果。但在确有必要时,也可根据需要作少量调整。此时,为减少对原有数据的变动,一种可考虑采用的办法,是只改分类目录不改排架号。例如,在需要增加从作者角度对文学作品的揭示时,可在分类目录的相应门类下按作者设置检索类目,并收入对应的分类数据,以便在不变动底层类表的情况下,通过对这些检索类目的重复反映,提供从作者角度的检索功能,如图4所示。如有理想的操作界面,上述处理是十分方便的。当然,在确有必要时,也可对底层类表的类目作少量调整。但由于这类调整会带来排架变动,应十分慎重,通常须结合标引类表整体发展的需要确定。

图4 只改目录不改排架类表示例

上述各类情况,可先通过对少量典型类目进行试验,在成熟时再逐步扩大使用范围。

再次,还应分析数字环境下的应用对类目体系功能的影响,进一步探索分类系统的定位,及其应用规律问题。分类表作为一种实用工具,其功能是与应用环境及其提供的可能性密切联系的。过去我们总是说,传统分类法是从学科角度组织的,一般无法同时从主题角度集中;在分类法等级层次展开过程中,一般都是按照选定的引用次序展开的单线系统,使得系统无法从不同角度集中和揭示资源,例如,“管理学”的资源,在目前的《中国图书馆分类法》中通常即是分散在各个应用部门的。但数字环境下超文本链接的应用,多维化结构的引入,给类表的揭示功能带来了新的可能性。可以在保持目前体系的情况下,有选择地同时集中部分被分散的门类,甚至提供从主题角度集中的形式。如可以使用这一方式,在分类检索系统中同时集中展示有关“管理学”的资源。由于分类法在目前的文献检索系统中是结合主题法等使用的,因此文献分类法在数字化应用中如何进行必要的改造和调整,还需要结合目录体系中不同方法之间的分工协调情况来确定。从整个图书、文献检索系统而言,是采用在分类系统中学科和主题结合的形式,还是整体上仍然保持分类以学科为主,主题以主题法为主的分类主题结合的形式?这就需要将分类法的应用放到整个检索系统发展的环境下去讨论,并在整体分工的情况下,对这类应用的方式进一步研究,发现其规律,并建立起相应的规范。

任何检索语言都应当在实际使用中充分发挥作用,并在这一过程中不断完善,尤其是在应用环境发生变化的时候。经过国内图书馆界的共同努力,《中国图书馆分类法》第五版已在2010年出版,希望新版的使用,能同时成为探索其在图书馆检索系统中有效应用的新起点。通过不断的探索和试验,推进分类法在数字环境下的实践与研究,并在此基础上,逐步发展出新的、具有数字化特点的文献分类法版本。

4 相关思考

影响机检系统中分类应用的关键之一是检索软件的编制。对检索软件的开发,我是外行,但因有感于心,谈几点外行看法:

第一,应采用国内自主开发的软件,尽量放弃使用国外的检索软件。国外软件不仅价格高昂,而且功能上也很难满足国内需要。很难想象,一个对国内的检索语言情况并不了解的公司,能够开发符合国内检索语言特点的高质量的系统。而且这类系统升级困难,没有可持续性,难于进一步优化,不能形成良性发展的可能。

第二,重视发展新的环境下建设检索工具的有效工作模式。手工分类目录环境下,检索语言专业人员自己可以建立分类检索工具的时代已经一去不复返。要有效做好数字环境下图书馆的检索工具建设,唯有加强领域合作,建立起良性开发方式,包括:建立分类领域的专业人员与计算机编程人员结合的团队;技术骨干队伍稳定,能够长期持续等。为了达到较好的效果,图书馆与专业公司的合作是可以考虑的形式之一。

第三,应该通过合理的工作程序,确保检索软件的开发达到专业水准的要求。包括,通过图书馆专业人员的参与,使得软件编制能跟上专业领域的发展水准,并应为进一步的调整改进留下可能。就检索语言的应用目标而言,我认为,至少应该通过与计算机环境的结合,使得检索语言具有的基本功能得到开发。例如,就分类语言而言,至少应充分反映分类法的特点和优长,包括提供友好的浏览界面,以适用的方式显示等级结构,提供各种灵活使用的方式等,使得分类法的优点得到充分体现;就主题语言而言,至少词表已经建立的等同关系,能以适合的方式使用;等级关系和相关关系能作为检索优化的手段得以显示等,使得各种基本功能得到开发。

第四,对应用进行跟踪,为进一步优化、改进提供条件。检索系统有在应用过程中不断完善的需要,同时,数字环境和用户需求,也会对检索语言的发展产生影响。因此,检索系统及其语言不是静止的,不仅需要在基本功能开发的同时进行跟踪,而且应充分利用网络空间的优势,不断优化、拓展。如:分类系统中,逐步发展多维结构,探索将主题与学科结合的可能性,不断丰富分类应用的理论和方法体系;主题系统中,结合检索丰富入口词、改进词间关系及自然语言检索功能的扩展等。

总之,在数字图书馆的研究中,关注各种前沿问题的研讨是必要的,但应用实践也十分重要。因为如果缺乏实际应用这一环节,不仅会影响使用效果,而且也失去了进一步研究发展的基础。愿我国检索语言的成果能得到扎实的应用及持续发展。

1 马张华.我国大型图书馆机检系统检索特点研究.中国图书馆学报,2003,29(4):56-59

2 Markey K,Demeyer A.Findings of the Dew ey Decimal Classification On-line Project.International Cataloguing,1986,15(2):15-19

3 dmoz.[2008-08-08].http://www.dm oz.org/Science/

4 马张华,陈文广,赵丹群.数字环境下文献分类法检索应用的思考.中国图书馆学报,2009,35(1):59-64

猜你喜欢

检索系统分类法类目
本期练习题类目参考答案及提示
收录《信号处理》的检索系统及数据库
收录《信号处理》的检索系统及数据库
本刊被以下检索系统及数据库收录
本刊被以下检索系统及数据库收录
K 近邻分类法在岩屑数字图像岩性分析中的应用
基于贝叶斯分类法的股票选择模型的研究
ABC分类法在介入耗材库存管理中的应用
《中图法》第5版交替类目研究综述
黄三角、长三角、珠三角明、清及民国通志一级类目比较*