APP下载

草根分类法在网络资源组织的应用

2019-02-18张雅红

卷宗 2019年34期

摘 要:近几年来,草根分类法也越来越受重视,它可以应用于背景资料的阅读、分类订阅、邮件过滤、文件管理等领域。本文从草根分类法与传统分类法入手,分析将其应用于网络资源组织的必然性,重点介绍了在网络资源组织中的应用,并简要分析了草根分类法的不足之处。

关键词:网络资源组织;草根分类法;传统分类法

草根分类法,又叫公众分类法、大众分类法以及自由分类法等,是索引系统的一种形式。是在Web2.0的网络环境下,人们在使用博客、因特网以及其它网络服务时,用标签对不同的信息对象进行分类。当这些标签分组、计数并用于自动浏览、查找信息是,就形成了草根分类法。第一个社会标签系统Del.icio.us出现于2003年,“草根分类法”这一专业术语正式出现于2004年由Vander Wal首次提出的,是英语单词“folk”和“taxonomy”,即“人民”和“分類法”,组合而成的,它是一种自下而上的非正式的分类方法,允许用户用自己随意选择的关键词(或称标签)对信息进行归类。Folksonomy包括3个重要组成部分:用户、被描述的资源(具有唯一的标识符,如URL或ISBN)和标识符或标签(用来描述信息资源)。

1 草根分类法必然会成为网络信息资源的主要组织形式

1)与传统分类法相比较,草根分类法的优点。传统分类法是一个相对的概念,通常是由图书情报学专家设计的,是机读目录(Machine-ReadableCataloging,MARC)格式的分等级的目录结构,是面向印刷性文献的分类体系。传统意义上的分类体系又被称为图书馆分类体系。

传统分类法是与主题法相分离的,非专业人员很难从分类号看出某一文献的内容,即只能反映学科属性,而且传统分类法严格遵循学科性原则,有复杂的标引技术和严格的分类规定,只有经过专门培训的专业人员才能掌握这方面的技能,进行分类标引工作。与传统分类法相比,这种分类法的特点在于它并没有采用预先制定的信息分类法和词表,而是用户根据个人的使用习惯,以自定义的自由词为数字资源对象进行标注和分类。所以公众分类法比传统的等级分类和分面分类法更接近用户大众并易于被他们接受,自由灵活是其突出的优点。用户可以对其感兴趣的内容进行标识,提供一个或者多个标签,或什么也不作,仅浏览他人的标签。人们不必查询杜威十进制分类法(DDC)。用户对内容进行标注后,他人可立刻看到这些标签,如果认为标签不合适,还可以自行增加新的标签,因此共建共享是其另一重要特色。

2)动态更新是其有别于传统分类法的又一个重要特色。传统分类法只能在分类体系已经设定的类目中对号入座,对于新出现的难以对号人座的新事物、新学科等只能靠类或归入上位类。动态更新是随着人们使用不同标签标识内容信息,被使用最多的标签就最能说明这条信息的特点。一些使用频率低的标签逐渐“淡出”人们的视野,而那些使用频率高的标签会在标签云图以字号变大的形式反映出来,这种更新可让人随时发现当前人们关注的“热点”和“走势”。

3)传统分类法的制定和维护需要大量的人力物力,并且相对于万维网(World Wide Web)的海量资源来说,传统分类法显得缺乏灵活性。而分众分类是平面延伸的分类方法,分众分类所得的类与类之间没有从属关系。虽然它称不上严谨、准确,但是在社会性软件中,这种平面延伸的分类方法却在潜移默化中为网络用户建立了多种沟通的渠道,促进了社会网络的形成。

网络的发展的主流趋势是越来越倾向智能化、生活化。而这种来源于人民生活的大众分类法也就必将成为网络信息资源的主要组织形式。

2 目前,草根分类法在网络信息组织形式中的应用

作为一种信息资源组织方式,基于标签技术的公众分类法已经在多种服务系统中得到了应用。基于互联网的各种资源管理和共享系统是公众分类法的起源和目前的主要应用领域。

2.1 网络信息资源分类管理

商业门户网站、搜索引擎的分类体系是大众信息分类法的主要组成部分。Yalloo!的分类体系包括14个大类。Googe的分类体系包括16个大类。Sohu的分类体系包括16个大类。Sina的分类体系包括18个大类。这些分类体系虽有一定差别.但是都设置了很多与公众生活相关的大类,反映了公众对生活类信息资源的需求,这些分类体系应该属于大众信息分类法的范畴。

2.2 网络信息资源的管理

网络信息资源可以分为文本型与非文本型。

1)对文本型网络信息资源的管理。作为一个用户表达自我和交流思想主要平台的网络博客以及空间日志,就是文本资源的管理系统。用户使用标签来对自己的文章进行标注和分类。标签可能是文章中的某些关键词,也可能是未出现在文章中的语言词汇。标签的另一个作用是聚合整个系统中相似内容的文章,用户通过标签能够发现与自己拥有相同兴趣、思想的个人乃至群体。

2)对非文本型网络资源(如图片、视频、音频等)的管理。在Web2.0网络环境下,用户可以将图片、视频、音频文件上传到网站服务器上,与其他用户分享,但是,图片和视音频没有文本特征,这使这类资源的检索更加困难,标签技术的应用就解决了这一问题。标签不但能够组织和聚合相似的资源,还可以使用户将描述这类非文本资源的内外部特征,例如主题、属性、作者、来源等等,从而提供了一条重要的检索途径。如视频分享网站土豆网、搜狐网。

2.3 网页资源管理

网络书签也是大众分类法的进行网络资源信息组织的方式之一。网络书签是由某一网页的URL以及用户对该网页的命名、收藏它的时间的。通过书签,用户能够对特定的网页资源加以标识和收藏,以便再次访问。用户可以对每个书签添加若干标签,标签代表的是用户对书签所指向网页的注释。添加标签的功能实际是用户使用公众分类法对所收藏的网页资源进行组织和整序,利用标签用户能够更加快速准确地定位网页资源。在网络书签提供的服务中,用户还可以将自己收藏的网页资源与他人分享,标签促进了这一目的的实现。一方面,通过某一标签,用户能够发现和收获丰富的网页资源;另一方面,对相同的网页资源,用户可以获知不同的收藏者的理解和标注方式。

3 草根分类法的不足之处

虽然草根分类法已经广泛运用于网络信息资源组织中,但它也有改进的地方,首先由于缺乏层次性的缺乏使草根分类法很难揭示复杂的关系。另外,虽然草根分类法是由用户自定义的,但是由于用户认知程度不同、用词习惯的不同,会产生大量的同义词,而且有可能对同一事物的揭示存在很大的差异,这样会造成词的冗余,加重系统负担,降低分类的准确性;而传统分类法正好可以弥补这方面的不足,因此,在以后的网络发展中,应该草根分类法与大众分类法之间寻找一个契合点使两者之间建立一种联系,将他们的优势结合起来,进而改进网络信息组织发展。

参考文献

[1]张琪玉.因特网大众分类法的本质属性[J].图书馆杂志,2002,21(11):21-22.

[2]徐少同.网络信息自组织视角下的Folksonomy优化[J].图书情报工作,2009,53(10):102-105.

作者简介

张雅红,女,河南大学图书馆,研究方向:图书分类。