APP下载

面向网络信息发现的标签研究

2014-11-28郭晓溪谭益阳

河南图书馆学刊 2014年8期
关键词:网络信息标签

郭晓溪 谭益阳

关键词:网络信息;信息发现;标签

摘要:文章对标签、分众分类法及标签云进行了概述,分析了标签在网络信息发现中的作用,并指出了标签存在的问题,提出了面向网络信息发现的标签发展建议。

中图分类号:G254文献标识码:A文章编号:1003-1588(2014)08-0128-03

收稿日期:2014-07-11

作者简介:郭晓溪(1992-),中山大学资讯管理学院本科生;谭益阳(1988-),中山大学资讯管理学院硕士生。1标签、分众分类法与标签云

1.1标签及分众分类法

标签是用户为方便自己再次发现和使用资源而为资源赋予的别名,是将资源和用户头脑中的某个概念联系起来的一个纽带。标签最初来源于2003年出现的社会性书签工具,如Delicious(美味书签)使用标签对网络资源链接进行标注。而后,Flickr(闪亮图片)、豆瓣等网站使用标签标注实体资源并得到迅速的推广和应用,进而引发了分众分类法的出现和流行。“Folksonomy”一词是由信息构建专家Thomas Vander Wal在2004年提出的,并被解释为“是个人用户为满足自身检索的需要,对信息或对象自由添加标签的结果,用户添加标签的行为是在一个社会化的环境中进行,即这个环境是开放的、共享的”。

分众分类法也被称为大众标注法(collaborative tagging)、社会分类法(social classification)、社会标引法(social indexing)或社会标注法(social tagging),是一种“自下而上的社会化分类方法”。国内许多研究将标签和分众分类法等同,但实际上二者有一定的区别。分众分类法是基于大量标签的协作而产生的对网络资源分类的信息组织方法,而标签是用户对网络资源的一种标识。

1.2标签云

标签云(Tag Cloud)是标签集合的一种展示方式,其根据每位用户提交的标签及每个标签的使用频率或被关注度等指标为权重,定量地计算每个标签的权值,然后用不同颜色或不同字体以及不同标签位置等表示每个标签的权值,并形象、直观地在页面上展示给用户。通过标签云,用户可以灵活地依照字序或热门程度来检索一个标签,而大多数标签本身就是超链接,直接指向与标签相关联的一系列条目。标签云按照应用主体可分为个人标签云、社群标签云、网站标签云、系统标签云等。标签云的产生通常借助一定生成工具,如tagcrowd、wordpress等。标签云在其产生开始就具有简单、高效、方便、灵活等特性。标签云率先被应用于Flickr网站,而后随着Delicious、Technorati等网站对其的使用而得到不断推广,并迅速成为当前流行的Web2.0应用之一。

2标签在网络信息发现中的作用

2.1标签描述网络信息,引发基于标签的信息检索

在海量的网络信息中,要找到所需信息,则需要对信息进行关键词检索,而标签本身就是关键词。同时,标签能够为网络信息提供多维度的描述,如一张图片的标签,既可以是图片的内容,也可以是图片的颜色,还可以是图片产生的时间、地点等,提高了该信息被检索到的机率。目前,大部分网站提供标签检索功能,以方便用户快速寻找标签,进而找到对应的网络信息,国外还推出了基于标签系统的搜索引擎,如Mnemonmap、Ouintura、Technorati 等。标签系统可以通过添加语义词典或本体控制标签语义等手段解决检索过程中标签的语义问题和推荐问题,进而降低用户检索的难度。此外,用户标签质量的提高也会极大地提高检索效果,因为标签是由用户创造的,与权威的受控词表不同,它能够更准确地反映用户对信息资源的概念模式,从而能更贴近用户的认知,增强用户的体验,节省用户检索的时间。这些都使得基于标签的网络信息检索成为用户发现信息的重要方法,也成了当下研究和探索的方向,将在一定程度上弥补当前搜索引擎检准效果不佳的缺陷。

2.2标签催生分众分类法,促进网络信息的分类、组织和导航

标签的趋同性和稳定性在标签的长期使用和数量不断增加的条件下得到了体现。Adam Maths提出,大量标签遵循负幂分布,即少量的标签(一般为热门标签)被大量使用,大量标签只有少数人使用,更大多数的标签只有一到两个人使用。被大量使用的“少数标签”积累下来,变形成核心词汇(即高频标签),这些核心词汇自然地构成了一个分类体系,因此产生了新的网络信息分类法——分众分类法。与传统的分类体系不同,分众分类法因为标签没有层级之分而呈现出平面性、非结构化的特点。然而,在不同的网络信息系统中,可能会产生不同的分众分类法,这主要取决于网络社区的性质以及该社区用户的兴趣、爱好、文化层次、语言习惯和认知水平等因素。通过分众分类法,网络信息便可形成不同的类别,能使用户更快地发现信息。同时,通过分众分类法,还可以将拥有相同或相似标签的网络信息进行聚类形成不同类别,达到网络信息的分类、组织和导航的作用,有利于网络信息的发现。但标签的随意性和自由性可能会导致同类信息不集中,因此部分网站把传统分类法与分众分类法进行融合,把基于标签的分众分类置于传统分类之下,起到相互补充的作用。

2.3标签建立关联网络,实现个性化信息推荐,拓宽信息发现的渠道

郭晓溪,谭益阳:面向网络信息发现的标签研究郭晓溪,谭益阳:面向网络信息发现的标签研究在Web2.0的信息环境中,用户不仅强调个性化信息服务推荐机制,希望能够快速地获取信息反馈,并在反馈的过程中使结果更趋向于自身需求;同时也希望通过信息共享的社会网络平台来拓宽自身的信息获取渠道。标签将原来的<用户、资源>二元组变成了<用户、标签、资源>三元组,不仅使用户和信息资源对象建立了联系,还在用户集合、标签集合以及信息资源集合间形成了一个关联网络。在这一关联网络中,用户可以通过相同或相似的标签找到不同的用户和资源,也可以通过相同或相似的资源找到不同的用户和标签,因而,系统在向用户进行个性化信息推荐时可以向用户推荐资源、标签或者是其他用户[1]。基于这种关联性,具有相同兴趣爱好的用户聚集在一起形成了虚拟社区,用户可以在这样的虚拟社区中交流和沟通,促进了信息的共享,也能将个人智慧有效地上升为集体智慧,再转化为个人智慧,从而提高个人、组织的学习、工作效率,使社区内的知识管理成为可能,拓宽了用户发现信息的渠道。

2.4标签云可视化,挖掘知识、完善个性化信息推荐

随着标签云的渐渐普及,标签云的作用和影响引起了研究人员的关注,成为了国内外研究的热点之一。沈奎林等人认为,标签云对学术资源的揭示有重要作用,能够提供一种新的检索和导航方式[2];倪娟提出了标签云对学科知识服务的作用[3];刘斌和杨帆利用关联分析和聚类算法,将标签云与地理信息导航结合在一起研究,实现了基于用户偏好的移动餐厅推荐系统;而国外学者Sinclair和Cardew-Hall通过实验认为,标签云虽不能完全替代信息搜索任务,但可以用于扩大用户检索过程[4]。对于信息发现而言,更重要的是标签云能够通过标签或用户的聚类算法来挖掘知识。通过对一个学科领域在不同时间的标签云进行比较,用户可以直观地了解到该领域知识的新发展。动态的标签云在用户浏览过程中还可以使用户发现位于边缘的标签,这可能使用户意外地发现信息,增加了信息偶遇的情况。此外,将标签云嵌入个性化推荐机制中,对用户或虚拟社区的标签进行实时抓取和分类,并采用词频统计的方法进行分类,有利于推荐系统准确了解用户或社区的知识需求,更有针对性地找出与用户、社区需求相匹配的知识信息,消除推荐结果的偏差,完善个性化信息推荐。

3面向网络信息发现的标签问题及发展建议

3.1标签存在的主要缺陷

3.1.1标签多样性与模糊性。分众分类是基于标签语法层次的简单聚合分类,不同标签可能是近义词,它们能够表达同一语义,如“电脑”和“计算机”两个不同的词指示同一事物。这种标签的多样性会影响到信息的聚合分类。用户所标注的标签往往会出现一词多义的现象,在缺乏语境的情况下,标签所表达的语义是模糊的,如“杜鹃”既可以指鸟,也可以指花。标签的模糊性会降低信息组织的清晰度,进而降低信息检索的准确度。

3.1.2标签随意性与平面性。虽然标签的随意性体现了信息组织的人性化,但随意性可能会使标签产生混乱和无序,也会增加“垃圾标签”的产生,如:对一张内容为动物的照片标记为人物后,对其他用户而言,其是无意义的。标签的平面性使得网络信息不以传统的树状分类,给用户带来了方便。但标签类目的平面非等级结构也造成了主次不分、重要信息被隐藏等问题,同时也使用户在进行标签检索时,难以确定标签的主次,重要的信息就可能不被检索到,从而影响用户的检索效率[5]。

3.1.3可视化标签云的实用性。用户对标签云的使用一般是浏览而非阅读,且不会注意到云图中的所有标签。因而,标签云图的可视化属性(吸引用户的注意)和性能(用户通过标签云图满足自己的需求)决定了标签云的实用性。目前,普遍的标签云的字体、颜色、大小等属性并不能吸引用户的注意,云图中标签的排序算法也较为单一,不能提供基于不同算法的标签云图之间的转换,同时,其也缺乏与用户的互动,无法让用户获得意外的信息发现。

3.2标签发展建议

3.2.1融合传统的网络信息组织方法,增加标签系统推荐功能。将传统的主题词表、分类目录等嵌入标签系统中,同时结合相应的信息抽取技术、数据挖掘技术等对用户即将标注的对象进行分析,当用户需要进行标注时,系统则可为用户推荐基于内容或用户时间、空间、社会背景或者相关社会网络内群体知识的标签,从而从标签的产生开始就对标签进行规范,以减少标签的随意性带来的噪音和垃圾,提高标签的质量,还可使网络信息分类更准确。而在用户使用标签进行检索时,也可提供建议的标签,从而保证使用的标签关键词能与系统标签最大限度地匹配,提高检索的准确性。

3.2.2优化显示效果,改进排序方法,完善标签云。利用JavaScript、Flash、Css等网页显示技术优化标签云的显示效果,将标签云设计成动态、3D、可缩放的效果[6],当用户需要查看处于云边缘或较小字体的标签时,可以随意拖动或缩放标签云,既可以吸引用户的眼球,还能增强用户体验。同时,改进云中标签排序算法,采用标签共现或语义分析的标签聚类算法,可以增强云图中标签的语义关系,增加时间轴控制功能[7]。此外,提供字序、语义关联、标签频度等云图之间的转换功能,可以使用户通过不同类型标签云的浏览发现更多信息。

4结语

Web2.0时代的网络已经远远超越了其最初的形态,网络信息发现也越来越艰难。 标签的出现适应了时代需求,催生了网络信息的新的分类组织方法,推动了网络信息自组织的发展,也为用户更快更准地发现信息提供了便利。未来,在网络信息发现的过程中,标签仍是必不可少的工具,在不断克服缺陷的探索完善过程中,其将发挥更大的效用。

参考文献:

[1]曾子明,张振.社会化标注系统中基于社区标签云的个性化推荐研究[J].情报杂志,2011(10):128-133.

[2]沈奎林,邵波,卢明.标签云在学术资源解释中的研究与应用——以中国知网数据库中图书情报类核心期刊论文关键词为例[J].图书馆论坛,2013(3):36-42.

[3]倪娟.论标签云在高校图书馆学科知识服务中的作用[J].图书馆,2013(6):18-20.

[4]Sinclair J, Cardew-Hall M.The Folksonomy Tag Cloud:When is it useful[J].Journal of Information Science,2008(1):15-29.

[5]金燕,陈玉.基于本体的标签控制方法研究[J].图书馆理论与实践,2010(7):26-29.

[6]黎邦群.相关关键词与相关图书标签云[J].图书馆建设,2013(8):11-15.

[7]曹红兵,胡昌文.一种带时间轴的热门关键词云图的设计与实现[J].图书情报工作,2012(12):107-112,95.

(编校:严真)

猜你喜欢

网络信息标签
论如何有效应对网络信息安全问题所带来的威胁
浅谈高校网络信息安全问题与对策
网络信息下高中生投资理财观念培养
透视网络信息对中国共产党和政府的隐性攻击分析方法研究
狠撕“柔弱林妹妹”标签请叫我率性蒋老板!
让衣柜摆脱“杂乱无章”的标签
科学家的标签
科学家的标签
标签新闻
不要给孩子贴上“胆怯”的标签