APP下载

基于搜索引擎的采办知识管理系统设计

2012-04-29何晓川张荣荣苏俊杰

科技资讯 2012年24期
关键词:搜索引擎知识库文档

何晓川 张荣荣 苏俊杰

摘要:为加强采办知识管理工作,在分析知识管理和搜索引擎技术的基础上,对采办知识管理系统进行了阐述,设计了系统架构,详细说明了各子系统的功能以及用户核心需求。

关键词:采办知识管理搜索引擎系统架构

中图分类号:TP182 文献标识码:A 文章编号:1672-3791(2012)08(c)-0005-03

现代化采办过程涉及的知识领域不断增多,对采办实施知识管理已成为提高采办效益的必然选择。采办知识管理系统能够实现对知识的有效组织、管理和应用。随着采办知识管理系统内部知识的爆炸式增长,采办人员极易迷失在海量的知识中,给用户查找所需信息带来了困难。知识管理系统必须为用户提供有效的信息查询手段,而知识搜索引擎作为知识管理系统中的核心组成,是采办人员获取知识、学习知识的重要工具。文章以知识流转过程为依据,以搜索引擎为依托,分析設计了功能丰富的采办知识管理系统。

1知识管理的特点

知识管理是知识经济时代的必然产物,知识管理专家Yogesh Mathotra认为:“知识管理是在日益加剧的不连续环境变化的情况下服务于组织适应、生存和能力等关键问题的活动。其实质在于信息技术处理数据的能力及人们创造和创新能力有机配合的组织过程”[1]。知识管理是对知识的一种全新管理理念,知识管理不同于信息管理,知识管理更加注重知识的应用和创新。知识管理主要有以下几方面特点[2]。

(1)知识经济的到来是建立在现代化信息技术的基础之上,没有信息技术和网络技术的支持,知识的作用得不到体现。

(2)知识管理的作用不仅仅是对已有知识的共享和使用,而是通过知识的交流和沉淀,实现知识的创新并用于实践,实现知识的价值。

(3)知识管理扩大了人们可利用知识的范畴,它不仅关注显性知识,更重视隐性知识的收集和共享。知识管理的作用之一就是实现了隐性知识向显性知识的转化。

(4)知识管理的各个环节都离不开人,知识管理的作用只有通过人的参与才能得以体现,人是知识创新的动力和源泉。

2知识管理系统分析

知识管理系统(Knowledge Management System,KMS)是实施知识管理的有效工具,是为保持某行业领域内的竞争优势而用来管理领域知识的综合系统[3]。Alavi等人将知识管理系统定义为一个支持并注重知识的创新、存储、检索、流转和应用的信息系统[4]。

根据应用领域的不同,知识管理系统结构有所区别,但基本实施过程通常包括知识获取、知识提炼、知识存储、知识共享、知识应用和知识创新[5]。

知识获取:知识获取是知识管理过程的基础和前提,知识的来源包括系统内部和外部。

知识提炼:知识提炼是指对获取的知识进行进一步的处理,主要利用一些数学的方法对知识进行过滤和挖掘,并对一些不确定的知识进行推理、判断和分类。

知识存储:知识存储是指将提炼后的知识以一定的组织形式存储到相应类型的知识库中,以方便日后的管理和使用。

知识共享:知识共享是指利用搜索或推送等技术手段在系统内部实现知识的交换和讨论,方便用户对知识库存储知识的访问。

知识应用:知识应用是指利用获取的知识来解决用户在实际工作中所遇到的困难和问题,是知识管理概念应用价值的体现。

知识创新:知识库中的知识需要不断的更新以满足业务需求。知识创新是指通过人员的实践,在原有知识的基础上产生出新方法、新理念、新思想的过程。

3搜索引擎技术

搜索引擎通常由搜索模块、索引模块、检索模块三部分组成,如图1所示。不同的搜索引擎会根据自己实际需要进行模块的变化和扩展,但都建立在这三个基本模块的基础之上[6]。

3.1 搜索模块

搜索模块的主要工作是在网络中漫游,以便发现和搜索信息。搜索模块通过一个称为网络爬虫的程序从种子站点开始在网络中自动爬行。首先读取网页的内容,找到在该网页中的链接地址,然后通过链接地址再发现下一个网页,一直循环下去。目前爬行策略分为两种:一种是按照深度优先、宽度优先或者启发式方式发现新的网页链接;另一种是将网络中的网页信息按照IP地址或者域名划分为几个子域,然后多个爬虫程序并行爬行各个子域中的网页。

在应用中,可根据具体的应用背景对爬取网页的类型和范围进行控制,以提高信息发现和更新的速度。

3.2 索引模块

文本索引模块的主要功能是处理和分析非结构化文档,索引器从原始文档中抽取索引项,用于表示文档,并生成文档集合的索引表。

3.3 检索模块

检索模块的主要功能是根据用户输入的查询请求在索引库中快速检索出文档,进行文档与查询的相关度评价,并对将要输出的结果进行排序。

在应用中,可采取一些措施来提高搜索引擎的性能以方便用户,例如查询扩展处理、智能代理、信息分类和摘要等。

4采办知识管理系统设计

4.1 系统架构设计

采办知识管理系统按照采办业务需求分为知识资源层、知识产生层、知识处理层、知识应用层和知识汇聚层五个层次,其结构如图2所示。

各层主要功能如下。

(1)知识资源层。

知识资源层是知识管理系统的知识来源,也是知识管理系统建设的基础。知识资源层涵盖采办过程所涉及的各个领域,并覆盖各种类型的知识,包括显性知识和隐性知识。

(2)知识产生层。

知识产生层也就是知识生命周期的流转过程,实现方便有效的沉淀知识资源、提炼加工知识资源、建立知识点间的关联,促进知识交互过程的创新行为。

(3)知识处理层。

知识处理层主要涉及到对知识资源的整理和价值分析,通过建立有效的知识分类,进行有价值的知识挖掘,通过知识评价促进知识的新旧轮转和淘汰。

(4)知识应用层。

知识应用层强调与采办信息化训练与研究平台中各个子系统业务的集成,促进业务和流程的执行效率,并通过有效的知识获取和交互渠道,实现自主的知识学习。

(5)知识汇聚层。

知识汇聚层通过建立统一和个性化的知识门户,促进知识的集成,这种知识汇聚不仅能够汇聚知识资源层的知识资源,还能够展示各个子系统业务/流程的知识。

4.2 管理功能设计

采办知识管理系统总体功能包括基础管理功能和业务管理功能两部分,其功能组成如图3所示。

基础管理功能为平台各子系统提供基础的数据管理服务,在这里不做赘述。各业务管理功能模块实现功能如下。

(1)采办知识库。

知识库是知识管理系统的基础,知识库能为用户提供良好的知识共享环境并能动态地对其中的知识进行实时的更新和维护,是知识管理系统成功实施的关键。采办知识管理系统建成结构合理、内容丰富的采办知识库,为平台各类训练系统的教学和训练提供知识体系、知识推送、知识订阅、知识协作、知识支援、知识学习和知识创新环境的支撑。采办知识库主要包括课程知识库、教材专著知识库、案例知识库、研讨知识库、研究论文知识库、采办试题知识库、采办法律法规知识库等专业知识库。

(2)采办知识门户。

采办知识门户为采办人员提供一种自主学习环境,也是一种知识的共享和应用机制。该模块建立了多个专业领域的知识门户,包括发展需求论证专业知识门户,采办费用管理和训练专业知识门户、采办项目管理专业知识门户等,集中汇聚本专业领域的知识,形成有效的知识群,能够为相关岗位的工作人员提供第一手的、全面的知识支撑环境。

(3)采办知识研讨厅。

采办知识研讨厅模块旨在建立采办知识共享和交互机制,这同样也是挖掘隐性知识的需要。采办知识管理系统按专业设立项目管理、质量管理、合同管理、价格管理等领域的论坛和社区,并建立合适的研讨管理机制,一方面为采办专家和教员与学员进行互动提供支持,另一方面为采办人员搭建基础的知识交流、研讨环境。

(4)采办专家咨询。

采办专家咨询是指当采办人员遇到急需解决或困惑的问题时,可以在线向专家提问,或借此通过其它联系方式同专家取得联系进行咨询求助。采办专家咨询模块建立采办专家名录,搭建方便的专家咨询环境,支持专家隐性知识挖掘,并在知识挖掘基础上,进行知识梳理,知识沉淀。该模块建立知识支援机制、促进知识协作和交流,并充分利用和挖掘采办专家和相关领域人员的隐性知识资源来解决问题,促进隐性知识向显性知识的转化。系统建立了专家知识库,用户通过访问专家知识库,了解专家的学科专业和经历经验等信息,可以有针对性地向专家获取相应的知识,加速了隐性知识向显性知识的转化。

(5)采办知识搜索。

采办知识搜索作该系统的一项基础服务,主要为采办用户提供知识检索功能。采办知识搜索能够实现查询关键词的自动查询扩展优化,并对返回的搜索结果进行聚类分析。采办知识搜索更加注重搜索结果的准确率,加快信息的查找速度,使采办人员能够在最短的时间内找到自己所需的信息,加速系统内知识的流转、共享和创新。

(6)采办知识应用。

采办知识管理系统建立多种知识应用手段,包括知识推送、知识订阅、知识推荐、知识点评等。基于多种应用手段,该系统将采办知识库中的海量知识活动起来,自动推送给所需要的人,使知识的价值最大化。

4.3 知识搜索引擎需求

采办知识搜索引擎为知识汇聚、知识发现、知识聚类、知识门户的构建等提供支持,通过搜索引擎技术完成知识管理的使命。知识搜索引擎建立在明确的知识来源基础之上,根据用户的身份与请求,回馈最准确恰当的知识,为特定用户提供搜索服务,更加强调知识的准确性和标准性,强调通过互动机制,如评价、交流、修改、维护等进行搜索结果的自我学习,以达到知识搜索的智能化。

采办知识管理系统建设的重要意义在于通过对采办相关知识的有效管理,加速知识的流转和使用,促进隐性知识向显性知识的转化,从而提高了采办工作效率。从图2采办知识管理系统模型中可看出,采办知识搜索引擎作为系统知识应用的一种基础服务,在采办人员和所需知识之间起到了桥梁作用,是发挥采办知识作用的催化剂。

通过项目前期对采办人员进行的调研和需求分析,采办知识管理系统目标用户对知识搜索引擎方面的需求集中体现在以下两个方面。

(1)搜索结果的查全率(Recall)和查准率(Precision)。

查全率和查准率是目前最常用的搜索引擎检索质量评价标准[7]。查全率是指系统在进行某次检索时,检索出的相关文档数量与系统中所有相关文档数量的比率,反应了系统检索的全面性;查准率是指检索出的相关文档数量与检索出的所有文档总量的比率,反应了系统检索的准确性。

目前大多数搜索引擎采用基于关键词匹配的检索模式,用户在进行检索时往往只输入少量的关键词进行查询。由于采办人员的经验不足等原因,往往输入的关键词不能真正体现用户的查询意图,再加之中文词语的多义性,一个词语在不同的语境中会表现出不同的含义,导致了检索结果中充斥着许多与用户意图无关的结果,影响了搜索引擎的性能。

(2)搜索结果的结构化呈现。

搜索引擎为采办用户查找信息提供了便利,但随着数据的激增,搜索引擎也暴露出许多不足,其中一个重要的原因就是搜索结果通常以一个线性列表的形式进行呈现,缺乏清晰的结构,用户必须逐个浏览返回的查询结果,不仅给用户带来不便,也削弱了搜索引擎的使用价值。

5结语

文章分析了采办知识管理系统中关键技术的相关概念和特点,详细描述了设计的采办知识管理系统的层次结构和相关模块的功能,最后对采办知识搜索引擎的功能、特点进行了描述,总结了目标用户对搜索引擎的功能需求。

参考文献

[1] 樊治平.知识管理研究[M].沈阳:东北大学出版社,2003:21.

[2] 姜媛.移动通信运营企业知识管理系统研究[D].北京:北京邮电大学,2009.

[3] Vizcaino.A multi-agent model to develop knowledge management system[C].Proceedings of the 40th Annual Hawaii International Conference on System Science,2007.

[4] AlaviM,Leidner DE.Knowledge management and knowledge management system[J].Conceptual foundations and research issues.MIS Quarterly,2001,25(1):107-136.

[5] 李绪成,王保,杨建安.知识管理研究[J].情报杂志.2005,1:114-117.

[6] 丁宬杰.搜索引擎技术的研究与发展[D].上海:上海交通大学,2006.

[7] 李新友.信息检索中查询扩展技术研究[D].南宁:广西师范大学,2007.

猜你喜欢

搜索引擎知识库文档
有人一声不吭向你扔了个文档
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
基于RI码计算的Word复制文档鉴别
高速公路信息系统维护知识库的建立和应用
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
基于Drupal发布学者知识库关联数据的研究
网络搜索引擎亟待规范
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发
广告主与搜索引擎的双向博弈分析