APP下载

基于知识元的知识管理

2013-04-24于秀慧李宝山

山东图书馆学刊 2013年1期
关键词:细粒度量级知识库

于秀慧 李宝山

(1 同方知网(北京)技术有限公司,北京 100192;2 中国人民大学商学院,北京 100872)

1 信息的泽它时代和知识的精细化需求

近些年来,全世界的信息量呈爆炸式增长。即使在全球遭遇金融危机的2009年,全球信息量仍达到80万 PB,比上一年度增长62%。[1]美国国际数据公司一项名为“数字世界”的调查显示,2010年全球共产生近1.2泽它(zetta,10的21次方)字节的数字信息。而未来10年,全球总体信息量将是现在的44倍。[2]全球将进入信息和数据存储的“泽它时代”。

信息量的增长使人们从表面看起来不必再为获取信息而绞尽脑汁,各种各样的信息似乎触手可及,信息技术的发展也为人们随时随地获取信息提供了极大的便利。但是,这样丰富的信息资源下面却也隐藏着深层次的问题:一方面,信息和知识的高量级增长给精细的知识获取造成了非常大的难度,降低了知识获取的效率;另一方面,纷繁复杂的信息和知识很容易使知识利用者产生“博物馆效应”,降低了知识的利用效果。随着社会的进步和知识经济的快速发展,人们对获取知识的精准程度要求越来越高。同时,如何挖掘富有启示性的隐性知识成为提高知识利用效果的迫切需求。

2 知识元及其意义

2.1 知识元的含义

为了在一定程度上满足精细化的知识获取和利用的需求,有必要将承载着图书、期刊等传统载体的知识进行碎化,使知识载体的粒度细化为知识元,从而提高知识获取和利用的效率和精准程度。对于知识元的含义,众多学者都从不同的角度进行了阐释,具体如表1所示。

表1 不同学者关于知识元含义的阐释

根据知识元的含义,可以看出知识元具有独立性、拓扑性、链接性、外显性、便于存储等特点[3],可以为精细化的知识管理提供新的视角。

2.2 知识元的意义

将传统载体上的知识碎化成为知识元,并以知识元为基本单位对知识进行组织和集成对于知识的获取、传播、普及和利用有着非常重要的意义。

(1)有助于提高人们的知识获取效率

知识元将传统文献载体承载的知识细化,通过知识元人们可以直接检索并直接深入到所要了解的知识点,而不是必须浏览整篇文献来自己找到自己所需要的知识。

(2)有助于提高人们的学习能力

知识碎化为知识元之后,可以通过知识元组织和整合技术将不同内容特征的知识元和不同载体类型的知识元围绕特定的领域、问题、目标等集成起来,使人们的学习过程不再依赖于单一的文本形式,而是综合利用文本、图片、音频、视频等多种形式的知识表现形式,提高知识学习过程形象性和综合性,有利于人们学习能力的提高。

(3)有助于提高人们的创新能力

不同知识之间可以通过知识元链接形成了不同的知识链,进而形成整个知识结构的知识网络。[4]在这个知识网络中,某些知识元链接所揭示的知识关联可能是人们从未发现甚至是意想不到的一种联系,通过分析这些知识之间的联系有利于发现新的创新切入点。同时,在创新的过程中,强大的知识元网络有助于人们快速、全面的了解某一领域的系统知识,为创新奠定基础,提高创新能力。

3 基于知识元的知识管理

3.1 基于知识元的知识管理框架

以知识元为基本知识单位的知识管理,通过对知识的量级碎化管理和对知识元的整体集成管理,形成各种类型的知识元库。知识的量级碎化管理主要是通过知识挖掘和知识抽取等相关技术将隐藏在传统载体中的知识元挖掘和抽取出来,并进行聚类,形成具备不同特点的各种类型知识元。这些知识元在知识的内容表现上更加收敛,能够独立的针对某一内容进行清晰地描述,并且可以作为知识的基本单元为知识元库的构建奠定更细粒度的知识资源基础。知识元的整体集成管理主要是通过知识组织和知识整合等相关技术将碎化后的知识元按照各种不同逻辑进行知识关联,形成知识元之间的逻辑关系网,同时综合集成各种知识服务功能和知识平台建设,构建出针对不同需求的、不同类型、不同层次的知识元库。上述基于知识元的知识管理框架具体如图1所示。

图1 基于知识元的知识管理框架

3.2 知识的知识元量级碎化管理

知识元量级碎化管理主要是指对知识资源进行基于知识元的细粒度碎化、拆分、标引,使内容资源以不可再分割的最小单元进行存储、聚类和展示等。知识元的量级碎化有多种方式,根据内容特征的不同,可以将知识资源碎化为数值型知识元、定义型知识元、术语型知识元等;根据知识元载体表现形式的不同,可以将知识碎化为文本型知识元、图片型知识元、音频型知识元、视频型知识元等。碎化后各种典型知识元的主要特征如表2所示。

在传统的知识载体中,多种知识元与该载体是同时绑定在一起的,对于知识元的拆分只能是用户在浏览该知识载体中所包含的所有知识的过程中自行拆分。通过知识资源的知识元量级碎化管理,可以将文献等传统载体中隐藏的不同类型的知识元分离和抽取出来,实现细粒度知识的直接检索和查询,为知识的深入准确定位奠定基础。用户检索的过程中,可以选择更精确的关键词与知识库中知识元进行匹配,在很大程度上可以解决因检索词的含义或范围过窄而导致在知识库中无精确匹配项的问题。这种底层的数据结构不仅可以提高查询速度,也提高查准率,避免模糊检索的诸多弊端。同时,知识通过深度加工碎化为知识元后,其内容和形式都实现了有效的收敛,为深入分析知识之间的逻辑关系、进行精细化的知识组织和知识元库集成管理奠定了细粒度的知识基础。

表2 各种典型知识元

3.3 知识的知识元库整体集成管理

知识的知识元库整体集成管理是以知识元为基础和核心,通过知识关联技术建立知识元与知识元之间、知识元与其他知识载体之间的链接,并综合集成相关知识管理和知识服务功能,通过知识组织和知识整合技术建立不同层次的、面向不同用户需求的知识元数据库。通过知识元库可以对碎化后的知识元进行重新组合,使不同内容特征和不同载体形式的独立知识元按照特定的目标和逻辑关系构成一个有机的整体,从而形成面向知识精细化利用的细粒度知识集成。

根据构成层次和主要用途的不同,可以将知识元库集成管理中所涉及的知识库大体分为五大类型,即基础型知识元库、相关知识库、学习型知识元库、发现型知识元库和创新型知识元库。其中基础知识元库由各种基础类型的知识元组成,它是不同层次知识元库的最底层、最核心的知识资源基础,也是知识元库满足用户需求的必要前提;相关知识库主要由各种与知识元相关的知识库组成,如来源文献知识库、引文知识库、关联关系知识库等,这些知识库是知识元库与其他类型知识资源库之间重要的连接桥梁,使知识元库在收敛的同时又具有开放性的特点;学习型知识元库、发现型知识元库和创新型知识元库是建立在基础知识元库和相关知识库基础上的综合性知识元库,这三大层次的知识元库可以按照用户学习和研究过程的深入程度提供不同的知识服务。

(1)学习型知识元库

学习型知识元库对现有的显性知识进行全面梳理和整合,将各种类型的独立知识元按照学科、行业、应用领域、研究问题等不同的方式进行聚类,建立知识元之间的关系链接,形成针对某一领域相对比较完整的知识架构和体系。在学习型知识元库中围绕某一聚类核心,定义知识元、术语知识元、原理知识元等内容型知识元可以结合文本、图片、音频、视频等不同形式的表现形式,全面形象的展示与该聚类核心有关的各方面知识,为学习者提供一个全面、立体、形象的知识体系,提高人们的学习效率和效果。同时,构建知识元与其他各种各类知识资源之间的相互关联,从而形成知识网络,满足人们快速了解各学科知识基本内容的需求和发现知识之间内容关联的需要,促进显性知识的整合、普及和利用。

(2)发现型知识元库

知识发现的定义是1996年由Fayyyad等人给出的:是指从大量数据中获得有效的、新颖的、有潜在应用价值的和最终可理解的模式的高级处理过程。[5]基于知识元的知识发现以知识元的内容分析为主,用规范的方法读取知识元所包含的内容,获取知识元中潜层或隐含的本质性信息和知识,通过对已有知识元的深入分析和加工,将大量的知识元以量化的形式表达出来,从而发现知识元之间的潜在关联。

发现型知识元库的关键是通过统计分析法、人工神经网络、决策树和关联规则等方法,对海量的知识元进行定量分析、推理分析等,发现知识元内部的隐性知识及知识元之间的隐性关联,推动和促进隐性知识的开发和利用。发现型知识元库通过对现有知识的深度挖掘,可以实现可知知识存量的持续累积和增加,使人们对客观世界的认识更加全面、更加深入,为创造新知识奠定基础。

(3)创新型知识元库

创新型知识元库在发现现有知识之间潜在关系的基础上,分析这些潜在关系的内容、性质和价值,同时综合利用所挖掘的隐性知识和所积聚的显性知识辅助研究人员进行科研创新。

创新型知识元库对海量知识元数据按照研究领域、所解决的研究问题、所使用的研究方法、所使用的原始素材和资料等不同方面,进行聚类分析、时间序列分析、拐点分析等统计学分析,使隐藏在海量数据中的人脑很难驾驭和分析的现象或规律利用计算机强大的定量分析能力分析和展示出来。其中,非常重要也是十分具有挑战性的工作是总结和构造不同领域的创新评价指标和标准,建立相对科学合理的创新评价体系,帮助研究人员对已有的创新成果进行衡量和评价,从而从中获得持续创新的启示。根据上述分析结果,研究人员可以利用人脑所特有的定性分析能力,结合自身的专业知识、研究经验、科研嗅觉等探索可能的创新切入点。创新型知识元库通过辅助人们创造新知识,使整体的知识存量不断增加,推进知识生命周期的不断螺旋式上升,进而提高人们改造客观世界的能力。学习型知识元库、发现型知识元库和创新型知识元库三种主要类型的知识元库结合人类认识和改造客观世界的过程,不断深入探索、挖掘和开发知识元的价值,形成逐层递进、逐层上升的知识元结构体系。在该知识元体系中匹配相应的互动功能设计,加强用户与知识库之间的互操作,用户可以按照自己的研究思路在知识元库中进行大量数据分析,从而推动研究的进展。甚至对于自己的某些大胆猜测或突发奇想,用户都可以通过互动功能方便的在知识元库中进行验证,从而激发人们的创新思维。

综上所述,基于知识元的知识管理一方面可以通过知识元的量级碎化管理,细化知识粒度,提高显性知识的利用效率和效果,另一方面可以通过知识元库的整体集成管理对知识元进行不同层次的组织和整合,对开发困难较大的隐性知识挖掘进行有益的探索,促进显性知识和隐性知识的综合利用。

〔1〕何元.基于云计算的海量数据挖掘分类算法研究[D].成都:电子科技大学,2011

〔2〕张敏.数据库安全研究现状与展望[J].中国科学院院刊,2011,26(3):303-309

〔3〕付蕾.知识元标引系统的设计与实现[D].武汉:华中师范大学,2009

〔4〕姜永常.基于知识元的知识仓库构建[J].图书与情报,2005(6):73-14,105

〔5〕于春丽.学科服务中的知识发现策略研究[J].图书馆学研究,2010(7):92-94

猜你喜欢

细粒度量级知识库
融合判别性与细粒度特征的抗遮挡红外目标跟踪算法
基于SVM多分类的超分辨图像细粒度分类方法
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
基于web粒度可配的编辑锁设计
21连胜
支持细粒度权限控制且可搜索的PHR云服务系统
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
位置与方向测试题