APP下载

基于本体的案例推理模型研究

2019-10-30历子谦刘宝

科学与财富 2019年30期
关键词:本体模型

历子谦 刘宝

摘 要:提出了一种基于本体的相似度评估的方法和案例检索以及一种基于本体的案例自适应模型,这使得CBR(Case-based Reasoning)系统的开发能够在语义层次上进行相似性评估和案例自适应,从而得出结果。可以更好地反映用户的真实需求;并可以从中获得CBR所需的领域知识。本体获取极大地减少了传统CBR系统中知识获取的瓶颈。最后,提出了一种基于本体的CBR系统模型框架,从软件复用的角度提高了CBR系统的开发效率。

关键词:本体;案例推理;语义相似性;案例适配;模型;

1、CBR与本体的结合

1)本体作为CBR系统词汇

针对案例的词汇,一种直接的表达方式是使用领域本体以一种面向对象的方式来表达它,即概念上对应的类和个体对应的对象,而关系对应于描述对象的属性(可以分为数据类型属性和对象属性)。案例结构可以通过本体中的类来定义,例如destination目的地概念,可以将其视为一个类,并且该类的实例可以是北京或上海等。类似地,对于查询词汇,本体也可以用于定义和表达更丰富的查询,以便用户可以更好地表达他们的需求。在相似性评估中,本体可以在语义级别上填补查询词和案列词之间的空白。

2)基于本体的案例检索

在案例检索中,相似性评估是非常重要的推理环节,用于评估查询和检索到的案例之间的相似性。使用本体知识时,概念层次结构及其在本体中的关系将对相似性评估产生有益的影响。类层次结构包括对象之间的相似性知识。在本文中,我们定义并使用基于本体的案例相似性度量函数。一般而言,两个结构化案例的相似性可以分为全局和局部两个层次。局部相似性是简单属性之间的相似性,而全局相似性是简单属性的加权平均值,也称为平均相似性,可以通过以下公式计算:

averageSimilarity=∑i=1nlocalSimi(i)×weightaverageSimilarity=∑i=1nlocalSimi(i)×weight(i)/∑i=1nweight(i)(i)/∑i=1nweight(i)

其中:n为简单属性的个数;localSimi (i) 表示案例间第i个简单属性间的相似度 (0~1的某个值) ;weight (i) 表示第i个属性的权重。

局部相似性度量使用了基于本体的概念相似性度量标准。基于本体的相似性度量从不同的角度可有多种方法, 本文定义了如下两种:

deep_Simi (ci, cj)

=max (depth (commonSuper(ci,cj)))/maxCi∈CN(depth(Ci))  cosine_Simi (ci, cj) =|super (ci, C) ∩super

其中:CS为本体中的概念集;super (c, C) 表示概念c的超概念集;commonSuper (ci, cj) 表示两个体ci、cj共同的超概念集;depth (c) 表示概念c的深度。

3)基于本体的案例适配

本文利用描述逻辑的推理机制定义了基于本体的模型和基于替代的适配方案。替代的定义如下:若依赖关系Depends On(i1,i2 )成立,當i1被另外一个值i1″代替时,为了使关系Depends On()仍然成立,必须找到i2的代替物i2″。因此需要在知识库中声明i2″与i1″的关系应与i2与i1的关系相似。

2基于本体的案例推理模型框架(MONCBR)

从头开发CBR应用程序将是一项艰巨的任务。但是,如果我们可以重用以前开发的某些组件和推理方法,则开发效率将大大提高。从这个角度出发,在以上关于本体和CBR结合的讨论的基础上,本文提出了一个开发CBR应用程序的模型框架。由于该框架可以集成以前的开发结果,并为将来的开发提供通用的开发过程和接口,因此在两个方面都很好地支持了软件工程中软件重用的想法。

下面分别介绍各层的功能及其实现。

2.1持久层

持久层是指案例的持久化的存储位置,其可以是数据库,文本文件,或是描述逻辑本体的持久存储位置。可以根据知识类型同时选择几种方法。有许多方式来表达的情况下,如最一般的(属性值),结构化表示,基于框架的表示,面向对象的表示和语义网络方法。

2.2连接器

连接器是一种接口并且是接口层的主要组件。它负责访问和检索持久层案例,并以统一的方式将案例返回给CBR系统。根据案例持久存储的三种主要方式(关系数据库,本体库,文本文件),下面将描述相应的访问方法和技术实现:

2.2.1关系数据库连接器

由于该框架基于Java技术,因此可以充分利用Java Bean和J2EE的最新核心技术Hibernate。关系数据库的情况也可以用Java Bean表示。Java Bean是Java类。每个公共属性都有其自己的get和set方法。它的修改和管理可以通过称为Introspection的Java技术自动实现。

2.2.本体连接器

本体连接器用于访问存储在本体中的知识。用于访问存储在本体中的知识。Jena是基于Java语言的语义Web开发工具,提供用于处理Modal类的RDF图的API。使用这些API,用户可以选择将RDF图存储在内存或持久性存储(文件或数据库)中。新版本的jena2支持基于RDFS和owl的语义推理,并提供了相应的API工具包,因此该层的实现主要基于Jena工具包。

2.2.3文本连接器

由于许多经验都以文本形式存在(例如网页),因此访问文本案例非常重要。该层的实现首先使用信息提取方法来获取文本信息,然后使用结构化的方式来表达案例。这样,可以使用常见的CBR方法(例如最近邻算法)进行推理,因此文本信息的提取是该层的关键。

2.3案例的内存组织

通过将连接器对象连接到特定的案例持久性层,将案例加载到内存中,然后需要一个数据结构来组织案例。好的数据结构将大大提高效率。针对具体的案例结构案例库的组织可选用线性表、k-d树等。

2.4逻辑推理层

该层次是CBR推理过程中相关算法的具体实现,主要是相似性算法和自适应算法。根据应用需求,我们可以实现其特定的算法,例如基于数据库的传统案例检索算法和ID3决策树k-d树。该层还实现了基于本体的相似性评估方法和基于本体的模型替换方法。

3结语

基于案例的推理(CBR)是快速发展的人工智能中的一个子领域,基于本体的知识表示是语义推理的前提和基础。CBR和本体技术的结合是CBR发展的趋势。本文主要阐述了本体在案例检索和案例自适应中的明显优势。在此基础上,提出了一种基于本体的基于案例的推理模型框架MONCBR,并分析了各个模块的实现方法。该框架具有通用框架的优点,并从软件重用的角度提高了开发效率。

参考文献:

[1]曹勇. 基于案例推理的地震应急本体案例库构建及案例检索研究[D].中国地质大学(北京),2018.

[2]吴文晓. 基于本体的突发事件网络舆情案例推理研究[D].西南科技大学,2017.

[3]李苏豪. 基于点云的建筑表面损伤三维重建与信息集成研究[D].东南大学,2017.

作者简介:

历子谦,性别:男,出生年(1995-),籍贯(山东省日照市),民族(汉),学历(在读研究生),研究方向(案例推理系统)。

猜你喜欢

本体模型
Abstracts and Key Words
适用于BDS-3 PPP的随机模型
p150Glued在帕金森病模型中的表达及分布
对姜夔自度曲音乐本体的现代解读
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
基于本体的机械产品工艺知识表示
3D打印中的模型分割与打包
《我应该感到自豪才对》的本体性教学内容及启示
FLUKA几何模型到CAD几何模型转换方法初步研究