APP下载

基于形式概念分析的制造业动态本体知识库构建

2021-05-05杨淑群

制造业自动化 2021年4期
关键词:概念分析知识库本体

王 恒,杨淑群

(上海工程技术大学 电子电气工程学院,上海 201620)

0 引言

本体是描述一个事物的本质,许多本体可以构成一个知识库,知识库是可共享的包含各个领域内规则以及所联系的数据及事实,有利于领域内部进行数据分析、数据调用等工作。本体知识库广泛地应用于制造业,为了适应制造业领域数据的动态变化性,相关学者构建了大量的制造业动态本体知识库[1,2]。

传统的制造业动态本体知识库可以进行简单的数据更新以及数据关系,但是随着制造业本体的日益增多,手动更新动态本体数据,会影响制造业的工作效率。因此本文分析基于形式概念分析的制造业动态本体知识库,实现知识库自动获取动态制造业本体信息,根据约束条件和本体关系,进行合理的动态本体数据更新,促进本体知识库的发展。

1 制造业动态本体构建

本体最早被应用于哲学领域,常被用来描述事物的本质,后被用于计算机、大数据领域,用于说明概念模型的明确规范[3]。本体是一个领域知识的整体架构,能够明确规划各种概念之间的关系。通过利用本体,能够实现数据库、存储器之间的资源共享,构建数据量庞大的知识领域,并且通过融合Web信息集成技术,精确定义概念的含义和概念之间的关系,为由异构数据源构成的动态本体提供统一的概念和术语标准,减少制造业动态本体因不同数据源采用不同命名方式造成的概念不明或语义冲突,进一步保证数据共享和数据交换的可实施性[4]。因此,构建基于形式概念分析的制造业动态本体,能够进一步实现数据共享,为用户提供更便捷且有价值的信息服务。

在本体的实践应用中需经过本体构建原则的指导,其中最具影响的构建原则是必须保证动态本体的清晰性、一致性、可扩展性、最小编码偏好程度性以及本体最小性。清晰性指的是本体所描述的概念和关系必须是准确清晰的,所表达的逻辑公理必须是形式化的。一致性是动态本体所推出的结论必须与术语本身的含义保持一致,不能发生矛盾和冲突[5,6]。可扩展性是本体应支持在原有的术语概念上定义新的概念,并能够扩展概念之间的关系体系。最小编码偏好程度性指的是保持编码偏好最小化,在知识层面上对概念进行说明,独立表示某一种特殊符合的层次标码。本体最小化是对构建本体的规模进行约束,以满足知识共享需求为前提,遵循本体构建最小化原则。编码过程如图1所示。

本体既能够描述简单的分类层次结构,也能够通过增加公理、规则来描述复杂的概念关系和概念内涵。构成动态本体的主要元素包括类、关系、函数、公理和实例五种[7]。函数动态本体元素概括如表1所示。

图1 编码过程

表1 函数动态本体元素

构建本体通常应用于OWL语言作为描述语言。OWL语言是一种标准的XML语言,能够较好的解决本体的描述问题,能够精准的描述文件和实例之间的关系,并加强在web环境下描述对象的语义内涵,且相比较于其他描述语言,OWL语言的表达能力更强,且更容易被机器理解和识别[8,9]。OWL语言为本体提供了三种表达能力不同的子语言,分别针对三种不同类别的描述对象,从而提升本体的描述能力,满足用户的不同需求,而且每个子语言都能对前一种语言进行扩展,使对对象的描述更加深入[10~12]。描述过程如图2所示。

本体的构建是一个循环往复的复杂过程,具体步骤如图3所示。

1)建立规格说明书[13]。建立一份采用自然语言书写的包含本体描述范围、程度的非格式化的规格说明书。

2)获取知识。从不同的数据库以及书籍、报刊等实体资料获取构建本体所需的知识,并对获取的知识进行分析,总结知识之间的关联。

图2 描述过程

图3 制造业动态本体的构建流程

3)概念化。根据知识关系构成知识概念模型,并根据规格说明书采用合适的领域词汇描述对象概念和内涵,然后集成相近本体对同一描述对象的概念,实现概念描述的一致性。

4)在合适的开发环境下,采用形式化的编码进行运行,实现本体的使用,并在本体运行期间,采用参考框架对本体各阶段的运行情况进行判断,评价本体的运行效果,便于后期对本体的更新和完善。参考框架如图4所示。

图4 参考框架

2 基于形式概念分析的制造业动态本体知识库构建

形式概念分析方法是一种融合了数学基础和图像基础的一个具有数据分析和规则提取的分析方法,其作用是分析出事物动态本体之间结构的关系。形式概念分析的原理是根据事物之间的关系,建立合法的动态约束条件[14]。为了辅助形式概念分析的可视化,本文借助Hasse图对分析的结果进行表示,使分析结果更加直观。Hasse图如图5所示。

图5 Hasse图

对于本文分析的制造业动态本体知识库,形式概念分析主要的任务是在原有动态本体知识库的基础上,定期对本体的新生概念和数据进行分析,根据分析结果对本体数据库进行数据更新,保证知识库的实时性和有效性。

知识库是数据库和人工智能管理的集成品,其功能是模拟数据库通过人工智能技术进行相应的操作,方便管理者对本体数据的收集、整理和提取。同时动态本体知识库是具有层次、结构化、模块化、多变的一个特殊数据库,知识库最终的表现形式是以文档的格式存储,在不同的领域,根据领域特点和需求,对于知识库的理解不同,但是统一的理解都是一个可以存储、查询、调用的多功能数据库。

结合上文分析的制造业动态本体的构成元素和语音,以及形式概念分析方法,本文总结出基于形式概念的制造业动态本体知识库构建的流程,主要分为七个步骤,具体过程如图6所示。

图6 基于形式概念分析制造业动态本体知识库构建流程

1)首先对制造业本体进行需求分析,主要过程是将提供的信息进行关键字抽取以及总结。需求分析的目的是确定本次制造业本体所构建的知识库所面向的用户类型、目的以及相关知识的有关内容、体系等,确定正确知识库的构建方向;

2)根据需求分析的内容,本文根据关键字进行最重要本体知识的获取,此过程关系到知识库体系的数据内容,因此要在专业人员指导下完成。主要是对知识源进行加工处理,以便后期对最重要本体知识库的调用;

3)在专业人士的指导下,将获取的知识源进行知识推理。知识推理的目的是理清制造业本体知识点之间的关系,为知识库内各个知识点的约束条件提供构建依据,知识推理是构建制造业本体知识库的关键步骤之一,因此本文在知识推理部分完成四次推理,保证知识库内的数据关系具有条理性。四次推理分别为演绎推理、不精确推理、非单调推理、形式推理;

4)根据对制造业动态本体知识库的知识源进行推理后,对特殊知识源进行标记。语义标记首先将所示本体知识库内知识源进行检索,然后将具有两个或者多个属性的知识源进行语义标记,方便制造业动态本体知识库的信息更新;

5)最终根据形式概念分析将语义标记和知识推理按照逻辑构建制造业动态本体知识库,达到目的。

将实现的制造业本体知识库进行初次运行试验,检查构建的本体知识库是否达到了构建要求,如果发现不足,则立即进行优化整理。

构建的知识库如图7所示。

图7 知识库结构

因为试验存在误差性,所以试验次数必须满足要求,才能投放市场。在构建的制造业本体知识库使用过程中,定期进行知识数据更新[15]。

3 实验研究

为了验证本文提出的基于形式概念分析的制造业动态本体知识库的有效性,与传统的基于多维多值概念格的制造业动态本体知识库(方法1),基于数据分析的制造业动态本体知识库(方法2)进行实验对比。

设定实验参数表2所示。

表2 实验参数

根据所得实验参数,选用本文知识库与传统知识库进行实验对比,得到的构建时间如图8所示。

图8 构建时间实验结果

根据图8可知,三种不同的知识库中,所提方法速度最快,在整个抽取过程中,都更加稳定、直观,即使是面对开放的文本,知识库也可以与其它知识库进行协作,因此具有更强的适应性,知识库的表达结果也更加符合人类的理解。基于多维多值概念格的制造业动态本体知识库的构建时间相对较慢,主要是由于迭代训练速度较慢,主题抽取速度较快,因此知识库的划分与人类的理解结果存在一定的偏差。方法2的速度最慢,耗费时间最长,内部主题词较为离散,需要花费更多的时间进行整理,因此知识库内部的数据也非常离散和孤立。

进行十次实验,得到的知识库准确率实验结果如表3所示。

根据表3可知,所提方法的知识库准确率高于方法1和方法2,所提方法引入了关系形式概念背景知识,具有很强的计算能力,能够很好地分析出实体词条的关系形式,通过综合考虑的方式确定制造业动态。知识库内部的离散主体和文本主题拥有有效的获取路径,能够更为简单地表达语义。除此之外所提方法还引入了局部特征分析法,提高了概念的连贯性,更好地确定语言要素,提高了分析过程的灵活性。

表3 知识库准确率

4 结语

本文首先了解制造业动态本体知识库的概念、构造元素和构成语言,根据这些基本概念总结制造业动态本体的构建流程,为动态本体知识库的构建奠定基础。然后进行形式概念分析,完善制造业本体知识库的构建流程,最终实现本文的研究,达到研究目的,使制造业动态本体知识库可以自动获取数据更新本体信息,提高本体知识库的功能性。

猜你喜欢

概念分析知识库本体
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
基于本体的机械产品工艺知识表示
拱结构概念分析在结构力学教学中的应用
TED文化交流类演讲的概念功能分析
高速公路信息系统维护知识库的建立和应用
《我应该感到自豪才对》的本体性教学内容及启示
“有无对比法”在经济评价中的运用及相关概念分析
基于Drupal发布学者知识库关联数据的研究
基于形式概念分析探讨《伤寒论》中葱白止利功效的新发现
专题