APP下载

面向航天产品的知识模型构建方法

2022-09-30王小辉赵山杉

科技管理研究 2022年16期
关键词:本体文档图纸

贾 倩,王小辉,赵山杉

(中国运载火箭技术研究院研究发展部,北京 100076)

1 概念提出

知识模型是指对知识进行形式化和结构化抽象后形成的知识表示形式。构建知识模型可以抽取知识要素及其之间的关系,一方面便于计算机对知识点及关联关系的识别、解析、推断,为知识图谱构建、知识推理及推送等提供支撑;另一方面便于使用人对知识体系进行全盘性、完整性地了解,支撑个人知识体系的构建,辅助能力快速提升。

航天产品研制是典型的系统工程,具有流程复杂、专业众多、知识密集等特点,一项型号的研制往往涉及数十个专业、数百项流程,形成上百项研试文件、技术图纸、工具软件等知识资源,这些知识资源来源于各个专业、各个岗位、各个流程,在模版格式、属性类别、应用领域等方面存在各式各样的差异,属于典型的多源异构化知识。为了便于后续的知识解析与挖掘,需要对知识资源进行结构化处理,以统一、规范知识数据包(也就是知识模型),实现知识的存储与固化,为后续的知识应用提供支撑。

2 知识模型构建方法研究现状

知识模型的构建往往包括知识模型梳理及知识模型表示。其中,知识模型梳理主要进行领域知识要素及要素间关系的提取与分析;知识模型表示则负责将提取出的概念体系以计算机可识别的方式进行表达。相对而言,知识表达即合理有效地表示知识,是知识模型构建的核心,也更为重要[1]。在知识模型梳理方面,已有研究往往借鉴传统教学模式中的树形知识模型[2],在此基础上再进一步扩展和丰富。在知识模型表示方面,目前的表示方式主要包括基于逻辑的知识表示、基于关系的知识表示、面向对象的知识表示、基于规则的知识表示和基于本体的知识表示等[3]。近年来,由于本体的语义丰富性优势凸显,其已成为公认的开放网络环境下知识表示的规范[4],因此越来越多的学者采用基于本体的知识表示用于构建知识模型。

在基于本体的知识模型构建方面,学术研究集中于理论方法和工程实践两大维度。理论方法研究起步较早,许多学者从基于本体的知识搜索、知识表达、知识推理等方面进行了研究,如徐东[5]提出了一种基于本体的知识智能搜索方法;袁磊等[6]提出一种面向领域知识的本体知识模型可扩展标记语言(XML)表示框架;张星等[7]提出了一种基于本体的科学效应知识表达和语义推理方法;于鑫刚等[8]提出一种基于本体的知识库模型构建方法。上述理论研究为后面的工程实践提供了丰富的理论指导。近年来,伴随着理论的成熟与完善,越来越多的学者关注工程实践,将知识模型应用于各个工程领域,如贾磊等[9]提出了一种面向复杂零件的知识模型构建方法;彭菲等[10]提出了基于本体的海军军械维修保障知识模型构建方法;孙杭等[11]针对运载火箭的晃动分析计算,提出了晃动计算程序的领域知识模型;王剑辉[12]提出一种基于本体的教学系统知识模型构建方法。从上述主要研究可以看到,知识模型的领域相关性很大,不同领域的知识其自身特点与应用需求不同,构建的原则和方法也不尽相同。

3 知识模型构建原则

对于航天领域知识而言,结合航天产品需求,本研究提出其知识模型的构建应遵循全面性、体系化、可重用、动态更新等原则。

(1)全面性:知识模型应面向具体业务需求,包含的知识点应完整全面,涵盖在目前认知范围内、业务需求对应的全部知识要素。

(2)体系化:知识要素之间、知识要素与知识资源之间均应建立关联关系,实现从某一知识要素对其他知识要素的延伸与拓展,以及通过知识要素定位到具体知识资源。

(3)可重用:知识模型应作为针对某一特定问题的通用解决方案,在出现该特定问题时可重复应用。

(4)动态更新:知识模型应随着知识内容的拓展深入而不断更新,包括知识要素的增加,也包括关联关系的丰富,同时应实现各更新版本的可溯源。

本文提出一种兼顾时间和空间的新型交通组织模式,即在主辅路汇入点设置预信号,实现辅道进入交通主干道节点联动组织,并在车流仿真平台上进行测试分析,从而得出结论. 本文研究的目的在于探寻城市干道节点与辅道交通组织模式,变革干道节点信号组织方式,为城市干道建设面临的空间储备不足局面,整理出可行的弹性设计指引.

4 基于本体的知识模型构建方法

本体本质上是对概念及其相互间关系的一种形式化、规范化描述,以此来表达某一领域的知识体系[13]。形式化、规范化是指机器可以理解、处理[14]。在知识模型构建方面,本体的目标是获取、描述相关领域的知识,提供该领域知识的共同理解,确定该领域内共同认可的要素,并从不同层次的形式化模式上给出这些要素和要素间相互关系的明确定义[15],随后,对这些要素和关系进行形式化、规范化地封装,从而形成统一的格式化表示模型。基于本体思想,知识模型构建可分为4 个步骤,如图1 所示。

图1 知识模型构建流程

4.1 知识分类

分类指的是将不同的抽象或实物进行区分或聚集的活动[16]。其依据是物体之间的关系,这些关系可以是明显可见的,也可以是推测而来的[17]。如果分类的对象是知识时,那么分类活动就是知识分类[18]。可以说,知识分类是根据特定的需要和标准,通过分类活动,把人类的全部知识按照相同、相异、相关等属性划分成为不同类别的知识体系,以此显示其在知识整体中的应有位置和相互关系[19]。知识分类不同,知识属性也不同。因此,在知识要素提取之前,有必要先开展知识分类工作。

对于航天产品而言,分类维度包括基于专业维度的知识分类、基于来源维度的知识分类、基于产品维度的知识分类、基于岗位维度的知识分类等。考虑到知识要素应尽可能相异,本研究主要从载体形式维度开展知识分类。按照载体形式的不同,知识资源可包括但不限于如下类别。

(1)文档类知识:以文字为主的报告类知识,具体又可细分为技术报告类知识、技术成果类知识、经验总结类知识等。其中,技术报告类知识包括各类论证报告、研究报告、总结报告等;技术成果类知识包括学术论文、标准规范、知识产权等;经验总结类知识包括质量问题、故障案例、最佳实践等。

(2)软件类知识:支撑产品研制的工具、软件等。

(3)图纸类知识:航天产品的设计图纸等。

(4)实物类知识:研制出的产品样件、样机等实物。

4.2 知识要素提取

知识属性要素可以理解为知识资源的元数据,能够代表知识最关键的信息,同时又可以作为本体构建的元素。知识要素的提取与两大方面因素有关,一是知识资源本身的特点,二是知识资源的应用场景。知识资源本身的特点主要包括知识所属领域、专业、分类等,这些属性决定了知识资源所包含的关键要素;知识资源的应用场景主要指知识哪些属性可作为后续查询、解析、挖掘的依据,这些属性同样支撑了知识资源关键要素的获取。以下分别探讨文档、软件、图纸、实物等不同类别知识的属性要素。

(1)文档类知识。文档类知识的属性要素可分为五大类,分别是基本信息、领域方向、概要内容、文档结构、参考文献。各类别的细化要素如图2 所示。其中,基本信息包括标题、作者、密级、领域方向、发表时间等文档的基本属性;作者信息包括作者所属组织、专业、岗位、历史业绩等,便于后续与其他文档创作者进行关联;概要内容为体现文档的主要内容,包括摘要及关键词;文档结构即为文档的章节信息,包括章、节目录,以及每章、节下的总结和概述性描述;参考文献是对其他文档的参考引用以及被其他文档参考引用的情况。

图2 文档类知识属性要素示例

(2)软件类知识。软件类知识的属性要素可分为四大类,分别是基本信息、算法模型原理、主要功能和版本更新历程。如图3 所示,基本信息包括软件的名称、开发者、领域方向、当前版本号等;算法模型原理包括软件开发所依据的定理、公式、算法、模型等;主要功能包括软件主要针对的需求、具备的功能以及达到的效果;版本更新历程包括软件各轮更新的背景、更新的版本、解决的问题、仍存在的问题、相关讨论记录、更新者及更新日期等。

图3 软件类知识属性要素示例

(3)图纸类知识。图纸类知识的属性要素可分为四大类,分别是基本信息、设计依据、主要部件和版本更新历程。如图4 所示,基本信息包括图纸名称、密级、产品、型号、绘制者、当前版本、完成日期等;设计依据即为图纸绘制的依据,包括背景需求、参照的其他产品及型号、相关的讨论记录、绘制方案等;主要部件包括图纸涉及的主要产品、涉及的分系统、各分系统涵盖的部件;版本更新历程包括图纸各轮更新的背景、更新的版本、解决的问题、仍存在的问题、更新者、更新日期等。

图4 图纸类知识属性要素示例

4.3 知识模型构建

完成知识要素提取后,还需要分析要素之间的关系。对于大部分知识类别而言,要素间的关系主要分为包含关系、平行关系(同类关系),还有许多关系是难以给出具体定义的,被统称为“相关关系”。根据知识要素间的关系,可以将看似相差很远的要素关联起来,从而实现知识体系的扩展,使构建的知识模型更加全面化、系统化。

5 知识模型构建实例

5.1 单类别知识模型构建

以文档类知识为例,知识要素之间的关系如表1 所示。

表1 文档类知识要素间关系分析

根据要素及其之间关系构建文档类知识模型(见图5)。由于要素不断延伸和拓展,因此图5 仅列出了部分内容。

图5 文档类知识模型示例

5.2 综合性知识模型构建

在现实应用中,使用者需要的往往不是单一类别的知识资源,而是不同知识资源的组合,因此,所需的知识模型也是综合性的模型。以面向新员工的岗位知识体系为场景,探讨综合性的岗位知识模型的构建。

岗位知识模型是指员工为适应岗位需要应具备的知识体系。本研究认为,岗位知识模型应包括岗位信息、上下游关系、支撑知识体系三大方面。其中,岗位信息包括岗位名称、所属专业、主要职责、主要业务流程等;上下游关系包括岗位的上游岗位、输入知识、下游岗位、输出知识等;支撑知识体系包括适应岗位需求所需的文档、软件、图纸等各类知识资源,如文档类知识、软件类知识、图纸类知识、其他知识等(见图6)。

图6 岗位知识模型构建示例

6 结论和讨论

近年来,随着信息和知识的急剧增加,以及“知识图谱”“知识推理”等概念的兴起,知识模型在知识应用中的作用越来越显著。尽管对于知识模型的概念业界尚未形成统一的定义,但知识模型的结构化、系统化、通用化等特点得到了学术界和企业界广泛共识,也正是基于上述特点,知识模型在快速搜索、精准定位、个性化推送、图谱化展示中发挥的作用越来越大,不同领域的知识管理研究人员纷纷开始探讨面向本领域业务需求的知识模型构建方法。本研究面向航天产品的需求提出了知识模型构建原则及表示方式,探讨了基于本体的知识模型构建方法,并展示了知识模型具体构建实例。目前,本研究所构建的知识模型已成功应用于航天产品知识管理中,实现了不同知识资源的统一封装与表达,推动了知识资产的固化与重用,支撑了知识自动分类、知识搜索、知识推送、知识图谱等应用。

知识要素抽取是知识模型构建中的关键环节,由于航天领域知识资源格式相对规范,本研究采用人工方式的知识抽取,其优点是提取的要素较为准确,不需要再进行清洗、融合等操作,缺点是需要耗费人工精力,因此多适用于知识体量不太大的情况。而随着企业知识体量的不断扩充,基于机器学习的自动知识抽取技术势必会成为大势所趋,这也是后续的研究重点。

猜你喜欢

本体文档图纸
浅谈Matlab与Word文档的应用接口
有人一声不吭向你扔了个文档
眼睛是“本体”
浅谈汽车线束产品图纸管理
看图纸
模具图纸在全生命周期内的信息管理系统研究
基于本体的机械产品工艺知识表示
基于RI码计算的Word复制文档鉴别
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
专题