APP下载

ITS的目标与技术障碍

2020-06-01吴重光

化工职业技术教育 2020年2期
关键词:本体软件人工智能

吴重光

(北京化工大学,北京100029)

【系列讲座①ITS的由来与发展回顾】

ITS(Intelligent Tutoring System)可以通称为“智能教学系统”,是一种人工智能计算机软件,用于模拟人类教与学的行为和指导过程。随着科学技术的飞速发展,ITS已经逐渐发展成为先进的综合技术的集成系统。ITS既可以帮助学生学习大量的课程,又可以配合教师为大量的学生而工作,也可以实行个性化教学,进而改进学生的理解水平和提高学习成绩,为教师和开发者提供实时数据,用来提炼教学方法。研发ITS的终极目标是辅助实现教育的个性化、公平化和终身化。ITS的研究、开发和应用起始于上世纪70年代,伴随着认知科学、人工智能技术和互联网技术的进步得到快速发展。近半个世纪以来,国外发表的ITS相关论著数以百万计,美国已经涌现出一批高水平ITS软件,并且在工程职业教学,小学、中学和大学的许多课程中得到推广应用。

研发ITS的目标和技术障碍是什么?一个形象的比喻是:研发ITS软件需要拨开“一团迷雾”,翻越“三座大山”。

拨开“一团迷雾”就是必须明确研发ITS的终极目标。在这个终极目标方面,教师往往会有疑惑。例如:人工智能是要取代教师吗?有了ITS后,教师是不是无事可做?学生也会认为,有了ITS是不是不用心学习就能成为“学霸”?

其实不然,设计和开发ITS系统的目的不是取代有经验的教师,而是增强和扩展教师的教学能力,提高教学效率和质量,实现教育的个性化、公平化、网络化和终身化。教师必须是熟练应用ITS的专家,并且教师为学习过程带来了复杂且丰富的社会互动是不可或缺的。ITS的目的是增强和扩展所有学生的学习能力,包括自主学习和元认识能力,从死记硬背的学习方式改进为有意义的学习。

研发ITS软件需要翻越“三座大山”——

“第一座大山”:人类的知识是什么?如何由计算机软件识别和处理?

涉及各门课程知识的标准化、知识本体开发和知识图谱开发,是人工智能的“生态环境”,是一个浩大的,需要发动所有教师参与的“世纪工程”。

“第二座大山”:计算机如何辅助人类分析、决策、行动和自动控制?

涉及领域有专业实践知识、现代数学、系统仿真、图论、网络拓扑、评估理论、逻辑学、概率论、过程控制、故障诊断、数据处理、最优化、机器学习、计算机科学、软件开发和数值计算理论与技术等。其中,因果反事实推理和高速、高效、多功能“推理引擎”算法,是人工智能技术的半壁江山,是目前国内难于实现ITS的“卡脖子”技术。

“第三座大山”:教师和学生如何学会使用ITS?

对ITS软件本身而言:需要其功能完备,并且尽可能具有普遍适用性,当教师把任何一门课程的知识本体开发成功后,嵌入ITS都能实现智能教学;需要直观形象的图形化建模;需要软件的使用具有简明、快捷、易学易用等优点;需要ITS软件在实际应用中不断进取,也是ITS技术不断进步的技术保障。完成多领域多学科的专用ITS软件更是一个极其艰巨和长期的任务。

对ITS软件的使用者而言:需要亲历传统教学方法颠覆性变革的过程;需要付出艰辛努力先学会ITS技术,然后结合实际熟练地应用,才能具有“智慧超人”的本领。涉及对所解决问题的深度实践和深入了解,涉及熟练的定性和定量建模技巧。因此,实现ITS大规模普及应用也是一个艰巨和长期的任务。

1知识本体是人工智能的“生态环境”

知识是什么?这是一个从古至今直到未来,人类认识真实世界包括人类自己的永恒课题。随着人类生产力和科学技术的发展,关于知识的认知正在不断进展中。

在历史的长河中,人类对知识的认知理论称为“本体论”(Ontology)。科技领域称其为“知识本体”,知识本体的概念出自于哲学的本体论或称为存在论,英语单词“ontology”是来源于希腊语单词“存在”和“学问”的组合。人类最早研究这个论题的时间可以追溯到古希腊时代,哲学家试图研究当事物发生变化的时候,如何去发现事物的本质。亚里士多德(Aristotle)把存在区分为不同的模式,建立了一个范畴系统(System ofCategories),包含的范畴有:实体、质量、数量、关系、行动、感情、空间、时间。亚里士多德以他卓越的学识和深刻的洞察力,抓住了人类认识中最关键的概念。

本体论得到迅速发展的时期是从上世纪90年代开始。主要原因是计算机技术的发展以及人工智能技术的探索,迫切需要使用本体论来定义知识的规范,以便在软件实体之间共享、重用和使用计算机处理知识。近年来,IT界将其重要意义比喻为人工智能的“生态环境”,与此同时也不断加深了对知识的认知。

1991年,美国计算机专家尼彻斯(R.Niches)等在完成美国国防部高级研究计划局(Defense Advanced Research ProjectsAgency,DARPA)一个关于知识共享的科研项目中,提出了一种构建智能系统方法的新思想。他所发表的论文题目是《知识共享的使能技术》。尼彻斯团队认识到:构建智能系统需要由两个部分组成,一个部分是知识本体,一个部分是“问题求解方法”(Problem SolvingMethods,PSMs)。知识本体涉及特定知识领域中的共有知识和知识结构,它是静态的知识。而PSMs涉及在相应知识领域进行推理的知识,它是动态的知识。PSMs使用知识本体中的静态知识进行动态的推理,就可以构建一个智能系统。这样的智能系统就是一个知识库,而知识本体就是知识库的核心。

1995年,格鲁伯(T.R.Gruber)在人工智能研究中发表论文《面向知识共享的本体设计原理》。论文中定义“知识本体是概念化的显式规范”。这个定义比较著名,在知识本体的研究中广为流传。

1998年,施图德(Studer)等发表论文《知识工程原理和方法》。论文在前人对知识本体定义的基础上,给出了一个更加明确的解释:“知识本体是对概念体系的明确的、形式化的、可共享的规范”。

知识本体的研究与开发属于新兴学科“知识工程”范畴。人类通过计算机和互联网的知识表达和应用才真正开始把知识从一般概念上升为科学严谨的知识本体。这是广泛深入实现人工智能应用,即计算机化知识处理和大数据处理的基础和“生态环境”。这是一个长期的,艰巨的,贯穿人类生产活动与社会活动整个生命周期的,同时也是大规模广泛发动人类参与的活动,需要以科学的方法总结、重构、更新、创新和标准化人类的知识,特别是各领域的知识。

几十年来,基于知识本体的计算机与互联网信息标准历经了从内容层面到结构层面,即符号、图像、语法到语义的发展,信息传递/交换/共享从字符、位图和向量图的拼写选择和图形绘制到电子文本的人工导引连接,目前已经进展到由计算机自动导引连接的“智能”化阶段。信息交换技术的进展情况如图1所示。

图1 信息交换技术的进展

计算机软件和互联网信息标准,例如,XML、DOM、UML、RDF、DAML+OIL和OWL2(知识本体网络语言-2),已经在全球任何使用计算机网络和数字化通信系统和设备中运行,可以说是世界上使用范围最广和使用人数最多的信息标准。

知识本体的开发和应用已经形成一门学科,称为“知识本体工程”。在信息系统领域应用的知识本体主要用于表达信息的内容和机理。

在研究如何用计算机表达知识时,首先需要认识人类自然语言文字的文档局限性问题。人们发现,如果直接用人类自然语言在计算机中表达信息,其不足体现在如下方面:

●歧义性(Ambiguous)即容易引起歧义的,或模棱两可的表述。

●模糊性(Vagueor Inherently Fuzzy),或者说非清晰性。

●非逻辑推演性,因为语法不是语义,语言很难直接实施逻辑推理。

●离散性,或者说不完备性。

●非定量性,或非可数值计算性。

●任意性,例如,文言文、诗句或地域方言的表达方式。

●不同国家语言不同,包括语法不同,表达方式有差异。

●同义语的多种解释。

●易错性(Error-prone)或因人而异性。人们对自然语言掌握的程度不同;不连贯性(Inconsistency),会导致不可推理性。

●背景依赖性(Contextdependent),或者说语境依赖、上下文依赖性。

通过分析人类自然语言文字文档局限性问题,计算机信息科学家逐渐理清了“知识本体到底是什么?”或者说知识本体是如何构成的。采用知识本体工程方法解读人类知识后认识到:知识本体由内容信息和结构信息构成,两者缺一不可。如图2所示,知识本体是内容信息与结构信息的交集。

图2 知识本体的构成

作者给出的简单解释是——

●内容信息是全宇宙包括地球世界一切事物的名称、类型和属性。

●结构信息是各事物之间包括名称、类型和属性之间的连接关系和/或影响关系。

设计知识本体是开发专业课程ITS的第一步,所遵照的8条规则如下:

⑴清晰性:采用自然语言客观如实且充分必要地定义知识本体的含义。

⑵连贯性:知识本体在逻辑上是通顺的,不得推论出自相矛盾的结果。

⑶扩充性:基于现有的知识本体词汇可以定义新的特殊用途的项目,而无需改变现有的定义。

⑷兼容性:知识本体的概念说明可以在不同的表达系统和不同的表达风格中实行。

⑸基本性:或称为最小知识本体授权(委托),即确定最少只定义哪些项目就能够本质上实行知识一致性的传达。

⑹图示性:知识本体的结构信息可以与图形(图谱)相互映射,以便应用时直观形象、快捷方便,以及直接采用图论及网络拓扑推理方法处理结构信息。

⑺互用性:能够与互联网标准语言(例如XML,OWL等)互操作。

⑻可推理/可计算性:可以实施逻辑推理、定性推理或用数值算法半定量或定量求解。

在上述8条规则中,第1~5条是国际流行的规则,第6~8条是依据知识本体工程的最新进展,作者在第1~5条基础上新增加的参考规则。

以相关知识本体国际标准作为开发本领域和本专业课程知识本体的基础和依托,是作者推荐的最佳技术路线。因为凡是国际标准或国家标准都是一个领域或专业使用频率非常高的知识,并且凝聚了众多专家长年积累的集体智慧,经过了大量的实践检验与修正。

非常幸运,化工领域早已颁布国际标准,即ISO/TS15926标准《工业自动化系统与集成流程工厂(包括石油和天然气生产设施)生命周期数据集成》.规定了流程工厂的工程、建筑和作业有关的信息表达。这些表达支持在工厂生命周期的各个阶段,流程工业对信息的要求;工厂生命周期各个阶段中所有实体间的信息共享和集成。这是多国几百位专家合作,历经20多年艰辛研发的成果。这使我们认识到知识工程研发项目的艰巨性。ISO/TS15926是用于计算机信息存储与构造知识库的标准,其中第一部分和第二部分已经直接采标为国家标准(GB/T 18975.1-2)。标准将过程工厂生命周期信息以通用化与概念化的数据模型表达,它是实施信息库、数据仓库共享、传送、交换和自动审查的基础。但是,该标准重点是表达静态知识本体,作者在大规模工业应用的基础上,对该标准进行了扩展,使其可以表达动态知识本体,并且由计算机可以识别和处理。

构造ITS还需要任务和解决问题方法的知识本体,简称“任务与方法知识本体”。如果把静态知识本体比喻为机械唯物主义在人工智能领域中的体现,任务与方法知识本体可以比喻为辩证唯物主义在人工智能领域中的体现。因为任务与方法知识本体需要处理动态变化的知识,包括动态识别、动态分析、随时决策和及时行动,而不是单纯静态知识的处理。又是非常幸运,国际电工委员会标准IEC 61882《危险与可操作性分析(HAZOP分析)应用指南》是化工过程ITS可以借鉴的理想的知识标准之一。经过作者引进和推荐,2013年采标为我国安全生产行业标准(AQ/T 3049-2013)。在实践应用中发现该标准有许多缺陷,经过改进和扩展,依托IEC 61882开发成功智能HAZOP-CAH软件。采用该软件,已经由北京思创信息系统有限公司完成了上千项石化、化工、炼油与天然气过程的HAZOP安全评估。在国家应急管理部(原国家安全生产监督管理总局)大力倡导下,由中国化学品安全协会组织,由作者主编了《危险与可操作性分析应用指南(专业版)》和《危险与可操作性分析基础及应用(普及版)》两种教材。多年来,中国化学品安全协会组织初级、专业级和高级HAZOP培训班100多期,毕业学员数千人,学会智能HAZOP-CAH软件的技术人员数已过万人。智能HAZOP-CAH软件的推广,为降低我国化工重特大事故发生率做出了贡献。

HAZOP分析本身恰恰是“过程运行学”中分析问题和解决问题的“灵魂”方法,也是新一代人工智能和可解释的人工智能(XAI)中“因果反事实推理分析和决策”的“灵魂”。因此,HAZOP-CAH本身就是“过程运行学”中分析和决策的ITS软件。此外,也是ITS跟踪评估学生学习“踪迹”,用自然语言文字给出智能解释的核心方法。

2智能识别、分析和决策的“利器”

知识本体模型的推理是开发人工智能专家系统软件的核心技术之一。如图3所示,ITS专家系统由两大部分组成,即知识建模和知识推理。因此知识推理是专家系统的一半,是专家系统运作的“推理引擎”。高效的推理引擎软件必须具有高效的推理算法。知识本体映射为知识图谱,即图形化表达是新一代专家系统的主流特征。因为图形化直观、形象、易学、易用,并且直接可以采用图论和网络拓扑方法推理求解知识本体模型。高效计算机推理机技术掌握在开发者手中,可以自主开发出应对各种领域特征和用途的ITS专家系统。

图3 ITS专家系统由两大部分组成

高效推理算法是一种在复杂有向网络图中高速、省容量、没有无效探索的独立通路搜索算法,作者1986年在《控制系统计算机辅助设计》著作中发表。2016年完成国家著作权登记,是具有自主知识产权的算法和程序。通路算法不但可以通过多种推理方法,将知识图谱模型中隐含的所有独立显式危险剧情(路径)"挖掘"出来,其计算速度在普通笔记本电脑上每秒钟可以推理得到10 000 000个危险传播路径,而且联合回路搜索算法可以直接应用梅逊公式(图论)求解代数方程组和微分方程组。“推理引擎”是实现智能识别、智能分析、智能决策和智能行动的“利器”。

3推广普及ITS的“快速通道”

推广普及ITS的“快速通道”最好的方法是大力开办技术培训班,这也是智能HAZOP-CAH技术在国内大范围快速推广普及的成功经验。培训目标是首先补教师的短板。培训重点为知识工程、定性建模、智能推理、HAZOP方法和过程运行实践能力仿真训练。培训班可以分为初级、中级和高级三种。

⑴正式出版的配套教材5部,都是作者本人著作

●《系统建模与仿真》,国家级规划教材,清华大学出版社,2008.

●《危化品特种作业实际操作仿真培训与考核指南》,化学工业出版社,2015.

●《智能型危化品安全与特种作业仿真培训指南》,化学工业出版社,2020.

●《危险与可操作性分析(HAZOP)应用指南》(专业版),中国石化出版社,2012.

●《危险与可操作性分析(HAZOP)基础及应用》(普及版),中国石化出版社,2012.

⑵配套系列软件全部经过工程实际考验并完成了国家软件著作权登记

主要有如下8种:

●AI3面向事件的微型人工智能专家系统软件平台(专业版,可构建大系统知识图谱模型和多功能推理分析与决策)。

●AI3-TZZY-KY智能型危险化学品安全与特种作业实际操作仿真培训套件(含7个典型危险化工单元和AI3软件互动)。

●AI3-RT-TZZY智能型危险化学品安全与特种作业实际操作仿真培训双机实时软件套件(含7个典型危险化工单元高精度仿真软件和实时AI3学习版专家系统软件实时联网,可以用于在线故障诊断实验、知识图谱模型验证、修改和试验研究)。

●MPCE多功能过程与控制仿真实验软件(适用于过程控制和化学工程双专业多项目实验,具备复杂控制系统组态软件平台和6种高精度化工过程仿真软件联合实验)。

●CSA控制系统分析软件(完成图形化信号流图SFG网络拓扑及数值积分计算。CSA属于AI3系列中的形式化知识本体推理和计算软件,单独使用)。

●CAH专业化智能HAZOP分析软件(分为企业版和学习版两种,北京思创信息系统有限公司开发,已经在化工、石化、炼油和天然气企业大规模应用)。

●PSM过程安全管理软件(CAH的配套软件,北京思创信息系统有限公司开发,已经在化工、石化、炼油和天然气企业大规模应用)。

●CAS半定量安全评估软件。包括SIL(安全整体性要求级别)评估和安全保护层LOPA分析软件(CAH的配套软件,北京思创信息系统有限公司开发,已经在化工、石化、炼油和天然气企业大规模应用)。

⑶ITS培训班宗旨和培训内容简介

●教师先行。坚持举办讲座、初级、中级和高级ITS教学技术的培训班。全面更新教师的观念,深入掌握国际最新教学理论和方法,以先进的ITS方法回馈学生。起步:为全体教师大办ITS巡回讲座和专业培训班。长远:建议各职业学院成立ITS教师进修学院。

●智能化HAZOP是多专业AI方法论的基础必修课,能提高学生的集体智慧和采用头脑风暴分析问题解决问题的能力。建议:化学工程、安全工程、精细化工、企业管理、过程控制、环境工程、过程装备与控制工程等专业作为必修课。

●新立项的ITS课程,除急需的课程智能化HAZOP外,其他暂缓,克服教学管理滞后,影响ITS的实施。

●在所有相关专业的实习环节中嵌入智能仿真培训技术。

●培养有能力开发各领域课程ITS的教师团队。起步:作者培训和顾问。长远:有计划有措施开发所有课程的ITS软件。

培训的具体安排,以ITS技术初级(四天)培训班为例——

第一步:以危险化学品过程特种作业的7个典型化工单元为实战训练案例,提高对典型化工单元运行掌控和事故处理能力。通过特种作业考核。

两天,讲课半天,实战一天半,考核半小时。

第二步:学习HAZOP分析方法的要领,以分组集体讨论的方式实战训练。

一天,讲课半天,包括智能HAZOP-CAH使用说明,练习半天。

第三步:在特种作业仿真和智能推理软件平台(AI-TZZY-K/Y)上构建知识图谱模型,进行SDG深度学习训练。

半天,练习。

第四步:教师总结培训中的问题和注意事项,介绍和演示误操作分析和决策知识图谱建模方法。

半天,讲课总结。

【系列讲座③ITS在化工职业教育中应用系列软件⑴⑵预告】

AI3是Artificial Intelligence3的简称,即人工智能-3。AI3是一个面向事件的专家系统软件平台,是通用性高、图形化、可由用户自定制的软件平台,用于直观快速地构建人工智能专家系统应用。

智能+HAZOP分析软件CAH(Computer Aided HAZOP)完全融入了经过改进和扩展的领域知识本体,简称为SOM/SOM_G,以及过程危险分析的“方法和任务知识本体”。根据吴重光提出的高效推理算法研发的推理引擎,智能HAZOP-CAH通过图形化人机界面,构建了一个完整的人工智能HAZOP专家系统平台。

猜你喜欢

本体软件人工智能
禅宗软件
眼睛是“本体”
一种基于社会选择的本体聚类与合并机制
软件对对碰
2019:人工智能
人工智能与就业
数读人工智能
下一幕,人工智能!
即时通讯软件WhatsApp
专题