APP下载

基于案例搜索的飞机事故数据库的设计与实现

2016-09-26谢克斌

装备制造技术 2016年7期
关键词:航空事故数据库

袁 晶,谢克斌

(1.上海民航职业技术学院,上海200232;2.九洲空管科技有限责任公司,四川 绵阳621000)

基于案例搜索的飞机事故数据库的设计与实现

袁晶1,谢克斌2

(1.上海民航职业技术学院,上海200232;2.九洲空管科技有限责任公司,四川 绵阳621000)

为便于分析及总结航空事故原因,通过整理国内外的航空事故案例,进行信息和数据分析,以事故成因主次等因素为依托,建立一个分层结构的飞机事故案例数据库。同时,建立数据库的搜索查询机制,在该数据库中可实现飞行事故的关键词检索和相似度匹配,进而查询相关航空事故进行案例。并且,此数据库可更新,新的飞机事故信息和数据可以随时加入。最后将该数据库应用到《人为因素与航空法规》等课程的教学中,网页版查询航空数据库简单易操作。

航空事故;人为因素;分层结构;模糊匹配;数据库

对于民航业来讲,安全可以说是永恒的主题,飞机事故发生的概率很低,但因其特殊性,只要出现事故,全世界对其关注度都非常高。2014年3月8日马航MH370失联更是让航空安全得到前所未有的关注度。民航事故会造成生命、经济以及生活等各个方面的重大损失,怎样去尽量降低事故发生是民航人一直努力的方向。而对过往发生的大量具备特征性的事故进行总结分析,归类事故发生原因,增加飞行驾驶员和机务维修人员的培训,在错误中学习。

对航空事故原因分析及相关统计的文献很多,大部分都是针对事故原因统计总结事故症候,或是进行结论性的事故原因概率说明。例如文献[1]对民航事故进行了模型分析,并未进行相应数据库的建立。而中国民航大学民航安全科学研究所开发的人为因素数据库[2],仅仅是对全球所有航空安全事故的罗列,只能依次点开查阅,而非对事故人为因素原因的归类分析。但对于民航机务或是学习民航专业的学生来说,在培训“人为因素对安全的影响”时,很多时候需要进行实例直观的讲解。这就需要定位原因,搜索到具体相应示例进行讲解。

基于此,本文将“人为因素”引起的航空事故进行总结归类,运用事件分析模型分析整理出事故原因,建立分层结构的查询飞机事故数据库。运用关键词查询,可迅速定位查阅该事故的原因、经过及总结分析等。同时,在关键词检索中运用模糊搜索机制,从而达到更好的模糊匹配。

1 事故建模

国际航空运输协会(IATA)的统计资料显示,现阶段飞行事故的80%都与人的不安全行为有关。

基于这一情况,国际民航组织(ICAO)专门设立了“航空人为因素与航空法规”为一项专门的研究内容。范围广阔,包括:人的身体特征、心理状态、环境因素;感官知觉、运动特点、作业姿态;操纵和显示设计、人机系统控制;人际交往、团队合作、组织管理等等[3]。

这里对所有航空事故进行总结分析,抽离出所有不安全因素影响,总结归类,建立航空事故模型。

运用基元事件分析方法对各事故影响因子进行编排[4],对事故进行分层管理。模型事故因子分为人体机能、社会心理、物理环境和违规操作四个层次,如图1所示。

图1 航空事故模型

其中,对于事故涉及到的四大部分再次进行各种情况的细分。

(1)人体机能

包含人的生理所有相关状态,这里将人身体是否健康(有无生病、亚健康状态等)、睡眠质量好坏、眼睛、耳朵等感觉器官是否在最佳状态、人脑记忆强度、神经系统分析问题的能力等都归类于此分层系统中。

(2)社会心理

主要包含人在所处社会环境中的心理状态,包括工作、学习及生活等方面。在工作过程中涉及到的内容是影响心理波动的一个主要成因,其中包含工作量带来的负荷、压力或者焦虑;工作过程中的组员合作、沟通引起的各类问题;所在公司的人文关怀、企业文化、企业管理和监督的规章等等。生活方面的心理影响主要是家庭组成或者家庭成员的特殊情况(如疾病等)引起的某些时间段内的压力感。

(3)物理环境

物理环境对飞机维修工作的影响是不容忽视的。例如维护所处的季节,在炎热的夏天和寒冷的冬天都会使事故率增加。还有维护工作中的大噪音和振动(发动机工作或钣金作业时)都会影响维护工作的完整性和精神集中度。

(4)违规操作

飞机维护工作中存在很多重复性工作和目视检查等内容,在完成这部分工作时,机务工作者容易产生倦怠情绪,主观认为此类工作简单,且发生事故的可能性一般非常低,工作的期待值不高,在这一过程中,很容易造成漏检、忽略等违规行为。

基于以上的分类可涵盖所有的事故可能形成原因,对所有事件归类,逻辑存储,然后进行数据库的物理设计,依据事故分层原因完成数据库的逻辑编排,完成数据库文件的物理存储结构、各种存取路径、存储空间的分配、记录的存储格式等[5]。在这部分中,需要关注的是搜索功能的完成及相关的限制条件。

2 关键词检索匹配

提取航空事故案例,通过输入关键词搜索完成。由于关键词表达的形式存在差异,对此,本数据库中采用基于释义的模糊匹配关键词搜索机制。通过计算输入的关键词与设定的关键词之间的匹配系数,得到语句间的相关度,系统通过对语句相关度的比较从而确定是否为相同查询,进而判断是否响应搜索。

2.1知网和义原的说明

知网是发布出来的一个知识资源,以汉语和英语的词语所代表的概念为资源描述对象。系统中知识单元内容以网状结构分布,可通过计算机处理。其中义原是最基本的、不易于再分割的意义的最小单位,描述了概念与概念之间以及概念具备的所有特性之间的关系,这些关系都隐含在知网的知识词典和义原的特征文件中[6]。

义原之间的联系及相关关系是通过义原分类树的形式体现的,这是进行语义相似度计算的基础。在知网中,包含一些特征文件,通过它们来描述义原(primitive)之间的关系。各个义原之间的关系一般比较复杂,常见的关系描述有上下位关系、所属关系、同级关系、同义关系、反义关系等等。

大部分义原之间的表达并非运用某一种单一的关系描述就能完成的,通常会存在重复和交叉情况,为了描述方便,将研究过程简单化。此处,将关系描述中最重要的上下位关系作为基础,以树状结构的义原层次来说明语义间的关系,如图2所示。基于此,进行关键词匹配系数和释义相似度的计算。

图2 义原的特征结构

2.2义原相似度的计算[7]

由于所有的概念都最终归结于基本意义单元——义原(个别地方用具体词),所以语句或者关键词的相似度判别最终都是归结到知网的最小意义单元——义原相似度大小的计算。这里对义原的相似度计算做相应规定。

规定义原b1和b2的语义相似度计算如下式:

式中,b1和b2表示两个基本义原;s表示和在义原层次结构体系中的路径长度,是一个大于零的数值;β是相似度关系系数,可人为规定参数值(大小按用户计算需求调整)。在描述的各种关系中,根据式(1)的计算主要利用义原的上下位关系。

从式(1)中可以看到,相似度与义原语义间距离成反比,义原在关系树种所处的位置越远,表明它们之间的语义的相似度越低。当两个义原归属于不同的类别体中,它们之间相当于隔着屏障,不可到达,距离趋近于无穷大。

在知网的知识描述语言中,在一些义原出现的位置出现的不是原语义,而是一个具体词(概念),通常会用圆括号()括起来。

这里认为具体词和义原归属于不同类别,距离也为无穷大,相似度为零。只有具体词完全相同,才认为是同一个词。

2.3关键词模糊匹配

本文的飞机案例数据库中对案例的搜索是通过输入关键词来实现的。为了更好的查询出相关事故,将词语表达上的差异性忽略,达到关键词的模糊匹配,即能对词语释义相似但表述不同的关键词语达到同一搜索结果的显示。词语的释义表述一般存在多个。这里先完成释义相似度的计算,然后推算出关键词的模糊匹配。

知网中释义的基本组成单元即为义原,规定两个释义的相似度计算如下:

式中,x表示释义包含的义原个数;simi(b1,b2)表示第i个义原表达式的相似度值。

完成释义相似度计算后,进行搜索关键词的模糊匹配算法。

以w1和w2表示键入的两个搜索关键词,假设w1有m个释义表达:e11,e12,…,e1m,w2有n个释义表达:e11,e12,…,e1n.此处,对w1和w2的各个释义进行相似度大小比较,取释义相似度中的最大值作为两个关键词的匹配系数:

两个关键词的匹配系数决定了两个关键词是否为相似含义,是否能搜索出同一航空事故。本数据库中规定:

(1)匹配系数φ≥0.7时,两个关键词释义相同,可相互替换,做出同样的响应(即在本数据库搜索中显示相应航空事故信息)。

(2)匹配系数0.3<φ<0.7时,两个关键词释义存在模糊区间,系统提示“输入更精确的关键词,查找合适信息”。

(3)匹配系数0.3≤φ时,两个关键词释义不相同,无法查找相关条件,系统提示“无相应搜索结果”。

3 数据库的建立

航空事故数据库建立以航空事故案例的事故形成原因为依据,建立具有事件逻辑层次结构和数据信息的案例库,建立良好的检索机制,能根据用户输入的关键词匹配出其对应的飞机事故的详细信息。

数据库为了方便应用,采用网页形式设计,界面如图3所示。

图3 事故显示界面

数据库中关键词模糊匹配,能完成文字表达差异的容度,“同义词”设计如图4所示。

图4 关键词模糊匹配

为方便实时更新该数据库,设置了数据更新部分,如图5所示。可完成最新航空事故的添加:事故名称、关键词、事件经过描述、事件发生的原因以及事故相关图片。

图5 数据库添加界面

4 结束语

本文将飞机事故案例以事故形成原因为依据,运用基元事件分析法建立具有层次结构的事故案例库。同时,建立了良好的检索机制,能根据用户输入的关键词进行模糊匹配,忽略差异,找出其对应的飞机事故的详细信息。本查询数据库以网页形式呈现,使用方便,并且能随时更新事故库,有一定的实用价值。但本数据库只单一针对维护中涉及到的机务工作者的人为因素影响,如何增加数据这一块是需要进一步研究的内容,例如,数据库中加上事故飞机的航班信息、航材信息、引发事故的零部件信息等等。

[1]孙瑞山,赵青.航空人为差错事故/事件分析(ECAR)模型研究[J].中国安全科学学报,2012,22(2):17-22.

[2]人为因素研究小组.人为因素总数据库研究报告[R].2003.

[3]温涛.基于人为因素的安全航空研究[D].西安:西南交通大学.2001:25.

[4]卜小敏.航空人为因素事故/事件分析模型研究[D].天津:中国民航大学,2008.

[5]张露,马丽.数据库设计[J].安阳工学院学报,2007,(4):66-69.

[6]Zhou Qiang,Feng Songyan.Building a rela-tion network representation for how-net[C].Proceedings of 2000 Interna tional Conference on Multilingual Information,Urumqi,China,200:139-145

[7]程莉,卢正鼎,文坤梅,等.基于语义的模糊匹配探索与应用[J].华中科技大学学报:自然科学版,2003,31(2):23-25.

Design and Implementation of an Aircraft Accident Database Based on Case Searching

YUAN Jing1,XIE Ke-bin2
(1.Shanghai Civil Aviation College,Shanghai 200232,China;(2.Jiuzhou Aerocont Technologies Co.,Ltd,Mianyang Sichuan 621000,China)

To facilitate the analysis and summary of the causes of aviation accidents,through the consolidation of domestic and foreign aviation accident cases,information and data analysis,causes of accidents factors,we established a hierarchical structure of aircraft accident case database.At the same time,we set up a database searching mechanism which can achieve a similarity key words matching.This makes the location of a relative flight accident more accurate and easy.Then,this database can be updated,the new aircraft accident information and data can be added at any time.Finally,the database is applied to the teaching of human factors and aviation regulations and other courses.And web page query database is simple and easy to operate.

aviation accident;human factor;layered structure;fuzzy matching;data base

TP392

A

1672-545X(2016)07-0215-04

2016-04-20

袁晶(1987-),女,湖北麻城人,硕士研究生,助教,研究方向为民航机务维护,智能诊断与仿真;谢克斌(1987-),男,山东潍坊人,硕士研究生,工程师,研究方向为空管通信,空管信息化。

猜你喜欢

航空事故数据库
学中文
“闪电航空”来啦
“闪电航空”来啦
废弃泄漏事故
小恍惚 大事故
数据库
数据库
数据库
数据库
达美航空的重生之路