APP下载

基于数据挖掘技术的事故隐患预警方法研究*

2017-04-16马明焕王新浩许晓辉

中国安全生产科学技术 2017年7期
关键词:排查隐患数据挖掘

马明焕,王新浩,许晓辉,罗 云,杨 凌

( 1.国网吉林省电力有限公司,吉林 长春 130000;2.中国地质大学(北京) 工程技术学院,北京 100083;3.国网吉林省电力有限公司 延边供电公司,吉林 延吉 133000)

0 引言

安全生产事故隐患排查治理作为遏制重特大事故、实现安全生产超前预防的主要措施途径,对提升企业安全生产保障水平具有至关重要的作用[1-2]。近年来,随着企业事故隐患排查治理信息系统和政府事故隐患排查治理网络管理平台逐渐建立完善,大量事故隐患数据信息被科学地记录和存储[3-4]。然而,大多数企业仅应用这些数据指导隐患整改工作,缺乏对数据的有效利用。收集存储能力增强与数据分析利用水平欠缺之间的矛盾,严重制约企业安全管理水平的提高。挖掘安全管理数据中的潜在价值,指导隐患排查治理工作的优化提升,将成为企业安全发展的关键。

目前,隐患排查治理方面的研究主要集中在隐患管理体系构建、长效机制完善和排治措施优化3个方面[5-7],数据挖掘技术在事故隐患排查治理方面的应用尚处于起步阶段。部分学者尝试用Apriori,Eclat等关联规则算法对煤矿[8]、石化[9]、地铁[10]等领域的风险因素进行关联规则挖掘,以此进行关联因素预警。但上述应用均采用传统支持度计数方式挖掘频繁项集,某些重大事故隐患往往因出现频率较低、支持度不满足阈值而被剪枝,无法形成有趣规则[11]。此外,专家学者在研究过程中,大多将隐患数据定义为静态数据,或将不同时序的隐患数据置于同一数据集,忽视对关联规则变化趋势的分析,不符合隐患动态变化的特点。基于上述分析,本文应用并优化数据流滑动窗模型、等价类变换算法和变化挖掘算法等数据挖掘技术,构建1种关联隐患预警方法,挖掘各类隐患间关联规则和变化模式,指导企业进行针对性排查和整改。

1 关联隐患预警方法

图1 关联隐患预警流程Fig.1 Associated hidden danger prediction process

关联隐患预警方法主要包括:隐患数据挖掘、隐患预警信息发布、关联隐患排查治理、效果评价及反馈4个环节,如图1所示。首先,以历史隐患数据为基础,通过隐患数据流窗口模型、加权等价类变换算法和隐患变化模式3项数据挖掘技术,获得隐患关联规则数据集与隐患变化模式数据集;其次,将数据集映射到用户实时录入的隐患排查数据中,发现关联隐患及其变化模式,发布关联隐患类型、存在可能性及变化模式等预警信息;然后,企业按预警信息进行针对性隐患排查治理;最后,对预警准确率、关键隐患出现频率等情况进行评估反馈,以此调节数据窗口长度及隐患权重。

1.1 隐患数据流窗口模型

数据流是一系列连续而有序的二元组组成的序列,其中T为元素的时间点,I表示实体元素。数据流窗口是数据流领域最具代表性的模型,其主要思想为:在大部分数据流的应用分析中,用户往往关心最近的数据[12],设T是1个时间长度,如1季度、1 a等;t为观测时刻;则称W[t-T:t]为数据流S上的1个时间间隔为T的窗口,其中t和T的单位相同;W[t-T:t]随t的变化而滑动,故称其为滑动窗口。

图2 隐患数据流滑动窗口Fig.2 Hidden data stream sliding window

1.2 加权等价类变换算法

等价类变换算法[13]是采用垂直数据格式挖掘频繁项集的深度优化算法,该算法在概念格理论的基础上,利用基于前缀的等价关系将搜索空间(概念格)划分为较小的子概念格,各子概念格采用自底向上的搜索方法独立产生频繁项集,进而根据支持度、不平衡比等约束条件产生关联规则。

为适应隐患重要性不同特点,在等价类变换算法的基础上,引入隐患权重概念,设计加权等价类变化算法,改变传统的支持度计算方式;通过对管理隐患、重大事故隐患等关键隐患设置高权重,提升关键隐患支持度,增加关键隐患规则数量。隐患权重相关概念如下:

对于事故隐患类型集合H={h1,h2,…,hn},其中h1,h2,…,hn为隐患类型,为表征各隐患的重要性,对各隐患设置权重系数,记为wj,其中0

定义1 :设隐患排查活动集合I={Ix,Iy,…,Iz},其中Ix={ha,hb,…,hn}为1次隐患排查活动,ha,hb,…,hn为此次隐患排查活动发现的隐患类型,Ix的权重记W(Ix)

定义2:隐患集合X的加权支持度为Wsup(X)

定义3:关联规则X⟹Y的加权支持度为Wsup(X∪Y)

传统等价类变换算法具有递推性质,即若一隐患集合的支持度不满足最小支持度的要求,则此隐患集合与其他隐患集合做并运算后得到的集合也不满足最小支持度的要求。在加入隐患权重概念后,传统支持度计算方式发生变化。因此,需验证该性质是否仍然成立,即证明:X与Y为2个隐患集合,若X⊂Y,且X≠φ,则必有Wsup(X)≥Wsup(Y)成立。

由上述推导证明得:加入权重概念后,传统等价类变换算法的递推性质仍然有效,可极大减少搜索空间,提高运算效率。

1.3 隐患变化模式

变化挖掘[14-15]主要是比较不同时间段的关联规则集合,分析前后差异,给出变化模式的类型,从而掌握事件的变化情况。为提升对隐患数据分析的适应性,在传统变化挖掘算法基础上,重新定义隐患变化模式。

2 应用实践分析

2.1 企业隐患数据挖掘

以72家安全管理性质相似的企业为例进行应用实践分析,上述企业在2013年进行了3个阶段的安全生产标准化评审检查,由于数据录入传输等方面问题,最终收集到164次检查数据,共包括28 957条隐患信息,分为组织管理、设备设施和环境卫生3大类839种。其中第一阶段68次16 391条隐患信息,第二阶段46次7 436条隐患信息,第三阶段50次5 130条隐患信息。

图3 隐患窗口划分Fig.3 Hidden danger window partition

根据企业安全生产标准化评分标准,对隐患设定权重,隐患权重与该隐患所属类型的总分值成正比,总分值越大,权重越大。

为计算权重对关键隐患支持度的影响,将加权算法和传统算法的频繁1项集按支持度由大到小排序。

表1 企业隐患关联规则及变化模式

图4 隐患重要度变化Fig.4 The change of hidden danger weight

2.2 事故隐患预警

隐患及其并发现象可以看做是复杂网络图,节点代表隐患,连线代表隐患间的关联关系,隐患排查治理可以看作是消除网络中的节点与连线。关联规则就是发现点与点之间的关系,根据已知点找到其他关联点;变化模式是分析点、线的变化情况,找到对应隐患的变化情况,从而进行针对性管理,如图5所示。

图5 关联规则Fig.5 Visualization of association rules

图中节点的颜色代表隐患类型,红色为组织管理类、蓝色为设备设施类、绿色为环境卫生类(此处通过灰度区别),节点编码表示隐患具体信息(为保持图像简洁隐去隐患节点编码);节点的大小代表节点的支持度,节点越大支持度越大。节点间连线为2节点关联关系,连线颜色为关联规则前项的颜色,连线粗细代表关系强弱,关系越紧密连线越粗。

1)t1观测点:对比图5(b)与图5(a)发现,T2阶段

基础管理类隐患中的职业安全健康培训和应急管理、基础设施类隐患中的动力配电柜和金属切削机床以及环境类隐患中的厂区环境和车间环境等9类隐患与其他隐患连线比例增加,占总连线数的48.6%,其中职业安全健康培训和金属切削机床类较为突出,分别增加45.7%和27.5%;与表1中隐患多为衰减模式和关系变化模式相对应。根据变化模式的定义,认为培训指导阶段对该类隐患的整改治理强度较弱,导致隐患持续存在,最终出现图5(b)中连线比例增加的现象。因此,t1时刻进行隐患排查治理时,应酌情优先检查上述部位,并适当加强整改治理力度。

2)t2观测点:将图5(c)所示阶段与前2个阶段对比发现,隐患节点与连线数量进一步减少,反映出企业经过3个阶段标准化达标工作,隐患数量减少,整体安全水平提高。但与图5(b)相比,T3阶段管理类隐患相关节点和连线比例增加。反映在变化模式上,即表1中组织管理类规则分别占新增模式和意外条件模式的100%和97.8%,表明企业在标准化建设过程中,对基础设施、环境健康等问题的治理效果较好,但忽视对基础管理的优化,导致危险源管理、班组安全管理等基础管理类隐患不断出现。因此,t2时刻企业应适当改变安全生产策略,遏制组织管理类隐患发展势头。此外,环境类隐患中的车间环境、仓库环境相关节点与连线仍然较多,多为关系变化模式和意外结果模式,应优化该类隐患整改措施,防止其他关联隐患出现。

表2 隐患预警情况

2.3 应用效果评估

进行10次模拟运算,统计不同最小置信度条件下,预警隐患数量与准确率,计算平均值,如图6所示。

图6 准确率变化趋势Fig.6 The trend of accuracy

随置信度水平提升,2时点隐患预警准确率均由65%提升至100%。且当置信度为0.70时,预警隐患的类型分别占总类型的39.9%和29.9%,能较好预警事故隐患。结合2.2分析发现,t2时间点预警隐患类型相对减少,与企业安全生产水平提高相关,并通过图5(c)中节点和连线数量减少反映出来。结合此阶段管理类隐患比例上升且多为新增模式的情况,企业可根据自身安全状况、经济条件的各方面因素,适当提升相关隐患权重,降低最小支持度阈值,增大隐患预测数量,增强管理类隐患的关注程度。

3 结论

1)应用滑动数据窗模型、加权等价类变换算法和隐患变化挖掘算法等数据挖掘技术,构建1种关联隐患预警方法,通过挖掘隐患间关联关系和变换模式,获取关联隐患类型、出现频率和变化趋势等预警信息,指导隐患排查治理工作优化提升。

2)以72家安全管理性质相似企业的164次隐患排查数据为例进行应用实践分析,结果表明该方法能挖掘隐患间的关联规则和变化趋势,指导隐患排查治理策略制定,且隐患预警准确率随置信度不断提高。

3)该算法以历史隐患数据为运行基础,对于企业隐患数据较少,且无同类企业数据借鉴情况,数据挖掘效果不佳,下一步需要研究如何增强数据挖掘算法对稀疏隐患数据的挖掘能力。

[1] 魏利军,方来华.基于移动互联网及云服务的安监执法与隐患排查系统研究[J].中国安全生产科学技术,2014,10(S1):136-140.

WEI Lijun, FANG Hualai. Study on safety supervision law enforcement and hidden trouble inspection system based on mobile Internet and cloud service[J]. Journal of Safety Science and Technology,2014,10(S1):136-140.

[2] 张亚丽,王廷春,王秀香,等.中国石化管道及罐区隐患排查治理监管系统研究与应用[J].中国安全生产科学技术,2016,12(4):185-191.

ZHANG Yali, WANG Tingchun, WANG Xiuxiang, et al. Research and application of supervision and management system on hidden trouble checking and governing for pipeline and tank area in SINOPEC[J]. Journal of Safety Science and Technology,2016,12(4):185-191.

[3] 张冬阳.信息化助力风险分级管控与隐患排查治理工作[J].中国安全生产科学技术,2016,12(S1):296-299.

ZHANG Dongyang.Study on risk management and control with classification and potential hazards identification and control assisted by informatization[J]. Journal of Safety Science and Technology,2016,12(S1):296-299.

[4] 欧阳秋梅,吴超.安全生产大数据的5W2H采集法及其模式研究[J].中国安全生产科学技术,2016,12(12):22-27.

OUYANG Qiumei, WU Chao. Research on 5W2H acquisition method and mode of big data for work safety[J]. Journal of Safety Science and Technology,2016,12(12):22-27.

[5] 王荣.事故事件与排查隐患——《企业安全生产标准化基本规范》解读[J].中国安全生产科学技术,2011,7(9):216-220.

WANG Rong. Accident events and investigation potential dangers—interpretation for the basic norms of enterprise work safety standardization[J]. Journal of Safety Science and Technology,2011,7(9):216-220.

[6] 朱红.国内外石油化工企业隐患治理工作探讨[J].中国安全生产科学技术,2013,9(4):115-118.

ZHU Hong. Discussion on hidden dangers treatment plan of petrochemical enterprise at home and abroad[J]. Journal of Safety Science and Technology, 2013,9(4):115-118.

[7] 宇仁茂.煤矿重大隐患特性及其治理体系的分析研究[J].中国安全生产科学技术,2014,10(S1):153-157.

YU Renmao. Analysis on the characteristics of coal mine and its hazard management system[J]. Journal of Safety Science and Technology,2014,10(S1):153-157.

[8] 张长鲁.煤矿事故隐患大数据处理与知识发现分析方法研究[J].中国安全生产科学技术,2016,12(9):176-181.

ZHANG Changlu. Study on big data processing and knowledge discovery analysis method for safety hazard in coal mining[J]. Journal of Safety Science and Technology,2016,12(9):176-181.

[9] 胡瑾秋,张来斌,伊岩,等.基于贝叶斯估计的炼化装置动态告警管理方法研究[J].中国安全生产科学技术,2016,12(10):81-85.

HU Jinqiu, ZHANG Laibin, YI Yan, et al. Research on dynamic alarm management method of refining device based on Bayesian estimation[J]. Journal of Safety Science and Technology,2016,12(10):81-85.

[10] 郭聖煜,骆汉宾,滕哲,等.地铁施工工人不安全行为关联规则研究[J].中国安全生产科学技术,2015,11(10):185-190.

GUO Shengyu, LUO Hanbin, TENG Zhe, et al. Research on association rules of unsafe behavior for metro construction worker[J]. Journal of Safety Science and Technology,2015,11(10):185-190.

[11] Han J, Kamber M. Data Mining: Concepts and techniques[J]. Data Mining Concepts Models Methods & Algorithms Second Edition, 2006, 5(4):1-18.

[12] GEHRKE J, KORN F, SRIVASTAVA D. On computing correlated aggregates over continual data streams[J]. SIGMOD Record, 2001, 30(2): 13-24

[13] Zaki M J. Scalable algorithms for association mining[J]. IEEE Transactions on Knowledge & Data Engineering, 2000, 12(3):372-390.

[14] Song H S, Kim J K, Kim S H. Mining the change of customer behavior in an internet shopping mall[J]. Expert Systems with Applications, 2001, 21(3):157-168.

[15] Chen M C, Chiu A L, Chang H H. Mining changes in customer behavior in retail marketing[J]. Expert Systems with Applications, 2005, 28(4):773-781.

猜你喜欢

排查隐患数据挖掘
隐患随手拍
隐患随手拍
互联网安全隐患知多少?
隐患随手拍
改进支持向量机在特征数据挖掘中的智能应用
高层建筑消防安全排查情况及处理对策
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
配网二次回路故障的排查分析
给家中来个危险排查吧