APP下载

基于井下人员的异常轨迹分析方法研究

2021-04-25赵福龙

电脑知识与技术 2021年9期

赵福龙

摘要:针对井下作业人员轨迹数据信息多维度和稀疏性等问题,提出了基于离群点的异常轨迹筛选ZFMTRAOD算法,首先通过对轨迹子段建立R-tree索引提升检索速度,然后利用离群检测思想对邻域半径内轨迹子段的数量和平均时间判断轨迹是否异常,最后利用井下作业人员的轨迹数据对算法的性能进行比较,发现基于离群点的井下人员轨迹分析算法不仅能判别出井下作业人员异常轨迹的类型,还提高了异常轨迹判别的准确率。

关键词:离群点;ZFMTRAOD算法;轨迹分析;R-tree索引

中图分类号:TP311  文献标识码:A

文章编号:1009-3044(2021)09-0205-03

开放科学(资源服务)标识码(OSID):

Research On Abnormal Trajectory Analysis Method Based on Downhole Personnel

ZHAO Fu-long

(Hebei University of Engineering, Handan 056038, China)

Abstract:For trajectory data underground work personnel information and multi-dimensional sparse sexual problems, such as abnormal trajectory of outliers is proposed based on screening ZFMTRAOD algorithm, first of all, through the path son sets up R - tree index increases the retrieval speed, and then use the ideological within the neighborhood radius on outlier detection sub section number and the average time to determine whether a trajectory is unusual, the use of underground work personnel's trajectory data to compare the performance of the algorithm, mine personnel find outliers based on trajectory analysis algorithm can not only identify abnormal track the type of underground work personnel, also raised the exception path discriminant accuracy.

Key words: outliers; ZFMTRAOD algorithm; Path analysis; R-tree indexes

國家在煤矿安全生产环节一直给予高度重视,要求所有煤矿企业必须安装井下安全避险六大系统,但在分析煤矿特大事故发生的原因时,我们能够发现大多数事故的发生并不是由于井下环境恶劣等其他客观因素引发的,反而是人的主观行为因素。据有关数据表明,在煤矿大型事故中,人的主观行为因素占比高达97.67%,其中55.37%是由矿工的违规作业导致的[1-2],因此如何加强对井下人员的异常行为监管才是煤矿安全生产环节的重中之重。

目前已有不少科研人员将异常轨迹检测作为轨迹分析的重点,提出了许多异常轨迹筛选方法,Knorr[3-5]等人通过定义轨迹速度(平均速度、最小速度、最大速度)、位置(由轨迹点起始位置和结束位置组成)等属性作为轨迹的标志,提出了基于加权距离的异常轨迹判别方法,此方法是根据轨迹整体的属性来定义的距离函数,因此忽略了轨迹部分属性间的差别,导致判别结果不准确。Li[6]等人提出了基于分类思想的轨迹判别算法,利用提出新的框架ROAM提取motif,对异常的轨迹进行筛选、过滤。Lee[7]等人提出了基于划分的异常轨迹判别方法TRAOD,此方法采用分段的方式对每条轨迹划分为若干子轨迹线段,利用Hausdorrf[8-9]测距方法测量子轨迹线段的距离,该算法较好地解决了全局轨迹之间筛选的问题,但还是存在无法有效判别出轨迹局部属性以及需要计算大量的Hausdorrf距离的问题。在检测一些具有相似属性的轨迹时还具有一定的困难。

以上这些算法为本文提供了良好的想法,对提出一种适合井下人员轨迹的判别方法打下了基础,因此本文根据井下人员轨迹数据具有多维度和稀疏性的特点,提出了基于离群点的异常轨迹判别算法。

1相关理论

1.1基于离群点的异常轨迹判别算法

如图1所示是本文提出的基于离群点的异常轨迹判别算法是流程图,它能够判别出三种类型的异常轨迹,一是空间异常轨迹,根据井下人员空间位置数据与正常行走的轨迹信息作比较进行判别。二是时间异常轨迹,根据井下人员在某地点停留的时间判别出该点是否为异常点,三是根据以上两种判别方法得出该轨迹是否为时空间异常轨迹。

此算法首先对分离出的每个轨迹子段建立R-tree索引,为的是能快速地查找到目标子段邻域半径[ω]内的其他轨迹子段,然后利用Hausdorff测距方法对轨迹子段进行遍历,利用离群点思想将距离轨迹子段[Si]小于h的轨迹数量[NUMSi,h]查询出来,当[NUMSi,h]小于设定的阈值[K×m]时,则可以判断该轨迹为空间异常,然后利用时间准则[Tμ]判断该轨迹是否为时间异常。此算法利用R-tree索引不仅提高了异常轨迹判别速度,还可以判断出异常轨迹的异常类型。

1.2构建R-tree

R-tree树结构可以对距离目标子段一定距离的子轨迹段进行检索,通过设置合适的索引半径[ω]可以找出所有距离目标子段为d(d<[ω])的子轨迹段,将整体的轨迹距离比较转化为局部的子轨迹段比较,其中[ω]的选取对索引结果有很大影响,如果[ω]较大,索引速度降低,如果[ω]较小,索引出的子轨迹段不完整,因此取两种极端情况进行考虑。

(1)当目标子段与其他轨迹处于平行状态时,Hausdorff距离公式为[d=d2∥(Li,Lj)] ,[ω]取值为[ω∥=Lmax+d+12*Length(Li)],[Length(Li)]表示目标子段[Li]的长度,[Lmax]表示距离目标子段最长的轨迹。

(2)当目标子段与其他轨迹处于垂直状态时,Hausdorff距离公式为[d=d2⊥(Li,Lj)]

[ω]取值为[ω⊥=d2Li,Lj+14*(Length(Li))2]

当把两种极端情况都考虑到时,只需取[ω]的最大值,所有的距离目标子段的子轨迹段都能被检索到。因此[ω]的定义公式为:

[ω=max (ω∥,ω⊥)]

从图3我们能看到红色代表目标轨迹,总体长度为H。蓝色代表的其他轨迹,是利用邻域半径为[ω]的索引方式检索到的,首先对目标子段进行分离,分离出的结果为{[h1,h2]},{[h2,h3]},{[h3,h4]},然后检测被分离的轨迹段是否为异常轨迹。从图中我们能得知被检索到的轨迹子段为:

[Hωh1,h2={l12,l21,l22,l31,l32}]

[Hωh1,h2={l14,l22,l23,l32,l33}]

[Hωh1,h2={l15,l23,l24,l33,l34}]

我们所获得的轨迹子段还不能确定是否为轨迹线段,只能作为是符合[ω]邻域半径的轨迹点的集合。必须满足[li]和[jj]两个点在同一条轨迹上且[li]和[lj]必须是相邻点这两组条件才能确定为轨迹线段,因此,符合条件的轨迹线段为:

[Hωh1,h2={l21,l22,(l31,l32)}]

[Hωh2,h3={l22,l23,(l32,l33)}]

[Hωh3,h4={l23,l24,(l33,l34)}]

1.3井下人员异常轨迹的筛选

利用基于距离测量离群点的检测思想对空间异常进行筛选,该方法DB(P,D)是由Knorr等人[3]提出的,由于方法简单,易于理解,被许多科研人员广泛引用,因此利用此算法的思想,提出了公式1-1来检测。

[NUMSi,h

[Si]用来表示目标轨迹子段,h表示距离目标轨迹子段[Si]的距离,[NUMSi,h]表示其他轨迹子段到目标子段的距离小于h的轨迹数量,m表示距离目标轨迹子段的距离为[ω]的轨迹数量,K表示用来调节距离关系的参数。当满足上式关系时,可以判定此目标轨迹子段[Si]为正常空间轨迹,否则为异常轨迹。

利用Jiang等人[10]提出的GOLF方法来检测时间异常轨迹,首先要设置“[Tμ]”时间准则,然后计算出时间阈值,假设有一组集合[S={s1,s2,…,sn}],如果集合中的任意的数都满足式1-2,则此数为异常。

[si-s>Tμ]                                    1-2

[s]用来表示集合S的平均值,[μ]用来表示集合S的方差,用式子1-3,1-4表示

[s=i=1nSi/n]1-3

[μ=i=1nsi-s2/(n-1)]                             1-4

Jiang等人用实验数据表明,当[Tμ]中T为2或1.645時,异常轨迹的判别率较高,对于本文实验采用k=1.645的效果更好,因此设置阈值为[Tthr=s+Tμ],如果经过该子轨迹段的时间大于所设置的阈值则认为该轨迹可能时间异常。

2实验分析

2.1案例分析

从图4我们能够看出是利用ZFTRAOD算法检测出的某矿井作业人员的异常轨迹,其中包含了三种异常轨迹状态,用三种不同的颜色分别代表不同的异常轨迹类型,其中蓝色代表时间异常,黑色代表空间异常,红色代表时空异常。

从图5中我们能够看出,这是某采区井下作业人员的活动范围,其中蓝色的方点代表井下关键位置的站点,该站点设有定位基站,对经过的井下作业人员进实时行定位,每个定位基站都有独立的位置编码对移动的人员进行具体的位置定位。分析图2中的轨迹①,通过对比采区的活动示意图,我们发现该作业人员直接从编号为15121的工作面的CH4传感器基站移动到了配电硐室附近,此轨迹的开始日期为2019年9月8日12点30分30秒,随后在16点20分25秒处结束,姓名为李洪刚(假名),查询当天该人员对应的轨迹得知,此工作人员没有走正常路线,跳过了联络巷2等其他基站,直接从15121工作面走到了配电硐室,正常的行走轨迹应该是从15121工作面经过联络巷2到达变电所或经过消防材料库到达配电硐室,因此,该段轨迹存在空间异常。

如图4所示,轨迹②是一条时间异常轨迹,表示作业人员从回风立井的水泵房到主斜井的配电硐室花费的时间存在较大的差异,根据时间差异准则计算出的时间差为1355,但是从异常信息表中发现,该轨迹子段汪强(假名)行走的时间在2019年9月7日为3982秒,另外在其他两天的行走时间分别为1298秒和1309秒,因此,该段轨迹的异常类别为时间异常。

2.2算法性能比较

我们分别从三个方面对三种算法进行对别,分别是检率、漏检率、正确率。得出的结果如表1所示。

通过上表可以发现ZFTRAOD算法比R-TRAOD算法和TRAOD算法性能更好,在正确率上要比其他两种算法高,在漏检率和误检率上要比其他两种算法低,因此,表明ZFTRAOD算法不仅可以判别异常轨迹的类型,在性能上也比其他两种算法好。

将ZFTRAOD算法与其他两种算法在时间上进行比较,得到的结果见表2,SD1、SD2、SD3分别代表井下瓦检员的轨迹、安全员的轨迹和系统维护人员的轨迹数据,5990、20366、137731分别代表定位点的个数。通过分析表2我们能发现TRAOD算法的运行时间明显慢于ZFTRAOD算法,虽然ZFTRAOD算法要比R-TRAOD算法稍慢一些,那是因为ZFTRAOD算法在对轨迹进行判断的基础上还要进行轨迹异常类型的判别,因此,从总体来说ZFTRAOD算法的整体性能要优于TRAOD算法和R-TRAOD算法。

3结束语

本文针对井下作业人员的异常轨迹检测问题,提出了基于离群点的异常轨迹筛选ZFTRAOD算法,利用R-Tree索引来检索出距离目标子段一定距离内的所有轨迹子段,提升了异常轨 迹的查找效率,利用离群点思想查找邻域半径内的轨迹子段的数量和平均时间来判断轨迹是否异常。该算法在判别轨迹异常类型的基础上提升了判别准确率,能更加有效地对井下人员的日常轨迹进行分析。

参考文献:

[1] 卢宁.煤矿安全管理与矿工违章行为进化博弈分析[J].现代经济信息,2016(22):75.

[2] 栗继祖,杨佳丽,弋永杰.矿工违章行为影响因素及防控[J].现代职业安全,2016(10):111-113.

[3]KnorrE M,Ng R T.Finding intensions knowledge of distance-based outliers[C]//Proceedings of 25th VLDB,Edinburgh,Scotland,1999:211-222.

[4]Knorr E M,Ng R T.Algorithms for mining distance-based outliers in large datasets[C]//Proceedings of 24th VLDB,New York City,1998:392-403.

[5] Knorr E M,Ng R T,TucakovV.Distance-based outliers:algorithms and applications[J].The VLDB Journal,2000,8(3/4):237-253.

[6] Li X L,Han J W,KimS,etal.ROAM:rule- and motif-based anomaly detection in massive moving object data sets[C]//Proceedings of the 2007 SIAM International Conference on Data Mining.Philadelphia,PA:Societyfor Industrial and AppliedMathematics,2007:273-284.

[7] Lee J G,Han J W,Li X L.Trajectoryoutlier detection:apartition-and-detect framework[C]//2008 IEEE 24th International Conference on Data Engineering.April7-12,2008,Cancun,Mexico.IEEE,2008:140-149.

[8] 王培,江南,萬幼,等.应用Hausdorff距离的时空轨迹相似性度量方法[J].计算机辅助设计与图形学学报,2019,31(4):647-658.

[9] 张晓滨,杨东山.基于时间约束的Hausdorff距离的时空轨迹相似度量[J].计算机应用研究,2017,34(7):2077-2079.

[10] Jiang S Y,Li Q H,Li K L,etal.GLOF:a new approach for mining local outlier[C]//Proceedingsofthe 2003 International Conference on Machine Learning and Cybernetics (IEEE Cat.No.03EX693).November5-5,2003,Xi'an,China.IEEE,2003:157-162.

【通联编辑:梁书】