APP下载

基于轨迹数据的渔船安全行为智能化管理方案设计与实现

2023-06-03黄端琼

电脑知识与技术 2023年10期
关键词:数据挖掘

黄端琼

关键词:渔船轨迹;渔船安全;数据挖掘;智能分析

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2023)10-0120-04

0 引言

福建是我国海洋捕捞业最发达的省份之一,在海洋捕捞产值及产量规模方面,福建已连续多年稳居全国前三。截至目前,福建省在册的海洋捕捞渔船约为1.2万艘,为切实加强渔船安全管理,自2019年以来福建省为海洋渔船陆续安装了固定式北斗示位仪、插卡式AIS定位终端,近年来积累了大量的渔船轨迹数据包含渔船名、经纬度位置信息、时间、航速、航向、船籍港、船舶归属地区、船舶类型、作业类型、设备等信息,有效记录了渔船捕捞航行过程和相应的行为特征。渔船是渔业生产的重要工具,通过对渔船轨迹数据进行数据挖掘可以精准分析渔船生产行为,对精准掌握渔船作业行为、发现渔船异常行为、规范渔业执法等具有重要的意义。

目前已有国内外学者基于轨迹数据进行大量的数据挖掘与分析,例如唐存宝等提出基于AIS的船舶航迹分布算法[1],实现航迹分布图在电子海图平台上的绘制;陈昭、王凯、李征宇等人开展了大规模轨迹数据研究与分析,提出了轨迹数据的索引、数据存储组织优化、查询方法,为轨迹数据的挖掘分析及融合相关应用提供技术支撑[2-5] ;唐天琪等基于车辆轨迹数据进行数据挖掘与分析,设计一套车辆规则创建流程模板,实现车辆规则的动态指定、数据统计及可视化展示[6];吕国华等人提出一种基于联邦随机森林的船舶AIS轨迹分类算法FRFCA,用于船舶AIS轨迹数据挖掘,为海事监管系统中船舶轨迹识别和船舶航行风险分析提供智能化服务;Souza等人[7]提出了一个识别拖网、围网、延绳钓3种渔船的算法;国外有些学者基于机器学习或深度学习方法對AIS轨迹数据进行渔船作业类型为渔船监测提供技术支撑[7-10]。如何从积累的渔船轨迹数据中挖掘出有价值的信息,充分利用数据对于研究渔船作业行为模式、分析渔船交通流特征具有重要的意义。为此本文提出了一个渔船安全行为智能化管理方案,基于渔船安全管理实际需求实现轨迹数据的数据预处理、智能分析应用,可以为渔业行政主管部门提供决策分析依据,进一步提升渔业管理智能化水平。

1 数据处理

1.1 数据来源

本文采用的数据源为2021年至今的福建省海洋渔船定位轨迹和基本信息两部分,其中渔船基本信息数据记录12061条,渔船轨迹数据记录约86亿条,数据量约2T。数据结构如表1、表2所示。

1.2 数据接入及融合处理流程

本文采取WebService方式实现渔船北斗定位数据、AIS定位数据的接入,针对渔船定位数据丢包、异常屏蔽等行为,整合从农业农村部、航标处、终端厂商获取的渔船定位数据,通过野值剔除、时间对准、空间对准等数据处理手段,应用概率关联、最近邻等算法实现目标测值和状态估计值的关联。

渔船安装了北斗、AIS设备,在同一航行期间都会发送定位信息,为了有效利用多源轨迹数据,本文采用渔船北斗、AIS轨迹数据的融合处理有效利用这些定位数据,从而提高系统显示船舶实时位置的准确性。融合处理流程包括数据清洗、数据转换、数据入库与接口对接,具体流程如图1所示。

首先对接收所有定位数据先清洗删除异常数据与不规范数据,主要进行缺失值处理和合理性校验;然后对原始报文数据按标准规范进行报文解析,转换为结构化渔船轨迹数据,对定位时间戳进行判断,当数据为历史补报数据或倒挂数据时,将数据存储至kafka历史数据主题,当数据为正常实时数据时,更新ElasticSearch中的渔船最后出现位置,然后以Redis为缓存,对轨迹数据应用概率关联、最近邻等算法实现目标测值和状态估计值的关联,把采集的AIS数据按渔船MMSI编码和时间戳进行去重操作,对同一渔船同一时间的轨迹信息只保留一条轨迹数据,最终将Redis中的轨迹数据存储到数据库中。

2 智能分析应用

2.1 船码匹配分析

船码匹配分析主要用于判断渔船船码是否匹配,有效区别于疑似三无、疑似套牌、疑似假牌的渔船现象,有效处置海上渔业突发事件,提升渔业安全生产管理水平。由于AIS数据无渔船作业状态,本文基于北斗数据和AIS数据进行同船匹配,匹配与北斗终端同船的AIS终端,船码匹配流程如下:

第一步:初始化,相似度匹配阈值,相似度计算规则(余弦相似度等);

第二步:通过相似度矩阵计算不同AIS设备与北斗设备上报数据的相似性矩阵;

第三步:遍历当前时刻的所有北斗设备数据,若没有满足阈值的船只,则返回此次匹配失败;

第四步:若有满足阈值的船只,返回满足阈值船只里面相似度最高的船只。

匹配流程如下图2所示:

当前时刻所有AIS设备数据按匹配流程分别遍历所有北斗设备数据。匹配成功意味着相似度极高的设备可以绑定在一起,从而得出是哪一艘船在使用该设备。如图3所示:

2.2 作业类型异常分析

福建省渔船主要作业类型为拖网、刺网、围网三种类型,根据规定渔船必须按照渔业行政主管部门许可、核定的作业类型生产,但实际上存在渔船擅自改变或增加作业类型进行生产的现象,这对渔业“双控”造成严重冲击,扰乱了渔业生产正常秩序,给渔业资源、渔业经济和渔业安全带来不良影响。为了实现渔船作业类型异常分析,本文研究了拖网、围网、刺网作业类型的渔船行驶轨迹、速度变化的差异性(详见图4),表现为拖网分为单拖、双拖、拖虾,如拖虾作业,渔船一般分布在特定海域,在进行作业时,其轨迹是以1.5~3节的航速,呈S型往返反复运行,作业时间一般在5~6小时;刺网渔船作业时轨迹通常表现为折线, 速度2节以下收放网;以2~5.5节的航速,形状呈圆形或半圆形。本文依托渔船轨迹分类算法发现擅自改变作业方式的渔船,通过目标识别算法分析得出的渔船捕捞作业方式与备案登记进行对比呈现,以达到违规作业的预警目的。

轨迹分类算法对每艘渔船的轨迹生成了速度、方向、空间、时间特征,抽取特征参数输入机器学习模型不断进行模型训练与修正,最终得出高精度可依赖的作业类型自动识别模型,简单高效,过拟合风险低,易于拓展,分类算法思路如图5所示。

2.3 基于地理围栏开展渔船行为智能分析

地理围栏(Geo-fencing)是LBS的一种新应用,就是用一个虚拟的栅栏围出一个虚拟地理边界,具有时间和地理双属性。本文通过划定渔港、锚地、敏感海域的地理围栏,将这些区域以闭合多边形的方式在电子海图上标记出来,并设置了相应的时空属性,然后通过将渔船轨迹数据与地理围栏进行关联,实现渔船进出港、驶入敏感海域、伏休异动等智能分析。在划定渔港、锚地、敏感海域地理围栏后,将这些地理围栏与渔船实时位置进行综合比对,对于有进出地理围栏的渔船,自动记录渔船进港港口、进港时间、出港港口、出港时间、驶入敏感海域时间、航速异动等信息,将这些信息用于出港未报备、单船出海、未同进同出、驶入敏感海域、异地渔船非法停靠的渔船行为分析,推送提醒管理人员。

2.4 渔船作业高风险海域分析

本文将福建海域进行网格化划分,依托网格预报、历史事故、敏感海域、商船航线等数据,对每一个网格贴上标签,渔船进入网格海域后,系统自动分析渔船船长、吨位、历史违规、历史理赔等数据,进行分级提醒,减少对渔民的打扰,同时增加消息精准度。每个海域网格包括海况数据(含天气、风力、浪高、水温、发布日期、预报时效等信息)、历史事故数据(含事故等级、事故类型、当事船舶、事故时间、事故地点、事故概况等)、商渔船高风险碰撞警戒区(含航线名称、航线地理分布、警戒区名称等)含等,用于后续消息规则自动匹配。消息规则配置包括渔船计算规则、网格计算规则、匹配规则三个部分,其中消息规则配置从渔船个体出发,对渔船匹配规则进行统一配置,包含分类名称、统计规则、实现方式、不同统计结果对应的等级标签,可配置渔船船长、吨位、历史违規、历史理赔等信息;网格计算规则从海域网格出发,对海域网格匹配规则进行统一配置,包含分类名称、统计规则、实现方式、不同统计结果对应的等级标签,可配置如风力、浪高、事故多发、船只密度(低、中、高)等;匹配规则从渔船个体和海域网格两个角度,分别设置对应的匹配规则,可以设置多个等级标签。

3 渔船安全行为态势感知展示

为了更直观地进行渔船安全行为态势感知,本文提出采用专题图的形式,依托电子海图进行船码匹配分析、作业类型异常分析、基于地理围栏开展渔船行为智能分析、渔船作业高风险海域分析结果展示,同时对渔船赋予“健康码”,提供渔船健康报告,多维度分析综合展现渔船个体状况。

4 结束语

近年来,为了切实加强渔船安全管理,渔业行政主管部门陆续为渔船配备各种类型的安全通信终端,并配套建设了渔船管理系统,积累了大量的渔船轨迹数据。随着大数据挖掘技术的发展,渔船安全管理对智能化分析需求日益增长。为了解决原有渔船管理手段单一、系统智能化程度低的情况,本文提出了渔船安全行为智能分析管理方案,以渔船轨迹数据为切入点对渔船轨迹数据融合处理、智能分析进行深入研究,并将最终分析成果以可视化方式进行展示,实现渔船船码不符、作业类型异常、触发电子围栏行为、驶入敏感海域、进入碰撞高风险海域等行为提前预警,及时提醒渔业主管部门和船东,将危险行为扼杀在苗头,避免不必要的争端。

猜你喜欢

数据挖掘
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
数据挖掘技术综述与应用
基于GPGPU的离散数据挖掘研究
利用数据挖掘技术实现LIS数据共享的开发实践
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议