APP下载

基于深度学习的飞行目标识别*

2020-12-02

舰船电子工程 2020年10期
关键词:飞行数据决策树坐标系

高 敏 刘 洪

(1.四川大学视觉合成图形图像技术重点学科实验室 成都 610045)(2.四川大学计算机学院 成都 610065)

1 引言

利用雷达监测数据识别飞行动态目标无论是在军事上还是民用上都具有重大的意义,近年来国内外对飞行动态目标识别都是利用传统的基于物理学原理、信息融合和图像识别的方法,常用有以下几种方法:1)利用空中目标旋转部件对雷达回波有调制作用的原理,利用K近邻分类方法对飞机进行分类[1];2)利用信息融合的方法识别出飞机类型[2];3)利用飞机图像数据结合统计学原理的分类方法对飞机进行分类[3]。但是这几种方法存在的缺点和问题是对动态飞行目标识别的准确率不高,近年来随着人工智能深度学习的流行,基于深度学习神经网络的空管系统也逐渐受到人们的重视,成为了研究热点。目前已经有一些利用飞行目标图像结合深度学习神经网络的方法来对飞行目标进行识别判断。本文创新点是利用大量的雷达监测数据结合谷歌的深度学习框架Tensorflow来对无人机和民航飞机这类的动态飞行目标进行识别,相较于以前的基于统计学的识别方法具有更高的识别准确率,并且利用深度学习方法对空管系统的智能化具有重要的研究意义,也为动态目标识别提供了新的思路和方法。

2 主要方法及流程

本文首先通过一次雷达和二次雷达监测的飞行目标数据,选取原始数据中距离、方位、俯仰、X、Y五个飞行特征数据,将数据预处理清洗后的雷达数据通过公式计算转换成WGS-84坐标系下的经度、维度和高度的特征数据,再综合雷达监测数据中航向、速度的特征数据作为飞行目标分类器的输入数据,并对输入数据进行PCA主成分分析,将降维后的数据进行二维平面和三维空间的可视化分析,以此来展现雷达监测的不同飞行目标特征数据之间的内在隐藏关系。最后分别通过基于统计学原理方法的决策树分类器和基于深度学习的DNN神经网络分类器来训练分类模型,并比较评估两种不同的分类器的训练时间和分类准确率。主要过程如图1所示。

3 雷达监测数据预处理

本节主要内容是对飞行目标数据进行数据清理和预处理。

3.1 雷达原始数据集

通过一次雷达设备得到一段时间内监测和处理后的无人机飞行数据,其中包括了时间,批号,距离、方位、俯仰、航速、航向、周期、系统时间等数据,再通过不同坐标系下的坐标转换方法得到WGS-84坐标系下的经度、纬度、高度的特征数据。一次雷达设备监测和处理后的无人机原始数据集部分实例如表1所示。

图1 飞行目标识别流程图

二次雷达设备监测和处理的是民航飞机的飞行数据,其中数据包括了时间、批号、SSR、X、Y、R、Hei、航速、航向等数据,再通过不同坐标系下的坐标转换方法得到WGS-84坐标系下的经度和纬度的特征数据。二次雷达设备监测和处理后的民航飞机原始数据集部分实例如表2所示。

3.2 雷达数据预处理

由于雷达监测的原始数据中有一些数据有缺项,部分数据信息不完整,所以过滤清洗掉这些数据来保证和提高分类器的分类效果。原始数据中还有一些数据项和飞行目标识别分类无关,比如时间、批号、周期、系统时间、SSR和R等数据项,通过数据预处理清洗掉这些信息数据,减少分类器训练模型的参数个数和训练时间[4]。

表1 无人机雷达数据

表2 民航飞机雷达数据

WGS-84坐标系是一个以地球质心为坐标原点的协议地球坐标参考系,它在几何上以X,Y,Z轴正交构成右手坐标系的质心坐标系统。文献[5]介绍了笛卡尔坐标系,雷达局部坐标系,地理极坐标系三种坐标系,并且给出了三种坐标系互相转换的公式,所以可以使用论文中的方法将一次雷达设备监测的基于地理极坐标系的无人机飞行数据转换为基于笛卡尔坐标系的WGS-84坐标系下的飞行数据,以及可以将二次雷达设备监测的基于局部坐标系的民航飞机飞行数据转换为基于笛卡尔坐标系的WGS-84坐标系下的飞行数据[6]。

4 数据可视化

将飞行特征数据进行数据可视化,以图形图像的形式来表示和展现飞行特征数据中隐藏的关系和未知信息,帮助分析飞行特征数据信息之间的关系。

由于提取的飞行特征数据是多维度的,要进行数据可视化需要进行数据降维。PCA主成分分析可以在减少需要分析的飞行数据维度指标时,尽量减少原始飞行数据包含信息的损失,达到对原始飞行数据进行全面分析的目的[7]。通过PCA主成分分析将速度、航向、经度、纬度、高度五个维度的特征数据降维成二维和三维特征的数据,以此来进行飞行数据在二维平面和三维空间的数据可视化[8]。

部分民航飞机和无人机的飞行数据降维后在二维平面的可视化图如图2所示。

图2 民航飞机和无人机飞行数据二维平面示意图

部分民航飞机和无人机的飞行数据降维后在三维空间的可视化图如图3所示。

图3 民航飞机和无人机飞行数据三维空间示意图

从二维平面图可视化图中发现代表民航飞行数据点的圆形处于图2中左上角位置,代表无人机飞行数据点的三角形处于图2中右下角位置,而在三维空间可视化图中发现代表民航飞行数据点的圆形处于图3中靠里的位置,代表无人机飞行数据点的三角形处于图3中靠外的位置。通过二维平面和三维空间飞行数据可视化图像,能够观察到代表不同飞行目标的数据点的位置的分布不同,飞行特征数据可视化图形象直观地展现了民航飞机和无人机飞行特征数据之间的不同,给分类器提供了分类依据。

5 基于统计学原理的决策树分类方法

本章节介绍采用传统统计学方法即决策树方法来对雷达监测的飞行目标进行分类的原理过程[9]。在特征独立性假设成立的情况下(即飞行轨迹特征速度、航向、经度、纬度、高度相互独立),将预处理后的数据样本集分为训练集、验证集和测试集,并且把这些样本集都分为平均的两类数据,一类为普通民航飞机飞行的数据,一类为无人机飞行的数据,记为D={D1,D2},数据标签属性记为A={a1,a2},假设当前样本集合D中第k类样本所占的比例为Pk的(k=1,2…,|y|),则D的信息熵定义为

标签属性a假设有T个可能的取值[10],根据对应的属性a来对样本集D进行划分,因为a有T个可能的取值,则就会产生T个分支结点,根据样本集中所有在属性a上取值为at的样本,选取第t个分支结点的样本,记为Dt,由于不同的分支结点所包含的样本数不同,赋予权重|Dt|/|D|给分支结点,结合之前计算出的信息熵可以计算出用属性a对样本集D进行划分所获得的信息增益[11]:

选择信息增益最大的属性a:

最后根据著名的ID3决策树学习算法[12]中以信息增益为准则来选择划分属性,根据计算出的信息增益,递归生成决策树分类模型。

6 基于深度学习的神经网络方法

本节介绍了DNN神经网络的特点和它与决策树模型的对比分析。

传统的基于统计学的决策树分类模型它在假定已知各种情况发生概率的前提下,运用概率分析构成决策树来求得当前值的期望值与零比较大小的概率,它一般用于评估项目风险和判断其可行性的基于统计学的决策分析图解方法。它的优点是对缺失的数据不敏感,能同时处理常规型和数据型的大批量数据,并且能在相对短的时间内训练出预测结果良好的模型,但是它的缺点是递归生成的决策树模型往往会导致过拟合,导致模型在训练集上能有很高的准确率,但是在测试集上预测结果不准确,而且处理特征相关和连续性的数据时候效果很差。

由于受到了神经网络科学的启发,机器学习从单层感知机发展到多层感知机,而深度学习通过神经网络的深层次架构学习出高层特征,并且随着神经网络层数的增加,可以学习更加复杂的非线性模型,而DNN就是超过一个隐层的深层次的神经网络模型。现有的DNN模型主要有以下几点:第一,对于权值空间中的收敛值它比采用纯BP算法的随机初始权值更加接近[13];第二,随着神经网络隐藏层层数的增加,虽然增加了模型复杂度,但是却增强了模型的表达和泛化能力;第三,激励函数的使用,本次分类采用的是ReLU激励函数,它以0为中心,右边是线性函数可以保证梯度回传很远,左边直接对信号进行抑制,并且在最后一层使用softmax函数进行分类预测,并且使用了Adagrad优化器[14]。基于深度学习的DNN模型通过构建具有非线性网络结构和多层隐层的复杂模型,利用大量的训练数据来将低层特征形成更加抽象的高层特征,从而提高模型分类和预测的准确率。DNN模型体系突出了模型的深度结构,强调特征学习的重要性,通过多层隐层将原本样本空间的特征逐层转换到新的特征空间,对比与传统的采用人工规则构造特征的方式,采用大数据来训练的DNN模型能学习到更有用的特征和能够刻画出数据之间丰富的深层次的内在信息[15]。现如今某些采用深度学习方法通过让机器自动学习出模式特征的应用中,有很多已经超过原有通过算法来识别和分类的性能[16]。

7 实验结果以及分析

7.1 数据集大小

决策树模型和DNN神经网络的总的数据集有2840420条数据和对应的2840420条标签数据,将总的数据集拆分为训练集2808420条数据,验证集12000条数据,测试集20000条数据。并且每一个数据集中民航飞机和无人机的数据各占一半。

7.2 实验结果比较

测试集在两种分类模型下的分类效果如表3所示。

表3 两种模型的性能比较

从决策树分模型和DNN神经网络模型,这两种分类方法的实验结果来看,DNN神经网络分类模型相对来说具有更好的效果,准确率对比决策树有接近25%的提高。

7.2.1 训练集、验证集和测试集的交叉熵损失变化

训练集、验证集和测试集的交叉熵损失的变化曲线如图4所示,其中实线代表训练集的交叉熵损失的变化曲线,虚线代表验证集的交叉熵损失的变化曲线,点线代表测试集的交叉熵损失的变化曲线。可以看出,当模型训练轮数迭代步数达到200时,训练集、验证集和测试集的交叉熵损失都由高到低最后趋近于0达到稳定,其中训练集交叉熵损失略低于验证集和测试集。

图4 训练集、验证集和测试集的交叉熵损失变化

7.2.2 训练集、验证集和测试集的准确率变化

图5 训练集、验证集和测试集的准确率变化

训练集、验证集和测试集的分类准确率的变化曲线如图5所示,其中实线代表训练集的准确率的变化曲线,虚线代表验证集的准确率的变化曲线,点线代表测试集的准确率的变化曲线。可以看出,当模型训练轮数迭代步数达到200时,训练集、验证集和测试集的分类准确率都由低到高最后趋近于1达到稳定,其中训练集准确率略高于验证集和测试集。

8 结语

本文利用雷达监测的飞行目标数据,结合目前最新的谷歌人工智能深度学习框架Tensorflow来解决不同的飞行动态目标的识别的问题,通过实验的结果比较分析,应用深度学习中的DNN神经网络模型相较于传统基于统计学原理的决策树模型具有更高的识别准确率。而如何应用深度学习神经网络模型识别更多不同类型的动态飞行目标,并且提高其识别准确率仍然是未来研究的方向。

猜你喜欢

飞行数据决策树坐标系
独立坐标系椭球变换与坐标换算
简述一种基于C4.5的随机决策树集成分类算法设计
坐标系背后的故事
GARMIN1000系统维修平台搭建预研究
三角函数的坐标系模型
浅谈飞行数据集中处理流程管理
求坐标系内三角形的面积
民航空管自动化系统中飞行电报自动化处理
决策树学习的剪枝方法
决策树在施工项目管理中的应用