APP下载

BiLSTM-Attention: 一种空中目标战术意图识别模型

2021-11-12滕飞刘曙宋亚飞

航空兵器 2021年5期
关键词:注意力机制

滕飞 刘曙 宋亚飞

摘 要:传统空中目标战术意图识别过程中仅依据单一时刻进行推理分析, 而实际战场中目标战术意图是由一系列动作实现的, 因此目标状态呈现动态、 时序变化特征。 针对此问题在长短期记忆网络(LSTM)的基础上引入双向(Bidirectional)传播机制和注意力(Attention)机制, 提出基于BiLSTM-Attention的空中目标战术意图识别模型。 采用分层的方法构建空战意图特征集, 并将其编码成时序特征, 将决策人员经验封装成标签, 通过BiLSTM神经网络学习空战意图特征向量中的深层次信息, 并利用注意力机制自适应分配网络权重, 将不同权重的空战特征信息放入Softmax函数层进行意图识别。 通过与传统空中战术目标意图识别模型对比及消融实验分析表明, 所提模型有效提升了空中目标战术意图识别效率, 对辅助作战系统具有重要的理论意义和参考价值。

关键词: 意图识别; 注意力机制; 双向长短时记忆网络; 空中目标; 时序特征

中图分类号: TJ760; E824  文献标识码:    A  文章编号: 1673-5048(2021)05-0024-09

0 引  言

在现代信息化空战中, 航空科学和军事技术的蓬勃发展导致空中目标受到越来越严重的威胁。 同时, 高科技的不断应用导致战场环境的复杂性和信息不对称等特征不断涌现, 仅依靠专家经验很难从复杂空战环境中实时、 准确地识别敌方目标意图。 因此, 迫切需要智能化推理方法来突破传统人工方式的弊端, 帮助己方夺取制空权甚至战争的胜利[1-2]。

近年来, 为满足作战决策系统的需求, 在军事领域开展了大量的意图识别研究。 现有的用于复杂战场环境下对敌目标意图识别研究主要有证据理论[3]、 模板匹配[4]、 专家系统[5]、 贝叶斯网络[6-7]和神经网络[8-9]等方法。 文献[3]利用舰船的传感器测得空中目标的特征信息, 建立置信规则库, 用证据推理融合多源信息对目标意图进行识别。 文献[4]在以态势数据库为基础构成的模板上, 设计了意图识别推理模型, 并提出基于D-S证据理论的意图识别模板匹配方法。 文献[5]使用领域专家知识构建知识库, 而后将战场态势与作战意图的对应关系用规则的形式进行表达, 最后使用推理机得出推理结果。 文献[6-7]依据军事专家知识确定贝叶斯网络参数, 通过节点表示特征, 有向弧表示转移关系, 条件概率表示关系强度, 利用新事件影响后向传播从而对网络参数进行更新, 一直到某个意图超越阈值, 该意图即为识别意图。 文献[8]将实际战场中的信息进行收集, 从中选择合适的特征并进行数据预处理得到数据集, 然后将数据集输入神经网络, 利用神经网络的自适应和自学习能力得到作战意图识别规则, 之后使用空战意图识别规则来推理出敌目标作战意图。

上述方法通过依靠单一时刻的特征信息进行分析和推理, 很难有效从时序变化的目标状态特征中寻找出隐含的深层信息。 而实际上, 目标意图在战场中是通过一系列战术动作实施的, 所以目标的动态属性和战场环境会呈现出动态、 时序变化特征, 并且敌方目标的作战行动会具有一定的欺骗性和隐蔽性, 故依据单一时刻的特征信息来推理敌目标意图是不够科学的[9]。  文献[10]针

对时序变化特征提出基于长短期记忆(long-term and    short-term  memory, LSTM)网络的战术意图智能识别模

型, 该模型对识别目标作战意图有良好的效果, 并且符合战场态势信息中的时序特征和前后逻辑关系, 但其只能利用历史时刻信息来对当前信息作出判断, 无法利用未来时刻信息, 且其准确率还有较大提升空间。

综上, 本文提出一种基于BiLSTM-Attention空中目标战术意图智能识别模型, 在基于LSTM网络的基础上引入双向(Bidirectional)循环机制和注意力(Attention)机制, 从而模拟决策人员对于空战情况的推理过程。 将编码化的空战特征向量输入BiLSTM层, 相比放入LSTM层能充分利用历史时刻和未来时刻信息综合作出判断; 把BiLSTM层的输出向量放入Attention机制层能进一步突出影响意图的关键信息, 提高意图识别的准确率。 将多种模型与本文提出模型进行对比实验, 以准确率、 损失值、 召回率、 精确率、 F1-分数作为评价指标, 证明了本文提出模型在空中目标战术意图识别方面的有效性。

1 空中目标意图识别问题描述

空中目标战术意图是从实时、 对抗性环境中, 通过提取相应时空域内的战场环境信息、 空战敌我目标的静态属性和实时动态信息进行分析, 并结合相应军事领域知识, 来推理敌方目标作战意图的过程[11], 如图1所示。

空中目标战术意图识别是一种典型的模式识别问题, 可以描述为空战意图识别特征到空战意图类型的映射。 定义 I=(i1, i2, …, in) 為空中目标战术意图空间, 定义 Vt 为 t 时刻战场实时特征信息。 由于空中目标战术意图识别是在复杂、 高对抗战场条件下进行的, 被识别目标会尽可能欺骗我方决策人员, 迫使我方作出错误判断, 故用单一时刻特征来识别敌方作战意图与实际情况会有较大差异。 因此, 从被识别目标多个连续时刻的特征信息中推测其作战意图更具有科学性。 定义 VT 为 t1 到 tT 连续 T 个时刻的特征集构成的时序特征集, 从而确定战术意图空间 I 到时序特征集 VT 的映射函数:

I=f(VT)=f(V(t1), V(t2), …, V(tT)) (1)

由于空战本身存在的高对抗性、 不确定性、 复杂性等, 很难通过数学公式归纳推导出战术意图类型到时序特征集的映射关系[1]。 本文通过使用空战数据集来训练BiLSTM-Attention网络结构, 从而隐式地建立战术意图类型到时序特征集的映射关系。 整个空战意图识别过程如图2所示。

在进行空中目标战术意图识别时, 首先通过空战领域专家对历史数据进行意图类型标定得到完整训练数据集, 之后将预处理后的数据集输入BiLSTM-Attention网络训练得到空战意图类型与时序特征集之间的映射关系; 在实际空战时, 通过传感器实时采集连续 N 个时刻( Tn~Tn+N )目标的状态信息, 最后将采集的目标状态信息整合编码后输入到训练好的目标意图识别模型, 得到目标意图识别结果。

为准确描述空中目标战术意图识别模型, 做如下假设: (1)敌我双方所处的空战地形、 大气层、 气候等战场环境条件大致相同; (2)敌方空中目标战术意图在所提取的时间序列中不发生改变[2]。

1.1 目标战术意图空间描述

目标战术意图空间对于不同的作战形式、 不同的场景、 不同的敌方实体有不同的意图空间。 因此, 需要根据相应的作战情况定义适合的战术意图空间。 如文献[3]中定义敌方空中目标对我方水面舰艇的战术意图空间为{侦察、 监视、 攻击、 掩护}; 文献[12]对于敌方单组海上舰船编队建立戰术意图空间为{攻击、 侦察、 撤退、 掩护}; 文献[13]定义敌方空中目标对我方潜艇的战术意图空间为{攻击、 搜潜、 驱离、 巡逻}; 文献[14]对于水下威胁目标建立战术意图空间为{攻击、 规避、 巡逻}。

本文针对某空域无人机交战为研究对象, 建立敌方目标的战术意图空间包括: 突防、 佯攻、 攻击、 侦察、 撤退、 监视、 电子干扰7种意图类型。

在确立意图空间后, 如何将人的认知模式转换成智能模型训练的标签, 并与战术意图空间中意图类型相对应, 是将BiLSTM-Attention模型应用于战术意图识别的关键。 分析目标战术意图推理过程可知, 决策人员得到战场态势信息后, 结合自身经验作出敌方目标意图判断是很难显式表达出来的, 但是人的认知经验往往隐含在对敌方目标作战意图的推理过程中。 因此, 可以将决策人员的认知经验封装成标签来训练BiLSTM-Attention模型。 针对本文中确立的7种敌方目标作战意图类型, 相应的作战意图类型编码与模式解析机制如图3所示。  例如, 若BiLSTM-Attention模型输出的意图识别结果为3, 则可认为敌方目标的作战意图为监视意图,  故通过将敌方作战意图编码的方式能简单清楚地表达出决策者的认知经验, 并且更加容易训练模型。

1.2 空中目标战术意图识别特征描述

敌方目标战术意图与敌我双方的威胁程度和作战任务高度相关。  例如,  我方对敌方威胁程度远大于敌方对我方的威胁程度时, 敌方目标的战术意图为“攻击”的可能性就会大大降低。 因此,  为识别不同的敌我双方威胁

程度和作战任务, 需要提取不同的空战特征。

从威胁程度角度, 影响目标威胁程度大小的因素有

很多, 本文主要考虑敌我双方距离、 速度、 角度以及飞行加速度。 空战能力因子也是决定目标威胁程度大小的重要因素, 对于战机的空战能力, 借鉴文献[15]构建单机空战能力威胁函数:

C=[ ln ε1+ ln (ε2+1)+ ln (∑ε3+1)]ε4ε5ε6ε7 (2)

其中,  ε1~ε7 分别表示战机机动性能、 机载武器性能、 机载设备探测能力、 战机的基本飞行性能、 战机的操作性能、 战机的作战生存性能以及电子信息对抗性能。 空战能力威胁是战机的固有性能, 因此可根据公式计算出一定时期内敌我双方各式战机的空战能力因子, 保存在数据库中, 并根据我方掌握的装备发展情况实时更新数据库数据。

从作战任务角度, 当敌方战机执行某项作战任务时, 其战机的某些特征信息必须满足一定的条件。 例如, 歼击机在空战攻击时通常采用高速接近敌方目标, 战机飞行速度一般是735~1 470 km/h; 执行突防任务时分为低空突防和高空突防, 对应高度为50~200 m和10 000~11 000 m[16]。 目标雷达信号状态与作战任务也存在一定联系。 例如, 空战格斗时通常保持对空雷达开启, 执行侦察任务时保持对空雷达和对海雷达的开启[2]。 不同类型的战机具备不同的应用价值和战术意义, 歼击机攻击性较强, 侦察机侦察能力强, 因此敌机类型也可作为战术意图识别特征。

此外, 空中目标战术意图的实现与战机机动动作密切相关。 常见的机动动作库有两种设计类型: 一类是以典型空战战术飞机动作作为依据设计的“典型战术动作库”, 另一类以空战基本操纵动作为设计依据的“基本操纵动作库”。 由于本文研究的是时序特征, 通过采集12帧的目标特征信息进行战术意图识别, 而“典型战术动作库”的控制算法求解复杂, 动作的退出和转换时间点难以确定, 故本文采用“基本操纵动作库”[17]。 该库是由美国国家航空咨询委员会(NASA)学者根据空战中最常用的机动方式提出的, 主要包括7种机动动作: 最大加速、 最大减速、 最大过载爬升、 最大过载俯冲、 最大过载右转、 最大过载左转、 稳定分型, 但是由这7种机动方式组合的机动动作还不够多, 并且都采取极限操纵, 显然不符合空战实际。 本文选用改进后的基本操纵动作11种[18], 包括:匀速前飞、 减速前飞、 加速前飞、 爬升、 右爬升、 左爬升、 俯冲、 右俯冲、 左俯冲、 右转、 左转。

综上所述, 本文的空中目标战术意图识别特征集为{对空雷达状态、 对海雷达状态、 干扰状态、 受干扰状态、 机动类型、 敌机类型、 敌机加速度、 敌机高度、 敌机速度、 敌机空战能力因子、 航向角、 方位角、 我机加速度、 我机高度、 我机速度、 我机空战能力因子、 双方距离}17维特征向量,  并且可分为数值型特征和非数值型特征。 特征描述图如图4所示。

2 基于BiLSTM-Attention空战意图识别模型

BiLSTM-Attention模型共分为三部分: 空战特征向量输入层、 隐含层和输出层。 其中, 隐含层由BiLSTM层、 Attention层和Dense层三部分组成。 网络的输入节点input=(12, 17), 输出节点output=7, 其中, 12表示步长; 17表示特征维数; 7表示意图类别数。 其BiLSTM-Attention模型结构如图5所示。

2.1 输入层

本文的输入层主要是对采集的空战特征数据集进行预处理, 即将这些数据集处理成BiLSTM层能够直接接受并能处理的特征向量形式。 空战特征向量化具体操作步骤如下:

(1) 读取采集数据并进行数据清洗。

(2) 将数值型空战特征数据进行归一化处理。  数据归一化能够消除数据量纲影响, 提高网络收敛效率, 本文对敌机加速度、 敌机高度、 敌机速度、 敌机空战能力因子、 航向角、 方位角、 我机加速度、 我机高度、 我机速度、 我机空战能力因子、 双方距离共11种数值型空战特征数据进行归一化处理。 对于第x种数值型数据 Fx=[fx1, fx2, …fxi, …, fxn](x=1, 2, …, 11) ; n为数据总数。 将第x种中第i个原始数据值 fxi 映射到区间[0, 1]的结果为 fxi′ , 其公式为

fxi′=fxi- min Fx max Fx- min Fx (3)

式中:   minFx 为第x维特征Fx 的最小值;   maxFx 为第x维特征Fx 的最大值。

(3) 将非数值型空战特征数据编码。 对于对空雷达状态、 对海雷达状态、 干扰状态、 受干扰状态4种属性数据编码表示为0和1。 例如, 对空雷达状态中0表示雷达处于关闭状态, 1表示雷达处于打开状态。 对于机动类型和敌机类型两种属性数据应用Mllier的9级量化理论[19], 获得各非数值型特征的编码化数据, 而后进行归一化处理。

(4) 将7种敌方目标作战意图类型按图3所示编码成类别标签。

(5) 随机初始化数据, 按8∶2划分训练集和测试集。

经过上面的五步操作之后, 采集到的空战特征数据就变成隐含层能够直接接受并处理的特征向量形式。

2.2 隐含层

2.2.1 BiLSTM层

长短期记忆网络作为一种特殊的循环神经网络(Recurrent Neural Network, RNN), 也具有同RNN相类似的递归结构, 但LSTM通过引入门控开关的思想来模拟人脑的遗忘机制和记忆机制, 从而克服长序列训练过程中的梯度消失和梯度爆炸问题[20]。

在LSTM体系结构中通过遗忘门、 更新门、 输出门以及记忆单元实现信息的输入和输出, LSTM的单个神经元体系结构如图6所示。 图中Xt为时间t时刻的输入特征;ct-1为更新前的神经元;Ct为更新后的神经元;ht-1和ht分别为上一时刻和当前时刻的输出特征;Γf,Γu和Γo分别为遗忘门、 更新门和输出门;t 为候选神经元;  σ 为Sigmoid函数。 其运算过程如下:

Γf =σ(Wf [ht-1, Xt]+b f)(4)

Γu =σ(Wu [ht-1, Xt]+b u)(5)

C~t= tanh (Wc [ht-1, Xt]+bc ) (6)

ct=Γu *C~t+Γf *Ct-1  (7)

Γo =σ(Wo [ht-1, xt+b o]) (8)

ht=Γo*tanhct(9)

其中,Wf,W u,W c,Wo以及b f,b u,b c,b o為各相应部分的权重系数矩阵和偏移向量。

传统的LSTM网络为单向的神经网络结构, 所获取的信息都是当前时刻之前的历史信息, 导致忽略了未来的信息, 而BiLSTM网络是由前向的LSTM网络与后向的LSTM网络组成, 具有能够捕获前后信息特征的作用, 其模型结构如图7所示。

从图7可以看出, BiLSTM在t时刻隐层状态Ot 可通过前向隐层状态 ht 和后向隐层状态 ht 两部分求得, 前向隐层状态 ht 由当前输入的xt和(t-1)时刻前向的隐层状态 ht-1 决定, 后向隐层状态 ht 由当前输入的xt和(t+1)时刻后向的隐层状态 ht+1 决定[21]。 计算公式如式(10)~(12)所示, 其中wi(i=1, 2, …, 6)表示一个单元层到另一个单元层的权重。

ht=f(w1xt+w2ht-1) (10)

ht=f(w3xt+w5ht+1) (11)

Ot=g(w4ht+w6ht) (12)

2.2.2 Attention层

Attention机制与人类的视觉所特有的大脑信号处理机制相似, 其通过计算不同时刻BiLSTM网络中输出的特征向量的权重, 突出对预测结果占比更大的特征, 从而使整个神经网络模型表现出更优的性能。 Attention机制在机器翻译、 语音识别等时序数据中表现优异, 在分类预测中也有较为不错的效果, 可以单独使用, 也可以在其他混合模型中作为其他混合模型的层使用[22]。 在本文空中目标战术意图识别中, 神经网络在训练过程中通过Attention机制来重点关注一些关键的特征, 其核心是权重系数。 首先学习每个特征的重要程度, 而后根据重要程度为每个特征分配相应的权重。 例如, 敌机是攻击意图时, 其中航向角、 机动类型等特征会被Attention机制分配更多的权重来加深模型记忆。 Attention机制模型基本结构如图8所示。Ot 为BiLSTM网络输出的第t个特征向量, 将其输入注意力机制隐藏层得到初始状态向量st , 而后与权重系数αt对应相乘并累加求和, 得到最终输出的状态向量Y。 计算公式如下:

et= tanh (wtst+bt) (13)

αt= exp (et)/∑ti=1ei (14)

Y=∑nt=1αtst (15)

式中: et为第t个特征向量的状态向量st所确定的能量值;wt为第t个特征向量的权重系数矩阵;bt为第t个特征向量相对应的偏移量。 根据式(14)可以实现由输入初始状态到新的注意力状态的转换, 之后通过式(15)得到最终输出的状态向量Y, 最后将Y与Dense层整合在一起作为一个输出值输入到最后的输出层。

2.3 输出层

输出层的输入为隐含层中Attention机制层的输出。 利用多分类Softmax函数对输出层的输入进行相应计算, 从而得出空中目标战术意图分类:

yk=softmax(w1Y+b1)(16)

其中:w1为Attention机制层到输出层需要训练的权重系数矩阵;b1为需要训练的对应偏置; yk 为输出层的输出预测标签。

3 实验分析

3.1 实验数据集

实验以某空域无人机交战为研究背景, 实验数据来源于某作战仿真系统中。 通过多次运行仿真系统, 得到多种空战意图模式, 从中随机抽取10 000个空战意图样本, 针对每个样本采集连续12帧信息(每帧信息包括航向角、 飞行高度、 干扰状态、 雷达状态等17个维度特征信息)。 由于样本集数据量过大,  选择由空战领域专家通过空战经验编写意图识别规则来生成意图标签, 之后通过计算机对空战意图样本进行模式分类, 最后由空战领域专家根据空战经验对存在意图分类歧义的样本数据进行修订。 其中数据集包括 7 种目标战术意图, 各战术意图数据占比情况为攻击意图 21.6%、 突防意图20.0%、 侦察意图19.8%、 监视意图12.9%、 佯攻意图10.0%、 电子干扰意图9.25%、 撤退意图6.45%。 样本规模为10 000, 其中按8∶2划分训练集与测试集, 故训练集样本规模为8 000, 测试集样本规模为2 000。

3.2 实验设置

本实验以准确率、 损失值作为实验的评价指标。

实验使用Python语言, 在GPU加速环境下进行, 采用Keras深度学习框架, 电脑配置为Win10t系统、  GTX960M顯卡、 8GB内存。

实验中有很多超参数需要设置, 依据准确率进行调整。 记隐藏层层数为HL, 各隐藏层节点数为HS。 (1)保持隐藏层层数不变, 分别设置不同的隐藏层节点数, 分析隐藏层节点数对模型性能的影响, 设HL=1, HS=[64], [128], [256], [512], 得出最优隐藏层节点数, 结果如图9所示。 (2)依据得出的最优隐藏层节点数, 在总体数目保持不变的情况下, 分别设置不同的隐藏层层数, 分析隐藏层层数对模型性能的影响, 设HL=1, HS=[256]; HL=2, HS=[128, 128]; HL=3, HS=[128, 64, 64]; HL=4, HS=[128, 64, 32, 32], 结果如图10所示。

由图9可见, HS=64, 128, 256, 512的模型识别准确分别在93%, 94%, 96%, 95%左右, 说明隐藏层节点数并不是越多越好, 而是存在一个合适的隐藏层节点数, 隐藏层节点数过多还会容易发生“过拟合”现象。 由图10可见, 随着隐藏层层数的增加, 模型的识别准确率逐渐提升, 具有三隐藏层的BiLSTM-Attention模型的性能明显优于单隐藏层和双隐藏层模型。 当隐藏层层数增加到4层时, 模型的收敛速度稍有下降, 并且稳定后的准确率也低于三隐藏层模型。 故在隐藏层节点数不变的情况下, 适当增加网络深度会有效提升模型识别准确率, 但当达到一定层数后, 再增加隐藏层层数效果会变差。 其他关键超参数设置如下表1所示。

3.3 实验结果分析

3.3.1 BiLSTM-Attention模型识别结果分析

BiLSTM-Attention模型经训练后对20%的样本测试, 实验表明本文提出的网络模型准确率达到97.3%, 为进一步观测各识别意图之间的关系, 制作数据集的混淆矩阵, 对角线表示识别正确的样本个数, 如表2所示。

可以看出, 模型对于7种意图识别皆具有较高识别准确率, 特别是撤退意图的识别准确率可达到100%。 对于攻击意图有较少部分错误识别为佯攻意图, 侦察意图和监视意图也有少部分相互识别错误, 经分析应是两种意图对应的空战特征相似性较高、 意图欺骗性更强, BiLSTM神经网络无法确保训练的模型权重在识别此类战术意图之间有明显差别, 故最后的注意力机制层无法准确地感知到两者之间的权重差异, 从而导致有少部分意图相互识别错误情况出现, 符合实际情况。

3.3.2 模型的对比实验

本实验选取100次迭代过程中, 测试集上最高的准确率作为该模型的准确率, 相对应的损失值即为该模型的损失值。 使用本文所提模型BiLSTM-Attention分别与文献[9]提出的栈式自编码器(SAE)战术意图智能识别模型、 文献[10]提出的基于LSTM的战场对敌目标战术意图识别模型、 文献[16]提出的使用ReLU函数和Adam算法优化的DBP神经网络空中目标作战意图识别模型、 传统的多分类模型支持向量机(SVM)和多层感知机(MLP)进行对比实验。 对比实验参数设置如表3所示, 实验具体结果如表4所示。

从表4可看出, 本文所提出的模型BiLSTM-Attention较其他五种模型在准确度和损失值两方面都表现得更加优异, 较两种传统机器学习方法SVM和MLP准确率可提高约30%, 较传统神经网络方法准确率可提高约20%, 较基础LSTM模型准确率提高2.8%, 从而验证本文所提模型对于空中目标战术意图识别的有效性。 进一步分析, LSTM与BiLSTM-Attention作为以RNN为基础的时序特征网络模型较其他模型更加适用空中目标战术意图识别, 进一步说明依据时序特征变化来判断空中目标意图更加具有科学性。

3.3.3 模型消融实验

虽然BiLSTM-Attention模型与LSTM, SAE, DBP, MLP, SVM模型的对比实验已经充分说明BiLSTM-Attention模型具有高准确率和低损失率的特点, 能准确识别空中目标战术意图, 但其毕竟不属于同种类型混合实验模型的对比, 缺少一定实验说服力。 因此, 在同一数据集上做模型消融实验, 其实验结果如表5、 图11~12所示。

从表5中可以看出, 本文所提模型准确率可高达97.3%, 对比LSTM, LSTM-Attention, BiLSTM模型使準确率分别提升了2.8%, 1.5%, 和1.1%。 所提模型损失值对比其他三种模型也更低。 从图11~12的消融实验准确率与损失值变化情况分析, 四种模型中从左往右看随训练轮次的增加总体上准确率不断提高, 损失值不断降低, 其中BiLSTM-Attention模型始终优于其余三种模型, BiLSTM-Attention与BiLSTM在最初训练不久后, 其准确率和损失值就明显优于其余两种模型, 经分析认为双向传播机制能有效提高训练效果, 使神经网络模型在相同批量大小、 学习率、 训练轮次的情况下能更快地学习。 BiLSTM与LSTM-Attention两种模型曲线较为接近, 且都明显优于LSTM模型, 可见通过引入双向传播机制和注意力机制对于LSTM模型有明显提升。

引入精确率(意图识别正确的正样本个数占意图识别器判定为正样本个数的比例)、 召回率(意图识别正确的正样本个数占实际的正样本个数的比例)、 F1-分数(精确率和召回率的调和平均值)三种模型评估指标, 进一步验证模型优越性。 结果见表6。

表5中①、 ②、 ③、 ④分别表示BiLSTM-Attention、 BiLSTM、 LSTM-Attention、 LSTM空中目标战术意图识别模型。 可以得出四种模型对于佯攻和监视意图识别率相对较低, 经分析, 应是这两种意图与攻击意图和侦察意图空战特征相似性较高, 对于撤退意图识别率较高。 BiLSTM与LSTM-Attention模型三种评估指标结果相差较小, 但都明显高于LSTM, BiLSTM-Attention模型在各项评估指标中全面占优, 证明了本文所提模型能够以高准确度对空中目标战术意图进行识别。

4 结  论

本文针对在复杂战场环境下仅依靠专家经验很难高效识别敌方目标意图, 且传统空中目标战术意图识别仅依据单一时刻分析, 缺乏科学性, 准确率较低的问题, 分析了空战目标战术意图识别问题特点。 采用分层策略从威胁程度和作战任务两方面选取共17维空战特征, 将决策人员的认知经验封装作为标签, 提出一种利用空中目标时序特征变化的BiLSTM-Attention空战目标战术意图识别模型。 该模型利用BiLSTM神经网络充分学习连续12帧空战特征信息, 提取更为深层次特征, 而后利用注意力机制对特征分配不同权重, 以达到更加精确识别意图的目的。 通过与其他模型对比实验显示, 本文所提模型学习速度较快且识别准确率更高。 本文模型对于空战特征相似性高、 欺骗性强的意图识别还存在不足, 以及在所检测的时间序列中意图若发生改变应如何识别, 这将是下一步研究的重点。

参考文献:

[1] 樊会涛, 闫俊.  自主化——机载导弹重要的发展方向[J]. 航空兵器, 2019, 26(1): 1-10.

Fan Huitao, Yan Jun.  The Important Development Direction of Airborne Missile:   Autonomization[J].  Aero Weaponry, 2019, 26(1): 1-10. (in Chinese)

[2] 刘钻东,  陈谋,  吴庆宪,  等. 非完备信息下无人机空战目标意图预测[J]. 中国科学: 信息科学,  2020,  50(5): 704-717.

Liu Zuandong,  Chen Mou,  Wu Qingxian,  et al. Prediction of Unmanned Aerial Vehicle Target Intention under Incomplete Information[J]. Scientia Sinica Informationis,  2020,  50(5): 704-717.(in Chinese)

[3] 赵福均,  周志杰,  胡昌华,  等. 基于置信规则库和证据推理的空中目标意图识别方法[J]. 电光与控制,  2017,  24(8): 15-19.

Zhao Fujun,  Zhou Zhijie,  Hu Changhua,  et al. Aerial Target Intention Recognition Approach Based on Belief-Rule-Base and Evidential Reasoning[J]. Electronics Optics & Control,  2017,  24(8): 15-19.(in Chinese)

[4] 李香亭. 态势估计中目标意图识别的研究与实现[D]. 太原: 中北大学,  2012.

Li Xiangting. The Research and Implementation of Situation Assessment in the Target Intention Recognition[D]. Taiyuan: North University of China,  2012. (in Chinese)

[5] 尹翔,  张萌,  陈梦乔. 基于判别分析的空中目标作战意图识别[J]. 弹箭与制导学报,  2018,  38(3): 46-50.

Yin Xiang,  Zhang Meng,  Chen Mengqiao. Combat Intention Re-cognition of the Target in the Air Based on Discriminant Analysis[J]. Journal of Projectiles, Rockets, Missiles and Guidance,  2018,  38(3): 46-50.(in Chinese)

[6] Jin Q,  Gou X T,  Jin W D,  et al. Intention Recognition of Aerial Targets Based on Bayesian Optimization Algorithm[C]∥ 2nd IEEE International Conference on Intelligent Transportation Engineering,  2017: 356-359.

[7] Song Y,  Zhang X H,  Wang Z K. Target Intention Inference Model Based on Variable Structure Bayesian Network[C]∥ International Conference on Computational Intelligence and Software Engineering,  2009: 1-4.

[8] 吴南方. 基于循环神经网络的集群意图识别方法研究[D]. 成都: 西南交通大学,  2019.

Wu Nanfang. Research on Cluster Intention Recognition Method Based on Recurrent Neural Network[D]. Chengdu: Southwest Jiaotong University,  2019. (in Chinese)

[9] 欧微,  柳少军,  贺筱媛,  等. 基于时序特征编码的目标战术意图识别算法[J]. 指挥控制与仿真,  2016,  38(6): 36-41.

Ou Wei,  Liu Shaojun,  He Xiaoyuan,  et al. Tactical Intention Re-cognition Algorithm Based on Encoded Temporal Features[J]. Command Control & Simulation,  2016,  38(6): 36-41.(in Chinese)

[10] 歐微,  柳少军,  贺筱媛,  等. 战场对敌目标战术意图智能识别模型研究[J]. 计算机仿真,  2017,  34(9): 10-14.

Ou Wei,  Liu Shaojun,  He Xiaoyuan,  et al. Study on the Intelligent Recognition Model of Enemy Targets Tactical Intention on Battlefield[J]. Computer Simulation,  2017,  34(9): 10-14.(in Chinese)

[11] Zhou T L,  Chen M,  Wang Y H,  et al. Information Entropy-Based Intention Prediction of Aerial Targets under Uncertain and Incomplete Information[J]. Entropy,  2020, 22(3): 279.

[12] 陈浩,  任卿龙,  滑艺,  等. 基于模糊神经网络的海面目标战术意图识别[J]. 系统工程与电子技术,  2016,  38(8): 1847-1853.

Chen Hao,  Ren Qinglong,  Hua Yi,  et al. Fuzzy Neural Network Based Tactical Intention Recognition for Sea Targets[J]. Systems Engineering and Electronics,  2016,  38(8): 1847-1853.(in Chinese)

[13] 张天赫,  彭绍雄,  邹强,  等. 无监督神经网络的潜艇对空战术意图识别[J]. 现代防御技术,  2018,  46(2): 122-129.

Zhang Tianhe,  Peng Shaoxiong,  Zou Qiang,  et al. Unsupervised Learning Neural Network Based Submarine Recognize Tactical Intention for Air Target[J]. Modern Defence Technology,  2018,  46(2): 122-129.(in Chinese)

[14] 陆光宇,  丁迎迎. 水下平台对敌意图识别技术研究[J]. 指挥控制与仿真,  2012,  34(6): 100-102.

Lu Guangyu,  Ding Yingying. Study on Intention Recognition to  Foe of Underwater Platform[J]. Command Control & Simulation,  2012,  34(6): 100-102.(in Chinese)

[15] 奚之飞,  徐安,  寇英信,  等. 基于PCA-MPSO-ELM的空战目标威胁评估[J]. 航空学报,  2020,  41(9): 216-231.

Xi Zhifei,  Xu An,  Kou Yingxin,  et al. Target Threat Assessment in Air Combat Based on PCA-MPSO-ELM Algorithm[J]. Acta Aeronautica et Astronautica Sinica,  2020,  41(9): 216-231.(in Chinese)

[16] 周旺旺,  姚佩阳,  张杰勇,  等. 基于深度神经网络的空中目标作战意图识别[J]. 航空学报,  2018,  39(11): 200-208.

Zhou Wangwang,  Yao Peiyang,  Zhang Jieyong,  et al. Combat Intention Recognition for Aerial Targets Based on Deep Neural Network[J]. Acta Aeronautica et Astronautica Sinica,  2018,  39(11): 200-208.(in Chinese)

[17] 朱可钦,  董彦非. 空战机动动作库设计方式研究[J]. 航空计算技术,  2001,  31(4): 50-52.

Zhu Keqin,  Dong Yanfei. Study on the Design of Air Combat Maneuver Library[J]. Aeronautical Computer Technique,  2001,  31(4): 50-52.(in Chinese)

[18] 周思羽,  吳文海,  李翔,  等. 空战机动决策集模型分析[J]. 飞机设计,  2012,  32(3): 42-45.

Zhou Siyu,  Wu Wenhai,  Li Xiang,  et al. Analysis of Air Combat Maneuver Decision Set Model[J]. Aircraft Design,  2012,  32(3): 42-45.(in Chinese)

[19] 李俊生,  梁伟,  刘雪梅,  等. 基于离差最大化的导弹中段目标威胁度评估[J]. 系统工程理论与实践,  2007,  27(5): 164-167.

Li Junsheng,  Liang Wei,  Liu Xuemei,  et al. The Multi-Attribute Evaluation of Menace of Targets in Midcourse of Ballistic Missile Based on Maximal Windage Method[J]. Systems Engineering-Theory & Practice,  2007,  27(5): 164-167.(in Chinese)

[20] Qiao Y C,  Zhang B,  Zhang W Z,  et al. DGA Domain Name Classification Method Based on Long Short-Term Memory with Attention Mechanism[J]. Applied Sciences,  2019,  9(20): 4205.

[21] Chen J X,  Jiang D M,  Zhang Y N. A Hierarchical Bidirectional GRU Model with Attention for EEG-Based Emotion Classification[J]. IEEE Access,  2019,  7: 118530-118540.

[22] 朱铭康,  卢先领. 基于Bi-LSTM-Attention模型的人体行为识别算法[J]. 激光与光电子学进展,  2019,  56(15): 153-161.

Zhu Mingkang,  Lu Xianling. Human Action Recognition Algorithm Based on Bi-LSTM-Attention Model[J]. Laser & Optoelectronics Progress,  2019,  56(15): 153-161.(in Chinese)

BiLSTM-Attention: An Air Target Tactical

Intention Recognition Model

Teng Fei, Liu Shu, Song Yafei*

(Air and Missile Defense College,  Air Force Engineering University,  Xian 710051,  China)

Abstract:  In the traditional air target tactical intention recognition process,  reasoning analysis is only based on a single moment,  but in the actual battlefield,  the target tactical intention is realized by a series of actions,  so the target state presents the characteristics of dynamic and temporal changes. In order to solve this problem,  the bi-directional(Bidirectional) propagation mechanism and attention(Attention) mechanism are introduced on the basis of long-term and short-term memory network (LSTM),  and a target tactical intention recognition model based on BiLSTM-Attention is proposed. The hierarchical method is used to construct the feature set of air combat intention and encode it into time series feature. The decision makers experience is encapsulated into a label. The deep information in the feature vector of air combat intention is learned by BiLSTM neural network,  and the network weight is adaptively assigned by attention mechanism. Finally,  the air combat feature information with different weights is put into Softmax function layer for intention recognition. Through the comparison with the traditional air tactical target intention recognition model and the analysis of  ablation experimental,  the proposed model effectively improves the recognition efficiency of air target tactical intention. It has important theoretical significance and reference value for auxiliary combat system.

Key words:  intention recognition; attention mechanism; bi-directional long-term and  short-term memory network; air target; temporal feature

猜你喜欢

注意力机制
基于注意力机制的行人轨迹预测生成模型
基于注意力机制和BGRU网络的文本情感分析方法研究
多特征融合的中文实体关系抽取研究
基于序列到序列模型的文本到信息框生成的研究
基于深度学习的手分割算法研究
从餐馆评论中提取方面术语
面向短文本的网络舆情话题
基于自注意力与动态路由的文本建模方法
基于深度学习的问题回答技术研究
基于LSTM?Attention神经网络的文本特征提取方法