基于机器学习的战场态势评估问题研究与展望

2022-08-19霍士伟田八林郭圣明师有为

指挥控制与仿真 2022年4期

霍士伟，田八林，郭圣明，师有为

(1. 国防大学研究生院,北京 100091; 2. 国防科技大学信息通信学院,湖北武汉 430030;3. 国防大学联合作战学院,北京 100091)

战场态势评估是作战指挥活动的核心环节,是有效实施作战指挥决策的前提和依据。随着大量的预警探测设备、传感器的广泛应用,获取的大量战场态势数据已经远远超出了指挥员的分析和处理能力。而信息化作战的快节奏又对态势评估的时效性和准确性提出了更高要求。因此,必须要通过智能化的手段来辅助指挥员完成态势评估。智能化战场态势评估是实现智能化作战指挥的基础和关键。智能态势评估既可以有效提高指挥员评估态势的速度,又可以弥补指挥员主观判断的局限,增强态势评估的准确性。

本文对战场态势评估的概念和基于机器学习的战场态势评估研究现状进行了概述,分析了现有基于机器学习的战场态势评估存在的问题,并对其解决思路和研究方法进行了展望。

1 战场态势评估概念

战场态势评估的概念来源于信息融合领域。19世纪80年代中期,美国国防部联合领导实验室理事(Joint Directors of Laboratories,JDL)制定了一个通用的信息融合处理模型——JDL 模型。在该模型中,态势评估是信息融合系统结构中的第二级处理,它是建立在目标状态与属性估计以及态势估计基础上的高层信息融合技术。态势评估是指在低层传感器完成对目标的识别、跟踪等一级信息处理基础上,建立的关于作战事件、兵力、时间、地点要素等组织形式的一张多重视图。态势评估通过将所观测到的兵力分布、活动与战场环境、敌方意图等联系起来,识别已发生的事件和计划,得到对敌方兵力、部署、行动方向和路线的估计结果,推断出敌方意图,做出对当前战场情景的解释,并对将来时刻态势变化做出预测。随着研究的开展,美国学者Endsley进一步将战场态势评估分为三个阶段:态势觉察、态势理解和态势预测。

在具体研究过程中,战场态势评估包括很多不同的具体研究内容,与特定的作战场景密切相关。态势觉察阶段包括作战实体识别、作战事件识别;态势理解阶段包括作战意图识别、目标威胁评估、态势优劣判断、作战重心分析等;态势预测阶段包括作战效果评估、进攻方向预测等。

2 基于机器学习的战场态势评估研究现状

2.1 基于机器学习的战场态势评估主要方法

随着机器学习的快速发展和在军事领域的广泛应用,以及战场数据获取能力的提高,基于机器学习的数据驱动的战场态势评估成为目前研究的热点。基于机器学习的战场态势评估是将战场态势评估问题作为分类或者回归问题进行建模。下面将现有基于机器学习的战场态势评估方法进行分类总结,如图1所示。

图1 基于机器学习的战场态势评估方法分类

1)基于常规机器学习方法的战场态势评估方法

常规的机器学习方法主要包括神经网络、支持向量机、贝叶斯、决策树等方法。基于常规机器学习方法的战场态势评估是直接将上述机器学习模型应用于意图识别、威胁评估等典型战场态势评估场景下,一般过程为收集带标记样本数据、训练模型、利用模型进行分类或回归预测。在这些常规机器学习方法用于战场态势评估时,一个关键问题是模型参数的选择和初始化。如神经网络初始的权值和阈值选取如果不恰当,网络可能难以收敛,容易陷入局部极值。针对该问题,常规的机器学习方法在应用于战场态势评估时,通常会和遗传算法(Genetic Algorithms, GA)、粒子群算法(Particle Swarm Optimization, PSO)等优化算法一起运用,优化算法的作用就是确定最优的模型参数。

2)基于集成学习的战场态势评估方法

基于常规机器学习方法的战场态势评估只建立一个机器学习模型,而基于集成学习的战场态势评估是将多个机器学习模型进行集成,以实现优势互补的目的,实现模型精度和泛化性能的提高。根据个体模型的不同,基于集成学习的战场态势评估方法包括同质集成和异质集成两种类型。根据基础学习模型生成方式的不同,基于集成学习的战场态势评估方法又可分为并行集成方法和串行集成方法。并行集成的典型方法是Bagging集成方法,串行集成的典型方法是Boosting方法。

3)基于深度学习的战场态势评估方法

深度学习是具有多隐层的神经网络模型,相对于浅层结构神经网络模型,具有更好的非线性处理能力,对于高维的战役层面的战场态势评估具有优势。同时,深度学习具有良好的特征提取能力,能够学习隐藏在战场数据中的本质特征,克服了常规浅层结构神经网络特征提取能力不足的问题。深度学习具有多种不同网络结构。研究者基于深度堆栈自编码网络、深度循环神经网络、深度卷积神经网络等网络形式构建了不同场景下的战场态势评估模型,实现了战场态势评估准确率的进一步提升。

2.2 基于机器学习的战场态势评估目前存在的问题

由上述分析可以看出,当前基于机器学习的战场态势评估主要集中于常规机器学习算法在具体的战场态势评估场景下的应用研究和集成运用。由于战场环境和作战领域的特殊性,在利用机器学习方法进行战场态势评估时还存在一些问题亟须解决。主要包括以下问题:

1)样本数量稀疏

样本数量稀疏,指由于样本数量较少，无法满足机器学习模型训练的需要,使模型无法达到良好的精度和泛化性能。由于实际作战和作战演习的场次有限,使得获取战争态势数据很困难。同时由于战争的不确定性、对手的隐蔽性和欺骗性以及战场环境保密性，进一步加大了获取准确的高质量的战场态势数据的难度。常规的机器学习方法需要大量高质量样本数据来进行模型训练，才能够取得良好的评估效果,当样本数据较少时，会导致模型训练不够充分,评估精度降低。

2)标记样本不足

标记样本不足是指可以获得大量的样本数据,但是带标签的样本数量相对较少,从而无法有效支持有监督的机器学习模型训练。在战场态势评估环境下,要获得充足的满足模型训练要求的带标签样本数据是比较困难的。相对而言,我们能够获得较多的无标记样本数据,但是为这些数据添加标签需要花费大量的人力和时间。在标记样本不足情况下,直接利用常规机器学习方法在少量有标记样本上进行训练,会造成评估准确性不高。

3)误分代价不平衡

误分代价不平衡问题是指不同类别的分类错误会造成不同的误分类代价。战场态势评估具有明显的误分代价不平衡特点,将劣势态势误分为优势态势的代价要远远高于将优势态势误分为劣势态势的代价。但是,常规的机器学习方法以提高模型总体准确率为目标,假定不同类别的误分代价是相同的。当常规的机器学习方法应用于具有误分代价不平衡的战场态势评估问题中,很容易造成误分代价高的样本错分,而对作战进程造成严重影响。

3 基于机器学习的战场态势评估研究展望

为更好地实现基于机器学习的智能战场态势评估,针对上述分析的现有基于机器进行战场态势评估中存在的样本数量稀疏，标记样本不足和误分代价不平衡问题,结合样本生成技术、迁移学习、半监督学习、集成学习等机器学习前沿技术,提出解决上述问题的研究思路,如图2所示。

图2 基于机器学习的战场态势评估技术框架

3.1 基于小样本学习的战场态势评估

样本数量稀疏问题在机器学习解决实际问题时经常存在,因此，小样本学习成为机器学习领域中的一个重要研究问题。小样本学习主要有两类方法:样本生成方法和迁移学习方法。

样本生成方法是在现有少量样本的基础上,生成大量的新的样本用于模型训练。在战场态势评估样本数量稀疏的情况下,可以采用样本生成方法增加样本数量。样本生成方法最常用的就是生成对抗式网络(GAN)。生成对抗式网络是一种特殊的深度学习模型,由一个生成器和判别器组成,生成器学习真实样本的内在分布规律,并生成新的样本;差别器判断输入是真实样本还是生成样本。生成对抗式网络可用于图像形式战场态势样本数据,但是对于离散形式的战场态势样本数据生成效果不佳。对于离散形式的战场态势样本生成,可以采用加入噪声的方式来增加样本的多样性。

迁移学习是将在解决一个问题时获得的知识应用到解决另一个不同但相关的问题当中,本质是知识的迁移再利用。它类似于人类学习能力中的类比学习,使机器在解决问题时,不需要从头开始,可以像人类那样利用其他相关领域知识的启发,更好更快地对新知识进行学习。迁移学习中要解决的新问题称为目标域,已有的相关领域问题称为源域。在战场态势评估过程中,当前评估场景(目标域)的样本较少时,而相似评估场景(源域)存在大量的样本数据,这时可以采用迁移学习的方法。基于迁移学习的战场态势评估首先利用源域的大样本数据对模型进行训练,然后利用目标域小样本数据对模型进行微调。由于两个评估场景具有相似性,在源域训练好的模型在目标域有一定的适用性。

3.2 基于半监督学习的战场态势评估

针对标记样本不足问题,研究者提出了半监督学习的方法。半监督学习是一种介于监督学习和无监督学习之间的机器学习方法,能够同时利用标记样本和无标记样本训练模型,通过从无标记样本中挖掘样本结构信息辅助分类或回归模型学习。半监督学习一方面可以解决监督学习因标记样本不足导致的泛化能力弱的问题,另一方面缓解了无监督学习完全忽视标记信息而导致学习性能较低的问题。半监督学习根据实现方法的不同,可分为自训练方法、协同训练方法、生成式模型和基于图的方法等。其中，自训练方法和协同训练方法可以和各种常规分类或回归模型进行组合应用,同时不需要对常规模型内部进行改进,是两种简单且适应性强的半监督学习方法。自训练半监督学习方法首先利用现有的少量标记样本进行监督式学习,然后将学习得到的分类或回归模型对无标记样本进行分类或回归预测,也就是为无标记样本添加伪标记,然后根据一定的伪标记选择策略选择伪标记准确率较高的数据加入训练集重新训练模型。迭代上述过程,直到算法达到预定条件。协同训练算法要求样本数据具有两个充分冗余且满足条件独立性的视图。视图是指从某个侧面或视角观察事物得到的属性特征,比如对于音频信息可以用时域和频域两个不同的特征来表示,这就是两个视图。这些视图需要能够独立地从不同角度全面地反映整个数据集的特性。协同训练算法的过程:首先分别在每个视图上使用有标记样本训练两个模型,然后运用所建立的模型给无标记样本打上伪标签并给出相应的置信水平,然后将置信水平高的伪标记样本加入另一个模型的训练集中,使对方利用合并后的新的数据集重新训练模型。这个互相学习、共同进步的过程不断迭代,直到达到两个模型无法进一步优化为止。

利用自训练方法和协同训练方法两种半监督学习方法都可以有效解决战场态势评估中的标记样本不足问题。基本思路是利用支持向量机、BP神经网络等常规机器学习方法构建基础评估模型,然后通过自训练方法或协同训练方法，利用无标签样本对基础评估模型进行辅助训练,从而提高模型的精度和泛化性能。需要注意的是,协同训练在多视图数据上效果很好。因此,对于态势图形式的战场态势数据,可以采用不同的图像特征提取方法来构造多视图特征,利用协同训练方法可以获得更好的效果。但是,对于离散数据形式的战场态势数据,由于无法构建多视图特征,使得协同训练方法效果较差,这时宜采用自训练方法。自训练方法是一种更通用的方法,在各种数据类型的战场态势评估场景下,都可以应用。

3.3 基于代价敏感学习的战场态势评估

针对代价误分不平衡问题,研究者提出了代价敏感机器学习方法。代价敏感学习考虑不同类别样本的误分代价,重点关注错分代价较高类别的样本,以分类错误总代价最小为目标。代价敏感学习方法主要包括代价敏感直接学习和代价敏感集成学习两类。代价敏感直接学习是对常规机器学习算法内部进行改进,如对算法损失函数进行改进,引入误分代价敏感因子,使常规算法具有代价敏感特性，像支持向量机、BP神经网络等都有代价敏感的改进模型。代价敏感集成学习通过利用集成学习的方法对常规分类模型进行组合,在集成学习算法的样本权重更新过程中引入误分类代价,使常规分类模型具有代价敏感特性。代价敏感集成学习方法不需要对常规分类模型内部进行改进,是一种简单且适应性强的代价敏感机器学习方法。

利用上述两种代价敏感机器学习方法都可以有效解决战场态势评估中的误分代价不平衡问题。利用代价敏感直接学习方法进行战场态势评估的关键是根据战场态势评估误分类代价来构建新的损失函数。利用代价敏感集成学习方法进行战场态势评估,就是以BP神经网络、支持向量机等常规机器学习方法构建战场态势基础评估模型,通过代价敏感集成学习方法，引入误分代价矩阵，对基础评估模型进行集成训练,使模型具有代价敏感特性，其关键是集成训练过程中样本权重更新策略的设计。

4 结束语

本文对战场态势评估的概念和基于机器学习的战场态势评估研究现状进行了概述,分析了现有基于机器学习的战场态势评估存在的问题,并对其解决思路和研究方法进行了展望。通过文中的综述和分析可以看出,传统机器学习方法在完善数据条件下的战场态势评估场景下具有良好的效果。但面对样本稀疏，标记样本不足，误分代价不平衡等这些数据不完善的情况时,直接应用传统机器学习方法无法取得较好效果,甚至会对作战进程造成严重影响。这时需要将传统机器学习方法和迁移学习、半监督学习、代价敏感学习等新型机器学习方法结合起来应用。下一步将针对具体态势评估场景,建立具体的战场态势评估模型,并进行实验验证。