APP下载

面向潜艇作战实验的认知驱动战能环融合控制方法

2020-10-20张东俊王维平黄美根李小波

指挥控制与仿真 2020年5期
关键词:指挥员声呐态势

张东俊,王维平,黎 潇,黄美根,张 磊,李小波

(1. 中国人民解放军92337部队,辽宁 大连 116023;2. 国防科技大学系统工程学院,湖南 长沙 410072)

潜艇作战实验旨在摸清潜艇性能底数,确保实战适用性[1]。因此,必须按照实战化要求,立足强敌对手和复杂环境去考核被试潜艇装备遂行使命任务的能力。其中,被试潜艇与陪试装备的对抗活动即为交战进程,而控制交战进程的核心在于塑造有利态势,从而不断增强己方战场优势,最终完成使命任务。

目前国内外针对交战进程控制的研究大致可划分为态势获取生成和态势认知决策。态势获取生成是态势塑造的基础,态势认知决策是态势塑造的关键。态势获取生成能力主要受潜艇作战系统的制约,提升作战系统装备性能和改进作战系统体系结构成为可行之法[2]。针对装备性能提升,俄罗斯“阿穆尔”级常规潜艇[3]装备了高精度声呐与导航传感器,美国“弗吉尼亚”级核潜艇[4]则配置侧置的鱼雷发射管,为艇艏球形阵声呐提供了完整空间。而针对作战系统体系结构,“弗吉尼亚”级核潜艇作战系统注重协作能力建设,法国“鲉鱼”级常规潜艇作战系统则注重对态势信息的多层次多维度综合处理,有效提升了态势生成能力[5]。

态势认知决策能力与指挥水平、作战经验等人因认知因素密切相关。美空军博伊德上校针对战斗机近战提出的“观察—判断—决策—行动”OODA环是作战认知理论的先驱[6]。随后,国防大学胡晓峰团队提出并深度阐述了态势智能认知概念[7],杨尚飞等人则提出了面向体系作战的认知提升指挥概念模型[8],侧重于利用先进技术提升指挥员认知水平。此外,吴金平等人基于BDI模型和联合意图理论对潜艇作战实体认知行为进行了建模分析[9]。而在辅助指挥员决策方面,陆铭华等人利用模糊神经网络建立潜艇指挥决策控制模型[10],黄峰峰等人则通过模拟指挥员战场决策思维过程,构建了基于直觉模糊Petri网的水面舰艇编队对潜攻击意图推理模型[11],对潜艇指挥员决策具有积极作用。

然而,上述研究成果仍然没有从根本上解决战场有利态势塑造这个核心问题,原因在于没有形成统一的态势塑造认知控制量,且缺乏有效的控制方法,极大制约了潜艇指挥员的交战进程控制能力。因此,本文面向潜艇作战实验,在运用战能理论[12]的基础上,采用战能环表征交战进程,提出战能环势概念作为态势塑造认知控制量,并建立认知驱动的战能环融合控制方法,为潜艇指挥员控制交战进程提供有力支撑。

1 认知驱动战能环融合控制方法设计

本节首先定义战能、综合战能、战能环及战能环势等基本概念,然后,从认知驱动角度给出战能环融合控制框架设计,并详细阐述融合控制的基本原理。

1.1 基本概念

1)战能与综合战能

潜艇作战能力,即战能,是作战实验考核的重要指标。指挥员的认知决策行为是作用于潜艇,使其产生动态变化,进而直接影响战能的行为。因此,战能随潜艇行为动态变化,具有随动时变特性。

潜艇作战具有特殊性,多采用单艇运用模式,对潜艇自身能力的需求较为全面。依据潜艇遂行使命任务要求从能力视图角度将战能划分为探测能、隐蔽能、打击能、防御能和保障能等战能分量[12],不同分量描述了潜艇不同的作战能力。在实际交战中,己方潜艇指挥员的指控行为会同时影响多个战能分量,即各战能分量之间具有一定关联关系,同时,敌我双方不同战能分量之间会存在对抗关系,如我方打击能与敌方防御能。信息作为现代战争的重要元素,在保障能中占据重要作用。为便于对潜艇整体作战能力进行表征与度量,给出综合战能M的五元组定义如式(1)所示。

M=〈m1,m2,m3,m4,m5〉

(1)

其中,m1、m2、m3、m4、m5分别代表探测能、隐蔽能、打击能、防御能和保障能。

2)战能环

受潜艇使命任务约束,潜艇作战通常可划分为搜索、信息联通、攻击、防御等基本阶段。因此,围绕交战进程,在战能的基础上,战能环可表征为战能积蓄—感知—传递—转化的动态过程。结合态势塑造,战能感知对应态势获取,战能传递旨在完成态势生成,战能积蓄与战能认知决策密切相关,最终,指挥员的决策行为作用于潜艇即完成战能转化过程。

战能环随时间演进,在任一确定时刻,其作战能力的表现即为综合战能,战能环形式化表征如式(2)所示,即战能环P是综合战能M与时间t的连续函数。

P=f(M,t)

(2)

其中,f(·)为战能环表征函数。

3)战能环势

从态势塑造的角度而言,战能环是交战进程各阶段的“态”表征,而塑造态势更需要把握当前交战进程的发展趋势,这也是战能环控制的基本对象。基于此,提出战能环势概念:任一时刻战能环P对作战任务F的满足度,为战能环综合势能的简称,记为q。

(3)

其中,P0、PT与PF分别表示任务初始时刻、当前时刻与完成时刻的战能环,dl用于求解任意两时刻战能环之间的逻辑距离。

因此,战能环势与当前战能环及其与任务所需战能环之间的逻辑距离密切相关,同时,也受初始时刻选取的制约。需要说明的是,若出现q<0,则表明战能环势背离了作战任务需求发展,此时,需要重置当前时刻为新的初始时刻。

1.2 认知驱动战能环融合控制框架

交战进程控制即战能环控制必须充分考虑指挥员认知驱动的因素。具体而言,指挥员认知体现在对作战使命任务、潜艇当前态势和潜艇作战系统的理解上,并最终通过指挥员决策行为在交战进程中呈现。因此,认知驱动战能环控制可以表述为指挥员在作战使命任务的指导下,基于对当前战能环的认知理解,决策形成作战口令,并通过综合运用潜艇作战系统控制战能环势的过程。

为支持认知驱动战能环控制,首先给出规划控制、预测控制和反馈控制的基本含义。规划控制是一种对控制对象的发展演进路径进行前馈规划的开环控制方式;预测控制是指预测有限时域内,控制对象发展趋势,并提前作用于控制对象的过程控制方式;反馈控制是通过捕获控制律后的误差,并用于修正后续控制作用的过程控制方式。基于此,给出集规划控制、预测控制和反馈控制于一体的认知驱动战能环融合控制框架如图1所示,主要包括战能环及其各阶段间的控制方式。

图1 认知驱动战能环融合控制框架

战能环中战能积蓄是战能感知、传递和转化之间交互的控制环节,旨在支持包括态势生成、态势感知、行动构想、定下决心、任务规划、行动控制等传统指挥控制过程中的指挥员认知决策行为。战能积蓄对战能感知采取预测控制方式,通过预测潜艇探测能力的发展趋势,进而生成预测控制律作用于声呐及潜艇运动等行为,优化态势获取能力。战能积蓄与战能传递对应规划控制方式,基于作战任务,提前规划战场目标态势,作用于战场传递的态势生成能力,指导战能环势发展。战能积蓄与战能转化之间存在反馈控制方式,战能转化后塑造的战能态势与期望的战场态势之间的环势差反馈于战能积蓄,并用于修正后续控制律,从而不断形成期望战场态势。因此,针对战能环演进,有必要设计战能环控制准则与判据,分别负责战能环开闭状态与各阶段之间转进状态的控制。总体而言,战能环融合控制旨在通过利用规划控制、预测控制和反馈控制,实现对战能环势的按需控制。

1.3 融合控制基本原理

融合控制基本原理如图2所示,主要包括规划控制、预测控制和反馈控制,其中,变量含义如表1所示。

图2 融合控制基本原理

表1 变量定义

融合控制对象为战能环势,控制律为潜艇操纵行为,控制目标为满足作战任务需要的战场态势。因此,k时刻,规划控制以作战任务F、潜艇状态r(k)以及敌方状态s(k)为输入,在潜艇作战系统性能及水声环境的约束下,通过构建规划模型进行启发式求解,生成参考轨迹R。预测控制以R为基本遵循,采用滚动优化原则,利用在线优化算法生成有限时域内局部最优的一组控制律u(k),并将其输入预测模型以给出未来的一组预测输出y(k+j|k),而y(k+j|k)与R在k+j时刻的差值称为跟随误差e′(k+j)。同时,潜艇可能受到的近似稳态扰动d′(k)通过前馈补偿方式进行考虑。由于预测输出y(k|k)与实际输出y(k)之间可能存在预测误差e(k),需要引入反馈控制以修正后续预测输出为y′(k+j|k),从而增强预测控制的抗扰性和稳定性。

2 基于贪婪策略的规划模型设计

规划模型与指挥员认知密切相关,主要包括权重矩阵设计、约束方程设计和参考轨迹生成三个模块,权重矩阵是参考轨迹生成算法中贪婪策略执行的具体依据,约束方程负责保证给定参考轨迹能够在潜艇作战系统与资源限制下实现。

2.1 权重矩阵设计

规划模型旨在生成参考轨迹R,其是综合战能M中各战能分量的期望演化路径,如式(4)所示。

R=〈g1(t),g2(t),g3(t),g4(t),g5(t)〉

(4)

其中,g(·)为轨迹生成函数。

指挥员受领作战任务F后,依据对当前态势的认知理解,将作战进程划分为若干典型阶段,如搜索、攻击等,总阶段数记为L。然后,分析每个阶段对不同战能分量的需求度,进而给出各战能分量的权重分配,共同构成任务权重矩阵U,如式(5)所示。

U=[ui,l]5×L,i∈{1,2,…,5},l∈{1,2,…,L}

(5)

2.2 约束方程设计

在任意时刻t0下,假设任务时间为t,则所需调整的战能环势差Δqi如式(6)所示,战能环势差是指时刻t0与t0+t的战能环势增量。

(6)

求解出所有Δqi后,从行为与资源两个维度给出约束方程组如式(7)所示。

(7)

其中,w(·)为资源需求函数,Wres为当前可用资源集,h(·)为行为需求函数,Hres为当前可执行行为集。

因此,上述判定方程组中第一个方程表示调整R所需资源应当不大于当前可用资源,如声呐、鱼雷等;第二个方程表示调整R所需行为应当包含于当前可执行行为集,如潜艇加速、发射水声对抗器材等;第三个方程表示任意时刻所需行为均应受限于潜艇最大可执行行为,如潜艇航行速度等。

2.3 参考轨迹生成

参考轨迹生成本质是一个多目标最优控制问题,考虑实现难度与求解时间的因素,本文采用贪婪策略寻求参考轨迹的可行解,其通常为次优解。

在权重矩阵U中选择作战阶段l对应的权重向量(u1,l,u2,l,u3,l,u4,l,u5,l)T,依次从中选择最大值对应的战能分量,依据约束方程生成该战能分量的参考轨迹,然后更新可用行为集与资源集,直到完整生成R。

本文采用贪婪策略的参考轨迹生成算法1。其中,算法由两层嵌套循环组成,内层循环(Step4~Step9)用于生成作战阶段l的参考轨迹,外层循环(Step1~Step10)则可生成整个作战任务所需的参考轨迹。

算法1:参考轨迹生成算法 输入:权重矩阵U,gi(t0),gi(t0+t), Wres,Hres输出:参考轨迹R 1. for (j=1; j

3 融入反馈校正的预测控制设计

由图2可知,预测控制与反馈控制共同构成过程控制。因此,战能环过程控制主要包括参考轨迹、预测模型、滚动优化及反馈校正等模块。其中,参考轨迹由规划控制负责生成。

3.1 预测模型构建

预测模型的主要作用是基于历史信息和有限时域内的未来输入对系统未来响应进行预测。考虑在线求解的实时性,预测模型通常较为简单,且可以将约束条件规约至未来输入中,并在未来预测输出中体现。针对交战进程控制的战能环预测模型Pre一般形式如式(8)所示。

(8)

基于此,借鉴网络模体思想[13],即通过节点间微观基本关系研究网络宏观状态,建立基于行为—战能映射关系的预测模型,如图3所示。

图3 基于行为—战能映射关系的预测模型

首先,需要分析给出潜艇通用行为的元动作集合A={ai},并基于潜艇性能实验测量各元动作对应各战能分量的变化情况,建立潜艇元动作战能响应模型O。然后,将未来潜艇行为分解为若干元动作的线性组合,分别得到各战能分量的响应结果,最后,汇总给出未来战能响应输出,即实现预测功能。

3.2 滚动优化设计

滚动优化是预测控制的关键优势,其采取在线优化算法,以参考轨迹与预测输出的跟随误差以及前馈扰动补偿为输入,输出控制时域内的一组控制律,即潜艇行为,如加速、关闭主动声呐等。控制时域通常短于预测时域。

在预测模型的基础上,在线优化算法的核心在于依据潜艇行为—战能映射关系,搜寻补偿当前跟随误差e′(k+j)的潜艇元动作组合,并综合给出潜艇最佳的实际操作行为。本质上,在线优化算法是对预测模型的逆向运用。在线优化算法如算法2所示,其中,Δe为便于机器运算的容许误差。

算法2:在线优化算法 输入:战能响应模型O,跟随误差e'(k+j),外部扰动d'(k+j)输出:控制律u(k+j) 1. j=1;2. while (e'(k+j)>Δe) {3. decompose e'(k+j);4. offset d'(k);5. mapping ai by O;6. generate u(k+j) by the combination of ai;7. j++;8. }

由算法2可知,滚动优化寻求的是预测时域内的局部最优解。需要说明的是,算法遵循的控制思路为逐步使实际轨迹跟随参考轨迹。同时,尽管滚动优化给出一组控制律,但实际在受控过程中执行的只有k时刻的控制作用u(k),即随着预测时域与控制时域的往前推进,实现滚动优化效果。

3.3 反馈校正设计

由于潜艇水下环境的复杂多变性,预测模型不可避免地面临模型失配以及环境干扰等影响,存在一定的不确定性。因此,反馈校正在预测控制中具有不可替代的作用,也是目前过程控制的必备环节。

源于潜艇受控过程中存在扰动,一般情况下潜艇实际输出y(k)与预测输出y(k|k)存在一定偏差,通常称为预测误差e(k)。因此,为优化后续控制作用,需要利用预测误差对后续预测输出y(k+j|k)进行校正,从而获得反馈校正后的预测输出y′(k+j|k)。其反馈校正模型如式(9)所示。

(9)

其中,β(k)为校正系数,是关于k的线性递增函数,参数α与γ分别表示校正基数与校正斜率,且α≥0、γ≥0,具体取值与控制时域长度相关,旨在尽可能减小后续预测误差。

4 实例分析

4.1 想定设置

红方潜艇受领任务为指定海域D内搜索反潜,任务时长为T。A、B分别为红方与蓝方潜艇,假设B在D内等概率出现。A、B均采用噪声搜潜方式进行探测,采用鱼雷进行对敌攻击,并配备水声对抗器材防御。此外,红方潜艇A配备了支持主动声源的无人水下潜航器(UUV)。B的主被动声呐性能为A的1.2~1.8倍,鱼雷自导精度为A的1.2~1.5倍。

4.2 融合控制分析

首先,红方指挥员依据作战任务将作战进程划分为主动搜潜、鱼雷攻击、防御撤离三个阶段,即L=3。在主动搜潜阶段,A可用搜潜资源集合Wres为{主动声呐、被动声呐、UUV},可用搜潜行为集Hres为{打开主动声呐、打开被动声呐、释放UUV};在鱼雷攻击阶段,A可用攻击资源集合Wres为{线导鱼雷、自导鱼雷},可用攻击行为集Hres为{发射线导鱼雷、发射自导鱼雷};在防御撤离阶段,A可用防御资源集合Wres为{水声对抗器材、潜艇动力系统},可用防御行为集Hres为{发射水声对抗器材、潜艇加速转向机动、潜艇上浮下潜机动}。

1)参考轨迹生成

在此约束下,红方指挥员依据对敌我态势的认知,形成作战规划:潜艇A必须先探测感知到敌方,并快速完成目标锁定后发射鱼雷攻击,随后主动机动隐蔽撤离战场,防止遭遇敌水面兵力反击。据此,给出任务权重矩阵U如式(10)所示。此外,红方指挥员需要确定过程控制中反馈校正系数β(k),给定参数取值α=0.8、γ=0.12。

(10)

在此基础上,给出红方指挥员生成的参考轨迹R如图4所示。

图4 参考轨迹R

2)实际轨迹控制

融合控制的目标是使潜艇实际轨迹尽可能跟随参考轨迹发展。首先,需要确定各战能分量与参考轨迹的差值,然后,在基于行为—战能映射关系的预测模型基础上,由在线优化算法求解任意时刻的控制律,并由潜艇指战员实施后观测战能变化,从而滚动推进形成战能实际轨迹,如图5所示。其中,战能环控制准则与判据采用文献[12]中极大不对称准则与控制判据方法。

图5 实际轨迹

限于篇幅,本文仅以探测能为例给出实际轨迹生成过程。首先,与探测能相关的潜艇行为包括声呐操作、UUV操作以及潜艇运动操作。随后,分析给出各行为的元动作集合。声呐操作元动作集合为{声呐打开、扫描频段设定、声呐关闭};UUV操作元动作集合为{UUV发射、扫描频段设定、UUV回收};潜艇运动操作元动作集合为{速度设定、偏航角设定、俯仰角设定、横滚角设定}。其中,扫描频段设定用于对目标可能频段进行高精度扫描,速度单位为节,偏航角、俯仰角与横滚角设定以潜艇六自由度运动模型为基准,单位为度。然后,通过逆向利用预测模型给出支持探测能差值的潜艇行为,即进入区域D后随即打开主被动声呐并发射UUV,然后采取Z字型搜索策略,并在潜艇监听到疑似噪声后,执行扫描频段设定,进一步确定敌潜艇位置。在战能环进入鱼雷攻击的转化阶段后,执行声呐关闭与UUV回收,以提升隐蔽能利于撤离战场。

对比图4和图5可知,实际轨迹较好地跟随了参考轨迹的演进,即参考轨迹可以有效引导战能环过程控制。但是,参考轨迹规划仍具有一定的理想成分,这与指挥员经验与风格密切相关。综上,所提融合控制方法在指挥员对态势认知的基础上,实现了对战能环的按需控制,能够有效支撑潜艇指挥员控制交战进程。

5 结束语

本文采用战能理论深入研究了交战进程控制问题,给出战能环势概念,并将其作为态势塑造认知控制量,提出了集规划控制、预测控制和反馈控制于一体的认知驱动战能环融合控制方法。该方法首先给出了融合控制框架与基本原理,然后,采用贪婪策略给出了参考轨迹生成算法,并提出了基于行为—战能映射关系的预测模型与在线优化算法,同时融入反馈校正设计,有效消减了战能环过程控制的不确定性。最后设计了某海域搜索反潜实例,综合给出了参考轨迹与实际轨迹的生成过程与对比分析结果,表明融合控制方法可以有效辅助潜艇指挥员控制交战进程。

猜你喜欢

指挥员声呐态势
空投声呐浮标空中运动轨迹研究
历史虚无主义的新近演化态势与特征
一种基于方位估计的双站被动声呐航迹关联方法
2019年12月与11月相比汽车产销延续了增长态势
汇市延续小幅震荡态势
火场秩序混乱的原因分析及对策
意大利莱昂纳多公司推出世界上最小的主被动水下声呐系统
泰利斯公司研制紧凑型CAPTAS 4声呐
贵州: 干好“指挥员” 做优“作战员”
指挥员