APP下载

一种自主∕遥控水下机器人共享控制方法

2021-08-26王兴华

机械设计与制造 2021年8期
关键词:遥控障碍物安全性

王兴华,田 宇

(1.中国科学院沈阳自动化研究所机器人学国家重点实验室,辽宁 沈阳 110016;2.中国科学院机器人与智能制造创新研究院,辽宁 沈阳 110016;3.中国科学院大学,北京100049)

1 引言

自主∕遥控水下机器人(Autonomous and Remotely operated underwater Vehicle,ARV)是一种综合自主水下机器人和遥控水下机器人特点的新型水下机器人,可以在自主、半自主、遥控等模式下执行搜索、观察及作业任务,其研发和在海洋观测、探测中的应用成为近年来国际上水下机器人发展的热点[1-2]。目前,由于ARV自主控制技术水平的限制,ARV执行诸多环境探索特别是作业等任务仍需操作人员的监控或遥控[3]。因此,实现高效融合操作人员遥控和ARV自主控制的共享控制[4],以充分发挥ARV所具有的人机协同控制特色优势进而提高ARV的任务性能,成为近年来ARV高效应用需要研究和解决的重要问题。

共享控制指人和自主控制系统之间相互协调,协同对机器人进行控制的控制策略[5]。共享控制的关键是人和自主控制系统控制权重的分配,其主要分为仲裁法和融合法两种。仲裁法通过在任务执行过程中根据任务需求选择遥控或自主控制来实施对机器人的共享控制。仲裁法在控制信号切换时往往存在控制命令和机器人状态的不连续和不稳定问题[6],因此为避免仲裁法存在的问题,研究人员更多的应用融合法研究和实施共享控制,即根据任务和控制要求设计有效的算法实时融合操作人员和自主控制系统的控制命令以对机器人进行共享控制。基于融合法的共享控制在智能轮椅[7-8]、移动机器人[9-10]等领域已经开展了许多研究,结果表明可以在有效避免仲裁法存在的问题同时取得良好的共享控制效果(提升机器人的任务性能和减轻操作人员的工作负担)。

在水下机器人领域,针对水下机器人共享控制的研究相对较少,且多采用仲裁法研究和设计共享控制方法[3-4,11]。因此,面向ARV环境探索任务过程中的共享控制需求,针对仲裁法存在的问题,采用融合法研究和设计了一种基于多目标优化的共享控制方法,并对其性能进行计算机仿真验证和评估。

2 任务与控制结构

未知环境探索是ARV所需执行的重要任务之一。通常情况下,该任务中全局环境信息未知,无法预先设定ARV的运动目标和运动路径,需要依靠ARV携带的声学、光学等传感器获取的实时局部环境信息进行决策和规划。由于ARV自主能力的限制,在复杂未知环境的探索任务中,ARV按照任务需求探索环境和搜索操作人员感兴趣的目标时仍需操作人员实时遥控。因此,针对ARV在全局环境信息未知的二维水平面运动执行环境探索任务开展共享控制研究,实时融合ARV自主控制与操作人员通过操作杆遥控的控制命令,以发挥融合法共享控制的优势使ARV服从操作人员的控制意图、提高ARV的安全性、降低操作人员操作的复杂性并优化ARV的运动路径。

为便于实现ARV在环境探索任务中的共享控制,设计了模块化的控制结构,由传感系统模块、操作人员遥控模块、自主控制模块和共享控制模块组成,如图1所示。传感系统模块用于获取并输出与环境和ARV运动状态相关的信息,包括局部环境中障碍物的分布(n为障碍物的数量)、ARV当前的位置P ARV和艏向角ψARV;操作人员遥控模块的功能是由操作人员根据传感系统模块输出的P ARV、ψAR V和P obs通过遥控操作杆的x和y轴分别输出ARV艏向角控制命令ψh和前向速度的控制命令v h;自主控制模块根据传感系统模块输出的P obs和P ARV,使用人工势场法计算ARV艏向角的控制命令ψapf;共享控制模块根据其他模块输出的ψh、ψapf、ψAR V、P A RV和P obs,使用基于多目标优化的共享控制方法产生艏向角的控制命令ψsh are。该结构中,ARV的前向速度由操作人员直接控制,艏向角由共享控制模块控制。

图1 控制结构Fig.1 Control Architecture

3 基于多目标优化的共享控制方法

3.1 方法概述

在控制结构中,共享控制模块使用基于多目标优化的共享控制方法产生ψshar e控制ARV。基于多目标优化的共享控制方法由目标函数、约束条件和优化方法三部分组成,使用目标函数和约束条件将ARV艏向角的共享控制转化为以艏向角控制命令变量ψ作为决策变量的多目标优化问题,通过优化方法求解该问题得到ψ的最优解即ψshare。目标函数包括服从度函数ob edience(ψ)、自 主 度 函 数autonomy(ψ)和 稳 定 度 函 数stab ility(ψ),其作用是根据任务需求对ψ的不同取值进行评估;约束条件为ψ可行解取值区间的集合I safe=[I1,I2,…,I i](i为取值区间的个数),根据局部环境中障碍物的分布确定以保障ARV安全;优化方法用于求解多目标优化问题以得到ψshare,使用最小最大法作为优化方法。该方法中,ARV艏向角的共享控制表示为公式(1)所示的极大化的多目标优化问题。

3.2 目标函数

文献[7-8]根据反应式控制的思想,设计了效率函数评估操作人员的控制命令,并使用函数值计算操作人员控制命令的权重。借鉴文献[7-8]中效率函数的设计方法,目标函数设计为以自然常数作为底数的负指数函数形式,值域均在区间(0,1]内,便于对不同的目标函数进行比较。该形式的目标函数在对称轴处取得最大值1并向两侧递减,通过调整形状系数(形状系数非负)可以改变递减的速度,形状系数越大,递减的速度越快;特别的,当形状系数为零时,函数值恒为1。采用最小最大法求解时优化结果由函数值最小的函数确定[8],因此,目标函数的形状系数越大,对优化结果的影响越大;当形状系数为0时对优化结果无影响,便于调整目标函数在优化中的作用。

3.2.1 服从度函数

在环境探索任务中,ARV的运动需要服从操作人员的控制意图以满足观测需求,为简化计算,采用ψh表示操作人员的控制意图,因此设计了式(2)所示的服从度函数评估ψ与ψh的差别。

式中:exp()—以自然常数作为底数的指数函数;ψ=ψh—对称轴;

α—服从度函数的形状系数,其值由式(3)确定。

式中:αmax—大于0的常数;dmin—ARV到障碍物的最小距离;d shar e—障碍物影响ARV运动的距离阈值;d saf e—保障ARV与障碍物之间安全的距离阈值;d sha re和d sa fe根据ARV的运动半径确定。

式(3)根据dmin调整α的值从而改变操作人员影响ARV运动的程度。

3.2.2 自主度函数

ARV在任务中还应该服从自主控制的控制命令以辅助操作人员的操作并提高ARV的安全性,自主控制的控制命令使用ψapf以辅助操作人员避障,因此设计了式(4)所示的自主度函数评估ψ与ψapf的差别。

式中:γ—自主度函数的形状系数,其值由式(5)确定。

式中:γmax—大于0的常数。

式(5)根据dmin调整γ的值,使ψapf仅在dmin

3.2.3 稳定度函数

适当的减少控制命令相对于当前运动方向的突变可以使ARV的运动状态更稳定,从而降低操作人员操作的复杂性并使ARV的运动路径更加平顺,因此设计了式(6)所示的稳定度函数评估ψ相对于ψAR V的变化。

式中:β>0—稳定度函数的形状系数,β越大,稳定度函数对优化结果的影响越大,优化产生的ψsh a re相对于ψA RV的变化越小。过大的β会使ARV不易改变运动方向,因此将β设置为较小的正常数。

3.3 约束条件

约束条件I safe为保障ARV安全的ψ的取值区间的集合,根据ARV在不同运动方向上的安全性确定,在基于多目标优化的共享控制方法中,安全性由安全性评估函数表示。在环境探索任务中,ARV与障碍物的距离越大越安全,因此,安全性评估函数由ARV携带的声学、光学等传感器获取的周围障碍物分布的方向和距离信息确定。

安全性评估函数根据局部环境中障碍物分布的栅格地图计算,计算过程的示意图,如图2所示。其中,虚线交叉产生的小正方形为栅格,黑色栅格为障碍物栅格,白色栅格为自由栅格,Δ为栅格粒度;实线标出的大正方形为活动窗口,边长为wm,活动窗口内的栅格地图用于计算安全性评估函数;椭圆表示ARV,位于活动窗口的中心;以θ为夹角使用以ARV所在的位置为中心的一组射线将活动窗口划分为2π∕θ个区域,单个区域内ARV到障碍物栅格的最小距离为dm,当区域内不存在障碍物栅格时d=(w-Δ)∕2 m;I′1为符合安全性要求即安全性评估函数取值要求的ψ的一个取值区间,IΔ为安全间隔,I1为约束条件中ψ的一个取值区间。

安全性评估函数设计为分段函数,其自变量ψ的定义域为区间(-π,π]。在极坐标系中,根据图2中夹角为θ的区域划分将定义域分段,每段定义域内的函数值为常数,其根据图2中对应区域内的d确定,使用式(7)计算。d越大,函数值越小,该段定义域内ψ的取值越安全。

式中:security(ψ)—安全性评估函数;λ—改变函数值大小的比例因子,设置为大于0的常数;dmax—障碍物开始引起security(ψ)函数值变化的距离阈值,且dmax=(w-Δ)∕2 m。约束条件I s a fe根据安全性评估函数分两步计算,首先确定符合安全性要求的运动方向的取值区间的集合I′saf e=[I′1,I′2,…,I′j](j为取值区间的个数),使ARV在I′saf e的区间内的运动方向上与障碍物保持安全的距离:设置d share为保障ARV安全的距离阈值,对应的安全性评估函数的函数值阈值为λ(dmaxd share),由于在安全性评估函数的函数值计算中,距离越大,函数值越小,ψ的取值越安全,因此使用securit y(ψ)<λ(dmax-d share)计算得到I′safe。然后,缩小I′sa fe中的取值区间以得到I saf e,以保障ARV在I sa fe的区间内的运动方向上与两侧的障碍物也保持相对安全的距离:如图2所示。设置了保障ARV安全的安全间隔IΔ,在I′sa fe中的所有取值区间(以I′1为例)的两端分别缩小IΔ以得到I sa fe(以I1为例)。

图2 安全性评估函数计算方法示意图Fig.2 Illustration of the Calculation Method of Security Evaluation Function

3.4 优化方法

在环境探索任务中,ARV通常在全局环境信息未知的水下环境中工作,对可靠性的要求很高,因此借鉴文献[8]中多目标优化的方法,选择最小最大法作为优化方法计算最优解,以在最坏的情况下寻求最好的优化结果,保证ARV工作的可靠性。最小最大法将式(1)所示的多目标优化问题转化为式(8)所示的单目标优化问题,通过求解即可得到共享控制方法产生的艏向角控制命令ψshare。

4 计算机仿真

为了验证基于多目标优化的共享控制方法的效果,研发了ARV共享控制计算机仿真研究环境。仿真环境主要由视景显示、ARV共享控制算法、ARV动力学仿真与运动控制、障碍物仿真四个模块组成。其中,操作人员通过图马斯特T.16000M操作杆输入控制信息;ARV的动力学模型采用REMUS AUV的六自由度动力学模型[12],该AUV使用一个主推进器控制前向速度,一对垂直舵控制艏向,最大前向速度为2.5 m∕s。

为验证基于多目标优化的共享控制方法的效果,在仿真环境中对基于多目标优化的ARV共享控制、遥控和加权共享控制三种方法进行了对比仿真。其中,遥控方式可以仿真操作人员直接遥控和仲裁法共享控制中由操作人员控制的情况;加权共享控制通过线性加权融合人机控制信号实现共享控制,如式(9)所示,在融合法共享控制的设计思路中具有一定的代表性[8-9],式(9)中μ(μ∈[0,1])为操作人员遥控的权值,根据ARV到障碍物的最小距离确定,使用式(10)计算,为便于比较,式(10)的参数设置与服从度函数中形状系数的计算方法一致。

如图3(a)所示,仿真实验设计为ARV由起点A出发穿过障碍物区域并到达终点B的过程以仿真ARV的环境探索任务,终点B仅为路径点,不用于ARV的路径规划。仿真中ARV的控制周期设置为0.1 s,运动控制采用文献[13]中的混合模糊P+ID控制方法,仿真区域大小为(400×600)m。仿真中基于多目标优化的共享控制方法的参数设置如下:服从度函数中,d share=50 m,d sa fe=15 m,αmax=1;稳定度函数中β=0.1;自主度函数中γmax=1;活动窗口中,Δ=1 m,w=121m,用于划分区域的θ=2π∕180,将活动窗口划分为180个区域;安全性评估函数中λ=1,计算约束条件时IΔ=2π∕18。仿真结果,如图3、表1所示。

图3 仿真结果Fig.3 Simulation Results

表1 仿真结果Tab.1 Simulation Results

图3中:A—起点;B—终点,黑色图形——障碍物;曲线—ARV的运动路径。由图3和表1可以看出,与遥控和加权共享控制相比,基于多目标优化的共享控制方法产生的ARV路径更平顺,在任务中的路径长度和所需时间也更短,有效的优化了ARV的运动。

仿真中用于控制ARV艏向角的操作杆x轴的输入信号变化,如图4所示。

图4 操作人员的输入信号Fig.4 The Operator’s Input Signal

由图4可知,与其他方式相比,基于多目标优化的共享控制方法有效减少了操作杆x轴输入信号的变化,使操作人员通过操作杆输入的控制信号更简单,有效降低了操作人员操作的复杂性,从而降低了操作人员遥控的工作负担。

仿真中ARV到障碍物的最小距离dmin的变化,如图5所示。仿真中使用的ARV动力学模型的最小转弯半径不超过15m,因此,加入适当余量后设定dmin不小于20 m时ARV处于安全状态。使用遥控仿真时ARV仅由操作人员控制,图5(b)中180 s左右出现了dmin过小的情况,此时图4(b)中操作杆信号的变化比较剧烈,说明遥控方式在操作较复杂的情况下发生碰撞的风险增加,安全性下降;使用加权共享控制控制时dmin保持在30m以上,虽然ARV保持安全状态,但与基于多目标优化的ARV共享控制相比,减小了ARV在障碍物周围活动的范围,同时dmin的变化比较剧烈,结合图3(c)可知,ARV的运动路径出现了明显的抖动;而使用基于多目标优化的共享控制方法时ARV始终处于安全状态,克服了上述两种方法中存在的问题,改善了ARV的安全性,优化了ARV的运动路径,从而提高了ARV的任务性能。

图5 ARV与障碍物的最小距离Fig.5 The Minimum Distance Between the ARV and the Obstacle

5 结论

针对ARV在环境探索任务中的艏向角控制,提出一种基于多目标优化的共享控制方法。将ARV艏向角控制命令作为决策变量,使用设计的服从度、稳定度和自主度函数作为目标函数,根据设计的安全性评估函数确定约束条件,通过最小最大法计算环境探索任务中ARV艏向角的控制命令。基于构建的ARV共享控制仿真环境对设计的共享控制方法进行的仿真实验表明,基于多目标优化的共享控制方法有效的提高了ARV的任务性能并降低了操作人员遥控的工作负担。在将来的研究工作中,将通过识别操作人员意图、分析操作人员的任务表现以及丰富操作人员与ARV系统的交互方式(力反馈、虚拟现实等),进一步提高基于多目标优化的共享控制方法的控制效果。

猜你喜欢

遥控障碍物安全性
如何遥控引爆的
新染料可提高电动汽车安全性
某既有隔震建筑检测与安全性鉴定
高低翻越
SelTrac®CBTC系统中非通信障碍物的设计和处理
他是如何遥控引爆的
ApplePay横空出世 安全性遭受质疑 拿什么保护你,我的苹果支付?
Imagination发布可实现下一代SoC安全性的OmniShield技术
遥控赛车
土钉墙在近障碍物的地下车行通道工程中的应用