APP下载

移动边缘计算系统中无人机和用户的分层博弈优化方法*

2020-09-27岩,姚

通信技术 2020年9期
关键词:效用函数跟随者计算资源

崔 岩,姚 叶

(中国人民解放军陆军工程大学 通信工程学院,江苏 南京 210007)

0 引言

近年来,VR/AR、自动驾驶等飞速发展。此类应用会在短时间内产生大量数据,且对时延的要求很高,但移动设备无法配备足够的计算资源和能量资源进行处理。作为5G/B5G 中的一种新兴技术,移动边缘计算被提出来解决这一难题[1]。移动边缘计算通过将计算、控制和存储移动到网络边缘,使得资源受限的移动设备获得对计算密集型任务和时延敏感型任务的支持。

传统的边缘计算服务器通常部署在固定的地方(如基站),降低了移动边缘计算系统的灵活性。而无人机部署灵活、易于管理、成本低廉,引入移动边缘计算中能带来诸多潜在的增益[2]。例如,由于无人机与地面用户之间遮挡较少,因此两者通常能够建立视距传输链路[3]。此外,当地面情况恶劣(如自然灾害)时,无人机也可以快速、低成本地提供边缘计算服务。

传统的集中式优化往往需要大量的信息交互,复杂度较高且不能反映个体诉求。而在博弈模型中,每个个体都能独立做出适合自己的策略。合理的博弈模型能减少甚至消除用户之间的信息交互,且能以较低复杂度的算法解决问题[4]。但是,现阶段用博弈论解决使用无人机的移动边缘计算系统中问题的论文还很少,且多仅考虑了地面用户和无人机资源的异构性及用户不同的利益诉求,少有文章充分考虑无人机的动态性。良好的动态性是无人机相比于传统的地面基站最大优势之一。因此,基于博弈论思想,本文提出一种联合优化方案,充分考虑无人机的动态性和用户的利益诉求,建立斯坦伯格博弈模型,优化无人机的位置,从而进一步提高多无人机为传统的移动边缘计算系统带来的潜在增益,最后证明了纳什均衡解的存在性,并找到了纳什均衡点[5]。

1 系统模型

如图1 所示,这是一个多无人机为多地面用户提供边缘计算服务的场景。其中,地面用户i∈I={1,2,…,I}分布在任务区域A中,无人机n∈N={1,2,…,N}在空中为地面用户提供边缘计算服务。以A的左下角为坐标原点,建立三维空间直角坐标系,则地面用户i的坐标可表示为li=(xi,yi,0),无人机n的坐标可表示为ln=(xn,yn,h)。在地面用户集合I中,每个地面用户i都有一个计算密集型任务ψi=(di,Fi)亟待处理,其中di代表该计算任务的数据量(bit),Fi代表完成该计算任务所需的CPU 周期数。

本文考虑无人机和地面用户建立了视距传输链路,因此信道增益可以表示如下:

其中||·||表示欧氏距离,di,n为无人机n和地面用户i之间的距离。β0表示参考距离为1 m 时的信道增益。

图1 多无人机多地面用户系统模型

1.1 本地计算模型

当地面用户i在本地处理计算任务时,用表示其CPU 频率,用ei表示每CPU 周期的能耗,则可得到任务处理时间和任务处理能耗分别为:

因此,可得到本地计算总开销为:

其中表示时间权重因子,表示能耗权重因子,。权重因子反映了系统对时延和能耗的敏感程度。

1.2 卸载模型

无人机i的卸载策略ai包括两部分:卸载到哪个无人机上?从无人机处请求多少计算资源?可用分别表示这两个子策略,即,其中∈{0,1,…,N}表示地面用户i选择卸载到的无人机。当时,表示地面用户i选择了在本地处理任务。表示地面用户i从无人机n处请求的计算资源量(CPU 周期数/单位时间)。

计算地面用户i的卸载开销前,首先定义地面用户卸载时受到的干扰。在无人机集合N中,每个无人机n提供有限的频谱资源,即有限的正交子载波c∈C={1,2,…,C}。当多个地面用户通过同一信道进行卸载时,它们会相互干扰[6]。用∈C表示地面用户i卸载时使用的信道,则地面用户i在卸载到无人机n时受到的干扰表示为:

其中pj是地面用户j的发射功率。本文考虑地面用户采取固定的信道选择策略,由此可得到地面用户i卸载过程中的信噪比:

其中σ0为背景噪声功率。因此,地面用户i的卸载速率为:

其中B表示地面用户i的信道带宽,则地面用户i卸载时的上传时间、上传能耗分别为:

假设地面用户i向无人机n请求的计算资源量为,那么完成其计算任务ψi所需的时间为:

由此得到地面用户i选择卸载时的总时延为:

综上,当地面用户i选择卸载时,付出的总计算开销为总时延和能耗的加权和表示如下:

当地面用户i从无人机n处请求计算资源时,需要按照无人机n对其计算资源的定价支付一定的价钱。当无人机n的定价是ηn时,地面用户i为计算资源付出的成本为:

综上所述,当地面用户i将计算任务卸载到无人机时,付出的总开销包括总计算开销和为计算资源付出的价格两部分:

综合1.1 和1.2 两部分内容,可得到地面用户i完成计算任务ψi所需的总开销为:

其中t{·}为指示函数。当条件{·}为真时,指示函数t{·}取值为1;反之,指示函数t{·}取值为0。

1.3 无人机的收益模型

本文中无人机搭载边缘计算服务器,有偿为地面用户提供计算卸载服务。本文仅考虑无人机为地面用户提供计算资源获得的收益,因此当无人机n的定价为ηn时,获得的收益为:

此外,无人机也应适当调整位置ln,位置的改变将影响信道质量,进而影响其服务质量。因此,无人机n的策略bn=(ln,ηn)。

2 博弈模型和问题形成

在使用无人机的移动边缘计算系统中,地面用户通过优化自身的卸载策略、请求的资源量,使开销最小化。而搭载了边缘计算服务器的无人机由移动运营商提供,目的在于在合适的位置以合理的定价提供计算资源,从而获得更高的收益。作为移动边缘计算系统中的两大核心部分,两者的利益诉求不一样。同时,作为服务提供者,搭载边缘计算服务器的无人机通常更具主动性。因此,针对系统中不同用户的优先级和需求的差异性,采用分层博弈模型能有效刻画地面用户的策略和无人机的策略对系统性能的影响。斯坦伯格博弈是一种典型的分层博弈[7],模型中包含具有高优先级别、先行动的领导者以及观测领导者决策信息而后行动的跟随者。本文将采用多领导者-多跟随者斯坦伯格博弈建模分析地面用户和无人机的决策行为。其中,无人机被建模为领导者,地面用户被建模为跟随者。不失一般性地,无人机和地面用户都被建模为自私且理性的博弈参与者。该多领导者-多跟随者斯坦伯格博弈表示如下:

(1)博弈参与者:无人机被建模为领导者,担任边缘服务器的角色,地面用户被建模为跟随者担任用户的角色。

(2)策略:无人机n的策略bn=(ln,ηn),其中ln=(xn,yn,h)表示无人机的三维坐标,ηn表示无人机n对每CPU 周期的定价。地面用户i的策略,其中∈{0,1,…,N}表示地面用户i卸载到的无人机,=0 时表示地面用户i选择在本地处理其计算任务,表示地面用户i从无人机n处请求的计算资源量。

(3)效用函数:对于无人机来说,效用函数为其提供计算资源得到的收益,而地面用户的效用函数则为其总开销。

首先,定义领导者(无人机)的效用函数为向地面用户提供计算资源得到收益:

无人机通过调整其位置和对计算资源的定价,寻求收益的最大化。因此,无人机之间的非合作博弈模型可描述为:

其中b={b1,b2,…,bN}表示无人机的联合策略。

定义跟随者(地面用户)的效用函数,构建基于局部互利的博弈模型,即用户在做决策的时候会考虑其邻居用户[8]。所谓邻居,指对于地面用户i来说,当它选择卸载到无人机时,如果存在一个地面用户j∈I{i}与其使用相同的信道,则两者互为邻居。由此可定义地面用户i的效用函数为地面用户i和其邻居的总开销之和:

其中Vi(ai,a-i)是地面用户i的总开销。该局部互利博弈模型可以表示为:

其中a={a1,a2,…,aI}表示地面用户的联合策略。

3 纳什均衡分析

3.1 对跟随者(地面用户)进行分析

定理1:局部互利博弈Gf是一个精准势博弈,至少有一个纯策略的纳什均衡解。

证明:首先构造下面的势能函数:

当任意地面用户i的策略单方面地从ai变更为时,则该地面用户的效用函数的改变量如下:

即策略改变导致的势函数之差等于效用函数之差,因此该博弈为精准势博弈,定理1 成立。

3.2 对领导者(无人机)进行分析

本文以无人机的收益作为其效用函数,且仅考虑无人机为地面用户提供计算资源获得的收益,而不考虑其他收益和开销。定理1 表明,地面用户层构成的局部互利博弈模型存在均衡解,而无人机的收益就是地面用户为计算资源付出的开销,如式(16)所示。因此,地面用户层存在均衡解就意味着无人机层同样存在均衡解。

最后,本文基于最佳响应算法[5]找到这一均衡点。无人机作为领导者根据对地面用户策略的预判,根据最佳响应作出收益最大化的决策[9],然后地面用户以无人机的策略b*为条件进行策略优化。如此反复,直至均衡。

4 仿真分析

本节通过仿真验证了所提方案的性能。仿真参数设置如下:A=50 m×50 m、N=5、I=100、B=5×106Hz、C=5。图2 展示了地面用户的开销和无人机收益的收敛情况。相较于初始情况(所有地面用户均本地处理),本方案在数次迭代后显著降低了地面用户的开销,并提高了无人机收益。图2中迭代曲线在后期的波动是因为本方案最终收敛到局部最优点,而该系统的局部最优点并不唯一。

图2 地面用户开销和无人机收益的收敛情况

图3 展示了不同信道数下,本方案基于最佳响应和随机选择下收敛结果的差异性。曲线表明,基于最佳响应的方案优化效果更好。可以看出,随着信道数的增加,地面用户的开销显著降低,且基于最佳响应的方案降幅更大,但随着信道数的增加,无人机的收益并没有明显变化。这是由于该参数设置下,几乎所有的地面用户都已将计算任务卸载到无人机上进行计算,信道数的增加无法吸引到新用户,再加上无人机之间的竞争,使得其收益没有显著变化。

图3 不同信道数下地面用户开销和无人机收益情况

图4 展示了在地面用户均匀分布、正态分布、指数分布3 种分布方式下,地面用户的开销和无人机收益的收敛情况。柱状图表明,不同的分布方式下,基于最佳响应的方案相较于基于随机选择的方案,无论是地面用户的开销,还是无人机收益,都更具优势。

图4 不同分布方式下地面用户开销和无人机收益情况

5 结语

本文考虑了一个多无人机多地面用户的移动边缘计算场景,建立了斯坦伯格博弈模型。无人机被建模为领导者,通过优化位置和对计算资源的定价,使自身收益最大化;地面用户被建模为跟随者,通过优化卸载策略和请求的计算资源量,使自身开销最小化。最后,仿真结果验证了本方案的有效性,方案能有效降低地面用户的开销,提高无人机的收益。

猜你喜欢

效用函数跟随者计算资源
基于模糊规划理论的云计算资源调度研究
改进快速稀疏算法的云计算资源负载均衡
基于Wi-Fi与Web的云计算资源调度算法研究
耦合分布式系统多任务动态调度算法
由城市台的“跟随者”到县域“三农”媒体的 “领导者”
从“跟随者”到“引领者”的跨越
从“跟随者”到“引领者”
—— 瓮福集团PPA项目成为搅动市场的“鲶鱼”
跟随者
供给侧改革的微观基础