基于车辆载带中继的路边单元突发业务分组调度最优策略

2021-06-20张亚楠

自动化学报 2021年5期

代亮张亚楠钱超孟芸黄鹤

车联网作为协同车-路-环境的开放融合网络系统,可为智能交通系统管理和控制提供新思路和手段[1],还可作为物联网实体为道路及周边的事件监测作传输载体[2].

高速公路沿线部署多个RSU 给行驶车辆提供信息服务是车联网的重要应用场景.RSU 不仅可作为经过其无线覆盖范围内过往车辆的互联网接入设备;部分RSU 还承担着其周边交通状况、环境监测、自然灾害及动物活动信息的收集和转发功能.为了降低高速公路车联网中通信基础设施的部署开销,部分RSU 与骨干网络处于隔离状态[3].孤立RSU可通过移动车辆以“存储-载带-转发”的方式将所收集到的周边交通状况、环境监测、动物活动等信息转发到与骨干网络相连的RSU[4-6].由于源RSU业务源的动态变化性和不可预测性使得自适应的分组调度面临挑战,如森林火灾监控、各种静止或移动的被监测保护动物等,业务状态在短时间内表现出高度的突发性[7-8],需要以自适应和鲁棒的方法解决突发业务调度问题,以提高网络资源利用率.

在上述应用背景下,应设计有效的源RSU 节点分组调度策略,在其无线覆盖范围内有车辆经过时,决定是否将收集的数据发送给过往车辆进行载带中继传输.分组端到端时延由源RSU 缓存中的排队时延与车辆载带分组至目的RSU 过程中的传播时延两部分组成.若源RSU 给到达车辆均发送分组,能使平均排队时延最小,但会导致较大的平均传播时延;若为了等待速度较快的车辆而导致分组在缓存中过多积压,则平均排队时延增加.因此,平均排队时延和平均传播时延之间存在最佳折中能使平均端到端时延最小化.当源RSU 的突发业务到达其缓存队列时,如果能根据突发业务到达率动态调整载带车辆的速度选择范围,就能缓解由于分组队列阻塞带来的排队时延增长.

1 相关工作及本文贡献

车联网中由于车辆移动速度快导致网络拓扑频繁变化,网络节点间断连通,这种间歇连通特性虽然增大了数据传输时延,但也增加了数据分发的机会和网络容量,适用于时延容忍的业务[9].车联网可使用“存储-载带-转发(Store-carry-forward)”的机会传输方式进行时延容忍业务的多跳传输[10].现有的高速公路车联网场景以“存储-载带-转发”方式进行时延容忍业务传输研究主要关注于如何保证车辆间多跳传输的可达性,而对网络性能考虑较少.文献[11]在高速公路场景下,得到了通过车辆载带中继的消息在一定距离上的传播时延的概率分布,以此为基础,研究两个紧邻车辆簇中后簇簇首通过车辆载带中继将分组发给前簇簇尾的时延概率分布,进而得到该场景下端到端时延的分布情况[12].Huang 等[13]考虑了车辆分布稀疏且相对移动速度不同会导致其通信过程频繁中断,研究了长距离车辆载带中继消息恢复时延的稳态分布.文献[14]提出了一种结合V2V (Vehicle to vehicle)和V2I (Vehicle to infrastructure)混杂方式的车辆载带中继的车联网数据分发方法,有数据待发的车辆可以通过多跳成簇的方式,将数据通过其他车辆载带中继到RSU 节点,该方法可以优化网络资源利用率及减少数据交付时延.

互不连通的RSU 可通过过往车辆“存储-载带-转发”的方式将所收集到的周边的交通状况、环境监测、动物活动等信息转发到与骨干网络相连的RSU,进而传送给数据中心[4-6].高速公路车联网中,RSU 可作为多种传感器网络的汇入网关,承担着周边交通状况、环境监测、动物活动等信息的收集和转发功能.该场景下,在RSU 节点形成的业务具有突发性[15].在进行RSU 分度调度研究时,需要考虑业务突发性对分组排队时延和分组传播时延的影响.目前车联网突发业务相关研究主要集中在由车辆随机到达引起的业务突发性,包括车与车,车与路边单元之间待传输的业务.文献[16]通过V2V多跳方式将具有突发性的车辆业务传输到RSU,并根据车辆与RSU 间的延迟约束估算覆盖该路段所需的最少RSU 数量.文献[17]在车辆通信环境下提出一种突发分组生成算法,能更加精确地描述突发业务传输过程中的分组生成情况.在文献[18]中,作者研究了异构车载网络基于位置路由的端到端时延界问题,考虑了车辆间通信的突发特性,将车辆间多跳通信建模成广义随机有界突发模型.文献[19]考虑了车辆业务的突发性和信道环境的高度动态性,研究V2V 多跳通信过程中业务源缓存情况、端到端时延性能及多跳传输带来的业务突发累积效应.文献[20]根据车辆轨迹数据统计车辆行驶过程中与RSU 相遇的概率分布,在业务分组具有随机性和突发性的条件下,研究车联网中移动数据卸载问题.也有相关文献从较大时间尺度来考虑车联网性能,车联网的业务需求及可用网络资源随着交通流量的时空变化而变化,其业务到达具有突发性[21-22].

由车辆载带中继的分组在RSU 间传输过程中,其端到端时延主要由排队时延和传播时延两部分组成.贪婪中继方案(Greedy bundle relaying scheme,GBRS)[23]不考虑车辆速度,源RSU 向经过的每个车辆均发送1 个分组,该方法能使排队时延最小,但传播时延较大.为降低传播时延,Khabbaz等[23-25]提出了一种RSU 分组概率中继方案(Probabilistic bundle relaying scheme,PBRS),在该方案中定义一个称为发送概率的参数Pr,该发送概率与车速成正相关,该方案不能对分组队列长度的动态变化做出相应调整.在文献[26-28]中作者基于分组重传机制,将虚拟空间引入分组延迟感知的分组传输方案,目的是在1 个分组到达目的RSU 前,源RSU 可将虚拟空间中该分组备份重传给后续到达但速度更快的车辆,以便更早地交付给目的RSU,但会造成分组冗余传输,影响网络资源利用率.Ramaiyan 等[29]假设源节点能感知车辆到达时间和车速,并根据车速和累计的分组数量做传输决策,利用动态规划方法解决了RSU 间分组传输端到端时延最小化问题,该方法需要已知完整的网络信息知识(即精确的车辆到达时刻、车辆速度等),并以每辆车到达时刻作为决策点,不能及时感知RSU缓存中分组的动态变化.在文献[30]中,作者在相同背景下,通过建立马尔科夫链分析了传播时延对接收端RSU 缓冲区中分组传输和重新排序的影响,统计间歇性连通车载网络场景下的延迟数据来评估网络性能.

在上述研究工作中,源RSU 向每个经过车辆发送1 个分组的方式使得传输资源利用率低,且排队时延受分组到达率的影响较大.据此,Khabbaz 等[23-24,31-32]提出了一种批量分组概率传输方案(Probabilistic bundle relaying scheme with bulk bundle release,PBRS-BBR),通过提高服务率减少分组在缓存中的排队时延,并仿真验证了PBRSBBR 相对于批量分组贪婪传输方案(Greedy bundle relaying scheme with bulk bundle release,GBRS-BBR)的优势.在文献[33]中,Fawaz 等建模并分析了上游RSU 与中游RSU 同时依靠车流向下游RSU 载带中继分组的场景,提出了一个能够缓解存储饱和度且延迟最小的分组批量发送方案.Wang 等[10]的研究侧重于RSU 向过往车辆发送数据的下行传输问题,在双向车流中选择中继车辆将信息从RSU 转发给有下载需求的目的车辆,减少车辆的传输中断时间.

本文针对基于车辆载带中继的RSU 突发业务分组调度问题,提出一种能使分组端到端时延最小的随机优化策略.该策略根据源RSU 缓存中的分组累积数量和移动车辆的速度状态做分组调度决策,能根据突发业务量的实时变化,动态调整分组调度的载带车辆速度选择范围.当突发业务到达时,及时增加载带车辆资源;突发业务量过后,再次调整车速选择范围,从而保证系统服务质量,实现分组传输过程中的平均端到端延时最小化.

2 系统模型

基于车辆载带中继的RSU 突发业务分组传输场景如图1 所示,高速公路某个路段存在两个固定RSU 节点,分别为源节点 RSU1与目的节点 RSU2.由于部署位置原因 RSU1不能接入互联网,该节点作为多种传感器网络的网关节点负责将周边具有突发性质的监测数据转发给与骨干网络相连的RSU2节点.两个RSU 间隔距离用 L 表示,该距离远大于RSU 的无线覆盖范围[24-25].相比距离 L,RSU 无线覆盖范围可忽略.

图1 路边单元突发业务分组传输调度示意图Fig.1 The schematic of bursty traffic transmission scheduling between roadside units

RSU-车辆分组随机调度系统如图2 所示,突发业务分组随机到达 RSU1,在其缓存中存储并排队等待发送.将系统时间划分为等长时隙,在某个时隙内,若没有车辆到达 RSU1,则分组在缓存中排队等候;若该时隙内有车辆到达,则 RSU1根据分组调度策略确定是否向经过车辆发送分组,以及发送的分组数量.

图2 RSU-车辆分组随机调度系统Fig.2 The packet scheduling system of RSU-vehicles

2.1 突发业务到达模型

假设每个时隙有不同数量的突发业务分组随机到达 RSU1,且分组到达过程是独立同分布的.突发业务可用多状态伯努利分布进行描述[34-35].令a[t]=m表示在第 t 个时隙有 m 个分组新到达 RSU1,分组到达过程的概率质量函数表示为

其中,θm∈[0,1]表示a[t]=m,m ∈{0,1,···,M}的概率,由于受到物理限制,M为每个时隙RSU 所能接收周边监测数据的最大分组个数.则 a[t] 的分布∑满足且分组平均到达率为

RSU1中的缓存用来存储尚未传输的积压分组,缓存容量为K 个分组,其中 K=∞和 K＜∞ 分别表示缓存容量无限和有限的情况.第 t-1 个时隙结束时,缓存中的分组个数,即队列长度,用 q[t] 表示,其状态变化为

其中,s[t]∈[0,S]表示 RSU1在第 t 个时隙向到达车辆发送的分组个数,S 为每个时隙受到物理限制,RSU 所能传输的最大分组数量.新到达的分组在该时隙可以立即传送,故在本系统中不区分新到达的分组和已存储在缓存中的分组.因此,可将第 t 个时隙的队列状态等效定义为x[t]=q[t]+a[t],得出

2.2 车辆到达模型

高速公路自由流交通状态下,车辆到达RSU1服从参数为λ 的泊松过程.用 T 表示两车相继到达RSU1的时间间隔,则 T 服从负指数分布,其概率密度函数为f(t)=λe－λt,t＞0,概率分布函数为F(t)=Pr(T ≤t)=1-e－λt,t ＞0.令系统时隙长度为固定值,用 Δt 表示,则在该时隙内(至少)有1 辆车到达RSU1的概率(即两辆车相继到达的时间间隔小于等于 Δt 的概率)为

因此,一个时隙内没有车到达 RSU1的概率为1-Pa.当时隙足够小时可确保每个时隙最多有一辆车到达.

2.3 离散车速状态模型

令 v[t]表示第 t个时隙到达 RSU1的车辆速度,其中 v[t]=0表示该时隙没有车辆进入 RSU1覆盖范围.假设在RSU 间行驶过程中,车辆速度保持不变,并且对于各个时隙独立同分布.本文将连续的车速量化成 W+1个离散的车速状态:令V=[v1,v2,···,vW+1]为阈值向量,其中,v1=Vmax和vW+1=Vmin分别是车速的上限和下限,且满足vw＞vw+1,即下标越小代表车速越快.

将第 t 个时隙到达 RSU1的车辆速度状态用h[t]表示,其中,h[t]=w,1 ≤w ≤W,表示v[t]∈[vw+1,vw);h[t]=W +1表示该时隙 t 内没有车辆到达,即 v[t]=0 .车速离散为5 个状态的模型如图3(a)所示,其中,w=1和 w=4 分别表示车速最快与最慢的状态;w=5表示无车辆到达 RSU1.类似地,W +1个离散车速状态模型如图3(b)所示.

图3 离散车速状态模型Fig.3 Discrete velocity states models

车速处于状态 w 的概率用 ηw表示,其概率质量函数表达式为

令 v∈[Vmin,Vmax),则车速分布的截断概率密度函数为[36]

2.4 传播时延

在车速状态模型中将连续的车速离散为W +1个状态,则传播时延也相应的离散为W+1 个状态.令 Tw表示车速状态为w时,RSU1向车辆发送1 个分组的平均传播时延,并分以下两种情况讨论:

1)当车速状态为w,1 ≤w ≤W 时,速度取区间中值,该状态下发送1 个分组的平均传播时延表达式为

显然,平均传播时延 Tw与车速成反比,即车速状态越好,平均传播时延越小,即T1＜T2＜···＜TW.

2)当车速状态为w=W +1 时,表示没有车辆到达 RSU1,故不能传输分组,此状态下平均传播时延为0,即 Tw+1=0 .

3 马尔科夫决策框架与时延分析

马尔科夫决策是用于不确定条件下的决策优化模型,描述代理与环境或系统交互的随机决策过程[37-38].基于车辆载带中继的路边单元分组调度问题面临突发业务到达时刻与数量的随机性、车辆到达的随机性,以及车速的随机性.本文基于马尔科夫决策的随机优化方法,提出一个分组调度最优策略,该策略能根据突发业务量、缓存状态的实时变化,动态、弹性地调整车速状态的选择范围以最小化端到端分组传输时延.本节通过建立马尔科夫决策(Markov decision process,MDP)框架对分组传输过程中的排队时延和传播时延进行分析,并以分组端到端时延最小化为目标,建立一个非线性优化问题.

MDP 框架制定如下:上文所描述的分组传输系统可由一个5 元组组成.其中,X={0,1,···,K}表示系统状态集合,每个状态代表 RSU1缓存中的分组队列长度;N={(m,w)|m ∈{0,1,···,M},w ∈{1,···,W +1}}表示所有可能的分组到达状态与车速状态的组合,表示系统的不确定性;S={0,1,···,S}表示发送分组个数的行动集合;P={τk,l|k,l ∈X}表示转移概率矩阵,其中τk,l=Pr{x[t+1]=l|x[t]=k}表示从时隙 t 到时隙t+1,RSU1缓存中分组队列长度由 k转变为l 的一步转移概率;D 表示分组从 RSU1传输到 RSU2的平均端到端时延,即MDP 框架中的报酬函数.令表示平均排队时延,表示平均传播时延,可得到:

在每个时隙,RSU1根据系统状态、车速状态做出行动决策.在系统状态 x[t]=k,车速状态h[t]=w的条件下,RSU1向到达车辆发送 s 个分组的概率用表示,即

系统转移概率分以下三种情况讨论:

1)若时隙 t-1结束时,RSU1缓存中有 k 个分组,且在时隙 t有 i个分组到达 RSU1,并发送i-m个分组给经过车辆,则 RSU1缓存在时隙 t增加了m个分组,其转移概率为

其中,k∈[0,K-1],m ∈[1,M] .

2)若时隙 t-1结束时,RSU1缓存中有 k 个分组,且在时隙 t有 i个分组到达 RSU1,并发送i+s个分组给经过车辆,则 RSU1缓存在时隙 t减少了s个分组,其转移概率为

其中,k∈[1,K],s ∈[1,S] .

3)若时隙 t-1结束时,RSU1缓存中有 k 个分组,且在时隙 t 缓存中分组个数保持不变的概率为

当 M≤K时,RSU1缓存状态的一步转移马尔科夫链如图4 所示.

图4 马尔科夫链模型Fig.4 Markov chain model

马尔科夫链的局部平衡方程为

根据MDP 框架,状态转移概率矩阵用 P 表示,矩阵中第 (i+1,j+1)个元素为τi,j;系统到达稳态时,队列状态为k 的稳态概率用 πk表示,且π=[π0,π1,···,πK]T.因为本系统所建立得马尔科夫链是齐次、不可约且非周期的,所以其稳态概率可以通过ΠP=Π获得.归一化方程为:.令f表示参数为的向量,当调度概率已知,则通过解以上方程可得到 πk,所以 πk是f的函数,可表示为πk(f).

根据式(9),在缓存队列状态为x[t]=k,车速为h[t]=w的条件下,时隙 t发送 s 个分组的平均传播时延为每个时隙 RSU1发送分组产生的平均传播时延为

4 优化问题与调度策略

于是,平均排队时延与平均传播时延分别可转化为

本文采用LINGO 软件中的建模语言对优化问题(18)进行描述,利用该软件中的非线性模型求解器解出该优化问题的全局最优解分别根据求得最优稳态概率和最优分组调度参数

对于已知的车速状态 w和发送分组个数 s,队列长度 k 存在一个最优门限且满足s2),即在相同车速状态 w下,发送分组数 s 越多,队列长度门限越大.此时,最优传输参数的门限结构为

同理,对于已知队列长度 k和发送分组个数s,车速状态存在一个最优门限且满足s2),即在相同分组队列长度 k 的条件下,车速状态越小(车速越快),发送分组数 s 越多,车速状态门限越小.此时,最优传输参数的门限结构为

5 仿真分析

本文的仿真分为3 部分.1)通过优化问题(18)的最优解计算最优分组调度参数验证本文所提出的路边单元突发业务分组调度最优策略(Optimal packet scheduling strategy for roadside units＇ bursty traffic,OPSS-RSUs)具有门限结构;2)仿真并做出突发业务分组平均排队时延、平均端到端时延随平均传播时延的变化曲线,分析平均排队时延与平均传播时延间的折中;3)将本文提出的OPSS-RSUs 方法与贪婪中继方案GBRSBBR (Greedy bundle relaying scheme with bulk bundle release)、概率中继方案PBRS-BBR (Probabilistic bundle relaying scheme with bulk bundle release)以及Q-Learning 算法Q-Learning-BBR(Q-learning scheme with bulk bundle release)在平均排队时延、平均传播时延以及平均端到端时延三个方面进行对比和分析.

仿真参数设置如表1 所示,其中,速度区间取[16.67,33.33] m/s,即[60,120] km/h;将连续车速离散为W+1=5个车速状态,即 1≤w ≤5,且w越小表示车速状态越快,车速状态 w=5 时表示没有车辆到达 RSU1.根据式(5),不同车速状态的概率取值为[η1,η2,η3,η4,η5]=[0.1259,0.1494,0.1494,0.1259,0.4493].相应地,根据式(8),不同车速状态下 RSU1发送1 个分组的传播时延为[T1,T2,T3,T4,T5]=[320.0256,369.2421,436.3477,533.2622,0].为便于分析,取 S=2,即 RSU1在每个时隙向到达车辆发送的分组个数 s∈{0,1,2}.

表1 仿真参数表Table 1 Simulation parameters

5.1 OPSS-RSUs 方法门限结构验证

本文按分组到达概率 θi的不同分为两组方案进行仿真,且两组 θi的取值如表2 所示.其中,方案1 中分组的平均到达率,方案2 中

表2 分组到达参数表Table 2 Packets arrival parameters

图5 OPSS-RSUs 方法双门限结构Fig.5 Double threshold structure of OPSS-RSUs

由图5 可知,调度策略 s 是基于车速状态 w和分组队列长度 k 的双门限结构.在图5(a)中,当w=3时,根据式(19),有

当 0≤k ＜11时,RSU1发送0 个分组;当11 ≤k ＜12时,发送1 个分组;当 k≥12 时,发送2 个分组.因此,在相同车速状态下,分组队列长度较小时,RSU1不发送分组以等待速度更快的车辆;当分组累积数量增大到门限值时,RSU1会及时发送分组,以降低排队时延.

当 3＜w ≤5时,RSU1发送0 个分组;当2 ＜w ≤3时,发送1 个分组;当 w≤2 时,发送2 个分组.由此可得出结论,在相同分组队列长度的条件下,车速状态 w 越大(车速越小),RSU1发送分组个数越少;反之,发送分组个数越多.

综上所述,车速状态越好,分组队列长度越大,则发送分组数目越多;车速状态越差,分组队列长度越小,则发送分组数目越少甚至不发送分组.

当 k=24,s=2 时,方案1 与方案2 车速状态的门限值分别出现在车速状态3 与车速状态4 处,说明在相同的分组队列长度条件下,分组到达率较小时,该调度策略选取速度较快(w≤3)的车辆发送分组,放弃车速较慢的车辆(w=4,5).当增大时,分组累积速率加快,该调度策略将扩大发送分组的车速选择范围(w≤4),给速度较慢的车(w=4)也发送分组,该方法能防止排队时延的过快增长.

5.2 排队时延与传播时延的折中验证

在优化问题式(18)中,将平均传播时延

如图6(a)所示,在OPSS-RSUs 方法中,当平均传播时延较小时,说明 RSU1仅选择速度较快的车辆发送分组,故平均排队时延较高;随着平均传播时延逐渐增大,RSU1扩大载带分组的车速选择范围,使得分组传输机会增加,平均排队时延随之快速下降;当平均传播时延继续增大时,由于分组平均到达率 α¯ 不变,扩大车速选择范围对平均排队时延的影响逐渐减弱,平均排队时延的下降速率逐渐平缓并趋近于0,即分组到达 RSU1后几乎立刻发送给车辆.因此,平均排队时延与平均传播时延之间存在折中,且该折中点能使得平均端到端时延最小化.在图6(b)中,随着平均传播时延逐渐增大,平均端到端时延经历了先降低后增加的过程,验证了折中点的存在性.

图6 平均排队时延和平均端到端时延随平均传播时延的变化曲线Fig.6 Changes in average queuing delay and average end-to-end delay as the average propagation delay increases

5.3时延性能对比分析

GBRS-BBR 方法不考虑车辆速度,在缓存中分组个数不为0 的情况下,向每一个经过的车辆均发送分组,即传输参数如下式所示:

PBRS-BBR 方法中,RSU1向第 i 辆车传输分组的概率为Pbr,i∈[0,1],根据文献[25] 中式(4),RSU 给第 i 辆车发送分组的概率表达式为

其中,μv表示车辆到达率,dSD表示源-目的RSU间隔距离,Vmax表示限定车速的最大值,vi表示第i辆车的速度.由此可知,在车辆到达率 μv为定值的条件下,Pbr,i仅由车速决定,车速越大,Pbr,i越大;反之,Pbr,i越小.因此PBRS-BBR 方法仅能降低分组平均传播时延,无法对平均排队时延进行控制.

Q-Learning 是一种无模型的强化学习算法,在该算法中.定义系统状态 state(k,w),其中k ∈{0,1,···,K},w∈{1,···,W};行动 act 表示发送分组个数;报酬 r为状态 state(k,w)且采取行动 act 时,单位时隙所产生的端到端时延,故状态-行动报酬矩阵 R 如下式所示:

其中,对某一状态,非有效行动的报酬为-∞,仿真中设定为-100 000 000.

本文使用 ϵ-greedy (ϵ-贪婪算法)来保证源路边单元探索环境参数及保障数据包调度决策质量.应用 ϵ-greedy 之后的源路边单元在进行强化学习决策时,做出在当前车辆速度状态和数据包队列状态下进行发送分组数量的决策.

算法整体步骤如下:

在当前状态 state(k,w) 的所有行动中选取一个行动act;

算法中 ϵ 是一个在0和1 之间服从均匀分布的随机变量,在每次决策之前随机选取，在每次迭代中 0≤ϵ ≤1 是恒定的探索参数.

本文所提出的OPSS-RSUs 方法以端到端时延最小化为优化目标,根据分组排队数量和车速状态两个因素决定是否给该车发送分组以及发送分组的数量.将车辆到达率取固定值 λ=0.55,平均分组到达率的变化范围取 [0.1,1.0],OSPT-RSUs、GBRSBBR、PBRS-BBR和Q-Learning-BBR 四种分组调度方法的平均排队时延、平均传播时延以及平均端到端时延的仿真结果如图7 所示.

与另外三种方法相比,GBRS-BBR 方法产生的平均排队时延最小,但平均传播时延最大,如图7(a)和图7(b)所示.GBRS-BBR 方法向所有到达车辆发送分组,能在最短时间内将分组发送给车辆,但不对车速进行选择,其平均传播时延是RSU1和 RSU2的间隔距离与车速期望值的比值,大小不随变化.PBRS-BBR 方法中,RSU1向不同车辆发送分组的概率 Pbr,i与其速度大小成正相关,其平均传播时延小于GBRS-BBR.当 α¯ 较小时,该方法与Q-Learning-BBR 方法均能通过降低平均传播时延达到降低端到端时延的目的;当 α¯ 较大时,分组在 RSU1缓存中迅速累积,排队时延增大,PBRS-BBR和Q-Learning-BBR 方法的端到端时延显著高于GBRS-BBR 方法和OSPT-RSUs 方法,如图7(c)所示.对比图7(c)与图7(a)和图7(b)可知,本文所提出的OSPT-RSUs 方法能根据的增大动态地扩大车速选择范围,用较小平均排队时延的增长换取平均传播时延的大幅降低,从而使得平均端到端时延显著小于其他三种方法.

图7时延随变化曲线Fig.7 Change of delay with

图8时延随 λ 变化曲线Fig.8 Change of delay with λ

随着车辆到达率 λ 取值由小增大,四种分组调度方法的平均排队时延均呈下降趋势,如图8(a)所示.当车辆到达率 λ 较小时,为防止缓存中分组累积数量过多导致排队时延过大,OSPT-RSUs 方法会扩大车速选择范围增加分组服务率,因此其平均传播时延较大,且与GBRS-BBR 方法相近,如图8(b)所示.随着 λ 不断增大,分组载带机会增多,OSPTRSUs 方法能通过不断优化载带车辆的速度范围,使得平均传播时延和端到端总时延逐渐降低,其分组平均端到端时延较GBRS-BBR、PBRS-BBR 以及Q-Learning-BBR 方法有明显优势,如图8(c)所示.

6 结论

本文研究了高速公路车联网场景下基于车辆载带中继的RSU 突发业务分组调度问题,提出一种能使分组端到端时延最小的随机优化策略,该策略根据源RSU 缓存中的分组累积数量和移动车辆的速度状态做分组调度决策.本文通过受限马尔科夫决策框架对分组传输过程中的状态转移过程进行分析,建立一个非线性平均端到端时延最小化问题并求解.该方法可使得源路边单元根据突发业务到达率的实时变化,动态、弹性地调整分组调度策略,即动态调整车速选择范围,当突发业务量到达时,及时增加载带车辆资源;突发业务量过后,再次调整车速选择范围,从而保证系统服务质量,实现分组传输过程中的平均端到端延时最小化.