基于多智能体的城市环道交通信号控制算法

2021-02-26陈晓利韩锋斌

重庆大学学报 2021年1期

陈晓利,韩锋斌

(1.重庆交通大学交通运输学院,重庆400074;2.招商局重庆交通科研设计院有限公司自动驾驶技术交通运输行业研发中心,重庆400067;3.重庆大学自动化学院,重庆400044)

环道是一个城市的交通枢纽,也是车流量强度最大的地区,从各地不同方向到达的车流非常集中,是一个路网密集、交叉口关联性极强的复杂系统,交叉口上游交通流的持续汇入和下游交通流不能及时疏散是造成环道拥堵的根本原因,在交通高峰期甚至会导致环道出现“死锁”现象。城市环道交通控制系统中广泛使用的仍是单点定时控制方法,这种方法是基于进出单点交叉口的交通流呈规律性分布,在稳定情况下有比较好的控制效果,但在交通流分布不稳定,随机性较强情况下,单点定时控制难以满足实时控制效果,产生较大的延误和信号周期的损失[1]。

环道交通是一个多交叉口组成的环形交通路网,多交叉口之间有较强关联性,如何从整体角度出发,将环道整体视为一个研究对象,环道内所有交叉口作为研究对象,在达到单个交叉口配时最优的情况下,对所有交叉口进行信号协调,是解决问题的关键[2]。近年来,多智能体系统研究是人工智能领域的一个研究热点,由于多智能体具备学习性、自调节性、以及交互性等优良特性。考虑交通系统是时间和空间上非线性、时变的随机系统,对交通系统的实时优化控制非常适合采用多智能体系统。在研究和分析各种多智能体在交通控制领域的基础上,将城市环道这一抽象模型引入研究范围,对城市环道进行模型的建立,并进行特性分析,尝试将多智能体技术引入到城市环道的交通控制中,实现不同的时段对城市环道交通的最优控制,研究背景选为重庆市两路口环道,该环道共有5个交叉口,高峰时段的交通流量较大,交通流负载过大,在环道模型中具有代表性,构建一套合理的智能控制系统,针对交通评价指标进行分析,选择具有代表性的交通评价指标,对该控制系统的控制效果与现有控制效果进行对比分析,证明该智能控制系统的合理性和有效性。

1 城市环道多交叉口信号协同控制算法

交通系统是一个在物理上分散、功能上紧密相连的大型复杂系统,对于交通路网中的各个子系统,各自处于不同的时间和空间上动态变化的环境中,这些特性非常适合使用多智能体的思想进行求解。多智能体系统比较符合交通系统中各个元素的特征[3]。因此,基于多智能体所形成的交通模型比较符合实际交通环境。此外,多智能体的开放性使得它自身可以与其他的控制方法结合,使得问题的求解更加便捷和简单[4]。

如图1所示,以重庆市两路口环道为例,构件抽象的交互性多智能体系统模型,说明5个交叉口所构成的交叉口系统与多智能体系统对比,5个智能体之间彼此互相关联,左右图两者的拓扑结构非常相似,因此考虑可以将多智能体理论应用到环道交叉口的协调控制中[5]。

图1 两路口环道与多智能体系统模型对比示意图Fig.1 The schemativ diagram of two intersection loop and multi-agent system model comparison

对于一个城市交通路网,主干道往往承受着比较大的交通负载,对干道的各个交叉口进行协调控制,从而保证主干道上车流的畅通运行和减轻路网的负载已成为缓解城市交通拥堵改善城市交通运行状况的关键所在。对于干道协调控制,往往根据2个指标进行优化:停车延误和绿波带,根据这2项指标,有两种干道协调设计思路:

1)绿波协调控制设计;

2)停车延误协调控制设计。绿波协调控制设计是以车辆在干道上行驶时绿波带最大化为设计目标;停车延误协调控制设计是车辆的停车延误最小化为设计目标。

1.1 干道协调绿波控制

干道绿波协调控制是基于绿波带的设计思想,对干道上多个交叉口进行协调相位设计,绿波带设计,从而使得车流能够不停车地直行通过各个交叉口。进行干道绿波协调设计一般只适用于交通状况较小或者未饱和的状态,滤波协调控制的核心在于绿波带的设计,通过求得最大绿波带,使得绿波时间在整个公共信号周期时间内的比值达到最大,使得车辆可以尽可能不停车地驶离干道。绿波带的宽度往往是衡量滤波协调控制的评价指标。

下面对绿波协调控制的几个基本概念做解释:

1)协调相位:是指干道上的多个信号交叉口为了达到协调控制而设计的相位,一般为直行相位。

2)绿波带:是指在同一绿灯时间内,经过车道的车辆相距最远的2条连续行驶轨迹线的空间。表征绿波带的2个属性是绿波带宽度以及绿波带速度。其中,绿波带宽度是指车辆在2个交叉口之间连续获得通行的最小绿灯时间;绿波带速度是指车辆在获得绿波时的平均速度。如果车辆能以绿波带速度在干道上行驶,理想情况下,可以不停顿地通过各个交叉口。

笔者提出基于多智能体的环道内交叉口绿波协调算法,算法的基本思路是:将环道上的每一个交叉口都看做是一个智能体,并且环道上的相邻交叉口之间可以建立信息沟通,两者之间的信息可以共享,两者之间的通信忽略时延,那么环道上多个交叉口的协调控制就是多智能体的协调控制[6]。

1.2 算法模型与参数

定义环道交叉口多智能体的模型如下式所示

式中:Agent为交叉口多智能体的集合;S t(i,j)为交叉口多智能体i的状态;C k为交叉口多智能体的周期长度;T k(i,j)为交叉口多智能体i的每个相位的最大相位时间;P inext为交叉口多智能体i的下一个相位[7]。

其中:s t(i,j)指的是在t时刻第i个交叉口智能体的第j个相位的状态值;C k(i)为第i个智能体在第k个周期的周期值;t k(i,j)为第i个智能体在第k个周期的第j个相位的最大相位时间。

在定义完环道交叉口智能体的模型之后,求解各个交叉口智能体的交通参数是非常核心的部分,主要的交通参数有3个:周期、各个相位绿灯时间、和相位选择策略[8]。以下对这3个参数的求解进行阐述

周期:周期的求解如下

当满足最优周期条件时,根据韦伯斯特算法求得最佳周期,若不满足,则启用预案中的周期时长。

相位绿灯时间:基于行驶安全考虑,每个相位应设有最小的通行时间tmin,通常取10 s,这里定义第i个交叉口智能体的第j个相位的流量为q(i,j),且在t时刻,第i个交叉口的总的通行车流为Q i(t),t(i,j)为第i个交叉口智能体的第j个相位应该获取的绿灯时长。那么,根据流量分配原则

相位选择策略:此时,利用多智能体系统的通信与信息共享的特点进行设计。设计思路:假设交叉口智能体agenti此时正在对车流Tf进行放行,此时,交叉口智能体agenti给相邻的交叉口智能体agenti+1发送一个通知Notification,这里agenti+1表示下游交叉口智能体。智能体agenti+1根据发来的通知,得到放行时刻,计算出绿波车流到达的时刻,从而对自身进行自适应调整,使得道路的通行能力最优化[9]。

为进一步说明协调相位的选择策略,这里,对相邻交叉口的时距图进行分析,对立面的一些参数进行解释,如下图2所示,为2个交叉口智能体的时距图。

图2 交叉口相位时距图Fig.2 The intersection phase time distance diagram

图中,I i、I i-1为相邻的交叉口,C k(i)为交叉口I i的第k个信号周期时长,t k1为信号周期的开始时刻,t k6为结束时刻,t k2为下行绿波时间开始时刻,t k3为下行绿波时间结束时刻,下行绿波时间是指车流从交叉口I i到I i-1的绿波时间,同理,t k4、t k5为上行绿波时间开始结束时刻。Δt ki是2个绿波带的时间间隔,也就是t k4和t k3的差值。这里定义时间间隔集合Δt k=[t k2-t k1,Δt ki,t k6-t k5],时间间隔Δt k的选择直接影响到相邻智能体交叉口的协调绿波控制效果[10]。

交叉口智能体的相位选择基于2方面的考虑:1)一是智能体自身当前的状态,单个交叉口是自适应的控制策略,将单个交叉口视为智能体,如果做当前相位的选择,必然会影响到自适应控制的控制效果。2)需要考虑协调车流(也就是绿波车流)到达此交叉口的时刻与当前时刻的时间间隔。在2个相邻交叉口智能体满足绿波条件的基础上,待协调车流到达时间与交叉口智能体的剩余可选择的相位时间时长的大小之差,也就是两者的匹配程度会影响智能体的控制效果:如果两者之间相等,那么协调车流可以不停车地连续经过2个相邻交叉口,如果不相等,肯定对绿波效果有影响[11]。

经过上面的分析,可以得到当前智能体的相位选择策略主要由2个因素决定,即:智能体的当前状态以及时间匹配度。分别用s t(i,j)表示当前智能体的状态参数,以及Time Match表示时间匹配度。其中时间匹配度定义如下

其中tmin为提到的最小相位时间,Δt为时间间隔集合Δt k中的取值。

因为相位选择策略主要由上面2个参数决定,因此定义当前智能体的协调适应度变量

相位选择算法流程如表1所示。

表1 相位选择算法Table 1 Phase selection algorithm

续表1

1.3 算法流程

经过分析,基于多智能体的绿波协调算法利用智能体之间的通信能力,将所需传递的有用信息传递给相邻智能体,经过智能体的推理计算,得到协调控制参数以及智能体的下一步执行策略[12]。

这里定义相邻智能体之间的发送信息交流表达式为

此外,定义相邻智能体之间接受信息交流表达式为

基于智能体周期、相位绿灯时间、以及信号选择策略的研究,多智能体的绿波协调算法如表2所示:

表2 绿波协调算法Table 2 Green wave coordination algorithm

结合单点自适应配时算法和基于多智能体的滤波协调算法,提出算法描述如下:

1)获取各个路口不同方向的实时车流量。

2)根据自适应控制配时算法得到各个路口的周期与各个相位的绿灯时间。

3)基于多智能体信息互通的思想,不同路口将自己的周期与各相位绿灯时间发给相邻路口。

4)判断各个路口之间的周期是否相同或成整数倍,若是,则可以进行滤波协调控制,各个路口智能体根据相邻路口的周期与协调相位绿灯时长,调整自己的协调相位绿灯时间;若不是,则不满足绿波协调的条件,各个路口智能体执行自己的配时方案即可。

5)实时车流量数据的更新频率为5 min,所以,每个路口信号灯的配时方案执行次数:n=⎿5/T」,即n个周期的时间最接近于5 min,n即为本时段内的周期执行次数。执行完n个周期后,继续获取实时车流量,继续步骤1。

算法总的流程图如下图3所示。

图3 算法总流程图Fig.3 Algorithm folw chart

2 实验仿真

以重庆市两路口环道为实验仿真对象,分别选取其5个交叉口在低峰、平峰、高峰3个时段下的车流量进行实验仿真,表3为5个交叉口的各时段车流量分布。

表3 各时段车流量分布Table 3 Traffic flow distribution in different periods

使用vissim交通仿真软件进行仿真,为体现出所提算法的有效性,分别在两路口环道原有配时、韦伯斯特定时配时以及所提配时算法3种情况下,进行对比实验,实验结果如图4—图9所示。

1)低峰时段

图4 低峰时控制效果仿真曲线Fig.4 The simulation curve of low peak time control effect

图5 低峰时控制效果对比Fig.5 Comparison of low peak time control effect

2)平峰时段

图6 平峰时控制效果仿真曲线Fig.6 The simulation vurve of mid peak time control effect

图7 平峰时段控制效果对比Fig.7 Comparison of mid peak time control effect

3)高峰时段

图8 高峰时控制效果仿真曲线Fig.8 The simulation curve of high peak tim control effect

图9 高峰时段控制效果对比Fig.9 Comparison of high peak time control effect

由上面的实验仿真结果可以看到,在低车流量下,环道路网使用的自适应多智能体控制配时方案和原有的配时方案相比,两者的参数对比基本相差不大;在车流量不大的交通环境下,使用自适应多智能体控制配时方案相比原有的配时方案有着比价明显的优势,排队长度、停车次数、延误3项指标均有明显的降低;在车流量较大,环道交通处于近乎堵塞的情况下,使用自适应多智能体控制配时方案和原有的配时方案在排队长度和平均停车次数这2项指标表现上基本相差不大,因为此时的交通负载处于过载状态,但由于自适应多智能体控制算法是根据实时车流计算出的配时信息而且还考虑了相邻交叉口的绿波协调,因此在延误这项指标上,有着明显的减小。