APP下载

基于ASNBD-CMFE特征信息提取的短时交通流预测

2021-06-03彭延峰彭志华刘燕飞

北京交通大学学报 2021年2期
关键词:交通流分量模态

彭延峰 ,彭志华,刘燕飞

(1. 湖南科技大学 机械设备健康维护湖南省重点实验室,湖南 湘潭 411201;2. 南华大学 数理学院,湖南 衡阳 421001)

智能交通系统(Intelligent Transport Systems, ITS)能在已有交通设施基础上对现有的交通网络进行优化,从而有效缓解交通堵塞情况,具有低成本高收益的特点,是当今治理城市交通网络拥堵的研究热点.短时交通流预测是ITS的重要组成部分,可以确保ITS中路径诱导和交通流控制的有效性,对未来短时内的交通流量做出准确预测,为人们的出行提供实时有效的信息.城市交通流呈现出较强的非线性、随机性特征.因此,为对短时交通流进行准确可靠的预测,需要从历史数据中提取有效信息.

目前,经验模态分解(Empirical Mode Decomposition, EMD)、小波变换、奇异值分解和、集成经验模态分解(Ensemble Empirical Mode Decomposition, EEMD)等多种方法已被广泛应用于交通流数据特征信息的提取并取得了较好的效果.文献[1]将EMD分别与递归分析和定量递归分析结合,有效提取了交通流数据的内禀动态特性,并揭示了其时频域演化规律.文献[2]建立了基于奇异谱分析和人工神经网络的交通流混合预测模型,结果表明该模型可对交通流大数据样本进行有效分析和预测.文献[3]采用小波变换对交通流数据进行降噪预处理,结合遗传算法对神经网络初始参数进行优化,有效提升了预测精度.文献[4]提出了基于奇异值分解的优化抗差无损卡尔曼滤波算法,避免了扩展卡尔曼滤波算法的滤波发散问题,从而提高交通流状态估计的稳定性和精度.文献[5]采用小波变换将交通流数据分解为多个分量,然后采用神经网络对各个分量分别进行预测,结果表明该方法可有效用于交通流的实时动态预测.其中,EEMD因其具有良好的鲁棒性和抗模态混淆能力,近年来被广泛应用于处理非线性交通数据.文献[6]采用EEMD方法建立交通流数据的降噪模型,然后使用支持向量机对降噪后的数据进行交通流预测,结果表明对原始进行降噪处理能有效提升预测精度.文献[7]使用EEMD对交通事故数据进行降噪和重构,在此基础上构建了交通风险预测模型.文献[8]基于使用EEMD对交通流数据进行降噪,提出了一种基于EEMD和LSSVM的公共交通短期客流预测模型,取得了较好的预测效果.

然而,在EEMD中由于需要使用极值点构建上下包络,仍存在端点效应和模态混淆等问题.针对其缺点,文献[9]提出了自适应最稀疏窄带分解方法(Adaptive Sparsest Narrow-Band Decomposition, ASNBD),该方法将信号分解转化为对滤波器参数的优化问题,以得到信号的最稀疏解为优化目标,在优化过程中将信号自适应的分解成多个内禀窄带分量,无需处理极值点,所以在抑制端点效应和模态混淆等方面优于EEMD[10].

在对交通流进行降噪时,现有研究多未采取可靠的方法区分包含交通流本质特征信息的有效分量和噪声分量.如文献[1]采用直接将经验模态分解得到的前3个分量作为噪声分量,并除以上分量从而达到降噪的效果.文献[7]中经验模态分解和集合经验模态分解方法均采用去除前N个分量的形式进行降噪.文献[8]采用所有分量进行交通流预测,未区分噪声和有效分量.显然,针对不同的交通流数据,简单去除前几个分量或者是采用全部分量进行交通流特征提取缺乏的科学依据并影响预测的准确性.在对交通流数据进行分解以后,需要对分量进行筛选达到提取交通流有效特征信息的目的.因此,需要采用合适的方法将获得的有效分量和伪分量进行区分,从而提取包含有效信息的分量作为预测的输入样本.文献[11]提出了复合多尺度模糊熵(Composite Multiscale Fuzzy Entropy, CMFE),用以衡量信号的非线性程度.对于短时交通流数据,由于受天气、节假日和早晚高峰等因素影响,具有较强的非线性特征.数据分解结果中与噪声相关的分量非线性程度更高,其CMFE值也越高.而能反映交通流随时间变化规律的分量相对更平稳,非线性程度更低,其CMFE值更低.因此采用CMFE对交通流数据分解结果进行筛选可以有效降低交通流数据噪声,提取其本质特征信息,从而提高预测精度.

为实现短时交通流的准确预测,首先对原始交通流数据进行ASNBD分解,得到包含不同交通流数据特征的多个内禀窄带分量(Intrinsic Narrow-Band Components, INBC),求出每个分量的CMFE,根据CMFE选取有效分量,从而提取交通流数据的有效信息.然后根据分量筛选结果分别对每个分量建立最小二乘支持向量机(Least Square Support Vector Machines,LSSVM)网络模型,针对每个分量的自身特点选择不同的模型训练参数,以提高单个模型的预测精度.最后将各个预测值进行累加并得出预测结果.

基于此,本文作者提出了短时交通流数据的ASNBD-CMFE-LSSVM预测方法,并使用实际交通流数据将该方法与EEMD-LSSVM和EEMD-CMFE-LSSVM预测方法进行对比,结果表明ASNBD-CMFE-LSSVM预测方法拥有更好的预测精度.

1 ASNBD-CMFE特征信息提取

针对使用EMD进行分解时容易产生欠包络、过包络、端点效应、频率混淆等问题,受EMD的启发,文献[9]提出了一种基于高斯牛顿迭代法解决非线性优化问题的自适应最稀疏时频分析方法.

1.1 ASNBD算法

ASNBD主要思想为将信号分解为若干个内禀窄带分量(INBC)之和,该方法将信号分解问题转化为对滤波器参数的优化过程,优化目标为获得原始的信号最稀疏的表示,而约束条件是所有的INBC都处在过完备字典库中,且比原始数据更加平滑.ASNBD方法的步骤如下.

1)建立具有普适性的过完备字典库.

Dic={A(t)cos(ωt+φ(t)):

ωA(max)≪ω,φ(t)为缓变函数}

(1)

2)在过完备字典库中,为找到最佳的内禀稀疏结构,将信号分解问题转换成如下无约束优化问题P1,从而得到信号的最稀疏解.信号迭代过程如下:

①令r1(t)=f(t);

②解决如下优化问题P1:

(2)

(3)

(4)

式中:ω,ωb,ωc分别为滤波器的衰减速率、带宽和中心频率,滤波器的示意图如图1所示.

图1 滤波器示意Fig.1 Schematic diagram of the filter

④令ri+1=ri(t)-Ii(t);

⑤若‖rk+1‖2<ε则迭代终止,否则返回到第2)步.

ASNBD方法将信号分解转化为对滤波器参数的优化问题,以得到信号的最稀疏解为优化目标,在优化过程中将信号自适应的分解成多个内禀窄带分量,无需处理极值点,因此,在抑制端点效应和模态混淆等方面优于EEMD[12-14].

1.2 CMFE方法

复合多尺度模糊熵(CMFE)是针对粗粒化过程中由于时间序列[11],采用相同尺度因子下的不同粗粒化序列的模糊熵的均值作为该尺度因子下的模糊熵值,反映了时间序列在不同尺度因子下的复杂性.如果一个时间序列的熵值在大部分尺度上都比另一个时间序列的熵值大,那么就认为前者比后者更为复杂,非线性程度更高;如果一个时间序列随着尺度因子递增而熵值单调递减,那么这就意味此序列结构相对较简单,非线性程度更低.CMFE具体计算步骤如下:

对于时间序列{x(i),i=1,2,…,N},定义粗粒化序列

(5)

(6)

2 LSSVM算法

最小二乘支持向量机(LSSVM)是在支持向量机的基础上提出来的,解决了传统支持向量机在求解实际问题时导致计算量过大的缺点,实现了传统支持向量机的不等式约束问题转化为等式约束问题.在损失函数方面,传统支持向量机采用二次规划的方法,LSSVM将二次规划问题转变成线性方程组的求解,简化了计算复杂性[15-17].

LSSVM利用最有决策函数将非线性估计函数映射到高维空间,实现非线性函数到线性函数的转变.

f(xi)=vTv+b,i=1,2,…,N

(7)

式中:xi代表输入的实际数据;f(xi)表示输出标签;N为样本的个数;vT表示回归系数;b为偏差.对于LSSVM的回归问题,其优化模型为

(8)

s.t.yi=vTφ(xi)+b+ξi,γ≥0

(9)

式中:γ为惩罚系数;ξi为松弛变量;φ(xi)为映射系数.

为解决该非线性优化问题,构建其拉格朗日函数为

L(ω,b,ξi,αi)=J(ω,ξ)-

(10)

式中:αi为拉格朗日乘子,根据优化条件求解∂L/∂ω=0,∂L/∂b=0,∂L/∂ξi=0和∂L/∂αi=0,消去ω和ξi可得以下线性方程组.

(11)

式中:y=[y1,y2,…,yN]T;α=[α1,α2,…,αN]T;l=[l1,l2,…,lN]T;Ω=φ(xi)Tφ(xj).选择径向基函数作为核函数,最终得到LSSVM预测模型为

(12)

3 ASNBD-CMFE-LSSVM预测算法

本文使用ASNBD对原始交通流数据进行分解,该方法将信号分解转化为对滤波器参数的优化问题,以得到信号的最稀疏解为优化目标,在优化过程中将信号自适应的分解成多个内禀窄带分量,无需处理极值点,所以在抑制端点效应和模态混淆等方面优于EEMD.

在对交通流数据进行分解以后,需要对分量进行筛选达到提取交通流有效特征信息的目的.对于短时交通流数据,数据分解结果中与噪声相关的分量非线性程度更高,其CMFE值也越高.而能反映交通流随时间变化规律的分量相对更平稳,非线性程度更低,其CMFE值更低.因此采用CMFE对交通流数据分解结果进行筛选可以有效降低交通流数据噪声,提取其本质特征信息.ASNBD算法的流程如图2所示.

图2 ASNBD-CMFE-LSSVM短时交通流预测流程Fig.2 Flow chat of the ASNBD-CMFE-LSSVM short time traffic flow prediction

4 实验结果分析

4.1 数据集

为验证ASNBD-CA-LSSVM 算法的有效性,以美国明尼阿波利斯市某路口2018年7月交通流量数据为例[18],数据采集位置如图3所示.交通流数据采样周期为2 min,3日共采集2160个数据,如图4所示.选取前2日共1 440个数据作为训练样本,如图4所示,第3日数据作为预测方法测试样本.

图3 明尼阿波利斯市交通流量数据采集点Fig.3 Traffic flow data collection stations in city of Minneapolis

图4 交通流原始数据Fig.4 Original data of traffic flow

4.2 ASNBD-CMFE特征信息提取

为对比验证本文方法的有效性,首先分别使用EEMD和ASNBD方法对交通流训练数据进行分解.EEMD和ASNBD的分解结果分别如图5和图6所示.从图5可以看出,EEMD分解得到的包含短时交通流数据主要特征的IMF6分量出现了模态混淆,未能反映工作日交通流早晚高峰特征.这是由于包含交通流主要特征信息的IMF6分量受噪声模态干扰产生了一定波动.而ASNBD分解的结果相对较平稳,尤其是包含交通流主要特征信息的INBC1分量较好地提取了交通流数据特征信息.

图5 交通流数据EEMD分解结果Fig.5 EEMD decomposition results of traffic flow data

图6 交通流数据ASNBD分解结果Fig.6 ASNBD decomposition results of traffic flow data

对原始信号和各分量进行归一化处理,分别计算原始信号和各分量之间的CMFE如图7所示,设置CMFE阈值为1,CMFE低于红色虚线(阈值1)的分量即为有效分量.通过图7可知EEMD分解得到的IMF4、IMF5、IMF6和残余量的CMFE均低于阈值1,因此判定为有效分量.同时,ASNBD分解得到的INBC1、INBC2和INBC3的CMFE均低于阈值1,因此判定为有效分量.

图7 CMFE计算结果Fig.7 Calculation results of CMFE

4.3 ASNBD-CMFE-LSSVM预测结果分析

为评价论文方法短时交通流预测效果,分别采用EEMD-LSSVM、EEMD-CMFE-LSSVM和ASNBD-CMFE-LSSVM方法进行对比,其中EEMD-LSSVM和EEMD-CMFE-LSSVM的对比结果可以验证CMFE方法的有效性,EEMD-CMFE-LSSVM和ASNBD-CMFE-LSSVM的对比结果可以验证ASNBD方法的有效性.为对3种方法进行量化评价,引入平均绝对误差(Mean Absolute Error, MAE)、最大绝对误差(MAXimum absolute Error, MAXE)、均方根误差(Root Mean Square Error, RMSE)和能量误差(Energy Error, EE)最为预测结果和真实值之间误差大小的评价参数,各参数具体如下

(13)

(14)

(15)

(16)

采用EEMD所有分量、EEMD-CMFE分析后的有效分量和ASNBD-CMFE分析后的有效分量分别作为训练样本输入LSSVM进行训练,通过实验调整输入参数.采用第五日共720个数据作为测试样本,输入构建好的LSSVM模型进行测试.分别采用3种方法的预测结果如图8~10所示,其中绝对误差曲线为真实值和预测值误差的绝对值,预测误差对比如表1所示.可以看出EEMD-CMFE-LSSVM方法的预测误差要小于EEMD-LSSVM,预测值更接近真实值,这是由于通过CMFE分析剔除了伪分量,降低了随机噪声干扰对预测结果的影响.同时,ASNBD-CMFE-LSSVM方法的预测误差要小于其他两种方法,这是由于相对EEMD方法,ASNBD方法能更好地提取交通流数据的本质特征信息,从而导致ASNBD-CMFE-LSSVM方法预测精度更高,预测效果更好.然而,由于结合CMFE进行特征值向量的选取,在提高预测精度的同时也增加了计算量,因此EEMD-CMFE-LSSVM所耗时间量要高于EEMD-LSSVM算法.ASNBD-CMFE-LSSVM所需的计算时间也高于EEMD-CMFE-LSSVM,这是由于ASNBD中需对滤波器参数进行优化,计算量更大.

表1 各预测方法误差及训练时间对比Tab.1 Error and training time comparisons of all the prediction models

图8 EEMD-LSSVM预测结果Fig.8 The prediction results of EEMD-LSSVM

图9 EEMD-CMFE-LSSVM预测结果Fig.9 Prediction results of EEMD-CMFE-LSSVM

图10 ASNBD-CMFE-LSSVM预测结果Fig.10 Prediction results of ASNBD-CMFE-LSSVM

5 结论

1)提出了一种基于ASNBD-CMFE特征信息提取和最小二乘支持向量机的短时交通流预测方法,采用ASNBD方法对信号进行分解,计算每个分量的CMFE,根据分量的非线性程度选取有效分量并剔除伪分量,提取交通流数据特征信息,针对每个分量的自身特点选择不同的模型训练参数,从而实现短时交通流预测.

2)对实测数据的分析结果表明,ASNBD-CMFE方法能较好地从噪声干扰中提取交通流特征信息,结合LSSVM方法能对短时交通流数据进行有效预测.

所提算法提高了交通流预测的准确度,但在计算效率方面还有待进一步提升,今后将在ASNBD的快速算法方面进行深入研究,以期提升本文算法在交通流预测中的时效性.

猜你喜欢

交通流分量模态
基于LSTM的沪渝高速公路短时交通流预测研究
基于GM跟驰模型的内河限制性航道船舶交通流基本图
联合仿真在某车型LGF/PP尾门模态仿真上的应用
基于老年驾驶人的多模态集成式交互设计研究
画里有话
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
模态可精确化方向的含糊性研究
论《哈姆雷特》中良心的分量
广州港大濠水道定线制引航要领