APP下载

基于EMD-CNN-LSTM模型的铁路客运量短期预测研究

2023-12-27孟琪琳

铁道运输与经济 2023年12期
关键词:客运量尺度分量

孟琪琳,窦 燕

(新疆财经大学 统计与数据科学学院,新疆 乌鲁木齐 830012)

0 引言

铁路运输在交通运输业发展中起着重要作用,是国民经济发展的动力,随着我国现代综合交通运输体系更加完善,铁路成为旅客运输的较优方式[1-2]。铁路客运量预测作为铁路项目经济效益以及修建可行性的关键,精准的预测有助于铁路交通规划设计、科学管理以及最优资源配置[3-5]。铁路客运受天气、地域、环境等因素的影响是一个复杂的系统,所统计的客运数据存在强波动性、非线性的特征,难以进行精准预测。因此,研究铁路客运量预测时,首先需要将原始数据进行分解处理,有效降低数据的波动性,优化其平稳性;其次综合利用不同神经网络模型的优势充分提取数据间的特征,有效挖掘非线性数据间的特征信息,准确把握铁路客运历史数据的变化规律,提高可预测性。

小波分析法可以反映我国铁路客运量在不同时间尺度的周期波动强弱,具有较强的时间频率分析能力,其优点在于简单灵活,能够获取更多时间信息,在各个领域都有运用[6-7]。经验模态分解方法(EMD)是一种自适应性强的时间序列数据分析算法,不受分解层数以及小波基选择影响,可以将一个复杂的非线性信号进行平稳性处理,得到一系列光滑的分量,减少数据随机性和波动性[8-9]。长短期神经网络(LSTM)适合处理预测间隔和延迟相对较长的时间序列,可以提取数据长期以来的特征,在捕捉时空关系方面具有优越性能,常用于捕获数据中的复杂非线性关系[10-11];该算法解决了循环神经网络(RNN)在训练期间梯度消失的问题,对于长期规律学习效率较高,在许多复杂的非线性问题方面处理效果显著[12-15]。

研究通过组合模型集合各单项模型优势来提高预测精度[16-17],将原始数据通过EMD 算法对原始序列进行分解得到各内涵模态分量(IMFs)及残差分量(Res),并利用样本熵值对分解所得分量进行重构;引入卷积神经网络(CNN)与LSTM相结合,实现网络的并行学习,在特征提取与降维等方面具有优势,能够更好地处理时间序列数据,维持序列数据前后的相互关系。结果表明,使用EMD-CNN-LSTM组合预测模型预测我国铁路客运量更加有效。

1 方法与模型

1.1 小波分析法

小波分析又叫小波变换,是在Fourier 变换的基础上发展而来的一种时频局部化分析方法,可以对数据进行多时间尺度周期性分析。其中,小波实部系数图可以反映铁路客运量在不同时间尺度的周期变化和分布规律;小波系数可以反映铁路客运量大小,小波系数为正,说明铁路客运量偏大;小波系数为负,说明铁路客运量偏小;小波方差图则反映铁路客运量在不同时间尺度的周期波动强弱。

1.2 经验模态分解

EMD 算法适用于非线性、非平稳性数据的处理,并且可以有效减少模态混叠对序列分解的干扰性,实现序列的深层次平稳化。该算法的本质是将信号中不同频率的波动或趋势项逐级分解,形成一系列具有平稳性且相互影响甚微的数据序列[18]。为了使得到的各IMFs 分量有意义,需要满足2 个条件。一是该分量的极值点与过零点的数目必须一致或相差必须少于1 个;二是对于每一个时间点,该分量的局部极大值和局部最小值构成的上下包络线均值为零,即上下包路线关于时间轴逐步对称。

1.3 样本熵

熵是衡量系统复杂度的一种定量描述工具,样本熵概念来自物理学意义上的近似熵概念,20世纪末由Pincus 和Richman 等[19-20]提出。样本熵作为近似熵的一种改进算法,本身不依赖于数据长度,可以减少近似熵产生的误差[21],有效反映时间序列中的复杂性。其熵值大小准确反映时间序列的情况,样本熵值越小,序列的复杂性就越低;反之,序列的复杂性就越高。

1.4 卷积神经网

CNN 是一种近年来在机器学习领域用途较广的模型,由卷积层、池化层和全连接层构成。其中,卷积层在提取特征中依靠卷积核对数据特征进行提取;池化方式则采用ReLU 激活函数,用来忽略部分特征;全连接层将池化之后的神经元展开为向量形式。整体通过局部连接和共享权值的模式,交替运用卷积层、池化层和全连接层,最大程度地提取输入数据中的局部特征,减少人为提取特征的误差。CNN 在时间序列预测中学习数据关系能力较弱,因而将其与LSTM方法结合。

1.5 长短期神经网络

RNN在时间序列预测分析中得到广泛使用,主要是由输入层、隐含层以及输出层3个层次所构成,与普通神经网络相比其优点在于隐含层内的神经元之间相互连接,隐含层的每次计算结果都与当前输入以及上一次的隐含层结果之间不是相互独立的,RNN 网络对之前的信息具有记忆能力并应用于当前输出的计算中。LSTM是一种RNN的变体,基于RNN 增加了新的记忆单元与门控机制,可以有效地解决RNN 的梯度爆炸或者消失问题,处理数据长距离依赖问题。LSTM 模型在每个神经元内部增加了输入门、遗忘门和输出门3 类控制记忆单元状态的门结构,这些结构都可以让信息选择性通过,对神经网络模型中各个时刻的数据状态产生影响。

1.6 研究步骤

(1)时序数据分解。运用EMD 分解算法将原始序列分解得到各IMFs 分量与Res 分量,利用各分量波动的相似性和样本熵值的相近程度对各分量进行重构处理得到新序列。

(2)模型预测。将经分解后重构的序列经归一化处理后分为训练集、测试集,对训练集数据进行模型训练,使用CNN-LSTM 组合模型对重构序列的测试集数据进行预测,并将预测结果进行反归一化处理,获得各分量序列预测结果。

(3)分量预测结果叠加。将各分量序列预测结果进行叠加获得最终铁路客运量的预测结果,并对预测结果与原始数据进行误差分析。

(4)模型效果评价。将EMD-CNN-LSTM 组合预测模型与其他模型的预测结果进行比较,根据评价指标衡量组合模型的有效性。

2 铁路客运量趋势周期特征分析

2.1 铁路客运量趋势特征分析

我国铁路客运量在月尺度上都具有上升趋势,1990 年1 月—2020 年1 月全国铁路月尺度客运量变化趋势如图1 所示。根据趋势线可以看出,全国铁路客运量近30 年呈上升趋势,客运量不断增加,其上升速率0. 0002/月,线性拟合R2=0.722,模型拟合较好。1990 年—2020 年我国铁路客运量年平均增长率4.6%,“十三五(2016—2020 年)”以来随着铁路系统的完善,客运量的平均增长率达8.9%。从近期发展环境看,我国客运网络仍在逐步完善,随着人口的不断迁移,铁路客运量仍将继续上升,维持稳中有进的发展趋势。

图1 1990年1月—2020年1月全国铁路月尺度客运量变化趋势Fig.1 Variation trend of monthly national railway passenger volume from January 1990 to January 2020

2.2 铁路客运量周期特征分析

在周期分析阶段,运用小波分析法,分析2015—2019年数据的周期特征。铁路客运量月尺度小波分析如图2所示。由图2a可知,振荡能量明显的时间尺度有3~6 月、7~11 月、13~22 月、52~61 月。52~61 月特征尺度的振荡能量强,变化周期明显;13~22 月特征尺度的振荡能量变弱,变化周期变弱;7~11 月尺度能量强度和周期分布表现次之;3~6 月特征尺度能量最弱,总体上变化周期稳定。由图2b可知,我国铁路客运量在月尺度上存在4 个明显峰值,分别对应5,9,18和56月尺度,其中第1峰值为56 月尺度,为第1 主周期;第2,3 峰值出现在18,9 月尺度,分别为第2,3 主周期;第4 峰值为5月尺度,振荡最弱,为第4主周期。

图2 铁路客运量月尺度小波分析Fig.2 Monthly wavelet analysis of railway passenger volume

根据小波方差,绘制4 个主周期小波系数随时间变化的过程,铁路客运量月尺度主周期叠加趋势如图3 所示。在5 月特征尺度上,变化的平均周期为3个月左右,大约经历了20个变化周期;在9月特征尺度上,平均变化周期为6 个月左右,大约经历了10 个变化周期;在18 月特征尺度上,平均变化周期为12个月左右,大约经历了5个变化周期;在56月特征尺度上,经历周期变化较少,约2个变化周期,周期为30 个月左右。根据小波系数变化可以判别出在不同时段各尺度影响周期变化的强度,可以看出5 月尺度前期表现为较低能量平稳振荡,中期强度部分上升随之下降,之后又上升维持稳定的变化趋势;9 月尺度、18 月尺度前期变化幅度较小,后期有加强的变化;56 月尺度则呈现下降趋势。总体上,叠加周期趋势与实际变化基本符合,主周期以5,9,18 和56 月尺度为主。由于主要考虑主周期的小波系数叠加周期,但还会出现不同时期的其他周期,忽略了其他相对较小时间尺度的振荡周期,因而周期实际振荡出现部分偏差。综上所述,我国客运量在月尺度上具有明显的周期性。

图3 铁路客运量月尺度主周期叠加趋势Fig.3 Superposition trend of monthly main period of railway passenger volume

3 实证分析

根据对原始序列的趋势分析,可以看出其整体的变化过程波动较大,非线性、非平稳性和趋势性显著,需要对序列进行分解,得到波动性较小的分量序列进行预测。CNN-LSTM具有特征提取能力,可以挖掘特征向量,使用该模型可以较好地提取原始序列的趋势、周期特征,从而提升预测性能。将该数据集的前80%划分为训练集,后20%划分为预测集。在训练过程中使得模型能够更快地让参数趋于收敛,提高预测精度,并对预测时所需的数据进行归一化处理。为评估模型预测效果,采用均方根误差(RMSE)、平均绝对百分比误差(MAPE)和平均绝对值误差(MAE)评价指标来衡量。

3.1 铁路客运量序列分解及重构

由于数据随机性较高,为提高预测精度,需要将全国铁路客运量数据进行分解,采用EMD 分解算法对其进行进一步的平稳化处理。EMD 分解余量信号图如图4所示。由图4可知,利用EMD算法对原始序列进行分解,将其从高频到低频逐级分解为5个固有模态分量和1个残差分量,各分量数据相较于最初数据,其振动周期逐渐增加、波动趋势逐渐平缓,平稳性明显优化。5个固有模态分量分别反映不同影响因素在不同尺度下对波动量数据的影响,残差分量则表示波动量序列的长期变化趋势。

图4 EMD分解余量信号图Fig.4 EMD margin signal

为评估EMD 分解后的数据是否会造成原始序列信息的丢失,将原始序列与EMD 分解所得分量进行重构误差分析,原始序列与EMD 分量重构误差如图5所示。由图5可知,通过求解分解后各分量与余量的重构误差,得到平均误差为-2.102×10-15,分解损失量较小,EMD 算法在保留原始信息的情况下,降低了原始数据的复杂度。数据经过EMD分解后得到5 个分量,对逐个分量进行预测,预测过程中每个分量都会产生预测误差,分量越多会导致产生的误差越大,最后在叠加预测结果时,所得累积的误差就越大,对预测结果的精度产生影响。因此,为了更准确地对铁路客运序列进行分析和预测,减少预测模型的计算规模,增强模型的预测性能,对分解得到的各分量依据样本熵值进行重构处理。

EMD分解所得各分量样本熵值如表1所示。通过综合比较各分量波动的相似性、样本熵值的相近程度对各分量进行重构,使用预测模型对各重构分量进行预测,达到提升预测精度的效果。IMF1,IMF2,IMF3 和IMF4 分量样本熵值较大,表明分量的随机性较强,且随时间的变化波动较大,反映了气候等外界随机因素对铁路客运量的影响,因此将IMF1,IMF2,IMF3,IMF4 分量重构为高频序列;IMF5和Res分量波动频率依次减弱,表明分量受外界随机影响较小,随时间波动较为平缓,因而将IMF5 和Res 分量重构为低频序列。各分量重构序列图如图6所示,数据的随机性明显降低。

表1 EMD分解所得各分量样本熵值Tab.1 Sample entropy of each component obtained by EMD

3.2 LSTM和CNN网络层数选取

对于数据量不大的数据集,如果设计的网络模型过于复杂容易导致过拟合现象。为验证提出的EMD-CNN-LSTM组合模型对各分量的预测,对其重构分量进行仿真计算。分别对CNN和LSTM参数进行固定,之后将CNN 和LSTM 网络层数的选取做出调整,通过计算RMSE 的大小评估预测效果,CNN-LSTM 层数选取结果如表2 所示。在CNN 和LSTM 层数取2 和1 时,预测效果MAE 和RMSE 达到最小且模型不存在过拟合现象。因此,将CNN层数定为2层、LSTM层数定为1层。

表2 CNN-LSTM层数选取结果Tab.2 Selection results of CNN-LSTM layers

3.3 基于组合模型的铁路客运量预测研究

应用CNN-LSTM 组合模型,预测分解重构所得的高频序列及低频序列。为验证模型预测效果,选用测试集数据预测分析我国铁路客运量,各分解重构序列预测结果如图7 所示,各分解重构序列预测绝对误差如表3所示。

表3 各分解重构序列预测预测绝对误差Tab.3 Absolute prediction errors of each decomposition and reconstruction sequence

图7 各分解重构序列预测结果Fig.7 Prediction results of each decomposition and reconstruction sequence

由图7 和表3 可知,各分量序列预测曲线与实际曲线拟合优度较好,平均绝对误差在0. 2045~0. 1869区间变化,维持在较低水平。最后,将各分量序列的预测结果进行叠加,得到最终铁路客运量的预测结果。EMD-CNN-LSTM 模型预测结果如图8所示。由图8可知,最终预测值曲线与原始序列曲线较为接近。通过计算预测值与原始序列之间的绝对误差与相对误差可知,其绝对误差在0. 0008~0. 6755 之间,平均绝对误差为0. 2545,误差较小,模型具有较高的可行性。

图8 EMD-CNN-LSTM模型预测结果Fig.8 Prediction results of EMD-CNN-LSTM model

3.4 预测模型比较分析

运用EMD-CNN-LSTM,CNN-LSTM,LSTM,随机森林,GBDT,XGBoost 6 种模型预测我国铁路客运量,得到预测结果。不同模型的预测结果比较如图9 所示。并依据RMSE,MAE 以及MAPE 3 种评价指标,分析EMD-CNN-LSTM 组合模型的预测优势,各模型预测结果精度评价如表4所示。

图9 不同模型的预测结果比较Fig.9 Comparison of prediction results of different models

由图9 可知,与其他模型相比,EMD-CNNLSTM 组合模型所得的预测结果与原始序列更为接近,预测效果更好。由表4 可知,EMD-CNNLSTM 组合模型的精度优于其他模型,通过比较EMD-CNN-LSTM和CNN-LSTM,RMSE下降24.3%,MAE下降7.4%,MAPE下降14.3%,由此可知序列的分解提高了预测结果的有效性;通过比较EMDCNN-LSTM,CNN-LSTM,LSTM,随机森林,GBDT,XGBoost 模型,RMSE,MAE,MAPE 均有明显下降,由此可知EMD-CNN-LSTM 模型所得到的预测结果有效性更好,在预测过程中,对数据进行分解实现数据的深度平稳化是提高预测精度的关键因素之一。

4 研究结论

为了解决铁路客运量数据强随机性及不平稳性对预测精度的影响问题,提出一种基于数据分解的铁路客运量组合预测模型。基于EMD 分解方法,分解处理原始数据序列,得到弱波动、较平稳的分量,并为减少预测误差使用样本熵对分量进行重构;针对各分量序列,采用CNN-LSTM 组合模型进行预测,并将各分量预测结果叠加得出最终预测结果。研究结论如下。

(1)在分析我国月尺度铁路客运量特征过程中,发现客运量具有明显的趋势性及周期性。根据对我国铁路客运量的特征分析,考虑到时间序列的强随机性,使用EMD 分解算法对原始数据序列进行分解,优化数据的平稳性,提高预测结果的准确性。

(2)使用样本熵对过多分量进行重新合并,减少多分量预测合并时的累计误差,将分量传送至CNN-LSTM 组合模型中,该模型可以较好地捕捉数据的长期特征,使得预测更为精准。结果表明,EMD-CNN-LSTM组合模型预测值与真实值的误差较小,验证了模型具有较高的可行性。

(3) 比较EMD-CNN-LSTM, CNN-LSTM,LSTM,随机森林,GBDT,XGBoost 模型预测结果,证实EMD-CNN-LSTM 组合模型的预测效果优于其他模型。在预测过程中,对数据进行分解实现数据的深度平稳化是提高预测精度的关键因素。

(4)受客观条件所限,一些与铁路客运量相关的影响因素(如气候、票价等)尚未考虑在内,也是影响铁路客运量预测精度的因素之一,未来可以进行探究。

猜你喜欢

客运量尺度分量
交通运输部:3 月城市轨道交通客运量环比增长16.6%
帽子的分量
财产的五大尺度和五重应对
2018年北京市城市公共交通运行特征分析
2018年北京市轨道交通运行特征分析
论《哈姆雷特》中良心的分量
分量
宇宙的尺度
9
基于瞬时对称分量法的三相四线制D-STATCOM控制研究