APP下载

基于多影响因素融合的中欧班列开行数量预测

2023-10-20

铁道运输与经济 2023年10期
关键词:成渝中欧班列

王 瑶

(中国铁道科学研究院集团有限公司 运输及经济研究所,北京 100081)

0 引言

中欧班列是“一带一路”倡议的重要载体,是贯通国内国际2 个市场、促进国内国际双循环的有效手段。近些年,中欧班列开行数量大幅增长,2022年中欧班列开行1.6万列、发送量160万TEU,同比分别增长9%、10%,回程占比46.4%。中欧班列覆盖范围广泛,已开通88 条线路,通达欧洲20多个国家、超过200 个城市,形成稳定的运营格局。中欧班列货物品类不断扩大,包括电子产品、机械设备、化工产品、木材纸浆、服装鞋帽、粮食、葡萄酒、咖啡豆、冷鲜食品、医药和医疗设备等,涵盖沿线国家人民生产生活的多个方面[1-3]。中欧班列涉及多国跨境运输,除运输政策影响,还受经济、市场需求、自身服务质量等多因素综合驱动,梳理各因素因果关系,构建更具解释能力的多因素融合预测模型,预判中欧班列开行发展趋势及增长空间,为中欧班列方案编制、运营管理、市场费用优化等提供决策支撑[4-6]。

在预测方法方面,货运量预测多采用基于大量历史数据的趋势外推预测法,不适用中欧班列货运发展时间短、影响因素多、波动性强等现状。货运量预测另一种常用方法是影响因素法,通过定量分析各因素变量对货运量因变量的影响程度,在微观层面构建变量反馈关系,从而对预测货运发展趋势具备较好的解释能力[7-8]。如冯芬玲等[9]融入进口额、农业增加值、工业增加值、GDP等因素,运用IPSO-Capsule-NN 模型预测中欧班列出口需求量;杨静莹等[10]研究基本运价、口岸投资力度等因素,构建内陆港与沿海港反馈系统动力学模型,预测蓉欧快铁运量走势;WANG 等[11]研究国民经济增长率、铁路固定资产投资水平等变量与铁路快运市场供需的关系,分析铁路快运系统供需情况;刘畅等[12]研究政策条件、综合运输费用及全程送达时间等因素,构建逻辑斯蒂模型,预测中欧班列开行数量。

在预测精度方面,既有研究大多通过数据深度挖掘、优化人工智能算法,来提高运量预测精确性。邵梦汝等[13]构建灰色神经网络组合模型,提高铁路货运量预测的模拟性能和预测精确度;雷定猷等[14]提出基于非线性主成分分析和遗传算法优化的径向基函数神经网络的交通量预测方法,有效提高交通量的预测精度。神经网络模型在学习能力上具有显著的优势,能准确寻找影响因素与实际输出之间的关系,较好地学习模拟实际数据走势,根据数据波动及时调整,但往往在搜索全局最优值时存在过拟合问题。

中欧班列开行受贸易环境、运输政策、通道服务等多种要素影响,BP 神经网络模型具有较高的训练速度和非线性映射能力,可构建中欧班列开行数量与相关因素之间映射关系,实现多影响因素融合的中欧班列开行数量预测,但常规BP 神经网络模型求解过程受初始权重和阈值影响,存在收敛速度慢、易陷入局部最优的问题。考虑GA 遗传算法是一种并行随机搜索最优化方法,具有较好的自适应和寻优能力,结合GA 遗传算法在模型收敛和求解特征方面的优势,将BP 神经网络中所有权值和阈值组成种群个体,通过计算个体适应度从全局得到最优个体,对网络初始权值和阈值赋值,提高BP神经网络预测精度。

1 中欧班列开行数量影响因素分析

中欧班列服务对象是跨国贸易,具有路线长、环节多、手续繁杂等特点。运输过程受地区宏观经济、地区国际贸易需求、铁路服务质量等内外部多因素影响。

1.1 对俄罗斯、欧盟地区进出口贸易额

近年来,中欧班列沿线各国与我国进出口贸易额逐年提高对班列开行数量起正向影响作用,是预判中欧班列开行数量的重要宏观指标。近两年,受国际局势影响,2022年中欧贸易额为8 473亿美元,同比增长2.4%;2023年1—5月中欧贸易额为3 317亿美元,同比下降3.7%。目前,俄罗斯对外贸易向东部区域转移,2022年中俄贸易额为1 902.71亿美元,同比增长29.3%;2023年1—6月中俄贸易额为1 145.47亿美元,同比增长40.6%。

对俄罗斯、欧盟地区进出口贸易额不仅影响中欧班列开行数量,还直接影响中欧班列整体结构,目前发往俄罗斯班列运输市场份额高于发往欧盟班列份额。为合理评估参数值,基于班列去向份额权重拟合俄罗斯、欧盟地区的综合进出口贸易额。

1.2 地区生产总值

地区生产总值是衡量国家和地区的经济发展重要指标,反映经济走行态势和阶段性的货物运输规模。对外贸易总额与地区生产总值密切相关,在经济发展平稳形势下,国民生产总值是影响中欧班列开行数量的重要指标。

1.3 运输费用

运输费用是客户选择运输方式的重要影响因素,中欧班列运输费用受政府补贴政策影响较大。近几年地方政府以不同的标准和方式对当地的中欧班列进行补贴,极大地促进了中欧班列发展。随着中欧班列补贴退坡,班列运营将逐步实现市场化,运输费用优势有所减弱,一定程度影响班列开行规模。

1.4 全程运输时间

全程运输时间是高附加值货物品类客户选择运输方式的决定因素。尤其汽车、笔记本电脑及零部件、手机、小家电等高附加值货物品类客户,对运输时间、通关时间、准时送达等全程运输时间提出了较高要求。多年发展证明,运输时间是中欧班列运输市场竞争力的重要体现,能够满足高附加值货物强时效性运输需求。

2 基于GA-BP神经网络的中欧班列开行数量预测模型

中欧班列开行数量受市场需求、班列服务质量等多因素影响,各因素之间存在模糊动态非线性关系,传统的时间序列方法很难融合多因素的复杂影响并做出准确预判。BP 神经网络模型具有较高的训练速度和非线性映射能力,构建中欧班列开行数量与相关因素之间映射关系,实现多影响因素融合的中欧班列开行数量预测,但常规BP 神经网络模型求解过程受初始权重和阈值影响,存在收敛速度慢、易陷入局部最优的问题。考虑GA遗传算法是一种并行随机搜索最优化方法,具有较好的自适应和寻优能力,结合GA 遗传算法在模型收敛和求解特征方面的优势,将BP 神经网络中所有权值和阈值组成种群个体,通过计算个体适应度从全局得到最优个体,对网络初始权值和阈值赋值,提高BP 神经网络预测精度。因此,提出神经网络联合遗传算法(GA-BP 神经网络)的预测方法,以提高中欧班列开行数量的预测精度。

2.1 BP神经网络结构

构建中欧班列开行数量预测模型,首先确定BP神经网络结构,包含输入层、隐含层、输出层,每一层有激活函数和若干节点相连接,其中各神经元具有不同的连接权值和阈值。选取地区生产总值、对俄罗斯、欧盟地区进出口贸易额、运输费用、运输时间4 项指标作为BP 神经网络输入层参数,输入层神经元数取4;选取中欧班列开行数量预测值作为输出层。隐含层节点数对模型预测结果影响很大,一般先采用经验公式计算节点数的可能选择,然后再通过试凑法选择预测误差最小时的隐含层节点数。隐含层神经元数按经验取值,这里取8。BP神经网络结构如图1所示。

图1 BP神经网络结构Fig.1 BP neural network structure

2.2 GA遗传算法优化BP神经网络算法

基于GA 遗传算法优化BP 神经网络,通过GA遗传算法中选择、交叉和变异等操作找到最小适应度值对应个体,从全局得到最优个体作为网络初始值,BP神经网络再利用GA算法确保网络模型设计的初始权值、阈值指标达到最优,然后对模型进行网络训练,并更新权值和阈值,实现模拟预测。

GA 遗传算法优化BP 神经网络算法流程如图2所示。具体步骤包括:①原始数据预处理和相关性计算。对原始数据进行规范化处理,得到可训练数据,运用Pearson 法分析影响因素与中欧班列开行数量相关性,得到可测试数据,确定BP 神经网络输入值。②数据归一化和初始化参数赋值。对数据进行归一化处理,确定神经网络层数、各层节点、训练学习相关参数,确定GA 遗传算法种群规模、迭代次数、遗传变异等参数。③计算个体适应度。通过计算找出种群中的进化最优染色体并进行复制。④操作遗传迭代。根据适应度值进行选择、交叉、变异等进行运算操作,迭代新染色体种群,评估得到最优个体解。⑤GA 遗传算法所得最优解,对BP 神经网络权值和阈值,经网络训练,输入测试数据,预测中欧班列开行数量,判断是否满足精度,输出预测结果,否则返回。

图2 GA遗传算法优化BP神经网络算法流程Fig.2 Optimization of BP neural network algorithm by GA genetic algorithm

3 成渝中欧班列开行数量预测实证分析

成渝中欧班列是由重庆和成都共同创立班列品牌,截至2022 年两地累计开行班列数2.2 万列,占全国中欧班列累计开行量约40%。以成渝中欧班列开行数量预测作为实证案例,选取2011—2022 年班列运营生产数据、国家商务数据中心数据、联合国统计署数据等作为BP 神经网络学习样本,预测2023—2025年班列开行数量。

3.1 模型测算

3.1.1 影响因素相关性

在将影响因素输入BP 神经网络模型前,对地区生产总值、对俄罗斯、欧盟地区进出口贸易额、全程运输时间、运输费用等进行相关性分析,判断相关因素能否与成渝中欧班列开行数量较好拟合,计算得出Pearson 相关系数如表1 所示。结果表明各项相关系数绝对值均在0.9 以上,该4 项影响因素与成渝中欧班列开行数量存在强相关,可作为模型输入值。

表1 影响因素Pearson相关系数Tab.1 Pearson correlation coefficients of influencing factors

3.1.2 原始数据归一化

各影响因素之间的数量级差异较大,将影响网络映射精度和自学习的收敛性,需进行归一化处理,使用线性转换法对各因素原始数据处理,输入向量归一化处理值如表2所示。

表2 输入向量归一化处理值Tab.2 Normalized processing value of input vector

3.1.3 模型参数设置

中欧班列开行数量预测模型包括BP 神经网络参数设置和GA 遗传算法参数设置。基于BP 神经网络结构设计,选择4 个输入神经元、1 个输出神经元,8 个隐含层,误差控制在0.01,学习速度设定为0.1,迭代次数1 000。遗传算法选择预测输出与期望输出的相对差作为各个染色体的适应度值,选择常用的轮盘赌法在已知每个个体适应度值的基础上进行选择,种群规模为10,进化次数为20次,交叉概率为0.7,变异概率为0.1。

3.1.4 模型预测结果对比

输入影响因素数据和成渝中欧班列开行数量历史数据,作为输入样本,BP 神经网络和GA-BP 模型输出班列开行数量拟合预测值。开行数量拟合值与实际值对比如图3所示。2种模型预测值曲线变化趋势与实测值的波动趋势基本一致,仅个别与测试样本数据相差较大,例如2020 年受疫情影响,成渝中欧班列承接海运、空运转移运量,开行数量逆势增长,样本数据波动异常,预测模型拟合值与样本值误差较大。2 种预测模型整体拟合程度较高,BP 模型和GA-BP 模型拟合预测数据平均相对误差分别为8.69%和3.71%,对比平均相对误差,GABP 模型拟合预测值与实际值吻合度更高、测算效果更优。班列开行数量预测模型相对误差对比如图4所示。

图3 开行数量拟合值与实际值对比Fig.3 Comparison of predicted and actual number of trains

图4 BP与GA-BP模型预测结果相对误差对比Fig.4 Comparison of relative errors in prediction results between BP and GA-BP models

基于模型预测结果,成渝中欧班列开行数量呈稳定增长趋势,2023 年、2024 年、2025 年GA-BP模型预测值分别为4 719列、4 996列、5 432列。近几年,成渝两地开展中欧班列深度合作,当地制造产品及货源占比超过80%,回程率、重箱率、本地制造货源率达到较高水平,货源结构、运营线路、运行班列等稳定可靠,保障了未来成渝中欧班列运行总体稳中向好。

3.2 影响因素敏感性分析

为进一步研究各因素变量对中欧班列开行数量发展趋势的影响,扰动影响因素样本数据取值,分析因素变量不同调整幅度下的班列开行数量预测值波动情况。重点分析宏观经济、运输费用、运输时间等因素敏感性变化,考虑成渝地区生产总值较为稳定,在此不做具体分析。

3.2.1 对俄罗斯、欧盟地区进出口贸易额的影响

在其他3 个影响因素取值不变条件下,扰动俄罗斯、欧盟地区加权贸易额取值,分别增减10%,重新拟合测算,贸易额对成渝中欧班列开行数量预测的影响如图5所示。

图5 贸易额变动对开行数量预测的影响Fig.5 Impact of changes in trade volume on prediction of the number of trains

图5表明,当贸易额增减幅度为10%时,班列数量预测值波动幅度在4%以内,结果表明贸易额对班列开行数量具有一定影响,市场经济需求是成渝中欧班列数量增长的诱因,国际进出口贸易快速发展有利于推动班列高速增长。近十年,中欧班列开行数量平均增幅为83%,明显高于对俄罗斯、欧盟地区贸易额平均增幅的6.5%,表明班列开行除受市场需求波动影响,还受其他外界因素影响[15]。

3.2.2 运输费用的影响

随着各地补贴退坡,成渝中欧班列向市场化转型,运输费用逐步恢复正常。为分析成渝中欧班列开行数量对于运费的敏感性,在其他3 个影响因素取值不变条件下,将费用分别提高10%、20%,重新拟合测算,得出运输费用对成渝中欧班列开行数量预测的影响如图6所示。

图6 运输费用变动对成渝中欧班列开行数量预测值的影响Fig.6 Impact of transportation cost on prediction of the number of trains on Chengdu-Chongqing China Railway Express

图6 表明,未来几年成渝中欧班列对运价敏感性较高,若运输费用增加10%,班列开行数量相较原基本值最大降幅在6%左右;若运输费用增加20%,班列开行数量相较原基本值最大降幅在10%左右。在补贴退坡引导下,货运结构不断优化,低附加值货物占比缩小,适箱货源主要以服装鞋帽、汽车整车、机械设备、家具建材、生活用品等高附加值货物为主,对班列运输服务品质要求较高,也可承受运价一定范围上涨。地方政府应结合实际情况,适时调整补贴额度,发挥补贴政策的作用。

3.2.3 全程运输时间的影响

成渝班列高附加值货物客户对时效性非常敏感,更期望缩短全程运输时间,降低长途运输引起的货品贬值风险。目前,重庆、成都班列全程平均运输时间分别为14 d、12.5 d,取算数平均值13.5 d。扰动全程运输时间取值,将全程运输时效平均值分别增减1 d,重新拟合测算,全程运输时间对成渝中欧班列开行数量预测的影响如图7所示。

图7 全程运输时间变动对成渝中欧班列开行数量预测的影响Fig.7 Impact of total transportation time on prediction of the number of trains on Chengdu-Chongqing China Railway Express

图7 表明,成渝中欧班列对运输时间具有较强敏感性,若全程运输时间缩短1 d,班列开行数量相较原基本值增长3%~10%,若运输时限延长1 d,班列开行数量相较原基本值减少7%以内。全程运输时间主要包括班列在途运输时间、口岸站停留时间、运输方式衔接时间等,其中口岸站停留时间占比最大,2022年全国中欧班列开行数量为16 562列,部分口岸站拥堵现象突出,降低了班列运输时效,影响客户体验。为进一步缩短中欧班列运输时限,有待推进设施联通畅通、完善通关流程和机制、拓展中欧班列运输通道径路,提升班列市场竞争力。

3.2.4 运输费用和运输时间综合影响

运营实践表明,中欧班列时效性高于海运、经济性优于空运,是适运高附加值货物的运输产品,综合优化运输费用和时效更具现实意义。扰动运输费用和运输时间取值,一是以运输费用增加10%、运输时间缩短1 d 为测算条件,二是以运输费用增加20%、运输时间缩短2 d 为测算条件,重新拟合测算,运输费用和运输时间变动对班列开行数量预测值的综合影响如图8所示。

图8 运输费用和运输时间变动对班列开行数量预测值的综合影响Fig.8 Impact of transportation cost and time on prediction of the number of trains

由图8 所示,成渝中欧班列具备运输费用和运输时间综合优势,相较原基本值,一定幅度提高运价和缩短运输时间对班列开行数量综合影响幅度均在5%以内。结果表明,班列运输时效性与运输费用两因素相互作用,随着补贴逐年退坡,运输费用虽有一定幅度增长,但全面提升运输时效,仍可保障班列开行数量稳定增长。

4 结论

融合地区生产总值、对俄罗斯、欧盟地区进出口贸易额、运输费用、运输时间4 项因素,构建基于BP神经网络联合GA遗传算法的中欧班列开行数量预测模型,从样本数据拟合结果来看,平均相对误差为3.71%,拟合预测值与实测值变化趋势一致,表明将4项因素作为变量的预测模型合理可行。结合未来宏观经济、政策扶持、运营服务质量等变化情况,研究影响因素变化对班列开行数量的影响,测算结果表明:①扰动俄罗斯、欧盟地区贸易额取值,虽贸易额调整幅度较大,但班列开行数量波动较小,表明中欧班列开行除受运输市场需求直接影响,还受其他因素影响。②扰动运输费用取值,虽运价一定幅度提升,但班列开行数量降幅较小,表明在补贴退坡引导下,成渝班列以高附加值货物为主,可承受运费一定范围上涨。③扰动全程运输时间取值,随运输时间不同取值,班列开行数量波动幅度较大,表明班列开行对运输时间具有较强敏感性,缩短运输时间是提升中欧班列服务质量的有效途径。④综合扰动运价和运到时间,运价一定幅度增加、运输时间缩短,对班列开行数量影响程度有限,表明提高班列运输时效是降低补贴依赖的有效措施。

猜你喜欢

成渝中欧班列
2020中欧数学奥林匹克
第11届中欧数学奥林匹克(2017)
赣州港开通两趟中欧班列
“汉新欧”班列再扩容
В первом квартале 2016 года через КПП Маньчжоули прошли 220 международных грузовых железнодорожных составов
建筑师行迹中欧
成渝双城到同城
基于Shift-share的成渝产业结构效益与竞争力研究
首趟“义新欧”中欧班列抵达义乌
成渝复线璧山段全线贯通