基于MI-Granger-NARX融合模型的铁路网规模测算方法

2021-02-03钱名军李引珍何瑞春曾海军

铁道学报 2021年1期

钱名军，李引珍，何瑞春，曾海军

(1.兰州交通大学交通运输学院，甘肃兰州 730070；2.宁波轨道交通集团运营分公司，浙江宁波 315101)

作为国民经济大动脉、关键基础设施的铁路交通系统，是我国现代化综合交通运输体系的重要骨干和实现“交通强国”战略的主要力量，其建设规模和发展质量将对国家的经济社会乃至资源生态环境等产生重要影响。因此，为更好地发挥铁路对经济、社会持续健康发展的促进和先导作用，切实提高铁路网规划建设的科学性和前瞻性，需要我们从广阔的视角和长远的战略来探究铁路网发展规律，研究铁路网建设规模问题，进而为铁路交通部门制定科学合理的铁路网中长期发展规划和年度铁路建设计划提供科学决策依据，以实现铁路建设资金的有效投入、铁路网络系统的健康发展。

一个国家的铁路网发展规模和建设进程除了有其自身内在的形成及演化机理和运行机制外，在很大程度上还受到人口和资源数量及分布、经济社会发展、交通运输政策等外部因素的影响。这些因素与铁路系统相互作用、彼此影响，形成了一个复杂巨系统。这使得铁路网规模测算成了一个系统而复杂的难题，难以建立准确的解析数学模型。

目前，交通网里程规模的测算方法主要有统计模型法[1]、运输需求分析法[2-4]、类比研究法[5]、网络分析法[6-8]、BP神经网络模型[9]等。文献[1]构建了铁路网密度与人口密度、人均GDP之间的宏观规模需求统计模型，并针对地理环境、产业结构、政策偏好等影响因素设计了依赖-偏好指数对模型进行修正。文献[2]针对城市轨道交通线网规模需求的梯度效应、弹性效应等，结合城市经济承受力、环境资源容量等外部约束，给出了相应的轨道交通规模匡算模式。文献[5]从路网密度、运输负荷、网距和路网强度4个方面将我国铁路网与典型国家铁路网进行类比研究，以此来推断我国铁路网的适宜规模。文献[6]根据中国铁路网的层级结构特点，综合采用连通度法和GIS技术来测算铁路网总规模。文献[9]通过对公路网规模影响因素的分析，建立了基于BP神经网络的公路网规模预测模型。这些测算方法的适应性、实用性和测算精度不一而足，选取的研究指标差异较大，大多仅凭经验或定性分析即决定影响变量的取舍，未作科学的论证筛选，且主要侧重于终极稳态下的路网总里程规模测算,而对社会经济系统与铁路网规模的协同匹配关系与时序演进规律考虑较少，无法根据某一具体年度或相应时期的经济社会发展指标对铁路网建设的合理规模进行准确测算。

实际上，由图1可知，近20多年来，随着经济的持续发展和社会的稳定繁荣，我国的铁路网里程规模与人口密度、人均GDP、社会消费品零售总额、居民消费水平、全社会客货运量、铁路运输业固定资产投资等指标变量的时序变化趋势，尽管短期变化方向、波动幅度不尽一致，但长期趋势密切相关。

图1 1993—2019年铁路网里程与相关变量的时序变化趋势

基于此，本文在综合分析铁路网规模内外部影响因素的基础上，首先，运用互信息(Mutual Information，MI)理论和Granger因果关系检验对12项初选指标变量进行筛选，得到对铁路网里程规模影响力度最大、解释能力最强的7个变量。然后，引入具有动态反馈调节和延迟单元、带外部输入的非线性自回归神经网络(Nonlinear Auto-Regressive Models with Exogenous Inputs Neural Network，NARX)建立铁路网规模测算模型，以筛选所得7个指标变量作为NARX网络的自变量输入，铁路网里程序列作为自回归因变量输入，来测算铁路网里程规模。最后，通过算例验证了本方法的有效性和测算精度。

1 相关性理论与NARX原理

1.1 多元变量相关性理论

(1)互信息理论

作为多变量相关性分析方法，互信息法从信息论角度出发，运用“熵”的概念来量化测度变量间共有信息的多少，以反映变量间相互依赖的强弱程度[10]。与典型相关性分析方法要求变量数据均服从正态分布且只能测度线性相关关系相比，互信息为无参数估计法，对变量数据的分布类型没有特殊要求，既能准确刻画线性相关关系，又能有效捕捉非线性相关关系。因此，适用于铁路网非线性系统的特征变量筛选。

定义1：设离散型随机变量X，概率分布为p(x)，则度量其信息含量(信息结构、不确定性等)的信息熵为

(1)

定义2：若离散型随机变量X、Y的边缘概率分布和联合概率分布分别为p(x)、p(y)和p(x,y)，则已知X条件下Y的条件熵为

(2)

已知Y条件下X的条件熵为

(3)

(X,Y)的二维联合熵为

(4)

定义3：联合概率分布p(x,y)与边缘概率分布p(x)、p(y)的相对熵即为互信息I(X,Y)

(5)

当两变量相关性越大、相互依赖程度越高，所包含的共同信息也越多，互信息值I(X,Y)越大。反之，当变量X和Y完全无关或相互独立时，意味着两变量间不存在共同信息，互信息的结果最小为0。

(2)Granger动态因果关系检验

Granger因果关系检验用于经济变量间动态相关关系的量化分析[11]。它假设每个相关变量的预测信息都包含在其时间序列中，常用于检验一个变量是否对另一个变量具有解释、预测能力。

对于同阶单整的平稳时间序列Xt、Yt，Granger因果检验要求估计以下广义回归模型：

无约束回归模型：

(6)

有约束回归模型：

(7)

式中：Yt、Yt-j分别为被解释变量的当期值和j期滞后值；Xt-i为解释变量的滞后i期值；ai、βj、λj为回归系数；m、n、p为对应变量的最大滞后期；μ1 t、μ2 t为误差项。

通过构造上述方程的F统计量即可实现Granger检验[12]。利用式(6)、式(7)分别进行包含与不包含外生变量X滞后项的最小二乘回归，得相应残差平方和记为URSS、RRSS，则对应的F统计量为

(8)

式中：n为X的滞后项个数；N为样本容量。

如果F值大于给定显著水平下响应临界值Fα(n,N-2n-1)，则拒绝原假设，即认为“变量X是变量Y的Granger原因”，也说明变量X的过去值有能力解释、预测变量Y的值。反之，则接受“变量X不是变量Y的Granger原因”的原假设，即变量X对变量Y的变化没有解释、预测能力。

1.2 NARX原理

带外部输入的NARX是一种动态递归神经网络。相较于静态、无反馈的前馈神经网络如BP网络，NARX网络具有反馈结构和延迟单元，不仅考虑了外部输入对输出产生的影响，而且通过延迟单元将输出反馈也引入到静态多层感知器，使输出层能实时地将包含历史信息的输出数据反馈到输入层，参与下一次的迭代训练，从而使网络具有动态记忆性且系统信息保留更加完整，提高了模型的学习能力和预测精度[13-14]。同时，其收敛速度和学习效率也优于BP网络和全回归网络[15]。

(1)NARX的神经网络结构

本文采用的NARX网络为多输入单输出结构，主要由输入层、隐含层、输出层和输入、输出延迟单元构成，模型结构见图2。

图2 NARX动态神经网络结构图

模型方程为

(9)

式中：fh、fo分别为训练得到的隐含层、输出层非线性映射函数；bh、bo分别为隐含层、输出层阈值；dx、dy分别为输入、输出延迟阶数；M为网络隐含层神经元数；Wh,i、Wh,j、Wh,o分别为输入层与隐含层、反馈连接与隐含层、隐含层与输出层之间的权重系数；y(t)为t时刻神经网络的预测输出值，y(t-j)，(j=1,2,…,dy)为t-j时刻系统的输出值；xk(t-i)，(k=1,2，…,p;i=1,2,…,dx)为神经网络第k个外部输入变量序列在t-i时刻的输入值，p为外部输入变量序列维数。

(2)NARX神经网络参数确定

运用NARX模型进行测算时，确定其隐含层的神经元个数和模型的输入、输出延迟阶数是关键。

①隐含层神经元数M

隐含层神经元个数决定了所建模型的复杂程度。隐含层神经元个数为

(10)

式中：M为隐含层神经元个数；I为输入层神经元个数；O为输出层神经元个数;a为0到10之间的常数。

②输入、输出延迟阶数d

延迟阶数表示当前输出值会受到前几期输入值的影响。采用AIC(Akaike’s Information Criterion)准则确定，表达式为

AIC(d)=lnA+2d/N

(11)

综上，NARX网络兼具时间序列回归模型和非线性动态神经网络的优点，非常适合结构复杂的非线性、时变系统的时间序列预测建模，日益成为非线性动态系统中应用广泛的一种神经网络。

2 铁路网规模主要影响因素的相关性分析

2.1 铁路网规模主要影响因素的定性分析

研究表明，影响铁路网规模的因素众多，可归纳为外部因素和内部因素两大类。外部因素涉及自然地理、经济社会和交通政策等方面，内部因素涉及铁路系统自身的运营技术和组织效率等方面。

(1)自然地理因素

自然地理包括国土面积、人口与资源数量及分布。国土面积越大、人口与资源数量越多、分布越广，则一定程度上需要规划更大规模的铁路网才能满足需求，以实现交通路网合理布局。

(2)经济社会因素

经济、社会的发展规模和质量直接影响铁路客货运输需求，进而决定铁路网的建设规模。伴随经济的繁荣、社会的发展，GDP、社会消费品零售总额、居民年均消费水平等指标逐步增长，带动越来越多的人员、物资等生产要素的流动、聚合形成更大的客货运量，进而推动铁路网规模有序扩张，以改善交通运输环境、提高运输服务质量。

所以，当铁路网规模与经济、社会发展阶段匹配适度时，不仅能满足当前国民经济发展的现实需求，还能激发或吸引潜在的客货运输需求，对经济、社会发展具有明显的推动和先导性作用。当铁路网规模与经济、社会发展匹配失度时，建设过于超前易造成路网设备设施利用率低下、浪费国家投资，建设过于滞后则易导致路网通行能力无法满足现实需求、制约经济持续健康发展。可见，铁路网规模与经济、社会发展之间存在相互促进、彼此制约的相互关系。

(3)交通政策因素

交通政策主要表现为对相应交通运输方式的固定资产投资额。对铁路运输业的固定资产投资额度直接影响铁路网基础设施的建设规模、发展质量，并最终影响到客货运量结构、运输市场份额等。

(4)运输技术和组织管理因素

运输技术和组织管理包括铁路运输密度、货车周转时间、货车平均静载重等指标。运输密度是一定时期客货运周转量与其路网里程的比值，是衡量运能与运量匹配适应程度的指标。为确保运输密度在合理范围，铁路网里程规模需求与运量匹配适度。货车周转时间指货车每完成一次周转所平均消耗的时间，是反映日常运营组织效率的指标。货车周转时间越小，则机车车辆周转速度越快，运输组织效率越高，完成相同的运输量需要的铁路网规模就越小。货车平均静载重是反映货车在装车或重车状态下标记载重量利用率的重要指标。它不仅受车种型号、车辆构造及所运货物的性质尺寸、包装状况等影响，还与铁路部门的货物装载技术方法密切相关，是评价货运组织质量优劣的重要指标之一。该值越大，则完成相同运量需要的货车数量越少，即单位里程的运输能力和效率越大，需要的铁路网里程就越少。

因此，本文综合现有研究成果[4-6,8]并考虑指标数据的可得性、代表性和完备性，初步选取人口密度、人均GDP、社会消费品零售总额、居民年均消费水平、全社会货运量、全社会客运量、货物周转量、旅客周转量、铁路运输业固定资产投资、铁路运输密度、货车周转时间、货车平均静载重共12项指标作为影响铁路网里程规模的内外部因素的表征指标集，见表1。

表1 影响铁路网规模的内、外部因素

在不同的经济、社会发展阶段，上述因素共同作用决定了当时及未来一段时期的铁路网适宜规模。

2.2 影响因素的互信息相关性分析

为检验上述基于定性分析所选取的12项影响因素与铁路网里程规模的相关性强弱，以1993—2019年的相关数据序列为研究样本，利用式(5)求出各影响因素与铁路网总里程和普速铁路里程的互信息值，见表2。其中“普速铁路里程=铁路网总里程-高速铁路里程”(我国自2008年起才有真正意义上的高速铁路里程统计数据，在此之前按0公里计算)。

表2 各变量互信息值

由表2可知，人口密度、人均GDP、社会消费品零售总额、居民年均消费水平、全社会货运量、货物周转量、旅客周转量、铁路运输业固定资产投资、货车平均静载重这9项指标变量与铁路网总里程及普速铁路里程的互信息值均高于0.8，从统计学意义上认为其对铁路网规模的影响力度极大、相关性极强。而全社会客运量、铁路运输密度和货车周转时间这3项指标与铁路网里程的互信息值均低于0.6，从统计学意义上认为其对铁路网规模的影响力较弱、关联性较低，可直接从初始指标集中予以剔除。同时，全社会货运量与货物周转量均为全社会货运规模的表征指标，彼此间的相关性达0.989 9，为避免输入变量的高自相关性出现过拟合而影响模型测算精度，本文保留与铁路网规模相关性更高的全社会货运量指标，而剔除相关性略低的货物周转量指标。

至此，影响因素变量由原来的12个约简为8个：X1为人口密度；X2为人均GDP；X3为社会消费品零售总额；X4为居民年均消费水平；X5为全社会货运量；X6为旅客周转量；X7为铁路运输业固定资产投资；X8为货车平均静载重。这在一定程度上去除了输入变量中的冗余信息、降低了变量维度，可避免出现过拟合现象。

2.3 影响因素的Granger因果关系检验

为确保基于互信息法所筛选变量对铁路网规模的解释、预测力度，提高测算模型的稳定性、收敛效果和泛化能力，需对8个变量再进行Granger因果关系检验。

(1)变量序列平稳性检验

为消除不同序列量纲单位和异方差的影响，又不改变数据间的协整关系，需对各变量序列进行自然对数标准化处理。

为防止伪回归现象，进行Granger检验前，先用ADF单位根检验法对各变量序列进行平稳性检验。ADF检验表明，因变量铁路网总里程的对数序列LYz、普速铁路里程的对数序列LYp和8个解释变量的对数序列LXi(i=1,2,…,8)均不同程度具有趋势项或截距项，接受存在单位根的原假设，即原变量对数序列都是非平稳序列。而各变量所对应的一阶差分序列ΔLYz、ΔLYp、ΔLXi(i=1,2,…,8)经ADF检验，均拒绝存在单位根的原假设，呈现出较好的平稳性，其一阶差分序列的ADF检验结果见表3。

表3 各变量一阶差分序列的ADF检验结果

由表3可知，因变量Yj(j=z,p)和解释变量Xi(i=1,2,…,8)的一阶差分序列对应的ADF检验统计量均至少小于5%的显著性水平临界值，其接受存在单位根的相伴概率均低于5%，也就是说至少在95%的置信度水平下各一阶差分序列均拒绝存在单位根的原假设，表明各差分序列的平稳性良好，满足协整检验条件。

(2)Johansen协整检验

协整检验是用于判断铁路网规模变量Yj(j=z,p)与其解释变量Xi(i=1,2,…,8)是否存在长期稳定的均衡关系[16]。因涉及3个及以上变量的协整分析，故采用Johansen协整检验法，且该方法包含了迹检验和最大特征值检验两种方法，可使结论更稳健。依据最小AIC准则，选取最佳滞后阶数为2。协整检验结果见表4、表5。

从表4、表5可见，Johansen协整检验的两个对应结果均显示，各原假设的检验统计量都明显大于其5%显著水平下的临界值，且接受原假设的概率都小于0.05，这表明协整方程的个数不止7个而至少有8个。因此，验证了铁路网规模变量Yj(j=z,p)与人口密度X1、人均GDPX2等8个解释变量均存在长期稳定的协整关系，具备进行Granger因果关系检验的条件。

(3)Granger因果关系检验

为避免Granger因果关系检验受变量平稳程度或样本容量长度的影响，本文针对铁路网规模变量Yj(j=z,p)与解释变量Xi(i=1,2,…,8)的相互关系进行了1～6阶滞后期的Granger检验，以排除滞后期敏感性对检验结果的影响。限于篇幅分别只列出了滞后1～3期的检验结果，见表6、表7。

表4 总里程与解释变量的Johansen协整检验结果

表5 普速铁路里程与解释变量的Johansen协整检验结果

表6 总里程与解释变量间的Granger因果关系检验

从表6、表7可见，在90%的置信度水平下，除了人口密度X1连续6期的检验结果均不同程度接受了“不是铁路网总里程LYz和普速铁路里程LYp的Granger原因”的原假设外，其余7个变量均显著拒绝了“不是铁路网总里程LYz和普速铁路里程LYp的Granger原因”的原假设。这表明人口密度X1很大程度上并不是推动铁路网里程规模Yj(j=z,p)增长的Granger原因，而人均GDP、社会消费品零售总额、居民年均消费水平、全社会货运量、旅客周转量、铁路运输业固定资产投资和货车平均静载重等7个变量的增长才是推动铁路网里程增长的Granger原因。

通过进一步的Granger因果关系检验，筛选出了对铁路网里程规模最具解释力的7个变量，有力支撑了模型输入变量选取的科学合理性。

表7 普速铁路里程与解释变量间的Granger因果关系检验

3 测算实例

3.1 数据来源及预处理

文中铁路网里程、年度总人口、GDP、社会消费品零售总额、居民年均消费水平、全社会货物运输量、全社会旅客运输量、货物周转量、旅客周转量、铁路运输业固定资产投资、全国铁路客货运总换算周转量、货车周转时间、货车平均静载重等统计指标数据，分别是从国家统计局官网、《铁道统计公报》(2000—2019年)和《铁路运输生产建设统计公报》(1993—1999年)中提取整理得到。

根据研究需要，将各序列按照85%、15%的比例划分为训练集和测试集，并按模型对输入数据的格式要求进行元胞化转换。

3.2 NARX神经网络训练

将经过Granger动态因果检验的7个解释变量序列Xi(i=2,3，…,8)作为外部输入项，将铁路网规模变量Yj(j=z,p)分别作为自回归输入项，运用MatlabR2017b构建NARX网络模型。根据式(10)、式(11)计算得出神经元个数和延迟阶数，并结合程序运行效果，综合确定隐含层神经元个数为12，输入、输出延迟阶数为2。为提高模型测算精度、泛化性能，先用开环(Open-loop)结构，采用以网络权值平方和与误差平方和加权值作为性能评价函数的贝叶斯正则化算法(Bayesian Regularization，BR)来训练网络，训练精度设置为10-3，最大迭代次数为1 000次。

图3为铁路网总里程Yz的NARX测算模型迭代训练效果图，共循环迭代163步后训练停止，迭代至第63步时即达到稳定效果，此时整个数据集的均方误差为0.007 5。

图3 NARX网络训练效果图

图4为3个对应数据集的线性回归系数拟合优度。可见拟合优度值R都非常接近1，表明预测值与目标值高度吻合，模型具有良好的泛化能力和预测性能。

图4 模型回归系数拟合优度

图5 预测效果误差图

图5为NARX网络预测效果误差图，其中竖直方向的黄色线段表示预测值与实际值的误差，该线段越少、越短即表示网络预测效果越好。由图5可见，预测值与实际值误差很小，最大误差不超过0.2，表明此NARX动态神经网络的预测精度较高，适用于铁路网里程规模的准确测算。

图6为NARX网络预测误差自相关图，其值在滞后阶数为0时应该最大，其他情况以不超过95%的置信区间为最佳。由图6可见，误差自相关系数除0阶以外，其他阶数的值都在置信区间以内且近乎为0。说明该模型各延迟阶数的预测误差是彼此独立、非线性、不相关的，证明模型的预测性能良好。

表8 4种神经网络模型的测算性能对比

图6 模型误差自相关图

综上，可以判断所构建的NARX神经网络模型达到了预期效果，可用于铁路网里程规模的测算。

3.3 测算性能检验

(1)平均绝对百分误差δMAPE

(12)

(13)

将训练好的MI-Granger-NARX融合模型调成闭环结构(Close-loop)对2017—2019年的铁路网总里程进行测算，并与其他3种神经网络测算结果和相应年度的铁路网总里程实际数据进行对比，见表8。

同时，根据本模型可以测算出2020年底我国铁路网总里程规模将达到14.63万km，其中普速铁路里程为10.73万km、高速铁路里程为3.90万km。也就是说，我国铁路网建设进程若不因当前宏观发展趋势的波动而出现重大调整，则2020年度我国将新增约0.65万km铁路线路，其中高铁新增约0.40万km。这与2016年版《中长期铁路网规划》中“到2020 年，铁路网规模达到15万km”的规划目标非常接近。从国民经济发展状态及趋势来看，目前我国普速铁路发展基本协调，高速铁路发展较为迅速。未来我国普速铁路、高速铁路均还有一定的发展空间，但都应确保与国民经济发展需求相适应、相匹配。

4 结论

(1)影响我国铁路网里程规模的因素众多，但起决定作用的因素主要是人均GDP、社会消费品零售总额、居民年均消费水平、全社会货运量、旅客周转量、铁路运输业固定资产投资和货车平均静载重等7项指标。

(2)互信息法和Granger因果关系检验作为统计意义上的相关性量化检验方法，其结果对铁路网规模测算变量的筛选有重要作用，可使模型输入变量解释能力更强、测算方法更具稳健性和科学性。

(3)将带外部输入的非线性自回归神经网络NARX用于铁路网规模测算是可行的，模型较传统神经网络泛化能力更好、测算结果精度更高。

基于MI-Granger-NARX融合模型的铁路网规模测算方法，综合吸纳了人均GDP、居民消费水平、全社会货运量等对铁路网规模影响力度最大、解释能力最强的经济、社会发展和运输需求诸多指标作为输入变量，同时考虑了复杂系统的延迟效应。不仅能根据当前的经济、社会和行业发展数量、质量指标测算出下一年的铁路网规模，为年度铁路网建设计划确定合理可行的执行方案；还能根据中远期经济、社会和行业发展的预期数据，测算出相应时期的铁路网适宜规模，为中长期铁路网规划提供科学有效的决策参考。