APP下载

基于AIS船舶数据的港口交通流量预测模型研究*

2018-07-26李扬威

交通信息与安全 2018年3期
关键词:交通流量交通流神经网络

李 晋 钟 鸣 李扬威

(1.武汉理工大学能源与动力工程学院 武汉430063;2.武汉理工大学智能交通系统研究中心 武汉430063;3.武汉理工大学国家水运安全工程技术中心 武汉 430063;4.武汉理工大学水路公路交通安全控制与装备教育部工程研究中心 武汉 430063;5.中国交通通信信息中心 北京 100011)

0 引 言

“一带一路”倡议的提出,使中国的海上经济通道战略价值不断提升,港口作为海上交通最重要的节点,价值不言而喻。同时,随着市场对大型、高速船舶的需求不断增加,港口航道上行驶的大型高速船舶越来越多,这在客观上增加了港口交通治理的难度。通过科学预测港口区域交通流量,对于降低港口交通压力,避免海上交通事故,为优化航道规划和改善通航环境,意义重大。

目前对交通流预测的方法主要可以分为4类。第一类是基于统计分析模型的流量预测。该方法是在分析交通流量时间序列变化特性的基础上,运用与之适用性较高的统计分析模型拟合流量变化趋势,进而实现对流量的预测。该方法的应用比较成熟,主要包括历史平均模型、时间序列模型、卡尔曼滤波理论以及非参数回归模型等。第二类是基于非线性理论的流量预测。该方法是在分析交通流量时间序列非线性规律的基础上,借助混沌理论、耗散结构论、自组织理论等非线性系统理论构建对应的预测方法。目前发展较为成熟的预测方法有小波理论、突变理论、混沌理论等。第三类基于组合预测模型的方法。该方法同时采用2种或2种以上的预测方法对流量进行预测,以发挥不同预测方法的优势。第四类基于人工智能模型的流量预测。该方法是结合交通流量时间序列自身的不可控性,将人工智能模型作为训练方法,进而输出交通流量预测值。人工智能模型主要包括神经网络模型,支持向量机模型等。通过梳理发现,各种交通流量预测方法的本质是借助预测算法的某些拟合优势,使之适应交通流量变化机理,进而提高预测精度和效率。聚焦到港口交通流研究方面,预测方法大多都是借鉴道路交通而来,但是由于船舶交通流具有自身的特点,相关研究方法不能简单的复制套用。研究发现,基于组合预测方法和基于人工智能算法的预测模型对于研究船舶交通流预测问题具有广阔的应用前景和实践意义。

目前对船舶数据的采集分析方面的研究较少,主要是数据采样手段无法达到大数据采样的要求。2008年底,国际海事组织(IMO)将AIS技术应用到E-航海战略中,得到很好的应用效果[1],随着相关技术的不断成熟,AIS数据可以实现实时联网等功能,丰富、稳定、准确的AIS信息使得海上交通调查研究这一工作变得更为准确、科学[2-3]。笔者将利用提取天津港区主航道的AIS历史船舶数据,通过对不同交通流预测方法的比较,建立港口交通流预测模型,再根据实时进港船舶数据,对不同模型的结果进行比较验证。

1 港口船舶交通流数据来源

根据港口的功能属性,对研究区域的船舶数据进行分布提取,并研究其关联关系。以天津港进出港主航道为例,将港区主航道分为3个断面,见图1。即断面①港区与1# & 2#锚地之间,断面②1# & 2#锚地与3# & 4#锚地之间,断面③外泊锚地进入主航道。通过3个断面的船舶流量就可以描绘出船舶在主航道上的时空分布规律,并分析出各个时段船舶进出港流量情况,通过对船舶航向的筛选,3个断面可一次判断船舶进出属性,从而为船舶流量预测打下数据基础。

图1 船舶流量统计Fig.1 Vessel traffic flow statistics

在选取断面时的主要考虑因素主要包括航道的平面分布情况[4-5],天津港的主航道由进港和出港航道组成,航道的姿态呈现从西北到东南的分布,进出天津港的船舶主要是通过这个主航道,由于进港航道和出港航道分开并列设置,因此进出港的船舶相互干扰较小;同时也要考虑在航道的两侧分布着几个大小不同的锚地,这些锚地对进出港的船舶影响较大,例如通过断面3的船舶经由主航道驶入天津港时,有可能在锚地3处停留,因此在船舶流量统计时需要考虑这方面的因素。

2 数据获取方法与分析

2.1 数据获取方法

利用“宝船网”(即中国交通通信信息中心运营和服务的基于船舶AIS数据和GIS的船舶位置服务平台)搜集的实时数据和平台工作,对其接口进行开发,通过地理位置标会工具对主航道关联锚地和水域进行区域划定,在某特定区域对连续的某段时间里经过的船舶进行历史轨迹的分析提取,再对船舶信息进行分类和筛选,整理出历史船舶交通流量数据,如根据船舶航向判断其进出港属性,以此筛选进出港船舶交通流,并将数据进行分类,确保导入模型数据类别的准确性。图2为船舶AIS的提取逻辑图。

图2 数据提取逻辑图Fig.2 Data extraction logic

2.2 数据分析

2.2.1 AIS数据质量分析

在实际应用过程中,AIS 动静态信息可能存在一定的误差,包括:船名、船舶长度、MMSI 等;罗经(船首向)误差较大,其中,船长、船首向与船速对统计的结果影响最大。

2.2.2 船舶交通流量

统计流量样例。通过自编软件提取天津港主航道进出港口的船舶流量数据(以2017年N月T日为例),并根据静态信息和动态信息综合比较,剔除错误数据,得到数据见图3。

图3 进出港船舶流量统计Fig.3 Flow statistics of vessel in and out of the port

由图3中可知,从上午9:00开始,进出港口船舶数量开始增加,其中在12:00—13:00,出港数量最多,达到15艘,在11:00—12:00和13:00—14:00进港船舶数量最大,达到11艘,从15:00开始,进出港船舶数量呈逐渐下降趋势,因此,定义进出港高峰时段为10:00—15:00。

2.2.3 船舶交通流速分析

根据所有采集的各艘船舶的瞬时速度,得到所有船舶的平均瞬时速度为8.4 kn,即天津港主航道的船舶瞬时流速为8.4 kn,这说明天津港主航道船舶航速较大,且以大型船舶为主,因此,制定科学有效的交通管理措施和预测方法非常必要。

表1 部分进出天津港船舶速度统计表Tab.1 Statistics of vessel in and out of Tianjin port kn

3 建立预测模型

3.1 传统预测模型

通过统计船舶交通流量数据发现,其具有显著的非线性特征,在交通流量预测上应用较为广泛的传统预测方法,例如,K近邻回归预测[6]、时间序列预测模型[7]和灰色预测模型[8-9]在模型应用时考虑到了数据的时变特征,因此将结合采集的船舶流量数据应用上述3种预测方法进行船舶流量预测,受于篇幅限制,这里就不再展开论述,但计算结果将在预测结果分析部分进行阐述。

3.2 建立组合预测模型

将多种模型进行组合可以利用各模型的优点同时避免相应的缺点[10-13],因此,笔者提出一种组合模型,将k近邻回归预测、时间序列预测模型和灰色预测模型进行组合。混合模型的基本原理描述如下。

i=1,2,…,n

若记组合预测的预测误差平方和为J,则

建立最优组合预测方法,这种方法是根据“预测误差平方和最小”这一原则来求取各个单项预测方法的权系数向量的。如果某一加权系数向量Kn使组合预测方法的预测误差平方和J达到极小值Jmin,则称Kn为最优加权系数向量,其所对应的组合预测方法为最优组合预测方法。因此,线性最优组合预测即为下列最优化问题。

则有

假设n种预测方法的预测误差向量e1,e2,…,en是与线性无关的,则E(n)为正定矩阵,且是可逆的。显然上式的解为求条件极值的问题。根据Lagrange乘数法求条件极值问题,可以推得

且可得预测误差的精确公式为

由上可见,Jmin与组合权重K无关,说明最小均方误差是不依赖组合权重的。

3.3 基于基因算法的优化改进模型

在对天津港主航道区域数据整理和对部分传统预测模型梳理的基础上,建立优化的神经网络模型和组合的神经网络模型。

3.3.1 基因算法的优化过程

整个优化流程可分为神经网络结构确定、基因算法优化和神经网络预测3部分,流程见图4。

图4 优化流程图Fig.4 Flow chart of neural networkoptimized by genetic algorithm

3.3.2 BP神经网络结构确定

隐含层数、隐含层神经元数、激励函数、神经网络初始值对对算法的应用效果有比较明显的影响[14-17],同时学习速率也是重要的影响参数。所以需要先明确上述参数。

1) BP神经网络隐含层数。通过大量学者的期刊文献可以发现,3层神经网络就可以满足精度的要求[12]。因此,笔者采用输入层、隐含层和输出层的网络形式。选用6 h的流量数据作为输入数据,即输入层的神经元个数为6。将未来1 h做为预测结果,因此,输出层的数值是1。

2) 隐含层神经元数。隐含层神经元数的数量直接影响着模型是否出现“过拟合”等情况,根据多次试验,确定隐含层神经元数为8。

3) 激励函数。根据所采集的数据特点,选择双曲正切S型函数作为输出层的激励函数,单极性S型函数作为隐含层的激励函数。

4) 学习速率以及其他参数确定。根据训练样本的数据量,选择BP神经网络的学习速率为化0.01,则训练最大步数为4 000,训练目标的最大误差为化0.000 1。

3.3.3 基因算法优化

运用基因算法,确定最优权值与阈值,提高网络的学习速度和预测精度。

3.3.4 神经网络预测

对神经网络进行训练,计算出相应的输出误差。

4 预测结果分析

为了更好的对比笔者所提出的预测模型的预测效果,分别按照上述的模型方法对进出天津港的船舶交通流量进行预测,预测出2017年N月T+1日当天24 h的进出港口船舶流量,并与实际采集的船舶流量进行对比分析。(为了方便,以下称k近邻回归预测、时间序列预测模型和灰色预测模型的组合预测模型为组合模型,其预测结果为预测1;以下称遗传算法优化BP神经网络预测模型为改进模型,产生的预测结果为预测2。)

图5 进港船舶预测结果对比Fig.5 Comparison of prediction results of vessel entering port

图6 出港船舶预测结果对比图Fig.6 Comparison of the prediction results of the vessel out of port

由图5~6可知,通过与实际的进出港船舶流量数据进行对比,从预测整体情况来看,组合模型与改进模型都能够预测出流量变化的趋势,且准确度较高,同时预测2的结果要更优于预测1的结果,即利用遗传算法改进神经网络的预测模型相比组合模型预测精度更高。

为了更加直观的检验本文所提出的预测模型的效果,对部分传统流量预测模型也进行了分析计算,并与本文提出的模型进行结果对比。

表2 船舶流量预测结果Tab.2 Forecast result of vessel′s total quantity

由表2可见,5种预测方法都对船舶交通流取得较高预测精度,预测的平均误差不超过1。进一步对比表中MAE,MSE,MRE可以发现:在3种传统的预测模型中,K近邻回归预测的效果最好,时间序列的预测其次,而GM(1,1)模型最差,而组合模型则有更高的精度;优化的BP神经网络模型预测结果优于组合模型,在进港预测上的平均相对误差仅为9.75%,而在出港交通流量的预测仅为10.47%。

为了便于比较最后的预测结果,将5种预测结果分别合成船舶日进港交通流量与日出港流量,计算评价指标结果见表3。

表3 船舶流量预测结果Tab.3 Forecast result of vessel′s total quantity

对比表2与表3,可以发现将时刻数据合成为日流量数据,在很大程度可以降低预测的误差。上述结果中,K近邻回归,组合模型,遗传算法优化BP神经网络模型都能对日流量数据做出较好的预测,而灰色预测模型和时间序列模型则表现较差。尽管遗传算法优化BP网络似乎取得的精度更高,但对比表2所示的结果,可能出现了正负误差相抵的情况。

5 结束语

通过提取港口附近的船舶AIS数据,分析了船舶的交通流量和船速等参数,验证了本文所采集的AIS数据符合船舶交通流特点,证明采集方式的可行性,同时也说明了所采集的数据是比较准确的。利用实时采集的船舶AIS数据还可以有效验证流量预测模型的准确性,为验证模型提供了基础保证。本文又在此基础上,将遗传算法与神经网络预测模型相结合,并将非k近邻回归预测、时间序列预测和灰色预测模型组合成混合模型,构建出2种港口交通流量预测模型,并针对船舶进出港口的流量进行预测分析和对比,通过与实际采集数据进行对比,证明本文提出的2种模型,都具有较高的预测准确性,预测结果能有效反应数据的时变性与非线性特点,对数据的规律也能正确表达。为了更直观的验证本文提出的预测模型的效果,与传统预测模型进行结果对比,证明本文所提出的预测方法精度更高。在后继的研究中,将在持续增加混合模型数据采集量的基础上,继续从数据应用、影响条件等方面进行优化,改进预测精度和速度。

猜你喜欢

交通流量交通流神经网络
基于LSTM的沪渝高速公路短时交通流预测研究
京德高速交通流时空特性数字孪生系统
神经网络抑制无线通信干扰探究
基于XGBOOST算法的拥堵路段短时交通流量预测
基于神经网络的中小学生情感分析
基于GA-BP神经网络的衡大高速公路日交通流量预测
基于神经网络的拉矫机控制模型建立
路内停车对交通流延误影响的定量分析
混合非机动车交通流超车率影响因素模型
基于支持向量机回归和RBF神经网络的PID整定