APP下载

基于机器学习的船舶油耗预测

2021-07-01刘洋洋卫家骏

中国水运 2021年5期
关键词:人工神经网络支持向量机

刘洋洋 卫家骏

摘 要:准确地预测船舶能耗对实现航速优化、纵倾优化等具有重要作用。然而船舶油耗受到多种因素的影响,如航行速度、吃水、风速、浪高等,给船舶油耗预测带来众多困难与挑战。本文收集了在航船舶传感器数据,通过对数据进行预处理,提取了与油耗影响有关的特征数据信息。使用人工神经网络(Artificial Neural Network,ANN)、支持向量机回归(Support Vector Regression,SVR)、岭回归(Ridge)等共7种机器学习方法进行船舶油耗预测。实验结果表明,ANN的R2值大于0.9,预测精度最高,Lasso与Ridge的预测精度最低,R2值皆小于0.5。本文提出的模型可为在航船舶实时油耗预测提供重要参考。

关键词:船舶油耗预测;人工神经网络;支持向量机

中图分类号:U676.3          文献标识码:A            文章编号:1006—7973(2021)05-0138-03

随着世界人口、贸易不断增加,人们对货物的需求不断增加,世界上约80%的货物运输是通过船舶运输完成。根据国际海事组织(International Maritime Organization,IMO)第4次发布的研究报告,2012~2018年,航运业排放的温室气体从9.77亿吨增加到10.76亿吨,增长10.1%,航运业排放比例从原先2.76%上升至2.89%,据IMO估计,按照现有的趋势发展,到2050年,CO2的排放量将比2018年提高50%。

Leifson等考虑风浪、污底附着物对船舶航行的影响,并结合主机与螺旋桨的工况,建立了油耗预测白箱模型,并使用人工神经网络对模型的各个参数进行了求取。Yang等考虑到船舶实际航行中,由于风、浪等航行环境的影响,会造成失速现象,为此采用了Kwon的方法进行了航速估算,建立了远洋船舶的油耗预测模型。Yan等基于在航船舶营运数据,建立了一种BPNN的船舶能耗预测模型,并对通航环境因素与能耗的影响进行了敏感性分析,预测获得的油耗值其精度要高于采用理论公式。Sun等为了加快ANN的预测收敛速度,利用遗传算法对初始连接权值进行了优化,有效提高了模型的训练收敛速度。Wang等在进行航速优化时,使用小波神经网络对航速、水深、风速进行了实时预测,并使用经验公式获得了阻力与航速的关系,在此基础上确定了主机转速与单位海里燃油消耗的函数关系。叶睿与殷振宇等基于一艘丹麦籍客滚轮的运营数据,经过数据清洗,提取了油耗相关的特征数据信息,并使用人工神经网络进行油耗预测。Yan等認为不同通航环境的船舶油耗存在一定的差异,为此采用k-mean方法对航行环境数据进行聚类,并根据聚类结果,分析了长江内河不同位置的环境因素对油耗的影响。高梓博等提出了一种高斯混合模型的聚类方法,并结合最大似然算法,对主机工况、航速等特征进行聚类,聚类结果表明油耗量与主机转速关系并不是一一对应,受到海况的影响较大。

综上所述,目前主要采用单一的方法进行船舶能耗预测研究,缺乏分析、比较各个方法在能耗预测的优劣势。为此,本文结合机器学习常用的回归方法,提出了人工神经网络(Artificial Neural Network,ANN)、支持向量机回归(Support Vector Regression,SVR)、岭回归(Ridge)、Lasso回归、梯度提升决策树回归(GBR)、K最近回归(KNN)及随机森林(RF),共7种回归方法进行船舶能耗预测,分析了各个方法在油耗预测的精度,以及气象环境因素对油耗预测的影响。

1油耗数据采集及预处理

1.1  船舶油耗数据采集

本文数据来源为某油轮的在航船舶实时采集数据。通过对在航船舶安装传感器,如GPS、计程仪、风速风向仪、轴功率仪、油耗仪等。这些传感器会实时采集船舶姿态信息、主机性能状态信息等,如经纬度、航速、航向、吃水、主机转速、功率等数据,这些数据通过网络传输至船端或岸端,并将其储存在数据库中。数据的采集过程如图1所示。

1.2  油耗数据预处理

数据在采集的过程中,由于人为因素、设备仪器、网络信号等原因,致使采集的数据包含很多错误数据与噪声数据。若将这些数据直接用于后续的模型进行训练学习,其能耗的预测值与实际值相差较大,很难反映众多影响因素下油耗实际分布情况,因此需要对采集的能效数据进行数据预处理。本文根据以下原理对采集的数据进行预处理。

(1)根据领域知识,对于风向、流向、船艏向、航向不在[0°,360°]范围内的数据进行删除。

(2)由于该船舶是远洋航行,其大部分是处于满载和压载航行,因此其吃水处于一定的吃水范围内,根据吃水范围,将不在区间范围内的吃水数据删除。

(3)根据转速、航速的分布范围,将航速不在[4,16]kn范围内的数据删除。为保证主机的工作性能,船舶在航行一段时间后,会进行冲车,由于冲车阶段的各个特征数据发生急剧变化,对于冲车阶段的数据需进行删除。

经过以上步骤,数据最开始由12951行删除至11271行。对于前后气象数据相差较大的数据先进行异常识别,对识别后的数据进行线性插值。

2船舶油耗预测模型构建

船舶能耗预测模型如图2所示,主要包括数据预处理、数据集的划分、模型性能评价。在获得干净数据后,通过相关性分析及结合相关领域知识,综合考虑到船舶航行姿态,装载情况、航行气象环境等对油耗的影响,确定了航速、平吃水、纵倾、风速、风向、流速、流向作为模型的输入,每天的燃油消耗量作为模型的输出。

在获得油耗及其相关影响特征数据集后,将数据集按照0.8:0.2的比例划分训练集与测试集。在训练集学习过程中,根据各个特征数据分布情况,通过对训练集进行训练学习,以此确定模型的参数。然而有些模型在训练集的学习效果好,但并不代表模型在测试集的预测效果也好,有可能出现过拟合与欠拟合现象,因此需要综合衡量模型在训练集与测试集性能效果。常见的模型评价指标为均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R2),各个指标的计算值可通过式(1)—(4)获得。

其中m为测试集样本个数,为测试样本的实际值,为测试样本的预测值,为测试集中样本的实际值的平均值。R2越高,意味着油耗实际值与预测值越接近,表示模型的预测精度越高。MSE、RMSE、MAE的值越低,说明油耗实际值与预测值越接近,表示模型的预测精度越高。

3 船舶油耗预测结果分析

数据在用于模型训练之前,先对数据进行标准化处理,使用z-score对数据进行标准化转换。使用的工具为python3.7版本,且该版本基于anaconda 3集成开发环境。整个数据集进行20次的不同划分,每次划分的数据集经过标准化处理后,然后用于模型的训练,对20次模型训练的结果进行平均作为模型的性能评价值。各个方法的训练集与测试集的性能指标值如表1所示。由表1可知,在测试集中ANN的R2值均高于其它6种方法,且其MSE、RMSE、MAE的值均低于其它6种方法,这说明在该7种回归方法中,在船舶能耗预测方面,ANN的预测精度最高。与此同时,Lasso与Ridge 的R2值均低于其它6种方法,且MSE、RMSE、MAE的值均高于其它6种方法,这说明在该7种回归方法中,在船舶能耗预测方面,Lasso与Ridge的预测精度最低。原因是由于这两种方法在进行回归时,对影响能耗的各个特征因素时进行线性组合,然而实际中各个影响因素之间的关系及其复杂,并不一定与油耗呈现简单的线性关系,因此这两种方法的预测精度较低。

4结论

通过对在航船舶安装传感器,采集能耗及相关特征数据信息,根据各个特征的数据分布规律,提出了数据清洗方法。结合机器学习、集成学习及深度学习,使用ANN、SVM、RF、Lasso等共7种方法去进行船舶油耗预测,并对每种方法的预测结果进行了分析,结果显示ANN的预测精度最高,本文所建立的模型可为实時油耗预测提供参考依据。

参考文献:

[1] UNCTAD. Review of maritime transport 2020 [R]. New York: UNCTAD, 2020.

[2] IMO. Fourth IMO GHS study 2020-final report note by the secretariat [R]. London: 2020.

[3] Leifsson L ?, varsdóttir H S, Sigur?sson S ?, etc. Grey-box modeling of an ocean vessel for operational optimization[J]. Simulation Modelling Practice and Theory, Sep, 2008, 16 (8): 923-932.

[4] Yang, L. , Chen, G. , Zhao, J. , & Rytter, N. G. M. Ship speed optimization considering ocean currents to enhance environmental sustainability in maritime shipping. Sustainability,2020, 12, 3649.

[5] KWON Y. Speed loss due to added resistance in wind and waves[J].Naval Architect,2008(3):14-16.

[6] Yan X ,  Xing S ,  Yin Q . Multiparameter Sensitivity Analysis of Operational Energy Efficiency for Inland River Ships Based on Backpropagation Neural Network Method[J]. Marine Technology Society Journal, 2015, 49(1):148-153.

[7] Sun C ,  Wang H ,  Liu C , et al. Dynamic Prediction and Optimization of Energy Efficiency Operational Index (EEOI) for an Operating Ship in Varying Environments[J]. Journal of Marine Science and Engineering, 2019, 7(11):402.

[8] Wang K , Yan X , Yuan Y , et al. Real-time optimization of ship energy efficiency based on the prediction technology of working condition[J]. Transportation Research Part D Transport & Environment, 2016, 46:81-93.

[9] 叶睿, 许劲松. 基于人工神经网络的船舶油耗模型[J].船舶工程, 2016, 229(03):89-92.

[10] 殷振宇,许劲松.基于航行数据的船舶油耗优化[J].船舶工程,2019,41(08):100-104.

[11] Xinping Yan, Kai Wang, Yupeng Yuan, Xiaoli Jiang, Rudy R. Negenborn,Energy-efficient shipping: An application of big data analysis for optimizing engine speed of inland ships considering multiple environmental factors,Ocean Engineering,2018,169,457-468.

[12] 高梓博,杜太利,张勇,黄连忠.聚类算法在船舶能效数据挖掘中的应用[J].武汉理工大学学报(交通科学与工程版),2019,43(02):286-290.

猜你喜欢

人工神经网络支持向量机
基于人工神经网络的故障诊断专利浅析
人工神经网络发展历史与训练算法概述
基于人工神经网络的优化配置研究
ANN、ANFIS和AR模型在日径流时间序列预测中的应用比较
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究