APP下载

基于PSO-XGBoost的船舶特涂工序能耗预测

2023-01-11蒋清华任新民欧阳彬

软件工程 2023年1期
关键词:工序能耗船舶

蒋清华,任新民,姜 军,欧阳彬,彭 保

(1.友联船厂(蛇口)有限公司,广东 深圳 518067;2.湖南工商大学,湖南 长沙 410205;3.深圳信息职业技术学院,广东 深圳 518172)

renxinmin@cmhk.com;jiangqinghua0115@163.com;jiangjun8880@163.com;2248918560@qq.com;pengb@sziit.edu.cn

1 引言(Introduction)

近几年,致力于降低船舶修造领域工业能耗的船舶能源物联网技术被广泛研究,为城市“双碳”量化管理提供了大量有益的参考资料。为了降低船舶非生产性航行时间和维修费用,提高船舶盈利空间,必须对船舶进行科学的维护和管理,控制和优化船舶维修和保养过程中设备的能耗。因此,开展船舶能效优化技术研究具有重要意义[1-2]。机器学习等技术的出现与发展促进了船舶能效优化研究相关算法的精进。针对以上情况,本文以友联船厂的某货轮为例进行研究,从降低船舶特涂工序(一种船舶维修保养方式)过程中的电能消耗预测误差的角度出发,结合实船采集数据,基于XGBoost机器学习模型,通过粒子群算法(Particle Swarm Optimization,PSO)优化模型超参数提升船舶特涂工序能耗预测模型的预测效果。

2 相关研究(Related research)

随着世界人口的增长,人们对物品的需求逐渐增加,世界各国之间的货物贸易增多,货物运输需求增大,世界上通过船舶运输的货物约占总运输货物的80%。运载化学品的船舶由于装载货物的特殊性,所以需要定期使用特别的涂层进行维修和保养(即船舶特涂业务),其中就涉及维修设备的电力消耗。在维修和保养过程中因设备老化、施工安排不当等造成的电能浪费问题极大地增加了企业的维修成本。近年,船舶修造成为高技术和高能耗特征并重的重点工业领域,其高能耗问题是船舶企业所在城市管理的重点和难点。随着科学技术的进步,船舶绿色化、智能化发展理念也随之提出,修造船企业如何优化修造船过程中的能效问题,已经成为该行业发展过程中亟待解决的重要一环[2]。依托机器学习算法,通过将记录并解读船舶修造过程中的数据,用于对船舶能耗影响因素的归纳分析,进而建立能耗预测模型,可以对船舶能耗进行详细的描述和预测[3]。

BESIKCI等[4]和YAN等[5]分别运用人工神经网络和BP神经网络方法对船舶数据进行能效预测。BESIKCI等在模型基础上建立了决策支持系统,用来减少油耗,而YAN等则是利用模型实现多要素影响下的船舶能效智能预测。

船舶航行时,环境因素会对其产生一定的影响,因此在进行能效预测时,有些学者也考虑了环境因素的影响。LEIFSSON等[6]使用人工神经网络完成模型内部参数确定工作,并在考虑风浪对船舶油耗影响的同时,加入污低附着物这一被人们广泛忽略的影响因素,使得所建立的白箱模型具有更高的适用性。YANG等[7]提出船舶在航行过程是否出现失速现象是影响船舶油耗的重要因素,因此YANG等使用航速优化模型求解(Kwon)方法测算船舶在实际运输过程中受到外界环境如风浪等影响时的航行速度,并建立油耗预测模型。孙双休等[8]提出了最小二乘支持向量机模型,对船舶集中空调系统能耗进行分析预测。牛晓晓等[9]采用人工鱼群算法优化支持向量机,对柴油机性能进行回归分析,取得了高精度的预测效果。WANG等[10]主要采用小波神经网络预测船舶主机转速与油耗之间的关系。叶睿等[11]基于人工神经网络,使用一艘丹麦籍客滚轮的运营数据,建立了油耗预测模型。GAO等[12]运用高斯混合模型聚类,结合最大似然算法对数据进行分析,分析结果表明油耗量与主机转速之间的关系并不是一一对应的,其受海况的影响较大。王凯等[13]结合船舶油耗及其影响因素进行实船采集数据,采用不同机器学习算法对船舶能耗进行预测分析,验证各算法的特点和优势。YAN等[14]通过大量实验,摆脱了单一环境对船舶油耗的限制,使用K-mean聚类方法重点研究长江内河区域不同位置对船舶油耗产生的影响。

3 研究方法(Research method)

本研究中采用的方法概述如图1所示。本研究分三个阶段进行:第一阶段,研究人员采集友联船厂2021 年9 月至2022 年4 月共4 艘货轮特涂作业各舱室工序能耗数据,并对数据集进行清洗。第二阶段:将处理好的能耗数据用于训练、验证和测试PSO-XGBoost模型。采用K-fold交叉验证技术及粒子群算法优化模型的超参数,并使用15%的测试集确保模型不会出现过拟合或欠拟合。第三阶段:通过与其他能耗预测模型进行效果对比实验,验证PSO-XGBoost与优越性,最终将PSO-XGBoost模型用于船舶特涂能耗预测,解释预测结果背后的潜在原因,并揭示新的见解。

图1 研究方法流程图Fig.1 Research method flow chart

3.1 船舶特涂能耗数据描述

研究人员以友联船厂的4 艘进行特涂作业的货轮(包括萨法轮、托玛琳轮、坦桑石轮及丹娜轮)为研究对象,采集自2021 年9 月至2022 年4 月的船舶特涂作业各舱室工序能耗(E)数据如表1所示。

表1 PSO-XGBoost模型分析中使用的船舶特涂信息Tab.1 Ship tank coating information used in PSO-XGBoost model analysis

采用船舶特涂业务相关变量作为能耗预测的影响因素,包括工序类型(Pr)、施工面积(M)、施工时长(T)、各类特涂设备数(包括冷风机Nc、除湿机Nd、吸砂机Ns)、设备总数(Nsum)、风管数(Nf)、温度要求(Ta)及湿度要求(H)。上述变量是根据船舶特涂业务流程及能耗预测相关领域的研究经验选择的,这表明这些影响因素对船舶特涂工序能耗预测最重要。收集并整理最终的船舶特涂工序能耗数据用作训练PSOXGBoost模型的目标。

3.2 基于数据清洗与特征筛选的初步数据分析

为消除样本中异常数据的影响,需要删除掉样本中的异常值。基于3σ准则采用岭回归算法筛选出样本数据中的异常值,如图2(a)—图2(c)所示为数据集中的异常值分布情况,最终剔除掉编号为[39,77,94,102,162,329]共六个异常样本。

图2 数据集中的异常值分布情况Fig.2 The distribution of outliers in a dataset

图3展示了目标变量船舶特涂能耗与其影响因素变量之间的相关性情况。风管数Nf、设备总数Nsum与能耗E之间的相关系数较大,分别为0.75、0.62。温度要求Ta和湿度要求H与能耗E之间相关系数均为0.56。此外,Ta与H之间显著相关(相关系数达0.87)。由于M、Nc、Ns、T与E的低相关性,以及Ta与H之间高度相关,因此本文仅使用Pr、Nf、Nd、Nsum、Ta作为构建模型的能耗影响变量。

图3 各变量之间的热力相关图Fig.3 Thermodynamic correlation diagram between variables

3.3 XGBoost模型

极限梯度提升树(XGBoost)[15]是基于树的boosting算法的一种变体。从概念上来说,XGBoost是学习特征X和目标Y之间的函数关系f的一个迭代过程,在该过程中,各个树按顺序根据前一棵树的残差进行训练。树的预测数学形式可表示如下:

3.4 粒子群优化算法(PSO)

由Eberhart and Kennedy(1995)提出的粒子群优化算法(PSO)是根据鸟类倾向于更好的搜索路线的掠食性轨迹而制定的[16]。这是一种基于种群的随机搜索方法,具有参数少、过程简单的优点,已被应用于解决许多领域的优化问题。在D维超空间的优化问题中,m个粒子中的每个粒子都可以根据计算结果调整其位置和速度。第k步的位置向量可以表示为,速度向量是,第k个粒子的最佳位置为,全局最佳位置为。粒子的运动可以通过公式(3)和公式(4)计算得到:

其中,k表示迭代次数,i为粒子数,d为搜索方向,ω表示权重,表示粒子的局部最佳位置,作为所有粒子的全局最佳位置,和 表示学习因素,并被视为常数,和 表示在[0,1]中均匀分布的随机量,采用公式(3)和公式(4)求出最佳解。

4 实验与结果(Experiments and results)

4.1 实验目的

本次实验首先使用XGBoost模型进行船舶特涂工序能耗预测任务训练,同时采用PSO算法对模型的超参数进行优化,其次将优化后的模型与线性回归(LR)、随机森林(RF)、K近邻回归(KNN)等能耗预测模型进行对比,探究PSO-XGBoost模型的预测效果是否优于其他模型。

4.2 实验环境

实验采用Intel酷睿i5-12500H 12核16线程CPU,显卡使用4 GB NVDIA GTX 3050Ti,编程语言使用Python 3.9。为了避免模型训练过程中发生过拟合,本次实验采用早期停止法。

实验参数设置如下:迭代次数epoch设为5,批量大小batch size设为10,学习率learning rate设为0.0001,早期停止批量大小设为500。

4.3 评估指标

采用回归任务中常用的评估指标:平均绝对误差百分比(MAPE)、判定系数(R2)和正规化均方根误差(NRMSE),各个指标的计算方法如公式(5)—公式(7):

4.4 实验结果与分析4.4.1 实验结果

将船舶特涂工序能耗数据按0.8∶0.2划分为训练样本集合与测试样本集合,训练集用来训练模型,并在测试集上对模型预测效果进行验证(每种方法均进行5 折交叉验证)。PSO-XGBoost模型及其他对比模型的预测效果见表2,XGBoost的NRMSE为8.56%,MAPE为13.36%,R2为86.37%。本文提出的模型PSO-XGBoost的NRMSE为7.69%,MAPE为12.21%,R2为91.90%,各项指标明显优于其他模型。

表2 PSO-XGBoost模型及其他对比模型的预测效果Tab.2 Prediction error of PSO-XGBoost model and other comparison models

4.4.2 结果分析

本次实验结果表明,PSO-XGBoost与XGBoost、LR、KNN和RF等能耗预测机器学习方法相比,表现出了优异的性能,并且采用PSO算法进行参数寻优,有效提升了模型的预测精度。

此外,为了使PSO-XGBoost模型的预测结果具有可解释性,研究人员采用基于博弈论的SHAP方法[17]结合随机森林模型计算特征变量的贡献度,综合考虑算法速度和算法准确率,设定决策树个数K=500,特征总数M=5。运行程序得到五个特征的贡献度,图4是根据SHAP值得到的特征分析图。横轴有正负值,表示对船舶特涂工序能耗的正负影响,图4中各点表示各个特征关于每个样本的SHAP值。SHAP值小于0的点表示对能耗值有负向的影响,SHAP值大于0的点表示对能耗值有正向的影响。排名第一的变量SHAP值大于0的点明显多于小于0的点,说明变量风管数(Nf)对船舶特涂工序能耗的影响是正向的,即设备连通向舱室的风管数越多,其能耗会越高。排名第二的变量是工序类型(Pr),不同工序使用到的设备不同,达到施工要求的标准也不相同,其对能耗的影响有正有负,因此在整个数据集中变量风管数(Nf)的SHAP值正负分布均匀。排名最后的变量温度要求(Ta)的SHAP值接近于0,这是由于特涂作业中各个类型的工序对舱室内的温度要求基本一致,因此温度要求(Ta)对模型预测能耗的贡献较小。

图4 特征分析图Fig.4 Analysis diagram of features

5 结论(Conclusion)

船舶特涂工序能耗受多种因素影响,为了实现船舶能源的智能化管理,提出了一种能耗预测模型,该模型对特征重要性和多元变量的相关性进行建模,同时使用基于博弈论的SHAP方法分析能耗及其影响因素之间的关系,最终实现了船舶特涂工序能耗预测。主要结论如下。

(1)提出了一种基于PSO-XGBoost船舶特涂工序能耗预测模型。将该模型的预测结果与其他方法进行对比发现,PSOXGBoost的最高性能为NRMSE=7.69%,预测误差MAPE值仅为12.21%,模型可解释性R2为91.90%,证明了该模型的可预测性。同时研究表明,利用PSO算法调整模型超参数可有效提升预测性能。

(2)从挖掘船舶特涂工序能耗的影响因素角度,根据相关性分析选择Pr、Nf、Nd、Nsum、Ta作为预测模型的主要输入变量。同时,采用基于博弈论的SHAP方法计算变量的特征贡献度,分析了其与能耗的关系。结果表明,风管数Nf对模型预测的贡献度最大,温度要求Ta对模型预测的贡献度最小。

(3)船舶特涂工序能耗主要来源于设备消耗的电能,因此设备的损耗会影响其使用效率进而影响能耗,但目前的船舶能耗数据中没有涉及设备损耗的信息。此外,船舶特涂工序能耗数据是一种时间序列,季节性等时间特征会影响特涂设备的使用及施工达标要求等情况,从而导致能耗变化。今后可考虑加入设备损耗、时间特征进行建模,从而更好地预测船舶特涂工序能耗。

猜你喜欢

工序能耗船舶
120t转炉降低工序能耗生产实践
能耗双控下,涨价潮再度来袭!
《船舶》2022 年度征订启事
大理石大板生产修补工序详解(二)
船舶!请加速
BOG压缩机在小型LNG船舶上的应用
日本先进的“零能耗住宅”
船舶压载水管理系统
人机工程仿真技术在车门装焊工序中的应用