APP下载

基于GWO-LSTM的设施蔬菜温室温度预测*

2023-02-04毛晓娟鲍彤荀广连李德翠王宝佳任妮

中国农机化学报 2023年1期
关键词:灰狼步长温室

毛晓娟,鲍彤,荀广连,李德翠,王宝佳,任妮

(江苏省农业科学院信息中心,南京市,210014)

0 引言

设施蔬菜生产使用的温室是典型的小气候环境,受内外环境的影响,具有强干扰,多耦合,大滞后等特点[1-2]。温度作为作物生长过程中重要的环境影响因素,直接决定作物的生长发育状况,不适宜的温度将导致作物大幅减产甚至绝收。因此,稳定精确地预测温室温度,并根据温度预测值提前调控温室环境,对温室大棚内的作物生产意义重大。

目前国内外关于温室内温度的预测模型主要分为两类,一类是机理模型,一类是数据模型。机理模型主要基于流体动力学和能量平衡[3-4],但是其内部关联参数多,建模难度大。数据模型主要根据温室内外环境数据进行建模,无需考虑温室耗散、热辐射等影响因素。随着机器学习的快速发展,数据模型在温室内温度的预测中得到了广泛的应用[5-9]。Yu等[10]提出一种基于最小二乘支持向量机(Least Squares Support Vector Machine, LSSVM)的温度预测模型,采用改进粒子群算法(Improved Particle Swarm Optimization,IPSO)对LSSVM模型进行参数优化,对未来短时的预测效果较好,但在长时间的温度预测方面还需要进一步研究。任守纲等[11]利用R-BP神经网络进行多步滚动预测温室的温度值,但对温室外界环境因素考虑不全,预测仍然存在较大误差。田东等[12]利用移动平均、移动平均差分自回归模型和遗传算法优化的支持向量机三种模型相结合的方法进行食用菌温室温度预测,该组合模型预测精度比单模型有明显提高,但其仅基于7月份数据进行预测,模型不具有广泛适应性。

由于浅层的机器学习算法在处理长时间序列信号上存在不足,数据预测结果存在较大的误差。深度学习作为机器学习最新的研究成果,它通过学习深层非线性网络结构,在数据特征和模型挖掘上具有显著优势。循环神经网络(Recurrent Neural Network,RNN)[13]作为深度学习中处理序列问题的典型网络结构,将时序概念引入到网络结构设计中,使其在时序建模中具有更强的适应性和更高的预测精度。但是RNN结构随着序列长度的增加易存在梯度消失或爆炸问题,对于序列长期依赖关系的学习存在一定的困难。Hochreiter等[14]提出了长短期记忆网络(Long short-term memory network,LSTM),它作为一种特殊的RNN,解决了标准RNN无法建立较长时间跨度的模型预测问题,因此被广泛应用于时间序列的预测中[15-22]。在温度预测方面,DaDhja等[23]对比RNN-LSTM、人工神经网络和自回归神经网络对30 min后的温室温度等环境因子进行预测,结果表明RNN-LSTM预测效果最好。赵明珠等[24]利用双向长短期记忆(Bi-directional Long Short-Term Memory,BiLSTM)网络模型得到了优于LSTM、差分整合移动平均自回归(Autoregressive Integrated Moving Average,ARIMA)模型的地铁车站温度预测结果。智协飞等[25]利用长短期记忆网络、浅层神经网络、滑动训练期消除偏差集合平均和滑动训练期多模式超级集合方法对地面气温进行预报,该集成方法的预报结果比所有单个模式预报更为准确。

综上,LSTM在诸多时间序列预测上具有很大的优势,温室温度预测作为典型的时间序列问题,使用LSTM方法尤其合适,但LSTM的模型参数依靠人工经验确定,随机性较大,易陷入局部最优解。灰狼优化算法(Grey Wolf Optimization,GWO)[26]是近年来提出的一种通过模拟灰狼捕食行为的群体智能优化算法,具有收敛性强、参数少、易实现等优点,比较粒子群算法、蝙蝠算法等有更强的收敛速度与搜索能力,因此被广泛用于模型参数的调整优化[27-28]。

本文将灰狼优化算法和长短期记忆网络模型相结合,提出基于GWO-LSTM的设施蔬菜温室温度预测模型。将LSTM网络中隐藏层单元数、学习率和迭代次数等模型参数作为GWO算法中狼群的位置坐标,通过计算适应度值更新狼群位置以获取模型参数的最优解。利用最优参数搭建LSTM网络模型对温室内温度进行预测。

1 材料与方法

1.1 试验区概况

本文试验区域为江苏省农业科学院科研基地阳光板温室。温室屋脊为南北走向,跨度栋宽8 m,开间4 m,肩高5.0 m,顶高5.8 m,外遮阳高6.5 m。屋面形状为一跨二尖顶文洛式,顶部及四周侧墙采用8 mm阳光板。温室配备外遮阳系统、内遮阳系统、保温系统、交错顶开窗系统、湿帘风机降温系统、自动升降式补光系统、控制系统等。温室内部采用椰糠基质栽培种植樱桃番茄,试验期间番茄分别经历幼苗期、开花期和坐果期生长阶段,时间为2020年9月中旬—12月下旬。试验初期天气炎热,温室通过湿帘、风机和天窗等设备进行降温,后期天气变冷采用内保温、遮阳网等设备进行保温。试验期间利用团队自主开发的设施蔬菜智慧管控平台对温室环境实施自动调控,全程保证番茄处于适宜的生长环境中。

1.2 数据采集与预处理

温室内环控设备(风机、湿帘、天窗、补光灯、内保温、内遮阳、外遮阳)操作历史状态通过设施蔬菜智慧管控平台进行实时自动采集,采集内容包括设备名称、设备操作类型(开启、关闭、展开、合拢)和操作时间等。温室内环境因子通过无线传感器采集,主要采集室内空气温度、空气相对湿度、光合有效辐射和二氧化碳浓度等环境数据。温室外通过小型气象站采集室外空气温度、空气相对湿度、风速和光合有效辐射等环境数据。

由于温室内环境复杂多变,为了准确地获取温室中环境数据的空间分布变化,分别取温室中4个地块的中心点(A、B、C、D)作为监测点。在点A、B、C、D处于垂直方向依次布设空气温湿度传感器、二氧化碳浓度传感器和光合有效辐射传感器,分别距地面1.5 m、1.6 m、1.8 m。温室外点E位置布设小型气象站,温室内外传感器布设的俯视图和剖面图如图1所示,温室内外传感器设备的型号、量程范围等参数说明如表1所示。

(a) 俯视图

表1 传感器设备说明Tab. 1 Description of the sensor device

本文选取2020年9月23日—12月21日期间试验数据,采样间隔为10 min,总共采集12 819条样本数据。其中设备开启、展开状态记录为1,设备关闭、合拢状态记录为0,多个监测点采集的同类环境数据取平均值。对于缺值采用线性插值法进行填充,异常值采用均值法进行替换。由于各类数据单位、量纲的差异,本文对数据采用归一化处理,归一化后按照7∶3划分数据集,前8 967条数据作为训练样本集,后3 852条数据作为测试样本集。数据归一化公式如式(1)所示。

(1)

式中:y′——归一化后的转换值;

y——真实值;

ymax——样本最大值;

ymin——样本最小值。

影响温室内空气温度的主要因素包括室内空气温度、室内空气相对湿度、室内光合有效辐射、室外空气温度、室外空气相对湿度、室外光合有效辐射、室外风速和室内环控设备(风机、湿帘、天窗、补光灯、内保温、内遮阳、外遮阳)运行状态。本文选取上述14个因子作为模型输入参数,下一时刻温室内空气温度作为模型输出参数。

1.3 温室温度预测模型构建

1.3.1 长短期记忆网络(LSTM)

LSTM网络通过精心设计的“门”结构,使模型具有长时间的“记忆功能”,避免了标准循环神经网络产生的梯度消失与梯度爆炸问题。该网络在结构设计中有遗忘门ft、输入门it、输出门ot和一个记忆单元。其内部基本结构如图2所示。

图2 长短期记忆网络内部结构图

遗忘门主要是控制旧信息的遗忘,计算公式如式(2)所示。

(2)

输入门主要是控制新的信息输入,计算公式如式(3)所示。

(3)

记忆单元临时状态,计算公式如式(4)所示。

(4)

更新记忆单元,计算公式如式(5)所示。

(5)

输出门公式如式(6)所示。

(6)

整个隐藏层的计算公式如式(7)所示。

ht=ot×tanh (ct)

(7)

输出层的计算公式如式(8)所示。

(8)

式中:bf——遗忘门的偏置;

bi——输入门的偏置;

bc——记忆单元的偏置;

bo——输出门的偏置;

1.3.2 灰狼优化算法(GWO)

灰狼优化算法是一种受到了灰狼狩猎的启发而开发的优化搜索方法,灰狼具有严格的社会等级层次制度,从高到低分别为α、β、δ和ω,捕食的过程在α的带领下完成。灰狼的狩猎包括跟踪猎物、包围猎物和攻击猎物。

灰狼包围猎物行为的数学模型定义如下。

D=|C·Xp(t)-X(t)|

(9)

X(t+1)=Xp(t)-A·D

(10)

A=2a·r1-a

(11)

C=2·r2

(12)

式中:Xp(t)——当前猎物的位置矢量;

X(t)——当前灰狼的位置矢量;

X(t+1)——下一次迭代后的灰狼的位置矢量;

D——灰狼和猎物之间的距离;

a——收敛因子,随着迭代次数从2线性递减到0;

r1、r2——[0, 1]区间上的随机数。

当灰狼识别出猎物的位置后,α引导β和δ对猎物进行攻击。选取前三个最优解,其余灰狼根据α、β、δ更新自己的位置。

(13)

(14)

(15)

式中:Dα——α与其他灰狼之间的距离;

Dβ——β与其他灰狼之间的距离;

Dδ——δ与其他灰狼之间的距离;

Xα(t)——α当前迭代次数下的位置矢量;

Xβ(t)——β当前迭代次数下的位置矢量;

Xδ(t)——δ当前迭代次数下的位置矢量;

X1——狼群中某个灰狼向α移动的矢量;

X2——狼群中某个灰狼向β移动的矢量;

X3——狼群中某个灰狼向δ移动的矢量。

1.3.3 GWO优化LSTM模型参数流程

LSTM模型参数的确定大多是基于人工经验,存在模型调节参数时间长、易收敛于局部最优解等问题。GWO作为一种群体智能优化算法,具有全局搜索能力强、收敛快、易实现等优点,近年来广泛用于参数优化等领域。

为提高温室温度预测模型的预测精度,本文利用GWO对LSTM模型参数进行优化调整,以LSTM网络中隐藏层单元数、学习率和迭代次数作为狼群位置,通过计算适应度函数,更新狼群位置,获得LSTM网络模型参数最优解,利用最优模型参数构建设施蔬菜温室温度预测模型。本文提出的基于GWO-LSTM的设施蔬菜温室温度预测模型流程如图3所示。

图3 基于GWO-LSTM的设施蔬菜温室温度预测模型流程图

根据流程图,基于GWO-LSTM的设施蔬菜温室温度预测模型构建具体步骤如下。

步骤1:将设施蔬菜智慧管控平台采集的温室内外环境因子和设备操作状态原始时间序列样本数据进行异常值剔除、缺值补充和数据归一化处理后,按照7:3比例将已处理样本集划分为训练集和测试集。

步骤2:确定GWO的初始数据,包括灰狼种群个数、初始坐标和迭代次数等。将LSTM网络的隐藏层单元数、学习率和迭代次数转换为狼群的位置坐标,选择训练样本集对LSTM进行模型训练。

步骤4:选择测试样本集,对上述优化参数的LSTM网络进行测试,得到最优的LSTM网络模型,基于最优的LSTM网络模型预测温室内空气温度值。

1.3.4 模型评价指标

为了验证本文提出的基于GWO-LSTM模型的预测性能,使用4种性能评价指标,包括均方根误差(Root Mean Squared Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)和决定系数R2。其中,RMSE、MAE和MAPE数值越小,模型预测结果越准确。R2接近1,代表拟合优度越大,模型预测效果越好。

(16)

(17)

(18)

(19)

式中:N——预测样本数;

yi′——温室内温度预测值;

yi——温室内温度真实值;

y——真实值的平均值。

2 结果与分析

2.1 模型参数选择

本试验基于编程语言python3.7,利用Anaconda 3环境下的Keras2.4深度学习库进行模型构建。GWO-LSTM网络模型由输入层、隐藏层和输出层三层网络组成,采用Adam算法训练LSTM内部网络参数,隐藏层中的激活函数设为Relu函数。将LSTM的隐藏层单元数、学习率和迭代次数作为狼群的位置坐标,其中隐藏层单元数取值范围为[2,100],学习率取值范围为[0.000 1, 0.01],迭代次数取值范围为[20, 300],预测时间步长为30 min。灰狼优化算法参数设置为:狼群总数为20,最大迭代次数为10,灰狼α,β和δ的初始坐标均为[0,0,0]。

为了验证本文提出的GWO-LSTM的模型性能,选择标准LSTM、BP-ANN进行试验对照。标准LSTM、BP-ANN均采用和GWO-LSTM网络模型相同的输入参数、输出参数和预测时间步长。其中,标准LSTM网络和BP-ANN均为三层网络,隐藏层单元数均设为14,学习率均设为0.01,迭代次数均设为100。

2.2 基于GWO-LSTM的温室温度预测

利用GWO对LSTM模型进行训练,获得最优模型参数,即隐藏层单元数为33,学习率为0.01,迭代次数为94。利用最优模型参数,将标准LSTM、BP-ANN 和GWO-LSTM三种模型对温室内空气温度进行预测,各模型在测试集上的预测曲线如图4所示,依次为BP-ANN 预测曲线、LSTM预测曲线和GWO-LSTM预测曲线。图4显示,标准LSTM、BP-ANN 预测误差相对较大,尤其在波峰、波谷和锯齿波动较为剧烈的附近误差较大。而本文提出的GWO-LSTM模型预测曲线更接近温室内空气温度的实测值,特别是在曲线波动剧烈处的预测效果更优于其他模型。

(a) BP-ANN预测曲线

为进一步验证模型的预测精度和模型多步预测能力,选择RMSE、MAE、MAPE和R2这4个模型评价指标来衡量三种模型预测性能,表2给出在不同预测时间步长下三种模型的温度预测结果精度分析值。

表2 三种模型不同预测时间步长的温度预测结果精度分析Tab. 2 Precision analysis of temperature prediction results with different prediction time steps for three models

在预测时间步长为10 min条件下,GWO-LSTM模型的RMSE为0.386 9,MAE为0.164 1,MAPE为0.104 7,R2为0.987 1。与标准LSTM相比,评价指标RMSE、MAE、MAPE分别降低了24.98%、57.02%、37.34%,R2增加了1.02%;与BP-ANN相比,评价指标RMSE、MAE、MAPE分别降低32.63%、62.59%、41.41%,R2增加了1.59%。

在预测时间步长为30 min条件下,GWO-LSTM模型的RMSE为0.677 6,MAE为0.411 4,MAPE为0.168 7,R2为0.960 4。与标准LSTM相比,评价指标RMSE、MAE、MAPE分别降低了3.60%、8.86%、11.64%,R2增加了0.31%;与BP-ANN相比,评价指标RMSE、MAE、MAPE分别降低了30.29%、35.29%、18.62%,R2增加了4.57%。

在预测时间步长为60 min条件下,GWO-LSTM模型RMSE为1.030 2,MAE为0.594 3,MAPE为0.196 3,R2为0.910 8。与标准LSTM相比,评价指标RMSE、MAE、MAPE分别降低了3.85%、11.80%、7.32%,R2增加了1.13%;与BP-ANN相比,评价指标RMSE、MAE、MAPE分别降低了35.33%、46.12%、29.29%,R2增加了16.75%。

从模型评价指标横向比较结果看出,本文提出的GWO-LSTM模型无论在步长10 min、30 min或60 min 情况下,预测精度都比标准LSTM和BP-ANN 更高。

从预测步长纵向比较来看,针对GWO-LSTM模型,时间步长60 min相较于时间步长30 min,评价指标RMSE、MAE、MAPE分别增加了0.352 6、0.182 9、0.027 6,R2减少了0.049 6;时间步长30 min相较于时间步长10 min,评价指标RMSE、MAE、MAPE分别增加了0.290 7、0.247 3、0.064,R2减少了0.021 3。说明GWO-LSTM在预测未来30 min内的温度变化相对更精确,在预测未来60 min内的温度变化方面准确度稍有下降。

为进一步验证GWO-LSTM模型的连续性预测能力,表3给出2020年11月25日预测时间步长为60 min 时温室内空气温度实际值与各模型预测值的部分数据对比分析,可以看出GWO-LSTM模型在连续6个时间点的最大绝对误差和平均绝对误差分别是0.185 3和0.120 9,均小于LSTM和BP-ANN模型的最大绝对误差和平均绝对误差。

表3 预测时间步长为60 min的温度真实值与预测值对比分析Tab. 3 Comparison and analysis between actual value and predicted value in 60 min predicted time step

综上所述,本文提出的GWO-LSTM能够较准确地预测温室内未来60 min的空气温度变化,同时避免了人工调参,提高了模型参数调优效率,能够为智能温室精准调控提供有效的技术支撑。

3 结论

1) 目前对设施蔬菜温室内空气温度预测的研究大多仅采用温室内外部的环境因子数据,未考虑温室内控制设备的影响,而实际生产中控制设备的调控对温室气候的形成起着较大的作用,因此这类仅利用温室内外部环境因子数据建立的模型无法用于自控型温室空气温度预测。本文基于实际生产中的状况,实时采集温室内控制设备的运行状态,并把设备状态作为模型输入的一部分,这种建模方式更符合实际生产中自控型温室的工作状态。

2) 本文采用GWO优化算法对LSTM的模型参数进行寻优,解决了根据人工经验选取模型参数而导致的模型拟合度不够,模型预测精度低和模型调节参数时间过长等问题。同时本文还对多个时间步长进行预测对照,在未来10 min和30 min预测步长中,GWO-LSTM 预测精度均优于标准LSTM和BP-ANN模型。在未来60 min预测步长中,GWO-LSTM的预测均方根误差、平均绝对误差、平均绝对百分比误差分别为1.030 2、0.594 3、0.196 3,相比标准LSTM降低了3.85%、11.80%、7.32%,说明GWO-LSTM模型在未来60 min预测中仍具有较高的准确性。

3) 目前本文所述实例仅采集到秋季和初冬的温室气候环境和设备运行数据,缺乏整个冬季和春季的采集数据。后续将补充采集冬季和春季的温室气候环境和设备运行数据,按照季节划分数据集,进而构建针对不同季节的预测模型,使模型具有普适性,同时将模型应用到实际生产中。

猜你喜欢

灰狼步长温室
现代温室羊肚菌栽培技术
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
苍松温室 苍松灌溉
苍松温室 苍松灌溉
灰狼和山羊
基于随机森林回归的智能手机用步长估计模型
基于Armijo搜索步长的几种共轭梯度法的分析对比
谷谷鸡和小灰狼
可以避免一个温室化的地球吗?
灰狼的大大喷嚏