APP下载

基于神经网络算法的果树需水预测研究

2022-02-25何淑林刘慧敏金立强

灌溉排水学报 2022年1期
关键词:土壤湿度神经网络果树

何淑林,刘慧敏,金立强,刘 勇,*

(1.黑龙江大学,哈尔滨 150000;2.黑龙江东部节水设备有限公司,哈尔滨 150000)

0 引 言

【研究意义】植物消耗水分的主要途径为植株间的蒸腾作用、地表渗漏、地表径流,还有一部分用于自身的生长发育。对于果树而言,由于其枝繁叶茂且冠层较大,果树吸收的水分有95%都用于蒸腾作用[1],因此准确计算果树蒸腾量对果树的合理灌溉、提高水资源利用率具有重要意义。【研究进展】植物需水量的计算方法有多种,其中使用最普遍的有2种:一种是直接计算,即根据土壤湿度和最佳土壤湿度的偏差,直接计算出植物在各个生长阶段的需水量;另一种是间接确定,由于植物的水分大部分都用于蒸腾作用,可以通过模型预测植物的蒸腾量,间接计算植物在各个生长时期的需水量[2-3]。Kumar等[4]利用极限学习机(Extreme Learning Machine, ELM)方法对蒸腾量进行预测,结果表明ELM模型的预测精度较高,且预测模型简单、易实现;Wang等[5]建立的模型框架将反向传播神经网络(Back Propagation Network, BP)和Hargreaves蒸散模型相结合,建立了集成未来气候变化情景下的水资源分配优化模型,该模型框架可以揭示受气候变化影响的水文气象要素的规律,具有很大的研究意义;Hou等[6]将热红外遥感的知识应用到农业灌溉中,预测在不同灌溉速率下作物的蒸腾速率,可以帮助安排灌溉时间,对于精准灌溉具有重要意义;陈士旺等[7]根据基质含水率的变化情况,分析了温室番茄蒸腾量花期和苗期的预测精度,对温室灌溉管理具有很大的推广应用价值;商志根等[8]建立PSO优化最小二乘支持向量机的预测模型,预测作物的需水量,具有预测精度高、泛化能力强等优点;孟玮等[9]在径向基神经网络的基础上加入了人工蜂群算法,预测蓄水坑灌状态下的苹果树需水量,为果园的灌溉管理提供了科学的依据。【切入点】国内外研究人员对植物需水量预测进行了广泛的研究,虽然取得了一定的进展,但如何提高预测精度,降低预测模型的复杂度等问题仍然是研究的重点问题,上述学者建立的预测模型对模型的实用性以及实验对比等方面的考虑有所欠缺。【拟解决的关键问题】针对以上问题,本研究将深度学习中的LSTM神经网络应用于果树蒸腾量预测,主要针对如何提高模型的预测精度、降低模型的复杂度等问题进行改进,并进行对比分析。

1 基本理论

1.1 主成分分析法

由于影响果树蒸腾量的环境因子很多,传感器采集的各种环境因子之间具有一定的耦合性,如果将所有变量输入到预测模型中,会使预测模型变得复杂,从而增加了模型预测的难度。因此,使用较少的新变量代替原来较多的变量,并使这些较少的新变量保留尽可能多的原始变量所反映的信息成为关键问题。

主成分分析(Principal Component Analysis,PCA)是一种常用的解决多变量问题的方法,通过将多维的数据特征映射成低维数据特征,在降低数据的维度的同时可以包含大部分的数据信息[10],从而使得模型的复杂度降低。

1.2 长短时记忆(Long Short-term Memory,LSTM)神经网络

在农业预测领域中,由于蒸腾量受多种环境因子的影响,田地采集环境数据也是一种典型的非平稳性时间序列,历史时刻的环境数据会对当前时刻的蒸腾量产生影响,因此可以用LSTM神经网络对蒸腾量进行预测[11]。

LSTM神经网络是循环神经网络(Recurrent Neural Network,RNN)的变体,是一种特殊的RNN模型[12]。LSTM有3个控制门,这3个控制门相互配合,通过控制该时刻和上一时刻的输入、输出,来对细胞状态进行更新,可以很好地解决“梯度消失”的问题。为了解决长时依赖的问题,在LSTM单元中,使用3个阈值层,用来有效控制可以通过门的信息量[13]。

第一步是由遗忘层通过sigmoid单元来决定什么信息可以通过细胞状态,sigmoid函数输出一个(0,1)之间的值,过滤上一时刻传递下来的信息以及当前时刻输入的信息。

第二步是利用输入层,通过sigmoid单元产生需要更新的数据。

第三步是对以前的细胞状态进行更新。

第四步是计算本时间节点LSTM神经网络的输出值。首先计算得到一个初始输出ot,然后将ct值缩放到-1~1之间,将ot与缩放后的ct相乘,最后得到模型的输出。

1.3 注意力机制

由于在整个模型训练中并非所有的中间节点信息都有相同的贡献程度,同时还存在一些噪声,影响模型的预测程度,注意力(Attention)机制突出了关键特征向量对输出的贡献,很好地优化了传统模型[14]。Attention机制通过对模型输入特征进行计算,为不同输入特征赋予不同的权重,对关键特征向量赋予更高的权重,以帮助模型做出更准确的判断。

2 基于Attention-LSTM预测模型的搭建

2.1 基于Attention-LSTM的蒸腾量预测模型

LSTM神经网络对于输入数据序列较短时,学习效果较好,但是输入较长的数据列,仍然会受到长时依赖问题的影响,进而会丢失部分重要信息,难以达到满意的训练效果。为了更好地发挥LSTM神经网络的优势,解决上述问题,本文在LSTM网络模型的基础上加入了Attention机制。引入Attention机制后,捕获长时依赖特征会更加容易,只需要一次计算就可以将任意2个关键词联系起来,这使得长距离依赖的捕获变得容易。因此,本文提出了Attention-LSTM模型来预测果树蒸腾量。将PCA筛选出的主要影响因子作为输入,预测果树蒸腾量。

Attention-LSTM网络模型的实现步骤为:

1)获取传感器测得的气象数据和土壤墒情数据,利用拉依达法则对异常数据进行筛选和校正。

2)采用主成分分析提取出影响蒸腾量的关键影响因子,减少输入,消除变量间的相关性,同时划分样本训练集和测试集。

3)将主成分分析得出的关键影响因子输入到Attention-LSTM神经网络中,对蒸腾量进行预测。

4)计算损失函数,损失函数选择均方误差为每一轮网络训练后的预测值与实际值的偏差,根据损失函数的值调整各个网络层的权重,判断训练次数是否达到设定的值,如果没有达到设定值则继续训练。

5)对收敛的神经网络进行测试,计算模型的误差来验证模型的好坏,输出预测的蒸腾量并绘制图像。

2.2 预测模型评价指标

本文采用3种误差分析方法,即平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)来验证蒸腾量预测的准确性。由于误差之间可能会出现相互抵消的情况,利用平均绝对误差可以有效地避免这个问题。平均绝对百分比误差是一种衡量预测准确性的统计指标。利用均方根误差可以有效地说明数据的离散程度。误差越小,模型的预测精度越高。

本文将均方误差(MSE)作为验证预测模型性能优劣的评价指标,误差越小说明预测模型越好。

3 基于PCA的果树蒸腾量影响因子的筛选

3.1 研究区概况

本文以山西省运城市的一个6 666.7 m3苹果试验田为研究对象,分别在试验田的4个方位布置传感器,监测多个角落的数据信息。对于苹果园的气象数据,使用多元素百叶箱进行采集;利用土壤墒情传感器,采集苹果园中的土壤环境数据。本文将2015—2020年采集的28 354组数据作为试验数据,每相隔1 h传感器采集1次环境数据,采集的数据有空气温度、空气湿度、大气压强、光照强度、风速、降水量、土壤温度、土壤湿度、pH值、日照时间等。

3.2 数据预处理

数据采集过程中会出现数据缺失、数据重复、数据不均衡以及数据类型不一致等情况,所以在构建神经网络之前,需要对数据进行预处理,主要包括:异常数据筛选与校正、平滑处理以及归一化处理,使所有数据处在同一量纲上,加快模型的训练速度,保证模型稳定收敛,提高预测精度。

经过预处理并将数据进行日平均平滑处理,最终得到4 264组数据集,并对数据集进行样本划分,将其中的3 744组数据作为预测模型的训练数据集,400组数据作为验证数据集,120组数据作为测试数据集。

3.3 果树蒸腾量影响因子筛选

利用传感器采集到的气象数据和土壤墒情数据量大,而且影响果树蒸腾量的环境因子很多[15-17],各环境因子之间具有一定的耦合性,如果将所有变量输入到预测模型中,大量的数据必然会加大模型的训练难度并降低预测精度。因此利用PCA的方法降低输入变量的维数,利用SPSS软件进行主成分分析,对影响蒸腾量的环境因子进行数据筛选。表1为各环境因子的相关性。表中X1为蒸腾量(mm/d)、X2为空气温度(℃)、X3为空气湿度(%)、X4为风速(m/s)、X5为日照时间(h)、X6为降水量(mm)、X7为大气压强(Pa)、X8为光照强度(Lux)、X9为土壤温度(℃)、X10为土壤湿度(%)。

表1 相关性结果Table 1 Correlation Result

空气湿度、空气温度、风速、光照强度、土壤湿度与蒸腾量相关系数分别为0.605、-0.595、0.599、0.634、-0.598,说明这5个环境因子与蒸腾量的相关性较大,其他变量与蒸腾量的相关性较小。因此,初定空气温度、风速、光照强度、空气湿度、土壤湿度为关键影响因子。

表2为主成分累积贡献率,其中方差百分比越大,说明此主成分的贡献率越大。主成分的累积贡献率是提取主成分个数的重要依据,在X1~X10的10个主成分中,其中前3个主成分就可以把变量表达为85%以上,说明前3个主成分基本包含了全部变量所具有的信息,因此本文选择3个主成分进行分析。

表2 主成分累计贡献率Table 2 Cumulative contribution rate of principal components

此外,只考虑累积贡献率是不够的,还要对主成分得分系数进行分析。表3为前3个主成分的得分系数。从表3可以看出,空气温度、大气压强、光照强度在第1主成分载荷较大,空气湿度、土壤湿度在第2主成分载荷较大,风速在第3主成分载荷较大。因此,可以把空气温度、大气压强、光照强度、空气湿度、土壤湿度、风速作为主要影响因子,作为预测模型的输入样本。

表3 主成分得分系数Table 3 Principal component score coefficient

4 结果与分析

4.1 预测模型仿真结果分析

图1为Attention-LSTM模型的损失值,损失值越小表示模型性能越好。图中横轴代表训练次数,纵轴代表损失值,蓝色的线代表训练损失值,黄色的线代表验证损失值。可以观察到当预测模型的训练次数为50次左右时,模型基本达到稳定,训练损失值可以达到0.1,验证损失值可以达到0.05,说明模型预测精度高,具有较高的鲁棒性。

图1 Attention-LSTM模型的损失Fig.1 Loss of the Attention-LSTM model

由于彭曼公式FAO-56PM计算的蒸腾量准确性相对较高,已经成为国际通用的计算蒸腾量的方法[18],因此,本文将彭曼公式计算出的蒸腾量作为Attention-LSTM预测模型的目标输出,该目标输出被用来验证Attention-LSTM模型的预测精度。

Attention-LSTM最终预测结果如图2所示,其中蓝色线是FAO-56PM的值,红线是Attention-LSTM的预测值,可以看出基于Attention-LSTM的神经网络预测模型预测出的值和FAO-56PM的值达到很好地拟合,说明本文的模型预测精度较高。

图2 Attention-LSTM预测结果Fig.2 Attention-LSTM prediction results

4.2 预测模型对比分析

为了验证本文提出的预测模型的性能,采用Attention-LSTM模型对PCA分析的数据集进行训练和测试,将BP模型、RNN模型、LSTM模型、Attention-RNN模型、Attention-LSTM模型进行对比。

结果见图3,可以看出BP模型的预测误差最大,个别样本数据的蒸腾量预测误差超过2 mm/d;RNN模型的误差较大,大部分样本的蒸腾量误差在1 mm/d周围震荡;Attention-LSTM、LSTM和Attention-RNN模型的预测误差较小,其蒸腾量预测误差大部分在1 mm/d附近波动,其中Attention-LSTM模型的误差最小,预测精度最高。

图3 Attention-LSTM与其他模型预测误差比较Fig.3 Comparison of forecast errors between attention-LSTM and other models

表4为各模型预测精度比较结果,其中Attention-LSTM模型的预测精度最高,MAE、MAPE、RMSE和MSE分别为0.387、0.148、0.487和0.062。与BP模型相比,各项指标分别提高了44.7%、15.3%、44.5%、30.3%;与RNN模型相比,各项指标分别提高了33.3%、19.6%、33.7%、16.8%;与LSTM模型相比,各项指标分别提高了28.8%、7.9%、30.2%、15.0%;与Attention-RNN模型相比,各项指标分别提高了20.0%、11.7%、19.9%、10.1%。总体来看,基于Attention-LSTM的果树蒸腾量预测模型具有较好的预测性能,可以准确预测果树蒸腾量。

表4 各模型预测精度比较Table 4 Comparison of prediction accuracy of each model

5 结 论

本文在LSTM神经网络的基础上加入了Attention机制,通过对模型输入变量进行计算,对关键影响因子赋予更高的权重,以帮助模型做出更准确的判断,从而提高预测的精度。与彭曼公式计算出的蒸腾量进行比较,本文的预测模型运用PCA筛选出的空气温度、大气压强、光照强度、空气湿度、土壤湿度、风速,可以计算出精准的蒸腾量,用到的传感器更少,降低了模型的复杂度。与其他模型相比,本文提出的预测模型预测精度高,实现简单,可以在有限的环境数据下,实现更加准确的蒸腾量预测,从而实现果树的需水量预测。

本文主要是针对果园的灌溉进行研究的,相对于大田和温室种植而言并不适用,下一步将继续改进模型,扩大研究范围,争取可以应用到更广泛的农业种植中,以满足农业生产的需要,推动农业的高质量发展。

猜你喜欢

土壤湿度神经网络果树
果树冬季要休眠 易受冻害要注意
果树秋季施肥三要点
果树夏剪有诀窍
基于神经网络的船舶电力系统故障诊断方法
基于人工智能LSTM循环神经网络的学习成绩预测
CLDAS土壤湿度产品适用性评估
荒漠化露天矿土壤湿度监测模型的构建
——以红沙泉矿区为例
MIV-PSO-BP神经网络用户热负荷预测
阜新春播期土壤湿度变化特征分析
三次样条和二次删除相辅助的WASD神经网络与日本人口预测