APP下载

土壤温度时间序列预测的LSTM神经网络研究

2021-11-10汪靖阳郄志红吴天齐刘家树王晓丽张月辰

河北农业大学学报 2021年5期
关键词:方根土壤温度神经网络

汪靖阳,郄志红,吴天齐,刘家树,王 晨,王晓丽,张月辰

(1.河北农业大学 城乡建设学院,河北 保定 071001;2.国网北京市电力公司丰台供电公司,北京100000;3.河北省水利水电第二勘测设计研究院,河北 石家庄 050000;4.河北省节水灌溉装备产业技术研究院,河北 石家庄 050000;5.河北农业大学 农学院,河北 保定 071001)

适宜的土壤温度是作物生长发育的重要环境因素,在作物全生育期都起着关键作用。为此,土壤温度在现代土壤系统分类中往往作为土壤诊断的重要特性之一[1]。在农田灌溉工作中,土壤温度影响着作物的生长发育。比如作物在其生长关键期短期强低温会导致其生长受到抑制[2-4]。因此,研究土壤温度的预测模型对农业生产具有重要意义。

土壤温度的预测模型基本上可分为机理模型和经验模型。机理模型,也称“确定性模型”,主要是1种基于土壤温度变化的平衡方程而建立的数学模型,但由于其数学表达式的建立较为困难,所需的参数较多而且确定困难,在实际应用中难以推广。经验模型,也称“不确定性模型”,包括线性回归模型、神经网络模型等。相较于机理模型,经验模型建立简单,且参数少,因此近十几年来,在国内外已得到了广泛应用。邹平和杨劲松等[5]利用BP神经网络模型对长期定位监测点表层土壤温度时间序列数据进行了分析和预测取得了良好的效果;Saeed Samadianfard[6]等将小波神经网络模型、基因表达式编程和人工神经网络模型3种模型进行对比,分别对土壤温度进行了预测。刘家树[7]采用LSTM神经网络模型对土壤温度时间序列分析,取得了良好的效果

RNN由BP神经网络改进而来,在BP神经网络的基础上,将隐藏层内的神经元之间进行了连接,使RNN网络会记忆以往输入的信息并应用于当前输出的计算中,增强了神经网络对时间序列数据的训练效果。RNN网络近年来在处理时间序列数据的应用中取得了一定成果,但其在应用时仍存在梯度消失和梯度爆炸问题[8-10]。1997年,Hochreiter等[10]首次提出了LSTM神经网络,并在长期的应用实践中发现LSTM神经网络比RNN泛化能力更强[11-14]。

为了便于分析土壤温度数据和指导农田灌溉,常选择土壤的时均和日均温度数据来表示数据特征:土壤时均温度数据能够获得日内土壤温度变化情况和日最低温度,用于描述作物寒害强度,对防控作物寒害具有指导作用[15];土壤日均温度数据能够反应作物在生育期内受到的低温冷害情况,对指导灌水施肥具有重要意义[16]。

1 研究区域及研究方法

1.1 研究区域

本研究的试验地点位于河北省石家庄市藁城区,地处太行山东麓河北平原中南部,坐标北纬37°51′~ 38°18′、东经 114°39′~ 114°59′[17]。藁城区气候为暖温带半湿润大陆性季风气候。全年的年平均气温为12.8 ℃,其中1月和7月分别为全年最冷和最热的时间,其当月平均气温为-3.5 ℃和26.4℃。藁城区全年平均降水量为494 mm[16]。

1.2 数据获取

在不同深度下的土壤内布置土壤温度传感器,并与数据采集器相连。数据采集器每1 h采集1次温度数据并保存。本研究选择藁城区2017年到2020年间10~30 cm深度处的数据作为本试验的原始数据,共计34 430条。首先对原始数据进行降采样操作,将原数据聚合为不同深度的每日平均土壤温度数据,共计991条,并建立日均土壤温度预测模型;然后直接选取2019年5月初至6月底各土层的温度数据建立基于LSTM神经网络的时均土壤温度模型。本研究选择上述时间段的数据建立时均土壤温度模型是由于该时段内试验区域的温度较接近,更容易建立模型。

1.3 LSTM神经网络原理

LSTM神经网络是RNN的扩展,相较于RNN可以使自循环的权重视上下文而定,通过细胞状态将信息向后传播,这个传播的过程也称记忆。如图1所示,LSTM神经网络具有不同的结构,有4个以特殊方式相互影响的神经网络层。通过门结构对网络增删信息,通常由1个Sigmoid神经网络层和逐点乘积操作组成[18-20]。

图1 LSTM神经网络结构Fig.1 The LSTM neural network structure

(1)遗忘门f(t)

遗忘门决定在细胞传递信息的过程中对信息的取舍,由下式表示:

(2)输入门g(t)

输入门决定向细胞状态中添加新的信息,由下式表示:

(3)输出门q(t)

输出门决定了当前时刻的最终输出,由下式表示:

其中b,U和W分别是LSTM细胞中的偏置、输入权重和遗忘门的循环权重,σ表示Sigmod激活函数,hj(t-1)和xj(t)分别表示由上一时间序列输出的土壤温度和当前时间序列输入的土壤温度。

2 数据分析与预处理

2.1 土壤温度时序变化分析

从图2可以看出,10、20 cm和30 cm的土壤温度的变化规律相似,即在每年的2月至7月总体呈上升趋势,8月至次年2月总体呈下降趋势。当图2中的土壤温度呈上升趋势时,深层土壤温度通常低于浅层土壤温度;反之,当土壤温度呈下降趋势时,深层土壤温度通常高于浅层土壤温度。这可能是由于与深层土壤相比,浅层土壤温度受到大气温度等外界因素的影响更直接造成的。

图2 距地表10~30 cm处时均土壤温度时间序列Fig. 2 Time series of average edaphic temperature at 10 ~ 30 cm from the surface

由图3可知,距地表10 cm和20 cm的土壤日内温度变化剧烈,距地表30 cm表层土壤日内温度変化相对平稳,浅层土壤温度主要受太阳辐射强度、日照时长、风速、和大气温度等影响。

图3 距地表10~30 cm处日均土壤温度时间序列Fig. 3 Time series of average daily edaphic temperature at 10 ~ 30 cm from the surface

2.2 土壤温度数据的预处理

将本研究获取的土壤温度时间序列数据降采样,总计991个,为了检验日均土壤温度预测模型的效果,将原始数据划分为训练集和测试集两部分:即2017年至2019年的土壤温度数据作为训练集,共计725个,而2019年7月至2020年2月的土壤温度数据为检验模型效果的测试集,共计266个。

将原始数据集的2019年5、6月份的数据集,以同样的方式划分为训练集和测试集:即2019年5月至6月中旬数据作为训练集,共1 110个,剩余342个数据为检验模型效果的测试集。在建立土壤温度预测模型前先对土壤温度原始数据进行归一化[22]。

3 土壤温度预测的LSTM神经网络结构

神经网络输入层和输出层神经元个数由输入样本和目标样本维数确定,而隐含层神经元个数的确定没有固定的规范,相关研究常常采用试凑法确定,因此,本研究分别选择60和80作为2个隐藏层的神经元数目。

延迟坐标维数是确定时间序列模型输入样本和输出样本个数的重要参数,其大小主要由时间序列数据的特征和模型决定[5]。本研究采取试凑法来确定模型的延迟坐标维数:假定延迟坐标维数的步长和取值范围,先选择取值范围的最小值再依次递增,得到不同延迟坐标维数的样本预测值与真实值的均方根误差(RMSE),最后取均方根误差(RMSE)最小时的作为模型最优的延迟坐标维数。

3.1 基于LSTM神经网络的日均土壤温度预测模型

根据图2可知,10~30 cm的土壤温度时间序列数据变化趋势相似,可以采用相同的LSTM神经网络模型。运用试凑法确定模型参数,以距地表20 cm的土壤温度数据为例:设置延迟坐标维数的最小值为3,最大值取21,步长为1,逐步递增,经LSTM神经网络对20 cm的土壤温度数据训练后,得到模拟值与实测值均方根误差。由图4可知,随着增加,先增大后逐渐趋于平稳,当时其对应的最小,因此确定,输入层神经元的数目设为2。因此本研究LSTM神经网络结构为2-60-80-1,如图5所示。

图4 不同延迟坐标条件下日均土壤温度预测模型的均方根误差Fig. 4 Root mean square error (RMSE) of daily mean edaphic temperature prediction model under different delay coordinate conditions

图5 基于LSTM神经网络的日均土壤温度预测模型结构Fig. 5 Structure of daily mean edaphic temperature prediction model based on LSTM neural network

3.2 基于LSTM神经网络的时均土壤温度预测模型

该建立过程与日均土壤温度预测模型相似:如图6所示,通过试凑法得到最优的延迟坐标维数为3,建立基于LSTM神经网络的时均温度预测模型,结构为2-60-80-1,结构同图5所示。

图6 不同延迟坐标条件下时均土壤温度预测模型的均方根误差Fig. 6 Root mean square error (RMSE) of time-mean edaphic temperature prediction model under different delay coordinates conditions

4 计算结果及分析

4.1 日均土壤温度预测结果分析

使用10、20和30 cm的各土层温度数据对上述基于LSTM神经网络的日均土壤温度预测模型进行训练,并设定网络性能函数为均方误差。以2019年6月至次年2月的259个10、20和30 cm的各土层温度数据作为测试样本,经模型预测之后,获得如图7所示各土层温度预测值与实测值的对比图示以及表1中LSTM模型评价指标。

图7 10~30 cm处日均土壤温度的预测值与实测值Fig. 7 Predicted and measured daily mean edaphic temperature at 10 ~ 30 cm

表1 不同深度条件下LSTM神经网络的时均土壤温度预测模型的评价指标Table 1 Evaluation index of hour-average edaphic temperature prediction model based on LSTM neural network under different depth conditions

如图7所示,经训练后模型的预测值与实测值在趋势上吻合程度较高,且由表1可知,在处理日均土壤温度时间序列数据时,该模型拟合效果较好,特别是预测30 cm处土壤温度时间序列时,其决定系数达到0.997,均方根误差达到0.600,均方误差达到0.360,由此证明与10 cm和20 cm处日均土壤温度时间序列数据相比,30 cm处日均土壤温度时间序列数据更适合该模型应用。这说明将LSTM神经网络应用到日均土壤温度时间序列预测中具有一定可行性。

4.2 时均土壤温度预测结果分析

使用10、20和30 cm的各土层温度数据对上述基于LSTM神经网络的时均土壤温度预测模型进行训练,并设定网络性能函数为MSE。以2019年6月份数据作为检验LSTM神经网络预测能力的测试样本,得到如图8所示各土层温度预测值与实测值的对比图示。

可以看出经训练后模型的预测值与实测值在趋势上吻合程度较高,且由表2可知,该模型的决定系数较高,对10~30 cm的时均土壤温度时间序列数据拟合效果较好,说明该模型用于土壤的时均温度预测具有一定的实用性。但在个别时间模型模拟结果有所偏差,如在当天13至14时,该模型的预测值常常会低于实测值0.2~0.3 ℃。

图8 10~30 cm处时均土壤温度的预测值与实测值Fig.8 Predicted and measured values of edaphic temperature at 10 ~ 30 cm

表2 不同深度条件下LSTM神经网络的时均土壤温度预测模型的评价指标Table 2 The estimate indicator of hour-average edaphic temperature predictied model based on LSTM neural network under different depth conditions

4.3 与BP神经网络模型的效果比较

相关研究表明,BP神经网络模型——误差反向传播多层前向反馈神经网络在土壤温度时间序列预测方面已经表现出较好的效果[5]。为进一步验证LSTM神经网络模型在土壤温度时间序列预测方面的优势,本研究应用BP神经网络模型再对原始数据进行拟合,并将求解结果与LSTM神经网络模型的求解结果进行对比分析。本研究采用的BP神经网络结构参考文献[5],采用3-3-1结构。

通过求解结果的均方误差(MSE)、均方根误差(RMSE)和决定系数(R2)等模型评价指标,对2种土壤温度时间序列预测模型的优劣进行讨论,鉴于数据种类较多,不失代表性地,使用对10、20和30 cm的3个土层数据模型计算结果的均方根误差(RMSE)的平均值作为判定2种模型优劣判定的标准,模型分析结果如图9所示。

图9 LSTM神经网络与BP神经网络对10~30 cm处土壤温度时间序列的平均均方根误差Fig. 9 Average root mean square error of LSTM neural network and BP neural network for soil temperature time series at 10 ~ 30 cm

在拟合日均土壤温度数据时,LSTM神经网络模型较之BP神经网络模型,均方根误差(RMSE)平均降低0.038;在预测时均土壤温度数据时,LSTM神经网络模型较之BP神经网络模型,均方根误差(RMSE)平均降低0.068。结果表明,相较于BP神经网络模型LSTM神经网络模型用于本试验区域的土壤温度时间序列预测具有更高的评价精确度。

5 结论

试验结果表明,由LSTM神经网络建立的土壤温度预测模型其模拟效果能够达到土壤温度日常预报的基本标准,对日均土壤温度预测和时均土壤温度预测均能达到较高的准确度,且相较于BP神经网络模型在土壤温度时间序列预测上亦具备一定优势。此外,该模型对不同深度的土壤温度数据的预测效果也不尽相同:相较于距地表10 cm和20 cm的土壤温度数据,基于LSTM神经网络的日均土壤温度预测模型对距地表30 cm的土壤温度时间序列数据的预测效果更好,并且模型的RMSE、MSE和R2均优于使用其他深度的土壤温度数据训练的LSTM神经网络模型。LSTM神经网络模型对土壤温度时间序列预测时,不需要建立复杂的数学模型,应用简单,参数少,方法简单、快捷、实用。

猜你喜欢

方根土壤温度神经网络
越冬期埋土防寒层厚度对贺兰山东麓葡萄园土壤温度的影响*
基于神经网络的船舶电力系统故障诊断方法
基于SHAW模型的青海湖流域土壤温度模拟①
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
我们爱把马鲛鱼叫鰆鯃
地下滴灌葡萄园土壤温度的时空变化特征
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
数学魔术——神奇的速算
数学魔术