APP下载

基于Bi-LSTM的芒果产量预测

2020-04-23刘海姣秦亮曦秦川苏永秀

电子技术与软件工程 2020年8期
关键词:芒果广西神经网络

刘海姣 秦亮曦* 秦川 苏永秀

(1.广西大学计算机与电子信息学院 广西壮族自治区南宁市 530000)

(2.广西气候中心 广西壮族自治区南宁市 530000 3.广西气象科学研究所 广西壮族自治区南宁市 530000)

我国热带果树的水果产量约占世界热带果树水果总产量的28%,种类繁多,品质优良。但是我国属于热带果树种植的北缘地带,受气候变化影响,每年产量的波动较大。

芒果产量信息对于我国芒果生产、加工、出口、消费等都有重要作用,对我国农业产业发展具有重要意义。科学、准确地预测芒果产量,可以为相关部门优化热带水果生产结构提供良好的参考与借鉴,具有较好的研究价值。

本研究旨在利用历年广西芒果产量及同期气象数据,建立Bi-LSTM 芒果产量预测模型,对广西的芒果产量进行预测。

1 相关工作

长短期记忆网络(LSTM)是一种特殊的循环神经网络(RNN)。由于其独特的结构,LSTM 非常适合于处理时间序列数据的预测问题。目前,国内对于农作物产量的预测方法主要有BP 神经网络模型及其改进方法[1]、灰色预测模型[2]和ARIMA 模型等,以及上述方法的组合模型等。其中,BP 神经网络模型是各种农作物产量预测的常用方法,但是传统的BP 神经网络模型存在学习收敛速度慢、易陷入局部极值等问题,其预测精度并不理想[3]。灰色预测模型对非平稳序列,波动较大的数据序列预测效果较差,水果产量变动的随机性、非平稳性和复杂性,给水果产量的中长期预测带来了很大的困难。

芒果产量数据属于波动较大的时间序列。其中1991-1994年呈现上升趋势,经过1994-1996年3年小幅波动后,1997年又出现了快速下降趋势。后面每年的产量都会出现小幅或较大的波动,因此在建立芒果产量预测模型时,需要充分考虑其波动性大的特点,选择能反映这一特点的模型,而Bi-LSTM 模型正好具有解决此类问题的优势。

2 基于Bi-LSTM预测模型及算法设计

2.1 长短期记忆网络(LSTM,Long Short-Term Memory)

长短期记忆网络是一种时间循环神经网络,是为了解决一般的RNN 存在的长期依赖问题而专门设计出来的。其结构就是把循环神经网络中隐含层换成LSTM 模块。LSTM 用细胞状态表示门控制单元状态。细胞状态由三个门来控制,这三个门分别称为输入门(Input Gate)、遗忘门(Forget Gate)和输出门(Output Gate)。

2.2 基于Bi-LSTM的芒果产量预测模型及算法

2.2.1 基于Bi-LSTM 的芒果产量预测模型

图1:基于Bi-LSTM 的芒果产量预测模型

图2:各模型预测拟合效果

芒果产量时间序列数据存在影响产量的气象因素多但积累的历史数据年份少的特点,使用单向的LSTM 难免存在由于数据较少带来的问题,而Bi-LSTM 通过正反两个方向的训练提高模型的性能[4]。因此,采用了Bi-LSTM 来构建广西芒果产量的预测模型(如图1 所示)。

该模型共由三个部分组成:数据输入及预处理层、隐含层和输出层。隐含层由Bi-LSTM 层和全连接层构成。

Bi-LSTM 的训练过程具体如下:

对历年芒果产量及相关的气象数据进行预处理,包括归一化,利用气象因素在时间上的相似性填补缺失值等,同时将预处理过的数据划分为训练集和测试集;

初始化模型参数,不断尝试Bi-LSTM 的层数,节点数,Epoch以及迭代次数;

对于训练样本中的每个<x,y>

自前向后的正向隐藏层更新公式为:

自后向前的反向隐藏层更新公式为:

正反向隐藏层信息的输出层更新公式为:

利用公式(4)[5]计算输出值,并传给输出层。

2.2.2 基于Bi-LSTM 的芒果产量预测算法

算法的步骤如下:

step 1:数据预处理。对数据进行相关性分析和归一化处理,并将数据划分为训练数据集和测试数据集。

step 2:初始化模型参数。设置实验所得到的Bi-LSTM 模型最佳层数,输入层、隐藏层及输出层神经元数,学习步长初始值,Epoch 以及Dropout 概率等参数。

step 3:训练阶段。利用训练数据集,对Bi-LSTM 模型进行训练。包括正向计算、反向计算及全连接层计算、得到模型输出结果,使得输出结果与实际值的误差最小化。

step 4:测试阶段。将测试数据集输入到训练好的Bi-LSTM 芒果产量预测模型中,得到芒果产量预测结果,并进行误差分析。

3 实验及结果分析

实验数据是广西气象局提供的1991-2014年广西某地芒果产量及同期气象要素数据。

通过相关性分析,从9 个要素24 个芒果生产周期,共计324个要素(特征)中选取了106 个相关性显著的特征作为Bi-LSTM模型的训练特征。

在广西芒果产量预测问题中,需要采用含有气象要素和产量的训练数据集对Bi-LSTM 模型进行训练,本文选取1991-2002年的气象数据和产量作为训练数据,2003-2014年的气象数据作为测试数据,对训练完成的Bi-LSTM 模型进行测试,预测测试年份的芒果产量并与实际产量进行比较。

3.1 实验参数设置

为了评估Bi-LSTM 模型对广西芒果产量数据预测的性能,将把Bi-LSTM 模型与其它几个模型进行比较。实验的参数epochs 表示训练次数,一次训练即所有训练样本均在神经网络中经过了一次前向传播和一次后向传播的过程。

主要设置4 个对比模型,每个对比实验情况均运行10 次取平均值。

(1)SVR 模型:支持向量回归(Support Vector Regression, SVR)模型。

(2)BP 模型:BP(Back Propagation)神经网络模型。

(3)LSTM 模型:单层长短期记忆神经网络模型。

(4)GRU 模型:GRU(Gated Recurrent Unit, GRU)是LSTM的一种变体,在GRU 中只有更新门和重置门。

3.2 评价指标

采用均方误差(MSE,Mean Squared Error)和均方根误差(RMSE,Root Mean Square Error)[5]作为评价指标对各模型的性能进行评价。MSE 和RMSE 值越小,表明预测值与实际值之间偏差越小,预测性能越好,反之则预测性能越差。

表1:不同模型预测值的RMSE、MSE 比较

3.3 结果及分析

五个不同模型的预测值及实际值如图2 所示,而各模型预测的MSE,RMSE 如表1 所示。

在相同实验参数设置下,Bi-LSTM 模型的预测值与实际值更加相近,产量趋势也比其它模型更加拟合。Bi-LSTM 模型的RMSE分别比SVR、BPNN、LSTM、GRU 模型的RMSE 降低了26.2%、31.4%、1.3%、9.4%。而MSE 分别比SVR、BPNN、LSTM、GRU模型的MSE 降低了45.6%、52.9%、2.5%、18.0%。

Bi-LSTM 模型的预测准确率明显优于比较的4 个模型,获得了较好的预测效果。为了了解增加LSTM 层数对准确率的影响,把单层和多层LSTM、Bi-LSTM 预测性能进行了比较,单层Bi-LSTM模型效果比较好,而双层Bi-LSTM 模型效果有下降,这也许跟实验数据规模不够大有一定关系,所以复杂模型的优势发挥不出来。

4 结语

为了更准确地预测芒果产量,设计了基于Bi-LSTM 网络的芒果产量预测模型,并给出了该模型的算法步骤。将广西某地区芒果产量及同期相关性较为显著的气象要素数据用于构建Bi-LSTM预测模型,并将训练好的Bi-LSTM 模型与SVR、BPNN、GRU、LSTM 等模型进行了性能对比。实验结果表明,Bi-LSTM 模型与上述4 个模型相比,均方根误差大幅降低,同时预测产量更加接近于实际产量。本研究可以为相关部门优化热带水果生产和其它农作物产量预测研究提供较好的参考价值。

猜你喜欢

芒果广西神经网络
我才不要穿
神经网络抑制无线通信干扰探究
小洞会“咬”人
小洞会“咬”人
广西广西
广西尼的呀
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
广西出土的商代铜卣