APP下载

波致海床瞬态液化对再悬浮贡献率的深度学习预测方法*

2022-01-22冯春健刘汉露刘锦昆贾永刚权永峥

工程地质学报 2021年6期
关键词:海床瞬态神经网络

冯春健 刘汉露 刘锦昆 贾永刚 侯 方 薛 凉 权永峥

(①中石化石油工程设计有限公司, 东营 257020, 中国) (②中国海洋大学, 青岛 266100, 中国)

0 引 言

海底沉积物发生侵蚀再悬浮的主要驱动力是波浪和海流。一种侵蚀再悬浮作用机制是波浪产生的轨道切应力和流致剪切应力超过了海床表层沉积物的强度,使其发生再悬浮(Green et al.,2014)。另一种侵蚀再悬浮作用机制是:在波浪循环荷载的作用下,渗透性差的海床会发生孔隙水压力的累积甚至液化(张少同等, 2016),当液化作用产生时,海床一定深度范围内细颗粒物被渗流输运到海水中(Zhang et al.,2017),这种“瞬态泵送”过程对侵蚀再悬浮的贡献率达到20%~60%(Zhang et al.,2018)。进一步准确预测不同海况下瞬态泵送对再悬浮的贡献率对近岸侵蚀量的定量计算和侵蚀灾害的有效评估具有重要意义。

海底侵蚀再悬浮研究的一个重要指标是近底海水的悬沙浓度(Suspended Sediment Concentration, SSC)。海水悬沙浓度预测的经典方法是通过现场采集沉积物和海水样品进行室内分析,建立物理模型和统计模型(Dey et al.,2018)。这些方法针对实时短期预测难以适用,尤其是实时评估预测波致瞬态泵送对再悬浮的贡献率。随着计算机和人工智能的发展,机器学习和深度学习方法在地质灾害(鄢好等, 2019; 杜星等, 2020; 刘艳辉等, 2021)和海洋泥沙动力学研究中逐渐发挥重要作用(Mohammad et al.,2020; Huang et al.,2021)。深度学习方法可以从大量数据集中提取信息,这些信息可以作为理解深层次物理规律的佐证(Goldstein et al.,2019)。人工神经网络(ANN)已广泛应用于海岸泥沙动力学研究,在悬沙浓度(时间序列数据)的预测(Mohammad et al.,2016)和沿岸泥沙输移速率计算(Maanen et al.,2010)等方面表现突出。神经网络强大的学习能力也伴随着训练时容易过拟合和误差叠加的缺点,训练出来的模型只适用于当前的数据。此外,它们需要大量的超参数调整,这大大增加了训练所需的时间。

长短时记忆(Long Short-Term Memory, LSTM)循环神经网络由一个输入门、遗忘门和输出门组成,具有不同于一般神经网络的结构,可以解决上述问题(Hochreiter et al., 1997; Kaveh et al.,2020)。LSTM神经网络可以用特殊的结构将无意义的信息舍弃,从而防止了梯度下降引起的梯度消失或梯度爆炸的现象,解决神经网络应用于时间序列预测中所带来的误差叠加问题。本文应用2016~2017年冬季在中国黄河水下三角洲观测到的悬沙浓度、瞬态泵送和水动力学数据集训练和测试LSTM深度学习预测模型,并与两种常用的时间序列预测模型(支持向量回归和人工神经网络)进行性能比较。

1 研究区和数据集

为了训练和测试波致海床瞬态液化对再悬浮贡献率的深度学习预测模型,于2016~2017年冬季在黄河水下三角洲地区的埕岛海域进行了海水悬沙浓度和水动力条件的原位长期观测,观测点(118.900 255 2°E, 38.166 741 14°N)位置如图 1 中所示。

图 1 研究区地理位置:(a)现代黄河水下三角洲地理位置(b)观测点位置(c)观测所用到的仪器设备Fig. 1 Location of the study area:(a) Geographical location of the underwater delta of the modern Yellow River(b) Position of observation point(c) Instruments and equipment used for observation

1.1 研究区概况

现代黄河三角洲形成于1855年黄河改道后,研究区所在的埕岛海域位于中国半封闭式渤海西南部,在渤海湾和莱州湾之间( 图 1b) 。研究区位于济阳断陷区,地形较平坦,表层沉积物由粉砂(62.3%)和黏土(37.4%)组成,平均粒径为0.043 mm。冬季风暴事件的经常发生导致海底侵蚀、液化等地质灾害频繁(杨作升, 1993)。1976年黄河改道至清水沟后,刁口叶瓣废弃,河流泥沙供应减少(Xue et al.,1993),北岸发生了强烈的风浪侵蚀再悬浮和泥沙输运,岸线不断后退。

影响再悬浮量(悬沙浓度)变化的机制主要包括河流输入、波浪或水流引起的局部再悬浮和沉降过程(Maa et al., 2007)。在本研究区,由于刁口叶瓣废弃,河流输入导致悬沙浓度变化可以忽略,波浪是造成黄河水下三角洲发生大量侵蚀再悬浮的控制因素(张少同等, 2016)。波浪对海床沉积物的作用不仅包括轨道切应力,海平面的波峰波谷循环交替变化对海床施加垂向循环荷载,会导致瞬态和残余两种孔压响应(Jeng, 2003),对应着两种不同的渗流模式——瞬态渗流和累积渗流。波峰波谷的垂向振荡过程中,波峰时在海床中引起下压力,波谷时在海床中产生上吸力,导致海床和海水的界面处发生垂向的瞬态渗流。波致海床孔压所引发的垂向渗流,在海床液化之前,强度往往较小,但持续的常态波浪作用或骤增的风暴浪引起海床瞬态液化后,会发生“瞬态泵送”现象,即海床中的细颗粒会被输运到海床表面,进一步被水流搬运、悬浮,这一过程对再悬浮的贡献量不可忽视,可达20%~60%(Zhang et al., 2018)。

1.2 数据集

在观测点位置(118.9002552°E, 38.16674114°N)的海床表面布放了四脚架平台和海底实验舱(图 1),四脚架平台上和海底实验舱内各装有一台波潮仪(virtuoso, RBR,加拿大,内置压力传感器)和一台浊度计(Concerto RBR,加拿大,内置光学后向散射传感器)。海水浊度和波浪参数的记录分别以1次/3 s的连续采集模式和5 min·h-1(6 Hz)的burst采样模式进行。连续、同步测量2016年12月18日至2017年1月11日的水深、波浪、海水浊度以及海底实验舱内的波浪、海水浊度参数。

为了分析瞬态泵送对再悬浮的贡献率,需要得到实验舱内外同一高度的海水悬沙浓度。四脚架搭载的海底边界层悬浮物浓度剖面仪(Argus Surface Meter IV,Argus公司,德国),通过内置的OBS传感器阵列(间距1 cm)以1次/30 min的burst模式来记录近底边界层内(距底0~1.8 m)的悬沙浓度剖面。

本文数据集包括的参数有:水深(D)、有效波高(Hs)、有效波周期(Ts)、实验舱内悬沙浓度(SSCin)、实验舱外悬沙浓度(SSCout)。为了使所有时间序列的长度都相同,同时消除测量噪声,对所有数据每半小时取平均。上述5个参数作为自变量,悬沙浓度贡献率(C)为目标变量,定义为因变量。建立基于LSTM的深度学习预测模型需要用到的时间序列数据如图 2 所示。

图 2 LSTM的训练和预测数据Fig. 2 Training and prediction data of LSTM

2 研究方法

2.1 LSTM神经网络

循环神经网络(Recurrent Neural Network, RNN)是一类用于处理序列数据的神经网络(Rumelhart et al.,1986)。相比于ANN的优点在于,在获取每个神经元的输出的同时,也将其作为输入再次反馈给神经元。这种方式不仅在每个时间步长中接收新的信息,而且还向这些新信息中添加先前输出的加权值。这样RNN的神经元就具备了先前输入的“记忆”。长短时记忆(Long Short-Term Memory, LSTM)循环神经网络是一种特殊类型的RNN,可以规避常规RNN中梯度爆炸和梯度消失的问题(Hochreiter et al., 1997)。LSTM网络由输入层、隐含层和输出层组成,其结构类似于RNN。但RNN与LSTM的不同之处在于,LSTM用一个记忆单元取代了常规RNN的基本单元(Graves et al.,2013)。如图 3 所示,该记忆单元包含3个门函数(输入门、遗忘门和输出门),而且定义了“细胞状态”(ct)。门函数可以在训练中记录过去的关键特征,并根据权重选择不重要的特征来遗忘,可以轻松地读取和更新长时间序列的信息。

图 3 用于数据预测的长短时记忆循环神经网络结构Fig. 3 The structure of short-and long-term memory cyclic neural network for data prediction

在t时刻,xt为LSTM细胞的输入数据(多参数时则是多维度矩阵);ht-1为LSTM单元在t-1时刻的输出;ct为t时刻细胞状态值,用来保存重要信息;ht是t时刻LSTM单元的输出。LSTM单元的计算过程包括以下步骤:

首先,细胞状态候选值

(1)

式中:Wc为权重矩阵;bc为偏差。

输入门的值it用式(2)计算,输入门控制将当前输入数据更新为细胞的状态值。

it=σ(Wi· [ht-1,xt]+bi)

(2)

式中: σ为sigmoid函数;Wi为权重矩阵;bi为偏差。

遗忘门用来控制遗忘上一层细胞状态的内容,根据上一序列的ht-1和本序列的xt为输入,通过sigmoid激活函数,判断上一层需要保留或去除的细胞状态内容。遗忘门的值ft用式(3)计算。

ft=σ(Wf· [ht-1,xt]+bf)

(3)

式中:Wf为权重矩阵;bf为偏差。

用遗忘门和输入门将t-1时刻细胞状态ct-1更新为t时刻细胞状态ct:

(4)

最后要基于细胞状态保存的内容来确定输出什么内容。即选择地的输出细胞状态保存的内容。输出门的值ot用式(5)计算,输出门控制存储单元状态值的输出。

ot=σ(Wo·[ht-1,xt]+bo

(5)

式中:Wo为权重矩阵;bo为偏差。

LSTM单元的最终输出:

ht=ot×tanh(ct)

(6)

由于上述这种LSTM内部参数的共享机制,可以通过设置权重矩阵的维数来控制输出的维数。在LSTM神经单元中,输入之间有一个很长的延迟和反馈。梯度既不会爆炸也不会消失,因为LSTM体系结构中存储单元的内部状态保持着一个恒定的错误流。

在神经网络训练中,防止过拟合是至关重要的。Srivastava et al. (2014)提出了Dropout方法来防止神经网络训练中的过拟合。在神经网络的层与层之间的训练过程中,一些神经元以一定的概率随机从网络中脱落。

2.2 LSTM 预测模型

2.2.1 数据预处理——归一化

因为LSTM递归神经网络的转换函数是双曲正切函数(tanh函数:ex-e-x/(ex+e-x)其函数值范围为- 1~1),训练集和测试集数据归一化。归一化方程如下:

(7)

式中:xmax和xmin分别为数据集(训练集和测试集)的最大值和最小值;x为输入值;z为x的转换值。

2.2.2 分割训练集和测试集

将数据集拆分为训练集和测试集,这里将前9天的数据作为训练集,后3天的数据作为测试集。然后将训练集和测试集分别拆分为输入和输出变量。最后将输入变量(X)转变成LSTM需要的三维格式,即[samples, timesteps, features]。

2.2.3 定义和拟合LSTM模型

为了建立预报模型,本研究采用了两层LSTM单元,预测值在第3层输出。LSTM的超参数包括隐含层数、神经元数、学习率、激活函数、批处理规模、时间点数(epoch)和损失函数。神经网络的超参数决定了网络如何运行,进而决定了网络的准确性和有效性。

在本研究中,根据调整后的超参数值对模型性能的影响,手动调整LSTM超参数进行模型优化。超参数设置如下,学习率为0.0001,两层LSTM神经元数量均为100个,输出层设置一个神经元,也作为预测值yt的输出。Dropout设置为0.5。所有的激活函数都使用了整流线性单元(ReLus),因为ReLus除了计算过程简单之外,还可以有效地进行梯度下降和反向传递,从而防止梯度爆炸和消失。

2.3 机器学习

2.3.1 支持向量回归(Support Vector Regression, SVR)

支持向量回归是由Vapnik et al. (1997)提出的。支持向量回归算法包括不敏感损失函数和惩罚因子函数; 因此,它比支持向量机算法更具有鲁棒性。SVR算法是将数据投影到一个高维超平面后,计算每个点到超平面的总距离。如果一个超平面是用最小总距离确定的,那么这个超平面就是解。SVR是预测整个时间序列最常用的方法。

2.3.2 人工神经网络(Artificial Neural Network, ANN)

反向传播网络(Back Propagation Network, BPN)是目前最常用的监督学习ANN模型(Rumelhart et al.,1986)。BPN是一种结合了逆向传递、梯度下降和链式法则的优化算法。采用梯度下降法从参数的初始位置推进到最陡的下坡方向,并更新参数位置。斜率信息通过导数函数(计算函数斜率)得到。梯度下降利用这一特性来优化损失函数。

2.4 性能评价标准

采用均方根误差(Root Mean Squared Error, RMSE)、平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)、平均平方误差-标准偏差(Root Mean Squared error-Standard Deviation Ratio, RSR)这3个常用的统计变量来比较LSTM的真实值与预测值的偏差,以评价LSTM的预测性能。RMSE、MAPE、RSR分别表示为式(8)~式(10)。

(8)

(9)

(10)

平均平方误差-标准偏差在0~1之间,越接近0的情况下模型性能越好,一般认为RSR在0.7以下时模型能很好地预测实测值。

3 结 果

3.1 预测结果

图 4和图 5 用不同的形式展示了SVR模型、ANN模型、LSTM模型做的瞬态泵送贡献率实际值和预测值的对比。从图 4 中,散点图的拟合直线斜率和R2越接近1,说明预测的误差越小。LSTM模型和ANN模型具有相似的精度,SVR模型的预测比较分散,误差更大。

图 4 83.5 h内实测与预报贡献率的散点图Fig. 4 Scatter plot of the measured and forecast contribution rate within 83.5 hoursa. SVR; b. ANN; c. LSTM

图 5 各模型预测结果Fig. 5 Prediction results of each modela. SVR; b. ANN; c. LSTM

应用MAPE值、RMSE值和RSR值评价3种模型的性能。由表 1 可以看出,LSTM模型、ANN模型的误差值要比SVR模型小得多。LSTM模型的MAPE值分别比SVR模型和ANN模型的MAPE值低85.31%、70.11%; LSTM模型的RMSE值分别比SVR模型和ANN模型的RMSE值低83.07%、63.97%; LSTM模型的RSR值分别比SVR模型和ANN模型的RSR值低79.09%、55.49%。这些结果表明,LSTM模型显著优于SVR模型和ANN模型。

表 1 SVR,ANN,LSTM 模型的MAPE值、RMSE值、RSR值Table 1 MAPE values,RMSE values and RSR values of SVR,ANN and LSTM models

3.2 SVR,ANN,LSTM模型不同预测时间效果对比

从误差变化的趋势上来看,图 6中显示的是MAPE和RMSE随不同预测时间的变化。红色实线代表RMSE,黑色实线代表MAPE。SVR和LSTM的预测时间为36 h的条件下,误差明显增大; 而后SVR和LSTM的MAPE逐渐减小,但ANN和LSTM的RMSE逐渐增大。ANN的RMSE和MAPE逐渐减小。从数值大小来看,如图 7 和图 8,SVR和ANN的两种误差在12 h和24 h相差不大,但远大于LSTM; 后面预测时间增加,误差远均大于LSTM和ANN。ANN和LSTM相比,LSTM的两种误差均小于ANN。此外,RMSE虽然在48 h后有下降趋势,但是变化量和绝对值小于ANN。由此也可以证明,LSTM的性能优于ANN。

图 6 各模型不同预测时长结果对比Fig. 6 Comparison of the results of different prediction durations of different modelsa. SVR; b. ANN; c. LSTM

图 7 各模型不同预测时间MAPE的值Fig. 7 MAPE values of various models at different prediction times

图 8 各模型不同预测时间RMSE的值Fig. 8 RMSE values of each model at different prediction times

4 结 论

本文建立了基于LSTM的瞬态液化对再悬浮贡献率的深度学习预测模型,利用黄河水下三角洲埕岛海域的现场观测数据集对该模型进行了训练和测试,并与SVR、ANN时间序列预测模型的性能进行了比较。结果表明:

(1)LSTM模型显著优于SVR模型和ANN模型。与其他模型相比,LSTM模型在训练过程中除了误差值更小外,还表现出更高的稳定性和更快的收敛速度。

(2)LSTM模型对3.5 d以内的瞬态泵送再悬浮贡献率预报误差最小,其MAPE、RMSE和RSR均值分别为5.87%、1.6730、0.1574,均明显低于其他预测模型。在所有的预测区间内,LSTM模型的R2值在所有比较模型中均最高。

猜你喜欢

海床瞬态神经网络
波浪荷载引起不同埋深管线周围海床响应和液化分析
高压感应电动机断电重启时的瞬态仿真
神经网络抑制无线通信干扰探究
波流耦合作用下双层砂质海床累积液化特征数值分析❋
波致砂土海床剪切与液化破坏特征对比研究❋
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
十亿像素瞬态成像系统实时图像拼接
基于瞬态流场计算的滑动轴承静平衡位置求解
DC/DC变换器中的瞬态特性分析