APP下载

基于LSTM 网络的海水石油污染含量遥感预测模型

2021-10-12黄妙芬王江颖邢旭峰王忠林

广东海洋大学学报 2021年5期
关键词:步长波段神经元

黄妙芬,王江颖,邢旭峰,王忠林,周 运

(广东海洋大学数学与计算机学院,广东 湛江 524088)

随着海上石油开采活动以及沿海石油化工基地的相继建设,相关海域不可避免地受到石油污染。开展相关海域石油污染含量的动态预测研究,对于推动我国生态文明建设,改善海域水质质量,具有重要的作用。将遥感技术引入区域海洋石油污染相关特性研究的工作已展开,包括其表观光学特性、固有光学特性和荧光特性[1-4],反演石油污染含量的遥感模型也相继建立[5-7]。黄妙芬等[8]建立基于水体石油污染归一化遥感反射比指数(Normalized Difference Petroleum Remote Sensing Reflectance Index,NDPRI)反演水中石油含量的遥感模式,其计算过程所需的输入参数完全取自于遥感图像本身,避免对其他附加输入参数的依赖,从而实现遥感化,为将遥感技术用于研究水体石油污染含量的历史变化特征和建立预测模型打下基础。

美国陆地卫星 Landsat 系列的第一颗卫星Landsat 1 于1972 年成功发射,至今已经发射8 颗卫星,除Landsat 6 发射失败之外,其余7 颗卫星积累了大量对地观测遥感数据[9-10],这些数据在海洋水质观测中发挥了巨大的作用。依据该系列的数据源,学者们[11-12]分别建立提取叶绿素、悬浮泥沙、溶解性有机碳(dissolved organic carbon,DOC)等水体参数的遥感模型,取得良好效果。Landsat 系列所积累的时间序列数据,可为海洋石油污染含量Co遥感预测模型的建立提供数据源,但Landsat 是典型的遥感时序数据,若纯粹基于其数据源建模来对相关数据进行预测,并不能深入挖掘出数据源时序特征,因而需寻找一种能将时序特性关联起来考虑的方法。

近年来,基于神经网络的信息提取算法取得长足进展[13],不少学者[14-15]将这些算法用于遥感数据信息的提取和水质参数监测等。循环神经网络(Recurrent Neural Network,RNN)[16]通常被认为是一种用于处理时间序列数据的深度学习网络,它通过隐含层神经元的循环“记住”过去的信息,将现在的信息与过去的信息进行糅合,因此可产生相对准确的预测结果。长短期记忆网络(Long Short-Term Memory,LSTM),属于循环神经网络RNN 中的一种,主要解决RNN 在长期依赖上出现梯度爆炸与消失的问题。LSTM 的特点是能学习具有长时间跨度的时间序列并自动确定最优时间滞后预测,因而能更有效地利用长距离的时序信息建立高精度的预测模型,在众多领域取得了良好的预测效果[17-19]。本研究将LSTM 引入到具有长时间时序的Landsat 遥感数据中,通过信息挖掘,对Co遥感预测模型的建立展开探索性研究,旨在为掌握相关海域海洋石油污染含量的动态变化特征提供一种新技术手段。

1 材料与方法

1.1 研究区域

研究区域选择位于辽东半岛南端大连市金州区的深水油港——大连新港。大连新港于1976 年正式投入使用,承担着将大庆原油输入油轮的任务。在该海域,历史上曾发生多次溢油事件和严重的石油管道爆炸事件,加上日常的生产活动、油轮的运输等,给周围海域带来一定的油污染,这使得它成为一个进行海洋石油污染特性研究的天然试验场地[20-21]。

1.2 海水石油污染含量现场测量

海水石油污染含量现场测量数据主要用于预测模型的验证和分析。采样点中心位置的经纬度为:38°58.178' N,121°55.098' E。测量时间:1)2018 年8 月25 日7:00—17:00,采样深度为表层(0 m),共计10 个样本;2)2021 年1—5 月卫星过境时刻(上午10:00—11:00),采样深度为表层(0 m),共计20 个样本。

测量仪器采用美国特纳TD-500D 便携式紫外荧光测油仪,该仪器测定原理与分子荧光光度法(《SL 366-2006 水质 石油类的测定 分子荧光光度法》)相同,所使用的监测标准与我国的《海洋监测规范》GB17378.3-1998 相符。

1.3 遥感数据处理

1.3.1美国Landsat 系列卫星介绍 采用卫星遥感数据为Landsat 系列数据。考虑到大连新港油码头是1976 年投入使用,对海域的油污染有滞后效应,因此本研究采用1984 年之后发射的Landsat 5/TM、Landsat 7/ETM+、Landsat 8/OLI 这3 个传感器采集的数据(表1)。

表1 Landsat 5/TM、Landsat 7/ETM+、Landsat 8/OLI 相关技术参数Table 1 Schedule of launch times and related technical parameters of the Landsat5/TM,Landsat 7/ETM+,Landsat 8/OLI

表1 显示,1)Landsat 5/TM、Landsat 7/ETM+、Landsat 8/OLI 这3 种传感器的空间分辨率都是30 m,时间分辨率都是16 d,时空分辨率高度一致;2)在可见光-近红外波段(0.45~ 0.90 μm)都具有蓝光、绿光、红光和近红外波段,波段设置也基本相近(除Landsat 8/OLI 设置2 个蓝光波段,在此采用第2 个蓝光波段)。

1.3.2遥感数据Landsat 系列卫星对地扫描覆盖的设计原则是相邻两轨卫星之间存在一部分区域重叠,研究区域大连新港海域正好落在轨道号(Path/Row)为120/33 和119/33 的重叠区域,因而时间分辨率可由16 d 提高到8 d。利用1984—2020 年在大连新港海域过境的Landsat 卫星所采集的数据,共获取遥感数据1680 景(数据下载网址:https://earthexplorer.usgs.gov/)。由于在部分日期卫星过境的时候,出现云覆盖的情况,导致数据缺失。在1999—2011 年期间,研究区域可同时接收到ETM+和TM 的数据,因而通过这些密集的数据建立线性插值方程,来补齐缺失的数据。

Landsat 系列卫星遥感数据产品,存储的数值是灰度值(Digital Number,DN),因而首先需将其转换为传感器接受到来自目标物的光谱辐亮度信息,即进行辐射校正,其次考虑到大气的影响,需进一步对经过辐射校正的数据进行大气校正。本研究中大气校正方法采用美国 RSI(Research Systems Inc.)公司研发的遥感图像处理软件ENVI (The Environment for Visualizing Images)所提供的大气校正模块(Fast line-of-sight Atmospheric Analysis of Spectral Hypercube,FLAASH),经过大气校正后最终得到各对应波段的Rrs(sr-1)[9]。

1.3.3海水石油污染含量遥感反演算法海水石油污染含量Co的获取采用基于归一化遥感反射比指数I(normalized difference petroleum remote sensing reflectance index,NDPRI)的石油污染含量遥感反演模型[8]。NDPRI 的计算公式为

基于NDPRI 反演出Co的遥感模式为

式(3)中,Co为海水石油污染含量,mg/L;x为I值,单位为1。

1.4 LSTM 网络工作原理

LSTM 网络通过在每个神经元结构中设置3 个门来控制细胞状态的方式,以解决RNN 网络在长期依赖上出现梯度爆炸与消失的问题,每个神经元结构如图1。

图1 LSTM 单个神经元结构Fig.1 LSTM single neuron structure

图1 中,xt表示当前输入值;ht表示当前隐藏层的输出,ht-1表示上一隐藏层的输出;Ct表示当前隐藏层的记忆细胞,Ct-1表示上一隐藏层的记忆细胞,表示记忆细胞状态,记忆细胞的作用是控制记忆单元中信息传播;ft为遗忘门,用来控制需要丢弃的信息;it为输入门,用来控制需要保留的信息;ot为输出门,用来控制需要输出的信息。求解ft、it、ot,、Ct、ht的表达式如下:

式(4—9)中,Wf、Wc、Wi、Wo为权重矩阵,σ为sigmoid 函数,bf、bc、bi、bo为偏置矩阵,sigmoid和tanh 都是激活函数,两者的表达式如式(10-11)。

1.5 模型性能评价

在参数确定过程中,选取均方根误差R(Root Mean Square Error,RMSE)和平均绝对百分比误差M(Mean Absolute Percentage Error,MAPE)作为评价模型性能的指标,计算公式如式(12—13),其中R表示模型的稳定性,其值越低表示模型越稳定;M用于表示模型的准确性,其值越低表示模型的精度越高,效果越好。由于实验的结果具有一定的偶然性,评价指标均取3 次实验的平均值。

其中,m为样本数,yi为实测值,为预测值。

2 结果与讨论

2.1 基于LSTM 网络的Rrs 预测模型

2.1.1遥感数据运用遥感数据直接采集到的物理量是像元在各个波段的Rrs,因而本研究主要引入LSTM 网络对可见光-近红外波段的Rrs进行预测,然后通过一定的算法计算出对应像元的Co。为提高数据的准确性,在大连新港海域选择一块由3 行×3 列所构成的9 个像元的固定区域,将9 个像元平均值作为中心像元的数值,分别得到该区域在蓝光、绿光、红光和近红外波段对应的Rrs。将该区域所有过境时刻数据取出,并与经过插值处理的数据一起构成时序数据集,共计1 680 个数据,按7∶2∶1的比例将它们分成训练集、验证集和测试集,其中训练集数据用于训练模型,以找出最佳的权重和偏置;验证集数据用于对训练模型进行筛选,以找出最佳的超参数;测试集数据用于对训练好的模型进行性能评估。

2.1.2LSTM 网络模型参数的优化 LSTM 网络模型的超参数主要包括神经网络层数、隐藏神经元节点数和回溯时间步长。在模型构建过程中,神经网络层数设计太多会引起过拟合,导致训练效果不理想,太少又会引起欠拟合,达不到训练所需的效果;隐藏神经元节点数的大小是影响模型收敛速度的一个关键因素;在构建一个基于真实测量数据的预测模型时,如果回溯时间步长太短,则前后的时间依赖关系很弱,进行时间序列预测的意义就不大;如果时间步长越长,则梯度消失或爆炸的风险也就越高。

在对参数进行优化时,首先将训练集数据分批加载进入模型进行训练,此时,批处理大小(batch_size)设置为32,数据加载一批模型便迭代一次,训练次数(epochs)设置为500,当验证集上的损失(均方差)在10 次迭代中没有下降,则将学习率降低到原来的80%,初始学习率为0.001,最低为0.000 01;其次对神经网络层数、每层隐藏神经元数、回溯时间步长进行试验,确定最优的超参数。

以蓝光波段的Rrs数据为例,在神经网络层数优化的过程中,分别取2、3、4 层进行实验,并利用指标R和M对模型性能进行评估,结果如表2。分析表2 可见,神经网络层数为3,指标R和M的数值最小,因而可认为最佳的神经网络层数为3。

表2 设置不同神经网络层数的模型评价指标值Table 2 Model evaluation index values of different neural network layers

采用3 层神经网络,将LSTM 网络的隐藏神经元节点分别设置为16、32、64、96 个进行实验,结果如表3。分析表3 可见,在隐藏神经元节点数为64 时,指标R和M值最小。

表3 设置不同隐藏神经元节点数的模型评价指标值Table 3 Model evaluation index values of different number of hidden neuron nodes

采用3 层神经网络,神经元节点数为64 的模型结构,分别采用不同回溯时间步长进行试验。不同回溯时间步长下,各模型的评价指标比较如表4。分析表4 可见,可得最佳回溯时间步长为6。

表4 设置不同回溯时间步长的模型评价指标值Table 4 Model evaluation index values of different backtracking time steps

上面实验对蓝光波段的遥感反射比数据进行LSTM 预测模型构建参数选取,实验结果表明,最佳组合为3 层神经网络、隐藏神经元节点数为64、回溯时间步长为6。以同样的试验方法分别对绿光波段、红光波段、近红外波段的遥感反射比数据探究构建LSTM 预测模型的最佳参数(表5)。

表5 LSTM 模型在各波段中的最佳参数组合Table 5 Optimal parameter combination of LSTM model in each band

2.1.3预测模型验证 在最佳参数组合下,图2 为LSTM 模型对蓝光波段、绿光波段、红光波段、近红外波段Rrs数据的预测数据与测试数据的对比结果。分析图2 可见,Rrs的预测值曲线与其测量值曲线的变化趋势基本一致。

图2 4 波段Rrs 预测结果与实际测量结果对比Fig.2 Comparison of predicted and actual results of Rrs in four bands respectively

由表6 可见,在这4 个波段中,近红外波段具有最小的R值和最大的M值,表明其预测模型的稳定性最好,但准确性相对就差一些。

表6 不同波段作为测试集的LSTM 模型预测效果Table 6 Prediction effect of LSTM model with different bands as test set

2.2 Co 的预测及验证

基于LSTM 网络所建立的预测模型,根据2021年1—5 月在研究区域卫星过境的对应日期,分别预测出过境时的4 个波段的Rrs,共计20 组数据。然后将这些预测的Rrs代入公式(6)进行归一化处理,最后根据公式(7)和(8)计算出Co预测值。Co实测值的获取时间和方法参见1.2 节。图3 为2021 年1—5 月在大连新港实测值的Co与预测值的对比,图中数据时间间隔为8 d,时间序号1—4 是1 月份的观测值,5—8 为2 月份观测值,依次类推。

图3 油含量预测值与实际测量值对比Fig.3 Comparison of predicted and actual results of petroleum-pollution concentration

分析图3 可见,1)Co的预测值总体高于测量值;2)从1 月份开始到5 月份Co变化趋势呈现逐渐增加态势,1 月份大连新港油含量比较低,2—3月油含量的增加幅度比较大,4—5 月增幅变缓,趋于平稳。这与气温的增加有着密切的关系,因为随着温度的增加,水温增高,底层的油物质会产生挥发,使得水体的含油量增加。

从图4 可看出,Co变化值在1.0~ 9.3 mg/L 之间,10:00—11:00 数值在3.1~ 4.2 mg/L 之间,之后急剧上升,可达到9 mg/L。这与2021 年1—5 月的测量值和预测值是比较接近的,表明大连新港由于石油化工生产活动的影响,海水油污染一直存在。

图4 2018 年8 月26 日研究区域油含量随时间变化曲线Fig.4 Time variation of petroleum-pollution concentration at different depths in study area on August 26,2018

进一步计算出图3 中Co的预测值与实际测量值的平均相对误差,结果为9.17%,表明通过4 波段Rrs预测模型预测出来的Rrs,代入Co遥感反演模型中反演出来的结果精度较高。分析造成误差的原因,主要有:1)用于模型训练与验证的数据中,由于云覆盖的影响,采用了插值的方法来弥补缺失数据;2)Co遥感反演模型是基于部分像元点而建立;3)实际进行Co测量时由于受到水样采集环境的影响,对测量值也会带来误差,使得测量值不能代表该时刻的油含量的真值。

3 结论

卫星遥感数据能实时获取大面积海域的Rrs,它们是海水组分对后向散射的总贡献。在水色遥感领域利用Rrs,可进一步估算出海水的组分浓度,包括水体石油污染含量。Landsat 卫星序列具有长时间的数据积累,为基于LSTM 网络建立Co遥感预测模型奠定了数据基础。本研究中提出一种基于Landsat卫星遥感数据和LSTM 网络的Co预测模型。该模型根据Landsat 卫星遥感获取的历史数据,分别建立针对可见光-近红外范围的4 波段Rrs预测模型,在此基础上采用水体石油污染归一化遥感反射比指数构建的遥感估算模型预测出Co值,最后根据现场测量数据对预测值进行验证,平均相对误差为9.17%,表明该预测算法具有较高精度。

基于Co预测模型所预测的数据可弥补在有云情况下油含量数据缺失的问题,也可为相关海域油含量未来动态演变预测提供一种新技术手段,并可在其他海域油港中进行推广应用。另外本研究Co的遥感预测思路还能为利用Rrs建立其他水质参数浓度的预测模型提供参考。

猜你喜欢

步长波段神经元
Ku波段高隔离度双极化微带阵列天线的设计
最佳波段组合的典型地物信息提取
新型X波段多功能EPR谱仪的设计与性能
一种面向车内噪声控制的改进变步长LMS算法
最佳波段选择的迁西县土地利用信息提取研究
AI讲座:神经网络的空间对应
基于变步长梯形求积法的Volterra积分方程数值解
董事长发开脱声明,无助消除步长困境
起底步长制药
仿生芯片可再现生物神经元行为