APP下载

基于生成对抗网络的塔里木深层超深层叠前地震子波提取

2022-02-23韩浩宇戴永寿宋建国万勇孙伟峰李泓浩

地球物理学报 2022年2期
关键词:鉴别器子波卷积

韩浩宇,戴永寿*,宋建国,万勇,孙伟峰,李泓浩

1 中国石油大学(华东)海洋与空间信息学院,青岛 266580 2 中国石油大学(华东)地球科学与技术学院,青岛 266580

0 引言

在地球物理勘探领域中,全波形反演技术与叠前偏移成像等技术对储层分布、地层岩性构造有着重要意义,而这些技术的准确度离不开叠前地震子波的准确提取.传统地震子波的提取主要依靠频谱分解方法,Rosa和Ulrych(1991)提出一种谱模拟反褶积的方法,该方法从地震记录振幅谱中得到地震子波振幅谱,通过压缩地震子波提高地震资料的分辨率.Wang等(2015)提出了基于蚁群算法的子波相位估计方法,通过对子波振幅谱进行希尔伯特变换得到最小相位子波并将最小相位子波Z域的零点关于单位圆进行对称变换,建立候选子波库,最后利用蚁群算法实现子波相位的准确寻优.我国西部的塔里木盆地具有丰富的石油资源,也是我国油气勘探的重要战略地区.塔里木盆地含有巨厚膏岩体以及熔断体等复杂地质结构;储层位于地下深层超深层;地震资料信噪比低,有效信号微弱.因此,塔里木地区叠前地震子波提取难度更高,同时也具有重要的研究价值.传统地震子波提取方法无法快速准确地完成塔里木地区叠前地震子波提取的工作,更快速高效的子波提取方法研究及其应用迫在眉睫.

生成对抗网络(GAN,Generative Adversarial Nets)是由Goodfellow等(2014)提出的一种神经网络模型,在自然图像、语音、文本等方面取得广泛应用.生成对抗网络相较于传统卷积神经网络(CNN,Convolutional Neural Network)具有以下改进:(1)在处理一维地震数据的情况下,GAN算法可以不受CNN的分类标签限制;(2)GAN网络结构由双CNN嵌套构成,网络结构更加复杂,交叉训练更加准确;(3)在算法逻辑上,GAN只采用反向传播算法而不采用马尔科夫链,不需要对数据隐变量进行推断.由于GAN的结构优势,近年来该算法被逐步应用于地震数据处理领域中.Li和Luo(2019)利用GAN数据增强的特性对原始地震剖面图进行训练,获得更高分辨率的地震剖面图以实现高分辨率地震反演.Kaur等(2019)通过CycleGAN对地震数据的原始分布进行训练,完成了对缺失地震道记录的插值工作.Mao等(2019)利用GAN实现了滚动轴承不平衡性的故障诊断,首先利用GAN的鉴别器判断滚动轴承参数序列的准确性,然后生成器拟合无故障情况下的轴承参数序列,验证了生成对抗网络处理一维序列的有效性.这些GAN算法的应用为本文实现叠前地震子波的提取提供了可能.

本文通过采用生成对抗网络来实现叠前地震子波的提取.针对塔里木地区的深层低信噪比叠前地震资料,通过去噪等方式实现数据预处理,利用传统地震子波提取方法提取部分地震资料中的叠前地震子波,再与合成叠前地震记录共同组成训练集;采用生成对抗网络训练数据集,最后利用地震子波与地震记录的概率分布特征不同实现叠前地震子波的处理,从而降低运算复杂度.

1 基于生成对抗网络的叠前地震子波提取方法

生成对抗网络中的生成器与鉴别器的输入分别为叠前地震记录与叠前地震子波,用于训练的数据集则是由针对塔里木地区的合成数据所建立.本节从生成对抗网络提取地震子波的原理流程及叠前地震子波样本集两个方面进行详细描述.

本节内容从生成对抗网络算法原理和叠前地震记录及对应用于合成的地震子波的样本集建立两个方面进行详细描述.

1.1 生成对抗网络地震子波提取基本原理和流程

依据地震褶积模型的理论,地震记录可以被表示为地震子波与反射系数的褶积:

x(t)=w(t,τ)*r(t)+n(t),

(1)

其中x(t)代表地震记录,w(t,τ)代表地震子波,r(t)代表反射系数,n(t)代表噪声,*代表卷积运算.在噪声及反射系数未知的情况下,地震子波的求解过程可以被视为非线性最优化求解问题,可由公式(2)表达:

(2)

其中Xn(t)代表地震记录,wΔ(t)代表估计地震子波.对于式(2)而言,由于反射系数与地震子波都是未知量,所以直接求解无疑是非常复杂的.为优化求解过程,从叠前地震记录中准确提取地震子波,本文提出了一种基于数据驱动的生成对抗网络的方法实现地震子波的提取.

生成对抗网络是近年来兴起的一种深度学习算法,其应用场合十分广泛.本文中对生成对抗网络进行了适用性改进,使其能够更准确的完成子波提取工作.该网络主要由两部分构成:生成器和鉴别器,其中,生成器主要作用是:从地震记录中估计地震子波.鉴别器主要作用为:判断估计子波的准确性.利用生成器与鉴别器之间地相互博弈,实现叠前地震子波的准确提取及准确性评价.基于生成对抗网络的子波提取处理过程如图1所示.

本文以1×n的合成叠前地震记录作为生成器的输入,以用于合成相应记录的叠前地震子波作为鉴别器输入样本.鉴别器与生成器包含了卷积层(CONV)、下采样层(Sub-Sampling)、反卷积层(CONV_tran)与全连接层(Fully-Connect).网络搭建完成后,初始模型通过不断的迭代训练直至获得预期模型.

1.2 生成对抗网络结构与网络训练过程

生成对抗网络中的生成器与鉴别器都由卷积神经网络构成,网络首先进行鉴别器训练.鉴别器主要任务是学习叠前地震子波的数据特征,其本质是二分类器.我们将输入的地震子波训练样本标记为1,即真实子波,将初始生成器的输出值标记为0,即伪子波.而生成器则是一个仅包含前向传播算法的卷积神经网络,其网络参数更新则由鉴别器传递更新.网络具体结构如图2所示.

图1 基于GAN算法的子波提取处理流程图Fig.1 Wavelet extraction processing flow chart based on GAN

图2 生成对抗网络结构图Fig.2 Generative Adversarial Networks structure diagram

图2中G(w)代表生成器生成的估计子波,w代表真实地震子波,x(t)代表叠前地震记录.本文所采用的生成对抗网络中生成器共由五层网络构成,包含两层卷积层、两层下采样层和一层全连接层,鉴别器则由三层网络构成,包含一层全连接层及两层反卷积层.

GAN每次训练都会将训练集当中的叠前地震子波与生成器生成的估计子波交替输入至鉴别器网络,通过卷积层提取数据特征,再通过下采样层对特征数据进行降维,防止过拟合情况出现,最终输出32个特征图集.以特征图集为鉴别条件,叠前地震子波特征标记为1(真实子波),而生成子波则通过损失函数误差判别为0(伪子波)与1(真实子波)的中间值.若判定结果大于0.5则认为生成子波即为叠前地震记录所对应的真实地震子波.

考虑到地震数据的特殊性以方便神经网络处理,首先需要先对地震数据进行预处理.在实验过程中发现,由于地震记录与地震子波振幅数据中含有大量负值,而网络卷积训练过程中受卷积核运算及激活函数影响,负参数可能导致节点死亡,训练结果不准确.参考深度学习在图像处理中的应用特点,我们对地震数据归一化至[0,1]区间内.归一化公式为:

(3)

其中Xnorm代表归一化后的地震数据.该方法可将原始数据等比例缩放.

将预处理后1×500的地震子波数据通过卷积层与下采样层提取特征数据,该过程主要通过卷积核运算获得高维度数据特征.卷积层计算过程为:

(4)

其中⊗是二维卷积算子,σ是激活函数,Wh是网络权重参数,初始化为较小的随机数,bh是网络偏置值,初始化为0.

激活函数可提高模型的非线性拟合能力.标准GAN中常采用sigmoid或tanh函数作为激活函数,通过对地震数据的特性分析及实验结果验证,将激活函数替换为带泄露修正单元leaky ReLUs.Leaky ReLUs函数改进自ReLUs函数(Nair and Hinton,2010),属于神经网络当中常用激活函数之一,其优势在于可以使网络的收敛速度更快,且避免输入特征数据存在负值时网络偏置无法更新.激活函数公式为:

(5)

其中xi为输入特征值,ai是常数参数.在网络的不断训练过程中网络权重参数与偏置值也会不断更新.

卷积层输出的高维度数据特征不仅会使得数据冗余,网络训练速度缓慢,且网络学习过多特征会导致训练结果不准确.而下采样层的主要作用即对特征数据进行降维,保留携带位置信息且相关性强的特征数据,舍去多余特征数据,其主要原理借鉴了图像的下采样过程.

最后通过卷积层与下采样层的特征数据通过全连接层后,输入至损失函数进行误差判别,这一步骤决定着鉴别器的鉴别结果.生成对抗网络与传统卷积神经网络所不同的是利用了JS散度作为损失函数进行误差判别.损失函数公式为:

(6)

(7)

其中Pg(w)代表生成器生成的估计子波的概率分布,Pr(w)代表真实子波的概率分布,KL则代表KL散度,其表达式如公式(6)所示.鉴别器依据损失函数更新网络参数,当生成样本与真实样本具有较大偏差时,损失函数能够提供较大梯度,网络沿梯度下降方向更新网络参数同时将更新后的参数传递至鉴别器与生成器中.需要我们注意的是,随着不断训练,鉴别器对子波真实性的鉴别能力不断增强,最终达到最优鉴别器.

在鉴别器不断训练的过程中,生成器也在不断进行训练与优化.生成对抗网络的训练过程是交叉训练的.生成器不包含反向传播算法,其网络参数更新依赖于鉴别器的误差反向传播算法.生成器每次参数更新后,都会从新一组的叠前地震记录中生成估计子波.生成器类似于逆向的卷积神经网络,叠前地震子波输入至生成器后通过全连接层后转化为网络数据特征,具体形式可类比鉴别器中子波数据通过卷积层后所得到的数据特征.此时将生成器从叠前地震记录中所获得的数据特征通过反卷积层进行数据重构,同样经过两层反卷积层后获得重构的估计子波G(w).反卷积层的具体公式为:

w=(d-1)×s+k,

(8)

其中w代表生成子波,d代表全连接层转化后的特征值,s则代表滑动步长,本文步长设置为2,k代表卷积核大小,本文设置为5.

在网络框架搭建完成后,为实现深层叠前地震子波的准确提取,我们期望通过生成器生成的地震子波能够不断的逼近叠前地震记录中的真实子波:

J=min(G(w)-w)2,

(9)

其中G(w)代表生成器生成的估计子波.为了使式(9)中J取值尽可能逼近0,将生成网络的目标函数设置为:

minGmaxDV[D,G]=Ew[lgD(w)]

+E′w[lg(1-D(G(w′)))],

(10)

其中,D(w)代表最优鉴别器,D(G(w′)代表最优鉴别器对生成器生成的估计子波的鉴别结果.生成对抗网络主要学习数据的概率分布特征,该目标函数用于衡量生成子波与真实子波之间分布相同程度.从目标函数中可以看出,对于一个固定的生成器G而言,鉴别器D需要不断提高鉴别能力,即最大化两者之间的交叉熵,从而准确区分生成样本与真实样本的区别,对于一个固定的鉴别器D而言,则需要不断提升生成器G所生成样本的准确性,使得D难以区分两者区别.两者之间的在学习过程中是不断对抗与博弈的,其学习过程(Goodfellow et al.,2014)如图3所示.

图3中Z到X的映射过程代表了生成样本向真实样本的映射过程.图3a代表网络初始训练阶段,鉴别器性能不足,生成数据与真实数据偏差较大;图3b代表鉴别器再经过一定训练后已获得较强的鉴别能力,能够初步区分生成样本与真实数据之间的差异;图3c代表鉴别器不断引导生成器生成数据向真实样本的概率分布移动;图3d代表训练完成阶段,鉴别器已无法区分生成数据与真实数据之间差异的阶段.从图3a—d代表着生成对抗网络不断迭代学习直至达到预期结果的过程.

对于鉴别器而言,鉴别函数越大则能更准确地给出输入样本中真实样本的比例,也意味着提取得到的结果地震子波更加接近真实子波,最优鉴别器D(w)通过公式(11)和(12)迭代获得:

互联网时代为人类提供了许多的可能,企业也可以搭上这趟便车(顺势利用互联网的及时性)为会计职业风险的防范提供良好的保障,即利用互联网对企业财务工作进行实时监督。

(11)

(12)

图3 生成对抗网络的学习过程图(a) 网络初始学习阶段示意图; (b) 鉴别器学习示意图; (c) 生成器学习示意图; (d) 网络训练完成阶段示意图.Fig.3 Diagram of the learning process of generating a confrontation network(a) Schematic diagram of the initial learning stage of the network; (b) Schematic diagram of the discriminator learning; (c) Schematic diagram of generator learning; (d) Schematic diagram of completion stage of network training.

其中D′(w)代表最优鉴别器的导数,Pr(w)代表真实地震子波样本的概率分布,Pg(w)代表假样本的概率分布.整个网络的训练过程中,生成器输出的估计子波与真实子波在鉴别器中不断地进行特征匹配,通过生成器与鉴别器之间的博弈,使估计子波不断向真实子波收敛.当生成对抗网络到达纳什平衡(Goodfellow et al.,2014)时,即达到鉴别器无法区分估计子波与真实子波的时刻,认为最后一次迭代中生成器所生成的结果子波即为对应叠前地震记录中的真实地震子波.

图4 生成对抗网络的训练流程图Fig.4 The training flowchart of the confrontation generation network

整个生成对抗网络的训练过程是生成器与鉴别器交替进行的,具体过程如图4所示.在基于生成对抗网络的地震子波提取方法中,最重要的步骤为叠前地震子波及其对应叠前地震记录样本集的建立,由于本文方法针对目标区域为塔里木柯东地区,所以样本标签集需针对目标靶区特性人工建立.

1.3 生成对抗网络训练集地构建

由于用作生成对抗网络训练样本的叠前地震子波的完备性和叠前地震记录的特征相似度决定了生成对抗网络求解的叠前地震子波的准确性,因而本文有针对性地建立了柯东地区叠前地震记录及对应的地震子波样本集,用于生成对抗网络进行训练.

样本集是一个带标签的数据集,包含了网络的输入与输出数据,在生成对抗网络中,利用叠前深层地震记录取代随机噪声信号作为输入,用于合成的对应叠前地震子波作为网络输出.本文所建立的柯东地区叠前地震记录及对应地震子波样本集由合成地震记录组成,分别采用国际主流地震速度模型—Marmousi模型和盐丘模型与不同主频和幅度的雷克子波进行正演合成无噪的叠前地震记录,并为地震记录加入随机噪声,保证合成记录的信噪比与实际地震资料一致性.合成叠前地震记录流程如图5所示.

图5 叠前地震记录合成流程图Fig.5 Flow chart of pre-stack seismic record synthesis

地震记录正演结果如图6所示.此时获得的叠前地震记录并不含噪声,为更好地模拟塔里木地区深层超深层叠前地震记录,对柯东地区地质构造及噪声类型进行了简要分析.柯东地区构造带总体表现为典型的三角带构造(被动顶板双重构造)(曾昌明等,2011),此外还具有明显的断层高陡特点(杜治利等,2013)和野外勘探中存在的恶劣环境,叠前地震数据噪声十分强烈.为更好地拟合柯东地区叠前地震噪声,采用传统BM3D去噪方法对实际柯东叠前地震记录进行噪声去除,并将获取到的多道噪声添加至合成地震记录当中,使样本训练集更加符合实际地震资料.

为更好地模拟目标区域叠前地震记录,采用了不同类型及不同主频的地震子波作为初始子波合成叠前地震炮记录,并在合成后随机添加不同信噪比的噪声,建立了总量为20000个的样本集.完成初始样本集建立后,利用该样本集进行网络训练,仿真与实测数据实验详见第2节.

2 数值实验

为验证基于生成对抗网络算法的叠前地震子波提取方法的有效性及准确性,本文分别利用合成数据与柯东地区实际地震资料进行数值实验.

2.1 合成地震记录仿真实验及结果分析

图6 正演合成叠前地震记录结果图(a) Marmousi速度模型; (b) 合成叠前炮记录; (c) 用于合成叠前地震记录的雷克子波; (d) 合成叠前地震记录(第1道).Fig.6 The result of forward synthetic pre-stack seismic record(a) Marmousi velocity model; (b) Synthetic prestack shot record; (c) Rick wavelet used to synthesize pre-stack seismic records; (d) Synthetic pre-stack seismic records (Track 1).

本文选取零偏移距叠前地震记录进行方法准确性对比实验.从实验结果中分析可发现,传统谱模拟算法及变分模态分解法在叠前地震子波提取中都存在不可忽视的旁瓣,在多次实验中都存在相应问题,且需要不断人工修改参数,提取过程复杂.子波提取结果与提取误差如图7和图8所示.

表1 传统谱模拟算法与生成对抗网络算法的叠前地震子波提取速度对比Table 1 Comparison of pre-stack seismic wavelet extraction speed between traditional spectrum simulation algorithm and GAN

图7 叠前地震子波提取结果对比(a) 谱模拟算法提取子波与合成子波对比; (b) VMD算法提取子波与合成子波对比; (c) 对抗生成算法提取子波与合成子波对比.红色代表用于合成叠前记录的雷克子波;蓝色代表不同方法提取的叠前地震子波.Fig.7 Comparison of pre-stack seismic wavelet extraction results(a) Comparison between wavelet extracted by spectral simulation algorithm and synthesized wavelet; (b) Comparison between wavelet extracted by VMD algorithm and synthesized wavelet; (c) Comparison between wavelet extracted by GAN and synthesized wavelet. Red represents the Rick wavelet used to synthesize pre-stack records;Blue represents the pre-stack seismic wavelets extracted by different methods.

图8 不同方法子波提取误差对比(a) 传统谱模拟算法的子波提取误差; (b) 变分模态分解法的子波提取误差; (c) 本文方法的子波提取误差.Fig.8 Wavelet extraction errors comparison of different methods(a) Wavelet extraction error of traditional spectrum simulation algorithm; (b) Wavelet extraction error of variational modal decomposition method; (c) Wavelet extraction error of the method in this paper.

本文采用均方误差对三种地震子波提取方法进行了误差分析,其中传统谱模拟算法的均方误差MSE=0.0497,变分模态分解法的均方误差MSE=0.0098,而本文中生成对抗网络算法的均方误差MSE=0.000571.实验结果表明,本文所提出的基于生成对抗网络的塔里木深层超深层叠前地震子波提取方法相比传统算法更加准确.此外,通过针对不同目标区地层特性构建叠前地震子波训练集,生成对抗网络也可实现不同地区的叠前地震子波提取.

2.2 柯东地区实际地震资料处理及结果分析

为了验证基于生成对抗网络的叠前地震子波提取方法在实际地震资料子波提取中的有效性及优越性,采用了柯东地区叠前共中心点地震炮记录进行子波提取实验,并采用稀疏反褶积方法对叠前地震记录进行了反褶积处理,从图9中可以看出,基于生成对抗网络的叠前地震子波提取方法反褶积结果与基于VMD的叠前地震子波提取方法的结果相比,地震记录同相轴更加清晰,叠前地震剖面的分辨率更高.

图9 叠前地震记录反褶积结果对比图(a) 柯东地区叠前共中心点炮记录(第1~50道); (b) 采用VMD算法提取地震子波后的反褶积结果; (c) 本文方法的反褶积结果.Fig.9 Comparison of deconvolution results of pre-stack seismic records(a) Pre-stack CMP record in Kedong area (track 1~50); (b) Deconvolution results after seismic wavelet extracting by VMD algorithm; (c) Deconvolution results by the method in this paper.

3 结论

本文提出采用一种基于生成对抗网络算法的叠前地震子波提取技术,针对塔里木柯东地区的地质构造及噪声特性,利用基于有限差分的正演方法建立柯东地区合成叠前地震记录样本集利用生成对抗网络对样本集进行学习训练,实现对塔里木柯东地区叠前地震子波的准确提取.相比于传统地震子波提取方法,基于生成对抗网络的叠前地震子波提取算法速度更快,合成数据和实际地震资料的数值实验都表明了方法的有效性及准确性.本文在提取过程中尚未考虑子波的时空变特性,下一步将研究时空域叠前地震子波的准确提取.

猜你喜欢

鉴别器子波卷积
基于多鉴别器生成对抗网络的时间序列生成模型
基于双鉴别器生成对抗网络的单目深度估计方法
基于自适应震源子波提取与校正的瑞利波波形反演
一类非线性动力系统的孤立子波解
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络的分析与设计
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
基于倒双谱的地震子波估计方法
北斗系统信号NH码处理方法研究