APP下载

基于目标检测和迁移学习的电成像测井裂缝识别

2021-03-07杨晓倩张萍熊振东陶忠瑞陈一帆陈华

电脑知识与技术 2021年36期
关键词:迁移学习目标检测

杨晓倩 张萍 熊振东 陶忠瑞 陈一帆 陈华

摘要:随着我国油气勘探技术的发展,裂缝性储积层在油气的勘探开发中发挥着越来越重要的作用。现有的裂缝识别仍然局限于人工分割裂缝部分再进行分类,没法从整个油井地下的成像测井图像中检测出裂缝的存在。该文针对测井数据和图像资料,研究了裂缝经Hough变换后的正弦曲线特性,由此人工制造了大量图像代替成像数据进行标注,并应用目标检测相关知识,使用YOLOv3训练模型,通过fine-tuning基于ImageNet的预训练模型,对测试集进行目标检测,不仅加快了收敛的速度,其在抽样的测试集中还能够有效地识别出一些裂缝;同时,制造了带有不同程度噪音的测试集再进行检测,可知本文的模型允许曲线带有一定范围内的噪声。最后,该文提出了进一步的研究思路,指出可以应用领域生成网络的思想,且对于不同类型的裂缝,可以考虑看作多个种类的目标检测问题,进一步进行分类研究。

关键词:裂缝识别;目标检测;YOLO;迁移学习

中图分类号:TP391      文献标识码:A

文章编号:1009-3044(2021)36-0032-05

開放科学(资源服务)标识码(OSID):

1 引言

一直以来,裂缝性储层都是勘探的难点和重点,裂缝的导流程度对油气井的产出情况有很大的影响,在采油过程中,裂缝和半裂缝的识别是非常重要的。地质勘探工作中,反映裂缝信息较多的是成像测井图像,传统的人工拾取裂缝的方法工作量大,且存在较大误差,所以需要提出一种智能提取裂缝,且对其进行准确识别的方法。

目前,在测井裂缝识别方面,与智能裂缝识别相关的研究成果很少。传统的测井裂缝识别方法[1]很难找到定量分析方法,近年出现了一些使用智能算法及数字图像处理方法进行裂缝识别的成果:在裂缝提取中,使用改进蚁群算法[2],使用Roberts算子[3]等,此外还有快速霍夫变换、数学形态学[4]、张量投票方法等图像分割方法。

然而,现有的方法都基于人为捕捉裂缝的前提,再对手动选取的图像进行识别,这种应用依旧存在着巨大的工作量要求,且高度依赖于人工判断。并且,目前的算法都具有大数据量的要求,然而在实际的勘探开发工程中,勘探任务难以开展,采集数据尤为艰难。因此,需要一种基于目标检测的方法,从成像测井图像中识别出裂缝的存在,并且能够基于小样本得到一个较好的效果。于是,本文基于这一问题展开了研究。

2 数据集的预处理

2.1 裂缝数据集的特征

针对电成像测井图像的测井裂缝识别,主要原理是先对数据进行图像处理,再进行裂缝信息的提取分析工作。文献[5-6]使用Hough变换做自动识别。在成像测井图像的平面展开图上,测井裂缝一般都是正弦曲线形状,Hough 变换最初是用来检测直线的,所以赖富强[5]提出用改进的 Hough 变换来进行裂缝识别。

根据正弦曲线的一般方程公式(1):

[y=Asin(ωx-β)+y0]                        (1)

其中,是式子里的自变量,y是因变量。A作为振幅,ω是角频率,β是初相位,y0是中线(基线)。将成像测井信息进行处理,可以得到 A、ω、β和 y0这几个参数,从而得到了裂缝的曲线表达式。如图1所示,利用改进的Hough 变换可以较好地识别出经过预处理以后的图像中的裂缝。

基于这一原理,本文假定测井裂缝图像都能处理成带一定范围内噪声的正弦曲线图像,因此,可以考虑随机生成一组正弦曲线作为数据集使用。

2.2 裂缝数据集制备

1)数据集介绍

本文使用的数据集是VOC2007格式的标准数据集,具体格式见图2。

Images这一文件夹存储全部的训练图片样本数据,ImageSets这个文件夹存储4个文本文档格式的文件,分别存储记录了所有训练图片数据、测试图片数据、验证图片数据的图片样本名称,Annotations存储了与图片对应的.xml格式的标注数据,labels这一文件夹存储可以直接使用的标注数据,samples文件夹存储了需要检测的数据。

2)图像生成

通过公式(2)[7]来生成模拟的裂缝图像:

[y=128π×tanθ×cos(128π×(x+1))+257-128π×tanθ+n]                  (2)

其中,[θ]是裂缝倾角,[n]是随机噪声。通过修改粗细、倾角等参数,随机生成了1000张图片作为数据集,选取其中几张如图3。

3)数据标注

通过数据标注工具labelimg生成.xml格式的标注数据。标注图像和xml文件分别见图4和图5。

将数据集及其标注放至对应位置,随机将数据集划分为训练集:验证集 = 9:1的比例。

4)数据增强

深层神经网络一般是需要大量数据以获得较好结果,因为它依赖于能足以概括一个事物不同角度的数据集量。由于地质构造运动的复杂性,地层中的裂缝形态各异,尤其是经历了板块挤压后,裂缝普遍会发生旋转、扩张等现象,而仅仅1000张图像显然无法概括所有情况,为了改善数据有限的问题,采用数据增强的方法,增强样本多样性、提高模型鲁棒性、避免过拟合。

在计算机视觉这一领域中,典型的数据增强的方式有翻转、旋转、缩放、随机裁剪或补零、色彩抖动、加噪声等。本文通过在训练模型的过程中对图像进行翻转、改变光照强度等操作,即一种在线增强的方式,操作如图6。

3 数据集目标检测YOLOv3

目标检测,也叫目标提取,就是事先给定一个图像,进行分割和识别。目标检测过程需要包含此目标在该图像中的位置数据信息和分类标签信息。本文所描述的平均精度特别适合于我们的算法预测目标和类的位置。同时,该平均精度可以用于评价模型定位、目标监控和分割的性能等。

YOLOv3是一种速度和准确率都能达到较高水平的目标检测模型,使用Darknet-53网络结构(含53个卷积层),在多尺度、小物体检测中都有着不凡的表现。

3.1 YOLOv3算法原理

1)特征提取器

YOLOv3[8]的网络结构如图7所示。

2)边界框检测

YOLOv3用anchor boxex来选定边界框,过程见图8。每个边界框预测4个坐标:[tx,ty,tw,th]。如果目标单元距离图像左上角的边距是[(cx,cy)]且对应图像边界框的宽和高为[pw,ph],那么网络的预测为公式(3):

[bx=σ(tx)+cxby=σ(ty)+cybw=pwetwbh=pheth]                                  (3)

YOLOv3使用逻辑回归预测每个边界框的目标与真实目标的符合程度。本文系统将忽略符合度未达到一定阈值的物体,设定阈值为0.5。

3.2 预训练模型的迁移

对于小样本数据,为了更快更有效地提取特征,需要基于大量数据的预训练参数来初始化。本文的训练是用ImageNet数据集训练[10],初始值为首次训练得到的权重值,然后继续训练,不断对参数进行微调。在Imagenet数据集上预训练的模型的参数从微调开始就效果很好,接近最佳值,所以比直接从自制的训练集上开始训练再做微调得到的模型效果更好。因此,微调可以有效地减少迭代次数,使收敛更快。

4 算法实现及结果分析

4.1 模型训练

我们使用yolov3-tiny预训练模型,该模型保存了yolov3的前15层卷积层的参数。

模型的四种评估度量如表1所示。

运行时间为1.236h,可以看出,迁移预训练的模型比从头训练更快收敛。

4.2 边界框预测

1)使用测试机预测边界框

使用原本划分的测试集预测边框,检测结果如图9。

而在输出中,也存在着预测图10中边界框的情况。

在本文看来,这是因为训练集中出现了大量的只有一部分的曲线,这是因为在数据生成时的范围设置使某种形态的图像偏多,导致模型泛化能力受到影响。

2)重新生成不同程度噪声的数据预测边界框

在正弦曲线上加以一个随机噪声,不断加大噪声进行裂缝检测,效果如图11。

由此可见,本文建立的模型能检测出带有一定范围内噪声的裂缝曲线,具有一定的鲁棒性。这是因为本文的预训练模型基于包含各种种类的标准数据集,其参数容许样本存在多样性,因此大大提升了泛化能力。

5 模型改进

5.1 不同种类裂缝的识别

地質勘探中,裂缝也有严格的分类[11],基于这一分类,可以延伸出许多工作:对于勘探开发工作而言,诱导缝是测量仪器在钻测时压裂地层时产生的,不具有指示意义,反而会误导判断,被称为“假缝”,因此需要鉴别出天然裂缝与诱导缝,捕捉对地层分析有利的信息;若在检测出裂缝的基础上,需要识别出裂缝类型,则原问题变为多目标检测问题。由于正弦曲线的波长等参数中包含着与倾角有关的信息,可作出不同角度的裂缝图像,进行不同形态裂缝的识别。

5.2 领域生成网络

在本文初步的试探性工作下,通过最简单的迁移学习fine-tuning已经能看出其对于处理小样本数据的优势。而在迁移学习中,对于类别空间不共享但任务相似的源域与目标域,可以使用领域生成网络[12]的方法进行模型训练。

而目前的DANN是进行了非深度迁移,本文认为,如果将特征提取器替换为Darknet-53,则可以提取源域的深层特征,由于基于正弦曲线的生成方法有能力制作出一个规模大的数据集,因此可以视作源域,而用成像测井裂缝图像作Hough变换后的曲线作为目标域,通过调整特征提取器的层数,进行试探性研究,探究这两者究竟在第几层时会发生负迁移,以做出合理地修正。

5.3 类别不平衡

在实际地质勘探开发过程中,裂缝的类别是不平衡的,这主要是因为地质的构造运动通常会倾向于同一个运动模式,所以训练模型可能会侧重于样本中数量较大的一类,这样模型的泛化能力就会降低,上文以F范数评价得到的效果并不好,一定程度上也是因为裂缝识别的模型过分侧重于某一形状,这亦是一种潜在的不平衡。

而在后续做不同种类裂缝检测时,这一现象会更为明显。首先,在生成数据集时,应先控制范围,使数据集符合自然界中的不平衡现象,再对该现象进行处理。

不平衡数据的处理方法有重采样、欠采样、平衡抽样、代价敏感学习等。而综合考虑本问题中小样本+不平衡的特点,可以考虑选用生成式对抗网络[13]。

6 总结

裂缝经Hough变换后,皆可化为带一定噪声的正弦曲线,这一特性给予了人工绘制数据集一个有力的依据,也一定程度上克服了在现阶段裂缝识别上最大的问题:不可能采集到大量的数据以训练模型。这简化了数据采集工作,节约了大量的人力资本。

本文通过fine-tuning基于标准数据集的YOLOv3 tiny预训练模型,对测试集进行目标检测,从结果中可以看出,使用预训练的参数来初始化网络,不仅加快了收敛的速度,还能够有效地识别出一些裂缝。对于带有不同程度噪音的测试集再进行检测,也能识别出一部分,即该模型具备着一定的鲁棒性,这也是因为基于标准数据集的模型容许输入样本的多样性,因此大大提高了泛化能力。

最后,后续的研究可以将领域生成网络改造成深度迁移,共享人造数据集于裂缝处理后的数据集之间的深层特征,以试探性研究其两者之间的迁移。该工作有望解决许多问题,如将已有数据的陆相成因油田油藏迁移到很难采集数据以至于几乎没有数据的海相成因油藏中,或将某地区的油藏数据应用于新开发的油藏数据中,等等。

参考文献:

[1] 高霞,谢庆宾.储层裂缝识别与评价方法新进展[J].地球物理学进展,2007,22(5):1460-1465.

[2] 彭诚,邹长春.基于改进蚁群算法的成像测井裂缝自动提取方法[J].计算机工程,2015,41(8):196-201.

[3] 田金文,高谦,杜拥军,等.基于井壁成像测井图像的溶洞自动检测方法[J].江汉石油学院学报,1999,21(2):20-22.

[4] 秦巍,陈秀峰.成像测井井壁图像裂缝自动识别[J].测井技术,2001,25(1):64-69,81.

[5] 赖富强.电成像测井处理及解释方法研究[D].青岛:中国石油大学,2011.

[6] 刘文斌.火山岩储层缝洞测井自动识别和定量评价[D].长春:吉林大学,2017.

[7] 杜小强,刘鑫,薛志波,等.基于深度学习的电成像测井裂缝自动识别方法初探[J].化工管理,2019(24):204-205.

[8] Redmon J,Farhadi A.YOLOv3:an incremental improvement[EB/OL].2018

[9] Redmon J,Farhadi A.YOLO9000:better,faster,stronger[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).July 21-26,2017,Honolulu,HI,USA.IEEE,2017:6517-6525.

[10] Zhou Z W,Sodha V,Siddiquee M M R,et al.Models genesis:generic autodidactic models for 3D medical image analysis[EB/OL].2019

[11] 周燦灿,杨春顶.砂岩裂缝的成因及其常规测井资料综合识别技术研究[J].石油地球物理勘探,2003,38(4):425-430,462.

[12] Ganin Y,Ustinova E,Ajakan H,et al.Domain-adversarial training of neural networks[M]//Domain Adaptation in Computer Vision Applications.Cham:Springer International Publishing,2017:189-209.

[13] Goodfellow I.NIPS 2016 tutorial:generative adversarial networks[EB/OL].2016:arXiv:1701.00160[cs.LG].https://arxiv.org/abs/1701.00160.

【通联编辑:唐一东】

猜你喜欢

迁移学习目标检测
迁移学习研究综述
从认知角度探讨大学英语网络教学模式
奇异值分解与移移学习在电机故障诊断中的应用
视频中目标检测算法研究
行为识别中的人体运动目标检测方法
移动机器人图像目标识别
基于背景建模法的运动目标检测
基于P3电位的目标检测研究
一种基于迁移极速学习机的人体行为识别模型
一种改进的峰均功率比判源方法