APP下载

基于PCA-RBF神经网络的新型录井岩性识别方法

2016-04-22鲜让之吴德顺陈丽群

四川地质学报 2016年1期
关键词:塔里木

陈 袁,鲜让之,吴德顺,周 飞,陈丽群

(1.中石油塔里木油田分公司勘探开发研究院,新疆 库尔勒841000;2.中石油塔里木油田分公司库车项目经理部,新疆 库尔勒841000)



基于PCA-RBF神经网络的新型录井岩性识别方法

陈 袁1,鲜让之1,吴德顺2,周 飞1,陈丽群1

(1.中石油塔里木油田分公司勘探开发研究院,新疆 库尔勒841000;2.中石油塔里木油田分公司库车项目经理部,新疆 库尔勒841000)

摘要:新的钻井工艺或钻井液体系的使用在保证钻井施工顺利进行的同时,也给录井岩屑的岩性识别带来了极大的挑战,其中以膏盐岩地层尤为突出。以塔里木油田大北X井为例,提出了主成分分析(PCA)与径向基函数(R BF)神经网络相结合的膏盐岩地层岩性识别方法,利用主成分分析法去除指标变量间的相关性,将原始指标变量重新线性组合为4项综合变量作为R BF神经网络的输入向量;最后建立适于识别膏盐岩地层岩性的R BF神经网络模型。实际识别结果表明,该PCA-R BF神经网络模型对于膏盐岩地层岩性的识别具有较高的准确性,完全可以满足实际应用的要求,具有进一步推广的价值。

关键词:R BF神经网络;综合录井参数;膏盐岩地层;塔里木

PDC钻头由于其高钻速、高效益、高井身质量等优势而被广泛使用,然而它特殊的钻头结构和岩石破碎机理又使得岩屑量少且细碎[1],这给现场岩样的采集和岩屑的岩性识别带来极大的困难。譬如在膏盐岩地层中,为了避免因盐岩层蠕动而带来的卡钻等钻井事故,常常采用欠饱和钻井液体系。这种钻井液体系由于溶解了地下盐层,从而使得返出井口的岩屑量急剧减少,难以观察到盐岩,同时由于盐岩溶解而造成上覆岩层的局部垮塌,还会使得岩屑中混入大量非该目的层段的假岩屑,这些影响因素无疑都增加了岩性准确识别的难度。

以往用于识别或预测地层岩性的方法主要有以下三类:①通过研究综合录井参数(如钻时、扭矩或转速等)与岩性间直接对应关系来识别[3-7];②通过建立录井参数与岩性的数学线性关系来确定,如钻速与岩性的关系[8],录井参数相关系数二阶导与岩性的关系[9];③通过建立模型来识别岩性,如模糊数学[10]、BP神经网络[11-14]等。尽管上述方法在录井岩性的识别上取得了一定的效果,但也存在一定的局限性,如录井参数多选取以钻速为主的工程参数而忽略了钻井液参数的运用,而且以上方法无一例外都应用在砂泥岩地层,还没有提出针对特殊地层(如膏盐岩地层)的录井岩性识别方法。因此,结合前人研究成果,综合运用多录井参数,首次提出了基于主成分分析的径向基函数神经网络在膏盐岩地层录井岩屑的岩性识别方法,不仅克服了过去所选参数的单一化,还弥补了鲜有针对膏盐岩地层岩屑的岩性识别这一空白。

1 主成分分析(PCA)原理

主成分分析(Principal Component Analysis,简称PCA)是利用降维的思想,把多个指标转化为少数几个不相关的综合指标的一种多元统计数学分析方法。PCA的基本思想为把众多具有一定相关性的原始可观测指标变量X1,X2,…,Xp,通过线性变换,重新组合成一组互不相关的综合指标变量Fm(m≤p),以代替原来可观测的指标变量[15],排除其相互重叠的信息,组成少数几个不能直接观测的新变量。这些新变量在反映地层真实信息方面又尽可能多的表征了原变量的数据特征,以此来综合反应地层岩性。假定有n 个岩性样本,每个样本有p 个指标变量,所构成得n×p 的矩阵则为:

主成分分析的具体步骤可分为以下几步:

1.1原始指标变量标准化

原始观测指标有不同的量纲,有的有很大的差异。由于不同量纲的数量级会引出新的问题,为了消除由于量纲的不同而带来的影响,主成分分析前需对数据进行标准化处理,公式为:

式中,表示第i个指标变量与第k个指标变量的相关系数。

1.3计算R矩阵的特征值λ j及特征向量α ji,建立主成分得分函数Fj

特征值是主成分的方差,其大小反映了各个主成分在被评价对象上所起作用,可根据特征方程式来求出,并进一步求出属于λj特征向量αji(i=1,2,…,p),最后通过特征向量,可将标准化后的指标变量Zi转换为综合指标变量,即主成分得分函数为原指

标变量的第j个主成分,它是Z1,Z2,…,Zp的一切线性组合中方差最大的,即Fj是与F1,F2,…,Fj-1都不相关的Z1,Z2,…,Zp的所有线性组合中方差最大者。其中F1在总方差中所占比重最大,其余主成分方差依次递减,因此实际处理中只需挑选其中几个方差最大的主成分来简化系统结构。

1.4计算方差贡献率,确定主成分个数m

2 径向基函数(RBF)神经网络模型

径向基函数(Radial Basis Function,简称RBF)神经网络,是1998年提出的一种典型的三层前馈网络,由输入层、隐层和输出层组成(见图)。作为整个神经网络体系中应用最广泛的网络结构,相比较其他神经网络而言,RBF神经网络在训练速度、逼近能力等方面则更具优势,具有收敛速度快、不易陷入局部极小点、鲁棒性好和易于实现等优点[16-18]。

RBF神经网络结构图

RBF神经网络的基本思想是用径向基函数作为隐层神经节点的基,通过非线性函数的线性组合来实现非线性映射。径向基函数神经节点的基函数形式各异,其中最常用的为高斯函数,它是一种局部分布、中心对称衰减的非负非线性函数。高斯函数表达式为:

式中:h为隐层节点数;Ri(x)为隐层第i个节点的输出;x为m维输入向2量;ci为隐层第i个径向基函数中心;σi为隐层节点响应宽度,用于调节神经节点的敏感程度;x-ci为x-ci的欧式距离,表示x与ci之间的距离。

从高斯函数表达式来看,在ci处隐层节点的响应值达到最大,随着x-ci的增大,R(ix)迅速衰减,因此从输入层输入的向量只有一小部分靠近ci的值才会被激活,即径向基函数为一个具有局部感受特性的函数形式。

RBF神经网络从输入层到隐层x→Ri(x)为非线性变换,而隐层到输出层则为线性变换:

式中:wki为第i个隐层节点到第k个输出层之间的权值;p为输出层数。

通过RBF神经网络表达式可以看出,由径向基函数构成的隐层对输入层进行变换,能将低维数据变换到高维空间,使得在低维空间线性不可分的问题在高维空间线性可分,并最终通过输出层线性输出。利用高斯函数作为基函数的径向基神经网络学习过程可简述为两个阶段:①自组织学习阶段,即学习隐层基函数的中心与方差的阶段;②监督学习阶段,即学习输入层权值阶段。在网络学习中需要确定的参数有两类:①隐层节点数h、基函数中心ci和宽度σi,一般可采用K-均值算法来训练ci,基函数宽度的选取则往往根据聚类的结果来确定,而隐层节点个数的确定至今没有完善的计算公式,只能通过遍历尝试直到达到误差满意为止;②输出层与隐层之间的连接权值,在确定ci和σi之后,权值的大小可采用线性最小二乘法(LMS)来确定。

3 实例应用

塔里木盆地库车坳陷库姆格列木群(E1-2km)广泛发育厚层膏盐岩,其中塔里木油田大北X井库姆格列木群第二段(5 071.0m~5 681.0m)为一典型的膏盐岩地层,岩性较为丰富,主要为不同厚度的褐色含盐泥岩、盐质泥岩、泥岩,白色盐岩、泥质盐岩、膏盐岩、石膏岩,灰白色泥膏岩等。为了保证合理的井眼结构和钻井施工的安全,该井E1-2km段采用了PDC钻井工艺和欠饱和盐水钻井液体系,这也使得钻井岩屑颗粒细小且量少,在现场可能造成岩屑定名不准确,甚至连岩屑的主要岩性都可能出现重大偏差。基于此,本文选择了该井5 512.0m~5 591.0m井段的79个岩屑样本(岩屑为1米1捞)进行PCA-RBF神经网络训练,并对5 591.0m~5 646.0m井段共55组岩屑岩性进行识别。在此需要补充说明的是,训练样本和识别样本岩性都做了适当的简化,只取其主要岩性(盐岩、膏岩及泥岩)作为研究对象。

表1 原始观测指标变量样本汇总表(已标准化)

3.1 原始观测指标变量的选取

由于地下地层岩性的不同会引起钻井效率的不同,因此可以根据钻井效率的改变来判断地下地层的岩性。对于膏盐岩等软地层来说,PDC钻头的使用寿命较长,在长时间钻进该类型地层后,钻头仍能保持良好的工作状态[19],因此本次研究忽略了钻头磨损对钻井效率的影响。在充分考虑钻井工艺和钻井液体系对膏盐岩地层钻井效率的影响[20-22]后,优选出了3大类共计9项的原始观测指标变量。第1类为可以直接从录井仪上读取的录井参数,如钻时等;第2类为需要做简单线性处理的参数,如当量进尺深度;第三类为钻井液参数,如氯离子含量。其具体参数为:钻速(X1)、入口流量(X2)、出口密度(X3)、全烃(X4)、当量进尺深度(X5)、当量扭矩(X6)、DC指数(X7)、出入口电导差(X8)、氯离子含量(X9)。

3.2PCA-RBF神经网络岩性识别

由于所选原始观测指标较多,各指标势必存在不同程度的相关性,如不进行处理将增加神经网络的规模,影响识别精度。经主成分分析后的数据可以在保留主要信息的基础上降低神经网络的输入维数,从而消除变量间的相关性,增强神经网络的识别能力。PCA-RBF神经网络岩性识别步骤如下:

1)对所选样本按照标准化公式进行处理,其结果见表一。

表2 主成分方差解释表

2)对79个训练样本建立相关系数矩阵R。

3)计算R特征值,确定主成分。通过对相关系数矩阵特征值的计算可知(表2),前4个主成分的特征值都大于1,且方差累计贡献率达到88.82%,说明前4个主成分基本包含了9个原始观测指标变量的所有信息。根据因子载荷矩阵(表3)可发现:钻速、当量进尺深度、DC指数和当量扭矩在第1主成分(F1)上有很高的载荷,说明了第1主成分主要反映了钻速等原指标变量的信息;入口流量、出口密度及氯离子含量在第2主成分(F2)上载荷较高;出入口电导差在第3主成分(F3)上有很高载荷;第4主成分(4)主要反映了全烃指标变量的信息。以上4个主成分综合反映了全部9项指标变量的绝大部分信息,因此可以用前四个主成分来代替原有观测指标变量进行神经网络分析。表三的主成分得分系数矩阵给出了原始指标变量与主成分之间的线性关系,根据该矩阵以及原始指标变量就可以计算出各主成分的得分,其线性表达式为:

表3 因子载荷矩阵与主成分得分系数矩阵

4)建立PCA-RBF神经网络岩性识别模型。

利用上述4个主成分公式,计算出134组岩性样本各主成分得分,并将其作为神经网络训练识别的输入向量。在79组训练样本中,随机选取其中的28组作为神经网络模型的回判样本。由样本特征可以确定PCA-RBF神经网络的结构:输入层为4层,输出层为3层,隐层节点数则通过遍历尝试确定,当隐层节点数为22时,神经网络模型误差最小,模型的其余参数是在确定了隐层节点数后,自动调整其值至到最小误差为止。表四为PCA-RBF神经网络训练识别的结果汇总表,从该表可以看出,该网络模型训练样本的正确率高达98.0%,回判正确率达92.9%,对55待识别样本的识别正确率达90.9%。其中仅有2个膏岩被错误识别为泥岩,1个泥岩误认为盐岩,2个盐岩样本分别错判为膏岩和泥岩。从训练和识别的结果来看,该PCA-RBF神经网络模型对于膏盐岩地层岩性的识别具有较高的准确性,可以满足实际应用的要求,可以进一步推广。

表4 训练识别结果汇总表

4 结论

主成分分析法(PCA)作为一种降维的数学分析方法被大量用于石油勘探领域,而径向基函数神经网络由于其训练速度快,逼近能力强、鲁棒性好和易于实现等优点而成为神经网络体系中应用最广泛的网络结构。将主成分分析法与径向基函数神经网络结合,并应用于膏盐岩地层录井岩屑的岩性识别尚属首次。经主成分分析后的众多原始可观测指标变量能线性组合为少数保留了原始变量信息的综合变量,从而降低神经网络的输入维数,增强网络模型的识别能力。实际应用表明,以塔里木油田大北X井为例,对优选出的9项综合录井参数进行主成分分析,确定了方差贡献率最大的前4个主成分作为径向基函数神经网络的输入层,通过遍历尝试隐层节点数后,确定了RBF神经网络的最优模型,将其对55个待识别样本进行识别,最终识别正确率达90.9%。因此可以认为,基于PCA-RBF神经网络的膏盐岩地层岩性识别方法具有一定的合理性,有进一步推广的价值。

参考文献:

[1]焦继延.PDC钻头钻井对地质录井的影响[J].西部探矿工程,2005,111(增):35~37.

[2]王晓阳,张泳.塔河油田膏盐岩地层录井技术[J].录井工程,2006,17(增):12~15.

[3]贺登兵.不同钻井参数条件下PDC钻头钻井岩屑分析与识别[J].内蒙古石油化工,2007(8):208~209.

[4]高峰,张书桐,滕玉明,等.PDC钻头下录井岩性的识别方法[J].石油地质与工程,2007,21(1):37~38,63.

[5]曾艳涛,肖天君,使用PDC钻头时的录井方法研究[J].西部探矿工程,2010(6):58~60.

[6]徐振中,蔡福华.谈谈在使用PDC钻头时的几种录井方法[J].西部探矿工程,2005,107(4):61~62.

[7]何国贤.应用录井参数综合判别岩性[J].海洋石油,2002,111(1):19~23.

[8]曹正林,周丽清,王志章,等.利用钻井参数进行随钻岩性预测[J].天然气工业,2000,20(1):48~50.

[9]王佑宁,惠卓雄,刘志刚,等.PDC钻头条件下岩性识别新技术探讨[J].录井技术,2003,14(4):1~7.

[10]张文旗,王志章,孙新销,等.PDC钻头条件下随钻岩性模糊识别[J].录井工程,2008,19(2):27~29.

[11]李功权,曹代勇,陈恭洋,等.PDC钻头条件下随钻岩性识别方法研究[J].石油钻采工艺,2006,28(2):25~27.

[12]杨进,张辉.地层岩性随钻识别的神经网络方法研究[J].天然气工业,2006,26(12):109~111.

[13]周劲辉,鄢泰宁,屠厚泽.识别所钻地层的人工神经网络法应用[J].地球科学—中国地质大学学报,2000,25(6):642~645.

[14]张辉,高德利,钻井岩性实时识别方法研究[J].石油钻采工艺[J].2005,27(1):13~15.

[15]于秀林,任雪松.多元统计分析[J].北京:中国统计出版社,1999.

[16]Meng JooEr,Shiqian Wu,Juwei Lu,et al.Face Recognition With Radial Basis Function(RBF)Neural Networks[J].Ieee Transactionson Neural Networks,2002,13(3):697~710.

[17]Tianshu Bi,Zheng Yan,Fushuan Wen.Online Fault Section Estimation in Power Systems With Radial Basis Function Neural Network[J].Electrical Power and Energy Syst.,2002,24:321~328.

[18]Sridhar Seshagiri,Hassan K Khalil.Output Feedback Control of Nonlinear Systems Using RBF Neural Networks[J].Ieee Transactionson Neural Networks,2000,11(1):69~79.

[19]邹德永,王瑞和.PDC钻头的岩石研磨性试验研究[J].石油大学学报(自燃科学版),2003,27(2):41~43.

[20]陈庭根,管志川.钻井工程理论与技术[M].东营:中国石油大学出版社,2000.

[21]石秉忠.钻井液对钻井效率的影响因素分析[J].西部探矿工程,2011(12):74~78.

[22]尚锁贵.膏盐岩地层地质特征与录井技术[J].录井工程,2006,17(4):10~13.

Lithology Identification Method While Drilling Based on PCA-RBF Neural Network

CHEN Yuan1XIAN Rang-zhi1WU De-shun2ZHOU Fei1CHEN Li-qun1
(1-Research Institute of Exploration and Development,Tarim Oilfield Company,PetroChina,Korla Xinjiang 841000; 2-Kuqa Project Management Department,Tarim Oilfield Company,PetroChina,Korla Xinjiang 841000)

Abstract:This paper has a discussion on lithology identification method while drilling based on PCA-RBF neural network by the example of gypsum salt rock formation in DB-X Well,Tarim Oilfield and puts forward lithology identification method for gypsum salt rock formation based on PCA and RBF neural network.A RBF neural network model for lithology identification of gypsum salt rock formation is set up.

Key words:PCA method; RBF neural network; comprehensive mud logging parameter; gypsum salt rock formation; lithology identification

DOI:10.3969/j.issn.1006-0995.2016.01.035

中图分类号:O212

文献标识码:A

文章编号:1006-0995(2016)01-0156-05

作者简介:陈袁(1987-)男,四川内江人,助理工程师,现从事油藏描述,油气田开发地质研究工作

收稿日期:2015- 03-06

猜你喜欢

塔里木
塔里木油田HLHT区块优快钻井技术研究
塔里木库车山前深井窄间隙小尾管固井技术
岩屑录井数字化技术在塔里木油田的应用
塔里木
基于TSP方法的环塔里木非物质文化遗产的旅游线路研究
大学生旅游行为调查分析——以塔里木大学为例
从源-盖控烃看塔里木台盆区油气分布规律
塔里木油田超深超高压气藏的成功改造
2013年塔里木垦区棉花农业气象条件评述
2013年塔里木垦区气候特点及其对棉花生产的影响