APP下载

基于主成分分析和学习矢量化的神经网络岩性识别方法

2015-05-09胡红曾恒英梁海波罗静王剑波

测井技术 2015年5期
关键词:岩性测井神经元

胡红, 曾恒英, 梁海波, 罗静, 王剑波

(1.西南石油大学地球科学与技术学院, 四川 成都 610500; 2.西南石油大学机电工程学院, 四川 成都 610500)

0 引 言

自Samuel J Rogers等[1-14]详细阐述神经网络在岩性识别中的应用以来,采用基本BP算法及其一些改进算法训练BP网络均取得良好效果。但基本BP算法存在局限性,比如容易陷入局部极小值点,网络学习和记忆不稳定等[15]。

测井资料中与岩性密切相关的测井曲线有多条,输入维数过高必定会引起网络结构复杂化,增加运行时间,降低网络整体性能。针对上述情况,提出了一种基于主成分分析(Principal Component Analysis,PCA)和学习矢量量化(Learning Vector Quantization,LVQ)的神经网络的岩性识别方法。PCA是由Hotelling[16]提出的一种对信息进行处理、压缩、提取的有效方法。LVQ神经网络是一种训练竞争层的前向有监督的网络类型,具有网络结构简单,分类稳定可靠,容错性好等特点。该方法用PCA对测井数据进行降维,然后利用LVQ神经网络进行岩性识别分类。

1 理论原理

1.1 主成分分析

主成分分析(PCA)是一种基于变量协方差矩阵,能很好地处理高维数据的多元统计分析方法。通过投影,将高维数据以尽可能少的信息损失映射到低维空间,达到简化数据结构的目的。即用较少的指标代替和综合反映原来较多的信息,这些综合后的指标就是原来多指标的主要成分[17]。

对某一对象进行评价时,设其原始数据集中样本数为n,输入变量维数为p,则输入样本阵Xi=(xi1,xi2,…,xip)T。主成分的求解过程实质是求解转换矩阵U的过程。主成分的求解分为4个步骤[17-19]。

(1) 对原始变量矩阵X进行标准化,计算标准化数据的相关系数距阵R。

(4) 主成分的个数通过累计贡献率来确定。一般取累计贡献率达80%~95%的特征值λ1,λ2,…,λm所对应的主成分Y1,Y2,…,Ym。

1.2 LVQ神经网络

LVQ神经网络是一种自组织特征映射算法的改良算法。它将有监督学习算法和竞争学习思想结合起来,具有强大的非线性运算和相似特征聚类功能。在模式识别应用中,使用LVQ不需要将输入向量归一化、正交化,只需直接计算输入向量与竞争层之间的距离,就可实现模式分类[20]。

LVQ网络由输入层、竞争层和输出层神经元组成(见图1)。输入层有n个神经元接受输入向量,与竞争层之间完全连接;竞争层有m个神经元,分别为若干组;输出层每个神经元只与竞争层中的一组神经元连接,连接权值固定为1。在LVQ网络训练过程中,输入层和竞争层之间的连接权值被逐渐调整为聚类中心,当一个输入样本被送至LVQ网络时,竞争层的神经元通过胜者为王竞争学习规则产生获胜神经元,允许其输出为1,而其他神经元输出为0,与获胜神经元所在组相连接的输出神经元其输出也为1,而其他输出神经元为0,从而给出当前输入样本的模式类[21]。其学习算法分为LVQ1算法和LVQ2算法。在LVQ1算法中,只有一个神经元获胜,即只有一个神经元的权值向量得到更新,而LVQ2算法引入了“次获胜”神经元,获胜神经元与“次获胜”神经元的权值向量都能得到更新调整,因此能提高网络训练质量,分类效果更加。

图1 LVQ网络结构

2 PCA-LVQ岩性识别方法

利用测井资料进行岩性识别的问题,实际就是建立非线性数学模型。LVQ神经网络作为一种非线性建模方法,具有良好的自组织和自适应性等功能,可以逼近任意的非线性函数(映射)。但由于输入的不同测井曲线数据之间存在着一定的相关性,不仅使网络规模剧增,降低了网络的收敛性能,而且导致输入信息重叠,使模型预测的准确率有所降低。因此,本文提出的PCA-LVQ岩性识别模型,既简化了网络结构,加快了收敛速度,又提高了网络的识别精度。该模型包括3个步骤。

(1) 选取测井数据样本集并进行标准化处理。将样本集分为2部分,即训练集和测试集。

(2) 对训练集和测试集数据进行主成分分析,按照累计贡献率大于90%选择主成分,并将训练集和测试集选取的主成分分别记为X_PCA和C_PCA。

(3) 把X_PCA输入LVQ神经网络中进行训练,建立PCA-LVQ岩性识别模型。把C_PCA输入建好的模型中,得到测试样本的分类。

3 在测井岩性识别中的应用

对沁水盆地潘庄地区×井进行了测井资料岩性识别。这是一口与多分支水平井相配套的煤层气排采井,有录井、测井和部分取心资料。在通过样本和测井参数的优选后,利用PCA-LVQ模型进行岩性识别,并与LVQ模型的识别结果进行了对比。

3.1 样本集的选取

运用神经网络技术识别岩性,建立典型合理的样本集是成功的关键[5]。该研究综合利用岩心、岩屑和测井等资料,通过一系列的资料分析、数据处理,建立了可靠的岩性和测井参数响应的对应关系。×井钻穿地层共计7种岩性,分别为砂质泥岩、泥岩、粉砂岩、细砂岩、中砂岩、石灰岩、煤,对7种岩性进行了编码,作为神经网络的输出(见表1)。测井曲线有9条,分别为探测岩石电性特征的自然电位(SP)、深侧向(RLLd)、浅侧向(RLLs)、微球聚焦(RMSFL),反映岩石声学特性的补偿声波(AC),反映地层稳定性的井径(CAL)以及探测岩石核物理性质的自然伽马(GR)、补偿密度(DEN)、补偿中子(CNL)。

表1 ×井岩性编码

为找到样本集最佳的输入变量,设计了3个方案:①为了最大程度地保留测井信息,输入9条测井曲线;②由于钻头类型、钻进方式、钻井液性能、钻井泵排量等都会对井径大小造成影响,为减小非地层因素的影响,输入除CAL外的8条测井曲线;③由于有3条电阻率曲线,为降低输入维度,减小非地层因素的影响,仅输入GR、SP、DEN、AC、CNL、RLLD等6条测井曲线。其中,电阻率曲线都经过对数化处理。同时由于每种岩性所对应的测井响应参数都在一个区间上变化,为了保证样本的全面性、代表性,样本数目必然不能太少。依据岩性剖面和测井资料,全井共选取了250个样本组成样本集。

3.2 数据标准化处理

为消除测井数据量纲不同的影响,减小运算量,运用PCA特征提取技术之前,样本集数据须进行标准化处理。数据标准化有几种方法,这里采用标准差标准化方法。其公式为

(1)

3.3 PCA特征提取

将归一化后的数据分为2个部分,其中1~200号作为训练样本,201~250号作为测试样本。对训练样本进行主成分分析,得到了3种方案的特征值、特征向量、累计贡献率,并通过特征向量和归一化后的变量矩阵求出了主成分。训练样本的特征值和累计贡献率如表2所示。各方案前3个主成分的累计贡献率分别为91.86%、95.02%、95.76%,基本反映了原始样本所有信息,可代替原始样本作为神经网络的输入,记为X_PCA。图2是方案①、方案②、方案③前3个主成分的空间分布,不难看出,输入变量采用②和③方案时,前3个主成分的聚类效果较好,类边界更加清晰。测试样本主成分分析的过程与训练样本相同,把得到的前3个主成分记为C_PCA。X_PCA和C_PCA即为新的训练样本和测试样本。

3.4 PCA-LVQ模型的岩性识别

表2 训练样本特征值及累计贡献率

图2 各方案前3个主成分的空间分布

在MATLAB中编程实现了LVQ神经网络的LVQ1和LVQ2算法。把3种方案的训练样本X_PCA分别输入LVQ网络进行训练,建立各方案的PCA-LVQ岩性识别模型。由于需要输入3个主成分和输出7种岩性,所以输入层、输出层神经元个数分别为3和7。训练参数仅涉及了学习速率和训练次数,学习速率取0.01,竞争层神经元个数和训练次数通过试凑法确定。如图3、图4所示,PCA-LVQ网络的岩性识别率与竞争层神经元个数、训练次数呈正相关的关系,且最后LVQ1和LVQ2学习算法的识别率均保持不变。由此不难确定,最佳网络结构为3-12-7,训练次数为130次。网络训练完成后,输入测试样本以检验模型的有效性。

图3 识别率与竞争层神经元个数的关系(训练次数150次)

图4 识别率与训练次数的关系(竞争层神经元12个)

表3给出了直接利用原始测井数据进行岩性识别的LVQ模型和主成分分析过后的PCA-LVQ模型的测井岩性识别结果。结果表明:(1)经过PCA降维后,LVQ网络的收敛速度和识别率都得到了明显提高,训练时间缩短了10 s左右,识别率提高20%以上;(2)考虑了“次获胜”神经元的LVQ2学习算法具有更强的模式识别能力,岩性识别率提高4%以上;但相应的网络运算量增大,训练时间变长;(3)与方案①和方案③相比,输入变量采用方案②时,岩性识别率更高,可达到90%。这一结果与各方案前3个主成分的空间分布相符。

表3 LVQ模型和PCA-LVQ模型岩性识别结果

4 结 论

(1) 针对测井资料曲线多和LVQ神经网络在模式分类中的显著特点,首次将PCA-LVQ网络模型应用于测井岩性识别。

(2) 利用神经网络进行测井岩性识别时,输入测井曲线的选择十分重要。既要保留更多的有用信息,又要尽量减小非地层因素的影响。

(3) PCA特征提取技术是一种行之有效的测井数据预处理方法,消除了测井曲线数据间的自相关性,实现数据压缩和降维,加快网络收敛速度,提高了网络识别精度。

(4) PCA-LVQ模型网络结构简单;在较少试验的情况下就可以确定最佳的网络结构和训练参数,容易实现;识别正确率较高,在油气勘探领域中具有较大的应用价值。

参考文献:

[1] Rogers S J, Fang J H, Karr C L, et al. Determination of Lithology from Well Logs Using a Neural Network [J]. AAPG Bulletin, 1992, 76(5): 731-739.

[2] 张洪, 邹乐君, 沈晓华. BP神经网络在测井岩性识别中的应用 [J]. 地质与勘探, 2002, 38(6): 63-65.

[3] 崔勇, 赵澄林. 神经网络技术在油田地质学领域中的应用——以测井岩性识别为例 [J]. 西安石油学院学报, 2003, 17(4): 16-18.

[4] 张治国, 杨毅恒, 夏立显. 自组织特征映射神经网络在测井岩性识别中的应用 [J]. 地球物理学进展, 2005, 20(2): 332-336.

[5] 吴磊, 徐怀民, 季汉成. 基于交会图和多元统计法的神经网络技术在火山岩识别中的应用 [J]. 石油地球物理勘探, 2006, 41(1): 81-86.

[6] 邓广涛, 马念杰, 贾明魁. 人工神经网络在煤巷顶板岩性识别中的应用 [J]. 采矿与安全工程学报, 2006, 23(2): 182-186.

[7] 程国建, 周冠武, 王潇潇. 概率神经网络方法在岩性识别中的应用 [J]. 微计算机信息, 2007, 23(6): 257, 288-289.

[8] 纪福全, 程国建, 王潇潇, 等. 构造性神经网络在测井岩性识别中的应用 [J]. 石油矿场机械, 2007, 36(4): 52-55.

[9] 张莹, 潘保芝. 基于主成分分析的SOM神经网络在火山岩岩性识别中的应用 [J]. 测井技术, 2009, 33(6): 550-554.

[10] Cvetkovic M Velic J, Malvic T. Application of Neural Network in Petroleum Reservoir Lithology and Saturation Prediction [J]. Geologia Croatica, 2009, 62(2): 115-121.

[11] 刘兴周. BP神经网络在辽河坳陷太古宇潜山内幕岩性识别中的应用 [J]. 石油地质与工程, 2010, 24(5): 40-42.

[12] 刘明军, 李恒堂, 姜在炳. GA-BP神经网络模型在彬长矿区测井岩性识别中的应用 [J]. 煤田地质与勘探, 2011, 39(4): 8-12.

[13] 范存辉, 梁则亮, 秦启荣, 等. 基于测井参数的遗传BP神经网络识别火山岩岩性——以准噶尔盆地西北缘中拐凸起石炭系火山岩为例 [J]. 石油天然气学报, 2012, 34(1): 68-71.

[14] 杨辉, 黄健全, 胡雪涛, 等. BP神经网络在致密砂岩气藏岩性识别中的应用 [J]. 油气地球物理, 2013, 11(1): 39-42.

[15] 张治国, 杨毅恒, 夏立显. RPROP算法在测井岩性识别中的应用 [J]. 吉林大学学报, 2005, 35(3): 389-393.

[16] Hotelling H. Analysis of a Complex of Statistical Variables into Principal Components [J]. Journal of Educational Psychology, 1993, 24(6): 417-441, 448-520.

[17] 张国英, 王娜娜, 张润生, 等. 基于主成分分析的BP神经网络在岩性识别中的应用 [J]. 北京石油化工学院学报, 2008, 16(3): 43-46.

[18] 李岳, 吕克洪. 主成分分析在铁谱磨粒识别中的应用研究 [J]. 国防科技大学学报, 2004, 26(1): 89-94.

[19] 钟仪华, 李榕. 基于主成分分析的最小二乘支持向量机岩性识别方法 [J]. 测井技术, 2009, 33(5): 325-429.

[20] 飞思科技产品研发中心. 神经网络理论与MATLAB7实现 [M]. 北京: 电子工业出版社, 2005.

[21] 孙健, 王成华, 洪峰, 等. 基于PCA-LVQ的模拟电路故障诊断 [J]. 电路与系统学报, 2013, 18(2): 310-313.

猜你喜欢

岩性测井神经元
本期广告索引
一种识别薄岩性气藏的地震反射特征分析
跃动的神经元——波兰Brain Embassy联合办公
相关矩阵和熵值算法在松辽盆地元素录井岩性识别中的应用
K 近邻分类法在岩屑数字图像岩性分析中的应用
运用测井资料识别岩性油气藏
基于测井响应评价煤岩结构特征
随钻电阻率测井的固定探测深度合成方法
ERK1/2介导姜黄素抑制STS诱导神经元毒性损伤的作用
毫米波导引头预定回路改进单神经元控制