APP下载

物化探综合异常模糊分级评价及识别

2010-10-17陈书让史朝洋

物探化探计算技术 2010年6期
关键词:模式识别人工神经网络物化

陈书让,张 林,史朝洋

(陕西省地质调查院,陕西西安 710065)

物化探综合异常模糊分级评价及识别

陈书让,张 林,史朝洋

(陕西省地质调查院,陕西西安 710065)

针对物化探综合异常反映出的高维空间复杂结构和相互之间复杂关系等现象,通过对多维信息的降维处理,提取综合异常的特征参量,建立了表述物化探综合异常的初始模型。以模糊数学为手段,对已知区的综合异常进行模糊分类评价,建立了物化探综合异常评价模型。利用人工神经网络,通过学习建立识别系统,对未知综合异常进行识别,完成了对复杂物化探综合异常的评价。实例表明,该评价方法是合理可行的。

综合异常;特征参量;模糊聚类;人工神经网络;模式识别

0 前言

随着多金属矿产和能源勘查难度的不断增大,在物化探方法投入方面,往往是多种物化探方法综合勘查,依此来减少单一方法在解释推断方面存在的多解性,以提高综合方法地质找矿的效果。从一般意义上说,由于不同的地球物理、地球化学指标,其属性是不同的,因而地球物理、地球化学行为亦不同,不同属性的指标也就往往不相关。但是,在成矿作用的影响下,又决定了不同指标之间具有共性,常常出现不同属性指标的叠合[1]。这种叠合的体现,就是在多金属矿(化)体或油气藏的上方出现众多指标异常共存的综合异常。所以说,多指标的叠合是多金属矿(化)体或油气藏本身地球物理、地球化学特征的必然反映。

以多指标叠合方式形成的综合异常,能够最大限度地反映各组成指标的异常信息特点和空间展布特点等,为从多方面对综合异常进行评价提供了素材,保证了综合异常评价结果的客观性。正确地对综合异常进行评价有助于缩小勘探靶区,提高勘探成功率,这是多金属矿产和能源综合物化探勘查希望达到的最终目的。然而,多指标虽然提供了众多可供利用的异常信息,但其形成的高维空间复杂结构等现象,自然也给综合异常科学评价增加了难度。因此,建立合理、实用的综合异常评价方法,是人们不断进行探索的问题之一。

1 基本思路

(1)初始模型建立。初始模型是以多元数理统计为工具,结合实际情况,通过对多维信息的降维处理,提取综合异常的特征参量,实现对物化探综合异常特征的全面描述。

(2)评价模型建立。评价模型是以综合异常特征参量为基础,以模糊数学为手段,对综合异常进行模糊分类评价。

(3)模式识别。依据评价模型结果,建立综合异常模式,并把其作为人工神经网络的学习样本。通过网络学习,建立人工神经网络识别系统,对未知综合异常进行识别。

2 综合异常特征参量的提取和选择[2、3]

综合异常特征参量,是对综合异常进行全面、客观描述的信息集合,是客观评价综合异常性质的基础素材,它直接关系到综合异常最终评价定位结果。为了保证提取和选择的特征参量,充分达到对综合异常的全面反映,特征参量提取和选择的基本原则有以下几点。

(1)既能够全面反映综合异常的全部信息,也能够体现各种不同指标组合信息对综合异常的贡献。

(2)既能够反映综合异常的内在本质特征,也能够体现综合异常的表象特征。

(3)每个特征参量应具有实际含义,且易于用量值加以表达。

(4)特征参量的量值为非负值,其大小反映了该特征参量对综合异常贡献大小的信息。

(5)特征参量量值的大小,与综合异常的可靠程度具有正比关系。

3 模糊分级评价方法

模糊分级评价是以模糊动态聚类分析为基础。动态聚类分析是基于样本间相似性度量的间接聚类方法。由于它能够真实、客观地描述事物之间的关系,因而在许多领域得到了广泛应用。

3.1 基本原理

模糊动态聚类[4~7]是从模糊矩阵出发,先给出一个初始分类,形成一个初始模糊矩阵,计算最优聚类中心,根据一定的准则对模糊矩阵进行修改,再重新计算最优聚类中心,直至计算达到精度要求为止。最终形成的模糊矩阵,反映了某个综合异常属于某一类的隶属度大小,根据最大隶属度原则确定综合异常的类属。模糊动态聚类的结果,使综合异常的特征参量“围绕中心而聚”。聚类中心是某一类综合异常的代表,不同聚类中心在多维空间的坐标值往往表现出一定的差异,因此,根据聚类中心在多维空间中,相对于原点的广义距离值的大小,可进行不同类别之间的分级定位,以达到分类又分级的结果。

3.2 算法描述步骤

(1)把描述综合异常的各特征参量构成样本集Χ,Χ用矩阵形式表示为:

其中 xij为综合异常的特征参量值;p为综合异常特征参量的个数;n为待聚类评价的综合异常个数。

(2)选择初始分类个数c,一般c

(4)计算每一类的最优聚类中心Vk。

(5)计算每个样本xi(i=1,2,…,n)与每个聚类中心Vk的距离Dik:

(6)根据模糊划分准则函数式(4),可以计算出J(D(l),V(l))。

如果J(D(l-1),V(l-1))-J(D(l),V(l))<ε(ε精度要求),则结束迭代。否则:

对于任意的i,若有s,使得xi=vs(X=(x1,x2,…,xn)T,则令

若对于任意的k,都有xi≠vk,执行式(6),返回步骤(4)。

其中 k=1、2、…、c。

4 模式识别

作者在本文采用的模式识别方法,是多层前向人工神经网络、BP学习算法。采用非线性激励函数的多层神经网络,可以解决许多复杂的实际问题,在模式识别方面的特点,就是在学习过程中具有自动提取特征的能力,表现出较强的分类识别能力[3]。

4.1 学习样本及标准模式的建立

学习样本是每个类别的所有综合异常的特征参量。设综合异常共分为c类,第i类共有Ni个综合异常,每个综合异常有p特征参量,则第i类的学习样本描述为:

其中 j=1、2…、Ni。

为使学习样本更为丰富,并使学习样本中包含具有类内的代表性综合异常,把类内特征矢量的均值矢量作为该类的代表,并称其为标准模式。

设m(i)为第i类综合异常特征参量的均值矢量,则均值矢量的第k个分量为:

则第i类的均值矢量定义为:

把第i类综合异常的标准模式与该类的其它综合异常,共同组成人工神经网络模式识别的学习样本,并以此为基础建立期望输出。

4.2 人工神经网络模式识别

4.2.1 BP神经网络的结构

BP神经网络的学习过程由正向传播和反向传播二个组成。在正向传播过程中,输入信号从输入层经过隐含层逐层处理,传向输出层。在输出层产生输出信号,每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,则转向反向传播过程,将误差信号,由输出层开始逐层向前传播。在误差信号反向传播的过程中,网络的连接权值由误差反馈进行调节。通过权值的不断修正,使网络的实际输出更接近于期望输出,由此所得的权值就记忆在网络之中,并用于对未知类别加以模式识别[9~14]。

根据作者在本文所解决的实际问题特点,选择有二个隐含层的BP神经网络,激励函数为逻辑(Sigmoid)函数(称之为S型函数):

其中 -∞

BP神经网络的结构见图1。

图1 含二个隐含层的BP网络结构图Fig.1 BPNetwork structurem ap inc luding two imp licate layers

4.2.2 BP神经网络算法描述[4~6]

BP算法是一种快速下降的方法,它采用了最优化方法中最普通的梯度下降法,目的是使实际输出与期望输出的均方差最小化。具体算法步骤为:

(1)设置变量和参数

Xk={xk1,xk2,…,xkp}T,k=1,2,…,N,为学习样本,N为学习样本的个数。

为第n次迭代时输入层与隐层I之间的权值向量。

为第n次迭代时隐层I与隐层J之间的权值向量。

为第n次迭代时隐层J与输出层之间的权值向量。

Yk(n)=[yk1(n),yk2(n),…,ykc(n)]T,为第n次迭代时网络的实际输出。Dk=[dk1,dk2,…,dkc]T,k=1,2,…,N,为期望输出。

(2)初始化,即赋给输入层各一个随机较小的非零值。

(3)提供学习样本和对应的期望输出向量。

(4)对所有学习样本,用S型函数前向计算BP网络各个层神经元的输出信号。

隐层I输出:

隐层J输出:

(5)由期望输出dk和实际输出yk(n)计算总平均误差能量。

输出层输出:

判断是否满足要求,若不满足要求转至步骤(6),直到网络的平均误差小于规定的要求,或达到给定学习次数,迭代结束。

(6)利用梯度调整法反向计算每一层神经元的局部梯度。

输出层局部梯度:

隐层J局部梯度:

隐层I局部梯度:

(7)计算权值修正量,并修正权值,转至步骤(4)。

其中 η为学习速率;α为动量因子;n为迭代次数。

4.2.3 BP神经网络算法在计算应用中应注意的几点

(1)由于初始值的大小会影响网络的学习速度,所以初始值既不能过大,也不能过小,一般应为-2.4/F~2.4/F(F为所连网络单元输入端个数)之间的非零随机数。

(2)学习速率参数的大小,是决定网格收敛速度和稳定性的重要参数。为保证网络既能稳定收敛,又有较快的收敛速度,可以在网格中加入动量因子。动量因子理论上可正可负,但实际应用中只能取正。

(3)期望输出值的设定,只能接近激励函数(Sigmoid)的渐近值1和0,而不应等于1和0。

(4)尽量使用顺序方式训练网络,以作者在本文中所述问题下,学习样本的输入顺序应是随机的,以尽可能避免连续输入的样本属于同一类。

4.3 综合异常识别

用上述的BP神经网络,经过学习样本的迭代计算,当误差达到规定的要求后,获得每一层各神经元的权值,这时的BP神经网络就是一个给定物化探综合异常分类结果为学习样本条件下的识别系统。利用该系统,对其它未知类别的综合异常进行分类识别,从而可实现对综合异常的分类评价。

5 实例分析

5.1 以鄂尔多斯盆地某探区油气物化探为例

5.1.1 探区地质概况

测区位于缓慢西倾的陕北斜坡的东部,沉积相带属于中生代三叠系的延长三角洲的组成部份。延长三角洲砂体呈北东~南西向舌状展布,属网状河流三角洲相及水下三角洲亚相,为砂泥剖面型。由于构造运动影响微弱,油气富集受鼻状构造和岩性双重因素的控制,整体上构造不太发育,仅在局部出现由压实差异形成的起伏较小的鼻状构造。

测区周边钻井资料揭示,该区地层的层序自上而下为:第四系(Q)、侏罗系直罗组(J2Z)、延安组(J1-2Y)、富县组(J1f)和三叠系延长组(T3Y)。其中,三叠系延长组为本区的主要勘探目的层。三叠系延长统长4+5、长6油层组,属于三角洲前缘河口砂体、三角洲平原分流河道砂体为主的湖相三角洲沉积。

5.1.2 综合异常特征参量选取

1区、2区和3区是得到一定验证的三个已知区,四区是待评价的新区。表1(见下页)是根据实际综合异常得到的三个已知区综合异常特征参量,共计十五个综合异常,把其作为神经网络的学习样本。

表2(见下页)是待评价区综合异常的特征参量。

5.1.3 模糊动态聚类结果

把已知区的十五个综合异常划分为四个类别,并以最优模糊矩阵的形式表示。按照最大隶属度原则,其分类结果见表3(见下页)。

表3(见下页)中的分级指标是每一类综合异常聚类中心的特征值。该特征值既反映了每一类之间的差异程度,同时,其量值的大小也反映了不同类别之间综合异常的好与坏,为综合异常的级别定位提供了依据。

四类综合异常特征参量的均值矢量由表4(见下页)给出。

由表1和表4共同组成人工神经网络的学习样本。

在学习过程中,网络的参数选择是:网络初始值为-0.218~0.218之间的随机非零数,学习速率0.2,动量因子0.2,输入层神经元12个,第一隐含层神经元36个,第二隐含层神经元12个,输出层神经元4个。网络学习的实际输出列于表5(见下页)。实际输出与期望输出的总平均误差小于0.000 1。

表1 已知区综合异常特征参量一览表Tab.1 Characteristic param etersof comp rehensive anom alies in confirm ed area

表2 待评价区综合异常特征参量一览表Tab.2 Characteristic param etersof comp rehensive anom alies in unknown area

表3 综合异常模糊划分动态聚类结果一览表Tab.3 Dynam ic fuzzy c lustering resu ltof comp rehensive anom alies

表4 综合异常特征参量的均值矢量一览表Tab.4 Average victorof characteristic param eter of comp rehensive anomalies

5.2 待评价区综合异常的识别结果

对表2中待评价区综合异常的识别结果,见下页表6。

5.3 结果分析

待评价区五个未知综合异常的识别结果是:

(1)1号异常尽管参数较多,但其电性特征和异常的重叠较差,因而被识别为三类异常。

(2)2号异常为一类异常。

(3)3号异常虽然异常指标不如1号异常多,但它有较好的电性特征和较好的重叠度,因而,被识别为二类异常。

(4)4号、5号异常为四类异常。

从这五个综合异常各方面的信息和特征定性分析,并根据多年的实际工作经验及资料对比认为,识别的结果是合理的。

6 结论

(1)用特征参量对物化探综合异常进行描述,既实现了对多指标、结构复杂的综合异常各种特征进行全面体现,同时也实现了对多指标的降维处理。以量值的形式体现综合异常的各种特征,为采用数学方法对其进行处理和定位提供了基础。

表5 神经网络实际输出Tab.5 Practicaloutputof neural network

表6 神经网络模式识别结果一览表Tab.6 Recognized resultof neural network pattern

(2)模糊聚类结果,既达到对综合异常的的分类,也实现了分级评价,从而有助于对综合异常认识上的深化。

(3)采用人工神经网络进行识别,符合处理物化探综合异常这种指标众多、异常结构复杂问题的实际要求。

实例表明,作者所采用的评价方法,其结果与实际情况是相符合的。作者在本文虽以油气物化探综合异常评价为例,就方法本身而言,对多金属物化探综合异常的评价也是适应的。

[1]杨育斌,张金来,吴学明,等.油气地球化学勘查[M].武汉:中国地质大学出版社,1987.

[2]吴翊,李永乐,胡庆军.应用数理统计[M].长沙:国防科技大学出版社(第四版),2001.

[3]植东升.地质找矿勘探中的概率统计方法[M].长沙:中南工业大学出版社,1987.

[4]彭祖赠,孙韫玉.模糊(Fuzzy)数学及其应用[M].武汉:武汉大学出版社,2002.

[5]李荣钧.模糊多准则决策理论与应用[M].北京:科学出版社,2002.

[6]张振良.应用模糊数学[M].重庆:重庆大学出版社,1991.

[7]文环明.动态聚类分析在储层分级中的应用[J].物探化探计算技术,2002,24(4):323.

[8]孙即祥.现代模式识别[M].长沙:国防科技大学出版社,2002.

[9]沈世镒.神经网络系统理论及其应用[M].北京:科学出版社,2000.

[10]高隽.人工神经网络原理及仿真实例[M].北京:机械工业出版社,2003.

[11]杨文采,王宝珍.神经网络技术及其在物化探上的应用[J].物探化探计算技术,1994,16(4):303.

[12]张洪,邹乐君,沈晓华.BP神经网络在测井岩性识别中的应用[J].地质与勘探,2002,38(6):18.

[13]吴良才,胡振琪.基于神经网络的GPS高程转换方法[J].工程勘察,2004,2:23.

[14]王硕儒,赵举孝,范德江.自组织神经网络用于地质样品分类[J].物探与化探,1997,21(2):34.

TP 183

A

1001—1749(2010)06—0629—07

2010-05-04 改回日期:2010-10-12

陈书让(1957-),男,陕西咸阳人,工程硕士,教授级高级工程师,主要从事物化探资料处理、综合研究和解释工作。

猜你喜欢

模式识别人工神经网络物化
物化-生化工艺处理页岩气采出水的工程实践
利用人工神经网络快速计算木星系磁坐标
人工神经网络实现简单字母的识别
滑动电接触摩擦力的BP与RBF人工神经网络建模
UPLC-MS/MS法结合模式识别同时测定芪参益气滴丸中11种成分
在Oracle数据库中实现物化视图
第四届亚洲模式识别会议
重看图形界面“扁平化”与“拟物化”之争——关于设计思维的探讨
人工神经网络和安时法电池SOC估计
可拓模式识别算法中经典域的确定方法