APP下载

基于贝叶斯网的隐伏矿体成矿预测

2019-03-08邓浩刘靖

西部论丛 2019年5期

邓浩 刘靖

摘 要:目前的矿产资源预测与评价方法在如何融合多维、多元地质信息方面缺乏更深层次的研究。本文在在已有模型和技术的基础上,提出了采用貝叶斯网络模型进行成矿预测的方法。贝叶斯统计不同于一般的统计方法,其不仅利用模型信息和数据信息,而且充分利用先验信息。本文以新疆阿希金矿为研究区,利用贝叶斯网学习学习成矿因素和金品位间的关系,计算未知区的金品位的后验概率。并使用该贝叶斯网对未知区金品位进行预测。

关键词:贝叶斯网 阿西矿区 隐伏矿体预测

1 引 言

阿希金矿床是20世纪80年代末于新疆西天山地区发现的低硫型浅成低温热液金矿床[1]。而如今地表矿、浅部矿已开采殆尽,找矿已经向隐伏矿、深部矿转变,找矿难度不断加大,隐伏矿体定位预测理论与方法的研究己成为了当代成矿预测学的科学前沿和研究重点[2]。

随着计算机技术的不断发展,运用数学地质理论及三维可视化技术对矿体进行空间定位预测也得到了快速发展;三维成矿预测方法[3]近年来已发展成为融合三维地质建模、多元地学信息集成的三维定位定量预测方法。目前针对研究区深部找矿的研究较少,这在一定程度上制约了对构造控矿与矿体定位规律的进一步认识。另一方面,在控矿因素与矿化指标间的关联关系上,尚缺少定量层面的研究。由于地质信息的复杂性和不确定性,难以建立精确的数学解析模型来描述控矿因素和矿化信息的关联关系。而贝叶斯网就是一种基于概率的不确定性推理网络,用来表示变量集合连接概率的图形模型,提供了一种表示因果信息的方法。它最早由Judea Pearl于1988年提出,当时主要用于处理人工智能中的不确定性信息。随后它逐步成为了处理不确定性信息技术的主流,并且在计算机智能科学、工业控制、医疗诊断等领域的许多智能化系统中得到了重要的应用。

因此本文在已有模型和技术的基础上,提出了采用贝叶斯网络模型进行成矿预测的方法。并将该方法应用于新疆阿希矿区,通过对该矿区的已知数据学习贝叶斯网,并使用该贝叶斯网对未知区金品位进行预测通。

2 研究区概况

阿希金矿位于伊犁—中天山板块北缘博罗霍洛岛弧带的吐拉苏盆地中,这些板块、微板块之间的相互作决定了其大地构造演化的基本特征,并制约了该地区现今大地构造和矿产的分布[4]。

矿区出露地层为下石炭统大哈拉军山组第五岩段和下石炭统阿恰勒河组第一岩段[5]。哈拉军山组第五岩性段是一套中—中酸性火山岩建造,阿恰勒河组第一岩性段为火山活动平息后的正常沉积物,属一套浅海相碎屑岩—碳酸岩建造[6],并且以角度不整合覆盖于前者之上[5]。

区域构造线以NWW—SEE为主,区内褶皱比断裂发育,总体构成一个复式背斜。矿床受火山机构及其相关断裂控制,矿区内发育系列环形和放射状断裂。F2断裂构造是矿区金矿化导矿、容矿构造为一体的控矿断裂构造,是阿希金矿成矿流体大规模迁移、汇聚的主要通道和场所[7]。矿区火山岩分布广泛,岩相变化大,发育有喷溢相溶岩、爆发相火山碎屑岩以及次火山岩相英安斑岩等多种岩相。

围岩蚀变具有一定的水平分带性,蚀变带发育了以矿体为中心,向外依次为硅化、黄铁绢英岩化和青磐岩化的蚀变分带,但硅化带上盘的黄铁绢英岩化蚀变范围明显宽于下盘[8]。主要矿石矿物为黄铁矿、银金矿、白铁矿、毒砂、黄铜矿、方铅矿等。矿石结构相对较为复杂,主要有交代残余结构、填隙结构、压碎结构、包含结构、环带结构、加大边结构和锯齿状结构[9]。

3 贝叶斯网

贝叶斯网包括定性和定量两个方面,在定性方面描述了贝叶斯网的各变量的连接关系,在定量方面刻画了各变量间的条件概率。因此贝叶斯网学习也包括两个过程,一是对于除根节点外的每一变量找到所有父节点,也就是贝叶斯网的结构学习;二是在已知结构的基础上,获得这些参数的估计。

3.1 结构学习

结构学习即是根据已知数据,学习贝叶斯网络的过程。贝叶斯网的构造方法有两种,一种是通过咨询专家手工构造,这种方法适用于变量少、逻辑关系强且易于表达的领域 ,另一种方法是使用一定的算法对大量的数据进行分析来获得网络结构。近年来,随着计算机技术和大数据的发展,从数据中学习网络结构已成为最有效的方式之一。

从数据中学习贝叶斯网结构主要有基于评分[10-11]和基于约束[12]的两种方法。基于约束的结构学习方法从数据出发,首先做一些关于变量之间独立关系的假设检验,获得一些独立性关系,然后寻找与这些关系(约束)相容的网络结构,该方法能比较直观的描述因果关系,且速度较快,但是在独立性检验时比较容易出错,而一旦前面出错,就会影响后面的计算。基于评分的方法把结构学习看为一个最优化问题,该方法首先确定一个评分准则来评价不同模型的好坏,然后从所有可能的模型结构中选出评分最高的结构模型作为最终的模型结构,其中最常用的是K2算法和爬山法[13]。

K2算法是最早的贝叶斯网结构学习算法之一。设D是关于变量X1,…Xn的一组完整数据,K2算法的目的是要寻找CH评分高的模型。计出于算复杂度的考虑,k2不是要寻找出CH评分最高的模型,而是要寻找在一定条件下的最优模型,所使用的条件有两个,他们使搜索空间大大缩小:(1)变量的一个拓扑排序ρ,其中父节点要排在子节点之前,(2)任一变量的父节点个数不超过u。为简化模型评分的计算,k2假设参数先验分布都是均匀分布。

爬山法的目标是要找出评分最高的模型。它从一个初始模型出发开始搜索,初始模型一般设为无边模型。在搜索的每一步,它首先用搜索算子对当前模型进行局部修改,得到一系列候选模型;然后计算每个候选模型的评分,并将最有候选模型与当前模型比较;若最有候选模型的评分大,则以它为下一个当前模型,继续搜索,否则,就停止搜索,并返回当前模型。

基于评分的方法不需要变量间的约束性关系,直接从数据本身出发,对于缺值数据也适用。

3.2 參数估计

3.3 概率推理

已知贝叶斯网的结构和参数估计,当给定一组变量确切值的情况下,可以计算出一组查询变量的概率分布。

推理是通过计算回答查询的过程。贝叶斯网中的推理问题有三大类:已知贝叶斯网中某些变量的取值计算另外一些变量的后验概率分布问题;已知某些变量计算后验概率最大状态组合的最大后验假设问题;与证据相一致的状态组合中概率最大组合的最大可能解释问题。已知贝叶斯网的结构和参数估计,当给定一组变量确切值的情况下,可以计算出一组查询变量的后验概率。

在实际应用中,往往需要在同一贝叶斯网中进行多次不同的推理,而两次不同的推理之间往往存在一些相同的步骤。团树传播算法是一种利用步骤共享来加快推理的算法。它首先用贝叶斯中的概率函数将团树初始化,并且设置证据,然后任选一个团作为枢纽节点,进行信息传递。信息传递分为收集阶段,CTP从叶节点开始,逐步朝枢纽节点方向传递信息。在信息分发阶段,CTP从枢纽节点开始,逐步向叶节点传递信息。

4 实例分析

本文以阿希金矿区地质体三维模型为基础,以阿希金矿区矿体定位概念模型为指导,提取主断裂面距离场因素(dF)、管道相距离场因素(dGV)、成矿流体通道距离场因素(dore-f)、主断裂面坡度因素(gF)、管道相坡度因素(gGV)、主断裂面趋势-起伏因素(wrF)、管道相趋势-起伏因素(wrGV)一共七个指标作为阿希矿区的控矿因素作为证据变量,这七个指标和金矿品味的散点关系图1如下所示,并根据该图将证据变量分为利于成矿和不利于成矿两种类型。

根据上图可知:(1)当管道相距离场因素在10m-95m区间内时,Au品位较高,因此将该段管道相距离作为利于成矿距离;(2)当管道相趋势-起伏因素在-10m-15m区间内时,Au品位较高,因此将该管道相趋势-起伏作为利于成矿的趋势;(3)当管道相坡度因素在60°-85°区间内时,Au品位较高,因此将该范围的管道相坡度作为利于成矿坡度;(4)当主断裂面距离场因素在0m-60m区间内时,Au品位较高,因此将该主断裂面距离作为利于成矿距离;(5)当主断裂面趋势-起伏因素在-10m-35m区间内时,Au品位较高,因此将该主断裂面趋势起伏作为利于成矿的趋势;(6)当主断裂面坡度因素在57°-90°区间内时,Au品位较高,因此将该范围的主断裂坡度作为利于成矿坡度;(7)当成矿流体通道距离场因素在0m-250m区间内时,Au品位较高,因此将该成矿流体通道距离作为利于成矿距离。据此便将所有证据变量分为利于成矿和不利于成矿两种类型。

对于分类后的数据,分别用1,2,3,4,5,6,7,8表示Au,dF, wrF, gF, dGV, wrGV, gGV, doref金品位和七个成矿因素的顺序。本文采用K2算法进行贝叶斯网的结构学习,图2为为使用K2算法学习得到的两种模型。当学习顺序为[8,1,2,3,4,5,6,7]时,学习贝叶斯网结构为图2中模型1,评分结果为[0.4500,0.5500,0.5500,0.2833,0.4500,0.6167,0.3833,0.7167];当学习顺序为[8,1,2,3,4,5,6,7] 时,学习贝叶斯网结构为图2中模型2,对应的评分结果为[0.4500,0.5500,0.4500,0.5500,0.4500,0.5500,0.2833,0.6167]。比较可知,其中当为模型1 时,模型总体评分最高,性能最好。并对模型1计算贝叶斯网的参数估计,获得每个节点的联合概率分布。

为了保证预测模型中的控矿因素指标能够对未知区预测起到有效的指示作用,需要设定一个边界条件,保证该矿区内控矿因素指标的数值落在已知区模型控制的范围之内(即已知区的数据密集区域)。阿希矿区预测模型的控矿因素指标边界条件如表1所示。当矿区内各找矿指标的值均落在对应区间内时,则可认为预测得到的矿化指标Au值有效。

在上述边界条件的限制下,采用团树传播算法,计算当证据变量即七个成矿因素已知时Au的后验概率,并将后验概率最大的一类结果作为对Au的预测结果。图3为对阿希金矿未知区Au的预测值在GOCAD中显示的结果。

5 结论

本文采用贝叶斯估计的方法,从数学统计的角度对各成矿因素间的关系进行分析并进行隐伏矿体的成矿预测,得到了很好的预测结果。该方法对先验地质知识依赖性较强,能够充分利用已有先验知识。得到的结构模型,能够为从地质方面解释各成矿因素的关系提供预想和思路。

参考文献

[1] 董连慧, 沙德铭. 西天山地区晚古生代浅成低温热液金矿床[M]. 地质出版社, 2005.

[2] 张均. 隐伏矿体定位预测的方法学基础及方法论[J]. 地质与资源, 2000, 9(2):100-104.

[3] 毛先成. 三维数字矿床与隐伏矿体立体定量预测研究[D]. 中南大学, 2006.

[4] 魏佳林. 新疆阿希金矿床矿体空间定位规律及找矿方向研究[D]. 中国地质大学, 2012.

[5] 李志忠. 浅谈新疆阿希金矿床地质特征及成矿机理[J]. 新疆有色金属, 2006, 29(3):6-7.

[6] 韩建民. 新疆阿希金矿矿床地质特征及找矿方向[J]. 新疆有色金属, 2003(s1):37-39.

[7] 王庆峰. 新疆阿希金矿深部成矿预测研究[J]. 新疆有色金属, 2013, 36(2):33-36.

[8] 刘占坤, 毛先成, 潘敏, et al. 西天山阿希金矿床围岩蚀变[J]. 地质科技情报, 2017(5):195-203.

[9] 徐伯骏, 费小丽, 曹新志, et al. 新疆伊犁阿希金矿床成矿深度和剥蚀程度分析[J]. 地质科技情报, 2014(3):154-162.

[10] Linhart H, Zucchini W. Model selection. New York: John Wiley & Sons Inc. Publishers. 1986.

[11] Burnham K P, Anderson D R. Model selection and multimodel inference:a partical information theoretic approach. New York: Spring Verlag. 2002.

[12] Spirtes P, Meek C. Learning Bayesian networks with discrete variable from data. In Proceedings of First International Conference on Knowledge Discovery and Data Mining, Montreal, QU. San Francisco; Morgn Kaufmann Publishers. 1995, 294~299.

[13] Glover F. Future paths for integer programming and links to artificial intelligence. Computers and Operations Research, 1986, 13(5):533~549.