APP下载

多金属矿产综合信息区域深部成矿预测
——以临江市东港地区靶区预测为例

2020-06-29毕明丽

科学技术与工程 2020年15期
关键词:图层成矿向量

毕明丽

(长春工程学院勘查与测绘工程学院,长春 130021)

矿产资源勘探中,当前易于寻找的地表矿已逐渐减少,找矿难度增大且成本提高,为满足人类日益增长的矿产资源需求,降低找矿成本,找矿工作重点已逐步由浅部矿、隐伏矿向难度更大的深部找矿发展,深部找矿成为现阶段主要的矿产勘探趋势,这就要求加强对成矿规律的研究,形成较为完全的成矿理论,研究出新的成矿预测方法,提高矿产勘探效率。区域深部成矿预测已成为矿产勘探领域的热点,为众多地质学家所关注[1]。

王耀升等[2]以南泥湖钼多金属矿田为对象进行找矿预测研究,确定了与成矿关系密切的隐伏岩体侵入模型,根据成矿空间位置分布的差异建立成矿模型和找矿模型,获取了有利的成矿区域,完成了找矿预测,但该方法的成矿预测准确率不高;谢迎春等[3]为寻找隐伏矿等新资源,利用遥感影像与信息集成技术,对研究区域的地质特征进行分析,建立地质信息预测模型,但成矿预测精度较低;郝兴中等[4]分析了长江中下游成矿带的地球物理学特征,指出巨矿形成的根本原因是地幔流通道因素,以此发现巨矿带形成的根本原因,完成成矿预测,但该方法计算中,参数选取不佳,导致预测精度不高;张晓华等[5]依据成矿特点分析了金属异常活动态机制,构建金属异常活动模式,划定出了远景成矿区,但未能很好的优化预测中的参数,影响了预测结果。文献[6]以遥感影像和遥感地质解析方法为基础研究金属成矿问题,根据不同的遥感地质解析规模和成矿地质条件,划分了不同级别的找矿预测区,但存在预测效率不高的问题;文献[7]提出了一种新的、综合的斑岩-硅卡岩-低温热液矿床模型,该模型解释了地质背景、矿石特征、成矿分带以及北亚地区矿床成矿过程,但预测过程效率低;文献[8]详细分析了喀尔汗辉长岩体的地质构造及金属成矿前景,给出了硫化物成矿带中金属分布情况,帮助实现成矿预测,但该方法的预测度较低。

为此,提出多金属矿产综合信息区域深部成矿预测方法,提取了区域深部成矿信息,通过GIS技术建立成矿数据库,通过证据权模型获取控矿因素的最优缓冲距离,基于参数优化的支持向量机实现成矿预测,并通过实验验证了所提方法的性能,表明方法能够高精度的完成成矿预测。

1 多金属矿综合信息库建立

对深部区域成矿预测中,应首先建立多金属矿综合信息库,便于提供数据信息,帮助完成成矿预测。采用地理信息系统(geographic information system,GIS)建立多金属矿综合信息库,成矿预测过程中,依据GIS的计算机信息辅助功能对多金属矿综合信息统一管理[9-10]。

采集金属、矿产、遥感以及地质等信息,建立统一地理坐标系下的GIS信息库,该数据库的前期数据采集工作主要通过矢量化生成方式进行,即通过GIS获取遥感图像,将图像信息进行数字化处理,生成三维数据模型。采集得到多金属矿的综合数据信息后,将GIS信息库划分为三层结构,对应输入数据信息。三层结构分别为第一层遥感图像数据文件,对GIS遥感图像进行存储;第二层子库数据,包括地理图像数据库、地址数据库、物探数据库等;第三层主要针对多项图层数据进行存储。

2 区域深部成矿信息提取

区域深部的成矿信息是指能够识别矿床赋存的综合地质信息和对成矿信息进行提取,有利于准确的完成成矿预测。GIS技术的出现,促使成矿信息朝向数字化方向发展,依据上述建立的GIS多金属矿综合信息库提取区域深部成矿信息。主要通过建立证据权模型,分析多金属矿床与标志图层的关系,确定控矿因素的最优缓冲距离来完成区域深部成矿信息提取[11-12]。

2.1 证据权模型

通常对于成矿过程而言,地质要素本身以及其周边范围要素均会产生一定的作用,由此可建立证据权模型,获取控矿因素的最优缓冲距离,便于构建最优证据图层,完成区域深部矿产预测。在GIS中,证据权模型具有多金属矿产资源数字化分析功能,主要通过图层统计实现,为区域深部成矿提供了很好的依据。证据权模型能够将多金属矿床与标志图层相联系,其中标志图层使用数字“0”和“1”表示,“0”表示地质标志不存在,“1”表示地质标志存在,用于展示多金属矿床的存在与否[13]。

建立证据权模型的步骤如下。

将控矿地质因素表示为Xm,其中m为控矿地质因素数量,假设Y为深部区域待预测单元,Wi为不同数量控矿地质因素的权系数,X1与X2之间相互独立,则后验概率与权系数的关系可表示为

(1)

式(1)中:P(Y|Xm)表示Y的后验概率。其中权系数Wi可表示为

Wi=ln[P(Xi|Y1)/P(Xi|Y2)],i=0,1,…,m

(2)

(3)

(4)

则控矿地质因素的对比度R可表示为

(5)

若R为正数,表示控矿地质因素与待预测单元呈现正相关关系;若R为负数,表示控矿地质因素与待预测单元呈现负相关关系;根据对比度R的正负取值可确定控矿地质因素的最优缓冲距离[14]。

对比度R的计算方式适用于矿点数量较多的情况,在矿点数量较少的情况下,仅通过计算对比度R获取的结果不够精确,由此需要计算R的显著性统计量Stud(R):

(6)

根据上述步骤获取控矿地质因素的最优缓冲距离,则表示完成了证据权模型的构建。

2.2 成矿信息提取流程

根据2.1节建立的证据权模型获取最大的缓冲距离,将其当作最优证据图层,从而提取成矿信息。基于证据权模型实现区域深部成矿信息提取的流程如下。

(1)对研究区域进行网格化划分,分为100 m×100 m的单元网格,保证每个单元网格的矿点不超过1个。将证据图层划分为地质因素图层、网格图层和矿点分布图层三部分。

(2)在不同缓冲距离下,对地质因素图层的含矿情况进行分析。

(3)依次对网格图层和矿点分布图层的矿点数目进行计算,并与地质因素图层进行叠加分析,计算得出证据图层含矿单元总数[15-16]。根据含矿单元数量计算统计量Stud(R),选取显著性统计量Stud(R)最大时的缓冲距离作为最优缓冲距离。

区域深部成矿信息提取的流程图如图1所示。

图1 成矿信息提取流程图Fig.1 Flowchart of metallogenic information extraction

3 区域深部支持向量机矿产预测

基于提取得到的成矿信息,使用支持向量机完成区域深部矿产预测。支持向量机是基于统计学的一种分类方法,目前被广泛认为是一种有效的预测方法,在面对小样本、高维数据条件下具有非常优秀的性能[17]。

利用支持向量机进行成矿预测,主要是构建一个能够将成矿点和非成矿点区分开来的目标函数,获取一个最优分类平面。

支持向量机预测的关键是获取最优参数,使用遗传算法优化支持向量机参数,遗传算法是一种随机搜索优化方法,过程中主要使用适应度函数进行计算,通过对生物群体迭代筛选获取最优参数,遗传算法具有简单便捷、寻优范围广等优势。利用遗传算法进行支持向量机参数优化,主要包括问题编码、适应度函数计算和遗传运算三部分,具体步骤如下。

(1)对惩罚因子C进行初始化,并对其进行二进制编码处理。

(2)使用支持向量机对二进制编码后的初始种群进行训练,依据训练得到的数据计算种群个体的适应度。

(3)随机设置遗传算法中的迭代次数、交叉概率等参数,结合适应度计算结果获取新的种群,然后再重新计算新种群的适应度。

(4)直至迭代完成,输出适应度最大的种群个体,即表示完成了参数优化。

根据上述步骤完成支持向量机参数寻优,获取最优惩罚因子C,再利用径向基核函数进行数据集样本计算,即可获取预测结果,完成区域深部成矿预测。

4 实验结果与分析

利用GIS技术获取吉林省临江市东港地区的铜矿床数据集,将其作为研究对象,图2为吉林省东港地区的找矿靶区预测图。

1为船底山组;2为晚侏罗世-早白垩世石人组;3为晚三叠世长白组;4为古元古代老岭群珍珠门组;5为晚三叠世二长花岗岩;6为古元古代片麻状英云闪长岩;7为花岗斑岩;8为闪长岩脉;9为闪长玢岩;10为同性剪切带;11为实测及推测断层;12为土壤地球化学测量异常及编号;13为激电异常及编号;14为综合成矿预测靶区及编号图2 东港地区找矿靶区预测图Fig.2 Prediction of prospecting target area in Donggang area

将该地区的成矿预测靶区分为了3个,其中ZHBQ-1位于该地区西北部,预测面积为1.32 km2。主体位于晚三叠二长花岗岩、长白组地层和古元古代片麻状英云闪长岩这三者接触带上以及其附近,另外,此处局部地区地段可见北东向韧性剪切带,经探测存在铜矿的可能性最大。

综合该地区地质背景,ZHBQ-1靶区具有更好的成矿地质条件,是进行预测成矿可能性较好的位置,因此选定次预测靶区为预测区域进行预测。在该靶区构建了多金属铜矿综合信息库,构建的数据样本包含100 个数据集,在构建支持向量机模型时,通常需要等量的正负样本,因此设置100 个数据样本中的50 个为矿点数据样本,50 个为非矿点数据样本。按照100 m×100 m的单元网格划分研究区域,将每个网格看作一个矿点。为更好地利用样本数据进行算法性能测试,保障实验过程的稳定进行,对100 个数据样本进行无放回抽样,按照 5:3:2 的比例构建不同数量的样本数据集,如表1所示。

实验在MATLAB环境中进行,操作系统为Windows10,中央处理器为i7,频率为3.2 GHz。

根据实验环境和数据的设置,对该区域深部矿产进行实验测试,得到的成矿预测结果如图3所示。

根据图3可以看出,方法预测得到的成矿点较多,且大多分布在有矿区,表明预测方法具有一定的可行性。

表1 样本数据集Table 1 Sample dataset

图3 成矿预测结果Fig.3 Metallogenic prediction results

为充分验证成矿预测方法的有效性,选取以下实验指标进行分析。

(1)最优缓冲距离计算准确率:成矿信息提取中,获取最优缓冲距离是主要需要实现的目标,对最优缓冲距离计算准确率进行实验分析,验证成矿信息提取结果的优劣。

(2)参数优化耗时:基于支持支持向量机进行成矿预测的关键是获取最优参数,对参数优化耗时进行对比分析,能够很好的验证预测方法的性能。

(3)成矿预测精度:在线性可分和线性不可分条件下,分别对成矿预测结果的精度进行分析,与文献[3-5]方法进行对比。

(4)预测度:预测度是指在固定区域面积中能够预测得到的已知矿点,能够反映成矿预测的效率,预测度曲线的横坐标为研究区域面积百分比,纵坐标为预测得到的已知矿点数量。

4.1 最优缓冲距离计算准确率对比实验

以最优缓冲距离计算准确率为指标,对本文方法与文献[4- 6]方法进行对比,结果如表2所示。

分析表2可以看出,利用本文方法计算最优缓冲距离,在任意数据组别下,准确率均在90%以上,文献[4]方法的最高计算准确率为70%,文献[5]方法的最高计算准确率为75%,文献[6]为80%。由表2可以看出,本文方法具有一定的优势,能够很好地完成成矿信息提取,因为使用证据权模型进行分析,能够数字化统计成矿相关信息,获取最优缓冲距离,构建最优证据图层。

表2 最优缓冲距离计算准确率对比Table 2 Comparison of accuracy in calculating optimal buffer distance

4.2 参数优化耗时对比实验

采用支持向量机进行成矿预测,对惩罚因子C进行优化处理,提高预测结果的精度。对参数优化耗时进行对比分析,结果如图4所示。

图4 参数优化耗时对比Fig.4 Comparison of parameter optimization time

根据图4可知,文献[5-7]方法的参数优化耗时分布在6~12 s,而本文方法的参数优化耗时最高不超过6 s,平均水平在4 s左右,由此可见,利用遗传算法优化支持向量机参数,获取了较好的结果,能够快速完成参数优化,从而尽快完成成矿预测。

4.3 成矿预测精度对比实验

数据线性可分和线性不可分条件下,方法与文献[3-5]方法的成矿预测精度结果如表3所示。

表3 成矿预测精度对比Table 3 Comparison of metallogenic prediction accuracy

分析表3可以看出,在数据线性可分和线性不可分条件下,本文方法的预测精度基本不受影响,均在90%以上,而文献[3-5]方法则会受到影响,尤其是文献[5]方法,在数据线性可分条件下,文献[5]方法的预测精度可达89%,但在数据线性不可分条件下,文献[5]方法的预测精度不超过66%,具有明显的差距。通过上述数据分析可以看出,利用支持向量机引入参数的方法,能够很好的解决数据线性不可分问题,进而实现高精度成矿预测。

4.4 预测度对比实验

以预测度为指标,将本文方法与文献[6- 8]方法进行对比,结果如图5所示。

图5 预测度对比Fig.5 Comparison of forecasting degrees

分析图5可以看出,本文方法的预测度曲线最靠近左上方,即本文方法在固定区域面积内,能够预测得到的已知矿点数量最多,预测效率最高。而文献[6- 8]方法的预测度曲线虽然与本文方法的曲线走势一致,但始终低于本文方法,表明本文方法的预测性能优越。

5 结论

区域深部成矿预测具有非常重要的现实意义,针对目前成矿预测要求的逐步提升,寻找一种精确的成矿预测方法迫在眉睫。提出多金属矿产综合信息区域深部成矿预测方法,采集金属、矿产、遥感以及地质等信息,建立统一地理坐标系下的GIS信息库,通过图层统计实现证据权模型金属矿产资源数字化分析功能等,并利用支持向量机完成成矿预测。实验结果表明,本文方法在最优缓冲距离计算准确率、支持向量机参数优化耗时、成矿预测精度以及预测度等方法均优于传统方法,能够高精度完成成矿预测,为以后相关方面的研究提供了可参考依据。

猜你喜欢

图层成矿向量
向量的分解
桂西沉积型铝土矿床成矿规律及成矿模式
聚焦“向量与三角”创新题
为《飞舞的空竹龙》加动感
新疆寨北山铜矿成矿新认识及找矿预测
中非铜钴成矿带矿床遥感特征研究
柴达木盆地北缘锂多金属矿成矿条件及找矿潜力
解密照片合成利器图层混合模式
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线