APP下载

矿井涌水量的支持向量机—马尔科夫链预测模型

2022-03-18

现代矿业 2022年2期
关键词:马尔科夫涌水量矿井

年 宾

(中勘资源勘探科技股份有限公司)

水害是地下矿山经常面临的难题,通常会受含水层边界条件及含水介质的非均质性等因素影响,许多学者对井下涌水量预测模型做出了大量研究工作。多项式回归、神经网络、灰色理论等都是当下预测矿井涌水量的方法,但这些方法都不够完善,或多或少存在着一些缺陷。例如:因为位移时序存在随机波动性,灰色拟合通常不能得到正确合理的预测结果[1-2];人工的神经网络方法则缺少严谨的理论基础,还需要要求较高的学习样本,样本过多容易造成“维数灾难”,导致过低的泛化性能;样本过少则缺乏精度[3]。

马尔科夫链可以很好地解决预测随机波动性较大的问题,对于系统受各种因素产生的随机性,也可以更好地揭示。而另一方面,作为一种基于结构风险最小化原理的机器学习技术,支持向量机能较好地解决面临的实际问题。为了能够准确获取矿井涌水量的内在规律,从而提高预测效果,尝试将马尔科夫链和支持向量机2种算法结合起来,提出了支持向量机—马尔科夫链涌水量预测模型。利用支持向量机模型对矿井涌水量数据进行学习和回归拟合,在该模型的基础上,通过马尔科夫预测方法来进行状态判别缩小预测区间,从而刻画涌水量的波动规律。基于皖北某煤矿2015—2019 年的矿井涌水量数据,对模型进行实例检验。

1 支持向量机—马尔科夫模型构建

1.1 支持向量机[4-7]

1.1.1 支持向量机原理

支持向量机(SVM)的基本思想可用图l 所示的二维原理图说明,其中构建最优超平面是支持向量机的主要技术。图1中实心点是一类样本,空心点是另一类样本,2 类样本不同,H即为2 类样本的分类线。H1和H2分别为平行分类线的直线,且在2类样本中它们是距离分类线最近的直线,它们之间的距离就叫分类间隔。分类线能将2 类不同的样本正确分开,且能达到最大分类间隔的分类线成为最优分类线,支持向量机就是在满足所有最优超平面条件下H1,H2上的训练样本。

式中,ω为权值向量;b为分类阈值。

对于其中的样本分类问题,要寻找到最优超平面,使可分样本集满足式(2)和式(3):

通过图1可以看到,H1和H2中不存在任何样本,即超平面ωxi+b=1和ωxi+b=-1不存在样本,其中2/‖ ‖ω即为它们之间的几何间隔,支持向量机原理就是求它们的最大化间隔,以便得到最优超平面。在给定的训练样本中找到权值ω和阈值b的最优值,从而使得权值代价函数最小化的方法就是求解超平面,即

同时当训练样本线性不可分的情况出现时,对于这些样本,就要引入非负松弛变量ξi,i=1,2,…,l,这样可以构造一个对样本集的分类误差之和最小的平面,则超平面优化问题也随之发生了改变,计算公式为

式中,ξi≥0;C为惩罚参数。

1.1.2 核函数选取

在支持向量机预测模型中,存在核函数影响预测精度的问题,选取核函数是支持向量机预测应用的重中之重,核函数不同,预测的精度就可能存在很大差异。目前,常用的核函数有3种[8]。

多项式核函数的计算公式是代表多项式空间的内积计算,重视数据的全局性,主要原理是通过转换,将计算从高维空间转到低维,避免造成维数灾难,用低维空间来计算内积值。

径向基核函数通常是空间任意一点x到核函数中心y之间的欧式距离的单调函数,σ是宽度参数,起到控制函数的径向范围的作用,该函数的分布类似于高斯分布。

径向基核函数(RBF核函数):

Sigmoid 核函数来源于神经网络,近似于多层感知器神经网络,在支持向量机中主要注意它最终求的是全局最优值,有很好泛化能力。

1.2 马尔科夫链预测方法

马尔科夫预报非常适合用于随机波动较大的预报问题。将数据序列根据马尔科夫链划分成若干状态,表示为E1,E2,…,En,同时按时序将其中的转移时间取为t1,t2,…,tn,用表示数列由状态Ei经过k步变为Ej的概率,即

式中,状态Ei经过k步变为Ej的次数用nij(k)表示,Ni即为状态Ei出现的总次数,则k步状态转移概率矩阵为

通过上述所得的状态概率转移矩阵,可以明确数列中的变量所处状态和变量的最大概率值max[p(k)ij],然后就能够确定变量下一步的转向,再由所得的转向概率对预报值进行马尔科夫修正[9]。当矩阵中第k行的最大概率有2 个或2 个以上相同或相近时,矿井涌水量相对变化的未来转向则不能单纯由R(1)来确定,此时需进一步考查R(2),R(3)等,依此类推,直到涌水量的未来转向能够确定为止。

涌水量未来转向的明确,就意味着支持向量机预测值变动区间的确定,该区间的中点即为最可能的预测值,故最可能的位移时序预测值为

式(11)即为支持向量机—马尔科夫链的预测模型。马氏链具有无后效性,同时加上具有追踪变量随机波动能力的马尔科夫状态概率转移矩阵,其与支持向量机模型结合起来,能够通过实现优势互补来提高模型的预报精度。

2 支持向量机—马尔科夫链预测模型的应用

2.1 支持向量机预测

利用上述模型,以2015—2019 年皖北煤电集团某煤矿涌水量序列为例进行预报。选取了该煤矿监测数据的前26 个作为学习样本,检验样本选取了最后4 个时步数据,模型选取径向基函数(RBF),令σ2=1,来确定参数C的值。通过改变参数C的值来比较其识别结果,从而确定选取本模型中参数C的值为100。预测结果见表1,表中涌水量为单月日平均值。

?

2.2 预测结果的马尔科夫修正

2.2.1 概率状态的划分

通过对支持向量机预测模型预报的误差进行状态划分,因为状态界限具有不确定性,所以本研究采用适算法来划分状态区间,从而求状态转移概率矩阵[9]。通过1 组临界值已知残差序列代入式(9),得到概率转移矩阵,再用已知的数据进行检验。本研究划分了4个区间的残差序列,概率状态见表2。

2.2.2 状态转移概率矩阵构造

由上述方法及数据可求得矿井涌水量状态的4步转移概率矩阵如下:

2.2.3 预测表编制

通过4 个状态来选取离预测时步最近的4 个时步编制预测表,根据其远近定下1、2、3、4 的转移步数。在转移步数所对应的转移矩阵中,新的概率矩阵由开始和结束状态的行向量组成,将新的概率矩阵列向量加起来,其中系统的未来转向状态就是和最大的转移步数所对应的状态。表3 为2019 年6 月时的矿井涌水量的状态预测值。

?

由表3 可知,在合计栏中,状态Ⅰ出现的可能性最大,表示2019 年6 月时的矿井涌水量实测值与预测值的误差最可能处在状态Ⅰ中。由表1可知,2019年6 月支持向量机模型的预测值为3.36 m3/min,实测值为3.24 m3/min,由式(13)可得支持向量机—马尔科夫预测模型的预测值为3.21 m3/min。支持向量机—马尔科夫预测模型的预测精度更高。

2.2.4 矿井涌水量动态预测

当获得2019 年6 月时的矿井涌水量的实测值后,将第1 个时步数据删除,第28 个时步数据进行增补,得到定长的样本,确保每次预测数据都是最新的。以此,采用基于支持向量机—马尔科夫模型对该矿2019 年6—12 月的涌水量数据进行了动态预测,计算结果见表4。从表4可知,支持向量机—马尔科夫模型预测值与实测值吻合较好,误差较小,较好地反映了矿井涌水量的变化趋势,预测精度较支持向量机模型有了较大提高。

?

3 结 语

在支持向量机预测和马尔科夫链预测优势的基础上,由历史数据信息可以得到通过支持向量机模型所反映生成的系统发展宏观规律的预测曲线,并用该曲线为基准,对动态状态进行划分,最后通过马尔科夫状态转移概率来刻画系统微观波动规律。支持向量机—马尔科夫链预测模型是1个切实可行的模型,且预报精度相较于单一的支持向量机模型要高很多,该模型的建立对矿井涌水量预报有重要推动意义。

猜你喜欢

马尔科夫涌水量矿井
基于三维马尔科夫模型的5G物联网数据传输协议研究
赵各庄矿矿井涌水量预测方法分析
突出矿井大采高综采工作面过断层风险管控研究
矿井建设中的现场施工管理
复杂条件下矿井水文地质类型划分方法
马尔科夫链驱动的带停时的超前倒向随机微分方程的适应解
基于叠加马尔科夫链的边坡位移预测研究
矿井涌水量重标极差法等维预测模型
马尔科夫链在企业沙盘模拟教学质量评价中的应用
马尔科夫链在企业沙盘模拟教学质量评价中的应用