APP下载

基于PCA-PNN原理的岩爆烈度分级预测方法

2019-10-21吴顺川张晨曦成子桥

煤炭学报 2019年9期
关键词:岩爆烈度训练样本

吴顺川,张晨曦,成子桥

(1.北京科技大学 土木与资源工程学院,北京 100083; 2.昆明理工大学 国土资源工程学院,云南 昆明 650093; 3.中电建路桥集团有限公司,北京 100048)

岩爆是高地应力状态下地下硐室开挖过程中,硬脆性围岩因开挖卸荷导致洞壁切向应力超出围岩强度极限,引发岩体弹性能急剧猛烈释放而产生碎片剥落、岩块动力弹射抛掷现象,并伴有不同程度的爆炸、撕裂声,直接威胁现场作业人员和设备安全,影响工程进度[1-4]。

岩爆预测是岩爆灾害的有力防控手段[5]。岩爆预测方法主要分为两大类,即单因素预测方法以及多因素综合预测方法。前者利用已建立的岩爆判据实现岩爆烈度预测[2,6-13],判据不同,岩爆烈度判别结果稍有差别;后者利用非线性理论综合多种岩爆判据、岩石力学参数等实现岩爆预测,应用的非线性理论主要分为两类:数学方法和智能算法。前者主要结合模糊数学综合评判法[6]、可拓学理论[14]、逼近理想解排序法(TOPSIS)[15-16]、灰色系统理论[17]、云模型理论[18-19]、距离判别法[2]、理想点法[5,20]、未确知测度理论[21]等;后者主要应用BP神经网络[22]、支持向量机[23]、人工神经网络[24]、广义回归神经网络[25]等。与单因素预测方法相比,多因素综合预测方法考虑岩爆影响因素更为全面、判别结果较为准确,具有一定优势。此外,基于微震监测技术的岩爆预测也正逐步推广应用,该技术通过获取岩体内部产生微破裂的前兆信息,可实时反映出围岩应力状态及强度等物理力学参数的变化特征,实现岩爆预测[3,26-27]。

以上理论方法、技术从不同角度揭示了岩爆现象发生规律及指标特征,丰富了岩爆预测理论。由于岩爆影响因素较多,其孕育演化机制尚不明朗,需要充分利用指标信息、挖掘指标特征与岩爆烈度等级的内在联系,并结合多种预测理论方法、技术才有可能实现岩爆的准确预测,故仍有必要引入新的预测模型开展岩爆烈度分级预测方法研究。

概率神经网络(PNN)是由Specht于1988年提出的,具有结构简单、训练容易、收敛速度快,容错能力强等优点,并可用线性学习算法实现非线性学习算法的功能[28-29],主要应用于故障诊断等模式分类问题[30-31]。PNN网络的激活函数采用高斯函数时,指标变量需满足互不相关且同分布[32]。事实上,大多数岩爆预测指标间均存在一定的相关性,故应用PNN网络前需先消除岩爆预测指标间相关性。

消除指标间相关性的常用方法有限制指标数量、分离重迭元、修正指标权重、主成分分析法、因子分析法等[33]。考虑到本文选用预测指标较多,选用主成分分析法(PCA)对岩爆预测指标数据预处理,除可消除指标间的相关性外,还能实现指标数据降维,提高PNN网络训练和分类速度。由此笔者基于主成分分析-概率神经网络模型开展岩爆烈度分级预测方法研究。

1 方法原理

1.1 主成分分析法

主成分分析法的核心是将原指标通过线性组合,使之成为一组新的、互相独立的、并包含大部分原始信息的综合指标,以此达到降维的目的[34]。在保证原始数据足够信息量的前提下,对原多维指标变量数据进行降维,可压缩指标个数、简化数据,缩减岩爆烈度分级预测所消耗的时间。该法模型如下:

假定m个样本和n个评价指标中第i个样本的第j个指标取值为xij,构造原始评价指标数据矩阵X=(xij)m×n:

(1)

则原变量指标为x1,x2,…,xn,设降维后综合指标即主成分为y1,y2,…,yn,用X的n个指标向量作线性组合,即

(2)

式(1),(2)满足:① 各等式系数平方和为1,如式(3)所示;② 任何两个主成分相互独立,互不相关;③y1是x1,x2,…,xn的全部线性组合中方差最大者,y2是与y1不相关的x1,x2,…,xn的全部线性组合中方差最大者,yn是与y1,y2,…,yn-1均不相关的x1,x2,…,xn的全部线性组合中方差最大者[34]。

(3)

从相关矩阵出发求解主成分的步骤[35-36]。

步骤1:将原始数据标准化。

(4)

(5)

步骤2:计算指标间的Pearson相关系数矩阵,即

R=(rkl)n×n(k,l=1,2,…,n)

(6)

其中,rkl为第k个指标和第l个指标间的相关系数,且rkl=rlk(即对称矩阵),计算公式为

(7)

步骤3:计算相关矩阵R的特征值和特征向量。特征值记为λ1,λ2,…,λn,满足λi≥0(i=1,2,…,n),特征值对应的单位化特征向量记为p1,p2,…,pn。

步骤4:确定主成分个数。计算主成分的累计贡献率,一般取特征值大于1、累计贡献率达85%~95%所对应的前k个主成分。

(8)

式中,vs为第s个主成分的方差贡献率。

(9)

式中,vsumk为前k个主成分的累计贡献率。

步骤5:计算提取主成分的对应得分。主成分系数矩阵为:U=(p1,p2,…,pn),若从原指标中提取了前k个主成分,则有

(10)

1.2 概率神经网络

概率神经网络以径向基神经网络为基础,采用统计学方法推导的激活函数替换S型激活函数,在某些易满足的条件下由PNN实现的决策边界渐近趋向贝叶斯最优决策面[28],是径向基网络与贝叶斯决策理论、概率密度函数的非参数估计的有机融合。PNN网络由输入层、模式层、累加层和输出层组成,其网络拓扑结构如图1[37]所示。输入层接收训练样本数据,神经元个数与输入向量长度相等,输入向量经加权处理后传递给模式层见式(11):

Zi=xwi

(11)

式中,Zi为模式层第i个神经元的输入;x为输入向量;wi为权值向量。

图1 概率神经网络拓扑结构Fig.1 Probabilistic neural network topology

模式层用来计算输入向量与各模式的匹配关系,并返回一个标量值。该层神经元个数与输入的训练样本个数相同。向量x输入到模式层,则模式层中第i类模式的第j个神经元输出关系为

φij=1/[(2π)0.5σd]e[-(x-xij)(x-xij)T/σ2]

(12)

式中,d为度量空间的维数;σ为平滑因子;xij为第i类样本的第j个中心;φij为模式层中第i类模式的第j个神经元输出值。

累加层的主要作用是线性求和、加权平均。将模式层中同一模式的神经元的输出做加权平均,该层神经元数目与样本模式总数相同,且与模式层神经元建立连接关系的前提条件是两者属于同一模式分类。

(13)

式中,vi为第i类类别的输出,(i=1,2,…,M),M为训练样本模式总数;L表示第i类神经元的个数。

输出层由竞争神经元构成,神经元个数与训练样本模式总数相同,每个神经元分别对应一种模式。用于为累加层的输出做临界值判别,将输出层内具有最大后验概率密度的神经元输出为1,其余输出为0。

2 岩爆烈度预测模型

2.1 PNN适用性分析

将岩爆烈度分级预测视为模式分类问题的依据(即PNN适用性)如下:① 岩爆烈度有分级。关于岩爆烈度分级国内外目前虽尚无统一标准,目前常用的岩爆判据见表1。由表1可知,岩爆烈度常被分为4级,即岩爆烈度预测结果共有4类;② 岩爆预测问题有相应的指标量化数据,且一组样本有惟一确定的岩爆烈度;③ 岩爆预测问题的基本思路主要是通过对岩爆指标变量数据的非线性处理,挖掘预测指标与岩爆烈度的内在联系,使模型判定结果能够与实际岩爆等级一致,达到预测的目的。该过程与PNN模式分类问题相似,即先通过岩爆典型样本训练学习预测指标与岩爆等级间的对应关系,进而将训练后的PNN网络判定测试样本岩爆等级。

表1 岩爆判据及烈度分级
Table 1 Rockburst criterion and intensity classification

类型岩爆判据公式岩爆等级无轻微中等强烈Russenes判据[6]σθ/σc<0.20.2~0.30.30~0.55>0.55Hoek判据[6]σθ/σc0.340.420.560.70强度应力比法Turchaninov判据[6]c=(σθ+σl)/σθ≤0.30.3~0.50.5~0.8>0.8陶振宇判据[7]σc/σ′1>14.514.5~5.55.5~2.5<2.5二郎山判据[8]σθ/σc<0.30.3~0.50.5~0.7>0.7N-Jhelum判据[9]σ′rm/σmax>74~72~41~2能量比[10]η=(φ1/φ0)×100%<3.53.5~4.24.2~4.74.7弹性能量指数[2]Wet=φsp/φst<2.0—2.0~5.0≥5.0能量法冲击能量指数[10]Wcf=e1/e2<1.5—1.5~5.0≥5.0弹性应变能指标[10]Es=R2c/2E<0.20.2~0.50.50~0.75≥0.75峰值能量冲击性指数[11]A′CF=Ue/Ua<22~5>5剩余弹性能指数[11]AEF=Ue-Ua<5050~150150~200>200脆性系数[12]B=σc/σt>4040.0~26.726.7~14.5<14.5岩性法能量储耗指数[13]k=σcεf/σtεb<20—20~130>130变形脆性系数[12]Ku=u/ul<2.02.0~6.06.0~9.0≥9.0

注:σθ为硐室最大切向应力,MPa;σc为岩石单轴抗压强度,MPa;σl为硐室轴向应力,MPa;σ′1为最大主应力,MPa;σ′rm为岩体强度,MPa;σmax为垂直于隧道轴向的最大水平主应力,MPa;η为能量比;φ1为破坏后岩石碎片弹射的动能,kJ/m3;φ0为岩石受载后储存的最大弹性应变能,kJ/m3;Wet为弹性能量指数;φsp为岩石试件在单轴压缩过程中,达到σc以前(0.8σc~0.9σc)所存储的弹性应变能,kJ/m3;φst为一个加载循环中产生微破裂和岩石塑性变形所耗损能量,kJ/m3;Wcf为冲击能量指数;e1为峰值前贮存的变形能;e2为破坏过程损耗的变形能;Es为弹性应变能指标;E为岩石的弹性模量,GPa;A′CF为峰值能量冲击性指数;AEF为剩余弹性能指数;Ue,Ua分别为峰前弹性能密度和峰后破坏能密度,kJ/m3;B为脆性系数;k为能量储耗指数;Ku为变形脆性系数;σt为岩石单轴抗拉强度,MPa;εf,εb为峰值前和峰值后的总应变量;u,ul为岩石峰值荷载前的总变形和永久变形。

2.2 岩爆预测指标选取

岩爆的发生与岩体特征、地应力、地质构造和开挖扰动等因素密切相关[9],具有显著的随机性、突发性和复杂性等特点[38-39],给岩爆预测带来了较大挑战。岩爆预测的数据信息源于选取的指标,目前岩爆预测指标体系多数基于3~6种岩爆判据或岩石力学参数。总的来说,预测指标的选取应满足:① 在室内或现场易于获取,具有较好的可操作性;② 具有较好的代表性;③ 能够从不同角度反映岩爆特征信息。利用上述已有研究成果,根据岩爆的影响因素、特点及成因,选取围岩最大切应力σθ、单轴抗压强度σc、单轴抗拉强度σt、应力系数σθ/σc、脆性系数σc/σt和弹性能量指数Wet六种指标组成岩爆预测指标体系。前3种为围岩应力参数,后3种为岩爆判据(岩爆烈度分级标准见表1)。

2.3 PCA-PNN岩爆烈度预测模型

主要过程为:① 根据选定指标搜集岩爆案例数据;② 为消除指标间量纲、数量级差异,将原始数据标准化,再作相关性分析;③ 采用主成分分析法(PCA)对数据预处理,消除指标间相关性并降维,得到主成分数据;④ 创建PNN网络,设置不同的平滑因子;⑤ 将训练样本数据输入PNN进行训练,获取各类样本的特征信息;⑥ 训练完成后,分别输入训练样本和测试样本对网络性能测试,计算其分类正确率。

由表1可知,岩爆烈度分级有无、轻微、中等、强烈4类,笔者将该分级分别设定为1,2,3,4级,则PNN输出向量为1×4行向量,类别编码采用第i类在行向量第i个元素位置输出为1、其余为0,如输出向量为(0,1,0,0)表示该样本属于2级,即轻微岩爆。

3 预测模型实现过程

3.1 PCA预处理

依据所选指标,笔者搜集国内外46组典型工程岩爆案例数据[12,40-42](表2),前36组为训练样本,后10组作为测试样本。

各指标间相关系数见表3,σc与σt,σt与σc/σt,σθ与σc,σt,σθ/σc的相关系数均超过0.5,预测指标间有较为明显的相关性,岩爆烈度分级预测结果必定会受其影响,故有必要采用主成分分析法对原始数据作相关性消除处理。

表2 原始岩爆案例数据与主成分数据
Table 2 Data of original rockburst cases and principal components

注:37~46组为测试样本,表7同。

表3 各指标间相关系数
Table 3 Correlation coefficients between different indexes

采用标准化的46组岩爆案例数据作主成分分析,其计算步骤如前文所述。各主成分方差贡献率及累计贡献率见表4,前3个主成分的累计贡献率达86.718%,表明前3个主成分共包含86.718%的原始信息,且对应的特征值均大于1,满足前述条件,因此选取这3个主成分。表5为主成分系数矩阵,由此得出主成分y1,y2,y3与6个指标变量之间的关系为

(14)

(15)

(16)

表4 PCA处理后的结果
Table 4 Results by PCA

成分特征值主成分贡献率/%累计贡献率/%12.76346.05246.05221.36722.79068.84231.07317.87686.71840.5689.45896.17750.2033.38199.55760.0270.443100

表5 主成分系数矩阵
Table 5 Coefficient matrix of principal components

指标主成分123σθ0.5000.3570.259σc0.425-0.4340.271σt0.521-0.146-0.298σθ/σc0.2510.7650.093σc/σt-0.3000.0080.804Wet0.381-0.2810.339

用式(1),(2)将指标数据标准化后代入式(14),(15),(16),可得主成分数据(表2)。3个主成分包含了原指标中的绝大部分信息,故可将3个主成分视为岩爆综合预测指标RCI1,RCI2,RCI3。

3.2 PNN网络参数确定

各组岩爆综合预测指标RCI1,RCI2,RCI3构成PNN网络输入向量。训练样本数据有36组,岩爆烈度有4种分类模式,因此PNN输入层、模式层、累加层、输出层的神经元个数分别为3,36,4,4,其拓扑网络结构为3×36×4×4。先输入36组训练样本对PNN进行训练,再分别输入训练样本、10组测试样本对网络性能进行测试。

平滑因子的选取对网络性能起着关键作用。平滑因子取值过小易造成网络过度拟合[43];平滑因子取值过大则不能完全区分细节,PNN网络接近于线形分类器[44]。本文考虑平滑因子Spread值取值区间为[0.02,1.00],满足区间内均匀分布,共50个Spread值。经测试,岩爆训练样本、测试样本的预测正确率随Spread值的变化曲线如图2所示。

图2 模型预测正确率随Spread值的变化Fig.2 Accuracy rate of the model prediction changes with Spread values

由图2可知,在0.02~1.00,训练样本、测试样本预测正确率总体上随平滑因子的减小而趋增高;在某些小范围内,训练样本正确率、测试样本正确率不随平滑因子变化,说明PNN网络对这些区间内的spread值变化不敏感。训练样本、测试样本正确率最大值及首次达到最大时的spread值见表6。

表6 模型最优结果及对应参数
Table 6 Optimal results and corresponding parameters

项别最高正确率/%Spread值训练样本1000.36测试样本900.52

3.3 PCA-PNN模型预测结果

取Spread值为0.36,46组岩爆案例判定结果如图3,4所示。由图3,4可知,训练样本测试误判率为0,测试样本中第8组岩爆案例误判,预测结果比实际发生的岩爆等级略大一级,误判率为10%。

为进一步说明模型的可行性,将预测结果与随机森林(RF)模型、支持向量机(SVM)模型及人工神经网络(ANN)模型的两组预测结果[40]对比,具体见表7。由表7可知,4种模型的预测结果相差不大,与实际岩爆烈度基本吻合。RF模型、SVM模型及ANN模型的训练样本误判率、测试样本误判率见表8。由表8可知,PCA-PNN模型比SVM模型及ANN模型预测效果稍好,误判率与RF模型训练样本平均误判率、测试样本平均误判率一致。此外PNN收敛速度快,通常在数秒内即可完成,且分类效果较为理想,表明PCA-PNN岩爆烈度分级预测模型是合理可行的。

图3 训练样本预测结果Fig.3 Training sample prediction results

图4 测试样本预测结果Fig.4 Test sample prediction results

表7 与其它模型预测结果对比
Table 7 Contrast with other model predictions

序号模型输出向量ⅠⅡⅢⅣ本文结果实际等级RF模型a组b组SVM模型a组b组ANN模型a组b组1001033333333200103333334430010333343444001033333333500103333333360010333333337001033333333800103333333390010333333331000103333333311001033333333120010333333331300014444444414100011111111151000111111111600103333333317001033333333180010333333331900103333333320010022222222210001444434442210001111111123001033333333240001444443442501002222332326010022222222270001444444442801002222332329000144444444

续 表

表8 3种模型误判率汇总[40]
Table 8 Summary of misjudgment rates of three other models[40]

误判率RF模型a组b组SVM模型a组b组ANN模型a组b组训练样本误判率/%0011.18.35.611.1测试样本误判率/%02010102030训练样本平均误判率/%09.708.35测试样本平均误判率/%101025

4 结 论

(1)选取围岩最大切应力σθ、单轴抗压强度σc、单轴抗拉强度σt、应力系数σθ/σc、脆性系数σc/σt和弹性能量指数Wet共6个指标构成岩爆预测指标体系。考虑到指标间的相关性及PNN网络对指标变量间相互独立的要求,采用主成分分析法对原始数据预处理,消除指标相关性并降维,得出3个线性无关的主成分即岩爆综合预测指标RCI1,RCI2,RCI3。

(2)平滑因子σ(Spread值)对概率神经网络性能影响较大。在满足均匀分布的前提下,选取[0.02,1.00]内的50个Spread值,经测试训练样本、测试样本正确率最大值分别为100%,90%,两者首次达到最大时对应的Spread值分别为0.36,0.52。

(3)为使训练样本、测试样本正确率同时最优,取Spread值为0.36。并将判别结果与RF模型、SVM模型及ANN模型的两组预测结果比较,发现4种模型之间预测结果总体相差不大,但PCA-PNN模型比SVM模型、ANN模型的预测结果稍好,误判率与RF模型的训练样本平均误判率、测试样本平均误判率一致。此外PNN收敛速度快,通常在数秒内即可完成,效果较为理想。以上表明PCA-PNN岩爆烈度分级预测模型是合理可行的。

猜你喜欢

岩爆烈度训练样本
深埋长隧洞岩爆微震监测、预警与防控技术探讨
烈度速报子系统在2021年云南漾濞MS6.4地震中的应用
2021年云南漾濞MS6.4地震仪器地震烈度与宏观地震烈度对比分析
高烈度区域深基坑基坑支护设计
基于模糊数学法的阿舍勒铜矿深部岩体岩爆倾向性预测
浅谈巴玉隧道岩爆施工措施
高原高应力隧道岩爆段施工与防护技术研究
高烈度区高层住宅建筑的结构抗震设计策略
人工智能
基于小波神经网络的网络流量预测研究