APP下载

GSK-XGBoost模型在井底风温预测中的应用*

2022-04-26纪俊红马铭阳崔铁军昌润琪

中国安全生产科学技术 2022年3期
关键词:方根井筒交叉

纪俊红,马铭阳,崔铁军,昌润琪

(辽宁工程技术大学 安全科学与工程学院,辽宁 葫芦岛125000)

0 引言

随着我国煤炭开采量的持续增长,许多矿井的开采条件不断恶化,其中的矿井热害对矿工和设备的危害急剧增加,成为亟待解决的问题。井下工作环境恶劣,伴有高温、高湿、有毒气体,都靠风流带走,因此,风流参数测定的准确性非常重要。而风温测量在井筒底部就存在测量不准确的问题,其根源在于,风流从井筒经过,其间的换热、传质过程较为复杂,这一过程,是既包含显热交换又包含潜热交换的复杂的、动态的演化过程,传统方法计算误差大,研究人员不易掌握[1-3]。

近年来,矿井智能化飞速发展,机器学习算法被广泛应用在瓦斯涌出量预测、瓦斯渗透率预测、岩爆指标体系预测等方面[4-8],为更智能地建立拟合模型,部分学者尝试通过机器学习算法对淋水井筒的风温进行预测:吕品等[9]首次建立了基于BP神经网络的淋水井筒风温预测模型,对比经验公式模型,提供了新思路;张翔等[10]将粒子群优化算法应用到BP神经网络中,对其权值和阈值进行了优化,有效地改善BP神经网络的局部最优;段艳艳[11]利用支持向量机良好的非线性能力,将其应用于矿井风温的预测中,建立了矿井风温预测支持向量机模型;张群[12]采用trainlm()函数对BP神经网络收敛速度慢的缺陷进行了优化,并将其运用到潘三矿进行预测研究;马恒等[13]运用T-S模糊神经网络建立新的预测模型,无需考虑复杂多变影响因素的制约,模型预测精度有所提升。

以上研究不同程度地推动了淋水井筒风温预测的发展,但应用的算法多为神经网络模型,而神经网络模型在运行过程中存在样本需求量大,易陷入局部最优等缺陷。基于此,本文提出GSK-XGBoost模型,该模型中的XGBoost算法在运算时具有精度更高、灵活性更强、对样本需求量较小等优点,更适用于本文这种监测点有限、数据较少的小样本风温预测。针对XGBoost模型超参数较多复杂性较大的缺点,采用网格搜索结合K折交叉验证对模型优化,进行参数寻优,建立网格搜索结合K折交叉验证优化XGBoost的矿井井底风温预测模型,并对模型的性能进行评估。经实例验证,GSK-XGBoost模型更适用于井底风温的预测,为井底风温预测提供一条新思路。

1 模型构建

1.1 XGBoost模型

XGBoost算法于2016年提出,具有预测精度较高、训练速度较快、抗拟合能力较强、对样本量和特征数据类型要求较低等特点,在医学、生物学及人工智能等多个领域的表现性能较好[14-16]。

XGBoost目标函数如式(1):

(1)

树的复杂度Ω(f)见式(2):

(2)

式中:γ是复杂度参数;T为叶子节点数;λ是叶子权重w的惩罚系数。

在XGBoost中采用了目标函数二阶泰勒展开。假设将均方误差用作损失函数,则目标函数可以推导为式(3):

(3)

式中:gi和hi分别为损失函数的一阶和二阶梯度统计量。根据所有损失值的总和来计算最终损失值。叶子j的最优权重wj*以及目标函数的最优值为式(4),(5):

(4)

(5)

总而言之,是将目标函数的优化转换为确定二次函数的最小值的问题。此外,引入了正则化项,使XGBoost具有更好的抗过度拟合能力。

1.2 网格搜索结合K折交叉验证

XGBoost算法参数较多,超参数的取值会影响预测准确性,需优化才能保证模型质量。网格搜索是1种穷举算法,将所搜索到的参数划分为一定范围内长度相同的网格,网格中的每个点代表1组参数,通过网格中所有点来搜寻最佳解,获取最优参数[17-18]。

同时,为避免模型过拟合或欠拟合,将网格搜索法与K折交叉验证法相结合,进一步提高模型预测性能。K折交叉验证法本质是将数据集等比例划分为K份,其中的1份作为测试集,剩余数据作为训练集。重复进行K次实验,得到K个模型,通过K次实验后取评价指标的平均值作为评价性能指标[19]。K折交叉验证过程原理如图1所示。

图1 K折交叉验证原理Fig.1 Principle of K-fold cross-validation

1.3 GSK-XGBoost预测模型

综上所述,本文选用网格搜索算法结合K折交叉验证组成“K折网格搜索交叉验证法”(Grid Search and K-Cross-Validation,GSK)对XGBoost回归模型进行优化,构建GSK-XGBoost模型,构建过程如下[20-21]:

第1步:数据预处理。对样本数据进行归一化处理,生成模型训练样本集。

第2步:构建XGBoost模型。初始化XGBoost参数,设置参数空间及步距。

第3步:参数寻优。应用网格搜索法结合K折交叉验证(本文K取5),对XGBoost进行参数寻优,进行多次迭代缩小搜索范围对XGBoost回归模型参数进行调整,获得XGBoost模型的最优超参数,并进行更新。

第4步:使用训练集构建GSK-XGBoost模型并进行预测。构建预测模型,采用测试集评估模型性能。

第5步:当输出结果满足评价标准时,输出结果。

GSK-XGBoost预测模型构建流程如图2所示。

图2 GSK-XGBoost模型的构建流程Fig.2 Construction process of GSK-XGBoost model

2 井下风温影响因素分析

2.1 井下风温影响因素选取

竖井井筒环境与平巷有所不同,竖井井筒横穿岩石种类较多,各类岩石热物理性质也各有差异,造成围岩温度变化较大,且地下水系出现在井筒的位置随机,滴水点和滴水量不易测量,其热湿环境变化复杂,影响因素较多[22]。

结合传统井底计算公式分析,传统计算井底风温时,认为自压缩温升是最主要的热源[23]。地面大气压力和井筒深度与风流压缩密切相关,深部开采的井筒高差较大,空气由井筒向下流动时,其压力和温升均会上升,此过程为自压缩过程。在重力场的作用下位能转化为焓升而造成温升。

实际矿井风流自压缩过程并非绝热过程,而是复杂演化的传热、传质伴随自压缩的过程。此过程的热交换和湿交换显著影响着井筒内风温、湿度的变化。而井口风温会直接影响工作面风温,尤其对浅井,影响更为显著。

因此,本文选取井口风温、入风相对湿度、地面大气压力、井筒深度作为主要影响因素。选用参考文献[13]中的数据进行模型构建,部分通风参数整理结果见表1。

表1 通风参数原始数据(部分数据)Table 1 Original data sheet of ventilation parameters(partial data)

2.2 性能评价指标

本文采用平均相对误差MRE、均方根误差RMSE与决定系数R2对预测结果进行评价。平均相对误差反映测量的可信程度;均方根误差衡量预测值同真值之间的偏差;决定系数反映预测值与实际值分布的一致性,越接近1,相关越强。具体的计算公式如(6)~(8):

(6)

(7)

(8)

3 井下风温GSK-XGBoost预测模型

3.1 实验环境

本例实验环境为ASUSTek Computer Inc笔记本,CPU:Intel(R)Core(TM)i5-8265U CPU@1.60GHZ 1.68GHZ,RAM:8GB,使用软件为Python3.7,anaconda3集成开发环境。采用极限梯度上升XGBoost科学计算包建立预测模型。

3.2 数据处理

为消除量纲差异,提高预测精度,采用min-max归一化对原始数据进行处理,结果落在[0,1]之间,处理公式如(9):

(9)

式中:X为归一化后数据;x为原始数据;min为数据最小值;max为数据最大值。

选取处理后的前20组数据作为训练样本,剩余6组数据作为测试样本,导入预测模型训练。

3.3 模型构建与结果分析

在GSK-XGBoost模型搭建中,通过“5折网格搜索交叉验证法”确定XGBoost中使用树的数量、最大回归树深度、学习速率的最优超参数,其中最大回归树深度用来防止陷入过度拟合,学习速率控制模型的效率与适应能力。GSK-XGBoost预测模型参数优化结果见表2。

表2 GSK-XGBoost预测模型参数优化结果Table 2 Parameters optimization results of GSK-XGBoost prediction model

分别构建随机森林(RF)模型、BP神经网络(BPNN)模型、T-S模糊神经网络模型与GSK-XGBoost模型,对测试样本进行预测,井底风温预测值与实际值结果对比见表3,不同模型预测值与真实值对比分布曲线如图3所示。

表3 各模型井底风温预测结果及误差Table 3 Prediction results and errors of wind temperature at well bottom by each model

图3 各模型井底风温预测对比Fig.3 Comparison on prediction results of wind temperature at well bottom by each model

为验证本文方法的有效性,采取平均绝对误差、平均相对误差与均方根误差分别对RF模型、BPNN模型、T-S模糊神经网络模型与GSK-XGBoost模型进行分析,4种模型的结果对比见表4。

表4 各井底风温预测模型评价对比Table 4 Evaluation and comparison of each prediction model for wind temperature at well bottom

由图3可以看出,RF模型、BPNN模型及T-S模糊神经网络模型在预测过程中,均出现了较大偏差,GSK-XGBoost模型预测的矿井井底风温与实际值最为接近,趋势最为吻合,预测精度更高。由表3~4可看出,GSK-XGBoost预测模型预测值与真实值的平均绝对误差为0.12 ℃,平均相对误差为0.54%,均方根误差为0.12 ℃,预测较为准确,结果较好。与RF模型、BPNN模型和T-S模糊神经网络模型相比,预测误差均有了明显的改善,通过“5折网格搜索交叉验证法”优化后的XGBoost模型,平均相对误差分别降低了2.12%,0.88%,0.3%,均方根误差分别降低了0.66,0.24,0.11 ℃,验证了本文提出的GSK-XGBoost模型可有效地提升井底风温预测精度。

4 实例验证

为进一步检验GSK-XGBoost预测模型的预测精度及通用性,作者于2020年10月实测了山西省长治市某矿井5组数据,利用训练好的预测模型进行检验。井下实测数据见表5,预测数据评估结果见表6,实测数据井底风温的预测值与真实值对比如图4所示。

表5 井下实测数据Table 5 Measured underground data

表6 实测数据井底风温评估结果Table 6 Evaluation results of wind temperature at well bottom with measured data

图4 井底风温实测数据预测对比Fig.4 Comparison of predicted wind temperature at well bottom with measured data

通过对表6与图4的分析可知,本文建立的预测模型的预测相对误差范围在0.308 6%~0.759 5%之间,均方根误差为0.085 ℃,整体预测精度可满足井下实际的需要;决定系数R2的值为0.947 4,非常接近1,表明模型已经实现良好的预测,说明本文提出的GSK-XGBoost模型在井底风温预测方面具有可行性。

5 结论

1)采用“5折网格搜索交叉验证法”对XGBoost模型进行优化,确定模型的最优参数,提高模型拟合度。经参数寻优,当使用树的数量为150,最大回归树深度为3,学习速率为0.1时,XGBoost模型性能最佳。

2)将GSK-XGBoost模型预测结果与随机森林模型、BP神经网络模型、T-S模糊神经网络模型相比,平均相对误差分别降低了2.12%,0.88%,0.3%,均方根误差分别降低了0.66,0.24,0.11 ℃,预测精度均有了明显提升。

3)作者通过实测山西某矿井底风温数据对模型的有效性进行验证,均方根误差为0.085 ℃,决定系数R2的值为0.947 4,进一步说明预测模型在井底风温预测以及矿井热害防治中的可行性与实用性,适合工程实际的应用,为矿井井底风温的预测提供1种新的有效方法。

猜你喜欢

方根井筒交叉
再谈满井放矿
综放工作面开采对井筒破坏影响的研究分析
随机振动均方根加速度计算方法研究及应用
菌类蔬菜交叉种植一地双收
“六法”巧解分式方程
我们爱把马鲛鱼叫鰆鯃
连数
连一连
数学魔术——神奇的速算
复杂地段副斜井井筒施工方法的选择