APP下载

基于盾构机运行参数的局部切空间排列与Xgboost融合的地质类型识别

2022-08-01刘明阳余宏淦陶建峰覃程锦高浩寒刘成良

关键词:刀盘盾构样本

刘明阳,余宏淦,陶建峰,覃程锦,高浩寒,刘成良

(上海交通大学机械与动力工程学院,上海,200240)

作为一种隧道掘进工程机械,土压平衡盾构机被广泛应用于铁路、地铁、公路等隧道工程中[1-2]。相比于钻爆法、人工开挖等方法,盾构法受地层地质影响较大。当盾构机运行参数不能适应当前掘进地层时,可能出现盾构机刀盘堵塞、盾体卡死和隧道塌陷等施工事故。实时准确感知地质类型是选取合理的掘进参数、保障施工安全的重要前提条件[3]。采用钻孔测井法进行传统的地质勘测。由于钻孔深度有限,难以对深度较大的隧道进行地质测量。同时,有限个数的钻孔难以反映隧道所在地层地质类型的全貌。随着地质勘测技术的发展,出现了地震波勘测法、探地雷达法和声波探测法等新方法[4]。这些方法存在成本较高、测量速度慢、受施工空间限制等问题,在盾构法中的应用受到了限制。

盾构机运行参数与地质之间具有密切的联系,国内外学者提出了使用盾构机运行参数识别掘进地层土类型的方法。HASSANPOUR 等[5-6]定义了基于掘进机运行参数的场切深指数,用于表示围岩等级;WANG等[7]采用盾构机运行参数建立了地质特征综合指标计算模型,使用地质特征模型区分多个地质特征组;SHATERPOUR 等[8]使用统计分析方法,研究了砂岩、石灰石和玄武岩3种岩石对盾构机运行时的总推力和刀盘转矩的影响;邢彤等[9]采用场切深指数和扭矩切深指数建立了表示掘进土层状况的特征空间,实现了土层类型判别;杨果林等[10]统计分析了主要施工参数在砾岩、砂卵石和泥岩3类岩石中的分布及变化特征,研究了不同岩石中贯入度、场切入指数和掘进比能三者间的变化关系,并预测了地层可掘性;宋克志等[11]将盾构掘进比推力和比扭矩作为表征围岩状况的指标,采用模糊识别规则识别围岩类型;张娜等[12]采用分步回归和聚类分析的方法建立了岩机关系模型,利用掘进机运行参数实时感知岩石强度、体积节理数和围岩等级等参数。

近年来,机器学习算法发展迅速。相比于传统的分类回归算法,机器学习算法具有表达能力强、准确率高等优点,很多学者将机器学习算法应用于掘进机掌子面地质类型预测中。ZHAO等[13]建立了ANN 算法模型,使用盾构机运行参数的一阶、二阶差分增强特征作为输入,预测掘进地层的地质类型。

ZHOU 等[14]采用复杂拓扑网络方法,选取了136维盾构机运行参数作为网络输入,实现了掘进地质条件识别。ZHANG等[15]使用刀盘速度、刀盘扭矩、推力和前进速度4个通道数据作为输入,提出基于K-MEANS聚类与支持向量分类器的地质条件预测模型;ZHANG等[16]通过独立性检验筛选得到的7 个与地质类型关系密切的盾构机运行参数,并将其作为输入,采用ANN,SVM和KNN这3种算法分别对地质类型进行识别;刘建东等[17]建立神经网络模型,使用基于盾构掘进参数的修正掘进比能作为输入,识别盾构掘进过程中的孤石地层;朱北斗等[18]选取盾构推进力、推进速度、刀盘扭矩和刀盘转速共4 个掘进参数,使用BP 神经网络对3种典型地质类型进行识别;宫思艺等[19]使用盾构机总推力、刀盘扭矩、刀盘转速、推进速度和螺旋机转速作为输入,使用Xgboost算法识别软土地层、软硬交互地层和孤石地层;朱梦琦等[20]利用总推进力、刀盘功率、刀盘扭矩和推进速度4个盾构机运行参数作为输入,使用随机森林和AdaCost算法,实现对围岩等级的预测;段志伟等[21]对不同围岩下区分度较好的掘进参数进行PCA主成分分析,获得表征围岩可掘性等级的2个主成分指标,并构建BP神经网络,对围岩可掘性等级进行识别。

现有研究主要选择总推力、刀盘转矩等较少的运行参数表征当前掘进地层的地质特征。实际上,大量盾构机运行参数中蕴含的地质特征没有被挖掘,容易造成信息损失,影响了模型识别的精度。当选择运行参数输入数量变多时,又会造成模型训练速度慢、泛化能力差等问题。为解决以上问题,首先,分析众多盾构机运行参数与地质类型的关系,筛选了与地质相关的盾构机运行参数;然后,采用LTSA算法对筛选的盾构机运行参数进行数据降维,提取其中的稀疏低维特征;第三,将低维特征输入Xgboost分类模型中,实现掌子面地质类型识别;最后,利用新加坡某地铁工程数据构造了模型的训练集和测试集,证明所提方法的有效性。

1 工程概况

本文中使用的盾构机运行数据来自新加坡大众捷运系统汤姆逊线地铁麦士威站—珊顿道站段隧道工程,隧道全程为710 m,共掘进502 环。施工区间如图1所示。隧道施工区域中存在海洋黏土、河床黏土、福康宁卵石地层、句容地层共4种地质层,其中句容地层主要为高度风化的IV 型和完全风化的V 型。采用钻孔测井法测量隧道施工区间的部分环所在地层的地质类型,测量结果如表1所示。

图1 新加坡盾构隧道工程施工区间Fig.1 Construction section of Singapore shield tunnel project

表1 地质类型与掘进环号对应Table 1 Correspondence between geological type and tunnel number

海洋黏土通常为非常软的黏土,偶尔有贝壳碎片。河床黏土通常为坚硬的砂质粉砂或黏土。V类型的句容地层为完全风化的紫色、棕色、灰色的粉质砂,IV 类型为弱至中等强度、细至中粒度的高裂隙泥岩、粉砂岩或砂岩。经过对钻探土层样本分析,得到各种地质类型的具体性质如表2所示。

表2 典型地质类型性质Table 2 Typical geotechnical type properties

该隧道工程采用6 700 mm 直径的土压平衡盾构机挖掘,盾构机主要设备参数如表3所示。盾构机上安装有数据采集系统,每隔5 s采集1 465个传感器参数和机器运行参数。0~502环部分掘进数据如表4所示。

表3 盾构机设备参数Table 3 Shield machine equipment parameters

表4 0~502环部分盾构机掘进数据Table 4 Part of tunneling data of the shield machine in 0-502 ring

2 盾构机掘进数据处理

2.1 数据预处理

2.1.1 提取平稳段运行数据

盾构机数据采集系统记录盾构机的运行状态,取值有0(关机状态)、1(待机状态)、2(运行状态)。以第192环掘进数据为例,该环的盾构机状态和总推力如图2所示。在掘进1环的过程中,盾构机在中途会出现多次待机或停止状态。在盾构机处于待机或停机状态时,盾构机不进行掘进,总推力为0 MN。在预处理盾构机运行参数时,需要将盾构机运行状态为0或1的样本点去掉。

图2 第192环盾构机状态与总推力Fig.2 No.192 ring shield machine state and total thrust

将盾构机从启动运行到进入待机状态为止的时间区间定义为1个掘进区间。图3所示为盾构机在192环掘进环中的第1个掘进区间内的总推力和刀盘转矩与时间的关系。分析多个掘进区间,发现在盾构机开始掘进的最开始的100 s 内,盾构机运行处于非平稳阶段,盾构机推力、扭矩逐渐上升至稳定值,变化幅度很大。在进行地层识别时,采用盾构机平稳掘进段的数据进行预测,在数据预处理时,将每次启动时前100 s的样本点去掉。

图3 第192环1个掘进区间内盾构机总推力与刀盘转矩Fig.3 Total thrust and cutter head torque of shield machine in a tunneling section of No.192 ring

2.1.2 提取平稳段运行数据

在实际盾构掘进过程中,盾构机运行参数由数据采集系统不断采集获得,运行参数数据为流数据,难以获得全部样本点的参数最大值和最小值,因此,无法使用传统的MinMax归一化方法处理盾构传感数据。为了避免不同类型的盾构掘进参数的变化范围差异对数据挖掘和机器学习模型造成影响,采用下式对盾构机运行参数进行归一化:

式中:P0为运行参数原始值;Ps为运行参数额定值;P为归一化的运行参数。部分盾构机运行参数额定值如表5所示。

表5 部分盾构机运行参数额定值Table 5 Rated value of shield machine operating parameters

2.2 盾构机运行参数选取

现广泛采用盾构机总推力、掘进速度、刀盘转速和刀盘转矩这4个掘进参数作为地层识别模型的输入参数。在地层中的地质类型较少、不同地质类型的地质参数差异较大的隧道工程中,可以达到较高的地层识别精度。在新加坡隧道实例中,盾构机在不同类型的地层掘进时,部分盾构机运行参数的均值如表6所示。

由表6可见:盾构机在较软类型和较硬地层的刀盘转矩、刀盘转速以及土舱压力等参数有明显差异,可以采用少量盾构机运行参数对地质类型进行粗略划分。但对性质相似的地层尤其是句容地层IV 型和V 型这2 种地层,刀盘转矩、刀盘转速、推进速度和总推力相似。此时,通过少量掘进参数表征地层特征,能够反映的地层地质特征较少,难以准确识别5种地质类型。土压平衡盾构机的掘进过程是复杂的岩机交互过程,盾构机数据采集系统采集得到的大量运行数据中都蕴含了掘进地层地质信息,为了从盾构机运行参数中充分挖掘地质表征特征,需要合理选择盾构机运行参数。

表6 不同地层中盾构机运行参数均值Table 6 Mean values of shield machine operating parameters in typical formations

盾构千斤顶的推力是推进过程中盾构遇到的全部阻力之和,主要包括开挖面正面土体对刀盘的阻力F1及盾构四周外表面与土体之间的摩擦阻力F2。刀盘转矩主要包括刀盘与土体之间的摩擦阻力转矩T1及刀盘切削土体需要克服的地层抗力转矩T2。根据文献[18,22],F1,F2,T1和T2可表示为:

式中:D为盾构机直径;L为盾体长度;G为盾构机重力;γ为开挖地层土体的容重;K为静止土压力系数;Kα为主动土压力系数;H为隧道深度;μ为盾体与周围土体之间的动摩擦因数;ξ为刀盘开口率;qu为土体的单轴抗压强度;v为盾构机掘进速度;n为刀盘转速。刀盘转速、转矩、盾构机推进力、推进速度与土体容重、土压力系数关系密切,这些盾构机运行参数受到地层地质性质的影响。

土压平衡盾构机掘进时,盾构机土舱压力设定值与掌子面土压力接近,可表示为[23]

式中:σx为土舱压力;K为掌子面土层的静止侧压力系数;c为土体黏聚力;φ为土体内摩擦角;h为隧道埋深;R为隧道半径;b为自然拱的半跨度。由此可见,土舱压力与地质条件关系密切。

在掘进过程中需要控制螺旋机转速和推进速度来保持土舱压力的稳定。土舱压力与螺旋机运行参数之间的关系可表示为[24]

式中:ΔP为土舱压力变化量;A为盾构机横截面积;η为螺旋机排土效率;hs为螺旋机螺距;As为螺旋机有效排土面积;Vc为螺旋机土舱体积;Et为渣土等效变形模量;ω为螺旋机转速。掘进地层性质对盾构机排土效率有显著影响[25],导致不同地层中土舱压力、螺旋机转速和推进速度等运行参数存在差异。上述运行参数之间的关系能够综合反映当前掘进地质特征。

在土压平衡盾构中,为了改良掌子面切削土体和渣土的性质,会在刀盘前方、土舱和螺旋机中注入膨润土、气泡剂和高分子聚合物等添加剂[26-27]。注入添加剂可以改善土体的塑性流动性,降低刀盘和螺旋机转矩,提高螺旋机排土效率和掘进速度[28]。现有理论知识难以定量分析各种添加剂对盾构机在不同地质类型的地层中运行参数的影响,将泡沫、膨润土和高分子聚合物添加剂注入流量作为机器学习模型输入参数,借助模型的抽象特征学习能力,表征添加剂对盾构机运行参数的影响。

基于上述分析,选择推进系统、刀盘系统、排土系统、添加剂注入系统的177个传感器监测参数和盾构机机器参数作为预测模型的输入。盾构机运行参数选择如表7所示。

表7 盾构机运行参数选择Table 7 Shield machine operating parameter selection

3 基于LTSA-Xgboost 的掌子面地质类型识别方法

3.1 基于LTSA算法的特征降维方法

3.1.1 LTSA算法原理

LTSA 算法[29]又称局部切空间排列算法,是一种无监督的流形学习算法,通过寻找高维观测数据的低维流形结构,达到对高维非线性数据的维数约简,常用于数据挖掘和机器学习等任务。LTSA通过样本点在局部切空间中的坐标特征,求解高维样本点在低维流形中的坐标,达到数据降维和特征提取的目的。

对于一组样本点x1,x2,…,xn(xi∈Rm),要求解其在d维非线性流形中的映射坐标T=[τ1,τ2,…,τn,τi∈Rd,其中d<m。对于样本点xi,选取其k个临近点{xi1,xi2,…,xik}。令通过求解

得到xi1,xi2,…,xik的d维最佳仿射子空间Qi。k个邻域点的局部特征坐标为Qi的最优解为矩阵的d个最大的奇异值对应的左奇异向量。

定义样本点全局坐标与局部坐标的映射关系为

3.1.2 盾构运行数据特征提取

对盾构机掘进参数进行筛选和预处理之后,得到177 维输入特征向量。求解运行参数之间的spearman 相关性系数矩阵,如图4所示。由图4可见:部分盾构机运行参数之间具有很强的相关性,说明输入参数中包含重复冗余信息。若直接将高维盾构机运行参数传入分类模型中,则分类器难以从运行参数中提取出准确的地质信息,影响了地层识别的准确率。

图4 177个参数间spearman相关系数图Fig.4 Spearman correlation coefficient among 177 parameters

使用LSTA流形学习算法挖掘内蕴于高维向量中的低维特征,消除传感参数中的冗余信息,得到稀疏化的输入特征,有助于提升分类算法对特征的学习。图5所示为使用LSTA 算法从177 维盾构运行参数中提取的50 维特征的spearman 相关系数矩阵。参数之间的相关性显著降低,达到了消除特征冗余信息的目的。

图5 50个低维特征间spearman相关系数图Fig.5 Spearman coefficient matrix between 50 lowdimensional features

3.2 Xgboost算法

Xgboost 算法又称为极限梯度提升算法[30],是boosting 算法的一种。Xgboost 算法通过集成多个基本分类器,形成强学习器。相比于深度学习算法更适合于处理图像、语音等高维抽象数据,基于树模型的Xgboost算法更适合于处理低维表格数据,例如传感器监测数据。Xgboost算法能够有效地防止过拟合,训练结果稳定。因此,本文采用Xgboost算法作为地层识别分类算法。

设最大迭代次数为K,Xgboost 强学习器可表示为

其中,gi(x)为每轮迭代时产生的基本分类器模型。选择CART 树作为基本分类器。训练集样本为I={(xi,yi)}(|I|=n,xi∈Rl,y∈R)。在每次迭代中,为训练基本分类器,定义优化目标L(t)为

式中:t为当前迭代次数;为t-1 轮迭代时强分类器的预测结果;Ω(ft)为正则化项。对于具有T个树叶节点的决策树q(x),设每个树叶节点的权重为wj(j=1,2,…,T),则正则化项可表示为

使用二阶展开方法快速求解权重最优解w*j和损失函数最优值L(t)*为

每个节点生成左右子树时,需要选择使Lsplit最大的特征和特征值分裂子树。当所有Lsplit≤0时,停止生成子树,本轮训练结束。重复上述步骤,直到达到最大迭代次数K,即可训练得到Xgboost 强分类器。

3.3 LTSA-Xgboost地质类型识别流程

盾构机数据采集系统实时采集1 465个通道的盾构机运行参数作为模型输入。对数据集进行预处理,去掉盾构机处于待机与停机状态的样本点,去掉盾构机运行前100 s 的非平稳样本点,采用参数额定值对数据进行归一化。从全部运行参数中选取指定的177个运行参数组成地质类型识别高维特征向量。采用LTSA流形学习算法对高维特征向量进行降维,提取低维特征。将低维特征输入Xgboost分类模型,模型输出盾构机掌子面地质类型。LTSA-Xgboost 地质类型识别流程如图6所示。

图6 LTSA-Xgboost地质类型识别流程Fig.6 LTSA-Xgboost geological type identification process

4 验证与分析

4.1 数据集构造

选择15个经过钻探点的掘进环作为输入样本,掘进环的长度为1.4 m左右。由于在短距离内地质类型具有连续性,可将这些环的地质类型标注为钻探点测得的地质类型。为检验模型的泛化性能并防止不同地质类型的训练样本数量差异影响模型识别准确率,对每种地质类型分别选取单独1环中的500个样本点作为测试集,其他环中随机选取1 600 个样本点作为训练集。具体划分结果如表8所示。

表8 训练集和测试集划分Table 8 Training set and test set division

4.2 模型评价指标

为了检验模型的分类效果,采用准确率A、精确度和F指数3 个指标对模型进行评价。准确率、精确度和F指数的计算公式为:

式中:n为样本总数;m为样本类别数;ypiredict为模型预测的样本点地质类型类别;yaictual为样本点对应的真实地质类型类别;TiP为预测正确的i类地层样本数量;FiN为预测为其他类型的i类地层样本的数量;FiP为预测为i类地层的其他类型地层样本的数量;Pi为模型对第i类样本的识别精确度。

4.3 结果讨论

从177个盾构机运行参数中提取最佳的低维特征集,需要寻找LTSA算法中的低维流形映射坐标最佳维度数和进行降维计算时选取的最佳临近点个数。采用不同的低维流形维度数和临近点个数,使用Xgboost算法作为分类器,可以得到分类器使用LTSA降维特征对掌子面地质类型识别的准确率如图7所示。当低维流形维度数为40,临近点个数为100 时,Xgboost 的算法准确率达到最高,说明此时的低维流形特征与掌子面地质类型之间的映射关系最佳。为证明LTSA 算法的优越性,对比LTSA,LLE,PCA 和ISOMAP 这4 种降维算法,将4 种算法提取的低维特征作为Xgboost 分类模型的输入参数,Xgboost 模型的识别准确率分别为98.32%,76.83%和70.43%和55.34%。Xgboost 分类模型以LTSA算法提取得到的低维特征作为输入参数时准确率最高,说明了LTSA算法的优越性。

图7 使用LTSA降维特征的Xgboost地质类型识别准确率Fig.7 Accuracy of Xgboost geotechnical recognition using LTSA dimensionality reduction feature

为评价LTSA+Xgboost 掌子面地质类型识别模型对复杂地质类型的识别效果,对比了极限梯度提升树(Xgboost)、深度神经网络(DNN)、支持向量机(SVM)、LTSA+Xgboost、LTSA+DNN、LTSA+SVM 这6 种识别算法在新加坡地铁数据集上对掌子面地质类型的识别效果。其中,LTSA模型的降维维度数设置为40,临近点个数设置为100,Xgboost 模型的基本分类器个数设置为800,分类器最大深度设置为4,学习率设置为0.15。

表9所示为6种算法在本数据集上的识别准确率、精确度和F指数。由表9可见:采用降维后的低维特征作为输入,Xgboost,DNN 和SVM 识别算法的地质类型识别准确率相比于将运行参数直接输入分别提升20.96%,15.28%和41.00%,说明LTSA降维有效解决了模型输入参数过多时由于特征冗余产生的模型精度下降的问题。

表9 不同算法的识别结果Table 9 Recognition results of different methods

比较上述6 种算法可知,LTSA-Xgboost 算法的识别准确率、精确度和F指数均为最高,识别准确率达到98.48%,证明本算法对于掌子面地质类型识别具有有效性。LTSA+Xgboost 算法对5 种地质类型识别的混淆矩阵图如图8所示。

图8 LTSA-Xgboost算法识别结果混淆矩阵图Fig.8 LTSA-Xgboost recognition result confusion matrix

为验证本文提出的盾构机运行参数筛选与特征提取方法的有效性,对比采用不同特征输入时,各种算法在地质类型识别上的差异。采用LTSA算法从本文选取的177 个盾构机运行参数中提取40维特征作为模型输入,使用Xgboost,DNN 和SVM 这3 种分类算法模型对5 种地质类型进行识别,结果如表9所示。采用盾构总推进力、推进速度、刀盘总扭矩和刀盘转速这4个特征参数作为模型输入,Xgboost,DNN和SVM这3种分类算法模型的识别结果如表10所示。

表10 使用不同输入参数的Xgboost、DNN和SVM算法识别结果Table 10 Recognition results using Xgboost,DNN and SVM algorithms with different input parameters

从图10可见:本文的特征筛选和特征提取方法能够得到更为全面准确地掌子面地质信息特征,有助于提升地质类型识别算法的性能。

5 结论与展望

1)提出了一种面向掌子面地质类型识别的盾构机运行参数筛选方法,选取与推进系统、刀盘系统、土舱、螺旋机和添加剂注入系统相关的177个盾构机运行参数,相比于常用的盾构机总推力、掘进速度、刀盘转速和刀盘转矩这4 个掘进参数,包含更丰富的地质信息。

2)利用LTSA流形学习算法从高维盾构机运行参数中提取内蕴稀疏化特征,有效降低了输入特征之间的相关性,消除特征中的冗余信息;建立了基于Xgboost的地质类型识别模型,使用低维特征输入准确识别了盾构机掌子面地质类型。

3)采用本文提出的参数筛选规则与LTSAXgboost识别模型,识别准确率达到98.48%,相比于DNN、SVM 和Xgboost 算法,识别准确率分别提升了22.40%,44.28%和20.96%。

4)识别混合地层是目前隧道掌子面地质类型识别的一个研究热点。在未来的研究中,将对混合地层进行分类,按照各种地质类型的地层所占比例及分布特点建立新的分类标签,然后利用本文所提方法建立盾构运行参数与新的地质标签之间的映射模型,实现对混合地层的识别。

猜你喜欢

刀盘盾构样本
基于正交试验的 TBM 双板刀盘结构参数优化设计
软硬不均地层对盾构刀盘受力计算方法与分析
小直径双模式盾构机在复合地层中的施工应用与实践
浅析硬岩刀盘转速与其内部落料的关系
水泥回填土技术在盾构出洞加固中的应用及改善方法
盾构穿越既有建筑物施工关键技术研究
用样本估计总体复习点拨
规划·样本
液驱土压平衡盾构刀盘电气原理分析
随机微分方程的样本Lyapunov二次型估计