APP下载

基于聚类算法与碎石桩钻进参数的地层识别

2023-10-24平,赵飞,刘旺,王

人民长江 2023年10期
关键词:进尺碎石聚类

李 继 平,赵 宇 飞,刘 必 旺,王 文 博

(1.中国水利水电科学研究院,北京 100038; 2.中国水利水电第八工程局有限公司,湖南 长沙 410007; 3.中国水利水电第六工程局有限公司,辽宁 沈阳 110179)

0 引 言

软土地基常包括淤泥质土、软黏性土以及湿陷性黄土地基等[1-2]。这类地基强度低、压缩性高、易液化,对其上部的工程建筑物安全稳定有着极大的隐患。针对此类问题,国内外普遍采用振冲碎石桩对软弱地基进行置换和排水处理,以此提高地基的承载力,而精准掌握软弱地基的地质信息是采用振冲碎石桩加固处理的前提和基础。

在振冲碎石桩施工前,通常在已掌握区域地层特征的基础上,采用现场钻孔取土与室内外试验相结合的方法综合评价软弱地基的地质条件,并以此作为确定振冲碎石桩施工工艺的设计依据。但是在实际工程中,对于软弱地基的勘探数量较少,再加上软弱地层的形成过程、地层产状与赋存条件较为复杂,很难通过较少的勘探资料全面掌握整个地基加固区域中所有软弱地层的分布情况[3]。针对此类问题,国内外研究者利用施工过程中监测到的各类参数,通过数学模型、机器学习以及大数据挖掘等方法对各类地层岩石特性的辨识进行了大量研究。Esmaeilzadeh[4]等利用基于差分进化优化算法的模糊C均值聚类方法有效识别了岩体的结构面。Kitzig[5]等通过将岩石物理与地球化学数据相结合进行岩体聚类分析,能有效地识别岩石物理结构和岩石力学性质的潜能。谭英卓、周泽宏[6-7]等通过钻进参数的模型分析,对不同岩层的类型进行了有效的辨识。熊虎林[8]等利用钻进参数与地层类型,通过神经网络模型对钻进速率进行了有效预测,可见钻进工程中的各类参数与地层类型是密切相关的。

本文研究对象为金沙江拉哇水电工程的振冲碎石桩加固围堰地基工程,该围堰地基的地质条件复杂,各地层类型分布变化大。该碎石桩加固工程利用SV70碎石桩机伸缩式导杆连接振冲器,运用“水气联动”的方法进行造孔。同时通过安装在不同设备上的传感器,实现了对振冲施工过程深度、电流、电压、水量、水压、气压、填料密度等的实时监控,从而对整个施工过程进行动态跟踪。如何利用海量采集的数据对振冲碎石桩成孔过程中的地层进行有效辨识分析,对后续进行振冲碎石桩施工质量控制与振冲碎石桩智能化施工管理有着重要的指导意义。

本文基于以往工程的研究案例,结合前述工程振冲碎石桩施工过程的实时监测数据,在成桩过程能量消耗的基础上引入碎石桩钻进比功的概念,通过对不同维度参数的地层钻进展开类型辨识分析,并用聚类评估指标筛选出最有效的地层类型辨识聚类算法,以为类似的工程成桩质量控制提供技术支撑。

1 围堰地基地层初勘类型

该工程枢纽区河床覆盖层最大深度为71.4 m,主要为河流冲积物、湖相沉积物以及岸坡坡积物等。通过现场钻孔取土与室内外试验勘探得到的河床覆盖层性状如图1所示。上游围堰地基河床覆盖层最厚约65~68 m,由上至下分别Qal-5冲积砂卵石层,厚度1.4~4.6 m;Ql-3堰塞湖静水沉积砂质粉土,厚度14.7~18.1 m;Ql-2堰塞湖沉积层可细分为Q1-2-③黏土层,Q1-2-②砂质粉土层与Ql-2-①粉土层3个亚层,层厚约31.4 m。底部Qal-1为以冲积为主的卵石、块石层,厚度约4.6~5.0 m。

图1 河床覆盖层性状

由于前期初步勘察钻探数量有限,得到的深厚覆盖层地层分界及地质信息并不十分精准,但是作为最直接及最基础的地质信息,它可以作为后期利用钻进参数来辨识地层类型的参考依据。

2 数据获取与预处理

随着智能化施工管理与物联网技术的不断发展,该工程在振冲碎石桩施工设备上安装了多种智能传感器,以获取振冲器的深度、电流、速率、留振时间以及桩体填料量等重要施工信息。同时利用无线传输方式将各类数据传输到智能化监控系统中,实现对碎石桩施工过程进行实时监控与优化管理。安装在振冲碎石桩设备上的信息采集传感器按照每秒1 条的频率进行施工数据的采集与传输。一根深40 m的振冲碎石桩将会产生约8 000条数据,该围堰地基处理所需的振冲碎石桩超过2 600根,整个施工过程中共收集了超过2 200 万条数据。通过这些实时采集的施工数据,能够绘制碎石桩施工过程中工作深度、加密电流、填料量、实时桩形与留振时间之间的过程曲线。

获取的振冲碎石桩施工参数不是独立的数据,各参数和地层属性之间存在一定的对应关系。这些重要的监测数据不仅能反映施工状况,还能反映出不同地质条件下的地层特性,尤其是在桩成孔的过程中,经历河床不同覆盖层物质时钻孔的速度以及所需的加密电流都不尽相同。因此本文选取成孔过程中的数据作为原始数据集,并在此基础上进行围堰地层类型的辨识。

2.1 碎石桩数据选取

对于如何选取碎石桩数据,主要考虑了振冲碎石桩钻孔分布位置,同时兼顾不同区域中振冲碎石桩施工信息相互校核与对比分析便利性的需要。

根据上述选取原则,本次的地层聚类分析选取6组水平方向的碎石桩数据,每组有3根进尺成孔数据桩,共18根数据桩。选取桩分布位置如图2所示。为了使每根施工的碎石桩机所采集的数据尽可能地表征出同类地层区域的施工动态,所选取不同组的3根桩对应的编号均相同,分别为9,10,11。

2.2 异常值处理

对施工数据进行深度挖掘与分析之前,需要对数据进行一系列的处理,从而提取出有价值的数据进行地层分类研究,主要包括剔除无效数据、删除重复数据、数据归类整理等方面内容。振冲碎石桩施工过程中的异常数据主要是指不符合钻进时间序列趋势,不能反映钻进过程真实状态的的监测值。本文对碎石桩监测数据处理如下:

定义碎石桩监测过程中进尺深度样本Hk的样本集组成为

Hk={h1,h2,h3…hm} (k=1,2,…m)

(1)

在单位时间序列中应当有hm-1≤hm,剔除样本中不符合该序列的样本值,同时保留进尺深度随时间不变的初始值以及对应电流值。

定义监测过程中进尺深度对应的电流样本Ik的样本集组成为

Ik={i1,i2,i3…im}

(2)

在碎石桩钻孔施工过程中应当有着im≠0,剔除电流值为0的样本,以及对应的进尺深度值。

3 振冲碎石桩钻进比功

岩土工程中常根据仪器钻进过程中的参数与能量变化对岩层结构进行分类。谭卓英、岳中琦等[9-10]根据花岗岩钻进过程中的能量变化对其进行了实时分级。田昊等[11]、张幼振等[12]利用钻进中的能量变化,分别对隧道凝灰岩、含煤地层界面进行了识别分类。许明等[13]利用随钻参数与地层比功对持力层进行了有效判定。本文利用安装在振冲器上的传感器,对振冲施工过程的深度、电流、电压等数据进行实时采集,并提出振冲碎石桩在钻进过程中的钻进比功概念。

定义振冲碎石桩钻进比功为

(3)

式中:W=UIt,为碎石桩钻进过程单位时间所做的功,J;U为钻进电压,V;I为钻进时电流,A;t为单位钻进时间,s。Q=Svt,为碎石桩单位时间钻进的地层体积,cm3;S为碎石桩钻孔接触面积,cm2;v为单位钻进速率,cm3。

在碎石桩实际钻进过程中,由于钻速很小,且该施工的地基土层以粉质砂土与低液限黏土为主,所以轴向方向的黏滞力可以忽略不计,碎石桩做功可以全部当作破碎土层所消耗的能量。不同地层类型的岩性存在差异,随着钻进时间的推进,在不同类型地层中所消耗的能量会不同,与其对应的钻进比功也不同。部分振冲碎石桩的钻进时间与钻进比功关系如图3所示。

由图3可知,振冲碎石桩在不断钻进的过程中,在不同类型的地质层中,对应的钻进比功有着显著的不同。当遇到软弱地层时,其钻破地层所消耗的能量少,对应的钻进比功较低。当钻进到区域性较硬的块石与卵石层时,其钻进比功会在一定峰值处稳定波动。为了进一步验证进尺深度与钻进过程的能量消耗情况,选取ⅡA-3609数据桩分析其在钻进过程的进尺深度与钻进比功的关系,如图4所示。

图4 进尺深度与钻进比功关系

由图4可知,此根数据桩所钻进的地层区域中,钻进比功随着地层软弱程度的减弱而增大。当进入中部Ql-2的堰塞湖相沉积层时,由于该地层主要为砂质低液限黏土层,强度低、易液化,故消耗的能量较低,对应的钻进比功也较低。当碰触到黏土层的部分卵石等坚硬块石时,消耗的钻进能量会在局部突然增大。当钻进到底部Qal-1层时,由于此类地层主要为较硬的卵石、块石等,故钻进消耗的能量增加,其对应的钻进比功也会稳定在较高范围。可见碎石桩在钻进过程中的钻进比功与地层软硬特性有着显著的相关关系。基于此,本文根据钻进过程中的比功变化,对相应的钻进参数进行不同方法聚类分析,从而获得较为准确的地层类型分布情况与最合适的地层聚类方法。

4 聚类定义及算法的选择与评价

学术界有关聚类的解释,普遍采用的是Everitt在1974年关于聚类所提出的定义:一个类簇内的实体是相似的,不同类簇的实体是不相似的;一个类簇是测试空间中点的会聚,同一类簇的任意两个点间的距离小于不同类簇的任意两个点间的距离;类簇可以描述为一个包含密度相对较高的点集的多维空间中的连通区域,它们借助于包含密度相对较低的点集的区域与其他区域(类簇)相分离。

聚类算法在多关系数据的挖掘与机器学习中得到了广泛的应用与发展,但是在岩土工程领域中的应用相对较少。常见的聚类算法类型有基于划分的聚类、密度聚类、谱聚类等。为了探索适用本文数据挖掘的聚类方法,本文在各聚类方法中各选出一种代表性的聚类算法,同时结合振冲碎石桩钻进数据的特点,选用了以下几种聚类算法对碎石桩的参数进行挖掘与分析:基于高斯混合模型(GMM)最大期望(EM)的聚类[14]、凝聚层次(AGNES)聚类[15-17]、K-Means聚类[18-20]、基于密度(DBSCAN)的聚类[21-22]以及均值漂移(MeanShift)聚类[23-24]。在对6组碎石桩数据进行预处理后,结合不同地层中的钻进比功与地质类型的关系,决定选取进尺深度、钻进电流与钻进比功3个维度进行聚类算法的处理。

4.1 聚类结果

由于桩孔数量较多,本文选取ⅡA-3609、ⅡA-3809两根数据桩孔的聚类结果进行分析说明。在同一种聚类算法的聚类结果中,不同的簇类颜色代表在钻进过程中该段地层可以划分出不同的地质类型。具体聚类结果如图5~9所示。

图6 DBSCAN聚类结果

图7 K-Means聚类结果

图8 AGNES聚类结果

图9 MeanShit聚类结果

从5组聚类结果可知,ⅡA-3609、ⅡA-3809两根数据桩分别从地基深度18.6 m与22.8 m处进行聚类分析,该深度以上没有为围堰地基加固施工中打入的旋挖护筒,因此,不对该深度以上数据开展分析。

由图5~9可知,在基于高斯混合模型的最大期望聚类(GMM-EM)与DBSCAN聚类的结果图中,各簇点交叉混乱、噪声点较多、聚类效果较差,且随进尺深度不断的推进,没有明显的地层分层效果,表明这两种聚类算法不适用于本工程的地层辨识。而通过K-Means聚类、凝聚层次法(AGNES)以及MeanShift聚类的分析结果图可以看出,这3种聚类在随进尺深度推进过程中,均能较明显地把碎石桩将要加固的地层分为3簇,这表明ⅡA-3609、ⅡA-3809两根桩所钻入的地层深度是可以划分为3类不同性状的地质类型的。这与前期的地质初勘相吻合,即对应Q1-2层的砂质低液限黏土层的3个亚层Ql-2-③、Ql-2-②与Ql-2-①。

在K-Means聚类结果中:ⅡA-3609碎石桩所在的Ql-2-③层深度在18.6~28.0 m左右,Ql-2-②层深度在28.0~41.0 m左右,Ql-2-①层深度在41.0~51.0 m左右,其整个Q1-2层的砂质低液限黏土层厚度为32.4 m左右。在MeanShift聚类结果中:ⅡA-3609碎石桩所在的Ql-2-③层深度在18.6~30.0 m左右,Ql-2-②层深度在30.0~42.6 m左右,Ql-2-①层深度在42.6~51.5 m左右,其整个Q1-2层的砂质低液限黏土层厚度为32.9 m左右。在AGNES聚类结果中:ⅡA-3609碎石桩所在的Ql-2-③层深度在18.6~34.0 m左右,Ql-2-②层深度在34.0~39.0 m左右,Ql-2-①层深度在39.0~50.1 m左右,其整个Q1-2层的砂质低液限黏土层厚度为31.5 m左右。ⅡA-3809碎石桩所在的Ql-2-③层深度在22.8~38.0 m左右,Ql-2-②层深度在38.0~45.0 m左右,Ql-2-①层深度在45.0~54.4 m左右,其整个Q1-2层的砂质低液限黏土层厚度为31.6 m左右。AGNES聚类结果与初步勘探围堰地基的低液限黏土层厚度31.4 m基本吻合,也表明利用合适的聚类算法是能较准确地识别地层类型的。

4.2 聚类效果评价指标

判断聚类的精准度是数据挖掘中必须要做的工作,主要采用相关评估指标来判断。评估指标可分为内部评估指标与外部评估指标,外部评估指标需要知晓数据类别或进行标注,而内部评估指标则不需要。在实际工程中,很少有标注数据能帮助进行聚类,故常选用内部评估指标进行聚类效果评估。

本文结合以往学者所做的研究,选用轮廓系数(SC)[25-26]、Calinski-Haraba(CH)指数[27]和Davies-Bouldin(DB)指数[28]3种常见的内部评估指标进行聚类效果的评估。

4.2.1轮廓系数(Silhouette Coefficient)

轮廓系数最早由Rousseeuw于1986年提出。它结合内聚度和分离度两种因素,可以用来在相同原始数据的基础上评价不同算法对聚类结果所产生的影响。对于样本i,轮廓系数S(i)数学定义如下:

(4)

式中:a,b分别代表样本i到同一簇和不同簇所有样本距离的平均值。S(i)的取值范围为-1~1,其数值越大,说明b越大于a,即样本距同一簇的距离越近,距不同簇的距离越远,样本的聚类划分越合理,效果越好。

4.2.2Calinski-Harabaz指数

CH指数于1974年被提出,又被称为方差比标准,为簇内色散平均值与簇间色散的比值。其数学定义如下:

(5)

式中:k表示聚类的数目;N为数据的点数;Tr(Bk)为簇内色散矩阵的迹;Tr(Ak)为簇间色散矩阵的迹。

(6)

(7)

式中:Nk表示归属于簇k的样本数量,ck代表簇k的中心点,Ck表示归属于簇k的样本,c表示所有样本的中心点。CH数值越大,说明簇间协方差越大,簇内协方差越小,整体聚类效果越好。

4.2.3Davies-Bouldin指数

Davies-Bouldin(DB)指数是计算所有簇的簇内平均距离与不同簇类中心距离的比值,并求其最大值,该指标的计算公式如下:

(8)

其中,簇a和簇b的相似度Sab定义如下:

(9)

式中:da表示簇a中所有样本与簇a中心点的平均距离;dab代表簇a和簇b中心点之间的距离(a≠b)。DB值越小意味着簇内距离越小,同时簇间距离越大,整体的聚类效果就越好。

4.3 聚类评价指标对比分析

利用上述3类评估指标,对碎石桩钻进数据集的聚类效果进行检验分析,对所有数据桩聚类的3种评估指标具体分析如表1~3所列。

表1 轮廓系数数值指标

表2 CH数值指标

表3 DB数值指标

由表1~3可知:AGNES聚类、K-Means聚类以及MeanShift聚类的轮廓系数与CH指数的取值范围与均值明显高于GMM-EM聚类与DBSCAN聚类。其中AGNES聚类的轮廓系数与CH指数的取值范围最大。同时AGNES聚类的DB指数范围与均值也低于其他几类聚类算法。结合AGNES聚类和MeanShift聚类的地层辨识分析结果可知:AGNES聚类算法在Ql-2-③层的聚类结果为18.6~34.0 m,在Ql-2-②层的聚类结果为34.0~39.0 m,在Ql-2-①层的聚类结果为39.0~50.1 m。整个Q1-2层的聚类深度为31.5 m左右,这与围堰地基中初步勘探得到的低液限黏土层厚度是吻合的。

综上所述,通过对进尺深度、钻进电流与钻进比功3个方面指标进行不同的聚类算法分析后,再对各聚类方法进行聚类效果评估分析,发现 AGNES聚类算法是适用于该工程围堰地基地层辨识的有效方法。另外通过评价聚类效果的评价指标来看,所选用的地层识别聚类方法是合适的,为其他类似的大数据聚类分析方法选择提供了重要参考。

5 结 论

本文基于振冲碎石桩施工过程中的实时监测数据提出了振冲碎石桩钻进比功的概念,并通过聚类分析开展不同进尺深度的地层类型辨识。利用轮廓系数、DB指数和CH指数来对各聚类算法的地层辨识效果进行评估,为工程中地层类型的辨识筛选出最合适的聚类算法,主要结论如下:

(1) 振冲碎石桩在成桩过程中消耗的能量会因地层物理力学特性的不同而变化,在软弱地层消耗能量低,坚硬岩层则较高。提出的振冲钻进比功可有效表征不同的地层类型。

(2) 本文所选取的进尺深度、电流与钻进比功3个指标与复杂地层分类有较强的相关性。通过聚类结果与评估指标可知,K-Means聚类、AGNES聚类与MeanShift聚类这3种聚类算法能较准确地辨识不同的地层类型,其中AGNES聚类效果最好。

(3) 凝聚层次(AGNES)聚类算法可以根据桩成孔过程采集的特征参数,对复杂地层进行有效辨识,从而实现对需要加固的软弱地层信息的快速获取。

本文通过对振冲碎石桩施工数据的深入挖掘分析进而开展不同地层类型的辨识,为振冲碎石桩施工成桩过程中的质量控制指标确定提供了重要技术支撑,也为分析振冲碎石桩施工后形成的复合地基综合物理力学特性提供了基础资料。

猜你喜欢

进尺碎石聚类
碎石神掌
CFG桩与碎石桩的比选设计
开挖进尺对竖井开挖影响研究
基于DBSACN聚类算法的XML文档聚类
悲壮归乡路
隧道循环进尺的极限平衡分析*
基于高斯混合聚类的阵列干涉SAR三维成像
火车道上为什么铺碎石?
岩堆体隧道洞口浅埋段开挖进尺的计算与分析——以云南麻昭高速公路赵家屋隧道为例
考虑钻头进尺影响的深水钻井水力参数优选