APP下载

基于支持向量机的桥墩局部冲刷深度预测模型

2022-01-07潘志刚林祥峰张继生

水利水电科技进展 2021年6期
关键词:训练样本泥沙冲刷

潘志刚,林祥峰,张继生

(1.中国港湾西部非洲区域公司,科特迪瓦 阿比让市 06BP6687;2.河海大学港口海岸与近海工程学院,江苏 南京 210098;3.河海大学海岸灾害及防护教育部重点实验室,江苏 南京 210098)

桥墩局部冲刷的过程十分复杂,据不完全统计,国内外学者基于不同方法得到的桥墩局部冲刷深度预测公式约有50个[1],这些公式主要考虑了水深、流速、流向、桥墩直径、床面泥沙粒径、泥沙黏性、泥沙级配等影响因素[2-4]。现有冲刷深度预测公式存在以下不足:①由于桥墩周围水流结构及泥沙运动复杂,各公式之间考虑的影响因素不尽相同,导致预测结果相差较大[5];②多依靠试验数据独立获得,由于试验条件不同,公式的适用范围有限。支持向量机(support vector machines,SVM)是建立在统计学习理论中结构风险最小化原理基础上的机器学习方法,具有以下优势[6-8]:①适用小样本学习方法,基本不涉及概率测度及大数定律等,简化了通常的分类和回归等问题;②结果由少量最具代表性的支持向量决定,算法较为简单,能有效减少样本数据中异常值对预测结果的影响,具有较好的鲁棒性和泛化性;③计算复杂度取决于支持向量的数目,而不是样本空间的维数,一定程度上避免了“维数灾难”;④SVM学习问题可以表示为凸函数优化问题,因此可以利用已知的有效算法发现目标函数的全局最小值[9]。SVM方法基于样本学习,可有效解决复杂非线性问题中多因素综合影响下的目标预测难题[10-12]。本文结合SVM建立恒定流条件下圆柱型桥墩局部冲刷深度预测模型,以期为准确预测桥墩冲刷深度及桥墩基础防护设计提供参考。

1 模型构建

1.1 SVM基本原理

SVM方法是Vapnik等在20世纪90年代提出的基于统计学理论的机器学习方法[7],能高效处理非线性的分类和回归问题[13]。该方法基于结构风险最小化原则,通过非线性映射将输入向量映射到高维特征空间,在这个空间中寻找最优回归超平面,使得目标损失函数最小,该最优回归超平面的表达式为

(1)

式中:ω为权值系数矩阵;b为阈值;φ(x)为映射函数;x为支持向量。

SVM寻找最优超平面过程中,通过最小化权值系数平方和保证函数关系的最优化,同时容许小于ε的误差[14],通过求解下述二次凸规划问题确定ω和b:

(2)

约束条件为

(3)

SVM通过核函数定义的非线性变化将输入样本数据转换到高维特征空间,并在这个高维空间中寻找输入变量和输出变量的线性关系,因此核函数的选择尤为重要。常用的核函数有线性核函数、多项式核函数、径向基核函数(RBF)和Sigmoid核函数。参考前人研究[9,14-15],本文选择常用于处理非线性问题的径向基核函数作为映射函数:

k(xi,x)=exp(-γ|x-xi|2)

(4)

式中γ为核函数参数。

SVM模型的建立需要确定惩罚因子C、容许误差ε和核函数参数γ。在模型训练过程中,采用10折交叉验证法评估参数特定组合的预测效果,据此选择最优参数组合[16]。基于SVM的桥墩局部冲刷深度预测模型构建流程如图1所示。

图1 基于SVM的桥墩局部冲刷深度预测模型构建流程

1.2 桥墩冲刷影响因素

水流经过桥墩时,由于阻挡作用,靠近自由液面的压强增大,桥墩前沿产生下潜水流;两侧水流流速增大、压强降低;桥墩前沿下潜水流和底部水流相遇在两侧形成对称的马蹄涡系;在桥墩后侧,由于掩护作用,形成尾涡[17]。桩前的下潜水流、桩两侧的马蹄涡系和桩后的尾涡是影响桥墩局部冲刷的主要因素[18-19]。随着冲刷坑深度和范围扩大,床面抗冲刷能力增大,当水流不再带走泥沙时,桥墩冲刷达到平衡状态。桥墩最大冲刷深度主要受水流平均流速v、水深h、泥沙中值粒径d50、泥沙分层系数σg、桥墩直径D和泥沙启动流速vc等因素影响[20-21]。结合量纲分析法,桥墩最大冲刷深度Smax可以表示为

(5)

式中:Fr为弗劳德数;g为重力加速度。

1.3 模型训练数据

模型训练数据采用Sheppard等[1]收集的440组恒定流工况下圆柱型桥墩基础局部冲刷试验数据,这些试验数据涵盖了定床冲刷和动床冲刷、均匀沙和非均匀沙工况,具有一定的代表性。Sheppard等[1]对最初收集的569组试验数据进行了筛选,剔除了其中可靠性较低的数据,比如水流强度较低但冲刷深度很大的数据,使得保留的440组冲刷试验数据具有很强的可靠性。根据式(5),确定泥沙分层系数、水流强度、相对水深、桩径粒径比和弗劳德数作为输入参数,冲刷深度作为输出参数。

表1为440组样本数据中相关参数的最小值、最大值、平均值和标准差,可以看出模型输入参数取值范围相差较大。在SVM学习模型中,变化范围更大或标准差更大的输入参数对结果影响更大,可能与实际情况不同,因此需要对输入参数进行归一化处理,以提高计算精度,加快求最优解速度[14]。归一化处理中,将训练数据转换到[-1,1]区间内,转换公式为

表1 样本数据特征值

(6)

1.4 模型预测效果验证

采用Sheppard等[1]收集的试验数据训练和评估基于SVM的桥墩局部冲刷深度预测模型,利用决定系数(R2)和均方根误差(RMSE)对模型进行评估。将选取的440组冲刷试验数据划分为训练样本和测试样本,训练样本占80%,测试样本占20%,训练样本有352组,测试样本有88组。采用训练样本训练基于SVM的桥墩局部冲刷深度预测模型,将训练好的模型直接应用于测试样本,模型训练和预测效果如图2所示。

图2 基于SVM的桥墩局部冲刷深度预测模型预测效果

由图2可知,建立的基于SVM的桥墩局部冲刷深度预测模型预测值和实测值吻合良好,实测值与模型预测值的对比点均落在45°线附近,大部分不超过25%误差线。训练样本的R2为0.903,RMSE为0.154;测试样本的R2为0.842,RMSE为0.190,说明模型的训练及预测效果具有较高的精度,可用于桥墩局部冲刷深度的预测。

2 模型预测结果分析

2.1 误差分布分析

本文对所有的桥墩冲刷试验样本预测结果进行误差分析,采用相对误差进行评估。表2列出了所有试验样本各个误差层次占比。由表2可以看出,在440组试验数据中,相对误差在10%、20%、30%、40%以内的占比分别为69.09%、89.77%、93.86%和95.91%,仅约4%的数据相对误差超过40%。

表2 试验数据误差占比

2.2 敏感性分析

在本文建立的模型中,桥墩局部冲刷深度的影响因素有泥沙分层系数、水流强度、相对水深、桩径粒径比和弗劳德数5个,为了衡量每一个变量对预测结果的影响,对模型的每一个变量进行敏感性分析。去除其中一个变量,并重新训练模型,利用10折交叉验证法确定模型最优参数,在测试数据上计算模型的R2和RMSE。与原模型的预测结果相比,若预测结果相差较大,则模型对该变量敏感。敏感性分析的结果见表3,可见模型预测结果对分层系数和水流强度更为敏感,其次是桩径粒径比,而模型对相对水深及弗劳德数的敏感性较低。泥沙分层系数反映泥沙均匀性,水流强度表示水流速度与泥沙临界启动流速比值,随着泥沙分层系数或水流强度发生变化,桥墩局部冲刷进程将发生明显改变,显著影响冲刷平衡时桥墩局部冲刷最大深度;相较于泥沙分层系数和水流强度,桩径粒径比、相对水深和弗劳德数的影响程度较低。本文建立的基于SVM的桥墩局部冲刷深度预测模型对冲刷影响因素的敏感性与Sheppard等[1]分析结果相似,说明所建立的模型对于预测桥墩局部冲刷深度具有可靠性。

表3 影响变量敏感性分析

3 结 语

为了准确预测桥墩局部冲刷最大深度,本文基于SVM方法建立了桥墩局部冲刷深度预测模型。模型训练样本为恒定流工况下440组圆柱型桥墩局部冲刷深度,包括动床冲刷和定床冲刷、均匀沙和非均匀沙工况,涵盖工况范围广。误差分析结果表明,模型具有较高的预测精度,对于工程实际应用具有参考价值。此外,敏感性分析表明,模型对泥沙分层系数和水流强度较为敏感,而对相对水深、弗劳德数和桩径粒径比的敏感性较低。

本文建立的基于SVM的桥墩局部冲刷深度预测模型依赖于训练样本,由于训练样本中仅包含恒定流条件下圆柱型桥墩局部冲刷试验数据,故所建立的冲刷深度预测模型在其他桥墩类型(例如方型桥墩)复杂水动力环境(例如波流共同作用)下的应用性能有待进一步研究。未来可继续收集其他桥墩类型或复杂水动力环境下的桥墩局部冲刷数据,重新训练模型,扩大该模型的应用范围,提高其性能表现。

猜你喜欢

训练样本泥沙冲刷
泥沙做的父亲
自定义的浪
自定义的浪
基于GOCI影像的半月潮周期内渤海悬浮泥沙浓度变化研究
新疆多泥沙河流水库泥沙处理措施
人工智能
透射槽波探测技术对煤层冲刷带的研究与应用
基于小波神经网络的网络流量预测研究
气泡对点蚀状态管道冲刷腐蚀的数值模拟
宽带光谱成像系统最优训练样本选择方法研究