APP下载

神经网络的土钉轴力最大值预测模型

2023-11-08卓维松阙云王荣黄瑞

武夷学院学报 2023年9期
关键词:土钉轴力神经网络

卓维松,阙云,王荣,黄瑞

(1.福建船政交通职业学院 土木工程学院,福建 福州 350007;2.福州大学 土木工程学院,福建 福州 350116;3.武夷学院 土木工程与建筑学院,福建 武夷山 354300)

土钉轴力是土钉抗拔和抗拉极限状态设计的关键参数之一,对土钉轴力精确预测不仅关系到工程造价,并且与基坑支护工程的安全问题息息相关。目前,世界各国都有相应的土钉轴力计算模型,如美国的FHWA 法[1],日本规程用的经验土压力[2],中国的《建筑基坑支护技术规程》(JGJ 120-2012)、《基坑土钉支护技术规程》(CECS 96:97),简化增量法[3]和极限上限分析法[4]等。

目前已有学者对现有的土钉预测模型进行评估。例如,Yuan 等[5-6]对FHWA、《建筑基坑支护技术规程》和《基坑土钉支护技术规程》所提出的土钉轴力模型分别进行了模型不确定性分析,研究表明其模型因子的平均值和变异系数分别为0.95 和0.382、0.62 和0.62 及0.974 和0.730。由此可见,现有土钉轴力计算模型精确度仍有待提高。

神经网络方法由于具有高度的非线性映射能力,事先不需要假设输出变量与输入变量之间的关系,而是通过对大量数据组成的样本本身进行深入学习验证,就能找到输入数据和输出数据之间的某种线性或者非线性关系。杨小辉[7]基于Elman 神经网络构建复合土钉墙安全预测模型,并用实测数据进行对比,证明Elman 神经网络用于复合土钉墙的安全预测方面具有较好可行性。曹正[8]提出一种基于BP 神经网络的基坑土钉支护结构优化设计方法,用于选择工程量最小的土钉支护方案。Hao 等[9]用监测数据建立土钉墙位移神经网络预测模型,并用正交试验分析,找出影响边坡位移影最大的敏感性因素。王兆鑫[10]采用BP算法与遗传算法相结合的方法应用于土钉墙土钉支护的变形预测,经过预测模型与实测位移数据对比,发现神经网络模型预测值与实测变形值最大误差为8.82%,能满足工程问题的实际需求。Maedehl 等[11]利用多层神经网络对考虑土钉抗拔力、覆土荷载和灌浆压力影响的土钉墙中土钉结合体系的最大位移进行了评估。

由此可见,神经网络已被广泛地应用于土钉墙相关参数的预测中,且具有较高的模型预测精度。然而,以上研究多适用于单一土体或者单一土钉墙神经网络模型,因其数据有限导致模型适用性有限,并且其所建立模型所采用的数据量偏少,远不足以支撑一个具有实用价值的神经网络模型。

基于此开展文献调研,收集大量工作状态下土钉轴力最大值的实测数据,建立一个考虑土钉墙参数(坑壁倾角、后倾角)、土钉参数(间距、直径、长度和角度)、土参数(黏聚力、摩擦角和重度)和超载情况等因素的土钉轴力神经网络预测模型,然后对该模型的预测结果进行评估,以期提高土钉轴力的预测精度,为其理论计算和工程实践提供支持。

1 土钉墙轴力的BP 神经网络模型

1.1 神经网络的基本理论

BP 神经网络(back-propagation neural networks)及反向传播神经网络,是采用误差逆传播算法进行误差校正的多层前馈网络。BP 神经网络的学习过程是正向传播过程和反向传播阶段,正向传播过程是基本信息输入输入层,然后由隐藏层加权处理就会得到输出值。反向传播阶段就是当输出值与样本值存在差异时,这是BP 神经网络就会通过逐层修改权值和阈值,逐步减小输出值与样本值的误差,直至得到满足特定要求的结果为止。

BP 神经网络对于处理工程中各种非线性的映射能力非常出众,使其使用面很广,其具有非常强大的自学习和自组织能力,神经网络对建模的目标的经验知识不需要太高的要求。在实际应用中较为方便,将影响土钉轴力多因素数据作为输入,实际监测土钉轴力值作为输出,神经网络便会将输入数据和输出数据分成三类分别用于训练网络、验证网络、测试网络,是最终生成的神经网络模型满足精度要求,可以应用于土钉轴力预测的实际工程,其应用范围涉及非常广。

图1 为BP 神经网络的结构,左边为输入层x,右边为输出层y,中间部分为隐藏层,隐藏层层数不唯一,隐藏层里面包括神经元,神经元数也不唯一。

图1 神经网络结构Fig.1 Neural network structure

1.2 神经网络模型的实现流程

图2 为神经网络使用的基本流程。通过编写Matlab 神经网络语言,使用结果回调用相应的工具箱,便于更加直观理解所训练验证测试神经网络模型的性能,图3 为Matlab 实现神经网络的流程。

图2 算法流程图Fig.2 Algorithm flow chart

图3 神经网络训练及仿真流程图Fig.3 Neural network training and simulation flow chart

2 土钉轴力的BP 神经网络结构设计

2.1 输入层与输出层设计

基坑土钉墙土钉轴力是多种因素共同作用的结果,收集大量工作状态下土钉轴力最大值的实测数据,建立详细土钉轴力数据库。考虑土钉墙参数(坑壁倾角、后倾角)、土钉参数(间距、直径、长度和角度)、土参数(黏聚力、摩擦角和重度)和超载情况等因素,该神经网络将这些因素作为输入层,用来进行数据分析,输出层是监测的土钉实测数据值。

2.2 神经网络模型的参数分析

2.2.1 层数和节点数

隐藏层的层数通常不唯一,计算方式也不固定,通常与设计人员的经验和习惯确定,设计隐藏层数目太少,学习能力下降,会导致计算不充分,精度较差,容错率变低。设计隐藏层数据太多,会导致计算过程过于漫长,学习时间太长,精度也不一定很高。经多次测算,本模型设置1 个隐藏层,一共2 层激活层,其中第一层有21 个神经元,第二层10 个神经元。输入节点是14 个,输出节点是1 个,输入层和输出层不设置激活函数,输入层、输出层都呈现线性映射。

2.2.2 初始值范围的选定

采用土钉墙土钉轴力最大值作为训练样本,网络初始权值是随机生成,一般将初始值得范围选定在(-1,1),这样激活函数处于对最大变化率时调节各个神经元的权值。

2.2.3 网络的输入

如果输入层输入变量的数量级过于庞大也将不利于权值的调整,利用归一化处理可以避免数值问题带来的计算麻烦,归一化后的数据将使网络快速收敛。多因素影响的模型,神经网络对样本数据的评价标准不一样,这时需要对其量纲化,做统一评价标准。数据不做归一化,在计算过程中,净输入绝对值可能会过大,导致神经元输出呈现饱和,较小的值将会被忽略,最终影响模型的预测精度,所以现在做神经网络时,都不可避免的将数据进行归一化处理。

2.2.4 学习速率

学习速率通常需要经过多次测算去选定为定值。在神经网络的使用中,一开始是比较难选到最合适的学习速率,通常会导致学习速率过大或者过小。如果设置的学习速率太大,神经网络在计算过程中可能会出现权值修正过头的现象,导致模型的预测进度较差。如果设置的学习速率太小,神经网络计算过程会很慢,耗费大量时间。神经网络循环训练产生权值变化量的大小是由学习速率决定,通过大量调节测算,认为选取学习速率为0.01 较为合适。

2.2.5 终止训练设定

训练目标均方差低于0.001。终止设定中设置如果训练效果不佳,连续十步变差,就会训练将会自动停止。

2.3 BP 网络的MATLAB 设计

BP 神经网络里面一般有newff()、train()、sim()3 个函数,可分别用于创建、训练和预测。本文用newff()函数,该隐藏层设置2 个激活层,第一个激活层设置21 个节点,第二个激活层设置10 个节点,这个两个激活层的激活函数都使用正切S 型函数tansig。因为S 型函数tansig 性能好,比较稳定,不容易梯度消失,计算性能好,对于输入值要求相对宽容。

设置优化方法选择trainlm 函数,因为动量反转和动态自适应学习率的梯度下降BP 算法训练函数traingdx、levenberg_Marquardt 的BP 算法训练函数trainlm,这用优化函数是系统默认的最优于处理中等规模的神经网络的算法。训练样本都有很大的计算量,trainlm 能将这部分的计算量减少,避免复杂的矩阵运算,提高训练样本的计算速率。

3 土钉轴力预测方面的应用

3.1 土钉轴力数据

用于生成神经网络的土钉墙土钉轴力最大值数据样本容量来源于阙云等[12]在简化增量法计算土钉轴力模型准确性分析中的土钉轴力数据库。其收集了国内现有的178 根土钉轴力数据,提出异常和最后一根土钉的轴力实测数据后土钉为143 根。

3.2 数据模拟结果

经过多次训练和筛选,找到比较合适的神经网络模型,每次生成的模型都不一样,多次筛选必不可免。这神经网络本身调节值得随机生成有关。通过Matlab编写神经网络代码,建立用于预测土钉轴力的神经网络模型,最终的得到神经网络预测值与实测值如下图4 所示。由图4 可知,该神经网络模型土钉轴力最大预测值与最大实测值吻合程度很高,离群点较少。

图4 神经网络预测值与实测值Fig.4 Neural network predicted value and measured value

通过Performance 得到其迭代次数与均方误差的关系,如图5 所示。由图可知,训练、验证和测试的MSE 随着迭代次数的增加而减小,且MSE 值较小,验证和测试的MSE 值差不多。验证的MSE 最小值发生在第5 次迭代,而且在此之前没有过拟合现象,即没有训练MSE 值递减但验证MSE 值递增的现象出现。

图5 迭代次数与均方误差的关系Fig.5 The relation between epochs and mean square error

通过Training state 得到其验证数据的梯度、Mu、验证检查与迭代次数的关系如图6 所示。由图可知,梯度随着迭代次数的增加而减小,Mu 是LM 算法里面的一个参数,基本上随着迭代次数是稳定变化的,最大值也未超过0.001。验证检查就是找到一个时点,而它之后6 个时点对应的MSE 都没有减小。在时点5~15 上,验证的MSE 单调增大,因此算法停止,最小的验证MSE 发生在5 次迭代上。

图6 验证数据的梯度、Mu、验证检查与迭代次数的关系Fig.6 The relationship between gradient,Mu,validation check of validation data and epochs

通过Regression 得到其拟合回归图,如图7 所示。由图可知,训练R 值为0.981,验证R 值为0.73,测试R 值为0.82,整体R 值为0.92。经过多次尝试,结果还是比较理想的,但是这样的结果并不完美,如果想要得到更好的拟合结果可以做如下尝试:多次切换影响结果的初始值;改变神经元数量继续尝试来获取更好的结果;通过增加数据来进一步来完善该神经网络模型;通过应用不同的函数来训练数据建模。

图7 拟合回归图Fig.7 Fit regression graph

4 神经网络预测土钉轴力模型评估

神经网络模型建成后,神经网络预测土钉轴力最大值提取出来和土钉轴力实测值进行分析对比。图8为神经网络预测土钉轴力最大值与土钉轴力实际监测值关系图。由图可知,预测最大钉轴力最大值均小于100 kN,实测土钉轴力最大值和预测土钉轴力最大值与1∶1 对应线的偏差,图形不完全吻合,造成不吻合的原因可能有以下四个方面:可能与土壤类型、地形、环境;试验仪器本身的误差;人为造成的误差;模型本身的误差。

图8 神经网络预测土钉轴力最大值与土钉轴力实际监测值Fig.8 Neural network predicts the maximum value of soil nail axial force and the actual monitoring value of soil nail axial force

图9 为土钉轴力最大值神经网络模型的模型因子λB与预测土钉轴力最大值关系图。由图可知,土钉轴力的μλ 和COVλ分别1 和0.37。表明预测土钉轴力最大值的平均值比实测土钉轴力最大值的平均值一样。图中λ 大于2 的数据点有2 个,但未发现将这些土钉轴力最大值识别为异常值的原因,剔除问题数据后土钉轴力最大值数据(n=143)的斯皮尔曼秩相关系数为ρ=0.88(大于零)P 值<0.05。表明拒绝了λ 和预测土钉轴力最大值相互独立的零假设。由于该方法的准确性取决于土钉轴力最大值的大小,即使从数据集中省略2 个最高数据点,偏差依赖性的定量指标显示仍然相关。

图9 神经网络模型的模型因子与λB 预测土钉轴力最大值关系Fig.9 The relationship between the model factor of the neural network model and λB to predict the maximum axial force of soil nail

表1 为不同土钉轴力模型相关参数对比表,由表可知,对比国内现有常应用于实际工程的土钉轴力模型,可知该神经网络土钉轴力预测模型中的土钉轴力平均值更加精确,模型因子的变异性更小。且该神经网络土钉轴力预测模型的预测精度和预测土钉轴力最大值之间不存在相关性,因而适用性更广泛。

表1 不同土钉轴力模型相关参数对比Tab.1 Comparison of parameters of different soil nailing axial force models

5 结论

收集大量工作状态下土钉轴力最大值的实测数据,建立一个考虑土钉墙参数、土钉参数、土参数和超载情况等因素的土钉轴力预测模型,然后通过Matlab神经网络代码和神经网络工具箱进行土钉轴力最大模拟。得出的主要结论如下:

(1)该神经网络模型土钉轴力最大值预测的预测值与土钉轴最大值实测值吻合程度很高,离群点较少。

(2)该神经网络梯度稳步降低,其中LM 算法里面的参数Mu 基本上随着迭代次数稳定变化,最大值也未超过0.001,训练R 值为0.981,验证R 值为0.73,测试R 值为0.82,整体R 值为0.92。

(3)对比规范现有土钉轴力模型,该神经网络土钉轴力预测模型的土钉轴力平均值更精确,模型因子变异性更小,且预测精度和土钉轴力最大值之间不存在相关性,因此适用性更广泛。

猜你喜欢

土钉轴力神经网络
浅谈支撑轴力伺服系统在深基坑中的应用
土钉喷锚在不同土层的支护应用及效果分析
复合土钉墙优化设计的探讨
基坑钢支撑轴力监测的优化及实践
神经网络抑制无线通信干扰探究
不同支护方案在基坑支护设计中的对比分析
钢支撑轴力在安装过程中的监测分析
基于神经网络的拉矫机控制模型建立
基坑开挖阶段支撑轴力时空效应分析
复数神经网络在基于WiFi的室内LBS应用