APP下载

改进的VIP法在大坝监测效应量关键影响因子识别中的应用

2023-02-09李诗婉刘可心周子玉李艳玲

水利规划与设计 2023年1期
关键词:分析法投影关键

李诗婉,刘可心,周子玉,李艳玲

(1.四川大学水利水电学院 水力学与山区河流开发保护国家重点实验室,四川 成都 610065;2.江阴市璜土镇人民政府,江苏 江阴 214445)

1 概述

环境量对于大坝安全监测具有十分重要的作用,如库水位对土石坝渗流的影响[1],温度对混凝土坝变形的影响[2]等。通过应用各种数学、力学等方法[3],结合环境量建立大坝安全监测模型[4],分析环境分量对监测效应量的影响程度,可以更好地针对这些影响大坝效应量的关键因素实施监控,并且能够定量分析它们对于监测效应量的影响,更好地把握大坝的运行性态。

1956年,意大利的Tonini[5]最早将影响大坝位移的主要因素划分为水压、温度和时效3个分量,随后各国学者纷纷推动跟进。在国内,顾冲时[6]首次采用最小二乘法获得了大坝水压变化分量和温度变化分量以及时效效应分量;王建[7]和陈宇清[8]分别提出了结合距离概念的加权面积法和应用灰色系统理论的灰色关联分析法来描述环境量对效应量的影响效应,并且都取得了不错的应用效果。但是,加权面积法识别结果很大程度上依赖于建模因子的选取,灰色关联分析法对于数据异常突跳具有很强的敏感性,从而容易造成大坝监测效应量关键影响因子的误判。因此,本文提出了改进的变量投影重要性分析法,该方法基于偏最小二乘回归,提供可以对数据进行深入分析的辅助分析技术,结合水利工程的特性对变量投影重要性指标进行改进,是一种较好的变量选择方法,适用于样本较少、相关性较强的数据[9],并通过工程实例的应用,验证本文方法的可靠性和准确性。

2 基于偏最小二乘的VIP改进方法

在偏最小二乘法计算过程中[10],所提取的因子主成分th对分量X、xj或y的解释能力就相当于X、xj或y关于th的线性回归方程的复测定系数R2。其值越大,就说明解释能力越强。定义th的各种解释能力如下:

th对某个因子xj的解释能力:

Rd(xj,th)=r2(xj,th)

(1)

th对X的解释能力:

(2)

th对y的解释能力:

Rd(y,th)=r2(y,th)

(3)

基于th的解释能力,即可得到变量投影重要性指标VIPj:

(4)

式中,k—自变量个数;Rd(y,t1,t2,…,tm)—因变量和主成分的相关系数,表示t1,t2,…,tm对y的累计解释能力;whj—轴wh的第j个分量,表示该自变量在主成分上的权重,在这里,它被用于测量xj对构造th成分的边际贡献,对于任意h=1,2,…,m,则有:

(5)

根据变量投影重要性分析法的基本原理可以发现,VIPj表示自变量对因变量的解释能力,该指标能够说明哪些自变量相对而言对于因变量的作用更大一些。在水利工程中,自变量xj为环境量因子,通过力学理论及类似工程经验,构建合理的大坝安全监测统计回归模型,确定对效应量有影响作用的环境量因子。由于所有环境量因子xj对于监测效应量y的总影响应为1,因此,根据式(5)可以将式(4)改进为:

(6)

图1 改进的VIP法识别关键影响因子流程图

3 应用效果分析

3.1 多重共线性影响分析

以某土石坝左岸山体绕坝渗流测点AUP1的实测数据为例,构建绕坝渗流统计回归模型见式(7),其统计分析成果见表1。从表1中可以看出,统计回归效果较理想,复相关系数为0.954,但14个模型因子中6个方差膨胀因子(VIF)大于10,最大值达5255.70,这说明模型因子间存在着严重的多重共线性。

(7)

为进一步说明多重共线性对关键影响因子识别的影响,使用测点AUP1的实测数据(共313个测次)进行不同方式的抽样得到5个不同数据量的数据样本,并根据5个样本分别建立统计回归模型,获取各因子的回归系数,见表2、如图2所示。从图表中可以看出,对于5个不同的样本,其复相关系数都相当理想,也都通过了F检验,但部分因子回归系数的波动较大。

分别采用加权面积法和改进的变量投影重要性分析法对AUP1测点实测数据样本1—5进行关键影响因子识别,得到该测点的影响因子识别结果见表3。通过表3可以看出,对于5个不同的样本,采用加权面积法进行效应量关键影响因子识别结果受数据变化影响较大,稳定性和可靠性低。

图2 测点AUP1在不同抽样下的最小二乘回归系数

加权面积法的核心是结合距离的概念,根据统计回归模型中的各环境因子回归系数构建分量-时间曲线,将分量至某一基准值的平均距离作为衡量标准,因此,该方法识别关键影响因子的精度在很大程度上取决于模型因子回归系数的稳定性。而由于多重共线性的存在,回归系数对效应量监测序列中数据的微小变化可能会非常敏感,回归系数的稳定性会变差,从而导致加权面积法确定的效应量分量比例可靠性降低。而采用改进的变量投影重要性分析法采用循环式的信息分解与提取方法,从环境量集中提取成分,然后对所提取的成分进行普通的多元回归,由于所提取的成分都线性无关,从而能够有效消减变量间多重共线性影响,因此识别出的关键影响因子和次关键影响因子均为降雨和水位,且各环境量的影响占比相差不超过3%,能够克服效应量监测序列中数据的微小变化,其对相同测点不同数据量的数据序列识别结果稳定性明显优于加权面积法。

3.2 抗噪能力分析

以某闸坝坝顶外观垂直位移测点CTP4为例,由于该闸坝垂直位移观测墩的监测方式为人工监测,频率为1次/月,温度的监测方式为自动化监测,频率为1次/d,其原观监测数据与测点观测当日温度的历时过程线、温度原观监测数据历时过程线如图3所示,使用单测点统计回归模型。

表1 绕渗测点AUP1回归结果统计

表2 测点AUP1原观监测的5个抽样样本及回归结果

表3 测点AUP1不同抽样下的关键影响因子识别结果 单位:%

图3 测点CTP4及温度历时过程线

单测点统计回归模型如下:

(8)

从图4可以发现,CTP4测点2019年8月测次对应的温度值出现突跳,达到34.0℃,但该测次前1天的温度测值仅25.5℃,温度序列出现了单次突跳。为分析温度测值突变、不同温度测值提取模式等对关键因子识别效果的影响,设置了3个方案进行对比分析。

将该测点原观监测数据作为目标数据列:

X0={X0(t),t=1,2,…,n};

(1)观测当日环境量作为比较数据列1:

X1i={X1i,t=1,2,…,n;i=2};

(2)将比较数据列1中2019年8月测次的温度数据修正为该测次前一天的温度实测值25.5℃作为比较数据列2:

X2i={X2i,t=1,2,…,n;i=2};

(3)由于该测点垂直位移效应量的监测频率为1次/月,因此再将比较数据列1中的温度数据取各月均值作为比较数据列3:

X3i={X3i,t=1,2,…,n;i=2};(其中,i=1时为水位分量;i=2时为温度分量;i=3时为时效分量)。

采用灰色关联分析法针对目标数据列和比较数据列1、2、3进行关键影响因子识别,采用改进的变量投影重要性分析法针对目标数据列和比较数据列1、2进行关键影响因子识别,得到该测点的影响因子识别结果见表4。可以发现灰色关联分析法应用灰色系统理论,将水位、温度、时效等环境量和效应量观测数据作无量纲处理,并将效应量作为参考数列,环境量因子作为比较数列,分别求解其关联系数和关联度,并将归一化后的关联度作为环境量对大坝效应量的影响程度。但是3次识别的关键影响因子结果并不一致,温度影响占比相差最大达到了17.58%,这说明灰色关联分析法的抗噪能力较差,监测序列的单次突跳对识别结果影响很大,同时当环境量和效应量监测频次不一致时难以选择合理的目标数据列和比较数据列,不同的选取方式会造成识别结果产生很大的差异,甚至会造成关键影响因子的误判。当采用改进的变量投影重要性分析法进行关键影响因子识别时,该方法通过提取变量中解释能力最强的综合变量,相较于灰色关联分析法对各测点的关键影响因子识别不会因效应量与环境量数据列的异常突跳而产生差异,同时也能够避免效应量与环境量监测频次不一致而难以选择数据列的问题,计算出来的环境分量占比更稳定,相差不超过2%。

综上所述,加权面积法易受统计回归模型的精度和合理性影响,且受数据量的微小变化影响很大;灰色关联分析法受制于本身极大程度依靠数学处理的特性,无法从力学角度进行合理解释,同时效应量或环境量监测序列的单次突跳、效应量与环境量的观测频次不一致均可能对识别结果产生很大影响。然而基于偏最小二乘回归的变量投影重要性改进分析法,采用循环式的信息分解与提取方法,从环境量集中提取变量中解释能力最强的综合变量,从而有效克服上述问题,具有较强的适用性。

表4 不同方法对测点CTP4的关键影响因子识别结果 单位:%

4 结论

针对加权面积法和灰色关联分析法在大坝安全监测效应量关键影响因子识别时的主要问题,提出了改进的变量投影重要性分析法,并从稳定性和适用性等方面分析其应用效果,得到了如下结论:

(1)加权面积法基于统计回归模型,监测序列中数据的微小变化可能造成回归系数估计值的很大波动,而改进的变量投影重要性分析法具备良好的稳定性,能有效降低因子间多重共线性。

(2)相较于依靠数学统计的灰色关联分析法处理波动型数据时识别结果可靠性差的问题,改进的变量投影重要性分析法能有效降低数据序列异常突跳的不利影响,并且克服环境量和效应量监测频次不一致时数据列的不同选择导致对大坝监测效应量的关键影响因子产生误判现象。

(3)本文基于偏最小二乘回归,提出的改进变量投影重要性分析法具备良好的可靠性性和适用性,较加权面积法和灰色关联分析法具有明显的优势。

猜你喜欢

分析法投影关键
硝酸甘油,用对是关键
异步机传统分析法之困难及其克服
新形势下深化改革开放的关键一招
高考考好是关键
解变分不等式的一种二次投影算法
基于最大相关熵的簇稀疏仿射投影算法
找投影
找投影
基于时间重叠分析法的同车倒卡逃费探析
层次分析法在SWOT分析法中的应用