APP下载

数据挖掘技术在水利工程安全监测管理中的应用研究

2021-12-04裘明华

水利科技与经济 2021年11期
关键词:田家溢洪道监测点

裘明华

(浙江颐川科技有限公司,杭州 310000)

1 概 述

随着科技进步,全世界已经步入信息时代,水利行业亦开始大规模应用计算机网络、现代通信、智能控制以及数据挖掘等新兴技术,来实现高效管理水利工程的目的[1-3]。

数据挖掘技术最早是应用于商业管理领域,随着信息化的发展,将数据挖掘技术应用于水利工程的研究成为未来水利行业信息化发展的一个重要趋势。付晓旭、韩红旗、李琼等[4-6]展开对数据挖掘技术在水利工程信息化管理应用中的可行性。许惠君、张弛等[7-8]深入探讨数据挖掘技术在水库调度与防洪过程中的应用。此外,数据挖掘技术在我国水利工程安全管理中也逐渐得到重视。阿米娜古[9]指出,水利工程安全管理系统中引入数据挖掘技术数据,能够实现水利工程中数据的高效筛选与合理分析,实现水利工程的科学化、专业化、信息化、高效化、自动化。杨献志等[10]深入探讨了水利工程管理中数据挖掘技术应用可行性及前景,并指出数据挖掘技术能够使得水利工程项目管理更加科学化。

综上所述,现有的关于我国水利工程安全监测与管理的研究主要是从管理制度或方向方面提出,而缺乏对新型技术引用的研究。数据挖掘技术是基于某大数据库发掘有效有价值的数据并加以利用的新型技术,目前被广泛应用到各个领域中。因此,发展数据挖掘技术在水利工程安全维护管理中的应用,对于促进我国水利工程管理现代化、建设高效畅通的安全管理体系具有十分重要的意义。

2 工程背景

田家湾水库位于浙江省湖州市田家湾村,项目区冬季寒冷干燥,春季湿润多风,夏季高温多雨,秋季旱涝无常。水库工程属长江流域支流水利工程,水库控制流域面积为97 km2,总库容为942.5×104m3。根据现场调查结果,由于水库大坝工程年久失修,因此部分溢洪道泄洪能力出现问题,不能满足下游山西省高校新校区防洪的限泄要求。因此,展开对该水利工程的安全监测、管理与风险评价具有重要意义。为合理布置实施田家湾水库除险加固工程,现需要对该水库各溢洪道的实际情况展开监测与安全管理。见图1。

图1 田家湾水库

3 基于数据挖掘技术的风险评级模型

3.1 数据挖掘技术

传统的信息处理侧重于关键词查询与关键信息统计分析,而对一些“次要”的指标所隐含的信息则选择忽略。数据挖掘即指从长时间所堆积的大量历史数据中提取人们有兴趣、有价值的数据知识的过程。这些数据不仅包括关键的、重要的信息,同时也包括大量数据中所隐含的信息,这些信息对管理措施决策可能具有重要意义。数据挖掘是通过对某个数据库中的每个数据展开分析,从而探索获得大量数据中基础规律的技术。数据挖掘技术主要包括数据准备、规律探寻以及规律确定这3个项目。数据挖掘技术主要方法见表1。

表1 数据挖掘技术主要方法

3.2 数据处理与相似度分析

由于现场数据具有完整性差、噪点多等劣势,从设计监理单位所获取的数据不全为有效数据,因此需要对数据进行预处理以获得真实有效的数据,使得试验研究样本更加真实,以保证数据挖掘的正确性。数据预处理主要包括数据筛选、数据补充及数据整合标准化3个步骤。在对数据展开聚类分析时,通常采用分类统计量距离来描述不同数据之间的相似度。常见的距离统计量有以下几种:Manhattan距离、Euclidean距离以及Chebychev距离。本次研究采用Manhattan距离(也称绝对值距离)进行距离计算及相似度分析,假设某个样本中具有n个样品,其基本计算方法如下:

(1)

3.3 评价模型构建

采用K-means聚类算法进行计算,其基本原则是优化初始聚类中心,使选取的初始聚类中心的距离尽量远[11-12]。本次研究采用“聚类-分级”的层次聚类分析方法(图2)来处理水库不同安全监测点的分级管理问题。

图2 AGNES层次聚类分析法

其具体实现过程主要分为4个步骤:

1)获取水库溢洪道安全相关监测点的具体数据并进行预处理,以得到真实、有效的数据。

2)认为设定K值,基于改进的K-means算法将安全因素分为K个簇(K即为期望划分的等级数),计算簇间距离并得到划分为K个簇的数据库。

3)计算聚类后的每个簇内数据的总均值Sj,Sj值可由下式计算:

(2)

式中:i为监测点编号(1,2,…,n);j为簇数编号(1,2…,k);Q为溢洪道在的安全效能值;R为监测点风险因素修复率,%;N为监测点沉降量,mm;E为监测点偏移量,m。

4)根据Sj的值,按照大小顺序将监测点的效能划分为k个等级。

4 工程应用

经过现场观察和调查,田家湾水库溢洪道存在一定的安全风险,主要表现在溢洪道不同部位出现混凝土破裂,上覆土层位移变形,严重影响溢洪道工作效率。为合理分析溢洪道不同部位的安全运行,本次研究选取田家湾水库中溢洪道20个安全监控点的数据作为样本进行研究,经过预处理得到基本数据,见表2。

表2 田家湾水库20个安全监测点数据

按照上节所述具体流程与步骤,选定分级簇总数k为4;再利用Matlab等数据分析软件,最终得到基于数据挖掘技术的分级结果见表3。

表3 基于改进K-means算法的分级结果

综上可知,按照4个等级机制,则该水库中按次序每个等级安全监测点的数目分别为2、10、3和5个。由此可见,该水库溢洪道安全监测点中有8个监测点反映出安全性较低(Ⅲ、Ⅳ级),需要进行修复或更换。根据K-means算法输出结果,可以得到Ⅲ、Ⅳ级需要修复的监测点编号,其中Ⅲ级的有监测点2号、4号和11号,Ⅳ级的有1号、7号、8号、10号和16号,因此需要采取措施针对对应编号尤其是Ⅳ级簇内的监测点展开及时的修复。

5 结 论

为研究数据挖掘技术在水利工程安全监测管理中的应用,本文基于数据挖掘技术建立了水利工程溢洪道安全等级划分基本方法,并以我国浙江省田家湾湾水库为例开展了深入研究。主要结论如下:

1)基于数据挖掘技术中的聚类分析法,并采用改进的K-means算法建立水利工程安全监测管理等级划分基本方法,该方法具有高效、可处理复杂数据的优势,能够适用于我国水利工程安全监测管理工作中。

2)基于水利工程溢洪道等级划分基本方法,得到田家湾水库溢洪道安全监测点中按次序每个等级的监测点数目分别2、10、3和5个,且能够快速确定每个等级的对应序号。其中,等级为Ⅲ、Ⅳ级的安全监测点反映出严重问题,需要及时进行修复或更换,该区域需要修复的位置总数为8个。

猜你喜欢

田家溢洪道监测点
保定市满城区人大常委会为优化营商环境固定监测点授牌
天津南港LNG接收站沉降监测点位布设
GFRP筋替代钢筋在溢洪道泄槽结构中的应用研究
走,到田家寨看风光
青山嘴水库工程(溢洪道)
基于流体体积函数法的阶梯溢洪道消能研究
全站仪极坐标法监测点稳定性分析方法研究
不同来流条件对溢洪道过流能力的影响
Our process of building a physical robot prototype
济南市细颗粒物(PM2.5)的时空分布特征分析研究