APP下载

基于大数据分析的台区线损综合治理排查模型研究及应用

2021-06-03符煌莹沈华胄岑颖蓓

浙江电力 2021年5期
关键词:损率台区电量

陈 未,潘 越,符煌莹,沈华胄,岑颖蓓

(国网浙江象山县供电有限公司,浙江 象山 315700)

0 引言

随着电力体制改革的持续推进以及经济下行压力的进一步增大,企业提高自身运营效率、降低生产成本对其生存发展显得尤为重要[1-3]。对供电企业而言,线损率是其生产经营状况的一项重要技术经济指标,直接关系到其经营成果和经济效益[2,4-6]。当前,台区变压器增容或线路调整导致用户数据迁移不及时、违约窃电、表计电量采集数据频繁缺失的现象时有发生,不仅给供电企业造成了经济损失,也给广大用户的用电安全造成较大的隐患。在国网公司的统一部署下,目前已开展同期线损的计算,但由于监测手段的不足,导致台区线损异常仍频繁发生[7-10]。

为此,本文以国家电网公司提出的线损精益化管理目标为指导要求,以台区线损治理为着眼点,采用大数据挖掘技术,构建台区线损综合治理排查模型,设计出一套可以精准监控台区线损情况的线损精益化管理平台,实现线损归真和自动生成,实时监测关口、表计、设备、电量等关键节点信息,掌握各层级、各环节、各元件的线损情况,强化供售电量的精细管理,杜绝跑冒滴漏,提升公司经营效益。

1 数据获取与预处理

1.1 数据获取方式

本文所使用的研究数据主要来源于用电信息采集系统、营销系统等数据库。具体为某供电公司的280 603 个低压用户的基本信息和用电情况。其中,数据主要包括用户基础信息、台区线损信息、台区用户用电量信息等,具体涵盖用户户名、户号、用电地址、用电类别、用电容量、用电量、台区综合线损、用户电压、用户电压等数据信息,具体如表1 所示。

表1 台区线损综合管理数据源表及分析字段

1.2 数据预处理

1.2.1 数据清洗

为了有效支撑模型的构建工作,需要对获取的数据做以下预处理:

(1)划定所需数据范围。为提高线损治理工作成效,主要对综合线损率为负或线损率超过考核要求的红线部分台区所涉及用户进行分析,即优先分析线损不合格台区相关用户。

(2)确定清洗规则。对于所取数据字段不完整、为空或者偏差较大的用户档案信息进行清除,不作为后续分析的数据源;去掉数据部分为0、为空或者不完整的用户用电数据,为之后分析建模提供用户数据支撑。

1.2.2 模型触发机制

本文主要针对表计快走、表计慢走、用户窃电和用户窜台区这4 类发生概率大、影响比重高的常见线损类问题进行研究。其具体实现流程如图1 所示:输入用户的基础信息后,首先判断户变一致率是否为100%,如为“否”则与损失电量进行对比看是否匹配,如为“是”则将用户档案进行输出,不触发模型。若户变一致率为100%,则判断公变终端、台区低压用户采集成功率是否为100%,如为“否”则对比采集失败用户电量与台区线损电量是否一致,如为“是”则输出采集数据,不触发模型。

图1 模型触发流程

1.2.3 数据窗生成

当数据窗选择时间过短时,电量单点突变对数据结果的影响存在偶然性;当数据窗选择时间过长时,则会因数据量过大而对模型的运算应用形成负担,同时其空间和时间复杂度上也会成倍增加。为提高数据模型分析的正确性,降低时间、空间复杂度,本文依据实践情况确定数据窗,将时间序列定为发现线损不合格当天开始,向前逆推14~21 天。将该时间序列内发生的用户用电情况和台区线损波动等作为主要分析对象。

2 理论方法及分析模型构建

本文主要以低压用户为研究对象,通过多种算法构建适用于台区线损综合治理的问题排查模型。该模型主要分为3 个方面:

(1)对4 类常见线损问题的历史案例进行分析,通过聚类分析法梳理每种问题的关键变量,确定其判别规则。

(2)对用户用电变化趋势和台区线损变化曲线进行拟合,框定疑似用户范围。

(3)对比分析疑似用户用电特征与4 类问题的辨别规则,确定疑似问题,找出疑似用户。

2.1 问题辨别规则制定

2.1.1 SL 层次聚类分析法

本文应用SL 层次聚类分析法[11-16],收集历年发现并已处置的各种典型案例,着重分析表计快走、表计慢走、用户窃电、窜台区4 类问题的基本用电特征,将相关数据进行类比。由于考察的是定性指标,且需自动建议选择最佳类别,结合输入的各项用户基本信息数据,本文采用SL 层次聚类分析法对4 类问题用户的基本采样数据特征进行分析。规定每个类间距离等于2 类对象之间的最小距离,即各类中的任一对象与另一类中任一对象的相似度取最大值。

使用用户基础信息、用电容量、用电类别、表计接线方式、电能表额定值、电压等级、电流值、零线电流值、电量值、电能表事件值等十余种用户基本信息和用电数据项作为聚类变量,使用上述确定的聚类方案得到聚类结果,确定与4类线损问题关联性最强的几个关键因素变量,具体如图2 所示。

图2 SL 层次聚类分析法逻辑

2.1.2 4 类问题关键变量确定

如图3 所示,通过SL 层次聚类分析法,可得出4 类常见问题的关键影响因素:

图3 影响综合线损率的4 类问题及其关键影响因素聚类结果

表计慢走关键因素:用户电量变化与线损率变化曲线是否正相关;是否出现表计停走、倒走等计量异常现象;用户电量是否明显不符合用电规律。

用户窃电关键因素:用户有无突发开盖记录、有无电流失流、有无电压断相、有无失压、有无零线电流异常、有无反向电量异常等计量异常;台区线损率是否突然变大;用户电量变化与线损率变化曲线是否正相关;是否存在三相电流不平衡;是否存在反向电流。

表计快走关键因素:用户电量变化与线损率变化曲线是否负相关;是否出现表计飞走、电量突变等计量异常现象;用户电量是否明显不符合用电规律。

用户窜台区关键因素:用户电量变化与线损率变化曲线是否成负相关;用户地址信息和台区名称是否一致;用户的用电量与台区线损的损失电量是否匹配;相邻或附近台区是否同时出现异常且线损异常方向与该台区相反。

2.2 疑似用户研判模型

2.2.1 基础曲线生成

为方便后续算法应用,疑似用户研判模型主要通过台区线损和用户用电情况2 个维度进行分层构建,针对所有已发生用电的用户,根据其在数据窗内的用电量波动情况形成用户电量曲线;同时,针对台区线损的变化形成台区日均线损基础曲线。

2.2.2 皮尔逊积距相关系数法

本文在疑似用户研判环节,主要应用皮尔逊积矩相关系数法[11,13,17-20],皮尔逊积矩相关系数是2个变量标准化后的协方差,主要适用于衡量2 个变量线性相关的程度,并且变量数据类型一般为连续型数据。其公式可表示如下:

式中:ρX,Y代表皮尔逊相关系数;E(X)为变量X的均值;E(Y)为变量Y 的均值;E(XY)为变量X和变量Y 乘积的均值;E(X2)为变量X 平方的均值;E(Y2)为变量Y 平方的均值。

本文在规定数据窗内,将预生成的不同维度的2 条基础曲线,即用户电量波动曲线和台区日均线损变化曲线,进行曲线拟合。利用皮尔逊相关系数算法,分析每个用户的用电情况与台区日均线损情况的线性相关程度(如图4、图5 所示),并将分析结果按相关程度大小从高到低排列。当用户出现表计快走、表计慢走、用户窃电、用户窜台区4 类疑似问题时,用户用电量与台区日均线损呈正相关时或者负相关(具体业务含义表2),因此用户用电量与台区日均线损呈正相关或者负相关时,用户出现表计快走、表计慢走、用户窃电、用户窜台区4 类疑似问题的概率越大。

图4 正相关曲线拟合案例展示

图5 负相关曲线拟合案例展示

表2 各类疑似问题下用户用电量与台区线损

一般的,当皮尔逊相关系数绝对值大于或等于0.8 时[20],说明该用户的电量与线损的变化呈强相关性,则可将该用户划入疑似用户清单,用户疑似度为用户用电量与台区线损的相关系数的绝对值(如表3、表4 所示),用于后续分析排查。

表3 皮尔逊相关系数系数具体含义[20]

表4 正相关曲线疑似用户清单

2.3 疑似问题辨别模型

本文疑似问题辨别模型主要应用神经网络算法[18-24],将经过模型筛选所得的疑似用户用电特征,与已知的问题辨别规则进行匹配,最终确定疑似问题类型。所选择神经网络的结构分为输入层F0、隐藏层F1、输出层F2。如图6 所示,台区用户经过研判模型后得出疑似用户清单,将清单上用户的用电特征(包括用电类别、电压等级、电流值等)作为Fuzzy ART(模糊自适应谐振原理)输入神经元,以向量I=(I1,…,In)表示;导入聚类分析后得出的四类疑似问题关键因素,到类别表示层F1,以向量y=(y1,y2,y3,y4)表示;结合权重W=(W1,…,Wn),输出结论,即辨别疑似问题类别结果为输出层F2。

表5 负相关曲线疑似用户清单

图6 神经网络算法逻辑

3 模型应用

基于上述得到的台区线损综合治理排查模型,依托移动作业终端开展相关应用探索实践,进行线损精益化管控平台的设计,其功能架构如图7 所示。该平台基于模型计算得到线损异常用户名单,以台区线损作为采集质量、营配基础档案质量、现场用电情况、线损异常波动的指标,持续提高台区线损日监测达标率;以线损作为打击窃电及违约用电的专项行动依据,开展现场核查工作。

图7 线损精益化管控平台功能架构

运用大数据挖掘技术,跨系统关联用电信息采集系统、营配贯通平台、营销业务应用系统等相关业务数据,通过应用所构建的数据模型,实现对线损异常用户的筛选排查。基于排查结果,对线损异常的台区用户从电量、营配关系、采集异常、地理位置等维度进行自动分析,在符合国网安全接入要求的前提下利用移动作业终端对线损异常台区进行现场核对,并对违约窃电行为进行拍照留存,固化证据,提高台区线损日监测达标率。

如图7 所示,该平台包括PC 端应用和移动端功能应用。在PC 端,包括线损异常台区线损筛选、采集电量数据缺失用户预警、异常用电用户分析、现场核查工作查看等功能。在移动端,有基于模型计算得到的线损异常用户名单、异常用电用户核查、用户轨迹定位等功能。

4 结语

本文采用大数据分析方法,以国网公司的线损精益化管理要求为指导,以台区线损治理为目标,针对当前线损治理的难题,通过梳理营配关系、整改档案信息,创新数据挖掘方法,研究构建适用于台区线损综合治理的问题排查模型,并应用该模型快速定位疑似用户、框定疑似问题并指导现场排查。

基于该模型,依托移动作业终端,设计并研发出一套可以精准监控台区线损情况的线损精益化管理平台,实现线损归真和自动生成,实时监测关口、表计、设备、电量等关键节点信息,掌握各层级、各环节、各元件的线损情况,强化供售电量的精细管理,提升公司经营效益。

猜你喜欢

损率台区电量
储存聊天记录用掉两个半三峡水电站电量
我国水库淤损情势分析
四川2018年7月转让交易结果:申报转让电量11.515 63亿千瓦时
降低台区实时线损整治工作方法
无功补偿极限线损率分析及降损措施探究
供电企业月度实际线损率定量计算方法
电量隔离传感器测试仪的研制
供售电量不同期对综合线损率的影响
北斗通信在小型水电厂电量采集中的应用
三合一集中器作为台区线损考核表计的探讨