APP下载

低压台区电能表运行误差自动监测方法

2021-01-29丁建顺

自动化与仪表 2021年1期
关键词:台区电能表分类器

唐 亮,王 凯,庄 磊,黄 丹,丁建顺

(1.国网安徽省电力有限公司,合肥230061;2.国网安徽省电力有限公司 营销服务中心(计量中心),合肥 230031)

在现代社会中,现存的很多老旧城区多处于变压器低压供电的区域。由于电能表设施老旧,管理松散, 电能表经常出现运行故障或者人为窃电、偷电的想象。在此背景下,如何实现对低压台区电能表运行误差的自动监测,对于及时发现异常,避免人为窃电、偷电行为,保证电力企业和个人用户利益都具有重要的现实意义[1]。

低压台区电能表运行异常的监测问题,实际上就是通过数据比对、统计分析和数据挖掘等技术手段,对电能表的运行工况进行诊断和分析,判断其运行是否存在异常状况[2]。BP 神经网络是模拟人大脑神经单元的工作方式的一种算法。该算法应用在数据分析中,具有很强的非线性映射能力、泛化能力以及容错能力,但是面对量大且更新速度较快的电能表计量数据,收敛速度慢,且易陷入局部最优,大大增加了监测模型的训练时间,降低了监测准确性[3]。

针对上述问题, 本文在前人研究的基础上,利用改进后的BP 神经网络进行低压台区电能表运行误差自动监测。

1 基于BP 神经网络的电能表运行误差自动监测方法

1.1 电能表运行数据采集

拥有数据是进行数据挖掘的必要条件,因此对低压台区电能表运行误差进行自动监测,首先要解决低压台区电能表运行数据采集的难题。为此,通过北斗卫星技术,提出了面向低压台区的电能表运行数据采集方案。该方案的基本思路是通过用电信息采集终端获取电能表运行数据,然后上联北斗通信机,建立终端与主站之间的北斗通信通道,通过报文通信架构实现信息的转换和传输[4]。其具体过程如图1 所示。

图1 电能表运行数据采集流程Fig.1 Operation data acquisition process of electricity meters

1.2 电能表运行数据准备

1.2.1 数据清洗

采集到的电能表运行数据中并不是所有的数据都是有价值的,其中还包含一些噪声,数据是不完整、不一致等无价值的数据,这些无价值的数据统称为脏数据[5]。脏数据会严重干扰数据挖掘质量,因此需要对脏数据进行清洗。针对这3 种脏数据,需要做到噪声数据消除、不完整数据弥补以及不一致数据纠正,相对应的处理方法有统计方法和可视化技术、替代法(估值法),以及参照其它资料人工更正。

1.2.2 数据选择

采集到的数并不是所有都能用于某一决策。假定有100 个字段,其中可能只有20%可用,而如何从100 个字段中选取出这20%数据是十分重要的。它可以通过建立相关计算模型来解决。选择是在2个维上进行的,一个是选择列或参数维,另一个是选择行或记录维。无论是哪个,都可以利用SQL 语言实现[6]。

1.2.3 比例变换

数据变换是指将数据转换或统一成适合于挖掘的形式。大多数的神经网络模型只接受[0,1.0]和[-1.0,1.0]范围内的数值数据。因此,需要按照比例将数据映射到固定区间,一般可以通过归一化的方法实现。常用的归一化方法有最大-最小标准化、Z-score 标准化、函数转化等[7]。

——最大-最小标准化

式中:man,min 分别为样本数据的最大值、最小值;x为一个原始值。

——Z-score 标准化

式中:α 为均值;β 为标准差。

——Decimal scaling 小数定标标准化

式中:j 为满足条件的最小整数。

1.2.4 数据归约

对于小型或中型数据集,一般的数据预处理步骤已经足够,但是对于电能表运行这类海量大且更新速度较快的数据, 需要做进一步的数据归约,即在不降低数据质量的同时减少数据数量。在此采用主成分分析方法进行归约。其具体步骤如下:

步骤1对原始数据进行标准化, 建立标准化矩阵Z。

步骤2计算标准化矩阵Z 的相关系数矩阵R,即

式中:rij为原变量xi与xj的相关系数,rij(i,j=1,2,…,p)。

步骤3计算特征值与特征向量。①求解样本相关矩阵R 的特征方程

得到p 个特征根, 并按大小顺序排列λ1≥λ2≥…≥λp≥0;②分别求出对应于特征值λ 的特征向量,ei(i=1,2,…,p),要求‖ei‖=1,即

式中:ei为向量j 的第i 个分量。

步骤4计算的主成分贡献率和累计贡献率,即

贡献率为

累计贡献率为

一般取累计贡献率达85%~95%的特征值,λ1,λ2,…,λm所对应的第1,第2,…,第m 个主成分(m≤p)。

步骤5计算主成分载荷zij,即

步骤6各主成分的得分。

1.3 构建BP 神经网络分类器

1.3.1 BP 神经网络基本结构

BP 神经网络一种模拟人类大脑的结构和功能的算法,由输入层、隐含层和输出层组成。BP 神经网络主要通过2 个过程进行工作,即信号正向传播和误差反向传播。在信号正向传播阶段,输入信号通过输入层输入,然后经过隐含层处理,最终达到输出层,输出结果。这时计算输出结果与期望输出的误差值,判断误差值是否小于设定的阈值,若小于则说明输出的结果为理想结果,若大于则进入误差反向传播阶段[8]。在误差反向传播阶段,经误差以某种形式向输入层传播,根据误差不断调整连接权值[9-10]。经过反复训练,使得输出结果不断逼近期望结果。

1.3.2 BP 神经网络分类器

基于BP 神经网络构建分类器, 主要包括3 个步骤,如图2 所示。

图2 BP 神经网络分类器Fig.2 BP neural network classifier

1.3.3 BP 神经网络训练过程

步骤1初始化BP 神经网络各参数;

步骤2电能表运行数据输入输入层;

步骤3电能表运行数据隐含层计算, 隐含层输出Hj的计算公式为

式中:xi为输入向量;ωij为输入层和隐含层间连接权值;aj为隐含层阈值;l 为隐含层节点数;f 为隐含层激励函数。

步骤4隐含层计算结果输入到输出层。输出层计算公式为

式中:ωjk为连接权值;bk为阈值;Ok为BP 网络输出层输出。

步骤5误差计算,计算公式为

步骤6权值更新。根据网络预测误差e,更新网络连接权值ωij和ωjk。即

式中:η 为学习速率。

步骤7阈值更新。根据网络预测误差e 更新网络节点阈值a 和b。即

步骤8判断算法迭代是否结束,如还未结束,则返回步骤2。

1.3.4 BP 神经网络分类器优化

针对BP 神经网络分类器存在的缺点, 有2 种改进策略:一种是改进算法本身,另一种是引入一种智能算法对神经网络进行优化, 提高分类精度。在此采用Adaboost 算法进行优化, 即把多个BP 神经网络弱分类器组成的强分类器。具体过程如下:

步骤1选择m 组数据,作为训练样本。

步骤2神经网络初始化。

步骤3弱分类器预测。训练第t 个神经网络分类器时,计算预测序列g(t)的预测误差和。

步骤4计算预测序列权值。

步骤5调整预测数据权重。

步骤6训练N 组神经网络之后,得到N 组弱分类函数,从而组成强分离函数。

2 仿真分析

为测试所提基于BP 神经网络的低压台区电能表运行误差自动监测方法有效性,在MatLab(R2010b)环境下进行仿真分析。

2.1 样本数据和参数设置

选取某低压台区1 个月内的用电量统计数据作为样本数据。以某一天为例,采集到的用电量统计数据形式见表1。

表1 某低压台区一天中部分用电量的统计数据Tab.1 Statistical data of partial power consumption in one day in a low voltage platform area

由于采集到的样本数据集中没有误差数据,所以人工篡改2565 条数据,作为异常数据。

参数设置见表2。

表2 参数设置Tab.2 Parameter settings

2.2 电能表运行误差检测步骤

利用MatLab 工具实现基于BP 神经网络的电能表运行误差数据监测方法,其主要步骤如下:

步骤1BP 神经网络的建立,使用newff 函数实现;

步骤2BP 神经网络的初始化,使用init 函数实现;

步骤3将80%电能表运行数据输入到BP 神经网络中,进行训练。该训练通过train 函数实现。训练结果如图3 所示。

图3 BP 神经网络训练结果Fig.3 BP neural network training results

由图可见,经过1000 次迭代后,基于BP 神经网络的低压台区电能表运行误差自动监测模型训练完成,误差小于预先设定的误差阈值,表明在此所构建已经具备较好的分类检测能力。下一步可以通过输入测试样本进行网络。

步骤4将剩余20%电能表运行数据输入到训练好的BP 神经网络中,进行仿真测试。该测试通过sim 函数实现。

2.3 评价指标

1)准确率 准确率又称分类器的总体识别率,是指被分类器正确分类的元组所占的百分比,即它反映分类器对各类元组的正确识别情况,当类分布相对平衡时最有效。即

式中:Tp为指被分类器正确分类的正元组;TN为指被分类器正确分类的负元组;P 为正元组数;N 为负元组数。

2)监测时延 误差监测时延Js是指产生误差时间Jc与监测出误差时间Jh的差值。

2.4 结果分析

1)分类器监测准确率 为了验证低压台区电能表运行误差监测效果,采用聚类算法、最近邻算法、支持向量机算法,以及BP 神经网络算法,进行分类器监测准确率检测,通过sigmaplot 软件得到的结果如图4 所示。

图4 不同方法下分类器监测准确率Fig.4 Monitoring accuracy of classifier in different methods

由图4 分析可见,不同方法的分类器监测准确率不同。当数据量为60 MB 时,聚类算法的分类器监测准确率为69%;最近邻算法的分类器监测准确率为68%;支持向量机的分类器监测准确率为69%;BP 神经网络的分类器监测准确率为97%。本文方法对低压台区电能表运行误差监测准确性较好,能够实现准确监测。这是因为经过数据清洗、数据选择、比例变换以及数据归约4 个步骤的处理,提高了数据质量,有效提升了分类器监测准确率。

2)监测时延 实时数据量可达430 GB,电能表数据差值是电能表测得值与实际用电结果的差值。为了验证低压台区电能表运行误差监测效果,计算聚类算法、最近邻算法、支持向量机算法以及BP 神经网络算法的电能表运行误差监测时延,所得结果如图5 所示。

图5 不同方法下误差监测时延Fig.5 Error monitoring delay in different methods

由图5 分析可见,不同方法下低压台区电能表运行误差监测时延存在差异。当数据量为50 MB时,聚类算法的误差监测时延为789 ms;最近邻算法的误差监测时延为643 ms;支持向量机算法的误差监测时延为576 ms;BP 神经网络算法误差监测时延为38 ms。本文方法一直拥有较低监测时延,说明该方法能够较少监测用时,有效提升监测效率。

3 结语

基于BP 神经网络研究了低压台区电能表运行误差自动监测方法。经过仿真测试,本文方法对低压台区电能表运行误差监测准确率高,当数据量为60 MB时,BP 神经网络的分类器监测准确率可达97%;该方法监测时延较低,监测效率高,数据量为50 MB,BP 神经网络算法误差监测时延仅38 ms。但由于测试数据具有局限性,导致测试结果可能存在误差。

猜你喜欢

台区电能表分类器
巧数电能表
认识电能表
基于实例的强分类器快速集成方法
降低台区实时线损整治工作方法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
电能表自动化检定机器人可靠挂卸表方案设计与实现
三合一集中器作为台区线损考核表计的探讨
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别
多功能低压台区识别设备的研制