APP下载

基于改进深度学习的电力营销数据异常识别研究

2022-09-01康径竟黄河滔

通信电源技术 2022年9期
关键词:编码标签节点

万 龙,康径竟,黄河滔

(云南电网有限责任公司 昭通供电局,云南 昭通 657100)

0 引 言

能源与电力发展事关国计民生,与经济社会存在广泛紧密的联系。推动深度学习和实体经济深度融合,挖掘改进深度学习的价值,对于助力新时代能源电力事业更好地服务经济社会发展具有重大意义。在我国经济发展水平日益向好、国民生活质量日益改善的背景下,我国电力用户的数量也在持续增加,与此同时用电量也出现明显提升,在电力系统中电力业务所具有的重要意义和作用也逐渐突出,因此针对电力营销管理工作中所涉及到的电量管理工作的要求也愈发严格[1]。对电量管理工作而言,电费以及电价的统计分析工作极为关键,在进行电量管理工作时经常会遇到电量异常等问题,借助优化后的改进深度学习方法,对于电力营销工作中所涉及到的异常数据加以识别判断,可改善电力营销数据的准确性和可靠度。

1 深度学习简介

深度学习理论描述了学习样本数据的表示层次及其内在作用规律,在学习过程中所获得的一切文字、声音、图像等信息参量,都具备较强的应用处理能力。该项理论算法的最终实践目标是使机器人具备像人一样的学习与分析能力,在准确识别文字、声音、图像等数据信息的同时,为各项理论参量赋予较强的计算与处理能力。总体而言,深度学习是一种极为复杂的机器学习类应用算法,在图像及语音识别方面具有较为广阔的应用前景,远超数据挖掘、机器翻译等其他类型的信息处理技术[2]。

深度学习在异常检测方面展现出良好的性能,递归神经网络(Recurrent Neural Network,RNN)常用于分析序列信息,长短期记忆(Long Short-Term Memory,LSTM)网络是RNN的一个分支,在自然语言处理等序列信息分析应用中表现良好。

2 深度学习主要网络模型

卷积神经网络(Convolutional Neural Network,CNN)为当前应用较多的深度学习理论中的研究模型之一,其标准结构包括输出层、全连接层、输入层以及交替的卷积层、池化层等部分。为了保障民生,提高电网可靠性,有些学者已将深度学习引入电力行业进行研究、探索[3]。

自动编码器(Auto Encoder,AE)在创建之初实际上是用于压缩数据,主要具有下述特点:(1)与数据间具有密切联系,即代表自动编码器,仅能够对和训练数据较为类似的数据进行压缩处理;(2)通过该方法对数据进行压缩处理以后,会在一定程度上对数据产生损伤,这主要是由于在进行降维处理时必然会丢失部分信息。

通过自动编码器能够对输入原始数据所具有的一些隐蔽性特征进行学习,也就是编码(Coding)。在对新特征进行学习后,即可重新获得原始输入信息,这一过程也被称之为解码(Decoding)[4]。对自动编码器的工作情况进行分析,其实际上和主成分分析(Principal Component Analysis,PCA)具有相似之处,但是性能却得到显著优化,这主要是由于神经网络能够自动的对一些新的数据和能力进行学习,因此能够使得企业数据处理效率和质量均得到显著提高。在对自动编码器的工作原理和整体情况进行深入分析后,能够发现其实际上属于无监督式的深度学习模型,通过其能够获得多种多样的训练样本的新数据信息,所以从这一层面而言,其实际上也可以被划分到生成算法模型的范畴中[5]。

对于RNN结构进行分析,该算法能够对此前所输入的各项信息加以记忆,并在现有输出信息中进行应用,所以对于数据序列类型的数据信息进行计算时极为适用,而且将CNN算法和RNN算法联合应用可以很好地解决数据间的相关性问题。

3 基于改进深度学习的电力营销数据识别设计

基于改进深度学习的电力营销异常数据检测包含Caffe 深度学习框架构建、电力营销数据清洗、异常检测标签编码3个处理步骤,具体执行方法如下[6]。

3.1 Caffe深度学习框架

Caffe深度学习框架是电力系统硬件执行环境的搭建基础,由学习网络本体、电网监测主机、学习节点、异常数据集合等多个结构共同组成。其中,学习网络本体可提供电力系统运行所需的电子量信息,并可借助数据传输通道反馈至下级应用结构之中。电网监测主机起到承上启下的物理连接作用,可在电量数据传输流的作用下,将异常数据平均分配至各级学习节点之中,从而较好地满足电信息捕获需求。异常数据集合位于Caffe深度学习框架底部,可有效整合各学习节点中的电力系统异常数据,并将其转换为既定格式的存储应用参量。Caffe深度学习框架结构如图1所示。

图1 Caffe深度学习框架结构

3.2 电力数据清洗

数据清洗转换实际上就是对数据中存在的异常问题进行处理解决,并对对象识别工作中所涉及到的不足之处进行解决应对的过程,通过传统的人工数据处理方法仅能够对少量的数据信息进行处理,而且还存在费时费力、效率较低等问题,同时对专业水平要求高,本身还会出错,不能满足海量调度管理类及实时类数据清洗要求[7]。基于此,开发出一种便捷高效快速的数据清理转换方法,并且借助一定的设备或者仪器实现自动化或者半自动化的数据清洗工作具有重要意义,对于控制数据质量也具有显著积极影响。

一般情况下,在Caffe深度学习框架中,电力数据清洗结果受到常性化捕获指标χ的直接影响,若不考虑其他干预条件对最终计算结果的影响,常性化捕获指标数值越大,电力数据的清洗能力也就越强,反之则越弱。图2为电力数据清洗的过程。

图2 电力数据清洗过程

3.3 异常检测标签编码

异常检测主要分为以下两类。

(1)数据有标签。对于这样的数据,期望训练一个分类器,这个分类器除了要能告知正常数据的类别外,还要对于异常数据输出其属于“unknown”类,这个任务叫做Open-set Recognition[8]。

(2)数据无标签。这类数据分为两种,一种是数据是干净的(clean),也就是说数据集中不包含异常数据;另一种是数据是受污染的(polluted),数据集中包含少量的异常数据。其中,受污染的数据是更常见的情况。

通常情况下,电力系统异常数据中始终包含大量的类别特征参量,这些特征同时具备较强的标签编码能力,然而仍有一部分捕获节点需要对电力系统异常数据设置必要的判别条件,也就是异常检测标签的编码处理行为[7,8]。异常检测标签编码所能接收的电力系统数据必须保持有序存在状态,并要求其输出行为必须为连续且规范的。按照既定表示形式,待编码的数值并不能持续保持为有序状态,也就是Caffe 深度学习框架为其分配了一个数量值而已[9]。

4 异常识别研究

自动化协议栈能够提供电力营销异常数据自动捕获所需的一切连接协议信息,应用层、传输层、网络层、链路层以及物理层结构体同时位于电力系统以太网络外端,能够为Caffe深度学习框架提供良好的捕获节点条件。一方面可提防异常数据对于电力营销主机的打击与干扰行为;另一方面也可将异常数据信息整合成独立的传输主体,大幅节省改进深度学习网络中的数据存储空间。

异常数据拷贝可耗费大量的CPU存储空间,在自动化协议栈多层架构体系的作用下,该项处理行为可将电力系统异常数据的自动捕获时间缩短近50%。在电力系统异常数据传输速率水平保持为l0 Mb/s 的情况下,检测标签编码执行速率可达到原有捕获速率的一倍或几倍。在此情况下,异常数据的拷贝与封装行为都会对最终信息捕获结果造成直接影响,数据传输量过大或过小,都会导致捕获结果出现偏颇,从而影响改进深度学习网络的实际作用能力。

电力营销的内核访问用户空间一般不会直接对深度学习网络开放,且在实际操作时也极易受捕获节点所处位置的影响。因此,应以电力营销异常数据的原始存在节点作为捕获映射条件的初级建立依据,以自动化捕获节点的终止存在位置作为捕获映射条件的终极建立依据,两相结合在深度学习网络中实现电力系统异常数据捕获映射条件的顺利应用。

5 改进深度学习的电力营销数据异常识别研究难点

营销数据审核过程中,核算员需要依据电力营销应用系统中电量电费审核条件筛选出来的异常用户进行审核过滤。作为电量电费审核的辅助工具,审核条件的完善及准确性对审核工作质量起着十分重要的作用。改进深度学习模型需要进行实际的训练,通过大量数据来提高它的准确性和智能性。深度学习实际上就是借助建立涉及到多个隐藏层的机器学习模型,通过大量的训练数据进行反复的学习,从中提取到数据的有用特征,进而使得预测或者分类工作准确性得到有效提升的一种方法。深度模型实际上是一种方式、一种手段,而特征学习才是其目的。在深度学习算法中,对于模型结构的深度极为重视,同时对于特征学习所具有的重要意义进行了着重表现,借助逐层的特征变化使得样本在原本空间中所具有的特征进行处理,以一个新的空间特征加以表示,进而降低预测或者分类工作的难度[10]。相较于人工规则构造特征算法而言,借助大数据进行课程学习,可以对数据所蕴含的大量内在信息进行更加准确可靠的体现。

在仅能够提供有限的数据的情况下,深度学习算法无法实现对数据中所包含规律的无偏差估计,所以为显著提高算法的精度,必须给予充足的数据支持。因为深度学习中图模型的复杂化,所以使得算法的时间和复杂程度大大提高,想要切实保证算法的实时性,还需要进一步优化改善硬件设备和编程技能。

6 结 论

在改进深度学习网络的作用下,电力营销异常数据自动捕获方法可联合Caffe框架,在清洗电力数据信息的同时,对异常检测标签节点进行编码处理,且由于自动化协议栈多层架构体系的存在,待拷贝异常数据能够与最终信息捕获结果建立一一对应的捕获映射条件,不仅能够较好稳定已连接的电网应用环境,也可实现对异常传输电子量的精确化处理,具备较强的应用可行性。

猜你喜欢

编码标签节点
生活中的编码
基于图连通支配集的子图匹配优化算法
《全元诗》未编码疑难字考辨十五则
结合概率路由的机会网络自私节点检测算法
面向复杂网络的节点相似性度量*
采用贪婪启发式的异构WSNs 部分覆盖算法*
子带编码在图像压缩编码中的应用
Genome and healthcare
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮