APP下载

基于实时多维数据的窃电行为分析平台

2021-12-14赵长军傅瑶

网络安全技术与应用 2021年11期
关键词:分析模型用电量用电

◆赵长军 傅瑶

基于实时多维数据的窃电行为分析平台

◆赵长军 傅瑶

(重庆工业职业技术学院 重庆 401120)

本文设计基于实时多维数据的窃电行为分析平台,利用大数据分析建模技术,将与用户相关的生产、生活、信用多维数据通过流水线方式注入,进而利用全景窃电行为分析模型进行计算,得到有效的窃电嫌疑用户数据、窃电特征等结果,为电力企业精准的窃电定位提供支持。

多维数据;窃电行为;大数据

1 引言

随着社会用电量的增大,各种用户的用电费用增加,窃电问题变得越来越突出。科学技术的发展也让窃电手段日益高明,方法更加隐蔽,给查处带来了很大的难度。每年因为偷电,导致供电单位损失巨大。据统计,上海一年经过查处的窃电损失超过3000万元,且还存在大量无法稽查到的情况;天津市2016年查处偷电案2256件,挽回经济损失七千万。

本文设计基于实时多维数据的窃电行为分析平台,通过Hadoop大数据分析,将与用户相关的生产、生活多维数据通过流水线方式实时注入系统中,进行全景窃电行为模型计算分析。分析模型考虑了用户的家庭情况、气候、信用等多种参数,从而得到更为精准的窃电嫌疑用户数据、窃电特征等结果,为电力企业进行准确的窃电定位提供支持,提升企业的经济效益,保证社会用电安全。

2 基于实时多维数据的窃电行为分析平台架构

本文利用云平台的计算服务实现多维度窃电行为分析的大数据计算,采用部署于云端的Hadoop大数据平台构建分析系统,作为供电企业现有的本地数据中心的扩展;利用服务总线(Service Bus)实现服务共享,整合与其他系统如气候系统、电商系统、企业经营数据系统的服务与数据共享。通过数据共享方式,实现几个分析维度数据的整合。平台架构见图1。

多维度的数据通过数据服务共享方式统一获取到系统中,进一步进行窃电行为大数据分析。基于Hadoop,将几个维度的数据建立窃电分析模型。窃电分析模型设计基于上述几个维度的数据,模型采用几个策略:

(1)用户用电历史:颗粒度分别到天、月、年,以及多年的历史用电数据。此维度作为用电情况的参照数据。

(2)近期/实时用户用电数据:与历史同期同颗粒度用电情况进行对照分析,分析是否有变化、变化的幅度、方差等。

(3)水表、气表数据:家庭的用水用气情况基本能够反映家庭的人口情况,例如人口的增加,一般会带来持续的用水、用气增加,反之亦然。此维度数据可作为判断家庭人口变化的基准,而人口增加,必定也会带来用电量的增加。当一个家庭的用水持续激增,而用电量反而在下降,同样存在一定的窃电嫌疑。

(4)气候数据:参与对历史同期用电量的分析。例如同日期、同天气、同气温的情况下,历史同期的用电变化情况。分析的粒度可以为天、周、月。特别是夏、冬两个季节,因为制冷和取暖会使用高功率设备,如果在家庭情况不产生大的变化情况下,同期连续用电量差异较大,则嫌疑增加。

(5)电商信用数据:获取此用户消费信用数据、消费力数据。电商一般对用户的消费、退货、纠纷情况建立了对应的信用制度,可以作为个人信用的参考。同时从总体上来说,消费力较好的用户,窃电概率也会降低,依次为一定权重的参照系数,分析用户情况。

(6)企业产量、营业数据:对企业用电用户来说,产量与营业数据仍然反映了用电的情况。可以获取同类型企业用电-产量比,得到单位产量的用电情况,进而分析此企业/用户用电是否偏离正常。

图1 平台架构图

3 数据分析与建模

根据上述接口,获得全量多维数据后,可加载入系统,可按照防窃电分析模型进行嫌疑分析等。例如,对几个代表性的用户进行了数据采集,多维数据如表1所示。

表1 用户数据表

从气象系统获取历年每月平均气温数据。在采集了上述数据后,加载窃电行为分析计算模型到Hadoop大数据分析引擎中。分析步骤为:

(1)计算每月平均气温偏离比,得到每月用电影响气温因子:

即计算出当前月份往前12个月的平均气温与上轮对应12个月份的平均气温偏离比。例如当前为6月,平均气温为25度,而对应偏离比为|(26.5-25)/26.5| = 0.0566。

(2)获得用户信用值

每个用户都有自己的信用值,主要参考阿里提供的芝麻信用。芝麻信用是一个综合的信用评估报告值,结合了各个的资产、贷款、信用卡、生活缴费等多个维度的信用情况,具有很好的参考意义。

(3)计算家庭人口变化系数

用户家庭的水、气的使用情况往往随着人数变化而变化,根据抽样,可近似为线性增长。

(4)计算预估用电值

预估用电值,主要反映用户在气温变化、人口变化情况下,预计的本月用电量。是根据过去两年对应月份用电量,及家庭人口变化系数和每月用电影响因子,计算出预估本月用电量。

(5)计算窃电嫌疑评估值

根据预估的用电量,对比当月用电量,结合用户信用值,得到每个用户嫌疑评估值。

通过上述验证数据,可得出用户的窃电行为评估值结果。

4 结论

本文通过设计基于实时多维数据的窃电行为分析平台,将各类系统的数据进行数据集成,利用云计算大数据模型进行分析。构建窃电行为分析模型,将数据分析过程与结果提供给供电单位,让他们能够从中提取到自己关心的具有窃电嫌疑个体信息,开展针对性的稽查工作。利用大数据与云计算技术的优势整合现有的各类数据,建立云端的窃电行为分析系统,其有别于传统的部署大量用电计量防窃终端的方式,也有别于拉网式的人工稽查方式,让数据分析为工业生产服务。平台不仅仅基于现有的用电数据,更是引入了多维度的信息,包括天气变化对用电的影响、个人信用因素的影响、生产经营数据的影响等,这些数据让分析的结果更准确,更有实用价值。

[1]张素香,刘建明,赵丙镇,等. 基于云计算的居民用电行为分析模型研究[J]. 电网技术,2013(6).

[2]郝然, 艾芊, 肖斐. 基于多元大数据平台的用电行为分析构架研究[J]. 电力自动化设备,2017(8).

[3]徐磊, 杨秀, 张美霞. 基于数据挖掘的工业用户用电行为分析[J]. 电测与仪表, 2017(16).

[4]李端超, 王松. 基于大数据平台的电网线损与窃电预警分析关键技术[J]. 电力系统保护与控制,2018(5).

猜你喜欢

分析模型用电量用电
02 国家能源局:1~7月全社会用电量同比增长3.4%
01 国家能源局:3月份全社会用电量同比增长3.5%
基于BERT-VGG16的多模态情感分析模型
安全用电知识多
国家能源局:3月份全社会用电量同比下降4.2%
对输配电及用电工程的自动化运行的几点思考
为生活用电加“保险”
用电安全要注意
层次分析模型在结核疾病预防控制系统中的应用
全启发式语言分析模型