APP下载

云计算下供电监控数据压缩存取方法研究

2019-11-27王建玺

通信电源技术 2019年11期
关键词:计算技术聚类对象

王建玺,岳 圆

(1.平顶山学院 计算机学院,河南 平顶山 467000;2.中国人民解放军61267部队,北京 101114)

0 引 言

电力设备的老化损坏是停电事故的主要原因,为了能够及时发现电力设备的故障和问题,对供电系统的供电监控数据进行合适的压缩存取就非常重要。通过对供电监控数据的压缩存取,可以及时获得供电系统的全部信息[1]。

为了得到有价值并能反应供电系统状态的特征,需要从格式多样、规模巨大及价值密度低的大数据中提取有用的数据并进行分析。云计算技术能够有效提高供电系统状态评估水平,显著减少停电等电网安全事故发生率。

1 云计算下供电监控数据压缩存取方法设计

1.1 引入Spark云计算技术

Spark云计算技术由数据存储、API及资源管理等3个主要组件构成[2]。Spark云计算技术最具有特点的一个概念就是基于弹性分布的供电监控数据集。基于弹性分布的供电监控数据集是一个供电监控数据的集合,可以看做是Spark云计算技术一个特殊的定义类,Spark云计算技术主要的操作是围绕基于弹性分布的供电监控数据集来进行的[3]。从原文件中获取需要的供电监控数据来创建基于弹性分布的供电监控数据集,并将供电监控数据存储到其中,可以通过对Spark云计算技术进行转换操作获得基于弹性分布的供电监控数据集。

1.2 构建基于Spark云计算的聚类算法

基于Spark云计算的聚类方法根据供电监控数据集在供电系统中分布的稠密程度进行聚类,聚类开始前,数据集中的供电监控数据不需要设定簇的数量,因此适合对云计算下的供电监控数据进行压缩和存取。其中DBSCAN算法是基于Spark云计算的聚类算法中具有代表性的聚类算法,DBSCAN算法操作步骤如下。

输入为供电监控数据集D,参数选择MinPts,ε输出为簇集合。将供电监控数据集中的所有数据对象都标记成为unvisited;从供电监控数据集中随机选取一个从未被访问的供电监控数据对象p,将供电监控数据对象p标记成已经被访问过的数据对象;如果被检测的对象属于供电监控数据对象p的ε邻域,且供电监控数据点在ε邻域内的个数大于等于MinPts个;创建新的供电监控数据聚类簇A,并把供电监控数据对象p添加到其中;令N是供电监控数据对象p的ε邻域中所有供电监控数据的集合;将N中供电监控数据点标记为pi;如果供电监控数据点pi没有被划分成为聚类簇,将供电监控数据点pi添加到另一个聚类簇C中,并输出;将供电监控数据对象p标记为噪声数据,Untill供电监控数据集D中不包含未被访问过的供电监控数据对象。

1.3 确定供电监控数据压缩存取格式

传统关系型数据库中的供电监控数据压缩存储格式也是多种多样的。供电监控数据检索速率和检索方式与数据的压缩存取格式关系密切。实际的数据存储检索需求是存取格式的设计根据,对一段连续时间内的供电监控数进行查询是供电监控数据查询的特点,其包括查询某段时间的平均值、最大值及最小值,或者是在一段时间内符合查询要求的数据。例如,查询某一月某人的网上银行消费记录,就是对单点数据的连续调查。还有一种情况是对多个对象同一时间段的数据查询,如对3个人1个月业绩的对比查询,可以得到想要的数据。

图1 云计算下供电监控数据压缩存取流程图

1.4 实现云计算下供电监控数据压缩存取

根据供电监控数据压缩存取格式的确定,选择一种适合云计算下的供电监控数据压缩存取格式,基于Spark云计算技术的引入,构建基于Spark云计算的聚类算法,实现云计算下供电监控数据压缩存取。云计算下供电监控数据压缩存取流程如图1所示。

2 实例验证

为了验证本文方法的可靠性,与传统压缩存取方法进行对比实验。

2.1 实验方法及步骤

为了保证本次实验结果具有鲜明的对比性,实验过程中,选择同一种供电监控数据压缩存取格式,保证供电监控数据的完整性,实验的具体操作步骤如下。选择一套供电系统,在供电系统中选取10组供电监控数据,实验开始前检查供电系统的运行是否稳定;为了提高本次对比实验的精准度,引入供电监控数据压缩存取效率作为本次实验的对比指标;将10组供电监控数据分别以两种方法进行对比;记录实验结果并绘制供电监控数据压缩存取效率曲线,如图2所示。

图2 供电监控数据压缩存取效率曲线

2.2 实验结论

由图2可知,两种压缩存取方法的供电监控数据压缩存取能力有很大差别,本文方法对于供电监控数据具有较高的压缩存取能力,平均压缩存取效率为87.35%,而传统压缩存取方法的压缩存取能力明显低于本文设计的压缩存取方法。

3 结 论

本文对云计算下供电监控数据压缩存取方法进行了研究,通过引入Spark云计算技术,构建聚类算法,实现云计算下供电监控数据的压缩存取。经对比验证,本文方法在压缩存取方面优于传统方法。

猜你喜欢

计算技术聚类对象
涉税刑事诉讼中的举证责任——以纳税人举证责任为考察对象
判断电压表测量对象有妙招
基于5G和边缘计算技术的智能仓储数字化管理平台
云计算技术发展分析及其应用探讨
基于K-means聚类的车-地无线通信场强研究
攻略对象的心思好难猜
云计算技术在现代化办公系统中的应用
基于高斯混合聚类的阵列干涉SAR三维成像
基于物联网和云计算技术的葡萄园监测系统研究
基于Spark平台的K-means聚类算法改进及并行化实现