APP下载

大数据挖掘电力系统项目管理中理论的应用

2018-11-10陈文怡

中华建设科技 2018年5期
关键词:聚类分析项目管理

陈文怡

【摘 要】本文提出了一种基于大数据理论的项目管理分析方法。在此方法研究中,将全局信息引入项目管理系统中,主要采用大数据管理、信息系统数据挖掘理论中的聚类分技术,快速准确地分析出项目进展及状况,最终完成总体分析。为项目管理分析开辟了新的应用领域。运用大数据挖掘从大型数据库信息中自动提取有效的、新颖的、潜在有用的信息,且大数据挖掘理论可为项目管理数据应用的研究做出重要贡献。

【关键词】大数据挖掘;数据分类;项目管理;聚类分析

【Abstract】This paper proposes a project management analysis method based on big data theory. In this method research, the global information is introduced into the project management system, mainly using the clustering technology in the big data management and information system data mining theory to quickly and accurately analyze the project progress and status, and finally complete the overall analysis. Opened new application areas for project management analysis. Using big data mining to automatically extract effective, novel and potentially useful information from large database information, and big data mining theory can make an important contribution to the research of project management data application.

【Key words】Big data mining;Data classification;Project management;Cluster analysis

1. 引言

(1)大数据挖掘是从大量数据中有效地发现有价值的、不明显的信息,这种涉及从数据中提取信息的过程也是一种探索性数据分析。大数据挖掘是从存储在数据库、数据仓库或其他信息库中的大量数据中发现有趣的信息,如模式、關联、变化、异常和重要结构的过程。大数据挖掘通常用于非常大的数据库,由于数据库的复杂性和容量庞大,使得它通常是不能被解读或分析。大数据挖掘的目的是从这些大型数据库中发现有用的信息,这种过程被称为数据库知识发现(KnowledgeDiscoveryinDatabases,KDD)。大数据挖掘涉及数据库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索等多学科的技术集成。大数据挖掘中的一个常见问题是查找数据属性之间的关联。大数据挖掘任务有以下类别:分类描述;关联分析;聚类分析;孤立点分析;进化分析。故障是指与观察到的变量或与设备相关联的计算参数在可接受范围内发生了偏离,即故障是一个过程异常或症状。总的来说,故障与设备或仪表的正常行为相背离。它们可能出现在基本设备或其控制仪器中,并代表着性能恶化、部分故障或全部故障。故障分析的目的是通过行为异常识别系统来保证操作成功。由于适当的过程监控,使停机时间最小化,改善了操作的安全性,降低了制造成本。一般来说,故障分析的过程可分为三个主要步骤:报警、识别、评估。电力系统是一个最复杂的人工综合控制系统,其安全、稳定、经济可靠运行,在社会经济的发展中起着非常重要的作用。

(2)为了解决项目管理系统资源平衡和任务分解落实这一难题,必须对系统本身及其复杂性不断提高分析、运行和控制水平。当发现系统从正常运行状态到异常运行故障时,其资源量可能发生显著的异常变化。异动检测触发器就是利用数据嗅探的突然变化来判别系统是否发生故障或运行异常。通过对数据测量与正常系统参数的对比,可以检测出项目管理系统资源异动位置,因此,可以实现选择性故障排除。在本研究中,全局信息将被引入后备保护系统中。在某些故障后,利用监督管理管理单元进行实时定量检测。然后对故障分量和故障区段数据进行快速准确的分析,最终完成故障隔离。

(3)基于统计理论,还将对非线性复杂系统进行大量的基础研究,采用大数据挖掘中的聚类分析技术项目管理中的资源利用检测问题。

2. 数据挖掘中的分类

分类是大数据挖掘领域的经典课题之一。聚类是将数据对象分类成一组不相交类的过程,称为簇,因此类中的对象之间具有高度的相似性。聚类是无监督分类的一个分支。“分类”是指将数据对象分配给一组类的过程。“无监督”意味着集群不依赖于预定义的类,而对数据对象进行分类。聚类分析的应用包括以下三个方面:(1)识别原始数据中的簇;(2)确定原始数据中簇的个数;(3)验证原始数据中发现的簇。聚类分析具有很强的数据分析能力,已成功应用于各个领域的研究。假设有n个样本,每个样本有m个指标,观测数据可以表示为αij(i=1nj=1m)。最常用的描述关系程度的测量是距离dij通常表示样本ξ(i)和η(j)之间的距离。

3. 基于数据挖掘的故障分析

例如,其中的热工元件是热工保护中进行信号采集的重要组成部分,热工元件能否安全可靠地运行,直接关系到热工保护的安全性和可靠性。但是,由于温度、压力流量以及阀门位置灯原因,常常会造成误发信号,使得主辅机产生保护异常的现象。有的热力发电厂中,因热工元件故障引起的热工保护异常甚至占到了所有故障发生率的一半以上,通过数据采集分析发现,主要原因是元件的质量不高、部分元件老化。因此,要加强对热工元件的选购和设计,尽量避免单点参与机组保护的模式,尽最大可能降低机组保护异常的风险。同时,从各种数据采集和分析挖掘中,可以得到其他信息源的类似分析和结论。

4. 结语

在电力项目管理系统的控制中,特别是在电力系统的广域后备保护中,保护装置的准确、快速、可靠性能的前提是相应的故障类型和故障位置可以快速识别并准确定义。在本研究中,全局信息已经被引入到后备保护系统中。基于大数据挖掘理论,主要利用聚类分析技术来寻找电量的显著变化特征。然后,对故障部件和故障部分进行快速准确的识别,最后完成故障分析。本文的主要技术贡献和创新在于将全局信息引入到电力项目管理系统中,为电力项目管理系统的故障分析开发新的应用。大数据挖掘被定义为从大型数据库中自动提取有效、新颖、潜在有用且全面的信息挖掘过程。它在学术和应用科学研究中得到了广泛的应用,在这些研究中,数据集是通过实验产生的。大数据挖掘理论的最重要特征是其跨学科性和普遍性。大数据挖掘在很大程度上与机器学习有关,在机器学习中,科学家开发算法和技术来发现和描述数据中的潜在规律。因此,大数据挖掘为信息处理、模式识别和人工智能等许多领域提供了有用的技术。

参考文献

[1] 王元卓,贾岩涛,刘大伟,等.基于开放网络知识的信息检索与数据挖掘[J].计算机研究与发展,2015,52(02):456~474.

[2] 李涛,曾春秋,周武柏,等.大数据时代的数据挖掘——从应用的角度看大数据挖掘[J].大数据,2015,1(04):57~80.

[3] 赵建华.半监督学习在网络入侵分类中的应用研究[J].计算机应用研究,2014,31(06):1874~1876.

[4] 马昱欣,曹震东,陈为.可视化驱动的交互式数据挖掘方法综述[J].计算机辅助设计与图形学学报,2016,28(01):1~8.

[5] 梁吉业,钱宇华,李德玉,等.大数据挖掘的粒计算理论与方法[J].中国科学:信息科学,2015,45(11):1355~1369.

[6] 吉根林,赵斌.面向大数据的时空数据挖掘综述[J].南京师大学报(自然科学版),2014,37(01):1~7.

[文章编号]1619-2737(2018)05-25-847

猜你喜欢

聚类分析项目管理
项目管理在科研项目管理中的应用
环境工程的项目管理
新媒体用户行为模式分析
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究
航天项目管理——高技术复杂项目管理