APP下载

元数据在电力统计管理系统中的应用研究

2018-05-10刘道新张启伟朱承治马向辉

经济研究导刊 2018年11期
关键词:关口电量指标

刘道新,张启伟,朱承治,马向辉,程 霄

(1.国家电网公司,北京100031;2.北京中电普华信息技术有限公司,北京100085;3.国网浙江省电力公司,杭州 310007)

引言

“克强指数”是反映经济现状的经济指标,主要是结合耗电量、铁路货运量和银行贷款发放量三个指标,其中,铁路货运占25%,35%为银行贷款,40%为用电。与GDP的统计相比,该指标能够更加精确地反映我国经济现实状况,主要是由于三个指标涉及电网、铁路、银行的具体业绩核算,与地方政府的GDP统计工作无关,也不会有作假掺水的空间和动机,故而所取得的具体数据也更为真实,更能够反映经济的走势。“克强指数”不仅很快用于MSCI(摩根士丹利资本国际)和花旗银行,更是受到了我国各级政府的密切关注。在这三个指标里,电量是一个影响经济走势的最重要指标,是对宏观经济发展判断的基础,因此电网企业主导的电力统计受到格外关注。同时,外界对电力统计数据科学性、准确性和及时性的要求也在不断增加。

传统的电力统计工作主要按照统计报表制度见图1所示,即由电网企业总部制定各省报送的表格,各省再根据本省情况,制定本省统计表格,并部署各地市统计工作,各地市组织下属县级供电企业开展统计填报工作,并逐级汇总核实后上报,最后经公司总部汇总后发布。

图1 传统以表汇表的多层级固定统计模式

传统的业务模式已无法满足电力统计精细化、集约化管理的新要求,主要问题表现在以下几方面。一是统计数据采用逐层上报的方式,效率低、流程复杂、时效性差,错误难以追踪。二是基层县公司仅上报统计结果数据,总部不能直接查询明细数据,无法实现数据的集中管理控制。三是当前统计业务基层单位信息没有统一的管理规范和流程,缺少统计单位名录的管理功能。

本文针对上述问题,将元数据技术应用于电力统计分析领域,利用元数据方法提出电力统计数据标准,建立基于关口电量数据的指标定义、计算方法和取数规则,并借助信息化系统平台手段,实现电力统计数据的自动获取、自主统计和自由展示。

一、元数据模型

(一)元数据定义

元数据(Metadata)一词本身是随着因特网的发展而产生的,最早见于1988年美国航空与宇宙航行局编辑出版的《目录交换格式》中[1-4]。元数据与传统图馆编目标推的不同之处在于,它除了具有描述功能外,还具有控制、管理信息资源的能力。元数据是适用于描述任何网络数据和资源,促进网络信息资源组织和获取的数据。

元数据主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件纪录等功能。它又被称为“数据的数据”,是对基础数据元的说明,通过提供理解和精确解释数据元所需要的信息,使数据的使用变得准确而高效。用户在使用数据时可以首先查看其元数据以便能够获取自己所需的信息。因此,我们研究的元数据是建立在数据元的基础上进行的。

(二)基于元数据的系统应用架构

元数据作为一种对数据资源的内容、结构、价值、访问、使用等各个方面进行描述的工具,提供了有效的资源组织方法[5-7]。其目标是通过对资源进行标准、有效的描述和组织,使得数据可以得到高效的流动和使用。数据生产者依据元数据对资源进行有效的管理和维护,而数据使用者则通过元数据方便地发现和挖掘有价值的信息。

元数据是关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义、目标定义、转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息,所有这些信息都应当妥善保存,并很好地管理,为数据仓库的发展和使用提供方便。

元数据在系统中一般的应用体系见图2。客户端通过业务数据目录对象模型从元数据库中取得元数据;通过调用已定义的查找算法应用到业务系统中,进而获得所需的结构化数据,最终以用户友好的方式将数据展现给用户。由于元数据也是数据,因此可以用类似数据的方法在数据库中进行存储和获取。

图2 元数据在统计系统中的应用

总之,元数据是描述信息资源或数据等对象的数据,其使用目的在于:识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。

二、电力统计元数据体系

(一)电力统计元数据对象

针对当前电力统计工作中存在的问题,利用元数据方法建立电力统计指标标准,加强元数据标准在统计活动中的应用,实现统计元数据的规范化和标准化管理,生成用来定义、描述和解释统计过程中产生的各类实体统计数据,并对实体数据进行统一的规范和定义,为统计数据和元数据的集成提供基础;在此基础上,逐步完善研究制定涵盖统计设计管理、数据采集处理和数据发布等统计生产全过程的元数据标准,提高统计能力和统计工作的规范化和标准化水平。

建立元数据标准首先要确定数据的对象,当前电力统计重点是电量数据的收集与分析。综合考虑到电量数据的来源、属性等,提出了包括单位、行政区、电厂、变电站、线路、关口等7个统计对象,针对这7个统计对象制定元数据标准,并分别形成单位元数据、行政区元数据、电厂元数据、变电站元数据、线路元数据和关口元数据。

在以上7个统计对象中,电厂、变电站、线路均为电力系统的设备对象,单位和行政区为范围对象;而关口表是电量计量信息对象。电量统计作为电力统计的核心内容,也是计算“克强指数”的关键内容。接下来本文将重点探讨基于关口明细数据和单位对象范围下的电量元数据统计方法。

(二)元数据标准

1.关口元数据

关口表是各种交换电量计量的基础设备,是电量统计的基础数据元,因此关口表是电量统计工作的重要研究对象。经过梳理各单位管理的关口基础信息,并将此类基础属性信息进行类型划分和属性归纳,建立全面反映关口表信息的关口元数据,包括关口类型、管理单位、供受关系、电压等级、计量点类型、开始结束时间等信息,及实际应用业务场景。关口元数据结构如表1所示,通过建立统一的关口元数据,保证电力系统内上亿只关口表具有统一的数据管理格式,为大量基于关口数据的指标获取和指标数值计算分析奠定基础。

2.单位元数据

表1 关口元数据

单位元数据主要反映供电电网的基本信息,并可根据行政区域进一步形成各级行政单位。建立单位元数据的主要目的是为随后电力统计工作确定统计的范围,并利用元数据制定单位信息的规则,为基于元数据的统计口径和区域奠定基础。单位元数据主要包括单位名称、社会信任代码、所属类型、所属电网、单位类型、县公司类型、资产属性、所属行业、所属行政区等管理类信息。

(三)电量元数据模型

通过调研各级单位、各业务部门管理的统计指标,以关口电量计算模型为基础,梳理电网中售电、用电、供电、购电等统计基础数据源的业务逻辑关系,明确各业务统计指标的数据责任单位及审核单位,深入梳理出电力统计指标数据源,制定出电量统计的元数据标准模型[8-12]。该模型主要基于关口元数据、单位元数据,利用关口档案数据、关口明细电量数据,供电、购电业务数据,以及售电、用电等营销结算指标数据。本文引入实体-联系图(Entity Relationship Diagram,简称E-R图),用来描述现实世界的概念模型。将关口、单位作为实体型数据,利用现实世界中实体属性之间存在的联系,建立实体型数据与概念数据的对关系,即基于统一单位元数据和关口元数据,利用具体数据信息的属性实现供电量、售电量、用电量和购电量等关键信息的组合计算。

电量数据集E-R图见图3所示,通过统计全系统的关口电量数据表,在关口信息统计的基础上,采用发电厂出口、电网联络线受入点的关口表统计购电量指标,采用用户变、营销系统的关口表统计供电量指标;在供电公司为对象,统计单位代码下售电量和用电量指标;以不同用户为对象,统计不同用户关口电量耗电量指标。总之,通过建立电量元数据统计模型,可实现多口径、多时间段、多范围的电量信息采集和计算,为统计系统构建提供技术支撑。

图3 电量元数据统计实体-联系图

三、电力元数据统计系统

(一)统计系统架构

运用数据信息平台技术建立基于元数据的统计系统,形成具有可操作、执行性强的体系架构。该架构对照元数据的架构体系,可以分为三大环节和层级,第一层为数据层,第二层为指标管理层,第三层为应用挖掘层。具体架构是在全面采集掌握外部环境信息、系统运行信息、企业经营信息、统计管理信息的基础上,基于元数据模型建立统计计算的采集接口,经过元数据处理后获得各分类属性的统计指标,并以此为基础,利用数据分析技术进行数据关联度智能分析挖掘。该体系架构主要可实现以下几项功能:一是数据采集功能;二是指标自动统计计算功能;三是数据库管理功能;四是趋势分析预测;五是价值数据挖掘功能。

(二)统计系统功能

元数据统计系统以县公司为开展统计业务的最小统计对象,开展明细数据、指标数据统计工作,并集中存储在统一数据库,地市、省、总部基于统一数据库中的县统计指标、明细数据,开展制度报表、数据查询、统计分析工作;系统通过单位、指标、模型等管理功能辅助规范统计业务。元数据电力统计平台系统功能如图4所示。统计平台从运检、调度、营销等业务系统实时接入基础源数据,提取出包括关口、单位、设备明细数据;县公司利用电力系统统一采用的元数据标准管理大量基础数据,并根据元数据统计模型和指标设置情况进行自动分析计算。并形成统一的包含明细数据的数据库,各级单位可实现本单位以及下级单位明细数据、统计指标的查询和溯源。在此基础上,形成制度报表、统计分析、多维管理查询、穿透查询、指标台账等工作,并提供图表展示和高级分析等功能。在系统维护和管理方面,构建了指标管理、模板管理、单位管理、模型管理、数据审核校验、权限管理等六大管理模块,根据实际需求维护元数据信息、管理信息等内容,保证系统的可扩展性和兼容性。

(三)统计系统应用

图4 电量元数据统计实体-联系图

基于以上研究,系统架构以数据采集、存储、处理和分析为技术依托,融合实时数据库、主题分析库(OLAP)和商业智能(BI)等综合优势,建立全业务的统计分析管理应用体系,并以平台SOA/ESB数据总线为核心,对其他相关应用提供数据接口服务和应用集成服务,建立基于元数据的信息系统分析界面,如图5所示。

图5 电力统计信息系统分析界面

基于元数据技术统计系统,实现各级单位报表自动生成,取消报告加工与报送环节,实现任意口径、任意时点动态生成,如图6所示。基于该系统应用,在完成定期月度报送常规口径电量统计工作以外,还可以根据地区、口径、时间段等多种组合形式的电力统计分析,并且该系统指标计算结果是源自于实际运行数据,无人工统计和干预,减少了人为的统计失误,提高了统计工作的效率。另外,系统应用可以随时查询、自由制定、自动导出。

图6 电量元数据统计系统应用效果展示

结语

本文针对电力统计中存在的诸多问题,在全面梳理电力统计指标数据源基础上,研究提出统一的电力统计七大类元数据对象,并以此为基础,围绕电量统计提出了关口元数据和单位元数据标准,建立了基于关口和单位的电量元数据统计计算模型。最后,基于元数据的统计分析模型,对数据仓库的数据标准化抽取和解析建立了电力元数据统计系统,提出了统计平台架构和功能实现方法,形成了专业的自主统计报表制作功能。基于元数据的电力统计系统方法改变了传统的统计模式,实现了统一数据库管理,有利于加强数据分析、指导决策应用,为发挥统计数据价值、展现电力与经济内在规律、服务政府决策提供有力支撑。

参考文献:

[1]Bruce TR,HillmannDI.The Continuum of Metadata Quality:Defining,Expressing,Exploiting[J].In Metadata in Practice,American Library Association,2004:238-256.

[2]张晓林.元数据研究与应用[M].北京:北京图书馆出版社,2002.

[3]陈力娟.浅谈元数据及其应用[J].中国统计,2006,(11):43-44.

[4]Agrawal N,Bolosky W J,Douceur J R,et al.A five-year study of file-system metadata.Trans.Storage,2007,3(3):9.

[5]曹蓟光,王申康.元数据管理策略的比较研究[J].计算机应用,2001,21(23):3-5.

[6]梅海燕.元数据的研究进展[J].现代图书情报技术,2002,(4):17-21.

[7]戴超凡,等.数据仓库中的元数据管理[J].计算机工程与科学,2003,25(4):54-57.

[8]郭创新,等.电力信息技术[M].北京:科学出版社,2015.

[9]李晓东.电力企业数据中心数据管控的研究与应用[J].ELECTRIC POWER IT,2012,(8).

[10]王颖.企业统计数据质量影响因素研究[D].杭州:浙江大学,2006.

[11]陈苏,柏文阳,徐洁磐.一种新的数据质量模型的研究[J].计算机应用研究,2005,(7):52-54.

[12]安弟.电力行业统计分析系统设计[J].科技展望,2015,(3):69.

猜你喜欢

关口电量指标
储存聊天记录用掉两个半三峡水电站电量
主要宏观经济指标及债券指标统计表
主要宏观经济指标及债券指标统计表
关口前移赢主动
《妙笔蓝水晶奇案》第十回 轻松闯关口
主要宏观经济指标及债券指标统计表
主要宏观经济指标及债券指标统计表
节假日来电量预测及来电量波动应对策略