APP下载

辨识谐波电流监测数据中异常数据的一种方法研究

2016-04-12马智远崔晓飞黄裕春臧天磊

电力系统保护与控制 2016年21期
关键词:正态布尔监测数据

马智远,崔晓飞,黄裕春,王 艳,符 玲,臧天磊

辨识谐波电流监测数据中异常数据的一种方法研究

马智远1,崔晓飞1,黄裕春1,王 艳2,符 玲2,臧天磊2

(1.广州供电局有限公司电力试验研究院,广州 广东 510410;2.西南交通大学电气工程学院,四川 成都 610031)

针对谐波电流监测数据中的异常数据影响谐波源定位和谐波责任划分准确性的问题,根据实测谐波电流数据的统计特性,采用三参数威布尔分布建立谐波电流监测数据的概率分布模型。利用最小二乘法估计三参数威布尔分布的形状参数、尺度参数和位置参数,在参数估计的基础上,得到谐波数据主体分布区间,并据此确定谐波电流异常阈值。仿真结果表明谐波电流监测数据较好地服从三参数威布尔分布,所提出的谐波电流异常监测数据辨识方法能够有效识别谐波电流监测中的异常数据。

谐波电流监测;异常数据;三参数威布尔分布;参数估计

0 引言

在电能质量监测[1-2]中,由于设备故障、仪器采集错误和外界信号干扰等因素,谐波记录数据会出现不正常变化的现象,即产生异常数据。谐波电流监测中的异常数据会影响谐波源定位和责任划分的精度,对电网决策产生不利影响;同时电能质量监测也需要辨识和记录谐波数据的这种变化,为分析设备运行状态提供依据,以保障电力系统安全。因此,根据一定的识别标准,辨识谐波监测数据中的谐波监测中异常数据的辨识是电力系统异常数据辨识的一个分支,以往研究中多将整个电力系统监测数据作为整体进行研究,将异常数据辨识与状态估计结合在一起[3-11]。

传统的异常数据辨识方法在状态估计后得到量测量残差,对其进行处理,如残差标准化、加权处理等,并设定临界阈值,通过残差的检验实现对数据的异常辨识。文献[3]采用量测突变量检测法,将前一采样时刻的量测与本采样时刻的量测量比较,若有意外突变,判定为异常数据,这种方法需要满足采样间隔内电网结构不变的前提假设。文献[4]通过量测数据协方差矩阵中元素的变化规律辨识异常数据,对防止残差淹没和残差转移有一定积极意义。文献[5]提出了一种自适应抗差最小二乘方法,利用中位数原理在线估计方程残差序列的期望和方差,实现了在线辨识。

在电力系统状态估计中,一些新方法被引入到异常数据处理过程中,文献[6]采用标准残差和相邻两采样时刻的量测数据差值作为特征量进行模糊聚类分析,用隶属度分析量测量在多大程度上属于不良数据,文献[7]采用在线核学习法检测异常数据,这类方法计算量大、过程繁琐,离实际应用尚有一定的距离。

工程中需要对生数据进行异常数据辨识,生数据异常辨识中多采用概率统计中离群数据辨识的思路,在正常情况下,谐波数据存在一定的波动范围,绝大部分数据监测结果分布在一定区间内,当数据出现在概率极低的区间时,认为这些监测数据是异常数据,在状态估计中需要减轻权重或做出预警。基于正态分布的正态样本法[12]确定异常阈值时,假设谐波量测数据满足正态分布,将偏离样本主体的测量值视为异常值,采用3倍标准差原则设定异常阈值,这种方法计算简便。文献[13]针对谐波监测数据,建立谐波数据的正态云模型,采用云模型外隶属曲线确定异常阈值。但正态分布是一种理想的分布,谐波电流既有平稳特性,也有随机性、冲击性、波动性等复杂的特性,谐波电流监测数据经常偏离正态分布,这时该类方法确定的异常阈值就不再适用。

因此,本文从实际谐波监测数据的特点出发,研究了一种基于三参数威布尔分布的异常数据辨识方法。首先,对实测谐波电流数据进行三参数威布尔分布的最小二乘估计,然后基于三参数威布尔分布的参数估计结果,推导谐波电流数据总体样本区间,确定谐波电流异常阈值。若超出总体样本区间,则判定为谐波电流异常数据。最后,通过实际的谐波电流监测数据,验证本文方法的可靠性和实用性。

1 谐波电流异常数据检测方法

谐波电流的波动特性复杂,传统的正态分布不能准确描述谐波电流监测数据的统计特性,三参数威布尔分布具有更广泛的分布形式[14-16],通常认为三参数威布尔分布在一定参数下可包括正态分布,因此采用三参数威布尔分布进行谐波数据的拟合以适应谐波电流的多种变化形式。

基于三参数威布尔分布的谐波电流异常数据检测方法,如图1所示,假设历史谐波电流监测数据为去除了异常值的数据集合,采用三参数威布尔分布的最小二乘法拟合,得到其形状参数a、尺度参数b和位置参数e的估计值。根据等概率原则和等密度原则确定异常阈值。对待检测的实测数据进行判定,阈值范围外的谐波电流数据定为异常数据。另外剔除了异常数据的监测数据可作为新的数据加入到历史谐波电流监测数据集中,以更新谐波分布的参数估计结果,为后续谐波监测数据进行异常检测提供基础,并对异常数据的分布情况进行记录以分析设备运行状态与运行环境。

图1 基于三参数威布尔分布的谐波监测异常数据检测方法Fig. 1 Detection of abnormal data in harmonic monitoring based on three-parameter Weibull distribution

2 谐波电流监测数据分布参数估计

2.1 谐波数据分布特性分析

本文针对谐波电流监测数据展开讨论,在经典的异常值识别方法中,往往假定谐波数据服从正态分布,假设每天的谐波监测数据T服从一个数学期望为、方差为的高斯分布,记为。其中正态分布的期望值m表征了数据的集中趋势,标准差s描述了数据的分布离散程度,s越大,数据分布越分散;s越小,数据分布越集中。服从正态分布的变量的频数分布由 ,ms完全决定。根据3倍标准差来判断出异常数据,即。当某次测量值it在 3m s+ 或区间外时,认为其为异常值。但实际数据往往并不完全服从正态分布,判断异常值的标准是计算数据的均值和标准差,而均值和标准差的耐抗性极小,异常值本身也会对它们产生较大影响。

三参数威布尔分布是一种常用的分布,其形状参数a、尺度参数b决定分布的形状,位置参数e决定分布的位置,具有更多样的分布形式,能够适应谐波电流的不同分布形态,如整体谐波非对称分布、谐波集中分布在均值处等。当左右时,威布尔分布近似为正态分布。 0e= 时的三参数威布尔分布的不同分布形式如图3所示。由图3可见,威布尔分布的分布形式更多变,采用三参数威布尔分布描述谐波电流的概率分布放宽了对谐波数据分布形态的严苛要求,能更真实地表现谐波数据的本来面貌,相比正态分布有更强的优越性。

图2 正态分布概率密度曲线Fig. 2 Probability density function of normal distribution

图3 三参数威布尔分布概率密度曲线Fig. 3 Probability density function of three-parameter Weibull distribution

2.2 三参数威布尔分布模型的参数估计

最小二乘法是一种实用高效的参数估计方法,因此本文采用最小二乘法进行三参数威布尔分布的参数估计[17]。三参数威布尔分布的分布函数和概率密度函数分别为式(1)和式(2)。

对式(1)变形并取对数,得式(3)。

式(3)可改写为线性形式,如式(6)。在已知 X和Y的条件下,用最小二乘法可求得对应的A和B。

式中:it为第i个谐波检测数据;n为谐波检测数据总数。

采用最小二乘法估计三参数威布尔分布的形状参数a、尺度参数b和位置参数e的方法流程如图4所示,初始化位置参数(0)0e = ,迭代精度l设为0.003。每次迭代更新三个参数的估计值,并检验位置参数的差值,当差值小于迭代精度时,输出三个参数,否则更新位置参数,令,并重新估计三个参数,直至迭代收敛。

图4 最小二乘法估计三参数威布尔分布Fig. 4 The least squares method to estimate the three-parameter Weibull distribution

3 谐波电流监测数据异常阈值的确定

3.1 威布尔分布概率密度函数

通过最小二乘法估计得到威布尔分布的三个参数,即得到了谐波电流监测数据的分布形态。对某机场污水处理厂的谐波监测数据进行最小二乘估计得到的谐波电流三参数威布尔分概率密度分布如图5所示,该组监测数据采样间隔为1 s,采样时间为1 h。由图5可见,谐波电流数据主要集中在一定的数据区间,绝大多数谐波电流数据出现在该区间内,区间外谐波电流出现的概率很小。因此可选取合理的概率密度和分布概率确定谐波电流异常阈值,作为辨识数据异常的依据。

图5 谐波电流监测数据的三参数威布尔分布概率密度曲线Fig. 5 Three-parameter Weibull probability density distribution curve of monitoring harmonic current data

3.2 等概率谐波电流异常阈值确定

在正态总体样本法[12]中,通常以3倍标准差原则确定异常阈值,此时总体样本分布概率为99.7%,即取正态概率函数中的异常数据概率为0.3%。在基于三参数威布尔分布的异常数据辨识法中设异常数据概率水平为q,认为总体样本分布概率为1q- 。正态分布中概率密度函数为对称曲线,总体样本区间的确定并无争议。威布尔分布的形态多为不对称形式,该情形下的概率区间确定方法考虑等概率法和等密度法。

等概率谐波电流异常阈值确定方法,假设在谐波的三参数威布尔分布中上下两侧的异常谐波概率水平相等,即确定异常数据概率水平为q时,上侧和下侧的异常数据分布概率均为 /2q ,如式(13)和式(14)所示。式中,lt、rt分别为下侧与上侧的异常阈值,谐波数据位于区间外时,则为异常数据。

对式(13)和式(14)分别求解,得到lt与rt的表达式,如式(15)和式(16)。

3.3 等密度谐波电流异常阈值的确定

采用等概率法确定谐波电流异常阈值时认为上下两侧的异常数据分布概率相等,未考虑密度因素。异常阈值确定的思路是确定总体中绝大多数谐波数据出现的区间为异常阈值,概率密度是衡量出现集中程度的首选指标。由于威布尔分布存在的不对称分布形式,两侧的概率密度存在差异,等概率原则得出的阈值会出现一侧异常区间概率密度大于另一侧的情况,这时考虑等密度谐波电流异常阈值确定方法。

假设在谐波的三参数威布尔分布中上下两侧的异常谐波概率密度相等,确定异常数据概率水平为q,如式(17)和式(18)所示。

由式(17)和式(18)变形可得式(19)和式(20)。

联立式(19)和式(20)形成二元指数方程组,用Matlab软件求得等密度条件下的lt与rt。

4 仿真验证

本文以某机场污水处理厂的谐波电流监测数据进行异常监测的仿真分析,其采样间隔为1 s,以前半小时谐波监测数据进行参数估计,后10 min作为待辨识数据。

本文方法和正态样本法建模结果分别如表1和表2所示。正态样本法对谐波数据进行正态拟合的正态概率分布如图6所示,本文方法对谐波电流进行三参数威布尔分布拟合的威布尔概率图如图7所示。由两图可见,正态分布概率图上、下侧各有部分数据点偏离了正态拟合曲线,威布尔分布概率图中绝大多数数据点都在拟合曲线上,下侧只有少数离群数据略微偏离拟合曲线,因此采用本文方法进行三参数威布尔分布描述谐波数据结果更准确。

表1 正态样本法建模结果Table 1 Modeling results of normal sample method

表2 本文方法建模结果Table 2 Modeling results of the proposed method

正态样本法以3倍标准差原则确定异常阈值,由表 1可见,正态样本法确定的异常阈值为和。本文方法根据第3节中方法确定异常阈值,异常概率水平q设为0.003,采用等密度原则确定阈值为和;采用等概率原则确定阈值为和0.432 6。本文方法确定的异常阈值区间小于正态样本法确定的阈值区间。

图6 谐波监测数据正态分布概率图Fig. 6 Normal probability scheme of harmonic monitoring data

图7 谐波监测数据三参数威布尔分布概率图Fig. 7 Three-parameter Weibull probability scheme of harmonic monitoring data

图8 和图9为本文方法与总体样本法对谐波监测数据的辨识结果。由图8可见,本文方法能够检测到超出上侧阈值的5个异常数据点,正态样本法并未检测到异常数据点;由图9可见,本文方法能够检测到超出下侧阈值的一个异常数据点,而正态样本法未检测到异常数据点。

图8 3次谐波电流异常检测结果Fig. 8 Abnormal test result of 3th harmonic current

图9 3次谐波电流异常检测结果Fig. 9 Abnormal test result of 3th harmonic current

将辨识出的异常数据剔除后的数据理应具有更好的概率拟合结果,采用估计标准差衡量拟合结果的准确性,威布尔分布估计标准差定义为

对原始数据、正态样本法辨识并剔除异常数据后的数据、本文方法辨识并剔除异常数据后的数据分别检验估计标准差,结果如表3所示。

表3 不同异常辨识方法的估计标准差Table 3 Estimated standard error under different methods

由表3可见,本文方法辨识处理后的数据估计标准差yS小于正态样本法辨识后的数据结果,说明本文方法具有更好的辨识效果,等密度原则的辨识效果略优于等概率原则。

5 结论

(1) 建立谐波电流监测数据的三参数威布尔分布模型,更好地适应了谐波电流的复杂分布特性,满足其分布形式的变化,根据三参数威布尔分布的概率密度函数确定谐波电流异常阈值,能够更准确地反映正常谐波电流的波动范围。

(2) 等密度原则确定谐波电流三参数威布尔分布的正常范围或异常阈值,考虑了谐波电流不均匀分布的情形,更具说服力。

(3) 对实测谐波电流数据的仿真结果表明,三参数威布尔分布对谐波电流数据的拟合精度优于正态分布,本文方法能够及时辨识谐波电流的异常变化。

[1] 张逸, 林焱, 吴丹岳. 电能质量监测系统研究现状及发展趋势[J]. 电力系统保护与控制, 2015, 43(2): 138-147.

ZHANG Yi, LIN Yan, WU Danyue. Current status and development trend of power quality monitoring system[J]. Power System Protection and Control, 2015, 43(2): 138-147.

[2] 姚致清, 于飞, 赵倩, 等. 基于模块化多电平换流器的大型光伏并网系统仿真研究[J]. 中国电机工程学报, 2014, 33(36): 27-33.

YAO Zhiqing, YU Fei, ZHAO Qian, et al. Simulation research on large-scale PV grid-connected systems based on MMC[J]. Proceedings of the CSEE, 2014, 33(36): 27-33.

[3] 刘莉, 翟登辉, 姜新丽. 电力系统不良数据检测与辨识方法的现状与发展[J]. 电力系统保护与控制, 2010, 38(5): 143-147, 152.

LIU Li, ZHAI Denghui, JIANG Xinli. Current situation and development of the methods on bad-data detection and identification of power system[J]. Power System Protection and Control, 2010, 38(5): 143-147, 152.

[4] 黄彦全, 肖建, 李云飞, 等. 基于量测数据相关性的电力系统不良数据检测和辨识新方法[J]. 电网技术, 2006, 30(2): 70-74.

HUANG Yanquan, XIAO Jian, LI Yunfei, et al. A new method to detect and identify bad data based on correlativity of measured data in power system[J]. Power System Technology, 2006, 30(2): 70-74.

[5] 薛安成, 张兆阳, 毕天姝. 基于自适应抗差最小二乘的线路正序参数在线辨识方法[J]. 电工技术学报, 2015, 30(8): 202-209.

XUE Ancheng, ZHANG Zhaoyang, BI Tianshu. Online identification of transmission line positive-sequence parameters based on adaptive robust least squares[J]. Transactions of China Electrotechnical Society, 2015, 30(8): 202-209.

[6] 吴军基, 杨伟, 葛成, 等. 基于 GSA 的肘形判据用于电力系统不良数据辨识[J]. 中国电机工程学报, 2006, 26(22): 23-28.

WU Junji, YANG Wei, GE Cheng, et al. Application of GSA-based elbow judgment on bad-data detection of power system[J]. Proceedings of the CSEE, 2006, 26(22): 23-28.

[7] 王兴志, 严正, 沈沉, 等. 基于在线核学习的电网不良数据检测与辨识方法[J]. 电力系统保护与控制, 2012, 40(1): 50-55.

WANG Xingzhi, YAN Zheng, SHEN Chen, et al. Power grid bad-data detection and identification based on online kernel learning method[J]. Power System Protection and Control, 2012, 40(1): 50-55.

[8] BROWN DO COUTTO M, STACCHINI DE SOUZA J C, RIBEIRO GUIMARAENS M A. Enhanced bad data processing by phasor-aided state estimation[J]. IEEE Transactions on Power Systems, 2014, 29(5): 2200-2209.

[9] VISHNU PRIYA K P, BAPAT J. Bad data detection in smart grid for AC model[C] // 2014 Annual IEEE India Conference (INDICON), IEEE, 2014: 1-6.

[10] LOURENCO E M, COELHO E P R, PAL B C. Topology error and bad data processing in generalized state estimation[J]. IEEE Transactions on Power Systems, 2015, 30(6): 3190-3200.

[11] TONG Shulin, WEN Fushuan, CHEN Liang, et al. Identification and justification of abnormal electric load data based on density evaluation[C] // 2011 4th International Conference on DRPT, IEEE, 2011: 776-780.

[12] 国家标准局. GB 4883-1985 数据的统计处理和解释正态样本异常值的判断和处理[S]. 北京: 中国标准出版社, 1985.

China Standard Bureau. GB 4883-1985 statistical interpretation of data-detection and handling of outlyingobservations in normal sample[S]. Beijing: China Standard Press, 1985.

[13] 钟清, 张文峰, 余南华, 等. 主动配电网谐波预测预警方法的研究[J]. 电力系统保护与控制, 2014, 42(23): 50-56.

ZHONG Qing, ZHANG Wenfeng, YU Nanhua, et al. Research on harmonic forecasting and warning of active distribution network[J]. Power System Protection and Control, 2014, 42(23): 50-56.

[14] 赵洪山, 赵航宇. 考虑元件故障率变化的配电网可靠性评估[J]. 电力系统保护与控制, 2015, 43(5): 56-62.

ZHAO Hongshan, ZHAO Hangyu. Distribution system reliability analysis considering the elements failure rate changes[J]. Power System Protection and Control, 2015, 43(5): 56-62.

[15] 刘文颖, 徐鹏, 赵子兰, 等. 基于区间估计的风电出力多场景下静态电压安全域研究[J]. 电工技术学报, 2015, 30(3): 172-178.

LIU Wenying, XU Peng, ZHAO Zilan, et al. A research of static voltage stability region in wind power scenario based on interval estimation[J]. Transactions of China Electrotechnical Society, 2015, 30(3): 172-178.

[16] 陈丽丹, 聂涌泉, 钟庆. 基于出行链的电动汽车充电负荷预测模型[J]. 电工技术学报, 2015, 30(4): 216-225.

CHEN Lidan, NIE Yongquan, ZHONG Qing. A model for electric vehicle charging load forecasting based on trip chains[J]. Transactions of China Electrotechnical Society, 2015, 30(4): 216-225.

[17] 游达章. 最小二乘法在威布尔分布的可靠性评估[J].湖北工业大学学报, 2009, 24(4): 34-35, 45.

YOU Dazhang. The application and arithmetic of the least square method in the reliability assessment based on Weibull distribution[J]. Journal of Hubei University of Technology, 2009, 24(4): 34-35, 45.

(编辑 周金梅)

A detection method of abnormal harmonic current monitoring data

MA Zhiyuan1, CUI Xiaofei1, HUANG Yuchun1, WANG Yan2, FU Ling2, ZANG Tianlei2
(1. Guangzhou Power Supply Bureau Electric Power Research Institute, Guangzhou 510410, China; 2. School of Electric Engineering, Southwest Jiaotong University, Chengdu 610031, China)

A few abnormal data stored in harmonic current monitoring data affects the accuracy of the harmonic source localization and harmonic division of responsibilities. For this problem, according to the statistical characteristics of the measured harmonic current data, the harmonic current monitoring data distribution model is established using three-parameter Weibull probability distribution, the least squares method is used to estimate the shape parameter, scale parameters and location parameters of Weibull distribution. On the basis of the three-parameter Weibull distribution parameter estimation results, the total sample interval is obtained in order to determine the harmonic current anomaly threshold. The simulation results show that Weibull distribution has better adaptability for harmonic current characteristic, the method proposed in this paper can identify the abnormal data effectively. This work is supported by National Natural Science Foundation of China (No. 51407150).

harmonic current monitoring; abnormal data; three-parameter Weibull distribution; parameter estimation

2015-10-14;

2016-01-18

马智远(1987-),男,硕士,工程师,研究方向为电能质量、新能源相关技术;E-mail: 402989002@qq.com

崔晓飞(1985-),女,硕士,工程师,研究方向为在线监测、电能质量相关技术;

黄裕春(1987-),女,硕士,工程师,研究方向为新能源、电能质量相关技术。

10.7667/PSPC151811

国家自然科学基金项目(51407150);四川省科技创新苗子工程项目(2015099);四川省科技支撑计划项目(2016RZ0079)

猜你喜欢

正态布尔监测数据
利用二元对数正态丰度模型预测铀资源总量
GSM-R接口监测数据精确地理化方法及应用
布尔和比利
布尔和比利
布尔和比利
布尔和比利
双幂变换下正态线性回归模型参数的假设检验
基于泛正态阻抗云的谐波发射水平估计
基于直觉正态云模型和最优变权的变压器绝缘状态评估
环评中引用大气现状监测数据的研究