APP下载

基于有偏t分布ARMAX模型的短期电价预测

2011-05-10王瑞庆季文天

电网与清洁能源 2011年2期
关键词:电价残差负荷

王瑞庆,季文天

(1.海南软件职业技术学院 软件工程系,海南 琼海 571400;2.安阳师范学院 计算机与信息工程学院,河南 安阳 455000)

社会主义市场经济环境下,价格在资源优化配置中发挥着基础性作用。电力市场条件下,电价的形成机制是否合理、价格体系结构是否健全关系到整个电力市场是否能够健康、平稳运行。

电价是电力市场供求平衡时形成的出清价,不仅受气象、系统负荷、发电成本、可用发电容量、输电网络阻塞等客观因素的影响,还受到市场交易规则、参与者的竞价策略及其对价格的心理反映等主观因素的影响[1],这些因素使得准确的电价预测较为困难。当前的预测方法主要包括通过模拟电力市场竞争规则来预测市场出清电价的长期预测方法和依据大量历史数据建立反映电价变化规律数学模型的短期预测方法[2]。

神经网络对非确定性、非精确性规律具有自适应能力,能够有效地处理多变量和非线性问题,是目前研究较多的一种短期电价预测方法[3-10]。文献[3-4]使用基于BP(Back Propagation)和LM(Levenberg-Marquardt)训练方法的3层前馈神经网络对维多利亚、西班牙和加利福尼亚的现货电价进行了预测。文献[5]指出高斯径向基函数网络比传统网络具有更快的学习速度和更好的逼近性能,更加适合于短期电价的预测。文献[6-10]分别提出了神经网络与模糊逻辑、Kalman滤波、支持向量机等相结合的短期电价预测方法,结果表明混合预测方法比单独使用神经网络具有更好的效果。但由于神经网络方法的参数调整不够灵活,学习速度较慢,在实际应用中遇到了困难。

时间序列方法需要的历史数据相对较少,能准确地反映历史电价变化的连续性,比较常用的有自回归滑动平均(ARMA)和自回归积分滑动平均模型(ARIMA)。文献[11]建立了一个以负荷作为外生变量的自回归滑动平均模型(ARMAX),对PJM电力市场未来24 h的现货电价作出了预测。文献[12]注意到大多数电价序列均是非平稳随机过程,建立了基于ARIMA的电价预测模型,但该模型没有考虑负荷等因素对电价的影响。文献[13]注意到不同时段也是一个影响电价变动的重要因素,建立了一个基于ARMA的分时段电价预测模型,使得对价格飞升(Price Spikes)的预测准确度得到了很大提高。文献[14-15]分别建立了将误差校正、小波变换与ARIMA相结合的电价预测模型。文献[16]建立了一个综合考虑电价序列的非平稳、分时段和负荷影响的传递函数模型,进一步提高了电价预测的准确性。但这些模型大都基于残差服从正态分布的假设,不能有效地处理电价的有偏厚尾性,同时定阶困难,待估参数较多,难于大量应用。

在对电力市场现货电价的影响因素和波动规律综合分析的基础上,本文提出了一种基于有偏学生t分布ARMAX模型的短期电价预测方法。该方法通过有偏学生t分布、正弦函数、负荷平方来描述现货电价分布的有偏厚尾性、多重周期性及其与负荷之间的非线性相关性,很大程度上降低了模型的阶数,减少了模型的待估参数。对PJM电力市场2007年6月1日至2010年9月9日历史数据的算例分析表明,该模型计算量小,待估参数少,可准确反映电价的变化规律,具有一定的实用价值。

1 预测模型及求解方法

1.1 预测模型

时间序列分析是根据历史数据建立描述时间序列变化过程的规律性的数学模型,然后根据建立的数学表达式进行预测,其基本假定是未来是过去的延续。时间序列方法的主要难点在于如何选择恰当的模型,如果模型选择不准确,即使参数估计再准确,预测效果也不会太好。

电价预测模型可以看作一个多输入单输出系统,输出为当期电价,输入为系统负荷、参与者的报价策略、燃料价格、季节、气候等影响因素。考虑到系统负荷和电价在各个电力市场中均是公开信息,因此本文选择当期负荷、历史负荷与历史电价作为输入,并使用时间序列模型对这一系统进行描述。设pt表示t期现货电价,则描述电价变化的时间序列模型可表述为:

式中,B为滞后算子;dt表示t期系统负荷;ut表示t期残差;m为电价一年内变化的周期数;p、q、r、s分别为电价、残差、负荷和负荷平方的滞后阶数;dwkd为周一到五取值为1、周六日取值为0的虚拟变量;琢=(琢0,琢1,琢2,琢11,…,琢m1,琢12,…,琢m2)、渍=(渍1,渍2,…,渍p)、兹=(兹1,兹2,…,兹q)、酌=(酌1,酌2,…,酌r)、资=(资1,资2,…,资s)表示待估参数;f(t)描述电价序列的趋势和季节性变化,通过使用多个正弦函数可以允许电价序列在1年内有多个周期,每个周期的幅度和峰值位置分别由琢i1和琢i2描述。

1.2 模型定阶

通过对去趋势和周期变化后的电价序列pt-f(t)的自相关函数和偏自相关函数的分析,可以确定p和q的初始取值,r和s的初始取值可以通过观察电价序列与负荷、负荷平方的趋势图加以确定。

构成时间序列的每个序列值之间的简单关系称为自相关,可以使用自相关系数进行描述。对于给定时间序列{yt},k期自相关系数籽k为:

在给定yt-1,yt-2,…,yt-k+1条件下,yt与yt-1之间的条件相关关系称为偏自相关,可以使用偏自相关系数籽kk描述。其计算公式为:

AR(p)序列的自相关函数随着滞后期的增加,呈现指数或者正弦波衰减,逐渐趋近于0,而其偏自相关函数在k>p后全都趋向于0。因此,可以根据偏自相关函数的截尾性来辨识AR(p)模型的参数p。

MA(q)序列的自相关函数在k>q后全部趋向于0,而其偏自相关函数呈指数衰减,具有拖尾性。因此,可以根据自相关函数的拖尾性来辨识MA(q)模型的参数q。

1.3 参数估计

设ut=滓zt,其中滓表示残差ut的均方差,zt是均值为0、方差为1、符合有偏学生t分布的白噪声序列,则ut的条件概率密度函数可表示为:

式中,祝表示Gamma函数;姿沂(-1,1)和浊沂(2,肄)为有偏学生t分布的偏度和自由度;It-1表示t期的可用信息集;当zt<-a/b时1依姿取值1-姿,否则取值1+姿。若记ξ=(琢,渍,兹,酌,资,浊,姿,滓2),则条件对数似然函数可表示为:

式中,n表示样本容量;lt(ξ)=lng(ut|It-1)表示t期的条件对数似然函数。通过最大化L(ξ),即可获得模型参数ξ的估计值ξ赞。

需要指出的是,由于模型中包含残差ut的滞后项,L(ξ)实际上是关于待估参数的非线性函数,求解结果对初始值的选取非常敏感。为了增加估计结果的精度,本文采用逐次逼近方法,即先求解简化模型,然后以其结果作为求解复杂模型的初始值。

1.4 模型检验

式中,ξ0为待估参数的真值;H为Hessian矩阵,可通过H(ξ0)抑鄣L(ξ)/鄣ξ鄣ξ'|ξ=ξ赞估计。计算出ξ赞的方差后,即可利用t统计量对待估参数的显著性进行检验。

对残差符合有偏学生t分布的假设可能并不符合其真实分布,因此有必要给出估计参数ξ赞的稳健方差,以便计算估计参数ξ赞的渐近有效置信区间。ξ赞的稳健方差为矩阵赘赞的对角元素。

式中,V赞=鄣L(ξ)/鄣ξ(鄣L(ξ)/鄣ξ)'|ξ=ξ赞。

Nyblom统计量可用于检验模型的稳定性[17],其渐近分布只依赖于待估参数个数。Nyblom检验的原假设是全部待估参数是稳定的,其备择假设是至少有1个待估参数是不稳定的。Nyblom统计量WN可表示为:

式中

Nyblom统计量也可用于检验单个系数的稳定性,相应于第k个待估参数的Nyblom统计量WN,k为:

式中,Skt为St的第k个元素;V赞kk为V赞的第k个对角元素。

Cramer-Von Mises统计量可用于检验残差是否符合有偏学生t分布的假设。设偏度为姿、自由度为浊的有偏学生t分布的累积分布函数为FN(z),残差的实际累积分布函数为F(z),则Cramer-Von Mises统计量WCVM可根据式(10)进行估计:

1.5 拟合精度评估

一般而言,电价序列预测模型是一个参数时变模型,其参数均需用更新的数据进行辩识,以便提高电价预测的准确性。本文采用平均绝对百分比误差(MAPE)来度量模型的预测精度,其表达式为:

式中,p赞t表示t期预测电价;pt表示t期的电价观测值;n是预测电价的数目。

2 PJM电力市场实证研究

本文使用的研究样本来源于美国PJM电力市场2007年6月1日至2010年9月9日的日平均现货电价和日平均负荷,样本总数为1 197。表1给出了日平均现货电价和日平均负荷序列的描述性统计结果。从表1可以看出,2个样本的偏度系数和峰度系数都显著异于正态,现货电价和负荷序列均呈现明显的右偏形态,同时具有较为明显的尖峰厚尾特征。J-B统计量非常显著,说明样本期间内电价和负荷的分布具有非正态性。

表1 样本数据的描述性统计结果

通过对样本数据的趋势图及相关系数的初步分析,将式(1)中的的预测模型具体化为(m,p,q,r,s)分别取值(2,4,4,1,1)。为便于比较有偏学生t分布与正态分布模型的估计结果,表2和表3分别给出了剔除模型中在95%置信水平上不显著的估计参数后的极大似然估计结果。从表2和表3中可以看出,有偏学生t分布模型和正态分布模型的MAPE分别为6.2%和6.627%,与文献[11-16]的拟合精度大致相当,但其待估参数却远少于文献[11-16]中所建模型的待估参数,这在一定程度上降低了模型的复杂性,增强了模型的实际应用价值。

从表2和表3还可以看出,有偏学生t分布模型相对于正态分布模型的MAPE和最大似然值分别提高了0.425和146.36,表明有偏学生t分布模型相对于正态分布模型具有较好的拟合效果。从表3可见,t分布的自由度为2.652 5,说明残差具有明显的厚尾特征,但Cramer-Von Mises统计量6.645 3仍大于其99%置信限的临界值0.333,表明有偏学生t分布仍不能很好地描述残差的实际分布。

表2 正态分布假设的估计结果

表3 学生t分布假设的估计结果

从表3可见,残差的标准误滓和自由度浊的Nyblom统计量分别为10.605和10.544,均大于其99%置信限的临界值0.748,表明关于方差滓2和自由度浊为常数的假设与实际不符,这从残差的概率分布(见图1)也可得到验证。因此,应采用什么形式的分布函数来更好地描述残差的实际分布,是下一步的研究重点。

图1 残差的概率密度

3 结语

在对电力市场现货电价的影响因素和波动规律综合分析的基础上,本文提出了一种基于有偏学生t分布ARMAX模型的短期电价预测方法。该模型采用有偏学生t分布、正弦函数、负荷平方来描述现货电价分布的有偏厚尾性、多重周期性及其与负荷之间的非线性相关性,在一定程度上降低了模型的阶数及其待估参数的个数。对PJM电力市场2007年6月1日至2010年9月9日的历史数据的算例分析表明,该模型计算量小,待估参数少,能够准确反映电价的变化规律,具有一定的实用价值。但本文模型关于残差符合均值为0、方差、偏度和自由度为常数的有偏学生t分布的假设与残差的实际分布不太吻合,这在一定程度上降低了模型的预测精度,因此如何进一步改进模型提高拟合优度是下一步要解决的主要问题。

[1]刘达,牛东晓,杨光.电力市场中的电价影响因素[J].陕西电力,2009,37(1):9-12.

[2]陈思杰,周浩.电力市场电价预测方法综述[J].继电器,2006,34(11):54-60.

[3]SZKUTA B R,SANABRA L A,DILLON T S.Electricity Price Short-Term Forecasting Using Artificial Neural Networks[J].IEEE Trans on Power Systems,1999,14(3):851-857.

[4]CATALAO J P S,MARIANO S J P S,MENDES V M F,et al.Short-Term Electricity Prices Forecasting In a Competitive Market:a Neural Network Approach[J].Electric Power System Research,2007,77(10):1297-1304.

[5]GUO J J,PETER B L.Selecting Input Factors for Clusters of Gaussian Radial Basis Function Networks to Improve Market Clearing Price Prediction[J].IEEE Trans on Power Systems,2003,18(2):665-672.

[6]HONG Y Y,HSIAO C Y.Locational Marginal Price Forecasting in Deregulated Electricity Markets Using Artificial Intelligence [J]. IEE Proc on Gener Transm Distrib,2002,149(5):621-626.

[7]CLAUDIA P R,GEORGE J A.Energy Price Forecasting in The Ontario Competitive Power System Market[J].IEEE Trans on Power Systems,2004,19(1):366-374.

[8]ZHANG Li,PETER B L.Neural Network-Based Market Clearing Price Prediction and Confidence Interval Estimation With an Improved Extended Kalman Filter Method[J].IEEE Trans on Power Systems,2005,20(1):59-66.

[9]AMJADY N.Day-ahead Price Forecasting of Electricity Markets by a New Fuzzy Neural Network[J].IEEE Trans on Power Systems,2006,21(2):887-986.

[10]FAN S,MAO C,CHEN L.Next-Day Electricity Price Forecasting Using a Hybrid Network[J].IEE Proc on Gener Transm Distrib,2007,1(1):176-182.

[11]王瑞庆,王晛,李渝曾.基于时间序列ARMAX模型的短期电价预测方法[J].华东电力,2009,37(5):727-730.

[12]CONTRERAS J,ESPINOLA R,NOGALES F J,et al.ARIMA Models to Predict Next-Day Electricity Prices[J].IEEE Trans on Power Systems,2003,18(3):1014-1020.

[13]CUARESMA J C,HLOUSKOVA J,KOSSMEIER S,et al.Forecasting Electricity Spot-Prices Using Linear Univariate Time-Series Models[J].Applied Energy,2004,77(1):87-106.

[14]周明,严正,倪以信,等.含误差预测校正的ARIMA电价预测新方法[J].中国电机工程学报,2004,24(12):63-68.

[15]CONEJO A J,PLAZSA M A,ESPINOLA R,et al.Day-Ahead Electricity Price Forecasting Using The Wavelet Transform and ARIMA Models[J].IEEE Trans on Power Systems,2005,20(2):1035-1042.

[16]陈友,王晛,李渝曾.一种用于短期电价预测的分时段时间序列传递函数模型[J].电力系统保护与控制,2008,36(16):1-4.

[17]NYBLOM J.Testing for the Constancy of Parameters over Time[J].Journal of the American Statistical Association,1989,84(405):223-230.

猜你喜欢

电价残差负荷
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
德国:电价上涨的背后逻辑
探索电价改革
可再生能源电价附加的收支平衡分析
争议光伏标杆上网电价
防止过负荷时距离保护误动新判据
主动降负荷才是正经事
负荷跟踪运行下反应堆一回路控制系统仿真与验证