APP下载

适用于小样本的神经网络光伏预测方法

2017-05-24张程熠唐雅洁李永杰江全元

电力自动化设备 2017年1期
关键词:太阳辐射输出功率时段

张程熠 ,唐雅洁 ,李永杰 ,高 强 ,江全元

(1.浙江大学 电气工程学院,浙江 杭州 310027;2.国网浙江省电力公司电力调度控制中心,浙江 杭州 310007)

0 引言

近年来,随着社会经济的发展,能源短缺和环境污染问题日益突出,开发与利用可再生能源成为解决能源和环境问题的有效途径。在新能源发电中,光伏发电由于具有安全可靠、地域限制少、建设周期短等优势而得到快速发展,目前已具备较大的产业规模。但由于天气等因素的影响,光伏输出功率在短时间尺度内存在较大的不确定性,准确有效的光伏预测技术对于系统的安全稳定运行和光伏能源的有效利用具有重要意义。

按照预测原理,光伏预测方法可分为物理方法和统计方法两大类。物理方法是利用物理模型进行预测,如文献[1]以数值天气预报为输入,利用太阳位置模型、光伏电池模型、逆变器效率模型,最终得到了光伏电站的输出功率。物理方法不需要历史运行数据,投产后即可预测,但是需要光伏电站详细的物理信息,预测精度受所建模型的影响很大,在实际工程中应用较少。统计方法是通过对历史运行数据进行统计分析,进而找出光伏输出功率与各影响因素的内在规律进行预测,如灰色预测、马尔科夫链、人工神经网络、支持向量机等。文献[2]以待预测日的历史相似日中有光照时段的每小时输出功率平均值,待预测日与历史相似日的气温信息、湿度信息、风速以及气溶胶数据为输入,以待预测日有光照时段每小时输出功率平均值为输出,用BP神经网络实现了未来24 h光伏输出功率的多步预测。文献[3]提出一种基于相似日和径向基函数神经网络的光伏发电预测方法。文献[4]通过灰色关联度分析选择训练样本,利用最小二乘支持向量机预测未来24 h的光伏输出功率。文献[5]通过近邻传播算法对光伏出力进行分类,然后根据预测日所属类别建立回声网络状态方程用以预测光伏出力。上述方法在具备充足的样本数据时均具有较好的预测水平,但是由于实际系统所具备的预测条件差别很大,没有一种方法是普适的[6]。目前,提前1 d的光伏短期预测方法一般都需要充足的历史数据支持,对数据积累时间的要求长达 3 个月至 1 a 不等[2,5-6],若光伏电站处于投运初期,历史数据积累不足,常规预测方法在应用上会受到很大限制。因此,有必要针对小样本情境对常规方法进行改进,得到适用于投运初期光伏发电系统的功率预测方法。

为了充分利用神经网络方法对于解决非线性问题的优势,同时降低预测算法对历史数据的依赖程度、提高预测算法对小样本的适应性,本文提出了一种双层神经网络单步光伏预测方法。通过分析光伏输出功率的影响因素,明确了各影响因素的自然解耦特性,将单层神经网络拆分为双层神经网络,使各部分网络的结构得到简化;通过天气类型与云遮程度对应关系的统计分析,将云遮因素有效整合到模型输入量中,降低了输入、输出之间关系的复杂度;用单步预测代替多步预测,降低了网络的输入、输出维数,进一步简化了网络结构。最后基于实际系统的运行数据,验证了本文所提出的方法在小样本条件下,能够较准确地实现提前1 d的光伏发电功率预测。

1 光伏输出功率影响因素

光伏发电是根据光生伏特效应,利用太阳能电池将太阳能直接转化为电能。光伏输出功率与地表太阳辐射强度以及光电转换效率紧密相关。在分析光伏输出功率影响因素时,可从影响地表太阳辐射的因素和影响光电转换环节的因素这两方面分别展开。

1.1 地表辐射强度的影响因素

太阳辐射在经过地球大气时,会受云量、气溶胶、水汽等因素的综合影响[7]。

云量对太阳辐射的影响十分显著且复杂,但总体上,云量的增加会使到达地球表面的总辐射减少[7-8]。在空气质量良好、空气湿度较小时,到达地表的太阳辐射主要受到云量的影响。为了表示太阳辐射穿透云层的能力,将第j天第i时段的平均太阳辐射强度Ri,j与无云天气下对应时段的平均太阳辐射 R0i的比值定义为穿透率 ki,j,即:

R0i可由n个邻近日对应时段历史数据中的最大太阳辐射值近似表示,即:

其中,n为所选择的邻近日数量。

作为太阳辐射最显著的影响因素,云量常被作为预测模型的输入量。目前,常规气象数据中还没有直接描述云量的值。由于天气类型能对云量进行模糊表示,在短期光伏预测中,普遍利用天气类型表征云量的情况。本文用到的天气类型数据主要来自公共气象数据网站Weather Underground,包含晴天、多云时晴、多云、阴、雨这5类,数据间隔为1 h。

气溶胶是大小为0.001~100 μm的固体或液体小质点分散并悬浮在气体介质中形成的胶体分散体系,对太阳辐射也有着重要影响。它既可以直接反射、散射或吸收太阳辐射,又可以通过改变云的微物理性质而产生间接效应,但总体上,气溶胶的增加会使到达地面的太阳辐射减少[8]。近年来,随着化石燃料的大量燃烧,人为气溶胶的排放大量增加,雾霾天气频繁出现,成为光伏预测中不可忽视的因素。环境监测中的空气质量指数AQI(Air Quality Index)作为空气质量状况的无量纲指标,是目前最常见的空气质量定量描述指标,故本文选用空气质量指数表示气溶胶的影响。文中用到的空气质量指数数据来自青悦空气质量历史数据库,数据间隔为1 h。

水汽对太阳辐射也有较强的吸收作用,但相比云量和气溶胶的影响,这种作用小很多[7]。一般情况下,只有在雾霭天气下,水汽才会对太阳辐射有比较明显的削弱作用。在训练样本有限时,为尽量简化输入、输出之间的映射关系,不再将水汽作为预测模型的输入量,仅在第2.3节进行统计样本的筛选时考虑水汽的影响。

1.2 光电转换环节的影响因素

到达地球表面的太阳辐射能够通过太阳能电池的光伏效应,完成光电转换过程,最终输出电功率。在这一过程中,地表辐射强度、逆变器转换效率、光伏面板安装角度、光伏组件温度等因素都会影响输出功率。

由于绝大多数光伏并网逆变器都以相对稳定的功率转换率运行在最大功率点跟踪模式,对既定的光伏发电系统而言,其输出功率数据具有高度的自相关性,已包含了光伏阵列的系统信息,在短期预测中可以将逆变器转换效率、光伏面板安装角度等因素看作常数,而只需考虑地表太阳辐射强度和光伏组件的温度[9]。

地表太阳辐射强度是光电转换的直接影响因素,随着地表太阳辐射强度的增大,光伏电池的开路电压、短路电流会随之增大,从而引起输出功率的增大。

光伏电池对组件温度也具有一定的敏感性。随着温度的升高,短路电流有所增加,但开路电压却下降,且后者变化较大,总的输出功率将下降。这一情况在组件温度达到20℃以上时尤为显著[10]。由于光伏组件的温度较难预测,在实际预测过程中常用环境温度进行代替。

1.3 影响因素的解耦

通过上述内容可以看出,从光伏发电物理机制的角度分析,可将影响光伏输出的因素分为2个部分:第一部分为太阳辐射从地外到达地球表面过程中的所有影响因素,包含大气中各要素对太阳辐射的削减,如云量、气溶胶等;第二部分为光电转换环节的影响因素,主要考虑地表太阳辐射和光伏组件温度。上述两部分影响因素具有如图1所示的天然解耦特性,在建立预测模型时,可将其分开考虑。

图1 光伏输出功率影响因素解耦示意图Fig.1 Schematic diagram of influencing factors decoupling for PV output

2 光伏发电预测模型

2.1 BP神经网络

BP神经网络是一种按误差反向传播算法训练的多层前馈网络,具有强大的非线性映射能力,它能通过样本训练使网络学习大量的输入、输出映射关系,并且具有较好的泛化能力,在光伏预测中有着广泛的应用[11]。

神经网络预测模型主要由输入层、隐含层、输出层组成。文献[12]在用BP神经网络进行提前1 d的光伏预测时,以前一天的发电量序列、天气类型、最高气温以及预测日的天气类型、最高气温为输入,以预测日的发电量序列为输出。这种利用邻近日或相似日功率序列相似性而构建的预测模型在实际工程中有着广泛的应用。目前,随着气象服务类信息的详细化,公共气象服务网站已经能够提供未来1 d中每小时的天气类型、温度等信息,可将这些信息加入到神经网络输入中,得到一个由天气类型、温度、空气质量确定的光伏输出功率预测模型Ⅰ:预测时段为06:00—19:00,其他时段输出功率为0,输入层变量为06:00—19:00每小时的天气类型、空气质量指数、温度,输出层变量为06:00—19:00每小时的光伏输出功率,如图2所示。

图2 预测模型I神经网络结构图Fig.2 Structure of neural network for forecast modelⅠ

为使预测模型适应小样本情境,提高在小样本条件下的泛化能力,本文对预测模型Ⅰ进行了改进。一般而言,神经网络的泛化能力主要取决于3个因素,即问题本身的复杂程度、网络结构以及样本量的大小[11]。在样本量一定且较小时,为保证网络的泛化水平,应尽可能简化输入和输出之间的关系以及网络结构。下文根据第1.3节中分析得到的光伏功率影响因素的自然解耦特性,将图2所示的预测网络拆分,使网络结构得到简化。此外,基于气象信息的统计分析对天气类型进行变换,并用单步预测代替多步预测,简化了输入和输出之间的关系。同时,用单步预测代替多步预测降低了输入、输出维数,进一步简化了网络结构。通过上述改进,初步得到了本文的预测模型Ⅱ。

2.2 神经网络结构拆分

根据第1.3节对光伏输出功率影响因素的分析,可将削弱辐射强度的主要影响因素云量、气溶胶,以及影响光电转换环节的温度这3个因素作为神经网络的输入。用天气类型表示云量情况,用空气质量指数表示气溶胶情况,即如图2所示的神经网络结构。

考虑到太阳辐射削减环节与光电转换环节是2个较为独立的过程,为简化网络结构,可针对这2个过程进行解耦,从而把一个相对较大的网络拆分为2个较小的网络,得到如图3所示的输入、输出关系,通过这样的处理,网络结构能够得到初步简化,对小样本的适应性也会随之提高。

2.3 输入量变换

图3 分层后的输入、输出关系示意图Fig.3 Schematic diagram of relationship between input and output after layering

在神经网络输入量中,空气质量指数和温度均为具有实际物理意义的数值,但天气类型仅对晴天、多云时晴、多云、阴、雨这5种情况进行区分,一般用整数对其进行标识,记为w,如表1所示。

表1 天气类型标识码对照表Table1 Identification codes of weather type

w只能对5种天气类型进行区分标识,并不能表示其云遮程度,加大了输入和输出之间关系的复杂度。为尽可能减少这一影响,本文充分利用待预测时段邻近时段的天气类型预报信息和邻近日的历史太阳辐射数据,统计得到各天气类型所对应的穿透率期望,用穿透率期望代替天气类型,简化输入、输出之间的映射关系。具体处理过程如下所述。

a.在历史样本中除去空气质量不佳、空气湿度大的部分,得到地表太阳辐射强度主要受云量影响的样本。由式(2)计算得到邻近日第i时段最大太阳辐射,用于近似表示第i时段无云天气下的太阳辐射R0i,再由式(1)计算第j天第i时段的实际穿透率ki,j。结合第j天第i时段实际天气类型与实际穿透率,统计得到天气类型w所对应的穿透率的分布,并计算其期望值。利用浙江南都电源光储一体化电站2015年4月至6月的历史数据,得到的统计结果如表2所示。相比w所标识的天气类型,穿透率期望值能够更直接地体现出当前云量对太阳辐射的削减程度,从而简化神经网络的映射关系。

表2 天气类型与穿透率期望对应关系Table2 Weather type and corresponding penetration rate expectation

b.步骤a中5种天气类型的表示比较模糊,每一种天气类型统计得到的穿透率较为分散。为细化步骤a中穿透率的统计分析过程,将前后时段的天气类型也考虑其中,得到了考虑前后时段天气情况的穿透率分布。由实际数据得到统计结果,部分结果如表3所示。表中天气类型转换1-2-1表示当前时段天气类型为2,前一时段天气类型为1,后一时段天气类型为1。相比表2,表3对天气类型有了更细致的划分,同时计及了天气的变化信息。

表3 考虑前后时段天气类型的穿透率期望对照Table3 Penetration rate expectation considering previous and succeeding weather types

c.由步骤a、b分别得到了2种穿透率的统计结果。在进行预测时,首先根据待预测时段及其前后时段的天气类型,在表3中查找对应的穿透率期望,若该考虑时变的天气类型在有限的统计样本中未曾出现,则只考虑当前时段的天气类型,并在表2中查找对应的穿透率期望,得到代表云量的穿透率期望作为输入值,用于模型的训练和预测。

2.4 用单步预测代替多步预测

在对天气类型进行变换后,双层神经网络中体现光伏输出功率影响因素的变量包含穿透率期望空气质量指数 Ai,j以及环境温度 Ti,j,用向量 xi,j表示第j天第i时段的影响因素,即:

由于夜间光伏输出功率为0,式(3)中预测时段i的取值区间为06:00—19:00,则第j天的影响因素xj为:

定义第j天第i时段的光伏输出功率为yi,j,则第j天的光伏输出功率yj为:

根据预测模型输出向量的维数,分别定义单步预测和多步预测。输出向量只有一维的为单步预测,输出向量有多维的为多步预测。即单次预测中,若以yi,j为输出,则称为单步预测,若以yj为输出,则称为多步预测。一般情况下,多步预测模型的各输入因素也需是多维的,而相比多步预测,单步预测各输入因素的维数大幅降低。以本文模型Ⅰ的输入、输出关系为例,多步预测的输入量是06:00—19:00时间范围内每个时段的天气类型、空气质量指数和温度;单步预测的输入量可以简化为06:00—19:00时间范围内某一个待预测时段的天气类型、空气质量指数和温度。目前在短期光伏预测中,一般采用多步预测方法,输入、输出维数较高,需要较多的隐含层节点,网络结构趋于复杂化,对训练样本数量有较高要求。考虑到地表太阳辐射强度主要受当前时段的天气类型、空气质量等因素的影响,在光电转换环节中,光伏输出功率也主要受当前时段光照强度、温度的影响,并且现有气象服务网站可以提供时间间隔为1 h的气象数据,因此可以用单步预测代替多步预测,用单个时段的数据代替连续一天各时段的数据序列,从而构建各影响因素单时段输入、预测结果单时段输出的单步预测模型。

在单步预测中,若以 xi,j为输入、以 yi,j为输出,则输入量中的时段信息会缺失。一种处理方法是在输入量中加入时刻 ti,得到新的输入变量 x′i,j:

另一种处理方法是将穿透率期望ki,j与第i时段无云天气下的太阳辐射R0i相乘,得到第i时段受云量影响后的太阳辐射强度,即:

通过这样的改变,可以得到新的输入变量 x″i,j:

这2种方式均能将时刻信息添加到输入量中,但是由于第一种方式增加了新的输入量,网络结构不如第二种方式简洁,所以在预测模型中采用x″i,j作为输入变量。具体预测流程如图4所示,将该预测方法对应的模型记作模型Ⅱ。

图4 模型Ⅱ预测流程示意图Fig.4 Schematic diagram of forecast modelⅡ

3 预测结果与分析

上文提及了常规的预测模型Ⅰ以及适用于小样本的预测模型Ⅱ,预测模型Ⅱ相比预测模型Ⅰ的改进主要体现在以下3个方面:

a.将单层神经网络拆分为双层神经网络;

b.用单步预测代替多步预测;

c.用云遮后辐射强度代替天气类型标识码。

为验证预测模型Ⅱ的有效性,分别构建预测模型Ⅰ与预测模型Ⅱ的网络结构,并实现BP神经网络的学习训练与仿真预测。神经网络输入、输出层节点个数与预测模型输入、输出个数一致。通过试算,预测模型Ⅰ的隐含层选择为2层,2层隐含层节点数均为5个;预测模型Ⅱ中第一个神经网络的隐含层为1层,节点数为3个,第二个神经网络的隐含层为1层,节点数为2个。在2种预测模型中,隐含层激励函数类型均为Logsig函数,输出层激励函数为线性函数,使用梯度下降法进行网络训练。算例中所采用的辐射强度数据、光伏输出功率数据来自浙江南都电源光储一体化电站57 kW光伏发电系统2015年4月20日至6月17日的运行数据,共包含50 d有效数据。天气类型、温度等气象数据来自公共气象数据网站,数据间隔均为1 h。

选择6月8日至6月17日这10 d的数据作为预测样本,分别将6月8日之前的10 d、20 d、30 d、40 d数据作为训练样本,对预测模型Ⅰ与预测模型Ⅱ进行检验。

以6月12日(晴天)与6月16日(阴雨天)为例,将2种预测模型在不同数量的训练样本下的预测结果绘制在图5与图6中。图5是天气类型为晴天时的预测结果,图6是天气类型为阴雨天时的预测结果。

图5 晴天预测结果Fig.5 Predictive results for sunny day

图6 阴雨天预测结果Fig.6 Predictive results for overcast and rainy day

从图5和图6中可以看出,预测模型Ⅰ与预测模型Ⅱ在晴天的预测效果较好,在阴雨天的预测效果较差。模型Ⅱ的预测效果在小样本情况下优于模型Ⅰ,随着样本数量的增加,模型Ⅰ的预测效果逐渐提升,两者的预测效果趋近。

为了进一步分析预测效果,本文以均方根误差RMSE(Root Mean Square Error)、平均绝对值百分比误差 MAPE(Mean Absolute Percentage Error)和希尔不等系数TIC(Theil Inequality Coefficient)为评价指标,对模型进行评估。RMSE、MAPE与TIC的计算式分别如下[13]:

其中,Pi为光伏输出功率实测值,单位为kW;Pfi为光伏输出功率预测值,单位为kW;N为预测日所预测的时段总数。

图7对比了2种预测模型在不同训练样本下所有预测日的预测误差指标均值。需要说明的是,由于日出日落时段的光伏出力实际值很小,较小的预测偏差就可能会导致很大的相对绝对值误差值。因此,为了合理地展示不同模型的预测效果,在图7所示的MAPE指标结果中,没有考虑日出日落时段(早晨或傍晚光伏出力小于0.5 kW的时段)的预测误差。

图7 不同数量训练样本的预测误差指标均值Fig.7 Means of forecast error indexes for different training sample sizes

由于3种误差评价指标变化趋势相似,因此在图8中以RMSE指标为例,分别呈现了在不同数量的训练样本下,预测模型Ⅰ与预测模型Ⅱ的预测误差。日期编号1—10分别对应6月8日至6月17日。

图8 分别采用10、20、30、40 d数据作为训练样本的误差对比Fig.8 Comparison of forecast error between two models,based on 10-,20-,30-,40-day training sample

上述图形表明:

a.预测模型Ⅰ对训练样本的依赖较大,随着样本数量的增加,预测误差逐渐减小;

b.预测模型Ⅱ对小样本的适应性较好,在样本数量从10 d增加到40 d的过程中,预测误差变化不大,且均保持在较低水平;

c.随着预测样本数量的增加,预测模型Ⅰ的预测水平逐渐接近预测模型Ⅱ,当训练样本数量达到40 d时,预测模型Ⅰ在第5个预测样本中的预测结果甚至优于预测模型Ⅱ。

可以看出,本文所提出的预测模型Ⅱ对小样本情境有较好的适应性,适合应用于投运初期、历史累积数据较少的光伏电站。

4 结论

本文提出了一种改进的双层神经网络单步光伏短期预测方法。该方法通过将单层神经网络拆分为双层神经网络、用单步预测代替多步预测、用穿透率期望代替天气类型标识码,实现了网络结构和输入输出之间关系的简化。算例结果表明,该方法在小样本条件下,有较好的预测结果。

[1]卢静,翟海清,冯双磊,等.光伏发电功率预测方法的探索[J].华东电力,2013,41(2):380-384.LU Jing,ZHAI Haiqing,FENG Shuanglei,et al.Physical method for photovoltaic power prediction[J].East China Electric Power,2013,41(2):380-384.

[2]LIU J,FANG W,ZHANG X,et al.An improved photovoltaic power forecasting model with the assistance of aerosol index data[J].IEEE Transactions on Sustainable Energy,2015,6(2):434-442.

[3]王晓兰,葛鹏江.基于相似日和径向基函数神经网络的光伏阵列输出功率预测[J].电力自动化设备,2013,33(1):100-109.WANG Xiaolan,GE Pengjiang.PV array output forecasting based on similar day and RBFNN[J].Electric Power Automation Equipment,2013,33(1):100-109.

[4]程泽,韩丽洁,李思宇,等.光伏发电功率的智能预测算法[J].电力建设,2014,35(7):34-39.CHENG Ze,HAN Lijie,LI Siyu,et al.Intelligent forecasting algorithm for photovoltaic power generation [J].Electric Power Construction,2014,35(7):34-39.

[5]李乐,刘天琪.基于近邻传播聚类和回声状态网络的光伏预测[J].电力自动化设备,2016,36(7):41-46.LI Le,LIU Tianqi.PV power forecasting based on AP-ESN[J].Electric Power Automation Equipment,2016,36(7):41-46.

[6]钱振,蔡世波,顾宇庆,等.光伏发电功率预测方法研究综述[J].机电工程,2015,32(5):651-659.QIAN Zhen,CAI Shibo,GU Y uqing,et al.Review of PV power generation prediction[J].Journal of Mechanical&Electrical Engineering,2015,32(5):651-659.

[7]尹青,张华,何金海.近48年华东地区地面太阳总辐射变化特征和影响因子分析[J].大气与环境光学学报,2011,6(1):37-46.YIN Qing,ZHANG Hua,HE Jinhai.Long term change of surface total solar radiation and influencing factors over East China in recent 48 years[J].Journal of Atmospheric and Environmental Optics,2011,6(1):37-46.

[8]申彦波,赵宗慈,石广玉.地面太阳辐射的变化、影响因子及其可能的气候效应最新研究进展[J].地球科学进展,2008,23(9):915-924.SHEN Yanbo,ZHAO Zongci,SHI Guangyu.The progress in variation of surface solar radiation,factors and probable climatic effects[J].Advances in Earth Science,2008,23(9):915-924.

[9]丁明,王磊,毕锐.基于改进 BP神经网络的光伏发电系统输出功率短期预测模型[J].电力系统保护与控制,2012,40(11):93-99.DING Ming,WANG Lei,BI Rui.A short-term prediction model to forecast output power of photovoltaic system based on improved BP neural network [J].Power System Protection and Control,2012,40(11):93-99.

[10]邓雅,胡书举,孟岩峰,等.光伏发电系统功率预测研究方法综述[J].电气制造,2013(6):18.DENG Ya,HU Shuju,MENG Yanfeng,et al.Overview of research methods for power prediction of photovoltaic power generation system [J].Journal of Electrical Engineering,2013(6):18.

[11]阎平凡,张长水.人工神经网络与模拟进化计算[M].北京:清华大学出版社,2005:79-82.

[12]陈昌松.光伏微网的发电预测与能量管理技术研究[D].武汉:华中科技大学,2011.CHEN Changsong.Research on power forecasting and energy management for photovoltaic microgrid [D].Wuhan:Huazhong University of Science&Technology,2011.

[13]高阳,张碧玲,毛京丽,等.基于机器学习的自适应光伏超短期出力预测模型[J].电网技术,2015,39(2):307-311.GAO Yang,ZHANG Biling,MAO Jingli,et al.Machine learningbased adaptive very-short-term forecast model for photovoltaic power[J].Power System Technology,2015,39(2):307-311.

猜你喜欢

太阳辐射输出功率时段
邯郸太阳辐射时空分布特征
养阳的黄金时段到了
四个养生黄金时段,你抓住了吗
基于PCA 的太阳辐射观测算法研究
太阳辐射作用下钢筒仓结构温度场分析研究
适用于智能电网的任意波形输出功率源
基于双层BP神经网络的光伏电站输出功率预测
洛阳地区太阳辐射变化特征及影响因子分析
分时段预约在PICC门诊维护中的应用与探讨
分布式发电系统并网逆变器输出功率的自适应控制