APP下载

基于地基云图与气象数据的辐照度轻量化预测

2021-05-08钟振兴马晓波

东北电力大学学报 2021年1期
关键词:辐照度云图轻量化

钟振兴,马晓波,安 巍

(同济大学机械与能源工程学院,上海 201804)

太阳能光伏发电具有功率波动大,稳定性差的缺点,生产、消耗量的不匹配会导致严重的弃光问题,造成能源浪费.为了提高太阳能利用效率,实现太阳能光伏、光热产品产能的预测,辐照度的准确预测是其中重要的前提条件.近年来,许多学者针对这一问题展开了深入的研究.Heinle[1]采用K最近邻域(K-Nearest Neighbors,KNN)分类法对晴空、积云、卷云、层云、积雨云等7种天空类型进行判断,并各自训练子模型作辐照度预测,其天空分类识别准确率可达74.58%.Zhang[2]等利用光伏发电系统附近的天空云图,分别采用多层感知器、卷积神经网络、长短时记忆模块构造模型,实现了1 min~10 min内的光伏系统性能预测,其卷积神经网络模型预测均方根误差比持续模型降低了12.1%.蒋俊霞[3]等采用粒子图像测速法计算云的速度矢量,利用地基云图建立云识别和云量反演方法,预报未来时刻云的位置和云量,进而实现辐照度的超短期预测,其预测结果的均方根误差为144.89 W/m2.周海[4]等以非线性方法集成了自回归、神经网络、支持向量机模型,从而克服了单一模型的局限性,以光伏电站周围气象数据及当前辐照度作输入,预测未来4小时内辐照度,对比持续模型表现,其均方根误差降低了约60%.马燕峰[5]等对9项气象参数共511种组合进行了分析,确定了最优输入值,构建了非线性自回归网络模型,其在晴、低云量、高云量、阴雨等四种典型气象条件测试中,标准均方根误差取得了7%至54%不等的改善.

纵观上述研究,其应用场景均为大型的光伏电场,在训练过程中,其云图特征往往是人为标定的,不仅标准难以统一,而且需要耗费大量人力时间.这些模型的结构通常比较复杂,需要高性能计算机的支持,预测速度也往往较慢.从实用性角度来看,在光伏电站现场采样预测过程中,能够提供的算力条件往往有限,但使用智能算法自动提取云图特征已成为一种必要的预测手段.这样的矛盾导致发展有限算力的轻量化预测模型成为必然的选择.

轻量化预测模型是指为了使模型能够适用性能较低的计算条件,而对深度学习模型的训练参数、预测准确率与预测耗时进行仔细的对比和调控的辐照度预测模型.除了上述的大型光伏电站应用场景外,随着太阳能光电、光热利用技术的成熟,太阳能产品在家庭用户的普及率也在逐年上升.在小规模太阳能用户的应用场景下,大型预测模型响应速度慢的缺陷更加难以忍受.同时,受原始数据集限制,大型模型往往仅使用地基云图或气象数据进行预测,没有两者兼顾,准确率还有较大的优化空间.因此,太阳辐照度轻量化预测技术研究有着深刻的理论意义和广阔的应用前景.

本文利用深度学习技术,采取卷积神经网络提取云图特征,提出了一个整合地基云图与气象数据的辐照度轻量化预测模型.通过优化其算法网络结构,大幅降低了预测模型的计算时间,能够为家庭、个体用户的太阳能产品提供准确快速的性能预测.

1 轻量化数据采集系统

深度学习算法通常需要进行大量的计算,但在许多实际应用的场合如光伏现场的检修与调试中,往往只有便携式计算机,算力条件十分有限,数据采集及预测系统需要做出有效的轻量化改进措施.Movidius神经网络计算棒集成了英特尔视觉处理器和深度神经网络硬件加速器,能以极低的功耗执行高性能视觉推理运算[6].考虑到模型准确率与设备便携性,本文采用了树莓派卡片式计算机与Movidius神经网络计算棒结合的硬件平台,完成了数据采集与实时预测计算,如图1所示.连接树莓派的辐照度、温湿度、风速、风向等传感器定时记录气象讯息,广角摄像头用于采集天空云图,神经网络计算棒负责加速预测.各传感器的性能参数,如表1所示.

表1 各气象记录传感器参数

图1 数据采集预测系统示意图图2 辐照度预测模型算法流程

2 轻量化预测模型架构

2.1 辐照度预测模型算法流程

深度学习算法具有多层次的网络结构和重复训练特征的迭代方式,能较好地应对辐照度预测问题.辐照度预测模型的训练流程及预测流程,如图2所示.首先,导入原始数据,清洗部分存在异常的节点;其次,对数据作批量归一化,划分训练样本及测试样本;然后,建立模型进行迭代训练,并作参数调优测试;最终,训练完毕获取模型输出文件.在实际预测场景下,将采集到的数据进行合适的预处理后,可利用训练完毕导出的模型作预测,以得到合理结果.

2.2 典型未轻量化算法

决策树模型具有误差低、收敛快的特点,在数据预测工业案例中得到了广泛应用.其代表Gradient Boosting[7]的核心思想为逐层学习,即不直接拟合最终的强模型F(x),而是在n步的迭代中每一步迭代都得到一个基础拟合函数fn(x),通过累加的方式来推理得到最终的拟合函数

(1)

设x为输入数据,y为数据真实值,则可定义损失函数L(y,F(x)).常设L为平方误差损失函数,即L(y,F(x))=(y-F(x))2.在第m步的迭代开始前,已有前m-1步的累加模型Fm-1(x)、残差项(y-Fm-1(x))和损失函数L(y,Fm-1(x)),第m步中迭代训练fm(x)的目的为尽量拟合上一步的残差项,使得该步的总拟合函数Fm(x)=Fm-1(x)+fm(x)能更接近真实值y.Gradient Boosting算法利用损失函数L的负梯度在当前模型F(x)=Fm-1(x)的值来作为残差的近似值,其负梯度r定义为

(2)

在第m步迭代中,在Fm-1(x)的基础上尝试用弱拟合函数hm(x)来进一步逼近真实数据y,并求出对应的损失函数L.调整hm(x)及其它参数,当L处于该步迭代的最小值时,可求出对应的负梯度rm.将rm作为权重与hm(x)相乘可以得到本次迭代的基础拟合函数即fm(x)=rm×hm(x),并以此进一步得到了该步的累加模型Fm(x).

研究表明,上述决策树模型仅使用气象数据作辐照度预测,容易出现过拟合,在实际测试时往往难以达到令人满意的结果,使用云图和配套气象参数作训练可为模型预测性能带来明显的提升[8].在对云图的识别处理中,如何判断云层厚度及运动趋势是关键所在.卷积神经网络一般由卷积层、池化层和全连接层组成,有效模仿了生物的视觉机制,在处理图像识别任务中得到了广泛应用.因此,常用卷积神经网络分析云图特征.卷积层主要对输入进行卷积运算,设在2维空间有函数F和G,则其卷积为

(3)

其中,F(a,b)即为卷积核,卷积核大小为(2n+1)×(2n+1).卷积通过加权求和运算可以提取图像特征,而池化层负责对卷积层输出特征进行降维,根据降维方法可分为最大值池化与平均值池化.引入云图识别任务后,模型数据计算量会大幅提升,亟需有效的轻量化措施以在保证准确率的前提下,改善运行速度.

2.3 气象数据预测算法改进

LightGBM模型[9]针对传统Gradient Boosting算法速度和可扩展性的不足做出了优化,采用互斥特征捆绑与梯度单边采样策略,具有更低的内存消耗与更高的准确率,有效缓解了计算数据量过大的问题.互斥特征捆绑指在稀疏特征空间中,若满足大量特征同时取0值的条件,可将这些互斥特征合并,以降低特征维度和模型复杂度.梯度单边采样指相比传统导入所有数据进行训练的方法,其在每次训练过程中只选取部分具有高梯度的样本数据来尝试拟合计算.LightGBM在保证预测准确率的前提下,降低了算力要求,但其在训练时需要仔细调整树的深度和叶子节点等参数,以避免过拟合现象的发生.

为了充分挖掘气象数据变化对辐照度产生的影响,使用特征交叉的方式来扩充特征,即令温度、湿度、风速、风向、当前辐照度等特征进行两两(或多个)相乘以构建非线性关系,从而达到更佳的训练效果,有效提升模型预测性能[10].本文利用LightGBM算法对所有的特征进行了相关性分析,绘制了特征相关性示意图如图3所示.可以看出,实际辐照度与当前辐照度、小时、温度×湿度等参数存在较高相关性.考虑到模型复杂度与精确度的要求,本文最终选取了9个交叉特征:辐照度×辐照度、温度×湿度、辐照度×温度、辐照度×湿度、风向×风向、风速×湿度、风向×湿度、风速×风向、风速×温度,与日期时间、温湿度、风速风向及当前辐照度等基础气象信息一起共18个特征作为气象数据输入.

图3 预测辐照度与输入参数间的相关性

2.4 云图处理及轻量化措施

如上所述,为了提升预测的准确性,在预测模型中需要引入地基云图信息来预测未来时刻的辐照度.然而,一般处理图像的预测算法往往计算量较重,并不适用于轻量化的预测设备.因此,为了能够使用轻量化的计算设备处理云图信息,就必须对云图采取轻量化的深度学习模型.MobileNet预测模型专注于移动端或嵌入式设备,可有效减少计算量,在处理图像识别任务中相对于传统的深度学习模型有很大优势[11].相较于传统的卷积步骤,MobileNet创新地采用深度可分离卷积方法(Depthwise Separable Convolution)以降低计算复杂度与参数个数.传统卷积步骤的计算量X1为

X1=DF×DF×M×DK×DK×N

(4)

其中:DF为输入图尺寸,M为输入图通道数,DK为卷积核尺寸,N为输出通道数;而深度可分离卷积首先根据输入通道进行按位相乘的计算,此时通道数不变;然后使用1×1的卷积核进行传统的卷积运算,此时通道数改变.深度可分离卷积的计算量X2为

X2=DF×DF×M×DK×DK+1×1×M×DF×DF×N

(5)

例如,在如图4所示的深度计算网络结构中,若设DK=3,则传统卷积方法计算量约为271万,深度可分离卷积计算量约为165万,可节省39%的计算量,而且其在模型大小、运行速度层面都有较大优化.

图 4 传统卷积(左)与MobileNet卷积(右)核心方法区别

受MobileNet模型参数少、体量轻等特点的启发,如图5所示.本文计算模型的网络结构与MobileNet设计相似,但有三点不同:(1)为了表达云的运动趋势,模型中将相邻时刻的两幅地基云图图像权重平均值组合成了一张新云图,相邻时刻的两幅地基云图和融合所得的新云图组合,可以在一定程度上表达出此阶段内云的运动趋势.本模型输入端不是单一图片,而是由上述相邻时刻的云图及融合得新云图组成的,而且在全连接层中添加了在LightGBM模型中筛选得到的18个气象特征作为输入;(2)本模型舍弃了MobileNet的顶端网络结构,以自行构造的全连接层与回归层取而代之.而且,与常规的迁移学习思路不同,考虑到云图图像的特殊性,其与网络图像交叉部分极少,本模型只使用了部分MobileNet的网络结构,而没有使用MobileNet的模型权重;(3)本模型的预测目标为具体数值,即下一节点时刻的GHI,而不是图像分类.

图5 数据预测流程图

3 数据收集及评估

本文所用云图及配套气象数据由部署于上海市同济大学嘉定校区气象观测站提供.其中,天空云图使用鱼眼摄像头捕获,采集时间为5分钟,并用图像处理库OpenCV对云图边缘存在畸变处进行批量剪裁.配套气象数据实测于2019年11月至12月及2020年6月至8月,共收集了3 671组数据,其中3 234组数据用于模型训练及验证,437组数据用于测试模型预测结果.

对于预测结果的准确性评价,可以定义如下的误差评价指标:

(6)

(7)

(8)

(9)

其中,MAE(Mean Absolute Error)为平均绝对误差,反映了预测值误差的实际情况.nMAE(Normalized Mean Absolute Error)为相对平均绝对误差,nRMSE(Normalized Root Mean Square Error)为相对均方根误差,它们均反映了预测值整体的相对误差,且nRMSE更关注数据的异常值表现.技能得分SS(Skill Score)可定量评估模型改善程度.上式中:N为整体样本个数;xt为样本实际值;x′t为样本预测值;x为样本整体平均值;ε0为参照模型的某个性能参数(如MAE、nMAE、nRMSE等);ε1为对应的测试模型性能参数.

4 算例分析

本文以Keras 2.3+TensorFlow 1.14为学习框架,并利用开源图像处理函数库OpenCV 4.1处理云图数据.模型采用Adam优化算法,学习率衰减策略:当验证集损失值持续10步不下降时则减少学习率为原来的1/10.模型训练完成后,将权重数据与推断程序打包转换成轻量化的专用文件供现场预测的树莓派计算平台使用.

以不同方法对30分钟后辐照度进行预测的结果,如表2所示.由前两组不同输入的对比实验可见,单纯的图像输入或者气象数据输入较图像与数据结合模型的预测效果差.以基础卷积-回归网络模型、卷积-径向基函数(CNN-RBF)预测模型[7]做性能对比,结果显示:在不同的典型天气类型下,卷积-多层感知器(MobileNet-MLP)轻量化预测模型的相对均方根误差均低于其他预测方法.与未作轻量化处理的原模型相比,由于轻量化模型预先对权重文件进行了转换,并针对数据流读取方式做了优化,在加载模型与读图速度方面都有明显提升,以单组图片为例,在不损失准确率的前提下,预测时间缩短了71%.

表2 预测模型的性能比较

图6展示了各模型在多种典型天气情况下的预测结果.图6(a)为冬季晴天天气,图6(b)为夏季晴天天气,图6(c)为夏季多云转阴天气,图6(d)为夏季阴雨天气.可以看出,晴天天气辐照度随时间变化规律较为明显,而多云天气及阴雨天气辐照度波动较大,预测难度也有所上升;从季节角度来看,季节更替时辐照度波动没有明显变化,最主要的区别体现在辐照度峰值上,夏季辐照度峰值可达近1 100 W/m2,而冬季辐照度峰值往往只有约600 W/m2;图6-d)中的夏季阴雨天气气象参数波动剧烈,从而导致各模型预测辐照度误差较大,预测出现了一定的滞后.由上述图表可知,本轻量化模型的预测结果最接近真实值,MAE,nMAE,nRMSE的技能得分相对基础模型分别提高了24.6%、19.5%、25.5%.

图 6 各模型在不同天气条件下预测结果

5 结 论

在短时辐照度预测中,本文利用深度学习技术对相连地基云图作融合变换,自动判断天空的变化趋势,并基于LightGBM模型完成了气象参数的筛选,从而有效提升了辐照度的预测精度.通过优化输入参数、重构MobileNet网络结构和使用Movidius计算棒转换模型等轻量化措施,合理简化了预测模型,有效提升了预测速度,实现了辐照度的轻量化预测.

算例结果表明,本文提出的轻量化预测模型在进行超短期辐照度预测时,平均均方根误差在16%左右,误差值较传统预测方法下降了5.5%,同时,在预测速度上也提升了71%,有效缓解了大型光伏预测模型臃肿迟滞的问题.本模型具有轻便快捷、准确高效的特点,既可供大型光伏电场工作人员现场调试使用,也为家庭太阳能产品的高效利用提供了新思路.

猜你喜欢

辐照度云图轻量化
汽车轻量化集成制造专题主编
成都云图控股股份有限公司
太阳总辐照度对热带中太平洋海表温度年代际变化的可能影响
一种轻量化自卸半挂车结构设计
一种轻量化自卸半挂车结构设计
黄强先生作品《雨后松云图》
光伏发电系统的时序概率模型研究
中国典型地区水平总辐射辐照度频次特征*
基于TV-L1分解的红外云图超分辨率算法
瞄准挂车轻量化 锣响挂车正式挂牌成立