基于K均值小波神经网络的二阶段空调负荷预测

2018-06-13郑守锦

福州大学学报（自然科学版） 2018年3期

赵超，郑守锦

(福州大学石油化工学院，福建福州 350116)

0 引言

随着人们对工作与生活环境舒适性要求的日益提高，空调系统在工业和民用建筑中的得到广泛应用. 与此同时，空调节能也引起社会越来越多的关注. 建立合理的空调负荷预测模型是实现空调系统经济运行和调度的基础，也是开展空调节能研究的重要工具. 由于空调系统具有非线性、多变量和大时滞等特征，使得建立其精确预测模型面临相当大的困难. 近年来，以人工神经网络和模糊分析为代表的基于数据驱动的空调负荷建模方法受到国内外学者极大的关注[1-3].

小波神经网络是结合人工神经网络思想与小波变换理论而构造的一种新的神经网络模型，它既保存神经网络的自学习能力，又继承小波变换良好的时频局域化性质，因而具有更强的逼近能力和容错能力. 自小波神经网络提出以后，它在数据分类、系统辨识、动态建模及智能控制等领域得到广泛的应用，近年来也被许多学者用于建筑能耗和空调负荷的建模及预测研究之中[4-5]. 文献[6]建立小波神经网络模型对空调负荷进行预测，利用改进的微分进化算法优化网络参数，仿真实验证明该方法较人工神经网络、遗传算法-神经网络、粒子群优化人工神经网络模型有更高的预测精度，表明小波神经网络用于空调负荷预测的可行性；文献[7-8]将小波神经网络应用于电力系统短期负荷预测，并与BP神经网络预测模型相比较，分析得到小波神经网络预测模型不仅具有更好的预测精度，而且所需网络节点少、收敛速度快及自适应性好.

为提高建筑空调负荷预测模型的精度和可靠性，提出一种基于K均值聚类和小波神经网络的两阶段空调负荷建模方法. 利用K均值聚类算法对样本数据进行无监督的学习划分，使得具有相同或相类似特性的建模样本聚类到对应的一簇中，以消除建模样本中的噪声和非平稳性，从而有效降低数据相关性对模型预测精度的影响. 在聚类分析的基础上，建立起具有较高预测精度和泛化能力的小波神经网络空调负荷预测模型. 通过对南方地区某办公大楼 DeST模拟的能耗数据进行建模预测，并与独立的小波神经网络和 BP神经网络预测模型的性能作比较, 验证空调负荷预测方法的可行性和有效性.

1 二阶段预测模型算法

1.1 K均值聚类算法

图1 K均值聚类流程图 Fig.1 Process of K-means clustering algorithm

K均值聚类是一种基于划分的经典聚类算法，其算法简单易实现，具有高效的数据挖掘能力和良好的可伸缩性，在图像处理、数据挖掘、故障诊断等领域得到广泛应用[9-10].K均值聚类算法的基本思路[11]：设在Rm空间中存在数据点集S={X1,L,Xn}，其中Xi=(xi1,L,xim)(i=1, 2, …,n)，首先确定聚类的个数k，并随机选取数据点Vi(i=1, 2,L,k)作为各个簇的聚类初始中心；其次，依据距离就近原则分别将每个数据点依次划分到离其最近的聚类中心所在的簇；进一步，更新每个簇的聚类中心，以每个簇所包含数据点的均值定义为该簇新的聚类中心；最后，按下式目标函数计算每个数据点到所在簇中心的距离平方和，若目标函数值达到最小时(即聚类中心不再改变)则聚类完成，否则依据新的聚类中心重新进行聚类划分. 算法结构如图1所示.

(1)

1.2 小波神经网络

图2 小波神经网络结构 Fig.2 Structure of wavelet neural network model

小波神经网络(wavelet neural network, WNN)是利用小波元代替神经元将小波分解与神经网络相融合. 本文在BP神经网络(back propagation neural network， BPNN)结构的基础上，用母小波函数的伸缩平移作为BPNN隐节点的Sigmoid函数. 小波函数具有多样性，鉴于Morlet小波拥有较好的光滑性和时域局部性，本文采用Morlet小波基函数替代隐含层的Sigmoid函数，表达式为：

ψ(x)=cos(1.75x)exp(-x2/2)

(2)

图2为WNN拓扑结构， WNN模型由输入层—隐含层—输出层三层构成. 其中，x1,x2, …,xk为网络的输入值；y1,y2, …,ym为网络的预测输出；ωij、ωjk分别为各结构层之间的连接权值.

设隐含层个数为l，则输出表达式为：

(3)

式中：h(j)为隐含层第j节点的输出值；aj和bj分别为第j个节点小波基函数的伸缩和平移因子.

则输出层表达式为：

(4)

式中：m为输出层节点数.

在小波神经网络训练过程中，采用梯度修正法对WNN的网络权值和小波基函数伸缩平移因子进行修正，通过对参数的调整，实现输出值逐步逼近期望值. 定义代价函数：

(5)

式中：yn(k)为实际值；y(k)为模型预测输出值.

根据误差逆传播思想， WNN参数调整采用梯度修正法：

(6)

(7)

式中：η为学习系数；s表示第s次迭代.

图3 预测模型总体框图Fig.3 Overall frame of prediction model

1.3 二阶段预测模型

本文提出K均值小波神经网络的二阶段预测模型. 首先，充分了解样本统计分布特征，合理选择要聚类的簇的个数k，利用K均值聚类进行聚类分析；再者，对聚类后的每个簇依次建立WNN模型，其次将验证数据采用所对应簇的WNN模型进行预测，最后综合k个模型预测结果即为本章预测方法的最后结果. 模型结构如图3所示.

2 二阶段空调负荷预测建模

2.1 建模步骤

图4 预测模型流程图 Fig.4 Process of prediction model

由于空调负荷系统是受到室内和室外等多种不确定因子影响，用单一的固定模型很难稳定性地反映其变化趋势，因此，有必要考虑利用多模型组合预测来提高空调负荷预测模型的抗干扰能力和精确度. 如图4所示，基于K均值小波神经网络的二阶段空调负荷预测模型的关键步骤可总结如下：

1) 根据样本集特征确定聚类个数k，随机选取k个样本点作为每个簇的初始聚类中心.

2) 将每个样本点依次划分到离其最近的聚类中心点所代表的簇，并依次更新每个簇的聚类中心点.

3) 按式(1)聚类准则函数计算当前函数值，若达到收敛则聚类结束，否则重复步骤2).

4) 归一化处理. 为了消除不同量级数据之间的影响，将数据样本进行归一化处理，如下式：

(8)

式中：X为原始值；Xmax和Xmin为最大值和最小值；Y为归一化结果.

5) 构造WNN模型. 对每个簇建立WNN模型，设置小波基函数伸缩平移因子a、b及各结构层之间的连接权值ωij、ωjk的初始值，确定网络学习系数η.

6) 模型训练. 输入训练样本，计算预测值和训练误差，按式(6)～(7)修正参数；判断训练误差是否达到期望值，若是则训练结束，否则返回训练步骤.

7) 将待预测样本数据选择所对应的WNN模型进行预测.

8) 预测结果反归一化. 按下式进行反归一化计算.

(9)

式中:Y′为每个簇对应模型的预测值.

2.2 实例分析1

2.2.1 建筑物简介

图5 建筑外形示意图Fig.5 Shape of office building

用于验证本章预测方法的办公建筑如图5所示. 该建筑位于中国南方地区，主楼地下1层，地上16层，附属楼3层，标准层层高3.5 m，建筑高度57.4 m；建筑总面积19 700.5 m2，包括地下建筑面积2 384.88 m2，地上建筑面积17 315.62 m2，其中建筑空调面积为13 292.25 m2. 空调按正常工作日时间开机运行，每天从7:00—17:00，共计10 h.

2.2.2 构造样本集

基于上述建筑的构建参数利用DeST-C模拟计算夏季各月份的逐时空调负荷作为基准值. 根据DeST-C模拟计算的结果，选取6月20日—8月31日空调负荷值构成样本集(共计520组)，其中300组负荷值作为训练样本数据， 220组负荷值作为验证样本数据.

2.2.3 结果与分析

文中采用K均值算法对样本聚类4个簇进行实验，根据聚类后的训练集分别构造最优小波神经网络模型. 同时建立独立的WNN和BPNN模型作比较. 3种模型拟合结果与实际值对比如图6所示，空调负荷预测结果与实际值比较如图7所示.

从图7可知，这三种预测方法在一定程度上都能较好地反映能耗变化趋势，但存在个别预测值偏差较大; 相比独立的WNN和BPNN模型，本文基于K均值小波神经网络的二阶段预测具有更好的抗干扰能力及更高的预测精度. 通过K均值聚类分析并建立相应簇的最优模型，使得文中的二阶段预测得到更稳定及更接近实际值的输出.

图6 训练结果Fig.6 Training results

图7 预测结果Fig.7 Predictive results

为更直观地比较以上3种模型的预测结果，选择三个误差指标对预测值计算评估. 三个误差指标分别为：平均绝对误差(MAPE)，表示预测结果的可信程度；最大相对误差(Emax)，反应预测结果的稳定性；均方根误差(RMSE)，表征预测结果的离散程度. 计算公式如下：

(10)

(11)

(12)

式中：n为总样本数；Y(i)为期望值；Y*(i)为预测值.

表1 误差计算结果

从表1计算结果可以看出，文中基于K均值小波神经网络的二阶段预测平均绝对误差为4.01%，比BP神经网络和小波神经网络模型分别降低了2.62%和3.65%，有效提高了预测精度；另一方面，从3种模型的最大相对误差(Emax)和均方根误差(RMSE)对比分析可知，本文预测方法明显降低，具有更优的稳定性和抗干扰能力. 综上对3个模型的MAPE、Emax及RMSE分析对比，文中基于K均值小波神经网络的二阶段预测模型具有更优越的预测效果，在空调负荷预测中的应用是可行、有效的.

2.2.4 聚类不同簇个数对比分析

表2 不同簇个数预测误差

为深入对本文模型的性能进行探索研究，文中分别聚类3、 4、 5个簇进行实验对比. 将3种聚类的空调负荷预测结果按式(10)～(12)三个误差指标进行对比，误差计算结果如表2所示.

由表2可知，当聚类4个簇时预测效果最佳，簇个数为5时的预测效果不如簇个数为3和4. 结果表明增加聚类的簇个数可以有效消除样本数据的高噪声和非平稳性，但伴随着每个簇的样本点数目的减小使模型训练欠学习导致泛化能力下降，而增加到一定个数后，后者对模型性能不利影响越来越占主导因素，所以在建模过程中为保证模型具有更好的鲁棒性应要选择合适聚类簇的个数.

2.3 实例分析2

图8 预测结果Fig.8 Predictive results

为验证本文的二阶段空调负荷预测模型对其他建筑具有普遍适用性，对南方地区的另一栋建筑的实测空调负荷进行实验. 选用该建筑6-9月份共122组的日空调负荷值作为实验的建模样本数据，其中6-8月份的负荷值(共92组样本点)作为训练集， 9月份的负荷值(共30组样本点)作为验证集. 本次实验对样本集聚类成3个簇，同时建立独立的WNN和BPNN模型作比较， 3种模型预测结果如图8所示. 从图中可以看出二阶段预测模型的拟合效果明显优于其他两种模型，有效地减小了预测滞后现象的发生，具有更好的预测效果.

表3 误差计算结果

将3种模型的空调负荷预测结果按式(10)～(12)三个误差指标进行分析对比，计算结果如表3所示.

从表3可得，本文基于K均值小波神经网络的二阶段空调负荷预测模型预测结果的Emax、 MAPE及RMSE 3个指标计算值均小于其他2种模型，表明该预测方法具有更好的精确度和可靠性.

3 结语

1) 利用K均值聚类算法可以有效消除样本数据的高噪声和非平稳性，但聚类的簇个数过多每个簇的样本点数目的减小使模型训练欠学习、泛化能力下降，为保证模型具有更好的鲁棒性应选择合适聚类簇的个数.

2) 通过3种性能评价指标分析对比，本文的二阶段预测模型预测效果均优于传统独立的WNN和BPNN模型，具有更好的预测精度和可靠性.

参考文献：

[1] 段艳艳. 空调负荷预测的现状和发展[J]. 制冷与空调, 2012(3): 300-304.

[2] 孙育英, 王丹, 王伟, 等. 空调运行负荷预测方法的研究综述[J]. 建筑科学, 2016, 32(6): 142-150.

[3] LI X M, DING L X, MING S,etal. A novel air-conditioning load prediction based on ARIMA and BPNN model[J] Conference on Information Processing, 2009, 1(1) : 51-54.

[4] 李云. 改进的小波神经网络结构优化算法及其应用研究[D]. 重庆：西南大学, 2016.

[5] ALEXANDRIDIS A K, ZAPRANIS A D. Wavelet neural networks: a practical guide[J]. Neural Networks, 2013, 42(1): 1-27.

[6] LIAO G C . Hybrid improved differential evolution and wavelet neural network with load forecasting problem of air conditioning[J]. International Journal of Electrical Power & Energy Systems, 2014, 61(1): 673-682.

[7] 祖哲, 毕贵红, 刘力, 等. 基于小波神经网络的电力系统短期负荷预测模型研究[J]. 计算机技术与发展, 2012(10): 237-241.

[8] 陈标. 短期电力负荷的小波神经网络预测[D]. 长沙：湖南大学, 2012.

[9] 欧陈委.K-均值聚类算法的研究与改进[D]. 长沙：长沙理工大学, 2011.

[10] HAN J W, KAMBER M. 数据挖掘概念与技术[M]. 范明，孟小峰，译. 2版. 北京：机械工业出版社, 2008.

[11] 吴晓蓉.K-均值聚类算法初始中心选取相关问题的研究[D]. 长沙：湖南大学, 2008.

[12] 张清华. 小波神经网络参数优化及其应用[D]. 哈尔滨：东北农业大学, 2009.