APP下载

mRMR和PSO算法对神经网络预测模型优化效果

2024-02-22杜润琪刘益民

煤气与热力 2024年1期
关键词:住宅楼互信息供热

杜润琪, 于 丹, 刘益民, 岑 悦

(1.北京建筑大学, 北京 102627; 2.中国建筑科学研究院有限公司, 北京 100013)

1 概述

随着科技进步,传统集中供热正向智慧供热发展[1]。利用人工智能算法对供热负荷进行准确预测,是实现供热系统优化调节及节能运行的先决条件与迫切需求[2]。

当前已有研究人员对供热负荷预测进行了相关研究[3-6]。BP(Back Propagation)神经网络适用于对供热负荷这类非线性对象的预测建模[7],但存在收敛速度慢及易陷入局部极小值等缺陷[8]。因此,本文提出利用最大相关和最小冗余(Maximum Relevance and Minimum Redundancy,mRMR)算法对BP神经网络预测模型的输入变量进行特征选择,加快BP神经网络预测模型的收敛速度并提高预测精度,得到mRMR-BP神经网络预测模型。然后利用粒子群优化(Particle Swarm Optimization,PSO)算法优化mRMR-BP神经网络预测模型初始参数,进一步提高预测模型预测精度并避免陷入局部极小值,最终建立PSO-mRMR-BP神经网络预测模型。对实际住宅楼进行供热负荷预测,评价3种神经网络预测模型的预测效果。

2 mRMR算法与PSO算法

① mRMR算法

BP神经网络预测模型的拓扑结构受输入节点数量的影响,因此确定合理的输入节点数量对提高BP神经网络预测模型的收敛速度及预测精度至关重要[9]。本文采用mRMR算法选取BP神经网络预测模型输入变量集合。

mRMR算法是一种基于互信息理论的封装式特征选择方法[10],互信息是信息论中用于度量变量间相关性的一种参数(互信息越大,表明相关性越强)。mRMR算法的功能为在原始输入变量集合中找到与目标变量相关性最大,但是输入变量之间冗余最小的输入变量集合。

基于mRMR算法,可计算得到各输入变量(共m个输入变量)与预测目标变量的互信息,并按照由高到低的顺序进行排序。基于各输入变量互信息的排序结果,选择序列中1~m个输入变量作为预选输入变量集合,输入BP神经网络预测模型中进行训练,以预测结果的均方根误差(Root Mean Square Error,RMSE)最小作为评价指标,选取最佳mRMR-BP神经网络预测模型,对应的预选输入变量集合即为最优输入变量集合。

② PSO算法

PSO算法是一种模仿鸟群社会行为的智能优化算法,可用于解决非线性、不可微、多峰值的复杂问题[11]。算法中的每个粒子都代表问题的一个潜在解,用位置、速度、适应度值3项指标表示该粒子特征,通过不断迭代更新粒子的速度和位置达到全局最优解。

由于mRMR-BP神经网络预测模型会随机对初始参数进行赋值,易陷入局部极小值,因此本文利用PSO算法对mRMR-BP神经网络预测模型的初始参数进行优化。通过PSO算法搜索全局最优初始权值和阈值,并将计算得到的最优初始权值和阈值赋予mRMR-BP神经网络预测模型,最终得到优化后的PSO-mRMR-BP神经网络预测模型。

3 预测模型优化步骤

a.从实际工程中得到输入变量数据及供热负荷数据。

b.基于mRMR算法计算各个输入变量的互信息,并按照互信息由高到低对输入变量进行排序。

c.选择序列中1~m个输入变量作为预选输入变量集合,输入BP神经网络预测模型进行训练。

d.以RMSE最小为评价指标,选取最佳mRMR-BP神经网络预测模型,对应的预选输入变量集合即为最优输入变量集合。

e.经过mRMR算法优化后确定mRMR-BP神经网络预测模型的拓扑结构,初始化mRMR-BP神经网络预测模型。以模型预测结果的相对误差绝对值作为个体适应度值,利用PSO算法优化mRMR-BP神经网络预测模型的初始权值和阈值。

f.训练模型,直至预测值与实际值满足相对误差绝对值小于等于0.01后停止训练。

4 预测效果评价

① 工程概况

北京市某住宅小区共16栋住宅楼,热力站设在地下一层,每个楼栋口安装调节阀。监测数据均来自设置在热力站内的二级管网监控平台。采样时间间隔在监控平台中已经设定,本次仅调取各监测数据的逐时平均值。监测数据包括室外温度、室外风速、室外相对湿度、二级干管供水温度、二级干管回水温度、二级干管供水压力、二级干管回水压力、二级干管流量、二级循环泵运行频率、住宅楼室内温度、住宅楼流量、住宅楼供热负荷、楼栋口调节阀开度、热力站供热负荷。

② 数据来源

以小区内某栋住宅楼为研究对象,对该住宅楼供热负荷进行预测。住宅楼供热面积为7 000 m2,共有48户住户。2 259组数据样本来自该住宅楼2019—2020年供暖期,每组数据的采样间隔为1 h。

③ 缺失值与异常值处理

直接删除连续12 h缺失的数据,其余缺失数据采用K最近邻(K-Nearest Neighbors,KNN)算法,根据缺失样本周围K个邻近样本的平均值进行填充[12]。利用拉依达准则[13]筛选过大、过小等异常值,并删除含有异常值的数据组。处理后的有效数据为1 889组。

④ 模型训练数据和验证数据

随机抽取处理后的1 789组数据,作为BP神经网络预测模型的训练数据,基于MATLAB平台建立BP神经网络预测模型以及进行mRMR算法、PSO算法优化。经随机抽取后剩余的100组数据用于预测模型验证。

⑤ 最优输入变量集合

以住宅楼当前供热负荷为预测目标变量,考虑到居住建筑的热惰性,引入住宅楼前3 h、2 h、1 h供热负荷,共计16个输入变量,利用mRMR算法筛选出最优输入变量集合。由mRMR算法得到的16个输入变量的互信息见表1。由互信息可知,二级干管回水温度与住宅楼当前供热负荷的相关性最强,相关性最弱的是住宅楼室内温度。

表1 16个输入变量的互信息

根据输入变量相关性排序结果,从1~16号输入变量依次选取输入变量集合。利用BP神经网络预测模型进行训练,得到16个预测模型。预测模型RMSE随输入变量数量的变化见图1。输入变量数量为1时,输入变量仅为二级干管回水温度。输入变量数量为2时,输入变量为二级干管回水温度、楼栋口调节阀开度。以此类推。由图1可知,输入变量数量为12时,预测模型RMSE最小,此时输入变量集合为最优输入变量集合。

图1 预测模型RMSE随输入变量数量的变化

⑥ 神经网络预测模型的拓扑结构

与mRMR-BP神经网络预测模型、PSO-mRMR-BP神经网络预测模型对比的BP神经网络预测模型共有16个输入变量,因此输入节点数量为16。预测模型的输出为住宅楼当前供热负荷,即输出节点数量为1。因此,BP神经网络预测模型的拓扑结构为16-33-1[14]。

mRMR-BP神经网络预测模型、PSO-mRMR-BP神经网络预测模型均基于最优输入变量集合建立,最优输入变量集合中有12个输入变量,即输入节点数量为12,预测模型的输出同样为住宅楼当前供热负荷。因此,mRMR-BP神经网络预测模型、PSO-mRMR-BP神经网络预测模型的拓扑结构均为12-25-1[14]。3个模型均为多输入、单输出结构。

⑦ 预测效果评价指标

本文选择平均相对误差(Mean Relative Error,MRE)绝对值、RMSE、最大绝对误差绝对值作为预测效果评价指标。3种评价指标的值越小,说明预测结果越接近实际,预测模型的预测效果越好。

⑧ 预测效果评价

将经过随机抽取后余下的100组数据样本作为验证数据进行验证,得到BP神经网络预测模型、mRMR-BP神经网络预测模型、PSO-mRMR-BP神经网络预测模型的预测结果。3种神经网络预测模型的预测值与实际值见图2。由图2可知,3种神经网络预测模型预测值的变化趋势与实际值均基本一致。与BP神经网络预测模型、mRMR-BP神经网络预测模型相比,PSO-mRMR-BP神经网络预测模型预测值更加接近实际值。

图2 3种神经网络预测模型的预测值与实际值

3种神经网络预测模型预测值与实际值的绝对误差见图3。由图3可知,与BP神经网络预测模型、mRMR-BP神经网络预测模型相比,PSO-mRMR-BP神经网络预测模型预测值与实际值的绝对误差的绝对值更小。

图3 3种神经网络预测模型预测值与实际值的绝对误差

3种神经网络预测模型的预测效果评价指标见表2。由表2可知,BP神经网络预测模型的MRE绝对值、RMSE、最大绝对误差绝对值均最大,为3种神经网络预测模型中预测效果最差的预测模型。PSO-mRMR-BP神经网络预测模型的MRE绝对值、RMSE、最大绝对误差绝对值均最小,为3种神经网络预测模型中预测效果最佳的预测模型。说明,在经过mRMR算法对预测模型输入变量进行筛选以及PSO算法对模型初始参数进行优化后,预测模型的预测效果显著提高。

表2 3种神经网络预测模型的预测效果评价指标

5 结论

在3种神经网络预测模型中,BP神经网络预测模型的预测效果最差,PSO-mRMR-BP神经网络预测模型的预测效果最佳。与BP神经网络预测模型相比,经过mRMR算法对输入变量进行筛选以及PSO算法对初始参数进行优化,PSO-mRMR-BP神经网络预测模型的预测效果显著提高。

猜你喜欢

住宅楼互信息供热
某住宅楼的混凝土点状爆裂原因分析
近期实施的供热国家标准
住宅楼钢筋结算特点分析
御康山庄高层住宅楼桩选型研究
PPP模式应用于城市供热项目分析
基于互信息的贝叶斯网络结构学习
联合互信息水下目标特征选择算法
改进的互信息最小化非线性盲源分离算法
基于增量式互信息的图像快速匹配方法
高层住宅楼电气工程设计