APP下载

聚类分析在公共建筑能源系统优化运行中的应用研究

2022-01-25叶从周上海市建筑科学研究院有限公司上海200032

建筑科技 2021年6期
关键词:电表能耗聚类

叶从周(上海市建筑科学研究院有限公司,上海 200032)

随着新一代信息技术的发展,人工智能技术在建筑节能减排上的应用越来越受到重视,尤其在建筑能源管理系统(Energy management system for Interligent Building ,BEMS)的领域中,通过人工智能 AI 与物联网技术的相结合(AIoT 技术),使得建筑智能化水平得到显著提高[1]。

BEMS 借助目前的物联网技术,将智能电表等设备采集的能耗及建筑运行数据汇总整理,可用于优化建筑用能,然而,目前楼宇内 BEMS 主要用于支持能源实时计量与分项分类数据的统计分析,对于推动能源优化管理、用能系统智慧运行的功能相对较弱,BEMS 在建筑能效提升中的作用没有得以充分发挥。

在此背景下,本文引入聚类分析技术,研究其与建筑能源管理系统的结合应用,通过开展相关的数据试验,为大数据技术支撑建筑能源系统优化运行构建适合的方法。

1 聚类分析及其在建筑节能领域的应用

1.1 时间序列聚类

聚类分析是一种挖掘大量未知分类的相似数据背后是否某种信息或者规律的数据挖掘技术,而其中时间序列聚类,则是指对一组按时间顺序变化的数据进行聚类。时间序列聚类一般可以根据时间序列的分段方式,分为三种方式[2]:完整时间段聚类、子序列时间段聚类以及时间点聚类。本文主要采用了完整时间段聚类的方式,来对建筑能耗数据进行聚类。

1.2 在建筑节能领域的应用

时间序列聚类在建筑节能领域的主要应用有三种[2]:识别时间序列数据中的动态变化、预测与推荐以及模式识别。在建筑节能领域,基于时间序列聚类分析的主要研究有:建筑用能的模式识别[3-4]、需求侧管理、建筑用能预测、建筑用能异常数据检测。BEMS 主要包含两大应用场景:建筑用能系统运行管理和设备设施维护维修管理。如能将时间序列聚类的应用模式与BEMS的应用场景相结合,则能发挥该项技术对公共建筑能源管理运行策略和设备运维的重要作用。

2 研究思路及试验方法

本文选取某栋建筑的某块电表全年采集数据建立样本,引入时间序列聚类算法,开展数据试验,通过对建筑用能时间序列数据的曲线进行分类分析,从中寻找建筑能耗变化与分布特征,形成对能耗数据、设备维护、节能管控措施的指导意见,并建立相关模型,为研究结果向其他电表、建筑等更大范围的推广提供准备。

试验方法如下:首先,提取某电表一整年的小时总能耗数据,将整年数据划分为一个 365×24 的矩阵,以天为单位,一天24h 组成一条时间序列曲线,共建立 365 条时间序列曲线;通过混合多种聚类算法清洗数据,剔除异常曲线;将清洗后数据进行二次聚类;分析聚类之后的结果,统计所处分类的能耗曲线的所在月份、天气等数据信息,为建筑能耗模式识别和能耗预测做好准备。试验流程如图 1 所示。

图1 试验流程图

3聚类算法选型以及特征维度选择

基于以上研究思路,本试验选用 K-means 和 DBSCAN两个聚类算法,并依据能耗数据特征,选择K-means 特征维度。

3.1 K-means

K-means 聚类是最著名的聚类算法之一,在时间序列领域应用广泛[11-12],其原理为通过将数据分为K 个簇中,使得簇内的各个数据到中心点的距离差平方和最小。K-means算法最重要的是如何定义簇的数量K和如何定义距离的计算方式。

在建筑能源管理中,通常根据设备用途,将建筑用电分为照明、空调、动力以及特殊用电。其中,照明与动力用电受工作日因素的影响较大,而空调用电则受季节因素的影响较大。基于此,试验中将 K 设置为 6,即(过渡季,供热季,供冷季)×(工作日,节假日)[5]。

针对时间序列数据,计算距离的方式,常用的有欧几里得距离、皮尔森系数、DTW 等。根据建筑能耗数据的特点,本试验选择欧几里得距离作为判断每个点到每个簇中心距离远近的指标。原因在于:建筑能耗时序数据与建筑设备(如:空调、照明灯具)的开关时间,有着强相关性,这一特点在办公类建筑的表现尤为明显。所以,在通过聚类计算能耗时间序列曲线相似度的时候,不能采用诸如 DTW 等算法,原因是这类算法主要用于计算时间序列数据波动趋势的相似度[6],而建筑能耗曲线则是需要相同时间点的能耗在计算距离时一一对应,计算各条由 24 个点 /d 组成的能耗曲线相互之间相似度。通过 K-means 聚类算法,得到每个簇的中心,使得簇心曲线上的每个点有其实际的物理意义,为之后的设备运行策略优化提供统计学意义上的支撑。

3.2 DBSCAN

DBSCAN 是一种基于空间密度的聚类算法,在对能耗负荷进行数据分析的研究中,已有广泛的讨论和应用。在建筑能耗数据的采集过程中,由于仪表异常,统计错误等因素,造成能耗数据分析的困难。因此,需要对数据进行必要的清洗。本试验将采用 K-means 和 DBSCAN 混合的方法,先用K-means 聚类对能耗数据进行划分,再对划分后的能耗数据分别进行 DBSCAN 聚类,将其中被识别为异常的能耗曲线剔除,为之后的算法分析提供更有价值的能耗数据。

4 试验过程及其结果分析

4.1 试验过程

本试验样本数据来源于上海某办公建筑高压电表 2020年全年能耗数据集,试验过程随机挑选了其中一块电表开展研究。

首先,整理一年数据去除有缺失的天数,然后对其进行首次聚类,聚类部分结果如图 2 所示。

图2 对电表能耗数据第一次聚类

然后,对聚类后的每一类数据进行二次密度聚类(DBSCAN),结果如图 3 所示,其中虚线被算法判断为脏数据:

图3 通过密度聚类清洗数据

对清洗后的数据再次进行 K-means 聚类,结果如图 4所示。

图4 K-means 聚类后每一类的簇中心

4.2 结果分析

观察图 4 发现:簇心曲线趋势基本相同,主要区别在于开关机时间(曲线升高幅度变大所在时间)、工作时间用能和非工作时间用能高低。其中,类别 0 及类别 1 曲线开机时间为早上 6 点左右而,其他颜色的曲线开机时间则是早上 5点左右,而关机时间则皆为晚上 22 点左右。

进一步对聚类结果进行统计分析,结果如表 1 所示,该表统计了各类别在全年 12 个月以及工作日、非工作日所占的天数。某类别在某月中所占天数越多,说明越符合该月份的用能规律。观察表内数据,可以发现每一个簇的曲线波动趋势,和月份有显著关系,说明电表用能与各月份所在季节有着强相关性,这符合本试验针对供热季、供冷季和过渡季来设置 K-means 聚类中 K 个簇的预期。

表1 聚类后统计结果单位:d

分析能耗曲线的月份分布情况,可以发现类别 0 和类别2 表征了 2、3 和 4 月份用能规律,类别 1 表征了 7 月与 12月、类别 3 表征了 8 月至 12 月、类别 5 则表征一部分 9 月及 10 月;而工作日和非工作日分布均匀,对该电表的能耗无明显影响,推测该电表所在区域为非办公场所,查阅楼宇配电文件得知:该电表用电正是位于该楼 B 1 层的观光及餐饮区域,故该统计结果反映的运行特征基本符合预期,说明聚类具有实际物理意义,可以为进一步分析提供数据支撑和实际意义。

又以 9 月中旬至 10 月中旬为例,分析聚类结果与日期、天气的对应关系,如表 2 所示,发现:类别 3 曲线和类别 5 曲线所处日期段在天气和节假日的分布上无明显差别,即天气和人流量应对能耗无特别影响,能耗曲线上却出现高低差异,可推测在该电表下,存在节能空间。

表2 聚类结果(部分)与日期、天气对应表

进一步,将实际值与簇心值以及每个类的上四分位与下四分位作对比,如图 5 、图 6 所示。

图5 逐时能耗值与每类簇心值及上、下四分位值的对比—高于上四分卫

图6 逐时能耗值与每类簇心值及上、下四分位值的对比—低于下四分卫

如图所示,当实际值出现明显高于或低于合理范围时,可能是用能异常的表征,此时 BEMS 可以记录具体问题发生时间点,并针对不同的用能异常现象,提示相应的管理建议;如果用能过高,可根据数据所在时刻,排查是否因额外活动造成用能升高、是否存在非正常使用或应关未关的设备,并统计过高用能出现频次,为优化设备管理流程、合理使用能源指明方向,对于存在条件的楼宇,BEMS 可将判定结果及管控策略发送至楼宇自控系统,由其自动执行所需的自检和优化。当出现数据显著波动,则考虑电表故障,此时BEMS 可统计数据波动出现频次,并提示物业排查问题,若电表并无损坏,则怀疑电表所接设备存在频繁重启,进一步提示物业排查电表所接设备是否损坏及是否需要及时更换,以避免不必要的用能损耗以及建筑内人员不适。从聚类分析结果推导建筑能源系统优化运行策略的流程如图 7 所示。

图7 从聚类分析结果推导建筑能源系统优化运行策略的流程

5 结 语

本文以基于聚类分析的面向公共建筑的能耗管理优化运行策略中的应用研究,以上海某办公建筑的电表监测数据为对象,通过混合聚类分析,开展数据试验。在试验中分别使用了 K-means 和 DBSCAN 两种聚类算法,发现使用K-means 聚类算法对能耗数据进行分类,分类结果具有实际物理意义,与该电表计量位置的功能相符;对聚类结果开展进一步分析,结合天气或者节假日等数据,可用于判断建筑用能是否存在异常,为推导可能出现用能异常现象背后的原因提供统计学意义上的逻辑支撑,从而为业主在节能减排上提供支持。

本文的研究验证了聚类分析算法在建筑能耗异常数据检测、建筑用能模式识别中的可用性,未来,本文工作成果可通过嵌入楼宇能源管理平台实现规模化推广应用,同时,还可面向建筑用能预测、需求侧管理的目标持续深入开发,以更充分地挖掘聚类分析在建筑能源系统优化运行中的价值,为实现建筑节能降碳提供更重要的支撑。

猜你喜欢

电表能耗聚类
巧判电表测量对象
120t转炉降低工序能耗生产实践
能耗双控下,涨价潮再度来袭!
电表“对”与“错”归类巧掌握
探讨如何设计零能耗住宅
基于K-means聚类的车-地无线通信场强研究
Cartoons
日本先进的“零能耗住宅”
基于高斯混合聚类的阵列干涉SAR三维成像
一种层次初始的聚类个数自适应的聚类方法研究