APP下载

多联机系统涡旋式压缩机回液故障在线诊断模型研究

2021-08-18钟寒露周镇新陈焕新吴俊峰

制冷技术 2021年3期
关键词:测试数据决策树压缩机

钟寒露,周镇新,陈焕新*,吴俊峰

(1-华中科技大学能源与动力工程学院,湖北武汉 430074;2-压缩机技术国家重点实验室(压缩机技术安徽省实验室),安徽合肥 230031)

0 引言

在我国,空调是用电量的主要组成部分之一,它约占整个住宅用电量的30%[1]。多联机由于其能耗低、热舒适性高和灵活的安装方式被广泛应用于各类建筑中[2]。多联机系统是种通过控制压缩机制冷剂循环和制冷剂液体进入室内换热器的流量来满足室内冷热负荷的直接蒸发式制冷系统[3]。多联机系统通过满足不同室内负荷需求和独立单元控制来提供灵活性[4]。

压缩机是多联机系统中重要的组成部分,一旦受到损坏或发生回液等可能的故障,最终会造成系统故障和经济损失[5]。BREUKER 等[6]的研究表明,压缩机故障会产生最高昂的维修费,约占单体式空调系统维修费用的24%。多种故障都会导致回液,造成阀门、连杆和活塞损坏,如蒸发器或冷凝器盘管结构、制冷剂过充和膨胀阀故障等[6]。此外,液态制冷剂还可能导致机油从压缩机壳体中带出,从而造成暂时性的润滑损失[6]。在封闭式压缩机的多联机系统中,若发生机械故障,必将产生高昂的更换压缩机的费用[7]。因此,为了减少多联机系统的损坏和保持室内舒适度[8-9],及时诊断压缩机回液故障十分必要。

尽管压缩机回液故障愈发受到重视,但在公开文献中,与其他组件故障相比,如制冷剂泄漏[10-12]、传感器故障[13-14],仅有少量研究致力于诊断回液故障。以往关于压缩机的故障研究主要集中在密封泄漏[15]、阀故障[16]、活塞沉降[17]和结垢[17]上。只有BREUKER 等[6]和WANG 等[7]对回液做过一些研究。BREUKER 等[6]给出了造成回液的几种原因,但是没有给出具体的诊断方法。WANG 等[7]基于数据驱动的方法对压缩机回液进行离线诊断,但没有验证模型的在线诊断能力。

主成分分析[13,18-19]和决策树[7,19-20]因其优越的性能而被广泛应用于数据驱动的故障检测与诊断模型中。主成分分析可以通过正交变换和主成分提取将一组高维、可能相关的变量转换为低维线性不相关变量,以达到降维和信息提取的目的[22]。决策树通过树形结构来呈现决策/分类过程,具有决策简单和可解释性强的优点。因此,本文结合主成分分析和决策树来诊断压缩机回液故障。

本文首先利用相关分析和专家知识消除冗余变量,将离散数据集分为训练数据集和测试数据集。然后由主成分分析处理训练数据集,采用分类决策树算法构建主成分分析-决策树分类模型。最后采用主成分分析-决策树分类模型诊断在线数据。测试数据集用来验证模型的准确性,将两个在线实时数据导入已建立的模型中,以检测在线故障诊断性能。

1 基于主成分分析-决策树方法的回液诊断策略

1.1 主成分分析

主成分分析已成为统计中典型的降维和信息提取方法。本文将介绍信息提取理论的概述。主成分分析的其他详细理论可在文献[13,23-25]中找到。

假设有n维样本集Q=(x(1),x(2),...,x(m)),首先按照式(1)对所有样本进行中心化,以获得集中样本集Q1。

根据等式(2)获得数据集的协方差矩阵,然后根据等式(3)对矩阵XXT进行特征值分解。在式(3)中W是XXT的n′特征向量的矩阵,而λ是XXT的特征值。

接着取出最大的n′个特征值的特征向量(w1,w2,...,wn'),并对所有特征向量进行归一化以形成特征向量矩阵W。并根据公式(4)对每个数据集中的每个样本x(i),转换为新的样本z(i)。

最后得到输出的新数据集Q′=(z(1),z(2),…,z(m))。此外,新得到的主元变量均为原始变量x的线性组合,且各主元变量之间互不相关。

1.2 分类决策树方法概述

决策树算法经过不断的发展,目前被广泛用于数据挖掘和机器学习领域[26],因其以树形结构呈现决策/分类过程而具有决策简单和可解释性强的优点。当前可用的两种最常见的决策树算法为分类决策树[27]和C4.5[28]。本文利用分类决策树建立决策树模型,对压缩机液体回液进行故障诊断。

分类决策树算法[7,21,29]是一种二进制递归分割技术。当前样本分为两个子样本,因此生成的每个非叶子节点都有两个分支,生成的决策树是简单的二叉树。图1所示为用于多联机故障诊断的基于分类决策树的树结构,“正常”表示真实的正常数据样本,“故障”表示真实的液体回注故障数据。一棵完全生长的树通常会考虑每个属性,这会导致树很大且过拟合。因此,我们通常使用复杂度参数或最大树深度来更改树结构。

图1 用于多联机分类的基于分类决策树的树结构

1.3 故障诊断策略概述

在线故障诊断策略如图2所示。它主要包括3个阶段:数据收集和处理、模型构建和测试以及在线故障诊断。

图2 主成分分析-决策树故障诊断方法流程

第一阶段是数据收集和处理。将传感器按时序获取的原始多联机系统运行参数进行积分,并剔除缺失值。相关分析的结果用作选择变量的基础。

第二阶段是模型构建和文本。将采集数据的2/3用作训练数据,1/3 用作测试数据。主成分分析方法用于重建数据以获得新的主成分变量。然后将新的主成分变量用作分类与回归树的输入变量,以建立故障诊断训练模型。将测试数据作为验证集来验证模型的准确性。通过混淆矩阵[30-31]评估故障诊断的准确性。

第三阶段是在线故障诊断。传感器收集多联机系统的实时运行数据,并将其传输到已建立的故障诊断模型,以执行压缩机回液故障在线诊断。

2 实验装置和数据准备

实验操作和数据收集均严格按照相关准则进行,以确保实验和数据的完整性和可靠性。

2.1 实验装置

图3所示为实验系统和主要传感器分布。由图3 可知,多联机系统由5 个室内机和1 个室外机组成。为了清晰显示制冷剂的流动方向,实线表示高压管道,而虚线表示低压管道。

此多联机系统使用的是R410A 制冷剂,标准充注量为9.9 kg。室外机和室内机的额定容量分别为28 和7.1 kW。本文将压缩机进气管的表面结霜视为压缩机回液的外部表现。应该注意的是,故障2模型的运行工况不同于正常模式和故障1。将室内干球温度Ti从22 ℃调整到10 ℃,将室外干球温度To从7 ℃更改为-7 ℃,以确保观察到结霜状态。详细的实验条件如表1所示,室内机开机台数为n。

表1 3 种模型的详细测试条件

两种引起回液的方法:1)图3 中的方法#1,是通过铜管将高压侧液体制冷剂旁路到蓄能器入口;2)图3 中的方法#2,是在140%的制冷剂充注量下实现的。正常充注水平应为100%。两种方法的最终结果都是在多联机系统中造成回液。

图3 实验系统及主要传感器分布

2.2 实验数据

所有传感器都在实验之前进行了校正,以确保测量值的准确率。数据采集软件将会把系统上传感器采集到的数据每3 s 记录一次并保存。剔除缺失值后,实验总共获得了17,217 条离线数据,其中包括7,478 条正常数据,9,739 条回液数据。所有收集到的离线数据有2/3 被划分为训练数据,其余1/3 划分为测试数据。具体如表2所示。将故障1 和故障2 视为同一种回液故障。

表2 不同类型数据集中的样本数

初始监视变量最多可以有50 个,但是许多状态变量是布尔型的,不利于故障检测与诊断模型的开发。在消除了控制变量和布尔变量之后,保留了10 个最佳变量,1~6 为温度变量,7~8 为运行电流,9~10 为运行频率,具体如表3所示。

表3 10 个最佳变量类型

3 结果与讨论

3.1 相关性分析结果

在故障检测与诊断模型建立过程中,冗余变量严重影响了训练数据模型的可靠性[32]。因此,消除冗余变量十分重要。图4所示为所有变量的置信矩阵,能直观展示出10 个变量之间的相关性。图4 中的数字越大,说明变量之间的正相关越强,绝对值越接近于1,变量间相关性越强。其中正号表示正相关,负号表示负相关。

如图4所示,有6 组数据相关性大于0.9,甚至有的变量几乎完全相关。如Tcom.shell和Tcom.dis、Tevap和Taccu.out、Ifan和ffan、Tcond和Icom等。注意,一些变量和多个变量都是强相关的,如Tcond甚至与三种变量有强相关性。在专家变量知识与保证模型精度相结合的原则下,剔除了4个变量:Tcond、Tevap、Tcom.shell和Ifan,还剩6 个变量:ffan、Tcom.dis、Taccu.in、Taccu.out、Icom和fcom。

图4 初始变量的置信矩阵

3.2 主成分分析结果

将所有离线数据分为两部分,其中三分之二作为建模数据,三分之一作为测试数据。正如在1.1 节中所讨论的,主成分分析具有信息提取和降维的优点。因此,首先对收集到的数据变量进行主成分分析,然后形成新的主成分变量作为决策树模型的输入变量,从而有效避免了模型由于信息技术的深度限制而造成的信息利用不完全的影响。

从1.1 节的结果可知,新形成的主成分变量是原始变量的线性组合,组合系数如表4所示。组合系数的绝对值越大,主成分包含的原始变量的信息越多,其表示形式越强。例如,主变量1(RC1)中的最大组合系数为0.86,它对应于原始变量Taccu.out。因此,RC1 是原始变量Taccu.out的最强代表。

表4 新主元变量的组合系数

3.3 训练和测试模型结果

以主成分分析形成的主成分变量作为分类决策树算法的输入变量,得到压缩机液回液故障诊断模型,如图5所示。该模型最后使用RC1 和RC5两个主要变量进行故障诊断。为了避免模型过度拟合,决策树深度设置为2。

图5 主成分分析-决策树方法在压缩机液体回液故障诊断中的树状结构

如表5 和表6所示,所提出的主成分分析-决策树方法使用实验测试数据显示出良好的故障诊断性能。训练数据集和测试数据集的总体分类准确性均高达97%。对于故障状况的诊断,训练和测试数据集的准确度高达98.88%和98.77%。只有大约1%的数据无法正确诊断。

表5 基于训练数据集诊断结果的混淆矩阵

表6 基于测试数据集诊断结果的混淆矩阵

3.4 在线诊断结果

由故障诊断模型可知,可以通过监控以下6 个运行参数(fcom、Tcom.dis、Taccu.in、Taccu.out、Ucom和ffan)来诊断压缩机是否发生了回液。文中进行了两个验证主成分分析-决策树模型在线故障诊断的实验,测试条件与离线数据收集之前的测试条件相同。当多联机系统稳定运行时,传感器开始实时传输数据以进行诊断。具体的在线数据集信息如表7所示。

表7 两组在线数据集信息

传感器收集的数据将实时传输到故障诊断模型中。表8 和表9所示为在线诊断结果的混淆矩阵。该模型对故障的诊断准确度超过了98%,这种出色的在线诊断性能表明此模型可用于压缩机回液故障诊断中。实时在线故障诊断结果如图6所示。

表8 基于在线数据集1 诊断结果的混淆矩阵

表9 基于在线数据集2 诊断结果的混淆矩阵

图6 两种运行数据的在线故障诊断结果

为了比较相同类型的诊断,将两种相同类型的诊断结果放在同一张图中。如图6(a)所示,尽管稍后会误判一些正常数据,但在开始的38 min 内,两次在线诊断的准确性非常高,几乎没有错误诊断。通过检查原始数据,大规模错误判断的原因是系统在此时间段内进行了除霜。图6(b)显示了两次故障类型的诊断结果。两次结果均表明,该方法对回液的检测具有良好的诊断效果,只有极少的故障数据无法正确判断。

4 结论

本文提出了一种针对多联机系统压缩机的在线回液故障诊断方法,该方法分三步将决策树与主成分分析结合起来,将11,478 个离线观测数据用于模型建立,采用两个在线实时数据集对在线故障诊断模型进行性能验证,得到如下结论:

1)主成分分析有效整合了变量信息,决策树模型使用两个主元“RC1”和“RC5”作为分类变量;这两个主要元素分别表示原始变量Taccu.out和Tcom.dis;

2)此方法可以在线诊断压缩机回液故障,实验数据和在线数据的总故障诊断准确性分别超过了97%和93%;

3)在线数据的压缩机回液故障诊断准确率高达98%,表明该模型可以进行准确的故障预警,该模型识别正常状态的准确率约为87%,虽然低于整体准确度,但仍可被实际使用。

猜你喜欢

测试数据决策树压缩机
一种针对不均衡数据集的SVM决策树算法
BOG压缩机在小型LNG船舶上的应用
测试数据管理系统设计与实现
浅析特大型往复压缩机组的安装
压缩机组智能控制与节能增效
决策树和随机森林方法在管理决策中的应用
基于自适应粒子群优化算法的测试数据扩增方法
基于决策树的出租车乘客出行目的识别
空间co-location挖掘模式在学生体能测试数据中的应用
基于肺癌CT的决策树模型在肺癌诊断中的应用