APP下载

基于LSTM循环神经网络的盾构机故障预测系统设计

2018-11-13,,,,

现代机械 2018年5期
关键词:数据源盾构可视化

,, ,,

(同济大学机械与能源工程学院,上海201804)

0 引言

随着我国城市化的飞速发展,大量人口涌入城镇,地上空间不断缩减,我国也将发展目光投入到地下空间。盾构机作为隧道推进的主要机械,是一种集机、电、液为一体的大型设备,本身的结构相当复杂,与此同时,盾构机往往工作在潮湿、阴暗、充满灰尘的地下空间,工作环境十分恶劣,这使得盾构发生故障的概率很高,进而会耽误工程进度,大大加剧工程成本。

现阶段,盾构机的整修仍然以工人的手工修理为主,即使经验丰富的工人也会花费大量的时间查找故障原因所在[1],因此,对盾构机在运行过程中进行状态监测及故障诊断就显得尤为重要。文献[2]提出了一种基于机理模型的故障预测方法并在航空发动机以及传感器上进行了验证,但这种基于数学的模型在设备参数较多时精度不高。文献[3]提出了一种针对转子试验台的专家系统,并对其多故障进行诊断,但专家系统往往依赖于专业人员的经验知识,故模型的可依赖度不高。随着大数据时代的来临,深度学习的持续升温,工程设备实时运转数据背后所隐含的健康信息值得我们去深究。因此,实现基于数据驱动的设备故障预测显得尤为重要。

基于数据驱动的的故障预测方法主要有人工神经网络、遗传算法、支持向量机、奇异谱分析等。由于盾构机的故障时间序列参数众多,且获得数据都是较粗糙的数据包形式且精度不高,故很难用单一模型来拟合数据曲线以达到理想的预测效果[4];而混合方法建模过程复杂,受人为因素影响较大,不利于实际应用中推广。随着深度学习技术的不断发展,人工神经网络在应对数据分类时的有效性引起了人们的注意,但神经网络在处理时序数列时将取得的数据视为独立的,故无法模拟时间序列的马尔可夫过程[5],基于此情况便孕育出了循环神经网络(Recurrent Neural Network),它认为系统在某一时刻的输出状态yt不仅与这一时刻的输入xt有关,也依赖于上一时刻的输出yt-1,通过将时间序列输入预测模型,能够对数据进行逐层抽象并提取特征,以达到令人满意的精度。而LSTM则是在RNN的基础上增加了三个“门”操作,以解决RNN存在的难以训练长度过大的时序数据的问题。

本文围绕LSTM循环神经网络展开,在故障预测方面摒弃传统方法中所使用的大量信号处理技术,充分利用LSTM循环神经网络在处理时序数据序列时的优势,并对预测系统架构进行分层,降低了系统的耦合度[6],为设备故障预测系统的通用化提供了参考。

1 LSTM关键技术介绍

本章主要介绍LSTM模型,包括计算过程以及相关的RNN模型。

图1 RNN网络简图(左)及隐藏层细胞 展开结构(右)

st=f(Wssst-1+Wxsxt+bs)

(1)

yt=Wsyst+by

(2)

其中,W表示权重系数矩阵(例如Wxs表示输入层到隐藏层的权重系数矩阵),b表示各层的偏置向量,f表示激活函数(例如sigmoid函数)。

RNN隐藏层之间的神经元是互相连接的,因此数据在层内各神经节点之间是共享的,这也是RNN可以有效处理时序数据的关键之处。RNN在训练时序数据时采用反向传播算法更新各系统参数,故当RNN网络层数较大时易产生梯度消失和梯度爆炸问题。由此,LSTM模型应用而生,它在传统RNN隐藏层细胞的基础上增加了三个“门”,可有效解决RNN在处理长时序数据时存在的问题。经过不断演化,目前应用最为广泛的LSTM模型如图2所示,其中各参数都可由如下的前向计算公式(3)-(8)计算所得:

it=σ(Wsist-1+Wcict-1+Wxixt+bi)

(3)

ft=σ(Wsfst-1+Wxfxt+Wcfct-1+bf)

(4)

zt=tanh(Wscst-1+Wxcxt+bc)

(5)

ct=itzt+ftct-1

(6)

ot=σ(Wsost-1+Wxoxt+Wcoct+bo)

(7)

st=ottanh(ct)

(8)

图2 LSTM隐藏层展开结构

其中,i,f,o分别代表输入门,忘记门以及输出门,c代表细胞状态,s表示隐藏层序列,W表示权重系数矩阵,b表示偏置项,tanh和σ分别表示正切激活函数和sigmoid激活函数。通过在传统RNN的细胞结构中增加三个“门”,LSTM细胞结构可有效遗忘之前的无用信息,保存有效的输入信息,从而更加高效地处理长时间序列。理论上,LSTM循环神经网络可以处理无限长的时间序列。

LSTM循环神经网络在训练数据集时有三个步骤:1)根据前向计算公式计算模型的输出值;2)根据定义的损失函数计算模型的误差,并利用反向传播算法更新各系统参数;3)重复第2步直至模型的准确率保证在允许范围内。

2 预测系统架构总体设计

本文旨在提出一种适用于盾构机故障预测的系统,LSTM循环神经网络只是其中的核心技术,整个系统还包括底部传感器采集数据的预处理、盾构机关键部件的划分及其特征参数的选取等。通过分析,提出了盾构机故障预测系统的四层框架结构,如图3,由下至上依次为设备配置层、数据整合层、故障预测层、可视化层。其中,设备配置层主要负责新增盾构机的配置,数据整合层负责采集数据的预处理及入库操作,故障预测层负责建立预测模型,对盾构机故障进行预测,可视化层负责将诊断结果以直观的形式显示在界面上。

图3 预测系统四层架构

2.1 设备配置层

由于制造商的不同,所制造的盾构机在某些方面有所差异,但在机械结构和整体功能上相差不大,如目前国内用的比较多的海瑞克、小松、铁建等品牌的盾构机,其在机械结构上大都可以划分为刀盘系统、推进系统、注浆系统、螺旋机系统等。设备配置层就是通过为底层设备编写相应的通信接口程序或改变系统的配置参数,使各种类型的盾构机在属性与状态两方面都可以无误地录入到系统中来,接着对录入的盾构机需要进行关键部件的划分,即将盾构机经常发生故障的几大系统选取出来作为故障预测的对象。

2.2 数据整合层

数据整合层是故障预测层能否拥有良好预测结果的基础,良好的数据能有效提高故障预测的准确性。该层的主要功能就是将传感器采集到的数据包进行解析,并通过第三方接口获取盾构机故障预测中所需的各种数据源并对数据进行整合,同时将整合好的数据进行存储并按各功能模块进行划分以利于后续的分析挖掘操作。

通常来说,盾构机相关数据源通常有三个:实时数据源、故障信息数据源、地质数据源。实时数据源记录的是盾构机运转的实时信息,故障信息数据源记录的是盾构机在运行过程中的各种故障记录,而地质数据源记录的是盾构机推进过程中地面的沉降隆起情况。盾构机的实时数据通常存在两种形式:开关量和模拟量,但这两种数据形式在计算机内存中的存储形式是不一样的,模拟量需要8个字节,而开关量仅需要1个字节。底层传感器采集到的实时数据是以数据包的形式进行传输的,数据包既包含模拟量也包含开关量,所以需要对该数据包进行解析才能得到某个测点的实时数据,即首先需要定位被测点的数据在数据包的起始位置,再根据测点所对应的字节长度解析出其相应的数据段。而对于故障信息数据库及地质数据库,其数据库的部署可能与实时数据的数据库不在同一台服务器上,以上海地铁盾构设备工程有限公司与同济大学的合作项目为例,盾构公司提供的故障信息数据库及地质数据库部署在web服务器上,所以通过HTTP—GET的方式请求数据,并将请求到的数据与实时数据源进行整合。整合过程如图4所示,图中显示了这四个数据库的交互示意图,箭头表示数据的流向。

图4 数据源整合示意图

在数据整合完毕后,将所有的信息存入到关系型数据库SQL Server中,并结合盾构机管理以及用户使用所需的模块,可以将数据库系统划分为图5所示的五大模块:区间管理、设备管理、数据处理、分析挖掘、用户管理。

图5 整合数据库五大模块

2.3 故障预测层

2.3.1 模型建立前的数据清洗

经过数据整合层整合之后的数据为一个二维数据列表形式,其中仍然有很多缺失值,因此在建立模型以前,需要对数据集作进一步的清洗。本着对数据库的保护,通常不会直接对数据库进行操作,可以通过数据库导出操作将数据表导出为一张Excel表以方便后续的预测分析。对于数值型的变量采用相应列的平均值来填充空缺值,对于分类型的变量采用相应列中出现频次最多的那个分类来填充缺失值。在数据清洗完毕后,便要进行特征参数的选取,即将设备配置层中盾构机各关键部件运转时所影响的参数选取出来,如刀盘系统的刀盘扭矩,刀盘转速,刀盘马达超负载等;螺旋机系统的水平偏差值,垂直偏差值,螺旋机回路压力等。在各系统选取完特征参数之后,某些参数的值可能很大也可能很小,基于此,可以对所有值进行标准化处理,使其尽量落在一个取值范围内。

2.3.2 LSTM模型建立

本次系统采用监督学习的方式进行故障预测,故在将数据输入模型前,需要对实时数据集及故障数据集做一定的处理使其满足模型的输入数据格式。图6展示了LSTM预测模型的整体框架。本文将实时数据的前百分之七十作为训练集,后百分之三十作为测试数据。对于故障数据集,需要罗列各关键系统可能出现的所有故障形式,并用One-Hot编码法对所有的故障形式进行标注,这样不但能够处理非连续型数值特征,同时也能在一定程度上扩充特征。在对数据标定完之后,我们用数据分割的办法将数据分割为(X1,X2,X3,…,Xn)。接下来,我们将数据集输入隐藏层,从图中可以看出,隐藏层中包含有n个前后相连的LSTM细胞,其中cn-1和sn-1分别为前一个LSTM细胞的工作状态和输出,其推导公式见第一章的公式(3)-(8),经过隐藏层后的数据将会到达模型输出层的分类器,进而得到实际的故障类型输出。单次训练输出的真实值与理论值之间往往有较大的差距,故需要选取一个损失函数来评判真实值与理论值之间的误差,此系统中定义训练过程的损失函数如公式(9):

图6 LSTM预测模型整体框架

(9)

其中,h为数据集样本数,l为数据集的特征数目,pi为实际输出值,yi为理论输出值。设定损失函数最小为优化目标,给定网络初始化的随机种子数seed及学习率,应用优化算法不断更新网络参数,进而得到最终的隐藏层网络。

2.4 可视化层

可视化层通过开发大量的页面构件,并与后台数据进行绑定,从而实现页面的可定制化。它主要将实时监控的盾构机关键部件以图表和文字的方式显示在页面上,并对盾构机的实时数据进行预测诊断,最终以合适的报表形式将预测的结果显示在界面上。其可视化界面如图7所示。

图7 可视化界面

从图中可以看出,盾构机故障预测系统的可视化界面是在2.2节中的五大模块的基础上增加了一个用户配置模块,可以为系统配置具有操作该系统资格的用户的信息。其它模块根据各自业务的不同对数据进行展示,或根据功能划分对系统进行管理、配置。

3 预测效果显示

本文将以盾构机刀盘系统中的轴承作为故障预测的对象,将轴承出现的故障形式进行相应的编码,并利用搭建的模型对训练数据集进行训练,接着用验证集来验证模型的精度使其达到满意的范围,最后再利用此模型对从数据库中随机取出的一组轴承数据进行故障预测,并将故障类型显示在可视化界面上。

3.1 模型的搭建及训练

本数据集中轴承的实时参数共计2000个,对应的轴承故障形式也有十种(0表示安全,1表示内圈轻度磨损,2表示内圈中度磨损等),首先需要将数据集中的实时参数数据及故障标签数据做一定的处理使其满足诊断模型的要求,接着需要一层一层的叠加神经网络层以构成完整的LSTM循环神经网络模型,最后对模型进行训练及测试。图8中的代码给出了模型的搭建及训练过程。

图8 模型的搭建及训练过程

3.2 预测结果的可视化

图9给出了本次实验的预测结果,其中报表中给出了盾构机的品牌及预测的部位信息,并对预测算法及预测时间做了一定的解释,最后在结果框中显示出部件可能发生的故障具体形式,工作人员可根据此提醒尽早检查部件的健康状况,以避免盾构机的停机。

图9 预测结果显示

4 结论与讨论

本文针对恶劣环境下容易出现故障的盾构机,结合当今很流行的深度学习模型LSTM循环神经网络,设计了盾构机的故障预测系统。整个系统分为四层:设备配置层、数据整合层、故障预测层、可视化层。为了提高系统快速诊断的能力,在数据整合层首先进行了大量的数据预处理使数据缓存到预分析的数据库中,接着在特征提取层利用数据分析工具对分析的数据作了进一步的清洗工作,从而可以有效减少预测模型训练的时间,极大提高系统的运行效率。这种预测系统的提出不但可以在零部件损坏前及时更换,从而提高系统寿命;更可以保证工程在非人为因素影响下推进,进而降低整个工程成本。

猜你喜欢

数据源盾构可视化
基于CiteSpace的足三里穴研究可视化分析
思维可视化
水泥回填土技术在盾构出洞加固中的应用及改善方法
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
Web 大数据系统数据源选择*
基于不同网络数据源的期刊评价研究
盾构近距离下穿房屋接收技术
基于真值发现的冲突数据源质量评价算法
小净距盾构隧道开挖相互影响分析