APP下载

基于GRU 神经网络的有毒气体扩散预测方法*

2021-04-20陈贤富

网络安全与数据管理 2021年4期
关键词:特征参数神经网络误差

陈 立,陈贤富

(中国科学技术大学 微电子学院,安徽 合肥230027)

0 引言

近年来,各国经常发生化工厂爆炸事故、危险品仓库发生火灾爆炸等引发的有毒气体泄露[1],严重影响人们的生命财产安全。 2018 年12 月18 日,江苏南通一化工厂设备爆裂,设备内的氮气以及氟化氢泄漏,造成作业人员中毒死亡。 2019 年中国江苏盐城、美国休斯敦的化工厂爆炸均造成了大面积的有毒气体的泄露。 2020 年11 月9 日1,浙江衢州中天东方氟硅材料有限公司发生火灾事故,该起火灾燃烧物质主要是氯硅烷,属于高沸物,燃烧产物有毒。目前被广泛使用的大气扩散模型主要分为两大类,一类是基于数理计算的,一类是基于机器学习的。 数理计算的典型代表有高斯扩散模型[2]、计算流体力学(CFD)模型等。 Mazzoldi[3]用高斯扩散模型模拟二氧化碳运输和储存设施泄漏的情况。高斯扩散模型使用简单的数学表达式,易于计算,耗时少,但只适用于平坦地形上畅通无阻的气体流动,在复杂环境下的预测往往不准确。 PONTIGGIA M[4]用CFD 模型模拟城市地区大气中液化石油气(LPG)扩散进行后果评估。 CFD 基于有限元计算,能较为精准地预测浓度扩散,但计算耗时长。 2019 年中国科学技术大学的程云芳[5]用机器学习算法粒子群-支持向量机模型,对苯储罐泄漏的浓度进行了危险位置的短距离预测。这些方法仍基于传统的机器学习方法。

因此,本文提出了一种利用深度学习[6]技术进行有毒气体扩散预测的方法。 首先根据有毒气体扩散原理,对经典的公开数据集草原牧场数据集的样本数据进行特征选取,将选择的特征参数输入到基于GRU 的3 层神经网络模型,最后得到预测点浓度值。 实验结果表明该模型的平均绝对误差(MAE)、均方误差(RMSE)和相关系数(r)均优于BP 神经网络模型。

1 GRU 神经网络模型

GRU 神经网络由CHUNG J[7]等于2014 年提出,是一种改进型循环神经网络(RNN)。 与人工神经网络(ANN)的全连接不同,RNN[8-9]的隐藏层之间相互连接。 ANN[10]的输出是相互独立的,而RNN 的输出不仅受当前输入特征的影响,而且受前一时刻的输出影响,所以RNN 具有更好的时间序列性能。 但是,RNN 却很难得到很好的训练。 主要原因是RNN会产生梯度消失和梯度爆炸。 因此更多的是使用它的变体形式,GRU 就是其中一种变体。 GRU 和RNN具有相似的结构,区别在于隐藏层的存储单元结构。GRU 的结构图如图1 所示。

图1 GRU 神经网络结构图

GRU[11]有两个门,即一个重置门和一个更新门。重置门决定了新的输入信息与前面的记忆信息如何结合,更新门决定了之前记忆保存到当前时间步的信息。 GRU 信息处理过程公式如下所示:

其中,rt、zt分别为重置门和输出门,Wr、Wz、tanh 分别为对应的权值和激励函数。 当前输入值、输出值分别为xt、ht。

2 数据预处理

草原牧场数据集[12]是在1956 年7 月至8 月进行的经典的野外实验数据集。 实验地点位于内布拉斯加州奥尼尔东北约5 英里处。 释放发生在距离地面高度为0.46 m 的点源,SO2作为示踪剂, 每10 min抽样测量一次浓度值。 水平方向以180°弧度为中心,利用高度为1.5 m 的采样器,在顺风处的5 个弧度处采样(50 m,100 m,200 m,400 m,800 m)。 该实验收集了下风向距离、风速、风向等多个特征数据。对数据集进行整理分析得到68 个不同版本数据,每个版本均有多个观测值,合计8 173 条有效样本。 部分特征参数如表1 所示。

分析特征数据,有的特征数值非常大,有的特征数值非常小,为避免数值较高的特征在模型中所占作用较强,相对数值较低的特征被削弱作用,需要对数据进行归一化操作,本文使用最常用的MinMax 归一化[13],它将所有特征都线性映射到0~1 之间,计算公式如下:

表1 部分特征参数

式中表示标准化后的特征矩阵,其中xi表示第i列的特征矩阵,max(xi)、min(xi)分别表示当前特征矩阵的最大值、最小值。

3 实验分析

3.1 实验设置

在训练模型之前需要将标准化后的数据集划分为训练集和测试集,由于GRU 是时间相关的,因此将草原牧场数据集数据按时间先后排序。 选择前58 个版本的7 480 条样本数据作为训练集,后10 个版本693 条数据作为测试集。 首先将风速、风向等19 个参数作为特征值输入,经过具有GRU 结构的3 层神经网络模型训练,最终以浓度值作为输出。再将测试集的特征参数作为输入,经过训练好的模型,得到测试集的预测浓度值。

硬件平台为Intel Core i5-8250U CPU 和8 GB RAM 的Windows 64 操作系统,使用Python 编写程序。

3.2 评价标准

本文选取平均绝对误差(MAE)、均方根误差(RMSE)[14]和相关系数(r)[15]来评估模型的性能。 平均绝对误差可以避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小。均方根误差表示预测值与与其真实值之间的偏差, 因此MAE 和RMSE 越小越好。 相关系数描述了预测值与真实值之间的相关程度,所以r越接近于1,表示模型效果越好。

3.3 模型预测结果

基于GRU 的神经网络模型的预测结果如图2所示,从图中可以看出,本文方法预测结果未出现负数浓度值,且对于峰值点浓度值的预测较好,可以有效地预测有毒气体扩散浓度。

图2 GRU 神经网络预测结果

为了证明基于GRU 的神经网络模型方法的性能,将该方法与基于BP 神经网络模型的方法进行对比。 BP 模型的预测结果如图3 所示,从图中看出BP 模型的预测结果在低浓度值时出现了负数浓度值,并且在浓度值较高的点误差较大。

表2 记录了通过多次实验两种不同模型预测结果的平均值,从表中可以看出,基于GRU 神经网络模型的MAE、RMSE 均低于BP 神经网络模型,r值更接近于1,评价指标值均优于BP 模型。

图3 BP 神经网络预测结果

表2 不同模型预测结果的对比

4 结论

对于毒害气体扩散浓度预测问题, 本文提出了基于GRU 模型的有毒气体扩散模型,实现快速、高效的有毒气体浓度预测。 此模型在草原牧场数据集上进行了验证。 结果表明,本文方法对毒气扩散有更高的预测精度。 在未来工作中,期待将模型扩展到实际应用中。

猜你喜欢

特征参数神经网络误差
冕洞特征参数与地磁暴强度及发生时间统计
角接触球轴承接触角误差控制
Beidou, le système de navigation par satellite compatible et interopérable
神经网络抑制无线通信干扰探究
基于交通特征参数预测的高速公路新型车检器布设方案研究
压力容器制造误差探究
基于神经网络的中小学生情感分析
基于PSO-VMD的齿轮特征参数提取方法研究
基于视频的车辆特征参数算法研究
基于神经网络的拉矫机控制模型建立