APP下载

深度学习在环境污染平台数据分析中的应用与设计

2021-06-16沈文渊吴也正魏恒缪青

电子制作 2021年2期
关键词:准确度数据处理卷积

沈文渊,吴也正,魏恒,缪青

(江苏省苏州环境监测中心,江苏苏州,215004)

0 引言

环境污染已经成为影响人们健康生活的重要问题之一,随着环境污染种类的增多,污染成分也更加复杂,不仅包括传统的大气污染、海洋污染、水土污染、粮食污染等,还包括光污染、噪声污染、辐射污染等,为人们的健康安全带来了恶劣影响。因此,加强环境污染的防治和保护成为重要的工作,由于污染区域、成分、后果都比较复杂,传统的人工管理模式已经无法适应需求,政府机构或企业组织开始在环境污染防治中引入先进的信息技术,开发和部署了许多的信息系统,比如污染数据监控系统、环境污染预测系统等,这些应用软件引入了数据库、物联网等关键技术,有效地提升了环境污染防治信息化水平[1]。

目前,环境污染信息平台集成的功能越来越多,经过多年的运行积累了海量的数据资源,这些数据中蕴含着有价值的知识信息,可以为人们提供环境污染防治的决策支撑[2]。因此,本文引入深度学习技术,构建一个数据加工和处理模型,提高环境污染平台的智能分析水平,具有一定的意义。

1 环境污染平台功能分析

目前,环境污染平台经过多年的运行,集成的信息功能更多,不仅包括环境污染监控、环境污染预警、环境污染治理、环境污染影响评估等多个方面,还包括环境污染预测等功能。因此,本文对这些应用功能进行总结和归纳,将其划分为数据采集、数据传输和数据存储等功能,这样就可以实现环境污染数据的共享。

(1)环境污染数据采集

数据采集是环境污染平台的基础功能,人们可以在各个环境污染采集点部署传感器,比如硫化物传感器、二氧化碳传感器等,采集环境污染的各种成分数据,将这些数据通过物联网和互联网传输到服务器。

(2)环境污染数据传输

环境污染数据传输的方法很多,包括物联网、移动通信、光纤网络等。由于环境污染数据采集点分布的比较散乱,每一平方公里都有多个传感器,因此这些传感器可能分布于野外、水面、大气中,因此采集的数据传输就需要使用物联网和移动通信,将其从采集终端传输到服务器。服务器和各个电脑终端之间的传输则可以使用光纤网络,帮助人们掌握环境污染情况,数据传输需要保证高可靠性和高速性。

(3)数据存储

环境污染平台保存的数据种类非常多,时间久远,一般都需要保存数十年的环境污染数据,以便人们能够针对某一个低于的环境污染情况进行全方位的掌握,避免由于数据保存漏洞产生不全面的问题。因此,数据存储可以采用冗余的光纤阵列存储器,并且可以在不同的地域建设保存机房,实现数据安全存储。

2 深度学习在环境污染平台数据分析中的应用

■2.1 深度学习算法设计

环境污染平台的数据非常多,传统的分析方法已经无法满足高效性需求,因此本文提出引入一个深度学习算法,从而可以接收环境污染平台数据,针对这些数据进行加工和分析,从中发现有价值的知识,为环境污染预警、治理提供决策支撑[3]。深度学习算法是一种非线性模式识别技术,其可以从一堆数据中构建一个复杂的、非线性的多变量分析模型,该模型能够更加真实的模拟现实客观存在,从而可以全面的、准确的识别结果。深度学习最核心的技术是卷积神经网络,这是一种数学处理方法,在环境污染平台中的具体应用模型包括多个层次,分别是输入层、卷积层、池化层、全连接层,这样就可以增加深度学习算法的训练和学习深度,从而提高环境污染数据的识别精确度,获取一个良好的输出模型,也可以在运行中实时的根据需求调整卷积神经网络参数,动态的优化深度学习算法[4]。深度学习在环境污染平台数据分析模型如图1所示。

图1 基于深度学习的环境污染平台数据分析流程

深度学习在环境污染平台数据分析中的每一层的功能及作用描述如下。

(1)输入层。环境污染平台存储的数据非常多,防治和保护人员可以从数据服务器中调取各种数据,将这些数据输入到深度学习算法的输入层。输入层针对环境污染数据进行初步的建模和预处理,比如删除一些噪声数据或稀疏数据等,然后针对环境污染数据进行归一化处理,以便能够统一数据的量纲,保证数据能够被深度学习算法识别和加工处理。

(2)卷积层。卷积层通常包括两个关键操作,可以实现卷积网络的局部关联操作和窗口滑动操作。局部操作可以针对数据特征进行过滤,滑动窗口可以完成卷积神经网络特征的提取,实现卷积神经网络的特征分析,进一步改进卷积神经网络的准确度。卷积层可以采用的核函数非常多,比如Sigmoid函数,适用环境污染数据中有价值知识的挖掘分析工作。由于Sigmoid函数拥有很强的收敛性,因此可以在很短的时间内获取数据挖掘结果,避免过度拟合现象发生,可以大幅度提高数据分析准确度。

(3)池化层。池化层可以压缩卷积神经网络处理的数据量,同时还可以减少网络设置的参数数量,避免卷积神经网络计算和处理时过度拟合。具体的,在卷积层处理的结果上,神经网络可以获取环境污染数据的基因特征,这些特征数据采取池化操作之后就可以计算某一个局部卷积特征平均值,也可以计算最大值或最小值,利用这些值可以针对卷积层获取的特征数量进行过滤,从而可以降低分类器的计算复杂度,充分的减少过度拟合发生的概率。

(4)全连接层。全连接层是一个分类器,其可以将神经网络经过学习和训练的结果输出到全连接层,全连接层可以构建一个图形化的显示模式,该模式能够按照需求输出每一个期望的知识信息,比如大气污染的成分、某地区易发生的污染事故、某一个时间段即将发生的环境污染事故等,从而为环境污染防治和保护提供准确的决策。

■2.2 算法实验及结果分析

为了能够验证深度学习算法的有效性,本文从环境污染平台中获取了近两年的环境污染数据,同时引入人工处理方法、支持向量机算法和K-means算法作为对比。具体的,环境污染数据共计100万份,这些污染数据中有二氧化硫、工业废气、工业氮氧化物、工业烟粉尘、二氧化氮、一氧化碳等污染成分,提取这些数据污染成分的特征高达数万个,详细数据如表1所示。

表1 环境污染数据集详细信息

本文针对每一种方法都进行了100次试验,取这100次试验的平均值为比较数据,人工处理方法的准确度为64.8%,支持向量机算法的准确度为84.7%,K-means算法的准确度为81.6%,深度学习算法的准确度为98.5%,同时深度学习算法的处理时间也最短,远远的超过了人工处理时间,因此可以更快的获取环境污染数据,同时对未来的环境污染数据走势进行预测,以便环境污染保护人员开展工作。详细数据如表2 所示。

表2 各个算法实验结果

3 结束语

环境污染防治是一项系统的、复杂的工程,其需要全社会共同参与和努力,同时引入更加先进的信息化平台,实现环境污染数据的采集、分析、预警、治理和保护,以便能够提高环境污染监控和保护的实时化,具有重要的作用和意义。本文详细地分析了环境污染平台数据处理工作内容,引入先进的深度学习技术,基于卷积神经网络,利用先进的Sigmoid函数,提高算法的处理速度和收敛性,从而可以获取一个准确的环境污染数据处理结果,与传统的人工数据处理方法、支持向量机算法、K-means算法相比,实验结果显示深度学习算法大幅度提高处理精确度,可以为环境保护工作提供更加精准的预测,也可以为污染防治提供更加有力的支持。未来,环境污染平台将会持续改进数据处理算法,以便提高污染数据处理的实时化、精准化和智能化,同时还要提供数据处理的便捷化。

猜你喜欢

准确度数据处理卷积
基于全卷积神经网络的猪背膘厚快速准确测定
影响重力式自动装料衡器准确度的因素分析
基于图像处理与卷积神经网络的零件识别
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
无人机测绘数据处理关键技术及运用
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
视频大数据处理的设计与应用