APP下载

一种基于气象数据的仓储粮堆表层温度预测方法

2020-05-24段珊珊杨卫东

中国粮油学报 2020年2期
关键词:粮堆平均温度表层

段珊珊 杨卫东,2 肖 乐 张 元,2

(河南工业大学信息科学与工程学院1,郑州 450001)(河南工业大学粮食信息处理与控制教育部重点实验室2,郑州 450001)

随着人口和社会流动性的增加,到2050年对粮食的需求将翻一番[1]。全球每年收获的粮食超过20亿t[2]。占全球粮食总产量三分之一的粮食损失于收获后储藏管理不善。对粮食水分含量,温度和害虫感染缺乏控制是造成这种损失的三个重要因素。粮食的高水分和高粮温为霉菌生长和储量害虫提供了有利条件,而储粮害虫和微生物是造成粮堆发热点的重要因素,粮堆中发热点的不断发展,会导致发热点内粮食的损坏[3]。智能仓储工作的主要目的是提高粮食储存能力,如有效控制储存温度和水分等。粮食籽粒在储藏过程中,其生命活动从未停止,仍为活的有机体,它受自身呼吸作用和外界温度、湿度、气体成分等环境因子的影响,这些内外因素与粮食安全储存密切相关。储粮生态系统中一些生物因素和非生物因素的相互作用会引起粮食变质,但随着储粮技术的发展,人类已经能够对该系统实现有效控制。通过控制环境条件,使粮食储藏生态系统处于非生态学稳定状态,是粮食安全储藏的根本[4-8]。粮食的安全储存可以通过控制两个重要的物理因素来实现:温度和水分含量[2]。杨卫东等[9]提出了一种经济无损的基于CSI的粮食水分检测,能有效的检测粮食的水分范围,为粮食水分无损检测提供了新的方法。粮食温度是粮食状态的重要指标,其检测和控制技术是粮情测控的主要技术之一。在粮情检测系统中,储粮温度的检测是一项比较成熟的技术,已在国家储备中得到广泛应用[10]。研究者对于粮情测控的研究都期望通过技术手段预测粮堆在未来储藏周期中的状态,以便对粮食储藏提前做出合理有效的保管方式,减少储粮损失。尹君[11]采用多场耦合理论构建了小麦粮堆温度场、湿度场、微气流场多场耦合数学模型,模拟预测粮堆结露变化过程,为储粮安全提供了理论基础。在粮食储藏过程中,粮堆发生虫害的主要部位集中在粮堆表层(即粮面以下30~50 cm)等粮温变化活跃区域[12]。储藏粮堆温度随四季的变化而变化,和外界气象变化有着密切的联系,为充分了解高大平房仓储粮温度随气象的变化规律,提高存储参数估计的精度,本研究利用国家气象信息中心(National Meteorological Information Center: NMIC)天气预报数据,结合机器学习相关算法对粮堆表层平均温度进行了研究,为智能仓储提供了参考。

研究中尝试利用历史NMIC数据结合机器学习算法开发预测模型,并将它们与来自传感器的温度数据相关联。用历史训练数据和传感器温度数据推导准确的训练模型,本研究的预测模型可以使用特定区域的NMIC数据来预测未来的粮堆表面平均温度。同时,因为本研究根据特定的粮仓历史温度数据生成模型,它们固有地结合了地理特征对每个地点的气象因素的影响,由于当地气象因素影响粮堆的温度和湿度,单个粮仓必须根据特定地点调整参数建立预测模型。本研究的目标是自动生成智能温度预测模型,一个小范围区域的所有同类型同储藏品种的粮仓都可以使用这些预测模型预测粮温,从而提前进行人工干预保障储粮环境安全。气象数据和粮食温度数据收集后,数据处理模块包括数据预处理,线性回归预测和不同核函数的支持向量机(SVM)预测。对于数据预处理,本研究采用离群检测,数据归一化和噪声消除来获得校准的气象数据和储藏粮堆温度数据。

1 储藏粮堆温度检测系统

本研究讨论的粮仓为昆明市西山区储备小麦的高大平房仓。粮堆内布置传感器的原则为由东向西分为10行,由南向北分为5个区,由粮堆上层到底部分为4层,在一个层面上,温度传感器纵向和横向间距不大于5 m,层间垂直距离不大于2 m,在粮堆中共布置了200个温度传感器。图1显示了粮仓的纵向截面图。

图1 粮仓纵向截面图

温度监测系统通常包括温度传感器,温度测量电缆和计算机监控终端。每条线代表一根电缆,每根电缆上放置四个温度传感器。图2是粮情测控系统结构图。

计算机发送检测命令到分机,接收分机的检测数据,进行数据分析等处理。分机接收计算机命令,检测温湿度数据,结果传送到计算机。温度传感器采用一线总线通信协议,封装在电缆内部,敷设在粮堆内部。粮温记录时间为每日上午9—10时,温度采样频率为每日1次。

图2 粮情测控系统结构图

2 数据收集和分析

本研究收集了云南省昆明市西山区高大平房仓小麦粮堆423 d的粮食温度数据。数据收集的时间起点为2017年1月1日,然后从中国气象数据网获得对应地区和对应时间点的气象数据。气象因素包括气压,气温,相对湿度,降水量,蒸发量,风速,日照时间和0 cm地温。数据采集过程中,由于传感器故障等问题导致出现异常值,且各因素数据量级不统一,必须对数据进行预处理。数据预处理模块包括异常值处理和数据标准化。

2.1 异常值处理

传感器通常会记录一些异常值。在数据处理中,异常点的出现会使得函数的梯度出现奇异梯度,这就导致算法的终止,从而影响研究变量之间的函数关系。为了有效的避免这些异常点造成的损失,本研究采用Pauta准则方法和线性趋势点法来检测和去除异常值,详细过程如下。

步骤1:令Xi,i=1,2,…,n,为第i个检测数据值,计算某特征的样本均值为

(1)

步骤2:然后计算样本的残差ei和样本标准差σ

(2)

(3)

步骤4:重复步骤1~步骤3,直到遍历所有值。

2.2 数据标准化

在气象因素多指标评价体系中,由于各因素具有不同的量纲和数量级,如果直接用元数据对粮堆表层温度进行预测,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。因此,为了保证预测结果的准确性,对数据进行标准化处理。

本研究使用 Z标准化,标准化过程如式(4):

(4)

图3显示粮堆表层温度随气温的变化规律。可以看出粮堆表层温度和气温的变化趋势一致,但随气温变化有一定的延迟,气温的最大值是在6月,而粮堆表层平均温度的最大值在9月。其原因是粮食籽粒本身的不良导热性以及储粮粮仓仓壁具有较好的隔热性能。

然后,分析粮堆表层平均温度如何随气象因素变化以及这些气象因素之间的相互作用。数据分析的目的是为了直观了解粮堆表层温度是如何依赖多种气象组合指标变化的,而不是从单一气象指标去预测。从多个天气指标预测粮堆表层温度,以期在研究中使用机器学习方法探索其复杂性,自动生成预测模型。

图3 温度随时间变化趋势

图4显示了不同的气象因素对粮堆表层温度的影响,可以看出粮堆表层平均温度和气象因素中的气温,0 cm地温,相对湿度呈现较强的正相关关系,分析发现粮堆表层平均温度和其他因素相关性较弱。图5显示了不同气象因素之间的相互影响,可以看出,气温与0 cm地温呈现较强的正相关性,气温和相对湿度、日照时间和相对湿度呈现一定的负相关性。

图4 不同气象因素对粮堆表层均温的影响

图5 气象因素之间的相互关系

3 预测模型

把获取的粮堆表层温度均值及气象数据作为随季节变化的时间序列,通过分析建立时间序列预测模型[13]。模型中探索气象8个因素和粮堆表层平均温度之间的函数关系,表示为粮堆表层平均温度=F(气压、气温、相对湿度、降水量、蒸发量、风速、日照时间、0 cm地面温度),F是使用不同回归方法确定的函数。文中保留每个变量指标的单位:气压单位为hPa,气温单位为℃,相对湿度百分比介于0%~100%之间,降水量单位为mm,蒸发量单位为mm,风速单位为m/s,日照时间单位为h,0 cm的地温单位为℃。建立预测模型之前,将所有数据标准化。

3.1 线性最小二乘预测模型

最小二乘是在欧氏距离为误差度量的情况下,由系数矩阵所张成的向量空间内对于观测向量的最佳逼近点,拟合函数是光滑函数,因此首先应用线性最小二乘回归方法来预测粮堆表层温度,最小二乘回归使通过气象因素预测的粮堆表层温度均值与真实值之间的平方差总和最小[14]。用最小二乘法进行曲线拟合,得到的拟合函数为

粮堆表层平均温度=0.29气压 +1.09气温+0.41相对湿度+0.01降水量+0.02日照时间-0.02蒸发量-0.04风速-0.56地温

把时间序列数据的任意80%作为训练集,20%作为测试集,预测结果如图6a所示。在线性最小二乘预测模型中,由于不同气象因素对粮堆表层均温的影响程度不同,不同气象表现出不同的权重,预测结果与图4相一致,气温、0 cm地温、相对湿度的系数较大,系数较小的气象因素对粮堆表层均温的影响程度也较小。

3.2 支持向量预测模型

由图5可以看出不同气象因素之间也有相互影响,考虑综合所有因素的复杂性,一些样本不能在二维空间中线性划分,考虑将样本映射到高维空间,可以实现更好的可分离性表现[15]。SVM回归的准确性取决于适当的核函数和参数的选择。本研究采用支持向量机中的线性核函数,多项式核函数和高斯径向基函数(RBF)核函数,将数据从输入空间转换为高维数据特征空间来预测粮堆表层平均温度[16-20]。这里选择SVM而非其他监督学习方法是由于其能够解决小样本下机器学习的问题及泛化能力较强的优点。对于线性核,特征空间到输入空间的维度是一样的,其参数少且速度快。把收集到的423 d的气象数据及粮堆表层平均温度做数据样本,每一天的粮堆表层平均温度对应同一天的气象8个因素,随机选取80%的样本做训练集,20%的样本做测试集,不同核函数的预测结果如图6b所示。由于粮食储藏过程中的通风及翻仓作业,收集到一个周期内的样本量有限,且特征维数较少,多项式核函数可以实现将低维的输入空间映射到高维的特征空间,相应的计算复杂度也会增加。用多项式核函数得到的对粮堆表层均温的预测结果如图6c所示。高斯径向基核函数是一种局部性强的核函数,其可以将一个样本映射到一个更高维的空间内,该核函数是应用最广的一个,无论大样本还是小样本都有较好的性能,而且相对于多项式核函数参数要少,利用高斯径向基核函数对粮堆表层平均温度进行预测的结果如图6d所示。

图6 线性预测及SVM不同核函数预测结果

图7 线性预测及SVM不同核函数预测结果的均方根误差

为了定量分析不同核函数所对应模型的有效性,用均方根误差作为评价指标,均方根误差是用来衡量观测值同真值之间的偏差,它对一组测量中的特大或特小误差反映非常敏感,所以,标准误差能够很好地反映出测量的精密度,因此本研究中选用均方根误差作为评价指标,结果如图7所示。线性最小二乘预测的均方根误差与SVM中线性核函数预测的均方根误差相近,分别为5.243和5.249,SVM中多项式核函数预测和RBF核函数预测的均方根误差分别为4.69和4.45。由此可知气象因素与粮堆表层平均温度之间并非简单的线性关系,而是综合多因素的复杂预测问题,由于高斯径向基核函数相对较好的性能,其预测结果也最优。

4 结论

由于不同区域粮仓结构及储粮品种差异及气象因素的小范围区域性差异,对不同地区的储藏粮堆表层温度预测将采用不同参数的同一预测模型,在对多区域粮堆温度预测的基础上,提高预测模型的鲁棒性和广泛适用性。在本研究中,结合云南省昆明市西山区气象多种因素,利用线性最小二乘法及SVM不同核函数机器学习方法来预测该地区高大平房仓储藏粮堆表层的平均温度。粮堆表层平均温度随气温的变化而变化,但由于粮食籽粒的不良导热性及粮仓墙壁的隔热性能,粮堆表层平均温度随气温变化有一定的延迟。气象8个因素中的气温、0 cm地温、相对湿度与粮堆表层平均温度具有较强的相关性,结合气象多种因素利用机器学习不同方法对粮堆表层平均温度的预测结果中,SVM高斯径向基核函数的预测性能最强,均方根误差最小,证明了基于气象数据的仓储粮堆表层平均温度预测模型与方法的有效性,利用这种预测方法,能够及时发现粮仓中温度的变化趋势,从而及时进行人工干预。

猜你喜欢

粮堆平均温度表层
关于规范中最低日平均温度定义的探讨与建议
兰州地区区域加权平均温度模型构建方法研究
南方地区圆拱形和锯齿形大棚内温度四季差别探究*
半潜式平台表层卡套管处理与认识
路基基床表层级配碎石施工技术
基于数字图像技术的粮堆压力与孔隙率关系研究
水体表层沉积物对磷的吸收及释放研究进展
基于COMSOL的静态仓储稻谷粮堆温度场模拟研究
储料竖向压力对粮仓中小麦粮堆湿热传递的影响
储粮压力对玉米粮堆温度场影响的实验与模拟研究