APP下载

基于SV M的葡萄霜霉病病害发生预测研究

2018-11-06宋旺

中小企业管理与科技 2018年15期
关键词:原始数据线性向量

宋旺

(中南林业科技大学,长沙410004)

1 引言

葡萄深受人们喜爱,葡萄在全世界各地均有种植,然而葡萄病害也威胁着葡萄产业的发展,因此,对葡萄病害进行预测显得尤为重要。秦华[1],包峰,王娟,任振辉[2]分别用自适应神经网络和BP神经网络对葡萄病害进行了预测,得出了神经网络模型可以用于葡萄病害的预测。胡一帆(2016年)[3]等基于支持向量机(SVM)方法,利用南京市的气象数据建立了南京市天空云量的预报模型。本文考虑温度、湿度、降水量与葡萄病害发生率的回归拟合预测。

2 相关理论基础

2.1 支持向量机的分类算法

根据Vapnik[4]所提出的支持向量机,能用于线性和非线性的分类问题。

对于线性回归问题,令线性可分的样本集为(xi,yi),i=1,2,…,n,x∈Rn,y∈{+1,-1}此时,n 维空间线性判别函数一般表达式为:g(x)=wx+b,在这个空间中有一个最优分类面能将两类分类点区分,分类面的方程为:

应满足的约束条件为

对判别函数 g(x)=w·x+b,对所有的样本都有|g(x)|≥1 因此,样本到最佳分类面的最小距离为:|g(x)|/||w||=1/||w||,上述问题变成:

这是一个凸二次规划问题,引入lagrange函数:

上述ai(i=1,2,…n)是拉格朗日乘子,分别对w和b求偏导得:

非线性问题此时也转化为对偶问题:

在maxw(a)下,得出ai的解,值不为0所对应的样本点就是支持向量。最优分类函数表示为:

另一方面,看待非线性问题时,需要应用一个非线性映射函数把原样本空间映射到一个高维空间,有必要引入松弛变量ξi,这个因子应当加到拉格朗日的式子中,在求||w||最小值的计算当中增加惩罚。

此时分类面的约束变成了

2.2 支持向量机的回归算法

回归型支持向量机常用ε—不灵敏误差函数(ε≥0),寻求最优回归超平面的问题转化为求解如下一个二次凸规划问题:

式中 ξi,为松弛变量,分别表示在误差为ε约束下的训练误差的上限和下限,C为惩罚常数。

最优超平面线性回归方程为:

式中 ai,表示拉格朗日乘子,b为偏置量,由约束条件而来,k(x·x)i表示支持向量机的核函数,xi表示作为支持向量的样本向量,x表示待预测因子向量。大量研究表明选择高斯核函数会比选择其他核函数效果好。

3 支持向量机葡萄病害预测模型

本文将平均温度、降水量、相对湿度作为输入向量,葡萄病害发生率作为输出量。取2012年到2014年各年的6月19至9月18日每隔一周的数据,前27周作为训练样本,选取后11周的葡萄病害发生率作为测试样本。

关于本文历史气象数据以及相关葡萄病害发生率数据来源于庞建[5]的硕士论文。所用的工具是MATLAB软件与工具包。本文利用交叉寻优找到最优参数c=1.4142,g=0.17678。实验回归拟合结果和预测结果分别如图1和2所示。

得到的最佳参数进行训练,再与原始数据进行回归预测,得到误差仅为0.021,而相关性为71.35%,而多元回归拟合程度为0.67。从图中3.3可以得出,利用支持向量机对葡萄霜霉病病害发生率进行回归分析,误差仅为0.021。回归预测点的变化趋势基本与原始数据保持一致。

图1 原始数据与预测数据

图2 原始数据与测试数据

4 结论

本文利用葡萄霜霉病病害发生率数据资料基于SVM理论建立SVM病害发生率预测模型对病害发生率进行短期预测,预测结果比多元线性回归理想。同时,也进一步为葡萄病害发生率的预测提供了一种新方法。

猜你喜欢

原始数据线性向量
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
渐近线性Klein-Gordon-Maxwell系统正解的存在性
向量的分解
线性回归方程的求解与应用
聚焦“向量与三角”创新题
受特定变化趋势限制的传感器数据处理方法研究
二阶线性微分方程的解法
非齐次线性微分方程的常数变易法
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
向量垂直在解析几何中的应用