APP下载

基于SVM的遥感影像监督分类方法研究

2022-05-01郭恒张军刘安伟

甘肃科技纵横 2022年1期
关键词:神经网络

郭恒 张军 刘安伟

关键词:最大似然;神经网络;SVM;Kappa系数

中国分类号:P237 文献标志码:A

0引言

随着近些年遥感技术领域众多新技术的不断涌现,目前该技术已具备多平台、大尺度、高分辨率、多波段、多时相、卫星重访周期短等诸多优势,影像携带丰富的光谱信息。遥感图像的分类就是使用基于各类模型算法的计算机模式识别技术在遥感领域的应用。具体目的是通过先验知识或实地踏勘数据与目视解译的方法建立研究区不同地物类别及判别标准,通过计算机进行监督与非监督分类。目前主流较为成熟的分类方法较多,主要有最大似然、神经网络、支持向量机等分类方法。不论使用哪一种方法,都有其局限性。所以,在实际应用中,要结合各种分类方法自身的特点及影像的实际情况,提高分类的精度与效率[1]。

1影像分类方法

在基于监督分类的影像分类方法中,马氏距离分类法在考虑像素统计的基础上,注重各类别中的内在变化,相对最小距离分类法更加实用,但相对的计算时间成本要大[2];最小距离分类法是基于图像像素统计的分类法,该分类方法的优势在于其计算量小,所有像素均被分类。其劣势在于基于矩阵的计算相对单一,精度不高,存在一定的错分想象。例如,同类型地物因局部像素差异过大而被错分[3];平行六面体分类法充分考虑遥感影像各波段的光谱特征,按照光谱DN值作图像分类处理。对植被的监督分类运用该分类方法可以得到较好的分类结果,但同种地物光谱如果与训练样本光谱差异较大,也会存在错分的现象;最大似然法具有分类效率高,精度较好的优势。但该分类方法受参数估计限制较大;神经元网络分类法模拟人脑神经反馈机制系统建立一套数学模型。该分类方法较传统基于统计的分类方法在分类精度上有明显的提高,但计算非常耗時,分类运算需要多次迭代才能完成[4];支持向量机分类法也是机器学习中较为经典的一种分类法。该方法在训练样本较少的前提下,仍可以获得较好的分类结果及统计规律,其缺点是计算时间会随训练样本种类几何倍增,分类难以实施。

2支持向量机算法分类原理

支持向量机(Support Vector Machine)早期是由Corinna Cortes和Vladimir Vapnik于20世纪90年代提出的经典机器学习算法理论[5]。该算法的原理是基于统计学习理论的VC维理论与结构风险最小化原则基础之上的[6]。在已有的训练样本找到一个最优的折中点,就需要在所选训练样本的学习能力与学习精度之间权衡,从而得到较好的规则推广能力。通过非线性变换,使分类问题转化为高维空间的分类问题,同时在高维空间找到对应的最佳分类面,最终得到一个最优分类结果[7]。在图像分类中,由低维分类转化为高维分类,可以大幅度降低分类难度。分类算法的复杂性取决于训练样本的数量和质量,与训练样本中的持向量机有密切关系。运用非线性变换将低维空间的分类转化为高维空间的分类问题。同时,在高维空间找到对应的最佳分类面是支持向量机的基本思路。在转化过程中,非线性变化的运算较为复杂。这里需要使用训练样本间的积运算(x)i,yi,完成空间维度由低到高的变换。内积运算也被称为核函数,其优势在于坐标变换相对容易,它解决了基于维数变换的分类问题,同时,不增加整个计算过程的复杂性。根据Hilbert-Schmidt理论,只有满足前提条件的内积函数才可以进行空间变换,该条件定义为,对于任意K(x,y),g(x)≠0,且∫g(x)2dx<∞,有:

3实验结果分析

3.1数据处理

研究选用ENVI遥感影像处理软件,使用Landsat8OLI_TIRS卫星数字产品,影像获取时间为2018年6月5日,条带号:129,行编号:36。前期对数据进行了辐射定标与大气校正预处理工作,以还原真实的地表辐射率特征值。裁剪出甘肃省天水市三阳川新区的334.48km2土地作为研究区域,并且通过全色影像与多光谱影像的融合,提升影像分辨率至15m。根据国家标准《土地利用现状分类》(GB/T21010-2017),结合研究区域土地利用实际情况,将训练样本划分为林地、草地、耕地、水域、裸地、建设用地,前期对影像纹理特征的分析解译,首先对遥感图像对应的训练样本进行选取与实地踏勘,得到分类样本27组,验证样本31组。在样本的选取遵循以下两点准则,一是尽量选择单一地物类型的像元作为训练样本;二是根据纹理信息与光谱特征,尽可能选取一些具有代表性的地物作为样本[8]。然后对选取样本作可分离性分析,系统使用Jeffries-Ma⁃tusita分离参数表示样本的可分离性。矩阵中行与列的焦点表示这两类地物类型的可分离程度,数值在0~2.0之间。小于1.8说明地物之间可分离性不理想[9],需要重新调整训练样本;大于1.9的数值说明相应地物可分离性良好,符合要求[10]。经反复实验与调整训练样本,使训练样本的可分离度调整到最佳状态,见表1所列。

3.2结果分析

将研究区遥感影像7、4、6波段与5、4、3波段进行色彩合成,着重对不同类别的训练样本进行有效区分,可以将不同种地物差异展示出来。分别使用最大似然、神经元网络及支持向量机等监督分类方法对研究影像作分类处理,结果如图2所示。通过影像纹理信息及目视解译判读结果,对比发现,平行六面体法分类精度相对较低,在分类结果中容易出现错分及边界与实际情况不符的情况,最大似然、神经网络、支持向量机分类法在整体分类上具有较好的分类效果。

4分类精度与效率评定

遥感影像分类精度评价因子主要包括:混淆矩阵、Kappa系数、总体分类精度、错分误差、漏分误差、用户精度、制图精度等[11]。研究以总体精度与Kappa系数作为参考依据。结合验证样本,经数据分析,可初步得出以下分类精度评定结论:

神经网络与支持向量机的总体分类精度较高,但神经网络算法耗时较长,见表2所列。在选取的研究区域及当前的影像分辨率下,SVM分类方法的分类精度与效率综合表现最佳,计算机分类时间均可在15s内完成,但不同分类方法时间消耗差异较大。

5结论

文章结合经实地踏勘的训练样本与验证样本,将研究区影像通过6种常见的分类算法进行依次的影像分类处理。可以得到:基于研究区数据与尺度,SVM分类算法在时间效率与分类精度综合表现最佳。通过不同分类算法对实际数据处理的横向对比,可以对不同分类器进行评定,也可以作为遥感影像解译评定的参考依据。由于地表环境复杂多变,地表实际反射率与地球表观反射率之间的差异,这些都给影像的分类造成难度,并且每次的实验结果与所获取数据的质量、实际地物类型、分类复杂度有着密切关系。如何根据实际情况,选择最佳分类器,快速、准确的将图像进行分类,需要我们对不同质量的数据进行分类实验与数据分析,还需要我们对不同算法的原理进行更深入地研究。

猜你喜欢

神经网络
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
基于改进VGG-16神经网络的图像分类方法
基于自适应神经网络的电网稳定性预测
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
基于BP神经网络PID控制的无刷直流电动机调速系统设计