APP下载

SVM支持向量机在遥感图像中的应用研究

2017-01-11凯,韩

关键词:超平面分类器像素

纪 凯,韩 栋

(1.安徽交通职业技术学院,安徽 合肥 230051;2.法国格勒诺布尔计算机实验室,伊泽尔省格勒诺布尔市 38000)

SVM支持向量机在遥感图像中的应用研究

纪 凯1,韩 栋2

(1.安徽交通职业技术学院,安徽 合肥 230051;2.法国格勒诺布尔计算机实验室,伊泽尔省格勒诺布尔市 38000)

遥感图像分类是遥感图像处理领域中的一个重要的研究方向,随着传感器质量的不断提高,越来越多高质量的遥感图像需要新的监督分类方法进行处理。常用的将svm二元分类器改进成为多级分类器的方法有“一对一”(one against one,1-v-1)和“一对多”(one against all,1-v-all)。本文将使用这两种方法进行遥感图像分类研究,进行对比评价。结果发现在大多数情况下,第一种方法“一对一”在计算速度和分类精度方面要优于第二种方法“一对多”。但是这种差别并不太显著,具体选择哪种方法也取决于实际情况。

图像分类;传感器;二元分类器

随着卫星技术的提高,大量遥感图像可以实时实地获取。90年代卫星遥感在全球和区域尺度土地覆盖研究与应用方面取得了突破性进展,土地利用覆盖遥感研究的新方法不断出现[1]。遥感数据在土地资源分析和应用中的第一步是遥感图像分类,在满足一定精度的要求下,如何解决多类别图像的识别是遥感图像研究中的一个关键问题[2]。支持向量机(Support Vector Mqchine,SVM)作为一种新的高效学习方法,是近十几年来发展起来的一种统计学习理论,反映了结构风险最小化原则,在遥感图像分类领域应用越广。相比传统的遥感图像分类方法计算速度慢,分类精度低,SVM具有小样本学习,稳定,准确和高效等特点,成为遥感图像分类研究的热点。本文结合实际例子,使用SVM进行遥感图像分类,并对结果对比评价。

1 支持向量机分类器

1.1 支持向量机

机器学习是为了使期望风险最小,因为可利用的信息只是有限样本 ,传统学习方法中运用了经验风险最小化(ERM)准则。而根据统计学习理论的研究 ,不但经验风险要最小,VC维也要尽量小,为了缩小置信范围,实际风险才能取得较小。SVM正是根据 SRM理论在线性可分的基础上的最优分类面发展出来的。

支持向量机的基本思想是对于一组数据样本,如果其属于一个或两个类,通过一个尽可能宽的分界区间,发现一个可完美分离d维数据的超平面,且最大化这两个类与超平面的距离。SVM把“内核诱导特征空间”的概念引入,通过内核函数把数据映射到一个可分离的高维空间。内核函数通过样品的相似性,提供了比给定类的描述符合本身更多的信息。

对于一个二元分类问题,给定一个大小为n的训练集T:

xi,yi分别是训练矢量和目标值T中的第i个样本,且i=1,...,N。则分类超平面的定义是:

(.)是从数据集d映射到更高维的Hilbert希尔伯特空间H,.,.是在H超平面的点积,决定函数f(x)是:

找到一个最佳超平面和两个预定义的类之间的最大间隔是支持向量机的目标。可转化为求解下面的二次优化问题来实现:

定义一个映射z= (x)的变换将d维输入向量x映射到一般较高的d维向量z。选择一个 (),则新的训练数据{ (xi),yi}是一个可分的超平面是其目标。注意 (xi)是和其他 (xj)的点积。即公式(内核)如果知道,则用在高维特征空间中的点积:

可不需直接处理映射z= (xi)。

1.2 核函数

核函数的选择是构造出一个具有良好性能的SVM的关键。核函数类型的选择与类型确定后相关参数的选择是核函数的选择的两个工作。依据泛函的相关理论,如果有一种函数K(xi,xj)满足默瑟条件(正定的特征值),其就对应某一变换空间的内积。对于判断哪些函数是核函数到目前为止也取得了重要的突破,得到默瑟条件和以下常用的核函数类型:

(1)线性核函数:

(2)多项式核

(3)径向基函数,也被称为高斯核函数是最流行的内核,即:

(4)傅里叶核

(5)样条核

(6)Sigmoid核函数

如何选取核函数解决实际问题,一般是利用专家的先验知识预先选定核函数或是采用Cross-Validation方法,即在选取核函数时,通过试用不同的核函数,最好的核函数是归纳误差最小的核函数。

1.3 SVM多类分类器

如前所述,SVM分类本质上是一个适用于两种类别的两类分类技术,因此必须加以修改以适用于处理多类信息,比如遥感图像多种地物分类。SVM多级分类器实现的基本思想是将多级分类问题简化为两类分类问题,这样就可以使用SVM方法。通常有两种方法实现:一种是one agaist one(1-v-1),该方法代表了最早和最常见的SVM方法,即通过一系列两类SVM分类器的构造,把每个分类器识别两个类别,再把结果以某种方式的组合实现多级分类。比如在一幅遥感图像上,感兴趣的类别有水,植被和建筑物,首先用SVM分类为水体区和非水体区(植被和建筑物)或植被区和非植被区(水和建筑物),然后在非水体区或非植被区再次使用SVM进行分类。另外一种方法是one agaist all(1-v-all),即合并多个分类面的参数求解到一个最优化问题中,求解该最优化问题一次性实现多级分类。第二种方法虽然貌似可以一次性实现多级分类,但是求解最优化问题的过程无论是复杂度还是计算时间都远远大于第一种1-v-1方法,而且计算量的加大也会影响分类精度。本文将分别使用以上两种方法进行卫星图像的土地覆盖信息的提取分类,将这两种技术的性能进行比较和评价。

2 分类方法

如图1所示,研究区是2003年5月Quickbird卫星获取的位于芬兰北部的一幅图像,图像中主要有四种地物,分别是树,地面植被,道路和建筑物,使用Matlab 7中的SVM函数进行处理,使用到的SVM核函数主要有线性核函数,多项式核函数,和径向基核函数。分别使用1-v-1和1-v-all方法进行分类比较,然后导入相关地理信息进行分类精度评估,主要分类精度参数是未分类像素数,混合像元数,最终精度评估和kappa系数。

图1 研究区域

3 结果和讨论

下面几组图是使用不同核函数的1-v-1分类器(一对一分类器)和1-v-all分类器(一对一分类器)对研究区图像分类的结果。红色的代表地表建筑物,深绿色代表树木,浅绿色代表地表植被,灰色是地面道路,黑色是未分类像素,黄色是混合像素。左边的图2-1,图3-1和图4-1是使用1-v-1分类器,我们可以发现分类结果中几乎没有混合像素的情况,只有一些黑色的未分类像素。而右边的图2-2,图3-2和图4-2是使用1-v-all分类器的结果,显而易见,分类结果除了有黑色的未分类像素,还有一些黄色的混合像素。

图2-1:线性1-v-1分类

图2-2:线性1-v-all分类

图3-1:多项式1-v-1分类

图3-2:多项式1-v-all分类

图4-1:径向基1-v-1分类

图4-2:径向基1-v-all分类

通过表1,可以明显看出两种SVM分类器分类方法结果对比,1-v-1分类器没有混合像素,而1-v-all分类器不仅会出现未分类像素,还会出现混合像素,影响最后的分类精度。

表1 两种SVM分类器分类方法比较

混合像素 0 95未分类像素 20 187多项式核函数 混合像素 0 64未分类像素 18 104径向基核函数 混合像素 0 38

三种核函数的分类结果可以通过 95%的置信区间的一致性kappa系数进行对比分析,表2给出了比较结果。

表2 两种SVM分类器分类方法kappa系数

从表2可以看出,使用线性核函数和径向基核函数的时候,v1-v-1分类器分类精度优于1-v-all分类器线分类精度,但是总体结果来说差异不显著。在使用多项式核函数的时候,两种SVM分类器分类结果没有区别。由此可以看出,总体来说,1-v-1分类器的结果要优于1-v-all分类器,但是具体选择那种核函数,要根据实际情况具体分析。

[1]Kramer J.H.,2002.Observation of the earth and its environment:Survey of missions and sensors (4th Edition).(Berlin:Springer).

[2]贾永红,张春森,王爱平.基于 BP 神经网络的多源遥感影像分类[J].西安科技学院学报,2001,21(1):58-60.

A Study of Remote sensing image classification based on Support Vector Machine

JI Kai1,HAN Dong2
(1.Civil Engineering Department,Anhui Communications Vocational &Technical College ,Hefei Anhui 230051,China; 2 French Grenoble Computer laboratory,Grenoble Isere 38000,France)

Remote sensing image classification is an important research topic.More high-quality satellite images can be obtained with the improvement of sensor quality.Two of the common methods to enable this adaptation include the "one against one" (1-v-1)and "one against all" (1-v-all).This paper will use these two methods for satellite image classification.It is found that in most cases,the first method,"one against one" is better than the second method "one against all".But there are no much differences so the choice of technique adopted boils down to the actually conditions.

Image Classification; sensor ; Binary Classifier

P237

:A

10.3969/j.issn.1672-7304.2016.01.062

1672–7304(2016)01–0133–02

(责任编辑:廖建勇)

纪凯(1979-),男,安徽六安人,副教授,研究方向:工程测量和遥感数据处理。

猜你喜欢

超平面分类器像素
像素前线之“幻影”2000
全纯曲线的例外超平面
涉及分担超平面的正规定则
“像素”仙人掌
以较低截断重数分担超平面的亚纯映射的唯一性问题
涉及周期移动超平面的全纯曲线差分形式的第二基本定理
ÉVOLUTIONDIGAE Style de vie tactile
基于差异性测度的遥感自适应分类器选择
基于实例的强分类器快速集成方法
高像素不是全部