APP下载

基于支持向量机的几种核函数遥感图像分类比较

2015-01-01孙彦花梁怀翔

科技视界 2015年4期
关键词:训练样本向量精度

孙彦花 梁怀翔

(1.山东省煤田地质局物探测量队,山东 泰安271000;2.北京望神州科技有限公司,中国 北京100085)

0 引言

遥感技术作为人类研究地球资源环境的一种技术手段,遥感图像计算机分类是遥感技术应用的重要组成部分[1]遥感数字图像的处理就是将遥感图像的模拟或数字形式的信息输入计算机中,利用某种遥感图像处理软件,按照一定的数学模型,进行变换、加工产生可为专业人员判读的图像或者资料[2]。20世纪70年代之后,图像分类成为遥感领域研究的热点问题,在诸多领域中应用越来越广泛,如测绘行业中地理国情监测,铁路行业中用图像分类进行环境监测,水利部门用图像分类技术监测河道或者湖泊周围的自然环境。近年来许多学者对图像分类进行了大量的研究和探索,并提出了多种方案。如Huang等人[3]通过获取图像颜色的空间相关性等信息,通过用分类树来对图像进行分类。

目前常用的图像分类方法是最大似然法,它是以贝叶斯的主观理论为代表的,运用最大似然法前提条件是图像数据呈正态分布,而且主要存在的问题是反映不出对知识的不知道信息[4]。

采用传统的分类方法,会出现很多错分,漏分的情况,且分类精度也比较低。在此种情况下,许多人找寻新的分类方法,支持向量机的分类方法应运而生。近些年来,支持向量机被应用到了很多领域,支持向量机的研究已经被越来越多的学者所重视,这种技术在人脸特征检测、文字体识别、图像处理以及其他领域都取得了大量的研究成果。图像分类结果是将图像空间划分为若干个子区域,每个区域代表一类地物[5]。

1 支持向量机的原理与方法

图1 最优分类面示意图Fig.1 Schematic diagram of optimal classification face

因为f(x)是单调递增函数,h随着△2的递增而递减。因此如果训练样本数固定后,两类训练样本之间的分类间隔越大,则与之对应的VC维就会越小。

分类超平面方程为wTx+b=0,如果线性可分,则样本集(xi,yi),其中i=1,2,…,n,x∈Rd,y∈{-1,1},满足:

最优超平面问题在线性可分情况下,可以表示为下面的约束优化问题,在条件的约束下,求下列函数的最小值

2 支持向量机模型的建立及算法实现

在前面介绍SVM算法的基础上,本文采用了台湾林志仁老师开发的一个基于C和C++的LIBSVM开源代码,并在其上添加许多新的特性。本次设计利用SVM进行图像分类的流程是:添加数据,新建训练样本,图像分类,分类后处理。本软件设计程序主要包括以下几个模块:样本采集模块,样本训练模块,算法分类模块,图像显示模块。在设计时结合Windows系统下特有图形设备接口,实现图像显示,分析功能,并可以将分类后的结果以一种直观的形式呈现在用户面前。

2.1 样本采集模块的设计与实现

利用别的商业软件对测区的遥感影像进行预处理,如;几何校正,影像镶嵌,影像裁切等,然后将预处理后的数据加载到样本采集模块中。用户可在此模块中对此影像中设计不同的波段组合显示,同时需要在此设计不同的训练样本,并确定分类地物的类别。

支持向量机的基本思想如(图1)所示。在图中直线附近不同的图形代表不同的训练样本,H为把两类训练样本没有错误分开的分类面,H1和H2表示超平面,H1和H2之间的距离△被称为分类间隔(margin)。

如果给定分类间隔△的值,可以确定相应的分类超平面,当分类面变化时,分类间隔△也随之发生变化。在分类间隔△存在下,超平面几何的VC维h满足下面关系:

2.2 算法训练模块的设计与实现

本软件设计的最核心,最复杂的本分就是算法模块。该算法模块需要先输入待处理的文件,输出的文件路径,以及先前做的训练样本文件。见图2。

图2 样本算法模块的界面Fig.2 Sample algorithm module interface

2.3 分类模块的设计与实现

分类模块实现对数据的分类,在分类时需设置需要分类的影像,训练样本以及输出的文件。经过分类后即可将影像分成多个类别。分类模块如图3所示。

图3 样本分类模块的界面Fig.3 Sample classification module interface

在这次试验中,分别采用多项式核函数、线性核函数、径向基核函数,Sigmoid核函数对测区数据进行分类。然后将分类后的数据利用分类误差矩阵和Kappa系数来测试分类的精度,并与真实材料比对查看分类的精度。

3 试验区测试结果与分析

此次选择了一景空间分辨率为1.25米的Resurs DK1数据为实验数据,影像成像时间为2009年11月。首先利用ERDAS软件对测试数据进行预处理操作,图4是经过ERDAS预处理之后,真彩色合成图。

图4 原图像Fig.4 The original image

3.1 四种核函数的分类结果比较

本次实验针对测试数据利用核函数的四种不同函数对图像进行分类,将测区数据分为房屋、主干道、植被,小路、草地,水池六类地物,下图是利用SVM的不同核函数对影像进行分类的效果图。

图5 四种核函数的分类结果比较Fig.5 Comparison of classification results of four kinds of kernel function

从上面几幅图用肉眼可以看出,对于SVM的四种核函数都可以实现对影像的正确分类,为了更好的区分各种不同核函数的分类效果,采用误差矩阵和Kappa系数对四种分类效果进行量化评价,表1和表2是利用分类结果误差(Error matrix of classification)矩阵和Kappa系数对以上各种分类效果精度评价。

表1 核函数为多项式的图像分类评价Tab.1 Kernel function evaluation for polynomial image classification

表2 核函数为线性的图像分类评价Tab.2 Kernel function evaluation for linear image classification

通过以上各个核函数的分类结果评价分析可以看出,径向基核函数的分类精度略高于多项式核函数、线性核函数和Sigmoid核函数的分类精度。

表3 核函数为径向基的图像分类评价Tab.3 kernel function evaluation for radial basis mage classification

表4 核函数为Sigmoid的图像分类评价Tab.4 kernel function evaluation for Sigmoid image classification

4 结论

本次对SVM在遥感影像上的图像分类做了深入的研究,并在此基础上编制了图像分类软件。通过实验发现,利用SVM对影像进行分类,分类的精度比较高。

论文主要对SVM算法进行了深入的研究,并将SVM算法应用到图像分类中并进行编程实现。且对支持向量机在图像分类中的若干问题作了研究,通过实验证明不同的核函数会产生不同的分类效果,针对传统遥感图像分类方法的缺点,在分析SVM分类方法的基础上,对SVM算法表达式的核函数进行了分析,而且针对小样本的学习,构建了基于支持向量机的图像分类模型。根结实验结果通过分类效果图以及混淆矩阵和Kappa系数表明了采用支持向量机算法建立的模型有很高的分类精度,与最小距离法和最大似然法相比,是一种更加有效的遥感图像分类方法。

[1]孙家槟.遥感原理与方法[M].武汉:武汉大学出版社,2003.

[2]袁金国.遥感图像数字处理[M].北京:中国环境科学出版社,2006.

[3]Vapnik V N.The Nature of Statistical Learning Theory[M].New York Spring-Verlag,1995.

[4]Richards A.Remote sensing digital image analysis:an introduction[M].2nd ed.Berlin:Springer-Verlag,1993.

[5]杨昕,汤国安,邓凤东,吕恒.ERDAS遥感数字图像处理实验教程[M].北京:科学出版社,2009:113.

猜你喜欢

训练样本向量精度
向量的分解
聚焦“向量与三角”创新题
人工智能
基于DSPIC33F微处理器的采集精度的提高
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法
向量垂直在解析几何中的应用
GPS/GLONASS/BDS组合PPP精度分析
向量五种“变身” 玩转圆锥曲线