APP下载

改进支持向量机的遥感影像道路提取技术研究

2021-08-05王艳梅李金雨冯海霞

浙江水利水电学院学报 2021年3期
关键词:均值聚类精度

王艳梅,李金雨,冯海霞

(1.安徽三联学院 交通工程学院,安徽 合肥 230601;2.山东交通学院 交通与物流工程学院,山东 济南 250357)

随着空间技术的不断发展,遥感影像的分辨率越来越高,为更准确地提取地物信息提供了更好的数据基础。道路是高分辨率遥感影像中一种很重要的地物信息,如何从高分辨率遥感影像中精确地提取出道路信息,成为国内外众多学者研究的热点,因此也提出了各种各样的算法[1-5]。虽然高分辨率遥感影像中道路信息的几何特征和纹理特征都非常明显,但是由于同物异谱和同谱异物现象的存在,使得道路信息提取的精度受到一定限制,给提取算法的设计带来一定难度。

支持向量机(support vector machine,SVM)是国内外众多学者研究的热点[6-11]。汪闽等[12-13]设计了一种使用非线性映射SVM从高分辨率遥感影像中提取道路信息的方法。SONG M等[14]对于遥感影像中被遮挡的道路使用区域增长法进行提取,然后使用SVM将遥感影像分为道路和非道路两大类。GHULE S A等[15]提出,借助纹理特征和颜色特征分析遥感影像中道路信息,然后采用SVM提取道路网信息。但是,这些算法存在提取的道路位置不准确、像素错分等问题,导致道路信息提取的整体精度不高。本文提出了一种改进的SVM算法。该方法首先使用K均值聚类算法(K-means clustering algorithm)对遥感影像进行聚类分析,抓住关键样本,剔除沉冗样本,然后使用SVM提取道路信息,可以降低误判率。

1 算法原理

1.1 K均值聚类算法原理

该算法首先将样本聚类为K个簇,然后计算每个对象到各聚类中心的距离,把每个对象分配给距离它最近的聚类中心。

(1)随机选择K个对象作为原始的聚类中心;

(2)计算每个样本点到聚类中心的距离,将每个样本点归类到距离该点最近的聚类中心;

(3)计算每个聚类中所有点的质心(坐标平均值);

(4)如果簇的质心不变,则返回到划分结果,否则转到步骤(2)。

随机选择k个聚类中心μ1,μ2,…,μk∈R。然后对各个样本进行分类计算:

ci=argminxi-μj2

(1)

对于每一个类j,重新计算该类的质心

(2)

式(1)—式(2)中ci表示的是样本i与各类k中距离最近的类,质心μj则代表用户对属于同一个类的样本中心点的猜测。分好类后,用户要重新计算它的质心然后重复迭代直至质心不变。

1.2 SVM原理

(1)构造n个二值分类器,fk(x),k=[1,n]。将第k类的训练样本和其他训练样本集分开。若样本xi属于第k类,则有sgnfk(xi)=1,否则sgnfk(xi)=-1。

(2)寻找函数fk(xi),k=[1,n]中最大值所对应的类别即为xi的类别,yi=argmaxf1(xi),f2(xi),…,fn(xi)。

本文选择具有线性核函数的SVM将原始影像分为道路和非道路两大类,主要过程是先将原始遥感影像经过K均值聚类,然后通过SVM提取道路信息。最后,将K均值+SVM提取道路信息结果与直接使用SVM提取道路信息结果进行精度比较。

2 实验与结果分析

2.1 数据介绍

本次选用的实验数据是由高分二号卫星采集的合肥市城区的部分道路影像,分辨率为4 m的多光谱数据。选取的合肥城区实验数据原始影像见图1,影像中包含了道路、房屋、植被、水体等地物信息。

图1 原始影像数据

2.2 实 验

实验在matlab环境下实现,实验1是选择线性核函数的SVM直接提取道路信息,提取结果见图2。实验2是先将遥感影像经过K均值聚类,然后通过SVM提取道路信息,提取结果见图3。通过视觉分析,从提取结果可以看出,SVM算法提取结果噪声较大,而K均值+SVM提取结果噪声较小,提取结果相对更准确一些。

图2 直接使用SVM提取道路信息结果

图3 K均值+SVM提取道路信息结果

2.3 算法精度分析

通过实验可以看出,两种方法提取的道路信息完全不同,直接使用SVM提取道路的噪声较大,而使用K均值+SVM提取道路信息的噪声较小。为了更精确地评估两种方法提取道路的精度,可以采用数据分析的方法评估道路提取的精度。可根据所提取道路的几何长度,使用准确度、冗余误差和遗漏误差对提取道路结果进行评估。

(3)

(4)

(5)

根据实验中所提取的道路信息结果,表1列出了实验1和实验2中提取道路信息的准确度、冗余误差和遗漏误差。从表1中可以看出,直接使用SVM提取道路信息的准确度、冗余误差和遗漏误差分别为81.29%、0.85%和12.24%,使用K均值+SVM的准确度、冗余误差和遗漏误差分别为92.15%、0.19和5.31。通过K均值+SVM算法提取道路信息比直接使用SVM算法提取道路信息精度更好。

表1 道路目标提取结果的精度统计

3 结 语

高空间分辨率遥感影像中道路信息的纹理特征和几何特征都非常丰富。本文基于高分二号遥感影像数据采用K均值与SVM相结合的方法提取道路信息,通过算法精度分析,该方法提取道路信息精度比直接使用SVM提取道路信息效果更好。但是,使用K均值与SVM相结合的方法提取道路信息时,仍存在道路信息丢失及自动化程度不高等问题,需要进一步深入研究。

猜你喜欢

均值聚类精度
基于K-means聚类的车-地无线通信场强研究
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
分析误差提精度
基于DSPIC33F微处理器的采集精度的提高
基于高斯混合聚类的阵列干涉SAR三维成像
GPS/GLONASS/BDS组合PPP精度分析
关于均值有界变差函数的重要不等式
一种层次初始的聚类个数自适应的聚类方法研究
改进的Goldschmidt双精度浮点除法器