条件随机场框架下基于随机森林的城市土地利用/覆盖遥感分类

2014-09-13杨耘徐丽颜佩丽

自然资源遥感 2014年4期

杨耘，徐丽，颜佩丽

(1.长安大学地质工程与测绘学院，西安 710054； 2.长安大学西部矿产资源与工程教育部重点实验室，西安 710054； 3.长安大学信息工程学院，西安 710061； 4.西安长庆科技工程有限责任公司，西安 710018)

0 引言

在利用高分辨率遥感图像进行土地利用/覆盖分类中，空间上下文及语义信息的描述及利用是项关键技术。马尔科夫随机场(markov random fields，MRFs)可对图像的空间关系进行建模，但它需要假设或估计图像的条件和先验概率[1]。条件随机场(conditional random fields，CRFs)是Lafferty于2001年针对自然语言处理问题提出的一种判别式概率模型框架。在图像处理中，CRFs在空间上下文的表达及后验概率建模方面有其独特优势[2]，已被广泛应用到计算机视觉领域的自然图像目标类分割、视频目标跟踪[3-6]等方面。CRFs仅是一个模型框架，如果待处理的数据或目的不同，以及采用的图像分析方法不同，则模型具体形式也不尽相同。近年来，国内外学者[7-9]开展了CRFs在遥感领域的应用研究，但针对高分辨率遥感图像分类的研究相对较少。前人利用不同传感器图像(如多光谱、高光谱及SAR图像等)提取土地利用/覆盖分类信息并围绕如何有效表达目标空间上下文及语义信息这一关键技术开展了CRFs模型研究，为CRFs在遥感领域的推广应用作出了重要贡献，但大多集中在基于超像素的CRFs模型研究上。同其他面向对象分类方法一样，基于超像素的CRFs模型也存在分割质量对分类精度影响大的问题。在这一背景下，本文开展了“考虑空间上下文信息的基于像素的CRFs模型能否在m级分辨率的IKONOS和QuickBird等多光谱遥感图像分类中表现良好”这一问题的研究。

另一方面，已有研究[10-11]表明，随机森林(random forests，RF)算法[12]在多光谱、高光谱遥感图像分类中能与支持向量机(support vector machine，SVM)算法相竞争。在这种情况下，本文提出了适用于城市土地利用/覆盖高分辨率遥感分类的基于像素的RF-CRFs模型。

1 基于像素的RF-CRFs模型

1.1 概率图的建立

概率图的建立是基于CRFs模型分类的前提和基础。本文中，以图像的每个像素为结点建立一个概率图G(V,E)，如图1(a)所示。其中，V是像素表示的结点集合{nri,i=1,…,9}，每个结点包含观测变量的结点(图1(b)深灰色表示)和其标签变量的结点(图1(b)浅灰色表示)；E是结点i与其相邻结点j的连线表示的无向边集合(i,j)∈E，每个结点都具有4/8邻域(本文采用8邻域结构)。与不规则概率图模型相比，这类图模型更容易推理。

(a) 以像素为结点的4邻域概率图(b) 4邻域概率图的立体表示

1.2 特征提取

对于高分辨率遥感图像分类来说，除了光谱特征以外，纹理也是一项重要的特征[13]。其中，Texton 滤波器可产生多尺度多方向的纹理特征；与Gabor滤波器相比，它同时描述了目标的纹理、空间位置以及上下文信息多种特征[3]。本文选用5像素×5像素大小为窗口的Texton 滤波器来描述目标多尺度多方向的空间结构。

方向梯度直方图(histogram of oriented gradient，HOG)是计算局部图像梯度方向信息统计值的图件(目标的色调和形状能够被梯度或边缘的方向密度分布很好地描述)。在城区，主要土地利用类型是建筑物和道路，用方向梯度直方图可较好地反映这些特征。

上述特征可用一个高维特征向量来表示，并作为各结点的观测值，但存在特征维数过高及特征分量之间相关的问题。提升(boosting)技术是一种常用的特征优化方法。但本文实验表明：该技术对复杂场景遥感图像的分类效果改善不大，反而会增加分类的时间代价；而RF算法具有降低特征分量之间相关性的优势，其分类效果能与常用的SVM算法相竞争。因此，本文将RF与CRFs框架有机集成来定义RF-CRFs模型，用于高分辨率图像分类。

1.3 势函数的定义

1.3.1 基于随机森林的关联势函数

二阶CRFs模型的一般形式[2]为

，

(1)

式中：xi，yi分别表示概率图中第i个结点的观测值及其类标签；Z(x)为归一化常数；w,v分别表示关联势函数和交互势函数的参数向量；β为调节关联势能和交互势能的权重。关联势函数Øi表达了第i个观测变量xi取标签yi的概率，交互势函数φij反映了变量xi与其相邻变量xj之间的相关性及其各自标签yi与yj的相关性。

关联势函数的定义对CRFs模型的分类起主要作用，它通常利用某判别分类器的直接或间接概率输出来定义。常见的判别分类器有：逻辑回归、SVM及RF等。其中RF是一种采用集成策略的分类器[12]，在遥感图像分类中得到了较好应用。与其他分类器相比，RF分类器具有3个特点： ①RF可适用于大数据量的分类，在高维数据分类中更能体现出其速度快、精度高以及对噪声鲁棒的优势[14]； ②与SVM不同，RF的输出是个概率值，它可直接集成到CRFs模型框架中； ③RF可以直接扩展到多值分类中(RF分类原理参见文献[10])。

本文引入RF分类器来定义关联势函数Øi。对于变量xi及其标签yi，当yi=l，∀l∈L(L为标签集合)时，则有

(2)

式中:K是决策树总数；Tk(xi,θk)中k=1,…，K；θk是描述第k个决策树的独立同分布参数向量；δ为示性函数，其定义参见文献[14]。

利用式(2)定义的RF后验概率可将CRFs关联势函数定义为

Øi(yi,xi)=logP(yi|xi)。

(3)

本文对决策树总数、决策树最大深度和最大特征数这3个参数分别取经验值为50，2和10。

1.3.2 特征对比度加权Potts函数的交互势函数

本文采用对图像特征对比度敏感的Potts模型来定义交互势函数，其表达式为

φij(yi,yj,xi,xj,v’)=v’Tu(xi,xj)δ’(yi,yj) ,

(4)

式中：v’是待学习的参数向量；δ’是Potts函数，其定义参见文献[2]；u(xi,yj)是特征函数。

u(xi,xj)的定义是交互势函数定义的关键。对于城区高分辨率遥感图像，房屋与道路的光谱、纹理、形状特征相近，而高程信息是鉴别这两类目标的有效特征。但目前获取高分辨率的高程数据成本较高，因此要融合多种特征(如光谱、多尺度多方向的纹理及方向梯度直方图等)才能提高分类的精度。基于以上分析，本文将u(xi,xj)定义为

u(xi,xj)=1-exp(-‖f(xi,xj)‖2) ,

(5)

式中f(xi,xj)为广义特征对比度向量，其形式为

f(xi,xj)=[1,|xi1-xj1|,…,|xim-xjm|,…,|xiM-xjM|],

(6)

其中xim，xjm分别表示观测变量xi，xj的第m(m=1,2,…,M)维分量。组合式(5)(6)，便构成了完整的RF-CRFs模型。

2 模型实现

选取一定数量的训练样本，采用分项学习法[3]对RF-CRFs模型参数集{w,v,β}进行训练。模型参数学习后，便可对标签未知的图像数据进行分类，即模型推理。本模型属于多标签的二阶CRFs模型，对应的Gibbs能量是非亚模(non-submodular)的。因此，常用的模型推理方法仅能实现近似推理。考虑到图模型中结点数众多，本文采用基于图割(graph cut)的α-膨胀算法[2]进行快速推理。

上述过程是基于Darwin机器视觉库[15]，用Matlab和C++混合编程方式二次开发实现的。

3 实验及分析

3.1 实验

选取2005年7月武汉城区QuickBird多光谱图像为测试数据(如图2(a))，图像大小为412像素×412像素。SVM，RF和RF-CRFs模型对该图像进行分类的结果如图2(c)—(e)所示。

(a) QuickBird多光谱图像(b) 分类地面参考数据(c) 基于像素的SVM分类(d) 基于像素的RF分类

(e) 基于RF-CRFs模型(f) (d)与(e)类标记结果(g) (c)与(e)类标记结果(h) (e)相对于(b)的分类的分类差异图差异图错误示意图

从上述分类结果来看，与RF分类器相比，RF-CRFs模型的分类效果有所改善，改善之处可以从图2(f)看出：黑、白点分别表示了2种分类器对同一个结点输出标签的不一致性和一致性。其中，不一致性主要是由于RF-CRFs模型考虑了空间上下文信息，而RF分类器没有考虑而造成的。因此，RF-CRFs模型的分类效果更好。

图2(g)给出SVM与RF-CRFs模型分类结果的差异，可以看出二者的标记结果差异较大，其原因之一是SVM与RF-CRFs的分类原理存在较大差异，同时也间接反映了二者分类精度的差异。与其相比，RF与RF-CRFs的分类原理更相似，因此它们的标记结果差异较小，如图2(f)所示。

从图2(h)可以看出， RF-CRFs模型仍存在分类错误：除目标边缘像素外，目标内部存在错分现象，错误主要在建筑物与阴影，以及建筑物与道路的混分上，如图2(e)箭头所示。

3.2 定量评价及分析

随机选取训练和检验样本，利用混淆矩阵的总精度及Kappa进行精度评价，上述3种方法的分类精度如表1所示。

表1 3种方法分类精度对比

分析图2和表1，可以得出：

1)对比RF与SVM这2种分类器的分类结果，RF的分类精度比SVM提高了4.56%，分类可靠性也有所增加。

2)图2(d)(e)表明,与RF和SVM的分类结果相比，RF-CRFs模型分类结果中的“分类噪声”减少，其分类精度比RF分类精度提高了3.35%，比SVM分类器提高了7.91%，表明交互势能项对于缓解分类噪声，提高分类精度有一定作用。

3)从图2(f)可以看出，对于CRFs模型，关联势能对分类起主要作用，而交互势能仅用于进一步改善分类效果。

4 结论

凭借CRFs在目标空间上下文特征建模及分类方面的独特优势，针对城区高分辨率遥感图像的土地利用/覆盖分类问题，本文开展了集成光谱、多尺度、多方向Texton纹理等多种线索的基于像素的RF-CRFs模型的定义研究。

实验中，以典型城区的QuickBird多光谱图像为实验数据，开展了该模型的测试与分析。结果表明：上述多特征融合的RF-CRFs模型的分类精度达82.52%以上，比无交互势能的RF分类器提高了3.35%。因此，若特征及关联势函数定义合适，基于像素的RF-CRFs模型在m级分辨率的遥感图像分类中表现良好，可作为高分辨率图像的分类方法。

本文方法仍存在建筑物、道路以及阴影之间的混分现象。若无高程信息，这些现象很难避免。更重要的是，本文方法仍属于基于像素的分类，仍不能够表达大尺度的空间上下文信息(特别是语义信息)。因此，今后要开展多级空间上下文特征融合的CRFs模型研究。

参考文献(References)：

[1] 杨红磊,彭军还.基于马尔可夫随机场的模糊c-均值遥感影像分类[J].测绘学报,2012,41(2):213-218.

Yang H L,Peng J H.Remote sensing classification based on Markov random field and fuzzy c-means clustering[J].Acta Geodaetica et Cartographica Sinica,2012,41(2):213-218.

[2] Sutton C,Mccallum A.An introduction to conditional random fields[J].Machine Learning,2011,4(4):267-373.

[3] Shotton J,Winn J,Rother C,et al.Textonboost for image understanding:Multi-class object recognition and segmentation by jointly modeling texture,layout,and context[J].International Journal of Computer Vision,2009,81(1):2-23.

[4] Baloch S,Cheng E,Fang T.Shape based Conditional Random Fields for Segmenting Intracranial Aneurysms[M]//Image-based Geometric Modeling and Mesh Generation.Netherlands:Springer,2013:55-67.

[5] 高琳,唐鹏,盛鹏,等.复杂场景下基于条件随机场的视觉目标跟踪[J].光学学报,2010,30(6):1721-1728.

Gao L,Tang P,Sheng P,et al.Visual object tracking based on conditional random fields under complex scene[J].Acta Optica Sinica,2010,30(6):1721-1728.

[6] 李玲玲,金泰松,李翠华.基于局部特征和隐条件随机场的场景分类方法[J].北京理工大学学报,2012,32(7):720-724.

Li L L,Jin T S,Li C H.Scene classification based on local feature and hidden conditional random fields[J].Transactions of Beijing Institute of Technology,2012,32(7):720-724.

[7] Zhong P,Wang R.Modeling and classifying hyperspectral imagery by CRFs with sparse higher order potentials[J].IEEE Transactions on Geoscience and Remote Sensing,2011,49(2):688-705.

[8] Su X,He C,Feng Q,et al.A supervised classification method based on conditional random fields with multiscale region connection calculus model for SAR image[J].IEEE Geoscience and Remote Sensing Letters,2011,8(3):497-501.

[9] Hoberg T,Rottensteiner F,Heipke C.Context models for CRF-based classification of multitemporal remote sensing data[C]//ISPRS Annals of the Photogrammetry,Remote Sensing and Spatial Information Sciences.Melbourne,2012，1/7:129-134.

[10]刘毅,杜培军,郑辉,等.基于随机森林的国产小卫星遥感影像分类研究[J].测绘科学,2012,37(4):194-196.

Liu Y,Du P J,Zheng H,et al.Classification of China small satellite remote sensing image based on random forests[J].Science of Surveying and Mapping,2012,37(4):194-196.

[11]雷震.随机森林及其在遥感影像处理中应用研究[D].上海:上海交通大学,2012.

Lei Z.The research on random forests and its application to remote sensing image processing[D].Shanghai:Shanghai Jiaotong University,2012.

[12]Breiman L.Random forests[J].Machine Learning,2001,45(1):5-32.

[13]王东广,肖鹏峰,宋晓群,等.结合纹理信息的高分辨率遥感图像变化检测方法[J].国土资源遥感,2012,24(4):76-81.

Wang D G,Xiao P F,Song X Q,et al.Change detection method for high resolution remote sensing image in association with textural and spectral information[J].Remote Sensing for Land and Resources,2012,24(4):76-81.

[14]Kontschieder P,Bulò S R,Bischof H,et al.Structured class-labels in random forests for semantic image labelling[C]//International Conference on Computer Vision.Barcelona:IEEE,2011:2190-2197.

[15]Gould S.Darwin:A framework for machine learning and computer vision research and development[J].Journal of Machine Learning Research,2012,13:3533-3537.