APP下载

基于SPOT-5卫星影像的水稻信息提取方法研究
——以德阳市旌阳区为例

2017-10-23彭文甫任国业

西南农业学报 2017年4期
关键词:决策树分类器林地

王 娟,张 杰,张 优,彭文甫*,任国业

(1.四川师范大学 地理与资源科学学院,四川 成都 610068;2.四川师范大学 西南土地资源评价与监测教育部重点实验室,四川 成都 610068;3.四川省农业科学院遥感应用研究所,四川 成都 610066)

基于SPOT-5卫星影像的水稻信息提取方法研究
——以德阳市旌阳区为例

王 娟1,2,张 杰1,2,张 优1,2,彭文甫1,2*,任国业3

(1.四川师范大学 地理与资源科学学院,四川 成都 610068;2.四川师范大学 西南土地资源评价与监测教育部重点实验室,四川 成都 610068;3.四川省农业科学院遥感应用研究所,四川 成都 610066)

【目的】水稻遥感信息提取是遥感技术在农业领域应用方面的重要内容,也是快速、准确满足水稻种植遥感监测的需要。【方法】本研究以四川省德阳市旌阳区为研究区,利用SPOT-5卫星影像,对研究区的影像进行监督、面向对象以及决策树等多种方法分类,对分类结果进行对比,研究最适合提取水稻信息的方法。【结果】结果表明:①监督分类(6种分类器)人为控制训练区提高精度的同时也加大了人为误差;面向对象分类提高了效率,易出现分类混淆;决策树分类法直观、效率高,但在本研究区中,由于耕林混交的面积较大,水体和居民地亮度值接近,造成分类误差加大。②神经网络和支持向量机的分类精度最高,分类效果清晰,说明在实际水稻信息提取中以监督分类为最佳。【结论】基于遥感技术和高分辨率数据提取水稻信息、实现水稻监测是可行的。

水稻信息提取;监督分类;面向对象分类;决策树分类;德阳市

【研究意义】水稻作为中国第一大粮食作物,约占粮食总量的40 %,其长势监测、种植面积提取与产量的估算对于我国农业和经济的发展具有重要经济意义[1]。随着人口不断增长、城乡扩建占用大量的耕地,使得水稻面积信息越来越重要,它不仅是产量信息的基础,也是国民经济的重要情报之一,因此掌握重要的水稻种植信息,为国家和各级地方制定政策提供科学依据[2]。及时准确的进行水稻种植面积测量估算对中国的粮食安全和合理分配农业资源等都具有非常重要的意义[3]。目前利用农业统计报表法和抽样调查法仍然是获取大范围水稻的主要方法,但这些常规方法不能够快速准确的获取大范围的水稻信息,对农业生产管理、农业信息监测的需求无法满足[4]。利用遥感等技术进行空间信息获取能增加对农业生产的指导作用,促进精准农业的发展[5]。可以为农业生产,水稻产量的预报,及评估、粮食价格预测和国家粮食生产布局及规划等提供科学依据。

【前人研究进展】近年来国内利用遥感技术获取水稻等作物面积的相关研究较多,遥感数据获取周期短、覆盖范围广成为农作物调查的重要手段。国内不同地方采取的不同的方法进行相应的研究。例如,李杨等[6]利用典型物候期的TM数据,基于特征波段构建决策树来提取水稻面积。汪小钦等[7]利用ASAR数据基于面向对象分类建立水稻种植面积快速提取方法。张薇薇[8]利用中巴卫星(CBRES)影像和1景Landsat TM影像数据对重庆市梁平县综合利用RS和GIS技术手段并结合现有的土地利用现状资料,对CBRES CCD数据在水稻种植监测方面的应用潜力进行了探讨。魏新彩[1]以江汉平原腹地为研究区,选取样区水稻生长关键区的多时相HJ-1A/1B卫星数据构建基于HJ卫星数据的水稻种植面积提取方法,得到较好的效果。陈仲新等[9]利用SPOT-5卫星影像数据,采用非监督分类方法,并借助地面样方实测数据,准确提取出株洲市的水稻种植面积。单捷等[10]以环境卫星数据为基础,利用影像原始光谱信息的基础上,分析和提取多种分类特征,运用支持向量机法、CART决策树法和最大似然法提取水稻面积。总之,国内各个研究中提取水稻种植面积的方法多种多样,但是仅仅通过单一的因子和方法来提取水稻面积难免会造成很大的误差,并且单一的方法对大面积的农作物面积提取增加较多的工作量,不利于水稻面积的有效提取。进几十年来,国外学者在农作物面积信息提取的技术和方法方面做了大量的研究,研究应用的遥感数据多种多样,例如:Wardlow BD等[11]利用MODIS遥感数据的分辨率为250 m NDVI以及EVI指数对北美大平原进行大尺度作物制图的研究。Xiao等[12]利用NASA提供的MODIS的MOD09A1计算出一系列指数,包括NDVI、LSWI、ENI等,然后利用这种数据发展一种基于掩膜的制图算法对中国南部及13个省和东南亚13个国家水田面积进行提取。国外研究人员利用多种方法多种数据对水稻种植面积进行提取。其研究内容相比较国内而言更加多样化,但是根据不同的地区的情况,国内研究人员也开始采取多种多样的方法进行水稻面积提取。

【本研究切入点】本文以四川省德阳市旌阳区为研究区,采用监督分类、面向对象分类和决策树分类法,对水稻种植信息进行提取,通过精度评价、结合野外实测定点监测的结果,对比分析不同分类结果的精度与效率,【拟解决的关键问题】提出适合研究区水稻面积提取的遥感分类方法,减少在对农作物面积估算中的误差,促进农业技术与3S技术相结合、农业监测的准确性、高效性。

1 研究区概况

四川省是全国13个粮食主产区之一,也是西部地区唯一的粮食主产省。据统计,2014年全省水稻平均单产510 kg/667m2。德阳市位于四川成都平原东北部(图1)位于北纬31°05'~31°20'N,104°15'~104°33'E之间东跨龙泉山入川中盆地,辖旌阳区、广汉市、什邡市、绵竹市、中江县、罗江县,幅员面积5911 km2,人口392万。德阳市不仅是成渝经济区重要区域中心城市,也是成都经济区重要增长极。德阳市作为中国重大技术装备制造业基地和全国三大动力设备制造基地之一,生产了全国45 %以上的大型轧钢设备,同时也是世界最大的铸锻钢制造基地,发电设备产量全球第一,石油钻机出口全国第一。气候属亚热带季风湿润气候区,四季分明。

图1 研究区位置Fig.1 Location of study area

2 数据来源及方法

2.1 数据来源及处理

本研究数据是2014年德阳市旌阳区的SPOT-5遥感影像,RGB组合为1、4、2波段组合,图像较清晰,云量较少,数据来源于四川省农科院遥感应用研究所;德阳市矢量边界,数据来源于四川师范大学西南土地资源与评价教育部重点实验室;数据预处理采用ENVI5.1软件,对遥感影像进行几何纠正、辐射定标、大气纠正、拼接与剪裁,得到德阳市旌阳区遥感数据;利用人机交互解译与野外调查结合的方法,提取德阳市土地分类数据。

2.2 研究方法

2.2.1 土地利用分类系统 根据研究区实际土地利用类型为耕地(水田)、林地、建设用地、水域、未利用地,考虑到本次研究是提取水稻面积,未利用地面积很少,将未利用地并入建设用地,因此土地利用类型为耕地(水田)、林地、建设用地、水域。

2.2.2 监督分类方法 监督分类又称训练分类法(supervised classification),在这种分类中,对每种类别选取一定数量的训练区,计算机计算每种训练样区统计或其他信息,每个样本和训练样区做比较,按照不同规则将其划分到和其最相似的样本中[13]。本文运用了监督分类中的6种不同分类器对研究区影像进行分类,分别是:平行六面体分类器(Parallelpiped)、最小距离分类器(Minimum Distance)、马氏距离分类器(Mahalanobis Distance)、最大似然分类器(Likelihood Classification) 、神经网络分类器(Neural Net Classification)、支持向量机分类器(Support Vector Machine Classification)。

2.2.3 面向对象的图像分类 面向对象的图像分类主要是集合临近象元为对象用来识别感兴趣区的光谱要素,充分利用高分辨率的全色和多光谱数据的空间,纹理和光谱信息来分类的特点,以高精度的分类结果或者矢量输出[14]。

2.2.4 基于专家知识决策树分类 基于专家知识的决策树分类是基于遥感图像数据及其他空间数据,通过专家经验总结、简单的数学统计和归纳方法等,获得分类规则并进行遥感分类。总体上可分为4个过程:定义分类规则、构建决策树、执行决策树和评价分类结果[11]。

2.2.5 技术路线 在对研究区SPOT-5遥感影像进行矫正、配准以及拼接等预处理后,分别采用监督分类(6种分类器)、面向对象和决策树分类等方法,对影像进行分类、分类后处理,通过野外验证,对比分析不同方法提取水稻信息的精度。技术路线见图2。

3 结果与分析

3.1 监督分类结果

监督分类总体上一般可分为4个过程:定义训练样本、执行监督分类、评价分类结果和分类后处理。而根据研究区不同的情况,在执行监督分类时,要根据分类的复杂程度、精度需求来选择分类器[14]。基于监督分类6种不同分类器分类后得出以下结果(图3)。

3.2 面对对象分类

本文运用基于样本的面对对象分类方法来进行分类,同样是选择4类训练样本,水稻、林地、居民地、水体,得出的分类结果如下(图4)。

图2 技术路线Fig.2 Technology route

a.马氏距离分类器;b.最大似然法分类器;c.最小距离分类器;d.神经网络分类器;e.平行六面体分类器;f.支持向量机分类器图3 6种监督分类器得到的分类结果Fig.3 6 classification results obtained by supervised classifier

3.3 决策树分类

结合德阳市旌阳区的SPOT-5影像,分析其影像中水体、居民地、林地以及水稻等主要地物的光谱特征,首先对监督分类时选取的训练样本进行各波段数据的统计分析,主要地物类型的统计信息主要包括:各波段下的最大值(Max.)、最小值(Min.)、均值(Mean)、方差(Stdev)等,这是遥感图像亮度值的随机变量概率分布状况的较好描述(表1)。本文提取了spot影像1、4、2波段和归一化植被指数运算的统计特征值,其中归一化植被指数为近红外波段和红外波段的反射率的差除以它们的和。计算表达公式为:

其中,NIR为近红外波段,R为红外波段NDVI能反映植被冠层的影像,反映植被覆盖率,且-1≤NDVI≤1。

图4 面向对象分类结果Fig.4 Results of object oriented classification

根据上表光谱统计信息,分析不同地物光谱灰度值得出如下结论。B1(NIR):水稻>居民地>林地>水体,居民地和林地亮度值接近,容易混淆,水稻和水体、居民地、林地亮度值差异明显。

B2(R):居民地>水体>水稻>林地,林地和水稻有重叠的部分,容易混淆,水体和居民地差异明显,但是也有部分重叠的现象。

图5 水稻信息提取过程Fig.5 Process of rice information extraction

B3(G):居民地>水体>水稻>林地,居民地和水体、水稻、林地差异明显,水稻和水体有部分重叠的地方。

表1 研究区影像上提取的各地物类型的统计特征信息Table 1 Statistical features of the various types of information extracted from the image in the study area

图6 决策树分类Fig.6 Results of decision tree classification

B4(SWIR): 居民地>水稻>林地>水体,水体和居民地、林地、水稻差异明显,林地和水稻之间亮度值较为接近,差异不明显。

B5(NDVI):水稻>>林地>居民地>水体,居民地、水体和林地、水稻有着明显的差异,能根据NDVI明显将水稻和水体区分出来,但是水稻和林地之间、水体和居民地之间依然存在部分重叠的现象。

对地物光谱特征分析,得出如下结论。水体:B2>B3>B1>B4;居民地:B2>B3>B4>B1;林地:B3>B1>B4>B2;水稻:B1>B3>B4>B2。

从上述分析可以看出:①特征波段NDVI中,林地、水稻和非植被差异明显,因此可以利用NDVI值将水稻、林地与居民地和水体区分出来,由此去掉大部分水体和居民地。②而在原始影像的波段中,水稻和林地、水体和居民存在重叠现象,利用阈值不能提取水稻信息,同时具有相似的波段特征,即B3(G)>B1(NIR),此时由于水稻和林地之间容易混淆,根据B3(G)和B4(SWIR)上的波段特征,即B3>B4再次对水稻进行提取。③在B1(NIR)居民地和水体上差异明显,几乎没有重叠,可以利用这个波段提取水体。本文根据上述分析,提出基于特征波段的决策树方法对水稻信息进行提取,可用下面流程图进行表示,基本过程图5。

水稻和林地的提取:根据前面的分析,二者和水体、居民地之间的NDVI值差异明显,通过多次试验将此处NDVI值设置在0.17,通过分析各地物亮度值的关系,通过B1和B3对水稻和林地进行提取,通过B1和B4对水体和居民地进行提取,具体分类结果图6。

3.4 分类结果精度评价

图7 野外调查路线Fig.7 Field of survey

3.4.1 野外调查 通过野外采样数据,来验证分析结果的正确性。验证区域选取主要是根据本次研究调查采用数据源的时相特征、判读过程与结果的意见反馈以及充分考虑已有的数据基础来选择本次地面复核的样方点。本次调查主要集中在四川省德阳市旌阳区进行实地考察,野外采集了50个样本点和20个样地(图7)。

通过对比不同的分类器的制图精度、用户精度和Kappa系数,总结出对各种地物类型的识别能力,提取出对水稻种植面积进行提取最优的方法。根据以上数据,可以得出以下结果。

(1)从分类影像中可以看出研究区的水稻大部分是分布于西部和西北部的,研究区中部和南部地区主要是建设用地(居民地),位于研究区中部的河流其特征较为明显,东部及东南部地区主要以林地为主,混合有水稻田(耕地)分布。

表2 Kappa系数与分类质量的对应关系Table 2 Relationship between Kappa coefficient and quality classification

表3 各分类方法分类精度比较Table 3 Classification accuracy of different classification methods

表4 各地物类型在不同的分类方法下的制图精度Table 4 Mapping accuracy of each object types by different classification methods

表5 各地物类型在不同的分类方法下的用户精度Table 5 User accuracy of each feature type by different classification methods

(2)在各个分类结果(表3)中,总分类精度最高的是支持向量机分类(95.92 %),而后依次是最大似然法分类(95.57 %)、神经网络分类(95.22 %)、面向对象分类(93.67 %)、马氏距离分类(89.32 %)、基于专家决策树分类(89.09 %)、最小距离分类(80.46 %)以及平行六面体分类(78.28 %)。监督分类通过大量时间选取训练和评估训练样本的基础上,提高了分类精度,但由图3可见,最小距离分类法和平行六面体分类法中,水体和居民地容易出现混分的情况,造成分类错误。而研究区东部及东南部由于水稻田和林地的象元混交,在分类是也容易出现错误,综合比较下来,最大似然分类法、神经网络分类法和支持向量机分类结果都分类较为精确。

(3)从制图精度(表4)来看,文章是对水稻面积的提取,在各种分类结果中,水稻的制图精度由高到低依次是:马氏距离分类(98.43 %)、最小距离分类(96.86 %)、神经网络分类(93.33 %)、支持向量机分类(89.80 %)、基于专家决策树分类(83.74 %)、最大似然法分类(82.35 %)、面向对象分类(77.65 %)、平行六面体分类(77.25 %)。总的来说监督分类中的马氏距离分类、最小距离分类和神经网络分类的制图精度较高,而面向对象分类和决策树分类次之。说明在分类中正确分类的像元个数和真实参考象元的比值较高,基于野外采样点来验证分类结果的精度较高,这样的结果说明在实际提取水稻种植面积的应用中,监督分类的方法要优于面向对象分类和决策树分类。

(4)水稻分类的用户精度是指正确分到水稻的像元总数与分类器将整个图像的像元分为水稻的像元总数的比值。在分类结果中,马氏距离分类、神经网络分类、支持向量机分类、最大似然分类、面向对象分类的用户精度都为100 %,但是由于用户精度是分类器自身的像元分类,所以在实际应用中不能通过用户精度来比较哪种方法更适合于水稻面积的提取。

(5)将监督分类中6中分类结果作比较后,得出的最优的两种分类方法和基于样本的面向对象的分类法和基于专家决策树的分类方法作比较,监督分类依然占优势,其分类结果精度更高,决策树分类的精度较面向对象的分类方法其精度稍低。

因此,精度评价结果显示,本文采用的几种分类方法分类效果都较好,以神经网络和支持向量机的分类精度最高,分类效果最为清晰。因此在进行水稻面积提取的实际应用中应该以监督分类(最大似然分类法、神经网络分类法和支持向量机分类)为主要分类方法,但是实际方法应以实际研究区为例。

4 讨 论

本研究利用遥感分类的几种分类方法对研究区的SPOT-5影像进行分类,进行水稻种植面积的提取。监督分类可以根据应用目的和区域,人为控制训练样本选取,有针对地决定分类类别,但需要耗费大量的人力和时间来选取和评估训练样本,加大了人为误差,且只能识别样本中已定义的样本类别,没有定义的类别会出现不能识别或者混淆状况;基于样本的面向对象的分类可以减少选取精确样本的时间,但在象元混交的地方容易出现分类混淆的现象;决策树分类法灵活直观、清晰、运算效率高,在遥感分类问题上具有很大的优势。在本文章中,由于耕林混交的面积较大,而水稻生长期的NDVI和林地容易混杂,造成分类误差加大的现象。

5 结 论

由于研究区位于成都平原中部地区,这里的耕地多采用轮耕制度,耕作模式的改变导致在提取水稻种植面积会存在一定的误差,耕林混交的现象对水稻种植面积的提取还存在影响。本次试验的成果对于大面积提取水稻种植面积测量方法的研究有着重要的理论和实际价值。在实际应用中,由于中国人多地广,各个省县的耕作模式不同,给各个影像进行分类提取水稻面积带来一定的困难,增加了分类不确定性。如果要在更大范围的地区进行试验,需要根据研究区特定的耕作模式及物候情况,因地制宜,制定适合该地区的分类规则。

[1]魏新彩.基于HJ卫星影像的水稻种植面积遥感信息提取方法研究[D].武汉:湖北大学,2013.

[2]陈树辉,李 杨,曾凡君,等.基于多源数据的水稻种植面积提取[J].安徽农业科学,2011,39(12):7442-7444.

[3]周 虹.2014年四川省稻谷生产情况分析及展望[C].四川农业科技,2015.

[4]程式华,曹立勇,陈深广,等.水稻遗传育种回顾与展望[A].科技创新成就辉煌—中国农业科学院建50周年学术文集[C],中国农业科学院,2007:84-91.

[5]李 根,景元书,王 琳,等.基于MODIS时序植被指数和线性光谱混合模型的水稻面积提取[J].大气科学学报,2014,37(1):119-126.

[6]李 杨,江 南,吕 恒,等.基于水稻特征波段的决策树分类研究[J].地理与地理信息科学,2010,26:2.

[7]汪小钦,王钦敏,史晓明,等.基于主成分变换的ASAR数据水稻面积提取[J].农业工程学报,2008,24(10):122-126.

[8]张薇薇.基于多时相CBRES CCD图像的水稻种植面积监测[D].重庆:西南大学,2008.

[9]黄振国,陈仲新,刘芳清,等.利用SPOT-5影像提取水稻面积的研究[J].湖南农业大学学报,2013,39(2):137-140.

[10]单 捷,岳彩荣,江 南.基于环境卫星影像的水稻种植面积提取方法研究[J].江苏农业学报,2012(4):728-732.

[11]Wardlow B D,EgbertSL.Large-area crop mapping using time-serise MODIS 250 NDVI data:An assessment for the US FOR the US central Great plains[J].Remote Sensing of Environment,2008(3): 1096-1116.

[12]Xiao X,Boles S,Liu J,et al.Mapping paddy rice agriculture in southern China using multi-temporal MODIS images[J].Remote Sensing of Environment,2005,95: 480-492.

[12]田金苓.土地利用遥感分类计数探讨[J].科技创新导报,2010(9):18.

[13]王人潮,黄敬峰.水稻遥感估产[M].北京:中国农业出版社,2002.

[14]赵英时.遥感应用分析原理与方法[M].北京:科学出版社,2003:194.

ExtractionMethodResearchofRiceInformationBasedonSPOT-5SatelliteImagesTakingJingyangDistrict,DeyangCity,SichuanProvinceasExample

WANG Juan1,2,ZHANG Jie1,2,ZHANG You1,2,PENG Wen-fu1,2*,REN Guo-ye3

(1.Institute of Geography and Resources Science,Sichuan Normal University,Sichuan Chengdu 610068,China;2.Key Lab of Land Resources Evaluation and Monitoring in Southwest,Ministry of Education,Sichuan Normal University,Sichuan Chengdu 610068,China;3.Remote Sensing Application Institute,Sichuan Academy of Agriculture Sciences,Sichuan Chengdu 610101,China)

【Objective】Rice information extraction based on remote sensing is an important aspect of the application of remote sensing technology in the field of agriculture,which can quickly and accurately meet the needs of the remote sensing monitoring of rice cultivation.【Method】Jingyang district of Deyang city was used as studied area,based on the SPOT-5 image data,the most suitable method of extracted rice information in this paper was studied from the method of supervised classification,parallel hexahedron classification,minimum distance classifier,Mahalanobis distance classification,object-oriented classification and decision tree classification.【Result】(i) Supervised classification could improve the precision by the artificial control training area but increase the error from the man-made.Oriented object classification improved the efficiency but led to easy confuse the classification.Decision tree classification method was intuitive,clear,high efficiency but increase the classification error as the result of the tillage mixed forest area was larger,the brightness values between the water and area close within the study area.(ii)The classification accuracy from the methods of the neural network and support vector machine was the highest,and the classification effect was clear.【Conclusion】The extracted information of rice and monitoring rice based on remote sensing technology and the high resolution remote sensing data was feasible.

Rice information extraction; Supervised classification; Object-oriented classification; Decision tree classification; Deyang city

1001-4829(2017)4-0861-08

10.16213/j.cnki.scjas.2017.4.025

2016-05-22

国家自然科学基金项目“基于LUCC扰动影响的成都平原土地生态安全维持机理”(41371125)

王 娟(1993-),女,四川宜宾人,硕士研究生,研究方向为人文地理,E-mail:460292531@ qq.com;*为通讯作者:彭文甫(1964-),男,四川乐山人,博士,副教授,研究方向为环境遥感,E-mail: pwfzh@126.com。

K825.89

A

(责任编辑 陈 虹)

猜你喜欢

决策树分类器林地
图片新闻
基于深度优先随机森林分类器的目标检测
决策树和随机森林方法在管理决策中的应用
明水县林地资源现状及动态变化浅析
浅谈明水县林地资源动态变化状况
基于差异性测度的遥感自适应分类器选择
基于决策树的出租车乘客出行目的识别
基于模糊关联规则和决策树的图像自动标注
基于肺癌CT的决策树模型在肺癌诊断中的应用
基于层次化分类器的遥感图像飞机目标检测