APP下载

基于中分辨TM数据的水稻提取方法对比研究*

2014-03-09李志鹏李正国刘珍环吴文斌谭杰扬

中国农业资源与区划 2014年1期
关键词:时相面向对象分辨率

李志鹏,李正国,刘珍环,吴文斌,谭杰扬,杨 鹏※

(1.中国农业科学院农业资源与农业区划研究所/农业部农业信息技术重点实验室,北京 100081;2.中山大学地理科学与规划学院,广州 510275)

水稻在我国粮食生产中占有重要的地位,是我国重要的粮食作物之一,占全国粮食总播种面积的27%,而其产量则达到粮食总产量的35%[1]。与此同时,水稻面积遥感动态监测正成为农作物空间监测[2]和土地变化科学[3]的热点问题。精确的水稻种植面积信息,可为农业生产、水稻产量的预报和评估、粮食价格预测和国家粮食生产布局及规划等提供科学依据[4]。

中分辨率遥感影像由于具备较高的空间分辨率,能够满足我国大面积水稻作物监测,成为业务化运行的主要数据源。中空间分辨率影像包括Landsat TM/ETM+、SPOT、CBERS-1/2 CCD、HJ-1A/1B CCD等 (表1),其分辨率主要在100m以内,是当前最常用的水稻遥感监测数据源,其特征是卫星类型多、覆盖范围广、时间分辨率较高且时间序列较长,可实现大范围、多时期水稻种植的长期监测。Peng等[5]利用1986年和2002年两期Landsat TM影像对丽江县包括水稻在内的土地利用变化进行分析,实现了对过去16年间水稻种植变化特征分析;朱晓禧等[6]利用1988年和1998年Landsat TM影像,获取了黑龙江省西部地区的水稻和玉米种植图。中分辨率影像是当前作物遥感监测分类及变化监测中常用的数据源,也是我国农情业务运行遥感监测系统中的主要数据源,但因其对应的遥感自动分类方法存在缺陷,容易降低分类的精度。

针对以上的不足,该研究拟尝试近些年常用的神经网络和面向对象算法并结合多时相影像中分辨影像进行分类对比研究。神经网络 (Artificial Neural Network,简称ANN)是一种非线性的处理单元,具有知识的分布式存储,信息处理的并行结构方式,可以处理复杂的数据集,识别更精细的模式。它对于数据的类型和分布函数没有特殊的要求,容忍度高、容错性强,对于离散的、非正态分布多源数据的处理非常适合[7]。该方法与其它分类方法相比较,具有适应性强,精度较高的优势[8]。与传统的基于像元的分类方法相比,基于地物的光谱、植被指数 (NDVI)、形状、纹理及结构等多源信息的面向对象分类不仅充分考虑遥感影像的各种信息,而且突破了传统方法以单个像素作为识别单元的局限,以多个同类像素的集合作为基本单元。该算法不仅适用于高分影像,对于中分辨率影像同样适用[9]。中分辨率遥感影像分类提取水稻多基于单一时相进行分类识别,但基于单一时相遥感影像进行水稻面积提取面临的共同问题在于时相的选择,而最佳时相影像 (灌水移栽期)的选择可以强化水稻信息,弱化其它因子的干扰[10]。因此,只有准确的掌握研究区域的水稻生长发育期并选取该时段影像[11],才能够提取出高精度的水稻空间分布信息。

该研究拟选取中分辨率TM影像为数据源,以我国水稻生产第一大县——富锦市为研究区域,基于神经网络算法、面向对象分类算法及多时相遥感影像选择对比分析开展研究。该文通过探讨两种分类算法在水稻提取过程中的差异及分类过程中最佳时相的选择问题,以期找到解决提高基于中分辨率水稻遥感监测分类精度的问题,为水稻遥感动态监测、作物空间格局演变和农业土地变化科学研究等提供科学支撑。

表1 中分辨率水稻遥感监测常用数据源

1 研究区与数据

1.1 研究区域

该文选择全国水稻第一县 (市)的黑龙江省富锦市为研究区,富锦位于黑龙江省东北部、松花江下游南岸,富锦是三江平原腹地的中心城市 (131°25'~133°26'E,46°51'~47°31'N),全境总面积8 227 km2,周边与桦川县、同江市等7个县 (市)相邻。富锦市气候属于中温带大陆性季风气候;年平均气温3.4℃,最冷月平均气温-19.0℃,最热月平均气温22.2℃;年平均降水量510mm;地势低平,平均海拔60m左右。主要粮食作物包括水稻、小麦、大豆和玉米。

1.2 数据来源

该研究主要采用的数据为2景Landsat-5 TM影像,轨道号为114-027,数据接收时间为2010-06-06和08-25日,分别处于水稻的返青期、乳熟期,遥感影像覆盖富锦市90%以上的地区,并基于富锦市矢量文件对TM影像进行裁剪,完成分类前期数据准备。该数据从美国地质勘探局 (USGS)网站(http://earthexplorer.usgs.gov)下载。数据为L1T数据产品,已经过系统辐射校正和地面控制点几何校正,并且通过DEM进行了地形校正,基本满足研究区域分类要求。

基于谷歌高分辨率影像对研究区内进行样本采集,具体采样过程是:首先,选取谷歌地球上2010年覆盖富锦市地区的高分辨率遥感影像;其次,依据随机采样原则对整个富锦市的主要地物类型 (水稻、旱地、林地、建设用地及水体等)进行采样,共选取1 189个样方 (2/3用作训练样本,1/3用作验证样本)。此外,为验证分类结果的面积精度,从黑龙江农业信息网 (www.hljagri.gov.cn)获取2010年富锦市水稻和旱地的面积数量 (含3个国营农场)分别为28.07万、33.27万hm2。

2 研究方法

该研究主要采用神经网络分类及面向对象 (SVM)分类算法,分别对覆盖黑龙江省富锦市的2010年两个时相TM影像进行分类提取,依据富锦市实际地物情况及研究目的,分类结果包括水稻、旱地、林地、建设用地及水体等5类地物类型,并对两个时相4种分类结果进行分类后聚类处理 (Majority分析法),以消除分类过程中细小地物“椒盐”现象。文章通过两种分类算法、两个时相4种分类结果对比分析,以期找到基于中分辨率TM影像的水稻提取最佳分类算法。

2.1 神经网络分类方法

BP(back propagation)神经网络算法是神经网络算法中最常用的一种方法,1986年由Rumelhart和McCelland为首的科学家小组提出[12],是一种按误差逆传播算法训练的多层前馈网络,是目前最为广泛的神经网络模型之一。BP算法是一种有监督式的学习算法,基本思想是:若利用已有权重和阈值正向传播得不到期望的输出,则反向传播反复修改 (迭代)各节点的权重和阈值,逐步减小代价函数,直到达到预先设定的要求。一般以代价函数小于某一相当小的正数或迭代不再减小,则停止反复振荡,此时完成BP网络的训练及输入与输出之间映射关系的确定。BP神经网络 (BPNN)能学习和存贮大量的输入—输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。Majority分析是为消除细小图斑而进行的分类后处理,主要采用类似于卷积滤波的方法将较大类别中的虚假像元归到该类中,定义一个变换核尺寸,用变换核中占主要地位 (像元最多)的像元类别代替中心像元的类别。

该研究利用BP神经网络分类算法分别对富锦市的两个时相 (2010-06-06和08-08)TM影像进行分类提取、分类后Majority分析、精度评定3个过程。首先,经多次尝试对比分析,最佳输入参数活化函数、贡献阈值、权重调节速度、步幅长度、RMSE误差值、隐藏层数、迭代次数分别为0.5、0.5、0.9、0、1、30,输出初步分类结果;为减少分类过程中面积较小的图斑,对BP神经网络初步分类结果进行分类后归并处理 (Majority分析),以消除“椒盐现象”,提高分类精度,输入参数变换核、中心像元权重值分别为3×3、1;利用混淆矩阵对神经网络分类结果进行精度评定。整个分类过程在ENVI5.0软件下完成。

2.2 面向对象分类算法

与传统基于像元分类方法相比,面向对象分类方法在高分辨率遥感影像中的应用有巨大优势[13]。该方法不仅可以充分考虑地物的光谱、植被指数 (NDVI)、形状、纹理及结构等信息,使得分割后形成若干互不交叠的非空子区域,减少“椒盐效应”;同时由于对象内部相对均一,因而在一定程度上解决了“同物异谱”和“同谱异物”现象[14]。

利用面形对象 (SVM)分类算法分别对富锦市的两个时相 (2010-06-06和08-08)TM影像进行分类提取、分类后Majority分析、精度评定3个过程,其中面向对象分类是基于ENVI EX模块下完成。首先,分别对两个时相的TM影像进行尺度分割,与基于像元分类方法最大不同,初期的分割尺度对于分类结果的精度有着十分重要的影响,经多次尝试获取最佳分割尺度参数分割值、合并值分别为50、70;其次,输入训练样本、基于支持向量机 (SVM)算法最终实现面向对象分类过程,输入初步分类结果;同理进行分类后处理及混淆矩阵精度检验。

3 结果分析

3.1 水稻分布信息及精度检验

图1为基于神经网络和面向对象两种常用的单时相分类方法对富锦市两个时相 (2010-06-06和2010-08-25)TM影像分别进行分类提取,并对提取结果进行Majority滤波处理。提取类别主要包括水稻、旱地、林地、建设用地及水体等。下图分别表示:(a)时相为2010-06-06,分类算法为神经网络;(b)时相为2010-06-06,分类算法为面向对象 (SVM);(c)时相为2010-08-25,分类算法为神经网络;(d)时相为2010-08-25,分类算法为面向对象 (SVM)。

图1 2010年富锦市土地利用

基于研究区域的Google地球高分辨率影像随机采样,生成1 189个样方,占总样本数1/3作为验证样本,计397个 (水稻96个,旱地132个,林地67个,建设用地60个,水体42个)。最终基于混淆矩阵的分类精度评价结果如表2所示:4种分类总体精度均在90%以上,Kappa系数在0.85以上。其中面向对象 (2010-06-06)分类结果精度最佳,总体精度、Kappa系数、水稻用户精度及生产者精度分别为99.23%、0.9873、99.12%、99.93%;神经网络 (2010-08-25)分类精度相对最低,总体精度、Kappa系数、水稻用户精度及生产者精度分别为90.35%、0.8468、97.44%、96.05%。

基于2010年富锦市 (包括3个国营农场)统计数据 (水稻和旱地)进一步对4种分类结果进行面积一致性评定,评定结果见表3:神经网络 (2010-06-06)、面向对象 (2010-06-06)、神经网络 (2010-08-25)、面向对象 (2010-08-25)4种分类的水稻面积一致性分别为:2.2%、3.3%、-7.6%、-1.7%;旱地一致性分别为-0.2%、1.5%、-7.0%、7.7%。该验证结果表明:水稻提取结果在2010年6月较统计数据普遍偏高,在2010年8月普遍偏低;旱地分类面积结果为神经网络两个时相的分类结果均较统计面积低,面向对象提取旱地面积较统计面积偏高。整体表明,基于面向对象分类算法提取的水稻、旱地面积值较基于像元的神经网络分类高。主要原因是面向对象分类算法在分类过程中容易出现过分割而将田间的部分道路、水利设施等包含到水稻和旱地中[14]。

3.2 分类方法对比分析

为对比两种分类算法的分类效果,分别对6月和8月两个时相分类结果进行对比分析。对表4中2010年6月6日两种分类算法初始分类结果进行对比分析,面向对象/初始的总体精度、Kappa系数、水稻用户精度及生产者精度较神经网络/初始的4种分类精度分别高1.28%、0.0212、0.55%、1.37%;对表4中2010年8月25日两种分类算法初始分类结果进行对比分析,面向对象/初始的总体精度、Kappa系数、水稻用户精度及生产者精度较神经网络/初始的4种分类精度高6.09%、0.089 8、0.62%、2.34%。该结果表明,在高纬度单季稻生长区,面向对象分类算法的精度显著高于神经网络的分类精度,水稻用户精度和生产者精度在6月份分别高0.55%、1.37%,在8月份分别高0.62%、2.34%。主要原因是面向对象不仅考虑了TM影像丰富的光谱、植被指数 (NDVI)、形状、纹理及结构等多源信息,而且突破了传统方法以单个像素作为识别单元的局限,以大面积分割后的地块为基本单元,避免了“异物同谱和同谱异物”、“椒盐”现象。

表2 2010年富锦分类结果混淆矩阵精度评价

表3 富锦市遥感提取与统计数据面积一致性评定

分类后滤波处理 (Majority分析)在分类过程中起着关键的作用,在一定程度上能够改善分类结果的精度,其中基于像元的神经网络分类结果精度提高程度尤为显著 (如表4)。2010-06-06,神经网络经分类后滤波处理后的总体精度、Kappa系数、水稻用户精度及生产者精度分别提高0.7%、0.0115、0.14%、0.5%;2010-08-25,神经网络经分类后滤波处理后的总体精度、Kappa系数、水稻用户精度及生产者精度分别提高2.87%、0.043、1.56%、1.43%。结果表明,对神经网络分类的结果进行Majority滤波处理,可以弱化“噪声”的干扰,在一定程度上可以改善水稻分类的精度,水稻用户精度和生产者精度在6月份分别高0.14%、0.5%,在8月份分别高1.56%、1.43%。

表4 总体分类及水稻分类结果

3.3 时相对比分析

在基于单时相中分辨率影像进行水稻提取过程中,不仅方法的选择对于分类结果精度十分重要,最佳时相的选择具有同等重要意义。表4表明,神经网络/初始在06-06(返青期)与08-25(乳熟期)的结果对比表明,返青期的总体精度、Kappa系数、水稻用户精度及生产者精度较乳熟期分别高10.42%、0.1614、2.67%、3.45%;面向对象/初始在06-06(返青期)与08-25(乳熟期)的结果对比表明,返青期的总体精度、Kappa系数、水稻用户精度及生产者精度较乳熟期分别高5.61%、0.0928、2.6%、2.48%。上述结果表明,选取关键水稻物候期的遥感影像获取水稻种植面积的精度更高,返青期水稻提取精度要高于乳熟期,其中神经网络算法的水稻用户精度及生产者精度分别提高2.67%、3.45%;面向对象算法的水稻用户精度及生产者精度分别提高2.6%、2.48%。因此,建议在基于单时相中分辨率影像提取水稻面积时尽量考虑选择关键物候期的影像。

4 结论与讨论

基于中分辨率遥感影像进行水稻监测是农业遥感监测中最常用的方法之一,是水稻面积提取及估产研究的重要基础。该研究利用神经网络和面向对象两种分类算法对富锦市两个时相 (2010-06-06返青期和2010-08-25乳熟期)TM影像分别进行水稻提取,并得出以下主要结论:

(1)在高纬度单季稻生长区,面向对象分类算法的精度显著高于神经网络的分类精度。水稻用户精度和生产者精度在6月份分别高0.55%、1.37%,在8月份分别高0.62%、2.34%。主要原因是面向对象不仅考虑了TM影像丰富的光谱、植被指数 (NDVI)、形状、纹理及结构等多源信息,而且突破了传统方法以单个像素作为识别单元的局限,以大面积分割后的地块为基本单元,避免了“异物同谱和同谱异物”、“椒盐”现象。

(2)对神经网络分类的结果进行Majority滤波处理,在一定程度上可以改善水稻分类的精度。水稻用户精度和生产者精度在6月份分别提高0.14%、0.5%,在8月份分别提高1.56%、1.43%。该方法主要是通过弱化水田块中的细小图斑“噪声”干扰,将细小图斑重新分类为水稻,减少水稻漏分,提高水稻生产者精度;通过滤除将其它地物类型中错分为水稻的细小图斑,减少错分,提高水稻用户精度。

(3)选取关键水稻物候期的遥感影像获取水稻种植面积的精度更高,返青期水稻提取精度要高于乳熟期。其中神经网络算法的水稻用户精度及生产者精度分别提高2.67%、3.45%;面向对象算法的水稻用户精度及生产者精度分别提高2.6%、2.48%。因此,建议在基于单时相中分辨率影像提取水稻面积时尽量考虑选择关键物候期的影像。

未来需要建立全国水稻物候历信息,为最佳时相的中分辨率遥感影像选择提供重要参考依据,以提高水稻提取精度;最佳尺度分割是面向对象分类算法关键步骤,需要建立自动化最优尺度分割算法来提高分类的精度。

[1]陈晓华,张玉香,张合成.中国农业统计资料2011.北京:中国农业出版社,2012

[2]Kuenzer C,Knauer K.Remote sensing of rice crop areas.International Journal of Remote Sensing.2013,34(6):2101 ~2139

[3]Aspinall R.Editorial.Journal of Land Use Science.2006,1(1):1 ~4

[4]覃志豪,唐华俊,李文娟,等.气候变化对农业和粮食生产影响的研究进展与发展方向.中国农业资源与区划,2013,34(5):1~7

[5]Peng J,Wu J,Yin H,et al.Rural land use change during 1986—2002 in Lijiang,China,based on remote sensing and GIS data.Sensors,2008,8(12):8201~8223

[6]朱晓禧,方修琦,王媛.基于遥感的黑龙江省西部水稻、玉米种植范围对温度变化的响应.地理科学,2008,28(1):66~71

[7]李小涛,李纪人,黄诗峰,等.变差函数和神经网络结合的遥感影像分类方法研究.国土资源遥感,2006,(1):18~21

[8]陈启浩,高伟,刘修国.辅以纹理特征的高分辨率遥感影像分类.测绘科学,2008,33(1):88~90

[9]翁中银,何政伟,范娟,等.基于TM影像的面向对象地表覆被信息提取.地理空间信息,2013,11(1):37~39

[10]黄敬峰,杨忠恩,等.基于GIS的浙江省水稻遥感估产最佳时相选择.应用生态学报,2002,13(3):290~294

[11]李正国,唐华俊,杨鹏,等.植被物候特征的遥感提取与农业应用综述.中国农业资源与区划,2012,33(5):20~28

[12]李朝峰,曾生根,许磊.遥感图像智能处理.北京:电子工业出版社,2007

[13]张俊,于庆国,侯家槐.面向对象的高分辨率影像分类与信息提取.遥感技术与应用.2010,(1):112~117

[14]汤传勇,卢远.利用面向对象的分类方法提取水稻种植面积.遥感信息.2010,(1):53~56

猜你喜欢

时相面向对象分辨率
GEE平台下利用物候特征进行面向对象的水稻种植分布提取
面向对象方法在水蓄冷PLC编程中应用分析
原生VS最大那些混淆视听的“分辨率”概念
滑冰式滑雪动作体系的建构
一种提高CCD原理绝对值传感器分辨率的方法
血清白细胞介素及急性时相反应蛋白在细菌性痢疾患者中的变化研究
基于深度特征学习的图像超分辨率重建
基于自适应块组割先验的噪声图像超分辨率重建
3D VOI 技术在SPECT三时相骨显像对股骨头坏死早期诊断的应用
基于面向对象的车辆管理软件的研制与开发