APP下载

基于MODIS 的松花江流域主要作物分布提取*

2023-10-25冯颖郭英陈晓璐刘孟竹沈彦俊

中国生态农业学报(中英文) 2023年10期
关键词:松花江流域植被指数决策树

冯颖,郭英,陈晓璐,刘孟竹,沈彦俊,3**

(1.河北师范大学地理科学学院 石家庄 050024;2.中国科学院遗传与发育生物学研究所农业资源研究中心/中国科学院农业水资源重点实验室 石家庄 050022;3.中国科学院大学现代农业科学学院 北京 100049)

准确地掌握农作物种植结构的时空变化信息可为区域农作物耗水变化及水资源供需变化的研究提供基础,对国家农业生产管理、国家粮食安全与保障和农业生产指导具有重要意义[1]。农作物种植结构的调查从最早的田间统计尺度已经发展到如今的遥感对地观测。相比于传统高成本、低效率田间调查方法,遥感观测为掌握大区域尺度农作物空间格局提供了更加便捷、有效的方法。遥感作物分类的核心是充分利用农作物光谱、物候、地表覆被类型等特征差异以及专家知识对农作物进行分类,主要方法包括基于物候的算法、基于机器学习和深度学习的算法等。传统目视解译遥感图像处理中分类精度较低且效率较低,而决策树分类则是通过获取各个像元特征值进行的,包括光谱特征与纹理特征,当遥感影像空间布局和分布较难分辨时,根据特定的知识和规则对地物种类和影像进行分层并依次进行匹配,从而达到地物种类分离的目的。决策树方法具有物理机制明确、易实现、准确度高、效率高的优点,已被广泛应用[2]。

周静平等[3]根据多时序环境卫星影像,采用决策树和面向对象相结合的分类方法成功在黑龙江省双河农场地区提取了作物分布信息。陈睿等[4]基于2011-2016 年的HJ1A/CCD 数据,利用HANTS 滤波后的归一化植被指数(NDVI)时间序列曲线,获得黑河中游绿洲区作物种植面积的精细分类,精度高于90.8%。陈晓璐等[5]对MODIS 和Landsat 数据进行融合利用HANTS 滤波建立ESTARFN NDVI 时间序列数据对察罕淖尔地区灌溉耕地进行提取,总分类精度为93.18%,Kappa 系数为0.91。李鑫川等[6]以多时序环境卫星影像对黑龙江垦区友谊农场进行作物分类表明: 决策树分类效果最好。黄健熙等[7]以多时序高分卫星影像,构建基于NDVI 植被指数的决策树对黑龙江省五九七农场作物种植信息进行提取,精度高于最大似然法的分类精度。郝卫平等[8]基于多时相遥感数据估算了2007 年东北三省的耕地和水稻(Oryza sativa)、玉米(Zea mays)、大豆(Glycine max)的面积,精度分别为0.68、0.74 和0.68。李奇峰等[9]采用聚类分析法研究东北农作区种植结构空间演变情况,结果表明主要作物生产呈现集中趋势,形成各自主要的生产区域。综上,基于时序植被指数的决策树分类方法根据作物季相节律特征构建,能充分体现同一作物在不同生育期及不同作物在同一生育期的差异,因此具有较高的作物分类精度。

2020 年我国粮食供求总量始终处于紧平衡状态,粮食生产面临着“供”与“需”双重压力,我国始终坚持“谷物基本自给、口粮绝对安全”的战略,东北黑土粮仓是我国粮食生产的最重要产区[10-11]。松花江流域穿越东北粮食的主产区,是我国重要的商品粮基地[12]。2000 年以来,出于政策刺激,松花江流域种植规模快速扩张,种植面积扩大了将近一倍,种植结构发生了重大改变。因此,提取松花江流域内作物种植结构变化,对于提升其未来供给能力、保障国家粮食安全以及粮食生产的合理布局具有重要意义。

本研究以松花江流域为研究区,基于统计年鉴数据以及MODIS 多时相数据,计算NDVI、植被增强型指数(EVI)及地表水分指数(LSWI) 3 个植被指数,结合不同作物生长发育的物候期构建决策树模型,对松花江流域内水稻、玉米和大豆进行提取,分析流域内种植结构的空间变化特征,以期为流域内种植结构调整提供科学指导。

1 研究区概况

松花江作为中国七大河之一,是黑龙江在中国境内的最大支流。松花江流域(119°52′~132°31′E,41°42′~51°38′N)东西长920 km,南北宽1070 km,跨越内蒙古、吉林、黑龙江3 省(自治区),流域面积55.68 万km2,占黑龙江流域总面积的30.2% (图1)。流域地处北温带季风气候区,四季分明,夏季温热多雨,冬季寒冷干燥,年内温差较大,多年平均气温为3~5 ℃,年内7 月温度最高,日平均温度为20~25 ℃,最高曾达40 ℃以上;1 月温度最低,月平均气温-20 ℃以下;多年平均降水量在500 mm 左右,东南部山区降水可达700~900 mm,而干旱的流域西部地区只有400 mm。松花江水系发达,支流众多,流域内水能资源丰富,年径流量762 亿m3。松花江自古以来便有“黄金水道”的称誉,为两岸的农业发展带来了充足的资源。流域内光照充足,雨热同期且土壤肥力较高,土壤主要以黑土、棕壤、白浆土以及沼泽土为主,适于农作物的生长,利于农业的发展,是我国重要的农业基地。其主要粮食作物为水稻和玉米,主要经济作物为大豆,均为一年一熟制,生育期集中在4-9 月。

图1 研究区概况及验证点分布图Fig.1 Overview of the study area and distribution of verification points

2 数据来源与研究方法

2.1 数据来源

水稻、玉米、大豆的种植面积来源于黑龙江省、吉林省、内蒙古自治区的统计年鉴(https://data.cnki.net),土地利用数据来源于“中国科学院地理科学与资源研究所资源环境科学与数据中心”(https://www.resdc.cn)。MODIS 数据为MOD13A2 产品和MOD09A1(https://www.earthdata.nasa.gov),其 中,MOD13A2 产品NDVI 及EVI 指标的时空分辨率分别为16 d 和1 km;MOD09A1为反射率数据,用于LSWI 指标的计算,时空分辨率分别为8 d 和500 m。

2.2 研究方法

本研究基于黑龙江省、吉林省和内蒙古自治区统计年鉴数据的作物种植面积以及MODIS 多时相数据,计算NDVI、EVI 及LSWI,构建决策树模型对松花江流域内水稻、玉米和大豆进行提取。

2.2.1 主要作物物候特征

松花江流域水稻在4 月下旬泡田,5 月中下旬插秧,6-8 月返青、分蘖、拔节、抽穗、灌浆,9 月中上旬成熟,9 月下旬至10 月上旬收获;玉米生育期较长,约150 d 左右,不同品种略有差别,4 月下旬至5月上旬播种,5-9 月出苗、三叶期、七叶期、拔节、抽穗、开花、灌浆,9 月下旬至10 月上旬成熟,10 月中下旬收获;大豆播种时间为5 月中上旬,5-6 月出苗、开花,7 月中下旬结荚,8-9 月从鼓粒到成熟,10 月初收获[13](表1)。

表1 松花江流域不同作物生育期Table 1 Different crop growth periods in Songhua River Basin

2.2.2 植被指数时间序列数据集

NDVI 是目前应用最广泛的植被指数。完整的NDVI 时间序列数据集能够较好地反映农作物播种-生长-成熟-收割的全过程。由于农作物的种类、生长特性和播种收割时间不同,表现出的光谱差异也不同[14-15]。计算公式为:

EVI 是利用遥感影像中的红光波段、近红外波段及蓝光波段运算得出的植被指数,对植被冠层结构十分敏感,不仅能降低大气和土壤对植被的干扰,而且能更加有效地消除指数的饱和现象,广泛应用于研究植被动态变化[16]。计算公式如下:

LSWI 针对植被水分对红外波段的吸收特性,采用红外通道监测植被水分状况。水体对短波红外波段(SWIR)有较强的吸收,SWIR 波段对植被含水量的变化较敏感,近红外波段(NIR)比可见光具有更强的叶冠透射能力,可用于区分水稻[17-19]。计算公式如下:

式中:ρnir为近红外通道反射率;ρswir为短波热红外通道反射率;ρred为红色通道反射率;ρblue为蓝色通道反射率;L为土壤调节参数,值为1。

2.2.3 植被指数时间序列数据集重构

由于云、气溶胶以及地物的双向性反射等因素会对地表覆盖及陆地生态系统的监测产生极大的影响,因此需要对植被指数时间序列集进行平滑处理,即重构时序植被指数。目前常用的植被指数时间序列滤波去除噪声分析方法主要有Savizky-Golay 滤波(S-G)、非对称高斯滤波(A-G)、双逻辑调和函数滤波(D-L)和傅里叶谐波(Hants)等。Savitzky-Golay过滤器的效果根据所选窗口的宽度不同,可以满足多种场合的需求[20-22]。本研究使用的是S-G 滤波,可有效平滑去除噪声且最大程度地保留植被指数的特征曲线。

式中:为植被指数拟合值;Y为植被指数原始值;N为卷积数据;m为半个平滑窗口的宽度;j为初始值植被指数序列;Ci为第i个植被指数滤波系数。

2.2.4 决策树模型

由于不同作物生育期的差异,不同地区气候环境的差异及不同作物物候期的差异,以NDVI、EVI及LSWI 指标为提取目标,根据不同作物的关键物候期(出苗期、拔节期、抽雄期、成熟期等)设定阈值,使用ENVI 软件中的决策树模型提取不同作物的种植面积[23-24]。松花江流域主要种植作物为水稻、玉米、大豆。LSWI 指标可采用红外通道检测植被水分状况,水稻在4 月下旬至5 月上旬处于泡田时期,期间水稻秧苗与水体处于共存状态,可用于区分水稻和其他作物;玉米种植时间早于水稻和大豆,可利用出苗期区分玉米和其他作物,玉米的拔节期生长速率最快,抽雄期为营养生长向生殖生长转变的时期,此时玉米的平均叶面积最大,其NDVI 时序曲线达到峰值,10 月上旬玉米收割后为裸地;大豆播种时间稍晚于玉米,其收获时间早于玉米,其EVI 曲线到达峰值时间较玉米早。决策树中,对于NDVI 及EVI 峰值的确定,选择了包含峰值及其前后的两个时相,可避免一定程度上因受到各地种植习惯不同、气候干扰等带来的影响(表2)。

表2 松花江流域作物决策树模型Table 2 Crop decision tree model in the Songhua River Basin

3 结果与分析

3.1 作物提取精度验证

3.1.1 基于统计年鉴数据的精度验证

本研究基于决策树模型结合作物生长发育关键物候期,对2000 年和2020 年松花江流域内主要农作物种植面积进行提取,并与农业统计年鉴各市的种植面积进行相关分析,决定系数为0.8797,水稻、玉米和大豆的决定系数分别为0.9090、0.9026、0.8200,单类种植结构提取的精度均在82%以上(图2),结果具有较好的一致性,分类结果能较准确地反映流域内作物的空间分布情况。

图2 2000 年和2020 年松花江流域主要作物提取种植面积与各市农业统计年鉴数据对比Fig.2 Comparison of extracted planting crop areas and actural planting areas of agricultural statistical yearbook data of crops in the Songhua River Basin in 2000 and 2020

3.1.2 混淆矩阵验证

通过在松花江流域内实地考察,采集作物分布验证点109 个,其中水稻采样点40 个,玉米采样点53 个,大豆采样点26 个,获取的验证点近两年内作物种植类型未发生变化,可用于2020 年作物提取的空间验证,结合Google Earth 和其他学者已发布的相关数据集进行混淆矩阵验证[25-26],Kappa 系数为0.79,总体分类精度为0.84。分类结果具有较高的准确性,可用于松花江流域内作物的空间分布特征分析。

3.2 松花江流域作物分布的空间变化分析

松花江流域南部地区主要种植玉米,北部地区大多种植大豆,水稻主要分布在松花江、第二松花江及嫩江河流附近耕地,形成“北大豆,南玉米,河流附近皆水稻”的空间分布格局(图3)。2000-2020 年,松花江流域内作物空间分布发生显著改变。在嫩江流域北部和中部地区主要为其他作物转变为大豆,嫩江流域南部地区主要为其他作物转变为玉米和水稻,在松花江(三岔河口以下)流域主要为大豆和其他作物转变为玉米,第二松花江流域为其他作物转变为玉米。水稻集中分布在三江平原佳木斯市以及哈尔滨市、齐齐哈尔市等地区,除白山市和延边朝鲜族自治州水稻种植面积呈减少趋势外,其余各市水稻的种植面积均有不同程度增加;玉米集中分布在长春市、哈尔滨市、齐齐哈尔市等地区,在流域内大部分城市种植面积均有不同程度增加,玉米的种植面积增加与流域内实行了8 年的玉米临储政策有关,政策颁布后既稳定了玉米的价格同时也保障了农民的收益;大豆集中分布在黑河市、齐齐哈尔市、绥化市等地区,其种植面积在长春市、哈尔滨市、吉林市等有不同程度的下降。

图3 2000 年和2020 年松花江流域主要作物空间分布Fig.3 Spatial distribution of main crops in the Songhua River Basin in 2000 and 2020

2000-2020 年松花江流域内作物总种植面积整体呈波动增加趋势,由95 556.28 km2增加到173 070.00 km2,增幅81.12%。由于近年来积温带北移东扩现象,水稻种植优势区扩大,2000-2020 年水稻的种植面积呈逐年增加的趋势;大豆的种植面积呈先增加后减少再增加的趋势,2009-2015 年大豆呈波动减少趋势,其余年份波动增加;玉米的种植面积呈先稳步增加后减少的趋势。与2000 年相比,2020 年水稻、玉米和大豆种植面积分别增加24 911.36 km2、54 432.07km2、20 719.77 km2,保障了我们国家的粮食安全(图4)。

图4 2000-2020 年松花江流域作物总种植面积及主要作物种植面积Fig.4 Total planting area and each crop planting area of main crops in the Songhua River Basin from 2000 to 2020

3.3 松花江流域作物种植结构的时空变化分析

2000-2020 年松花江流域内作物种植结构发生显著变化[27],水稻种植面积占流域总种植面积比例由13.03%增加到21.59%,玉米种植面积占流域总种植面积比例由32.58%增加到49.44%,大豆种植面积占流域总种植面积比例由25.86%增加到26.25%(图5)。水稻种植面积在松花江流域大部分区域均有增加,尤其是在三江平原等水稻优势产区及河流附近一些水资源充沛的城市,水稻种植面积呈现明显扩张趋势;鹤岗市北部及齐齐哈尔市北部等地区水稻种植面积变化不大;长春市北部、七台河市西北部及吉林市、白山市、延边朝鲜族自治州中部部分地区,水稻种植面积减少(图6)。总体而言,除白山市和延边朝鲜族自治州水稻种植面积呈减少趋势外,松花江流域其余各市水稻的种植面积均有不同程度增加,其中佳木斯市、齐齐哈尔市、哈尔滨市种植面积增加较多,佳木斯市水稻种植面积增加8996.8 km2,增幅为634.75%;齐齐哈尔市增加3505.8 km2,增幅为370.99%。玉米种植面积在整个流域变化较大,大部分地区种植面积均呈增加趋势,仅在白城市西北部、松原市中部等地区玉米种植面积有所减少;长春市中部、松原市东北部、哈尔滨市西南部及绥化市少数地区玉米种植面积变化较小(图6)。2000-2020 年内,玉米种植面积在整个松花江流域18 市内均有不同程度增加,其中长春市增加面积最多,增加7709.1 km2,增幅为136.71%;齐齐哈尔市增加面积为7343.8 km2;增加幅度最大的为黑河市,增幅为861.66%,由2000 年的303.6 km2增加到2020 年的2919.5 km2。大豆种植面积在流域北部偏东地区增加明显,其中牡丹江市东北部、鹤岗市中部部分地区、大庆市北部、齐齐哈尔市中部及佳木斯市北部偏东等地区种植面积增加;而在流域东北部地区种植面积减少,主要包括长春市中部、哈尔滨市东北部、松原市中部偏东等地区;大豆种植面积没有变化的区域集中分布在齐齐哈尔北部及黑河市南部地区(图6)。总体上,2000-2020 年内大豆种植面积在各市有增有减,其中黑河市增加最多,增加面积为11 770.1 km2,增幅为434.29%;长春市大豆种植面积减少最多,减少面积为1407.2 km2。2000-2020 年作物种植优势区无明显变化。水稻、玉米和大豆一直为流域内主要种植作物。2000-2020 年水稻、玉米和大豆种植面积之和占总种植面积比例由71.49%波动增加到97.28%,水稻、玉米和大豆种植面积占总种植面积比例增幅分别为8.56%、16.86%、0.39% (图5)。

图5 2000-2020 年松花江流域不同作物占总种植面积比例Fig.5 Proportions of different crops in the total planting area of the Songhua River Basin from 2000 to 2020

图6 2000-2020 年松花江流域作物种植面积的变化Fig.6 Crops planting areas changes of the Songhua River Basin from 2000 to 2020

将松花江流域内18 个地级市按不同作物占总种植面积比例进行聚类分析,将占比大于50%的市作为单一作物主导型,可分为水稻主导型、玉米主导型和大豆主导型;将所占比例均未超过50%且两种作物所占比例相近的作为两种作物共同主导型,可分为玉米-水稻主导型、玉米-大豆主导型和大豆-水稻主导型。2000 年作物主导类型多元化,共有5 种主导类型,其中玉米主导型市6 个,大豆主导型市4 个,玉米-水稻主导型市2 个,玉米-大豆主导型市4 个,大豆-水稻主导型市2 个。2020 年作物主导类型趋于稳定且逐渐转为单一型作物主导,共有4 种主导类型,其中水稻主导型市1 个,玉米主导型市13 个,大豆主导型市3 个,玉米-大豆主导型市1 个,其余双作物主导市类型均转变为单一作物主导型(图7)。2000-2020 年新增水稻主导型市(佳木斯市)、玉米-水稻主导型市(吉林市、通化市)和大豆-水稻主导型市(延边朝鲜族自治州、佳木斯市)消失,玉米-水稻主导型市和玉米-大豆主导型市均转变为玉米主导型市,作物种植类型逐渐趋于集中(图8)。

图7 2000 年和2020 年松花江流域作物主导型转移Fig.7 Crop dominant transfer in the Songhua River Basin from 2000 to 2020

图8 2000 年和2020 年松花江流域作物主导类型Fig.8 Crop dominant types in the Songhua River Basin in 2000 and 2020

4 讨论与结论

4.1 讨论

遥感影像在农作物的信息提取中得到了广泛应用,通过构建NDVI、EVI 时序曲线结合不同作物在各个时间段的特征能够准确地提取水稻、玉米、大豆、小麦(Triticum aestivum)等作物类型的分布信息。相关学者基于Sentinel 数据、Landsat 等数据等对东北地区进行了作物提取[28-29],而MODIS 数据具有较高的时间和空间分辨率,在大尺度区域作物识别和提取等方面具有明显优势,因此本研究基于时空分辨率为16 d、1 km 的MODIS 数据,利用多指标决策树分类法对松花江流域2000 年和2020 年作物分布进行提取。选取的农作物生育期内NDVI、EVI 及LSWI 3 个指标的曲线变化特征能够反映研究区不同作物生长发育状况,实现了大尺度作物分布信息的提取,获得了较高的作物分类精度。但在黑河市区域大豆的提取精度略低,主要是由于该区域农作物地块面积较小、种植分散、套种、间种等种植方式对作物的提取精度产生了影响。此外,部分地区缺少县域统计年鉴作物种植面积的数据,难以在县域尺度上收集到完整的作物种植数据,在市域尺度上收集到的数据,缺乏海拉尔市和乌兰浩特市的作物统计数据,因此,在作物提取结果验证时未将其与统计数据进行比较。针对不同类型作物面积提取的精度评估,大豆精度较低,这可能是因为在进行实际调研时大豆的地面调查点相对较少,对松花江流域大豆NDVI 变化曲线特征的提取精度有一定的影响。因此,在未来大尺度水稻、玉米和大豆作物类型的提取中,除了利用NDVI、EVI 及LSWI 多指标变化曲线特征,还可以引入气象要素等其他辅助信息提高决策树分类精度,实现基于较少量地面调查点的作物遥感影像半自动化识别[30]。水稻和玉米相比大豆而言为高耗水作物,流域南部地区主要种植玉米,北部地区主要种植大豆,流域南部地区耗水高于北部地区;嫩江流域南部地区主要为其他作物转变为玉米和水稻,松花江(三岔河口以下)流域主要为大豆和其他作物转变为玉米,第二松花江流域主要为其他作物转变为玉米,以上地区作物种植区域的改变及种植面积的扩大保障了我国的粮食安全,但也增加了松花江流域农业用水的压力。

4.2 结论

本研究选取2000 年和2020 年松花江流域内作物生长发育期的时间序列MODIS 数据,借助实地考察及Google Earth 影像获取分类样本数据,提取作物关键生长发育期的NDVI、EVI 及LSWI 特征值,并根据样本的特征值建立决策树模型,提取了松花江流域2000 年和2020 年的主要种植作物空间分布,并分析了2000-2020 年流域内作物种植结构的空间分布特征。得到以下结论:

1)本研究分类结果中,单类作物种植结构提取的准确率均在82%以上,具有较高的精度,经实地考察验证、Google Earth 及相关数据计算混淆矩阵,Kappa 系数为0.79,总体分类精度为0.84,水稻、玉米和大豆的提取精度分别为0.9090、0.9026 和0.8200。

2)松花江流域是我国重要的玉米、水稻和大豆生产基地,2000-2020 年松花江流域种植规模处于持续扩张状态,总播种面积呈增加趋势;玉米和水稻呈逐年波动增加趋势,2009-2015 年大豆呈波动减少趋势,其余年份波动增加。对比2000年,2020 年水稻、玉米和大豆种植面积分别增加24 911.36 km2、54 432.07 km2和20 719.77 km2。总体来看,水稻种植面积占总种植面积比例增加8.56%,玉米种植面积占比增加16.86%,大豆种植面积占比增加0.39%。

3)松花江流域作物种植以玉米为主,水稻和大豆为辅,形成“北大豆,南玉米,河流附近皆水稻”的生产格局。水稻在松花江流域整个范围内大部分为种植面积增加区,尤其是河流附近水资源丰富的地区;玉米在整个流域内种植面积变化较大,大部分地区均为种植面积增加区;大豆在流域北部偏东地区为种植面积增加区。

4) 2020 年新增水稻主导型市,玉米-水稻主导型市和大豆-水稻主导型市消失,玉米-水稻主导型市和玉米-大豆主导型市均转变为玉米主导型市,作物种植类型逐渐趋于集中。

综上,对松花江流域内2000 年和2020 年的作物种植结构的提取结果具有可靠性。从农作制分区角度,流域内作物种植结构呈现集中连片和趋于稳定的规律,各地市逐步形成了具有各自特色的优势作物种植区及生产基地。

猜你喜欢

松花江流域植被指数决策树
自然灾害、农户传统风险管理手段与天气指数保险需求
一种针对不均衡数据集的SVM决策树算法
吉林省松花江流域产业生态系统适应性分析
基于植被指数选择算法和决策树的生态系统识别
AMSR_2微波植被指数在黄河流域的适用性对比与分析
决策树和随机森林方法在管理决策中的应用
河南省冬小麦产量遥感监测精度比较研究
基于一维水动力模型的洪水顶托影响分析
农业面源氨氮污染减排体系的构建及减排控制对策
基于决策树的出租车乘客出行目的识别