APP下载

基于GF-6影像的农作物种植结构提取研究

2023-05-20解文欢张有智张海峰张效霏

现代农机 2023年3期
关键词:决策树农作物卫星

解文欢,张有智,吴 黎,张海峰,张 宇,张效霏

(黑龙江省农业科学院 农业遥感与信息研究所,150086,黑龙江哈尔滨)

高分卫星数据是国家的战略资源,其应用已深入到国家经济和社会发展、生态建设、民生保障、国家安全等方面。在农业农村领域,高分卫星数据得到了广泛应用,通过有效监测农业生产情况,科学预测作物长势、面积、产量等情况,对农业生产灾害能做到快速反应和评估,为客观掌握宏观农业生产形势、制定和实施精准的政策措施等提供了高效的技术手段。

赵璐等以馆陶县为研究区,基于国产高分二号卫星影像数据,采用面向对象的最近邻方法提取研究区农业大棚信息,提取精度为95.65%[1]。张彦等利用GF-6 WFV数据构建温度植被干旱指数,最大相关系数为0.85,花生干旱等级监测总体准确率为91.98%[2]。郭燕等利用高分一号卫星数据,结合Landsat-8 和RapidEye 数据,对比支持向量机法和光谱角法提取鄢陵县玉米面积,支持向量机法的分类精度优于光谱角法的分类精度[3]。葛皓使用国产高分一号卫星WFV 影像提取了江苏省盐城市东台市条子泥条北水稻垦区的红、绿、蓝及近红外波段的反射率,比较了22 个常用植被指数诊断大田水稻氮素营养水平的能力与估产的能力[4]。王婷等基于GF-1 WFV 卫星遥感数据,应用归一化植被指数,对盘锦2020 年水稻长势进行多时相动态遥感监测,结果显示:2020 年盘锦水稻长势前期较好,中期变差,后期恢复[5]。

GF-6 卫星具有高分辨率、宽覆盖、多波段、高质量和高效率成像等特点,为作物识别提供更丰富的信息。GF-6 卫星遥感数据的使用,扩大了遥感监测范围,提高了遥感监测频率,提升了遥感识别精度,降低了农业资源调查成本。由于GF-6 卫星可获取红边波段,打破了RapidEye 卫星对于红边波段遥感影像的垄断,在农作物面积监测中将替代50%的国外卫星数据(Landsat8_OLI),提高了国产卫星影像应用能力。GF-6 卫星的发射成功标志着我国农业遥感的研究工作开启了以GF-6 卫星数据为主要数据源的新局面。本文以拜泉县为研究区域,基于GF-6 WFV 遥感数据,采用随机森林算法对研究区的玉米、大豆和水稻进行分类,通过实地采集GPS 地面验证点进行分类精度评价,探究采用随机森林算法对GF-6 WFV 影像提取农作物种植结构精度,为农作物面积和种植结构提取提供数据参考。

1 材料与方法

1.1 研究区概况

拜泉县位于黑龙江省中西部地区,地处小兴安岭余脉与松嫩平原过渡地带,东经125.5°~126.5°,北纬47.3°~47.9°,面积为3 599 km2,地势呈东高西低、南高北低,由东向西逐渐平缓,地理位置如图1 所示。地形漫川漫岗,丘陵起伏,沟谷切割强烈。研究区属于温带大陆性气候区,年均气温在1.2 ℃,无霜期为122 d,年平均降水量为490 mm,降水多集中在夏季。研究区的土壤类型主要为黑土、黑钙土和草甸土,土质肥沃,有利于农作物生长,主要农作物类型为玉米和大豆,其他为马铃薯、中草药和芸豆等。

图1 拜泉县地理位置示意图

1.2 研究数据及预处理

1.2.1 遥感数据及预处理

本研究选用2020 年8 月26 日的GF-6 WFV 数据为数据源。GF-6 WFV 卫星2018 年6 月2 日发射成功,具有窄幅(PMS)和宽幅(WFV)2 种不同空间分辨率,GF-6 WFV 数据分辨率为16 m,卫星波段信息包括蓝(0.45~0.52 μm)、绿(0.52~0.59 μm)、红(0.63~0.69 μm)、近红外(0.77~0.89 μm)、红边1(0.69~0.73 μm)、红边2(0.73~0.77 μm)、紫边(0.40~0.45 μm)、黄边(0.59~0.63 μm)8 个波段[6]。GF-6 WFV 卫星与GF-1 卫星组网运行,GF-6 WFV 影像与GF-1 WFV影像预处理流程相似,在ENVI5.3 中对获取的GF-6 WFV 卫星数据进行辐射定标、大气校正和几何精校正等预处理工作[7]。

1.2.2 解译标志点和验证点获取

2020 年7 月5—7 日进行野外调查,使用手持GPS 野外实地采集解译标志点200 个和验证点120个,涉及玉米、水稻、大豆和蔬菜等同一时期农作物。

1.3 研究方法

1.3.1 农作物生长发育时期

农作物类型判读的最佳时相要选择农作物生长茂盛、影像反映明显的时期。根据研究区内各农作物的生长发育时间(如表1 所示),确定各类农作物的最佳识别期,对影像进行判读。因此选择8 月26 日农作物处于生长旺盛期(玉米的乳熟期、大豆的结荚期、水稻的抽穗期)的影像进行农作物识别,如图2 所示。

表1 拜泉县主要作物的发育期

图2 8 月26 日GF-6 WFV 卫星影像图

1.3.2 分类方法

采用单模型分类方法的模型往往精度不高,容易出现过拟合问题,随机森林算法是为了解决单个决策树模型过拟合问题而提出的算法。随机森林算法由BREIMAN L[8]提出,他通过bootstrap 重抽样技术,从原始训练样本集N 中有放回地重复随机抽取k 个样本生成新的训练样本集合,然后对每个bootstrap 样本进行决策树建模,把分类树组合成随机森林,在变量(列)的使用和数据(行)的使用上进行随机化,生成很多分类树,然后组合成多棵决策树进行预测,再汇总分类树的结果。

(1)每棵决策树由样本量为K 的训练样本X 和随机向量θk生成。

(2)随机向量序列{θk,k=1,2,…,K}独立同分布。

(3)随机森林即所有决策树的集合{h (X,θk),k=1,2,…,K }

(4)每个决策树模型h(X,θk)都有一票投票权来选择输入变量x 的分类结果。

式中:H(x)表示随机森林分类结果;hi(x)是单个决策树分类结果;Y 表示分类目标;I(.)为示性函数。RF分类模型使用简单的投票策略来完成最终的分类。

随机森林算法的优点是:具有极高的准确率;随机性的引入,使得随机森林不容易过拟合,有很好的抗噪声能力;能处理很高维度的数据,并且不用做特征选择;既能处理离散型数据,又能处理连续型数据,数据集无需规范化;训练速度快,可以得到变量重要性排序,容易实现并行化。随机森林算法在运算量没有显著提高的前提下提高了预测精度。

2 结果

在ENVI5.3 软件中,基于GF-6 WFV 遥感数据,利用GPS 采集的解译标志点建立训练样本,在随机森林树设为100 的情况下进行随机森林分类,提取大豆、水稻和玉米的种植结构并计算面积(如图3 所示)。分类结果数据与GPS 采集的120 个地面验证点进行精度验证,kappa 系数为0.893 72,总分类精度达92.5%。2020 年拜泉县种植水稻0.796 万hm2,玉米7.839 万hm2,大豆17.122 万hm2。

图3 2020 年基于GF-6WFV 影像的拜泉县主要农作物种植结构图

3 结论与讨论

本文基于GF-6 WFV 遥感数据利用随机森林算法对拜泉县主要农作物玉米、大豆和水稻种植结构进行提取研究。采用随机森林算法,随机森林树为100 的情况下进行分类,总体分类精度达到了92.5%。采用随机森林算法对GF-6 WFV 卫星数据进行识别分类,能够准确提取农作物空间分布,实现对农作物种植范围的更新与变化范围的监测,能够极大降低人工目视解译的工作量,提高更新效率。研究过程中也存在一些问题,本研究仅从光谱特征角度进行了分类,后续研究中可以根据不同波段和纹理特征的结合,分析对农作物识别精度的影响,将波段和纹理特征结合,以提高对农作物的识别精度。GF-6 WFV 卫星数据已成为农业遥感业务运行系统的主要数据源之一,在农业生产和管理中得到了规模化应用,为各农业部门提供了科学客观的信息支持。

猜你喜欢

决策树农作物卫星
高温干旱持续 农作物亟须“防护伞”
俄发现保护农作物新方法
夏季农作物如何防热害
厉害了!农作物“喝”上环保酵素
miniSAR遥感卫星
一种针对不均衡数据集的SVM决策树算法
静止卫星派
决策树和随机森林方法在管理决策中的应用
Puma" suede shoes with a focus on the Product variables
基于决策树的出租车乘客出行目的识别