APP下载

基于哨兵二号的大豆、玉米遥感识别

2024-01-30王晶晶兰仕浩邱琳汪曙单捷黄晓军李牧

江苏农业学报 2023年8期
关键词:特征选择大豆玉米

王晶晶 兰仕浩 邱琳 汪曙 单捷 黄晓军 李牧

王晶晶,蘭仕浩,邱  琳,等. 基于哨兵二号的大豆、玉米遥感识别——以江苏徐淮地区为例[J]. 江苏农业学报,2023,39(8):1698-1706.

doi:10.3969/j.issn.1000-4440.2023.08.009

收稿日期:2022-11-07

基金项目:江苏省农业科技自主创新基金项目[CX(22)2001]

作者简介:王晶晶(1981-) , 女 , 江苏扬州人, 博士, 副研究员 , 主要从事农业遥感应用研究。 (E-mail)immi103@163.com

摘要:本研究以哨兵二号影像为数据源,以江苏徐淮地区邳州市西南部作为研究区,开展大豆、玉米遥感识别研究。采用覆盖玉米和大豆主要生长期的多时相哨兵二号影像构建遥感特征参数数据集,包括12个光谱波段的反射率和47个植被指数,采用递归特征消除与随机森林、支持向量机相结合的算法开展特征参数优选,明确最优识别时相-特征参数组合,在此基础上,采用随机森林和支持向量机分类器进行分类,并比较分类精度。研究结果表明,利用特征参数优选方法提取最优特征参数组合,在保证总体精度的前提下能够减少特征参数数量;陆地水指数和倒数差值等植被指数是2种优选算法所提取出的共性特征参数;9月8日是研究区玉米和大豆遥感识别的最佳时相,总体精度和Kappa系数均为0.99。

关键词:玉米;大豆;哨兵二号影像;特征选择;遥感识别

中图分类号:TP79      文献标识码:A      文章编号:1000-4440(2023)08-1698-09

Recognition of corn and soybean based on Sentinel-2 imagery: a case study in Xuhuai area, Jiangsu province

WANG Jing-jing1 LAN Shi-hao2 QIU Lin1 WANG Shu1 SHAN Jie1 HUANG Xiao-jun1 LI Mu1

(1.Institute of Agricultural Information, Jiangsu Academy of Agricultural Sciences, Nanjing 210014, China;2.School of Remote Sensing and Geomatics Engineering, Nanjing University of Information Science and Technology, Nanjing 210044, China)

Abstract:In this study, the southwest of Pizhou City of Xuhuai area, Jiangsu province, China, was taken as the study area, and multi-temporal Sentinel-2 images covering the main growing period of the corn and soybean were adopted to build the multi-temporal candidate features data set including the reflectance of 12 spectral bands and 47 vegetation indices. Two machine-learning algorithms, i.e., random forest and support vector machine combined with the recursive feature elimination process were employed and their respective performance in crop identification was evaluated to determine the optimal characteristic parameters of remote sensing identification with the best recognition time phases of corn and soybean. Results indicated that feature parameter selection method could be used to extract the optimal feature parameter combination and reduce the number of feature parameters under the premise of ensuring the overall accuracy. The combination of features of multiple time phases obtained by the two algorithms had some of the same preferred feature parameters including land surface water index and derivative difference vegetation index. The classification accuracy analysis showed that September 8 was the best phase for corn and soybean recognition in this study with the overall accuracy and kappa coefficient of 0.99.

Key words:corn;soybean;Sentinel-2 imagery;feature selection;remote sensing identification

玉米是目前世界上种植最广泛的谷类作物之一,其总产量位居三大谷类作物(玉米、水稻和小麦)之首。近几十年来,玉米是全球单位面积产量和种植面积增长最快的大田作物[1],在解决未来粮食需求方面发挥着重要作用。中国是世界主要大豆生产国之一,但大豆的产量远远不能满足畜牧业生产和人们生活的需要,近年来大豆种植面积不断增加。随着玉米和大豆种植规模的不断扩大,快速准确地了解玉米、大豆种植的空间分布和动态变化等一系列问题显得日益紧迫。识别农作物,掌握农作物种植面积及其变化,是当前农业遥感监测研究的重要目标,引导和调节农业结构对规划国家和区域经济社会发展战略,制定农产品进出口计划具有重要意义[2-3],同时作物空间分布情况是作物长势监测、产量预测、灾害预警等农情遥感监测的基础信息[4-5]。传统方法通过人工实地调查获取耕地种植情况,存在费时费力的局限性,不能大范围使用。遥感技术具有宏观、实时、动态等优点,已成为获取耕地和农作物信息的有效手段[6-7]。

在农作物分类识别研究中,原始遥感影像的光谱特征使用最多,利用线性或非线性变换得到的植被指数能有效提高玉米和大豆识别的效率,成为农作物识别最重要的遥感特征[8-9]。红边、近红外波段和短波红外已被学者证明对玉米和大豆的识别至关重要[10-12]。由于作物具有明显的季节生长规律和物候特征,时相的选择成为影响精度的重要因素[13-14]。目前,对玉米和大豆的种植分布研究主要集中在机械化程度高、种植连片的产区,例如美国、巴西、阿根廷以及中国东北地区[15]。玉米和大豆遥感识别研究以中低空间分辨率、大尺度、高时间分辨率的遥感数据源为主[8-10],对于以散户种植为主、种植结构较为复杂的地区,例如地处中国黄淮海大豆、玉米种植区的江苏省徐淮地区,由于农田景观破碎、作物插花种植程度较高,中低分辨率卫星数据难以满足种植田块较小的玉米、大豆等作物种植分布精细识别的空间分辨率的要求。

本研究以江苏省徐淮地区邳州市南部地区为研究区,以欧洲航天局(European Space Agency,ESA)哨兵二号(Sentinel-2)高分辨率影像为遥感数据源,开展农田景观破碎地区玉米和大豆遥感识别特征选择研究,通过地面实地调查获得了玉米、大豆、水稻等主要作物样本,提取样本对应遥感影像的波段反射率并计算多个植被指數作为遥感识别特征数据集,采用2种机器学习算法,即随机森林 (Random forest, RF) 和支持向量机 (Support vector machines, SVM) 结合递归特征消除(Recursive feature elimination, RFE) 算法,分析多个时相的遥感特征数据集中各个遥感特征对识别精度的重要性,探求玉米、大豆和其他作物分类最优遥感特征参数及适宜时相,最后利用时相-遥感参数的最优特征组合提取研究区玉米和大豆的种植分布信息,并验证精度。

1  材料与方法

1.1  研究区概况

江苏徐淮地区是中国典型的玉米、大豆种植区。研究区位于江苏省邳州市西南部( 34°07′~34°21′N,117°37′~117°57′E)。邳州市位于江苏省西北部,黄河与淮河之间,属于暖温带湿润半湿润季风气候区,年平均气温14.4 ℃,年平均日照时数2219.7 h,年平均降水量853.2 mm,玉米和大豆种植面积分别为36 710 hm2和5 490 hm2,主要分布在邳州西南部地区(图1)。

本图为哨兵二号(Sentinel-2)MSI 4.3.2,4、3、2波段真彩色合成影像。

1.2  数据获取与预处理

本研究涉及的数据主要包括Sentinel-2影像和不同类型农作物的田间样本。本研究采用的卫星影像包括2020年7月至2020年10月五景Sentinel-2影像,影像数据从欧洲航天局数据中心(https:∥scihub.Copernicus.eu/dhus/#/home)下载,五景影像的成像时间和清晰度如表1所示。Sentinel-2是1颗高分辨率多光谱成像卫星,它搭载多光谱成像仪(MSI),覆盖了从可见光以及近红外到短波红外的13个光谱波段,是唯一具有红边范围3个波段光学影像数据的高分辨率多光谱成像卫星,对作物监测具有重要意义。本研究使用的Sentinel-2数据为LEVEL-2A级,产品进行了辐射校正、大气校正、正射校正和几何校正。在大气校正过程中,卷云波段(中心波长1 375 nm)被自动去除,将其余12个波段叠加重采样至10 m分辨率。最后,根据研究区域的位置对图像进行裁剪。

2020年7月至2020年10月,在研究区进行了3次实地调查,收集了地面不同类型作物样本的信息。研究区中与玉米、大豆同一生长季节的主要农作物是水稻。采用亚米级全球定位系统获取作物样本位置,测量获得样本369个,其中玉米样本123个,大豆样本120个,水稻样本126个(图2)。

1.3  遥感识别特征参数

本研究选用并建立的遥感识别特征主要有两大类。第一类是Sentinel-2影像12个波段的反射率,第二类是利用蓝光、绿光、红光、红边、近红外和短波红外波段构建的植被指数。根据Sentinel-2数据的波段设置,本研究选取ρ1、ρ2、ρ3、ρ4、ρ5、ρ6、ρ7、ρ8、ρ8A、ρ9、ρ11、ρ12、NDVI、NDVIGreen、RVI、RVIGreen、SRNIR/RE、SRRed/RE、SRRed/Green、TVI、SAVI、DVI、DDVI、EVI、LSWI、TDVI、OSAVI、VARIGreen、NLI、MNLI作为玉米、大豆遥感识别特征参数(表2),建模特征参数共计59个。Sentinel-2影像的第5、第6、第7波段是3个红边波段,第8和第8A波段是2个近红外波段,第11和第12波段是2个短波红外波段,后续用于分析建模的遥感特征数据集中的各个因子,以Sentinel-2波段名称命名。

1.4  特征参数优选算法

本研究分别将递归特征消除算法与随机森林、支持向量机相结合,构建了RF-RFE及SVM-RFE特征参数优选与分类算法,开展玉米和大豆所对应的农作物遥感识别特征参数优选研究。从样本中随机抽取2/3,用于建模,以另外1/3未被抽中的样本用于模型的精度评价。

RF-RFE算法首先将某一时相建模使用的所有特征参数集代入RF分类器,得到分类总体精度,再利用随机森林特征重要性估计,得到各个特征参数的重要程度,利用后向迭代特征递归消除方法,删除重要性最小的特征,再次将新的特征参数集代入RF分类器,得到总体精度,循环评价完所有特征,筛选出总体精度达到相对稳定的峰值时的特征参数组合,确定为该时相玉米和大豆的最佳遥感特征参数组合。

SVM-RFE算法输入的原始特征数据集与RF-RFE算法输入的相同,首先将某一时相建模使用的所有特征因子集代入SVM高斯径向基核函数分类器,得到分类总体精度,再利用支持向量机线性核函数训练得到每个特征参数的重要性,同样利用后向迭代特征参数递归消除方法,删除重要性最小的特征,再次将新的特征参数集代入SVM分类器,得到总体精度,循环评价完所有的特征参数,筛选出总体精度达到相对稳定的峰值时的特征参数组合,确定为该时相玉米和大豆的最佳遥感特征参数组合。

1.5  玉米和大豆种植分布信息提取

通过比较RF-RFE和SVM-FRE特征选择结果,选择最适宜时相的Sentinel-2图像,计算该时相玉米和大豆最佳遥感特征参数组合所需要的各个植被指数及波段反射率,将所有参数所在波段进行组合,然后根据研究区已有农田矢量边界,提取出农田范围信息,选择最适宜分类算法,将实地样本作为训练样本输入分类器,提取研究区玉米和大豆的空间分布信息。

ρBlue、ρGreen、ρRed、ρRE、ρNIR、ρSWIR分别表示蓝波段反射率、绿波段反射率、红波段反射率、红边反射率、近红外波段反射率、短波红外波段反射率;SAVI计算中的L值为0.5;WDRVI中a值为0.1。

2  结果与分析

2.1  最优特征参数组合选择

分别利用RF和SVM特征参数重要性评价方法,对5个时相59个特征参数依次删除得分最低的遥感特征参数,然后得到分类的总体精度,参与分类的特征参数数量与总体精度的变化情况如图3所示。

7月8日的結果显示,使用RF-RFE算法,前4个特征参数的分类总体精度达到0.81,使用SVM-RFE算法,前7个特征参数的分类总体精度达到0.81,达到总体精度的稳定值之后,2种算法随着特征参数数量进一步增加,总体分类精度变化幅度较小,59个特征参数的总体精度分别为0.77和0.82。8月17日的结果显示,使用RF-RFE算法,前9个特征参数的分类总体精度达到0.92,之后随着特征参数数量增加,总体精度呈现小幅度波动,59个特征参数的总体精度为0.88;使用SVM-RFE算法,前3个特征参数的分类总体精度达到0.89,之后随着特征参数数量增加,总体分类精度呈现降低的趋势,59个特征参数的总体精度为0.82。9月8日的结果显示,使用RF-RFE算法,前5个特征参数的分类总体精度达到0.99,之后随着特征参数数量增加,总体精度呈现稳定状况,59个特征参数的总体精度为0.99;使用SVM-RFE算法,前4个特征参数的分类总体精度达到0.99,之后随着特征参数数量增加,总体分类精度呈现降低的趋势,59个特征参数的总体精度为0.87。9月18日的结果显示,使用RF-RFE算法,前3个特征参数的分类总体精度达到0.96,之后随着特征参数数量增加,总体精度呈现小幅度波动,59个特征参数的总体精度为0.94;使用SVM-RFE算法,前9个特征参数的分类总体精度达到0.98,之后随着特征参数数量增加,总体分类精度呈现降低的趋势,59个特征参数的总体精度为0.84。10月1日的结果显示,使用RF-RFE算法,前28个特征参数的分类总体精度达到0.86,之后随着特征参数数量增加,总体精度呈现小幅度波动,59个特征参数的总体精度为0.83;使用SVM-RFE算法,前10个特征参数的分类总体精度达到0.90,之后随着特征参数数量增加,总体分类精度呈现先降低再趋于稳定的趋势,59个特征参数的总体精度为0.89。

通过比较分类总体精度,选择5个时相分类总体精度达到稳定峰值时所对应的特征参数集为最优特征集,使用RF-RFE和SVM-RFE算法优选出来的不同时相最优特征参数子集,如表3及表4所示。

5个时相的最优特征参数组合中,短波红外波段、近红外以及红边波段构建的DDVI和LSWI是2种特征优选算法提取出的共性特征参数,对研究区的大豆、玉米和水稻有较好的区分性。

2.2  分类精度评价

选择5个时相优选后的遥感特征参数组合作为变量输入到RF和SVM分类器,以1/3样本验证分类精度。根据混淆矩阵计算出总体精度、Kappa系数、用户精度、制图精度4个评价指标,对2种分类方法的精度进行评价。

RF和SVM 2种分类方法的总体精度和Kappa系数在不同时相上的变化趋势较为一致(图4、图5),7月8日的分类精度最低,RF算法的总体精度和Kappa系数分别为0.81和0.71,SVM方法的总体精度和Kappa系数分别是0.82和0.74,9月8日的分类精度最高,RF和SVM算法的总体精度和Kappa系数均为0.99,同时2种算法在9月8日的玉米与大豆的用户精度及制图精度均为5个时相中的最高值(图6、图7),利用RF分类方法获得的玉米制图精度为1.00,用户精度为0.98,大豆制图精度为0.97,用户精度为1.00,总体分类精度为0.99,Kappa系数为0.99,利用SVM方法获得的玉米制图精度为0.98,用户精度为1.00,大豆制图精度为1.00,用户精度为0.97。由此可知,9月8日是研究区大豆和玉米遥感识别的最佳时相。

2.3  玉米和大豆种植分布信息提取

综合比较RF-RFE和SVM-RFE 2种算法的精度和输入参数数量,本研究选取2020年9月8日Sentinel-2影像,以研究区LSWI(ρ8,ρ11)、LSWI(ρ8A,ρ11)、LSWI(ρ8,ρ12)、LSWI(ρ6,ρ8A)作为遥感特征参数输入数据集,采用SVM分类器,提取研究区玉米和大豆的空间分布(图8)。

3  结  论

本研究基于典型研究区玉米和大豆生长过程中5个时相的Sentinel-2影像,构建以波段反射率和植被指数为主要识别特征的遥感特征参数集,并通过RF-RFE和SVM-RFE算法确定玉米和大豆识别的优选特征参数与最佳识别时相,进一步利用实测样本对识别进行验证和比较,得出如下结论。

第一,多时相Sentinel-2影像在农田景观破碎、作物插花种植程度较高的徐淮地区表现出较好的作物识别能力,在9月8日及9月18日2个时相,玉米、大豆和水稻的总体分类精度和Kappa系数均超过0.90,9月8日是本研究玉米、大豆识别提取的最佳时相,总体分类精度可达0.99。

第二,通过构建递归特征消除与随机森林及支持向量机相结合的特征优选算法,在获得稳定的总体分类精度的同时,可以减少特征参数的输入数量。除了10月1日之外的4个时相,2种特征优选算法获得最大分类精度对应的特征参数数量均少于10个。

第三,RF-RFE和SVM-RFE 2种特征优选算法获得的研究区多个时相的优选特征参数组合拥有一些相同的特征参数。使用Sentinel-2 近红外和短波红外波段构建的LSWI指数以及利用红边和近红外波段构建的DDVI指数在研究区8月至10月多个时相的玉米、大豆遥感识别特征筛选中显示出重要作用。

参考文献:

[1]  郭  伟,赵春江,顾晓鹤,等. 乡镇尺度的玉米种植面积遥感监测 [J]. 农业工程学报,2011,27(9):69-74.

[2]MATHUR A, FOODY G. Crop classification by support vector machine with intelligently selected training data for an operational application [J]. International Journal of Remote Sensing,2008,29:2227-2240.

[3]陈仲新,任建强,唐华俊,等. 农业遥感研究应用进展与展望 [J]. 遥感学报,2016,20(5):748-767.

[4]杨邦杰. 农情遥感监测[M]. 1版.北京:中国农业出版社,2005.

[5]许青云,杨贵军,龙慧灵,等. 基于MODIS-NDVI多年时序数据的农作物种植识别 [J]. 农业工程学报,2014,30(11):134-144.

[6]唐华俊. 农业遥感研究进展与展望 [J]. 农学学报,2018,8(1):167-171.

[7]董金玮,吴文斌,黄健熙,等. 农业土地利用遥感信息提取的研究进展与展望 [J]. 地球信息科学学报,2020,22(4):772-783.

[8]DE SOUZA C H W, MERCANTE E, JOHANN J A, et al. Mapping and discrimination of soya bean and corn crops using spectro-temporal profiles of vegetation indices [J]. International Journal of Remote Sensing,2015,36:1809-1824.

[9]DA SILVA JUNIOR C A, NANNI M R, TEODORO P E, et al. Vegetation indices for discrimination of soybean areas: a new approach [J]. Agronomy Journal,2017,109:1331-1343.

[10]ZHONG L H, HU L N, YU L, et al. Automated mapping of soybean and corn using phenology [J]. ISPRS Journal of Photogrammetry and Remote Sensing,2016,119:151-164.

[11]劉  佳,王利民,滕  飞,等. RapidEye卫星红边波段对农作物面积提取精度的影响 [J]. 农业工程学报,2016,32(13):140-148.

[12]YIN L K, YOU N S, ZHANG G L, et al. Optimizing feature selection of individual crop types for improved crop mapping[J]. Remote Sensing,2020,12(1):1-20.

[13]FOERSTER S, KADEN K, OERSTER M, et al. Crop type mapping using spectral-temporal profiles and phenological information [J]. Computers and Electronics in Agriculture,2012,89:30-40.

[14]HU Q, SULLA D, XU B D, et al. A phenology-based spectral and temporal feature selection method for crop mapping from satellite time series [J]. International Journal of Applied Earth Observation and Geoinformation,2019,80:218-229.

[15]黄健熙,侯矞焯,苏  伟,等. 基于GF-1 WFV数据的玉米与大豆种植面积提取方法 [J]. 农业工程学报,2017,33(7):164-170.

[16]DEFRIES R, TOWNSHEND J. NDVI-derived land classifications at a global scale [J]. Journal of Remote Sensing,1994,17:3567-3586.

[17]GITELSON A A, KAUFMAN Y J, MERZLYAK M N. Use of a green channel in remote sensing of global vegetation from EOS-MODIS [J]. Remote Sensing of Environment,1996,58:289-298.

[18]JORDAN C F. Derivation of leaf-area index from quality of light on the forest floor [J]. Ecology,1969,50:663-666.

[19]GITELSON A A, MERALYAK M N. Spectral reflectance changes associated with autumn senescence of Aesculus hippocastanum L. and Acer platanoides L. leaves. Spectral features and relation to chlorophyll estimation [J]. Journal of Plant Physiology,1994,143:286-292.

[20]CHAPPELLE E W, KIM M S, MC MURTREY J E. Ratio analysis of reflectance spectra (RARS): an algorithm for the remote estimation of the concentrations of chlorophyll A, chlorophyll B, and carotenoids in soybean leaves [J]. Remote Sensing of Environment,1992,39:239-247.

[21]SIMS D A, GAMON J A. Relationships between leaf pigment content and spectral reflectance across a wide range of species, leaf structures and developmental stages [J]. Remote Sensing of Environment,2002,81:337-354.

[22]HUETE A R. A soil-adjusted vegetation index(SAVI) [J]. Remote Sensing of Environment,1988,25:295-309.

[23]RICHARDSON A J, EVERITT J H. Using spectral vegetation indices to estimate rangeland productivity [J]. Geocarto International,1992,7:63-69.

[24]GITELSON A, SOLOVCHENKO A. Non-invasive quantification of foliar pigments: Possibilities and limitations of reflectance- and absorbance-based approaches [J]. Journal of Photochemistry and Photobiology  B-Biology,2018,178:537-544.

[25]HUETE A, JUSTICE C, LIU H. Development of vegetation and soil indices for MODIS-EOS [J]. Remote Sensing of Environment,1994,49:224-234.

[26]XIAO X, BOLES S, LIU J, et al. Characterization of forest types in Northeastern China, using multi-temporal SPOT-4 VEGETATION sensor data [J]. Remote Sensing of Environment,2002,82:335-348.

[27]BANNARI A, ASALHI H, TEILLET P M. Transformed difference vegetation index(TDVI) for vegetation cover mapping [C]. Toronto, Canada: IGARSS,2002:3053-3055.

[28]RONDEAUX G, STEVEN M, BARET F. Optimization of soil-adjusted vegetation indices [J]. Remote Sensing of Environment,1996,55:95-107.

[29]GITELSON A A. Wide dynamic range vegetation index for remote quantification of biophysical characteristics of vegetation [J]. Journal of Plant Physiology,2004,161:165-173.

[30]GITELSON A A, KAUFMAN Y J, STARK R, et al. Novel algorithms for remote estimation of vegetation fraction [J]. Remote Sensing,2002,80:76-87.

[31]GOEL N S, QIN W. Influences of canopy architecture on relationships between various vegetation indices and LAI and FPAR: a computer simulation [J]. Remote Sensing Reviews,1994,10:309-347.

[32]GONG P, PU R, BIGING G S, et al. Estimation of forest leaf area index using vegetation indices derived from Hyperion hyperspectral data [J]. IEEE Transactions on Geoscience and Remote Sensing,2003,41:1355-1362.

(責任编辑:陈海霞)

猜你喜欢

特征选择大豆玉米
注意防治大豆点蜂缘蝽
从大豆种植面积增长看我国粮食安全
收玉米啦!
巴西大豆播种顺利
大豆的营养成分及其保健作用
我的玉米送给你
Kmeans 应用与特征选择
联合互信息水下目标特征选择算法
基于特征选择和RRVPMCD的滚动轴承故障诊断方法
基于二元搭配词的微博情感特征选择