APP下载

冀鲁豫省际边界区域撂荒地提取与分析

2019-07-25张二梅谢紫菁纪文政邵怀勇

湖北农业科学 2019年13期
关键词:冀鲁豫决策树耕地

丁 锐 ,张二梅 ,谢紫菁,纪文政 ,邵怀勇

(成都理工大学,a.国土资源部地学空间信息技术重点实验室;b.地球科学学院,成都 610059)

在快速工业化、城镇化进程中,受农地利用“边际化规律”作用,农地弃耕撂荒已成为普遍现象[1]。农地边际化是指农地收入由低到少的现象,是社会、经济、政治等多种因素影响的结果。撂荒地的时空变化对粮食安全、生态环境的稳定性以及社会经济效益都有着非常重要的影响[2]。省际边界区是指中国省际行政区划边缘交界区域。省际边界地区远离各地区省会城市,难以受到强经济中心的辐射作用,且处于不同省级行政单元交界地区,容易产生政策不同步、各自为政的现象,严重制约了当地的经济增长和区域协调发展。由于经济发展的不平衡、不充分,撂荒现象在省界边际地区表现得尤为明显。

对于耕地撂荒现象,遥感技术在撂荒地研究中发挥的作用日趋明显。国内学者利用遥感数据采用了诸多方法进行研究[3-6]。主要可分为面向对象的分析方法、基于多尺度分形特征的提取、基于决策树分类方法和联合变化检测法等。国外学者[7-9]针对欧洲大面积连片耕地撂荒现象,主要采用基于MODIS NDVI时间序列的方法进行撂荒地提取,但由于分辨率因素和国内撂荒破碎分布的现状,在国内研究中应用存在一定限制。张碧蓉等[10]针对不同分辨率影像的撂荒地提取方法进行了对比分析,发现针对中分辨率的Landsat影像,利用地物光谱曲线差异,撂荒地提取采用决策树分类方法效果较好。决策树结合多项指标,在中分辨率撂荒地识别提取中具有明显优势。为此,本文选取冀鲁豫三省交界处的6个县(市)作为研究区,运用CART决策树分类方法对数据初步分类,结合土地流转方法提取撂荒地,从而分析撂荒地空间格局、撂荒复垦、持续撂荒现象并结合经济指标研究其驱动因素,以期为省际边缘地区撂荒地提取及分析研究提供案例。

1 研究区概况与数据来源

本研究以河北省邯郸市魏县、大名县,山东省聊城市冠县、莘县,河南省濮阳市南乐县、清丰县6个冀鲁豫三省交界处的县级行政单元为研究区。这一区域地处华北平原,位于黄河下游,地理坐标为35°46′26″-36°42′12″N、114°43′42″-115°46′43″E,陆地面积5 935.6 km2,为温带大陆性季风气候,雨热同期,光照充足。研究区经济以第一产业为支柱,主要农作物有小麦、玉米、棉花、蔬菜等。其中魏县、大名县为国家重点贫困县,经济较为落后,伴随着城镇建设速度的加快,当地耕地大量减少,同时也出现了耕地撂荒现象,严重影响当地粮食产量。因此,选取冀鲁豫省际交界处的6个县,提取撂荒地数量并分析其分布状况。

研究所用的数据为美国地质勘探局(USGS)(http://glovis.usgs.gov/)提供的 2000—2018 年 30 m分辨率的Landsat数据,作为地物识别分类的基础数据。因为4—6月作物生长茂盛,易于区分耕地与建筑用地、水体、裸地的特征,因此选取该时间段影像清晰、云量较少的遥感影像作为当年的地物识别底图,每年选取一幅,2000—2018共19幅影像。除此之外,还使用 USGS(https://gdex.cr.usgs.gov)提供的30 m分辨率SRTM DEM数字高程数据,以此提取坡度作为决策树分类依据;并利用Google Earth影像和部分其他高分辨率影像数据作为地物特征点识别依据,用于结果精度检验;最后结合各省经济年鉴数据分析耕地撂荒驱动因素。

2 研究方法

2.1 撂荒地界定

关于撂荒地的定义,综合国内外研究,一部分学者将耕地闲置一年以上视为撂荒,一部分学者将耕地闲置3个月或以上定义为撂荒,也有一部分学者以此为基础,将耕地撂荒分为季节性撂荒和常年性撂荒[11-13]。本文结合前人研究结果以及研究区撂荒特点,对撂荒地识别定义为:前一年的耕地在第二年转化为裸地区域定为当年耕地撂荒区域,前一年的撂荒地在第二年又转化为耕地部分定义为复垦区域。

2.2 研究技术路线

研究流程分为以下四步,第一步:对数据进行预处理,结合多项参数生成新的波段组合影像;第二步:根据新的波段组合影像进行CART决策树分类,得到2000—2018年历年的土地利用图;第三步:结合验证样本对分类结果进行精度验证;第四步:每两年分类结果叠加,得到土地流转结果,识别每年撂荒地并分析撂荒地空间分布、计算撂荒面积、复垦率、持续撂荒及结合当地经济年鉴数据探寻撂荒驱动因素。技术路线图如图1所示。

2.2.1 数据预处理 首先对2000—2018年Landsat遥感影像进行预处理,包括研究区边界掩膜裁剪、快速大气校正,由于2012年Landsat7影像数据存在条带,因此对2012年数据进行插值条带修复处理;处理完成后,根据影像波段信息计算归一化差分植被指数 (Normalized Difference Vegetation Index,NDVI)、归一化差分建筑指数(Normalized Difference Built-up Index,NDBI)、归一化差分水体指数(Normalized Difference Water Index,NDWI)值,利用这 3个归一化指数有助于提高决策树模型的精度,更好区分植被、水体、裸地三类地物的特征,其计算公式如下:

图1 技术路线图

式中,NIR代表近红外波段,R代表可见光红光波段,G代表可见光绿光波段,SWIR代表短波红外波段。

在ENVI 5.3软件中使用ISODATA非监督分类方法,迭代次数设置为10次,类别设置为10~15类,得到ISODATA分类结果,并根据DEM数据在ArcMap 10.3软件裁剪研究区进行坡度计算,得到坡度结果;将原始 Landsat影像与 NDVI、NDBI、NDWI、ISODATA初步分类结果和坡度结果进行波段组合,得到新的决策树分类基础数据。

2.2.2 执行决策树分类 CART(Classification and Regression Tree)相较于其他决策树方法,具有严格无参数、方法实现简单、运行速度较快、结构清晰及易理解等优点[14],被称为是数据挖掘领域的里程碑式算法。决策树由节点和分支组成,根据地物光谱特征等事物的自身属性进行不同类别的区分,采用属性和特征已知的训练集构建决策树模型。将测试数据放入决策树模型,根据其属性信息依次判断测试集中对象所属的地物类别,最终得到分类结果。CART算法利用二分递归原理,将当前样本划分为两个子样本,生成的每个非叶子节点都有两个分支。如果当前节点的所有样本不属于同一类地物或者仅剩下一个样本,则该节点为非叶子节点,最终每个属性的分裂点构成判断条件,该属性划分的子树为最优分支。依照上述原则建立出分类树,再利用剪枝算法对其进行剪枝,最终得到最优的决策树模型。结合Google Earth高分辨率影像和实地数据,根据预处理得到的波段组合新影像选取训练样本,分别为水体、建筑用地、裸地和农田。由于研究区在2011年后出现大面积大棚种植区,与农田等其他地物有着不同的影像特征,所以2011年后的训练样本加入大棚区这一分类。将第一步数据预处理后得到的波段组合的影像和70%的样本作为训练样本放入CART分类器中进行分类,得到优化决策树模型。再在ENVI 5.3软件中执行建立的决策树模型,得到土地利用分类结果。2000—2018年的影像依次处理,得到连续19年的土地利用分类图。

2.2.3 精度验证 对执行决策后的分类结果进行精度验证,检验分类结果准确性。将选取样本数量的30%用于验证样本,检验决策树分类结果的准确性。精度检验指标包括总体精度(Overall Accuracy,OA)、生产者精度(Producer's Accuracy,PA)、用户精度(User's Accuracy,UA)、错分漏分误差和 Kappa系数。经过验证,保证总体精度以及Kappa系数均在80%以上,错分误差、漏分误差小于5%,并且用户精度与制图精度也都在80%以上,最终分类精度保持在75%以上为合格。如果精度较低,重复第二步操作,直至精度满足要求。

2.2.4 撂荒地识别提取 撂荒地识别提取是本研究的关键步骤,其结果的准确性关系着后续撂荒耕地复垦和持续撂荒的精度。根据“2.1”中关于撂荒地的定义,将2000—2018年的19幅土地利用结果以相邻两年为单位进行连续比较。从2000年开始,以2000年为基准年,以2001年为判断年,判别2001年土地利用结果变化,若2000年的耕地区域在2001年转化为裸地,则视该地块为撂荒;接着以2001年为基准年,2002年为判别年得到2002年撂荒结果,以此类推得到2001—2018年18幅撂荒耕地分布图。

为定量反映当年的撂荒情况,引入撂荒率来反映当年撂荒程度,即当年的撂荒面积占前一年耕地面积的比重。其表达式如下:

式中,Paf表示第i+1年的撂荒率;SAi+1表示第i+1年的撂荒地面积;SFi表示第i年的耕地面积。

2.2.5 撂荒地复垦与持续提取 撂荒地与耕地常存在相互转换关系,当撂荒耕地在第二年重新耕作,转化为耕地,即为复垦。根据2001—2018年的撂荒地识别结果,如果同一地块在第i年为撂荒地,而在第i+1年重新转化为耕地,则视该地块为复垦耕地,以此为依据统计2002—2018年每年的复垦面积。根据每年的复垦面积,结合上一年的撂荒面积数据,统计该年的复垦率,其表达式如下:

式中,Prf表示第i+1年的复垦率;SRi+1表示第i+1年的复垦面积;SAi表示第i年的撂荒面积。

为探寻研究区持续撂荒趋势,将2001—2018年的撂荒地提取结果进行叠加,得到持续撂荒分布图,以此分析研究区持续撂荒结果。

3 结果与分析

3.1 撂荒地空间格局分析

基于CART决策树分类方法,根据多项指标因子得到每年的初步土地利用分类结果。在满足“2.2.3”中确定的精度要求后,最终获得了2000—2018年19年的研究区土地利用图。根据“2.2.4”建立的撂荒地提取规则,将相邻两年的土地利用结果进行叠加,得到2001—2018年的撂荒地分布图(部分年份如图2所示)。

图2 研究区撂荒地分布图

根据分类结果信息,当地的建筑分布呈 “马蜂窝”式聚集状,且随着经济的发展,建筑用地面积呈逐渐增加趋势,裸地面积逐年减少,其中冠县和莘县变化尤其明显。莘县境内在2011年前后出现较为明显的大棚种植区,且大棚区面积逐年增加,由此可见当地大棚农业发展迅猛,为当地的农业经济发展作出重要贡献。由于棉花的生长周期与当地小麦等其他农作物不一致,而春季棉花作物的地物特征与裸地极其相似,因此大名县境内在春季的影像分类中存在大面积裸地区域,通过高精度影像比对,确定研究中大名县境内的连片裸地为棉花种植地。由于采取连续两年的影像叠置结合耕地变化提取撂荒区域,因此这部分棉花地对最终结果有一定影响但总体可以接受。

由图2可知,撂荒地在研究区范围内均有分布,主要集中在研究区东北部,南部地区撂荒程度较轻。在2016和2018年的结果图中,撂荒地主要集中在研究区中部,研究区边缘撂荒地分布减少。通过不同年份的撂荒地结果对照比较,可以看出研究区撂荒地呈明显减少趋势,尤其2016和2018年较2002、2004年等早期年份撂荒地提取结果呈明显减少趋势。

3.2 撂荒地空间构成分析

根据2001—2018年的撂荒地提取结果,统计不同区(县)的撂荒面积并计算每年的撂荒率。结果表明,2001—2003年撂荒较为严重,其中2002年撂荒率最大为1.78%,撂荒面积6 662.43 hm2。2015年后撂荒率跌破1%,并一直维持在较低水平,其中2017年撂荒率最小,仅为0.52%,该年撂荒面积也最小,为1 956.33 hm2。冀鲁豫边界区6县撂荒情况总体控制得不错,每年的撂荒率均小于2%,年均撂荒率为1.34%,撂荒率总体呈下降趋势。

将各区(县)撂荒面积统计结果进行对比(表1),2001—2014年冠县和莘县的撂荒面积较大,在2014年后明显下降。2012年大名县撂荒面积增幅尤为巨大,经考证主要是受2012年影像数据质量影响,导致提取质量下降,排除此年误差影响,大名县撂荒面积总体维持在较低水平。其他5县的撂荒面积虽然在21世纪初占比较大,但都在近几年得到明显控制。

表1 2001—2018年冀鲁豫边界区县撂荒地统计结果 (单位:hm2)

3.3 复垦与持续撂荒分析

耕地因多种复杂因素撂荒,当条件有利于耕作时,往往又会出现撂荒耕地复垦现象,因此统计复垦耕地也是耕地撂荒分析中重要的一环。根据“2.2.5”中的规则对2001—2018年进行复垦统计(表2)。结果表明,2003年复垦率最高,为69.33%,复垦面积达4 618.98 hm2;2013年复垦率最小,为3.91%,复垦面积为251.55 hm2。2002—2018年年均复垦率为32%,总体复垦情况较好,仅有 2002、2013、2018年3年复垦率低于10%。分析每年的撂荒率趋势,发现复垦率总体呈以两年为单位上升又下降的循环波动趋势。

耕地的持续撂荒严重影响到粮食安全,对土质等耕作条件也会产生一定影响。将2001—2018年历年的撂荒地提取结果进行叠加,对研究区撂荒进行持续性分析,统计研究区6县的持续撂荒结果(表3)。由表3可知,研究区持续撂荒主要集中在1~2年范围内,撂荒地持续1年的面积最大,有20 037.87 hm2,仅有很少一部分撂荒地持续时间大于10年,持续撂荒大于12年的小于1 hm2,由于研究区总面积较大,这部分撂荒完全可以忽略不计。各区(县)对比中,冠县、大名县和莘县持续撂荒面积占比较大,与撂荒面积趋势一致。

表2 2002—2018年冀鲁豫边界区(县)撂荒复垦统计结果(单位:hm2)

表3 2001—2018年冀鲁豫边界区县持续撂荒地统计结果

图3 研究区持续撂荒分布

将2001—2018年的撂荒地结果进行叠加分析,得到研究区持续撂荒分布结果(图3),研究区撂荒时间较长的地区主要分布在北部,但由于占比较少,所以结果不是特别明显,研究区大部分为短时间撂荒。由此可知研究区持续撂荒不是十分明显,大部分仅为短时间撂荒,一段时间后又开始复垦,可见当地对常年撂荒地的控制十分可观。

3.4 撂荒驱动因素分析

根据各项撂荒数据,结合冀鲁豫三省统计年鉴的经济指标,对撂荒地产生的驱动因素进行分析。以研究区中魏县为例,整理各年份年鉴中的农业经济指标(表4)。结合撂荒地总体趋势,研究区撂荒面积在2000—2003年较大,而2000年当地农林渔牧从业人员仅占总乡村从业人口的25.58%,由此可见,21世纪初的撂荒现象主要受制于农业人口大量外出务工,未从事农业劳动导致撂荒地产生。2012年后农林渔牧从业人口比例虽然有所下降,但是并没有出现撂荒率上升的现象,一方面得益于农业机械化程度提高,另一方面归功于政府农业及扶贫政策的实施,农民纯收入呈逐年增长趋势,务农收入提高也改善了耕地撂荒情况。2014年后撂荒现象得到控制,结合当地经济指标数据和政府政策分析,发现2014年正值实施精准扶贫重点施策。近5年中国扶贫政策取得阶段性成果,贫困发生率低于4%,有望在2020年建成“全面小康社会”。研究区撂荒面积虽然在世纪初占比较大,但都在近几年得到显著控制,由此可见精准扶贫等一系列政策在当地取得一定成果,当地农民生活条件相对得到改善,撂荒土地也因此再次盘活起来,帮助农民增收和推动当地经济发展。

表4 2000—2016部分年份魏县经济指标

综上所述,在冀鲁豫省际边界区撂荒因素主要取决于务农人口占比、农业生产效率和当地政府的政策实施,除此之外,自然灾害和当地环境质量也会影响耕地撂荒,由于其受具体年份和地区影响,不将其纳为主要分析因素。值得一提的是,不同地区撂荒因素也存在一定差异性,要视具体情况进行分析,合理探寻撂荒地驱动因素。

3 小结

研究结果表明,撂荒地在研究区分布较为均匀,东北部相对较多,南部地区撂荒程度较轻。2015年后撂荒面积减少,研究区边界地区表现得尤为明显。

冀鲁豫三省交界处6县的撂荒面积总体呈下降趋势。其中2002年撂荒面积最大,为6 662.43 hm2,该年撂荒率也达到峰值,为1.78%。2015年后研究区撂荒现象得到有效控制,2015—2018年撂荒率均小于1%,分别为0.89%、0.61%、0.52%、0.64%。研究区复垦呈上升又下降循环波动,年均复垦率为32%。其中2003年复垦率最大,达69.33%。冀鲁豫边界区常年撂荒现象不是特别明显,主要为1~2年的短时期撂荒。其中持续1年的撂荒面积最大,有20 037.87 hm2。研究区最长持续撂荒时间为14年,但是占比极小,面积仅有0.09 hm2。结合当地经济数据分析,冀鲁豫边界区撂荒主要取决于务农人口、农业生产效率及当地政府政策。随着农业机械化程度提高以及“精准扶贫”等一系列政府政策支持,研究区撂荒情况在2015年后得到有效控制。

本研究基于遥感 (RS)、地理信息系统(GIS)、CART决策树分类等方法对冀鲁豫省际边界区撂荒地进行提取与分析,但受制于影像分辨率因素限制,本研究方法对于小图斑撂荒地提取还有一定局限性,仅适用于连续明显的撂荒地块。本研究结果一定程度上为全国其他相似省际边界区撂荒耕地研究提供了案例,也为维护国家耕地红线安全和政府可持续政策决策提供了依据。

猜你喜欢

冀鲁豫决策树耕地
自然资源部:加强黑土耕地保护
我国将加快制定耕地保护法
保护耕地
新增200亿元列入耕地地力保护补贴支出
一种针对不均衡数据集的SVM决策树算法
统一战线:杨得志开辟冀鲁豫边区的『秘密武器』
决策树和随机森林方法在管理决策中的应用
基于决策树的出租车乘客出行目的识别
基于肺癌CT的决策树模型在肺癌诊断中的应用
纪念中共中央冀鲁豫(平原)分局成立七十周年座谈会暨党的群众路线与冀鲁豫边区民主民生运动学术研讨会征文启事