APP下载

中国红树林制图的遥感时空概率阈值方法

2022-07-06黄可孟祥珍杨刚孙伟伟

遥感学报 2022年6期
关键词:红树林阈值精度

黄可,孟祥珍,杨刚,孙伟伟

宁波大学地理与空间信息技术系,宁波 315211

1 引言

红树林是热带和亚热带海岸带上特有的森林群落,其结构复杂、物种多样、生产力高效,具有独特的生态功能以及重大的社会、经济价值(王文卿和王瑁,2007)。然而,在人类活动的影响下,全球范围内的红树林面积正以年均1%的速度减少,且面临生物多样性降低、生态系统服务功能退化等主要威胁(张之豪,2019)。Jia等(2018)解译了123张Landsat影像,发现在1973年—2000年中国红树林消失了60%以上,2000年—2015年约恢复了12%。据统计,中国目前有林红树林湿地面积约为2.9 万ha,比2001年增加了近15%(张之豪,2019),但当前形势依然紧迫,中国红树林的保护和生态修复工作依然需要付诸更大的努力和投入。

在红树林监测方面,遥感技术具有宏观、经济、高效的特点,已成为现今红树林监测和管理不可或缺的手段(林鹏,1987),并应用于区域提取、种间分类、群落结构、生物量、灾害灾情、动态变化、驱动机制、红树林湿地保护与管理等领域(孙永光等,2013)。现有研究大多以自然保护区等典型区域为研究区(郭菊兰等,2015;黄星等,2015),省域尺度研究居多(李春干等,2015),全国尺度研究较少(吴培强等,2013)。在全球尺度上,国外学者在红树林的分布与动态监测方面已经开展一些研究(Giri 等,2013)。中分辨率光学遥感数据为红树林监测中最常用的数据源(李天宏等,2002;Giri 等,2013;吴培强等,2013),高分辨率遥感数据有利于提高分类精度并且能实现进一步的红树林种间分类,包括IKONOS(Kovacs 等,2005)、QuickBird(何玉花等,2019)、ZY-3(苏岫等,2017)、GF-5(Wan等,2020)等卫星数据以及无人机数据(刘凯等,2019a;田义超等,2019);除光学遥感外,雷达数据(黎夏等,2006;李春干等,2015)也越来越多地运用到红树林遥感监测中。

红树林信息往往通过遥感影像的光谱波段,以及通过其计算的纹理特征和植被指数等信息进行提取,常用的提取方法包括目视解译(尹艺洁等,2017)、面向对象分类法(刘凯等,2019a)、决策树法(Liu 等,2017;刘凯等,2019b;肖海燕等,2007)、支持向量机方法(甄佳宁等,2019;周磊等,2019)等。大部分研究通过结合多种分类方法进行红树林信息提取(李春干等,2015;刘凯等,2019a),采用现场实测数据作精度评价。CCDC 方法(Zhu 和Woodcock,2014)为植被长期动态监测提供了有效的手段,Awty-Carroll 等(2019)将CCDC 方法应用于Sundarbans地区红树林的长期动态情况研究中。但是,现有研究主要使用单时相或多时相遥感数据面向小研究范围的红树林信息提取,缺少了对长时序数据时间信息的有效利用。由于数据源、时相、分类方法、解译尺度等方面的差异,不同研究的红树林提取结果也存在较大的差别(周振超等,2018),这对分析某地区红树林的时空变化情况造成了不确定性。而且,中国红树林遥感监测与制图的空间范围主要集中在红树林自然保护区或省级行政区(尤其是广西),全国尺度的研究较少(吴培强等,2013;Jia等,2018)。

近年来,中国红树林的遥感制图研究已有相关产品。Chen 等(2017)基于物候学的方法制作了2015年中国红树林地图,通过Landsat 长时序数据合成每个像素位置指数的分位数来描述植被绿度、冠层覆盖情况和潮汐淹没状态。Hu等(2018)通过合成每个像素位置一段时间内的Landsat 图像分位数,再由这些时间剖面计算光谱—时间变异性指标,采用随机森林算法制作中国1990年、1995年、2000年、2005年、2010年和2015年的红树林地图。Jia 等(2018)基于低潮时的Landsat 影像采用面向对象的方法绘制了1973年、1980年、1990年、2000年、2010年和2015年的中国红树林地图。Zhao 和Qin(2020)基于Sentinel-1 的SAR数据和Sentinel-2 的多光谱数据,通过指数分位数合成的方法利用随机森林算法制作了2015年、2017年的中国红树林地图。

虽然Sentinel 数据具有更高的空间分辨率,但首颗Sentinel-1A卫星于2014年4月3日发射,在提供长时序数据方面Landsat 卫星具有无可取代的优势。相较于选取低潮影像进行红树林提取的方法,本研究充分利用了Landsat 数据,更加简单快速,并且避免了人工海岸区域的高不确定性。本研究通过红树林概率阈值来进一步提取红树林的精细范围,从一个新的角度来考虑潮汐淹没状态对红树林提取结果的影响。

GEE(Google Earth Engine)平台提供了完整的Landsat、MODIS、Sentinel 系列影像,具备影像在线批量处理的能力,能很好满足大范围地区红树林长时间序列监测的需求。已有部分学者(Li等,2019;刘凯等,2019b)利用GEE 平台对红树林的动态监测做出尝试。本研究基于GEE 平台提出一种时空概率阈值法对中国红树林进行提取,选取2015年516 景Landsat 8 影像进行处理,证实了GEE 平台处理大范围长时序数据的高效性,有利于分析全国红树林的时空变化趋势,为中国实施大规模的红树林生态系统保护和恢复行动提供科学支撑和决策参考建议(张之豪,2019)。

2 研究区与数据源

2.1 研究区概况

研究区为中国东南沿海区域(图1),包括广西壮族自治区、广东省、香港特别行政区、澳门特别行政区、福建省、浙江省、海南省、台湾省8 个省级行政区。沿海地区地势低洼,海岸类型多样,主要包括淤泥质海岸、基岩海岸和砂质海岸。气候类型为热带、亚热带季风气候,年均温21 ℃—25 ℃,年降水量在1200 mm 以上。自1980年第一个红树林自然保护区成立以来,中国(不含港澳台地区)共建立红树林自然保护区32 个(图1,数据来自中华人民共和国生态环境部官网2019年5月14日发布的《2017年全国自然保护区名录》),其中国家级自然保护区6个、省级自然保护区5个、市级自然保护区8 个、县级自然保护区13 个,保护区类型大多为海洋海岸,仅大鹏半岛、汕头湿地为森林生态、内陆湿地,主管部门主要为林业部门,少数为海洋、环保部门。广东省是中国红树林面积最大的省份,共有16 个红树林自然保护区(其中国家级自然保护区2 个),广西壮族自治区、海南省、福建省分别有3个(其中国家级自然保护区2个)、8个(其中国家级自然保护区1个)、5 个(其中国家级自然保护区1 个)红树林自然保护区。中国红树林主要为海漆、木榄、红海榄、秋茄、桐花树、白骨壤等,红树植物种类由南向北逐渐减少。浙江省舟山市是中国红树林人工引种的北界,福建省沙埕湾是中国红树林天然分布的北界。

图1 研究区位置Fig.1 Location of the study area

2.2 GEE平台及Landsat数据

GEE 是一个由海量数据集和高性能并行计算组成的服务平台,通过API 接口和基于Web 的交互式开发环境实现对云端海量数据的访问、操作以及结果可视化等(郝斌飞等,2018)。GEE平台提供了海量的遥感影像,包括所有Landsat 系列产品、MODIS 系列产品、Sentinel 系列产品等,此外还提供了数字高程模型、土地覆被、地表温度等诸多环境、地球物理以及社会经济数据集。GEE平台还拥有强大的在线云计算能力,并且对用户提供了丰富的API 接口,用户可使用Python 和JavaScript 语言通过API 接口对算法进行调用或自定义功能的编写,实现对海量数据的处理及分析,很好地解决了数据量、计算速度等方面的问题,从而更充分地发挥了地球观测遥感数据的潜力。

Landsat 数据的用途在不断发展,已经成为农业、林业、土地利用、水资源、自然资源勘探等多个领域的重要数据来源,尤其近年来在土地覆被变化、沿海湿地的消失等各种应用中发挥着越来越重要的作用。GEE 平台对所有Landsat 存档数据进行了整理,包括原始数据、大气表观反射率数据以及经大气校正的表面反射率数据等。本研究使用的Landsat 8影像覆盖情况如图2所示,共筛选得到2015年1月1日至12月31日Landsat 8 表面反射率数据516景。

图2 研究区Landsat 8影像数量Fig.2 Number of Landsat 8 images over the study area

2.3 参考数据集

为了与本研究提出的红树林提取方法进行比较,选择了一种全球红树林产品(GMW_2015 数据集)和一种中国红树林产品(CAS_Mangrove 2015年数据集),时相为2015年,空间分辨率均为30 m。

日本航空航天局(JAXA)京都与碳计划(Kyoto &Carbon Initiative)制定了GMW (Global Mangrove Watch)数据集(Bunting等,2018;Thomas等,2017)。GMW 基于ALOS PALSAR 和Landsat数据,首先生成红树林栖息地掩膜,然后使用随机森林分类器对红树林进行分类,生成2010年的红树林全球范围分布图,精度在93.6%—94.5%。这个范围构成红树林监测系统的基础,该系统使用JAXA JERS-1 SAR, ALOS PALSAR 和ALOS-2 PALSAR-2 雷达数据来评估1996年—2016年的红树林变化。GMW 数据集可在Ocean Data Viewer(https://data.unep-wcmc.org/datasets/45[2020-10-16])下载,包括1996年、2007年—2010年、2015年—2016年数据。

Jia等(2018)利用120余景Landsat卫星影像,采用面向对象和最近邻法,构建了第一个中国红树林空间分布及其变化数据集CAS_Mangroves,总体精度在78%—94%。该数据集目前包括1973年、1980年、1990年、2000年、2010年和2015年共6期中国红树林空间分布数据。相较于其他中国红树林遥感制图产品,CAS_Mangroves 数据集是基于长时序数据生成的,采用统一的数据源和方法,在时间上更具有一致性和可比性;使用面向对象的方法提取红树林,整体性好,精度高;采用实地调查采样的验证方式,野外调查数据包括1296 个红树林点和1058个非红树林点,可靠性更高。

2.4 样本数据集

本研究基于Google Earth 的2015年高分辨率影像,根据目视解译结果并参考GMW_2015 数据集和CAS_Mangrove 2015年数据集选择了红树林样本点1100个,用于确定决策树分类阈值和概率阈值。同时还选取了非红树林样本点1100 个(包括其他植被和非植被样本),用于对比实验中的监督分类。此外还使用了外业实测数据,为2019年的广西红树林野外考察样本点100个。样本数据集用于提取结果的精度验证,图3为样本数据集分布图。

图3 样本数据集分布图Fig.3 Distribution of sample dataset

3 研究方法

本研究首先使用非监督分类法区分水体与陆地,再根据分类结果提取水陆边线并生成红树林潜在生长区,利用多种指数与光谱信息协同构建多特征决策树提取红树林粗略生长范围,基于长时序数据计算红树林生长概率并确定概率阈值实现红树林精细提取。红树林提取流程如图4所示。

图4 红树林提取流程Fig.4 Workflow of mangroves extraction

3.1 红树林潜在生长区生成

红树林只生长于潮间带地区,根据这一生长区位特征可以对红树林提取范围进行缩减,减少其余陆地像元对红树林提取造成的干扰。

本研究采用K-means算法对影像进行非监督分类实现水陆分离,选取NDVI(Rouse 等,1974)、NDWI(McFeeters,1996)两种指数和NIR、SWIR1、SWIR2共3个红外波段参与非监督分类,进行水体和陆地信息提取。NDVI与NDWI的计算公式如下:

式中,ρNIR为近红外波段反射率,ρR为红光波段反射率,ρG为绿光波段反射率,ρB3、ρB4、ρB5分别为Landsat 8影像波段3、波段4、波段5波段反射率。

根据陆地与水体的非监督分类结果,通过Canny 边缘检测算法提取水陆边线。该算法由Canny(1986)提出,包括图像降噪、计算图像梯度、非极大值抑制、双阈值筛选4个步骤,GEE中已对其进行封装。红树林的生长区位条件比较严格,需要合适的海水盐度及潮汐条件,所以红树林分布在水陆边线向外延伸的一定范围内。李想等(2018)经野外实地调查发现北部湾地区红树林分布在水陆边线向外延伸40—2300 m 领域内。北部湾是中国红树林的典型分布区,红树林面积大且集中连片分布,广东省东南沿海地区与北部湾区域所处纬度相近,而纬度越高红树林生长条件越不利,台湾省、福建省、浙江省的红树林分布较少,以北部湾红树林的生长范围作为缓冲区标准可以适用于全国。因此以距水陆边线2300 m为限生成海陆双向缓冲区,最后叠加非监督分类生成的陆地掩膜,得到红树林潜在生长区。

3.2 红树林信息提取与合成

植被指数是根据植被独特的光谱特性,利用卫星的可见光及近红外波段数据进行组合,突出植被信息,抑制土壤亮度、土壤颜色等非植被信息。植被指数已被广泛应用于植被生长状况以及覆盖情况的定性或定量监测,其中NDVI 的应用最为广泛。为了进一步区分出红树林,许多学者针对不同传感器提出了不同的红树林指数(Liu 等,2017;Jia 等,2019),Gupta 等(2018)基于Landsat 8 OLI 影像建立了红树林综合识别指数(CMRI),以增大NDVI与NDWI的差异,值越大越可能是红树林,其计算公式如下:

本研究将利用NDVI、NDWI、CMRI 与光谱信息协同构建多特征决策树对红树林进行提取。首先进行各个指数与光谱波段的阈值确定。选择2015年GMW 数据集中国区域红树林范围作为样本区,统计样本区内Landsat 8 OLI 影像的原始单波段及NDVI、NDWI和CMRI的分布直方图,经多次实验确定分类阈值,各波段值及指数同时满足阈值要求则为红树林。

对一年内所有可用数据进行红树林信息提取,根据决策树分类结果,统计各像素所在位置在该年内是红树林的概率,即被分为红树林的次数除以总分类次数,据此生成年度红树林概率数据。再通过实验确定概率阈值提取红树林的最终结果。

4 结果与分析

图5 为红树林样本在原始单波段及NDVI、NDWI 和CMRI 的统计直方图,决策树分类的阈值如表1所示,待分类像素的各波段值及指数均在阈值上下限范围内则被分为红树林。图6为年度红树林概率图(以海南省新英湾为例)。本文与Jia 等(2018)研究结果作对比,同时统计不同概率下红树林提取精度,综合确定本研究的红树林概率阈值。阈值范围0.1—1,步长为0.1,通过多次实验得到对比结果如图7所示,红树林样本点被提取比例可视为提取精度。可以看出,选择红树林概率大于等于0.5时,提取结果与Jia等(2018)研究结果接近。并且在阈值为0.1—0.5时,提取精度变化不大,而在阈值大于0.5 后,提取精度迅速下降。最终确定红树林概率阈值为0.5,得到的2015年红树林面积提取结果为21932 ha。

图5 红树林样本原始单波段像元值及光谱指数值统计直方图Fig.5 Histogram of original single-band values and spectral indexes in mangrove samples

图6 年度红树林概率图(以海南省新英湾为例)Fig.6 Annual map of mangrove probability(A case study of Xinying Bay in Hainan Province)

图7 不同概率下的红树林提取结果Fig.7 Mangroves extraction results under different probability

表1 红树林分类阈值Table 1 Classification thresholds of mangroves

为了验证本文方法的合理性与有效性,本研究与不同的分类方法进行对比。在水陆分离、红树林潜在生长区生成的基础上,分别采用光谱指数、原始波段对影像进行决策树分类,再根据相同的年度概率阈值(选择红树林概率大于等于0.5)得到两个分类结果。监督分类方法中,同样在水陆分离、红树林潜在生长区生成的基础上,选择红树林、非红树林两类各1100 个样本点(随机选择770 个样本点为训练样本,其余330 个样本点为测试样本),分别采用CART、SVM 两种分类器对年度均值合成影像进行分类得到两个分类结果,总体精度均为99.44%。

提取结果如图8所示,图8(a)为本文方法提取结果,红树林边缘信息准确,具有最优的目视结果。图8(b)和图8(c)为参考数据集,其中图8(b)为Jia 等(2018)CAS_Mangrove 数据集的2015年红树林范围,图8(c)为GMW 数据集的2015年红树林范围。可以看出,CAS_Mangrove 数据集提取结果较好,但边缘细节部分不够准确,而GMW数据集忽略了幼小、分散的红树林。图8(d)为仅使用光谱指数提取的结果,红树林范围被很大程度的高估,说明NDVI、NDWI、CMRI 这3 个指数不能完全概括红树林的光谱特征并将其与其他陆地背景分开。图8(e)为仅使用原始波段提取的结果,提取效果较好,但水边的植被容易被误分为红树林。图8(f)和图8(g)分别为应用CART、SVM 两种分类器的监督分类结果,由于样本点仅分红树林、非红树林两类,提取结果也有明显的高估。值得指出的是,虽然两个监督分类的总体精度高达99.44%,但明显扩大了红树林的分布范围。

表2为不同提取方法的全国红树林面积统计结果,其他方法均有不同程度的高估,这与图8的结果一致。仅使用光谱指数提取的红树林面积最大,其次是应用CART、SVM 两种分类器的监督分类结果,仅使用原始波段提取的结果高估程度最小。

表2 不同方法提取结果对比Table 2 Comparison of extraction results by different methods

图8 不同数据集以及提取方法的红树林提取结果对比Fig.8 Comparison of mangrove extraction results derived from different datasets and extraction methods

本研究根据样本数据集对提取结果进行精度验证:(1)广西野外考察验证点100个中,被提取点达97 个;(2)本研究提取结果与两个参考数据集的精度如表3所示,本研究提取结果、CAS_Mangrove 2015年数据集、GMW_2015 数据集的总体精度分别为95.09%、95.82%、82.23%,三者的红树林生产者精度分别为90.36%、91.73%、64.64%。本研究的精度略低于CAS_Mangrove 2015年数据集,CAS_Mangrove 2015年数据集的精度最高;GMW_2015 数据集精度较低,存在大量漏分的红树林像素。

表3 不同数据集的精度对比Table 3 Comparison of accuracy of different datasets

本研究提取得到中国红树林面积为21932 ha。表4 对比了不同研究得到的2015年红树林面积,本研究得到的结果与Jia 等(2018)研究结果较为接近,而GMW 数据集的红树林面积总体偏低,说明本研究选取的阈值比较合理,能较完整地提取出中国红树林。

2015年中国红树林分布情况如图9所示,结合表4可以看出中国红树林主要分布在广西壮族自治区和广东省,两者的红树林面积占全国红树林面积的73.22%;其次是海南省,占全国总面积的18.12%;再次是福建省,占全国总面积的5.08%;台湾省和香港特别行政区的红树林面积接近,浙江省红树林面积较小,澳门特别行政区红树林面积最小。

图9 2015年中国沿海红树林的分布Fig.9 Distribution of mangroves along the coast of China in 2015

表4 2015年中国红树林面积Table 4 The areas of mangroves in China in 2015/ha

广东省红树林广泛分布在沿海地市的各个港湾,其中湛江市、珠江口等地分布最为密集,水东港、海陵湾、镇海港、大亚湾、马宫港等地较为集中,在潮州等地也有分布。广西壮族自治区沿岸港湾均有大片红树林分布,其中英罗湾、丹兜海、铁山港、大风江、钦州湾、防城港、珍珠湾分布较为集中。海南省的红树林主要分布在东北部的东寨港和清澜港,其次是北部的花场湾、新英湾和后水湾,在南部三亚港、西部墩头港也有分布。福建省的红树林在漳州市、厦门市、泉州市、福州市、宁德市均有分布,漳江口、九龙江口、泉州湾是主要分布区。浙江省是中国红树林人工引种的北界,主要分布在西门岛周边及瓯江口,鳌江口、飞云江口与沿浦湾区也有少量分布。台湾省红树林只在西海岸分布,主要集中在台北淡水河口,新竹、嘉义沿岸也有零星分布。香港特别行政区的红树林主要分布在米埔、大埔汀角、西贡等地。澳门特别行政区红树林面积很少,主要分布在凼仔与路环大桥西侧。

5 结论

本研究基于GEE 平台对516 景Landsat 8 数据进行处理,提出了一种时空概率阈值法,得到了2015年中国及各省级行政区红树林面积并生成了分布图,红树林生产者精度达90.36%。2015年全国红树林面积为21932 ha,主要分布在广西壮族自治区和广东省,两者的红树林面积占全国红树林面积的73.22%。

本研究使用了2015年所有可用的Landsat 影像,各像素所在位置均有多次观测值(最高达58次),这样可以避免因某次成像时红树林被淹没而无法被提取。并且,考虑到不同潮汐淹没状态对红树林提取结果的影响,还选用红树林概率阈值来进一步确定红树林分布范围。

本研究证实了GEE 平台在大数据、云计算方面的优势,能高效地处理大范围长时间的遥感数据,获取逐年的红树林分布范围是可能的,这使全国甚至全球红树林动态监测成为可能,有利于分析红树林的时空变化趋势及其驱动机制。

Landsat 数据的空间分辨率为30 m,分辨率较为粗糙,对于幼小、分散的红树林不能很好地识别提取;虽然研究利用的数据足够多,能在一定程度上避免红树林正好被淹没而未被提取的情况,但仍不能完全排除这种可能。这两者都会造成结果的低估。另外,本研究的样本点主要来自于目视解译,目视解译中的偏差会造成红树林提取结果的不确定性。本研究提取结果的精度略低于CAS_Mangrove 2015 数据集,这可能是选取样本点时以其为参考所造成的。下一步工作中,可以采用分辨率更高的高分数据或Sentinel 数据结合潮位数据进行红树林提取,收集更多的野外实测数据以进行特征提取及精度验证。

猜你喜欢

红树林阈值精度
基于不同快速星历的GAMIT解算精度分析
非平稳声信号下的小波变换去噪方法研究
藏着宝藏的红树林
土石坝坝体失稳破坏降水阈值的确定方法
非均匀光照下文本图像分割算法研究
红树林为何能在海水中生长
走过红树林
近似边界精度信息熵的属性约简
利用迭代软阈值方法抑制恒时演化类核磁共振实验中的采样截断伪峰
电力系统短期负荷预测方法与预测精度