APP下载

基于高分六号WFV数据的可可西里湖泊水体识别模型

2022-06-22王仁军李东颖刘宝康

自然资源遥感 2022年2期
关键词:反射率湖泊波段

王仁军, 李东颖, 刘宝康

(天水师范学院资源与环境工程学院,天水 741000)

0 引言

湖泊作为地表水圈的重要组成,不仅参与全球水分循环,调节区域水分平衡,而且还为人类提供了丰富的生活和生产资源,是维持区域生态平衡的重要因子之一[1-2]。我国湖泊主要集中分布于对气候变化十分敏感的青藏高原地区,大于1 km2的湖泊总数占全国湖泊总数量的39.2%[3-4]。其中,深藏于青藏高原腹地的可可西里地区,是我国湖泊分布密度最高的地区之一。通常,该区域湖泊分布的海拔较高,气候恶劣,受人类活动影响较小,因此该地区湖泊变迁能忠实记录气候变化,是气候变化的敏感指示器。

近年来极端气候事件频繁发生,引发了一系列的自然灾害[5]。2011年9月受青藏高原气候暖湿化的影响,可可西里地区卓乃湖发生溃堤,大量湖水外泄,依次流入库赛湖和海丁诺尔湖,最后注入盐湖,外溢湖水注入盐湖之后,盐湖水位上升,可能引起盐湖湖水外溢,盐湖湖水为高度矿化的咸水,一旦外溢,不仅会危及青藏铁路和青藏公路等一些基础设施,而且还会严重危及可可西里地区生态环境安全,通过研究及时、准确地获取盐湖水体变化信息,能够为相关部门进行水患防治提供科学决策和依据。基于此,大批学者对可可西里地区的湖泊进行了研究,姚晓军等[6]和刘宝康等[7]利用Landsat TM/ETM+/OLI遥感影像和国产环境减灾星(HJ1A/B)CCD数据对该区域湖泊水位变化、溃堤原因和可能引发溃堤的条件等进行了研究。

随着遥感技术被广泛应用于水体监测领域,水体信息提取方法成为热门研究方向。如Komeil等[8]利用Landsat5 TM,Landsat7 ETM+和Landsat8 OLI遥感影像,模拟了2000—2013年伊朗乌鲁米耶湖的时空变化; Adrian等[9]以澳大利亚东部的TM/ETM/OLI影像为数据源,在比较7种水体指数的基础上,提出了一种简单精确的大范围水体自动分类方法。目前,用于水体信息提取的方法以单波段阈值法和多波段谱间关系法为主[10]。单波段阈值法主要是利用水体与背景地物在遥感影像的某一波段反射率存在差异,能有效抑制背景地物,实现与背景地物相分离的目的[11],但单波段阈值法对不同时相、不同区域的水体需要设置不同的阈值,具有一定的局限性; 多波段谱间关系法综合利用各波段信息,通过波段之间的组合,极大地增强了水体与其他地物反射率的差异,与单波段阈值法相比不受时空的影响[12],多波段谱间关系法中以水体指数法最为常见,如McFeeters[13]提出了归一化差异水体指数(normalized difference water index, NDWI),能够抑制植被和土壤信息,实现增强水体信息的作用; 徐涵秋[14]针对NDWI提取市区水体不理想,在NDWI的基础上,提出了改进的归一化水体指数(modified normalized difference water index,MNDWI); 陈文倩等[15]基于高分一号4个波段并结合决策树法,提出了阴影水体指数(shade water index ,SWI),能有效地剔除阴影、裸地等背景地物对水体的影响; 王瑾杰等[16]在SWI的基础上,提出了改进的阴影水体指数(modified shade water index ,MSWI),进一步提高阴影与水体的分离程度; 王小标等[17]针对复杂环境下水体提取精度易受到低反射率地表影响的问题,利用ETM+影像,构建了多波段水体指数(multi-band water index,MBWI),但此方法很难提出与水体反射率接近的地物; 王琳等[18]利用Landsat8影像,提出了双红外水体指数(double infrared band water index,DIBWI) ,用于准确识别蓝藻湖泊水体信息。

现阶段水体研究主要利用国外卫星数据,国外卫星数据存在时间/空间分辨率低、晴空数据少等问题,难以对水体进行精准监测,而我国的高分六号卫星,是我国自主研发的低轨光学遥感卫星,与国外数据相比,具有高时间分辨率、宽覆盖等特点,有利于湖泊水库的精细化动态监测。本文以其WFV影像为数据源,构建了一种新型水体指数——红边水体指数(red side water index,RSWI),利用混淆矩阵生成的总体分类精度和Kappa系数进行精度验证,并与NDWI,MSWI和单波段阈值法3种水体提取模型进行精度对比分析,探究RSWI的精确度和可靠性。此方法可为高分六号卫星数据在湖泊面积及其湖岸线动态监测方面提供理论参考和技术支撑。

1 研究区概况及数据源

1.1 研究区概况

可可西里地区,位于N33°30′~36°29′,E81°56′~94°06′,深藏于青藏高原腹地,横跨新疆维吾尔自治区、西藏自治区和青海省3大行政区(图1)。可可西里地区平均海拔高达4 000 m以上,气候条件恶劣,湖泊众多且受人为影响较小,面积大于10 km2的湖泊多达83个,包括淡水湖、微咸水湖、咸水湖、盐湖,其中微咸水湖和咸水湖分布较多,是青藏高原湖泊集中分布区域之一[19]。本文选取可可西里地区的卓乃湖、太阳湖、可可西里湖、库赛湖、加德仁错、多格错仁错及西金乌兰湖7个不同类型的湖泊,作为新型水体指数可行性和普适性验证分析的研究区。

图1 研究区地理位置

1.2 数据源及预处理

高分六号卫星于2018年6月2日在我国酒泉卫星发射中心成功发射,是中国空间技术研究院研制的低轨光学遥感卫星,设计寿命为8 a,有高时间分辨率和宽覆盖相协同等优点。影像包括8个波段,具体见表1。本研究所使用的高分六号16 m多光谱遥感影像数据来自中国资源卫星应用中心(http: //36.112.130.153: 7777/DSSPlatform/index.html),影像获取时间为2020年9月29日。

表1 高分六号卫星影像波段情况

首先,在ENVI5.3软件下对遥感影像进行线性拉伸,突出显示水体信息; 其次,对影像进行辐射定标和大气校正,其中辐射定标采用中国资源卫星应用中心提供的绝对定标系数,大气校正采用FLAASH模型; 然后,利用影像自带的有理多项式函数模型参数(rational polynomial coefficient,RPC)和地面高程数据完成高分六号数据的正射校正; 最后,对影像进行裁切,以便下一步处理。

2 水体识别模型

2.1 新型水体指数构建

2.1.1 水体光谱特征分析

由于各类地物不同的光谱特征,在影像上反映出不同的综合特征,构成地物解译与信息获取的基础。

水体在可见光范围内的反射率随波长的增加而逐渐降低,在蓝光波段反射率较高,波长达到近红外波段时,水体反射率接近0,而植被、干土壤等的反射率曲线变化趋势与此相反,在蓝光波段呈强吸收和近红外波段呈强反射的特点,基于此为水体信息的获取提供了可能。通过理论研究结果进行实地调查可以确定研究区水体类型及附属地物为深水区、浅水区、盐碱地、裸岩、湿地、沙地、戈壁和积雪等,水体提取主要是浅水区边界和其附属地物的区分,从而高质量提取。

2.1.2 RSWI构建

经试验分别统计不同地物在高分六号WFV数据各波段中反射率的值,结果如图2所示。由图2可知,浅水区水体受湖底沉积物的影响,呈较高的反射率,整体高于深水区水体; 积雪光谱曲线变化趋势虽与浅水区水体相似,但与其他地物光谱曲线分离性较大; 湿地与浅水区水体在红光波段存在相交,异物同谱现象明显,难以区分,盐碱地、裸岩、沙地和戈壁4类地物光谱曲线变化趋势相似,但是这些地物均在红边2波段与水体分离性较大; 水体在蓝光波段和绿光波段的反射率整体高于红边1和2波段的反射率,尤其在红边2波段相差最大,而盐碱地、裸岩、沙地、湿地和戈壁等地物正好相反。通过大量实验证明,当红边2波段反射率扩大2倍时,水体与其他背景地物相差最大。利用上述特征构建新型水体指数RSWI,模型公式为:

图2 典型地物反射率曲线

(1)

式中:RSWI为红边水体指数;B1,B2和B6为高分六号WFV数据第1,2和6波段的反射率。当RSWI≥C时为水体,C为新型水体指数的经验性阈值。

2.1.3 RSWI决策树模型提取水体流程

考虑到积雪与浅水区水体反射率特征相似,且蓝光波段和绿光波段的反射率也整体高于红边2波段,利用RSWI无法将其区分,但积雪具有高反射的特点,与其他地物差异明显,可引入单波段并结合RSWI构成决策树的逻辑运算,剔除此类地物的影响。RSWI决策树模型提取水体流程见图3。

图3 RSWI提取水体流程

提取水体具体步骤为: ①通过高分六号WFV数据近红外波段的阈值剔除积雪,提取水体及其他地物信息; ②在图像上随机采集60个水体样本和60个非水体样本信息,统计其光谱信息,并结合直方图反复证实水体阈值范围,设定合理阈值,保证最大程度上不漏提水体信息; ③利用构建的RSWI,确定阈值,提取水体信息,并对结果做二值化处理,使其与背景分离。

2.2 其他水体提取模型

为分析验证RSWI的可靠性,本文选取了其他几种常见水体提取模型,包括单波段阈值法[20]、NDWI和MSWI,计算公式分别为:

B4

(2)

(3)

(4)

式中:B4为高分六号WFV数据的近红外波段的反射率;T为单波段阈值法的经验性阈值。

3 结果分析与验证

首先,利用提出的模型进行水体提取; 然后,为了达到更高精度运用直方图法对结果优化,将RSWI与其他模型水体提取结果进行对比分析; 最后,以目视解译提取结果作为验证数据,通过结果分析得到基于高分六号WFV数据的水体提取效果。

3.1 水体提取及结果分析

利用本文提出的模型与NDWI,MSWI和单波段阈值法在卓乃湖的初次提取结果如图4所示。为了水体提取达到更好精度,首选利用直方图反复确认水体范围,以确保最大程度上不漏提水体信息,获取研究区的RSWI,NDWI,MSWI和单波段阈值法的阈值分别为0,0.11,0.32和0.04(图5),再对4种水体提取模型提取结果做二值化处理,除单波段阈值法小于阈值的像元为水体外,其余水体模型均大于或等于阈值的像元为水体,小于阈值的像元为非水体,水体和非水体像元分别赋值为1和0,不同水体模型提取结果如图6所示。

(a) RSWI(b) NDWI(c) MSWI(d) 单波段阈值法

(a) RSWI(b) NDWI(c) MSWI(d) 单波段阈值法

(a) GF-6 WFV(b) RSWI(c) NDWI

(d) MSWI(e) 单波段阈值法

分析图6可知,4种水体提取模型均能较好地提取水体边界,提取结果大致相似,但存在细节差异。4种水体模型提取结果中,MSWI提取结果误差最大,由于湖泊浅水区域,受湖底沉积物的影响,水体反射率增高,设置阈值时,阈值过大无法将其与小斑块盐碱地进行区分,阈值过小出现漏提,从而导致提取结果不理想,根据单波段影像灰度直方图,当阈值设定为0.32时,水体信息虽能达到较好的提取效果,但仍受复杂湖底影响,导致水体漏提现象。与MSWI相比,单波段阈值法提取效果虽有所改善,但仍受限干扰地物影响,无法完整提取水体信息。而RSWI和NDWI提取结果较为相似,均优于单波段阈值法和MSWI,但NDWI仍然无法区分反射率较高的浅水区水体和盐碱地,导致部分浅水区水体漏提。RSWI能有效抑制湖底沉积物和盐碱地等的影响,但与积雪等高亮地物无法区分,导致将一些高亮地物误提为水体,因此在实验过程中,考虑引入近红外波段作为补充,来剔除高亮地物,从而提高水体提取精度。

3.2 精度验证

为了定量评价近红外波段和RSWI构成的决策树水体提取模型的精确度和可靠性,需要对水体提取结果进行精度评价。水体提取精度主要体现在水陆边界上,以同一时期Google Earth影像作为辅助数据,沿水陆边界选取水体和非水体的样本点,采用混淆矩阵计算的总体精度和Kappa系数定量评价不同水体模型的提取效果,计算结果见表2。

表2 基于不同水体模型提取结果精度评价

由表2验证结果可知,RSWI水体指数与近红外波段构成的决策树水体提取模型总体精度较为理想,Kappa系数效果较好。RSWI决策树模型的总体精度和Kappa系数均高于其他3种水体提取模型,RSWI决策树模型的总体精度和Kappa系数分别为93.78%和0.87,较NDWI提高了1.37百分点和0.02,较MSWI和单波段阈值法分别提高了12.44百分点、0.23和3.23百分点、0.06。其次为NDWI和单波段阈值法,与RSWI决策树模型相比,NDWI和单波段阈值法对浅水区水体敏感性较弱。MSWI提取效果最差,总体精度和Kappa系数最低。

综上所述,RSWI和近红外波段构成的决策树模型提取精度最高,NDWI和单波段阈值法提取精度次之,NDWI和单波段阈值法对浅水区水体敏感性较差,MSWI提取精度最差。可见,本文提出的RSWI决策树模型能有效抑制复杂湖底沉积物和盐碱地等地物对水体提取时的干扰,总体精度较高,提取效果较为理想,在基于国产高分六号WFV数据进行干旱区水体信息提取具有明显优势。

4 RSWI普适性分析

为了验证RSWI水体提取模型的稳定性与普适性,从定量、定性及不同方法对比多角度进行验证。

4.1 定性验证

首先从区域上选取可可西里地区不同类型面积大于100 km2的6个典型湖泊,包括可可西里地区的太阳湖、可可西里湖、库赛湖、加德仁错、多格错仁错及西金乌兰湖进行RSWI的普适性分析,利用4种水体提取模型分别对6个不同类型的湖泊进行水体提取,提取结果见表3。分析表3可知,RSWI,NDWI,MSWI和单波段阈值法这4种水体模型整体提取结果大致相同,均能较好地提取水体信息,但明显存在细节差异,需要从纵向和横向变化进行验证。

表3 不同水体模型提取水体结果对比

(续表)

1)从纵向分析,从淡水湖到微咸水湖和咸水湖再到盐湖,湖水含盐量增加,湖底沉积物由简单变复杂,受湖底沉积物和湖水性质的影响,4种水体提取模型对不同类型湖泊的适应性不同。4种水体提取模型对淡水湖均有较强的适应性,提取结果差异性较小,但随湖水含盐量增加,4种水体提取模型对不同类型湖泊表现出适应性的差异。其中MSWI对不同类型湖泊的适应性最差,NDWI和单波段阈值法对不同类型湖泊的适应性次之,而本文提出的RSWI水体提取模型能有效抑制湖水性质的影响,对不同类型湖泊都具有较好的适应性。

2)从横向分析,MSWI提取效果最差,提取水体区域偏小,单波段阈值法虽能较好地提取水体信息,但受湖底沉积物和湖水性质的影响,导致部分水体区域漏提,如多格错仁错西部浅水区水体; NDWI和RSWI提取效果最好,两者虽提取结果相似,但NDWI对复杂湖底沉积物的敏感性较弱,无法区分浅水区水体和湿地,出现过提现象,而RSWI水体提取模型能有效抑制湖底沉积物和湖水性质的影响,因此能有效地识别浅水区水体; 此外,从库赛湖提取结果可知,NDWI提取结果受高亮地物影响,误将积雪提为水体,而RSWI和MSWI均结合单波段阈值法构成了决策树模型能有效剔除积雪等高亮地物对提取结果的影响。

4.2 定量验证

为了更加深入地分析RSWI水体模型的普适性,同样以同一时期Google Earth影像为辅助数据,分别对6个不同类型的湖泊沿水陆边界选取水体和非水体样本作为真实地面数据,利用混淆矩阵计算RSWI,NDWI,MSWI和单波段阈值法分别对太阳湖、可可西里湖、库赛湖、加德仁错、多格错仁错及西金乌兰湖提取水体结果的总体精度和Kappa系数,结果见表4。分析表4可知,4种水体提取模型对淡水湖的提取结果误差最小,总体精度最大差值仅为3.39百分点,但随湖水含盐量增加,这一差值增大; 6个湖泊水体提取结果中,RSWI的总体精度和Kappa

表4 不同类型湖泊水体提取结果精度评价

系数均为各水体提取模型最高,其次为NDWI和单波段阈值法,而MSWI提取精度最差。

综合分析表明,本文提出的RSWI水体提取模型整体精度较好,对不同类型的湖泊具有较好的稳定性和普适性,因此本文提出的水体模型可用于高分六号可可西里地区湖泊水体提取。

5 结论与讨论

本文以可可西里地区的卓乃湖、太阳湖、可可西里湖、库赛湖、加德仁错、多格错仁错及西金乌兰湖为研究对象,利用高分六号WFV遥感影像,通过分析不同地物在高分六号WFV数据各波段中的反射率差异,构建了一种新型水体指数RSWI,并结合单波段阈值法,引入近红外波段,提出了一种决策树水体提取方法。利用样本数据,对RSWI,NDWI,MSWI和单波段阈值法分别建立混淆矩阵进行精度评价,验证RSWI提取水体信息的可行性。主要结论如下:

1)通过对比高分六号WFV的RSWI,NDWI,MSWI和单波段阈值法4种湖泊水体识别模型的提取结果,结果表明: MSWI提取结果误差最大; 单波段阈值法相比MSWI提取效果有所改善,但仍受湖底沉积物影响较大; RSWI和NDWI提取结果较为相似,提取效果较好,但NDWI对浅水区水体敏感性弱,无法准确识别浅水区水体,导致部分浅水区水体漏提,而RSWI对浅水区敏感性较强,能够有效抑制湖底沉积物的影响,但RSWI受高亮地物的影响,因此结合单波段阈值法作为补充,从而有效地提高了水体提取精度。

2)通过利用混淆矩阵获得的总体精度和Kappa系数对4种模型进行精度评价,结果表明: RSWI和近红外波段构成的决策树模型提取精度较为理想,总体精度和Kappa系数分别为93.78%和0.87,均高于其他3种水体提取模型; NDWI和单波段阈值法提取精度次于RSWI,但高于MSWI,MSWI提取精度最差。

3)选取可可西里地区不同类型的6个湖泊,进一步分析RSWI的可行性和普适性,结果表明: RSWI水体提取模型整体精度较好,总体精度和Kappa系数均高于NDWI,MSWI和单波段阈值法,对不同类型的湖泊具有较好的稳定性和普适性。

本文提出的RSWI水体提取模型能有效识别浅水区水体信息,为水体监测提供了新的数据源和技术支撑,但本研究仅使用了单一数据源,受限于高分六号WFV数据的空间分辨率(16 m),提取结果仍然受混合像元的影响; 此外未能获取不同时相遥感影像进行时空对比,结论具有一定局限性。因此,采用高分辨率多源卫星资料提取湖泊水体面积及湖岸线,探究此方法基于不同时相遥感影像的普适性将是今后工作研究的重点。

猜你喜欢

反射率湖泊波段
利用镜质组反射率鉴定兰炭与煤粉互混样的方法解析
商品条码印制质量检测参数
——缺陷度的算法研究
车灯反射腔真空镀铝反射率研究
最佳波段组合的典型地物信息提取
湖泊上的酒店
基于地面边缘反射率网格地图的自动驾驶车辆定位技术
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术
奇异的湖泊