APP下载

基于IHS变换和Mean Shift算法的草地分类研究

2022-10-04赵安琳杨延征

西北林学院学报 2022年5期
关键词:特征向量波段草地

康 乐,陈 伟*,赵安琳,杨延征

(1.国家林业和草原局 华东调查规划设计院,浙江 杭州 310019;2.中国科学院 生态环境研究中心 城市与区域生态国家重点实验室,北京 100085)

影像分析技术在植被覆盖、土地分类等方面的研究越来越普遍[1-4]。为评估放牧场地的发展情况和培育趋势,了解牧场草地的营养价值,牧场管理者需要借助地物分类来估量草地覆盖度。草地分类的研究已有很多,主要体现在大尺度分类上[5-9],分类方法也多种多样,主要包括指标指示法、多元聚类分析法以及监督分类法等[7-12]。

IHS变换在图像融合上的研究很多[13-14],IHS变换的优势体现在两个方面,一是IHS变换能够分离出独立性较强的波段,二是IHS变换后主要波段可以参与其他图像融合方法,进而提升图像融合后的质量。在视觉上定性描述色彩时,采用IHS系统则更为直观[16]。王柳等[17]研究了2种地形图分色方案直接用RGB和IHS进行分色,通过比较2种分色方案的效果,在IHS空间分色的效果较好;沈世旻[18]基于IHS变换进行图像增强提高车牌识别的精度;Mean shift算法在视频跟踪和图像识别方面有广泛的应用[19-21]。郅忠强[22]以颜色特征、纹理特征为Mean shift算法主要参数识别草地内部结构和障碍物,为割草机器人识别草地和障碍物提供了决策支撑;付勇等[23]采用核带宽度自适应调整的Mean shift算法,能够根据物体的移动和大小锁定目标;陈伟等[24-26]采用Mean shift算法对机载点云数据进行森林结构参数提取,提取结果优于其他常规方法[27]。草地分类的方法很多,主要分为监督分类和非监督分类。宏观尺度监测草地类型或草地生物量采用非监督分类较多,并且能够整体客观评价草地相关指标[28-30]。Mean shift算法作为非监督分类方法,具有在草地分类的独特优势,可根据分类的尺度要求,合理调整特征向量和核带宽度,实现更精细化分类。

1 材料与方法

1.1 研究数据

2019年6-9月,对内蒙古草地放牧控制样区进行野外观测工作。观测内容包括草地冠层光谱、草地覆盖度和叶绿素含量等。共获取了230个重复观测的样点数据,样点的分布见图1。结合收集到的2019年Hyperion高光谱数据,开展植被覆盖度与放牧变化监测方面的研究工作。

图1 草地样区230个样点的分布

1.2 原理和方法

Mean shift算法是基于概率密度函数的估算过程,其计算过程就是图像像素根据设定的特征向量向概率密度大的方向聚类,直到函数收敛为止[31]。

对一个概率密度函数f(x),已知d维空间中n个采样点xi(i=1,…,n),f(x)的核函数的估计可以写成

(1)

(2)

式中,mh(x)为Mean shift向量公式。

给定初始点x,核函数G(x)以及容许误差ε,Mean Shift算法将循环执行下面3个步骤,直到满足结束条件:

1)计算mh(x)。

2)把mh(x)赋给x。

特征向量是草地分类的“识别码”,不同类别的地物其特征向量的属性不同。

1.3 图像变换和融合

图像变换和融合的目的是进行图像增强,突出目标地物的波段或特征信息。根据RGB转换IHS颜色空间转换公式,分别转换成I(表示亮度或强度)、H(表示色调)、S单波段图像(饱和度),IHS颜色空间I、H、S具有相对独立性。归一化植被指数(NDVI)是植被生长状态及植被覆盖度的最佳指示因子,公式中表示为NDVI,被认为是全球植被和生态环境变化的有效指标[32-33]。

(3)

式中:NDVI为归一化植被指数,ρNIR为近红外波段的反射值,ρR为红光波段的反射值。

由于RGB图像没有近红外波段,可使用“绿度”指标近似代替NDVI[34]。

(4)

式中:Green为绿度,ρG为绿色波段的反射值,ρR为红光波段的反射值。

1.4 方法设计

由图2可见,对原RGB始影像进行2次计算:一是采用IHS变换得到IHS图像,二是根据绿度计算公式提取绿度波段图像;其次对IHS图像和绿度图像进行波段融合,得到具有四波段的融合图像,为下一步的图像聚类分析提供了丰富的波段信息;然后,确定特征向量和核带宽度,以Mean shift算法对融合图像进行分类;最后对分类结果进行验证和精度评价。

图2 总体技术流程

特征向量和核带宽度是Mean shift算法主要参数,是决定图像聚类质量的关键因素。本研究取融合图像(i,h,s)作为空间特征向量xs,带宽为hs;绿度为植被指数向量x绿,带宽为h绿。采用高斯核函数。以核函数G(x)和带宽h估计密度函数为

(5)

式中:h为核窗宽;C是归一化参数;x为特征向量。

(6)

确定带宽后,利用Mean shift算法进行迭代计算,在迭代过程中可得到多个稳态点(即峰值),把趋向某个稳态点的像素归于一类,并做好标记,最终得到分类结果(图3)。

图3 Mean shift算法流程

1.5 试验验证

Mean shift聚类的计算过程是在Matlab(The math works:natick,MA,USA)平台上进行的。考虑到标准Mean shift算法的运行时间随整个数据集的大小呈指数增长。如果我们直接把Mean shift方法应用到批量图像数据处理,是非常耗时和低效的。因此,为了提高计算效率,有必要采用多进程并行计算方式。

2 结果与分析

2.1 图像变换和图像融合

由图4可见,图4A为原始RGB波段图像,通过绿度公式波段计算得到绿度波段图像(图4B),RGB图像通过IHS变换得到IHS图像(图4C),绿度图像和IHS图像融合得到图像(图4D)。融合后的图像包含了I、H、S和绿度4个波段,草地纹理较为清晰,对比度较强。

图4 图像转换及融合结果

2.2 Mean shift算法分类

基于Mean shift算法对融合图像进行聚类分析,聚类到同一稳态点的像素记为{Ni}。每个Ni包括一类点集,为了区分不同的聚类地物,聚类分割后地物标签标识。图5为土壤、草地、其他3种类型,地物特征比较明显,能够直观分辨出分类后的地物形态。由于试验期间草地常绿,所以草地和土壤能够明显区分,其他类型主要是历年积累在地表的枯死植被,对土壤精准识别有一定的干扰性,但对草地的分类精度影响不大。

图5 对融合图像进行Mean shift分类

2.3 参数与灵敏度分析

Mean shift算法的核半径h以及控制参数都要取合理的值。通过试验发现,核带宽度h=0.3时,Mean shift算法聚类结果变化不敏感,迭代次数和收敛允许误差分别设置在9和0.000 1,该方法对参数的变化不敏感。该方法所使用的具体参数见表1。

表1 试验参数

2.4 图像精度分析

为验证图像分割分类精度,对10个样地的所有草地进行试验。为了定量评估检测结果的准确性,在10个样地将识别的草地覆盖率和实测草地覆盖率进行比较。依据文献[35],真阳性(TP)、假阴性(FN)和假阳性(FP)可分别表示真实草地覆盖率、未识别草地覆盖率和误识别的草地覆盖率。可以用“召回率”(recall,r=TP/(TP+FN)表示地物检测率和“准确率”(precision,p=TP/(TP+FP)表示检测到草地正确性,来评估检测精度[36]。由表2可见,平均召回率为94.5%,平均准确率为95.0%。表3列出了本研究方法与常规Mean shift方法(基于RGB图像)结果比较,显示本方法召回率提高了5.4%,准确率提高5.2%。

表2 草地识别精度

表3 本方法与常规Mean shift算法比较

表4对比其他常规主流方法与本研究方法的聚类分析效果。除了“召回率”(Recall)和“准确率”(Precision)这2个指标外,还使用F值(F-Score)=准确率×召回率×2/(准确率+召回率)(F值即为准确率和召回率的调和平均值)来评价总体检测精度。与其他方法相比,本研究具有更好的总体识别指标,即召回率和准确率都高于其他方法,从F值也能看出总体识别精度较高并且指标稳定。

表4 不同识别方法的精度比较

3 结论与讨论

基于IHS的图形分割结果与地物实际形态比较吻合,采用的Mean shift算法不仅考虑颜色因子,同时也把植被特征因子考虑进去,提高了图像分类的精度。

1)IHS图像三分量具有相对独立性,I可以明显区分阴影与非阴影的类别;H能很好地区别草地与枯草之间的色彩差别,进一步把草分为绿草和枯草,但仅靠H还不能很好地分离出绿草和枯草,还需考虑纹理及I和绿度的阈值范围;S体现了色彩的纯洁性,可提取几何顶点的端元波谱,通过二维散点图量测图像光谱的空间可分离度。

2)绿度是区分植被与非植被的有效指数,也被称为归一化绿红差值指数NGRDI (normalized green-red difference index),可替代NDVI估算草地覆盖度。随着手机拍照和无人机航拍可见光图像的广泛应用,基于RGB绿度计算方式会更便捷,通过与IHS图像融合可进一步加强草地的辨识度及其他地物的可分离性,从而提高估算草地覆盖度的工作效率。

3)Mean shift算法能够很好地区分不同地物类型,但固定Mean shift算法在运行的时候需要不断试验才能达到预期的目标,工作量巨大。自适应Mean shift算法从微观精准识别草地的关键算法,下一步将研究自适应Mean shift在草地分类的应用。

猜你喜欢

特征向量波段草地
Ku波段高隔离度双极化微带阵列天线的设计
最佳波段组合的典型地物信息提取
克罗内克积的特征向量
新型X波段多功能EPR谱仪的设计与性能
高中数学特征值和特征向量解题策略
最佳波段选择的迁西县土地利用信息提取研究
Laughing song
三个高阶微分方程的解法研究
草地
一片草地的述说