APP下载

基于特征分组融合的可识别分析

2019-11-29云红全明德烈

计算机与数字工程 2019年11期
关键词:识别率直方图决策树

黄 霄 云红全 徐 力 鞠 雯 明德烈

(1.华中科技大学自动化学院多谱信息处理技术国家级重点实验室 武汉 430074)(2.宇航智能控制技术国家级重点实验室 北京 100854)(3.北京航天自动控制研究所 北京 100854)

1 引言

在高分辨率遥感图像中,目标拥有丰富的特征信息,这为基于遥感图像的目标可识别性分析提供了可能。一般而言,遥感图像的目标主要分为线性目标、复杂结构目标和团块目标[1]。由于不同的目标类型以及对目标描述方法的不同,其所得到的特征在识别性能上也有很大的差异。为了克服单一特征在识别性能上的片面性和局限性,文献[2]将形状和颜色两种特征进行了组合应用;文献[3]融合了颜色、纹理以及GIST 等特征,这些改进都在一定程度上提高了算法的性能。

为综合各类型特征的优势,实验以分组融合的方式同时应用Gabor、LPQ、HSV、LBP、GIST、HOG 6种特征,并进行特征层面和分类器层面的融合以提高可识别性分析的性能。考虑到高分辨率遥感图像各类目标之间差异较大,本文将主要对遥感图像中的团块目标(飞机、车辆、船舶等)的可识别性展开研究。

2 特征融合

2.1 基本特征提取

1)HSV颜色直方图

HSV颜色特征可以比较直观地描述图像内容,是遥感图像的一个重要认识特征,有着众多的实践与证明[4]。HSV 颜色空间是一种基于感知的颜色模型,它把图像颜色信息分为三个属性:色调、饱和度和亮度。为实现HSV 颜色直方图特征的提取,需将图像从RGB 转换到HSV。对三个分量执行非等间隔的量化:根据人类视觉的辨别能力,将色调空间分为8 区间,饱和度和亮度均分为3 区间。然后根据色彩的不同范围和主观色彩感知执行非等间隔的量化,最后统计其的直方图分布,完成HSV颜色直方图特征的提取。

2)Gabor纹理特征

Gabor小波核函数具有与人类大脑皮层简单细胞的二维反射区相同的特性,它能够捕捉对应空间尺度、空间位置及方向选择性等局部结构信息,在计算机视觉和图像分析领域得到广泛的应用[5]。Gabor 滤波器[6]是一个由二维高斯函数衍生出的复数域正弦曲线函数,相当于一组带通滤波器,由其获得的Gabor 纹理特征是一种不依赖于颜色或亮度的视觉特征,具体提取方法如下:使用5个尺度8个方向的Gabor 滤波器对原始图像进行Gabor 变换,可以形成40幅图像纹理表示,再计算这40幅图像的均值和方差从而得到一个80维的特征向量。

3)LBP纹理特征

LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子,它具有旋转不变性和灰度不变性等显著的优点,在遥感图像的也有着各种应用[7]。原始的LBP 算子[8]定义为在3*3 的窗口内,以窗口中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3*3 邻域内的8 个点经比较可产生8 位二进制数,其十进制值即为该像素点的LBP值。特征描述中,以直方图的形式统计出每个像素点的LBP 数值,并将其作为整幅图的LBP 纹理特征向量。

4)LPQ纹理特征

LPQ 算子是一种具有模糊不变性的纹理特征描述算子。对于图像f(x),M×M 领域Nx采用离散的短时傅立叶变换[9],如式(1)所示:

其中u表示频率。

局部傅立叶系数通过4 个频点u1=[a,0]T,u2=[0,a]T,u3=[a,a]T,u4=[a,-a]T来计算,a 表示很小范围,a=1/M.对于每个像素位置,通过向量表示。

傅立叶系数相位可以通过每个部分的实数和虚数的符号来表示。

其中gj是向量G( x )=[Re{ F ( x )},Im{F(x)}]的第j个部分。然后qj对其进行二进制编码,如式(4)所示:

经过LPQ 算子运算后形成LPQ 图像,然后转化成LPQ直方图,将其作为特征的表达。

5)HOG形状特征

方向梯度直方图(Histogram of Oriented Gradient,HOG)特征[10]是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。HOG 特征的主要思想是,在一副图像中,局部目标的表象和形状能够被梯度或边缘的方向密度分布很好地描述,而梯度主要存在于边缘的地方。HOG 特征的提取主要由四个步骤组成:(1)颜色空间归一化;(2)梯度计算;(3)梯度方向直方图;(4)重叠块直方图归一化,最后获得HOG特征。

6)GIST视觉特征

GIST 特征[11]用以实现对该信息的客观描述。该特征模拟人的视觉,形成对外部世界的一种空间表示,捕获图像中的上下文信息。GIST 特征的实现过程如下:(1)通过多尺度多方向Gabor 滤波器组对场景图像进行滤波;(2)将滤波后的图像划分为n×n 的网格;(3)各个网格采用离散傅里叶变换和窗口傅里叶变换提取GIST 特征;(4)将第(3)步中每个网格中产生的特征值级联起来,就得到了整幅图像的GIST特征。

2.2 基于优势互补的特征分组

1)Gabor_LPQ

Gabor 纹理特征和LPQ 纹理特征都是对图像纹理的描述。Gabor 纹理特征,在提取目标的局部空间和频率域信息方面具有良好的特性,但存在全局表征能力弱以及特征数据维数冗余的问题。LPQ 纹理特征,可对整个图像的轮廓进行描述,具有良好的识别结果。

考虑到Gabor 滤波器的局部优势及LPQ 算子的整体能力,因此联合Gabor 纹理特征和LPQ 纹理特征实现互补,完成目标可识别性分析[12]。如图1所示。

图1 Gabor_LPQ特征处理

2)LBP_HSV

LBP 特征是基于灰度空间的图像局部纹理特征描述算子,它不随灰度尺度的变化而变化,在不同光照的影响下鲁棒性好,具有良好的灰度不变性和旋转不变性等优点。

HSV 颜色直方图是基于HSV 空间的全局特征,特别适用于难以进行自动分割的图像,与LBP特征相比具有全局性的特点。

3)HOG_GIST

HOG 提取的是图像局部轮廓特征,由于它在图像的局部细胞单元上进行操作,所以它对图像几何形变和光学形变能保持良好的不变形,这能很好地应用到对于物体的检测。GIST 提取的是图像的全局特征,二者有一定的互补。

图2 HSV_LBP特征处理

3 特征分组融合算法

3.1 分类器算法

1)Adaboost分类器

AdaBoost 是一种迭代算法,它被评为数据挖掘十大算法之一[13],其核心思想是针对同一个训练集训练不同的分类器,即弱分类器,然后把这些弱分类器集合起来,构造一个更强的最终分类器[14]。

算法本身是改变数据分布实现的,它根据每次训练集之中的每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改权值的新数据送给下层分类器进行训练,然后将每次训练得到的分类器融合起来,作为最后的决策分类器。

2)决策树算法

决策树(decision tree)是一种基本的分类与回归方法。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。其主要优点是模型具有可读性,分类速度快。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型。预测时,对新的数据,利用决策树模型进行分类。决策树学习通常包括3 个步骤:特征选择、决策树的生成和决策树的修剪。

决策树算法很多,例如:ID3 算法[15]、C4.5 算法、CART 算法等。这些算法均采用自上而下的贪婪算法,每个内部节点选择分类效果最好的属性来分裂节点,可以分成两个或者更多的子节点,继续此过程直到这棵决策树能够将全部的训练数据准确的分类,或所有属性都被用到为止。

3.2 算法步骤

特征分组融合的可识别性分析实验主要包括学习阶段和预测阶段,其主要步骤如下:

1)学习阶段

(1)选定正负样本:选取具有飞机、车辆以及船舶等团块目标的图片作为训练的正样本,选取无团块目标的随机图像作为训练的负样本。正样本数为2400个,负样本数为2400个,并以此作为训练集数据;

(2)针对训练集分别提取Gabor、LPQ、HSV、LBP、GIST、HOG等特征,训练并获取相应的特征组Adaboost分类器;

(3)将分类器模型应用于测试数据,计算并保存其预测模型中间值,每个测试数据对应三个分类器的中间值P1,P2,P3,并以此作为其属性描述;

(4)将分类器的预测中间值P1,P2,P3作为决策树算法的输入属性进行训练,获得Gabor_LPQ、HSV_LBP、GIST_HOG三个分类器的融合规则。

2)预测流程

(1)提取待分析图像的Gabor_LPQ 特征、HSV_LBP特征、GIST_HOG特征;

(2)针对不同的特征使用相应的Adaboost分类器计算预测中间值;

(3)将获得的预测中间值运用Gabor_LPQ、HSV_LBP、GIST_HOG 三个分类器的融合规则进行预测,获得对应的结果。

图4 训练流程图

图5 预测流程图

4 实验结果及分析

识别率是正确识别样本数与样本总数的比值,是衡量识别算法性能的最重要指标。实验通过分别提取Gabor、LPQ、HSV、LBP、GIST、HOG 等6 种特征,并将其得到的识别率与Gabor_LPQ、HSV_LBP、GIST_HOG 等3 种融合特征的识别率进行对比,分析特征融合对识别率的影响。然后,在此基础上,将三种融合特征分类器的分析结果与三种分类器融合的结果进行对照分析,得到分类器融合对识别率的提升效果。

利用单个特征进行Adaboost 学习和分类预测的结果如下图所示,其中横轴表示迭代的轮数,纵轴表示当前分类器在测试集上的识别正确率,实验过程中用到了三种Adaboost 方法,分别为Gentle Adaboost、Modest Adaboost以及Real Adaboost。

图6 Gabor adaboost迭代提升图

图7 LPQ adaboost迭代提升图

图8 HSV Adaboost迭代提升图

图9 LBP Adaboost迭代提升图

图10 GIST Adaboost迭代提升图

图11 HOG Adaboost迭代提升图

通过分析可知,Gentle Adaboost 和Real Adaboost 的适应能力较强,性能比Modest Adaboost 更稳定,以下对比实验将仅使用Real Adaboost方法进行。

为了进一步分析特征组合对识别率的影响,分别将Gabor 和LPQ 特征,HSV 和LBP 特征,GIST 和HOG 特征进行融合,然后选用Real Adaboost 方法实现训练学习。如图12~14 所示,分别为Gabor_LPQ、HSV_LBP、GIST_HOG 融合特征迭代训练提升图。

图12 Gabor_LPQ融合特征迭代训练提升图

图13 HSV_LBP融合特征迭代训练提升图

图14 GIST_HOG融合特征迭代训练提升图

通过分析可知,三组融合特征得到的识别率均高于利用单一特征进行学习的识别率,即得到结论:基于优势互补的特征融合有利于提高Adaboost算法的识别率。

最后,使用CART 决策树算法将Gabor_LPQ、HSV_LBP、GIST_HOG 三个分类器进行融合,并把得到的分析结果与上述实验进行对比。表1 记录了6 个单特征和3 组分组融合特征使用Real Adaboost方法时,第200轮以及迭代过程中最高的识别率。最后一行的数据为已得的三个分类器进行CART融合时在同一测试集上的识别率。

表1 单个、分组以及分类器融合识别率对比表

5 结语

实验结果表明,基于多特征分组融合的可识别算法的识别率高于单特征或组合特征判别算法,该算法能够同时综合Gabor_LPQ、HSV_LBP、GIST_HOG 特征的优点,将目标识别率提高到97%以上。

猜你喜欢

识别率直方图决策树
ADC直方图分析在颈部淋巴结转移性鳞癌鉴别诊断中的价值
基于差分隐私的高精度直方图发布方法
简述一种基于C4.5的随机决策树集成分类算法设计
档案数字化过程中OCR技术的应用分析
例析频率分布直方图
中考频数分布直方图题型展示
决策树学习的剪枝方法
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别
人工智能现状和发展