APP下载

基于Gabor特征的稀疏表示纹理分割研究

2015-05-29蒋宏骏纪则轩孙权森

现代电子技术 2015年10期
关键词:稀疏表示

蒋宏骏+++纪则轩+++孙权森

摘 要: 稀疏表示和字典学习在图像去噪、图像重建和模式识别等应用上取得了良好的效果,其利用稀疏系数和重构误差来作为模式分类的判别准则。稀疏表示纹理分割方法是将图像分割问题转换为像素点的分类问题。但通常稀疏表示分类方法是基于图像块特征,难以准确表征图像纹理信息。为了解决上述问题,提出基于Gabor特征的稀疏表示纹理分割方法。因为Gabor特征对图像纹理信息的鲁棒性,算法首先从每类纹理中选择一些像素点作为训练样本,计算其不同尺度和方向下的Gabor特征,将其作为初始化字典,通过判别性的字典学习算法(D?KSVD)更新字典,该字典学习算法在KSVD基础上使得字典更具有类别判别能力,最后以待分割图像的每个像素点作为测试样本,计算其Gabor特征。利用OMP算法得到测试样本在字典下的稀疏系数,根据稀疏系数得到类标签,进而对像素点进行分类,完成分割。通过在Brodatz纹理库上的实验结果表明,该方法有效提高了稀疏表示算法对纹理图像分割的正确率。

关键词: 稀疏表示; 字典学习; D?KSVD; Gabor

中图分类号: TN919?34 文献标识码: A 文章编号: 1004?373X(2015)10?0073?05

图像分割是由图像处理进到图像分析的关键步骤,也是一种基本的计算机视觉技术。纹理作为物体表面的固有特征之一,是人们区分不同物体的重要因素,纹理可以提供图像区域的平滑、稀疏、规则等特性。例如医学图像中包含大量的纹理信息,不同部位、相同部位不同病灶的图像纹理存在一定差异。又如遥感图像中不同地貌呈现的纹理差异也很明显。

稀疏表示问题源于Bruno A.Olshausen和David J.Field在《NATURE》上提出的自然图像的稀疏编码理论[1]。其理论表明自然图像的稀疏编码,类似于哺乳动物初级视觉的简单细胞的工作原理。近年来,稀疏表示在模式识别中也得到了很好的应用。例如稀疏表示分类算法[2](SRC)方法,它直接将训练样本作为字典,通过判断测试样本的相应特征与训练字典中的各类系数重建结果的误差来完成识别。SRC方法在人脸识别领域获得了很好的应用。在SRC方法的基础上,国内外一些学者通过增加不同类别子字典的约束条件,使其更好地进行模式识别。文献[3]和文献[4]通过增加不同类子字典的不相关约束条件使每类的子字典尽可能相互独立。文献[5]提出的FDDL方法在字典学习中加入Fisher判别准则,来提高字典的判别能力。文献[6]提出的D?KSVD方法通过增加训练样本预标签,与监督学习相结合,使得字典学习具有类别判别能力。上述方法在人脸识别等模式识别应用上取得了很好的识别性能,但其研究重心都是基于图像块的灰度特征。在人脸识别中,图像块特征可以较好地表示人脸的全局信息,但其在纹理分割应用难以准确表示纹理的局部信息。

针对上述问题,本文提出一种基于Gabor特征的稀疏表示分割方法。该方法通过对训练样本增加预标签,将稀疏表示过程与有监督学习过程相结合,使得字典学习具有类别判别能力。同时考虑到Gabor特征较好地模拟了人类视觉系统的视觉感受,是一种强大的纹理特征提取方法,其很好地表示图像的纹理信息。所以将Gabor特征引入稀疏表示分类方法中,以提高算法的识别率和鲁棒性。本文对Brodatz纹理图像进行分割实验,将图像块像素的灰度级联为特征做对照实验。实验结果表明基于Gabor特征的稀疏表示分割方法进一步提高了分割效果。

1 相关工作与背景

1.1 稀疏表示

1996年Bruno A.Olshausen和David J.Field在《NATURE》上首次提出了自然图像的稀疏编码[2],其很好地解释了哺乳动物初级视觉的简单细胞工作原理。稀疏表示是指,对于一个给定信号或图像Y,其在一组过完备基D上有一个稀疏的表示。它的形式如下:

[Y=Dα, D∈Rm×n, m?n] (1)

稀疏表示问题就是要求解向量x,使x的非零项尽可能少。问题定义如下:

[minα0 s.t. Dα=Y] (2)

该问题是0范数最优化问题。1997年Gorodnitsky和Rao证明了在[σ(D)≥2α0]条件下,式(2)有惟一解[7],[σ(D)]为最小的线性相关的列向量所含的向量个数,但上述问题仍是个NP问题。2006年Candes和Tao证明了当满足条件RIP,0范数最优化问题与1范数问题的解一致:

[minα1 s.t. Dα=Y] (3)

而1范数优化问题是凸优化问题,故有惟一解。当引入重建误差[ε],式(2)可以写成:

[minY-Dα22+λα1 s.t.α

1.2 稀疏表示分类

稀疏表示分类方法是基于测试样本可以表示为训练样本的加权线性组合这一先验。假设有c个类别,字典为D=[D1,D2,…,DC],其中Di 为第i类子字典,其由第i类训练样本组成。

通过1范数对测试样本y进行稀疏表示:

[α=argminxy-Dα22+λα1] (5)

计算第i类的重构误差:

[riy=y-Dδiα2] (6)

[δiα]仅保留稀疏向量[α]中第i类的系数。最后通过公式(7)进行分类。

[identityy=argminiriy] (7)

1.3 字典学习

通过字典学习,可以使得字典对信号或图像具有更强的表示能力,减少重构误差。通常对于一个信号或图像,需要通过字典学习算法来获得其完备字典。常用的字典学习算法有MOD[8]、K?SVD[9]、online[10]算法。

K?SVD算法是求解如下最优化问题:

[minD,αY-Dα2F s.t.?i,xi0≤T] (8)

K?SVD算法步骤如下:

输入:数据样本[Y=y1,y2,…,yN∈Rd×N]

列规范化的初始字典[D=d1,d2,…,dk∈Rd×k]

Step1:稀疏编码,利用OMP算法求解以下优化问题:

[minαy-Dα22+λα1 s.t.α

Step2:字典更新,对于字典中的每一个原子[dk]和相应的稀疏表示系数[αk],求解以下优化问题:

[argmindk,αkEk-dkαk2]

式中[Ek=Y-i≠kdiαi]为误差矩阵。通过SVD求解这个一阶近似问题,使得[UΔVT=SVDEk],更新[dk]成U的第1列,更新[αk],成V的第1行乘以[Δ1,1],即:

[dk′=U:,1,αk′=Δ1,1V1,:]

Step3:返回Step2,直到收敛。

1.4 判别字典学习

文献[7]提出的D?KSVD方法,并将该方法应用于人脸识别问题。但是K?SVD算法在字典学习过程中只考虑了重建误差和稀疏度,如果仅根据其重建误差和稀疏度来进行分类,效果并不理想。D?KSVD在K?SVD算法基础上加入了线性分类器[H=Wα+b],根据经验风险最小化理论,该分类器应该满足:

[W,b=argminW,b=H-Wα-b2+βW2] (9)

式中H中的每1列,hi=[0,0,…,1,…,0,0],只有一个项的系数为1,其位置表示分类结果。

将判别项加入K?SVD算法中,构成以下最优化问题:

[D,W,α=argminD,W,αY-Dα2+γH-Wα2+βW2 s.t.α0≤T] (10)

式中:Y是输入信号;H是其对应的标签;D是字典;W是分类器;[α]是稀疏系数;[γ]和[β]是权重系数。参考K?SVD的字典学习算法,式(10)可以写成如下形式:

[D,W,α=argminD,W,α Yγ*H- Dγ*W*α2+βW2s.t. α0≤T] (11)

由于在K?SVD算法中,字典[ Dγ*W]是规范化的,所以可以省略正则项[W2],从而最优化问题可以简化为:

[D,W,α=argminD,W,α Yγ*H- Dγ*W*αs.t. α0≤T] (12)

在D?KSVD算法中,字典D和相应的分类器W需要联合归一化,归一化字典[D′]和相应的分类器[W′]计算方式如下:

[D′=d1′,d2′,...,dk′=d1d12,d2d22,...,dkdk2W′=w1′,w2′,…,wk′=w1w12,w2w22,…,wkwk2] (13)

2 基于Gabor特征的稀疏表示纹理分割

稀疏表示的分割算法把图像分割问题转换成对图像像素点分类的问题,其关键就是提取合适的特征和构建稀疏表示的分类方法。

D?KSVD算法以大小[n×n]的图像块作为处理单元,图像块所有灰度值作为特征向量。在图像重建和图像去噪中,该特征能有效地表示图像本身,有利于图像的表示。但该图像的灰度特征并没有很强的判别信息,这就导致了在使用图像块的灰度特征进行纹理分割时效果并不理想。而Gabor特征是一种重要的纹理特征提取方法。所以将Gabor特征引入D?KSVD算法进行研究。

基于Gabor特征的D?KSVD算法分可以为两个部分,第一部分是从每类纹理图像选择一些像素点作为训练样本,计算这些像素点的Gabor特征以及样本的类别标签信息,通过D?KSVD算法训练得到Gabor字典G和分类器W。对字典G和分类器W进行归一化,得到[G′]和[W′];第二部分以待分割图像的每个像素点作为测试样本,计算其Gabor特征。利用OMP算法得到测试样本在字典[G′]下的稀疏系数[α],根据[H=W′α]得到测试样本的类别标签。根据类标签对像素点进行分类,最后完成分割。

2.1 Gabor特征提取

2?D Gabor小波变换是一种重要的基于频谱的纹理特征提取方法。Gabor小波变换实现了对纹理图像不同方向和尺度下的特征提取[2]。

假设[fx,y]表示为[M×N]的图像,则该图像的2维离散Gabor小波变换可以定义为:

[I(x,y)=fx,y?hx,y] (14)

式中[Ix,y]是其滤波输出。

[hx,y]是2维Gabor函数,其是一个被复正弦函数调制的高斯函数,可表示为:

[hx,y=gx,yexpj2πUx+Vy] (15)

式中:(U,V)表示特定的空间频率;g(x,y)为高斯函数,可表示为:

[gx,y=12πλσ2exp-xλ2+y22σ2] (16)

式中:[σ]是空间放缩系数,控制滤波器脉冲响应的宽度;[λ]确定了滤波器的长宽比,确定滤波器的朝向。

p个方向和q个尺度的Gabor小波变换分别与图像进行卷积,得到p×q个Gabor图像。Gabor图像中,点(m,n)所对应的值可以反应该位置的能量信息, 但是采用能量信息容易造成分类误差。所以本文采用以(m,n)为中心,大小w×w块的均值和标准差作为纹理特征。尺度为p方向为q的均值和标准差表示如下:

[μp,qm,n=xyIp,qm,nw×wσp,qm,n=xyIp,qm,n-μp,qm,nw×w2] (17)

在稀疏表示框架下,假设用T表示像素点(m,n)的Gabor特征向量,则T可以表示为:

[T=μ0,0,σ0,0,…,μP-1,Q-1,σP-1,Q-1] (18)

Gabor特征向量T的构造流程如图1所示。

2.2 稀疏表示分割

本文将训练样本提取的Gabor特征作为初始化字典。Gabor特征字典G=[G1,G2,…,GC],Gi表示第i类训练样本的Gabor子字典,分割的算法步骤如下所示:

输入:待分割图像I。

(1) 分别对每类纹理随机提取m个像素点作为训练样本X,以图像中每个像素点为测试样本。训练样本的类别标签为H。

图1 提取Gabor特征的流程图

(2) 计算每块的p个尺度,q个方向的Gabor特征。

(3) 用KSVD算法对训练样本X作字典学习,得到字典G和稀疏系数α。

(4) 根据类别标签Ls和系数α、初始化:

[W=αTα+β*E-1*α*H]

(5) 构造[ Xγ*H]和[ Gγ*W]进行D-KSVD字典学习;

(6) 对字典和权值矩阵归一化得到[G′]和[W′],利用OMP算法得到测试样本在字典[G′]的稀疏表示系数[α′];

(7) 根据求得的[α′]计算[l=W′*α′],得到测试样本的类别标签。

3 实验结果与分析

为了证明将Gabor特征引入D?KSVD分类框架方法的有效性,本文对50幅双纹理和三纹理图像进行分割实验。其中图像尺寸为300×300像素,纹理图像由Brodatz纹理图像随机混合而成。Brodatz纹理库包含17类纹理,29张纹理图像,其中12类纹理包含2种光照下的图像。随机选取纹理进行合成。程序运行环境Matlab 2012b, 硬件配置是Intel(R) Core(TM) i5?3230M CPU@2.6 GHz和4 GB内存。实验选择4个尺度、4个方向分别对Brodatz图像进行Gabor变换。每类纹理的训练样本数为100。实验首先对双纹理图像进行分割,图2为其中两组实验的分割结果。图2(a)为Brodatz纹理图像。图2(b)为本文方法的分割结果,图2(c)为基于Gabor特征的SRC算法,图2(d)为SRC算法,图2(e)~(g)分别是图像块大小为3×3,5×5,7×7时的D?KSVD算法。可以看出,不管是SRC方法还是D?KSVD方法,传统的基于图像块特征稀疏表示方法的分割正确率很低,存在明显的错分。引入Gabor特征,极大改善了纹理图像的分割效果。而GD?KSVD与GSRC相比,进一步提高了分割正确率。说明了通过D?KSVD字典学习,字典的判别能力得到了增强。

图2 双纹理图像分割结果比较

此外,还对三纹理图像进行了分割,见图3。从两组分割结果可以看出,本文方法与GSRC算法相比,边缘分割效果更好。

图3 三纹理图像分割结果比较

图3(a)为原始图像,(b)为本文方法,(c)为GSRC算法,(d)为SRC算法,(e)为图像块大小为3×3的D?KSVD算法,(f)为图像块大小为5×5的D?KSVD算法,(g)为图像块大小为7×7的D?KSVD算法。

图4(a)、图4(b)分别为50组双纹理图像和三纹理图像实验分割正确率的结果对比。表3列出了各算法分割正确率的均值及标准差。从中不难看出,基于Gabor特征的稀疏表示纹理分割方法对双纹理图像的平均正确率高达98.49%,三纹理图像的平均正确率为96.65%。比单纯采用图像块特征的D?KSVD方法提高了近20%,而从实验标准差看出,与GSRC算法相比,本文方法稳定性和鲁棒性更好。

图4 双纹理和三纹理图像分割实验

表1 分割正确率比较

4 结 语

稀疏表示和字典学习是近些年来图像领域内研究的热点。多数应用以图像块作为分类的特征。本文提出一种基于Gabor特征的稀疏表示分割方法。在判别字典学习的基础上,引入图像的Gabor特征,在降低字典规模的同时,保证算法的识别率和鲁棒性。本文对双Brodatz纹理和三Brodatz纹理图像的进行分割实验,并与图像块为特征的D?KSVD方法作对照实验。实验结果表明基于Gabor特征的稀疏表示分割效果明显提高。实验结果中以Gabor特征进行纹理分割的边缘存在一定的错分。同时随着类别数的增加,纹理边缘区域的错分概率增加。在不增加字典规模的同时,如何提高字典各类子字典之间的奇异性以及改善算法对纹理边缘的判别能力,将基于Gabor特征的稀疏表示分割方法推广到更多纹理的情况,将是未来工作的重点。

参考文献

[1] OLSHAUSEN B A, FIELD D J. Emergence of simple?cell receptive field properties by learning aspase code for natural images [J]. Nature, 1996, 381: 607?609.

[2] WRIGHT J, YANG A Y, GANESH A, et al, Robust face recognition via sparse representation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(2): 210?227.

[3] RAMIREZ I, Sprechmann P, SAPIRO G. Classification and clustering via dictionary learning with structured incoherence and shared features [C]// Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. San Francisco, CA, USA: IEEE, 2010: 3501?3508.

[4] MAIRAL J, BACH F, PONCE J, at al. Discriminative learned dictionaries for local image analysis [C]// Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. Anchorage, Alaska, USA: IEEE, 2008: 1?8.

[5] YANG M, ZHANG L, FENG X C. Fisher discrimination dictionary learning for sparse representation [C]// Proceedings of IEEE International Conference on Computer Vision. Barcelona, Spain: ICCV, 2011: 6?13.

[6] ZHANG Qiang, LI Bao?xin. Discriminative K?SVD for dictionary learning in face recognition [C]// Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. San Francisco, CA, USA: IEEE, 2010: 2691?2698.

[7] IRINA F G, BHASKAR D R. Sparse signal reconstruction from limited data using focus: a re?weighted minimum norm algorithm [J]. IEEE Transactions on Signal Processing, 1997, 45(3): 600?616.

[8] ENGAN K, AASE S O, HUSOY J H. Multi?frame compression: theory and design [J]. EURASIP Signal Processing, 2000, 80(10): 2121?2140.

[9] AHARON M, ELAD M, BRUCKSTEIN A. KSVD: An algorithm for designing overcomplete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006, 54(11): 4311?4322.

[10] MAIRAL J, BACH F, PONCE J, at al. Online dictionary learning for sparse coding [C]// Proceedings of the 26th International Conference on Machine Learning. Montreal, QC, Canada: ICML, 2009: 689?696.

[11] 胡正平,徐波,白洋.Gabor特征集结合判别式字典学习的稀疏表示图像识别[J].中国图象图形学报,2013,18(2):189?194.

[12] 宋长新,马克,秦川,等.结合稀疏编码和空间约束的红外图像聚类分割研究[J].物理学报,2013,62(4):1?10.

[13] 徐建,常志国,赵小强.以图像分类为目标的字典学习算法[J].现代电子技术,2013,36(2):22?25.endprint

猜你喜欢

稀疏表示
耦合了聚类中心约束项的稀疏表示图像去噪
CSRimpute算法填补效果的正则化参数灵敏度分析
Grouplet变换原理及技术综述
基于字典学习和结构聚类的图像去噪算法研究
分块子空间追踪算法
基于压缩感知的图像融合方法
一种改进的稀疏表示人脸算法
基于稀疏表示分类算法的复合绝缘子憎水性检测方法