APP下载

Log-Gabor系数相关结构及其图像检索应用

2022-09-28李运兰

计算机仿真 2022年8期
关键词:识别率小波高斯

陈 熙,申 柯,李运兰

(1. 贵州师范大学大数据与计算机科学学院,贵州 贵阳 550025; 2. 长沙学院计算机工程与应用数学学院,湖南 长沙 410022)

1 引言

图像特征提取在计算机视觉和模式识别领域扮演着重要的角色,它在视频监控,图像检索,运动检测,远程遥感,生物医学图像分析和人脸识别等方面发挥着重要作用。基于统计的图像特征提取是非常重要的图像特征提取方法,到目前为止,已经有很多统计图像特征提取方法。R. Chellappa等人提出了二维马尔可夫随机场模型的图像纹理分类特征提取方法,所提方法利用马尔可夫随机场模型参数的最小二乘估计作为特征[1]。Jorjandi S等人提出非对称正态拉普拉斯混合模型进行图像统计特征建模[2]。

通过对小波变换系数分布特征构建不同的统计模型也是图像特征描述的一类主流方法。Vasconcelos详细讨论了特征空间中各成分独立性的影响,得出独立性对检索精度有负面影响的结论,因此采用统计模型来建模不同尺度和方向下的小波变换系数的相关性是一种被证明有效的纹理描述方法[3],从而有一些研究人员开展这方面的工作。文献[4]采用金字塔离散小波变换(DWT)对图像进行分解,并用广义高斯分布(GGD)对细节子带系数进行建模。图像之间的相似度匹配采用广义高斯概率密度之间的K-L散度进行计算。考虑到一个高斯模型难于对纹理分布进行准确建模,Hind Oulhaj等人提出了高斯混合模型来刻画复小波变换子带系数的统计特征,其中用最大似然估计方法估计高斯混合模型的参数[5]。Kim和TJ-Kang提出了一种基于小波包帧分解的图像纹理特征提取方法,并对每一自带系数采用高斯混合模型建模,而概率密度函数之间的距离采用K-L散度函数来计算[6]。Tzagkarakis等人提出利用对称α稳定分布对小波细节子带系数进行建模[7],由于一般分布情况下KL散度不存在闭式解,他们采用特征函数代替概率密度函数(PDF)来计算相似性。针对图像纹理分布的倾斜性和非对称性,Matza和Y-Bistritz提出了混合倾斜高斯函数来获得纹理图像的更好的特征向量,其中EM算法被用来估计混合倾斜高斯分布的参数[8]。Yijin Peng等人针对合成孔径雷达(SAR)图像的统计特性,提出了一种基于马尔可夫链蒙特卡罗(MCMC)的伪模拟退火(PSA)估计方法,有效地估计了混合α稳定分布的模型参数[9]。同样的,当纹理分布具有倾斜性和非对称性特点时,倾斜α稳定分布[10]用来建模纹理是一种更合理的办法. 对于具有厚拖尾分布特征的纹理,SRH Shojaei等人提出混合倾斜α稳定分布来进行建模[11]。Li C 等人在2019年指出,不同尺度和方向下的Gabor小波子带系数存在强相关性,然后他们采用copula来建模这种相关性并用于人脸识别,取得了很好的效果[12]。

从上面一系列的研究文献中发现,对小波变换子带系数进行统计建模是图像识别与检索的一条有效途径,但是尽我所知,纹理统计建模时,对图像进行小波变换一般都是采用双树复小波,小波包和Gabor小波等,很少看见采用Log-Gabor小波[13]对图像进行变换,然后对不同尺度和方向下的Log-Gabor小波子带系数进行建模。Field等人指出,使用在对数频率尺度上传递函数为高斯函数的滤波器可以对图像进行更有效的编码,即Log-Gabor函数能更真实的反应自然图像的频率响应[14]。针对Field等人在文献[14]中给出的这一结论,改进了Li C等人的算法[12],把文献[12]中的Gabor变换改为Log-Gabor变换。因为Log-Gabor滤波函数比Gabor滤波函数的频谱更符合自然图像的频谱特征,故在频域来说,Log-Gabor变换后的变换系数更具有自然图像的频谱特征。在所提Log-Gabor系数高斯建模方法中,首先对图像进行Log-Gabor变换,然后不同方向和尺度下的Log-Gabor变换系数采用广义高斯模型进行建模,而所建模型的参数采用期望最大[15]进行估计,模型之间的距离采用K-L散度函数来定义。

2 Log-gabor小波变换及子带系数相关性

2.1 多尺度多方向Log-gabor小波变换

Koviesi在频域中通过采用极性可分离的二维高斯函数构造了二维Log-Gabor滤波器,其由径向分量和角度分量相乘得到[16],所设计的二维Log-Gabor滤波器的频域形式定义为

(1)

u1=ucosθ+vsinθ,v1=-usinθ+vcosθ

其中θ表示滤波器的方向,u0表示滤波器的中心频率,k调节滤波器在u1方向的带宽,σv调节滤波器在v1方向上的带宽。对于多尺度多方向Log-Gabor滤波器而言,需要调整的参数为u0,k和σv。Log-Gabor滤波器无直流分量,因此所以采用Log-Gabor滤波器提取的特征不受光照的影响[17]。另外,Log-Gabor函数的传递函数在高频端有一个延长的尾巴,适合对频谱具有厚拖尾的图像进行编码。图1展示了二维Log-Gabor函数在某一尺度和方向下频域形式的径向分量,角度分量和幅度。图2显示了一幅人脸图像在某一尺度下不同方向的滤波结果的模,在后面的实验中,都是采用Log-Gabor滤波结果的模做实验。

图1 二维Log-gabor的频域形式

图2 一幅人脸图像在二维Log-Gabor滤波后的模

2.2 不同尺度和方向下Log-Gabor小波变换子带系数相关性

正如Vasconcelos等人指出不同尺度和方向下的小波变换系数如果独立的话,则会对检索精度有负面影响[3],所以接下来通过实验检验图像经过Log-Gabor小波变换后不同尺度不同方向下变换系数的相关性。

采用绘制Chi-plot图来观察一对随机变量之间的相关性[18]。设二维随机变量(X,Y)的n个抽样为:(x1,y1),…,(xn,yn),同时假设I(A)是事件A的隶属函数。对于每个样本点(xi,yi),定义如下式子

根据上面式子,计算

Mi=(Hi-FiGi)/{Fi(1-Fi)Gi(1-Gi)}1/2

(2)

(3)

然后在平面上绘制所有的点(Mi,Ni)(i=1,2,…,n),则所绘制的图形就是Chi-plot散点图。这里Mi是随机变量X和Y的一个非参数相关性度量,取值处于[-1,1]之间,如果Y是X的严格单调增函数,则Mi=1,若Y是X的严格单减函数,则Mi=-1。Ni表示样本(xi,yi)到样本集中心位置的距离,其取值也处于[-1,1]之间。如果变量X和Y为独立的连续随机变量,则Ni的取值服从[-1,1]上均匀分布;而当随机变量X和Y相关时,Ni的取值会出现一定的聚集性,表现为散点图会出现聚集性。

记gm,n为一幅图像经过尺度为m和方向为n的Log-Gabor滤波后的模,它是和图像大小相同的一个矩阵。当考察gm,n和gm′,n′的相关性时,其实就是把gm,n中各元素当成一个随机变量v的样本,把gm′,n′中各元素当成一个随机变量v′的样本,考察随机变量v和v′之间的相关性。图3给出了不同尺度和方向下Log-Gabor各子带系数的相关性的Chi-plot图。

图3 一幅人脸图像在二维Log-Gabor滤波后各子带系数相关性的Chi-plot图

3 基于Log-gabor的广义高斯密度估计

3.1 广义高斯分布

很多研究论文表明,广义高斯概率分布比较适合对小波变换系数进行建模[4,19,20]。广义高斯密度(generalized Gaussian density,GGD)函数定义为

(4)

(5)

3.2 基于Log-Gabor和广义高斯概率模型的图像特征提取及匹配

前面介绍了Log-Gabor小波和广义高斯概率模型,在此基础上,进一步介绍设计的基于Log-Gabor和广义高斯概率模型的图像特征提取及匹配方案。此方案可以归纳为如下5个步骤:

1) 假设图像X被均匀分成不重叠8×8子块,这些子块分别表示为X(i)(i=0,1,2,…,63).

2) 假设Log-Gabor有5个尺度k1,k2,…,k5和4个方向θ1,θ2,θ3,θ4。设图像子块的Log-Gabor小波系数为:L(i)(km,θh)=(m=1,2,…,5;h=1,2,…,4;i=0,1,…,63),这里m表示尺度,h表示方向,i表示子块。

3) 对每个子带系数L(i)(km,θh)采用广义高斯概率模型进行建模。将子带系数矩阵L(i)(km,θh)里面的元素当成一个随机变量的样本,此随机变量的概率密度函数为广义高斯概率密度函数,采用期望最大[15]方法估计此广义高斯概率密度函数的参数,假设子带系数L(i)(km,θh)经参数估计后获得的概率密度函数为p(i,km,θh)(α,β)。

(6)

5) 考虑到Kullback-Leiler距离的非对称性,即

将式(6)修改为如下形式

(7)

4 试验与分析

为了验证所提基于Log-Gabor和广义高斯概率模型的图像纹理特征提取及匹配算法的有效性,在二个纹理图像库:USPTex数据库[21]、Brodatz数据库[22]和FERET人脸图像数据库[23]的一个子集上进行了相关测试。此三个数据库中图片都是自然图片,而非人造图片,其频谱分布具有厚拖尾的特征。所提算法与广义高斯模型[4]、基于Copula模型的Gabor小波变换[12]、Log-Gabor直方图[24],正交Log-Gabor方法[25]和Gabor滤波器[28]进行了识别率比较分析。为了直接体现各算法的纹理特征提取能力,采用了比较简单的最近邻分类方法。

4.1 图像数据库

USPTex纹理图像数据库中图片为自然纹理图像,包括生活中各种常见物品,如种子,蔬菜,稻谷,织物,道路,和土壤等。USPTex纹理数据库共有191类彩色纹理图片,每类12张,总计2292张纹理图像。在下面关于USPTex数据库的试验中,选取了100类纹理,每类选取9张图片,每张样本图像都转化成灰度图像,大小调整为128×128像素。图4(a)是该数据库中1种纹理12张图片。Brodatz纹理图像数据库也是一个为研究人员常常采用的自然纹理图像库,采用了其中100类纹理,每类9张图片,每张样本图像都转化成灰度图像,其大小调整为128×128像素。图4(b)是1种Brodatz纹理的9张图片。FERET人脸数据库由美国军方FERET项目创建,此图片库包含大量人脸图像,每张图片中只含有一张人脸。人脸变化覆盖表情、光照、姿态和年龄。数据库包含1万多张人脸图片,是人脸识别领域应用最广泛的人脸数据库之一。从中选择了100个人的图片,每个人7张图片,共700张图片做实验,其中每张图片调整为80×80像素的灰度图片。图4(c)是此数据库中一个人的7张图片。

图4 预处理后样本图像

4.2 累加匹配特性曲线

累加匹配特性曲线常常用来展示生物特征识别系统性能。在计算CMC曲线时,先需要构建一个“Gallery”图库集和一个“Probe”图库集。可以在所用的某个实验图片库中每类图片抽一张出来构建此图片库的“Gallery”图库集,而此图片库中剩余的图片构成“Probe”图库集。比如实验中FERET图片库包含100个人的700张图片,那么每个人挑一张图片构成包含100张图片的“Gallery”图库集,而剩下的600张图片构成“Probe”图库集。CMC曲线的绘制方法在李子青博士撰写的一本人脸识别专著中有较详细的介绍[26],文献[27]中也采用了CMC曲线来衡量识别系统的性能。

图5(a)中,文中所提算法秩1识别率虽然比Copula plus Gabor算法[12]稍低,但是其曲线明显在Copula plus Gabor算法上方,整体性能最好。Copula plus Gabor、广义高斯模型[4]和正交Log-Gabor算法[25]性能接近,而Log-Gabor直方图算法[24]在这几种算法中只比Gabor算法性能稍好。在图5(b)中,所提算法秩1识别率达到56.4%,是所有算法中最好的,而整个曲线也是明显位于其它曲线上方。正交Log-Gabor算法性能比其它几种算法都弱。在图5(c)中,整体而言,六种算法性能差别都不太大,特别是文中所提算法,Copula plus Gabor[12]和广义高斯模型[4]三种算法性能从CMC曲线上看很接近。Log-Gabor直方图算法的性能比正交Log-Gabor算法性能稍差,而Log-Gabor直方图算法的性能比Gabor算法性能稍好。比较以上三个数据库,可以看出,所提算法比其它二种统计方法,即广义高斯模型[4]和Copula plus Gabor[12],性能还是要好。正交Log-Gabor由二个方向相互垂直的Log-Gabor滤波器构成,其性能比Log-Gabor直方图算法性能稍好。

图5 各图像数据库的累加匹配特性曲线

4.3 正确识别率与训练样本集大小的关系

一般来说,图像往往具有光照,角度和遮挡等变化,同一个人或物体,因为光照,角度和遮挡等变化,可能导致类内差别大于类间差别,所以在构建训练样本图像库时,挑选的照片需要覆盖图像的各种变化,从而使得训练图片尽可能体现图像在不同环境下的特点。在测试正确识别率与训练样本集大小的关系时,随机从USPTex纹理库、Brodatz纹理库和FERET人脸库中分别选择1、2、3、4和5张图片构成它们各自的训练库,各图像库中所剩下的为相应的测试图像集,例如从FERET图库中每个人随机选择2张图片,共200张图片,计算每张图片的广义高斯概率密度函数,然后计算剩下的400张图片的广义高斯概率密度函数,用这400张图片的概率密度函数去比对训练用200张图片的概率密度函数,从而得到正确识别率。试验重复5次,各次的平均识别率分别列在表1,表2和表3中。表1、表2和表3中显示了随着训练样本的增加各算法识别率情况。整体而言,随着训练样本增加,各算法的识别性能还是明显增加了。在表1中,看到,几种算法识别率都不很高,这是因为这个数据库是自然纹理图片,同一类图片类内差别很大,而且这里用到的是灰度图片,没有色彩信息,所以识别率不高,在表2中也是有这种情况。表1中数据显示所提算法在五种算法中基本上是最好的,然后Copula plus Gabor[12]次之,Log-Gabor直方图[24]算法是最弱的。表2中数据是几种算法在Brodatz纹理库数据库上测试而来,在该数据库上,所提算法也显示了其优势。表3中数据是在FERET人脸图像库数据库上测试而来,该数据库是一个在人脸识别方面应用非常广的数据库,在该数据库中,当训练样本比较少的时候,所提算法并没优势,但当增加训练样本时,所提算法的识别率比其它几种算法要好。实际中,为了让训练样本具有代表性,一般是每一类图像都多取几个典型训练样本,所以在实际中,所提算法还是具有优势。

表1 USPTex纹理数据库上的平均识别(%)

表2 Brodatz纹理库上的平均识别率 (%)

表3 ERET人脸库上的平均识别率

5 结束语

图像分布建模是图像统计特征提取的一种方法,而图像在变换域的分布建模比在像素域建模一般更加有效。由于自然图像的频谱具有非高斯性,故Log-Gabor变换比Gabor变换更能保持自然图像原始频谱特征。本文提出了基于Log-Gabor的广义高斯模型图像建模的算法。所提算法包括将图像进行不同方向和尺度下的Log-Gabor变换,对Log-Gabor的子带变换系数采用广义高斯模型进行建模,得到代表图像特征的概率密度函数和采用K-L距离函数计算概率密度函数之间的距离这样几个关键步骤。从相关实验中可以得出几个结论:1)图像Log-Gabor不同尺度和方向下的子带系数具有强相关性;2)Log-Gabor函数比Gabor函数更适合进行自然图像统计建模;3)三个数据库上的CMC曲线和识别率证实了所提算法比几种相关的算法具有更好的识别性能。

猜你喜欢

识别率小波高斯
构造Daubechies小波的一些注记
小波去噪算法研究
善用游戏的方式解决手足争端
数学王子高斯
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别
人工智能现状和发展
青蛙历险
从自卑到自信 瑞恩·高斯林