APP下载

基于非高斯分布的ICA纹理分类方法研究

2017-04-25涛,张

电子设计工程 2017年8期
关键词:峭度高斯分布特征提取

韩 涛,张 杰

(中国飞行试验研究院 陕西 西安 710089)

基于非高斯分布的ICA纹理分类方法研究

韩 涛,张 杰

(中国飞行试验研究院 陕西 西安 710089)

纹理特征的提取是纹理分析的重要研究内容之一。基于独立成分分析的纹理分类方法中,目前主要选取独立成分分析系数的二阶统计量或频谱直方图作为纹理特征描述。本文根据独立成分分析系数满足非高斯分布的特点,提出了一种新的对野值鲁棒的纹理特征提取方法,该方法较好地描述了独立分量分析系数分布的反对称性和稀疏性,在仿真实验中取得了较好的分类效果。同时针对不同的特征提取方法,利用独立性不同的滤波器研究了滤波器独立性对分类性能的影响,进一步揭示了独立成分分析系数的非高斯性与特征辨识能力之间的关系。

纹理分类;独立成分分析;非高斯分布;独立性

纹理是表征图像的一个重要特征,它广泛存在于各类图像中。纹理图像的分类在图像处理、计算机视觉和模式识别中有着极其重要的作用。纹理分类的一个重要研究内容是纹理特征的提取,期望所提取的特征能有效地刻画纹理结构、辨别不同类别的纹理。目前主要有四类常用的纹理特征表达方法[1]:基于统计分析、基于几何结构分析、基于模型和基于信号处理等方法。其中,基于信号处理的方法又称为基于滤波器组的方法,受到广泛关注,其实质是采用滤波器或滤波器组对纹理图像进行分解变换,获得纹理在不同分辨率或者不同频谱范围内的特征表现[2]。文中所研究的基于独立成分分析的纹理分类方法属于上述的信号处理方法。

针对不同特征提取方法,研究了滤波器独立性对分类性能的影响。利用主成分分析(principal component analysis,简记为PCA)滤波器和独立性不同的ICA滤波器,对比了频谱直方图、偏度、峭度以及本文提出的新函数的特征提取方法对分类性能的影响,进一步揭示了ICA系数的非高斯性与特征辨识能力之间的关系[3]。实验结果表明,ICA系数的非高斯性越强,其对高阶统计量的辨识能力就越强[4]。

1 基于ICA的纹理分类

基于ICA的纹理分类如图1所示,主要包括以下过程:1)从纹理图像中取图像块,通过FastICA算法[5]学习得到一组滤波器构成滤波器组;2)将纹理图像与滤波器组卷积得到特征图像;3)在特征图像中取图像块并描述得到特征向量;4)利用分类器进行训练与测试。

图1 ICA纹理分类框图

1.1 纹理的ICA表示

用x=[x1,…,xM]T表示一幅图像或者图像块按行展开成一个列向量,在ICA中,x可以表示成一些特征或者基函数的线性组合[6]:

式中,ai,i=1,…,N为基函数,是(M×N)的矩阵A的列;s=[s1,s2,…,sN]T表示用基函数A表示x时的系数,其各分量间相互统计独立。这种模型还与视觉系统中冗余度最小的编码策略一致[12]。

利用ICA学习得到基函数A和系数s,即利用训练数据x找到一个线性变换矩阵W使得

式中,分量y之间尽可能统计独立,y是s的估计。矩阵A是W的广义逆。

从Brodatz纹理图像[13]中取图像块,通过FastICA算法学习得到基函数A和独立滤波器W=[w1,w2,…,wN]T。ICA基函数是从训练数据中学习得到,是与训练数据相关,对不同的训练数据会得到不同的基函数[7]。利用ICA学习得到的每个滤波器具有特定的频率和方向特征。利用W能将纹理中的独立分量提取出来,即:ICA的系数s。对系数s作进一步描述就能刻画出纹理的特征,从而达到纹理分类的目的。

1.2 特征图像

将纹理图像与滤波器组中的每个滤波器w1,w2,…,wN分别作卷积:

式中,i表示ICA滤波器wi的通道序号,(k,l)表示空间位置,I表示纹理图像,(*)表示卷积运算,Ui为ICA系数(又称滤波图像或特征图像)。

将原图像与滤波器组进行滤波(卷积)得到滤波图像。如果滤波器组包含N个滤波器,则原图像与滤波器组滤波后,将产生与原图像一样大小的N幅滤波图像。每一个滤波器具有特定的频率和方向特征,响应于特定的纹理特征[8]。这样,原纹理图像中与滤波器相调谐的部分,在滤波图像将产生较强的能量,不相调谐的部分将产生较弱的能量。滤波图像又称为特征图像,特征向量是由每一个特征图像中相应像素值的描述构成的向量。

1.3 特征提取

从N幅特征图像中取某一相同位置的像素点,从该像素点开始得到一特征图像块;描述图像块的特征得到一个或多个特征值;按照滤波器的顺序将特征值串联组成一向量,此向量即为特征向量。图像块的特征可以采用频谱直方图、常规矩的方法以及本文引入的估计方法,详见本文第3节。考虑到去除光照的影响,这里的图像块均已去均值[9]。

从用于训练的纹理图像中得到训练样本的特征向量,从用于测试的纹理图像中得到测试样本的特征向量,然后送到分类器中进行训练与测试。

1.4 分 类

将得到的特征向量用分类器进行分类,用训练样本进行训练,最后用测试样本进行测试。本文采用最近邻分类器。最近邻分类器是采用各类中全部样本都作为代表点[10],将未知样本X判别为与它最近的样本同类。因此,最近邻分类器可在一定程度上克服各类样本均值向量的偏差所造成的影响。

假定有 C个类别 ω1,ω2, …,ωc的模式分类问题,每类的样本数为Ni个,其中i=1,2,…,C。则可以规定ωi类的判别函数为:

其中xki的角标i表示ωi类;k表示ωi类Ni个样本中的第k个样本,按照上式,决策规则可以写为:

2 特征提取方法研究

由于ICA系数满足非高斯分布,不可避免地存在野值。在特征图像中取的图像块不可能非常大,数据量较小。在样本数量有限的情况下,常规矩中的高阶矩对野值极其敏感,它们的值可能只依赖于少数几个可能错误但很大的观测值[11]。同时,高阶矩估计中的幂次较高,远离零的数据对它们的影响,比靠近零的数据对它们的影响要强得多,这样度量的是分布的尾部,基本上不受分布中心附近结构的影响。这意味着,野值或者远离零的数据可能完全确定了矩估计,因而使得这些估计毫无用处。举例来说,假定在一个具有零均值和单位方差的随机变量的1000个样本值中有一个为10,那么峭度最少为104/1000-3=7,也就是说一个单样本可以使峭度变得很大。这样我们可以看到,峭度的值可能只取决于边缘的少量观测值,而这些观测可能是错误的或与问题无关的。换句话说,常规矩估计中的峭度并不是非高斯性的一个鲁棒度量。

为了更好地描述ICA系数的非高斯分布特征,文中提出了一种的新的纹理特征提取方法[12],该方法较好地描述了ICA系数概率密度分布的反对称性(asymmetry)和稀疏性(sparity)。

描述ICA系数概率密度分布的反对称性的度量函数:

描述ICA系数概率密度分布的稀疏性的度量函数:

这两个函数都是光滑的,而且对野值具有鲁棒性。在上面的例子中利用式(7)进行估计,那么峭度的变化量仅为exp(-102/2)/1000=1.9287×10-25≈0,即对整体估计的影响几乎为零。

式(6)用于描述ICA系数的概率密度分布的反对称性,文中将该式作为与偏度相对应的估计。式(7)作为ICA系数的稀疏性度量,可作为峭度的估计。采用ICA系数的方差(公式(5)的第一个式子)、式(6)、式(7)的联合矩来描述ICA系数的概率密度分布特征,这样得到的特征向量更加紧凑,且具有较好的鲁棒性。

3 滤波器独立性对分类性能影响的研究

在ICA滤波器的学习过程中,为了减少计算量,加快ICA算法的收敛速度,采用PCA去除图像的二阶统计特征相关性,其余的高阶统计特征由ICA分离,得到的PCA滤波器组如图2(a)所示。图像经PCA处理后,利用ICA算法得到独立的滤波器。在ICA学习过程中,由于ICA初始化矩阵是随机的,一开始得到的滤波器基本上无结构和方向信息[13]。但随着迭代次数的增多,得到的滤波器的结构和方向信息越来越明显。图2(b)为迭代50步得到的ICA滤波器,表现出多方向性、多频率性。图2(c)为迭代1 000步得到的ICA滤波器,方向性和频率性表现得更加明显。

图2 经PCA以及ICA迭代50、1000次后得到的滤波基(12×12)

基于滤波器组的纹理分类中,使用PCA滤波器得到的系数具有高斯性,而使用ICA滤波器得到的系数具有非高斯性。对于高斯分布,使用均值和方差可以描述分布特征。方差表征信号偏离均值的程度,当均值为零时,反映信号的能量信息[14]。当均值为零时,对于高斯分布使用方差即可描述其分布特征。而对于非高斯分布,特征描述时除了使用均值和方差外,通常还使用偏度和峭度这样的高阶统计量来描述。

我们的实验结果表明:采用方差或者频谱直方图作为特征提取方法时,使用PCA滤波器和ICA滤波器的实验结果相近;采用偏度和峭度这些高阶统计量提取特征时,使用ICA滤波器明显优于PCA滤波器。而且ICA系数的非高斯性越强,其对高阶统计量的辨识能力就越强[15]。采用系数的高阶统计量时ICA滤波器具有明显的优势,且采用方差,偏度和峭度的联合矩获得的效果最理想。

4 仿真实验

图4的横轴为利用ICA求滤波器的迭代次数,纵轴为分类的正确率。随着迭代次数的增加,左图从上到下分别为利用谱直方图、常规矩的二阶矩得到的分布图,右图为利用公式(7)提供的稀疏性估计、公式(6)提供的反对称估计、常规矩的峭度、常规矩的偏度得到的纹理分类结果分布图。图中迭代次数从0开始计算,迭代次数为0表示对数据进行PCA处理时得到的PCA滤波器的分类结果。

图3 纹理图像经ICA后得到的基的平均互信息与系数的平均峭度值随迭代次数的分布情况

图4 ICA滤波器独立性与其对纹理特征的辨识能力的影响

实验结果表明,若使用 ICA系数的频谱直方图或方差提取特征,虽然随着迭代次数的增加,ICA滤波器独立性越来越好,但对最后的分类结果没有太大影响。当在特征提取中采用系数的偏度和峭度时,随着迭代次数的增加,滤波器相互间越来越独立,利用偏度和峭度得到分类结果均有提高。同时由图4可知,由常规矩得到的偏度和峭度作为特征提取时波动较大,而由公式(6)提供的反对称估计得到的结果稳定性地上升。这主要是由于常规矩估计对野值较为敏感,而公式(6)提供的反对称估计对野值的鲁棒性好。由图4可知,利用公式(7)提供的稀疏性估计的分类结果一直都较高,而且一直很稳定,鲁棒性非常好。

5 结 论

文中主要研究了基于ICA纹理分类中特征提取以及滤波器独立性问题。根据独立成分分析系数满足非高斯分布的特点,采用对野值鲁棒的特征提取函数,较好地描述了系数分布反对称性和稀疏性,在ICA纹理分类中取得了较好的分类效果。同时针对不同的特征提取方法,研究了滤波器独立性对分类性能的影响。利用PCA滤波器和ICA滤波器,对比了频谱直方图、偏度、峭度以及本文引入的新函数的特征提取方法对分类性能的影响,不同的特征提取方法对滤波器独立性的要求不同,进一步揭示了ICA系数的非高斯性与特征辨识能力之间的关系。实验结果表明,ICA系数的非高斯性越强,其对高阶统计量的辨识能力就越强。

[1]汪荣贵,杨万挺,方帅.基于小波域信息融合的MSR改进算法 [J].中国图象图形学报,2010,15(7): 1901-1908.

[2]刘文涛,陈红,蔡晓霞,等.基于双树复小波变换的信号去噪算法[J].火力与指挥控制,2014,39(12): 84-87.

[3]张丽丽,苏训,陈鑫,等.基于边缘检测和小波变换的遥感图像融合算法[J].大庆师范学院学报,2014,34(6):24-27.

[4]陆莹,牛蕊,王伟,等.基于小波变换的图像边缘提取算法[J].测绘与空间地理信息,2015,38(3):21-24. [5]赵季红,雷佩,王伟华,等.基于小波变换的 RLS波束成形算法研究[J].电信科学,2015,29(3): 109-111.

[6]黄黎洪.一种基于单尺度Retinex的雾天降质图像增强新算法[J].应用光学,2010,31(5):728-733.

[7]卫婷婷,纪峰,庞胜军.图像增强算法新进展[J].宁夏师范学院学报(自然科学),2012(12):6-33.

[8]葛君伟,谢祥华,方义秋.雾天图像清晰化方法及应用[J].重庆邮电大学学报(自然科学版),2010,22(2):223-226.

[9]周卫星,廖欢.基于高频强调滤波和 GLAHE的雾天图像增强方法[J].数字视频,2010(7):38-40.

[10]胡大南,何涛.基于雾天环境下图像增强方法研究[J].科技论坛,2011(2):14-15.

[11]王剑平,张婕.小波变换在数字图像处理中的应用[J].现代电子技术,2011,34(1):91-94.

[12]张彬,郑永果,马芳,等.基于小波变换的多模态医学图像融合算法 [J].重庆医学,2011,23(7): 652-654.

[13]刘兴淼,王仕成,赵静.基于小波变换与模糊理论的图像增强算法研究[J].弹箭与制导学报,2010,30(4):183-186.

[14]Namgook Cho,Enhanced Voice Activity Detection Using Acoustic Event Detection and Classification [J].IEEE Transactions on Audio,Speech and Language Processing,2011(7):927-936.

[15]Cheng Gong, LI Yao-bo, Voice Activity Detection Method Based on Gray Correlation Analysis Algorithm[J].Signal Processing Letters,IEEE,2011:87-90.

Non-Gauss distribution's ICA texture classification

HAN Tao,ZHANG Jie
(Chinese Flight Test Establishment,Xi'an 710089,China)

Extracting effective features remains to be an important research problem in texture analysis. Based on independent component analysis(ICA),second-order statistical features and spectral histogram of ICA coefficients have been used to characterize texture properties for classification purpose.In this paper,according that the ICA coefficients satisfy non-gauss distribution in texture classification based on independent component analysis (ICA),new features extracting method is put forward,which is robust to outliers.The method measures ICA coefficients'asymmetry and sparsity,which are shown to yield better classification performance than the previously reported ICA features.Furthermore,the influence of different texture feature effected by independent of ICA filters are investigated.The non-gauss property of ICA coefficients and the discriminating power of features are further revealed.

textureclassification;independentcomponentanalysis(ICA);non-gaussdistribution;independent

TN99

:A

:1674-6236(2017)08-0147-04

2016-06-23稿件编号:201606183

航空科技基金(2010ZD30004);航空科技基金(2015ZD30002)

韩 涛(1985—),男,陕西汉中人,硕士,工程师。研究方向:摄影测量。

猜你喜欢

峭度高斯分布特征提取
基于MCKD和峭度的液压泵故障特征提取
利用Box-Cox变换对移动通信中小区级业务流量分布的研究
2种非对称广义高斯分布模型的构造
联合快速峭度图与变带宽包络谱峭度图的轮对轴承复合故障检测研究
基于Daubechies(dbN)的飞行器音频特征提取
谱峭度在轴承故障振动信号共振频带优选中的应用
一种基于改进混合高斯模型的前景检测
Bagging RCSP脑电特征提取算法
基于鲁棒性小波包峭度图的滚动轴承故障诊断*
基于MED和循环域解调的多故障特征提取