APP下载

基于张量投票的线性判别分析算法研究

2019-05-08张成毅罗双华

渭南师范学院学报 2019年5期
关键词:边界点张量线性

李 姣,张成毅,罗双华

(西安工程大学 理学院,西安 710048)

随着大数据爆发式的增长趋势,如何从复杂、冗余的数据中提取有效信息成为现阶段的一个研究热点。人脸识别、姿态识别、指纹识别等生物识别技术对图像数据中的生物特征数据进行处理,涉及对高维图像数据的处理技术。在此过程中“维数灾难”成为分析图像数据的一个巨大挑战。为了解决这一问题,就需要选择和提取数据中的显著特征,即剔除不相关和冗余的信息降低数据维数以提取有价值的特征数据。线性判别分析对处理由单个因素引起变化的数据效果明显,却无法满足越来越复杂数据的处理需求。因此,多重线性代数的应用逐步弥补了这方面的缺陷。

线性判别分析在处理多类数据的分类及降维问题中取得了一定的显著效果,但针对此过程中可能存在的小样本问题,不同改进算法处理的核心思想也不同,如温浩等人将LDA扩展到张量子空间下,提出了用张量线性判别分析(Tensor Linear Discriminant Analysis, Tensor-LDA)来进行人脸识别算法的研究[1],但算法中存在低维特征提取不充分的问题。因此,本文在此基础上提出了基于张量投票的线性判别分析算法,即首先使用张量投票对样本数据即点、曲线和曲面等结构特征的提取,再利用线性判别分析进行分类和降维处理,以解决图像数据中可能存在的小样本问题。

1 张量投票方法

张量投票[2]是一种推断图像显著结构的算法。计算流程可概括为三大步骤:(1)将输入图像数据的像素点转换为张量表示;(2)每一个像素点的张量在其邻域内传播信息并收集传播到自身的信息,计算的方式主要为两次张量投票:第一次为稀疏投票,一般选择球形投票域,只在输入的数据点之间进行,投票结果会形成新的张量表示;新的张量再选择合适的投票域进行第二次张量投票——稠密投票,即向图像中的所有像素点投票,投票结果形成特征显著图;(3)根据数据的特征显著度对投票结果进行特征提取,主要包含基于矩阵特征值计算的投票解释和基于极值搜索的特征提取。[3]

如图1所示,像素点的张量表示即在取向估计的基础上根据各点的取向特征生成投票域;张量投票后对所有投票叠加,使各数据点形成新的张量表示;在投票形成新张量后需要对投票进行解释即特征值的分解过程;特征提取即对点、曲线等显著图的搜索过程。[3-5]在张量投票算法的计算步骤中进行的两次投票及最后的输出均为张量形式,这可能会造成维数灾难等问题,由于高维数据之间的运算虽然会避免数据结构信息的丢失,但需要花费大量的时间。

近几年,张量投票算法逐渐与其他算法相结合用于解决涉及图像处理方面的问题。例如,林洪彬等人针对张量投票理论无法进行解析求解的难题,提出了基于解析张量投票的散点云特征提取算法。[6]李慧娴等人为了检测物体表面裂痕,在检测算法主体过程中为了得到完整的裂纹区域,使用张量投票得到了裂纹的中心线并以此作为连接裂纹片段的曲线,通过实验验证张量投票算法对裂纹片段进行了有效的连接和噪声去除。[7]

2 线性判别分析

线性判别分析方法(LDA)在处理数据时需要预先知道样本的类别并通过提取最有利于分类的特征,从而使得同类样本聚合度好而不同类样本离散度大。LDA以分离不同类别为目的,充分利用训练样本的已知类别信息寻找最有助于分类的最佳投影子空间,使得不同类别的数据样本在这个子空间内彼此互相分离。LDA通过Fisher准则找到一个最优线性投影(转换)矩阵,然后利用最优线性投影矩阵获得最佳投影子空间。[8]

其中:Ni表示属于第i类的样本个数。

这一过程往往存在由于训练样本不足而引起的类内散度矩阵奇异的小样本问题。Zhu M等人提出的子类判别分析(Subclass discriminant analysis)[9]和Gkalelis N等人提出的混合子类判别分析(Mixture subclass discriminant analysis)[10],分别针对小样本作了相应的改进并均取得了显著的效果。而这些基于子空间的改进算法主要是通过在分类阶段更加细化的表示样本均值,但容易出现融合技术选择的难题。

3 改进线性判别分析算法

基于上述两种算法在处理具体问题时存在的不足,本文提出的基于张量投票的改进线性判别分析算法主要特点就是将张量投票对数据结构特征的鲁棒性优势融入线性判别分析中,从而取得较好的融合处理结果。算法的优势主要是融合了两者在处理图像数据时各自具备的优点从而采取较好的处理方式:张量投票采用非线性的方法处理图像数据中的显著点、曲线和曲面等[11];线性判别分析则采用线性原则对数据进行降维、分类处理[12-14]。因此,改进算法的提出将线性方法和非线性方法相结合,既解决了非线性方法在处理数据时存在的缺点,又解决了线性方法存在的不足。

改进算法的实现过程包括两个阶段:输入待处理的数据到张量投票方法流程中进行处理,得到投票结果;将投票结果代入线性判别分析的判别准则函数中进行分类、降维处理,并输出最终结果。

3.1 张量投票阶段

张量投票方法的最大特点是输入特征和输出特征均使用张量表示,能够从稀疏或噪声掩盖下的数据中推断出结构信息。通过两次投票将输入数据的显著性特征提取出来并用张量表示,实现数据模型的张量表示、投票域的计算以及数据通信的线性投票。[15]

图2 张量投票域示意图

点P与周围所有可能发生作用的点之间的连接曲线及其取向构成投票域的形状及取向,投票的大小代表强度,二阶对称张量投票的投票强度衰减函数为:

其中:DF为投票域的投票强度,σ为投票尺度,s为弧长,κ为曲率,c为投票尺度σ的函数,用于调整距离和曲率对投票大小影响的比例关系,同时控制着投票域的横向张度。

投票强度衰减函数表明了投票大小会随平滑路径的长度增加而衰减,并且倾向于保持直线方向的连续性。投票的尺度参数作为投票域的投票强度计算框架中唯一关键的参数,定义了投票邻域的大小,并且是对曲线平滑程度的一种度量。[15]投票域的影响范围介于小尺度和大尺度之间:小尺度范围下的投票,过程更加局部化并且有利于保持图像细节,但存在受外部干扰影响大的缺陷;大尺度范围下的投票,过程可以连通一些断点,抗噪能力强,不足之处在于图像的平滑性容易受到影响。

如图3所示,对边界点作张量投票处理后得到了近乎封闭的曲线。这说明张量投票方法对边界点邻域之间的相关性作出投票,从而连接相关性较大的边界点得到显著曲线即图像的大致形状。在张量投票过程中主要使用了棒形投票域获得最终的结果图。从图3中可以看出张量投票过程将lemon的边界特征点提取出来并进行了光滑曲线的连接,较明显地突出了张量投票对于显著图提取的鲁棒性。第一张是输入的边界点图像,在进行了张量投票处理后,从第二张可以看出算法连通了相关性大的断点并形成了较为光滑的曲线图像,但存在一定的噪声数据。因此,接下来要做的就是将得到的结果张量代入线性判别分析中,以实现对于图像数据的最后处理。

(a)dot-edge图像 (b)TV图像

3.2 线性判别分析阶段

由于张量投票的最终结果是张量,具有较高维数,但最终的结果张量中包含着从输入数据中提取的显著特征,保存了输入数据一定的结构信息。因此,在不破坏这种结构特征的基础上将得到的结果张量代入线性判别分析中,求解降维处理后的张量子空间。待测样本数据经过投影后在张量子空间中构成与待测样本具有投影关系的新样本数据,并且新样本数据之间存在不同类的数据点之间相互分离、同类的数据点之间彼此靠近的关系。

张量线性判别分析方法是传统线性判别分析方法在张量子空间上的扩展。它在张量域对样本进行处理并提取样本的特征。相比于向量,有效保留了样本的结构信息,并且更充分地利用了收集到的信息,同时还避免了线性判别分析中存在的小样本问题,提高了学习性能。[12]因此,改进的线性判别分析算法在运算过程中更加精确地保证了类间散度矩阵和类内散度矩阵之间的关系。相比与传统LDA算法中通过求解判别准则函数寻求最优的投影向量的差异,本文则是寻求一系列投影矩阵(张量)ui(i=1,2,…,N)从而实现将高维的张量样本转化为低维的张量数据,同时满足类间散度矩阵最大化、类内散度矩阵最小化。[16]其中,类内散度矩阵SW、类间散度矩阵SB和构成的判别准则函数描述分别如下:

(1)

温凤文等人结合相似度量的概率学习方法,将两个矩阵的相似度用属于同一个集合的概率值来度量。并由条件概率公式定义两个矩阵之间的差异集属于同一集合的概率,文中用条件概率的高斯分布函数,即

估计条件概率

为样本均值。[16]

对于投影后的样本集UTXiV∈Rl1×l2,赵越等人针对投影矩阵U和V不能同时计算的问题,定义了两个优化函数来确定U和V。[17]以其中的一个优化函数为例具体操作如下:对于一个固定的V,U通过优化函数J(U)来实现:

(2)

本文在两者处理投影矩阵的方法中得到启示,即针对投影矩阵不能同时计算的问题,引入贝叶斯定理实现对该问题的处理。通过对两个投影矩阵之间先验概率的学习,从而实现对相应后验概率的表示。

(3)

虽然投影矩阵U和V不能同时计算,但贝叶斯定理将两个投影矩阵之间通过先验概率与后验概率存在的关系表示出来。使用贝叶斯定理进行两个投影矩阵之间关系的表示,主要是考虑到贝叶斯定理将两个相关因素用已知概率表示,避免了在运算过程中丢失某些数据,同时也避免了小样本问题的出现。

3.3 算法流程

提出的改进算法的主要流程为:

Step 1:输入待处理图像到张量投票流程中,进行初步处理,即将像素点张量表示后代入T=λ1e1e1T+λ2e2e2T,其中T为二维空间的二阶对称张量,λ1≥λ2≥0为T的特征值,e1和e2为对应的特征向量。通过相关的运算得到相应的特征值对应的特征向量构成的张量,然后输出得到结果张量。

Step 2:通过将结果张量代入改进线性判别分析算法中,即代入式(1)中对类内散度矩阵与类间散度矩阵两者之间在结果张量条件下构成的关系进行运算,从而得到相应的最优解。

Step 3:将投影矩阵U和V通过贝叶斯定理进行处理,即代入到式(3),得到两者之间的关系。

Step 4:对相应的优化函数作最优化处理,得到最终的最优解,即将U和V代入式(2)中,在不断迭代的过程中寻求满足迭代次数而获取的最优解。

通过上述流程为改进算法的实现提供了理论支撑。在进行整个算法的过程中,存在的难点主要在于流程的第二步,即张量投票与线性判别分析的融合阶段,在这个阶段出现的问题可能会直接影响整个算法的效果。因此,在保证整个算法流程的流畅性的同时,本文着重改进了在张量投票过程中形成的结果张量代入线性判别分析流程后作为投影矩阵而产生的问题,即将投影矩阵存在的问题通过贝叶斯定理进行了处理。

在整个算法流程运行的过程中,通过规避每一步中可能存在的不足,将两种方法各自处理图像数据的优势放大,在不足处作出相应的改进。如对于张量投票过程中产生的结构张量在代入线性判别分析过程中容易出现维数不匹配的问题,将贝叶斯定理代入其中作出改进,从而实现两者之间的过渡。

4 实验结果与分析

对于算法效果的实验验证主要选择了简单图像的边界点,即通过离散的边界点获取图像的边界形状,依据离散点间存在的关系获取预期的显著曲线。实验主要是在Matlab R 2016a环境下进行的。

实验取得的结果如图4所示。

(a)dot-edge图像 (b)TV图像 (c)改进的边界提取图像

从图4(c)可以看出,改进后的LDA算法融合了张量投票对于显著点或曲线等特征提取的鲁棒性,剔除了原本在张量投票过程中图像数据中含有的噪声数据,得到了比较好的图像轮廓曲线。其中,图4(a)为输入图像lemon的点边界图像,图像中的点边界提供了原图像的全局形状;图4(b)为经过张量投票(Tensor Voting, TV)处理后的图像,输出的结果可以清楚地看出原图像lemon的大致形状,但边缘存在一定的噪声数据;图4(c)为最终的输出结果,本文提出的改进算法将原图像lemon中含噪数据剔除后,在对图像数据的进一步处理中保证了算法的稳定性,即保留了图像的连续性。

以下几种图像在采用提取图像边界点来获取边缘图像的算法与文中研究的改进算法之间的清晰度对比分析如表1所示。

表1 几种获取边缘图像算法的对比

注:本文中指定识别图像的边缘图像的清晰度分为:模糊[0,3];较清晰(3,7];清晰(7,10]

由表1的对比分析可知,对图像的边界点提取并形成近似封闭边缘的处理中,对较为简单的图像边界点的处理几种算法都得到了较为清晰的边缘图像;对复杂及边界点离散程度大的图像提取的边缘图像效果较为模糊。

从实验结果可以看出,与传统LDA相比,本文提出的改进算法避免了将张量代入判别函数中存在的不能同时计算等问题。在算法实现的第一步就对待处理图像进行了显著特征的提取,在这一步主要是利用了张量投票对于图像显著性的鲁棒性;对在下一步的线性判别分析阶段只需要对处理后的图像进行相应的降维和去噪处理。将这一系列处理流程中可能出现的问题也作出了相应的解决,实验的最终结果表明改进的算法得到了对于图像数据处理的预期目标。

5 结语

本文将改进的算法对简单图像的边界点进行处理作为实验验证的基础,取得的效果也比较理想。图像数据的边界点坐标在算法流程的实验中得到了图像的边界曲线,主要在张量投票过程中逐步实现对点邻域之间相关性的投票并得到了近似光滑的曲线图像,图像的整体特征曲线逐步显现;将处理后得到的结果代入下一个阶段即线性判别分析的算法流程中,经过相应的运算得到了含噪小、图像边界曲线近乎完整的实验结果。

接下来的研究课题是不断完善算法对于图像数据处理的泛化性,使得算法对于复杂指纹图像的识别也可以提取作为识别依据的显著图,并可以在指纹数据库中作出一定的分类。在对简单图像的处理过程中,改进算法对于指纹图像的处理可能存在的困难主要有指纹图像具有纹理复杂、差异细微等特点,同时亟待处理的指纹图像数据样本也有二维或三维之分。因此,研究的课题为最终解决指纹数据的分类及识别的稳定性和高速率,就要求不断改善提出算法的泛化能力,不仅对简单图像的处理具有很好的稳定性,也对复杂图像数据具有较好的鲁棒性。

猜你喜欢

边界点张量线性
汽车驾驶员前方视野测量中A柱双目障碍角边界点选取的分析
一类张量方程的可解性及其最佳逼近问题 ①
浅谈张量的通俗解释
2型糖尿病脑灌注及糖尿病视网膜氧张量的相关性
二阶整线性递归数列的性质及应用
严格对角占优张量的子直和
基于安全性的自主环境探索算法的改进方法
区分平面中点集的内点、边界点、聚点、孤立点
非齐次线性微分方程的常数变易法
多阈值提取平面点云边界点的方法