基于降维压缩法的图像重构

2015-04-17韦仙康睿丹

武汉工程大学学报 2015年12期

关键词：范数降维人脸

韦仙，康睿丹

太原工业学院理学系，山西太原 030008

基于降维压缩法的图像重构

韦仙，康睿丹

太原工业学院理学系，山西太原 030008

针对人脸图像易受环境因素的影响造成缺失或者受噪声污染，提出了从有限的信息中重构完整的图像矩阵的方法.首先利用奇异值压缩降维的方法提取人脸图像的特征值，并运用基于凸优化的矩阵填充技术对缺失的图像矩阵进行有效重构，然后采用固定点迭代算法，通过Matlab语言编程，进行分裂法迭代，在选取合适参数的情况下使运行程序快速收敛至目标矩阵，减小了运行时间.分析峰值信噪比随奇异值个数的变化关系，对人脸图像的保真度进行评估，通过对不同采样率下人脸图像重构效果的对比，运行时间的分析，得出降维压缩技术能够有效实现图像矩阵填充的结论.

矩阵填充；人脸识别；低秩；奇异值分解

0 引言

近年来，矩阵填充（Matrix completion，MC）理论逐渐受到越来越多学者的关注，它是一种高效的信号数据处理技术.在实际研究中，图像、信号、数据等都可以利用矩阵的形式表示，但由于受到实验条件限制，获得的矩阵元素往往是缺失、受噪声污染的.如何通过有效算法计算得到干净、完整的矩阵？这便是矩阵填充研究的问题，其核心思想是通过采集部分元素重构出目标矩阵，在重构精度上体现出优越性.

基于矩阵填充技术重构图像矩阵，应用于人脸识别，在保证较高保真度基础上对人脸图像矩阵进行压缩降维处理，利用矩阵填充算法有效实现重构.对研究人脸识别与追踪问题具有积极意义.

1 相关技术

1.1 图像降维处理

将数值元素写成低秩矩阵的形式称之为矩阵的降维过程.矩阵降维技术作为获取相关性和去噪的基本工具，广泛应用于图像压缩、计算机视图、机器学习等领域.降维的目的在于从有限缺失的信息中获得更简洁的数据表示，一种经典的降维技术是基于奇异值分解实现低秩逼近.与其他低秩逼近方法比较，奇异值分解的重建误差较小［1］.

由于图像矩阵的奇异值是人脸识别的代数特征量，能够反映人脸图像的内在属性和本质特征［2-3］，利用奇异值分解的方法能够对获得的人脸图像矩阵进行合理的降维处理，在不影响估计性能的前提下，有效地降低计算量，节约时间和成本［4］.

将人脸图像写成矩阵的形式，设M∈Rm×n是原始图像，X∈Ω是重建的近似图像，整数r满足1≤r＜rank（M），Ω为矩阵集合，｜▯｜为矩阵范数，拟合秩为r的矩阵X，使其有

由此能够对原始图像矩阵进行降维处理，并利用矩阵填充技术在已知部分数据的前提下实现人脸图像的重构.人脸图像重构流程图如图1所示.

图1 人脸图像重构流程图Fig.1 Flow diagram of face image reconstruction

1.2 矩阵填充原理

由于重构的近似图像矩阵X是秩为r的低秩矩阵，其独立元的个数df＝（2mn－r）r远小于维数m×n.这说明只要采样数目大于df，是有可能从采集的有限元素中重构矩阵X，该问题能够通过解决如下凸优化问题实现：

其中X为重构矩阵，rank（X）表示矩阵X的秩.这是一种根据观测数据拟合矩阵的普遍方法，如果存在唯一的低秩拟合数值，那么能够实现重构，但这是个NP-hard问题，在理论和数值实验中需要大量时间，不具有应用价值.

如果秩为r的矩阵能够进行奇异值分解，那么在限制集合内能够用奇异值之和最小化来替代（1）式中秩最小化问题，有

由于核范数是凸函数，能够通过半正定程序有效优化.则式（1）的NP-hard问题成功转化为凸优化问题，只需要选择合适的算法程序就能够实现矩阵的重构.

如果矩阵的某一行或者列的所有元素都没有被采样得到，那么无论采用何种理论和方法都不可能填充出这一行或者列的数值.因此，当采样方式满足一定条件时，才有可能实现矩阵重构.矩阵填充的采样方式一般是随机等分采样.

如果矩阵的行和列几乎都由零值组成，那么无论使用何种采样方式都不可能实现重构，原因是对于大部分的采样集合，得到的都是零值以至于没有办法计算出非零数据.比如矩阵：

对于这样的矩阵只有右上角一个数值，其余均为0，虽然是低秩矩阵却无法利用矩阵填充原理实现重构［6］.这就要求想要重构的目标矩阵M的奇异向量高度集中，能够在非零空间中进行采样操作.即，奇异向量在标准基内具有不相关性，为了使观测值数目最小化，有如下定义：

假设U为Rn的子空间，PU为在U上的正交投影，则U的相关性表示为

其中i为子空间U的维度，ei为标准基.对于任意子空间，μ（U）的最小值为1，如果U由元素值为倍数的向量测量得到，那么μ（U）的值为对于低相关性的矩阵，对应于子空间中的行列值均具有低相关性，则不能在零空间进行采样.对矩阵X进行奇异值分解，有

其中U和V分别代表行列矢量空间.

1.3 基本算法

核范数最小化过程是一个凸优化线性约束问题.虽然能够转换为一个半正定程序解决，但是这种方法在计算大矩阵上是耗时耗资的.固定点迭代算法［7］（FPC），在求解核范数最小化问题上体现了用时短，重构误差小的优越性.

核范数被称为Schatten-1范数或Ky-Fan范数，式（2）的核范数问题亦可写成

若b受噪声污染，则约束条件改写成其拉格朗日形式为

其中θ和τ均为中间参数.

利用FPC算法解决式（5）的问题如下：

其中Γ（▯）表示矩阵的收敛操作.该算法的核心是算子分裂技术，设X*为式（5）的最优解，当且仅当

由此得出X*的优化解满足.

利用固定点迭代法解决式（5）的具体步骤：

（1）初始化：给定X0，τ¯＞0.选取τ1＞τ2＞…＞τL＝τ¯＞0.设置X＝X0.

（2）以τ＝τ1，τ2，…，τL，开始，ε＞0数列收敛时，计算Y＝X－εA*（A（X）-b），且对Y作SVD分解，Y＝U Diag(σ)VT，计算X＝U Diag（Γετ（σ））VT.

（3）逐次迭代至数列不收敛时结束.

2 数值结果与分析

采用2.2 GHz CPU，4 GB yte内存的计算机进行模拟仿真实验，使用MATLAB编码运行算法程序.

将降维技术应用于人脸图像矩阵中，用ORL国际标准人脸数据库中S40的图像作为研究对象，其图像维数为112×552，对图像矩阵进行奇异值分解，分析奇异值大小与维数的关系（见图2）可知，并非所有的奇异值均对图像信息有较大贡献，只需要提取出具有决定因素的奇异值就能够充分反映图像特征，从而实现图像的压缩降秩，在保证图像质量的前提下，尽可能地降低矩阵的秩，而评估图像质量的常用函数有：均方根误差SRMSE，信噪比QSNR，峰值信噪比QPSNR等.下面给出峰值信噪比QPSNR的计算公式，分析重建图像质量

图2 奇异值与矩阵维数的关系曲线Fig.2 Relation curve between singular value and matrix dimension

从图2可知，随着维数的增大，奇异值逐渐减小，较大的奇异值数量级在104，较小的奇异值为50左右，由于奇异值越小，对图像保真度的影响越低，那么能够将数值较小的，对图像特征贡献少的奇异值合理舍去，并结合奇异值个数与峰值信噪比的关系（见图3），确定降维后的人脸图像矩阵.图3中秩为35对应的QPSNR值等于35时，重建的人脸图像轮廓清晰，与原图基本无差别，保证了图像的质量.这说明能够将维数为112×552的人脸图像压缩成秩为35的图像输出.

图3 奇异值个数与1/QPSNR关系曲线Fig.3 Relation curve between singular values and 1/QPSNR

图4 降秩处理后不同采样率下图像矩阵填充效果Fig.4 Reduced－rank matrix completion with different sample rates

人脸识别广泛应用于公安检查、监控等方面，但由于实际条件的限制，获得的图像矩阵往往是缺失的，为了获得较高清晰度的人脸图像，除了利用奇异值分解提取特征信息外，还要求将目标矩阵从获得的部分数据中重构出来.

利用矩阵填充算法，分析不同采样率下对人脸图像的重构效果（见图4）.其中第一行是原始图像，第二行是秩为35时的重建图像，第三、四、五行分别是采样率为10%、30%、50%的效果图.将未经降秩处理直接进行采样的图像进行重构，效果如图5所示，其中第一、二、三行分别对应采样率为10%、30%、50%的效果图.对于图4，秩为35时重建图像清晰可辨，说明压缩降维处理合理有效.当采样率为10%时，由于采样数目m＝6 182小于独立元个数df＝22 015，不符合矩阵填充重构条件，图像模糊失真；采样率为30%时，能够识别出人脸轮廓；采样率为50%时，图像整体清晰，虽有模糊，但人脸的识别度较高，与图5进行对比，容易看出，通过降维处理后，重构的人脸图像比较清晰.

图5 未经降秩处理不同采样率下图像重够效果Fig.5 Images of reconstruction results of different sample rateswithout reducing rank

图6给出运行时间和采样率的关系图，随着采样率逐渐增大，程序运行时间变长，当采样率为70%时，运行时间为25 s，均不超过1min，这说明通过降维处理的矩阵填充技术能够有效地实现人脸图像的重构.

图6 运行时间与采样率关系图Fig.6 Relation curve between run－time and sample rate s

3 结语

利用奇异值分解法提取人脸图像特征，并进行降维分析，在不影响图像质量前提下，运用矩阵填充技术重构人脸图像，利用计算机模拟，分析实验数值结果表明，重构效果较好，运行时间较短.对人脸识别的研究工作具有一定的指导意义和参考价值.

［1］杨济美，向世明，刘荣，等.矩阵低秩逼近的快速增量算法及其在人脸图像中的应用［J］.中国科学技术大学学报，2009，39（9）：970－979.

YANG Ji－mei，XIANG Shi－m ing，LIU Rong，et al.A fast incremental algorithm for low rank approximations of matrices and its applications in facial images［J］. Journal of University of Science and Technology of China，2009，39（9）：970－979.（in Chinese）

［2］HONG Z Q.A lgebraic feature extraction of image for recognition［J］.Pattern Recognition，1991，24（3）：211-219.

［3］BEGHDADIA，PESQUET PB.A new image distortion measure based on wavelet decomposition［J］.Proc ofIEEE ISSPA，2003（1）：485-488.

［4］夏平平，吕太之.动态人脸识别系统的设计与实现［J］.武汉工程大学学报，2011，33（10）：107-110.

XIA Ping-ping，L YU Tai-zhi.Design and implementation of a dynamic faces recognition system［J］.Journal ofWuhan Institute of Technology，2011，33（10）：107-110.（in Chinese）

［5］韦仙.基于矩阵填充技术重构哦低秩密度矩阵［J］.武汉工程大学学报，2015，37（2）：72-76.

WEI Xian.Reconstructing low-rank density matrix via matrix completion［J］.Journal of Wuhan Institute of Technology，2015，37（2）：72-76.（in Chinese）

［6］EMMANUEL JC，BENJAMIN R.Exact low-rank matrix completion via convex optimization［J］.IEEE，2008（23-26）：806-812.

［7］MA Shi-qian，DONALD G，CHEN Li-feng.Fixed point and Bregman iterative methods for matrix rank m inim ization［J］.Mathematical Programm ing，2011，128（1-2）：321-353.

Image reconstruction based on dimension reduction and com pression technology

WEIXian，KANG Rui-dan
Faculty of Science，Taiyuan Institute of Technology，Shanxi030008，China

Aimed at that the face image is usuallymissing and corrupted by noise under the impact of environmental factors，we proposed amethod to reconstruct the complete imagematrix from the limited information.Firstly，we applied the matrix completion theory to reconstruct the imagematrix whose eigenvalues are effectively extracted using the method of singular value compression.Then，we used the matrix completion technology based on the convex optimization to study the problem ofmissing matrix reconstruction by running the fixed point iterative algorithm.This algorithm can quickly converge to the targetmatrix in the case of selecting appropriate parameters by conducting splitting iteration with the help of Matlab programming language，which reduces the running time.We evaluated the fidelity of the face image by analyzing the relationship between the peak signal to noise ratio and the number of singular values.The conclusion shows that the image matrix is effectively completed using the technology of dimension compression through analy zing the effectof face image reconstruction under different sampling rates and the run-times.

matrix completion；face recognition；low-rank；singular value decomposition

O411.1

10.3969/j.issn.1674-2869.2015.12.015

1674－2869（2015）12－0069－06

本文编辑：陈小平

2015－11－05

太原工业学院院级青年科学基金(2014LQ05)

韦仙(1988-)，女，山西晋城人，助理实验师，硕士.研究方向:压缩感知与矩阵填充.