基于NTSS和压缩感知的人脸跟踪算法

2019-06-03郭春赫邓湘奇

实验室研究与探索 2019年3期

徐杰，郭春赫，孙超，邓湘奇

(黑龙江科技大学电子与信息工程学院，哈尔滨150022)

0 引言

目标跟踪应用的领域十分广泛。例如，目标跟踪是无人驾驶汽车的核心系统，大部分无人驾驶汽车出现安全风险事故的原因是由于强光的干扰和行人与背景信息颜色相近导致误判，最终酿成车祸。

目前，大部分的跟踪算法是基于外观特征模板的。一种有效的外观模型在跟踪算法中是很重要的，并且在近些年受到了极大的关注［1-2］。基于线性随机测量的实时目标跟踪算法具有较好的实时性优势，一经提出就得到了众多相关领域研究者的关注［3-8］。但是，以上算法在目标受到光照干扰或者对目标进行实时跟踪时仍然存在目标漂移的现象，不能达到跟踪目标的实时性和鲁棒性。文献［9-10］中提出了对压缩感知跟踪算法在这种情况下的改进。传统的跟踪算法大部分利用全局搜索，遍历整张图片，这样会加大计算的复杂度，提取目标特征的速度会大大降低。在行人跟踪方面，由于人的非刚性变化，在长时间跟踪目标状态下仍然具有较弱的跟踪效果，容易发生漂移现象。本文提出的基于NTSS和压缩感知的人脸跟踪算法是利用双重采样方法，并结合NTSS搜索方法遍历输入图像，最终能够有效地解决目标发生局部遮挡和强光干扰的问题。

1 压缩感知理论

压缩感知是近年来发展最为前沿的理论之一。压缩传感指出信号是可压缩的，其在某个变化范围内是稀疏的，这样就可以通过特定的方法，将高维信号降到低维空间上以方便求解，再把原始信号从低维空间中还原出来，保证信号的全部信息。图1给出了压缩感知理论的整个操作流程。

图1 压缩感知理论框架

1.1 信号的稀疏表示方法

信号并不是绝对稀疏的。从理论意义上理解，如能找到信号稀疏表达空间，任何信号都具有可压缩性的。压缩感知数学模型表示如下:

假设1个长度为N的一维信号x在某个正交基上能够进行稀疏表示，则有

式中:x为信号在时域中的表示;k(稀疏系数)为信号在频域中的表示，其与x是同一个信号的等价表示，其中k中有K个系数不为0，则称x在频域是可压缩的或者是K-稀疏的。

1.2 满足RIP条件的测量矩阵

信号无失真的恢复原始信号，这里采用压缩感知的方法将处在高维的原始图像信号降低到低维度的测量矩阵，其数学模型表示如下:

式中:k称为CS信息算子［11］;测量值Y是一个M维的向量，实现了降维的过程。在将高维信号x转换为低维信号Y的过程中，信号能够无失真地还原出来要确保矩阵满足RIP准则［12］，RIP准则的数学描述为:

1.3 恢复信号

当矩阵满足RIP准则时，求解稀疏系数k，再通过x=θk重构原始信号x。最后将x从M维的测量值中构造出来。其数学模型为:

2 NTSS和压缩感知的人脸跟踪算法

2.1 NTSS 算法

NTSS是根据上1帧目标框的位置来寻找下1帧目标框位置的搜索算法。其实现过程如下，将目标框的质心位置作为最小误差(MAD)位置，同时取距离质心位置步长为4和2的各8个点计算最小误差点作为下一个中心点，再距离这个中心点取步长为1的8个点计算MAD，找到最终的目标子窗口。NTSS搜索跟踪目标的过程如图2所示。符号表示各个步骤搜索过程的候选点，此候选点用于下1帧目标跟踪框的确定。

图2 NTSS搜索目标过程

MAD平均绝对误差函数计算过程如下:

式中:M×N表示当前帧中与目标块最佳匹配块的大小;f(m，n)表示目标的灰度值。多种搜索算法在执行时间和恢复图像质量上进行了对比，如表1所示。

表1 多种匹配算法的Matlab执行时间和重构图像PSNR值

由表1可知，在恢复图像质量上虽然全局搜索算法FS恢复图像的质量上最佳，但在运行速率上，FS所运行的时间要比其他算法长，NTSS执行时间最短，所以在考虑检测图像速率方面NTSS搜索算法最佳。

2.2 NTSS和压缩感知的人脸跟踪过程

利用NTSS和压缩感知算法处理第1帧目标的流程图如图3所示。l1红色矩形框为目标的初始位置，此算法的目标初始位置l1是事先给定的。初始化稀疏测量矩阵M定义为:

式中:rij为矩阵M中的元素。通过初始化稀疏测量矩阵可大幅度降低计算速度，且数据存储空间可以有效地利用，大大节省了样本存储空间。M中每行非零项保存的是在输入图像中的矩形过滤器的位置。

图3 第1帧的处理流程(图中的数字表示的是先后顺序)

此后在与目标位置l1相距

的区域内取正样本(见图3中第②步取样本中的红色矩形框)，在与l1相距

的区域内取负样本(见图3中第②步取样本中的黄色矩形框)。用不同尺度的矩形滤波器对所有正负样本进行卷积得到高纬度的特征向量x，它是每个尺度下过滤的图像所连成的高维度的向量。最后用稀疏随机测量矩阵M对高纬度的特征向量进行降维，得到低维的特征向量v，有

由于M是一个巨大的稀疏矩阵，并由许多小的矩阵滤波器组成，如果使用稀疏测量矩阵会消耗相当大的存储空间。如图3中的第3步和第4步，此算法巧妙地使用M矩阵对正负样本直接提取低维特征向量v，特征提取示意图如图4所示，其特征提取过程如下式所示:

图4 特征生成示意图

经过式(7)特征提取后，计算提取的低维特征并更新朴素贝叶斯分类器［13］的参数，得到分类器1。

式中:y=0表示正样本，y=1表示负样本，且p(y=0)=p(y=1);μ1和σ1分别为正样本均值和方差，且它们的更新过程如下:

式中，λ为学习率。

随着第1帧处理完成后，此时的分类器1的参数得到了更新，开始处理第2帧图像，如图5所示。将目标框l1的质心位置作为最小误差(MAD)位置，同时取距离质心位置步长为4和2的各8个点计算最小误差点作为下一个中心点，再距离这个中心点取步长为1的8个点计算MAD，找到最终的目标子窗口。

图5 第2帧寻找跟踪目标位置的处理流程(图中的数字表示的是先后顺序)

当第2帧图像来时，以经过NTSS检测得到的候选目标子窗口的质心(见图6中的黄色虚线框)为圆心，以半径为α范围内的区域采集若干正样本Bα=

根据以上介绍的视频第1帧和第2帧处理方法，后面每帧的处理和这两帧类似。

图6 第2帧更新分类器的处理流程(图中的数字表示的是先后顺序)

3 实验结果分析

通过国际标准数据库中的视频序列对压缩感知算法和基于NTSS压缩感知人脸跟踪算法分别得到的目标位置进行了比较，图7所示为压缩感知算法得到的目标位置(红色框)。由图7可见，在182帧和213帧，当人脸经过90°旋转后再复原得到的目标框已经发生了漂移。而基于NTSS和压缩感知算法实现人脸跟踪的结果如图8所示，在182帧和213帧中得到的目标框更具有较强的鲁棒性。

图7 压缩感知算法实现的人脸跟踪

图8 基于NTSS和压缩感知算法实现人脸跟踪

利用国际标准的人脸数据库AFW和MALF视频序列分别在暗光、脸部旋转、尺度变换和局部遮挡等影响条件下进行算法的测试，针对压缩感知算法和基于NTSS压缩感知算法运用中心距离均值［14-15］进行了比对，如表2所示。

表2 中心距离均值/像素

从表2可见，本文算法最大可降低59.01%的误差。最后得出以下结论，基于NTSS和压缩感知的人脸跟踪算法不受目标发生遮挡、脸部90°旋转和光照的影响，对人脸的跟踪具有较强的稳定性和实时性。中心距离均值为

4 结语

本文提出了基于NTSS双重采样压缩感知人脸跟踪算法。此算法通过选用不同的半径和步长进行正负样本的双重采样。并运用NTSS搜索方法作为目标的检测方法，根据测试的国际标准视频序列所得出的跟踪结果表明，本文提出的基于NTSS和压缩感知的人脸跟踪算法在人脸发生尺度变换、人脸90°旋转和暗光条件下更具有鲁棒性，有效提高了目标跟踪的准确性。