一种改进的基于奇异值分解的亚像素级图像配准算法*
2019-01-21耿修瑞杨炜暾赵永超
凌 程,耿修瑞,杨炜暾,赵永超
(中国科学院电子学研究所 中国科学院空间信息处理与应用系统技术重点实验室, 北京 100190; 中国科学院大学, 北京 100049)(2017年11月13日收稿; 2018年1月9日收修改稿)
图像配准是一项非常重要的图像预处理技术。随着数字图像处理的发展,图像配准技术已经被广泛应用于高分辨率图像生成[1]、医学图像对齐[2]、高精度3D重建[3]、遥感图像变化检测、多源图像融合等领域。这些关键领域中,需要高精度的图像配准,即亚像素级的图像配准。现有的亚像素级图像配准算法主要分为3类[4-5]:基于插值的方法[6-8]、解最优化问题法[9-10]和扩展的相位相关法[2,11-13]。其中,基于插值的方法采用插值技术对相似性函数或者图像进行插值重采样,以插值后的最大值位置作为配准位置,以此达到亚像素的精度。Guizar-Sicairos等[7]对相似形函数内插法进行快速改进;Yousef等[8]在此基础上进一步提高速度,在保证配准精度的同时大大减少计算复杂度。本文在此将Yousef等[8]提出的快速相似性函数内插法称为fast-SSDFT方法。解最优化问题法的目标函数为衡量两幅待配准图像之间相似程度的函数,支持各种变换模型,具有参数选择灵活,计算精度高的特点,但是其计算量非常大,收敛概率和得到全局最优解的概率也需要提高。基于相位相关的方法利用傅里叶变换的特性,将时域上的平移量转化为求解频域上的相位相关,具有精度高、对噪声鲁棒和计算复杂度低等优点。
目前所有扩展的相位相关法都是基于傅里叶变换的平移特性,即两幅待配准的图像在空间域上存在平移,转换到频域上则表现为线性相位,通过对频域上线性相位的求解来获得空间域上的平移量。传统的相位相关法直接将归一化互功率谱矩阵进行傅里叶反变换,通过判断冲激函数的峰值位置得到平移参数的值,但是这种方法只能得到整数像素值。Hoge[11]提出,通过对归一化互功率谱矩阵进行奇异值分解,用最大奇异值所对应的奇异向量估算出平移量,可以达到亚像素的精度。该方法通过选取最大奇异值,抛弃小的奇异值,起到对噪声过滤的作用,因此该方法对平移参数的估计具有较高的精度。另外为了求得亚像素精度的平移量,需要对得到的奇异向量的相位值进行一维相位解缠,然后用最小二乘法估计出平移量。Tong等[12]利用Ransac算法[14]替代最小二乘法对解缠后的相位值进行估计,在噪声较大的情况下,Ransac算法能够滤除噪声带来的异常值,使得估计出的平移参数精度更高。Feng等[13]针对低信噪比的图像提出一种鲁棒的亚像素配准算法,该算法通过计算两幅图像的互相关系数[15]的质心得到精确的平移参数,从而达到亚像素的配准精度,本文在此将其称为CC_centriod方法。
在理想无噪的情况下,缠绕相位具有一定的周期性,可以通过积分的方法进行相位解缠。通过积分的方法求得真实相位具有一个前提,即相邻两个像元间的真实相位差的绝对值要小于π[16],但是如果两幅图像之间的平移量超过某个阈值或者受噪声影响时,所得到的一维缠绕相位向量相邻的真实相位差的绝对值会超出π,因此传统的积分法进行相位解缠就会变得不再适用。本文提出一种改进的相位解缠方法对传统积分法得到的结果进行校正,改进的算法可以避免积分法受到此前提和噪声的影响,使得估计出的平移参数更精确。本文把基于奇异值分解(SVD)的相位相关法结合改进的相位解缠方法称为SVD-IIM(SVD-improved integral method)。
1 基于SVD分解的相位相关法
1.1 方法原理和流程
令x0和y0表示两幅大小为M×N的图像之间在行方向和列方向上的平移量,可以表示成
g(x,y)=f(x-x0,y-y0).
(1)
式中:f(x,y)和g(x,y)为二维离散函数,其中变量x=1,2,3,…,M和变量y=1,2,3,…,N。根据傅里叶变换的性质可以得到
G(u,v)=F(u,v)exp{-j2π(ux0/M+vy0/N)}.
(2)
式中:F(u,v)和G(u,v)分别是f(x,y)和g(x,y)的二维离散傅里叶变换函数,其中变量u=1,2,3,…,M和变量v=1,2,3,…,N。因此可以得到归一化互功率谱函数Q(u,v)
= exp{-j2π(ux0/M+vy0/N)}.
(3)
式中:*代表共轭,传统的相位相关法直接计算归一化互功率谱函数Q(u,v)的傅里叶反变换:
在这个句子中,汉语外延文化信息“沧海”和“桑田”翻译成“sea and mulberry fields”。“沧海变桑田”意味着巨大的改变,英语读者很容易理解文化负载词的文化含义,所以译者尽可能地逐字翻译。
Q(x,y)=δ(x-x0,y-y0).
(4)
在理想情况下,归一化互功率谱矩阵Q在理论上是一个秩为1的矩阵,因此归一化互功率谱函数Q(u,v)可以进行如下分解:
Q(u,v)=exp{-j2π(ux0/M+vy0/N)}
= exp{-j2πux0/M}exp{-j2πvy0/N}
(5)
式中:H代表共轭转置,令向量qx0和qy0为:
qx0=(e-j(2π/M)x0,e-j(2π/M)2x0,…,e-j(2π/M)Mx0)T,
(6)
qy0=(ej(2π/N)y0,ej(2π/N)2y0,…,ej(2π/N)Ny0)T.
(7)
因此归一化互功率谱矩阵Q可以表示为
(8)
但是,在一般情况下,Q并不是一个秩为1的矩阵,因此文献[11]提出可以通过对Q矩阵进行SVD分解,用最大奇异值和相对应的奇异向量对Q进行秩1估计,由于奇异值最大的分量受噪声影响较小,因而秩1估计可以起到抑制噪声的作用。对Q进行秩1估计:
(9)
式中:σ1为最大的奇异值,u1和v1为σ1所对应的奇异向量,因此有u1≈qx0和v1≈qy0。对u1和v1进行相位解缠,得到解缠后的相位px和py,并用最小二乘法拟合px和py,得到px和py的斜率kx和ky,通过得到的斜率最终求得平移参数:
(10)
图1 基于SVD分解的相位相关法流程图Fig.1 Flow chart of phase correlation method based on SVD
1.2 积分法相位解缠原理
在理想情况下,图像的采样率满足Nyquist采样定理,采样频率必须大于信号最高频率的2倍,解缠相位中相邻像素点之间的相位差值不可能超过半个周期,当满足此条件时必然能通过积分法,由缠绕相位解缠出正确的真实相位值。令φ(m)为周期缠绕前的真实相位值,φ(m)为相应的缠绕相位,相位缠绕算子可以如下定义:
ω(φ(m))=φ(m)=φ(m)+2πk(m).
(11)
其中-π<ω(φ(m))<π,得到属于(-π,π)的缠绕相位φ(m),定义差分算子Δ,因此对于真实相位值有
Δφ(m)=φ(m+1)-φ(m).
(12)
由于真实相位值中相邻像素点之间的相位差值不可能超过半个周期,所以有
-π<Δφ(m)<π.
(13)
对相邻缠绕相位也进行差分运算得
Δφ(m)=φ(m+1)-φ(m)=Δφ(m)+
2πΔk(m).
(14)
对该相位差使用缠绕算子得
ω(Δφ(m))=Δφ(m)+2πΔk(m)+2πk′(m).
(15)
根据缠绕算子ω的定义,ω(Δφ(m))必然在区间(-π,π)内,由式(13)可知,Δφ(m)也属于区间(-π,π),因此有
Δk(m)+k′(m)=0.
(16)
所以可将式(15)简化为
ω(Δφ(m))=Δφ(m).
(17)
因此最终的真实相位可以表示成
ω(Δφ(n)).
(18)
从以上推导可以看出,使用积分法进行相位解缠依赖于一个重要的前提,即真实相位中相邻像素点之间的相位差值必须在(-π,π)范围内。而在实际遥感图像配准应用中,由于有地形突变、相位混叠、平移量较大等各种因素的存在,相位信息中将会引入噪声,在计算解缠相位的过程中,并不确定式(13)是否成立,所以通过积分法即式(18)计算所得到的相位值只是相位的估计值,其准确性并不能保证[17]。
1.3 改进的相位解缠方法
如图2所示,如果当真实相位差的绝对值大于π时,使用积分法进行相位解缠会出现图2(a)所示的现象,如果对φ(i+1)进行加上或减去2π的校正操作后更符合趋势斜率kx,那么执行此校正操作,使得校正后的φ(i+1)-φ(i)更符合趋势斜率,如图2(b)所示。
图2 相位校正示意图Fig.2 Schematic of phase correlation
2 实验结果及分析
本文选取的实验数据为高分2号(GF-2)卫星和资源3号(ZY-3)卫星的高分辨率多光谱图像数据(部分图像数据如图3 所示),分别进行校正效果实验和配准精度对比实验。其中校正效果实验主要对比传统积分法和改进的相位解缠方法对缠绕相位的解缠效果以及相应的配准精度,配准精度对比则实验对比在不同的平移量、加入不同大小的高斯白噪声、不同混叠情况下,本文所提SVD-IIM方法与已有的SVD方法[11]、SVD-RANSAC方法[12],CC-centriod[13]方法和fast-SSDFT[8]方法这4种方法的配准精度。
2.1 校正效果实验
对上文所述的高分2号数据在光谱维上取均值得到其灰度图像,在其中选取一幅大小为1 280像素×1 280像素的原始参考图像,如图4(a)所示。将其在原灰度图像上分别在行方向平移541个像素和在列方向平移548个像素,得到另一幅平移后的原始待配准图像,如图4(b)所示。那么这两幅灰度图像的平移关系为(541,548),分别对两幅图像进行10倍降采样得到两幅大小为128像素×128像素的图像,如图4(c)和4(d)所示,因此其平移关系变为(54.1,54.8)[18]。
按照图1所示的流程计算图4(c)和图4(d)的归一化互功率谱矩阵Q(u,v),并滤除其中的高频分量和小于特定阈值的频率分量,再对Q矩阵进行SVD分解得到最大奇异值对应的奇异向量u和v,分别利用传统积分法和改进的相位解缠方法对u和v的相位进行相位解缠。利用最小二乘法分别对图5(b)、5(d)所示的解缠相位值的斜率进行估计,其配准结果如表1所示,显然传统积分法的误差远远大于改进的相位解缠方法的误差。由图5(b)、5(d)可以看出,改进的相位解缠算法能对传统积分法得到的结果进行很好的校正,因此当参考图像和待配准图像之间平移量较大时,即当相邻像素点之间相位差的绝对值接近或超过p时,利用传统的积分法相位解缠得到的结果并不可靠,而经过改进的相位解缠方法可以精确地估计出平移参数。
图3 GF-2数据(a,b)和ZY-3数据(c,d)Fig.3 Imagery of GF-2(a,b) and ZY-3(c,d)
图4 原始配准图和10倍降采样后的配准图Fig.4 Original images and images after 10 times downsampling used for registration
表1 传统积分法和改进相位解缠方法配准精度比较Table 1 Precision comparison between the traditional integral method and the improved phase unwrapping method
2.2 配准精度对比实验
对上文所述的高分2号数据和资源3号数据在光谱维上取均值,利用得到的灰度图像进行配准精度对比试验,选取大小为1 280像素×1 280像素的子图为原始参考图像,以其为基准进行不同程度的平移,得到原始待配准图像。分别对原始参考图像和原始待配准图像进行10倍降采样得到实验所用的大小为128像素×128像素的配准图像。图6和图7为本文提出的SVD-IIM方法与其他4种方法分别在高分2号数据和资源3号数据上进行的对比结果。其中图6(a)、6(d)和图7(a)、7(d)为对于不同平移量的绝对误差对比示意图,其中图6(a)和图7(a)平移量为57~62个像素,图6(d)和图7(d)平移量为55~60个像素,步长均为0.1个像素;图6(b)、6(e)和图7(b)、7(e)为在加入不同高斯白噪声情况下的绝对误差对比示意图,将配准图像归一化至0~256,加入标准差为6~10的高斯白噪声,真实平移量为(59.4,7.8);对待配准图减采样之前的原图进行不同程度的高斯模糊可以模拟不同情况下的混叠,而高斯模糊等价于低通滤波器[2],图6(c)、6(f)和图7(c)、7(f)为在不同混叠程度下的绝对误差对比示意图,高斯模糊窗大小为25×25,模糊因子为高斯函数的标准差, 真实平移量为(59.4,7.8)。图中所有绝对误差为100幅随机选取的待配准图像配准误差的平均值。
图5 相位解缠结果示意图Fig.5 Schematic of the phase unwrapping results
图6 GF-2数据配准精度对比图Fig.6 The contrast diagram of GF-2 data registration accuracy
图7 ZY-3数据配准精度对比图Fig.7 The contrast diagram of ZY-3 data registration accuracy
如图6(a)~6(c)和图7(a)~7(c)所示,对于不同的平移量、加入不同大小的高斯白噪声、不同混叠情况下,本文提出的SVD-IIM方法的误差都在0附近,而原有的SVD方法和SVD-RANSAC方法的误差都在10个像素以上,因此可以进一步确定在平移量较大时传统积分法得到的相位解缠结果是错误的,而改进的相位解缠方法所得到的结果是可靠的,并且精度较高。
图6(d)~6(f)和图7(d)~7(f)对比在不同平移量,加入不同高斯白噪声,不同混叠情况下的3种方法的配准精度,可以看出本文提出的SVD-IIM方法的误差相比于CC-centriod方法和fast-SSDFT方法的误差更小,并且更稳定。对于较大平移量的配准问题,参考图像和待配准图像间存在较大的非匹配区域,这些非匹配区域的信息在估计平移参数时如同噪声,因此在存在大量噪声的情况下,本文提出的SVD-IIM方法可以将配准精度控制在0.1个像素范围内。
3 结束语
本文针对基于奇异值分解(SVD)的相位相关法中传统积分法进行相位解缠的可靠性问题,利用线性相位单调变化的特性,提出一种改进的相位解缠方法,对传统积分法得到的结果进行校正,可以精确得到真实相位值,使得对于两幅平移量较大的待配准图像可以稳定并准确地估计出其平移参数。本文用真实光学图像的实验验证了本文提出的SVD-IIM方法在配准问题上相比于原有的SVD方法、SVD-RANSAC方法、CC-centriod方法和fast-SSDFT方法更具鲁棒性和准确性,具有重要的应用价值。