APP下载

改进的空间下采样视频转码快速运动估计算法

2012-01-18刘续普

电子设计工程 2012年23期
关键词:宏块转码码流

马 萌,刘续普

(上海海事大学 上海 200135)

近来数字多媒体接入设备,比如智能手机,平板电脑,有了很快的发展。随着内容呈现格式的增加,如何能将压缩的视频流在异构网络中不同发送和接受设备间转换成了一个研究热点[1]。

文中提出可以通过预测2个待选最佳预测运动向量作为EPZS快速运动估计的预测中心来提高预测的精准性,并根据当前宏块对应转码前区域的宏块运动矢量的一致性和视频运动性自适应的调整搜索策略。结果显示这个效果比传统方式运动矢量合成算[2-4]相比有更好的视频质量,降低了转码的计算复杂度。

1 概 述

基于H.264编码标准[5]的视频转码今年来随着H.264标准的普及开始成为近年来国内外研究的热点问题。H.264是一个面对未来IP和无线环境下的视频压缩标准,在视频压缩效率方面比目前所有的视频压缩标准都有显著提高。由于运动估计和运动补偿需要占用H.264编码中60%的编码时间,如果在转码中重新对宏块进行运动矢量预测和修正,计算量太大,难以满足实时性要求。为此,利用输入码流中的信息来减少计算量,是提高转码速度的有效途径。在运动重估计算法的研究中,文献[6]提出了一种新的运动矢量重估计的体系结构AMVR-DIM。与传统的运动矢量合成算法相比,该算法有效地提高了降采样视频转码中运动预测的精确性。这种方法引入了运动矢量的多样性和宏块重要性的概念用以控制宏块编码模式和搜索策略,由于使用了固定阈值来选择宏块的重编码模式,在对一些视频序列转码时,可能会造成码流过大。本文基于AMVR-DIM架构提出了新的视频转码快速运动估计算法。

2 视频转码快速运动估计算法

2.1 基于输入码流信息的备选运动矢量的合成

对于输入码流信息的运动合成算法,文中采用基于距离激励的Alpha-均值滤波。Alpha-激励均值滤波的特点是通过消除候选者中偏差过大的来预测。这个策略主要包含两个阶段。首先,通过由大到小整理所有候选的预测运动向量。其次,利用一个预先确定的加权因子α来决定是否消除候选运动向量的数目。这个Alpha-激励均值滤波器的公式如下:

其中α在0到0.5之间;mvi代表第i个运动矢量;M是运动矢量的数目;代表了去最小的值。因为中值算法是所有传统算法中进行下采样转码效果最好的。从而利用Alpha-激励均值滤波的概念来提高下采样的精准度,将其作为从原始码流中提取运动矢量合成最佳预测运动矢量的标准。

2.2 转码前区域的运动矢量多样性分析

在 2:1的空间分辨率降尺度转码中,输出图像中每个目标宏块由输入图像的 4个宏块降采样得到。一个目标宏块的运动矢量多样性特征是由与之对应的 4个原始宏块MV之间的相互关系决定的,其分别对应于3种情况,具体如图1所示。

1)4个MV大小方向完全一致,如图1(a)所示,此时预测运动矢量直接可以作为当前宏块的运动矢量,再进行小范围运动求精搜索即可。

2)4个MV大小方向差别不大,即多样性低,一致性高,如图1(b)所示,可以在预测运动矢量周围进行范围较大的运动搜索。

3)4个MV大小和方向差别大,即多样性高,一致性低,如图1(c)。合成运动矢量较难准确预测转码后的运动矢量,如果直接使用该合成运动矢量,会造成较大的图像矢量损失。此时,可以采用结合已转码码流信息合成的另一备选预测运动矢量,利用下文采取的策略(自适应阈值)共同确定运动搜索的中心,并且加大运动搜索的区域,提高运动估计的准确性。

图1 宏块运动矢量间的差异性Fig.1 Difference of motion vector of macro block

本文采用方差作为一致性的测度因子

其中,

其中,mvi0,mvi1分别为第i个宏块运动矢量的水平与垂直分量;与表示当前4个宏块中mv的平均值 (水平与垂直分量)。

2.3 基于已转码码流信息的备选运动失恋的合成

从已转码码流中预测当前宏块的最佳运动矢量可以选取H.264标准中帧间预测的方法,下面简单介绍一下。

如图2,E为当前宏块或宏块分割子宏块。A、B、C分别为E的左、上、右上方的3个相对应块。如果E的左边不止一个分割,取其中最上的一个为 A;上方不止一个分割时,取最左边一个为B。下面左侧显示所有分割有相同尺寸时的邻近分割选择。下面右侧图给出了不同尺寸时临近分割的选择。

图2 已转码码流的帧间预测合成备选运动矢量Fig.2 Motion vector candidate synthesizeusing inter-prediction of transcoded stream

其中:

1)传输分割不包括 16×8 和 8×16 时,MVp 为 A、B、C 分割MV的中值;

2)16×8分割,上面部分 MVp由 B预测,下面部分 MVp由A预测;

3)8×16分割,左面部分 MVp由 A预测,右面部分 MVp由C预测;

4)跳跃宏块(skipped MB),同 1)。

如果右图所示的已传送块不提供时 (如在当前片外),MVp选择需重新调整。在解码端,MVp以相同方式形成并加到 MVD上。对跳跃宏块,不存在 MVD,运动补偿宏块也由MV直接生成。

依据此种H.264帧间预测方法从已转码码流中预测最佳运动矢量,作为备选之一。

本论文共采用2个备选最佳预测中心,并通过宏块运动矢量间的差异性等策略灵活选择备选运动矢量,并作为EPZS的预测矢量,可以提高预测的精准度,从而使后面的率失真优化计算量降低。

2.4 运动搜索中心的选择及搜索模式的调整

根据上下文分析,本文算法根据当前宏块的Var的大小,将运动估计的搜索中心和搜索模式分为一下3中情况进行调整:

1)Var

2)Var>Div2,此时当前宏块对应的转码前区域的运动矢量差别较大,合成的运动矢量无法准确预测当前宏块的运动矢量。此时,根据本文策略,可以采取的方法为:将从转码前区域的运动矢量合成的备选运动矢量,以及从已转码码流利用帧间预测得到的另一备选运动矢量共同作为快速运动估计算法EPZS的预测中心,替代原始EPZS的预测中心,进行EPZS快速运动估计,并利用了精细化搜索以及早停止。实验证明这两个备选的运动矢量作为预测中心较原始EPZS算法有更低的复杂度和更好的效率。

得到这两个备选预测中心后,通过公式(3)获得最佳预测中心,其中 m=[mx,my]T,p=[px,py]T是测试中的备选预测中心,x,y是空间位置坐标,λmotion是拉格朗日因子。 R(m-p)代表运动信息代价。

其中,SAD的计算是利用公式(4)得到,式中s代表输入视频信号,c代表解码后的参考帧。

B=16,8,4

最后,对每个转码宏块通过钻石模板进行运动搜索,并利用上文提及的早停止策略。

3)Div1

本文选用了 2个自适应的阈值作为判别多样性的高低的门限,如下所示:

其中,

表示一帧中所有块的方差平均值;λ1,λ2是高低阈值的加权系数,随着视频序列的不同而改变。在运动平缓的视频序列中,一帧图像中大部分宏块变化很少,对这些宏块使用传统的运动矢量合成方法即可得到较好的预测。故可以利用较大的λ2抑制帧内刷新等模式的使用,以避免造成编码长度的冗余。相反,在运动剧烈的图像中,由于大部分宏块不适宜只用单一运动矢量来表示,可以通过改变λ1,λ2来降低预测模式中单个mv模式预测所占的比例,以提高预测的准确度。

2.5 宏观算法流程

本文宏观算法流程如图3所示。首先利用基于距离激励的α均值滤波合成运动矢量一,作为备选预测中心之一;然后利用已转码码流的临近宏块通过帧间预测得到另一个备选预测中心。再对当前宏块对应的转码前区域进行多样性分析,并根据当前帧的运动活跃因子调整运动矢量多样性判别的阈值。最后由计算得到的当前宏块多样性因子和判断阈值Div1,Div2,选择合适的搜索中心和搜索策略。

图3 快速运动估计算法流程Fig.3 Algorithm flow of fast motion estimation

3 实验与仿真结果

本文在 P4 3.2 GHz、1G RAM、VC++2008的环境下进行转码测试。输入码流为使用JM12.0编码 CIF尺寸的H.264码流。采用simple profile编码,IPPP……结构,帧间预测只采用了 P16×16模式,Q=28,帧率为 30 f/s。转码器使用 CPDT结构,转码后的分辨率降为QCIF尺寸。本文所采用的方法能够达到与 DIM[6]相近的转码速率,在保持较高视频质量的同时能够有效地控制比特率大小。

表1列举了对不同视频序列进行转码的平均信噪比及转码后的码流大小。与传统的运动矢量合成方法相比,DIM[6]算法的信噪比有所提高,但是也增加了码流的长度。尤其是在平缓的视频序列中,使用文献[6]中的固定门限方法可能会带来编码长度的急剧上升。相比之下,本文提出的自适应阈值方法,更利于低带宽情况下码流的传输。

表1 不同测试序列的峰值信噪比与码流长度的对比Tab.1 Performanceof PSNRand bitstreamof differenttestsequence

在运动剧烈的视频序列中,本文算法在相近的码率下得到了更高的信噪比。而对于平缓序列,本文算法能够降低计算复杂度,以较小的图像质量损失换取了码流长度 25%~50%的下降。

4 结束语

对于视频空间分辨率下采样转码,文中提出一种基于输入码流信息和已转码码流信息并利用EPZS方法的快速运动估计算法。该算法利用输入码流的运动矢量来计算宏块合成备选运动矢量一,利用已转码码流信息合成备选预测运动矢量二,共同作为EPZS快速运动估计算法的2个预测中心。根据宏块运动活跃性(利用输入码流的宏块模式信息计算编码帧的运动活跃性),自适应地选择重编码模式,在对多组视频序列的H.264空间分辨率下采样转码中获得了较高的图像质量,并有效控制了码流的大小。

[1]Xin J,Lin C W,Sun M T.Digital video transcoding[J].Proceedings of the IEEE,2005,93(1):84-97.

[2]Ahmad I.Video transcoding:an overview of various techniques and research issues[J].IEEE Transactions on Multimedia,2005,7(5):793-804.

[3]Bjork N,Christopoulos C.Transcoder architecture for video coding[J].IEEE Transactions on Consumer Electron,1998,44(2):88-98.

[4]Shanableh T,Ghanbari M.Heterogeneous video transcoding to lower spatio-temporal resolutions and different encoding formats[J].IEEE Transactions on Multimedia,2000,2(2):101-110.

[5]Wiegand T.Overview of the H.264/AVC video coding standard[J].IEEETrans.Circuits Syst Video Technol.,2003,13(7): 560-576.

[6]Fung K T,Siu W C.Diversity and importance measures for video downscaling[C]//Proc.of IEEE International Conference on Acoustics, Speech and Signal Processing,2005:18-23.

猜你喜欢

宏块转码码流
数字电视TS码流协议简要分析
天津台新闻云系统外来视频文件转码方案
视频转码技术在广播电视中的应用研究
基于运动估计与补偿的雷达拼图预测分析*
基于IPTV点播业务的视频分段式转码方案的研究与应用
基于选择特征宏块的快速视频稳像
一种比较ASN.1码流差异的方法
基于梯度的CCSDS压缩码流控制算法研究
IRD对TS流的处理
IP网络丢包条件下的H.264高清视频实时解码问题分析