APP下载

H.265/HEVC视频编码标准性能评估与分析

2018-11-26徐山峰王兆伟孙治水王行建

中国电子科学研究院学报 2018年5期
关键词:压缩率编码器时延

谢 佳,徐山峰,王兆伟,孙治水,王行建

(中国电子科学研究院,北京 100041)

0 引 言

目前,安防监控、在线聊天,视频会议、数字电视、图像识别等领域,对视频编码的需求越来越大,要求也越来越高。随着专业硬编码芯片性能的不断提升,传输带宽的大幅拓宽,硬件平台和传输网络能够容忍的视频编码的计算开销和带宽开销越来越大。随着视频编码技术的更新换代,业界先进的视频编码标准层出不穷,H.265、Thor、AOMedia Video1、Daala等新标准百家争鸣。华为、中国电科海康威视、思科、谷歌、Mozilla等高新技术企业或相关专业组织对视频编码专利池和市场份额的竞争也趋于白热化。纵观剑拔弩张、竞争激烈的视频编码领域,H.265/HEVC是比较主流的标准之一,同时也是主流芯片厂商兼容的标准之一。H.265/HEVC相对于H.264/AVC在性能方面究竟提升了多少,同时在开销方面是否能够接受,H.265/HEVC的“性价比”到底高不高,在业界有一定争议。怎样基于成本投入所决定的硬件性能,更好的选择H.265/HEVC的应用场景,是需求方需要慎重考虑的。本文基于这个问题,展开分析与研究。

2013年6月7日,ITU-T网站上正式发布了H.265/HEVC标准[1]。2013年11月25日,ISO/IEC正式发布了H.265/HEVC标准[2]。H.265/HEVC最大可以支持8192X4320分辨率的视频编解码处理。

类似于以往的国际标准,H.265/HEVC采用混合编码框架,如图所示,包括变换、量化、熵编码、帧内预测、帧间预测和环路滤波等模块[3]。

图1 H.265/HEVC编码框架[4]

图2 H.265/HEVC的宏块划分比H.264/AVC更灵活、更高效

H.265/HEVC采用了基于四叉树的灵活块分割结构[5、6]、不同角度的帧内预测模式[7~10]、自适应的运动矢量预测AMVP、合并技术Merge、可变尺寸的离散余弦变换、模式依赖的离散正弦变换[11]、性能更高的CABAC[12],以及新的样点自适应补偿SAO[13]等更加先进的技术。

1 H.265/HEVC采用的新技术

编码单元方面, H.264/AVC中仅采用了4X4/8X8的DCT变换,而H.265/HEVC中DCT变换的最大尺寸为32X32,这种大尺寸变换单元的选择可以是编码器在处理高分辨率画面中经常出现平坦区域时能充分提高压缩率。

帧内预测方面,在H.264/AVC中,基于4X4大小的编码块采用9中预测模式,基于16X16大小的编码块采用4种预测模式。为了应对高清视频纹理的多样性,H.265/HEVC针对亮度信号提供了35种预测模式,包括33种角度预测和DC预测模式、Plannar预测模式,从而更好地匹配视频中复杂的纹理,提高预测效果,去除冗余空间。

图3 H.265/HEVC和H.264/AVC帧内预测模式比较

帧间预测方面,相对于H.264/AVC,为了提升性能,H.265/HEVC引入了运动信息融合技术(Merge)、运动矢量预测技术(AMVP)和基于Merge的Skip模式。这些技术利用空域相关性和时域相关性来减少相邻编码单元之间的运动参数冗余。

图4 H.265/HEVC基于四叉树的转换单元分割方式

每个编码单元可以以四叉树的方式递归分割为转换单元。与H.264主要以4×4转换,偶尔以8×8转换所不同的是,H.265有若干种转换尺寸:32×32、16×16、8×8和4×4。从数学的角度来看,更大的转换单元可以更好地编码静态信号,而更小的转换单元可以更好地编码动态信号,大大提高了编码效率。

H.265/HEVC采用的SAO滤波技术,对编码后重构图像的方块失真,起到了补偿重构、减少振铃效应失真的目的。H.265/HEVC采用的IBDI技术,提高了编码器的编码精度、降低了帧内/帧间预测误差。同时通过引入参考帧压缩算法,降低了重构图像的数据量。H.265/HEVC采用的ACS技术[14],基于4X4编码单元,即将一个TU划分成多个4X4块单元,每个4X4块单元内部和各个4X4块单元之间都按照相同的扫描顺序进行扫描。

综上,H.265/HEVC在编码方面引入了大量新的技术体制,编码压缩率和图像质量都比H.264/AVC有了显著提高。同时,不可避免的,H.265/HEVC的算法复杂度更高,计算开销也更大。

2 图像质量评价指标

本文综合运用PSNR和SSIM对视频编码图像质量进行联合评价。

PSNR是一种客观评价指针,其值通常为20~60,且和图像质量呈正比例关系。对于第n帧图像,大小为Ncal×Nrow的数字化图像Ys(n,i,j)和参考图像YD(n,i,j),其PSNR计算公式如下:

PSNR(n)=

其中,Vpeak=2k-1,k是对于亮度部分用几个位来表示一个像素的值。

SSIM是一种接近人眼主观感受的评价指针,其值为0~1,且和图像质量呈正比例关系。SSIM相关的亮度比较公式如下:

式中,uXuX和uYuY表示XX和Y图像的均值,C1=(K1L)2C1=(K1L)2,SSIM相关的对比度比较公式如下:

式中,σX和σY表示XX和Y图像的方差,C2=(K2L)2C2=(K2L)2,SSIM相关的结构比较公式如下:

式中,σXYσXY表示XX和Y图像的协方差,C3=C2/2C3=C2/2,XX和Y图像的结构相似度表示为:

SSIM(X,Y)=l(X,Y)·c(X,Y)·s(X,Y)=

式中,C1、C2、C3为常数,一般取K1=0.01,K2=0.03,L=255。

3 性能评估实验

为了对H.265/HEVC的编码性能进行综合评价,本文从https://people.xiph.org/~tdaede/sets/video-hd-1/sintel_trailer_2k_1080p24_2s.y4m下载原始视频序列,通过H.265/HEVC编码器对该视频序列进行编码压缩。该视频序列共48帧,持续2秒,分辨率1920X1080,大小149.3MB。为了直观体现H.265/HEVC的性能,本文将H.265/HEVC和H.264/AVC的编码性能进行比较。其中以X265作为H.265/HEVC的工程实现,以X264作为H.264/AVC的工程实现。主要分析H.265/HEVC、H.264/AVC的压缩比、压缩图像质量、编码时延等技术指标。

本实验的步骤如下:

(1)通过ffmpeg将原始Y4M视频序列转换为YUV视频序列;

(2)通过设置X265/X264编码进程的命令行参数“—crf”(取值0~51,取值越大图像质量越差,压缩率越高),对YUV视频序列按照不同的压缩比进行编码压缩,形成.265/.264视频编码文件,并通过时间戳计时折算编码时延;

(3)通过ffmpeg将编码压缩后的.265/.264文件分拆成48帧静态编码BMP图片;

(4)通过ffmpeg将YUV文件分拆成48帧静态原始BMP图片;

(5)按照PSNR和SSIM公式计算比较每帧编码BMP相对于原始BMP的SSIM和PSNR;

(6)利用GNUPLOT绘制SSIM和PSNR曲线变化图。

3.1 图像质量

详见下图

3.2 编码时延

视频压缩中,每帧代表一幅静止的图像。为了提高压缩率,通常采用I/P/B帧编码序列来提高压缩率。I帧是关键帧,只做帧内预测;P帧相对于前面的I帧做帧间预测;B帧是双向预测帧,即相对于前、后I/P帧做帧间预测。B帧的压缩率更高,但计算开销也更大。

图5 H.264/AVC每帧图像的编码后质量(PSNR/SSIM)

图6 H.265/HEVC每帧图像的编码后质量(PSNR/SSIM)

图7 不同压缩比条件下H.264/AVC和H.265/HEVC的平均图像质量(PSNR/SSIM)

X264相对于X265的优点是“性价比”高,X265相对于X264的优点是压缩率高、画质高。为了在压缩率和计算开销之间进行折衷,同时更好的突出编码器自身的优点,在默认情况下:X264采用I/P帧编码序列,即计算开销相对较小的方式进行处理;X265采用I/P/B帧编码序列,即压缩率相对较高的方式进行处理。

为了衡量计算开销,本文在同一台Intel P8400 2.26 GHz双核处理器、1.9 GiB内存的笔记本电脑上,进行编码实验,分析X264、X265的编码时延。其中编码时延的计算是通过时间戳计时折算得到。

表1 H.264编码时延有关信息

表2 H.265编码时延有关信息

3.3 编码效果图

图8 视频序列原图

图9 H.264编码效果图(压缩比1:503.2)

图10 H.265编码效果图(压缩比1:482)

从图8、9、10的编码效果图可以看出,在相近压缩率的条件下,H.265对于诸如头发、腰带等图像细节部分和扣衣服扣子的手等图像运动部分的处理上,比H.264画质更高、更清晰。

4 实验结论

(1)在同等图像质量情况下,H.265比H.264平均节省约30%~50%的码率,且压缩的越狠,这种趋势越明显;

(2)H.264每帧图像的质量波动比H.265相对平滑;

(3)H.265在提高压缩率和图像质量方面性能的同时,计算开销比H.264扩大了10~20倍。换句话说,H.265需要更加强大的硬件支撑。

本实验对H.264和H.265的编码性能进行了理论计算和综合比较,并完成了可视化评估。通过以上工作,系统、直观得洞悉了H.265相对于H.264在编码性能方面的提升,同时对二者的编码开销进行了评估,为在不同应用场景和设备条件下视频编码器的选择提供了依据。

猜你喜欢

压缩率编码器时延
融合CNN和Transformer编码器的变声语音鉴别与还原
5G承载网部署满足uRLLC业务时延要求的研究
基于GCC-nearest时延估计的室内声源定位
水密封连接器尾部接电缆的优化设计
缠绕垫片产品质量控制研究
某型飞机静密封装置漏油故障分析
基于双增量码道的绝对式编码器设计
分布式多视点视频编码在应急通信中的应用
简化的基于时延线性拟合的宽带测向算法
基于数字信号处理的脉冲编码器