APP下载

基于DWT和视觉加权的图像质量评价方法研究

2011-07-17蒋铭马兆丰辛宇钮心忻杨义先

通信学报 2011年9期
关键词:人眼主观图像

蒋铭,马兆丰,辛宇,钮心忻,杨义先

(1.北京邮电大学 网络与交换技术国家重点实验室信息安全中心,北京 100876;2.北京邮电大学 网络与信息攻防技术教育部重点实验室,北京 100876;3.天柏宽带网络科技(北京)有限公司,北京 100086)

1 引言

图像质量评价是图像处理中常考虑到问题,如图像传输、处理及压缩等技术中图像降质问题,人们越来越注意研究结合基于人眼视觉特性的图像质量评价方法。

图像质量主观的评价方法由于具有耗时长、费用高、稳定性差等固有缺点的限制,很少在图像质量评价中被采用。图像质量客观评价方法仍有许多不完善之处,但其仍是图像质量评价的主流发展方向。传统的图像质量客观评价方法,主要通过计算图像的统计误差来实现图像质量的评价,如均方差(MSE, mean square error)、峰值信噪比(PSNR[1],peak signal noise ratio),还有包括基于图像的高阶累积量的无参考的图像质量客观评价方法。然而对于最终接收者是人的应用场合,采用以上纯粹的基于统计量的客观评价方法得到的结果与由主观方法得到的结果存在着一定的差异。如文献[2]直接指出了峰值信噪比不宜用来评价信息隐藏技术[3],因为PSNR在评价信息隐藏中数字水印技术的不可感知性指标上存在缺陷。因此更加符合实际需要的客观图像评价标准还有待建立和完善。

Eskicioglu等人指出[4],在客观评价方法中引入一些简单的视觉模型,可以提高客观评价方法与主观评价方法的关联度。这表明,图像质量的评价与人眼的视觉模型是两个不可分割的部分。因此,在实现图像质量的客观评价方法时,如果能将人眼的视觉特性考虑进去,将提高评价效果。

Mannos等人最先利用人眼视觉特性,建立相应的模型,并应用于图像质量的客观评价中[5]。之后很多研究者对Mannos等人的方法进行了扩展,深化,提出了很多基于人眼视觉模型的图像质量客观评价方法。M.iyahara M等人[6]基于人的视觉特性[7]和大量的工程实验,给出了用于图像编码质量评价的PQS(picture quality scale)方法[8],该方法是建立在 CCIR500系列图像质量评价标准定义的图像质量尺度的基础上的图像质量客观评价方法,既考虑了全局特征,如随机误差,也考虑了局部化的干扰,如块效应、关联误差及边缘误差。它是通过求各种失真因子来最后给出评判值,其不足是对很好和很差图像的质量评价结果同MOS方法不十分一致。Wang Zhou和Bovik等人在2002年首次提出了结构信息的概念[9],并给出了一种通用图像质量指数UIQI(universal image quality index),该方法考虑了3个误差因素:相关性丢失、亮度失真、对比度失真。作者认为:人眼视觉的主要功能是提取背景中的结构信息,而且人眼视觉系统能高度自适应地实现这一目标,因此对图像结构失真的度量应是图像感知质量的最好近似。在此基础上给出一种符合人眼视觉系统特性的图像质量客观评判标准:结构相似指数SSIM(structural sIMilarity)[10,11]。同时SSIM也考虑了3个误差因素:相关性丢失、亮度失真、对比度失真。但结果比 UIQI稳定,性能好。还有一些边缘的图像质量客观评价方法,如马苗等人在文献[12]中给出了一种基于灰关联 GL(grey correlation)的图像质量评价方法等。

由小波分析理论可知,对图像进行小波变换后,在小波域可以得到图像的多个频带的信息,各频带都是原图像不同分辨率的子图,保持着原图像的基本轮廓。由人眼的视觉特性曲线可知,人眼最为敏感的就是图像的轮廓信息。因此小波分析的多分辨率特性适合人类的视觉特性。考虑到HVS对图像信号的空间方向敏感性不一致,而原图像的整体信息又和各子图像小波系数的大小关系密切,由此出发,本文提出了一种新的客观质量评价算法——基于小波变换的视觉加权峰值信噪比(WVWPSNR,wavelet and vision_weighted peak signal noise ratio)。该方法将图像的DWT和HVS特性相结合,利用子图分解以及视觉加权处理实现图像质量的客观评价。

2 基于MSE的图像质量客观评价方法缺陷

其中,1≤l≤L,L=1 000。这里x(l)为选取的原始DCT交流系数,w(l)为符合高斯分布的伪随机水印序列,a为水印强度,x1(l)为嵌入水印后的序列。为了简化起见,这里定义一个称为嵌入偏移参数的量m,用于指定水印嵌入起始点相对于最大交流系数的偏移。因此,对于Cox的算法,m=0。这里选取m=0,m=10 000及m=50 000这3种情况,选取的水印强度a都是300,根据刘瑞祯等人的结果[14],这3种

图像质量的评价广泛应用于医学成像系统技术、图像视频压缩技术、人脸识别技术等多种场合。这里选取一个数字水印的例子,来说明基于统计量的图像质量评价方法存在的缺陷。水印算法采用Cox等人提出的基于扩频通信的数字水印算法[13]。

由于这个例子主要是为了证明基于统计量的图像质量评价方法存在的缺陷,而并没有考虑数字水印方面的要求,比如不可感知性和顽健性,因此很多参数的选取都是为了证明基于统计量的图像质量评价方法存在的缺陷的需要而设定。在Cox的水印算法中,将图像进行DCT变换,然后将DCT系数按绝对值大小排列成一维序列,选取系数最大的1 000个交流系数作为嵌入水印的宿主媒体,按式(1)嵌入水印。情况下的MSE应该相等,实验中有些偏差,认为是量化误差,所得结果如图1所示。

图1 MSE评价图像质量的缺陷

图1可以看出,几乎相同的MSE表现出的图像质量的主观评价存在很大差异,图1(d)的主观评价分肯定要比图1(b)高。根据本文后述算法得出的3幅失真图像与原始图像之间的质量评价值分别为:27.173dB、33.536dB和37.949dB。结果更为符合主观评价值。因此,研究人眼视觉系统及其特性,建立相应的人眼视觉模型并将其应用于图像质量评价中,将是一件很有意义的事情。

3 基于DWT和视觉加权的图像质量客观评价方法

算法的立论依据是将图像的DWT和人眼视觉特性有机地结合起来。由于 HVS对加载于不同空间方向和频率子图像上的噪声具有不同的敏感度。结合小波分析理论,图像经从DWT最终可被分解为一系列相互独立的,对应于不同空间位置和方向的空间频率通道。研究[15]表明,五到六级的小波分解与 HVS的低级信息处理机制最为接近,更加符合人眼视觉特性,但过大的数据运算量抵消了其实用价值,因此,一般认为四级小波变换是一种兼顾计算复杂性和精确性的折衷方案。

算法实现步骤如下。

1) 对标准图像与降质的目标图像分别进行四级DWT变换,各分成13个子图图像。

2) 每次只将原始图像的一个子图置换为目标图像对应子图而保持原始图像其余子图不变,然后进行逆DWT变换,得到修改过的图像。将它与原始图像通过MSE算法进行计算,得到一个MSE值。

3) 由于四级DWT变换将图像分成了13个子图像,所以依次按步骤2执行,即可以得到13个MSE,分别用MSE(j,θ)表示。

MSE(j,θ)是指子图像(j,θ)对应的单子图目标图像的MSE值,其中j代表小波分解级数(j=1,2,3,4);θ代表每层小波分解后子图对应的 4个方向(θ=1,2,3,4),以3级小波分解为例,每层分解产生的子图及其对应的方向示意图如图2所示。

图2 图像三级小波分解及对应方向示意图

4) 加权值的计算:对图像进行小波变换后,各子图图像质量对原始图像质量的影响不尽相同,低频成分影响最大,这里用子图的F(j,θ)(式(2))来表征子图像系数的能量大小。

F(j,θ)的计算公式如下:

其中,fxy(j,θ)代表子图像(j,θ)的小波系数,M、N分别表示小波子图的长与宽。α参数为控制比例参数,经过实验分析,α一般取值为0.5~1。由于小波分解为四级,所以F(4,4)值最大,对应着DWT变换的低频子图像。并通过(式(3))计算各个子图像与四级小波低频子图像在图像能量上的比例因子,即归一化系数W(j,θ),并将此系数作为该子图像质量影响原始图像质量的归一化权重系数。容易发现,W(j,θ)=1,即第四级小波低频子带影响最大,符合小波理论知识。其中W(j,θ)计算公式如下:

计算结果见表1。

表1 lena图像加权系数W(j,θ)

5) 确定各子图的视觉加权值后,计算原始图像和降质目标图像的加权均方误差WMSE,公式如下:

对于位深度为8bit的图像,其等效视觉加权峰值信噪比WVWPSNR为

4 实验结果分析

分别用主观评价方法,PSNR、SSIM、PQS、UIQI、GL和文献[16]中的WWPSNR方法及本文提出的 WVWPSNR客观评价方法对一系列降质图像进行质量评价,通过比较图像质量的主、客观评价结果来进一步验证本文方法的性能。

4.1 实验1

1) 实验目的。

验证WVWPSNR方法的可行性和有效性。

实验中选取LIVE图像质量估计库,由美国德州大学(The University of Texas)图像视频工程实验室(LIVE, laboratory for image and video engineering)免费提供[17]。该图片库包括多幅彩色的原始图像,还包括5 类失真图像:JPEG、JPEG 2000、White Noise (白噪声)、Gaussian Blur(高斯模糊)、FastFading(在fastfading 通道传输JPEG 2000码流的过程中发生错误而失真的图像) 。同时图像库还给出了平均主观评分差值(DMOS),DMOS 是主观评分均值(MOS, mean opinion score) 和满分(100) 的差值(DMOS= 100−MOS),且 DMOS的取值范围为[0,100]。本文通过DMOS计算出相应的MOS来作为主观评价值。考虑到前面所述图像质量客观评价方法都是在灰度图像上进行的,因此在实验中都是将算法作用于彩色图像中提取出来的灰度部分所得到的结果。

2) 实验方法与步骤。

分别采用传统的PSNR、SSIM、PQS、UIQI、GL等客观评价方法、WWPSNR方法以及本文的WVWPSNR客观评价方法对目标图像进行评价。

3) 实验结果。

采用上述方法获得的MOS值与客观评价结果如图3所示,横坐标表示测试图像序号,纵坐标表示对该图像进行质量评价的结果及 MOS值。由于各种图像质量的评价值区间不统一,为了能够较好地进行图示比较,部分评价值倍乘了部分常数。如0.5×MOS表示MOS值倍乘0.5。

图3 buildings图像质量主、客观评价对比

图3可以看出,随着图像主观视觉质量的升高,WVWPSNR评价结果表现出与图像质量主观分数MOS结果变化趋势一致的评价结果,验证了算法的可行性和可靠性。根据引言部分各种图像质量评价方式的分析表明,SSIM方法和UIQI方法性能优于其他评价方法,本文 WVWPSNR方法表现出与以上 2种方法变化趋势相似程度较高的结果,且WVWPSNR评价值与 MOS分数变化趋势更加接近,验证了本算法的有效性。

图4 图像质量评价对比

4.2 实验2

1) 实验目的。

比较各种图像质量客观评价方法性能,将其作用于上述图片库,将得到的客观评价值与已知的MOS分数进行了相关分析,验证客观评价结果与图像主观视觉质量的相符程度及算法的优越性、稳定性。

2) 实验方法与步骤。

将实验1中测得的目标图像的各种测试结果分别与 MOS进行相关性计算,求出图像质量客观评价方法与主观评价方法的相关系数。其公式如下:

其中,n为图像个数,MOS(i)表示MOS值,X(i)表示各种客观评价方法的测试结果。归一化相关系数NC越接近1,表示客观评价值与主观MOS值越具有线性相关性,即图像质量客观评价结果与图像主观视觉质量越相符。图4是评价图像质量对比图。

横坐标表示库中图像的种类数,纵坐标表示对各种图像进行的质量评价值与MOS值之间的相关系数。

以上质量评价对比图结果表明:PQS算法较差(由于该算法相关系数(如表2所示)与其他测试值相距甚远,不利于曲线显示),GL算法性能不够优良,SSIM算法和UIQI算法在对待White Noise处理的图像性能较弱,这是由于White Noise攻击的特殊性造成的,其余评价结果均符合主观评价标准。本文算法在各种方式处理后的图像质量评价中均和主观评价接近,主要由于本文算法所采用的小波分解特性更加符合人眼视觉特性。而对以上较常见的图像处理方式,PSNR算法具有一定的普遍性,但是性能普遍低于WWPSNR、UIQI及本文的算法。但由于其复杂度最低,因此应用广泛。

3) 实验数据分析。

对相关系数NC进行均值统计(如表2所示)和标准差统计(如表3所示)。

均值分析表显示本文所述方法的结果与主观评价方法的结果较为一致,所得的客观评价值与MOS值关联度更高,算法优越性更佳。标准差分析表达数据显示本文算法所得到的结果稳定性更加好。

4.3 实验3

比较上述各种图像质量客观评价方法性能特征,主要表现在算法是否与人类视觉特性 HVS相结合以及算法的复杂度。算法复杂度体现在以上各种算法对图像质量评价的时间。

表2 均值统计

表3 标准差统计

表4 算法时间统计

表5 算法性能特征

时间统计数据(如表4所示)表明PQS算法过于复杂,计算量大,速度慢,不适合实际应用。PSNR、SSIM、UIQI、及GL算法复杂度较小。本文算法复杂度不大,和WWPSNR相当。算法性能数据(如表5所示)表明除PSNR和UIQI算法,WWPSNR、SSIM、PQS、GL及本文算法均有效地结合了HVS。

综合考虑,本文算法复杂度不大,且结合了HVS,性能较好。

5 结束语

虽然目前图像质量客观评价方法仍然有许多不完善之处,但客观评价方法仍然是图像质量评价的发展方向。本文利用了图像的四级 DWT变换和 HVS思想实现了一种客观图像质量评价方法,评价结果与主观评价结果具有更好的关联度。目前还没有一种很好的,能够与 MOS完全一致的图像质量客观评价方法,因此,这需要进一步的研究。研究的方向包括继续提高现有的各种基于灰度图像的图像质量客观评价方法,寻找新的方法,以及研究基于彩色图像的图像质量客观评价方法等。图像质量的正确评价对于视频图像质量的评估有着重要的指导意义,在最新的视频压缩标准 H.264[18]中,在编码过程中对视频帧数据的质量评价除了传统的PSNR方法外,已经引进了 SSIM 的方法。对于整体图像信息工程的发展具有十分重要的意义,随着多媒体信息技术的高速发展,对图像质量评价的研究将越来越受到人们的重视。

[1]KATZENBEISSER S, PETITCOLAS F A P.Information Hiding Techniques for Steganography and Digital Watermarking[Z].Artech House, Inc.,2000

[2]尤新刚,郭云彪,周琳娜.峰值信噪比不宜用来评价信息隐藏技术[A].信息隐藏全国学术研讨会(CIHW2000/2001)论文集[C].西安: 西安电子科技大学出版,2001.129 -134.YOU X G, GUO Y B, ZHOU L N.PSNR is improper to evaluate steganography technique[A].China Inform a tion Hiding Workshop(CIHW2000/2001)Ana Lects[C].Xian: Xidian University Press,2001.292-134.

[3]钮心忻.信息隐藏与数字水印[M].北京:北京邮电大学出版社 2004.NIU X X.Information Hiding and Digital Watermarking[M].Beijing: Beijing University of Psots and Telecommunications Press 2004.

[4]ESKICIOGLU A M, FISHER P S.Image quality measures and their performance[J].IEEE Trans on Communication, 1995, 43: 2959-2965.

[5]MANNOS J L, SAKRISON D J.The effects of a visual fidelity criterion on the encoding of images[J].IEEE Trans Information Theory,1974, 4: 525-536.

[6]MIYAHARA M.Quality assessments for visual service[J].IEEE Communications Magazine, 1988, 26(10): 51-60.

[7]林仲贤、孙秀如编著.视觉及测色应用[M].科学出版社, 1987.6.LIN Z X, SUN X R.Vision and Color Measurement Application[M].Science Press.1987.6.

[8]MIYAHARA M, KOTANI K, ALGAZIV R.Objective picture quality scale (PQS) for image coding[J].IEEE Transactions on Communications, 1998, 46(9): 1215-1226.

[9]WANG Z, BOVIK A C.A universal image quality index[J].IEEE Signal Processing Letters, 2002 , 9(3): 81-84.

[10]WANG Z, BOVIK A C, SHEIKH H R,et al.Image quality assessment: From error visibility to structural similarity[J].IEEE Transactions on Image Processing, 2004, 13(4): 600-612.

[11]WANG Z, BOVIK A C, SIMONCELLI E P.Structural approaches to image quality assessment[A].Bovik A C.Handbook of Image and Video Processing(Second Edition)[C], New York, USA: Academic Press,2005:1-33.

[12]马苗, 丁力, 郝重阳.数字水印的透明性的灰评判[J].计算机工程与应用, 2003.22:22-23.MA M, DING L, HAO C Y.Judgment of the imperceptibility of digital watermarking based on gray correlation degree[J].Computer Engineering and Applications, 2003.22:22-23

[13]COX I, KILIAN J.Secure spread spectrum watermarking for mulitmedia[J].IEEE Trans on Image Processing, 1997, 6(12): 1673-1687.

[14]刘瑞祯, 谭铁牛.水印能量估计的一般性框架[J].计算机学报,2001, 24: 242-247.LIU R Z, TAN T N.A general watermarking framework for optimal energy estimation[J].Chinese Journal of Computers, 2001, 24: 242 -247

[15]BRADLEY A P.A wavelet visible difference predictor[J].IEEE Trans on Image Processing, 1998, 8(5): 717-730.

[16]丁艺芳.基于小波变换和视觉系统的图像质量综合评价新算法[D].上海: 上海大学, 2001.DING Y F.A New Algorithm for Integrated Image Quality Measurement Base on Wavelet Transform and Human Visual System[D].Shanghai: Shanghai University, 2001.

[17]SHE I H, WANG Z, CORMACK L,et al.LIVE image quality assessment database[DB/OL].http://live.ece.utexas.edu/research/ quality, 2006.

[18]毕厚杰.新一代视频压缩编码标准——H.264/AVC[M].北京: 人民邮电出版社, 2005.BI H J.A New Generation of Video Compression Coding Standard H.264/AVC[M].Beijing: Posts and Telecom Press, 2005.

猜你喜欢

人眼主观图像
“美好生活”从主观愿望到执政理念的历史性提升
巧用图像中的点、线、面解题
有趣的图像诗
加一点儿主观感受的调料
人眼X光
人眼为什么能看到虚像
闪瞎人眼的,还有唇
看人,星光璀璨缭人眼
主观评述构式“很+x”认知研究
遥感图像几何纠正中GCP选取