APP下载

高动态范围电视显示的非线性转换特性

2016-06-23

电视技术 2016年2期

陈 科

(中国电子科技集团公司第三研究所,北京 100015)

高动态范围电视显示的非线性转换特性

陈科

(中国电子科技集团公司第三研究所,北京 100015)

摘要:常规电视基于CRT低亮度范围显示技术已无法满足新型显示器要求。介绍了杜比和BBC公司的HDR光电转换特性,揭示了两种方案支持亮度高达2 000~10 000 cd/m2的技术细节。这两种方案基于人眼视觉系统特性,以较少的量化比特支持107高动态范围显示,对提高4K超高清图像质量有重大意义。

关键词:高动态范围;视觉系统;伽马校正

1人眼视觉感知范围

人眼视觉范围指人眼所能感知的亮度范围,从10-6cd/m2(注:1 cd/m2=1 nt)到了108cd/m2[1-2],范围(亮度比值)达到了1014(即1014∶1),而典型的景物亮度大致在105范围。当人眼适应了某一环境亮度后,其瞬时视觉范围可达到104(即同一瞳孔开度下可辨别的亮度范围)。现今的电视显示器对比度范围大致能做到2 000∶1,远小于人眼的感知范围。所以,人们从电视上所看到的仅仅是一个屏幕表现,而非真实世界景色的再现。图1真实世界中,人眼可感知的亮度范围从暗处的2 cd/m2到明亮处的10 000 cd/m2,其亮度分辨率能力远高于目前的任何显示设备。

传统显示器CRT曾长期占据显示屏的统治地位,

图1 真实世界的亮度值

CRT能提供的最高亮度不超过100 cd/m2。现代的视频显示器,比CRT显示器提供更高的性能。特别是可提供更明亮的图像和更深的黑色。换句话说,现代显示器可提供比CRT显示器更高的动态范围。现今消费级液晶显示器亮度可达到400 cd/m2,高质量产品可达到1 000 cd/m2,某些专门用途的商用产品则可实现4 000~5 000 cd/m2的高亮度。

目前以CRT为基础的光电转换特性标准限制了新型显示器表现真实景物亮度范围的能力,单方面提高显示器件的亮度范围仍无法实现高动态范围景物显示。本文介绍了杜比Vision和英国广播公司BBC提出的HDR(高动态范围)显示方案,二者从HDR需求出发,提出了新型的光电转换特性,可实现高达10 000 cd/m2的亮度,有效扩展了显示器的动态范围。

2电视系统的非线性光电变换

电视中的非线性最初来自使不同亮度等级上获得一致的噪声效果的理念。CIE规定了一个亮度的函数,使之尽可能接近人眼对亮度的响应,这函数关系大致是幂指数0.42。对于线性电视系统,同样的噪声量级,在暗区表现明显而在亮区则很弱。因此,模拟电视系统用非线性变换使主观视觉在不同亮度区看上去噪声处于相同的水平。在摄像机输出端,把信号用幂指数0.42加以压缩,而在显示器端把信号扩展,使整个系统的亮度传输基本线性,而视频噪声则在不同亮度区趋于一致。早期电视工程师利用CRT电-光转换的非线性来实现噪声均匀性要求,CRT的转换幂率为2.4(2.4大约是0.42的倒数)。

实际操作中,用于摄像机变换的预校正指数平均值为0.5,由ITU BT.709标准化。通过与显示器的2.4结合,整个系统的伽马值为1.2,即图2表示的系统伽马值。这种对前端信号的预校正补偿称为意图再现(rendering intent),是人眼在室内较暗环境观看图像较为适宜的变换值,它较好地反映了人眼视觉系统对真实世界景物的客观响应。

图2 伽马校正

视频信号数字化后,量化比特成为图像噪声的主要来源。量化级数直接影响动态范围,而且是图像中亮度差的重要体现,量化比特不足会在图像的平滑区域引入不规则的边界,这种现象被称为“条带”、“轮廓”或量化误差,图3表示一种极端的轮廓效应。BBC在1974年的研究表明[3],对于100∶1动态范围,8 bit已经使图像足够平滑,几乎看不出“轮廓”。

图3 不同比特深度产生的量化轮廓现象

电视演播室中常用10 bit视频,但实际中,使用BT.709的变换值,对增加动态范围几无贡献,因为多出来的2 bit用于最低有效位,指望提高暗区分辨率,可以降低最小黑电平,但不能增加屏幕的最高亮度。类似的情况,ITU BT.2020中提出的12 bit也不能增加屏幕的最高亮度。

BT.709规定从景物亮度到电信号的光-电转换关系,称为OETF。摄像机制造商希望能支持更高的动态范围,但BT.709只提供100∶1动态范围而无法实现。目前的摄像机甚至可支持16 bit视频动态范围,达到105量级。为规避BT.709限制,摄像机制造商在OETF曲线中加入一个“膝盖”状拐点,来延伸亮度范围,使信号不至于饱和[3],见图4。

图4 膝盖状拐点延伸摄像机动态范围 (截图)

采用不同的OETF可增加视频信号的动态范围。BT.709规定的伽马曲线设计目的,在于不同亮度下产生均匀的视频噪声,由此设计出近似于人眼视觉的主观亮度曲线。但是,视频信号数字化以后,视频信号量化的目标是避免产生量化的轮廓噪声,而不是提供均匀的感知噪声。所以,量化视频信号时,重点放在展现人类视觉系统的亮度范围感知能力,以及能够区分亮度差的能力。

3人眼视觉系统特性

量化视频信号希望避免轮廓,即相邻点的量化电平差。研究人眼视觉系统的韦伯定律指出,人眼可察觉的物理亮度差与亮度成正比。也就是说,在可察觉亮度差的边界上,韦伯分数(ΔL/L)趋于一个常数。研究表明,人眼锥细胞的韦伯分数在2%~3%之间,表示受试者能可靠地检测出物理亮度在2%到3%的变化[4-5]。

韦伯定律表明,对数关系的OETF将提供最大的动态范围,同时再现图像中察觉不到的量化轮廓。韦伯分数为2%表示可以获得100∶1的动态范围。使用233级量化电平,即709中的8 bit,没有可感知的轮廓。

这也就是说,人眼瞬时的亮度动态范围在104,这并非量化级要达到214=16 384才能满足分辨要求。例如亮度从0.1 cd/m2到1 000 cd/m2,动态范围104,而人眼随亮度增加,在100 cd/m2处分辨率只有1 cd/m2而不是0.1 cd/m2,亮度越高可分辨的亮度差越大,维持ΔL/L基本不变,所以并不需要按最小亮度均匀量化。只要按照某种适合人眼视觉特性的变换关系,就可以用1 000个量化级实现亮度动态范围104,甚至更大,如杜比Vision用12 bit实现107的亮度动态范围。

Barten根据人眼视觉系统规律,并经过大量试验得出复杂的Barten模型,是图像研究领域公认的基础,成为图像显示中人眼最小亮度差分辨率阈值理论依据。ITU BT.2246中给出Schreiber和Barten模型曲线,见图5[6]。

图5 人眼可察觉亮度差阈值曲线(截图)

BT.1886根据CRT的Gamma特性,规定幂指数为2.4的电-光转换特性。图5中给出3种12 bit量化的BT.1886随亮度范围变化的最小对比度特性,在高亮度区,BT.1886量化误差小于人眼对比度阈值,但低亮度区则高于人眼对比度阈值,表明对高动态范围显示的高亮度区,BT.1886量化浪费了过多的比特,而低亮度区则比特量化太粗,比特数不足。

4支持HDR的光电转换特性

为摆脱以CRT为基础的光电转换特性束缚,实现高动态范围(HDR)显示,现已有杜比、BBC、NHK和Philips向ITU提出4个HDR标准化建议,其中杜比Vision提出的感知量化(Perceptual Quantizer,PQ)成为SMPTE ST2084标准,可实现10 000 cd/m2屏幕亮度,BBC提出的10 bit HDR建议,支持超过1 000 cd/m2的HDR显示。图6给出几种光电转换特性的比较,其中BT.709只有100 cd/m2亮度范围,DICOM是医学数字成像和通信领域的标准,规定医学图像质量,10 bit可实现5 000 cd/m2以上的高亮度,杜比Vision则有107高动态范围,支持10 000 cd/m2亮度。

图6 不同的光电转换特性中亮度和信号量化级的关系

4.1系统级光电转换特性

电视传播信号链如图7所示,信号的变换包括摄像端和显示端的非线性特性。摄像机非线性特性称为光-电转换特性(OETF),显示端则称为电-光转换特性(EOTF)。常规电视通常把这两者混为一谈而统称为“伽马校正”。整个信号链为适应人眼视觉系统而呈现非线性,是光-光的系统转换特性(OOTF)或系统伽马。系统伽马用来补偿人眼在不同观看环境的心理视觉效果,适合的系统伽马值能更好地完成景物真实再现(rendering intent)。电影业选择系统伽马值为1.6~1.8,适合黑暗环境下观看,电视在室内较暗环境观看,系统伽马值为1.2,计算机从业者偏爱系统伽马值为1,因为它适合在室内较亮环境下观看图像。

图7 电视信号链的光电转换特性

BBC对系统伽马值进行了主观测试,测试的室内照度10 lx,一台参考显示器显示亮度为600 cd/m2的参考图像,另一台测试显示器显示9个不同伽马值(1.0~2.4)的测试图像,测试图像亮度从68 cd/m2到5 200 cd/m2变化,参试者从中选出与参考图像匹配最好的测试图像。测试结果中得出优选的系统伽马值如图8所示,并得到如下经验公式[8]

(1)

图8 系统伽马值主观测试

图8表明,HDR系统伽马值随显示器峰值亮度而改变,例如室内常用环境亮度10 lx下,相当于背景亮度10 cd/m2,亮度为1 000 cd/m2显示器系统伽马值优选为1.4,而数千坎德拉每平方米亮度的显示器,则系统伽马值宜取1.5。为此,BBC的研究报告建议,厂商根据显示器亮度不同而采用不同的系统伽马值,可获得最佳观看效果。

4.2杜比Vision

杜比实验室提出一种用于显示器的电信号到屏幕光输出的非线性变换,即电-光转换特性EOTF,也称感知量化(Perceptual Quantizer,PQ),其商业名称为杜比Vision。杜比PQ根据Barten对比度敏感特性,构造显示端非线性变换EOTF,使量化误差形成小于Barten对比度阈值的PQ曲线。

(2)

其中,Mopt(u)=e-2π2σ2u2

(3)

(4)

(5)

(6)

对不同类型的图像,人眼视觉敏感度不同,以不同空间频率的图像(图像呈现不同距离的光栅)作为敏感度的测试。图9中画出不同亮度下的敏感度CSF曲线,找到每个亮度下CSF最大值,也就是指该亮度下人眼对此光栅图像最为敏感,所谓的图像勾边效应,而此时的亮度差作为人眼可察觉的最小亮度差阈值。将这些亮度差阈值连成随亮度变化的一条曲线,即得到Barten最小可觉差(Just Noticeable Difference,JND)曲线,如图10表示[7]。

图9 Barten模型的CSF峰值S(L,u)(截图)

图10 Barten模型构造量化均匀的可觉差曲线(截图)

图10中虚线表示的折线段为Schreiber可觉差阈值曲线,在1~10 000 cd/m2亮度范围,呈对数关系,而在0.01~1 cd/m2范围为1/2幂指数关系。另一条虚线表示的弯曲线段即从Barten模型公式中得出的可觉差阈值曲线,该曲线下方即为不同亮度下不可察觉的亮度差值,也就是量化阶梯的取值范围。沿着这条阈值曲线构造的变换特性,便可用最少的量化比特获得最佳量化效果。

杜比实验室按照Barten阈值曲线做出3条12 bit量化曲线,分别是0.46JND,100 cd/m2;0.68JND,1 000 cd/m2;0.9JND,10 000 cd/m2。分别对应不同的量化误差和最大亮度。误差最小的是0.46JND,位于最下方。

以0.9JND,10 000 cd/m2曲线为基础,得到杜比PQ。杜比PQ用了不同的函数规律来逼近Barten阈值曲线,低亮度区为平方根关系(斜率-1/2),高亮度区是斜率接近0的对数关系,低亮度和高亮度之间的中间区域,则为变化的斜率,中间区斜率平均值表现为BT.1886的变换斜率。杜比PQ提出的EOTF由下式表示[7]

(7)

其中:Y是屏幕亮度;V是视频信号值,0≤V≤1;L0=10 000;m=78.843 8;n=0.159 3;c1=0.835 9;c2=18.851 6;c3=18.687 5。

根据杜比PQ曲线,屏幕亮度为

(8)

反过来得到视频信号

(9)

经过导数运算,写成对比度敏感形式

(10)

式中:ΔV是数字量化的最小单位,12 bit时,ΔV=1/4 060。

按照式(10),画出12 bit,10 000 cd/m2时的PQ曲线见图11,可见杜比PQ构造的EOTF亮度范围从0.001 cd/m2到10 000 cd/m2,动态范围107,整条曲线在不同亮度区量化阈值均小于Barten阈值。同样是12 bit量化的BT.1886 EOTF,最高亮度1 000 cd/m2,在小于2 cd/m2的低亮度区,量化阈值高于Barten阈值,表明杜比PQ比BT.1886量化效率更高。

图11 杜比PQ和亮度阈值曲线(截图)

杜比PQ是显示端的非线性变换特性EOTF,与摄像端不发生关系,只考虑了信号量化和人眼亮度分辨率的关系,认为若视频信号从摄像机获取,则摄像机端信号与景物亮度呈线性关系。换句话说,若摄像端存在类似BT.709给出非线性变换,则需要去除这种非线性,才能正确显示所摄取的景物亮度。因此,杜比PQ是作为表现视频信号特征的视频监视器角色出现,而非指定从景物到显示屏整个系统的变换关系。

4.3BBC建议的HDR光电变换特性

BBC的HDR建议考虑电视信号的产生到显示整条信号链,提出OETF和EOTF。从信号产生端看,在图像的较亮部分符合韦伯定律,即感知亮度差和亮度的比值近似恒定。这意味着对数规律的OETF在给定的量化深度下将提供最大动态范围。例如现今专有的摄像机OETFs,如S-LOG,Panalog和Log C等已获得广泛使用。但对数变换在低亮度区域分辨率很差,会出现可察觉的量化误差。低亮度区人眼视觉感知阈值符合De Vries-Rose规律,很凑巧的是,传统的指数型OETF特性与De Vries-Rose规律匹配很好。这种传统的伽玛曲线当初就是为低亮度表现的CRT所设计。因此,理想的OETF应在低亮区符合指数规律,在高亮区符合对数规律。

BBC提出混合型OETF如下式表示[8]

(11)

式中:E是代表景物线性亮度的摄像机各彩色通道(R,G,B)信号值。E′是非线性变换信号,归一化范围0~1。r=0.5是白电平参考值。

固定常数a=0.178 832 77,b= 0.284 668 92,c= 0.559 910 73。对应这组常数,相对亮度为12时,信号值E′=1。

图12 BBC OETF变换关系

图12表示按照log-Gamma规律的组合型OETF变换,其中虚线为BT.709的伽马预校正,实线为适合HDR的OETF,相对亮度从1扩大到12,避免了高亮度区的信号饱和。这种log-Gamma规律的组合为提高量化效率埋下伏笔。

BBC建议的显示器非线性变换EOTF如下[8]

(12)

式中:Yd为像素表示的屏幕亮度;Ys是景物亮度;α=LP-LB,表示屏幕亮度最大值;β=LB;γ为系统级光电转换特性。LP是峰值白(对应Ys=1),LB是黑亮度(Ys=0)。

EOTF实际计算过程见图12。EOTF把线性景物亮度Ys映射到屏幕亮度Yd。与常规动态范围SDR不同,EOTF将变换施加到景物亮度Ys,而不是加到每个颜色通道,来防止颜色变换的不一致。

图12 实际的EOTF计算过程

Ys可通过预校正信号E′来获得

(13)

E是线性景物亮度的每个彩色分量RGB分量表示,可得到

(14)

显示亮度Yd确定之后,显示器每个像素的显示值Rd,Gd和Bd由下式决定

(15)

计算量化误差曲线,取α=2 000,β=0.01,γ=1.5。按10 bit量化有ΔE′=1/1 020,得到BBC EOTF量化误差曲线如图13所示,图中3种EOTF均为10 bit量化,杜比PQ是最接近Schreiber阈值的EOTF,支持亮度到10 000 cd/m2。BBC和1886传统Gamma支持2 000 cd/m2亮度,但1886在中低亮度区已经超过Schreiber阈值,量化误差为可察觉。BBC EOTF结合了Gamma和对数转换特性,量化误差正好在阈值之内,表现出较好的量化效率。需要指出的是,按照本文的推导计算曲线,与BBC研究报告给出的曲线略有差别,尚未找到原因。BBC研究报告误差曲线如图14所示。

图13 BBC EOTF和杜比PQ量化误差曲线(截图)

图14 BBC研究报告给出的EOTF量化误差曲线

BBC HDR转换特性首先从摄像端入手进行非线性预校正,低亮度区采用BT.709Gamma特性,在高亮度区采用对数特性,这样充分发挥摄像机已具备的高亮度景物摄取能力,同时将人眼视觉亮度差阈值与量化级相适配。其次,对于显示端,按照观看环境亮度和显示器峰值亮度参数选择系统级Gamma值,从整个亮度观看全过程适应人眼视觉特性。BBC HDR方案与现有的电视伽玛特性标准在低亮度区域有一定兼容性,转换特性产生的量化误差对大多数自然景物图像而言不易察觉,转换特性没有杜比PQ那么复杂,因此,日本已将其作为扩展图像动态范围电视(EIDRTV)系统的ARIB国家标准。

5结束语

本文以杜比感知量化和BBC摄像端和显示端分开考虑的转换特性入手,介绍HDR电视系统光电转换特性原理和设计实现。这两种HDR方案均基于人眼视

觉系统的感知特性,以最少的量化比特实现高动态范围显示要求。杜比方案基于显示器屏幕亮度,以人眼视觉感知阈值来确定电-光转换特性,使量化误差正好小于视觉阈值,形成精确复杂的高亮度转换特性。BBC方案在摄像端采用扩大景物亮度范围非线性预校正,在显示端以适合观看环境的系统级伽玛数设计电-光转换特性,同样以较少的量化比特实现高动态范围显示。HDR电视系统将传统基于CRT特性,亮度范围在100 cd/m2以内的常规显示扩展到2 000~10 000 cd/m2高亮度,适应新型显示器的发展现状,为用户提供更加绚丽多彩的真实世界再现。

参考文献:

[1]DENTON E J,PIRENNE M H.The absolute sensitivity and functional stability of the human eye[J].The journal of physiollogy,1954,123(3):417-442.

[2] NARISADA K,SCHREUDER D.Light pollution handbook[M].[S.l.]:Springer Science & Business Media,2004.

[3] BORER T.Non-linear opto-electrical transfer functions for high dynamic range television[EB/OL].[2015-11-01].http://downloads.bbc.co.uk/rd/pubs/whp/whp-pdf-files/WHP283.pdf.

[4] STEVENS S S. On the psychophysical law[J].Psychological review,1957,64(3):153-181.

[5] DAVSON H. Physiology of the eye[M].5th ed. London:Macmillan Academic and Professional Ltd.,1990.

[6] BARTEN P G J. Formula for the contrast sensitivity of the human eye[C]//Proc. SPIE-IS&T. San Jose,CA:[s.n.],2004,5294:231-238.DOI:10.1117/12.537476.

[7] SCOTT M. Perceptual signal coding for more efficient usage of bit codes[J].Motion imaging journal, 2013,122(4):52-59.DOI:10.5594/j18290.

[8] BORER T, COTTON A. A “display independent” high dynamic range television system[EB/OL].[2015-10-10].http://downloads.bbc.co.uk/rd/pubs/whp/whp-pdf-files/WHP309.pdf.

Non-linearity function of high dynamic range TV display

CHEN Ke

(CETCNo.3ResearchInstitute,Beijing100015,China)

Abstract:Conventional CRT-based low-luminance range TV display technology has been unable to meet the requirements of the new display. This article describes Dolby and the BBC HDR photoelectric conversion characteristics to reveal two schemes technical details supporting brightness up to 2 000~10 000 cd/m2. Both schemes are based on human visual system, with less quantization bit to support high dynamic range up to 107, to improve the 4K ultra high-definition picture quality which has great significance.

Key words:HDR; vision system; Gamma correction

中图分类号:TN948

文献标志码:A

DOI:10.16280/j.videoe.2016.02.001

作者简介:

陈科,中国电科集团第三研究所副总工,中国电子学会消费电子分会副主任委员。

责任编辑:许盈

收稿日期:2015-12-01

文献引用格式:陈科. 高动态范围电视显示的非线性转换特性[J].电视技术,2016,40(2):1-7.

CHEN K. Non-linearity function of high dynamic range TV display [J].Video engineering,2016,40(2):1-7.