河套 IT TALK 62:(原创)由浅入深说高清——聊聊高动态范围(HDR)

河套 IT TALK 62:(原创)由浅入深说高清——聊聊高动态范围(HDR)

当我们谈论视频技术时,超高清视频(Ultra High Definition,简称UHD)无疑是当今最令人兴奋的领域之一。UHD视频技术不仅可以提供比传统高清视频更为逼真的画面,还可以为观众带来更加沉浸式的体验。对超高清的理解,很多人第一个直觉就是4K、8K的高分辨率,其实超高清技术的进步不仅仅是分辨率提升这么简单,它还包括更多的技术提升,包括但不局限于:高动态范围(HDR)、编解码、先进计算、三维立体声、超分技术、数字版权管理和视频云等等。从本期开始,我们会从浅入深,带您走近超高清,探讨其背后的技术原理,希望这个系列的文章能让您对UHD视频技术有更深入的了解。


关于超高清视频(UHD)有很多可聊的技术,衡量一台超高清电视的技术指标,以下可能都会涉及:

我们重点来谈谈其中的HDR。HDR是high Dynamic Range(高动态范围)的英文缩写。今天我们就拆开了、掰碎了,好好聊聊到底什么是HDR。

HDR和SDR

HDR(高动态范围)是个相对概念,相对于SDR而言。SDR是Standard Dynamic Range(标准动态范围)的英文首字母缩写。

SDR这个概念要追随到阴极射线管(CRT)显示器的时代。在液晶电视推广之前(也才不到20年前的事儿),带着一个大鼓包的CRT电视仍是普遍的存在。SDR就是根据CRT显示器的亮度、对比度和颜色特性和限制来规范电视光强度的一个标准。这些陈旧的技术标准在面临整个电视系统硬件性能的大幅度提升的时代,已经显得不够用了。

HDR相对于SDR,HDR拥有更广的色彩容量和更高的动态范围,为图像保留更多的细节。通过丰富的图像亮部和暗部细节,在对比度、灰度等维度上提升影像质量,让用户眼中的影像更加细腻真实,更富有感染力。

下面,我们就从几个参数维度入手,逐一对比说明,HDR到底好在哪里?

亮度-图像照明的强度

国际单位制(SI)中的亮度单位是每平方米坎德拉(cd/m 2),非正式的名称nit(尼特)。用来描述每单位面积发出的光的量度。现实世界具有极大的动态范围。比如:星光可以低至 0.000001 尼特,太阳辐射量超过 10 亿尼特。人眼可以检测到的亮度从10 − 6 或0.000001尼特到 10 8 或一亿 (100,000,000) 尼特。(也就是人眼感知亮度的范围为 10 14 尼特,或一百万亿 100,000,000,000,000,大约 46.5 f 级)。

通常,SDR显示器的峰值亮度为100尼特。在配备专业投影仪的传统商业影院中,图像的标准化峰值亮度为 48 尼特(杜比影院的峰值亮度约为 100 尼特)。对于 HDR,这个峰值亮度数字增加到大约 1,000–10,000尼特。这就意味着高光(图像中最亮的部分)可以更亮、色彩更丰富、细节更丰富。更大的亮度容量可以在不增加整体图像亮度的情况下,增加小范围的亮度,例如:闪亮金属物体的明亮反光,漆黑夜空中闪烁的明星,燃烧中的篝火和绚丽多彩的日落晚霞。

亮度还有一个最黑,专业叫法是最低亮度(黑电平)。SDR,这个值一般为0.1尼特。HDR这个黑电平没有定义,但肯定比0.1尼特要低很多。特别是对OLED显示器,它可以将像素关闭到纯黑色,所以在很多OLED规范中,黑电平不高于 0.0005 尼特。所以HDR除了表现的更亮,同样还可以表现的更暗,更黑。

 对比度也是衡量亮度动态变化范围的指标。这是用最亮部分和最暗部分之间差异的指标。它通常表示为图像或视频最亮部分的亮度与最暗部分的亮度之比。从对比度上来看:

SDR 显示器的对比度通常在 1000:1 到 4000:1 左右。

而HDR 显示器的对比度可以达到 10,000:1 到 100,000:1 甚至更高。

颜色深度-色彩渐变的精细程度

但是否亮度范围变大,设备的表现就好了吗?不一定。还有一个非常重要的指标颜色深度(简称色深)。在计算机图形学领域表示在位图或者视频帧缓冲区中存储每一像素的颜色所用的位数,常用单位为位/像素(bpp)。色彩深度越高,可用的颜色就越多。色彩深度是用“n位颜色”(n-bit colour)来说明的。若色彩深度是n位,即有2n种颜色选择,而储存每像素所用的位数目就是n。常见的有:1位:2种颜色,单色光,黑白二色,用于compact Macintoshes。

4位:16种颜色,用于EGA及不常见及在更高的分辨率的VGA标准,color Macintoshes。8位:256种颜色,用于最早期的彩色Unix工作站,低分辨率的VGA,Super VGA,AGA,color Macintoshes。其中红色和绿色各占3位,蓝色占2位。灰阶,有256种灰色(包括黑白)。若以24位模式来表示,则RGB的数值均一样,例如(200,200,200)。16位:65,536种颜色,用于部分color Macintoshes(红色占5个位、蓝色占5个位、绿色占6个位,所以红色、蓝色、绿·色各有32、32、64种明暗度的变化总共可以组合出65,536种颜色)。24位:16,777,216种颜色,真彩色,能提供比肉眼能识别更多的颜色,用于显示照片。彩色图像,就是常说的24位真彩,约为1670万色。30位:通常是红色、绿色和蓝色各10位,共1,073,741,824种颜色。36位:红色、绿色和蓝色各12位,共68,719,476,736种颜色。48位:每个颜色通道使用 16 位产生 48 位,即 281,474,976,710,656 种颜色。为了说明色彩深度的重要性,我们举一个具体的例子。如下图,海边的篝火场景,如果遮住火焰,边上的海岸很显然是SDR的,而篝火便是动态范围的关键所在。

1. 我们用8bit去记录场景,0对应海岸的最暗处,255对应海岸区域的最亮处。于是大部分区域可以被8bit完美还原,而篝火因为大大超过了255对应的亮度,因此只能被约束到255。呈现过曝状态(最左边)

2. 对于HDR图形,他在1.的基础上额外增加了一些bit去记录高亮度区域,因此依然可以相对更好地还原篝火地感觉。(中间)

3. 如果非要用8bit去记录HDR呢?假设图例的SDR区域亮度是2,那么篝火部分便是256。于是我们可能得到最右侧的结果。黑暗区域只能用1bit来记录,篝火用7bit记录,这样会导致大面积的黑色。

所以没有足够的色彩深度的支撑,HDR根本无法体现出优势。道理很简单,亮度范围是大了,但是精度不够用,亮度信息被稀疏掉了,效果自然大打折扣。一般而言:

SDR 显示器通常支持 8 位色深,这意味着它们可以显示多达 1670 万种颜色。

HDR 显示器可以支持 10 位甚至 12 位色深,这意味着它们可以显示多达 10.7 亿种颜色或更多。

色彩空间-色彩的生动或者丰富程度

色彩空间(英语:Color space)是对色彩的组织方式。我们一般谈到色彩空间,都是基于人眼可见色彩范围这个角度来界定的。它是一种将色彩映射到一组坐标或值的数学模型,允许它们在不同的设备和系统上准确地再现。

CIE 1931 XYZ色彩空间(也叫做CIE 1931色彩空间)就是国际照明委员会(CIE)于1931年创立的一个模型。它根据人眼三种视锥细胞的感光能力(波长和光谱敏感度)绘制。外侧曲线边界是光谱(或单色)光轨迹,波长用纳米标记。注意描绘的颜色依赖于显示这个图象的设备的色彩空间,目前没有设备能有足够大色域来在所有位置上提供精确的色度表现。举个例子,如果你看到的这个CIE 1931 色彩空间很多颜色很接近,甚至一致,这不是眼睛的问题,大概率是因为您的屏幕在此图像中显示的颜色是使用sRGB指定的,因此无法正确显示sRGB色域之外的颜色。

回到今天的话题,HDR和SDR能承载的色彩空间是不同的。与 SDR 相比,HDR 的另一个好处是颜色范围更广(通常称为广色域或 WCG)(见下图)。就目前而言,SDR 的色域被称为 BT.709(可以显示人眼可见颜色的35%左右),而 HDR 的色域在技术上是 BT.2020(可显示高达 75% 或更多的可见颜色)。但是,很少有显示器能够真正显示 BT.2020 的全部范围,因此称为 DCI-P3 的中间色域通常用于 HDR 内容。

值得注意的是,对比度、色深和色彩空间的确切数字可能会因具体的显示器和正在查看的内容而异。但是,总的来说,HDR 显示器在对比度和色深方面比 SDR 显示器有显着改进。

为了正确显示HDR图像,仅仅提高亮度是不够的 – 以与人类视力相匹配的方式显示色彩和色调至关重要。色彩和色调受每个输入和输出设备具有的称为伽玛的输入 – 输出特性的影响。

伽玛曲线

图像的伽马曲线(Gamma Curve)编码矫正用于通过利用人类感知光和颜色的非线性方式来优化编码图像时的位使用或用于传输图像的带宽。在普通照明条件下(既不是漆黑也不是刺眼的明亮),人类对亮度(亮度)的感知遵循近似幂函数。对较暗色调之间的相对差异更敏感比在较轻的音调之间,符合史蒂文斯幂定律。而伽马曲线编码利用了这一点。如果图像不是伽马编码的,它们会为人类无法区分的高光分配太多的比特或太多的带宽,而为人类敏感的阴影值分配太少的比特或太少的带宽,并且需要更多的比特/带宽来维持相同的视觉质量。

BT.2100标准提供两条伽玛曲线作为不同类型生产工作的标准。

对于互联网流媒体和电影:PQ (感知量化)

PQ伽玛曲线基于人类视觉感知的特征,并且最适合于在互联网上制作电影或串流视频的内容,其中再现准确性是关键。

PQ伽玛曲线的最高亮度固定为1,000 cd/m² (或更高)。 换句话说,无论显示设备的最高亮度如何,伽玛曲线始终相同,上限为1,000 cd/m²,从而实现一致的图像再现。

对于广播电视:HLG (混合对数伽玛)

HLG伽玛曲线旨在允许在现有的SDR电视上显示而不会看不到位置,并且最适合于广播电视和直播视频馈送。

HLG伽玛曲线的最高亮度与显示设备的最高亮度无关。换言之,因为伽玛曲线根据显示设备的最高亮度而变化,即使在现有的SDR显示器上,伽玛曲线也可允许接受观看HDR内容,并且图像劣化较小。

总而言之,PQ在图像质量和可显示的亮度范围方面要好得多,但如果从摄像机到最终显示器的整个广播链没有得到适当的监控,那么要想保证图像的正确显示就会变得复杂又昂贵;PQ伽马曲线基于人类视觉感知的特性,更适合应用在电影制作和互联网视频流中。

HLG伽马曲线基于较旧的SDR(709)标准,并对其进行了扩展,以便能够显示更高的亮度范围,这对于人类视觉系统来说并不是最佳选择,但就制作而言HLG更易操作也更具有兼容性,允许在现有SDR电视上显示更高动态范围的内容,更适合应用于广播电视和直播视频中。

好了,今天我们就先聊到这儿,下篇,我们再谈谈HDR标准的复杂状况。