CN107852512A - 基于亮度转换函数或视频色彩分量值的优化视频编码的系统及方法 - Google Patents
基于亮度转换函数或视频色彩分量值的优化视频编码的系统及方法 Download PDFInfo
- Publication number
- CN107852512A CN107852512A CN201680032914.3A CN201680032914A CN107852512A CN 107852512 A CN107852512 A CN 107852512A CN 201680032914 A CN201680032914 A CN 201680032914A CN 107852512 A CN107852512 A CN 107852512A
- Authority
- CN
- China
- Prior art keywords
- video data
- video
- value
- quantization parameter
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 152
- 230000007704 transition Effects 0.000 title abstract 2
- 238000005457 optimization Methods 0.000 title 1
- 238000013507 mapping Methods 0.000 claims abstract description 24
- 238000013139 quantization Methods 0.000 claims description 176
- 241000023320 Luma <angiosperm> Species 0.000 claims description 32
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 32
- 238000003860 storage Methods 0.000 claims description 24
- 230000003044 adaptive effect Effects 0.000 claims description 7
- 238000012886 linear function Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 abstract description 40
- 230000000116 mitigating effect Effects 0.000 abstract 2
- 239000000523 sample Substances 0.000 description 82
- 230000006870 function Effects 0.000 description 80
- 238000001914 filtration Methods 0.000 description 33
- 238000012545 processing Methods 0.000 description 31
- 239000013598 vector Substances 0.000 description 27
- 230000008569 process Effects 0.000 description 24
- 238000012546 transfer Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 10
- 238000009795 derivation Methods 0.000 description 9
- 239000013074 reference sample Substances 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 7
- 238000005070 sampling Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 3
- 241000209094 Oryza Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 241000985610 Forpus Species 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000002059 diagnostic imaging Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000000135 prohibitive effect Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 101150114515 CTBS gene Proteins 0.000 description 1
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000036314 physical performance Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/98—Adaptive-dynamic-range coding [ADRC]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种视频编码设备可被配置为接收基于范围映射误差生成的接收视频数据。范围映射误差可能来自对应于高动态范围(HDR)视频数据的亮度转换函数,其被用于转换并非HDR的视频数据。所述视频编码设备可被配置为减轻所述范围映射误差。视频编码设备可重映射视频数据。所述视频编码设备可以执行减轻重映射误差的编码技术。
Description
技术领域
本发明涉及视频编码,更具体地,涉及基于亮度转移函数或视频色彩分量值的优化视频编码的技术。
背景技术
数字视频功能可被结合至大范围的装置中,包括:包括所谓智能电视的数字电视、膝上型或台式电脑、平板电脑、数字录音装置,数字媒体播放器,视频游戏设备、包括所谓智能手机的蜂窝电话、医学成像设备等。可根据视频编码标准对数字视频进行编码。视频编码标准的例子包括ISO/IEC MPEG-4Visual和ITU-T H.264(也称为ISO/IEC MPEG-4AVC)和高效视频编码(High-Efficiency Video Coding,HEVC)、ITU-T H.265和ISO/IEC 23008-2MPEG-H。目前正在对HEVC的扩展和改进进行开发。例如,视频编码专家组(Video CodingExperts Group,VCEG)将某些主题指定为用于进一步调查的关键技术区域(Key TechnicalAreas,KTA)。响应KTA调查而开发的技术可被包括在未来的视频编码标准中,(例如,“H.266”)视频编码标准可结合视频压缩技术。
视频压缩技术使得存储和发送视频数据的数据需求得以减少。视频压缩技术可通过利用视频序列中的固有冗余来减少数据需求。视频压缩技术可以将视频序列细分为连续的较小的部分(即,视频序列内的帧组、帧组内的帧、帧内的片、片内的编码树单元(或宏块)、编码树单元内的编码块、编码块内的编码单元等)。空间技术(即帧内编码)和/或时间技术(即帧间编码)可用于产生待编码的编码单元与参考编码单元之间的差值。该差值可被称为残留数据。残留数据可以被编码为量化变换系数。语法元素(例如,参考图片索引、运动向量和块向量)可关联残留数据和参考编码单元。可以对残留数据和语法元素进行熵编码。
视频编码标准规定了支持编码的视频数据的格式。例如,HEVC的Main10profile(10bit主档次)规定了视频数据具有4:2:0的色度采样格式和每个视频分量支持的8或10位的位深度。数字摄像机首先生成与其每一个图像传感器所产生的信号相对应的原始数据。例如,原始数据可以包括红色、绿色和蓝色通道中的每一个的绝对线性亮度电平值。光电转换函数(Optical-Electro Transfer Function,OETF,也可叫光电传递函数)可以非线性地将绝对线性亮度值映射到数字码字。所产生的数字码字可以被转换为由视频编码标准支持的视频格式。将原始数据,例如线性亮度电平,转换成由视频编码标准支持的格式通常会导致数据丢失。在一些情况下,该数据丢失可能导致非最佳编码。在另一个示例中,HEVC的Main 10profile规定了视频数据具有4:2:0的色度采样格式和每个视频色彩分量支持的8或10位的位深度。此外,HEVC规定视频可用性信息(Video Usability Information,VUI)其可用于通过信号基色,用信号通知视频数据的多个可能色彩空间中的一个。基色可包括绿基色值、蓝基色值、红基色值和参考白值(例如白色D65)的色度坐标。根据参考色域,如国际照明委员会(International Commission on Illumination,CIE)1931色域,可以指定色度坐标。当前的视频编码技术对于编码具有特定色彩空间的视频数据可能不太理想。
发明内容
技术问题
一般而言,本发明描述了用于预测视频编码的各种技术。具体地,本发明描述了根据定义的或期望的亮度转换函数来优化视频编码的技术。如本文中所使用的,术语亮度转换函数可指一种光电转换函数(OETF)或电光转换函数(electro-optical transferfunction,EOTF,也可叫电光传递函数)。应该注意的是,光电转换函数可以被称为逆电光转换函数,以及电光转换函数可以被称为逆光电转换函数(即使两个转换函数不是彼此的精确反相)。所述优化视频编码的技术还基于视频色彩分量值。应当注意的是,如本文中所使用的,术语色域可以代表性地指可用于特定设备(例如,电视)的整个色彩范围,以及色彩空间可指色域内的色彩数据值的范围。然而,应当注意,在一些情况下,术语色域和色彩空间可交换地使用。这样,相对于本文描述的技术,术语色彩空间或色域的特定用途不应被解释为限制本文所描述技术的范围。本文描述的技术可以用于补偿在亮度值到数字码字的映射不太理想时发生的非最佳视频编码性能。例如,在实践中,OETF可以将亮度值的范围映射到小于全部(例如,大约一半)的关于给定位深度的可用数字码字。在这种情况下,基于对一个位深度的所有可用的数字码字对应于亮度值的整个范围的假设而设计的视频编码器,通常不能以最佳方式执行视频编码。本文描述的技术还可用于补偿当视频数据包括大于预期的色彩空间和/或大于预期的动态范围时发生的非最佳视频编码性能。例如,视频编码器和/或视频编码标准可基于假设视频数据通常限于具有根据ITU-R BT.709标准和所谓的标准动态范围(Standard Dynamic Range,SDR)定义的色彩空间的视频数据而已经被设计。当前显示技术可以支持相较于ITU-R BT.709(例如,根据ITU-R BT 2020标准所定义的色彩空间)具有更大范围(即更大面积)的色彩空间以及具有所谓的高动态范围(High DynamicRange,HDR)的视频数据的显示。进一步地,下一代视频显示器可以支持动态范围和色彩空间能力的进一步改进。具有大于ITU-R BT.709的范围的色彩空间的例子包括ITU-RBT.2020(Rec.2020)和DCI-P3(SMPTE PR 431-2)。应当注意,尽管在一些示例中本文描述的技术是相对于特定色彩空间来进行描述,在本文描述的技术并不限于特定的色彩空间。进一步地,应当注意,在一些示例中,尽管本发明的技术是相对于ITU-T H.264标准和ITU-TH.265标准来进行描述,本发明的技术通常适用于任何视频编码标准,包括当前在开发中的视频编码标准(例如,“H.266”)。
问题的解决方案
在一个示例中,一种修改视频数据的方法包括接收视频数据、确定与视频数据相关联的重映射参数、以及至少部分地基于所述重映射参数修改包括在所述视频数据中的值。
在一个示例中,一种用于修改视频数据的设备包括一个或多个处理器,其被配置为接收视频数据、确定与所述视频数据相关联的重映射参数、以及至少部分地基于所述重映射参数修改包括在所述视频数据中的值。
在一个示例中,一种非暂时性计算机可读存储介质包括存储在其上的指令,在执行时,使得用于编码视频数据的设备的一个或多个处理器接收视频数据、确定与所述视频数据相关联的重映射参数、以及至少部分地基于所述重映射参数修改包括在所述视频数据中的值。
在一个示例中,一种用于修改视频数据的装置包括用于接收视频数据的手段、用于确定与所述视频数据相关联的重映射参数的手段、以及用于至少部分地基于所述重映射参数修改包括在所述视频数据中的值的手段。
在一个示例中,一种视频数据编码方法包括接收视频数据、确定视频数据的值的使用范围、以及根据所述视频数据的值的使用范围确定一个或多个编码参数。
在一个示例中,一种用于编码视频数据的设备包括一个或多个处理器,其被配置为接收视频数据、确定视频数据的值的使用范围、以及根据所述视频数据的值的使用范围确定一个或多个编码参数。
在一个示例中,一种非暂时性计算机可读存储介质包括存储在其上的指令,在执行时,使得用于编码视频数据的设备的一个或多个处理器接收视频数据、确定视频数据的值的使用范围、以及根据所述视频数据的值的使用范围确定一个或多个编码参数。
在一个示例中,一种用于编码视频数据的装置包括用于接收视频数据的手段、用于确定视频数据的值的使用范围的手段、以及用于根据所述视频数据的值的使用范围确定一个或多个编码参数的手段。
在一个示例中,一种确定量化参数的方法包括接收对应于视频数据的分量的样本值的阵列、确定所述样本值的阵列的平均值、以及至少部分地基于所述平均值确定变换系数阵列的量化参数。
在一个示例中,一种用于确定量化参数的设备包括一个或多个处理器,其被配置为接收对应于视频数据的分量的样本值的阵列、确定所述样本值的阵列的平均值、以及至少部分地基于所述平均值确定变换系数阵列的量化参数。
在一个示例中,一种非暂时性计算机可读存储介质包括存储在其上的指令,在执行时,使得用于编码视频数据的设备的一个或多个处理器接收对应于视频数据的分量的样本值的阵列、确定所述样本值的阵列的平均值、以及至少部分地基于所述平均值确定变换系数阵列的量化参数。
在一个示例中,一种用于修改视频数据的装置包括用于接收对应于视频数据的分量的样本值的阵列的手段、用于确定所述样本值的阵列的平均值的手段、以及用于至少部分地基于所述平均值确定变换系数阵列的量化参数的手段。
在附图和以下的描述中阐述了一个或多个示例的细节。本发明的其它特征、目的和优点将从说明书和附图以及权利要求中变得显而易见。
附图说明
[图1]图1是示出根据本发明一个或多个技术的可被配置为对视频数据进行编码和解码的系统的示例的框图。
[图2]图2是示出根据本发明一个或多个技术的配置为处理视频数据的视频处理单元的示例的框图。
[图3]图3是示出根据本发明一个或多个技术的配置为处理视频数据的视频处理单元的示例的框图。
[图4]图4是示出根据本发明一个或多个技术的可被配置为编码视频数据的视频编码器的示例的框图。
[图5]图5是示出根据本发明一个或多个技术的可被配置为解码视频数据的视频解码器的示例的框图。
[图6]图6是示出两个相邻视频块的概念图。
具体实施方式
数字图像捕获设备和数字图像显示设备可以具有指定的动态范围。动态范围可以指设备的最大亮度能力到设备的最小亮度能力的范围(或比率)。例如,电视可以能够产生0.5坎德拉每平方米(cd/m2或尼特nit)的黑电平亮度和400cd/m2的峰值白亮度,因此可以被描述为具有800的动态范围。以类似的方式,视频摄像机所能够感测的黑电平亮度值可以为0.001cd/m2和摄像机所能够感测的峰值白亮度值可以为10,000cd/m2。动态范围可以被分类为高动态范围(HDR)或低或标准动态范围(SDR)中的任何一个。典型地,将不大于100到500的动态范围分类为SDR,以及将大于SDR的动态范围分类为HDR。在一个示例中,SDR内容可以基于ITU-R BT.1886推荐,用于HDTV工作室制作中使用的平板显示器的参考电光转换函数(Recommendation ITU-R BT.1886,reference electro-optical transfer function forflat panel displays used in HDTV studio production)。应当注意,在一些情况下,HDR更具体地被定义为具有0至10,000cd/m2的亮度范围。
在一个示例中,HDR内容可以相对ST 2084(2014High Dynamic Range Electro-Optical Transfer Function of Mastering Reference Displays published by theSociety of Motion Picture and Television Engineers(电影电视工程师协会,
SMPTE))来描述。以类似的方式,数字图像捕获设备和数字图像显示设备可以具有指定的色域。在此示例中,色域可指设备的物理性能。例如,数字图像捕获设备可以能够在ITU-RBT.2020色彩空间内录制视频。传统上,基于视频内容最终呈现在具有ITU-R BT.709色彩空间性能的显示设备上的假设,设计了视频系统。例如,基于在具有约100的动态范围的阴极射线管(Cathode Ray Tube,CRT)显示器上呈现视频内容的假设,设计了传统的电视系统。这样,尽管在传统视频系统中使用的一些组件可能具有支持HDR视频数据的能力,但这些能力没有被利用。当前实验的和市售的视频捕获设备和视频显示设备支持HDR视频数据。这样,有动机设计视频系统来支持捕捉、编码、传输、解码和/或显示HDR视频数据。在一些示例中,对视频系统包括用于支持SDR视频数据的不同组件以及包括支持HDR视频数据的不同组件,可能是困难的和/或成本过高的。本文描述的示例技术可以使视频系统更有效地既支持SDR视频又支持HDR视频。视频数据可以被描述为存储在容器中,其中容器指定动态范围和色彩空间。例如,视频数据可以被描述为存储在BT.2020/ST-2084容器中。
数字图像捕获设备将图像记录为一组线性相关的亮度值(例如,阵列中的每个传感器的感测亮度值)。同样地,数字图像显示设备基于一组线性相关电值(例如,提供给构成显示器的每个物理像素的电压)显示图像。人类视觉不能以线性方式感知亮度值的变化。即,例如,与100cd/m2的亮度值相关联的图像的区域不一定被感知为比与200cd/m2的亮度值相关联的图像的区域明亮两倍。这样,亮度转换函数(例如,光电转换函数(OETF))或电光转换函数(EOTF)可以用来将线性亮度数据转换成可以以有意义的方式被感知的数据。
OETF可以将线性亮度值映射到非线性感知函数,其中非线性感知函数是基于人类视觉的特征。非线性感知函数可由感知曲线表示。OETF可用于将由数字图像捕获设备所捕获的亮度值映射到感知函数。OETF可以归一化线性亮度值的范围(例如,归一化0-10,000cd/m2到0-1)并将归一化值映射到定义的感知曲线的值。将归一化值映射到定义的感知曲线的值可以被称为非线性编码。此外,可以将归一化值映射到数字码字,即在必要时进行缩放之后。这些过程使量化的感知曲线值被映射到二进制值(例如,将感知曲线值映射到210个码字)。例如,OETF可以从摄像机接收亮度值,其可以被称为原始视频数据或微加工的视频数据,作为输入和用于在RGB色彩空间中的每个红色、绿色和蓝色通道的12位值的集合,可以在缩放和量化后生成。OETF生成的值可以对应于定义的图像/视频格式。应当注意,在一些示例中,这些定义的图像/视频格式可以被描述为未压缩的图像/视频数据。
未压缩的视频数据可根据视频编码标准来压缩,例如使用空间和/或时间技术。然而,在压缩之前,使用OETF生成的数字值和源视频数据(例如,视频捕获设备生成的视频数据)通常需要被转换成被视频编码设备支持的视频格式。被视频编码设备支持的视频格式包括视频编码器能接收并编码到兼容位流中的视频格式和/或由视频解码器输出作为解码兼容位流的结果的视频格式。将使用OETF生成的数字值和源视频数据转换为被视频编码设备支持的视频格式,可以包括色彩空间转换、量化和/或下采样。例如,视频编码标准可以支持具有4:2:0的色度采样格式和每个视频分量的10位的位深度的视频数据,以及由OETF和视频捕获设备生成的视频数据可以包括12位的RGB值。在此示例中,色彩空间转换技术可用于将12位的RGB值转换为YCbCr色彩空间中的对应值(即,亮度(Y)通道值和色度(Cb和Cr)通道值)。此外,量化技术可用于将YCbCr色彩空间值量化为10位。最后,下采样技术可用于从4:4:4的采样格式到4:2:0的采样格式向下采样YCbCr值。以此方式,可将由视频捕获设备记录的亮度值转换为被视频编码设备支持的格式。应当注意的是,OETF转换、量化和下采样中的每一个都会导致数据丢失。
应当注意的是,尽管视频编码标准可以编码独立于亮度转换函数的视频数据(即,亮度转换函数通常在视频编码标准的范围之外),视频编码标准的预期性能可以基于所支持的视频编码格式中的预期数据值和预期支持的视频编码格式,并且所支持的视频编码格式中的预期数据值可以基于关于亮度转换函数的假设。即,例如,视频编码标准可以基于假设:特定码字一般对应于特定的最小和最大亮度值、和使用视频系统发送的大多数视频数据将具有特定的支持格式(例如,75%的视频数据将基于ITU-R BT.709色彩空间)和大多数样本值将在所支持的视频编码格式的一定范围内。这可导致在视频数据不具有预期范围内的值时编码不太理想,特别地,当视频数据具有大于预期范围的值时。应当注意的是,不太理想的视频编码可能在数据帧内出现。例如,对于10位视频通道数据,视频编码标准可以基于假设最小码字值(例如,0)通常对应于0.02cd/m2的亮度水平和最大码字值(例如,1023)通常对应于100cd/m2的亮度水平。这个示例可被描述为映射SDR视频数据(例如,从0.02cd/m2到100cd/m2的数据)至10位码字。在另一示例中,帧的一个区域可以包括阴影中的场景的一部分,并且同样地,可以具有比不在阴影中的场景的一部分相对较小的动态范围。本文描述的技术可用于,在例如亮度值的视频色彩分量值的基础上,通过改变编码参数来优化视频编码。
如上所述,基于视频显示设备的当前能力,视频系统有动机支持HDR视频数据的编码。如上文的进一步描述,对视频系统包括独立组件以用于每一个SDR视频数据和HDR视频数据可能是不切实际的。在一些情况下,在视频系统内实现多个亮度转换函数可能是困难的、不切实际的和/或成本过高的。如下文详细描述,使用与HDR数据相对应的亮度转换函数来转换SDR数据可能导致非最佳编码。
对应于HDR数据的亮度转换函数的例子包括所谓的SMPTE(Society of MotionPicture and Television,电影电视工程师协会)高动态范围(HDR)转换函数,其可被称为SMPTE ST 2084。SMPTE HDR转换函数包括EOTF和逆EOTF。根据下述公式组,在HEVC中描述SMPTE ST 2084逆EOTF:
Lc=C/10,000
V=((c1+c2cn)/(1+c3,Lcn))m
c1=-c3-c2+1=3424/4096=0.8359375
c2=32*2413/4096=18.8515625
c3=32*2392/4096=18.6875
m=128*2523/4096=78.84375
n=0.25*2610/4096=0.1593017578125
其中“/”是实值除法(real-valued division)。
相应的SMPTE ST 2084EOTF可以根据下述公式组来描述:
Lc=((max[(V1/m-c1),0])/(c2-c3*V1/m)1/h
C=10,000*Lc
在上述等式中,C是0至10,000cd/m2的预期范围的亮度值。即,将Lc等于1通常意在对应于10,000cd/m2的亮度水平。C可以被称为光学输出值或绝对线性亮度值。此外,在上述等式中,V可以被称为非线性颜色(或亮度)值或感知曲线值。如上所述,OETF可以将感知曲线值映射到数字码字。即,V可以映射到2N位码字。可用于将V映射到10位码字的函数的示例可被定义为:Digital Value=INT(1023*V),
其中INT(x)通过对小于0.5的小数值进行下舍入以及对大于或等于0.5的小数值进行上舍入而生成整数。
应当注意的是,在其他示例中,用于将V映射到N位码字的函数可以将V的值的范围映射到小于2N码字(例如,码字可以保留)。表1提供了为C的近似输入值生成的码字的例子。
C(cd/m2) | Digital Value |
~0.56 | 128 |
~5 | 256 |
~92 | 512 |
~313 | 640 |
表1
如表1所示,1024个可用码字的一半量化了大约0到92cd/m2的亮度范围,和1024个码字的一半量化了大约92到10,000cd/m2的亮度范围。因此,如果SMPTE ST 2084被用于量化SDR视频数据,则可用码字大约有一半是没有被使用的,例如,100cd/m2的SDR视频数据的最大值可被量化为520。这可能导致视频编码器的非最佳性能,包括实现HEVC方面的视频编码器。例如,下面将更详细地描述,基于位深度和/或量化参数值的HEVC中的技术可能不能最佳地执行,如果样本值的范围不占用0至2N个码字的范围或预期范围的大多数(例如,至少一半)。这种技术的例子包括去块滤波、取样自适应偏移(Sample Adaptive Offset,SAO)滤波、量化参数导出、内插法(例如,在运动补偿内使用)以及不可用样本的初始化。如本文中所使用的,术语范围映射误差可以指样本值以不理想或意外的方式占用一些码字的情况,并且可以包括限幅(例如,将最大样本值映射到小于最大码字值的码字值)、子范围的数量过量(例如,将大范围的样本值映射到小范围的码字)和/或子范围的数量不足(例如,将小范围的样本值映射到大范围的码字)。本文描述的技术可用于减轻范围映射误差的影响。
图1是示出根据本发明一个或多个技术的可被配置为对视频数据进行处理和编码(即,编码和/或解码)的系统的示例的框图。系统100表示根据本发明的一个或多个技术的可基于亮度转换函数或视频色彩分量值来优化视频编码的系统的示例。如图1所示,系统100包括源设备102、通信介质110和目标设备120。在图1所示的示例中,源设备102可以包括被配置为对视频数据进行编码并将编码的视频数据发送到通信介质110的任何设备。目标设备120可以包括被配置为经由通信介质110接收编码的视频数据并对编码的视频数据进行解码的任何设备。源设备102和/或目标设备120可以包括装备有有线和/或无线通信的计算设备,并且可以包括,例如机顶盒、数字录像机、电视、台式机、膝上型计算机、或平板电脑、游戏控制台、包括例如“智能”手机、蜂窝电话的移动设备、个人游戏设备和医疗成像设备。
通信介质110可以包括无线和有线通信介质和/或存储设备的任意组合。通信介质110可以包括同轴电缆、光缆、双绞线电缆、无线发射器和接收器、路由器、交换机、中继器、基站和/或可用于促进各种设备和站点之间的通信的任何其它设备。通信介质110可以包括一个或多个网络。例如,通信介质110可以包括被配置为能够访问万维网的网络,例如,因特网。网络可以根据一个或多个电信协议的组合来操作。电信协议可以包括专有方面和/或可以包括标准化电信协议。标准化电信协议的例子包括数字视频广播(Digital VideoBroadcasting,DVB)标准、高级电视系统委员会(Advanced Television SystemsCommittee,ATSC)标准、综合服务数字广播(Integrated Services DigitalBroadcasting,ISDB)标准,电缆数据服务接口规范(Data Over Cable Service InterfaceSpecification,DOCSIS)标准、全球系统移动通信(Global System MobileCommunications,GSM)标准、码分多址(Code Division Multiple Access,CDMA)标准、第三代合作伙伴项目(3rd Generation Partnership Project,3GPP)标准、欧洲电信标准协会(European Telecommunications Standards Institute,ETSI)标准、互联网协议(Internet Protocol,IP)标准,无线应用协议(Wireless Application Protocol,WAP)标准和IEEE标准。
存储设备可以包括能够存储数据的任何类型的设备或存储介质。存储介质可以包括有形的或非暂时性的计算机可读介质。计算机可读介质可以包括光盘、闪存、磁存储器和/或任何其它合适的数字存储介质。在一些示例中,存储设备或其部分可被描述为非易失性存储器,并且在其它示例中,存储设备的部分可被描述为易失性存储器。易失性存储器的例子可包括随机存取存储器(Random Access Memories,RAM)、动态随机存取存储器(Dynamic Random Access Memories,DRAM)、静态随机存取存储器(Static Random AccessMemories,SRAM)。非易失性存储器的例子可包括磁性硬盘、光盘、软盘、闪存或电可编程只读存储器(Electrically Programmable Memories,EPROM)或电可擦除可编程(Electrically Erasable and Programmable,EEPROM)存储器的形式。存储设备可以包括存储卡(例如,安全数字(Secure Digital,SD)存储卡)、
内部硬盘驱动器、外部硬盘驱动器、内部固体驱动器和/或外部固体驱动器。数据可以根据定义的文件格式存储在存储设备上,例如由ISO定义的标准的媒体文件格式。
再次参考图1,源设备102包括视频源104、视频处理单元105、视频编码器106和接口108。视频源104可以包括被配置为捕获和/或存储视频数据的任何设备。例如,视频源104可以包括视频摄像机和可操作地连接其的存储设备。在一个示例中,视频源104可以包括能够支持HDR视频数据的视频捕获设备(例如,具备0-10,000cd/m2的动态范围的设备)。视频处理单元105可被配置为从视频源接收视频数据,并将接收到的视频数据转换为被视频编码器106支持的格式,例如,能够被编码的格式。
在图2中示出了视频处理单元的示例。在图2所示的例子中,视频处理单元105包括光电转换函数单元202、色彩空间转换单元204、量化单元206、下采样单元208以及重映射单元210。应当注意的是,尽管视频处理单元105的元件可以位于视频系统中的各种物理位置。例如,光电转换函数单元202的功能可以在生产设备上执行并且下采样单元208的功能可以在广播设备上独立执行。还应当注意的是,尽管下面以特定顺序描述了功能,这并不限制特定操作以单一的顺序执行。例如,由下采样单元208执行的功能可以在由量化单元206执行的功能之前执行。进一步地,应当注意,由视频处理单元的元件执行的功能可以由源设备和/或视频编码器来执行。例如,由重映射单元210执行的功能可以由视频编码器106执行。
光电转换函数单元202可被配置为接收原始或微加工的视频数据,并根据另一个OETF转换视频数据。在一个示例中,光电转换函数单元202可被配置为根据上述的SMPTE ST2084转换函数来转换视频数据。色彩空间转换单元204可被配置为将一个色彩空间格式的视频数据转换为另一色彩空间格式的视频数据。例如,色彩空间转换单元可被配置为根据定义的一组转换方程,将RGB色彩空间格式的视频数据转换为YCbCr色彩空间格式的视频数据。量化单元206可被配置为量化色彩空间值。例如,量化单元206可被配置为量化12位Y、Cb和Cr值为8或10位值。下采样单元208可被配置为减少在定义的区域内的样本值的数量。例如,对于样本的阵列,每个像素可以有Y、Cb和Cr值(即4:4:4采样),下采样单元208可被配置为对阵列进行向下采样,使得对于每四个Y值,存在相应的Cb和Cr值(例如,4:2:0采样)。以这种方式,下采样单元208可以用支持的格式向视频编码器输出视频数据。
如上所述,当SDR视频数据根据对应于HDR的OETF进行转换时,例如,SMPTE ST2084,可能发生范围映射误差。重映射单元210可被配置为检测和减轻范围映射误差。如上所述,在使用SMPTE ST 2084来量化SDR视频数据的情况下,可用码字的大约一半是未使用的。在一个示例中,重映射单元210可被配置为扩展所使用的码字的范围(例如,将100cd/m2映射为位字1023)。重映射单元210可以基于输入值X和重映射的值Y之间的函数关系来重映射数据。函数关系可以包括函数(例如,Y=F(x))的组合和查找表。此外,可以为输入值的特定范围或区域分别指定函数和/或查找表。例如,输入值范围0-255可以根据查找表指定Y的值,并且输入值范围256-520可根据函数来指定Y的值。
在一个示例中,重映射函数可以是线性重映射函数。线性重映射函数的例子可以由下述公式组来定义:
Y=R(X)=A*X+C
wherc
A=(MaxR-Min_R)/(Max_I-Min_I)
C=Min_R-A*Min_1
在这个示例中,Min_I可对应于最小输入值(例如,4),Max_I可对应于最大输入值(例如,520),Min_R可对应于最小重映射值(例如,2),Max_R可对应于最大重映射值(例如,1023)。Min_I、Max_I、Min_R、Max_R、A和C中的每一个可被称为重映射参数。应当注意的是,可以存在其它类型的重映射参数(例如,查找表、索引值、常量值等)及各种方式来定义各种类型的重映射参数。例如,输入数据重映射参数的动态范围DR_I,可以被定义为最大输入值减去最小输入值。相较于非重映射数据,视频编码器可以用更有效的方式对重映射数据进行编码。例如,如果在被视频编码器编码之前数据被重映射,则颜色条带不太可能发生。
如上所述,在一些示例中,由重映射单元210执行的功能可以被实现为视频编码器的一部分。在这种情况下,视频编码器可被配置为用信号通知重映射参数。例如,可在片头、图片参数集(Picture Parameter Set,PPS)或序列参数集(Sequence Parameter Set,SPS)中进行信号通知重映射参数和/或查找表。如下面详细的描述,重映射单元302可被配置为基于信号通知的重映射参数执行重映射。以此方式,重映射单元210表示被配置为接收视频数据、确定与所述视频数据相关联的重映射参数以及至少部分地基于所述重映射参数修改包括在所述视频数据中的值的设备的实例。
再次参考图1,视频编码器106可以包括被配置为接收视频数据并生成表示所述视频数据的兼容位流的任何设备。兼容位流可以指视频解码器可以从其接收和再现视频数据的位流。兼容位流的多个方面可根据视频编码标准来定义,例如,ITU-T H.265(HEVC),其描述于Rec.ITU-T H.265v2(10/2014)中,所述Rec.ITU-T H.265v2(10/2014)的全文和/或扩展以引用的方式并入本文中。此外,可根据当前正在开发的视频编码标准来定义兼容位流。当生成兼容位流时,视频编码器106可压缩视频数据。压缩可以是有损的(可识别的或不可识别的)或无损的。
视频内容通常包括由一系列帧组成的视频序列。一系列帧也可以被称为一组图片(Group of Pictures,GOP)。每个视频帧或图片可以包括多个片,其中,一个片包括多个视频块,视频块包括像素值的阵列。在一个示例中,视频块可以被定义为像素值的最大阵列(也称为样本),其可以被预测地编码。如上所述,样本值可以相对于参考色彩空间来描述。例如,对于每个像素,样本值可指定相对于绿基色值的绿色值、相对于蓝基色值的蓝色值以及相对于红基色值的红色值。样本值也可以根据其他类型的色彩空间来指定,例如,可使用亮度色彩分量值和两个色度色彩分量值来指定像素值。如本文中所使用的,术语视频块可至少指可预测地编码的像素值的最大阵列、其细分部分和/或对应的结构。可根据扫描模式(例如,光栅扫描)来排序视频块。视频编码器对视频块及其细分部分执行预测编码。ITU-TH.264规定宏块包括16x 16的亮度样本。ITU-T H.265规定类似的编码树单元(Coding TreeUnit,CTU)结构,其中图片可被分成相同大小的CTU,并且每个CTU可以包括具有16x 16、32x32或64x 64亮度样本的编码树块(Coding Tree Block,CTB)。
在ITU-T H.265中,根据对应的四叉树数据结构,CTU的CTB可以被划分为编码块(Coding Blocks,CB)。根据ITU-T H.265,一个亮度CB和两个对应的色度CB以及相关联的语法元素被称为编码单元(Coding Unit,CU)。CU与为CU而定义一个或多个预测单元(Prediction Units,PU)的预测单元结构相关联,其中,PU与对应的参考样本相关联。例如,CU的PU可以是根据帧内预测模式编码的样本的阵列。特定的帧内预测模式数据(例如,帧内预测语法元素)可将PU与对应的参考样本相关联。在ITU-T H.265中,PU可以包括亮度和色度预测块(Prediction Blocks,PBs),其中正方形PBs被支持用于帧内图片预测和矩形PBs被支持用于帧间图片预测。PU中包括的样本值与相关联的参考样本之间的差可以被称为残留数据。
残留数据可以包括与视频数据的每个分量相对应的差值的相应阵列。例如,差值可以分别对应于亮度(Y)分量、第一色度分量(Cb)和第二色度分量(Cr)。残留数据可以在像素域中。转换,例如离散余弦变换(Discrete Cosine Transform,DCT)、离散正弦变换(Discrete Sine Transform,DST)、整数变换、小波变换、重叠变换或概念上类似的变换,可应用于像素差值以产生变换系数。应当注意的是,在一些示例中(例如,ITU-T H.265),PU可以被进一步细分为转换单元(Transform Units,TUs)。即,为了生成变换系数(例如,四个8x8转换可应用于残留数据的16x 16阵列),像素差值的阵列可以被细分,所述细分可以被称为转换块(Transform Blocks,TBs)。变换系数可以根据量化参数(QuantizationParameter,QP)进行量化。量化变换系数可以根据熵编码技术(例如, 内容自适应可变长度编码(Content Adaptive Variable Length Coding,CAVLC)、上下文自适应二进制算术编码(Context Adaptive Binary Arithmetic Coding,CABAC)、或概率区间划分熵编码(Probability Interval Partitioning Entropy Coding,PIPE))。更进一步地,语法元素,例如定义预测模式的语法元素,也可以进行熵编码。熵编码的量化变换系数和相应的熵编码的语法元素可以形成可用于再现视频数据的兼容位流。
如上所述,预测语法元素可将视频块及其PU与对应的参考样本相关联。例如,对于帧内预测编码,帧内预测模式可以指定参考样本的位置。在ITU-T H.265中,对亮度分量的可能的帧内预测模式包括平面预测模式(Planar Prediction Mode)(predMode:0)、DC预测(predMode:1)、33个角预测模式(predMode:2-34)。一个或多个语法元素可以识别35个帧内预测模式中的一个。对于帧间预测编码,运动向量(Motion Vector,MV)识别除了待编码的视频块的图像之外的图像中的参考样本,从而利用视频中的时间冗余。例如,可以从位于先前编码的帧中的参考块预测当前视频块,以及可使用运动向量来指示该参考块的位置。运动向量和相关联的数据可以描述,例如,运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度)、预测方向和/或参考图片索引值。进一步地,诸如ITU-T H.265的编码标准可支持运动向量预测。运动向量预测通过使用相邻块的运动向量来使运动向量能够被指定。
再次参考图1,接口108可以包括被配置为接收兼容视频位流并将所述兼容视频位流发送和/或存储到通信介质的任何设备。接口108可以包括诸如以太网卡的网络接口卡,并且可以包括光收发器、射频收发器或能够发送和/或接收信息的任何其它类型的设备。进一步地,接口108可以包括计算机系统接口,其可以使兼容视频位流被存储在存储设备上。例如,接口108可以包括支持PCI和PCIe总线协议、专用总线协议、通用串行总线(UniversalSerial Bus,USB)协议、I2C或可用于互连对等设备的任何其它逻辑和物理结构的芯片组。
如图1所示,目标设备120包括接口122、视频解码器124、视频处理单元125以及显示器126。接口122可以包括被配置为从通信介质接收兼容视频位流的任何设备。接口122可以包括诸如以太网卡的网络接口卡,并且可以包括光收发器、射频收发器或能够接收和/或发送信息的任何其它类型的设备。进一步地,接口122可以包括能够从存储设备取得兼容视频位流的计算机系统接口。例如,接口122可以包括支持PCI和PCIe总线协议、专用总线协议、通用串行总线(USB)协议、I2C或可用于互连对等设备的任何其它逻辑和物理结构的芯片组。视频解码器124可以包括被配置为接收兼容位流和/或其可接受的变化、并由此再现视频数据的任何设备。
视频处理单元125可被配置为接收视频数据并将接收的视频数据转换为被显示器支持的格式,例如,可以显示的格式。视频处理单元125的示例在图3中示出。在图3所示的例子中,视频处理单元125包括重映射单元302、上采样单元304、反量化单元306、色彩空间转换单元308和电光转换函数单元310。应当注意的是,由视频处理单元125的元件执行的功能可以由视频解码器和/或显示器来执行。例如,由重映射单元302执行的功能可以由视频解码器124来执行。
如上所述,当根据对应于HDR的OETF,例如,SMPTE ST 2084,对SDR视频数据进行转换时,可能发生范围映射误差。重映射单元302可以被配置为检测和减轻范围映射误差。重映射单元302可以被配置为以类似于上文关于重映射单元210所描述的方式,即,使用由一组重映射参数定义的线性重映射函数和/或使用查找表,来检测和减轻范围映射误差。应当注意的是,重映射单元302可以与重映射单元210结合或独立操作。例如,如上所述,视频编码器210可被配置为用信号通知重映射参数,例如,可在片头或图片参数集(PPS)或序列参数集(SPS)中。在该示例中,重映射单元302可以接收重映射参数和/或查找表,并且基于接收到的重映射参数和/或查找表执行重映射。应当注意的是,在其它示例中,重映射单元302被配置为推断重映射参数。例如,可以基于解码的视频数据来推断Min_I,例如,Min_I可以被推断为一组N个解码的视频样本值中的最小值。以此方式,重映射单元302表示被配置为接收基于范围映射误差生成的视频数据、确定与所述视频数据相关联的重映射参数以及至少部分地基于所述重映射参数修改包括在所述视频数据中的值的设备的示例。
再次参考图3,上采样单元304可被配置为在定义的区域内增加样本值的数量。例如,上采样单元304可被配置为转换4:2:0视频数据至4:4:4视频数据。反量化单元306可被配置为对色彩空间值执行反量化。例如,反量化单元306可被配置为转换Y、Cb、Cr的8或10位值至12位值。色彩空间转换单元308可被配置为将一个色彩空间格式的视频数据转换为另一个色彩空间格式的视频数据。例如,根据定义的一组转换方程,色彩空间转换单元可被配置为将YCbCr色彩空间格式的视频数据转换成RGB色彩空间格式的视频数据。电光转换函数单元310可被配置为接收视频数据,并根据EOTF来转换视频数据。应当注意的是,在一些示例中,在应用EOTF之前,视频数据可以被缩放到0到1的范围。在一个示例中,电光转换函数单元310可被配置为根据上述的SMPTE ST 2084转换函数来转换视频数据。
再次参考图1,显示器126可以包括被配置为显示视频数据的任何设备。显示器126可以包括各种显示设备中的一个,例如液晶显示器(liquid crystal display,LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一个类型的显示器。显示器126可以包括高清晰度显示器或超高清晰度显示器。在一个示例中,显示器126可以包括能够支持HDR视频数据的视频显示设备(例如,具备0-10,000cd/m2的动态范围的设备)。
如上所述,如果样本值的范围不占用码字的预期范围(例如,如果根据SMPTE ST2084量化SDR视频数据),则视频编码标准中的技术,例如去块滤波、取样自适应偏移(SAO)滤波、量化参数导出、内插法以及不可用样本的初始化,可能不能最佳地执行。除了使用重映射技术或作为替代方案来使用重映射技术,例如上述示例性的重映射技术,在本文描述的技术可以使得视频编码设备能够减轻编码过程中的范围映射误差的影响。例如,视频编码器和/或视频解码器可被配置为对特定位深度确定样本值的使用范围。样本值的使用范围可以基于分量样本值的组合,例如,Y、Cb、Cr的一个或全部和/或R、G、B的一个或全部、或另一种色彩样本格式(例如,CMYK减色法)。例如,视频编码设备可被配置为,基于特定的一组样本的最小和最大样本值,确定样本值的使用范围。例如,视频编码器可被配置为确定序列中没有样本值具有大于520的值。进一步地,在一些示例中,可以用信号通知使用范围样本值。例如,视频编码器可被配置为,在位流中和/或作为带外信号,用信号通知样本值的使用范围。一个或多个编码参数可以基于样本值的使用范围。例如,可基于位深度的量化参数(Quantization Parameter,QP)值以及从QP值导出的值,可以样本值的使用范围为基础进行修改。
图4是示出可实现本文所述的编码视频数据的技术的视频编码器400的示例的框图。应当注意的是,尽管示例的视频编码器400被示为具有不同的功能块,这样的说明是为了描述的目的,并且不将视频编码器400和/或其子元件限制为特定的硬件或软件结构。视频编码器400的功能可以使用硬件、固件和/或软件的实施方式的任何组合来实现。在一个示例中,视频编码器400可被配置为接收存储在BT.2020/ST-2084容器中的视频数据,确定所述视频数据的值的使用范围,以及基于所述视频数据的值的使用范围确定一个或多个编码参数。
视频编码器400可对视频片中的视频块进行帧内预测编码和帧间预测编码,并且因此可以被称为混合视频编码器。在图4所示的示例中,视频编码器400接收已根据编码结构划分的源视频块。例如,源视频数据可以包括宏块、CTU、其细分部分和/或另一等价编码单元。在一些示例中,视频编码器可被配置为执行源视频块的附加细分部分。应当注意的是,在本文描述的技术一般适用于视频编码,不管源视频数据在编码之前和/或编码期间是如何划分的。在图4所示的实例中,视频编码器400包括加法器402、变换系数生成器404、系数量化单元406、反量化/转换处理单元408、加法器410、帧内预测处理单元412、运动补偿单元414、运动估计单元416、去块滤波单元418、取样自适应偏移(SAO)滤波单元419和熵编码单元420。如图4所示,视频编码器400接收源视频块并输出位流。
在图4所示的实例中,视频编码器400可通过从源视频块中减去预测视频块来生成残留数据。下文详细描述预测视频块的选择。加法器402表示被配置为执行该减法运算的元件。在一个示例中,视频块的减法发生在像素域中。变换系数生成器404对残留块或其细分部分(例如,四个8×8变换可应用于残留值的16×16阵列)应用变换,例如离散余弦变换(DCT)、离散正弦变换(DST)、或概念上类似的变换,从而生成一组残留变换系数。变换系数生成器404可以将残留变换系数输出到系数量化单元406。
系数量化单元406可被配置为执行变换系数的量化。量化过程可减小与某些或全部系数相关联的位深度。量化的程度可以改变编码的视频数据的率-失真(即,比特率vs视频质量)。量化的程度可以通过调整量化参数进行修改。量化参数可以基于预测量化参数值和量化参数delta值。在ITU-T H.265中,可以针对每个CU更新量化参数,并且可以为每个亮度(Y)和色度(Cb和Cr)分量导出量化参数。
在示例中,根据输入值的动态范围、输入位深度,例如亮度和/或色度位深度,可导出修改的量化参数。修改的量化参数可用于变换系数的缩放(反量化)过程。修改的量化参数可用于将所接收的一组二进制符号映射到值的过程。修改的量化参数可用于量化样本值的缩放(反量化)过程。在一个示例中,修改的量化参数的导出可以基于在位流中接收的第一语法元素的值。基于在位流中较早接收的第二语法元素的值,可以在位流中有条件地接收第一语法元素。
在ITU-T H.265中,对于编码单元中的当前亮度编码块,可以基于预测量化参数值和根据下述等式导出的量化参数delta值来导出亮度量化参数Qp’Y:
EQUATION1
Qp’Y=QpY+QpBdOffsetY
EQUATION2
QpY=((qPY_PRED+CuQpDeltaVal+52+2*QpBdOffsetY)%(52+QpBdOffsetY))-QpBdOffsetY
其中,
-QpBdOffsetY是量化参数范围偏移,并且可以通过QpBdOffsetY=6*bit_depth_luma_minus8来导出;
-bit_depth_luma_minus8等于亮度(bitDepthY)的位深度减去8;
-qPY_PRED等于:
从片段头中用信号通知的变量导出的片亮度量化参数,或者
按解码顺序,在前一个量化组中的最后一个编码单元中的亮度量化参数;
-CuQpDeltaVal是从转换单元语法中用信号通知的变量中导出,并且具备在-(26+QpBdOffsetY/2)到+(25+QpBdOffsetY/2)的包含范围内的值;以及
-%是取模运算符,其中x%y是x除以y的余数,仅为x>=0和y>0的整数x和y而定义;
应当注意的是,在一些示例中,关于等式1和等式2,QpBdOffsetY可以被概括为包括基于亮度分量的位深度的任何值,并且等式2可以被概括为包括基于亮度量化参数预测值、编码单元量化参数delta值和亮度分量的位深度的任何函数。进一步地,应当注意的是,亮度量化参数预测值可在片头、序列参数集(SPS)、图片参数集(PPS)或任何其它合适的位置中被以信号通知。以这种方式,本文描述的技术不应解释为被基于对ITU-T H.265所描述的示例性例子所限制,并且通常可应用于其它视频编码标准中定义的量化参数,包括当前正在开发的视频编码标准。
进一步地,在ITU-T H.265中,根据下述等式导出编码单元的色度量化参数Qp’Cb和Qp’Cr:
EQUATION3
Qp’Cb=qPCb+QpBdOffsetC
EQUATION4
Qp’Cr=qPCr+QpBdOffsetC
其中,
-QpBdOffsetC是量化参数范围偏移,并且可以通过QpBdOffsetC=6*bit_depth_chroma_minus8来导出;
-bit_depth_chroma_minus8等于色度(bitDepthC)的位深度减去8;
在ITU-T H.265中,基于索引qPi等于变量qPiCb和qPiCr,变量qPCb和qPCr被设置为等于如表2中所指定的QpC的值。
qPi | <30 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | >43 |
Qpc | =qPi | 29 | 30 | 31 | 32 | 33 | 33 | 34 | 34 | 35 | 35 | 36 | 36 | 37 | 37 | =qP-6 |
表2
其中qPiCb和qPiCr如下导出:
EQUATION 5
qPiCb=Clip3(-QpBdOffsetC,57,QpY+pps_cb_qp_offset+
slice_cb_qp_offset)
EQUATION 5
qPiCr=Clip3(-QpBdOffsetC,57,QpY+pps_cr_qp_offset+slice_cr_qp_offset)
其中
-如果z<x,Clip3(x,y,z)等于x;如果z>y,Clip3(x,y,z)等于y;否则,Clip3(x,y,z)等于z;
-pps_cb_qp_offset在图片参数集中被发信号并且具有从-12到+12的包含范围内的值;
-pps_cr_qp_offset在图片参数集中被发信号并且具有从-12到+12的包含范围内的值;
-slice_cb_qp_offset在片段头中被发信号并且指定一个差以加入到pps_cb_qp_offset,以及具有从-12到+12的包含范围内的值;
-slice_cr_qp_offset在片段头中被发信号并且指定一个差以加入到pps_cr_qp_offset,以及具有从-12到+12的包含范围内的值;
应当注意的是,在一些示例中,关于等式3-6,QpBdOffsetC可以被概括为基于色度分量的位深度的任何值,并且qPiCb和qPiCr的函数可以被概括为包括基于亮度量化参数(或与之相关联的变量)和色度分量的位深度的任何函数。以此方式,本文所述的技术不应被解释为被基于关于ITU-T H.265描述的示例性例子所限制,并且通常可应用于如其它视频编码标准中所定义的色度量化参数,包括当前正在开发的视频编码标准。应当注意的是,量化参数(或与之相关联的变量)可用于确定与视频编码相关联的其它值(例如,去块滤波值等)。因此,根据本文描述的技术确定的量化参数可用于由视频编码器和/或视频解码器执行的其它功能。
如上所述,视频数据帧的一个区域可以比帧的另一个区域具有相对较小的动态范围(例如,阴影中的场景的一部分)。在一些示例中,这些区域可被包括在视频数据的同一片中。如以上等式中所示,在ITU-T H.265中,对于视频数据块,亮度量化参数Qp’Y是独立于所述块的亮度样本值导出的。即,在ITU-TH.265中导出的Qp’Y可能不考虑在视频数据的区域内的样本的实际亮度值和/或帧内的视频区域的亮度变化。这可能导致编码性能不太理想。本文描述的示例技术可用于基于具有视频数据的区域的样本值来确定用于视频数据的区域的量化参数。
在一个示例中,至少部分地基于视频数据块内的样本的亮度值,视频编码器400可被配置为确定视频数据块的量化参数。例如,至少部分地基于视频数据块内的样本的平均亮度值,视频编码器400可被配置为确定视频数据块的量化参数。例如,对于CU,视频编码器400可确定包括在CU中的所有样本的平均亮度分量值以及基于所述平均亮度分量值,生成用于所述CU的亮度和/或色度量化参数。进一步地,应当注意的是,在一些示例中,用于确定平均亮度值的视频数据块不一定需要与确定量化参数的视频数据块是相同的块。例如,平均亮度值可以基于一个片中的一个或多个CTU和一个CTU中的一个或多个CU进行确定。这些平均亮度值可用于为片内的任何CU生成亮度和/或色度量化参数。在一些示例中,用于确定平均亮度值的视频数据块可以与CU、LCU或PU块边界对齐。在其它示例中,用于确定平均亮度值的视频数据块不一定需要与CU、LCU或PU块边界对齐。
在一个示例中,用于CU的量化参数可以被确定为比例因子的函数(例如,A),乘以用于视频数据块的平均亮度值(例如,LumaAverage),加上偏移值(例如,Offset)。即,量化参数可以基于以下函数:
A*LumaAverage+Offset
在一个示例中,术语A*LumaAverage+Offset可以被称为量化δ值。在一个示例中,A*LumaAverage+Offset可被添加到预测器量化参数值(例如,片QP值或CTU QP值),以得到用于CU的量化参数值。再次参考上述等式1和2,术语qPY_PRED+CuQpDeltaVal可用于确定用于CU的亮度分量量化参数。在一个示例中,视频编码器400可被配置以使得CuQpDeltaVal基于A*LumaAverage+Offset。在一个示例中,视频编码器400可被配置以使得qPY_PRED等于为片中每个CU预定义的常数。在一个示例中,预定义的常数是片亮度量化参数,其对应于片段头中以信号通知的变量。
应当注意的是,在一个示例中,可以基于以下包括A、LumaAverage和Offset的函数确定CU的量化参数:
max(A*LumaAverage+Offset,Constant)
其中
-如果x大于等于y,max(x,y)返回x;如果y大于x,则max(x,y)
返回y。
术语max(A*LumaAverage+Offset,Constant)可用于以类似于术语A*LumaAverage+Offset的方式来确定量化参数。在一个示例中,A的值可以在0.01到0.05的范围内,并且在一个示例中,可以等于.03;Offset(偏移值)的值可以在-1到-6的范围内,并且在一个示例中,可以等于-3;以及Constant(常数)的值可以在-1到1的范围内,并且在一个示例中,可以等于0。应当注意的是,A、Offset和Constant的值可以基于所观测到的存储在BT.2020/ST-2084容器中的视频数据的编码性能。在一个示例中,将A、Offset和Constan的值设置为达到BT.2020/ST-2084容器中存储的视频数据的编码性能可能是可取的,比得上对具有恒定量化参数的BT.709/BT.1886容器中存储的同样数据进行编码。应当注意的是,本文所述的技术可用于对BT.2020/ST-2084容器中存储的视频数据进行编码,而不需要在BT.709/BT.1886容器中输入视频数据。视频编码标准可以指定多个可用色彩空间和/或动态范围中的一个。例如,HEVC包括视频可用性信息(Video Usability Information,VUI),其可用于表示色彩空间、动态范围和其他视频数据属性。在一个示例中,用于导出量化参数和相关联参数的函数(例如,A、Offset和Constant)可以根据视频可用性信息或正在开发中的视频编码标准中所包含的类似信息来确定。例如,函数可以包括基于亮度值统计的其它函数,包括例如,用于视频数据块的最大的、最小的和/或中值的亮度值。
如上所述,在一个示例中,预测量化参数值可以在片头、序列参数集、图片参数集或任何其他合适的位置处的位流中被信号通知。此外,在一个示例中,可以根据查找表操作来确定量化参数δ值。例如,LumaAverage可以参考查找表条目。此外,在一个示例中,量化δ值可以根据,包括例如二次等式、三次等式、多项式和/或非线性函数的其它类型的函数来确定。以此方式,视频编码器400表示一个设备的例子,该设备被配置为接收与视频数据的分量相对应的样本值阵列、确定样本值阵列的平均值、以及至少部分地基于所述平均值来确定用于变换系数的阵列的量化参数。
再次参考上面的等式5和等式6,在等式5和等式6中,基于QpY导出qPiCb和qPiCr。在亮度分量量化参数至少部分基于视频数据块的平均亮度值的例子中,修改qPiCb和qPiCr是如何导出的可能是有用的。即,例如,使用动态范围偏移值来导出qPiCb和qPiCr可能是有用的。进一步地,表2中所示的色度量化参数与亮度量化参数之间的关系不是线性的。因此,如上所述,如果样本值的范围不占用码字的预期范围,则基于亮度量化参数的色度量化参数的导出不能最佳地执行。这可能导致亮度和色度之间的不平衡的比率分配。为了减轻这个问题,在一个示例中,视频编码器400可以被配置为导出qPiCb和qPiCr,如下:
EQUATION 7
qPiCb=Clip3(-QpBdOffsetC,57,QpY+dynamic_range_qp_offset+pps_cb_qp_offset+slice_cb_qp_offset)-dynamic_range_qp_offset;
EQUATION 8
qPiCr=Clip3(-QpBdOffsetC,57,QpY+dynamic_range_qp_offset+pps_cr_qp_offset+slice_cr_qp_offset)-dynamic_range_qp_offset;
在一个示例中,dynamic_range_qp_offset是动态范围偏移值的例子并且可被定义如下:
dynamic_range_qp_offset specify offsets to the luma quantizationparameter Qp’Yused for deriving Qp’Cb and Qp’Cr,.In one example,the values ofdynamic_range_qp_offset shall be in the range of-12to+12,inclusive.
通过基于变量dynamic_range_qp_offset导出qPiCb和qPiCr,可以调整色度量化参数以减轻范围映射误差。在一个示例中,dynamic_range_qp_offset可以取决于输入值的动态范围、输入位深度,例如亮度和/或色度位深度。进一步地,dynamic_range_qp_offset可以从位流中的信息导出,和/或可以在片头或PPS或SPS中用信号通知。表3提供了可用于在PPS或SPS的任一个中用信号通知dynamic_range_qp_offset的语法的例子。
表3
在一个示例中,dynamic_range_qp_offset_enabled_flag可以定义如下:dynamic_range_qp_offset_enabled_flag等于1指定dynamic_range_qp_offset语法元素存在于PPS(或SPS)中,并且dynamic_range_qp_offset可存在于转换单元语法中。dynamic_range_qp_offset_enabled_flag等于0指定dynamic_range_qp_offset语法元素不存在于PPS(或SPS)中,并且dynamic_range_qp_offset不存在于转换单元语法中。
应当注意的是,在其它示例中,dynamic_range_qp_offset可以由每个色度分量的动态范围偏移所代替,例如dynamic_range_cb_qp_offset和dynamic_range_cr_qp_offset。进一步地,在一个示例中,dynamic_range_qp_offset可以在CU基础上变化。此外,在一个示例中,dynamic_range_qp_offset可以由视频解码器(例如,基于量化参数δ值的值)进行推断。在一个示例中,dynamic_range_qp_offset可以被推断为编码单元的量化参数和/或片的初始量化参数(即,片亮度量化参数)的函数。例如,dynamic_range_qp_offset可以等于(编码单元量化参数)减去(初始片量化参数)。在一个示例中,动态范围偏移值可以被推断为编码单元的平均亮度值和/或片的初始量化参数的函数。在一个示例中,片的初始量化参数可以包括qPY_PRED。如下文所详细描述的,关于视频解码器300,可以推断量化参数δ值。应当注意的是,在一些示例中,可以使用类似的技术来推断动态范围偏移值。例如,基于解码的视频块的平均亮度值,动态范围偏移值可由视频解码器300确定。以此方式,视频编码器200表示了一个设备的示例,所述设备可被配置为接收对应于视频数据的亮度分量的样本值阵列、确定样本值阵列的平均值、至少部分基于所述平均值来确定用于变换系数阵列的亮度量化参数、以及基于所述量化参数确定色度量化参数。
再次参考图4,量化变换系数被输出到反量化/变换处理单元408。反量化/变换处理单元408可被配置为应用反量化和反变换以生成重构的残留数据。如图4所示,在加法器410,重构的残留数据可以被添加到预测视频块。以此方式,可重构经编码的视频块,并且所得到的重构视频块可用于对给定的预测、变换和/或量化的编码质量进行评估。视频编码器400可被配置为执行多个编码通路(例如,执行编码的同时改变预测、变换参数和量化参数中的一个或多个)。可基于重构视频块的评估来优化位流的率-失真或其它系统参数。此外,重构视频块可以被存储,并用作预测后续块的参考。
如上所述,视频块可以使用帧内预测来进行编码。帧内预测处理单元412可被配置为选择帧内预测以用于待编码的视频块。帧内预测处理单元412可被配置为评估帧并确定用于对当前块进行编码的帧内预测模式。如上所述,可能的帧内预测模式可以包括平面预测模式、DC预测模式和角度预测模式。此外,应当注意的是,在一些实施例中,可从用于亮度预测模式的帧内预测模式推断色度分量的预测模式。帧内预测处理单元412可以在执行一个或多个编码通路之后选择帧内预测模式。进一步地,在一个示例中,帧内预测处理单元412可以基于率-失真分析来选择预测模式。
在HEVC中,帧内样本预测可以使用相邻上面的和左边的样本值作为参考样本值来预测当前块。当相邻样本值不可用时,它们可被其它可用的样本值取代,并且如果这些值都不可用的话,它们可被初始化为默认值。在一个示例中,默认值被提供为:
1<<(bitDepth-1)
其中
-x<<y是通过y二进制数字表示的x的两个补码整数表示的算术左移。仅对y的非负的整数值定义这个函数。作为左移的结果,移到最低有效位(Least Significant Bit,LSB)中的位,具有等于0的值;及
-bitDepth是用于亮度的bitDepthY和用于色度的bitDepthC。
因此,当相邻样本值不可用,且待替换的样本值不可用时,参考样本值的初始值为(近似)在完全位深度的样本值的中点。例如,对于10位数据(即样本值范围0-1023),初始值为512,并且对于8位数据(即样本值范围0-255),初始值为128。应当注意的是,默认的初始化也可以应用于不可用的图片。如上所述,例如,关于表1,在一些情况下,最小和最大像素值可能不占满范围0到(1<<bitDepth)–1(例如,SDR视频数据的最大值(例如,100cd/m2)可被量化为对于10位数据的520)。在此情况下,数据可能不以在完全位深度的样本值的中点为中心。在此情况下,将不可用参考样本初始化为1<<(bitDepth-1),可导致预测差、编码性能较低。
在一个示例中,不可用参考样本值的导出可以是以输入数据的动态范围和/或输入样本值的实际位深度(例如,基于一组样本中的实际样本值)为基础的。在一个示例中,不可用参考样本值的导出可基于在位流中接收的第一语法元素的值。基于在位流中较早接收的第二语法元素的值,可以在位流中有条件地接收第一语法元素。
在一个示例中,视频编码器400可被配置为使用除了用于不可用参考样本的中点之外的默认初始值。在一个示例中,所述初始值可以与输入数据的动态范围和/或输入样本值的实际位深度(例如,基于一组样本中的实际样本值)相关。进一步地,在一个示例中,可以在位流中(其中,信号值可以由视频解码器接收)用信号通知初始值,或者可在位流中用信号通知另一个值并用来导出初始值。例如,表中的值的索引可用于导出初始值。在一个示例中,可以基于观测到的数据来导出所述表,或者可以预先确定所述表。
在一个示例中,可以根据表4中提供的示例性语法来用信号通知初始值。
表4
在一个示例中,default_padding_abs可以如下定义:
default_padding_abs指定用于不可用样本的默认填充值,除了在完全位深度的样本值的中点。
等于1的specify_default_padding_enabled_flag,指定default_padding_abs语法元素存在于PPS[或SPS]中。
再次参考图4,运动补偿单元414和运动估计单元416可被配置为对当前视频块进行帧间预测编码。应当注意的是,尽管图示为不同的,运动补偿单元414和运动估计单元416可以进行高度整合。运动估计单元416可被配置为接收源视频块并计算视频块的PU的运动向量。运动向量可指示当前视频帧内的视频块的PU相对于参考帧内的预测块的位移。帧间预测编码可以使用一个或多个参考帧。进一步地,运动预测可以是单预测的(使用一个运动向量)或双预测的(使用两个运动向量)。运动估计单元416可被配置为通过计算例如由绝对差之和(Sum of Absolute Difference,SAD)、方差之和(Sum of Square Difference,SSD)或其它差度量所确定的像素差来选择预测块。
如上所述,运动向量可根据运动向量预测来确定和指定。运动估计单元416可被配置为执行如上所述的运动向量预测,以及其它所谓的先进运动向量预测(Advance MotionVector Predictions,AMVP)。例如,运动估计单元416可被配置为执行时间运动向量预测(Temporal Motion Vector Prediction,TMVP)、支持“合并”模式以及支持“跳过”和“直接”运动推断。例如,时间运动向量预测(TMVP)可包括从前一帧继承运动向量。
如图4所示,运动估计单元416可将计算出的运动向量的运动预测数据输出到运动补偿单元414和熵编码单元420。运动补偿单元414可被配置为接收运动预测数据,并使用所述运动预测数据生成预测块。例如,在从运动估计单元416接收到当前视频块的PU的运动向量时,运动补偿单元414可将对应的预测视频块定位在帧缓冲器内(图4中未示出)。应当注意的是,在一些示例中,运动估计单元416执行涉及亮度分量的运动估计,运动补偿单元414对色度分量和亮度分量两者都使用基于亮度分量所计算的运动向量。应当注意的是,运动补偿单元414还可以被配置为将一个或多个插值滤波器应用于重构的残留块以计算用于运动估计的子整数像素值。
如图4所示,运动补偿单元414和运动估计单元416可以通过去块滤波单元418和SAO滤波单元419接收重构视频块。去块滤波单元418可被配置为执行去块技术。去块是指使重构视频块的边界平滑的过程(例如,使边界对观看者而言不太明显)。SAO滤波单元419可被配置为执行SAO滤波。SAO滤波是非线性幅度映射,其可用于通过向重构的视频数据添加偏移来改善重构。在应用去块之后,通常应用SAO滤波。
在示例中,决策过程输出去块决策和用于去块中的滤波过程的参数。决策过程可以基于输入数据的动态范围和/或输入样本值的实际位深度(例如,基于一组样本中的实际样本值)。在一个示例中,决策过程可以基于在位流中接收的第一语法元素的值。基于在位流中较早接收的第二语法元素的值,可以在位流中有条件地接收第一语法元素。
在HEVC中,去块滤波器可应用于邻近于相邻视频块的边界的样本,例如PU边界(PUboundary,PB)或TU边界(TU boundary,TB)。在HEVC中,去块滤波器的粒度为8x8或更高。图6是示出了两个8x8相邻视频块P和Q的概念图。将去块滤波器应用于边界的决策是基于边界滤波器强度bS,其中,bS可以具有0、1或基于与P和Q相关联的预测的2的值(例如,如果P或Q中的一个使用帧内预测模式,则bS等于2)。进一步地,确定滤波器类型(例如,无、强或弱)以应用于边界,是基于对块P和Q内的样本的值与定义的阈值β和tC的比较。例如,过滤决策可以基于以下条件:
|p2,0-2p1,0+p0,0|+|p2,3-2p1,3+p0,3|+|q2,0-2q1,0+q0,0|+|q2,3-2q1,3+q0,3|>β
|p2,i-2p1,i+p0,i|+|q2,i-2q1,i+q0,il<β/8
|p3,i-p0,i|+|q0,i-q3,i|<β/8
|p0,i-q0,i|<2.5tC
在HEVC中,对于亮度块边缘,得到如下变量β:
β=β′*(1<<(BitDepthY-8))
其中
如表5中所指定,基于如下得到的亮度量化参数Q来确定β′:Q=Clip3(0,51,qPL+(slice_beta_offset_div2<<1))
其中
-qPL=((QpQ+QpP+1)>>1),变量QPQ和QpP被设置为等于编码单元的QpY值,所述编码单元包括:分别包含了样本q0,0和p0,0的编码块;
-slice_beta_offset_div2是用于包含了样本q0,0的片的语法元素slice_beta_offset_div2的值。
在HEVC中,对于亮度块边缘,变量tC导出如下:
tC=tC′*(1<<(BitDepthY-8))
其中
如表5所规定,基于如下得到的亮度量化参数Q来确定tC′:Q=Clip3(0,53,qPL+2*(bS-1)+(slice_tc_offset_div2<<1))
其中
-slice_tc_offset_div2是用于包含了样本q0,0的片的语法元素slice_tc_offset_div2的值。
在HEVC中,对于色度块边缘,变量tC导出如下:
tC=tC′*(1<<(BitDepthC-8))
其中
如表5所规定,基于如下得到的色度量化参数Q来确定tC′:
Q=Clip3(0,53,Qpc+2+(slice_tc_offset_div2<<1)),
变量QpC和QpP被设置为等于编码单元的QpC值,所述编码单元包括:分别包含了样本q0,0和p0,0的编码块;
其中
-slice_tc_offset_div2是用于包含了样本q0,0的片的语法元素slice_tc_offset_div2的值。
-如表5所规定,基于如下得到的索引qPi来确定QpC:
qPi=((QpQ+QpP+1)>>1)+cQpPicOffset应当注意的是,在一些情况下,QpC等于Min(qPi,51)
-如上所述,cQpPicOffset可被分别设置为等于pps_cb_qp_offset或者pps_cr_qp_offset。
Q | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 |
β′ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 6 | 7 | 8 |
tC′ | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
Q | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 |
β′ | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 20 | 22 | 24 | 26 | 28 | 30 | 32 | 34 | 36 |
tC′ | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 2 | 2 | 2 | 2 | 3 | 3 | 3 | 3 | 4 | 4 | 4 |
Q | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | |||
β′ | 38 | 40 | 42 | 44 | 46 | 48 | 50 | 52 | 54 | 56 | 58 | 60 | 62 | 64 | - | - | |||
tC′ | 5 | 5 | 6 | 6 | 7 | 8 | 9 | 10 | 11 | 13 | 14 | 16 | 18 | 20 | 22 | 24 |
表5:从输入Q得到阈值变量β′和tC′
如上所述,如果样本值的范围不占用码字的预期范围,去块滤波器可能不能最佳地执行。在一个示例中,视频编码器400可被配置为导出如下的β值:
β=β′*dynamic_range_scale
其中
如表5所规定,基于如下得到的亮度量化参数Q来确定β′:
Q=Clip3(0,51,qPL+dynamic_range_qp_offset+(slice_beta_offset_div2<<1))。
在一个实例中,视频编码器400可被配置导出如下tC值:
tC=tC′*dynamic_range_scale
其中
如表5所规定,基于如下得到的色度量化参数Q来确定tC′:
Q=Clip3(0,53,qPL+dynamic_range_qp_offset+2*(bS-1)+(slice_tc_offset_div2<<1))
在一个示例中,视频编码器400可被配置为导出如下用于色度块边缘的tC:
tC=tC′*dynamicrange_scale
其中
如表5所规定,基于如下得到的色度量化参数Q来确定tC′:
Q=Clip3(0,53,QpC+dynamic_range_qp_offset+2+(slice_tc_offset_div2<<1)),
在一个示例中,dynamicrange_qp_offset可以取决于输入值的动态范围,可以取决于输入位深度(例如,bitDepthY或bitDepthC),可以从位流给定的信息中得到,和/或可以在片头或PPS或SPS中用信号通知。信令dynamicrange_qp_offset的例子在上面相对于表3进行了描述。进一步地,在一个示例中,dynamic_range_scale可以从dynamicrange_qp_offset和位深度导出。
如上所述,SAO滤波单元419可被配置为执行SAO滤波。如上所述,变换系数的量化导致重构的和原始的块之间的数据损失。数据丢失通常不均匀地分布在像素之间。通常,在边缘周围的失真中存在偏差。除了在边缘周围的量化失真中的偏差,还可以发生与像素值的特定范围相关的系统误差。这些类型的系统误差(或偏差)都可以使用SAO滤波来校正。应当注意的是,SAO滤波可选择地被关闭,仅应用于亮度样本,或仅应用于色度样本。HEVC定义两个标志,该两个标志能够使SAO滤波可被控制,slice_sao_lumaflag(用于亮度的开/关(on/off))和slice_sao_chroma_flag(用于色度的开/关(on/off))。进一步地,SAO参数可被任一个明确地在CTU标头中用信号通知、或者从左边的或上方的CTU继承。SAO可以自适应地应用在像素上。HEVC提供两种类型的SAO滤波器(1)边缘型SAO滤波器,其中偏移量取决于边缘模式。边缘型的使用可通过语法元素SaoTypeIdx(例如,等于2)在HEVC中用信号通知;以及(2)带型SAO滤波器,其中偏移取决于样本振幅。带型SAO滤波器的使用可通过语法元素SaoTypeIdx(例如,等于1)在HEVC中用信号通知。带型SAO滤波器在有噪声的序列中或在具有大梯度的序列中通常是有利的。
带型SAO滤波器可以基于其强度将像素分类成不同的带。在一个示例中,从0到2N-1(例如,对于N=8为0到255)的像素范围可均匀地分段成32带。可以通过添加表示为带偏移的值来修改具有四个连续带内的值的样本。带偏移可以在CTU标头中被用信号通知。
如上所述,如果样本值的范围不占用码字的预期范围,SAO滤波器可能不能最佳地执行。在一个示例中,视频编码器400可被配置为确定样本值的使用范围以及样本值的使用范围可用于SAO滤波。在一个示例中,样本值的使用范围可被均匀地分割为32带,以及属于四个连续带的样本值可以通过添加表示为带偏移的值来进行修改。进一步地,在一个示例中,与使用范围相关联的信息可以在片或序列或图片参数标头中被用信号通知。在一个示例中,通过包括在SPS、PPS、片、CTU、CU和/或PU水平上的标志,可以控制SAO带偏移控制技术。
表6提供了可用于在PPS或SPS的任一个中用信号通知SAO技术的示例性语法:
表6
在一个示例中,dynamic_range_SAO_enabled_flag和dynamic_range_SAO_MAX可以如下定义:
dynamic_range_SAO_enabled_flag等于1,说明dynamic_range_SAO_MAX语法元素存在于PPS[或SPS]中,并且dynamic_range_SAO_MAX可存在于片单元语法或CTU语法中。dynamic_range_qp_offset_enabled_flag等于0,说明dynamic_range_qp_offset语法元素不存在于PPS[或SPS]中,并且dynamic_range_qp_offset不存在于转换单元语法中。
dynamic_range_SAO_MAX指定了被认为在SAO中的带偏移模式中的最大像素值。具体地,从0到dynamic_range_SAO_MAX的样本值范围被平均地分割成在带偏移模式中的32带。
再次参考图4,熵编码单元420接收量化的变换系数和预测的语法数据
(即,帧内预测数据和运动预测数据)。应当注意的是,在一些示例中,系数量化单元406可对包括了量化的变换系数的矩阵进行扫描,在该系数被输出到熵编码单元420之前。在其他示例中,熵编码单元420可执行扫描。熵编码单元420可被配置为根据本文所述的一个或多个技术来执行熵编码。熵编码单元420可被配置为输出兼容位流,即,视频解码器能够从其接收和再现视频数据的位流。
如上所述,可以根据熵编码技术对语法元素进行熵编码。为了将CABAC编码应用于语法元素,视频编码器可对语法元素执行二值化。二值化是指将语法值转换成一系列的一个或多个位的过程。这些位可以被称为“二进制位(Bins)”。例如,二值化可以包括使用8位固定长度技术将5的整数值表示为00000101,或使用一元编码技术将其表示为11110。二值化是无损过程,并且可以包括以下编码技术的一个或组合:固定长度编码、一元编码、截断一元编码、截断莱斯(Rice)编码、哥伦布(Golomb)编码、k阶指数哥伦布编码、哥伦布-莱斯编码。如本文中所使用的每个术语固定长度编码、一元编码、截断一元编码、截断莱斯编码、哥伦布编码、k阶指数哥伦布编码和哥伦布-莱斯编码可以指这些技术的一般实现和/或这些编码技术的更为明确的实现。例如,可以根据例如ITU-T H.265的视频编码标准,哥伦布-莱斯编码的实现方式可进行明确地定义。在一些示例中,本文描述的技术一般可应用于使用任何二值化编码技术生成的二进制值。
在二值化之后,CABAC熵编码器可选择上下文模型。对于特定的bin,可以从与二进制相关联的一组可用上下文模型中选择上下文模型。应当注意的是,在ITU-T H.265中,可以基于前一个bin和/或语法元素来选择上下文模型。上下文模型可以识别bin作为特定值的概率。例如,上下文模型可以指示编码0值bin的概率是0.7,以及编码1值bin的概率是0.3。在选择可用上下文模型之后,CABAC熵编码器可基于所识别的上下文模型对bin进行算术编码。
图5是示出根据本发明一个或多个技术的可被配置为解码视频数据的视频解码器的示例的框图。在一个示例中,视频解码器500可被配置为接收视频数据,确定视频数据的值的使用范围,以及基于所述视频数据的值的使用范围,确定一个或多个编码参数。在另一个实例中,视频解码器500可被配置为接收对应于视频数据的分量的样本值阵列,确定样本值阵列的平均值,以及至少部分地基于所述平均值来确定用于变换系数阵列的量化参数。
视频解码器500可被配置为执行帧内预测解码和帧间预测解码,并且,因此可被称为混合式解码器。在图5所示的示例中,视频解码器500包括熵解码单元502、反量化单元504、反变换处理单元506、帧内预测处理单元508、运动补偿单元510、加法器512、去块滤波单元514、SAO滤波单元515和参考缓冲器516。视频解码器500可被配置为以与视频编码标准一致的方式解码视频数据,包括当前正在开发的视频编码标准。如上文所述,视频解码器500可被配置为接收位流,所述位流包括在其中用信号通知的变量。应当注意的是,尽管示例性视频解码器500被示为具有不同的功能块,这样的说明是为了描述的目的,并且不将视频解码器500和/或其子元件限制为特定的硬件或软件架构。视频解码器500的功能可以采用硬件、固件和/或软件实现方式的任何组合来实现。
如图5所示,熵解码单元502接收熵编码的位流。熵解码单元502可被配置为根据与熵编码过程互易的过程来解码来自位流的量化的语法元素和量化的系数。熵解码单元502可被配置为根据上文所述的任一个熵编码技术来执行熵解码。熵解码单元502可以用与视频编码标准一致的方式来解析编码的位流。
如图5所示,反量化单元504从熵解码单元502接收量化的变换系数。反量化单元504可被配置为应用反量化。反变换处理单元506可被配置为执行反变换以生成重构的残留数据。由反量化单元504和反变换处理单元506分别执行的技术可以类似于上述的反量化/变换处理单元408所执行的技术。反量化过程可以包括例如由H.265解码标准定义的常规过程。进一步地,反量化过程还可以包括量化参数的使用。可以根据上述关于视频编码器的一个或多个技术来导出量化参数。
如上所述,视频编码器可以,用信号通知预测量化参数值和δ量化参数(例如,qPY_PRED和CuQpDeltaVal)。在一些示例中,视频解码器500可被配置为确定预测量化参数和/或δ量化参数。即,视频解码器500可被配置为,基于解码的视频数据的属性来确定预测量化参数和/或δ量化参数,以及基于包括在位流中的数据,来推断预测量化参数和/或δ量化参数。应当注意的是,在示例中,视频解码器500确定预测量化参数和/或δ量化参数,编码的视频数据可以使用减小的比特率来传输。即,例如,当不用信号通知CuQpDeltaVal或者不频繁地通知时,可以节省比特。
在一个示例中,视频解码器500可以至少部分基于视频数据块内的样本的平均亮度值来确定δ量化参数。用于确定平均亮度值的视频数据块可以包括各种类型的视频数据块。在一个示例中,可以为包括了编码单元、最大编码单元和/或预测单元的视频数据块计算平均亮度值。在一个示例中,可以为包括了帧内预测过程的输出的视频数据块计算平均亮度值。在一个示例中,可以为包括了帧间预测过程的输出的视频数据块计算平均亮度值。在一个示例中,可以为包括了在当前块之外(例如,相邻块)的重构像素值的视频数据块计算平均亮度值。在一个示例中,当前块之外的重构像素可以对应可用于当前块的帧内预测的重构像素值。在一个示例中,如果当前块之外的重构像素不可用于帧内预测,可以将平均亮度值设置为等于预定值。
一旦视频解码器500确定视频数据块的平均亮度值,可以以类似于上述的方式来确定δ量化参数。例如,可使用如上所述的函数A*LumaAverage+Offset和max(A*LumaAverage+Offset,Constant)。在一个示例中,可以在位流中用信号通知A、Offset(偏移)和Constant(常数)中的一个或多个。进一步地,在一个实施例中,平均亮度值可用于参考查找表中的δ量化参数。
此外,在一个示例中,结合位流中用信号通知的量化参数δ值,可以使用由视频解码器500所确定的量化参数δ值来确定量化参数。例如,基于用信号通知的量化参数δ值和推断的量化参数δ值,可以由视频解码器500确定如上所述的CuQpDeltaVal或者类似的量化参数δ值。例如,CuQpDeltaVal可以等于CuQpDeltaValsignaled+CuQpDeltaValinferred,其中,CuQpDeltaValsignaled包括在位流中并且CuQpDeltaValinferred是根据上述的一个或多个示例性技术所确定的。
此外,应当注意的是,在一些示例中,除了包括上述的qPY_PRED之外,量化参数预测值可以包括一个或多个不同类型的用信号通知的和/或推断的量化参数预测值。例如,量化参数预测值可以基于先前的编码单元来确定。例如,用于当前编码单元的量化参数可以基于以下示例函数:
max(A*Luma_CurrentAverage+Offset,Constant)-max(A*Luma_PreviousAverage+Offset,Constant)+Previous_QP+delta_QP
or
A*(Luma_CurrentAverage-Luma_PreviousAverage)+Previous_QP+delta_QP.
其中,
-Luma_CurrentAverage和Luma_PreviousAverage是分别用于当前编码单元和先前的编码单元的LumaAverage值;
-delta_QP包括了如上所述的任意示例性的量化参数δ值;及
-Previous_QP是与先前的编码单元关联的量化参数。
再次参考图5,反变换处理单元506可被配置为对变换系数应用反DCT、反DST、反整数变换、或概念上类似的反变换过程,以在像素域中产生残留块。如图5所示,重构的残留数据可以提供给加法器512。加法器512可以将重构的残留数据添加到预测视频块并生成重构的视频数据。预测视频块可以根据预测视频技术(即,帧内预测和帧间预测)来确定。
帧内预测处理单元508可被配置为接收帧内预测语法元素,并且从参考缓冲器516获取预测视频块。参考缓冲器516可包括被配置为存储一个或多个视频数据帧的存储器设备。帧内预测语法元素可以识别帧内预测模式,例如,上述的帧内预测模式。在一个示例中,根据关于视频编码器的上述的一个或多个技术,可以导出初始化值。
运动补偿单元510可以接收帧间预测语法元素,并生成运动向量以识别在参考缓冲器516中存储的一个或多个参考帧中的预测块。运动补偿单元510可以产生运动补偿块,可能基于插值滤波器执行内插法。用于具备子像素精度的运动估计的插值滤波器的标识符可被包括在语法元素中。运动补偿单元510可使用插值滤波器来计算参考块的子整数像素的内插值。
去块滤波单元514可被配置为对重构视频数据执行滤波。例如,去块滤波单元514可被配置为执行去块,如上文关于去块滤波单元418的描述。SAO滤波单元515可被配置为对重构的视频数据执行滤波。例如,SAO滤波单元515可被配置为执行SAO滤波,如上文关于SAO滤波单元419的描述。如图5所示,视频块可以由视频解码器500输出。以这种方式,视频解码器500可被配置为生成重构的视频数据。
在一个示例中,基于输入数据的动态范围和/或输入样本值的实际位深度(例如,基于一组样本中的实际样本值),解码器124的输出可以被修改(例如,修整到位于值的范围内)。在一个示例中,基于在位流中接收到的第一语法元素的值,解码器124的输出可以被修改(例如,修整到位于值的范围内)。基于在位流中较早接收的第二语法元素的值,可以在位流中有条件地接收第一语法元素。
在一个示例中,在符合位流中携带的变换系数水平值所允许的值范围,可以基于输入数据的动态范围和/或输入样本值的实际位深度(例如,基于一组样本中的实际样本值)。在一个示例中,在符合位流中携带的变换系数水平值所允许的值范围,可以基于在位流中接收的第一语法元素的值。基于在位流中较早接收的第二语法元素的值,可以在位流中有条件地接收第一语法元素。
在一个示例中,基于输入数据的动态范围和/或输入样本值的实际位深度(例如,基于一组样本中的实际样本值),反量化单元504的输出可以被修改(例如,修整到位于值的范围内)。在一个示例中,基于在位流中接收的第一语法元素的值,反量化单元504的输出可以被修改(例如,修整到位于值的范围内)。基于在位流中较早接收的第二语法元素的值,可以在位流中有条件地接收第一语法元素。
在一个示例中,反变换处理单元506可以包括两个一维(one-dimensional,1-D)反变换单元。在一个示例中,基于输入数据的动态范围和/或输入样本值的实际位深度(例如,基于一组样本中的实际样本值),在506中的第一1-D反变换单元的输出可以被修改(例如,修整到位于值的范围内)。在一个示例中,基于在位流中接收的第一语法元素的值,在506中的第一1-D反变换单元可以被修改。基于在位流中较早接收的第二语法元素的值,可以在位流中有条件地接收第一语法元素。
在一个或多个示例中,所描述的功能可以以硬件、软件、固件或其任意组合来实现。如果以软件实现,则所述功能可以存储在计算机可读介质上,或者作为在计算机可读介质上的一个或多个指令或代码而被传送,并且由基于硬件的处理单元来执行。计算机可读介质可以包括计算机可读存储介质,其对应于有形介质,例如数据存储介质、或者包括了促进计算机程序从一个地方传送到另一个地方的任何介质的通信介质,例如,根据通信协议。以这种方式,计算机可读介质通常可以对应于(1)有形的计算机可读存储介质,其为非易失性;或(2)诸如信号或载波的通信介质。数据存储介质可以是任何可用介质,其可被一个或多个计算机或一个或多个处理器访问以获取指令、代码和/或数据结构来实现本发明中所描述的技术。计算机程序产品可以包括计算机可读介质。
作为示例而非限制,这样的计算机可读存储介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、闪存、或可用于存储指令或数据结构的形式的所需程序代码并且可由计算机访问的任何其它介质。并且,任何连接都被适当地称为计算机可读介质。例如,如果使用同轴电缆、光缆、双绞线、数字用户线路(DigitalSubscriber Line,DSL)或诸如红外、无线电以及微波的无线技术从网站、服务器或其它远程源发送指令,则同轴电缆、光缆、双绞线、DSL或诸如红外、无线电和微波的无线技术包括在介质的定义中。然而,应当理解的是,计算机可读存储介质和数据存储介质不包括连接、载波、信号、或其它暂态介质,而是指向非瞬态(非易失性)有形存储介质。本文中所用的磁盘和盘包括压缩盘(Compact Disc,CD)、激光盘、光盘、数字多功能光盘(DigitalVersatile Disc,DVD)、软盘和蓝光盘,其中磁盘通常以磁方式再现数据,而光盘利用激光以光学方式再现数据。上述的组合也应包括在计算机可读介质的范围内。
指令可以由一个或多个处理器执行,例如一个或多个数字信号处理器(DigitalSignal Processor,DSP)执行、通用微处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程逻辑阵列(Field Programmable Logic Aarrays,FPGA)、或其他等效的集成或离散逻辑电路。相应地,本文中所使用的术语“处理器”可指任何前述结构或适用于实施本文所述技术的任何其它结构。此外,在一些方面,本文描述的功能可被提供在被配置为进行编码和解码、或结合在组合编解码器中的专用硬件和/或软件模块内。并且,所述技术可以完全实现在一个或多个电路或逻辑元件中。
本公开的技术可以在包括了无线手机、集成电路(Integrated Circuit,IC)或一组IC(例如,芯片组)的各种各样的设备或装置中实现。在本公开中描述了各种元件、模块或单元以强调被配置为执行所公开的技术的设备的功能方面,但不需要通过不同的硬件单元实现。相反,如上所述,各种单元可被组合在编解码器硬件单元中或由互操作的硬件单元的集合提供,并结合适当的软件和/或固件,其中该硬件单元包括一个或多个如上所述的处理器。
此外,在上述的每个实施例中使用的基站设备和终端设备(视频解码器和视频编码器)的每个功能块或各种特征,可由电路实现或执行,该电路通常为集成电路或多个集成电路。设计成执行本说明书中所描述的功能的电路可以包括通用处理器、数字信号处理器(DSP)、专用或通用应用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、或离散硬件组件或其组合。通用处理器可以是微处理器,或者可选地,处理器可以是常规处理器、控制器、微控制器或状态机。上述通用处理器或每个电路可以由数字电路配置或者可以由模拟电路配置。进一步地,由于半导体技术的进步,当接替当前集成电路的一种制造集成电路的技术出现时,由该技术制造的集成电路也可以使用。
各种示例已被描述。这些和其它示例在下述权利要求的范围内。
Claims (54)
1.一种修改视频数据的方法,其特征在于,所述方法包括步骤:
接收基于范围映射误差生成的视频数据;
确定与所述视频数据相关联的重映射参数;及
至少部分地基于所述重映射参数修改包括在所述视频数据中的值。
2.根据权利要求1所述的方法,其特征在于,其中所述范围映射误差与将线性亮度值映射到数字码字的函数相关联。
3.根据权利要求2所述的方法,其特征在于,其中,所述将线性亮度值映射到数字码字的函数对应于高动态范围(HDR)视频数据,并且在动态范围包括标准动态范围(SDR)视频数据时,产生重映射误差。
4.根据权利要求1至3中任一项所述的方法,其特征在于,接收视频数据包括:在视频编码设备处接收视频数据以作为输入数据。
5.根据权利要求1至3中任一项所述的方法,其特征在于,接收视频数据包括:在视频解码设备处接收视频数据以作为输出数据。
6.根据权利要求1至5中任一项所述的方法,其特征在于,重映射参数包括查找表。
7.根据权利要求1至6中任一项所述的方法,其特征在于,重映射参数包括一个或多个最小输入值、最大输入值、最小重映射值和最大重映射值。
8.根据权利要求1至7中任一项所述的方法,其特征在于,确定重映射参数包括:接收被用信号通知的重映射参数。
9.根据权利要求1至7中任一项所述的方法,其特征在于,确定重映射参数包括:至少部分地基于所述接收到的视频数据确定重映射参数。
10.根据权利要求1至9中任一项所述的方法,其特征在于,至少部分地基于所述重映射参数修改包括在所述视频数据中的值包括:扩展与所述视频数据相关联的值的范围。
11.一种视频数据编码方法,其特征在于,所述方法包括步骤:
接收视频数据;
确定视频数据的值的使用范围;及
至少部分地基于视频数据的值的使用范围,确定一个或多个编码参数。
12.根据权利要求11所述的方法,其特征在于,接收视频数据包括:在视频编码设备处接收视频数据以作为输入数据。
13.根据权利要求11所述的方法,其特征在于,接收视频数据包括:在视频解码设备处接收视频数据以作为输出数据。
14.根据权利要求11至13中任一项所述的方法,其特征在于,基于视频数据的使用范围确定一个或多个编码参数包括:确定量化参数。
15.根据权利要求14所述的方法,其特征在于,确定量化参数包括:至少部分地基于偏移值,导出色度量化参数。
16.根据权利要求15所述的方法,其特征在于,所述偏移值在负12到正12的范围内。
17.根据权利要求15所述的方法,其特征在于,至少部分地基于偏移值导出色度量化参数包括:至少部分地基于偏移值生成索引值。
18.根据权利要求15所述的方法,其特征在于,至少部分地基于偏移值导出色度量化参数包括:从量化参数中减去偏移值。
19.根据权利要求11至13中任一项所述的方法,其特征在于,基于视频数据的使用范围确定一个或多个编码参数包括:基于视频数据的使用范围,确定与去块滤波器强度相关联的阈值。
20.根据权利要求19所述的方法,其特征在于,基于视频数据的使用范围确定与去块滤波器强度相关联的阈值包括:基于与所述视频数据的使用范围相关联的偏移值来确定索引值。
21.根据权利要求19至20中任一项所述的方法,其特征在于,基于视频数据的使用范围,确定与去块滤波器强度相关联的阈值包括:基于所述视频数据的使用范围来缩放阈值。
22.根据权利要求21所述的方法,其特征在于,在参数集中以信号通知比例因子。
23.根据权利要求21所述的方法,其特征在于,从偏移值或位深度导出比例因子。
24.根据权利要求20至23中任一项所述的方法,其特征在于,在参数集中以信号通知偏移值。
25.根据权利要求11至13中任一项所述的方法,其特征在于,基于视频数据的使用范围确定一个或多个编码参数包括:确定初始值。
26.根据权利要求25所述的方法,其特征在于,确定初始值包括:基于填充值确定初始值。
27.根据权利要求26所述的方法,其特征在于,基于填充值确定初始值包括:基于位深度将填充值添加到中点值。
28.根据权利要求11至13中任一项所述的方法,其特征在于,基于视频数据的使用范围确定一个或多个编码参数包括:确定取样自适应偏移滤波器的一个或多个带。
29.根据权利要求28所述的方法,其特征在于,确定取样自适应偏移滤波器的一个或多个带包括:基于所述使用范围生成32个带。
30.一种用于编码视频数据的设备,其特征在于,所述设备包括一个或多个处理器,所述处理器被配置为执行权利要求1至29的步骤的任何和全部组合。
31.根据权利要求30所述的设备,其特征在于,所述设备包括视频编码器。
32.根据权利要求30所述的设备,其特征在于,所述设备包括视频解码器。
33.一种用于编码视频数据的装置,其特征在于,所述装置包括用于执行权利要求1至29的步骤的任何和全部组合的手段。
34.一种非暂时性计算机可读存储介质,其特征在于,所述非暂时性计算机可读存储介质包括存储的指令,所述指令在执行时,使得视频数据编码设备的一个或多个处理器执行权利要求1至29的步骤的任何和全部组合。
35.一种确定量化参数的方法,其特征在于,所述方法包括步骤:
接收对应于视频数据的分量的样本值的阵列;
确定所述样本值的阵列的平均值;及
至少部分地基于所述平均值确定变换系数阵列的量化参数。
36.根据权利要求35所述的方法,其特征在于,所述分量包括亮度分量。
37.根据权利要求35或36所述的方法,其特征在于,所述样本值的阵列与变换系数值的阵列对准。
38.根据权利要求35至37中任一项所述的方法,其特征在于,所述样本值的阵列包括与所述变换系数值的阵列不同的样本数。
39.根据权利要求35至38中任一项所述的方法,其特征在于,所述样本值的阵列包括从解码的视频数据导出的样本值。
40.根据权利要求35至39中任一项所述的方法,其特征在于,至少部分地基于所述平均值确定量化参数包括:至少部分地基于所述平均值确定量化参数δ值。
41.根据权利要求40所述的方法,其特征在于,至少部分地基于所述平均值确定量化参数δ值包括:对所述平均值应用线性函数。
42.根据权利要求40所述的方法,其特征在于,至少部分地基于所述平均值确定量化参数δ值包括:确定应用到所述平均值的线性函数的最大值和常数值。
43.根据权利要求40至42中任一项所述的方法,其特征在于,该方法进一步包括:在位流中用信号通知量化参数δ值。
44.根据权利要求40至43中任一项所述的方法,其特征在于,至少部分地基于所述平均值确定用于变换系数阵列的量化参数包括:将所述量化参数δ值添加到预测量化参数。
45.根据权利要求44所述的方法,其特征在于,预测量化参数包括:在片头中被用信号通知的预测量化参数或者至少部分地基于前一个编码单元确定的预测量化参数中的一个。
46.根据权利要求35至45中任一项所述的方法,其特征在于,量化参数包括亮度量化参数,并且进一步包括:基于所述量化参数确定色度量化参数。
47.根据权利要求46所述的方法,其特征在于,基于所述量化参数确定色度量化参数包括:基于动态范围偏移值确定色度量化参数。
48.根据权利要求35至47中任一项所述的方法,其特征在于,所述样本值的阵列包括对应于具有比ITU-R BT.709色彩空间更大的范围的色彩空间的样本值。
49.根据权利要求48所述的方法,其特征在于,所述样本值阵列包括对应于ITU-RBT.2020色彩空间的样本值。
50.一种用于编码视频数据的设备,其特征在于,所述设备包括一个或多个处理器,所述处理器被配置为执行权利要求35至49的步骤的任何和全部组合。
51.根据权利要求50所述的设备,其特征在于,所述设备包括视频编码器。
52.根据权利要求50所述的设备,其特征在于,所述设备包括视频解码器。
53.一种用于编码视频数据的装置,其特征在于,所述装置包括用于执行权利要求35至49的步骤的任何和全部组合的手段。
54.一种非暂时性计算机可读存储介质,其特征在于,所述非暂时性计算机可读存储介质包括存储的指令,所述指令在执行时,使得用于编码视频数据设备的一个或多个处理器执行权利要求35至49的步骤的任何和全部组合。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562172177P | 2015-06-07 | 2015-06-07 | |
US62/172177 | 2015-06-07 | ||
US201562233352P | 2015-09-26 | 2015-09-26 | |
US62/233352 | 2015-09-26 | ||
PCT/JP2016/002761 WO2016199409A1 (en) | 2015-06-07 | 2016-06-07 | Systems and methods for optimizing video coding based on a luminance transfer function or video color component values |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107852512A true CN107852512A (zh) | 2018-03-27 |
Family
ID=57503222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680032914.3A Pending CN107852512A (zh) | 2015-06-07 | 2016-06-07 | 基于亮度转换函数或视频色彩分量值的优化视频编码的系统及方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20180167615A1 (zh) |
EP (1) | EP3304912A4 (zh) |
CN (1) | CN107852512A (zh) |
WO (1) | WO2016199409A1 (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108769804A (zh) * | 2018-04-25 | 2018-11-06 | 杭州当虹科技股份有限公司 | 一种高动态范围视频的格式转换方法 |
CN111434111A (zh) * | 2018-04-01 | 2020-07-17 | Lg电子株式会社 | 基于量化参数推导的图像编码设备及其方法 |
CN112640469A (zh) * | 2018-09-05 | 2021-04-09 | 松下电器(美国)知识产权公司 | 编码装置、解码装置、编码方法和解码方法 |
CN113273205A (zh) * | 2018-12-21 | 2021-08-17 | 北京字节跳动网络技术有限公司 | 使用更高比特深度精度的运动矢量推导 |
CN113284248A (zh) * | 2021-06-10 | 2021-08-20 | 上海交通大学 | 一种点云有损压缩的编解码方法、装置和系统 |
CN113785577A (zh) * | 2019-04-26 | 2021-12-10 | 华为技术有限公司 | 用于指示色度量化参数映射函数的方法和装置 |
CN113853788A (zh) * | 2019-05-31 | 2021-12-28 | 联发科技股份有限公司 | 色度残差缩放的延迟降低方法和装置 |
US20220038721A1 (en) * | 2019-03-05 | 2022-02-03 | Zte Corporation | Cross-component quantization in video coding |
CN114026858A (zh) * | 2019-06-23 | 2022-02-08 | 夏普株式会社 | 用于在视频编码中导出视频块的量化参数的系统和方法 |
CN114175651A (zh) * | 2019-06-20 | 2022-03-11 | Lg电子株式会社 | 基于亮度映射和色度缩放的视频或图像编码 |
CN116508324A (zh) * | 2020-10-02 | 2023-07-28 | 杜比实验室特许公司 | 用于sdr到hdr上转换的自适应局部整形 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013109026A1 (ko) * | 2012-01-18 | 2013-07-25 | 엘지전자 주식회사 | 엔트로피 부호화/복호화 방법 및 그 장치 |
WO2017093188A1 (en) * | 2015-11-30 | 2017-06-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Encoding and decoding of pictures in a video |
WO2018067051A1 (en) * | 2016-10-05 | 2018-04-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Deringing filter for video coding |
JP6822123B2 (ja) * | 2016-12-19 | 2021-01-27 | ソニー株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP6822121B2 (ja) | 2016-12-19 | 2021-01-27 | ソニー株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP6822122B2 (ja) * | 2016-12-19 | 2021-01-27 | ソニー株式会社 | 画像処理装置、画像処理方法及びプログラム |
CN110612724B (zh) * | 2017-03-21 | 2021-04-20 | 杜比实验室特许公司 | 使用明亮度信息的量化参数预测 |
US10200687B2 (en) * | 2017-06-02 | 2019-02-05 | Apple Inc. | Sample adaptive offset for high dynamic range (HDR) video compression |
CN107087163B (zh) * | 2017-06-26 | 2018-10-12 | 杭州当虹科技股份有限公司 | 一种提升hdr视频主观质量的编码方法 |
EP3649782A4 (en) * | 2017-07-05 | 2021-04-14 | Telefonaktiebolaget LM Ericsson (PUBL) | DECODING A BLOCK OF VIDEO SAMPLE |
US11019339B2 (en) * | 2017-07-12 | 2021-05-25 | Futurewei Technologies, Inc. | Fractional quantization parameter offset in video compression |
US10778978B2 (en) * | 2017-08-21 | 2020-09-15 | Qualcomm Incorporated | System and method of cross-component dynamic range adjustment (CC-DRA) in video coding |
EP3557872A1 (en) * | 2018-04-16 | 2019-10-23 | InterDigital VC Holdings, Inc. | Method and device for encoding an image or video with optimized compression efficiency preserving image or video fidelity |
CN110446041B (zh) | 2018-05-02 | 2021-11-19 | 中兴通讯股份有限公司 | 一种视频编解码方法、装置、系统及存储介质 |
US20200045341A1 (en) * | 2018-07-31 | 2020-02-06 | Ati Technologies Ulc | Effective electro-optical transfer function encoding for limited luminance range displays |
CN113545060B (zh) * | 2019-03-08 | 2025-04-18 | 中兴通讯股份有限公司 | 视频编码中的空瓦片编码 |
CN113545044B (zh) | 2019-03-08 | 2025-06-13 | 北京字节跳动网络技术有限公司 | 视频处理中的整形模型 |
CN113692741B (zh) | 2019-04-18 | 2022-12-13 | 北京字节跳动网络技术有限公司 | 跨分量模式中的参数推导 |
KR102779365B1 (ko) * | 2019-04-19 | 2025-03-10 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 제산 없는 인트라 예측을 위한 방법 및 장치 |
WO2020216246A1 (en) | 2019-04-23 | 2020-10-29 | Beijing Bytedance Network Technology Co., Ltd. | Methods for cross component dependency reduction |
JP7407206B2 (ja) | 2019-05-08 | 2023-12-28 | 北京字節跳動網絡技術有限公司 | クロスコンポーネントコーディングの適用条件 |
CN113994697B (zh) | 2019-06-22 | 2024-10-18 | 北京字节跳动网络技术有限公司 | 色度残差缩放的语法元素 |
CN114128280B (zh) | 2019-07-07 | 2023-11-14 | 北京字节跳动网络技术有限公司 | 色度残差缩放的信令通知 |
WO2021037004A1 (en) * | 2019-08-23 | 2021-03-04 | Huawei Technologies Co., Ltd. | An encoder, a decoder and corresponding methods for performing chroma deblocking for blocks which use joint chroma coding |
KR20220062085A (ko) | 2019-09-20 | 2022-05-13 | 알리바바 그룹 홀딩 리미티드 | 비디오 처리에서 양자화 파라미터 시그널링 |
US11558616B2 (en) * | 2020-03-05 | 2023-01-17 | Qualcomm Incorporated | Methods for quantization parameter control for video coding with joined pixel/transform based quantization |
US11516514B2 (en) * | 2020-03-27 | 2022-11-29 | Tencent America LLC | High level control for deblocking operations |
US20250126266A1 (en) * | 2023-10-16 | 2025-04-17 | Tencent America LLC | Ccso with band offset only option |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010187302A (ja) * | 2009-02-13 | 2010-08-26 | Mitsubishi Electric Corp | 動画像符号化装置 |
CN102172024A (zh) * | 2008-10-03 | 2011-08-31 | 高通股份有限公司 | 用于色度和亮度视频块的编码的量化参数选择 |
WO2012118359A2 (ko) * | 2011-03-03 | 2012-09-07 | 한국전자통신연구원 | 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치 |
CN102934430A (zh) * | 2010-06-11 | 2013-02-13 | 索尼公司 | 图像处理装置和方法 |
CN103139565A (zh) * | 2011-11-25 | 2013-06-05 | 吴秀美 | 用于对色度图像解码的方法 |
CN103238334A (zh) * | 2010-10-01 | 2013-08-07 | 三星电子株式会社 | 图像帧内预测方法和设备 |
CN103379321A (zh) * | 2012-04-16 | 2013-10-30 | 华为技术有限公司 | 视频图像分量的预测方法和装置 |
US20140092998A1 (en) * | 2012-10-01 | 2014-04-03 | Microsoft Corporation | Frame packing and unpacking higher-resolution chroma sampling formats |
CN103828369A (zh) * | 2011-06-10 | 2014-05-28 | 茨特里克斯系统公司 | 质量感知视频优化中的宏块级自适应量化 |
WO2014205561A1 (en) * | 2013-06-28 | 2014-12-31 | Blackberry Limited | Methods and devices for emulating low-fidelity coding in a high-fidelity coder |
CN104303501A (zh) * | 2012-04-03 | 2015-01-21 | 高通股份有限公司 | 用于视频译码的量化矩阵和解块滤波器 |
US20150071344A1 (en) * | 2013-09-09 | 2015-03-12 | Apple Inc. | Chroma quantization in video coding |
CN104584560A (zh) * | 2012-07-02 | 2015-04-29 | 微软公司 | 在去块时使用色度量化参数偏移 |
CN104584559A (zh) * | 2012-07-02 | 2015-04-29 | 微软公司 | 用于色度qp值的扩展的范围 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07322260A (ja) * | 1994-05-27 | 1995-12-08 | Sony Corp | 符号化装置 |
FI4155898T3 (fi) * | 2011-12-06 | 2024-12-02 | Dolby Laboratories Licensing Corp | Menetelmä havaittuun luminanssin ei-lineaarisuuteen perustuvan kuvatietojen vaihdon parantamiseksi eri näyttöominaisuuksien kesken |
ES2708954T3 (es) * | 2013-02-21 | 2019-04-12 | Dolby Laboratories Licensing Corp | Gestión de visualización para video de alto rango dinámico |
BR112015024172B1 (pt) * | 2013-03-26 | 2023-01-31 | Dolby Laboratories Licensing Corporation | Método, sistema e meio de armazenamento legível por computador |
CN105324997B (zh) * | 2013-06-17 | 2018-06-29 | 杜比实验室特许公司 | 用于增强动态范围信号的分层编码的自适应整形 |
US10136133B2 (en) * | 2014-11-11 | 2018-11-20 | Dolby Laboratories Licensing Corporation | Rate control adaptation for high-dynamic range images |
EP3096516A1 (en) * | 2015-05-22 | 2016-11-23 | Thomson Licensing | Method for color mapping a video signal and method of encoding a video signal and corresponding devices |
-
2016
- 2016-06-07 EP EP16807117.3A patent/EP3304912A4/en not_active Withdrawn
- 2016-06-07 WO PCT/JP2016/002761 patent/WO2016199409A1/en active Application Filing
- 2016-06-07 CN CN201680032914.3A patent/CN107852512A/zh active Pending
- 2016-06-07 US US15/579,850 patent/US20180167615A1/en not_active Abandoned
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102172024A (zh) * | 2008-10-03 | 2011-08-31 | 高通股份有限公司 | 用于色度和亮度视频块的编码的量化参数选择 |
JP2010187302A (ja) * | 2009-02-13 | 2010-08-26 | Mitsubishi Electric Corp | 動画像符号化装置 |
CN102934430A (zh) * | 2010-06-11 | 2013-02-13 | 索尼公司 | 图像处理装置和方法 |
CN103238334A (zh) * | 2010-10-01 | 2013-08-07 | 三星电子株式会社 | 图像帧内预测方法和设备 |
WO2012118359A2 (ko) * | 2011-03-03 | 2012-09-07 | 한국전자통신연구원 | 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치 |
CN103828369A (zh) * | 2011-06-10 | 2014-05-28 | 茨特里克斯系统公司 | 质量感知视频优化中的宏块级自适应量化 |
CN103139565A (zh) * | 2011-11-25 | 2013-06-05 | 吴秀美 | 用于对色度图像解码的方法 |
CN104303501A (zh) * | 2012-04-03 | 2015-01-21 | 高通股份有限公司 | 用于视频译码的量化矩阵和解块滤波器 |
CN103379321A (zh) * | 2012-04-16 | 2013-10-30 | 华为技术有限公司 | 视频图像分量的预测方法和装置 |
CN104584560A (zh) * | 2012-07-02 | 2015-04-29 | 微软公司 | 在去块时使用色度量化参数偏移 |
CN104584559A (zh) * | 2012-07-02 | 2015-04-29 | 微软公司 | 用于色度qp值的扩展的范围 |
US20140092998A1 (en) * | 2012-10-01 | 2014-04-03 | Microsoft Corporation | Frame packing and unpacking higher-resolution chroma sampling formats |
WO2014205561A1 (en) * | 2013-06-28 | 2014-12-31 | Blackberry Limited | Methods and devices for emulating low-fidelity coding in a high-fidelity coder |
US20150071344A1 (en) * | 2013-09-09 | 2015-03-12 | Apple Inc. | Chroma quantization in video coding |
Non-Patent Citations (2)
Title |
---|
KEIICHI CHONO等: "Enhanced chroma QP signalling for adaptive cross-component transform in SCC extensions", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, 19TH MEETING: STRASBOURG, FR, 17–24 OCT. 2014, DOCUMENT: JCTVC-S0040-V2》 * |
MATTEO NACCARI等: "Improving HEVC compression efficiency by intensity dependant spatial quantisation", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, 10TH MEETING: STOCKHOLM, SE, 11–20 JULY 2012, DOCUMENT: JCTVC-J0076》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111434111A (zh) * | 2018-04-01 | 2020-07-17 | Lg电子株式会社 | 基于量化参数推导的图像编码设备及其方法 |
US11917155B2 (en) | 2018-04-01 | 2024-02-27 | Lg Electronics Inc. | Image coding apparatus and method thereof based on a quantization parameter derivation |
US11477453B2 (en) | 2018-04-01 | 2022-10-18 | Lg Electronics Inc. | Image coding apparatus and method thereof based on a quantization parameter derivation |
CN116320456A (zh) * | 2018-04-01 | 2023-06-23 | Lg电子株式会社 | 编解码设备的画面编解码方法、存储介质及数据发送方法 |
CN108769804A (zh) * | 2018-04-25 | 2018-11-06 | 杭州当虹科技股份有限公司 | 一种高动态范围视频的格式转换方法 |
CN112640469A (zh) * | 2018-09-05 | 2021-04-09 | 松下电器(美国)知识产权公司 | 编码装置、解码装置、编码方法和解码方法 |
CN113273205A (zh) * | 2018-12-21 | 2021-08-17 | 北京字节跳动网络技术有限公司 | 使用更高比特深度精度的运动矢量推导 |
US12126821B2 (en) * | 2019-03-05 | 2024-10-22 | Zte Corporation | Cross-component quantization in video coding |
US20220038721A1 (en) * | 2019-03-05 | 2022-02-03 | Zte Corporation | Cross-component quantization in video coding |
CN113785577B (zh) * | 2019-04-26 | 2023-06-27 | 华为技术有限公司 | 用于指示色度量化参数映射函数的方法和装置 |
CN113785577A (zh) * | 2019-04-26 | 2021-12-10 | 华为技术有限公司 | 用于指示色度量化参数映射函数的方法和装置 |
US12160578B2 (en) | 2019-04-26 | 2024-12-03 | Huawei Technologies Co., Ltd. | Method and apparatus for signaling of mapping function of chroma quantization parameter |
CN113853788A (zh) * | 2019-05-31 | 2021-12-28 | 联发科技股份有限公司 | 色度残差缩放的延迟降低方法和装置 |
CN113853788B (zh) * | 2019-05-31 | 2025-01-10 | 寰发股份有限公司 | 视频编解码方法和装置 |
CN114175651A (zh) * | 2019-06-20 | 2022-03-11 | Lg电子株式会社 | 基于亮度映射和色度缩放的视频或图像编码 |
CN114026858A (zh) * | 2019-06-23 | 2022-02-08 | 夏普株式会社 | 用于在视频编码中导出视频块的量化参数的系统和方法 |
CN114026858B (zh) * | 2019-06-23 | 2024-08-09 | 夏普株式会社 | 用于在视频编码中导出视频块的量化参数的系统和方法 |
CN116508324A (zh) * | 2020-10-02 | 2023-07-28 | 杜比实验室特许公司 | 用于sdr到hdr上转换的自适应局部整形 |
CN113284248A (zh) * | 2021-06-10 | 2021-08-20 | 上海交通大学 | 一种点云有损压缩的编解码方法、装置和系统 |
Also Published As
Publication number | Publication date |
---|---|
US20180167615A1 (en) | 2018-06-14 |
EP3304912A1 (en) | 2018-04-11 |
WO2016199409A1 (en) | 2016-12-15 |
EP3304912A4 (en) | 2018-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107852512A (zh) | 基于亮度转换函数或视频色彩分量值的优化视频编码的系统及方法 | |
US11765355B2 (en) | Video coding with content adaptive spatially varying quantization | |
US11228770B2 (en) | Loop sample processing for high dynamic range and wide color gamut video coding | |
CN110999299B (zh) | 在视频译码中跨分量动态范围调整(cc-dra)的系统及方法 | |
US11917155B2 (en) | Image coding apparatus and method thereof based on a quantization parameter derivation | |
CN112042202B (zh) | 解码图片缓冲区管理及动态范围调整 | |
KR20200099535A (ko) | 결합된 픽셀/변환 기반 양자화를 이용한 비디오 코딩을 위한 양자화 파라미터 제어 | |
AU2019252418B2 (en) | Harmonization of transform-based quantization and dynamic range adjustment scale derivation in video coding | |
US20180048907A1 (en) | Video coding tools for in-loop sample processing | |
HK40020459A (zh) | 利用內容自適應空間變化量化的視頻譯碼 | |
HK40017308A (zh) | 在视频译码中跨分量动态范围调整(cc-dra)的系统及方法 | |
HK40000964A (zh) | 用於回路内样本处理的视频译码工具 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180327 |
|
WD01 | Invention patent application deemed withdrawn after publication |