CN107211129A - 对彩色图片进行编码和解码的方法和装置 - Google Patents
对彩色图片进行编码和解码的方法和装置 Download PDFInfo
- Publication number
- CN107211129A CN107211129A CN201680007783.3A CN201680007783A CN107211129A CN 107211129 A CN107211129 A CN 107211129A CN 201680007783 A CN201680007783 A CN 201680007783A CN 107211129 A CN107211129 A CN 107211129A
- Authority
- CN
- China
- Prior art keywords
- component
- color
- luminance
- obtaining
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000012886 linear function Methods 0.000 claims abstract description 25
- 230000006870 function Effects 0.000 claims description 37
- 230000015654 memory Effects 0.000 claims description 32
- 241000023320 Luma <angiosperm> Species 0.000 claims description 8
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 16
- 239000011159 matrix material Substances 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 239000003086 colorant Substances 0.000 description 8
- 238000012937 correction Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000003491 array Methods 0.000 description 3
- 238000007667 floating Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000012888 cubic function Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000005693 optoelectronics Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 229920001690 polydopamine Polymers 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/36—Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Color Television Systems (AREA)
Abstract
本公开一般涉及对具有色彩分量(Ec)的彩色图片进行编码的方法和设备,其特征在于,其包括:获得(130)亮度分量(L),包括从彩色图片的亮度(Y)获得(120)调制值(Ba),通过将彩色图片的亮度(Y)除以调制值(Ba)来获得经缩放的亮度,通过对经缩放的亮度应用非线性函数来获得亮度分量(L),使得亮度分量(L)的动态相比于经缩放的亮度的动态是减少的;获得两个色度分量(C1,C2),包括获得取决于亮度分量的像素(i)的值(L(i))和彩色图片中的同位像素(i)的亮度值(Y(i))的因子(r(L(i))),通过将每个色彩分量(Ec)乘以因子(r(L(i)))来获得(150)至少一个中间色彩分量(E’c),以及从至少一个中间色彩分量(E’c)获得(170)两个色度分量(C1,C2);以及对亮度(L)和两个色度分量(C1,C2)进行编码(180)。
Description
技术领域
本公开一般涉及图片/视频编码和解码。具体地,但非排他性地,本公开的技术领域涉及像素值属于高动态范围的图片的编码/解码。
背景技术
本部分旨在向读者介绍可能与在下面描述和/或要求保护的本公开的各个方面有关的本领域的各个方面。相信该讨论有助于向读者提供背景信息,以便更好地理解本公开的各个方面。相应地,应当理解的是,这些陈述应从这一方面阅读,而不作为对现有技术的承认。
在下文中,彩色图片包含以特定图片/视频格式的采样(像素值)的若干阵列,该特定图片/视频格式指定与图片(或视频)的像素值有关的所有信息以及可以由显示器和/或任何其他设备使用以便例如对图片(或视频)进行可视化和/或解码的所有信息。彩色图片包括:至少一个分量,以样本的第一阵列的形状,通常是照度(或亮度)分量;以及至少一个另外的分量,以样本的至少一个其他阵列的形状。或者,等效地,相同信息也可以通过色彩样本的阵列的集合(色彩分量)表示,诸如传统的三原色RGB表示。
像素值由C个值的矢量表示,其中,c是分量的数量。矢量的每个值通过定义像素值的最大动态范围的比特的数量来表示。
标准动态范围图片(SDR图片)是亮度值用通常以2或光圈数(f-stop)的幂所测量的有限动态(dynamic)来表示的彩色图片。SDR图片具有10个光圈数左右(即,线性域中的最亮像素与最暗像素之间的比率为1000)的动态,并且用有限数量的比特进行编码以减少动态,有限数量的比特在非线性域中在HDTV(高清晰度电视系统)和UHDTV(超高清晰度电视系统)中往往是8个或10个,例如通过使用ITU-R BT.709 OEFT(光电传递函数)(Rec.ITU-RBT.709-5,2002年4月)或ITU-R BT.2020 OETF(Rec.ITU-R BT.709-5,2014年6月)。该有限非线性表示不允许正确呈现小信号变化,具体地,在暗的亮度范围和亮的亮度范围中的小信号变化。在高动态范围图片(HDR图片)中,信号动态是高得多(多达20个光圈数,最亮像素与最暗像素之间的比率为100万),并且需要新的非线性表示,以在其整个范围上保持信号的高精度。在HDR图片中,通常以浮点格式(针对每个分量,32比特或者16比特,即浮点或半浮点)表示原始数据,最流行的格式是openEXR半浮点格式(针对每个RGB分量16比特,即针对每个像素48比特),或者用具有长表示(通常至少16比特)的整数。
色域(color gamut)是色彩的某个完全集。最通常的用法是指能够在给定的环境中(诸如在给定的色彩空间内或者由某个的输出设备)精确地表示的色彩集合。
色量(color volume)由色彩空间以及该色彩空间中所表示的值的动态范围来定义。
例如,色域由用于UHDTV的RGB ITU-R Recommendation BT.2020色彩空间来定义。更老的标准ITU-R Recommendation BT.709定义用于HDTV的较小色域。在SDR中,虽然一些显示技术可以显示更亮的像素,但是对于色量(在其中对数据进行编码),动态范围在官方上被定义上至100尼特(坎德拉每平方米)。
高动态范围图片(HDR图片)是亮度值用高于SDR图片的动态的HDR动态来表示的彩色图片。
HDR动态尚未被标准定义,但是可能期待多达数千尼特的动态范围。例如,HDR色量由RGB BT.2020色彩空间来定义,并且该RGB色彩空间中所表示的值属于从0到4000尼特的动态范围。HDR色量的另一示例由RGBBT.2020色彩空间来定义,并且该RGB色彩空间中所表示的值属于从0到1000尼特的动态范围。
对图片(或视频)进行色彩分级是改动/增强图片(或视频)的色彩的处理。通常,对图片进行色彩分级包括色量(色彩空间和/或动态范围)的改变或者与该图片有关的色域的改变。因此,同一图片的两个不同的色彩分级版本是值在不同的色量(或色域)中表示的该图片的版本,或者是它们的色彩中的至少一个已经根据不同色彩等级而改动/增强的图片的版本。这可能涉及用户交互。
例如,在电影摄影制作中,使用三原色相机,将图片和视频捕获为包括3个分量(红色、绿色和蓝色)的RGB色彩值。RGB色彩值取决于传感器的三原色特性(色彩原色)。然后,获得所捕获的图片的第一色彩分级版本,以便(使用特定的影院式等级)得到影院式渲染。典型地,所捕获的图片的第一色彩分级版本的值根据标准化的YUV格式(诸如定义UHDTV的参数值的BT.2020)来表示。
然后,配色师(通常与摄影导演一起)通过对一些色彩值进行精调/微调,对所捕获的图片的第一色彩分级版本的色彩值进行控制,以加入艺术意图。
待解决的问题是压缩的HDR图片(或视频)的分发,而同时分发表示该HDR图片(或视频)的色彩分级版本的关联SDR图片(或视频)。
通常的解决方案是在分发基础架构上同时联播(simulcast)SDR和HDR图片(或视频)二者,但缺点是,相比于诸如HEVC main 10 profile(“High Efficiency VideoCoding”,SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS,Recommendation ITU-TH.265,Telecommunication Standardization Sector of ITU,2013年4月)这样的适合于广播SDR图片(或视频)的遗留基础架构分发,实际上使所需的带宽加倍。
使用遗留分发基础架构要求加速出现HDR图片(或视频)的分发。另外,在确保图片(或视频)的SDR版本和HDR版本二者的良好质量的同时,应当使比特率最小化。
而且,可以确保向后兼容性,即,SDR图片(或视频)对于配备有遗留解码器和显示器的用户应当是可观看的,即,具体地,总体所感知的亮度(即暗场景和亮场景)以及所感知的色彩(例如色调的保留等)应当保留。
另一种直接的解决方案是,通过适当的非线性函数减少HDR图片(或视频)的动态范围,典型地减少为有限数量的比特(例如10比特),并且直接按照HEVC main10 profile来压缩。这样的非线性函数(曲线)已经存在,例如,由Dolby在SMPTE所提出的所谓的PQ EOTF(SMPTE standard:High Dynamic Range Electro-Optical Transfer Function ofMastering Reference Displays,SMPTE ST 2084:2014)。
该解决方案的缺点是缺少向后兼容性,即,所获得的图片(视频)的缩减版本没有足以被认为可作为SDR图片(或视频)来观看的可视质量,并且压缩性能不太好。
本公开考虑到前述内容而设计。
发明内容
以下给出本公开的简要概述,以便提供对本公开的一些方面的基本理解。该概述不是本公开的囊括性概览。其并非旨在标识本公开的关键或决定性要素。以下概述仅以简化的方式呈现本公开的一些方面,作为对下文所提供的更详细的描述的前序。
本公开着手于通过一种对具有色彩分量的彩色图片进行编码的方法来弥补现有技术的至少一个缺点,该方法的特征在于,其包括:
-通过对彩色图片的亮度应用非线性函数,获得亮度分量,使得所述亮度分量的动态相比于彩色图片的亮度的动态是减少的,所述非线性函数取决于从所述彩色图片的亮度所获得的调制值;
-获得两个色度分量,通过
通过用取决于亮度分量的因子对每个色彩分量进行缩入,获得至少一个中间色彩分量,以及
从所述至少一个中间色彩分量获得所述两个色度分量;以及
-对所述亮度和两个色度分量进行编码。
该方法允许通过将经解码的亮度和色度分量组合在一起,从待编码的彩色图片得到SDR彩色图片。该SDR彩色图片可以由遗留SDR显示器显示。换句话说,这样的SDR彩色图片可由终端用户从其遗留SDR显示器观看。该方法因此允许与任何SDR遗留显示器的向后兼容性。
根据实施例,从所述至少一个中间色彩分量获得所述两个色度分量包括:
-通过取得每个中间色彩分量的平方根,获得三个中间分量;以及
-将所述三个中间分量线性地组合在一起。
平方根函数用于对在编码侧所需的OEFT(光电传递函数)进行近似。因为应当应用在解码器侧以对完整的动态输入图片进行解码的EOTF(电光传递函数)于是成为平方函数,所以这样的近似带来无歧义的可逆公式,并且部分地带来低复杂度解码器。
此外,因为平方根是在HD/UHD TV中所使用的ITU-R Recommendation BT.709/BT.2020所定义的标准SDR OETF的良好近似(主要是幂0.45),所以SDR图片显示有几分一致的色彩。
根据本公开的另一方面,本公开涉及一种从比特流对彩色图片进行解码的方法。该方法包括:
-通过对从比特流所获得的亮度分量应用非线性函数,获得第一分量,使得所述第一分量的动态相比于所述亮度分量的动态是增加的;
-从所述第一分量、从比特流所获得的两个色度分量、以及取决于亮度分量的因子,获得至少一个色彩分量;以及
-通过将所述至少一个色彩分量组合在一起,形成所解码的图片。
根据本公开的其他方面,本公开涉及包括被配置为实现上述方法的处理器的设备、包括程序代码指令(该程序代码指令当在计算机上执行该程序时执行上述方法的步骤)的计算机程序产品、在其中存储有使处理器至少执行上述方法的步骤的指令的处理器可读介质、以及携带程序代码的指令(程序代码的指令用于当在计算设备上执行该程序时执行上述方法的步骤)的非临时性存储介质。
根据下面结合附图进行的关于实施例的描述,本公开的特定性质以及本公开的其他目的、优点、特征和使用将变得明显。
附图说明
在附图中例示本公开的实施例。附图中,
图1示意性示出根据本公开的实施例的对彩色图片进行编码的方法的步骤的图;
图2示意性示出根据本公开的实施例的步骤170的子步骤的图;
图3示意性示出根据本公开的实施例的步骤170的子步骤的图;
图4示意性示出根据本公开的实施例的从至少一个比特流对彩色图片进行解码的方法的步骤的图;
图4a示意性示出根据本公开的实施例的步骤230的子步骤的图;
图4b示意性示出根据本公开的实施例的步骤230的子步骤的图;
图5示意性示出根据本公开的实施例的步骤231的子步骤的图;
图6示出根据本公开的实施例的设备的架构的示例;以及
图7示出根据本公开的实施例的通过通信网络进行通信的两个远程设备。
相似或相同元件用相同标号指代。
具体实施方式
下文中将参照示出本公开的实施例的附图更完整地描述本公开。然而,本公开可以以很多替代的形式来实施,而不应当被理解为局限于在本文中所阐述的实施例。相应地,虽然本公开可以具有各种修改和替代的形式,但是其特定实施例在附图中作为示例示出,并且将在本文中详细地描述。然而,应当理解,不打延期将本公开限制于所公开的具体形式,而是相反地,本公开将覆盖落入由权利要求所限定的本公开的精神和范围内的所有修改、等同物和替代。
在本文中所使用的术语仅用于描述具体的实施例,而不用于限制本公开。如在本文中所使用的那样,单数形式的“一”、“一个”以及“该”意图同样包括复数形式,除非上下文另外清楚地指明。还应当理解,术语“包括”、“包括有”、“包含”和/或“包含有”在本发明中使用时,用于指定存在所陈述的特征、整数、步骤、操作、元件和/或组件,但是不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件或它们的群组。此外,当元件被称为“响应于”或“连接到”另外的元件时,其可以直接响应于或连接到该另外的元件,或者可以存在中间元件。相反,当元件被称为“直接响应于”或“直接连接到”另外的元件时,不存在中间元件。如在本文中所使用的那样,术语“和/或”包括相关联的所列项目中的一个或多个的任何以及所有组合,并且可以简写为“/”。
应当理解,虽然术语“第一”、“第二”等在本文中可以用于描述不同的元件,但是这些元件不应当受限于这些术语。这些术语仅用于将一个元件与另外的元件区分开。例如,第一元件可以被称为第二元件,相似地,第二元件可以被称为第一元件,而不脱离本公开的教导。
虽然一些图包括通信路径上的箭头,以示出通信的主方向,但是应当理解,通信可以在与所图示的箭头相反的方向上进行。
一些实施例参照框图以及操作流程图来描述,其中,每个块表示电路元件、模块、或者包括用于实现所指定的逻辑功能的一个或多个可执行指令的代码的部分。还应当注意,在其他实现方式中,块中所标记的功能可以不按所标记的次序进行。例如,取决于所涉及的功能,相继示出的两个块实际上可以基本上同时地执行,或者各块有时可以以相反的次序执行。
在本文中所提及的“一个实施例”或“实施例”意味着结合实施例所描述的具体特征、结构或特性可以包括在本公开的至少一个实现方式中。在说明书中的各个地方出现的短语“在一个实施例中”或“根据实施例”未必均指同一个实施例,单独的或替代的实施例也未必与其他实施例相互排斥。
权利要求中出现的标号仅用于说明,而不应当具有对权利要求的范围有限制作用。
虽然未明确描述,但是所呈现的实施例和变型可以以任何组合或部分组合的方式使用。
在实施例中,因子取决于调制值Ba。调制(或背光)值通常与HDR图片相关联,并且表示HDR图片的亮度。这里,与由彩色面板(例如LCD面板)制成的电视机和背后照射装置(例如LED阵列)类比,使用术语(调制)背光。背后装置(通常生成白光)用于照射彩色面板,以向TV提供更多的亮度。因此,TV的亮度是背后照射器的亮度和彩色面板的亮度的乘积。该背后照射器一般称为“调制”或“背光”,并且其强度在某种程度上表示总体场景的亮度。
本公开关于对彩色图片进行解码/解码进行描述,但是扩展到图片序列(视频)的编码/解码,因为序列的每个彩色图片如下所述那样地依次被编码/解码。
在下文中,将彩色图片I视为具有三个色彩分量Ec(c=1、2或3),其中,表示彩色图片I的像素值。
本公开不限于表示三个分量Ec的色彩空间,而是扩展到诸如RGB、CIELUV、XYZ、CIELab等任何色彩空间。
图1示意性示出根据本公开的实施例的对彩色图片I进行编码的方法的步骤的图。
基本上,方法从待编码的彩色图片I的三个色彩分量Ec,确定(和编码)亮度分量L和两个色度分量C1和C2。亮度和色度分量形成SDR彩色图片,SDR彩色图片的像素值表示在色彩空间(L、C1、C2)中。所述SDR彩色图片可由遗留SDR显示器观看,即,具有足够的可视质量以便由遗留SDR显示器观看。
在步骤110中,模块IC通过将三个分量Ec线性地组合在一起,获得表示彩色图片I的亮度的分量Y:
其中,A1是定义从(E1、E2、E3)色彩空间到色彩空间(Y、C1、C2)的色彩空间变换的3x3矩阵A的第一行。
在步骤130中,模块FM通过对分量Y应用非线性函数f,获得亮度分量L:
L=f(Ba,Y) (1)
其中,Ba是由模块BaM从分量Y所获得的调制值(步骤120)。
对分量Y应用非线性函数f减少其动态范围。换句话说,亮度分量L的动态相比于分量Y的动态是减少的。
基本上,分量Y的动态范围减少,以便使用10个比特来表示分量L的亮度值。
根据实施例,在应用非线性函数f之前,分量Y被除以调制值Ba:
L=f(Y/Ba) (2)
根据实施例,非线性函数f是伽玛函数:
其中,Y1根据等式(1)或(2)的实施例等于Y或Y/Ba,B是常数值,γ是参数(严格小于1的实数值)。
根据实施例,非线性函数f是S-Log函数:
L=a.ln(Y1+b)+c
其中,a、b和c是所确定的SLog曲线的参数(实数值),使得f(0)和f(1)是不变的,并且SLog曲线的导数在通过小于1的伽玛曲线延长时在1中是连续的。因此,a、b和c是参数γ的函数。在表格1中示出典型值。
γ | a | b | c |
1/2.0 | 0.6275 | 0.2550 | 0.8575 |
1/2.4 | 0.4742 | 0.1382 | 0.9386 |
1/2.8 | 0.3861 | 0.0811 | 0.9699 |
表格1
在有利的实施例中,就HDR压缩性能以及所获得的SDR照度的良好可观看性而言,接近1/2.5的γ的值是有效的。因此,这三个参数可以有利地采取以下值:a=0.44955114,b=0.12123691,c=0.94855684。
根据实施例,根据分量Y的像素值,非线性函数f是伽玛校正或者SLog校正。
对分量Y应用伽玛校正上拉(pull up)暗区域,但是不降低足够高的光以避免亮像素的燃烧。
然后,根据实施例,根据分量Y的像素值,模块FM应用伽玛校正或者SLog校正。信息数据Inf可以指示是应用伽玛校正还是Slog校正。
例如,当分量Y的像素值在阈值(等于1)以下时,则应用伽玛校正,否则应用SLog校正。
根据步骤120的实施例,调制值Ba是分量Y的像素值的平均值、中值、最小值或最大值。可以在线性HDR亮度域Ylin中,或者在非线性域(例如,ln(Y)或Yγ,其中,γ<1)中,执行这些操作。
根据实施例,当方法被用于对属于图片序列的若干彩色图片进行编码时,针对每个彩色图片、图片组(GOP)或者针对彩色图片的一部分(诸如但不限于在HEVC中所定义的切片或传递单元),确定调制值Ba。
根据实施例,非线性函数f的值Ba和/或参数(诸如a、b、c或γ)和/或信息数据Inf存储在本地或远程存储器中和/或添加到比特流BF中,如图1所示。
在步骤140中,从彩色图片I获得至少一个色彩分量Ec(c=1、2、3)。可以直接从本地或远程存储器,或者通过对彩色图片I应用色彩变换,获得色彩分量Ec。
在步骤150中,通过按照取决于亮度分量L的因子r(L)对每个色彩分量Ec进行缩放,获得中间色彩分量E’c(c=1、2或3):
其中,r(L(i))是由模块RM所确定(步骤160)的因子(实数值),该因子取决于分量L的像素i的值,E′c(i)是中间色彩分量E’c的像素i的值,Ec(i)是色彩分量Ec的像素i的值。
按照因子进行缩放表示乘以所述因子或除以所述因子的逆。
按照取决于亮度分量L的因子r(L)对每个色彩分量Ec进行缩放保留彩色图片I的色彩的色调。
根据步骤160的实施例,因子r(L)是亮度分量L相对于分量Y的比率:
其中,Y(i)是分量Y的像素i的值。实际上,分量Y的像素的Y(i)无歧义地取决于亮度分量L的像素的值L(i),使得该比率可以仅被写为L(i)的函数。
因为按照还取决于分量Y的因子r(L)对每个色彩分量Ec进行缩放保留彩色图片I的的色调,并且从而改善所解码的彩色图片的可视质量,所以该实施例是有利的。
更准确地说,在比色法和色彩理论中,色彩度、色度和饱和度指代特定色彩的感知强度。色彩度是彩色与灰色之间的差异的程度。色度是在相似观看条件下相对于显现白色的另一色彩的亮度。饱和度是色彩相对于其自身亮度的色彩度。
高度丰富多彩的刺激是生动且强烈的,而不太丰富多彩的刺激显得更加柔和,更接近于灰色。在根本没有色彩度的情况下,色彩是“中性”灰色(在任何其色彩中均没有色彩度的图片被称为灰阶)。任何色彩都能够根据其色彩度(或色度或饱和度)、光亮度(或亮度)和色调来描述。
色彩的色调和饱和度的定义取决于用于表示所述色彩的色彩空间。
例如,当使用CIELUV色彩空间时,饱和度suv被定义为色度相对于亮度L*的比率。
然后,色调通过下式给出:
根据另一示例,当使用CIELAB色彩空间时,饱和度被定义为色度相对于亮度的比率:
然后,色调由下式给出:
这些等式是与人类对饱和度的感知相一致的饱和度和色调的合理预测器,并且证明在保持角度a*/b*(或u*/v*)固定的同时调整CIELAB(或CIELUV)色彩空间中的亮度确实会影响同一色彩的色调,并且因此影响同一色彩的感知。在步骤150中,按照同一因子对色彩分量Ec进行缩放,保留该角度,因此保留色调。
现在,考虑彩色图片I在CIELUV色彩空间中表示、以及通过将动态范围相比于彩色图片I的亮度的动态范围减少(步骤130)的亮度分量L以及CIELUV色彩空间的两个色度分量U(=C1)和V(=C2)组合在一起所形成的图片I2。因为色彩的饱和度和色调改变,所以图片I2的色彩被人类不同地感知。方法(步骤150)确定图片I2的色度分量C1和C2,使得图片I2的色彩的色调最佳地匹配彩色图片I的色彩的色调。
根据步骤160的实施例,因子r(L)由下式给出:
该最后的实施例是有利的,因为其防止因子针对非常暗的像素成为零,即,允许比率是可逆的,而无论像素值如何。
在步骤170中,从所述至少一个中间色彩分量E’c获得两个色度分量C1、C2。
根据步骤170的实施例,如图2所示,通过对每个中间色彩分量(E’c)应用(步骤171)OETF,获得至少一个中间分量Dc(c=1、2或3):
例如,OETF由ITU-R recommendation BT.709或BT.2020定义,并且规定如下:
该实施例允许根据特定OETF减少动态范围,但是如稍后详述的那样,带来复杂的解码处理,。
根据该实施例的变型,如图3所示,OETF通过平方根来近似,即,通过取得每个中间色彩分量(E’c)的平方根(步骤171),获得至少一个中间分量Dc(c=1、2或3):
该实施例是有利的,因为其提供由ITU-R recommendation BT.709或BT.2020所定义的OETF的良好近似,并且带来低复杂度的解码器。
根据该实施例的另一变型,OETF通过立方根来近似,即,通过取得每个中间色彩分量(E’c)的立方根(步骤171),获得至少一个中间分量Dc(c=1、2或3):
该实施例是有利的,因为其提供由ITU-R recommendation BT.709或BT.2020所定义的OETF的良好近似,但是其带来比在通过平方根来近似OETF时解码器获得的稍微更复杂的解码器。
在步骤172中,模块LC1通过线性地组合三个中间分量Dc,获得两个色度分量C1和C2:
其中,A2和A3是3x3矩阵A的第二行和第三行。
在图1中的步骤180中,编码器ENC对亮度分量L以及两个色度分量C1和C2进行编码。
根据实施例,经编码的分量L和色度分量C1、C2存储在本地或远程存储器中和/或添加到比特流F中。
图4示意性示出根据本公开的实施例的从至少比特流对彩色图片进行解码的方法的步骤的图。
在步骤210中,解码器DEC通过至少部分地对比特流F进行解码,获得亮度分量L和两个色度分量C1、C2。
在步骤220中,模块IFM通过对亮度分量L应用非线性函数f1获得第一分量Y,使得第一分量Y的动态相比于亮度分量L的动态是增加的:
Y=f-1(Ba,L) (3)
非线性函数f1是非线性函数f(步骤130)的逆。
因此,根据函数f的实施例定义函数f1的实施例。
根据实施例,从本地或远程存储器(例如查找表)和/或从比特流BF获得值Ba和/或非线性函数f1的参数(诸如a、b、c或γ)和/或信息数据Inf,如图4所示。
根据实施例,在应用了非线性函数f1之后,将亮度分量L乘以调制值Ba:
Y=Ba*f-1(L) (4)
根据实施例,非线性函数f1是伽玛函数的逆。
于是,分量Y通过下式给出:
其中,根据等式(3)或(4)的实施例,Y1等于Y或Y/Ba,B是常数值,γ是参数(严格小于1的实数值)。
根据实施例,非线性函数f1是S-Log函数的逆。于是,分量Y1通过下式给出:
根据实施例,根据分量Y的像素值,非线性函数f是伽玛校正的逆或SLog校正的逆。这由信息数据Inf来指示。
在步骤230中,模块ILC从第一分量Y、两个色度分量C1、C2,并且从取决于亮度分量L的因子r(L),获得至少一个色彩分量Ec。然后,通过将所述至少一个色彩分量Ec组合在一起,获得经解码的彩色图片。
因子r(L)可以从本地或远程存储器(例如查找表)或者从比特流BF或F获得。
当对每个中间色彩分量E’c应用一般的OETF(图2中的步骤171)时,中间分量Dc与分量Y、两个色度分量C1、C2以及因子r(L)有关:
并且
其中,EOTF(电光传递函数)是步骤171中所应用的OETF的逆。
等式(5b)提供:
其中,OETF(Ec)=Dc,θi是取决于矩阵A的常数,Li是也取决于矩阵A的线性函数。于是,等式(5a)变为:
r(L)*Y=A11EOTF(D1)+A12EOTF(D2)+A13EOTF(D3) (7)
并且于是
r(L)*Y=A11EOTF(D1)+A12EOTF(θ2D1+L2(C1,C2))+A13EOTF(θ3D1+L3(C1,C2)(8)
等式(8)是仅关于D1的隐式等式。取决于EOTF的表达式,可以或多或少简单地求解等式(8)。一旦被求解,就获得D1,通过等式(6)从D1推导出D2、D3。然后,通过对三个所获得的中间分量Dc应用EOTF,获得中间色彩分量E’c,即,E’c=EOTF(Dc)。
在这个一般的情况下,即,当对每个中间色彩分量E’c应用一般的OETF(没有任何特定性质)时,对于等式(8),不存在解析解。例如,当OETF是ITU-R BT.709/2020 OETF时,可以通过使用所谓的牛顿法(Newton’s method)或任何其他数值方法,在数值上求解等式(8),以找到正则函数的根。然而,这样带来高度复杂的解码器。
在这个一般的情况下,根据图4a所示的步骤230的第一实施例,在步骤231中,模块ILEC从第一分量Y、两个色度分量C1、C2以及因子r(L)获得三个中间色彩分量E’c,如上所述。在步骤232中,通过按照因子r(L)对每个中间色彩分量E’c进行缩放,获得三个色彩分量Ec:
Ec(i)=E′c(i)/r(L(i))
其中,r(L(i))是由步骤160所给出的因子,其取决于分量L(步骤210的输出)的像素i的值,E′c(i)是中间色彩分量E’c的像素i的值,并且Ec(i)是色彩分量Ec的像素i的值。
实际上,该次序(步骤231在步骤232之前)是编码方法的次序(步骤170跟在步骤150之后)的逆。
根据该第一实施例的变型,OEFT是平方根函数,则EOTF是平方函数。
根据该第一实施例的另一变型,OEFT是立方根函数,则EOTF是立方函数。
当在步骤171中所使用的OETF满足交换条件时,即:
OETF(x*y)=OETF(x)*OETF(y),
则分量Y和色彩分量Ec通过下式相联系:
其中,Fc是等于OETF(Ec)的分量,并且
使得交换条件提供
等式(10)提供
其中,θi是取决于矩阵A的常数,Li是也取决于矩阵A的线性函数。
于是,等式(9)变为:
Y=A11EOTF(F1)+A12EOTF(F2)+A13EOTF(F3) (11)
并且于是:
Y=A11EOTF(F1)+A12EOTF(θ2F1+L2(C′1,C′2))+A13EOTF(θ3F1+L3(C′1,C′2) (12)
当OETF满足交换条件时,根据图4b所示的步骤230的第二实施例,在步骤232中,通过按照因子OEFT(r(L(i)))对两个色度分量C1和C2进行缩放,获得两个中间分量C’1和C’2,其中,OETF是在图2中的步骤171中所使用的函数:
其中,r(L(i))是由步骤160所给出的因子,其取决于分量L(步骤210的输出)的像素i的值,C′1(i)、C′2(i)分别是分量C’1和C’2的像素i的值,C1(i)、C2(i)分别是分量C1和C2的像素i的值。
在步骤231中,模块ILEC从第一分量Y和两个中间色度分量C’1、C’2获得三个色彩分量Ec,如上所述。
根据该第二实施例的变型,OEFT是平方根函数,于是,EOTF是平方函数。于是,在图4b中的步骤232中,通过按照因子对两个色度分量C1和C2进行缩放,获得两个中间分量C’1和C’2
等式(9)变为:
并且
使得交换提供
等式(11)变为:
并且
等式(14)是可以解析地求解的二阶等式。该解析解带来图5所示的步骤231的特定实施例。该实施例是有利的,因为其允许EOTF(OETF的逆)的解析表达式,并且因此允许图片的经解码的分量的解析表达式。而且,EOTF于是成为平方函数,其在解码侧是低复杂度的处理。
在步骤2310中,模块SM通过将两个中间色度分量C’1、C’2和第一分量Y组合在一起,获得第二分量S:
其中,k0、k1和k2参数值以及意味着分量C′c(c=1或2)的平方。
在步骤2311中,模块LC2通过将中间色度分量C’1、C’2和第二分量S线性地组合在一起,获得三个求解器分量Fc:
其中,C是被定义为矩阵A的逆的3x3矩阵。
在步骤2312中,通过取得每个中间色彩分量(Dc)的平方,获得三个色彩分量Ec:
矩阵A确定待编码的图片I从表示待编码的图片的像素值的色彩空间(E1、E2、E3)到色彩空间(Y、C1、C2)的变换。
这样的矩阵取决于待编码的彩色图片的域。
例如,当在由ITU-R Rec.709所定义的BT709域中表示待编码的图片时,矩阵A通过下式给出:
并且矩阵C通过下式给出:
根据该第二实施例的变型,OEFT是立方根函数,于是,EOTF是立方函数。然后,在图4b中的步骤232中,于是可以通过按照因子对两个色度分量C1和C2进行缩放,获得两个中间分量C’1和C’2:
于是,EOTF是立方函数,从而导致关于F1的等式(14)是更复杂的三阶等式,其可以通过所谓的卡达诺(Cardano)方法来解析地求解。
对于四阶等式也存在非常复杂的解析解(费拉里(Ferrari)方法),但对于高于或等于五的任何阶,如Abel-Ruffini定理所述,不再有解析解。
解码器DEC被配置为对已经由编码器ENC编码的数据进行解码。
编码器ENC(以及解码器DEC)不限于特定的编码器(解码器),但是当需要熵编码器(解码器)时,诸如Huffmann编码器、算术编码器或上下文自适应编码器(例如H264/AVC或HEVC中所使用的Cabac)这样的熵编码器是有利的。
编码器ENC(以及解码器DEC)不限于特定的编码器,例如,其可以是有损的帧/视频遗留编码器(例如JPEG、JPEG2000、MPEG2、H264/AVC或HEVC)。
在图1至图5上,模块是功能单元,其可以与可区分的物理单元有关或无关。例如,这些模块或它们中的一些可以集合在一个组件或电路中,或者用于软件的功能。相反,一些模块可以潜在地包括分离的物理实体。使用纯硬件,例如使用诸如ASIC或FPGA或VLSI(分别为“专用集成电路”、“现场可编程门阵列”、“超大规模集成”)这样的专用硬件,或者由嵌入在设备中的若干集成电子组件,或者由硬件组件和软件组件的混合,来实现与本公开兼容的装置。
图6表示可以被配置为实现结合图1至图5所描述的方法的设备60的示例性架构。
设备60包括通过数据和地址总线61链接在一起的以下元件:
-微处理器62(或CPU),其例如是DSP(或数字信号处理器);
-ROM(或只读存储器)63;
-RAM(或随机存取存储器)64;
-I/O接口65,用于从应用发送和/或接收数据;以及
-电池66。
根据变型,电池66处于设备外部。图6的这些元件中的每一个是本领域技术人员公知的,并且将不进一步地公开。在所提及的存储器中的每一个中,在说明书中所使用的词语“存储器”可以对应于小容量(一些比特)的区域或者非常大的区域(例如,整个程序,或者大量所接收到的或所解码的数据)。ROM 63至少包括程序和参数。根据本公开的方法的算法存储在ROM 63中。当通电时,CPU 62将程序上载到RAM中,并且执行对应的指令。
RAM 64包括寄存器中的由CPU 62所执行并且在设备60通电之后上载的程序、寄存器中的输入数据、寄存器中的方法的不同状态下的中间数据、以及寄存器中的用于执行方法的其他变量。
在本文中所描述的实现方式例如可以实现为方法或处理、装置、软件程序、数据流或信号。虽然仅在单一形式的实现方式的情况下进行了讨论(例如,仅作为方法或设备进行了讨论),但是所讨论的特征的实现方式也可以实现为其他形式(例如程序)。例如,装置可以实现为适当的硬件、软件和固件。例如,方法可以实现在诸如例如处理器(一般被称为处理设置,包括例如计算机、微处理器、集成电路或者可编程逻辑设备)这样的装置中。处理器还包括通信设备,诸如例如计算机、蜂窝电话、便携式/个人数字助理(“PDA”)以及其他便于在终端用户之间进行信息通信的设备。
根据编码或编码器的特定实施例,从来源获得彩色图片I。例如,来源属于包括下列的集合:
-本地存储器(63或64),例如视频存储器或RAM(或随机存取存储器)、闪速存储器、ROM(或只读存储器)、硬盘;
-存储接口,例如与海量储存器、RAM、闪速存储器、ROM、光盘或磁支撑体的接口;
-通信接口(65),例如有线接口(例如总线接口、广域网接口、局域网接口)或无线接口(诸如IEEE 802.11接口或接口);以及
-图片捕获电路,例如,诸如例如CCD(或电荷耦合器件)或CMOS(或互补金属氧化物半导体)这样的传感器。
根据解码或解码器的不同实施例,所解码的图片或色彩分量Ec发送到目的地,具体地,目的地属于包括下列的集合:
-本地存储器(63或64),例如视频存储器或RAM(或随机存取存储器)、闪速存储器、ROM(或只读存储器)、硬盘;
-存储接口,例如与海量储存器、RAM、闪速存储器、ROM、光盘或磁支撑体的接口;
-通信接口(65),例如有线接口(例如总线接口、广域网接口、局域网接口)或无线接口(诸如IEEE 802.11接口或接口);以及
-显示器。
根据编码或编码器的不同实施例,比特流BF和/或F发送到目的地。作为示例,比特流F和BF之一或者比特流F和BF二者存储在本地或远程存储器中,例如视频存储器(64)或RAM(64)、硬盘(63)中。在变型中,一个或两个比特流发送到储存器接口(例如与海量储存器、闪速存储器、ROM、光盘或磁支撑体的接口)和/或通过通信接口(65)(例如到对点对点链路、通信总线、点对多点链路或广播网络的接口)来发送。
根据解码或解码器的不同实施例,从来源获得比特流BF和/或F。示例性地,从本地存储器(例如视频存储器(64)、RAM(64)、ROM(63)、闪速存储器(63)或硬盘(63))读取比特流。在变型中,比特流接收自储存器接口(例如与海量储存器、闪速存储器、ROM、光盘或磁支撑体的接口)和/或接收自通信接口(65)(例如到对点对点链路、通信总线、点对多点链路或广播网络的接口)。
根据不同实施例,被配置为实现参照图1至图3所描述的编码方法的设备60属于包括下列的集合:
-移动设备;
-通信设备;
-游戏设备;
-平板(或平板计算机);
-膝上型设备;
-静止图片相机;
-摄像机;
-编码芯片;
-静止图片服务器;以及
-视频服务器(例如广播服务器、视频点播服务器或网络服务器)。
根据不同实施例,被配置为实现参照图4、图4a、图4b和图5所描述的解码方法的设备60属于包括下列的集合:
-移动设备;
-通信设备;
-游戏设备;
-机顶盒;
-电视机;
-平板(或平板计算机);
-膝上型设备;
-显示器;以及
-解码芯片。
根据图7中所示的实施例,在通过通信网络NET、在两个远程设备A与B之间的传输背景下,设备A包括被配置为实现参照图1至图3所描述的用于对图片进行编码的方法的部件,设备B包括被配置为实现参照图4、图4a、图4b以及图5所描述的用于解码的方法的部件。
根据本公开的变型,网络是广播网络,其适合于将静止图片或视频图片从设备A广播到包括设备B的解码设备。
在本文中所描述的各种处理和特征的实现方式可以各种不同的装备或应用来实施。这样的装备的示例包括编码器、解码器、处理来自解码器的输出的后处理器、将输入提供给编码器的预处理器、视频编码器、视频解码器、视频编解码器、网络服务器、机顶盒、膝上型设备、个人计算机、蜂窝电话、PDA以及用于处理图片或视频的任何其他设备或其他通信设备。应当清楚的是,装备可以是移动的,甚至可以安装在移动车辆中。
另外,所述方法可以通过处理器正执行的指令来实现,并且这样的指令(和/或由实现方式所产生的数据值)可以存储在计算机可读存储介质上。计算机可读存储介质可以采取以一个或多个计算机可读介质实施并且在其上实施有可由计算机执行的计算机可读程序代码的计算机可读程序产品的形式。在本文中所使用的计算机可读存储介质被视为给出在其中存储信息的固有能力以及提供从中检索信息的固有能力的非临时性存储介质。计算机可读存储介质可以例如但不限于是电子、磁、光、电磁、红外或半导体系统、装置或设备、或前述的任何适当的组合。应当意识到,下面的内容虽然提供可以应用本发明原理的计算机可读存储介质的更具体的示例,但是本领域技术人员容易意识到,其仅是示例性而非囊括性的列表:便携式计算机盘、硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、便携式压缩盘只读存储器(CD-ROM)、光学存储设备、磁存储设备、或者前述项的任何适当的组合。
指令可以形成有形地实施处理器可读介质上的应用程序。
指令可以在例如硬件、固件、软件或组合中。指令可以存在于例如操作系统、单独的应用或二者的组合中。因此,处理器可以表征为例如被配置为执行处理的设备和包括具有用于执行处理的指令的处理器可读介质(诸如存储设备)的设备二者。另外,在指令的基础上,或者代替指令,处理器可读介质可以存储由实现方式所产生的数据值。
对于本领域技术人员将显而易见的是,实现方式可以产生被格式化以携带可以例如被存储或发送的信息的各种信号。信息包括例如用于执行方法的指令或所描述的实现方式之一所产生的数据。例如,信号可以被格式化,以携带用于写入或读取所描述的实施例的语法的规则作为数据,或者携带所描述的实施例所写入的实际语法值作为数据。这样的信号例如可以被格式化为电磁波(例如使用频谱的射频部分)或者基带信号。格式化可以包括例如对数据流进行编码以及调制具有经编码的数据流的载波。信号携带的信息例如可以是模拟或数字信息。如公知的那样,可以通过各种不同的有线或无线链路发送信号。信号可以存储在处理器可读介质上。
已经描述了多个实现方式。然而,应当理解,可以进行各种修改。例如,可以组合、补充、修改或移除不同实现方式的元件,以产生其他实现方式。此外,本领域技术人员应当理解的是,其他结构和处理可以代替所公开的那些结构和处理,所得到的实现方式将以与所公开的实现方式至少基本相同的方式,执行与所公开的实现方式至少基本相同的功能,以实现与所公开的实现方式至少基本相同的结果。相应地,本申请想到了这些以及其他实现方式。
Claims (24)
1.一种对具有色彩分量(Ec)的彩色图片进行编码的方法,其特征在于,其包括:
-获得(130)亮度分量(L),包括:
从彩色图片的亮度(Y)获得(120)调制值(Ba),
通过将彩色图片的亮度(Y)除以所述调制值(Ba),获得经缩放的亮度,
通过对经缩放的亮度应用非线性函数,获得亮度分量(L),使得所述亮度分量(L)的动态相比于经缩放的亮度的动态是减少的;
-获得两个色度分量(C1,C2),包括:
获得因子(r(L(i))),所述因子(r(L(i)))取决于所述亮度分量的像素(i)的值(L(i))以及彩色图片中的同位像素(i)的亮度值(Y(i)),
通过将每个色彩分量(Ec)乘以所述因子(r(L(i))),获得(150)至少一个中间色彩分量(E’c),以及
从所述至少一个中间色彩分量(E’c)获得(170)所述两个色度分量(C1,C2);以及
-对所述亮度(L)和两个色度分量(C1,C2)进行编码(180)。
2.如权利要求1所述的方法,其中,根据经缩放的亮度(Y)的像素值,所述非线性函数是伽玛曲线或者Slog曲线。
3.如权利要求2所述的方法,其中,所述方法还包括:生成信息数据(Inf),所述信息数据(Inf)指示所述非线性函数是伽玛校正还是Slog校正。
4.如权利要求1至3中的一项所述的方法,其中,所述方法还包括将下列值中的至少一个存储在本地或远程存储器中和/或添加到比特流:
调制值(Ba);
非线性函数的参数;
信息数据(Inf)。
5.如权利要求1至4中的一项所述的方法,其中,所述因子(r(L(i)))是所述亮度分量的像素(i)的值(L(i))相对于彩色图片中的同位像素(i)的亮度值(Y(i))的比率。
6.如权利要求1至4中的一项所述的方法,其中,所述因子r(L(i))由下式给出:
<mrow>
<mi>r</mi>
<mrow>
<mo>(</mo>
<mi>L</mi>
<mo>(</mo>
<mi>i</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mo>{</mo>
<mn>5</mn>
<mo>,</mo>
<mi>L</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>)</mo>
</mrow>
<mo>}</mo>
</mrow>
<mrow>
<mn>2048</mn>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mo>{</mo>
<mn>0.01</mn>
<mo>,</mo>
<mi>Y</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>)</mo>
</mrow>
<mo>}</mo>
</mrow>
</mfrac>
</mrow>
其中,L(i)是所述亮度分量的像素(i)的值,Y(i)是所述彩色图片中的同位像素(i)的亮度值。
7.如权利要求1至6中的一项所述的方法,其中,从所述至少一个中间色彩分量(E’c)获得(170)所述两个色度分量(C1,C2)包括:
通过对每个中间色彩分量(E’c)应用OETF,获得(171)三个中间分量(Dc);以及
将三个中间分量(Dc)线性地组合(172)在一起。
8.如权利要求7所述的方法,其中,所述OETF是平方根。
9.如权利要求7所述的方法,其中,所述OETF是立方根。
10.一种从比特流对彩色图片进行解码的方法,其特征在于,其包括:
-获得(220)第一分量(Y),包括:
从比特流获得(210)亮度分量(L),
通过对所述亮度分量(L)应用非线性函数,获得结果分量,使得所述结果分量的动态相比于亮度分量(L)的动态是增加的,
从待解码的彩色图片的亮度获得调制值(Ba),
通过将所述结果分量乘以所述调制值,获得所述第一分量(Y);
-从比特流获得(210)两个色度分量(C1,C2);
-获得因子(r(L(i))),所述因子(r(L(i)))取决于所述亮度分量(L)的像素(i)的值(L(i));
-从所述第一分量(Y)、所述两个色度分量(C1,C2)以及所述因子(r(L(i)))获得(230)至少一个色彩分量(Ec);以及
-通过将所述至少一个色彩分量(Ec)组合在一起,形成经解码的图片。
11.如权利要求10所述的方法,其中,获得(230)至少一个色彩分量(Ec)包括:
从所述第一分量(Y)和所述两个色度分量(C1,C2)获得(231)三个中间色彩分量(E’c);以及
通过将每个中间色彩分量(E’c)除以所述因子(r(L(i))),获得(232)所述至少色彩分量(Ec)。
12.如权利要求10所述的方法,其中,获得(230)至少一个色彩分量(Ec)包括:
通过根据所述因子(r(L(i)))来除每个色度分量(C1,C2),获得(232)两个中间色度分量(C’1,C’2);以及
从所述第一分量(Y)和所述两个中间色度分量(C’1,C’2)获得(231)所述至少一个色彩分量(Ec)。
13.如权利要求12所述的方法,其中,获得(230)至少一个色彩分量(Ec)包括:
-通过将每个色度分量(C1,C2)除以等于所述因子(r(L(i)))的平方根的值,获得(232)两个中间色度分量(C’1,C’2);以及
-获得(231)所述至少一个色彩分量(Ec),包括:
通过将两个中间色度分量(C’1,C’2)和第一分量(Y)组合在一起,获得(2310)第二分量(S),
通过将中间色度分量(C’1,C’2)和所述第二分量(S)线性地组合在一起,获得(2311)至少一个中间色彩分量(Dc),以及
通过取得每个中间色彩分量(Dc)的平方,获得(2312)三个色彩分量(Ec)。
14.如权利要求10至13中的一项所述的方法,其中,根据经缩放的亮度(Y)的像素值,所述非线性函数是伽玛曲线的逆或Slog曲线的逆。
15.如权利要求10至14中的一项所述的方法,其中,所述方法还包括:从本地或远程存储器和/或从比特流获得下列值中的至少一个:
调制值(Ba);
非线性函数的参数;
指示非线性函数是伽玛校正还是Slog校正的信息数据(Inf)。
16.如权利要求10至15中的一项所述的方法,其中,所述因子(r(L(i)))是所述亮度分量的像素(i)的值(L(i))相对于所述第一分量(Y)中的同位像素(i)的亮度值(Y(i))的比率。
17.如权利要求10至15中的一项所述的方法,其中,所述因子(r(I(i)))从本地或远程存储器或者从比特流获得。
18.一种对具有色彩分量(Ec)的彩色图片进行编码的设备,其特征在于,其包括处理器,所述处理器被配置为:
-从彩色图片的亮度(Y)获得调制值(Ba);
-通过将彩色图片的亮度(Y)除以所述调制值(Ba),获得经缩放的亮度(Y);
-通过对经缩放的亮度(Y)应用非线性函数,获得亮度分量(L),使得所述亮度分量(L)的动态相比于经缩放的亮度(Y)的动态是减少的;
-获得两个色度分量(C1,C2),包括:
获得因子(r(L(i))),所述因子(r(L(i)))取决于所述亮度分量的像素(i)的值(L(i))以及彩色图片中的同位像素(i)的亮度值(Y(i)),
通过将每个色彩分量(Ec)乘以所述因子(r(L)),获得至少一个中间色彩分量(E’c),以及
从所述至少一个中间色彩分量(E’c)获得所述两个色度分量(C1,C2);以及
-对所述亮度(L)和两个色度分量(C1,C2)进行编码。
19.一种从比特流对彩色图片进行解码的设备,其特征在于,其包括处理器,所述处理器被配置为:
-获得第一分量(Y),包括:
从比特流获得亮度分量(L),
通过对所述亮度分量(L)应用非线性函数,获得结果分量,使得所述结果分量的动态相比于亮度分量(L)的动态是增加的,
从待解码的彩色图片的亮度(Y)获得调制值(Ba),
通过将所述结果分量乘以所述调制值,获得所述第一分量(Y);
-从比特流获得两个色度分量(C1,C2);
-获得因子(r(L(i))),所述因子(r(L(i)))取决于所述亮度分量(L)的像素(i)的值(L(i));
-从所述第一分量(Y)、所述两个色度分量(C1,C2)以及所述因子获得至少一个色彩分量(Ec);
-通过将所述至少一个色彩分量(Ec)组合在一起,形成经解码的图片。
20.一种计算机程序产品,包括程序代码指令,所述程序代码指令用于当在计算机上执行该程序时执行根据权利要求1所述的编码方法的步骤。
21.一种计算机程序产品,包括程序代码指令,所述程序代码指令用于当在计算机上执行该程序时执行根据权利要求10所述的解码方法的步骤。
22.一种处理器可读介质,其中存储有指令,所述指令用于使处理器执行至少根据权利要求1所述的编码方法的步骤。
23.一种处理器可读介质,其中存储有指令,所述指令用于使处理器执行至少根据权利要求10所述的解码方法的步骤。
24.一种非临时性存储介质,其携带程序代码的指令,所述程序代码的指令用于当在计算设备上执行所述程序时执行根据权利要求1至17中的一项所述的方法的步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15305119.8A EP3051825A1 (en) | 2015-01-30 | 2015-01-30 | A method and apparatus of encoding and decoding a color picture |
EP15305119.8 | 2015-01-30 | ||
PCT/EP2016/051448 WO2016120208A1 (en) | 2015-01-30 | 2016-01-25 | A method and apparatus of encoding and decoding a color picture |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107211129A true CN107211129A (zh) | 2017-09-26 |
Family
ID=52473835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680007783.3A Pending CN107211129A (zh) | 2015-01-30 | 2016-01-25 | 对彩色图片进行编码和解码的方法和装置 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20180014024A1 (zh) |
EP (2) | EP3051825A1 (zh) |
JP (1) | JP2018507618A (zh) |
KR (1) | KR20170110088A (zh) |
CN (1) | CN107211129A (zh) |
AU (1) | AU2016212242A1 (zh) |
BR (1) | BR112017015593A2 (zh) |
CA (1) | CA2973637A1 (zh) |
MX (1) | MX2017009750A (zh) |
RU (1) | RU2705013C2 (zh) |
WO (1) | WO2016120208A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6937781B2 (ja) | 2016-05-04 | 2021-09-22 | インターデジタル ヴイシー ホールディングス, インコーポレイテッド | 高ダイナミックレンジ画像を符号化ビットストリームへ符号化/復号する方法と装置 |
US11803948B2 (en) | 2019-04-23 | 2023-10-31 | Dolby Laboratories Licensing Corporation | Display management for high dynamic range images |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1827024A1 (en) * | 2006-02-24 | 2007-08-29 | Sharp Kabushiki Kaisha | High dynamic range video coding |
CN102893305A (zh) * | 2010-03-02 | 2013-01-23 | 株式会社理光 | 图像处理设备和图像获取设备 |
CN103843058A (zh) * | 2011-09-27 | 2014-06-04 | 皇家飞利浦有限公司 | 用于图像的动态范围变换的装置和方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104486605B (zh) * | 2009-03-10 | 2017-04-12 | 杜比实验室特许公司 | 扩展动态范围和扩展维数图像信号转换 |
BRPI1009443B1 (pt) * | 2009-03-13 | 2021-08-24 | Dolby Laboratories Licensing Corporation | Método de geração de parâmetros de mapeamento de tons inverso, método de compactação de dados de vídeo e método para geração de um fluxo de bits de saída a partir de um fluxo de bits de entrada |
US8483479B2 (en) * | 2009-05-11 | 2013-07-09 | Dolby Laboratories Licensing Corporation | Light detection, color appearance models, and modifying dynamic range for image display |
-
2015
- 2015-01-30 EP EP15305119.8A patent/EP3051825A1/en not_active Withdrawn
-
2016
- 2016-01-25 WO PCT/EP2016/051448 patent/WO2016120208A1/en active Application Filing
- 2016-01-25 CN CN201680007783.3A patent/CN107211129A/zh active Pending
- 2016-01-25 RU RU2017127151A patent/RU2705013C2/ru not_active IP Right Cessation
- 2016-01-25 JP JP2017539641A patent/JP2018507618A/ja not_active Ceased
- 2016-01-25 KR KR1020177020987A patent/KR20170110088A/ko not_active Withdrawn
- 2016-01-25 BR BR112017015593A patent/BR112017015593A2/pt not_active Application Discontinuation
- 2016-01-25 US US15/546,121 patent/US20180014024A1/en not_active Abandoned
- 2016-01-25 MX MX2017009750A patent/MX2017009750A/es unknown
- 2016-01-25 AU AU2016212242A patent/AU2016212242A1/en not_active Abandoned
- 2016-01-25 CA CA2973637A patent/CA2973637A1/en not_active Abandoned
- 2016-01-25 EP EP16701607.0A patent/EP3251369A1/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1827024A1 (en) * | 2006-02-24 | 2007-08-29 | Sharp Kabushiki Kaisha | High dynamic range video coding |
CN102893305A (zh) * | 2010-03-02 | 2013-01-23 | 株式会社理光 | 图像处理设备和图像获取设备 |
CN103843058A (zh) * | 2011-09-27 | 2014-06-04 | 皇家飞利浦有限公司 | 用于图像的动态范围变换的装置和方法 |
Non-Patent Citations (2)
Title |
---|
JI WON LEE等: "Local Tone Mapping using K-means Algorithm and Automatic Gamma Setting", 《2011 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS (ICCE)》 * |
TE-HSUN WANG等: "Photography Enhancement Based on the Fusion of Tone and Color Mappings in Adaptive Local Region", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》 * |
Also Published As
Publication number | Publication date |
---|---|
RU2017127151A (ru) | 2019-02-28 |
EP3051825A1 (en) | 2016-08-03 |
RU2705013C2 (ru) | 2019-11-01 |
WO2016120208A1 (en) | 2016-08-04 |
BR112017015593A2 (pt) | 2018-03-13 |
JP2018507618A (ja) | 2018-03-15 |
MX2017009750A (es) | 2017-10-27 |
AU2016212242A1 (en) | 2017-08-03 |
CA2973637A1 (en) | 2016-08-04 |
KR20170110088A (ko) | 2017-10-10 |
US20180014024A1 (en) | 2018-01-11 |
RU2017127151A3 (zh) | 2019-06-25 |
EP3251369A1 (en) | 2017-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7356478B2 (ja) | カラー・ピクチャを符号化および復号する方法および装置 | |
RU2710291C2 (ru) | Способы и устройства для кодирования и декодирования цветного изображения hdr | |
CN114189691B (zh) | 用于对hdr图像和使用色彩映射函数的sdr图像两者进行编码的方法和设备 | |
CN107409210B (zh) | 匹配不同动态范围的彩色图片之间的色彩的方法和设备 | |
KR102523233B1 (ko) | 컬러 픽처를 디코딩하는 방법 및 디바이스 | |
CN108352076B (zh) | 编码和解码方法及对应设备 | |
EP3051489A1 (en) | A method and apparatus of encoding and decoding a color picture | |
RU2705013C2 (ru) | Способ и устройство кодирования и декодирования цветного изображения | |
HK40081874A (zh) | 对彩色图片进行编码和解码的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20190918 Address after: Delaware, USA Applicant after: Interactive Digital VC Holding Company Address before: Icelemulino, France Applicant before: Thomson Licensing Company |
|
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170926 |