CN101663896A - 用于对视频数据进行编码的方法和设备、用于对编码的视频数据和编码的视频信号进行解码的方法和设备 - Google Patents
用于对视频数据进行编码的方法和设备、用于对编码的视频数据和编码的视频信号进行解码的方法和设备 Download PDFInfo
- Publication number
- CN101663896A CN101663896A CN 200880013169 CN200880013169A CN101663896A CN 101663896 A CN101663896 A CN 101663896A CN 200880013169 CN200880013169 CN 200880013169 CN 200880013169 A CN200880013169 A CN 200880013169A CN 101663896 A CN101663896 A CN 101663896A
- Authority
- CN
- China
- Prior art keywords
- data
- enhancement layer
- color
- color channel
- base layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
对于具有不同空间、时间或SNR分辨率的两个或多个视频版本,可以通过产生基本层(BL)和增强层(EL)来实现可缩放性。当可以显示的位深高的颜色位深的视频版本可用时,一般的解决方案是色调映射。针对具有不同颜色深度的两个或多个版本使用不同颜色编码的情况,提出了一种更高效的压缩方法。本发明基于可用颜色通道之间的联合层间预测。因此,在具有不同颜色位深的两个或多个版本使用不同的颜色编码的情况下,还可以使用颜色位深可缩放性。在这种情况下,层间预测是基于所有颜色分量的联合预测。预测还可以包括颜色空间转换和伽马校正。
Description
技术领域
本发明涉及数字视频编码。更具体地,本发明涉及一种用于对视频数据进行编码的方法和设备,一种用于对编码的视频数据和相应编码的视频信号进行解码的方法和设备。
背景技术
近年来,在许多应用领域(如,医学图像处理、制作和后期制作中的数字电影工作流、以及与家庭影院相关的应用)中越来越期望具有高于8位位深的数字图像/视频。现有技术图像/视频编码技术同样正在推进高位深编码。JVT以H.264保真度范围扩展(FRExt)对高位深编码进行标准化,FRExt支持高达14比特的位深、以及高达4:4:4的色度采样。另一方面,运动图像JPEG2000(第3部分)支持每分量高达32比特。
潜在地,考虑到在未来较长时间内,传统8比特和高比特数字成像系统将在市场上同时存在这一事实,颜色位深可缩放性是十分有用的。有若干种方式来处理8比特视频和高比特视频的共存。第一种解决方案是,仅给出高比特编码的比特流,并使得色调映射方法能够给出针对标准8比特显示设备的8比特表示。第二种解决方案是,给出包含8比特编码的比特流的同播(simulcast)比特流。选择哪些比特流进行解码是解码器的偏好。这意味着,例如,支持AVC高10简档的较强的解码器可以解码并输出10比特视频,而常规解码器仅可以输出8比特视频。典型地,第一种解决方案不能兼容H.264/AVC 8比特解码器。第二种解决方案兼容所有当前标准,但是需要更多开销。然而,比特降低和后向标准兼容性之间的良好折衷可以是可缩放的解决方案。SVC(也称为H.264/AVC的可缩放扩展)考虑支持位深可缩放性。
对于颜色位深可缩放性的方法还没有太多研究。不同于可以在不同分辨率之间使用空间上采样来实现的空间可缩放性,具有挑战的是,可能很难对从重构的低比特画面到原始高比特画面的附加信息进行编码,例如,对于8比特至10比特的可缩放性,由于在对8比特画面进行编码时引入的量化误差的缘故,附加信息也可以高达10比特。层间位深预测也不类似于在变换域利用位平面扫描的FGS。
此外,已知使用不同类型的颜色空间、色度坐标和伽马校正(例如,RGB、YCrCb、HSV、XYZ)的颜色编码的不同可能。存在各种转换算法。
当具有比可以显示的位深高的颜色位深的视频版本可用时,一般的解决方案是色调映射,其中,将高动态范围降低至较低颜色位深,而保持对比度。当具有不同空间、时间或SNR分辨率的两个或多个视频版本可用时,可以通过产生基本层(BL)和要与BL组合的增强层(EL)来实现可缩放性。
然而,色调映射方法的固有问题在于,传送比必要数据更多的数据。对于具有不同颜色位深的两个或多个版本使用不同颜色编码的情况,需要更高效的压缩方法。
发明内容
本发明是基于对以下事实的认识,所述事实为:通常在位深可缩放视频编码中,在可用颜色通道之间执行联合层间预测是有利的。因此,根据本发明,在具有不同颜色位深的两个或多个版本使用不同颜色编码的情况下,也可以使用颜色位深可缩放性。在这种情况下,层间预测是基于所颜色分量的联合预测。预测还可以包括颜色空间转换和伽马校正。
根据本发明的一个方面,一种用于对包括基本层数据和增强层数据在内的视频数据进行编码的方法,其中,基本层和增强层数据包括多个颜色通道,例如,Y、Cr、Cb或R、G、B,并且,基本层和增强层数据具有不同的位深,所述方法包括以下步骤:对基本层数据进行编码;分别针对颜色通道,根据基本层数据对增强层数据进行预测;以及基于所述预测的增强层数据,分别针对颜色通道对增强层数据进行编码,其中,在至少一个模式下,根据所有可用基本层颜色通道,联合预测每个增强层颜色通道,所述方法针对至少一个增强层颜色通道还包括以下步骤:产生残差数据,所述残差数据是原始增强层颜色通道数据和预测的颜色通道数据之间的差;对原始增强层颜色通道数据进行编码;对残差数据进行编码;为至少一个增强层颜色通道选择经编码的原始增强层颜色通道数据、残差数据或经编码的残差数据,其中,所述选择与其他增强层颜色通道的选择无关;以及提供所选增强层颜色通道数据作为增强层输出数据,并且提供对涉及所述增强层颜色通道的所选编码模式的指示。
根据本发明的另一方面,一种用于对具有BL和EL数据的经编码的视频数据进行解码的方法包括以下步骤:从经编码的视频数据中提取BL数据和EL数据,其中,BL数据和EL数据均包括多个颜色通道的分离数据;至少针对增强层的第一颜色通道,对指示了编码模式的指示进行提取;对多个颜色通道的基本层数据进行解码;基于解码的基本层数据对EL数据进行预测,其中,在至少一个模式中,根据所有可用BL颜色通道对每个EL颜色通道进行联合预测;对多个颜色通道的EL数据进行解码,其中,获得残差,并且至少针对所述第一颜色通道,根据所指示的编码模式,使用所述指示进行解码;以及基于预测的EL数据和所述残差,对多个颜色通道的EL数据进行重构。
根据本发明的又一方面,一种用于对包括基本层数据和增强层数据在内的视频数据进行编码的设备,其中,基本层数据和增强层数据包括多个颜色通道,并且,基本层和增强层具有不同的位深,所述设备包括:用于对基本层进行编码的装置;用于分别针对颜色通道,根据基本层对增强层进行预测的装置;以及用于基于所述预测的增强层,分别针对颜色通道(例如,R、G、B)对增强层进行编码的装置,其中,在至少一个模式中,根据所有可用基本层颜色通道来联合预测每个增强层颜色通道,所述设备针对至少一个增强层颜色通道还包括:用于产生残差的装置,所述残差是原始增强层颜色通道图像和预测的颜色通道图像之间的差;用于对原始增强层颜色通道图像进行编码的装置;用于对残差进行编码的装置;用于为至少一个增强层颜色通道选择经编码的原始增强层颜色通道图像、残差或经编码的残差的装置,其中,所述选择与其他增强层颜色通道的选择无关;以及用于提供所选增强层颜色通道数据作为增强层输出数据并且提供对涉及所述增强层颜色通道的所选编码模式的指示的装置。
根据本发明的另一方面,一种用于对具有基本层数据和增强层数据的经编码的视频数据进行解码的设备包括:用于从经编码的视频数据中提取基本层数据和增强层数据的装置,其中,基本层数据和增强层数据均包括多个颜色通道的分离数据;用于至少针对增强层的第一颜色通道,对指示了编码模式的指示进行提取的装置;用于对多个颜色通道的基本层数据进行解码的装置;用于基于解码的基本层数据对增强层数据进行预测的装置,其中,在至少一个模式中,根据所有可用基本层颜色通道,对每个增强层颜色通道进行联合预测;用于对多个颜色通道的增强层数据进行解码的装置,并且,获得残差,并且至少针对所述第一颜色通道,根据所指示的编码模式,使用所述指示进行解码;以及用于基于预测的增强层数据和所述残差对多个颜色通道的增强层数据进行重构的装置。
根据另一方面,一种包括基本层数据和增强层数据的经编码的视频信号,其中,基本层数据包括第一颜色编码的多个颜色通道,并且增强层数据包括另一第二颜色编码的多个颜色通道,基本层数据和增强层数据具有不同的颜色位深,并且,所述信号还包括编码模式指示,所述编码模式至少针对第一增强层颜色通道指示其包括经编码的残差数据还是经编码的宏块数据。
所提出的编码解决方案的特别优势在于,其符合H.264/AVC标准,并且与H.264/AVC可缩放扩展(SVC)中支持的所述种类的可缩放性相兼容。
至少一种实现提出了H.264/AVC兼容的颜色位深可缩放编码解决方案,其中,将低比特(通常8比特)和高比特(例如,10、12或14比特)序列分别编码为基本层和增强层。在所公开的解决方案的一个实施例中,在宏块(MB)级中进行低比特BL和高比特EL之间的层间预测,以利用相同视频的低比特和高比特表示之间的冗余。此外,对每个颜色通道(例如,Y、Cb或Cr)的层间颜色位深预测不是独立的。相反,以联合方式执行,从而通过联合层间颜色位深预测,用重构的位于同一位置的基层MB的所有(通常为三个)颜色通道来确定增强层MB的每个通道的预测版本。
在所附权利要求、以下说明书和附图中公开了本发明的优势实施例。
附图说明
参照附图描述了本发明的示例实施例,在附图中
图1是颜色位深可缩放编码的框架;
图2是帧内编码中的联合层间预测;
图3是帧间编码中的联合层间预测;以及
图4是帧间编码中的自适应层间颜色位深预测。
具体实施方式
不失一般性地,假设存在颜色位深可缩放性的两个层:一个层是8比特视频序列,而另一层是10比特视频序列。针对至少一个实现方式,在图1中示出了所提出的颜色位深可缩放编码的框架。
可缩放编码器Enc产生位深可缩放比特流SBS,其中复用了BL和EL编码的画面。可缩解码器Dec可以通过仅对BL比特流进行解码来产生8比特视频,或通过对整个可缩放比特流SBS进行解码来产生10比特视频。向不同客户提供相同视觉内容的不同位深的多个版本,通过所提出的颜色位深可缩放编码来实现设备自适应。
应当强调的是,两个输入序列,8比特和10比特视频序列,可以不仅在位深方面不同。因此,层间预测可以包含,例如:
1)针对不同伽马校正和不同色度坐标的调整,例如,RGB颜色空间(Rec.BT.601)至RGB颜色空间(Rec.BT.709)的转换,RGB颜色空间(Rec.BT.601)至设备指定RGB颜色空间转换。
2)颜色空间转换(包括针对不同伽马校正的调整),例如,XYZ颜色空间至sRGB颜色空间的转换,YCbCr颜色空间(Rec.BT.709)至RGB颜色空间(Rec.BT.709)的转换,YCbCr颜色空间(Rec.BT.601)至YCbCr颜色空间(Rec.BT.709)的转换。
3)色调格式转换,例如,YCbCr 4:2:0至YCbCr 4:2:2,YCbCr 4:2:0至YCbCr 4:4:4,
4)颜色校正,以及
5)上述项目的组合。
情况1)、2)和3)可以涉及非线性变换,而在情况4)中,两个所考虑的序列之间的关系与查找表(LUT)一样复杂。此外,情况2)还可以涉及跨不同颜色通道的处理。例如,将YCbCr颜色空间(Rec.BT.709)至RGB颜色空间(Rec.BT.709)的转换数学建模为矩阵运算,使得针对每个像素,通过Y、Cb和Cr的值的线性组合来计算R(G或B)的值。至少一个实现方式提出了包含跨不同颜色通道的处理的联合层间预测,所述联合层间预测可以在画面级或MB级下进行。
以下,给出了实现联合层间颜色位深预测的编码/解码方法。在该部分中,提供了各个实现方式的细节。也可能在其他部分中讨论这样的实现方式。至少一个实现方式提供了用于实现颜色位深可缩放性的AVC兼容联合层间预测的技术解决方案。在图2和图3中示出了包含MB级层间颜色位深预测的帧内和帧间编码中的颜色位深可缩放编码器的相应的图。不失一般性地,假设层间颜色位深预测包含YCbCr颜色空间(Rec.BT.709)至RGB颜色空间(Rec.BT.709)的转换。解码处理是帧内和帧间编码中编码处理的逆过程。
关于图2和图3,应当注意,三个率失真优化块(RDO)RDOr、RDOg、RDOb彼此独立。即,对于每个颜色通道,可以单独判定,在无需预测的情况下直接对增强层进行帧内/帧间编码,还是以其他方式执行预测,产生残差,以及对该残差直接进行帧内/帧间编码,还是在速率失真优化判定之前进行变换(T)、量化(Q)和熵编码。在RDO期间,确定数据率和失真之间的最佳折衷,并且选择相应的信号。在帧间预测的情况下,如图3所示,在增强层中可以使用来自基本层MB的运动矢量305r、305g、305b。
可以在语法中(例如,在MB类型字段中)包括对所选编码类型的指示。
图4示出了在每个EL分支中使用附加跳过模式,使得RDO具有4个输入:引入新模式(所谓的跳过模式)来跳过EL残差信号。如果通过RDO选择跳过模式,则EL不包含当前MB的比特。在解码器处,仅对BL MB进行解码,并且进行层间颜色位深预测来获得重构的ELMB。层内预测在原理上以相同方式进行工作。
以下列表提供了各种实现方式的简要列表。该列表并非是穷尽的,而是仅提供了许多可能实现方式中一小部分的简要描述。
参照图2和图3,一种用于对包括基本层数据和增强层数据在内的视频数据进行编码的方法,其中,基本层和增强层数据包括多个颜色通道(例如,Y、Cr、Cb或R、G、B),并且,基本层和增强层数据具有不同的位深,该方法包括以下步骤:
对基本层数据进行编码201y、201cr、201cb;分别针对颜色通道根据基本层数据对增强层数据进行预测;以及基于所述预测的增强层数据,分别针对颜色通道(例如,R、G、B)对增强层数据进行编码,
其中,在至少一个模式中,根据所有可用基本层颜色通道,对每个增强层颜色通道进行联合预测200,并且所述方法针对至少一个(或一些或全部)增强层颜色通道还包括其他以下步骤:
产生残差数据Rres、Bres、Gres,所述残差数据是原始增强层颜色通道数据REL、GEL、BEL和预测的颜色通道数据之间的差;
对原始增强层颜色通道数据进行编码202r、202g、202b;
对残差数据进行编码203r、203g、203b、204r、204g、204b;
为至少一个增强层颜色通道选择RDOr、RDOg、RDOb经编码的原始增强层颜色通道数据、残差数据或经编码的残差数据,其中,所述选择与其他增强层颜色通道的选择无关;以及
提供所选增强层颜色通道数据作为增强层输出数据,并且提供对涉及所述增强层颜色通道的所选编码模式的指示。
在一个实施例中,基本层和增强层使用不同的颜色编码(例如,Y、CR、CB和R、G、B),并且层间预测200还包括针对帧内和帧间编码的颜色空间转换。
在一个实施例中,颜色空间转换包括从YCbCr颜色空间(Rec.BT.709)至RGB颜色空间(Rec.BT.709)的转换。
在一个实施例中,对残差进行编码包括熵编码204r、204g、204b。
在一个实施例中,针对增强层颜色通道数据的附加编码模式包括宏块级上的跳过模式405;在跳过模式中,增强层数据不包含相应宏块的比特。
在一个实施例中,在选择RDOr、RDOg、RDOb的步骤中,所述选择基于数据率和失真的最小化。
在一个实施例中,在画面级执行跨不同颜色通道的预测200。
在一个实施例中,在宏块级执行跨不同颜色通道的预测。
在一个实施例中,所述方法还包括:分别针对每个基本层和增强层颜色通道进行熵编码ECY,BL、ECCb,BL、ECCr,BL、ECY,EL、ECCb,EL、ECCr,EL。
根据本发明的另一方面,用于对具有BL数据和EL数据的经编码的视频数据进行解码的方法包括以下步骤:
从经编码的视频数据中提取基本层数据和增强层数据,其中,基本层数据和增强层数据均包括多个颜色通道的分离数据;至少针对增强层的第一颜色通道,对指示了编码模式的指示进行提取;对多个颜色通道的基本层数据进行解码;基于解码的基本层数据对增强层数据进行预测,其中,在至少一个模式中,根据所有可用基本层颜色通道对每个增强层颜色通道进行联合预测;对多个颜色通道的增强层数据进行解码,其中,获得残差,并且至少针对所述第一颜色通道,根据所指示的编码模式,使用所述指示进行解码;以及基于预测的增强层数据和所述残差,对多个颜色通道的增强层数据进行重构。
以下实施例涉及用于解码的方法。在一个实施例中,基本层和增强层使用不同的颜色编码(例如,Y、CR、CB或R、G、B),并且预测步骤还包括:针对帧内和帧间编码的颜色空间转换。
在一个实施例中,颜色空间转换包括YCbCr颜色空间至RGB颜色空间转换。
在一个实施例中,对残差进行解码包括熵解码。
在一个实施例中,采用针对增强层颜色通道的附加解码模式,包括宏块级上的跳过模式,其中,在跳过模式中,增强层数据不包含相应宏块的比特。
在一个实施例中,在画面级上执行跨不同颜色通道的预测。
在一个实施例中,在宏块级上执行跨不同颜色通道的预测。
在一个实施例中,所述方法还包括:分别针对每个基本层和增强层颜色通道的熵解码。
根据另一方面,一种用于对包括基本层数据和增强层数据在内的视频数据进行编码的设备,其中,基本层数据和增强层数据包括多个颜色通道(例如,Y、CR、CB或R、G、B),并且,基本层和增强层具有不同的位深,所述设备包括:
用于对基本层进行编码的装置201y、201cr、201cb;
用于分别针对颜色通道根据基本层对增强层进行预测的装置200;以及
用于基于所述预测的增强层,分别针对颜色通道R、G、B对增强层进行编码的装置,其中,在至少一个模式中,根据所有可用基本层颜色通道来联合预测200每个增强层颜色通道R、G、B,并且所述设备针对至少一个增强层颜色通道还包括:
用于产生残差Rres、Bres、Gres的装置,所述残差是原始增强层颜色通道REL、GEL、BEL和预测的颜色通道图像之间的差;用于对原始增强层颜色通道图像进行编码的装置202r、202g、202b;用于对残差进行编码的装置203r、203g、203b、204r、204g、204b;用于为至少一个增强层颜色通道选择经编码的原始增强层颜色通道图像、残差或经编码的残差的装置RDOr、RDOg、RDOb,其中,所述选择与其他增强层颜色通道的选择无关;以及用于提供所选增强层颜色通道数据作为增强层输出数据并且提供对涉及所述增强层颜色通道的所选编码模式的指示的装置。
以下实施例涉及用于对视频数据进行编码的设备。
在一个实施例中,基本层和增强层使用不同的颜色编码Y、CR、CB,R、G、B,并且用于执行帧间预测的装置200还包括:用于针对帧内和帧间编码执行颜色空间转换的装置。
在一个实施例中,颜色空间转换包括YCbCr颜色空间(Rec.BT.709)至RGB颜色空间(Rec.BT.709)转换。
在一个实施例中,用于对残差进行编码的装置包括:用于执行熵编码的装置204r、204g、204b。
在一个实施例中,所述设备还包括:用于针对增强层颜色通道在宏块级上执行作为附加编码模式的跳过模式的装置405,其中,在跳过模式中,增强层不包含相应宏块的比特。
根据本发明的另一方面,一种用于对具有基本层数据和增强层数据的经编码的视频数据进行解码的设备包括:
用于从经编码的视频数据中提取基本层数据和增强层数据的装置,其中,基本层数据和增强层数据包括多个颜色通道的分离数据;用于至少针对增强层的第一颜色通道,对指示了编码模式的指示进行提取的装置;用于对多个颜色通道的基本层数据进行解码的装置;用于基于解码的基本层数据对增强层数据进行预测的装置,其中,在至少一个模式中,根据所有可用基本层颜色通道对每个增强层颜色通道进行联合预测;用于对多个颜色通道的增强层数据进行解码的装置,其中,获得残差,并且至少针对所述第一颜色通道,根据所指示的编码模式,使用所述指示进行解码;以及用于基于预测的增强层数据和所述残差,对多个颜色通道的增强层数据进行重构的装置。
以下实施例涉及用于对经编码的视频数据进行解码的设备。
在一个实施例中,基本层和增强层分别针对Y、CR、CB颜色空间或R、G、B颜色空间使用不同的颜色编码装置,并且用于预测的装置还包括:用于在帧内和帧间编码的情况下执行颜色空间转换的装置。
在一个实施例中,用于执行颜色空间转换的装置包括:用于执行YCbCr颜色空间至RGB颜色空间转换的装置。
在一个实施例中,用于对残差进行解码的装置包括:用于熵解码的装置。
在一个实施例中,所述设备还包括:用于针对至少一个增强层颜色通道,执行作为附加解码模式的、宏块级上的跳过模式解码的装置,其中,在跳过模式中,增强层数据不包含相应宏块的比特。
在一个实施例中,用于执行跨不同颜色通道的预测的装置在画面级上进行操作。
在一个实施例中,用于执行跨不同颜色通道的预测的装置在宏块级上进行操作。
在一个实施例中,所述设备还包括:用于分别针对每个基本层和增强层颜色通道进行熵解码的装置。
根据又一方面,一种包括基本层数据和增强层数据在内的经编码的视频信号,其中,基本层数据包括第一颜色编码的多个颜色通道,例如Y、Cr、Cb,并且增强层数据包括另一第二颜色编码的多个颜色通道R、G、B,其中,基本层数据和增强层数据具有不同的颜色位深,并且,所述信号还包括编码模式指示,所述编码模式至少针对第一增强层颜色通道指示其包括经编码的残差数据还是经编码的宏块数据。
根据一个方面,通过根据重构的位于同一位置的基本层MB的所有(通常为三个)颜色通道,对增强层MB的每个颜色通道进行预测,来进行联合层间预测。
本公开描述了各种实现。然而,所描述的实现的特征和方面还适于其他实现。例如,可以使用各种不同的技术来实现信令,这些技术包括但不限于,SPS语法、其他高级语法、非高级语法、带外信息,以及隐式信令。此外,可以使用各种编码技术。相应地,尽管可以在具体上下文中描述这里描述的实现,但是这样的描述不应视为对这样的实现或上下文的特征和概念的限制。
例如可以以方法或过程、设备或软件程序来实现这里描述的实现。即使仅在单一形式的实现的上下文中进行讨论(例如,仅作为方法进行讨论),所讨论的实现或特征也可以以其他形式(例如设备或程序)实现。例如,设备可以以适当的硬件、软件和固件实现。例如,方法可以在诸如计算机或其他处理设备等设备中实现。此外,还可以通过由处理设备或其他设备执行的指令来实现方法,并且可以将这样的指令存储在计算机可读介质上,例如,CD、或其他计算机可读存储设备、或集成电路。
正如本领域技术人员显而易见,实现还可以产生被格式化为承载例如可以被存储或传输的信息的信号。该信息可以包括,例如,用于执行方法的指令,或由所描述的实现之一产生的数据。例如,可以将信号格式化为将特定语法的值(或者如果正在传输语法则甚至可以是语法指令本身)作为数据来承载。此外,可以在编码器或解码器或二者中实现多种实现。
此外,通过本公开可以构思出其他实现。例如,可以通过对所公开的实现的各种特征进行组合、删除、修改或补充来创建附加的实现。
将理解,仅以示例的方式描述了本发明,在不脱离本发明的范围的前提下可以对本发明进行细节上的修改。
可以独立地或以任何适当组合的形式来提供说明书以及(适当地)权利要求书和附图中所公开的每个特征。可以以硬件、软件、或两者的组合的形式来(适当地)实现这些特征。在适用情况下,可以将连接实现为无线连接或有线连接,而不一定为直接或专用连接。出现在权利要求中的附图标记仅用作说明目的,不应对权利要求的范围造成限制影响。
Claims (15)
1、一种用于对包括基本层(BL)数据和增强层(EL)数据在内的视频数据进行编码的方法,其中,基本层和增强层数据包括多个颜色通道(Y、Cr、Cb,R、G、B),并且,基本层和增强层数据具有不同的位深,所述方法包括以下步骤:
-对基本层数据进行编码(201y、201cr、201cb);
-分别针对所述颜色通道,根据基本层数据对增强层数据进行预测(200);以及
-基于所述预测的增强层数据,分别针对所述颜色通道(R、G、B)对增强层数据进行编码;
其中,在至少一个模式中,根据所有可用基本层颜色通道,对每个增强层颜色通道进行联合预测(200),并且所述方法针对至少一个增强层颜色通道还包括其他以下步骤:
-产生残差数据(Rres、Bres、Gres),所述残差数据是原始增强层颜色通道(REL、GEL、BEL)和预测的颜色通道数据之间的差;
-对原始增强层颜色通道数据进行编码(202r、202g、202b);
-对残差数据进行编码(203r、203g、203b、204r、204g、204b);
-为至少一个增强层颜色通道选择(RDOr、RDOg、RDOb)经编码的原始增强层颜色通道数据、残差数据或经编码的残差数据,其中,所述选择与其他增强层颜色通道的选择无关;以及
-提供所选增强层颜色通道数据作为增强层输出数据,并且提供对涉及所述增强层颜色通道的所选编码模式的指示。
2、根据权利要求1所述的方法,其中,基本层和增强层使用不同的颜色编码(Y、CR、CB,R、G、B),并且层间预测(200)还包括针对帧内和帧间编码的颜色空间转换。
3、根据权利要求2所述的方法,其中,所述颜色空间转换包括:YCbCr颜色空间(Rec.BT.709)至RGB颜色空间(Rec.BT.709)的转换。
4、根据前述权利要求之一所述的方法,其中,对残差进行编码包括熵编码(204r、204g、204b)。
5、根据前述权利要求之一所述的方法,其中,针对增强层颜色通道数据的附加编码模式包括宏块级上的跳过模式(405);在跳过模式中,增强层数据不包含针对相应宏块的比特。
6、根据前述权利要求之一所述的方法,其中,在所述选择(RDOr、RDOg、RDOb)步骤中,所述选择基于数据率和失真的最小化。
7、根据前述权利要求之一所述的方法,其中,在画面级执行跨不同颜色通道的预测(200)。
8、根据前述权利要求之一所述的方法,其中,在宏块级执行跨不同颜色通道的预测。
9、根据前述权利要求之一所述的方法,其中,还包括:分别针对每个基本层和增强层颜色通道进行的熵编码(ECY,BL、ECCb,BL、ECCr,BL、ECY,EL、ECCb,EL、ECCr,EL)。
10、一种用于对具有BL数据和EL数据的经编码的视频数据进行解码的方法,包括以下步骤:
-从经编码的视频数据中提取基本层数据和增强层数据,其中,基本层数据和增强层数据均包括多个颜色通道的分离数据;
-至少针对增强层的第一颜色通道,对指示了编码模式的指示进行提取;
-对多个颜色通道的基本层数据进行解码;
-基于解码的基本层数据对增强层数据进行预测,其中,在至少一个模式中,根据所有可用基本层颜色通道对每个增强层颜色通道进行联合预测;
-对多个颜色通道的增强层数据进行解码,其中,获得残差,并且至少针对所述第一颜色通道,根据所指示的编码模式,使用所述指示进行解码;以及
-基于预测的增强层数据和所述残差,对多个颜色通道的增强层数据进行重构。
11、一种用于对包括基本层(BL)和增强层(EL)在内的视频数据进行编码的设备,其中,基本层和增强层数据包括多个颜色通道(Y、Cr、Cb,R、G、B),并且,基本层和增强层具有不同的位深,所述设备包括:
-用于对基本层进行编码的装置(201y、201cr、201cb);
-用于分别针对颜色通道,根据基本层对增强层进行预测的装置(200);以及
-用于基于所述预测的增强层,分别针对颜色通道(R、G、B)对增强层进行编码的装置;
其中,在至少一个模式中,根据所有可用基本层颜色通道,对每个增强层颜色通道(R、G、B)进行联合预测(200),所述设备针对至少一个增强层颜色通道还包括:
-用于产生残差(Rres、Bres、Gres)的装置,所述残差是原始增强层颜色通道(REL、GEL、BEL)和预测的颜色通道图像之间的差;
-用于对原始增强层颜色通道图像进行编码的装置(202r、202g、202b);
-用于对残差进行编码的装置(203r、203g、203b、204r、204g、204b);
-用于为至少一个增强层颜色通道选择经编码的原始增强层颜色通道图像、残差或经编码的残差的装置(RDOr、RDOg、RDOb),其中,所述选择与其他增强层颜色通道的选择无关;以及
-用于提供所选增强层颜色通道数据作为增强层输出数据并且提供对涉及所述增强层颜色通道的所选编码模式的指示的装置。
12、根据前述权利要求所述的设备,其中,基本层和增强层使用不同的颜色编码(Y、CR、CB,R、G、B),用于执行层间预测的装置(200)还包括:用于针对帧内和帧间编码执行颜色空间转换的装置。
13、一种用于对具有基本层和增强层数据的经编码的视频数据进行解码的设备,包括:
-用于从经编码的视频数据中提取基本层数据和增强层数据的装置,
其中,基本层数据和增强层数据均包括多个颜色通道的分离数据;
-用于至少针对增强层的第一颜色通道,对指示了编码模式的指示进行提取的装置;
-用于对多个颜色通道的基本层数据进行解码的装置;
-用于基于解码的基本层数据对增强层数据进行预测的装置,其中,在至少一个模式中,根据所有可用基本层颜色通道,对每个增强层颜色通道进行联合预测;
-用于对多个颜色通道的增强层数据进行解码的装置,其中,获得残差,并且,至少针对所述第一颜色通道,根据所指示的编码模式,使用所述指示进行解码;以及
-用于基于预测的增强层数据和所述残差对多个颜色通道的增强层数据进行重构的装置。
14、根据前述权利要求所述的设备,其中,基本层和增强层使用不同的颜色编码(Y、CR、CB,R、G、B),用于预测的装置还包括:用于针对帧内和帧间编码执行颜色空间转换的装置。
15、一种包括基本层(BL)和增强层(EL)数据在内的经编码的视频信号,其中,基本层数据包括第一颜色编码的多个颜色通道(Y、Cr、Cb),并且增强层数据包括不同的第二颜色编码的多个颜色通道(R、G、B),其中,基本层数据和增强层数据具有不同的颜色位深,并且,所述信号还包括编码模式指示,所述编码模式至少针对第一增强层颜色通道指示其包括经编码的残差数据还是经编码的宏块数据。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US92578807P | 2007-04-23 | 2007-04-23 | |
US60/925,801 | 2007-04-23 | ||
US60/925,788 | 2007-04-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101663896A true CN101663896A (zh) | 2010-03-03 |
Family
ID=41790676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200880013169 Pending CN101663896A (zh) | 2007-04-23 | 2008-04-09 | 用于对视频数据进行编码的方法和设备、用于对编码的视频数据和编码的视频信号进行解码的方法和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101663896A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103477621A (zh) * | 2011-01-28 | 2013-12-25 | 艾艾欧有限公司 | 基于hvs模式的颜色转换 |
CN103535038A (zh) * | 2011-05-16 | 2014-01-22 | 杜比实验室特许公司 | 用于分层vdr编码的有效架构 |
WO2014106608A1 (en) * | 2013-01-04 | 2014-07-10 | Canon Kabushiki Kaisha | Encoding and decoding methods and devices, and corresponding computer programs and computer readable media |
CN104322068A (zh) * | 2012-06-27 | 2015-01-28 | 英特尔公司 | 跨层跨通道残差预测 |
CN105025997A (zh) * | 2012-12-28 | 2015-11-04 | 高通股份有限公司 | 针对位深度可缩放视频译码使用样本自适应调整的层间预测 |
CN105409217A (zh) * | 2014-06-19 | 2016-03-16 | 索尼公司 | 图像处理装置、图像处理方法和计算机可读介质 |
CN105744277A (zh) * | 2011-11-04 | 2016-07-06 | 杜比实验室特许公司 | 分层vdr编译码中的层分解 |
US9554142B2 (en) | 2011-01-28 | 2017-01-24 | Eye IO, LLC | Encoding of video stream based on scene type |
CN106878707A (zh) * | 2011-04-14 | 2017-06-20 | 杜比实验室特许公司 | 多颜色通道多元回归预测算子 |
CN107257989A (zh) * | 2015-03-24 | 2017-10-17 | 英特尔公司 | 群集的调色板压缩 |
CN107690808A (zh) * | 2015-06-08 | 2018-02-13 | 高通股份有限公司 | 可缩放视频译码中色域缩放性参数及表的推导 |
CN110913217A (zh) * | 2014-06-19 | 2020-03-24 | Vid拓展公司 | 用于基于三维色彩映射模型参数优化的系统和方法 |
CN113329269A (zh) * | 2020-02-28 | 2021-08-31 | 杭州海康威视数字技术股份有限公司 | 视频编码、解码方法、装置、电子设备及存储介质 |
-
2008
- 2008-04-09 CN CN 200880013169 patent/CN101663896A/zh active Pending
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103477621A (zh) * | 2011-01-28 | 2013-12-25 | 艾艾欧有限公司 | 基于hvs模式的颜色转换 |
US9554142B2 (en) | 2011-01-28 | 2017-01-24 | Eye IO, LLC | Encoding of video stream based on scene type |
CN103477621B (zh) * | 2011-01-28 | 2016-09-28 | 艾艾欧有限公司 | 基于hvs模式的颜色转换 |
CN106878707B (zh) * | 2011-04-14 | 2018-05-08 | 杜比实验室特许公司 | 多颜色通道多元回归预测算子 |
CN106878707A (zh) * | 2011-04-14 | 2017-06-20 | 杜比实验室特许公司 | 多颜色通道多元回归预测算子 |
US10021390B2 (en) | 2011-04-14 | 2018-07-10 | Dolby Laboratories Licensing Corporation | Multiple color channel multiple regression predictor |
US10237552B2 (en) | 2011-04-14 | 2019-03-19 | Dolby Laboratories Licensing Corporation | Multiple color channel multiple regression predictor |
CN103535038A (zh) * | 2011-05-16 | 2014-01-22 | 杜比实验室特许公司 | 用于分层vdr编码的有效架构 |
US10298923B2 (en) | 2011-05-16 | 2019-05-21 | Dolby Laboratories Licensing Corporation | Efficient architecture for layered VDR coding |
CN105744277A (zh) * | 2011-11-04 | 2016-07-06 | 杜比实验室特许公司 | 分层vdr编译码中的层分解 |
CN105744277B (zh) * | 2011-11-04 | 2019-12-24 | 杜比实验室特许公司 | 分层vdr编译码中的层分解 |
CN104322068A (zh) * | 2012-06-27 | 2015-01-28 | 英特尔公司 | 跨层跨通道残差预测 |
US10536710B2 (en) | 2012-06-27 | 2020-01-14 | Intel Corporation | Cross-layer cross-channel residual prediction |
CN105025997A (zh) * | 2012-12-28 | 2015-11-04 | 高通股份有限公司 | 针对位深度可缩放视频译码使用样本自适应调整的层间预测 |
CN105025997B (zh) * | 2012-12-28 | 2019-06-21 | 高通股份有限公司 | 针对位深度可缩放视频译码使用样本自适应调整的层间预测 |
WO2014106608A1 (en) * | 2013-01-04 | 2014-07-10 | Canon Kabushiki Kaisha | Encoding and decoding methods and devices, and corresponding computer programs and computer readable media |
CN105409217A (zh) * | 2014-06-19 | 2016-03-16 | 索尼公司 | 图像处理装置、图像处理方法和计算机可读介质 |
CN105409217B (zh) * | 2014-06-19 | 2019-12-24 | 索尼公司 | 图像处理装置、图像处理方法和计算机可读介质 |
CN110913217A (zh) * | 2014-06-19 | 2020-03-24 | Vid拓展公司 | 用于基于三维色彩映射模型参数优化的系统和方法 |
CN110913217B (zh) * | 2014-06-19 | 2022-01-25 | Vid拓展公司 | 用于基于三维色彩映射模型参数优化的系统和方法 |
CN107257989A (zh) * | 2015-03-24 | 2017-10-17 | 英特尔公司 | 群集的调色板压缩 |
CN107690808A (zh) * | 2015-06-08 | 2018-02-13 | 高通股份有限公司 | 可缩放视频译码中色域缩放性参数及表的推导 |
CN113329269A (zh) * | 2020-02-28 | 2021-08-31 | 杭州海康威视数字技术股份有限公司 | 视频编码、解码方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101663896A (zh) | 用于对视频数据进行编码的方法和设备、用于对编码的视频数据和编码的视频信号进行解码的方法和设备 | |
US20100128786A1 (en) | Method and apparatus for encoding video data, method and apparatus for decoding encoded video data and encoded video signal | |
JP5383674B2 (ja) | ビット深さスケーラビリティのために向上層残差予測を使ってビデオ・データをエンコードおよび/またはデコードする方法および装置 | |
US20230276061A1 (en) | Scalable video coding system with parameter signaling | |
JP5346198B2 (ja) | 階層的lutを利用したビット深度スケーラビリティのためのエンハンスメントレイヤ残差予測 | |
CN101622878B (zh) | 用于实现位深度可分级性的视频编解码方法和视频编解码设备 | |
CN101601300B (zh) | 用自适应增强层预测对位深度可分级视频数据进行编码和/或解码的方法和设备 | |
CN101558650B (zh) | 编码和/或解码视频数据的方法及设备 | |
US20050259729A1 (en) | Video coding with quality scalability | |
CN102067609A (zh) | 利用降低的比特深度更新模式和降低的色度采样更新模式进行视频编码和解码的方法及装置 | |
TW201347542A (zh) | 規定視覺動態範圍編碼操作及參數 | |
EP2092748A1 (en) | Method and apparatus for encoding and/or decoding video data using enhancement layer residual prediction for bit depth scalability | |
CN103458243A (zh) | 视频解码方法和设备 | |
CN101189875B (zh) | 利用公共预测器的亮度和色度编码 | |
EP3272124B1 (en) | Scalable video coding system with parameter signaling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20100303 |
|
C20 | Patent right or utility model deemed to be abandoned or is abandoned |