[go: up one dir, main page]

CN101584220B - 对视频信号进行编码的方法和系统、编码的视频信号、对视频信号进行解码的方法和系统 - Google Patents

对视频信号进行编码的方法和系统、编码的视频信号、对视频信号进行解码的方法和系统 Download PDF

Info

Publication number
CN101584220B
CN101584220B CN200880002202.2A CN200880002202A CN101584220B CN 101584220 B CN101584220 B CN 101584220B CN 200880002202 A CN200880002202 A CN 200880002202A CN 101584220 B CN101584220 B CN 101584220B
Authority
CN
China
Prior art keywords
frame
flow
encoder
decoder
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200880002202.2A
Other languages
English (en)
Other versions
CN101584220A (zh
Inventor
W·H·A·布鲁尔斯
A·P·H·布尔奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN101584220A publication Critical patent/CN101584220A/zh
Application granted granted Critical
Publication of CN101584220B publication Critical patent/CN101584220B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一些视频压缩标准使用多个时间预测。采用另一预测来覆写最老的时间预测中的一个或多个。在实施例中,增强编码器中使用的预测由基本流编码器中生成的预测覆写。

Description

对视频信号进行编码的方法和系统、编码的视频信号、对视频信号进行解码的方法和系统
技术领域
本发明涉及视频编码(或视频压缩)的一般领域,并且在实施例中涉及所谓的可扩缩的视频编码。本发明提供了对视频信号进行编码的方法和系统,其中实现了图像压缩,例如可扩缩的图像压缩,并且使用了多个时间预测,其中多个帧被存储在预测单元的存储器中。 
本发明还涉及解码的、例如可扩缩的视频信号,并且还涉及对视频信号进行解码的方法和系统。 
图像显示系统通常接收经压缩的数据流。已知多种图像压缩技术被用于减少必须存储或者传输的图像数据量。在视频压缩中使用了预测,其中从一个或多个先前接收或者生成的帧中预测出一帧的内容或者一帧的一部分的内容。在视频信号处理中,信号由帧内编码帧和帧间编码帧组成,例如由I帧、P帧和B帧组成。I帧是帧内编码帧。P帧和B帧被称为帧间编码帧。帧内编码帧能够在不参考其他帧的情况下被重建;帧间编码帧的重建则是通过使用其他帧的数据(前向或者后向预测)实现的。P帧和B帧仅包含I帧之间的信息或变化,该信息或变化通常以宏块的运动矢量表示。在标准视频信号处理中,帧间编码帧的参考是相对简单的,至多涉及两种帧,从I帧中前向地预测出P帧,并且从I帧和P帧中前向和后向地预测出B帧。通过使用运动估计能够找到用于对帧的各部分(宏块)进行运动估计的运动矢量。一些更复杂的视频压缩标准,例如AVC压缩标准,具有进行许多多预测的可能性。相对较大数量的时间(即前向或后向)预测被作出。不仅在时间上最接近的帧被考虑用于进行预测,而且在时间上距离较远的帧也被考虑。在缓冲器中,若干个帧存储在存储器中,以用于时间预测。随着时间的推进,所述帧移位通过该存储器的缓冲器,并且当新的“新鲜”帧被存储时,最老的帧被排除出该缓冲器之外。 
尽管现有方案是有用的,但是发明人意识到存在对编码进行改进的可能性。公知的方法在预测上具有限制。通过消除该限制,在不需要对现有(可扩缩的)视频编码进行较大改变的情况下提供了新的可能性,并且因此提供了易于在工业上使用的新机会。 
为此目的,根据本发明的方法的特征在于,采用来自另一预测单元的单独生成的预测帧来覆写(overwrite)所述预测单元中的存储器中的预测帧。 
“单独生成”在本发明的框架内是指在普通(时间)过程之外生成预测帧。预测帧例如生成在编码器的增强编码部分中,生成在基本流(base stream)编码部分中的预测帧在独立于编码器的增强部分的情况下被生成(尽管从整体上看去,仍旧在编码器中)。在存储器中保存地最久的预测帧是指存储器中最老的预测帧或者是最老的预测帧的子集中的一个。 
本发明基于以下构思: 
在标准中使用了若干个时间预测。一个帧被保存地越久,那么通常来说基于该帧的时间预测的重要性就越低。在本发明中,通过将为一个或多个时间预测保留的空间用于单独预测的方式来绕开时间预测的规则。这将略微降低基于常规生成的预测帧的时间预测的准确性。然而,被覆写的信息是相对冗余或者用处不大的。因此频繁地覆写该信息不会严重地降低图像质量。所述信息可以被写入覆写槽(slot)中,然而该信息提供了采用现有标准无法实现的或者在对现有过程进行非常复杂的改变的情况下才能实现的可能性,从而使得这些可能性不再兼容于现有标准和/或必须在视频信号中加入大量的数据。在本发明的简单实施例中,所述被覆写的预测是最老的预测之一。最老(在存储器中最久)的预测通常是最不重要的。可替代地,所述方法可以包括在覆写前选择最不重要的预测的算法。 
根据本发明的方法不需要更多的比特或者不需要对现有AVC标准做出较大的改变。 
在本发明的一个实施例中,所述存储器是在增强编码器/解码器中的存储器,并且所述单独生成的帧是来自基本编码器/解码器的扩展了(upscaled)的帧/去交织的帧。这使得在不改变语法的情况下能够使用用于可扩缩的压缩的AVC标准。 
在另一实施例中,所述外部帧包括深度图。 
这允许生成3D视频多视图编码。 
在图7所示的又一实施例中,所述增强流提供了更高的帧率,该提高后的帧率与原来的帧率的比值不为2。对于这种情况来说,一种可以想象的应用为用于电视机的频率为50Hz的基本层和用于计算机LCD面板(或其他高级的显示器)的频率为75Hz的增强层。的确,将帧率增加到至少75Hz提供了极大的改善,然而,其所需的比特率比直接增加到100Hz要低。此外,75Hz是许多(主要在计算机领域中的)显示器的本地刷新率。因此,与75/90Hz增强兼容的50/60Hz解决方案是优选的,但是既不能采用MPEG2也不能采用SVC来实现该解决方案。 
根据本发明,能够高效率地实现此兼容性。 
附图说明
通过使用以下附图来更详细地说明本发明的这些和其他有利的方面。 
图1a至图1c示出了后处理方法的处理流程,该后处理方法包括根据本发明的实施例的用于编码(图1a)和解码(图1b)的方法,其中图1c示出了一个更复杂的实施例。 
图2至图5进一步说明了图1a至图1c中所示的本发明的实施例。 
图6示出了本发明的第二实施例。 
图7示出了本发明的另一个实施例,其中基本流和增强流具有不同的帧率。 
图8示出了具有(通常是用于时间预测的)预测存储器的视频压缩设备的基本原理,其中至少一个不那么合用的预测存储器用于存储可替代的预测装置的预测。 
附图不是按比例绘制的。一般来说,附图中相同的附图标记表示相同的部件。 
具体实施方式
简而言之,本发明可描述为: 
一些视频压缩标准具有例如为运动估计/运动补偿而使用大量预测的可能性。发明人意识到这些预测中的某些预测是比较冗余的或者用处不大,例如使用AVC时,采用了多个时间预测并且IC被预设计为能够对此进行处理。在本发明中,通过覆写这些预测中的最后一个预测(即通常是最不准确的,尤其对于野外运动来说)来绕开时间预测的规则,以对另一预测进行编码。解码器的行为是类似的。 
图1示出了使用编码和解码方法的本发明的实施例的处理流程。以下对该处理流程进行说明: 
编码器侧: 
图1a示出了根据本发明的方法和系统的实施例。 
在图中所使用的缩写代表: 
DCT:离散余弦变换 
Q:量化 
DCT-1:离散余弦反变换 
Q-1:反量化 
VLC:可变长度编码 
Base str:基本流 
Enh str:增强流 
ME/MC:运动估计/运动补偿 
R0,R1等:存储器内的用在ME/MC中的帧 
MBi:宏块i 
PTSi:呈现时间戳i 
AVC:高级视频编码,高级视频编码例如是H.264和MPEG4.10编码标准 
SEI:补充增强信息。 
图1a示出了其中使用了基本流和增强流的方法。在许多图像传输方法中固有的大量数据带来了极大的问题。更特别地,每个数字图像帧仍然是根据特定系统的显示分辨率从像素阵列中形成的静止图像。结果,所包含的原始数字信息的数量通常是巨大的。为了减少必须发送的数据量,使用压缩方案以对数据进行压缩。已建立了各种不同的视频压 缩标准或过程,其中包括MEPG-2、MPEG-4和H.263。 
许多应用允许被使用,其中能够在一个流中以不同的分辨率和/或质量获得图像数据。实现这个的方法不严格地称为可扩缩性技术。存在其上可以使用可扩缩性的三个轴。第一个为时间轴上的可扩缩性,通常被称为时间可扩缩性。其次,存在质量轴上的可扩缩性,通常被称为信号-噪声可扩缩性或者细颗粒可扩缩性。第三个轴为分辨率轴(图像中像素的数目),其通常被称为空间可扩缩性或者分层编码。在分层编码中,比特流被划分为两个或更多个比特流或者层。每一层能够被组合以形成单个高质量的信号。例如,基本层可以提供较低质量的视频信号,而增强层提供能够增强基本层图像的附加信息。图1a示出了用于提供分层信号的方法和系统,在此情况下,该分层信号具有基本流(base str)和增强流(base str),该增强流有时亦被称为增强层。 
输入在经过低通滤波器1(例如为奈奎斯特滤波器)之后被分解并且被发送到基本编码器2。在该基本编码器中,信号经历离散余弦变换(DCT),或者任何其他类似的变换(例如使用小波),并且被量化(Q);在产生的数据流上执行可变长度编码以提供要发送和/或要存储的基本流。在视频信号处理中,信号通常由帧内编码帧和帧间编码帧组成,例如由I帧、P帧和B帧组成。I帧为帧内编码帧。P帧和B帧被称为帧间编码帧。帧内编码帧能够在不参考其他帧的情况下重建;帧间编码帧则通过使用其他帧的数据来重建(前向或后向预测)。P帧和B帧仅包含I帧之间的信息或变化,所述信息或变化通常以宏块的运动矢量表示。为了寻找差异,必须在编码器内对原始信号进行重建。这是由反量化(Q-1)和离散余弦反变换(DCT-1)实现的。产生的重建帧在编码器中用于估计运动矢量。在一种简单的布置中,仅将一个重建帧用于运动估计和运动补偿。然而,在更复杂的方法和系统中,使用了多个重建帧。这可能是有用的,因为重建引入的误差对于某些重建帧来说要大于其他一些重建帧,并且同样有可能的是,前面的帧不一定是作为用于对帧之间的差异进行运动矢量估计的开始位置的最佳帧。编码器包括移位寄存器,其中为了进行比较,多个重建帧的数据被存储在移位寄存器中以用在运动估计和/或运动补偿中,即用在预测中。一些更复杂的视频压缩标准(例如AVC压缩标准)具有进行许多多个预测的可能性。相对较大 数量的时间(即前向或后向)预测被执行。不仅将时间上最接近的帧考虑为用于进行预测,而且还将时间上离得较远的帧也考虑进去。在缓冲器中,若干帧被存储在缓冲器中以用于时间预测。随着时间的推进,将该帧移位通过该缓冲器,并且当新的“新鲜”帧被存储时,最老的帧被排除出该缓冲器之外。 
尽管产生的基本流没有提供可被视为高清晰度的分辨率,但是基本流可被广播、接收并且经由解码器显示。 
在图1a中,所述系统还包括增强编码器3。在增强编码器3中,执行如基本流编码器2中所执行的类似方法,唯一的区别在于对增强流(即原始信号与基本流之间的差异)进行处理。增强解码器包括用于对增强的层信号进行离散余弦变换和量化以及用于重建(DCT-1、Q-1)的装置。用于R0、R1等帧的增强流的重建数据被存储并且被用于对增强流的运动估计和运动补偿。本领域技术人员应当熟悉这些方法。 
发明人已经意识到,存储的帧并不都具有相同的相关性,特别地但非排他性地,最不长久的帧很可能不是很重要。帧被保存得越久,那么通常来说基于该帧的时间预测的重要性就越低。在本发明中,通过将为最后一个时间预测(即“最老的帧”)保留的空间用于单独的预测来绕开时间预测的规则。这将略微降低时间预测的准确性。然而,被覆写的信息是相对冗余/用处不大的。因此,非常频繁地覆写该信息不会严重地降低图像质量。然而,可以被写入覆写槽中的信息提供了采用现有标准无法实现的或者只有在对现有过程进行非常复杂的改变(这使得他们不再兼容于现有标准和/或必须在视频信号中加入大量的比特)的情况下才能实现的可能性。通过覆写一个或多个最老的帧就能够使用本发明。 
图1a示出了本发明的方法和系统的实施例。位于增强编码器中的存储器内的最老的数据被在基本编码器中生成的扩展/交织帧覆写。因此,在进行编码之前,采用来自基本编码器/解码器2的同样具有PTSi(呈现时间戳i)的扩展/去交织帧4来覆写增强编码器3中的最后一个(增强编码器的存储器5中最久的)参考帧Rn/1。因此,在增强编码器3的存储器5中存储得最久的帧被单独生成的帧覆写,即被来自基本流编码器2的扩展/去交织帧4覆写。尽管这可能略微降低在增强编码器中 执行的运动估计/运动补偿的准确性,但这允许在没有任何语法改变的情况下使用用于可扩缩压缩的AVC。这例如与以向后兼容(720p或1080iHDTV)的方式引入全帧率下的1080p HDTV有关。该原理也适用于不可扩缩的压缩。图1a示出了可扩缩的编码器。由于资源限于180i,因此根据本发明的方案允许对硅片仅作微小的修改就可以实现1080p。现在,最后一个预测Rn-1例如包括智能内容的自适应扩展的候选。作为更复杂的实施例,例如,如果例如通过使用两种不同的去交织算法生成预测(帧),那么可以覆写最后两个“普通的”时间预测(Rn-1,Rn-2)。 
在实施例中,只有在增强编码器中的存储器内最久的帧被覆写。在本发明的范围内,根据存储器内的帧的数量,可以覆写多于一个最老的帧。同样,在此实施例中,可以做出简单的选择,即覆写最老的帧。在实施例中,可以覆写最后n个帧中的一个,其中根据对要覆写的最老的帧集合的重要性(排序)所进行的估计来做出覆写哪一帧的选择,从而被覆写的帧并不一定是最老的帧,而可能是第二老的帧。 
图1b示出了解码器侧。VLD表示可变长度解码。在基本流解码器2’中生成的帧4被用于覆写增强解码器的存储器5’中的帧预测帧Rn-1。 
图1c示出了图1a中所示的设计的更复杂的实施例。其区别在于使用了滤波器,此外还在于将与该滤波器以及扩展相关的数据插入了SEI(补充增强信息)。这些数据被用在解码器中以在解码器端建立用于滤波和扩展的相同参数,从而使得在编码器内用于编码方法中的参数同样能用在解码中。 
在此实施例中,当“来自外部的”帧被置入解码画面缓冲器时,给予该帧一个老的cts(合成时间戳),以使其永远不会被显示,并且还将其标记为“长期参考”,以使其不会被排除出存储器。 
图2在流程图中示出了所述增强内的不同步骤,以确保外部帧(具有PTSj的扩展基)确实覆写了存储器中的帧Rn-1。 
本发明的基本见解,即采用外部生成的预测帧来覆写存储器中最久的预测帧,并不仅在图1a至图1c中示出的实施例中是有用的。 
在图2b中给出了另一选择;其给出了可以安全地覆写存储器内的参考帧时的例子。在此重要的是,仅当帧已被发送到输出端(显示器)时才将其覆写。由帧进入,存储器被该帧填充(存储器0,存储器1等)。 在此设置中,参考帧的数量为三。这意味着前三帧不可能去覆写帧,因为我们需要三个帧。当一个帧已被显示时,就可以在存储器中将其覆写。因此,在此例中,已被置于圆圈中的帧可被覆写。应当注意的是,这些帧是最老的帧,但不一定是存储器中最老的帧。在第四列中,例如可以覆写已显示的I0帧,但不可以覆写还没有显示的B1帧。矩形表示用于为B3和P6(第一个矩形)以及B5和P7(最后一个矩形)提供参考的帧。 
图3示出了一个实施例,其中扩展并解码了的I0基本流帧在增强编码器/解码器的存储器(缓冲器)中覆写了增强编码器/解码器中的最后一个参考预测帧(R2),其在本例中为P-6。 
图4示出了一个实施例,其中具有时间戳PTS2的扩展并解码了的P2;基本流帧在增强编码器/解码器的存储器(缓冲器)中覆写了增强编码器/解码器中的最后一个参考预测帧(R2),其在本例中为P-4。 
图5示出了一个实施例,其中基本流具有720p的输出并且增强流具有1080p的输出。具有时间标记PTS1的扩展/去交织的基本流帧覆写AVC增强编码器的存储器中的帧Rn-1。这允许了以向后兼容(720p或1080i HDTV)的方式引入全帧率下的1080p HDTV,这对于公知方法而言是不可能的或者需要付出高得多的代价。 
同样,我们可以将覆写多个参考帧之一的原理应用到多视图的情况,以使我们不必改变任何语法,并且基本上也可以将常规的AVC用于此应用场合。 
已经存在对多视图的情况进行高效压缩的尝试。在mpeg中,已认识到使用分级B帧的普通AVC可被用于对多视图视频进行高效压缩。在这样的方法中,将不同视图的帧交织起来,并且确保非参考(非C)视图帧为分级B类型(被存储的B,Bs)。这对于每个MB既允许空间预测(相邻)又允许时间预测(从相同的视图)。 
特别地,具有一个中心视图(C)以及一个左视图(L)和一个右视图(R)的情况对于立体视频而言是很令人感兴趣的。在此,中心视图C为参考视图,而L和R视图为分级B帧。 
尽管目前最佳的解决方案(AVC+分级B帧)是一个很大的改进,然而相对于仅仅AVC C流三视图AVC流的比特率对于许多应用而言仍旧过高(1+2*0.4/0.5)=1.8..2*。 
在MPEG中,人们设法用新的模式(新语法)来扩展AVC,以将IBR(从2D+深度中进行图像再现)作为新的预测模式包括进来以改善多视图AVC编码器的效率。但是,由于这意味着对AVC进行了许多改变,因此这将在实施方面带来困难。 
然而,发明人意识到,可以使用本发明的基本构思,即在多视图情况下覆写多个参考帧之一的原理,使得我们也不必改变任何语法,并且基本上也可以将常规的AVC用于此应用场合。 
这由图6所示,其中参考帧的最小数量通常为4,参见a),其中在AVC编码器的存储器中使用了四个参考帧,即Cfw、Cbw、Bsr、Bsl。 
当然可以增加参考帧的数量(参见图6b Cfw、Cbw、Bsr、Bsl、Bsr-1、Bsl-1),这会带来一定的(有限的)增益。此情况描绘在b)中。 
对于真实的3D应用,同样需要三个深度视图。采用这些深度视图以及C视图,我们可以将IBR(基于图像的再现)应用于创建L’和R’的逼近(预测)。这些预测能够在每次开始对新的帧进行编码之前覆写比较不重要的参考帧(参见图6c)。 
现在,与b)相比,增益要大得多,如部分c)中所示。 
由本发明允许的第三个应用是为具有不同于2的幂的比值的较高帧率创建增强流。 
的确,根据本发明的一般方案,将50Hz序列的解码帧置于75Hz序列的参考列表中。由于来自50Hz序列的预测帧在时间上与在75Hz序列中编码的帧十分接近,因此该预测帧是良好的预测器并且有助于达到更好的编码效率。参照图7,其中帧i属于增强的75Hz序列,而帧i’属于基本50Hz序列: 
-帧1’与帧1具有相同的时间位置 
-帧2’在时间上比75Hz序列中的任何帧都更接近于帧2 
-帧2在时间上比75Hz序列中的任何帧都更接近于帧3 
-帧3’与帧4具有相同的时间位置 
-等等 
简而言之,可将本发明描述为: 
一些视频压缩标准使用多个时间预测。用另一预测来覆写最老的时间预测中的一个或多个。在一个实施例中,在增强编码器中使用的预测 被基本流编码器中生成的预测覆写。在另一实施例中,时间预测被3D视图覆写。 
本发明涉及如以上通过实例所描述的编码的方法和系统以及解码的方法和系统。 
本发明还体现在视频信号中,该视频信号包括编码的视频信号和控制信息,该控制信息例如包括解码方法中使用的功能参数。根据上述任一实施例及其任意组合,所述控制信息可以包括数据。 
根据本发明,包括在所述视频信号中的控制信息可以包括一个或多个以下信息: 
A:一般信息,即适用于整个视频信号的信息 
1.所述方法被用于对视频信号进行编码,这在如果将来仅使用一种标准方法的情况下是有益的。 
2.所述方法的特定实施例被用于对视频信号进行编码 
3.所述方法中使用的参数,这样的参数可以例如为 
-待覆写的特定预测(在存储器中最久的,或者在存储器中两个最久的,或者存储器中第二久的预测) 
-在整个对视频信号进行编码过程中使用的参数,例如滤波器的参数、扩展算法的参数或者确定哪个预测要被覆写的算法的参数。 
B.特定的动态信息 
如果视频信号是动态生成的,即在编码期间所做的某些选择是根据视频内容进行的;在编码器内所做的选择可以包括在编码的视频信号中。例如,如果所述编码方法包括例如通过估计可能要被覆写的预测相比于将覆写该预测的预测的重要性来确定哪个预测要被覆写的算法,那么存在将所述选择算法的细节包含到视频信号中(从而因此将一般信息包含到视频信号中)的选择。然而,这仅在解码器包括所述算法的情况下才起作用。如果解码器不包括该算法,那么可以发送特定的动态信息,即对于视频信号的特定部分(例如通过标志)而言,指定要被覆写的特定预测。 
视频信号可以包括一般信息和动态信息。所有上述类型的信息以及其他任何种类的、与根据本发明的方法的使用相关的信息在本申请的框 架内都被称为参数。因此,参数可以是简单的是/否参数(上述的点A1),指示一组可能性内的选择的参数(例如上述的点A2)或者用于对所述方法内的步骤进行控制的参数(上述的点A3)或者任何形状或形式的动态参数(上述的点B)。 
图8再次详细说明了本发明的(与最一般的方法相应的)最一般的设备。在允许预测单元801将标准SEL_F()应用到由类似的例如进行有损变换和运动补偿(例如在AVC中,时间预测可以从若干先前的图像的组合中得到)的预测单元T、T2产生的若干预测上的视频压缩中,可以通过存储来自另一预测单元PR_UN的单独预测的数据来“重复使用”这些“标准”模式中的一个(即在予存储器MEM_P2中,粗糙地量化的第一预测,例如小波逼近,被另一来自PR_UN的算法用另一预测区域覆写)。然后,可以容易地将此新的预测模式引入到现有的(任意)标准中。选择标准SEL_F也可以改变。 
另一预测单元可以例如使用纹理合成。如果编码器侧识别出存在若干片(例如若干块)草地,那么可以使用仅采用(例如通常不具有残留更新)合成生成的草地的比较标准或预测。这然后可以被选择为与例如时间预测相比之下最佳的质量/压缩区域。然后,解码器同样应用草地生成(其甚至不需要接收那个区域的时间预测信息)。所有类型的改进的预测均可由预测单元PR_UN生成,例如通过将某种图像变换(例如锐化或平滑)应用到一些图像数据上(或者将两种不同的去交织算法应用到最后两个最不准确的时间预测存储器中,于是,所述时间预测存储器例如采用时间预测来形成竞争预测)或者3D模型(例如从几个时间序列图像中生成)等。 
也可以通过例如在SEI中的标准化的压缩图像信号来传输这样的同步数据。 
本发明还体现在任何用于根据本发明的方法或设备的计算机程序产品中。计算机程序产品应当被理解为命令集的任何物理实现,该命令集允许通用或专用处理器在使命令进入该处理器的一系列加载步骤(所述加载步骤可以包括中间转换步骤,例如翻译到中间语言,以及最终的处理器语言)之后执行本发明的任何特征功能。特别地,所述计算机程序产品可以被实现为载体(例如磁盘或磁带)上的数据、存在于存储器 中的数据、(有线或无线)网络连接上传输的数据或者纸上的程序代码。除了程序代码,程序所需的特征数据也可以实现为计算机程序产品。 
应当注意的是,上述实施例是用于说明本发明而不是用于限制本发明的,本领域技术人员应当能够在不偏离所附权利要求的范围的情况下设计出许多可替代的实施例。 
在权利要求中,任何位于括号之间的附图标记都不应被解释为对权利要求的限制。 
应当清楚的是,在本发明的框架内可以做出许多变型。本领域技术人员应当理解,本发明并不限于以上特定示出和说明的内容。本发明存在于每一个新颖的特有特征以及特有特征的每一种组合中。权利要求中的附图标记并不限制权利要求的保护范围。 
例如,所述方法可以仅用于图像的一部分,或者本发明的方法的不同实施例可以用于图像的不同部分,例如将一个实施例用于图像的中心,而将另一实施例用于图像的边缘。 
动词“包括”及其变体的使用不排除未在权利要求中列出的元件的存在。元件之前的冠词“一”的使用不排除多个这样的元件的存在。 
本发明针对帧进行了说明。在本发明的框架内,如果例如在帧的一部分上(例如仅在视频的中间部分或者仅在视频的前景部分)执行了根据本发明的方法,那么“帧”可以是帧的一部分。 

Claims (19)

1.对视频信号进行编码的方法,其中执行图像压缩,其中对于该视频信号在增强流编码器(3)中编码增强流而在基本流编码器(2)中编码基本流,并且在所述增强流编码器(3)中使用多个时间预测,其中将多个预测帧存储在增强流编码器(3)的存储器(5)中,其中采用来自基本流编码器(2)的帧(4)来覆写增强流编码器(3)的所述存储器(5)中的时间预测帧(Rn-1)。
2.根据权利要求1所述的方法,其中所述被覆写的预测帧为在存储器中最久的预测帧中的一个或多个。
3.根据权利要求1所述的方法,其中来自所述基本流编码器(2)的帧(4)被扩展/去交织。
4.根据权利要求1所述的方法,其中增强流的帧率与基本流的帧率的差异倍数不为2。
5.对视频信号进行解码的方法,该视频信号包括增强流和基本流,其中在增强流解码器(3′)中解码增强流而在基本流解码器(2′)中解码基本流,并且在所述增强流解码器(3′)中使用多个时间预测,其中执行图像压缩,并且其中多个预测帧被存储在增强流解码器(3′)的存储器(5′)中,其中采用来自基本流解码器(2’)的帧(4′)来覆写增强流解码器(3’)的存储器(5′)中的时间预测帧(Rn-1)。
6.根据权利要求5所述的方法,其中所述被覆写的预测帧为在存储器中最久的预测帧中的一个或多个。
7.根据权利要求5所述的方法,其中来自所述基本流解码器的帧被扩展/去交织。
8.根据权利要求1或5所述的方法,其中执行可扩缩的压缩。
9.根据权利要求5所述的方法,其中增强流的帧率与基本流的帧率的差异倍数不为2。
10.用于将视频信号生成增强流和基本流的编码器,包括增强流编码器(3)和基本流编码器(2),其中执行图像压缩,其中该编码器被设置用于生成多个时间预测并且将所述多个时间预测存储在增强流编码器(3)的存储器(5)中,其中该编码器被设置为采用来自基本流编码器(2)的帧(4)来覆写增强流编码器(3)的存储器(5)中的时间预测帧(Rn-1)。
11.根据权利要求10所述的编码器,其中该编码器被设置为覆写在存储器中最久的预测帧中的一个或多个。
12.根据权利要求10所述的编码器,其中该编码器具有用于对来自所述基本流编码器(2)的帧进行扩展/去交织的装置。
13.根据权利要求10所述的编码器,其中增强流的帧率与基本流的帧率的差异倍数不为2。
14.根据权利要求10所述的编码器,其中该编码器被设置为用于可扩缩的压缩。
15.用于压缩的视频信号的解码器,该压缩的视频信号包括基本流和增强流,该解码器包括基本流解码器(2′)和增强流解码器(3′),其中所述增强流解码器(3′)被设置为用于生成多个时间预测并且将所述多个时间预测存储在该增强流解码器(3′)中的存储器(5’)中,其中所述解码器被设置为采用来自基本流解码器(2’)的帧(4′)来覆写增强流解码器(3’)中的存储器(5′)中的时间预测帧(Rn-1)。
16.根据权利要求15所述的解码器,其中该解码器被设置为覆写在存储器中最久的一个或多个预测帧。
17.根据权利要求15所述的解码器,其中该解码器具有对来自所述基本流解码器(2’)的帧进行扩展/去交织的装置。
18.根据权利要求15所述的解码器,其中增强流的帧率与基本流的帧率的差异倍数不为2。
19.根据权利要求15所述的解码器,其中该解码器被设置为用于对可扩缩的压缩的视频信号进行解码。
CN200880002202.2A 2007-01-12 2008-01-04 对视频信号进行编码的方法和系统、编码的视频信号、对视频信号进行解码的方法和系统 Active CN101584220B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP07100470A EP1944978A1 (en) 2007-01-12 2007-01-12 Method and system for encoding a video signal. encoded video signal, method and system for decoding a video signal
EP07100470.9 2007-01-12
PCT/IB2008/050014 WO2008084417A2 (en) 2007-01-12 2008-01-04 Method and system for encoding a video signal, encoded video signal, method and system for decoding a video signal

Publications (2)

Publication Number Publication Date
CN101584220A CN101584220A (zh) 2009-11-18
CN101584220B true CN101584220B (zh) 2014-09-17

Family

ID=38091743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880002202.2A Active CN101584220B (zh) 2007-01-12 2008-01-04 对视频信号进行编码的方法和系统、编码的视频信号、对视频信号进行解码的方法和系统

Country Status (7)

Country Link
US (1) US8571101B2 (zh)
EP (2) EP1944978A1 (zh)
JP (1) JP5508024B2 (zh)
CN (1) CN101584220B (zh)
ES (1) ES2572885T3 (zh)
PL (1) PL2105028T3 (zh)
WO (1) WO2008084417A2 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011091301A1 (en) * 2010-01-21 2011-07-28 General Instrument Corporation Full resolution stereoscopic video with 2d backward compatible signal
CN102986214A (zh) 2010-07-06 2013-03-20 皇家飞利浦电子股份有限公司 从低动态范围图像生成高动态范围图像
EP2636222A1 (en) 2010-11-04 2013-09-11 Koninklijke Philips Electronics N.V. Generation of depth indication maps
JP6070692B2 (ja) * 2012-03-30 2017-02-01 ソニー株式会社 画像処理装置および方法、並びに、プログラム
US10085017B2 (en) * 2012-11-29 2018-09-25 Advanced Micro Devices, Inc. Bandwidth saving architecture for scalable video coding spatial mode
EP2772189A1 (en) * 2013-02-28 2014-09-03 Koninklijke Philips N.V. Apparatus and method for determining vital sign information from a subject
MX382207B (es) 2015-08-19 2025-03-13 Sony Corp Dispositivo de transmision, metodo de transmision, dispositivo de recepcion y metodo de recepcion.
JP6157548B2 (ja) 2015-09-25 2017-07-05 株式会社コンテック 監視画像の作成装置、作成プログラムおよび作成方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1440623A (zh) * 2000-05-15 2003-09-03 诺基亚有限公司 视频编码
CN1685731A (zh) * 2002-09-27 2005-10-19 皇家飞利浦电子股份有限公司 可分级视频编码

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3501521B2 (ja) * 1994-11-07 2004-03-02 三菱電機株式会社 ディジタル映像信号再生装置および再生方法
JP3347954B2 (ja) * 1995-11-02 2002-11-20 三菱電機株式会社 動画像符号化装置及び動画像復号化装置
US5909224A (en) * 1996-10-18 1999-06-01 Samsung Electronics Company, Ltd. Apparatus and method for managing a frame buffer for MPEG video decoding in a PC environment
US6731811B1 (en) * 1997-12-19 2004-05-04 Voicecraft, Inc. Scalable predictive coding method and apparatus
US7266150B2 (en) * 2001-07-11 2007-09-04 Dolby Laboratories, Inc. Interpolation of video compression frames
CN1253008C (zh) * 2001-10-26 2006-04-19 皇家飞利浦电子股份有限公司 空间可分级压缩的方法和设备
JP2003299103A (ja) * 2002-03-29 2003-10-17 Toshiba Corp 動画像符号化方法と装置及び動画像復号化方法と装置
US7145948B2 (en) * 2002-05-29 2006-12-05 Koninklijke Philips Electronics N.V. Entropy constrained scalar quantizer for a Laplace-Markov source
JP4562999B2 (ja) * 2002-07-11 2010-10-13 パナソニック株式会社 画像復号化方法および画像復号化装置
TWI268715B (en) * 2004-08-16 2006-12-11 Nippon Telegraph & Telephone Picture encoding method, picture decoding method, picture encoding apparatus, and picture decoding apparatus
US7728878B2 (en) * 2004-12-17 2010-06-01 Mitsubishi Electric Research Labortories, Inc. Method and system for processing multiview videos for view synthesis using side information
US7995656B2 (en) * 2005-03-10 2011-08-09 Qualcomm Incorporated Scalable video coding with two layer encoding and single layer decoding
US8208564B2 (en) * 2005-06-24 2012-06-26 Ntt Docomo, Inc. Method and apparatus for video encoding and decoding using adaptive interpolation
US20070230564A1 (en) * 2006-03-29 2007-10-04 Qualcomm Incorporated Video processing with scalability

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1440623A (zh) * 2000-05-15 2003-09-03 诺基亚有限公司 视频编码
CN1685731A (zh) * 2002-09-27 2005-10-19 皇家飞利浦电子股份有限公司 可分级视频编码

Also Published As

Publication number Publication date
JP2010516138A (ja) 2010-05-13
ES2572885T3 (es) 2016-06-02
CN101584220A (zh) 2009-11-18
EP2105028A2 (en) 2009-09-30
JP5508024B2 (ja) 2014-05-28
US20100014585A1 (en) 2010-01-21
EP1944978A1 (en) 2008-07-16
PL2105028T3 (pl) 2016-09-30
US8571101B2 (en) 2013-10-29
WO2008084417A2 (en) 2008-07-17
EP2105028B1 (en) 2016-03-30
WO2008084417A3 (en) 2008-09-04

Similar Documents

Publication Publication Date Title
CN101584220B (zh) 对视频信号进行编码的方法和系统、编码的视频信号、对视频信号进行解码的方法和系统
TWI690201B (zh) 全方位視訊之解碼方法、編碼方法及電子設備
CN101204094B (zh) 可缩放地编码和解码视频信号的方法
EP3700213B1 (en) Method and apparatus for encoding or decoding an image with inter layer motion information prediction according to motion information compression scheme
CN1738434B (zh) 用于3d子带编码的嵌入式基层编解码器
KR100888962B1 (ko) 영상 신호의 인코딩 및 디코딩 방법
CN101742321B (zh) 基于图层分解的视频编、解码方法及装置
US20180124414A1 (en) Video encoding using hierarchical algorithms
CN102595135B (zh) 一种可伸缩视频编码的方法及装置
CN105308966A (zh) 视频编码方法及其设备以及视频解码方法及其设备
CN105850133A (zh) 用于下一代视频译码的内容自适应主运动补偿预测
CN107005705B (zh) 使用层间预测对多层图像进行编码或解码的方法和装置
MX2008002391A (es) Metodo y aparato para codificar video de vistas multiples.
CN101341757B (zh) 本地宏块信息缓冲器
CN101404766A (zh) 一种多视点视频信号的编码方法
US20230276063A1 (en) Npu for encoding or decoding videostream format for machine analisys
CN103716629A (zh) 用于图像处理的方法、装置编码器和解码器
KR101386651B1 (ko) 다시점 비디오 인코딩 및 디코딩 방법 및 이를 이용한 인코딩 및 디코딩 장치
CN101895744B (zh) 处理多视图视频
US20240414363A1 (en) Npu and decoder capable of transceiving feature map
CN102474616A (zh) 用于生成、解码和转码经编码的视频数据流的方法和装置
US11831887B1 (en) Scalable video coding for machine
CN101917616A (zh) 用于数字编码3d立体视频图像的方法和系统
CN107071404A (zh) 对具有多个图像的图像序列进行编码的方法及设备
JPH11122609A (ja) 画像圧縮

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant