[go: up one dir, main page]

CN101816180B - 利用多个视图间参考画面的运动跳跃模式的方法和装置 - Google Patents

利用多个视图间参考画面的运动跳跃模式的方法和装置 Download PDF

Info

Publication number
CN101816180B
CN101816180B CN2008801100813A CN200880110081A CN101816180B CN 101816180 B CN101816180 B CN 101816180B CN 2008801100813 A CN2008801100813 A CN 2008801100813A CN 200880110081 A CN200880110081 A CN 200880110081A CN 101816180 B CN101816180 B CN 101816180B
Authority
CN
China
Prior art keywords
inter
view reference
reference picture
view
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008801100813A
Other languages
English (en)
Other versions
CN101816180A (zh
Inventor
田冬
珀文·B·潘迪特
尹澎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Digital Madison Patent Holding SAS
Original Assignee
THOMSON LICENSING CORP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40085663&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN101816180(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by THOMSON LICENSING CORP filed Critical THOMSON LICENSING CORP
Publication of CN101816180A publication Critical patent/CN101816180A/zh
Application granted granted Critical
Publication of CN101816180B publication Critical patent/CN101816180B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了利用多个视图间参考画面的运动跳跃模式的方法和装置。一种装置包括编码器,所述编码器用于通过对与多视图视频内容相关的图像块执行以下选择中的至少一个来对所述图像块编码,所述选择包括:从视图间参考画面列表集合中选择视图间参考画面列表、从视图间参考画面集合中选择视图间参考画面、以及从视差矢量集合中选择对应于该视图间参考画面的视差矢量。所述编码器基于视图间参考画面列表、视图间参考画面和视差矢量中的至少一个来提取所述图像块的运动信息。

Description

利用多个视图间参考画面的运动跳跃模式的方法和装置
对相关申请的交叉引用
本申请要求于2007年8月6日提交的美国临时申请序列号第60/954,256号的权益,在此通过引用而整体并入所述申请。
技术领域
本发明一般地涉及视频编码和解码,并且更具体地涉及利用多个视图间(inter-view)参考画面的运动跳跃(motion skip)模式的方法和装置。
背景技术
运动跳跃是通过重新使用来自当前宏块的邻近参考视图的一些宏块信息对该当前宏块解码的编码工具。可以使用的这样的宏块信息例如包括:模式、运动矢量、参考画面索引(index)以及参考画面列表。因为跳过当前宏块的与运动相关的信息,所以基于邻近视图中的画面很可能显示一致的时间上的运动的这一事实,实现一些编码的益处(gain)。
多视图视频编码(MVC)允许多个视图间参考画面。但是,对于多视图视频编码,未指定怎样实施运动跳跃模式,诸如例如选择哪个视图和哪个块来提取运动信息。
在第一现有技术方法中提出了用于多视图视频编码的运动跳跃模式。为了利用邻近视图之间的运动相似性,从对应于相同的时间事件(instance)的邻近视图画面中的对应的宏块推断(infer)运动信息。指定视差(disparity)矢量以定位邻近视图中的对应的宏块。稍后,在第二现有技术方法中简化了所提出的该模式。在第三现有技术方法中提出的又一模式通过自适应地在列表0和列表1之间选择画面来获得对应的宏块而提高了编码效率。在第三现有技术方法中提出的该模式中,引入附加的语法元素来标识(signal)应当使用哪个列表来获得对应的宏块。
对于第一现有技术方法,应当注意,总是从紧邻的视图获得运动信息。即使在使用多个视图间参考画面时,也不选择除紧邻的视图之外的其他视图来提供运动信息。这可能限制运动跳跃模式的性能的能力。例如,如果以帧内模式来编码紧邻的视图中的对应的宏块,则不能够从紧邻的视图导出任何运动信息。
发明内容
由本原理来处理现有技术的这些和其他缺陷和缺点,本原理针对用于利用多个视图间参考画面的运动跳跃模式的方法和装置。
根据本原理的一方面,提供了一种装置。该装置包括编码器,所述编码器用于通过对与多视图视频内容相关的图像块执行以下选择中的至少一个来对所述图像块编码,所述选择包括:从视图间参考画面列表集合中选择视图间参考画面列表、从视图间参考画面集合中选择视图间参考画面、以及从视差矢量集合中选择对应于该视图间参考画面的视差矢量。所述编码器基于视图间参考画面列表、视图间参考画面和视差矢量中的至少一个来提取所述图像块的运动信息。
根据本原理的另一方面,提供了一种方法。该方法包括对与多视图视频内容相关的图像块编码。所述编码步骤包括对于所述图像块执行以下选择中的至少一个,所述选择包括:从视图间参考画面列表集合中选择视图间参考画面列表、从视图间参考画面集合中选择视图间参考画面、以及从视差矢量集合中选择对应于该视图间参考画面的视差矢量。所述编码步骤还包括基于视图间参考画面列表、视图间参考画面和视差矢量中的至少一个来提取所述图像块的运动信息。
根据本原理的又一方面,提供了一种装置。该装置包括解码器,所述解码器用于通过对与多视图视频内容相关的图像块执行以下选择中的至少一个来对所述图像块解码,所述选择包括:从视图间参考画面列表集合中选择视图间参考画面列表、从视图间参考画面集合中选择视图间参考画面、以及从视差矢量集合中选择对应于该视图间参考画面的视差矢量。所述解码器基于视图间参考画面列表、视图间参考画面和视差矢量中的至少一个来提取所述图像块的运动信息。
根据本原理的再一方面,提供了一种方法。该方法包括对与多视图视频内容相关的图像块解码。所述解码步骤包括对所述图像块执行以下选择中的至少一个,所述选择包括:从视图间参考画面列表集合中选择视图间参考画面列表、从视图间参考画面集合中选择视图间参考画面、以及从视差矢量集合中选择对应于该视图间参考画面的视差矢量。所述解码步骤还包括基于视图间参考画面列表、视图间参考画面和视差矢量中的至少一个来提取所述图像块的运动信息。
从对示例实施例的以下详细描述中,本原理的这些和其他方面、特征和优点将变得明显,应当联系附图阅读以下详细描述。
附图说明
根据以下示例附图,可以更好地理解本原理,其中:
图1为根据本原理的实施例的、可以应用本原理的示例的多视图视频编码(MVC)编码器的框图;
图2为根据本原理的实施例的、可以应用本原理的示例的多视图视频编码(MVC)解码器的框图;
图3为根据本原理的实施例的、用于使用运动跳跃模式对多个参考进行编码的示例方法的高层流程图;
图4为根据本原理的实施例的、用于使用运动跳跃模式对多个参考进行解码的示例方法的高层流程图;
图5为根据本原理的实施例的、用于使用运动跳跃模式对多个视图间参考进行编码的另一示例方法的流程图;
图6为根据本原理的实施例的、用于使用运动跳跃模式对多个视图间参考进行解码的另一示例方法的流程图;
图7为示出根据本原理的实施例的、可以应用本原理的空间相邻宏块的图;
图8为根据本原理的实施例的、用于使用运动跳跃模式对多个视图间参考进行编码的又一示例方法的流程图;
图9为根据本原理的实施例的、用于使用运动跳跃模式对多个视图间参考进行解码的又一示例方法的流程图;
图10为根据本原理的实施例的、用于使用运动跳跃模式对多个视图间参考进行编码的再一示例方法的流程图;
图11为根据本原理的实施例的、用于使用运动跳跃模式对多个视图间参考进行解码的再一示例方法的流程图;
图12为根据本原理的实施例的、用于使用运动跳跃模式对多个视图间参考进行编码的进一步的示例方法的流程图;
图13为根据本原理的实施例的、用于使用运动跳跃模式对多个视图间参考进行解码的进一步的示例方法的流程图;
具体实施方式
本原理针对用于利用多个视图间参考画面的运动跳跃模式的方法和装置。
本描述阐释了本原理。因而应当理解,本领域技术人员将能够设计出虽然未在这里显式地描述或示出、但体现本原理并被包括在其精神和范围内的各种布置。
在这里所叙述的全部例子和条件性(conditional)语言意图在于辅助读者理解本原理和由(多个)发明人为发展本领域而贡献的构思的教学目的,并且应当被理解为不限于这样的具体叙述的例子和条件。
此外,在这里叙述本原理的原理、方面和实施例的全部陈述,以及其具体例子,意图包括其结构性和功能性等效物的两者。另外,这样的等效物意图包括当前已知的等效物以及在将来开发的等效物,即,所开发的、无论结构如何但执行相同的功能的任何元件。
因而,例如,本领域技术人员将理解,在这里所呈现的框图表示体现本原理的阐释性电路的概念视图。相似地,将理解,任何流程表、流程图、状态转换图、伪码等表示可以在计算机可读介质中实质性地表示、并且由计算机或处理器如此执行的各种处理,而无论这样的计算机或处理器是否被显式地示出。
可以通过使用专用硬件以及能够与恰当的软件相关联而执行软件的硬件来提供图中所示的各种元件的功能。在由处理器提供时,可以由单个专用处理器、由单个共享处理器、或由多个单独的处理器(其中的一些可以被共享)来提供所述功能。此外,术语“处理器”或“控制器”的显式使用不应被理解为排他性地指能够执行软件的硬件,而可以隐式地包括但不限于数字信号处理器(“DSP”)硬件、用于存储软件的只读存储器(“ROM”)、随机存取存储器(“RAM”)和非易失性存储装置。
还可以包括传统的和/或定制的(custom)其他硬件。相似地,图中所示的任何开关都仅仅是概念性的。可以通过程序逻辑的操作、通过专用逻辑、通过程序控制和专用逻辑的交互、或甚至手动地执行它们的功能,如同从情境中更具体地理解的那样,具体的技术可由实施者选择。
在权利要求中,被表达为用于执行所指定的功能的部件的任何元件意图包括执行该功能的任何方式,所述任何方式例如包括:a)执行该功能的电路元件的组合或b)因此包括固件、微代码(microcode)等的任何形式的软件与用于执行该软件的恰当的电路组合以执行该功能。如同由这样的权利要求所限定的本原理存在于以下事实:以权利要求所要求的方式将由所叙述的各种部件所提供的功能组合并放在一起。因而认为可以提供那些功能的任何部件与这里所示出的那些部件等效。
本说明书中对本原理的“一个实施例”或“实施例”的引用意味着在本原理的至少一个实施例中包括与实施例相关联地描述的具体的特点、结构、特征等。因而,贯穿本说明书各个位置出现的短语“在一个实施例中”或“在实施例中”的出现不一定全部指相同的实施例。
应当理解,例如在“A和/或B”以及“A和B中的至少一个”的情况中的用语“和/或”以及“中的至少一个”的使用意图包括仅仅对所列的第一选项(A)的选择、或仅仅对所列的第二选项(B)的选择、或对两个选项(A和B)的选择。作为进一步的例子,在“A、B和/或C”以及“A、B和C中的至少一个”的情况中,这样的措辞意图包括仅仅对所列的第一选项(A)的选择、或仅仅对所列的第二选择(B)的选择、或仅仅对所列的第三选项(C)的选择、或仅仅对所列的第一和第二选项(A和B)的选择、或仅仅对所列的第一和第三选项(A和C)的选择、或仅仅对所列的第二和第三选项(B和C)的选择、或对全部三个选项(A和B和C)的选择。如同对于本领域和相关领域中的普通技术人员来说易于明白的是,可以对于所列出的许多条目扩展该措辞。
进一步地,如在这里可互换地使用的,“跨视图”和“视图间”都指属于除当前视图之外的视图的画面。
同样,如这里所使用的,短语“高层”指分层级地驻留在宏块层之上的层。例如,如这里所使用的那样,高层可以指、但不限于码片(slice)首部(header)层、补充增强信息(SEI)层、画面参数集(PPS)层、序列参数集(SPS)层和网络抽象层(NAL)单元首部层。
转向图1,由参考标号100一般地指示示例多视图视频编码(MVC)编码器。编码器100包括组合器105,其具有与变换器110的输入端信号通信地连接的输出端。变换器110的输出端与量化器115的输入端信号通信地连接。量化器115的输出端与熵编码器120的输入端和逆量化器125的输入端信号通信地连接。逆量化器125的输出端与逆变换器130的输入端信号通信地连接。逆变换器130的输出端与组合器135的第一非反相输入端信号通信地连接。组合器135的输出端与帧内预测器145输入端和去块滤波器150的输入端信号通信地连接。去块滤波器150的输出端与参考画面存储装置155(用于视图i)的输入端信号通信地连接。参考画面存储装置155的输出端与运动补偿器175的第一输入端和运动估算器180的第一输入端信号通信地连接。运动估算器180的输出端与运动补偿器175的第二输入端信号通信地连接。
参考画面存储装置160(用于其他视图)的输出端与视差估算器170的第一输入端和视差补偿器165的第一输入端信号通信地连接。视差估算器170的输出端与视差补偿器165的第二输入端信号通信地连接。
熵解码器120的输出端可用于编码器100的输出端。组合器105的非反相输入端可用于编码器100的输入端,并且与视差估算器170的第二输入端和运动估算器180的第二输入端信号通信地连接。开关185的输出端与组合器135的第二非反相输入端和组合器105的反相输入端信号通信地连接。开关185包括与运动补偿器175的输出端信号通信地连接的第一输入端、与视差补偿器165的输出端信号通信地连接的第二输入端、以及与帧内预测器145的输出端信号通信地连接的第三输入端。
模式决定模块140具有与开关185连接的输出端,该输出端用于控制开关185选择哪个输入端。
转向图2,由参考标号200一般地指示示例多视图视频编码(MVC)解码器。解码器包括熵解码器205,其具有与逆量化器210的输入端信号通信地连接的输出端。逆量化器210的输出端与逆变换器215的输入端信号通信地连接。逆变换器215的输出端与组合器220的第一非反相输入端信号通信地连接。组合器220的输出端与去块滤波器225的输入端和帧内预测器230的输入端信号通信地连接。去块滤波器225的输出端与参考画面存储装置240(用于视图i)的输入端信号通信地连接。参考画面存储装置240的输出端与运动补偿器235的第一输入端信号通信地连接。
参考画面存储装置245(用于其他视图)的输出端与视差补偿器250的第一输入端信号通信地连接。
熵编码器205的输入端可用于解码器200的输入端来接收残留(residue)比特流。此外,模式模块260的输入端也可用于解码器200的输入端来接收控制语法以控制开关255选择哪个输入端。进一步地,运动补偿器235的第二输入端可用于解码器200的输入端来接收运动矢量。并且,视差补偿器250的第二输入端可用于解码器200的输入端来接收视差矢量语法。
开关255的输出端与组合器220的第二非反相输入端信号通信地连接。开关255的第一输入端与视差补偿器250的输出端信号通信地连接。开关255的第二输入端与运动补偿器235的输出端信号通信地连接。开关255的第三输入端与帧内预测器230的输出端信号通信地连接。模式模块260的输出端与开关255信号通信地连接,用于控制开关255选择哪个输入端。去块滤波器225的输出端可用于解码器的输出端。
如上所述,本原理针对用于利用多个视图间参考画面的运动跳跃模式的方法和装置。
根据本原理的一个或更多的实施例,我们提出在上述的第一现有技术参考中所提出的运动跳跃模式进行扩展和修改。该扩展和修改可用于多个视图间参考画面的情况。
为了识别每个视图间参考画面中的对应的宏块,为视图间参考画面和当前画面的每一对指定视差矢量。该信令(signaling)可以处于宏块层、码片层、画面层、画面组(GOP)层、和/或序列层(例如序列参数集(SPS)层)。例如,可以只对锚点(anchor)画面在码片首部中指定视差矢量,而非锚点画面可以基于与锚点画面的距离以某些方式导出它们的视差矢量,或可以简单地使用来自最近(last)解码的锚点画面的视差值。另一例子涉及在补充增强信息(SEI)消息中封装视差矢量,并且将视差矢量与画面相关联。表1示出了对视图间参考画面和当前画面的每一对标识一个全局视差矢量的例子。
表1
slice_header_mvc_extension(){   C   描述符
   first_mb_in_slice   2   ue(v)
   slice_type   2   ue(v)
   ic_enable   2   u(1)
   if(anchor_pic_flag){
     if(slice_type==P||slice_type==B){
        for(i=0;i<num_non_anchor_refs_l0[CurrVlewld];i++)
           for(compldx=0;compldx<2;compldx++)
              global_disparity_mb_l0[i][compldx]   2   se(v)
     }
     if((slice_type==B){
        for(i=0;i<num_non_anchor_refs_l1[CurrViewld];i++)
           for(compldx=0;compldx<2;compldx++)
              global_disparity_mb_l1[i][compldx]   2   se(v)
     }
}
   pic_parameter_set_id   2   ue(v)
   frame_num   2   u(v)
   …
}
在利用运动跳跃模式对宏块解码时,我们需要确定将选择哪个候选的视差矢量(以及其关联的视图间参考画面)来提取运动信息。据此,在这里提供四个示例实施例,其描述怎样在运动跳跃模式的情境中处理多个视图间参考。但是,应当理解,本原理不仅仅限于这里所描述的四个实施例,并且给定这里所提供的本原理的教导,本领域和相关领域的技术人员在保持本原理的精神的情况下,将设想到这些和其他各种实施例以及其变型。
转向图3,由参考标号300一般地指示用于利用多个视图间参考画面的运动跳跃模式的示例编码方法。
方法300包括开始块305,其向功能块310传递控制。功能块310对于将被编码的当前宏块检查传统编码模式,将最佳编码模式和开销(cost)保存在MODEbest和Costbest,并且向功能块315传递控制。功能块315在视图间参考列表中执行选择,并且向功能块320传递控制,所述选择被指定为List_x。功能块320在视图间参考画面中执行选择,并且向功能块325传递控制,所述选择被指定为Ref_x。功能块325在视差矢量中执行选择,并且向功能块330传递控制,所述选择被指定为Dv_x。功能块330基于所选择的List_x、Ref_x和Dv_x定位对应的宏块(关于当前宏块的),并且向功能块335传递控制。功能块335从对应的宏块提取运动信息,并且向功能块340传递控制。功能块340取得运动跳跃模式的编码开销,并且向功能块345传递控制,所述编码开销被指定为CostMS。功能块345更新最佳运动跳跃开销,并且向决定块350传递控制,所述最佳运动跳跃开销被指定为CostMS_best。决定块350确定是否还存在要检查的视差矢量。如果是,则向功能块325返回控制。否则,向决定块355传递控制。
决定块355确定是否还存在要检查的视图间参考画面。如果是,则向功能块320返回控制。否则,向决定块360传递控制。决定块360确定是否还存在要检查的视图间参考列表。如果是,则向功能块315返回控制。否则,向决定块365传递控制。决定块365确定CostMS_best是否小于Costbest。如果是,则向功能块370传递控制。否则,向功能块375传递控制。
功能块370利用运动跳跃模式(其中显式地标识List_x、Ref_x和Dv_x)编码宏块,并且向结束块399传递控制。
功能块375利用MODEbest编码宏块,并且向结束块399传递控制。
转向图4,由参考标号400一般地指示用于利用多个视图间参考画面的运动跳跃模式的示例解码方法。
方法400包括开始块405,其向功能块410传递控制。功能块410解析宏块的语法(其可能隐式地或被显式地标识),并且向决定块415传递控制。决定块415确定是否在使用运动跳跃模式。如果是,则向功能块420传递控制。否则,向功能块455传递控制。
功能块420按照所解析的语法在视图间参考列表中执行选择,并且向功能块425传递控制。功能块425按照所解析的语法在视图间参考画面中执行选择,并且向功能块430传递控制。功能块430按照所解析的语法在视差矢量中执行选择,并且向功能块440传递控制。功能块440基于在功能块420、425和430中的选择来定位对应的宏块,并且向功能块445传递控制。功能块445从对应的宏块提取运动信息,并且向功能块450传递控制。功能块450使用所提取的运动信息继续对该宏块解码,并且向结束块499传递控制。
功能块455利用正常的(即非运动跳跃)编码模式对该宏块解码,并且向结束块499传递控制。
现在将描述针对用于在运动跳跃模式的情境中处理多个视图间参考的方法的第一示例实施例。
在第一实施例中,仅仅发送对应于当前视图的最接近的视图间参考的全局视差矢量。这里,假定将参考来自列表0和列表1(当可用时)的最接近的视图画面,如在高层所标识的,为当前视图导出来自视图间参考画面的运动信息。如果列表0中的对应的宏块是帧内宏块,则检查列表1(当可用时)并且如果对应的MB不是帧内宏块,则使用列表1。在列表0和列表1都存在并且都不是帧内编码的情况下,假定列表0具有比列表1更高的优先级。如果两个列表都具有帧内宏块,则不选择运动跳跃模式。
转向图5,由参考标号500一般地指示用于使用运动跳跃模式来编码多个视图间参考的另一示例方法。
方法500包括开始块505,其向功能块510传递控制。功能块510在传统模式中寻找具有Costmin的最佳编码模式MODEbest,并且向决定块515传递控制。决定块515确定当前宏块是否位于P或B码片内。如果是,则向功能块520传递控制。否则,向功能块565传递控制。
功能块520取得在高层处标识的全局视差矢量,并且向功能块525传递控制。功能块525使用该全局视差矢量从列表0中识别最接近的视图间参考中的对应的宏块,并且向决定块530传递控制。决定块530确定对应的宏块(由功能块525识别的)是否是帧内宏块。如果是,则向功能块535传递控制。否则,向功能块545传递控制。
功能块535使用该全局视差矢量从列表1中识别最接近的视图间参考中的对应的宏块,并且向决定块540传递控制。决定块540决定对应的宏块(由功能块535识别的)是否是帧内宏块。如果是,则向功能块565传递控制。否则,向功能块545传递控制。
功能块565利用MODEbest对宏块编码,并且向结束块599传递控制。
功能块545提取运动信息,使用该运动信息来寻找对应的宏块,并且向功能块550传递控制。功能块550利用运动跳跃模式(MODEms)取得速率-失真(RD)开销(Costms),并且向决定块555传递控制。决定块555确定Costms是否小于Costmin。如果是,则向功能块560传递控制。否则,向功能块565传递控制。
功能块560将MODEbest设置为MODEms,并且向功能块565传递控制。
转向图6,由参考标号600一般地指示用于使用运动跳跃模式来对多个视图间参考解码的另一示例方法。
方法600包括开始块605,其向决定块610传递控制。决定块610确定当前宏块是否位于P码片或B码片内。如果是,则向决定块615传递控制。否则,向功能块650传递控制。
决定块615确定是否标识了运动跳跃模式。如果是,则向功能块620传递控制。否则,向功能块650传递控制。
功能块620取得高层处标识的全局DV,并且向功能块625传递控制。功能块625使用该全局视差矢量从列表0中识别最接近的视图间参考中的对应的宏块,并且向决定块630传递控制。决定块630确定对应的宏块是否是帧内宏块。如果是,则向功能块635传递控制。否则向功能块645传递控制。
功能块635使用该全局视差矢量从列表1中识别最接近的视图间参考中的对应的宏块,并且向决定块640传递控制。决定块640确定对应的宏块是否是帧内宏块。如果是,则向功能块655传递控制。否则,向功能块645传递控制。
功能块655使比特流无效(invalid),并且向结束块699传递控制。
功能块645提取运动信息并且使用它来进一步对当前宏块解码,并且向功能块650传递控制。
功能块650继续对当前宏块解码,并且向结束块699传递控制。
现在将描述针对用于在运动跳跃模式的情境中处理多个视图间参考的方法的第二示例实施例。
在第二实施例中,我们不在高层发送全局视差矢量,并且也不将运动跳跃模式限制为总是使用特定的参考。替代地,从空间相邻的宏块中导出参考。
转向图7,由参考标号700一般地指示空间相邻的宏块。具体地,由参考符号710(可交换地也由参考符号“A”指定)、720(可交换地也由参考符号“B”指定)和730(可交换地也由参考符号“C”指定)指示当前宏块的三个相邻的宏块,由参考标号780(可交换地也由参考符号“curr”指定)指示当前宏块。
如果存在一个并且来自A、B和C中的仅仅一个宏块使用视图间预测,那么我们选择参考画面并且选择其相关联的视差矢量作为用于当前宏块的视差矢量(DV)。该视差矢量(DV)其后被用于对运动跳跃模式获得来自视图间参考的对应的宏块。
如果存在来自A、B和C中的多于一个的宏块使用视图间预测,则我们选择具有最小参考索引的视图间参考画面及其相关联的视差矢量。进一步地,如果多于一个块共享相同的视图间参考画面,则来自对应的宏块的中间(median)视差矢量将用作当前宏块的视差矢量。在每种情况中,可以缩放(scale)视差矢量以使得它指向最近的宏块边界(boundary)。
如果A、B或C中没有使用视图间预测的块,则不选择运动跳跃模式。
转向图8,由参考标号800一般地指示使用运动跳跃模式对多个视图间参考编码的又一示例方法。
方法800包括开始块805,其向功能块810传递控制。功能块810在传统模式中寻找具有Costmin的最佳编码模式MODEbest,并且向决定块815传递控制。决定块815确定当前宏块是否位于P或B码片中。如果是,则向决定块820传递控制。否则,向功能块865传递控制。
决定块820确定是否存在使用视图间预测的邻近宏块。如果是,则向功能块870传递控制。否则,向功能块865传递控制。
功能块870在列表0中寻找具有最小参考索引的邻近宏块,并且向功能块825传递控制。
功能块825在列表0中选择视差矢量(DV)及其参考,以寻找对应的宏块,并且向决定块830传递控制。决定块830确定对应的宏块是否是帧内宏块。如果是,则向功能块875传递控制。否则,向功能块845传递控制。
功能块875在列表1中寻找具有最小参考索引的邻近宏块,并且向功能块835传递控制。功能块835在列表1中选择视差矢量(DV)及其参考,以寻找对应的宏块,并且向决定块840传递控制。决定块840确定对应的宏块是否是帧内宏块。如果是,则向功能块865传递控制。否则,向功能块845传递控制。
功能块845提取用于运动跳跃模式(MODEms)的运动信息,并且向功能块850传递控制。功能块850利用运动跳跃模式(MODEms)取得速率-失真(RD)开销(Costms),并且向决定块855传递控制。决定块855确定Costms是否小于Costmin。如果是,则向功能块860传递控制,否则,向功能块865传递控制。
功能块860将MODEbest设置为MODEms,并且向功能块865传递控制。功能块865利用MODEbest对宏块编码,并且向结束块899传递控制。
转向图9,由参考标号900一般地指示使用运动跳跃模式对多个视图间参考解码的又一示例方法。
方法900包括开始块905,其向决定决910传递控制。决定块910确定当前宏块是否位于P码片或B码片中。如果是,则向决定块915传递控制。否则,向功能块950传递控制。
决定块915确定是否标识了运动跳跃模式。如果是,则向决定块920传递控制。否则,向功能块950传递控制。
决定块920确定是否存在使用视图间预测的邻近宏块,如果是,则向功能块960传递控制。否则,向功能块955传递控制。
功能块955使比特流无效,并且向结束块999传递控制。
功能块960在列表0中寻找具有最小参考索引的邻近宏块,并且向功能块925传递控制。功能块925在列表0中选择视差矢量(DV)及其参考,以寻找对应的宏块,并且向决定块930传递控制。
决定块930确定对应的宏块是否是帧内宏块。如果是,则向功能块965传递控制。否则,向功能块945传递控制。
功能块965在列表1中寻找具有最小参考索引的邻近宏块,并且向功能块935传递控制。功能块935在列表1中选择视差矢量(DV)及其参考,以寻找对应的宏块,并且向决定块940传递控制。
决定块940确定对应的宏块是否是帧内宏块。如果是,则向功能块970传递控制。否则,向功能块945传递控制。
功能块970使比特流无效,并且向结束块999传递控制。
功能块945提取运动信息并且使用它来对当前宏块进一步解码,并且向功能块950传递控制。功能块950继续对当前宏块解码,并且向结束块999传递控制。
现在将描述针对用于在运动跳跃模式的情境中处理多个视图间参考的方法的第三示例实施例。
在第三实施例中,我们在高层处对当前视图的每个视图间参考画面发送全局视差矢量(GDV)。在一个实施例中,这可以如表1中所示只在锚点画面处标识。为了确定将使用哪个全局视差矢量,我们将从邻近宏块推断视图参考索引。在一个实施例中,从空间相邻的宏块中导出它。再次参考图7,示出了当前宏块的三个相邻的宏块。
令refViewIdxLXY指定由块Y使用的序列参数集(SPS)中的列表X中的对应的ViewIdx。如果块Y不使用视图间预测,则设置refViewIdxLXY=-1。输出是块Curr的refViewIdxLX。在实施例中,可以使用以下关联性:
refViewIdxL0=MinPositive(refViewIdxL0A,MinPositive(refViewIdxL0B,refViewIdxL0C))
refViewIdxL1=MinPositive(refViewIdxL1A,MinPositive(refViewIdxL1B,refViewIdxL1C))
其中
在refViewIdxL0和refViewIdxL1都小于0时,我们设置refViewIdxL0=0,refViewIdxL1=0。
如果refViewIdxLX中只有一个不小于0,则我们使用该列表来对运动跳跃模式获得来自视图间参考的对应的宏块。否则,应用以下规则:我们在列表0中寻找具有最小的参考索引的邻近的宏块,并且其参考索引被用于识别视图间参考画面并且然后用于定位对应的宏块。如果对应的宏块不是帧内编码的,则提取运动信息。但是,如果对应的宏块是帧内编码的,则我们尝试使用列表1来定位对应的宏块以及提取运动信息。
转向图10,由参考标号1000一般地指示使用运动跳跃模式对多个视图间参考编码的再一示例方法。
方法1000包括开始块1005,其向功能块1010传递控制。功能块1010在传统模式中寻找具有Costmin的最佳编码模式MODEbest,并且向决定块1015传递控制。决定块1015决定当前宏块是否位于P码片或B码片中。如果是,则向决定块1020传递控制。否则,向功能块1075传递控制。
决定块1020确定是否存在使用视图间预测的邻近宏块。如果是,则向功能块1035传递控制。否则,向功能块1075传递控制。
功能块1035在列表0中寻找具有最小参考索引的邻近宏块,并且向功能块1025传递控制。
功能块1025使用所识别的视图间参考画面以及所标识的全局视差矢量(DV)来寻找对应的宏块,并且向决定块1030传递控制。决定块1030确定对应的宏块是否是帧内宏块。如果是,则向功能块1040传递控制。否则,向功能块1055传递控制。
功能块1040在列表1中寻找具有最小参考索引的邻近宏块,并且向功能块1045传递控制。
功能块1045使用所识别的视图间参考画面以及所标识的全局视差矢量(DV)来寻找对应的宏块,并且向决定块1050传递控制。决定块1050确定对应的宏块是否是帧内宏块。如果是,则向功能块1075传递控制。否则,向功能块1055传递控制。
功能块1055提取用于运动跳跃模式(MODEms)的运动信息,并且向功能块1060传递控制。功能块1060利用运动跳跃模式(MODEms)取得速率-失真(RD)开销(Costms),并且向决定块1065传递控制。决定块1065确定Costms是否小于Costmin。如果是,则向功能块1070传递控制,否则,向功能块1075传递控制。
功能块1070将MODEbest设置为MODEms,并且向功能块1075传递控制。
功能块1075利用MODEbest对宏块编码,并且向结束块1099传递控制。
转向图11,由参考标号1100一般地指示使用运动跳跃模式对多个视图间参考解码的再一示例方法。
方法1100包括开始块1105,其向决定块1110传递控制。决定块1110确定当前宏块是否位于P码片或B码片中。如果是,则向决定块1115传递控制。否则,向功能块1150传递控制。
决定块1115确定是否标识了运动跳跃模式。如果是,则向决定块1120传递控制。否则,向功能块1150传递控制。
决定块1120确定是否存在使用视图间预测的邻近宏块,如果是,则向功能块1160传递控制。否则,向功能块1155传递控制。
功能块1155使比特流无效,并且向结束块1199传递控制。
功能块1160在列表0中寻找具有最小参考索引的邻近宏块,并且向功能块1125传递控制。
功能块1125使用在块1160中识别的邻近MB和在高层处标识的全局视差矢量中的一个所确定的视图间参考画面来定位对应的MB,并且向决定块1130传递控制。
决定块1130确定对应的宏块(在块1125中识别的)是否是帧内宏块。如果是,则向功能块1165传递控制。否则,向功能块1145传递控制。
功能块1165在列表1中寻找具有最小参考索引的邻近宏块,并且向功能块1135传递控制。
功能块1135使用在块1165中识别的邻近MB和在高层处标识的全局视差矢量中的一个所确定的视图间参考画面来定位对应的MB,并且向决定块1140传递控制。
决定块1140确定对应的宏块(在块1135中识别的)是否是帧内宏块。如果是,则向功能块1170传递控制。否则,向功能块1145传递控制。
功能块1170使比特流无效,并且向结束块1199传递控制。
功能块1145提取运动信息并使用它来进一步对当前宏块解码,并且向功能块1150传递控制。功能块1150继续对当前宏块解码,并且向结束块1199传递控制。
现在将描述针对用于在运动跳跃模式的情境中处理多个视图间参考的方法的第四示例实施例。
在第四实施例中,我们在高层处对当前视图的每个视图间参考画面发送全局视差矢量(GDV)。在一个例子中,这可以如表1中所示的,仅仅在锚点画面处标识。为了确定使用哪个全局视差矢量,对每个利用运动跳跃模式编码的宏块标识对应的全局视差矢量的索引。该模式提供更多的灵活性,并且使得编码器和/或解码器能够标识任何视图间参考,这导致更好的性能。表1和2阐释了根据本原理的一个或更多的实施例而提出的改变,其中CurrViewId是当前解码画面的view_id。所提出的语法的语义(semantics)如下:
在存在时,list_idx指示从哪个列表导出运动跳跃信息。list_idx等于0指示应当从列表0导出运动跳跃信息。list_idx等于1指示应当从列表1导出运动跳跃信息。在list_idx不存在时,将list_idx推断为0。
在存在时,gdv_idx指定列表0或列表1中将用于运动跳跃模式的全局视差矢量的索引。在gdv_idx不存在时,将gdv_idx推断为0。
表2
macroblock_layer(){   C   描述符
if(!anchor_pic_flag){
   motion_skip_flag   2   u(1)|ae(v)
   if(motion_skip_flag){
      if(num_non_anchor_refs_l1[CurrViewld]>0)
        list_idx   2   u(1)|ae(v)
      if(num_non_anchor_refs_l0[CurrViewld]>1‖num_non_anchor_refs_l1[CurrViewld]>1)
         gdv_idx   2   le(v)|ae(v)
   }
}
   if(!motion_skip_flag){
      mb_type   2   ue(v)|ae(v)
      if(mb_type==l_PCM){
         while(!byte_aligned())
           pcm_alignment_zero_bit   2   f(1)
         for(i=0;i<256;i++)
            pcm_sample_luma[i]   2   u(v)
         for(i=0;i<2*MbWidthC*MbHeightC;i++)
            pcm_sample_chroma[i]   2   u(v)
      }else{
         noSubMbPartSizeLessThan8×8Flag=1
         if(mb_type!=l_N×N & &MbPartPredMode(mb_type,0)!=lntra_16×16 & &NumMbPart(mb_type)==4){
            sub_mb_pred(mb_type)   2
            for(mbPartldx=0;mbPartldx<4;mbPartldx++)
              if(sub_mb_type[mbPartldx]!=B_Direct_8×8){
                 if(NumSubMbPart(sub_mb_type[mbPartldx])>1)
                    noSubMbPartSizeLessThan8×8Flag=0
                 }else if(ldirect_8×8_inference_flag)
                    noSubMbPartSizeLessThan8×8Flag=0
         }else{
           if(transform_8×8_mode_flag & & mb_type==l_N×N)
              transform_size_8×8_flag   2   u(1)|ae(v)
           mb_pred(mb_type)   2
         }
      }
 /*剩余部分与JMVM中相同*/
}
转向图12,由参考标号1200一般地指示使用运动跳跃模式对多个视图间参考编码的另一示例方法。
方法1200包括开始块1205,其向功能块1210传递控制。功能块1210在传统模式中寻找具有Costmin的最佳编码模式MODEbest,并且向决定块1215传递控制。决定块1215确定当前码片是否是P码片或B码片。如果是,则向功能块1220传递控制。否则,向功能块1275传递控制。
功能块1220从高层对每个视图间参考画面取得全局视差矢量(DV),并且向功能块1225传递控制。功能块1225设置list_idx等于列表0,并且向功能块1230传递控制。功能块1230将gdv_idx设置为第一视图间参考画面,并且向功能块1235传递控制。功能块1235使用gdv_idx在对应的参考中识别对应的宏块,并且向决定块1240传递控制。决定块1240确定对应的宏块是否是帧内宏块。如果是,则向决定块1265传递控制。否则,向功能块1245传递控制。
功能块1245提取用于运动跳跃模式(MODEms)的运动信息,并且向功能块1250传递控制。功能块1250利用运动跳跃模式(MODEms)取得速率-失真(RD)开销(Costms),并且向功能块1260传递控制。如果Costms小于Costmin,则功能块1260更新MODEbest,并且向决定块1265传递控制。决定块1265确定是否还存在视图间参考。如果是,则向功能块1285传递控制。否则,向决定块1270传递控制。
功能块1285将gdv_idx设置为下一视图间参考,并且向功能块1235返回控制。
决定块1270确定list_idx是否等于列表1。如果是,则向功能块1275传递控制。否则,向功能块1280传递控制。
功能块1275利用MODEbest对宏块编码,并且向结束块1299传递控制。
功能块1280设置list_idx等于列表1,并且向功能块1230返回控制。
转向图13,由参考标号1300一般地指示使用运动跳跃模式对多个视图间参考解码的又一示例方法。
方法1300包括开始块1305,其向决定块1310传递控制。决定块1310确定当前宏块是否位于P码片或B码片中。如果是,则向决定块1315传递控制。否则,向功能块1360传递控制。
决定块1315确定是否标识了运动跳跃模式。如果是,则向功能块1320传递控制。否则,向功能块1360传递控制。
功能块1320从高层对每个视图间参考画面取得全局视差矢量,并且向功能块1325传递控制。功能块1325解码1ist_idx和gdv_idx,并且向决定块1330传递控制。决定块1330确定list_idx是等于0还是等于1。如果list_id等于0,则向功能块1335传递控制。否则,如果1ist_id等于1,则向功能块1340传递控制。
功能块1335通过列表0中的gdv_idx来识别视图间参考,并且向功能块1345传递控制。
功能块1340通过列表1中的gdv_idx来识别视图间参考,并且向功能块1345传递控制。
功能块1345使用gdv_idx在对应的参考中识别对应的宏块,并且向决定块1350传递控制。决定块1350确定对应的宏块(在块1345中识别的)是否是帧内宏块。如果是,则向功能块1365传递控制。否则,向功能块1355传递控制。
功能块1365使比特流无效,并且向结束块1399传递控制。
功能块1355提取运动信息并使用它来进一步对当前宏块解码,并且向功能块1360传递控制。
功能块1360继续对当前宏块解码,并且向结束块1399传递控制。
现在将对本发明的许多伴随的优点/特征中的一些给出描述,所述优点/特征中的一些已经在上面被提及。例如,一个优点/特征为一种包括编码器的装置,所述编码器用于通过对于与多视图视频内容相关的图像块执行以下选择中的至少一个来编码所述图像块:从视图间参考画面列表集合中选择视图间参考画面列表、从视图间参考画面集合中选择视图间参考画面、以及从视差矢量集合中选择对应于该视图间参考画面的视差矢量。所述编码器基于该视图间参考画面列表、该视图间参考画面和该视差矢量中的至少一个来提取所述图像块的运动信息。
另一优点/特征为具有如上所述的编码器的装置,其中所述对视图间参考画面列表、视图间参考画面和视差矢量中的至少一个的选择是隐式的(implicit)。
又一特征优点为具有所述编码器的装置,如上所述,其中所述选择是隐式的,其中所述图像块对应于多视图视频内容的当前视图,并且所述选择对应于第一情形、第二情形、第三情形和第四情形中的一个。第一情形使对视图间参考画面的选择为显式的(explicit)。第二情形使得选择与当前视图最接近的视图间参考画面。第三情形使得基于关于所述图像块的邻近宏块来选择视图间参考画面和视差矢量。第四情形使得在高层处显式地发送视差矢量并且基于邻近宏块来仅仅选择视图间参考画面列表和视图间参考画面中的至少一个。
再一优点/特征为具有如上所述的编码器的装置,其中对应于第二情形而被选择的视图间参考画面是在被选择的视图间参考画面列表中被指定的第一视图间参考画面。
此外,另一特征/优点为具有如上所述的编码器的装置,其中所述邻近宏块包括左宏块、上宏块和右上宏块,并且对应于第三情形的选择进一步对应于以下情况:所述邻近宏块中的至少一个仅仅使用视图间预测,并且从视图间参考画面集合中对应于所述邻近宏块中的至少一个的视图间参考画面中选择的视图间参考画面具有最小索引值。
进一步地,另一特征/优点为具有如上所述的编码器的装置,其中对应于第四情形的选择进一步对应于以下情况:所述邻近宏块中的至少一个仅仅使用视图间预测,并且从视图间参考画面集合中对应于所述邻近宏块中的至少一个的视图间参考画面中选择的视图间参考画面具有最小索引值。
本发明的这些和其他特征和优点可以由相关领域普通技术人员基于这里的教导来容易地确定。应当理解,可以在各种形式的硬件、软件、固件、专用处理器或它们的组合中实施本原理的教导。
最佳选地,按照硬件和软件的组合来实施本原理的教导。此外,可以将该软件实施为在程序存储单元上被有形地体现的应用程序。该应用程序可以被上载至包括任何合适的架构的机器,并且被所述机器执行。优选地,在具有诸如一个或更多的中央处理单元(“CPU”)、随机存取存储器(“RAM”)和输入/输出(“I/O”)接口之类的硬件的计算机平台上实施该机器。该计算机平台还可以包括操作系统和微指令代码。在这里所描述的各种处理和功能可以是由CPU执行的、微指令代码的一部分或应用程序的一部分、或它们的任何组合。另外,诸如附加数据存储单元和打印单元之类的各种其他外设单元可以与该计算机平台连接。
应当进一步理解,因为优选地在软件中实施附图中描绘的一些系统构成组件和方法,所以取决于本原理被编程的方式,系统组件或处理功能块之间的实际连接可能不同。给定这里的教导,相关领域普通技术人员将能够设想到本原理的这些和相似的实施方案或配置。
虽然在这里已经参考附图描述了阐释性的实施例,但应当理解,本原理不限于这些精确的实施例,并且相关领域普通技术人员可以实现各种改变和修改,而不脱离本原理的范围或精神。所有这样的改变和修改意图被包括在如在所附权利要求中所提出的本原理的范围内。

Claims (24)

1.一种装置,其包括:
编码器(100),其用于通过对与多视图视频内容相关的图像块执行以下操作来编码所述图像块:
执行以下选择之一:从视图间参考画面列表集合中选择视图间参考画面列表、从视图间参考画面集合中选择视图间参考画面、以及从视差矢量集合中选择对应于该视图间参考画面的视差矢量;
基于所述视图间参考画面列表、所述视图间参考画面和所述视差矢量中的至少一个来识别对应的视图间块,并且
从所述对应的视图间块提取所述图像块的运动信息。
2.如权利要求1所述的装置,其中对所述视图间参考画面列表、所述视图间参考画面和所述视差矢量中的至少一个的选择是隐式的。
3.如权利要求2所述的装置,其中所述图像块对应于所述多视图视频内容的当前视图,并且所述选择对应于第一情形、第二情形、第三情形和第四情形中的一个,第一情形使得对视图间参考画面的选择为显式的,第二情形使得选择与当前视图最接近的视图间参考画面,第三情形使得基于关于所述图像块的邻近宏块来选择所述视图间参考画面和所述视差矢量,以及第四情形使得在高层处显式地发送所述视差矢量并且基于所述邻近宏块来仅仅选择所述视图间参考画面列表和所述视图间参考画面中的至少一个。
4.如权利要求3所述的装置,其中对应于第二情形所选择的视图间参考画面是在被选择的视图间参考画面列表中指定的第一视图间参考画面。
5.如权利要求3所述的装置,其中所述邻近宏块包括左宏块、上宏块和右上宏块,并且对应于第三情形的选择进一步对应于以下情况:所述邻近宏块中的至少一个仅仅使用视图间预测,并且从视图间参考画面集合中对应于所述邻近宏块中的至少一个的视图间参考画面中选择的视图间参考画面具有最小索引值。
6.如权利要求3所述的装置,其中对应于第四情形(1000)的选择进一步对应于以下情况:所述邻近宏块中的至少一个仅仅使用视图间预测,并且从视图间参考画面集合中对应于所述邻近宏块中的至少一个的视图间参考画面中选择的视图间参考画面具有最小索引值(1035和1040)。
7.一种方法,其包括:
对与多视图视频内容相关的图像块编码,
其中所述编码步骤包括:
对于所述图像块执行(315、320、325)以下选择中的至少一个:从视图间参考画面列表集合中选择视图间参考画面列表、从视图间参考画面集合中选择视图间参考画面、以及从视差矢量集合中选择对应于该视图间参考画面的视差矢量;
基于所述视图间参考画面列表、所述视图间参考画面和所述视差矢量中的至少一个来识别对应的视图间块,以及
从所述对应的视图间块提取(335)所述图像块的运动信息。
8.如权利要求7所述的方法,其中对所述视图间参考画面列表(315)、所述视图间参考画面(320)和所述视差矢量(325)中的至少一个的选择是隐式的。
9.如权利要求8所述的方法,其中所述图像块对应于所述多视图视频内容的当前视图,并且所述选择对应于第一情形(1200)、第二情形(500)、第三情形(800)和第四情形(1000)中的一个,第一情形使得对视图间参考画面的选择为显式的(1275),第二情形使得选择(525、535)与当前视图最接近的视图间参考画面,第三情形使得基于关于所述图像块的邻近宏块来选择(870、875)所述视图间参考画面和所述视差矢量,以及第四情形使得在高层处显式地发送所述视差矢量并且基于所述邻近宏块来仅仅选择(1035、1040)所述视图间参考画面列表和所述视图间参考画面中的至少一个。
10.如权利要求9所述的方法,其中对应于第二情形(500)所选择的视图间参考画面是在被选择的(525、535)视图间参考画面列表中指定的第一视图间参考画面。
11.如权利要求9所述的方法,其中所述邻近宏块包括左宏块、上宏块和右上宏块,并且对应于第三情形(800)的选择进一步对应于以下情况:所述邻近宏块中的至少一个仅仅使用视图间预测,并且从视图间参考画面集合中对应于所述邻近宏块中的至少一个的视图间参考画面中选择的视图间参考画面具有最小索引值(870、875)。
12.如权利要求9所述的方法,其中对应于第四情形(1000)的选择进一步对应于以下情况:所述邻近宏块中的至少一个仅仅使用视图间预测,并且从视图间参考画面集合中对应于所述邻近宏块中的至少一个的视图间参考画面中选择的视图间参考画面具有最小索引值(1035、1040)。
13.一种装置,其包括
解码器(200),其用于通过对与多视图视频内容相关的图像块执行以下操作来解码所述图像块:
执行以下选择之一:从视图间参考画面列表集合中选择视图间参考画面列表、从视图间参考画面集合中选择视图间参考画面、以及从视差矢量集合中选择对应于该视图间参考画面的视差矢量;
基于所述视图间参考画面列表、所述视图间参考画面和所述视差矢量中的至少一个来识别对应的视图间块,并且
从所述对应的视图间块提取所述图像块的运动信息。
14.如权利要求13所述的装置,其中对所述视图间参考画面列表、所述视图间参考画面和所述视差矢量中的至少一个的选择是隐式的。
15.如权利要求14所述的装置,其中所述图像块对应于多视图视频内容的当前视图,并且所述选择对应于第一情形、第二情形、第三情形和第四情形中的一个,第一情形使得对所述视图间参考画面的选择为显式的,第二情形使得选择与当前视图最接近的视图间参考画面,第三情形使得基于关于所述图像块的邻近宏块来选择所述视图间参考画面和所述视差矢量,以及第四情形使得在高层处显式地接收所述视差矢量并且基于所述邻近宏块来仅仅选择所述视图间参考画面列表和所述视图间参考画面中的至少一个。
16.如权利要求15所述的装置,其中对应于第二情形所选择的视图间参考画面是在被选择的视图间参考画面列表中指定的第一视图间参考画面。
17.如权利要求15所述的装置,其中所述邻近宏块包括左宏块、上宏块和右上宏块,并且对应于第三情形的选择进一步对应于以下情况:所述邻近宏块中的至少一个仅仅使用视图间预测,并且从视图间参考画面集合中对应于所述邻近宏块中的至少一个的视图间参考画面中选择的视图间参考画面具有最小索引值。
18.如权利要求15所述的装置,其中对应于第四情形(1000)的选择进一步对应于以下情况:所述邻近宏块中的至少一个仅仅使用视图间预测,并且从视图间参考画面集合中对应于所述邻近宏块中的至少一个的视图间参考画面中选择的视图间参考画面具有最小索引值。
19.一种方法,其包括:
对与多视图视频内容相关的图像块解码,
其中所述解码步骤包括:
对于所述图像块执行(420、425、430)以下选择中的至少一个:从视图间参考画面列表集合中选择视图间参考画面列表、从视图间参考画面集合中选择视图间参考画面、以及从视差矢量集合中选择对应于该视图间参考画面的视差矢量;
基于所述视图间参考画面列表、所述视图间参考画面和所述视差矢量中的至少一个来识别对应的视图间块,以及
从所述对应的视图间块提取(445)所述图像块的运动信息。
20.如权利要求19所述的方法,其中对所述视图间参考画面列表(420)、所述视图间参考画面(425)和所述视差矢量(430)中的至少一个的选择是隐式的。
21.如权利要求20所述的方法,其中所述图像块对应于多视图视频内容的当前视图,并且所述选择对应于第一情形(1300)、第二情形(600)、第三情形(900)和第四情形(1100)中的一个,第一情形使得对所述视图间参考画面的选择为显式的(1325),第二情形使得选择(625、635)与当前视图最接近的视图间参考画面,第三情形使得基于关于所述图像块的邻近宏块来选择(960、965)视图间参考画面和视差矢量,以及第四情形使得在高层处显式地接收所述视差矢量并且基于所述邻近宏块来仅仅选择(1160、1165)所述视图间参考画面列表和所述视图间参考画面中的至少一个。
22.如权利要求21所述的方法,其中对应于第二情形(600)所选择的视图间参考画面是在被选择的(625、635)视图间参考画面列表中指定的第一视图间参考画面。
23.如权利要求21所述的方法,其中所述邻近宏块包括左宏块、上宏块和右上宏块,并且对应于第三情形(900)的选择进一步对应于以下情况:所述邻近宏块中的至少一个仅仅使用视图间预测,并且从视图间参考画面集合中对应于所述邻近宏块中的至少一个的视图间参考画面中选择的视图间参考画面具有最小索引值(960、965)。
24.如权利要求21所述的方法,其中对应于第四情形(1100)的选择进一步对应于以下情况:所述邻近宏块中的至少一个仅仅使用视图间预测,并且从视图间参考画面集合中对应于所述邻近宏块中的至少一个的视图间参考画面中选择的视图间参考画面具有最小索引值(1160、1165)。
CN2008801100813A 2007-08-06 2008-07-30 利用多个视图间参考画面的运动跳跃模式的方法和装置 Expired - Fee Related CN101816180B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US95425607P 2007-08-06 2007-08-06
US60/954,256 2007-08-06
PCT/US2008/009201 WO2009020542A1 (en) 2007-08-06 2008-07-30 Methods and apparatus for motion skip mode with multiple inter-view reference pictures

Publications (2)

Publication Number Publication Date
CN101816180A CN101816180A (zh) 2010-08-25
CN101816180B true CN101816180B (zh) 2013-01-16

Family

ID=40085663

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801100813A Expired - Fee Related CN101816180B (zh) 2007-08-06 2008-07-30 利用多个视图间参考画面的运动跳跃模式的方法和装置

Country Status (7)

Country Link
US (1) US10298952B2 (zh)
EP (1) EP2174506A1 (zh)
JP (1) JP5303556B2 (zh)
CN (1) CN101816180B (zh)
BR (1) BRPI0814854A2 (zh)
TW (1) TWI403171B (zh)
WO (1) WO2009020542A1 (zh)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101415115B (zh) * 2007-10-15 2011-02-02 华为技术有限公司 基于运动跳跃模式的视频编解码方法及其编解码器
CN103037220B (zh) * 2008-01-04 2016-01-13 华为技术有限公司 视频编码、解码方法及装置和视频处理系统
KR101813189B1 (ko) * 2010-04-16 2018-01-31 에스케이 텔레콤주식회사 영상 부호화/복호화 장치 및 방법
KR101893559B1 (ko) * 2010-12-14 2018-08-31 삼성전자주식회사 다시점 비디오 부호화/복호화 장치 및 방법
WO2012090497A1 (ja) * 2010-12-28 2012-07-05 パナソニック株式会社 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、及び動画像符号化復号装置
US20130120528A1 (en) * 2011-01-09 2013-05-16 Thomson Licensing Video processing apparatus and method for detecting a temporal synchronization mismatch
US20120189060A1 (en) * 2011-01-20 2012-07-26 Industry-Academic Cooperation Foundation, Yonsei University Apparatus and method for encoding and decoding motion information and disparity information
RU2480941C2 (ru) * 2011-01-20 2013-04-27 Корпорация "Самсунг Электроникс Ко., Лтд" Способ адаптивного предсказания кадра для кодирования многоракурсной видеопоследовательности
WO2012108315A1 (ja) * 2011-02-07 2012-08-16 シャープ株式会社 予測情報生成方法、画像符号化方法、画像復号方法、予測情報生成装置、予測情報生成プログラム、画像符号化装置、画像符号化プログラム、画像復号装置および画像復号プログラム
KR20120095610A (ko) * 2011-02-21 2012-08-29 삼성전자주식회사 다시점 비디오의 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP5747559B2 (ja) * 2011-03-01 2015-07-15 富士通株式会社 動画像復号方法、動画像符号化方法、動画像復号装置、及び動画像復号プログラム
US9247249B2 (en) 2011-04-20 2016-01-26 Qualcomm Incorporated Motion vector prediction in video coding
WO2012172634A1 (ja) * 2011-06-13 2012-12-20 株式会社東芝 画像符号化装置、画像復号化装置、方法およびプログラム
CN106878755B (zh) * 2011-06-30 2019-09-13 索尼公司 图像处理设备和图像处理方法
US9338474B2 (en) * 2011-09-23 2016-05-10 Qualcomm Incorporated Reference picture list construction for video coding
WO2013062470A1 (en) * 2011-10-24 2013-05-02 Telefonaktiebolaget L M Ericsson (Publ) Reference picture marking
WO2013105207A1 (en) * 2012-01-10 2013-07-18 Panasonic Corporation Video encoding method, video encoding apparatus, video decoding method and video decoding apparatus
TW201921951A (zh) * 2012-01-19 2019-06-01 美商Vid衡器股份有限公司 影巷編碼參考圖像清單發信及建構方法及裝置
US9525861B2 (en) 2012-03-14 2016-12-20 Qualcomm Incorporated Disparity vector prediction in video coding
US9445076B2 (en) * 2012-03-14 2016-09-13 Qualcomm Incorporated Disparity vector construction method for 3D-HEVC
US9549180B2 (en) 2012-04-20 2017-01-17 Qualcomm Incorporated Disparity vector generation for inter-view prediction for video coding
WO2014000664A1 (en) * 2012-06-28 2014-01-03 Mediatek Inc. Method and apparatus of disparity vector derivation in 3d video coding
US9998727B2 (en) * 2012-09-19 2018-06-12 Qualcomm Incorporated Advanced inter-view residual prediction in multiview or 3-dimensional video coding
WO2014047781A1 (en) * 2012-09-25 2014-04-03 Mediatek Singapore Pte. Ltd. Methods for inter-view residual prediction
CN104704819B (zh) * 2012-10-03 2016-12-21 联发科技股份有限公司 3d视频编码的视差矢量推导和视图间运动矢量预测的方法及装置
TW201415898A (zh) * 2012-10-09 2014-04-16 Sony Corp 影像處理裝置及方法
JP2015534416A (ja) * 2012-11-07 2015-11-26 エルジー エレクトロニクス インコーポレイティド ビデオ信号処理方法及び装置
US9544566B2 (en) * 2012-12-14 2017-01-10 Qualcomm Incorporated Disparity vector derivation
JP6027143B2 (ja) * 2012-12-27 2016-11-16 日本電信電話株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、および画像復号プログラム
US10136119B2 (en) * 2013-01-10 2018-11-20 Qualcomm Incoporated View synthesis in 3D video
US9521389B2 (en) * 2013-03-06 2016-12-13 Qualcomm Incorporated Derived disparity vector in 3D video coding
US9667990B2 (en) 2013-05-31 2017-05-30 Qualcomm Incorporated Parallel derived disparity vector for 3D video coding with neighbor-based disparity vector derivation
US10075690B2 (en) * 2013-10-17 2018-09-11 Mediatek Inc. Method of motion information prediction and inheritance in multi-view and three-dimensional video coding
PT3809705T (pt) * 2018-07-02 2024-07-22 Huawei Tech Co Ltd Método e dispositivo de predição de vetor de movimento e codec

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7671894B2 (en) * 2004-12-17 2010-03-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for processing multiview videos for view synthesis using skip and direct modes
US7869666B2 (en) * 2005-01-13 2011-01-11 Nvidia Corporation Video processing system and method with dynamic tag architecture
JP5020953B2 (ja) 2005-07-18 2012-09-05 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 時間及び視点間参照映像バッファを活用した予測符号化/復号化装置及びその方法
JP2007142521A (ja) * 2005-11-15 2007-06-07 Sharp Corp 動きベクトル算出装置および動きベクトル算出方法
ZA200805337B (en) * 2006-01-09 2009-11-25 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multiview video coding
EP1977593A4 (en) * 2006-01-12 2010-06-16 Lg Electronics Inc PROCESSING MORE VIEW VIDEO
KR100959538B1 (ko) * 2006-03-30 2010-05-27 엘지전자 주식회사 비디오 신호를 디코딩/인코딩하기 위한 방법 및 장치
EP2135454A4 (en) 2007-03-02 2010-09-01 Lg Electronics Inc METHOD AND DEVICE FOR DECODING / CODING A VIDEO SIGNAL
US8953684B2 (en) * 2007-05-16 2015-02-10 Microsoft Corporation Multiview coding with geometry-based disparity prediction

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
H-S KOO ET AL.CELL: MVC motion skip mode.《VIDEO STANDARDS AND DRAFTS》.2007, *

Also Published As

Publication number Publication date
US10298952B2 (en) 2019-05-21
EP2174506A1 (en) 2010-04-14
JP2010536242A (ja) 2010-11-25
US20100135391A1 (en) 2010-06-03
JP5303556B2 (ja) 2013-10-02
TWI403171B (zh) 2013-07-21
TW200922336A (en) 2009-05-16
CN101816180A (zh) 2010-08-25
BRPI0814854A2 (pt) 2015-01-27
WO2009020542A1 (en) 2009-02-12

Similar Documents

Publication Publication Date Title
CN101816180B (zh) 利用多个视图间参考画面的运动跳跃模式的方法和装置
TWI657695B (zh) 使用多視界視頻編碼及解碼之高階語法之改良式發信的方法
JP7497948B2 (ja) 動画像処理方法および装置
RU2637996C2 (ru) Способ и устройство для отделения номера кадра и/или счетчика очередности изображения (рос) для мультивидового видеокодирования и видеодекодирования
TWI488145B (zh) 於多重視圖編碼視訊中利用區域差異向量的運動跳過模式之方法及裝置
JP5666293B2 (ja) ビデオ・エンコーディング、およびデコーディングのためのスキップ/ダイレクトモードのコンテクストに依存するマージのための方法と装置
KR101353193B1 (ko) 멀티-뷰 비디오 코딩 시스템에서 사용하기 위한 방법 및 장치
CN101653000B (zh) 用于包含多视点视频编码的参考图像管理的方法
CN101518086A (zh) 在多视图视频编码中用信号通知视图可分级性的方法和装置
TW201244487A (en) Picture identification for multi-view video coding
CN101682763A (zh) 支持针对片数据的多通路视频语法结构的方法和设备
CN101682785A (zh) 编码多视图视频编码信息中使用码片组的方法和装置
CN105247863A (zh) 三维视频编码中简化的cabac编码方法
JP2023052767A (ja) 映像処理方法及び符号化器
CN101611633A (zh) 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置
CN102934434A (zh) 时间运动矢量预测的方法与装置
CN102668561A (zh) 用于视频编码的方法和设备
CN103229504A (zh) 在Inter/Merge/Skip模式下获取运动矢量/运动矢量预测值候选装置及方法
CN104969557A (zh) 对用于视频编码的并置参考图片以显式方式进行信号传输
JP2009526435A (ja) 適応ピクチャ群(gop)構造選択のための方法及び装置
CN111095932B (zh) 使用帧速率上转换工具用于改进的压缩/解压缩的方法和装置
CN103024397A (zh) 确定时域运动矢量预测值的方法和装置
CN103533376A (zh) 帧间预测编码运动信息的处理方法、装置和编解码系统
WO2013159705A1 (zh) 编解码方法、视频序列码流的编解码方法及其对应的装置
CN103873872A (zh) 参考图像管理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20170519

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190110

Address after: Paris France

Patentee after: International Digital Madison Patent Holding Co.

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130116

Termination date: 20210730