[go: up one dir, main page]

CN108605130B - 一种用于对与区块相关的符号进行熵编解码的方法和装置 - Google Patents

一种用于对与区块相关的符号进行熵编解码的方法和装置 Download PDF

Info

Publication number
CN108605130B
CN108605130B CN201680068748.2A CN201680068748A CN108605130B CN 108605130 B CN108605130 B CN 108605130B CN 201680068748 A CN201680068748 A CN 201680068748A CN 108605130 B CN108605130 B CN 108605130B
Authority
CN
China
Prior art keywords
block
current
depth
context
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680068748.2A
Other languages
English (en)
Other versions
CN108605130A (zh
Inventor
向时达
安基程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MediaTek Inc
Original Assignee
MediaTek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/CN2015/095775 external-priority patent/WO2017088170A1/en
Application filed by MediaTek Inc filed Critical MediaTek Inc
Publication of CN108605130A publication Critical patent/CN108605130A/zh
Application granted granted Critical
Publication of CN108605130B publication Critical patent/CN108605130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种用于对与区块相关的符号进行熵编解码的方法和装置。根据本发明,基于上下文的熵编解码被用于与具有不同区块尺寸范围的区块相关的源符号,其中,通过四元树结构、二元树结构或组合四元树加二元树结构对初始区块分区生成该区块。根据本发明,随着统计与当前块相关联的符号,基于来自相邻区块的部分信息以及基于当前块的形状、尺寸和深度中的至少一种的上下文可以与如何通过树结构分区的当前块相关。被编码或解码的当前符号可以对应与上述三种结构、跳过标记或预测模式标记有关的分割标记和模式。

Description

一种用于对与区块相关的符号进行熵编解码的方法和装置
优先权声明
本发明要求在2015年11月27日提出申请号为PCT/CN2015/095775的PCT专利申请和2015年12月23日提出申请号为62/387,291的美国临时专利申请的优先权。上述PCT专利申请和美国临时专利申请整体以引用方式并入本文中。
技术领域
本发明总体涉及图像和视频处理技术领域。具体地,本发明涉及一种用于对与区块相关的符号进行熵编解码的方法和装置。
背景技术
高效视频编码(High-efficiency video coding,HEVC)标准由ITU-T视频编码专家组(Video Coding Experts Group,VCEG)与ISO/IEC运动图像专家组(Moving PictureExperts Group,MPEG)标准化组织的联合视频项目开发,并被作为视频编码联合协作组(the Joint Collaborative Team on Video Coding,JCT-VC)的合作伙伴。
在HEVC中,一个片段被分区为多个编码树单元(coding tree units,CTU)。在主配置文件中,CTU的最小尺寸和最大尺寸由序列参数集(sequence parameter set,SPS)中的语法元素限定。CTU的允许尺寸可以为8x8,16x16,32x32,或64x64。对于每个片段而言,片段中的CTU按照光栅扫描顺序处理。
CTU进一步被分区为多个编码单元(coding units,CU)以适应不同的局部特征。四元树结构,用编码树表示,用于将CTU分成多个CU。设CTU的尺寸为MxM,M为64,32,或16中的任一数值。CTU可以为一个CU,或者可以作为编码树的节点,被分割成的四个更小的尺寸相同的编码单元(例如,M/2xM/2)。如果该单元作为编码树的叶节点,则该单元为CU。否则,可以迭代四元树分割流程,直至节点尺寸达到SPS中限定的最小允许CU尺寸。这一表现形式导致由图1所示的编码树(也被称为分区树结构)120指定的递归结构。图1所示的CTU分区110中,实线指示CU的边界。在CU级中,确定是否使用帧内图片(时间)或帧间图片(空间)预测对图片区域进行编码。由于最小CU尺寸可以为8x8,在不同预测类型切换时的最小粒度为8x8。
每个CU指定一个或多个预测单元(prediction unit,PU)。PU与CU连接,PU作为共享预测信息的基本代表块。在每个PU内,相同的预测流程被应用,且相关信息被发送到一个PU基本层的解码器上。根据PU分割类型,一个CU可以被分割成一个、两个或四个PU。如图2所示,HEVC规定了将CU分区成PU的八种形状。不同于CU,PU可以只被分割一次。如第二行所示的分区对应不对称分区类型,其中,两个分区部分具有不同的尺寸。
在基于PU分割类型应用预测流程获取到残差块之后,根据另一个类似于CU编码树的四元树结构,可以将一个CU分割成变换单元(transform units,TUs)。图1中,区块110的实线指示CU的边界,虚线指示TU的边界。类似地,分区树形结构120上的实线对应CU分区树形结构,分区树形结构120上的虚线对应TU分区树形结构。TU是一种应用于整数变换算法和量化处理的残差或变换系数的基本代表块(basic representative block)。对于每个TU,一种相同尺寸的整数变换被应用于TU以获得残差系数。该系数被发送到经过以TU为基础的量化处理后的解码器上。
下列术语,编码树块(coding tree block,CTB),编码块(coding block,CB),预测块(prediction block,PB)以及变换块(transform block,TB)被定义为分别用于指示与CTU,CU,PU以及TU相关的一个彩色分量的2D样品阵列。因此,CTU包含一个亮度CTB,两个色度CTB,CTU与语法元素相关。类似的关系在CU,PU和TU中有效。树分区通常同时应用于亮度和色度,尽管在色度达到一定的最小允许尺寸时,树分区应用异常。
可替换地,二元树区块分区结构可以被用于如ITU-T SG 16(Study Period2013),Contribution 966(J.An,et al,“Block partitioning structure for nextgeneration video coding”,ITU-T T13 SG16 COM 16–C 966 R3–E,Geneva,September2015)所公开的场景中。在已公开的二元树分区结构中,一区块可以被递归地分割成两个更小的区块。如图3中所示,存在多种不同的分割类型。最高效和最简单的分割类型是如图2顶部所示的对称水平分割和对称垂直分割。因此,系统可以选择仅使用上述两种分割类型。对于大小为MxN的给定块,一标记可以被以信号形式指示是否将一区块分割成两个更小的区块。若标记指示“是”,则另一语法元素被以信号形式指示哪一分割类型(例如,水平或垂直)被应用。若使用水平分割类型,则区块被分割成尺寸为MxN/2的两个区块,否则,若使用垂直分割类型,则区块被分割成尺寸为M/2xN的两个区块。二元树分割流程可以被迭代直至分割区块的尺寸(宽度或高度)可以达到高级语法(如SPS)中限定的最小允许区块的尺寸(宽度或高度)。由于二元树有两种分割类型(例如,水平和垂直),最小允许区块宽度和高度均应当被指示出。当分割会引起区块高度小于被指示的最小值时,非水平分割是隐含的。当分割会引起区块宽度小于被指示的最小值时,非水平分割是隐含的。图4给出了一个区块分区410及其相关的二元树结构420的示例。在二元树的每个分割节点(例如,非叶节点),一符号指示哪一分割类型(例如,水平或垂直)被应用,0指示水平分割,1指示垂直分割。
所提出的二元树结构可以被用于将一个区块分区成多个更小的区块,例如将一片段分区成多个CTU,将一个CTU分区成多个CU,将一个CU分区成多个PU或者将一个CU分区成多个TU,等等。在一个实施例中,二元树被用于将一个CTU分区成多个CU。换言之,二元树的根节点是一个CTU,二元树的叶节点是多个CU。叶节点进一步被预测和变换编码处理。在另一实施例中,为了简化区块分区流程,没有进一步地将一个CU分区成多个PU或者将一个CU分区成多个TU。这意味着,一CU等于一PU也等于一TU。因此,在这一案例中,二元树的叶节点也是预测和变换编码的基础单元。
二元树结构比四元树结构更有弹性,随着越来越多的分区形状可以被支持,二元树结构也是提高编码效率的因素。然而,为了选择最优的分区形状,编码的复杂性也将增加。为了平衡复杂性和编码效率,在2015年12月9日申请的PCT/CN2015/096761中公开了一种组合四元树和二元树结构的方法,该方法被称为四元树加二元树结构(quadtree plusbinary tree,QTBT)。在已公开的QTBT结构中,一区块首先被四元树结构分区,该四元树分区可以被迭代直至分区区块的尺寸分区达到最小允许四元树叶节点尺寸。如果该叶四元树区块不大于最大允许二元树根节点尺寸,则叶四元树区块进一步被二元树结构分割,二元树分割可以被迭代直至分区区块的尺寸(宽度或高度)到达最小允许二元树叶节点尺寸(宽度或高度)或二元树深度达到最大允许二元树深度。在QTBT结构中,最小允许四元树叶节点尺寸、最大允许二元树根节点尺寸、最小允许二元树叶节点宽度和高度以及最大允许二元树深度可以被高级语法(如SPS)指示出。图5给出了一个区块分区510及其相关的QTBT结构520的示例。实线指示四元树分割,虚线指示二元树分割。在二元树的每个分割节点(例如,非叶节点),一符号指示哪一分割类型(例如,水平或垂直)被应用,0指示水平分割,1指示垂直分割。
已公开的QTBT结构可以被用于将一区块分区成多个更小的区块,例如将一片段分区成多个CTU,将一个CTU分区成多个CU,将一个CU分区成多个PU或者将一个CU分区成多个TU,等等。例如,QTBT可以被用于将一个CTU分区成多个CU,即,QTBT的根节点为一CTU,CTU被一QTBT分区成多个CU。CU进一步被预测和变换编码处理。QTBT结构的简化也已经被2015年12月9日申请的PCT/CN2015/096761公开,没有进一步地将一个CU分区成多个PU或者将一个CU分区成多个TU。换言之,一CU等于一PU,并等于一TU。因此,QTBT结构的叶节点是预测和变换的基础单元。
以下为一已公开的QTBT结构的示例。QTBT结构可以应用于尺寸为128x128的CTU,最小允许四元树叶节点尺寸等于16x16,最大允许二元树根节点尺寸等于64x64,最小允许二元树叶节点宽度和高度均等于4,以及最大允许二元树深度等于4。首先,CTU被四元树结构分区,叶四元树单元可以拥有从16x16(最小允许四元树叶节点尺寸)到128x128(等于CTU尺寸,即没有分割)的尺寸。当叶四元树单元为128x128时,由于尺寸达到最大允许二元树根节点尺寸64x64,叶四元树单元不能进一步被二元树分割。否则,叶四元树单元可以进一步被二元树分割。叶四元树单元被用作二元树深度为0的根二元树单元。当二元树深度达到4时(即,被指示的最大二元树深度),非分割是隐含的。当二元树节点的宽度为4时,非水平分割是隐含的。当二元树节点的高度为4时,非垂直分割是隐含的。QTBT的叶节点进一步被预测(例如,帧间图片或帧内图片)和变换编码处理。
已公开的树结构可以被分别用于I-片段(即帧间编码片段)的亮度和色度,并同时被用于P-片段和B-片段的亮度和色度(在色度达到特定最小尺寸时除外)。换言之,在I-片段中,一个亮度CTB拥有其自身的QTBT-结构区块分区,两个色度CTB拥有另一QTBT-结构区块分区。该两个色度CTB也可以拥有其自身的QTBT-结构区块分区。
发明内容
本发明公开了一种用于对与区块相关的符号进行熵编解码的方法和装置,该区块分别通过视频编码器或视频解码器进行编码或解码。在一实施例中,接收包括与当前图像中的当前块相关的输入数据,其中,当前块通过采用四元树结构、二元树结构或组合四元树和二元树结构对初始区块分区生成。确定输入数据中被编码或被解码的当前符号,其中,当前符号与当前块相关。基于来源于一个或多个相邻区块的第一信息和与当前块的区块形状或分区深度中的至少一者相关的第二信息确定当前上下文,其中,在当前块之前处理该一个或多个相邻区块。根据当前上下文,应用基于上下文的熵编解码或解码对当前符号进行处理。
在一实施例中,当前符号与四元树分割标记相关,根据当前块的当前四元树深度和具有比当前块更大的四元树深度的相邻区块的数量确定当前上下文,其中,当前块通过采用四元树结构对初始区块分区生成,相邻区块包括顶部相邻区块和左侧相邻区块。例如,当前四元树深度可以被划分成三类,当前四元树深度分别为0,1或大于1;具有比当前块更大的四元树深度的相邻区块的数量值与0,1或2相关;基于三类和三种具有比当前块更大的四元树深度的相邻区块的数量值,总共5类上下文被应用。当基于当前块的分区深度来确定当前上下文时,若初始区块的不同区块尺寸被应用,可以进一步基于当前块的区块形状来确定当前上下文。不同的上下文可以被用于当前块的不同四元树深度以及具有比当前块更大的四元树深度的相邻区块的不同数量值。另外,当顶部相邻区块和左侧相邻区块的四元树分割标记均等于1时,不同的上下文可以被用于不同的四元树深度。
在另一实施例中,当前符号与跳过标记相关,基于当前块的当前二元树深度和采用跳过模式进行编码的相邻区块的数量来确定当前上下文,其中,当前块通过采用二元树结构对初始区块分区生成,相邻区块包括顶部相邻区块和左侧相邻区块。当给定块被跳过模式编码时,除了合并给定块的候选索引外,不再发出语法元素信号。当前二元树深度可以被划分成三类,当前二元树深度分别为0,1或2,以及大于2。被跳过模式编码的相邻区块的数量值与0,1或2相关。在本实施例中,基于三类和三种被跳过模式编码的相邻区块的数量值,总共9类上下文可以被应用。
在又一实施例中,当前符号与一用于指示当前块是否被帧内预测模式或帧间预测模式编码的预测模式标记相关,基于与当前块相关的一当前组合四元树和二元树深度和采用帧间模式进行编码的相邻区块的数量来确定当前上下文,其中,当前块通过采用组合四元树和二元树结构对初始区块分区生成,相邻区块包括顶部相邻区块和左侧相邻区块,其中当前组合四元树和二元树结构为缩放2倍后的四元树深度以及二元树深度的总和。例如,两种上下文分别被用于数量为1和2的被帧间模式编码的相邻区块,若被帧间模式编码的相邻区块数量为0,则两种附加上下文分别被用于当前组合四元树和二元树深度小于4的相邻区块和当前组合四元树和二元树深度不小于4的相邻区块。不同的上下文可以取决于当前组合四元树和二元树深度与深度阈值的比较结果而应用。在本实施例中,若初始区块的不同区块尺寸被应用,则深度阈值可以取决于当前块的区块尺寸。
在又一实施例中,当前符号与第一bin值相关,第一bin值与用于指示当前块是否被分割的二元树分割标记有关,基于具有比当前块更大的组合四元树和二元树深度的相邻区块的数量来确定当前上下文,其中,当前块通过采用组合四元树和二元树结构对初始区块分区生成,当前组合四元树和二元树结构为缩放2倍后的四元树深度以及二元树深度的总和,相邻区块包括顶部相邻区块和左侧相邻区块。进一步地,一当前第二符号对第二bin值相关,第二bin值与用于指示水平分割或垂直分割的二元树分割标记有关,根据当前块的区块形状,当前第二符号取决于第二bin值。第二上下文可以被应用,其中,三种第二上下文分别与区块形状为方形、宽度大于高度的矩形以及宽度小于高度的矩形的当前块相关。不同的上下文集合可以被用于当前块的三种不同形状,其中,当前块的三种不同形状分别与方形、宽度大于高度的矩形以及宽度小于高度的矩形相关。不同的上下文集合或不同的第二上下文集合可以被用于当前块的不同组合四元树和二元树深度。不同的上下文集合或不同的第二上下文集合可以被用于当前块的至少两种不同的二元树深度。例如,4类不同的上下文集合或4类不同的第二上下文集合可以被用于4中不同的二元树深度类型,二元树深度类型分别对应等于0,1,2或大于2的二元树深度。在另一例子中,不同的上下文集合或不同的第二上下文集合可以被用于当前块的至少两种不同的四元树深度或至少两种不同的二元树深度。
附图说明
图1是使用HEVC中相应的四元树将CTU细分为CUs和TUs的示例;
图2是HEVC中将CU分割成一个或多个PU的八种分区类型的示例;
图3是二元树中的可能的分区类型的示例;
图4是使用一相关二元树的区块分区的示例;
图5是使用一相关QTBT的区块分区的示例;
图6是本发明一示例性编码系统中使用四元树结构、二元树结构或组合四元树加二元树结构的用于与区块生成相关的符号的基于上下文的熵编解码的一示例性流程示意图。
具体实施方式
以下描述为实施本发明的较佳方式。本描述的目的在于阐释本发明的一般原理,并非起限定意义。本发明的保护范围当视所附的权利要求书所界定为准。
为了提高编码效率,在本发明中,使用基于上下文的自适应二进制算术编码(thecontext-based adaptive binary arithmetic coding,CABAC)模式的熵编解码被用于二元树结构的表达。根据本发明,基于上下文的熵编解码被用于与具有不同区块尺寸范围的区块相关的源符号,其中,通过四元树结构、二元树结构或组合四元树加二元树结构对初始区块分区生成该区块。根据本发明的上下文是基于来自相邻区块的部分信息以及基于当前块的形状、尺寸和深度中的至少一种,因为与当前块相关联的符号的数据可以与当前块利用树结构怎么分区相关。
在一方法中,上下文建模考虑到与相邻区块的二元树深度以及当前块的二元树深度相关的信息,其中,当前块可以发信通知分区决策。上下文的信息可以进一步考虑当前块的尺寸和/或形状。当组合四元树结构时,上下文建模可以进一步利用与相邻区块的四元树深度以及当前块的四元树深度相关的信息。二进制语法元素bt_split_flag可以被编码以作为当前块是否进一步被分区的信号。若该语法元素bt_split_flag是正确的(即分区),语法元素bt_split_flag可以被编码以指示被当前块使用的分割或分区模式(即水平或垂直)。
在包含两种二元分割模式的QTBT结构的一实施例中,对语法元素bt_split_flag进行熵编解码的上下文建模取决于具有比当前块更大的组合QTBT深度的相邻区块的数量。区块的组合QTBT深度被定义为缩放2倍后的四元树深度以及二元树深度的总和。对语法元素bt_split_mode进行熵编解码的上下文建模可以进一步取决于当前块的形状。根据本发明一实施例,表1和表2分别示例性地说明了编码语法元素bt_split_flag和bt_split_mode的上下文选择映射表。在表1中,ctxInc等于0对应于顶部相邻区块和左侧相邻区块的组合QTBT深度均没有大于当前块的组合QTBT深度;ctxInc等于1对应于只有顶部相邻区块和左侧相邻区块中的一者的组合QTBT深度大于当前块的组合QTBT深度。在表2中,由上下文索引识别上下文,ctxInc基于当前块的形状。具体地,ctxInc等于0对应于一个平方块;ctxInc等于1对应于一个宽度大于高度的矩形块;以及ctxInc等于2对应于一个高度大于宽度的矩形块。可以理解的是,表1和表2中所描述的例子在所有方面仅是说明性的,而不是作为对本发明的限制。本申请中可以采用其他数量的上下文。例如,表2中的两个矩形形状可以共享同一个上下文以将上下文的总数量由3个减少至2个。相应地,所公开的表格仅是说明性的,而不是作为对本发明的限制。
表1
Figure GDA0001671662700000091
表2
Figure GDA0001671662700000102
在另一实施例中,上下文建模进一步取决于当前块的二元树深度。根据本发明一实施例,表3和表4分别示例性地说明了编码语法元素bt_split_flag和bt_split_mode的上下文选择映射表,其中,“W”和“H”表示当前块宽度和高度。在另一实施例中,上下文建模进一步取决于当前块的四元树深度。在另一实施例中,上下文建模进一步取决于当前块的四元树深度和/或二元树深度,以及不同的四元树深度或二元树深度可以共享相同集合的上下文建模。如表3所示,总共12类上下文(即ctxInc从0到11)被应用。如表4所示,总共8类上下文(即ctxInc从0到7)被应用。再次强调,可以理解的是,表3和表4中所描述的例子在所有方面仅是说明性的,而不是作为对本发明的限制。本发明中,更多或更少数量的上下文或不同的上下文映射可以被应用。例如,表4中区块形状为宽度小于高度“W<H”的二元树深度为1和2的上下文并不相同。但是,在另一例子中,这两种条件可以共享同一个上下文。
表3
Figure GDA0001671662700000103
表4
Figure GDA0001671662700000101
Figure GDA0001671662700000111
在又一实施方式中,根据当前块的形状,不同的上下文集合可以被用于编码语法元素bt_split_flag。例如,不同形状当前块的不同上下文集合可以从如下等式得到:
ctx+=(W==H?0:(W>H?1:2))*num_ctx_set。 (1)
当不同上下文集合的算法应用于表1的案例中,表1中的三类上下文可以得到三种不同区块形状的9类上下文。
在又一实施方式中,上下文可以进一步取决于当前块的组合四元树和二元树深度。例如,不同当前块的组合四元树和二元树深度的不同上下文集合可以从如下等式得到:
ctx+=((QTdepth<<1)+BTdepth)*num_ctx_set。 (2)
在等式(2)中,((QTdepth<<1)+BTdepth)项与组合四元树和二元树深度相关,其中,QTdepth是当前块的四元树深度,Btdepth是当前块的二元树深度。
众所周知,由于视频资源中总是存在强空间相关性,因此区块的源语法元素值的统计特征常常与其相邻区块的对应语法元素值高度相关。实验结果进一步表明,区块的源语法元素值的统计特征常常与当前块的区块尺寸或分区树的深度相关。因此,在本发明的一实施例中,对尺寸范围大的区块的语法元素所进行的熵编解码上下文建模方案取决于一些与相邻区块相关的信息。上下文建模进一步取决于当前块的区块尺寸或分区树的深度。为了减少建模成本,一些接近的或相关的环境条件可以共享一个建模上下文。例如,在一实施例中,当前块的相邻树深度的相同集合上下文可以被指派给当前块。在另一实施例中,当区块分区被执行于不同色彩分量时,上下文建模方案进一步取决于当前块的色彩分量指数。
在一实施例中,所提出的上下文建模方案被用于由四元树或QTBT分区结构产生的CU四元树分割标记的二进制值(例如HEVC中的语法元素split_cu_flag)的熵编解码。所提出的上下文建模方案可以取决于具有比当前CU更大的四元树深度的相邻CU的数量,进一步取决于某些相邻配置的当前块的四元树深度。例如,当前CU的上下文索引ctxIdx可以由以下等式确定:
ctxInc=(d<T0?0:(d>T1?(T1-T0+1):(d-T0)))*(N+1)+n。 (3)
在等式(3)中,n是具有比当前CU更大的四元树深度的相邻CU的数量,N是相邻CU的最大数量值,d是当前块的四元树深度,以及T0和T1是某预设深度阈值。逻辑运算符“x?y:z”表示当x是TRUE或者不为0时,求y的值;否则求z的值。
在减小上下文的总数量的另一实施例中,当前CU的上下文索引ctxIdx可以由以下等式确定:
ctxInc=(n<N)?n:((d<T0?0:(d>T1?(T1-T0+1):(d-T0)))+N)。 (4)
在等式(4)中,n是与更大的QT深度相关的相邻CU的数量,N是相邻CU的最大数量值,d是当前块的四元树深度,以及T0和T1是某预设深度阈值。基于等式(4)的上下文选择的语法元素split_cu_flag的示例性映射表被示出在表5A中,其中,当相邻CU均具有一个较大的四元树深度(即N等于2)时,上下文建模进一步取决于预设深度阈值T0和T1分别为0和2的当前CU的四元树深度。如表5A所示,共有6类上下文(即ctxInc从0到5)被应用。表5B示出了另一例子,其中,所有四元树深度大于1的当前块被分组到一个类别,以及共有6类上下文(即ctxInc从0到4)被应用。
表5A
Figure GDA0001671662700000121
Figure GDA0001671662700000131
表5B
Figure GDA0001671662700000132
当CTU的尺寸被固定时,CU的尺寸可以由四元树深度被唯一地导出。例如当CTU的尺寸为128时,对应四元树深度为0,1和2,CU的尺寸分别可以为128,64和32。但是,当不同的CTU的尺寸被应用时,例如CTU为256,对应四元树深度为0,1和2,CU的尺寸分别可以为256,128和64。在本例中,在不同CTU的尺寸被应用时,具有给定尺寸的CU可以通过不同的上下文集合进行编码。这并不是所期望的。在另一实施例中,当上下文取决于四元树深度时,上下文建模进一步取决于区块尺寸。另一方面,四元树深度可以根据CTU的尺寸调节,如此相同CU尺寸被指定到相同的模型集合。
在另一实施例中,所提出的上下文建模方法被用于由四元树、二元树或QTBT分区结构生成CU跳过标记的二进制值(例如HEVC中的语法元素cu_skip_flag)的熵编解码。CU跳过标记等于1规定除了合并候选索引外,当前块不再发出语法元素信号。例如,所提出的上下文建模方法取决于跳过的相邻CU的数量,进一步取决于当前CU二元树或QTBT的深度。例如,当前块的上下文索引ctxInc可以由以下等式确定:
ctxInc=(((d+1)>>1)<T0?0:(((d+1)>>1)>T1?(T1-T0+1):(((d+1)>>1)-T0)))*(N+1)+n。 (5)
在等式(5)中,n是跳过的相邻CU的数量,N是跳过的相邻CU的最大数量值,d是当前块的BT,QT或BTQT深度,以及T0和T1是某预设深度阈值。在本发明一实施例中,表6示出了在二元树或QTBT分区结构中的语法cu_skip_flag的上下文选择的示例性映射表。在表6中,共有9类上下文(即ctxInc从0到8)被应用。在本发明一实施例中,表7示出了使用四元树分区结构的上下文选择的示例性映射表。在表7中,共有12类上下文(即ctxInc从0到11)被应用。
表6
Figure GDA0001671662700000141
表7
Figure GDA0001671662700000142
在减少上下文总量的另一实施例中,当前块的上下文索引ctxInc可以由以下等式确定:
ctxInc=(n<N)?n:((((d+1)>>1)<T0?0:(((d+1)>>1)>T1?(T1-T0+1):(((d+1)>>1)-T0)))+N)。 (6)
在等式(6)中,n是跳过的相邻CU的数量,N是跳过的相邻CU的最大数量值,d是当前块的BT,QT或BTQT深度,以及T0和T1是某预设深度阈值。
本发明可以被用于语法元素pred_mode_flag。语法元素pred_mode_flag等于0规定当前块单元在帧内预测模式中被编码。语法元素pred_mode_flag等于1规定当前块单元在帧间预测模式中被编码。根据现有的HEVC标准,语法元素pred_mode_flag等于被应用单个上下文进行熵编解码。本发明一实施例得到在帧间模式中被编码的基于相邻区块数量的上下文,其中,相邻区块包括顶部相邻区块和左侧相邻区块。上下文进一步取决于当前块的组合四元树和二元树深度,QBTdepth=(QTdepth*2+BTdepth+1)>>1,其中QTdepth为当前块的四元树深度,BTdepth为当前块的二元树深度。在一实施例中,初始上下文索引ctxInc可以基于在帧间模式中被编码的相邻区块数量推导得出。随后被修改的初始ctxInc进一步取决于当前块的组合四元树和二元树深度:
ctxInc=ctxInc?(ctxInc+1):(QBTdepth<4?0:1)。 (7)
根据等式(7),生成语法元素pred_mode_flag的4类上下文。在上述示例中,上下文选择取决于具有一深度阈值的当前块的组合四元树和二元树深度的比较结果。如果不同的CTU尺寸被应用,例如CTU的尺寸为256或128,由于不同的CTU尺寸,该深度阈值应当将四元树深度考虑在内。例如,在等式(7)中,CTU的尺寸为128时,深度阈值为4。CTU的尺寸为256时,深度阈值应被修改为6。相应地,在其他实施例中,如果不同的CTU区块尺寸被应用,深度阈值取决于当前CU的区块尺寸。
图6示出了本发明中包含基于上下文对区块相关的符号进行熵编解码的示例性编码系统一实施例的流程示意图,该区块采用四元树结构、二元树结构或组合四元树和二元树结构生成的。根据该方法,在步骤610中,接收与当前图像中的当前块相关的输入数据,其中,当前块通过采用四元树结构、二元树结构或组合四元树和二元树结构对初始区块分区生成。在编码器侧,输入数据对应与当前块相关的一个或多个符号。该符号可以与用于生成当前块的分区流程相关。该符号也可以对应与当前块相关的语法元素,例如跳过标记或预测模式标记。在解码器侧,输入数据可以对应与编码符号或语法元素相关的一视频比特流或一二进制字符串,该编码符号或语法元素通过基于上下文的熵解码进行解码。在步骤620中,确定输入数据中被编码或被解码的当前符号,其中,当前符号与当前块相关。在步骤630中,基于来源于一个或多个相邻区块的第一信息和与当前块的区块形状或分区深度中的至少一者相关的第二信息确定当前上下文,其中,在当前块之前处理一个或多个相邻区块。随后,在步骤640中,根据当前上下文,应用基于上下文的熵编解码或解码对当前符号进行处理。
本发明所示的流程图用于示出根据本发明的视频编码的示例。在不脱离本发明的精神的情况,本领域的技术人员可以修改每个步骤、重组这些步骤、将一个步骤进行分离或者组合这些步骤而实施本发明。在本发明中,已经使用特定语法和语义来示出不同示例,以实施本发明的实施例。在不脱离本发明的精神的情况,通过用等价的语法和语义来替换该语法和语义,本领域的技术人员可以实施本发明。
上述说明,使得本领域的普通技术人员能够在特定应用程序的内容及其需求中实施本发明。对本领域技术人员来说,所描述的实施例的各种变形将是显而易见的,并且本文定义的一般原则可以应用于其他实施例中。因此,本发明不限于所示和描述的特定实施例,而是将被赋予与本文所公开的原理和新颖特征相一致的最广泛的范围。在上述详细说明中,说明了各种具体细节,以便透彻理解本发明。尽管如此,将被本领域的技术人员理解的是,本发明能够被实践。
如上的本发明的实施例可以在各种硬件、软件代码或两者的结合中实现。例如,本发明的实施例可以是集成在视频压缩芯片内的电路,或者是集成到视频压缩软件中的程序代码,以执行本文的处理。本发明的一个实施例也可以是在数字信号处理器(DigitalSignal Processor,DSP)上执行的程序代码,以执行本文所描述的处理。本发明还可以包括由计算机处理器、数字信号处理器、微处理器或现场可编程门阵列(field programmablegate array,FPGA)所执行的若干函数。根据本发明,通过执行定义了本发明所实施的特定方法的机器可读软件代码或者固件代码,这些处理器可以被配置为执行特定任务。软件代码或固件代码可以由不同的编程语言和不同的格式或样式开发。软件代码也可以编译为不同的目标平台。然而,执行本发明的任务的不同的代码格式、软件代码的样式和语言以及其他形式的配置代码,不会背离本发明的精神和范围。
本发明以不脱离其精神或本质特征的其他具体形式来实施。所描述的例子在所有方面仅是说明性的,而非限制性的。因此,本发明的范围由附加的权利要求来表示,而不是前述的描述来表示。权利要求的含义以及相同范围内的所有变化都应纳入其范围内。

Claims (20)

1.一种用于对与区块相关的符号进行熵编解码的方法,其特征在于,所述区块分别通过视频编码器或视频解码器进行编码或解码,所述方法包括:
接收与当前图像中的当前块相关的输入数据,其中,当前块通过采用四元树结构、二元树结构或组合四元树和二元树结构对初始区块分区生成;确定所述输入数据中被编码或被解码的当前符号,其中,所述当前符号与所述当前块相关;
基于来源于一个或多个相邻区块的第一信息和至少与所述当前块的分区深度相关的第二信息确定当前上下文,其中,在所述当前块之前处理所述一个或多个相邻区块;以及
根据所述当前上下文,应用基于上下文的熵编码或熵解码对所述当前符号进行处理。
2.根据权利要求1所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,当前符号与四元树分割标记相关,根据所述当前块的当前四元树深度和具有比所述当前块更大的四元树深度的相邻区块的数量确定所述当前上下文,其中,所述当前块通过采用四元树结构对初始区块分区生成,所述相邻区块包括顶部相邻区块和左侧相邻区块。
3.根据权利要求2所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,所述当前四元树深度被划分成3类,所述当前四元树深度分别为0,1或大于1;具有比所述当前块更大的四元树深度的所述相邻区块的数量值与0,1或2相关;基于所述3类和3种具有比所述当前块更大的四元树深度的相邻区块的数量值,总共5类上下文被应用。
4.根据权利要求2所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,当基于所述当前块的分区深度来确定当前上下文时,若所述初始区块的不同区块尺寸被应用,则进一步基于所述当前块的区块形状来确定所述当前上下文。
5.根据权利要求2所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,不同的上下文被用于所述当前块的不同四元树深度以及具有比所述当前块更大的四元树深度的相邻区块的不同数量值。
6.根据权利要求2所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,当顶部相邻区块和左侧相邻区块的四元树分割标记均等于1时,不同的上下文被用于不同的当前四元树深度。
7.根据权利要求1所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,所述当前符号与跳过标记相关,基于所述当前块的当前二元树深度和采用跳过模式进行编码的相邻区块的数量来确定所述当前上下文,其中,所述当前块通过采用二元树结构对初始区块分区生成,所述相邻区块包括顶部相邻区块和左侧相邻区块,以及其中,当给定块被跳过模式编码时,除了合并给定块的候选索引外,不再发出语法元素信号。
8.根据权利要求7所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,所述当前二元树深度被划分成3类,所述当前二元树深度分别为0,1或2,以及大于2;被跳过模式编码的所述相邻区块的数量值与0,1和2相关;基于所述3类和3种被跳过模式编码的相邻区块的数量值,总共9类上下文被应用。
9.根据权利要求7所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,当前符号与一用于指示当前块是否被帧内预测模式或帧间预测模式编码的预测模式标记相关,基于与所述当前块相关的一当前组合四元树和二元树深度和采用帧间模式进行编码的相邻区块的数量来确定所述当前上下文,其中,所述当前块通过采用组合四元树和二元树结构对初始区块分区生成,所述相邻区块包括顶部相邻区块和左侧相邻区块,其中所述当前组合四元树和二元树结构为缩放2倍后的四元树深度以及二元树深度的总和。
10.根据权利要求9所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,不同上下文取决于当前组合四元树和二元树深度与深度阈值的比较结果而应用,其中,若所述初始区块的不同区块尺寸被应用,则所述深度阈值取决于当前块的区块尺寸。
11.根据权利要求9所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,两种上下文分别被用于数量为1和2的被帧间模式编码的相邻区块,若被帧间模式编码的相邻区块数量为0,则两种附加上下文分别被用于所述当前组合四元树和二元树深度小于4的相邻区块和所述当前组合四元树和二元树深度不小于4的相邻区块。
12.根据权利要求1所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,所述当前符号与第一bin值相关,所述第一bin值与用于指示当前块是否被分割的二元树分割标记有关,基于具有比当前块更大的组合四元树和二元树深度的相邻区块的数量来确定所述当前上下文,其中,所述当前块通过采用组合四元树和二元树结构对初始区块分区生成,所述当前组合四元树和二元树结构为缩放2倍后的四元树深度以及二元树深度的总和,所述相邻区块包括顶部相邻区块和左侧相邻区块。
13.根据权利要求12所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,一当前第二符号与第二bin值相关,所述第二bin值与用于指示水平分割或垂直分割的二元树分割标记有关,根据当前块的区块形状,所述当前第二符号取决于第二bin值。
14.根据权利要求13所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,第二上下文被应用,其中,三种第二上下文分别与区块形状为方形,宽度大于高度的矩形以及宽度小于高度的矩形的所述当前块相关。
15.根据权利要求13所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,不同的上下文集合被用于当前块的三种不同形状,其中,所述当前块的三种不同形状分别与方形,宽度大于高度的矩形以及宽度小于高度的矩形相关。
16.根据权利要求13所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,不同的上下文集合或不同的第二上下文集合被用于当前块的不同组合四元树和二元树深度。
17.根据权利要求13所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,不同的上下文集合或不同的第二上下文集合被用于当前块的至少两种不同的二元树深度。
18.根据权利要求17所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,4类不同的上下文集合或4类不同的第二上下文集合被用于4中不同的二元树深度类型,所述二元树深度类型分别对应等于0、1,2或大于2的二元树深度。
19.根据权利要求13所述的用于对与区块相关的符号进行熵编解码的方法,其特征在于,不同的上下文集合或不同的第二上下文集合被用于当前块的至少两种不同的四元树深度或至少两种不同的二元树深度。
20.一种用于对与区块相关的符号进行熵编解码的装置,其特征在于,所述区块分别通过视频编码器或视频解码器进行编码或解码,所述装置包括经配置以执行以下操作的一个或多个电子电路或处理器:
接收与当前图像中的当前块相关的输入数据,其中,当前块通过采用四元树结构、二元树结构或组合四元树和二元树结构对初始区块分区生成;
确定所述输入数据中被编码或被解码的当前符号,其中,所述当前符号与所述当前块相关;
基于来源于一个或多个相邻区块的第一信息和至少与所述当前块的分区深度相关的第二信息确定当前上下文,其中,在所述当前块之前处理所述一个或多个相邻区块;以及
根据所述当前上下文,应用基于上下文的熵编码或熵解码对所述当前符号进行处理。
CN201680068748.2A 2015-11-27 2016-11-25 一种用于对与区块相关的符号进行熵编解码的方法和装置 Active CN108605130B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
PCT/CN2015/095775 WO2017088170A1 (en) 2015-11-27 2015-11-27 Entropy coding the binary tree block partitioning structure
CNPCT/CN2015/095775 2015-11-27
US201562387291P 2015-12-23 2015-12-23
US62/387,291 2015-12-23
PCT/CN2016/107241 WO2017088810A1 (en) 2015-11-27 2016-11-25 Method and apparatus of entropy coding and context modelling for video and image coding

Publications (2)

Publication Number Publication Date
CN108605130A CN108605130A (zh) 2018-09-28
CN108605130B true CN108605130B (zh) 2021-05-11

Family

ID=58763208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680068748.2A Active CN108605130B (zh) 2015-11-27 2016-11-25 一种用于对与区块相关的符号进行熵编解码的方法和装置

Country Status (4)

Country Link
US (1) US10863207B2 (zh)
EP (1) EP3363199B1 (zh)
CN (1) CN108605130B (zh)
WO (1) WO2017088810A1 (zh)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11223852B2 (en) * 2016-03-21 2022-01-11 Qualcomm Incorporated Coding video data using a two-level multi-type-tree framework
CA3025334C (en) * 2016-05-25 2021-07-13 Arris Enterprises Llc Binary ternary quad tree partitioning for jvet coding of video data
CN113905238B (zh) * 2016-07-05 2024-06-04 株式会社Kt 对视频进行解码或编码的方法和计算机可读介质
US10609423B2 (en) 2016-09-07 2020-03-31 Qualcomm Incorporated Tree-type coding for video coding
CA3046942A1 (en) * 2016-12-16 2018-06-21 Sharp Kabushiki Kaisha Image decoding device and image encoding device
EP3562153A4 (en) * 2016-12-26 2019-12-25 Nec Corporation IMAGE CODING METHOD, IMAGE DECODING METHOD, IMAGE CODING DEVICE, IMAGE DECODING DEVICE AND PROGRAM
US10536724B2 (en) * 2016-12-26 2020-01-14 Nec Corporation Video encoding method, video decoding method, video encoding device, video decoding device, and program
CA3051822A1 (en) * 2017-01-31 2018-08-09 Sharp Kabushiki Kaisha Systems and methods for performing planar intra prediction video coding
WO2018174617A1 (ko) 2017-03-22 2018-09-27 한국전자통신연구원 블록 형태에 기반한 예측 방법 및 장치
US20180367818A1 (en) * 2017-06-15 2018-12-20 Futurewei Technologies, Inc. Block Partition Structure in Video Compression
KR102343333B1 (ko) * 2017-07-07 2021-12-24 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
EP3662664B1 (en) * 2017-08-03 2024-09-04 Sharp Kabushiki Kaisha Systems and methods for partitioning video blocks in an inter prediction slice of video data
CN109510997B (zh) * 2017-09-15 2022-09-23 华为技术有限公司 图像编码方法及设备
WO2019059676A1 (ko) 2017-09-20 2019-03-28 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR102654647B1 (ko) * 2017-10-20 2024-04-04 인텔렉추얼디스커버리 주식회사 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
EP3701719B1 (en) * 2017-10-27 2024-02-21 Huawei Technologies Co., Ltd. Methods and apparatuses for signaling partioning information for picture encoding and decoding
EP3484150A1 (en) * 2017-11-09 2019-05-15 Thomson Licensing Methods and devices for picture encoding and decoding
EP3503557A1 (en) * 2017-12-22 2019-06-26 Thomson Licensing Method and apparatus for video encoding and decoding based on context switching
KR102618692B1 (ko) * 2018-06-15 2024-01-02 삼성전자주식회사 노이즈 또는 디서의 영향을 감소시키기 위한 디스플레이 구동 회로 및 방법
WO2019174567A1 (zh) * 2018-03-16 2019-09-19 华为技术有限公司 划分标志位的上下文建模方法及装置
US10972758B2 (en) * 2018-04-02 2021-04-06 Qualcomm Incorporated Multi-type-tree framework for transform in video coding
CN110636299B (zh) * 2018-06-21 2022-06-14 北京字节跳动网络技术有限公司 用于处理视频数据的方法、装置及计算机可读记录介质
US10848763B2 (en) 2018-11-14 2020-11-24 Tencent America LLC Method and apparatus for improved context design for prediction mode and coded block flag (CBF)
CN111277828B (zh) * 2018-12-04 2022-07-12 华为技术有限公司 视频编解码方法、视频编码器和视频解码器
US11115652B2 (en) 2018-12-07 2021-09-07 Tencent America LLC Method and apparatus for further improved context design for prediction mode and coded block flag (CBF)
TW202441955A (zh) * 2018-12-14 2024-10-16 美商松下電器(美國)知識產權公司 編碼裝置及解碼裝置
CN113316939A (zh) * 2018-12-24 2021-08-27 华为技术有限公司 一种标志位的上下文建模方法及装置
CN111435993B (zh) * 2019-01-14 2022-08-26 华为技术有限公司 视频编码器、视频解码器及相应方法
SG11202109482PA (en) * 2019-03-08 2021-09-29 Beijing Bytedance Network Technology Co Ltd Joint coding of palette mode usage indication
CN110267036B (zh) * 2019-03-11 2020-07-10 杭州海康威视数字技术股份有限公司 一种滤波方法及设备
WO2020207502A1 (en) 2019-04-12 2020-10-15 Beijing Bytedance Network Technology Co., Ltd. Most probable mode list construction for matrix-based intra prediction
CN113728647B (zh) * 2019-05-01 2023-09-05 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文编码
CN114051735B (zh) 2019-05-31 2024-07-05 北京字节跳动网络技术有限公司 基于矩阵的帧内预测中的一步下采样过程
CN113950836B (zh) 2019-06-05 2024-01-12 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文确定
US11516489B2 (en) * 2019-06-24 2022-11-29 Tencent America LLC Method and apparatus for video coding
CN112135135A (zh) * 2019-06-24 2020-12-25 腾讯美国有限责任公司 视频解码方法、装置、计算机设备及存储介质
CN112135128B (zh) * 2019-06-24 2024-07-05 华为技术有限公司 图像预测方法、编码树节点划分方法及其装置
US11190777B2 (en) * 2019-06-30 2021-11-30 Tencent America LLC Method and apparatus for video coding
EP3991411A4 (en) 2019-07-29 2022-08-24 Beijing Bytedance Network Technology Co., Ltd. Palette mode coding in prediction process
US11252443B2 (en) * 2019-08-12 2022-02-15 Tencent America LLC Method and apparatus for video coding
US11317090B2 (en) * 2019-08-12 2022-04-26 Tencent America LLC Method and apparatus for video coding
US11323743B2 (en) * 2019-08-26 2022-05-03 Tencent America LLC Interaction between CU partitions and sub-block transform
TWI864067B (zh) * 2019-09-23 2024-12-01 法商內數位Ce專利控股公司 編碼樹分割的方法與設備及其儲存媒體
US11259055B2 (en) * 2020-07-10 2022-02-22 Tencent America LLC Extended maximum coding unit size
CN114598873B (zh) * 2020-12-03 2023-06-20 华为技术有限公司 量化参数的解码方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102939756A (zh) * 2010-04-16 2013-02-20 Sk电信有限公司 视频编码/解码设备和方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8619853B2 (en) 2007-06-15 2013-12-31 Qualcomm Incorporated Separable directional transforms
CN106231323B (zh) 2010-04-13 2020-07-28 Ge视频压缩有限责任公司 解码器、解码方法、编码器以及编码方法
US20120170648A1 (en) * 2011-01-05 2012-07-05 Qualcomm Incorporated Frame splitting in video coding
US9654785B2 (en) 2011-06-09 2017-05-16 Qualcomm Incorporated Enhanced intra-prediction mode signaling for video coding using neighboring mode
AU2012274780B2 (en) * 2011-06-24 2016-03-31 Sun Patent Trust Decoding method, coding method, decoding apparatus, coding apparatus, and coding and decoding apparatus
CA2937885C (en) * 2011-07-01 2018-01-30 Samsung Electronics Co., Ltd. Method and apparatus for entropy encoding using hierarchical data unit, and method and apparatus for decoding
US9088770B2 (en) 2012-08-15 2015-07-21 Intel Corporation Size based transform unit context derivation
GB2505408A (en) 2012-08-24 2014-03-05 British Broadcasting Corp Video Encoding and Decoding with Chrominance Sub-sampling
US9538175B2 (en) 2012-09-26 2017-01-03 Qualcomm Incorporated Context derivation for context-adaptive, multi-level significance coding
US9686561B2 (en) * 2013-06-17 2017-06-20 Qualcomm Incorporated Inter-component filtering
WO2015131388A1 (en) 2014-03-07 2015-09-11 Qualcomm Incorporated Simplification of depth intra mode coding in 3d video coding

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102939756A (zh) * 2010-04-16 2013-02-20 Sk电信有限公司 视频编码/解码设备和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
图像的自适应分解算法及应用研究;范东光;《中国优秀硕士论文电子期刊》;20140915;全文 *

Also Published As

Publication number Publication date
US20180332288A1 (en) 2018-11-15
EP3363199B1 (en) 2021-05-19
US10863207B2 (en) 2020-12-08
WO2017088810A1 (en) 2017-06-01
EP3363199A1 (en) 2018-08-22
EP3363199A4 (en) 2019-06-19
CN108605130A (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
CN108605130B (zh) 一种用于对与区块相关的符号进行熵编解码的方法和装置
CN109479137B (zh) 用于彩色视频数据的调色板模式编解码的方法及装置
TWI669948B (zh) 編碼或解碼視頻資料之方法及裝置
RU2689182C1 (ru) Способ условного разбиения видео и изображений на блоки бинарного дерева для кодирования
TWI646829B (zh) 一種視訊編碼系統使用的視訊編碼方法及裝置
TWI683573B (zh) 用於視訊編解碼中具有畫面內方向預測模式之內含畫面內編解碼工具設定的方法和裝置
TWI720584B (zh) 視訊處理系統中色度量化參數導出的方法以及裝置
CN107005718B (zh) 使用二叉树块分区的视频编码的方法
TWI702833B (zh) 一種用於視訊編解碼系統的視訊編解碼方法和裝置
US11039147B2 (en) Method and apparatus of palette mode coding for colour video data
CN113906737B (zh) 具有分割限制条件的小尺寸编码单元分割方法和装置
TWI729569B (zh) 帶有約束的亮度-色度單獨的編碼樹編碼的方法和設備
CN111937404B (zh) 一种用于视频编码器或解码器的视频编解码方法及装置
WO2017088170A1 (en) Entropy coding the binary tree block partitioning structure
CN108781299A (zh) 用于视频和图像编解码的预测二叉树结构的方法和装置
TWI761166B (zh) 圖像和視訊編解碼中發信切片分割資訊之方法和裝置
CN119547431A (zh) 使用梯度和模板改进帧内模式推导和预测的方法和装置
CN118947115A (zh) 在视频编解码中使用发送预定分区的cu划分方法和装置
CN119343917A (zh) 用于视频编码系统中的熵编码分区划分决策的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220610

Address after: 7, floor 3, No. 5, Taiyuan 1st Street, Zhubei City, Hsinchu County, Taiwan, China, China

Patentee after: MEDIATEK Inc.

Address before: Hsinchu Science Park Road, Taiwan city of Hsinchu China Dusing 1

Patentee before: MEDIATEK Inc.

TR01 Transfer of patent right