CN119654861A - 用于在帧内块复制模式下使用预测信号的重排列的视频编码的方法和装置 - Google Patents
用于在帧内块复制模式下使用预测信号的重排列的视频编码的方法和装置 Download PDFInfo
- Publication number
- CN119654861A CN119654861A CN202380056246.8A CN202380056246A CN119654861A CN 119654861 A CN119654861 A CN 119654861A CN 202380056246 A CN202380056246 A CN 202380056246A CN 119654861 A CN119654861 A CN 119654861A
- Authority
- CN
- China
- Prior art keywords
- block
- sub
- blocks
- current block
- splitting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 92
- 230000008707 rearrangement Effects 0.000 title claims abstract description 32
- 239000013598 vector Substances 0.000 claims description 102
- 238000001914 filtration Methods 0.000 description 16
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 238000013139 quantization Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000005457 optimization Methods 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 108010063123 alfare Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本实施方式公开了一种用于在帧内块复制模式下使用预测信号的重排列的视频编码的方法和装置。在本实施方式中,视频解码装置获得指示当前块的水平分裂或垂直分裂的分裂方向,并且获得子块相对于当前块的比例。视频解码装置根据帧内块复制(IBC)模式生成当前块的初始预测块。视频解码装置根据分裂方向和子块的比例,将初始预测块分裂为子块,然后再对子块的顺序进行重排列,生成当前块的最终预测块。
Description
技术领域
本公开涉及在帧内块复制模式下使用预测信号的重排列的视频编码(coding)方法和装置。
背景技术
该部分中的陈述仅提供与本公开相关的背景信息,并且不一定构成现有技术。
因为视频数据与音频或静止图像数据相比具有大的数据量,所以在没有进行压缩处理的情况下,视频数据需要大量硬件资源(包括存储器)来存储或传输视频数据。
因而,编码器通常用于压缩和存储或传输视频数据。解码器接收压缩视频数据,对接收到的压缩视频数据进行解压缩,播放解压缩后的视频数据。视频压缩技术包括H.264/高级视频编码(AVC)、高效率视频编码(HEVC)和多用途视频编码(VVC),其与HEVC相比具有大约30%或更多的改善的编码效率。
然而,由于图像尺寸、分辨率和帧速率逐渐增加,所以要编码的数据量也增加。因而,需要提供比现有压缩技术更高的编码效率和改善的图像增强效果的新压缩技术。
在执行当前块的预测时,帧内块复制(IBC)模式使用解析的块向量信息从当前帧中的重构区域生成当前块的预测块。IBC模式被划分为合并模式和高级运动向量预测(advanced motion vector prediction,AMVP)模式。在合并模式中,编码器用信号发送合并指数,且在AMVP模式中,编码器用信号发送指示块向量预测因子(BVP)和块向量差(BVD)的指数。在如上所述的IBC模式中,当前块作为单个块进行处理。因此,为了提高视频编码效率和增强视频质量,需要考虑利用当前块的子块。
发明内容
[技术问题]
本公开试图提供一种用于在当前块的预测信号通过使用块向量从当前帧中的重构区域生成时通过重排列初始预测信号来重构当前块的视频编码方法和装置。
[技术方案]
本公开的至少一个方面提供了一种通过视频解码装置来重构当前块的方法。该方法包括:获得当前块的分裂方向,分裂方向指示水平分裂或垂直分裂。方法还包括获得子块相对于当前块的比例。方法还包括:根据帧内块复制(IBC)模式生成当前块的初始预测块。方法还包括基于分裂方向和子块的比例将初始预测块分裂成子块。方法还包括通过对子块进行重排列来生成当前块的最终预测块。
本公开的另一方面提供可一种通过视频编码装置对当前块进行编码的方法。该方法包括:根据帧内块复制(IBC)模式生成当前块的初始预测块。方法还包括获得当前块的分裂方向,且分裂方向指示水平分裂或垂直分裂。方法还包括获得子块相对于当前块的比例。方法还包括基于分裂方向和子块的比例将初始预测块分裂成子块。方法还包括通过对子块进行重排列来生成述当前块的最终预测块。
本公开的又一方面提供了一种存储由视频编码方法生成的比特流的计算机可读记录介质。视频编码方法包括:根据帧内块复制(IBC)模式生成当前块的初始预测块。视频编码方法包括:获得当前块的分裂方向,并且分裂方向指示水平分裂或垂直分裂。视频编码方法包括:获得子块相对于当前块的比例。视频编码方法包括:基于分裂方向和子块的比例将初始预测块分裂成子块。视频编码方法包括:通过对子块进行重排列来生成当前块的最终预测块。
[有益效果]
如上所述,本公开提供了一种在当前块的预测信号通过使用块向量从当前帧的重构区域生成时通过重排列初始信号来重构当前块的视频编码方法和装置。由此,视频编码方法和装置提高了视频编码效率并提高了视频质量。
附图说明
图1是可以实施本公开的技术的视频编码装置的框图。
图2示出用于使用四叉树加二叉树三叉树(QTBTTT)结构来分割块的方法。
图3A和图3B示出包括广角帧内预测模式的多个帧内预测模式。
图4示出当前块的邻近块。
图5是可以实施本公开的技术的视频解码装置的框图。
图6是详述根据本公开的至少一个实施方式的视频解码装置的一部分的框图。
图7是根据本公开的至少一个实施方式的由视频解码装置执行的用于基于IBC(帧内块复制)模式预测当前块的方法的流程图。
图8是示出根据本公开的至少一个实施方式的垂直分割的子块的示图。
图9是示出根据本公开的至少一个实施方式的水平分割的子块的图。
图10至图13是示出根据本公开的一些实施方式的初始预测块的重排列的示图。
图14是根据本公开另一实施方式的由视频解码装置执行的用于基于IBC模式预测当前块的方法的流程图。
图15是示出根据本公开的至少一个实施方式的垂直地或水平地分割的子块的图。
图16A和图16B是示出根据本公开的至少一个实施方式的对子块边界应用滤波示图。
图17A和图17B是示出根据本公开的另一实施方式的对子块边界应用滤波的示图。
图18是根据本公开的至少一个实施方式的由视频编码装置执行的用于基于IBC模式预测当前块的方法的流程图。
具体实施方式
在下文中,参照附图详细描述本公开的一些实施方式。在以下描述中,相同的参考标号表示相同的元件,尽管元件在不同的附图中示出。此外,在一些实施方式的以下描述中,为了清楚和简洁的目的,当认为使本公开的主题模糊时,可以省略相关已知部件和功能的详细描述。
图1是可以实施本公开的技术的视频编码装置的框图。在下文中参照图1的示出,描述视频编码装置和该装置的部件。
编码装置可以包括图片分裂器110、预测器120、减法器130、变换器140、量化器145、重排单元150、熵编码器155、逆量化器160、逆变换器165、加法器170、环路滤波器单元180和存储器190。
编码装置的每个部件可以实施为硬件或软件或者实施为硬件和软件的组合。此外,每个部件的功能可以实施为软件,并且还可以实施微处理器以执行与每个部件相对应的软件的功能。
一个视频由包括多个图片的一个或多个序列构成。每个图片被分裂为多个区域,并对每个区域执行编码。例如,将一个图片分裂成一个或多个片(tile)或/和切片(slice)。这里,一个或多个片可以被定义为片组。每一片或/和切片被分裂成一或多个编码树单元(CTU)。另外,每一个CTU通过树结构分裂成一或多个编码单元(CU)。将应用于每一个编码单元(CU)的信息编码为CU的语法,且将共同应用于包括在一个CTU中的CU的信息编码为CTU的语法。此外,共同应用于一个切片中的所有块的信息被编码为切片报头的语法,并且应用于构成一个或多个图片的所有块的信息被编码为图片参数集(PPS)或图片报头。此外,将多个图片共同参考的信息编码到序列参数集(SPS)。另外,一个或多个SPS共同参考的信息被编码到视频参数集(VPS)。进一步,共同应用于一片或片组的信息也可以被编码为片或片组报头的语法。包括在SPS、PPS、片报头、片或片组报头中的语法可以被称为高级语法。
图片分裂器110确定编码树单元(coding tree unit,CTU)的尺寸。关于CTU的大小(CTU大小)的信息被编码为SPS或PPS的语法并且被传送到视频解码装置。
图片分裂器110将构成视频的每个图片分裂成具有预定尺寸的多个编码树单元(CTU),然后通过使用树结构递归分裂CTU。树结构中的叶节点变成编码单元(CU),其是编码的基本单元。
树结构可以是四叉树(QT),其中,较高节点(或父节点)被分裂成具有相同大小的四个较低节点(或子节点)。树结构也可以是二叉树(BT),其中较高节点被分裂成两个较低节点。树结构还可以是三叉树(TT),其中,较高节点以1:2:1的比例被分裂为三个较低节点。树结构还可以是QT结构、BT结构和TT结构中的两个或多个结构被混合的结构。例如,可以使用四叉树加二叉树(QTBT)结构或者可以使用四叉树加二叉树三叉树(QTBTTT)结构。这里,将二叉树三叉树(BTTT)添加到树结构以被称为多类型树(MTT)。
图2是用于描述通过使用QTBTTT结构分裂块的方法的示图。
如图2所示,CTU可以首先被分裂成QT结构。四叉树分裂可以是递归的,直到分裂块的大小达到在QT中允许的叶节点的最小块大小(MinQTSize)。指示QT结构的每个节点是否被分裂为下层的四个节点的第一标志(QT_split_flag)由熵编码器155编码,并被发送到视频解码装置。当QT的叶节点不大于在BT中允许的根节点的最大块大小(MaxBTSize)时,叶节点可进一步被分裂为BT结构和TT结构中的至少一个。在BT结构和/或TT结构中可以存在多个分裂方向。例如,可以存在两个方向,即,相应节点的块被水平分裂的方向和相应节点的块被垂直分裂的方向。如图2所示,当MTT分裂开始时,指示节点是否被分裂的第二标志(mtt_split_flag)以及另外指示分裂方向(垂直或水平)的标志和/或如果节点被分裂则指示分裂类型(双叉或三叉)的标志由熵编码器155编码并用信号发送给视频解码装置。
可选地,在编码指示每个节点是否被分裂为下层的四个节点的第一标志(QT_split_flag)之前,指示节点是否被分裂的CU分裂标志(split_cu_flag)也可被编码。当CU分裂标志(split_cu_flag)的值指示每一节点未分裂时,对应节点的块变为分裂树结构中的叶节点且变为作为编码的基本单元的CU。当CU分割标志(split_cu_flag)的值指示每个节点被分割时,视频编码装置首先通过上述方案开始编码第一标志。
当QTBT被用作树结构的另一实例时,可存在两种类型,即,相应节点的块被水平分裂为具有相同尺寸的两个块的类型(即,对称水平分裂)和相应节点的块被垂直分裂为具有相同尺寸的两个块的类型(即,对称垂直分裂)。指示BT结构的每个节点是否被分割为下层的块的分割标志(split_flag)和指示分割类型的分割类型信息由熵编码器155编码,并被传送到视频解码装置。同时,可以另外呈现将对应节点的块分裂为彼此不对称的两个块的类型。对对称形式可以包括其中对应节点的块被分裂为具有1:3的尺寸比的两个矩形块的形式,或者还可以包括其中对应节点的块被沿对角线方向分裂的形式。
CU可以根据来自CTU的QTBT或QTBTTT分裂而具有不同大小。在下文中,对应于待编码或解码的CU(即,QTBTTT的叶节点)的块被称为“当前块”。由于采用QTBTTT分裂,当前块的形状除了正方形形状外,还可以是矩形形状。
预测器120预测当前块以生成预测块。预测器120包括帧内预测器122和帧间预测器124。
通常,图片中的当前块中的每一者可以被预测性编码。通常,当前块的预测可以通过使用帧内预测技术(使用来自包括当前块的图片的数据)或者帧间预测技术(使用来自在包括当前块的图片之前被编码的图片的数据)来执行。帧间预测包括单向预测和双向预测两者。
帧内预测器122通过使用在包括当前块的当前图片中位于当前块的邻位上的像素(参考像素)来预测当前块中的像素。根据预测方向,存在多个帧内预测模式。例如,如图3A中所示,多个帧内预测模式可以包括包含平面模式和DC模式的2个非定向模式,并且可以包括65个定向模式。邻近像素和将被使用的算术等式根据每个预测模式被不同地定义。
为了对具有矩形形状的当前块进行有效的定向预测,可以附加地使用如图3B中的虚线箭头图示的定向模式(#67至#80,帧内预测模式#-1至#-14)。定向模式可被称作“广角帧内预测模式”。在图3B中,箭头指示用于预测的对应参考样本并且不表示预测方向。预测方向与箭头所示的方向相反。在当前块具有矩形形状时,广角帧内预测模式是在没有附加比特传输的情况下以与特定方向模式相反的方向执行预测的模式。在这种情况下,在广角帧内预测模式中,可以通过具有矩形形状的当前块的宽度和高度的比例确定可以用于当前块的一些广角帧内预测模式。例如,在当前块具有高度小于宽度的矩形形状时,具有小于45度的角度的宽角度帧内预测模式(帧内预测模式#67至#80)是可用的。在当前块具有宽度大于高度的矩形形状时,可以使用具有大于-135度的角度的广角帧内预测模式。
帧内预测器122可以确定将用于对当前块进行编码的帧内预测。在一些实例中,帧内预测器122可以通过使用多个帧内预测模式对当前块进行编码,且还可以从测试模式中选择将使用的适当帧内预测模式。例如,帧内预测器122可以通过使用针对多个测试的帧内预测模式的速率-失真分析来计算速率-失真值,并且还可以在测试模式中选择具有最佳速率-失真特征的帧内预测模式。
帧内预测器122在多个帧内预测模式中选择一个帧内预测模式,并通过使用相邻像素(参考像素)和根据选择的帧内预测模式确定的算术等式来预测当前块。关于所选择的帧内预测模式的信息由熵编码器155编码,并被传送到视频解码装置。
帧间预测器124通过使用运动补偿处理来生成用于当前块的预测块。帧间预测器124在比当前图片更早地编码和解码的参考图片中搜索与当前块最相似的块,并且通过使用搜索到的块生成用于当前块的预测块。另外,生成运动向量(MV),其对应于在当前图片中的当前块和在参考图片中的预测块之间的位移。通常,对亮度分量执行运动估计,并且基于亮度分量计算的运动向量被用于亮度分量和色度分量两者。包括关于参考图片的信息和关于用于预测当前块的运动向量的信息的运动信息由熵编码器155编码,并被传送到视频解码装置。
帧间预测器124还可以对参考图片或参考块执行内插以便增加预测的准确度。换句话说,两个连续整数样本之间的子样本通过将滤波器系数应用于包括两个整数样本的多个连续整数样本而被内插。当针对内插的参考图片执行搜索与当前块最相似的块的处理时,可以针对运动向量表示不是整数样本单位精度,而是十进制单位精度。可以针对待编码的每一目标区域(例如,例如切片、片、CTU、CU等单元)不同地设置运动向量的精度或分辨率。当应用这样的自适应运动向量分辨率(AMVR)时,应针对每一目标区域用信号发送关于待应用于每一目标区域的运动向量分辨率的信息。例如,当目标区域是CU时,用信号发送关于应用于每个CU的运动向量分辨率的信息。关于运动向量分辨率的信息可以是表示将在下面描述的运动向量差的精度的信息。
同时,帧间预测器124可以通过使用双向预测来执行帧间预测。在双向预测的情况下,使用两个参考图片和表示在每个参考图片中最类似于当前块的块位置的两个运动向量。帧间预测器124分别从参考图片列表0(RefPicList0)和参考图片列表1(RefPicList1)选择第一参考图片和第二参考图片。帧间预测器124还搜索与相应参考图片中的当前块最相似的块以生成第一参考块和第二参考块。另外,通过对第一参考块和第二参考块进行平均或加权平均来生成当前块的预测块。另外,包括关于用于预测当前块的两个参考图片的信息并且包括关于两个运动向量的信息的运动信息被传送到熵编码器155。在这里,参考图片列表0可以由在预重构的图片当中的按照显示顺序在当前图片之前的图片组成,并且参考图片列表1可以由在预重构的图片当中的按照显示顺序在当前图片之后的图片组成。然而,虽然不特别限于此,但是按照显示顺序在当前图片之后的预重构的图片可以附加地包括在参考图片列表0中。相反地,在当前图片之前的预重构的图片也可以附加地包括在参考图片列表1中。
为了最小化用于编码运动信息所消耗的比特数量,可以使用各种方法。
例如,在当前块的参考图片和运动向量与相邻块的参考图片和运动向量相同时,能够识别相邻块的信息被编码以将当前块的运动信息传送到视频解码装置。这种方法被称为合并模式。
在合并模式中,帧间预测器124从当前块的相邻块中选择预定数量的合并候选块(在下文中,称为“合并候选”)。
作为用于推导合并候选的相邻块,如在图4中示出的,可以使用在当前图片中邻近于当前块的左块A0、左下块A1、上块B0、右上块B1、和左上块B2中的全部或一些。进一步,位于除当前块所位于的当前图片之外的参考图片(可以与用于预测当前块的参考图片相同或不同)内的块也可以用作合并候选。例如,在参考图片内与当前块位于同一地点的块或邻近于位于同一地点的块的块可以另外用作合并候选。如果通过上文所描述的方法选择的合并候选的数目小于预设数目,那么将零向量添加到合并候选。
帧间预测器124通过使用邻近块配置包括预定数目的合并候选的合并列表。从包括在合并列表中的合并候选中选择要用作当前块的运动信息的合并候选,并且生成用于识别所选择的候选的合并指数信息。所生成的合并指数信息由熵编码器155编码,并被传送到视频解码装置。
合并跳跃模式是合并模式的特殊情况。在量化之后,当用于熵编码的所有变换系数接近于零时,仅发送相邻块选择信息而不发送残余信号。通过使用合并跳跃模式,对于具有轻微运动的图像、静止图像、屏幕内容图像等等可以实现相对高的编码效率。
在下文中,合并模式和合并跳跃模式被统称为合并/跳跃模式。
用于编码运动信息的另一方法是高级运动向量预测(AMVP)模式。
在AMVP模式中,帧间预测器124通过使用当前块的邻近块推导用于当前块的运动向量的运动向量预测候选(motion vector predictor candidate)。作为用于推导运动向量预测候选的相邻块,可以使用与在图4中示出的当前图片中的当前块相邻的左块A0、左下块A1、上块B0、右上块B1和左上块B2中的全部或一些。此外,位于除当前块所位于的当前图片之外的参考图片(可以与用于预测当前块的参考图片相同或不同)内的块也可以用作用于推导运动向量预测候选的相邻块。例如,可以使用在参考图片之内与当前块位于同一地点的块或者邻近于统一地点的块的块。如果通过上述方法选择的运动向量候选的数目小于预设数目,那么将零向量添加到运动向量候选。
帧间预测器124通过使用邻近块的运动向量推导运动向量预测候选,并通过使用运动向量预测候选确定用于当前块的运动向量的运动向量预测。另外,通过从当前块的运动向量减去运动向量预测来计算运动向量差。
运动向量预测(motion vector predictor)可以通过将预定义的函数(例如,中心值和平均值计算等)应用于运动向量预测候选来获得。在这种情况下,视频解码装置还知道预定义的函数。此外,由于用于推导运动向量预测候选的邻近块是编码和解码已经完成的块,所以视频解码装置还可能已经知道邻近块的运动向量。因此,视频编码装置不需要对用于识别运动向量预测候选的信息进行编码。因而,在这种情况下,关于运动向量差的信息和关于用于预测当前块的参考图片的信息被编码。
同时,还可以通过选择运动向量预测候选中的任何一个的方案来确定运动向量预测。在这种情况下,用于识别选择的运动向量预测候选的信息与关于运动向量差的信息和关于用于预测当前块的参考图片的信息联合地另外编码。
减法器130通过从当前块中减去由帧内预测器122或帧间预测器124生成的预测块来生成残差块。
变换器140将具有空间域的像素值的残差块中的残差信号变换为频域的变换系数。变换器140可以通过将残差块的总尺寸用作变换单元来对残差块中的残差信号进行变换,或者还可以将残差块分裂成多个子块,并可通过将子块用作变换单元来执行变换。可选地,残差块被分裂为两个子块,分别为变换区域和非变换区域,以仅使用变换区域子块作为变换单元对残差信号进行变换。这里,变换区域子块可以是基于水平轴(或垂直轴)具有1:1的尺寸比的两个矩形块之一。在这种情况下,标志(cu_sbt_flag)指示仅变换子块,并且方向(垂直/水平)信息(cu_sbt_horizontal_flag)和/或位置信息(cu_sbt_pos_flag)由熵编码器155编码并用信号发送给视频解码装置。此外,变换区域子块的大小可以基于水平轴(或垂直轴)具有1:3的大小比例。在这种情况下,划分相应分裂的标志(cu_sbt_quad_flag)另外由熵编码器155编码,并用信号发送给视频解码装置。
同时,变换器140可以在水平方向和垂直方向上单独地对残差块执行变换。对于变换,可使用不同类型的变换函数或变换矩阵。例如,用于水平变换和垂直变换的一对变换函数可被定义为多重变换集合(MTS)。变换器140可以选择在MTS中具有最高变换效率的一个变换函数对,并且可以在水平和垂直方向中的每一者上变换残余块。关于MTS中的变换函数对的信息(mts_idx)由熵编码器155编码并用信号发送给视频解码装置。
量化器145使用量化参数量化从变换器140输出的变换系数,并将量化的变换系数输出到熵编码器155。量化器145还可以立即量化相关的残差块,而无需针对任何块或帧的变换。量化器145还可以根据变换块中的变换系数的位置应用不同的量化系数(缩放值)。应用于以2维布置的量化的变换系数的量化矩阵可以被编码并用信号发送给视频解码装置。
重排单元150可以执行针对量化的残差值的系数值的重排列。
重排单元150可以通过使用系数扫描将2D系数阵列改变为1D系数序列。例如,重排单元150可以通过使用Z字形扫描或者对角线扫描将DC系数扫描为高频域系数来输出ID系数序列。根据变换单元的尺寸和帧内预测模式,还可使用沿列方向扫描2D系数阵列的垂直扫描和沿行方向扫描2D块类型系数的水平扫描来代替Z字形扫描。换句话说,根据变换单元的尺寸和帧内预测模式,可以在Z字形扫描、对角扫描、垂直扫描和水平扫描中确定要使用的扫描方法。
熵编码器155通过使用包括基于上下文的自适应二进制算术码(CABAC)、指数哥伦布等的各种编码方案对从重排单元150输出的ID量化的变换系数的序列进行编码来生成比特流。
此外,熵编码器155对与块分裂相关的信息(诸如,CTU尺寸、CTU分裂标志、QT分裂标志、MTT分裂类型、MTT分裂方向等)进行编码,以允许视频解码装置将块等同地分裂到视频编码装置。此外,熵编码器155对关于指示当前块是通过帧内预测还是帧间预测来编码的预测类型的信息进行编码。熵编码器155根据预测类型对帧内预测信息(即,关于帧内预测模式的信息)或帧间预测信息(在合并模式的情况下,合并指数,以及在AMVP模式的情况下,关于参考图片指数和运动向量差的信息)进行编码。此外,熵编码器155对与量化相关的信息(即,关于量化参数的信息和关于量化矩阵的信息)进行编码。
逆量化器160对从量化器145输出的量化的变换系数进行去量化以生成变换系数。逆变换器165将从逆量化器160输出的变换系数从频域变换到空间域,以重构残差块。
加法器170将重构的残差块和由预测器120生成的预测块相加以重构当前块。当对下一顺序块进行帧内预测时,重构的当前块中的像素可用作参考像素。
环路滤波器单元180对重构像素执行滤波,以便减少由于基于块的预测和变换/量化而发生的块伪影、振铃伪影、模糊伪影等。作为环路滤波器的环路滤波器单元180可以包括去块滤波器182、样本自适应偏移(SAO)滤波器184和自适应环路滤波器(ALF)186的全部或一些。
去块滤波器182对重构块之间的边界进行滤波以便去除由于块单元编码/解码而发生的块伪影,并且SAO滤波器184和ALF 186执行针对去块的滤波视频的附加滤波。SAO滤波器184和ALF 186是用于补偿重构像素与原始像素之间由于有损编码而导致的差的滤波器。SAO滤波器184应用偏移作为CTU单元以增强主观图像质量和编码效率。另一方面,ALF186执行块单元滤波,并且通过划分相应块的边界和变化量的程度来应用不同的滤波器来补偿失真。关于将用于ALF的滤波器系数的信息可以被编码并用信号发送给视频解码装置。
通过去块滤波器182、SAO滤波器184和ALF 186滤波的重构的块被存储在存储器190中。当一个图片中的所有块被重构时,重构的图片可以用作参考图片,用于对之后要编码的图片内的块进行帧间预测。
视频编码装置可以将编码的视频数据的比特流存储在非暂时性存储介质中,或通过通信网络将比特流发送至视频解码装置。
图5是可以实施本公开的技术的视频解码装置的功能框图。在下文中,参照图5,描述视频解码装置和装置的部件。
视频解码装置可以包括熵解码器510、重排单元515、逆量化器520、逆变换器530、预测器540、加法器550、环路滤波器单元560和存储器570。
与图1的视频编码装置相似,视频解码装置的每个部件可实现为硬件或软件或实现为硬件和软件的组合。此外,每个部件的功能可以实现为软件,并且还可以实现微处理器以执行与每个部件对应的软件的功能。
熵解码器510通过对由视频编码装置生成的比特流进行解码以确定将被解码的当前块来提取与块分裂相关的信息,并且提取重构当前块所需的预测信息和关于残差信号的信息。
熵解码器510通过从序列参数集合(SPS)或图片参数集合(PPS)提取关于CTU大小的信息来确定CTU的大小,并且将图片分割成具有确定大小的CTU。另外,CTU被确定为树结构的最高层,即根节点,并且可以提取CTU的分裂信息,以使用树结构对CTU进行分裂。
例如,当使用QTBTTT结构对CTU进行分裂时,首先提取与QT的分裂相关的第一标志(QT_split_flag),以将每个节点分裂为下层的四个节点。此外,针对与QT的叶节点相应的节点,提取与MTT的分裂相关的第二标志(mtt_split_flag)、分裂方向(垂直/水平)和/或分裂类型(二叉/三叉),以将相应的叶节点分裂为MTT结构。结果,在QT的叶节点下面的每个节点被递归地分裂成BT或TT结构。
作为另一实例,当通过使用QTBTTT结构来分裂CTU时,提取指示CU是否被分裂的CU分裂标志(split_cu_flag)。当对应的块被分裂时,第一标志(QT_split_flag)也可以被提取。在分裂过程期间,对于每个节点,0次或更多次的递归MTT分裂可以在0次或更多次的递归QT分裂之后发生。例如,对于CTU,MTT分裂可以立即发生,或者相反,可以仅发生多次的QT分裂。
作为另一实例,当使用QTBT结构对CTU进行分裂时,提取与QT的分裂有关的第一标志(QT_split_flag),以将每个节点分裂成下层的四个节点。此外,提取指示与QT的叶节点相对应的节点是否被进一步分裂成BT的分割标志(split_flag)以及分裂方向信息。
同时,当熵解码器510通过使用树结构的分裂确定将被解码的当前块时,熵解码器510提取关于指示当前块是被帧内预测还是被帧间预测的预测类型的信息。当预测类型信息指示帧内预测时,熵解码器510提取用于当前块的帧内预测信息(帧内预测模式)的语法元素。当预测类型信息指示帧间预测时,熵解码器510提取表示用于帧间预测信息的语法元素(即,运动向量和运动向量参考的参考图片)的信息。
此外,熵解码器510提取量化相关信息并且提取关于当前块的量化的变换系数的信息作为关于残差信号的信息。
重排单元515可以再次以与由视频编码装置执行的系数扫描顺序相反的顺序,将由熵解码器510熵解码的1D量化的变换系数的序列改变为2D系数阵列(即,块)。
逆量化器520去量化量化的变换系数,并且通过使用量化参数去量化量化的变换系数。逆量化器520还可以将不同的量化系数(缩放值)应用于以2D布置的量化的变换系数。逆量化器520可以通过将来自视频编码装置的量化系数的矩阵(缩放值)应用于量化的变换系数的2D阵列来执行去量化。
逆变换器530通过将去量化的变换系数从频域逆变换到空间域中来重构残差信号而生成当前块的残差块。
此外,当逆变换器530逆变换变换块的部分区域(子块)时,逆变换器530提取仅变换块的子块被变换的标志(cu_sbt_flag)、子块的方向(垂直/水平)信息(cu_sbt_horizontal_flag)和/或子块的位置信息(cu_sbt_pos_flag)。逆变换器530还将相应子块的变换系数从频域逆变换到空间域中以重构残差信号并且利用值“0”作为残差信号填充未逆变换的区域以生成当前块的最终残差块。
此外,当应用MTS时,逆变换器530通过使用从视频编码装置信号通知的MTS信息(mts_idx)来确定在水平方向和垂直方向中的每一个方向上应用的变换指数或变换矩阵。逆变换器530还通过使用所确定的变换函数在水平方向和垂直方向上对变换块中的变换系数执行逆变换。
预测器540可以包括帧内预测器542和帧间预测器544。在当前块的预测类型是帧内预测时激活帧内预测器542,并且在当前块的预测类型是帧间预测时激活帧间预测器544。
帧内预测器542根据从熵解码器510提取的帧内预测模式的语法元素,在多个帧内预测模式之中确定当前块的帧内预测模式。帧内预测器542还根据帧内预测模式通过使用当前块的邻近参考像素来预测当前块。
帧间预测器544通过使用从熵解码器510提取的用于帧间预测模式的语法元素确定当前块的运动向量和运动向量参考的参考图片。
加法器550通过将从逆变换器530输出的残差块和从帧间预测器544或帧内预测器542输出的预测块相加来重构当前块。在对之后要解码的块进行帧内预测时,重构的当前块内的像素被用作参考像素。
作为环路滤波器的环路滤波器单元560可以包括去块滤波器562、SAO滤波器564和ALF 566。去块滤波器562对重构块之间的边界执行去块滤波,以便去除由于块单元解码而发生的块伪影。SAO滤波器564和ALF 566在去块滤波之后对重构块执行附加滤波,以便补偿重构像素和原始像素之间由于有损编码而导致的差。通过使用关于从比特流解码的滤波器系数的信息来确定ALF的滤波器系数。
通过去块滤波器562、SAO滤波器564和ALF 566滤波的重构块被存储在存储器570中。当一个图片中的所有块被重构时,重构的图片可以用作参考图片,用于对之后要编码的图片内的块进行帧间预测。
在一些实施方式中,本公开涉及如上文所描述的对视频图像进行编码和解码。更具体地,本公开提供一种用于在当前块的预测信号是通过使用块向量从当前帧中的重构区域生成时通过对初始预测信号进行重排列来重构当前块的视频编码方法和装置。
以下实施方式可以由视频编码装置中的预测器120执行。以下实施方式也可以由视频解码装置中的预测器540执行。
对当前块进行编码过程中,视频编码装置在可以在优化率失真方面生成与本实施例相关联的信令信息。视频编码装置可以使用熵编码器155对信令信息进行编码,并将编码的信令信息发送到视频解码装置。视频解码装置可以使用熵解码器510以从比特流解码与当前块的解码相关联的信令信息。
在以下描述中,术语“目标块”可以与当前块或编码单元(CU)互换地使用,或可指代编码单元的某一区域。
此外,一个标志的值为真指示该标志被设置为1时。另外,一个标志的值是假指示该标志被设置为0时。
I.块内复制(IBC)
IBC使用块向量复制同一帧中的参考块,进行当前块的帧内预测,以生成当前块的预测块。
视频编码装置执行块匹配以导出最优块向量。这里,块向量表示从当前块到参考块的位移。为了增加编码效率,视频编码装置可以不照原样发送块向量,而是可将其分裂成块向量预测因子(BVP)和块向量差(BVD),并对BVP和BVD进行编码,然后将BVP和BVD发送给视频解码装置。
在下文中,BVD和块向量被视为具有相同的空间分辨率。
就利用块向量而言,IBC具有帧间预测的特性。因此,IBC可以分类为IBC合并/跳跃模式和IBC AMVP模式。
在IBC合并/跳跃模式的情况下,视频编码装置首先构成IBC合并列表。在优化编码效率方面,视频编码装置可以选择包括在IBC合并列表中的候选中的一个候选的块向量,并使用选择的块向量作为块向量预测因子(block vector predictor,BVP)。视频编码装置确定指示所选块向量的合并指数。然而,视频编码装置不生成BVD。视频编码装置对合并指数进行编码并将其发送到视频解码装置。IBC合并列表可以由视频编码装置和视频解码装置以相同方式构成。在解码合并指数之后,视频解码装置可以使用合并指数来从IBC合并列表生成块向量。
在IBC跳跃模式的情况下,视频编码装置利用与IBC合并模式相同的方法进行块向量发送,但是不发送与当前块和预测块之间的差对应的残差块。
当在IBC AMVP模式中时,视频编码装置确定块向量并在优化编码效率方面构成IBC AMVP列表。视频编码装置将指示包括在IBC AMVP列表中的候选块向量之一的候选指数确定为BVP(块向量预测因子)。视频编码装置计算作为BVP与块向量之间的差值的BVD(块向量差)。然后,视频编码装置编码候选指数和BVD,并且将候选指数和BVD传送给视频解码装置。
另一方面,视频解码装置对候选指数和BVD进行解码。在从IBC AMVP列表中获得由候选指数指示的BVP时,视频解码装置可以将BVP和BVD相加以重构块向量。
参考视频解码装置来描述以下实施方式,但可在视频编码装置中同等地或类似地实现以下实施方式。
II.根据本公开的实施方式
图6是详述根据本公开的至少一个实施方式的视频解码装置的一部分的框图。
根据一些实施方式的视频解码装置可以确定预测单元和变换单元,并且对于与所确定的单元相对应的当前块,通过使用所确定的预测技术和预测模式执行预测和逆变换,以最终生成当前块的重构块。图6中示出的操作可以由视频解码装置的逆变换器530、预测器540和加法器550执行。另一方面,如图6中示出的相同操作可以由视频编码装置的逆变换器165、图片分裂器110、预测器120、和加法器170执行。在此情况下,视频解码装置使用从比特流解析的编码信息,但视频编码装置可以在最小化速率失真方面使用来自较高水平的编码信息集。在下文中,为了方便起见,以视频解码装置为中心描述实施方式。
如图5中所示,取决于预测技术,预测器540包括帧内预测器542和帧间预测器544,但是如图6中所示,预测器540可以包括预测单元确定器602、预测技术确定器604、预测模式确定器606和预测执行器608的全部或部分。
预测单元确定器602确定预测单元(PU)。预测技术确定器604相对于预测单元确定预测技术,例如,帧内预测、帧间预测或帧内块复制(IBC)模式、调色板模式等。预测模式确定器606确定用于预测技术的详细预测模式。预测执行器608根据确定的预测模式生成当前块的预测块。
逆变换器530包括变换单元确定器610和逆变换执行器612。变换单元确定器610响应于当前块的逆量化信号来确定变换单元(TU),并且逆变换执行器612对由逆量化信号表示的变换单元进行逆变换以生成残差信号。
加法器550对预测块和残差信号进行求和以生成重构块。重构块被存储在存储器中并且可以用于在将来预测其他块。
由预测单元确定器602确定的预测单元可以变成当前块或者从当前块分裂的子块中的一个子块。在这种情况下,取决于颜色格式,色度分量的预测单元可以在大小上对应于亮度分量的预测单元。可选地,亮度分量和色度分量的预测单元可以单独地确定,并且可以针对色度分量的预测单元执行预测。
预测技术确定器604确定用于预测单元的预测技术。如上所述,预测技术可以为帧间预测、帧内预测、IBC模式和调色板模式中的一者。
在一个实施例中,如果当前块的预测技术不是帧内预测,那么视频解码装置解析1位标志信息。如果解析的标志指示跳跃模式,则视频解码装置可以将当前块的预测模式确定为帧间预测合并模式或IBC合并模式。视频解码装置还可以将所预测的信号用作重构信号,跳过逆变换。
另一方面,如果解析的标志不指示用于当前块的跳跃模式,则预测技术确定器604可以通过相对于当前块的预测技术解析一系列1比特标志来确定预测技术(诸如帧间预测、帧内预测、IBC模式、调色板模式等)中的一个。在下文中,指示是否应用IBC模式的标志被称为IBC标志。
例如,如果跳跃模式没有被应用于当前块并且其被确定为帧间预测或IBC模式,则预测模式确定器606可以解析1比特标志并且基于解析的标志确定当前块的预测模式是合并模式或AMVP模式。
如果当前块的预测模式是IBC模式,则预测模式确定器606可以解析1比特标志,并且基于在下文中被称为“重排列标志”的解析的标志来确定是否使用用于对初始预测信号进行重排列的模式(在下文中被称为“重排列预测模式”)来生成最终预测信号。首先,视频解码装置通过使用块向量来生成当前块的初始预测块。接着,如果重排列标志为真且使用重排列预测模式,那么视频解码装置可以通过将初始预测块分裂成多个子块且对子块位置重排列来生成最终预测块。
下面描述在当前块的预测技术是IBC模式,并且预测模式是重排列预测模式时预测执行器608的操作。在下文中,视频解码装置参考预测执行器608。
因为当前块的预测技术是IBC模式,所以视频解码装置可以如上所述的IBC合并模式生成块向量或根据IBC AMVP模式生成单向块向量。此外,视频解码装置可以根据IBC合并模式/IBCAMVP模式生成双向块向量。例如,可以根据IBC合并模式生成一个块向量,并且可以根据IBC AMVP模式生成另一个块向量。可选地,视频解码装置可以仅以IBC合并模式或仅以IBCAMVP模式生成块向量。如上所述,当在IBC合并模式中时,视频编码装置用信号发送合并指数。另外,当在IBCAMVP模式中时,视频编码装置可以用信号发送候选指数和块向量差。视频解码装置可以解析发送的参数并通过使用解析的参数生成块向量。
作为实例,视频编码装置和视频解码装置可以通过使用在当前块的空间邻域中的重构块的运动信息、按照编码顺序在当前块之前编码的块中的运动信息、零运动信息等构成候选块向量列表,如图4中所示。当在IBC合并模式中时,视频解码装置可以通过使用合并指数来生成块向量。当在IBC AMVP模式中时,视频解码装置可以使用候选指数来导出块向量预测因子,且然后补偿块向量差以由此生成块向量。在这种情况下,在图4中图示的当前块的空间邻域中的重构块的一些位置可以被省略或者改变。
图7为根据本公开的至少一个实施例的由视频解码装置执行的用于基于IBC模式预测当前块的方法的流程图。
视频解码装置从比特流解码IBC标志(S700)。这里,如上所述,IBC标志(IBC_flag)适于指示是否应用IBC模式。
视频解码装置检查IBC标志(S702)。
如果IBC标志为真(在S702中为是),则视频解码装置从比特流解码重排列标志(S704)。
视频解码装置检查重排列标志(S706)。这里,重排列标志(reorder_flag)指示重排列预测模式将被启用还是被禁用。
如果重排列标志为真(在S706中为是),则视频解码装置从比特流解码水平标志(S708)。这里,水平标志(hor_flag)指示当前块是要水平地还是垂直地分裂。
视频解码装置检查水平标志(S710)。
如果水平标志为真(S710中的是),则视频解码装置根据重排列预测对用于水平分裂当前块的分裂指数(split_idx)进行解码(S712)。这里,分裂指数指示所述子块相对于水平分裂的子块的预设比例中的一个。根据分裂指数的子块比例可以为如表1中所示出的子块比例。
[表1]
split_idx | 子块比例 |
0 | 1:1 |
1 | 1:2:1 |
2 | 1:3 |
3 | 3:1 |
另一方面,如果水平标志为假(S710中的否),则视频解码装置根据重排列预测对用于垂直分裂当前块的分裂指数(split_idx)进行解码(S714)。这里,所述分裂指数指示预设子块相对于垂直分裂的子块的比例中的一个。根据分裂指数的子块比例可以为如表1中所示的子块比例。
视频解码装置基于重排列预测模式生成当前块的预测块(S716)。
另一方面,如果IBC标志为假(在S702中为否),则视频解码装置基于诸如帧内预测、帧间预测等的另一预测技术来生成当前块的预测块。
(S720).
此外,如果重排列标志为假(在S706中为否),则视频解码装置根据不利用重排列预测模式的传统IBC模式来生成当前块的预测块(S730)。
在一个实例中,当前块的大小(或纵横比)可以隐含地确定用于执行重排列预测的子块的分裂方向。本节描述了当前块预测技术是IBC模式,并且根据重排列预测模式对当前块进行预测的情况。相对于具有大小W×H(其中,W是宽度并且H是高度)的当前块,如果W>H,则视频解码装置可以生成垂直分裂的子块,如图8中所示。可选地,如果W<H,那么视频解码装置可以生成沿水平方向分裂的子块,如图9中所示。
在一个实例中,如果用于执行重排列预测的子块的分裂方向是基于当前块的大小而隐含地确定,或基于经解析的水平标志而显式地确定(如图7的实例中),那么可以基于当前块的纵横比而隐含地确定子块比例(即,分裂指数)。可选地,可以基于用信号发送和解析的分裂指数明确地确定的子块比例,如图7中所示。如上所述,可以如表1中示出根据分裂指数的子块比例。
本节描述了生成当前块的预测块的步骤(S716),其中,用于执行重排列预测的子块的分裂方向根据当前块的大小被隐含地确定,或者根据解析的水平标志被显式地确定,如在图7中所示,并且子块比例被隐含地或者显式地确定。在基于IBC合并模式或IBC AMVP模式生成当前块的块向量之后,视频解码装置可以如下使用生成的块向量基于重排列预测模式执行当前块的预测。
在一个实例中,在当前块隐含地或显式地垂直分裂且子块比例隐含地或显式地确定为1:1时,视频解码装置首先通过使用块向量生成初始预测块,如图10中所示。视频解码装置垂直地分裂初始预测块以生成两个子块。视频解码装置可接着执行重排列以改变两个子块的顺序以生成当前块的最终预测块。
作为另一实例,如果当前块被隐含地或显式地垂直分割且子块比例被隐含地或显式地确定为1:2:1,则视频解码装置可以首先通过使用块向量生成初始预测块,如图11中所示。视频解码装置垂直地分裂初始预测块以生成三个子块。视频解码装置可接着执行重排列以改变三个子块的顺序以生成当前块的最终预测块。在图11的实例中,在三个子块中,重排列的块是位于初始预测块的任一侧上的子块1和子块3。可以不对位于中心的子块2进行重排列。
作为又一实例,如果当前块隐含地或显式地垂直分裂且子块比例隐含地或明确地确定为1:3,那么视频解码装置首先通过使用块向量生成初始预测块,如图12中所示。视频解码装置垂直地分裂初始预测块以生成两个子块。视频解码装置可接着执行重排列以改变两个子块的顺序以生成当前块的最终预测块。
作为又一实例,如果当前块被隐含地或显式地垂直分割且子块比例被隐含地或显式地确定为3:1,则视频解码装置可首先通过使用块向量来生成初始预测块,如图13中所示。视频解码装置垂直地分裂初始预测块以生成两个子块。视频解码装置可接着执行重排列以改变两个子块的顺序以生成当前块的最终预测块。
此外,如果当前块被隐含地或显式地水平分裂且子块比例被隐含地或显式地确定,则视频解码装置可以首先通过使用块向量生成初始预测块。视频解码装置水平地分裂初始预测块以生成子块。接着,视频解码装置可以执行重排列以改变子块的顺序以生成当前块的最终预测块。
图14是根据本公开另一实施方式的由视频解码装置执行的用于基于IBC模式预测当前块的方法的流程图。
与图7的流程图相比,图14的实例仅包括应用IBC模式并且重排列标志为真的情况。
视频解码装置从比特流解码1:1标志(S1400)。这里,1:1标志(1:1_flag)指示在水平或垂直方向上分裂子块比例是1:1还是1:1:1:1。例如,如果1:1标志为真,则子块比例为1:1,如果1:1标志为假,则子块比例可为1:1:1:1。
视频解码装置检查1:1标志(S1402)。
如果1:1标志为真(在S1402中为是),则视频解码装置可以执行以下步骤(S1404至S1410)。
视频解码装置从比特流解码半标志(S1404)。这里,半标志(half_flag)指示在水平或垂直方向上的子块比例是1:1还是1:2:1。例如,如果半标志为真,则子块比例为1:1,且如果半标志为假,则子块比例可以为1:2:1。
视频解码装置从比特流解码水平标志(S1406)。这里,水平标志(hor_flag)指示当前块是水平还是垂直分裂。
视频解码装置基于半标志和水平标志生成当前块的子块(S1408)。
视频解码装置基于重排列预测模式生成当前块的预测块(S1410)。
例如,如果半标志为真且水平标志为假,视频解码装置可以执行重排列预测以生成当前块的最终预测块,如图10中所示。可选地,如果半标志为假且水平标志为假,视频解码装置可以执行重排列预测以生成当前块的最终预测块,如图11中所示。
如果1:1标志为假(在S1402中为否),则视频解码装置可以执行以下步骤(S1420至S1426)。
视频解码装置从比特流解码水平标志(S1420)。这里,水平标志(hor_flag)指示当前块是水平还是垂直分裂。
视频解码装置基于水平标志来生成当前块的子块(S1422)。视频解码装置可以基于水平标志的值来分裂当前块以生成子块,如图15中所示。
视频解码装置从比特流解码复制指数(S1424)。这里,复制指数(copy_idx)指示哪些子块将被重排列。如果对两个子块进行重排列,则根据复制指数重排列的块可以如表2所示来表示。
[表2]
copy_idx | 重排列块 |
0 | A、B |
1 | A、C |
2 | C、D |
3 | B、D |
视频解码装置基于复制指数生成当前块的预测块(S1426)。
如果当前块被隐含地或显示地水平或垂直地分裂,则视频解码装置将初始预测块分裂为子块,并对分裂的子块重排列。视频解码装置可接着将滤波应用于邻近于子块之间的边界的样本以生成最终预测信号,如下文实施方式中所示。
在一个实例中,在相对于初始预测块执行子块的重排列之后,视频解码装置可以通过将滤波器‘f’应用于邻近于内部边界的预测信号以生成子块边界的信号来生成如图16A和图16B中所示的最终预测信号。在这种情况下,滤波器‘f’可以是诸如中值滤波器的滤波器,但可以是具有预设系数的固定滤波器。可选地,视频编码装置可以用信号发送指示预设的滤波器中的一个的信息,并且视频解码装置可以解析用信号发送的信息以确定滤波器,然后可以使用所确定的滤波器以对子块之间的边界执行滤波。此时,视频解码装置可以通过使用相对于子块之间的边界相邻的区域的预测信号对子块之间的边界执行滤波。在图16A的实例中,初始预测块分裂为具有1:1比例的两个子块。在图16B的实例中,初始预测块被分裂为具有1:2:1比例的三个子块。
根据另一实例,在执行用于初始预测块的子块的重排列之后,视频解码装置将每一子块边界处的预测信号的值与邻近于内部边界的预测信号的值进行比较。如果两个相邻样本值之间的差值小于或等于某个阈值“t”,则视频解码装置可以通过将滤波器‘f’应用于邻近于内部边界的预测信号以生成子块边界的信号来生成如图17A和图17B所示的最终预测信号。另一方面,如果两个相邻样本值之间的差值大于某个阈值“t”,则视频解码装置可以阻止将滤波应用于邻近于内部边界的预测信号。在此情况下,阈值可以为基于视频编码装置与视频解码装置之间的协定的预定义值。可选地,可以基于输入视频的位深度来隐含地确定阈值。在这种情况下,滤波器f可以是诸如中值滤波器的滤波器,但可以是具有预设系数的固定滤波器。又或者,视频编码装置可以用信号发送指示预设滤波器中的一个的信息,并且视频解码装置可以解析用信号发送的信息以确定滤波器,并且然后可以使用所确定的滤波器来对子块之间的边界执行滤波。在这种情况下,视频解码装置可以通过使用相对于子块之间的边界相邻的区域的预测信号来执行子块之间的边界的滤波。
在图17A的实例中,初始预测块被分裂为具有1:1比例的两个子块。此时,因为满足|a0-b0|>t,所以视频解码装置可不对a0和b0之间的边界应用滤波。进一步,在图17B的实例中,初始预测块被分裂为具有1:2:1的比例的三个子块。此时,因为满足|a0-b0|>t和|cH-dH|>t,所以视频解码装置可不对a0和b0之间的边界以及cH和dH之间的边界应用滤波。
图18是根据本公开的至少一个实施方式的由视频编码装置执行的用于基于IBC模式预测当前块的方法的流程图。
图18的实例包括应用IBC模式的情况。
视频编码装置基于IBC模式生成当前块的初始预测块(S1800)。
视频编码装置可以基于IBC合并模式或IBC AMVP模式生成当前块的块向量,然后可以使用生成的块向量从当前帧中的重构区域生成初始预测块。
视频编码装置获得当前块的分裂方向(S1802)。这里,分裂方向指示水平分裂或垂直分裂。
在一个实例中,在速率-失真优化方面,视频编码装置确定水平标志。这里,水平标志指示分裂方向是水平分裂还是垂直分裂。视频编码装置可以基于水平标志来设置分裂方向。随后,视频编码装置可以编码且然后可将以水平标志用信号发送到视频解码装置。
作为另一实例,视频编码装置可以基于当前块的大小隐含地确定分裂方向。
视频编码装置获得子块相对于当前块的比例(S1804)。
在一个实例中,在速率-失真优化方面,视频编码装置确定分裂指数。这里,分裂指数指示预设的子块比例(例如,表1)中的一个。视频编码装置可以基于分裂指数确定子块的比例。随后,视频编码装置可以将分裂指数编码且用信号发送到视频解码装置。
作为另一实例,视频编码装置可以基于当前块的纵横比而隐含地确定子块的比例。
视频编码装置可以基于分裂方向和子块的比例将初始预测块分裂成子块(S1806)。
视频编码装置可以对子块重排列以生成当前块的最终预测块(S1808)。
视频编码装置可以将预设滤波器应用于邻近于重排列的子块之间的边界的样本。
基于初始预测块和最终预测块,视频编码装置确定重排列标志(S1810)。这里,重排列标志指示子块是否将被重排列。在速率-失真优化方面,视频编码装置可以通过将初始预测块与最终预测块进行比较来确定重排列标志。例如,如果初始预测块是最佳的,那么视频编码装置将重排列标志设定为假。另一方面,如果最终预测块是最佳的,那么视频编码装置可以将重排列标志设定为真。
视频编码装置对重排列标志进行编码(S1812)。
如上所述,如果在速率-失真优化方面确定指示分裂方向的分裂标志,视频编码装置可以进一步对分裂标志进行编码。此外,如果确定在速率-失真优化方面指示子块的比例的分裂指数,则视频编码装置可以对分裂指数进行编码。
尽管各个流程图中的步骤被描述为顺序地执行,但是这些步骤仅仅例示本公开的一些实施方式的技术构思。因此,本公开所属领域的普通技术人员可通过改变在各个附图中描述的顺序或者通过并行执行两个以上的步骤来执行步骤。所以,各个流程图中的步骤不限于所示的时间序列顺序。
应当理解,以上描述呈现了可以以不同其他方式实现的说明性实施方式。在一些实施方式中描述的功能可以通过硬件、软件、固件和/或其组合来实现。还应理解,本公开中描述的功能部件用“…单元”标识以强烈强调它们独立实现的可能性。
同时,在一些实施方式中描述的各种方法或功能可以被实现为存储在能够由一个或多个处理器读取和执行的非暂时性记录介质中的指令。例如,非暂时性记录介质可以包括各种类型的记录装置,其中,数据以计算机系统可读的形式存储。例如,非暂时性记录介质可以包括存储介质,诸如可擦除可编程只读存储器(EPROM)、闪存驱动器、光盘驱动器、磁性硬盘驱动器和固态驱动器(SSD)等。
尽管出于说明性的目的已经描述了本公开的实施方式,然而,本公开所属领域的普通技术人员应当认识到,在不背离本公开的构思和范围的情况下,各种修改、添加、以及替换是可能的。因此,为了简洁和清晰起见,已经描述了本公开的实施方式。本公开的实施方式的技术构思的范围不受图示的限制。因此,本公开所属领域的普通技术人员应当理解,本公开的范围不应受上述明确描述的实施方式的限制,而是受权利要求及其等同物的限制。
(参考标号)
120:预测器
540:预测器
602:预测单元确定器
604:预测技术确定器
606:预测模式确定器
608:预测执行器。
相关申请的交叉引用
本申请要求2022年8月9日提交的韩国专利申请第10-2022-0099353号以及2023年7月11日提交的韩国专利申请第10-2023-0089974号的优先权和权益,通过引用将其每一个的全部内容结合在此。
Claims (18)
1.一种由视频解码装置重构当前块的方法,所述方法包括:
获得所述当前块的分裂方向,所述分裂方向指示水平分裂或垂直分裂;
获得子块相对于所述当前块的比例;
根据帧内块复制(IBC)模式生成所述当前块的初始预测块;
根据所述分裂方向和所述子块的比例,将所述初始预测块分裂为子块;以及
通过对所述子块进行重排列来生成所述当前块的最终预测块。
2.根据权利要求1所述的方法,进一步包括:
从比特流解码指示所述子块是否将被重排列的重排列标志;以及
检查所述重排列标志,
其中,当所述重排列标志为真时,通过生成所述当前块的所述最终预测块来执行获得所述分裂方向。
3.根据权利要求2所述的方法,进一步包括,当重排列标志为假时:
根据所述IBC模式生成所述当前块的预测块。
4.根据权利要求2所述的方法,进一步包括:
从比特流解码IBC标志,所述IBC标志指示是否应用IBC模式;以及
检查所述IBC标志,
其中,当所述IBC标志为真时,对所述重排列标志进行解码。
5.根据权利要求1所述的方法,其中,获得所述分裂方向包括:
从比特流解码指示所述分裂方向是所述水平分裂还是所述垂直分裂的水平标志;以及
根据所述水平标志设置所述分裂方向。
6.根据权利要求1所述的方法,其中,获得所述分裂方向包括:
基于所述当前块的大小隐含地确定所述分裂方向。
7.根据权利要求1所述的方法,其中,获得所述子块的比例包括:
从比特流解码指示所述子块的预设比例之一的分裂指数;以及
根据所述分裂指数确定所述子块的比例。
8.根据权利要求1所述的方法,其中,获得所述子块的比例包括:
基于所述当前块的纵横比隐含地确定所述子块的比例。
9.根据权利要求1所述的方法,其中,生成所述初始预测块包括:
基于IBC合并模式或IBC高级运动向量预测(AMVP)模式生成所述当前块的块向量;以及
使用所述块向量从当前帧中的重构区域生成所述初始预测块。
10.根据权利要求1所述的方法,其中,生成所述最终预测块包括:
对与重排列的子块之间的边界相邻的样本应用预设滤波器。
11.根据权利要求10所述的方法,其中,生成所述最终预测块包括:
当与所述重排列的子块之间的边界相邻的两个样本值之间的差值小于或等于预设阈值时,应用所述预设滤波器,当所述两个样本值之间的差值大于所述预设阈值时,阻止应用所述预设滤波器。
12.一种由视频编码装置对当前块进行编码的方法,所述方法包括:
根据帧内块复制(IBC)模式生成所述当前块的初始预测块;
获得所述当前块的分裂方向,所述分裂方向指示水平分裂或垂直分裂;
获得子块相对于所述当前块的比例;
基于所述分裂方向和所述子块的比例,将所述初始预测块分裂为子块;以及
通过对所述子块进行重排列来生成所述当前块的最终预测块。
13.根据权利要求12所述的方法,进一步包括:
基于所述初始预测块和所述最终预测块来确定指示所述子块是否要被重排列的重排列标志;以及
对所述重排列标志进行编码。
14.根据权利要求12所述的方法,其中,获得所述分裂方向包括:
确定指示所述分裂方向是所述水平分裂还是所述垂直分裂的水平标志;以及
根据所述水平标志设置所述分裂方向。
15.根据权利要求14所述的方法,进一步包括:
对所述水平标志进行编码。
16.根据权利要求12所述的方法,其中,获得所述子块的比例包括:
确定指示所述子块的预设比例之一的分裂指数;以及
根据所述分裂指数确定所述子块的比例。
17.根据权利要求16所述的方法,进一步包括:
对所述分裂指数进行编码。
18.一种计算机可读记录介质,存储由视频编码方法生成的比特流,所述视频编码方法包括:
根据帧内块复制(IBC)模式生成当前块的初始预测块;
获得所述当前块的分裂方向,所述分裂方向指示水平分裂或垂直分裂;
获得子块相对于所述当前块的比例;
基于所述分裂方向和所述子块的比例,将所述初始预测块分裂为子块;以及
通过对所述子块进行重排列来生成所述当前块的最终预测块。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20220099353 | 2022-08-09 | ||
KR10-2022-0099353 | 2022-08-09 | ||
KR1020230089974A KR20240021107A (ko) | 2022-08-09 | 2023-07-11 | 인트라 블록 복사 모드에서 예측신호들의 재배열을이용하는 비디오 코딩방법 및 장치 |
KR10-2023-0089974 | 2023-07-11 | ||
PCT/KR2023/010023 WO2024034886A1 (ko) | 2022-08-09 | 2023-07-13 | 인트라 블록 복사 모드에서 예측신호들의 재배열을 이용하는 비디오 코딩을 위한 방법 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN119654861A true CN119654861A (zh) | 2025-03-18 |
Family
ID=89851952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202380056246.8A Pending CN119654861A (zh) | 2022-08-09 | 2023-07-13 | 用于在帧内块复制模式下使用预测信号的重排列的视频编码的方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN119654861A (zh) |
WO (1) | WO2024034886A1 (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101748620B1 (ko) * | 2014-06-20 | 2017-07-04 | 성균관대학교산학협력단 | 영상의 부호화/복호화 방법 및 이를 이용하는 장치 |
CN118612464A (zh) * | 2019-03-06 | 2024-09-06 | 韩国电子通信研究院 | 图像编码/解码方法和设备以及存储比特流的记录介质 |
HUE068613T2 (hu) * | 2019-03-15 | 2025-01-28 | Samsung Electronics Co Ltd | Kép kódolási eljárás és eszköz, kép dekódolási eljárás és eszköz |
CN116491114A (zh) * | 2020-11-23 | 2023-07-25 | 现代自动车株式会社 | 利用子块单元帧内预测的影像编码和解码方法和装置 |
KR20220071939A (ko) * | 2020-11-24 | 2022-05-31 | 현대자동차주식회사 | 비디오 부호화 및 복호화를 위한 장치 및 방법 |
-
2023
- 2023-07-13 CN CN202380056246.8A patent/CN119654861A/zh active Pending
- 2023-07-13 WO PCT/KR2023/010023 patent/WO2024034886A1/ko unknown
Also Published As
Publication number | Publication date |
---|---|
WO2024034886A1 (ko) | 2024-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220191530A1 (en) | Intra prediction method and device for predicting and dividing prediction unit into sub-units | |
US20240283916A1 (en) | Video encoding and decoding using intra block copy | |
US20240007636A1 (en) | Method and apparatus for video coding using versatile information-based context model | |
CN116491114A (zh) | 利用子块单元帧内预测的影像编码和解码方法和装置 | |
CN119654861A (zh) | 用于在帧内块复制模式下使用预测信号的重排列的视频编码的方法和装置 | |
US20250030874A1 (en) | Method for chroma component prediction based on reconstructed luma information | |
US20250008093A1 (en) | Method and apparatus for video coding using intra mirror prediction | |
US20240007623A1 (en) | Block splitting structure for efficient prediction and transform, and method and appartus for video encoding and decoding using the same | |
US20230388541A1 (en) | Method and apparatus for video coding using intra prediction based on subblock partitioning | |
US20240007649A1 (en) | Method and apparatus for video coding using motion vector with component-wise adaptive spatial resolution | |
US20240305815A1 (en) | Method and apparatus for video coding using intra prediction based on template matching | |
US20230388494A1 (en) | Method for generating prediction block by using weighted-sum of intra prediction signal and inter prediction signal, and device using same | |
US20240357087A1 (en) | Method and apparatus for video coding using improved amvp-merge mode | |
US20240179326A1 (en) | Method and apparatus for video coding using nonrectangular block splitting structure | |
US20240114131A1 (en) | Video encoding/decoding method and apparatus | |
US20240236301A9 (en) | Video encoding/decoding method and apparatus | |
US20230412811A1 (en) | Method and apparatus for video coding using spiral scan order | |
US20250024038A1 (en) | Method and apparatus for video coding using adaptive multiple transform selection | |
US20240357093A1 (en) | Method for template-based intra mode derivation for chroma components | |
US20240114148A1 (en) | Video encoding and decoding method for adaptively determining chroma intra directional prediction mode | |
US20240179324A1 (en) | Method and apparatus for video coding using an improved in-loop filter | |
US20230283768A1 (en) | Method for predicting quantization parameter used in a video encoding/decoding apparatus | |
US20240422321A1 (en) | Method and apparatus for video coding using context model initialization | |
US20240323349A1 (en) | Video encoding/decoding method and apparatus adjusting number of multiple transform selection candidates in multiple transform selection | |
US20240031564A1 (en) | Method and apparatus for video coding using adaptive intra prediction precision |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication |