CN114270867A - 图像解码装置、图像解码方法及程序 - Google Patents
图像解码装置、图像解码方法及程序 Download PDFInfo
- Publication number
- CN114270867A CN114270867A CN202080058192.5A CN202080058192A CN114270867A CN 114270867 A CN114270867 A CN 114270867A CN 202080058192 A CN202080058192 A CN 202080058192A CN 114270867 A CN114270867 A CN 114270867A
- Authority
- CN
- China
- Prior art keywords
- block
- boundary
- prof
- unit
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 226
- 238000012545 processing Methods 0.000 claims abstract description 211
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims abstract description 103
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims abstract description 45
- 238000001914 filtration Methods 0.000 claims abstract description 41
- 239000013598 vector Substances 0.000 claims description 186
- 238000001514 detection method Methods 0.000 claims description 11
- 230000003287 optical effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 description 30
- 230000000875 corresponding effect Effects 0.000 description 28
- 238000010586 diagram Methods 0.000 description 25
- 238000013139 quantization Methods 0.000 description 25
- 238000012937 correction Methods 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 230000001276 controlling effect Effects 0.000 description 9
- 230000009466 transformation Effects 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 6
- 238000011045 prefiltration Methods 0.000 description 4
- 241000723655 Cowpea mosaic virus Species 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 3
- 230000002542 deteriorative effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明的图像解码装置200包括:仿射预测信号生成部241F,构成为针对每个块判断PROF处理是否适合,当应用PROF处理时,针对将块分割所得的每个子块进行PROF处理;及环路滤波处理部250,构成为针对每个块边界判断解块滤波是否适合,确定不对应用PROF处理后的块的子块边界应用解块滤波。
Description
[技术领域]
本发明涉及一种图像解码装置、图像解码方法及程序。
[背景技术]
以往,已知PROF(Prediction Refinement with Optical Flow,光流预测细化)技术及解块滤波技术(例如,参考非专利文献1)。
PROF是利用与以4×4像素块为单位平行移动及旋转对应的运动模型,高精度地生成预测信号的技术,与不应用PROF处理时相比,可以期待主观画质及客观画质这两方面的改善。
解块滤波器是应用于块边界的低通滤波器,可以期待抑制块噪声而使主观画质提高的效果。
[现有技术文献]
非专利文献
非专利文献1:Versatile Video Coding(Draft 6),JVET-N1001
[发明内容]
发明要解决的课题
在现有技术中,在应用PROF处理的块边界,也有可能应用解块滤波。然而,有如下问题:对于主观画质已通过PROF处理充分得到改善的块,有可能由于应用解块滤波,反而导致主观画质变差。
因此,本发明是鉴于上述问题而完成的,其目的在于提供一种图像解码装置、图像解码方法及程序,能够通过不对应用PROF处理后的子块边界应用解块滤波,来防止主观画质变差。
用于解决课题的手段
本发明的第一特征的主旨在于一种图像解码装置,包括:仿射预测信号生成部,构成为针对每个块判断PROF处理是否适合,当应用所述PROF处理时,针对将所述块分割所得的每个子块进行所述PROF处理;及环路滤波处理部,构成为针对每个块边界判断解块滤波是否适合,确定不对应用所述PROF处理后的块的子块边界应用解块滤波。
本发明的第二特征的主旨在于一种图像解码方法,包括以下步骤:针对每个块判断PROF处理是否适合,当应用所述PROF处理时,针对将所述块分割所得的每个子块进行所述PROF处理;及针对每个块边界判断解块滤波是否适合,确定不对应用所述PROF处理后的块的子块边界应用解块滤波。
本发明的第三特征的主旨在于一种程序,在图像解码装置中使用,且使计算机执行以下步骤:针对每个块判断PROF处理是否适合,当应用所述PROF处理时,针对将所述块分割所得的每个子块进行所述PROF处理;及针对每个块边界判断解块滤波是否适合,确定不对应用所述PROF处理后的块的子块边界应用解块滤波。
发明的效果
根据本发明,可以提供一种图像解码装置、图像解码方法及程序,能够通过不对应用PROF处理后的子块边界应用解块滤波,来防止主观画质变差。
[附图的简单说明]
图1是示出一实施方式的图像处理系统10的构成的一个例子的图。
图2是示出一实施方式的图像编码装置100的功能块的一个例子的图。
图3是示出从一实施方式的图像编码装置100的编码部140输出的编码后数据(比特流)的构成的一个例子的图。
图4是示出图3所示的SPS 141内包含的控制数据的一个例子的图。
图5是示出图3所示的切片头部143A中包含的控制数据的一个例子。
图6是示出一实施方式的图像编码装置100的帧间预测部111的功能块的一个例子的图。
图7是示出一实施方式的图像编码装置100的帧间预测部111的细化部111C的处理顺序的一个例子的流程图。
图8是示出一实施方式的图像编码装置100的帧间预测部111的预测信号生成部111D的处理顺序的一个例子的流程图。
图9是示出一实施方式的图像编码装置100的帧间预测部111的仿射运动矢量算出部111E的处理顺序的一个例子的流程图。
图10是用于说明一实施方式的图像编码装置100的帧间预测部111的仿射运动矢量算出部111E的处理顺序的一个例子的图。
图11是示出一实施方式的图像编码装置100的帧间预测部111的仿射预测信号生成部111F的处理顺序的一个例子的流程图。
图12是示出一实施方式的图像编码装置100的环路滤波处理部150的功能块的一个例子的图。
图13是用于说明一实施方式的图像编码装置100的环路滤波处理部150的边界强度判断部153(153A/153B)的处理顺序的图。
图14是示出一实施方式的图像解码装置200的功能块的一个例子的图。
图15是示出一实施方式的图像解码装置200的帧间预测部241的功能块的一个例子的图。
图16是示出一实施方式的图像解码装置200的环路滤波处理部250的功能块的一个例子的图。
图17是用于说明变更例1的图。
图18是用于说明变更例1的图。
图19是用于说明变更例2的图。
图20是用于说明变更例2的图。
[具体实施方式]
下面,参考附图对本发明的实施方式进行说明。另外,下述实施方式中的构成要素可以适当地与现有的构成要素等进行置换,并且,可以进行包括与其他现有的构成要素的组合在内的各种变形。因此,不应以下述实施方式的记载来限定权利要求书所记载的发明内容。
(第一实施方式)
下面,参考图1至图16对本发明的第一实施方式的图像处理系统10进行说明。图1是示出本实施方式的图像处理系统10的图。
如图1所示,图像处理系统10包括图像编码装置100及图像解码装置200。
图像编码装置100构成为通过对输入图像信号进行编码来生成编码数据。图像解码装置200构成为通过对编码数据进行解码来生成输出图像信号。
此处,该编码数据可以经由传输路径从图像编码装置100发送至图像解码装置200。并且,编码数据也可以在存储至存储介质后,从图像编码装置100提供至图像解码装置200。
(图像编码装置100)
下面,参考图2对本实施方式的图像编码装置100进行说明。图2是示出本实施方式的图像编码装置100的功能块的一个例子的图。
如图2所示,图像编码装置100包括帧间预测部111、帧内预测部112、减法器121、加法器122、变换及量化部131、逆变换及逆量化部132、编码部140、环路滤波处理部150及帧缓冲器160。
帧间预测部111构成为通过帧间预测(interframe prediction)来生成预测信号。
具体来说,帧间预测部111构成为通过对编码对象的帧(以下称为对象帧)与存储在帧缓冲器160中的参考帧进行比较,来指定参考帧中包含的参考块,并确定所指定的参考块的运动矢量。
并且,帧间预测部111构成为基于参考块及运动矢量,针对每个预测块生成预测块中包含的预测信号。帧间预测部111构成为将预测信号输出至减法器121及加法器122。此处,参考帧是与对象帧不同的帧。
帧内预测部112构成为通过帧内预测(intraframe prediction)来生成预测信号。
具体来说,帧内预测部112构成为指定对象帧中包含的参考块,并基于所指定的参考块,针对每个预测块生成预测信号。并且,帧内预测部112构成为将预测信号输出至减法器121及加法器122。
此处,参考块是预测对象的块(以下称为对象块)所参考的块。例如,参考块是与对象块相邻的块。
减法器121构成为从输入图像信号中减去预测信号,并将预测残差信号输出至变换及量化部131。此处,减法器121构成为生成通过帧内预测或帧间预测所生成的预测信号与输入图像信号的差分即预测残差信号。
加法器122构成为将预测信号与从逆变换及逆量化部132输出的预测残差信号相加来生成滤波处理前解码信号,并将该滤波处理前解码信号输出至帧内预测部112及环路滤波处理部150。
此处,滤波处理前解码信号构成帧内预测部112中使用的参考块。
变换及量化部131构成为进行预测残差信号的变换处理,且获取系数等级值。此外,变换及量化部131也可以构成为进行系数等级值的量化。
此处,变换处理是将预测残差信号变换为频率成分信号的处理。在该变换处理中,可以使用与离散余弦变换(DCT,Discrete Cosine Transform)对应的基模型(变换矩阵),也可以使用与离散正弦变换(DST,Discrete Sine Transform)对应的基模型(变换矩阵)。
逆变换及逆量化部132构成为进行从变换及量化部131输出的系数等级值的逆变换处理。此处,逆变换及逆量化部132也可以构成为在逆变换处理之前进行系数等级值的逆量化。
此处,逆变换处理及逆量化是按照与由变换及量化部131进行的变换处理及量化相反的顺序进行。
编码部140构成为对从变换及量化部131输出的系数等级值进行编码,并输出编码数据。
此处,例如编码是基于系数等级值的产生概率来分配不同长度的代码的熵编码。
并且,编码部140构成为不仅对系数等级值进行编码,还对解码处理中使用的控制数据进行编码。
此处,控制数据可以包括编码块(CU,Coding Unit)尺寸、预测块(PU,PredictionUnit)尺寸、变换块(TU,Transform Unit)尺寸等尺寸数据。
环路滤波处理部150构成为对从加法器122输出的滤波处理前解码信号进行滤波处理,且将滤波处理后解码信号输出至帧缓冲器160。
此处,例如滤波处理是减少在块(编码块、预测块或变换块)的边界部分产生的失真的解块滤波处理。
帧缓冲器160构成为存储帧间预测部111中使用的参考帧。
此处,滤波处理后解码信号构成帧间预测部111中使用的参考帧。
(编码部140)
下面,使用图3至图5对由编码部140编码的控制数据进行说明。图3是从编码部140输出的编码后数据(比特流)的构成例。
首先,该比特流可以在开头包含SPS(Sequence Parameter Set,序列参数集)141。SPS 141是以序列(图片的集合)为单位的控制数据的集合。具体示例将在下文叙述。各SPS141至少包含在有多个SPS 141时用于识别各SPS 141的id信息。
该比特流也可以在SPS 141后面包含PPS(Picture Parameter Set,图片参数集)142。PPS 142是以图片(切片的集合)为单位的控制数据的集合。各PPS 142至少包含在有多个SPS 141时用于识别各SPS 141的id信息。并且,各PPS 142至少包含用于指定与各PPS142对应的SPS 141的SPS id信息。
该比特流也可以在PPS 142后面包含切片头部143A。切片头部143A是以切片为单位的控制数据的集合。具体示例将在下文叙述。各切片头部143A至少包含用于指定与各切片头部143A对应的PPS 142的PPS id信息。
该比特流也可以在切片头部143A后面包含切片数据144A。切片数据144A可以包含上述系数等级值及尺寸数据等。
如上所述,为如下构成:各有一个切片头部143A/143B、PPS 142、SPS 141与各切片数据144A/144B对应。如上所述,在切片头部143A/143B中,由PPS id信息来指定参考哪一PPS 142,在该PPS 142中,进一步由SPS id信息来指定参考哪一SPS 141,因此,可以对多个切片数据144A/144B使用共同的SPS 141及PPS 142。
换句话说,不必针对每个切片数据144A/144B均传输SPS 141及PPS 142。例如,如图3所示,也可以为如下流构成:在切片头部143B及切片数据144B之前,不对SPS 141及PPS142进行编码。
另外,图3的构成只是一个例子。若为由切片头部144A/144B、PPS 142、SPS 141指定的控制数据与各切片数据144A/144B对应的构成,则还可以追加除上述以外的要素作为流的构成要素。并且,同样地,也可以在传输时整形为与图3不同的构成。
图4是示出SPS 141内包含的控制数据的一个例子的图。
如上所述,SPS 141至少包含用于识别各SPS 141的id信息(sps_seq_parameter_set_id)。
SPS 141也可以包含用于对可否使用(有效、无效)下述BDOF(Bi-DirectionalOptical Flow)处理进行控制的标志“sps_bdof_enabled_flag”。当该标志的值为“0”时,表示在与该SPS 141对应的切片内不使用BDOF处理。另一方面,当该标志的值为“1”时,表示在与SPS 141对应的切片内可使用BDOF处理。在下述处理中,针对每个块确定在切片内的各块中实际上是否使用BDOF处理。
即,“sps_bdof_enabled_flag”是SPS 141中包含的表示可否以序列为单位使用BDOF处理的标志(第四标志)。
SPS 141也可以包含用于对可否使用(有效、无效)下述DMVR(Decoder-sideMotion Vector Refinement)处理进行控制的标志“sps_dmvr_enabled_flag”。当该标志的值为“0”时,表示在与该SPS 141对应的切片内不使用DMVR处理。另一方面,当该标志的值为“1”时,表示在与该SPS 141对应的切片内可使用DMVR处理。在下述处理中,针对每个块确定在切片内的各块中实际上是否使用DMVR处理。
即,“sps_dmvr_enabled_flag”是SPS 141中包含的表示可否以序列为单位使用DMVR处理的标志(第三标志)。
SPS 141还可以包含用于对可否使用(有效、无效)下述仿射运动补偿进行控制的标志“sps_affine_enabled_flag”。当该标志的值为“0”时,表示在与该SPS 141对应的切片内不使用仿射运动补偿。另一方面,当该标志的值为“1”时,表示在与该SPS 141对应的切片内可使用仿射运动补偿。在下述处理中,针对每个块确定在切片内的各块中实际上是否使用仿射运动补偿。
即,“sps_affine_prof_enabled_flag”是SPS 141中包含的表示可否以序列为单位使用PROF处理的标志(第五标志)。
当“sps_affine_enabled_flag”为“1”时,SPS 141还可以另外包含“sps_affine_type_flag”这一标志。当该标志的值为“0”时,表示在与该SPS 141对应的切片内将下述仿射运动补偿时的参数个数始终设为“4”。另一方面,当该标志的值为“1”时,表示在与该SPS141对应的切片内进行仿射运动补偿时,可针对每个块选择“4”或“6”中的任一个作为参数个数。
当“sps_affine_enabled_flag”的值为“1”时,SPS 141还可以另外包含“sps_affine_prof_enabled_flag”这一标志。当该标志的值为“0”时,表示在与该SPS 141对应的切片内不使用下述PROF(Prediction Refinement with Optical Flow)处理。另一方面,当该标志的值为“1”时,表示在与该SPS 141对应的切片内可使用PROF处理。在下述处理中,针对每个块确定在切片内的各块中实际上是否使用PROF处理。
当“sps_bdof_enabled_flag”、“sps_dmvr_enabled_flag”及“sps_affine_prof_enabled_flag”中至少任一标志的值为“1”时,SPS 141还可以另外包含“sps_bdof_dmvr_prof_slice_present_flag”这一标志。当该标志为“1”时,表示在与该SPS 141对应的切片头部143A/143B内包含下述“slice_disable_bdof_dmvr_prof_flag”这一标志。当该标志的值为“0”时,表示在与该SPS 141对应的切片头部143A/143B内不包含“slice_disable_bdof_dmvr_prof_flag”。
即,“sps_bdof_dmvr_prof_slice_present_flag”是表示在切片头部143A/143B内是否包含“slice_disable_bdof_dmvr_prof_flag”的标志(第二标志)。另外,当不存在该标志时,可以隐含地视为该标志的值为“0”。
图5是示出切片头部143A/143B中包含的控制数据的一个例子的图。
如上所述,在切片头部143A/143B中,至少包含用于指定与该切片对应的PPS 142的PPS id信息“slice_pic_parameter_set_id”。如上所述,由该PPS id信息指定的PPS内所参考的SPS 141为与该切片头部143A/143B对应的SPS 141。
当在与该切片头部143A/143B对应的SPS 141内包含“sps_bdof_dmvr_prof_slice_present_flag”,且该标志的值为“1”时,在该切片头部143A/143B中也可以包含有“slice_disable_bdof_dmvr_prof_flag”。当该标志的值为“1”时,如下所述,可以控制为在该切片中包含的各块中不使用BDOF处理、DMVR处理、PROF处理。当该标志的值为“0”时,可以控制为在该切片中包含的各块中可使用BDOF处理、DMVR处理、PROF处理。
即,“slice_disable_bdof_dmvr_prof_flag”是切片头部143A/143B中包含的对可否使用DMVR处理、BDOF处理及PROF处理进行统一控制的标志(第一标志)。
换句话说,“slice_disable_bdof_dmvr_prof_flag”是切片头部143A/143B中包含的对可否使用PROF处理进行控制的标志,是切片头部143A/143B中包含的对可否使用DMVR处理进行控制的标志,且是切片头部143A/143B中包含的对可否使用BDOF处理进行控制的标志。
以上所说明的标志的值只是一个例子。当使赋予给标志的值(“0”及“1”)的意义相反时,可以通过使所对应的处理也相应地相反,来实现等效处理。
并且,如上所述,能够通过设置控制为不以切片为单位使用BDOF处理、DMVR处理、PROF处理的标志,而由图像编码装置100侧明确地控制不使用该功能,因此,能够通过不使用该功能,来削减图像编码装置100及所对应的图像解码装置200的处理负荷及消耗电力。
(帧间预测部111)
下面,参考图6对本实施方式的图像编码装置100的帧间预测部111进行说明。图6是示出本实施方式的图像编码装置100的帧间预测部111的功能块的一个例子的图。
如图6所示,帧间预测部111包括运动矢量搜索部111A、运动矢量编码部111B、细化部111C、预测信号生成部111D、仿射运动矢量算出部111E及仿射预测信号生成部111F。
帧间预测部111是构成为基于运动矢量来生成预测块中包含的预测信号的预测部的一个例子。
运动矢量搜索部111A构成为通过对象帧与参考帧的比较,来指定参考帧中包含的参考块,并搜索所指定的参考块的运动矢量。
并且,对多个候补参考帧进行上述搜索,以确定该预测块中用于预测的参考帧及运动矢量。对于一个块最多可以各使用两个参考帧及运动矢量。将对于一个块仅使用一组参考帧与运动矢量的情况称为单向预测,将使用两组参考帧与运动矢量的情况称为双向预测。在下文中,将第一组称为L0,将第二组称为L1。
此外,运动矢量搜索部111A构成为确定参考帧及运动矢量的编码方法。在编码方法中,除分别传输参考帧及运动矢量的信息的常规方法以外,还有下述合并模式及仿射运动补偿等。
另外,关于运动矢量的搜索方法、参考帧的确定方法以及参考帧及运动矢量的编码方法的确定方法,可以采用已知的方法,因此,省略其详细说明。
运动矢量编码部111B构成为使用由运动矢量搜索部111A所确定的编码方法,对同样由运动矢量搜索部111A所确定的参考帧及运动矢量的信息进行编码。关于具体的参考帧及运动矢量信息的编码方法,可以采用已知的方法,因此,省略其详细说明。
当该块的编码方法为合并模式时,在图像编码装置100侧,首先创建针对该块的合并列表。此处,合并列表是列举了多个参考帧与运动矢量的组合的列表。
为各组合分配有索引,图像编码装置100仅对该索引进行编码,并传输至图像解码装置200,代替单独对参考帧及运动矢量的信息进行编码。通过预先在图像编码装置100侧与图像解码装置200侧共用合并列表的创建方法,在图像解码装置200侧,可以仅根据该索引的信息,解码出参考帧及运动矢量的信息。
另外,关于合并列表的创建方法,可以采用已知的方法,因此,省略其详细说明。
仿射运动补偿是如下方法:对每个块传输少量参数,并基于该参数及预定的模型,导出将该块分割所得的每个子块的运动矢量。导出该运动矢量的方法的详细内容将在下文叙述。
当为仿射运动补偿时,运动矢量编码部111B构成为对下述控制点运动矢量的信息及参考帧的信息进行编码。如下所述,控制点运动矢量对每个块传输两个或三个运动矢量信息。
并且,当该块是进行双向预测的块时,对L0及L1分别各传输两个或三个控制点运动矢量的信息。关于具体的编码方法,可以采用已知的方法,因此,省略其详细说明。
当在该块中使用仿射运动补偿时,移至图6所示的仿射运动矢量算出部111E的处理,否则,移至细化部111C的处理。
细化部111C构成为进行对由运动矢量编码部111B编码的运动矢量进行修正的细化处理(例如DMVR)。
具体来说,细化部111C构成为进行如下细化处理:以由运动矢量编码部111B编码的运动矢量所指定的参考位置为基准,设定搜索范围,从搜索范围中指定特定成本最小的修正参考位置,并基于修正参考位置,对运动矢量进行修正。
图7是示出细化部111C的处理顺序的一个例子的流程图。
如图7所示,在步骤S71中,细化部111C判断是否满足用于应用细化处理的特定条件。当该特定条件全部被满足时,本处理顺序前进至步骤S72。另一方面,当该特定条件中任一条件未被满足时,本处理顺序前进至步骤S75,结束细化处理。
此处,特定条件包括该块是进行双向预测的块这一条件。
并且,特定条件也可以包括如下条件:L0侧的参考帧及L1侧的参考帧中的任一方相对于该帧来说在时间上为过去的帧,另一参考帧相对于该帧来说在时间上为后续的帧,且L0侧与L1侧的距该帧的时间距离(例如,POC(Picture Order Count,图像序列号)的差的绝对值)相等。
并且,特定条件也可以包括运动矢量在合并模式下被编码这一条件。
并且,特定条件也可以包括如下条件:在该块所属的序列的SPS 141中,“sps_dmvr_enabled_flag”的值表示在该序列中可使用DMVR(例如,该标志的值为“1”)。
此外,特定条件也可以包括如下条件:在该块所属的切片的切片头部143A/143B中,“slice_disable_bdof_dmvr_prof_flag”的值表示在该切片中可使用DMVR(例如,该标志的值为“0”)。
在步骤S72中,细化部111C基于由运动矢量编码部111B编码的运动矢量及参考帧的信息,生成搜索用图像。
此处,当运动矢量指向非整数像素位置时,细化部111C应用滤波器将非整数像素位置的像素内插至参考帧的像素值。此时,细化部111C能够通过使用抽头数比下述预测信号生成部111D中使用的内插滤波器少的内插滤波器,来削减运算量。例如,细化部111C可以通过双线性插值来内插非整数像素位置的像素值。
在步骤S73中,细化部111C使用步骤S72中生成的搜索用图像,以整数像素精度进行搜索。此处,整数像素精度是指以由运动矢量编码部111B编码的运动矢量为基准,仅搜索间隔整数像素的点。
细化部111C通过步骤S72的搜索来确定整数像素间隔位置处的修正后运动矢量。作为搜索方法,可以使用已知的方法。
例如,细化部111C也可以利用如下方法进行搜索:仅搜索仅将L0侧及L1侧的差分运动矢量的符号反转所得的组合所对应的点。在搜索时,细化部111C例如也可以在各搜索点处算出搜索成本,并在搜索成本最小的搜索点处对运动矢量进行修正。
此处,细化部111C也可以按照仅使与由运动矢量编码部111B编码的运动矢量对应的搜索点处的搜索成本减小的方式算出搜索成本。例如,关于该搜索点,细化部111C也可以将使利用与其他搜索点同样的方法算出的搜索成本减小至3/4所得的值设定为该搜索点的最终搜索成本。
步骤S73中的搜索结果也可能是与搜索前的运动矢量相同的值。
在步骤S74中,细化部111C以步骤S73中确定的整数像素精度的修正后运动矢量为初始值,以非整数像素精度进行运动矢量的搜索。作为运动矢量的搜索方法,可以使用已知的方法。
并且,细化部111C也可以在实际上未进行搜索的情况下,将步骤S73的结果作为输入,使用抛物线拟合等参数模型来确定非整数像素精度的矢量。
细化部111C在步骤S74中确定非整数像素精度的修正后运动矢量后,移至步骤S45,结束细化处理。此处,为方便起见,使用了非整数像素精度的修正后运动矢量这样的表达,但根据步骤S74的搜索结果,结果也可能是与步骤S73中求出的整数像素精度的运动矢量相同的值。
细化部111C也可以将大于预定阈值的块分割为较小的子块,并对每个子块执行细化处理。例如,细化部111C可以预先将细化处理的执行单位设定为16×16像素,当块的水平方向或垂直方向的尺寸大于16像素时,分别分割成16像素以下。此时,对于同一块内的所有子块,使用由运动矢量编码部111B编码的该块的运动矢量,作为细化处理的基准运动矢量。
当对每个子块进行处理时,细化部111C可以对每个子块执行图7的所有步骤。并且,细化部111C也可以仅对每个子块进行图7的部分处理。具体来说,细化部111C可以对每个块进行图7的步骤S71及S72的处理,且对每个子块进行步骤S73及S74的处理。
预测信号生成部111D构成为基于从细化部111C输出的经修正的运动矢量来生成预测信号。
此处,如下所述,预测信号生成部111D构成为基于上述细化处理过程中算出的信息(例如搜索成本),来判断是否对每个块进行BDOF处理。
具体来说,当运动矢量未被修正时,预测信号生成部111D构成为基于由运动矢量编码部111B编码的运动矢量来生成预测信号。另一方面,当运动矢量被修正时,预测信号生成部111D构成为基于由细化部111C修正的运动矢量来生成预测信号。
图8是示出预测信号生成部111D的处理顺序的一个例子的流程图。此处,当利用细化部111C以子块为单位进行细化处理时,预测信号生成部111D的处理也以子块为单位执行。此时,以下说明中的块这一术语可以适当替换为子块。
如图8所示,在步骤S81中,预测信号生成部111D生成预测信号。
具体来说,预测信号生成部111D将由运动矢量编码部111B编码的运动矢量或由细化部111C编码的运动矢量作为输入,当该运动矢量所指的位置为非整数像素位置时,应用滤波器将非整数像素位置的像素内插至参考帧的像素值。此处,关于具体的滤波器,可以应用非专利文献1中所揭示的最大8抽头的水平垂直可分离型滤波器。
当该块是进行双向预测的块时,预测信号生成部111D生成基于第一组(以下称为L0)参考帧与运动矢量的预测信号、及基于第二组(以下称为L1)参考帧与运动矢量的预测信号这两者。
在步骤S82中,预测信号生成部111D针对每个块确认是否满足下述BDOF处理的应用条件。
作为该应用条件,至少包括该块是进行双向预测的块这一条件。
并且,应用条件也可以包括如下条件:在细化部111C在步骤S73中的整数像素位置搜索中,上述搜索成本最小的搜索点的搜索成本大于预定阈值或为预定阈值以上。
并且,特定条件也可以包括如下条件:在该块所属的序列的SPS 141中,“sps_bdof_enabled_flag”的值表示在该序列中可使用BDOF(例如,该标志的值为“1”)。
并且,应用条件也可以包括如下条件:在该块所属的切片的切片头部143A/143B中,“slice_disable_bdof_dmvr_prof_flag”的值表示在该切片中可使用BDOF处理(例如,该标志的值为“0”)。
并且,应用条件也可以包括如下条件:L0侧的参考帧及L1侧的参考帧中的任一方相对于该帧来说在时间上为过去的帧,另一参考帧相对于该帧来说在时间上为后续的帧,且L0侧与L1侧的距该帧的时间距离(例如,POC的差的绝对值)的比率为预定比率。
此处,作为比率的确定方法,例如可以按照如下方式进行确定:与使用下述BDOF处理中的L0侧及L1侧的梯度或亮度值进行运算时的权重系数的倒数成正比。
例如,当将L0侧的权重系数设为“2/3”,且将L1侧的权重系数设为“1/3”时,作为参考帧的距离的比率,若将L0与该帧间的距离设为“1”,则L1与该帧间的距离为“2”,只有在该情况下,才应用BDOF处理。
同样地,例如,当将L0侧的权重系数设为“1/2”,且将L1侧的权重系数设为“1/2”时,作为参考帧的距离的比率,若将L0与该帧间的距离设为“1”,则L1与该帧间的距离为“1”,即,该帧与L0之间的距离等于该帧与L1之间的距离,只有在该情况下,才应用BDOF处理。
即,预测信号生成部111D也可以包括如下条件作为该应用条件:以与使用两个参考帧(L0/L1)各自的像素值或根据两个参考帧(L0/L1)的像素值算出的各自的值进行运算时的权重系数的倒数成正比的方式,和两个参考帧(L0/L1)与该帧的时间距离相关。
并且,预测信号生成部111D也可以包括如下条件作为该应用条件:当该权重系数相等时,作为与该时间距离相关的条件,两个参考帧(L0/L1)各自与该帧的时间距离相等。
另外,此处,以权重系数为“1/2”的情形为例进行了说明,但当在L0侧与L1侧使用相同权重(例如,也可以为“1”)时,仅在该帧与L0之间的距离等于该帧与L1之间的距离的情况下,才应用BDOF处理。
当判断出满足该应用条件时,本处理顺序移至步骤S83,当不满足该应用条件时,本处理顺序移至步骤S84。
在步骤S83中,预测信号生成部111D执行BDOF处理,并生成预测信号。BDOF处理的处理本身可以使用已知的方法,因此,仅对概况进行说明,省略其详细说明。
第一,预测信号生成部111D对该块的参考块内的各像素算出垂直方向及水平方向的亮度值的梯度。作为具体的算出方法,例如可以使用非专利文献1所述的方法来算出。此处,将L0的水平方向的梯度称为“gradientHL0”,将L0的垂直方向的梯度称为“gradientVL0”,将L1的水平方向的梯度称为“gradientHL1”,将L1的垂直方向的梯度称为“gradientVL1”。
第二,预测信号生成部111D算出该块的校正MV(vx,vy)。作为具体的算出方法,例如可以使用非专利文献1所述的方法来算出。此处,上述梯度的和(tempH,tempV)及L0与L1的参考块间的亮度值差分(diff)是以如下方式算出,如非专利文献1所述,也可以用于算出上述(vx,vy)。
diff=predSampleL0×weightL0-predSampleL1×weightL1
tempH=gradientHL0×weightL0+gradientHL1×weightL1
tempV=gradientVL0×weightL0+gradientVL1×weightL1
此处,“predSampleL0”及“predSampleL1”分别为L0及L1的参考块的亮度值,“weightL0”及“weightL1”分别为算出上述梯度及亮度值差分时的权重系数。
此处,以“diff”、“tempH”、“tempV”这三个参数为例,对使用共同的权重的例子进行了说明,在对L0侧的信息及L1侧的信息进行加减乘除时,可以设定同样的权重。
并且,也可以按照与该权重的倒数成正比的方式,像上述那样设定与距参考帧的距离相关的BDOF处理的应用条件。换句话说,也可以按照与该帧与L0及L1的各参考帧的距离的比的倒数成正比的方式,像上述那样设定加减乘除时的权重。
通过以这种方式进行设定,当假设梯度或亮度值等在L0与L1之间线性变化时,可以对该帧的时间位置设定合适的权重系数。并且,能够通过设定与权重系数对应的BDOF处理的应用条件,来保证始终使用合适的权重系数。
第三,预测信号生成部111D使用上述所求出的梯度及校正MV,例如以如下方式算出各像素的亮度值校正量“bdofOffset。
bdofOffset=vx×(weightL0×gradientHL0―weightL1×gradientHL1)+vy×(weightL0×gradientVL0―weightL1×gradientVL1)
第四,预测信号生成部111D例如可以如非专利文献1所述,使用“bdofOffset”,算出各像素的校正后亮度值的预测值。
即,预测信号生成部111D构成为在BDOF处理中,基于使用两个参考帧(L0/L1)各自的像素值或根据两个参考帧(L0/L1)的像素值算出的各自的值进行运算时的权重系数,在上述应用条件中包括与两个参考帧与该帧的时间距离相关的条件。
在实施BDOF处理后,本处理顺序移至步骤S85,结束处理。
在步骤S84中,当该块是进行双向预测的块时,预测信号生成部111D对步骤S81中生成的L0与L1的预测信号进行合成,生成最终预测信号。关于具体的合成方法,可以使用已知的方法,因此,省略其详细说明。当该块是进行单向预测的块时,预测信号生成部111D直接将步骤S81中生成的预测信号作为最终预测信号。
预测信号生成部111D在按照以上顺序生成最终预测信号后,移至步骤S85,结束处理。
仿射运动矢量算出部111E构成为当由运动矢量搜索部111A确定在该块中进行仿射运动补偿时,基于由运动矢量编码部111B编码的控制点运动矢量,来算出将该块分割所得的每个子块的运动矢量。
图9是示出仿射运动矢量算出部111E的处理顺序的一个例子的流程图。
如图9所示,在步骤S91中,仿射运动矢量算出部111E计算“dHorX”、“dhorY”、“dVerX”及“dVerY”共四个参数的值。
此处,仿射运动矢量算出部111E在计算参数时,使用由运动矢量编码部111B编码的控制点运动矢量的值。
如上所述,每个块有两个或三个控制点运动矢量。在图10中,示出了控制点运动矢量为三个(“CPMV0”、“CPMV1”、“CPMV2”)时的例子。
此处,在图10中,实线表示该块的边界,虚线表示将该块分割所得的子块的边界,实线箭头表示控制点运动矢量,虚线箭头表示各子块的运动矢量。
当控制点运动矢量为两个时,为仅有图10的CPMV0及CPMV1的状态。根据控制点运动矢量的值计算“dHorX”、“dhorY”、“dVerX”及“dVerY”共四个参数的值的具体方法可以使用已知的方法,因此,省略其详细说明。
在步骤S92中,仿射运动矢量算出部111E确定是否对该块应用“fallbackMode”。
此处,“fallbackMode”是在将该块分割所得的所有子块中使用同一运动矢量的模式。“fallbackMode”的判断方法可以使用已知的方法,因此,省略其详细说明。当对该块应用“fallbackMode”时,本处理顺序前进至步骤S93,当不对该块应用“fallbackMode”时,本处理顺序前进至步骤S94。
在步骤S93中,仿射运动矢量算出部111E算出使用“fallbackMode”时的各子块的运动矢量。
如上所述,当为“fallbackMode”时,同一块内的所有子块的运动矢量的值相同。具体的算出方法可以使用已知的方法,因此,省略其详细说明。
例如,在非专利文献1中,将上述“dHorX”、“dHorY”、“dVerX”及“dVerY”的值、及以该块的左上方的坐标为原点时的块中央的坐标值(分别使该块的高度及宽度为“1/2”所得的值)代入预定模型,来算出运动矢量。本处理顺序在步骤S93完成后,移至步骤S97,结束处理。
在步骤S94中,仿射运动矢量算出部111E算出不应用“fallbackMode”时的各子块的运动矢量。具体的算出方法可以使用已知的方法,因此,省略其详细说明。
例如,在非专利文献1中,将“dHorX”、“dHorY”、“dVerX”及“dVerY”的值、及以该块的左上方的坐标为原点时的各子块中央的坐标值代入预定模型,来算出运动矢量。本处理顺序在步骤S94结束后,移至步骤S95。
在步骤S95中,仿射运动矢量算出部111E判断是否满足在该块中应用PROF处理的条件。
应用条件可以包括“sps_affine_prof_enabled_flag”的值为“1”这一条件。
并且,应用条件也可以包括“slice_disable_bdof_dmvr_prof_flag”的值表示在该切片中可使用PROF处理(例如,该标志的值为“0”)这一条件。
此外,应用条件也可以包括不对该块应用“fallbackMode”这一条件。
仿射运动矢量算出部111E在判断出满足所有应用条件时,确定对该块应用PROF处理,本处理顺序前进至步骤S96。在除此以外的情况下,确定不对该块应用PROF处理,本处理顺序移至步骤S97,结束处理。
以上示出了仿射运动矢量算出部111E判断是否满足所有应用条件的例子,但仿射运动矢量算出部111E也可以通过逻辑上等效的其他方法来判断。
具体来说,也可以使上述所有应用条件反转,且定义为不应用PROF处理的条件,仿射运动矢量算出部111E在任一情况符合不应用的条件时,确定不对该块应用PROF处理,前进至步骤S97,在均不符合不应用的条件时,确定对该块应用PROF处理,前进至步骤S96。
与上述例子对应的不应用PROF处理的条件可以按照如下方式定义。
该不应用的条件可以包括“sps_affine_prof_enabled_flag”的值为“0”这一条件。
并且,该不应用的条件也可以包括“slice_disable_bdof_dmvr_prof_flag”的值表示在该切片中禁止使用PROF处理(例如,该标志的值为“1”)这一条件。
此外,该不应用的条件也可以包括对该块应用“fallbackMode”这一条件。
在步骤S96中,仿射运动矢量算出部111E算出PROF处理中使用的“diffMV”的值。例如,对以各子块的左上方的坐标为原点时的各像素位置,算出“diffMV”的值。另外,当该块内的各子块的尺寸相同时(例如,4×4像素),算出一个子块的各像素位置的“diffMV”,便可以在其他子块中沿用该值。
例如,可以按照如下方式算出“diffMV”。
diffMV[x][y][0]=x×(dHorX<<2)+y×(dVerX<<2)-posOffsetX
diffMV[x][y][1]=x×(dHorY<<2)+y×(dVerY<<2)-posOffsetY此处,x、y表示以各子块的左上方的坐标为原点时的各像素位置(x,y),[0]表示“diffMV”的x方向分量,[1]表示“diffMV”的y方向分量。
另外,以下关系成立。
posOffsetX=6×dHorX+6×dVerX
posOffsetY=6×dHorY+6×dVerY
之后,如非专利文献1所述,仿射运动矢量算出部111E进行右移及限幅处理。
在算出“diffMV”后,本处理顺序移至步骤S97,结束处理。
以上说明是关于该块中的一个参考帧的处理。例如,当为具有两个参考帧的双向预测时,对L0及L1分别执行上述步骤S91至S97的处理。因此,对于L0及L1,是否应用PROF处理的判断结果或“diffMV”的算出结果可能会分别不同。
图11是示出仿射预测信号生成部111F的处理的一个例子的流程图。
仿射预测信号生成部111F构成为当“slice_disable_bdof_dmvr_prof_flag”表示在与切片头部对应的切片内可使用PROF处理时(标志的值为“0”时),进行PROF处理,当表示不可使用PROF处理时(标志的值为“0”时),不进行PROF处理,来生成预测信号。
另外,仿射预测信号生成部111F也可以构成为当在切片头部中不包含“slice_disable_bdof_dmvr_prof_flag”时,隐含地解释为该标志表示可使用(标志的值为“0”)来进行处理。
在步骤S111中,仿射预测信号生成部111F生成预测信号。
具体来说,仿射预测信号生成部111F将由仿射运动矢量算出部111E算出的每个子块的运动矢量作为输入,当该运动矢量所指的位置为非整数像素位置时,应用滤波器将非整数像素位置的像素内插至参考帧的像素值。此处,关于具体的滤波器,可以应用非专利文献1中所揭示的最大6抽头的水平垂直可分离型滤波器。
当该块是进行双向预测的块时,仿射预测信号生成部111F生成L0及L1的预测信号这两者。
在步骤S112中,仿射预测信号生成部111F判断在该块的该预测方向(L0或L1)上是否应用PROF处理。在该判断中,可直接使用上述步骤S95中的判断结果。
当判断出在该块的该预测方向上应用PROF处理时,本处理顺序前进至步骤S113。另一方面,当判断出在该块的该预测方向上不应用PROF处理时,本处理顺序前进至步骤S114。
在步骤S113中,仿射预测信号生成部111F执行PROF处理。PROF处理的具体处理可以使用已知的方法,因此,省略其详细说明。仿射预测信号生成部111F通过PROF处理进行预测信号的校正。
在步骤S114中,当该块是进行双向预测的块时,仿射预测信号生成部111F对步骤S111中生成的L0与L1的预测信号、或在步骤S113中校正该预测信号所得的预测信号进行合成,生成最终预测信号。具体的合成方法可以使用已知的方法,因此,省略其详细说明。当该块是进行单向预测的块时,仿射预测信号生成部111F将步骤S111中生成的预测信号、或在步骤S113中校正该预测信号所得的预测信号直接作为最终预测信号。
在最终预测信号的生成完成后,本处理顺序移至步骤S115,结束处理。
在以上例子中,为方便起见,将预测信号生成部111D与仿射预测信号生成部111F作为不同的处理块进行了说明,但它们的部分处理可共用,也可以设为单一的处理块。
例如,步骤S81与S111、以及步骤S84与步骤S114可以视为相同的处理。
在该情况下,若在图8的步骤S82中判断为“否”之后,依次执行图10的步骤S112、S113及S114,便可以将图8及图10的流程图整合起来,视为单一的处理块。此时,以块为单位排他地应用BDOF处理及PROF处理。
(环路滤波处理部150)
下面,对本实施方式的环路滤波处理部150进行说明。图12是示出本实施方式的环路滤波处理部150的图。
如图12所示,环路滤波处理部150包括块边界检测部151、边界强度判断部153、滤波确定部154及滤波处理部155。
此处,末尾标注有“A”的构成是与垂直方向的块边界的解块滤波处理相关的构成,末尾标注有“B”的构成是与水平方向的块边界的解块滤波处理相关的构成。
下面,例示在进行垂直方向的块边界的解块滤波处理后,进行水平方向的块边界的解块滤波处理的情况。
如上所述,解块滤波处理可以应用于编码块,可以应用于预测块,也可以应用于变换块。并且,解块滤波处理也可以应用于将上述各块分割所得的子块。即,对象块及相邻块可以是编码块,可以是预测块,可以是变换块,也可以是将它们分割所得的子块。
在子块的定义中,包括作为细化部111C及预测信号生成部111D的处理单位所说明的子块。并且,在子块的定义中,包括作为仿射运动矢量算出部111E及仿射预测信号生成部111E的处理单位所说明的子块。当对子块应用解块滤波时,可以适当将以下说明中的块替换为子块。
由于垂直方向的块边界的解块滤波处理与水平方向的块边界的解块滤波处理是同样的处理,所以下面对垂直方向的块边界的解块滤波处理进行说明。
块边界检测部151A构成为基于表示块尺寸的控制数据,来检测块的边界。此处,块是编码块(CU)、预测块(PU)、变换块(TU)。具体的检测方法可应用已知的方法,因此,省略其详细说明。
边界强度判断部153A构成为判断对象块与相邻块的块边界的边界强度。
边界强度判断部153A还可以构成为基于表示对象块及相邻块是否是帧内预测块的控制数据,来判断块边界的边界强度。
例如,如图13所示,边界强度判断部153A也可以构成为当对象块及相邻块中的至少任一个块是帧内预测块时(即,块边界两侧的块中的至少任一个是帧内预测块时),判断块边界的边界强度为“2”。
边界强度判断部153A还可以构成为基于表示在对象块及相邻块中是否包含非零(zero)的正交变换系数、及块边界是否是变换块的边界的控制数据,来判断块边界的边界强度。
例如,如图13所示,边界强度判断部153A也可以构成为当对象块及相邻块中的至少任一个块包含非零的正交变换系数,且块边界是变换块的边界时(即,块边界两侧的块中的至少任一个中存在非零的变换系数,且是TU的边界时),判断块边界的边界强度为“1”。
边界强度判断部153A还可以构成为基于表示对象块及相邻块的运动矢量的差的绝对值是否为阈值(例如1/2像素)以上的控制数据,来判断块边界的边界强度。
例如,如图13所示,边界强度判断部153A也可以构成为当对象块及相邻块的运动矢量的差的绝对值为阈值(例如1/2像素)以上时(即,块边界两侧的块的运动矢量的差的绝对值为阈值(例如1/2像素)以上时),判断块边界的边界强度为“1”。
边界强度判断部153A还可以构成为基于表示对象块及相邻块的运动矢量的预测所参考的参考块是否不同的控制数据,来判断块边界的边界强度。
例如,如图13所示,边界强度判断部153A也可以构成为当对象块及相邻块的运动矢量的预测所参考的参考块不同时(即,在块边界两侧的块中参考图像不同时),判断块边界的边界强度为“1”。
边界强度判断部153A也可以构成为基于表示对象块及相邻块的运动矢量的个数是否不同的控制数据,来判断块边界的边界强度。
例如,如图13所示,边界强度判断部153A也可以构成为当对象块及相邻块的运动矢量的个数不同时(即,在块边界两侧的块中运动矢量的个数不同时),判断块边界的边界强度为“1”。
例如,如图13所示,边界强度判断部153A也可以构成为当上述条件均不被满足时,判断块边界的边界强度为“0”。
另外,很可能边界强度的值越大,在块边界产生的块失真越大。
对于亮度信号及色差信,上述边界强度判断方法可以通过共同的方法来判断,也可以使用部分不同的条件来判断。
滤波确定部154A构成为确定应用于块边界的滤波处理(例如,解块滤波处理)的种类。
例如,滤波确定部154A也可以构成为基于块边界的边界强度、或对象块及相邻块中包含的量化参数等,来确定是否对块边界应用滤波处理、是否应用弱滤波处理及强滤波处理中的任一滤波处理。
滤波确定部154A也可以构成为当块边界的边界强度为“0”时,确定不应用滤波处理。
滤波处理部155A构成为基于滤波确定部154A的确定结果,来对解块前图像进行处理。对解块前图像进行的处理是无滤波处理、弱滤波处理、强滤波处理等。
(图像解码装置200)
下面,参考图14对本实施方式的图像解码装置200进行说明。图14是示出本实施方式的图像解码装置200的功能块的一个例子的图。
如图14所示,图像解码装置200包括解码部210、逆变换及逆量化部220、加法器230、帧间预测部241、帧内预测部242、环路滤波处理部250及帧缓冲器260。
解码部210构成为对由图像编码装置100生成的编码数据进行解码,且对系数等级值进行解码。
此处,例如解码是顺序与由编码部140进行的熵编码相反的熵解码。
并且,解码部210也可以构成为通过编码数据的解码处理来获取控制数据。
另外,如上所述,控制数据可以包括编码块尺寸、预测块尺寸、变换块尺寸等尺寸数据。
并且,如上所述,控制数据也可以包括序列参数集(SPS)、图片参数集(PPS)、切片头部等头部信息。
例如,解码部21也可以构成为从切片头部解码出对可否使用PROF处理进行控制的标志、或者对可否使用DMVR处理、BDOF处理及PROF处理进行统一控制的标志等。
逆变换及逆量化部220构成为进行从解码部210输出的系数等级值的逆变换处理。此处,逆变换及逆量化部220也可以构成为在逆变换处理之前进行系数等级值的逆量化。
此处,逆变换处理及逆量化是按照与由变换及量化部131进行的变换处理及量化相反的顺序进行。
加法器230构成为将预测信号与从逆变换及逆量化部220输出的预测残差信号相加来生成滤波处理前解码信号,并将滤波处理前解码信号输出至帧内预测部242及环路滤波处理部250。
此处,滤波处理前解码信号构成帧内预测部242中使用的参考块。
与帧间预测部111同样地,帧间预测部241构成为通过帧间预测(interframeprediction)来生成预测信号。
具体来说,帧间预测部241构成为基于从编码数据中解码出的运动矢量及参考帧中包含的参考信号,针对每个预测块生成预测信号。帧间预测部241构成为将预测信号输出至加法器230。
与帧内预测部112同样地,帧内预测部242构成为通过帧内预测(intraframeprediction)来生成预测信号。
具体来说,帧内预测部242构成为指定对象帧中包含的参考块,并基于所指定的参考块,针对每个预测块生成预测信号。帧内预测部242构成为将预测信号输出至加法器230。
与环路滤波处理部150同样地,环路滤波处理部250构成为对从加法器230输出的滤波处理前解码信号进行滤波处理,且将滤波处理后解码信号输出至帧缓冲器260。
此处,例如滤波处理是减少在块(编码块、预测块、变换块或将它们分割所得的子块)的边界部分产生的失真的解块滤波处理。
与帧缓冲器160同样地,帧缓冲器260构成为存储帧间预测部241中使用的参考帧。
此处,滤波处理后解码信号构成帧间预测部241中使用的参考帧。
(帧间预测部241)
下面,参考图15对本实施方式的帧间预测部241进行说明。图15是示出本实施方式的帧间预测部241的功能块的一个例子的图。
如图15所示,帧间预测部241包括运动矢量解码部241B、细化部241C、预测信号生成部241D、仿射运动矢量算出部241E及仿射预测信号生成部241F。
帧间预测部241是构成为基于运动矢量来生成预测块中包含的预测信号的预测部的一个例子。
运动矢量解码部241B构成为通过从图像编码装置100接收到的控制数据的解码,来获取运动矢量。
并且,运动矢量解码部241B构成为也对与是否对该块使用仿射运动补偿相关的信息进行解码。
此处,当不对该块使用仿射运动补偿时,进行细化处理部241C及预测信号生成部241D的处理,当对该块使用仿射运动补偿时,进行仿射运动矢量算出部241E及仿射预测信号生成部241F的处理。
与细化部111C同样地,细化部241C构成为执行对运动矢量进行修正的细化处理。
与预测信号生成部111D同样地,预测信号生成部241D构成为基于运动矢量来生成预测信号。
与仿射运动矢量算出部111E同样地,仿射运动矢量算出部241E构成为使用由运动矢量解码部241B解码出的控制点运动矢量来算出各子块的运动矢量。
与仿射预测信号生成部111F同样地,仿射预测信号生成部241F使用由仿射运动矢量算出部241E算出的各子块的运动矢量来生成预测信号,且与预测信号生成部111D及仿射预测信号生成部111F同样地,预测信号生成部241D与仿射预测信号生成部241F也可以整合为同一处理块。
(环路滤波处理部250)
下面,对本实施方式的环路滤波处理部250进行说明。图16是示出本实施方式的环路滤波处理部250的图。
如图16所示,环路滤波处理部250包括块边界检测部251、边界强度判断部253、滤波确定部254及滤波处理部255。
此处,末尾标注有“A”的构成是与垂直方向的块边界的解块滤波处理相关的构成,末尾标注有“B”的构成是与水平方向的块边界的解块滤波处理相关的构成。
此处,例示在进行垂直方向的块边界的解块滤波处理后,进行水平方向的块边界的解块滤波处理的情况。
如上所述,解块滤波处理可以应用于编码块,可以应用于预测块,也可以应用于变换块。并且,解块滤波处理也可以应用于将上述各块分割所得的子块。即,对象块及相邻块可以是编码块,可以是预测块,可以是变换块,也可以是将它们分割所得的子块。
由于垂直方向的块边界的解块滤波处理与水平方向的块边界的解块滤波处理是同样的处理,所以下面对垂直方向的块边界的解块滤波处理进行说明。
与块边界检测部151A同样地,块边界检测部251A构成为基于表示块尺寸的控制数据,来检测块的边界。
与边界强度判断部153A同样地,边界强度判断部253A构成为判断对象块与相邻块的块边界的边界强度。块边界的边界强度的判断方法如上所述。
与滤波确定部154A同样地,滤波确定部254A构成为确定应用于块边界的解块滤波处理的种类。解块滤波处理的种类的确定方法如上所述。
与滤波处理部155A同样地,滤波处理部255A构成为基于滤波确定部254A的确定结果,来对解块前图像进行处理。对解块前图像进行的处理是无滤波处理、弱滤波处理、强滤波处理等。
(变更例1)
下面,参考图17及图18对上述实施方式的变更例1进行说明。下面,主要对与上述实施方式的不同点进行说明。在上述实施方式中,关于BDOF处理及PROF处理,分别省略了详细说明,但在本变更例中,对具体处理的一个例子进行说明。
第一,使用图17对步骤S83的BDOF处理的具体示例进行说明。
如图17所示,在步骤S171中,预测信号生成部111D/241D分别对与应用BDOF处理的块或子块对应的L0及L1的参考块内的各像素算出水平方向及垂直方向的亮度值梯度。
具体来说,预测信号生成部111D/241D利用下式对块内的各像素位置(x,y)算出上述梯度。
gradientHL0[x][y]=(predSamplesL0[hx+1][vy]>>shift1)-(predSamplesL0[hx-1][vy]>>shift1)
gradientV0[x][y]=(predSamplesL0[hx][vy+1]>shift1)-(predSamplesL0[hx][vy-1]>>shift1)
gradientHL1[x][y]=(predSamplesL1[hx+1][vy]>>shift1)-(predSamplesL1[hx-1][vy]>>shift1)
gradientV1[x][y]=(predSamplesL1[hx][vy+1]>shift1)-(predSamplesL0[hx][vy-1]>>shift1)
此处,“predSamplesL0”及“predSamplesL1”是步骤S81中算出的L0及L1的预测信号。并且,“hx”及“vy”由下式定义。
在下式中,“nCbW”是该块的宽度,“nCbH”是该块的高度,“Clip3(min,max,input)”是将“input”的值限幅在“min≦input≦max”的函数。
hx=Clip3(1,nCbW,x)
hy=Clip3(1,nCbH,y)
另外,“shift1”由下式定义。
shift1=Max(6,bitDepth-6)
此处,“bitDepth”是进行像素值的处理时的比特深度。
在步骤S172中,预测信号生成部111D/241D算出校正MV。
此处,第一,预测信号生成部111D/241D对该块或子块的各像素算出以下三个参数的值。
diff[x][y]=(predSamplesL0[hx][vy]>>shift2)-(predSamplesL1[hx][vy]>>shift2)
tempH[x][y]=(gradientHL0[x][y]+gradientHL1[x][y])>>shift3
tempV[x][y]=(gradientVL0[x][y]+gradientVL1[x][y])>>shift3
此处,“shift2”及“shift3”由下式定义。
shift2Max(4,bitDepth-8)
shift3=Max(3,15-bitDepth)
第二,预测信号生成部111D/241D将该块或子块分割成4×4像素块,如下所述,针对每个4×4像素块算出参数。
[数学式1]
sGx2=∑i∑j Abs(tempH[xSb+i][ySb+j])with i,j=-1..4
sGy2=∑i∑j Abs(tempV[xSb+i][ySb+j])with i,j=-1..4
sGxGy=∑i∑j(Sign(tempV[xSb+i][ySb+j])*tempH[xSb+i][ySb+j])with i,j=-1..4
sGxGym=sGxGy>>12
sGxGys=sGxGy&((1<<12)-1)
sGxdI=∑i∑j(-Sign(tempH[xSb+i][ySb+j])*diff[xSb+i][ySb+j])with i.j=-1..4
sGydI=∑i∑j(-Sign(tempV[xSb+i][ySb+j])*diff[xSb+i][ySb+j])with i.j=-1..4
此处,“xSb”及“yXb”是以该块或子块的左上方像素为原点时各4×4像素块的左上方像素的坐标。并且,“Sign(input)”是如下函数:在“input”的值为正时返回“1”,在“input”的值为负时返回“-1”,在“input”的值为“0”时返回“0”。
如下所述,预测信号生成部111D/241D使用以上述方式算出的值,来算出校正MV(vx,vy)。
vx=sGx2>0?Clip3(-mvRefineThres,mvRefineThres-1,-(sGxdI<<3)>>Floor(Log2(sGx2))):0
vy=sGx2>0?Clip3(-mvRefineThres,mvRefineThres-1,((sGydI<<3)-((vx×sGxGym)<<12+vx×sGxGys)>>1)>>Floor(Log2(sGx2))):0
此处,“mvRefineThres”由下式定义。
mvRefineThres=1<<Max(5,bitDepth-7)
通过设为上述构成,能够将校正MV(vx,vy)的各分量的比特宽度抑制在“1<<Max(5,bitDepth-7)+1”比特以内(含符号)。
在步骤S173中,如下所述,预测信号生成部111D/241D对各像素的预测信号进行校正。
bdofOffset=(vx×(gradientHL0[x+1][y+1]-gradientHL1[x+1][y+1]))>>1+(vy×(gradientVL0[x+1][y+1]-gradientVL1[x+1][y+1]))>>1
pbSamples[x][y]=Clip3(0,(2bitDepth)-1,(predSamplesL0[x+1][y+1]+offset4+predSamplesL1[x+1][y+1]+bdofOffset)>>shift4)
此处,“offset4”及“shift4”由下式定义。
offset4=1<<(shift4-1)
shift4=Max(3,15-bitDepth)
预测信号生成部111D/241D在进行以上所有处理后,进入步骤S174,结束处理。
接着,使用图18对步骤S113的PROF处理的具体示例进行说明。
如图18所示,在步骤S181中,仿射预测信号生成部111F/241F分别对应用PROF处理的L0及L1的参考块内的各像素算出水平方向及垂直方向的亮度值梯度。
具体来说,仿射预测信号生成部111F/241F利用下式对块内的各像素位置(x,y)算出梯度。
gradientH[x][y]=(predSamples[x+2][y]>>shift1)-(predSamples[x][y]>>shift1)
gradientV[x][y]=(predSamples[x][y+2]>>shift1)-(predSamples[x][y]>>shift1)
此处,“predSamples”是步骤S111中生成的L0或L1的预测信号。此处,设为shift1=Max(6,bitDepth-6)。
当对L0及L1这两者应用PROF处理时,仿射预测信号生成部111F/241F分别对L0及L1算出上述“gradientH”及“gradientV”。此时,以像素为单位来看,步骤S181中的计算内容与步骤S171的计算内容完全相同。
在步骤S182中,仿射预测信号生成部111F/241F计算校正MV。该处理实际上是作为步骤S96,在仿射运动矢量算出部111E/241E的内部进行,但为方便起见,视为在步骤S182中进行的处理来说明。实际上,仿射预测信号生成部111F/241F直接使用步骤S96中算出的值即可。
第一,与上述步骤S96的说明同样地,仿射预测信号生成部111F/241F算出“diffMv”的值。
diffMv[x][y][0]=x×(dHorX<<2)+y×(dVerX<<2)-posOffsetX
diffMv[x][y][1]=x×(dHorY<<2)+y×(dVerY<<2)-posOffsetY
第二,仿射预测信号生成部111F/241F将上述“diffMv”的值分别右移7比特。
第三,如下所述,仿射预测信号生成部111F/241F进行限幅处理。
diffMv[x][y][i]=Clip3(-dmvLimit,dmvLimit-1,diffMv[x][y][i])
此处,
dmvLimit=1<<Max(5,bitDepth-7)。
通过设为上述构成,能够将“diffMv”的各分量的比特宽度抑制在“1<<Max(5,bitDepth-7)+1”比特以内(含符号)。该比特宽度与步骤S172中算出的校正MV相同。
在步骤S183中,仿射预测信号生成部111F/241F进行预测信号的校正。
如下所述,仿射预测信号生成部111F/241F对应用PROF处理的块及预测方向进行预测信号“pbSamples”的值的校正。
dI=gradientH[x][y]×diffMv[x][y][0]+gradientV[x][y]×diffMv[x][y][1]
pbSamples[x][y]=predSamples[x+1][y+1]+(dI>>1)
当在L0及L1这两者中应用PROF处理时,仿射预测信号生成部111F/241F分别对L0及L1执行上述处理。
仿射预测信号生成部111F/241F在上述校正完成后,移至步骤S184,结束PROF处理。
仿射预测信号生成部111F/241F在PROF处理完成后,执行步骤S114中说明的预测值合成处理。预测值的合成例如可以由下式执行。
predSamples[x][y]=Clip3(0,(1<<bitDepth)-1,(predSamplesL0[x][y]+predSamplesL1[x][y]+offset2)>>shift2)
此处,
offset2=1<<(shift2-1)
shift2=Max(3,15-bitDepth)。
另外,当进一步通过PROF处理对L0侧的预测信号“predSamplesL0”及L1侧的预测信号“predSamplesL1”这两者进行校正时,若将步骤S183的计算代入“predSamplesL0”及“predSamplesL1”,则可以进行如下变形。
dI_Bi=(dI_L0>>1)+(dI_L1>>1)
pbSamples[x][y]=Clips(0,(1<<bitDepth)-1,(predSamplesL0_orig[x][y]+offset2+predSamplesL1_orig[x][y]+dI_Bi)>>shift2)
此处,“dI_L0”及“dI_L1”分别为L0及L1的dI的值,“predSamplesL0_orig”及“predSamplesL1_orig”是通过PROF处理进行校正前的预测信号。
以上所说明的BDOF处理及PROF处理中算出的梯度及校正MV的值分别被以比特宽度相同的方式限幅,因此,由此算出的“bdofOffset”及“dI_Bi”的比特宽度也相同。
即,也可以按照如下方式进行运算:由预测信号生成部111D/241D进行的BDOF处理中算出的偏移量、与由仿射预测信号生成部111F/241F进行的PROF处理中分别对两个参考帧(L0/L1)算出的偏移量合成后的值的比特宽度相同。
并且,对PROF处理后的预测信号进行合成时的“offset2”及“shift2”的值与BDOF处理的“offset4”及“shift4”的值也相同。因此,对L0及L1这两者应用BDOF处理及PROF处理时的预测值生成处理是完全相同的公式。
通过将BDOF处理及PROF处理设为上述构成,有如下效果。
第一,能够使步骤S171与步骤S181的梯度算出处理为完全相同的处理。
即,能够在PROF处理应用于两个参考帧(L0/L1)时,使由预测信号生成部111D/241D进行的BDOF处理中的梯度算出处理、与由仿射预测信号生成部111F/241F进行的PROF处理中的梯度算出处理为相同的处理。
第二,能够使步骤S172与步骤S182的输出即校正MV的比特宽度完全相同。
即,能够分别进行限幅处理,使由预测信号生成部111D/241D进行的BDOF处理中的校正MV量、与由仿射预测信号生成部111F/241F进行的PROF处理中使用的校正MV量分别为相同的比特宽度。
第三,能够使步骤S173的预测值校正处理与步骤S183的预测值校正处理及步骤S114的预测值合成处理为完全相同的处理。
即,能够使由预测信号生成部111D/241D使用偏移量进行的最终预测信号生成处理、与由仿射预测信号生成部111F/241F使用偏移量合成后的值进行的最终预测信号生成处理为相同的处理。
由于如上所述,针对每个块排他地应用BDOF处理及PROF处理,所以上述相同的处理部分在硬件上实现时,可以在BDOF处理及PROF处理中共用处理电路。由此,可以期待削减电路规模。
(变更例2)
下面,参考图19及图20对上述实施方式的变更例2进行说明。下面,主要对与上述实施方式的不同点进行说明。在本变更例中,使用与上述实施方式不同的例子,对块边界检测部151/251中的块边界检测方法及边界强度判断部153/253中的边界强度的判断方法进行说明。
下面,对块边界检测部151A进行说明,但在块边界检测部151B/251A/251B中,也可以通过同样的处理来检测块边界。
图19是示出块边界检测部151A的处理的一个例子的流程图。下面,将以CU为单位进行处理的情况作为例子进行说明。
在步骤S191中,块边界检测部151A检测CU边界。由于块边界检测部151A是检测垂直方向的边界的处理块,所以将该CU左侧的垂直方向的边界检测为滤波处理对象的块边界。
另外,“检测为块边界”例如相当于事先准备表示画面内的该像素位置是否为边界的二维标志序列(例如,“edgeFlags[x][y]”),将检测为边界的像素位置的标志值设为“1”,将不是边界的像素位置的标志值设为“0”。
此处,当该CU左侧的垂直方向的边界位于图片边界或切片边界或瓦片边界等编码单位的边界时,块边界检测部151A也可以不将该边界检测为块边界。
块边界检测部151A在按照上述顺序检测出CU边界后,移至步骤S192。
在步骤S192中,块边界检测部151A检测TU边界(变换块边界)。
块边界检测部151A以该CU左侧的垂直方向的边界为起点,一边使水平方向的坐标每次增加4像素,使垂直方向的像素位置每次增加1像素,一边确认各像素位置是否为TU边界。当该像素位置为TU边界时,块边界检测部151A将该像素位置检测为块边界。
块边界检测部151A在按照上述顺序检测出TU边界后,移至步骤S193。
在步骤S193中,块边界检测部151A检测子块边界。
在步骤S193中,作为检测对象的子块边界例如也可以是进行帧间预测后的CU的子块边界。
此时,在上述子块边界中,可以包括由细化部111C/241C执行的DMVR处理中的子块(例如,16×16像素尺寸)的边界、及由仿射运动矢量算出部111E/241E及仿射预测信号生成部111F/241F进行的仿射运动补偿中的子块(例如,4×4像素尺寸)的边界这两者。
在步骤S193中,作为检测对象的子块边界例如也可以是应用仿射运动补偿或“merge_subblock”后的CU的子块边界。
另外,当在该CU中应用PROF处理时,仿射运动补偿的子块与PROF处理的子块一致。
此处,在步骤S193中将仿射运动补偿的子块边界作为检测对象的情况下,当在该CU中应用PROF处理时,块边界检测部151A也可以不将仿射运动补偿的子块边界及PROF处理的子块边界作为检测对象。
即,也可以仅当在该CU中应用仿射运动补偿且在该CU中不应用PROF处理时,块边界检测部151A才将仿射运动补偿的子块边界作为检测对象。当然,对于应用PROF处理的CU,块边界检测部151A也可以将仿射运动补偿的子块边界及PROF处理的子块边界作为检测对象。
另外,对于进行双向预测的块的子块边界,可以当在L0或L1中的至少任一者中应用PROF处理时,块边界检测部151A便将该块视为“应用PROF处理的CU”。并且,也可以仅当在L0及L1这两者中均应用PROF处理时,块边界检测部151A才将该块视为“应用PROF处理的CU”。在以下说明中也可以进行同样的解释。
块边界检测部151A将该CU左侧的垂直方向的边界作为起点,一边使水平方向的坐标每次增加通过以下方法算出的子块尺寸,使垂直方向的像素位置每次增加1像素,一边确认各像素位置是否为子块边界。
当该像素位置为子块边界时,块边界检测部151A将该像素位置检测为块边界。此处,可以设为如下处理:即使该位置为子块边界,当对该CU应用PROF处理时,块边界检测部151A也不将其检测为子块边界。
例如,上述子块尺寸可以按照如下方式算出。
子块尺寸=Max(8,(nCbW/NumSbX))
此处,“nCbW”是该CU的宽度(水平方向的像素数),“NumSbX”是该CU内的水平方向上包括的子块的数量。
当使用上式时,是判断子块边界是否是以该CU左侧的垂直方向的边界为起点,且在水平方向上最小每隔8像素的位置处的子块边界。
例如,上述子块尺寸还可以按照如下方式算出。
子块尺寸=Max(4,(nCbW/NumSbX))
此时,是判断子块边界是否是以该CU左侧的垂直方向的边界为起点,且在水平方向上最小每隔4像素的位置处的子块边界。
即,块边界检测部151A构成为以对象块左端或上端的坐标为基准,以最小每隔4像素的间隔,判断对象像素位置是否为子块边界。
块边界检测部151A在按照上述顺序检测出子块边界后,移至步骤S194,结束处理。
以上以不对CU边界、TU边界、子块边界分别进行区分而是单纯地检测块边界为例进行了说明,但也可以对它们进行区分并存储。
例如,可以区分成CU边界、TU边界、子块边界进行存储,也可以区分成TU边界、运动矢量边界。此时,CU边界被检测为TU边界及运动矢量边界这两者。并且,TU边界被检测为TU边界,子块边界被检测为运动矢量边界。该区分例如可以在下述边界强度判断部153A中使用。
下面对边界强度判断部153A进行说明,在边界强度判断部153B/253A/253B中也可以进行完全相同的判断。
边界强度判断部153A可以构成为当对象像素位置不是块边界时,将边界强度判断为“0”。
即,块边界检测部151可以构成为不将应用PROF处理的块内的子块检测为块边界,边界强度判断部153A可以构成为将未被检测为块边界的像素位置的边界强度判断为“0”,滤波确定部154可以构成为当边界强度为“0”时,确定不对块边界应用解块滤波。
边界强度判断部153A也可以构成为基于表示对象块及相邻块是否为帧内预测块的控制数据,来判断块边界的边界强度。
例如,如图20所示,边界强度判断部153A也可以构成为当对象块及相邻块中的至少任一个块是帧内预测块时(即,块边界两侧的块中的至少任一个是帧内预测块时),判断块边界的边界强度为“2”。
边界强度判断部153A还可以构成为基于表示在对象块及相邻块中是否包含非零(zero)的正交变换系数、及块边界是否是变换块的边界的控制数据,来判断块边界的边界强度。
例如,如图20所示,边界强度判断部153A也可以构成为当对象块及相邻块中的至少任一个块包含非零的正交变换系数,且块边界是变换块的边界时(即,块边界两侧的块中的至少任一个中存在非零的变换系数,且是TU的边界时),判断块边界的边界强度为“1”。
边界强度判断部153A还可以构成为基于表示对象块及相邻块的运动矢量的差的绝对值是否为阈值(例如1/2像素)以上的控制数据,来判断块边界的边界强度。此时,也可以构成为基于该块边界是否是应用PROF处理的块内的子块边界,来判断边界的边界强度。
例如,如图20所示,边界强度判断部153A也可以构成为当对象块及相邻块的运动矢量的差的绝对值为阈值(例如1/2像素)以上时(即,块边界两侧的块的运动矢量的差的绝对值为阈值(例如1/2像素)以上时),且该块边界不是步骤S95中判断出应用PROF处理的块的子块(4×4像素块)边界时,判断块边界的边界强度为“1”。
即,边界强度判断部153A也可以构成为对每个块边界判断边界强度,并构成为当该块边界两侧的块的运动矢量的差的绝对值为1/2像素以上,且该块边界不是应用PROF处理后的子块边界时,将边界强度判断为“1”。
此处,滤波确定部154也可以构成为当边界强度为“0”时,确定不对块边界应用解块滤波。
例如,边界强度判断部153A也可以构成为当对象块及相邻块的运动矢量的差的绝对值为阈值(例如1/2像素)以上时(即,块边界两侧的块的运动矢量的差的绝对值为阈值(例如1/2像素)以上时),且该块边界两侧的块不是步骤S95中判断出应用PROF处理的块时,判断块边界的边界强度为“1”。
例如,边界强度判断部153A也可以构成为当对象块及相邻块的运动矢量的差的绝对值为阈值(例如1/2像素)以上时(即,块边界两侧的块的运动矢量的差的绝对值为阈值(例如1/2像素)以上时),且该块边界处至少任一个块不是步骤S95中判断出应用PROF处理的块时,判断块边界的边界强度为“1”。
另外,对于进行双向预测的块的子块边界,当在L0或L1中的至少任一者中应用PROF处理时,也可以视为“判断出应用PROF处理的块”。即,在该情况下,当未在L0及L1这两者中应用PROF处理时,在运动矢量的差为阈值以上时,将边界强度判断为“1”。
即,边界强度判断部153A也可以构成为当对象块为双向预测时,且对两个参考帧中的至少任一个应用了PROF处理时,便视为对对象块应用了PROF处理。
还可以仅当在L0及L1这两者中应用PROF处理时,才视为“判断出应用PROF处理的块”。即,在该情况下,当仅在L0或L1中应用了PROF处理时,且运动矢量的差为阈值以上时,将边界强度判断为“1”。
并且,作为另一个例子,也可以进行如下判断:对于应用了PROF处理的块边界,在判断边界强度时,不判断运动矢量的差,或将运动矢量的差视为“0”。作为具体示例,可以按照如下方式来判断。
当该块是进行单向预测的块,且在该块中应用PROF时,在判断子块边界的边界强度时,不判断运动矢量的差,或将运动矢量的差视为“0”。
当该块是进行双向预测的块,且L0侧的参考帧与L1侧的参考帧不同时,在L0侧及L1侧中应用PROF的预测方向(仅L0、仅L1或两者)上,不判断运动矢量的差,或将运动矢量的差视为“0”。
当该块是进行双向预测的块,且L0侧的参考帧与L1侧的参考帧是同一帧时,当在L0侧应用PROF时,不判断该子块边界两侧的L0的运动矢量之间的差,或将该子块边界两侧的L0的运动矢量之间的差视为“0”。
同样地,当在L1侧应用PROF时,不判断该子块边界两侧的L1的运动矢量之间的差,或将该子块边界两侧的L1的运动矢量之间的差视为“0”。
在该情况下,如以往那样,L0与L1之间的运动矢量的差用于判断边界强度。具体来说,例如,该子块边界左侧的子块的L0侧的运动矢量与该子块边界右侧的子块的L1侧的运动矢量的差用于判断边界强度。
即,边界强度判断部153A也可以构成为在判断对象边界两侧的块在相同预测方向上各自的运动矢量的差时,当在该预测方向上应用了PROF处理时,不判断该预测方向上各自的运动矢量的差,或将该预测方向上各自的运动矢量的差视为“0”。
或者,在该块是进行双向预测的块,且L0侧的参考帧与L1侧的参考帧是同一帧时,当该子块边界两侧的运动矢量分别应用PROF时,也可以不判断运动矢量的差,或将运动矢量的差视为“0”。
在该情况下,例如,当在L0侧及L1侧这两者中应用PROF时,也不判断L0与L1间的运动矢量的差,或将L0与L1间的运动矢量的差视为“0”,这一点与上述例子不同。
边界强度判断部153A还可以构成为基于表示对象块及相邻块的运动矢量的预测所参考的参考块是否不同的控制数据,来判断块边界的边界强度。
例如,如图20所示,边界强度判断部153A也可以构成为当对象块及相邻块的运动矢量的预测所参考的参考块不同时(即,在块边界两侧的块中参考图像不同时),判断块边界的边界强度为“1”。
边界强度判断部153A也可以构成为基于表示对象块及相邻块的运动矢量的个数是否不同的控制数据,来判断块边界的边界强度。
例如,如图20所示,边界强度判断部153A也可以构成为当对象块及相邻块的运动矢量的个数不同时(即,在块边界两侧的块中运动矢量的个数不同时),判断块边界的边界强度为“1”。
以上对使用运动矢量或参考块来判断边界强度的方法的例子进行了说明,但也可以仅对检测为上述CU边界、子块边界或运动矢量边界的块边界,进行使用运动矢量或参考块的判断。
换句话说,也可以在是TU边界、但不是子块边界或运动矢量边界的块边界,跳过使用运动矢量或参考块的判断。此时,在TU边界,仅确认在边界两侧的块中的至少任一个中是否存在非零的正交变换系数。
例如,如图20所示,边界强度判断部153A也可以构成为当上述条件均不被满足时,判断块边界的边界强度为“0”。
即,仿射预测信号生成部111F/241F构成为对每个块判断PROF是否适合,且当应用该PROF处理时,对将块分割所得的每个子块进行PROF处理。
并且,环路滤波处理部150/250构成为对每个块边界判断解块滤波是否适合,且确定不对应用PROF处理后的块的子块边界应用解块滤波。
通过设为上述构成,应用PROF处理后的块边界或子块边界的边界强度为“0”,从而不再应用解块滤波。由于PROF处理具有提高主观画质的效果,因此,通过设为这种构成,能够防止以下情况:由于利用解块滤波对块边界的像素值进行校正,反而损害主观画质。
并且,上述图像编码装置100及图像解码装置200也可以通过使计算机执行各功能(各步骤)的程序来实现。
另外,在上述各实施方式中,以将本发明应用于图像编码装置100及图像解码装置200为例进行了说明,但本发明并不仅限于此例,同样也可以应用于具有图像编码装置100及图像解码装置200的各功能的图像编码/解码系统。
根据本发明,能够通过不对应用PROF处理后的子块边界应用解块滤波,来防止主观画质变差。
[符号说明]
10:图像处理系统;100:图像编码装置;111、241:帧间预测部;111A:运动矢量搜索部;111B:运动矢量编码部;111C、241C:细化部;111D、241D:预测信号生成部;111E、241E:仿射运动矢量算出部;111F、241F:仿射预测信号生成部;112、242:帧内预测部;121:减法器;122、230:加法器;131:变换及量化部;132、220:逆变换及逆量化部;140:编码部;150、250:环路滤波处理部;160、260:帧缓冲器;200:图像解码装置;210:解码部;241B:运动矢量解码部。
Claims (9)
1.一种图像解码装置,其特征在于,包括:
仿射预测信号生成部,构成为针对每个块判断PROF(Prediction Refinement withOptical Flow)处理是否适合,当应用所述PROF处理时,针对将所述块分割所得的每个子块进行所述PROF处理;及
环路滤波处理部,构成为针对每个块边界判断解块滤波是否适合,确定不对应用所述PROF处理后的块的子块边界应用解块滤波。
2.根据权利要求1所述的图像解码装置,其特征在于,所述环路滤波处理部还包括块边界检测部,所述块边界检测部构成为以对象块的左端或上端的坐标为基准,以最小每隔4像素的间隔,判断对象像素位置是否为所述子块边界。
3.根据权利要求1或2所述的图像解码装置,其特征在于,所述环路滤波处理部包括:
边界强度判断部,构成为对所述每个块边界判断边界强度,并构成为当所述块边界两侧的块的运动矢量的差的绝对值为1/2像素以上且所述边界不是应用PROF处理后的子块边界时,将边界强度判断为“1”;及
滤波确定部,构成为当所述边界强度为“0”时,确定不对所述块边界应用解块滤波。
4.根据权利要求1或2所述的图像解码装置,其特征在于,所述环路滤波处理部包括:
块边界检测部,构成为不将应用所述PROF处理后的块内的子块检测为所述块边界;
边界强度判断部,构成为将未被检测为所述块边界的像素位置的边界强度判断为“0”;及
滤波确定部,构成为当所述边界强度为“0”时,确定不对所述块边界应用解块滤波。
5.根据权利要求3或4所述的图像解码装置,其特征在于,所述边界强度判断部构成为当对象块为双向预测时,且对两个参考帧中的至少任一个应用了所述PROF处理时,视为对所述对象块应用了所述PROF处理。
6.根据权利要求3或4所述的图像解码装置,其特征在于,所述边界强度判断部构成为当对象块为双向预测时,且对两个参考帧均应用了所述PROF处理时,视为对所述对象块应用了所述PROF处理。
7.根据权利要求1或2所述的图像解码装置,其特征在于,所述边界强度判断部构成为在判断对象边界两侧的块在相同预测方向上各自的运动矢量的差时,当在该预测方向上应用了所述PROF处理时,不判断该预测方向上各自的运动矢量的差,或将该预测方向上各自的运动矢量的差视为“0”。
8.一种图像解码方法,其特征在于,包括以下步骤:
针对每个块判断PROF(Prediction Refinement with OpticalFlow)处理是否适合,当应用所述PROF处理时,针对将所述块分割所得的每个子块进行所述PROF处理;及
针对每个块边界判断解块滤波是否适合,确定不对应用所述PROF处理后的块的子块边界应用解块滤波。
9.一种程序,其特征在于,在图像解码装置中使用,且使计算机执行以下步骤:
针对每个块判断PROF(Prediction Refinement with OpticalFlow)处理是否适合,当应用所述PROF处理时,针对将所述块分割所得的每个子块进行所述PROF处理;及
针对每个块边界判断解块滤波是否适合,确定不对应用所述PROF处理后的块的子块边界应用解块滤波。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019-172136 | 2019-09-20 | ||
JP2019172136A JP7200074B2 (ja) | 2019-09-20 | 2019-09-20 | 画像復号装置、画像復号方法及びプログラム |
PCT/JP2020/031565 WO2021054040A1 (ja) | 2019-09-20 | 2020-08-21 | 画像復号装置、画像復号方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114270867A true CN114270867A (zh) | 2022-04-01 |
CN114270867B CN114270867B (zh) | 2024-10-01 |
Family
ID=74883520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080058192.5A Active CN114270867B (zh) | 2019-09-20 | 2020-08-21 | 图像解码装置、图像解码方法及程序 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7200074B2 (zh) |
CN (1) | CN114270867B (zh) |
WO (1) | WO2021054040A1 (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU1102883A (en) * | 1981-12-28 | 1983-07-15 | A.B. Jensen | Anlag med bundluftkanaler til lufttorring af korn i et torrelager og til transport af kornet bort fra lageret |
CN101404767A (zh) * | 2008-11-24 | 2009-04-08 | 崔天龙 | 一种基于图像分析及人工智能的可变参数的自动化视频转码方法 |
CA2815819A1 (en) * | 2010-12-07 | 2012-06-04 | Sony Corporation | Image processing device and image processing method for applying filtering determination processes in parallel |
CN103248888A (zh) * | 2012-02-10 | 2013-08-14 | 美国博通公司 | 根据视频编码的采样点自适应偏移(sao) |
TW201334534A (zh) * | 2012-02-10 | 2013-08-16 | Broadcom Corp | 頻域取樣自適應偏移(sao) |
WO2013145773A1 (ja) * | 2012-03-30 | 2013-10-03 | 株式会社Jvcケンウッド | 画像符号化装置、画像符号化方法、画像符号化プログラム、送信装置、送信方法、及び送信プログラム、並びに画像復号装置、画像復号方法、画像復号プログラム、受信装置、受信方法、及び受信プログラム |
JP2014007713A (ja) * | 2012-06-27 | 2014-01-16 | Nippon Telegr & Teleph Corp <Ntt> | デブロッキング処理方法、デブロッキング処理装置、プログラム、及び記録媒体 |
WO2014015279A1 (en) * | 2012-07-20 | 2014-01-23 | Qualcomm Incorporated | Parameter sets in video coding |
EP2824925A1 (en) * | 2013-07-11 | 2015-01-14 | Nxp B.V. | Video decoding with reduced-complexity deblocking |
AU2015200216A1 (en) * | 2010-06-04 | 2015-02-12 | Sony Corporation | Image Processing Device and Method |
CN104620586A (zh) * | 2012-09-20 | 2015-05-13 | 索尼公司 | 图像处理装置和方法 |
AU2016200566A1 (en) * | 2009-07-01 | 2016-02-18 | Sony Group Corporation | Image processing device and method |
JP2016054570A (ja) * | 2011-01-18 | 2016-04-14 | ソニー株式会社 | 画像処理装置、画像処理方法、プログラム及び記録媒体 |
CN107925773A (zh) * | 2015-06-11 | 2018-04-17 | 英迪股份有限公司 | 使用自适应去块滤波编码和解码图像的方法及其装置 |
CN108696755A (zh) * | 2012-04-13 | 2018-10-23 | 三菱电机株式会社 | 图像编码装置、图像解码装置及其方法 |
CN110115038A (zh) * | 2016-12-22 | 2019-08-09 | 佳能株式会社 | 编码设备、编码方法和程序、解码设备、解码方法和程序 |
CN113711608A (zh) * | 2019-04-19 | 2021-11-26 | 北京字节跳动网络技术有限公司 | 利用光流的预测细化过程的适用性 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK149021C (da) * | 1981-12-28 | 1993-05-03 | Anton Brandi Jensen | Anlaeg med bundluftkanaler til lufttoerring af korn i et toerrelager og til transport af kornet bort fra lageret |
-
2019
- 2019-09-20 JP JP2019172136A patent/JP7200074B2/ja active Active
-
2020
- 2020-08-21 CN CN202080058192.5A patent/CN114270867B/zh active Active
- 2020-08-21 WO PCT/JP2020/031565 patent/WO2021054040A1/ja active Application Filing
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU1102883A (en) * | 1981-12-28 | 1983-07-15 | A.B. Jensen | Anlag med bundluftkanaler til lufttorring af korn i et torrelager og til transport af kornet bort fra lageret |
CN101404767A (zh) * | 2008-11-24 | 2009-04-08 | 崔天龙 | 一种基于图像分析及人工智能的可变参数的自动化视频转码方法 |
AU2016200566A1 (en) * | 2009-07-01 | 2016-02-18 | Sony Group Corporation | Image processing device and method |
AU2015200216A1 (en) * | 2010-06-04 | 2015-02-12 | Sony Corporation | Image Processing Device and Method |
CA2815819A1 (en) * | 2010-12-07 | 2012-06-04 | Sony Corporation | Image processing device and image processing method for applying filtering determination processes in parallel |
JP2016054570A (ja) * | 2011-01-18 | 2016-04-14 | ソニー株式会社 | 画像処理装置、画像処理方法、プログラム及び記録媒体 |
TW201334534A (zh) * | 2012-02-10 | 2013-08-16 | Broadcom Corp | 頻域取樣自適應偏移(sao) |
CN103248888A (zh) * | 2012-02-10 | 2013-08-14 | 美国博通公司 | 根据视频编码的采样点自适应偏移(sao) |
WO2013145773A1 (ja) * | 2012-03-30 | 2013-10-03 | 株式会社Jvcケンウッド | 画像符号化装置、画像符号化方法、画像符号化プログラム、送信装置、送信方法、及び送信プログラム、並びに画像復号装置、画像復号方法、画像復号プログラム、受信装置、受信方法、及び受信プログラム |
CN108696755A (zh) * | 2012-04-13 | 2018-10-23 | 三菱电机株式会社 | 图像编码装置、图像解码装置及其方法 |
JP2014007713A (ja) * | 2012-06-27 | 2014-01-16 | Nippon Telegr & Teleph Corp <Ntt> | デブロッキング処理方法、デブロッキング処理装置、プログラム、及び記録媒体 |
WO2014015279A1 (en) * | 2012-07-20 | 2014-01-23 | Qualcomm Incorporated | Parameter sets in video coding |
CN104620586A (zh) * | 2012-09-20 | 2015-05-13 | 索尼公司 | 图像处理装置和方法 |
EP2824925A1 (en) * | 2013-07-11 | 2015-01-14 | Nxp B.V. | Video decoding with reduced-complexity deblocking |
CN107925773A (zh) * | 2015-06-11 | 2018-04-17 | 英迪股份有限公司 | 使用自适应去块滤波编码和解码图像的方法及其装置 |
CN110115038A (zh) * | 2016-12-22 | 2019-08-09 | 佳能株式会社 | 编码设备、编码方法和程序、解码设备、解码方法和程序 |
CN113711608A (zh) * | 2019-04-19 | 2021-11-26 | 北京字节跳动网络技术有限公司 | 利用光流的预测细化过程的适用性 |
Non-Patent Citations (2)
Title |
---|
JIANLE CHEN: "Algorithm description for Versatile Video Coding and Test Model 6 (VTM 6)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 15TH MEETING: GOTHENBURG, SE, 3–12 JULY 2019, pages 3 * |
WEI CHEN: "Non-CE9: Block Boundary Prediction Refinement with Optical Flow for DMVR", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 15TH MEETING: GOTHENBURG, SE, 3–12 JULY 2019, pages 2 * |
Also Published As
Publication number | Publication date |
---|---|
JP2021052228A (ja) | 2021-04-01 |
CN114270867B (zh) | 2024-10-01 |
JP7200074B2 (ja) | 2023-01-06 |
WO2021054040A1 (ja) | 2021-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108781294B (zh) | 视频数据的运动补偿方法及装置 | |
US11800150B2 (en) | Method for deriving a motion vector | |
EP3941064B1 (en) | Image decoding device, image decoding method, and program | |
US20250008161A1 (en) | Image decoding device, method and program with prediction refinement optical flow | |
US20240283972A1 (en) | Image decoding device, image decoding method, and program | |
JP7106025B2 (ja) | 画像復号装置、画像復号方法及びプログラム | |
CN114270867A (zh) | 图像解码装置、图像解码方法及程序 | |
JP7012191B1 (ja) | 画像復号装置、画像復号方法及びプログラム | |
JP7055937B1 (ja) | 画像復号装置、画像復号方法及びプログラム | |
JP7356783B2 (ja) | 画像復号装置、画像復号方法及びプログラム | |
WO2013077304A1 (ja) | 画像符号化装置、画像復号装置、並びにそれらの方法及びプログラム | |
JP2021052389A (ja) | 画像復号装置、画像復号方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |