WO2018070632A1 - 영상 코딩 시스템에서 영상 디코딩 방법 및 장치 - Google Patents
영상 코딩 시스템에서 영상 디코딩 방법 및 장치 Download PDFInfo
- Publication number
- WO2018070632A1 WO2018070632A1 PCT/KR2017/005999 KR2017005999W WO2018070632A1 WO 2018070632 A1 WO2018070632 A1 WO 2018070632A1 KR 2017005999 W KR2017005999 W KR 2017005999W WO 2018070632 A1 WO2018070632 A1 WO 2018070632A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- weight
- current block
- deriving
- merge
- block
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 92
- 239000000523 sample Substances 0.000 claims abstract description 113
- 239000013074 reference sample Substances 0.000 claims abstract description 78
- 230000002093 peripheral effect Effects 0.000 description 57
- 230000002123 temporal effect Effects 0.000 description 21
- 238000013139 quantization Methods 0.000 description 11
- 238000001914 filtration Methods 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 4
- 101100080600 Schizosaccharomyces pombe (strain 972 / ATCC 24843) nse6 gene Proteins 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
Definitions
- the present invention relates to an image coding technique, and more particularly, to an image decoding method and apparatus in an image coding system.
- the demand for high resolution and high quality images such as high definition (HD) images and ultra high definition (UHD) images is increasing in various fields.
- the higher the resolution and the higher quality of the image data the more information or bit rate is transmitted than the existing image data. Therefore, the image data can be transmitted by using a medium such as a conventional wired / wireless broadband line or by using a conventional storage medium. In the case of storage, the transmission cost and the storage cost are increased.
- a high efficiency image compression technique is required to effectively transmit, store, and reproduce high resolution, high quality image information.
- An object of the present invention is to provide a method and apparatus for improving image coding efficiency.
- Another object of the present invention is to provide an inter prediction method and apparatus for performing prediction by applying weights for each motion information to L0 motion information and L1 motion information of a current block.
- Another technical problem of the present invention is to provide a method and apparatus for deriving L0 motion information and L1 motion information of a current block.
- Another technical problem of the present invention is to provide a method and apparatus for deriving weights for L0 motion information and L1 motion information of a current block.
- an image decoding method performed by a decoding apparatus.
- the method may include parsing a merge index for a current block, constructing a merge candidate list based on neighboring blocks of the current block, and selecting a merge candidate indicated by the merge index among merge candidates included in the merge candidate list.
- L0 motion information and L1 motion information of the current block based on the selected merge candidate; deriving an L0 reference sample based on the L0 motion information; referring to L1 based on the L1 motion information Deriving a sample, deriving an L0 weight and an L1 weight of the current block, and weighting the L0 reference sample and the L1 reference sample based on the L0 weight and the L1 weight to sum the current Generating a predictive sample of the block.
- a decoding apparatus for performing image decoding.
- the decoding apparatus comprises an entropy decoding unit for parsing a merge index for a current block, and a merge candidate list based on neighboring blocks of the current block, and a merge point indicated by the merge index among merge candidates included in the merge candidate list.
- Selects a candidate derives L0 motion information and L1 motion information of the current block based on the selected merge candidate, derives an L0 reference sample based on the L0 motion information, and references L1 based on the L1 motion information
- Derive a sample derive a L0 weight and an L1 weight of the current block, and weight the sum of the L0 reference sample and the L1 reference sample based on the L0 weight and the L1 weight to determine the weight of the current block.
- a prediction unit generating a prediction sample.
- a video encoding method performed by an encoding apparatus may include constructing a merge candidate list based on neighboring blocks of the current block, deriving L0 motion information and L1 motion information of the current block based on one of merge candidates included in the merge candidate list, Deriving an L0 reference sample based on L0 motion information, deriving an L1 reference sample based on the L1 motion information, deriving an L0 weight and an L1 weight of the current block, the L0 weight and the L1 weight And generating a prediction sample of the current block by weighting the L0 reference sample and the L1 reference sample based on a signal, and encoding and outputting prediction information about the current block. do.
- a video encoding apparatus constructed a merge candidate list based on neighboring blocks of the current block, deriving L0 motion information and L1 motion information of the current block based on one of merge candidates included in the merge candidate list, Deriving an L0 reference sample based on the L0 motion information, deriving an L1 reference sample based on the L1 motion information, deriving an L0 weight and an L1 weight of the current block, the L0 weight and the L1
- a prediction unit generating a prediction sample of the current block by weighting the L0 reference sample and the L1 reference sample based on a weight, and an entropy encoding unit encoding and outputting prediction information about the current block. Characterized in that.
- inter prediction may be performed by applying weights for each motion information to the L0 motion information and the L1 motion information for the current block, thereby improving the prediction accuracy for the current block.
- the data amount of additional information for the L0 motion information and the weights for the L1 motion information for the current block can be reduced, thereby improving the overall coding efficiency.
- FIG. 1 is a diagram schematically illustrating a configuration of a video encoding apparatus to which the present invention may be applied.
- FIG. 2 is a diagram schematically illustrating a configuration of a video decoding apparatus to which the present invention may be applied.
- FIG 3 illustrates the L0 reference picture and the L1 reference picture and MVL0 and MVL1 for inter prediction of the current block.
- FIG. 4 illustrates an example of configuring a merge candidate list for deriving motion information when the merge mode is applied to the current block.
- FIG 5 illustrates an example of deriving the L0 weight and the L1 weight from a merge candidate included in the merge candidate list.
- FIG. 6 exemplarily illustrates a case where the ratio of the POC difference between the current picture and the L0 reference picture and the ratio of the POC difference between the current picture and the L1 reference picture are different from each other.
- FIG. 7 exemplarily illustrates a method of deriving an L0 weight and an L1 weight of the current block based on a template of the current block and templates of reference blocks.
- FIG. 8 schematically illustrates a video encoding method by an encoding device according to the present invention.
- FIG. 9 schematically illustrates a video decoding method by a decoding apparatus according to the present invention.
- each configuration in the drawings described in the present invention are shown independently for the convenience of description of the different characteristic functions, it does not mean that each configuration is implemented by separate hardware or separate software.
- two or more of each configuration may be combined to form one configuration, or one configuration may be divided into a plurality of configurations.
- Embodiments in which each configuration is integrated and / or separated are also included in the scope of the present invention without departing from the spirit of the present invention.
- a picture generally refers to a unit representing one image of a specific time zone
- a slice is a unit constituting a part of a picture in coding.
- One picture may be composed of a plurality of slices, and if necessary, the picture and the slice may be mixed with each other.
- a pixel or a pel may refer to a minimum unit constituting one picture (or image). Also, 'sample' may be used as a term corresponding to a pixel.
- a sample may generally represent a pixel or a value of a pixel, and may only represent pixel / pixel values of the luma component, or only pixel / pixel values of the chroma component.
- a unit represents the basic unit of image processing.
- the unit may include at least one of a specific region of the picture and information related to the region.
- the unit may be used interchangeably with terms such as block or area in some cases.
- an M ⁇ N block may represent a set of samples or transform coefficients composed of M columns and N rows.
- FIG. 1 is a diagram schematically illustrating a configuration of a video encoding apparatus to which the present invention may be applied.
- the video encoding apparatus 100 may include a picture divider 105, a predictor 110, a subtractor 115, a transformer 120, a quantizer 125, a reordering unit 130,
- the entropy encoding unit 135, the residual processing unit 140, the adding unit 150, the filter unit 155, and the memory 160 may be included.
- the residual processor 140 may include an inverse quantizer 141 and an inverse transform unit 142.
- the picture divider 105 may divide the input picture into at least one processing unit.
- the processing unit may be called a coding unit (CU).
- the coding unit may be recursively split from the largest coding unit (LCU) according to a quad-tree binary-tree (QTBT) structure.
- LCU largest coding unit
- QTBT quad-tree binary-tree
- one coding unit may be divided into a plurality of coding units of a deeper depth based on a quad tree structure and / or a binary tree structure.
- the quad tree structure may be applied first and the binary tree structure may be applied later.
- the binary tree structure may be applied first.
- the coding procedure according to the present invention may be performed based on the final coding unit that is no longer split.
- the maximum coding unit may be used as the final coding unit immediately based on coding efficiency according to the image characteristic, or if necessary, the coding unit is recursively divided into coding units of lower depths and optimized.
- a coding unit of size may be used as the final coding unit.
- the coding procedure may include a procedure of prediction, transform, and reconstruction, which will be described later.
- the processing unit may include a coding unit (CU) prediction unit (PU) or a transform unit (TU).
- the coding unit may be split from the largest coding unit (LCU) into coding units of deeper depths along the quad tree structure.
- LCU largest coding unit
- the maximum coding unit may be used as the final coding unit immediately based on coding efficiency according to the image characteristic, or if necessary, the coding unit is recursively divided into coding units of lower depths and optimized.
- a coding unit of size may be used as the final coding unit. If a smallest coding unit (SCU) is set, the coding unit may not be split into smaller coding units than the minimum coding unit.
- the final coding unit refers to a coding unit that is the basis of partitioning or partitioning into a prediction unit or a transform unit.
- the prediction unit is a unit partitioning from the coding unit and may be a unit of sample prediction. In this case, the prediction unit may be divided into sub blocks.
- the transform unit may be divided along the quad tree structure from the coding unit, and may be a unit for deriving a transform coefficient and / or a unit for deriving a residual signal from the transform coefficient.
- a coding unit may be called a coding block (CB)
- a prediction unit is a prediction block (PB)
- a transform unit may be called a transform block (TB).
- a prediction block or prediction unit may mean a specific area in the form of a block within a picture, and may include an array of prediction samples.
- a transform block or a transform unit may mean a specific area in a block form within a picture, and may include an array of transform coefficients or residual samples.
- the prediction unit 110 may perform a prediction on a block to be processed (hereinafter, referred to as a current block) and generate a predicted block including prediction samples of the current block.
- the unit of prediction performed by the prediction unit 110 may be a coding block, a transform block, or a prediction block.
- the prediction unit 110 may determine whether intra prediction or inter prediction is applied to the current block. As an example, the prediction unit 110 may determine whether intra prediction or inter prediction is applied on a CU basis.
- the prediction unit 110 may derive a prediction sample for the current block based on reference samples outside the current block in the picture to which the current block belongs (hereinafter, referred to as the current picture). In this case, the prediction unit 110 may (i) derive the prediction sample based on the average or interpolation of neighboring reference samples of the current block, and (ii) the neighbor reference of the current block.
- the prediction sample may be derived based on a reference sample present in a specific (prediction) direction with respect to the prediction sample among the samples. In case of (i), it may be called non-directional mode or non-angle mode, and in case of (ii), it may be called directional mode or angular mode.
- the prediction mode may have, for example, 33 directional prediction modes and at least two non-directional modes.
- the non-directional mode may include a DC prediction mode and a planner mode (Planar mode).
- the prediction unit 110 may determine the prediction mode applied to the current block by using the prediction mode applied to the neighboring block.
- the prediction unit 110 may derive the prediction sample for the current block based on the sample specified by the motion vector on the reference picture.
- the prediction unit 110 may apply one of a skip mode, a merge mode, and a motion vector prediction (MVP) mode to derive a prediction sample for the current block.
- the prediction unit 110 may use the motion information of the neighboring block as the motion information of the current block.
- the skip mode unlike the merge mode, the difference (residual) between the prediction sample and the original sample is not transmitted.
- the MVP mode the motion vector of the current block may be derived using the motion vector of the neighboring block as a motion vector predictor.
- the neighboring block may include a spatial neighboring block existing in the current picture and a temporal neighboring block present in the reference picture.
- a reference picture including the temporal neighboring block may be called a collocated picture (colPic).
- the motion information may include a motion vector and a reference picture index.
- Information such as prediction mode information and motion information may be encoded (entropy) and output in the form of a bitstream.
- the highest picture on the reference picture list may be used as the reference picture.
- Reference pictures included in a reference picture list may be sorted based on a difference in a picture order count (POC) between a current picture and a corresponding reference picture.
- POC picture order count
- the subtraction unit 115 generates a residual sample which is a difference between the original sample and the prediction sample.
- residual samples may not be generated as described above.
- the transform unit 120 generates a transform coefficient by transforming the residual sample in units of transform blocks.
- the transform unit 120 may perform the transformation according to the size of the transform block and the prediction mode applied to the coding block or the prediction block that spatially overlaps the transform block. For example, if intra prediction is applied to the coding block or the prediction block that overlaps the transform block, and the transform block is a 4 ⁇ 4 residual array, the residual sample uses a discrete sine transform (DST). In other cases, the residual sample may be transformed by using a discrete cosine transform (DCT).
- DST discrete sine transform
- DCT discrete cosine transform
- the quantization unit 125 may quantize the transform coefficients to generate quantized transform coefficients.
- the reordering unit 130 rearranges the quantized transform coefficients.
- the reordering unit 130 may reorder the quantized transform coefficients in the form of a block into a one-dimensional vector form through a coefficient scanning method. Although the reordering unit 130 has been described in a separate configuration, the reordering unit 130 may be part of the quantization unit 125.
- the entropy encoding unit 135 may perform entropy encoding on the quantized transform coefficients.
- Entropy encoding may include, for example, encoding methods such as exponential Golomb, context-adaptive variable length coding (CAVLC), context-adaptive binary arithmetic coding (CABAC), and the like.
- the entropy encoding unit 135 may encode information necessary for video reconstruction other than the quantized transform coefficients (for example, a value of a syntax element) together or separately. Entropy encoded information may be transmitted or stored in units of network abstraction layer (NAL) units in the form of bitstreams.
- NAL network abstraction layer
- the inverse quantization unit 141 inverse quantizes the quantized values (quantized transform coefficients) in the quantization unit 125, and the inverse transform unit 142 inverse transforms the inverse quantized values in the inverse quantization unit 141 to generate a residual sample.
- the adder 150 reconstructs the picture by combining the residual sample and the predictive sample.
- the residual sample and the predictive sample may be added in units of blocks to generate a reconstructed block.
- the adder 150 may be part of the predictor 110.
- the adder 150 may be called a restoration unit or a restoration block generation unit.
- the filter unit 155 may apply a deblocking filter and / or a sample adaptive offset to the reconstructed picture. Through deblocking filtering and / or sample adaptive offset, the artifacts of the block boundaries in the reconstructed picture or the distortion in the quantization process can be corrected.
- the sample adaptive offset may be applied on a sample basis and may be applied after the process of deblocking filtering is completed.
- the filter unit 155 may apply an adaptive loop filter (ALF) to the reconstructed picture. ALF may be applied to the reconstructed picture after the deblocking filter and / or sample adaptive offset is applied.
- ALF adaptive loop filter
- the memory 160 may store reconstructed pictures (decoded pictures) or information necessary for encoding / decoding.
- the reconstructed picture may be a reconstructed picture after the filtering process is completed by the filter unit 155.
- the stored reconstructed picture may be used as a reference picture for (inter) prediction of another picture.
- the memory 160 may store (reference) pictures used for inter prediction.
- pictures used for inter prediction may be designated by a reference picture set or a reference picture list.
- FIG. 2 is a diagram schematically illustrating a configuration of a video decoding apparatus to which the present invention may be applied.
- the video decoding apparatus 200 may include an entropy decoding unit 210, a residual processor 220, a predictor 230, an adder 240, a filter 250, and a memory 260. It may include.
- the residual processor 220 may include a reordering unit 221, an inverse quantization unit 222, and an inverse transform unit 223.
- the video decoding apparatus 200 may reconstruct the video in response to a process in which the video information is processed in the video encoding apparatus.
- the video decoding apparatus 200 may perform video decoding using a processing unit applied in the video encoding apparatus.
- the processing unit block of video decoding may be, for example, a coding unit, and in another example, a coding unit, a prediction unit, or a transform unit.
- the coding unit may be split along the quad tree structure and / or binary tree structure from the largest coding unit.
- the prediction unit and the transform unit may be further used in some cases, in which case the prediction block is a block derived or partitioned from the coding unit and may be a unit of sample prediction. At this point, the prediction unit may be divided into subblocks.
- the transform unit may be divided along the quad tree structure from the coding unit, and may be a unit for deriving a transform coefficient or a unit for deriving a residual signal from the transform coefficient.
- the entropy decoding unit 210 may parse the bitstream and output information necessary for video reconstruction or picture reconstruction. For example, the entropy decoding unit 210 decodes information in a bitstream based on a coding method such as exponential Golomb coding, CAVLC, or CABAC, quantized values of syntax elements necessary for video reconstruction, and residual coefficients. Can be output.
- a coding method such as exponential Golomb coding, CAVLC, or CABAC, quantized values of syntax elements necessary for video reconstruction, and residual coefficients. Can be output.
- the CABAC entropy decoding method receives a bin corresponding to each syntax element in a bitstream, and decodes syntax element information and decoding information of neighboring and decoding target blocks or information of symbols / bins decoded in a previous step.
- the context model may be determined using the context model, the probability of occurrence of a bin may be predicted according to the determined context model, and arithmetic decoding of the bin may be performed to generate a symbol corresponding to the value of each syntax element. have.
- the CABAC entropy decoding method may update the context model by using the information of the decoded symbol / bin for the context model of the next symbol / bean after determining the context model.
- the information related to the prediction among the information decoded by the entropy decoding unit 210 is provided to the prediction unit 230, and the residual value on which the entropy decoding has been performed by the entropy decoding unit 210, that is, the quantized transform coefficient, is used as a reordering unit ( 221 may be input.
- the reordering unit 221 may rearrange the quantized transform coefficients in a two-dimensional block form.
- the reordering unit 221 may perform reordering in response to coefficient scanning performed by the encoding apparatus.
- the rearrangement unit 221 has been described in a separate configuration, but the rearrangement unit 221 may be part of the inverse quantization unit 222.
- the inverse quantization unit 222 may dequantize the quantized transform coefficients based on the (inverse) quantization parameter and output the transform coefficients.
- information for deriving a quantization parameter may be signaled from the encoding apparatus.
- the inverse transform unit 223 may inversely transform transform coefficients to derive residual samples.
- the prediction unit 230 may perform prediction on the current block and generate a predicted block including prediction samples for the current block.
- the unit of prediction performed by the prediction unit 230 may be a coding block, a transform block, or a prediction block.
- the prediction unit 230 may determine whether to apply intra prediction or inter prediction based on the information about the prediction.
- a unit for determining which of intra prediction and inter prediction is to be applied and a unit for generating a prediction sample may be different.
- the unit for generating a prediction sample in inter prediction and intra prediction may also be different.
- whether to apply inter prediction or intra prediction may be determined in units of CUs.
- a prediction mode may be determined and a prediction sample may be generated in PU units
- intra prediction a prediction mode may be determined in PU units and a prediction sample may be generated in TU units.
- the prediction unit 230 may derive the prediction sample for the current block based on the neighbor reference samples in the current picture.
- the prediction unit 230 may derive the prediction sample for the current block by applying the directional mode or the non-directional mode based on the neighbor reference samples of the current block.
- the prediction mode to be applied to the current block may be determined using the intra prediction mode of the neighboring block.
- the prediction unit 230 may derive the prediction sample for the current block based on the sample specified on the reference picture by the motion vector on the reference picture.
- the prediction unit 230 may apply any one of a skip mode, a merge mode, and an MVP mode to derive a prediction sample for the current block.
- motion information required for inter prediction of the current block provided by the video encoding apparatus for example, information about a motion vector, a reference picture index, and the like may be obtained or derived based on the prediction information.
- the motion information of the neighboring block may be used as the motion information of the current block.
- the neighboring block may include a spatial neighboring block and a temporal neighboring block.
- the prediction unit 230 may construct a merge candidate list using motion information of available neighboring blocks, and may use information indicated by the merge index on the merge candidate list as a motion vector of the current block.
- the merge index may be signaled from the encoding device.
- the motion information may include a motion vector and a reference picture. When the motion information of the temporal neighboring block is used in the skip mode and the merge mode, the highest picture on the reference picture list may be used as the reference picture.
- the difference (residual) between the prediction sample and the original sample is not transmitted.
- the motion vector of the current block may be derived using the motion vector of the neighboring block as a motion vector predictor.
- the neighboring block may include a spatial neighboring block and a temporal neighboring block.
- a merge candidate list may be generated by using a motion vector of a reconstructed spatial neighboring block and / or a motion vector corresponding to a Col block, which is a temporal neighboring block.
- the motion vector of the candidate block selected from the merge candidate list is used as the motion vector of the current block.
- the information about the prediction may include a merge index indicating a candidate block having an optimal motion vector selected from candidate blocks included in the merge candidate list.
- the prediction unit 230 may derive the motion vector of the current block by using the merge index.
- a motion vector predictor candidate list may be generated using a motion vector of a reconstructed spatial neighboring block and / or a motion vector corresponding to a Col block, which is a temporal neighboring block.
- the prediction information may include a prediction motion vector index indicating an optimal motion vector selected from the motion vector candidates included in the list.
- the prediction unit 230 may select the predicted motion vector of the current block from the motion vector candidates included in the motion vector candidate list using the motion vector index.
- the prediction unit of the encoding apparatus may obtain a motion vector difference (MVD) between the motion vector of the current block and the motion vector predictor, and may encode the output vector in a bitstream form. That is, MVD may be obtained by subtracting the motion vector predictor from the motion vector of the current block.
- the prediction unit 230 may obtain a motion vector difference included in the information about the prediction, and derive the motion vector of the current block by adding the motion vector difference and the motion vector predictor.
- the prediction unit may also obtain or derive a reference picture index or the like indicating a reference picture from the information about the prediction.
- the adder 240 may reconstruct the current block or the current picture by adding the residual sample and the predictive sample.
- the adder 240 may reconstruct the current picture by adding the residual sample and the predictive sample in block units. Since the residual is not transmitted when the skip mode is applied, the prediction sample may be a reconstruction sample.
- the adder 240 has been described in a separate configuration, the adder 240 may be part of the predictor 230. On the other hand, the adder 240 may be called a restoration unit or a restoration block generation unit.
- the filter unit 250 may apply the deblocking filtering sample adaptive offset, and / or ALF to the reconstructed picture.
- the sample adaptive offset may be applied in units of samples and may be applied after deblocking filtering.
- ALF may be applied after deblocking filtering and / or sample adaptive offset.
- the memory 260 may store reconstructed pictures (decoded pictures) or information necessary for decoding.
- the reconstructed picture may be a reconstructed picture after the filtering process is completed by the filter unit 250.
- the memory 260 may store pictures used for inter prediction.
- pictures used for inter prediction may be designated by a reference picture set or a reference picture list.
- the reconstructed picture can be used as a reference picture for another picture.
- the memory 260 may output the reconstructed picture in an output order.
- the motion information may include L0 motion information for the L0 direction and / or L1 motion information for the L1 direction.
- the L0 motion information may include an L0 reference picture index and a motion vector L0 indicating a L0 reference picture included in the reference picture list L0 (List 0, L0) for the current block.
- the L1 motion information may include an L1 reference picture index and an MVL1 indicating an L1 reference picture included in a reference picture list L0 (List 1, L1) for the current block.
- the L0 direction may be referred to as a past direction or a forward direction.
- the L1 direction may also be called a future direction or a reverse direction.
- the reference picture list L0 may include pictures that are earlier in the output order than the current picture
- the reference picture list L1 may include pictures that are later in the output order than the current picture.
- inter prediction when performing inter prediction based on L0 motion information, it may be called LO prediction, and when performing inter prediction based on L1 motion information, it may be called L1 prediction.
- L0 prediction when inter prediction is performed based on the motion information and the L1 motion information, it may be called bi-prediction.
- the decoding apparatus may derive an L0 reference block based on the L0 motion information, and L1 based on the L1 motion information.
- a reference block can be derived.
- the decoding apparatus may generate the prediction sample of the current block by adding the L0 reference sample of the L0 reference block and the L1 reference sample of the L1 reference block corresponding to the L0 reference sample with the same weight.
- the decoding apparatus may derive the L0 reference sample based on the L0 motion information, derive the L1 reference sample based on the L1 motion information, and may refer to the sample value of the L0 reference sample and the L1 reference sample.
- the prediction sample may be generated by halving the value of the sample plus the sample value. This may correspond to the case where the weight of each of the L0 reference sample and the L1 reference sample is 1/2. In this case, a predicted block including the prediction sample may be derived based on the following equation.
- Block pred is a prediction block of the current block
- Block cor0 is the L0 reference block indicated by the MVL0
- Block cor1 is the L1 indicated by the MVL1. Represents a reference block.
- the decoding apparatus may generate the prediction sample in consideration of weights for the L0 direction and the L1 direction, respectively.
- the method of generating the prediction sample in consideration of the weight of each of the L0 direction and the L1 direction may improve prediction accuracy as compared to the pair prediction method shown in Equation (1).
- the decoding apparatus may derive the L0 reference sample based on the L0 motion information, derive the L1 reference sample based on the L1 motion information, and L0 weights to the sample value of the L0 reference sample.
- the prediction sample may be generated by adding a value obtained by multiplying by and a value obtained by multiplying the L1 weight by the sample value of the L1 reference sample.
- a predicted block including the prediction sample may be derived based on the following equation.
- Block pred is a prediction block of the current block
- Block cor0 is an L0 reference block indicated by the MVL0
- block cor1 is an L1 reference block indicated by the MVL1
- w represents the L0 weight.
- the L1 weight may be represented by 1 minus the first weight, that is, (1-w).
- the L0 weight and the L1 weight are directly coded and signaled by the motion information in the current block as in the AMVP mode
- the L0 weight and the L1 weight may be obtained through information on the directly coded L0 weight and the L1 weights.
- motion information is signaled by indexing motion information of a neighboring block, such as a merge mode
- the motion information may be obtained through various methods as follows.
- the decoding apparatus may derive a merge candidate list for deriving motion information of the current block based on neighboring blocks of the current block.
- the merge candidate list may be configured to include motion information of spatially adjacent neighboring blocks of the current block as merge candidates.
- the spatially adjacent peripheral blocks may be referred to as spatial peripheral blocks.
- the spatial peripheral block may include a lower left peripheral block A0, a left peripheral block A1, a right upper peripheral block B0, an upper peripheral block B1, and / or an upper left peripheral block B2 of the current block.
- the merge candidate list may be configured to include motion information of a temporal neighboring block, for example, the temporal neighboring block T0 or the temporal neighboring block T1 shown in FIG. 4, as a merge candidate.
- the reference picture including the temporal neighboring block may be referred to as a collocated picture (colPic), and the temporal neighboring block is the right bottom peripheral block T0 of the same position block in the collocated picture, or Center right bottom block T1 may be included.
- the merge candidate list may be configured to include a combined bi-predicted candidate or a zero vector derived by combining the motion information of the neighboring blocks as a merge candidate.
- the merge candidate list may be configured based on a combined pair prediction candidate derived from a combination of the motion information of the spatial neighboring block of the current block, the motion information of the temporal neighboring block, and / or the motion information of the neighboring blocks.
- One of the merge candidates included in the merge candidate list may be selected and used as motion information of the current block.
- motion information of neighboring blocks of the current block illustrated in FIG. 4, that is, A0, A1, B0, B1, B2, T0, T1, and Combined candidate included as merge candidates of the merge candidate list may use AMVP mode.
- the motion information may include L0 weight and L1 weight for each motion information.
- the L0 weight and the L1 weight are stored in block units, the L0 weight and the L1 weight of the current block may be derived based on the L0 weight and the L1 weight for each motion information.
- the L0 weight and the L1 weight used for prediction of the neighboring block associated with the selected merge candidate are respectively L0 weight and L1 of the current block.
- A1 is selected among merge candidates included in the merge candidate list
- the L0 weight and the L1 weight used for prediction of the neighboring block existing at the A1 position, that is, the left neighboring block of the current block are respectively included. It can be derived from the L0 weight and the L1 weight of the current block.
- the value of the L0 weight used for the prediction of the left neighboring block is 3/8 and the value of the L1 weight is 5/8
- the value of the L0 weight of the current block is 3/8 and the value of the L1 weight is Can be derived as 5/8.
- FIG. 5B illustrates a process of decoding the current block by using weights when a merge mode is applied to the current block.
- the decoding apparatus may parse a merge index for the current block (S500). The merge index may be signaled through the bitstream.
- the decoding apparatus may construct a merge candidate list (S510). As described above, the decoding apparatus may derive the merge candidate list including motion information of neighboring blocks of the current block as merge candidates.
- the decoding apparatus may borrow weights of the selected merge candidate, that is, the selected motion information, among the merge candidates included in the merge candidate list as the weights of the current block (S520).
- the selected merge candidate may indicate a merge candidate indicated by the merge index.
- the decoding apparatus may apply weights of the motion information of the selected merge candidate, that is, the selected neighboring block, as the weights of the current block.
- the decoding apparatus may derive a value selected for prediction of a block of each merge candidate, that is, the most of the merge candidates, that is, the weights of the merge candidates, as the weight of the current block.
- the decoding apparatus may derive the mode of the weights of the merge candidates as the weight of the current block.
- the decoding apparatus may derive the mode of the L0 weights of the merge candidates included in the merge candidate list, and derive the mode of the L0 weights of the merge candidates as the L0 weight of the current block. can do.
- the decoding apparatus may derive the mode of the L1 weights of the merge candidates included in the merge candidate list, and derive the mode of the L1 weights of the merge candidates as the L1 weight of the current block. have
- the decoding apparatus may apply an average value of weight values of motion information (merge candidates) of neighboring blocks of the current block as the weight of the current block.
- the decoding apparatus may derive an average value of L0 weights of merge candidates included in the merge candidate list, and derive the average value of the L0 weights of the merge candidates as the L0 weight of the current block. can do.
- the decoding apparatus may derive an average value of the L1 weights of the merge candidates included in the merge candidate list, and derive the average value of the L1 weights of the merge candidates as the L1 weight of the current block.
- the decoding apparatus may apply a median value of weight values of motion information (merge candidates) of neighboring blocks of the current block as the weight of the current block.
- the decoding apparatus may derive a median value of L0 weights of merge candidates included in the merge candidate list, and convert the median value of the L0 weights of the merge candidates to the L0 weight of the current block. Can be derived.
- the decoding apparatus may derive a median value of L1 weights of merge candidates included in the merge candidate list, and derive the median value of the L1 weights of the merge candidates as the L1 weight of the current block. .
- the weights of the current block may be derived based on the motion information of the neighboring blocks of the current block, but information on the weights of the current block may be directly transmitted, and based on the information. Weights of the current block may be derived.
- pair prediction may be performed based on motion information of neighboring blocks of the current block selected from merge candidates of the merge candidate list.
- the weights may be derived through a cost function using the L0 reference block and the L1 reference block derived based on the motion information.
- the cost function for deriving the L0 weight and the L1 weight may be represented by the following equation.
- Block ref0 is a sample value of the L0 reference block indicated by MVL0 in the L0 direction
- Block ref1 is a sample value of the L1 reference block indicated by the MVL1 in the L1 direction
- w is the L0 weight.
- the L1 weight may be represented by 1 minus the L0 weight, that is, (1-w).
- the cost may represent a difference between the L0 reference block and the corresponding samples of the L1 reference block, and as shown in Equation 3, the cost may include the L0 reference block to which the L0 weight is applied and the L1 weight to which the L1 weight block is applied. It can be derived as the sum of the absolute values of the differences between corresponding samples of the L1 reference blocks.
- the cost can be used to derive weights for the pair prediction.
- the encoding apparatus may derive a plurality of costs by applying a plurality of L0 weight candidate and L1 weight candidate combinations to the L0 reference block and the L1 reference block, and relates to a cost that is the least of the plurality of costs.
- An index indicating the L0 weight candidate and the L1 weight candidate combination may be signaled.
- the decoding apparatus may parse the index and derive the L0 weight candidate and the L1 weight candidate of the combination of the L0 weight candidate and the L1 weight candidate indicated by the index as the L0 weight and the L1 weight, respectively.
- the index may be referred to as a pair prediction weight index or a weight index.
- rate-distortion optimization RDO may be performed by including a rate in the process of deriving the weights.
- the weight index may be transmitted in a prediction unit (PU) or a coding unit (CU).
- the prediction unit may be called a prediction block
- the coding unit may be called a coding block.
- a syntax when the weight index is transmitted in a CU unit may be configured as shown in the following table.
- cu_skip_flag is a syntax element of a skip flag indicating whether a CU skip mode is applied
- part_mode is a syntax element indicating partitioning information of the CU to the PU
- bi_pred_weighting_idx is an L0 weighting candidate and an L1 weighting candidate combination.
- the weight index may be signaled at a lower frequency than the method in which the weight index is parsed before the part_mode is parsed and the weight index is transmitted in PU units.
- the bit rate may be increased compared to the case where the weight index is transmitted in PU units.
- a syntax when the weight index is transmitted in units of PUs may be configured as shown in the following table.
- merge_flag represents a syntax element of a merge flag indicating whether a merge mode is applied to a PU
- merge_idx represents a syntax element of the merge index
- bi_pred_weighting_idx represents the weight index.
- the method of binarizing the weight index may include a method in which the weight index and the binary code are fixedly associated with each other, and a method in which the weight index and the binarization code are variably associated with each other.
- An example of a method of binarizing the weight index by fixedly matching the weight index and the binarization code may be as shown in the following table.
- the values of the L0 weight candidate and the L1 weight candidate combination indicated by the value of the weight index may be derived as shown in column 2 of Table 3.
- the binarization code corresponding to the value of the weight index may be derived as shown in column 3 of Table 3.
- the number of bits allocated for the weight index may be variable according to the value of the weight index, and a small number of bits may be allocated when the selected frequency is a high value.
- the combination of L0 weight candidate and L1 weight candidate having a value of (1/2, 1/2) may be most frequently selected for prediction of each block, in which case the weight index indicating the combination
- the coding gain can be obtained by assigning a low bit binarization code to a value of.
- a 3-bit binarization code may correspond to all values of the weight index. That is, the number of bits of the weight index may be fixed to 3 bits.
- the 3-bit binarization code may include 000, 001, 010, 011, 100, 101, and 110.
- the binarization code may be fixedly corresponding to the value of the weight index, but may also be variably corresponding.
- the value of the weight index can be predicted.
- an L0 weight predictor and an L1 weight predictor may be predicted based on at least one of the merge candidates (or motion information of neighboring blocks of the current block), and correspond to the L0 weight predictor and the L1 weight predictor.
- An index value may be derived.
- the L0 weight and the L1 weight of the merge candidate selected based on the merge index may be derived as the L0 weight predictor and the L1 weight predictor, respectively.
- the weight index may indicate a difference value between an index value corresponding to the L0 weight predictor and the L1 weight predictor and an actual weight index value among the index values for the combinations. That is, a binarization code allocated according to the difference value and the value of the weight index may correspond. A binary code representing the weight index may be assigned bits of variable length based on the difference value. The binarization code corresponding to the difference value may be as shown in the following table.
- the difference value may be expressed as a value obtained by subtracting an index value corresponding to the L0 weight predictor and the L1 weight predictor from the value of the actual weight index.
- the value of the weight index predicted by grasping the tendency of the weights of the neighboring blocks may be 2 indicating a combination of (3/8, 5/8), and the value of the actually derived weight index is When 4 indicates a combination of (5/8, 3/8), the difference value may be represented by 2 minus 2 by 4. Therefore, the binarization code of the weight index actually derived may be derived as 11110.
- the value of the weight index predicted by identifying the tendency of the weights of the neighboring blocks may be 5 indicating a combination of (6/8, 2/8), and the value of the actually derived weight index is (1/2, In the case of 3 indicating a combination of 1/2), the difference value may be represented by ⁇ 2 minus 5. Therefore, the binarization code of the weighted index actually derived may be derived as 1110.
- the combination of (x, y) may represent a combination of the L0 weight candidate and the L1 weight candidate in which the value of the L0 weight candidate is x and the value of the L1 weight candidate is y.
- the method for mapping the variable binarization code to the value of the weighted index may have a problem that the binarization code becomes long because the difference value is increased by almost two times because the difference value needs to be transmitted.
- the difference value may be encoded by restricting the case to seven types.
- the weights may be derived based on a ratio of a POC difference between a current picture and an L0 reference picture and a POC difference between the current picture and the L1 reference picture.
- the L0 weight and the L1 weight may be derived such that a ratio of the L0 weight to the L1 weight is inversely proportional to a ratio of a POC difference between an L0 reference picture and the current picture and a POC difference between an L1 reference picture and the current picture.
- a difference in POC between the L0 reference picture and the current picture and a difference in POC between the L1 reference picture and the current picture may be the same.
- the L0 weight and the L1 weight may be equally 1/2.
- a POC difference between the L0 reference picture and the current picture may be 2, and a POC difference between the L1 reference picture and the current picture may be 1.
- a ratio between the POC difference between the L0 reference picture and the current picture and the POC difference between the L1 reference picture and the current picture may be derived as 2: 1.
- the L0 weight may be 1/3 and the L1 weight may be 2/3 to be inversely proportional to the ratio of 2: 1.
- a POC difference between pictures may be called a time distance, and a POC difference between the L0 reference picture and the current picture is a first time distance, and a POC difference between the L1 reference picture and the current picture is a second time distance. It can be called.
- the L0 weight and the L1 weight are calculated based on a template of the current block and a template of a reference block.
- the template of the current block may be a specific area including left peripheral samples and the upper peripheral samples of the current block
- the template of the reference block may include the left peripheral samples and the upper peripheral samples of the reference block. It may be a specific area that includes.
- FIG. 7 exemplarily illustrates a method of deriving an L0 weight and an L1 weight of the current block based on a template of the current block and templates of reference blocks.
- FIG. 7A illustrates a template of the current block, a template of the L0 reference block corresponding to a template of the current block, and a template of the L1 reference block.
- the template of the L0 reference block may be called an L0 template
- the template of the L1 reference block may be called an L1 template.
- the decoding apparatus may derive the L0 weight and the L1 weight of the current block based on the template of the current block, the L0 template, and the L1 template.
- the decoding apparatus may parse the merge index (S700).
- the merge index may be signaled through the bitstream.
- the decoding apparatus may construct a merge candidate list (S710).
- the decoding apparatus may derive the merge candidate list including motion information of neighboring blocks of the current block as merge candidates.
- the decoding apparatus may derive the motion information of the current block based on a merge candidate indicated by the merge index among merge candidates included in the merge candidate list.
- the decoding apparatus may derive the L0 reference block and the L1 reference block of the current block based on the motion information.
- the decoding apparatus may derive the L0 template and the L1 template corresponding to the template of the current block and the template of the current block.
- the template of the current block may include left peripheral samples and top peripheral samples of the current block. That is, the template of the current block may be a specific area including left peripheral samples and the upper peripheral samples of the current block.
- the L0 template may include left peripheral samples and upper peripheral samples of the L0 reference block
- the L1 template may include left peripheral samples and upper peripheral samples of the L1 reference block.
- the L0 template may be a specific area including the left peripheral samples and the upper peripheral samples of the L0 reference block
- the L1 template may be the specific area including the left peripheral samples and the upper peripheral samples of the L1 reference block. Can be.
- the decoding apparatus may calculate an L0 weight and an L1 weight of the current block based on the template of the current block, the L0 template, and the L1 template (S720).
- the L0 template and corresponding samples of the L1 template may be weighted, and the difference between the sampled value of the template of the current block and the weighted value, that is, the cost is used to derive weights for the pair prediction.
- a plurality of L0 weight candidate and L1 weight candidate combinations may be applied to the L0 template and the L1 template to derive a plurality of weighted sum templates, and the plurality of weighted reference blocks.
- a plurality of costs with a template of the current block for each of the templates of the plurality of templates may be derived, and the L0 weight candidate and the L1 weight candidate for the least cost of the plurality of costs are respectively represented by the L0 weight and It can be derived from the L1 weight.
- the cost function for deriving the L0 weight and the L1 weight may be represented by the following equation. That is, the cost may be derived based on the following equation.
- i and j represent the position (i, j) of the sample in the block and cost distortion Is the cost
- Temp cur is the sample value of the template of the current block
- Temp ref0 is the sample value of the L0 template
- Temp ref1 is the sample value of the L1 template
- w is the L0 weight.
- the L1 weight may be represented by 1 minus the L0 weight, that is, (1-w).
- the decoding apparatus may derive weights for the pair prediction based on Equation (4).
- the decoding apparatus may decode the current block based on the calculated weights (S730).
- the decoding apparatus may generate a prediction block of the current block by weighting the L0 reference block and the L1 reference block of the current block based on the L0 weight and the L1 weight.
- the decoding apparatus may directly use the prediction block as a reconstruction block according to a prediction mode, or generate a reconstruction block by adding a residual to the prediction block.
- the weights may be derived by using the above-described methods in combination. Specifically, a method of using the above-described motion information of the neighboring block with respect to the current block, that is, the weight of the merge candidate indicated by the merge index as the weight of the current block and the method of deriving the weight based on the POC difference In this case, it may be selectively applied, or a method of deriving the weight based on the POC difference and a method of deriving the weight based on the templates of the current block and the reference block may be applied.
- L0 weights And L1 weight may be derived as 1/2, and when reference pictures are located at different time distances, that is, when the first time distance and the second time distance are different, the template and reference of the current block described above
- the L0 weight and the L1 weight may be derived based on a template of blocks.
- the weight of the motion information of the selected spatial neighboring block is When the merge candidate derived from the motion information of the temporal neighboring block or the combination of the motion information among the merge candidates is selected for the motion information of the current block, the weight of the current block is 1 / Can be derived as 2.
- the weight of the motion information of the selected spatial neighboring block is
- the derived merge candidate of motion information or motion information of a temporal neighboring block among the merge candidates is selected for the motion information of the current block.
- the weights of the current block can be calculated based on the templates of.
- FIG. 8 schematically illustrates a video encoding method by an encoding device according to the present invention.
- the method disclosed in FIG. 8 may be performed by the encoding apparatus disclosed in FIG. 1.
- S800 to S850 of FIG. 8 may be performed by the prediction unit of the encoding apparatus
- S860 may be performed by the entropy encoding unit of the encoding apparatus.
- the encoding apparatus constructs a merge candidate list based on neighboring blocks of the current block (S800).
- the merge candidate list may be configured to include motion information of spatially adjacent neighboring blocks of the current block as merge candidates.
- the spatially adjacent peripheral blocks may be referred to as spatial peripheral blocks.
- the spatial peripheral block may include a lower left peripheral block, a left peripheral block, a right upper peripheral block, an upper peripheral block, and / or an upper left peripheral block of the current block.
- the merge candidate list may also be configured to include motion information of temporally adjacent neighboring blocks as merge candidates.
- the peripheral blocks adjacent in time may be called temporal peripheral blocks.
- the merge candidate list may be configured to include a combined bi-predicted candidate or a zero vector derived by combining the motion information of the neighboring blocks as a merge candidate.
- the merge candidate list may be configured based on the motion information of the spatial neighboring block of the current block, the motion information of the temporal neighboring block, and / or the combined pair prediction candidate.
- the encoding apparatus derives the L0 motion information and the L1 motion information of the current block based on one of the merge candidates included in the merge candidate list (S810).
- the encoding apparatus may select one of merge candidates included in the merge candidate list to derive motion information of the current block.
- the selected merge candidate may include L0 motion information and L1 motion information of neighboring blocks of the current block.
- the M0 motion information of the merge candidate may be derived as the L0 motion information of the current block
- the L1 motion information of the merge candidate may be derived as the L1 motion information of the current block.
- the L0 motion information of the current block may include an L0 reference picture index and a motion vector L0 indicating a L0 reference picture included in a reference picture list L0 (List 0, L0) for the current block.
- the L1 motion information of the current block may include an L1 reference picture index and an MVL1 indicating an L1 reference picture included in a reference picture list L0 (List 1, L1) for the current block.
- the encoding apparatus derives an L0 reference sample based on the L0 motion information (S820).
- the encoding apparatus may derive the L0 reference sample based on the L0 motion information.
- the encoding apparatus may derive the L0 reference block indicated by the MVL0 in the L0 reference picture indicated by the L0 reference picture index, and the L0 reference block may include the L0 reference sample.
- the encoding apparatus derives an L1 reference sample based on the L1 motion information (S830).
- the encoding apparatus may derive the L1 reference sample based on the L1 motion information.
- the encoding apparatus may derive the L1 reference block indicated by the MVL1 in the L1 reference picture indicated by the L1 reference picture index, and the L1 reference block may include the L1 reference sample.
- the encoding apparatus derives the L0 weight and the L1 weight of the current block (S840).
- the encoding apparatus may derive the L0 weight and the L1 weight of the current block through various methods.
- the encoding apparatus may derive the L0 weight and the L1 weight of the current block based on the L0 weight and the L1 weight of the selected merge candidate.
- the encoding apparatus may derive the L0 weight of the selected merge candidate as the L0 weight of the current block, and may derive the L1 weight of the selected merge candidate as the L1 weight of the current block.
- the encoding apparatus may derive the mode of the L0 weights and L1 weights of the merge candidates included in the merge candidate list as the L0 weight and the L1 weight of the current block. Specifically, the encoding apparatus may derive the mode of the L0 weights of the merge candidates included in the merge candidate list as the L0 weight of the current block, and determine the L1 weights of the merge candidates included in the merge candidate list. The mode of the values may be derived as the L1 weight of the current block.
- the encoding apparatus may derive the L0 weight and the L1 weight of the current block based on the average value of the L0 weights and the average value of the L1 weights of the merge candidates included in the merge candidate list.
- the encoding apparatus may derive an average value of the L0 weights of the merge candidates included in the merge candidate list and derive an average value of the L1 weights of the merge candidates included in the merge candidate list.
- the encoding apparatus may derive the average value of the L0 weights of the merge candidates as the L0 weight of the current block, and derive the average value of the L1 weights of the merge candidates as the L1 weight of the current block.
- the encoding apparatus may derive the L0 weight and the L1 weight of the current block based on the median value of the L0 weights and the L1 weights of the merge candidates included in the merge candidate list.
- the encoding apparatus may derive a median value of the L0 weights of the merge candidates included in the merge candidate list and derive the median value of the L1 weights of the merge candidates included in the merge candidate list.
- the encoding apparatus may derive the intermediate value of the L0 weights of the merge candidates as the L0 weight of the current block, and derive the intermediate value of the L1 weights of the merge candidates as the L1 weight of the current block. Can be.
- the encoding apparatus may derive a first difference between a picture order count (POC) of the current picture and a POC of the L0 reference picture in which the L0 reference sample is located, and the POC of the current picture and the L1 reference sample
- a second difference with the POC of the located L1 reference picture may be derived, and the L0 weight and the L1 weight may be derived based on a ratio between the first difference and the second difference.
- the encoding apparatus may derive the L0 weight and the L1 weight such that the ratio of the L0 weight to the L1 weight is inversely proportional to the ratio of the first difference to the second difference.
- the decoding apparatus may derive the L0 weight and the L1 weight based on a ratio between the first difference and the second difference.
- the sum of the L0 weight and the L1 weight may be 1.
- the L0 weight is inversely proportional to the ratio 2: 1 between the first difference and the second difference. Is 1/3, and the L1 weight may be derived as 2/3.
- the first difference may be referred to as a first time distance
- the second difference may be referred to as a second time distance.
- the encoding apparatus may determine the L0 weight and the L1 weight based on the template of the current block, the template of the L0 reference block including the L0 reference sample, and the template of the L1 reference block including the L1 reference sample. Can be derived.
- the encoding apparatus may derive a template of the current block based on neighboring samples of the current block, and may derive a template of the L0 reference block including the L0 reference sample corresponding to the template of the current block. And a template of an L1 reference block including the L1 reference sample corresponding to the template of the current block.
- the template of the current block may include left peripheral samples and upper peripheral samples of the current block
- the template of the L0 reference block may include left peripheral samples and upper peripheral samples of the L0 reference block
- the template of the L1 reference block may include left peripheral samples and upper peripheral samples of the L1 reference block.
- the encoding apparatus may derive a plurality of weighted templates by weighting a template of the L0 reference block and a template of the L1 reference block based on a plurality of L0 weight candidates and L1 weight candidate combinations, and generating the plurality of weighted sums.
- the cost with the template of the current block for each of the templates can be derived.
- the encoding apparatus may derive the L0 weight candidate and the L1 weight candidate for the lowest cost among the costs as the L0 weight and the L1 weight, respectively.
- the weighted template may be derived as the sum of the template of the L0 reference block to which the L0 weight candidate is applied and the corresponding samples of the template of the L1 reference block to which the L1 weight candidate is applied.
- the cost may also be expressed as sum of absolute differences (SAD) between corresponding samples between the template of the current block and the weighted template.
- the cost may be derived based on Equation 4 described above. That is, the L0 weight and the L1 weight may be derived based on Equation 4 described above.
- the weights may be derived using a combination of the above-described methods. Specifically, the method of using the motion information of the neighboring block with respect to the current block, that is, the weight of the merge candidate as it is as the weight of the current block and the method of deriving the weight based on the POC difference, Alternatively, the method of deriving the weight based on the POC difference and the method of deriving the weight based on the templates of the current block and the reference block may be selectively applied in some cases.
- the L0 weight and the L1 weight may be derived as 1/2, and when the first difference and the second difference are not the same, the current described above
- a method of deriving the L0 weight and the L1 weight of the current block may be applied based on the template of the block, the template of the L0 reference block, and the template of the L1 reference block.
- the L0 weight and the L1 weight of the merge candidate are the L0 weight and the weight of the current block, respectively.
- the L0 weight and the L1 weight of the current block may be derived as 1/2.
- the L0 weight and the L1 weight of the merge candidate are respectively the current block. If the selected merge candidate is not the motion information of the spatial neighboring block, based on the template of the current block, the template of the L0 reference block and the template of the L1 reference block. A method of deriving the L0 weight and the L1 weight of the current block may be applied.
- the encoding apparatus may generate and signal a weight index indicating the L0 weight and the L1 weight of the current block.
- the encoding apparatus may generate a weight index indicating one of combinations of the L0 weight candidate and the L1 weight candidate.
- the L0 weight candidate and the L1 weight candidate combinations may be preset, or may be derived based on merge candidates included in the merge candidate list.
- the weight index may be signaled through the bitstream.
- the encoding apparatus may parse a merge flag indicating whether a merge mode is applied to the current block, and the weight index may be signaled only when the merge flag has a value of 1.
- the weight index may be signaled in a CU unit or a PU unit.
- the number of bits of the weight index may be variable.
- the binarization code of the weight index may be derived as shown in Table 3 above.
- the encoding apparatus may derive an L0 weight predictor and an L1 weight predictor based on at least one of the merge candidates, wherein the weight index is the L0 weight predictor and the L1 weight predictor among the index values for the combinations.
- a difference value between an index value corresponding to and an index value for the L0 weight and the L1 weight of the current block may be represented.
- the L0 weight and the L1 weight of the selected merge candidate may be derived as the L0 weight predictor and the L1 weight predictor, respectively.
- a binary code representing the weight index may be assigned bits of variable length based on the difference value.
- the binarization code indicating the weight index may be derived as shown in Table 4 above.
- the encoding apparatus generates a prediction sample of the current block by weighting the L0 reference sample and the L1 reference sample based on the L0 weight and the L1 weight (S850).
- the encoding apparatus may apply the L0 weight to the L0 reference sample and apply the L1 weight to the L1 reference sample.
- the encoding apparatus may generate the prediction sample by adding the L0 reference sample to which the L0 weight is applied and the L1 reference sample to which the L1 weight is applied.
- the prediction sample may be generated based on Equation 2 described above.
- the encoding apparatus encodes and outputs prediction information about the current block (S860).
- the encoding apparatus may generate a merge index indicating the merge candidate selected to derive the motion information of the current block.
- the encoding device may encode and output the merge index.
- the merge index may be included in the prediction information.
- the encoding apparatus may generate the weighted index and may encode and output the weighted index.
- the weight index may be included in the prediction information.
- the encoding apparatus may generate a residual sample based on the original sample and the derived prediction sample.
- the encoding apparatus may generate information about the residual based on the residual sample.
- the information about the residual may include transform coefficients related to the residual sample.
- the encoding apparatus may derive the reconstructed sample based on the prediction sample and the residual sample. That is, the encoding apparatus may derive the reconstructed sample by adding the prediction sample and the residual sample.
- the encoding apparatus may encode the information about the residual and output the bitstream.
- the bitstream may be transmitted to a decoding apparatus via a network or a storage medium.
- FIG. 9 schematically illustrates a video decoding method by a decoding apparatus according to the present invention.
- the method disclosed in FIG. 9 may be performed by the decoding apparatus disclosed in FIG. 2.
- S900 may be performed by the entropy decoding unit of the decoding apparatus
- S910 to S970 may be performed by the prediction unit of the decoding apparatus.
- the decoding apparatus parses the merge index for the current block (S900).
- the decoding apparatus may receive the merge index through the bitstream.
- the merge index may indicate one of merge candidates included in the merge candidate list of the current block.
- the decoding apparatus configures the merge candidate list based on neighboring blocks of the current block (S910).
- the merge candidate list may be configured to include motion information of spatially adjacent neighboring blocks of the current block as merge candidates.
- the spatially adjacent peripheral blocks may be referred to as spatial peripheral blocks.
- the spatial peripheral block may include a lower left peripheral block, a left peripheral block, a right upper peripheral block, an upper peripheral block, and / or an upper left peripheral block of the current block.
- the merge candidate list may also be configured to include motion information of temporally adjacent neighboring blocks as merge candidates.
- the peripheral blocks adjacent in time may be called temporal peripheral blocks.
- the merge candidate list may be configured to include a combined bi-predicted candidate or a zero vector derived by combining the motion information of the neighboring blocks as a merge candidate.
- the merge candidate list may be configured based on the motion information of the spatial neighboring block of the current block, the motion information of the temporal neighboring block, and / or the combined pair prediction candidate.
- the decoding apparatus selects a merge candidate indicated by the merge index among merge candidates included in the merge candidate list (S920).
- the merge index may indicate one of merge candidates included in the merge candidate list.
- the merge candidate indicated by the merge index may be selected to derive motion information of the current block.
- the decoding apparatus derives L0 motion information and L1 motion information of the current block based on the selected merge candidate (S930).
- the selected merge candidate may include L0 motion information and L1 motion information of neighboring blocks of the current block.
- the L0 motion information of the selected merge candidate may be derived as the L0 motion information of the current block
- the L1 motion information of the selected merge candidate may be derived as the L1 motion information of the current block.
- the L0 motion information of the current block may include an L0 reference picture index and a motion vector L0 indicating a L0 reference picture included in a reference picture list L0 (List 0, L0) for the current block.
- the L1 motion information of the current block may include an L1 reference picture index and an MVL1 indicating an L1 reference picture included in a reference picture list L0 (List 1, L1) for the current block.
- the decoding apparatus derives an L0 reference sample based on the L0 motion information (S940).
- the decoding apparatus may derive the L0 reference sample based on the L0 motion information.
- the decoding apparatus may derive the L0 reference block indicated by the MVL0 in the L0 reference picture indicated by the L0 reference picture index, and the L0 reference block may include the L0 reference sample.
- the decoding apparatus derives an L1 reference sample based on the L1 motion information (S950).
- the decoding apparatus may derive the L1 reference sample based on the L1 motion information.
- the decoding apparatus may derive the L1 reference block indicated by the MVL1 in the L1 reference picture indicated by the L1 reference picture index, and the L1 reference block may include the L1 reference sample.
- the decoding apparatus derives the L0 weight and the L1 weight of the current block (S960).
- the decoding apparatus may derive the L0 weight and the L1 weight of the current block through various methods.
- the decoding apparatus may derive the L0 weight and the L1 weight of the current block based on the L0 weight and the L1 weight of the selected merge candidate.
- the decoding apparatus may derive the L0 weight of the selected merge candidate as the L0 weight of the current block, and may derive the L1 weight of the selected merge candidate as the L1 weight of the current block.
- the decoding apparatus may derive the mode of the L0 weights and L1 weights of the merge candidates included in the merge candidate list as the L0 weight and the L1 weight of the current block. Specifically, the decoding apparatus may derive the mode of the L0 weights of the merge candidates included in the merge candidate list as the L0 weight of the current block, and determine the L1 weights of the merge candidates included in the merge candidate list. The mode of the values may be derived as the L1 weight of the current block.
- the decoding apparatus may derive the L0 weight and the L1 weight of the current block based on the average value of the L0 weights and the average value of the L1 weights of the merge candidates included in the merge candidate list.
- the decoding apparatus may derive an average value of L0 weights of the merge candidates included in the merge candidate list and derive an average value of the L1 weights of the merge candidates included in the merge candidate list.
- the decoding apparatus may derive the average value of the L0 weights of the merge candidates as the L0 weight of the current block, and derive the average value of the L1 weights of the merge candidates as the L1 weight of the current block.
- the decoding apparatus may derive the L0 weight and the L1 weight of the current block based on the median value of the L0 weights and the L1 weights of the merge candidates included in the merge candidate list.
- the decoding apparatus may derive a median value of L0 weights of merge candidates included in the merge candidate list and derive a median value of L1 weights of merge candidates included in the merge candidate list.
- the decoding apparatus may derive the intermediate value of the L0 weights of the merge candidates as the L0 weight of the current block, and derive the intermediate value of the L1 weights of the merge candidates as the L1 weight of the current block. Can be.
- the decoding apparatus may receive information about the L0 weight and the L1 weight and derive the L0 weight and the L1 weight based on the received information.
- the decoding apparatus may parse a weight index indicating one of combinations of the L0 weight candidate and the L1 weight candidate.
- the L0 weight candidate and the L1 weight candidate combinations may be preset, or may be derived based on merge candidates included in the merge candidate list.
- the weight index may be signaled through the bitstream.
- the decoding apparatus may derive the L0 weight candidate and the L1 weight candidate of the combination indicated by the weight index among the combinations as the L0 weight and the L1 weight, respectively.
- the decoding apparatus may parse a merge flag indicating whether a merge mode is applied to the current block, and the weight index may be parsed only when the merge flag has a value of 1.
- the weight index may be signaled in a CU unit or a PU unit.
- the weight index may be signaled only when the merge index has a value of 1.
- the weight index may be signaled in a CU unit or a PU unit.
- the number of bits of the weight index may be variable.
- the binarization code of the weight index may be derived as shown in Table 3 above.
- the decoding apparatus may derive an L0 weight predictor and an L1 weight predictor based on at least one of the merge candidates, and the weight index is the L0 weight predictor and the L1 weight predictor among the index values for the combinations.
- a difference value between an index value corresponding to and an index value for the L0 weight and the L1 weight of the current block may be represented.
- the L0 weight and the L1 weight of the selected merge candidate may be derived as the L0 weight predictor and the L1 weight predictor, respectively.
- a binary code representing the weight index may be assigned bits of variable length based on the difference value.
- the binarization code indicating the weight index may be derived as shown in Table 4 above.
- the decoding apparatus may derive a first difference between a picture order count (POC) of a current picture and a POC of an L0 reference picture in which the L0 reference sample is located, and the POC of the current picture and the L1 reference sample
- a second difference with the POC of the located L1 reference picture may be derived, and the L0 weight and the L1 weight may be derived based on a ratio between the first difference and the second difference.
- the decoding apparatus may derive the L0 weight and the L1 weight such that the ratio of the L0 weight to the L1 weight is inversely proportional to the ratio of the first difference to the second difference.
- the decoding apparatus may derive the L0 weight and the L1 weight based on a ratio between the first difference and the second difference.
- the sum of the L0 weight and the L1 weight may be 1.
- the L0 weight is inversely proportional to the ratio 2: 1 between the first difference and the second difference. Is 1/3, and the L1 weight may be derived as 2/3.
- the first difference may be referred to as a first time distance
- the second difference may be referred to as a second time distance.
- the decoding apparatus may derive the L0 weight and the L1 weight based on the template of the current block and the L0 template and the L1 template corresponding to the template of the current block.
- the decoding apparatus may derive a template of the current block based on neighboring samples of the current block, and derive an L0 template corresponding to the template of the current block, wherein the L0 template is configured to obtain the L0 reference sample.
- a L1 template corresponding to the template of the current block may be derived, wherein the L1 template is based on the neighbor samples of the L1 reference block including the L1 reference sample. Can be derived.
- the template of the current block may include left peripheral samples and upper peripheral samples of the current block
- the L0 template may include left peripheral samples and upper peripheral samples of the L0 reference block
- the L1 template May include left peripheral samples and upper peripheral samples of the L1 reference block.
- the decoding apparatus may derive a plurality of weighted templates by weighting the L0 template and the L1 template based on a plurality of L0 weight candidate and L1 weight candidate combinations, and for each of the plurality of weighted templates.
- the cost with the template of the current block can be derived.
- the decoding apparatus may derive the L0 weight candidate and the L1 weight candidate for the lowest cost among the costs as the L0 weight and the L1 weight, respectively.
- the weighted template may be derived as the sum of the L0 template to which the L0 weight candidate is applied and the corresponding samples of the L1 template to which the L1 weight candidate is applied.
- the cost may also be expressed as sum of absolute differences (SAD) between corresponding samples between the template of the current block and the weighted template.
- the cost may be derived based on Equation 4 described above. That is, the L0 weight and the L1 weight may be derived based on Equation 4 described above.
- the weights may be derived using a combination of the above-described methods. Specifically, the method of using the motion information of the neighboring block with respect to the current block, that is, the weight of the merge candidate as it is as the weight of the current block and the method of deriving the weight based on the POC difference, Alternatively, the method of deriving the weight based on the POC difference and the method of deriving the weight based on the templates of the current block and the reference block may be selectively applied in some cases.
- the L0 weight and the L1 weight may be derived as 1/2, and when the first difference and the second difference are not the same, the current described above
- a method of deriving the L0 weight and the L1 weight of the current block may be applied based on the template of the block, the L0 template, and the L1 template.
- the L0 weight and the L1 weight of the merge candidate are the L0 weight and the weight of the current block, respectively.
- the L0 weight and the L1 weight of the current block may be derived as 1/2.
- the L0 weight and the L1 weight of the merge candidate are respectively the current block.
- the L0 weight and the L1 weight of may be applied to the L0 weight and the L1 weight of the current block based on the template of the current block, the L0 template, and the L1 template. The method for deriving the L0 weight and the L1 weight may be applied.
- the decoding apparatus generates a prediction sample of the current block by weighting the L0 reference sample and the L1 reference sample based on the L0 weight and the L1 weight (S970).
- the decoding apparatus may apply the L0 weight to the L0 reference sample and may apply the L1 weight to the L1 reference sample.
- the decoding apparatus may generate the prediction sample by adding the L0 reference sample to which the L0 weight is applied and the L1 reference sample to which the L1 weight is applied.
- the prediction sample may be generated based on Equation 2 described above.
- the decoding apparatus may directly use the prediction sample as a reconstruction sample according to a prediction mode, or generate a reconstruction sample by adding a residual sample to the prediction sample. If there is a residual sample for the current block, the decoding apparatus may receive information about the residual for the current block from the bitstream. The information about the residual may include transform coefficients regarding the residual sample. The decoding apparatus may derive the residual sample (or residual sample array) for the current block based on the residual information. The decoding apparatus may generate a reconstructed sample based on the prediction sample and the residual sample, and may derive a reconstructed block or a reconstructed picture based on the reconstructed sample. Thereafter, as described above, the decoding apparatus may apply an in-loop filtering procedure, such as a deblocking filtering and / or SAO procedure, to the reconstructed picture in order to improve subjective / objective picture quality as necessary.
- an in-loop filtering procedure such as a deblocking filtering and / or SAO procedure
- the inter prediction may be performed based on the weights of the L0 motion information and the L1 motion information of the current block, thereby improving the prediction accuracy of the current block.
- the data amount of additional information for the weights for the L0 motion information and the L1 motion information for the current block can be reduced, thereby improving the overall coding efficiency.
- the above-described method according to the present invention may be implemented in software, and the encoding device and / or the decoding device according to the present invention may perform image processing of, for example, a TV, a computer, a smartphone, a set-top box, a display device, and the like. It can be included in the device.
- the above-described method may be implemented as a module (process, function, etc.) for performing the above-described function.
- the module may be stored in memory and executed by a processor.
- the memory may be internal or external to the processor and may be coupled to the processor by various well known means.
- the processor may include application-specific integrated circuits (ASICs), other chipsets, logic circuits, and / or data processing devices.
- the memory may include read-only memory (ROM), random access memory (RAM), flash memory, memory card, storage medium and / or other storage device.
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명에 따른 디코딩 장치에 의하여 수행되는 영상 디코딩 방법은 디코딩 장치에 의하여 수행되는 영상 디코딩 방법에 있어서, 현재 블록에 대한 머지 인덱스를 파싱하는 단계, 주변 블록들을 기반으로 머지 후보 리스트를 구성하는 단계, 상기 머지 후보 리스트에 포함된 머지 후보들 중 상기 머지 인덱스가 가리키는 머지 후보를 선택하는 단계, 상기 선택된 머지 후보를 기반으로 상기 현재 블록의 L0 움직임 정보 및 L1 움직임 정보를 도출하는 단계, 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 단계, 및 상기 L0 가중치 및 상기 L1 가중치를 기반으로 L0 참조 샘플과 L1 참조 샘플을 가중합하여 상기 현재 블록의 예측 샘플을 생성하는 단계를 포함하는 것을 특징으로 한다.
Description
본 발명은 영상 코딩 기술에 관한 것으로서 보다 상세하게는 영상 코딩 시스템에서 영상 디코딩 방법 및 장치에 관한 것이다.
최근 HD(High Definition) 영상 및 UHD(Ultra High Definition) 영상과 같은 고해상도, 고품질의 영상에 대한 수요가 다양한 분야에서 증가하고 있다. 영상 데이터가 고해상도, 고품질이 될수록 기존의 영상 데이터에 비해 상대적으로 전송되는 정보량 또는 비트량이 증가하기 때문에 기존의 유무선 광대역 회선과 같은 매체를 이용하여 영상 데이터를 전송하거나 기존의 저장 매체를 이용해 영상 데이터를 저장하는 경우, 전송 비용과 저장 비용이 증가된다.
이에 따라, 고해상도, 고품질 영상의 정보를 효과적으로 전송하거나 저장하고, 재생하기 위해 고효율의 영상 압축 기술이 요구된다.
본 발명의 기술적 과제는 영상 코딩 효율을 높이는 방법 및 장치를 제공함에 있다.
본 발명의 다른 기술적 과제는 현재 블록의 L0 움직임 정보 및 L1 움직임 정보에 각 움직임 정보에 대한 가중치들을 적용하여 예측을 수행하는 인터 예측 방법 및 장치를 제공함에 있다.
본 발명의 또 다른 기술적 과제는 현재 블록의 L0 움직임 정보 및 L1 움직임 정보를 도출하는 방법 및 장치를 제공함에 있다.
본 발명의 또 다른 기술적 과제는 현재 블록의 L0 움직임 정보 및 L1 움직임 정보에 대한 가중치들을 도출하는 방법 및 장치를 제공함에 있다.
본 발명의 일 실시예에 따르면, 디코딩 장치에 의하여 수행되는 영상 디코딩 방법이 제공된다. 상기 방법은 현재 블록에 대한 머지 인덱스를 파싱하는 단계, 상기 현재 블록의 주변 블록들을 기반으로 머지 후보 리스트를 구성하는 단계, 상기 머지 후보 리스트에 포함된 머지 후보들 중 상기 머지 인덱스가 가리키는 머지 후보를 선택하는 단계, 상기 선택된 머지 후보를 기반으로 상기 현재 블록의 L0 움직임 정보 및 L1 움직임 정보를 도출하는 단계, 상기 L0 움직임 정보를 기반으로 L0 참조 샘플을 도출하는 단계, 상기 L1 움직임 정보를 기반으로 L1 참조 샘플을 도출하는 단계, 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 단계, 및 상기 L0 가중치 및 상기 L1 가중치를 기반으로 상기 L0 참조 샘플과 상기 L1 참조 샘플을 가중합(weighted sum)하여 상기 현재 블록의 예측 샘플을 생성하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 다른 일 실시예에 따르면, 영상 디코딩을 수행하는 디코딩 장치가 제공된다. 상기 디코딩 장치는 현재 블록에 대한 머지 인덱스를 파싱하는 엔트로피 디코딩부, 및 상기 현재 블록의 주변 블록들을 기반으로 머지 후보 리스트를 구성하고, 상기 머지 후보 리스트에 포함된 머지 후보들 중 상기 머지 인덱스가 가리키는 머지 후보를 선택하고, 상기 선택된 머지 후보를 기반으로 상기 현재 블록의 L0 움직임 정보 및 L1 움직임 정보를 도출하고, 상기 L0 움직임 정보를 기반으로 L0 참조 샘플을 도출하고, 상기 L1 움직임 정보를 기반으로 L1 참조 샘플을 도출하고, 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하고, 및 상기 L0 가중치 및 상기 L1 가중치를 기반으로 상기 L0 참조 샘플과 상기 L1 참조 샘플을 가중합(weighted sum)하여 상기 현재 블록의 예측 샘플을 생성하는 예측부를 포함하는 것을 특징으로 한다.
본 발명의 또 다른 일 실시예에 따르면, 인코딩 장치에 의하여 수행되는 비디오 인코딩 방법을 제공한다. 상기 방법은 현재 블록의 주변 블록들을 기반으로 머지 후보 리스트를 구성하는 단계, 상기 머지 후보 리스트에 포함된 머지 후보들 중 하나를 기반으로 상기 현재 블록의 L0 움직임 정보 및 L1 움직임 정보를 도출하는 단계, 상기 L0 움직임 정보를 기반으로 L0 참조 샘플을 도출하는 단계, 상기 L1 움직임 정보를 기반으로 L1 참조 샘플을 도출하는 단계, 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 단계, 상기 L0 가중치 및 상기 L1 가중치를 기반으로 상기 L0 참조 샘플과 상기 L1 참조 샘플을 가중합(weighted sum)하여 상기 현재 블록의 예측 샘플을 생성하는 단계 및 상기 현재 블록에 대한 예측 정보를 인코딩하여 출력하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 또 다른 일 실시예에 따르면, 비디오 인코딩 장치를 제공한다. 상기 인코딩 장치는 현재 블록의 주변 블록들을 기반으로 머지 후보 리스트를 구성하는 단계, 상기 머지 후보 리스트에 포함된 머지 후보들 중 하나를 기반으로 상기 현재 블록의 L0 움직임 정보 및 L1 움직임 정보를 도출하는 단계, 상기 L0 움직임 정보를 기반으로 L0 참조 샘플을 도출하는 단계, 상기 L1 움직임 정보를 기반으로 L1 참조 샘플을 도출하는 단계, 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 단계, 상기 L0 가중치 및 상기 L1 가중치를 기반으로 상기 L0 참조 샘플과 상기 L1 참조 샘플을 가중합(weighted sum)하여 상기 현재 블록의 예측 샘플을 생성하는 예측부 및, 상기 현재 블록에 대한 예측 정보를 인코딩하여 출력하는 엔트로피 인코딩부를 포함하는 것을 특징으로 한다.
본 발명에 따르면 현재 블록에 대한 L0 움직임 정보 및 L1 움직임 정보에 각 움직임 정보에 대한 가중치들을 적용하여 인터 예측을 수행할 수 있고, 이를 통하여 상기 현재 블록에 대한 예측 정확도를 향상시킬 수 있다.
본 발명에 따르면 현재 블록에 대한 L0 움직임 정보 및 L1 움직임 정보에 대한 가중치들을 위한 부가 정보의 데이터량을 줄일 수 있고, 이를 통하여 전반적인 코딩 효율을 향상시킬 수 있다.
도 1은 본 발명이 적용될 수 있는 비디오 인코딩 장치의 구성을 개략적으로 설명하는 도면이다.
도 2는 본 발명이 적용될 수 있는 비디오 디코딩 장치의 구성을 개략적으로 설명하는 도면이다.
도 3은 상기 현재 블록의 인터 예측을 위한 상기 L0 참조 픽처 및 상기 L1 참조 픽처와 MVL0 및 MVL1을 나타낸다.
도 4는 상기 현재 블록에 상기 머지 모드가 적용되는 경우의 움직임 정보 도출을 위한 머지 후보 리스트(merge candidate list)를 구성하는 일 예를 나타낸다.
도 5는 상기 머지 후보 리스트에 포함된 머지 후보로부터 상기 L0 가중치 및 상기 L1 가중치를 도출하는 일 예를 나타낸다.
도 6은 상기 현재 픽처와 상기 L0 참조 픽처와의 POC 차이 및 상기 현재 픽처와 상기 L1 참조 픽처와의 POC 차이의 비가 동일한 경우와 다른 경우를 예시적으로 나타낸다.
도 7은 상기 현재 블록의 템플릿과 참조 블록들의 템플릿들을 기반으로 상기 현재 블록의 L0 가중치 및 상기 L1 가중치를 도출하는 방법을 예시적으로 나타낸다.
도 8은 본 발명에 따른 인코딩 장치에 의한 비디오 인코딩 방법을 개략적으로 나타낸다.
도 9는 본 발명에 따른 디코딩 장치에 의한 비디오 디코딩 방법을 개략적으로 나타낸다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정 실시예에 한정하려고 하는 것이 아니다. 본 명세서에서 상용하는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 기술적 사상을 한정하려는 의도로 사용되는 것은 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서 "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부품 도는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
한편, 본 발명에서 설명되는 도면상의 각 구성들은 서로 다른 특징적인 기능들에 관한 설명의 편의를 위해 독립적으로 도시된 것으로서, 각 구성들이 서로 별개의 하드웨어나 별개의 소프트웨어로 구현된다는 것을 의미하지는 않는다. 예컨대, 각 구성 중 두 개 이상의 구성이 합쳐져 하나의 구성을 이룰 수도 있고, 하나의 구성이 복수의 구성으로 나뉘어질 수도 있다. 각 구성이 통합 및/또는 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성 요소에 대해서는 동일한 참조 부호를 사용하고 동일한 구성 요소에 대해서 중복된 설명은 생략한다.
본 명세서에서 픽처(picture)는 일반적으로 특정 시간대의 하나의 영상을 나타내는 단위를 의미하며, 슬라이스(slice)는 코딩에 있어서 픽처의 일부를 구성하는 단위이다. 하나의 픽처는 복수의 슬라이스로 구성될 수 있으며, 필요에 따라서 픽처 및 슬라이스는 서로 혼용되어 사용될 수 있다.
픽셀(pixel) 또는 펠(pel)은 하나의 픽처(또는 영상)을 구성하는 최소의 단위를 의미할 수 있다. 또한, 픽셀에 대응하는 용어로서 '샘플(sample)'이 사용될 수 있다. 샘플은 일반적으로 픽셀 또는 픽셀의 값을 나타낼 수 있으며, 휘도(luma) 성분의 픽셀/픽셀값만을 나타낼 수도 있고, 채도(chroma) 성분의 픽셀/픽셀 값만을 나타낼 수도 있다.
유닛(unit)은 영상 처리의 기본 단위를 나타낸다. 유닛은 픽처의 특정 영역 및 해당 영역에 관련된 정보 중 적어도 하나를 포함할 수 있다. 유닛은 경우에 따라서 블록(block) 또는 영역(area) 등의 용어와 혼용하여 사용될 수 있다. 일반적인 경우, MxN 블록은 M개의 열과 N개의 행으로 이루어진 샘플들 또는 변환 계수(transform coefficient)들의 집합을 나타낼 수 있다.
도 1은 본 발명이 적용될 수 있는 비디오 인코딩 장치의 구성을 개략적으로 설명하는 도면이다.
도 1을 참조하면, 비디오 인코딩 장치(100)는 픽처 분할부(105), 예측부(110), 감산부(115), 변환부(120), 양자화부(125), 재정렬부(130), 엔트로피 인코딩부(135), 레지듀얼 처리부(140), 가산부(150), 필터부(155) 및 메모리(160)을 포함할 수 있다. 레지듀얼 처리부(140)는 역양자화부(141) 및 역변환부(142)를 포함할 수 있다.
픽처 분할부(105)는 입력된 픽처를 적어도 하나의 처리 유닛(processing unit)으로 분할할 수 있다.
일 예로, 처리 유닛은 코딩 유닛(coding unit, CU)이라고 불릴 수 있다. 이 경우 코딩 유닛은 최대 코딩 유닛(largest coding unit, LCU)으로부터 QTBT (Quad-tree binary-tree) 구조에 따라 재귀적으로(recursively) 분할될 수 있다. 예를 들어, 하나의 코딩 유닛은 쿼드 트리 구조 및/또는 바이너리 트리 구조를 기반으로 하위(deeper) 뎁스의 복수의 코딩 유닛들로 분할될 수 있다. 이 경우 예를 들어 쿼드 트리 구조가 먼저 적용되고 바이너리 트리 구조가 나중에 적용될 수 있다. 또는 바이너리 트리 구조가 먼저 적용될 수도 있다. 더 이상 분할되지 않는 최종 코딩 유닛을 기반으로 본 발명에 따른 코딩 절차가 수행될 수 있다. 이 경우 영상 특성에 따른 코딩 효율 등을 기반으로, 최대 코딩 유닛이 바로 최종 코딩 유닛으로 사용될 수 있고, 또는 필요에 따라 코딩 유닛은 재귀적으로(recursively) 보다 하위 뎁스의 코딩 유닛들로 분할되어 최적의 사이즈의 코딩 유닛이 최종 코딩 유닛으로 사용될 수 있다. 여기서 코딩 절차라 함은 후술하는 예측, 변환, 및 복원 등의 절차를 포함할 수 있다.
다른 예로, 처리 유닛은 코딩 유닛(coding unit, CU) 예측 유닛(prediction unit, PU) 또는 변환 유닛(transform unit, TU)을 포함할 수도 있다. 코딩 유닛은 최대 코딩 유닛(largest coding unit, LCU)으로부터 쿼드 트리 구조를 따라서 하위(deeper) 뎁스의 코딩 유닛들로 분할(split)될 수 있다. 이 경우 영상 특성에 따른 코딩 효율 등을 기반으로, 최대 코딩 유닛이 바로 최종 코딩 유닛으로 사용될 수 있고, 또는 필요에 따라 코딩 유닛은 재귀적으로(recursively) 보다 하위 뎁스의 코딩 유닛들로 분할되어 최적의 사이즈의 코딩 유닛이 최종 코딩 유닛으로 사용될 수 있다. 최소 코딩 유닛(smallest coding unit, SCU)이 설정된 경우 코딩 유닛은 최소 코딩 유닛보다 더 작은 코딩 유닛으로 분할될 수 없다. 여기서 최종 코딩 유닛이라 함은 예측 유닛 또는 변환 유닛으로 파티셔닝 또는 분할되는 기반이 되는 코딩 유닛을 의미한다. 예측 유닛은 코딩 유닛으로부터 파티셔닝(partitioning)되는 유닛으로서, 샘플 예측의 유닛일 수 있다. 이 때, 예측 유닛은 서브 블록(sub block)으로 나뉠 수도 있다. 변환 유닛은 코딩 유닛으로부터 쿼드 트리 구조를 따라서 분할 될 수 있으며, 변환 계수를 유도하는 유닛 및/또는 변환 계수로부터 레지듀얼 신호(residual signal)를 유도하는 유닛일 수 있다. 이하, 코딩 유닛은 코딩 블록(coding block, CB), 예측 유닛은 예측 블록(prediction block, PB), 변환 유닛은 변환 블록(transform block, TB) 으로 불릴 수 있다. 예측 블록 또는 예측 유닛은 픽처 내에서 블록 형태의 특정 영역을 의미할 수 있고, 예측 샘플의 어레이(array)를 포함할 수 있다. 또한, 변환 블록 또는 변환 유닛은 픽처 내에서 블록 형태의 특정 영역을 의미할 수 있고, 변환 계수 또는 레지듀얼 샘플의 어레이를 포함할 수 있다.
예측부(110)는 처리 대상 블록(이하, 현재 블록이라 함)에 대한 예측을 수행하고, 상기 현재 블록에 대한 예측 샘플들을 포함하는 예측된 블록(predicted block)을 생성할 수 있다. 예측부(110)에서 수행되는 예측의 단위는 코딩 블록일 수 있고, 변환 블록일 수도 있고, 예측 블록일 수도 있다.
예측부(110)는 현재 블록에 인트라 예측이 적용되는지 인터 예측이 적용되는지를 결정할 수 있다. 일 예로, 예측부(110)는 CU 단위로 인트라 예측 또는 인터 예측이 적용되는지를 결정할 수 있다.
인트라 예측의 경우에, 예측부(110)는 현재 블록이 속하는 픽처(이하, 현재 픽처) 내의 현재 블록 외부의 참조 샘플을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이 때, 예측부(110)는 (i) 현재 블록의 주변(neighboring) 참조 샘플들의 평균(average) 혹은 인터폴레이션(interpolation)을 기반으로 예측 샘플을 유도할 수 있고, (ii) 현재 블록의 주변 참조 샘플들 중 예측 샘플에 대하여 특정 (예측) 방향에 존재하는 참조 샘플을 기반으로 상기 예측 샘플을 유도할 수도 있다. (i)의 경우는 비방향성 모드 또는 비각도 모드, (ii)의 경우는 방향성(directional) 모드 또는 각도(angular) 모드라고 불릴 수 있다. 인트라 예측에서 예측 모드는 예를 들어 33개의 방향성 예측 모드와 적어도 2개 이상의 비방향성 모드를 가질 수 있다. 비방향성 모드는 DC 예측 모드 및 플래너 모드(Planar 모드)를 포함할 수 있다. 예측부(110)는 주변 블록에 적용된 예측 모드를 이용하여, 현재 블록에 적용되는 예측 모드를 결정할 수도 있다.
인터 예측의 경우에, 예측부(110)는 참조 픽처 상에서 움직임 벡터에 의해 특정되는 샘플을 기반으로, 현재 블록에 대한 예측 샘플을 유도할 수 있다. 예측부(110)는 스킵(skip) 모드, 머지(merge) 모드, 및 MVP(motion vector prediction) 모드 중 어느 하나를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 스킵 모드와 머지 모드의 경우에, 예측부(110)는 주변 블록의 움직임 정보를 현재 블록의 움직임 정보로 이용할 수 있다. 스킵 모드의 경우, 머지 모드와 달리 예측 샘플과 원본 샘플 사이의 차(레지듀얼)가 전송되지 않는다. MVP 모드의 경우, 주변 블록의 움직임 벡터를 움직임 벡터 예측자(Motion Vector Predictor)로 이용하여 현재 블록의 움직임 벡터 예측자로 이용하여 현재 블록의 움직임 벡터를 유도할 수 있다.
인터 예측의 경우에, 주변 블록은 현재 픽처 내에 존재하는 공간적 주변 블록(spatial neighboring block)과 참조 픽처(reference picture)에 존재하는 시간적 주변 블록(temporal neighboring block)을 포함할 수 있다. 상기 시간적 주변 블록을 포함하는 참조 픽처는 동일 위치 픽처(collocated picture, colPic)라고 불릴 수도 있다. 움직임 정보(motion information)는 움직임 벡터와 참조 픽처 인덱스를 포함할 수 있다. 예측 모드 정보와 움직임 정보 등의 정보는 (엔트로피) 인코딩되어 비트스트림 형태로 출력될 수 있다.
스킵 모드와 머지 모드에서 시간적 주변 블록의 움직임 정보가 이용되는 경우에, 참조 픽처 리스트(reference picture list) 상의 최상위 픽처가 참조 픽처로서 이용될 수도 있다. 참조 픽처 리스트(Picture Order Count)에 포함되는 참조 픽처들은 현재 픽처와 해당 참조 픽처 간의 POC(Picture order count) 차이 기반으로 정렬될 수 있다. POC는 픽처의 디스플레이 순서에 대응하며, 코딩 순서와 구분될 수 있다.
감산부(115)는 원본 샘플과 예측 샘플 간의 차이인 레지듀얼 샘플을 생성한다. 스킵 모드가 적용되는 경우에는, 상술한 바와 같이 레지듀얼 샘플을 생성하지 않을 수 있다.
변환부(120)는 변환 블록 단위로 레지듀얼 샘플을 변환하여 변환 계수(transform coefficient)를 생성한다. 변환부(120)는 해당 변환 블록의 사이즈와, 해당 변환 블록과 공간적으로 겹치는 코딩 블록 또는 예측 블록에 적용된 예측 모드에 따라서 변환을 수행할 수 있다. 예컨대, 상기 변환 블록과 겹치는 상기 코딩 블록 또는 상기 예측 블록에 인트라 예측이 적용되었고, 상기 변환 블록이 4×4의 레지듀얼 어레이(array)라면, 레지듀얼 샘플은 DST(Discrete Sine Transform)를 이용하여 변환되고, 그 외의 경우라면 레지듀얼 샘플은 DCT(Discrete Cosine Transform)를 이용하여 변환할 수 있다.
양자화부(125)는 변환 계수들을 양자화하여, 양자화된 변환 계수를 생성할 수 있다.
재정렬부(130)는 양자화된 변환 계수를 재정렬한다. 재정렬부(130)는 계수들 스캐닝(scanning) 방법을 통해 블록 형태의 양자화된 변환 계수들을 1차원 벡터 형태로 재정렬할 수 있다. 여기서 재정렬부(130)는 별도의 구성으로 설명하였으나, 재정렬부(130)는 양자화부(125)의 일부일 수 있다.
엔트로피 인코딩부(135)는 양자화된 변환 계수들에 대한 엔트로피 인코딩을 수행할 수 있다. 엔트로피 인코딩은 예를 들어 지수 골롬(exponential Golomb), CAVLC(context-adaptive variable length coding), CABAC(context-adaptive binary arithmetic coding) 등과 같은 인코딩 방법을 포함할 수 있다. 엔트로피 인코딩부(135)는 양자화된 변환 계수 외 비디오 복원에 필요한 정보들(예컨대 신택스 요소(syntax element)의 값 등)을 함께 또는 별도로 인코딩할 수도 있다. 엔트로피 인코딩된 정보들은 비트스트림 형태로 NAL(network abstraction layer) 유닛 단위로 전송 또는 저장될 수 있다.
역양자화부(141)는 양자화부(125)에서 양자화된 값(양자화된 변환 계수)들을 역양자화하고, 역변환부(142)는 역양자화부(141)에서 역양자화된 값들을 역변환하여 레지듀얼 샘플을 생성한다.
가산부(150)는 레지듀얼 샘플과 예측 샘플을 합쳐서 픽처를 복원한다. 레지듀얼 샘플과 예측 샘플은 블록 단위로 더해져서 복원 블록이 생성될 수 있다. 여기서 가산부(150)는 별도의 구성으로 설명하였으나, 가산부(150)는 예측부(110)의 일부일 수 있다. 한편, 가산부(150)는 복원부 또는 복원 블록 생성부로 불릴 수도 있다.
복원된 픽처(reconstructed picture)에 대하여 필터부(155)는 디블록킹 필터 및/또는 샘플 적응적 오프셋(sample adaptive offset)을 적용할 수 있다. 디블록킹 필터링 및/또는 샘플 적응적 오프셋을 통해, 복원 픽처 내 블록 경계의 아티팩트나 양자화 과정에서의 왜곡이 보정될 수 있다. 샘플 적응적 오프셋은 샘플 단위로 적용될 수 있으며, 디블록킹 필터링의 과정이 완료된 후 적용될 수 있다. 필터부(155)는 ALF(Adaptive Loop Filter)를 복원된 픽처에 적용할 수도 있다. ALF는 디블록킹 필터 및/또는 샘플 적응적 오프셋이 적용된 후의 복원된 픽처에 대하여 적용될 수 있다.
메모리(160)는 복원 픽처(디코딩된 픽처) 또는 인코딩/디코딩에 필요한 정보를 저장할 수 있다. 여기서 복원 픽처는 상기 필터부(155)에 의하여 필터링 절차가 완료된 복원 픽처일 수 있다. 상기 저장된 복원 픽처는 다른 픽처의 (인터) 예측을 위한 참조 픽처로 활용될 수 있다. 예컨대, 메모리(160)는 인터 예측에 사용되는 (참조) 픽처들을 저장할 수 있다. 이 때, 인터 예측에 사용되는 픽처들은 참조 픽처 세트(reference picture set) 혹은 참조 픽처 리스트(reference picture list)에 의해 지정될 수 있다.
도 2는 본 발명이 적용될 수 있는 비디오 디코딩 장치의 구성을 개략적으로 설명하는 도면이다.
도 2를 참조하면, 비디오 디코딩 장치(200)는 엔트로피 디코딩부(210), 레지듀얼 처리부(220), 예측부(230), 가산부(240), 필터부(250) 및 메모리(260)을 포함할 수 있다. 여기서 레지듀얼 처리부(220)은 재정렬부(221), 역양자화부(222), 역변환부(223)을 포함할 수 있다.
비디오 정보를 포함하는 비트스트림이 입력되면, 비디오 디코딩 장치는(200)는 비디오 인코딩 장치에서 비디오 정보가 처리된 프로세스에 대응하여 비디오를 복원할 수 있다.
예컨대, 비디오 디코딩 장치(200)는 비디오 인코딩 장치에서 적용된 처리 유닛을 이용하여 비디오 디코딩을 수행할 수 있다. 따라서 비디오 디코딩의 처리 유닛 블록은 일 예로 코딩 유닛일 수 있고, 다른 예로 코딩 유닛, 예측 유닛 또는 변환 유닛일 수 있다. 코딩 유닛은 최대 코딩 유닛으로부터 쿼드 트리 구조 및/또는 바이너리 트리 구조를 따라서 분할될 수 있다.
예측 유닛 및 변환 유닛이 경우에 따라 더 사용될 수 있으며, 이 경우 예측 블록은 코딩 유닛으로부터 도출 또는 파티셔닝되는 블록으로서, 샘플 예측의 유닛일 수 있다. 이 때, 예측 유닛은 서브 블록으로 나뉠 수도 있다. 변환 유닛은 코딩 유닛으로부터 쿼드 트리 구조를 따라서 분할 될 수 있으며, 변환 계수를 유도하는 유닛 또는 변환 계수로부터 레지듀얼 신호를 유도하는 유닛일 수 있다.
엔트로피 디코딩부(210)는 비트스트림을 파싱하여 비디오 복원 또는 픽처 복원에 필요한 정보를 출력할 수 있다. 예컨대, 엔트로피 디코딩부(210)는 지수 골롬 부호화, CAVLC 또는 CABAC 등의 코딩 방법을 기초로 비트스트림 내 정보를 디코딩하고, 비디오 복원에 필요한 신택스 엘리먼트의 값, 레지듀얼에 관한 변환 계수의 양자화된 값 들을 출력할 수 있다.
보다 상세하게, CABAC 엔트로피 디코딩 방법은, 비트스트림에서 각 구문 요소에 해당하는 빈을 수신하고, 디코딩 대상 구문 요소 정보와 주변 및 디코딩 대상 블록의 디코딩 정보 혹은 이전 단계에서 디코딩된 심볼/빈의 정보를 이용하여 문맥(context) 모델을 결정하고, 결정된 문맥 모델에 따라 빈(bin)의 발생 확률을 예측하여 빈의 산술 디코딩(arithmetic decoding)를 수행하여 각 구문 요소의 값에 해당하는 심볼을 생성할 수 있다. 이때, CABAC 엔트로피 디코딩 방법은 문맥 모델 결정 후 다음 심볼/빈의 문맥 모델을 위해 디코딩된 심볼/빈의 정보를 이용하여 문맥 모델을 업데이트할 수 있다.
엔트로피 디코딩부(210)에서 디코딩된 정보 중 예측에 관한 정보는 예측부(230)로 제공되고, 엔트로피 디코딩부(210)에서 엔트로피 디코딩이 수행된 레지듀얼 값, 즉 양자화된 변환 계수는 재정렬부(221)로 입력될 수 있다.
재정렬부(221)는 양자화되어 있는 변환 계수들을 2차원의 블록 형태로 재정렬할 수 있다. 재정렬부(221)는 인코딩 장치에서 수행된 계수 스캐닝에 대응하여 재정렬을 수행할 수 있다. 여기서 재정렬부(221)는 별도의 구성으로 설명하였으나, 재정렬부(221)는 역양자화부(222)의 일부일 수 있다.
역양자화부(222)는 양자화되어 있는 변환 계수들을 (역)양자화 파라미터를 기반으로 역양자화하여 변환 계수를 출력할 수 있다. 이 때, 양자화 파라미터를 유도하기 위한 정보는 인코딩 장치로부터 시그널링될 수 있다.
역변환부(223)는 변환 계수들을 역변환하여 레지듀얼 샘플들을 유도할 수 있다.
예측부(230)는 현재 블록에 대한 예측을 수행하고, 상기 현재 블록에 대한 예측 샘플들을 포함하는 예측된 블록(predicted block)을 생성할 수 있다. 예측부(230)에서 수행되는 예측의 단위는 코딩 블록일 수도 있고, 변환 블록일 수도 있고, 예측 블록일 수도 있다.
예측부(230)는 상기 예측에 관한 정보를 기반으로 인트라 예측을 적용할 것인지 인터 예측을 적용할 것인지를 결정할 수 있다. 이 때, 인트라 예측과 인터 예측 중 어느 것을 적용할 것인지를 결정하는 단위와 예측 샘플을 생성하는 단위는 상이할 수 있다. 아울러, 인터 예측과 인트라 예측에 있어서 예측 샘플을 생성하는 단위 또한 상이할 수 있다. 예를 들어, 인터 예측과 인트라 예측 중 어느 것을 적용할 것인지는 CU 단위로 결정할 수 있다. 또한 예를 들어, 인터 예측에 있어서 PU 단위로 예측 모드를 결정하고 예측 샘플을 생성할 수 있고, 인트라 예측에 있어서 PU 단위로 예측 모드를 결정하고 TU 단위로 예측 샘플을 생성할 수도 있다.
인트라 예측의 경우에, 예측부(230)는 현재 픽처 내의 주변 참조 샘플을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 예측부(230)는 현재 블록의 주변 참조 샘플을 기반으로 방향성 모드 또는 비방향성 모드를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이 때, 주변 블록의 인트라 예측 모드를 이용하여 현재 블록에 적용할 예측 모드가 결정될 수도 있다.
인터 예측의 경우에, 예측부(230)는 참조 픽처 상에서 움직임 벡터에 의해 참조 픽처 상에서 특정되는 샘플을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 예측부(230)는 스킵(skip) 모드, 머지(merge) 모드 및 MVP 모드 중 어느 하나를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이때, 비디오 인코딩 장치에서 제공된 현재 블록의 인터 예측에 필요한 움직임 정보, 예컨대 움직임 벡터, 참조 픽처 인덱스 등에 관한 정보는 상기 예측에 관한 정보를 기반으로 획득 또는 유도될 수 있다
스킵 모드와 머지 모드의 경우에, 주변 블록의 움직임 정보가 현재 블록의 움직임 정보로 이용될 수 있다. 이 때, 주변 블록은 공간적 주변 블록과 시간적 주변 블록을 포함할 수 있다.
예측부(230)는 가용한 주변 블록의 움직임 정보로 머지 후보 리스트를 구성하고, 머지 인덱스가 머지 후보 리스트 상에서 지시하는 정보를 현재 블록의 움직임 벡터로 사용할 수 있다. 머지 인덱스는 인코딩 장치로부터 시그널링될 수 있다. 움직임 정보는 움직임 벡터와 참조 픽처를 포함할 수 있다. 스킵 모드와 머지 모드에서 시간적 주변 블록의 움직임 정보가 이용되는 경우에, 참조 픽처 리스트 상의 최상위 픽처가 참조 픽처로서 이용될 수 있다.
스킵 모드의 경우, 머지 모드와 달리 예측 샘플과 원본 샘플 사이의 차이(레지듀얼)이 전송되지 않는다.
MVP 모드의 경우, 주변 블록의 움직임 벡터를 움직임 벡터 예측자(motion vector predictor)로 이용하여 현재 블록의 움직임 벡터가 유도될 수 있다. 이 때, 주변 블록은 공간적 주변 블록과 시간적 주변 블록을 포함할 수 있다.
일 예로, 머지 모드가 적용되는 경우, 복원된 공간적 주변 블록의 움직임 벡터 및/또는 시간적 주변 블록인 Col 블록에 대응하는 움직임 벡터를 이용하여, 머지 후보 리스트가 생성될 수 있다. 머지 모드에서는 머지 후보 리스트에서 선택된 후보 블록의 움직임 벡터가 현재 블록의 움직임 벡터로 사용된다. 상기 예측에 관한 정보는 상기 머지 후보 리스트에 포함된 후보 블록들 중에서 선택된 최적의 움직임 벡터를 갖는 후보 블록을 지시하는 머지 인덱스를 포함할 수 있다. 이 때, 예측부(230)는 상기 머지 인덱스를 이용하여, 현재 블록의 움직임 벡터를 도출할 수 있다.
다른 예로, MVP(Motion Vector Prediction) 모드가 적용되는 경우, 복원된 공간적 주변 블록의 움직임 벡터 및/또는 시간적 주변 블록인 Col 블록에 대응하는 움직임 벡터를 이용하여, 움직임 벡터 예측자 후보 리스트가 생성될 수 있다. 즉, 복원된 공간적 주변 블록의 움직임 벡터 및/또는 시간적 주변 블록인 Col 블록에 대응하는 움직임 벡터는 움직임 벡터 후보로 사용될 수 있다. 상기 예측에 관한 정보는 상기 리스트에 포함된 움직임 벡터 후보 중에서 선택된 최적의 움직임 벡터를 지시하는 예측 움직임 벡터 인덱스를 포함할 수 있다. 이 때, 예측부(230)는 상기 움직임 벡터 인덱스를 이용하여, 움직임 벡터 후보 리스트에 포함된 움직임 벡터 후보 중에서, 현재 블록의 예측 움직임 벡터를 선택할 수 있다. 인코딩 장치의 예측부는 현재 블록의 움직임 벡터와 움직임 벡터 예측자 간의 움직임 벡터 차분(MVD)을 구할 수 있고, 이를 인코딩하여 비트스트림 형태로 출력할 수 있다. 즉, MVD는 현재 블록의 움직임 벡터에서 상기 움직임 벡터 예측자를 뺀 값으로 구해질 수 있다. 이 때, 예측부(230)는 상기 예측에 관한 정보에 포함된 움직임 벡터 차분을 획득하고, 상기 움직임 벡터 차분과 상기 움직임 벡터 예측자의 가산을 통해 현재 블록의 상기 움직임 벡터를 도출할 수 있다. 예측부는 또한 참조 픽처를 지시하는 참조 픽처 인덱스 등을 상기 예측에 관한 정보로부터 획득 또는 유도할 수 있다.
가산부(240)는 레지듀얼 샘플과 예측 샘플을 더하여 현재 블록 혹은 현재 픽처를 복원할 수 있다. 가산부(240)는 레지듀얼 샘플과 예측 샘플을 블록 단위로 더하여 현재 픽처를 복원할 수도 있다. 스킵 모드가 적용된 경우에는 레지듀얼이 전송되지 않으므로, 예측 샘플이 복원 샘플이 될 수 있다. 여기서는 가산부(240)를 별도의 구성으로 설명하였으나, 가산부(240)는 예측부(230)의 일부일 수도 있다. 한편, 가산부(240)는 복원부 또는 복원 블록 생성부로 불릴 수도 있다.
필터부(250)는 복원된 픽처에 디블록킹 필터링 샘플 적응적 오프셋, 및/또는 ALF 등을 적용할 수 있다. 이 때, 샘플 적응적 오프셋은 샘플 단위로 적용될 수 있으며, 디블록킹 필터링 이후 적용될 수도 있다. ALF는 디블록킹 필터링 및/또는 샘플 적응적 오프셋 이후 적용될 수도 있다.
메모리(260)는 복원 픽처(디코딩된 픽처) 또는 디코딩에 필요한 정보를 저장할 수 있다. 여기서 복원 픽처는 상기 필터부(250)에 의하여 필터링 절차가 완료된 복원 픽처일 수 있다. 예컨대, 메모리(260)는 인터 예측에 사용되는 픽처들을 저장할 수 있다. 이 때, 인터 예측에 사용되는 픽처들은 참조 픽처 세트 혹은 참조 픽처 리스트에 의해 지정될 수도 있다. 복원된 픽처는 다른 픽처에 대한 참조 픽처로서 이용될 수 있다. 또한, 메모리(260)는 복원된 픽처를 출력 순서에 따라서 출력할 수도 있다.
상술한 내용과 같이 현재 블록에 인터 예측이 수행되는 경우, 상기 인터 예측을 위한 움직임 정보가 도출될 수 있다. 상기 움직임 정보는 L0 방향에 대한 L0 움직임 정보 및/또는 L1 방향에 대한 L1 움직임 정보를 포함할 수 있다. 여기서, 상기 L0 움직임 정보는 상기 현재 블록에 대한 참조 픽처 리스트 L0(List 0, L0)에 포함된 L0 참조 픽처를 가리키는 L0 참조 픽처 인덱스 및 움직임 벡터 L0(Motion Vector L0, MVL0)를 포함할 수 있고, 상기 L1 움직임 정보는 상기 현재 블록에 대한 참조 픽처 리스트 L0(List 1, L1)에 포함된 L1 참조 픽처를 가리키는 L1 참조 픽처 인덱스 및 MVL1를 포함할 수 있다. 여기서, 상기 L0 방향은 과거 방향 또는 순방향이라고 불릴 수도 있다. 또한, 상기 L1 방향은 미래 방향 또는 역방향이라고 불릴 수도 있다. 또한, 상기 참조 픽처 리스트 L0는 상기 현재 픽처보다 출력 순서상 이전 픽처들을 포함할 수 있고, 상기 참조 픽처 리스트 L1는 상기 현재 픽처보다 출력 순서상 이후 픽처들을 포함할 수 있다.
현재 블록에 대한 예측을 수행함에 있어, L0 움직임 정보를 기반으로 인터 예측을 수행하는 경우 LO 예측이라고 불릴 수 있고, L1 움직임 정보를 기반으로 인터 예측을 수행하는 경우 L1 예측이라고 불릴 수 있으며, 상기 L0 움직임 정보 및 L1 움직임 정보를 기반으로 인터 예측을 수행하는 경우 쌍예측(bi-prediction)이라고 불릴 수 있다. 본 발명에서는 상기 현재 블록에 인터 예측이 수행되는 경우, 특히 상기 현재 블록에 쌍예측이 수행되는 경우, 상기 L0 움직임 정보를 기반으로 도출된 L0 참조 샘플과, 상기 L1 움직임 정보를 기반으로 도출된 L1 참조 샘플과의 가중합(weighted sum)을 통하여 상기 현재 블록의 예측 샘플을 도출하는 방법을 제안한다. 상기 가중합을 통한 예측 샘플을 도출하는 방법은 상기 쌍예측의 예측 정확도를 향상시킬 수 있고, 이를 통하여 전체적인 코딩 효율을 향상시킬 수 있다.
도 3은 상기 현재 블록의 인터 예측을 위한 상기 L0 참조 픽처 및 상기 L1 참조 픽처와 MVL0 및 MVL1을 나타낸다. 상기 현재 블록에 인터 예측이 수행되는 경우, 특히 상기 현재 블록에 쌍예측이 수행되는 경우, 디코딩 장치는 상기 L0 움직임 정보를 기반으로 L0 참조 블록을 도출할 수 있고, 상기 L1 움직임 정보를 기반으로 L1 참조 블록을 도출할 수 있다. 이 경우, 디코딩 장치는 상기 L0 참조 블록의 L0 참조 샘플과 상기 L0 참조 샘플에 대응하는 상기 L1 참조 블록의 L1 참조 샘플을 동일한 비중으로 더하여 상기 현재 블록의 예측 샘플을 생성할 수 있다. 즉, 디코딩 장치는 상기 L0 움직임 정보를 기반으로 상기 L0 참조 샘플을 도출할 수 있고, 상기 L1 움직임 정보를 기반으로 상기 L1 참조 샘플을 도출할 수 있고, 상기 L0 참조 샘플의 샘플값 및 상기 L1 참조 샘플의 샘플값을 더한 값을 1/2하여 상기 예측 샘플을 생성할 수 있다. 이는 상기 L0 참조 샘플 및 상기 L1 참조 샘플 각각의 가중치가 1/2인 경우에 대응될 수 있다. 이 경우, 상기 예측 샘플을 포함한 예측 블록(predicted block)은 다음과 같은 수학식을 기반으로 도출될 수 있다.
여기서, i, j는 블록 내 샘플의 위치 (i, j)를 나타내고, Blockpred는 상기 현재 블록의 예측 블록, Blockcor0는 상기 MVL0가 가리키는 상기 L0 참조 블록, Blockcor1는 상기 MVL1가 가리키는 상기 L1 참조 블록을 나타낸다.
한편, 디코딩 장치는 L0 방향 및 L1 방향 각각에 대한 가중치를 고려하여 상기 예측 샘플을 생성할 수 있다. 상기 L0 방향 및 상기 L1 방향 각각에 대한 가중치를 고려하여 상기 예측 샘플을 생성하는 방법은 수학식 1에 나타난 쌍예측 방법에 비하여 예측 정확도를 향상시킬 수 있다. 구체적으로, 디코딩 장치는 상기 L0 움직임 정보를 기반으로 상기 L0 참조 샘플을 도출할 수 있고, 상기 L1 움직임 정보를 기반으로 상기 L1 참조 샘플을 도출할 수 있고, 상기 L0 참조 샘플의 샘플값에 L0 가중치를 곱한 값 및 상기 L1 참조 샘플의 샘플값에 L1 가중치를 곱한 값을 더하여 상기 예측 샘플을 생성할 수 있다. 상기 예측 샘플을 포함하는 예측 블록(predicted block)은 다음과 같은 수학식을 기반으로 도출될 수 있다.
여기서, i, j는 블록 내 샘플의 위치 (i, j)를 나타내고, Blockpred는 상기 현재 블록의 예측 블록, Blockcor0는 상기 MVL0가 가리키는 L0 참조 블록, Blockcor1는 상기 MVL1가 가리키는 L1 참조 블록, w는 상기 L0 가중치를 나타낸다. 이 경우, 상기 L1 가중치는 1에서 상기 제1 가중치를 뺀 값, 즉, (1-w)로 나타낼 수 있다.
상기 L0 가중치 및 상기 L1 가중치는 상기 현재 블록에 AMVP 모드와 같이 움직임 정보가 직접 부호화되어 시그널링되는 경우, 직접 부호화된 상기 L0 가중치 및 상기 L1 가중치들에 대한 정보를 통하여 획득될 수 있고, 상기 현재 블록에 머지 모드(merge mode)와 같이 움직임 정보가 주변 블록의 움직임 정보를 인덱스화하여 시그널링되는 경우, 다음과 같은 다양한 방법을 통하여 획득될 수 있다.
도 4는 상기 현재 블록에 상기 머지 모드가 적용되는 경우의 움직임 정보 도출을 위한 머지 후보 리스트(merge candidate list)를 구성하는 일 예를 나타낸다. 도 4를 참조하면 디코딩 장치는 상기 현재 블록의 주변 블록들을 기반으로 현재 블록의 움직임 정보 도출을 위한 머지 후보 리스트를 도출할 수 있다. 상기 머지 후보 리스트는 상기 현재 블록의 공간적으로 인접한 주변 블록의 움직임 정보를 머지 후보(merge candidate)로 포함하여 구성될 수 있다. 공간적으로 인접한 상기 주변 블록은 공간적 주변 블록이라고 불릴 수 있다. 상기 공간적 주변 블록은 상기 현재 블록의 좌하측 주변 블록 A0, 좌측 주변 블록 A1, 우상측 주변 블록 B0, 상측 주변 블록 B1 및/또는 좌상측 주변 블록 B2를 포함할 수 있다. 또한, 상기 머지 후보 리스트는 시간적으로 인접한 주변 블록, 예를 들어 도 4에 도시된 시간적 주변 블록 T0 또는 시간적 주변 블록 T1의 움직임 정보를 머지 후보(merge candidate)로 포함하여 구성될 수 있다. 여기서, 상기 시간적 주변 블록을 포함하는 참조 픽처는 동일 위치 픽처(collocated picture, colPic)라고 불릴 수도 있고, 상기 시간적 주변 블록은 동일 위치 픽처(collocated picture) 내 동일 위치 블록의 우하단 주변 블록 T0, 또는 센터 우하단 블록 T1이 포함될 수 있다. 또한, 상기 머지 후보 리스트는 상기 주변 블록들의 움직임 정보들을 조합하여 도출된 조합된 쌍예측 후보(combined bi-predicted candidate) 또는 영 벡터(zero vector)를 머지 후보로 포함하여 구성될 수 있다. 상기 현재 블록의 공간적 주변 블록의 움직임 정보, 시간적 주변 블록의 움직임 정보 및/또는 주변 블록들의 움직임 정보들 조합하여 도출된 조합된 쌍예측 후보 등을 기반으로 상기 머지 후보 리스트가 구성될 수 있고, 상기 머지 후보 리스트에 포함된 머지 후보들 중 하나가 선택되어 상기 현재 블록의 움직임 정보로 사용될 수 있다.
한편, 도 4에 도시된 상기 현재 블록의 주변 블록들의 움직임 정보들, 즉, 상기 머지 후보 리스트의 머지 후보로 포함된 A0, A1, B0, B1, B2, T0, T1 및 Combined candidate가 AMVP 모드를 기반으로 부호화된 움직임 정보인 경우, 상기 움직임 정보들은 각 움직임 정보에 대한 L0 가중치 및 L1 가중치를 포함하고 있을 수 있다. 상기 L0 가중치 및 상기 L1 가중치가 블록 단위로 저장되어 있을 경우, 각 움직임 정보에 대한 L0 가중치 및 L1 가중치를 기반으로 현재 블록의 L0 가중치 및 L1 가중치가 도출될 수 있다.
도 5는 상기 머지 후보 리스트에 포함된 머지 후보로부터 상기 L0 가중치 및 상기 L1 가중치를 도출하는 일 예를 나타낸다. 상기 머지 후보 리스트에 포함된 머지 후보들 중 하나가 상기 현재 블록의 움직임 정보를 위하여 선택된 경우, 선택된 머지 후보에 연관된 주변 블록의 예측에 사용된 L0 가중치 및 L1 가중치를 각각 상기 현재 블록의 L0 가중치 및 L1 가중치로 도출될 수 있다. 예를 들어, 상기 머지 후보 리스트에 포함된 머지 후보들 중 상기 A1이 선택된 경우, 상기 A1 위치에 존재 하는 주변 블록, 즉, 상기 현재 블록의 좌측 주변 블록의 예측에 사용된 L0 가중치 및 L1 가중치가 각각 상기 현재 블록의 L0 가중치 및 L1 가중치로 도출될 수 있다. 구체적으로, 상기 좌측 주변 블록의 예측에 사용된 L0 가중치의 값이 3/8, L1 가중치의 값이 5/8인 경우, 상기 현재 블록의 L0 가중치의 값은 3/8, L1 가중치의 값은 5/8로 도출될 수 있다.
도 5의 (b)는 상기 현재 블록에 머지 모드가 적용되는 경우, 가중치들을 이용하여 상기 현재 블록을 디코딩하는 과정을 나타낼 수 있다. 디코딩 장치는 상기 현재 블록에 대한 머지 인덱스를 파싱할 수 있다(S500). 상기 머지 인덱스는 비트스트림을 통하여 시그널링될 수 있다. 디코딩 장치는 머지 후보 리스트를 구성할 수 있다(S510). 디코딩 장치는 상술한 내용과 같이 상기 현재 블록의 주변 블록들의 움직임 정보들을 머지 후보들로 포함하는 상기 머지 후보 리스트를 도출할 수 있다. 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들 중 선택된 머지 후보, 즉, 선택된 움직임 정보의 가중치들을 상기 현재 블록의 가중치들로 차용할 수 있다(S520). 상기 선택된 머지 후보는 상기 머지 인덱스가 가리키는 머지 후보를 나타낼 수 있다. 디코딩 장치는 상기 선택된 머지 후보, 즉, 선택된 주변 블록의 움직임 정보의 가중치들을 상기 현재 블록의 가중치들로 그대로 적용할 수 있다.
또한, 다른 예로, 디코딩 장치는 상기 머지 후보들, 즉, 상기 머지 후보들의 가중치들 중 가장 많이 각 머지 후보의 블록의 예측에 선택된 값을 상기 현재 블록의 가중치로 도출할 수 있다. 다시 말해, 디코딩 장치는 상기 머지 후보들의 가중치들의 값들 중 최빈값을 상기 현재 블록의 가중치로 도출할 수 있다. 구체적으로, 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 값들 중 최빈값을 도출할 수 있고, 상기 머지 후보들의 상기 L0 가중치들의 값들 중 상기 최빈값을 상기 현재 블록의 상기 L0 가중치로 도출할 수 있다. 또한, 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L1 가중치들의 값들 중 최빈값을 도출할 수 있고, 상기 머지 후보들의 상기 L1 가중치들 중 상기 최빈값을 상기 현재 블록의 상기 L1 가중치로 도출할 수 있다
또한, 다른 예로, 디코딩 장치는 상기 현재 블록의 주변 블록들의 움직임 정보들(머지 후보들)의 가중치 값의 평균값을 상기 현재 블록의 가중치로 적용할 수 있다. 구체적으로, 예를 들어, 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 평균값을 도출할 수 있고, 상기 머지 후보들의 상기 L0 가중치들의 상기 평균값을 상기 현재 블록의 상기 L0 가중치로 도출할 수 있다. 또한, 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L1 가중치들의 평균값을 도출할 수 있고, 상기 머지 후보들의 상기 L1 가중치들의 상기 평균값을 상기 현재 블록의 상기 L1 가중치로 도출할 수 있다.
또한, 다른 예로, 디코딩 장치는 상기 현재 블록의 주변 블록들의 움직임 정보들(머지 후보들)의 가중치 값의 중간값을 상기 현재 블록의 가중치로 적용할 수 있다. 구체적으로, 예를 들어, 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 중간값을 도출할 수 있고, 상기 머지 후보들의 상기 L0 가중치들의 상기 중간값을 상기 현재 블록의 상기 L0 가중치로 도출할 수 있다. 또한, 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L1 가중치들의 중간값을 도출할 수 있고, 상기 머지 후보들의 상기 L1 가중치들의 상기 중간값을 상기 현재 블록의 상기 L1 가중치로 도출할 수 있다.
한편, 상술한 바와 같이 상기 현재 블록의 주변 블록의 움직임 정보를 기반으로 상기 현재 블록의 가중치들이 도출될 수 있으나, 상기 현재 블록의 가중치들에 대한 정보가 직접 전송될 수 있고, 상기 정보를 기반으로 상기 현재 블록의 가중치들이 도출될 수 있다.
구체적으로, 상기 현재 블록에 머지 모드가 적용되는 경우, 상기 머지 후보 리스트의 머지 후보들 중 선택된 상기 현재 블록의 주변 블록의 움직임 정보를 기반으로 쌍예측이 수행될 수 있다. 이 경우, 상기 움직임 정보를 기반으로 도출되는 L0 참조 블록 및 L1 참조 블록을 이용한 비용함수를 통하여 상기 가중치들이 도출될 수 있다. 상기 L0 가중치 및 상기 L1 가중치를 도출하기 위한 비용함수는 다음과 같은 수학식으로 나타낼 수 있다.
여기서, i, j는 블록 내 샘플의 위치 (i, j)를 나타내고, Costdistortion
은 코스트, Blockref0는 L0 방향의 MVL0가 가리키는 L0 참조 블록의 샘플값, Blockref1는 상기 L1 방향의 상기 MVL1가 가리키는 L1 참조 블록의 샘플값, w는 상기 L0 가중치를 나타낸다. 이 경우, 상기 L1 가중치는 1에서 상기 L0 가중치를 뺀 값, 즉, (1-w)로 나타낼 수 있다. 상기 코스트는 상기 L0 참조 블록 및 상기 L1 참조 블록의 대응하는 샘플들간의 차이를 나타낼 수 있고, 수학식 3에 도시된 바와 같이 상기 코스트는 상기 L0 가중치가 적용된 L0 참조 블록과 상기 L1 가중치가 적용된 상기 L1 참조 블록의 대응하는 샘플들간 차이의 절대값의 합으로 도출될 수 있다.
상기 코스트는 상기 쌍예측을 위한 가중치들을 도출하는데 사용될 수 있다. 예를 들어, 인코딩 장치는 복수의 L0 가중치 후보 및 L1 가중치 후보 조합들을 상기 L0 참조 블록과 상기 L1 참조 블록에 적용하여 복수의 코스트들을 도출할 수 있고, 상기 복수의 코스트들 중 최소인 코스트에 관한 L0 가중치 후보 및 L1 가중치 후보 조합을 나타내는 인덱스를 시그널링할 수 있다. 디코딩 장치는 상기 인덱스를 파싱(parsing)할 수 있고, 상기 인덱스가 가리키는 L0 가중치 후보 및 L1 가중치 후보 조합의 L0 가중치 후보 및 L1 가중치 후보를 각각 상기 L0 가중치 및 상기 L1 가중치로 도출할 수 있다. 여기서, 상기 인덱스는 쌍예측 가중치 인덱스 또는 가중치 인덱스라고 불릴 수 있다. 한편, 수학식 3에서는 distortion 만 고려되어 있으나, 상기 가중치들을 도출하는 과정에서는 rate가 포함되어 RDO(Rate-distortion optimization)가 수행될 수도 있다.
상기 가중치 인덱스는 예측 유닛(prediction unit, PU) 또는 코딩 유닛(coding unit, CU) 단위로 전송될 수 있다. 상기 예측 유닛은 예측 블록이라고 불릴 수 있고, 상기 코딩 유닛은 코딩 블록이라고 불릴 수 있다. 상기 가중치 인덱스가 CU 단위로 전송되는 경우, 하나의 CU에 대응하는 PU들은 동일한 가중치가 적용될 수 있다.
예를 들어, 상기 가중치 인덱스가 CU 단위로 전송되는 경우의 신텍스(syntax)는 다음의 표와 같이 구성될 수 있다.
여기서, cu_skip_flag 는 CU의 스킵 모드 적용 여부를 나타내는 스킵 플래그의 신텍스 요소(syntax element), part_mode 는 상기 CU의 PU로의 파티셔닝(partitioning) 정보를 나타내는 신텍스 요소, bi_pred_weighting_idx 는 L0 가중치 후보 및 L1 가중치 후보 조합들 중 하나를 가리키는 상기 가중치 인덱스의 신텍스 요소를 나타낸다. 표 1은 상기 CU에 스킵 모드가 적용되는 경우 및 스킵 모드가 적용되지 않는 경우 모두에 상기 가중치 인덱스가 시그널링됨을 나타내고 있으나, 상기 가중치 인덱스의 시그널링 여부는 상기 CU에 스킵 모드가 적용되는 경우 및 스킵 모드가 적용되지 않는 경우에 대하여 독립적으로 결정될 수 있다. 상기 가중치 인덱스가 CU 단위로 부호화되어 전송되는 경우, 상기 part_mode가 파싱되기 전에 상기 가중치 인덱스가 파싱되도록 부호화되어 PU 단위로 상기 가중치 인덱스가 전송되는 방법보다 낮은 빈도로 상기 가중치 인덱스가 시그널링될 수 있다.
하지만, 머지 모드가 적용되지 않는 경우에도 상기 가중치 인덱스가 시그널링될 수 있기에 상기 가중치 인덱스가 PU 단위로 전송되는 경우보다 비트율이 증가될 수도 있다. 예를 들어, 상기 가중치 인덱스가 PU 단위로 전송되는 경우의 신텍스(syntax)는 다음의 표와 같이 구성될 수 있다.
여기서, merge_flag는 PU의 머지 모드 적용 여부를 나타내는 머지 플래그의 신텍스 요소, merge_idx는 상기 머지 인덱스의 신텍스 요소, bi_pred_weighting_idx는 상기 가중치 인덱스를 나타낸다. 상기 가중치 인덱스가 PU 단위로 전송될 경우, 상기 머지 인덱스 다음에 파싱되도록 전송되어서 상기 PU에 머지 모드가 적용되는 경우에만 시그널링될 수 있기 때문에 의도치 않은 비트율 증가를 막을 수 있다. 즉, 상기 머지 플래그의 값이 1인 경우에만 상기 가중치 인덱스가 시그널링될 수 있다. 하지만 상술한 CU 단위로 상기 가중치 인덱스를 전송하는 방법보다는 높은 빈도로 상기 가중치 인덱스가 전송될 수 있다.
한편, 상기 가중치 인덱스를 이진화(binarization)하는 방법은, 상기 가중치 인덱스와 이진화 코드(binary code)를 고정적으로 대응시키는 방법과 상기 가중치 인덱스와 이진화 코드를 가변적으로 대응시키는 방법을 포함할 수 있다. 상기 가중치 인덱스와 이진화 코드를 고정적으로 대응시켜 상기 가중치 인덱스를 이진화 하는 방법의 일 예는 다음의 표와 같을 수 있다.
L0 가중치 후보 및 L1 가중치 후보 조합은 7개로 가정될 수 있고, 이 경우, 상기 가중치 인덱스의 값이 나타내는 L0 가중치 후보 및 L1 가중치 후보 조합의 값은 표 3의 2열과 같이 도출될 수 있다. 또한, 상기 가중치 인덱스의 값에 대응하는 이진화 코드는 표 3의 3열과 같이 도출될 수 있다. 상기 가중치 인덱스를 위하여 할당되는 비트 수는 상기 가중치 인덱스의 값에 따라 가변적(variable)일 수 있고, 선택되는 빈도가 높은 값인 경우에 작은 비트 수가 할당될 수 있다. 예를 들어, (1/2, 1/2)의 값을 갖는 L0 가중치 후보 및 L1 가중치 후보 조합이 각 블록의 예측에 선택되는 빈도가 가장 높을 수 있고, 이 경우, 상기 조합을 가리키는 상기 가중치 인덱스의 값에 낮은 비트의 이진화 코드를 할당하여 부호화 이득을 얻을 수 있다. 또한, 상기 가중치 인덱스의 모든 값들에 동일하게 3 비트의 이진화 코드를 대응시킬 수도 있다. 즉, 상기 가중치 인덱스의 비트수는 3비트로 고정될 수 있다. 상기 3bit 길이의 이진화 코드는 000, 001, 010, 011, 100, 101 및 110을 포함할 수 있다.
한편, 상기 가중치 인덱스의 값에 이진화 코드가 고정적으로 대응될 수 있지만, 가변적으로 대응될 수도 있다. 예를 들어, 상기 가중치 인덱스의 값이 예측될 수 있다. 다시 말해, 상기 머지 후보들(또는 현재 블록의 주변 블록들의 움직임 정보들) 중 적어도 하나를 기반으로 L0 가중치 예측자 및 L1 가중치 예측자가 예측될 수 있고, 상기 L0 가중치 예측자 및 L1 가중치 예측자에 대응하는 인덱스 값이 도출될 수 있다. 예를 들어, 상기 머지 인덱스를 기반으로 선택된 머지 후보의 L0 가중치 및 L1 가중치가 각각 상기 L0 가중치 예측자 및 상기 L1 가중치 예측자로 도출될 수 있다.
상기 가중치 인덱스는 상기 조합들에 대한 인덱스 값들 중 상기 L0 가중치 예측자 및 L1 가중치 예측자에 대응하는 인덱스 값과 실제 가중치 인덱스 값과의 차분값을 나타낼 수 있다. 즉, 상기 차분값과 상기 가중치 인덱스의 값에 따라 할당되는 이진화 코드가 대응할 수 있다. 상기 가중치 인덱스를 나타내는 이진화 코드(binary code)는 상기 차분값을 기반으로 가변 길이의 비트들이 할당될 수 있다. 상기 차분값에 대응되는 이진화 코드는 다음의 표와 같을 수 있다.
상기 차분값은 실제 가중치 인덱스의 값에서 상기 L0 가중치 예측자 및 L1 가중치 예측자에 대응하는 인덱스 값을 뺀 값으로 나타낼 수 있다. 구체적으로, 예를 들어, 상기 주변 블록들의 가중치들의 경향성을 파악하여 예측된 가중치 인덱스의 값은 (3/8, 5/8)의 조합을 가리키는 2일 수 있고, 실제 도출된 가중치 인덱스의 값은 (5/8, 3/8)의 조합을 가리키는 4인 경우, 상기 차분값은 4 에서 2를 뺀 2로 나타낼 수 있다. 따라서, 실제 도출된 상기 가중치 인덱스의 이진화 코드는 11110으로 도출될 수 있다. 또한, 상기 주변 블록들의 가중치들의 경향성을 파악하여 예측된 가중치 인덱스의 값은 (6/8, 2/8)의 조합을 가리키는 5일 수 있고, 실제 도출된 가중치 인덱스의 값은 (1/2, 1/2)의 조합을 가리키는 3인 경우, 상기 차분값은 3 에서 5를 뺀 -2로 나타낼 수 있다. 따라서, 실제 도출된 상기 가중치 인덱스의 이진화 코드는 1110으로 도출될 수 있다. 여기서, (x, y)의 조합은 L0 가중치 후보의 값이 x, L1 가중치 후보의 값이 y인 L0 가중치 후보 및 L1 가중치 후보 조합을 나타낼 수 있다.
상술한 바와 같이 상기 가중치 인덱스의 값에 가변적인 이진화 코드를 대응시키는 방법은 상기 차분값을 전송해야 하므로 부호화될 경우의 수가 2배 가까이 증가하기 때문에 이진화 코드가 길어진다는 문제점이 있을 수 있다. 이에, 상술한 표 4와 같이 상기 차분값의 경우를 7가지로 제한하여 부호화될 수 있다.
한편, 상기 가중치들에 대한 정보의 수신없이 상기 L0 가중치 및 상기 L1 가중치를 계산하여 도출하는 방법이 있을 수 있다. 일 예로, 현재 픽처와 L0 참조 픽처와의 POC 차이 및 상기 현재 픽처와 L1 참조 픽처와의 POC 차이의 비율을 기반으로 상기 가중치들이 도출될 수 있다.
도 6은 상기 현재 픽처와 상기 L0 참조 픽처와의 POC 차이 및 상기 현재 픽처와 상기 L1 참조 픽처와의 POC 차이의 비가 동일한 경우와 다른 경우를 예시적으로 나타낸다. 상기 L0 가중치와 상기 L1 가중치와의 비율이 L0 참조 픽처와 상기 현재 픽처와의 POC 차이와 L1 참조 픽처와 상기 현재 픽처와의 POC 차이와의 비율에 반비례하도록 상기 L0 가중치 및 상기 L1 가중치가 도출될 수 있다. 예를 들어, 도 6의 (a)에 도시된 것과 같이 상기 L0 참조 픽처와 상기 현재 픽처와의 POC 차이와 상기 L1 참조 픽처와 상기 현재 픽처와의 POC 차이가 동일할 수 있다. 이 경우, 상기 L0 가중치 및 L1 가중치는 동일하게 1/2로 도출될 수 있다.
또한, 도 6의 (b)에 도시된 것과 같이 상기 L0 참조 픽처와 상기 현재 픽처와의 POC 차이가 2, 상기 L1 참조 픽처와 상기 현재 픽처와의 POC 차이가 1일 수 있다. 이 경우, 상기 L0 참조 픽처와 상기 현재 픽처와의 POC 차이와 상기 L1 참조 픽처와 상기 현재 픽처와의 POC 차이와의 비율은 2:1로 도출될 수 있다. 따라서, 2:1의 비율에 반비례하도록 상기 L0 가중치는 1/3, 상기 L1 가중치는 2/3로 도출될 수 있다. 한편, 픽처들 간 POC 차이는 시간 거리라고 불릴 수 있고, 상기 L0 참조 픽처와 상기 현재 픽처와의 POC 차이는 제1 시간 거리, 상기 L1 참조 픽처와 상기 현재 픽처와의 POC 차이는 제2 시간 거리라고 불릴 수 있다.
상기 가중치들에 대한 정보의 수신없이 상기 L0 가중치 및 상기 L1 가중치를 계산하여 도출하는 방법의 다른 예로, 상기 현재 블록의 템플릿(template)과 참조 블록의 템플릿들을 기반으로 상기 L0 가중치 및 상기 L1 가중치를 도출하는 방법이 있을 수 있다. 여기서, 상기 현재 블록의 템플릿은 상기 현재 블록의 좌측 주변 샘플들 및 상기 상측 주변 샘플들을 포함하는 특정 영역일 수 있고, 상기 참조 블록의 템플릿은 상기 참조 블록의 좌측 주변 샘플들 및 상기 상측 주변 샘플들을 포함하는 특정 영역일 수 있다.
도 7은 상기 현재 블록의 템플릿과 참조 블록들의 템플릿들을 기반으로 상기 현재 블록의 L0 가중치 및 상기 L1 가중치를 도출하는 방법을 예시적으로 나타낸다. 도 7의 (a)는 상기 현재 블록의 템플릿과 및 상기 현재 블록의 템플릿에 대응하는 상기 L0 참조 블록의 템플릿 및 상기 L1 참조 블록의 템플릿을 나타낸다. 상기 L0 참조 블록의 템플릿은 L0 템플릿이라고 불릴 수 있고, 상기 L1 참조 블록의 템플릿은 L1 템플릿이라고 불릴 수 있다. 디코딩 장치는 상기 현재 블록의 템플릿, 상기 L0 템플릿 및 상기 L1 템플릿을 기반으로 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출할 수 있다.
도 7의 (b)는 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 일 예를 나타낸다. 디코딩 장치는 머지 인덱스를 파싱할 수 있다(S700). 상기 머지 인덱스는 비트스트림을 통하여 시그널링될 수 있다. 디코딩 장치는 머지 후보 리스트를 구성할 수 있다(S710). 디코딩 장치는 상술한 내용과 같이 상기 현재 블록의 주변 블록들의 움직임 정보들을 머지 후보들로 포함하는 상기 머지 후보 리스트를 도출할 수 있다. 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들 중 상기 머지 인덱스가 가리키는 머지 후보를 기반으로 상기 현재 블록의 움직임 정보를 도출할 수 있다. 디코딩 장치는 상기 움직임 정보를 기반으로 상기 현재 블록의 L0 참조 블록 및 L1 참조 블록을 도출할 수 있다. 이 경우, 디코딩 장치는 상기 현재 블록의 템플릿 및 상기 현재 블록의 템플릿에 대응하는 L0 템플릿 및 L1 템플릿이 도출할 수 있다. 상기 현재 블록의 템플릿은 상기 현재 블록의 좌측 주변 샘플들 및 상측 주변 샘플들을 포함할 수 있다. 즉, 상기 현재 블록의 템플릿은 상기 현재 블록의 좌측 주변 샘플들 및 상기 상측 주변 샘플들을 포함하는 특정 영역일 수 있다. 상기 L0 템플릿은 상기 L0 참조 블록의 좌측 주변 샘플들 및 상측 주변 샘플들을 포함할 수 있고, 상기 L1 템플릿은 상기 L1 참조 블록의 좌측 주변 샘플들 및 상측 주변 샘플들을 포함할 수 있다. 상기 L0 템플릿은 상기 L0 참조 블록의 좌측 주변 샘플들 및 상기 상측 주변 샘플들을 포함하는 특정 영역일 수 있고, 상기 L1 템플릿은 상기 L1 참조 블록의 좌측 주변 샘플들 및 상기 상측 주변 샘플들을 포함하는 특정 영역일 수 있다.
디코딩 장치는 상기 상기 현재 블록의 템플릿, 상기 L0 템플릿 및 상기 L1 템플릿을 기반으로 상기 현재 블록의 L0 가중치 및 L1 가중치를 계산할 수 있다(S720). 상기 L0 템플릿 및 상기 L1 템플릿의 대응하는 샘플들은 가중합될 수 있고, 상기 현재 블록의 템플릿의 샘플값과 상기 가중합된 값과의 차이, 즉, 코스트가 상기 쌍예측을 위한 가중치들을 도출하는데 사용될 수 있다. 예를 들어, 복수의 L0 가중치 후보 및 L1 가중치 후보 조합들이 상기 L0 템플릿과 상기 L1 템플릿에 적용되어 복수의 가중합(weighted sum)된 템플릿들이 도출될 수 있고, 상기 복수의 가중합된 상기 참조 블록들의 템플릿들 각각에 대한 상기 현재 블록의 템플릿과의 복수의 코스트들이 도출될 수 있고, 상기 복수의 코스트들 중 최소인 코스트에 관한 L0 가중치 후보 및 L1 가중치 후보는 각각 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치로 도출될 수 있다. 상기 L0 가중치 및 상기 L1 가중치를 도출하기 위한 비용함수는 다음과 같은 수학식으로 나타낼 수 있다. 즉, 상기 코스트는 다음과 같은 수학식을 기반으로 도출될 수 있다.
여기서, i, j는 블록 내 샘플의 위치 (i, j)를 나타내고, Costdistortion
은 상기 코스트, Tempcur는 상기 현재 블록의 템플릿의 샘플값, Tempref0는 상기 L0 템플릿의 샘플값, Tempref1는 상기 L1 템플릿의 샘플값, w는 상기 L0 가중치를 나타낸다. 이 경우, 상기 L1 가중치는 1에서 상기 L0 가중치를 뺀 값, 즉, (1-w)로 나타낼 수 있다. 디코딩 장치는 상기 수학식 4를 기반으로 상기 쌍예측을 위한 가중치들을 도출할 수 있다.
디코딩 장치는 상기 계산된 가중치들을 기반으로 상기 현재 블록을 디코딩할 수 있다(S730). 디코딩 장치는 상기 L0 가중치 및 L1 가중치를 기반으로 상기 현재 블록의 상기 L0 참조 블록 및 상기 L1 참조 블록을 가중합하여 상기 현재 블록의 예측 블록을 생성할 수 있다. 디코딩 장치는 예측 모드에 따라 상기 예측 블록을 바로 복원 블록으로 이용할 수도 있고, 또는 상기 예측 블록에 레지듀얼(residual)을 더하여 복원 블록을 생성할 수도 있다.
한편, 상술한 방법들을 복합적으로 사용하여 상기 가중치들이 도출될 수 있다. 구체적으로, 상술한 상기 현재 블록에 대한 주변 블록의 움직임 정보, 즉, 상기 머지 인덱스가 가리키는 머지 후보의 가중치를 그대로 상기 현재 블록의 가중치로 사용하는 방법과 POC 차이를 기반으로 상기 가중치를 도출하는 방법이 경우에 따라 선택적으로 적용될 수도 있고, 상기 POC 차이를 기반으로 상기 가중치를 도출하는 방법과 상기 현재 블록 및 참조 블록의 템플릿들을 기반으로 상기 가중치를 도출하는 방법이 적용될 수도 있다.
일 예로, 쌍예측의 참조 픽쳐들이 동일한 시간거리에 있는 경우, 즉, 현재 픽처와 L0 참조 픽처와의 제1 시간 거리 및 상기 현재 픽처와 L1 참조 픽처와의 제2 시간 거리가 동일한 경우, L0 가중치 및 L1 가중치는 1/2로 도출될 수 있고, 참조픽쳐들이 다른 시간 거리에 위치할 경우, 즉, 상기 제1 시간 거리 및 상기 제2 시간 거리가 다른 경우, 상술한 상기 현재 블록의 템플릿 및 참조 블록들의 템플릿를 기반으로 상기 L0 가중치 및 L1 가중치가 도출될 수 있다.
다른 예로, 상기 현재 블록에 머지 모드가 적용되고 상기 현재 블록의 움직임 정보를 위하여 머지 후보 리스트에 포함된 머지 후보들 중 공간적 주변 블록의 움직임 정보가 선택된 경우, 선택된 상기 공간적 주변 블록의 움직임 정보의 가중치가 상기 현재 블록의 가중치로 적용될 수 있고, 상기 현재 블록의 움직임 정보를 위하여 상기 머지 후보들 중 시간적 주변 블록의 움직임 정보 또는 움직임 정보들의 조합으로 도출된 머지 후보가 선택된 경우, 상기 현재 블록의 가중치는 1/2로 도출될 수 있다.
다른 예로, 상기 현재 블록에 머지 모드가 적용되고 상기 현재 블록의 움직임 정보를 위하여 머지 후보 리스트에 포함된 머지 후보들 중 공간적 주변 블록의 움직임 정보가 선택된 경우, 선택된 상기 공간적 주변 블록의 움직임 정보의 가중치가 상기 현재 블록의 가중치로 적용될 수 있고, 상기 현재 블록의 움직임 정보를 위하여 상기 머지 후보들 중 시간적 주변 블록의 움직임 정보 또는 움직임 정보들의 도출된 머지 후보가 선택된 경우, 상술한 상기 현재 블록의 템플릿 및 참조 블록들의 템플릿들을 기반으로 상기 현재 블록의 가중치들이 계산될 수 있다.
도 8은 본 발명에 따른 인코딩 장치에 의한 비디오 인코딩 방법을 개략적으로 나타낸다. 도 8에서 개시된 방법은 도 1에서 개시된 인코딩 장치에 의하여 수행될 수 있다. 구체적으로 예를 들어, 도 8의 S800 내지 S850은 상기 인코딩 장치의 예측부, S860은 상기 인코딩 장치의 엔트로피 인코딩부에 의하여 수행될 수 있다.
인코딩 장치는 현재 블록의 주변 블록들을 기반으로 머지 후보 리스트를 구성한다(S800). 상기 머지 후보 리스트는 상기 현재 블록의 공간적으로 인접한 주변 블록의 움직임 정보를 머지 후보(merge candidate)로 포함하여 구성될 수 있다. 공간적으로 인접한 상기 주변 블록은 공간적 주변 블록이라고 불릴 수 있다. 상기 공간적 주변 블록은 상기 현재 블록의 좌하측 주변 블록, 좌측 주변 블록, 우상측 주변 블록, 상측 주변 블록 및/또는 좌상측 주변 블록을 포함할 수 있다. 상기 머지 후보 리스트는 또한, 시간적으로 인접한 주변 블록의 움직임 정보를 머지 후보(merge candidate)로 포함하여 구성될 수 있다. 시간적으로 인접한 상기 주변 블록은 시간적 주변 블록이라고 불릴 수 있다. 또한, 상기 머지 후보 리스트는 상기 주변 블록들의 움직임 정보들을 조합하여 도출된 조합된 쌍예측 후보(combined bi-predicted candidate) 또는 영 벡터(zero vector)를 머지 후보로 포함하여 구성될 수 있다. 상기 현재 블록의 공간적 주변 블록의 움직임 정보, 시간적 주변 블록의 움직임 정보 및/또는 상기 조합된 쌍예측 후보 등을 기반으로 상기 머지 후보 리스트가 구성될 수 있다.
인코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들 중 하나를 기반으로 상기 현재 블록의 L0 움직임 정보 및 L1 움직임 정보를 도출한다(S810). 인코딩 장치는 상기 현재 블록의 움직임 정보를 도출하기 위하여 상기 머지 후보 리스트에 포함된 머지 후보들 중 하나를 선택할 수 있다. 선택된 머지 후보는 상기 현재 블록의 주변 블록의 L0 움직임 정보 및 L1 움직임 정보를 포함할 수 있다. 상기 머지 후보의 L0 움직임 정보는 상기 현재 블록의 상기 L0 움직임 정보로 도출될 수 있고, 상기 머지 후보의 L1 움직임 정보는 상기 현재 블록의 상기 L1 움직임 정보로 도출될 수 있다. 상기 현재 블록의 상기 L0 움직임 정보는 상기 현재 블록에 대한 참조 픽처 리스트 L0(List 0, L0)에 포함된 L0 참조 픽처를 가리키는 L0 참조 픽처 인덱스 및 움직임 벡터 L0(Motion Vector L0, MVL0)를 포함할 수 있고, 상기 현재 블록의 상기 L1 움직임 정보는 상기 현재 블록에 대한 참조 픽처 리스트 L0(List 1, L1)에 포함된 L1 참조 픽처를 가리키는 L1 참조 픽처 인덱스 및 MVL1를 포함할 수 있다.
인코딩 장치는 상기 L0 움직임 정보를 기반으로 L0 참조 샘플을 도출한다(S820). 인코딩 장치는 상기 L0 움직임 정보를 기반으로 상기 L0 참조 샘플을 도출할 수 있다. 인코딩 장치는 상기 L0 참조 픽처 인덱스가 가리키는 L0 참조 픽처 내 상기 MVL0가 가리키는 L0 참조 블록을 도출할 수 있고, 상기 L0 참조 블록은 상기 L0 참조 샘플을 포함할 수 있다.
인코딩 장치는 상기 L1 움직임 정보를 기반으로 L1 참조 샘플을 도출한다(S830). 인코딩 장치는 상기 L1 움직임 정보를 기반으로 상기 L1 참조 샘플을 도출할 수 있다. 인코딩 장치는 상기 L1 참조 픽처 인덱스가 가리키는 L1 참조 픽처 내 상기 MVL1가 가리키는 L1 참조 블록을 도출할 수 있고, 상기 L1 참조 블록은 상기 L1 참조 샘플을 포함할 수 있다.
인코딩 장치는 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출한다(S840). 인코딩 장치는 다양한 방법을 통하여 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출할 수 있다.
일 예로, 인코딩 장치는 상기 선택된 머지 후보의 L0 가중치 및 L1 가중치를 기반으로 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출할 수 있다. 구체적으로, 인코딩 장치는 상기 선택된 머지 후보의 L0 가중치를 상기 현재 블록의 상기 L0 가중치로 도출할 수 있고, 상기 선택된 머지 후보의 L1 가중치를 상기 현재 블록의 상기 L1 가중치로 도출할 수 있다.
또한, 다른 예로, 인코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들 및 L1 가중치들의 값들 중 최빈값을 상기 현재 블록의 L0 가중치 및 L1 가중치로 도출할 수 있다. 구체적으로, 인코딩 장치는 상기 머지 후보 리스트에 포함된 상기 머지 후보들의 L0 가중치들의 값들 중 최빈값을 상기 현재 블록의 상기 L0 가중치로 도출할 수 있고, 상기 머지 후보 리스트에 포함된 머지 후보들의 L1 가중치들의 값들 중 최빈값을 상기 현재 블록의 상기 L1 가중치로 도출할 수 있다.
또한, 다른 예로, 인코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 평균값 및 L1 가중치들의 평균값을 기반으로 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출할 수 있다. 구체적으로, 인코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 평균값을 도출할 수 있고, 상기 머지 후보 리스트에 포함된 상기 머지 후보들의 L1 가중치들의 평균값을 도출할 수 있다. 인코딩 장치는 상기 머지 후보들의 상기 L0 가중치들의 상기 평균값을 상기 현재 블록의 상기 L0 가중치로 도출할 수 있고, 상기 머지 후보들의 상기 L1 가중치들의 상기 평균값을 상기 현재 블록의 상기 L1 가중치로 도출할 수 있다.
또한, 다른 예로, 인코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 중간값 및 L1 가중치들의 중간값을 기반으로 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출할 수 있다. 구체적으로, 인코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 중간값을 도출할 수 있고, 상기 머지 후보 리스트에 포함된 머지 후보들의 L1 가중치들의 중간값을 도출할 수 있다. 인코딩 장치는 상기 머지 후보들의 상기 L0 가중치들의 상기 중간값을 상기 현재 블록의 상기 L0 가중치로 도출할 수 있고, 상기 머지 후보들의 상기 L1 가중치들의 상기 중간값을 상기 현재 블록의 상기 L1 가중치로 도출할 수 있다.
또한, 다른 예로, 인코딩 장치는 현재 픽처의 POC(picture order count)와 상기 L0 참조 샘플이 위치하는 L0 참조 픽처의 POC와의 제1 차이를 도출할 수 있고, 상기 현재 픽처의 POC와 상기 L1 참조 샘플이 위치하는 L1 참조 픽처의 POC 와의 제2 차이를 도출할 수 있고, 상기 제1 차이와 상기 제2 차이와의 비율을 기반으로 상기 L0 가중치 및 상기 L1 가중치를 도출할 수 있다. 구체적으로, 인코딩 장치는 상기 L0 가중치와 상기 L1 가중치와의 비율이 상기 제1 차이와 상기 제2 차이와의 비율에 반비례하도록 상기 L0 가중치 및 상기 L1 가중치를 도출할 수 있다. 즉, 디코딩 장치는 상기 제1 차이와 상기 제2 차이와의 비율을 기반으로 상기 L0 가중치 및 상기 L1 가중치를 도출할 수 있다. 여기서, 상기 L0 가중치와 상기 L1 가중치의 합은 1일 수 있다. 구체적으로, 예를 들어, 상기 제1 차이의 값이 2, 상기 제2 차이의 값이 1로 도출되는 경우, 상기 제1 차이와 상기 제2 차이와의 비율 2:1에 반비례하도록 상기 L0 가중치는 1/3, 상기 L1 가중치는 2/3으로 도출될 수 있다. 여기서, 상기 제1 차이는 제1 시간 거리, 상기 제2 차이는 제2 시간 거리라고 불릴 수도 있다.
또한, 다른 예로, 인코딩 장치는 상기 현재 블록의 템플릿, 상기 L0 참조 샘플을 포함하는 L0 참조 블록의 템플릿, 상기 L1 참조 샘플을 포함하는 L1 참조 블록의 템플릿을 기반으로 상기 L0 가중치 및 상기 L1 가중치를 도출할 수 있다. 인코딩 장치는 상기 현재 블록의 주변 샘플들을 기반으로 상기 현재 블록의 템플릿(template)을 도출할 수 있고, 상기 현재 블록의 상기 템플릿에 대응하는 상기 L0 참조 샘플을 포함하는 L0 참조 블록의 템플릿을 도출할 수 있고, 상기 현재 블록의 상기 템플릿에 대응하는 상기 L1 참조 샘플을 포함하는 L1 참조 블록의 템플릿을 도출할 수 있다. 상기 현재 블록의 템플릿은 상기 현재 블록의 좌측 주변 샘플들 및 상측 주변 샘플들을 포함할 수 있고, 상기 L0 참조 블록의 템플릿은 상기 L0 참조 블록의 좌측 주변 샘플들 및 상측 주변 샘플들을 포함할 수 있고, 상기 L1 참조 블록의 템플릿은 상기 L1 참조 블록의 좌측 주변 샘플들 및 상측 주변 샘플들을 포함할 수 있다. 인코딩 장치는 복수의 L0 가중치 후보 및 L1 가중치 후보 조합들을 기반으로 상기 L0 참조 블록의 템플릿 및 상기 L1 참조 블록의 템플릿을 가중합하여 복수의 가중합된 템플릿들을 도출할 수 있고, 상기 복수의 가중합된 템플릿들 각각에 대한 상기 현재 블록의 템플릿과의 코스트를 도출할 수 있다. 인코딩 장치는 상기 코스트들 중 최소인 코스트에 관한 L0 가중치 후보 및 L1 가중치 후보를 각각 상기 L0 가중치 및 상기 L1 가중치로 도출할 수 있다. 여기서, 상기 가중합된 템플릿은 L0 가중치 후보가 적용된 상기 L0 참조 블록의 템플릿과 L1 가중치 후보가 적용된 상기 L1 참조 블록의 템플릿의 대응하는 샘플들간의 합으로 도출될 수 있다. 또한, 상기 코스트는 상기 현재 블록의 템플릿과 상기 가중합된 템플릿 사이의 대응하는 샘플들간의 SAD(sum of absolute differences)로 나타낼 수 있다. 또한, 상기 코스트는 상술한 수학식 4를 기반으로 도출될 수 있다. 즉, 상기 L0 가중치 및 상기 L1 가중치는 상술한 수학식 4를 기반으로 도출될 수 있다.
또한, 상술한 방법들을 복합적으로 사용하여 상기 가중치들이 도출될 수 있다. 구체적으로, 상술한 상기 현재 블록에 대한 주변 블록의 움직임 정보, 즉, 상기 머지 후보의 가중치를 그대로 상기 현재 블록의 가중치로 사용하는 방법과 POC 차이를 기반으로 상기 가중치를 도출하는 방법이 경우에 따라 선택적으로 적용될 수도 있고, 상기 POC 차이를 기반으로 상기 가중치를 도출하는 방법과 상기 현재 블록 및 참조 블록의 템플릿들을 기반으로 상기 가중치를 도출하는 방법이 경우에 따라 선택적으로 적용될 수도 있다.
일 예로, 상기 제1 차이 및 상기 제2 차이가 동일한 경우, L0 가중치 및 L1 가중치는 1/2로 도출될 수 있고, 상기 제1 차이와 상기 제2 차이가 동일하지 않은 경우, 상술한 상기 현재 블록의 템플릿, L0 참조 블록의 템플릿 및 L1 참조 블록의 템플릿을 기반으로 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치를 도출하는 방법이 적용될 수 있다.
또한, 다른 예로, 상기 현재 블록의 움직임 정보를 위하여 선택된 상기 머지 후보가 상기 현재 블록의 공간적 주변 블록의 움직임 정보인 경우, 상기 머지 후보의 L0 가중치 및 L1 가중치가 각각 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치로 적용될 수 있고, 선택된 상기 머지 후보가 공간적 주변 블록의 움직임 정보가 아닌 경우, 상기 현재 블록의 L0 가중치 및 L1 가중치는 1/2로 도출될 수 있다.
또한, 다른 예로, 또한, 다른 예로, 상기 현재 블록의 움직임 정보를 위하여 선택된 상기 머지 후보가 상기 현재 블록의 공간적 주변 블록의 움직임 정보인 경우, 상기 머지 후보의 L0 가중치 및 L1 가중치가 각각 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치로 적용될 수 있고, 선택된 상기 머지 후보가 공간적 주변 블록의 움직임 정보가 아닌 경우, 상술한 상기 현재 블록의 템플릿, L0 참조 블록의 템플릿 및 L1 참조 블록의 템플릿을 기반으로 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치를 도출하는 방법이 적용될 수 있다.
한편, 인코딩 장치는 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치를 나타내는 가중치 인덱스를 생성할 수 있고, 시그널링 할 수 있다. 구체적으로, 인코딩 장치는 L0 가중치 후보 및 L1 가중치 후보의 조합들 중 하나를 가리키는 가중치 인덱스를 생성할 수 있다. 여기서, 상기 L0 가중치 후보 및 상기 L1 가중치 후보 조합들은 기설정될 수 있고, 또는 상기 머지 후보 리스트에 포함된 머지 후보들을 기반으로 도출될 수도 있다. 상기 가중치 인덱스는 비트스트림을 통하여 시그널링될 수 있다.
한편, 인코딩 장치는 상기 현재 블록에 머지 모드가 적용되는지 여부를 나타내는 머지 플래그를 파싱할 수 있고, 상기 가중치 인덱스는 상기 머지 플래그의 값이 1인 경우에만 시그널링될 수 있다. 또한, 상기 가중치 인덱스는 CU 단위 또는 PU 단위로 시그널링될 수 있다.
또한, 상기 가중치 인덱스의 비트 수는 가변적(variable)일 수 있다. 예를 들어, 상기 가중치 인덱스의 이진화 코드는 상술한 표 3과 같이 도출될 수 있다. 또한, 인코딩 장치는 상기 머지 후보들 중 적어도 하나를 기반으로 L0 가중치 예측자 및 L1 가중치 예측자를 도출할 수 있고, 상기 가중치 인덱스는 상기 조합들에 대한 인덱스 값들 중 상기 L0 가중치 예측자 및 L1 가중치 예측자에 대응하는 인덱스 값과 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치에 대한 인덱스 값과의 차분값을 나타낼 수 있다. 또한, 상기 선택된 머지 후보의 L0 가중치 및 L1 가중치는 각각 상기 L0 가중치 예측자 및 상기 L1 가중치 예측자로 도출될 수 있다. 상기 가중치 인덱스를 나타내는 이진화 코드(binary code)는 상기 차분값을 기반으로 가변 길이의 비트들이 할당될 수 있다. 예를 들어, 상기 가중치 인덱스를 나타내는 이진화 코드는 상술한 표 4와 같이 도출될 수 있다.
인코딩 장치는 상기 L0 가중치 및 L1 가중치를 기반으로 상기 L0 참조 샘플과 L1 참조 샘플을 가중합(weighted sum)하여 현재 블록의 예측 샘플을 생성한다(S850). 인코딩 장치는 상기 L0 참조 샘플에 상기 L0 가중치를 적용할 수 있고, 상기 L1 참조 샘플에 상기 L1 가중치를 적용할 수 있다. 다음으로, 인코딩 장치는 상기 L0 가중치가 적용된 상기 L0 참조 샘플과 상기 L1 가중치가 적용된 상기 L1 참조 샘플을 더하여 상기 예측 샘플을 생성할 수 있다. 상기 예측 샘플은 상술한 수학식 2를 기반으로 생성될 수 있다.
인코딩 장치는 상기 현재 블록에 대한 예측 정보를 인코딩하여 출력한다(S860). 인코딩 장치는 상기 현재 블록의 움직임 정보를 도출하기 위하여 선택된 머지 후보를 가리키는 머지 인덱스를 생성할 수 있다. 인코딩 장치는 상기 머지 인덱스를 인코딩하여 출력할 수 있다. 상기 머지 인덱스는 상기 예측 정보에 포함될 수 있다. 또한, 인코딩 장치는 상기 가중치 인덱스를 생성할 수 있고, 인코딩하여 출력할 수 있다. 상기 가중치 인덱스는 상기 예측 정보에 포함될 수 있다.
또한, 인코딩 장치는 원본 샘플과 상기 도출된 예측 샘플을 기반으로 레지듀얼(residual) 샘플을 생성할 수 있다. 인코딩 장치는 상기 레지듀얼 샘플을 기반으로 상기 레지듀얼에 관한 정보를 생성할 수 있다. 상기 레지듀얼에 관한 정보는 상기 레지듀얼 샘플에 관한 변환 계수들을 포함할 수 있다. 인코딩 장치는 상기 예측 샘플과 상기 레지듀얼 샘플을 기반으로 상기 복원 샘플을 도출할 수 있다. 즉, 인코딩 장치는 상기 예측 샘플과 상기 레지듀얼 샘플을 더하여 상기 복원 샘플을 도출할 수 있다. 또한, 인코딩 장치는 상기 레지듀얼에 관한 정보를 인코딩하여 비트스트림 형태로 출력할 수 있다. 상기 비트스트림은 네트워크 또는 저장매체를 통하여 디코딩 장치로 전송될 수 있다.
도 9는 본 발명에 따른 디코딩 장치에 의한 비디오 디코딩 방법을 개략적으로 나타낸다. 도 9에서 개시된 방법은 도 2에서 개시된 디코딩 장치에 의하여 수행될 수 있다. 구체적으로 예를 들어, S900은 상기 디코딩 장치의 엔트로피 디코딩부, S910 내지 S970은 상기 디코딩 장치의 예측부에 의하여 수행될 수 있다.
디코딩 장치는 현재 블록에 대한 머지 인덱스를 파싱한다(S900). 현재 블록에 머지 모드가 적용되는 경우, 디코딩 장치는 비트스트림을 통하여 상기 머지 인덱스를 수신할 수 있다. 상기 머지 인덱스는 상기 현재 블록의 머지 후보 리스트에 포함된 머지 후보들 중 하나를 가리킬 수 있다.
디코딩 장치는 상기 현재 블록의 주변 블록들을 기반으로 상기 머지 후보 리스트를 구성한다(S910). 상기 머지 후보 리스트는 상기 현재 블록의 공간적으로 인접한 주변 블록의 움직임 정보를 머지 후보(merge candidate)로 포함하여 구성될 수 있다. 공간적으로 인접한 상기 주변 블록은 공간적 주변 블록이라고 불릴 수 있다. 상기 공간적 주변 블록은 상기 현재 블록의 좌하측 주변 블록, 좌측 주변 블록, 우상측 주변 블록, 상측 주변 블록 및/또는 좌상측 주변 블록을 포함할 수 있다. 상기 머지 후보 리스트는 또한, 시간적으로 인접한 주변 블록의 움직임 정보를 머지 후보(merge candidate)로 포함하여 구성될 수 있다. 시간적으로 인접한 상기 주변 블록은 시간적 주변 블록이라고 불릴 수 있다. 또한, 상기 머지 후보 리스트는 상기 주변 블록들의 움직임 정보들을 조합하여 도출된 조합된 쌍예측 후보(combined bi-predicted candidate) 또는 영 벡터(zero vector)를 머지 후보로 포함하여 구성될 수 있다. 상기 현재 블록의 공간적 주변 블록의 움직임 정보, 시간적 주변 블록의 움직임 정보 및/또는 상기 조합된 쌍예측 후보 등을 기반으로 상기 머지 후보 리스트가 구성될 수 있다.
디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들 중 상기 머지 인덱스가 가리키는 머지 후보를 선택한다(S920). 상기 머지 인덱스는 상기 머지 후보 리스트에 포함된 머지 후보들 중 하나를 가리킬 수 있다. 상기 머지 인덱스가 가리키는 머지 후보는 상기 현재 블록의 움직임 정보를 도출하기 위하여 선택될 수 있다.
디코딩 장치는 상기 선택된 머지 후보를 기반으로 상기 현재 블록의 L0 움직임 정보 및 L1 움직임 정보를 도출한다(S930). 상기 선택된 머지 후보는 상기 현재 블록의 주변 블록의 L0 움직임 정보 및 L1 움직임 정보를 포함할 수 있다. 상기 선택된 머지 후보의 L0 움직임 정보는 상기 현재 블록의 상기 L0 움직임 정보로 도출될 수 있고, 상기 선택된 머지 후보의 L1 움직임 정보는 상기 현재 블록의 상기 L1 움직임 정보로 도출될 수 있다. 상기 현재 블록의 상기 L0 움직임 정보는 상기 현재 블록에 대한 참조 픽처 리스트 L0(List 0, L0)에 포함된 L0 참조 픽처를 가리키는 L0 참조 픽처 인덱스 및 움직임 벡터 L0(Motion Vector L0, MVL0)를 포함할 수 있고, 상기 현재 블록의 상기 L1 움직임 정보는 상기 현재 블록에 대한 참조 픽처 리스트 L0(List 1, L1)에 포함된 L1 참조 픽처를 가리키는 L1 참조 픽처 인덱스 및 MVL1를 포함할 수 있다.
디코딩 장치는 상기 L0 움직임 정보를 기반으로 L0 참조 샘플을 도출한다(S940). 디코딩 장치는 상기 L0 움직임 정보를 기반으로 상기 L0 참조 샘플을 도출할 수 있다. 디코딩 장치는 상기 L0 참조 픽처 인덱스가 가리키는 L0 참조 픽처 내 상기 MVL0가 가리키는 L0 참조 블록을 도출할 수 있고, 상기 L0 참조 블록은 상기 L0 참조 샘플을 포함할 수 있다.
디코딩 장치는 상기 L1 움직임 정보를 기반으로 L1 참조 샘플을 도출한다(S950). 디코딩 장치는 상기 L1 움직임 정보를 기반으로 상기 L1 참조 샘플을 도출할 수 있다. 디코딩 장치는 상기 L1 참조 픽처 인덱스가 가리키는 L1 참조 픽처 내 상기 MVL1가 가리키는 L1 참조 블록을 도출할 수 있고, 상기 L1 참조 블록은 상기 L1 참조 샘플을 포함할 수 있다.
디코딩 장치는 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출한다(S960). 디코딩 장치는 다양한 방법을 통하여 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출할 수 있다.
일 예로, 디코딩 장치는 상기 선택된 머지 후보의 L0 가중치 및 L1 가중치를 기반으로 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출할 수 있다. 구체적으로, 디코딩 장치는 상기 선택된 머지 후보의 L0 가중치를 상기 현재 블록의 상기 L0 가중치로 도출할 수 있고, 상기 선택된 머지 후보의 L1 가중치를 상기 현재 블록의 상기 L1 가중치로 도출할 수 있다.
또한, 다른 예로, 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들 및 L1 가중치들의 값들 중 최빈값을 상기 현재 블록의 L0 가중치 및 L1 가중치로 도출할 수 있다. 구체적으로, 디코딩 장치는 상기 머지 후보 리스트에 포함된 상기 머지 후보들의 L0 가중치들의 값들 중 최빈값을 상기 현재 블록의 상기 L0 가중치로 도출할 수 있고, 상기 머지 후보 리스트에 포함된 머지 후보들의 L1 가중치들의 값들 중 최빈값을 상기 현재 블록의 상기 L1 가중치로 도출할 수 있다.
또한, 다른 예로, 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 평균값 및 L1 가중치들의 평균값을 기반으로 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출할 수 있다. 구체적으로, 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 평균값을 도출할 수 있고, 상기 머지 후보 리스트에 포함된 상기 머지 후보들의 L1 가중치들의 평균값을 도출할 수 있다. 디코딩 장치는 상기 머지 후보들의 상기 L0 가중치들의 상기 평균값을 상기 현재 블록의 상기 L0 가중치로 도출할 수 있고, 상기 머지 후보들의 상기 L1 가중치들의 상기 평균값을 상기 현재 블록의 상기 L1 가중치로 도출할 수 있다.
또한, 다른 예로, 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 중간값 및 L1 가중치들의 중간값을 기반으로 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출할 수 있다. 구체적으로, 디코딩 장치는 상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 중간값을 도출할 수 있고, 상기 머지 후보 리스트에 포함된 머지 후보들의 L1 가중치들의 중간값을 도출할 수 있다. 디코딩 장치는 상기 머지 후보들의 상기 L0 가중치들의 상기 중간값을 상기 현재 블록의 상기 L0 가중치로 도출할 수 있고, 상기 머지 후보들의 상기 L1 가중치들의 상기 중간값을 상기 현재 블록의 상기 L1 가중치로 도출할 수 있다.
또한, 다른 예로, 디코딩 장치는 상기 L0 가중치 및 상기 L1 가중치에 대한 정보를 수신할 수 있고, 상기 수신된 정보를 기반으로 상기 L0 가중치 및 상기 L1 가중치를 도출할 수 있다. 구체적으로, 디코딩 장치는 L0 가중치 후보 및 L1 가중치 후보의 조합들 중 하나를 가리키는 가중치 인덱스를 파싱할 수 있다. 여기서, 상기 L0 가중치 후보 및 상기 L1 가중치 후보 조합들은 기설정될 수 있고, 또는 상기 머지 후보 리스트에 포함된 머지 후보들을 기반으로 도출될 수도 있다. 상기 가중치 인덱스는 비트스트림을 통하여 시그널링될 수 있다. 디코딩 장치는 상기 조합들 중 상기 가중치 인덱스가 가리키는 조합의 L0 가중치 후보 및 L1 가중치 후보를 각각 상기 L0 가중치 및 상기 L1 가중치로 도출할 수 있다.
한편, 디코딩 장치는 상기 현재 블록에 머지 모드가 적용되는지 여부를 나타내는 머지 플래그를 파싱할 수 있고, 상기 가중치 인덱스는 상기 머지 플래그의 값이 1인 경우에만 파싱될 수 있다. 또는 상기 가중치 인덱스는 CU 단위 또는 PU 단위로 시그널링될 수 있다.
한편, 상기 가중치 인덱스는 상기 머지 인덱스의 값이 1인 경우에만 시그널링될 수 있다. 또한, 상기 가중치 인덱스는 CU 단위 또는 PU 단위로 시그널링될 수 있다.
또한, 상기 가중치 인덱스의 비트 수는 가변적(variable)일 수 있다. 예를 들어, 상기 가중치 인덱스의 이진화 코드는 상술한 표 3과 같이 도출될 수 있다. 또한, 디코딩 장치는 상기 머지 후보들 중 적어도 하나를 기반으로 L0 가중치 예측자 및 L1 가중치 예측자를 도출할 수 있고, 상기 가중치 인덱스는 상기 조합들에 대한 인덱스 값들 중 상기 L0 가중치 예측자 및 L1 가중치 예측자에 대응하는 인덱스 값과 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치에 대한 인덱스 값과의 차분값을 나타낼 수 있다. 또한, 상기 선택된 머지 후보의 L0 가중치 및 L1 가중치는 각각 상기 L0 가중치 예측자 및 상기 L1 가중치 예측자로 도출될 수 있다. 상기 가중치 인덱스를 나타내는 이진화 코드(binary code)는 상기 차분값을 기반으로 가변 길이의 비트들이 할당될 수 있다. 예를 들어, 상기 가중치 인덱스를 나타내는 이진화 코드는 상술한 표 4와 같이 도출될 수 있다.
또한, 다른 예로, 디코딩 장치는 현재 픽처의 POC(picture order count)와 상기 L0 참조 샘플이 위치하는 L0 참조 픽처의 POC와의 제1 차이를 도출할 수 있고, 상기 현재 픽처의 POC와 상기 L1 참조 샘플이 위치하는 L1 참조 픽처의 POC 와의 제2 차이를 도출할 수 있고, 상기 제1 차이와 상기 제2 차이와의 비율을 기반으로 상기 L0 가중치 및 상기 L1 가중치를 도출할 수 있다. 구체적으로, 디코딩 장치는 상기 L0 가중치와 상기 L1 가중치와의 비율이 상기 제1 차이와 상기 제2 차이와의 비율에 반비례하도록 상기 L0 가중치 및 상기 L1 가중치를 도출할 수 있다. 즉, 디코딩 장치는 상기 제1 차이와 상기 제2 차이와의 비율을 기반으로 상기 L0 가중치 및 상기 L1 가중치를 도출할 수 있다. 여기서, 상기 L0 가중치와 상기 L1 가중치의 합은 1일 수 있다. 구체적으로, 예를 들어, 상기 제1 차이의 값이 2, 상기 제2 차이의 값이 1로 도출되는 경우, 상기 제1 차이와 상기 제2 차이와의 비율 2:1에 반비례하도록 상기 L0 가중치는 1/3, 상기 L1 가중치는 2/3으로 도출될 수 있다. 여기서, 상기 제1 차이는 제1 시간 거리, 상기 제2 차이는 제2 시간 거리라고 불릴 수도 있다.
또한, 다른 예로, 디코딩 장치는 상기 현재 블록의 템플릿 및 상기 현재 블록의 상기 템플릿과 대응하는 L0 템플릿 및 L1 템플릿을 기반으로 상기 L0 가중치 및 상기 L1 가중치를 도출할 수 있다. 디코딩 장치는 상기 현재 블록의 주변 샘플들을 기반으로 상기 현재 블록의 템플릿(template)을 도출할 수 있고, 상기 현재 블록의 상기 템플릿에 대응하는 L0 템플릿을 도출하되, 상기 L0 템플릿은 상기 L0 참조 샘플을 포함하는 L0 참조 블록의 주변 샘플들을 기반으로 도출될 수 있고, 상기 현재 블록의 상기 템플릿에 대응하는 L1 템플릿을 도출하되, 상기 L1 템플릿은 상기 L1 참조 샘플을 포함하는 L1 참조 블록의 주변 샘플들을 기반으로 도출될 수 있다. 상기 현재 블록의 템플릿은 상기 현재 블록의 좌측 주변 샘플들 및 상측 주변 샘플들을 포함할 수 있고, 상기 L0 템플릿은 상기 L0 참조 블록의 좌측 주변 샘플들 및 상측 주변 샘플들을 포함할 수 있고, 상기 L1 템플릿은 상기 L1 참조 블록의 좌측 주변 샘플들 및 상측 주변 샘플들을 포함할 수 있다. 디코딩 장치는 복수의 L0 가중치 후보 및 L1 가중치 후보 조합들을 기반으로 상기 L0 템플릿 및 상기 L1 템플릿을 가중합하여 복수의 가중합된 템플릿들을 도출할 수 있고, 상기 복수의 가중합된 템플릿들 각각에 대한 상기 현재 블록의 템플릿과의 코스트를 도출할 수 있다. 디코딩 장치는 상기 코스트들 중 최소인 코스트에 관한 L0 가중치 후보 및 L1 가중치 후보를 각각 상기 L0 가중치 및 상기 L1 가중치로 도출할 수 있다. 여기서, 상기 가중합된 템플릿은 L0 가중치 후보가 적용된 상기 L0 템플릿과 L1 가중치 후보가 적용된 상기 L1 템플릿의 대응하는 샘플들간의 합으로 도출될 수 있다. 또한, 상기 코스트는 상기 현재 블록의 템플릿과 상기 가중합된 템플릿 사이의 대응하는 샘플들간의 SAD(sum of absolute differences)로 나타낼 수 있다. 또한, 상기 코스트는 상술한 수학식 4를 기반으로 도출될 수 있다. 즉, 상기 L0 가중치 및 상기 L1 가중치는 상술한 수학식 4를 기반으로 도출될 수 있다.
또한, 상술한 방법들을 복합적으로 사용하여 상기 가중치들이 도출될 수 있다. 구체적으로, 상술한 상기 현재 블록에 대한 주변 블록의 움직임 정보, 즉, 상기 머지 후보의 가중치를 그대로 상기 현재 블록의 가중치로 사용하는 방법과 POC 차이를 기반으로 상기 가중치를 도출하는 방법이 경우에 따라 선택적으로 적용될 수도 있고, 상기 POC 차이를 기반으로 상기 가중치를 도출하는 방법과 상기 현재 블록 및 참조 블록의 템플릿들을 기반으로 상기 가중치를 도출하는 방법이 경우에 따라 선택적으로 적용될 수도 있다.
일 예로, 상기 제1 차이 및 상기 제2 차이가 동일한 경우, L0 가중치 및 L1 가중치는 1/2로 도출될 수 있고, 상기 제1 차이와 상기 제2 차이가 동일하지 않은 경우, 상술한 상기 현재 블록의 템플릿, 상기 L0 템플릿 및 상기 L1 템플릿을 기반으로 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치를 도출하는 방법이 적용될 수 있다.
또한, 다른 예로, 상기 현재 블록의 움직임 정보를 위하여 선택된 상기 머지 후보가 상기 현재 블록의 공간적 주변 블록의 움직임 정보인 경우, 상기 머지 후보의 L0 가중치 및 L1 가중치가 각각 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치로 적용될 수 있고, 선택된 상기 머지 후보가 공간적 주변 블록의 움직임 정보가 아닌 경우, 상기 현재 블록의 L0 가중치 및 L1 가중치는 1/2로 도출될 수 있다.
또한, 다른 예로, 또한, 다른 예로, 상기 현재 블록의 움직임 정보를 위하여 선택된 상기 머지 후보가 상기 현재 블록의 공간적 주변 블록의 움직임 정보인 경우, 상기 머지 후보의 L0 가중치 및 L1 가중치가 각각 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치로 적용될 수 있고, 선택된 상기 머지 후보가 공간적 주변 블록의 움직임 정보가 아닌 경우, 상술한 상기 현재 블록의 템플릿, 상기 L0 템플릿 및 상기 L1 템플릿을 기반으로 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치를 도출하는 방법이 적용될 수 있다.
디코딩 장치는 상기 L0 가중치 및 상기 L1 가중치를 기반으로 상기 L0 참조 샘플과 상기 L1 참조 샘플을 가중합(weighted sum)하여 상기 현재 블록의 예측 샘플을 생성한다(S970). 디코딩 장치는 상기 L0 참조 샘플에 상기 L0 가중치를 적용할 수 있고, 상기 L1 참조 샘플에 상기 L1 가중치를 적용할 수 있다. 다음으로, 디코딩 장치는 상기 L0 가중치가 적용된 상기 L0 참조 샘플과 상기 L1 가중치가 적용된 상기 L1 참조 샘플을 더하여 상기 예측 샘플을 생성할 수 있다. 상기 예측 샘플은 상술한 수학식 2를 기반으로 생성될 수 있다.
한편, 비록 도면에서 도시되지는 않았으나 디코딩 장치는 예측 모드에 따라 상기 예측 샘플을 바로 복원 샘플로 이용할 수도 있고, 또는 상기 예측 샘플에 레지듀얼 샘플을 더하여 복원 샘플을 생성할 수도 있다. 디코딩 장치는 상기 현재 블록에 대한 레지듀얼 샘플이 존재하는 경우, 상기 비트스트림으로부터 상기 현재 블록에 대한 레지듀얼에 관한 정보를 수신할 수 있다. 상기 레지듀얼에 관한 정보는 상기 레지듀얼 샘플에 관한 변환 계수를 포함할 수 있다. 디코딩 장치는 상기 레지듀얼 정보를 기반으로 상기 현재 블록에 대한 상기 레지듀얼 샘플(또는 레지듀얼 샘플 어레이)을 도출할 수 있다. 디코딩 장치는 상기 예측 샘플과 상기 레지듀얼 샘플을 기반으로 복원 샘플을 생성할 수 있고, 상기 복원 샘플을 기반으로 복원 블록 또는 복원 픽처를 도출할 수 있다. 이후 디코딩 장치는 필요에 따라 주관적/객관적 화질을 향상시키기 위하여 디블록킹 필터링 및/또는 SAO 절차와 같은 인루프 필터링 절차를 상기 복원 픽처에 적용할 수 있음은 상술한 바와 같다.
상술한 본 발명에 따르면 현재 블록에 대한 L0 움직임 정보 및 L1 움직임 정보에 대한 가중치들을 기반으로 인터 예측을 수행할 수 있고, 이를 통하여 상기 현재 블록에 대한 예측 정확도를 향상시킬 수 있다.
또한, 본 발명에 따르면 현재 블록에 대한 L0 움직임 정보 및 L1 움직임 정보에 대한 가중치들을 위한 부가 정보의 데이터량을 줄일 수 있고, 이를 통하여 전반적인 코딩 효율을 향상시킬 수 있다.
상술한 실시예에서, 방법들은 일련의 단계 또는 블록으로써 순서도를 기초로 설명되고 있지만, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 당업자라면 순서도에 나타내어진 단계들이 배타적이지 않고, 다른 단계가 포함되거나 순서도의 하나 또는 그 이상의 단계가 본 발명의 범위에 영향을 미치지 않고 삭제될 수 있음을 이해할 수 있을 것이다.
상술한 본 발명에 따른 방법은 소프트웨어 형태로 구현될 수 있으며, 본 발명에 따른 인코딩 장치 및/또는 디코딩 장치는 예를 들어 TV, 컴퓨터, 스마트폰, 셋톱박스, 디스플레이 장치 등의 영상 처리를 수행하는 장치에 포함될 수 있다.
본 발명에서 실시예들이 소프트웨어로 구현될 때, 상술한 방법은 상술한 기능을 수행하는 모듈(과정, 기능 등)로 구현될 수 있다. 모듈은 메모리에 저장되고, 프로세서에 의해 실행될 수 있다. 메모리는 프로세서 내부 또는 외부에 있을 수 있고, 잘 알려진 다양한 수단으로 프로세서와 연결될 수 있다. 프로세서는 ASIC(application-specific integrated circuit), 다른 칩셋, 논리 회로 및/또는 데이터 처리 장치를 포함할 수 있다. 메모리는 ROM(read-only memory), RAM(random access memory), 플래쉬 메모리, 메모리 카드, 저장 매체 및/또는 다른 저장 장치를 포함할 수 있다.
Claims (15)
- 디코딩 장치에 의하여 수행되는 영상 디코딩 방법에 있어서,현재 블록에 대한 머지 인덱스를 파싱하는 단계;상기 현재 블록의 주변 블록들을 기반으로 머지 후보 리스트를 구성하는 단계;상기 머지 후보 리스트에 포함된 머지 후보들 중 상기 머지 인덱스가 가리키는 머지 후보를 선택하는 단계;상기 선택된 머지 후보를 기반으로 상기 현재 블록의 L0 움직임 정보 및 L1 움직임 정보를 도출하는 단계;상기 L0 움직임 정보를 기반으로 L0 참조 샘플을 도출하는 단계;상기 L1 움직임 정보를 기반으로 L1 참조 샘플을 도출하는 단계;상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 단계; 및상기 L0 가중치 및 상기 L1 가중치를 기반으로 상기 L0 참조 샘플과 상기 L1 참조 샘플을 가중합(weighted sum)하여 상기 현재 블록의 예측 샘플을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 디코딩 방법.
- 제1항에 있어서,상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 단계는,상기 선택된 머지 후보의 L0 가중치를 상기 현재 블록의 상기 L0 가중치로 도출하는 단계; 및상기 선택된 머지 후보의 L1 가중치를 상기 현재 블록의 상기 L1 가중치로 도출하는 단계를 포함하는 것을 특징으로 하는 영상 디코딩 방법.
- 제1항에 있어서,상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 단계는,상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 값들 중 최빈값을 상기 현재 블록의 상기 L0 가중치로 도출하는 단계; 및상기 머지 후보 리스트에 포함된 머지 후보들의 L1 가중치들의 값들 중 최빈값을 상기 현재 블록의 상기 L1 가중치로 도출하는 단계를 포함하는 것을 특징으로 하는 영상 디코딩 방법.
- 제1항에 있어서,상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 단계는,상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 평균값을 도출하는 단계;상기 머지 후보 리스트에 포함된 머지 후보들의 L1 가중치들의 평균값을 도출하는 단계;상기 L0 가중치들의 상기 평균값을 상기 현재 블록의 상기 L0 가중치로 도출하는 단계; 및상기 L1 가중치들의 상기 평균값을 상기 현재 블록의 상기 L1 가중치로 도출하는 단계를 포함하는 것을 특징으로 하는 영상 디코딩 방법.
- 제1항에 있어서,상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 단계는,상기 머지 후보 리스트에 포함된 머지 후보들의 L0 가중치들의 중간값을 도출하는 단계;상기 머지 후보 리스트에 포함된 머지 후보들의 L1 가중치들의 중간값을 도출하는 단계;상기 L0 가중치들의 상기 중간값을 상기 현재 블록의 상기 L0 가중치로 도출하는 단계; 및상기 L1 가중치들의 상기 중간값을 상기 현재 블록의 상기 L1 가중치로 도출하는 단계를 포함하는 것을 특징으로 하는 영상 디코딩 방법.
- 제1항에 있어서,상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 단계는,L0 가중치 후보 및 L1 가중치 후보의 조합들 중 하나를 가리키는 가중치 인덱스를 파싱하는 단계; 및상기 조합들 중 상기 가중치 인덱스가 가리키는 조합의 L0 가중치 후보 및 L1 가중치 후보를 각각 상기 L0 가중치 및 상기 L1 가중치로 도출하는 단계를 포함하는 것을 특징으로 하는 영상 디코딩 방법.
- 제6항에 있어서,상기 현재 블록에 머지 모드가 적용되는지 여부를 나타내는 머지 플래그를 파싱하는 단계를 더 포함하되,상기 가중치 인덱스는 상기 머지 플래그의 값이 1인 경우에만 파싱되는 것을 특징으로 하는 영상 디코딩 방법.
- 제6항에 있어서,상기 머지 후보들 중 적어도 하나를 기반으로 L0 가중치 예측자 및 L1 가중치 예측자를 도출하는 단계를 더 포함하되,상기 가중치 인덱스는 상기 조합들에 대한 인덱스 값들 중 상기 L0 가중치 예측자 및 L1 가중치 예측자에 대응하는 인덱스 값과 상기 현재 블록의 상기 L0 가중치 및 상기 L1 가중치에 대한 인덱스 값과의 차분값을 나타내는 것을 특징으로 하는 영상 디코딩 방법.
- 제8항에 있어서,상기 선택된 머지 후보의 L0 가중치 및 L1 가중치가 각각 상기 L0 가중치 예측자 및 상기 L1 가중치 예측자로 도출되는 것을 특징으로 하는 영상 디코딩 방법.
- 제8항에 있어서,상기 가중치 인덱스를 나타내는 이진화 코드(binary code)는 상기 차분값을 기반으로 가변 길이의 비트들이 할당되는 것을 특징으로 하는 영상 디코딩 방법.
- 제1항에 있어서,상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 단계는,현재 픽처의 POC(picture order count)와 상기 L0 참조 샘플이 위치하는 L0 참조 픽처의 POC와의 제1 차이를 도출하는 단계;상기 현재 픽처의 POC와 상기 L1 참조 샘플이 위치하는 L1 참조 픽처의 POC 와의 제2 차이를 도출하는 단계;상기 제1 차이와 상기 제2 차이와의 비율을 기반으로 상기 L0 가중치 및 상기 L1 가중치를 도출하는 단계를 포함하는 것을 특징으로 하는 영상 디코딩 방법.
- 제1항에 있어서,상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하는 단계는,상기 현재 블록의 주변 샘플들을 기반으로 상기 현재 블록의 템플릿(template)을 도출하는 단계;상기 현재 블록의 상기 템플릿에 대응하는 L0 템플릿을 도출하되, 상기 L0 템플릿은 상기 L0 참조 샘플을 포함하는 L0 참조 블록의 주변 샘플들을 기반으로 도출되는 것을 특징으로 하는 단계;상기 현재 블록의 상기 템플릿에 대응하는 L1 템플릿을 도출하되, 상기 L1 템플릿은 상기 L1 참조 샘플을 포함하는 L1 참조 블록의 주변 샘플들을 기반으로 도출되는 것을 특징으로 하는 단계;복수의 L0 가중치 후보 및 L1 가중치 후보 조합들을 기반으로 상기 L0 템플릿 및 상기 L1 템플릿을 가중합하여 복수의 가중합된 템플릿들을 도출하는 단계;상기 복수의 가중합된 템플릿들 각각에 대한 상기 현재 블록의 템플릿과의 코스트를 도출하는 단계;상기 코스트들 중 최소인 코스트에 관한 L0 가중치 후보 및 L1 가중치 후보를 각각 상기 L0 가중치 및 상기 L1 가중치로 도출하는 단계를 포함하는 것을 특징으로 하는 영상 디코딩 방법.
- 영상 디코딩을 수행하는 디코딩 장치에 있어서,현재 블록에 대한 머지 인덱스를 파싱하는 엔트로피 디코딩부; 및상기 현재 블록의 주변 블록들을 기반으로 머지 후보 리스트를 구성하고, 상기 머지 후보 리스트에 포함된 머지 후보들 중 상기 머지 인덱스가 가리키는 머지 후보를 선택하고, 상기 선택된 머지 후보를 기반으로 L0 움직임 정보 및 L1 움직임 정보를 도출하고, 상기 L0 움직임 정보를 기반으로 L0 참조 샘플을 도출하고, 상기 L1 움직임 정보를 기반으로 L1 참조 샘플을 도출하고, 상기 현재 블록의 L0 가중치 및 L1 가중치를 도출하고, 상기 L0 가중치 및 상기 L1 가중치를 기반으로 상기 L0 참조 샘플과 상기 L1 참조 샘플을 가중합(weighted sum)하여 상기 현재 블록의 예측 샘플을 생성하는 예측부를 포함하는 것을 특징으로 하는 디코딩 장치.
- 제14항에 있어서,상기 예측부는 상기 머지 후보의 L0 가중치를 상기 현재 블록의 상기 L0 가중치로 도출하고, 상기 머지 후보의 L1 가중치를 상기 현재 블록의 상기 L1 가중치로 도출하는 것을 특징으로 하는 디코딩 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/340,463 US10750190B2 (en) | 2016-10-11 | 2017-06-09 | Video decoding method and device in video coding system |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662406411P | 2016-10-11 | 2016-10-11 | |
US62/406,411 | 2016-10-11 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2018070632A1 true WO2018070632A1 (ko) | 2018-04-19 |
Family
ID=61905816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2017/005999 WO2018070632A1 (ko) | 2016-10-11 | 2017-06-09 | 영상 코딩 시스템에서 영상 디코딩 방법 및 장치 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10750190B2 (ko) |
WO (1) | WO2018070632A1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110662041A (zh) * | 2018-06-29 | 2020-01-07 | 北京字节跳动网络技术有限公司 | 扩展Merge模式与其他视频编码工具之间的交互 |
WO2020130714A1 (ko) * | 2018-12-21 | 2020-06-25 | 주식회사 엑스리스 | 영상 신호 부호화/복호화 방법 및 이를 위한 장치 |
CN114631318A (zh) * | 2019-06-14 | 2022-06-14 | Lg电子株式会社 | 应用双向预测时推导用于加权平均的权重索引信息的图像解码方法和设备 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110710210B (zh) * | 2017-10-20 | 2023-08-04 | 株式会社Kt | 视频信号处理方法及装置 |
CN118921488A (zh) * | 2018-03-14 | 2024-11-08 | Lx 半导体科技有限公司 | 图像编码/解码设备和发送图像数据的设备 |
KR102738271B1 (ko) | 2018-06-05 | 2024-12-04 | 두인 비전 컴퍼니 리미티드 | Ibc 및 atmvp 간의 상호 작용 |
US11153599B2 (en) | 2018-06-11 | 2021-10-19 | Mediatek Inc. | Method and apparatus of bi-directional optical flow for video coding |
CN113115046A (zh) | 2018-06-21 | 2021-07-13 | 北京字节跳动网络技术有限公司 | 分量相关的子块分割 |
WO2019244117A1 (en) | 2018-06-21 | 2019-12-26 | Beijing Bytedance Network Technology Co., Ltd. | Unified constrains for the merge affine mode and the non-merge affine mode |
EP3806472A1 (en) * | 2018-06-30 | 2021-04-14 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Merge mode-based inter-prediction method and apparatus |
EP3834416A4 (en) * | 2018-08-17 | 2022-08-17 | HFI Innovation Inc. | Methods and apparatuses of video processing with bi-direction predicition in video coding systems |
CN110858901B (zh) * | 2018-08-24 | 2023-01-20 | 北京字节跳动网络技术有限公司 | 使用时域邻居的重叠块运动补偿 |
CN110944170B (zh) * | 2018-09-24 | 2023-05-02 | 北京字节跳动网络技术有限公司 | 扩展Merge预测 |
WO2020094149A1 (en) | 2018-11-10 | 2020-05-14 | Beijing Bytedance Network Technology Co., Ltd. | Rounding in triangular prediction mode |
GB2579824B (en) * | 2018-12-14 | 2022-05-18 | British Broadcasting Corp | Video encoding and video decoding |
CN117321992A (zh) * | 2021-04-09 | 2023-12-29 | 抖音视界有限公司 | 自适应运动候选列表 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090238269A1 (en) * | 2006-07-06 | 2009-09-24 | Purvin Bibhas Pandit | Method and Apparatus for Decoupling Frame Number and/or Picture Order Count (POC) for Multi-View Video Encoding and Decoding |
US20110261882A1 (en) * | 2008-04-11 | 2011-10-27 | Thomson Licensing | Methods and apparatus for template matching prediction (tmp) in video encoding and decoding |
US20140233651A1 (en) * | 2011-10-31 | 2014-08-21 | JVC Kenwood Corporation | Moving picture coding device, moving picture coding method, moving picture coding program, transmitting device, transmitting method and transmitting program, and moving picture decoding device, moving picture decoding method, moving picture decoding program, receiving device, receiving method and receiving program |
KR20150052259A (ko) * | 2012-09-07 | 2015-05-13 | 퀄컴 인코포레이티드 | 스케일러블 비디오 코딩을 위한 가중된 예측 모드 |
KR101571341B1 (ko) * | 2008-02-05 | 2015-11-25 | 톰슨 라이센싱 | 비디오 인코딩 및 디코딩시 묵시적 블록 분할을 위한 방법 및 장치 |
KR20160033884A (ko) * | 2014-09-18 | 2016-03-29 | (주)이더블유비엠 | 영상잡음 제거방법 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9866859B2 (en) * | 2011-06-14 | 2018-01-09 | Texas Instruments Incorporated | Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding |
WO2012173439A2 (ko) * | 2011-06-15 | 2012-12-20 | 한국전자통신연구원 | 스케일러블 비디오 코딩 및 디코딩 방법과 이를 이용한 장치 |
TWI612799B (zh) * | 2012-10-12 | 2018-01-21 | 韓國電子通信研究院 | 視訊編碼及解碼方法及使用該方法之裝置 |
-
2017
- 2017-06-09 US US16/340,463 patent/US10750190B2/en active Active
- 2017-06-09 WO PCT/KR2017/005999 patent/WO2018070632A1/ko active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090238269A1 (en) * | 2006-07-06 | 2009-09-24 | Purvin Bibhas Pandit | Method and Apparatus for Decoupling Frame Number and/or Picture Order Count (POC) for Multi-View Video Encoding and Decoding |
KR101571341B1 (ko) * | 2008-02-05 | 2015-11-25 | 톰슨 라이센싱 | 비디오 인코딩 및 디코딩시 묵시적 블록 분할을 위한 방법 및 장치 |
US20110261882A1 (en) * | 2008-04-11 | 2011-10-27 | Thomson Licensing | Methods and apparatus for template matching prediction (tmp) in video encoding and decoding |
US20140233651A1 (en) * | 2011-10-31 | 2014-08-21 | JVC Kenwood Corporation | Moving picture coding device, moving picture coding method, moving picture coding program, transmitting device, transmitting method and transmitting program, and moving picture decoding device, moving picture decoding method, moving picture decoding program, receiving device, receiving method and receiving program |
KR20150052259A (ko) * | 2012-09-07 | 2015-05-13 | 퀄컴 인코포레이티드 | 스케일러블 비디오 코딩을 위한 가중된 예측 모드 |
KR20160033884A (ko) * | 2014-09-18 | 2016-03-29 | (주)이더블유비엠 | 영상잡음 제거방법 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110662041A (zh) * | 2018-06-29 | 2020-01-07 | 北京字节跳动网络技术有限公司 | 扩展Merge模式与其他视频编码工具之间的交互 |
CN110662041B (zh) * | 2018-06-29 | 2022-07-29 | 北京字节跳动网络技术有限公司 | 视频比特流处理的方法和装置,存储视频比特流的方法和非暂时性计算机可读记录介质 |
WO2020130714A1 (ko) * | 2018-12-21 | 2020-06-25 | 주식회사 엑스리스 | 영상 신호 부호화/복호화 방법 및 이를 위한 장치 |
US11140391B2 (en) | 2018-12-21 | 2021-10-05 | Xris Corporation | Video signal encoding/decoding method, and device therefor |
US12075044B2 (en) | 2018-12-21 | 2024-08-27 | Xris Corporation | Video signal encoding/decoding method, and device therefor |
CN114631318A (zh) * | 2019-06-14 | 2022-06-14 | Lg电子株式会社 | 应用双向预测时推导用于加权平均的权重索引信息的图像解码方法和设备 |
US12166971B2 (en) | 2019-06-14 | 2024-12-10 | Lg Electronics Inc. | Image decoding method and apparatus for deriving weight index information for weighted average when bi-prediction is applied |
Also Published As
Publication number | Publication date |
---|---|
US20200053364A1 (en) | 2020-02-13 |
US10750190B2 (en) | 2020-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018070632A1 (ko) | 영상 코딩 시스템에서 영상 디코딩 방법 및 장치 | |
WO2017052081A1 (ko) | 영상 코딩 시스템에서 인터 예측 방법 및 장치 | |
WO2017034331A1 (ko) | 영상 코딩 시스템에서 크로마 샘플 인트라 예측 방법 및 장치 | |
WO2017043786A1 (ko) | 비디오 코딩 시스템에서 인트라 예측 방법 및 장치 | |
WO2018117546A1 (ko) | 비디오 신호 처리 방법 및 장치 | |
WO2018062921A1 (ko) | 영상 코딩 시스템에서 블록 분할 및 인트라 예측 방법 및 장치 | |
WO2017069590A1 (ko) | 영상 코딩 시스템에서 모델링 기반 영상 디코딩 방법 및 장치 | |
WO2016200043A1 (ko) | 비디오 코딩 시스템에서 가상 참조 픽처 기반 인터 예측 방법 및 장치 | |
WO2018021585A1 (ko) | 영상 코딩 시스템에서 인트라 예측 방법 및 장치 | |
WO2018062702A1 (ko) | 영상 코딩 시스템에서 인트라 예측 방법 및 장치 | |
WO2013069975A1 (ko) | 예측 단위의 파티션 모드에 기초한 계수 스캔 방법 및 장치 | |
WO2018056709A1 (ko) | 영상 코딩 시스템에서 인터 예측 방법 및 장치 | |
WO2019112071A1 (ko) | 영상 코딩 시스템에서 크로마 성분의 효율적 변환에 기반한 영상 디코딩 방법 및 장치 | |
WO2018174357A1 (ko) | 영상 코딩 시스템에서 영상 디코딩 방법 및 장치 | |
WO2016204374A1 (ko) | 영상 코딩 시스템에서 영상 필터링 방법 및 장치 | |
WO2017188565A1 (ko) | 영상 코딩 시스템에서 영상 디코딩 방법 및 장치 | |
WO2018066791A1 (ko) | 영상 코딩 시스템에서 영상 디코딩 방법 및 장치 | |
WO2017048008A1 (ko) | 영상 코딩 시스템에서 인터 예측 방법 및 장치 | |
WO2017195914A1 (ko) | 비디오 코딩 시스템에서 인터 예측 방법 및 장치 | |
WO2019194507A1 (ko) | 어파인 움직임 예측에 기반한 영상 코딩 방법 및 그 장치 | |
WO2017057877A1 (ko) | 영상 코딩 시스템에서 영상 필터링 방법 및 장치 | |
WO2018128222A1 (ko) | 영상 코딩 시스템에서 영상 디코딩 방법 및 장치 | |
WO2018128223A1 (ko) | 영상 코딩 시스템에서 인터 예측 방법 및 장치 | |
WO2017052272A1 (ko) | 비디오 코딩 시스템에서 인트라 예측 방법 및 장치 | |
WO2020141932A1 (ko) | Cpr 기반 mmvd를 이용하는 인터 예측 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 17860160 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 17860160 Country of ref document: EP Kind code of ref document: A1 |