RU2710667C1 - Способ и устройство привязки к текущему изображению для кодирования видео - Google Patents
Способ и устройство привязки к текущему изображению для кодирования видео Download PDFInfo
- Publication number
- RU2710667C1 RU2710667C1 RU2018145683A RU2018145683A RU2710667C1 RU 2710667 C1 RU2710667 C1 RU 2710667C1 RU 2018145683 A RU2018145683 A RU 2018145683A RU 2018145683 A RU2018145683 A RU 2018145683A RU 2710667 C1 RU2710667 C1 RU 2710667C1
- Authority
- RU
- Russia
- Prior art keywords
- block
- blocks
- cpr
- luma
- luminance
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 36
- 241000023320 Luma <angiosperm> Species 0.000 claims description 67
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 67
- 239000013598 vector Substances 0.000 claims description 29
- 235000019557 luminance Nutrition 0.000 description 84
- 238000000926 separation method Methods 0.000 description 30
- 230000000875 corresponding effect Effects 0.000 description 27
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 11
- 230000002596 correlated effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000009795 derivation Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000000638 solvent extraction Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 2
- 101150114515 CTBS gene Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Изобретение относится к кодированию и декодированию видео и предназначено для системы кодирования, использующей привязку к текущему изображению (CPR). Технический результат – повышение эффективности кодирования. В соответствии с данным способом блоки яркости и цветности текущего изображения совместно кодируются с использованием одной и той же структуры ячейки кодирования (CU), если режим CPR выбран для блоков яркости и цветности. В других случаях, если компоненты яркости и цветности разделены на блоки яркости и цветности по отдельности с использованием отдельных структур CU, блоки яркости и цветности кодируются или декодируются с использованием режима кодирования, выбранного из группы режимов кодирования, исключая режим CPR. В соответствии с другим способом, блоки яркости и цветности текущего изображения кодируются по отдельности с использованием другой структуры CU, если режим CPR выбран для блоков яркости и цветности. В еще одном способе реконструированные эталонные данные раскрыты для режима CPR с CU, равным PU. 2 н. и 13 з.п. ф-лы, 13 ил., 1 табл.
Description
ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ
Настоящее изобретение заявляет приоритет на основании предварительной патентной заявки США, серийный номер 62/342,883, поданной 28 мая 2016 г. Предварительная патентная заявка США полностью включена в настоящую заявку посредством ссылки.
ОБЛАСТЬ ТЕХНИКИ
Настоящее изобретение относится к разделению на блоки для процесса кодирования и / или прогнозирования в кодировании видео. В частности, настоящее изобретение раскрывает различные схемы кодирования для системы кодирования, использующей привязку к текущему изображению (CPR).
УРОВЕНЬ ТЕХНИКИ
Стандарт высокоэффективного видеокодирования (HEVC) разработан в рамках совместного видеопроекта МСЭ-Т Группой экспертов по видеокодированию (VCEG) и Группой экспертов по движущимся изображениям (MPEG) ISO / IEC, в рамках партнерства, известного как Объединенная команда по видеокодированию (JCT-VC). В HEVC один срез разделяется на множество ячеек кодового дерева (CTU). В основном профиле минимальный и максимальный размеры CTU определяются элементами синтаксиса в наборе последовательностных параметров (SPS). Допустимый размер CTU может составлять 8x8, 16x16, 32x32 или 64x64. Для каждого среза CTU в срезе обрабатываются в соответствии с порядком растровой развертки.
CTU дополнительно разделяется на множество ячеек кодирования (CU) для адаптации к различным локальным характеристикам. Дерево квадрантов, обозначаемое как кодовое дерево, используется для разделения CTU на множество CU. Допустим, размер CTU будет составлять MxM, где M — одно из значений: 64, 32 или 16. CTU может быть одной CU (т. е. без разделения) или может быть разделена на четыре меньших ячейки равных размеров (т. е. M/2xM/2 каждая), которые соответствуют узлам кодового дерева. Если ячейки являются конечными узлами кодового дерева, то ячейки становятся CU. В противном случае процесс разделения дерева квадрантов может повторяться до тех пор, пока размер узла не достигнет минимально допустимого размера CU, как указано в SPS (набор последовательностных параметров). Это представление приводит к рекурсивной структуре, как указано кодовым деревом (также называемым разделенной структурой дерева) 120 на фиг. 1. Разделение 110 CTU показано на фиг. 1, где сплошными линиями обозначены границы CU. Решение о том, кодировать ли область изображения с использованием межкадрового (временного) или внутрикадрового (пространственного) прогнозирования, принимается на уровне CU. Поскольку минимальный размер CU может составлять 8x8, минимальная степень детализации для переключения между различными основными типами прогнозирования составляет 8x8.
Кроме того, в соответствии с HEVC каждая CU может быть разделена на одну или более ячеек прогнозирования (PU). В сочетании с CU, PU работает в качестве базового представительного блока для обмена информацией о прогнозировании. Внутри каждой PU применяется один и тот же процесс прогнозирования, и соответствующая информация передается в декодер на основе PU. CU может быть разделена на один, два или четыре PU в соответствии с типом разделения PU. HEVC определяет восемь форм для разделения CU на PU, как показано на фиг. 2, включая 2Nx2N, 2NxN, Nx2N, NxN, 2NxnU, 2NxnD, nLx2N и nRx2N. В отличие от CU, PU может быть разделена только один раз в соответствии с HEVC. Разделы, показанные во второй строке, соответствуют асимметричным разделам, где две разделенные части имеют разные размеры.
После получения остаточного блока процессом прогнозирования на основе типа разделения PU остатки прогнозирования CU могут быть разделены на ячейки преобразования (TU) в соответствии с другой структурой дерева квадрантов, которая аналогична кодовому дереву для CU, как показано на фиг. 1. Сплошными линиями обозначены границы CU, а пунктирными линиями обозначены границы TU. TU является базовым представительным блоком с остаточными коэффициентами или коэффициентами преобразования для применения целочисленного преобразования и квантования. Для каждой TU применяется одно целочисленное преобразование с таким же размером, как и у TU, для получения остаточных коэффициентов. Эти коэффициенты передаются в декодер после квантования на основе TU.
Термины «блок кодового дерева» (CTB), «блок кодирования» (CB), блок прогнозирования (PB) и блок преобразования (TB) определены для указания двухмерного массива образцов одного компонента цветности, связанного с CTU, CU, PU и TU, соответственно. Таким образом, CTU состоит из одного CTB яркости, двух CTB цветности и связанных элементов синтаксиса. Аналогичное соотношение действительно и для CU, PU и TU. Разделение дерева обычно применяется одновременно как к яркости, так и к цветности, хотя исключения применяются, когда достигаются определенные минимальные размеры для цветности.
В других случаях в JCTVC-P1005 предложена структура двоичного разделения блоков дерева (D. Flynn, et al, «HEVC Range Extensions Draft 6», Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 16-я конференция: Сан-Хосе, США, 9-17 января 2014, документ: JCTVC-P1005). В предложенной структуре двоичного разделения дерева блок может быть рекурсивно разделен на два меньших блока с использованием различных типов двоичного разделения, как показано на фиг. 3. Наиболее эффективными и простыми являются симметричное горизонтальное и вертикальное разделение, как показано в двух верхних типах разделения на фиг. 3. Для данного блока размером MxN сигнализируется флаг, указывающий, разделен ли данный блок на два меньших блока. Если да, другой синтаксический элемент сигнализируется, чтобы указать, какой тип разделения используется. Если используется горизонтальное разделение, данный блок разделяется на два блока размером MxN/2. Если используется вертикальное разделение, данный блок разделяется на два блока размером M/2xN. Процесс двоичного разделения дерева может повторяться до тех пор, пока размер (ширина или высота) блока разделения не достигнет минимально допустимого размера блока (ширина или высота). Минимально допустимый размер блока может быть определен в синтаксисе высокого уровня, таком как SPS. Поскольку двоичное дерево имеет два типа разделения (т. е. горизонтальное и вертикальное), должны быть указаны минимально допустимые значения как ширины, так и высоты блока. Негоризонтальное разделение подразумевается, когда разделение приведет к тому, что высота блока будет меньше указанного минимума. Невертикальное разделение подразумевается, когда разделение приведет к тому, что ширина блока будет меньше указанного минимума. На фиг. 4 показан пример разделения 410 на блоки и соответствующее ему двоичное дерево 420. В каждом разделяемом узле (т. е. не конечном узле) двоичного дерева один флаг используется, чтобы указать, какой тип разделения (горизонтальный или вертикальный) используется, где 0 может обозначать горизонтальное разделение, а 1 может обозначать вертикальное разделение.
Структура двоичного дерева может использоваться для разделения области изображения на множество меньших блоков, такое как разделение среза на CTU, CTU на CU, CU на PU или CU на TU и т. д. Двоичное дерево может быть использовано для разделения CTU на CU, где корневым узлом двоичного дерева является CTU, а конечным узлом двоичного дерева является CU. Конечные узлы могут быть дополнительно обработаны путем кодирования прогнозирования и преобразования. Для упрощения, отсутствует дальнейшее разделение CU на PU или CU на TU, что означает, что CU равна PU, и PU равна TU. Таким образом, другими словами, конечный узел двоичного дерева является базовой единицей для кодирования прогнозирования и преобразования.
Структура двоичного дерева является более гибкой, чем структура дерева квадрантов, поскольку может поддерживаться большее количество форм разделения, что также является источником повышения эффективности кодирования. Однако сложность кодирования также возрастет, чтобы выбрать лучшую форму раздела. Чтобы сбалансировать сложность и эффективность кодирования, раскрыт способ объединения структуры дерева квадрантов и двоичного дерева, который также называется структурой «дерево квадрантов плюс двоичное дерево» (QTBT). В соответствии со структурой QTBT, блок сначала разделяется структурой дерева квадрантов, и разделение дерева квадрантов может повторяться до тех пор, пока размер разделяемого блока не достигнет минимально допустимого размера конечного узла дерева квадрантов. Если конечный блок дерева квадрантов не превышает максимально допустимый размер корневого узла двоичного дерева, он может быть дополнительно разделен структурой двоичного дерева, и разделение двоичного дерева может повторяться до тех пор, пока размер (ширина или высота) разделяемого блока не достигнет минимально допустимого размера конечного узла двоичного дерева (ширина или высота) или глубина двоичного дерева не достигнет максимально допустимой глубины двоичного дерева. В структуре QTBT минимальный допустимый размер конечного узла двоичного дерева, максимально допустимый размер корневого узла двоичного дерева, минимально допустимая ширина и высота конечного узла двоичного дерева могут указываться в синтаксисе высокого уровня, например, в SPS. На фиг. 5 показан пример разделения 510 на блоки и соответствующее ему QTBT 520. Сплошными линиями обозначено разделение дерева квадрантов, а пунктирными линиями обозначено разделение двоичного дерева. В каждом разделяемом узле (т. е. не конечном узле) двоичного дерева один флаг указывает, какой тип разделения (горизонтальный или вертикальный) используется, 0 может обозначать горизонтальное разделение, а 1 может обозначать вертикальное разделение.
Указанная выше структура QTBT может использоваться для разделения области изображения (например, срез, CTU или CU) на множество меньших блоков, такое как разделение среза на CTU, CTU на CU, CU на PU или CU на TU и т. д. Например, QTBT может использоваться для разделения CTU на CU, где корневым узлом QTBT является CTU, которая разделяется на множество CU структурой QTBT, и CU дополнительно обрабатываются посредством кодирования с прогнозированием и преобразованием. Для упрощения, отсутствует дальнейшее разделения CU на PU или CU. Это означает, что CU равна PU, а PU равна TU. Таким образом, другими словами, конечный узел структуры QTBT является базовой ячейкой для прогнозирования и преобразования.
Пример структуры QTBT показан следующим образом. Для CTU размером 128x128 минимально допустимый размер конечного узла дерева квадрантов задан равным 16x16, максимально допустимый размер корневого узла двоичного дерева задан равным 64x64, минимально допустимые ширина и высота конечного узла двоичного дерева заданы равными 4, и максимально допустимая глубина двоичного дерева задана равной 4. Во-первых, CTU разделяется структурой дерева квадрантов, и конечная ячейка дерева квадрантов может иметь размер от 16x16 (т. е. минимально допустимый размер конечного узла дерева квадрантов) до 128x128 (равный размеру CTU, т. е. без разделения). Если конечная ячейка дерева квадрантов — 128x128, она не может быть далее разделена двоичным деревом, поскольку размер превышает максимально допустимый размер корневого узла двоичного дерева 64x64. В противном случае, конечная ячейка дерева квадрантов может быть далее разделена двоичным деревом. Конечная ячейка дерева квадрантов, которая также является корневой ячейкой двоичного дерева, имеет глубину двоичного дерева, равную 0. Когда глубина двоичного дерева достигает 4 (т. е. максимально допустимая заданная глубина для двоичного дерева), не подразумевается никакого разделения. Когда блок соответствующего узла двоичного дерева имеет ширину, равную 4, подразумевается негоризонтальное разделение. Когда блок соответствующего узла двоичного дерева имеет высоту, равную 4, подразумевается невертикальное разделение. Конечные узлы QTBT дополнительно обрабатываются посредством кодирования прогнозирования (межкадровое или внутрикадровое) или преобразования.
Для I-среза структура дерева QTBT обычно применяется с раздельным кодированием яркости / цветности. Например, структура дерева QTBT применяется отдельно к компонентам яркости и цветности для I-среза и применяется одновременно как к яркости, так и к цветности (за исключением случаев, когда достигаются определенные минимальные размеры для цветности) для P- и B-срезов. Другими словами, в I-срезе CTB яркости имеет свое разделение QTBT-структурированных блоков, а два CTB цветности имеют другое разделение QTBT-структурных блоков. В другом примере два CTB цветности также могут иметь свои собственные разделы QTBT-структурированных блоков.
Для кодирования на основе блоков всегда существует необходимость разделять изображение на блоки (например, CU, PU и TU) для целей кодирования. Как известно в данной области техники, изображение может быть разделено на меньшие области изображений, такие как срезы, плитки, строки CTU или CTU перед применением разделения блока. Процесс разделения изображения на блоки для целей кодирования называется разделением изображения с использованием структуры ячеек кодирования (CU). Конкретный способ разделения для получения CU, PU и TU, принятый HEVC, является примером структуры ячеек кодирования (CU). Структура дерева QTBT является другим примером структуры ячеек кодирования (CU).
Привязка к текущему изображению
Оценка / компенсация движения является хорошо известной ключевой технологией в гибридном кодировании видео, которая использует пиксельную корреляцию между соседними изображениями. В видеопоследовательности движение объекта между соседними кадрами невелико, и движение объекта может быть смоделировано с помощью двумерного поступательного движения. Соответственно, схемы, соответствующие объектам или фону в кадре, смещаются для формирования соответствующих объектов в последующем кадре или коррелируют с другими схемами в текущем кадре. При оценке смещения (например, с использованием методов сопоставления блоков) схема может быть в основном воспроизведена без необходимости перекодирования схемы. Аналогичным образом, так же пытались сопоставлять и копировать блоки, чтобы позволить выбрать эталонный блок из одного и того же изображения. Было замечено, что подход оказался неэффективным при применении этой концепции к видео, снятым камерой. Частично причина состоит в том, что текстовая схема в пространственной соседней области может быть схожа с текущим блоком кодирования, но обычно с некоторыми постепенными изменениями в пространстве. Таким образом, блоку трудно найти точное совпадение на одном и том же изображении видео, снятого камерой. Следовательно, улучшение производительности кодирования ограничено.
Однако пространственная корреляция между пикселями в одном и том же изображении отличается для содержания экрана. Для типового видео с текстом и графикой на одном и том же изображении обычно присутствуют повторяющиеся схемы. Следовательно, внутриблочная (внутрикадровая) компенсация, видимо, может оказаться очень эффективной. Новый режим прогнозирования, т. е. режим внутриблочного копирования (IBC) или привязка к текущему изображению (CPR) был введен для кодирования содержания экрана, чтобы использовать эту характеристику. В режиме CPR ячейка прогнозирования (PU) прогнозируется из ранее реконструированного блока в том же изображении. Далее, вектор смещения (блок-вектор) (BV), используется для сигнализации относительного смещения от положения текущего блока в положение эталонного блока. Ошибки прогнозирования затем кодируются с использованием преобразования, квантования и энтропийного кодирования. Пример компенсации CPR показан на фиг. 6, где область 610 соответствует изображению, срезу или области изображения для кодирования. Блоки 620 и 630 соответствуют двум блокам для кодирования. В этом примере каждый блок может найти соответствующий блок в ранее закодированной области в текущем изображении (т. е. 622 и 632 соответственно). В соответствии с этой методикой эталонные образцы соответствуют реконструированным образцам текущего декодированного изображения перед операциями контурного фильтра, включающими в себя деблочный фильтр и фильтр адаптивного смещения образца (SAO) в HEVC.
Ранняя версия CPR была раскрыта в JCTVC-M0350 (Madhukar Budagavi и соавт., «AHG8: Video coding using Intra motion compensation», Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 13th Meeting: Incheon, KR, 18-26 Apr. 2013, Документ: JCTVC-M0350), который представлен как возможная технология для разработки HEVC Range Extensions (RExt). В JCTVC-M0350 компенсация CPR была ограничена в пределах небольшой локальной области, а поиск ограничен блок-вектором 1-D только для блока размером 2Nx2N. Позднее во время стандартизации HEVC SCC (кодирование содержания экрана) был разработан более усовершенствованный метод CPR.
Чтобы эффективно сигнализировать блок-вектор (BV), BV сигнализируется предиктивно с использованием предиктора BV (BVP) аналогично кодированию MV. Соответственно, разность BV (BVD) сигнализируется, и BV может быть реконструирован в соответствии с BV = BVP + BVD, как показано на фиг. 7, где эталонный блок 720 выбран в качестве прогнозирования IntraBC для текущего блока 710 (т. е. CU). BVP определяется для текущей CU. Способы получения предиктора вектора движения (MVP) известны в данной области техники. Подобная деривация может быть применена к деривации BVP.
Когда используется CPR, только часть текущего изображения может быть использована в качестве эталонного изображения. Некоторые ограничения соответствия битового потока налагаются для регулировки действительного значения MV, относящегося к текущему изображению.
Во-первых, должно выполняться одно из следующих условий:
BV_x + offsetX + nPbSw + xPbs - xCbs <= 0, и (1)
BV_y + offsetY + nPbSh + yPbs - yCbs <= 0. (2)
Во-вторых, должно выполняться следующее условие WPP (параллельная обработка фронта волны):
(xPbs + BV_x + offsetX + nPbSw - 1) / CtbSizeY - xCbs / CtbSizeY <=
yCbs / CtbSizeY - (yPbs + BV_y + offsetY + nPbSh - 1) / CtbSizeY (3)
В уравнениях (1) ... (3) (BV_x, BV_y) — блок-вектор яркости (т. е. вектор движения для CPR) для текущей PU; nPbSw и nPbSh — ширина и высота текущей PU; (xPbS, yPbs) — местоположение верхнего левого пикселя текущей PU относительно текущего изображения; (xCbs, yCbs) — местоположение верхнего левого пикселя текущей CU относительно текущего изображения; и CtbSizeY— размер CTU. OffsetX и offsetY — это два скорректированных смещения в двух измерениях с учетом интерполяции образца цветности для режима CPR:
offsetX = BVC_x & 0x7? 2 : 0, (4)
offsetY = BVC_y & 0x7? 2 : 0. (5)
(BVC_x, BVC_y) — блок-вектор цветности с разрешением 1/8-pel в HEVC.
В-третьих, эталонный блок для CPR должен находиться в пределах границ одной и той же плитки / среза.
Компенсация аффинного движения
Аффинная модель может использоваться для описания поворота 2D-блоков, а также 2D-деформаций квадратов (прямоугольников) в параллелограмм. Эта модель может быть описана следующим образом:
x’ = a0 + a1*x + a2*y, и
y’ = b0 + b1*x + b2*y. (6)
В этой модели необходимо определить 6 параметров. Для каждого пикселя (х, у) в области, представляющей интерес, вектор движения определяется как разность между местоположением данного пикселя (A), и местоположением его соответствующего пикселя в эталонном блоке (А’), т. е. MV = A’ - A = (a0 + (a1 - 1) * x + a2 * y, b0 + b1 * x + (b2 - 1) * y). Следовательно, вектор движения для каждого пикселя зависит от местоположения.
В соответствии с этой моделью, если векторы движения трех разных местоположений известны, то вышеуказанные параметры могут быть решены. Это эквивалентно условию, что 6 параметров известны. Каждое местоположение с известным вектором движения называется контрольной точкой. Аффинная модель с 6 параметрами соответствует модели с 3 контрольными точками.
В технической литературе Li и соавт. («An affine motion compensation framework for high efficiency video coding», in 2015 IEEE International Symposium on Circuits and Systems (ISCAS), 24-27 May 2015, Pages: 525-528) и Huang и соавт. («Control-Point Representation and Differential Coding Affine-Motion Compensation», IEEE Transactions on Circuits, System and Video Technology (CSVT), Vol. 23, No. 10, pages 1651-1660, Oct. 2013) представили некоторые примеры осуществления компенсации аффинного движения. В технической литературе Li и соавт. аффинный флаг сигнализируется для раздела блока 2Nx2N, когда текущий блок кодируется либо в режиме объединения (Merge), либо в режиме AMVP. Если этот флаг активен, деривация векторов движения для текущего блока следует аффинной модели. Если этот флаг неактивен, деривация векторов движения для текущего блока следует традиционному поступательному движению. Три контрольных точки (3 MV) сигнализируются при использовании аффинного режима AMVP. В каждом местоположении контрольной точки MV кодируется предиктивно. Затем MVD этих контрольных точек кодируются и передаются. В технической литературе Huang и соавт. исследованы различные местоположения контрольной точки и предиктивное кодирование MV в контрольных точках.
Синтаксическая таблица для компенсации аффинного движения показана в таблице 1. Как показано в таблице 1, синтаксический элемент use_affine_flag сигнализируется, если по меньшей мере один кандидат Merge — с аффинной кодировкой, и режим разделения — 2Nx2N (т. е. PartMode == PART_2Nx2N), как указано в примечаниях (1-1) ... (1-3) для режима Merge. Синтаксический элемент use_affine_flag сигнализируется, если размер текущего блока больше 8x8 (т. е. (Log2CbSize > 3) и режим разделения — 2Nx2N (т. е. PartMode == PART_2Nx2N), как указано в примечаниях (1-4) ... (1-6) для B-среза. Если use_affine_flag указывает на использование аффинной модели (т. е. use_affine_flag со значением 1), информация о двух других контрольных точках сигнализируется для эталонного списка L0, как указано в примечаниях (1-7) ... (1-9), и информация о двух других контрольных точках передается для эталонного списка L1, как указано в примечаниях (1-10) ... (1-12).
Таблица 1
prediction_unit(x0,y0,nPbW,nPbH) { | Примечание |
if(cu_skip_flag[x0][y0]) { | |
if(MaxNumMergeCand > 1) | |
merge_idx[x0][y0] | |
} else { /* MODE_INTER */ | |
merge_flag[x0][y0] | |
if(merge_flag[x0][y0]) { | |
if(по меньшей мере один кандидат объединения с аффинным кодированием &&PartMode == PART_2Nx2N) | 1-1 |
use_affine_flag | 1-2 |
else | 1-3 |
if(MaxNumMergeCand > 1) | |
merge_idx[x0][y0] | |
} else { | |
if(slice_type == B) | |
inter_pred_idc[x0][y0] | |
if(log2CbSize > 3 &&PartMode == PART_2Nx2N) | 1-4 |
use_affine_flag | 1-5 |
if(inter_pred_idc[x0][y0] != PRED_L1) { | 1-6 |
if(num_ref_idx_l0_active_minus1 > 0) | |
ref_idx_l0[x0][y0] | |
mvd_coding(x0,y0,0) | |
if(use_affine_flag){ | 1-7 |
mvd_coding(x0,y0,0) /* вторая контрольная точка, когда используется аффинный режим */ | 1-8 |
mvd_coding(x0,y0,0) /* третья контрольная точка, когда используется аффинный режим */ | 1-9 |
} | |
mvp_l0_flag[x0][y0] | |
} | |
if(inter_pred_idc[x0][y0] != PRED_L0) { | |
if(num_ref_idx_l1_active_minus1 > 0) | |
ref_idx_l1[x0][y0] | |
if(mvd_l1_zero_flag &&inter_pred_idc[x0][y0] == PRED_BI) { | |
MvdL1[x0][y0][0] = 0 | |
MvdL1[x0][y0][1] = 0 | |
} else | |
mvd_coding(x0,y0,1) | |
if(use_affine_flag){ | 1-10 |
mvd_coding(x0,y0,1) /* вторая контрольная точка, когда используется аффинный режим */ | 1-11 |
mvd_coding(x0,y0,1) /* третья контрольная точка, когда используется аффинный режим */ | 1-12 |
} | |
mvp_l1_flag[x0][y0] | |
} | |
} | |
} | |
} |
В настоящем изобретении рассматриваются различные аспекты кодирования CPR со структурой QTBT или раздельного кодирования яркости / цветности.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Способ и устройство для кодирования видео с использованием структуры дерева квадрантов плюс двоичное дерево, или раздельного кодирования яркости / цветности. В соответствии с одним из способов по настоящему изобретению, когда включен режим привязки к текущему изображению (CPR), компонент яркости и этот один или более компонентов цветности текущего изображения совместно разделяются на блоки яркости и блоки цветности с использованием одной и той же структуры ячейки кодирования (CU), и кодирование CPR применяется к блокам яркости и блокам цветности совместно, если режим CPR выбран для блоков яркости и блоков цветности, или когда компонент яркости и этот один или более компонентов цветности текущего изображения разделены на блоки яркости и блоки цветности по отдельности с использованием отдельных структур CU, блоки яркости и блоки цветности кодируются или декодируются с использованием режима кодирования, выбранного из группы режимов кодирования, исключая режим CPR.
В соответствии с другим способ компоненты яркости и цветности текущего изображения разделяются по отдельности на блоки яркости и блоки цветности с использованием отдельных структур CU. Кодирование CPR применяется к блокам яркости или блокам цветности по отдельности, если режим CPR выбран для блоков яркости или блоков цветности соответственно. Для блоков яркости, CPR относится к эталонным данным яркости в реконструированном изображении яркости текущего изображения с использованием первых векторов движения (MV). Для блоков цветности, CPR относится к эталонным данным цветности в реконструированном изображении цветности текущего изображения с использованием вторых MV. В одном из вариантов осуществления первые MV и вторые MV отличаются. В другом варианте осуществления первый MV для соотнесенного блока яркости используется для получения второго MV для соответствующего блока цветности, причем первый MV является масштабированным MV из соотнесенного блока яркости, если компонент яркости и этот один или более компонентов цветности обладают разными разрешениями. Если режим CPR применяется к соответствующему блоку цветности, и соотнесенный блок яркости кодируется в режиме CPR, то первый MV или масштабированный MV первого MV для соотнесенного блока яркости могут непосредственно использоваться в качестве второго MV соответствующего блока цветности. В этом случае флаг может быть использован для указания того, используется ли первый MV или масштабированный MV первого MV для соотнесенного блока яркости непосредственно как второй MV соответствующего блока цветности. Флаг сигнализируется или синтаксически выделяется, когда соответствующий блок цветности кодируется в режиме объединения или когда соотнесенный блок яркости кодируется в режиме CPR. Если режим CPR применяется к соответствующему блоку цветности, и соотнесенный блок яркости не кодируется в режиме CPR, то MV по умолчанию может быть использован в качестве второго MV соответствующего блока цветности. В другом варианте осуществления, если режим CPR применяется к соответствующему блоку цветности, и соотнесенный блок яркости кодируется в режиме CPR, то первый MV или масштабированный MV первого MV для соотнесенного блока яркости может быть использован в качестве предиктора (MVP), добавленного в список кандидатов Объединения, или список кандидатов расширенного прогнозирования вектора движения (AMVP) для соответствующего блока цветности. Первый MV или масштабированный MV первого MV для соотнесенного блока яркости может быть добавлен к местоположению ведущего кандидата в списке кандидатов объединения или списке кандидатов AMVP для соответствующего блока цветности. Если режим CPR применяется к соответствующему блоку цветности, и соотнесенный блок яркости не кодируется в режиме CPR, то MV по умолчанию может быть использован в качестве MVP, добавленного к списку кандидатов объединения или AMVP соответствующего блока цветности. Например, MV по умолчанию может быть выбран из группы MV, содержащей (-w, 0), (0, -h), (-w, -h), (-2w, 0) и (0, -2h), где w — ширина блока, а h — высота блока. В еще одном варианте осуществления первый MV или масштабированный MV первого MV для соотнесенного блока яркости, связанного с соседним блоком цветности соответствующего блока цветности, может быть непосредственно использован в качестве второго MV соответствующего блока цветности.
В другом аспекте вышеуказанного изобретения рассмотрены ограниченные реконструированные данные для режима CPR. Когда режим CPR применяется к текущему изображению, эталонные данные для текущего блока текущего изображения ограничиваются реконструированными данными, доступными перед прогнозированием текущей CU, содержащей текущий блок. Соответственно, блок-вектор (BV) текущего блока ограничен, чтобы выполнялось одно из двух условий: BV_x + offsetX + nPbSw <= 0 и BV_y + offsetY + nPbSh <= 0, где (BV_x, BV_y) — BV компонента яркости текущего блока, (offsetX, offsetY) — два скорректированных смещения с учетом интерполяции образца цветности для режима CPR, а nPbSw и nPbSh соответствуют ширине и высоте текущего блока. Текущий блок может соответствовать текущему блоку яркости или текущему блоку цветности. Эталонные данные для текущего блока области изображения дополнительно ограничены областью прогнозирования в форме лестницы, связанной с параллельной обработкой фронта волны (WPP), которая дополнительно ограничивает блок-вектор (BV) текущего блока до: (xPbs + BV_x + offsetX + nPbSw - 1) / CtbSizeY - xPbs / CtbSizeY <= yPbs / CtbSizeY - (yPbs + BV_y + offsetY + nPbSh - 1) / CtbSizeY, где (xPbs, yPbs) — это местоположение верхнего левого пикселя текущего блока относительно текущего изображения, и CtbSizeY — высота области изображения. offsetX и offsetY равны 0, если компонент яркости и компоненты цветности области изображения по отдельности разделены на блоки яркости и блоки цветности с использованием отдельных структур ячейки кодирования.
КРАТКОЕ РАСКРЫТИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
На фиг. 1 показан пример разделения блока с использованием структуры дерева квадрантов для разделения ячейки кодового дерева (CTU) на ячейки кодирования (CU).
На фиг. 2 показано разделение асимметричного движения (AMP) в соответствии с высокоэффективным видеокодированием (HEVC), где AMP определяет восемь форм для разделения CU на PU.
На фиг. 3 показан пример различных типов двоичного разделения, используемых структурой разделения двоичного дерева, где блок может быть рекурсивно разделен на два меньших блока, используя типы разделения.
На фиг. 4 показан пример разделения блока и его соответствующее двоичное дерево в каждом разделяемом узле (т. е. не конечном узле) двоичного дерева, один флаг используется, чтобы указать, какой тип разделения (горизонтальный или вертикальный) используется, где 0 может обозначать горизонтальное разделение, а 1 может обозначать вертикальное разделение.
На фиг. 5 показан пример разделения блока и соответствующая ему структура дерева квадрантов плюс двоичное дерево (QTBT), где сплошными линиями обозначено разделение дерева квадрантов, а пунктирными линиями обозначено разделение двоичного дерева.
На фиг. 6 показан пример компенсации CPR, где область 610 соответствует изображению, срезу или области изображения для кодирования. Блоки 620 и 630 соответствуют двум блокам для кодирования.
На фиг. 7 показан пример предиктивного кодирования блок-вектора (BV), где сигнализируется разность BV (BVD), соответствующая разности между текущим BV и предиктором BV.
На фиг. 8 показаны примеры ограниченной области эталонного пикселя для режима IntraBC (т. е. привязка к текущему изображению, режим CPD).
На фиг. 9 показан пример области эталонных данных в форме лестницы для WPP (параллельная обработка фронта волны), связанной с режимом CPR.
На фиг. 10 показан пример деривации кандидата соотнесенной цветовой плоскости из других цветовых плоскостей в том же кадре, где (Y1, U1, V1) и (Y2, U2, V2) — это цветовые плоскости двух последовательных кадров.
На фиг. 11 показана блок-схема примерной системы с режимом кодирования с привязкой к текущему изображению (CPR) в соответствии с вариантом осуществления настоящего изобретения, где блоки яркости и цветности текущего изображения совместно кодируются с использованием одной и той же структуры ячейки кодирования (CU), если режим CPR выбран для блоков яркости и цветности, или если компоненты яркости и цветности разделены на блоки яркости и цветности по отдельности с использованием отдельных структур CU, блоки яркости и цветности кодируются или декодируются с использованием режима кодирования, выбранного из группы режимов кодирования, исключая режим CPR.
На фиг. 12 показана блок-схема примерной системы кодирования с привязкой к текущему изображению (CPR) в соответствии с вариантом осуществления настоящего изобретения, где блоки яркости и цветности текущего изображения кодируются по отдельности с использованием другой структуры CU, если CPR режим выбран для блоков яркости и цветности.
На фиг. 13 показана блок-схема примерной системы кодирования с привязкой к текущему изображению (CPR) в соответствии с вариантом осуществления настоящего изобретения, где эталонные данные для текущего блока ограничены реконструированными данными, доступными перед прогнозированием текущей ячейки кодового дерева (CTU), содержащей текущий блок, если выбран режим CPR для блоков яркости и цветности.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
Следующее раскрытие относится к наилучшему варианту осуществления изобретения. Это раскрытие подготовлено с целью иллюстрации общих принципов изобретения и не является ограничивающим. Объем изобретения наилучшим образом определяется формулой изобретения.
В кодировании видео на основе первоначальной структуры дерева квадрантов плюс двоичное дерево (QTBT) и раздельного кодирования яркости / цветности, яркость и цветность кодируются по отдельности для всех кадров с внутренним кодированием (например, I-срез). Однако в HEVC-SCC CPR разработан для соединения трех цветовых компонентов. MV CPR используется для всех трех компонентов. В соответствии с одним из аспектов настоящего изобретения структура CPR модифицируется, когда яркость и цветность кодируются по отдельности. В этом раскрытии предложены различные способы кодирования CPR с отдельной структурой CU яркости / цветности. Далее раскрыты различные аспекты использования режима CPR для видеоданных, разделенных со структурой QTBT, или раздельного кодирования яркости / цветности.
Совместное кодирование цветового компонента для режима CPR
Когда режим CPR включен для текущего изображения, кодирование яркости и цветности (или R/G/B) по отдельности отключается. Другими словами, совместное кодирование яркости и цветности (или R/G/B) используется, когда включен режим CPR. Использование режима CPR может указываться синтаксисом высокого уровня, таким как pps_curr_pic_ref_enabled_flag в PPS (множество параметров изображения), который равен true. В этом случае компоненты яркости и цветности будут кодироваться совместно, как в случае P- или B-срезом. Другими словами, одна и та же структура ячейки кодирования (CU) используется для разделения компонентов яркости и цветности области изображения. Кроме того, один и тот же вектор движения (MV) или блок-вектор (BV) для компонентов яркости и цветности области изображения используется для определения местоположения эталонных данных.
В другом варианте осуществления изобретения используется кодирование яркости и цветности (или R/G/B) по отдельности, режим CPR выключен. Другими словами, компоненты яркости и цветности кодируются с использованием режима кодирования, выбранного из группы кодирования, исключая режим CPR.
Другими словами, использование режима CPR и кодирования яркости и цветности (или R/G/B) по отдельности не будет происходить одновременно в соответствии с вышеуказанными вариантами осуществления.
Раздельное кодирование CPR для яркости и цветности
Когда яркость и цветность кодируются по отдельности, используется отдельное кодирование CPR для компонентов яркости и цветности в соответствии с другим вариантом осуществления. Например, для кодирования компонента яркости, MV блоков яркости, кодированных в режиме CPR, относятся только к реконструированному изображению. Для кодирования компонента цветности MV блоков цветности, кодированных в режиме CPR, относятся к реконструированному изображению U/V (или Cb/Cr). Например, область изображения яркости (например, срез яркости или ячейка кодового дерева, CTU) может быть разделена на блоки яркости, используя первую структуру CU, и область изображения цветности (например, срез цветности или ячейка кодового дерева, CTU) может быть разделена на блоки цветности, используя вторую структуру CU. Если блоки яркости области изображения яркости имеют первые MV, а блоки цветности области изображения цветности имеют вторые MV, у CU/PU яркости и цветности могут быть разные MV. Другими словами, первые MV и вторые MV могут отличаться.
Прогнозирование MV для CU цветности, кодированной в режиме CPR
Когда компоненты яркости и цветности кодируются по отдельности, и для компонентов яркости и цветности используется отдельное кодирование CPR, MV от MV яркости или масштабированного MV яркости (если компонент яркости с отличным от компонента цветности разрешением) используется для кодирования MV блока цветности (например, CU/PU) в соответствии с вариантом осуществления настоящего изобретения. Например, когда CU/PU цветности кодируется с использованием режима CPR, если соотнесенные CU/PU яркости кодируется в режиме CPR, MV яркости или масштабированный MV яркости могут быть непосредственно использованы для CU/PU цветности или могут быть использованы в качестве предиктора MV (MVP) для CU/PU цветности. Кроме того, luma_merge_flag может сигнализироваться для указания того, используется ли MV яркости или масштабированный MV яркости непосредственно для текущей CU/PU цветности. Luma_merge_flag также может условно сигнализироваться. Например, он сигнализируется только тогда, когда соотнесенные CU/PU яркости кодируются в режиме CPR. В другом примере luma_merge_flag всегда сигнализируется для указания того, кодируется ли текущая CU/PU цветности в режиме CPR, и MV копируется из масштабированного MV яркости. В этом примере, если соотнесенная CU/PU яркости не кодируется в режиме CPR, может быть использован MV. MV по умолчанию может быть (-w, 0), (0, -h), (-w, -h), (-2w, 0), (0, -2h) или любым другим заранее заданным MV, где w — ширина CU или ширина PU, а h — высота CU или высота PU.
В другом примере luma_merge_flag всегда сигнализируется, когда режим объединения применяется для CU/PU цветности. Например, luma_merge_flag всегда сигнализируется, когда merge_flag или skip_flag равно true для компонента цветности. В этом примере, если соотнесенная CU/PU яркости не кодируется в режиме CPR, может быть использован MV. MV по умолчанию может быть (-w, 0), (0, -h), (-w, -h), (-2w, 0), (0, -2h) или любым другим заранее заданным MV, где w — ширина CU или ширина PU, а h — высота CU или высота PU.
В другом варианте осуществления MV яркости или масштабированный MV яркости соотнесенного блока яркости может быть использован в качестве MVP. Он может быть вставлен в список кандидатов объединения и / или список кандидатов AMVP. Он может быть вставлен в место первого кандидата (то есть в ведущее местоположение) в списке. Отсечение MV может быть применено для последующих кандидатов. Если соотнесенная CU/PU яркости не кодируется в режиме CPR, кандидат может быть удален или в качестве кандидата используется MV по умолчанию. MV по умолчанию может быть (-w, 0), (0, -h), (-w, -h), (-2w, 0), (0, -2h) или любым другим заранее заданным MV, где w — ширина CU или ширина PU, а h — высота CU или высота PU.
В другом варианте осуществления MV яркости или масштабированный MV яркости соотнесенного блока яркости текущего соседнего блока цветности может быть использован в качестве MVP. Он может быть вставлен в список кандидатов Объединения (Merge) и / или список кандидатов AMVP. Если соотнесенная CU/PU яркости не кодируется в режиме CPR, кандидат может быть удален или в качестве кандидата используется MV по умолчанию.
В другом варианте осуществления MV яркости или масштабированный MV яркости соотнесенного блока яркости может быть использован в качестве временного соотнесенного MVP.
Соотнесенный кандидат цветовой плоскости
Когда блок в цветовой плоскости кодируется, декодер может извлекать соотнесенных кандидатов цветовой плоскости, чтобы спрогнозировать вектор движения текущего блока. Соотнесенные кандидаты цветовой плоскости получаются из других цветовых плоскостей в том же кадре. На фиг. 10 показан пример деривации кандидата соотнесенной цветовой плоскости из других цветовых плоскостей в том же кадре, где (Y1, U1, V1) и (Y2, U2, V2) — это цветовые плоскости двух последовательных кадров. При кодировании блока в U2 соотнесенный кандидат цветовой плоскости может быть получен из Y2. Следует отметить, что декодер также может получать соотнесенных временных кандидатов из предыдущих кадров, кодированных в HEVC. Новые полученные соотнесенные кандидаты цветовой плоскости могут быть вставлены в список кандидатов вместе с другими кандидатами в HEVC. Цветовая плоскость U/V (или Cb/Cr) на фиг. 10 может быть скомбинирована. Например, она может быть изменена на четыре изображения, соответствующие (Y1, U1 + V1) и (Y2, U2 + V2).
В другом варианте осуществления, когда кодируется изображение цветности, кодированное поле MV яркости может быть использовано в качестве поля MV временного соотнесенного изображения. Первоначальный способ кодирования MV в совместном кодировании цветового компонента может быть применен для кодирования цветности изображения.
В другом варианте осуществления при кодировании цветности кодированное поле MV яркости копируется в текущее реконструированное изображение. Когда CU/PU декодируется, реконструированные образцы и MV обновляются. Первоначальный способ кодирования MV в совместном кодировании цветового компонента может быть применен для кодирования цветности изображения.
Режим LM для CPR
Поскольку изображения яркости и цветности кодируются по отдельности, может быть применено межцветовое прогнозирование для генерации нового прогнозируемого изображения для кодирования. Например, при декодировании изображения цветности декодированное изображение яркости может быть использовано для генерации нового прогнозирования виртуального изображения цветности. Может быть использована генерация прогнозирования в режиме LM-подобного режима яркости, как описано в программном обеспечении на основе HM (HEVC Test Model) / JEM (Joint Exploration Model), где prediction_sample = a*source_sample + b. Параметры a и b могут сигнализироваться в SPS / PPS / SliceHeader. Декодированное поле MV яркости может быть масштабировано как поле MV сгенерированного нового виртуального изображения цветности. Может быть применено двойное прогнозирование. Например, одно изображение может быть текущим реконструированным изображением цветности, а другое изображение может быть виртуальным изображением цветности. При использовании виртуального изображения цветности может быть снято ограничение области прогнозирования в форме лестницы в HEVC-SCC.
Ограничения эталонной области CPR для QTBT
Когда QTBT используется с CU, равной PU, существует только один блок прогнозирования на CU. Ограничения, указанные в уравнениях (1) ... (3), изменяются следующим образом:
BV_x + offsetX + nPbSw <= 0, (1’)
BV_y + offsetY + nPbSh <= 0, (2’)
(xPbs + BV_x + offsetX + nPbSw - 1) / CtbSizeY - xPbs / CtbSizeY <=
yPbs / CtbSizeY - (yPbs + BV_y + offsetY + nPbSh - 1) / CtbSizeY. (3’)
Вышеуказанные модифицированные уравнения также применяются к случаю использования структуры ячейки кодирования (CU) для генерации CU, где каждая CU соответствует одной PU. Когда три цветовых компонента изображения кодируются по отдельности, где у U/V цветности есть независимый блок-вектор, переменные offsetX и offsetY могут быть заданы равными 0.
Раскрытые выше изобретения могут быть встроены в различные системы кодирования или декодирования видео в различных формах. Например, изобретения могут быть реализованы с использованием аппаратных подходов, таких как специализированные интегральные схемы (IC), программируемая пользователем логическая матрица (FPGA), цифровой сигнальный процессор (DSP), центральный процессор (CPU) и т. д. Изобретения также могут быть реализованы с использованием программных кодов или кодов микропрограммного обеспечения, исполняемых на компьютере, ноутбуке или мобильном устройстве, таком как смартфоны. Кроме того, программные коды или коды микропрограммного обеспечения могут выполняться на платформе смешанного типа, такой как ЦП с выделенными процессорами (например, модуль видеокодирования видео или сопроцессор).
На фиг. 11 показана блок-схема примерной системы с режимом кодирования с привязкой к текущему изображению (CPR) в соответствии с вариантом осуществления настоящего изобретения, где блоки яркости и цветности текущего изображения совместно кодируются с использованием одной и той же структуры ячейки кодирования (CU), если режим CPR выбран для блоков яркости и цветности, или если компоненты яркости и цветности разделены на блоки яркости и цветности по отдельности с использованием отдельных структур CU, блоки яркости и цветности кодируются или декодируются с использованием режима кодирования, выбранного из группы режимов кодирования, исключая режим CPR. Шаги, показанные на блок-схеме, а также другие блок-схемы в этом раскрытии могут быть реализованы в виде программных кодов, исполняемых на одном или нескольких процессорах (например, одном или нескольких ЦП) на стороне кодировщика и / или декодировщика. Шаги, показанные на блок-схеме, также могут быть реализованы на базе аппаратных средств, таких как одно или более электронных устройств или процессоров, реализованных с возможностью выполнения шагов, показанных на блок-схеме. В соответствии с этим способом входные данные, связанные с текущим изображением, получены на шаге 1110, где текущая область изображения содержит компонент яркости и один или более компонентов цветности. На стороне кодировщика входные данные могут соответствовать видеоданным для кодирования. На стороне декодера входные данные могут соответствовать сжатым видеоданным для декодирования. На шаге 1120, когда включен режим привязки к текущему изображению (CPR), компонент яркости и этот один или более компонентов цветности области изображения совместно разделяются на блоки яркости и блоки цветности с использованием одной и той же структуры ячейки кодирования (CU), и кодирование CPR применяется к блокам яркости и блокам цветности совместно, если режим CPR выбран для блоков яркости и блоков цветности, или когда компонент яркости и этот один или более компонентов цветности области изображения разделены на блоки яркости и блоки цветности по отдельности с использованием отдельных структур CU, блоки яркости и блоки цветности кодируются или декодируются с использованием режима кодирования, выбранного из группы режимов кодирования, исключая режим CPR. Блоки яркости и блоки цветности кодируются с использованием эталонных данных в текущем изображении, если режим CPR выбран для блоков яркости и блоков цветности. Когда структура ячейки кодирования (CU) используется для разделения изображения, изображение обычно разделяется на срезы, плитки, строки CTU или CTU, и структура ячейки кодирования (CU) применяется к CTU для генерации CU, PU и TU для процесса кодирования. Структура дерева квадрантов плюс двоичное дерево (QTBT) может быть использована в качестве структуры ячейки кодирования (CU).
На фиг. 12 показана блок-схема примерной системы кодирования с привязкой к текущему изображению (CPR) в соответствии с вариантом осуществления настоящего изобретения, где блоки яркости и цветности текущего изображения кодируются по отдельности с использованием другой структуры CU, если CPR режим выбран для блоков яркости и цветности. В соответствии с этим способом входные данные, связанные с текущим изображением, получены на шаге 1210, где область изображения содержит компонент яркости и один или более компонентов цветности. Компонент яркости и этот один или более компонентов цветности области изображения разделяются по отдельности на блоки яркости и блоки цветности с использованием отдельных структур CU на шаге 1220. Кодирование CPR применяется к блокам яркости или блокам цветности по отдельности, если режим CPR выбран для блоков яркости или блоков цветности на шаге 1230. Например, кодирование CPR может относиться только к эталонным данным с реконструкцией по яркости с использованием векторов движения (MV) блоков яркости для кодирования компонента яркости, и кодирование CPR может относиться только к эталонным данным с реконструкцией по цветности с использованием векторов движения (MV) блоков цветности для кодирования компонента цветности.
На фиг. 13 показана блок-схема примерной системы кодирования с привязкой к текущему изображению (CPR) в соответствии с вариантом осуществления настоящего изобретения, где эталонные данные для текущего блока ограничены реконструированными данными, доступными перед прогнозированием текущей ячейки кодового дерева (CTU), содержащей текущий блок, если выбран режим CPR для блоков яркости и цветности. В соответствии с этим вариантом осуществления входные данные, связанные с текущим изображением, получены на шаге 1310, где текущее изображение содержит компонент яркости и один или более компонентов цветности. Компонент яркости и этот один или более компонентов цветности текущего изображения разделяются на блоки яркости и блоки цветности с использованием структур ячейки кодирования (CU) на шаге 1320, где ячейка кодирования (CU) равна ячейке прогнозирования (PU). На шаге 1330, когда режим привязки к текущему изображению (CPR) применяется к блокам яркости и блокам цветности, эталонные данные для текущего блока ограничены реконструированными данными, доступными перед прогнозированием текущей ячейки кодирования (CU), содержащей текущий блок, в соответствии с в BV_x + offsetX + nPbSw <= 0 или BV_y + offsetY + nPbSh <= 0. Текущий блок соответствует текущему блоку яркости или текущему блоку цветности, (BV_x, BV_y) соответствует текущему блок-вектору (BV) компонента яркости текущего блока, (offsetX, offsetY) — два скорректированных смещения с учетом интерполяции образца цветности для режима CPR, а nPbSw и nPbSh — ширина и высота текущего блока, и где offsetX и offsetY равны 0, если компонент яркости и этот один или более компонентов цветности текущего изображения по отдельности разделены на блоки яркости и блоки цветности с использованием отдельных структур ячейки кодирования (CU).
Показанные блок-схемы предназначены только для иллюстрации примера видеокодирования в соответствии с настоящим изобретением. Специалист в данной области техники может модифицировать любой шаг, поменять порядок шагов, разделить шаг или скомбинировать шаги при практическом применении настоящего изобретения, без отдаления от сущности настоящего изобретения. В раскрытии конкретный синтаксис и семантика были использованы для иллюстрации примеров осуществления реализации настоящего изобретения. Специалист в данной области техники может практиковать настоящее изобретение, заменяя синтаксис и семантику эквивалентным синтаксисом и семантикой, без отдаления от сущности настоящего изобретения.
Вышеуказанное раскрытие представлено, чтобы дать возможность специалисту в данной области техники практиковать настоящее изобретение, как это предусмотрено в контексте конкретной области применения и ее требований. Различные модификации раскрытого варианта осуществления будут понятны специалистам в данной области техники, и общие принципы, указанные здесь, могут быть применены к другим вариантам осуществления. Таким образом, данное изобретение не ограничено определенными показанными и раскрытыми вариантами осуществления, но может применяться в самой широкой области в соответствии с принципами и новыми функциями, раскрытыми здесь. В подробном раскрытии выше различные определенные детали показаны, чтобы обеспечить глубокое понимание настоящего изобретения. Несмотря на это, специалистам в данной области техники должно быть понятно, что данное изобретение может быть осуществлено.
Вариант осуществления настоящего изобретения, как описано выше, может быть реализован в различных аппаратных средствах, программных кодах или их сочетаниях. Например, вариантом осуществления настоящего изобретения может быть одна или более электронных схем, встроенных в микросхему сжатия видео, или программный код, интегрированный в программное обеспечение для сжатия видео, для выполнения раскрытой в настоящем документе обработки. Вариантом осуществления настоящего изобретения может быть также программный код для исполнения на цифровом сигнальном процессоре (DSP) для выполнения раскрытой в настоящем документе обработки. Изобретение также может включать в себя ряд функций, выполняемых компьютерным процессором, цифровым сигнальным процессором или микропроцессором, или программируемой логической интегральной схемой (FPGA). Эти процессоры могут быть реализованы с возможностью выполнения конкретных задач в соответствии с изобретением путем выполнения машиночитаемого программного кода или микропрограммного кода, который определяет конкретные способы, воплощенные в изобретении. Программный код или микропрограммный код может быть разработан на разных языках программирования и в разных форматах или стилях. Программный код также может быть скомпилирован для разных целевых платформ. Однако различные форматы кода, стили и языки программных кодов и другие средства конфигурирования кода для выполнения задач в соответствии с изобретением не будут отходить от сущности и объема изобретения.
Изобретение может быть осуществлено в других специальных формах без отступления от сущности или существенных характеристик. Раскрытые примеры следует рассматривать во всех отношениях только как иллюстративные и не имеющие ограничительного характера. Объем изобретения, таким образом, лучше всего отражается прилагаемой формулой изобретения, а не следующим раскрытием. Все изменения, относящиеся к значению и диапазону эквивалентности формулы изобретения, должны входить в их объем.
Claims (21)
1. Способ кодирования и декодирования видео, используемый в системе кодирования видео и системе декодирования видео соответственно, содержащий:
прием входных данных, связанных с текущим изображением, причем текущее изображение содержит компонент яркости и один или более компонентов цветности;
разделение компонента яркости и этого одного или более компонентов цветности текущего изображения по отдельности на блоки яркости и блоки цветности с использованием отдельных структур ячейки кодирования (CU); и
применение кодирования CPR к блокам яркости или блокам цветности, если режим CPR выбран для блоков яркости или блоков цветности соответственно.
2. Способ по п. 1, в котором для блоков яркости это применение CPR относится к эталонным данным яркости в реконструированном изображении яркости текущего изображения с использованием первых векторов движения (MV).
3. Способ по п. 2, в котором для блоков цветности это применение CPR относится к эталонным данным цветности в реконструированном изображении цветности текущего изображения с использованием вторых MV.
4. Способ по п. 3, в котором первые MV и вторые MV различны.
5. Способ по п. 3, в котором первый MV для соотнесенного блока яркости используется для получения второго MV для соответствующего блока цветности и в котором первый MV соответствует масштабированному MV из соотнесенного блока яркости, если компонент яркости и этот один или более компонентов цветности обладают разными разрешениями.
6. Способ по п. 5, в котором если режим CPR применяется к соответствующему блоку цветности и соотнесенный блок яркости кодируется в режиме CPR, то первый MV или масштабированный MV первого MV для соотнесенного блока яркости непосредственно используются в качестве второго MV соответствующего блока цветности.
7. Способ по п. 6, в котором флаг использован для указания того, используется ли первый MV или масштабированный MV первого MV для соотнесенного блока яркости непосредственно как второй MV соответствующего блока цветности.
8. Способ по п. 7, в котором флаг сигнализируется или синтаксически выделяется, когда соответствующий блок цветности кодируется в режиме объединения или когда соотнесенный блок яркости кодируется в режиме CPR.
9. Способ по п. 5, в котором если режим CPR применяется к соответствующему блоку цветности и соотнесенный блок яркости не кодируется в режиме CPR, то MV по умолчанию использован в качестве второго MV соответствующего блока цветности.
10. Способ по п. 5, в котором если режим CPR применяется к соответствующему блоку цветности и соотнесенный блок яркости кодируется в режиме CPR, то первый MV или масштабированный MV первого MV для соотнесенного блока яркости использован в качестве предиктора (MVP), добавленного в список кандидатов Объединения или список кандидатов расширенного прогнозирования вектора движения (AMVP) для соответствующего блока цветности.
11. Способ по п. 10, в котором первый MV или масштабированный MV первого MV для соотнесенного блока яркости добавлен к местоположению ведущего кандидата в списке кандидатов объединения или списке кандидатов AMVP для соответствующего блока цветности.
12. Способ по п. 5, в котором если режим CPR применен к соответствующему блоку цветности и соотнесенный блок яркости не кодирован в режиме CPR, то MV по умолчанию используется в качестве предиктора (MVP), добавленного в список кандидатов объединения или список кандидатов расширенного прогнозирования вектора движения (AMVP) для соответствующего блока цветности.
13. Способ по п. 12, в котором MV по умолчанию выбран из группы MV, содержащей (-w, 0), (0, -h), (-w, -h), (-2w, 0) и (0, -2h), где w - ширина блока, а h - высота блока.
14. Способ по п. 5, в котором первый MV или масштабированный MV первого MV для соотнесенного блока яркости, связанного с соседним блоком цветности соответствующего блока цветности, использован в качестве второго MV соответствующего блока цветности.
15. Устройство кодирования и декодирования видео, используемое системой кодирования видео и системой декодирования видео соответственно, содержащее одну или более электронных схем или процессоров, предназначенных для:
приема входных данных, связанных с текущим изображением, причем текущее изображение содержит компонент яркости и один или более компонентов цветности;
разделения компонента яркости и этого одного или более компонентов цветности текущего изображения по отдельности на блоки яркости и блоки цветности с использованием отдельных структур ячейки кодирования (CU); и
применения кодирования CPR к блокам яркости или блокам цветности, если режим CPR выбран для блоков яркости или блоков цветности соответственно.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662342883P | 2016-05-28 | 2016-05-28 | |
US62/342,883 | 2016-05-28 | ||
PCT/CN2017/086049 WO2017206803A1 (en) | 2016-05-28 | 2017-05-26 | Method and apparatus of current picture referencing for video coding |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2710667C1 true RU2710667C1 (ru) | 2019-12-30 |
Family
ID=60478454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2018145683A RU2710667C1 (ru) | 2016-05-28 | 2017-05-26 | Способ и устройство привязки к текущему изображению для кодирования видео |
Country Status (7)
Country | Link |
---|---|
US (2) | US20200322599A1 (ru) |
EP (2) | EP3456043A4 (ru) |
CN (2) | CN109076214A (ru) |
CA (1) | CA3025490A1 (ru) |
RU (1) | RU2710667C1 (ru) |
TW (2) | TWI702830B (ru) |
WO (2) | WO2017206803A1 (ru) |
Families Citing this family (104)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109952762B (zh) * | 2016-10-28 | 2023-07-04 | 韩国电子通信研究院 | 视频编码/解码方法和设备以及存储比特流的记录介质 |
WO2019135629A1 (ko) * | 2018-01-05 | 2019-07-11 | 에스케이텔레콤 주식회사 | 크로마 블록의 복원 방법 및 이를 이용한 영상 복호화 장치 |
US10687071B2 (en) | 2018-02-05 | 2020-06-16 | Tencent America LLC | Method and apparatus for video coding |
US11202079B2 (en) | 2018-02-05 | 2021-12-14 | Tencent America LLC | Method and apparatus for video decoding of an affine model in an intra block copy mode |
WO2019154417A1 (en) * | 2018-02-12 | 2019-08-15 | Mediatek Inc. | Method and apparatus of current picture referencing for video coding using adaptive motion vector resolution and sub-block prediction mode |
CN110324627B (zh) * | 2018-03-30 | 2022-04-05 | 杭州海康威视数字技术股份有限公司 | 色度的帧内预测方法及装置 |
WO2019234609A1 (en) | 2018-06-05 | 2019-12-12 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between ibc and bio |
WO2019234604A1 (en) * | 2018-06-05 | 2019-12-12 | Beijing Bytedance Network Technology Co., Ltd. | Extended quad-tree with asymmetric sub-blocks |
JP7159354B2 (ja) | 2018-06-07 | 2022-10-24 | ウィルス インスティテュート オブ スタンダーズ アンド テクノロジー インコーポレイティド | 適応的動きベクトル解像度を用いるビデオ信号処理方法及び装置 |
WO2019244117A1 (en) | 2018-06-21 | 2019-12-26 | Beijing Bytedance Network Technology Co., Ltd. | Unified constrains for the merge affine mode and the non-merge affine mode |
TWI750483B (zh) * | 2018-06-21 | 2021-12-21 | 大陸商北京字節跳動網絡技術有限公司 | 成分依賴的子區塊分割 |
SG11202013202YA (en) * | 2018-07-02 | 2021-01-28 | Huawei Tech Co Ltd | Motion vector prediction method and related apparatus |
WO2020017513A1 (en) * | 2018-07-16 | 2020-01-23 | Sharp Kabushiki Kaisha | Systems and methods for generating prediction blocks for coding of video data |
IL281144B2 (en) * | 2018-08-28 | 2025-01-01 | Huawei Tech Co Ltd | Image and accessory distribution method |
CN112806011B (zh) * | 2018-09-13 | 2024-11-26 | 交互数字Vc控股公司 | 改进的虚拟时间仿射候选 |
HUE065870T2 (hu) * | 2018-09-18 | 2024-06-28 | Huawei Tech Co Ltd | Videókódoló, videódekódoló és megfelelõ eljárások |
CN112740668B (zh) | 2018-09-18 | 2022-05-24 | 华为技术有限公司 | 译码方法、设备、系统 |
US10848782B2 (en) | 2018-09-21 | 2020-11-24 | Tencent America LLC | Method and apparatus for video coding |
GB2591906B (en) | 2018-09-24 | 2023-03-08 | Beijing Bytedance Network Tech Co Ltd | Bi-prediction with weights in video coding and decoding |
US11317099B2 (en) * | 2018-10-05 | 2022-04-26 | Tencent America LLC | Method and apparatus for signaling an offset in video coding for intra block copy and/or inter prediction |
CN111357294B (zh) * | 2018-10-23 | 2022-12-30 | 北京字节跳动网络技术有限公司 | 基于子块的运动信息列表的简化熵编解码 |
CN111107373B (zh) * | 2018-10-29 | 2023-11-03 | 华为技术有限公司 | 基于仿射预测模式的帧间预测的方法及相关装置 |
EP3874757A4 (en) * | 2018-11-02 | 2022-08-24 | Sharp Kabushiki Kaisha | Systems and methods for reference offset signaling in video coding |
MX2021005255A (es) * | 2018-11-06 | 2021-09-08 | Interdigital Vc Holdings Inc | Agrupamiento de parametros entre varias unidades de codificacion para codificacion y decodificacion de video. |
WO2020094149A1 (en) | 2018-11-10 | 2020-05-14 | Beijing Bytedance Network Technology Co., Ltd. | Rounding in triangular prediction mode |
MX2021005781A (es) | 2018-11-16 | 2021-07-02 | Hfi Innovation Inc | Metodo y aparato de codificacion de arbol de codificacion separada de luminancia-crominancia con restricciones. |
US11979585B2 (en) | 2018-11-20 | 2024-05-07 | Interdigital Madison Patent Holdings, Sas | Current picture referencing block vector initialization with dual tree |
CN113170106B (zh) * | 2018-11-28 | 2024-12-13 | 北京字节跳动网络技术有限公司 | 帧内块复制模式中运动参考的扩展方法 |
CN117915083A (zh) * | 2018-11-29 | 2024-04-19 | 北京字节跳动网络技术有限公司 | 块内拷贝模式和帧间预测工具之间的交互 |
WO2020114517A1 (en) * | 2018-12-08 | 2020-06-11 | Beijing Bytedance Network Technology Co., Ltd. | Shifting on affine parameters |
EP4307667A3 (en) * | 2018-12-21 | 2024-03-20 | Beijing Bytedance Network Technology Co., Ltd. | Motion vector precision in merge with motion vector difference mode |
CN113170195B (zh) | 2018-12-22 | 2024-09-03 | 北京字节跳动网络技术有限公司 | 具有双树分割的帧内块复制模式 |
CN113228644B (zh) * | 2018-12-30 | 2023-11-17 | 寰发股份有限公司 | 带有约束的亮度-色度单独的编码树编码的方法和设备 |
CN113316938B (zh) * | 2019-01-02 | 2023-12-15 | Lg 电子株式会社 | 使用去块滤波的图像编译方法和装置 |
WO2020141932A1 (ko) * | 2019-01-04 | 2020-07-09 | 엘지전자 주식회사 | Cpr 기반 mmvd를 이용하는 인터 예측 방법 및 장치 |
US10771799B2 (en) * | 2019-01-15 | 2020-09-08 | Tencent America LLC | Method and apparatus for video coding |
WO2020156544A1 (en) | 2019-02-02 | 2020-08-06 | Beijing Bytedance Network Technology Co., Ltd. | Buffer initialization for intra block copy in video coding |
CN113366853B (zh) | 2019-02-02 | 2024-08-02 | 北京字节跳动网络技术有限公司 | 用于视频编解码中的帧内块复制的缓冲区初始化 |
CA3131028A1 (en) | 2019-02-22 | 2020-08-27 | Huawei Technologies Co., Ltd. | Method and apparatus for affine based inter prediction of chroma subblocks |
US11632563B2 (en) * | 2019-02-22 | 2023-04-18 | Qualcomm Incorporated | Motion vector derivation in video coding |
JP7350074B2 (ja) * | 2019-02-28 | 2023-09-25 | インターデジタル ヴイシー ホールディングス, インコーポレイテッド | ピクチャの符号化及び復号のための方法及び装置 |
CN117395439A (zh) | 2019-03-01 | 2024-01-12 | 北京字节跳动网络技术有限公司 | 用于视频编解码中的帧内块复制的基于方向的预测 |
CN113519158B (zh) | 2019-03-01 | 2024-06-18 | 北京字节跳动网络技术有限公司 | 用于视频编解码中的帧内块复制的块矢量表示 |
CN117640927A (zh) | 2019-03-04 | 2024-03-01 | 北京字节跳动网络技术有限公司 | 视频编解码中的帧内块复制中的实施方式方面 |
WO2020182091A1 (en) | 2019-03-08 | 2020-09-17 | Beijing Bytedance Network Technology Co., Ltd. | Reshaping model in video processing |
AU2019201649A1 (en) | 2019-03-11 | 2020-10-01 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding a tree of blocks of video samples |
CN118018720A (zh) | 2019-03-14 | 2024-05-10 | Sk电信有限公司 | 视频编码和解码设备以及传输比特流的设备 |
US11343525B2 (en) | 2019-03-19 | 2022-05-24 | Tencent America LLC | Method and apparatus for video coding by constraining sub-block motion vectors and determining adjustment values based on constrained sub-block motion vectors |
US11677969B2 (en) * | 2019-03-22 | 2023-06-13 | Tencent America LLC | Method and apparatus for video coding |
WO2020191575A1 (zh) * | 2019-03-25 | 2020-10-01 | 富士通株式会社 | 图像编解码方法、装置以及电子设备 |
WO2020200236A1 (en) * | 2019-04-01 | 2020-10-08 | Beijing Bytedance Network Technology Co., Ltd. | Using interpolation filters for history based motion vector prediction |
WO2020211862A1 (en) * | 2019-04-18 | 2020-10-22 | Beijing Bytedance Network Technology Co., Ltd. | Restriction on applicability of cross component mode |
CN117579841A (zh) | 2019-04-23 | 2024-02-20 | 北京字节跳动网络技术有限公司 | 降低跨分量依赖性的方法 |
EP3942811A4 (en) | 2019-04-24 | 2022-06-15 | ByteDance Inc. | CONSTRAINTS ON THE REPRESENTATION OF A DIFFERENTIAL MODULATION BY CODED PULSES OF QUANTIFIED RESIDUE FOR A CODED VIDEO |
WO2020223496A1 (en) * | 2019-04-30 | 2020-11-05 | Beijing Dajia Internet Informationtechnology Co., Ltd. | Methods and apparatus of joint coding of chroma residuals |
EP3942799A4 (en) | 2019-05-01 | 2022-06-08 | ByteDance Inc. | INTRACODED VIDEO USING QUANTIZED RESIDUAL PULSE CODE MODULATION ENCODING |
KR20220002918A (ko) | 2019-05-02 | 2022-01-07 | 바이트댄스 아이엔씨 | 변환 스킵 모드에서의 시그널링 |
WO2020223615A1 (en) * | 2019-05-02 | 2020-11-05 | Bytedance Inc. | Coding mode based on a coding tree structure type |
WO2020224629A1 (en) | 2019-05-08 | 2020-11-12 | Beijing Bytedance Network Technology Co., Ltd. | Conditions for applicability of cross-component coding |
JP7359873B2 (ja) * | 2019-05-15 | 2023-10-11 | 華為技術有限公司 | エンコーダ、デコーダ、及び対応する方法 |
WO2020228744A1 (en) | 2019-05-16 | 2020-11-19 | Huawei Technologies Co., Ltd. | An encoder, a decoder and corresponding methods using ibc dedicated buffer and default value refreshing for luma and chroma component |
JP7377894B2 (ja) | 2019-05-21 | 2023-11-10 | 北京字節跳動網絡技術有限公司 | サブブロックマージモードでのシンタックスシグナリング |
CN114270860A (zh) * | 2019-06-04 | 2022-04-01 | 北京达佳互联信息技术有限公司 | 针对仿射模式的自适应运动矢量分辨率 |
CN113796070B (zh) * | 2019-06-10 | 2025-01-03 | Oppo广东移动通信有限公司 | 预测值的确定方法、编码器以及计算机存储介质 |
KR20250030973A (ko) * | 2019-06-11 | 2025-03-05 | 엘지전자 주식회사 | 크로마 양자화 파라미터 데이터 기반 영상 디코딩 방법 및 그 장치 |
CN119299680A (zh) | 2019-06-19 | 2025-01-10 | Lg 电子株式会社 | 用于限制色度块的大小的图像编码/解码方法和装置以及用于发送比特流的方法 |
WO2020256513A1 (ko) * | 2019-06-20 | 2020-12-24 | 엘지전자 주식회사 | 루마 맵핑 및 크로마 스케일링 기반 비디오 또는 영상 코딩 |
CN112118451B (zh) * | 2019-06-20 | 2022-09-27 | 杭州海康威视数字技术股份有限公司 | 一种编解码方法、装置及其设备 |
CN117478908A (zh) | 2019-06-22 | 2024-01-30 | 北京字节跳动网络技术有限公司 | 色度残差缩放的语法元素 |
CN112135128B (zh) * | 2019-06-24 | 2024-07-05 | 华为技术有限公司 | 图像预测方法、编码树节点划分方法及其装置 |
FR3098073B1 (fr) * | 2019-06-25 | 2021-09-24 | Fond B Com | Procédé de codage et de décodage d’une image d’une séquence vidéo et dispositif associé |
MX2022000102A (es) | 2019-07-06 | 2022-02-03 | Beijing Bytedance Network Tech Co Ltd | Bufer de prediccion virtual para la copia intra-bloque en codificacion de video. |
EP3977738A4 (en) | 2019-07-07 | 2022-08-17 | Beijing Bytedance Network Technology Co., Ltd. | SIGNALING OF CHROMA RESIDUAL SCALE |
CN114175633B (zh) | 2019-07-10 | 2023-12-29 | 北京字节跳动网络技术有限公司 | 用于视频编解码中的帧内块复制的样点标识 |
CN117579816A (zh) * | 2019-07-11 | 2024-02-20 | 北京字节跳动网络技术有限公司 | 用于视频编解码中的帧内块复制的比特流一致性约束 |
CN114175662B (zh) | 2019-07-20 | 2023-11-24 | 北京字节跳动网络技术有限公司 | 调色板模式使用指示的条件相关编解码 |
CN117221536A (zh) * | 2019-07-23 | 2023-12-12 | 北京字节跳动网络技术有限公司 | 调色板模式编解码的模式确定 |
US11277611B2 (en) * | 2019-07-24 | 2022-03-15 | Qualcomm Incorporated | Delta quantization parameter (QP) signaling in palette mode |
EP3991411A4 (en) | 2019-07-29 | 2022-08-24 | Beijing Bytedance Network Technology Co., Ltd. | Palette mode coding in prediction process |
KR102601022B1 (ko) | 2019-08-06 | 2023-11-13 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 색상 포맷에 기초한 비디오 영역 분할 |
EP4011082A4 (en) | 2019-08-08 | 2023-10-25 | Fg Innovation Company Limited | DEVICE AND METHOD FOR ENCODING VIDEO DATA |
KR20220042125A (ko) | 2019-08-10 | 2022-04-04 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 서브픽처 디코딩에서의 버퍼 관리 |
CN117395411A (zh) | 2019-08-20 | 2024-01-12 | 北京字节跳动网络技术有限公司 | 用于视频处理的方法、装置以及计算机可读存储介质 |
CN110446044B (zh) * | 2019-08-21 | 2022-08-09 | 浙江大华技术股份有限公司 | 线性模型预测方法、装置、编码器及存储装置 |
BR112022003469A2 (pt) * | 2019-08-23 | 2022-05-24 | Hfi Innovation Inc | Método e aparelho de particionamento de unidades de codificação de tamanho pequeno com restrições de partição |
US11218718B2 (en) | 2019-08-26 | 2022-01-04 | Tencent America LLC | Adaptive motion vector resolution signaling |
JP7381722B2 (ja) | 2019-09-02 | 2023-11-15 | 北京字節跳動網絡技術有限公司 | カラーフォーマットに基づいたコーディングモード決定 |
WO2021051044A1 (en) | 2019-09-14 | 2021-03-18 | Bytedance Inc. | Quantization parameter offset for chroma deblocking filtering |
CN110719467B (zh) * | 2019-09-18 | 2022-04-19 | 浙江大华技术股份有限公司 | 色度块的预测方法、编码器及存储介质 |
JP7479456B2 (ja) * | 2019-09-20 | 2024-05-08 | 北京字節跳動網絡技術有限公司 | ビデオ・データ処理方法及び装置並びに記憶媒体及び方法 |
MX2022003122A (es) * | 2019-09-21 | 2022-04-06 | Beijing Bytedance Network Tech Co Ltd | Modo intra basado para croma de restriccion de tama?o. |
MX2022003566A (es) * | 2019-09-24 | 2022-07-11 | Hfi Innovation Inc | Método y aparato de codificación de árbol para codificación separada con restricciones en tamaño de cu mínimo. |
CN114503558B (zh) * | 2019-09-30 | 2023-10-20 | 华为技术有限公司 | 插值滤波器在仿射运动补偿中的适应性使用 |
BR112022005894A2 (pt) | 2019-09-30 | 2022-06-21 | Huawei Tech Co Ltd | Uso de filtro de interpolação com base em dct e de filtro de interpolação bilinear aprimorado em compensação de movimento afim |
CN117528080A (zh) * | 2019-10-14 | 2024-02-06 | 字节跳动有限公司 | 视频处理中色度残差的联合编解码与滤波 |
WO2021073631A1 (en) | 2019-10-18 | 2021-04-22 | Beijing Bytedance Network Technology Co., Ltd. | Interplay between subpictures and in-loop filtering |
WO2021093730A1 (en) * | 2019-11-11 | 2021-05-20 | Mediatek Inc. | Method and apparatus of signaling adaptive motion vector difference resolution in video coding |
WO2021134666A1 (zh) * | 2019-12-31 | 2021-07-08 | 北京大学 | 视频处理的方法与装置 |
KR20220123707A (ko) | 2020-01-07 | 2022-09-08 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 강화된 보간 필터에 대한 움직임 벡터 범위 도출 |
US11445176B2 (en) * | 2020-01-14 | 2022-09-13 | Hfi Innovation Inc. | Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding |
CN112203086B (zh) * | 2020-09-30 | 2023-10-17 | 字节跳动(香港)有限公司 | 图像处理方法、装置、终端和存储介质 |
CN112203085B (zh) * | 2020-09-30 | 2023-10-17 | 字节跳动(香港)有限公司 | 图像处理方法、装置、终端和存储介质 |
US12058310B2 (en) * | 2021-02-26 | 2024-08-06 | Lemon Inc. | Methods of coding images/videos with alpha channels |
CN119032576A (zh) * | 2022-04-13 | 2024-11-26 | 联发科技股份有限公司 | 视频编解码系统中对颜色分量使用单独分割树的方法和装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2509440C2 (ru) * | 2009-06-12 | 2014-03-10 | Квэлкомм Инкорпорейтед | Многовидовое видео кодирование в системах мреg-2 |
US8995776B2 (en) * | 2010-06-17 | 2015-03-31 | Sharp Kabushiki Kaisha | Image filter device, decoding apparatus, encoding apparatus, and data structure |
RU2551207C2 (ru) * | 2009-12-17 | 2015-05-20 | Телефонактиеболагет Лм Эрикссон (Пабл) | Способ и устройство для кодирования видео |
US20150271487A1 (en) * | 2014-03-21 | 2015-09-24 | Qualcomm Incorporated | Using a current picture as a reference for video coding |
US20150304662A1 (en) * | 2012-04-12 | 2015-10-22 | Mediatek Singapore Pte. Ltd. | Method and apparatus for block partition of chroma subsampling formats |
US20150373332A1 (en) * | 2012-12-17 | 2015-12-24 | Lg Electronics Inc. | Method for encoding/decoding image, and device using same |
US20150382022A1 (en) * | 2014-06-26 | 2015-12-31 | Qualcomm Incorporated | Bitstream conformance constraints in scalable video coding |
US20160057419A1 (en) * | 2013-04-05 | 2016-02-25 | Canon Kabushiki Kaisha | Method and device for determining the value of a quantization parameter |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130049526A (ko) | 2011-11-04 | 2013-05-14 | 오수미 | 복원 블록 생성 방법 |
US9532046B2 (en) * | 2012-04-16 | 2016-12-27 | Qualcomm Incorporated | Reference picture set prediction for video coding |
CN103634603B (zh) | 2012-08-29 | 2017-07-07 | 中兴通讯股份有限公司 | 视频编解码方法、装置及系统 |
US10015515B2 (en) * | 2013-06-21 | 2018-07-03 | Qualcomm Incorporated | Intra prediction from a predictive block |
US9774879B2 (en) | 2013-08-16 | 2017-09-26 | Sony Corporation | Intra-block copying enhancements for HEVC in-range-extension (RExt) |
US11470339B2 (en) | 2013-08-27 | 2022-10-11 | Qualcomm Incorporated | Residual prediction for intra block copying |
AU2013228045A1 (en) * | 2013-09-13 | 2015-04-02 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding video data |
JP6359101B2 (ja) * | 2013-10-14 | 2018-07-18 | マイクロソフト テクノロジー ライセンシング,エルエルシー | ビデオ及び画像の符号化及び復号のためのイントラブロックコピー予測モードの特徴 |
WO2015078304A1 (en) | 2013-11-27 | 2015-06-04 | Mediatek Singapore Pte. Ltd. | Method of video coding using prediction based on intra picture block copy |
US9883197B2 (en) * | 2014-01-09 | 2018-01-30 | Qualcomm Incorporated | Intra prediction of chroma blocks using the same vector |
US10368092B2 (en) * | 2014-03-04 | 2019-07-30 | Microsoft Technology Licensing, Llc | Encoder-side decisions for block flipping and skip mode in intra block copy prediction |
US9918105B2 (en) * | 2014-10-07 | 2018-03-13 | Qualcomm Incorporated | Intra BC and inter unification |
CN106797475B (zh) | 2014-10-08 | 2019-12-10 | 联发科技股份有限公司 | 视频编码方法 |
CN105163116B (zh) * | 2015-08-29 | 2018-07-31 | 华为技术有限公司 | 图像预测的方法及设备 |
US10212444B2 (en) * | 2016-01-15 | 2019-02-19 | Qualcomm Incorporated | Multi-type-tree framework for video coding |
-
2017
- 2017-05-26 CA CA3025490A patent/CA3025490A1/en not_active Abandoned
- 2017-05-26 WO PCT/CN2017/086049 patent/WO2017206803A1/en unknown
- 2017-05-26 US US16/304,209 patent/US20200322599A1/en not_active Abandoned
- 2017-05-26 CN CN201780026110.7A patent/CN109076214A/zh active Pending
- 2017-05-26 EP EP17805749.3A patent/EP3456043A4/en not_active Withdrawn
- 2017-05-26 CN CN201780026466.0A patent/CN109076210B/zh active Active
- 2017-05-26 US US16/301,772 patent/US11089323B2/en active Active
- 2017-05-26 EP EP17805748.5A patent/EP3449630B1/en active Active
- 2017-05-26 WO PCT/CN2017/086065 patent/WO2017206804A1/en unknown
- 2017-05-26 RU RU2018145683A patent/RU2710667C1/ru active
- 2017-05-31 TW TW106117843A patent/TWI702830B/zh active
- 2017-05-31 TW TW106117846A patent/TWI652939B/zh not_active IP Right Cessation
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2509440C2 (ru) * | 2009-06-12 | 2014-03-10 | Квэлкомм Инкорпорейтед | Многовидовое видео кодирование в системах мреg-2 |
RU2551207C2 (ru) * | 2009-12-17 | 2015-05-20 | Телефонактиеболагет Лм Эрикссон (Пабл) | Способ и устройство для кодирования видео |
US8995776B2 (en) * | 2010-06-17 | 2015-03-31 | Sharp Kabushiki Kaisha | Image filter device, decoding apparatus, encoding apparatus, and data structure |
US20150304662A1 (en) * | 2012-04-12 | 2015-10-22 | Mediatek Singapore Pte. Ltd. | Method and apparatus for block partition of chroma subsampling formats |
US20150373332A1 (en) * | 2012-12-17 | 2015-12-24 | Lg Electronics Inc. | Method for encoding/decoding image, and device using same |
US20160057419A1 (en) * | 2013-04-05 | 2016-02-25 | Canon Kabushiki Kaisha | Method and device for determining the value of a quantization parameter |
US20150271487A1 (en) * | 2014-03-21 | 2015-09-24 | Qualcomm Incorporated | Using a current picture as a reference for video coding |
US20150382022A1 (en) * | 2014-06-26 | 2015-12-31 | Qualcomm Incorporated | Bitstream conformance constraints in scalable video coding |
Also Published As
Publication number | Publication date |
---|---|
TW201804796A (zh) | 2018-02-01 |
TWI702830B (zh) | 2020-08-21 |
EP3449630A4 (en) | 2019-11-27 |
EP3456043A4 (en) | 2019-11-27 |
CA3025490A1 (en) | 2017-12-07 |
EP3449630A1 (en) | 2019-03-06 |
TWI652939B (zh) | 2019-03-01 |
CN109076214A (zh) | 2018-12-21 |
WO2017206803A1 (en) | 2017-12-07 |
WO2017206804A1 (en) | 2017-12-07 |
EP3449630B1 (en) | 2024-07-10 |
US11089323B2 (en) | 2021-08-10 |
US20190222859A1 (en) | 2019-07-18 |
TW201804804A (zh) | 2018-02-01 |
EP3456043A1 (en) | 2019-03-20 |
CN109076210B (zh) | 2021-04-09 |
US20200322599A1 (en) | 2020-10-08 |
CN109076210A (zh) | 2018-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2710667C1 (ru) | Способ и устройство привязки к текущему изображению для кодирования видео | |
US11889056B2 (en) | Method of encoding or decoding video blocks by current picture referencing coding | |
CN111869216B (zh) | 用于视频编解码系统的语法处理的方法和装置 | |
EP3731527B1 (en) | Method and apparatus of palette mode coding for colour video data | |
TWI646829B (zh) | 一種視訊編碼系統使用的視訊編碼方法及裝置 | |
CN113039782A (zh) | 视频编解码中的子块去块方法及装置 | |
WO2021093730A1 (en) | Method and apparatus of signaling adaptive motion vector difference resolution in video coding |