MX2011004850A - Codificador de imagenes y decodificador de imagenes. - Google Patents
Codificador de imagenes y decodificador de imagenes.Info
- Publication number
- MX2011004850A MX2011004850A MX2011004850A MX2011004850A MX2011004850A MX 2011004850 A MX2011004850 A MX 2011004850A MX 2011004850 A MX2011004850 A MX 2011004850A MX 2011004850 A MX2011004850 A MX 2011004850A MX 2011004850 A MX2011004850 A MX 2011004850A
- Authority
- MX
- Mexico
- Prior art keywords
- unit
- region
- processing
- signal
- predictive
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 62
- 238000012545 processing Methods 0.000 claims description 257
- 238000013139 quantization Methods 0.000 claims description 134
- 230000009466 transformation Effects 0.000 claims description 66
- 238000003672 processing method Methods 0.000 claims description 33
- 230000008859 change Effects 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 8
- 230000001131 transforming effect Effects 0.000 claims description 6
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims 2
- 238000007781 pre-processing Methods 0.000 abstract description 41
- 238000010586 diagram Methods 0.000 description 17
- 238000011002 quantification Methods 0.000 description 11
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000013213 extrapolation Methods 0.000 description 7
- 238000011426 transformation method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
- H03M7/42—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
- H03M7/4006—Conversion to or from arithmetic code
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Un codificador de imágenes incluye una unidad de preprocesamiento 1 para dividir una señal de imagen en dos bloques bidimensionales de un tamaño prescrito, así como para decidir, para cada uno de los bloques divididos, el tipo de región a la que el bloque pertenece, así como genera datos comprimidos al ejecutar, para cada bloque dividido por la unidad de preprocesamiento 1, el procesamiento de codificación correspondiente al tipo de región decidido por la unidad de preprocesamiento 1; esto hace posible ejecutar un procesamiento de codificación adecuado para cada región en una imagen, pudiendo de esta manera implementar un codificador de imágenes capaz de mejorar la eficiencia de la codificación.
Description
CODIFICADOR DE IMÁGENES Y DECODIFICADOR DE IMÁGENES
CAMPO TÉCNICO DE LA INVENCIÓN
La presente invención se refiere a un codificador de imágenes que realiza codificación de longitud variable de una señal de imágenes y a un decodificador de imágenes para decodificar la señal de imágenes sometida a la codificación de longitud variable por parte del codificador de imágenes.
ANTECEDENTES DE LA TÉCNICA ANTERIOR
Como un codificador de imágenes convencional para realizar la codificación intracuadro (intracodificación), se describirá un codificador de imágenes que emplea estándares internacionales.
Un codificador de imágenes convencional transforma una imagen de un ámbito espacial a un ámbito de frecuencia al dividir la imagen en bloques de 8 pixeles ? 8 líneas y al aplicar una transformación de coseno discreta bidimensional (DCT, por sus siglas en inglés) a cada bloque dividido, tal y como lo hacen ISO/IEC10918 (conocido comúnmente como JPEG: véase Documento Distinto a Patente 1) o ISO/IEC14496-2 (conocido comúnmente como MPEG-4 visual: véase Documento Distinto a Patente 2).
Entonces, el procesamiento predictivo, que se basa en las diferencias entre los coeficientes de transformada de un bloque objetivo de
codificación (coeficientes de transformada desde el ámbito espacial al ámbito de frecuencia) y los coeficientes de transformada de bloques adyacentes al bloque, se realiza para obtener los coeficientes de transformada residual de predicción.
Después de ello, el procesamiento de cuantificación prescrito de los coeficientes de transformada residual de predicción, se realiza para obtener los coeficientes de cuantificación, seguido por la codificación de longitud variable (codificación de Huffman) de los coeficientes de cuantificación.
La figura 2 es un diagrama que muestra un ejemplo de una imagen.
Como se muestra en la figura 2, la imagen generalmente incluye toda una serie de temas.
De conformidad con ello, existen distintas regiones como una región plana en donde una señal de imágenes cambia poco (el cielo de fondo, por ejemplo), una región en donde el cambio uniforme continúa (pradera de primer plano, por ejemplo) y una región compleja en donde una señal de imágenes cambia de forma abrupta (una región de árboles en el centro, por ejemplo).
En los bordes en las fronteras entre las regiones, la señal de imágenes tiene cambios locales muy abruptos.
La figura 3 es un diagrama que muestra características de la señal de imágenes en dos regiones (región de cielo y región de árboles) en
una imagen similar a la imagen de la figura 2.
En el caso de una señal de imagines de 8 bits, aunque tiene una gradación de 256 pasos de 0 a 255, se ha encontrado que la señal de imágenes se distribuye en una escala muy estrecha de alrededor de 60 a 110 en la región de cielo. En contraste con ello, se ha encontrado, en la región de árboles, que la señal de imágenes se distribuye de forma casi uniforme a lo largo de todos los pasos 0 a 255.
Al realizar una DCT bidimensional de tamaño 8><8 en las dos regiones, seguido por la medición de la energía eléctrica de los coeficientes de transformada de la DCT bidimensional, se encuentra que, aunque casi todos los componentes en la región de cielo tienen solamente una energía eléctrica débil, muchos coeficientes de AC (componentes de corriente alterna) tienen una energía eléctrica considerablemente grande en la región de árboles.
En particular, se encuentra en la región de árboles que la energía eléctrica grande aparece en componentes de AC de baja frecuencia como (0, 1) y (1 , 0) cerca del componente (0, 0) que es el componente de corriente directa (DC, por sus siglas en inglés) (para hacer que la figura sea más legible, la energía eléctrica del componente de corriente directa es cero en las figuras 4A y 4B. En las figuras 4A y 4B, aunque se muestran solamente valores de energía eléctrica con valores positivos, los coeficientes de transformada reales adoptan valores tanto positivos como negativos).
Documento de la técnica anterior
Documento Distinto a Patente
Documento Distinto a Patente 1 : ISO/IEC 10918-1 "Information technology-Digital compression and coding of continuous-tone still images-Part 1 : Requirements and guidelines".
Documento Distinto a Patente 2: ISO/IEC 14496-2 "Information technology-Codíng of audio-visual objects-Part 2: Visual".
BREVE DESCRIPCIÓN DE LA INVENCIÓN
Con la configuración anterior, el codificador de imágenes convencional codifica la totalidad de la señal de imágenes en una imagen a través del mismo procesamiento de codificación, aunque la imagen generalmente incluye una región en donde la señal de imágenes varía considerablemente y una región en donde varía poco. De conformidad con ello, el procesamiento de codificación adecuado para una región en donde la señal de imágenes varia poco, no será apropiado para una región en donde la señal de imágenes varía considerablemente y el procesamiento adecuado para una región en donde la señal de imágenes varía considerablemente no será apropiado para una región en donde la señal de imágenes varía poco, lo que en ocasiones produce el problema de deterioro de la eficiencia de la codificación.
La presente invención se implementa para resolver el problema anterior. Por lo tanto, un propósito de la presente invención consiste en proveer un codificador de imágenes capaz de incrementar la eficiencia de codificación al realizar el procesamiento de codificación adecuado para cada región en una imagen.
Además, un propósito de la presente invención consiste en proveer un decodificador de imágenes capaz de decodificar la señal de imágenes codificada por el codificador de imágenes.
Un codificador de imágenes de conformidad con la presente invención se configura de tal manera que incluye una unidad divisora de bloques para dividir una señal de imagen en dos bloques bidimensionales de un tamaño prescrito; así como una unidad de decisión de tipo de región para decidir, para cada bloque que pasa a través de la división a través de la unidad divisora de bloques, a qué tipo de región pertenece el bloque, y esa unidad de codificación genera datos comprimidos al ejecutar, para cada bloque que pasa a través de la división a través de la unidad divisora de bloques, el procesamiento de codificación correspondiente al tipo de región decidido por la unidad de decisión de tipo de región.
De conformidad con la presente invención, dado que se configura de tal manera que incluye la unidad divisora de bloques para dividir una señal de imagen en dos bloques bidimensionales de un tamaño prescrito; y la unidad de decisión de tipo de región para decidir, para cada bloque que pasa a través de la división a través de la unidad divisora de bloques, a qué
tipo de región pertenece el bloque, y dado que la unidad de codificación genera datos comprimidos al ejecutar, para cada bloque que pasa a través de la división a través de la unidad divisora de bloques, el procesamiento de codificación correspondiente al tipo de región decidido por la unidad de decisión de tipo de región, es capaz de ejecutar el procesamiento de codificación adecuado para cada región en una imagen, ofreciendo de esta manera la ventaja de ser capaz de mejorar la eficiencia de codificación.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
La figura 1 es un diagrama de bloques que muestra una configuración de un codificador de imágenes de una modalidad 1 de conformidad con la presente invención;
La figura 2 es una vista que muestra un ejemplo de una imagen; La figura 3 es un diagrama que muestra características de la señal de imágenes en dos regiones (la región de cielo y la región de árboles) en una imagen similar a la imagen de la figura 2;
Las figuras 4A y 4B son diagramas que muestran las energías eléctricas de los coeficientes de AC individuales en las dos regiones (la región de cielo y la región de árboles) en la imagen similar a la imagen de la figura 2;
La figura 5 es un diagrama de bloques que muestra una configuración de un codificador de imágenes de una modalidad 3 de conformidad con la presente invención;
La figura 6 es un diagrama de bloques que muestra una configuración de un decodificador de imágenes de una modalidad 4 de conformidad con la presente invención;
La figura 7 es un diagrama de bloques que muestra una configuración de un decodificador de imágenes de una modalidad 5 de conformidad con la presente invención;
Las figuras 8A y 8B son diagramas que muestran los pixeles de un bloque objetivo de codificación y otros similares; y
La figura 9 es un diagrama que muestra los pixeles de un bloque objetivo de codificación y otros similares.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
El mejor modo de realización de la invención será descrito ahora hacienda referencia a los dibujos anexos para explicar la presente invención con mayor detalle.
Modalidad 1
La figura 1 es un diagrama de bloques que muestra una configuración de un codificador de imágenes de una modalidad 1 de conformidad con la presente invención.
En la figura 1 , cuando una señal de imágenes es introducida, una unidad de preprocesamiento 1 ejecuta el procesamiento de dividir la señal
de imágenes en bloques bidimensionales con un tamaño prescrito (el bloque se denominará "macrobloque" de ahora en adelante de conformidad con MPEG), así como de suministrar la señal de imágenes de cada macrobloque (denominado "señal de macrobloque" en lo sucesivo) a una unidad transformadora de señales 2.
Además, la unidad de preprocesamiento 1 realiza el procesamiento de decidir el tipo de región a la que pertenece cada macrobloque (como una región plana, región de borde y región compleja), así como de suministrar una señal resultante de decisión de región que indica el tipo de región a la unidad transformadora de señales 2, una unidad de procesamiento predictivo de coeficiente de transformada 3, una unidad de cuantificación 4 y una unidad de codificación de longitud variable 5.
De forma incidental, la unidad de preprocesamiento 1 constituye una unidad divisora de bloques y una unidad de decisión de tipo de región.
La unidad transformadora de señales 2, unidad de procesamiento predictivo de coeficiente de transformada 3, unidad de cuantificación 4 y unidad de codificación de longitud variable 5, constituyen una unidad de codificación para ejecutar el procesamiento de codificación correspondiente al tipo de región indicado por la señal resultante de decisión de región para cada macrobloque que pasa a través de la división a través de la unidad de preprocesamiento 1 para generar datos comprimidos.
La unidad transformadora de señales 2 es una unidad de procesamiento (unidad de procesamiento para ejecutar parte del
procesamiento de codificación) para dividir la señal de ámbito espacial, que es la salida de la señal de macrobloque de la unidad de preprocesamiento 1, en bloques con un tamaño prescrito, para transformar cada bloque a una señal de ámbito de frecuencia, así como para generar los coeficientes de transformada de ello. Por lo tanto, el tamaño de bloque a ser sujeto al procesamiento de transformación corresponde al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de preprocesamiento 1 , asi como la unidad transformadora de señales 2 divide la señal de macrobloque de entrada en bloques de ese tamaño, así como transforma cada señal de bloque después de la división de una señal de ámbito espacial a una señal de ámbito de frecuencia.
La unidad de procesamiento predictivo de coeficiente de transformada 3 es una unidad de procesamiento (unidad de procesamiento para ejecutar parte del procesamiento de codificación) para generar coeficientes de transformada residual de predicción al realizar el procesamiento predictivo entre los coeficientes de transformada del bloque objetivo de codificación y los coeficientes de transformada de los bloques adyacentes al bloque objetivo de codificación. La unidad de procesamiento predictivo de coeficiente de transformada 3 realiza el procesamiento predictivo mediante un método de procesamiento predictivo correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región a partir de la unidad de preprocesamiento 1.
La unidad de cuantificación 4 es una unidad de procesamiento
(unidad de procesamiento para ejecutar parte del procesamiento de codificación) para calcular los coeficientes de cuantificación al realizar el procesamiento de cuantificación de los coeficientes de transformada residual de predicción generados por la unidad de procesamiento predictivo de coeficiente de transformada 3. La unidad de cuantificación 4 realiza el procesamiento de cuantificación utilizando un parámetro de cuantificación y una tabla de cuantificación correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de preprocesamiento 1.
Aquí, la "tabla de cuantificación" es una tabla que almacena los valores de ponderación para las frecuencias y el "parámetro de cuantificación" es un valor de ponderación para la tabla de cuantificación.
La unidad de codificación de longitud variable 5 es una unidad de procesamiento (unidad de procesamiento para ejecutar parte del procesamiento de codificación) para generar datos comprimidos al ejecutar el procesamiento de codificación de longitud variable de los coeficientes de cuantificación calculados por la unidad de cuantificación 4. La unidad de codificación de longitud variable 5 realiza el procesamiento de codificación de longitud variable usando una tabla de palabras de código de Huffman (tabla de palabras de códigos de longitud variable) correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de preprocesamiento 1.
Además, la unidad de codificación de longitud variable 5 codifica
la salida de la señal resultante de decisión de región de la unidad de preprocesamiento 1 , incluye los datos codificados de la señal resultante de decisión de región dentro de los datos comprimidos, así como los suministra al decodificador de imágenes u otro similar.
A continuación de describirá la operación.
Recibiendo la señal de imágenes, la unidad de preprocesamiento 1 divide la señal de imágenes en macrobloques, que son bloques bidimensionales con un tamaño prescrito, así como suministra la señal de macrobloque a la unidad transformadora de señales 2 como la señal de imágenes de cada macrobloque.
Además, la unidad de preprocesamiento 1 decide el tipo de región a la que pertenece el macrobloque y suministra la señal resultante de decisión de región que indica el tipo de región a la unidad transformadora de señales 2, la unidad de procesamiento predictivo de coeficiente de transformada 3, la unidad de cuantificación 4 y la unidad de codificación de longitud variable 5.
La presente modalidad 1 describe los tres tipos a manera de ejemplo: una "región plana" en donde la señal de imágenes varía poco; una "región de borde" en donde la señal de imágenes cambia de forma abrupta debido a una frontera que la región incluye; y "región compleja" en donde la señal de imágenes varía considerablemente.
Un método de decisión del tipo de región usado por la unidad de preprocesamiento 1 , será descrito de forma concreta más adelante.
La unidad de preprocesamiento 1 mide, por ejemplo, la distribución de frecuencia de la señal de imágenes, según se muestra en la figura 3, de manera macrobloque por macrobloque.
Después de medir la distribución de frecuencia de la señal de imágenes de manera macrobloque por macrobloque, la unidad de preprocesamiento 1 establece una escala estrecha y decide una región en la que la distribución de frecuencia de la señal de imágenes se concentra en la escala estrecha como una "región plana".
Además, la unidad de preprocesamiento 1 decide una región en la que la distribución de frecuencia de la señal de imágenes se concentra en dos escalas estrechas como una "región de borde".
Adicionalmente, la unidad de preprocesamiento 1 decide una región en la que la distribución de frecuencia de la señal de imágenes se extiende a lo largo de una amplia escala como una "región compleja".
Como los otros métodos de decisión, puede concebirse lo siguiente.
Por ejemplo, para obtener los resultados mostrados en las figuras 4A y 4B, puede aducirse un método que transforme la señal de imágenes a una señal de ámbito de frecuencia de forma bloque por bloque, asi como que la clasifique en tres regiones (región plana, región de borde y región compleja) al dividir la energía eléctrica total, excepto para el componente de corriente directa (componente de DC, por sus siglas en inglés) de los coeficientes de transformada en tres niveles usando dos umbrales.
Como técnicas similares, por ejemplo, puede concebirse un método que mida la energía eléctrica del componente en (0, 1) en las direcciones (horizontal, vertical) mostradas en las figuras 4A y 4B y la energía eléctrica del componente en (1 , 0) y que clasifica la suma o promedio de la energía eléctrica de los dos componentes en tres niveles usando dos umbrales; o bien un método que mida la suma y proporción de la energía eléctricas de los componentes en (0, 1-7) y las energías eléctricas de los componentes en (1-7, 0), así como clasifique los resultados medidos en tres niveles empleando dos umbrales.
Cuando una imagen tiene un borde en una dirección horizontal, dado que los coeficientes no se producen en los componentes 1-7 en la dirección horizontal, pero grandes coeficientes se producen en los componentes 1-7 en la dirección vertical, la presencia o ausencia del borde puede detectarse con una gran exactitud midiéndolos en la dirección horizontal y la dirección vertical por separado.
Recibiendo la señal de macrobloque y la señal resultante de decisión de región de la unidad de preprocesamiento 1 , la unidad transformadora de señales 2 divide los macrobloques divididos por la unidad de preprocesamiento 1 de conformidad con el tamaño correspondiente al tipo de región indicado por la señal resultante de decisión de región, así como transforma cada señal de bloque después de la división de la señal de ámbito espacial a la señal de ámbito de frecuencia.
El tamaño de bloque correspondiente al tipo de región será
descrito a continuación.
En una "región plana", dado que el cambio de la señal dentro del macrobloque es pequeño, así como casi la totalidad de los componentes de AC de los coeficientes de transformada tienen valores pequeños, según se muestra en la figura 4A, incluso si el tamaño del bloque se encuentra ampliado a 40.64 cm x 40.64 cm, casi la totalidad de los componentes de AC de los coeficientes de transformada dentro del bloque tienen también valores pequeños.
Por lo tanto, cuando se toma una decisión de la "región plana", se selecciona un bloque grande. De este modo, la eficiencia de transformación se ve incrementada en la transformación al ámbito de frecuencia.
Por el contrario, en el caso de una "región compleja", dado que un bloque grande contiene toda una pluralidad de texturas y no puede lograr la eficiencia de la transformación de frecuencia, reducir el tamaño de un bloque tal y como a 10.16 cm x 10.16 cm puede mejorar la eficiencia de la transformación de frecuencia (dado que la reducción en el tamaño del bloque permite el procesamiento de una textura uniforme, puede incrementar la eficiencia de la transformación de frecuencia).
Sin embargo, de conformidad con una velocidad de transferencia objetivo o un objeto de la codificación de imagen relacionado con una calidad de imagen codificada, la eficiencia de codificación puede incrementarse al ejecutar el procesamiento de transformación de una forma diferente. Por
ejemplo, cuando hay un objeto para expresar variaciones delicadas en una región plana, podría ser mejor transformar una "región plana" en pequeños bloques y, cuando resulte necesario realizar la compresión a una velocidad de transferencia muy baja con consecuencias para la calidad de la imagen, podría ser mejor transformar una "región compleja" en bloques grandes.
Aquí, aunque se muestra una cubierta en donde la unidad transformadora de señales 2 cambia el tamaño para la división en bloques, también es posible cambiar el método de transformada de una señal de conformidad con el tipo de región indicado por la señal resultante de decisión de región.
Aunque la unidad transformadora de señales 2 comúnmente emplea una transformación de coseno discreto (DCT, por sus siglas en inglés) como un método de transformada de señal, ésta puede también utilizar un método de transformada como una transformación de onda, transformación de Haar, transformación de Hadamard y transformación de pendiente.
Estos métodos de transformada tienen sus propios méritos. Por ejemplo, dado que la transformación de Haar y la transformación de Hadamard se construyen a partir de solamente dos coeficientes de transformada de "+G y "-1", la transformación puede lograrse únicamente mediante adición y sustracción. Por lo tanto, tienen una alta probabilidad de ser capaz de transformarse con una pequeña cantidad de operación, así como de evitar errores operativos por parte de un procesador, como en la operación en coma flotante.
La transformación de onda tiene el mérito de ser capaz de realizar la transformación sin generar una frontera de bloque de una imagen codificada.
La transformación de pendiente, que se transforma a componentes linealmente inclinados como V o W, tiene el mérito de ser capaz de realizar la transformación con un pequeño número de coeficientes para una señal en donde el brillo o color cambian lentamente.
Para una "región plana", es concebible seleccionar la transformación de onda que pueda evitar la ocurrencia de una frontera de bloque, dado que una frontera de bloque es relevante en estas región, o bien seleccionar la transformación de Haar o la trasformación de Hadamard que pueda evitar la ocurrencia del error operativo, dado que el error operativo es relevante en esta región.
Además, para la "región plana", dado que los componentes de AC se producen poco como se describe anteriormente, resulta difícil obtener la diferencia en la eficiencia de transformación. Por lo tanto, en lugar de usar una transformación como DCT con una alta eficiencia de transformación, aunque una gran cantidad de operaciones, puede concebirse un 'método de seleccionar una transformación de Haar o una transformación de Hadamard capaz de reducir la cantidad de operaciones, aunque su eficiencia de transformación sea inferior a DCT. De manera alternativa, en el caso de una región plana que incluya componentes con una gradación que varía de forma única y sutil, puede concebirse un método de seleccionar la transformación de
pendiente capaz de emplear componentes inclinados.
Al igual que para una "región compleja", dado que un frontera de bloque es irrelevante, puede concebirse un método para seleccionar una DCT u otro similar. De manera alternativa, dado que se producen muchos coeficientes de transformada de componentes de AC, puede concebirse un método para seleccionar una DCT con una eficiencia de transformación más alta.
Al igual que para una "región de borde", puede concebirse un método para seleccionar una transformación de Haar o una transformación de Hadamard que pueda expresar un borde pronunciado para los componentes de borde en la dirección horizontal o vertical. Además, al igual que para los componentes oblicuos de borde, dado que son necesarios muchos componentes de AC, puede concebirse un método para seleccionar un DCT con una alta eficiencia de transformación.
De manera alternativa, cuando se selecciona un tamaño de bloque grande, el número de bits requeridos para la operación se incrementa, debido a la necesidad de manejar una gran cantidad de señales, aunque cuando se selecciona un tamaño de bloque pequeño, únicamente se maneja una cantidad pequeña de señales. De conformidad con ello, cuando se emplea un procesador con un número limitado de bits usados para las operaciones, puede concebirse un método para seleccionar una transformación como una transformación de Haar o una transformación de Hadamard que puede lograrse con una pequeña cantidad de operaciones
cuando se selecciona un tamaño de bloque grande, así como seleccionar una transformación como una DCT o una transformación de onda que requiera de una gran cantidad de operaciones cuando se selecciona un tamaño de bloque pequeño.
Por lo tanto, cambiar el método de transformada de conformidad con un propósito y aplicación de la codificación, puede satisfacer las necesidades.
Esto hace posible incrementar la eficiencia de compresión de codificación y la calidad de imagen subjetiva de la imagen decodificada.
De manera incidental, aunque la explicación anterior se realiza a manera de ejemplo que asigna un método de transformada particular a una región decidida en una correspondencia de uno a uno, también es posible dar prioridad a los métodos de transformada a ser usados para cada región como la transformación de Hadamard, DCT y transformación de onda para una "región plana", así como DCT, transformación de onda y transformación de Hadamard para la "región compleja"; así como añadir datos que indiquen qué método de transformada se selecciona para permitir la selección del método de transformada para cada región o para cada bloque.
Esto hace posible realizar el procesamiento de codificación empleando el método de transformada más apropiado, siendo de este modo capaces de lograr una alta eficiencia de codificación.
Recibiendo los coeficientes de transformada del macrobloque objetivo de codificación de la unidad transformadora de señales 2, la unidad
de procesamiento predictivo de coeficiente de transformada 3 realiza el procesamiento predictivo entre los coeficientes de transformada del bloque objetivo de codificación y los coeficientes de transformada de los bloques adyacentes al bloque objetivo de codificación (denominados "bloques adyacentes" en lo sucesivo en la presente) para generar los coeficientes de transformada residual de predicción.
Cuando la unidad de procesamiento predictivo de coeficiente de transformada 3 genera los coeficientes de transformada residual de predicción al ejecutar el procesamiento predictivo, sin embargo, ésta realiza el procesamiento predictivo usando el método de procesamiento predictivo correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de preprocesamiento 1.
A continuación se describirá el método de procesamiento predictivo correspondiente al tipo de región.
Al igual que para una "región plana", dado que los valores de los coeficientes de transformada son muy pequeños, tal y como se muestra en la figura 4A, el procesamiento predictivo de los coeficientes de AC puede producir un efecto muy pequeño.
Por lo tanto, la unidad de procesamiento predictivo de coeficiente de transformada 3 no realiza ningún procesamiento predictivo de los coeficientes de AC para un macrobloque decidido como una región plana.
Aunque MPEG-4 emplea un método para añadir, para cada macrobloque, una bandera de 1 bit denominada "ac_pred_flag", que indica si
realizar o no realizar el procesamiento predictivo de los coeficientes de AC, a los datos comprimidos sin excepción, "ac_pred_flag" puede excluirse cuando se decide que la región es una región plana, dado que la predicción de AC no se realiza en este caso.
De esta manera, los datos de 1 bit pueden reducirse para un macrobloque.
Al igual que para una "región de borde", se producen grandes coeficientes de transformada en los componentes (1-7, 0) (horizontal, vertical) en un bloque que incluye un borde horizontal, así como se producen en los componentes (0, 1-7) en un bloque que incluye un borde vertical.
Cuando los componentes de borde se producen a lo largo de una pluralidad de bloques, los bloques adyacentes tendrán casi los mismos coeficientes de transformada. Por lo tanto, muchos de los coeficientes de transformada residual de predicción se convierten casi a cero cuando se ejecuta el procesamiento predictivo de los coeficientes de transformada. De conformidad con ello, se espera que la eficiencia de codificación mejore considerablemente mediante el procesamiento de cuantificación post-etapa el procesamiento de codificación de longitud variable.
Por lo tanto, la unidad de procesamiento predictivo de coeficiente de transformada 3 siempre realiza el procesamiento predictivo de los coeficientes de AC para el macrobloque decidido como una región de borde.
En el caso de MPEG-4, esto hace posible reducir los datos de 1 bit de "ac_pred_flag" de la misma manera que en la .región plana.
Al igual que para una "región compleja", se producen muchos coeficientes de transformada, tal y como se muestra en la figura 4B, así como sus valores crecen.
Además, debido a la señal compleja, los bloques adyacentes no siempre tienen casi los mismos coeficientes de transformada.
Por lo tanto, al igual que para el procesamiento predictivo de los coeficientes de AC, se dispone de tal manera que permita la selección del procesamiento que pueda mejorar la eficiencia de codificación al generar datos que indiquen si ejecutar o no ejecutar el procesamiento predictivo de AC, así como añadiendo los datos a los datos comprimidos de la misma manera que "ac_pred_flag" de MPEG-4 convencional.
Al igual que para el procesamiento predictivo de los coeficientes de AC, puede concebirse una técnica para combinarlo con el procesamiento de cuantificación post-etapa de los coeficientes de AC.
En el procesamiento de cuantificación, usar un parámetro de cuantificación grande hará que muchos coeficientes de AC se cuantifiquen como cero, produciendo de esta manera un error de cuantificación grande.
Por otro lado, usar un parámetro de cuantificación pequeño hará que muchos coeficientes de AC se cuantifiquen como no cero, suprimiendo de esta manera el error de cuantificación.
Por lo tanto, el parámetro de cuantificación grande tiene poco efecto predictivo sobre los coeficientes de AC. De conformidad con ello, el procesamiento predictivo de AC no se realiza en absoluto. Esto hará posible
eliminar los datos que indican si se ejecuta o no se ejecuta el procesamiento predictivo de AC.
Por otro lado, el parámetro de cuantificación pequeño proporcionará ya sea el caso de tener un efecto predictivo sobre los coeficientes de AC o de no depender del estado de las señales de imágenes circundantes. Por lo tanto, los datos que indican si ejecutar o no el procesamiento predictivo de AC, se generan para determinar si ejecutar o no la predicción de AC. Esto mejorará la eficiencia de codificación del procesamiento predictivo de AC.
Al igual que el procesamiento predictivo de los coeficientes de
AC, puede utilizarse el método de MPEG-4 convencional que simplemente obtiene las diferencias entre siete coeficientes de AC de la salida de los coeficientes de transformada del bloque objetivo de codificación de la unidad transformadora de señales 2 y aquellos de los coeficientes de transformada de los bloques adyacentes. Además, también puede usarse un método que obtenga las diferencias después de ejecutar el procesamiento de ponderación prescrito de poner a la mitad o duplicar los coeficientes de transformada de los bloques adyacentes cuando se obtienen las diferencias, por ejemplo.
De manera alternativa, un método para mejorar la eficiencia de codificación cambiando el número de coeficientes de AC objetivo a someterse a la predicción, también puede ser empleado al ejecutar el procesamiento predictivo sobre únicamente tres coeficientes de AC para el coeficiente de DC, o bien en la totalidad de los 63 coeficientes de AC, por ejemplo.
En el caso de ejecutar el procesamiento de ponderación o cambiar el número de coeficientes de transformada a ser predichos, el parámetro que indica el valor de ponderación o el número de los coeficientes de AC objetivo a ser predichos, se incluye en la salida de los datos comprimidos déla unidad de codificación de longitud variable 5 que se describirá más adelante.
De manera alternativa, también puede concebirse un método que cambie el número de coeficientes de AC a ser predichos de conformidad con la región, como empleando solamente los siente coeficientes de AC horizontales o verticales en la "región de borde", aunque empleando la totalidad de los 63 coeficientes de AC en la "región compleja". Esto permitirá realizar el procesamiento predictivo adecuado para el estado de señal de cada región.
De manera incidental, el valor de ponderación puede fijarse en un único bloque o puede hacerse variar con los componentes individuales de los 63 coeficientes de AC. En este caso, los 63 valores de ponderación se colocan en los datos comprimidos.
Recibiendo los coeficientes de transformada residual de predicción de la unidad de procesamiento predictivo de coeficiente de transformada 3, la unidad de cuantificación 4 realiza el procesamiento de cuantificación de los coeficientes de transformada residual de predicción usando el parámetro de cuantificación y la tabla de cuantificación correspondiente al tipo de región indicado por la salida de la señal resultante
de decisión de región de la unidad de preprocesamiento 1 y calcula los coeficientes de cuantificación.
Normalmente, el parámetro de cuantificación y la tabla de cuantificación usada por la unidad de cuantificación 4, se especifican de conformidad con la magnitud de la cantidad de código objetivo dada al codificador de imágenes o con la magnitud de una cantidad de código que se ha producido en relación con ello. La presente modalidad 1, sin embargo, se encuentra configurada de tal manera que se especifican de conformidad con el tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de preprocesamiento 1.
El parámetro de cuantificación y la tabla de cuantificación correspondiente al tipo de región, se describirán a continuación.
En una "región plana", dado que la señal de imágenes cambia poco y casi todos los coeficientes de transformada adoptan valores pequeños, tal y como se muestra en la figura 4A, los coeficientes de transformada residual de predicción adoptarán también valores pequeños.
Por el contrario, en una "región compleja", dado que la señal de imágenes cambia considerablemente y muchos coeficientes de transformada adoptan valores grandes, tal y como se muestra en la figura 4B, los coeficientes de transformada residual de predicción tienen tendencia a adoptar valores grandes también.
En una "región de borde", dado que los coeficientes de transformada particulares adoptan valores grandes de conformidad con los
componentes de dirección del borde, los coeficientes de transformada residual de predicción adoptarán valores pequeños cuando la predicción de AC sea efectiva, aunque adoptan valores grandes cuando la predicción de AC no es efectiva.
De conformidad con ello, al ejecutar el procesamiento de codificación de alta calidad de imagen a una velocidad de compresión baja, el parámetro de cuantificación se especifica en un valor pequeño en la "región plana", de manera que proporcione una imagen que muestre mejor ligeros cambios, aunque plana.
Por otro lado, al ejecutar el procesamiento de codificación de imagen de poca calidad a una alta velocidad de compresión, el parámetro de cuantificación se especifica en un valor grande en la "región plana", de manera que se realice la totalidad de los coeficientes de cuantificación en cero, incrementando de esta manera la eficiencia de codificación de forma pronunciada.
En la "región compleja", el parámetro de cuantificación se hace grande, de manera que se suprima la ocurrencia de la cantidad de código.
En la "región de borde", un parámetro de cuantificación comparativamente pequeño se emplea para suprimir el ruido de codificación que tiene propensión a ocurrir en torno al borde.
De esta manera, establecer el parámetro de cuantificación de conformidad con el tipo de región hace posible mejorar la eficiencia de codificación.
Al igual que para la tabla de cuantificación, al establecer sus valores como valores pequeños o grandes, puede lograrse un efecto similar a aquel del parámetro de cuantificación. En el caso de la tabla de cuantificación, sin embargo, puede establecerse asignando ponderaciones para cada uno de los ámbitos de frecuencia de los coeficientes de transformada residual de predicción.
Por ejemplo, JPEG o MPEG describe, en la referencia estándar, los valores recomendados y valores iniciales que especifican el componente (0, 1) ó (1 , 0) de las figuras 4A y 4B en un valor comparativamente pequeño y el componente (7, 7) en un valor comparativamente grande.
Aunque el método de codificación convencional emplea una tabla de cuantificación que tiene el mismo valor a todo lo largo de la imagen, la presente modalidad 1 emplea la tabla de cuantificación que tiene valores distintos de una región a otra.
Los cuadros A-C son diagramas que muestran un ejemplo de la tabla de cuantificación.
En la "región plana", la totalidad de los valores de la tabla de cuantificación tiene un valor pequeño, tal y como se muestra en el cuadro A, de manera que pueda dar una imagen con variación muy pequeña.
En la "región compleja", los valores de la tabla de cuantificación se hacen más grandes, con un incremento de la frecuencia, tal y como se muestra en el cuadro C, de manera que los componentes de baja frecuencia puedan ser generados con una cantidad pequeña de código.
En la "región de borde", al igual que en la "región compleja", los
valores de la tabla de cuantificación se hacen más grandes, con un
incremento de la frecuencia. Sin embargo, tal y como se muestra en el cuadro
B, se especifican en valores más pequeños que los valores de la tabla de
cuantificación en la "región compleja".
CUADRO A
Ejemplo para la región plana
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
CUADRO B
Ejemplo para la región de borde
8 17 18 19 21 23 25 27
17 18 19 21 23 25 27 28
20 21 22 23 24 26 28 30
21 22 23 24 26 28 30 32
22 23 24 26 28 30 32 35
23 24 26 28 30 32 35 38
25 26 28 30 32 35 38 41
27 28 30 32 35 38 41 45
Valores iniciales de la tabla de cuantificación especificados por ISO/IEC
14496-2 (MPEG-4)
CUADRO C
Ejemplo para región compleja
16 11 10 16 24 40 51 61
12 12 14 19 26 58 60 55
14 13 16 24 40 57 69 56
14 17 22 29 51 87 80 62
18 22 37 56 68 109 103 77
24 35 55 64 81 104 113 92
49 64 78 87 103 121 120 101
72 92 95 98 112 100 103 199
Ejemplo de la tabla de cuantificación descrita en
ISO/IEC 10918-1 (JPEG)
De manera incidental, al igual que para los valores de la tabla de cuantificación, pueden fijarse como un estándar, de manera que tanto el codificador de imágenes como el decodificador de imágenes establezcan los mismos valores, o bien el codificador de imágenes pueda transmitir al decodificador de imágenes los valores de la tabla de cuantificación al ponerlos en los datos comprimidos, de manera que los valores de la tabla de cuantificación puedan actualizarse según se requiera.
De manera alternativa, también es posible preparar una pluralidad de tablas de cuantificación para las regiones individuales, de
manera que se permita la selección de una tabla de cuantificación, así como
codificar datos separados que indiquen qué tabla de cuantificación es seleccionada. Cuando la velocidad de compresión es alta, la cantidad de
código puede reducirse usando una tabla de cuantificación con valores grandes. Cuando la velocidad de compresión es baja, la calidad de la imagen
puede incrementarse usando una tabla de cuantificación con valores pequeños.
Recibiendo los coeficientes de cuantificación desde la unidad de cuantificación 4, la unidad de codificación de longitud variable 5 ejecuta el procesamiento de codificación de longitud variable de los coeficientes de cuantificación empleando una tabla de palabras de código de Huffman correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de preprocesamiento 1 , generando de este modo lose datos comprimidos.
El método de codificación convencional utiliza una tabla predeterminada de palabras de código de Huffman y un método de codificación aritmética, así como realiza el mismo procesamiento de codificación de longitud variable para todas las regiones en una imagen. En contraste con ello, la presente modalidad 1 cambia la tabla de palabras de código de Huffman y el método de codificación aritmética de conformidad con el tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de preprocesamiento 1 , permitiendo de esta manera un procesamiento de codificación de longitud variable más eficiente.
Los cuadros D y E son diagramas que muestran ejemplos de la tabla de palabras de código de Huffman.
CUADRO D
Ejemplo de palabra de código de Huffman para región plana
Asignar palabras de código más cortas a valores más
pequeños
CUADRO E
Ejemplo de palabra de código de Huffman para región compleja
Asignar palabras de código de igual longitud ya sea a
valores pequeños o grandes
En una "región plana", dado que los valores de coeficientes déla
transformación son pequeños, tal y como se muestra en la figura 4A, muchos coeficientes de cuantificación adoptan un valor pequeño.
De conformidad con ello, la tabla de palabras de código de Huffman optimizada para condiciones en las que muchos valores pequeños se producen tal y como se muestra en el cuadro D, se utiliza para permitir un incremento en la eficiencia del procesamiento de codificación de longitud variable.
En una "región compleja", dado que distintos valores de coeficiente de transformada que oscilan de grandes a pequeños se producen tal y como se muestra en la figura 4B, la tabla de palabras de código de Huffman optimizada para dichas condiciones tal y como se muestra en en el cuadro E, se utiliza para permitir un incremento en la eficiencia del procesamiento de codificación de longitud variable.
Aunque se muestra aquí un método en donde la unidad de codificación de longitud variable 5 cambia la tabla de palabras de código de Huffman, al igual que para el procesamiento denominado digitalización en zigzag que reordena datos de bloques dimensionales de 8 * 8 empleados por JPEG o MPEG en 64 datos de una sola dimensión, también es posible cambiar de conformidad con el tipo de región.
Por ejemplo, en una región plana o región compleja, dado que los coeficientes de transformada se reducen de modo uniforme de una región de frecuencia baja a una región de frecuencia alta, tal y como se muestra en las figuras 4A y 4B, la digitalización de zigzag convencional puede ser empleada. Sin embargo, en el caso de una región de borde, al igual que para un macrobloque que incluye un borde horizontal, por ejemplo, aunque los
coeficientes en una región de alta frecuencia en una dirección horizontal tienen solamente poca energía eléctrica, los coeficientes en una región de alta frecuencia en una dirección vertical tienen una energía eléctrica considerable. De conformidad con ello, la digitalización en la dirección vertical se realiza de forma preferencia. En contraste con ello, al igual que para un macrobloque que incluye un borde en una dirección vertical, el cambio se realiza para ejecutar la digitalización en una dirección horizontal de manera preferencial.
Generando los datos comprimidos según se ha descrito anteriormente, la unidad de codificación de longitud variable 5 codifica la salida de la señal resultante de decisión de región de la unidad de preprocesamiento 1 , así como transmite al decodificador de imágenes los datos codificados de la señal resultante de decisión de región incluyéndolos en los datos comprimidos.
Como resulta claro a partir de lo anterior, de conformidad con la presente modalidad 1 , se configura de tal manera que comprenda la unidad de preprocesamiento 1 que divide a la señal de imágenes en bloques bidimensionales con un tamaño prescrito y decide, para cada bloque que pasa a través de la división, el tipo de región a la que corresponde el bloque, así como para generar los datos comprimidos al ejecutar el procesamiento de codificación correspondiente al tipo de región decidido por la unidad de preprocesamiento 1 para cada bloque dividido por la unidad de preprocesamiento 1. De conformidad con ello, puede ejecutar el procesamiento de codificación apropiado para cada región en una imagen,
codificación.
De manera incidental, aunque la presente modalidad 1 se describe suponiendo que la totalidad de la unidad transformadora de señales 2, la unidad de procesamiento predictivo de coeficiente de transformada 3, la unidad de cuantificación 4 y la unidad de codificación de longitud variable 5, cambian su procesamiento interno de conformidad con el tipo de región decidido por la unidad de preprocesamiento 1 , no resulta necesario que todos ellos realicen el cambio. Por ejemplo, también es posible que parte de las mismas realice el cambio al mismo tiempo que se mejora la eficiencia de codificación.
Modalidad 2
La modalidad anterior 1 muestra un ejemplo en donde la unidad de preprocesamiento 1 decide el tipo de región y lo clasifica en tres tipos: "región plana", "región de borde" y "región compleja". La unidad de preprocesamiento , sin embargo, puede decidir el tipo de región y clasificarlo en dos tipos: "región de gradación alta requerida" y "región de gradación alta no requerida", por ejemplo.
Ahora se describirá un ejemplo concreto.
Al igual que para una señal de imágenes digitales, el número of bits de cada pixel determina la gradación.
Por ejemplo, un pixel de 8 bits puede expresar una gradación de 256 pasos de 0 a 255, mientras que un pixel de 12 bits puede expresar una
gradación de 2048 pasos de 0 a 2047.
A medida que se incrementa el número de pasos de gradación, la expresión de la señal de imágenes se enriquece y puede lograrse una calidad mayor. Sin embargo, un incremento en el volumen de datos provoca inconveniencia en el manejo.
En el caso de una señal de imagines ordinaria, la alta gradación no siempre es requerida a lo largo de una imagen complete, aunque es necesaria solamente para parte de la imagen en casi todos los casos.
Se describirá hacienda referencia a la figura 2. Al igual que para una región de árbol, dado que la señal de imágenes cambia de forma pronunciada en ese sitio, incluso si se logra proveer una señal fina, el ojo humano no puede percibirla. Además, dado que el procesamiento de codificación producirá una gran cantidad de ruido de codificación, el efecto de la alta gradación difícilmente se logra.
Por otro lado, al igual que para una región de cielo, cuando incluye sombras o gradación delicadas en donde el cielo azul gradualmente se torna más claro hacia el horizonte, la señal de imágenes cambia poco. De conformidad con ello, si el número de pasos de gradación es pequeño, el poder de la expresión se debilita. Por lo tanto, en ocasiones ocurre que las variaciones delicadas se pierden por complete y se expresan en un solo color, o bien la gradación que realmente varía poco a poco, cambia paso a paso de manera que se pierde una sensación de naturalidad.
De conformidad con ello, la presente modalidad 2 se configura
de tal manera que la unidad de preprocesamiento 1 distingue, como el tipo de región, entre la "región de gradación alta requerida" como una región de cielo y la "región de gradación alta no requerida" como una región de árbol.
Al igual que para la realización del procesamiento de transformación de la señal de macrobloque en la "región de gradación alta requerida", al transformar la salida de la señal de macrobloque de la unidad de preprocesamiento 1 de una señal de ámbito espacial a una señal de ámbito de frecuencia, la unidad transformadora de señales 2 incrementa la exactitud del procesamiento de transformación al incrementar la longitud de los bits a ser procesados, por ejemplo, realizando de esta manera el procesamiento con pocos errores.
Por otro lado, al igual que para la ejecución del procesamiento de transformación de la región de macrobloque en la "región de gradación alta no requerida", la longitud de los bits a ser procesados se acorta, por ejemplo, para reducir la carga de procesamiento, incluso si la exactitud del procesamiento de transformación se ve reducida.
Al generar los coeficientes de transformada residual de predicción ejecutando el procesamiento predictivo, la unidad de procesamiento predictivo de coeficiente de transformada 3 ejecuta, cuando el macrobloque objetivo de codificación se encuentra en la "región de gradación alta requerida", el procesamiento predictivo con pequeños errores empleando los coeficientes de transformada de los macrobloques adyacentes, de la misma manera que en la modalidad anterior 1.
Por otro lado, cuando el macrobloque objetivo de codificación se encuentra en la "región de gradación alta no requerida", por ejemplo, éste acorta la longitud de bits del procesamiento, para reducir la carga de procesamiento con costo para la exactitud del procesamiento predictivo.
Al ejecutar el procesamiento de cuantificación de la salida de los coeficientes de transformada residual de predicción de la unidad de procesamiento predictivo de coeficiente de transformada 3, la unidad de cuantificación 4 ejecuta, cuando el macrobloque objetivo de codificación se encuentra en la "región de gradación alta requerida", el procesamiento de cuantificación con un pequeño error de cuantificación utilizando un parámetro de cuantificación con un valor pequeño.
De manera alternativa, realiza el procesamiento de cuantificación con un pequeño error de cuantificación usando una tabla de cuantificación sin asignar ponderaciones en el ámbito de frecuencia o una tabla de cuantificación con ponderaciones pequeñas.
Por ejemplo, al emplear un pequeño valor como 1 - 4 como el parámetro de cuantificación en la cuantificación de los coeficientes de 12 bits de transformación residual de predicción, la salida de los coeficientes de cuantificación de la unidad de cuantificación 4 se convierte en 12 a 10 bits. Sin embargo, dado que muchos de ellos tienen originalmente valores pequeños de coeficientes de transformada, tal y como se muestra en la figura 4A, muchos de los coeficientes de cuantificación de salida tienen también valores pequeños.
Por otro lado, cuando el macrobloque objetivo de codificación se encuentra en la "región de gradación alta no requerida", se permite un error de cuantificación considerable. De conformidad con ello, el procesamiento de cuantificación se realiza utilizando un parámetro de cuantificación con un valor considerable o una tabla de cuantificación que tienen asignadas grandes cantidades de ponderación en el ámbito de frecuencia.
Por ejemplo, al usar un valor grande como 32 a 128 como el parámetro de cuantificación en la cuantificación de los coeficientes de transformada residual de predicción de 12 bits, la salida de los coeficientes de cuantificación de la unidad de cuantificación 4 se torna de 7 a 5 bits y muchos coeficientes de cuantificación se hacen cero al mismo tiempo.
Al ejecutar el procesamiento de codificación de longitud variable de la salida de los coeficientes de cuantificación de la unidad de cuantificación 4, la unidad de codificación de longitud variable 5 ejecuta, cuando el macrobloque objetivo de codificación se encuentra en la "región de gradación alta requerida", el procesamiento de codificación de longitud variable empleando una tabla de palabras de código de Huffman (véase el cuadro D) optimizada para condiciones en las que una gran cantidad de valores pequeños se producen debido a que muchos coeficientes de cuantificación tienen valores pequeños.
Por otro lado, cuando el macrobloque objetivo de codificación se encuentra en la "región de gradación alta no requerida", muchos coeficientes de cuantificación tienen un valor cero. De conformidad con ello, el
procesamiento de codificación de longitud variable se ejecuta empleando una tabla de palabras de código de Huffman optimizada para condiciones en las que se producen muchos valores cero.
Como resulta claro a partir de lo anterior, de conformidad con la presente modalidad 2, se configura de tal manera que decida la "región de gradación alta requerida" y la "región de gradación alta no requerida", asi como ejecute el procesamiento de codificación correspondiente al resultado de la decisión. De conformidad con ello, de la misma manera que en la modalidad anterior 1 , ofrece la ventaja de ser capaz de incrementar la eficiencia de codificación.
Modalidad 3
Aunque la modalidad anterior 1 muestra un ejemplo aplicado al método de codificación de ejecución del procesamiento predictivo de los coeficientes de transformada de MPEG-2 ó MPEG-4, también resulta aplicable a un método de codificación de ejecución del procesamiento predictivo de la señal de imágenes en un ámbito espacial empleado en ISO/IEC 14496-10 (conocido comúnmente como AVC (el mismo método que ITU-T H.264): Documento Distinto a Patente 3), por ejemplo.
Documento Distinto a Patente 3: ISO/IEC 14496-10 "Information technology Coding of audio-visual objects - Part 10: Advanced video coding".
La figura 5 es un diagrama de bloques que muestra una
configuración del codificador de imágenes de una modalidad 3 de conformidad con la presente invención. En la figura 5, dado que los mismos números de referencia designan componentes iguales o similares a aquellos de la figura 1, su descripción será omitida.
Una unidad de procesamiento predictivo de señales de imágenes
6 es una unidad de procesamiento (unidad de procesamiento para ejecutar parte del procesamiento de codificación) para generar una señal residual de predicción al dividir el macrobloque que pasa a través de la división por parte de la unidad de preprocesamiento 1 en bloques de un tamaño prescrito y al ejecutar el procesamiento predictivo entre el la señal del bloque objetivo de codificación y una señal de bloque adyacente. La unidad de procesamiento predictivo de señal de imágenes 6 realiza el procesamiento predictivo mediante el método de procesamiento predictivo correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de preprocesamiento 1.
Posteriormente, el contenido de procesamiento de la unidad de procesamiento predictivo de señales de imágenes 6, será descrito de manera concreta.
La unidad de procesamiento predictivo de señales de imágenes 6 genera la señal de predicción usando la señal de bloque adyacente, así como genera la señal residual de predicción al ejecutar el procesamiento predictivo entre la señal de predicción y la señal del bloque objetivo de codificación.
En este caso, mientras más cerca se encuentre la señal de predicción generada desde la señal de bloque adyacente con respecto a la señal de bloque objetivo de codificación, más cerca se encuentran los valores de la señal residual de predicción a cero. De conformidad con ello, el procesamiento en la unidad transformadora de señales después de etapa 2, la unidad de cuantificación 4 y la unidad de codificación de longitud variable 5, pueden lograr una alta eficiencia de codificación.
Como método de generación de la señal de predicción, al realizar la predicción de una señal de luminancia bloque por bloque de un bloque de 10.16 cm x 10.16 cm y de un bloque de 20.32 cm x 20.32 cm, por ejemplo, se especifican nueve métodos predictivos en AVC como estándares.
Además, al realizar la predicción bloque por bloque del bloque de 40.64 cm x 40.64 cm, cuatro métodos predictivos se especifican en AVC como estándares.
Por ejemplo, cuando la señal de imágenes se encuentra en una región plana, cualquier procesamiento predictivo logrará una eficiencia predictiva casi igual. Por lo tanto, no tiene sentido preparar una gran cantidad de modos predictivos.
De conformidad con ello, cuando el tipo de región indicado por la señal resultante de decisión de región es una región plana, los modos predictivos a ser usados se limitan solamente uno o de 2 a 4 métodos predictivos predeterminados.
Dicha restricción puede eliminar la cantidad de código para
designar el modo predictivo.
Por ejemplo, considérese un caso de especificar el modo predictivo con una longitud de bits fija. Al usar nueve métodos predictivos, se requiere de una longitud de código de 4 bits para distinguir nueve métodos predictivos. En contraste con ello, cuando el modo predictivo es solamente uno, un código para especificar el modo predictivo no es necesario y, cuando se limita a cuatro métodos predictivos, una longitud de código de 2 bits es suficiente para especificar los cuatro métodos predictivos.
Además, al igual que para la región plana, incluso si el procesamiento predictivo se realiza en cada uno de los 16 bloques de 10.16 cm x 10.16 cm ó en uno bloque de 40.64 cm x 40.64 cm, solamente casi la misma eficiencia predictiva puede ser lograda.
De conformidad con ello, al igual que para la región plana, la predicción se realiza únicamente bloque por bloque en bloques de 40.64 cm x 40.64 cm, eliminando la información de modo que indica qué tamaño de bloque se emplea como una unidad para realizar el procesamiento predictivo.
Cuando la señal de imágenes se encuentra en una región compleja, cualquier procesamiento predictivo no logrará una diferencia significativa, excepto cuando la señal de imágenes tenga una fuerte característica como un borde. Sin embargo, dado que un bloque de 10.16 cm x 10.16 cm puede seguir los cambios locales en las señales de imágenes con mayor facilidad que un bloque de 20.32 cm x 20.32 cm ó un bloque de 40.64 cm x 40.64 cm, puede incrementar el desempeño de codificación en general.
De conformidad con ello, al igual que para la región compleja, solamente la predicción es realizada bloque por bloque en bloques de 10.16 cm x 10.16 cm para eliminar la información de modo que indica qué tamaño de bloque se emplea como una unidad para ejecutar el procesamiento predictivo.
Modalidad 4
La figura 6 es un diagrama de bloques que muestra una configuración del decodificador de imágenes de una modalidad 4 de conformidad con la presente invención.
El decodificador de imágenes de la figura 6 corresponde al codificador de imágenes de la figura 1 y emplea un método de decodificación para ejecutar el procesamiento predictivo en los coeficientes de transformada de MPEG-2 ó MPEG-4.
En la figura 6, una unidad de decodificación de longitud variable
11, que recibe los datos comprimidos transmitidos desde el codificador de imágenes, realiza el procesamiento de decodificación de longitud variable (como la decodificación de Huffman o decodificación aritmética) de los datos comprimidos, ejecutando de esta manera el procesamiento de decodificación de la señal resultante de decisión de región y los coeficientes de cuantificación incluidos en los datos comprimidos.
Aquí, cuando una unidad de decodificación de longitud de variable 11 decodifica los coeficientes de cuantificación, ésta realiza el
procesamiento de decodificación de longitud variable usando una tabla de palabras de código de Huffman (tablas de palabras de códigos de longitud variable) correspondiente al tipo de región indicado por la señal resultante de decisión de región decodificada previamente.
De manera incidental, una unidad de decodificación de longitud variable 11 constituye una señal resultante de decisión de unidad de extracción de región.
La unidad de decodificación de longitud variable 1 , la unidad de cuantificacion inversa 12, la unidad de procesamiento predictivo de coeficiente de transformada 13 y la unidad de transformación inversa 14, constituye una unidad de decodificación para decodificar la señal de imágenes a partir de los datos comprimidos de bloques bidimensionales que pasan a través de la división al tamaño prescrito ejecutando el procesamiento de decodificación correspondiente al tipo de región indicado por la señal resultante de decisión de región.
La unidad de cuantificacion inversa 12 es una unidad de procesamiento (unidad de procesamiento para ejecutar parte del procesamiento de decodificación) para decodificar los coeficientes de transformada residual de predicción al ejecutar la cuantificacion inversa de los coeficientes de cuantificacion decodificados por la unidad de decodificación de longitud variable 11. La unidad de cuantificacion inversa 12 realiza la cuantificacion inversa utilizando un parámetro de cuantificacion y una tabla de cuantificacion correspondiente al tipo de región indicado por la señal
resultante de decisión de región decodificado por la unidad de decodificación de longitud variable 11.
La unidad de procesamiento predictivo de coeficiente de transformada 13 es una unidad de procesamiento (unidad de procesamiento para ejecutar parte del procesamiento de decodificación) para decodificar la señal residual de predicción al generar los coeficientes de transformada predictivos usando coeficientes de transformada decodificados de los bloques adyacentes y al ejecutar el procesamiento predictivo entre los coeficientes de transformada predictivos y los coeficientes de transformada residual de predicción del bloque decodificado por la unidad de cuantificación inversa 12. La unidad de procesamiento predictivo de coeficiente de transformada 13 realiza el procesamiento predictivo mediante el método de procesamiento predictivo correspondiente al tipo de región indicado por la señal resultante de decisión de región decodificada por la unidad de decodificación de longitud variable 11.
La unidad de transformación inversa 14 es una unidad de procesamiento (unidad de procesamiento para ejecutar parte del procesamiento de decodificación) para transformar la señal de ámbito de frecuencia, que es la señal residual de predicción decodificada por la unidad de procesamiento predictivo de coeficiente de transformada 13, a una señal de ámbito espacial. La unidad de transformación inversa 14 transforma la señal residual de predicción de la señal de ámbito de frecuencia a la señal de ámbito espacial usando, como el tamaño de bloque de unidad, el tamaño
correspondiente al tipo de región indicado por la señal resultante de decisión de región decodificada por la unidad de decodificación de longitud variable 11.
Subsiguientemente se describirá la operación.
Recibiendo los datos comprimidos transmitidos desde el codificador de imágenes, la unidad de decodificación de longitud variable 11 decodifica la señal resultante de decisión de región incluida en los datos comprimidos al ejecutar el procesamiento de decodificación de longitud variable, como la decodificación de Huffman o decodificación aritmética, así como suministra la señal resultante de decisión de región a la unidad de cuantificación inversa 12, unidad de procesamiento predictivo de coeficiente de transformada 13 y unidad de transformación inversa 1 .
Además, la unidad de decodificación de longitud variable 11 decodifica los coeficientes de cuantificación (coeficientes correspondientes a la salida de los coeficientes de cuantificación de la unidad de cuantificación 4 de la figura 1) contenidos en los datos comprimidos al ejecutar el procesamiento de decodificación de longitud variable de los datos comprimidos usando una tabla de palabras de código de Huffman correspondiente al tipo de región indicado por la señal resultante de decisión de región decodificada previamente.
De manera incidental, al igual que para la tabla de palabras de código de Huffman correspondiente al tipo de región, dado que es la misma que aquella de la modalidad anterior 1 , su descripción se omitirá.
Recibiendo los coeficientes de cuantificación de la unidad de
decodificación de longitud variable 11, la unidad de cuantificación inversa 12 decodifica los coeficientes de transformada residual de predicción (coeficientes correspondientes a la salida de los coeficientes de transformada residual de predicción de la unidad de procesamiento predictivo de coeficiente de transformada 3 de la figura 1) ejecutando la cuantificación inversa de los coeficientes de cuantificación empleando el parámetro de cuantificación y la tabla de cuantificación correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de decodificación de longitud variable 11.
De manera incidental, al igual que para el parámetro de cuantificación y la tabla de cuantificación correspondiente al tipo de región, dado que son los mismos que aquellos de la modalidad anterior 1 , su descripción será omitida.
Recibiendo los coeficientes de transformada residual de predicción de la unidad de cuantificación inversa 12, la unidad de procesamiento predictivo de coeficiente de transformada 13 genera los coeficientes de transformada predictivos usando los coeficientes de transformada decodificados de los bloques adyacentes. Como un método para generar los coeficientes de transformada predictivos, se emplea el mismo método que la unidad de procesamiento predictivo de coeficiente de transformada 3 de la figura 1 para generar la señal de predicción.
Después de generar la señal de predicción, la unidad de procesamiento predictivo de coeficiente de transformada 13 decodifica la
señal residual de predicción (señal correspondiente a la señal de ámbito de frecuencia que pasa a través la transformación mediante la unidad transformadora de señales 2 de la figura 1) al ejecutar el procesamiento predictivo mediante un método de procesamiento predictivo correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de decodiftcación de longitud variable 11 entre los coeficientes de transformada predictivos y los coeficientes de transformada residual de predicción decodificados por la unidad de cuantificación inversa 12.
De manera incidental, al igual que para el método de procesamiento predictivo correspondiente al tipo de región, dado que es el mismo que aquel de la modalidad anterior 1 , su descripción será omitida.
Recibiendo la señal residual de predicción del bloque de la unidad de procesamiento predictivo de coeficiente de transformada 13, la unidad de transformación inversa 14 transforma la señal residual de predicción de la señal de ámbito de frecuencia a la señal de ámbito espacial (señales de imágenes) usando, como unidad, el tamaño de bloque correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de decodificación de longitud variable 11.
De manera incidental, al igual que para el tamaño de bloque correspondiente al tipo de región, dado que es el mismo que aquel de la modalidad anterior 1 , su descripción será omitida.
Como resulta claro a partir de lo anterior, de conformidad con la
presente modalidad 4, ésta se encuentra configurada de tal manera que se extraiga la señal resultante de decisión de región que indica el tipo de región a la que pertenece el macrobloque a partir de los datos comprimidos de los dos macrobloques bidimensionales divididos en un tamaño prescrito, así como decodifique las señales de imágenes a partir de los datos comprimidos del macrobloque bidimensional, al ejecutar el procesamiento de decodificación correspondiente al tipo de región indicado por la señal resultante de decisión de región. De conformidad con ello, ésta ofrece la ventaja de ser capaz de decodificar la señal de imágenes codificada por el codificador de imágenes de la figura 1. De manera incidental, aunque la modalidad 4 se describe suponiendo que la totalidad de la unidad de cuantificación inversa 12, la unidad de procesamiento predictivo de coeficiente de transformada 13 y la unidad de transformación inversa 14 cambian su procesamiento interno como respuesta a la señal resultante de decisión de región decodificada por la unidad de decodificación de longitud variable 11, no es necesario cambiar la totalidad de las mismas. Por ejemplo, cuando se introducen los datos comprimidos en relación con los cuales únicamente parte del procesamiento cambiado por el codificador de imágenes, también es posible una configuración que cambie solamente la parte correspondiente del procesamiento.
Modalidad 5
La figura 7 es un diagrama de bloques que muestra una configuración del decodificador de imágenes de una modalidad 5 de conformidad con la presente invención. En la figura 7, dado que los mismos números de referencia designan a componentes iguales o similares que aquellos de la figura 6, su descripción será omitida.
El decodificador de imágenes de la figura 7 corresponde al codificador de imágenes de la figura 5 y emplea un método de decodificación para ejecutar el procesamiento predictivo en un ámbito espacial como AVC.
En la figura 7, una unidad de procesamiento predictivo de señales de imágenes 15, que corresponde a la unidad de procesamiento predictivo de señales de imágenes 6 de la figura 5, constituye una unidad de procesamiento (unidad de procesamiento para ejecutar parte del procesamiento de decodificación) para decodificar la señal de imágenes al ejecutar el procesamiento predictivo entre la señal residual de predicción de un bloque objetivo de decodificación (señal de ámbito espacial que pasa a través de la transformación inversa mediante la unidad de transformación inversa 14) y la señal de imágenes decodificada de los bloques adyacentes. La unidad de procesamiento predictivo de señales de imágenes 15 realiza el procesamiento predictivo mediante el método de procesamiento predictivo correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de decodificación de longitud variable 11.
Subsiguientemente se describirá la operación.
Recibiendo la señal residual de predicción del bloque objetivo de decodificación, que es la señal de ámbito espacial de la unidad de transformación inversa 14, la unidad de procesamiento predictivo de señales de imágenes 15 genera la señal de predicción de las señales de imágenes decodificadas de los bloques adyacentes mediante el mismo método que aquel de la unidad de procesamiento predictivo de las señales de imágenes 6 de la figura 5.
Entonces, la unidad de procesamiento predictivo de señales de imágenes 15 decodifica las señales de imágenes al ejecutar el procesamiento predictivo entre la señal de predicción y la señal residual de predicción del bloque objetivo de decodificación mediante el método de procesamiento predictivo correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de decodificación de longitud variable 11.
De conformidad con la presente modalidad 5, ésta puede decodificar la señal de imágenes codificada por el codificador de imágenes de la figura 5.
De manera incidental, la modalidad anterior 4 y la modalidad 5 se describen suponiendo que la unidad de cuantificación inversa, la unidad de procesamiento predictivo de transformación de coeficiente y la unidad de transformación inversa cambian su operación como respuesta a los valores de la señal resultante de decisión de región. Sin embargo, al emplear los datos que indican qué método de transformada se selecciona para cada bloque
descrito en la modalidad anterior 1 (véase el párrafo
[0023]), se configuran de tal manera que se realice el procesamiento combinado utilizando el método de transformada correspondiente a los datos. Cuando cuentan con una pluralidad de tablas de cuantificación y utilizan los datos que indican qué tabla de cuantificación es seleccionada (véase el párrafo
[0034]), se construyen de tal manera que realicen el procesamiento de decodificación usando la tabla de cuantificación correspondiente a esos datos.
Modalidad 6
La presente modalidad 6 será descrita a manera de ejemplo que realiza el procesamiento predictivo a través del método de procesamiento predictivo correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de preprocesamiento 1 cuando la unidad de procesamiento predictivo de señales de imágenes 6 de la figura 5, por ejemplo, genera la señal residual de predicción al ejecutar el procesamiento predictivo entre la salida de la región de macrobloque (señales de imágenes del bloque objetivo de codificación) de la unidad de preprocesamiento 1 y la región de macrobloque de los macrobloques adyacentes.
Aunque la modalidad anterior 3 describe la técnica de cambiar el tamaño de bloque usando el método de procesamiento predictivo de la señal de imágenes usada en AVC, también es posible cambiar el método de procesamiento predictivo de la señal de imágenes de conformidad con el tipo
de región decidido por la unidad de preprocesamiento 1.
Subsiguientemente se describirá un método de procesamiento predictivo adecuado para la "región plana".
Las figuras 8A y 8B son diagramas que muestran los pixeles de un bloque objetivo de codificación.
Los pixeles dentro de un cuadrado son pixeles del bloque objetivo de codificación. En el ejemplo de las figuras 8A y 8B, el bloque objetivo de codificación es un bloque con un tamaño de 10.16 cm x 10.16 cm. Además, los pixeles fuera del cuadro son los pixeles empleados para el procesamiento predictivo.
Los números designan valores de pixeles y el ejemplo de las figuras 8A y 8B supone una "región plana".
Cuando la señal corresponde a una "región plana", la señal dentro del bloque es casi constante, tal y como se muestra en la figura 8A. De manera alternativa, tal y como se muestra en la figura 8B, se supone que la señal dentro del bloque varía considerablemente en una dirección particular.
El procesamiento predictivo de AVC realiza la extrapolación usando los pixeles A - 1 en el perímetro del bloque objetivo de codificación, tal y como se muestra en la figura 9. De conformidad con ello, aunque se obtiene una alta eficiencia predictiva en relación con ta señal mostrada en la figura 8A, al igual que para la señal mostrada en la figura 8B, no puede obtenerse una eficiencia predictiva suficiente para los pixeles distantes de los pixeles A - I, como los pixeles h, k, n, I, o, así como p.
De conformidad con ello, el efecto predictivo se ve mejorado al generar la imagen predictiva incluyendo el valor del pixel p de la figura 9 en los datos codificados y al ejecutar la interpolación empleando el valor del pixel P- Como un método de codificación del valor del pixel p, la codificación del valor del pixel p mismo (en el caso de la figura 8B, que codifica el valor "38") resulta apropiada. En este caso, no es necesario realizar una operación adicional para obtener el valor del pixel p.
De manera alternativa, como un método de codificación del valor del pixel p, es posible obtener un valor promedio de los dos pixeles E e I más cercanos al pixel p de entre los pixeles A - 1 en el perímetro del bloque objetivo de codificación, así como codificar el valor diferencial entre el valor promedio y el valor del pixel p (en el caso de la figura 8B, el valor promedio se torna "34" y el valor diferencial se torna "+4"). En tal caso, si se supone una región plana, dado que el valor diferencial se vuelve casi cero, es posible realizar la eficiencia de codificación más alta que cuando se codifica el valor del pixel p mismo.
Adicionalmente, como un método de codificación del valor del pixel p, también es posible obtener el valor promedio de todos los pixeles A - 1 en el perímetro del bloque objetivo de codificación, así como codificar el valor diferencial entre el valor promedio y el valor del pixel p (en el caso de la figura 8B, el valor promedio es "32.22" y el valor diferencial es "+5.78"). En este caso, incluso si los pixeles en el perímetro del objetivo de codificación incluyen
ruido, dado que el valor promedio se obtiene empleando muchos pixeles, el efecto del ruido puede debilitarse.
Cualquiera de los tres tipos del método de codificación puede emplearse o puede cambiarse de conformidad con el tamaño del bloque de codificación.
Por ejemplo, cuando el tamaño de bloque es de 40.64 cm x 40.64 cm, dado que el pixel p en el área derecha inferior dentro del bloque se encuentra distante de los pixeles en el perímetro, el valor del pixel p mismo es utilizado. Por otro lado, cuando el tamaño de bloque es de 10.16 cm x 10.16 cm, dado que el pixel p se encuentra cerca de los pixeles en el perímetro, puede concebirse una técnica que obtenga el valor promedio de los pixeles E e I, así como emplee el valor diferencial entré el valor promedio y el valor del pixel p.
Entonces, la imagen predictiva es generada por la interpolación que emplea el pixel p y los pixeles A - 1 en el perímetro obtenido según se ha descrito anteriormente.
Como un método de cálculo de interpolación, la interpolación conocida de manera convencional se emplea como una interpolación lineal que asigna ponderaciones de conformidad con la distancia usando dos pixeles (por ejemplo, obteniendo el valor predictivo del pixel m mediante (3><E + p)/4), o bien la interpolación bilineal de asignar las ponderaciones de conformidad con la distancia usando cuatro pixeles (por ejemplo, obteniendo el valor predictivo del pixel k mediante (A + 2*E + 2*l + 3*p)/8).
De manera incidental, al igual que para los datos codificados que representan el valor del pixel p (el valor del pixel p mismo o el valor diferencial del valor promedio de los pixeles en el perímetro), es posible realizar no solamente la codificación del valor mismo, sino también la codificación después de ejecutar la cuantificación, tal y como empleando solamente los 6 bits superiores del valor. Dado que la cuantificación estrecha la escala del valor, ésta puede reducir la cantidad de código de los datos codificados.
La presente modalidad 6 se encuentra configurada de tal manera que cambie el método de procesamiento predictivo inclusivo de dicha técnica predictiva de interpolación de conformidad con el tipo de región decidido.
De esta manera, ésta puede ejecutar su procesamiento de codificación al cambiar entre distintos métodos de procesamiento predictivo, tal y como: la predicción de extrapolación en el ámbito espacial cuando la señal es casi uniforme dentro del bloque y se decide como una "región plana", como en el caso de la figura 8A; la predicción de interpolación en el ámbito espacial cuando la señal dentro del bloque varia considerablemente hacia una dirección particular, como en el caso de la figura 8B; el procesamiento predictivo de coeficientes de DC/AC para los coeficientes de transformada para una "región de borde"; y el procesamiento predictivo de coeficientes de DC para los coeficientes de transformada para una "región compleja".
De manera más específica, en el caso de una "región plana" uniforme, incluso si la predicción de interpolación es realizada, ésta no hace diferencia alguna en la eficiencia de la predicción. De conformidad con ello, se
selecciona la predicción de extrapolación que no requiera de la codificación del pixel p. En el caso de una "región plana" que cambia suavemente, la predicción de interpolación se emplea para obtener una alta eficiencia predictiva como aquella descrita anteriormente.
Al igual que para la "región de borde", en el caso del borde horizontal o borde vertical en particular, dado que la eficiencia predictiva de los coeficientes de AC es alta, el procesamiento predictivo de los coeficientes de DC y coeficientes de AC se realiza en los coeficientes de transformada para obtener la alta eficiencia de codificación sin ejecutar el procesamiento de interpolación o extrapolación en el ámbito espacial.
Al igual que para la "región compleja", dado que la eficiencia predictiva no puede ser obtenida en gran cantidad, solamente el procesamiento predictivo de los coeficientes de DC es ejecutado para reducir el procesamiento operativo innecesario.
Dado que los ejemplos anteriores deciden el método de procesamiento predictivo únicamente de conformidad con el tipo de región decidido, éstos no requieren de información sobre el método de procesamiento predictivo. Sin embargo, es posible seleccionar el método de procesamiento predictivo capaz de lograr la eficiencia predictiva más alta al ejecutar distintos tipos del método de procesamiento predictivo.
En este caso, aunque la información de selección de la que debe seleccionarse el método de procesamiento predictivo es necesaria, la cantidad de código de la información de selección sobre el método de procesamiento
predictivo puede reducirse dando prioridad al método de procesamiento predictivo para cada región seleccionada.
Por ejemplo, puede codificar la información de selección con una cantidad de código menor para un método de procesamiento predictivo a ser seleccionado con mayor frecuencia asignando prioridad con anticipación de conformidad con el orden de los métodos de procesamiento predictivo de fácil selección, como en el orden de la predicción de interpolación, predicción de extrapolación, predicción de DC y predicción de coeficiente de DC/AC en el caso de la "región plana" uniforme, en el orden de la predicción de extrapolación, predicción de interpolación, predicción de DC y predicción de coeficiente de DC/AC en el caso de la "región plana" que varía suavemente, así como en el orden de no predicción, predicción de DC y predicción de interpolación en el caso de la "región compleja".
Subsiguientemente se describirá el procesamiento predictivo de señales de imágenes del decodificador de imágenes para ejecutar el procesamiento de decodificación de los datos codificados procesados por la modalidad anterior.
Por ejemplo, la unidad de procesamiento predictivo de señales de imágenes 15 de la figura 7, realiza el procesamiento predictivo de señales de imágenes empleando el método de procesamiento predictivo correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de decodificación de longitud variable 11.
De forma concreta, al igual que para el decodificador de
imágenes correspondiente al codificador de imágenes que decide el método de procesamiento predictivo únicamente de conformidad con la región decidida, la unidad de procesamiento predictivo de señales de imágenes 15 realiza el procesamiento predictivo en el método de procesamiento predictivo correspondiente al tipo de región indicado por la salida de la señal resultante de decisión de región de la unidad de decodificación de longitud variable 11.
De forma más específica, la unidad de procesamiento predictivo de señales de imágenes 15 predice la señal de imágenes mediante la predicción de extrapolación si el tipo de región es una "región plana" uniforme, predice las señales de imágenes mediante la predicción de interpolación si el tipo de región es una "región plana" que varía suavemente, así como predice las señales de imágenes mediante el procesamiento de predicción de coeficientes de DC/AC, si el tipo de región es una "región de borde". Además, si el tipo de región es una "región compleja", ésta predice la señal de imágenes mediante el procesamiento predictivo de coeficiente de DC.
Por otro lado, al igual que para el decodificador de imágenes correspondiente al codificador de imágenes que codifica la información de selección sobre el método de procesamiento predictivo, la unidad de decodificación de longitud variable 11 decodifica la información de selección codificada sobre el método de procesamiento predictivo, así como la unidad de procesamiento predictivo de señales de imágenes 15 identifica el método de procesamiento predictivo a partir de la información de selección decodificada por la unidad de decodificación de longitud variable 1 , así como
predice las señales de imágenes mediante el método de procesamiento predictivo.
Aunque las modalidades anteriores 1 a 6 muestran ejemplos de realización de la codificación de longitud variable de las señales de imágenes, cuando las señales de imágenes es una señal de imágenes de color, se encuentra compuesta por tres o más componentes como rojo/azul/verde o una combinación de una señal de luminancia y dos señales de diferencia de color.
Las diferencias en los componentes de señal se conocen de modo que, aunque la señal de luminancia o componente verde incluya una gran cantidad de componentes de alta frecuencia, las señales de diferencia de dos colores o componentes rojos/azules incluyan pocos componentes de alta frecuencia.
Al codificar dichos colores de señales de imágenes, los Documentos Distintos a Patentes 1 a 3 describen técnicas para recolectar una pluralidad de componentes de señales pertenecientes a las mismas posiciones espaciales en un solo macrobloque a ser codificado, de manera que se permita realizar el procesamiento de codificación de la totalidad de las señales de los componentes pertenecientes a un macrobloque particular como las señales pertenecientes a una única región. Sin embargo, también es posible emplear un método para obtener las señales resultantes de decisión de regiones mediante el número de componentes de señales al ejecutar el procesamiento de decisión de tipo de región para cada componente, así como para cambiar el procesamiento de la transformación / cuantificación /
procesamiento de transformación de señales de la codificación de longitud variable con uso de la señal resultante de decisión de región para cada componente.
En este caso, la mayor eficiencia de codificación puede ser lograda gracias al procesamiento de codificación que se hace posible, el cual hace uso de las diferencias en los componentes de las señales individuales.
Aplicación Industrial
La presente invención es adecuada para un codificador de imágenes que debe incrementar la eficiencia de codificación al ejecutar el procesamiento de codificación apropiado para cada región dentro de la imagen.
Claims (14)
1.- Un codificador de imágenes que comprende: una unidad divisora de bloques para dividir una señal de imagen en dos bloques bidimensionales de un tamaño prescrito; una unidad de decisión de tipo de región para decidir, para cada bloque que pasa a través de la división a través de la unidad divisora de bloques, a qué tipo de región pertenece el bloque; y una unidad de codificación para generar datos comprimidos al ejecutar, para cada bloque que pasa a través de la división a través de la unidad divisora de bloques, procesamiento de codificación correspondiente al tipo de región decidido por la unidad de decisión de tipo de región.
2.- El codificador de imágenes de conformidad con la reivindicación 1 , caracterizado además porque la unidad de codificación comprende, a manera de unidad de procesamiento para ejecutar parte del procesamiento de codificación, una unidad transformadora de señales para transformar una señal de ámbito espacial que es una señal del bloque que pasa a través de la división mediante la unidad divisora de bloques a una señal de ámbito de frecuencia y para generar sus coeficientes de transformada y en donde la unidad transformadora de señales cambia el tamaño del bloque a un tamaño correspondiente al tipo de región decidido por la unidad de decisión de tipo de región, así como transforma la señal del bloque sometida al cambio de tamaño de una señal de ámbito espacial a una señal de ámbito de frecuencia.
3.- El codificador de imágenes de conformidad con la reivindicación 1 , caracterizado además porque la unidad de codificación comprende, a manera de unidad de procesamiento para ejecutar parte del procesamiento de codificación, una unidad de procesamiento predictivo para generar coeficientes de transformada residual de predicción al ejecutar el procesamiento predictivo entre los coeficientes de transformada de un bloque objetivo de codificación y los coeficientes de transformada de bloques adyacentes al bloque entre los bloques que pasan a través de la división mediante la unidad divisora de bloques, y en donde la unidad de procesamiento predictivo realiza el procesamiento predictivo mediante un método de procesamiento predictivo correspondiente al tipo de región decidido por la unidad de decisión de tipo de región.
4.- El codificador de imágenes de conformidad con la reivindicación 1 , caracterizado además porque la unidad de codificación comprende, a manera de unidad de procesamiento para ejecutar parte del procesamiento de codificación, una unidad de cuantificación para calcular los coeficientes de cuantificación al ejecutar el procesamiento de cuantificación de los coeficientes de transformada residual de predicción del bloque que pasa a través de la división mediante la unidad divisora de bloques, y en donde la unidad de cuantificación realiza el procesamiento de cuantificación utilizando un parámetro de cuantificación y una tabla de cuantificación correspondiente al tipo de región decidido por la unidad de decisión de tipo de región.
5. - El codificador de imágenes de conformidad con la reivindicación 1 , caracterizado además porque la unidad de codificación comprende, a manera de unidad de procesamiento para ejecutar parte del procesamiento de codificación, una unidad de codificación de longitud variable para generar datos comprimidos al ejecutar el procesamiento de codificación de longitud variable sobre los coeficientes de cuantificación del bloque que pasa a través de la división mediante la unidad divisora de bloques, y en donde la unidad de codificación de longitud variable ejecuta el procesamiento de codificación de longitud variable empleando una tabla de palabras de códigos de longitud variable correspondiente al tipo de región decidido por la unidad de decisión de tipo de región.
6. - El codificador de imágenes de conformidad con la reivindicación 1 , caracterizado además porque la unidad de codificación codifica la señal resultante de decisión de región que indica el tipo de región decidida por la unidad de decisión de tipo de región, asi como incluye datos codificados de la señal resultante de decisión de región en los datos comprimidos.
7. - El codificador de imágenes de conformidad con la reivindicación 1 , caracterizado además porque la unidad de codificación comprende, a manera de unidad de procesamiento para ejecutar parte del procesamiento de codificación, una unidad de procesamiento predictivo para generar una señal residual de predicción al ejecutar el procesamiento predictivo entre una señal de imágenes de un bloque objetivo de codificación y una señal de imágenes de bloques adyacentes al bloque entre los bloques que pasan a través de la división mediante la unidad divisora de bloques, y en donde la unidad de procesamiento predictivo realiza el procesamiento predictivo mediante un método de procesamiento predictivo correspondiente al tipo de región decidido por la unidad de decisión de tipo de región.
8. - Un decodificador de imágenes que comprende: una señal resultante de decisión de unidad de extracción de región para extraer, a partir de los datos comprimidos de un bloque bidimensional dividido en un tamaño prescrito, una señal resultante de decisión de región que indica un tipo de región al que pertenece el bloque; y una unidad de decodificación para decodificar una señal de imágenes a partir de los datos comprimidos del bloque bidimensional al ejecutar el procesamiento de decodificación correspondiente al tipo de región indicado por la señal resultante de decisión de región extraída de la señal resultante de decisión de la unidad de extracción de región.
9. - El decodificador de imágenes de conformidad con la reivindicación 8, caracterizado además porque la unidad de decodificación comprende, a manera de unidad de procesamiento para ejecutar parte del procesamiento de decodificación, una unidad de decodificación de longitud variable para decodificar coeficientes de cuantificación al ejecutar el procesamiento de decodificación de longitud variable de los datos comprimidos del bloque bidimensional, y en donde la unidad de decodificación de longitud variable realiza el procesamiento de decodificación de longitud variable empleando una tabla de palabras de códigos de longitud variable correspondiente al tipo de región indicado por la señal resultante de decisión de región extraída de la señal resultante de decisión de unidad de extracción de región.
10. - El decodificador de imágenes de conformidad con la reivindicación 8, caracterizado además porque la unidad de decodificación comprende, a manera de unidad de procesamiento para ejecutar parte del procesamiento de decodificación, una unidad de cuantificación inversa para decodificar coeficientes de transformada residual de predicción al ejecutar el procesamiento de cuantificación inversa de los coeficientes de cuantificación del bloque bidimensional, y en donde la unidad de cuantificación inversa realiza el procesamiento de cuantificación inversa utilizando un parámetro de cuantificación y una tabla de cuantificación correspondiente al tipo de región indicado por la señal resultante de decisión de región extraída de la señal resultante de decisión de unidad de extracción de región.
11. - El decodificador de imágenes de conformidad con la reivindicación 8, caracterizado además porque la unidad de decodificación comprende, a manera de unidad de procesamiento para ejecutar parte del procesamiento de decodificación, una unidad de procesamiento predictivo para decodificar una señal residual de predicción al ejecutar el procesamiento predictivo entre los coeficientes de transformada residual de predicción de un bloque objetivo de decodificación y los coeficientes de transformada residual de predicción de los bloques adyacentes al bloque entre los bloques bidimensionales divididos en un tamaño prescrito, y en donde la unidad de procesamiento predictivo realiza el procesamiento predictivo mediante un método de procesamiento predictivo correspondiente al tipo de región indicado por la señal resultante de decisión de región extraída de la señal resultante de decisión de unidad de extracción de región.
12. - El decodificador de imágenes de conformidad con la reivindicación 8, caracterizado además porque la unidad de decodificación comprende, a manera de unidad de procesamiento para ejecutar parte del procesamiento de decodificación, una unidad de transformación inversa para transmitir una señal de ámbito de frecuencia, que es una señal residual de predicción del bloque bidimensional, a una señal de ámbito espacial, y en donde la unidad de transformación inversa cambia el tamaño del bloque bidimensional a un tamaño correspondiente al tipo de región indicado por la señal resultante de decisión de región extraída de la señal resultante de decisión de unidad de extracción de región, y transforma la señal residual de predicción del bloque bidimensional que sufre el cambio de tamaño de una señal de ámbito de frecuencia a una señal de ámbito espacial.
13. - El decodificador de imágenes de conformidad con la reivindicación 8, caracterizado además porque la unidad de decodificación comprende, a manera de unidad de procesamiento para ejecutar parte del procesamiento de decodificación, una unidad de procesamiento predictivo para décodificar la señal de imágenes al ejecutar el procesamiento predictivo entre una señal residual de predicción de un bloque objetivo de decodificación y una señal residual de predicción de bloques adyacente al bloque entre los bloques bidimensionales divididos en el tamaño prescrito, y en donde la unidad de procesamiento predictivo realiza el procesamiento predictivo mediante un método de procesamiento predictivo correspondiente al tipo de región indicado por la señal resultante de decisión de región extraída de la señal resultante de decisión de unidad de extracción de región.
14.- El decodificador de imágenes de conformidad con la reivindicación 8, caracterizado además porque la unidad de decodificación comprende, a manera de unidad de procesamiento para ejecutar parte del procesamiento de decodificación, una unidad de procesamiento predictivo para decodificar la señal de imágenes al ejecutar el procesamiento predictivo entre una señal residual de predicción de un bloque objetivo de decodificación y una señal residual de predicción de bloques adyacente al bloque entre los bloques bidimensionales divididos en el tamaño prescrito, y en donde la unidad de procesamiento predictivo identifica un método de procesamiento predictivo a partir de la información de selección transmitida desde un codificador de imágenes, así como realiza el procesamiento predictivo a través del método de procesamiento predictivo.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008286499 | 2008-11-07 | ||
PCT/JP2009/005417 WO2010052833A1 (ja) | 2008-11-07 | 2009-10-16 | 画像符号化装置及び画像復号装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
MX2011004850A true MX2011004850A (es) | 2011-05-30 |
Family
ID=42152647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MX2011004850A MX2011004850A (es) | 2008-11-07 | 2009-10-16 | Codificador de imagenes y decodificador de imagenes. |
Country Status (10)
Country | Link |
---|---|
US (1) | US20110211636A1 (es) |
EP (1) | EP2348734A1 (es) |
JP (1) | JPWO2010052833A1 (es) |
KR (1) | KR20110091000A (es) |
CN (1) | CN102210151A (es) |
BR (1) | BRPI0922120A2 (es) |
CA (1) | CA2742239A1 (es) |
MX (1) | MX2011004850A (es) |
RU (1) | RU2011122801A (es) |
WO (1) | WO2010052833A1 (es) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103004206B (zh) | 2010-07-20 | 2016-06-01 | 株式会社Ntt都科摩 | 图像预测编码装置、图像预测编码方法、图像预测编码程序、图像预测解码装置、图像预测解码方法以及图像预测解码程序 |
KR101219309B1 (ko) * | 2010-09-29 | 2013-01-08 | 전북대학교산학협력단 | 신호 처리 소자 및 이미지 처리 소자 |
US9490839B2 (en) | 2011-01-03 | 2016-11-08 | Qualcomm Incorporated | Variable length coding of video block coefficients |
EP3349360B1 (en) | 2011-01-14 | 2019-09-04 | GE Video Compression, LLC | Entropy encoding and decoding scheme |
US9516316B2 (en) | 2011-06-29 | 2016-12-06 | Qualcomm Incorporated | VLC coefficient coding for large chroma block |
US9338456B2 (en) | 2011-07-11 | 2016-05-10 | Qualcomm Incorporated | Coding syntax elements using VLC codewords |
US9076267B2 (en) | 2011-07-19 | 2015-07-07 | Panasonic Intellectual Property Corporation Of America | Image coding device, integrated circuit thereof, and image coding method |
MY167488A (en) | 2011-09-28 | 2018-08-30 | Sun Patent Trust | Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus |
DK2869557T3 (da) * | 2012-06-29 | 2023-11-06 | Electronics & Telecommunications Res Inst | Fremgangsmåde og anordning til kodning/afkodning af billeder |
US9826229B2 (en) * | 2012-09-29 | 2017-11-21 | Google Technology Holdings LLC | Scan pattern determination from base layer pixel information for scalable extension |
JP6190103B2 (ja) * | 2012-10-29 | 2017-08-30 | キヤノン株式会社 | 動画像符号化装置、動画像符号化方法およびプログラム |
US9716894B2 (en) * | 2013-03-25 | 2017-07-25 | Qualcomm Incorporated | Intra prediction modes for lossy coding when transform is skipped |
JP6226578B2 (ja) * | 2013-06-13 | 2017-11-08 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム |
CN103533351B (zh) * | 2013-09-26 | 2016-08-17 | 西安空间无线电技术研究所 | 一种多量化表的图像压缩方法 |
JP2015170932A (ja) * | 2014-03-05 | 2015-09-28 | 株式会社リコー | 画像圧縮装置及び画像圧縮方法 |
KR102211592B1 (ko) * | 2014-03-19 | 2021-02-04 | 삼성전자주식회사 | 전자 장치 및 이의 영상 처리 방법 |
US10356428B2 (en) * | 2015-04-13 | 2019-07-16 | Qualcomm Incorporated | Quantization parameter (QP) update classification for display stream compression (DSC) |
US10284849B2 (en) | 2015-04-13 | 2019-05-07 | Qualcomm Incorporated | Quantization parameter (QP) calculation for display stream compression (DSC) based on complexity measure |
US10244255B2 (en) | 2015-04-13 | 2019-03-26 | Qualcomm Incorporated | Rate-constrained fallback mode for display stream compression |
US9936203B2 (en) | 2015-04-13 | 2018-04-03 | Qualcomm Incorporated | Complex region detection for display stream compression |
US10225561B2 (en) * | 2015-10-08 | 2019-03-05 | Mediatek Inc. | Method and apparatus for syntax signaling in image and video compression |
US10574988B2 (en) * | 2015-11-19 | 2020-02-25 | Qualcomm Incorporated | System and methods for reducing slice boundary visual artifacts in display stream compression (DSC) |
JP2017163390A (ja) * | 2016-03-10 | 2017-09-14 | 富士通株式会社 | 情報処理装置、データ圧縮方法、及び、データ圧縮プログラム |
CN107888917B (zh) * | 2017-11-28 | 2021-06-22 | 北京奇艺世纪科技有限公司 | 一种图像编解码方法及装置 |
US10728557B2 (en) | 2018-10-24 | 2020-07-28 | Sony Corporation | Embedded codec circuitry for sub-block based entropy coding of quantized-transformed residual levels |
EP3874746A1 (en) * | 2018-11-01 | 2021-09-08 | InterDigital VC Holdings, Inc. | Video encoding and decoding using multiple transform selection |
KR102489599B1 (ko) * | 2018-12-17 | 2023-01-18 | 엘지전자 주식회사 | 고주파 제로잉을 기반으로 변환 계수 스캔 순서를 결정하는 방법 및 장치 |
US10939107B2 (en) | 2019-03-01 | 2021-03-02 | Sony Corporation | Embedded codec circuitry for sub-block based allocation of refinement bits |
JP2020150516A (ja) * | 2019-03-15 | 2020-09-17 | シャープ株式会社 | 画像復号装置及び画像符号化装置 |
CN114079772B (zh) | 2020-08-21 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 视频解码方法、装置、计算机可读介质及电子设备 |
CN113824957B (zh) * | 2020-09-27 | 2022-10-28 | 腾讯科技(深圳)有限公司 | 视频编解码方法、装置及电子设备 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5493513A (en) * | 1993-11-24 | 1996-02-20 | Intel Corporation | Process, apparatus and system for encoding video signals using motion estimation |
JP3967405B2 (ja) * | 1996-10-09 | 2007-08-29 | テキサス インスツルメンツ インコーポレイテツド | 画像信号の符号化方法 |
KR100487989B1 (ko) * | 1997-10-23 | 2005-05-09 | 미쓰비시덴키 가부시키가이샤 | 화상 복호화 장치 및 화상 부호화 장치 |
FI117533B (fi) * | 2000-01-20 | 2006-11-15 | Nokia Corp | Menetelmä digitaalisten videokuvien suodattamiseksi |
JP2003046789A (ja) * | 2001-08-02 | 2003-02-14 | Canon Inc | 画像符号化装置及び画像復号化装置 |
US20030031371A1 (en) * | 2001-08-02 | 2003-02-13 | Shinichi Kato | Image encoding apparatus and image decoding apparatus |
EP1322121A3 (en) * | 2001-12-19 | 2003-07-16 | Matsushita Electric Industrial Co., Ltd. | Video encoder and decoder with improved motion detection precision |
JP2007201558A (ja) * | 2006-01-23 | 2007-08-09 | Matsushita Electric Ind Co Ltd | 動画像符号化装置および動画像符号化方法 |
US7949195B2 (en) * | 2007-01-16 | 2011-05-24 | Cisco Technology, Inc. | Per block breakpoint determining for hybrid variable length coding |
JP2008219205A (ja) * | 2007-02-28 | 2008-09-18 | Sony Corp | 画像情報符号化装置及び画像情報符号化方法 |
-
2009
- 2009-10-16 JP JP2010536644A patent/JPWO2010052833A1/ja active Pending
- 2009-10-16 WO PCT/JP2009/005417 patent/WO2010052833A1/ja active Application Filing
- 2009-10-16 CA CA2742239A patent/CA2742239A1/en not_active Abandoned
- 2009-10-16 MX MX2011004850A patent/MX2011004850A/es not_active Application Discontinuation
- 2009-10-16 US US13/128,146 patent/US20110211636A1/en not_active Abandoned
- 2009-10-16 CN CN2009801443894A patent/CN102210151A/zh active Pending
- 2009-10-16 KR KR1020117012818A patent/KR20110091000A/ko not_active Ceased
- 2009-10-16 EP EP09824534A patent/EP2348734A1/en not_active Withdrawn
- 2009-10-16 BR BRPI0922120A patent/BRPI0922120A2/pt not_active IP Right Cessation
- 2009-10-16 RU RU2011122801/08A patent/RU2011122801A/ru unknown
Also Published As
Publication number | Publication date |
---|---|
CA2742239A1 (en) | 2010-05-14 |
EP2348734A1 (en) | 2011-07-27 |
CN102210151A (zh) | 2011-10-05 |
RU2011122801A (ru) | 2012-12-20 |
JPWO2010052833A1 (ja) | 2012-03-29 |
US20110211636A1 (en) | 2011-09-01 |
KR20110091000A (ko) | 2011-08-10 |
WO2010052833A1 (ja) | 2010-05-14 |
BRPI0922120A2 (pt) | 2016-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
MX2011004850A (es) | Codificador de imagenes y decodificador de imagenes. | |
US20230224477A1 (en) | Image encoding device, image decoding device, image encoding method, image decoding method, and image prediction device | |
US9462271B2 (en) | Moving image encoding device, moving image decoding device, moving image coding method, and moving image decoding method | |
TWI575942B (zh) | 資料編碼及解碼 | |
JP4800571B2 (ja) | 損失の無い方法でディジタル画像を符号化するための装置および方法 | |
US11831892B2 (en) | Image coding device, image decoding device, image coding method, and image decoding method | |
AU784084B2 (en) | Quality based image compression | |
US9774872B2 (en) | Color image encoding device, color image decoding device, color image encoding method, and color image decoding method | |
AU2002315160C1 (en) | Configurable pattern optimizer | |
US20150023420A1 (en) | Image decoding device, image encoding device, image decoding method, and image encoding method | |
KR20040003055A (ko) | 디지털 이미지에 대한 선택적 색도 데시메이션 | |
CA2449709A1 (en) | Interframe encoding method and apparatus | |
US12323623B2 (en) | Coefficient decoding method, electronic device and storage medium | |
HK1155302A (en) | Image encoding device and image decoding device | |
KR20200145773A (ko) | 코딩 툴들을 제어하는 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA | Abandonment or withdrawal |