ES2907510T3

ES2907510T3 - Descomposición de datos residuales durante la codificación, decodificación y reconstrucción de señales en una jerarquía escalonada

Info

Publication number: ES2907510T3
Application number: ES13722424T
Authority: ES
Inventors: Luca Rossato; Guido Meardi
Original assignee: V Nova International Ltd
Current assignee: V Nova International Ltd
Priority date: 2012-05-14
Filing date: 2013-05-13
Publication date: 2022-04-25
Anticipated expiration: 2033-05-13
Also published as: EP2850829B1; KR20150018575A; KR20150014494A; BR112014028274A2; SG11201407417VA; US11622112B2; EP2850830A1; CN110944210A; BR112014028279A2; KR20150020568A; US20130322530A1; PL2850829T3; MX2014013846A; HK1203260A1; US20130321423A1; JP2015522988A; MX344994B; EA201492090A1; US20190297322A1; CN104620582B

Abstract

Un método de codificación de una señal de vídeo que comprende: a través del hardware de procesamiento del ordenador: recibir (6.01) un plano de la señal de vídeo en una primera resolución, el plano que comprende un plano de píxeles; submuestrear la resolución (6.01) del plano de la señal de vídeo para generar una representación del plano en una segunda resolución, la segunda resolución que es inferior a la primera resolución; producir (6.01, 6.02) un plano predicho de la señal en la primera resolución mediante la obtención de un plano codificado de la señal en la segunda resolución y el sobremuestreo de una decodificación simulada del plano codificado de la señal en la segunda resolución; producir (6.02) los datos residuales como una diferencia entre el plano recibido de la señal de vídeo en la primera resolución y el plano predicho de la señal de vídeo en la primera resolución; procesar (6.03, 6.04) los datos residuales mediante el uso de una descomposición direccional para generar los conjuntos de componentes direccionales (320), la descomposición direccional que se aplica a bloques de residuos de 2×2 para generar, para cada bloque de 2×2, cuatro componentes direccionales: A - un promedio del bloque de residuos, H - una diferencia horizontal dentro del bloque de residuos, V - una diferencia vertical dentro del bloque de residuos, y D - una diferencia diagonal dentro del bloque de residuos; derivar (6.05) los conjuntos de residuos transformados (350) a partir de los conjuntos de componentes direccionales (320) ajustando la componente direccional promedio de cada conjunto de componentes direccionales (320), que incluye: determinar un promedio predicho para cada bloque de 2×2 como una diferencia entre un valor de píxel cuantificado en la segunda resolución representativa del bloque y un promedio de un bloque correspondiente en el plano predicho de la señal, y restar el promedio predicho de la componente direccional promedio para el bloque de residuos; cuantificar (6.06) los conjuntos de residuos transformados (350); y codificar (6.08) los conjuntos cuantificados de residuos transformados para dar salida a los datos de reconstrucción codificados para la comunicación con el hardware de procesamiento del decodificador para la decodificación.

Description

DESCRIPCIÓN

Descomposición de datos residuales durante la codificación, decodificación y reconstrucción de señales en una jerarquía escalonada

Antecedentes

Muchas técnicas se conocen en la técnica para tratar la compresión y descompresión de señales multidimensionales o de señales que evolucionan a lo largo del tiempo. Este es el caso de las señales de audio, las señales de vídeo y otras señales multidimensionales como las señales volumétricas usadas en áreas científicas y médicas.

Con el fin de lograr altos ratios de compresión, esas técnicas explotan la correlación espacial y temporal dentro de la señal. Por ejemplo, los métodos convencionales identifican una referencia e intentan determinar la diferencia de la señal entre una ubicación actual y la referencia dada. Esto se hace tanto en el dominio espacial, donde la referencia es una porción (por ejemplo, un bloque o "macrobloque") del plano espacial ya recibido y decodificado, como en el dominio del tiempo, donde una única instancia en el tiempo de la señal (por ejemplo, una trama de vídeo en una secuencia de tramas) se toma como referencia para una cierta duración. Este es el caso, por ejemplo, de los algoritmos de compresión de la familia MPEG (Grupo de Expertos en Imágenes en Movimiento), donde los macrobloques previamente decodificados se toman como referencia en el dominio espacial y las tramas I y las tramas P se usan como referencia para las tramas P posteriores en el dominio del tiempo.

Las técnicas conocidas explotan la correlación espacial y la correlación temporal de muchas maneras, adoptando varias técnicas diferentes con el fin de identificar, simplificar, codificar y transmitir las diferencias. De acuerdo con los métodos convencionales, con el fin de aprovechar la correlación espacial de los residuos dentro de un bloque respectivo de elementos de imagen, se realiza una transformación de dominio (por ejemplo, en un dominio de frecuencia) y luego se realiza la eliminación con pérdida y la cuantificación de la información transformada, usualmente introduciendo algún grado de artefactos de bloque. En cambio, en el dominio del tiempo, los métodos convencionales transmiten la diferencia cuantificada entre la muestra actual y una muestra de referencia con compensación de movimiento. Con el fin de maximizar la similitud entre las muestras, los codificadores intentan estimar las modificaciones ocurridas a lo largo del tiempo frente a la señal de referencia. En los métodos de codificación convencionales (por ejemplo, tecnologías de la familia MPEG, VP8, etc.) esto se denomina estimación y compensación de movimiento.

Las CPU (Unidades Centrales de Procesamiento) y las GPU (Unidades de Procesamiento de Gráficos) actuales suelen ser muy potentes; una única GPU puede incluir varios cientos de núcleos informáticos para realizar un procesamiento paralelo de la información. Cuando se usa un hardware de tecnología actual, porciones muy grandes de una imagen se pueden almacenar en una memoria caché del procesador para su procesamiento. La necesidad de fragmentar las imágenes en una multitud de pequeños bloques, lo cual fue un factor determinante cuando se crearon JPEG y MPEG, ya que los procesadores de esa época sólo podían tratar con fragmentos muy pequeños de datos de vídeo a la vez — y en ese entonces sólo de manera secuencial — no aplica ya para las CPU y GPU modernas. Por tanto, una gran porción de la potencia de procesamiento disponible puede quedar sin usarse cuando se implementan tipos de codificación/decodificación similares a MPEG, con artefactos de bloqueo introducidos innecesariamente en la señal.

Además, en comparación con lo que era actual cuando se desarrolló MPEG, las aplicaciones modernas usualmente requieren una codificación de vídeo de definición mucho mayor y una calidad de reproducción general mucho mayor. En los vídeos de alta definición (por ejemplo, FullHD, UltraHD), y de alta calidad (por ejemplo, artefactos relativamente invisibles con respecto a la señal original) hay una diferencia mucho mayor entre las áreas con poco detalle (incluso potencialmente fuera de foco) y las áreas con muy buen detalle. Esto hace el uso de transformadas en el dominio de la frecuencia tales como las usadas en los métodos basados en JPEG y basados en MPEG aún más inadecuado para el procesamiento y la reproducción de imágenes, ya que el intervalo de frecuencias relevantes es cada vez más amplio.

Además, las imágenes de mayor resolución incluyen una mayor cantidad de ruido de cámara y/o grano de película, es decir, transiciones de píxeles de alta frecuencia muy detalladas que requieren muchos bits para codificar, pero que pueden ser bastante irrelevantes para la visualización frente a transiciones de píxeles de alta frecuencia similares de bordes de objetos.

Otro aspecto descuidado en la técnica conocida, al margen de unos pocos intentos, es el requisito de escalabilidad de calidad. Un método de codificación escalable codificaría una única versión de la señal comprimida y permitiría la entrega a diferentes niveles de calidad, de disponibilidad de ancho de banda y de complejidad del decodificador. La escalabilidad se ha tenido en cuenta en métodos conocidos como MPEG-SVC y j PeG2000, con una adopción relativamente pobre hasta ahora debido a la complejidad computacional y, hablando generalmente, a la ineficiencia de compresión con relación a las técnicas no escalables.

En el pasado, como una alternativa escalable a los estándares JPEG/MPEG para la codificación/decodificación, las denominadas pirámides laplacianas de imágenes se han usado con propósitos de codificación/decodificación. Por ejemplo, los sistemas de pirámides laplacianas convencionales crearon imágenes de resolución inferior mediante el uso de filtros gaussianos y luego construyeron la pirámide de las diferencias entre las imágenes obtenidas mediante sobremuestreo con un decodificador rígidamente programado desde los niveles de resolución inferiores hasta el nivel original. El uso de la codificación de pirámide laplaciana convencional se ha abandonado debido a su ineficiencia de compresión.

Las transformaciones de dominio de residuos aprovechadas hasta ahora por los métodos de codificación del estado de la técnica (por ejemplo, transformadas de Fourier, Transformadas de Coseno Discretas, transformadas de Hadamard, transformadas de ondículas, etc.) sufren una serie de problemas.

En primer lugar, la elección misma de transformarse en un dominio de frecuencia las hace inadecuadas para explotar adecuadamente la correlación entre grandes porciones de una señal (es decir, porciones con un gran número de muestras para cada una de las dimensiones), ya que las señales del mundo real usualmente muestran cantidades limitadas de periodicidad. Como consecuencia, las transformadas en el dominio de la frecuencia se realizan en bloques que son al mismo tiempo demasiado grandes y demasiado pequeños: demasiado grandes para ser computacionalmente simples y demasiado pequeños para explotar suficientemente la correlación de una señal de alta resolución. Por ejemplo, con el fin de explotar la correlación de un conjunto de muestras lo suficientemente grande y al mismo tiempo gestionar las complejidades computacionales, las técnicas de codificación de imagen y vídeo convencionales operan en bloques de 8*8, 16*16 o 32*32 elementos: claramente demasiado pequeños para capturar completamente la correlación de patrones de imagen en una imagen de alta definición (por ejemplo, con 8 millones de píxeles) pero lo suficientemente grande como para absorber una potencia computacional significativa. En segundo lugar, los métodos conocidos que aprovechan las transformadas del dominio de la frecuencia asumen implícitamente que los humanos son sensibles a los armónicos (por ejemplo, las frecuencias de las transiciones de color) de una manera que no depende de la dirección de la transición, mientras que varios estudios han demostrado que los humanos reconocen la nitidez de un transición mucho mejor que la dirección/ángulo preciso de la transición, especialmente cuando se observan formas complejas.

En tercer lugar, las técnicas de codificación con pérdida conocidas operan cuantificando los resultados de la transformada, que inevitablemente genera dos problemas: (1) artefactos basados en bloques, entre un bloque y los bloques vecinos, a corregir con métodos de procesamiento de imágenes de desbloqueo relativamente complejos; (2) imposibilidad de controlar fácilmente el error máximo en una imagen codificada, ya que los valores de píxel reales son el resultado de una transformada inversa de parámetros descuantificados, de modo que los errores de cuantificación en los parámetros cuantificados de un bloque se combinan entre sí de manera que son difíciles de gestionar sin múltiples recodificaciones y/o esquemas de cuantificación extremadamente complejos. Evitar artefactos de bloque y garantizar el máximo control de errores son características particularmente importantes, especialmente en aplicaciones tales como imágenes médicas o producción profesional de imágenes/vídeos.

El documento "A fully scalable video coder with inter-scale wavelet prediction and morphological coding", PROCEEDINGS OF SPIE, vol. 5960, 12 de julio de 2005 (2005-07-12), páginas 535-546, ISSN: 0277-786X, DOI: 10.1117/12.631429, a nombre de Adami y otros, XP-002363204, describe una arquitectura de codificación de vídeo escalable — basada en ondícula — en la que las subbandas filtradas temporales con compensación de movimiento de versiones escaladas espacialmente de una secuencia de vídeo pueden usarse como capa base para las predicciones entre escalas. Estas predicciones tienen lugar entre los datos del mismo nivel de resolución sin necesidad de interpolación. Los residuos de la predicción se transforman aún más mediante descomposiciones de ondículas espaciales. Las subbandas de ondículas espaciotemporales multiescala resultantes se codifican gracias a una técnica de dilatación morfológica integrada y una codificación aritmética basada en el contexto. Se logra escalabilidad espaciotemporal diádica y escalabilidad SNR progresiva. La decodificación de adaptación múltiple se puede implementar fácilmente sin necesidad de conocer un conjunto predefinido de puntos operativos. El sistema de codificación propuesto permite compensar algunos de los inconvenientes típicos de las actuales arquitecturas de codificación de vídeo escalable basadas en ondícula y muestra resultados visuales interesantes incluso cuando se compara con el estándar de codificación de vídeo de un solo punto operativo AVC/H.264.

Breve descripción

Las modalidades en la presente descripción se desvían con respecto a los sistemas y métodos convencionales, proporcionando métodos novedosos para cuantificar y/o transformar la información de los elementos (tal como los datos residuales) para reconstruir una representación de una imagen, permitiendo métodos de codificación caracterizados por codificación por entropía eficiente, baja complejidad computacional, paralelismo, escalabilidad, control de errores, etc. Los métodos y modalidades en la presente descripción representan un enfoque innovador para lograr resultados de codificación por entropía eficientes con baja complejidad computacional, paralelismo, escalabilidad y control de errores.

La invención se define en las reivindicaciones adjuntas.

La invención reivindicada se refiere a un método para codificar una señal de vídeo de acuerdo con la modalidad de la Figura 6 y a un método para decodificar una señal de vídeo de acuerdo con la modalidad de la Figura 7, en combinación con las técnicas ilustradas en las Figuras 2B, 3B y 3F. Otras modalidades se deben considerar simplemente como ejemplos adecuados para comprender la invención.

Para simplificar, las modalidades no limitativas ilustradas en la presente descripción se refieren a una señal como una secuencia de muestras multidimensionales (es decir, conjuntos de uno o más elementos organizados como matrices con una o más dimensiones, por ejemplo, a modo de ejemplos no limitativos, conjuntos de elementos de imagen organizados como imágenes bidimensionales). En la descripción, los términos "imagen" o "plano" (predichos con el significado más amplio de "hiperplano", es decir, matriz de elementos con cualquier número de dimensiones y una cuadrícula de muestreo determinada) se usarán a menudo para identificar la reproducción digital de un muestra de la señal a lo largo de la secuencia de muestras, en donde cada plano tiene una resolución dada para cada una de sus dimensiones (por ejemplo, X e Y, en el caso de dos dimensiones) y comprende un conjunto de elementos planos (o "elemento" o "pel", para imágenes bidimensionales a menudo llamadas "píxel", para imágenes volumétricas a menudo llamadas "voxel", etc.) caracterizadas por uno o más "valores" o "ajustes" (por ejemplo, a modo de ejemplos no limitativos, ajustes de color en un espacio de color adecuado, ajustes que indican el nivel de densidad, ajustes que indican los niveles de temperatura, ajustes que indican el tono de audio, ajustes que indican la amplitud, etc.). Cada elemento del plano se identifica mediante un conjunto adecuado de coordenadas que indica las posiciones enteras de dicho elemento en la cuadrícula de muestreo de la imagen. Las dimensiones de la señal pueden incluir sólo dimensiones espaciales (por ejemplo, en el caso de una imagen) o también una dimensión temporal (por ejemplo, en el caso de una señal que evoluciona con el tiempo).

Como ejemplos no limitativos, una señal puede ser una imagen, una señal de audio, una señal de audio multicanal, una señal de vídeo, una señal de vídeo multivista (por ejemplo, vídeo 3D), una señal plenóptica, una señal multiespectral, una señal volumétrica (por ejemplo, imágenes médicas, imágenes científicas, imágenes holográficas, etc.), una señal de vídeo volumétrica o incluso señales con más de cuatro dimensiones.

Para simplificar, las modalidades no limitativas ilustradas en la presente descripción a menudo se refieren a señales que se visualizan como planos de 2D de ajustes (por ejemplo, imágenes 2D en un espacio de color adecuado), tal como, por ejemplo, una imagen o una señal de vídeo (es decir, una secuencia de imágenes 2D que evolucionan con el tiempo). Sin embargo, los expertos en la técnica pueden aplicar fácilmente los mismos conceptos y métodos a cualquier otro tipo de señal multidimensional (por ejemplo, señales volumétricas, señales de vídeo, señales de vídeo 3D, señales plenópticas, etc.).

Las modalidades no limitativas ilustradas en la presente descripción también ilustran a menudo casos de señales codificadas en una jerarquía escalonada de niveles de calidad ("LOQ"), en donde los niveles de calidad superiores en la jerarquía escalonada tienen una resolución progresivamente mayor (es decir, un número superior de muestras para una o más de las dimensiones de la señal). Para simplificar, las modalidades no limitativas ilustradas en la presente descripción a menudo se refieren al caso simple de resoluciones que aumentan con un factor de escala de dos para cada una de las dimensiones de la señal, pero los expertos en la técnica pueden aplicar fácilmente los mismos métodos también a casos con diferentes (y potencialmente anisotrópicos) factores de escala. Cuando se trabaja con señales codificadas en una jerarquía escalonada de niveles de calidad, los residuos que permiten reconstruir los ajustes de los elementos de un LOQ dado "controlados" por (por ejemplo, ubicados junto con) un mismo elemento del LOQ inferior muestran correlaciones importantes que se explotan eficazmente por modalidades no limitativas ilustradas en la presente descripción. Para simplificar, llamaremos "elemento de control de plano" (o "pel de control") de un conjunto dado de elementos de plano en un LOQ superior ("pels controlados") al elemento principal en un LOQ inferior que se coubica junto con el determinado conjunto de elementos de plano en el LOQ superior.

Modalidades no limitativas adicionales ilustradas en la presente descripción transforman los datos residuales (es decir, información sobre ajustes para aplicar a elementos de una señal para obtener una representación adecuada de la señal en un nivel dado de calidad) para aprovechar tanto la correlación entre los propios residuos y la correlación que existe entre los residuos y la entrega de la señal a un nivel de calidad inferior. En particular, con el fin de codificar eficientemente los datos residuales en un flujo de bits digital, son necesarias dos operaciones: cuantificación (es decir, asignar a cada valor un símbolo que pertenece a un alfabeto de símbolos finito dado) y codificación por entropía. La transformación de los símbolos antes de la codificación por entropía permite reducir la variabilidad de los símbolos a codificar, aumentando, por lo tanto, la eficiencia del codificador por entropía. Aprovechar una representación de la señal a un nivel inferior de calidad permite predecir parte de la información residual en base a la información ya disponible en el decodificador, aumentando aún más la eficiencia de la codificación. Transformar un bloque de residuos y al mismo tiempo aprovechar una representación de la señal a un nivel de calidad inferior — es decir, implementar efectivamente una transformación multiescala — también permite explotar la correlación de la señal en una porción de la señal que es más ancha que el bloque en sí mismo: de esta manera, podemos mantener el tamaño del bloque extremadamente pequeño (por ejemplo, incluso 2*2) y al mismo tiempo aprovechar la correlación en un área mucho más amplia, logrando al mismo tiempo tanto beneficios de complejidad computacional como beneficios de eficiencia de codificación.

Los métodos ilustrados en la presente descripción esencialmente permiten transformar los residuos de modo que se minimice el número de símbolos distintos en una pluralidad de conjuntos de datos residuales cuantificados transformados, reduciendo, por lo tanto, el tamaño del flujo de bits que es necesario para codificar y transmitir dicha pluralidad de conjuntos. En algunas modalidades no limitativas descritas en la presente descripción, la etapa de cuantificación se realiza después de la etapa de la transformada en el lado de la codificación (y, en consecuencia, antes de la etapa de transformada inversa en el lado de la decodificación) de manera similar a lo que se ha hecho hasta ahora con los métodos de codificación convencionales. En otras modalidades novedosas no limitativas descritas en la presente descripción, la etapa de cuantificación se realiza antes de la etapa de la transformada en el lado de la codificación (y, en consecuencia, después de la etapa de transformada inversa en el lado de la decodificación), implementando efectivamente un método de transformación sin pérdidas. Realizar la etapa de cuantificación antes de la etapa de transformada permite controlar (y, si es necesario, limitar) los errores introducidos con la codificación con pérdidas incluso antes de comenzar las partes computacionalmente más intensivas de codificación. Las modalidades no limitativas descritas en la presente descripción también tratan eficazmente las correlaciones conocidas entre símbolos que se obtienen por medio de una transformación sin pérdidas.

Las modalidades no limitativas ilustradas en la presente descripción a menudo ilustran transformadas de descomposición aplicadas en conjuntos de residuos de 2x2. Esto debería ser no limitativo, y las personas expertas en la técnica pueden aplicar fácilmente los mismos métodos en conjuntos de residuos con diferentes tamaños, incluidos diferentes tamaños para cada dimensión (por ejemplo, conjuntos de residuos de 2*1) o más de dos dimensiones (por ejemplo, conjuntos de residuos de LxNxM en una imagen volumétrica o en una señal de vídeo donde la tercera dimensión representa el tiempo).

En una modalidad no limitativa descrita en la presente descripción, un primer procesador de señales ("codificador") se configura para codificar una señal en una jerarquía de niveles de calidad, mientras que un segundo procesador de señales ("decodificador") se configura para decodificar una representación de dicha señal en una jerarquía de niveles de calidad.

El codificador recibe una señal en un primer nivel de calidad y produce una representación de la señal en un segundo nivel de calidad, siendo el segundo nivel de calidad inferior al primer nivel de calidad. Luego, el codificador procesa la representación de la señal en el segundo nivel de calidad, produciendo una representación predicha de la señal en el primer nivel de calidad. Luego, el codificador genera los datos residuales, correspondiendo dichos datos residuales a una diferencia entre la señal en un primer nivel de calidad y la representación predicha de la señal en el primer nivel de calidad. Luego, el codificador transforma los datos residuales aplicando una transformada de descomposición, produciendo parámetros ("componentes" o "componentes residuales"). Descomponer los residuos para obtener las componentes residuales permite al codificador aprovechar mejor la correlación entre los residuos; además, algunas de las componentes se correlacionan más que los residuos con la representación de la señal en el segundo nivel de calidad, haciéndolas más fáciles de transmitir que los residuos no transformados. Luego, el codificador procesa dichas componentes, dicha representación predicha de la señal en el primer nivel de calidad y dicha representación de la señal en el segundo nivel de calidad, produciendo residuos transformados. A continuación, el codificador codifica dicha representación de la señal en el segundo nivel de calidad y dichos residuos transformados en los datos codificados correspondientes.

El decodificador recibe dichos datos codificados y reconstruye, en base, al menos en parte, a dichos datos codificados, una representación de la señal en el segundo nivel de calidad y residuos transformados reconstruidos. El decodificador procesa la representación de la señal en el segundo nivel de calidad, produciendo una reproducción predicha de la señal en el primer nivel de calidad, siendo el primer nivel de calidad superior al segundo nivel de calidad. El decodificador procesa dicha representación predicha de la señal en el primer nivel de calidad, dicha representación de la señal en el segundo nivel de calidad y dichos residuos transformados reconstruidos, produciendo las componentes reconstruidas. El decodificador aplica una transformada inversa de descomposición a las componentes reconstruidas, produciendo las residuos reconstruidos. El decodificador combina la representación predicha de la señal en el primer nivel de calidad con los residuos reconstruidos, produciendo una representación de la señal en el primer nivel de calidad.

En una modalidad no limitativa descrita en la presente descripción, las componentes residuales se obtienen mediante cálculos que comprenden adiciones y/o diferencias entre los residuos, y los residuos se obtienen mediante cálculos que comprenden adiciones y/o diferencias entre las componentes residuales. En una modalidad no limitativa, las operaciones realizadas para codificar los residuos transformados incluyen seleccionar un subconjunto de residuos transformados correspondientes a un subconjunto de residuos contiguos en el plano de residuos en un primer nivel de calidad, generando un valor en base, al menos en parte, a la representación de la señal en un segundo (inferior) nivel de calidad y combinando dicho valor con al menos una de las componentes residuales, produciendo un subconjunto de residuos transformados correspondientes a dicho subconjunto de residuos.

En otras modalidades no limitativas descritas en la presente descripción, un decodificador procesa los datos codificados, generando un conjunto de residuos correspondientes a los ajustes a realizar en elementos de una representación predicha de una señal en un primer nivel de calidad con el fin de producir una representación de la señal en el primer nivel de calidad, dicha reproducción predicha de la señal en el primer nivel de calidad producida por el decodificador en base, al menos en parte, a una representación de la señal en un segundo nivel de calidad, el segundo nivel de calidad inferior al primer nivel de calidad. El decodificador recibe los datos codificados correspondientes a los residuos transformados y produce, en base, al menos en parte, a dichos datos codificados, las componentes residuales reconstruidas. Luego, el decodificador genera un conjunto de residuos reconstruidos aplicando una descomposición inversa a las componentes residuales reconstruidas.

En una modalidad no limitativa, el decodificador produce dichas componentes residuales reconstruidas en base, también al menos en parte, a una representación de la señal en el segundo (inferior) nivel de calidad. En una modalidad no limitativa, para cada subconjunto de elementos de la señal en el primer nivel de calidad, el decodificador produce un conjunto de parámetros ("residuos transformados reconstruidos"). El decodificador produce un valor correspondiente a dicho conjunto de parámetros, dicho valor en base, al menos en parte, a una representación de la señal en el segundo (inferior) nivel de calidad. Luego, el decodificador combina uno o más parámetros con dicho valor, produciendo el conjunto de componentes residuales reconstruidas correspondiente a dicho subconjunto de elementos de la señal en el primer nivel de calidad. Luego, el decodificador procesa las componentes residuales reconstruidas aplicando una descomposición inversa, produciendo un conjunto de residuos reconstruidos. En una modalidad no limitativa, cada residuo reconstruido del conjunto se obtiene por sumas y/o diferencias entre las componentes residuales reconstruidas.

En algunas modalidades no limitadas descritas en la presente descripción, los residuos transformados reconstruidos se descuantifican antes de procesarse para producir las componentes residuales reconstruidas, es decir, la descuantificación se realiza antes de aplicar una descomposición inversa. En una modalidad no limitativa, las operaciones de descuantificación aplicadas a cada residuo transformado reconstruido (o a cada componente residual reconstruido) varían en base a la posición relativa del residuo transformado correspondiente en el conjunto de residuos transformados.

En otras modalidades no limitativas descritas en la presente descripción, las operaciones de descuantificación se aplican después de la descomposición inversa, descuantificando los residuos reconstruidos.

En algunas modalidades no limitativas descritas en la presente descripción, dicho valor combinado con un conjunto de residuos transformados reconstruidos para producir el correspondiente conjunto de componentes residuales corresponde a un promedio de los residuos en el conjunto ("promedio predicho"). En una modalidad no limitativa, el promedio predicho de un conjunto de residuos se produce promediando un conjunto de elementos de una representación predicha de la señal en el primer nivel de calidad (superior) y restando un elemento correspondiente de una interpretación de la señal en el segundo nivel de calidad (inferior).

En algunas modalidades no limitativas descritas en la presente descripción, la descomposición de residuos en un primer LOQ (superior) toma ventaja del hecho de que el subconjunto de residuos correspondiente a un subconjunto dado de elementos del plano ("pels controlados") se correlaciona con el valor del pel de control en el LOQ inferior, ya que la suma del promedio de los elementos predichos (conocidos por el decodificador) y del promedio de los residuos (a reconstruir por el decodificador) corresponde al valor del pel de control (conocido por el decodificador también). De hecho, en ausencia de operaciones de cuantificación, el promedio de residuos (o, de manera equivalente, la suma de los residuos) se podría determinar con precisión mediante información ya conocida en el lado del decodificador incluso antes de comenzar a proporcionar los datos residuales.

Existen varias formas de aprovechar la posibilidad de calcular un promedio predicho de residuos para mejorar la eficiencia de la codificación y decodificación de los residuos. En una modalidad no limitativa, un plano de residuos en un primer LOQ se divide en bloques de 2x2. Para cada bloque de 2*2, uno de los residuos no se codifica (es decir, no se transmite al decodificador), ya que el decodificador lo reconstruye a partir de los otros tres y del promedio predicho de residuos (es decir, el decodificador tiene la información que es necesaria para producir los residuos faltantes en base a los otros tres residuos de cada bloque de 2*2). Cuando se cuantifican los datos residuales, esta modalidad concentra todos los errores de cuantificación acumulados en uno de los cuatro residuos de cada bloque de 2x2. Otras modalidades no limitativas evitan este problema (manteniendo aún la ventaja de eficiencia de aprovechar la información promedio predicha) aplicando una transformada de descomposición a cada bloque de residuos.

En algunas modalidades no limitativas descritas en la presente descripción, el codificador aplica una transformada de "descomposición direccional" a cada bloque 2x2 de residuos de un plano bidimensional de residuos correspondiente a una representación de la señal en el primer nivel de calidad. En tales modalidades, las cuatro componentes residuales corresponden a cuatro "direcciones" de variabilidad para el bloque residual de 2x2: promedio ("A", correspondiente a la "inclinación de intensidad", conceptualmente ortogonal al plano del bloque de 2x2, suma de los residuos dividida por cuatro), inclinación horizontal ("H", correspondiente a la diferencia horizontal de los residuos, suma de los residuos a la izquierda menos la suma de los residuos a la derecha), inclinación vertical ("V", correspondiente a la diferencia vertical de los residuos, suma de los residuos en la parte superior menos suma de los residuos en la parte inferior) y la inclinación "diagonal" ("D", correspondiente a las diferencias restantes, no explicadas por una simple transición direccional en los bloques de residuos de 2x2).

La diferencia entre la componente promedio A y un promedio predicho (por ejemplo, entre otros, el calculado como la suma del promedio de los elementos predichos menos el elemento de control en el LOQ inferior) se denomina "promedio delta" o "8a". 8a es a menudo igual a cero para las señales del mundo real y, como consecuencia, es a menudo preferible calcular 8ay codificar por entropía 8a en lugar del componente A. Las inclinaciones horizontal y vertical de un bloque de residuos de 2*2 representan la intensidad y la dirección de una transición: para las señales convencionales, es probable que se correlacionen localmente, aumentando de nuevo la eficiencia de la codificación por entropía.

Otras modalidades no limitativas aplican otros métodos de descomposición direccional, en donde al menos uno de los residuos transformados en un conjunto dado de residuos transformados corresponde a una inclinación direccional de los valores del conjunto de los residuos que corresponde a dicho conjunto dado de residuos transformados. Una modalidad no limitativa calcula los residuos transformados realizando cálculos que incluyen operaciones de procesamiento de imágenes (por ejemplo, transformadas direccionales, cálculos de spline, filtro Sobel, cálculos de gradiente, etc.).

En una modalidad no limitativa descrita en la presente descripción, para cada bloque de residuos de NxM (por ejemplo, entre otros, para cada bloque de residuos de 2x2) en un plano de residuos, el codificador produce un conjunto de parámetros correspondientes a los residuos transformados. Luego, el codificador divide los parámetros en subconjuntos — cada uno de dichos subconjuntos corresponde a una misma clase de residuos transformados, en donde cada elemento de un subconjunto corresponde a un bloque de residuos — y codifica individualmente cada uno de los subconjuntos (es decir, los subconjuntos se codifican por separado y los parámetros usados para codificar por entropía cada uno de los subconjuntos son independientes de la codificación por entropía de los otros subconjuntos).

En algunas modalidades no limitativas descritas en la presente descripción, el codificador realiza una descomposición direccional en los bloques de residuos de 2*2 e individualmente (es decir, por separado) codifica los cuatro subconjuntos de parámetros 8a, H, V y D.

En otras modalidades no limitativas, al menos un parámetro codificado corresponde a una pluralidad de residuos transformados de un mismo bloque de residuos. En una modalidad no limitativa, el codificador realiza una descomposición direccional en bloques de residuos de 2x2, y para cada bloque de residuos de 2x2 produce un parámetro único (es decir, un símbolo único) correspondiente a los cuatro parámetros 8a, H, V, D, en donde dicho parámetro se convierte en el único parámetro codificado correspondiente a dicho bloque de residuos. En otras modalidades no limitativas, subconjuntos de los parámetros 8a y los parámetros D se codifican individualmente, mientras que los parámetros H y V se procesan de modo que produzcan un único subconjunto de parámetros, en el que cada parámetro corresponde al parámetro H y al parámetro V de un bloque de residuos de 2*2 dado.

En otras modalidades no limitativas descritas en la presente descripción, un decodificador recibe los datos correspondientes a los residuos transformados para los pels controlados (es decir, para elementos de una representación en un LOQ dado de una señal decodificada en una jerarquía escalonada de LOQ). Para reconstruir residuos en base a los residuos transformados, el decodificador combina los residuos transformados con parámetros en base, al menos en parte, a una representación de la señal en un LOQ inferior a dicho LOQ dado. En una modalidad no limitativa, el decodificador combina uno de los residuos transformados con una diferencia entre el ajuste del pel de control en el LOQ inferior y el promedio de los ajustes predichos (es decir, los ajustes antes de agregar los residuos) de los pels controlados en el LOQ dado. En una modalidad no limitativa, cada residuo transformado corresponde a un bloque de residuos e influye en los valores de todos los residuos que pertenecen a su bloque correspondiente.

En otras modalidades no limitativas descritas en la presente descripción, un codificador selecciona un bloque de residuos en un plano de residuos en un primer LOQ (superior) y produce un conjunto de parámetros en base, al menos en parte, a los residuos en dicho bloque y a una representación de la señal en un segundo LOQ (inferior). En otras modalidades no limitativas descritas en la presente descripción, un decodificador recibe un conjunto de parámetros correspondientes a un bloque de residuos en un plano de residuos en un primer LOQ (superior) y produce un conjunto de residuos en base, al menos en parte, ha dicho conjunto de parámetros y a una representación reconstruida de la señal en un segundo LOQ (inferior).

De acuerdo con modalidades no limitativas adicionales, la señal de entrada se codifica y decodifica por medio de un método de codificación jerárquico basado en niveles, y se producen planos de residuos para muestras vecinas a lo largo de la dimensión del tiempo en base, al menos en parte, a un mismo conjunto de elementos ("plano de soporte"), compensando el movimiento de dicho plano de soporte y combinándolo con residuos relativos, de acuerdo con métodos descritos en otras solicitudes de patente de los mismos autores. En una modalidad no limitativa, los residuos relativos transformados se basan al menos en parte en dicho plano de soporte. En una modalidad no limitativa, tanto el plano de soporte como los planos de residuos relativos se codifican y decodifican de acuerdo con los métodos descritos en la presente descripción.

Tenga en cuenta que las modalidades en la presente descripción se pueden implementar en software o hardware, o se pueden implementar mediante el uso de una combinación de software y hardware, y pueden incluir una configuración de uno o más dispositivos computarizados, enrutadores, redes, estaciones de trabajo, ordenadores de mano o portátiles, tabletas, teléfonos móviles, consolas de juegos, cajas decodificadoras, etc., para llevar a cabo y/o soportar cualquiera o todas las operaciones del método descrito en la presente descripción. En otras palabras, uno o más dispositivos o procesadores computarizados se pueden programar y/o configurar para operar como se explica en la presente descripción para llevar a cabo diferentes modalidades.

Además de las técnicas descritas anteriormente, otras modalidades en la presente descripción incluyen programas de software para realizar las etapas y operaciones resumidas anteriormente y descritos en detalle a continuación. Una modalidad de este tipo comprende un recurso de almacenamiento de hardware legible por ordenador (es decir, un medio legible por ordenador no transitorio) que incluye lógica de programa de ordenador, instrucciones, etc., codificados en el mismo que, cuando se ejecuta en un dispositivo computarizado que tiene un procesador y la memoria correspondiente, programa y/o hace que el procesador realice cualquiera de las operaciones descritas en la presente descripción. Tales arreglos se pueden proporcionar como software, código y/o como otros datos (por ejemplo, estructuras de datos) dispuestos o codificados en un medio legible por ordenador tal como un medio óptico (por ejemplo, CD-ROM, DVD-ROM o BLU-RAY), tarjeta de memoria flash, disquete o disco duro o cualquier otro medio capaz de almacenar instrucciones legibles por ordenador tal como microprograma o microcódigo en uno o más chips ROM, RAM o PROM o como un Circuito Integrado Específico de la Aplicación (ASIC). El software o microprograma u otras configuraciones de este tipo se pueden instalar en un dispositivo computarizado para hacer que el dispositivo computarizado realice las técnicas explicadas en la presente descripción.

En consecuencia, una modalidad particular de la presente descripción se refiere a un producto de programa de ordenador que incluye un medio de almacenamiento de hardware legible por ordenador que tiene instrucciones almacenadas en el mismo para soportar operaciones de procesamiento de señales.

El orden de las etapas se ha agregado para mayor claridad. Estas etapas se pueden realizar en cualquier orden adecuado.

Otras modalidades de la presente descripción incluyen programas de software, microprograma y/o hardware respectivos para realizar cualquiera de las etapas y operaciones de la modalidad del método resumidas anteriormente y descritas en detalle a continuación.

Además, se debe entender que el sistema, el método, el aparato, las instrucciones en medios de almacenamiento legibles por ordenador, etc., tal como se describe en la presente descripción, se pueden incorporar estrictamente como un programa de software, como un híbrido de software, microprograma y/o hardware o como hardware solo tal como dentro de un procesador, o dentro de un sistema operativo o dentro de una aplicación de software, etc.

Como se discutió anteriormente, las técnicas en la presente descripción son adecuadas para su uso en aplicaciones de software, microprograma y/o hardware que procesan señales y producen flujos de bits de datos codificados o que procesan flujos de bits de datos codificados y producen representaciones de señales. Sin embargo, se debe señalar que las modalidades en la presente descripción no se limitan al uso en tales aplicaciones y que las técnicas analizadas en la presente descripción también son adecuadas para otras aplicaciones.

Adicionalmente, tenga en cuenta que aunque cada una de las diferentes características, técnicas, configuraciones, etc., en la presente descripción se pueden analizar en diferentes lugares de esta descripción, se pretende que cada uno de los conceptos se pueda ejecutar independientemente o en combinación entre sí. En consecuencia, una o más de las presentes invenciones, modalidades, etc., como se describe en la presente descripción, se puede realizar y ver de muchas maneras diferentes.

Además, tenga en cuenta que este análisis preliminar de las modalidades en la presente descripción no especifica cada modalidad y/o cada aspecto incrementalmente nuevo de la presente descripción o de la(s) invención(es) reivindicada(s). En cambio, esta breve descripción sólo presenta modalidades generales y los correspondientes puntos de novedad sobre las técnicas convencionales. Para detalles adicionales y/o posibles perspectivas (permutaciones) de la(s) invención(es), se dirige al lector a la sección de Descripción Detallada y a las Figuras correspondientes de la presente descripción como se discute más adelante.

Breve descripción de los dibujos

Los anteriores y otros objetos, características y ventajas de la invención serán evidentes a partir de la siguiente descripción más particular de las modalidades preferidas en la presente descripción, como se ilustra en los dibujos acompañantes en los que caracteres de referencia similares se refieren a las mismas partes a través de las diferentes vistas. Los dibujos no están necesariamente a escala, en cambio, se hace hincapié en ilustrar las modalidades, principios, conceptos, etc.

Las Figuras 1A, 1B, 1C, 1D y 1E son diagramas de ejemplo que describen sistemas de codificación y decodificación de acuerdo con modalidades no limitativas ilustradas en la presente descripción.

Las Figuras 2A y 2B son diagramas de ejemplo que describen la decodificación y codificación jerárquica basada en niveles de acuerdo con modalidades no limitativas ilustradas en la presente descripción.

Las Figuras 3A, 3B, 3C, 3D, 3E y 3F ilustran la descomposición y la descomposición inversa de residuos de acuerdo con modalidades no limitativas ilustradas en la presente descripción.

Las Figuras 4A, 4B, 4C y 4E son diagramas de ejemplo que describen la descomposición inversa de acuerdo con modalidades no limitativas ilustradas en la presente descripción.

La Figura 5 ilustra operaciones realizadas por un decodificador de acuerdo con una modalidad no limitativa ilustrada en la presente descripción.

La Figura 6 ilustra un diagrama de flujo de un codificador que realiza la descomposición direccional de acuerdo con modalidades no limitativas ilustradas en la presente descripción.

La Figura 7 ilustra un diagrama de flujo de un decodificador que realiza una descomposición direccional inversa de acuerdo con modalidades no limitativas ilustradas en la presente descripción.

La Figura 8 es un diagrama de ejemplo que ilustra un sistema informático que proporciona procesamiento de datos de acuerdo con las modalidades descritas en la presente descripción.

La Figura 9 es un diagrama de ejemplo que ilustra la codificación de información de acuerdo con las modalidades en la presente descripción.

Las Figuras 10 y 11 son diagramas de flujo de ejemplo que ilustran métodos de ejemplo de acuerdo con las modalidades en la presente descripción.

Descripción detallada y resumen adicional de las modalidades

Los métodos ilustrados en la presente descripción son adecuados para cualquier tipo de señales multidimensionales, incluyendo, entre otras, señales de sonido, señales de sonido multicanal, imágenes, imágenes bidimensionales, señales de vídeo, señales de vídeo multivistas, señales de vídeo 3D, señales volumétricas, señales de vídeo volumétricas, señales de imágenes médicas, señales con más de cuatro dimensiones, etc.

Para simplificar, a lo largo de la descripción, las modalidades ilustradas generalmente adoptan el caso de uso de imágenes 2D (por ejemplo, imágenes aisladas o tramas/campos de una señal de vídeo), con cada elemento (en tal caso de ejemplo no limitativo denominado usualmente como "píxel", más en general denominado "pel") que se caracteriza por un conjunto de ajustes de color u otros parámetros en un espacio de color adecuado (por ejemplo, YUV, RGB, HSV, etc.). Diferentes planos de color (por ejemplo, el plano de luminancia Y y los dos planos — U y V — de crominancia), a menudo se codifican por separado y, a menudo, con diferentes resoluciones (debido a la menor sensibilidad del ojo humano a la información de crominancia).

Los métodos y modalidades ilustrados en la presente descripción pueden usarse juntos entre sí y/o junto con otros métodos. Muchas de las modalidades preferidas ilustradas en la presente descripción describen técnicas y algoritmos con el objetivo de lograr la compresión, es decir, codificar una representación adecuada de la señal con una cantidad mínima de bits. Este también es un ejemplo no limitativo: otras modalidades no limitativas logran diferentes propósitos, tales como codificación y decodificación multiescala, transmisión adaptativa, filtrado robusto y eficiente, eliminación de ruido de señal (por ejemplo, eliminación de ruido de imagen, eliminación de ruido de vídeo, etc.), mejoras de señal (por ejemplo, supermuestreo de señal, desentrelazado, etc.), generación de métricas de calidad de señal, identificación de contenido, visión artificial, encriptación de señal (por ejemplo, comunicación segura), etc.

La Figura 1A es un diagrama de ejemplo que describe modalidades no limitativas de sistemas de codificación y decodificación que aprovechan los métodos ilustrados en la presente descripción.

El codificador 110 recibe una señal 100 (tal como una imagen bidimensional) y la codifica en el flujo de datos 115. El decodificador 120 recibe el flujo de datos 115 y produce la señal reconstruida 130. La señal reconstruida 130 puede ser idéntica o simplemente sustancialmente similar a la señal original 100 en dependencia de si la codificación/decodificación es con pérdidas o sin pérdidas.

En una modalidad, el codificador 111 recibe la señal original 140 (una señal de vídeo, es decir, una secuencia de múltiples tramas de imágenes bidimensionales) y la codifica en un flujo de datos 116 transmitido por un enlace de comunicación respectivo a un receptor objetivo. El decodificador 121 en el receptor recibe el flujo de datos 116 y produce la señal reconstruida 150, en donde las imágenes reconstruidas 150-1, 150-2,..., 150-n son representaciones reconstruidas correspondientes a las imágenes originales 140-1, 140-2,... ., 140-n. Las imágenes reconstruidas 150-1 pueden ser idénticas o sustancialmente similares a las imágenes originales 140-1 en dependencia de si la codificación y/o decodificación respectiva es con pérdidas o sin pérdidas; las imágenes reconstruidas 150-2 pueden ser idénticas o sustancialmente similares a las imágenes originales 140-2 en dependencia de si la respectiva codificación y/o decodificación es con pérdidas o sin pérdidas; las imágenes reconstruidas 150-3 pueden ser idénticas o sustancialmente similares a las imágenes originales 140-3 en dependencia de si la respectiva codificación y/o decodificación es con pérdidas o sin pérdidas; y así sucesivamente. De acuerdo con modalidades adicionales, el codificador 112 recibe la señal original 160 (una señal volumétrica que incluye múltiples elementos) y la codifica en el flujo de datos 117. El decodificador 122 recibe el flujo de datos 117 y produce la señal reconstruida 170 (por ejemplo, una representación de la señal original).

La Figura 1B es un diagrama de ejemplo no limitativo que ilustra un sistema de codificación y decodificación multiescala de acuerdo con las modalidades en la presente descripción.

En una modalidad, el codificador 111 recibe la señal original 140 y la codifica en un flujo de datos multiescala 116. En esta modalidad de ejemplo, el decodificador 121-2 recibe el flujo de datos 116 y produce una señal reconstruida en el LOQ inferior 151 (por ejemplo, incluidas las tramas 151-1, 151-2, etc.) de un primer nivel de calidad (inferior) a la señal original y/o señal 150.

Además, en esta modalidad de ejemplo, el decodificador 121-1 recibe el flujo de datos 116 y produce una señal reconstruida a un LOQ 150 superior (por ejemplo, a un segundo nivel de calidad). En este ejemplo de modalidad, el segundo nivel de calidad es superior al primero.

En una modalidad no limitativa, el segundo nivel de calidad tiene una resolución mayor (espacial y/o temporal) que el primer nivel de calidad. En otra modalidad no limitativa, el decodificador 121-2 aprovecha las técnicas de decodificación basadas en MPEG (por ejemplo, MPEG2, MPEG4, h.264, etc.) con el fin de decodificar el flujo de datos 116. En otra aún modalidad no limitativa, el decodificador 121-1 produce una señal reconstruida en el LOQ 151 inferior y luego reconstruye o deriva la señal reconstruida en el LOQ 150 superior en base, al menos en parte, a reproducir primero la señal reconstruida en el LOQ 151 inferior. En otras palabras, el decodificador 121-1 usa una primera porción de los datos codificados en el flujo de datos 116 para reproducir representaciones de la señal 151 (por ejemplo, 151-1, 151-2, etc.). A partir de entonces, el decodificador 121-1 usa una segunda porción de los datos en el flujo de datos 116 para el sobremuestreo y modificar las representaciones de la señal 151 en las representaciones de la señal 150.

En una modalidad no limitativa, el segundo nivel de calidad tiene una resolución obtenida mediante sobremuestreo con un factor de escala de dos cada dimensión espacial del primer nivel de calidad. Por ejemplo, el flujo de datos 116 se puede configurar para incluir una primera porción de los datos de reconstrucción que indica cómo reproducir un elemento original de la representación de la señal en un primer nivel de calidad. Los datos de reconstrucción adicionales en el flujo de datos 116 pueden indicar cómo convertir el elemento en el primer nivel de calidad en múltiples elementos en un segundo nivel de calidad. A modo de ejemplo no limitativo, los elementos múltiples en el segundo nivel de calidad proporcionan una resolución mayor que el elemento original en el primer nivel de calidad. Repitiendo estas etapas, una resolución baja de una imagen se puede convertir en una mayor resolución de imagen. La mayor resolución de la imagen proporciona más detalles de la imagen (porque incluye muchos más elementos de la imagen) y, por tanto, es probable que sea más atractivo para el espectador.

En otras modalidades no limitativas, el segundo nivel de calidad tiene una resolución obtenida mediante sobremuestreo con un factor de escala específico (incluyendo factores de escala no enteros y/o factores de escala iguales a 1) cada una de las dimensiones de la señal. Como ejemplo, en una modalidad de ejemplo no limitativa, un procesador de señales de decodificación de un decodificador de TV (por ejemplo, entre otros, una caja decodificadora) se programa para implementar un método como se ilustra en la Figura 1B, en donde el flujo de datos 116 corresponde a la señal de radiodifusión recibida. De esta manera, los decodificadores heredados reciben el mismo flujo de datos 116, pero simplemente ignoran los datos adicionales que permiten reconstruir una representación de la señal al nivel de calidad superior. Como se mencionó, el nivel de calidad superior puede ser una representación de la señal en una mayor resolución. En otras modalidades no limitativas, un servidor de transmisión procesa el flujo de datos codificados 116 y, en respuesta a las características del decodificador y/o a la congestión del ancho de banda, genera una versión del flujo de datos que sólo incluye los datos codificados necesarios para decodificar la señal a un nivel dado de calidad (lo opuesto al máximo nivel de calidad posible). En tal caso, el ancho de banda no se desperdicia en la transmisión de datos que no se usarán para reconstruir una representación de la señal original.

La Figura 1C ilustra una modalidad de ejemplo no limitativa de codificación y decodificación jerárquica basada en niveles de una imagen bidimensional, con factores de escala de dos en ambas dimensiones entre cualquier nivel de calidad posterior de acuerdo con las modalidades en la presente descripción.

En esta modalidad de ejemplo, la imagen 130-3 es una representación de la imagen con un nivel de calidad dado y, en particular, tiene una resolución de 8x8 elementos. La imagen 130-4 es una representación de la misma imagen con el nivel de calidad inmediatamente inferior y tiene una resolución de 4x4 elementos.

El elemento 130-4-1 del LOQ inferior comparte ubicación con los elementos 130-3-1, 130-3-2, 130-3-3 y 130-3-4 del LOQ superior. En esta modalidad de ejemplo, el elemento 130-4-1 es, por tanto, el "elemento de control" (o "pel de control" o "elemento principal") de los elementos 130-3-1, 130-3-2, 130-3-3 y 130-3-4 ("elementos controlados" o "subelementos").

Otras modalidades no limitativas aplican los mismos métodos en imágenes con más de dos dimensiones, produciendo jerarquías escalonadas con factores de escala adecuados para cada nivel, incluidos factores de escala no enteros y/o factores de escala diferentes para las dimensiones diferentes y/o factores de escala diferentes a lo largo de la jerarquía.

La Figura 1D ilustra otra modalidad de ejemplo no limitativa de codificación y decodificación jerárquica basada en niveles de una imagen bidimensional, con factores de escala de dos en ambas dimensiones entre el LOQ N-1 y el LOQ N de acuerdo con las modalidades en la presente descripción.

El elemento principal 130-(N-1)-1 del LOQ N-1 ("elemento de control") se ubica junto con los cuatro subelementos 130-N-1 correspondientes al LOQ N ("elementos controlados"). En general, el elemento principal 130-(N-1)-1 se usa como línea base en la cual reproducir (por ejemplo, a través del sobremuestreo seguido de ajustes mediante el uso de datos residuales) los cuatro subelementos 130-N-1 correspondientes.

La Figura 1E ilustra otra modalidad de ejemplo no limitativa de codificación y decodificación jerárquica basada en niveles de una imagen bidimensional, con factores de escala no enteros de 3/2 en ambas dimensiones entre el LOQ N-1 y el LOQ N de acuerdo con las modalidades en la presente descripción.

El bloque principal 130-(N-1)-2 del LOQ N-1 (un grupo de elementos de control, ya que en este caso ningún elemento individual del LOQ N-1 se coubica precisamente junto con un conjunto de elementos del LOQ N) se coubica con los subelementos 130-N-2 del LOQ N (conjunto de elementos controlados). En este ejemplo no limitativo, el cálculo de un promedio predicho para los residuos correspondientes a los subelementos 130-N-2 puede requerir el procesamiento tanto de una representación predicha de los subelementos 130-N-2 como del bloque principal 130-(N-1)-2 (lo opuesto de un único elemento principal).

Por simplicidad y en aras de una ilustración adicional, las siguientes porciones de la descripción incluyen ejemplos que usan factores de escala de dos de un nivel de calidad al siguiente. Sin embargo, los expertos en la técnica pueden adaptar fácilmente todos los métodos descritos en la presente descripción para jerarquías escalonadas con cualquiera de los múltiples tipos diferentes de factores de escala, incluyendo factores de escala anisotrópicos y/o no enteros.

La Figura 2A es un diagrama de ejemplo que describe la decodificación de una señal en una jerarquía escalonada de niveles de calidad de acuerdo con las modalidades en la presente descripción.

En esta modalidad de ejemplo, el decodificador 210 recibe los datos de reconstrucción 200-1 y produce la imagen decodificada 245-(N-1) en el LOQ N-1 (en este ejemplo, el nivel mínimo de calidad o nivel inferior de calidad).

La calculadora de predicción para el siguiente LOQ 220-1 procesa la imagen 245-(N-1) con operaciones como las especificadas por los parámetros correspondientes para las operaciones 215-1, produciendo la imagen predicha 225-1. Suponiendo un factor de aumento de escala de 2x2, la calculadora 220-1 produce la imagen predicha 225-1 que especifica los ajustes para un bloque de elementos de 8x8.

El decodificador 230 recibe los datos de reconstrucción 200-2 y produce los residuos 240 (es decir, datos de reconstrucción o datos residuales). En esta modalidad de ejemplo, los residuos 240 pueden ser una matriz de 8x8 de información de ajustes de elementos que coincida con el número de elementos en la imagen 245-N.

La imagen predicha 225-1 producida también por la calculadora 220 también puede ser una matriz de 8x8 de información de ajustes de elementos que coincida con el número de elementos en la imagen 245-N.

En una modalidad, el sobremuestreo de la imagen 245-(N-1) en la imagen predicha 225-1 es simplemente una imagen de referencia que incluye 8x8 elementos. La imagen predicha 225-1 y los residuos 240 se combinan, en una base de elemento por elemento, produciendo una imagen decodificada 245-N, que es una representación de la señal en el LOQ N (por ejemplo, 8x8 elementos). En una modalidad, los residuos 240 incluyen un conjunto de 8x8 elementos que se agregan o combinan con elementos en la imagen predicha 225-1 para producir la imagen 245-N. La aplicación de los residuos 240 a la imagen predicha 225-1 produce una representación más precisa de la señal al nivel de calidad correspondiente. En otras palabras, la representación de la señal 245-N es una representación más precisa de la señal original que la imagen predicha 225-1.

Las representaciones de la señal en cada uno de los LOQ subsecuentemente superiores se pueden producir de acuerdo con el mismo método: producir, en base a la representación en el LOQ actual, una representación predicha en el siguiente LOQ superior; decodificar los residuos; combinar la representación predicha en el LOQ superior con los residuos decodificados, produciendo una representación de la señal en el LOQ superior. La combinación puede incluir, para cada elemento de la matriz, seleccionar una ubicación de un elemento dentro de la imagen predicha 225-1 y los residuos 240 y sumar los valores para producir un valor para el elemento correspondiente en la imagen 245-N.

En una modalidad no limitativa, el decodificador 210 usa - con el fin de decodificar la tasa de reconstrucción 200-1 -un método de decodificación que es diferente del método de decodificación usado por el decodificador 230. En una modalidad de ejemplo no limitativa, el decodificador 210 implementa un método de decodificación H.264.

En otras modalidades no limitativas, el decodificador 230 produce los residuos 240 en base a un conjunto de datos codificados (datos codificados del "plano de soporte") que se aprovecha también para producir los residuos para una imagen vecina en una secuencia de imágenes.

Por tanto, cualquier algoritmo de sobremuestreo adecuado puede usarse para convertir una señal o imagen de referencia en un primer nivel de calidad en una imagen predicha de mayor resolución en un siguiente nivel de calidad superior.

La Figura 2B es un diagrama de ejemplo que describe la codificación de un codificador de una señal en una jerarquía escalonada de niveles de calidad de acuerdo con las modalidades en la presente descripción.

Un procesador de señales configurado como un codificador recibe como imagen de entrada 130-0 en el LOQ #0 tal como una imagen con una mayor resolución. La imagen 130-0 se procesa por el submuestreador 250-0, produciendo la imagen 130-1 en el LOQ#-1. La imagen 130-1 se procesa por el submuestreador 251-1, produciendo la imagen 130-2 en el siguiente LOQ inferior #-2. Este proceso de submuestreo se repite hasta que se produce la imagen 130-B en el LOQ #B mínimo (un nivel de calidad aún más inferior).

Una vez que se produce la imagen 130-B con el nivel de calidad más bajo, el codificador comienza a producir los datos de reconstrucción (datos residuales o valores de ajuste) que serán necesarios en el lado de decodificación (es decir, decodificador) con el fin de reconstruir una representación de la señal original en diferentes niveles de calidad (o, más de manera más precisa, en una jerarquía escalonada de representaciones de la señal).

En esta modalidad de ejemplo, con el fin de hacer esto, el codificador produce los datos de reconstrucción para el LOQ mínimo (el LOQ inicial para la reconstrucción de la señal) y luego simula todas las operaciones que se realizarán por el decodificador con el fin de reconstruir progresivamente, en base a un LOQ inferior, cada siguiente LOQ superior. Crear los valores de ajuste para cada elemento cuando se desplaza hacia arriba en la jerarquía permite que un decodificador respectivo reproduzca una representación de la señal original en cada uno de los múltiples niveles de calidad.

En una modalidad, el nivel más bajo de calidad es la resolución más baja. Los niveles de calidad sucesivamente superiores representan representaciones de la señal de mayor resolución.

En esta modalidad de ejemplo, la imagen 130-B se procesa por la calculadora de residuos 260+B, produciendo datos residuales RB270+B. Los datos residuales 270+B se procesan por el generador de datos de reconstrucción 280+B, produciendo los datos de reconstrucción 290+B.

Los datos de reconstrucción 290+B se procesan por el decodificador simulado 2100+B, produciendo la representación de la señal 245-B en el LOQ #B mínimo y la representación predicha 225-(B+1) en el LOQ #(-B+1). Las representaciones predichas en cualquier LOQ #N dado son procesadas por el codificador junto con la imagen 130-N correspondiente para producir datos residuales.

La calculadora de residuos 261 recibe la imagen 130-1 en el LOQ #-1 y la representación predicha 225-(-1) en el LOQ #-1, produciendo los datos residuales 271. En una modalidad, los datos residuales 271 (o datos de reconstrucción) incluyen valores de ajuste a aplicar a la representación predicha recibida 225-(-1) con el fin de reproducir la representación de la señal en el nivel correspondiente de calidad #-1. Los datos residuales 271 se procesan por el generador de datos de reconstrucción 281, produciendo los datos de reconstrucción 291.

Los datos de reconstrucción 291 se procesan por el decodificador simulado 2101, produciendo la representación de la señal 245-1 en el LOQ #-1 y la representación predicha 225-0 en el LOQ #0.

La calculadora de residuos 260 recibe la imagen original 130-0 en el LOQ #0 y la representación predicha 225-0 en el LOQ #0, produciendo los datos residuales 270. En una modalidad, los datos residuales 270 (o datos de reconstrucción) incluyen valores de ajuste a aplicar a la representación predicha recibida 225-0 para reproducir la representación de la señal en el nivel correspondiente de calidad #0. Los datos residuales 270 se procesan por el generador de datos de reconstrucción 280, produciendo los datos de reconstrucción 290.

Los datos de reconstrucción 290 se procesan por el decodificador simulado 2100, produciendo la representación de la señal 245-0, que es la representación de la señal en el LOQ más alto en la jerarquía de representaciones que se generarán en el lado de decodificación.

En una modalidad no limitativa, el codificador verifica que la representación 245-0 sea adecuadamente similar a la imagen original 130-0, de acuerdo con una métrica de calidad. Si la puntuación de la métrica de calidad cae por debajo de un umbral, el codificador vuelve a procesar los datos de reconstrucción para uno o más LOQ (por ejemplo, ajustando los parámetros de codificación adecuados) hasta que una métrica de calidad para la similitud entre 245-0 y 130-0 esté por encima un umbral.

En otra modalidad no limitativa, el codificador verifica que la cantidad de flujo de bits necesaria para codificar los datos de reconstrucción 290, 291, ..., 290+B está por debajo de un umbral máximo. Si la cantidad necesaria de flujo de bits está por encima de un umbral, el codificador vuelve a procesar los datos de reconstrucción para uno o más LOQ (por ejemplo, ajustando los parámetros de codificación adecuados) hasta que la cantidad necesaria de datos a transmitir en el flujo de bits esté por debajo del umbral.

Las Figuras 3A y 3B ilustran un ejemplo de descomposición direccional de acuerdo con las modalidades en la presente descripción. La descomposición direccional se aplica a agrupaciones de bloques de residuos de 2*2 en el caso de sobremuestreo 2D con factor de escala de dos a lo largo de ambas dimensiones (es decir, para cada elemento principal en el LOQ #(N-1) hay cuatro pels controlados (es decir, elementos de imagen) en el siguiente LOQ #N superior y, en consecuencia, se deben decodificar cuatro residuos con el fin de reconstruir adecuadamente dichos pels controlados).

La descomposición direccional representa una manera de codificar los datos de reconstrucción (tales como los datos residuales) de una manera útil.

En este ejemplo, suponga que el bloque de residuos 300 es una porción de un plano de datos residuales en un LOQ #N dado que se procesa por un decodificador y combinado con una representación predicha de una señal en el LOQ #N dado con el fin de producir una representación de la señal en dicho LOQ #N dado. En particular, el bloque de residuos 300 se forma por los cuatro residuos r¡,j, n,j+1, r¡+1j y n+1,j+1. El residuo n,jes un valor de ajuste que indica cómo modificar un elemento correspondiente p¡,j en la imagen predicha para reproducir una representación del elemento Xi,j; los datos de reconstrucción j son un valor de ajuste que indica cómo modificar un elemento correspondiente pi,j+1 en la imagen predicha para reproducir una representación del elemento x¡,j+1; los datos de reconstrucción n+1,j son un valor de ajuste que indica cómo modificar un elemento correspondiente p¡+1,j en la imagen predicha para reproducir una representación del elemento x¡+1,j; los datos de reconstrucción n+1,j+1 son un valor de ajuste que indica cómo modificar un elemento correspondiente p¡+1,j+1 en la imagen predicha para reproducir una representación del elemento x¡+1,j+1.

En particular, el bloque de residuos 300 corresponde a un bloque 305 de elementos de imagen x¡,j, X¡,j+1, X¡+1,j, X¡+1,j+1en el LOQ #N controlado por un elemento principal y1306 en el LOQ #(N-1) inferior que se generó por el codificador en base a los elementos de imagen en el LOQ #N.

En esta modalidad no limitativa los ajustes y1 del elemento principal se generaron cuantificando un promedio ponderado de los ajustes de los elementos correspondientes al bloque 300, con uno de los múltiples algoritmos de submuestreo tales como un kernel de filtrado bilineal y con la posición de muestreo del elemento principal ubicada en el centro del bloque (es decir, en el caso no limitativo de filtrado bilineal, el elemento principal corresponde a un promedio simple de los pels controlados). Como consecuencia, la suma de los residuos de los pels controlados (es decir, la suma de rij, r¡,j+1, r¡+1,j y r¡+1,j+1) depende al menos en parte del ajuste del elemento principal y1; de hecho, en ausencia de operaciones de cuantificación, estaría determinado con precisión por el elemento principal, que ya se conoce por un decodificador en el momento en que comienza a reconstruir el bloque 300.

Con el fin de aprovechar adecuadamente tal información, el codificador, como se describe en la presente descripción, realiza una transformada de descomposición que toma ventaja conjuntamente de dos tipos de correlación: (1) la autocorrelación entre los residuos del bloque 300 y (2) la correlación entre los residuos del bloque 300, los elementos predichos correspondientes al bloque 300 y el elemento principal. Como se mencionó, la descomposición es una manera de codificar los residuos 300 en diferentes formatos (por ejemplo, las componentes direccionales 320 y luego residuos transformados 350 que son más adecuados para la transmisión a través de un enlace de comunicación a un dispositivo de destino remoto que decodifica los datos para reproducir una imagen). Más específicamente, en esta modalidad de ejemplo, con el fin de explotar la autocorrelación entre los residuos, el codificador aplica una transformación de "descomposición direccional" a los residuos, produciendo las cuatro componentes direccionales A, H, V y D:

■ A es el promedio de los residuos n,j, n,j+i, r¡+i,j, r¡+1,j+1;

■ H es la inclinación horizontal/latitudinal de dichos residuos;

■ V es la inclinación vertical/longitudinal de dichos residuos;

■ D es la inclinación diagonal/oblicua de dichos residuos.

En general, los valores H, V y D incluyen suficiente información de decodificación para convertir el valor A en ajustes más específicos para cada uno de las componentes residuales ry, ry+1, n+1,j, n+1,j+1. Desde un punto de vista geométrico, la transformación es equivalente a reemplazar cuatro muestras en el espacio con su representación dada por un plano ubicado en el eje z en el promedio de las muestras e inclinado en consecuencia para reconstruir las 4 muestras, como se ilustra en la Figura 3A.

Como ya se mencionó, la transformación tiene dos objetivos: explotar la correlación entre los residuos (por ejemplo, la correlación direccional de líneas y de patrones típicos de una imagen) y reducir la entropía de información correspondiente al promedio A, que se puede predecir fácilmente en el lado del decodificador en base, al menos en parte, a los valores predichos.

En el lado del codificador, el codificador sabe que el elemento principal se calculó de acuerdo con la fórmula 3.12 en la Figura 3B. La diferencia 6a entre y, y y1 proviene de los errores generados durante los procesos de cuantificación/descuantificación. De acuerdo con la ecuación 3.14 en la Figura 3B, restando de y1 el valor promedio de las predicciones p para los ajustes x de los pels controlados, es posible generar una predicción ("PA", para "promedio predicho") para el valor promedio de los cuatro residuos 300, de manera que la diferencia entre A y PA es igual a 6a.

En esta modalidad de ejemplo, el codificador genera los residuos transformados 350 de la siguiente manera:

■ Procesar los residuos 300 con el Descomponedor Direccional 310, produciendo las Componentes Direccionales 320. En particular, las Componentes Direccionales se calculan de acuerdo con los cálculos ilustrados en la fórmula 3.11.

■ Producir un Promedio Predicho de 340.

■ Procesar las Componentes Direccionales 320 y del Promedio Predicho 340 con la Calculadora de Residuos Transformados 330, produciendo los Residuos Transformados 350.

En una modalidad no limitativa, 6a se calcula de acuerdo con la fórmula 6a= A - PA = A - (yV,h - AvgP), en donde AvgP es el valor promedio de las predicciones p para los ajustes x de los pels controlados.

En una modalidad no limitativa, al calcular las Componentes Direccionales 320 el codificador no divide por 4 como se indica en la fórmula 3.11 en la Figura 3B, con el fin de reducir los cálculos necesarios para el proceso de descomposición inversa necesario en el lado de la decodificación.

En una modalidad no limitativa, un decodificador recibe los residuos transformados 6a, H, V, D (calculados por el codificador como se describió anteriormente) y calcula los residuos ry, ry+1, n+1,j, n+1,j+1 produciendo primero un promedio predicho PA y reconstruyendo las componentes A, H, V, D, y luego resolviendo para ry, ry+1, n+1,j, n j la ecuación indicada en la fórmula 3.11.

En otra modalidad no limitativa, el decodificador recibe los residuos transformados 6a, H, V, D y calcula A de acuerdo con la fórmula A = 6a (y'k,h - AvgP), en donde AvgP es el valor promedio de las predicciones p para los ajustes x de los pels controlados. Desde el punto de vista de la entropía de la información, el beneficio de transmitir/recibir 6a (es decir, la diferencia entre el promedio real de los residuos y el promedio predicho de los residuos) en lugar del valor A (promedio) se basa en el hecho de que 6a es muy probable que sea igual a cero (o sea casi cero), por lo que es más probable que el símbolo cero se encuentre en la secuencia de residuos transformados codificados, por tanto, que mejore la eficiencia de codificación. En otras palabras, transmitir el valor 6a en lugar de transmitir el valor A, ahorra la cantidad de bits de datos que se necesitan para codificar los residuos 300. Después de haber calculado A en este ejemplo, el decodificador calcula los residuos ry, ry+1, n+1,j, n j resolviendo para ry, ry+1, n+1,j, n+1,j+1 mediante el uso de la ecuación indicada en 3.11.

Como se indicó anteriormente, la descomposición de los residuos 300 para producir subsecuentemente los residuos transformados 350 toma ventaja de la correlación entre los residuos. En una modalidad no limitativa, la descomposición permite separar los residuos en una parte constante y una o más partes variables. Algunos de los elementos transformados pueden ser predecibles, haciendo más fácil transmitirlos. En una modalidad, los residuos transformados 350 se obtienen en base a una combinación de adiciones y/o diferencias entre componentes individuales.

Ilustrándolo con ecuaciones, a partir del vector r (que comprende los cuatro residuos 300 como j el codificador calcula el vector 1, en donde el vector 1 contiene cuatro parámetros derivados del promedio A, la inclinación horizontal H, la inclinación vertical V y la inclinación diagonal D. En particular, el vector 1 se calcula multiplicando el vector r por la matriz M. El decodificador recibe los parámetros que le permiten reconstruir el vector 1 (en particular, en la modalidad no limitativa descrita anteriormente, en lugar de recibir el parámetro A, el decodificador recibe el parámetro 5a que indica la diferencia entre A y el promedio predicho ^pA de los residuos). Después de haber reconstruido 1, el decodificador reconstruye el vector r multiplicando la inversa de la matriz M por el vector 1. Como se ilustra mediante las siguientes ecuaciones de la Figura 3^b, en una matriz de una modalidad no limitativa M-1 es idéntica a la matriz M:

r - M 1 - l - M -l

En otra modalidad no limitativa, diferentes residuos en un conjunto de residuos transformados se cuantifican de acuerdo con diferentes parámetros de cuantificación. Esto se debe a la diferente importancia relativa de las componentes direccionales para la calidad percibida, lo que permite cuantificar ciertos residuos transformados de manera diferente a otros sin diferencias notables en la calidad. En otras palabras, como se mencionó, los datos de reconstrucción o datos residuales en cada nivel de calidad correspondiente al que pertenecen los datos son responsables de volver a agregar los detalles en una representación predicha de la señal de manera que la representación producida de la señal refleje con mayor precisión la señal original para el nivel de calidad correspondiente.

Por ejemplo, los residuos transformados correspondientes al promedio o a las componentes diagonales se cuantifican de forma más agresiva que las otras. En una modalidad, el decodificador descuantifica diferentes residuos de acuerdo con diferentes parámetros de descuantificación. En otra modalidad, diferentes parámetros de cuantificación permiten mejorar la precisión de la inclinación vertical y la inclinación horizontal de los residuos (a las que el ojo humano es particularmente sensible) independientemente de la precisión de la información diagonal/oblicua, de modo que, en caso de artefactos de cuantificación (por ejemplo, errores de imagen que se producen debido al filtrado para guardar los bits de datos) introducidos por la compresión, las componentes específicas de los residuos tienen privilegios en términos de asignación de tasa de bits.

En otra modalidad no limitativa, los parámetros H y V se cuantifican de manera diferente de acuerdo con una estimación de las cantidades de correlación horizontal frente a vertical en una señal (por ejemplo, un campo en un vídeo entrelazado a menudo se caracteriza por una correlación horizontal más alta que una correlación vertical, por lo que se puede codificar eficientemente cuantificando H y V de manera diferente).

En otra modalidad no limitativa, para el último nivel de calidad, el decodificador recibe sólo parámetros correspondientes a H y V, y reconstruye el conjunto completo de componentes direccionales (y luego los residuos) ajustando A y D a valores predeterminados.

Otras modalidades no limitativas adoptan métodos de transformación de residuos similares con el fin de codificar y/o decodificar los residuos para conjuntos de pels controlados que presentan más de dos dimensiones (por ejemplo, a modo de ejemplo no limitativo, residuos para conjuntos de ocho elementos de imagen de control obtenidos por medio de una operación de sobremuestreo tridimensional) y/o diferentes factores de escala desde un LOQ inferior hasta el siguiente LOQ superior.

Los expertos en la técnica pueden deducir fácilmente la matriz de transformación que se usará en otras modalidades que operen en operaciones de sobremuestreo que involucren más de dos dimensiones (por ejemplo, a modo de ejemplo no limitativo, operaciones que involucren dos dimensiones espaciales y una dimensión temporal, todas con una escala factor de dos, reconstruyendo 8 pels controlados en un LOQ superior para cada pel controlado en un LOQ inferior). A modo de ejemplo no limitativo, un sobremuestreo volumétrico con un factor de escala de dos en todas las dimensiones requiere una matriz de transformada de descomposición residual de 8x8, que calcula 8 gradientes direccionales/inclinaciones residuales. En una modalidad no limitativa, para cada bloque 2x2x2 de la señal, el codificador calcula (y el decodificador recibe y decodifica) un parámetro correspondiente al valor residual promedio y 7 parámetros correspondientes a 7 valores de inclinación residual.

En otra modalidad no limitativa, tanto el codificador como el decodificador operan por separado en las dimensiones de tiempo y espacio. La inclinación temporal se transmite y decodifica primero y luego los 6 valores restantes (3 por cada plano espacial) se transmiten como valores espaciales oblicuos. En otra modalidad no limitativa, el codificador y el decodificador usan un método de descomposición direccional completo en dos dimensiones (por ejemplo, en el codificador, para cada bloque de residuos de 2x2: calcular el promedio A, la inclinación horizonta1H, la inclinación vertical V y la diagonal inclinar D de residuos, y luego codificar, en lugar del promedio A, la diferencia 5a entre el promedio A y el promedio predicho PA; en el decodificador: recibir la diferencia 5a entre el promedio A y el promedio predicho PA, la inclinación horizontal H, la inclinación vertical V y la inclinación diagonal D, y calcular a partir de dichos parámetros los cuatro residuos), y luego una descomposición direccional parcial en la tercera dimensión (por ejemplo, a lo largo del tiempo, calcular, codificar y decodificar sólo la inclinación entre los dos promedios de los bloques de residuos de 2x2).

En otra modalidad no limitativa, el codificador puede elegir la opción para evitar transmitir un residuo para cada conjunto de residuos correspondientes a un mismo pel de control en un LOQ inferior. Esto es equivalente a cuantificar 5a a cero, independientemente de su valor real.

En otras modalidades no limitativas, el decodificador recibe conjuntos completos de residuos y explota la redundancia en la información residual para propósitos de corrección o detección de errores, mejorando la solidez de la transmisión.

En otras modalidades no limitativas con factores de escala entre los LOQ diferentes de 2 para una o más direcciones, el codificador y el decodificador calculan el promedio predicho para un conjunto de residuos en base, al menos en parte, a los valores de una pluralidad de elementos de la representación del señal en el LOQ inferior. En otras modalidades no limitativas, el codificador aplica transformadas de descomposición a conjuntos específicos de residuos, con el objetivo de maximizar el número de residuos transformados a los que se les asigna un valor igual a cero. Esto se debe a que las técnicas de codificación por entropía son más eficientes cuando se comprime un flujo de números que incluyen un mayor porcentaje de valores iguales a cero. En una modalidad no limitativa, los parámetros correspondientes a las transformadas de descomposición aplicadas se transmiten al decodificador, junto con los datos de reconstrucción.

En una modalidad no limitativa, el codificador selecciona conjuntos de residuos de diferentes imágenes en un mismo LOQ en una secuencia de imágenes, correspondiendo dichos conjuntos de residuos a una misma ubicación (es decir, un conjunto de coordenadas) a lo largo de múltiples imágenes posteriores (por ejemplo, múltiples posiciones de muestreo a lo largo del tiempo). Para cada posición dada en los conjuntos de residuos, el codificador selecciona los residuos de los conjuntos que están en esa posición (por ejemplo, una secuencia temporal de residuos a lo largo del tiempo) y genera una secuencia de residuos transformados comenzando con un valor correspondiente al promedio de dichos residuos y luego — correspondiente a cada residuo dado — los valores correspondientes a la etapa entre el residuo anterior y el residuo dado. De esta manera, el codificador representa de manera muy eficiente una secuencia de múltiples valores que son constantes por un tiempo, luego cambian a un valor diferente y permanecen constantes nuevamente a partir de entonces: de hecho, tal secuencia se representa con sólo dos valores diferentes de cero (es decir, el valor correspondiente al promedio y el valor correspondiente al pel donde ocurre el cambio de etapa). En tal modalidad, para reconstruir los residuos originales, el decodificador procesa los residuos transformados y calcula los residuos multiplicando los residuos transformados por matrices tales como las siguientes (en dependencia del número de residuos en la secuencia):

etc.

La Figura 3F es un diagrama de ejemplo que ilustra la generación de datos de reconstrucción de acuerdo con las modalidades en la presente descripción

Como se muestra, el hardware de procesamiento informático de la Figura 3F se configura para producir los datos de reconstrucción de acuerdo con las modalidades en la presente descripción. Como se muestra, durante la codificación, el algoritmo de submuestreo 371 recibe y procesa el bloque 305 que incluye X11, X12, X21, X22. Cada uno de estos valores X11, X12, X21, X22 representa un ajuste correspondiente asociado con el elemento respectivo. En una modalidad, el algoritmo de submuestreo 371 recibe y procesa la matriz X en el primer nivel de calidad y convierte la matriz de valores x (X11, X12, X21, X22) en un único valor y (por ejemplo, el valor representativo 361). El algoritmo cuantificador 371 convierte el valor y en y1 (por ejemplo, un valor representativo cuantificado 362, también indicado como 306 en la Figura 3B). El algoritmo de muestreo ascendente 373 asociado con el codificador, al procesar la representación de la señal en el LOQ #2 inferior, inicia el sobremuestreo del valor 362 (por ejemplo, y1) en una representación predicha (P11, P12, P21, P22) correspondiente a la representación original de la señal (X11, X12, X21, X22). La función de diferencia 376 produce los datos de reconstrucción o datos residuales 300 como una diferencia entre la señal original especificada porX11, X12, X21, X22 y la representación predicha P11, P12, P21, P22 para producir los valores de ajuste R11, r 12, R21, R22.

En una modalidad, el valor de ajuste R11 = X11 - P11; el valor de ajuste R12 = X12 - P12; el valor de ajuste R21 = X21 - P21; y el valor de ajuste R22 = X22 - P22.

El recurso de procesador 377 recibe el primer conjunto de valores de ajuste (tales como los datos residuales 300 o los valores de ajuste R11, R12, R21, R22). El primer conjunto de valores de ajuste especifica los ajustes a realizar en una representación predicha (P11, P12, p21, P22) de la señal generada en el nivel #1 correspondiente para reconstruir una representación de la señal (X11, X12, X21, X22) en el primer nivel de calidad. El recurso de procesador 377 procesa el primer conjunto de valores de ajuste R11, R12, R21, R22. El recurso del procesador 377 deriva un segundo conjunto de valores de ajuste (o residuos transformados 350 o 8a, H, V, D) en base al primer conjunto de valores de ajuste R11, R12, R21, R22 y una representación de la señal como y1 en un segundo nivel de calidad.

En este ejemplo, el nivel de calidad #2 es inferior al nivel de calidad #1. La señal puede ser una imagen que incluye múltiples elementos. A modo de ejemplo no limitativo, el nivel de calidad #1 puede ser una primera resolución de imagen; el nivel de calidad #2 puede ser una segunda resolución de imagen. La resolución de la segunda imagen es más baja que la resolución de la primera imagen.

Nuevamente tenga en cuenta que la señal que se codifica por el hardware del codificador de la Figura 3F puede ser cualquier tipo adecuado de señal. Por ejemplo, la señal puede ser una imagen bidimensional; la señal puede ser una señal de vídeo; la señal puede ser una imagen volumétrica; y así sucesivamente.

En otra modalidad específica, el recurso de procesador 377 incluye un procesador de datos de reconstrucción 396. El procesador de datos de reconstrucción 396 convierte los datos residuales 300 en los valores de las componentes A, H, V y D. Como se mencionó, los valores A, H, V y D son una representación codificada de los residuos 300. En base, al menos en parte, al valor y1 y a las componentes direccionales A, H, V y D, el transformador de datos de reconstrucción 397 produce los valores de ajuste 8a, H, V, D (datos residuales transformados 350).

De acuerdo con la invención, el recurso de procesador 377 deriva el conjunto de valores de ajuste 8a, H, V, D (datos residuales transformados 350) procesando el conjunto de valores de ajuste R11, R12, R21, R22 para producir las múltiples componentes de ajuste A, H, V y D, que son representativas del conjunto de valores de ajuste R11, R12, R21, R22. El transformador de datos de reconstrucción 397 produce el conjunto de datos de ajuste 8a, H, V, D (datos residuales transformados 350) en base a una combinación de al menos uno de las múltiples componentes de ajuste tales como el valor A, con al menos un ajuste asociado con la representación de la señal tal como y1 en el nivel de calidad #2.

Como se mencionó, uno o más de los valores de ajuste 8a, H, V, D (datos residuales transformados 350) se pueden calcular en base a una combinación lineal del conjunto de valores de ajuste R11, R12, R21, R22 con la representación de la señal (tal como y1) en el nivel de calidad #2. Por ejemplo, el valor 8a se puede calcular en base a una diferencia entre el valor promedio A (un promedio de los valores X11, X12, X21, X22) generado por el algoritmo cuantificador 372 y un promedio predicho producido en base, al menos en parte, a un promedio de los elementos (P11, P12, P21, P22) en el bloque 393 (por ejemplo, [P11 P12 P21 P22]/4).

Como ejemplo, suponga que los datos en el bloque 305 (una porción correspondiente de elementos en un plano de elementos que se están submuestreando) incluyen: X11 = 10, X12 = 20, X21 = 25, X22 = 30. En este ejemplo, el algoritmo de submuestreo 371 produce un valor y = 21,25 mediante el uso de un promedio de los elementos X11, X12, X21, X22. El valor único y = 21,25 en el nivel de calidad #2 es un valor representativo de los ajustes asociados con los elementos X11, X12, X21, X22.

Suponga que el algoritmo cuantificador 372 cuantifica el valor y = 21.25 para producir y1 =21. En una modalidad, la cuantificación incluye comparar un valor recibido tal como y = 21,25 con múltiples intervalos. En este ejemplo, suponga que a cualquier valor en el intervalo A1 entre 21 y 21,999 se le asigna un valor de 21. El valor y = 21,25 cae dentro del intervalo A1 y por lo tanto se cuantifica y se le asigna un valor de 21 como resultado de la cuantificación por el algoritmo cuantificador 372.

Como se analizó anteriormente, las modalidades en la presente descripción incluyen el sobremuestreo del valor cuantificado y1 = 21 (también en base, al menos en parte, a sus elementos vecinos) en un conjunto de valores predichos P11, P12, P21, P22. En este ejemplo, suponga que la aplicación del algoritmo de sobremuestreo 373 produce los ajustes P11 = 10, P12 = 15, P21 = 20, P22 = 25. Estos valores P se aproximan a los ajustes de los valores X originales (X11, X12, X21, X22) pero necesitan algún ajuste.

Las modalidades en la presente descripción incluyen aplicar la función de diferencia 376 para producir los valores R (R11, R12, R21, R22). Por ejemplo, la función de diferencia 376 establece R11 = X11 - P11 (R11 = 10 - 10 = 0); la función de diferencia 376 establece R12 = X12 - P12 (R12 = 20 -15 = 5); la función de diferencia 376 establece R21 = X21 - P21 (R21 = 25 - 20 = 5); la función de diferencia 376 establece R22 = X2 - P22 (R22 = 30 - 25 = 5).

De acuerdo con las ecuaciones anteriores, el procesador de datos de reconstrucción 396 produce los ajustes para A, H, V y D en base a los ajustes R11, R12, R21, R22 en el nivel de calidad #1. Por ejemplo, de acuerdo con la matriz respectiva, el procesador de datos de reconstrucción 396 produce las componentes direccionales 320 de la siguiente manera:

A = [Rll R12 R21 R22]/4 = [0 5 5 5]/4 = 3,75

H= [Rll - R12 R21 - R22] / 4 = [0- 5 5 - 5] / 4 = 1,25

V = [Rll R12 - R21 - R22]/ 4 = [0 5- 5 - 5 ] /4 = 1,25

D = [Rll -R12-R21+R22] / 4 = [0- 5-5 5]/4 = -l,25

En base a estos valores para A, H, V y D, el transformador de datos de reconstrucción 397 produce los residuos transformados 300 (8a, H, V, D) de la siguiente manera:

5 » = Promedio - Promedio Predicho = {3,75 — [y1 — (P11+P12 + P21 + P22) /4]} =

5 a = (3,75 - [21 - (10 + 15 + 20 + 25) /4]> = 3,75 - (21 - 17,5) = 3,75 - 3,5 = 0,25

En este ejemplo, el recurso de procesador 377 produce los datos residuales transformados 350 de la siguiente manera:

óa, = ,25

H = 1,25

V = 1,25

D = -1,25

En consecuencia, el hardware del codificador, como se describe en la presente descripción, recibe la representación de la señal (X11, X12, X21, X22) en el nivel de calidad #1. El algoritmo de submuestreo 371 del codificador de la Figura 3F produce la representación de la señal y en el nivel de calidad #2 en base a la representación de la señal (X11, X12, X21, X22) en el nivel de calidad #1. El algoritmo de sobremuestreo 373 produce la representación predicha de la señal P11, P12, P21, P22 en el nivel de calidad #1 a partir de la representación de la señal en el nivel de calidad #2. Por ejemplo, el algoritmo cuantificador 372 produce y1 a partir de y. El algoritmo de sobremuestreo 373, al procesar la representación de la señal en el nivel de calidad #2, convierte y1 a P11, P12, P21, P22. Como se mencionó, la función de diferencia 376 produce el conjunto de valores de ajuste R11, R12, R21, R22 como una diferencia entre la representación de la señal R11, R12, R21, R22 en el nivel de calidad #1 y la representación predicha de la señal P11, P12, P21, P22 en el nivel de calidad #1. El procesador de datos de reconstrucción 396 produce un conjunto formateado de valores de ajuste (tales como las componentes direccionales 320) a partir del conjunto de valores de ajuste R11, R12, R21, R22. Como sugiere su nombre, el transformador de datos de reconstrucción 397 transforma el conjunto formateado de valores de ajuste en el conjunto de valores de ajuste 8a, H, V, D.

Las modalidades en la presente descripción pueden incluir además hardware y software de codificador adicionales para codificar el conjunto de valores de ajuste 8a, H, V, D y la representación de la señal y1 en el nivel de calidad #2 en la información codificada correspondiente. Un recurso de transmisor transmite la información codificada correspondiente a través de un enlace de comunicación al hardware de procesamiento del decodificador (ver la Figura 5 para un ejemplo no limitativo de decodificación).

De acuerdo con la Figura 5, el hardware de procesamiento del decodificador recibe la información codificada. A partir de la información codificada, el hardware de procesamiento del decodificador obtiene (a través de la decodificación) los datos de reconstrucción tales como el valor y1 =21. El valor y1 especifica cómo reconstruir la representación de la señal para el bloque 306 (Figura 3B) en el nivel de calidad #2. A partir de la información codificada recibida, el hardware de procesamiento del decodificador obtiene (a través de la decodificación) el conjunto de valores de ajuste 8a, H, V, D.

El hardware de procesamiento del decodificador reproduce la representación predicha de la señal P11 (elemento 500-1-1), P12 (elemento 500-1-2), P21 (elemento 500-1-3), P22 (elemento 500-1-4 ) en el nivel de calidad #1 en base, al menos en parte, al valor y1 en los datos de reconstrucción obtenidos. El hardware de procesamiento del decodificador obtiene un valor de ajuste ("promedio predicho" o "PA") tal como el valor 430-5 en base al procesamiento de los ajustes asociados con la representación predicha de la señal y los datos de reconstrucción obtenidos (tales como y1 = 21). En esta modalidad de ejemplo, el bloque 520 genera un valor de ajuste 430-5 para igualar y1 menos el promedio de las predicciones AvgP (tal como [(P11+P12+P21+P22)/4). Recuerde que el algoritmo de sobremuestreo 373 (también usado por el hardware de procesamiento del decodificador) aplicado a y1 y a sus elementos vecinos en el hardware de procesamiento del decodificador produce los valores P11 = 10, P12 = 15, P21 = 20, P22 = 25. Tenga en cuenta que el algoritmo específico a usar para el sobremuestreo del valor y1 se puede especificar en los datos recibidos por el hardware de procesamiento del decodificador. En particular, para un elemento dado de la representación preliminar de la señal en el nivel de calidad superior, los ajustes de producción para dicho elemento puede comprender: recibir metadatos asociados con las operaciones de sobremuestreo a usar para producir, en base a la representación de la señal en el nivel de calidad inferior, la representación preliminar de la señal en el nivel de calidad más alto; identificar una operación de muestreo ascendente (por ejemplo, entre otras, coeficientes de un kernel de muestreo ascendente) de acuerdo con lo especificado por los metadatos; y aplicar la operación a un subconjunto de elementos de la representación de la señal en el nivel de calidad inferior para derivar los ajustes para dicho elemento dado de la representación preliminar de la señal en el nivel de calidad más alto. El bloque de procesamiento 520, por lo tanto, produce y1 - AvgP = 21 -[(10 15 20 25)/4] = 21 -17,5 = 3,5. La función 562 suma delta 445-1 (por ejemplo, 8a = 0,25) obtenido mediante la decodificación como se analizó anteriormente) y un valor PA = 3,5 para producir una señal 430-5 tal como un valor de 3,75 (es decir, un promedio A = 3,75). Por tanto, el hardware de procesamiento del decodificador utiliza el valor de ajuste derivado (por ejemplo, PA = 3,5) como una base para modificar el valor 8a = 0,25 en el valor de ajuste A = 3,75)

Los datos obtenidos mediante la decodificación de la información recibida también incluyen la obtención de valores para H, V y D. En este ejemplo, los valores son los siguientes: H = 1,25, V = 1,25 y D = -1,25.

El hardware de procesamiento del decodificador aplica luego el conjunto modificado de valores de ajuste (por ejemplo, A, H, V, D) a la representación predicha reproducida de la señal P11, P12, P21, P22 para producir la representación de la señal 550-1 en el nivel de calidad #1. Por ejemplo, el hardware de procesamiento del decodificador aplica una fila de sumadores asociados con los valores de la matriz 532 para producir:

elemento 550-1-1 = elemento 500-1-1 (A 455-1 H 455-2 V 455-3 D 455-4)

= 10 (3,75 (-1,25) (-1,25) (-1,25)) = 10 = XI l;

elemento 550-1-2 = elemento 500-1-2 (A 455-1 - H 455-2 V 455-3 - D 455-4)

= 15 (3,75 -(-1,25) (-1,25) -(-1,25)) = 20 = X12;

elemento 550-1-3 = elemento 500-1-3 (A 455-1 - H 455-2 V 455-3 - D 455-4)

= 20 (3,75 (-1,25) -(-1,25) -(-1,25)) = 25 = X21;

elemento 550-1-4 = elemento 500-14 (A 455-1 - H 455-2 - V 455-3 D 455-4)

= 25 (3,75 -(-1,25) -(-1,25) (-1,25)) = 30 = X12.

y

elemento 50-1-4 = elemento 500-14 (A 455-1 - H 455-2 - V 455-3 D 4554)

= 25 (3,75 -(-1,25) -(-1,25) (-1,25)) = 30 = X12.

En consecuencia, a través de la recepción de datos residuales tales como y1 = 21 y los valores 8a = 0,25, H = -1,25, V = -1,25 y D = -1,25, el hardware de procesamiento del decodificador puede reproducir los valores originales X11, X12, X21 y X22.

De acuerdo con modalidades adicionales de la Figura 9, el hardware de procesamiento del codificador, como se analizó en la presente descripción, se puede configurar para producir múltiples conjuntos de datos de reconstrucción 910. Por ejemplo, una primera porción de una señal tal como los elementos X se puede procesar y codificar para producir un conjunto de datos de reconstrucción 910-1 como se analizó anteriormente. De manera similar como se analizó anteriormente, el codificador se puede configurar para producir un conjunto de datos de reconstrucción 910-2 en base a los elementos Z11, Z12, Z21 y Z22.

Como se analizó, cada conjunto de datos de reconstrucción 910 puede incluir los ajustes para múltiples componentes tales como A (una primera componente), H (una segunda componente), V (una tercera componente) y D (una cuarta componente) por medio del valor transformado 8a (un primer valor transformado), H (un segundo valor transformado), V (un tercer valor transformado) y D (un cuarto valor transformado). El primer valor transformado tal como 8a (promedio delta) en cada uno de los conjuntos corresponde a una primera clase de atributo; el segundo valor transformado en cada uno de los conjuntos corresponde a una segunda clase de atributo tal como la Horizontal (H); el tercer valor transformado en cada uno de los conjuntos corresponde a una tercera clase de atributo tal como la Vertical (V); el cuarto valor transformado en cada uno de los conjuntos corresponde a una cuarta clase de atributo tal como la Diagonal (D).

En una modalidad, el hardware de procesamiento del codificador crea una primera agrupación 925-1 para incluir un primer valor de componente de cada uno de los múltiples conjuntos de datos de reconstrucción 910. Por ejemplo, la agrupación 925-1 incluye los valores de las componentes 8a1, da2, ...

El hardware de procesamiento del codificador crea la agrupación 925-2 para incluir un segundo valor de componente tal como la H de cada uno de los múltiples conjuntos de datos de reconstrucción 910. Por ejemplo, la agrupación 925-2 incluye los valores de las componentes H1, H2, ...

El hardware de procesamiento del codificador crea la agrupación 925-3 para incluir un tercer valor de componente tal como la V de cada uno de los múltiples conjuntos de datos de reconstrucción 910. Por ejemplo, la agrupación 925-3 incluye los valores de las componentes V1, V2, ...

El hardware de procesamiento del codificador crea la agrupación 925-4 para incluir un tercer valor de componente tal como la D de cada uno de los múltiples conjuntos de datos de reconstrucción 910. Por ejemplo, la agrupación 925-4 incluye los valores de las componentes D1, D2, ...

En una modalidad, el hardware de procesamiento del codificador codifica las agrupaciones independientemente entre sí. Por ejemplo, la entropía del hardware de procesamiento del codificador codifica la primera agrupación 925 1 en la información codificada 965-1 independientemente de la entropía que codifica la segunda agrupación 925-2 en la información codificada 965-2.

En otras modalidades no limitativas, las agrupaciones de valores transformados se obtienen agrupando los valores transformados correspondientes a una misma porción de la señal (tal como un mosaico de la señal) y, por tanto, codificando individualmente los residuos transformados correspondientes a cada mosaico de la señal. En aún otras modalidades no limitativas, a los valores transformados correspondientes a un mismo conjunto de datos residuales 910 se les asigna un símbolo dado y el hardware de procesamiento del codificador codifica una secuencia de símbolos, en donde cada uno de los símbolos corresponde a uno de los conjuntos de datos residuales 910.

La Figura 3C ilustra una modalidad no limitativa de descomposición direccional aplicada a agrupaciones de dos residuos, en el caso de sobremuestreo 2D con un factor de escala de dos a lo largo de la dimensión horizontal y uno a lo largo de la dimensión vertical (es decir, para cada elemento principal en el LOQ #(N-1) hay dos pels controlados en el siguiente LOQ #N superior y, en consecuencia, se deben decodificar dos residuos con el fin de reconstruir adecuadamente dichos pels controlados) de acuerdo con las modalidades en la presente descripción.

El codificador calcula — de acuerdo con la fórmula 3.21 — las dos componentes direccionales A (para Promedio) y T (para Inclinación), y luego produce los residuos transformados 8a y T, en donde 8a se calcula como la diferencia entre A y el promedio predicho PA, y en donde PA se calcula como la diferencia entre el valor y1 del elemento 308 y el promedio AvgP de los valores predichos correspondientes a los dos elementos 307.

La Figura 3D ilustra una modalidad no limitativa de descomposición direccional aplicada a las agrupaciones de bloques de residuos de 2*2, en el caso de sobremuestreo 2D con factor de escala de dos a lo largo de ambas dimensiones (es decir, para cada elemento principal en el LOQ #(N-1) hay cuatro pels controlados en el siguiente LOQ #N superior y, en consecuencia, se deben decodificar cuatro residuos con el fin de reconstruir adecuadamente dichos pels controlados) de acuerdo con las modalidades en la presente descripción.

El bloque de residuos 300 es una porción de un plano de datos residuales en un LOQ #N dado que se procesa por un decodificador y se combina con una representación predicha de una señal en el LOQ #N dado con el fin de producir una representación de la señal en dicho LOQ #N dado. En particular, el bloque de residuos 300 se forma por los cuatro residuos n,j, n,j+1, r¡+1,j y n+1,j+1.

Los residuos 300 se procesan por el Descomponedor Direccional 310 de acuerdo con la fórmula 3.11, produciendo las Componentes Direccionales 320. Las Componentes Direccionales 320 y el Promedio Predicho 340 luego se procesan por la Calculadora de Residuos Transformados 330, produciendo los Residuos Transformados 350. Los residuos transformados 350 luego se cuantifican por el Cuantificador 360, produciendo los Residuos Transformados Cuantificados 370.

En una modalidad no limitativa, los Residuos Transformados Cuantificados 370 luego se procesan y codifican de nuevo en datos de reconstrucción codificados. En una modalidad no limitativa, los Residuos Transformados Cuantificados para la señal completa se agrupan en agrupaciones separadas que se codifican por entropía individualmente en conjuntos separados de datos de reconstrucción codificados. En una modalidad no limitativa, las agrupaciones separadas corresponden a distintas clases de residuos transformados (por ejemplo, entre otros, los Residuos Transformados Cuantificados correspondientes a las componentes H para toda la señal frente a los Residuos Transformados Cuantificados correspondientes a las componentes V para toda la señal, etc.). En otra modalidad no limitativa, las agrupaciones separadas corresponden a porciones distintas de la señal (por ejemplo, entre otras, los mosaicos de la señal).

De acuerdo con la Figura 3D, el descomponedor direccional 310 produce un conjunto formateado de valores de ajuste tales como las componentes direccionales 320 del conjunto de residuos 300 (por ejemplo, los valores de ajuste). La calculadora 330 transforma el conjunto formateado de valores de ajuste tales como las componentes direccionales 320 en los residuos transformados 350 (por ejemplo, los valores de ajuste). Luego, el codificador aplica un algoritmo cuantificador 360 al conjunto de valores de ajuste (residuos transformados 350) para producir un conjunto de valores de ajuste cuantificados tal como el residuo transformado cuantificado 370.

En una modalidad, el conjunto de valores de ajuste 8a, H, V, D es un vector que incluye múltiples componentes de datos de reconstrucción (por ejemplo, la componente 8a, la componente H, la componente V, la componente D). El cuantificador 360 cuantifica cada una de las componentes de ajuste para producir un conjunto cuantificado de valores de ajuste tales como los residuos 370.

Las diferentes componentes en los residuos transformados 350 se pueden cuantificar de acuerdo con diferentes reglas. Por ejemplo, un primer conjunto de intervalos puede usarse para cuantificar la componente 8a en los respectivos residuos 370. A cada intervalo se le puede asignar un valor respectivo. En dependencia de en cuál de los intervalos cae el valor de la componente 8a, el valor correspondiente asignado al intervalo se asigna luego a la componente 8a como el valor cuantificado para la componente.

Un segundo conjunto de intervalos puede usarse para cuantificar la componente H en los respectivos residuos 370. A cada intervalo del segundo conjunto se le puede asignar un valor cuantificado respectivo. En dependencia de en cuál de los intervalos en el segundo conjunto cae el valor de la componente H, el valor correspondiente asignado al intervalo se asigna luego a la componente H como el valor cuantificado para la componente.

De esta manera, un conjunto diferente de intervalos de cuantificación puede usarse para generar los valores cuantificados para cada uno de los diferentes tipos de componentes 8a, H, V, D. Como se mencionó, la cuantificación se usa para generar los ajustes similares para ajustes de componentes diferentes de cualquier otra manera. La cuantificación reduce la cantidad de datos necesarios para capturar una señal.

En consecuencia, las modalidades en la presente descripción incluyen el hardware del procesador del ordenador para cuantificar una primera componente de los datos de ajuste en el vector 8a, H, V, D en base a las primeras reglas de cuantificación. El hardware del procesador del ordenador cuantifica una segunda componente de los datos de ajuste en el vector en base a las segundas reglas de cuantificación. Las segundas reglas de cuantificación son diferentes a las primeras reglas de cuantificación.

La Figura 3E ilustra otra modalidad no limitativa de cuantificación y transformación de un bloque de residuos de 2x2 300, en donde los residuos se cuantifican antes de transformarse de acuerdo con las modalidades en la presente descripción. Vale la pena subrayar que la cuantificación antes de la transformación es una etapa importante y novedosa adicional introducida por esta invención, ya que hasta ahora los métodos de codificación convencionales han aplicado la cuantificación después de la transformación, por razones que incluyen la posibilidad de cuantificar ciertos parámetros transformados más que otros, es decir, en términos generales, dedicando más tasa de bits a las partes de "mayor prioridad" de la transformada.

Como se ilustra de la Figura 3E, en esta modalidad no limitativa, la cuantificación residual se realiza antes de ingresar a la etapa de la transformada y, en particular, el Cuantificador 380 procesa los residuos 300, produciendo los Residuos Cuantificados 309.

Los Residuos Cuantificados 309 se procesan por el Descomponedor Direccional Sin pérdidas 315, que produce las Componentes Direccionales Sin pérdidas 325 ("ldc") al procesar el vector de cuatro Residuos Cuantificados 309 ("qr") de acuerdo con la siguiente fórmula:

Es importante subrayar que el número de bits necesarios para las Componentes Direccionales Sin pérdidas 325 es mayor que el número de bits usados para describir los Residuos Cuantificados 309, ya que las Componentes Direccionales Sin pérdidas 325 se obtienen realizando sumas y restas de los Residuos Cuantificados 309.

Las Componentes Direccionales Sin pérdidas 325 y la Suma Predicha 345 se procesan por la Calculadora de Residuos Transformados 335, produciendo los Residuos Transformados 355.

En una modalidad no limitativa, la cuantificación de los Residuos 300 dentro del Cuantificador 380 se basa, al menos en parte, en parámetros producidos al procesar todo el plano de residuos al que pertenecen los Residuos 300 (es decir, mirando la señal en su totalidad).

En una modalidad no limitativa, la cuantificación de los Residuos 300 se realiza por el Cuantificador 380 a través de un método de optimización que asegura que la diferencia entre un elemento reconstruido (es decir, la combinación de un elemento predicho y su residuo correspondiente) y el elemento correspondiente en la señal original está por debajo de un umbral determinado de error máximo, lo que efectivamente asegura el control de errores de la representación de la señal reconstruida en un decodificador. En algunas modalidades no limitativas, la cuantificación de los Residuos 300 se realiza en base a los parámetros que se producen procesando sustancialmente la señal completa y/o el plano completo de residuos que comprende los Residuos 300. En una modalidad no limitativa, esto se logra procesando toda la señal y todo el plano de residuos, generando un mapa de prioridades que asigna un valor de prioridad a cada residuo en el plano de residuos; luego se realiza la cuantificación de los residuos en base, al menos en parte, a dichos valores de prioridad.

En una modalidad no limitativa, los residuos transformados son símbolos elegidos en alfabetos de símbolos que tienen un número diferente de bits (es decir, el número total de símbolos) en base a la posición relativa de cada residuo transformado en el vector de Residuos Transformados 355.

Como se analizó anteriormente, si se desea, la cuantificación se puede realizar directamente en los residuos 300 antes de descomponerlos en valores respectivos. Por ejemplo, el algoritmo cuantificador 380 recibe un primer conjunto de valores de ajuste (residuos 300) y produce un conjunto cuantificado de valores de ajuste tal como el residuo cuantificado 309. En una modalidad, el descomponedor direccional 315 aplica una o más operaciones invertibles y sin pérdidas al conjunto cuantificado recibido de valores de ajuste para producir un conjunto intermedio de valores de ajuste tales como S, V1, H1, D1. La calculadora 335 recibe un valor (tal como una suma predicha) derivado en base, al menos en parte, a una representación de la señal en el segundo nivel de calidad y una representación predicha de la señal en un primer nivel de calidad. La calculadora 335 usa el valor (por ejemplo, la suma predicha 345) para convertir el conjunto intermedio de valores de ajuste S, V1, H1, D1 en el residuo transformado 355 (tal como 5s, H1, V1, D1).

En una modalidad, los ajustes del conjunto cuantificado de valores de ajuste (tales como los residuos cuantificados 309) se producen de modo que las diferencias entre los ajustes en el conjunto del conjunto cuantificado de valores de ajuste (tales como los residuos cuantificados 309) y los ajustes correspondientes en el conjunto de ajustes los valores (tales como los ajustes 300) están por debajo de un valor de umbral de error.

Modalidades Adicionales

Como se analizó anteriormente, los valores de ajuste se pueden cuantificar en cualquier punto adecuado del proceso de codificación. De acuerdo con aún otras modalidades, tenga en cuenta que el conjunto de valores de ajuste pertenece a la reconstrucción de una ubicación particular en un plano de múltiples elementos que se codifican en los diferentes niveles de calidad. Cada una de las diferentes porciones de elementos en el plano puede cuantificarse en diferentes cantidades en dependencia de la ubicación particular en la que residen los elementos correspondientes. Por ejemplo, en áreas de la señal que son relativamente homogéneas, la región correspondiente se puede cuantificar menos con el fin de retener una buena calidad de señal de tales regiones; las áreas donde hay un contraste nítido se pueden cuantificar menos con el fin de retener la buena calidad de la señal de tales regiones; las áreas de una señal en las que se detecta un objeto particular tal como una persona o un texto se pueden cuantificar menos con el fin de retener la buena calidad de la señal de tales regiones; y así sucesivamente. En consecuencia, las modalidades en la presente descripción pueden incluir la cuantificación del valor de ajuste en dependencia de los atributos de la señal a la cual pertenece el conjunto de valores de ajuste.

De acuerdo con modalidades adicionales, el conjunto de valores de ajuste puede ser un vector que incluye múltiples componentes de datos de reconstrucción (tal como la componente 8, la componente H, la componente V, la componente D). Durante la codificación, dos o más de estas componentes se pueden combinar y representar mediante un único símbolo codificado.

Como se mencionó, cada una de las múltiples regiones de una señal original se puede codificar mediante el uso de un conjunto respectivo de valores de ajuste (tal como 8, H, V, D). Por ejemplo, una primera porción o región de la señal se puede codificar a través de un primer conjunto de valores de ajuste (tal como 81, H1, V1, D1); una segunda porción o región de la señal se puede codificar a través de un segundo conjunto de valores de ajuste (tal como 82, H2, V2, D2); una tercera porción o región de la señal se puede codificar a través de un tercer conjunto de valores de ajuste (tal como 83, H3, V3, D3); y así sucesivamente. Las modalidades en la presente descripción pueden incluir la codificación de cada uno de al menos dos de los conjuntos múltiples de datos de reconstrucción (tales como 8, H, V, D) o porciones de los mismos mediante el uso de un símbolo común. En consecuencia, un único símbolo puede usarse para representar los ajustes para múltiples conjuntos de valores de ajuste.

La Figura 4A ilustra una modalidad no limitativa de la descomposición direccional inversa realizada por un dispositivo decodificador de acuerdo con las modalidades en la presente descripción.

El bloque 410 de Descomposición Direccional Inversa recibe cinco planos de elementos en la resolución X x Y: un Plano de Promedios Predichos 400-5 y los cuatro planos de residuos transformados: Plano de 8400-1, Plano de H 400-2, Plano de V 400-3 y Plano de D 400-4.

El bloque 410 procesa los planos recibidos de acuerdo con una descomposición direccional inversa produciendo un Plano de Residuos con una resolución de 2Xx 2Y 420.

En una modalidad no limitativa, el bloque 410 selecciona los elementos correspondientes en los cinco planos de entrada y para cada agrupación de elementos correspondientes realiza una descomposición direccional inversa, reconstruyendo las componentes direccionales y luego sumando y restando adecuadamente las componentes direccionales para producir un conjunto de residuos correspondiente a la agrupación.

La Figura 4B ilustra otra modalidad no limitativa de descomposición direccional inversa de acuerdo con las modalidades en la presente descripción. En particular, el diagrama ilustra las operaciones realizadas por un procesador de señales configurado como decodificador para reconstruir un conjunto de Residuos 480.

Los cuatro parámetros cuantificados Q(8^a) 430-1, Q(H) 430-2, Q(V) 430-3 y Q(D) 430-4 se procesan respectivamente por el Descuantificador 440-1, el Descuantificador 440-2, el Descuantificador 440-3 y el Descuantificador 440-4. El Descuantificador 440-1 produce el parámetro Delta Descuantificado 445-1, el cual se procesa por el Combinador 450 y combinado con el Promedio Predicho 430-5, produciendo la Componente Promedio Descuantificada 455-1. El Descuantificador 440-2 produce la Componente Horizontal Descuantificada 455 2. El Descuantificador 440-3 produce la Componente Vertical Descuantificada 455-3. El Descuantificador 440-4 produce la Componente Diagonal Descuantificada 455-4.Los parámetros 455-1, 455-2, 455-3 y 455-4 se procesan por el bloque 470 de Descomposición Direccional Inversa, de acuerdo con los cálculos correspondientes a la Matriz M 460, produciendo los Residuos 480.

En una modalidad no limitativa, la Matriz M 460 corresponde a dieciséis coeficientes y los Residuos 480 se obtienen mediante sumas y restas de los parámetros 455-1, 455-2, 455-3, 455-4, de acuerdo con dichos coeficientes. En una modalidad no limitativa, los Residuos 480 son un conjunto de cuatro residuos, y cada uno de dichos residuos se obtiene multiplicando cada uno de los parámetros 455-1, 455-2, 455-3, 455-4 por un coeficiente de la Matriz M 460 y luego sumando los resultados de dichas multiplicaciones. En otra modalidad no limitativa, la Matriz M 460 es una matriz de 4x4 y el vector de Residuos 480 se obtiene multiplicando el vector de parámetros 455-1, 455-2, 455-3, 455-4 por la Matriz M 460.

En una modalidad no limitativa, cada uno de los Descuantificadores 440-1, 440-2, 440-3 y 440-4 realiza operaciones de cuantificación de acuerdo con los parámetros de cuantificación específicos (por ejemplo, las operaciones de descuantificación realizadas en el parámetro 430-1 son diferentes de las operaciones de descuantificación realizadas en el parámetro 430-2).

Como se muestra de la Figura 4B, se pueden aplicar diferentes operaciones de descuantificación a los datos cuantificados recibidos tales como Q(8a) 430-1, Q(H) 430-2, Q(V) 430-3 y Q(D) 430-4. El descuantificador 440-1 aplica una primera operación de descuantificación para reproducir un primer valor de ajuste tal como delta descuantificado 445-1; el descuantificador 440-2 aplica una segunda operación de descuantificación para reproducir un segundo valor de ajuste 455-2; el descuantificador 440-3 aplica una tercera operación de descuantificación para reproducir un tercer valor de ajuste 455-3; el descuantificador 440-4 aplica una cuarta operación de descuantificación para reproducir un cuarto valor de ajuste 455-4. Cada una de las operaciones de descuantificación puede ser única con respecto a las otras.

La Figura 4C ilustra otra modalidad no limitativa de la descomposición direccional inversa realizada por un procesador de señales configurado como decodificador para reconstruir un conjunto de cuatro residuos 480 de acuerdo con las modalidades en la presente descripción.

La modalidad de la Figura 4C realiza operaciones que son similares a las realizadas por la modalidad ilustrada de la Figura 4B, con la excepción de que en este caso el decodificador recibe sólo dos parámetros cuantificados Q(H) y Q(V) para reconstruir un bloque de 2x2 de cuatro residuos 480. Esto se debe al hecho de que la información transportada por los parámetros 430-1 y 430-4 de la Figura 4B es, en términos generales, menos importante para la percepción de la calidad, por lo que, en respuesta a las limitaciones de ancho de banda, el decodificador de la Figura 4C se habilita para reconstruir los Residuos 480 en base únicamente a 430-2 y 430-3, sustituyendo 430-1 y 430-4 con un valor predeterminado (por ejemplo, entre otros, cero).

Los parámetros 430-2 y 430-3 se procesan por los Descuantificadores 440-2 y 440-3 produciendo los parámetros 455- 2 y 455-3. El Bloque 470 recibe el Promedio Predicho 430-5, la Componente Horizontal Descuantificada 455-2, la Componente Vertical Descuantificada 455-3 y el Valor Cero 440-6, produciendo los Residuos 480 de acuerdo con los cálculos correspondientes a la Matriz M 460.

En una modalidad no limitativa no cubierta por la invención reivindicada, la descomposición inversa sin pérdidas se realiza mediante un procesador de señales configurado como decodificador con el fin de reconstruir un conjunto de dos Residuos 481 de acuerdo con las modalidades en la presente descripción. La modalidad ilustra una descomposición inversa de un bloque de dos residuos cuantificados que se transformaron por medio de una transformada de descomposición sin pérdidas, es decir, con la cuantificación realizada antes de la transformada en lugar de después de la transformada. Los residuos cuantificados transformados sin pérdidas tienen características matemáticas que permiten predecir algunos de sus bits (por ejemplo, entre otros, el bit menos significativo) en base a otros residuos cuantificados transformados sin pérdidas de un mismo conjunto. Más específicamente, los parámetros obtenidos con una operación de transformación sin pérdidas tienen en principio un mayor número de bits (por ejemplo, la suma sin pérdidas de dos parámetros de n bits requiere n+1 bits; la suma sin pérdidas de cuatro parámetros de n bits requiere n+2 bits, etc.), pero — en base a los coeficientes específicos de la transformada aplicada — parte de la información en los bits menos significativos se vuelve redundante (por ejemplo, idéntica para al menos dos de los parámetros transformados), por lo que es suficiente para transmitir a un decodificador sólo parte de los bits de algunos parámetros transformados, dejando al decodificador la tarea de aprovechar las redundancias conocidas para reconstruir el conjunto completo de parámetros transformados.

El Residuo Transformado R*1 — un parámetro hecho de 2 bits — se recibe por el Combinador 451 y combinado con la Suma Predicha 431-3 — un parámetro hecho de n+1 bits — produciendo la Suma S de Residuos Cuantificados 456- 1 — un parámetro hecho de n+1 bits.

El Residuo Transformado R2 — un parámetro hecho de n bits — se recibe por el bloque 491 junto con el parámetro S 456-1, produciendo la Diferencia D de los Residuos Cuantificados 456-2 — un parámetro hecho de n+1 bits. En particular, el parámetro D 456-2 se obtiene aumentando el número de bits del parámetro 431-2, y específicamente agregando como bit menos significativo adicional del parámetro 431-2 el bit menos significativo del parámetro 456-1 (de modo que los parámetros 456-1 y 456-2 tienen el mismo bit menos significativo).

Los parámetros 456-1 y 456-2 se reciben por el bloque 471 junto con la Matriz M1461 produciendo un conjunto de dos Residuos Cuantificados 481 de n bits. En una modalidad no limitativa, cada uno de los dos Residuos Cuantificados 481 corresponde a la suma o la diferencia de los parámetros 456-1 y 456-2, en donde el bit menos significativo de la suma o la diferencia (el cual por construcción es igual a cero) se quita.

Los Residuos Cuantificados 481 se procesan luego por el Descuantificador 441 produciendo los dos Residuos 482, hechos de n bits.

En otras modalidades no limitativas, todos los parámetros se forman por el mismo número de bits y el bloque 491 únicamente copia el bit menos significativo del parámetro 456-1 en el bit menos significativo del parámetro 431-2. En otra modalidad no limitativa, los Residuos 482 son parámetros compuestos por un número de bits mayor que el número de bits de los Residuos Cuantificados 481.

La Figura 4E ilustra una modalidad no limitativa de descomposición inversa sin pérdidas realizada por un procesador de señales configurado como decodificador con el fin de reconstruir un conjunto de cuatro Residuos 483 de acuerdo con las modalidades en la presente descripción. La modalidad ilustra una descomposición inversa que produce un bloque de cuatro residuos cuantificados 481 que se transformaron por medio de una transformada de descomposición sin pérdidas, es decir, con operaciones de cuantificación realizadas antes de la transformación en lugar de después de la transformación.

El Residuo Transformado R‘i 432-1 — un parámetro compuesto por 2 bits — se recibe por el Combinador 451 y combinado con la suma predicha 432-5 — un parámetro compuesto por n+2 bits — produciendo la Suma S de Residuos Cuantificados 457-1 — un parámetro compuesto por n+2 bits.

Los Residuos transformados R*2432-2 — un parámetro hecho de n+1 bits —, R*3432-3 — un parámetro hecho de n+1 bits — y R44432-4 — un parámetro formado por n bits — se reciben y procesan por el Reconstructor de Bits Redundantes 495 junto con la Suma S de los Residuos Cuantificados 457-1. El Reconstructor de Bits Redundantes 495 aprovecha la redundancia de información conocida generada por la descomposición sin pérdidas que se realizó en el lado del codificador y produce bits adicionales para 432-2, 432-3 y 432-4 usando como bit menos significativo el bit menos significativo de 457-1 y como segundo bit menos significativo añadió al 432-4 la Or exclusiva (XOR) de los bits correspondientes de 457-1, 432-2 y 432-3. Al hacer esto, el Reconstructor de Bits Redundantes 495 produce los cuatro parámetros S 457-1, H1457-2, V1457-3 y D1457-4, compuestos por n+2 bits y caracterizados por tener todos el mismo bit menos significativo y el segundo bit menos significativo de manera que el número de 1 (unos) en dicho segundo bit menos significativo es un número par.

Los parámetros 457-1, 457-2, 457-3 y 457-4 se procesan por Descomposición Direccional Inversa 472 de acuerdo con operaciones correspondientes a los parámetros incluidos en la Matriz M 460, produciendo un conjunto de cuatro Residuos Cuantificados 482, cada uno de dichos residuos cuantificados hechos de n bits.

Los Residuos Cuantificados 482 luego se procesan por el Descuantificador 442 produciendo los Residuos 483. Las operaciones descritas realizadas por el bloque 495 Reconstructor de Bits Redundantes para reconstruir la información redundante en los parámetros 457-1, 457-2, 457-3 y 457-4 (los cuales son una consecuencia conocida de la transformada sin pérdidas que se realizó en el lado del codificador) son sólo una modalidad no limitativa. Los expertos en la técnica pueden desarrollar fácilmente otras varias formas de extraer dicha información redundante en el lado del codificador (evitando así codificar y transmitir información redundante) y reconstruirla en el lado del decodificador.

Como se muestra, el conjunto de valores de ajuste puede ser un vector de múltiples componentes de ajuste R*1, R*2, R*3, R*4. A través de la aplicación de una matriz 460 y del procesamiento correspondiente al vector de múltiples componentes de ajuste, el hardware de procesamiento del decodificador deriva un conjunto de valores de ajuste cuantificados tales como los residuos 482. A través del descuantificador 442, el hardware de procesamiento del decodificador aplica un algoritmo de descuantificación al conjunto de valores de ajuste cuantificados tal como el residuo 482 para producir un conjunto de valores de ajuste descuantificados tales como los residuos 483 (es decir, los datos de reconstrucción). En una modalidad, el hardware de procesamiento del decodificador aplica el conjunto de valores de ajuste descuantificados tal como el residuo 483 a la representación preliminar de la señal para producir la representación secundaria de la señal como se analizó en la presente descripción.

En una modalidad, para derivar el conjunto de valores de ajuste descuantificados, el hardware de procesamiento del decodificador se puede configurar para aplicar el combinador 451 para modificar una componente de ajuste particular en el vector para producir un vector modificado de múltiples componentes de ajuste (tal como el residuo 457-1, el residuo 432-2, el residuo 432-3, el residuo 432-4). Uno o más de las múltiples componentes de ajuste en el conjunto modificado pueden tener diferentes longitudes de bits. El hardware de procesamiento del decodificador aplica un primer algoritmo al vector modificado (tal como el residuo 457-1, el residuo 432-2, el residuo 432-2, el residuo 432-4) de múltiples componentes de ajuste para ajustar adecuadamente las longitudes de bits de las componentes en el conjunto modificado a una longitud común tal como n+2 como en esta modalidad de ejemplo no limitativa.

La Figura 5 ilustra una modalidad no limitativa de las operaciones realizadas por un decodificador de acuerdo con las modalidades en la presente descripción. El decodificador reconstruye — en base a un conjunto de cuatro elementos predichos 500-1 en el LOQ #1, a un elemento correspondiente de una representación de la señal en el LOQ #2 inferior y a cuatro parámetros 445-1, 455-2, 455-3 y 455-4 — cuatro elementos 550-1 de una representación de la señal en el LOQ #1.

El bloque 520 procesa los cuatro elementos 500-1 y un elemento correspondiente de la representación 510 en el LOQ #2 produciendo un Promedio Predicho (PA) 430-5.

El Promedio Predicho 430-5 se combina con el parámetro Delta 445-1 produciendo el parámetro A 455-1.

Los parámetros 455-1, 455-2, 455-3 y 455-4 se combinan con los elementos 500-1-1, 500-1-2, 500-1-3 y 500-1-4 de acuerdo con las operaciones (sumas y/o diferencias) especificadas de la Figura 5, produciendo los elementos 550-1 1, 550-1-2, 550-1-3 y 550-1-4. Por ejemplo, el elemento 550-1-1 se obtiene sumando 455-1, 455-2, 455-3 y 455-4 a 500-1-1; el elemento 550-1-2 se obtiene sumando 455-1 y 455-3 y restando 455-2 y 455-4 a 500-1-2; etcétera. En una modalidad no limitativa, los elementos 500-1-1, ..., 500-1-4 tienen n bits, 455-1, ..., 455-4 tienen n+2 bits, y para cada elemento 550-1-n las sumas y diferencias de la Figura 5 se ejecutan primero sobre los parámetros 455-1, ..., 455-4 (produciendo un resultado de n+2 bits), luego el resultado se divide por 4 (es decir, se eliminan los dos últimos bits), obteniendo un parámetro de n bits y luego dicho parámetro de n bits se suma al elemento correspondiente 500-1-n produciendo el elemento 550-1-n.

En consecuencia, el hardware de procesamiento del decodificador como en la Figura 5 recibe la información o el valor de ajuste y1 asociado con una representación de una señal 510 en el nivel de calidad #2. El hardware de procesamiento del decodificador recibe un conjunto de valores de ajuste (tales como delta 445-1, H 455-2, V 455-3 y D 455-4). El hardware de procesamiento del decodificador produce una representación preliminar de la señal (tal como la señal 500-1) en el nivel de calidad #1 en base a la información de ajuste de los elementos de representación de la señal 510 en el nivel de calidad #2. El hardware de procesamiento del decodificador produce una segunda representación de la señal tal como la representación 550-1 en el nivel de calidad #2 en base al conjunto de valores de ajuste (tal como delta 445-1, H 455-2, V 455-3 y D 455-4) y a la representación preliminar de la señal 510 en el nivel de calidad #2.

Como se muestra, la producción de la segunda representación de la señal tal como la señal 550-1 puede incluir: modificar el conjunto de valores de ajuste delta 445-1, H 455-2, V 455-3 y D 455-4 en base, al menos en parte, a la entrega preliminar de la señal 550-1 en el nivel de calidad #1. El hardware de procesamiento del decodificador aplica el conjunto modificado de valores de ajuste A 455-1, H 455-2, V 455-3 y D 455-4 a la representación preliminar de la señal 500-1 para producir una segunda representación de la señal 550-1.

De acuerdo con modalidades adicionales, la información de ajuste tal como y1 se puede considerar la primera información de ajuste. La modificación del conjunto de valores de ajuste tales como delta 445-1, H 455-2, V 455-3 y D 455-4 puede incluir: en el bloque de procesamiento 520, recibir la primera información de ajuste y1. La primera información de ajuste y1 se asocia con la representación preliminar de la señal 500-1. El bloque de procesamiento 520 recibe una segunda información de ajuste tal como los ajustes del elemento 500-1-1 (P11), el elemento 500-1-2 (P12), el elemento 500-1-3 (P21) y el elemento 500-1-4 (P22). La segunda información de ajuste se asocia con la representación de la señal en el nivel de calidad #1. La representación preliminar de la señal 500-1 se obtiene en base, al menos en parte, a la primera información de ajuste y1. El bloque de procesamiento 520 aplica un algoritmo matemático a una combinación de la primera información de ajuste y1 y la segunda información de ajuste para producir un valor de modificación tal como el valor 430-5. La función 562 aplica el valor de modificación 430-5 al conjunto de valores de ajuste (tales como delta 445-1) para producir el conjunto modificado de valores de ajuste, que incluye el valor A 455-1.

En una modalidad, la función 562 recibe una componente de los datos tales como delta 445-1 del conjunto de valores de ajuste que incluye delta 445-1, H 455-2, V 455-3 y D 455-4. En una modalidad, uno o más de múltiples componentes en el conjunto de valores de ajuste incluye la información de la inclinación direccional.

La función 562 suma el valor de modificación 430-5 y la componente delta recuperada 445-1 para modificar nuevamente la componente delta en el promedio 455-1. A través de la aplicación de los valores de la matriz 532 (es decir, a través de la ejecución de sumas y restas de acuerdo con los valores de la matriz 532), el hardware de procesamiento del decodificador modifica los ajustes de cada uno de los múltiples elementos en la representación preliminar de la señal en el segundo nivel de calidad mediante el uso de la componente delta modificada 455-1. En otras palabras, el hardware de procesamiento del decodificador de la Figura 5 usa el valor 430-5 para modificar cada una de las representaciones preliminares de la señal 500-1 para producir una segunda representación de la señal 550-1.

Como se analizó, la decodificación se puede realizar en cada uno de los múltiples niveles de una jerarquía de múltiples niveles. Tenga en cuenta que la segunda representación de la señal 550-1 puede usarse subsecuentemente como base para producir una representación preliminar de la señal en el siguiente nivel de calidad superior.

Además, como se analizó anteriormente, la representación de la señal 510 en el nivel de calidad #2 puede ser un primer nivel de calidad y representar una primera resolución de imagen. El nivel de calidad #1 puede ser una segunda resolución de imagen inferior a la resolución de la primera imagen. Por tanto, la representación de la señal 510 en un nivel de calidad incluye un primer conjunto de elementos de imagen (por ejemplo, entre otros, un elemento y1). La representación de la señal tal como la señal 500-1 y 550-1, incluye un segundo conjunto de elementos de imagen (por ejemplo, entre otros, cuatro elementos X11, X12, x21y x22).

Como se mencionó anteriormente, los datos de reconstrucción que incluyen datos de reconstrucción 510 tales como y1 y los valores de ajuste 5a445-1, H 455-2, V 455-3 y D 455-4 pueden incluir además metadatos. El hardware de procesamiento del decodificador de la Figura 5 se puede configurar para recibir los metadatos asociados con el conjunto de valores de ajuste. A través del procesamiento de los metadatos, el hardware de procesamiento del decodificador identifica una o más operaciones a aplicar a los datos de reconstrucción para reproducir una representación de la señal 550-1 mediante el uso de los metadatos. Por ejemplo, en una modalidad, el hardware de procesamiento del decodificador aplica una o más operaciones identificadas al conjunto de valores de ajuste y/o el valor y1 para derivar la segunda representación de la señal 550-1 a partir de la representación preliminar de la señal 500-1.

Otras modalidades en la presente descripción pueden incluir la recepción de metadatos asociados con el conjunto de valores de ajuste. El hardware de procesamiento del decodificador se puede configurar para identificar una o más operaciones de acuerdo con lo especificado por los metadatos. El hardware de procesamiento del decodificador aplica una o más operaciones identificadas al conjunto de valores de ajuste para derivar la segunda representación de la señal 550-1 a partir de la representación preliminar de la señal 500-1.

Una modalidad en la presente descripción incluye la aplicación lineal del conjunto modificado de valores de ajuste a la representación preliminar de la señal. Por ejemplo, la aplicación de los valores de matriz 532 puede incluir la producción de la segunda representación de la señal 550-1 a través de una aplicación lineal (por ejemplo, a través de funciones de suma y diferencia como se muestra) del conjunto modificado de valores de ajuste tales como el promedio A 455-1, H 455-2, V 455-3 y D 455-4 a la representación preliminar de la señal 500-1.

Por tanto, como se muestra, a través de los valores de la matriz 532, el hardware de procesamiento del decodificador produce la segunda representación de la señal 550-1 a través de la aplicación del conjunto modificado del promedio de los valores de ajuste A 455-1, H 455-2, V455-3 y D 455-4 a la representación preliminar de la señal 500-1. El conjunto modificado de valores de ajuste incluye un vector de valores ponderados (como lo indican las funciones de suma y las funciones de resta) aplicados a la representación preliminar de la señal 500-1 de acuerdo con los valores de la matriz 532.

De acuerdo con otra modalidad de ejemplo más, el vector correspondiente al promedio A 455-1, H 455-2, V455-3 y D 455-4 representa un conjunto modificado de valores de ajuste. El hardware de procesamiento del decodificador se puede configurar para producir la representación secundaria de la señal 550-1 mediante la aplicación del conjunto modificado de valores de ajuste a la representación preliminar de la señal 500-1. El vector de valores de ajuste se puede aplicar por el hardware de procesamiento del decodificador a la representación preliminar para producir la representación secundaria de la señal 550-1 de acuerdo con las ponderaciones especificadas por los valores de la matriz 532.

Los valores de la matriz pueden variar y seleccionarse de un grupo de matrices posibles que comprende:

De una manera como se analizó anteriormente, los datos de reconstrucción que incluyen datos de reconstrucción 510 tales como y1 y los valores de ajuste delta 445-1, H 455-2, V 455-3 y D 455-4 se pueden recibir como información codificada. El hardware de procesamiento del decodificador que recibe tales datos se puede configurar para decodificar la información codificada en múltiples símbolos. El hardware de procesamiento del decodificador se puede configurar para recuperar un símbolo de los múltiples símbolos y, en dependencia de la codificación, producir cualquiera de una o más componentes en el conjunto de valores de ajuste delta 445-1, H 455-2, V 455-3 y D 455-4 del símbolo recuperado.

La Figura 6 es un diagrama de flujo que ilustra una modalidad que implementa la descomposición direccional dentro de un lazo de codificación jerárquico basado en niveles de acuerdo con la invención.

Un procesador de señales configurado como codificador recibe una señal con un nivel de calidad dado ("LOQ superior"), realiza operaciones de submuestreo hasta producir una representación de la señal en un LOQ mínimo (dicho ^lO^qmínimo es inferior al LOQ superior), codifica la representación de la señal en el LOQ mínimo con un método de codificación adecuado — que produce datos de reconstrucción codificados — y luego procesa dichos datos de reconstrucción codificados para simular las operaciones realizadas en un lado de decodificación, produciendo una representación decodificada de la señal en el LOQ mínimo (etapa 6.01 de la Figura 6).

Una vez producida la representación decodificada de la señal en el LOQ mínimo, el codificador entra en un lazo de procesamiento que se repite para cada LOQ subsecuentemente superior, procesando la jerarquía de LOQ nivel por nivel hasta el LOQ más alto.

En particular, el codificador procesa la representación decodificada de la señal en un LOQ dado ("LOQ inferior") y produce una representación predicha de la señal en el siguiente LOQ superior. Luego, el codificador produce datos residuales, correspondiendo dichos datos residuales a una diferencia entre la representación original de la señal en el siguiente LOQ superior y la representación predicha de la señal en el siguiente LOQ superior (etapa 6.02).

Luego, el codificador separa los datos residuales en agrupaciones de residuos (por ejemplo, entre otras, agrupaciones de residuos 2x2 contiguas) y para cada agrupación realiza una transformada de descomposición direccional, produciendo las componentes direccionales (etapa 6.03).

Luego, el codificador produce cuatro planos separados de componentes direccionales (Promedio, Horizontal, Vertical, Diagonal), en donde los elementos correspondientes de dichos cuatro planos corresponden a una misma agrupación de residuos (etapa 6.04).

Luego, el codificador produce un plano de componentes del promedio predicho, en donde cada uno de los elementos de dicho plano es el promedio predicho para una agrupación correspondiente de residuos, calculado en base a la diferencia entre el promedio de los elementos predichos correspondientes en el siguiente LOQ superior y el elemento correspondiente en el LOQ inferior. El codificador produce el plano de las componentes Deltas, en donde cada elemento del plano se calcula como la diferencia entre una componente Promedio correspondiente y su componente Promedio Predicho correspondiente. El plano de Delta se sustituye por el plano de los Promedios, formando el conjunto de cuatro componentes direccionales transformadas Delta, H, V y D. (etapa 6.05) Luego, el codificador cuantifica los planos de las componentes direccionales transformadas, produciendo planos de componentes direccionales transformadas cuantificadas, (etapa 6.06)

Luego se codifican las componentes direccionales transformadas cuantificadas, produciendo datos de reconstrucción codificados. (etapa 6.08)

Con el fin de proceder con el siguiente nivel en la jerarquía, el codificador luego simula las operaciones de decodificación que se realizarán en un lado de decodificación, produciendo una representación decodificada de la señal en el siguiente LOQ superior. Con el fin de hacer esto, el codificador descuantifica los planos de las componentes direccionales transformadas cuantificadas; combina el plano de Deltas descuantificados con el plano de Promedios Predichos, reconstruyendo un plano de componentes Promedios descuantificadas; calcula los datos residuales realizando para cada agrupación de cuatro residuos una descomposición direccional inversa de las componentes direccionales correspondientes A, H, V y D; combina los datos residuales con la representación predicha de la señal en el siguiente LOQ superior, produciendo la representación decodificada de la señal en el siguiente LOQ superior. (etapa 6.07)

En ese punto, si el siguiente LOQ superior no es el LOQ más alto, el codificador procede con el siguiente nivel en la jerarquía, volviendo a la etapa 6.02 en donde — para el siguiente nivel en la jerarquía — la representación de la señal en el siguiente LOQ superior al que acaba de decodificarse se convierte en la representación decodificada de la señal en el LOQ inferior.

En otras modalidades no limitativas, las operaciones de cuantificación aplicadas a cada plano de las componentes direccionales transformadas se basan en parámetros que son específicos de cada clase de componentes direccionales transformadas (por ejemplo, entre otros, el nivel de cuantificación aplicado a las componentes Diagonales es más fuerte que el nivel de cuantificación aplicado a las componentes Horizontales y/o Verticales). En otras modalidades no limitativas, el codificador — en lugar de producir y codificar cuatro planos separados de componentes transformadas — produce y codifica agrupaciones de cuatro componentes transformadas, correspondiendo cada una de dichas agrupaciones a una agrupación de cuatro residuos en el plano de residuos. En otras modalidades no limitativas no cubiertas por la invención reivindicada, el codificador realiza las operaciones de cuantificación durante la etapa 6.02, produciendo los residuos cuantificados. En dichas modalidades, las operaciones de descomposición y descomposición inversa son operaciones sin pérdidas, es decir, no se aplica ninguna cuantificación adicional a las componentes direccionales y/o a las componentes direccionales transformadas.

En otras modalidades no limitativas, la representación de la señal en el LOQ mínimo se codifica por medio de un método basado en MPEG; de esta manera, los decodificadores heredados que no se configuran para procesar y reconstruir los LOQ superiores en la jerarquía pueden al menos decodificar una representación de la señal en el LOQ mínimo.

La Figura 7 es un diagrama de flujo que ilustra una modalidad que implementa la descomposición direccional inversa dentro de un lazo de decodificación jerárquico basado en niveles de acuerdo con la invención.

Un procesador de señales configurado como decodificador recibe y decodifica datos codificados correspondientes a un nivel mínimo de calidad, produciendo una representación descodificada de la señal en dicho LOQ mínimo. (etapa 7.01)

Una vez producida la representación decodificada de la señal en el LOQ mínimo, el decodificador entra en un lazo de decodificación que se repite para cada LOQ subsecuentemente superior, reconstruyendo la jerarquía de los LOQ nivel por nivel hasta el LOQ más alto.

En particular, el decodificador procesa la representación descodificada de la señal en un LOQ dado ("LOQ inferior"), decodifica los datos de reconstrucción correspondientes al siguiente LOQ superior y produce cuatro planos de parámetros cuantificados. Luego, el decodificador realiza las operaciones de descuantificación adecuadas en dichos planos de parámetros cuantificados, produciendo los parámetros transformados descuantificados (etapa 7.02)

Luego, el decodificador produce una representación predicha de la señal en el siguiente LOQ superior, aprovechando las operaciones de sobremuestreo y/u otras operaciones de procesamiento de señales de acuerdo con lo especificado por los parámetros recibidos (etapa 7.03)

Para cada agrupación de cuatro parámetros transformados descuantificados (Delta, H, V, D) correspondiente a una agrupación de cuatro residuos, el decodificador produce un parámetro Promedio predicho, calculado en base a la diferencia entre un elemento correspondiente de la señal en el LOQ inferior y el promedio de los cuatro elementos correspondientes de la representación predicha de la señal en el siguiente LOQ superior. Para cada agrupación, el Promedio Predicho se combina con la componente Delta descuantificada, produciendo una componente Promedio descuantificada (etapa 7.04)

Para cada agrupación, el decodificador realiza una descomposición inversa de las componentes descuantificadas Promedio, H, V y D, produciendo cuatro residuos. En particular, cada uno de los residuos se obtiene realizando una combinación lineal (es decir, sumas y/o diferencias, con los coeficientes adecuados) de las componentes descuantificadas Promedio, H, V y D. De esta manera, el decodificador produce un plano de residuos en el siguiente LOQ superior. (etapa 7.05)

Luego, el decodificador combina la representación predicha de la señal en el siguiente LOQ superior con los residuos producidos, reconstruyendo una representación decodificada de la señal en el siguiente LOQ superior. (etapa 7.06)

En ese punto, si el siguiente LOQ superior no es el LOQ más alto, el decodificador procede con la decodificación del siguiente nivel en la jerarquía, volviendo a la etapa 7.02 en donde, para el siguiente LOQ en la jerarquía, la representación de la señal en el siguiente LOQ superior que acaba de decodificarse se convierte en la representación decodificada de la señal en el LOQ inferior.

En otras modalidades no limitativas no cubiertas por la invención reivindicada, las operaciones de descuantificación se realizan después de la transformada de descomposición inversa, descuantificando los residuos en lugar de descuantificar los parámetros transformados.

La Figura 8 es un diagrama de bloques de un sistema informático 800 que proporciona procesamiento informático de acuerdo con las modalidades en la presente descripción.

El sistema informático 800 puede ser, o al menos incluir, un dispositivo informático tal como un ordenador personal, un circuito de procesamiento, un televisor, un dispositivo de reproducción, un dispositivo de codificación, una estación de trabajo, un dispositivo informático portátil, un teléfono móvil, una tableta, una consola, una caja decodificadora, un terminal de red, un dispositivo de procesamiento, un dispositivo de red, funcionando como un conmutador, enrutador, servidor, cliente, etc.

Tenga en cuenta que el siguiente análisis proporciona una modalidad básica que indica cómo llevar a cabo la funcionalidad asociada con un procesador de señales como se analizó anteriormente. Sin embargo, se debe señalar que la configuración real para llevar a cabo las operaciones como se describió en la presente descripción puede variar en dependencia de la aplicación respectiva.

Como se muestra, el sistema informático 800 del presente ejemplo comprende un bus de comunicación 811, que proporciona comunicación con un medio de almacenamiento legible por ordenador 812 tal como un medio de almacenamiento no transitorio legible por ordenador, etc., en el cual se puede almacenar y recuperar información digital.

El sistema informático 800 puede comprender además un procesador 813, una interfaz de E/S 814 y una interfaz de comunicaciones 817.

En una modalidad, la interfaz de E/S 814 proporciona conectividad al depósito 880 y, si está presente, a una pantalla, altavoces de audio, dispositivos periféricos 816 tales como un teclado, un ratón de ordenador, etc.

Como se mencionó brevemente antes, el medio de almacenamiento legible por ordenador 812 puede ser cualquier dispositivo y/o hardware adecuado tal como una memoria, almacenamiento óptico, almacenamiento de estado sólido, disco duro, disquete, etc. En una modalidad, el medio de almacenamiento 812 es un medio de almacenamiento no transitorio (es decir, un medio de onda no portadora) configurado para almacenar las instrucciones asociadas con una aplicación del procesador de señales 840-1. Las instrucciones se ejecutan por un recurso respectivo tal como el procesador 813 con el fin de realizar cualquiera de las operaciones que se analizan en la presente descripción.

La interfaz de comunicaciones 817 permite que el sistema informático 800 se comunique a través de una red 890 con el fin de recuperar información de fuentes remotas y comunicarse con otros ordenadores, conmutadores, clientes, servidores, etc. La interfaz de E/S 814 también permite que el procesador 813 recupere o intente recuperar la información almacenada del depósito 880.

Como se muestra, los medios de almacenamiento legibles por ordenador 812 se pueden codificar con la aplicación de procesador de señales 840-1 ejecutada por el procesador 813 como un proceso 840-2.

Tenga en cuenta que el sistema informático 800 se puede incorporar para incluir un medio de almacenamiento legible por ordenador 812 para almacenar los datos y/o instrucciones lógicas.

El código asociado con la aplicación de procesador de señales 840-1 puede implementar las funcionalidades de los procesadores de señales ilustrados en la presente descripción y/u otros recursos necesarios para implementar la invención analizada en la presente descripción.

Durante la operación de una modalidad, el procesador 813 accede a los medios de almacenamiento legibles por ordenador 812 a través del bus de comunicación 811 con el fin de iniciar, ejecutar, llevar a cabo, interpretar o realizar de cualquier otra manera las instrucciones de la aplicación del procesador de señales 840-1 almacenadas en los medios de almacenamiento legibles por ordenador 812. La ejecución de la aplicación del procesador de señales 840-1 produce la funcionalidad de procesamiento en el procesador 813. En otras palabras, el proceso del procesador de señales 840-2 asociado con el procesador 813 representa uno o más aspectos de la ejecución de la aplicación del procesador de señales 840-1 dentro de o sobre el procesador 813 en el sistema informático 800. Los expertos en la técnica comprenderán que el sistema informático 800 puede incluir otros procesos y/o componentes de software y hardware tales como un sistema operativo u otro software que controle la asignación y el uso de los recursos de procesamiento de hardware para ejecutar la aplicación del procesador de señales 840-1. De acuerdo con diferentes modalidades, tenga en cuenta que el sistema informático puede ser cualquiera de varios tipos de dispositivos, incluyendo, entre otros, un sistema informático personal, una ordenador de escritorio, una ordenador portátil, una notebook, una netbook, un sistema informático central, una ordenador de mano, una estación de trabajo, un ordenador en red, un servidor de aplicaciones, un dispositivo de almacenamiento, un dispositivo electrónico de consumo tal como una cámara, una videocámara, una caja decodificadora, un dispositivo móvil, un teléfono inteligente, una tableta, una consola de videojuegos, un dispositivo portátil de videojuegos, un dispositivo periférico tal como un conmutador, un módem, un enrutadoro, en general, cualquier tipo de dispositivo informático o electrónico.

La funcionalidad soportada por los diferentes recursos se analizará ahora a través de los diagramas de flujo de las Figuras 10-11. Tenga en cuenta que las etapas de los diagramas de flujo a continuación se pueden ejecutar en cualquier orden adecuado.

La Figura 10 es un diagrama de flujo 1000 que ilustra un método de ejemplo de acuerdo con modalidades no limitativas descritas en la presente descripción. Tenga en cuenta que habrá cierta superposición con respecto a los conceptos como se analizó anteriormente.

En el bloque de procesamiento 1010, el hardware del procesador del ordenador recibe un primer conjunto de valores de ajuste, especificando el primer conjunto de valores de ajuste los ajustes a realizar en una representación predicha de una señal generada en un primer nivel de calidad para reconstruir una representación de la señal en el primer nivel de calidad.

En el bloque de procesamiento 1020, el hardware del procesador del ordenador procesa el primer conjunto de valores de ajuste.

En el bloque de procesamiento 1030, el hardware del procesador del ordenador deriva un segundo conjunto de valores de ajuste en base al primer conjunto de valores de ajuste y a una representación de la señal en un segundo nivel de calidad. El segundo nivel de calidad inferior al primer nivel de calidad.

La Figura 11 es un diagrama de flujo 1100 que ilustra un método de ejemplo de acuerdo con modalidades no limitativas descritas en la presente descripción. Tenga en cuenta que habrá cierta superposición con respecto a los conceptos como se analizó anteriormente.

En el bloque de procesamiento 1110, el hardware del procesador del ordenador recibe la información de ajuste asociada con una representación de una señal en un primer nivel de calidad.

En el bloque de procesamiento 1120, el hardware del procesador del ordenador recibe un conjunto de valores de ajuste. En el bloque de procesamiento 1130, el hardware del procesador del ordenador produce una representación preliminar de la señal en un segundo nivel de calidad en base a la información de ajuste. El segundo nivel de calidad es superior al primer nivel de calidad.

En el bloque de procesamiento 1140, el hardware del procesador del ordenador produce una representación secundaria de la señal en el segundo nivel de calidad en base al conjunto de valores de ajuste y a la representación preliminar de la señal en el segundo nivel de calidad. Tenga en cuenta nuevamente que las técnicas en la presente descripción son muy adecuadas para codificar y decodificar en sistemas jerárquicos. Sin embargo, se debe señalar que las modalidades en la presente descripción no se limitan al uso en tales aplicaciones y que las técnicas analizadas en la presente descripción también son adecuadas para otras aplicaciones.

En base a la descripción que se establece en la presente descripción, se han establecido numerosos detalles específicos para proporcionar una comprensión completa del objeto reivindicado. Sin embargo, se entenderá por los expertos en la técnica que el objeto reivindicado se puede llevar a la práctica sin estos detalles específicos. En otros casos, los métodos, aparatos, sistemas, etc., que serían conocidos por un experto, no se han descrito en detalle para no opacar el objeto reivindicado. Algunas porciones de la descripción detallada se han presentado en términos de algoritmos o representaciones simbólicas de operaciones en bits de datos o señales digitales binarias almacenadas dentro de la memoria de un sistema informático tal como una memoria de ordenador. Estas descripciones algorítmicas o representaciones son ejemplos de técnicas usadas por los expertos en las técnicas del procesamiento de datos para transmitir la esencia de su trabajo a otros expertos en la técnica. Un algoritmo como se describió en la presente descripción, y generalmente, se considera que es una secuencia autoconsistente de operaciones o un procesamiento similar que conduce a un resultado deseado. En este contexto, las operaciones o el procesamiento implican la manipulación física de cantidades físicas. Típicamente, pero no necesariamente, tales cantidades pueden tomar la forma de señales eléctricas o magnéticas capaces de ser almacenadas, transferidas, combinadas, comparadas o de cualquier otra manera manipuladas. En ocasiones es conveniente, principalmente por razones de uso común, referirse a tales señales como bits, datos, valores, ajustes, elementos, símbolos, caracteres, términos, números, numerales o similares. Sin embargo, se debe entender que todos estos términos y similares se deben asociar con las cantidades físicas apropiadas y son simplemente etiquetas convenientes. A menos que se indique específicamente de cualquier otra manera, como se desprende del siguiente análisis, se aprecia que a lo largo de esta especificación, los análisis que utilizan términos tales como "procesamiento", "computación", "cálculo", "producción", "determinación" o similares se refieren a acciones o procesos de una plataforma informática tal como una ordenador o un dispositivo informático electrónico similar, que manipula o transforma los datos representados como cantidades físicas electrónicas o magnéticas dentro de memorias, registros u otros dispositivos de almacenamiento de información, dispositivos de transmisión o dispositivos de visualización de la plataforma informática.

Claims

REIVINDICACIONES

i. Un método de codificación de una señal de vídeo que comprende:

a través del hardware de procesamiento del ordenador:

recibir (6.01) un plano de la señal de vídeo en una primera resolución, el plano que comprende un plano de píxeles;

submuestrear la resolución (6.01) del plano de la señal de vídeo para generar una representación del plano en una segunda resolución, la segunda resolución que es inferior a la primera resolución; producir (6.01, 6.02) un plano predicho de la señal en la primera resolución mediante la obtención de un plano codificado de la señal en la segunda resolución y el sobremuestreo de una decodificación simulada del plano codificado de la señal en la segunda resolución;

producir (6.02) los datos residuales como una diferencia entre el plano recibido de la señal de vídeo en la primera resolución y el plano predicho de la señal de vídeo en la primera resolución;

procesar (6.03, 6.04) los datos residuales mediante el uso de una descomposición direccional para generar los conjuntos de componentes direccionales (320), la descomposición direccional que se aplica a bloques de residuos de 2*2 para generar, para cada bloque de 2*2, cuatro componentes direccionales: A — un promedio del bloque de residuos,

H — una diferencia horizontal dentro del bloque de residuos,

V — una diferencia vertical dentro del bloque de residuos, y

D — una diferencia diagonal dentro del bloque de residuos;

derivar (6.05) los conjuntos de residuos transformados (350) a partir de los conjuntos de componentes direccionales (320) ajustando la componente direccional promedio de cada conjunto de componentes direccionales (320), que incluye:

determinar un promedio predicho para cada bloque de 2*2 como una diferencia entre un valor de píxel cuantificado en la segunda resolución representativa del bloque y un promedio de un bloque correspondiente en el plano predicho de la señal, y

restar el promedio predicho de la componente direccional promedio para el bloque de residuos; cuantificar (6.06) los conjuntos de residuos transformados (350); y

codificar (6.08) los conjuntos cuantificados de residuos transformados para dar salida a los datos de reconstrucción codificados para la comunicación con el hardware de procesamiento del decodificador para la decodificación.
2. El método como en la reivindicación 1, que comprende además:

transmitir los datos de reconstrucción codificados al hardware de procesamiento del decodificador.
3. El método como en la reivindicación 1, en donde cada conjunto de residuos transformados pertenece a la reconstrucción de una ubicación particular en el plano de la señal de vídeo en la primera resolución; y en donde los conjuntos de residuos transformados se cuantifican en dependencia de los atributos de imagen de las ubicaciones particulares.
4. El método como en la reivindicación 1, en donde los conjuntos de residuos transformados se cuantifican en dependencia de los atributos de imagen de las porciones de la trama de la señal de vídeo que corresponden a los conjuntos de residuos transformados, en donde una o más áreas de imagen homogénea, áreas de la imagen con contraste nítido y las áreas de la imagen con un objeto detectado se cuantifican menos.
5. El método como en la reivindicación 1, que comprende:

codificar al menos dos de las componentes direccionales mediante el uso de un único símbolo.
6. Un método de decodificación de una señal de vídeo que comprende:

a través del hardware de procesamiento del ordenador:

recibir (7.01) los valores de píxeles decodificados asociados con un plano de la señal de vídeo en una primera resolución;

recibir (7.02) los datos de reconstrucción codificados para la señal de vídeo;

decodificar (7.02) los datos de reconstrucción codificados para obtener conjuntos cuantificados de residuos transformados;

descuantificar (7.02) los conjuntos cuantificados de residuos transformados para obtener conjuntos de residuos transformados;

producir (7.03) una representación preliminar de un plano de la señal de vídeo a una segunda resolución mediante el sobremuestreo de los valores de los píxeles, la segunda resolución que es mayor que la primera resolución;

generar (7.04, 7.05) un plano de residuos a partir de los conjuntos de residuos transformados realizando una descomposición direccional inversa, en donde cada conjunto de residuos transformados comprende cuatro componentes direccionales correspondientes a los bloques respectivos de 2*2 del plano de residuos, las componentes direccionales que comprenden: 8 — un promedio ajustado del bloque de residuos,

H — una diferencia horizontal dentro del bloque de residuos,

V — una diferencia vertical dentro del bloque de residuos, y

D — una diferencia diagonal dentro del bloque de residuos, y

producir (7.06) una representación secundaria del plano de la señal de vídeo en la segunda resolución mediante la combinación del plano de residuos y la representación preliminar del plano de la señal de vídeo en la segunda resolución,

en donde el método comprende además:

producir (7.05) un parámetro promedio predicho para cada bloque de 2*2 derivado del conjunto de residuos transformados, el parámetro promedio predicho que se calcula como una diferencia entre un valor de píxel correspondiente para el bloque en la primera resolución y un promedio de un bloque correspondiente en la representación preliminar del plano de la señal de vídeo en la segunda resolución; y

efectuar una combinación, a través de la adición, de los parámetros promedio predichos con las componentes direccionales promedio ajustadas correspondientes durante la producción de la representación secundaria del plano de la señal de vídeo para restaurar las componentes direccionales promedio para el plano de residuos.
7. El método como en la reivindicación 6, en donde efectuar una combinación de los parámetros promedio predichos incluye:

sumar cada parámetro promedio predicho y la componente direccional promedio ajustada correspondiente para modificar la componente direccional promedio ajustada.
8. El método como en la reivindicación 7, que comprende además:

modificar los ajustes de cada uno de los múltiples elementos de píxeles en la representación preliminar del plano de la señal de vídeo en la segunda resolución en base a la componente direccional modificada.
9. El método como en la reivindicación 6, en donde la representación preliminar del plano de la señal de vídeo en la segunda resolución es una representación predicha del plano de la señal de vídeo en la segunda resolución; y

en donde la representación secundaria del plano de la señal de vídeo en la segunda resolución se usa como base para producir una representación preliminar de un plano de la señal de vídeo en una tercera resolución, la tercera resolución que es mayor que la segunda resolución.
10. El método como en la reivindicación 6, que comprende además:

recibir metadatos asociados con los datos de reconstrucción codificados;

identificar una operación de sobremuestreo de acuerdo con lo especificado por los metadatos; y aplicar la operación de sobremuestreo para derivar la representación preliminar del plano de la señal de vídeo en la segunda resolución.
11. El método como en la reivindicación 6, que comprende además:

producir la representación secundaria del plano de la señal de vídeo en la segunda resolución a través de una aplicación lineal del plano de residuos a la representación preliminar del plano de la señal de vídeo.
12. El método como en la reivindicación 6,

en donde las componentes direccionales se representan como un vector de valores y cada bloque de residuos se recupera a partir de las componentes direccionales mediante el uso de las ponderaciones especificadas por una matriz.
13. El método como en la reivindicación 6, que comprende además:

recibir los datos de reconstrucción codificados;

decodificar los datos de reconstrucción codificados en múltiples símbolos;

recuperar un símbolo de los múltiples símbolos; y

producir los residuos transformados cuantificados a partir del símbolo recuperado.
14. El método como en la reivindicación 6, que comprende además:

aplicar una primera operación de descuantificación para reproducir un primer residuo transformado; y aplicar una segunda operación de descuantificación para reproducir un segundo residuo transformado, la primera operación de descuantificación diferente de la segunda operación de descuantificación.
15. El hardware de almacenamiento legible por ordenador que tiene instrucciones almacenadas en el mismo, las instrucciones, cuando se realizan por un dispositivo de procesamiento, hacen que el dispositivo de procesamiento realice las operaciones de cualquiera de las reivindicaciones 1 a 14.
16. Un sistema informático que comprende:

un hardware del procesador de ordenador; y

un recurso de almacenamiento de hardware acoplado al hardware del procesador del ordenador, el recurso de almacenamiento de hardware que almacena instrucciones que, cuando se ejecutan por el hardware del procesador del ordenador, hacen que el hardware del procesador del ordenador realice las operaciones de cualquiera de las reivindicaciones 1 a 14.