ES2544946T3 - Decodificación de señal de audio multicanal usando señales de-correlacionadas - Google Patents
Decodificación de señal de audio multicanal usando señales de-correlacionadas Download PDFInfo
- Publication number
- ES2544946T3 ES2544946T3 ES05807484.0T ES05807484T ES2544946T3 ES 2544946 T3 ES2544946 T3 ES 2544946T3 ES 05807484 T ES05807484 T ES 05807484T ES 2544946 T3 ES2544946 T3 ES 2544946T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- channel
- decorrelated
- audio
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/02—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Abstract
Decodificador de audio (400; 500; 600) multi-canal para generar una reconstrucción de una señal multi-canal (412; 508; 610a; 610b; 630) usando una señal de submezcla (405; 505a, b; 605; 620) obtenida desde una señal multicanal original, teniendo la reconstrucción de la señal multi-canal (412; 508; 610a; 610b; 630) al menos tres canales, que comprende: un de-correlador (402; 502; 602; 700) para obtener un conjunto de señales de-correlacionadas usando una regla de de-correlación, en el que la regla de de-correlación es de manera que se obtiene una primera señal de correlacionada y una segunda señal de-correlacionada usando la señal de submezcla (405; 505a, b; 605; 620), y que la primera señal de-correlacionada y la segunda señal de-correlacionada son ortogonales entre sí en un intervalo de tolerancia de ortogonalidad, en el que la obtención de la primera y segunda señales decorrelacionadas comprende el filtrado de un canal de audio (406; 506; 607) extraído desde la señal de submezcla (405; 505a, b; 605; 620) por medio de uno o más filtros IIR paso-todo basándose en una estructura en celosía; y un calculador de canal de salida (403; 503; 603) para generar canales de salida usando la señal de submezcla (405; 505a, b; 605; 620), la primera y la segunda señales de-correlacionadas y la información de premezcla de modo que los al menos tres canales están al menos parcialmente de-correlacionados entre sí.
Description
Decodificación de señal de audio multicanal usando señales decorrelacionadas
La presente invención se refiere a codificación de señales de audio multicanal usando parámetros espaciales y en 5 particular a nuevos conceptos mejorados para generar y usar señales decorrelacionadas.
En la actualidad, las técnicas de reproducción de audio multicanal se están haciendo más y más importantes. En vista de una transmisión eficaz de señales de audio multicanal que tengan 5 o más canales de audio separados, se han desarrollado varias maneras de comprimir una señal estéreo o multicanal. Enfoques recientes para la
10 codificación paramétrica de señales de audio multicanal (estéreo paramétrico (PS), “Codificación de Indicación Binaural” (BCC) etc.) representan una señal de audio multicanal por medio de una señal de submezcla (podría ser monofónica o comprender varios canales) e información de lado paramétrico, también denominada como “indicaciones espaciales”, que caracterizan su etapa de sonido espacial percibido.
15 Un dispositivo de codificación multicanal generalmente recibe como entrada al menos dos canales, y emite uno o más canales de portadora y datos paramétricos. Los datos paramétricos se obtienen de manera que, en un decodificador, puede calcularse una aproximación de la señal multicanal original. Normalmente, el canal (canales) de portadora incluirá muestras de subbanda, coeficientes espectrales, muestras de dominio de tiempo, etc., que proporcionan una representación comparativamente precisa de la señal subyacente, mientras que los datos
20 paramétricos no incluyen tales muestras de coeficientes espectrales pero incluyen parámetros de control para controlar un cierto algoritmo de reconstrucción en su lugar. Una reconstrucción de este tipo podría comprender la ponderación mediante multiplicación, desplazamiento de tiempo, desplazamiento de frecuencia, desplazamiento de fase, etc. Por lo tanto, los datos paramétricos incluyen únicamente una representación comparativamente aproximada de la señal o del canal asociado.
25 La técnica codificación de indicación binaural (BCC) se describe en un número de publicaciones, como en “Binaural Cue Coding applied to Stereo and MultiChannel Audio Compression”, C. Faller, F. Baumgarte, AES convention artículo 5574, mayo de 2002, Múnich, en las publicaciones del 2 ICASSP “Estimation of auditory spatial cues for binaural cue coding”, y “Binaural cue coding: a normal and efficient representation of spatial audio”, ambas escritas
30 por C. Faller, y F. Baumgarte, Orlando, FL, mayo de 2002.
En la codificación BCC, un número de canales de entrada de audio se convierten a una representación espectral usando una DFT (Transformada Discreta de Fourier) basada en la transformación con ventanas solapantes. El espectro uniforme resultante a continuación se divide en particiones no solapantes. Cada partición tiene un ancho de 35 banda proporcional al ancho de banda rectangular equivalente (ERB). A continuación, los parámetros espaciales denominados ICLD (Diferencia de Nivel InterCanal) e ICTD (Diferencia de Tiempo InterCanal) se estiman para cada partición. El parámetro ICLD describe una diferencia de nivel entre dos canales y el parámetro ICTD describe la diferencia de tiempo (desplazamiento de fase) entre dos señales de canales diferentes. Las diferencias de nivel y las diferencias de tiempo se proporcionan normalmente para cada canal con respecto a un canal de referencia.
40 Después de la derivación de estos parámetros, los parámetros se cuantifican y finalmente se codifican para la transmisión.
Aunque los parámetros ICLD y ICTD representan los parámetros de localización de fuente de sonido más importantes, una representación espacial que use estos parámetros puede mejorarse introduciendo parámetros
45 adicionales.
Una técnica relacionada, denominada “estéreo paramétrico” describe la codificación paramétrica de una señal estéreo de dos canales basándose en una señal mono transmitida más información del lado de parámetro. En este contexto, se introducen 3 tipos de parámetros espaciales, denominados como diferencia de intensidad intercanal 50 (IID), diferencias de fase intercanal (IPD) y coherencia intercanal (ICC). El alcance del parámetro espacial establecido con un parámetro de coherencia (parámetro de correlación) posibilita una parametrización de la “difusión” espacial percibida o “compacidad” espacial de la etapa de sonido. El estéreo paramétrico se describe en más detalle en: “Parametric Coding of stereo audio”, J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers (2005) Eurasip, J. Applied Signal Proc. 9, páginas 13051322)”, en “HighQuality Parametric Spatial Audio Coding at Low
55 Bitrates”, J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, AES 116th Convention, preimpresión 6072, Berlín, mayo de 2004, y en “Low Complexity Parametric Stereo Coding”, E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, AES 116th Convention, preimpresión 6073, Berlín, mayo de 2004.
La presente invención se refiere a codificación paramétrica de las propiedades espaciales de una señal de audio.
60 Los decodificadores de audio multicanal paramétricos reconstruyen N canales basándose en M canales transmitidos, donde N > M, y datos de control adicional. Los datos de control adicional representan una velocidad de datos significativamente inferior a transmitir todos los N canales, haciendo la codificación muy eficaz mientras que al mismo tiempo asegura la compatibilidad con al menos tanto dispositivos de M canales como dispositivos de N canales. Los parámetros típicos usados para describir propiedades espaciales son diferencias de intensidad intercanal (IID), diferencias de tiempo intercanal (ITD) y coherencias intercanal (ICC). Para reconstruir las propiedades espaciales basándose en estos parámetros, se requiere un método que pueda reconstruir el nivel correcto de correlación entre dos o más canales, de acuerdo con los parámetros IC. Esto se consigue por medio de un método de decorrelación, es decir, un método para obtener señales decorrelacionadas desde señales transmitidas para
5 combinar señales decorrelacionadas con señales transmitidas en algún proceso de premezcla. Los métodos para premezclar basándose en una señal transmitida, una señal decorrelacionada y parámetros de IID/ICC se describen en las referencias anteriormente proporcionadas.
Existen un par de métodos disponibles para creación de señales decorrelacionadas. Preferentemente, las señales
10 decorrelacionadas tienen envolventes temporales y espectrales similares o iguales a las señales de entrada originales. Idealmente, se desea una función invariante en el tiempo lineal (LTI) con respuesta de frecuencia de pasotodo. Un método evidente para conseguir esto es usar un retardo constante. Sin embargo, usar un retardo, o cualquier otra función LTI pasotodo, dará como resultado respuesta no pasotodo después de la adición de la señal no procesada. En el caso de un retardo, el resultado será típicamente filtro de peine. El filtro de peine a menudo
15 proporciona un sonido “metálico” indeseable que, incluso aunque el efecto de ampliación de estéreo puede ser eficaz, reduce mucha naturaleza del original. El método de retardo constante y otros métodos de la técnica anterior sufren de la incapacidad para crear más de una señal decorrelacionada mientras conservan la calidad y la decorrelación mutua.
20 La calidad perceptual de una señal de audio multicanal reconstruida por lo tanto depende fuertemente de un concepto eficaz que permite la generación de una señal decorrelacionada desde una señal transmitida, en el que idealmente la señal decorrelacionada es ortogonal a la señal desde la que se obtiene, es decir perfectamente decorrelacionada. Incluso si está disponible una señal perfectamente decorrelacionada, no puede obtenerse una premezcla multicanal en la que los canales individuales se decorrelacionan mutuamente usando una única señal
25 decorrelacionada. Durante la premezcla se genera un canal de audio reconstruido combinando una señal transmitida con la señal decorrelacionada generada, mientras que el alcance al que la señal decorrelacionada se mezcla a la señal transmitida se controla típicamente mediante un parámetro de audio espacial (ICC) transmitido. No pueden conseguirse por lo tanto señales decorrelacionadas mutuamente de manera perfecta, puesto que cada canal de audio reconstruido tiene una fracción de la misma señal decorrelacionada.
30 Ya que la reconstrucción multicanal gana más y más interés, se conoce un número de publicaciones en relación con esta materia. Por ejemplo, la solicitud de patente internacional Nº WO2005/101370 A1 se refiere a un aparato para la generación de un parámetro de nivel para generar una representación multicanal a partir de al menos un canal de submezcla obtenido a partir de una señal multicanal. A medida que se requiere la conservación de la
35 energía durante premezcla y submezcla, se calcula un parámetro de nivel adicional de manera que la energía del canal de submezcla, cuando se pondera mediante el parámetro de nivel, se hace igual a la suma de energías de los canales originales de la señal multicanal. Como tal, pueden usarse algoritmos de submezcla apropiados sin tener que asegurar la conservación de energía en el lado del codificador mientras que se submezcla la señal multicanal en el al menos un canal submezclado.
40 La publicación G. Potard, I.Burnett: “Decorrelation techniques for the rendering of apparent sound source width in 3D audio displays” proceedings of the 7th International Conference on Digital Audio Effects DAFX04, 5 de octubre de 2004 (05102004), se refiere a los principios para representar fuentes de sonido en pantallas de audio de 3D y en particular dos técnicas que usan decorrelación como un medio para disminuir la Correlacióncruzada Interaural, que
45 tiene un impacto directo en el alcance de la fuente percibida. Adicionalmente, se describen técnicas para variar la decorrelación con tiempo y con frecuencia, que permite crear variaciones temporales y espectrales en el alcance espacial de las fuentes de sonido.
Adicionalmente, la publicación Breebaart J. et al: “Highquality parametric spatial audio coding at low bitrates”
50 preimpresiones de artículos presentados en la AES Convention el 8 de mayo de 2004 (08052004), describe un esquema de codificación denominado codificación de indicación binauaral que transmite dos indicaciones de localización de sonido perceptualmente relevantes junto con una submezcla mono de una señal de audio original que tiene al menos dos canales. En el documento, se describe particularmente que la calidad perceptual de una señal reconstruida puede mejorarse cuando se transmite un parámetro de coherencia (IC), que describe la
55 correlación entre dos canales de la señal original.
Es el objeto de la presente invención proporcionar un concepto más eficaz para creación de señales altamente decorrelacionadas.
60 Este objeto se consigue mediante un aparato de acuerdo con la reivindicación 1 o un método de acuerdo con la reivindicación 10 o un programa informático de acuerdo con la reivindicación 13.
La presente invención está basada en el hallazgo de que una señal multicanal que tiene al menos tres canales puede reconstruirse de manera que los canales reconstruidos están al menos parcialmente decorrelacionados entre sí usando una señal submezclada obtenida desde una señal multicanal original y un conjunto de señales decorrelacionadas proporcionadas mediante un decorrelador que obtiene el conjunto de señales decorrelacionadas desde la señal de submezcla, en el que las señales decorrelacionadas en el conjunto de señales decorrelacionadas son mutuamente de manera aproximada ortogonales entre sí, es decir se satisface una relación de
5 ortogonalidad entre pares de canales en un intervalo de tolerancia de ortogonalidad.
Un intervalo de tolerancia de ortogonalidad puede obtenerse por ejemplo a partir del coeficiente de correlación cruzada que cuantifica el grado de correlación entre dos señales. Un coeficiente de correlación cruzada de 1 significa correlación perfecta, es decir dos señales idénticas. Por otro lado, un coeficiente de correlación cruzada de
10 0 significa anticorrelación perfecta u ortogonalidad de las señales. El intervalo de tolerancia de ortogonalidad, por lo tanto, puede definirse como el intervalo de valores de coeficiente de correlación que varían desde 0 a un límite superior específico.
Por lo tanto, la presente invención se refiere, y proporciona una solución, al problema de generar eficazmente una o 15 más señales ortogonales mientras que conserva las propiedades de impulso y calidad de audio percibida.
En una realización de la presente invención se implementa un filtro en celosía IIR como un decorrelador que tiene coeficientes de filtro obtenidos desde secuencias de ruido, y el filtrado se realiza en un banco de filtros con valores complejos o con valores reales.
20 En una realización de la presente invención, un método para reconstruir una señal multicanal incluye un método para crear varias señales ortogonales o cercanas a la ortogonalidad usando un grupo de filtros en celosía IIR.
En una realización adicional de la presente invención, el método para crear varias señales ortogonales es tener un 25 método para elegir coeficientes de filtro para conseguir ortogonalidad o una aproximación de la ortogonalidad de una manera perceptualmente motivada.
En una realización adicional de la presente invención, se usa un grupo de filtros en celosía IIR en un banco de filtros con valores complejos durante la reconstrucción de la señal multicanal.
30 En una realización adicional de la presente invención se implementa un método para crear una o más señales ortogonales o cerca de la ortogonalidad, usando uno o más filtros IIR pasotodo basándose en la estructura en celosía en un decodificador espacial.
35 En una realización adicional de la presente invención, la realización anteriormente descrita se implementa de manera que los coeficientes de filtro usados para el filtrado IIR están basados en secuencias de ruido aleatorio.
En una realización adicional de la presente invención, se añaden retardos de tiempo adicionales a los filtros usados.
40 En una realización adicional de la presente invención, el filtrado se procesa en un dominio de banco de filtros.
En una realización adicional de la presente invención, el filtrado se procesa en un banco de filtros con valores complejos.
45 En una realización adicional de la presente invención, las señales ortogonales creadas mediante el filtrado se mezclan para formar un conjunto de señales de salida.
En una realización adicional de la presente invención, la mezcla de las señales ortogonales es dependiente de datos de control transmitidos, suministrados adicionalmente a un decodificador inventivo.
50 En una realización adicional de la presente invención, un decodificador inventivo o un método de decodificación inventivo usa datos de control que contienen al menos un parámetro que indica una correlación cruzada deseada de al menos dos de las señales de salida generadas.
55 En una realización adicional de la presente invención, una señal envolvente de 5.1 canales se premezcla desde una señal monofónica transmitida obteniendo cuatro señales decorrelacionadas usando el concepto inventivo. La señal submezclada monofónica y las cuatro señales decorrelacionadas se mezclan a continuación juntas de acuerdo con algunas reglas de mezclado para formar la señal de salida de 5.1 canales. Por lo tanto se proporciona la posibilidad de generar señales de salida que están mutuamente decorrelacionadas, puesto que las señales usadas para la
60 premezcla, es decir la señal monofónica transmitida y las cuatro señales decorrelacionadas generadas están principalmente decorrelacionadas debido a su generación inventiva.
En una realización adicional de la presente invención, se transmiten dos canales individuales como una submezcla de una señal de 5.1 canales. En una implementación, se obtienen dos señales mutuamente decorrelacionadas adicionales usando el concepto inventivo para proporcionar cuatro canales como base para una premezcla que está casi perfectamente decorrelacionado. En una modificación de la realización anteriormente descrita se obtiene una tercera señal decorrelacionada y se mezcla con las otras dos señales decorrelacionadas para proporcionar una señal decorrelacionada adicional disponible para la premezcla posterior. Usando esta característica, la calidad
5 perceptual puede mejorarse adicionalmente para canales individuales, por ejemplo el canal central de una señal envolvente 5.1.
En una realización adicional de la presente invención, se premezclan cinco canales de audio a partir de un canal transmitido monofónico antes de obtener, usando el concepto inventivo, cuatro señales decorrelacionadas que se 10 combinan posteriormente con cuatro de los cinco canales premezclados anteriormente mencionados, que permite una creación de cinco canales de audio de salida que están principalmente decorrelacionados de manera mutua.
En una realización adicional de la presente invención, las señales de audio se retardan antes de o después de la aplicación del filtrado basado en el filtro IIR inventivo. El retado mejora adicionalmente la decorrelación de las 15 señales generadas, y reduce la coloración cuando se mezclan las señales decorrelacionadas generadas con la señal submezclada original.
En una realización adicional de la presente invención, la generación de las señales decorrelacionadas se realiza en el dominio de subbanda de un banco de filtros (modulado complejo), en el que los coeficientes de filtro usados 20 mediante el decorrelador se obtienen usando el índice de banco de filtro específico del banco de filtro para el que se obtienen las señales decorrelacionadas.
En una realización adicional de la presente invención, las señales decorrelacionadas se obtienen usando filtros IIR en celosía que realizan un filtrado pasotodo IIR en celosía de una señal de audio. Usar un filtro IIR en celosía tiene
25 ventajas principales. Un decrecimiento exponencial de la respuesta de un filtro de este tipo, que es preferente para crear señales decorrelacionadas apropiadas, es una propiedad intrínseca de un filtro de este tipo. Adicionalmente, puede conseguirse una respuesta de pulso de decrecimiento larga deseada de un filtro usado para generar señales decorrelacionadas de una manera extremadamente eficaz en memoria y computacionalmente (baja complejidad) usando una estructura de filtro en celosía.
30 En una modificación de la realización anteriormente descrita los coeficientes de filtro (coeficientes de reflexión) usados se proporcionan por medio de proporcionar coeficientes de filtro obtenidos a partir de secuencias de ruido. En una modificación, los coeficientes de reflexión se calculan individualmente basándose en el índice de subbanda de una subbanda, en la que se usa el filtro en celosía para obtener señales decorrelacionadas.
35 En una realización de la presente invención, las señales filtradas y la señal de entrada sin modificar se combinan mediante una matriz de mezcla D para formar un conjunto de señales de salida. La matriz de mezcla D define las correlaciones mutuas de las señales de salida, así como la energía de cada señal de salida. Las entradas (pesos) de la matriz de mezcla D son preferentemente variables en tiempo y dependientes de los datos de control transmitidos.
40 Los parámetros de control preferentemente contienen (se desea) diferencias de nivel entre ciertas señales de salida y/o parámetros de correlación mutuos específicos.
En una realización adicional de la presente invención, un decodificador de audio inventivo está comprendido en un receptor de audio o dispositivo de reproducción para mejorar la calidad perceptual de una señal reconstruida.
45 Las realizaciones preferidas de la presente invención se describen posteriormente mediante los siguientes dibujos, en los que:
La Figura 1 muestra un diagrama de bloques de los conceptos de decodificación de audio inventivos; 50 La Figura 2 muestra un decodificador de la técnica anterior que no implementa los conceptos inventivos;
La Figura 3 muestra un decodificador de audio multicanal 5.1 de acuerdo con la presente invención;
55 La Figura 4 muestra un decodificador de audio de 5.1 canales adicional de acuerdo con la presente invención;
La Figura 5 muestra un decodificador de audio inventivo adicional;
La Figura 6 muestra una realización adicional de un decodificador de audio multicanal inventivo; 60 La Figura 7 muestra esquemáticamente la generación de una señal decorrelacionada;
La Figura 8 muestra un filtro IIR en celosía usado para generar una señal decorrelacionada;
La Figura 9 muestra un receptor o reproductor de audio que tiene un decodificador de audio inventivo; y
La Figura 10 muestra una transmisión que tiene un dispositivo receptor o reproductor que tiene un decodificador de audio inventivo.
5 Las realizaciones descritas a continuación son meramente ilustrativas de los principios de la presente invención para métodos avanzados para crear señales ortogonales. Se entiende que serán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos en el presente documento para los expertos en la materia. Se pretende, por lo tanto, limitar únicamente mediante el alcance de las reivindicaciones de patente inminentes y no mediante los
10 detalles específicos presentados a modo de descripción y explicación de las realizaciones del presente documento.
La Figura 1 ilustra un aparato inventivo para la decorrelación de señales como se usa en un sistema estéreo paramétrico o multicanal. El aparato inventivo incluye medios 101 para proporcionar una pluralidad de señales decorrelacionadas ortogonales obtenidas desde una señal de entrada 102. Los medios que proporcionan pueden ser
15 un conjunto de filtros de decorrelación basándose en estructuras IIR en celosía. La señal de entrada 102 (x) puede ser una señal de dominio de tiempo o una señal de dominio de subbanda única como por ejemplo obtenida a partir de un banco QMF complejo. Las señales emitidas mediante los medios 101, y1yN son las señales decorrelacionadas resultantes que son mutuamente ortogonales o cercanas a la ortogonalidad.
20 Ya que es vital para reconstruir las propiedades espaciales de un sistema estero paramétrico o multicanal paramétrico para disminuir la coherencia entre dos o más canales para reconstruir la amplitud percibida de la imagen espacial, la señal decorrelacionada resultante puede usarse para crear una premezcla final de una señal multicanal. Esto puede hacerse añadiendo versiones filtradas (h1(x)) de la señal original (x) a los canales de salida. Por lo tanto, reduciendo la coherencia entre las N señales usando N filtros diferentes puede hacerse de acuerdo con:
25
donde x es la señal original, y1 a yn son las señales de salida resultantes, a y b son los factores de ganancia que controlan la cantidad de coherencia y h1 a hn son los diferentes filtros de correlación. En un sentido más general, 30 uno puede escribir las señales de salida yi (i=1...I) como una combinación lineal de la señal de entrada x y la señal de entrada x filtrada mediante los filtros hn (j=1...N):
35 En este punto, la matriz de mezcla D determina las correlaciones mutuas y emite niveles de las señales de salida yi.
Para evitar cambios en el timbre, el filtro en cuestión debería ser preferentemente de carácter pasotodo. Un enfoque satisfactorio es usar filtros pasotodo similares a aquellos usados para procesos de reverberación artificial. Los algoritmos de reverberación artificial normalmente requieren una alta resolución de tiempo para proporcionar una 40 respuesta de impulso que es satisfactoriamente difusa en tiempo. Una manera de diseñar tales filtros de pasotodo es usar una secuencia de ruido aleatorio como respuesta de impulso. El filtro puede entonces implementarse fácilmente como un filtro FIR. Para conseguir un suficiente grado de independencia entre las salidas filtradas, la respuesta de impulso del filtro FIR debería ser relativamente larga, requiriendo por lo tanto una cantidad significativa de esfuerzo computacional para realizar la convolución. Un filtro IIR pasotodo se prefiere para ese fin. La estructura
45 IIR tiene varias ventajas cuando se trata de diseñar los filtros de decorrelación:
a) El decrecimiento exponencial natural que es común para toda la reverberación natural se desea para un filtro de decorrelación. Esto es una propiedad intrínseca de los filtros IIR.
50 b) Para respuestas de impulso de decrecimiento largas de un filtro IIR, el filtro FIR correspondiente es generalmente más caro en términos de complejidad y requiere más memoria.
Sin embargo, diseñar filtros IIR pasotodo es menos insignificante que el caso FIR donde cualquier secuencia de ruido aleatorio califica como un vector de coeficiente. Una restricción de diseño cuando se dirigen múltiples filtros de 55 decorrelación es también la capacidad requerida para conservar las mismas propiedades de decrecimiento para
todos los filtros mientras que se proporcionan salidas ortogonales (es decir, unas respuestas de impulso de filtro que obedecen a sustancialmente baja correlación de manera mutua) de cada salida de filtro. También como un requisito básico ha de conseguirse estabilidad.
5 La presente invención muestra un método novedoso para crear múltiples filtros pasotodo ortogonales por medio de una estructura de filtro IIR en celosía. Este enfoque tiene varias ventajas;
a) Complejidad inferior que los filtros FIR (dada la longitud requerida de las respuestas de impulso) b) Las restricciones de estabilidad pueden satisfacerse fácilmente, ya que esto se consigue automáticamente
10 cuando los valores absolutos de las magnitudes de todos los coeficientes de reflexión son menos de uno.
c) Pueden diseñarse múltiples filtros pasotodo ortogonales más fácilmente con las mismas propiedades de decrecimiento basándose en secuencias de ruido aleatorio.
15 d) Alta robustez frente a errores de cuantificación debido a efectos de longitud de palabra finita.
Aunque los coeficientes de reflexión del filtro IIR en celosía pueden basarse en secuencias de ruido aleatorio, para mejor rendimiento estos coeficientes deberían ordenarse también de maneras más sofisticadas o procesarse mediante métodos no aleatorios para conseguir suficiente ortogonalidad y otras propiedades importantes. Un
20 método sencillo es generar una multitud de vectores de coeficiente de reflexión aleatorios, seguido por una selección de un conjunto específico basándose en ciertos criterios, tales como una envolvente de decrecimiento común, minimización de todas las correlaciones de respuesta de impulso mutuas del conjunto seleccionado y similares.
Más específicamente, uno podría empezar con un gran conjunto de secuencias de ruido aleatorio. Cada una de
25 estas secuencias se usa como coeficientes de reflexión en la sección paso todo. Posteriormente, la respuesta de impulso de la sección pasotodo resultante se calcula para cada secuencia de ruido aleatorio. Finalmente, uno selecciona aquellas secuencias de ruido que proporcionan respuestas de impulso mutuamente decorrelacionadas.
Existen grandes ventajas al basar el algoritmo de decorrelación en un banco de filtros (complejo) tal como el banco
30 QMF con valor complejo. Este banco de filtros proporciona la flexibilidad para permitir las propiedades del decorrelador para que sea selectivo en frecuencia en términos de, por ejemplo, ecualización, tiempo de decrecimiento, densidad de impulso y timbre. Obsérvese que muchas de estas propiedades pueden alterarse mientras que se conserva la característica pasotodo. Existe mucho conocimiento relacionado con la percepción auditiva que guía el diseño de tal filtro IIR en celosía. Un aspecto importante es la longitud y forma de la envolvente de decrecimiento de
35 la respuesta de impulso. También la necesidad de un preretardo adicional, opcionalmente dependiente de la frecuencia, es importante ya que este influencia enormemente qué tipo de característica de filtro de peine se obtendrá cuando se mezcle la señal decorrelacionada con la original. Para suficiente densidad de impulso el ruido basado en coeficientes de reflexión en el filtro en celosía debería ser preferentemente diferente para los canales del banco de filtro diferentes. Para incluso mejor densidad de impulso pueden usarse aproximaciones de retardo
40 fraccionales en el banco de filtros.
La Figura 2 muestra una estructura de decodificación jerárquica para obtener una señal multicanal para una señal de submezcla monofónica transmitida mediante cajas estéreo paramétricas posteriores, usando una única señal decorrelacionada. Revisando brevemente el enfoque de la técnica anterior, debe de nuevo motivarse el problema
45 resuelto mediante la presente invención. El decodificador 110 de canal 1 a 3 mostrado en la Figura 2 comprende un decorrelador 112, un primer premezclador 114 estéreo paramétrico y un segundo premezclador 116 estéreo paramétrico.
Una señal de entrada 118 monofónica se introduce en el decorrelador 112 para obtener una señal de
50 correlacionada 120. Únicamente se obtiene una única señal decorrelacionada. El primer premezclador estéreo paramétrico recibe como una entrada la señal de submezcla 118 monofónica y la señal decorrelacionada 120. El primer premezclador 114 obtiene un canal central 122 y un canal combinado 124 mezclando la señal de submezcla 118 monofónica y la señal decorrelacionada 120 usando un parámetro de correlación 126, que dirige la mezcla de los canales.
55 El canal combinado 124 se introduce a continuación en el segundo premezclador 116 estéreo paramétrico, que crea el segundo nivel jerárquico del decodificador de audio. El segundo premezclador 116 estéreo paramétrico recibe adicionalmente la señal decorrelacionada 120 como una entrada y obtiene un canal izquierdo 128 y un canal derecho 130 mezclando el canal combinado 124 y la señal decorrelacionada 120.
60 Es principalmente factible generar un canal central 122 que se decorrelaciona perfectamente desde el canal combinado 124, cuando el decorrelador 112 puede obtener una señal decorrelacionada que es completamente ortogonal a la señal de submezcla 118 monofónica. Podría conseguirse decorrelación casi perfecta cuando la información de dirección 126 indica una premezcla, en la que cada canal premezclado tiene principalmente un componente de señal que proviene de la señal decorrelacionada 120 o desde la señal de submezcla 118 monofónica. Puesto que, sin embargo, la misma señal decorrelacionada 120 se usa a continuación para obtener el canal izquierdo 128 y el canal derecho 130, es evidente, que esto dará como resultado una correlación restante entre el canal central 122 y uno de los canales 128 o 130.
5 Esto se hace incluso más evidente cuando se examina el caso extremo en el que un canal izquierdo 128 completamente decorrelacionado y el canal derecho 130 deben obtenerse desde una señal decorrelacionada 120 que se supone que es perfectamente ortogonal a la señal de submezcla monofónica. La decorrelación perfecta entre el canal izquierdo 128 y el canal derecho 130 puede conseguirse, cuando el canal combinado 124 soporta
10 información en el canal de submezcla 118 monofónico únicamente, que significa simultáneamente que el canal central 122 está comprendido principalmente de la señal decorrelacionada 112. Por lo tanto, un canal izquierdo 128 decorrelacionado y el canal derecho 130 significaría que uno de los canales comprende principalmente la información sobre la señal decorrelacionada 120 y el otro canal comprendería principalmente la señal combinada 124, que entonces es idéntica a la señal submezcla 118 monofónica. Por lo tanto la única manera de que se de
15 correlacionen completamente los canales izquierdo o derecho fuerza una correlación casi perfecta entre el canal central 122 y uno de los canales 128 o 130.
Esta propiedad muy indeseada puede evitarse satisfactoriamente aplicando el concepto inventivo de generar señalesdecorrelacionadas diferentes y mutuamente ortogonales.
20 La Figura 3 muestra una realización de un decodificador de audio 400 multicanal inventivo que comprende una matriz de precorrelador 401, un decorrelador 402 y una matriz de mezcla 403. El decodificador inventivo 400 muestra una configuración 1 a 5, donde cinco canales de audio y un canal de mejora de baja frecuencia se obtienen desde una señal de submezcla 405 monofónica y de los datos de control espacial adicionales, tales como
25 parámetros de ICC o ICLD. Estos no se muestran en el dibujo principal en la Figura 3. La señal de submezcla 405 monofónica se introduce en la matriz de predecorrelador 401 que obtiene cuatro señales intermedias 406 que sirven como una entrada para el decorrelador 402, que comprende cuatro decorreladores inventivos h1h4. Estos suministran cuatro señales 408 mutuamente decorrelacionadas ortogonales en la salida del decorrelador 402.
30 La matriz de mezcla 403 recibe como una entrada las cuatro señales 408 mutuamente decorrelacionadas ortogonales y además una señal de submezcla 410 obtenida desde la señal de submezcla 405 monofónica mediante la matriz de predecorrelador 401.
La matriz de mezcla 403 combina la señal monofónica 410 y las cuatro señales decorrelacionadas 408 para
35 producir una señal de salida 412 5.1 que comprende un canal delanteroizquierdo 414a, un canal envolventeizquierdo 414b, un canal delanteroderecho 414c, un canal envolventederecho 414d, un canal central 414e y un canal de mejora de baja frecuencia 414f.
Es importante observar que la generación de cuatro señales 408 mutuamente decorrelacionadas ortogonales
40 posibilita la capacidad de obtener cinco canales de la señal de canal 5.1 que están al menos parcialmente decorrelacionados. En una realización preferida de la presente invención, estos son los canales 414a a 414e. El canal de mejora de baja frecuencia 414f comprende partes de baja frecuencia de la señal multicanal, que se combinan en un único canal de baja frecuencia para todos los canales envolventes 414a a 414e.
45 La Figura 4 muestra un decodificador inventivo 2 a 5 para obtener una señal envolvente de canal 5.1 desde dos señales transmitidas.
El decodificador de audio 500 multicanal comprende una matriz de predecorrelador 501, un decorrelador 502 y una matriz de mezcla 503. En la configuración 2 a 5, dos canales transmitidos, 505a y 505b se introducen en la
50 matriz de predecorrelador que obtiene un canal izquierdo intermedio 506a, un canal derecho intermedio 506b y un canal central intermedio 506c y dos canales intermedios 506d desde los canales presentados 505a y 505b, opcionalmente también usando datos de control adicionales tales como parámetros de ICC y ICLD.
Los canales intermedios 506d se usan como entrada para el decorrelador 502 que obtiene dos señales de
55 correlacionadas mutuamente ortogonales o casi ortogonales que se introducen en la matriz de mezcla 503 junto con el canal izquierdo intermedio 506a, el canal derecho intermedio 506b y el canal central intermedio 506c.
La matriz de mezcla 503 obtiene la señal de audio 508 de 5.1 canales final desde las señales anteriormente mencionadas, en las que los canales de audio finalmente obtenidos tienen las mismas propiedades ventajosas como
60 ya se han descrito para los canales obtenidos mediante el decodificador 400 de audio multicanal 1 a 5.
La Figura 5 muestra una realización adicional de la presente invención, que combina las características de los decodificadores de audio 400 y 500 multicanal. El decodificador de audio 600 multicanal comprende una matriz de predecorrelación 601, un decorrelador 602 y una matriz de mezcla 603. El decodificador de audio 600 multicanal es un dispositivo flexible que permite operar en diferentes modos dependiendo de la configuración de las señales de entrada 605 introducidas en el predecorrelador 601. En general, el predecorrelador obtiene señales intermedias 607 que sirven como entrada para el decorrelador 602 y que se transmiten y alteran parcialmente para crear parámetros de entrada 608. Los parámetros de entrada 608 son los parámetros introducidos en la matriz de mezcla
5 603 que obtiene configuraciones 610a o 610b de canal de salida que dependen de la configuración de canal de entrada.
En una configuración 1 a 5, una señal de submezcla y una señal residual opcional se suministran a la matriz de predecorrelador, que obtiene cuatro señales intermedias (e1 a e4) que se usan como una entrada del decorrelador,
10 que obtiene cuatro señales decorrelacionadas (d1 a d4) que forman los parámetros de entrada 608 junto con una señal transmitida directamente m obtenida desde la señal de entrada.
Puede observarse, que en el caso donde se suministre una señal residual adicional como entrada, el decorrelador 602 que es generalmente operativo en un dominio de subbanda, puede ser operativo para reenviar la señal residual
15 en lugar de obtener una señal decorrelacionada. Esto puede hacerse también de una manera selectiva para únicamente ciertas bandas de frecuencia.
En la configuración 2 a 5 las señales de entrada 605 comprenden un canal izquierdo, un canal derecho y opcionalmente una señal residual. En esa configuración, la matriz de predecorrelador obtiene un canal izquierdo, 20 uno derecho y un canal central y además dos canales intermedios (e1, e2). Por lo tanto, los parámetros de entrada a la matriz de mezcla 603 se forman mediante el canal izquierdo, el canal derecho, el canal central y dos señales decorrelacionadas (d1 y d2). En una modificación adicional, la matriz de predecorrelador puede obtener una señal intermedia adicional (e5) que se usa como una entrada para un decorrelador (D5) cuya salida es una combinación de la señal decorrelacionada (d5) obtenida desde la señal (e5) y las señales decorrelacionadas (d1 y d2). En este
25 caso, puede garantizarse una decorrelación adicional entre el canal central y el canal izquierdo y el derecho.
La Figura 6 muestra una realización adicional de la presente invención, en la que se combinan las señales decorrelacionadas con canales de audio individual después del proceso de premezcla. En esta realización alternativa, un canal de audio 620 monofónico se premezcla mediante un premezclador 624, en el que la premezcla puede 30 controlarse mediante datos 622 de control adicionales. Los canales de premezcla 630 comprenden cinco canales de audio que están correlacionados entre sí, y denominados comúnmente como canales secos. Los canales finales 632 pueden obtenerse combinando cuatro de los canales secos 630 con señales decorrelacionadas mutuamente ortogonales. Como resultado, es posible proporcionar cinco canales que están al menos parcialmente decorrelacionados entre sí. Con respecto a la Figura 3, esto puede observarse como un caso especial de una matriz de
35 mezcla.
La Figura 7 muestra un diagrama de bloques de un decorrelador 700 inventivo para proporcionar una señal decorrelacionada. El decorrelador 700 comprende una unidad de preretardo 702 y una unidad de decorrelación 704.
40 La señal de entrada 706 se introduce en la unidad de preretardo 702 para retardar la señal 706 durante un tiempo predeterminado. La salida de la unidad de preretardo 702 está conectada a la unidad de decorrelación 704 para obtener una señal decorrelacionada 708 como una salida del decorrelador 700.
En una realización preferida de la presente invención, la unidad de decorrelación 704 comprende un filtro pasotodo
45 IIR en celosía. En una variación opcional del decorrelador 700, los coeficientes de filtro (coeficientes de reflexión) se introducen en la unidad de decorrelación 704 por medio de un proveedor de coeficientes de filtro 710. Cuando el decorrelador 700 inventivo se opera en una subbanda de filtrado (por ejemplo, en un banco de filtros QMF), el índice de subbanda de la señal de subbanda actualmente procesada puede introducirse adicionalmente en la unidad de decorrelación 704. En ese caso, en una modificación adicional de la presente invención, diferentes coeficientes de
50 filtro de la unidad de decorrelación 704 pueden aplicarse o calcularse basándose en el índice de subbanda proporcionado.
La Figura 8 muestra un filtro de IIR en celosía como se usa preferentemente para generar las señales decorrelacionadas.
55 El filtro 800 de IIR mostrado en la Figura 8 recibe como una entrada una señal de audio 802 y obtiene como una salida 804 una versión decorrelacionada de la señal de entrada. Una gran ventaja usando un filtro en celosía IIR es que la respuesta de impulso de decrecimiento exponencial requerida para obtener una señal decorrelacionada apropiada proviene sin costes adicionales, puesto que esta es una propiedad intrínseca del filtro IIR en celosía. Se
60 ha de observar, que es necesario tener coeficientes de filtro k(0) a k(M1) cuyos valores absolutos son más pequeños que la unidad para conseguir la estabilidad requerida del filtro. Adicionalmente, pueden diseñarse múltiples filtros pasotodo ortogonales más fácilmente basándose en filtros IIR en celosía que es una principal ventaja para el concepto inventivo de obtener múltiples señales decorrelacionadas a partir de una única señal de entrada, en la que las diferentes señales decorrelacionadas obtenidas deben decorrelacionarse casi perfectamente u ortogonalizarse entre sí.
Pueden encontrarse más detalles sobre el diseño y las propiedades de los filtros en celosía pasotodo en “Adaptive Filter Theory”, Simon Haykin, ISBN 0130901261, PrenticeHall, 2002.
5 La Figura 9 muestra un receptor inventivo o reproductor de audio 900, que tiene un decodificador de audio 902 inventivo, una entrada 904 de flujo de bits y una salida de audio 906.
Un flujo de bits puede introducirse en la entrada 904 del receptor/reproductor de audio 900 inventivo. El flujo de bits
10 se decodifica a continuación mediante el decodificador 902 y la señal decodificada se emite o reproduce en la salida 906 del receptor/reproductor de audio 900 inventivo.
La Figura 10 muestra un sistema de transmisión que comprende un transmisor 908 y un receptor 900 inventivo.
15 La señal de audio introducida en una interfaz de entrada 910 del transmisor 908 se codifica y transfiere desde la salida del transmisor 908 a la entrada 904 del receptor 900. El receptor decodifica la señal de audio y reproduce o emite la señal de audio en su salida 906.
La presente invención se refiere a la codificación de representaciones multicanal de señales de audio que usan
20 parámetros espaciales. La presente invención enseña nuevos métodos para decorrelacionar señales para reducir la coherencia entre los canales de salida. No hace falta decir que aunque el nuevo concepto para crear múltiples señales decorrelacionadas es extremadamente ventajoso en un decodificador de audio inventivo, el concepto inventivo puede usarse también en cualquier otro campo técnico que requiera la generación eficaz de tales señales.
25 Aunque la presente invención se ha detallado en el decodificador de audio multicanal que realiza una premezcla en una única etapa de premezclado, la presente invención puede incorporarse por supuesto también en decodificadores de audio que están basados en una estructura de decodificación jerárquica, tal como por ejemplo se muestra en la Figura 2.
30 Aunque las realizaciones anteriormente descritas describen principalmente la obtención de señales decorrelacionadas a partir de una única señal de submezcla, no hace falta decir que puede usarse también más de un canal de audio como entrada para los decorreladores o la matriz de predecorrelación, es decir que la señal de submezcla puede comprender más de un canal de audio submezclado.
35 Adicionalmente, el número de señales decorrelacionadas obtenidas a partir de una única señal de entrada es básicamente ilimitado, puesto que el orden de filtro de los filtros en celosía puede variarse sin limitación y, puesto que es posible hallar un nuevo conjunto de coeficientes de filtro que obtengan una señal decorrelacionada que es ortogonal o principalmente ortogonal a otras señales en el conjunto.
40 Dependiendo de ciertos requisitos de implementación de los métodos inventivos, los métodos inventivos pueden implementarse en hardware o en software. La implementación puede realizarse usando un medio de almacenamiento digital, en particular un disco, DVD o un CD que tiene señales de control electrónicamente legibles almacenadas en el mismo, que cooperan con un sistema informático programable de manera que los métodos inventivos se realizan. En general, la presente invención es, por lo tanto, un producto de programa informático con
45 un código de programa almacenado en un soporte legible por máquina, siendo el código de programa operativo para realizar los métodos inventivos cuando el producto de programa informático se ejecuta en un ordenador. En otras palabras, los métodos inventivos son, por lo tanto, un programa informático que tiene un código de programa para realizar al menos uno de los métodos inventivos cuando el programa informático se ejecuta en un ordenador.
50 Se ha de entender que pueden realizarse diversos cambios al adaptar a las diferentes realizaciones sin alejarse de los conceptos más amplios desvelados en el presente documento y comprendidos mediante las reivindicaciones que siguen.
Claims (9)
-
imagen1 REIVINDICACIONES1. Decodificador de audio (400; 500; 600) multicanal para generar una reconstrucción de una señal multicanal (412; 508; 610a; 610b; 630) usando una señal de submezcla (405; 505a, b; 605; 620) obtenida desde una señal multi5 canal original, teniendo la reconstrucción de la señal multicanal (412; 508; 610a; 610b; 630) al menos tres canales, que comprende:un decorrelador (402; 502; 602; 700) para obtener un conjunto de señales decorrelacionadas usando una regla de decorrelación, en el que la regla de decorrelación es de manera que se obtiene una primera señal de10 correlacionada y una segunda señal decorrelacionada usando la señal de submezcla (405; 505a, b; 605; 620), y que la primera señal decorrelacionada y la segunda señal decorrelacionada son ortogonales entre sí en un intervalo de tolerancia de ortogonalidad, en el que la obtención de la primera y segunda señales decorrelacionadas comprende el filtrado de un canal de audio (406; 506; 607) extraído desde la señal de submezcla (405; 505a, b; 605; 620) por medio de uno o más filtros IIR pasotodo basándose en una estructura en15 celosía; y un calculador de canal de salida (403; 503; 603) para generar canales de salida usando la señal de submezcla (405; 505a, b; 605; 620), la primera y la segunda señales decorrelacionadas y la información de premezcla de modo que los al menos tres canales están al menos parcialmente decorrelacionados entre sí.- 20 2. Decodificador de audio (400; 500; 600) multicanal de acuerdo con la reivindicación 1 en el que la regla de decorrelación es de manera que el intervalo de tolerancia de ortogonalidad incluye valores de ortogonalidad <0,5 cuando un valor de ortogonalidad de 0 indica ortogonalidad perfecta y un valor de ortogonalidad de 1 indica correlación perfecta.
- 25 3. Decodificador de audio (400; 500; 600) multicanal de acuerdo con las reivindicaciones 1 a 2, en el que cada uno de dichos uno o más filtros (800) IIR tiene un primer sumador en una trayectoria de predicción directa del filtro para añadir una porción real del canal de audio y una porción anterior del canal de audio que está ponderada con un primer factor de ponderación; y un segundo sumador en una trayectoria de predicción hacia atrás para añadir la porción anterior del canal de audio a la porción real que está ponderada con un segundo factor de ponderación de la
30 señal de audio; y en el que los valores absolutos del primero y el segundo factores de ponderación son iguales. - 4. Decodificador de audio (400; 500; 600) multicanal de acuerdo con la reivindicación 3, en el que cada uno de dichos uno o más filtros (704; 800) IIR es operativo para usar un primer y un segundo factores de ponderación que se obtienen a partir de secuencias de ruido aleatorio.35
- 5. Decodificador de audio (400; 500; 600) multicanal de acuerdo con las reivindicaciones 1 a 4, en el que la regla de decorrelación es de manera que la primera señal decorrelacionada y la segunda señal decorrelacionada se obtienen usando una versión retardada en tiempo de la señal de submezcla (405; 505a, b; 605; 620).40 6. Decodificador de audio (400; 500; 600) multicanal de acuerdo con las reivindicaciones 1 a 5, operativo para obtener la primera y la segunda señales decorrelacionadas usando una porción de la señal de submezcla obtenida desde la señal de submezcla (405; 505a, b; 605; 620) mediante un banco de filtros con valores reales o complejos.
- 7. Decodificador de audio (400; 500; 600) multicanal de acuerdo con las reivindicaciones 1 a 6, en el que el45 calculador de canal de salida es operativo para generar cinco canales de salida desde una señal de submezcla (405; 505a, b; 605; 620) que tiene información sobre un canal de audio y desde cuatro señales decorrelacionadas.
- 8. Decodificador de audio (400; 500; 600) multicanal de acuerdo con las reivindicaciones 1 a 7, en el que elcalculador de canal de salida es operativo para generar cinco canales de salida desde la señal de submezcla (405; 50 505a, b; 605; 620) que tiene información sobre dos canales de audio y desde dos señales decorrelacionadas.
- 9. Decodificador de audio (400; 500; 600) multicanal de acuerdo con las reivindicaciones 1 a 8, en el que el calculador de canal de salida (403; 503; 603) es operativo para usar la información premezclada que comprende al menos un parámetro que indica una correlación deseada de un primer y un segundo canal de salida.55
- 10. Método para generar una reconstrucción de una señal de audio multicanal usando una señal de submezcla obtenida desde una señal multicanal original, teniendo la reconstrucción de la señal multicanal al menos tres canales, comprendiendo el método:60 obtener un conjunto de señales decorrelacionadas usando una regla de decorrelación, en el que la regla de decorrelación es de manera que la primera señal decorrelacionada y la segunda señal decorrelacionada se obtienen usando la señal de submezcla y que la primera señal decorrelacionada y la segunda señal decorrelacionada son ortogonales entre sí en un intervalo de tolerancia de ortogonalidad, en el que la obtención de la primera y segunda señales decorrelacionadas comprende el filtrado de un canal de audio (406; 506; 607)11
imagen2 extraído desde la señal de submezcla (405; 505a, b; 605; 620) por medio de uno o más filtros IIR pasotodo basándose en una estructura en celosía; y generar canales de salida usando la señal de submezcla, la primera y la segunda señales de decorrelación y la información de premezcla de modo que los al menos tres canales están al menos parcialmente de5 correlacionados entre sí. - 11. Receptor o reproductor de audio, teniendo el receptor o el reproductor de audio un decodificador multicanal (400; 500; 600) de acuerdo con la reivindicación 1.10 12. Método para recibir o reproducir audio, teniendo el método un método para generar una reconstrucción de una señal multicanal de acuerdo con la reivindicación 10.
- 13. Programa informático para realizar, cuando se ejecuta en un ordenador, un método de acuerdo con cualquierade las reivindicaciones del método 10 o 12. 1512
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0402649 | 2004-11-02 | ||
SE0402649A SE0402649D0 (sv) | 2004-11-02 | 2004-11-02 | Advanced methods of creating orthogonal signals |
PCT/EP2005/011664 WO2006048227A1 (en) | 2004-11-02 | 2005-10-31 | Multichannel audio signal decoding using de-correlated signals |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2544946T3 true ES2544946T3 (es) | 2015-09-07 |
Family
ID=33448765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES05807484.0T Active ES2544946T3 (es) | 2004-11-02 | 2005-10-31 | Decodificación de señal de audio multicanal usando señales de-correlacionadas |
Country Status (12)
Country | Link |
---|---|
US (1) | US8019350B2 (es) |
EP (1) | EP1808047B1 (es) |
JP (1) | JP4598830B2 (es) |
KR (1) | KR100903843B1 (es) |
CN (2) | CN101061751B (es) |
ES (1) | ES2544946T3 (es) |
HK (2) | HK1107739A1 (es) |
PL (1) | PL1808047T3 (es) |
RU (1) | RU2369982C2 (es) |
SE (1) | SE0402649D0 (es) |
TW (1) | TWI331321B (es) |
WO (1) | WO2006048227A1 (es) |
Families Citing this family (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE602005014288D1 (de) * | 2004-03-01 | 2009-06-10 | Dolby Lab Licensing Corp | Mehrkanalige Audiodekodierung |
ES2333137T3 (es) * | 2004-07-14 | 2010-02-17 | Koninklijke Philips Electronics N.V. | Conversion de canal de audio. |
KR100737386B1 (ko) | 2004-12-31 | 2007-07-09 | 한국전자통신연구원 | 공간정보기반 오디오 부호화를 위한 채널간 에너지비 추정및 양자화 방법 |
RU2416129C2 (ru) * | 2005-03-30 | 2011-04-10 | Конинклейке Филипс Электроникс Н.В. | Масштабируемое многоканальное кодирование звука |
US8626503B2 (en) * | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
ES2433316T3 (es) * | 2005-07-19 | 2013-12-10 | Koninklijke Philips N.V. | Generación de señales de audio de multiples canales |
KR101218776B1 (ko) | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
CN103366747B (zh) * | 2006-02-03 | 2017-05-17 | 韩国电子通信研究院 | 用于控制音频信号的渲染的设备和方法 |
EP1989920B1 (en) | 2006-02-21 | 2010-01-20 | Koninklijke Philips Electronics N.V. | Audio encoding and decoding |
PL1999997T3 (pl) * | 2006-03-28 | 2011-09-30 | Fraunhofer Ges Forschung | Udoskonalony sposób kształtowania sygnału podczas rekonstrukcji wielokanałowego sygnału audio |
US8488796B2 (en) * | 2006-08-08 | 2013-07-16 | Creative Technology Ltd | 3D audio renderer |
US20100241434A1 (en) * | 2007-02-20 | 2010-09-23 | Kojiro Ono | Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit |
DE102007018032B4 (de) * | 2007-04-17 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Erzeugung dekorrelierter Signale |
AU2008243406B2 (en) * | 2007-04-26 | 2011-08-25 | Dolby International Ab | Apparatus and method for synthesizing an output signal |
WO2009045649A1 (en) * | 2007-08-20 | 2009-04-09 | Neural Audio Corporation | Phase decorrelation for audio processing |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
AU2008344134B2 (en) * | 2007-12-31 | 2011-08-25 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
WO2009084920A1 (en) * | 2008-01-01 | 2009-07-09 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
US20100316230A1 (en) * | 2008-01-01 | 2010-12-16 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
WO2009084919A1 (en) | 2008-01-01 | 2009-07-09 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
TWI413109B (zh) | 2008-10-01 | 2013-10-21 | Dolby Lab Licensing Corp | 用於上混系統之解相關器 |
KR101600352B1 (ko) * | 2008-10-30 | 2016-03-07 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 장치 및 방법 |
EP2214162A1 (en) | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Upmixer, method and computer program for upmixing a downmix audio signal |
FR2954570B1 (fr) * | 2009-12-23 | 2012-06-08 | Arkamys | Procede de codage/decodage d'un flux numerique stereo ameliore et dispositif de codage/decodage associe |
WO2011083981A2 (en) * | 2010-01-06 | 2011-07-14 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
US9025776B2 (en) | 2010-02-01 | 2015-05-05 | Rensselaer Polytechnic Institute | Decorrelating audio signals for stereophonic and surround sound using coded and maximum-length-class sequences |
RU2683175C2 (ru) | 2010-04-09 | 2019-03-26 | Долби Интернешнл Аб | Стереофоническое кодирование на основе mdct с комплексным предсказанием |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
PT2609591T (pt) * | 2010-08-25 | 2016-07-12 | Fraunhofer Ges Forschung | Aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida |
CN102802112B (zh) * | 2011-05-24 | 2014-08-13 | 鸿富锦精密工业(深圳)有限公司 | 具有音频文件格式转换功能的电子装置 |
US9059786B2 (en) * | 2011-07-07 | 2015-06-16 | Vecima Networks Inc. | Ingress suppression for communication systems |
CN102364885B (zh) * | 2011-10-11 | 2014-02-05 | 宁波大学 | 一种基于信号频谱包络的频谱感知方法 |
ITTO20120067A1 (it) * | 2012-01-26 | 2013-07-27 | Inst Rundfunktechnik Gmbh | Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal. |
CN105229730A (zh) * | 2012-11-09 | 2016-01-06 | 斯托明瑞士有限责任公司 | 多信道信号的非线性逆编码 |
WO2014126688A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
CN104981867B (zh) * | 2013-02-14 | 2018-03-30 | 杜比实验室特许公司 | 用于控制上混音频信号的通道间相干性的方法 |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
TWI618051B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
US9478224B2 (en) * | 2013-04-05 | 2016-10-25 | Dolby International Ab | Audio processing system |
US20150036826A1 (en) * | 2013-05-08 | 2015-02-05 | Max Sound Corporation | Stereo expander method |
US20140362996A1 (en) * | 2013-05-08 | 2014-12-11 | Max Sound Corporation | Stereo soundfield expander |
US20150036828A1 (en) * | 2013-05-08 | 2015-02-05 | Max Sound Corporation | Internet audio software method |
EP3005352B1 (en) | 2013-05-24 | 2017-03-29 | Dolby International AB | Audio object encoding and decoding |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830050A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhanced spatial audio object coding |
EP2830049A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
EP2830334A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals |
CN105612766B (zh) | 2013-07-22 | 2018-07-27 | 弗劳恩霍夫应用研究促进协会 | 使用渲染音频信号的解相关的多声道音频解码器、多声道音频编码器、方法、以及计算机可读介质 |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
JP6212645B2 (ja) | 2013-09-12 | 2017-10-11 | ドルビー・インターナショナル・アーベー | オーディオ・デコード・システムおよびオーディオ・エンコード・システム |
CN105556597B (zh) * | 2013-09-12 | 2019-10-29 | 杜比国际公司 | 多声道音频内容的编码和解码 |
KR102741608B1 (ko) | 2013-10-21 | 2024-12-16 | 돌비 인터네셔널 에이비 | 오디오 신호들의 파라메트릭 재구성 |
WO2015059152A1 (en) | 2013-10-21 | 2015-04-30 | Dolby International Ab | Decorrelator structure for parametric reconstruction of audio signals |
KR102144332B1 (ko) * | 2014-07-01 | 2020-08-13 | 한국전자통신연구원 | 다채널 오디오 신호 처리 방법 및 장치 |
US9380387B2 (en) | 2014-08-01 | 2016-06-28 | Klipsch Group, Inc. | Phase independent surround speaker |
WO2016066743A1 (en) * | 2014-10-31 | 2016-05-06 | Dolby International Ab | Parametric encoding and decoding of multichannel audio signals |
TWI587286B (zh) * | 2014-10-31 | 2017-06-11 | 杜比國際公司 | 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體 |
ES2938244T3 (es) | 2016-11-08 | 2023-04-05 | Fraunhofer Ges Forschung | Aparato y procedimiento para codificar o decodificar una señal multicanal usando una ganancia lateral y una ganancia residual |
US10560661B2 (en) | 2017-03-16 | 2020-02-11 | Dolby Laboratories Licensing Corporation | Detecting and mitigating audio-visual incongruence |
CN110998721B (zh) * | 2017-07-28 | 2024-04-26 | 弗劳恩霍夫应用研究促进协会 | 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置 |
EP4488998A3 (en) * | 2021-03-11 | 2025-01-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decorrelator, processing system and method for decorrelating an audio signal |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5278909A (en) | 1992-06-08 | 1994-01-11 | International Business Machines Corporation | System and method for stereo digital audio compression with co-channel steering |
DE4236989C2 (de) | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
DE4409368A1 (de) | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
JP2766466B2 (ja) * | 1995-08-02 | 1998-06-18 | 株式会社東芝 | オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法 |
ATE218267T1 (de) | 1997-11-14 | 2002-06-15 | Waves Usa Inc W | Stereo zu raumklang nachverstärkung- schalldekodierungsschaltung |
JP3356165B2 (ja) * | 1998-11-16 | 2002-12-09 | 日本ビクター株式会社 | 音声符号化装置 |
JP2000214887A (ja) * | 1998-11-16 | 2000-08-04 | Victor Co Of Japan Ltd | 音声符号化装置、光記録媒体、音声復号装置、音声伝送方法及び伝送媒体 |
EP2339756A3 (en) * | 1999-04-07 | 2011-12-21 | Dolby Laboratories Licensing Corporation | Matrix improvements to lossless encoding and decoding |
US6438518B1 (en) | 1999-10-28 | 2002-08-20 | Qualcomm Incorporated | Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions |
US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
JP2002175097A (ja) | 2000-12-06 | 2002-06-21 | Yamaha Corp | 音声信号のエンコード/圧縮装置およびデコード/伸長装置 |
US7272555B2 (en) * | 2001-09-13 | 2007-09-18 | Industrial Technology Research Institute | Fine granularity scalability speech coding for multi-pulses CELP-based algorithm |
CN1471236A (zh) * | 2003-07-01 | 2004-01-28 | 北京阜国数字技术有限公司 | 用于感知音频编码的信号自适应多分辨率滤波器组 |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
-
2004
- 2004-11-02 SE SE0402649A patent/SE0402649D0/xx unknown
-
2005
- 2005-10-31 CN CN2005800225038A patent/CN101061751B/zh active Active
- 2005-10-31 WO PCT/EP2005/011664 patent/WO2006048227A1/en active Application Filing
- 2005-10-31 EP EP05807484.0A patent/EP1808047B1/en active Active
- 2005-10-31 PL PL05807484T patent/PL1808047T3/pl unknown
- 2005-10-31 RU RU2006146685/09A patent/RU2369982C2/ru active
- 2005-10-31 CN CN2010102251133A patent/CN101930740B/zh active Active
- 2005-10-31 KR KR1020077001638A patent/KR100903843B1/ko active IP Right Grant
- 2005-10-31 JP JP2007536127A patent/JP4598830B2/ja active Active
- 2005-10-31 ES ES05807484.0T patent/ES2544946T3/es active Active
- 2005-11-01 TW TW094138332A patent/TWI331321B/zh active
- 2005-11-29 US US11/291,009 patent/US8019350B2/en active Active
-
2007
- 2007-12-07 HK HK07113399.3A patent/HK1107739A1/xx unknown
-
2011
- 2011-06-29 HK HK11106683.6A patent/HK1152789A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
TW200630959A (en) | 2006-09-01 |
HK1152789A1 (en) | 2012-03-09 |
RU2006146685A (ru) | 2008-07-10 |
US20060165184A1 (en) | 2006-07-27 |
HK1107739A1 (en) | 2008-04-11 |
EP1808047B1 (en) | 2015-06-17 |
JP4598830B2 (ja) | 2010-12-15 |
CN101930740B (zh) | 2012-05-30 |
CN101061751A (zh) | 2007-10-24 |
KR100903843B1 (ko) | 2009-06-25 |
KR20070041724A (ko) | 2007-04-19 |
CN101061751B (zh) | 2013-06-19 |
TWI331321B (en) | 2010-10-01 |
US8019350B2 (en) | 2011-09-13 |
CN101930740A (zh) | 2010-12-29 |
EP1808047A1 (en) | 2007-07-18 |
SE0402649D0 (sv) | 2004-11-02 |
WO2006048227A1 (en) | 2006-05-11 |
RU2369982C2 (ru) | 2009-10-10 |
JP2008516290A (ja) | 2008-05-15 |
PL1808047T3 (pl) | 2015-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2544946T3 (es) | Decodificación de señal de audio multicanal usando señales de-correlacionadas | |
ES2362920T3 (es) | Método mejorado para la conformación de señales en reconstrucción de audio multicanal. | |
ES2623365T3 (es) | Compactación de información secundaria para la codificación paramétrica de audio espacial | |
RU2509442C2 (ru) | Способ и устройство для применения реверберации к многоканальному звуковому сигналу с использованием параметров пространственных меток | |
ES2317297T3 (es) | Conformacion de envolvente de sonido difuso para esquemas de codificacion de indicacion binaural y similares. | |
EP1999744B1 (en) | Reduced number of channels decoding | |
JP4856653B2 (ja) | 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング | |
CN1910655B (zh) | 构造多通道输出信号或生成下混信号的设备和方法 | |
ES2682073T3 (es) | Codificación conjunta paramétrica de fuentes de audio | |
TWI427621B (zh) | 編碼聲音通道及解碼經傳輸之聲音通道之方法、裝置及機器可讀取媒體 | |
ES2387256T3 (es) | Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio | |
CN103620677B (zh) | 音频信号帧中事件时隙位置的编码与译码技术 | |
JP5490143B2 (ja) | ダウンミックスオーディオ信号をアップミックスするためのアップミキサー、方法、および、コンピュータ・プログラム | |
PT1774515E (pt) | Aparelho e processo para gerar um sinal de saída multicanal | |
ES2691546T3 (es) | Aparato y procedimiento para la codificación de objetos de audio espacial que emplea objetos ocultos para la manipulación de mezclas de señales | |
TWI458365B (zh) | 用以產生電平參數之裝置及方法、用以產生多聲道表示之裝置及方法以及儲存參數表示之儲存媒體 | |
RU2406262C2 (ru) | Декодирование уменьшенного количества каналов | |
BRPI0518507B1 (pt) | Informações auxiliares compactas para a codificação paramétrica de áudio espacial |