[go: up one dir, main page]

ES2935637T3 - Reconstrucción de alta frecuencia de una señal de audio de entrada usando bancos de filtros en cascada - Google Patents

Reconstrucción de alta frecuencia de una señal de audio de entrada usando bancos de filtros en cascada Download PDF

Info

Publication number
ES2935637T3
ES2935637T3 ES19179788T ES19179788T ES2935637T3 ES 2935637 T3 ES2935637 T3 ES 2935637T3 ES 19179788 T ES19179788 T ES 19179788T ES 19179788 T ES19179788 T ES 19179788T ES 2935637 T3 ES2935637 T3 ES 2935637T3
Authority
ES
Spain
Prior art keywords
filterbank
subband
filter bank
analysis
synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19179788T
Other languages
English (en)
Inventor
Lars Villemoes
Per Ekstrand
Sascha Disch
Frederik Nagel
Stephan Wilde
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Dolby International AB
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV, Dolby International AB filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2935637T3 publication Critical patent/ES2935637T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Auxiliary Devices For Music (AREA)
  • Networks Using Active Elements (AREA)

Abstract

Un aparato para procesar una señal de audio de entrada (2300) se basa en una cascada de bancos de filtros, la cascada comprende un banco de filtros de síntesis (2304) para sintetizar una señal intermedia de audio (2306) a partir de la señal de audio de entrada (2300), siendo la señal de audio de entrada representado por una pluralidad de primeras señales de subbanda (2303) generadas por un banco de filtros de análisis (2302), en el que un número de canales del banco de filtros del banco de filtros de síntesis (2304) es menor que un número de canales del banco de filtros de análisis (2302). El aparato comprende además un banco de filtros de análisis adicional (2307) para generar una pluralidad de señales de segunda subbanda (2308) a partir de la señal intermedia de audio (2306), en el que el banco de filtros de análisis adicional tiene un número de canales que es diferente del número de canales del banco de filtros de síntesis (2304), (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Reconstrucción de alta frecuencia de una señal de audio de entrada usando bancos de filtros en cascada CAMPO TÉCNICO
[0001] La presente invención se refiere a sistemas de codificación de fuentes de audio que hacen uso de un procedimiento de transposición armónica para la reconstrucción de alta frecuencia (HFR, por sus siglas en inglés).
ANTECEDENTES DE LA INVENCIÓN
[0002] En el documento PCT WO 98/57436, se estableció el concepto de transposición como procedimiento para recrear una banda de alta frecuencia a partir de una banda de frecuencia más baja de una señal de audio. Se puede obtener un ahorro sustancial de la velocidad de transmisión de bits usando este concepto en la codificación de audio. En un sistema de codificación de audio basado en HFR, se procesa una señal de bajo ancho de banda mediante un codificador por núcleo de forma de onda y se regeneran las frecuencias más altas usando transposición e información colateral adicional de muy baja velocidad de transmisión de bits que describe la forma espectral diana del lado del decodificador. En el caso de bajas velocidades de transmisión de bits, donde el ancho de banda de la señal codificada por núcleo es reducido, resulta cada vez más importante recrear una banda alta con características perceptualmente agradables. La transposición armónica definida en el documento PCT WO 98/57436 funciona muy bien en el caso del material musical complejo en una situación de baja frecuencia de cruce. El principio de una transposición armónica es que se mapea una sinusoide con frecuencia w contra una sinusoide con frecuencia Tw donde T > 1 es un número entero que define el orden de transposición. En contraste con esto, un procedimiento de HFR basado en modulación de banda lateral única (SSB, por sus siglas en inglés) mapea una sinusoide con frecuencia w contra una sinusoide con frecuencia w + Aw donde Aw es un desplazamiento de frecuencia fijo. Dada una señal de núcleo con bajo ancho de banda, se puede producir un artefacto de sonido disonante como resultado de la transposición de SSB.
[0003] Con el fin de obtener la mejor calidad de audio posible, los procedimientos de HFR de alta calidad armónica del estado de la técnica emplean complejos bancos de filtros modulados, por ejemplo, una transformada de Fourier a corto plazo (STFT, por sus siglas en inglés), con una resolución de alta frecuencia y un alto grado de sobremuestreo para lograr la calidad de audio requerida. La resolución fina es necesaria para evitar la distorsión de intermodulación no deseada que surge del procesamiento no lineal de sumas de sinusoides. Con una resolución de frecuencia suficientemente alta, es decir, subbandas estrechas, los procedimientos de alta calidad apuntan a contar con el máximo de una sinusoide en cada subbanda. Es necesario un alto grado de sobremuestreo en el tiempo para evitar la distorsión del tipo alias y es necesario un cierto grado de sobremuestreo en la frecuencia para evitar los ecos previos de las señales transitorias. El inconveniente obvio es que la complejidad informática puede llegar a ser alta.
[0004] La transposición armónica basada en bloques de subbandas es otro procedimiento de HFR usado para suprimir los productos de intermodulación, en cuyo caso se emplea un banco de filtros con una resolución de frecuencia más gruesa y un menor grado de sobremuestreo, por ejemplo, un banco QMF multicanal. En este procedimiento, un bloque de tiempo de muestras de subbandas complejas es procesado por un modificador de fase común mientras que la superposición de varias muestras modificadas forma una muestra de subbanda de salida. Esto tiene el claro efecto de suprimir los productos de intermodulación que, de lo contrario, aparecerían cuando la señal de subbanda de entrada consiste en varias sinusoides. La transposición basada en el procesamiento de subbandas basado en bloques tiene una complejidad informática mucho más baja que los transpondedores de alta calidad y obtiene casi la misma calidad de muchas señales. Sin embargo, la complejidad es aún mucho más alta que en los procedimientos de HFR basados en SSB triviales, ya que se necesita una pluralidad de bancos de filtros de análisis, cada uno procesando señales de diferentes órdenes de transposición T, en una aplicación típica de HFR con el fin de sintetizar el ancho de bando requerido. De manera adicional, una estrategia común es adaptar la tasa de muestreo de las señales de entrada para ajustarse a los bancos de filtros de análisis de un tamaño constante, aunque los bancos de filtros procesan señales de diferentes órdenes de transposición. También es común aplicar filtros pasabanda a las señales de entrada con el fin de obtener señales de salida, procesadas a partir de diferentes órdenes de transposición, con densidades espectrales de potencia no superpuesta.
[0005] El almacenamiento o transmisión de señales de audio está sujeto a menudo a estrictas restricciones de velocidad de transmisión de bits. En el pasado, los codificadores se veían obligados a reducir drásticamente el ancho de banda de audio transmitido cuando solo se disponía de una velocidad de transmisión de bits muy baja. Los códecs de audio modernos hoy en día pueden codificar señales de banda ancha usando procedimientos de extensión de ancho de banda (BWE, por sus siglas en inglés) [1-12]. Estos algoritmos se basan en una representación paramétrica del contenido de alta frecuencia (HF, por sus siglas en inglés) que se genera desde la parte de baja frecuencia (LF, por sus siglas en inglés) de la señal decodificada por medio de una transposición en la región espectral de HF ("parcheo") y una aplicación de un procesamiento posterior regido por parámetros. La parte de LF es codificada con cualquier codificador de audio o voz. Por ejemplo, los procedimientos de extensión de ancho de banda descritos en [1-4] se basan en modulación de banda lateral única (SSB), con frecuencia denominado también procedimiento de "copiado" para generar múltiples parches de HF.
[0006] Últimamente, se ha presentado un nuevo algoritmo que emplea un banco de vocodificadores de fase [15-17] para la generación de diferentes parches [13] (véase la Fig. 20). Este procedimiento se ha desarrollado para evitar la aspereza auditiva que a menudo se observa en las señales sometidas a una extensión de ancho de banda SSB. Sin embargo, puesto que el algoritmo de BWE se realiza en el lado del decodificador de una cadena de códecs, la complejidad informática constituye un grave problema. Los procedimientos del estado de la técnica, especialmente la HBE basada en vocodificadores de fase, se realizan a expensas de una complejidad informática muy incrementada en comparación con los procedimientos basados en SSB.
[0007] Como se ha señalado anteriormente, los esquemas existentes de extensión de ancho de banda aplican solamente un procedimiento de parcheo en un bloque de señales dado a la vez, ya sea el parcheo basado en s Sb [1­ 4] o el parcheo basado en vocodificadores de HBE [15-17]. De manera adicional, los codificadores de audio modernos [19-20] ofrecen la posibilidad de conmutar el procedimiento de parcheo globalmente basándose en bloques de tiempo entre esquemas de parcheo alternativos.
[0008] El parcheo de copiado de SSB introduce aspereza no deseada en la señal de audio, aunque es sencillo desde el punto de vista informático y conserva la envolvente temporal de los transitorios. Por otra parte, la complejidad informática se incrementa significativamente con respecto al procedimiento de copiado de SSB que es muy sencillo desde el punto de vista informático.
[0009] El documento EP 1940023 A2 describe un banco de filtros digitales que pueden conectarse en cascada. También se refiere a un circuito de recepción que comprende dicho banco de filtros en cascada. Con el filtro digital siendo muestreado a una frecuencia de muestreo dada Fs, el banco de filtros digitales en cascada tiene: en la entrada, un circuito de transposición de frecuencia con respecto a la señal digital. Un filtro polifásico recibe como entrada la señal digital transpuesta en frecuencia sincronizada con la frecuencia de muestreo Fs. El filtro polifásico tiene un filtro FFT que tiene un número N de puntos. La salida del dispositivo de filtrado retiene un número determinado de salidas del filtro FFT por lo que la velocidad de transmisión de bits de información en la salida del dispositivo es igual a la velocidad de transmisión de bits de información en la entrada. El banco de filtros digitales es particularmente aplicable a los receptores de señales de radar de tipo heterodino.
RESUMEN DE LA INVENCIÓN
[0010] En lo que respecta a una reducción de la complejidad, son de particular importancia las tasas de muestreo. Esto se debe al hecho de que una alta tasa de muestreo representa una alta complejidad y una baja tasa de muestreo generalmente representa una baja complejidad debido al número reducido de operaciones necesarias. Por otro lado, sin embargo, la situación en aplicaciones de extensión de ancho de banda es particularmente tal que la tasa de muestreo de la señal de salida del codificador por núcleo será normalmente tan baja que esta tasa de muestreo es demasiado baja para una señal de ancho de banda completo. Dicho de otra manera, cuando la tasa de muestreo de la señal de salida del decodificador es, por ejemplo, 2 o 2,5 veces la frecuencia máxima de la señal de salida del codificador por núcleo, entonces una extensión de ancho de banda de, por ejemplo, un factor de 2 significa que es necesaria una operación de aumento de la frecuencia de muestreo para que la tasa de muestreo de la señal de ancho de banda extendido sea tan alta que el muestreo pueda "cubrir" los componentes de alta frecuencia generados adicionalmente.
[0011] De manera adicional, los bancos de filtros tales como bancos de filtros de análisis y bancos de filtros de síntesis se ocupan de una cantidad considerable de operaciones de procesamiento. Por consiguiente, el tamaño de los bancos de filtros, es decir, si el banco de filtros es un banco de filtros de 32 canales, un banco de filtros de 64 canales o incluso un banco de filtros con un mayor número de canales, influirá significativamente en la complejidad del algoritmo de procesamiento de audio. En general, se puede decir un número elevado de canales de banco de filtros requiere más operaciones de procesamiento y, por lo tanto, una mayor complejidad que un pequeño número de canales de banco de filtros. Habida cuenta de ello, en aplicaciones de extensión de ancho de banda y también en otras aplicaciones de procesamiento de audio donde diferentes tasas de muestreo suponen un problema, como en aplicaciones de tipo vocodificador o cualquier otra aplicación de efectos de audio, existe una interdependencia específica entre complejidad y tasa de muestreo o ancho de banda de audio, lo que significa que las operaciones de aumento de la frecuencia de muestreo o filtrado en subbandas pueden aumentar drásticamente la complejidad sin influir específicamente en la calidad del audio en el buen sentido cuando se eligen herramientas o algoritmos inadecuados para las operaciones específicas.
[0012] Un objeto de la presente invención es proporcionar un concepto de procesamiento de audio mejorado, que, por un lado, permite el procesamiento con baja complejidad y, por el otro lado, una buena calidad de audio.
[0013] Este objeto se logra mediante un aparato para realizar una reconstrucción de alta frecuencia (HFR) de una señal de audio de entrada de acuerdo con la reivindicación 1, un procedimiento para realizar una reconstrucción de alta frecuencia (HFR) de una señal de audio de entrada de acuerdo con la reivindicación 2, o un programa informático de acuerdo con la reivindicación 3.
[0014] Las realizaciones de la presente invención se basan en una colocación específica en cascada de bancos de filtros de análisis y/o de síntesis con el fin de obtener un remuestreo de baja complejidad sin sacrificar la calidad del audio. En una realización, un aparato para procesar una señal de audio de entrada comprende un banco de filtros de síntesis para sintetizar una señal de audio intermedia a partir de la señal de audio de entrada, donde la señal de audio de entrada está representada por una pluralidad de primeras señales de subbanda generadas por un banco de filtros de análisis colocado en la dirección de procesamiento antes del banco de filtros de síntesis, donde un número de canales de banco de filtros del banco de filtros de síntesis es inferior a un número de canales del banco de filtros de análisis. La señal intermedia es procesada adicionalmente por un banco de filtros de análisis adicional para generar una pluralidad de segundas señales de subbanda a partir de la señal de audio intermedia, donde el banco de filtros de análisis adicional tiene un número de canales que es diferente del número de canales del banco de filtros de síntesis por lo que la tasa de muestreo de una señal de subbanda de la pluralidad de señales de subbanda es diferente de una tasa de muestreo de una primera señal de subbanda de la pluralidad de primeras señales de subbanda generadas por el banco de filtros de análisis.
[0015] La cascada de un banco de filtros de síntesis y un banco de filtros de análisis adicional conectado posteriormente proporciona una conversión de la tasa de muestreo y, de manera adicional, una modulación de la porción de ancho de banda de la señal de entrada de audio original que ha sido introducida en el banco de filtros de síntesis en una banda base. Esta señal intermedia en tiempo, que ahora ha sido extraída de la señal de audio de entrada original que puede ser, por ejemplo, la señal de salida de un decodificador por núcleo de un esquema de extensión de ancho de banda, ahora está representada preferentemente como una señal fundamentalmente muestreada modulada a la banda base y se ha descubierto que esta representación, es decir, la señal de salida remuestreada, al ser procesada por un banco de filtros de análisis adicional para obtener una representación de subbandas permite un procesamiento con baja complejidad de operaciones de procesamiento adicionales que pueden o no producirse y que, por ejemplo, pueden ser operaciones de procesamiento relacionadas con la extensión del ancho de banda tales como operaciones de subbanda no lineal seguidas por el procesamiento de reconstrucción de alta frecuencia y por una fusión de las subbandas en el banco de filtros de síntesis final.
[0016] La presente solicitud proporciona diferentes aspectos de los aparatos, procedimientos o programas informáticos para el procesamiento de señales de audio en el contexto de la extensión del ancho de banda y en el contexto de otras aplicaciones de audio que no están relacionadas con la extensión del ancho de banda. Las características de los aspectos individuales descritos y reivindicados posteriormente se pueden combinar parcial o totalmente, pero también pueden usarse de forma independiente entre sí, puesto que los aspectos individuales ya proporcionan ventajas con respecto a la calidad perceptual, a la complejidad informática y a los recursos de procesador/memoria cuando se implementan en un sistema informático o en un microprocesador.
[0017] Las realizaciones proporcionan un procedimiento para reducir la complejidad informática de un procedimiento de HFR armónica a base de bloques de subbandas por medio de un filtrado eficiente y conversión de la tasa de muestreo de las señales de entrada a las etapas de análisis de los bancos de filtros de h Fr . Además, se puede demostrar que los filtros pasabanda aplicados a las señales de entrada son obsoletos en un transpondedor basado en bloques de subbandas.
[0018] Las presentes realizaciones contribuyen a reducir la complejidad informática de la transposición armónica basada en bloques de subbandas mediante la implementación eficiente de varios órdenes de transposición basada en bloques de subbandas en el marco de referencia de un solo par de bancos de filtros de análisis y de síntesis. Dependiendo del compromiso de calidad perceptual con respecto a la complejidad informática, solo se puede realizar un subconjunto adecuado de órdenes o todos los órdenes de transposición de manera conjunta dentro de un par de bancos de filtros. Es más, hay un esquema de transposición combinada donde solo se calculan directamente ciertos órdenes de transposición, mientras que el resto del ancho de banda se llena con replicación de órdenes de transposición disponibles, es decir, calculados anteriormente (por ejemplo, 2° orden) y/o el ancho de banda codificado por núcleo. En este caso, el parcheo puede ser llevado a cabo usando cada combinación concebible de rangos de fuente disponibles para replicación.
[0019] De manera adicional, las realizaciones proporcionan un procedimiento para mejorar tanto procedimientos de HFR armónica de alta calidad como procedimientos de HFR armónica a base de bloques de subbandas por medio de alineación espectral de herramientas de HFR. En particular, se consigue un rendimiento mejorado alineando los bordes espectrales de las señales generadas por HFR con los bordes espectrales de la tabla de frecuencias de ajuste de envolvente. Además, los bordes espectrales de la herramienta limitadora se alinean por el mismo principio con los bordes espectrales de las señales generadas por HFR.
[0020] Realizaciones adicionales están configuradas para mejorar la calidad perceptual de los transitorios y, al mismo tiempo, reducir la complejidad informática, por ejemplo, mediante la aplicación de un esquema de parcheo que aplica un parcheo mixto que consiste en el parcheo armónico y el parcheo de copiado.
[0021] En las realizaciones específicas, los bancos de filtros individuales de la estructura de bancos de filtros en cascada son bancos de filtros espejo en cuadratura (QMF, por sus siglas en inglés), todos los cuales se basan en un filtro prototipo de paso bajo o modulados en ventanas usando un conjunto de frecuencias de modulación que definen las frecuencias centrales de los canales de banco de filtros. Preferentemente, todas las funciones de ventana o filtros prototipo dependen entre sí de tal manera que los filtros de los bancos de filtros con diferentes tamaños (canales de banco de filtros) también dependen entre sí. Preferentemente, el banco de filtros de mayor tamaño de una estructura de bancos de filtros en cascada que comprende, en las realizaciones, un primer banco de filtros de análisis, un banco de filtros conectado posteriormente, un banco de filtros de análisis adicional y, en algún estado posterior del procesamiento, un banco de filtros de síntesis final, tiene una respuesta a la función de ventana o filtros prototipo con un cierto número de coeficientes de función de ventana o filtros prototipo. Los bancos de filtros de menor tamaño son, en todos los casos, una versión submuestreada de esta función de ventana, lo que significa que las funciones de ventana de los otros bancos de filtros son versiones submuestreadas de la función de ventana "grande". Por ejemplo, si un banco de filtros tiene la mitad del tamaño de un banco de filtros de gran tamaño, entonces la función de ventana tiene la mitad del número de coeficientes y los coeficientes de los bancos de filtros de menor tamaño se derivan por submuestreo. En esta situación, el submuestreo significa que, por ejemplo, se toma uno de cada dos coeficientes de filtro del banco de filtros más pequeño que tiene la mitad del tamaño. Sin embargo, cuando hay otras relaciones entre los tamaños de los bancos de filtros que no son valores de números enteros, luego se realiza un cierto tipo de interpolación de los coeficientes de ventana, por lo que, en definitiva, la ventana del banco de filtros de menor tamaño es, una vez más, una versión submuestreada de la ventana del banco de filtros de mayor tamaño.
[0022] Las realizaciones de la presente invención son particularmente útiles en situaciones donde solo se necesita una porción de la señal de audio de entrada para el procesamiento posterior, y esta situación se produce particularmente en el contexto de la extensión armónica del ancho de banda. En este contexto, resultan particularmente preferidas las operaciones de procesamiento tipo vocodificador.
[0023] Una ventaja de las realizaciones es que las realizaciones proporcionan una menor complejidad de un transpondedor de QMF por medio de operaciones eficientes en el dominio del tiempo y en la frecuencia y una calidad de audio mejorada para la replicación armónica de bandas espectrales basada en QMF y DFT usando alineación espectral.
[0024] Las realizaciones se refieren a sistemas de codificación de fuente de audio que emplean, por ejemplo, un procedimiento de transposición armónica a base de bloques de subbandas para la reconstrucción de alta frecuencia (HFR), y a procesadores de efectos digitales, por ejemplo, los denominados excitadores, donde la generación de distorsión armónica aporta nitidez a la señal procesada, y también a dilatadores del tiempo, donde la duración de la señal se extiende mientras mantiene el contenido espectral de la original. Las realizaciones proporcionan un procedimiento para reducir la complejidad informática de un procedimiento de HFR armónica a base de bloques de subbandas por medio del filtrado eficiente y la conversión de la tasa de muestreo de las señales de entrada antes de las etapas de análisis del banco de filtros de HFR. Además, las realizaciones muestran que los filtros pasabanda convencionales aplicados a las señales de entrada son obsoletos en un sistema de HFR a base de bloques de subbandas. De manera adicional, los ejemplos proporcionan un procedimiento para mejorar tanto los procedimientos de HFR armónica de alta calidad como los procedimientos de HFR armónica a base de bloques de subbandas por medio de la alineación espectral de las herramientas de HFR. En particular, los ejemplos enseñan cómo se consigue un rendimiento mejorado mediante la alineación de los bordes espectrales de las señales generadas por HFR con los bordes espectrales de la tabla de frecuencias de ajuste de envolvente. Además, los bordes espectrales de la herramienta limitadora se alinean por el mismo principio con los bordes espectrales de las señales generadas por HFR.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
[0025] La presente invención se describirá ahora a modo de ejemplos ilustrativos, que no limitan el alcance de la invención, con referencia a los dibujos adjuntos, en los que:
La Fig. 1 ilustra la operación de un transpondedor basado en bloques que usa los órdenes de transposición de 2, 3 y 4 en un marco de referencia de decodificador potenciado por HFR;
La Fig. 2 ilustra la operación de las unidades de estiramiento de subbandas no lineales de la Fig. 1;
La Fig. 3 ilustra una implementación eficiente del transpondedor basado en bloques de la Fig. 1, donde los remuestreadores y filtros pasabanda que preceden a los bancos de filtros de análisis de HFR se implementan usando remuestreadores en el dominio del tiempo multivelocidad y filtros pasabanda basados en QMF;
La Fig. 4 ilustra un ejemplo de bloques de construcción de una implementación eficiente de un remuestreador en el dominio del tiempo multivelocidad de la Fig. 3;
La Fig. 5 ilustra el efecto de una señal ilustrativa procesada por diferentes bloques de la Fig. 4 para un orden de transposición de 2;
La Fig. 6 ilustra una implementación eficiente del transpondedor basado en bloques de la Fig. 1, donde los remuestreadores y filtros pasabanda que preceden a los bancos de filtros de análisis de HFR son reemplazados por pequeños bancos de filtros de síntesis submuestreados que operan en subbandas seleccionadas a partir de un banco de filtros de análisis de 32 bandas;
La Fig. 7 ilustra el efecto de una señal ilustrativa procesada por un banco de filtros de síntesis submuestreado de la Fig. 6 para un orden de transposición de 2;
La Fig. 8 ilustra los bloques de implementación de un reductor de frecuencia de muestreo en el dominio del tiempo multivelocidad eficiente de un factor de 2;
La Fig. 9 ilustra los bloques de implementación de un reductor de frecuencia de muestreo en el dominio del tiempo multivelocidad eficiente de un factor de 3/2;
La Fig. 10 ilustra la alineación de los bordes espectrales de las señales del transpondedor de HFR con los bordes de las bandas de frecuencia de ajuste de envolvente en un codificador potenciado por HFR;
La Fig. 11 ilustra un escenario donde emergen artefactos debido a los bordes espectrales no alineados de las señales del transpondedor de HFR;
La Fig. 12 ilustra un escenario donde se evitan los artefactos de la Fig. 11 como resultado de los bordes espectrales alineados de las señales del transpondedor de HFR;
La Fig. 13 ilustra la adaptación de los bordes espectrales en la herramienta limitadora a los bordes espectrales de las señales del transpondedor de HFR;
La Fig. 14 ilustra el principio de transposición armónica a base de bloques de subbandas;
La Fig. 15 ilustra un escenario ilustrativo para la aplicación de transposición basada en bloques de subbandas usando varios órdenes de transposición en un códec de audio potenciado por HFR;
La Fig. 16 ilustra un escenario ilustrativo de la técnica anterior de la operación de una transposición basada en bloques de subbandas de múltiples órdenes mediante la aplicación de un banco de filtros de análisis separado por orden de transposición;
La Fig. 17 ilustra un escenario ilustrativo inventivo de la operación eficiente de una transposición basada en bloques de subbandas de múltiples órdenes mediante la aplicación de un único banco de filtros de análisis QMF de 64 bandas; La Fig. 18 ilustra otro ejemplo de formación de un procesamiento por señales de subbandas;
La Fig. 19 ilustra un parcheo de modulación de banda lateral única (SSB);
La Fig. 20 ilustra un parcheo de extensión de ancho de banda armónico (HBE);
La Fig. 21 ilustra un parcheo mixto, donde el primer parcheo se genera por la dispersión de frecuencia y el segundo parche se genera por un copiado SSB de una porción de baja frecuencia;
La Fig. 22 ilustra un parcheo mixto alternativo que usa el primer parche de HBE para una operación de copiado SSB para generar un segundo parche;
La Fig. 23 ilustra una estructura en cascada preferida de los bancos de filtros de análisis y de síntesis;
La Fig. 24a ilustra una implementación preferida del pequeño banco de filtros de síntesis de la Fig. 23;
La Fig. 24b ilustra una implementación preferida del banco de filtros de análisis adicional de la Fig. 23; La Fig. 25a ilustra descripciones generales de ciertos bancos de filtros de análisis y de síntesis de ISO/IEC 14496-3: 2005(E), y particularmente una implementación de un banco de filtros de análisis que se puede usar para el banco de filtros de análisis de la Fig.23 y una implementación de un banco de filtros de síntesis que se puede usar para el banco de filtros de síntesis final de la Fig. 23;
La Fig. 25b ilustra una implementación como diagrama de flujo del banco de filtros de análisis de la Fig. 25a; La Fig. 25c ilustra una implementación preferida del banco de filtros de síntesis de la Fig. 25a;
La Fig. 26 ilustra una descripción general del marco de referencia en el contexto del procesamiento de extensión de ancho de banda; y
La Fig. 27 ilustra una implementación preferida de un procesamiento de señales de subbandas producidas por el banco de filtros de análisis adicional de la Fig. 23.
DESCRIPCIÓN DE LAS REALIZACIONES PREFERIDAS
[0026] Las realizaciones descritas a continuación son meramente ilustrativas y pueden proporcionar una complejidad inferior de un transpondedor QMF mediante operaciones eficientes en el dominio del tiempo y de la frecuencia y una calidad de audio mejorada tanto de la SBR armónica basada en QMF como en DFT mediante la alineación espectral. Se entiende que, para otros expertos en la materia, resultarán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos en esta invención. Por lo tanto, es la intención que la invención esté limitada solo por el alcance de las siguientes reivindicaciones de patente y no por los detalles específicos presentados a modo de descripción y la explicación de las realizaciones en esta invención.
[0027] La Fig.23 ilustra una implementación preferida del aparato para procesar una señal de audio de entrada, donde la señal de audio de entrada puede ser una señal de entrada en el dominio del tiempo en línea 2300 producida, por ejemplo, por un decodificador de audio del núcleo 2301. La señal de audio de entrada es introducida en un primer banco de filtros de análisis 2302 que es, por ejemplo, un banco de filtros de análisis que tiene M canales.
Particularmente, el banco de filtros de análisis 2302 produce, por lo tanto, M señales de subbanda 2303, que tienen una tasa de muestreo fS = fS/M. Esto significa que el banco de filtros de análisis es un banco de filtros de análisis con muestreo crítico. Esto significa que el banco de filtros de análisis 2302 proporciona, para cada bloque de M muestras de entrada en línea 2300, una única muestra para cada canal de subbanda. Preferentemente, el banco de filtros de análisis 2302 es un banco de filtros modulado complejo, lo que significa que cada muestra de subbanda tiene una magnitud y una fase o, de modo equivalente, una parte real y una parte imaginaria. Por consiguiente, la señal de audio de entrada en línea 2300 está representada por una pluralidad de primeras señales de subbanda 2303 que son generadas por el banco de filtros de análisis 2302.
[0028] Se introduce un subconjunto de todas las primeras señales de subbanda en un banco de filtros de síntesis 2304. El banco de filtros de síntesis 2304 tiene Ms canales, donde Ms es inferior a M. Por consiguiente, no todas las señales de subbandas generadas por el banco de filtros 2302 son introducidas en banco de filtros de síntesis 2304, sino solo un subconjunto, es decir, una pequeña cantidad de canales como se indica en 2305. En la realización de la Fig. 23, el subconjunto 2305 cubre un determinado ancho de banda intermedio pero, como alternativa, el subconjunto también puede cubrir un ancho de banda que comienza con el canal 1 de banco de filtros del banco de filtros 2302 hasta un canal que tiene un número de canal inferior a M o, como alternativa, el subconjunto 2305 también puede cubrir un grupo de señales de subbandas alineadas con el canal M más alto y extenderse hasta un canal más bajo que tenga un número de canal superior al número de canal 1. Como alternativa, se puede iniciar la indexación de los canales con cero dependiendo de la notación usada en realidad. Preferentemente, sin embargo, en el caso de las operaciones de extensión de ancho de banda se introduce un cierto ancho de banda intermedio representado por el grupo de señales de subbandas indicado en 2305 en el banco de filtros de síntesis 2304.
[0029] Los otros canales que no pertenecen al grupo 2305 no se introducen en el banco de filtros de síntesis 2304. El banco de filtros de síntesis 2304 genera una señal de audio intermedia 2306, que tiene una tasa de muestreo igual a fs Ms/M. Dado que Ms es inferior a M, la tasa de muestreo de la señal intermedia 2306 será inferior a la tasa de muestreo de la señal de audio de entrada en línea 2300. Por lo tanto, la señal intermedia 2306 representa una señal con reducción de frecuencia de muestreo y demodulada correspondiente a la señal de ancho de banda representada por las subbandas 2305, donde la señal es demodulada a la banda base, dado que el canal más bajo del grupo 2305 se introduce en el canal 1 del banco de filtros de síntesis Ms y el canal más alto del bloque 2305 se introduce en la entrada más alta del bloque 2304, aparte de ciertas operaciones de relleno con ceros del canal más bajo o más alto con el fin de evitar problemas de solapamiento en los bordes del subconjunto 2305. El aparato para procesar una señal de audio de entrada comprende adicionalmente un banco de filtros de análisis adicional 2307 para analizar la señal intermedia 2306 y el banco de filtros de análisis adicional tiene Ma canales, donde Ma es diferente de Ms y preferentemente es superior a Ms. Cuando Ma es superior a MS, entonces la tasa de muestreo de las señales de subbanda producidas por el banco de filtros de análisis adicional 2307 e indicadas en 2308 será inferior a la tasa de muestreo de una señal de subbanda 2303. Sin embargo, cuando Ma es inferior a Ms, entonces la tasa de muestreo de una señal de subbanda 2308 será superior a una tasa de muestreo de una señal de subbanda de la pluralidad de primeras señales de subbanda 2303.
[0030] Por lo tanto, la cascada de bancos de filtros 2304 y 2307 (y preferentemente 2302) proporciona operaciones de aumento o reducción de frecuencia de muestreo muy eficientes y de gran calidad o, generalmente, una herramienta de procesamiento de remuestreo muy eficiente. La pluralidad de segundas señales de subbanda 2308 son procesadas adicionalmente, preferentemente, en un procesador 2309 que realiza el procesamiento con los datos remuestreados por la cascada de bancos de filtros 2304, 2307 (y preferentemente 2302). De manera adicional, es preferible que el bloque 2309 también realice una operación de aumento de frecuencia de muestreo de las operaciones de procesamiento de extensión de ancho de banda, por lo que, en última instancia, las subbandas producidas por el bloque 2309 tienen la misma tasa de muestreo que las subbandas producidas por el bloque 2302. A continuación, en una aplicación de procesamiento de extensión de ancho de banda, estas subbandas se introducen junto con las subbandas adicionales indicadas en 2310, que son preferentemente las subbandas de banda baja generadas, por ejemplo, por el banco de filtros de análisis 2302, en un banco de filtros de síntesis 2311, que finalmente proporciona una señal procesada en el dominio del tiempo, por ejemplo, una señal de ancho de banda extendido que tiene una tasa de muestreo 2fs. Esta tasa de muestreo producida por el bloque 2311 es, en esta realización, 2 veces la tasa de muestreo de la señal en línea 2300, y esta tasa de muestreo producida por el bloque 2311 es suficientemente alta para que el ancho de banda adicional generado por el procesamiento en el bloque 2309 pueda estar representado en la señal procesada en el dominio del tiempo con gran calidad de audio.
[0031] Dependiendo de la aplicación determinada de la presente invención de los bancos de filtros en cascada, el banco de filtros 2302 puede estar en un dispositivo separado y un aparato para procesar una señal de audio de entrada puede comprender solamente el banco de filtros de síntesis 2304 y el banco de filtros de análisis adicional 2307. Dicho de otra manera, el banco de filtros de análisis 2302 puede estar distribuido separadamente de un procesador "posterior" que comprende los bloques 2304, 2307 y, dependiendo de la implementación, también los bloques 2309 y 2311.
[0032] En otras realizaciones, la aplicación de la presente invención que implementa bancos de filtros en cascada puede ser diferente en el sentido de que un dispositivo determinado comprende el banco de filtros de análisis 2302 y el banco de filtros de síntesis más pequeño 2304, y la señal intermedia es proporcionada a un procesador diferente y distribuida por un distribuidor diferente o a través de un canal de distribución diferente. A continuación, la combinación del banco de filtros de análisis 2302 y el banco de filtros de síntesis más pequeño 2304 representa una manera muy eficiente de reducir la frecuencia de muestreo y, al mismo tiempo, demodular la señal de ancho de banda representada por el subconjunto 2305 a la banda base. Esta reducción de frecuencia de muestreo y demodulación a la banda base se ha realizado sin pérdida alguna de calidad de audio, y particularmente sin pérdida alguna de información de audio y, por lo tanto, es un procesamiento de alta calidad.
[0033] La tabla de la Fig. 23 ilustra ciertos números ilustrativos de los diferentes dispositivos. Preferentemente, el banco de filtros de análisis 2302 tiene 32 canales, el banco de filtros de síntesis tiene 12 canales, el banco de filtros de análisis adicional tiene el doble de los canales del banco de filtros de síntesis, tal como 24 canales, y el banco de filtros de síntesis final 2311 tiene 64 canales. En términos generales, el número de canales en el banco de filtros de análisis 2302 es elevado, el número de canales en el banco de filtros de síntesis 2304 es bajo, el número de canales en el banco de filtros adicional 2307 es mediano y el número de canales en el banco de filtros de síntesis 2311 es muy elevado. Las tasas de muestreo de las señales de subbanda producidas por el banco de filtros de análisis 2302 es fs/M. La señal intermedia tiene una tasa de muestreo fs Ms/M. Los canales de subbanda del banco de filtros de análisis adicional indicados en 2308 tienen una tasa de muestreo de fs Ms/(M MA), y el banco de filtros de síntesis 2311 proporciona una señal de salida que tiene una tasa de muestreo de 2fs, cuando el procesamiento en el bloque 2309 duplica la tasa de muestreo. Sin embargo, cuando el procesamiento en el bloque 2309 no duplica la tasa de muestreo, entonces la tasa de muestreo producida por el banco de filtros de síntesis será correspondientemente más baja. Posteriormente, se analizan realizaciones preferidas adicionales relacionadas con la presente invención.
[0034] La Fig. 14 ilustra el principio de transposición basada en bloques de subbandas. La señal en el dominio del tiempo de entrada es alimentada a un banco de filtros de análisis 1401 que proporciona una multitud de señales de subbandas de valor complejo. Estas se alimentan a la unidad de procesamiento de subbandas 1402. La multitud de subbandas de salida de valor complejo se alimenta al banco de filtros de síntesis 1403 que, a su vez, produce la señal de dominio en el tiempo modificada. La unidad de procesamiento de subbandas 1402 realiza operaciones de procesamiento no lineal de subbandas a base de bloques, de tal manera que la señal en el dominio del tiempo modificada es una versión transpuesta de la señal de entrada correspondiente a un orden de transposición T > 1. La noción de un procesamiento de subbandas a base de bloques se define por comprender operaciones no lineales en bloques de más de una muestra de subbanda a la vez, donde los bloques posteriores son enventanados y añadidos por superposición para generar las señales de subbandas de salida.
[0035] Los bancos de filtros 1401 y 1403 pueden ser de cualquier tipo modulado exponencial complejo tal como QMF o un DFT con ventana. Se pueden apilar de forma uniforme o desigual en la modulación y pueden ser definidos por un amplio rango de filtros prototipos o ventanas. Es importante conocer el cociente Afs/AfA de los siguientes dos parámetros de los bancos de filtros, medidos en unidades físicas.
- Ma el espaciado de frecuencias de subbandas del banco de filtros de análisis 1401;
- Afs: el espaciado de frecuencias de subbandas del banco de filtros de síntesis 1403.
[0036] Para la configuración del procesamiento de subbandas 1402, es necesario descubrir la correspondencia entre los índices de subbanda de origen y de destino. Se observa que una sinusoide de entrada de la frecuencia física O dará como resultado una contribución principal que se produce en las subbandas de entrada con el índice n ~ Q/ñfA. Una sinusoide de salida de la frecuencia física transpuesta deseada T O será el resultado de la alimentación a la subbanda de síntesis con el índice m ~ TQ/ñfs. Por consiguiente, los valores índice de subbanda de origen apropiados del procesamiento de subbandas de un índice de subbanda de destino dado m ha de cumplir
Figure imgf000008_0001
[0037] La Fig. 15 ilustra un escenario ilustrativo para la aplicación de transposición basada en bloques de subbandas usando varios órdenes de transposición en un códec de audio potenciado por HFR. Se recibe un flujo de bits transmitido en el decodificador del núcleo 1501, que proporciona una señal del núcleo decodificada de bajo ancho de banda en la frecuencia de muestreo fs. La baja frecuencia se vuelve a muestrear a la frecuencia de muestreo de salida 2fs por medio de un banco de análisis QMF complejo modulado de 32 bandas 1502 seguido por un banco de síntesis QMF de 64 bandas (QMF inverso) 1505. Los dos bancos de filtros 1502 y 1505 tienen los mismos parámetros de resolución física Afs = AfA y la unidad de procesamiento de HFR 1504 simplemente deja pasar las subbandas más bajas sin modificar correspondientes a la señal del núcleo de bajo ancho de banda. El contenido de alta frecuencia de la señal de salida se obtiene alimentando las subbandas más altas del banco de síntesis QMF del banco de síntesis QMF de 64 bandas 1505 con las bandas de salida de la unidad de transpondedor múltiple 1503, sometidas a conformación y modificación espectral realizadas por la unidad de procesamiento de HFR 1504. El transpondedor múltiple 1503 toma como entrada la señal del núcleo decodificada y produce una multitud de señales de subbanda que representan el análisis QMF de 64 bandas de una superposición o combinación de varios componentes de señal transpuestos. El objetivo es que si se pasa por alto el procesamiento de HFR; cada componente corresponde a una transposición física de un número entero de la señal del núcleo, (T = 2,3,...).
[0038] La Fig. 16 ilustra un escenario ilustrativo de la técnica anterior de la operación de una transposición basada en bloques de subbandas de múltiples órdenes 1603 mediante la aplicación de un banco de filtros de análisis separado por orden de transposición. En este caso, se deben producir y distribuir tres órdenes de transposición T = 2,3,4 en el domino de un QMF de 64 bandas que funciona a una tasa de muestreo de salida 2fs. La unidad de fusión 1604 simplemente selecciona y combina las subbandas relevantes de cada ramificación de factor de transposición en una única multitud de subbandas de QMF a alimentar a la unidad de procesamiento de HFR.
[0039] Considere primero el caso T = 2. El objetivo es específicamente que la cadena de procesamiento de un análisis QMF de 64 bandas 1602-2, una unidad de procesamiento de subbandas 1603-2 y una síntesis de QMF de 64 bandas 1505 resulte en una transposición física de T = 2. Identificando estos tres bloques con 1401, 1402 y 1403 de la Fig. 14, se descubre que AfsJAfA = 2, de modo que (1) da lugar, en la especificación correspondiente para 1603-2, que la correspondencia entre las subbandas de origen n y destino m viene dada por n = m.
[0040] En cuanto al caso T = 3, el sistema ilustrativo incluye un convertidor de tasa de muestreo 1601-3 que convierte la tasa de muestreo de entrada reduciéndola en un factor 3/2 de fs a 2fs/3. El objetivo es específicamente que la cadena de procesamiento de un análisis QMF de 64 bandas 1602-3, la unidad de procesamiento de subbandas 1603-3 y una síntesis de QMF de 64 bandas 1505 resulte en una transposición física de T = 3. Identificando estos tres bloques con 1401, 1402 y 1403 de la Fig. 14, se descubre, debido al remuestreo, que Afs/AfA = 3, de modo que (1) proporciona la especificación de 1603-3, que la correspondencia entre las subbandas de origen n y de destino m viene dada de nuevo por n = m.
[0041] En cuando al caso T = 4, el sistema ilustrativo incluye un convertidor de tasa de muestreo 1601-4 que convierte la tasa de muestreo de entrada reduciéndola en un factor de dos de fs a fs/2. El objetivo es específicamente que la cadena de procesamiento de un análisis QMF de 64 bandas 1602-4, la unidad de procesamiento de subbandas 1603-4 y una síntesis de QMF de 64 bandas 1505 resulte en una transposición física de T = 4. Identificando estos tres bloques con 1401, 1402 y 1403 de la Fig. 14, se descubre, debido al remuestreo, que AfsJAfA = 4, de modo que (1) proporciona la especificación de 1603-4, que la correspondencia entre las subbandas de origen n y de destino m también viene dada por n = m.
[0042] La Fig. 17 ilustra un escenario ilustrativo inventivo de la operación eficiente de una transposición basada en bloques de subbandas de múltiples órdenes que aplica un único banco de filtros de análisis QMF de 64 bandas. De hecho, el uso de tres bancos de análisis QMF separados y dos convertidores de tasa de muestreo de la Fig. 16 dan lugar a una complejidad informática más bien alta, así como también a ciertas desventajas de implementación del procesamiento basado en tramas debido a la conversión de la tasa de muestreo 1601-3. Las presentes realizaciones enseñan a reemplazar las dos ramificaciones 1601-3 ^ 1602-3 ^ 1603-3 y 1601-4 ^ 1602-4 ^ 1603-4 por el procesamiento de subbandas 1703-3 y 1703-4, respectivamente, mientras que la ramificación 1602-2 ^ 1603-2 se mantiene sin cambios en comparación con la Fig. 16. Los tres órdenes de transposición se tendrán que realizar en el dominio de un banco de filtros con referencia a la Fig. 14, donde AfsJAfA = 2. En el caso T = 3, la especificación para 1703-3 dada por (1) es que la correspondencia entre las subbandas de origen n y de destino m viene dada por n ~ 2m/3. En el caso T = 4, las especificaciones para 1703-4 dadas por (1) es que la correspondencia entre las subbandas de origen n y de destino m viene dada por n ~ 2m. Para reducir aún más la complejidad, se pueden generar algunos órdenes de transposición copiando los órdenes de transposición ya calculados o la salida del decodificador del núcleo.
[0043] La Fig. 1 ilustra la operación de un transpondedor basado en bloques de subbandas que usa los órdenes de transposición de 2, 3 y 4 en un marco de referencia de decodificador potenciado por HFR, tal como SBR [ISO/IEC 14496-3:2009, "Information technology - Coding of audio-visual objects - Part 3: Audio]. El flujo de bits es decodificado al dominio del tiempo por el decodificador del núcleo 101 y pasa al módulo de HFR 103, lo que genera una señal de alta frecuencia a partir de la señal del núcleo de la banda base. Después de la generación, la señal generada por HFR es ajustada dinámicamente para coincidir con la señal original lo más cerca posible por medio de información colateral transmitida. Este ajuste es realizado por el procesador de HFR 105 en las señales de subbanda obtenidas a partir de uno o varios bancos de análisis QMF. Un escenario típico es un caso donde el decodificador del núcleo opera en una señal en el dominio del tiempo muestreada a la mitad de la frecuencia de las señales de entrada y de salida, es decir, el módulo decodificador de HFR remuestreará efectivamente la señal del núcleo al doble de la frecuencia de muestreo. Esta conversión de la tasa de muestreo se obtiene por lo general por la primera etapa de filtrado de la señal del codificador del núcleo por medio de un banco de análisis QMF de 32 bandas 102. Las subbandas por debajo de la denominada frecuencia de cruce, es decir, el subconjunto más bajo de las 32 subbandas que contiene la totalidad de la energía de la señal del codificador del núcleo se combina con el conjunto de subbandas que llevan la señal generada por HFR. Por lo general, el número de subbandas así combinadas es de 64, lo que, después del filtrado por el banco QMF de síntesis 106, da lugar a una señal del codificador del núcleo con tasa de muestreo convertida combinada con la salida del módulo HFR.
[0044] En el transpondedor basado en bloques de subbandas del módulo HFR 103, se deben producir tres órdenes de transposición T = 2, 3 y 4, y distribuir en el dominio de un QMF de 64 bandas que opera a una tasa de muestreo de salida 2fs. La señal en el dominio del tiempo de entrada es filtrada por pasabanda en los bloques 103­ 12, 103-13 y 103-14. Esto se hace con el fin de hacer que las señales de salida, procesadas por los diferentes órdenes de transposición, tengan contenidos espectrales no superpuestos. Se reduce además la frecuencia de muestreo de las señales (103-23, 103-24) para adaptar la tasa de muestreo de las señales de entrada para ajustarse a los bancos de filtros de análisis de un tamaño constante (en este caso 64). Puede observarse que el incremento de la tasa de muestreo, de fs a 2fs, puede ser explicado por el hecho de que los convertidores de tasa de muestreo usan factores de reducción de frecuencia de muestreo de T/2 en lugar de T, en el que este último produciría señales de subbandas transpuestas que tienen la misma tasa de muestreo que la señal de entrada. Las señales con reducción de frecuencia de muestreo son alimentadas a bancos de filtros de análisis HFR separados (103-32, 103-33 y 103-34), uno para cada orden de transposición, lo que proporciona una multitud de señales de subbanda de valor complejo. Estas son alimentadas a las unidades de estiramiento de subbandas no lineales (103-42, 103-43 y 103-44). La multitud de subbandas de salida de valor complejo son alimentadas al módulo Fusionar/Combinar 104 junto con la salida del banco de análisis submuestreado 102. La unidad Fusionar/Combinar simplemente fusiona las subbandas del banco de filtros de análisis del núcleo 102 y cada ramificación de factor de estiramiento en una única multitud de subbandas de QMF a alimentar a la unidad de procesamiento de HFR 105.
[0045] Cuando se establece que los espectros de señales de diferentes órdenes de transposición no se superpongan, es decir, el espectro de la señal de orden de transposición de orden T debería comenzar donde termina el espectro de la señal del orden T-1, las señales transpuestas deben ser de carácter pasabanda. Por consiguiente, los filtros pasabanda tradicionales 103-12-103-14 de la Fig. 1. Sin embargo, a través de una simple selección exclusiva entre las subbandas disponibles mediante la unidad Fusionar/Combinar 104, los filtros pasabanda separados son redundantes y pueden ser evitados. Por el contrario, se aprovecha la característica de pasabanda inherente proporcionada por el banco QMF alimentando las diferentes contribuciones de las ramificaciones del transpondedor independientemente de los diferentes canales de subbandas en 104. También basta con aplicar la dilatación del tiempo únicamente a las bandas que se combinan en 104.
[0046] La Fig. 2 ilustra la operación de una unidad de estiramiento de subbandas no lineales. El extractor de bloques 201 muestrea una trama finita de muestras a partir de la señal de entrada de valor complejo. La trama está definida por una posición de puntero de entrada. Esta trama experimenta el procesamiento no lineal en 202 y posteriormente se enventanan por una ventana de longitud finita en 203. Las muestras resultantes se añaden a las muestras de salida anteriores de la unidad de superposición y suma 204 donde la posición de la trama de salida está definida por una posición de puntero de salida. El puntero de entrada se incrementa en una cantidad fija y el puntero de salida se incrementa en un factor de estiramiento de subbandas multiplicado por la misma cantidad. Una iteración de esta cadena de operaciones producirá una señal de salida con una duración siendo el factor de estiramiento de subbandas multiplicado por la duración de la señal de subbanda de entrada, hasta la longitud de la ventana de síntesis.
[0047] Si bien el transpondedor SSB empleado por SBR [ISO/IEC 14496-3:2009, "Information technology -Coding of audio-visual objects - Part 3: Audio] aprovecha, típicamente, la totalidad de la banda base, excluyendo la primera subbanda, para generar la señal de banda alta, un transpondedor armónico usa generalmente una parte más pequeña del espectro del codificador por núcleo. La cantidad usada, el denominado rango de origen, depende del orden de transposición, del factor de extensión de ancho de banda y de las reglas aplicadas al resultado combinado, por ejemplo, si se permite que las señales generadas de los diferentes órdenes de transposición se superpongan espectralmente o no. Como consecuencia, solamente una parte limitada del espectro de salida del transpondedor armónico de un orden de transposición dado se usará en realidad por el módulo de procesamiento de HFR 105.
[0048] La Fig. 18 ilustra otra realización de una implementación de procesamiento ilustrativa para el procesamiento de una señal de subbanda única. La señal de subbanda única ha sido sometida a algún tipo de decimación antes o después de su filtración por un banco de filtros de análisis no mostrado en la Fig. 18. Por lo tanto, la duración en el tiempo de la señal de subbanda única es inferior a la duración en el tiempo antes de formar la decimación. La señal de subbanda única es introducida en un extractor de bloques 1800, que puede ser idéntico al extractor de bloques 201, pero también se puede implementar de otra manera. El extractor de bloques 1800 de la Fig. 18 funciona usando un valor de avance de muestra/bloque denominado ilustrativamente e. El valor de avance de muestra/bloque puede ser variable o puede ajustarse de forma fija y es ilustrado en la Fig. 18 como una flecha en el recuadro extractor de bloques 1800. A la salida del extractor de bloques 1800, existe una pluralidad de bloques extraídos. Estos bloques están muy superpuestos, dado que el valor de avance de muestra/bloque e es significativamente más pequeño que la longitud de bloque del extractor de bloques. Un ejemplo es que el extractor de bloques extrae los bloques de 12 muestras. El primer bloque comprende las muestras 0 a 11, el segundo bloque comprende las muestras 1 a 12, el tercer bloque comprende las muestras 2 a 13, y así sucesivamente. En esta realización, el valor de avance de muestra/bloque e es igual a 1, y hay una superposición de 11 veces.
[0049] Los bloques individuales se introducen en un enventanador 1802 para enventanar los bloques usando una función de ventana para cada bloque. De manera adicional, se proporciona una calculadora de fase 1804 que calcula una fase para cada bloque. La calculadora de fase 1804 puede usar el bloque individual antes del enventanado o posteriormente al enventanado. A continuación, se calcula un valor de ajuste de fase p 3 k y se introduce en un ajustador de fase 1806. El ajustador de fase aplica el valor de ajuste a cada muestra del bloque. Es más, el factor k es igual al factor de extensión de ancho de banda. Cuando se debe obtener, por ejemplo, la extensión de ancho de banda en un factor de 2, entonces se multiplica la fase p calculada de un bloque extraído por el extractor de bloques 1800 por el factor de 2 y el valor de ajuste aplicado a cada muestra del bloque en el ajustador de fase 1806 es p multiplicado por 2. Este es un valor/regla ilustrativo. Como alternativa, la fase corregida para la síntesis es k * p, p (k-1)*p. Entonces, en este ejemplo, el factor de corrección es 2 si se multiplica o 1*p si se suma. Se pueden aplicar otros valores/reglas para calcular el valor de corrección de fase.
[0050] En una realización, la señal de subbanda única es una señal de subbanda compleja y se puede calcular la fase de un bloque de una pluralidad de diferentes maneras. Una manera es tomar la muestra en el centro o alrededor del centro del bloque y calcular la fase de esta muestra compleja. También es posible calcular la fase para cada muestra.
[0051] Aunque se ilustra en la Fig. 18 de la manera que opera un ajustador de fase posterior al enventanador, estos dos bloques también se pueden intercambiar, por lo que se realiza el ajuste de fase en los bloques extraídos por el extractor de bloques y se realiza una operación de enventanado posterior. Dado que ambas operaciones, es decir, el enventanado y el ajuste de fase son multiplicaciones de valor real o de valor complejo, estas dos operaciones se pueden resumir en una única operación que usa un factor de multiplicación complejo que, por sí, es el producto de un factor de multiplicación de ajuste de fase y un factor de enventanado.
[0052] Los bloques con fases ajustadas se introducen en un bloque de superposición/suma y de corrección de amplitud 1808, donde los bloques enventanados y con fase ajustada se añaden por superposición. De modo importante, sin embargo, el valor de avance de muestra/bloque del bloque 1808 es diferente del valor usado en el extractor de bloques 1800. Particularmente, el valor de avance de muestra/bloque del bloque 1808 es superior al valor e usado en el bloque 1800, por lo que se obtiene una dilatación del tiempo de la señal producida por el bloque 1808. Por consiguiente, la señal de subbanda procesada producida por el bloque 1808 tiene una longitud que es mayor que la señal de subbanda de entrada al bloque 1800. Cuando se debe obtener una extensión de ancho de banda de dos, entonces se usa el valor de avance de muestra/bloque, que es dos veces el valor correspondiente del bloque 1800. Esto da lugar a una dilatación del tiempo en un factor de dos. Sin embargo, cuando se necesitan otros factores de dilatación del tiempo, entonces se pueden usar otros valores de avance de muestra/bloque por lo que la salida del bloque 1808 tiene la duración de tiempo necesaria.
[0053] Para abordar el problema de superposición, se realiza preferentemente una corrección de la amplitud con el fin de abordar el problema de las superposiciones diferentes en el bloque 1800 y 1808. Esta corrección de la amplitud, sin embargo, también se podría introducir en el factor de multiplicación del enventanador/ajustador de fase, pero la corrección de la amplitud también se puede realizar posteriormente a la superposición/procesamiento.
[0054] En el ejemplo anterior con una longitud de bloques de 12 y un valor de avance de muestra/bloque en el extractor de bloques de uno, el valor de avance de muestra/bloque del bloque de superposición/suma 1808 sería igual a dos, cuando se realiza una extensión de ancho de banda de un factor de dos. Esto todavía daría lugar a una superposición de cinco bloques. Cuando se debe realizar una extensión de ancho de banda de un factor de tres, entonces el valor de avance de muestra/bloque usado por el bloque 1808 sería igual a tres y la superposición se reduciría a una superposición de tres. Cuando se debe realizar una extensión de ancho de banda de cuatro veces, entonces el bloque de superposición/suma 1808 tendría que usar un valor de avance de muestra/bloque de cuatro, lo que todavía daría como resultado una superposición de más de dos bloques.
[0055] Se pueden obtener grandes ahorros informáticos restringiendo las señales de entrada a las ramificaciones del transpondedor para que contengan únicamente el rango de origen, y esto a una tasa de muestreo adaptada a cada orden de transposición. En la Fig. 3 se ilustra el esquema de bloques básico de dicho sistema de un generador de HFR a base de bloques de subbandas. La señal de entrada del codificador por núcleo es procesada por reductores de la frecuencia de muestreo que preceden a los bancos de filtros de análisis de HFR.
[0056] El efecto esencial de cada reductor de frecuencia de muestreo es separar por filtración la señal del rango de origen y distribuirla al banco de filtros de análisis a la tasa de muestreo más baja posible. En este caso, la más baja posible se refiere a la tasa de muestreo más baja que es aún adecuada para el procesamiento posterior, no necesariamente la tasa de muestreo más baja que evite el solapamiento después de la decimación. La conversión de la tasa de muestreo se puede obtener de varias maneras. Sin limitar el alcance de la invención, se darán dos ejemplos: el primero muestra el remuestreo realizado por un procesamiento multivelocidad en el dominio del tiempo y el segundo ilustra el remuestreo obtenido por medio del procesamiento en subbandas de QMF.
[0057] La Fig. 4 muestra un ejemplo de los bloques de un reductor multivelocidad de la frecuencia de muestreo en el dominio del tiempo para un orden de transposición de 2. La señal de entrada, que tiene un ancho de banda B Hz y una frecuencia de muestreo fs, es modulada por un exponencial complejo (401) con el fin de desplazar en la frecuencia el comienzo del rango de origen de la frecuencia DC como
Figure imgf000012_0001
[0058] Los ejemplos de una señal de entrada y el espectro después la modulación se representan en las Fig. 5(a) y (b). La señal modulada es interpolada (402) y filtrada por un filtro de paso bajo de valor complejo con límites pasabanda de 0 y B/2 Hz (403). Los espectros después de las etapas respectivas se muestran en las Fig. 5(c) y (d). La señal filtrada es posteriormente decimada (404) y la parte real de la señal es calculada (405). Los resultados después de estas etapas se muestran en las Fig. 5(e) y (f). En este ejemplo particular, cuando T=2, B=0,6 (en una escala normalizada, es decir fs=2), se elige P2 de 24, con el fin de cubrir con seguridad el rango de origen. El factor de reducción de la frecuencia de muestreo es
Figure imgf000012_0002
, donde la fracción se ha reducido en un factor común de 8. Por consiguiente, el factor de interpolación es 3 (como se observa en la Fig. 5(c)) y el factor de decimación es 8. Mediante el uso de las Identidades de Noble ["Multirate Systems And Filter Banks," P.P. Vaidyanathan, 1993, Prentice Hall, Englewood Cliffs], se puede mover el decimador totalmente hacia la izquierda y el interpolador totalmente hacia la derecha de la Fig. 4. De esta manera, la modulación y el filtrado se realizan con la tasa de muestreo más baja posible y se reduce aún más la complejidad informática.
[0059] De acuerdo con la invención, se usan las salidas de subbandas del banco QMF de análisis de 32 bandas submuestreado 102 que ya está presente en el método de SBR y HFR. Las subbandas que cubren los rangos de origen de las diferentes ramificaciones del transpondedor se sintetizan al dominio en el tiempo mediante pequeños bancos QMF submuestreados que preceden a los bancos de filtros de análisis de HFR. Este tipo de sistema de HFR se ilustra en la Fig. 6. Los pequeños bancos QMF se obtienen submuestreando el banco QMF de 64 bandas original, donde los coeficientes de filtro prototipo se encuentran por interpolación lineal del filtro prototipo original. Siguiendo la notación de la Fig. 6, el banco QMF de síntesis que precede a la ramificación de transpondedor de 2° orden tiene Q2=12 bandas (las subbandas con índices de base cero de 8 a 19 en el QMF de 32 bandas). Para prevenir el solapamiento en el proceso de síntesis, se ajusta la primera (índice 8) y la última (índice 19) banda a cero. La salida espectral resultante se muestra en la Fig. 7. Tenga en cuenta que el banco de filtros de análisis del transpondedor a base de bloques tiene 2Q2=24 bandas, es decir, el mismo número de bandas que en el ejemplo basado en el reductor multivelocidad de la frecuencia de muestreo en el dominio del tiempo (Fig. 3).
[0060] Cuando se comparan la Fig. 6 y la Fig. 23, queda claro que el elemento 601 de la Fig. 6 corresponde al banco de filtros de análisis 2302 de la Fig. 23. Es más, el banco de filtros de síntesis 2304 de la Fig. 23 corresponde al elemento 602-2, y el banco de filtros de análisis adicional 2307 de la Fig. 23 corresponde al elemento 603-2. El bloque 604-2 corresponde al bloque 2309 y el combinador 605 puede corresponder al banco de filtros de síntesis 2311, pero en otras realizaciones, el combinador puede estar configurado para producir señales de subbanda y luego se puede usar un banco de filtros de síntesis adicional conectado al combinador. Sin embargo, dependiendo de la implementación, se puede realizar una determinada reconstrucción de alta frecuencia como se analiza en el contexto de la Fig. 26 más adelante, antes del filtrado de síntesis por el banco de filtros de síntesis 2311 o el combinador 205, o se puede realizar después del filtrado de síntesis en el banco de filtros de síntesis 2311 de la Fig. 23 o posteriormente al combinador en el bloque 605 de la Fig. 6.
[0061] Las otras ramificaciones que se extienden de 602-3 a 604-3 o que se extienden de 602-T a 604-T no se ilustran en la Fig. 23, pero se pueden implementar de manera similar, pero con diferentes tamaños de bancos de filtros, donde T en la Fig. 6 corresponde a un factor de transposición. Sin embargo, como se analiza en el contexto de la Fig. 27, se puede introducir la transposición en un factor de transposición de 3 y la transposición en un factor de transposición 4 en la ramificación de procesamiento que consiste en el elemento 602-2 a 604-2 por lo que el bloque 604-2 no solo proporciona una transposición en un factor de 2 sino también una transposición en un factor de 3 y se usa un factor de 4, junto con cierto banco de filtros de síntesis como se analiza en el contexto de las Fig. 26 y 27.
[0062] En la realización de la Fig. 6, Q2 corresponde a Ms y Ms es igual, por ejemplo, a 12. Es más, el tamaño del banco de filtros de análisis adicional 603-2 correspondiente al elemento 2307 que es igual a 2Ms tal como 24 en la realización.
[0063] Es más, como se ha descrito anteriormente, el canal de la subbanda más baja y el canal de la subbanda más alta del banco de filtros de síntesis 2304 pueden ser alimentados con ceros con el fin de evitar problemas de solapamiento.
[0064] El sistema descrito en la Fig. 1 puede ser considerado un caso especial simplificado del remuestreo descrito en las Fig. 3 y 4. Con el fin de simplificar la disposición, se omiten los moduladores. Además, todos los filtros de análisis de HFR se obtienen usando bancos de filtros de análisis de 64 bandas. Por consiguiente, P2 = P3 = P4 = 64 de la Fig. 3, y los factores de reducción de la frecuencia de muestreo son 1, 1,5 y 2 para las ramificaciones del transpondedor de 2°, 3er y 4° orden, respectivamente.
[0065] Una ventaja de la presente invención es que, en el contexto del procesamiento de muestreo crítico de la invención, se pueden usar las señales de subbanda del banco QMF de análisis de 32 bandas correspondiente al bloque 2302 de la Fig. 23 o 601 de la Fig. 6 como se define en MPEG4 (ISO/IEC 14496-3). La definición de este banco de filtros de análisis en la Norma MPEG-4 está ilustrada en la porción superior de la Fig. 25a y se ilustra como diagrama de flujo en la Fig. 25b, que también ha sido tomada de la Norma MPEG-4. La porción de SBR (replicación del ancho de banda espectral) de esta norma se incorpora en esta invención como referencia. Particularmente, se puede implementar el banco de filtros de análisis 2302 de la Fig. 23 o el QMF de 32 bandas 601 de la Fig. 6 como se ilustra en la Fig. 25a, en la porción superior y el diagrama de flujo de la Fig. 25b.
[0066] Es más, también se puede implementar el banco de filtros de síntesis ilustrado en el bloque 2311 de la Fig. 23 como se indica en la porción inferior de la Fig. 25a y como se ilustra en el diagrama de flujo de la Fig. 25c. Sin embargo, se puede aplicar cualquier otra definición de banco de filtros, pero al menos en el caso del banco de filtros de análisis 2302, es preferible la implementación ilustrada en las Fig. 25a y 25b debido a la robustez, estabilidad y alta calidad proporcionados por este banco de filtros de análisis MPEG-4 que tiene 32 canales al menos en el contexto de aplicaciones de extensión de ancho de banda tales como replicación de ancho de banda espectral o, en términos generales, en aplicaciones de procesamiento de reconstrucción de alta frecuencia.
[0067] El banco de filtros de síntesis 2304 está configurado para sintetizar un subconjunto de subbandas que cubren el rango de origen correspondiente a un transpondedor. Esta síntesis se realiza para sintetizar la señal intermedia 2306 en el dominio del tiempo. Preferentemente, el banco de filtros de síntesis 2304 es un pequeño banco QMF de valor real submuestreado.
[0068] La salida en el dominio del tiempo 2306 de este banco de filtros es alimentada luego a un banco QMF de análisis de valor complejo del doble del tamaño del banco de filtros. Este banco QMF está ilustrado por el bloque 2307 de la Fig. 23. Este procedimiento permite un ahorro sustancial de la complejidad informática ya que solo el rango de origen relevante se transforma al dominio de subbandas QMF teniendo la resolución de frecuencia duplicada. Los pequeños bancos QMF se obtienen submuestreando el banco QMF de 64 bandas original, donde los coeficientes de filtro prototipos se obtienen por interpolación lineal del filtro prototipo original. Preferentemente, se usa el filtro prototipo asociado con el banco de filtros de síntesis MPEG-4 que tiene 640 muestras, donde el banco de filtros de análisis MPEG-4 tiene una ventana de 320 muestras de ventana.
[0069] El procesamiento de los bancos de filtros submuestrados está descrito en las Fig. 24a y 24b, que ilustran diagramas de flujo. En primer lugar se determinan las siguientes variables:
M s = 4 • mímmo{(fr^ . o(0) 4)/8 1}
kL = iniciosubbanda2kL ( fTMaBaJO(0))
donde Ms es el tamaño del banco de filtros de síntesis submuestreado y kL representa el índice de subbanda del primer canal del banco QMF de 32 bandas a ingresar al banco de filtros de síntesis submuestreado. La matriz startSubband2kL figura en la Tabla 1. La función mínimo{x} redondea el argumento x al número entero más próximo hacia el infinito negativo.
Figure imgf000013_0001
[0070] Por consiguiente, el valor Ms define el tamaño del banco de filtros de síntesis 2304 de la Fig. 23 y Kl es el primer canal del subconjunto 2305 indicado en la Fig. 23. Específicamente, el valor en la ecuación ftablabaja está definido en ISO/IEC 14496-3, sección 4.6.18.3.2, que también se incorpora en esta invención como referencia. Se debe tener en cuenta que el valor Ms sufre incrementos de 4, lo que significa que el tamaño del banco de filtros de síntesis 2304 puede ser 4, 8, 12, 16, 20, 24, 28 o 32.
[0071] Preferentemente, el banco de filtros de síntesis 2304 es un banco de filtros de síntesis de valor real. Con este fin, se calcula un conjunto de muestras de subbandas de valor real Ms a partir de las nuevas muestras de subbandas de valor complejo Ms según la primera etapa de la Fig. 24a. Para este fin, se usa la siguiente ecuación
'/ ( * - ^ . ) = R e |x S(¡í# ) - e x p ^ y ^ i _ (fe (X5) 191
Figure imgf000014_0001
[0072] En la ecuación, exp() denota la función exponencial compleja, i es la unidad imaginaria y kL se ha definido anteriormente.
Desplazar las muestras en la matriz v en 2Msposiciones. Se descartan las muestras 2Ms más antiguas.
Se multiplican las muestras de subbandas de valor real Ms por la matriz N, es decir, se calcula el producto de matrizvector N V, donde
Figure imgf000014_0002
[0073] La salida de esta operación es almacenada en las posiciones 0 a 2Ms-1 de la matriz v.
Extraer las muestras de v según el diagrama de flujo de la Fig. 24a para crear la matriz de 10Ms elementos g.
Multiplicar las muestras de la matriz g por la ventana Ci para producir la matriz w. Los coeficientes de ventana Ci se obtienen por interpolación lineal de los coeficientes c, es decir, por medio de la ecuación
Figure imgf000014_0003
donde m(n) y p(n) se definen como partes entera y fraccional de 64n/Ms, respectivamente. Los coeficientes de ventana de c se pueden encontrar en la Tabla 4.A.87 de ISO/IEC 14496-3:2009.
[0074] Por consiguiente, el banco de filtros de síntesis tiene una calculadora de funciones de ventana prototipo para calcular una función de ventana prototipo mediante el submuestreo o interpolación usando una función de ventana almacenada para un banco de filtros que tiene un tamaño diferente.
Calcular Ms nuevas muestras de salida mediante la suma de muestras de la matriz w según la última etapa del diagrama de flujo de la Fig. 24a.
[0075] Posteriormente, se ilustra la implementación preferida del banco de filtros de análisis adicional 2307 de la Fig. 23 junto con el diagrama de flujo de la Fig. 24b.
Desplazar las muestras en la matriz x en 2Ms posiciones según la primera etapa de la Fig. 24b. Se descartan las 2Ms muestras más antiguas y se almacenan las 2Ms nuevas muestras en las posiciones 0 a 2Ms-1.
Multiplicar las muestras de la matriz x por los coeficientes de ventana C 2 i. Los coeficientes de ventana C 2 i se obtienen por interpolación lineal de los coeficientes c, es decir, por medio de la ecuación
Figure imgf000014_0004
donde m(n) y p(n) se definen como las partes entera y fraccional de 32-n/Ms, respectivamente. Los coeficientes de ventana de c se pueden encontrar en la Tabla 4.A.87 de ISO/IEC 14496-3:2009.
[0076] Por consiguiente, el banco de filtros de análisis adicional 2307 tiene una calculadora de funciones de ventana prototipo para calcular una función de ventana prototipo mediante el submuestreo o interpolación usando una función de ventana almacenada para un banco de filtros que tiene un tamaño diferente.
Sumar las muestras según la fórmula en el diagrama de flujo de la Fig. 24b para crear la matriz de 4Ms elementos.
Calcular 2Ms nuevas muestras de subbandas de valor complejo mediante la multiplicación de matriz-vector M u,
Figure imgf000015_0001
[0077] En la ecuación, exp() denota la función exponencial compleja e i es la unidad imaginaria.
[0078] En la Fig. 8(a) se muestra un diagrama de un reductor de frecuencia de muestreo de factor de 2. El filtro de paso bajo de valor real ahora se puede representar como H(z) = B(z)/ A(z), donde B(z) es la parte no recursiva (FIR) y A(z) es la parte recursiva (IIR). Sin embargo, para una implementación eficiente, usando las Identidades de Noble para reducir la complejidad informática, es beneficioso diseñar un filtro donde todos los polos tengan una multiplicidad de 2 (polos dobles) como A(z2). Por consiguiente, el filtro se puede factorizar como se muestra en la Fig. 8(b). Usando la Identidad de Noble 1, se puede mover la parte recursiva más allá del decimador al igual que en la Fig. 8(c). Se puede implementar el filtro no recursivo B(z) usando una descomposición convencional bicomponente polifásica como
Figure imgf000015_0002
[0079] Por consiguiente, el reductor de frecuencia de muestreo puede estar estructurado al igual que en la Fig. 8(d). Después de usar la Identidad de Noble 1, se calcula la parte FIR a la tasa de muestreo más baja posible, como se muestra en la Fig. 8(e). De la Fig. 8(e) es fácil observar que la operación de FIR (retardo, decimadores y componentes polifásicos) se puede considerar una operación de suma de ventanas que usa un paso de entrada de dos muestras. Para dos muestras de entrada, se producirá una nueva muestra de salida, lo que efectivamente da lugar a una reducción de frecuencia de muestreo en un factor de 2.
[0080] En la Fig. 9(a) se muestra un diagrama de bloques del reductor de frecuencia de muestreo de factor de 1,5=3/2. El filtro de paso bajo de valor real se puede representar de nuevo como H(z) = B(z)/ A(z), donde B(z) es la parte no recursiva (FIR) y A(z) es la parte recursiva (IIR). Como anteriormente, para una implementación eficiente, usando las Identidades de Noble para reducir la complejidad informática, es beneficioso diseñar un filtro donde todos los polos tienen una multiplicidad de 2 (polos dobles) o una multiplicidad de 3 (polos triples) como A(z2) o A(z3), respectivamente. En este caso se eligen los polos dobles ya que el algoritmo de diseño para el filtro de paso bajo es más eficiente, aunque la parte recursiva es 1,5 veces más compleja de implementar en comparación con el enfoque de triple polo. Por consiguiente, el filtro se puede factorizar como se muestra en la Fig. 9(b). Usando la Identidad de Noble 2, la parte recursiva se puede mover delante del interpolador al igual que en la Fig. 9(c). Se puede implementar el filtro no recursivo B(z) usando una descomposición convencional polifásica de 2, 3 = 6 componentes como
N, 5
B{z) = Y b{ri)z~n = £ z-’E, (z6), donde
«=0 /=0
Figure imgf000015_0003
[0081] Por consiguiente, el reductor de frecuencia de muestreo puede estar estructurado al igual que en la Fig. 9(d). Después de usar tanto la Identidad de Noble 1 como 2, se calcula la parte FIR a la tasa de muestreo más baja posible, como se muestra en la Fig. 9(e). De la Fig. 9(e), es fácil ver que las muestras de salida de índice par se calculan usando el grupo más bajo de tres filtros polifásicos Eü(z), E2(z), E^z)) mientras que las muestras de índice impar se calculan a partir del grupo más alto (E-i(z), E3(z), E¡(z)). La operación de cada grupo (cadena de retardo, decimadores y componentes polifásicos) se puede considerar como una operación de suma de ventanas usando un paso de entrada de tres muestras. Los coeficientes de ventana usados en el grupo superior son los coeficientes de índice impar, mientras que el grupo inferior usa los coeficientes de índice par del filtro original B(z). Por consiguiente, en el caso de un grupo de tres muestras de entrada, se producirán dos nuevas muestras de salida, dando como resultado efectivamente a una reducción de frecuencia de muestreo de un factor de 1,5.
[0082] La señal en el dominio del tiempo del decodificador del núcleo (101 en la Fig. 1) también se puede submuestrear mediante el uso de transformadas de síntesis submuestreadas de menor tamaño en el decodificador del núcleo. El uso de una transformada de síntesis de menor tamaño ofrece incluso una reducción adicional de la complejidad informática. Dependiendo de la frecuencia de cruce, es decir, el ancho de banda de la señal del codificador por núcleo, la relación del tamaño de la transformada de síntesis y el tamaño nominal Q (Q < 1), da lugar a una señal de salida del codificador del núcleo que tiene una tasa de muestreo Qfs. Para procesar la señal submuestreada del codificador del núcleo en los ejemplos descritos en la presente solicitud, todos los bancos de filtros de análisis de la Fig. 1 (102, 103-32, 103-33 y 103-34) deben ser aumentados a escala en el factor Q, así como también los reductores de frecuencia de muestreo (301-2, 301-3 y 301-T) de la Fig. 3, el decimador 404 de la Fig.4 y el banco de filtros de análisis 601 de la Fig. 6. Aparentemente, se debe elegir Q de manera que todos los tamaños de los bancos de filtros sean números enteros.
[0083] La Fig. 10 ilustra la alineación de los bordes espectrales de las señales del transpondedor de HFR con los bordes espectrales de la tabla de frecuencias de ajuste de envolvente en un codificador potenciado por HFR, tal como SBR [iSo /IEC 14496-3:2009, "Information technology - Coding of audio-visual objects - Part 3: Audio]. La Fig. 10(a) muestra un gráfico estilístico de las bandas de frecuencia que comprenden la tabla de ajuste de envolventes, las denominadas bandas de factor de escala, que cubren el rango de frecuencia de la frecuencia de cruce kx a la frecuencia de parada ks. Las bandas de factor de escala constituyen la red de frecuencias usadas en un codificador potenciado por HFR al ajustar el nivel de energía de la frecuencia de banda alta regenerada, es decir, la envolvente de frecuencia. Con el fin de ajustar la envolvente, se promedia la energía de las señales en un bloque de tiempo/frecuencia limitado por los bordes de las bandas de factor de escala y los bordes de tiempo seleccionados. Si las señales generadas por diferentes órdenes de transposición no están alineadas con las bandas de factor de escala, como se ilustra en la Fig. 10(b), pueden surgir artefactos si la energía espectral cambia drásticamente en las proximidades del borde de una banda de transposición, ya que el proceso de ajuste de envolvente mantendrá la estructura espectral dentro de una banda de factor de escala. Por consiguiente, la solución propuesta es adaptar los bordes de frecuencia de las señales transpuestas a los bordes de las bandas de factor de escala como se muestra en la Fig. 10(c). En la figura, el borde superior de las señales generadas por los órdenes de transposición de 2 y 3 (7=2, 3) se reducen un poco, en comparación con la Fig. 10(b), con el fin de alinear los bordes de frecuencia de las bandas de transposición con los bordes de las bandas de factores de escala existentes.
[0084] En la Fig. 11 se representa un escenario realista que muestra los artefactos potenciales cuando se usan bordes no alineados. La Fig. 11(a) muestra de nuevo los bordes de banda de factor de escala. La Fig. 11(b) muestra las señales generadas por HFR no ajustadas de los órdenes de transposición T=2, 3 y 4 junto con la señal de la banda base decodificada del núcleo. La Fig. 11(c) muestra la señal con envolvente ajustada cuando se asume una envolvente de destino plana. Los bloques con áreas a cuadros representan bandas de factor de escala con altas variaciones de energía intrabanda, lo que puede causar anomalías en la señal de salida.
[0085] La Fig. 12 ilustra el escenario de la Fig. 11, pero esta vez usando bordes alineados. La Fig. 12(a) muestra los bordes de la banda de factor de escala, la Fig. 12(b) representa las señales generadas por HFR sin ajustar de los órdenes de transposición T=2, 3 y 4 junto con la señal de la banda base decodificada del núcleo y, en línea con la Fig.11(c), la Fig. 12(c) muestra la señal con envolvente ajustada cuando se asume una envolvente de destino plana. Como se observa en esta figura, no hay ninguna banda de factor de escala con altas variaciones de energía intrabanda debido a la falta de alineación de las bandas de señal transpuestas y las bandas de factor de escala y, por consiguiente, se reducen los artefactos potenciales.
[0086] La Fig. 13 ilustra la adaptación de los bordes de banda limitadora de HFR, como se describe, por ejemplo, en SBR [ISO/IEC 14496-3:2009, "Information technology - Coding of audio-visual objects - Part 3: Audio] a los parches armónicos en un codificador potenciado por HFR. El limitador opera en bandas de frecuencia que tienen una resolución mucho más gruesa que las bandas de factor de escala, pero el principio de operación es prácticamente el mismo. En el limitador, se calcula un valor de ganancia promedio para cada una de las bandas del limitador. No se permite que los valores de ganancia individuales, es decir, los valores de ganancia de envolvente para cada una de las bandas de factor de escala, excedan el valor de ganancia promedio del limitador en más de un determinado factor de multiplicación. El objetivo del limitador es suprimir las grandes variaciones de las ganancias de las bandas de factor de escala dentro de cada una de las bandas del limitador. Mientras que la adaptación de las bandas generadas por el transpondedor a las bandas de factor de escala garantiza pequeñas variaciones de la energía intrabanda dentro de una banda de factor de escala, la adaptación de los bordes de las bandas del limitador a los bordes de las bandas del transpondedor, maneja las diferencias de energía de mayor escala entre las bandas procesadas por el transpondedor. La Fig. 13(a) muestra los límites de frecuencia de las señales generadas por HFR de los órdenes de transposición T=2, 3 y 4. Los niveles de energía de las diferentes señales transpuestas pueden ser sustancialmente diferentes. La Fig. 13(b) muestra las bandas de frecuencia del limitador que típicamente tienen una anchura constante en una escala de frecuencia logarítmica. Los bordes de las bandas de frecuencia del transpondedor se suman como bordes constantes del limitador y el resto de los bordes del limitador son recalculados para mantener las relaciones logarítmicas lo más próximas posibles, como se ilustra, por ejemplo, en la Fig. 13(c). Aunque se han descrito algunos aspectos en el contexto de un aparato, es evidente que estos aspectos también representan una descripción del procedimiento correspondiente, donde un bloque o dispositivo corresponde a una etapa de procedimiento o un rasgo de una etapa de procedimiento. De manera análoga, los aspectos descritos en el contexto de una etapa de procedimiento también representan una descripción de un bloque o elemento o rasgo correspondiente de un aparato correspondiente.
[0087] Ejemplos adicionales emplean un esquema de parcheo mixto que se muestra en la Fig. 21, donde se realiza el procedimiento de parcheo mixto dentro de un bloque de tiempo. Para una cobertura completa de las diferentes regiones del espectro de HF, una BWE comprende varios parches. En HBE, los parches más altos requieren altos factores de transposición dentro de los vocodificadores de fase, que deterioran particularmente la calidad perceptual de los transitorios.
[0088] Por tanto, los ejemplos generan los parches de mayor orden que ocupan las regiones espectrales superiores, preferentemente mediante un parcheo de copiado SSB eficiente desde el punto de vista informático y los parches de menor orden que cubren las regiones espectrales intermedias, para las cuales se desea la preservación de la estructura armónica, preferentemente por parcheo de HBE. La mezcla individual de los procedimientos de parcheo puede ser estática con el tiempo o, preferentemente, puede ser señalizada en el flujo de bits.
[0089] En el caso de la operación de copiado, se puede usar la información de baja frecuencia como se muestra en la Fig. 21. Como alternativa, se pueden usar los datos de los parches que se generaron usando los procedimientos de HBE como se ilustra en la Fig. 21. Esto último conlleva a una estructura tonal menos densa para los parches más altos. Además de estos dos ejemplos, es concebible cada combinación de copiado y HBE.
[0090] Las ventajas de los conceptos propuestos son
- Mejora de la calidad perceptual de los transitorios
- Reducción de la complejidad informática
[0091] La Fig. 26 ilustra una cadena de procesamiento preferida cuya finalidad es la extensión de ancho de banda, donde se pueden realizar diferentes operaciones de procesamiento dentro del procesamiento en subbandas no lineales indicado en los bloques 1020a, 1020b. La cascada de bancos de filtros 2302, 2304, 2307 está representada en la Fig. 26 por el bloque 1010. Es más, el bloque 2309 puede corresponder a los elementos 1020a, 1020b y el ajustador de envolvente 1030 puede colocarse entre el bloque 2309 y el bloque 2311 de la Fig. 23 o puede colocarse después del procesamiento en el bloque 2311. En esta implementación, el procesamiento selectivo de bandas de la señal procesada en el dominio del tiempo, tal como la señal de ancho de banda extendido se realiza en el dominio del tiempo en lugar de en el dominio de la subbanda, que existe antes del banco de filtros de síntesis 2311.
[0092] La Fig. 26 ilustra un aparato para generar una señal de audio de ancho de banda extendido a partir de una señal de entrada de baja banda 1000 de acuerdo con una realización adicional. El aparato comprende un banco de filtros de análisis 1010, un procesador de subbandas no lineales por subbandas 1020a, 1020b, un ajustador de envolvente conectado posteriormente 1030 o, en términos generales, un procesador de reconstrucción de alta frecuencia que opera con parámetros de reconstrucción de alta frecuencia como, por ejemplo, la entrada en la línea de parámetros 1040. El ajustador de envolvente, o en términos generales, el procesador de reconstrucción de alta frecuencia procesa las señales de subbandas individuales para cada canal de subbanda e introduce las señales de subbanda procesadas para cada canal de subbanda en un banco de filtros de síntesis 1050. El banco de filtros de síntesis 1050 recibe, en sus señales de entrada de los canales inferiores, una representación de subbanda de la señal del decodificador del núcleo de baja banda. Dependiendo de la implementación, la baja banda también puede derivar de las salidas del banco de filtros de análisis 1010 de la Fig. 26. Las señales de subbandas transpuestas son alimentadas a los canales superiores de banco de filtros del banco de filtros de síntesis para realizar la reconstrucción de alta frecuencia.
[0093] El banco de filtros 1050 finalmente produce una señal de salida del transpondedor que comprende extensiones de ancho de banda en factores de transposición de 2, 3 y 4, y la señal producida por el bloque 1050 ya no se limita por el ancho de banda a la frecuencia de cruce, es decir, a la frecuencia más alta de la señal del codificador por núcleo que corresponde a la frecuencia más baja de los componentes de la señal generada por SBR o HFR.
[0094] En la realización de la Fig. 26, el banco de filtros de análisis realiza un muestreo dos veces superior y tiene un cierto espaciado de subbandas de análisis 1060. El banco de filtros de síntesis 1050 tiene un espaciado de subbandas de síntesis 1070 que, en esta realización, tiene el doble del tamaño del espaciado de subbandas de análisis, lo que resulta en una contribución de transposición, como se analizará más adelante en el contexto de la Fig. 27.
[0095] La Fig. 27 ilustra una implementación detallada de una realización preferida de un procesador de subbandas no lineales 1020a en la Fig. 26. El circuito ilustrado en la Fig. 27 recibe como entrada una señal de subbanda única 108, que es procesada en tres "ramificaciones". La ramificación superior 110a es para la transposición en un factor de transposición de 2. La ramificación del centro de la Fig. 27 indicada en 110b es para una transposición en un factor de transposición de 3 y la ramificación inferior de la Fig. 27 es para una transposición en un factor de transposición de 4 y está indicada por el número de referencia 110c. Sin embargo, la transposición real obtenida por cada elemento de procesamiento de la Fig. 27 es solo 1 (es decir, que no hay transposición) en la ramificación 110a. La transposición real obtenida por el elemento de procesamiento ilustrado en la Fig. 27 de la ramificación intermedia 110b es igual a 1,5 y la transposición real de la ramificación inferior 110c es igual a 2. Esto se indica por los números entre paréntesis a la izquierda de la Fig. 27, donde se indican los factores de transposición T. Las transposiciones de 1,5 y 2 representan una primera contribución de transposición obtenida al tener las operaciones de decimación en las ramificaciones 110b, 110c y una dilatación del tiempo por el procesador de superposición y suma. La segunda contribución, es decir, la duplicación de la transposición, es obtenida por el banco de filtros de síntesis 105, que tiene un espaciado de subbandas de síntesis 107 que es el doble del espaciado de subbandas del banco de filtros de análisis. Por lo tanto, puesto que el banco de filtros de síntesis tiene el doble del espaciado de subbandas de análisis, ninguna función de decimación tiene lugar en la ramificación 110a.
[0096] Sin embargo, la ramificación 110b tiene una funcionalidad de decimación con el fin de obtener una transposición de 1,5. Debido al hecho de que el banco de filtros de síntesis tiene el doble de espaciado físico de subbandas del banco de filtros de análisis, se obtiene un factor de transposición de 3 como se indica en la Fig. 27 a la izquierda del extractor de bloques de la segunda ramificación 110b.
[0097] De manera análoga, la tercera ramificación tiene una funcionalidad de decimación que corresponde a un factor de transposición de 2, y la contribución final del espaciado de subbandas diferente en el banco de filtros de análisis y el banco de filtros de síntesis corresponde por último a un factor de transposición de 4 de la tercera ramificación 110c.
[0098] Particularmente, cada ramificación tiene un extractor de bloques 120a, 120b, 120c y cada uno de estos extractores de bloques puede ser similar al extractor de bloques 1800 de la Fig. 18. Es más, cada ramificación tiene una calculadora de fase 122a, 122b y 122c, y la calculadora de fase puede ser similar a la calculadora de fase 1804 de la Fig. 18. Es más, cada ramificación tiene un ajustador de fase 124a, 124b, 124c y el ajustador de fase puede ser similar al ajustador de fase 1806 de la Fig. 18. Es más, cada ramificación tiene un enventanador 126a, 126b, 126c, donde cada uno de estos enventanadores puede ser similar al enventanador 1802 de la Fig. 18. No obstante, los enventanadores 126a, 126b, 126c también pueden estar configurados para aplicar una ventana rectangular junto con cierto "relleno con ceros". Las señales de transposición o de parche de cada ramificación 110a, 110b, 110c, en la realización de la Fig. 27, se introducen en el sumador 128, que suma la contribución de cada ramificación a la señal de subbanda actual para obtener finalmente los denominados bloques de transposición en la salida del sumador 128. A continuación, se realiza un procedimiento de superposición y suma en el sumador de superposición 130 y el sumador de superposición 130 puede ser similar al bloque de superposición/suma 1808 de la Fig. 18. El sumador de superposición aplica un valor de avance de superposición y suma de 2 e, donde e es el valor de superposición y avance o "valor de paso" de los extractores de bloques 120a, 120b, 120c, y el sumador de superposición 130 produce la señal transpuesta que, en la realización de la Fig. 27, es una salida de subbanda única del canal k, es decir, del canal de subbanda observado actualmente. El procesamiento ilustrado en la Fig. 27 se realiza para cada subbanda de análisis o para un determinado grupo de subbandas de análisis y, como se ilustra en la Fig. 26, las señales de subbandas transpuestas se introducen en el banco de filtros de síntesis 1050 después de ser procesadas por el bloque 1030 para obtener finalmente la señal de salida del transpondedor ilustrada en la Fig. 26 a la salida del bloque 1050.
[0099] En una realización, el extractor de bloques 120a de la primera ramificación del transpondedor 110a extrae 10 muestras de subbandas y posteriormente se realiza la conversión de estas 10 muestras de QMF a las coordenadas polares. Esta salida, generada por el ajustador de fase 124a, es reenviada luego al enventanador 126a, que extiende la salida mediante ceros del valor primero y último del bloque, donde esta operación es equivalente a un enventanado (síntesis) con una ventana rectangular de longitud 10. El extractor de bloques 120a de la ramificación 110a no realiza una decimación. Por lo tanto, las muestras extraídas por el extractor de bloques son asignadas a un bloque extraído en el mismo espaciado de muestras que cuando fueran extraídas.
[0100] Sin embargo, esto es diferente para las ramificaciones 110b y 110c. El extractor de bloques 120b extrae preferentemente un bloque de 8 muestras de subbanda y distribuye estas 8 muestras de subbanda en el bloque extraído en un espaciado diferente de las muestras de subbandas. Las entradas de muestras de subbandas que no son enteras del bloque extraído se obtienen mediante una interpolación, y las muestras de QMF así obtenidas, junto con las muestras interpoladas, se convierten a coordenadas polares y son procesadas por el ajustador de fase. Después, de nuevo, se realiza el enventanado en el enventanador 126b con el fin de extender la salida del bloque por el ajustador de fase 124b mediante ceros para las primeras dos muestras y las últimas dos muestras, operación que equivale a un enventanado (síntesis) con una ventana rectangular de longitud 8.
[0101] El extractor de bloques 120c está configurado para extraer un bloque con una ampliación del plazo de tiempo de 6 muestras de subbandas y realiza una decimación de un factor de decimación de 2, realiza una conversión de las muestras de QMF a coordenadas polares y, de nuevo, realiza una operación en el ajustador de fase 124b y la salida se extiende de nuevo con ceros, sin embargo ahora para las primeras tres muestras de subbandas y las últimas tres muestras de subbandas. Esta operación es equivalente a un enventanado (síntesis) con una ventana rectangular de longitud 6.
[0102] A continuación, las salidas de transposición de cada ramificación son sumadas por el sumador 128 para formar la salida combinada de QMF, y por último se superponen las salidas combinadas de QMF usando la superposición y suma en el bloque 130, donde el valor de avance de superposición y suma o de paso es el doble del valor de paso de los extractores de bloques 120a, 120b, 120c como se ha analizado anteriormente.
[0103] Un ejemplo comprende un procedimiento para decodificar una señal de audio mediante el uso de transposición armónica basada en bloques de subbandas, que comprende el filtrado de una señal decodificada del núcleo por medio de un banco de filtros de análisis de M bandas para obtener un conjunto de señales de subbandas; la síntesis de un subconjunto de dichas señales de subbandas por medio de bancos de filtros de síntesis submuestreados que tienen un número reducido de subbandas, para obtener señales submuestreadas en el rango de origen.
[0104] Un ejemplo se refiere a un procedimiento para alinear los bordes de las bandas espectrales de las señales generadas por HFR con los bordes espectrales usados en un proceso paramétrico.
[0105] Un ejemplo se refiere a un procedimiento para alinear los bordes espectrales de las señales generadas por HFR con los bordes espectrales de la tabla de frecuencias de ajuste de envolvente que comprende: la búsqueda del borde más alto de la tabla de frecuencias de ajuste de envolvente que no exceda los límites fundamentales de ancho de banda de la señal generada por HFR del factor de transposición T; y que usa el borde más alto encontrado como límite de frecuencia de la señal generada por HFR del factor de transposición T.
[0106] Un ejemplo se refiere a un procedimiento para alinear los bordes espectrales de la herramienta limitadora con los bordes espectrales de las señales generadas por HFR que comprende: la suma de los bordes de frecuencia de las señales generadas por HFR a la tabla de bordes usada al crear los bordes de las bandas de frecuencia usados por la herramienta limitadora; y forzar al limitador a usar los bordes de frecuencia sumados como bordes constantes y a ajustar en consecuencia los bordes restantes.
[0107] Una realización se refiere a la transposición combinada de una señal de audio que comprende varios órdenes de transposición de números enteros en un dominio de bancos de filtros de baja resolución donde la operación de transposición se realiza en bloques de tiempo de señales de subbandas.
[0108] Una realización adicional se refiere a la transposición combinada, donde los órdenes de transposición superiores a 2 se incrustan en un entorno de transposición de orden 2.
[0109] Un ejemplo adicional se refiere a la transposición combinada, donde los órdenes de transposición superiores a 3 se incrustan en un entorno de transposición de orden 3, mientras que los órdenes de transposición inferiores a 4 se realizan por separado.
[0110] Un ejemplo adicional se refiere a la transposición combinada, donde se crean órdenes de transposición (por ejemplo, órdenes de transposición superiores a 2) mediante la replicación de órdenes de transposición calculados anteriormente (es decir, especialmente los órdenes más bajos) que incluyen el ancho de banda codificado por núcleo. Cada combinación concebible de órdenes de transposición disponibles y ancho de banda del núcleo es posible sin restricciones.
[0111] Una realización se refiere a la reducción de la complejidad informática debido al número reducido de bancos de filtros de análisis que son necesarios para la transposición.
[0112] Un ejemplo se refiere a un aparato para generar una señal de ancho de banda extendido a partir de una señal de audio de entrada, que comprende: un parcheador para parchear una señal de audio de entrada para obtener una primera señal parcheada y una segunda señal parcheada, teniendo la segunda señal parcheada una frecuencia de parche diferente en comparación con la primera señal parcheada, donde la primera señal parcheada se genera usando un primer algoritmo de parcheo y la segunda señal parcheada se genera usando un segundo algoritmo de parcheo; y un combinador para combinar la primera señal parcheada y la segunda señal parcheada para obtener la señal de ancho de banda extendido.
[0113] Un ejemplo adicional se refiere a este aparato acorde, en el que el primer algoritmo de parcheo es un algoritmo de parcheo armónico y el segundo algoritmo de parcheo es un algoritmo de parcheo no armónico.
[0114] Un ejemplo adicional se refiere a un aparato anterior, en el que la primera frecuencia de parcheo es más baja que la segunda frecuencia de parcheo o viceversa.
[0115] Un ejemplo adicional se refiere a un aparato anterior, en el que la señal de entrada comprende una información de parcheo; y en el que el parcheador está configurado para ser controlado por la información de parcheo extraída de la señal de entrada para variar el primer algoritmo de parcheo o el segundo algoritmo de parcheo de acuerdo con la información de parcheo.
[0116] Un ejemplo adicional se refiere a un aparato anterior, en el que el dispositivo de parcheo funciona para parchear bloques posteriores de muestras de señales de audio y en el que el parcheador está configurado para aplicar el primer algoritmo de parcheo y el segundo algoritmo de parcheo al mismo bloque de muestras de audio.
[0117] Un ejemplo adicional se refiere a un aparato anterior, en el que el dispositivo de parcheo comprende, en órdenes arbitrarios, un decimador controlado por un factor de extensión de ancho de banda, un banco de filtros y un estirador para una señal de subbanda de banco de filtros.
[0118] Un ejemplo adicional se refiere a un aparato anterior, en el que el estirador comprende un extractor de bloques para extraer un número de bloques superpuestos de acuerdo con un valor de avance de extracción; un ajustador de fase o enventanador para ajustar los valores de muestreo de subbandas en cada bloque basándose en una función de ventana o una corrección de fase; y un sumador de superposición para realizar un procesamiento de superposición y suma de bloques con ventana y con ajuste de fases usando un valor de avance de superposición superior al valor de avance de extracción.
[0119] Una realización adicional se refiere a un aparato para extender el ancho de banda de una señal de audio que comprende: un banco de filtros para filtrar la señal de audio para obtener señales de subbandas con reducción de frecuencia de muestreo; una pluralidad de diferentes procesadores de subbandas para procesar diferentes señales de subbandas de diferentes maneras, realizando los procesadores de subbandas diferentes operaciones de dilatación de tiempo de las señales de subbandas usando diferentes factores de estiramiento; y un fusionador para fusionar la salida de subbandas procesadas por medio de la pluralidad de procesadores de subbandas diferentes para obtener una señal de audio con ancho de banda extendido.
[0120] Un ejemplo adicional se refiere a un aparato para reducir la frecuencia de muestreo de una señal de audio que comprende: un modulador; un interpolador que usa un factor de interpolación; un filtro de paso bajo complejo; y un decimador que usa un factor de decimación, donde el factor de decimación es superior al factor de interpolación.
[0121] Un ejemplo se refiere a un aparato para reducir la frecuencia de muestreo de una señal de audio que comprende: un primer banco de filtros para generar una pluralidad de señales de subbanda a partir de una señal de audio, donde una tasa de muestreo de la señal de subbanda es inferior a una tasa de muestreo de una señal de audio; al menos un banco de filtros de síntesis seguido de un banco de filtros de análisis para realizar una conversión de la tasa de muestreo, teniendo el banco de filtros de síntesis un número de canales diferente de un número de canales del banco de filtros de análisis; un procesador de dilatación de tiempo para procesar la señal con tasa de muestreo convertida; y un combinador para combinar la señal con dilatación de tiempo y una señal de baja banda o una señal con dilatación de tiempo diferente.
[0122] Un ejemplo adicional se refiere a un aparato para reducir la frecuencia de muestreo de una señal de audio en un factor de reducción de frecuencia de muestreo no entero que comprende: un filtro digital; un interpolador que tiene un factor de interpolación; un elemento polifásico que tiene que tiene derivaciones pares e impares; y un decimador que tiene un factor de decimación que es superior al factor de interpolación, siendo el factor de decimación y el factor de interpolación seleccionados de tal manera que la relación del factor de interpolación y el factor de decimación es un número no entero.
[0123] Una realización se refiere a un aparato para procesar una señal de audio, que comprende: un decodificador del núcleo que tiene un tamaño de transformada de síntesis que es inferior a un tamaño de transformada nominal en un factor, por lo que una señal de salida es generada por el decodificador del núcleo que tiene una tasa de muestreo inferior a una tasa de muestreo nominal que corresponde al tamaño de transformada nominal; y un procesador posterior que tiene uno o más bancos de filtros, uno o más dilatadores de tiempo y un fusionador, donde un número de canales de bancos de filtros del uno o más bancos de filtros se reduce en comparación con un número determinado por el tamaño de transformada nominal.
[0124] Un ejemplo adicional se refiere a un aparato para procesar una señal de baja banda que comprende: un generador de parches para generar múltiples parches usando la señal de audio de baja banda, un ajustador de envolvente para ajustar una envolvente de la señal usando factores de escala dados para las bandas de factores de escala adyacentes que tienen bordes de bandas de factores de escala, donde el generador de parches está configurado para realizar los múltiples parches, por lo que un borde entre los parches adyacentes coincide con un borde entre las bandas de factores de escala adyacentes de la escala de frecuencias.
[0125] Un ejemplo se refiere a un aparato para procesar una señal de audio de baja banda que comprende: un generador de parches para generar múltiples parches usando la señal de audio de baja banda; y un limitador del ajuste de envolvente para limitar los valores de ajuste de envolvente de una señal mediante la limitación de las bandas limitadoras adyacentes que tienen bordes de bandas limitadoras, donde el generador de parches está configurado para realizar los múltiples parches de manera que un borde entre parches adyacentes coincida con un borde entre bandas limitadoras adyacentes en una escala de frecuencias.
[0126] El procesamiento inventivo es útil para potenciar códecs de audio que se basan en un esquema de extensión de ancho de banda. Especialmente, si una calidad perceptual óptima en una velocidad de transmisión de bits dada es muy importante y, al mismo tiempo, el poder de procesamiento es un recurso limitado.
[0127] Las aplicaciones más destacadas son los decodificadores de audio que, a menudo, se implementan en dispositivos portátiles y, por tanto, funcionan con una fuente de alimentación de baterías.
[0128] La señal de audio codificada puede almacenarse en un medio de almacenamiento digital o puede transmitirse en un medio de transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión por cable, tal como Internet.
[0129] Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención se pueden implementar en hardware o software. La implementación puede ser realizada utilizando un medio de almacenamiento digital, por ejemplo un disquete, un DVD, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria flash que tiene señales de control que se pueden leer electrónicamente almacenadas en el mismo, que cooperan (o son capaces de cooperar) con un sistema informático programable de tal manera que se realiza el procedimiento respectivo.
[0130] Algunas realizaciones según la invención comprenden un soporte de datos que tiene señales de control electrónicamente legibles, que son capaces de cooperar con un sistema informático programable, de tal forma que se realiza uno de los procedimientos descritos en esta invención.
[0131] En general, las realizaciones de la presente invención se pueden implementar como un producto de programa informático con un código de programa, siendo el código de programa operativo para realizar uno de los procedimientos cuando el producto de programa informático se ejecuta en un ordenador. El código de programa se puede almacenar, por ejemplo, en un soporte legible por máquina.
[0132] Otras realizaciones comprenden el programa informático para realizar uno de los procedimientos descritos en esta invención, almacenado en un soporte legible por máquina.
[0133] En otras palabras, una realización del procedimiento inventivo es, por lo tanto, un programa informático que tiene un código de programa para realizar uno de los procedimientos descritos en esta solicitud, cuando el programa informático se ejecuta en un ordenador.
[0134] Una realización adicional de los procedimientos inventivos es, por lo tanto, un soporte de datos (o un medio de almacenamiento digital, o un
medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para realizar uno de los procedimientos descritos en esta invención.
[0135] Una realización adicional del procedimiento inventivo es, por lo tanto, un flujo de datos o una secuencia de señales que representan el programa informático para realizar uno de los procedimientos descritos en esta invención. El flujo de datos o la secuencia de señales pueden, por ejemplo, estar configurados para ser transferidos a través de una conexión de comunicación de datos, por ejemplo, a través de Internet.
[0136] Una realización adicional comprende un medio de procesamiento, por ejemplo, un ordenador, o un dispositivo lógico programable, configurado para o adaptado para realizar uno de los procedimientos descritos en esta invención.
[0137] Una realización adicional comprende un ordenador que tiene instalado en el mismo el programa informático para realizar uno de los procedimientos descritos en esta invención.
[0138] En algunas realizaciones, se puede usar un dispositivo lógico programable (por ejemplo, una matriz de puertas programables in situ) para realizar algunas o todas las funcionalidades de los procedimientos descritos en esta invención. En algunas realizaciones, una matriz de puertas programables in situ puede cooperar con un microprocesador con el fin de realizar uno de los procedimientos descritos en esta invención. En general, los procedimientos se realizan preferentemente por cualquier aparato de hardware.
[0139] Las realizaciones descritas anteriormente son simplemente ilustrativas de los principios de la presente invención. Se entiende que, para otros expertos en la materia, resultarán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos en esta invención. Por lo tanto, es la intención que la invención esté limitada solo por el alcance de las siguientes reivindicaciones de patente y no por los detalles específicos presentados a modo de descripción y la explicación de las realizaciones en esta invención.
Bibliografía:
[0140]
[1] M. Dietz, L. Liljeryd, K. Kjorling y O. Kunz, "Spectral Band Replication, a novel approach in audio coding," en la 112a Convención a Es , Múnich, mayo de 2002.
[2] S. Meltzer, R. Bohm y F. Henn, "SBR enhanced audio codecs for digital broadcasting such as"Digital Radio Mondiale"(DRM)," en la112a Convención AES, Múnich, mayo de 2002.
[3] T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," en la 112a Convención a Es , Múnich, mayo de 2002.
[4] Norma Internacional ISO/IEC 14496-3:2001/FPDAM 1, "Bandwidth Extensión", ISO/IEC, 2002. Speech bandwidth extension method and apparatus Vasu lyengar y col.
[5] E. Larsen, R. M. Aarts y M. Danessis. Efficient high-frequency bandwidth extension of music and speech. En la 112a Convención AES, Múnich, Alemania, mayo de 2002.
[6] R. M. Aarts, E. Larsen, y O. Ouweltjes. A unified approach to low- and high frequency bandwidth extension. En la 115a Convención AES, Nueva York, Estados Unidos, octubre de 2003.
[7] K. Kayhko. A Robust Wideband Enhancement for Narrowband Speech Signal. Research Report, Universidad Tecnológica de Helsinki, Laboratorio de acústica y procesamiento de señales de audio, 2001.
[8] E. Larsen y R. M. Aarts. Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004.
[9] E. Larsen, R. M. Aarts y M. Danessis. Efficient high-frequency bandwidth extension of music and speech. En la 112a Convención AES, Múnich, Alemania, mayo de 2002.
[10] J. Makhoul. Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21 (3), junio de 1973.
[11] Solicitud de patente estadounidense 08/951.029; Audio band width extending system and method
[12] Patente estadounidense 6895375, Malah, D y Cox, R. V.: System for bandwidth extension of Narrow-band speech
[13] Frederik Nagel, Sascha Disch, "A harmonic bandwidth extension method for audio codecs," ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwán, abril de 2009.
[14] Frederik Nagel, Sascha Disch, Nikolaus Rettelbach, "A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs," 126a Convención AES, Múnich, Alemania, mayo de 2009
[15] M. Puckette. Phase-locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics, Mohonk 1995.", Robel, A.: Transient detection and preservation in the phase vocoder; citeseer.ist.psu.edu/679246.html
[16] Laroche L., Dolson M.: "Improved phase vocoder timescale modification of audio", IEEE Trans. Speech and Audio Processing, vol. 7, n.° 3, págs. 323--332,
[17] Patente estadounidense 6549884 Laroche, J. y Dolson, M.: Phase-vocoder pitch-shifting
[18] Herre, J.; Faller, C.; Ertel, C.; Hilpert, J.; Holzer, A.; Spenger, C, "MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio," 116a Conv. Aud. Eng. Soc., mayo de 2004
[19] Neuendorf, Max; Gournay, Philippe; Multrus, Markus; Lecomte, Jeremie; Bessette, Bruno; Geiger, Ralf; Bayer, Stefan; Fuchs, Guillaume; Hilpert, Johannes; Rettelbach, Nikolaus; Salami, Redwan; Schuller, Gerald; Lefebvre, Roch; Grill, Bernhard: Unified Speech and Audio Coding Scheme for High Quality at Low Bitrates, ICASSP 2009, 19-24 de abril, 2009, Taipei, Taiwán
[20] Bayer, Stefan; Bessette, Bruno; Fuchs, Guillaume; Geiger, Ralf; Goumay, Philippe; Grill, Bernhard; Hilpert, Johannes; Lecomte, Jeremie; Lefebvre, Roch; Multrus, Markus; Nagel, Frederik; Neuendorf, Max; Rettelbach, Nikolaus; Robilliard, Julien; Salami, Redwan; Schuller, Gerald: A Novel Scheme for Low Bitrate Unified Speech and Audio Coding, 126a Convención AES, 7 de mayo, 2009, Múnich

Claims (3)

REIVINDICACIONES
1. Aparato para realizar una reconstrucción de alta frecuencia (HFR) de una señal de audio de entrada (2300), que comprende:
un banco de filtros de análisis (601, 2302) para recibir una representación en el dominio del tiempo de la señal de audio de entrada (2300) y para analizar la representación en el dominio del tiempo para obtener una pluralidad de primeras señales de subbanda (2303), donde una tasa de muestreo de una primera señal de subbanda de la pluralidad de primeras señales de subbanda (2303) es igual a una tasa de muestreo (f2) de la señal de audio de entrada (2300) dividida por un número (M) de canales de banco de filtros de análisis del banco de filtros de análisis (601,2302), donde el banco de filtros de análisis (601, 2302) es un banco de filtros de análisis QMF como se define por la Norma de Replicación de Banda Espectral (SBR), ISO/IEC 14496-3:2009, "Information technology - Coding of audio-visual objects - Part 3: Audio, y donde el número (M) de canales de banco de filtros de análisis del banco de filtros de análisis (601,2302) es de 32,
un banco de filtros de síntesis (602-2, 602-3, 602-T, 2304) para sintetizar una señal de audio intermedia (2306) a partir de la pluralidad de primeras señales de subbanda (2303), donde un subgrupo (2305) de la pluralidad de primeras señales de subbanda (2303) se introduce en el banco de filtros de síntesis (602-2, 602-3, 602-T, 2304), y donde las señales de subbanda restantes de la pluralidad de primeras señales de subbanda no se introducen en el banco de filtros de síntesis (602-2, 602-3, 602-T, 2304), donde un número de canales de banco de filtros (Ms) del banco de filtros de síntesis (602-2, 602-3, 602-T, 2304) es inferior a un número de canales (M) del banco de filtros de análisis (601, 2302), donde el banco de filtros de síntesis (602-2, 602-3, 602-T, 2304) es un banco de filtros de síntesis QMF; y
un banco de filtros de análisis adicional (603-2, 603-3, 603-T, 2307) para generar una pluralidad de segundas señales de subbanda (2308) a partir de la señal de audio intermedia (2306), donde el banco de filtros de análisis adicional (603-2, 603-3, 603-T, 2307) tiene un número de canales (Ma) que es igual a dos veces el número de canales del banco de filtros de síntesis (602-2, 602-3, 602-T, 2304), por lo que una tasa de muestreo de una segunda señal de subbanda de la pluralidad de segundas señales de subbanda (2308) tiene un valor que es igual a la mitad del valor de una tasa de muestreo de la primera señal de subbanda de la pluralidad de primeras señales de subbanda (2303), donde el banco de filtros de análisis adicional (603-2, 603-3, 603-T, 2307) es un banco de filtros de análisis QMF adicional;
un procesador de dilatación del tiempo (100A, 100B, 100C, 604-2, 604-3, 604-T) para procesar la pluralidad de segundas señales de subbanda (2308); y
un combinador (605, 2311) para combinar las señales de subbanda procesadas generadas por el procesador de dilatación del tiempo (100A, 100B, 100C, 604-2, 604-3, 604-T) y la pluralidad de primeras señales de subbanda (2303) para obtener una señal en el dominio del tiempo reconstruida de alta frecuencia,
donde el banco de filtros de síntesis (602-2, 602-3, 602-T, 2304) se obtiene mediante submuestreo de un banco de filtros QMF de 64 bandas original, donde los coeficientes de filtro prototipo del banco de filtros de síntesis (602­ 2, 602-3, 602-T, 2304) se encuentran por interpolación lineal de un filtro prototipo original, y
donde el banco de filtros de síntesis (602-2, 602-3, 602-T, 2304) tiene 12 bandas que incluyen las subbandas con los índices de base cero de 8 a 19 en el banco de filtros de análisis (601, 2302), y una primera banda con el índice 8 y una última banda con el índice 19 se ponen a cero.
2. Procedimiento para realizar una reconstrucción de alta frecuencia (HFR) de una señal de audio de entrada (2300), que comprende:
un filtrado de análisis usando un banco de filtros de análisis (601, 2302) para recibir una representación en el dominio del tiempo de la señal de audio de entrada (2300) y para analizar la representación en el dominio del tiempo para obtener una pluralidad de primeras señales de subbanda (2303), donde una tasa de muestreo de una primera señal de subbanda de la pluralidad de primeras señales de subbanda (2303) es igual a una tasa de muestreo (f2) de la señal de audio de entrada (2300) dividida por un número (M) de canales de banco de filtros de análisis del banco de filtros de análisis (601, 2302), donde el banco de filtros de análisis (601, 2302) es un banco de filtros de análisis QMF como se define por la Norma de Replicación de Banda Espectral (SBR), ISO/IEC 14496-3:2009, "Information technology - Coding of audio-visual objects - Part 3: Audio, y donde el número (M) de canales de banco de filtros de análisis del banco de filtros de análisis (601,2302) es de 32,
un filtrado de síntesis usando un banco de filtros de síntesis (602-2, 602-3, 602-T, 2304) para sintetizar una señal de audio intermedia (2306) a partir de la pluralidad de primeras señales de subbanda (2303), donde un subgrupo (2305) de la pluralidad de primeras señales de subbanda (2303) se introduce en el banco de filtros de síntesis (602-2, 602-3, 602-T, 2304), y donde las señales de subbanda restantes de la pluralidad de primeras señales de subbanda no se introducen en el banco de filtros de síntesis (602-2, 602-3, 602-T, 2304), donde un número de canales de banco de filtros (Ms) del banco de filtros de síntesis (602-2, 602-3, 602-T, 2304) es inferior a un número de canales (M) del banco de filtros de análisis (601, 2302), donde el banco de filtros de síntesis (602-2, 602-3, 602-T, 2304) es un banco de filtros de síntesis QMF; y
un filtrado de análisis usando un banco de filtros de análisis adicional (603-2, 603-3, 603-T, 2307) para generar una pluralidad de segundas señales de subbanda (2308) a partir de la señal de audio intermedia (2306), donde el banco de filtros de análisis adicional (603-2, 603-3, 603-T, 2307) tiene un número de canales (Ma) que es igual a dos veces el número de canales del banco de filtros de síntesis (602-2, 602-3, 602-T, 2304), por lo que una tasa de muestreo de una segunda señal de subbanda de la pluralidad de segundas señales de subbanda (2308) tiene un valor que es igual a la mitad del valor de una tasa de muestreo de la primera señal de subbanda de la pluralidad de primeras señales de subbanda (2303), donde el banco de filtros de análisis adicional (603-2, 603-3, 603-T, 2307) es un banco de filtros de análisis QMF adicional;
un procesamiento de la pluralidad de segundas señales de subbanda (2308) usando un procesador de dilatación del tiempo (100A, 100B, 100C, 604-2, 604-3, 604-T); y
una combinación (605, 2311) de las señales de subbanda procesadas generadas por el procesamiento y la pluralidad de primeras señales de subbanda (2303) para obtener una señal en el dominio del tiempo reconstruida de alta frecuencia, donde el banco de filtros de síntesis (602-2, 602-3, 602-T, 2304) se obtiene mediante submuestreo de un banco de filtros QMF de 64 bandas original, donde los coeficientes de filtro prototipo del banco de filtros de síntesis (602-2, 602-3, 602-T, 2304) se encuentran por interpolación lineal de un filtro prototipo original, y
donde el banco de filtros de síntesis (602-2, 602-3, 602-T, 2304) tiene 12 bandas que incluyen las subbandas con los índices de base cero de 8 a 19 en el banco de filtros de análisis (601,2302), y una primera banda con el índice 8 y una última banda con el índice 19 se ponen a cero.
3. Programa informático que tiene un código de programa para realizar, cuando es ejecutado en un ordenador, un procedimiento de acuerdo con la reivindicación 2.
ES19179788T 2010-03-09 2011-03-04 Reconstrucción de alta frecuencia de una señal de audio de entrada usando bancos de filtros en cascada Active ES2935637T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US31212710P 2010-03-09 2010-03-09

Publications (1)

Publication Number Publication Date
ES2935637T3 true ES2935637T3 (es) 2023-03-08

Family

ID=43987731

Family Applications (2)

Application Number Title Priority Date Filing Date
ES11715452.6T Active ES2522171T3 (es) 2010-03-09 2011-03-04 Aparato y método para procesar una señal de audio usando alineación de borde de patching
ES19179788T Active ES2935637T3 (es) 2010-03-09 2011-03-04 Reconstrucción de alta frecuencia de una señal de audio de entrada usando bancos de filtros en cascada

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES11715452.6T Active ES2522171T3 (es) 2010-03-09 2011-03-04 Aparato y método para procesar una señal de audio usando alineación de borde de patching

Country Status (18)

Country Link
US (7) US9792915B2 (es)
EP (5) EP2545548A1 (es)
JP (2) JP5523589B2 (es)
KR (2) KR101414736B1 (es)
CN (2) CN103038819B (es)
AR (2) AR080476A1 (es)
AU (2) AU2011226212B2 (es)
BR (5) BR122021014312B1 (es)
CA (2) CA2792450C (es)
ES (2) ES2522171T3 (es)
HK (1) HK1181180A1 (es)
MX (2) MX2012010416A (es)
MY (1) MY154204A (es)
PL (2) PL3570278T3 (es)
RU (1) RU2586846C2 (es)
SG (1) SG183967A1 (es)
TW (2) TWI446337B (es)
WO (2) WO2011110499A1 (es)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5422664B2 (ja) * 2009-10-21 2014-02-19 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
EP2362375A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
JP5523589B2 (ja) * 2010-03-09 2014-06-18 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法
JP5850216B2 (ja) * 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
PL2581905T3 (pl) 2010-06-09 2016-06-30 Panasonic Ip Corp America Sposób rozszerzania pasma częstotliwości, urządzenie do rozszerzania pasma częstotliwości, program, układ scalony oraz urządzenie dekodujące audio
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
IL317702A (en) 2010-09-16 2025-02-01 Dolby Int Ab Method and system for harmonic, block, subchannel, and enhanced transposition by rhetorical multiplication
US8620646B2 (en) * 2011-08-08 2013-12-31 The Intellisis Corporation System and method for tracking sound pitch across an audio signal using harmonic envelope
USRE48258E1 (en) 2011-11-11 2020-10-13 Dolby International Ab Upsampling using oversampled SBR
TWI478548B (zh) * 2012-05-09 2015-03-21 Univ Nat Pingtung Sci & Tech 對等網路串流傳輸方法
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
CN103915104B (zh) * 2012-12-31 2017-07-21 华为技术有限公司 信号带宽扩展方法和用户设备
CN104981870B (zh) * 2013-02-22 2018-03-20 三菱电机株式会社 声音增强装置
JP6426633B2 (ja) * 2013-03-14 2018-11-21 エルジー エレクトロニクス インコーポレイティド 無線通信システムで端末間の直接通信を用いた信号受信方法
EP2979360A4 (en) * 2013-03-26 2017-03-29 Lachlan Paul Barratt Audio filtering with virtual sample rate increases
US9305031B2 (en) * 2013-04-17 2016-04-05 International Business Machines Corporation Exiting windowing early for stream computing
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
US9454970B2 (en) * 2013-07-03 2016-09-27 Bose Corporation Processing multichannel audio signals
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
TWI548190B (zh) * 2013-08-12 2016-09-01 中心微電子德累斯頓股份公司 根據控制法則來控制功率轉換器的功率級之控制器及方法
BR112016004029B1 (pt) * 2013-08-28 2022-06-14 Landr Audio Inc Método para realizar a produção automática de áudio, meio legível por computador, e, sistema de produção automática de áudio
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
US10469969B2 (en) 2013-09-17 2019-11-05 Wilus Institute Of Standards And Technology Inc. Method and apparatus for processing multimedia signals
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
CN105874819B (zh) 2013-10-22 2018-04-10 韩国电子通信研究院 生成用于音频信号的滤波器的方法及其参数化装置
CN104681034A (zh) * 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
CN105745706B (zh) * 2013-11-29 2019-09-24 索尼公司 用于扩展频带的装置、方法和程序
KR102215124B1 (ko) 2013-12-23 2021-02-10 주식회사 윌러스표준기술연구소 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치
KR102356012B1 (ko) 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
WO2015142073A1 (ko) 2014-03-19 2015-09-24 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
KR101856127B1 (ko) 2014-04-02 2018-05-09 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
EP2963649A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
KR101523559B1 (ko) * 2014-11-24 2015-05-28 가락전자 주식회사 토폴로지를 이용한 오디오 스트림 형성 장치 및 방법
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI693595B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI856342B (zh) * 2015-03-13 2024-09-21 瑞典商杜比國際公司 音訊處理單元、用於將經編碼的音訊位元流解碼之方法以及非暫態電腦可讀媒體
US10129659B2 (en) 2015-05-08 2018-11-13 Doly International AB Dialog enhancement complemented with frequency transposition
KR101661713B1 (ko) * 2015-05-28 2016-10-04 제주대학교 산학협력단 파라메트릭 어레이 응용을 위한 변조 방법 및 장치
US9514766B1 (en) * 2015-07-08 2016-12-06 Continental Automotive Systems, Inc. Computationally efficient data rate mismatch compensation for telephony clocks
CN111970629B (zh) 2015-08-25 2022-05-17 杜比实验室特许公司 音频解码器和解码方法
WO2017050669A1 (en) * 2015-09-22 2017-03-30 Koninklijke Philips N.V. Audio signal processing
WO2017053447A1 (en) 2015-09-25 2017-03-30 Dolby Laboratories Licensing Corporation Processing high-definition audio data
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10157621B2 (en) * 2016-03-18 2018-12-18 Qualcomm Incorporated Audio signal decoding
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10848363B2 (en) 2017-11-09 2020-11-24 Qualcomm Incorporated Frequency division multiplexing for mixed numerology
US11315584B2 (en) * 2017-12-19 2022-04-26 Dolby International Ab Methods and apparatus for unified speech and audio decoding QMF based harmonic transposer improvements
TWI702594B (zh) 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
CN118782079A (zh) 2018-04-25 2024-10-15 杜比国际公司 高频音频重建技术的集成
AU2019257701A1 (en) * 2018-04-25 2020-12-03 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
US20230085013A1 (en) * 2020-01-28 2023-03-16 Hewlett-Packard Development Company, L.P. Multi-channel decomposition and harmonic synthesis
CN111768793B (zh) * 2020-07-11 2023-09-01 北京百瑞互联技术有限公司 一种lc3音频编码器编码优化方法、系统、存储介质
TWI834408B (zh) * 2022-12-02 2024-03-01 元智大學 兩階濾波器

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55107313A (en) 1979-02-08 1980-08-18 Pioneer Electronic Corp Adjuster for audio quality
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US6766300B1 (en) 1996-11-07 2004-07-20 Creative Technology Ltd. Method and apparatus for transient detection and non-distortion time scaling
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP4152192B2 (ja) 2001-04-13 2008-09-17 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の高品質タイムスケーリング及びピッチスケーリング
MXPA03002115A (es) 2001-07-13 2003-08-26 Matsushita Electric Ind Co Ltd DISPOSITIVO DE DECODIFICACION Y CODIFICACION DE SEnAL DE AUDIO.
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4227772B2 (ja) 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
JP4313993B2 (ja) 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US7372907B2 (en) * 2003-06-09 2008-05-13 Northrop Grumman Corporation Efficient and flexible oversampled filterbank with near perfect reconstruction constraint
US20050018796A1 (en) * 2003-07-07 2005-01-27 Sande Ravindra Kumar Method of combining an analysis filter bank following a synthesis filter bank and structure therefor
US7337108B2 (en) 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
WO2005040749A1 (ja) * 2003-10-23 2005-05-06 Matsushita Electric Industrial Co., Ltd. スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
JP4254479B2 (ja) * 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) * 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
BRPI0517234B1 (pt) * 2004-11-02 2019-07-02 Dolby International Ab Decodificador para gerar um sinal de áudio, codificador para codificar um sinal de áudio, métodos para gerar e para codificar um sinal de áudio, receptor para receber um sinal de áudio, transmissor e sistema de transmissão para transmitir um sinal de áudio, métodos para receber, transmitir, e transmitir e receber um sinal de áudio, meio de armazenamento legível por computador, equipamento reprodutor de áudio, e, equipamento gravador de áudio
CN1668058B (zh) * 2005-02-21 2011-06-15 南望信息产业集团有限公司 基于递归最小平方差的子带回声抵消器
WO2006108543A1 (en) 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
JP2007017628A (ja) 2005-07-06 2007-01-25 Matsushita Electric Ind Co Ltd 復号化装置
US7565289B2 (en) 2005-09-30 2009-07-21 Apple Inc. Echo avoidance in audio time stretching
JP4760278B2 (ja) 2005-10-04 2011-08-31 株式会社ケンウッド 補間装置、オーディオ再生装置、補間方法および補間プログラム
EP1964438B1 (en) 2005-12-13 2010-02-17 Nxp B.V. Device for and method of processing an audio data stream
US7676374B2 (en) * 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
FR2910743B1 (fr) 2006-12-22 2009-02-20 Thales Sa Banque de filtres numeriques cascadable, et circuit de reception comportant une telle banque de filtre en cascade.
AU2008339211B2 (en) * 2007-12-18 2011-06-23 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CN101471072B (zh) * 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
ES2738534T3 (es) 2008-03-10 2020-01-23 Fraunhofer Ges Forschung Dispositivo y método para manipular una señal de audio que tiene un evento transitorio
US9147902B2 (en) 2008-07-04 2015-09-29 Guangdong Institute of Eco-Environmental and Soil Sciences Microbial fuel cell stack
CN102105931B (zh) * 2008-07-11 2013-04-10 弗朗霍夫应用科学研究促进协会 用于生成带宽扩展信号的装置与方法
MX2011000367A (es) 2008-07-11 2011-03-02 Fraunhofer Ges Forschung Un aparato y un metodo para calcular una cantidad de envolventes espectrales.
ATE522901T1 (de) 2008-07-11 2011-09-15 Fraunhofer Ges Forschung Vorrichtung und verfahren zur berechnung von bandbreitenerweiterungsdaten mit hilfe eines spektralneigungs-steuerungsrahmens
US8258849B2 (en) 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
EP2224433B1 (en) 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
ES2976382T3 (es) * 2008-12-15 2024-07-31 Fraunhofer Ges Zur Foerderungder Angewandten Forschung E V Decodificador de extensión de ancho de banda
RU2493618C2 (ru) 2009-01-28 2013-09-20 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
EP3998606B8 (en) 2009-10-21 2022-12-07 Dolby International AB Oversampling in a combined transposer filter bank
US8321216B2 (en) 2010-02-23 2012-11-27 Broadcom Corporation Time-warping of audio signals for packet loss concealment avoiding audible artifacts
JP5523589B2 (ja) * 2010-03-09 2014-06-18 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法
SG183966A1 (en) 2010-03-09 2012-10-30 Fraunhofer Ges Forschung Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals

Also Published As

Publication number Publication date
EP2545548A1 (en) 2013-01-16
EP4475124A3 (en) 2025-01-15
AU2011226212A1 (en) 2012-10-18
CA2792450A1 (en) 2011-09-15
BR122021019082B1 (pt) 2022-07-26
EP4475124A2 (en) 2024-12-11
JP2013525824A (ja) 2013-06-20
CN103038819B (zh) 2015-02-18
EP3570278B1 (en) 2022-10-26
BR112012022740A2 (pt) 2020-10-13
US9792915B2 (en) 2017-10-17
TWI444991B (zh) 2014-07-11
BR112012022574A2 (pt) 2021-09-21
US10770079B2 (en) 2020-09-08
TW201207842A (en) 2012-02-16
MX2012010415A (es) 2012-10-03
CN103038819A (zh) 2013-04-10
MX2012010416A (es) 2012-11-23
US20230074883A1 (en) 2023-03-09
KR101425154B1 (ko) 2014-08-13
SG183967A1 (en) 2012-10-30
CA2792452C (en) 2018-01-16
RU2586846C2 (ru) 2016-06-10
JP2013521538A (ja) 2013-06-10
BR122021014305B1 (pt) 2022-07-05
EP3570278A1 (en) 2019-11-20
US20180366130A1 (en) 2018-12-20
AR080476A1 (es) 2012-04-11
PL2545553T3 (pl) 2015-01-30
PL3570278T3 (pl) 2023-03-20
WO2011110499A1 (en) 2011-09-15
US11495236B2 (en) 2022-11-08
KR101414736B1 (ko) 2014-08-06
KR20120139784A (ko) 2012-12-27
AU2011226212B2 (en) 2014-03-27
AU2011226211A1 (en) 2012-10-18
EP2545553B1 (en) 2014-07-30
CN102939628A (zh) 2013-02-20
BR122021014312B1 (pt) 2022-08-16
US20170194011A1 (en) 2017-07-06
US10032458B2 (en) 2018-07-24
EP4148729C0 (en) 2025-01-22
KR20120131206A (ko) 2012-12-04
ES2522171T3 (es) 2014-11-13
CA2792450C (en) 2016-05-31
EP4148729A1 (en) 2023-03-15
US20240135939A1 (en) 2024-04-25
TW201207841A (en) 2012-02-16
US20200279571A1 (en) 2020-09-03
JP5523589B2 (ja) 2014-06-18
AR080477A1 (es) 2012-04-11
WO2011110500A1 (en) 2011-09-15
US9305557B2 (en) 2016-04-05
CA2792452A1 (en) 2011-09-15
EP4148729B1 (en) 2025-01-22
TWI446337B (zh) 2014-07-21
EP2545553A1 (en) 2013-01-16
HK1181180A1 (zh) 2013-11-01
RU2012142732A (ru) 2014-05-27
US11894002B2 (en) 2024-02-06
US20130090933A1 (en) 2013-04-11
BR112012022574B1 (pt) 2022-05-17
BR112012022740B1 (pt) 2021-12-21
JP5588025B2 (ja) 2014-09-10
AU2011226211B2 (en) 2014-01-09
CN102939628B (zh) 2015-05-13
MY154204A (en) 2015-05-15
US20130051571A1 (en) 2013-02-28

Similar Documents

Publication Publication Date Title
ES2935637T3 (es) Reconstrucción de alta frecuencia de una señal de audio de entrada usando bancos de filtros en cascada
BR122021019078B1 (pt) Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata