[go: up one dir, main page]

MX2012010416A - Aparato y método para procesar una señal de audio usando alineación de borde de patching. - Google Patents

Aparato y método para procesar una señal de audio usando alineación de borde de patching.

Info

Publication number
MX2012010416A
MX2012010416A MX2012010416A MX2012010416A MX2012010416A MX 2012010416 A MX2012010416 A MX 2012010416A MX 2012010416 A MX2012010416 A MX 2012010416A MX 2012010416 A MX2012010416 A MX 2012010416A MX 2012010416 A MX2012010416 A MX 2012010416A
Authority
MX
Mexico
Prior art keywords
patch
edge
frequency
signal
band
Prior art date
Application number
MX2012010416A
Other languages
English (en)
Inventor
Sascha Disch
Lars Villemoes
Frederik Nagel
Per Ekstrand
Stephan Wilde
Original Assignee
Dolby Int Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Int Ab filed Critical Dolby Int Ab
Publication of MX2012010416A publication Critical patent/MX2012010416A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Networks Using Active Elements (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

Aparato para procesar una señal de audio para generar una señal extendida de ancho de banda que tiene una parte de alta frecuencia y una parte de baja frecuencia, utilizando datos paramétricos para la parte de alta frecuencia, los datos paramétricos que se relacionan a bandas de frecuencia de la parte de alta frecuencia comprenden un calculador de frontera de parche, de modo que la frontera de parche coincida con una frontera de parche de frecuencia de las bandas de frecuencia. El aparato además comprende un parcheador para generar una señal parchada utilizando una señal de audio y la frontera de parche.

Description

APARATO Y MÉTODO PARA PROCESAR UNA SEÑAL DE AUDIO USANDO ALINEACIÓN DE BORDE DE PATCHING CAMPO TÉCNICO El presente invento se refiere a sistemas de codificación de fuente de audio los cuales hacen uso de un método de transposición armónica para reconstrucción de alta frecuencia (HFR) , y a procesadores de efecto digital, por ejemplo, los denominados excitadores, donde la generación de distorsión armónica agrega brillo a la señal procesada, y a extensores de tiempo, donde la duración de una señal es extendida mientras se mantiene el contenido espectral de la original.
ANTECEDENTES DEL INVENTO En la PCT WO 98/57436 se estableció el concepto de transposición como un método para recrear una banda de alta frecuencia a partir de una banda de frecuencia más baja de una señal de audio. Se puede obtener un substancial ahorro en cantidad de bits transmitidos usando este concepto para codificación de audio. En un sistema de codificación de audio basado en HFR, una señal de ancho de banda bajo es procesada por un codificador por núcleo de forma de onda y las frecuencias más altas son regeneradas usando transposición e información lateral adicional de muy baja cantidad de bits transmitidos que describe la forma espectral blanco del lado del decodificador . Para bajas cantidades de bits transmitidos, donde el ancho de banda de la señal codificada por un núcleo (core coded) es angosto, se hace cada vez más importante recrear una banda alta con características perceptualmente agradables. La transposición armónica definida en PCT WO 98/57436 funciona muy bien para material musical complejo en una situación con baja frecuencia de transición. El principio de una transposición armónica es que una sinusoide con frecuencia ? es mapeada a una sinusoide con frecuencia donde T>\ es un entero que define el orden de transposición. En contraste con esto, un método de HFR basado en modulación de banda lateral simple (SSB) mapea una sinusoide con frecuencia ? a una sinusoide con frecuencia &>+ A<y donde ?? es un corrimiento de frecuencia fijo. Dada una señal núcleo con ancho de banda bajo, puede resultar un artefacto que suena disonante de la transposición SSB.
Para lograr la mejor calidad de audio posible, los métodos de HFR armónica de alta calidad del estado actual de la técnica emplean bancos de filtros modulados complejos, por ejemplo, una Transformación de Fourier de Tiempo Corto (STFT) , con resolución de alta frecuencia y un alto grado de sobre—muestreo para lograr la calidad de audio requerida. La resolución fina es necesaria para evitar distorsión de intermodulación no deseada que aparece del procesamiento no lineal de sumas de sinusoides. Con suficientemente alta resolución de frecuencia, esto es, subbandas angostas, los métodos de alta calidad apuntan a tener un máximo de una sinusoide en cada subbanda. Se necesita un alto grado de sobre—muestreo en el tiempo para evitar un tipo de distorsión aliasing, y se necesita un cierto grado de sobre— muestreo en la frecuencia para evitar pre—ecos para señales con componente transitorio. La desventaja obvia es que la complejidad computacional puede hacerse alta.
La transposición armónica basada en bloque subbanda es otro método de HFR usado para suprimir productos de intermodulación, en cuyo caso se emplea un banco de filtros con resolución de frecuencia gruesa y un menor grado de sobre—muestreo, por ejemplo, un banco Q F multicanal. En este método, un bloque de tiempo de muestras de subbanda complejas es procesado por un modificador de fase común mientras la superposición de varias muestras modificadas forma una muestra de subbanda de salida. Esto tiene el efecto neto de suprimir productos de intermodulación que de otra manera aparecerían cuando la señal subbanda de entrada consta de varias sinusoides. La transposición basada en procesamiento de subbanda basado en bloques tiene mucho menor complejidad computacional que los medios de transposición de alta calidad y alcanza casi la misma calidad para muchas señales. Sin embargo, la complejidad es todavía mucho más alta que para los métodos de HFR basados en SSB triviales, ya que se requiere una pluralidad de bancos de filtros de análisis, cada que procesa señales de diferentes órdenes de transposición T, en una típica aplicación de HFR para sintetizar el ancho de banda requerido. Adicionalmente, un enfoque común es adaptar la tasa de muestreo de las señales de entrada para ajustar bancos de filtros de análisis de un tamaño constante, aunque los bancos de filtros procesan señales de diferentes órdenes de transposición. También es común aplicar filtros pasabanda a las señales de entrada para obtener señales de salida procesadas desde diferentes órdenes de transposición, con densidades espectrales que no se superponen .
El almacenamiento y la transmisión de señales de audio con frecuencia están sometidos a estrictas restricciones de cantidad de bits transmitidos. En el pasado, los codificadores eran forzados a reducir drásticamente el ancho de banda de audio transmitido cuando sólo se disponía de una muy baja cantidad de bits transmitidos. Los modernos codificadores—decodificadores de audio hoy en día son capaces de codificar señales de banda ancha usando métodos de extensión de ancho de banda (BWE) [1—12] . Estos algoritmos se basan en una representación paramétrica del contenido de alta frecuencia (HF) , que es generado a partir de la parte de baja frecuencia (LF) de la señal decodificada mediante una transposición dentro de la región espectral de HF ("patching", es decir los "parches" de audio) y aplicación de un procesamiento posterior regido' por parámetros. La parte de LF es codificada con cualquier codificador de audio o voz. Por ejemplo, los métodos de extensión de ancho de banda descritos en [1—4] se apoyan en modulación de banda lateral simple (SSB) , que con frecuencia se denomina con el término método " copy—up" , para generar los múltiples sectores de patching, es decir los parches de HF. Últimamente se ha presentado un nuevo algoritmo, el cual emplea un banco de vocoders de fase [15—17] para la generación de los diferentes parches [13] (ver Figura 20) . Este método ha sido desarrollado para evitar la aspereza auditiva que con frecuencia se observa en señales sometidas a extensión de ancho de banda SSB. A pesar de ser beneficioso para muchas señales tonales, este método llamado "extensión de ancho de banda armónica" (HBE) es proclive a degradaciones de calidad de los componentes transitorios contenidos en la señal de audio [14], ya que no está garantizada la conservación de la coherencia vertical sobre subbandas en el algoritmo de vocoder de fase estándar y, asimismo, el re-cálculo de las fases tiene que ser realizado sobre bloques de tiempo de una transformación o, alternativamente de un banco de filtros. Por lo tanto, aparece una necesidad de un tratamiento especial para partes de señal que contienen componentes transitorios.
Sin embargo, la complejidad computacional es un asunto serio, debido a que el algoritmo de BWE es realizado sobre el lado del decodificador de una cadena de codificador-decodificador . Los métodos del estado actual de la técnica, especialmente la HBE basada en vocoder de fase viene a costo de una complejidad computacional muy incrementada comparado con los métodos basados en SSB.
Como se detalla arriba, los esquemas de extensión de ancho de banda existentes se aplican sólo un método de parcheo sobre un bloque de · señal dado a la vez, ya sea parcheo basado en SSB [1—4] o parcheo basado en vocoder de HBE [15—17]. Adicionalmente, los modernos codificadores de audio [19—20] ofrecen la posibilidad de conmutar el método de parcheo globalmente sobre una base de bloque de tiempo entre esquemas de parcheo alternativos.
El parcheo copy—up de SSB introduce asperezas no deseadas dentro de la señal de audio, pero es computacoinalmente simple y conserva la envolvente de tiempo de componentes transitorios. En codificadores—decodificadores de audio que emplean parcheo de HBE, la calidad de reproducción del componente transitorio es frecuentemente por debajo de óptima. As, la complejidad computacional se incrementa significativamente sobre el método copy—up de SSB de complejidad computacional muy simple.
En lo que hace a reducción de complejidad, las tasas de muestreo son de particular importancia. Esto se debe al hecho de que una alta tasa de muestreo significa una alta complejidad y una baja tasa de muestreo generalmente significa una baja complejidad debido al reducido número de operaciones requeridas. Por un lado, sin embargo, la situación en aplicaciones de extensión de ancho de banda es particularmente tal que la tasa de muestreo de la señal de salida de codificador por núcleo típicamente será tan bajo que esta tasa de muestreo es demasiado baja para una señal de ancho de banda completa. Dicho de otro modo, cuando la tasa de muestreo de la señal de salida del decodificador es, por ejemplo, 1 o 2,5 veces la frecuencia máxima de la señal de salida del codificador por núcleo, entonces una extensión de ancho de banda, por ejemplo, por un factor 2, significa que se requiere una operación de muestreo hacia arriba de modo que la tasa de muestreo de la señal extendida en ancho de banda sea tan alto que el muestreo puede "cubrir" las componentes de alta frecuencia adicionalmente generadas.
Adicionalmente, los bancos de filtros tales como bancos de filtros de análisis y bancos de filtros de síntesis, son responsables de una considerable cantidad de operaciones de procesamiento. Por ende, el tamaño de los bancos de filtros, esto es, si el banco de filtros es un banco de filtros de 32 canales, un banco de filtros de 64 canales o incluso un banco de filtros con un mayor número de canales, influirá significativamente en la complejidad del algoritmo de procesamiento de audio. En general, uno pude decir que un alto número de canales de banco de filtros requiere más operaciones de procesamiento y, por lo tanto, mayor complejidad que un pequeño número de canales de banco de filtros. En vista de esto, en aplicaciones de extensión de ancho de banda y también en otras aplicaciones de procesamiento de audio, donde los diferentes tasas de muestreo son ¦ un tema, tal como en aplicaciones de tipo vocoder o cualquier otra aplicación de efecto de audio, hay una interdependencia especifica entre complejidad y tasa de muestreo o ancho de banda de audio, lo cual significa que las operaciones de muestreo hacia arriba o filtrado subbanda pueden mejorar drásticamente la complejidad sin influir específicamente la calidad de audio en un buen sentido cuando se eligen algoritmos o herramientas de software inadecuados para las operaciones especificas.
En el contexto de extensión de ancho de banda, se usan conjuntos de datos paramétricos para realizar un ajuste de envolvente espectral y para realizar otras manipulaciones a una señal generada mediante una operación de parcheo, esto es, mediante una operación que toma algunos datos del rango fuente, esto es de la porción de banda baja de la señal extendida en ancho de banda que está disponible en la entrada del procesador de extensión de ancho de banda y luego mapea estos datos a un rango de alta frecuencia. El ajuste de envolvente espectral puede tener lugar antes de realmente mapear la señal de banda baja al rango de alta frecuencia o subsiguientemente a haber mapeado el rango de la fuente al rango de alta frecuencia.
Típicamente, los conjuntos de datos paramétricos son provistos con una cierta resolución de frecuencia, esto es, datos paramétricos refieren a bandas de frecuencia de la parte de frecuencia alta. Por el otro lado, el parcheo de la banda baja a la banda alta, esto es, cuáles rangos de fuente son usados para obtener cuáles rangos blanco o de alta frecuencia, es una operación independiente de la resolución, en la cual los conjuntos datos paramétricos están dados con respecto a la frecuencia. El hecho de que los datos paramétricos transmitidos son, en un sentido, independientes de lo que realmente se usa como algoritmo de parcheo, es un rasgo importante, ya que esto permite gran flexibilidad del lado del decodificador, esto es, cuando se trata de la implementación del procesador de extensión de ancho de banda. Aquí se pueden usar diferentes algoritmos de parcheo pero se debe realizar uno y el mismo ajuste de envolvente espectral. Dicho de otro modo, el procesador de reconstrucción de frecuencia alta o el procesador de ajuste de envolvente espectral en una aplicación de extensión de ancho de banda no necesitan tener información sobre el algoritmo de parcheo aplicado para realizar el ajuste de envolvente espectral.
Una desventaja de este procedimiento, sin embargo, es que puede ocurrir una mala alineación entre las bandas de frecuencia para las cuales se proveen los conjuntos de datos paramétricos por un lado, y los bordes espectrales de un parche por el otro. Particularmente en situaciones donde la energía espectral cambia mucho en la vecindad de un borde de parche, pueden aparecer artefactos, específicamente en esta región, los cuales degradas la calidad de la señal extendida en ancho de banda .
SÍNTESIS DEL INVENTO Es un objetivo del- presente invento proveer un concepto mejorado del procesamiento de audio que permita buena calidad de audio.
Este objetivo se alcanza con un aparato para procesar una señal de audio de acuerdo con la reivindicación 1, un método para procesar una señal de audio de alta frecuencia de acuerdo con la reivindicación. 15 o un programa de computadora de acuerdo con la reivindicación 16.
Realizaciones del presente invento se refieren a un aparato para procesar una señal de audio para generar una señal extendida en ancho de banda que tiene una porción de alta frecuencia y una porción de baja frecuencia, donde se usan datos paramétricos para la porción de alta frecuencia, y donde los datos paramétricos se relacionan con bandas de frecuencia de la parte de alta frecuencia. El aparato comprende un calculador de borde de parche para calcular un borde de parche tal que el borde de parche coincida con un borde de banda de frecuencia de las bandas de frecuencia. El aparato · además comprende un parcheador para generar una señal parche usando la señal de audio y el borde de parche calculado. En una realización, el calculador de borde de parche está configurado para calcular el borde de parche como un borde de frecuencia en un rango de frecuencia de síntesis correspondiente a la parte de alta frecuencia. En este contexto, el parcheador está configurado para seleccionar una porción de frecuencia de la parte de banda baja usando un factor de transposición y el borde de parche. En otra realización, el calculador de borde de parche está configurado para calcular el borde de parche usando un borde de parche blanco que no coincide con un borde de banda de frecuencia de la banda de frecuencia. Entonces, el calculador de borde de parche está configurado para ajusfar el borde de parche diferente del borde de parche blanco para obtener la alineación. Particularmente en el contexto de una pluralidad de parches que usan diferentes factores de transposición, el calculador de borde de parche está configurado para calcular bordes de parche, por ejemplo, para tres diferentes factores de transposición tal . que cada borde de parche coincida con un borde de banda de frecuencia de las bandas de frecuencia de la parte de alta frecuencia. El parcheador entonces está configurado para generar la señal de parche usando tres diferentes factores de transposición tal que el borde entre dos parches adyacentes coincida con un borde entre dos bandas de frecuencia adyacentes a las cuales están relacionados los datos paramétricos .
El presente invento es particularmente útil por el hecho de que se evitan los artefactos que aparecen por bordes de parches mal alineados por un lado, y por otro, las bandas de frecuencia para datos paramétricos. En cambio, debido a la perfecta alineación, incluso señales fuertemente cambiantes o señales que tienen porciones fuertemente cambiantes en la región del borde de parche, son sometidas a extensión de ancho de banda con una buena calidad.
Asimismo, el presente invento es ventajoso por el hecho de que no obstante permite alta flexibilidad debido al hecho de que el codificador no tiene que tratar con un algoritmo de parcheo a ser aplicado del lado de decodificador . Se mantiene la independencia entre parcheo por un lado, y ajuste de envolvente espectral, esto es, usar los datos paramétricos generados por el codificador de extensión de ancho de banda por el otro, y permite la aplicación de diferentes algoritmos de parcheo o incluso una combinación de diferentes algoritmos de parcheo. Esto es posible ya que la alineación de borde de parche asegura que en el extremo los datos de parche por un lado y los conjuntos de datos paramétricos por el otro, coincidan entre si con respecto a las bandas de frecuencia, las cuales también son denominadas bandas de factor de escala.
Dependiendo de los bordes de parche calculados, los cuales pueden relacionarse por ejemplo, con el rango blanco, esto es, la pare de alta frecuencia de la señal extendida en ancho de banda finalmente extendida, se calculan los correspondientes rangos de fuente para determinar los datos de fuente de parche forman la porción de banda baja de la señal de audio. Resulta que se requiere sólo un cierto (pequeño) ancho de banda de la porción de banda baja de la señal de audio debido al hecho de que en algunas realizaciones se aplican factores de transposición armónica. Por lo tanto, para extraer en forma eficiente esta porción de la señal de audio de banda baja, se usa una estructura de banco de filtros de análisis especifica que' se basa bancos de filtros individuales en cascada.
Tales realizaciones se basan en una ubicación en cascada especifica de bancos de filtros de análisis y/o síntesis para obtener un re—muestreo de baja complejidad sin sacrificar calidad de audio. En una realización, un aparato para procesar una señal de audio de entrada comprende un banco de filtros de síntesis para sintetizar una señal intermedia de audio a partir de la señal de audio de entrada, donde la señal de audio de entrada está representadas por . una pluralidad de primeras señales subbanda generadas por un banco de filtros de análisis colocado en la dirección de procesamiento antes del banco de filtro de síntesis, en donde un número de canales de banco de filtros del banco de filtros de síntesis es más pequeño que un número de canales del banco de filtros de análisis. La señal intermedia es procesada asimismo mediante un banco de filtros de análisis adicional para generar una pluralidad de segundas señales subbanda a partir de la señal intermedia de audio, en donde el banco de filtros de análisis adicional tiene un número de canales que es diferente del número de canales del banco de filtros de síntesis de modo que una tasa de muestreo de una señal subbanda de la pluralidad de señales subbanda es diferente de una tasa de muestreo de una primera señal subbanda de la pluralidad de primeras señales subbanda generadas mediante el banco de filtros de análisis.
La cascada de un banco de filtros de síntesis y un banco de filtros de análisis adicional conectado subsiguientemente provee una conversión de tasa de muestreo y adicionalmente una modulación de la porción de ancho de banda de la señal de audio de entrada original que ha sido ingresada al banco de filtros de síntesis a una banda de base. Esta señal intermedia de tiempo, que ahora ha sido extraída de la señal de audio de entrada original la cual puede ser, por ejemplo, la señal de salida de un decodificador por núcleo de un esquema de extensión de ancho de banda, ahora es representada preferiblemente como una señal muestreada críticamente modulada a la banda de base, y se halló que esta representación, es decir, la señal de salida re—muestreada, cuando está siendo procesada por un banco de filtros de análisis adicional para obtener una representación subbanda permite un procesamiento de baja complejidad de operaciones de procesamiento adicionales que pueden ocurrir o no, y que pueden ser, por ejemplo, operaciones de procesamiento relacionado con extensión de ancho de banda tales como operaciones de subbanda no lineales seguidas por procesamiento de reconstrucción de alta frecuencia y por una fusión de subbandas en el banco de filtros de síntesis final.
La presente solicitud provee diferentes aspectos de aparatos, métodos o programas de computadora para procesar señales de audio en el contexto de extensión de ancho de banda y en el contexto de otras aplicaciones de audio, las cuales no están relacionadas con extensión de ancho de banda. Los rasgos de los aspectos individuales subsiguientemente descritos y reivindicados pueden ser parcial o totalmente combinados, pero también pueden ser usados separadamente uno de otro, ya que los aspectos individuales ya proveen ventajas con respecto a la calidad perceptual, la complejidad computacional y los recursos de procesador/memoria cuando son implementados en un sistema de computadora o microprocesador.
Realizaciones proveen un método para reducir la complejidad computacional de un método de HFR armónica basado en bloque subbanda por medio de eficiente filtrado y conversión de tasa de maestreo de las señales de entrada a las etapas de análisis de banco de filtros de HFR. Además, se puede mostrar que los filtros pasabanda aplicados a las señales de entrada son obsoletos en una medios de transposición basado en bloque subbanda.
Las presentes realizaciones ayudan a reducir la complejidad computacional de la transposición armónica basad en bloque subbanda implementando en forma eficiente varios órdenes de transposición basada en bloque subbanda en el marco de un solo par de banco de filtros de análisis y síntesis. Dependiendo de la solución de compromiso de calidad perceptual en función de complejidad computacional, se puede realizar sólo .un subconjunto de órdenes o todos los órdenes de transposición con untamente, dentro de un par de bancos de filtros.' Asimismo, un esquema de transposición combinada donde sólo se calculan directamente ciertos órdenes de transposición mientras el ancho de banda restante es filtrado mediante replicación de órdenes de transposición disponibles, esto es, calculados previamente (por ejemplo, 2 ° orden) y/o el ancho de banda codificado por núcleo. En este caso el parcheado puede ser llevado a cabo usando toda combinación concebible de rangos de fuente disponibles para replicación.
Adicionalmente, hay realizaciones que proveen un método para mejorar tanto métodos de HFR armónica de alta calidad como métodos de HFR armónica basada en bloque subbanda por medio de alineación espectral de herramientas de HFR. En particular se alcanza mayor rendimiento alineando los bordes espectrales de las señales generadas por HFR a bordes espectrales de la tabla de frecuencia de ajuste de envolvente. Además, los bordes espectrales de la herramienta limitadora son alineados mediante el mismo principio a los bordes espectrales de las señales generadas por HFR.
Otras realizaciones está configuradas para mejorar la calidad perceptual de componentes transitorios y reduciendo al mismo tiempo complejidad computacional, por ejemplo, mediante aplicación de un esquema de parcheo que aplica un parcheo mixto que consta de parcheo armónico y parcheo copy— up.
En realizaciones especificas, los bancos de filtros individuales de la estructura de banco de filtro en cascada son bancos de filtro de espejo en cuadratura (QMF) , los cuales se basan en un filtro prototipo pasabajos o ventana modulada usando un conjunto de frecuencias de modulación que definen las frecuencias centrales de los canales de banco de filtros. Preferiblemente, todas las funciones de ventana o filtros prototipo dependen entre sí de una manera tal que los filtros de los bancos de filtros son diferentes tamaños (canales de banco de filtro) también dependen entre si. Preferiblemente, el banco de filtros más grande es una estructura en cascada de bancos de filtros que comprende, en realizaciones, un primer- banco de filtros de análisis, una subsiguiente banco de filtros conectados, un banco de filtros de análisis adicional y en algún estado posterior de procesamiento, un banco de filtros de síntesis final, tiene una función de ventana o respuesta de filtro prototipo que tiene un cierto número de coeficientes de función ventana o filtro prototipo. Los bancos de filtros de tamaños más menores son todas versiones sub—muestreadas de esta función ventana, lo cual significa que las funciones ventana para los otros bancos de filtros son versiones sub—muestreadas de la función ventana "grande". Por ejemplo, si un banco de filtros tiene la mitad del tamaño del banco de filtros grande, entonces la función ventana tiene la mitad del número de coeficientes, y los coeficientes de los bancos de filtros de tamaño menor son derivados mediante" sub—muestreo . En esta situación, el sub—muestreo significa que, por ejemplo, para el banco de filtros más pequeño que tiene la mitad del tamaño, se toma cada segundo coeficiente de filtro. Sin embargo, cuando hay otras relaciones entre los tamaños de banco de filtros que no son valores enteros, entonces, se realiza un cierto tipo de interpolación de los coeficientes de ventana de modo que al final la ventana del banco de filtros más pequeño de nuevo es una versión sub— muestreada de la ventana del banco de filtros más grande.
Unas realizaciones del presente invento son particularmente útiles en situaciones donde sólo se requiere una porción de la señal de audio de entrada para ulterior procesamiento, y esta situación aparece particularmente en el contexto de extensión de ancho de banda armónica. En este contexto se prefieren particularmente operaciones de procesamiento tipo vocoder.
Es una ventaja en algunas realizaciones que las realizaciones proveen una menor complejidad para un medio de transposición de QMF mediante operaciones eficientes en el dominio del tiempo y de la frecuencia y una mejor calidad de audio para replicación de banda espectral armónica basada en QMF y DFT usando alineación espectral.
Algunas realizaciones se refieren a sistemas de codificación de fuente de audio que emplean, por ejemplo, un método de transposición armónica basada en bloque subbanda para reconstrucción de alta frecuencia (HFR) , y a procesadores de efecto digital, por ejemplo, los denominados excitadores, donde la generación de distorsión armónica agrega brillo a la señal procesada, y a extensores de tiempo, donde la duración de una señal es extendida mientras se mantiene el contenido espectral de la original. Realizaciones proveen un método para reducir la complejidad computacional de un método de HFR armónica basado en bloque subbanda por medio de eficiente filtrado y conversión de tasa de muestreo de las señales de entrada antes de las etapas de análisis de banco de filtros de HFR. Además, hay realizaciones que muestran que los filtros pasabanda convencionales aplicados a las señales de entrada son obsoletos en un sistema de HFR basado en bloque subbanda. Adicionalmente, hay realizaciones que proveen un método para mejorar tanto métodos de HFR armónica de alta calidad como métodos de HFR armónica basada en bloque subbanda por medio de alineación espectral de herramientas de HFR. En particular, hay realizaciones que enseñan cómo se alcanza mayor rendimiento alineando los bordes espectrales de las señales generadas por HFR a bordes espectrales, de la tabla de frecuencia de ajuste de envolvente. Además, los bordes espectrales de la herramienta limitadora son alineados mediante el mismo principio a los bordes espectrales de las señales generadas por HFR.
BREVE DESCRIPCIÓN DE LOS DIBUJOS Ahora se describirá el presente invento por medio de ejemplos ilustrativos, sin limitar el alcance del invento, con referencia a los dibujos acompañantes, en los cuales: la ' Figura 1 ilustra el funcionamiento de un medio de transposición basado en bloque usando órdenes de transposición 1, 3 y 4 en un marco de decodificador mejorado de HFR; la Figura 2 ilustra el funcionamiento de las unidades de estiramiento subbanda no lineal de la Figura 1; la Figura 3 ilustra una implementación eficiente del medio de transposición basado en bloque de la Figura 1, donde los re—muestreadores y filtros pasabanda que preceden el bando de filtros de análisis de HFR están implementados usando re—muestreadores del dominio del tiempo multi—tasa y filtros pasabanda basados en QMF; la Figura 4 ilustra un ejemplo de construir bloques para una eficiente implementación de un re—muestreador del dominio del tiempo multi—tasa de la Figura 3; las Figuras 5a—5f ilustran el efecto de una señal ejemplar procesada por los diferentes bloques de la Figura 4 para un orden de transposición de 2; la Figura 6 ilustra una implementación eficiente del medio de transposición basado en bloque de la Figura 1, donde los re—muestreadores y filtros pasabanda que preceden el bando de filtros de análisis de HFR están reemplazados por pequeños bancos de filtros de síntesis sub—muestreados que funcionan sobre subbandas seleccionadas de un banco de filtros de análisis de 32 bandas; la Figura 7 ilustra el efecto de una señal ejemplar procesada por un banco de filtros de síntesis sub— muestreado de la Figura 6 para un orden de transposición de 2; las Figuras 8a—8e ilustran los bloques de implementación de un reductor de la tasa de muestreo del dominio del tiempo muíti—tasa eficiente, de dos un factor 2; las Figuras 9a—9e ilustran los bloques de implementación de un reductor de la tasa de muestreo o del dominio del tiempo multi—tasa eficiente, de dos un factor 3/2; la Figura 10 (que comprende de la figura 10a a la 10c) ilustra la alineación de bordes espectrales de las señales del medio de transposición de HFR a los bordes de las bandas de frecuencia de ajuste de envolvente en un codificador mejorado de HFR; la Figura 11 (que comprende de la figura lia a la 11c) ilustra un escenario donde emergen artefactos debido a bordes espectrales de las señales del medio de transposición de HFR desalineados; la Figura 12 (gue comprende de la figura 12a a la 12c) ilustra un escenario donde los artefactos de la Figura 11 (que comprende de la figura lia a la 11c) son evitados como resultado de bordes espectrales de las señales de medio de transposición de HFR alineados; la Figura 13 (que comprende de la figura 13a a la 13c) ilustra la adaptación de bordes espectrales en la herramienta limitadora a los bordes espectrales de las señales del medio de transposición de HFR; la Figura 14 ilustra el principio de transposición armónica basada en bloque subbanda; la Figura 15 ilustra un escenario de ejemplo para la aplicación de transposición basada en bloque subbanda usando varios órdenes de transposición en un codificador— decodificador de audio mejorado de HFR; la Figura 16 ilustra un escenario de ejemplo del arte previo para la operación de una transposición basada en bloque subbanda de múltiples órdenes aplicando un banco de filtros de análisis separado por cada orden de transposición; la Figura 17 ilustra un escenario de ejemplo inventivo para la operación eficiente de una transposición basada en bloque subbanda de múltiples órdenes aplicando un único banco de filtros de análisis QMF de 64 bandas; la Figura 18 ilustra otro ejemplo para formar un procesamiento a modo de señal subbanda; la Figura 19 ilustra un parcheo de modulación de banda lateral simple (SSB) la Figura 20 ilustra un parcheo de extensión de ancho de banda armónica (HBE) la Figura 21 ilustra un parcheo mixto, donde el primer parcheo es generado desparramando frecuencia y el segundo parche es generado mediante copy—up de SSB de una porción de baja frecuencia; la Figura 22 ilustra un parcheo mixto alternativo utilizando el primer parcho de HBE para una operación de copy—up SSB para generar un segundo parche; la Figura 23 ilustra un visión general de un aparato para procesar una señal de audio usando alineación de banda espectral de acuerdo con una realización; La Figura 24a ilustra una implementación preferida del calculador de borde de parche de la Figura 23. la Figura 24b ilustra otra visión general de una secuencia de pasos realizados por realizaciones del invéntela Figura 25a ilustra un diagrama de bloques que ilustra más detalles del calculador de borde de parche y más detalles sobre el ajuste de envolvente espectral en el contexto de la alineación de bordes de parches; la Figura 25b ilustra un diagrama lógico para el procedimiento indicado en la Figura 24a como un pseudo código; la Figura 26 ilustra una visión general del marco de trabajo en el contexto de procesamiento de extensión de ancho de banda; y la Figura 27 (que comprende de la figura 27a a la 27b) ilustra una implementación preferida de un procesamiento de señales subbanda entregadas por el banco de filtros de análisis adicional de la Figura 23.
DESCRIPCIÓN DE REALIZACIONES PREFERIDAS Las realizaciones que se describen abajo son meramente ilustrativas y pueden proveer una complejidad inferior de un medio de transposición Q F mediante operaciones eficientes en el dominio del tiempo y de la frecuencia, y calidad de audio mejorada de ambos, SBR armónico basado QMF y DFT, mediante alineación .espectral. Se entiende que las modificaciones y variaciones posibles de las disposiciones y de los detalles descritos en la presente serán evidentes para los expertos en la materia. Por lo tanto, es la intención que el invento esté limitado sólo por el alcance de las siguientes reivindicaciones de patente y no por los detalles específicos presentados por la descripción y la explicación de las realizaciones en la presente.
La Figura 23 ilustra una realización de un aparato para procesar una señal de audio 2300 para generar una señal extendida en ancho de banda que tiene una parte de alta frecuencia y una parte de baja frecuencia, usando datos paramétricos para la parte de alta frecuencia, donde los datos paramétricos se relacionan con bandas de frecuencia de la parte de alta frecuencia. El aparato comprende un calculador de borde de parche 2302 para calcular un borde de parche preferiblemente usando un borde de parche blanco 2304 que no coincide con un borde de banda de frecuencia de la banda de frecuencia. La información 2306 sobre las bandas de frecuencia de la parte de alta frecuencia puede ser tomada, por ejemplo, de una transmisión de datos codificada adecuada para extensión de ancho de banda. En una realización adicional, el calcular de borde parche no sólo calcula un borde de parche simple para una solo parche sino que calcula varios bordes de parche para un varios diferentes parches que pertenecen a diferentes factores de transposición, donde la información sobre los factores de transposición son provistos al calculador de borde de parche 2302 como se indica en 2308. El calculador de borde de parche está configurado para calcular los bordes de parche de modo un borde de parche coincida con un borde de banda de frecuencia de las bandas de frecuencia. Preferiblemente, cuando el calculador de borde de parche recibe información 2304 sobre un borde parche blanco, entonces el calculador de borde de parche es configurado para poner el borde de parche diferente del borde de parche blanco para obtener la alineación. El calculador de borde de parche entrega los bordes de parche calculados, los cuales son diferentes de los bordes de parche' blanco, en la línea 2310 a un parcheador 2312. El parcheador 2312 genera una señal parcheada o varias señales parcheadas en la salida 2314 usando la señal de audio de banda baja 2300 y los bordes de parche 2310, y en las realizaciones donde se realizan múltiples transposiciones, usando los factores de transposición sobre la linea 2308.
La tabla de la Figura 23 ilustra un ejemplo numérico para ilustrar el concepto básico. Por ejemplo, cuando se supone que la señal de audio de banda baja tiene una porción de baja frecuencia que se extiende desde 0 hasta 4 kHz (es claro que el rango fuente no empieza realmente en 0 Hz sino cerca de 0, tal como en 20 Hz) . Asimismo, es la intención del usuario realizar una extensión de ancho de banda de la señal de 4 kHz a una señal extendida en ancho de banda de 16 kHz. Adicionalmente, el usuario ha indicado que el usuario desea realizar una extensión de ancho de banda usando tres parches armónicos con factores de transposición 2, 3 y 4. Entonces, los bordes blanco de los parches pueden ser puestos a un primer parche que se extiende desde 4 hasta 8 kHz, un segundo parche que se extiende desde 8 hasta 12 kHz y un tercer parche que se extiende desde 12 hasta 16 kHz. Así, los bordes de parche son 8, 12 y 16 cuando se supone que no se cambia el primer borde de parche que coincide con la frecuencia máxima o de transición de la señal de banda de frecuencia baja. Sin embargo, cambiar este borde del primer parche también está dentro de las realizaciones del presente invento si se requiere. Los bordes blanco corresponderían a un rango fuente de 2 a 4 kHz para el factor de transposición 1, 2,66 a 4 kHz para el factor de transposición de 3, y 3 a 4 kHz para el factor de transposición de 4. Específicamente, el rango fuente es calculando dividiendo los bordes blanco por el factor de transposición realmente usado.
Para el ejemplo de la Figura 23 se supone que los bordes 8, 12, 16 no coinciden con los bordes de banda de frecuencia de las bandas de frecuencia a las cuales se relacionan los datos paramétricos de entrada . Por den, el calculador de borde de parche calcula bordes de parche alineados y no aplican inmediatamente los bordes blanco. Esto puede dar por resultado un borde de parche superior de 7,7 kHz para el primer parche, un borde superior de 11,9 kHz para el segundo parche y 15,8 kHz para el borde superior para el tercer parche. Entonces, usando el factor de transposición de nuevo para el parche individual, se calculan ciertos rangos fuente "ajustados" y se usan para parcheo, los cuales están indicados en la Figura 23 en forma ejemplar.
A pesar de que se ha expresado que los rangos fuente son cambiados junto con los÷ rangos blanco, para otras implementaciones uno también podría manipular el factor de transposición y mantener el rango fuente o los bordes blanco o para otras aplicaciones uno incluso podría cambiar el rango fuente y el factor de transposición para finalmente arriba a bordes de parche ajustados los cuales coinciden con bordes de banda de frecuencia de las bandas de frecuencia a las cuales se relacionan los datos de extensión de ancho de banda paramétricos que describen la envolvente espectral de la porción de banda alta de la señal original.
La Figura 14 ilustra el principio de transposición basada en bloque subbanda. La señal del dominio del tiempo de entrada es alimentada a un banco de filtros de análisis 1410 el cual provee una multitud de señales subbanda de valor complejo. Estas son alimentadas a la unidad de procesamiento subbanda 1402. La multitud de subbandas de salida de valor complejo es alimentada al banco de filtros de síntesis 1403, el cual a su vez entrega la señal del dominio del tiempo modificada. La unidad de procesamiento subbanda 1402 realiza operaciones de procesamiento subbanda basadas en bloque no lineal tal que la señal del. dominio del tiempo modificada es una versión transpuesta de la señal de entrada correspondiente a un orden de transposición T >\ . La noción de un procesamiento subbanda basado en bloque se define comprendiendo operaciones no lineales sobre bloques de más que una muestra subbanda a un tiempo, donde los bloques subsiguientes son ventaneados y sumados en superposición para generar las señales subbanda de salida.
Los bancos de filtros 1401 y 1403 pueden ser cualquier tipo modulado exponencial complejo tal como Q F o un DFT ventaneado. Pueden ser apilados de manera par o impar en la modulación y pueden ser definidos a partir de un amplio rango de filtros prototipo o ventanas . Es importante conocer el cociente Afs IAfA de los siguientes dos parámetros de banco de filtros, medidos en unidades físi cas .
• AfA : el espaciamiento subbanda de frecuencia del banco de filtros de análisis 1401; • Afs : el espaciamiento subbanda de frecuencia del banco de filtros de síntesis 1403.
Para la configuración del procesamiento subbanda 1402 es necesario hallar la correspondencia entre índices subbanda fuente y blanco. Se observa que una sinusoide de entrada de frecuencia física O dará por resultado que ocurre una contribución principal en subbandas de entrada con índice ?8O/?/? . Una sinusoide de salida de la frecuencia física transpuesta deseada G-O resultará de alimentar la subbanda de síntesis con índice m8T-Ci/ Afs . Por ende, los apropiados valores de índice subbanda fuente de 1 procesamiento subbanda parta un dado índice subbanda blanco m deben obedecer n* m . (1 ¦ La - Figura .15 ilustra un escenario de ejemplo para la aplicación de transposición basada en bloque subbanda usando varios órdenes de transposición en un codificador— decodificador de audio mejorado de HFR. Una serie de bits en el tiempo transmitidos, es recibida en el decodificador por núcleo 1501, el cual provee una señal de núcleo decodificada de ancho de banda bajo a una frecuencia de muestreo fs. La frecuencia baja es re—muestreada a la frecuencia de muestreo de salida 2fs por medio de un banco de análisis QMF de 32 bandas modulado complejo 1502 seguido por un banco de síntesis QMF de 64 bandas (QMF inverso) 1505. Los dos bancos de filtros 1502 y 1505 tienen los mismos parámetros de resolución física Afs-AfA y la unidad de procesamiento de HFR 1504 simplemente deja pasar las subbandas inferiores . no modificadas correspondientes a la señal núcleo de ancho de banda baja. El contenido de alta frecuencia de la señal de salida se obtiene alimentando las subbandas superiores del banco de síntesis QMF de 64 bandas 1505 con las bandas de salida de la unidad transponedora múltiple 1503, sometidas a modelado y modificación espectral realizados mediante la unidad de procesamiento de HFR 1504. El transponedor múltiple 1503 toma como entrada la señal •núcleo decodificada y entrega una multitud de señales subbanda las cuales representan el análisis de banda OMF de 64 de una superposición o combinación de varios componentes de señal transpuestos. El objetivo es que si se saltea el procesamiento de HFR, cada componente corresponda a una transposición física entera de la señal núcleo, ( T = 2,3,... ) . la Figura 16 ilustra un escenario de ejemplo del arte previo para la operación de una transposición basada en bloque subbanda de múltiples órdenes 1603 aplicando un banco de filtros de análisis separado por cada orden de transposición. Aquí se han de producir y suministrar tres órdenes de transposición T = 2,3,4 en el dominio de un QMF de 64· bandas que funciona a tasa de muestreo de salida 2fs. La unidad de fusión 1604 simplemente selecciona y combina las subbandas relevantes de cada rama de factor de transposición en una sola multitud de subbandas de QMF a ser alimentadas en la unidad de procesamiento de HFR.
Considere primero el caso T-2. El objetivo es específicamente que la cadena de procesamiento de un análisis de QMF de 64 bandas 1602—2, una unidad de procesamiento subbanda 1603—2 y una síntesis de QMF de 64 bandas 1505 resulte en una transposición física de T-2. Identificando estos tres bloques con 1401, 1402 y 1403 de la Figura 14, uno encuentra que y Afs /AfA = 2 tal que (1) da por resultado la especificación para 1603—2 que la correspondencia entre subbandas fuente «y blanco m está dada por n =m .
Para el caso G =3, el sistema ejemplar incluye un convertidor de tasa de muestreo 1601—3 el cual reduce la tasa de muestreo de entrada mediante un factor 3/2 desde fs a 2fs/3. El objetivo es específicamente que la cadena de procesamiento de un análisis de QMF de 64 bandas 1602—3, la unidad de procesamiento subbanda 1603—3 y una síntesis de QMF de 64 bandas 1505 resulte en una transposición física de 7=3. Identificando estos tres bloques con 1401, 1402 y 1403 de la Figura 14, uno encuentra debido al re—muestreo, que Afs/AfA =3 , tal que (1) provee la especificación para 1603—3, donde la correspondencia entre subbandas fuente «y blanco m nuevamente está dada por n= m .
Para el caso T = 4, el sistema ejemplar incluye un convertidor de tasa de muestreo 1601—4 el cual reduce la tasa de muestreo de entrada mediante un factor dos desde fs a fs/2. El objetivo es específicamente que la cadena de procesamiento de un análisis de QMF de 64 bandas 1602—4, la unidad de procesamiento subbanda 1603—4 y una síntesis de QMF de 64. bandas 1505 resulte en una transposición física de 7=4. Identificando estos tres bloques con 1401, 1402 y 1403 de la Figura 14, uno encuentra debido al re—muestreo, que Afs/AfA =4 , tal que (1) provee la especificación para 1603—4, donde la correspondencia entre subbandas fuente «y blanco m también está dada por n = m .
La Figura 17 ilustra un escenario de ejemplo inventivo para la operación eficiente de una transposición basada en bloque subbanda de múltiples órdenes aplicando un único banco de filtros de análisis QMF de 64 bandas. En realidad, el uso de tres bancos de análisis QMF separados y dos convertidores de tasa de muestreo en la Figura 16 da por resultado una complejidad computacional bastante alta, así como también algunas desventajas de implementación por procesamiento basado en cuadro debido a la conversión de tasa de muestre 1601—3. Las realizaciones actuales enseñan reemplazar las dos ramas 1601—3 ? 1602—3 ? 1603—3 y 1601—4 ? 1602—4 ? 1603—4 por el procesamiento subbanda 1703—3 y 1703— 4, respectivamente, mientras la rama 1602—2 ? 1603—2 se mantiene sin cambio en comparación con la Figura 16. Los tres órdenes de transposición ahora tendrán que ser realizados en un dominio de banco de filtros con referencia a la Figura 14, donde Íssl&fA=2. Para el caso G = 3, la especificación para 1703—3 dada por (1) es que la correspondencia entre subbandas fuente ny blanco westá dada por rt«2m/3. Para el caso T = 4, las especificaciones para 1703—4 dadas por (1) son que la correspondencia entre subbandas fuente «y blanco mestá dada por n»2m . Para reducir adicionalmente la complejidad, algunos órdenes de transposición pueden ser generados copiando órdenes de transposición ya calculados o la salida del decodificador por núcleo.
La Figura 1 ilustra el funcionamiento de un medio de transposición basado en bloque subbanda que usa los órdenes de transposición de 2, 3, y 4 en un marco de trabajo de decodificador de HFR mejorado, tal como SBR [ISO/IEC 14496-3:2009, "Tecnología de información — Codificación de objetos audio—visuales" {"Information technology - Coding of audiovisual objects") - Parte 3: Audio] . La serie de bits en el tiempo {bitstream) es decodificada al dominio del tiempo mediante el decodificado por núcleo 101 y se la hace pasar al módulo de HFR 103, . el cual genera una señal de alta frecuencia a partir de la señal núcleo de banda base. Después de la generación, la señal generada por la HFR es ajustada dinámicamente para coincidir con la señal original lo más cercanamente posible por medio de información lateral transmitida. Este ajuste es realizado por el procesador de HFR 105 sobre señales subbanda, obtenida de uno o varios bancos de análisis QMF. Un escenario tipico es donde el decodificador por núcleo funciona sobre una señal del dominio del tiempo muestreada a la mitad de la frecuencia de las señales de entrada y salida, esto es el módulo de decodificador HFR efectivamente re—muestreará la señal núcleo al doble de la frecuencia de muestreo. Esta conversión de tasa de muestreo usualmente es obtenida mediante el primer paso de filtrar la señal de codificador por núcleo por medio de un banco de análisis QMF de 32 bandas, 102. Las subbandas por debajo de la denominada frecuencia de transición, esto es el subconjunto inferior de las 32 subbandas que contiene toda la energía de señal de codificador por núcleo, son combinadas con el conjunto de subbandas que portan la señal generada en la HFR. Usualmente, el número de subbandas asi combinadas es 64, lo cual, después de filtrar a través del banco de síntesis QMF 106, resulta en una señal de codificador por núcleo de tasa de muestreo convertido combinada con la salida del módulo de HFR.
En el medio de transposición basado en bloque subbanda del módulo de HFR 103, se han de producir y suministrar tres órdenes de transposición T = 2, 3 y 4, en el dominio de un QMF de 64 bandas que funciona a una tasa de muestreo de salida de 2fs. La señal del dominio del tiempo de entrada es filtrada pasabanda en los bloques 103—12, 103—13 y 103—14. Esto se hace para hacer que las señales de salida sean procesadas por los diferentes órdenes de transposición, para tener contenidos espectrales que no se superponen. Se reduce más la tasa de muestreo de las señales (103—23, 103—24) para adaptar la tasa de muestreo de las señales de entrada para calzar con los bancos de filtro de análisis de un tamaño constante (en este caso 64). Se puede notar que el incremento .de la tasa de muestreo, de fs a 2fs, puede ser explicado por el hecho de que los convertidores de tasa de muestreo usan factores de reducción de la tasa de muestreo de T/2 en lugar de T, y con el último resultarían señales subbanda transpuestas con. igual tasa de muestreo que la señal de entrada. Las señales con tasa de muestreo reducida son alimentadas a bancos de filtros de análisis de HFR separados (103—32, 103—33 y 103—34), uno por cada orden de transposición, los cuales proveen una multitud de señales subbanda de valores complejos. Éstas son alimentadas a las unidades extensoras subbanda no lineales (103—42, 103—43 y 103—44) . La multitud de subbandas de salida de valor complejo es alimentada al módulo Fusionar/Combinar 104 junto con la salida del banco de análisis submuestreado 102. La unidad de Fusionar/Combinar simplemente fusiona las subbandas provenientes del banco de filtro de análisis por núcleo 102 y cada rama de factor de estiramiento en una única multitud de subbandas de QMF a ser alimentadas en la unidad de procesamiento de HFR 105.
Cuando los espectros de señal de diferentes órdenes de transposición son ajustados para no superponerse, esto es, el espectro de la señal de 7° orden de transposición debe empezar cuando termina el espectro de la señal de orden G—1, las señales transpuestas necesitan ser de carácter pasabanda. De ahi los filtros pasabanda tradicionales 103— 12—103—14 de la Figura 1. Sin embargo, a través de una simple selección exclusiva entre subbandas disponibles mediante la unidad Fundir/Combinar 104, los filtros pasabanda separados son redundantes y pueden ser evitados.
En cambio, la característica pasabanda inherente provista por el banco QMF es aprovechada alimentando las diferentes contribuciones desde las ramas de medio de transposición independientemente a diferentes canales subbanda en 104. También alcanza para aplicar el estiramiento de tiempo sólo a bandas que son combinadas en 104.
La Figura 2 ilustra el funcionamiento de una unidad de estiramiento subbanda no lineal. El extractor de bloques 201 muestrea un cuadro finito de muestras de la señal de entrada de valor complejo. El cuadro esta definido por una posición de puntero de entrada. Este cuadro sufre procesamiento no lineal en 202 y subsiguientemente es ventaneado mediante una ventana de longitud finita 203. Las muestras resultantes son sumadas a las muestras en la unidad de superposición—y—suma 204 donde se define la posición de cuadro de salida mediante una posición de puntero de salida. El puntero de entrada es incrementado por una magnitud fija y el puntero de salida es incrementado por un factor de estiramiento subbanda veces la misma magnitud. Una iteración de esta cadena de operaciones producirá una señal de salida con la duración que es el factor de estiramiento subbanda veces la duración de la señal subbanda de entrada, hasta la longitud de la ventana de síntesis.
Mientras el medio de transposición SSB empleado por SBR [ISO/IEC 14496-3:2009, "Tecnología de información -Codificación. de objetos audio—visuales" {"Information technology - Coding of audio-visual objects") - Parte 3: Audio] típicamente aprovecha toda la banda base, excluyendo la primera subbanda, para generar la señal de banda alta, un medio de transposición armónica generalmente usa una parte más pequeña del espectro de codificador por núcleo. La magnitud usada, el denominado rango fuente, depende del orden de transposición, el factor de extensión de ancho de banda, y las reglas aplicadas para el resultado combinado, por ejemplo, si se permite o no, la superposición espectral de las señales generadas a partir de diferentes órdenes de transposición. Como consecuencia, sólo una parte limitada del espectro de salida del medio de transposición armónica para un dado orden de transposición, será realmente usada por el módulo de procesamiento HFR 105.
La Figura 18 ilustra otra realización de una implementación de procesamiento ejemplar para procesar una señal subbanda simple. La señal subbanda simple ha sido sometida a cualquier tipo de diezmado {decimation) ya sea antes o después de ser filtrada por un banco de filtros de análisis no mostrado en la Figura 18. Por lo tanto, la longitud de tiempo de la señal subbanda simple es más corto que la longitud de tiempo antes del diezmado. La señal subbanda simple es ingresada al extractor de bloque 1800, el cual puede ser idéntico al extractor de bloque 201, pero el cual también puede ser implementado de una manera diferente. El extractor de bloque 1800 de la Figura 18 funciona usando un valor de avance de muestra/bloque llamado para el ejemplo, e. El valor de avance de muestra/bloque puede ser variable o .puede ser puesto fijo y está ilustrado en la Figura 18 como una flecha en la caja de extractor de bloque 1800. En la salida del extractor de bloque 1800 existe una pluralidad de bloques extraídos. Estos bloques tienen alta superposición, ya que el valor de avance de muestra/bloque e es significativamente más pequeño que la longitud de bloque del extractor de bloque. Un ejemplo es que el extractor de bloques extrae bloques de 12 muestras. El primer bloque comprende muestras 0 a 11, el segundo bloque comprende muestras 1 a 12, el tercer bloque comprende muestras 2 a 2 a 13, y así siguiendo. En esta realización, el valor de avance de muestra/bloque e es igual a 1, y hay superposición de 11 veces.
Los bloques individuales son ingresados en un medio de ventaneo 1802 para ventanear los bloques usando una función de ventana para cada bloque. Adicionalmente, se provee un calculador de fase 1804, el cual calcula una fase para cada bloque. El calculador de fase 1804 puede usar el bloque individual antes del ventaneo o subsiguiente al ventaneo. Luego se calcula un valor de ajuste de fase p x k y se ingresa a un ajustador de fase 1806. El ajustador de fase aplica el valor de ajuste a cada muestra del bloque. Asimismo, el factor k es igual al factor de extensión de ancho de banda. Guando, por ejemplo, se ha de obtener la extensión de ancho de banda por un factor 1, entonces la fase p calculada para un bloque extraído por el extractor de bloque 1800 es multiplicada por el factor 2 y el valor de ajuste aplicado a cada muestra del bloque en el ajustador de fase 1806 es p multiplicado por 2. Este es un valor/regla ejemplar. Alternativamente, la fase corregida por síntesis es k * p, p + (k—l)*p. Así, en este ejemplo, el factor de corrección es 2 si se multiplica, o l*p si se suma. Se pueden aplicar otros valores/reglas para calcular el valor de corrección de fase.
En una realización, la señal subbanda simple es una señal subbanda compleja, y la fase de un bloque puede ser calculada mediante una pluralidad de diferentes maneras. Una manera es tomar la muestra en el medio o alrededor del medio del bloque y calcular la fase de esta muestra compleja. También es posible calcular la fase para cada muestra.
A pesar de que en la Figura 18 se ilustra la manera en que opera un ajustador de fase subsiguiente al medio de ventaneo, estos dos bloques también puede ser intercambiado, de modo que el ajuste de fase es realizado a los bloques extraídos por el extractor de bloque y se realiza una subsiguiente operación de ventaneo. Como ambas operaciones, esto es, ventaneo y ajuste de fase son multiplicaciones de valores reales o valores complejos, estas dos operaciones pueden ser resumidas en una sola operación usando un factor de multiplicación complejo el cual, en sí mismo, es el producto de un factor de multiplicación de ajuste de fase y un factor de ventaneo.
Los bloques ajustados en fase son ingresados en un bloque de superposición/suma y corrección de amplitud 1808, donde los bloques ventaneados y ajustados en fase son superpuestos—sumados . Sin embargo, de manera importante, el valor de avance de muestra/bloque es el bloque 1808 es diferente del valor usado en el extractor de bloque 1800. Particularmente, el valor de avance de muestra/bloque en el bloque 1808 es mayor que el valor e usado en el bloque 1800, de modo que se obtiene un estiramiento de tiempo de la señal entregada por el bloque 1808. Así, la señal subbanda procesada entregada por el bloque 1808 tiene una longitud que es más larga que la señal subbanda ingresada en el bloque 1800. Cuando se ha de obtener la extensión de ancho de banda de dos, entonces se usa el valor de avance de muestra/bloque, que es dos veces el valor correspondiente en el bloque 1800. Esto da por resultado un estiramiento de tiempo por un factor de dos. Sin embargo, cuando se necesitan otros factores de estiramiento de tiempo, entonces se pueden usar otros valores de avance de muestra/bloque de modo que la salida del bloque 1808 tiene una longitud de tiempo requerida.
Para encarar el problema de superposición, preferiblemente se realiza una corrección de amplitud para encarar el problema de diferentes superposiciones en el bloque 1800 y 1808. Sin embargo, esta corrección de amplitud también podría ser introducida en el factor de multiplicación de ajustador de ventaneo/fase, pero la corrección de amplitud también puede ser realizada subsiguiente a superposición/procesamiento.
En el ejemplo de arriba con una longitud de bloque de 12 y un valor de avance de muestra/bloque en el extractor de bloque de uno, el valor de avance de muestra/bloque para el bloque de superposición/suma 1808 seria igual a dos, cuando se realiza la extensión de ancho de banda por un factor de dos. Esto todavía daría por resultado una superposición de cinco bloques. Cuando se ha de realizar una extensión de ancho de banda por un factor de tres, entonces el valor de avance, de muestra/bloque · usado por el bloque 1808 sería igual a tres, y la superposición caería a una superposición' de tres. Cuando se ha de: realizar una extensión de ancho de banda por .cuatro, entonces el bloque de superposición/suma 1808 tendría que usar un valor de avance de muestra/bloque de cuatro,. lo cual todavía daría por resultado una superposición de más que dos bloques.
Se pueden lograr grandes ahorros computacionales restringiendo las señales de entrada a las ramas de medio de transposición que solo contienen el rango fuente, y esto a una tasa de muestreo adaptada a cada orden de transposición. El esquema de bloque básico de un sistema así para un generador de HFR basado en bloques, está ilustrado en la Figura 3. La señal de codificador por núcleo de entrada es procesada por reductores de la tasa de muestreo dedicados que . preceden a los bancos de filtros de análisis de HFR.
El efecto esencial de cada reductor de la tasa de muestreo es quitar por filtrado la señal de rango fuente y suministrarla al banco de filtros de análisis a la tasa de ¦muestreo más bajo posible. Aquí, más bajo posible se refiere a la tasa de muestreo más bajo que todavía es adecuado para el procesamiento corriente abajo, no necesariamente la tasa de muestreo más baja que evita aliasing después del diezmado. La conversión de tasa de muestreo puede obtenerse de varias maneras. Sin limitar el alcance del invento, se darán dos ejemplos: el primero muestra el re—muestreo realizado mediante procesamiento en el dominio del tiempo multi—tasa, y el segundo ilustra el re—muestreo logrado por medio de procesamiento subbanda QMF.
La Figura 4 muestra un ejemplo de los bloques en un reductor de la tasa de muestreo del dominio del tiempo multi—tasa para un orden de transposición de 2. La señal de entrada, que tiene un ancho de banda B Hz,- y una frecuencia de muestreo fs, es modulada por una exponencial compleja (401) para correr en frecuencia el inicio del rango fuente a frecuencia DC según En las Figuras 5(a) y (b) se representan ejemplos de una señal de entrada y el espectro después de la modulación. La señal modulada es interpolada (402) y filtrada mediante un filtro pasabajo de valor complejo con limites pasabanda 0 y B/2 Hz (403) . En las Figuras 5(c) y (d) se muestran los espectros después de los respectivos pasos. La señal filtrada es subsiguientemente diezmada (404) y la parte real de la señal es computada (405) . Los resultados de estos pasos se . muestran en las Figuras 5(e) y (f) . En este ejemplo · particular,. cuando T=2 , 5=0,6 (en ¦ una escala normalizada, esto es, f~s=2), P2 se elige como 24, para cubrir de manera segura el rango fuente. El factor de reducción de la tasa de muestreo da 32T _ 64 _ 8 P2 ~ 24 ~ 3 ' donde la fracción ha sido reducida por el factor común 8. De ahí,- el factor de interpolación es 3 (como se ve de la Figura 5(c)) y el factor de diezmado es 8. Usando las identidades de Noble ["Sistemas Multiritmo y Bancos de Filtros" ("Multirate Systems And Filter Banks") por P.P.
Vaidyanathan, 1993, Prentice Hall, Englewood Cliffs] , el diezmador puede ser movido por todo el trayecto a la izquierda, y el interpolador todo el trayecto a la derecha en la Figura 4. De esta manera, la modulación y el filtrado se hacen a la tasa de muestreo más bajo posible y se disminuye aun más la complejidad computacional .
Otro enfoque es usar las salidas subbanda del banco QMF de análisis de 32 bandas sub—muestreada 102 ya presente en el método SBR HFR. Las subbandas que cubren los rangos fuente para, las diferentes ramas del medio de transposición son sintetizadas al dominio del tiempo mediante pequeños bancos QMF sub—muestreados que preceden los bancos de filtro de análisis HFR. Este tipo de sistema de HFR está ilustrado en la Figura 6. Los pequeños bancos QMF se obtienen sub— muestreando el banco QMF de 64 bandas origianl, donde los coeficientes de filtro prototipo se hallan mediante interpolación lineal del filtro prototipo original. Siguiendo las notaciones de la Figura 6, el banco QMF de síntesis que precede a la rama del medio de transposición de 2° orden tiene Qz=\2 bandas (las subbandas con índices basados en cero desde 8 a 19 en el QMF de 32 bandas) . Para evitar aliasing en el proceso de síntesis, las primera (índice 8) y la última (índice 19) bandas, son puestas en cero. La salida espectral resultante se muestra en la Figura 7. Note que el banco de filtros de análisis del medio de transposición basado en bloque tiene 2£)2=24 bandas, esto es, el mismo número de bandas que en el ejemplo basado en reductor de la tasa de muestreo en el dominio del tiempo multi—tasa (Figura 3).
El sistema detallado en la Figura 1. puede ser visto como un caso especial simplificado del re—muestreo detallado en las Figuras 3 y 4. Para simplificar el arreglo se omiten los moduladores. Además, todo el filtrado de análisis de HFR se obtiene usando bancos de filtros de análisis de 64 bandas. De ahí, P2 = P3 =¦ P4 = 64. de la Figura 3, y los factores de reducción de la tasa de. muestreo son 1, 1,5 y 2 para las ramas del medio de transposición de 2o, 3° y 4° orden, respectivamente .
En la Figura 8 (a) se muestra un diagrama de bloques de un reductor de la tasa de muestreo de factor 2. El filtro pasa bajos ahora de valor real puede ser escrito H{z) = B(z)lA(z) , donde.S(z)es la parte no recursiva (FIR) yA(z)es la parte recursiva (IIR). Sin embargo, para una implementación eficiente, usando las Identidades de Noble para disminuir la complejidad computacional , es beneficioso diseñar un filtro donde todos los polos tengan multiplicidad 2 (polos dobles) como;4(z2). Por ende, el filtro, puede ser factoreado como se muestra en la Figura 8(b). Usando la Identidad de Noble 1, la parte recursiva puede ser movida más allá del medio de diezmado como en la Figura 8(c). El filtro no recursivo B(z) puede ser implementado usando descomposición polifase de 2 componentes estándar según Por ende, el reductor de tasa de muestreo puede ser estructurado como en la Figura 8 (d) . Después de usar la Identidad de Noble 1,. la parte FIR es computada a la tasa de muestreo más bajo posible como se muestra en la Figura 8(e) . De la Figura 8(e) es fácil ver que la operación FIR (retardo, medios de diezmado y componentes polifase) pueden verse como una operación de ventana—suma usando un tranco de entrada de dos muestras. Para dos muestras de entrada, se producirá una nueva muestra de salida, resultando efectivamente una reducción de la tasa de muestreo de un factor 2.
En la Figura 9(a) se muestra un diagrama de bloques del reducción de la tasa de muestreo de factor 1,5=3/2. El filtro pasa- bajos de valor real puede ser escrito nuevamente H(z) = B{z)lA{z) , donde B{z) es la parte no recursiva (FIR) yA(z)es la parte recursiva - (IIR) . Como antes, para una implementación eficiente, usando las Identidades de Noble para disminuir la complejidad computacional , es beneficioso diseñar un filtro donde todos los polos tengan multiplicidad 2 (polos dobles) o multiplicidad 3 (polos tripes) como í(z2)o 4(23) respectivamente . Aquí, se eligen polos dobles ya que el algoritmo de diseño para el filtro pasa bajos es más eficiente, a. pesar de que la parte recursiva realmente da 1,5 veces más complejo de implementar comparado con el enfoque de polo triple. Por ende, el filtro puede ser factoreado como se muestra en la Figura 9(b). Usando la Identidad de Noble 2, la parte recursiva puede ser movida al frente del medio de interpolación como en la Figura 9(c). El filtro no recursivoB(z)puede ser implementado usando descomposición polifase de componente 2-3 = 6 estándar según Por ende, el reductor de tasa de muestreo puede ser estructurado . como en la Figura 9(d). Después de usar ambas, la Identidad de Noble 1 y la 2, la parte FIR es computada a la tasa de muestreo más baja posible como se muestra en la Figura 9(e). De la Figura 9(e) es fácil ver que las muestras de salida de índice par son computadas usando el grupo de tres filtros polifase inferior ( E0(z), E2(z), E4(z) ) mientras que las muestras de índice, impar son computadas desde el grupo superior ( E,(z), E3(z), E5(z) ) . La operación de cada grupo (cadena de retarde, medios de diezmado y componentes polifase) puede ser vista como una operación de ventana—suma usando un paso de entrada de tres muestras. Los coeficientes de ventana usados en el grupo superior son los coeficientes de Indice impar, mientras que el grupo inferior usa los coeficientes de índice par del- filtro original 5(z) . De ahí, para un grupo de tres muestras de entrada, se producirán dos nuevas muestras de salida, resultando efectivamente una reducción de la tasa de muestreo de un factor 1,5.
La señal en el dominio del tiempo del decodificador por núcleo (101 en la Figura 1) también puede ser sub—muestreado usando una transformación de síntesis sub—muéstreada más pequeña en el decodificador por núcleo. El uso de una transformación de síntesis más pequeña ofrece todavía más disminución de complejidad computacional . Dependiendo de la frecuencia de transición, esto es, el ancho de banda de la señal de codificador por núcleo, el cociente del tamaño de transformación de síntesis y el tamaño nominal Q [Q < 1), resulta en una señal de salida de codificador por núcleo que tiene un tasa de muestreo Qfs. Para procesar la señal de codificador por núcleo sub—muestreada en los ejemplos detallados en la presente solicitud, todos los bancos de filtros de análisis de la Figura 1 (102, 103-32, 103-33 y 103—34) necesitan ser puestos a escala por el factor Q, asi como también los reductores de tasa de muestreo (301—2, 301—3 y .301— ) de la Figura 3, el elemento de diezmado 404 de la Figura 4, y el banco de filtros de análisis 601 de la Figura 6. Evidentemente, Q tiene que .ser seleccionado de modo que todos los tamaños de bancos de filtros sean enteros.
La Figura 10 (que comprende de la figura 10a a la 10c) ilustra la alineación de los bordes espectrales de las señales de medio de transposición de HFR a los bordes espectrales de la tabla de frecuencia de ajuste de envolvente en un codificador de HFR mejorado, tal como SBR [ISO/IEC 14496-3:2009, "Tecnología de información -Codificación de objetos audio—visuales" ("Information technology - Coding of audio—visual objects") - Parte 3: Audio]. La Figura 10(a) muestra un gráfico esquemático de las bandas de frecuencia que conforman la tabla de ajuste de envolvente, las denominadas bandas de factor de escala, cubriendo el rango de frecuencia desde la frecuencia de transición kx a la frecuencia de parada ks. Las bandas de factor de- escala constituyen la grilla de frecuencia usada en el codificador mejorado de HFR cuando se ajusta el nivel de energía de la banda alta regenerada sobre frecuencia, esto es, la envolvente .de frecuencia. Para ajusfar la envolvente, se promedia ,1a energía de la señal sobre un bloque tiempo/frecuencia restringido por los bordes de banda de factor de escala y bordes de tiempo seleccionados.
Específicamente, la Figura 10 (que comprende de la figura 10a a la 10c) ilustra en la porción superior, una división en bandas de frecuencia 100, y resulta claro de la Figura 10 (que comprende de la figura 10a a la 10c) que las bandas de frecuencia aumentan con la frecuencia, donde el eje horizontal corresponde a la frecuencia y tiene en la notación de la Figura 10 (que comprende de la figura 10a a la 10c) , canales de banco de filtro k, donde el banco de filtros puede ser implementado como un banco de filtros QMF tal como un banco de filtros de 64 canales o puede ser implementado vía una transformación de Fourier digital, donde k corresponde a una cierta bandeja de frecuencia de la aplicación DFT. Por ende, una bandeja de frecuencia de una aplicación DFT y un canal de banco de filtros de una aplicación QMF indican lo mismo en el contexto de esta descripción. Por ende, los datos paramétricos se dan para la parte de alta frecuencia 102 en las bandejas de frecuencia 100 o bandas de frecuencia. La parte de baja frecuencia de la señal extendida en. ancho de banda finalmente está indicada en 104. La ilustración intermedia en la Figura 10 (que comprende de la figura 10a a la 10c) ilustra los rangos de parche para un primer parche 1001, un segundo parche 1002 y un tercer parche 1003. Cada parche se extiende entre dos bordes de parche, donde hay un borde de parche inferior 1001a y un borde de parche superior 1001b, par el primer parche. El borde superior del primer parche indicado en 1001b corresponde al borde inferior del segundo parche el cual está indicado en 1002a. Por ende, los números de referencia 1001b y 1002a realmente se refieren a una y la misma frecuencia. Un borde de parche superior 1002b del segundo parche, de nuevo, corresponde a un borde de parche inferior 1003a del tercer parche, y el tercer parche también tiene un borde de parche superior 1003b. Se prefiere que no haya agujeros entre parches individuales, pero éste no es un requerimiento final. Es visible en la Figura 10 (que comprende de la figura 10a a la 10c) que los bordes de parche 1001b, 1002b no coinciden con bordes correspondientes de las bandas de frecuencia 100 sino que están adentro de ciertas bandas de frecuencia 101. La linea inferior en la Figura 10 (que comprende de la figura 10a a la 10c) ilustra diferentes parches con bordes alineados 1001c, donde la alineación del borde superior 1001c del primer parche automáticamente significa la alineación, del borde inferior 1002c del segundo parche y vice versa. Adicionalmente, se indica que el borde superior del segundo parche 1002d ahora está alineado con el borde de frecuencia o banda de frecuencia inferior 101 en la primera linea de la Figura 10 (que comprende de la figura 10a a la 10c) que, por lo tanto, automáticamente el borde inferior del tercer parche indicado en 1003c, también está alineado.
En la realización de la Figura 10 (que comprende de la figura 10a a la 10c) se muestra que los bordes alineados están alineados al borde de frecuencia inferior de la banda de frecuencia coincidente 101, pero la alineación también podría ser hecho en una dirección diferente, esto es, que el borde de parche 1001c, 1002c es alineado al borde de frecuencia superior de la banda 101 en lugar de al borde de frecuencia inferior del mismo. Dependiendo de la implementación real, se puede aplicar una de esas posibilidades e incluso puede ser una mezcla de ambas posibilidades para diferentes parches.
Si las señales generadas por diferentes órdenes de transposición no están alineadas a las bandas de factor de escala, como se ilustra en. la Figura 10(b), pueden aparecer artefactos si la energía espectral cambia drásticamente en el vecindad de un borde de banda de transposición, ya que el proceso de ajuste de envolvente mantendrá la estructura espectral dentro de una banda de factor de escala. Por ende, el invento adapta los bordes de frecuencia de las señales transpuestas a los bordes de las bandas de factor de escala como se muestra en la Figura - 10(c) . En la figura, el borde superior de las señales generadas por órdenes de transposición de 2 y 3 (T=2, 3) son disminuidas o cantidad pequeña, comparado con la Figura 10 (b) , para alinear los bordes de frecuencia de las bandas de transposición a bordes de banda de factor de escala existentes.
Un escenario realista que muestra potenciales artefactos cuando se usan bordes no alineados, está representado en la Figura 11 (que comprende de la figura lia a la 11c) . La Figura 11(a) muestra nuevamente los bordes de banda de factor de escala. La Figura 11(b) muestra las señales generadas por HFR no ajustadas de órdenes de transposición T=2, 3 y 4 junto con la señal de banda base decodificada por núcleo. La Figura 11(c) muestra la señal ajustada en envolvente cuando se supone una envolvente blanco plana. Los bloques con áreas cuadriculadas representan bandas de factor de escala con altas variaciones de energía intra—banda, lo cual puede causar anomalías en la señal de salida.
La Figura 12 (que comprende de la figura 12a a la 12c) ilustra el escenario de la Figura 11 (que comprende de la figura lia a la 11c), pero esta vez usando bordes alineados. La. Figura 12(a) muestra los .bordes de banda de factor de escala, la Figura 12 (b) representa las señales generadas por HFR no ajustadas, de órdenes de transposición T=2, 3 y 4 junto con . la señal de banda base decodificada por núcleo y, en linea con la Figura 11(c), la Figura 12(c) muestra la señal ajustada por envolvente si se supone una envolvente blanco plana. Como se -ve de esta figura, no hay bandas de factor de escala con altas variaciones de energía intra— banda debido a mala alineación de bandas de señal transpuestas y las bandas de factor de escala, y por ende, se disminuyen los potencial artefactos.
La Figura 25a ilustra una visión general de una implementación del calculador de borde de parche 2302 y el parcheador . y la ubicación de esos elementos adentro del escenario de extensión. de ancho de banda en concordancia con una realización preferida. Específicamente, se provee una interfaz de entrada 2500, la cual recibe los datos de banda baja 2300 y los datos paramétricos 2302. Los datos paramétricos pueden ser datos de extensión de ancho de banda, como por ejemplo, lo conocido de ISO/IEC 14496—3: 2009, lo cual es incorporado aquí como referencia en su totalidad, y particularmente con respecto a la sección relacionada con extensión de ancho de banda, que es la sección 4.6.18 "herramienta SBR" ( "SBR tool") . De particular relevancia en la sección 4.6.18 es el apartado 4.6.18.3.2 "Tablas de banda de frecuencia" {"Frequency band. tables") , y en particular el cálculo de algunas tablas de frecuencia fmaster> ÍTableHigh/ fTableLowj ÍTableNoise y fTableLim- Particularmente, la sección 4.6.18.3.2.1 de la Norma define el cálculo de las tablas de banda de frecuencia maestras, y la sección 4.6.18.3.2.2 defines el cálculo de las tablas de banda de frecuencia derivadas de la tabla de banda de frecuencia maestra, y en particular entrega cómo se calcula fTabiemgh/ Í abieLow y fTabieNoise · La sección 4.6.18.3.2.3 define el cálculo de la tabla de banda de frecuencia limitadora.
La tabla de frecuencia de baja resolución fTabieLow es para datos paramétricos de baja resolución y la tabla de frecuencia de alta resolución ÍTabieHigh es para datos paramétricos de alta resolución, las cuales son ambas posibles en el contexto de la herramienta de software MPEG—4 SBR, como se discute en la Norma mencionada y si los datos paramétricos son datos paramétricos de baja resolución o datos paramétricos de alta resolución, depende de la implementación de codificador. La interfaz de entrada 2500 determina si los datos paramétricos son datos de bajo o alta resolución y provee esta información al calculador de tabla de frecuencia 2501. El calculador de tabla de frecuencia entonces calcula la tabla maestra o generalmente deriva una tabla de alta resolución 2502 y una tabla de baja resolución 2503 y¦ provee la mismo al núcleo calculador- de borde de parche 2504, el cual adicionalmente comprende o coopera con, un calculador de banda limitadora 2505. Los elementos 2504 y 2505 generan bordes de parche de síntesis alineados 2506 y correspondientes bordes de banda limitadores relacionados al rango de síntesis. Esta información 2506 es provista a un calculador de banda fuente 2507, el cual calcula el rango fuente de la señal de audio de banda baja para un cierto parche de modo que junto con los correspondientes factores de transposición, se obtienen los bordes de parche de síntesis alineados 2506 después del parcheo usando, por ejemplo un medio de · transposición armónica 2508 como parcheador .
.En particular, el medio de transposición armónica 2508 puede ejecutar diferente algoritmos de parcheo tal como el algoritmo de parcheo basado en DFT o un algoritmo de parcheo basado en Q F. El medio de transposición armónica 2508 puede ser implementado para realizar un procesamiento de tipo vocoder el cual se describe en el contexto de las Figuras 26 y 27 (que comprende de la figura 27a a la 27b) para la realización de medio de transposición armónica basada en QMF, pero también se pueden usar otras operaciones de medio de transposición tal como . un medio de transposición basado en DFT con el propósito de generar una porción de alta frecuencia en una estructura de tipo vocoder. Para el medio de transposición basado en DFT, el calculador de banda fuente calcula ventanas de frecuencia para el rango de baja frecuencia. Para la implementación basada en QMF, el calculador de banda fuente 2507 calcula las bandas QMF requeridas del rango fuente para cada parche. El rango fuente está definido por los datos de audio de banda baja 2300, que típicamente está provisto en forma codificada y remitido por la interfaz de entrada 2500 a un decodificador por núcleo 2509. El decodificador por núcleo 2509 alimenta sus datos de salida a un banco de filtros de análisis 2510, que puede ser una implementación de QMF o una implementación de DFT. En la implementación de QMF, el banco de filtros de análisis 2510 puede tener 32 canales de banco de filtros, y estos 32 canales de banco de filtros definen el rango fuente "máximo", y el medio de transposición armónica 2508 entonces selecciona, de estas 32 bandas, las bandas actuales que componen el rango fuente ajustado según es definido por el calculador de banda fuente 2507 para, por ejemplo, cumplir los datos de rango fuente ajustados de la tabla de la Figura 23, provisto que los valores de frecuencia de la tabla de la Figura 23 son convertidos a índices subbanda de banco de filtros de síntesis. Un procedimiento similar puede ser realizado para el medio de transposición basado en DFT, que recibe para cada parche una cierta ventana para el rango de frecuencia baja y esta ventana luego es remitida al bloque de DFT 2510 para seleccionar el rango fuente en concordancia con los bordes de parche síntesis ajustados o alineados calculados por el bloque 2504.
La señal transpuesta 2509 entregada por el medio de transposición 2508 es remitida a un ajustador de envolvente y limitador de ganancia 2510, que recibe como entrada la tabla de alta resolución 2502 y la tabla de baja resolución 2503, las bandas limitadoras ajustadas 2511 y, naturalmente, los datos paramétricos 2302. La banda alta ajustada por envolvente sobre la línea 2512 luego es ingresada a un banco de filtros de síntesis 2514, que adicionalmente recibe la banda baja típicamente en forma de salida por el decodificador- por núcleo 2509. Ambas contribuciones se funden mediante el banco de¦ filtros de síntesis 2514 para finalmente obtener la señal reconstruida de alta frecuencia en línea 2515.
Es claro que la fusión de la banda alta y la banda baja puede ser hecha de manera diferente, tal como realizando una fusión en el dominio del tiempo en lugar de en el dominio de la frecuencia. Asimismo, es claro que se puede cambiar el orden de fusión, sin importar la implementación de la fusión y el ajuste de envolvente, esto es, de modo que el ajuste de envolvente de un cierto rango de frecuencia puede ser realizado subsiguiente a la fusión o, alternativamente, antes de la fusión, donde el último caso está ilustrado en la Figura 25a. Además se detalla que el ajuste de envolvente puede incluso ser realizado antes de la transposición en el medio de transposición 2508, de modo que el orden del medio de transposición 2508 y el ajustador de envolvente 2510 también puede ser diferente de lo que se ilustra en la Figura 25a como una realización.
Como ya se detalló en el contexto del bloque 2508, en las realizaciones se puede aplicar un medio de transposición armónica basado en DFT o un medio de transposición armónica basado en Q F. Ambos algoritmos se apoyan en desparramo de frecuencia de vocoder de fase. La señal del dominio del tiempo de codificador por núcleo es extendida en ancho de bando, usando una estructura de vocoder de fase modificado. La extensión de ancho de banda es realizada mediante estiramiento en el tiempo seguido de diezmado, esto es, transposición, usando varios factores de transposición (t = 2, 3, 4) en una etapa de transformación de análisis/síntesis común. La señal de salida del medio de transposición tendrá una tasa de muestreo - del doble que la de la señal de entrada, lo cual significa que para un factor de transposición de dos, la señal será estirada en el tiempo pero no diezmada, produciendo eficientemente una señal de igual tiempo de duración que la señal de entrada pero teniendo el doble de frecuencia de muestreo. El sistema combinado puede ser interpretado como tres medios de transposición en paralelo usando factores de transposición de 2, 3 y 4, respectivamente, donde los factores de diezmado son 1; 1,5 y 2. Para reducir complejidad, los medios de transposición de factor. 3 y 4 (medios de transposición de tercer y cuarto orden) son integrados dentro del medio de transposición de factor 2 (medio de transposición de segundo orden) por medio de . interpolación como se discute subsiguientemente en el contexto de la Figura 27 (que comprende de la figura 27a a la 27b) .
Para cada cuadro, se determina un tamaño de transformación de "tamaño completo" nominal de una medio de transposición, dependiendo de un sobre—muestreo en el dominio de la frecuencia señal—adaptable que puede aplicarse para mejorar la respuesta de componente transitorio o que puede ser apagado. Este valor está indicado en la Figura 24a como FFTSizeSyn. Entonces, se transforman bloques de muestras de entrada ventaneadas, donde para la extracción de bloque se ejecuta un valor de avance de bloque o valor de paso de análisis de un número mucho más pequeño de muestras, para tener una superposición significativa de bloques. Los bloques extraídos son transformados al dominio de la frecuencia por medio de una DFT dependiendo de la señal de control de sobre— muestreo del dominio de la frecuencia señal—adaptable . Las fases de los coeficientes de la DFT de valores complejos son modificadas de acuerdo con los tres factores de transposición usados. Para transposición de segundo orden, las fases son duplicadas, para las transposiciones de tercer y cuarto orden, las fases son triplicadas, cuadruplicadas o interpoladas a partir de dos coeficientes de DFT consecutivos. Los coeficientes modificados son transformados subsiguientemente de vuelta al dominio del tiempo por medio de una DFT, son ventaneados y combinados por medio de superponer—sumar usando un paso de salida diferente del paso de entrada. Entonces, usando algoritmo ilustrado en la Figura 24a, se calculan los bordes de parche y se escriben en el arreglo xOverBin. Luego se usan los bordes de parche para calcular ventanas de transformación en el dominio del tiempo para la aplicación del medio de transposición de DFT. Para el medio de transposición de QMF se calculan números de canal de rango fuente en base a los bordes de parche calculados en el rango de síntesis. Preferiblemente, esto está ocurriendo antes de la transposición ya que se necesita como información de control para generar el espectro transpuesto.
Subsiguientemente se discute el pesudo código indicado en la Figura 24a en relación con el diagrama de flujo de la Figura 25b que ilustra una implementación preferida del calculador de borde de parche. En el paso 2520 se calcula una tabla de frecuencia en base a los datos de entrada tales como una tabla de alta o baja resolución. De ahí, el bloque 2520 corresponde al bloque 2501 de la Figura 25a. Luego, en el paso 2522 se determina un borde de parche de síntesis blanco en base al factor de transposición. En particular, el borde de parche de síntesis blanco corresponde al resultado de la multiplicación del valor de parche de la Figura 24a y fTabieLow ( 0 ) , donde fiabieLow(O) indica el primer canal o bandeja del rango de extensión de ancho de banda, esto es, la primera banda por arriba de la frecuencia de transición, por debajo de la cual los datos de audio de entrada 2300 están dados con alta resolución. En el paso 2524 se verifica si el borde de parche de síntesis blanco coincide con una entrada en la tabla de baja resolución dentro de un rango de alineación. En particular, se prefiere un rango de alineación de '3, como se indica, por ejemplo, en 2525 en la Figura 24a. Sin embargo, otros rangos también son útiles, tal como rangos más pequeños o iguales que 5. Si en el paso 2524 se determina que el blanco coincide con una entrada de la tabla de baja resolución, entonces esta entrada coincidente es tomada como el nuevo borde de parche en lugar del borde de parche blanco. Sin embargo, si se determina que no existe entrada dentro del rango de alineación, se aplica el paso 2526, en el cual se hace la misma búsqueda con la tabla de alta resolución que también se indica en 2527 en la Figura 24a. Si en el paso 2526 se determina que existe una entrada de tabla dentro del rango de alineación, entonces la entrada coincidente es tomada como un nuevo borde de parche en lugar del borde de parche de síntesis blanco. Sin embargo, si en el paso 2526 se determina que incluso en la tabla de alta resolución no existe valor dentro del rango de alineación, entonces se aplica el paso 2528 en el cual se usa el borde de síntesis blanco sin alineación alguna. Esto también está indicado en la Figura 24a en 2529. Por ende, se puede ver el paso 2528 como una posición para caso de caída de modo que se garantiza en cualquier caso que el decodificador de extensión de ancho de banda no queda en un bucle, sino que llega a alguna solución en cualquier caso incluso si hay una selección muy específica y problemática de las tablas de frecuencia y los rangos blanco.
Con respecto al pseudo código de la Figura 24a, se detalla que las líneas de código 2531 ejecutan cierto procesamiento para asegurar que todas las variables estén en un rango útil. Asimismo, la verificación acerca de si el blanco coincide con una entrada en la tabla de baja resolución dentro de un rango de alineación, se ejecuta como el cálculo de una diferencia (líneas 2525, 2527) entre el borde de parche de síntesis blanco calculado por el producto indicado cerca del bloque 2522 en la Figura 25b e indicado en las líneas 2525, 2527 y una entrada de tabla actual definida por el parámetro sfbL para la línea 2525 o sfbH para la línea 2527 (sfb = banda de factor de escala) . Naturalmente, también se pueden ejecutar otras operaciones de verificación.
Asimismo, no necesariamente es el caso que se busca una coincidencia dentro de un rango de alineación cuando el rango de alineación está predeterminado. En cambio, se puede realizar una búsqueda en la tabla para hallar la mejor entra de tabla- coincidente, esto es, la entrada de tabla que está más cercana al valor de la frecuencia blanco sin importar si la diferencia entre esos dos es pequeña o alta.
Otras implementac.iones se refieren a una búsqueda en la tabla, tal como fTab-ieLow o fTabieHig para el borde más alto que no excede los limites de ancho de banda (fundamental) de la señal generada por HFR para un factor de transposición T. Luego se usa este borde más alto como el limite de frecuencia de la señal generada por HFR del factor de transposición T. En esta implementación no se requiere el cálculo de blanco indicado cerca de la caja 2522 en Figura 25b.
La Figura 13 (que comprende de la figura 13a a la 13c) ilustra la adaptación de los bordes de banda de limitador de HFT, como se describe, por ejemplo, en SBR [ISO/IEC 14496— 3:2009, "Tecnología de información — Codificación de objetos audio—visuales" ("Information technology - Coding of audiovisual objects) - Parte 3: Audio] para los parches armónicos en un codificador de HFR mejorado . El limitador opera sobre bandas de frecuencia que tienen una resolución mucho más gruesa que las bandas de factor de escala, pero el principio de operación es muy parecido. En el limitador se calcula el valor de ganancia promedio para casa una de las bandas de limitador. No se permite que los valores de ganancia individuales , esto es, los valores de ganancia de envolvente calculados para cada una de las bandas de factor de escala, excedan el valor de ganancia promedio de limitador por más que un cierto factor multiplicativo . El · objetivo del limitados es suprimir grandes variaciones de ganancias de banda de factor de escala dentro de cada una de las bandas del limitador. Mientras la adaptación de las bandas generadas por el medio de transposición a las bandas de factor de escala asegura pequeñas variaciones de la energía intra—banda dentro de la banda de factor de escala, la adaptación de los bordes de banda de limitador a los bordes de banda de medio de transposición , de acuerdo con el presente invento, maneja las diferencias de energía de mayor escala entre bandas procesadas del medio de transposición. La Figura 13(a) muestra los límites de frecuencia de las señales generadas por HFR de órdenes de transposición T=2, 3 y 4. Los niveles de energía de las diferentes señales transpuestas pueden ser substancialmente diferentes. La Figura 13(b) muestra las bandas de frecuencia del limitador las cuales típicamente son de ancho constante en una escala de frecuencia logarítmica . Los bordes de banda de frecuencia de medio de transposición son sumados como bordes de limitador constantes y los restantes bordes de limitador son re—calculados para mantener las relaciones logarítmicas lo más cercanas posibles, como se ilustra, por ejemplo, en la Figura 13(c).
Otras realizaciones emplean un esquema de parcheo mixto el cual está mostrado en la Figura 21, donde se ejecuta el método de parcheo mixto dentro de un bloque de tiempo. Para cobertura completa de las diferentes regiones del espectro de HF, un B E comprende varios parches. En HBE, los parches más altos requieren altos factores de transposición dentro de los vocoders dé fase, lo cual deteriora particularmente la calidad perceptual de los componentes transitorios.
Realizaciones asi generan los parches de orden más alto que ocupan las regiones espectrales superiores preferiblemente mediante parcheo copy—up SSB computacionalmente eficiente y los parches de orden inferior que cubren las regiones espectrales medias, para los cuales se desea conservación de la estructura armónica, preferiblemente, mediante parcheo HBE. La mezcla individual de métodos de parcheo puede ser estática en el tiempo o, preferiblemente, puede ser señalizada en la serie de bits en el tiempo.
Para la operación de copy—up, se puede usar la información de baja frecuencia como se muestra en la Figura 21. Alternativamente se pueden usar los datos de parches que fueron generados usando métodos HBR como se ilustra en la Figura 21. Esto último conduce a una estructura tonal menos densa para parches más altos. Además de estos dos ejemplos, se puede concebir toda otra combinación de copy—up y HBE.
Las ventajas de los conceptos propuestos son • Mejor calidad perceptual de componentes transitorios • Reducida complejidad computacional La . Figura 26 ilustra una cadena de procesamiento preferida con el propósitos de extensión de ancho de banda, donde se pueden ejecutar diferentes operaciones de procesamiento dentro del procesamiento subbanda no lineal indicado en los bloques 1020a, 1020b. En una implementación, el procesamiento banda—selectivo de la señal en el dominio del tiempo procesada tal como, la señal extendida en ancho de banda, se ejecuta en el dominio del tiempo más que en el dominio subbanda, que existe antes del banco de filtros de síntesis 2311.
La Figura 26 ilustra un aparato para generar una señal de audio extendida en ancho de banda a partir de una señal de entrada de banda baja 1000 de acuerdo con otra realización. El aparato comprende un banco de filtros de análisis 1010, un procesador subbanda no lineal de modo—subbanda 1020a, 1020b, un ajustador de envolvente conectado subsiguientemente 1030 o, digo en general, un procesador de reconstrucción de alta frecuencia que opera sobre parámetros de reconstrucción de alta frecuencia, por ejemplo, como entrada en la linea de parámetro 1040. El ajustador de envolvente, o como se expresa en general, el procesador de reconstrucción de alta frecuencia, procesa señales subbanda individuales para cada canal de subbanda y hace entrar señales subbanda procesadas para cada canal de subbanda en un banco de filtros de síntesis 1050. El banco de filtros de síntesis 1050 recibe, en sus señales de entrada de canal inferior, una representación de subbanda de la señal de decodificador por núcleo de banda baja. Dependiendo de la implementación, la banda baja también puede ser derivada de las salidas del banco de filtros de análisis 1010 de la Figura 26. Las señales subbanda transpuestas son alimentadas en canales de banco de filtros más altos del banco de filtros de síntesis para ejecutar reconstrucción de alta frecuencia.
El banco de filtros 1050 finalmente entrega una señal de salida- de medio de transposición la cual comprende extensiones de ancho de banda por factores de transposición 2, 3 y 4, y la señal entregada por el bloque 1050 ya no está limitada en ancho de banda a la frecuencia de transición, esto es, a la más alta frecuencia de la señal de codificador por núcleo que corresponde a la frecuencia más baja de los componentes de señal generados por SBR o HFR. El banco de filtros de análisis 1010 de la Figura 26 corresponde al banco de filtros de análisis 2510 y el banco de filtros de síntesis 1050 puede corresponder al banco de filtros de síntesis 2514 de la Figura 25a. En particular, como se discute en el contexto de la Figura 27 (que comprende de la figura 27a a la 27b) , el cálculo de banda fuente ilustrado en el bloque 2507 en la figura 25a es realizado dentro del procesamiento subbanda no lineal 1020a, 1020b, usando los bordes de parche de síntesis alineados . y los bordes de banda de limitador calculados por los bloques 2504 y 2505.
Con respecto a las tablas de banda de frecuencia de limitador, se ha de notar que las tablas de banda de frecuencia de limitador pueden ser construidas para tener o bien una banda de limitados sobre todo el rango de reconstrucción, o bien, aproximadamente 1,2; 2 o 3 bandas por octava, señalizadas por un elemento de serie de bits en el tiempo . bs_limi—ter_bands como se define en ISO/IEC 14496—3: 2009, 4.6.18.3.2.3. La tabla de banda puede comprender bandas adicionales correspondientes a los parches de generador de alta frecuencia. La tabla puede contener índices de subbandas de banco de filtros de síntesis, donde el número de elementos es igual al número de bandas más uno. Cuando transposición armónica está activa, se asegura que el calculador de banda de limitador introduce bordes de banda de limitador que coinciden con los bordes de parche definidos por el calculador de borde de parche 2504. Adicionalmente, los restantes bordes de banda de limitador luego son calculados entre aquellos bordes de banda de limitador puestos "fijamente" para los bordes de parche.
En la realización de la Figura 26, el banco de filtros realiza un sobre muestreo de dos veces y tiene un cierto espaciamiento subbanda de análisis 1060. El banco de filtros 1050 tiene un espaciamiento subbanda de síntesis 1070 que es, en esta realización, el doble del espaciamiento subbanda de análisis lo cual da por resultado una contribución de transposición como se discutirá luego en el contexto de la Figura 27 (que comprende de la figura 27a a la 27b) .
La Figura 27 (que comprende de la figura 27a a la 27b) ilustra una implementación detallada de una realización preferida de un procesador subbanda no lineal 1020a de la Figura 26. El circuito ilustrado en la Figura 27 (que comprende de la figura 27a a la 27b) recibe como entrada una señal subbanda simple 1080, la cual es procesada en tres "ramas". La rama superior 110a es para una transposición por un factor de transposición de 2. La rama del medio de la Figura 27· (que comprende de la figura 27a a la 27b) indicada en 110b es para una transposición por un factor de transposición de 3, y la rama inferior de la Figura 27 (que comprende de la figura 27a a la 27b) es para una transposición por un factor de transposición 4, y está indicada mediante el número de referencia 110c. Sin embargo, la transposición real obtenida por cada elemento de procesamiento de la Figura 27 (que- comprende de la figura 27a a la 27b) es sólo 1 (esto es, sin transposición) por rama 110a. La transposición real obtenida por el elemento de procesamiento ilustrado en la Figura 27 (que comprende de la figura 27a a la 27b) por la rama del medio 110b es igual a 1,5 y . la transposición real para la rama inferior 110c es igual a 2. Esto está indicado por los números entre corchetes a la izquierda de la Figura 27 (que comprende de la figura 27a a la 27b) , donde están indicados los factores de transposición T. Las transposiciones de 1,5 y 2 representan una primera contribución de transposición obtenida teniendo una operación de diezmado en las ramas 110b, 110c y un •estiramiento de tiempo mediante el procesador de superponer— sumar. La segunda contribución, esto es, la duplicación de la transposición, se obtiene mediante el banco de filtros de síntesis 105, el cual tiene . un espaciamiento subbanda de síntesis 1070. que es el doble del espaciamiento subbanda del banco de filtro de análisis. Por lo tanto, como el banco de filtros de síntesis tiene el doble de espaciamiento subbanda de síntesis, la funcionalidad de diezmado no tiene lugar en la rama 110a.
Sin embargo, . la rama 110b tiene una funcionalidad de diezmado para obtener una transposición por 1,5. Debido al hecho de que el banco de filtros de síntesis tiene el doble de espaciamiento subbanda físico que el banco de filtros de análisis, se obtiene un factor d transposición de 3 como está indicado en la Figura 27 (que comprende de la figura 27a a la 27b) a la izquierda del extractor de bloque para la segunda rama 110b.
Análogamente, la tercera rama tiene una funcionalidad de diezmado correspondiente a un factor de transposición de 2 , y la contribución final del espaciamiento subbanda diferente en el banco de filtros de análisis y el banco de filtros de síntesis finalmente corresponde a un factor de transposición de 4 de la tercera rama 110c.
En particular, cada rama tiene un extractor de bloque 120a, 120b, 120c y cada uno.de estos extractores de bloque puede ser similar al extractor de bloque 1800 de la Figura 18. Asimismo, cada rama tiene un calculador de fase 122a, 122b y 122c, y el calculador de fase puede ser similar al calculador de fase 1804 de la Figura 18. Asimismo, cada rama tiene un ajustador de fase 124a, 122b y 122c, y el ajustador de fase puede ser similar al ajustador de fase 1806 de la Figura 18. Asimismo, cada rama tiene un elemento de ventaneo 126a, 120b, 120c, donde cada uno de estos elementos de ventaneo puede ser similar al elemento de ventaneo 1802 de la Figura 18. En toco caso, los elementos de ventaneo' 126a, 126b,. 126c también pueden ser configurados para aplicar una ventana rectangular junto con algún "rellenado con ceros". Las señales transpuestas o de parche de cada rama 110a, 110b, 110c de la realización de la Figura 11 (que comprende de la figura lia a la 11c) se ingresa en el sumador 128, el cual suma la contribución proveniente de cada rama a la señal subbanda real para finalmente obtener lo que se denomina bloques de transpuestos en la salida del sumador 128. Luego se realiza un procedimiento de superposición—suma en el medio de superposición—suma 130, y el medio de superposición—suma 130 puede ser similar al bloque de superposición—suma 1808 de la Figura 18. El medio de superposición—suma aplica un valor de avance de superposición—suma d 2 e, donde e es el valor de superposición—avance o "valor de paso" de los extractores de bloque 120a, 120b, 120c, y el medio de superposición—suma 130 entrega la señal transpuesta, que en esta realización de la Figura 27 (que comprende de la figura 27a a la 27b) , es una salida subbanda de señal para el canal k, esto es para el canal subbanda actualmente observado. El procesamiento ilustrado en la Figura 27 (que comprende de la figura 27a a la 27b) es realizado para cada subbanda de análisis o para un cierto grupo de subbandas de análisis y, como se ilustra en la Figura 26, se ingresan señales subbanda transpuestas en el banco de filtros de síntesis 105 después de ser procesadas por el bloque 103 para finalmente obtener la señal de salida de medio de transposición ilustrada en la Figura 26 en la salida del bloque de salida 105.
En una realización, el extractor de bloque 120a de la primera rama de medio de transposición 110a extrae 10 muestras subbanda y subsiguientemente se realiza una conversión de estas 10 muestras QMF a coordenadas polares. Esta salida, generada por el ajustador de fase 124a, luego es remitida al elemento de ventaneo 126a, que extiende la salida mediante ceros para el primero y último valor del bloque, donde esta operación es equivalente a un ventaneo (síntesis) con una- ventana rectangular de longitud 10. El extractor de bloque 120a de la rama 110a no realiza diezmado. Por lo tanto, las muestras extraídas mediante el extractor de bloque son mapeadas en un bloque extraído en el mismo espaciamiento de muestra que donde fueron extraídas.
Sin embargo, esto es diferente para las ramas 110b y 110c. El extractor de bloque 120b preferiblemente extrae un bloque de 8 muestras subbanda y distribuye estas 8 muestras subbanda del bloque extraído en un espaciamiento de muestra subbanda diferente. Las entradas de muestra subbanda no enteras para el bloque extraído se obtienen mediante una interpolación, y las muestras QMF así obtenidas junto con las muestras interpoladas son convertidas a coordenadas polares y son procesadas por el ajustador de fase. Luego, de nuevo, se realiza el ventaneo en el elemento de ventaneo 126b para extender la salida de bloque mediante el ajustador de fase 124b mediante ceros para las dos primeras muestras y las dos últimas muestras, cuya operación es equivalente a un ventaneo (síntesis) con una ventana rectangular de longitud 8.
El extractor de bloque 120c está configurado para extraer un bloque con una extensión de tiempo de 6 muestras subbanda y realiza un diezmado de un factor de diezmado 2, realizar, una conversión- de las muestras QMF en coordenadas polares y de nuevo realiza una operación en el ajustador de fase 124b, y la salida de nuevo es extendida mediante ceros, aunque ahora para las tres . primera muestras subbanda y para las tres últimas muestras subbanda. Esta operación es equivalente a un ventaneo (síntesis) con una venta rectangular de longitud 6.
Las salidas de transposición de cada rama son sumadas luego para formar la salida de QMF combinada mediante el sumador 128, y las salidas de QMF combinadas son finalmente superpuestas usando superposición—suma en el bloque 130, donde el avance de superposición—suma o valor de paso es el doble que el valor de paso de los extractores de bloque 120a, 120b, 120c como se discutió antes.
La Figura 27 (que comprende de la figura 27a a la 27b) adicionalmente ilustra la funcionalidad realizada por el calculador de banda fuente 2507 de la Figura 25a, donde se considera que el número de referencia 108 ilustra las señales subbanda de análisis disponibles para una parcheo, esto es, las señales indicadas en 1080 de la Figura 26, que son entregadas por el banco de filtros de análisis 1010 de la Figura 26. La selección de la subbanda correcta de las señales subbanda de análisis o, en la otra realización relacionada con el medio de transposición de DFT, la aplicación de la correcta ventana de frecuencia de análisis es realidad por los extractores de bloque 120a, 120b, 120c. Con este fin, los bordes de parche que indican la primera señal subbanda, la última señal subbanda y las señales subbanda intermedias para cada parche son provistas al extractor de ¦ bloque para cada rama de transposición. La primera rama finalmente que da por resultado un factor de transposición de T=2 recibes, con su extractor de bloque 120a todos los índices subbanda entre xOverQmf(O) y xOverQmf(l), y el extractor de bloque 120a entonces extrae un bloque de la subbanda de análisis así seleccionada. Se ha de notar que los bordes de parche se dan como un índice de canal del rango de síntesis indicado por k, y las bandas de análisis están indicadas por n con respecto a sus canales subbanda. Por ende, como n se calcula dividiendo 2k por T, los números de canal de la banda de análisis n, por lo tanto, son iguales a los números de canal del rango de síntesis debido al doble espaciamiento de frecuencia del banco de filtros de síntesis como se discutió en el contexto de la Figura 26. Esto está indicado arriba del bloque 120a para el primera extractor de bloque 120a o, generalmente, para la primera rama de medio de transposición 110a. Luego, para la segunda rama de parcheo 110b, el extractor de bloque recibe todos los índices de canal de rango de síntesis entre xOverQmf(l) y x0verQmf(2). En particular, los índices de canal de rango fuente, desde los cuales el extractor de bloque tiene que extraer bloques para ulterior procesamiento, son calculados a partir de los índices de canal de rango de síntesis dados por los bordes de parche determinados multiplicando k con el factor 2/3. Entonces, se toma la parte entera de este cálculo como el número de canal de análisis n, del cual luego el extractor de bloque extrae el bloque a ser adicionalmente procesado mediante los elementos 124b, 126b.
Para la tercera rama 110c, el extractor de bloque 120c, otra vez recibe los bordes de parche y realiza una extracción de bloque de las subbandas que corresponden a bandas de síntesis definidas por xOverQmf(2) hasta x0verQmf(3). Los números de análisis n son calculados por 2 multiplicado por k, y éste es la regla de cálculo para calcular los números de canal de análisis a partir de los números de canal ¦ de síntesis. En este contexto, se ha de destacar que xOverQmf. corresponde a xOverBin de la Figura 24a, a pesar de que la Figura 24a corresponde al parcheador basado en DFT, . mientras que xOverQmf corresponde al parcheador basado en QMF. Las reglas de- cálculo para .determinar xOverQmf (i) es determinada de la misma manera que se ilustra en la Figura 24a-, pero no se requiere el factor • fftSizeSyn/128 para calcular xOverQmf.
El procedimiento para determinar los bordes de parche para calcular los rangos de análisis para la realización de la Figura 27 (que comprende de la figura 27a a la 27b) , también se ilustra en la Figura 24a y 24b. En el primer paso 2600 se. calculan los bordes de parche para los parches correspondientes a los factores de transposición 2, 3, 4 y, opcionalmente, incluso más, como se discutió en el contexto de las figuras 24a o la Figuras 25a. Luego se calcula la ventana del dominio de la frecuencia de rango fuente para el parcheador de DFT o las subbandas de rango fuente para el parcheador de QMF, mediante las ecuaciones discutidas en el contexto de los bloques 120a, 120b, 120c, los cuales también se ilustran a la derecha del bloque 2602. Luego se realiza un parcheo calculando la señal transpuesta y mapeando la señal transpuesta a las altas frecuencias como se indica¦ en el bloque 2604,. y el- calculo de la señal transpuesta está ilustrado en particular en el procedimiento de la Figura 27 (que comprende de la figura 27a a la 27b) , · donde la señal transpuesta entregada por el medio de superposición—suma de bloque 130 corresponde al resultado del parcheo generado por el procedimiento del bloque 2604 de la Figura 24a y 24b.
Una realización comprende un método para decodificar una señal de audio usando transposición armónica basada en bloque de subbanda, que comprende el filtrado de una señal decodificada por núcleo a través de un banco de filtros de análisis de bandas para obtener un conjunto de señales subbanda; sintetizar un subconjunto de dichas señales subbanda por medio de bancos de filtros de síntesis con tasa de muestreo reducida, para obtener señales de rango fuente con tasa de muestreo reducida.
Una realización se refiere a un método para alinear los bordes de banda espectral de señales generadas por HFR a bordes espectrales utilizados en un proceso paramétrico.
Una realización se refiere a un método para alinear bordes espectrales de las señales generadas por HFR a bordes espectrales de la tabla de frecuencia de ajuste de envolvente que comprende: la búsqueda del borde más alto en la tabla de frecuencia de ajuste de envolvente que no excede los límites de ancho de banda fundamentales de la señal generada por HFR de factor de transposición T; y usar el borde más alto hallado como límite de frecuencia de la señal generada por HFR de factor de transposición T.
Una realización se refiere a un método para alinear los bordes espectrales de la herramienta de software de limitador a los. bordes espectrales de las señales generadas por HFR, que comprende: sumar los bordes de frecuencia de las señales generadas por HFR a la tabla de bordes usada cuando se crea los bordes de banda de frecuencia usada por la herramienta de software de limitador; y forzar al limitador a usar los bordes de frecuencia sumados como bordes constantes y a ajustar consiguientemente los bordes restantes.
Una realización se refiere a transposición combinada de una señal de audio. que comprende varios órdenes de transposición enteros en un dominio de banco de filtros de baja resolución donde la operación de transposición es realizada sobre bloques de tiempo de las señales subbanda.
Otra realización se refiere a transposición combinada, donde los órdenes de transposición mayores que 2 son empaquetar en un entorno de transposición de orden 2 Otra realización se refiere a transposición combinada, donde los órdenes de transposición mayores que 3 son empaquetar en un entorno de transposición de orden 3, mientras los órdenes de transposición menores que 4 son realizados separadamente.
. Otra realización, se refiere a transposición combinada, donde se crean órdenes de transposición (por ejemplo, órdenes de transposición mayores que 2) mediante replicación de órdenes de transposición calculados previamente (esto es, especialmente órdenes inferiores) incluyendo el ancho de banda codificado por núcleo. Toda combinación concebible de órdenes de transposición disponibles y anchos de banda de núcleo, es posible sin restricciones.
Una realización se refiere a reducción de complejidad computacional debido al reducido número de bancos de filtro de análisis que se requieren para transposición.
Una realización se refiere a un aparato para generar una señal extendida en ancho de banda a partir de una señal de audio de entrada, que comprende: un parcheador para parchear una señal de audio de entrada para obtener una primera señal parcheada y una segunda señal parcheada, teniendo la segunda señal parcheada una frecuencia de parche diferente comparado con la primera señal parcheada, en donde la primera señal parcheada es generada usando un primer algoritmo de parcheo, y la segunda señal parcheada es generada usando un segundo algoritmo de parcheo; y un combinador para combinar la primera señal parcheada y la segunda señal parcheada para obtener la señal extendida en ancho de banda.
Otra realización se refiere a este aparato, en el cual el primer algoritmo de parcheo es un algoritmo de parcheo armónico, y el segundo algoritmo de parcheo es una algoritmo de parche no armónico.
Otra realización se refiere a un aparato de predicción, en el cual la primera frecuencia de parcheo es menor que la segunda frecuencia de parcheo o vice versa.
Otra realización se refiere a un aparato de predicción, en el- cual la señal de entrada comprende información de parcheo; y en el cual el parcheador está configurado para ser controlado por la información de parcheo extraída de la señal de entrada para variar el primer algoritmo de parcheo o el segundo algoritmo de parcheo en concordancia con la información de parcheo.
Otra realización se refiere a un aparato de predicción, en el cual el parcheador es operativo para parchear bloques subsiguientes de muestras de señal de audio, y en el cual el parcheador está configurado para aplicar el primer algoritmo de parcheo y el segundo algoritmo de parcheo al mismo bloque de muestras de audio.
Otra realización se refiere a un aparato de predicción, en el cual el parcheador comprende, en órdenes arbitrarios, un medio de diezmado controlado por un factor de extensión de ancho de banda, un banco de filtros, y un extensor para una señal subbanda de banco de filtros.
Otra realización se refiere a un aparato de predicción, en el cual el extensor comprende un extractor de bloques para extraer un número de bloques de superposición en concordancia con un valor de avance de extracción; un ajustador de fase o elemento de ventaneo para ajustar valores de muestreo subbanda en cada bloque en base a una función de ventana o una corrección de fase; y un medio de superposición—suma para realizar un procesamiento de superposición—suma de bloques ventaneados y ajustados en fase usando un valor de avance de superposición mayor que el valor de avance de extracción.
Otra realización se refiere a un aparato para extensión en ancho de banda de una señal de audio que comprende: un banco de filtros para filtrar la señal de audio para obtener señales subbanda con tasa de muestreo reducida; una pluralidad de diferentes procesadores subbanda para procesar diferentes señales subbanda en diferentes maneras, realizando los : procesadores subbanda diferentes operaciones de estiramiento de tiempo de señal subbanda usando diferentes factores de estiramiento; y una medio de fusión para fusionar subbandas procesadas entregadas por la pluralidad de diferentes procesadores subbanda para obtener una señal de audio extendida en ancho de banda.
Otra realización se refiere a un aparato para reducir la tasa de muéstreo de una señal de audio, que comprende; un modulador; un interpolador que usa un factor de interpolación; un filtro pasabajo complejo; y un medio de diezmado que usa un factor de diezmado, en donde el factor de diezmado es más alto que el factor de interpolación.
Una realización se refiere a un aparato para reducción de la tasa de muestreo de una señal de audio, que comprende: un primer banco de filtros para generar una pluralidad de señales subbanda a partir de la señal de audio, en donde una tasa de muestreo de la señal subbanda es más pequeña que una tasa de muestreo de la señal de audio; por lo menos un banco de filtros de síntesis seguido por un banco de filtro de análisis para realizar una conversión de tasa de muestre, teniendo el banco de filtro de síntesis un número de canales diferente de un número de canales del banco de filtro de análisis; un procesador de estiramiento de tiempo para procesar la señal con tasa de muestreo convertida; y un combinador para combinar la señal estirada en el tiempo y una señal de banda baja o una señal estirada en el tiempo diferente .
Otra realización se refiere a un aparato para reducir la tasa de muestreo de una señal de audio por un factor de reducción de la tasa de muestreo no entero, que comprende; un filtro digital; un interpolador que tiene un factor de interpolación; un elemento poli—fase que tiene derivaciones (taps) pares e impares y un medio de diezmado que tiene un factor de diezmado que es mayor que el factor de interpolación, siendo el factor de diezmado y el factor de interpolación seleccionados tal que un cociente del factor de interpolación y el factor de diezmados es no entero.
Una realización se refiere a un aparato para procesar una señal de audio, que comprende: un decodificador por núcleo que tiene un tamaño de transformación de síntesis que es más pequeño, que un tamaño de transformación nominal por un factor, de modo que la señal de salida es generada por el decodificador por núcleo que tiene una tasa de muestreo más pequeña que una tasa de muestreo nominal correspondiente al tamaño de transformación nominal; y un post—procesador que tiene uno o más bancos de filtros, uno o más extensores de tiempo y un medio de fusión, en donde un número de canales de banco de filtros del uno o más bancos de filtros es reducido comparado con un número según lo determinado por el tamaño de transformación nominal.
Otra realización se refiere a un aparato para procesar una. señal de banda baja, que comprende: un generador de parches para generar múltiples parches usando la señal de audio de banda baja; un ajustador de envolvente para ajustar una envolvente de la señal usando factores de escala dados por bandas de factor de escala adyacentes que tienen bordes de banda de factor de escala, en donde el generador de parches está configurado para realizar los múltiples parches, de modo que un borde entre parches adyacentes coincide con un bode entre bandas de factor de escala adyacentes en la escala de frecuencia.- Una realización se refiere a un aparato para procesar una señal de audio de banda baja, que comprende: un generador de parches para generar múltiples parches usando la señal de audio de banda baja; y un limitador de ajustador de envolvente para limitar valores de ajuste de envolvente para una señal limitando en bandas de limitador adyacentes que tienen bordes de banda de limitador, en donde el generador de parches está configurado para realizar los múltiples parches, de modo que un borde entre parches adyacentes coincide con un bode entre bandas de limitador adyacentes en una escala de frecuencia .
El procesamiento del invento es útil para mejorar codificadores—decodificadores de audio que se apoyan en un esquema de extensión¦ en ancho de banda. Especialmente si es muy importante una calidad perceptual óptima a una cantidad de bits transmitidos y, al mismo tiempo, la potencia de procesamiento es un recurso limitado.
La mayoría de las aplicaciones destacadas son decodificadores de audio que son implementados con frecuencia en dispositivos portátiles y, de ese modo, funcionan sobre una fuente .de energía de batería.
La señal de audio codificada inventiva puede ser almacenada en un medio de almacenamiento digital o puede ser transmitida a través de un medio de transmisión tal como un medio de transmisión inalámbrico o una medio de transmisión físico tal como Internet.
Dependiendo de ciertos requerimientos de implementación, las realizaciones del invento pueden ser implementadas en hardware o en software. La implementación se puede llevar a cabo utilizando un medio de almacenamiento digital, por ejemplo un diskette, un DVD, un CD, una ROM, una EPROM, una EEPROM o una memoria FLASH, los cuales tienen unas señales de control electrónicamente legibles guardadas en ellos, las cuales cooperan (o son capaces de cooperar) con un sistema de computación programable.de modo que se ejecuta el respectivo método .
Algunas realizaciones de acuerdo con el invento comprenden un portador de datos que tiene señales de control legibles electrónicamente, las cuales son capaces de cooperar con una sistema de computadora programable, tal que uno de los métodos descrito en la presente sea ejecutado.
Generalmente, realizaciones del presente invento pueden ser implementadas como un programa de computador con un código de programa, siendo código de programa operativo para ejecutar uno de los métodos cuando el producto de programa de computadora corre en una computadora. El código de programa puede ser almacenado, por ejemplo, sobre un portador legible por una máquina.
Otras realizaciones comprenden el programa de computadora para ejecutar uno de los métodos descritos en la presente, almacenado en un portador legible por una máquina.
En otras palabras, una realización del método inventivo es, por lo tanto, un programa de computadora que un código de programa para ejecutar uno de los métodos descritos en la presente, cuando el programa de computadora corre en una computadora .
Una realización adicional de los métodos inventivos es, por lo tanto, un portador de datos (o un medio de almacenamiento digital, o un medio legible por computadora) que comprende, grabado en el mismo, el programa de computadora para ejecutar uno de los métodos descritos en la presente.
Una realización adicional del método inventivo es, por lo tanto, una transmisión de datos o una secuencia de señales que representan el programa de computador para ejecutar uno de los métodos descritos en la presente. La transmisión de datos o la secuencia de señales pueden ser configuradas, por ejemplo, para ser transferidos vía una conexión de comunicación de datos, por ejemplo, via Internet.
Una realización adicional comprende un medio de procesamiento, por ejemplo, una computadora, o un dispositivo lógico programable, configurado para o adaptado para ejecutar uno de los métodos descritos en la presente.
Una realización adicional comprende una computadora que tiene instalado en ella el programa de computadora para ejecutar uno de los métodos descritos en la presente.
En algunas realizaciones se puede usar un dispositivo de lógica programable (por ejemplo un arreglo de compuesta programable de campo) para realizar algunas o todas las funcionalidades de los métodos descritos en la presente. En algunas realizaciones,- el arreglo de compuerta programable de campo puede cooperar con un microprocesador para realizar uno de los métodos descritos en la presente. Generalmente, los métodos preferiblemente son realizados mediante algún aparato de hardware.
Las realizaciones que se describieron más arriba son puramente ilustrativas para los principios del presente invento. Se entiende que las modificaciones y variaciones posibles de las disposiciones y de los detalles descritos en la presente serán evidentes para los expertos en la materia. Por lo tanto, es la intención que el invento esté limitado sólo por el alcance de las siguientes reivindicaciones de patente y no por los detalles específicos presentados por la descripción y la explicación de las realizaciones en la presente .
LITERATURA: [1] M. Dietz, L. Liljeryd, K. Kjorling y 0. Kunz, Replicación de Banda Espectral, un enfoque novedoso en ¦ codificación .de audio" ("Spectral Band Replication, a novel approach in audio coding") en la 112° Convención AES, Munich, mayo de 2002. [2] S. Meltzer, R. Bóhm y F . Henn, " Codificadores- decodificadores de audio mejorados con SBR para radiodifusión digital . tal como "Digital Radio Mondiale" (DRM) " ("SBR enhanced audio codees for digital broadeasting such as "Digital Radio Mondiale" (DRM),") en la 112° Convención AES, Munich, mayo de 2002. [3] T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Mejoramiento de mp3 con SBR: Rasgos y Capacidades del nuevo Algoritmo mp3PRO" ("Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm,") en la 112° Convención AES, Munich, mayo de 2002. [4] Norma Internacional ISO/IEC 14496-3: 2001/FPDAM 1 "Extensión, de Ancho de Banda" ISO/IEC, 2002. (International Standard ISO/IEC 14496-3 : 2001/FPDAM 1, "Bandwidth Extensión" ISO/IEC-, 2002.) "Método y Aparato de extensión de ancho de banda de voz" (Speech bandwidth extensión method and apparatus) Vasu lyengar et al.. [5] Larsen, R . . Aarts, y M. Danessis. "Extensión de ancho de banda de alta frecuencia eficiente de música y voz" ("Efficient high—frequency bandwidth extensión of music and speech") en la . convención 112° AES, Munich, Alemania, mayo de 2002. [6] R. M . Aarts, E. Larsen, y O. Ouweltjes. "Un enfoque unificado a la extensión de ancho de banda de baja y alta frecuencia" (A unified approach to low— and high frequency bandwidth extensión) . en La 115° Convención AES, New York, USA, octubre de 2003. [7] K. Kayhkó. "Un Mejoramiento de Banda Ancha Robusto para Señal de Voz de Banda angosta" (A Robust Wideband Enhancement for Narrowband Speech Signal) . Informe de investigación, Universidad de Tecnología de Helsinki, Laboratorio de Acústica y Procesamiento de Señal de Audio (Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing), 2001. [8] E. Larsen y R. M. Aarts. "Extensión de Ancho de Banda de Audio — Aplicación a Psicoacústica, Procesamiento de Señal y Diseño de Altavoz" (Audio Bandwidth Extensión — Application to psychoacoustics, Signal Processing and Loudspeaker Design). John Wiley & Sons, Ltd, 2004. [9] Larsen, R. M. Aarts, y M. Danessis. "Extensión de ancho de banda de alta frecuencia eficiente de música y voz" ("Efficient high—frequency bandwidth extensión of music and speech") en la convención 112° AES, Munich, Alemania, mayo de 2002. [10] J. Makhoul. "Análisis Espectral de . Voz mediante Predicción Lineal" (Spectral Analysis of Speech by Linear Prediction) . IEEE "Transacciones de Audio y Electroacústica" (Transactions on Audio and Electroacoustics), AU—21(3), junio de 1973. [11] Solicitud de Patente de Estados Unidos Número 08/951.029, Ohmori , et al. "Sistema y método de extensión de ancho de banda de audio" ("Audio band width extending system and method") [12] Patente de Estados Unidos N° 6895375, Malah, D & Cox, R. V. : "Sistema para extensión de ancho de banda de vos de banda angosta" (System for bandwidth extensión of Narrow— band speech) . [13] Frederik Nagel, Sascha Disch, "Un método de extensión de ancho de banda armónica para codificador-decodificador de audio" ("A harmonio bandwidth extensión method for audio codees") , ICASSP Congreso Internacional sobre el procesamiento de acústica, voz y señal ( International Conference on Acoustics, Speech and Signal Processing), IEEE CNF, Taipei, Taiwan, Abril de 2009 [14] Frederik Nagel, Sascha Disch, Nikolaus Rettelbach, "Un método de extensión de ancho de banda impulsada por vocoder- de fase con un nuevo tratamiento de componentes transitorios para códigos de audio." ("A phase vocoder driven bandwidth extensión method with novel transient handling for audio codees,") 126th AES Convention, Munich, Alemania, mayo de 2009. [15] M. Puckette. Vocoder de fase sincronizada. Congreso IEEE ASSP sobre Aplicaciones de Procesamiento de Señales en Audio y Acústica. ( Phase—locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics), Mohonk 1995.", A. Róbel, : "Detección y preservación de componentes transitorios en el vocoder de fase." ("Transient detection and preservation in the phase vocoder,") citeseer.ist.psu. edu/679246. html [16] Laroche L., Dolson M. : "Modificación mejorada de escala de tiempo de vocoder de fase de audio ("Improved phase vocoder timescale modification of audio"), IEEE Trans, sobre procesamiento de voz y audio (IEEE Trans. Speech and Audio Processing), vol. 7, no. 3, pp. 323—332, [17] Patente de los Estados Unidos 6 549 884, Laroche, J. & Dolson, M.: "Desplazamiento de tono de fase—vocoder" ( "Phase—vocoder pitch—shifting" ) [18] Herré, J. ; . Faller, C; Ertel, C; Hilpert, J. ; Hólzer, A.; Spenger, C, "Surround de MP3 : Codificación Eficiente y Compatible de; Señales de Audio de Múltiples Canales" ("MP3 Surround: Efficient and Compatible Coding of Multi—Channel Audio"), 116° Congreso de la Sociedad de Ingenioros de Audio, Mayo de 2004 (116th Conv. Aud. Eng. Soc. , May 2004) [19] Neuendorf, Max; Gournay, Philippe; Multrus, Markus; Lecomte, Jérémie; Bessette, Bruno; Geiger, Ralf; Bayer, Stefan; Fuchs, Guillaume; Hilpert, Johannes; Rettelbach, Nikolaus; Salami, Redwan; Schuller, Gerald; Lefebvre, Roch; Grill, Bernhard: Esquema de Codificación Unificada de Voz y Audio para una Alta Calidad con una Baja Cantidad de Bits Transmitidos" ("Unified Speech and Audio Coding Scheme for. •High Quality at Lowbitrates" ) , ICASSP 2009 (Congreso Internacional sobre el procesamiento de acústica, voz y señal), 19 al 24 de Abril de 2009, Taipei, Taiwan [20] Bayer, Stefan; Bessette, Bruno; Fuchs, Guillaume; Geiger, Ralf; Gournay, Philippe; Grill, Bernhard; Hilpert, Johannes; Lecomte, Jérémie; Lefebvre, Roch; Multrus, Markus; Nagel, Frederik; Neuendorf, Max; Rettelbach, Nikolaus; Robilliard, Julien; Salami, Redwan; Schuller, Gerald: "Un Esquema Novedoso para la Codificación Unificada de Voz y Audio con- una Baja Cantidad de Bits Transmitidos" ("A Novel Scheme for Low Bitrate Unified Speech and Audio Coding"), en la convención 126° AES, Munich, Alemania, 7 de mayo de 2009.

Claims (13)

REIVINDICACIONES
1. Un aparato para procesar una señal de audio para generar una señal extendida en ancho de banda que tiene una parte de alta frecuencia (102) y una parte de baja frecuencia (104) usando datos paramétricos (2302) para la parte de alta frecuencia (102), los datos paramétricos que se relacionan con bandas de frecuencia (100, 101) de la parte de alta frecuencia (102), que comprende: un calculador de borde de patching (2302) es decir de parche, para calcular un borde de parche (1001c, 1002c, 1002d, 1003c, 1003b) tal que el borde de parche coincide con un borde de banda de frecuencia de las bandas de frecuencia (101, 100) ; y un parcheador (2312) para generar una señal parcheada usando la señal de audio (2300) y el borde de parche (1001c, 1002c, 1002b, 1003c, 1003b) , en donde los bordes de parche se relacionan con la parte de alta frecuencia (102) de la señal extendida de ancho de banda; en donde el calculador de borde de parche (2302) está configurado para; calcular (2520) una tabla de frecuencia que define las bandas de frecuencia de la parte de alta frecuencia (102) usando los datos paramétricos o datos de entrada de configuración adicionales; establecer (2522) un borde de parche de síntesis objetivo diferente del borde de parche usando por lo menos un factor de transposición; buscar (2524), en la tabla de frecuencia, una banda de frecuencia coincidente que tenga un borde coincidente que coincida con el borde de parche de síntesis objetivo dentro de un intervalo de coincidencia predeterminado o buscar la banda de frecuencia que tenga un borde de banda de frecuencia que es más cercano al borde de parche de síntesis objetivó y seleccionar (2525, 2527) la banda de frecuencia coincidente como el borde de parche, en donde la banda de frecuencia coincidente tiene un borde coincidente que coincide con el borde de parche de síntesis objetivo dentro de un intervalo de coincidencia predeterminado o tiene un borde de banda de frecuencia que es más cercano al borde de parche de síntesis objetivo.
2. Un aparato de acuerdo con la reivindicación 1, en el cual el calculador de borde de parche (2302) está configurado para calcular bordes de parche para tres diferentes factores de transposición tal que cada borde de parche coincida con un borde de banda de frecuencia (100, 101) de las bandas de frecuencia de la parte de alta frecuencia, y en el cual el parcheador (2312) está configurado para generar la señal parcheada usando los tres factores de transposición diferentes (2308) de modo que un borde entre parches adyacentes coincide con un borde entre dos bandas de frecuencia adyacentes (100, 101).
3. Un aparato de acuerdo con una cualquiera de las reivindicaciones precedentes, en el cual el calculador de borde de parche (2302) está configurado para calcular el borde de parche como un borde de frecuencia (k) en .un rango de frecuencia de síntesis correspondiente a la parte de alta frecuencia (102), y en donde el parcheador (2312) está configurado para seleccionar una porción de frecuencia de la parte de banda baja (104) usando un factor de transposición y el borde de parche .
4. Un aparato de acuerdo con una cualquiera de las reivindicaciones precedentes, que además comprende: un reconstructor de alta frecuencia (1030, 2510) para ajustar la señal parcheada (2509). usando los datos paramétricos (2302), estando configurado el reconstructor de alta frecuencia para calcular, para una banda de frecuencia o un grupo dé bandas de frecuencia, un factor de ganancia a ser usado para ponderar la correspondiente banda de frecuencia o grupos de bandas de frecuencia de la señal parcheada (2509) .
5. Un aparato de acuerdo con la reivindicación 1, en el cual el rango de coincidencia predeterminado se fija a un valor más pequeño o igual que cinco bandas QMF o 40 bandejas de frecuencia de la parte de alta frecuencia (102) .
6. Un aparato de acuerdo con una cualquiera de las reivindicaciones precedentes, en el cual los datos paramétricos comprenden un valor de datos de envolvente espectral, en donde para cada banda de frecuencia se da un valor de datos de envolvente espectral separado, en donde el aparato además comprende un reconstructor de alta frecuencia (2510, 1030) para ajuste de envolvente espectral de cada banda de la señal parcheada usando el valor de datos de envolvente espectral para esta banda.
7. Un aparato de acuerdo con una cualquiera de las reivindicaciones precedentes, en el cual el calculador de borde de parche (2302) está configurado para buscar el borde más alto en la tabla de frecuencia, que no excede un límite de ancho de banda de una señal regenerada de alta frecuencia por un factor de transposición, y para usar el borde más alto hallado, como el borde de parche.
8. Un aparato de acuerdo con la reivindicación 7, en el cual el calculador de borde de parche (2302) está configurado para recibir, para cada factor de transposición de la pluralidad de diferentes factores de transposición, un borde de parche blanco diferente.
9. Un aparato de acuerdo con una cualquiera de las reivindicaciones precedentes, que además comprende una herramienta de software de limitador (2505, 2510) para calcular bandas de limitador usadas para limitar valores de ganancia para ajustar las señales parcheadas , el aparato que además comprende un calculador de banda de limitador configurado para fijar un borde de limitador de modo que por lo menos un borde de parche determinado por el calculador de borde de parche (2302) sea fijado como un borde de limitador también.
10. Un aparato de acuerdo con la reivindicación 9, en el cual el calculador de banda de limitador (2505) está configurado para calcular además bordes de limitador de modo que otros bordes de limitador coincidan con bordes de banda de frecuencia de las bandas de frecuencia de la parte de alta frecuencia (102) .
11. Un aparato de acuerdo con cualquiera de las reivindicaciones precedentes, en el cual el parcheador (2312) está configurado para generar múltiples parches usando diferentes factores de transposición (2308), en el cual el calculador de borde de parche (2302) está configurado para calcular los bordes de parche de cada parche de los múltiples parches de modo que los bordes de parche coinciden con diferentes bordes de banda de frecuencia de las bandas de frecuencia de la parte de alta frecuencia (102) , en donde el aparato además comprende un ajustador de envolvente (2510) para ajustar una envolvente de la parte de alta frecuencia (102) después de parchear o para ajustar la parte de alta frecuencia antes de parchear usando factores de escala incluidos en los datos paramétricos dados para bandas de factor de escala.
12. Un método de procesar una señal de audio para generar una señal extendida en ancho de banda que tiene una parte de alta frecuencia (102) y una parte de baja frecuencia (104) usando datos paramétricos (2302) para la parte de alta frecuencia (102), los datos paramétricos que se relacionan con bandas de frecuencia (100, 101) de la parte de alta frecuencia (102), que comprende: calcular (2302) un borde de parche (1001c, 1002c, 1002d, 1003c, 1003b) tal que el borde de parche coincide con un borde de banda de frecuencia de las bandas de frecuencia (101, 100) ; y generar (2312) una señal parcheada usando la señal de audio (2300) y el borde de parche (1001c, 1002c, 1002b, 1003c, 1003b) , en donde los bordes de parche se relacionan con la parte de alta frecuencia (102) de la señal extendida en ancho de banda; en donde la etapa de cálculo (2302) de un borde de parche comprende : calcular (2520) una tabla de frecuencia que define las bandas de frecuencia de la parte de alta frecuencia (102) usando los datos paramétricos o datos de entrada de configuración adicionales; establecer (2522) un borde de parche de. síntesis objetivo diferente del borde de parche usando por lo menos un factor de transposición; buscar (2524), en la tabla de frecuencia, una banda de frecuencia coincidente que tenga un borde coincidente que coincida con el borde de parche de síntesis objetivo dentro de un intervalo de coincidencia predeterminado o buscar la banda de frecuencia que tenga un borde de banda de frecuencia que es más cercano al borde de parche de síntesis objetivo y seleccionar (2525, 2527) la banda de frecuencia coincidente como el borde de parche, en donde la banda de frecuencia coincidente tiene un borde coincidente que coincide con el borde de parche de síntesis objetivo dentro de un intervalo de coincidencia predeterminado o tiene un borde de banda de frecuencia que es más cercano al borde de parche de síntesis objetivo.
13.. Un programa de computadora que tiene un código de programa para ejecutar cuando corre en una computadora, el método de la reivindicación 12.
MX2012010416A 2010-03-09 2011-03-04 Aparato y método para procesar una señal de audio usando alineación de borde de patching. MX2012010416A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US31212710P 2010-03-09 2010-03-09
PCT/EP2011/053313 WO2011110499A1 (en) 2010-03-09 2011-03-04 Apparatus and method for processing an audio signal using patch border alignment

Publications (1)

Publication Number Publication Date
MX2012010416A true MX2012010416A (es) 2012-11-23

Family

ID=43987731

Family Applications (2)

Application Number Title Priority Date Filing Date
MX2012010415A MX2012010415A (es) 2010-03-09 2011-03-04 Aparato y metodo para procesar una señal de audio de entrada utilizando bancos de filtro en cascada.
MX2012010416A MX2012010416A (es) 2010-03-09 2011-03-04 Aparato y método para procesar una señal de audio usando alineación de borde de patching.

Family Applications Before (1)

Application Number Title Priority Date Filing Date
MX2012010415A MX2012010415A (es) 2010-03-09 2011-03-04 Aparato y metodo para procesar una señal de audio de entrada utilizando bancos de filtro en cascada.

Country Status (18)

Country Link
US (7) US9305557B2 (es)
EP (5) EP2545553B1 (es)
JP (2) JP5523589B2 (es)
KR (2) KR101414736B1 (es)
CN (2) CN103038819B (es)
AR (2) AR080477A1 (es)
AU (2) AU2011226211B2 (es)
BR (5) BR122021014305B1 (es)
CA (2) CA2792452C (es)
ES (3) ES2935637T3 (es)
HU (1) HUE070311T2 (es)
MX (2) MX2012010415A (es)
MY (1) MY154204A (es)
PL (3) PL3570278T3 (es)
RU (1) RU2586846C2 (es)
SG (1) SG183967A1 (es)
TW (2) TWI446337B (es)
WO (2) WO2011110500A1 (es)

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9026236B2 (en) * 2009-10-21 2015-05-05 Panasonic Intellectual Property Corporation Of America Audio signal processing apparatus, audio coding apparatus, and audio decoding apparatus
EP2362376A3 (en) * 2010-02-26 2011-11-02 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using envelope shaping
KR101414736B1 (ko) * 2010-03-09 2014-08-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 캐스케이드 필터뱅크들을 이용한 입력 오디오 신호를 처리하는 장치 및 방법
JP5850216B2 (ja) * 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
AU2011263191B2 (en) 2010-06-09 2016-06-16 Panasonic Intellectual Property Corporation Of America Bandwidth Extension Method, Bandwidth Extension Apparatus, Program, Integrated Circuit, and Audio Decoding Apparatus
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
IL317702A (en) * 2010-09-16 2025-02-01 Dolby Int Ab Method and system for harmonic, block, subchannel, and enhanced transposition by rhetorical multiplication
US8620646B2 (en) * 2011-08-08 2013-12-31 The Intellisis Corporation System and method for tracking sound pitch across an audio signal using harmonic envelope
US9530424B2 (en) 2011-11-11 2016-12-27 Dolby International Ab Upsampling using oversampled SBR
TWI478548B (zh) * 2012-05-09 2015-03-21 Univ Nat Pingtung Sci & Tech 對等網路串流傳輸方法
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
CN103915104B (zh) * 2012-12-31 2017-07-21 华为技术有限公司 信号带宽扩展方法和用户设备
CN104981870B (zh) * 2013-02-22 2018-03-20 三菱电机株式会社 声音增强装置
CN105122910B (zh) * 2013-03-14 2018-10-12 Lg 电子株式会社 在无线通信系统中通过使用设备对设备通信接收信号的方法
JP6553590B2 (ja) * 2013-03-26 2019-07-31 バラット, ラックラン, ポールBARRATT, Lachlan, Paul サンプルレートを仮想的に増加させた音声フィルタ処理
US9305031B2 (en) 2013-04-17 2016-04-05 International Business Machines Corporation Exiting windowing early for stream computing
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
US9454970B2 (en) * 2013-07-03 2016-09-27 Bose Corporation Processing multichannel audio signals
EP2830059A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling energy adjustment
TWI548190B (zh) * 2013-08-12 2016-09-01 中心微電子德累斯頓股份公司 根據控制法則來控制功率轉換器的功率級之控制器及方法
WO2015027327A1 (en) * 2013-08-28 2015-03-05 Mixgenius Inc. System and method for performing automatic audio production using semantic data
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
WO2015041478A1 (ko) * 2013-09-17 2015-03-26 주식회사 윌러스표준기술연구소 멀티미디어 신호 처리 방법 및 장치
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
CN108449704B (zh) 2013-10-22 2021-01-01 韩国电子通信研究院 生成用于音频信号的滤波器的方法及其参数化装置
CN104681034A (zh) * 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
WO2015079946A1 (ja) * 2013-11-29 2015-06-04 ソニー株式会社 周波数帯域拡大装置および方法、並びにプログラム
JP6151866B2 (ja) 2013-12-23 2017-06-21 ウィルス インスティテュート オブ スタンダーズ アンド テクノロジー インコーポレイティド オーディオ信号のフィルタ生成方法およびそのためのパラメータ化装置
RU2764260C2 (ru) 2013-12-27 2022-01-14 Сони Корпорейшн Устройство и способ декодирования
KR102149216B1 (ko) 2014-03-19 2020-08-28 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
WO2015152665A1 (ko) 2014-04-02 2015-10-08 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
EP2963646A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
KR101523559B1 (ko) * 2014-11-24 2015-05-28 가락전자 주식회사 토폴로지를 이용한 오디오 스트림 형성 장치 및 방법
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI856342B (zh) 2015-03-13 2024-09-21 瑞典商杜比國際公司 音訊處理單元、用於將經編碼的音訊位元流解碼之方法以及非暫態電腦可讀媒體
TWI693595B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10129659B2 (en) 2015-05-08 2018-11-13 Doly International AB Dialog enhancement complemented with frequency transposition
KR101661713B1 (ko) * 2015-05-28 2016-10-04 제주대학교 산학협력단 파라메트릭 어레이 응용을 위한 변조 방법 및 장치
US9514766B1 (en) * 2015-07-08 2016-12-06 Continental Automotive Systems, Inc. Computationally efficient data rate mismatch compensation for telephony clocks
KR20240149977A (ko) * 2015-08-25 2024-10-15 돌비 레버러토리즈 라이쎈싱 코오포레이션 오디오 디코더 및 디코딩 방법
JP6564135B2 (ja) * 2015-09-22 2019-08-21 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. オーディオ信号処理
WO2017053447A1 (en) 2015-09-25 2017-03-30 Dolby Laboratories Licensing Corporation Processing high-definition audio data
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10157621B2 (en) * 2016-03-18 2018-12-18 Qualcomm Incorporated Audio signal decoding
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10848363B2 (en) * 2017-11-09 2020-11-24 Qualcomm Incorporated Frequency division multiplexing for mixed numerology
BR112020012654A2 (pt) * 2017-12-19 2020-12-01 Dolby International Ab métodos, aparelhos e sistemas para aprimoramentos de decodificação e codificação de fala e áudio unificados com transpositor de harmônico com base em qmf
TWI834582B (zh) 2018-01-26 2024-03-01 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
US11771779B2 (en) 2018-01-26 2023-10-03 Hadasit Medical Research Services & Development Limited Non-metallic magnetic resonance contrast agent
IL313348B1 (en) 2018-04-25 2025-04-01 Dolby Int Ab Combining high-frequency reconstruction techniques with reduced post-processing delay
CN118782079A (zh) * 2018-04-25 2024-10-15 杜比国际公司 高频音频重建技术的集成
WO2021154211A1 (en) * 2020-01-28 2021-08-05 Hewlett-Packard Development Company, L.P. Multi-channel decomposition and harmonic synthesis
CN111768793B (zh) * 2020-07-11 2023-09-01 北京百瑞互联技术有限公司 一种lc3音频编码器编码优化方法、系统、存储介质
TWI834408B (zh) * 2022-12-02 2024-03-01 元智大學 兩階濾波器

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55107313A (en) 1979-02-08 1980-08-18 Pioneer Electronic Corp Adjuster for audio quality
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US6766300B1 (en) 1996-11-07 2004-07-20 Creative Technology Ltd. Method and apparatus for transient detection and non-distortion time scaling
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
CA2443837C (en) 2001-04-13 2012-06-19 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
MXPA03002115A (es) 2001-07-13 2003-08-26 Matsushita Electric Ind Co Ltd DISPOSITIVO DE DECODIFICACION Y CODIFICACION DE SEnAL DE AUDIO.
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4313993B2 (ja) 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP4227772B2 (ja) 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US7372907B2 (en) * 2003-06-09 2008-05-13 Northrop Grumman Corporation Efficient and flexible oversampled filterbank with near perfect reconstruction constraint
US20050018796A1 (en) * 2003-07-07 2005-01-27 Sande Ravindra Kumar Method of combining an analysis filter bank following a synthesis filter bank and structure therefor
US7337108B2 (en) 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
JP4822843B2 (ja) * 2003-10-23 2011-11-24 パナソニック株式会社 スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
JP4254479B2 (ja) 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
BRPI0517234B1 (pt) 2004-11-02 2019-07-02 Dolby International Ab Decodificador para gerar um sinal de áudio, codificador para codificar um sinal de áudio, métodos para gerar e para codificar um sinal de áudio, receptor para receber um sinal de áudio, transmissor e sistema de transmissão para transmitir um sinal de áudio, métodos para receber, transmitir, e transmitir e receber um sinal de áudio, meio de armazenamento legível por computador, equipamento reprodutor de áudio, e, equipamento gravador de áudio
CN1668058B (zh) * 2005-02-21 2011-06-15 南望信息产业集团有限公司 基于递归最小平方差的子带回声抵消器
DE602006004959D1 (de) 2005-04-15 2009-03-12 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
JP2007017628A (ja) 2005-07-06 2007-01-25 Matsushita Electric Ind Co Ltd 復号化装置
US7565289B2 (en) 2005-09-30 2009-07-21 Apple Inc. Echo avoidance in audio time stretching
JP4760278B2 (ja) 2005-10-04 2011-08-31 株式会社ケンウッド 補間装置、オーディオ再生装置、補間方法および補間プログラム
JP4869352B2 (ja) 2005-12-13 2012-02-08 エヌエックスピー ビー ヴィ 音声データストリームを処理する装置および方法
US7676374B2 (en) * 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
FR2910743B1 (fr) * 2006-12-22 2009-02-20 Thales Sa Banque de filtres numeriques cascadable, et circuit de reception comportant une telle banque de filtre en cascade.
US9275648B2 (en) * 2007-12-18 2016-03-01 Lg Electronics Inc. Method and apparatus for processing audio signal using spectral data of audio signal
CN101471072B (zh) * 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
CN102789785B (zh) 2008-03-10 2016-08-17 弗劳恩霍夫应用研究促进协会 操纵具有瞬变事件的音频信号的方法和设备
US9147902B2 (en) 2008-07-04 2015-09-29 Guangdong Institute of Eco-Environmental and Soil Sciences Microbial fuel cell stack
RU2512090C2 (ru) * 2008-07-11 2014-04-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ генерирования сигнала с расширенной полосой пропускания
ES2539304T3 (es) 2008-07-11 2015-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Un aparato y un método para generar datos de salida por ampliación de ancho de banda
ES2372014T3 (es) 2008-07-11 2012-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral.
WO2010036061A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
WO2010036062A2 (en) 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP4231290B1 (en) * 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder, corresponding method and computer program
ES2639716T3 (es) 2009-01-28 2017-10-30 Dolby International Ab Transposición armónica mejorada
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
EP4451267B1 (en) * 2009-10-21 2025-04-23 Dolby International AB Oversampling in a combined transposer filter bank
US8321216B2 (en) 2010-02-23 2012-11-27 Broadcom Corporation Time-warping of audio signals for packet loss concealment avoiding audible artifacts
KR101414736B1 (ko) * 2010-03-09 2014-08-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 캐스케이드 필터뱅크들을 이용한 입력 오디오 신호를 처리하는 장치 및 방법
PL2545551T3 (pl) 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio

Also Published As

Publication number Publication date
HK1181180A1 (en) 2013-11-01
BR112012022740B1 (pt) 2021-12-21
CA2792452A1 (en) 2011-09-15
US20180366130A1 (en) 2018-12-20
TWI444991B (zh) 2014-07-11
TWI446337B (zh) 2014-07-21
US20240135939A1 (en) 2024-04-25
AU2011226212B2 (en) 2014-03-27
MY154204A (en) 2015-05-15
WO2011110499A1 (en) 2011-09-15
BR122021019082B1 (pt) 2022-07-26
RU2586846C2 (ru) 2016-06-10
US9305557B2 (en) 2016-04-05
AU2011226212A1 (en) 2012-10-18
EP3570278B1 (en) 2022-10-26
CA2792450A1 (en) 2011-09-15
EP2545548A1 (en) 2013-01-16
EP4475124A3 (en) 2025-01-15
EP4475124A2 (en) 2024-12-11
US20230074883A1 (en) 2023-03-09
RU2012142732A (ru) 2014-05-27
MX2012010415A (es) 2012-10-03
BR122021014305B1 (pt) 2022-07-05
EP2545553A1 (en) 2013-01-16
JP2013525824A (ja) 2013-06-20
PL3570278T3 (pl) 2023-03-20
KR20120139784A (ko) 2012-12-27
AU2011226211B2 (en) 2014-01-09
JP2013521538A (ja) 2013-06-10
US9792915B2 (en) 2017-10-17
EP4148729B1 (en) 2025-01-22
CA2792452C (en) 2018-01-16
HUE070311T2 (hu) 2025-05-28
AU2011226211A1 (en) 2012-10-18
US20170194011A1 (en) 2017-07-06
US12308036B2 (en) 2025-05-20
BR112012022740A2 (pt) 2020-10-13
AR080477A1 (es) 2012-04-11
PL2545553T3 (pl) 2015-01-30
CN102939628B (zh) 2015-05-13
PL4148729T3 (pl) 2025-05-26
TW201207841A (en) 2012-02-16
EP4148729A1 (en) 2023-03-15
SG183967A1 (en) 2012-10-30
JP5523589B2 (ja) 2014-06-18
KR101425154B1 (ko) 2014-08-13
ES2935637T3 (es) 2023-03-08
US20200279571A1 (en) 2020-09-03
ES3010370T3 (en) 2025-04-02
ES2522171T3 (es) 2014-11-13
AR080476A1 (es) 2012-04-11
JP5588025B2 (ja) 2014-09-10
US11894002B2 (en) 2024-02-06
CN102939628A (zh) 2013-02-20
EP2545553B1 (en) 2014-07-30
US20130090933A1 (en) 2013-04-11
KR101414736B1 (ko) 2014-08-06
EP3570278A1 (en) 2019-11-20
KR20120131206A (ko) 2012-12-04
US20130051571A1 (en) 2013-02-28
CN103038819B (zh) 2015-02-18
CA2792450C (en) 2016-05-31
TW201207842A (en) 2012-02-16
BR122021014312B1 (pt) 2022-08-16
EP4148729C0 (en) 2025-01-22
WO2011110500A1 (en) 2011-09-15
US11495236B2 (en) 2022-11-08
US10770079B2 (en) 2020-09-08
BR112012022574B1 (pt) 2022-05-17
US10032458B2 (en) 2018-07-24
CN103038819A (zh) 2013-04-10
BR112012022574A2 (pt) 2021-09-21

Similar Documents

Publication Publication Date Title
US12308036B2 (en) Apparatus and method for processing an input audio signal using cascaded filterbanks
HK40084150A (en) Apparatus for downsampling an audio signal
HK40084150B (en) Apparatus for downsampling an audio signal
HK40011519A (en) High frequency reconstruction of an input audio signal using cascaded filterbanks
HK40011519B (en) High frequency reconstruction of an input audio signal using cascaded filterbanks
HK1181180B (en) Apparatus and method for processing an audio signal using patch border alignment
BR122021019078B1 (pt) Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata

Legal Events

Date Code Title Description
FG Grant or registration