[go: up one dir, main page]

ES2638498T3 - Aparato y procedimiento para decodificar una señal de audio codificada mediante un filtro de cruce en torno a una frecuencia de transición - Google Patents

Aparato y procedimiento para decodificar una señal de audio codificada mediante un filtro de cruce en torno a una frecuencia de transición Download PDF

Info

Publication number
ES2638498T3
ES2638498T3 ES14741264.7T ES14741264T ES2638498T3 ES 2638498 T3 ES2638498 T3 ES 2638498T3 ES 14741264 T ES14741264 T ES 14741264T ES 2638498 T3 ES2638498 T3 ES 2638498T3
Authority
ES
Spain
Prior art keywords
frequency
spectral
signal
crossover
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14741264.7T
Other languages
English (en)
Inventor
Sascha Disch
Ralf Geiger
Christian Helmrich
Frederik Nagel
Christian Neukam
Konstantin Schmidt
Michael Fischer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2638498T3 publication Critical patent/ES2638498T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

Aparato para decodificar una señal de audio codificada que comprende una señal central codificada (1), que comprende: un decodificador central (1400) configurado para decodificar la señal central codificada (1401) para obtener una señal central decodificada; 0 de un rango de cruce que se extiende a lo largo de al menos tres valores de frecuencia o para llevar a cabo una adición ponderada por frecuencia (1424) de al menos una parte de un primer recuadro de frecuencia filtrado mediante el subfiltro de disminución progresiva de volumen (1420) y al menos una parte de un segundo recuadro de frecuencia filtrada mediante el subfiltro de aumento progresivo de volumen (1422) dentro de un rango de cruce que se extiende a lo largo de al menos tres valores de frecuencia.

Description

DESCRIPCION
Aparato y procedimiento para decodificar una senal de audio codificada mediante un filtro de cruce en torno a una frecuencia de transicion.
CAMPO TECNICO
[0001] La presente invencion se refiere a la codificacion/decodificacion de audio y, en especial, a la codificacion de audio mediante el relleno inteligente de espacios (IGF, por sus siglas en ingles).
10
[0002] La codificacion de audio es el campo de la compresion de senales que se ocupa de explotar la redundancia y la irrelevancia en senales de audio utilizando conocimientos de psicoacustica. En la actualidad, los codecs suelen necesitar aproximadamente 60 kbps/canal para llevar a cabo una codificacion perceptualmente transparente de casi cualquier tipo de senal de audio. Los codecs mas recientes tienen como objetivo reducir la tasa
15 de bits de la codificacion explotando las semejanzas espectrales en la senal mediante tecnicas como la ampliacion del ancho de banda (BWE, por sus siglas en ingles). Un esquema de BWE utiliza un conjunto de parametros de baja tasa de bits para representar los componentes de alta frecuencia (HF, por sus siglas en ingles) de una senal de audio. El espectro de HF se rellena con contenido espectral de las zonas de baja frecuencia (LF, por sus siglas en ingles) y la forma espectral, inclinacion y continuidad temporal se ajustan para mantener el timbre y el color de la 20 senal original. Dichos procedimientos de BWE permiten que los codecs de audio mantengan una alta calidad incluso a bajas tasas de bits de aproximadamente 24 kbps/canal.
[0003] El sistema de codificacion de audio de la invencion codifica de forma eficiente senales de audio
arbitrarias a una amplia variedad de tasas de bits. Mientras que, para altas tasas de bits, el sistema de la invencion
25 converge hacia la transparencia, para bajas tasas de bits se minimiza la molestia perceptual. Por lo tanto, la parte principal de la tasa de bits disponible se utiliza para codificar como forma de onda tan solo la estructura de mayor relevancia perceptiva de la senal en el codificador, y los espacios espectrales resultantes se rellenan en el decodificador con un contenido de senal que se aproxima mas o menos al espectro original. Se consume un volumen de bits muy limitado para controlar el denominado relleno inteligente de espacios (IGF, por sus siglas en 30 ingles) espectral basado en parametros mediante informacion secundaria especlfica transmitida del codificador al decodificador.
[0004] El almacenamiento o la transmision de senales de audio a menudo estan sometidos a estrictas
restricciones en lo que referente a la tasa de bits. Antes, los codificadores se velan obligados a reducir
35 drasticamente el ancho de banda transmitido cuando solo estaba disponible una tasa de bits muy baja.
[0005] En la actualidad, los codecs de audio modernos son capaces de codificar senales de banda ancha mediante procedimientos de ampliacion del ancho de banda (BWE) [1]. Estos algoritmos recurren a una representacion parametrica del contenido de alta frecuencia (HF), que se genera a partir de la parte de baja
40 frecuencia (LF) codificada como forma de onda de la senal decodificada por medio de la transposicion en la zona espectral de HF (“interconexion”) y la aplicacion de un posprocesamiento basado en parametros. En esquemas de BWE, a menudo la reconstruccion de la zona espectral de HF por encima de una frecuencia dada denominada frecuencia de cruce se basa en la interconexion espectral. Normalmente, la zona de HF esta compuesta por multiples interconexiones adyacentes y cada una de estas interconexiones procede de zonas de paso de banda (Bp, 45 por sus siglas en ingles) del espectro de LF por debajo de la frecuencia de cruce dada. Los sistemas del estado de la tecnica llevan a cabo la interconexion de manera eficiente dentro de una representacion de banco de filtros, por ejemplo, banco de filtros espejo de cuadratura (QMF, por sus siglas en ingles), copiando un conjunto de coeficientes de subbanda contiguos desde un origen hasta la zona de destino.
50 [0006] Otra tecnica empleada en los actuales codecs de audio que incrementa la eficiencia de la compresion
y, por tanto, permite la ampliacion del ancho de banda de audio a bajas tasas de bits es la sustitucion sintetica basada en parametros de partes adecuadas de los espectros de audio. Por ejemplo, las porciones de la senal de tipo ruido de la senal de audio original se pueden sustituir por ruido artificial generado en el decodificador, sin que se produzca una perdida considerable de la calidad subjetiva, y se puede ajustar la escala mediante los parametros de 55 la informacion secundaria. Un ejemplo de ello es la herramienta de sustitucion de ruido perceptual (PNS, por sus siglas en ingles) contenida en la codificacion avanzada de audio (AAC, por sus siglas en ingles) MPEG-4 [5].
[0007] Otro recurso que tambien permite la ampliacion del ancho de banda a bajas tasas de bits es la tecnica
de relleno de ruido incluida en la codificacion unificada de voz y audio (USAC, por sus siglas en ingles) de MPEG-D
[7]. Los espacios espectrales (ceros) inferidos por la zona muerta del cuantificador debidos a una cuantificacion demasiado gruesa se rellenan posteriormente con ruido artificial en el decodificador y se ajusta la escala mediante un posprocesamiento basado en parametros.
5 [0008] Otro sistema del estado de la tecnica se denomina sustitucion espectral precisa (ASR, por sus siglas
en ingles) [2-4]. Ademas de un codec de forma de onda, la ASR emplea una etapa especlfica de slntesis de senal que restituye porciones sinusoidales perceptualmente importantes de la senal en el decodificador. Ademas, un sistema descrito en [5] recurre al modelado sinusoidal en la zona de HF de un codificador de forma de onda para permitir la ampliacion del ancho de banda de audio con una calidad perceptual aceptable a bajas tasas de bits. 10 Todos estos procedimientos conllevan la transformacion de los datos en un segundo dominio aparte de la transformada de coseno discreta modificada (MDCT, por sus siglas en ingles), ademas de etapas de analisis/slntesis bastante complejas para la conservation de los componentes sinusoidales de HF.
[0009] Otro sistema del estado de la tecnica se denomina reconstruction de alta frecuencia y sus principios 15 se describen en el documento WO 2010/136459 A1.
[0010] La fig. 13 ilustra un diagrama esquematico de un codificador de audio para una tecnologla de ampliacion de ancho de banda como la utilizada, por ejemplo, en la codification avanzada de audio de alta eficiencia (HE-AAC, por sus siglas en ingles). Una senal de audio en la llnea 1300 se introduce en un sistema de filtros que
20 comprende un paso bajo 1302 y un paso alto 1304. La senal de salida del filtro de paso alto 1304 se introduce en un codificador/extractor de parametros 1306. El codificador/extractor de parametros 1306 esta configurado para calcular y codificar parametros tales como un parametro de envolvente espectral, un parametro de adicion de ruido, un parametro de armonicos faltantes o un parametro de filtrado inverso, por ejemplo. Estos parametros extraldos se introducen en un multiplexor de corrientes de bits 1308. La senal de salida de paso bajo se introduce en un 25 procesador que normalmente comprende la funcionalidad de un muestreador descendente 1310 y un codificador central 1312. El paso bajo 1302 limita el ancho de banda que se va a codificar a un ancho de banda considerablemente mas pequeno que el de la senal de audio de entrada original 1300. Esto proporciona una considerable ganancia de codificacion debido al hecho de que la totalidad de las funcionalidades que se dan en el codificador central solo tienen que actuar sobre una senal con un ancho de banda reducido. Cuando, por ejemplo, el 30 ancho de banda de la senal de audio en la llnea 1300 es de 20 kHz y cuando el filtro de paso bajo 1302 posee, ejemplarmente, un ancho de banda de 4 kHz, para cumplir el teorema del muestreo, teoricamente es suficiente con que la senal posterior al muestreador descendente tenga una frecuencia de muestreo de 8 kHz, lo que constituye una reduction considerable en la tasa de muestreo requerida para la senal de audio 1300, que debe ser de al menos 40 kHz.
35
[0011] La fig. 13b ilustra un diagrama esquematico de un correspondiente decodificador de ampliacion de ancho de banda. El decodificador comprende un multiplexor de corrientes de bits 1320. El demultiplexor de corrientes de bits 1320 extrae una senal de entrada para un decodificador central 1322 y una senal de entrada para un decodificador de parametros 1324. Una senal de salida del decodificador central posee, en el anterior ejemplo,
40 una tasa de muestreo de 8 kHz y, por lo tanto, un ancho de banda de 4 kHz, mientras que, para una reconstruccion completa del ancho de banda, la senal de salida de un reconstructor de alta frecuencia 1330 debe estar a 20 kHz, lo que requiere una tasa de muestreo de al menos 40 kHz. Para que esto sea posible, se necesita un procesador de decodificador con la funcionalidad de un muestreador ascendente 1325 y un banco de filtros 1326. El reconstructor de alta frecuencia 1330 recibe entonces la senal de salida de baja frecuencia analizada en frecuencia producida por 45 el banco de filtros 1326 y reconstruye el rango de frecuencias definido por el filtro de paso alto 1304 de la fig. 13a mediante la representation parametrica de la banda de alta frecuencia. El reconstructor de alta frecuencia 1330 posee varias funcionalidades, tales como la regeneration del rango de frecuencia superior mediante la utilization del rango de origen en el rango de baja frecuencia, un ajuste de envolvente espectral, una funcionalidad de adicion de ruido y una funcionalidad para introducir armonicos faltantes en el rango de frecuencia superior y, si se aplica y 50 calcula en el codificador de la fig. 13a, una operation de filtrado inverso para tener en cuenta el hecho de que normalmente el rango de frecuencia superior no es tan tonal como el rango de frecuencia inferior. En la HE-AAC, los armonicos faltantes se resintetizan en el lado del decodificador y se colocan exactamente en el medio de una banda de reconstruccion. Por lo tanto, ninguna de las llneas armonicas faltantes que se han determinado en una cierta banda de reconstruccion se coloca en los valores de frecuencia en los que se situaba en la senal original. Esas 55 llneas armonicas faltantes se colocan, en cambio, en frecuencias situadas en el centro de dicha cierta banda. De este modo, cuando una llnea armonica faltante de la senal original se coloca muy cerca del llmite de la banda de reconstruccion en la senal original, el error en la frecuencia introducido al colocar esta llnea de armonicos faltantes en el centro de la banda en la senal reconstruida es de cerca del 50% de la banda de reconstruccion individual, para la que se han generado y transmitido parametros.
[0012] Ademas, aunque los tlpicos codificadores centrales de audio actuan en el dominio espectral, el decodificador central genera una senal de dominio temporal que, de nuevo, se convierte despues en un dominio espectral mediante la funcionalidad del banco de filtros 1326. Esto introduce retardos de procesamiento adicionales,
5 puede introducir fallas debido al procesamiento en tandem consistente en transformar en primer lugar el dominio espectral en dominio de frecuencia y transformar de nuevo, normalmente, en un dominio de frecuencia diferente y, por supuesto, tambien requiere un grado considerable de complejidad computacional y, por tanto, energla electrica, lo cual supone un problema especlfico cuando se aplica la tecnologla de ampliacion de ancho de banda en dispositivos portatiles tales como telefonos moviles, tabletas, ordenadores portatiles, etc.
10
[0013] Los actuales codecs de audio llevan a cabo una codificacion de audio a baja tasa de bits utilizando la BWE como parte integral del esquema de codificacion. No obstante, las tecnicas de BWE tienen la limitacion de sustituir unicamente contenidos de alta frecuencia (HF). Ademas, no permiten codificar como forma de onda contenidos perceptualmente importantes por encima de una frecuencia de cruce dada. Por lo tanto, los actuales
15 codecs de audio pierden o bien detalle o bien timbre en HF cuando se implementa la BWE, ya que en la mayorla de sistemas no se tiene en cuenta la alineacion exacta de los armonicos tonales de la senal.
[0014] Otro inconveniente de los actuales sistemas BWE del estado de la tecnica es la necesidad de transformar la senal de audio en un nuevo dominio para la implementation de la BWE (por ejemplo, transformar un
20 dominio MDCT en QMF). Esta necesidad da lugar a complicaciones en la sincronizacion, una complejidad computacional anadida y mayores requisitos de memoria.
[0015] El almacenamiento o la transmision de senales de audio a menudo se ven sometidos a estrictas
restricciones en lo que respecta a la tasa de bits. Anteriormente, los codificadores se velan obligados a reducir de
25 manera drastica el ancho de banda de audio transmitido cuando solo estaba disponible una tasa de bits muy baja. En la actualidad, los modernos codecs de audio son capaces de codificar senales de banda ancha mediante procedimientos de ampliacion de ancho de banda (BWE) [1-2]. Estos algoritmos recurren a una representation parametrica del contenido de alta frecuencia (HF), que se genera a partir de la parte de baja frecuencia (LF) codificada como forma de onda de la senal decodificada por medio de la transposition en la zona espectral de HF 30 (“Interconexion”) y la aplicacion de un posprocesamiento basado en parametros.
[0016] En esquemas BWE, la reconstruction de la zona espectral de HF por encima de una, as! denominada, frecuencia de cruce dada se basa a menudo en la interconexion espectral. Otros esquemas que poseen la funcionalidad para rellenar espacios espectrales, por ejemplo, el rellenado inteligente de espacios (IGF), utilizan
35 unos, as! denominados, recuadros espectrales contiguos para regenerar partes de los espectros de HF de una senal de audio. Normalmente, la zona de hF esta compuesta por multiples interconexiones o recuadros adyacentes y cada una de estas interconexiones o recuadros se obtiene a partir de zonas de paso de banda (BP) del espectro de LF por debajo de la frecuencia de cruce dada. Los sistemas del estado de la tecnica llevan a cabo de manera eficiente la interconexion o formation de recuadros dentro de una representacion de banco de filtros copiando un conjunto de 40 coeficientes de subbanda adyacentes desde un origen a la zona de destino. Si bien, para algunos contenidos de la senal, el ensamblado de la senal reconstruida a partir de la banda de LF e interconexiones adyacentes dentro de la banda de HF puede producir batimiento, disonancia y aspereza auditiva.
[0017] Por lo tanto, en [19], el concepto de filtrado en banda de guarda de la disonancia se presenta en el 45 contexto de un sistema BWE basado en un banco de filtros. Se sugiere aplicar de manera eficaz un filtro de muesca
con un ancho de banda de aproximadamente 1 bark en la frecuencia de cruce entre LF y HF regenerada mediante BWE para evitar la posibilidad de disonancia y sustituir el contenido espectral por ceros o ruido.
[0018] Sin embargo, la solution propuesta en [19] presenta algunos inconvenientes: en primer lugar, la 50 sustitucion estricta de contenido espectral por ceros o ruido tambien puede afectar a la calidad perceptual de la
senal. Ademas, el procesamiento propuesto no es adaptable a la senal y, por tanto, en algunos casos, puede deteriorar la calidad perceptual. Por ejemplo, si la senal contiene transitorios, pueden producirse preecos y posecos.
[0019] En segundo lugar, las disonancias tambien pueden producirse en transiciones entre interconexiones 55 de hF consecutivas. La solucion propuesta en [19] solo resulta funcional para remediar las disonancias que se
producen en la frecuencia de cruce entre LF y HF regenerada por BWE.
[0020] Por ultimo, al contrario que los sistemas basados en bancos de filtros como el propuesto en [19], los sistemas BWE tambien se pueden llevar a la practica en implementaciones basadas en transformadas, como, por
ejemplo, la transformada de coseno discreta modificada (MDCT). Las transformadas de tipo MDCT son muy propensas a sufrir las denominadas fallas de zumbido o trino [20] que se producen si se copian zonas de paso de banda de coeficientes espectrales o si los coeficientes espectrales se fijan en cero, tal como se propone en [19].
5 [0021] En particular, la patente de EE. UU. 8,412,365 describe el uso, en una traslacion o plegado basados
en banco de filtros, de las denominadas bandas de guarda que se insertan y estan hechas de uno o varios canales de subbanda fijados en cero. Se utilizan varios canales del banco de filtros como bandas de guarda, y un ancho de banda de una banda de guarda deberla ser de 0,5 barks. Esas bandas de guarda de disonancia se reconstruyen parcialmente mediante senales de ruido blanco aleatorio, es decir, se suministra ruido blanco a las subbandas en
10 lugar de que estas sean cero. Las bandas de guarda se insertan independientemente de la senal actual que se vaya a procesar.
[0022] Los sistemas de ampliation de ancho de banda resultan particularmente problematicos cuando se llevan a la practica en implementaciones basadas en transformadas como, por ejemplo, la transformada de coseno
15 discreta modificada (MDCT). Las transformadas de tipo MDCT, as! como otras transformadas, son muy propensas a sufrir el denominado trino que se explica en [3] y a fallas de zumbido que se producen si se copian las zonas de paso de banda de coeficientes espectrales o si los coeficientes espectrales se fijan en cero como se propone en [2].
[0023] El objeto de la presente invention consiste en proporcionar un aparato y un procedimiento mejorados
20 para decodificar una senal de audio codificada.
[0024] Este objeto se logra mediante un aparato para decodificar una senal de audio codificada de la reivindicacion 1, un procedimiento de decodificacion de una senal de audio codificada de la reivindicacion 14 o un programa informatico de acuerdo con la reivindicacion 15. De acuerdo con la presente invencion, un aparato para
25 decodificar una senal de audio codificada comprende un decodificador central, un generador de recuadros para generar uno o mas recuadros espectrales con frecuencias no incluidas en la senal central decodificada, a partir de una portion espectral de la senal central decodificada y un filtro de cruce para llevar a cabo el filtrado de cruce espectral de la senal central decodificada y un recuadro de una primera frecuencia con frecuencias que se ampllan desde una frecuencia de relleno de espacios hasta una primera frecuencia de fin de recuadro o para el filtrado de
30 cruce espectral de un recuadro y otro recuadro de frecuencia, teniendo este otro recuadro de frecuencia una frecuencia de llmite inferior adyacente en frecuencia a una frecuencia de llmite superior del recuadro de frecuencia.
[0025] Preferentemente, este procedimiento esta destinado a su aplicacion dentro de una ampliacion de ancho de banda basada en una transformada como la MDCT. No obstante, la presente invencion se puede aplicar
35 de forma general y, especialmente en una situation de ampliacion de ancho de banda en la que se recurre a un banco de filtros espejo de cuadratura (QMF), especialmente si el sistema se muestrea crlticamente, por ejemplo cuando hay una representation de QMF con valores reales como conversion de tiempo en frecuencia o como conversion de frecuencia en tiempo.
40 [0026] La presente invencion resulta especialmente util para senales de tipo transitorio, ya que para dichas
senales de tipo transitorio, el zumbido constituye una falla audible y molesta. Las fallas de zumbido de filtro son provocadas por la denominada caracterlstica de “pared de ladrillo” (brick-wall) de un filtro en la banda de transition, es decir, una transicion brusca desde un banda de paso hasta una banda de fin a una frecuencia de corte. Dichos filtros se pueden implementar de manera eficiente fijando un coeficiente o grupo de coeficientes en cero en un
45 dominio de frecuencia de una transformada de tiempo/frecuencia. Por lo tanto, la presente invencion recurre a un filtro de cruce en cada frecuencia de transicion entre interconexiones/recuadros o entre una banda central y una primera interconexion/recuadro para reducir esta falla de zumbido. El filtro de cruce se implementa preferentemente mediante la ponderacion espectral en el dominio de la transformada empleando funciones de ganancia adecuadas.
50 [0027] Preferentemente, el filtro de cruce es adaptable a la senal y consiste en dos filtros: un filtro de
disminucion progresiva del volumen, que se aplica a la zona espectral inferior, y un filtro de aumento progresivo del volumen, que se aplica a la zona espectral superior. Los filtros pueden ser simetricos o asimetricos, segun la implementation concreta.
55 [0028] En otra realization, un recuadro de frecuencia o interconexion de frecuencia no solo se ve sometido al
filtrado de cruce, sino que el generador de recuadros lleva a cabo, antes de llevar a cabo el filtrado de cruce, una adaptation de interconexiones que comprende una fijacion de llmites de frecuencia en los mlnimos espectrales locales y una elimination o atenuacion de porciones tonales que permanecen en rangos de transicion en torno a las frecuencias de transicion.
[0029] En esta realizacion, se lleva a cabo un analisis de la senal en el lado del decodificador mediante un analizador, para analizar la senal central decodificada antes o despues de llevar a cabo una operacion de regeneracion de frecuencia para proporcionar un resultado del analisis. Despues, este resultado del analisis es
5 empleado por un regenerador de frecuencia para regenerar porciones espectrales no incluidas en la senal central decodificada.
[0030] De este modo, a diferencia de una configuracion de decodificador fija, en la que la interconexion o formacion de recuadros de frecuencia se llevan a cabo de forma fija, es decir, donde se toma un cierto rango de
10 origen a partir de la senal central y se aplican unos ciertos llmites de frecuencia fijos para fijar la frecuencia entre el rango de origen y el rango de reconstruccion, o el llmite de frecuencia entre dos interconexiones o recuadros de frecuencia adyacentes dentro del rango de reconstruccion, se lleva a cabo una interconexion o formacion de recuadros dependientes de la senal, en las que, por ejemplo, se puede analizar la senal central para encontrar mlnimos locales en la senal central y, despues, se selecciona el rango central de manera que los llmites de 15 frecuencia del rango central coincidan con mlnimos locales en el espectro de la senal central.
[0031] Como otra posibilidad o de forma anadida, se puede llevar a cabo un analisis de senal con una senal regenerada preliminar o senal preliminar con interconexiones de frecuencia o divididas en recuadros, en la que, tras el primer procedimiento de regeneracion preliminar, se analiza el llmite entre el rango central y el rango de
20 reconstruccion con el fin de detectar todas las porciones de la senal que generan fallas, como, por ejemplo, porciones tonales que resultan problematicas debido a que se encuentran lo bastante proximas entre si como para generar una falla de batimiento cuando se estan reconstruyendo. Como otra posibilidad o de forma anadida, tambien se pueden examinar los llmites de manera que se detecte un recorte intermedio de una porcion tonal y este recorte de una porcion tonal tambien generarla una falla cuando se estuviera reconstruyendo tal como es. Para evitar estos 25 procedimientos, el llmite de frecuencia del rango de reconstruccion y/o el rango de origen y/o entre dos recuadros o interconexiones individuales en el rango de reconstruccion se pueden modificar mediante un manipulador de senal con el fin de volver a llevar a cabo una reconstruccion con los llmites recien fijados.
[0032] De forma anadida o como otra posibilidad, la regeneracion de frecuencia es una regeneracion basada 30 en el resultado del analisis, ya que los llmites de frecuencia se dejan tal como estan y se efectua una eliminacion o
al menos una atenuacion de porciones tonales problematicas cerca de los llmites de frecuencia entre el rango de origen y el rango de reconstruccion o entre dos recuadros de frecuencia o interconexiones individuales dentro del rango de reconstruccion. Dichas porciones tonales pueden ser tonos cercanos que darlan lugar a una falla de batimiento o podrlan ser porciones tonales recortadas.
35
[0033] En concreto, cuando se utiliza una transformada sin conservacion de potencia, tal como una MDCT, un tono individual no se corresponde directamente con una llnea espectral individual. En lugar de ello, un tono individual se corresponded con un grupo de llneas espectrales con ciertas amplitudes dependiendo de la fase del tono. Cuando una operacion de interconexion recorta esta porcion tonal, se producira una falla tras la
40 reconstruccion, aunque se aplique una reconstruccion perfecta, como en un reconstructor MDCT. Esto se debe al hecho de que el reconstructor MDCT requerirla el patron tonal completo para un tono con el fin de reconstruir finalmente este tono de manera correcta. Debido al hecho de que antes se ha producido un recorte, esto deja ya de ser posible y, por tanto, se generara una falla de trino variable en el tiempo. Basandose en el analisis de acuerdo con la presente invencion, el regenerador de frecuencia evitara esta situation atenuando la porcion tonal completa 45 que genera una falla o, como se explica anteriormente, cambiando las correspondientes frecuencias llmite o aplicando ambas medidas, o incluso reconstruyendo la porcion recortada basandose en cierto conocimiento previo sobre dichos patrones tonales.
[0034] El enfoque de la invencion esta destinado principalmente para su aplicacion dentro de una BWE 50 basada en una transformada como la MDCT. No obstante, las ensenanzas de la invencion se pueden aplicar en
general, por ejemplo, de forma analoga dentro de un sistema basado en un banco de filtros de espejo de cuadratura (QMF), especialmente si el sistema se muestrea crlticamente, por ejemplo, una representation QMF con valores reales.
55 [0035] A continuation se exponen realizaciones preferidas haciendo referencia a los dibujos adjuntos, en los
que:
la fig. 1a ilustra un aparato para codificar una senal de audio;
la fig. 1 b ilustra un decodificador para decodificar una senal de audio, correspondiente al codificador de la fig. 1 a;
la fig. 2a ilustra una implementacion preferida del decodificador; la fig. 2b ilustra una implementacion preferida del codificador;
la fig.3a ilustra una representacion esquematica de un espectro generado por el decodificador de dominio espectral de la fig. 1b;
5 la fig.3b ilustra una tabla que indica la relacion entre factores de ajuste de escala para bandas de factor de escala y potencias para bandas de reconstruccion e informacion de relleno de ruido para una banda de relleno de ruido; la fig. 4a ilustra la funcionalidad del codificador de dominio espectral para aplicar la selection de porciones espectrales en el primer y el segundo conjunto de porciones espectrales; la fig. 4b ilustra una implementacion de la funcionalidad de la fig. 4a;
10 la fig. 5a ilustra una funcionalidad de un codificador MDCT;
la fig. 5b ilustra una funcionalidad del decodificador con una tecnologla MDCT; la fig. 5c ilustra una implementacion del regenerador de frecuencia;
la fig. 6a es un aparato para decodificar una senal de audio codificada de acuerdo con una implementacion; la fig. 6b ilustra otra realization de un aparato para decodificar una senal de audio codificada;
15 la fig. 7a ilustra una implementacion preferida del regenerador de frecuencia de la fig. 6a o 6b;
la fig. 7b ilustra otra implementacion de una cooperation entre el analizador y el regenerador de frecuencia; la fig. 8a ilustra otra implementacion del regenerador de frecuencia; la fig. 8b ilustra otra realizacion de la invention;
la fig. 9a ilustra un decodificador con tecnologla de regeneration de frecuencia que utiliza valores de potencia para 20 el rango de frecuencia de regeneracion;
la fig. 9b ilustra una implementacion mas detallada del regenerador de frecuencia de la fig. 9a; la fig. 9c ilustra un esquema que ilustra la funcionalidad de la fig. 9b; la fig. 9d ilustra otra implementacion del decodificador de la fig. 9a;

la fig. 10a ilustra un diagrama de bloques de un codificador que se corresponde con el decodificador de la fig. 9a;
25 la fig. 10b ilustra un diagrama de bloques para ilustrar otra funcionalidad de la calculadora de parametros de la fig.
10a;

la fig. 10c ilustra un diagrama de bloques que ilustra otra funcionalidad de la calculadora parametrica de la fig. 10a;

la fig. 10d ilustra un diagrama de bloques que ilustra otra funcionalidad de la calculadora parametrica de la fig. 10a;
la fig. 11a ilustra un espectro de un zumbido de filtro que rodea un transitorio;
30 la fig. 11b ilustra un espectrograma de un transitorio tras aplicar la ampliation de ancho de banda;
la fig. 11c ilustra un espectrograma de un transitorio tras aplicar una ampliacion de ancho de banda con reduction de
zumbido de filtro;
la fig. 12a ilustra un diagrama de bloques de un aparato para decodificar una senal de audio codificada; la fig. 12b ilustra unos espectros de magnitud (estilizados) de una senal tonal, una copia sin adaptation de 35 interconexion/recuadro; una copia con llmites de frecuencia cambiados y una elimination adicional de porciones tonales que generan fallas;
la fig. 12c ilustra un ejemplo de funcion de atenuacion cruzada;
la fig. 13a ilustra un codificador de la tecnica anterior con ampliacion de ancho de banda; y la fig. 13b ilustra un decodificador de la tecnica anterior con ampliacion de ancho de banda;
40 La fig. 14a ilustra otro aparato para decodificar una senal de audio codificada mediante un filtro de cruce; la fig. 14b ilustra una ilustracion mas detallada de un filtro de cruce ejemplar.
[0036] En la fig. 6a se ilustra un aparato para decodificar una senal de audio codificada que comprende una
senal central codificada y unos datos parametricos. El aparato comprende un decodificador central 600 para 45 decodificar la senal central codificada con el fin de obtener una senal central decodificada, un analizador 602 para analizar la senal central decodificada antes o despues de llevar a cabo una operation de regeneracion de frecuencia. El analizador 602 esta configurado para proporcionar un resultado de analisis 603. El regenerador de frecuencia 604 esta configurado para regenerar porciones espectrales no incluidas en la senal central decodificada a partir de una portion espectral de la senal central decodificada, datos de envolvente 605 para las porciones
50 espectrales faltantes y el resultado del analisis 603. De este modo, a diferencia de las antiguas implementaciones, la
regeneracion de frecuencia en el lado del decodificador no se lleva a cabo independientemente de la senal, sino que se lleva a cabo dependiendo de la senal. Esto ofrece la ventaja de que, cuando no existe ningun problema, la regeneracion de frecuencia se lleva a cabo tal cual, pero cuando existen porciones de senal problematicas, se detectan mediante el resultado del analisis 603 y entonces el regenerador de frecuencia 604 lleva a cabo una forma 55 adaptada de regeneracion de frecuencia que, por ejemplo, puede consistir en el cambio de un llmite de frecuencia
inicial entre la zona central y la banda de reconstruccion o el cambio de un llmite de frecuencia entre dos
recuadros/interconexiones individuales dentro de la banda de reconstruccion. Al contrario que la implementacion de las bandas de guarda, esta ofrece la ventaja de que los procedimientos concretos solo se llevan a cabo cuando es necesario y no, tal como sucede en la implementacion de la banda de guarda, durante todo el tiempo sin depender
en modo alguno de la senal.
[0037] Preferentemente, el decodificador central 600 se implementa como una etapa de decodificacion y decuantificacion por entropia 612 (por ejemplo, un decodificador de tipo Huffman o aritmetico), tal como se ilustra en
5 la fig. 6b. El decodificador central 600 genera como salida un espectro de senal central y el espectro se analiza mediante el analizador espectral 614, que es bastante similar al analizador 602 de la fig. 6a implementado como un analizador espectral en lugar de como un analizador arbitrario cualquiera que podria, tal como se ilustra en la fig. 6a, analizar tambien una senal en dominio temporal. En la realizacion de la fig. 6b, el analizador espectral esta configurado para analizar la senal espectral de manera que se determinen los minimos locales en la banda de origen 10 y/o en una banda de destino, es decir, en las interconexiones de frecuencia o recuadros de frecuencia. Despues, el regenerador de frecuencia 604 lleva a cabo, tal como se ilustra en 616, una regeneracion de frecuencia en la que los Kmites de las interconexiones se situan en los minimos en la banda de origen y/o la banda de destino.
[0038] Posteriormente, se explica la fig. 7a con el fin de describir una implementation preferida del 15 regenerador de frecuencia 604 de la fig. 6a. Un regenerador de senal preliminar 702 recibe, como entrada, datos de
origen procedentes de la banda de origen y, ademas, information de interconexion preliminar, como, por ejemplo, frecuencias de Kmite preliminares. Despues se genera una senal regenerada preliminar 703, que es detectada por el detector 704 para detectar los componentes tonales dentro de la senal reconstruida preliminar 703. Como otra posibilidad o de forma anadida, los datos de origen 705 tambien se pueden analizar mediante el detector 20 correspondiente al analizador 602 de la fig. 6a. Por tanto, la etapa de regeneracion de senal preliminar no seria necesaria. Cuando hay una correspondencia bien definida entre los datos de origen y los datos de reconstruction, los minimos o porciones tonales se pueden detectar incluso teniendo en cuenta unicamente los datos de origen, tanto si hay porciones tonales cercanas al limite superior del rango central, como en un limite de frecuencia entre dos recuadros de frecuencia generados de manera individual, tal como se explicara mas adelante con respecto a la 25 fig. 12b.
[0039] En el caso de que se hayan descubierto componentes tonales problematicos cerca de los limites de frecuencia, un regulador de frecuencia de transition 706 lleva a cabo un ajuste de una frecuencia de transition o frecuencia de cruce o frecuencia de inicio de relleno de espacios entre la banda central y la banda de reconstruccion
30 o entre porciones de frecuencia individuales generadas por los mismos datos de origen en la banda de reconstruccion. La senal de salida del bloque 706 se envia a un eliminador 708 de componentes tonales en los hmites. El eliminador esta configurado para eliminar los componentes tonales restantes que permanecen alli tras el ajuste de la frecuencia de transicion mediante el bloque 706. El resultado del eliminador 708 se envia a continuation a un filtro de cruce 710 con el fin de abordar el problema del zumbido del filtro y el resultado del filtro de cruce 710 se 35 introduce despues en un bloque de modelado de la envolvente espectral 712, que lleva a cabo un modelado de la envolvente espectral en la banda de reconstruccion.
[0040] Tal como se explica en el contexto de la fig. 7a, la detection de componentes tonales en el bloque 704 se puede llevar a cabo tanto con unos datos de origen 705 como con una senal reconstruida preliminar 703. Esta
40 realizacion se ilustra en la fig. 7b, en la que se crea una senal regenerada preliminar, como se muestra en el bloque 718. La senal correspondiente a la senal 703 de la fig. 7a se envia despues a un detector 720 que detecta los componentes que generan fallas. Aunque el detector 720 puede estar configurado para ser un detector que detecte componentes tonales en los Kmites de frecuencia, tal como se ilustra en 704 en la fig. 7a, el detector tambien se puede implementar para detectar otros componentes generadores de fallas. Dichos componentes espectrales 45 pueden ser incluso componentes distintos de los componentes tonales y se puede llevar a cabo una deteccion que indique si se ha generado una falla, probando diferentes regeneraciones y comparando los diferentes resultados de las regeneraciones con el fin de descubrir cual de ellas ha producido componentes que generan fallas.
[0041] El detector 720 controla ahora un manipulador 722 para manipular la senal, es decir, la senal 50 regenerada preliminar. Esta manipulation se puede realizar procesando realmente la senal regenerada preliminar
723 o llevando de nuevo a cabo una regeneracion, pero ahora con, por ejemplo, las frecuencias de transicion corregidas, como se ilustra con la linea 724.
[0042] Una implementacion del procedimiento de manipulacion consiste en que la frecuencia de transicion se 55 ajusta del modo que se ilustra en 706 de la fig. 7a. En la fig. 8a se ilustra otra implementacion, que se puede llevar a
cabo en lugar del bloque 706 o junto con el bloque 706 de la fig. 7a. Se proporciona un detector 802 para detectar frecuencias de inicio y final de una portion tonal problematica. A continuacion, se configura un interpolador 804 para realizar una interpolation y, preferentemente, una interpolation compleja entre el inicio y el final de la porcion tonal dentro del rango espectral. A continuacion, tal como se ilustra en la fig. 8a mediante el bloque 806, se sustituye la
porcion tonal por el resultado de la interpolacion.
[0043] Los bloques 808 y 810 de la fig. 8a ilustran una implementacion alternativa. En lugar de llevar a cabo una interpolacion, se lleva a cabo una generacion aleatoria de lineas espectrales 808 entre el inicio y el final de la
5 porcion tonal. Despues, se lleva a cabo un ajuste de potencia de las lineas espectrales generadas al azar, tal como se ilustra en 810, y la potencia de las lineas espectrales generadas al azar se fija de manera que la potencia sea similar a la de las partes espectrales no tonales adyacentes. Despues, la porcion tonal se sustituye por lineas espectrales generadas aleatoriamente y ajustadas por envolvente. Las lineas espectrales pueden ser generadas al azar o de forma pseudoaleatoria con el fin de proporcionar una senal de sustitucion que, en la medida de lo posible, 10 carezca de fallas.
[0044] En la fig. 8b se ilustra otra implementacion. En el bloque 820 se ilustra un generador de recuadros de frecuencia que se encuentra dentro del generador de frecuencia 604 de la fig. 6a. El generador de recuadros de frecuencia utiliza unos Kmites de frecuencia predeterminados. El analizador analiza entonces la senal generada por
15 el generador de recuadros de frecuencia, y el generador de recuadros de frecuencia 820 se configura preferentemente para llevar a cabo multiples operaciones de formacion de recuadros para generar multiples recuadros de frecuencia. Despues el manipulador 824 de la fig. 8b manipula el resultado del generador de recuadros de frecuencia de acuerdo con el resultado del analisis producido como salida por el analizador 822. La manipulacion puede consistir en el cambio de los Kmites de frecuencia o la atenuacion de porciones individuales. Despues, un 20 regulador de envolvente espectral 826 lleva a cabo un ajuste de envolvente espectral empleando la informacion parametrica 605, como se explica anteriormente en el contexto de la fig. 6a.
[0045] Despues, la senal ajustada espectralmente generada como salida por el bloque 826 se introduce en un convertidor de frecuencia-tiempo que, ademas, recibe las primeras porciones espectrales, es decir una
25 representacion espectral de la senal de salida del decodificador central 600. La salida del convertidor de frecuencia- tiempo 828 se puede utilizar despues para almacenarla o transmitirla a un altavoz para reproducir el audio.
[0046] La presente invention se puede aplicar a procedimientos de regeneration de frecuencia como los que se ilustran en las figs. 13a, 13b o se pueden aplicar preferentemente dentro del contexto del relleno inteligente de
30 espacios, que se describe a continuation haciendo referencia a las figs. 1a a 5b y 9a a 10d.
[0047] La fig. 1a ilustra un aparato para codificar una senal de audio 99. La senal de audio 99 se introduce en un convertidor de espectro temporal 100 para convertir una senal de audio con una tasa de muestreo en una representacion espectral 101 generada como salida por el convertidor de espectro temporal. El espectro 101 se
35 introduce en un analizador espectral 102 para analizar la representacion espectral 101. El analizador espectral 101 esta configurado para determinar un primer conjunto de primeras porciones espectrales 103 que se codificaran con una primera resolution espectral y un segundo conjunto diferente de segundas porciones espectrales 105 que se codificaran con una segunda resolucion espectral. La segunda resolucion espectral es mas pequena que la primera resolucion espectral. El segundo conjunto de segundas porciones espectrales 105 se introduce en una calculadora 40 de parametros o un codificador parametrico 104 para calcular una informacion de envolvente espectral con una segunda resolucion espectral. Ademas, se proporciona un codificador de audio de dominio espectral 106 para generar una primera representacion codificada 107 del primer conjunto de porciones espectrales con la primera resolucion espectral. Ademas, la calculadora de parametros/codificador parametrico 104 estan configurados para generar una segunda representacion codificada 109 del segundo conjunto de segundas porciones espectrales. La 45 primera representacion codificada 107 y la segunda representacion codificada 109 se introducen en un multiplexor de corriente de bits o formador de corriente de bits 108 y el bloque 108 finalmente genera como salida la senal de audio codificada para transmitirla o almacenarla en un dispositivo de almacenamiento.
[0048] Normalmente, una primera porcion espectral como, por ejemplo, 306 de la fig. 3a estara rodeada por 50 dos porciones espectrales como, por ejemplo, 307a, 307b. Este no es el caso en la HE AAC, en la que el rango de
frecuencia del codificador central es de banda limitada.
[0049] La fig. 1 ilustra un decodificador que se corresponde con el codificador de la fig. 1a. La primera representacion codificada 107 se introduce en un decodificador de audio de dominio espectral 112 para generar una
55 primera representacion decodificada de un primer conjunto de primeras porciones espectrales, y la representacion decodificada presenta una primera resolucion espectral. Ademas, la segunda representacion codificada 109 se introduce en un decodificador parametrico 114 para generar una segunda representacion decodificada de un segundo conjunto de segundas porciones espectrales con una segunda resolucion espectral que es mas baja que la primera resolucion espectral.
[0050] El decodificador tambien comprende un regenerador de frecuencia 116 para regenerar una segunda
porcion espectral reconstruida que presenta la primera resolucion espectral, utilizando una primera porcion espectral. El regenerador de frecuencia 116 lleva cabo una operacion de relleno de recuadros, es decir, utiliza un recuadro o 5 porcion del primer conjunto de primeras porciones espectrales y copia este primer conjunto de primeras porciones espectrales en el rango de reconstruccion o banda de reconstruction que contiene la segunda porcion espectral y normalmente lleva a cabo un modelado de la envolvente espectral u otra operacion segun lo indique la segunda representation decodificada generada como salida por el decodificador parametrico 114, es decir, utilizando la information del segundo conjunto de segundas porciones espectrales. El primer conjunto decodificado de primeras 10 porciones espectrales y el segundo conjunto reconstruido de porciones espectrales segun se indica en la salida del regenerador de frecuencia 117 en la llnea 117 se introduce en un convertidor de espectro-tiempo 118 configurado para convertir la primera representacion decodificada y la segunda porcion espectral reconstruida en una representacion temporal 119, y la representacion temporal presenta una cierta tasa de muestreo elevada.
15 [0051] La fig. 2b ilustra una implementation del codificador de la fig. 1a. Se introduce una senal de entrada
de audio 99 en un banco de filtros de analisis 220 correspondiente al convertidor de tiempo-espectro 100 de la fig. 1a. Despues, se lleva a cabo una operacion de modelado temporal de ruido (TNS, por sus siglas en ingles) en el bloque de TNS 222. Por lo tanto, la entrada en el analizador espectral 102 de la fig. 1a correspondiente a un enmascaramiento tonal del bloque 226 de la fig. 2b puede consistir en valores espectrales completos, cuando no se 20 aplica la operacion de modelado temporal de recuadros/modelado temporal de ruido, o bien en valores espectrales residuales, cuando se aplica la operacion de TNS ilustrada en la fig. 2b, bloque 222. Ademas, para senales de dos canales o senales multicanal, se puede llevar a cabo una codification conjunta de canales 228, de manera que el codificador de dominio espectral 106 de la fig. 1a puede comprender el bloque de codificacion conjunta de canales 228. Ademas, se proporciona un codificador por entropla 232 para llevar a cabo una compresion sin perdidas de los 25 datos, que tambien forma parte del codificador de dominio espectral 106 de la fig. 1a.
[0052] El analizador espectral/enmascaramiento tonal 226 divide la salida del bloque de TNS 222 entre la banda central y componentes tonales correspondientes al primer conjunto de porciones espectrales 103 y los componentes residuales correspondientes al segundo conjunto de porciones espectrales 105 de la fig. 1a. El bloque
30 224 indicado como codificacion de extraction de parametros de IGF corresponde al codificador parametrico 104 de la fig. 1a y el multiplexor de corriente de bits 230 corresponde al multiplexor de corriente de bits 108 de la fig. 1a.
[0053] Preferentemente, el banco de filtros de analisis 222 se implementa como una MDCT (banco de filtros de transformada de coseno discreta modificada) y la MDCT se utiliza para transformar la senal 99 en un dominio de
35 tiempo-frecuencia con la transformada de coseno discreta modificada actuando como herramienta de analisis de frecuencia.
[0054] El analizador espectral 226 aplica preferentemente un enmascaramiento de tonalidad. Esta etapa de estimation de enmascaramiento de tonalidad se utiliza para separar los componentes tonales de los componentes
40 de tipo ruido de la senal. Esto permite al codificador central 228 codificar todos los componentes tonales con un modulo psicoacustico. La etapa de estimacion del enmascaramiento de tonalidad se puede implementar de muchas maneras distintas y se implementa preferentemente con una funcionalidad similar a la de la etapa de estimacion de la pista sinusoidal utilizada en el modelado de seno y ruido para la codificacion de voz/audio [8, 9] o un codificador de audio basado en el modelo HILN descrito en [10]. Preferentemente, se utiliza una implementacion que resulta 45 facil de implementar sin necesidad de mantener trayectorias de nacimiento-muerte, pero tambien se puede utilizar cualquier otro detector de tonalidad o ruido.
[0055] El modulo de IGF calcula la semejanza existente entre una zona de origen y una zona de destino. La zona de destino estara representada por el espectro obtenido de la zona de origen. La medida de la semejanza
50 entre las zonas de origen y de destino se realiza mediante un enfoque de correlation cruzada. La zona de destino se divide en nTar recuadros de frecuencia sin solapamiento. Para cada recuadro de la zona de destino, se crean nSrc recuadros de origen a partir de una frecuencia de inicio fija. Estos recuadros de origen se solapan en un factor de entre 0 y 1, en el que 0 significa un 0% de solapamiento y 1 significa un 100% de solapamiento. Cada uno de estos recuadros de origen se correlaciona con el recuadro de destino a diferentes retardos para hallar el recuadro de 55 origen que mejor se corresponda con el recuadro de destino. El numero del recuadro que mejor se corresponde se almacena en tileNum[idx-tar], el retardo con el que se obtiene la mejor correlacion con el destino se almacena en xcorr_lag[idx_tar][idx_src] y el signo de la correlacion se almacena en xcorr_sign[idx_tar][idx_src]. En el caso de que la correlacion sea altamente negativa, es necesario multiplicar el recuadro de origen por -1 antes del proceso de relleno de recuadros en el decodificador. El modulo de IGF tambien se encarga de no reemplazar los componentes
tonales del espectro, ya que los componentes tonales se conservan mediante el enmascaramiento de tonalidad. Se utiliza un parametro de potencia por bandas para almacenar la potencia de la zona de destino, lo que nos permite reconstruir el espectro de manera precisa.
5 [0056] Este procedimiento ofrece ciertas ventajas frente a la clasica SBR [1], ya que el codificador central
conserva la rejilla armonica de una senal multitono, al tiempo que solo los huecos entre las sinusoides se rellenan con el “ruido modelado” que mejor se corresponde, procedente de la zona de origen. Otra ventaja de este sistema en comparacion con la ASR (sustitucion espectral precisa) [2-4] es la ausencia de una etapa de slntesis de senal que crea las porciones importantes de la senal en el decodificador. En lugar de ello, el codificador central se hace 10 cargo de esta tarea, lo que permite conservar componentes importantes del espectro. Otra ventaja del sistema propuesto es la escalabilidad continua que ofrece gracias a sus caracterlsticas. La simple utilizacion de un tileNum[idx_tar] y xcorr_lag = 0, para cada recuadro se denomina correspondencia de granularidad gruesa y se puede utilizar para bajas tasas de bits, al tiempo que la utilizacion de un xcorr_lag variable para cada recuadro nos permite establecer una mejor correspondencia entre los espectros de destino y de origen.
15
[0057] Ademas, se propone una tecnica de estabilizacion de eleccion de recuadro que elimina fallas en el dominio de frecuencia tales como el gorjeo y el ruido musical.
[0058] En el caso de los pares de canales estereo, se aplica un procesamiento estereo conjunto adicional. 20 Este procesamiento es necesario debido a que, para un cierto rango de destino, la senal puede ser una fuente de
sonido panoramizada que presenta una alta correlacion. En el caso de las zonas de origen escogidas para esta zona concreta no estan bien correlacionadas, aunque las potencias se corresponden con las zonas de destino, la imagen espacial puede verse deteriorada debido a la falta de correlacion de las zonas de origen. El codificador analiza la banda de potencia de cada zona de destino, normalmente, llevando a cabo una correlacion cruzada de los valores 25 espectrales y, si se supera un cierto umbral, establece un indicador conjunto para esta banda de potencia. En el decodificador, se tratan de manera individual las bandas de potencia del canal izquierdo y el derecho si no se establece este indicador de estereo conjunto. En el caso de que se establezca el indicador de estereo conjunto, tanto las potencias como las interconexiones se llevan a cabo en el dominio de estereo conjunto. La informacion de estereo conjunto para las zonas de IGF se senala de manera similar a la informacion de estereo conjunto para la 30 codificacion central, incluido un indicador que indica, en caso de prediccion, si la direccion de la prediccion va desde mezcla reductora hasta residual o viceversa.
35
[0059] Las potencias se pueden calcular a partir de las potencias transmitidas en el dominio L/R
(izquierda/derecha).
midNrg[k ] = leftNrg[k ]+ rightNrg[k ]
sideNrg[k ] = leftNrg[k ] - rightNrg[k ];
40
siendo k el Indice de frecuencia en el dominio de la transformada.
[0060] Otra solucion consiste en calcular y transmitir las potencias directamente en el dominio de estereo
conjunto para bandas en las que el estereo conjunto esta activado, de manera que no se necesita una 45 transformacion de potencia adicional en el lado del decodificador.
[0061] Los recuadros de origen siempre se crean conforme a la matriz Mid/Side (medio/lateral):
midTile[k ] = 0,5(leftTile[k ]+ rightTile[k ])
50
sideTile[k ] = 0,5(leftTile[k ]-rightTile[k ])
[0062] Ajuste de potencia:
55 midTile[k ] = midTile[k ] * midNrg[k ]
sideTile[k ] = sideTile[k ] * sideNrg[k ]
10
15
Transformacion estereo conjunto ^ LR:
[0063] Si no se codifica ningun parametro de prediction adicional:
leftTile[k ] = midTile[k ]+ sideTile[k ] rightTile[k ] = midTile[k ]- sideTile[k ]
[0064] Si se codifica un parametro de prediccion adicional y si la direction senalada va del medio al lateral:
sideTile[k ] = sideTile[k ]- predictionCoeffmidTile[k ] leftTile[k ] = midTile[k ]+ sideTile[k ] rightTile[k ] = midTile[k ]- sideTile[k ]
[0065] Si la direccion senalada va del lateral al medio:
20 midTile[k ] = midTile[k ] - predictionCoeffside Tile[k ]
leftTile[k ] = midTile[k ]- sideTile[k ]
rightTile[k ] = midTile[k ] + sideTile[k ]
25
[0066] Este procesamiento garantiza que a partir de los recuadros utilizados para regenerar zonas de destino con una alta correlation y zonas de destino panoramizadas, los canales izquierdo y derecho resultantes siguen representando una fuente de sonido correlacionada y panoramizada aunque las zonas de origen no esten correlacionadas, y se conserva la imagen estereo para dichas zonas.
30
[0067] Expresado de otro modo, en la corriente de bits, se transmiten indicadores de estereo conjunto que indican si se utilizara L/R o M/S como ejemplo para la codification general de estereo conjunto. En el decodificador, en primer lugar, se decodifica la senal central segun indican los indicadores estereo para las bandas centrales. En segundo lugar, la senal central se almacena tanto en una representation L/R como M/S. Para el relleno de
35 recuadros IGF, se escoge la representacion de los recuadros de origen de manera que se ajuste a la representacion de los recuadros de destino, tal como indica la information de estereo conjunto para las bandas de IGF. El modelado temporal de ruido (TNS) es una tecnica estandar y forma parte de la AAC [11-13]. El TNS se puede considerar como una ampliation del esquema basico de un codificador perceptual, en la que se intercala una etapa de procesamiento opcional entre el banco de filtros y la etapa de cuantificacion. La tarea principal del modulo de TNS consiste en 40 ocultar el ruido producido por la cuantificacion en la zona de enmascaramiento temporal de senales de tipo transitorio y, por tanto, da lugar a un esquema de codificacion mas eficiente. En primer lugar, el TNS calcula un conjunto de coeficientes de prediccion mediante una “prediccion hacia delante” en el dominio de la transformada, por ejemplo, MDCT. Estos coeficientes se usan mas tarde para aplanar la envolvente temporal de la senal. Debido a que la cuantificacion afecta al espectro filtrado mediante el TNS, el ruido de la cuantificacion tambien es temporalmente 45 plano. Al aplicar el filtrado TNS inverso en el lado del decodificador, el ruido de cuantificacion se modela de acuerdo con la envolvente temporal del filtro TNS y, por lo tanto, el ruido de cuantificacion queda enmascarado por el transitorio.
[0068] El IGF se basa en una representacion de tipo MDCT. Para lograr una codificacion eficiente, se deben 50 utilizar preferentemente bloques de aproximadamente 20 ms. Si la senal contenida en un bloque con semejante
longitud contiene transitorios, se producen preecos y posecos audibles en las bandas espectrales de IGF a causa del relleno de recuadros. La fig. 7c muestra un tlpico efecto de preeco anterior a la aparicion del transitorio a causa del IGF. En el lado izquierdo, se muestra el espectrograma de la senal original y, en el lado derecho, se muestra el espectrograma de la senal de ancho de banda ampliado sin filtrado TNS.
55
[0069] Este efecto de preeco se reduce mediante el TNS en el contexto del IGF. Aqul, el TNS se utiliza como
una herramienta de modelado de recuadros temporales (TTS, por sus siglas en ingles) cuando la regeneracion espectral en el decodificador se lleva a cabo con la senal residual del TNS. Los coeficientes de prediction de TTS necesarios se calculan y se aplican utilizando el espectro completo en el codificador, como es habitual. Las frecuencias de inicio y fin de TNS/TTS no se ven afectadas por la frecuencia de inicio del IGF fiGFstart de la 5 herramienta de IGF. En comparacion con el TNS legado, la frecuencia de fin de TTS se incrementa hasta la frecuencia de fin de la herramienta IGF, que es mayor que fiGFstart. En el lado del decodificador, los coeficientes TNS/TTS se aplican de nuevo sobre la totalidad del espectro, es decir, el espectro central mas el espectro regenerado, mas los componentes tonales obtenidos a partir del mapa de tonalidades (vease la fig. 7e). La aplicacion del TTS es necesaria para formar la envolvente temporal del espectro regenerado de forma que se 10 corresponda de nuevo con la envolvente de la senal original. De este modo, se reducen los preecos. Ademas, continua modelando el ruido de cuantificacion en la senal por debajo de fiGFstart, como es habitual con el TNS.
[0070] En decodificadores legados la interconexion espectral en una senal de audio corrompe la correlation espectral en los llmites de la interconexion y, de ese modo, altera la envolvente temporal de la senal de audio
15 introduciendo dispersion. Por tanto, otra ventaja de llevar a cabo el relleno de recuadros IGF en la senal residual consiste en que, tras la aplicacion del filtro de modelado, los llmites de los recuadros se correlacionan a la perfection, lo que da lugar a una reproduction temporal mas fiel de la senal.
[0071] En un codificador de la invention, el espectro que ha sido sometido al filtrado TNS/TTS, 20 procesamiento de enmascaramiento de tonalidad y estimation de parametros IGF no presenta ninguna senal por
encima de la frecuencia de inicio de IGF. Este espectro disperso se codifica ahora mediante el codificador central aplicando principios de codification aritmetica y codification predictiva. Estos componentes codificados, junto con los bits de senalizacion, forman la corriente de bits del audio.
25 [0072] La fig. 2a ilustra la implementation del correspondiente decodificador. La corriente de bits de la fig. 2a
correspondiente a la senal de audio codificada se introduce en el demultiplexor/decodificador que estarla conectado, con respecto a la fig. 1b, con los bloques 112 y 114. El demultiplexor de corriente de bits divide la senal de audio de entrada entre la primera representation codificada 107 de la fig. 1b y la segunda representation codificada 109 de la fig. 1b. La primera representacion codificada que contiene el primer conjunto de primeras porciones espectrales se 30 introduce en el bloque de decodificacion de canales conjuntos 204, correspondiente al dominio espectral del decodificador 112 de la fig. 1b. La segunda representacion codificada se introduce en el decodificador parametrico 114 que no se ilustra en la fig. 2a, y despues se introduce en el bloque de IGF 202 correspondiente al regenerador de frecuencia 116 de la fig. 1b. El primer conjunto de primeras porciones espectrales necesario para la regeneracion de frecuencia se introduce en el bloque de IGF 202 a traves de la llnea 203. Ademas, posteriormente a la 35 decodificacion de canales conjuntos 204, se aplica la decodificacion central especlfica en el bloque de enmascaramiento tonal 206, de manera que la salida del enmascaramiento tonal 206 corresponde a la salida del decodificador de dominio espectral 112. Despues, se lleva a cabo una combination mediante el combinador 208, es decir, una construction de cuadros en la que la salida del combinador 208 contiene ahora el espectro de rango completo, pero aun en el dominio filtrado mediante TNS/TTS. Despues, en el bloque 210, se lleva a cabo una 40 operation de TNS/TTS inversa a partir de la information del filtro TNS/TTS proporcionada a traves de la llnea 109, es decir, la informacion secundaria de TTS se incluye preferentemente en la primera representacion codificada generada por el codificador de dominio espectral 106 que, por ejemplo, puede ser un codificador central de tipo AAC o USAC, o tambien puede incluirse en la segunda representacion codificada. En la salida del bloque 210, se proporciona un espectro completo hasta la frecuencia maxima, que consiste en la frecuencia de rango completo 45 definida por la tasa de muestreo de la senal de entrada original. Despues, se lleva a cabo una conversion de espectro/tiempo en el banco de filtros de slntesis 212 para obtener finalmente la senal de audio de salida.
[0073] La fig. 3a ilustra una representacion esquematica del espectro. El espectro se subdivide en bandas de
factor de escala SCB y presenta siete bandas de factor de escala SCB1 a SCB7 en el ejemplo ilustrado de la fig. 3a. 50 Las bandas de factor de escala pueden ser bandas de factor de escala AAC que se definen en la norma AAC y poseen un ancho de banda creciente para frecuencias superiores, tal como se ilustra de manera esquematica en la fig. 3a. Es preferible llevar a cabo el relleno inteligente de espacios, no desde el mismo comienzo del espectro, es decir, a bajas frecuencias, sino iniciando la operacion de IGF en una frecuencia de inicio de IGF ilustrada en 309. Por lo tanto, la banda de frecuencia central se extiende desde la frecuencia mas baja hasta la frecuencia de inicio de 55 IGF. Por encima de la frecuencia de inicio de IGF, se aplica el analisis de espectro para separar los componentes espectrales de alta resolution 304, 305, 306 y 307 (el primer conjunto de primeras porciones espectrales) de los componentes de baja resolucion representados por el segundo conjunto de porciones espectrales. La fig. 3a ilustra un espectro que se introduce, ejemplarmente, en el codificador de dominio espectral 106 o el codificador de canales conjuntos 228, es decir, el codificador central actua sobre el rango completo, pero codifica una cantidad considerable
de valores espectrales cero, es decir, estos valores espectrales cero se cuantifican a cero o se fijan en cero antes de la cuantificacion o despues de la cuantificacion. En cualquier caso, el codificador central actua en el rango completo, es decir, como si el espectro fuera como el que se ilustra, es decir, no es necesario que el decodificador central tenga conocimiento de cualquier relleno inteligente de espacios o codificacion del segundo conjunto de segundas 5 porciones espectrales con una resolution espectral mas baja.
[0074] Preferentemente, la alta resolucion se define mediante una codificacion por llneas de llneas espectrales tales como llneas MDCT, mientras que la segunda resolucion o baja resolucion se define, por ejemplo, mediante el calculo de un valor espectral individual por cada banda de factor de escala, en el que una banda de
10 factor de escala abarca varias llneas de frecuencia. De este modo, la segunda resolucion es, con respecto a su resolucion espectral, mucho mas baja que la primera o alta resolucion definida mediante la codificacion por llneas que se aplica normalmente mediante el codificador central, por ejemplo un codificador central de tipo AAC o USAC.
[0075] En lo que respecta al calculo de los factores de ajuste de escala o potencias, la situation se ilustra en 15 la fig. 3b. Debido al hecho de que el codificador es un codificador central y debido al hecho de que puede haber,
aunque no necesariamente, componentes del primer conjunto de porciones espectrales en cada banda, el codificador central calcula un factor de ajuste de escala para cada banda, no solo en el rango central por debajo de la frecuencia de inicio de IGF 309, sino tambien por encima de la frecuencia de inicio de IGF hasta la frecuencia maxima fiGFstop, que es menor o igual que la mitad de la frecuencia de muestreo, es decir, fs/2. De este modo, las 20 porciones tonales codificadas 302, 304, 305, 306, 307 de la fig. 3a y, en esta realization, junto con los factores de escala SCB1 a SCB7, corresponden a los datos espectrales de alta resolucion. Los datos espectrales de baja resolucion se calculan comenzando desde la frecuencia de inicio de IGF y corresponden a los valores de information de potencia Ei, E2, E3 y E4, que se transmiten junto con los factores de ajuste de escala SF4 a SF7.
25 [0076] En particular, cuando el codificador central se encuentra en un estado de baja tasa de bits, se puede
aplicar una operation adicional de relleno de ruido en la banda central, es decir con una frecuencia mas baja que la frecuencia de inicio de IGF, es decir, en las bandas de factor de escala SCB1 a SCB3. En el relleno de ruido, existen varias llneas espectrales adyacentes que se han cuantificado a cero. En el lado del decodificador, se resintetizan estos valores espectrales cuantificados a cero, y los valores espectrales resintetizados se ajustan en cuanto a su 30 magnitud empleando una potencia de relleno de ruido tal como NF2 ilustrada en 308 de la fig. 3b. La potencia de relleno de ruido, que se puede dar en terminos absolutos o en terminos relativos, particularmente con respecto al factor de ajuste de escala como en USAC, corresponde a la potencia del conjunto de valores espectrales cuantificados a cero. Estas llneas de relleno de ruido tambien se pueden considerar como un tercer conjunto de terceras porciones espectrales que se regeneran mediante una sencilla slntesis de relleno de ruido sin que ninguna 35 operacion de IGF recurra a la regeneration de la potencia a partir de recuadros de frecuencia procedentes de otras frecuencias para reconstruir recuadros de frecuencia a partir de valores espectrales procedentes de un rango de origen y la informacion de la potencia E1, E2, E3 y E4.
[0077] Preferentemente, las bandas para las que se calcula la informacion de la potencia coinciden con las 40 bandas de factor de escala. En otras realizaciones se aplica un agrupamiento de valores de informacion de potencia,
de manera que, por ejemplo, para las bandas de factor de escala 4 y 5, solo se transmite un valor individual de informacion de potencia, pero incluso en esta realizacion, los llmites de las bandas de reconstruction agrupadas coinciden con los llmites de las bandas de factor de escala. Si se aplican diferentes separaciones de bandas, entonces se pueden aplicar ciertos recalculos o calculos de sincronizacion, y esto puede tener sentido dependiendo 45 de la implementation concreta.
[0078] Preferentemente, el codificador de dominio espectral 106 de la fig. 1a es un codificador basado en la psicoacustica tal como se ilustra en la fig. 4a. Normalmente, como se ilustra, por ejemplo, en la norma MPEG2/4 AAC o MPEG1/2, capa 3, la senal de audio que se codificara tras haberla transformado en el rango espectral (401
50 en la fig. 4a) se envla a una calculadora de factor de ajuste de escala 400. La calculadora de factor de ajuste de escala esta controlada por un modelo psicoacustico que recibe ademas la senal de audio que se desea cuantificar o recibe, como en la norma MPEG1/2 capa 3 o MPEG AAC, una representation espectral compleja de la senal de audio. El modelo psicoacustico calcula, para cada banda de factor de escala, un factor de ajuste de escala que representa el umbral psicoacustico. Ademas, los factores de ajuste de escala se ajustan despues, mediante la 55 cooperation de los ya conocidos bucles de iteration interno y externo o mediante cualquier otro procedimiento de codificacion adecuado, de manera que se cumplan ciertas condiciones en cuanto a la tasa de bits. Despues, los valores espectrales que se van a cuantificar, por una parte, y los factores de ajuste de escala calculados, por otra, se introducen en un procesador cuantificador 404. En la sencilla operacion realizada por el codificador de audio, los valores espectrales que se van a cuantificar se ponderan mediante factores de ajuste de escala y los valores
ponderados se introducen despues en un cuantificador fijo que normalmente incluye una funcionalidad de compresion hasta rangos superiores de amplitud. Entonces, en la salida del procesador cuantificador, existen unos Indices de cuantificacion que se envlan despues a un codificador por entropla que normalmente ofrece una codificacion especlfica y muy eficiente para un conjunto de Indices de cuantificacion a cero para valores de 5 frecuencia adyacentes o, como tambien se denominan en la tecnica, una “racha” de valores cero.
[0079] No obstante, en el codificador de audio de la fig. 1a, normalmente, el procesador cuantificador recibe information sobre las segundas porciones espectrales procedente del analizador espectral. Asl, el procesador cuantificador 404 se asegura de que, en la salida del procesador cuantificador 404, las segundas porciones
10 espectrales identificadas por el analizador espectral 102 son cero o tienen una representation reconocida por un codificador o un decodificador como una representacion cero que se puede codificar de manera muy eficiente, concretamente cuando existen “rachas” de valores cero en el espectro.
[0080] La fig. 4b ilustra una implementation del procesador cuantificador. Los valores espectrales MDCT se
15 pueden introducir en un bloque de fijado en cero 410. Entonces, las segundas porciones espectrales estan ya fijadas
en cero antes de que se lleve a cabo una ponderacion mediante los factores de ajuste de escala en el bloque 418 posterior al bloque de ponderacion 412. En otra implementacion, la operation de fijado en cero tambien se puede llevar a cabo en un bloque de fijado en cero 422 posterior a una cuantificacion en el bloque cuantificador 420. En esta implementacion, los bloques 410 y 418 no estarlan presentes. En general, se proporciona al menos uno de los
20 bloques 410, 418 y 422 segun la implementacion concreta.
[0081] Despues, en la salida del bloque 422, se obtiene un espectro cuantificado correspondiente a lo que se muestra en la ilustracion de la fig. 3a. Este espectro cuantificado se introduce despues en un codificador por entropla como el 232 de la fig. 2b, que puede ser un codificador de tipo Huffman o un codificador aritmetico, tal como se
25 define, por ejemplo, en la norma USAC.
[0082] Los bloques de fijado en cero 410, 418 y 422, que se proporcionan como distintas alternativas o en paralelo, se controlan mediante el analizador espectral 424. El analizador espectral comprende preferentemente cualquier implementacion del ya conocido detector de tonalidad o comprende cualquier tipo diferente de detector que
30 sea capaz de dividir un espectro entre componentes que se codificaran con una alta resolution y componentes que se codificaran con una baja resolucion. Otros algoritmos de este tipo implementados en el analizador espectral pueden ser un detector de actividad vocal, un detector de ruido, un detector de habla o cualquier otro detector que decide en funcion de la informacion espectral o metadatos asociados sobre los requisitos de resolucion para las diferentes porciones espectrales.
35
[0083] La fig. 5a ilustra una implementacion preferida del convertidor de espectro 100 de la fig. 1a tal como, por ejemplo, se implementa en AAC o USAC. El convertidor de tiempo-espectro 100 comprende un divisor de ventanas 502 controlado por un detector de transitorios 504. Cuando el detector de transitorios 504 detecta un transitorio, el divisor de ventanas recibe una indicacion de cambio de ventanas largas a ventanas cortas. El divisor
40 de ventanas 502 calcula entonces, para bloques de solapamiento, cuadros con ventana, en los que cada cuadro con ventana posee normalmente dos valores N como, por ejemplo, 2048 valores. Despues se lleva a cabo una transformation dentro de un transformador de bloques 506, y este transformador de bloques normalmente proporciona, ademas, una elimination, de manera que se lleva a cabo una combination de eliminacion/transformada para obtener un cuadro espectral con valores N como, por ejemplo, valores espectrales MDCT. De este modo, para
45 una operacion de ventana larga, el cuadro en la entrada del bloque 506 comprende dos valores N como, por ejemplo, 2048 valores y, entonces, un cuadro espectral posee 1024 valores. No obstante, despues se lleva a cabo un cambio a bloques cortos, cuando se llevan a cabo ocho bloques cortos en los que cada bloque corto posee valores en dominio temporal en ventanas de 1/8 en comparacion con una ventana larga y cada bloque espectral posee valores espectrales de 1/8 en comparacion con un bloque largo. De este modo, cuando esta eliminacion se
50 combina con una operacion del divisor de ventanas con un solapamiento del 50%, el espectro es una version muestreada crlticamente de la senal de audio en dominio temporal 99.
[0084] A continuation, se hace referencia a la fig. 5b que ilustra una implementacion concreta del regenerador de frecuencia 116 y el convertidor de espectro-tiempo 118 de la fig. 1b, o de la operacion combinada de
55 los bloques 208 y 212 de la fig. 2a. En la fig. 5b, se considera una reconstruction de banda concreta como la banda de factor de escala 6 de la fig 3a. La primera portion espectral en esta banda de reconstruccion, es decir la primera portion espectral 306 de la fig. 3a, se introduce en el bloque del constructor de cuadros/regulador 510. Ademas, tambien se introduce en el constructor de cuadros/regulador 510 una segunda porcion espectral reconstruida para la banda de factor de escala 6. Ademas, tambien se introduce en el constructor de cuadros/regulador 510 una
information de potencia tal como E3 de la fig. 3b, para una banda de factor de escala 6. La segunda portion espectral reconstruida en la banda de reconstruction ya se ha generado mediante el relleno de recuadros de frecuencia utilizando un rango de origen, y la banda de reconstruccion corresponde entonces al rango de destino. Ahora se lleva a cabo un ajuste de potencia del cuadro para obtener finalmente el cuadro reconstruido completo con 5 los valores N, por ejemplo, obtenidos en la salida del combinador 208 de la fig. 2a. Despues, en el bloque 512, se lleva a cabo una transformada/interpolacion inversa de bloques para obtener 248 valores de dominio temporal para los, por ejemplo, 124 valores espectrales en la entrada del bloque 512. Despues, se lleva a cabo una operation de division de ventana de slntesis en el bloque 514, que, de nuevo, se controla mediante una indication de ventana larga/ventana corta transmitida como informacion secundaria en la serial de audio codificada. Despues, en el bloque 10 516, se lleva a cabo una operacion de solapamiento/agregacion con un cuadro de tiempo anterior. Preferentemente, la MDCT aplica un solapamiento del 50%, de manera que, para cada nuevo cuadro temporal de valores 2N, finalmente se generan como salida valores N en dominio temporal. Se prefiere, con diferencia, un solapamiento del 50% debido al hecho de que proporciona un muestreo crltico y un cruce continuo de un cuadro al siguiente a causa de la operacion de solapamiento/agregacion del bloque 516.
15
[0085] Como se ilustra en 301 de la fig. 3a, se puede aplicar, ademas, una operacion de relleno de ruido, no solo por debajo de la frecuencia de inicio de IGF, sino tambien por encima de la frecuencia de inicio de IGF, al igual que para la banda de reconstruccion contemplada que coincide con la banda de factor de escala 6 de la fig. 3a. Despues, tambien se pueden introducir valores espectrales de relleno de ruido en el constructor de
20 cuadros/regulador 510, y dentro de este bloque tambien se puede aplicar el ajuste de los valores espectrales de relleno de ruido, o los valores espectrales de relleno de ruido pueden estar ya ajustados a partir de la potencia de relleno de ruido antes de introducirlos en el constructor de cuadros/regulador 510.
[0086] Preferentemente, una operacion de IGF, es decir una operacion de relleno de recuadros de frecuencia 25 a partir de valores espectrales procedentes de otras porciones, se puede aplicar en el espectro completo. De este
modo, se puede aplicar una operacion de relleno de recuadros espectrales, no solo en la banda alta por encima de una frecuencia de inicio de IGF, sino tambien en la banda baja. Ademas, tambien se puede aplicar el relleno de ruido sin relleno de recuadros de frecuencia, no solo por debajo de la frecuencia de inicio de IGF, sino tambien por encima de la frecuencia de inicio de IGF. No obstante, se ha descubierto que se puede obtener una codification de audio de 30 alta calidad y eficiencia cuando la operacion de relleno de ruido se limita al rango de frecuencias situado por debajo de la frecuencia de inicio de IGF y cuando la operacion de relleno de recuadros de frecuencia se restringe al rango de frecuencias situado por encima de la frecuencia de inicio de IGF, tal como se ilustra en la fig. 3a.
[0087] Preferentemente, los recuadros de destino (TT) (con frecuencias superiores a la frecuencia de inicio 35 de IGF) estan delimitados a los llmites de la banda de factor de escala del codificador de tasa completa. Los
recuadros de origen (ST), a partir de los cuales se toma la informacion, es decir, para frecuencias inferiores a la frecuencia de inicio de IGF, no estan delimitados por los llmites de la banda de factor de escala. El tamano de los ST deberla corresponder al tamano de los TT a los que estan asociados. Esto se ilustra mediante el siguiente ejemplo. TT[0] tiene una longitud de 10 bins de MDCT. Esto corresponde exactamente a la longitud de dos posteriores SCB 40 (por ejemplo, 4 +6). Entonces, todos los posibles ST que se van a correlacionar con TT[0] tambien tienen una longitud de 10 bins. Un segundo recuadro de destino TT[1] que es adyacente a TT[0] tiene una longitud de 15 bins I (SCB con una longitud de 7 + 8). Entonces, los ST para el mismo tienen una longitud de 15 bins, en lugar de los 10 bins para el caso de TT[0].
45 [0088] Si se diera el caso de que no se pudiera encontrar un TT para un ST con la longitud del recuadro de
destino (cuando, por ejemplo, la longitud del TT es mayor que el rango de origen disponible), entonces no se calcula la correlation y el rango de origen se copia varias veces en este TT (la copias se realizan una despues de otra, de manera que una llnea de frecuencia para la frecuencia mas baja de la segunda copia sigue inmediatamente, en frecuencia, a la llnea de frecuencia para la frecuencia mas alta de la primera copia), hasta que el recuadro de 50 destino TT este completamente lleno.
[0089] A continuation, se hace referencia a la fig. 5c que ilustra otra realization preferida del regenerador de
frecuencia 116 de la fig. 1b o el bloque de IGF 202 de la fig. 2a. El bloque 522 es un generador de recuadros de frecuencia que recibe, no solo una identification (ID) de banda de destino, sino ademas una ID de banda de origen. 55 Ejemplarmente, se ha determinado en el lado del codificador que la banda de factor de escala 3 de la fig. 3a resulta muy adecuada para la reconstruccion de la banda de factor de escala 7. De este modo, la ID de la banda de origen serla 2 y la ID de la banda de destino serla 7. Basandose en esta informacion, el generador de recuadros de frecuencia 522 aplica una operacion de copiado o relleno de recuadros armonicos o cualquier otro tipo de operacion de relleno de recuadros para generar la segunda porcion en bruto de componentes espectrales 523. La segunda
porcion en bruto de componentes espectrales posee una resolucion de frecuencia identica a la resolucion de frecuencia incluida en el primer conjunto de primeras porciones espectrales.
[0090] Despues, la primera porcion espectral de la banda de reconstruction, por ejemplo, 307 de la fig, 3a,
5 se introduce en un constructor de cuadros 524 y la segunda porcion en bruto 523 tambien se introduce en el constructor de cuadros 524. Despues, el cuadro reconstruido se ajusta mediante el regulador 526 empleando un factor de ganancia para la banda de reconstruccion calculado por la calculadora del factor de ganancia 528. No obstante es importante que la primera porcion espectral del cuadro no resulte afectada por el regulador 526, sino que solo la segunda porcion en bruto para el cuadro de reconstruccion resulte afecta por el regulador 526. Para 10 lograrlo, la calculadora del factor de ganancia 528 analiza la banda de origen o la segunda porcion en bruto 523 y, ademas, analiza la primera porcion espectral de la banda de reconstruccion para hallar finalmente el factor de ganancia corregido 527, de manera que la potencia del cuadro ajustado generado como salida por el regulador 526 tenga la potencia E4 cuando se contempla una banda de factor de escala 7.
15 [0091] En este contexto, es muy importante evaluar la precision en la reconstruccion de altas frecuencias que
ofrece la presente invention en comparacion con la HE-AAC. Esto se explica con respecto a la banda de factor de escala 7 de la fig. 3a. Se supone que un codificador de la tecnica anterior como el que se ilustra en la fig. 13a detectarla la porcion espectral 307 que se va a codificar con una alta resolucion como “armonicos faltantes”. Entonces, la potencia de este componente espectral se transmitirla al decodificador junto con una information de 20 envolvente espectral para la banda de reconstruccion, por ejemplo, la banda de factor de escala 7, Despues, el decodificador recrearla el armonico faltante. No obstante, el valor espectral al que el armonico faltante 307 serla reconstruido por el decodificador de la tecnica anterior de la fig. 13 estarla en el medio de la banda 7 a una frecuencia indicada por la frecuencia de reconstruccion 390. De este modo, la presente invencion evita un error de frecuencia 391 que el decodificador de la tecnica anterior de la fig. 13d si introducirla.
25
[0092] En una implementation, el analizador espectral tambien se implementa para calcular semejanzas
entre las primeras porciones espectrales y las segundas porciones espectrales y para determinar, basandose en las semejanzas calculadas, para una segunda porcion espectral en un rango de reconstruccion una primera porcion espectral que se corresponde lo mas posible con la segunda porcion espectral. A continuation, en esta 30 implementacion de rango de origen/rango de destino variable, el codificador parametrico introducira ademas un intervalo de origen que se corresponda, En el lado del decodificador, esta informacion serla utilizada despues por un generador de recuadros de frecuencia 522 de la fig. 5c que ilustra una generation de una segunda porcion en bruto 523 basandose en una ID de banda de origen y una ID de banda de destino.
35 [0093] Ademas, tal como se ilustra en la fig. 3a, el analizador espectral esta configurado para analizar la
representation espectral hasta una frecuencia maxima de analisis que es solo un poco menos de la mitad de la frecuencia de muestreo y, preferentemente, es de al menos un cuarto de la frecuencia de muestreo o, normalmente, mas alta.
40 [0094] Tal como se ilustra, el codificador actua sin muestreo descendente y el decodificador actua sin
muestreo ascendente. Expresado de otro modo, el codificador de audio de dominio espectral esta configurado para generar una representacion espectral con una frecuencia de Nyquist definida por la tasa de muestreo de la senal de audio introducida originalmente.
45 [0095] Ademas, tal como se ilustra en la fig. 3a, el analizador espectral esta configurado para analizar la
representacion comenzando con una frecuencia de inicio de relleno de espacios y terminando con una frecuencia maxima representada por una frecuencia maxima incluida en la representacion espectral, en la que una porcion espectral que se extiende desde una frecuencia minima hasta la frecuencia de inicio de relleno de espacios pertenece al primer conjunto de porciones espectrales y en la que otra porcion espectral, por ejemplo, 304, 305, 306 50 o 307, con valores de frecuencia superiores a la frecuencia de relleno de espacios se incluye tambien en el primer conjunto de primeras porciones espectrales.
[0096] Tal como se ha explicado en llneas generales, el decodificador de audio de dominio espectral 112 esta
configurado de manera que una frecuencia maxima representada por un valor espectral en la primera representacion 55 decodificada es igual a una frecuencia maxima incluida en la representacion temporal que presenta la tasa de muestreo en la que el valor espectral para la frecuencia maxima en el primer conjunto de primeras porciones espectrales es cero o distinta de cero. En cualquier caso, para esta frecuencia maxima en el primer conjunto de primeras porciones espectrales, existe un factor de ajuste de escala para la banda de factor de escala, que se genera y transmite independientemente de si todos los valores espectrales en esta banda de factor de escala estan
fijados en cero o no, tal como se explica en el contexto de las figs. 3a y 3b.
[0097] Por lo tanto, la invencion resulta ventajosa con respecto a otras tecnicas parametricas para aumentar la eficiencia de la compresion, por ejemplo, la sustitucion de ruido y el relleno de ruido (estas tecnicas sirven
5 exclusivamente para la representacion eficiente de un contenido de senal local de tipo ruido), ya que la invencion permite obtener una representacion precisa de la frecuencia de componentes tonales. Hasta la fecha, ninguna tecnica del estado de la tecnica aborda la representacion parametrica eficiente de un contenido de senal arbitrario mediante el relleno de espacios espectrales sin la restriccion de una division fijada a priori en la banda baja (LF) y la banda alta (HF).
10
[0098] Las realizaciones del sistema de la invencion mejoran los enfoques del estado de la tecnica y, de este modo, proporcionan una alta eficiencia de compresion, sin ninguna molestia perceptual, o solo un pequeno grado de molestia, y un ancho de banda de audio completo, incluso para bajas tasas de bits.
15 [0099] El sistema general consiste en:
• codificacion central de banda completa
• relleno inteligente de espacios (relleno de recuadros o relleno de ruido)
• partes tonales dispersas en centro seleccionadas mediante enmascaramiento tonal
20 • codificacion de par estereo conjunto para banda completa, incluido el relleno de recuadros
• TNS en recuadro
• blanqueamiento espectral en rango de IGF
[0100] Un primer paso para lograr un sistema mas eficiente consiste en suprimir la necesidad de transformar 25 datos espectrales en un segundo dominio de transformada distinto al del codificador central. Debido a que la
mayorla de los codecs de audio, como, por ejemplo, AAC, utilizan la MDCT como transformada basica, resulta util llevar a cabo la BWE tambien en el dominio de la MDCT. Un segundo requisito para el sistema BWE serla la necesidad de conservar la rejilla tonal, con lo que se conservan incluso los componentes tonales de HF y, por tanto, la calidad del audio codificado es superior a la de los sistemas existentes. Para atender a ambos requisitos para un 30 esquema BWE mencionados anteriormente, se propone un nuevo sistema denominado relleno inteligente de espacios (IGF). La fig. 2b muestra el diagrama de bloques del sistema propuesto en el lado del codificador y la fig. 2a muestra el sistema en el lado del decodificador.
[0101] La fig. 9a ilustra un aparato para decodificar una senal de audio codificada que comprende una 35 representacion codificada de un primer conjunto de primeras porciones espectrales y una representacion codificada
de unos datos parametricos que indican potencias espectrales para un segundo conjunto de segundas porciones espectrales. El primer conjunto de primeras porciones espectrales se indica en 901a de la fig. 9a, y la representacion codificada de los datos parametricos se indica en 901b en la fig. 9a. Se proporciona un decodificador de audio 900 para decodificar la representacion codificada 901a del primer conjunto de primeras porciones espectrales para 40 obtener un primer conjunto de primeras porciones espectrales decodificado 904 y para decodificar la representacion codificada de los datos parametricos para obtener unos datos parametricos decodificados 902 para el segundo conjunto de segundas porciones espectrales que indican potencias individuales para bandas de reconstruccion individuales, en la que las segundas porciones espectrales estan situadas en las bandas de reconstruccion. Ademas, se proporciona un regenerador de frecuencia 906 para reconstruir valores espectrales de una banda de 45 reconstruccion que comprende una segunda porcion espectral. El regenerador de frecuencia 906 utiliza una primera porcion espectral del primer conjunto de primeras porciones espectrales y una informacion de potencia individual para la banda de reconstruccion, en la que la banda de reconstruccion comprende una primera porcion espectral y la segunda porcion espectral. El regenerador de frecuencia 906 comprende una calculadora 912 para determinar una informacion de la potencia de conservation que comprende una potencia acumulada de la primera porcion espectral 50 con frecuencias en la banda de reconstruccion. Ademas, el regenerador de frecuencia 906 comprende una calculadora 912 para determinar una informacion de la potencia de conservacion que comprende una potencia acumulada de la primera porcion espectral con frecuencias en la banda de reconstruccion. Ademas, el regenerador de frecuencia 906 comprende una calculadora 918 para determinar una informacion de la potencia de recuadros de otras porciones espectrales de la banda de reconstruccion y para valores de frecuencia que son diferentes de la 55 primera porcion espectral, en la que estos valores de frecuencia tienen frecuencias en la banda de reconstruccion, en la que se van a generar las otras porciones espectrales mediante la regeneration de frecuencia a partir de una primera porcion espectral diferente de la primera porcion espectral de la banda de reconstruccion.
[0102] El regenerador de frecuencia 906 tambien comprende una calculadora 914 para una potencia faltante
en la banda de reconstruccion, y la calculadora 914 actua empleado la potencia individual para la banda de reconstruction y la potencia de conservation generada por el bloque 912. Ademas, el regenerador de frecuencia 906 comprende un regulador de la envolvente espectral 916 para ajustar las otras porciones espectrales de la banda de reconstruccion basandose en la information de la potencia faltante y la information de la potencia de recuadros 5 generada por el bloque 918.
[0103] Se hace referencia a la fig. 9c que ilustra una cierta banda de reconstruccion 920. La banda de reconstruccion comprende una primera portion espectral de la banda de reconstruccion, como la primera portion espectral 306 de la fig. 3a ilustrada de manera esquematica en 921. Ademas, el resto de los valores espectrales en
10 la banda de reconstruccion 920 se generaran a partir de una zona de origen, por ejemplo, desde la banda de factor de escala 1, 2, 3 por debajo de la frecuencia de inicio de relleno inteligente de espacios 309 de la fig. 3a. El regenerador de frecuencia 906 esta configurado para generar valores espectrales en bruto para las segundas porciones espectrales 922 y 923. Despues, se calcula un factor de ganancia g tal como se ilustra en la fig. 9c para ajustar finalmente los valores espectrales en bruto en las bandas de frecuencia 922 y 923 con el fin de obtener las
15 segundas porciones espectrales reconstruidas y ajustadas en la banda de reconstruccion 920 que ahora presentan la misma resolution espectral, es decir la misma distancia entre llneas que la primera porcion espectral 921. Es importante entender que la primera porcion espectral de la banda de reconstruccion que se ilustra en 921 de la fig. 9c se decodifica mediante el decodificador de audio 900 y no se ve afectada por el ajuste de envolvente llevado a cabo en el bloque 916 de la fig. 9b. En lugar de ello, la primera porcion espectral en la banda de reconstruccion
20 indicada en 921 se deja tal y como esta, ya que esta primera porcion espectral es generada como salida por el decodificador de audio de ancho de banda completo o tasa completa 900 a traves de la llnea 904.
[0104] A continuation, se expone un ejemplo concreto con numeros reales. La potencia de conservacion restante calculada por el bloque 912 es, por ejemplo, cinco unidades de potencia y esta potencia es la potencia de
25 las cuatro llneas espectrales de la primera porcion espectral 921 indicadas ejemplarmente.
[0105] Ademas, el valor de potencia E3 para la banda de reconstruccion correspondiente a la banda de factor de escala 6 de la fig. 3b o la fig. 3a es igual a 10 unidades. Un aspecto importante consiste en que el valor de potencia no solo comprende la potencia de las porciones espectrales 922, 923, sino la potencia completa de la
30 banda de reconstruccion 920 calculada en el lado del codificador, es decir, antes de llevar a cabo el analisis espectral mediante, por ejemplo, el enmascaramiento de tonalidad. Por lo tanto, las diez unidades de potencia abarcan la primera y la segunda porcion espectral de la banda de reconstruccion. Entonces, se supone que la potencia de los datos del rango de origen para los bloques 922, 923 o para los datos de destino en bruto para el bloque 922, 923 es igual a ocho unidades de potencia. De este modo, se calcula una potencia faltante de cinco
35 unidades.
[0106] Basandose en la potencia faltante dividida por la potencia de recuadro tEk, se calcula un factor de ganancia de 0,79. Despues, se multiplican las llneas espectrales en bruto para las segundas porciones espectrales 922, 923 por el factor de ganancia calculado. De este modo, solo se ajustan los valores espectrales para las
40 segundas porciones espectrales 922, 923, y las llneas espectrales para la primera porcion espectral 921 no se ven afectadas por este ajuste de la envolvente. Tras multiplicar los valores espectrales en bruto para las segundas porciones espectrales 922, 923, se ha calculado una banda de reconstruccion completa consistente en las primeras porciones espectrales de la banda de reconstruccion, y consistente en llneas espectrales en las segundas porciones espectrales 922, 923 de la banda de reconstruccion 920.
45
[0107] Preferentemente, el rango de origen para generar los datos espectrales en bruto en las bandas 922, 923 esta, con respecto a la frecuencia, por debajo de la frecuencia de inicio de IGF 309 y la banda de reconstruccion 920 esta por encima de la frecuencia de inicio de IGF 309.
50 [0108] Ademas, es preferible que los llmites de la banda de reconstruccion coincidan con los llmites de la
banda de factor de escala. De este modo, una banda de reconstruccion tiene, en una realization, el tamano de las correspondientes bandas de factor de escala del decodificador de audio central o estan dimensionadas de manera que, cuando se aplica un emparejamiento de potencia, un valor de potencia para una banda de reconstruccion proporciona la potencia de dos bandas de factor de escala o un numero entero superior. De este modo, cuando se
55 supone que se lleva a cabo la acumulacion de potencia para la banda de factor de escala 4, la banda de factor de escala 5 y la banda de factor de escala 6, el ll mite de frecuencia inferior de la banda de reconstruccion 920 es igual al ll mite inferior de la banda de factor de escala 4 y el ll mite de frecuencia superior de la banda de reconstruccion 920 coincide con el llmite superior de la banda de factor de escala 6.
[0109] A continuation, se explica la fig. 9d para mostrar otras funcionalidades del decodificador de la fig. 9a. El decodificador de audio 900 recibe los valores espectrales decuantificados correspondientes a las primeras porciones espectrales del primer conjunto de porciones espectrales y, ademas, en un bloque de ajuste de escala inverso 940, se proporcionan factores de ajuste de escala para bandas de factor de escala como las ilustradas en la
5 fig. 3b. El bloque de ajuste de escala inverso 940 proporciona todos los primeros conjuntos de primeras porciones espectrales por debajo de la frecuencia de inicio de IGF 309 de la fig. 3a y, ademas, las primeras porciones espectrales por encima de la frecuencia de inicio de IGF, es decir, las primeras porciones espectrales 304, 305, 306, 307 de la fig. 3a que estan todas situadas en una banda de reconstruction como la que se ilustra en 941 de la fig. 9d. Ademas, las primeras porciones espectrales de la banda de origen utilizadas para el relleno de recuadros de 10 frecuencia en la banda de reconstruccion se proporcionan al regulador de envolvente/calculadora 942 y este bloque recibe ademas la information de la potencia para la banda de reconstruccion proporcionada como information secundaria parametrica a la serial de audio codificada, tal como se ilustra en 943 de la fig. 9d. El regulador de envolvente/calculadora 942 proporciona entonces las funcionalidades de las figs. 9b y 9c y finalmente genera como salida valores espectrales ajustados para las segundas porciones espectrales de la banda de reconstruccion. Estos 15 valores espectrales ajustados 922, 923 para las segundas porciones espectrales de la banda de reconstruccion y las primeras porciones espectrales 921 de la banda de reconstruccion indicadas en la llnea 941 de la fig. 9d representan conjuntamente la representation espectral completa de la banda de reconstruccion.
[0110] A continuacion, se hace referencia a las figs. 10a a 10b para explicar realizaciones preferidas de un 20 codificador de audio para codificar una serial de audio para proporcionar o generar una serial de audio codificada. El
codificador comprende un convertidor de tiempo/espectro 1002 que alimenta un analizador espectral 1004, y el analizador espectral 1044 esta conectado a una calculadora de parametros 1006, por una parte, y a un codificador de audio 1008, por la otra. El codificador de audio 1008 proporciona la representacion codificada de un primer conjunto de primeras porciones espectrales y no abarca el segundo conjunto de segundas porciones espectrales. 25 Por otra parte, la calculadora de parametros 1006 proporciona informacion de potencia para una banda de reconstruccion que abarca las primeras y las segundas porciones espectrales. Ademas, el codificador de audio 1008 esta configurado para generar una primera representacion codificada del primer conjunto de primeras porciones espectrales con la primera resolution espectral, en la que el codificador de audio 1008 proporciona factores de ajuste de escala para todas las bandas de la representacion espectral generada por el bloque 1002. Ademas, como 30 se ilustra en la fig. 3b, el codificador proporciona informacion de potencia al menos para las bandas de reconstruccion situadas, con respecto a la frecuencia, por encima de la frecuencia de inicio de IGF 309, tal como se ilustra en la fig. 3a. De este modo, para las bandas de reconstruccion que coinciden preferentemente con bandas de factor de escala o con grupos de bandas de factor de escala, se dan dos valores, es decir, el correspondiente factor de ajuste de escala procedente del codificador de audio 1008 y, ademas, la informacion de potencia generada como 35 salida por la calculadora de parametros 1006.
[0111] El codificador de audio presenta preferentemente bandas de factor de escala con diferentes anchos de banda de frecuencia, es decir, con un numero diferente de valores espectrales. Por lo tanto, la calculadora parametrica comprende un normalizador 1012 para normalizar las potencias para el diferente ancho de banda con
40 respecto al ancho de banda de la banda de reconstruccion concreta. Con este fin, el normalizador 1012 recibe, como entradas, una potencia en la banda y varios valores espectrales en la banda y el normalizador 1012 genera, entonces, como salida una potencia normalizada por cada banda de reconstruccion/factor de escala.
[0112] Ademas, la calculadora parametrica 1006a de la fig. 10 comprende una calculadora de valores de 45 potencia que recibe informacion de control procedente del codificador central o de audio 1008, tal como se ilustra
mediante la llnea 1007 de la fig. 10a. Esta informacion de control puede comprender informacion sobre bloques largos/cortos utilizados por el codificador de audio y/o informacion de agrupamiento. Por tanto, mientras que la informacion sobre bloques largos/cortos y la informacion de agrupamiento sobre ventanas cortas se refieren a un agrupamiento “temporal”, la informacion de agrupamiento tambien puede hacer referencia a un agrupamiento 50 espectral, es decir, el agrupamiento de dos bandas de factor de escala en una unica banda de reconstruccion. Por tanto, la calculadora de valores de potencia 1014 genera como salida un unico valor de potencia para cada banda agrupada que abarca una primera y una segunda portion espectral cuando solo se han agrupado las porciones espectrales.
55 [0113] La fig. 10d ilustra otra realization para implementar el agrupamiento espectral. Con este fin, el bloque
1016 esta configurado para calcular valores de potencia para dos bandas adyacentes. Despues, en el bloque 1018, se comparan los valores de potencia y, cuando los valores de potencia no son muy diferentes o tienen una diferencia menor que la definida, por ejemplo, por un umbral, entonces se genera un valor individual (normalizado) para ambas bandas, tal como se indica en el bloque 1020. Tal como se ilustra mediante la llnea 1019, el bloque 1018 se puede
saltar. Ademas, la generation de un valor individual para dos o mas bandas llevada a cabo por el bloque 1020 se puede controlar mediante un control de tasa de bits del codificador 1024. De este modo, cuando se va a reducir una tasa de bits, el control de tasa de bits del codificador 1024 controla el bloque 1020 para generar un valor normalizado individual para dos o mas bandas aunque no se hubiera permitido que la comparacion del bloque 1018 agrupara los 5 valores de information de la potencia.
[0114] En el caso de que el codificador de audio lleve a cabo el agrupamiento de dos o mas ventanas cortas, este agrupamiento tambien se aplica para la informacion de la potencia. Cuando el codificador central lleva a cabo un agrupamiento de dos o mas bloques cortos, entonces, para estos dos o mas bloques, solo se calcula y transmite
10 un unico conjunto de factores de ajuste de escala. En el lado del decodificador, el decodificador de audio aplica despues el mismo grupo de factores de ajuste de escala para ambas ventanas agrupadas.
[0115] En referencia al calculo de la informacion de la potencia, los valores espectrales de la banda de reconstruction se acumulan a lo largo de dos o mas ventanas cortas. Expresado de otro modo, esto significa que los
15 valores espectrales en una cierta banda de reconstruccion para un bloque corto y para el posterior bloque corto se acumulan conjuntamente y solo se transmite un unico valor individual de informacion de potencia para esta banda de reconstruccion que abarca dos bloques cortos. Despues, en el lado del decodificador, el ajuste de la envolvente que se explica con respecto a las figs. 9a a 9d no se lleva a cabo de manera individual para cada bloque corto, sino que se lleva a cabo de forma conjunta para este conjunto de ventanas cortas agrupadas.
20
[0116] Despues, se vuelve a aplicar la correspondiente normalization, de manera que, aunque se haya llevado a cabo cualquier agrupamiento en frecuencia o agrupamiento en tiempo, la normalizacion permite facilmente que, para el calculo de la informacion del valor de potencia en el lado del decodificador, solo sea necesario conocer el valor de informacion de potencia, por una parte, y la cantidad de llneas espectrales en la banda de reconstruccion
25 o en el conjunto de bandas de reconstruccion agrupadas.
[0117] Ademas, se hace hincapie en que una informacion sobre potencias espectrales, una informacion sobre potencias individuales o una informacion de potencia individual, una informacion sobre una potencia de conservation o una informacion de potencia de conservacion, una informacion sobre una potencia de recuadro o una informacion
30 de potencia de recuadro, o una informacion sobre potencia faltante o una informacion de potencia faltante puede comprender, no solo un valor de potencia, sino tambien un valor de amplitud (por ejemplo, absoluta), un valor de nivel o cualquier otro valor, a partir del cual se puede obtener un valor de potencia final. Por tanto, la informacion sobre una potencia puede comprender, por ejemplo, el propio valor de potencia y/o un valor de un nivel y/o de una amplitud y/o de una amplitud absoluta.
35
[0118] La fig. 12a ilustra otra implementation del aparato para decodificar. Una corriente de bits es recibida por un decodificador central 1200 que puede ser, por ejemplo, un decodificador AAC. El resultado se configura en una etapa para llevar a cabo una interconexion o formation de recuadros de ampliation de ancho de banda 1202 correspondiente al regenerador de frecuencia 604, por ejemplo. Despues, se lleva a cabo un procedimiento de
40 adaptation de interconexion/recuadro y posprocesamiento, y, cuando se ha llevado a cabo una adaptation de interconexion, se controla el regenerador de frecuencia 1202 para llevar a cabo otra regeneration de frecuencia, pero ahora con, por ejemplo, llmites de frecuencia ajustados. Ademas, cuando se lleva a cabo un procesamiento de interconexion, por ejemplo, mediante elimination o atenuacion de llneas tonales, el resultado se envla despues al bloque 1206 que lleva a cabo el modelado de envolvente de ancho de banda basado en parametros, tal como se
45 expone, por ejemplo, en el contexto del bloque 712 o 826. El resultado se envla despues a un bloque de transformada de slntesis 1208 para llevar a cabo una transformada en el dominio de salida final que, por ejemplo, es un dominio de salida PCM, tal como se ilustra en la fig. 12a.
[0119] Las principales caracterlsticas de las realizaciones de la invention son las siguientes:
50
La realization preferida se basa en la MDCT que presenta las fallas de trino citadas anteriormente si la desafortunada election de frecuencia de cruce y/o margenes de interconexion “poda” zonas espectrales tonales, o hay componentes tonales que acaban situados demasiado cerca en los llmites de la interconexion.
55 [0120] La fig. 12b muestra el modo en que la tecnica propuesta de forma novedosa reduce las fallas que se
encuentran en los procedimientos de BWE del estado de la tecnica. En la fig. 12, panel (2), se muestra el espectro de magnitud estilizado de la salida de un procedimiento de BWE contemporaneo. En este ejemplo, la senal resulta afectada perceptualmente por el batimiento causado por dos tonos proximos, y tambien por la division de un tono. Cada una de ambas zonas espectrales problematicas esta marcada con un clrculo.
[0121] Para superar estos problemas, la nueva tecnica detecta en primer lugar la ubicacion espectral de los
componentes tonales contenidos en la senal. Despues, de acuerdo con un aspecto de la invencion, se intentan ajustar las frecuencias de transicion entre LF y todas las interconexiones mediante desplazamientos individuales 5 (dentro de unos llmites dados), de manera que se minimiza la division o el batimiento de componentes tonales. Con este fin, la frecuencia de transicion, preferentemente, debe corresponderse con un mlnimo espectral local. Este paso se muestra en la fig. 12b, panel (2) y panel (3), en los que la frecuencia de transicion fx2 se desplaza hacia frecuencias mas altas, lo que da lugar a f’x2.
10 [0122] De acuerdo con otro aspecto de la invencion, si continua habiendo contenidos espectrales
problematicos en zonas de transicion, se elimina al menos uno de los componentes tonales mal colocados para reducir o bien la falla de batimiento en las frecuencias de transicion o bien el trino. Esto se realiza a traves de una extrapolacion espectral o interpolacion/filtrado, tal como se muestra en la figura 2, panel (3). De este modo, se elimina un componente tonal de punto de base a punto de base, es decir, desde su mlnimo local izquierdo hasta su 15 mlnimo local derecho. El espectro resultante tras la aplicacion de la tecnologla de la invencion se muestra en la fig. 12b, panel (4).
[0123] Expresado de otro modo, la fig. 12b ilustra, en la esquina superior izquierda, es decir, en el panel (1), la senal original. En la esquina superior derecha, es decir, en el panel (2), se muestra una senal comparativa de
20 ancho de banda ampliada con zonas problematicas marcadas con elipses 1220 y 1221. En la esquina inferior izquierda, es decir, en el panel (3), se ilustran dos caracterlsticas de procesamiento de recuadro de interconexion o frecuencia de recuadros. La division de porciones tonales se ha abordado aumentando el llmite de frecuencia fx2, de manera que deja de aparecer all! un recorte de la correspondiente porcion tonal. Ademas, se aplican funciones de ganancia 1030 para eliminar la porcion tonal 1031 y 1032 o, como otra posibilidad, se indica una interpolacion 25 ilustrada por 1033. Por ultimo, la esquina inferior derecha de la fig. 12b, es decir, el panel (4), ilustra la senal mejorada resultante de una combinacion del ajuste de frecuencia de interconexion/recuadro, por una parte, y la eliminacion o al menos la atenuacion de porciones tonales problematicas.
[0124] El panel (1) de la fig. 12b ilustra, tal como se explica anteriormente, el espectro original, y el espectro 30 original tiene un rango de frecuencia central hasta la frecuencia de cruce o relleno de espacios fxi.
[0125] De este modo, una frecuencia fxi ilustra una frecuencia llmite 1250 entre el rango de origen 1252 y un rango de reconstruccion 1254 que se extiende entre la frecuencia llmite 1250 y una frecuencia maxima que es mas pequena o igual que la frecuencia de Nyquist fNyquist. En el lado del codificador, se supone que una senal esta
35 limitada en ancho de banda en fxi o, cuando se aplica la tecnologla relativa al relleno inteligente de espacios, se supone que fx2 corresponde a la frecuencia de inicio de relleno de espacios 309 de la fig. 3a. Dependiendo de la tecnologla, el rango de reconstruccion por encima de fxi estara vaclo (en el caso de la implementacion de las figs. 13a y 13b) o comprendera ciertas primeras porciones espectrales que se codificaran con una alta resolution, tal como se explica en el contexto de la fig. 3a.
40
[0126] La fig. 12b, panel (2), ilustra una senal regenerada preliminar, por ejemplo, generada por el bloque 702 de la fig. 7a, que presenta dos porciones problematicas. Una porcion problematica se ilustra en 1220. La distancia de frecuencia entre la porcion tonal incluida en la zona central ilustrada en 1220a y la porcion tonal situada en el comienzo del recuadro de frecuencia ilustrado en 1220b es demasiado pequena como para que se cree una
45 falla de batimiento. El otro problema consiste en que, en el llmite superior del primer recuadro de frecuencia generado por la primera operation de interconexion u operation de formation de recuadros de frecuencia ilustrada en 1225 es una porcion tonal con un recorte intermedio o dividida 1226. Cuando esta porcion tonal 1226 se compara con las otras porciones tonales de la fig. 12b, se pone de manifiesto que el ancho es mas pequeno que el ancho de una tlpica porcion tonal y esto significa que esta porcion tonal ha quedado dividida al fijar el llmite de frecuencia 50 entre el primer recuadro de frecuencia 1225 y el segundo recuadro de frecuencia 1227 en el lugar equivocado del rango de origen 1252. Para abordar este problema, se ha modificado la frecuencia de llmite fx2 para hacerla un poco mayor que la ilustrada en el panel (3) de la fig. 12b, de manera que no se produzca un recorte de esta porcion tonal.
[0127] Por otra parte, este procedimiento, en el que se ha cambiado f'x2 no aborda de manera eficaz el 55 problema del batimiento que, por tanto, se aborda mediante la eliminacion de los componentes tonales mediante
filtrado o interpolacion o cualquier otro procedimiento, tal como se explica en el contexto del bloque 708 de la fig. 7a. Asl, la fig. 12b ilustra una aplicacion secuencial del ajuste de la frecuencia de transicion 706 y la eliminacion de componentes tonales en los llmites se ilustra en 708.
[0128] Otra opcion habrla consistido en fijar el if mite de transicion fxi, para que fuera un poco mas bajo, de
manera que la porcion tonal 1220a dejara de estar situada en el rango central. Despues, tambien se ha retirado o eliminado la porcion tonal 1220a fijando la frecuencia de transicion fxi en un valor mas bajo.
5 [0129] Este procedimiento tambien habrla funcionado para abordar el problema con el componente tonal
problematico 1032. Al fijar un fx2 incluso mas alto, la porcion espectral en la que esta situada la porcion tonal 1032 se podrla haber regenerado dentro de la primera operacion de interconexion 1225 y, por lo tanto, no habrlan aparecido dos porciones tonales adyacentes o contiguas.
10 [0130] Basicamente, el problema de batimiento depende de las amplitudes y la distancia en frecuencia de las
porciones tonales adyacentes. El detector 704, 720 o, expresado de forma mas general, el analizador 602 esta configurado preferentemente de manera que tambien se realiza un analisis de la porcion espectral inferior situada en la frecuencia que se encuentra por debajo de la frecuencia de transicion, como por ejemplo fxi, fx2, f’x2 con el fin de detectar un componente tonal. Ademas, tambien se analiza el rango espectral situado por encima de la frecuencia 15 de transicion con el fin de detectar un componente tonal. Cuando la deteccion da lugar a dos componentes tonales, uno a la izquierda de la frecuencia de transicion con respecto a la frecuencia, y otro a la derecha (con respecto a la frecuencia ascendente), se activa el eliminador de componentes tonales en los llmites que se ilustra en 708 de la fig. 7a. La deteccion de componentes tonales se lleva a cabo en un cierto rango de deteccion que se extiende en ambas direcciones, desde la frecuencia de transicion, al menos un 20% con respecto al ancho de banda de la banda 20 correspondiente y, preferentemente, solo se extiende hasta un 10% hacia abajo, a la izquierda de la frecuencia de transicion, y hacia arriba, a la derecha de la frecuencia de transicion en relacion con el ancho de banda correspondiente, es decir, el ancho de banda del rango de origen, por una parte, y el rango de reconstruccion, por otra, o, cuando la frecuencia de transicion es la frecuencia de transicion entre dos recuadros de frecuencia 1225, 1227, una cantidad correspondiente de un 10% del recuadro de frecuencia correspondiente. En otra realizacion, el 25 ancho de banda de deteccion predeterminado es un bark. Deberlan poderse eliminar porciones tonales dentro de un rango de un bark alrededor de un llmite interconexion, de manera que el rango completo de deteccion sea 2 bark, es decir, un bark en la banda inferior y un bark en la banda superior, en las que el bark de la banda inferior es inmediatamente adyacente a un bark de la banda superior.
30 [0131] De acuerdo con otro aspecto de la invencion, para reducir la falla de zumbido de filtrado, se aplica un
filtro de cruce en el dominio de frecuencia a dos zonas espectrales consecutivas, es decir, entre la banda central y la
primera interconexion o entre dos interconexiones. Preferentemente, el filtro de cruce es adaptable a la senal.
[0132] El filtro de cruce consiste en dos filtros, un filtro de disminucion progresiva de volumen hout, que se 35 aplica a la zona espectral inferior, y un filtro de aumento progresivo de volumen hn, que se aplica a la zona espectral
superior.
[0133] Cada uno de los filtros tiene una longitud N.
40 [0134] Ademas, la pendiente de ambos filtros se caracteriza por un valor adaptable a la senal denominado
Xbias que determina la caracterlstica de muesca del filtro de cruce, con 0 < Xbias < N:
Si Xbias = 0, entonces la suma de ambos filtros es igual a 1, es decir, no hay caracterlstica de filtro de muesca en el filtro resultante.
Si Xbias = N, entonces ambos filtros son completamente cero.
45
[0135] El diseno basico de los filtros de cruce esta limitado por las siguientes ecuaciones:
hout (k) = hin (N -1 - k), "Xbias
50 hout (k) + hin (k) = 1, Xbias = 0
siendo k = 0, 1, ..., N-1 el Indice de frecuencia. La fig. 12c muestra un ejemplo de dicho filtro de cruce.
[0136] En este ejemplo, se utiliza la siguiente ecuacion para crear el filtro hout:
hout (k) = 0,5 + 0,5-cosf-------k--------n |, k = 0,1,...,N -1 - Xbias
oun ' \ N -1 - Xbias )
[0137] La siguiente ecuacion describe el modo en que se aplican despues los filtros hn y hout,
Y(kt -(N -1) + k) = LF (kt -(N -1) + k) hout (k) + HF(kt -(N -1) + k}hin (k), k = 0,1,..., N -1 5
en la que Y denota el espectro ensamblado, kt es la frecuencia de transition, LF es el contenido de baja frecuencia y HF es el contenido de alta frecuencia.
[0138] A continuation, se presentara la prueba de la ventaja que ofrece esta tecnica. La senal original en los 10 siguientes ejemplos es una senal de tipo transitorio, en particular una version de la misma filtrada con un filtro de
paso bajo, con una frecuencia de corte de 22 kHz. En primer lugar, este transitorio esta limitado en banda a 6 kHz en el dominio de la transformada. A continuacion, el ancho de banda de la senal original filtrada con un filtro de paso bajo se amplla a 24 kHz. La ampliation de ancho de banda se logra copiando la banda LF tres veces para rellenar completamente el rango de frecuencias que se halla disponible por encima de 6 kHz dentro de la transformada.
15
[0139] La fig. 11a muestra el espectro de esta senal, que se puede considerar como un espectro tlpico de una falla de zumbido del filtro que rodea espectralmente el transitorio debido a dicha caracterlstica de “pared de ladrillo” o brick-wall de la transformada (picos de habla 1100). Aplicando el enfoque de la invention, se reduce el zumbido del filtro en aproximadamente 20 dB en cada frecuencia de transicion (picos de habla reducidos).
20
[0140] En las figs. 11b y 11c, se muestra el mismo efecto, aunque en una ilustracion diferente. La fig. 11b muestra el espectrograma de la citada senal de tipo transitorio con la falla de zumbido del filtro que precede y sucede temporalmente al transitorio tras aplicar la tecnica BWE descrita anteriormente sin ninguna reduction del zumbido del filtro. Cada una de las llneas horizontales representa el zumbido del filtro en la frecuencia de transicion
25 entre interconexiones consecutivas. La fig. 6 muestra la misma senal tras aplicar el enfoque de la invencion dentro de la BWE. Mediante la aplicacion de la reduccion del zumbido, se reduce el zumbido del filtro en aproximadamente 20 dB en comparacion con la senal que se muestra en la figura anterior.
[0141] A continuacion, se explican las figs. 14a y 14b con el fin de ilustrar aun mas el aspecto del filtro de 30 cruce de la invencion que ya se ha explicado en el contexto de la caracterlstica del analizador. No obstante, el filtro
de cruce 710 tambien se puede implementar independientemente de la invencion que se explica en el contexto de las figs. 6a-7b.
[0142] La fig. 14a ilustra un aparato para decodificar una senal de audio codificada que comprende una senal 35 central codificada e information sobre datos parametricos. El aparato comprende un decodificador central 1400 para
decodificar la senal central codificada a fin de obtener una senal central decodificada. La senal central decodificada puede estar limitada en el ancho de banda en el contexto de la implementation de la fig. 13a y la fig. 13b, o el decodificador central puede ser un codificador de rango de frecuencia completo o de tasa completa en el contexto de las figs. 1 a 5c o 9a-10d.
40
[0143] Ademas, hay un generador de recuadros 1404 para regenerar uno o mas recuadros espectrales con frecuencias no incluidas en la senal central decodificada que se generan a partir de una porcion espectral de la senal central decodificada. Los recuadros pueden ser unas segundas porciones espectrales reconstruidas dentro de una banda de reconstruction como se ilustra, por ejemplo, en el contexto de la fig. 3a, o que puede incluir unas primeras
45 porciones espectrales que se reconstruiran con una alta resolution, pero, como otra posibilidad, los recuadros espectrales tambien pueden comprender bandas de frecuencia completamente vaclas cuando el codificador ha llevado a cabo una limitation estricta de banda, tal como se ilustra en la fig. 13a.
[0144] Ademas, se proporciona un filtro de cruce 1406 para llevar a cabo un filtrado de cruce espectral con la 50 senal central decodificada y un primer recuadro de frecuencia con frecuencias que se extienden desde una
frecuencia de relleno de espacios 309 hasta una primera frecuencia de fin de recuadros o para el filtrado de cruce espectral de un primer recuadro de frecuencia 1225 y un segundo recuadro de frecuencia 1221, en el que el segundo recuadro de frecuencia presenta una frecuencia de llmite inferior que es adyacente en frecuencia a una frecuencia de llmite superior del primer recuadro de frecuencia 1225.
55
[0145] En otra implementacion, la senal de salida del filtro de cruce 1406 se introduce en un regulador de envolvente 1408 que aplica la informacion de la envolvente espectral parametrica incluida en una senal de audio codificada como informacion secundaria parametrica para obtener finalmente una senal regenerada y con envolvente ajustada. Los elementos 1404, 1406 y 1408 se pueden implementar como un regenerador de frecuencia,
como se ilustra, por ejemplo, en la fig. 13b, la fig. 1b o la fig. 6a.
[0146] La fig. 14b ilustra otra implementacion del filtro de cruce 1406. El filtro de cruce 1406 comprende un subfiltro de disminucion progresiva de volumen que recibe una primera serial de entrada IN1, y un segundo subfiltro
5 de aumento progresivo de volumen 1422 que recibe una segunda entrada IN2 y los resultados o salidas de ambos filtros 1420 y 1422 se ponen a disposicion de un combinador 1424 que, por ejemplo, es un sumador. El sumador o combinador 1424 genera como salida los valores espectrales para los bins de frecuencia. La fig. 12c ilustra un ejemplo de funcion de atenuacion cruzada que comprende la caracterlstica de subfiltro de disminucion progresiva de volumen 1420a y la caracterlstica de subfiltro de aumento progresivo de volumen 1422a. Ambos filtros presentan un 10 cierto solapamiento en el ejemplo de la fig. 12c igual a 21, es decir N = 21. De este modo, otros valores de frecuencia o, por ejemplo, la zona de origen 1252 no se ven afectados. Solo los bins de frecuencia mas alta 21 del rango de origen 1252 se ven afectados por la funcion de disminucion progresiva de volumen 1420a.
[0147] Por otra parte, solo las llneas de frecuencia mas baja 21 del primer recuadro de frecuencia 1225 se 15 ven afectadas por la funcion de aumento progresivo de volumen 1420a.
[0148] Ademas, se pone de manifiesto por las funciones de atenuacion cruzada que las llneas de frecuencia entre 9 y 13 se ven afectadas, pero la funcion de aumento progresivo de volumen en realidad no afecta a las llneas de frecuencia entre 1 y 9 y la funcion de disminucion progresiva de volumen 1420a no afecta a las llneas de
20 frecuencia entre 13 y 21. Esto significa que solo serla necesario un solapamiento entre las llneas de frecuencia 9 y 13, y la frecuencia de cruce, como por ejemplo fxi, se colocarla en la muestra de frecuencia o el bin de frecuencia 11. De este modo, solo se requerirla un solapamiento de dos bins de frecuencia o valores de frecuencia entre el rango de origen y el primer recuadro de frecuencia para implementar la funcion de cruce o de atenuacion cruzada.
25 [0149] Dependiendo de la implementacion concreta, se puede aplicar un solapamiento mayor o menor y,
ademas, se pueden utilizar otras funciones de atenuacion aparte de la funcion coseno. Ademas, como se ilustra en la fig. 12c, es preferible aplicar una cierta muesca en el rango de cruce. Expresado de un modo diferente, la potencia en los rangos de llmite se reducira debido al hecho de que ambas funciones de filtro no suman una unidad, como serla el caso en una funcion de atenuacion sin muesca. Esta perdida de potencia para los llmites del recuadro de 30 frecuencia, es decir, el primer recuadro de frecuencia, se atenuara en el llmite inferior y el llmite superior, y las potencias se concentraran mas en el medio de las bandas. No obstante, debido al hecho de que el ajuste de la envolvente espectral tiene lugar posteriormente al procesamiento realizado por el filtro de cruce, la frecuencia total no se toca, pero se define por los datos de la envolvente espectral, tales como los factores de ajuste de escala correspondientes, tal como se explica en el contexto de la fig. 3a. Expresado de otro modo, la calculadora 918 de la 35 fig. 9b calcularla entonces el “rango de destino en bruto ya generado”, que consiste en la salida del filtro de cruce. Ademas, tambien se compensarla la perdida de potencia debida a la eliminacion de una porcion tonal mediante interpolacion, debido al hecho de que esta eliminacion da lugar entonces a una potencia de recuadro mas baja y el factor de ganancia para la banda de reconstruccion completa sera mas alto. No obstante, por otra parte, la frecuencia de cruce da lugar a una concentracion de potencia mas hacia el medio de un recuadro de frecuencia y 40 esto, al final, reduce de manera eficaz las fallas, causadas especialmente por los transitorios, como se explica en el contexto de las figs. 11 a-11 c.
[0150] La fig. 14b ilustra diferentes combinaciones de entradas. Para un filtrado en el llmite entre el rango de frecuencia de origen y el recuadro de frecuencia, la entrada 1 es la porcion espectral superior del rango central y la
45 entrada 2 es la porcion espectral inferior del primer recuadro de frecuencia o del recuadro de frecuencia individual, cuando solo existe un recuadro de frecuencia individual. Ademas, la entrada puede ser el primer recuadro de frecuencia y la frecuencia de transicion puede ser el llmite de frecuencia superior del primer recuadro y la entrada en el subfiltro 1422 sera la porcion inferior del segundo recuadro de frecuencia. Cuando tambien existe un tercer recuadro de frecuencia, otra frecuencia de transicion constituira el llmite de frecuencia entre el segundo recuadro de 50 frecuencia y el tercer recuadro de frecuencia y la entrada en el subfiltro de disminucion progresiva de volumen 1421 constituira el rango espectral superior del segundo recuadro de frecuencia determinado por el parametro de filtrado, cuando se utiliza la caracterlstica de la fig. 12c, y la entrada en el subfiltro de aumento progresivo de volumen 1422 sera la porcion inferior del tercer recuadro de frecuencia y, en el ejemplo de la fig. 12c, las llneas espectrales mas bajas 21.
55
[0151] Como se ilustra en la fig. 12c, es preferible que el parametro N sea igual para el subfiltro de disminucion progresiva de volumen, sin embargo, no es necesario. Los valores para N pueden variar y, entonces, el resultado sera que la “muesca” del filtro sera asimetrica entre el rango inferior y el superior. Ademas, las funciones de disminucion progresiva de volumen/aumento progresivo de volumen no tienen que estar necesariamente en la
misma caracterlstica que en la fig. 12c. En lugar de ello, tambien se pueden utilizar caracterlsticas asimetricas.
[0152] Ademas, es preferible hacer que la caracterlstica del filtro de cruce sea adaptable a la senal. Por lo tanto, basandose en un analisis de la senal, se adapta la caracterlstica del filtro. Debido al hecho de que el filtro de
5 cruce resulta especialmente util para las senales transitorias, se detecta si aparecen senales transitorias. Cuando aparecen senales transitorias, se puede utilizar una caracterlstica de filtro como la que se ilustra en la fig. 12c. Sin embargo, cuando se detecta una senal no transitoria, es preferible cambiar la caracterlstica del filtro para reducir la influencia del filtro de cruce. Esto se podrla obtener, por ejemplo, fijando N en cero o fijando Xbias en cero, de manera que la suma de ambos filtros sea igual a 1, es decir, que en el filtro resultante no hay ninguna caracterlstica 10 de filtro de muesca. Otra posibilidad consiste, simplemente, en saltarse el filtro de cruce 1406 en el caso de senales no transitorias. No obstante, preferentemente, se prefiere una caracterlstica de filtro de cambio relativamente lento mediante el cambio de los parametros N, Xbas con el fin de evitar fallas creadas por el cambio rapido de las caracterlsticas del filtro. Ademas, es preferible un filtro de paso bajo para permitir unicamente dichos cambios relativamente pequenos en las caracterlsticas del filtro aunque la senal este cambiando mas rapidamente de lo que 15 detecta cierto detector de transitorios/tonalidad. El detector se ilustra en 1405 de la fig. 14a. Puede recibir una senal de entrada en un generador de recuadros o una senal de salida del generador de recuadros 1404 o incluso se puede conectar al decodificador central 1400 para obtener una informacion de transitorio/no transitorio como, por ejemplo, una indicacion de bloque corto procedente, por ejemplo, de la decodificacion AAC. Como es natural, tambien se puede utilizar cualquier otro filtro de cruce diferente al que se muestra en la fig. 12c.
20
[0153] Despues, basandose en la deteccion de transitorios, o basandose en una deteccion de tonalidad, o basandose en cualquier otra deteccion de caracterlsticas de la senal, se cambia la caracterlstica del filtro de cruce 1406 tal como se explica.
25 [0154] Aunque algunos aspectos se han descrito en el contexto de un aparato para codificar o decodificar, es
evidente que estos aspectos tambien representan una descripcion del procedimiento correspondiente, en el que un bloque o dispositivo corresponde a un paso del procedimiento o a una caracterlstica de un paso del procedimiento. De forma analoga, los aspectos descritos en el contexto de un paso del procedimiento tambien representan una descripcion de un bloque o elemento o caracterlstica correspondiente de un aparato correspondiente. Algunos o 30 todos los pasos se pueden ejecutar mediante (o empleando) un aparato de hardware como, por ejemplo, un microprocesador, un ordenador programable o un circuito electronico. En algunas realizaciones, se pueden ejecutar uno o mas de los pasos mas importantes del procedimiento mediante dicho aparato.
[0155] Dependiendo de ciertos requisitos de implementacion, las realizaciones de la presente invencion se 35 pueden implementar en hardware o en software. La implementacion se puede llevar a cabo empleando un medio de
almacenamiento no transitorio, como, por ejemplo, un medio de almacenamiento digital, por ejemplo un disco flexible, una unidad de disco duro (HDD), un DVD, un BluRay, un CD, una ROM, una PROM, y una memoria EPROM, EEPROM o flash, con unas senales de control legibles electronicamente almacenadas en las mismas, que cooperan (o son capaces de cooperar) con un sistema informatico programable, de manera que se lleve cabo el 40 respectivo procedimiento. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.
[0156] Algunas realizaciones de acuerdo con la invencion comprenden un soporte de datos provisto de senales de control legibles electronicamente, que son capaces de cooperar con un sistema informatico programable, de manera que se lleva a cabo uno de los procedimientos descritos en la presente memoria.
45
[0157] En general, las realizaciones de la presente invencion se pueden implementar como producto de programa informatico con un codigo de programa, siendo el codigo de programa capaz de llevar a cabo uno de procedimientos cuando el producto de programa informatico se ejecuta en un ordenador. El codigo del programa puede almacenarse, por ejemplo, en un soporte legible por maquina.
50
[0158] Otras realizaciones comprenden el programa informatico para llevar a cabo uno de los procedimientos descritos en la presente memoria, almacenado en un soporte legible por maquina.
[0159] Expresado de otro modo, una realizacion del procedimiento de la invencion consiste, por tanto, en un 55 programa informatico con un codigo de programa para llevar a cabo uno de los procedimientos descritos en la
presente memoria, cuando el programa informatico se ejecuta en un ordenador.
[0160] Por tanto, otra realizacion del procedimiento de la invencion consiste en un soporte de datos (o un medio de almacenamiento digital, o un medio legible por ordenador) que comprende, grabado en el mismo, el
programa informatico para llevar a cabo uno de los procedimientos descritos en la presente memoria. Normalmente, el soporte de datos, el medio de almacenamiento digital o el medio grabado son tangibles y no transitorios.
[0161] Otra realizacion de la invention consiste, por tanto, en una corriente de datos o una secuencia de 5 senales que representan el programa informatico para llevar a cabo uno de los procedimientos descritos en la
presente memoria. La corriente de datos o la secuencia de senales puede, por ejemplo, estar configurada para ser transferida a traves de una conexion de comunicacion de datos, por ejemplo, a traves de Internet.
[0162] Otra realizacion comprende unos medios de procesamiento, por ejemplo, un ordenador o un 10 dispositivo logico programable, configurado o adaptado para llevar a cabo uno de los procedimientos descritos en la
presente memoria.
[0163] Otra realizacion comprende un ordenador en el que esta instalado el programa informatico para llevar a cabo uno de los procedimientos descritos en la presente memoria.
15
[0164] Otra realizacion de acuerdo con la invencion comprende un aparato o un sistema configurado para transferir (por ejemplo, de forma electronica u optica) a un receptor un programa informatico para llevar a cabo uno de los procedimientos descritos en la presente memoria. El receptor puede ser, por ejemplo, un ordenador, un dispositivo movil, un dispositivo de memoria o similar. El aparato o sistema puede comprender, por ejemplo, un
20 servidor de archivos para transferir el programa informatico al receptor.
[0165] En algunas realizaciones, se puede utilizar un dispositivo logico programable (por ejemplo, una matriz de puertas programables in situ) para llevar a cabo algunas de las funcionalidades, o todas, de los procedimientos descritos en la presente memoria. En algunas realizaciones, una matriz de puertas programables in situ puede
25 cooperar con un microprocesador con el fin de llevar a cabo uno de los procedimientos descritos en la presente memoria. Por lo general, los procedimientos se llevan a cabo preferentemente mediante cualquier aparato de hardware.
[0166] Las realizaciones descritas anteriormente tienen un caracter meramente ilustrativo de los principios de 30 la presente invencion. Se entiende que para los expertos en la materia resultaran evidentes modificaciones y
variaciones de las disposiciones y los detalles descritos en la presente memoria. Por lo tanto, se pretende que solo quede limitada por el alcance de las siguientes reivindicaciones de patente y no por los detalles concretos presentados a modo de description y explication de las realizaciones de la presente memoria.

Claims (14)

  1. REIVINDICACIONES
    1. Aparato para decodificar una senal de audio codificada que comprende una senal central codificada (1), que comprende:
    5
    un decodificador central (1400) configurado para decodificar la senal central codificada (1401) para obtener una senal central decodificada;
    0 de un rango de cruce que se extiende a lo largo de al menos tres valores de frecuencia o para llevar a cabo una adicion ponderada por frecuencia (1424) de al menos una parte de un primer recuadro de frecuencia filtrado 10 mediante el subfiltro de disminucion progresiva de volumen (1420) y al menos una parte de un segundo recuadro de frecuencia filtrada mediante el subfiltro de aumento progresivo de volumen (1422) dentro de un rango de cruce que se extiende a lo largo de al menos tres valores de frecuencia.
  2. 2. Aparato de la reivindicacion 1,
    15
    en el que una porcion espectral de la senal central decodificada, una porcion espectral del primer recuadro de frecuencia o una porcion espectral del segundo recuadro de frecuencia afectada por el filtro de cruce (1406) tienen un tamano inferior al 30% de la porcion espectral abarcada por una banda espectral total de la banda de frecuencia central decodificada o una banda espectral total del primer o el segundo recuadro de frecuencia y es mayor o igual 20 que una banda definida por al menos 5 valores de frecuencia adyacentes.
  3. 3. Aparato de las reivindicaciones 1 y 2,
    en el que el filtro de cruce (1406) esta configurado para aplicar una caracterlstica de filtro de tipo coseno para la 25 disminucion progresiva de volumen y el aumento progresivo de volumen.
  4. 4. Aparato de acuerdo con una de las reivindicaciones anteriores que comprende un regulador de envolvente (1408) configurado para ajustar la envolvente de una senal espectral filtrada con un filtro de cruce en un rango espectral definido por unos rangos espectrales de los uno o mas recuadros espectrales a partir de una
    30 informacion de envolvente espectral parametrica (1407) incluida en la senal de audio codificada.
  5. 5. Aparato de acuerdo con una de las reivindicaciones anteriores,
    que ademas comprende un convertidor de frecuencia-tiempo (828) configurado para convertir una senal con 35 envolvente ajustada junto con la senal central decodificada en una representation temporal.
  6. 6. Aparato de acuerdo con la reivindicacion 5, en el que el convertidor de frecuencia-tiempo esta configurado para aplicar una transformada de coseno discreta modificada (512, 514, 516) que comprende un procesamiento de solapamiento/adicion (516) de un cuadro actual con un cuadro de un tiempo anterior.
    40
  7. 7. Aparato de acuerdo con una de las reivindicaciones anteriores, en el que el filtro de cruce es un filtro controlable,
    en el que el aparato comprende ademas un detector de caracterlsticas de senales (1405), y 45
    en el que el detector de caracterlsticas de senales (1405) esta configurado para controlar una caracterlstica de filtro del filtro de cruce (1406) de acuerdo con un resultado de detection obtenido a partir de la senal central decodificada.
  8. 8. Aparato de la reivindicacion 7,
    50
    en el que el detector de caracterlsticas de la senal (1405) es un detector de transitorios, y en el que el detector de transitorios (1405) esta configurado para controlar el filtro de cruce de manera que, para una porcion de senal mas transitoria, el filtro de cruce produce un primer efecto en una senal de entrada de filtro de cruce, y el filtro de cruce (1406) produce un segundo efecto sobre la senal de entrada del filtro de cruce para una porcion de senal menos 55 transitoria, en las que el primer efecto es mayor que el segundo efecto.
  9. 9. Aparato de acuerdo con una de las reivindicaciones anteriores,
    en el que una caracterlstica del filtro de cruce (1406) se define por una caracterlstica de subfiltro de disminucion
    progresiva de volumen (1420a) y una caracterlstica de subfiltro de aumento progresivo de volumen (1422a),
    en el que la caracterlstica de subfiltro de aumento progresivo de volumen hin(k) y la caracterlstica de subfiltro de disminucion progresiva de volumen hout(k) se definen basandose en las siguientes ecuaciones:
    5
    hout (k) = hin (N -1 - k), "Xbias hout (k) + hin (k) = 1, Xbias = 0
    10 hout(k) = 0,5 + 0,5-cosf---k----n |,k = 0,1,...,N-1 -Xbias
    oun ’ y N -1 - Xbias ]
    en las que Xbias es un numero entero que define una pendiente de ambos filtros que se extiende entre cero y un numero entero N, en las que k es un Indice de frecuencia que se extiende entre cero y N-1, y en el que N es otro numero entero, y en las que diferentes valores para N y Xbias dan lugar a diferentes caracterlsticas del filtro de 15 cruce.
  10. 10. Aparato de la reivindicacion 9,
    en el que Xbias se fija entre 2 y 20 y en el que N se fija entre 10 y 50.
    20
  11. 11. Aparato de acuerdo con una de las reivindicaciones anteriores,
    en el que el generador de recuadros (1404) esta configurado para generar un recuadro de frecuencia preliminar (703), en el que un analizador (702) esta configurado para analizar el primer recuadro de frecuencia preliminar, en el 25 que el generador de recuadros tambien esta configurado para generar una senal regenerada con porciones tonales atenuadas o eliminadas en relacion con el recuadro de frecuencia preliminar, en el que el generador de recuadros esta configurado para eliminar o atenuar las porciones tonales cerca de los llmites del recuadro de frecuencia (708) para obtener una senal de entrada en el filtro de cruce (1406).
    30 12. Aparato de la reivindicacion 11, en el que el generador de recuadros esta configurado para detectar y
    eliminar o atenuar porciones espectrales tonales dentro de un rango de deteccion inferior al 20% de un ancho de banda de un recuadro de frecuencia o un rango de origen para la regeneracion.
  12. 13. Aparato de una de las reivindicaciones anteriores, en el que el filtro de cruce (1406) esta configurado 35 para realizar un filtrado de cruce dentro de un rango de solapamiento, y el rango de solapamiento comprende una
    porcion de frecuencia superior de la senal central decodificada y una porcion de frecuencia inferior del primer recuadro de frecuencia o,
    en el que el filtro de cruce (1406) esta configurado para realizar un filtrado de cruce dentro de un rango de 40 solapamiento y el rango de solapamiento comprende una porcion de frecuencia superior de un primer recuadro de frecuencia y una porcion de frecuencia inferior de un segundo recuadro de frecuencia.
  13. 14. Procedimiento de decodificacion de una senal de audio codificada que comprende una senal central codificada (1), que comprende:
    45
    decodificacion (1400) de la senal central codificada (1401) para obtener una senal central decodificada; generacion (1404) de uno o mas recuadros espectrales con frecuencias no incluidas en la senal central decodificada a partir de una porcion espectral de la senal central decodificada; y
    filtrado de cruce espectral, mediante un filtro de cruce (1406), de la senal central decodificada y un primer recuadro 50 de frecuencia con frecuencias que se extienden desde una frecuencia de relleno de espacios (309) hasta una frecuencia de llmite superior o para realizar un filtrado de cruce espectral de un primer recuadro de frecuencia y un segundo recuadro de frecuencia,
    en el que el filtro de cruce (1406) esta configurado para llevar a cabo una adicion ponderada por frecuencia (1424) de la senal central decodificada filtrada mediante un subfiltro de disminucion progresiva de volumen (1420) y al 55 menos una porcion del primer recuadro de frecuencia filtrada por un subfiltro de aumento progresivo de volumen (1422) dentro de un rango de cruce que se extiende a lo largo de al menos tres valores de frecuencia o para llevar a
    cabo una adicion ponderada por frecuencia (1424) de al menos una parte de un primer recuadro de frecuencia filtrado mediante el subfiltro de disminucion progresiva de volumen (1420) y al menos una parte de un segundo recuadro de frecuencia filtrada mediante el subfiltro de aumento progresivo de volumen (1422) dentro de un rango de cruce que se extiende a lo largo de al menos tres valores de frecuencia.
    5
  14. 15. Programa informatico para llevar a cabo, cuando se ejecuta en un ordenador o procesador, el
    procedimiento de la reivindicacion 14.
ES14741264.7T 2013-07-22 2014-07-15 Aparato y procedimiento para decodificar una señal de audio codificada mediante un filtro de cruce en torno a una frecuencia de transición Active ES2638498T3 (es)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
EP13177353 2013-07-22
EP13177346 2013-07-22
EP13177350 2013-07-22
EP13177350 2013-07-22
EP13177348 2013-07-22
EP13177346 2013-07-22
EP13177353 2013-07-22
EP13177348 2013-07-22
EP13189389 2013-10-18
EP13189389.3A EP2830065A1 (en) 2013-07-22 2013-10-18 Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
PCT/EP2014/065112 WO2015010950A1 (en) 2013-07-22 2014-07-15 Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency

Publications (1)

Publication Number Publication Date
ES2638498T3 true ES2638498T3 (es) 2017-10-23

Family

ID=49385156

Family Applications (9)

Application Number Title Priority Date Filing Date
ES14741264.7T Active ES2638498T3 (es) 2013-07-22 2014-07-15 Aparato y procedimiento para decodificar una señal de audio codificada mediante un filtro de cruce en torno a una frecuencia de transición
ES14738854T Active ES2728329T3 (es) 2013-07-22 2014-07-15 Aparato y método para decodificar o codificar una señal de audio utilizando valores de información para una banda de reconstrucción
ES14738857.3T Active ES2599007T3 (es) 2013-07-22 2014-07-15 Aparato y método para codificar y decodificar una señal de audio codificada utilizando modelado de ruido/parche temporal
ES18180168T Active ES2827774T3 (es) 2013-07-22 2014-07-15 Codificador de audio y método relacionado usando procesamiento de dos canales dentro de un marco de referencia de relleno inteligente de espacios
ES14738853T Active ES2908624T3 (es) 2013-07-22 2014-07-15 Aparato y procedimiento para codificar y decodificar una señal de audio con relleno inteligente de espacios en el dominio espectral
ES19157850T Active ES2959641T3 (es) 2013-07-22 2014-07-15 Aparato y método para decodificar o codificar una señal de audio utilizando valores de información para una banda de reconstrucción
ES14739161.9T Active ES2667221T3 (es) 2013-07-22 2014-07-15 Aparato y método para decodificar y codificar una señal de audio utilizando selección de mosaicos espectrales adaptativos
ES14739811T Active ES2813940T3 (es) 2013-07-22 2014-07-15 Aparato, método y programa informático para decodificar una señal de audio codificada
ES14739160T Active ES2698023T3 (es) 2013-07-22 2014-07-15 Decodificador de audio y método relacionado que usan procesamiento de dos canales dentro de un marco de relleno inteligente de huecos

Family Applications After (8)

Application Number Title Priority Date Filing Date
ES14738854T Active ES2728329T3 (es) 2013-07-22 2014-07-15 Aparato y método para decodificar o codificar una señal de audio utilizando valores de información para una banda de reconstrucción
ES14738857.3T Active ES2599007T3 (es) 2013-07-22 2014-07-15 Aparato y método para codificar y decodificar una señal de audio codificada utilizando modelado de ruido/parche temporal
ES18180168T Active ES2827774T3 (es) 2013-07-22 2014-07-15 Codificador de audio y método relacionado usando procesamiento de dos canales dentro de un marco de referencia de relleno inteligente de espacios
ES14738853T Active ES2908624T3 (es) 2013-07-22 2014-07-15 Aparato y procedimiento para codificar y decodificar una señal de audio con relleno inteligente de espacios en el dominio espectral
ES19157850T Active ES2959641T3 (es) 2013-07-22 2014-07-15 Aparato y método para decodificar o codificar una señal de audio utilizando valores de información para una banda de reconstrucción
ES14739161.9T Active ES2667221T3 (es) 2013-07-22 2014-07-15 Aparato y método para decodificar y codificar una señal de audio utilizando selección de mosaicos espectrales adaptativos
ES14739811T Active ES2813940T3 (es) 2013-07-22 2014-07-15 Aparato, método y programa informático para decodificar una señal de audio codificada
ES14739160T Active ES2698023T3 (es) 2013-07-22 2014-07-15 Decodificador de audio y método relacionado que usan procesamiento de dos canales dentro de un marco de relleno inteligente de huecos

Country Status (20)

Country Link
US (24) US10332539B2 (es)
EP (20) EP2830065A1 (es)
JP (12) JP6389254B2 (es)
KR (7) KR101826723B1 (es)
CN (12) CN112466312B (es)
AU (7) AU2014295302B2 (es)
BR (12) BR122022010960B1 (es)
CA (8) CA2918701C (es)
ES (9) ES2638498T3 (es)
HK (1) HK1211378A1 (es)
MX (7) MX354657B (es)
MY (5) MY187943A (es)
PL (8) PL3506260T3 (es)
PT (7) PT3017448T (es)
RU (7) RU2651229C2 (es)
SG (7) SG11201502691QA (es)
TR (1) TR201816157T4 (es)
TW (7) TWI555008B (es)
WO (7) WO2015010947A1 (es)
ZA (5) ZA201502262B (es)

Families Citing this family (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2610293C2 (ru) * 2012-03-29 2017-02-08 Телефонактиеболагет Лм Эрикссон (Пабл) Расширение полосы частот гармонического аудиосигнала
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
KR101790641B1 (ko) * 2013-08-28 2017-10-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 하이브리드 파형-코딩 및 파라미터-코딩된 스피치 인핸스
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
US9741349B2 (en) 2014-03-14 2017-08-22 Telefonaktiebolaget L M Ericsson (Publ) Audio coding method and apparatus
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
WO2016091893A1 (en) 2014-12-09 2016-06-16 Dolby International Ab Mdct-domain error concealment
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI856342B (zh) * 2015-03-13 2024-09-21 瑞典商杜比國際公司 音訊處理單元、用於將經編碼的音訊位元流解碼之方法以及非暫態電腦可讀媒體
GB201504403D0 (en) 2015-03-16 2015-04-29 Microsoft Technology Licensing Llc Adapting encoded bandwidth
EP3107096A1 (en) * 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3405949B1 (en) * 2016-01-22 2020-01-08 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for estimating an inter-channel time difference
CN117542365A (zh) * 2016-01-22 2024-02-09 弗劳恩霍夫应用研究促进协会 用于具有全局ild和改进的中/侧决策的mdct m/s立体声的装置和方法
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
DE102016104665A1 (de) 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
US10741196B2 (en) 2016-03-24 2020-08-11 Harman International Industries, Incorporated Signal quality-based enhancement and compensation of compressed audio signals
US10141005B2 (en) 2016-06-10 2018-11-27 Apple Inc. Noise detection and removal systems, and related methods
EP3475944B1 (en) 2016-06-22 2020-07-15 Dolby International AB Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
US10812550B1 (en) * 2016-08-03 2020-10-20 Amazon Technologies, Inc. Bitrate allocation for a multichannel media stream
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
US9679578B1 (en) 2016-08-31 2017-06-13 Sorenson Ip Holdings, Llc Signal clipping compensation
EP3306609A1 (en) * 2016-10-04 2018-04-11 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for determining a pitch information
US10362423B2 (en) * 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
EP3324406A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
JP6769299B2 (ja) * 2016-12-27 2020-10-14 富士通株式会社 オーディオ符号化装置およびオーディオ符号化方法
US10304468B2 (en) 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
US10090892B1 (en) * 2017-03-20 2018-10-02 Intel Corporation Apparatus and a method for data detecting using a low bit analog-to-digital converter
US10354669B2 (en) 2017-03-22 2019-07-16 Immersion Networks, Inc. System and method for processing audio data
EP3382701A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
EP3382700A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3382704A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
RU2727794C1 (ru) 2017-05-18 2020-07-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Управляющее сетевое устройство
US11550665B2 (en) 2017-06-02 2023-01-10 Apple Inc. Techniques for preserving clone relationships between files
US11545164B2 (en) * 2017-06-19 2023-01-03 Rtx A/S Audio signal encoding and decoding
JP7257975B2 (ja) 2017-07-03 2023-04-14 ドルビー・インターナショナル・アーベー 密集性の過渡事象の検出及び符号化の複雑さの低減
JP6904209B2 (ja) * 2017-07-28 2021-07-14 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
BR112020008216A2 (pt) * 2017-10-27 2020-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. aparelho e seu método para gerar um sinal de áudio intensificado, sistema para processar um sinal de áudio
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483882A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
TWI702594B (zh) 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
DE112018006786B4 (de) * 2018-02-09 2021-12-23 Mitsubishi Electric Corporation Audiosignal-Verarbeitungsvorrichtung und Audiosignal-Verarbeitungsverfahren
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
EP3576088A1 (en) * 2018-05-30 2019-12-04 Fraunhofer Gesellschaft zur Förderung der Angewand Audio similarity evaluator, audio encoder, methods and computer program
AU2019298307A1 (en) 2018-07-04 2021-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multisignal audio coding using signal whitening as preprocessing
CN109088617B (zh) * 2018-09-20 2021-06-04 电子科技大学 比率可变数字重采样滤波器
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
EP3671741A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
CN113348507B (zh) * 2019-01-13 2025-02-21 华为技术有限公司 高分辨率音频编解码
JP7262593B2 (ja) * 2019-01-13 2023-04-21 華為技術有限公司 ハイレゾリューションオーディオ符号化
KR102470429B1 (ko) * 2019-03-14 2022-11-23 붐클라우드 360 인코포레이티드 우선순위에 의한 공간 인식 다중 대역 압축 시스템
CN110265043B (zh) * 2019-06-03 2021-06-01 同响科技股份有限公司 自适应有损或无损的音频压缩和解压缩演算方法
WO2020253941A1 (en) * 2019-06-17 2020-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs
MX2022001162A (es) 2019-07-30 2022-02-22 Dolby Laboratories Licensing Corp Coordinacion de dispositivos de audio.
DE102020210917B4 (de) 2019-08-30 2023-10-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung eingetragener Verein Verbesserter M/S-Stereo-Codierer und -Decodierer
TWI702780B (zh) * 2019-12-03 2020-08-21 財團法人工業技術研究院 提升共模瞬變抗擾度的隔離器及訊號產生方法
CN111862953B (zh) * 2019-12-05 2023-08-22 北京嘀嘀无限科技发展有限公司 语音识别模型的训练方法、语音识别方法及装置
US11158297B2 (en) * 2020-01-13 2021-10-26 International Business Machines Corporation Timbre creation system
CN113192517B (zh) * 2020-01-13 2024-04-26 华为技术有限公司 一种音频编解码方法和音频编解码设备
US20230085013A1 (en) * 2020-01-28 2023-03-16 Hewlett-Packard Development Company, L.P. Multi-channel decomposition and harmonic synthesis
CN111199743B (zh) * 2020-02-28 2023-08-18 Oppo广东移动通信有限公司 音频编码格式确定方法、装置、存储介质及电子设备
CN111429925B (zh) * 2020-04-10 2023-04-07 北京百瑞互联技术有限公司 一种降低音频编码速率的方法及系统
CN113593586B (zh) * 2020-04-15 2025-01-10 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备
CN111371459B (zh) * 2020-04-26 2023-04-18 宁夏隆基宁光仪表股份有限公司 一种适用于智能电表的多操作高频替换式数据压缩方法
CN113782040B (zh) * 2020-05-22 2024-07-30 华为技术有限公司 基于心理声学的音频编码方法及装置
CN113808596B (zh) 2020-05-30 2025-01-03 华为技术有限公司 一种音频编码方法和音频编码装置
CN113808597B (zh) * 2020-05-30 2024-10-29 华为技术有限公司 一种音频编码方法和音频编码装置
EP4193357A1 (en) * 2020-08-28 2023-06-14 Google LLC Maintaining invariance of sensory dissonance and sound localization cues in audio codecs
CN113113033B (zh) * 2021-04-29 2025-03-07 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、设备及可读存储介质
CN113365189B (zh) * 2021-06-04 2022-08-05 上海傅硅电子科技有限公司 多声道无缝切换方法
CN115472171B (zh) * 2021-06-11 2024-11-22 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序
CN113593604B (zh) * 2021-07-22 2024-07-19 腾讯音乐娱乐科技(深圳)有限公司 检测音频质量方法、装置及存储介质
TWI794002B (zh) * 2022-01-28 2023-02-21 緯創資通股份有限公司 多媒體系統以及多媒體操作方法
CN114582361B (zh) * 2022-04-29 2022-07-08 北京百瑞互联技术有限公司 基于生成对抗网络的高解析度音频编解码方法及系统
EP4500524A1 (en) * 2022-05-17 2025-02-05 Google LLC Asymmetric and adaptive strength for windowing at encoding and decoding time for audio compression
WO2024085551A1 (ko) * 2022-10-16 2024-04-25 삼성전자주식회사 패킷 손실 은닉을 위한 전자 장치 및 방법

Family Cites Families (266)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
US6289308B1 (en) 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
JP3465697B2 (ja) * 1993-05-31 2003-11-10 ソニー株式会社 信号記録媒体
CA2140779C (en) 1993-05-31 2005-09-20 Kyoya Tsutsui Method, apparatus and recording medium for coding of separated tone and noise characteristics spectral components of an acoustic signal
TW272341B (es) * 1993-07-16 1996-03-11 Sony Co Ltd
GB2281680B (en) * 1993-08-27 1998-08-26 Motorola Inc A voice activity detector for an echo suppressor and an echo suppressor
BE1007617A3 (nl) * 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5502713A (en) * 1993-12-07 1996-03-26 Telefonaktiebolaget Lm Ericsson Soft error concealment in a TDMA radio system
JPH07336231A (ja) * 1994-06-13 1995-12-22 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
EP0732687B2 (en) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
EP0820624A1 (en) 1995-04-10 1998-01-28 Corporate Computer Systems, Inc. System for compression and decompression of audio signals for digital transmission
JP3747492B2 (ja) 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6253172B1 (en) * 1997-10-16 2001-06-26 Texas Instruments Incorporated Spectral transformation of acoustic signals
US5913191A (en) 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6253165B1 (en) * 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
US6453289B1 (en) 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US6061555A (en) 1998-10-21 2000-05-09 Parkervision, Inc. Method and system for ensuring reception of a communications signal
US6400310B1 (en) * 1998-10-22 2002-06-04 Washington University Method and apparatus for a tunable high-resolution spectral estimator
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
JP3762579B2 (ja) 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
KR100675309B1 (ko) * 1999-11-16 2007-01-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 광대역 오디오 송신 시스템, 송신기, 수신기, 코딩 디바이스, 디코딩 디바이스와, 송신 시스템에서 사용하기 위한 코딩 방법 및 디코딩 방법
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
AU2001284910B2 (en) * 2000-08-16 2007-03-22 Dolby Laboratories Licensing Corporation Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
US7003467B1 (en) 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US20020128839A1 (en) 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
WO2002058053A1 (en) 2001-01-22 2002-07-25 Kanars Data Corporation Encoding method and decoding method for digital voice data
JP2002268693A (ja) 2001-03-12 2002-09-20 Mitsubishi Electric Corp オーディオ符号化装置
SE522553C2 (sv) 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
US6934676B2 (en) 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
MXPA03002115A (es) * 2001-07-13 2003-08-26 Matsushita Electric Ind Co Ltd DISPOSITIVO DE DECODIFICACION Y CODIFICACION DE SEnAL DE AUDIO.
EP1446797B1 (en) * 2001-10-25 2007-05-23 Koninklijke Philips Electronics N.V. Method of transmission of wideband audio signals on a transmission channel with reduced bandwidth
JP3923783B2 (ja) * 2001-11-02 2007-06-06 松下電器産業株式会社 符号化装置及び復号化装置
JP4308229B2 (ja) 2001-11-14 2009-08-05 パナソニック株式会社 符号化装置および復号化装置
EP1423847B1 (en) 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
DE60323331D1 (de) 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
RU2316154C2 (ru) * 2002-04-10 2008-01-27 Конинклейке Филипс Электроникс Н.В. Кодирование стереофонических сигналов
US20030220800A1 (en) * 2002-05-21 2003-11-27 Budnikov Dmitry N. Coding multichannel audio signals
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
EP1516514A1 (en) * 2002-06-12 2005-03-23 Equtech APS Method of digital equalisation of a sound from loudspeakers in rooms and use of the method
KR100462615B1 (ko) * 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
DE20321883U1 (de) 2002-09-04 2012-01-20 Microsoft Corp. Computervorrichtung und -system zum Entropiedecodieren quantisierter Transformationskoeffizienten eines Blockes
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
KR100501930B1 (ko) * 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
RU2244386C2 (ru) 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
US8311809B2 (en) 2003-04-17 2012-11-13 Koninklijke Philips Electronics N.V. Converting decoded sub-band signal into a stereo signal
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
CN1839426A (zh) * 2003-09-17 2006-09-27 北京阜国数字技术有限公司 多分辨率矢量量化的音频编解码方法及装置
DE10345996A1 (de) * 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
DE10345995B4 (de) * 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
ES2282899T3 (es) 2003-10-30 2007-10-16 Koninklijke Philips Electronics N.V. Codificacion o descodificacion de señales de audio.
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004007184B3 (de) 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007191B3 (de) 2004-02-13 2005-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
DE602005014288D1 (de) 2004-03-01 2009-06-10 Dolby Lab Licensing Corp Mehrkanalige Audiodekodierung
US7739119B2 (en) 2004-03-02 2010-06-15 Ittiam Systems (P) Ltd. Technique for implementing Huffman decoding
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
CN1677492A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
CN1677493A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
WO2005096274A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
CN1677491A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
JP4938648B2 (ja) * 2004-04-05 2012-05-23 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネル・エンコーダ
US7668711B2 (en) 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
CN1947174B (zh) * 2004-04-27 2012-03-14 松下电器产业株式会社 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法
DE102004021403A1 (de) * 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
ATE394774T1 (de) * 2004-05-19 2008-05-15 Matsushita Electric Ind Co Ltd Kodierungs-, dekodierungsvorrichtung und methode dafür
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
JP2006003580A (ja) * 2004-06-17 2006-01-05 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置及びオーディオ信号符号化方法
CA2572805C (en) * 2004-07-02 2013-08-13 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
US7465389B2 (en) 2004-07-09 2008-12-16 Exxonmobil Research And Engineering Company Production of extra-heavy lube oils from Fischer-Tropsch wax
US6963405B1 (en) 2004-07-19 2005-11-08 Itt Manufacturing Enterprises, Inc. Laser counter-measure using fourier transform imaging spectrometers
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
TWI498882B (zh) 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
RU2404506C2 (ru) 2004-11-05 2010-11-20 Панасоник Корпорэйшн Устройство масштабируемого декодирования и устройство масштабируемого кодирования
EP2752843A1 (en) 2004-11-05 2014-07-09 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
JP4903053B2 (ja) * 2004-12-10 2012-03-21 パナソニック株式会社 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
SG163556A1 (en) 2005-04-01 2010-08-30 Qualcomm Inc Systems, methods, and apparatus for wideband speech coding
UA91853C2 (ru) * 2005-04-01 2010-09-10 Квелкомм Инкорпорейтед Способ и устройство для векторного квантования спектрального представления огибающей
WO2006108543A1 (en) * 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
US7983922B2 (en) 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
PT1875463T (pt) 2005-04-22 2019-01-24 Qualcomm Inc Sistemas, métodos e aparelho para nivelamento de fator de ganho
US7698143B2 (en) 2005-05-17 2010-04-13 Mitsubishi Electric Research Laboratories, Inc. Constructing broad-band acoustic signals from lower-band acoustic signals
JP2006323037A (ja) * 2005-05-18 2006-11-30 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置
JP5118022B2 (ja) 2005-05-26 2013-01-16 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化/復号化方法及び符号化/復号化装置
WO2006134992A1 (ja) * 2005-06-17 2006-12-21 Matsushita Electric Industrial Co., Ltd. ポストフィルタ、復号化装置及びポストフィルタ処理方法
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
JP2009500656A (ja) 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
US7411528B2 (en) * 2005-07-11 2008-08-12 Lg Electronics Co., Ltd. Apparatus and method of processing an audio signal
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
JP4640020B2 (ja) 2005-07-29 2011-03-02 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
CN100539437C (zh) 2005-07-29 2009-09-09 上海杰得微电子有限公司 一种音频编解码器的实现方法
WO2007055462A1 (en) 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
US20080255859A1 (en) * 2005-10-20 2008-10-16 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US8620644B2 (en) 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
KR20070046752A (ko) * 2005-10-31 2007-05-03 엘지전자 주식회사 신호 처리 방법 및 장치
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
HUE066862T2 (hu) * 2006-01-27 2024-09-28 Dolby Int Ab Hatékony szûrés komplex modulált szûrõbankkal
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
CN101512899B (zh) * 2006-07-04 2012-12-26 杜比国际公司 滤波器压缩器以及用于产生压缩子带滤波器冲激响应的方法
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
DE602006013359D1 (de) 2006-09-13 2010-05-12 Ericsson Telefon Ab L M Ender und empfänger
CN102892070B (zh) * 2006-10-16 2016-02-24 杜比国际公司 多声道下混对象编码的增强编码和参数表示
JP4936569B2 (ja) 2006-10-25 2012-05-23 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ副帯値を生成する装置及び方法、並びに、時間領域オーディオサンプルを生成する装置及び方法
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
JP5231243B2 (ja) * 2006-11-28 2013-07-10 パナソニック株式会社 符号化装置及び符号化方法
JP5238512B2 (ja) 2006-12-13 2013-07-17 パナソニック株式会社 オーディオ信号符号化方法及び復号化方法
US8200351B2 (en) 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
MX2009007412A (es) 2007-01-10 2009-07-17 Koninkl Philips Electronics Nv Decodificador de audio.
JP2010519602A (ja) 2007-02-26 2010-06-03 クゥアルコム・インコーポレイテッド 信号分離のためのシステム、方法、および装置
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP5294713B2 (ja) 2007-03-02 2013-09-18 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
KR101411900B1 (ko) 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统
ES2358786T3 (es) * 2007-06-08 2011-05-13 Dolby Laboratories Licensing Corporation Derivación híbrida de canales de audio de sonido envolvente combinando de manera controlable componentes de señal de sonido ambiente y con decodificación matricial.
CN101325059B (zh) * 2007-06-15 2011-12-21 华为技术有限公司 语音编解码收发方法及装置
US7774205B2 (en) 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8428957B2 (en) * 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
EP2571024B1 (en) * 2007-08-27 2014-10-22 Telefonaktiebolaget L M Ericsson AB (Publ) Adaptive transition frequency between noise fill and bandwidth extension
JP5255638B2 (ja) * 2007-08-27 2013-08-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ノイズ補充の方法及び装置
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
US8527265B2 (en) 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
US9177569B2 (en) * 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
EP2207166B1 (en) * 2007-11-02 2013-06-19 Huawei Technologies Co., Ltd. An audio decoding method and device
KR101586317B1 (ko) 2007-11-21 2016-01-18 엘지전자 주식회사 신호 처리 방법 및 장치
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
AU2008344134B2 (en) 2007-12-31 2011-08-25 Lg Electronics Inc. A method and an apparatus for processing an audio signal
DE602008005250D1 (de) * 2008-01-04 2011-04-14 Dolby Sweden Ab Audiokodierer und -dekodierer
US20090180531A1 (en) 2008-01-07 2009-07-16 Radlive Ltd. codec with plc capabilities
KR101413967B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
EP2248263B1 (en) 2008-01-31 2012-12-26 Agency for Science, Technology And Research Method and device of bitrate distribution/truncation for scalable audio coding
US8391498B2 (en) 2008-02-14 2013-03-05 Dolby Laboratories Licensing Corporation Stereophonic widening
AU2009221444B2 (en) * 2008-03-04 2012-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Mixing of input data streams and generation of an output data stream therefrom
WO2009109050A1 (en) * 2008-03-05 2009-09-11 Voiceage Corporation System and method for enhancing a decoded tonal sound signal
EP3296992B1 (en) 2008-03-20 2021-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for modifying a parameterized representation
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
EP2301017B1 (en) * 2008-05-09 2016-12-21 Nokia Technologies Oy Audio apparatus
US20090319263A1 (en) 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
CN103077722B (zh) 2008-07-11 2015-07-22 弗劳恩霍夫应用研究促进协会 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
MX2011000367A (es) 2008-07-11 2011-03-02 Fraunhofer Ges Forschung Un aparato y un metodo para calcular una cantidad de envolventes espectrales.
PL2346030T3 (pl) 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
ES2683077T3 (es) * 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
ES2422412T3 (es) 2008-07-11 2013-09-11 Fraunhofer Ges Forschung Codificador de audio, procedimiento para la codificación de audio y programa de ordenador
CN102089813B (zh) * 2008-07-11 2013-11-20 弗劳恩霍夫应用研究促进协会 音频编码器和音频解码器
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
ATE522901T1 (de) 2008-07-11 2011-09-15 Fraunhofer Ges Forschung Vorrichtung und verfahren zur berechnung von bandbreitenerweiterungsdaten mit hilfe eines spektralneigungs-steuerungsrahmens
RU2491658C2 (ru) * 2008-07-11 2013-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
WO2010028292A1 (en) 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
US8463603B2 (en) 2008-09-06 2013-06-11 Huawei Technologies Co., Ltd. Spectral envelope coding of energy attack signal
WO2010031049A1 (en) 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
JP5295372B2 (ja) * 2008-09-17 2013-09-18 フランス・テレコム デジタルオーディオ信号におけるプリエコーの減衰
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
ES2976382T3 (es) 2008-12-15 2024-07-31 Fraunhofer Ges Zur Foerderungder Angewandten Forschung E V Decodificador de extensión de ancho de banda
JP5423684B2 (ja) * 2008-12-19 2014-02-19 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
BR122019023704B1 (pt) 2009-01-16 2020-05-05 Dolby Int Ab sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta
JP4977157B2 (ja) * 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
JP5214058B2 (ja) * 2009-03-17 2013-06-19 ドルビー インターナショナル アーベー 適応的に選択可能な左/右又はミッド/サイド・ステレオ符号化及びパラメトリック・ステレオ符号化の組み合わせに基づいた高度ステレオ符号化
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
US8391212B2 (en) * 2009-05-05 2013-03-05 Huawei Technologies Co., Ltd. System and method for frequency domain audio post-processing based on perceptual masking
EP2249333B1 (en) * 2009-05-06 2014-08-27 Nuance Communications, Inc. Method and apparatus for estimating a fundamental frequency of a speech signal
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
TWI556227B (zh) 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
EP2273493B1 (en) 2009-06-29 2012-12-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Bandwidth extension encoding and decoding
MY167512A (en) 2009-07-07 2018-09-04 Xtralis Technologies Ltd Chamber condition
US8793617B2 (en) * 2009-07-30 2014-07-29 Microsoft Corporation Integrating transport modes into a communication stream
US9031834B2 (en) 2009-09-04 2015-05-12 Nuance Communications, Inc. Speech enhancement techniques on the power spectrum
GB2473267A (en) 2009-09-07 2011-03-09 Nokia Corp Processing audio signals to reduce noise
AU2010305383B2 (en) * 2009-10-08 2013-10-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
KR101137652B1 (ko) 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
EP4358082A1 (en) 2009-10-20 2024-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
EP2491555B1 (en) 2009-10-20 2014-03-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio codec
EP3998606B8 (en) * 2009-10-21 2022-12-07 Dolby International AB Oversampling in a combined transposer filter bank
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
US8856011B2 (en) 2009-11-19 2014-10-07 Telefonaktiebolaget L M Ericsson (Publ) Excitation signal bandwidth extension
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
SI2510515T1 (sl) 2009-12-07 2014-06-30 Dolby Laboratories Licensing Corporation Dekodiranje večkanalnih avdio kodiranih bitnih prenosov s pomočjo adaptivne hibridne transformacije
KR101764926B1 (ko) 2009-12-10 2017-08-03 삼성전자주식회사 음향 통신을 위한 장치 및 방법
CN102667920B (zh) * 2009-12-16 2014-03-12 杜比国际公司 Sbr比特流参数缩混
EP2357649B1 (en) 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
JP5523589B2 (ja) 2010-03-09 2014-06-18 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法
EP2369861B1 (en) 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
RU2683175C2 (ru) * 2010-04-09 2019-03-26 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
PL3779979T3 (pl) 2010-04-13 2024-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji
US8886523B2 (en) 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
TR201904117T4 (tr) 2010-04-16 2019-05-21 Fraunhofer Ges Forschung Kılavuzlu bant genişliği uzantısı ve gözü kapalı bant genişliği uzantısı kullanılarak bir geniş bantlı sinyal üretilmesine yönelik aparat, yöntem ve bilgisayar programı.
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
PL2581905T3 (pl) 2010-06-09 2016-06-30 Panasonic Ip Corp America Sposób rozszerzania pasma częstotliwości, urządzenie do rozszerzania pasma częstotliwości, program, układ scalony oraz urządzenie dekodujące audio
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US9236063B2 (en) * 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8489403B1 (en) 2010-08-25 2013-07-16 Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
KR101624019B1 (ko) * 2011-02-14 2016-06-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 코덱에서 잡음 생성
JP6185457B2 (ja) 2011-04-28 2017-08-23 ドルビー・インターナショナル・アーベー 効率的なコンテンツ分類及びラウドネス推定
US9311923B2 (en) 2011-05-19 2016-04-12 Dolby Laboratories Licensing Corporation Adaptive audio processing based on forensic detection of media processing history
WO2012158333A1 (en) * 2011-05-19 2012-11-22 Dolby Laboratories Licensing Corporation Forensic detection of parametric audio coding schemes
KR102078865B1 (ko) 2011-06-30 2020-02-19 삼성전자주식회사 대역폭 확장신호 생성장치 및 방법
DE102011106033A1 (de) * 2011-06-30 2013-01-03 Zte Corporation Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels
US20130006644A1 (en) 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6037156B2 (ja) * 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
KR20130022549A (ko) 2011-08-25 2013-03-07 삼성전자주식회사 마이크 노이즈 제거 방법 및 이를 지원하는 휴대 단말기
CN103718240B (zh) 2011-09-09 2017-02-15 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法
IN2014CN01270A (es) 2011-09-29 2015-06-19 Dolby Int Ab
PL3624119T3 (pl) * 2011-10-28 2022-06-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie kodujące i sposób kodowania
ES2592522T3 (es) * 2011-11-02 2016-11-30 Telefonaktiebolaget L M Ericsson (Publ) Codificación de audio basada en representación de coeficientes auto-regresivos
CN103959375B (zh) * 2011-11-30 2016-11-09 杜比国际公司 增强的从音频编解码器的色度提取
JP5817499B2 (ja) 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
CN103165136A (zh) 2011-12-15 2013-06-19 杜比实验室特许公司 音频处理方法及音频处理设备
US9390721B2 (en) 2012-01-20 2016-07-12 Panasonic Intellectual Property Corporation Of America Speech decoding device and speech decoding method
KR101398189B1 (ko) 2012-03-27 2014-05-22 광주과학기술원 음성수신장치 및 음성수신방법
KR102123770B1 (ko) * 2012-03-29 2020-06-16 텔레폰악티에볼라겟엘엠에릭슨(펍) 하모닉 오디오 신호의 변환 인코딩/디코딩
RU2610293C2 (ru) * 2012-03-29 2017-02-08 Телефонактиеболагет Лм Эрикссон (Пабл) Расширение полосы частот гармонического аудиосигнала
CN102750955B (zh) * 2012-07-20 2014-06-18 中国科学院自动化研究所 基于残差信号频谱重构的声码器
US9589570B2 (en) 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates
WO2014046526A1 (ko) 2012-09-24 2014-03-27 삼성전자 주식회사 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
US9135920B2 (en) 2012-11-26 2015-09-15 Harman International Industries, Incorporated System for perceived enhancement and restoration of compressed audio signals
PL3067890T3 (pl) 2013-01-29 2018-06-29 Fraunhofer Ges Forschung Koder audio, dekoder audio, sposób dostarczania zakodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i zakodowana reprezentacja, wykorzystujące adaptacyjne względem sygnału powiększanie szerokości pasma
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor

Also Published As

Publication number Publication date
US10347274B2 (en) 2019-07-09
KR101681253B1 (ko) 2016-12-01
US20210065723A1 (en) 2021-03-04
BR112016001072B1 (pt) 2022-07-12
US20150287417A1 (en) 2015-10-08
JP2016529546A (ja) 2016-09-23
AU2014295296B2 (en) 2017-10-19
US10593345B2 (en) 2020-03-17
PT3025337T (pt) 2022-02-23
CN111179963A (zh) 2020-05-19
US10311892B2 (en) 2019-06-04
BR112016000852A2 (pt) 2017-08-22
PL3025343T3 (pl) 2018-10-31
MX356161B (es) 2018-05-16
PT2883227T (pt) 2016-11-18
CN111554310A (zh) 2020-08-18
KR101822032B1 (ko) 2018-03-08
AU2014295295B2 (en) 2017-10-19
AU2014295298A1 (en) 2016-03-10
JP6705787B2 (ja) 2020-06-03
JP6144773B2 (ja) 2017-06-07
US20180268842A1 (en) 2018-09-20
PL3025340T3 (pl) 2019-09-30
EP3407350A1 (en) 2018-11-28
EP3723091A1 (en) 2020-10-14
MX2016000857A (es) 2016-05-05
PL3025328T3 (pl) 2019-02-28
BR112016001072A2 (es) 2017-08-22
PL3506260T3 (pl) 2024-02-19
SG11201502691QA (en) 2015-05-28
AU2014295297B2 (en) 2017-05-25
ES2698023T3 (es) 2019-01-30
EP3017448A1 (en) 2016-05-11
US11735192B2 (en) 2023-08-22
KR101807836B1 (ko) 2018-01-18
PT3407350T (pt) 2020-10-27
US20210217426A1 (en) 2021-07-15
EP3975180A1 (en) 2022-03-30
ES2813940T3 (es) 2021-03-25
RU2635890C2 (ru) 2017-11-16
RU2651229C2 (ru) 2018-04-18
KR20160046804A (ko) 2016-04-29
BR112016001125B1 (pt) 2022-01-04
ES2908624T3 (es) 2022-05-03
EP2883227B1 (en) 2016-08-17
MX2016000935A (es) 2016-07-05
US20160140979A1 (en) 2016-05-19
US20160210974A1 (en) 2016-07-21
WO2015010953A1 (en) 2015-01-29
KR20160042890A (ko) 2016-04-20
CA2918810C (en) 2020-04-28
CN105453176B (zh) 2019-08-23
US20180144760A1 (en) 2018-05-24
MX353999B (es) 2018-02-07
CA2918701A1 (en) 2015-01-29
BR112016001398B1 (pt) 2021-12-28
MX2015004022A (es) 2015-07-06
BR122022010958B1 (pt) 2024-01-30
CA2918835C (en) 2018-06-26
EP3025337A1 (en) 2016-06-01
TW201523589A (zh) 2015-06-16
MY182831A (en) 2021-02-05
RU2016105610A (ru) 2017-08-25
US20160140980A1 (en) 2016-05-19
CA2918807C (en) 2019-05-07
ZA201601011B (en) 2017-05-31
US20180102134A1 (en) 2018-04-12
EP3742444A1 (en) 2020-11-25
TW201514974A (zh) 2015-04-16
ZA201601111B (en) 2017-08-30
AU2014295301A1 (en) 2016-03-10
PT3025328T (pt) 2018-11-27
JP2016527556A (ja) 2016-09-08
CN110660410A (zh) 2020-01-07
SG11201600496XA (en) 2016-02-26
US20160133265A1 (en) 2016-05-12
JP6306702B2 (ja) 2018-04-04
MX354002B (es) 2018-02-07
EP3025337B1 (en) 2021-12-08
RU2646316C2 (ru) 2018-03-02
CA2918810A1 (en) 2015-01-29
CN112466312B (zh) 2025-02-21
EP4246512A3 (en) 2023-12-13
TW201523590A (zh) 2015-06-16
US10147430B2 (en) 2018-12-04
CN105518776B (zh) 2019-06-14
RU2015112591A (ru) 2016-10-27
CA2918807A1 (en) 2015-01-29
JP6389254B2 (ja) 2018-09-12
BR122022011238B1 (pt) 2023-12-19
CA2918524C (en) 2018-05-22
MX355448B (es) 2018-04-18
EP3025344A1 (en) 2016-06-01
MY175978A (en) 2020-07-19
US10276183B2 (en) 2019-04-30
RU2016105619A (ru) 2017-08-23
CN111179963B (zh) 2024-11-22
EP3025343A1 (en) 2016-06-01
CA2918804C (en) 2018-06-12
PL2883227T3 (pl) 2017-03-31
MX2016000924A (es) 2016-05-05
PL3025337T3 (pl) 2022-04-11
MX2016000940A (es) 2016-04-25
US10573334B2 (en) 2020-02-25
BR112016000740A2 (pt) 2017-08-22
CN110310659B (zh) 2023-10-24
US12142284B2 (en) 2024-11-12
JP2020060792A (ja) 2020-04-16
JP6568566B2 (ja) 2019-08-28
CN110660410B (zh) 2023-10-24
US20160140981A1 (en) 2016-05-19
CN104769671A (zh) 2015-07-08
BR112016001398A2 (pt) 2017-08-22
JP2016525713A (ja) 2016-08-25
RU2643641C2 (ru) 2018-02-02
US20190251986A1 (en) 2019-08-15
TW201513098A (zh) 2015-04-01
TWI541797B (zh) 2016-07-11
BR112016000852B1 (pt) 2021-12-28
JP7092809B2 (ja) 2022-06-28
US20190074019A1 (en) 2019-03-07
JP6400702B2 (ja) 2018-10-03
AU2014295296A1 (en) 2016-03-10
JP7483792B2 (ja) 2024-05-15
JP6321797B2 (ja) 2018-05-09
KR20160030193A (ko) 2016-03-16
CN105518777B (zh) 2020-01-31
CN112466312A (zh) 2021-03-09
BR112015007533B1 (pt) 2022-09-27
CA2918524A1 (en) 2015-01-29
US10515652B2 (en) 2019-12-24
AU2014295300A1 (en) 2016-03-10
RU2016105473A (ru) 2017-08-23
TW201517024A (zh) 2015-05-01
BR112016000740B1 (pt) 2022-12-27
BR112015007533A2 (es) 2017-08-22
RU2016105618A (ru) 2017-08-28
TW201517019A (zh) 2015-05-01
US20200082841A1 (en) 2020-03-12
MX2016000943A (es) 2016-07-05
US11289104B2 (en) 2022-03-29
EP3506260C0 (en) 2023-08-16
US11769512B2 (en) 2023-09-26
EP3025343B1 (en) 2018-02-14
PT3025343T (pt) 2018-05-18
CN105580075A (zh) 2016-05-11
ZA201601010B (en) 2017-11-29
EP2883227A1 (en) 2015-06-17
EP3723091B1 (en) 2024-09-11
WO2015010947A1 (en) 2015-01-29
EP2830059A1 (en) 2015-01-28
SG11201600494UA (en) 2016-02-26
PT3025340T (pt) 2019-06-27
CN105580075B (zh) 2020-02-07
EP3025328A1 (en) 2016-06-01
PL3407350T3 (pl) 2020-12-28
BR112016000947A2 (es) 2017-08-22
SG11201600401RA (en) 2016-02-26
WO2015010952A1 (en) 2015-01-29
ZA201601046B (en) 2017-05-31
KR20160041940A (ko) 2016-04-18
MY180759A (en) 2020-12-08
JP2022123060A (ja) 2022-08-23
WO2015010954A1 (en) 2015-01-29
TWI555009B (zh) 2016-10-21
US20220270619A1 (en) 2022-08-25
CA2918835A1 (en) 2015-01-29
AU2014295300B2 (en) 2017-05-25
CN110310659A (zh) 2019-10-08
US20230352032A1 (en) 2023-11-02
KR101774795B1 (ko) 2017-09-05
EP3025340B1 (en) 2019-03-27
AU2014295297A1 (en) 2016-03-10
EP3506260A1 (en) 2019-07-03
TWI545558B (zh) 2016-08-11
RU2649940C2 (ru) 2018-04-05
AU2014295301B2 (en) 2017-05-25
EP2830056A1 (en) 2015-01-28
US20160140973A1 (en) 2016-05-19
KR101826723B1 (ko) 2018-03-22
ES2959641T3 (es) 2024-02-27
WO2015010949A1 (en) 2015-01-29
KR20160034975A (ko) 2016-03-30
JP6186082B2 (ja) 2017-08-23
ES2728329T3 (es) 2019-10-23
JP2016530556A (ja) 2016-09-29
PT3017448T (pt) 2020-10-08
JP2018013796A (ja) 2018-01-25
US20190198029A1 (en) 2019-06-27
EP2830063A1 (en) 2015-01-28
CN105518776A (zh) 2016-04-20
ES2827774T3 (es) 2021-05-24
JP6310074B2 (ja) 2018-04-11
WO2015010950A1 (en) 2015-01-29
CN105453175B (zh) 2020-11-03
RU2640634C2 (ru) 2018-01-10
WO2015010952A9 (en) 2017-10-26
US11996106B2 (en) 2024-05-28
KR20160024924A (ko) 2016-03-07
MY187943A (en) 2021-10-30
TW201517023A (zh) 2015-05-01
US10134404B2 (en) 2018-11-20
RU2607263C2 (ru) 2017-01-10
BR122022010960B1 (pt) 2023-04-04
EP3506260B1 (en) 2023-08-16
US20220139407A1 (en) 2022-05-05
ES2667221T3 (es) 2018-05-10
EP3723091C0 (en) 2024-09-11
PL3017448T3 (pl) 2020-12-28
US10332539B2 (en) 2019-06-25
KR101764723B1 (ko) 2017-08-14
TWI555008B (zh) 2016-10-21
BR112016000947B1 (pt) 2022-06-21
CA2973841C (en) 2019-08-20
JP2018077487A (ja) 2018-05-17
AU2014295295A1 (en) 2016-03-10
US20170154631A1 (en) 2017-06-01
ZA201502262B (en) 2016-09-28
JP2018041100A (ja) 2018-03-15
CN105453176A (zh) 2016-03-30
CN105453175A (zh) 2016-03-30
CN111554310B (zh) 2023-10-20
CA2918804A1 (en) 2015-01-29
EP3025340A1 (en) 2016-06-01
EP3407350B1 (en) 2020-07-29
CA2973841A1 (en) 2015-01-29
US20190371355A1 (en) 2019-12-05
US11769513B2 (en) 2023-09-26
US20190043522A1 (en) 2019-02-07
RU2016105759A (ru) 2017-08-25
US10847167B2 (en) 2020-11-24
CN104769671B (zh) 2017-09-26
US11922956B2 (en) 2024-03-05
EP2830065A1 (en) 2015-01-28
AU2014295302A1 (en) 2015-04-02
EP3025344B1 (en) 2017-06-21
ES2599007T3 (es) 2017-01-31
EP2830064A1 (en) 2015-01-28
WO2015010948A1 (en) 2015-01-29
EP2830054A1 (en) 2015-01-28
EP2830061A1 (en) 2015-01-28
EP4246512A2 (en) 2023-09-20
US10002621B2 (en) 2018-06-19
JP2016529545A (ja) 2016-09-23
MX2016000854A (es) 2016-06-23
US11222643B2 (en) 2022-01-11
KR20150060752A (ko) 2015-06-03
EP3025328B1 (en) 2018-08-01
US20210295853A1 (en) 2021-09-23
CA2886505C (en) 2017-10-31
MX362036B (es) 2019-01-04
CN105556603B (zh) 2019-08-27
KR101809592B1 (ko) 2018-01-18
TR201816157T4 (tr) 2018-11-21
US10332531B2 (en) 2019-06-25
RU2016105613A (ru) 2017-08-28
SG11201600464WA (en) 2016-02-26
CA2886505A1 (en) 2015-01-29
TWI545560B (zh) 2016-08-11
TWI549121B (zh) 2016-09-11
SG11201600422SA (en) 2016-02-26
US11257505B2 (en) 2022-02-22
CN105518777A (zh) 2016-04-20
JP2015535620A (ja) 2015-12-14
MY184847A (en) 2021-04-27
AU2014295298B2 (en) 2017-05-25
BR122022011231B1 (pt) 2024-01-30
MX340575B (es) 2016-07-13
MX354657B (es) 2018-03-14
AU2014295302B2 (en) 2016-06-30
HK1211378A1 (en) 2016-05-20
SG11201600506VA (en) 2016-02-26
US10984805B2 (en) 2021-04-20
EP3017448B1 (en) 2020-07-08
CN105556603A (zh) 2016-05-04
BR112016001125A2 (es) 2017-08-22
JP2016527557A (ja) 2016-09-08
US11250862B2 (en) 2022-02-15
US20220157325A1 (en) 2022-05-19
TWI545561B (zh) 2016-08-11
BR122022010965B1 (pt) 2023-04-04
CA2918701C (en) 2020-04-14
US11049506B2 (en) 2021-06-29
JP6691093B2 (ja) 2020-04-28

Similar Documents

Publication Publication Date Title
ES2638498T3 (es) Aparato y procedimiento para decodificar una señal de audio codificada mediante un filtro de cruce en torno a una frecuencia de transición
ES2693051T3 (es) Aparato y procedimiento para generar una señal mejorada mediante el uso de relleno de ruido independiente