ES2458436T3 - Representación de señal de información utilizando transformada superpuesta - Google Patents
Representación de señal de información utilizando transformada superpuesta Download PDFInfo
- Publication number
- ES2458436T3 ES2458436T3 ES12705255.3T ES12705255T ES2458436T3 ES 2458436 T3 ES2458436 T3 ES 2458436T3 ES 12705255 T ES12705255 T ES 12705255T ES 2458436 T3 ES2458436 T3 ES 2458436T3
- Authority
- ES
- Spain
- Prior art keywords
- information signal
- transform
- region
- regions
- successor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
Un reconstructor de señal de información configurado para reconstruir, usando la cancelación del aliasing, una señal de información de una representación de transformada superpuesta de la señal de información que comprende, para cada una de regiones de superposición consecutivas de la señal de información, una transformada de una versión de ventana de la respectiva región, donde el reconstructor de señal de información está configurado para reconstruir la señal de información a una tasa de muestra que cambia en un borde (82) entre una región precedente (84) y una región sucesora (86) de la señal de información, donde el reconstructor de señal de información comprende: un retransformador (70) configurado para aplicar una retransformación sobre la transformada (94) de la versión de ventana de la región precedente (84), de modo de obtener una retransformada (96) para la región precedente (84), y aplicar una retransformación sobre la transformada de la versión de ventana de la región sucesora (86) de modo de obtener una retransformada (100) para la región sucesora (86), donde la retransformada (96) para la región precedente (84) y la retransformada (106) para la región sucesora (86) se superponen en una porción de cancelación del aliasing (102) en el borde (82) entre las regiones precedente y sucesora; un remuestreador (72) configurado para remuestrear, mediante la interpolación, la retransformación (96) para la región precedente (84) y/o la retransformada (100) para la región sucesora (86) en la porción de cancelación del aliasing (102) de acuerdo con un cambio de tasa de muestra en el borde (82); y una combinadora (74) configurada para realizar la cancelación del aliasing entre las retransformadas (96, 100) para las regiones precedente y sucesora (84, 86) obtenidas por el remuestreo en la porción de cancelación del 20 aliasing (102).
Description
Representación de señal de información utilizando transformada superpuesta.
[0001] La presente solicitud se refiere a la representación de señal de información usando transformadas superpuestas, y en particular, a la representación de una señal de información usando una representación de transformada superpuesta de la señal de información que requiere la cancelación del aliasing, tal como se usa, por ejemplo, en técnicas de compresión de audio.
[0002] La mayoría de las técnicas de compresión están diseñadas para un tipo específico de señal de información y condiciones de transmisión específicas de la corriente de datos comprimida, tal como el máximo retardo permitido y tasa de bits de transmisión disponible. Por ejemplo, en la compresión de audio, los códecs [codificadores– decodificadores] sobre la base de la transformada, tales como AAC [sigla en inglés de: codificación de audio avanzada], tienden a superar a los códecs de dominio de tiempo sobre la base de la predicción lineal, tales como ACELP [sigla en inglés de: Predicción Lineal excitada por código algebraico (algoritmo de codificación de discurso)], en el caso de la mayor tasa de bits disponible y en el caso de la codificación de música en lugar de discurso. El códec USAC [sigla en inglés de: codificación de discurso y audio unificada], por ejemplo, busca cubrir una mayor variedad de escenarios de aplicaciones, mediante la unificación de diferentes principios de codificación de audio dentro de un códec. Sin embargo, sería favorable aumentar adicionalmente la capacidad de adaptación a diferentes condiciones de codificación, por ejemplo, variando la tasa de bits de transmisión disponible a fin de poder sacar ventaja de ella, de manera de lograr, por ejemplo, una mayor eficiencia de codificación, o características similares.
[0003] Se conoce a partir de la solicitud de patente EP2107556A1 una codificación de transformada de audio con la que obtener una representación procesada de una señal de audio que tiene una secuencia de tramas generadas por muestreo de la señal de audio dentro de unos marcos primero y segundo, donde el muestreo utiliza la información en un contorno de tono.
[0004] En consecuencia, un objetivo de la presente invención es proporcionar dicho concepto mediante la provisión de un esquema de representación de señal de información con transformada superpuesta, que permita la representación de una señal de información por medio de una representación de transformada superpuesta que requiera la cancelación del aliasing, de modo que sea posible adaptar la representación de transformada superpuesta a la necesidad real, a fin de proporcionar la posibilidad de lograr mayor eficiencia de codificación.
[0005] Este objetivo es logrado por el asunto de las reivindicaciones independientes pendientes.
[0006] Las principales creencias que condujeron a la presente invención son las siguientes. Las representaciones de transformada superpuesta de señales de información a menudo se usan con la finalidad de formar un preestado en la codificación eficiente de la señal de información en términos de, por ejemplo, el sentido de la relación de tasa/distorsión. Ejemplos de dichos códecs son AAC o TCX [sigla en inglés de: excitación codificada de transformada] o similares. Las representaciones de transformada superpuesta, sin embargo, pueden ser usadas además para realizar el remuestreo mediante la transformada y retransformada concatenadas con diferentes resoluciones espectrales. En general, las representaciones de transformada superpuesta que causan aliasing en las porciones de superposición de las retransformadas individuales de las transformadas de las versiones en ventana de regiones de tiempo consecutivas de la señal de información tienen una ventaja en términos de la menor cantidad de niveles de coeficientes de transformada por codificar, de modo de representar la representación de transformada
superpuesta. En una forma extrema, las transformadas superpuestas son “críticamente muestreadas”. Es decir, no
aumentan el número de coeficientes en la representación de transformada superpuesta, en comparación con el número de muestras de tiempo de la señal de información. Un ejemplo de representación de transformada superpuesta es un banco de filtro MDCT (sigla en inglés de: transformada de coseno discreta modificada) o QMF (sigla en inglés de: filtros espejo en cuadratura). Por lo tanto, a menudo es favorable utilizar dicha representación de transformada superpuesta como un preestado en la codificación eficiente de señales de información. Sin embargo, sería además favorable poder permitir la tasa de muestra a la cual es representada la señal de información usando la representación de transformada superpuesta para cambiar en el tiempo, de modo de adaptarse, por ejemplo, a la tasa de bits de transmisión disponible o a otras condiciones ambientales. Imaginen una tasa de bits de transmisión disponible variable. Cada vez que la tasa de bits de transmisión disponible cae por debajo de algún umbral predeterminado, por ejemplo, puede ser favorable disminuir la tasa de muestra, y cuando la tasa de transmisión disponible se eleva nuevamente, será favorable poder aumentar la tasa de muestra a la cual la representación de transformada superpuesta representa la señal de información. Desafortunadamente, las porciones de aliasing de superposición de las retransformadas de la representación de transformada superpuesta parecen formar una barra contra dichos cambios de tasa de muestra, donde dicha barra parece ser superada solo mediante la interrupción completa de la representación de transformada superpuesta en los casos de cambios de tasa de muestra. No obstante, los inventores de la presente invención han hallado una solución al problema arriba mencionado, de modo de permitir un uso eficiente de representaciones de transformada superpuesta que involucran aliasing y la variación de tasa de muestra en cuestión. En particular, mediante la interpolación, la región precedente o siguiente de la señal de información es remuestreada en la porción de cancelación de aliasing de acuerdo con el cambio de tasa de muestra en el borde entre ambas regiones. Entonces, una combinadora puede efectuar la cancelación del aliasing en el borde entre las retransformadas para las regiones precedentes y siguientes obtenidas por el remuestreo en la porción de cancelación del aliasing. Con esta medida, los cambios en la tasa de muestreo son eficientemente atravesados, de modo de evitar cualquier discontinuidad de la representación de transformada superpuesta en los cambios o transiciones de tasa de muestra. Son viables también medidas similares del lado de la transformada, de manera de generar apropiadamente una transformada superpuesta.
[0007] Utilizando la idea arriba mencionada, es posible proporcionar técnicas de compresión de señal de información, tales como técnicas de compresión de audio, que tienen alta eficiencia de codificación sobre un amplio rango de condiciones de codificación ambientales, como el ancho de banda de transmisión disponible, mediante la adaptación de la tasa de muestra proporcionada, a estas condiciones, sin penalidad por los casos de cambios de tasa de muestra en sí mismos.
[0008] Los aspectos convenientes de la presente invención son el tema de las reivindicaciones dependientes del juego de reivindicaciones pendientes. Además, las realizaciones preferidas de la presente invención se describen a continuación con respecto a las figuras, donde:
la Fig. 1a muestra un diagrama de bloques de un codificador de información, donde las realizaciones de la presente invención podrían ser implementadas;
la Fig. 1b muestra un diagrama de bloques de un decodificador de señales de información donde podrían implementarse las realizaciones de la presente invención;
la Fig. 2a muestra un diagrama de bloques de una estructura interna posible del codificador núcleo de la Fig. 1a;
la Fig. 2b muestra un diagrama de bloques de una estructura interna posible del decodificador núcleo de la Fig. 1b;
la Fig. 3a muestra un diagrama de bloques de una implementación posible del remuestreador de la Fig. 1a;
la Fig. 3b muestra un diagrama de bloques de una estructura interna posible del remuestreador de la Fig. 1b;
la Fig. 4a muestra un diagrama de bloques de un codificador de señal de información donde podrían implementarse las realizaciones de la presente invención;
la Fig. 4b muestra un diagrama de bloques de un decodificador de señal de información donde podrían implementarse las realizaciones de la presente invención;
la Fig. 5 muestra un diagrama de bloques de un reconstructor de señal de información de acuerdo con una realización;
la Fig. 6 muestra un diagrama de bloques de un transformador de señal de información de acuerdo con una realización;
la Fig. 7a muestra un diagrama de bloques de un codificador de señal de información de acuerdo con una realización adicional, donde podría usarse un reconstructor de señal de información de acuerdo con la Fig. 5;
la Fig. 7b muestra un diagrama de bloques de un decodificador de señal de información de acuerdo con una realización adicional, donde podría usarse un reconstructor de señal de información de acuerdo con la Fig. 5;
la Fig. 8 muestra un esquema que exhibe los escenarios de cambio de tasa de muestra que se producen en el codificador y decodificador de señal de información de las Figs. 6a y 6b de acuerdo con una realización.
[0009] A fin de motivar las realizaciones de la presente invención que se describen adicionalmente a continuación, se describen preliminarmente las realizaciones dentro de las cuales pueden usarse las realizaciones de la presente solicitud, y que aclaran la intención y las ventajas de las realizaciones de la presente solicitud reseñadas adicionalmente a continuación.
[0010] Las Figs. 1a y 1b muestran, por ejemplo, un par de un codificador y un decodificador, donde las realizaciones explicadas subsiguientemente pueden usarse de modo conveniente. La Fig. 1a muestra el codificador, mientras que la Fig. 1b muestra el decodificador. El codificador de señal de información 10 de la Fig. 1a comprende una entrada 12 en la cual entra la señal de información; un remuestreador 14 y un codificador núcleo 16, donde el remuestreador 14 y el codificador núcleo 16 están conectados serialmente entre la entrada 12 y una salida 18 del codificador 10. En la salida 18, el codificador 10 da salida a la corriente de datos que representan la señal de información de la entrada 12. De manera similar, el decodificador que se muestra en la Fig. 1b con el signo de referencia 20 comprende un decodificador núcleo 22 y un remuestreador 24 que están conectados en forma serial entre una entrada 26 y una salida 28 del decodificador 20 de la manera que se expone en la Fig. 1b.
[0011] Si la tasa de bits de transmisión disponible para transportar la salida de corriente de datos en la salida 18 a la entrada 26 del decodificador 20 es alta, en términos de eficiencia de codificación, puede ser favorable representar la señal de información 12 dentro de la corriente de datos a una alta tasa de muestra, de modo de cubrir una amplia banda espectral del espectro de la señal de información. Es decir, una medida de eficiencia de codificación, tal como una medida de relación de tasa/distorsión, puede revelar que una eficiencia de codificación es más alta si el codificador núcleo 16 comprime la señal de entrada 12 a una tasa de muestra más alta cuando se compara con una compresión de una versión de tasa de muestra más lenta de la señal de información 12. Por otra parte, a menores tasas de bits de transmisión disponibles, puede pasar que la medida de eficiencia de codificación es más alta cuando se codifica la señal de información 12 a una tasa de muestra menor. En este sentido, debe observarse que la distorsión puede medirse de una manera motivada psicoacústicamente, es decir, teniendo en cuenta las distorsiones dentro de regiones de frecuencia perceptivamente más relevantes, en forma más intensa que aquellas dentro de las regiones de frecuencia perceptivamente menos relevantes, es decir, regiones de frecuencia donde el oído humano es, por ejemplo, menos sensible. En general, las regiones de baja frecuencia tienden a ser más relevantes que las regiones de mayor frecuencia, y por lo tanto, la codificación de menor tasa de muestra excluye los componentes de frecuencia de la señal en la entrada 12, que se posan sobre la frecuencia Nyquist, de la codificación; por otra parte, el ahorro de tasa de bits que resulta de esto puede, en un sentido de tasa/tasa de distorsión, lograr esta codificación de menor tasa de muestra preferida en comparación con la codificación de tasa de muestra más alta. Existen también discrepancias similares en la significación de las distorsiones entre las porciones de menor y mayor frecuencia, en otras señales de información tales como señales de medición, o similares.
[0012] Por lo tanto, el remuestreador 14 es para la variación de la tasa de muestra a la cual se muestrea la señal de información 12. Mediante el control apropiado de la tasa de muestra en dependencia de las condiciones de transmisión externas como la definen, entre otras cosas, la tasa de bits de transmisión disponible entre la salida 18 y la entrada 26, el codificador 10 es capaz de lograr una mayor eficiencia de codificación, a pesar de la condición de transmisión externa que cambia con el tiempo. El decodificador 20, a su vez, comprende el decodificador núcleo 22 que descomprime la corriente de datos, donde el remuestreador 24 cuida que la salida de señal de información reconstruida en la salida 28 tenga una tasa de muestra constante nuevamente.
[0013] Sin embargo, surgen problemas cada vez que se usa una representación de transformada superpuesta en el par de codificador/decodificador de las Figs. 1a y 1b. Una representación de transformada superpuesta que involucra aliasing en las regiones de superposición de las retransformadas forma una herramienta eficaz para la codificación, si bien, debido a la cancelación del aliasing de tiempo necesaria, se producen problemas si la tasa de muestra cambia. Ver, por ejemplo, las Figs. 2a y 2b. Las Figs. 2a y 2b muestran posibles implementaciones para el codificador núcleo 16 y el decodificador núcleo 22, asumiendo que ambos son del tipo de codificación de transformación. En consecuencia, el codificador núcleo 16 comprende un transformador 30, seguido de un compresor 32, y el decodificador núcleo expuesto en la Fig. 2b comprende un descompresor 34, seguido, a su vez, por un retransformador 36. Las Figs. 2a y 2b no se interpretarán al alcance de que no puedan presentarse otros módulos dentro del codificador núcleo 16 y el decodificador núcleo 22. Por ejemplo, un filtro podría preceder al transformador 30, de modo que este transformará la señal de información remuestreada obtenida por el remuestreador 14 no directamente, sino en una forma prefiltrada. De manera similar, un filtro que tiene una función de transferencia inversa podría suceder al retransformador 36, de manera que la señal de retransformada podría ser inversamente filtrada posteriormente.
[0014] El compresor 32 comprimirá la salida de representación de transformada superpuesta resultante por el transformador 30, tal como mediante el uso de codificación sin pérdidas tal como la codificación de entropía que incluye ejemplos como la codificación Huffman o aritmética, y el descompresor 34 podría hacer el proceso inverso, es decir, la descompresión, por ejemplo, mediante la decodificación de entropía tal como la decodificación Huffman
o aritmética a fin de obtener la representación de transformada superpuesta que luego se alimenta al retransformador 36.
[0015] En el entorno de codificación de transformación que se muestra en las Figs. 2a y 2b, se producen problemas cada vez que el remuestreador 14 cambia la tasa de muestreo. El problema es menos grave en el lado de la codificación, ya que la señal de información 12 se presenta de todos modos, y en consecuencia, el transformador 30 podría ser provisto de regiones continuamente muestreadas para las transformaciones individuales usando una versión en ventana de las respectivas regiones, aun en los casos de un cambio de tasa de muestreo. Una realización posible para la implementación del transformador 30, en consecuencia, se describe en lo siguiente, con respecto a la Fig. 6. En general, el transformador 30 podría ser provisto de una versión en ventana de una región precedente de la señal de información en una tasa de muestreo corriente, luego, del transformador de alimentación 30 por el remuestreador 14 con una región siguiente de la señal de información de superposición parcial, cuya transformada de la versión en ventana luego es generada por el transformador 30. No se producen problemas adicionales, ya que debe realizarse la cancelación del aliasing de tiempo necesaria, en el retransformador 36, en lugar del transformador 30. Sin embargo, en el retransformador 36, el cambio en la tasa de muestra causa problemas en términos de que el retransformador 36 no puede realizar la cancelación del aliasing de tiempo, ya que las retransformadas de las regiones inmediatamente siguientes mencionadas anteriormente se relacionan con diferentes tasas de muestreo. Las realizaciones que se describen adicionalmente a continuación superan estos problemas. De acuerdo con estas realizaciones, el retransformador 36 puede ser reemplazado por un reconstructor de señal de información adicionalmente descripto a continuación.
[0016] Sin embargo, en el entorno que se describe con respecto a las Figs. 1a y 1b, los problemas no solo se producen en el caso del codificador núcleo 16 y el decodificador núcleo 22 que son del tipo de codificación de transformada. En cambio, los problemas también pueden producirse en el caso del uso de bancos de filtro sobre la base de la transformada superpuesta para la conformación de los remuestreadores 14 y 24, respectivamente. Ver, por ejemplo, las, Figs. 3a y 3b. Las Figs. 3a y 3b muestran una realización específica para las realizaciones de los remuestreadores 14 y 24. De acuerdo con la realización de las Figs. 3a y 3b, ambos remuestreadores se implementan usando una concatenación de bancos de filtro de análisis 38 y 40, respectivamente, y luego, los bancos de filtro de síntesis 32 y 44, respectivamente. Como se ilustra en las Figs. 3a y 3b, los bancos de filtro de análisis y síntesis 38 a 44 pueden implementarse como bancos de filtro QMF, es decir, bancos de filtro a base de MDCT usando QMF para la división de la señal de información de antemano, y la reunión de la señal nuevamente. La QMF puede implementarse de manera similar a la QMF utilizada en la parte SBR [sigla en inglés de: replicación de banda espectral] de la MPEG HE–AAC [sigla en inglés de: codificación de audio avanzada de alta eficiencia del MEPG (Moving Pictures Expert Group (Grupo de Expertos de Películas))] o AAC–ELD [sigla en inglés de: codificación de audio avanzada de mejorado bajo retardo], lo que significa un banco de filtro modulado de multicanal con una superposición de 10 bloques, donde 10 es solo un ejemplo. En consecuencia, una representación de transformada superpuesta es generada por los bancos de filtro de análisis 38 y 40, y la señal remuestreada es reconstruida a partir de esta representación de transformada superpuesta, en el caso de los bancos de filtro de síntesis 42 y 44. A fin de lograr un cambio de tasa de muestreo, el banco de filtro de síntesis 42 y el banco de filtro de análisis 40 pueden implementarse a fin de operar a una longitud de transformada variable, donde, sin embargo, la tasa QMF o banco de filtro, es decir, la tasa a la cual las transformadas consecutivas son generadas por los bancos de filtro de análisis 38 y 40, respectivamente, por una parte, y retransformadas por los bancos de filtro de síntesis 42 y 44, respectivamente, por otra parte, es constante e igual para todos los componentes 38 a 44. Sin embargo, el cambio de la longitud de transformada logra un cambio en el índice de muestreo. Considerar, por ejemplo, el par de banco de filtro de análisis 38 y el banco de filtro de síntesis 42. Asumir que el banco de filtro de análisis 38 opera usando una longitud de transformada constante y una tasa constante de transformada o banco de filtro. En este caso, la representación de transformada superpuesta de la salida de señal de entrada por el banco de filtro de análisis 38 comprende, para cada una de las regiones de superposición consecutivas de la señal de entrada, que tiene una longitud de muestra constante, una transformada de una versión en ventana de la respectiva región, donde las transformadas también tienen una longitud constante. En otras palabras, el banco de filtro de análisis 38 adelantará al banco de filtro de síntesis 42 un espectrograma de una resolución constante de tiempo/frecuencia. Sin embargo, la longitud de la transformada del banco de filtro de síntesis cambiará. Considerar, por ejemplo, el caso del muestreo descendente de una primera tasa de muestreo descendente entre la tasa de entrada en la entrada del banco de filtro de análisis 38 y la tasa de muestreo de la salida de señal en la salida del banco de filtro de síntesis 42, a una segunda tasa de muestreo descendente. Siempre que la primera tasa de muestreo descendente sea válida, la salida de espectrograma o la representación de transformada superpuesta por el banco de filtro de análisis 38 solo se usará parcialmente para alimentar las retransformaciones dentro del banco de filtro de síntesis 42. La transformación del banco de filtro de síntesis 42 simplemente se aplicará a la porción de menor frecuencia de las transformadas consecutivas dentro del espectrograma del banco de filtro de análisis 38. Debido a la menor longitud de transformada utilizada en la retransformación del banco de filtro de síntesis 42, el número de muestras dentro de las retransformadas del banco de filtro de síntesis 42 también será menor en comparación con el número de muestras que se han sometido, en agrupaciones de las porciones de tiempo de superposición, a transformaciones en el banco de filtro 38, a fin de lograr una menor tasa de muestreo en comparación con la tasa de muestreo original de la señal de información que entra en la entrada del banco de filtro de análisis 38. No se producirán problemas, siempre que la tasa de muestreo descendente permanezca igual, ya que aún no representa ningún problema para que el banco de filtro de síntesis 42 realice la cancelación del aliasing de tiempo en la superposición entre las retransformadas consecutivas y las regiones de superposición consecutivas, de la señal de salida en la salida del banco de filtro 42.
[0017] El problema se produce cada vez que tiene lugar un cambio en la tasa de muestreo descendente, tal como el cambio desde una primera tasa de muestreo descendente hasta una segunda tasa de muestreo descendente mayor. En este caso, la longitud de transformadas utilizada dentro de la retransformación del banco de filtro de síntesis 42 se reducirá adicionalmente, de modo de lograr una tasa de muestra aún menor para las respectivas regiones subsiguientes, luego del punto de cambo de la tasa de muestreo en el tiempo. Nuevamente, se producen problemas para el banco de filtro de síntesis 42, ya que la cancelación del aliasing de tiempo entre la retransformada referida a la región inmediatamente precedente al punto de cambio de tasa de muestra en el tiempo y la retransformada referida a la región de la señal remuestreada que sucede inmediatamente al punto de cambio de tasa de muestra en el tiempo altera la cancelación del aliasing de tiempo entre las retransformadas en cuestión. En consecuencia, no ayuda mucho el hecho de que no se produzcan problemas similares del lado de la decodificación, donde el banco de filtro de análisis 40 con una longitud de transformada variable precede el banco de filtro de síntesis 44 de longitud de transformada constante. Aquí, el banco de filtro de síntesis 44 se aplica al espectrograma de la tasa constante de QMF/transformada, aunque de diferente resolución de frecuencia; es decir, las transformadas consecutivas avanzadas desde el banco de filtro de análisis 40 hacia el banco de filtro de síntesis 44, a una tasa constante, pero con una longitud de transformada variable con el tiempo o diferente para preservar la porción de menor frecuencia de la longitud de transformada entera del banco de filtro de síntesis 44, con relleno de la porción de frecuencia más alta de la longitud de transformada entera, con ceros. La cancelación del aliasing de tiempo entre la salida de las retransformadas consecutivas por el banco de filtro de síntesis 44 no es problemática, ya que la tasa de muestreo de la salida de señal reconstruida en la salida del banco de filtro de síntesis 44 tiene una tasa de muestreo constante.
[0018] Por lo tanto, nuevamente, se observa un problema al tratar de realizar la variación/adaptación de la tasa de muestra que se presenta anteriormente con respecto a las Figs. 1a y 1b, si bien estos problemas pueden ser superados mediante la implementación de la inversa o el banco de filtro de síntesis 42 de la Fig. 3a de acuerdo con algunas de las realizaciones que es explican subsiguientemente para un reconstructor de señal de información.
[0019] Las afirmaciones anteriores con respecto a una adaptación/variación de la tasa de muestreo son aún más interesantes cuando se consideran los conceptos de codificación de acuerdo con los cuales una porción de frecuencia más alta de una señal de información por codificar es codificada de una manera paramétrica, por ejemplo, usando la replicación de banda espectral (SBR, según su sigla en inglés), mientras que una de sus porciones de menor frecuencia es codificada usando la codificación de transformada o la codificación predictiva, o procedimiento similar. Ver, por ejemplo, las Figs. 4a y 4b, que muestran un par de codificador de señal de información y decodificador de señal de información. Del lado de la codificación, el codificador núcleo 16 sucede a un remuestreador representado como se muestra en la Fig. 3a, es decir, una concatenación de un banco de filtro de análisis 38 y un banco de filtro de síntesis 42 de longitud de transformada variable. Como se observa con anterioridad, a fin de lograr una tasa de muestra descendente variable con el tiempo entre la entrada del banco de filtro de análisis 38 y la salida del banco de filtro de síntesis 42, el banco de filtro de síntesis 42 aplica su retransformación en una subporción del espectro de rango constante, es decir, las transformadas de longitud constante y la tasa de transformada constante 46, que salen del banco de filtro de análisis 38, donde sus subporciones tienen la longitud variable de tiempo de la longitud de transformada del banco de filtro de síntesis 42. La variación de tiempo se ilustra mediante la flecha de doble cabeza 48. Si bien la porción de menor frecuencia 50 remuestreada por la concatenación del banco de filtro de análisis 38 y el banco de filtro de síntesis 42 es codificada por el codificador núcleo 16, el resto, es decir, la porción de frecuencia más alta 52, que forma la porción de frecuencia restante del espectro 46, puede someterse a una codificación paramétrica de su cubierta en el codificador de cubierta paramétrico 54. La corriente de datos de núcleo 56 es entonces acompañada por una corriente de datos de codificación paramétrica 58 que sale de un codificador de cubierta paramétrico 54.
[0020] Del lado de la decodificación, el decodificador comprende, asimismo, el decodificador núcleo 22, seguido de un remuestreador implementado como se muestra en la Fig. 3b, es decir, por un banco de filtro de análisis 40 seguido de un banco de filtro de síntesis 44, donde el banco de filtro de análisis 40 tiene una longitud de transformada variable con el tiempo sincronizada con respecto a la variación de tiempo de la longitud de transformada del banco de filtro de síntesis 42 del lado de la codificación. Si bien el decodificador núcleo 22 recibe la corriente de datos núcleo 56 a fin de decodificarla, se proporciona un decodificador de cubierta paramétrico 60 que tiene el objetivo de recibir la corriente de datos paramétricos 58 y derivar desde allí una porción de frecuencia más
alta 52’, que complementa una porción de frecuencia menor 50 de una longitud de transformada variable, a decir,
una longitud sincronizada con respecto a la variación de tiempo de la longitud de transformada utilizada por el banco de filtro de síntesis 42 del lado de la codificación y sincronizada con respecto a la variación de la tasa de muestreo que sale del decodificador núcleo 22.
[0021] En el caso del codificador de la Fig. 4a, es conveniente que el banco de filtro de análisis 38 esté presente de todos modos, de manera que la conformación del remuestreador solo necesite la adición del banco de filtro de síntesis 42. Mediante el cambio de la tasa de muestra, es posible adaptar la relación de la porción LF [sigla en inglés de: baja frecuencia] del espectro 46, que se somete a una codificación núcleo más exacta, en comparación con la porción HF [sigla en inglés de: alta frecuencia] que se somete meramente a la codificación de cubierta paramétrica. En particular, la relación puede controlarse de manera eficiente de acuerdo con las condiciones externas tales como el ancho de banda de transmisión disponible para la transmisión de la corriente de datos total, o similar. La variación de tiempo controlada del lado de la codificación es fácil de señalizar hacia el lado de la decodificación mediante, por ejemplo, los datos de información del lado respectivo.
[0022] Por lo tanto, con respecto a las Figs. 1a a 4b, se ha demostrado que sería favorable si se tuviera un concepto rápidamente, que permita de manera eficaz un cambio de tasa de muestreo, a pesar de uso de representaciones de transformada superpuesta que necesitan la cancelación del aliasing de tiempo. La Fig. 5 muestra una realización de un reconstructor de señal de información que, si se utilizara para la implementación del banco de filtro de síntesis 42
o el retransformador 36 en la Fig. 2b, superaría los problemas reseñados anteriormente, y lograría la explotación de las ventajas de dicho cambio de tasa de muestra como se reseña co anterioridad.
[0023] El reconstructor de señal de información que se muestra en la Fig. 5 comprende un retransformador 70, un remuestreador 72 y una combinadora 74, que se conectan de manera sucesiva en el orden mencionado, entre una entrada 76 y una salida 78 del reconstructor de señal de información 80. El reconstructor de señal de información que se muestra en la Fig. 5 es para la reconstrucción, utilizando la cancelación del aliasing, una señal de información de una representación de transformada superpuesta de la señal de información que entra en la entrada
76. Es decir, el reconstructor de señal de información tiene el fin de dar salida, en la salida 78, a la señal de información a una tasa de muestra variable con el tiempo, usando la representación de transformada superpuesta de esta señal de información a medida que entra en la entrada 76. La representación de transformada superpuesta de la señal de información comprende, para cada una de las regiones de tiempo de superposición consecutivas (o intervalos de tiempo) de la señal de información, una transformada de una versión en ventana de la región respectiva. Como se reseñará en más detalle a continuación, el reconstructor de señal de información 80 está configurado para reconstruir la señal de información a una tasa de muestra que cambia en un borde 82 entre una región precedente 84 y una región sucesora 86 de la señal de información 90.
[0024] Con el fin de explicar la funcionalidad de los módulos individuales 70 a 74 del reconstructor de señal de información 80, se asume preliminarmente que la representación de transformada superpuesta de la señal de información que entra en la entrada 76 tiene una resolución de tiempo/frecuencia constante, es decir, una constante de resolución en tiempo y frecuencia. Más adelante, se describe otro escenario.
[0025] De acuerdo con la hipótesis recién mencionada, la representación de transformada superpuesta podría pensarse como se muestra en 92 en la Fig. 5. Tal como se expone, la representación de transformada superpuesta comprende una secuencia de transformadas que son consecutivas en el tiempo, con una cierta tasa de
transformada Δt. Cada transformada 94 representa una transformada de una versión en ventana de una respectiva
región de tiempo i de la señal de información. En particular, a medida que la resolución de frecuencia es constante en el tiempo para la representación 92, cada transformada 94 comprende un número constante de coeficientes de transformada, a decir, Nk. Esto significa efectivamente que la representación 92 es un espectrograma de la señal de información que comprende componentes espectrales Nk o sub–bandas que pueden estar estrictamente ordenados a lo largo de un eje espectral k, como se ilustra en la Fig. 5. En cada componente espectral o sub–banda, los coeficientes de transformada dentro del espectrograma se producen a la tasa de transformada Δt .
[0026] Una representación de transformada superpuesta 92 que tiene dicha resolución de tiempo/frecuencia constante, por ejemplo, sale de un banco de filtro de análisis QMF como se muestra en la Fig. 3a. En este caso, cada coeficiente de transformada será asignado un valor complejo, es decir, por ejemplo, cada coeficiente de transformada tendrá una parte real y una imaginaria. Sin embargo, los coeficientes de transformada de la representación de transformada superpuesta 92 no necesariamente tienen un valor complejo, sino que también podrían ser solamente de un valor real, tal como en el caso de una MDCT pura. Además, se observa que la realización de la Fig. 5 también sería transferible a otras representaciones de transformada superpuesta que causan aliasing en las porciones de superposición de las regiones de tiempo, cuyas transformadas 94 están consecutivamente dispuestas dentro de la representación de transformada superpuesta 92.
[0027] El retransformador 70 está configurado para aplicar una retransformación sobre las transformadas 94, de modo de obtener, para cada transformada 94, una retransformada ilustrada por una respectiva cubierta de tiempo 96 para regiones de tiempo consecutivas 84 y 86, donde el cubierta de tiempo corresponde aproximadamente a la ventana aplicada a las porciones de tiempo mencionadas con anterioridad de la señal de información a fin de lograr la secuencia de transformadas 94. Siempre que se refiera a la región de tiempo precedente 84, la Fig. 5 asume que el retransformador 70 ha aplicado la retransformación sobre la transformada completa 94 asociada con dicha región 84 en la representación de transformada superpuesta 92, de manera que la retransformada 96 para la región 84 comprende, por ejemplo, muestras Nk o muestras Nk de dos tiempos –en cualquier caso, tantas muestras como conforman la porción de ventana de la cual se obtuvo la respectiva transformada 94– que muestrean la longitud temporal completa Δt de la región de tiempo 84, donde el factor es un factor que determina la superposición entre las regiones de tiempo consecutivas a partir de las cuales se han generado las transformadas 94 de la representación 92. Debe observarse aquí que la igualdad (o duplicación) del número de muestras de tiempo dentro de la región de tiempo 84 y el número de coeficientes de transformada dentro de la transformada 94 que pertenecen a dicha región de tiempo 84 se han seleccionado meramente con propósitos de ilustración, y que la igualdad (o duplicación) también puede reemplazarse por otra relación constante entre ambos números de acuerdo con una realización alternativa, conforme a la transformada superpuesta detallada utilizada.
[0028] Se asume ahora que el reconstructor de señal de información busca cambiar la tasa de muestra de la señal de información entre la región de tiempo 84 y la región de tiempo 86. La motivación para esto puede originarse de una señal externa 98. Si, por ejemplo, el reconstructor de señal de información 80 se usa para la implementación del banco de filtro de síntesis 42 de la Fig. 3a y la Fig. 4a, respectivamente, la señal 98 puede proporcionarse cada vez que un cambio de tasa de muestra promete una codificación más eficiente, tal como el curso de un cambio en las condiciones de transmisión de la corriente de datos.
[0029] En el presente caso, se asume, con propósitos de ilustración, que el reconstructor de señal de información 80 busca reducir la tasa de muestra entre las regiones de tiempo 84 y 86. En consecuencia, el retransformador 70 además aplica una retransformación sobre la transformada de la versión en ventana de la región sucesora 86, de modo de obtener la retransformada 100 para la región sucesora 86, aunque, esta vez, el retransformador 70 utilizada una longitud de transformada menor para efectuar la retransformación. Con mayor precisión, el retransformador 70 realiza la retransformación sobre el menor Nk’ < Nk de los coeficientes de transformada de la transformada para la región sucesora 86 solamente, es decir, los coeficientes de transformada 1 … Nk’, de modo que la retransformada 100 obtenida comprende una tasa de muestra menor, es decir, es muestreada solamente con Nk’ en lugar de Nk (o una fracción correspondiente de este último número).
[0030] Como se ilustra en la Fig. 5, el problema que se produce entre las retransformadas 96 y 100 es el siguiente. La retransformada 96 para la región precedente 84 y la retransformada 100 para la región sucesora 86 se superponen en una porción de cancelación del aliasing 102 en un borde 82 entre las regiones precedente y sucesora 84 y 86, donde la longitud de tiempo de la porción de cancelación del aliasing es, por ejemplo, (a – 1) · Δt, si bien el número de muestras de la retransformada 96 dentro de esta porción de cancelación del aliasing 102 es diferente (en este ejemplo, es superior) al número de muestras de la retransformada 100 dentro de la misma porción de cancelación del aliasing 102. Por lo tanto, la cancelación del aliasing de tiempo efectuando la superposición– adición de ambas retransformadas, 96 y 100, en dicho intervalo de tiempo 102 no es directa.
[0031] En consecuencia, el remuestreador 72 está conectado entre el retransformador 70 y la combinadora 74, donde esta última es responsable de realizar la cancelación del aliasing de tiempo. En particular, el remuestreador 72 está configurado para remuestrear, mediante la interpolación, la retransformada 96 para la región precedente 84 y/o la retransformada 100 para la región sucesora 86 en la porción de cancelación del aliasing 102 de acuerdo con el cambio de tasa de muestra en el borde 82. A medida que la retransformada 96 llega a la entrada del remuestreador 72 antes que la retransformada 100, puede ser preferible que el remuestreador 72 realice el remuestreado sobre la retransformada 96 para la región precedente 84. Es decir, mediante la interpolación 104, la correspondiente porción de la retransformada 96 contenida dentro de la porción de cancelación del aliasing 102 será remuestreada, de modo de corresponderse con la condición de muestreo o las posiciones de muestreo de la retransformada 100 dentro de la misma porción de cancelación del aliasing 102. La combinadora 74 simplemente puede entonces agregar muestras colocalizadas desde la versión remuestreada de la retransformada 96 y la retransformada 100, a fin de obtener la señal reconstruida 90 dentro de dicho intervalo de tiempo 102 a la nueva tasa de muestra. En ese caso, la tasa de muestra en la señal reconstruida de salida cambiará de la primera a la nueva tasa de muestra en el extremo conductor (inicio) de la porción de tiempo 86. Sin embargo, la interpolación también podría aplicarse de manera diferente para una mitad conductora y de cola del intervalo de tiempo 102, a fin de lograr otro punto 82 en el tiempo para el cambio de la tasa de muestra en la señal reconstruida 90. De este modo, el instante de tiempo 82 se ha trazado en la Fig. 5 para encontrarse en el medio de la superposición entre las porciones 84 y 86, solo con propósitos de ilustración, y de acuerdo con otras realizaciones, el mismo punto en el tiempo puede encontrarse en algún otro lugar entre el inicio de la porción 86 y el final de la porción 84, ambos, de manera inclusiva.
[0032] Por lo tanto, la combinadora 74 es entonces capaz de efectuar la cancelación del aliasing entre las retransformadas 96 y 100 para las regiones precedente y sucesora 84 y 86, respectivamente, según lo obtenido por el remuestreado en la porción de cancelación del aliasing 102. Con mayor precisión, a fin de cancelar el aliasing dentro de la porción de cancelación del aliasing 102, la combinadora 74 realiza un proceso de superposición–adición entre las retransformadas 96 y 100 dentro de la porción 102, usando la versión remuestreada obtenida por el remuestreador 72. El proceso de superposición–adición logra, junto con el ventaneado para la generación de las transformadas 94, una reconstrucción libre de aliasing y constantemente amplificada de la señal de información 90 en la salida 78, incluso a través del borde 82, aun cuando la tasa de muestra de la señal de información 90 cambia en el instante de tiempo 82 de una tasa de muestra más alta a una tasa de muestra menor.
[0033] En consecuencia, como resulta de la descripción anterior de la Fig. 5, la relación de la longitud de transformada de la retransformación aplicada a la transformada 94 de la versión ventaneada de la región de tiempo precedente 84 a una longitud temporal de la región precedente 84 difiere de una relación de una longitud de transformada de la retransformación aplicada a la versión ventaneada de la región sucesora 86 a una longitud temporal de la región sucesora 86 por un factor que corresponde al cambio de la tasa de muestra en el borde 82 entre ambas regiones, 84 y 86. En el ejemplo que se acaba de describir, este cambio de relación se ha iniciado de manera ilustrativa mediante una señal externa 98. Se ha asumido que las longitudes temporales de las regiones de tiempo precedente y sucesora 84 y 86 son iguales entre sí, y el retransformador 70 se configuró para restringir la aplicación de la retransformación sobre la transformada 94 de la versión ventaneada de la región sucesora 86 sobre una de sus porciones de baja frecuencia, por ejemplo, hasta el coeficiente de transformada Nk’– de la transformada.
Naturalmente, dicha captura ya podría haber tenido lugar también con respecto a la transformada 94 de la versión ventaneada de la región precedente 84. Además, contrariamente a la ilustración anterior, el cambio de tasa de muestra en el borde 82 podría haberse efectuado en la otra dirección, y en consecuencia, no puede realizarse ninguna captura con respecto a la región sucesora 86, sino, meramente, en cambio, con respecto a la transformada 94 de la versión ventaneada de la región precedente 84.
[0034] Con mayor precisión, hasta ahora, el modo de operación del reconstructor de señal de información de la Fig. 5 se ha descripto de manera ilustrativa para un caso donde una longitud de transformada de la transformada 94 de la versión ventaneada de las regiones de la señal de información y una longitud temporal de las regiones de la señal de información son constantes, es decir, la representación de transformada superpuesta 92 fue un espectrograma que tenía una resolución constante de tiempo/frecuencia. A fin de localizar el borde 82, el reconstructor de señal de información 80 se describió de manera ejemplar para responder a una señal de control 98.
[0035] En consecuencia, en esta configuración, el reconstructor de señal de información 80 de la Fig. 5 podría ser parte del remuestreador 14 de la Fig. 3a. En otras palabras, el remuestreador 14 de la Fig. 3a podría estar compuesto por una concatenación de un banco de filtro 38 para proporcionar una representación de transformada superpuesta de una señal de información, y un banco de filtro inverso, que comprende un reconstructor de señal de información 80 configurado para reconstruir, usando la cancelación del aliasing, la señal de información de la representación de transformada superpuesta de la señal de información como se describe hasta ahora. El retransformador 70 de la Fig. 5, en consecuencia, podría configurarse como un banco de filtro de síntesis QMF, donde, por ejemplo, el banco de filtro 38 es implementado como banco de filtro de análisis QMF.
[0036] Como queda claro de la descripción de las Figs. 1a y 4a, un codificador de señal de información podría comprender dicho remuestreador, junto con una etapa de compresión tal como el codificador núcleo 16 o la conglomeración del codificador núcleo 16 y el codificador de cubierta paramétrico 54. La etapa de compresión será configurada de manera de comprimir la señal de información reconstruida. Como se muestra en las Figs. 1 y 4a, dicho codificador de señal de información podría comprender además un controlador de tasa de muestra configurado para el control de la señal de control 98, de acuerdo, por ejemplo, con una información externa en la tasa de bits de transmisión disponible.
[0037] Sin embargo, alternativamente, el reconstructor de señal de información de la Fig. 5 podría ser configurado para localizar el borde 82 mediante la detección de un cambio en la longitud de la transformada de la versión ventaneada de las regiones de la señal de información dentro de la representación de transformada superpuesta. Con el fin de aclarar esta posible implementación, ver 92’ en la Fig. 5, donde se muestra un ejemplo de una representación de transformada superpuesta de llegada de acuerdo con la cual las trasformadas consecutivas 94
dentro de la representación 92’ aún llegan al retransformador 70 a una tasa de transformada constante Δt, si bien la
longitud de la transformada de la transformada individual cambia. En la Fig. 5, por ejemplo, se asume que la longitud de transformada de la transformada de la versión ventaneada de la región de tiempo precedente 84 es mayor que (a decir, Nk) la longitud de transformada de la transformada de la versión ventaneada de la región sucesora 86, que se asume es meramente Nk’. De algún modo, el retransformador 70 es capaz de analizar correctamente la información sobre la representación de transformada superpuesta 92’ de la corriente de datos de entrada, y en consecuencia, el retransformador 70 puede adaptar una longitud de transformada de la retransformación aplicada sobre la transformada de la versión ventaneada de las regiones consecutivas de la señal de información, a la longitud de
transformada de las transformadas consecutivas de la representación de transformada superpuesta 92’. Por lo tanto,
el retransformador 70 puede utilizar una longitud de transformada de Nk para la retransformación de la transformada 94 de la versión ventaneada de la región de tiempo precedente 84, y una longitud de transformada de un Nk’ para la retransformación de la transformada de la versión ventaneada de la región de tiempo sucesora 86, de modo de obtener la discrepancia de tasa de muestra entre las retransformaciones que ya se ha descripto anteriormente y que se muestra en la Fig. 5 en la parte media superior de esta figura. En consecuencia, en términos del modo de operación del reconstructor de señal de información 80 de la Fig. 5, este modo de operación coincide con la descripción anterior, además de la diferencia recién mencionada en la adaptación de la longitud de transformada de la retransformación a la longitud de transformada de las transformadas dentro de la representación de transformada
superpuesta 92’.
[0038] Por consiguiente, de acuerdo con esta última funcionalidad, el reconstructor de señal de información no tendrá que responder a una señal de control externa 98. En cambio, la representación de transformada superpuesta
de llegada 92’ podría ser suficiente para informar al reconstructor de señal de información sobre los puntos de
cambio de tasa de muestra en el tiempo.
[0039] El reconstructor de señal de información 80 que opera como se acaba de describir podría usarse a fin de formar el retransformador 36 de la Fig. 2b. Esto es, un decodificador de señal de información podría comprender un
descompresor 34 configurado para reconstruir la representación de transformada superpuesta 92’ de la señal de
información a partir de una corriente de datos. Como ya se ha descripto, la reconstrucción podría involucrar la decodificación de entropía. La longitud de transformada variable con el tiempo de las transformadas 94 podría ser señalizada dentro de la corriente de datos que entra en el descompresor 34 en una manera apropiada. Un reconstructor de señal de información como se muestra en la Fig. 5 podría usarse como el reconstructor 36. Podría configurarse igual para la reconstrucción, usando la cancelación del aliasing, la señal de información de la representación de transformada superpuesta proporcionada por el descompresor 34. En este último caso, el retransformador 70, por ejemplo, podría operarse de modo de utilizar una IMDCT [MDCT inversa] a fin de efectuar las retransformaciones, y la transformada 94 podría representarse por medio de coeficientes de valor real en lugar de coeficientes de valor complejo.
[0040] Por lo tanto, las realizaciones anteriores permiten el logro de muchas ventajas. Para códecs de audio que operan a un rango completo de tasa de bits, por ejemplo, tal como de 8 kb por segundo a 128 kb por segundo, una tasa de muestra óptima puede depender de la tasa de bits como se ha descripto con anterioridad con respecto a las Figs. 4a y 4b. Para tasas de bits menores, solo debería codificarse la menor frecuencia, por ejemplo, con procedimientos de codificación más exactos como ACELP o la codificación de transformada, mientras que las frecuencias más altas deberían ser codificadas de una manera paramétrica. Para tasas de bits altas, el espectro completo, por ejemplo, sería codificado con los procedimientos exactos. Esto significa, por ejemplo, que dichos procedimientos exactos siempre deberían codificar señales a una representación óptima. La tasa de muestra de dichas señales debe ser optimizada, de modo de permitir el transporte de los componentes de frecuencia de señal más relevantes de acuerdo con el teorema de Nyquist. En consecuencia, con respecto a la Fig. 4a., el controlador de tasa de muestra 120 allí expuesto podría configurarse de modo de controlar la tasa de bits de muestra a la cual se alimenta la señal de información en el codificador núcleo 16 de acuerdo con la tasa de bits de transmisión disponible. Esto corresponde a la alimentación de solo una subporción de frecuencia menor del espectro del banco de filtro de análisis en el codificador núcleo 16. La porción de frecuencia más alta restante podría ser alimentada en el codificador de cubierta paramétrico 54. La varianza de tiempo en la tasa de muestra y la tasa de bits de transmisión, respectivamente, no es un problema, como se describe con anterioridad.
[0041] La descripción de la Fig. 5 se refiere a la reconstrucción de señal de información que podría usarse a fin de abordar un problema de cancelación del aliasing de tiempo en las instancias de tiempo de cambio de tasa muestra. Como ya se menciona anteriormente con respecto a las Figs. 1 a 4b, deben tomarse además algunas medidas en las interfases entre los módulos consecutivos en los escenarios de las Figs. 1 a 4b, donde un transformador debe generar una representación de transformada superpuesta que luego entra en el reconstructor de señal de información de la Fig. 5.
[0042] La Fig. 6 muestra una realización para un transformador de señal de información. El transformador de señal de información de la Fig. 6 comprende una entrada 105 para recibir una señal de información en la forma de una secuencia de muestras; un capturador 106, configurado para capturar regiones de superposición consecutivas de la señal de información; un remuestreador 107, configurado para la aplicación de un remuestreado sobre por lo menos un subconjunto de las regiones de superposición consecutivas, de manera que cada una de las regiones de superposición consecutivas tenga una tasa de muestra constante, donde, sin embargo, la tasa de muestra constante varía entre las regiones de superposición consecutivas; un ventaneador 108, configurado para aplicar un ventaneado sobre las regiones de superposición consecutivas; y un transformador, configurado para la aplicación de una transformación individualmente sobre las porciones ventaneadas, de modo de obtener una secuencia de transformadas 94 que forman la representación de transformada superpuesta 92’ que luego sale en una salida 110 del transformador de señal de información de la Fig. 6. El ventaneador 108 puede utilizar una ventana Hamming o similar.
[0043] El capturador 106 puede estar configurado para efectuar la captura de modo tal que las regiones de superposición consecutivas de la señal de información tengan igual longitud en el tiempo, tal como 20 ms cada una.
[0044] En consecuencia, el capturador 106 avanza al remuestreador 107 una secuencia de porciones de señal de información. Asumiendo que la señal de información de llegada tiene una tasa de muestra variable en el tiempo que cambia de una primera tasa de muestra a una segunda tasa de muestra en un instante de tiempo predeterminado, por ejemplo, el remuestreador 107 puede configurarse a fin de remuestrear, mediante la interpolación, las porciones de señal de información de llegada que abarcan temporalmente la instancia de tiempo predeterminada, de modo que la tasa de muestra consecutiva cambia una vez de la primera tasa de muestra a la segunda tasa de muestra, como se ilustra en 111 en la Fig. 6. A fin de aclarar este punto, la Fig. 6 muestra en forma ilustrativa una secuencia de muestras 112, donde la tasa de muestra cambia en algún instante de tiempo 113, donde las regiones de longitud de tiempo constantes 114a a 114d ejemplarmente son capturadas con una compensación de región constante 115 Δt que define –junto con la longitud de tiempo de región constante –una superposición predeterminada entre regiones consecutivas 114a a 114d, tal como una superposición del 50% por pares consecutivos de regiones, si bien esto debe entenderse solo como un ejemplo. La primera tasa de muestra antes del instante de tiempo 113 se ilustra con δt1, y la tasa de muestra después del instante de tiempo 113 se indica por δt2. Tal como se ilustra en 111, el remuestreador 107, por ejemplo, puede configurarse de modo de remuestrear la región 114b de modo de tener la tasa de muestra constante δt1, donde, sin embargo, la región 114c que sucede en el tiempo es remuestreada de modo de tener la tasa de muestra constante δt2. En principio, puede ser suficiente si el remuestreador 107 remuestrea, mediante la interpolación, la subparte de las respectivas regiones 114b y 114c que abarcan temporalmente el instante de tiempo 113, que aún no tiene la tasa de muestra objetivo. En el caso de la región 114b, por ejemplo, puede ser suficiente si el remuestreador 107 remuestrea la subparte que sucede en el tiempo, el instante de tiempo 113, mientras que en el caso de la región 114c, la subparte que precede el instante de tiempo 113 puede ser solo remuestreada. En dicho caso, debido a la longitud de tiempo constante de las regiones capturadas 114a a 114d, cada región remuestreada tiene un número de muestras de tiempo N1,2 que corresponden a la respectiva tasa de muestra constante δt1,2. El ventaneador 108 puede adaptar su ventana o longitud de ventana a este número de muestras para cada porción de llegada, y lo mismo se aplica al transformador 109, que puede adaptar su longitud de transformada de su transformación de manera consecuente. Es decir, en el caso del ejemplo que se ilustra en 111 en la Fig. 6, la representación de transformada superpuesta en la salida 110 tiene una secuencia de transformadas, cuya longitud de transformada varía, es decir, aumenta y disminuye, en línea con la cantidad de muestras de las regiones consecutivas, es decir, de manera linealmente dependiente de dicha cantidad, y, a su vez, de la tasa de muestra constante a la cual la región respectiva se ha remuestreado.
[0045] Debe observarse que el remuestreador 107 puede configurarse de modo tal de registrar el cambio de tasa de muestra entre las regiones consecutivas 114a a 114d, de modo que el número de muestras que deben ser remuestreadas dentro de las respectivas regiones es mínimo. Sin embargo, el remuestreador 107, alternativamente, puede configurarse de manera diferente. Por ejemplo, el remuestreador 107 puede configurarse a fin de preferir el muestreo ascendente sobre el muestreo descendente, o viceversa, es decir, de modo de realizar el remuestreo de manera tal que todas las regiones que se superponen con el instante de tiempo 113 son remuestreadas sobre la primera tasa de muestra δt1 o sobre la segunda tasa de muestra δt2.
[0046] El transformador de señal de información de la Fig. 6 puede usarse, por ejemplo, a fin de implementar el transformador 30 de la Fig. 2a. En tal caso, por ejemplo, el transformador 109 puede ser configurado para efectuar una MDCT.
[0047] En este sentido, debe observarse que la longitud de transformada de la transformación aplicada por el transformador 109 puede aun ser mayor que el tamaño de las regiones 114c medidas en el número de muestras remuestreadas. En dicho caso, las áreas de la longitud de transformada que se extienden más allá de las regiones ventaneadas que salen del ventaneador 108 pueden establecerse en cero antes de la aplicación de la transformación mediante el transformador 109.
[0048] Antes de proceder a describir posibles implementaciones para realizar la interpolación 104 en la Fig. 5 y la interpolación dentro del remuestreador 107 en la Fig. 6 en más detalle, se hace referencia a las Figs. 7a y 7b, que muestran posibles implementaciones para los codificadores y decodificadores de las Figs. 1a y 1b. En particular, los remuestreadores 14 y 24 están representados como se muestra en las Figs. 3a y 3b, mientras que el codificador núcleo y el decodificador núcleo 16 y 22, respectivamente, están representados como un códec que es capaz de cambiar entre la codificación de transformada a base de MDCT por una parte, y la codificación CELP, tal como la codificación ACELP, por otra parte. Las ramas de codificación y decodificación a base de MDCT 122 y 124, respectivamente, podrían ser, por ejemplo, un codificador TCX y decodificador TCX, respectivamente. De manera alternativa, podría usarse un par de codificador y decodificador AAC. Para la codificación CELP, un codificador ACELP 126 podría formar la otra rama de codificación del codificador núcleo 16, donde un decodificador ACELP 128 forma la otra rama de decodificación del decodificador núcleo 22. El cambio entre ambas ramas de codificación podría efectuarse sobre una base de trama por trama, como es el caso en USAC [2] o AMR–WB+ [1] al texto estándar al cual se hace referencia para más detalle respecto de estos módulos de codificación.
[0049] Tomando el codificador y el decodificador de las Figs. 7a y 7b como un ejemplo específico adicional, se describe en más detalle a continuación un esquema para permitir un cambio de la tasa de muestreo interno para la entrada de las ramas de codificación 122 y 126 y para la reconstrucción por las ramas de decodificación 124 y 128. En particular, la señal de entrada que entra en la entrada 12 puede tener una tasa de muestra constante tal como de 32 kHz. La señal puede ser remuestreada usando el par de bancos de filtro de análisis QMF y de síntesis 38 y 42 de la manera descripta con anterioridad, es decir, con una relación adecuada de análisis y síntesis con respecto a la cantidad de bandas, por ejemplo, 1,25 o 2,5, para conducir a una señal de tiempo interna que entra en el codificador núcleo 16 que tiene una tasa de muestra dedicada de, por ejemplo, 25,6 kHz o 12,8 kHz. La señal de muestreo descendente es así codificada usando una de las ramas de codificación de los modos de codificación, por ejemplo, usando una representación MDCT y un esquema de codificación de transformada clásico en el caso de la rama de codificación 122, o en el dominio de tiempo usando ACELP, por ejemplo, en la rama de codificación 126. La corriente de datos así formada por las ramas de codificación 126 y 122 del codificador núcleo 16 sale y es transportada al lado de la decodificación, donde se somete a la reconstrucción.
[0050] Para el cambio de la tasa de muestra interna, los bancos de filtro 38 a 44 deben ser adaptados sobre una base de trama por trama, de acuerdo con la tasa de muestra interna a la cual operarán el codificador núcleo 16 y el decodificador núcleo 22. La Fig. 8 muestra algunos escenarios de cambios posibles, donde la Fig. 8 muestra meramente la vía de codificación MDCT del codificador y el decodificador.
[0051] En particular, la Fig. 8 muestra que la tasa de muestra de entrada que se asume es 32 kHz puede ser muestreada en forma descendente a cualquiera de 25,6 kHz, 12,8 kHz u 8 kHz, con una posibilidad adicional de mantener la tasa de muestra de entrada. De acuerdo con la relación de tasa de muestra seleccionada entre la tasa de muestra de entrada y la tasa de muestra interna, hay una relación de longitud de transformada entre el análisis del banco de filtro por una parte, y la síntesis del banco de filtro, por otra parte. Las relaciones son derivables de la Fig. 8 dentro de las cajas sombreadas de gris: 40 sub–bandas en los bancos de filtro 38 y 44, respectivamente, independientes de la tasa de muestra interna seleccionada; y 40, 32, 16 o 10 sub–bandas en los bancos de filtro 42 y 40, respectivamente, de acuerdo con la tasa de muestra interna seleccionada. La longitud de transformada de la MDCT utilizada dentro del codificador núcleo se adapta a la tasa de muestra interna resultante, de modo que la tasa de transformada resultante o el intervalo de graduación de transformada medido en tiempo es constante o independiente de la tasa de muestra interna seleccionada. Por ejemplo, puede ser constantemente 20 ms para lograr una longitud de transformada de 640, 512, 256 y 160, respectivamente, de acuerdo con la tasa de muestra interna seleccionada.
[0052] Usando los principios reseñados con anterioridad, es posible cambiar la tasa de muestra interna obedeciendo las siguientes limitaciones con respecto al cambio de banco de filtro:
- –
- No se causa retardo adicional durante un cambio;
- –
- El cambio, o cambio de tasa de muestra, puede suceder instantáneamente;
- –
- Se minimizan los artefactos del cambio, o al menos se reducen; y
- –
- La complejidad computacional es baja.
[0053] Básicamente, los bancos de filtro 38–44 y la MDCT dentro del codificador núcleo son las transformadas superpuestas donde los bancos filtro pueden utilizar una superposición más alta de las regiones ventaneadas cuando se compara con la MDCT del codificador núcleo y el decodificador. Por ejemplo, puede aplicarse una superposición de 10 veces para los bancos filtro, mientras que puede aplicarse una superposición de 2 veces para las MDCT 122 y 124. Para las transformadas superpuestas, los búfers de estado pueden describirse como un búfer de ventana de análisis para los bancos de filtro de análisis y las MDCT, y los búfers de superposición–adición para los bancos de filtro de síntesis y las IMDCT. En el caso del cambio de tasa, dichos búfers de estado deberían ajustarse de acuerdo con el cambio de tasa de muestra de la manera descripta con anterioridad con respecto a la Fig. 5 y la Fig. 6. En lo que sigue, se proporciona una descripción más detallada con respecto a la interpolación que también puede efectuarse del lado del análisis que se describe en la Fig. 6, en lugar del caso de la síntesis que se describen con respecto a la Fig. 5. El prototipo o la ventana de la transformada superpuesta puede adaptarse. A fin de reducir los artefactos del cambio, los componentes de señal en los búfers de estado deben conservarse a fin de mantener la propiedad de cancelación del aliasing de la transformada superpuesta.
[0054] En lo que sigue, se proporciona una descripción más detallada en términos de cómo realizar la interpolación 104 dentro del remuestreador 72.
[0055] Pueden distinguirse dos casos:
1) El cambio ascendente es un proceso de acuerdo con el cual la tasa de muestra aumenta desde la porción de tiempo precedente 84 hasta una porción de tiempo subsiguiente o sucesora 86.
2) El cambio descendente es un proceso de acuerdo con el cual la tasa de muestra disminuye desde la región de tiempo precedente 84 hasta la región de tiempo sucesora 86.
[0056] Asumiendo un cambio ascendente, es decir, tal como de 12,8 kHz (256 muestras por 20 ms) a 32 kHz (640 muestras por 20 ms), los búfers de estado, tales como el búfer de estado del remuestreador 72 expuesto en forma ilustrativa con el signo de referencia 130 en la Fig. 5, o su contenido, deben ser expandidos un factor correspondiente al cambio de tasa de muestra, tal como 2,5 en el ejemplo dado. Las posibles soluciones para una expansión sin causar retardo adicional son, por ejemplo, una interpolación lineal o una interpolación flexible. Esto es, el remuestreador 72 puede, al vuelo, interpolar las muestras de la cola de la retransformada 96 relacionadas con la región de tiempo precedente 84, que yacen dentro del intervalo de tiempo 102, dentro del búfer de estado 130. El búfer de estado, como se ilustra en la Fig. 5, puede actuar como un búfer de salida primero en primero. Naturalmente, no todos los componentes de frecuencia necesarios para una cancelación completa del aliasing pueden obtenerse por este procedimiento; en cambio, al menos una frecuencia menor, tal como de 0 a 6,4 kHz, puede ser generada sin ninguna distorsión, y desde un punto de vista psicoacústico, dichas frecuencias son las más relevantes.
[0057] Para los casos de cambio descendente a tasas de muestra menores, puede usarse además la interpolación lineal o flexible para diezmar el búfer de estado consecuentemente, sin causar retardo adicional. Esto es, el
remuestreador 72 puede diezmar la tasa de muestra mediante la interpolación. Sin embargo, un cambio descendente a tasas de muestra donde el factor de diezmado es grande, tal como el cambio de 32 kHz (640 muestras por 20 ms) a 12,8 kHz (256 muestras por 20 ms), donde el factor de diezmado es 2,5, puede causar aliasing de grave alteración, si los componentes de alta frecuencia no son eliminados. Para revertir este fenómeno, 5 puede comprometerse la filtración de síntesis, donde los componentes de mayor frecuencia pueden ser eliminados
“descargando” el banco de filtro o el retransformador. Esto significa que el banco de filtro sintetiza componentes de menos frecuencia en el instante de cambio, y por lo tanto, aclara el búfer de superposición–adición de componentes espectrales altos. Con mayor precisión, imaginen un cambio descendente de una primera tasa de muestra para la región de tiempo precedente 84 a una menor tasa de muestra, para la región de tiempo sucesora 86. Desviándose 10 de la descripción anterior, el retransformador 70 puede configurarse a fin de preparar el cambio descendente no permitiendo que todos los componentes de frecuencia de la transformada 94 de la versión ventaneada de la región de tiempo precedente 84 participen en la retransformación. En cambio, el retransformador 70 puede excluir los componentes de alta frecuencia no relevantes de la transformada 94, de la retransformación, estableciéndolos en 0, por ejemplo, o de otro modo, reduciendo su influencia sobre la retransformada, por ejemplo, mediante la atenuación 15 gradual de estos componentes de frecuencia más alta de manera creciente. Por ejemplo, los componentes de alta frecuencia afectados pueden ser aquellos sobre el componentes de frecuencia Nk’. Por lo tanto, en la señal de información resultante, una región de tiempo 84 se ha reconstruido intencionalmente a un ancho de banda espectral que es menor que el ancho de banda que hubiera estado disponible en la representación de transformada superpuesta que entra en la entrada 76. Por otra parte, sin embargo, los problemas del aliasing que se producen de
20 otro modo en el proceso de superposición–adición mediante la introducción no intencional de porciones de frecuencia más alta en el proceso de cancelación del aliasing dentro de la combinadora 74, a pesar de la interpolación 104, son evitados.
[0058] Como una alternativa, puede generarse una representación de muestra baja adicional simultáneamente, para
25 ser usada en un búfer de estado apropiado para un cambio de una representación de tasa de muestra más alta. Esto garantizaría que el factor de diezmado (en el caso de que sea necesario el diezmado) siempre se mantiene relativamente bajo (es decir, menor que 2), y por lo tanto, no se producirán artefactos de alteración, causados por el aliasing. Como se menciona con anterioridad, esto no preservará todos los componentes de frecuencia, si bien por lo menos las frecuencias menores que son de interés con respecto a la relevancia psicoacústica.
30 [0059] Por lo tanto, de acuerdo con una realización específica, podría ser posible modificar el códec USAC de la siguiente manera, a fin de obtener una versión de bajo retardo de USAC. En primer lugar, solo podrían permitirse los modos de codificación TCX y ACELP. Los modos AAC podrían evitarse. La longitud de trama podría seleccionarse de modo de obtener un entramado de 20 ms. A continuación, podrían seleccionarse los siguientes parámetros del
35 sistema de acuerdo con el modo de operación (super–banda ancha (SWB), banda ancha (WB), banda angosta (NB), ancho de banda completo (FB)) y de la tasa de bits. Una reseña de los parámetros del sistema se proporciona en la siguiente tabla.
- Modo
- Tasa muestreo entrada [kHz] Tasa muestreo interno [kHz] Longitud de trama [muestras]
- NB
- 8 kHz 12,8 kHz 256
- WB
- 16 kHz 12,8 kHz 256
- SWB tasas bajas (12–32 kbps)
- 32 kHz 12,8 kHz 256
- SWB tasas altas (48–64 kbps)
- 32 kHz 25,6 kHz 512
- SWB tasas muy altas (96–128 kbps)
- 32 kHz 32 kHz 640
- FB
- 48 kHz 48 kHz 960
40 [0060] En términos del modo de banda angosta, el aumento de la tasa de muestra podría evitarse y ser reemplazado estableciendo la tasa de muestreo interno igual a la tasa de muestreo de entrada, es decir, 8 kHz, con la selección de la longitud de trama consecuentemente, es decir, para ser de 160 muestras de largo. Asimismo, podrían seleccionarse 16 kHz para el modo de operación de banda ancha, con la selección de la longitud de trama de la MDCT para TCX para ser de 320 muestras de largo, en lugar de 256.
45 [0061] En particular, sería posible sostener la operación de cambio a través de un listado entero de puntos de operación, es decir, tasas de muestreo, tasas de bits y anchos de banda sostenidos. La siguiente tabla reseña las diversas configuraciones con respecto a la tasa de muestreo interno de una versión de bajo retardo anticipada de un códec USAC.
- Ancho de banda
- Tasa de muestreo de entrada
- 8 kHz
- 16 kHz 32 kHz 48 kHz
- NB
- 12,8 kHz 12,8 kHz 12,8 kHz 12,8 kHz
- WB
- 12,8 kHz 12,8 kHz 12,8 kHz
- SWB
- 12,8; 25,6; 32 kHz 12,8; 25,6, 32 kHz
- FB
- 12,8; 25,6; 32; 48 kHz
[0062] Como información adicional, debe observarse que no es necesario utilizar el remuestreador de acuerdo con las Fig. 2a y 2b. Alternativamente, podría proporcionarse un juego de filtro IIR [sigla en inglés de: respuesta infinita al impulso] a fin de asumir la responsabilidad de la funcionalidad de remuestreo de la tasa de muestreo de entrada a la frecuencia de muestreo núcleo dedicada. El retardo de dichos filtros IIR es inferior a 0,5 ms, si bien, debido a la relación excedente entre la frecuencia de entrada y de salida, la complejidad es bastante considerable. Asumiendo un retardo idéntico para todos los filtros IIR, puede permitirse el cambio entre diferentes tasas de muestreo.
[0063] Por lo tanto, puede preferirse el uso de la realización del remuestreador de las Figs. 2a y 2b. El banco de filtro QMF del módulo de cubierta paramétrico (es decir, SBR) puede participar en la cooperación para ejemplificar la funcionalidad de remuestreo que se describe con anterioridad. En el caso de SWB, esto agregaría una etapa de banco de filtro de síntesis al codificador, mientras que la etapa de análisis ya está en uso debido al módulo codificador de SBR. Del lado del decodificador, la QMF ya es responsable de proporcionar la funcionalidad de muestreo ascendente cuando se permite SBR. Este esquema puede usarse en todos los otros modos de ancho de banda. La siguiente tabla proporciona una reseña de las configuraciones QMF necesarias.
- SR interno [0001] LD–USAC
- Tasa de muestreo de entrada
- 8 kHz
- 16 kHz 32 kHz 48 kHz
- 12,8 kHz
- 20 / 32 40 / 32 80 / 32 120 / 32
- 25,6 kHz
- – 80 / 64 120 / 64
- 32 kHz
- evita con retardo 120 / 80
- 48 kHz
- evita con retardo
[0064] Asumiendo una frecuencia de muestreo de entrada constante, el cambio entre las tasas de muestreo interno es permitido mediante el cambio del prototipo de síntesis QMF. Del lado de la decodificación, puede aplicarse la operación inversa. Obsérvese que el ancho de banda de una banda QMF es idéntico sobre el rango entero de puntos de operación.
[0065] Si bien se han descrito algunos aspectos en el contexto de un aparato, es claro que estos aspectos además representan una descripción del correspondiente procedimiento, donde un bloque o dispositivo corresponde a un paso de procedimiento o un rasgo de un paso de procedimiento. En forma análoga, los aspectos que se describen en el contexto de un paso de procedimiento representan además una descripción de un correspondiente bloque, ítem o rasgo de un correspondiente aparato. Algunos o la totalidad de los pasos de procedimiento pueden ejecutarse mediante (o usando) un aparato de soporte físico, por ejemplo, un microprocesador, una computadora programable
o un circuito electrónico. En algunas realizaciones, algunos de uno o más de los pasos de procedimiento más importantes pueden ser ejecutados por dicho aparato.
[0066] De acuerdo con ciertos requisitos de implementación, las realizaciones de la invención pueden ser implementadas en soporte físico o en soporte lógico. La implementación puede realizarse usando un medio de almacenamiento digital, por ejemplo, un disco flexible, un DVD [disco versátil digital], un Blu–Ray, un CD [disco compacto], una ROM [sigla en inglés de: memoria de solo lectura], una PROM [sigla en inglés de: memoria de solo lectura programable], una EPROM [sigla en inglés de: memoria de solo lectura programable borrable], una EEPROM [sigla en inglés de: memoria de solo lectura programable y borrable electrónicamente] o una memoria FLASH, que tienen señales de control legibles electrónicamente allí almacenadas, que cooperan (o son capaces de cooperar) con un sistema de computadora programable de manera de efectuar el respectivo procedimiento. Por lo tanto, el medio de almacenamiento digital puede ser legible por computadora.
[0067] Algunas realizaciones de acuerdo con la invención comprenden un portador de datos que tiene señales de control legibles electrónicamente, que son capaces de cooperar con un sistema de computadora programable, de modo de realizar uno de los procedimientos que se describen en esta solicitud.
[0068] En general, las realizaciones de la presente invención pueden implementarse como un producto de programa para computadora con un código de programa, donde el código de programa opera para llevar a cabo uno de los procedimientos cuando el producto de programa de computadora se ejecuta en una computadora. El código de programa, por ejemplo, puede ser almacenado en un portador legible por una máquina.
[0069] Otras realizaciones comprenden el programa de computadora para realizar uno de los procedimientos que se describen en esta solicitud, almacenado en un portador legible por una máquina.
[0070] En otras palabras, una realización del procedimiento de la invención, es, por lo tanto, un programa para computadora que tiene un código de programa para realizar uno de los procedimientos que se describen en esta solicitud, cuando el programa de computadora se ejecuta en una computadora.
[0071] Una realización adicional de los procedimientos de la invención es, por lo tanto, un portador de datos (o un medio de almacenamiento digital, o un medio legible por computadora) que comprende, allí grabado, el programa de computadora para efectuar uno de los procedimientos que se describen en esta solicitud. El portador de datos, el medio de almacenamiento digital o el medio grabado habitualmente son tangibles y/o no transicionales.
[0072] Una realización adicional del procedimiento de la invención es, por lo tanto, una corriente de datos o una secuencia de señales que representa el programa de computadora para realizar uno de los procedimientos que se describen en esta solicitud. La corriente de datos o la secuencia de señales, por ejemplo, puede configurarse para ser transferida por medio de una conexión de comunicación de datos, por ejemplo, mediante la Internet.
[0073] Una realización adicional comprende un medio de procesamiento, por ejemplo, una computadora, o un dispositivo lógico programable, configurado o adaptado para realizar uno de los procedimientos que se describen en esta solicitud.
[0074] Una realización más comprende una computadora que tiene instalado el programa de computadora para llevar a cabo uno de los procedimientos que se describen en la presente solicitud.
[0075] Una realización adicional de acuerdo con la invención comprende un aparato o un sistema configurado para la transferencia (por ejemplo, de manera electrónica u óptica) de un programa de computadora para la realización de uno de los procedimientos que se describen en esta solicitud, a un receptor. El receptor puede ser, por ejemplo, una computadora, un dispositivo móvil, un dispositivo de memoria o similar. El aparato o el sistema, por ejemplo, puede comprender un servidor de archivo para la transferencia del programa de computadora al receptor.
[0076] En algunas realizaciones, puede usarse un dispositivo lógico programable (por ejemplo, un serie de puertas lógicas programable en campo) a fin de llevar a cabo algunas o todas las funcionalidades de los procedimientos que se describen en esta solicitud. En algunas realizaciones, una serie de puertas lógicas programable en campo puede cooperar con un microprocesador, a fin de llevar a cabo uno de los procedimientos que se describen en esta solicitud. En general, los procedimientos se llevan a cabo, preferentemente, por medio de cualquier aparato de soporte físico.
[0077] Las realizaciones descriptas con anterioridad son meramente ilustrativas de los principios de la presente invención. Debe entenderse que serán evidentes para los expertos en la técnica modificaciones y variaciones de las disposiciones y los detalles que se describen en esta solicitud. Por lo tanto, se tiene la intención de limitarse solo al alcance de las reivindicaciones de patente inminentes, y no a los detalles específicos que se presentan a modo de descripción y explicación de las realizaciones de la presente solicitud.
Literatura:
[1]: 3GPP, “Audio codec processing functions; Extended Adaptive Multi–Rate – Wideband (AMR–WB+) codec; Transcoding functions”, 2009, 3GPP TS 26.290.
[2]: USAC codec (Unified Speech and Audio Codec), ISO/IEC CD 23003–3 fechado 24 de septiembre de 2010.
Claims (22)
- REIVINDICACIONES1. Un reconstructor de señal de información configurado para reconstruir, usando la cancelación del aliasing, una señal de información de una representación de transformada superpuesta de la señal de información que comprende, para cada una de regiones de superposición consecutivas de la señal de información, una transformada de una versión de ventana de la respectiva región, donde el reconstructor de señal de información está configurado para reconstruir la señal de información a una tasa de muestra que cambia en un borde (82) entre una región precedente (84) y una región sucesora (86) de la señal de información, donde el reconstructor de señal de información comprende:un retransformador (70) configurado para aplicar una retransformación sobre la transformada (94) de la versión de ventana de la región precedente (84), de modo de obtener una retransformada (96) para la región precedente (84), y aplicar una retransformación sobre la transformada de la versión de ventana de la región sucesora (86) de modo de obtener una retransformada (100) para la región sucesora (86), donde la retransformada(96) para la región precedente (84) y la retransformada (106) para la región sucesora (86) se superponen en una porción de cancelación del aliasing (102) en el borde (82) entre las regiones precedente y sucesora;un remuestreador (72) configurado para remuestrear, mediante la interpolación, la retransformación (96) para la región precedente (84) y/o la retransformada (100) para la región sucesora (86) en la porción de cancelación del aliasing (102) de acuerdo con un cambio de tasa de muestra en el borde (82); yuna combinadora (74) configurada para realizar la cancelación del aliasing entre las retransformadas (96, 100) para las regiones precedente y sucesora (84, 86) obtenidas por el remuestreo en la porción de cancelación del aliasing (102).
-
- 2.
- El reconstructor de señal de información de acuerdo con la reivindicación 1, donde el remuestreador está configurado para remuestrear la retransformada (96) para la región precedente en la porción de cancelación del aliasing de acuerdo con el cambio de tasa de muestra en el borde.
-
- 3.
- El reconstructor de señal de información de acuerdo con la reivindicación 1 o 2, donde una relación de una longitud de transformada de la retransformación aplicada a la transformada (94) de la versión de ventana de la región precedente (84), a una longitud temporal de la región precedente (84), difiere de una relación de una longitud de transformada de la retransformación aplicada a la versión de ventana de la región sucesora (86), a una longitud temporal de la región sucesora (86) por un factor que corresponde al cambio de tasa de muestra.
-
- 4.
- El reconstructor de señal de información de acuerdo con la reivindicación 3, donde las longitudes temporales de las regiones precedente y sucesora (84, 86) son iguales entre sí, y el retransformador (70) está configurado para restringir la aplicación de la retransformación sobre la transformada de la versión de ventana de la región precedente
(84) a una porción de baja frecuencia de la transformada de la versión de ventana de la región precedente, y/o restringir la aplicación de la retransformación sobre la transformada de la versión de ventana de la región sucesora sobre una porción de baja frecuencia de la transformada de la versión de ventana de la región sucesora. -
- 5.
- El reconstructor de señal de información de acuerdo con cualquiera de las reivindicaciones 1 a 4, donde una longitud de transformada de la transformada de la versión de ventana de las regiones de la señal de información y una longitud temporal de las regiones de la señal de información son constantes, y el reconstructor de señal de información está configurado para localizar el borde (82) que responde a una señal de control (98).
-
- 6.
- Un remuestreador compuesto por una concatenación de un banco de filtro (38) para proporcionar una representación de transformada superpuesta de una información de señal, y un banco de filtro inverso (42) que comprende un reconstructor de señal de información (80) configurado para reconstruir, usando la cancelación del aliasing, la señal de información a partir de la representación de transformada superpuesta de la señal de información de acuerdo con la reivindicación 5.
-
- 7.
- Un codificador de señal de información que comprende un remuestreador de acuerdo con la reivindicación 6 y una etapa de compresión (16) configurada para comprimir la señal de información reconstruida, donde el codificador de señal de información además comprende un control de tasa de muestra configurado para controlar la señal de control (98) de acuerdo con una información externa en tasa de bits de transmisión disponible.
-
- 8.
- El reconstructor de señal de información de acuerdo con cualquiera de las reivindicaciones 1 a 4, donde la longitud de transformada de la transformada de la versión de ventana de las regiones de la señal de información varía, mientras que una longitud temporal de las regiones de la señal de información es constante, donde el reconstructor de señal de información está configurado para localizar el borde (82) mediante la detección de un cambio en la longitud de transformada de la versión de ventana de las regiones de la señal de información.
-
- 9.
- El reconstructor de señal de información de acuerdo con la reivindicación 8, donde el retransformador está configurado para adaptar una longitud de transformada de la retransformación aplicada sobre la transformada de la
versión de ventana de las regiones precedente y sucesora, a la longitud de transformada de la transformada de la versión de ventana de las regiones precedente y sucesora. -
- 10.
- Un reconstructor de señal de información que comprende un descompresor (34) configurado para reconstruir una representación de transformada superpuesta de una señal de información de una corriente de datos, y un reconstructor de señal de información de acuerdo con la reivindicación 9, configurado para reconstruir, using la cancelación del aliasing, la señal de información a partir de la representación de transformada superpuesta.
-
- 11.
- El reconstructor de señal de información de acuerdo con cualquiera de las reivindicaciones 1 a 5, 8 y 9, donde la transformada superpuesta es críticamente muestreada tal como una MDCT.
-
- 12.
- El reconstructor de señal de información de acuerdo con cualquiera de las reivindicaciones 1 a 5, 8 y 9, donde la representación de transformada superpuesta es un banco de filtro de valor complejo.
-
- 13.
- El reconstructor de señal de información de acuerdo con cualquiera de las reivindicaciones 1 a 5, 8, 9, 11 y 12, donde el remuestreador está configurado para usar una interpolación lineal o flexible para la interpolación.
-
- 14.
- El reconstructor de señal de información de acuerdo con cualquiera de las reivindicaciones 1 a 5, 8, 9, 11 y 12, donde la tasa de muestra disminuye en el borde (82), y el retransformador (70) está configurado para, en la aplicación de la retransformación sobre la transformada (94) de la versión de ventana de la región precedente (84), atenuar, o establecer en cero, frecuencias más altas de la transformada (94) de la versión de ventana de la región precedente (84).
-
- 15.
- Un transformador de señal de información configurado para generar una representación de transformada superpuesta de una señal de información usando una transformada superpuesta causante de aliasing, que comprende:
una entrada (105), para recibir la señal de información en la forma de una secuencia de muestras;un capturador (106), configurado para capturar regiones de superposición consecutivas de la señal de información;un remuestreador (107), configurado para aplicar, mediante la interpolación, un remuestreado sobre por lo menos un subgrupo de las regiones de superposición consecutivas de las señales de información, de modo que cada una de las porciones de superposición consecutivas tiene una tasa de muestra constante respectiva, si bien la tasa de muestra constante respectiva varía entre las regiones de superposición consecutivas;un ventaneador (108), configurado para la aplicación de un ventaneado sobre las regiones de superposición consecutivas, de la señal de información; y un transformador (109), configurado para aplicar, individualmente, una transformada sobre las regiones ventaneadas. -
- 16.
- El transformador de señal de información de acuerdo con la reivindicación 15, donde el capturador (106) está configurado para realizar la captura de las regiones de superposición consecutivas de la señal de información, de modo que las regiones de superposición consecutivas de la señal de información tienen una longitud de tiempo constante.
-
- 17.
- El transformador de señal de información de acuerdo con la reivindicación 15 o 16, donde el capturador (106) está configurado para efectuar la captura de las regiones de superposición consecutivas de la señal de información, de modo que las regiones de superposición consecutivas de la señal de información tienen una compensación de tiempo constante.
-
- 18.
- El transformador de señal de información de acuerdo con la reivindicación 16 o 17, donde la secuencia de muestras tiene una tasa de muestra variable que cambia de una primera tasa de muestra a una segunda tasa de muestra en un instante de tiempo predeterminado (113), donde el remuestreador (107) está configurado para aplicar el remuestreado sobre las regiones de superposición consecutivas (114b,c) que se superponen con el instante de tiempo predeterminado, de manera que su tasa de muestra constante cambia solamente una vez de la primera tasa de muestra a la segunda tasa de muestra.
-
- 19.
- El transformador de señal de información de acuerdo con la reivindicación 18, donde el transformador está configurado para adaptar una longitud de transformada de la transformada de cada región ventaneada, a un número de muestras de la respectiva región ventaneada.
-
- 20.
- Un procedimiento para la reconstrucción, usando la cancelación del aliasing, de una señal de información de una representación de transformada superpuesta de la señal de información que comprende, para cada una de regiones de superposición consecutivas de la señal de información, una transformada de una versión de ventana de la respectiva región, donde el reconstructor de señal de información está configurado para la reconstrucción de la señal
de información a una tasa de muestra que cambia en un borde (82) entre una región precedente (84) y una región sucesora (86) de la señal de información, donde el procedimiento comprende:la aplicación de una retransformación sobre la transformada (94) de la versión de ventana de la región precedente (84), de modo de obtener una retransformada (96) para la región precedente (84), y la aplicación de una retransformación sobre la transformada de la versión de ventana de la región sucesora (86), de modo de obtener una retransformada (100) para la región sucesora (86), donde la retransformada (96) para la región precedente (84) y la retransformada (106) para la región sucesora (86) se superponen en una porción de cancelación del aliasing(102) en el borde (82) entre las regiones precedente y sucesora;el remuestreado, mediante la interpolación, de la retransformada (96) para la región precedente (84) y/o la retransformada (100) para la región sucesora (86), en la porción de cancelación del aliasing (102) de acuerdo con un cambio de tasa de muestra en el borde (82); yla realización de la cancelación del aliasing entre las retransformadas (96, 100) para las regiones precedente y sucesora (84, 86) obtenidas mediante el remuestreado en la porción de cancelación del aliasing (102). - 21. Un procedimiento para la generación de una representación de transformada superpuesta de una señal deinformación usando una transformada superpuesta causante de aliasing, que comprende:la recepción de la señal de información en forma de una secuencia de muestras;la captura de regiones de superposición consecutivas, de la señal de información;la aplicación, mediante la interpolación, de un remuestreado sobre por lo menos un subgrupo de las regiones de superposición consecutivas de las señales de información, de modo que cada una de las porciones de superposición consecutivas tiene una respectiva tasa de muestra constante, si bien la respectiva tasa de muestra constante varía entre las regiones de superposición consecutivas;la aplicación de un ventaneado sobre las regiones de superposición consecutivas de la señal de información; y la aplicación individual de una transformación sobre las regiones ventaneadas.
- 22. Un programa para computadora que tiene un código de programa para la realización, cuando es ejecutado en una computadora, de un procedimiento de acuerdo con la reivindicación 20 o 21.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
US201161442632P | 2011-02-14 | ||
PCT/EP2012/052458 WO2012110478A1 (en) | 2011-02-14 | 2012-02-14 | Information signal representation using lapped transform |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2458436T3 true ES2458436T3 (es) | 2014-05-05 |
Family
ID=71943597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES12705255.3T Active ES2458436T3 (es) | 2011-02-14 | 2012-02-14 | Representación de señal de información utilizando transformada superpuesta |
Country Status (17)
Country | Link |
---|---|
US (1) | US9536530B2 (es) |
EP (1) | EP2550653B1 (es) |
JP (2) | JP5712288B2 (es) |
KR (1) | KR101424372B1 (es) |
CN (1) | CN102959620B (es) |
AR (1) | AR085222A1 (es) |
AU (1) | AU2012217158B2 (es) |
BR (1) | BR112012029132B1 (es) |
CA (1) | CA2799343C (es) |
ES (1) | ES2458436T3 (es) |
MX (1) | MX2012013025A (es) |
MY (1) | MY166394A (es) |
PL (1) | PL2550653T3 (es) |
RU (1) | RU2580924C2 (es) |
SG (1) | SG185519A1 (es) |
TW (2) | TWI564882B (es) |
WO (1) | WO2012110478A1 (es) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101811872B1 (ko) | 2007-09-20 | 2017-12-22 | 미츠비시 마테리알 가부시키가이샤 | 다결정 실리콘 반응로 및 다결정 실리콘의 제조 방법 |
WO2013049256A1 (en) * | 2011-09-26 | 2013-04-04 | Sirius Xm Radio Inc. | System and method for increasing transmission bandwidth efficiency ( " ebt2" ) |
US9842598B2 (en) | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
TWI557727B (zh) * | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
CN105247613B (zh) | 2013-04-05 | 2019-01-18 | 杜比国际公司 | 音频处理系统 |
PL3028275T3 (pl) * | 2013-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób przetwarzania sygnału audio z użyciem kombinacji w zakresie nakładania |
PL3000110T3 (pl) | 2014-07-28 | 2017-05-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Wybór jednego spośród pierwszego algorytmu kodowania i drugiego algorytmu kodowania z zastosowaniem redukcji harmonicznych |
US10504530B2 (en) | 2015-11-03 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Switching between transforms |
JP6976277B2 (ja) * | 2016-06-22 | 2021-12-08 | ドルビー・インターナショナル・アーベー | 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法 |
WO2018201112A1 (en) | 2017-04-28 | 2018-11-01 | Goodwin Michael M | Audio coder window sizes and time-frequency transformations |
EP3644313A1 (en) * | 2018-10-26 | 2020-04-29 | Fraunhofer Gesellschaft zur Förderung der Angewand | Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction |
US11456007B2 (en) | 2019-01-11 | 2022-09-27 | Samsung Electronics Co., Ltd | End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization |
JP7576632B2 (ja) | 2020-03-20 | 2024-10-31 | ドルビー・インターナショナル・アーベー | スピーカのための低音強調 |
Family Cites Families (217)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2225321T3 (es) | 1991-06-11 | 2005-03-16 | Qualcomm Incorporated | Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos. |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
SE501340C2 (sv) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5568588A (en) | 1994-04-29 | 1996-10-22 | Audiocodes Ltd. | Multi-pulse analysis speech processing System and method |
KR100419545B1 (ko) | 1994-10-06 | 2004-06-04 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다른코딩원리들을이용한전송시스템 |
JP3304717B2 (ja) * | 1994-10-28 | 2002-07-22 | ソニー株式会社 | ディジタル信号圧縮方法及び装置 |
US5537510A (en) | 1994-12-30 | 1996-07-16 | Daewoo Electronics Co., Ltd. | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5727119A (en) * | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
JP3317470B2 (ja) | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5890106A (en) * | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
US5848391A (en) * | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JP3622365B2 (ja) * | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
ES2247741T3 (es) | 1998-01-22 | 2006-03-01 | Deutsche Telekom Ag | Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio. |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6173257B1 (en) | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6439967B2 (en) | 1998-09-01 | 2002-08-27 | Micron Technology, Inc. | Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies |
SE521225C2 (sv) | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US6317117B1 (en) | 1998-09-23 | 2001-11-13 | Eugene Goff | User interface for the control of an audio spectrum filter processor |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
FI114833B (fi) | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
CN1145928C (zh) | 1999-06-07 | 2004-04-14 | 艾利森公司 | 用参数噪声模型统计量产生舒适噪声的方法及装置 |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6636829B1 (en) | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
ES2269112T3 (es) | 2000-02-29 | 2007-04-01 | Qualcomm Incorporated | Codificador de voz multimodal en bucle cerrado de dominio mixto. |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) * | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
US6847929B2 (en) | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US6636830B1 (en) * | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
US20040142496A1 (en) | 2001-04-23 | 2004-07-22 | Nicholson Jeremy Kirk | Methods for analysis of spectral data and their applications: atherosclerosis/coronary heart disease |
US7136418B2 (en) * | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
US7206739B2 (en) | 2001-05-23 | 2007-04-17 | Samsung Electronics Co., Ltd. | Excitation codebook search method in a speech coding system |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
DE10129240A1 (de) * | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten |
US6941263B2 (en) | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
DE10140507A1 (de) | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
KR100438175B1 (ko) | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
JP3815323B2 (ja) * | 2001-12-28 | 2006-08-30 | 日本ビクター株式会社 | 周波数変換ブロック長適応変換装置及びプログラム |
DE10200653B4 (de) * | 2002-01-10 | 2004-05-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
CA2388358A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
US7302387B2 (en) | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
US20040010329A1 (en) * | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Method for reducing buffer requirements in a digital audio decoder |
DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
DE60303689T2 (de) | 2002-09-19 | 2006-10-19 | Matsushita Electric Industrial Co., Ltd., Kadoma | Audiodecodierungsvorrichtung und -verfahren |
AU2003278013A1 (en) | 2002-10-11 | 2004-05-04 | Voiceage Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463419B1 (ko) | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
KR100465316B1 (ko) | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
KR20040058855A (ko) | 2002-12-27 | 2004-07-05 | 엘지전자 주식회사 | 음성 변조 장치 및 방법 |
US7876966B2 (en) * | 2003-03-11 | 2011-01-25 | Spyder Navigations L.L.C. | Switching between coding schemes |
US7249014B2 (en) | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
US20050021338A1 (en) | 2003-03-17 | 2005-01-27 | Dan Graboi | Recognition device and system |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10321983A1 (de) * | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal |
CN100508030C (zh) | 2003-06-30 | 2009-07-01 | 皇家飞利浦电子股份有限公司 | 一种编码/解码音频信号的方法及相应设备 |
DE10331803A1 (de) * | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung |
CA2475282A1 (en) | 2003-07-17 | 2005-01-17 | Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre | Volume hologram |
DE10345995B4 (de) * | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
DE10345996A1 (de) * | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
US7418396B2 (en) * | 2003-10-14 | 2008-08-26 | Broadcom Corporation | Reduced memory implementation technique of filterbank and block switching for real-time audio applications |
US20050091044A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US20050091041A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
US7519538B2 (en) | 2003-10-30 | 2009-04-14 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
KR20070001115A (ko) * | 2004-01-28 | 2007-01-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 복소수 값 데이터를 이용하는 오디오 신호 디코딩 |
DE102004007200B3 (de) * | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
JP4744438B2 (ja) | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
MXPA06012617A (es) | 2004-05-17 | 2006-12-15 | Nokia Corp | Codificacion de audio con diferentes longitudes de cuadro de codificacion. |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
US7630902B2 (en) | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
KR100656788B1 (ko) | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
BRPI0607247B1 (pt) | 2005-01-31 | 2019-10-29 | Skype | método para gerar uma seqüência de saída de amostras em resposta a uma primeira e uma segunda subseqüências de amostras, código de programa executável por computador, dispositivo de armazenamento de programa, e, arranjo para receber um sinal de áudio digitalizado |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
JP4519169B2 (ja) | 2005-02-02 | 2010-08-04 | 富士通株式会社 | 信号処理方法および信号処理装置 |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
EP1866915B1 (en) | 2005-04-01 | 2010-12-15 | Qualcomm Incorporated | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
EP1899958B1 (en) | 2005-05-26 | 2013-08-07 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
RU2296377C2 (ru) | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Способ анализа и синтеза речи |
EP1897085B1 (en) | 2005-06-18 | 2017-05-31 | Nokia Technologies Oy | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
CN101203907B (zh) * | 2005-06-23 | 2011-09-28 | 松下电器产业株式会社 | 音频编码装置、音频解码装置以及音频编码信息传输装置 |
KR100851970B1 (ko) | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
RU2312405C2 (ru) | 2005-09-13 | 2007-12-10 | Михаил Николаевич Гусев | Способ осуществления машинной оценки качества звуковых сигналов |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
WO2007083931A1 (en) | 2006-01-18 | 2007-07-26 | Lg Electronics Inc. | Apparatus and method for encoding and decoding signal |
CN101371296B (zh) | 2006-01-18 | 2012-08-29 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US7668304B2 (en) | 2006-01-25 | 2010-02-23 | Avaya Inc. | Display hierarchy of participants during phone call |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
FR2897977A1 (fr) | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
US20070253577A1 (en) | 2006-05-01 | 2007-11-01 | Himax Technologies Limited | Equalizer bank with interference reduction |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (ja) | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
JP5052514B2 (ja) | 2006-07-12 | 2012-10-17 | パナソニック株式会社 | 音声復号装置 |
WO2008007700A1 (fr) | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
WO2008013788A2 (en) | 2006-07-24 | 2008-01-31 | Sony Corporation | A hair motion compositor system and optimization techniques for use in a hair/fur pipeline |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US20080046249A1 (en) | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Updating of Decoder States After Packet Loss Concealment |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
US8041578B2 (en) * | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
US8126721B2 (en) * | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8417532B2 (en) * | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
JP5083779B2 (ja) | 2006-10-25 | 2012-11-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ副帯値を生成する装置及び方法、並びに、時間領域オーディオサンプルを生成する装置及び方法 |
DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
PL2052548T3 (pl) * | 2006-12-12 | 2012-08-31 | Fraunhofer Ges Forschung | Koder, dekoder oraz sposoby kodowania i dekodowania segmentów danych reprezentujących strumień danych w dziedzinie czasu |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
KR101414341B1 (ko) | 2007-03-02 | 2014-07-22 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 부호화 장치 및 부호화 방법 |
WO2008108083A1 (ja) | 2007-03-02 | 2008-09-12 | Panasonic Corporation | 音声符号化装置および音声符号化方法 |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101388210B (zh) | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
MX2009013519A (es) * | 2007-06-11 | 2010-01-18 | Fraunhofer Ges Forschung | Codificador de audio para codificar una señal de audio que tiene una porcion similar a un impulso y una porcion estacionaria, metodos de codificacion, decodificador, metodo de decodificacion, y señal de audio codificada. |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101513028B1 (ko) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
BRPI0816136B1 (pt) | 2007-08-27 | 2020-03-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Método e dispositivo para processamento de sinal |
JP4886715B2 (ja) | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 |
JP5264913B2 (ja) | 2007-09-11 | 2013-08-14 | ヴォイスエイジ・コーポレーション | 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置 |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101483043A (zh) | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
JP5536674B2 (ja) * | 2008-03-04 | 2014-07-02 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 入力データストリームのミキシング及びそこからの出力データストリームの生成 |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
FR2929466A1 (fr) | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8879643B2 (en) | 2008-04-15 | 2014-11-04 | Qualcomm Incorporated | Data substitution scheme for oversampled data |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
CA2836862C (en) * | 2008-07-11 | 2016-09-13 | Stefan Bayer | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
BRPI0910512B1 (pt) * | 2008-07-11 | 2020-10-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | codificador e decodificador de áudio para codificar e decodificar amostras de áudio |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
PL2346030T3 (pl) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
WO2010003532A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
EP2144171B1 (en) | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
US8352279B2 (en) * | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US8380498B2 (en) * | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
TWI520128B (zh) | 2008-10-08 | 2016-02-01 | 弗勞恩霍夫爾協會 | 多解析度切換音訊編碼/解碼方案(一) |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
EP4145446B1 (en) | 2009-01-16 | 2023-11-22 | Dolby International AB | Cross product enhanced harmonic transposition |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
WO2010086373A2 (en) | 2009-01-28 | 2010-08-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
CN102396024A (zh) | 2009-02-16 | 2012-03-28 | 韩国电子通信研究院 | 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备 |
PL2234103T3 (pl) | 2009-03-26 | 2012-02-29 | Fraunhofer Ges Forschung | Urządzenie i sposób manipulacji sygnałem audio |
KR20100115215A (ko) | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
JP5699141B2 (ja) * | 2009-06-23 | 2015-04-08 | ヴォイスエイジ・コーポレーション | 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
BR112012009032B1 (pt) | 2009-10-20 | 2021-09-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio para uso em aplicações de baixo retardamento |
KR101411759B1 (ko) | 2009-10-20 | 2014-06-25 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호 인코더, 오디오 신호 디코더, 앨리어싱-소거를 이용하여 오디오 신호를 인코딩 또는 디코딩하는 방법 |
ES2453098T3 (es) | 2009-10-20 | 2014-04-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Códec multimodo de audio |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
CN103069484B (zh) | 2010-04-14 | 2014-10-08 | 华为技术有限公司 | 时/频二维后处理 |
TW201214415A (en) | 2010-05-28 | 2012-04-01 | Fraunhofer Ges Forschung | Low-delay unified speech and audio codec |
MX2013009344A (es) | 2011-02-14 | 2013-10-01 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral. |
ES2681429T3 (es) | 2011-02-14 | 2018-09-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Generación de ruido en códecs de audio |
-
2012
- 2012-02-14 BR BR112012029132-7A patent/BR112012029132B1/pt active IP Right Grant
- 2012-02-14 WO PCT/EP2012/052458 patent/WO2012110478A1/en active Application Filing
- 2012-02-14 CA CA2799343A patent/CA2799343C/en active Active
- 2012-02-14 TW TW103134392A patent/TWI564882B/zh active
- 2012-02-14 MY MYPI2012004908A patent/MY166394A/en unknown
- 2012-02-14 ES ES12705255.3T patent/ES2458436T3/es active Active
- 2012-02-14 AR ARP120100476A patent/AR085222A1/es active IP Right Grant
- 2012-02-14 JP JP2013519117A patent/JP5712288B2/ja active Active
- 2012-02-14 KR KR1020127029497A patent/KR101424372B1/ko active Active
- 2012-02-14 PL PL12705255T patent/PL2550653T3/pl unknown
- 2012-02-14 CN CN201280001344.3A patent/CN102959620B/zh active Active
- 2012-02-14 SG SG2012083069A patent/SG185519A1/en unknown
- 2012-02-14 TW TW101104678A patent/TWI483245B/zh active
- 2012-02-14 EP EP12705255.3A patent/EP2550653B1/en active Active
- 2012-02-14 RU RU2012148250/08A patent/RU2580924C2/ru active
- 2012-02-14 AU AU2012217158A patent/AU2012217158B2/en active Active
- 2012-02-14 MX MX2012013025A patent/MX2012013025A/es active IP Right Grant
- 2012-11-09 US US13/672,935 patent/US9536530B2/en active Active
-
2014
- 2014-08-04 JP JP2014158475A patent/JP6099602B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
AU2012217158B2 (en) | 2014-02-27 |
EP2550653B1 (en) | 2014-04-02 |
EP2550653A1 (en) | 2013-01-30 |
TW201246186A (en) | 2012-11-16 |
TW201506906A (zh) | 2015-02-16 |
JP2014240973A (ja) | 2014-12-25 |
WO2012110478A1 (en) | 2012-08-23 |
CA2799343C (en) | 2016-06-21 |
MY166394A (en) | 2018-06-25 |
JP5712288B2 (ja) | 2015-05-07 |
CN102959620B (zh) | 2015-05-13 |
CA2799343A1 (en) | 2012-08-23 |
BR112012029132B1 (pt) | 2021-10-05 |
TWI564882B (zh) | 2017-01-01 |
RU2012148250A (ru) | 2014-07-27 |
KR20130007651A (ko) | 2013-01-18 |
JP2013531820A (ja) | 2013-08-08 |
RU2580924C2 (ru) | 2016-04-10 |
KR101424372B1 (ko) | 2014-08-01 |
MX2012013025A (es) | 2013-01-22 |
AR085222A1 (es) | 2013-09-18 |
HK1181541A1 (en) | 2013-11-08 |
US20130064383A1 (en) | 2013-03-14 |
JP6099602B2 (ja) | 2017-03-22 |
CN102959620A (zh) | 2013-03-06 |
SG185519A1 (en) | 2012-12-28 |
AU2012217158A1 (en) | 2012-12-13 |
TWI483245B (zh) | 2015-05-01 |
US9536530B2 (en) | 2017-01-03 |
BR112012029132A2 (pt) | 2020-11-10 |
PL2550653T3 (pl) | 2014-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2458436T3 (es) | Representación de señal de información utilizando transformada superpuesta | |
ES2533098T3 (es) | Codificador de señal de audio, decodificador de señal de audio, método para proveer una representación codificada de un contenido de audio, método para proveer una representación decodificada de un contenido de audio y programa de computación para su uso en aplicaciones de bajo retardo | |
ES2797525T3 (es) | Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC | |
ES2660392T3 (es) | Codificación de coeficientes espectrales de un espectro de una señal de audio | |
ES2604983T3 (es) | Ajuste de nivel en el dominio del tiempo para decodificación o codificación de señales de audio | |
ES2965741T3 (es) | Aparato para codificar o decodificar una señal multicanal codificada mediante una señal de relleno generada por un filtro de banda ancha | |
ES2354743T3 (es) | Dispositivo y método para el procesamiento posterior de valores espectrales y codificador y decodificador para señales de audio. | |
KR101407120B1 (ko) | 오디오 신호를 처리하고 결합된 통합형 음성 및 오디오 코덱(usac)을 위한 보다 높은 시간적 입도를 제공하기 위한 장치 및 방법 | |
ES2556268T3 (es) | Adaptaciones de ventanas de ponderación de análisis o de síntesis para una codificación o decodificación por transformada | |
EP3080803B1 (en) | Apparatus and method for decoding an encoded audio signal with low computational resources | |
US11562754B2 (en) | Analysis/synthesis windowing function for modulated lapped transformation | |
ES2995310T3 (en) | Downscaled decoding of audio signals | |
ES2906255T3 (es) | Transposición armónica mejorada | |
ES2972833T3 (es) | Métodos y aparatos para mejoras de descodificación unificada de habla y de audio | |
AU2023282303B2 (en) | Improved Harmonic Transposition | |
AU2015221516B2 (en) | Improved Harmonic Transposition | |
HK1181541B (en) | Information signal representation using lapped transform | |
HK1229056A1 (en) | Apparatus and method for decoding an encoded audio signal with low computational resources | |
HK1229056B (en) | Apparatus and method for decoding an encoded audio signal with low computational resources |