MX2011000557A - Metodo y aparato de codificacion y decodificacion de señal de audio/voz. - Google Patents
Metodo y aparato de codificacion y decodificacion de señal de audio/voz.Info
- Publication number
- MX2011000557A MX2011000557A MX2011000557A MX2011000557A MX2011000557A MX 2011000557 A MX2011000557 A MX 2011000557A MX 2011000557 A MX2011000557 A MX 2011000557A MX 2011000557 A MX2011000557 A MX 2011000557A MX 2011000557 A MX2011000557 A MX 2011000557A
- Authority
- MX
- Mexico
- Prior art keywords
- signal
- unit
- audio
- high frequency
- voice
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 230000005236 sound signal Effects 0.000 claims abstract description 53
- 230000002123 temporal effect Effects 0.000 claims abstract description 45
- 238000013139 quantization Methods 0.000 claims description 65
- 230000009466 transformation Effects 0.000 claims description 58
- 230000002441 reversible effect Effects 0.000 claims description 26
- 238000005070 sampling Methods 0.000 claims description 24
- 238000001228 spectrum Methods 0.000 claims description 10
- 230000001131 transforming effect Effects 0.000 claims description 5
- 230000005284 excitation Effects 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 3
- 230000011664 signaling Effects 0.000 claims description 2
- 238000004148 unit process Methods 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 30
- 230000006870 function Effects 0.000 description 7
- 230000007774 longterm Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Un método y aparato de codificación y decodificación de señal de audio/voz son proporcionados. Una señal de audio o señal de voz entrada podría ser transformada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta. La señal podría ser codificada al determinar una resolución adecuada, la señal codificada podría ser decodificada y de esta manera, la señal de audio, la señal de voz y una señal mezclada de la señal de audio y la señal de voz podrían ser procesadas.
Description
y
METODO Y APARATO DE CODIFICACION Y DECODIFICACION DE SEÑAL DE AUDIO/VOZ
Campo de la Invención
Las modalidades de ejemplo se refieren a un método y aparato de codificación y decodificación de una señal de audio/voz .
Antecedentes de la Invención
Un códec podría ser clasificado en un códec de voz y un códec de audio. Un códec de voz podría codificar/decodificar una señal en una banda de frecuencia en un intervalo de 50 Hz a 7 kHz utilizando un modelo de voz. En general, el códec de voz podría extraer un parámetro de una señal de voz mediante el modelo de las cuerdas vocales y los tractos vocales para realizar la codificación y la decodificación. Un códec de audio podría codificar/decodificar una señal en una banda de frecuencia en el intervalo de 0 a 24 Hz mediante la aplicación de un modelo psicoacústico tal como la Codificación Avanzada de Audio de Alta Eficiencia (HE-AAC) . El códec de audio podría realizar la codificación y decodificación removiendo o eliminando una señal menos perceptible en función de las características dé la audición humana.
Aunque un códec de voz es adecuado para la codificación/decodificación de una señal de voz, no es
REF.217150 adecuado para la codificación/decodificación de una señal de audio debido a la degradación de la calidad del sonido. Asimismo, la eficiencia de compresión de la señal podría ser reducida cuando un códec de audio realice la codificación/decodificación de una señal de voz.
Breve Descripción de la Invención
Las modalidades de ejemplo podrían proporcionar un método y aparato de codificación y decodificación de una señal de audio/voz que podría codificar y decodificar, de manera eficiente, una señal de voz, una señal de audio y una señal mezclada de la señal de voz y la señal de audio.
Las características y utilidades adicionales del presente concepto inventivo general serán señaladas en parte en la descripción que sigue, y en parte, serán obvias a partir de la descripción, o podrían ser aprendidos por la práctica del concepto inventivo general.
De acuerdo con las modalidades de ejemplo del presente concepto inventivo general, podría proporcionarse un aparato que codifica una señal de audio/voz, el aparato incluye una unidad de transformación de señal que transforma una señal de audio o señal de voz entrada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta, una unidad de modelo psicoacústico que controla la unidad de transformación de señal, una unidad de codificación de dominio de tiempo que codifica la señal, transformada a través de la unidad de transformación de señal, en función del modelo de voz, y una unidad de cuantificación que cuantifica la señal salida al menos a partir de una de la unidad de transformación de señal y la unidad de codificación de dominio de tiempo.
De acuerdo con las modalidades de ejemplo del presente concepto inventivo general, también podría proporcionarse un aparato que codifica una señal de audio/voz, el aparato incluye una unidad de procesamiento de estéreo paramétrico que procesa la información de estéreo de una señal de audio o señal de voz entrada, una unidad que procesa una señal de frecuencia alta de la señal de audio o señal de voz entrada, una unidad de transformación de señal que transforma la señal de audio o señal de voz entrada al menos en una de la señal de resolución de frecuencia alta y una señal de resolución temporal alta, una unidad de modelo psicoacústico que controla la unidad de transformación de señal, una unidad de codificación de dominio de tiempo que codifica la señal, transformada a través de la unidad de transformación dé señal, en función de un modelo de voz, y una unidad de cuantificación que cuantifica la señal salida al menos a partir de una de la unidad de transformación de señal y la unidad de codificación de dominio de tiempo.
De acuerdo con las modalidades de ejemplo del presente concepto inventivo general, también podría proporcionarse un aparato que codifica una señal de audio/voz, el aparato incluye una unidad de transformación de señal que transforma una señal de audio o señal de voz entrada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta, una unidad de modelo psicoacústico que controla la unidad de transformación de señal, una unidad de determinación de baja velocidad que determina si la señal transformada se encuentra en una baja velocidad, una unidad de codificación de dominio de tiempo que codifica la señal transformada en función de un modelo de voz cuando la señal transformada se encuentra en la baja velocidad, una unidad de configuración de ruido temporal que configura la señal transformada, una unidad de estéreo de alta velocidad que codifica la información de estéreo de la señal configurada, y una unidad de cuantificación que cuantifica al menos una de la señal salida a partir de la unidad de estéreo de alta velocidad y una señal salida a partir de la unidad de codificación de dominio de tiempo.
De acuerdo con las modalidades de ejemplo del presente concepto inventivo general, también podría proporcionarse un aparato que decodifica una señal de audio/voz, el aparato incluye una unidad de decisión de resolución que determina si una señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta en función de la información acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia, la información es incluida en un flujo de bits, una unidad de proceso inverso de cuantificación que realiza el proceso inverso de cuantificación del flujo de bits cuando la unidad de decisión de resolución determina que la señal es la señal de resolución de frecuencia alta, una unidad de decodificación de dominio de tiempo que decodifica la información adicional para la predicción lineal inversa del flujo de bits, y que restaura la señal de resolución temporal alta utilizando la información adicional, y una unidad de transformación de señal inversa que realiza la transformación inversa al menos de una de la señal de salida y una señal salida a partir de la unidad de proceso inverso de cuantificación hacia una señal de audio o señal de voz del dominio de tiempo.
De acuerdo con las modalidades de ejemplo del presente concepto inventivo' general, también podría proporcionarse un aparato que decodifica una señal de audio/voz, el aparato incluye una unidad de proceso inverso de cuantificación que realiza el proceso inverso de cuantificación de un flujo de bits, un estéreo/decodificador de alta velocidad que decodifica la señal sometida al proceso inverso de cuantificación, un formador/decodificador de ruido temporal que procesa la señal decodificada a través del estéreo/decodificador de alta velocidad y una unidad de transformación de señal inversa que realiza la transformada inversa de la señal procesada en una señal de audio o señal de voz del dominio de tiempo, en donde el flujo de bits es generado mediante la transformación de la señal de audio o señal de voz entrada al menos en una de la señal de resolución de frecuencia alta y la señal de resolución temporal alta.
De acuerdo con las modalidades de ejemplo del presente concepto inventivo general, un método y aparato de codificación y decodificación de señal de audio/voz podrían codificar y decodificar, de manera efectiva, una señal de voz, una señal de audio y una señal mezclada de la señal de voz y la señal de audio.
Asimismo, de acuerdo con las modalidades de ejemplo del presente concepto inventivo general, un método y aparato de codificación y decodificación de señal de audio/voz podrían realizar la codificación y decodificación con menos bits, y con lo cual, podría mejorar la calidad del sonido.
Las utilidades adicionales de las modalidades de ejemplo serán señaladas en parte en la descripción que sigue, y en parte, serán aparentes a partir de la descripción, o podrían ser aprendidas por la práctica de las modalidades.
Las modalidades de ejemplo del presente concepto inventivo general también proporcionan un método de · codificación de señales de audio y voz, el método incluye recibir al menos una señal de audio y al menos una señal de voz, transformar al menos una de la señal de audio recibida y la señal de voz recibida por lo menos en una de una señal de resolución de frecuencia y una señal de resolución temporal, codificar la señal transformada y cuantificar al menos una de la señal transformada y la señal codificada.
Las modalidades de ejemplo del presente concepto inventivo general también proporcionan, un método de decodificación de señales de audio y voz, el método incluye determinar si una señal de cuadro actual es una señal de resolución de frecuencia o una señal de resolución temporal con la información en el flujo de bits de una señal recibida acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia, realizar el proceso inverso de cuantificación del flujo de bits cuando la señal recibida sea la señal de resolución de frecuencia, realizar la predicción lineal inversa a partir de la información en el flujo de bits y restaurar la señal de resolución temporal utilizando la información, y realizar la transformación inversa al menos de una de la señal sometida al proceso inverso de cuantificación y la señal de resolución temporal restaurada en una señal de audio o señal de voz del dominio de tiempo.
Breve Descripción de las Figuras
Estas y/u otras características y utilidades del g
presente concepto inventivo general serán aparentes y apreciadas con mayor facilidad a partir de la siguiente descripción de las modalidades de ejemplo, tomadas en conjunto con las figuras que la acompañan, de las cuales:
La Figura 1 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general;
La Figura 2 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 3 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 4 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 5 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 6 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 7 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 8 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 9 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 10 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 11 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 12 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 13 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 14 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con. las modalidades de ejemplo del presente concepto inventivo general;
La Figura 15 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ;
La Figura 16 es un diagrama de flujo que ilustra un método de codificación de una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general; y
La Figura 17 es un diagrama de flujo que ilustra un método de decodificación de una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general.
Descripción Detallada de la Invención
A continuación, se hará referencia en detalle a las modalidades de ejemplo, los ejemplos de las cuales se ilustran en las figuras que la acompañan, en donde los mismos números de referencia se refieren a los mismos elementos a través de todas las. vistas. Las modalidades de ejemplo son descritas más adelante para explicar la presente descripción con referencia a las figuras.
La Figura 1 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 1, el aparato que codifica una señal de audio/voz podría incluir una unidad de transformación de señal 110, una unidad de modelo psicoacústico 120, una unidad de codificación de dominio de tiempo 130, una unidad de cuantificación 140, una unidad de procesamiento de estéreo paramétrico 150, una unidad de procesamiento de señal de frecuencia alta 160 y una unidad de multiplexión 170.
La unidad de transformación de señal 110 podría transformar una señal de audio o señal de voz entrada en una señal de resolución de frecuencia alta y/o una señal de resolución temporal alta.
La unidad de modelo psicoacústico 120 podría controlar la unidad de transformación de señal 110 para transformar la señal de audio o señal de voz entrada en la señal de resolución de frecuencia alta y/o la señal de resolución temporal alta.
De manera específica, la unidad de modelo psicoacústico 120 podría calcular un umbral de enmascaramiento para la cuantificación, y podría controlar la unidad de transformación de señal 110 para transformar la señal de audio o señal de voz entrada en la señal de resolución de frecuencia alta y/o señal de resolución temporal alta al menos con el umbral de enmascaramiento calculado.
I
La unidad de codificación de; dominio de tiempo 130 podría codificar la señal, transformada a través de la unidad de transformación de señal 110, al menos con un modelo de voz .
En particular, la unidad de modelo psicoacústico 120 podría proporcionar a la unidad de codificación de dominio de tiempo 130 una señal de información para controlar la unidad de codificación de dominio de tiempo 130.
En esta instancia, la unidad de codificación de dominio de tiempo 130 podría incluir una unidad de predicción (no se ilustra) . La unidad de predicción podría codificar los datos mediante la aplicación del modelo de voz a la señal transformada a través de la unidad de transformación de señal 110, y realizar la remoción de la información de correlación. Asimismo, la unidad de predicción podría incluir un previsor de corto plazo y un previsor de largo plazo.
La unidad de cuantificación 140 podría cuantificar y codificar la señal salida a partir de la unidad de transformación de señal 110 y/o la unidad de codificación de dominio de tiempo 130.
En esta instancia, la unidad de cuantificación 140 podría incluir una unidad de Predicción Lineal de Excitación de Código (CELP) para modelar una señal en donde es removida la información de correlación. La unidad CELP no es ilustrada en la Figura 1.
La unidad de procesamiento de estéreo paramétrico
150 podría procesar la información de estéreo de la señal de audio o señal de voz entrada. La unidad de procesamiento de señal de frecuencia alta 160 podría procesar la información de frecuencia alta de la señal de audio o señal de voz entrada.
El aparato que codifica una señal de audio/voz es descrito en mayor detalle más adelante.
La unidad de transformación de señal 110 podría dividir los coeficientes de espectro en una pluralidad de bandas de frecuencia. La unidad de modelo psicoacústico 120 podría analizar una característica de espectro y determinar la resolución temporal o la resolución de frecuencia de cada una de la pluralidad de bandas de frecuencia.
Cuando una resolución temporal alta es adecuada para una banda de frecuencia particular, el coeficiente de espectro en la banda de frecuencia particular podría ser transformado a través de la unidad de transformación inversa utilizando un esquema de transformada tal como una unidad de Transformada de Solapado Modulado Inverso (IMLT) , y la señal transformada podría ser codificada a través de la unidad de codificación de dominio de tiempo 130. La unidad de transformación inversa podría ser incluida en la unidad de transformación de señal 110.
En esta instancia, la unidad de codificación de dominio de tiempo 130 podría incluir el previsor de corto plazo y el previsor de largo plazo.
Cuando la señal entrada es una señal de voz , la unidad de codificación de dominio de tiempo 130 podría reflejar, de manera eficiente, una característica de la unidad de generación de voz debido al incremento de la resolución temporal. De manera específica, el previsor de corto plazo podría procesar los datos recibidos a partir de la unidad de transformación de señal 110, y podría remover la información de correlación de corto plazo de las muestras en el dominio de tiempo. Asimismo, el previsor de largo plazo podría procesar los datos de señal residual en donde ha sido realizada la predicción de corto plazo, y con lo cual, podría remover la información de correlación de largo plazo.
La unidad de cuantificación 140 podría calcular el tamaño por etapa de una velocidad entrada de bits. Las muestras cuantificadas y la información adicional de la unidad de cuantificación 140 podrían ser procesadas para remover la información de correlación estadística que podría incluir, por ejemplo, la codificación aritmética o la codificación de Huffman.
La unidad de procesamiento de estéreo paramétrico 150 podría ser operada a una velocidad de bits menor de 32 kbps. Asimismo, una unidad de procesamiento estéreo extendida del Grupo de Expertos de Imagen en Movimiento (MPEG) podría ser utilizada como la unidad de procesamiento de estéreo paramétrico 150. La unidad de procesamiento de señal de frecuencia alta 160 podría codificar, de manera eficiente, la señal de frecuencia alta.
La unidad de multiplexión 170 podría dar salida a una señal de salida de una o más de las unidades descritas con anterioridad como un flujo de bits. El flujo de bits podría ser generado utilizando un esquema de compresión tal como la codificación aritmética, o la codificación de Huffman, o cualquier otra codificación adecuada de compresión.
La Figura 2 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 2, el aparato que decodifica una señal de audio/voz podría incluir una unidad de decisión de resolución 210, una unidad de decodificación de dominio de tiempo 220, una unidad de proceso inverso de cuantificación 230, una unidad de transformación de señal inversa 240, una unidad de procesamiento de señal de frecuencia alta 250 y una unidad de procesamiento de estéreo paramét ico 260.
La unidad de decisión de resolución 210 podría determinar si la señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta, en función de la información acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia. La información podría ser incluida en un flujo de bits.
La unidad de proceso inverso de cuantificación 230 podría realizar el proceso inverso de cuantificación del flujo de bits en función de una señal salida de la unidad de decisión de resolución 210.
La unidad de decodificación de dominio de tiempo.220 podría recibir la señal sometida al proceso inverso de cuantificación a partir de la unidad de proceso inverso de cuantificación 230, podría decodificar la información adicional para la predicción lineal inversa del flujo de bits y podría restaurar la señal de resolución temporal alta al menos con la información adicional y la señal sometida al proceso inverso de cuantificación.
La unidad de transformación de señal inversa 240 podría realizar la transformada* inversa de una señal salida a partir de la unidad de decodificación de dominio de tiempo 220 y/o la señal sometida al proceso inverso de cuantificación que proviene de la unidad de proceso inverso de cuantificación 230 en una señal de audio o señal de voz del dominio de tiempo.
Una Transformada Solapada Modulada de Variación de Frecuencia Inversa (FV-MLT) podría ser la unidad de transformación de señal inversa 240.
La unidad de procesamiento de señal de frecuencia alta 250 podría procesar una señal de frecuencia alta de la señal transformada inversa, y la unidad de procesamiento de estéreo paramétrico 260 podría procesar la información de estéreo de la señal transformada inversa.
El flujo de bits podría ser entrado a la unidad de proceso inverso de cuantificación 230, la unidad de procesamiento de señal de frecuencia alta 250, y la unidad de procesamiento de estéreo paramétrico 260 para que sea decodificada .
La Figura 3 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 3 , el aparato que codifica una señal de audio/voz podría incluir una unidad de transformación de señal 310, una unidad de modelo psicoacústico 320, una unidad de configuración de ruido temporal 330, una unidad de estéreo de velocidad alta 340, una unidad de cuantificación 350, una unidad de procesamiento de señal de frecuencia alta 360 y una unidad de multiplexión 370.
La unidad de transformación de señal 310 podría transformar una señal de audio o señal de voz entrada en una señal de resolución de frecuencia alta y/o señal de resolución temporal alta.
Una Transformada del Coseno Discreto Modificado (MDCT) podría ser utilizada como la unidad de transformación de señal 310.
La unidad de modelo psicoacústico 320 podría controlar la unidad de transformación de señal 310 para transformar la señal de audio o señal de voz entrada en la señal de resolución de frecuencia alta y/o la señal de resolución temporal alta.
La unidad de configuración de ruido temporal 330 podría configurar el ruido temporal de la señal transformada.
La unidad de estéreo de velocidad alta 340 podría codificar la información de estéreo de la señal transformada.
La unidad de cuantificación 350 podría cuantificar la señal salida a partir de la unidad de configuración de ruido temporal 330 y/o la unidad de estéreo de velocidad alta 340.
La unidad de procesamiento de señal de frecuencia alta 360 podría procesar una señal de frecuencia alta de la señal de audio o la señal de voz .
La unidad de multiplexión 370 podría dar salida a una señal de salida de cada una de las unidades descritas con anterioridad como un flujo de bits. El flujo de bits podría ser generado utilizando un esquema de compresión tal¦ como la codificación aritmética, o la codificación de Huffman, o cualquier otra codificación adecuada.
La Figura 4 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 4, el aparato que decodifica una señal de audio/voz podría incluir una unidad de proceso inverso de cuantificación 410, un estéreo/decodificador de velocidad alta 420, un formador/decodificador de ruido temporal 430, una unidad de transformación de señal inversa 440 y una unidad de procesamiento de señal de frecuencia alta 450.
La unidad de proceso inverso de cuantificación 410 podría realizar el proceso inverso de cuantificación de un flujo de bits.
El estéreo/decodificador de velocidad alta 420 podría decodificar la señal sometida al proceso inverso de cuantificación. El formador/decodificador de ruido temporal 430 podría decodificar una señal en donde la configuración temporal es realizada en un aparato que codifica una señal de audio/voz .
La unidad de transformación de señal inversa 440 podría realizar la transformada inversa de la señal decodificada. en una señal de audio o señal de voz del dominio de tiempo. Una MDCT inversa podría ser. utilizada como la unidad de transformación de señal inversa 440.
La unidad de procesamiento de señal de frecuencia alta 450 podría procesar una señal de frecuencia alta de la señal decodificada transformada inversa.
La Figura 5 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 5, una unidad CELP podría ser incluida en la unidad de codificación de dominio de tiempo 520 del aparato que codifica una señal de audio/voz, mientras que la unidad CELP podría ser incluida en la unidad de cuantificación 140 en la Figura 1.
Es decir, la unidad de . codificación de dominio de tiempo 520 podría incluir un previsor de corto plazo, un previsor de largo plazo y la unidad CELP . La unidad CELP podría indicar el módulo de modelo de excitación para modelar una señal en donde es removida la información de correlación.
Cuando una unidad de transformación de señal transforma una señal de audio o señal de voz entrada en una señal de resolución temporal alta bajo el control de una unidad de modelo psicoacústico, la unidad de codificación de dominio de tiempo 130 podría codificar la señal de resolución temporal alta transformada sin cuantificar ¦ la señal de resolución temporal alta en la unidad de cuantificación de espectro 510 o, de manera alternativa, minimizando la cuantificación de la señal de resolución temporal alta en la unidad de cuantificación de espectro 510.
La unidad CELP incluida en la unidad de codificación de dominio de tiempo 520 podría codificar una señal residual de la información de correlación de corto plazo y la información de correlación de largo plazo.
La Figura 6 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 6, el aparato que codifica una señal de audio/voz ilustrado en la Figura 1, además podría incluir una unidad de cambio 610.
La unidad de cambio 610 podría seleccionar cualquiera una o más cuantificaciones de la unidad de cuantificación 620 y la codificación de la unidad de codificación de dominio de tiempo 630 al menos con la información acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia. La unidad de cuantificación 620 podría ser la unidad de cuantificación de espectro .
La Figura 7 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 7, el aparato que decodifica una señal de audio/voz ilustrado en la Figura 2 además podría incluir una unidad de cambio 710. La unidad de cambio 710 podría controlar un cambio en la unidad de decodificación de dominio de tiempo 730 o en la unidad de proceso inverso de cuantificación de espectro 720 en función al menos de la determinación de la unidad de decisión de resolución.
La Figura 8 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 8, el aparato que codifica una señal de audio/voz ilustrado en la Figura 1, además podría incluir una unidad de muestreo descendente 810.
La unidad de muestreo descendente 810 podría muestrear hacia abajo una señal entrada en una señal de frecuencia baja. La señal de frecuencia baja podría ser generada a través del muestreo descendente, y el muestreo descendente podría ser realizado cuando la señal de frecuencia baja se encuentre a una velocidad doble de una alta velocidad y baja velocidad. Es decir, la señal de frecuencia baja podría ser utilizada cuando una frecuencia de muestreo del esquema de codificación de señal de frecuencia baja es operada a una baja velocidad de muestreo que corresponde con la mitad o una cuarta parte de la velocidad de muestreo de la unidad de procesamiento de señal de frecuencia alta. Cuando la unidad de procesamiento de estéreo paramétrico es incluida en el aparato que codifica una señal de audio/voz, el muestreo descendente podría ser realizado cuando la unidad de procesamiento de estéreo paramétrico realice la síntesis de Filtro de Espejo de Cuadratura (QMF) .
En esta instancia, la alta velocidad podría estar a una velocidad más grande de 64 kbps , y la baja velocidad podría estar a una velocidad menor de 64 kbps.
La Figura 9 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Una unidad de decisión de resolución 910 podría determinar si una señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta, en función al menos en parte de la información 5 acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia. La información podría ser incluida en un flujo de bits.
Una unidad de proceso inverso de cuantificación 920 podría realizar el proceso inverso de cuantificación al flujo 10 de bits en función de una . señal salida de la unidad de decisión de resolución 910.
> Una unidad de decodificación de dominio de tiempo
930 podría recibir una señal residual codificada a partir de la unidad de proceso inverso de cuantificación 920, podría 15 decodificar la información adicional para la predicción lineal inversa del flujo de bits y podría restaurar la señal de resolución de frecuencia alta utilizando la información adicional y la señal residual.
Una unidad de transformación de señal inversa 940 20 podría realizar la transformada inversa de una señal de salida de la unidad de decodificación de dominio de tiempo 930 y/o la señal sometida al proceso inverso de cuantificación de la unidad de proceso inverso de cuantificación 920 en una señal de audio o señal de voz del
! 25 dominio de tiempo.
En esta instancia, una unidad de procesamiento de señal de frecuencia alta 950 podría realizar el muestreo ascendente en el aparato que decodifica una señal de audio/voz de la Figura 9.
La Figura 10 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general . .
Con referencia a la Figura 10, el aparato que codifica una señal de audio/voz ilustrado en la Figura 5 además podría incluir una unidad de muestreo descendente 1010. Es decir, una señal de frecuencia baja podría ser generada a través del muestreo descendente.
Cuando una unidad de procesamiento de estéreo paramétrico 1020 es aplicada, la unidad de muestreo descendente 1010 podría realizar el muestreo descendente cuando la unidad de procesamiento de estéreo paramétrico 1020 podría realizar la síntesis QMF para la generación de una señal de mezclado descendente. Una unidad de codificación de dominio de tiempo 1030 podría incluir un previsor de corto plazo, un previsor de largo plazo y una unidad CELP.
La Figura 11 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general.
Una unidad de decisión de resolución 1110 podría determinar si una señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta, en función de la información acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia. La información podría ser incluida en un flujo de bits.
Una unidad de proceso inverso de cuantificación de espectro 1130 podría realizar el proceso inverso de cuantificación del flujo de bits en función al menos en parte de una señal de salida de la unidad de decisión de resolución 1110, cuando la unidad de decisión de resolución 1110 determine que la señal de cuadro actual es la señal de resolución de frecuencia alta.
Cuando la unidad de decisión de resolución 1110 determine que la señal de cuadro actual es la señal de resolución temporal alta, una unidad de decodificación de dominio de tiempo 1120 podría restaurar la señal de resolución temporal alta.
Una unidad de transformación de señal inversa 1140 podría realizar la transformada inversa de una señal de salida de la unidad de decodificación de dominio de tiempo 1120 y/o la señal sometida al proceso inverso de cuantificación de la unidad de proceso inverso de cuantificación de espectro 1130 en una señal de audio o señal de voz del dominio de tiempo.
Asimismo, una unidad de procesamiento de señal de frecuencia alta 1150 podría realizar el muestreo ascendente en el aparato que decodifica una señal de audio/voz de la Figura 11.
La Figura 12 es un diagrama de bloque que ilustra un aparato que codifica una señal- de audio/voz de acuerdo con las · modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 12, el aparato que codifica una señal de audio/voz ilustrado en la Figura 6 podría incluir una unidad de muestreo descendente 1210. Es decir, una señal de frecuencia baja podría ser generada a través del muestreo descendente.
Cuando la unidad de procesamiento de estéreo paramétrico 1220 es aplicada, la unidad de muestreo descendente 1210 podría realizar el muestreo descendente cuando la unidad de procesamiento de estéreo paramétrico 1220 realice una síntesis Q F.
Un factor de muestreo ascendente/descendente del aparato que codifica una señal de audio/voz de la Figura 12 podría ser por ejemplo, una mitad o una cuarta parte de la velocidad de muestreo de una¡ unidad de procesamiento de señal de frecuencia alta. Es decir, cuando una señal es entrada en 48, 24 ó 12 kHz, podría estar disponible a través del muestreo ascendente/descendente.
La Figura 13 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general . :
Con referencia a la Figura 13, el aparato que decodifica una señal de audio/voz ilustrado en la Figura 2 además podría incluir una unidad de cambio. Es decir, la unidad de cambio podría controlar el cambio en una unidad de decodificación de dominio de tiempo 1320 o en una unidad de proceso inverso de cuantificación de espectro 1310.
La Figura 14 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general.
Con referencia a la Figura 14, el aparato que codifica una señal de audio/voz ilustrado en la Figura 1 y el aparato que codifica una señal de audio/voz ilustrado en la Figura 3 podrían ser combinados al menos en parte .
Es decir, cuando una señal transformada se encuentra a una baja velocidad como resultado de la determinación a través de la unidad de determinación de baja velocidad 1430 en función de una baja velocidad o alta velocidad predeterminada, la unidad de transformación de señal 1410, la unidad de codificación de dominio de tiempo 1440 y la unidad de cuantificación 1470 podrían ser operadas. Cuando la señal transformada se encuentra en la alta velocidad, la unidad de transformación de señal 1410, la unidad de configuración de ruido temporal 1450 y la unidad de estéreo de alta velocidad 1460 podrían ser operadas.
Una unidad de procesamiento de estéreo paramétrico 1481 y una unidad de procesamiento de señal de frecuencia alta 1491 podrían ser encendidas/apagadas en función de un estándar predeterminado. Asimismo, la unidad de estéreo de alta velocidad 1460 y la unidad de procesamiento de estéreo paramétrico 1481 no podrían ser operadas de manera simultánea. Asimismo, la unidad de procesamiento de señal de frecuencia alta 1491 y la unidad de procesamiento de estéreo paramétrico 1481 -podrían ser operadas, de manera respectiva, bajo el control de una unidad de determinación de procesamiento de señal de frecuencia alta 1490 y una unidad de determinación de procesamiento de estéreo paramétrico 1480 en función de la información predeterminada.
La Figura 15 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 15, el aparato que decodifica una señal de audio/voz ilustrado en la Figura 2 y el aparato que decodifica una señal de audio/voz ilustrado en la Figura 4 podrían ser combinados, al menos en parte.
Es decir, cuando una señal transformada se encuentra en una alta velocidad como resultado de la determinación de la unidad de determinación de baja velocidad 1510, un estéreo/decodificador de alta velocidad 1520, un ormador/decodificador de ruido temporal 1530 y una unidad de transformación . de señal inversa 1540 podrían ser operadas. Cuando la señal transformada se encuentra en una baja velocidad, una unidad de decisión de resolución 1550, una unidad de decodificación de dominio de tiempo 1560 y una unidad de procesamiento de señal de frecuencia alta 1570 podrían ser operadas. Asimismo, la unidad de procesamiento de señal de frecuencia alta 1570 y la unidad de procesamiento de estéreo paramétrico 1580 podrían ser operadas bajo el control de una unidad de determinación de procesamiento de señal de frecuencia alta y una unidad de determinación de procesamiento de estéreo paramétrico en función de la información predeterminada, de manera respectiva.
La Figura 16 es un diagrama de flujo que ilustra un método de codificación de una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general.
En la operación S1610, una señal de audio o señal de voz entrada podría ser transformada en el dominio de frecuencia. En la operación S1620, podría determinarse si una transformada en el dominio de tiempo será realizada.
Una operación del muestreo descendente de la señal de audio o señal de voz entrada además podría ser incluida.
De acuerdo al menos con . el resultado de la determinación en la operación S1620, la señal de audio o señal de voz entrada podría ser transformada en una señal de resolución de frecuencia alta y/o una señal de resolución temporal alta en la operación S1630.
Es decir, cuando la transformada en el dominio de tiempo vaya a ser efectuada, la señal de audio o señal de voz entrada podría ser transformada en la señal de resolución temporal alta y podría ser cuantificada en la operación S1630. Cuando la transformada en el dominio de tiempo no sea realizada, la señal de audio o señal de voz entrada podría ser cuantificada y codificada en la operación S1640.
La Figura 17 es un diagrama de flujo que ilustra un método de decodificación de una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
En la operación S1710, podría determinarse si una señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta.
En esta instancia, la determinación podría estar basada en la información acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia, y la información podría ser incluida en un flujo de bits.
^ _ En la operación S1720, el flujo de bits podría ser sometido al proceso inverso de cuantificación.
En la operación S1730, la señal sometida al proceso 5 inverso de cuantificación podría ser recibida, la información adicional para la predicción lineal inversa podría ser decodificada a partir del flujo de bits, y la señal de resolución temporal podría ser restaurada utilizando la información adicional y la señal residual codificada.
10 En la operación S1740, la señal salida a partir de la unidad de decodificación de dominio de tiempo y/o la señal ; sometida al proceso inverso de cuantificación de una unidad de proceso inverso de cuantificación podría ser transformada inversa en una señal de audio o señal de voz del dominio de 15 tiempo.
El presente concepto inventivo, general también puede ser incluido como códigos susceptibles de ser leídos por computadora en un medio susceptible de ser leído por computadora. El medio susceptible de ser . leído por
20 computadora puede incluir un medio de grabación susceptible de ser leído por computadora y un medio de transmisión susceptible de ser leído por computadora. El medio de grabación susceptible de ser leído por computadora es cualquier dispositivo de almacenamiento de datos que puede
25 almacenar datos como un programa que puede ser posteriormente leído por un sistema de computadora. Los ejemplos del medio de grabación susceptible de ser leído por computadora incluyen una memoria sólo de lectura (ROM) , una memoria de acceso aleatorio (RAM) , CD-ROMs, cintas magnéticas, discos flexibles y dispositivos ópticos de almacenamiento de datos. El medio de grabación susceptible de ser leído por computadora también puede ser distribuido a través de la red conectada con sistemas de computadora, de modo que el código susceptible de ser leído por computadora es almacenado y ejecutado en un modo distribuido. El medio de transmisión susceptible de ser leído por computadora puede transmitirse a través de ondas portadoras o señales (por ejemplo, la transmisión alambrada o inalámbrica de datos a través de la Internet) . Asimismo, programas funcionales, códigos y segmentos de código para conseguir el presente concepto inventivo general, pueden ser interpretados con facilidad por programadores expertos en la técnica a la cual se refiere él presente concepto inventivo general.
Aunque varias modalidades de ejemplo del presente concepto inventivo general han sido ilustradas y descritas, sería apreciado por aquellas personas expertas en la técnica que podrían realizarse cambios en estas modalidades de ejemplo sin apartarse de los principios y espíritu del concepto inventivo general, el alcance del cual es definido en las reivindicaciones y sus equivalentes .
Se hace constar que con relación a esta fecha el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.
Claims (1)
- REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones: 1. Un aparato que codifica una señal de audio/voz, caracterizado porque comprende: una unidad de transformación de señal que transforma una señal de audio o señal de voz entrada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta; una unidad de modelo psicoacústico que controla la unidad de transformación de señal; una unidad de codificación de dominio de tiempo que codifica la señal, transformada a través de la unidad de transformación de señal, en función del modelo de voz; y una unidad de cuantificación que cuantifica la señal salida al menos a partir de una de la unidad de transformación de señal y la unidad de codificación de dominio de tiempo. 2. El aparato de conformidad con la reivindicación 1, caracterizado porque la unidad de cuantificación incluye una Predicción Lineal de Excitación de Código (CELP, por sus siglas en inglés) para modelar una señal en donde la información de correlación es removida. 3. Un aparato que codifica una señal de audio/voz, caracterizado porque comprende: una unidad de procesamiento de estéreo paramétrico que procesa la información de estéreo de una señal de audio o señal de voz entrada; una unidad de procesamiento de señal de frecuencia alta que procesa una señal de frecuencia alta de la señal de audio o señal de voz entrada; una unidad de transformación de señal que transforma la señal de audio o señal de voz entrada al menos en una de la señal de resolución de frecuencia alta y una señal de resolución temporal alta; una unidad de modelo psicoacústico que controla la unidad de transformación de señal; una unidad de codificación de dominio de tiempo que codifica la señal, transformada a través de la unidad de transformación de señal, en función de un modelo de voz; y una unidad de cuantificación que cuantifica la señal salida al menos a partir de una de la unidad de transformación de señal y la unidad de codificación de dominio de tiempo. 4. El aparato de conformidad con la reivindicación 3, caracterizado porque la unidad de codificación de dominio de tiempo incluye una CELP para modelar una señal en donde la información de correlación es removida. 5. El aparato de conformidad con la reivindicación 3, caracterizado porque la unidad de cuantificación es una unidad de cuantificación de espectro, y además comprende: una unidad de cambio que selecciona cualquiera una de las señales salidas a partir de la unidad de cuantificación de espectro y la unidad de codificación de dominio de tiempo en función de si la señal de audio o señal de voz transformada es la señal de resolución de frecuencia alta o la señal de resolución temporal alta. 6. El aparato de conformidad con la reivindicación 3, caracterizado además porque comprende: una unidad de muestreo descendente que realiza el muestreo descendente a la señal de audio o señal de voz . 7. El aparato de conformidad con la reivindicación 3, caracterizado porque la unidad de transformación de señal incluye al menos una de una Transformada Solapada Modulada Variable de Frecuencia (FV-MLT, por sus siglas en inglés) y una Transformada del Coseno Discreto Modificado (MDCT, por sus siglas en inglés) . 8. El aparato de conformidad con la reivindicación 3, caracterizado porque la unidad de modelo psicoacústico proporciona la unidad de cuantificación con la información acerca de un ruido durante la cuantificación. 9. El aparato de conformidad con la reivindicación 3, caracterizado porque la unidad de codificación de dominio de tiempo además comprende: una unidad de predicción que aplica el modelo de voz en la señal transformada a través de la unidad de transformación de señal y que remueve la información de correlación. 10. Un aparato que decodifica una señal de audio/voz, caracterizado porque comprende: una unidad de decisión de resolución que determina si una señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta en función de la información acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia, la información es incluida en un flujo de bits; una unidad de proceso inverso de cuantificación que realiza el proceso inverso de cuantificación del flujo de bits cuando la unidad de decisión de resolución determina que la señal es la señal de resolución de frecuencia alta; una unidad de decodificación de dominio de tiempo que decodifica la información adicional para la predicción lineal inversa del flujo de bits, y que restaura la señal de resolución temporal alta utilizando la información adicional; y una unidad de transformación de señal inversa que realiza la transformada inversa al menos de una de la señal de salida a partir de la unidad de decodificación de dominio de tiempo y una señal de salida a partir de la unidad de proceso inverso de cuantificación hacia una señal de audio o señal de voz del dominio de tiempo. 11. El aparato de conformidad con la reivindicación 10, caracterizado además porque comprende al menos una de: una unidad de decodificación de señal de frecuencia alta que procesa una señal de frecuencia alta de la señal transformada inversa; y una unidad de procesamiento de estéreo paramétrico que procesa la información de estéreo de la señal transformada inversa. 12. Un aparato que codifica una señal de audio/voz, caracterizado porque comprende: una unidad de transformación de señal que transforma una señal de audio o señal de voz entrada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta; una unidad de modelo psicoacústico que controla la unidad de transformación de señal; una unidad de configuración de ruido temporal que configura al menos una de la señal de resolución de frecuencia alta transformada y la señal de resolución temporal alta transformada; una unidad de estéreo de alta velocidad que codifica la información de estéreo de la señal transformada; y una unidad de cuantificación que cuantifica la señal salida a partir al menos de una de la unidad de configuración i de ruido temporal y la unidad de estéreo de alta velocidad, i 13. El aparato de conformidad con la reivindicación 12, caracterizado porque además comprende: 5 una unidad de procesamiento de señal de frecuencia alta que procesa una señal de frecuencia alta de la señal de audio o la señal de voz . 1 . Un aparato que decodifica una señal de audio/voz , caracterizado porque comprende : 10 una unidad de proceso inverso de cuantificación que realiza el proceso inverso de cuantificación de un flujo de bits; un estéreo/decodificador de alta velocidad que decodifica la señal sometida al proceso inverso de cuantificación; 15 un formador/decodificador de ruido temporal que procesa la señal decodificada a través del estéreo/decodificador de alta velocidad; y una unidad de transformación de señal inversa que realiza la transformada inversa de la señal procesada en una 20 señal de audio o señal de voz del dominio de tiempo, en donde el flujo de bits es generado mediante la transformación de la señal de audio o señal de voz entrada al menos en una de la señal de resolución de frecuencia alta y la señal de resolución temporal alta. 25 15. El aparato de conformidad con la reivindicación 14, caracterizado además porque comprende: una unidad de procesamiento de señal de frecuencia alta que procesa una señal de frecuencia alta de la señal transformada inversa. 16. Un aparato que codifica una señal de audio/voz, caracterizado porque comprende: una unidad de transformación de señal que transforma una señal de audio o señal de voz entrada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta; una unidad de modelo psicoacústico que controla la unidad de transformación de señal; una unidad de determinación de baja velocidad que determina si la señal transformada tiene una baja velocidad; una unidad de codificación de dominio de tiempo que codifica la señal transformada en función de un modelo de voz cuando la señal transformada tiene la baja velocidad; una unidad de configuración de ruido temporal que configura la señal transformada; una unidad de estéreo de alta velocidad que codifica la información de estéreo de la señal configurada; y una unidad de cuantificación que cuantifica al menos una de la señal salida a partir de la unidad de estéreo de alta velocidad y una señal salida a partir de la unidad de codificación de dominio de tiempo. 17. El aparato de conformidad con la reivindicación 16, caracterizado además porque comprende: una unidad de determinación de procesamiento de estéreo parametrico que determina si opera una unidad de procesamiento de estéreo paramétrico en función de la información predeterminada; la unidad de procesamiento de estéreo paramétrico procesa la información de estéreo de una señal de frecuencia alta entrada cuando se determina que la unidad de procesamiento de estéreo paramétrico será operada; una unidad de determinación de procesamiento de señal de frecuencia alta que determina si opera una unidad de procesamiento de señal de frecuencia alta en función de otra información predeterminada; y la unidad de procesamiento de señal de frecuencia alta procesa una señal de frecuencia alta entrada . cuando se determina que la unidad de procesamiento de señal de frecuencia alta será operada. 18. Un método de codificación de una señal de audio/voz , caracterizado porque comprende : transformar una señal de audio o señal de voz entrada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta, y controlar la señal transformada en función de un modelo psicoacústico; codificar por tiempo la señal transformada en función al menos en parte de un modelo de voz; y cuantificar al menos una de la señal transformada y la señal codificada por tiempo. 19. Un método de decodificación de una señal de audio/voz, caracterizado porque comprende: determinar si una señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta, en función al menos en parte de la información incluida en el flujo de bits acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia; realizar el proceso inverso de cuantificación del flujo de bits cuando la señal es determinada como la señal de resolución de frecuencia alta decodificar la información adicional para la predicción lineal inversa a partir del flujo de bits y restaurar la señal de resolución temporal alta utilizando la información adicional; y realizar la transformación inversa al menos de una de la señal restaurada y la señal sometida al proceso inverso de cuantificación en una señal de audio o señal de voz del dominio de tiempo. 20. Un método de codificación de una señal de audio/voz, caracterizado porque comprende: recibir al menos una señal de audio y al menos una señal de voz ; transformar al menos una de la señal de audio recibida y la señal de voz recibida por lo menos en una de una señal de resolución de frecuencia y una señal de resolución temporal; codificar la señal transformada; y cuantificar al menos una de la señal transformada y la señal codificada. 21. Un método de decodificación de una señal de audio/voz, caracterizado porque comprende: determinar si una señal de cuadro actual es una señal de resolución de frecuencia o una señal de resolución temporal con la información en el flujo de bits de una señal recibida acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia; realizar el proceso inverso de cuantificación del flujo de bits cuando la señal recibida sea la señal de resolución de frecuencia; realizar la predicción lineal inversa a partir de la información en el flujo de bits y restaurar la señal de resolución temporal utilizando la información; y realizar la transformación inversa al menos de una de la señal sometida al proceso inverso de cuantificación y la señal de resolución temporal restaurada en una señal de audio o señal de voz del dominio de tiempo. ,
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080068377A KR101756834B1 (ko) | 2008-07-14 | 2008-07-14 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
PCT/KR2009/003870 WO2010008185A2 (en) | 2008-07-14 | 2009-07-14 | Method and apparatus to encode and decode an audio/speech signal |
Publications (1)
Publication Number | Publication Date |
---|---|
MX2011000557A true MX2011000557A (es) | 2011-03-15 |
Family
ID=41505940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MX2011000557A MX2011000557A (es) | 2008-07-14 | 2009-07-14 | Metodo y aparato de codificacion y decodificacion de señal de audio/voz. |
Country Status (10)
Country | Link |
---|---|
US (3) | US8532982B2 (es) |
EP (1) | EP2313888A4 (es) |
JP (1) | JP2011528135A (es) |
KR (1) | KR101756834B1 (es) |
CN (3) | CN105957532B (es) |
BR (1) | BRPI0916449A8 (es) |
IL (1) | IL210664A (es) |
MX (1) | MX2011000557A (es) |
MY (1) | MY154100A (es) |
WO (1) | WO2010008185A2 (es) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090006081A1 (en) * | 2007-06-27 | 2009-01-01 | Samsung Electronics Co., Ltd. | Method, medium and apparatus for encoding and/or decoding signal |
KR101756834B1 (ko) * | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
US20110087494A1 (en) * | 2009-10-09 | 2011-04-14 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme |
US9378745B2 (en) | 2010-04-09 | 2016-06-28 | Dolby International Ab | MDCT-based complex prediction stereo coding |
CN110890101B (zh) | 2013-08-28 | 2024-01-12 | 杜比实验室特许公司 | 用于基于语音增强元数据进行解码的方法和设备 |
CN103473836B (zh) * | 2013-08-30 | 2015-11-25 | 福建星网锐捷通讯股份有限公司 | 一种面向安全的具有声音变调功能的室内机及其智能楼宇对讲系统 |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
CN105957533B (zh) * | 2016-04-22 | 2020-11-10 | 杭州微纳科技股份有限公司 | 语音压缩方法、语音解压方法及音频编码器、音频解码器 |
US10141009B2 (en) | 2016-06-28 | 2018-11-27 | Pindrop Security, Inc. | System and method for cluster-based audio event detection |
US9824692B1 (en) | 2016-09-12 | 2017-11-21 | Pindrop Security, Inc. | End-to-end speaker recognition using deep neural network |
US10553218B2 (en) | 2016-09-19 | 2020-02-04 | Pindrop Security, Inc. | Dimensionality reduction of baum-welch statistics for speaker recognition |
US10347256B2 (en) | 2016-09-19 | 2019-07-09 | Pindrop Security, Inc. | Channel-compensated low-level features for speaker recognition |
WO2018053537A1 (en) | 2016-09-19 | 2018-03-22 | Pindrop Security, Inc. | Improvements of speaker recognition in the call center |
US10397398B2 (en) | 2017-01-17 | 2019-08-27 | Pindrop Security, Inc. | Authentication using DTMF tones |
CN108768587B (zh) * | 2018-05-11 | 2021-04-27 | Tcl华星光电技术有限公司 | 编码方法、设备及可读存储介质 |
US11355103B2 (en) | 2019-01-28 | 2022-06-07 | Pindrop Security, Inc. | Unsupervised keyword spotting and word discovery for fraud analytics |
US11019201B2 (en) | 2019-02-06 | 2021-05-25 | Pindrop Security, Inc. | Systems and methods of gateway detection in a telephone network |
WO2020164753A1 (en) | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method selecting an error concealment mode, and encoder and encoding method |
US11646018B2 (en) | 2019-03-25 | 2023-05-09 | Pindrop Security, Inc. | Detection of calls from voice assistants |
US12015637B2 (en) | 2019-04-08 | 2024-06-18 | Pindrop Security, Inc. | Systems and methods for end-to-end architectures for voice spoofing detection |
CN111341330B (zh) * | 2020-02-10 | 2023-07-25 | 科大讯飞股份有限公司 | 音频编解码方法、存取方法及其相关设备及存储装置 |
US20230230605A1 (en) * | 2020-08-28 | 2023-07-20 | Google Llc | Maintaining invariance of sensory dissonance and sound localization cues in audio codecs |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
JP3158932B2 (ja) * | 1995-01-27 | 2001-04-23 | 日本ビクター株式会社 | 信号符号化装置及び信号復号化装置 |
JP3342996B2 (ja) * | 1995-08-21 | 2002-11-11 | 三星電子株式会社 | 多チャネルオーディオ符号化器及び符号化方法 |
JP3522012B2 (ja) * | 1995-08-23 | 2004-04-26 | 沖電気工業株式会社 | コード励振線形予測符号化装置 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
DE19730129C2 (de) * | 1997-07-14 | 2002-03-07 | Fraunhofer Ges Forschung | Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals |
CA2246532A1 (en) * | 1998-09-04 | 2000-03-04 | Northern Telecom Limited | Perceptual audio coding |
CA2356869C (en) * | 1998-12-28 | 2004-11-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and devices for coding or decoding an audio signal or bit stream |
ES2269112T3 (es) | 2000-02-29 | 2007-04-01 | Qualcomm Incorporated | Codificador de voz multimodal en bucle cerrado de dominio mixto. |
US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
EP1493146B1 (en) * | 2002-04-11 | 2006-08-02 | Matsushita Electric Industrial Co., Ltd. | Encoding and decoding devices, methods and programs |
JP4399185B2 (ja) * | 2002-04-11 | 2010-01-13 | パナソニック株式会社 | 符号化装置および復号化装置 |
US7330812B2 (en) * | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
JP2005141121A (ja) * | 2003-11-10 | 2005-06-02 | Matsushita Electric Ind Co Ltd | オーディオ再生装置 |
KR20070001139A (ko) * | 2004-02-17 | 2007-01-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들 |
WO2005096508A1 (fr) * | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Equipement de codage et de decodage audio ameliore, procede associe |
WO2005096273A1 (fr) * | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Ameliorations apportees a un procede et un dispositif de codage/decodage audio |
CN1677490A (zh) | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
KR101037931B1 (ko) | 2004-05-13 | 2011-05-30 | 삼성전자주식회사 | 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법 |
KR100634506B1 (ko) * | 2004-06-25 | 2006-10-16 | 삼성전자주식회사 | 저비트율 부호화/복호화 방법 및 장치 |
CN101010726A (zh) * | 2004-08-27 | 2007-08-01 | 松下电器产业株式会社 | 音频解码器、方法以及程序 |
WO2006025337A1 (ja) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | ステレオ信号生成装置およびステレオ信号生成方法 |
US7548853B2 (en) | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
CN100561576C (zh) | 2005-10-25 | 2009-11-18 | 芯晟(北京)科技有限公司 | 一种基于量化信号域的立体声及多声道编解码方法与系统 |
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
KR101237413B1 (ko) | 2005-12-07 | 2013-02-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치 |
ATE429118T1 (de) * | 2005-12-16 | 2009-05-15 | Dolby Sweden Ab | Vorrichtung zum erzeugen und interpretieren eines datenstroms mit einer reihe von segmenten unter verwendung von daten in nachfolgenden datenrahmen |
US7809018B2 (en) * | 2005-12-16 | 2010-10-05 | Coding Technologies Ab | Apparatus for generating and interpreting a data stream with segments having specified entry points |
CN101136202B (zh) * | 2006-08-29 | 2011-05-11 | 华为技术有限公司 | 音频信号处理系统、方法以及音频信号收发装置 |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
KR100964402B1 (ko) | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
KR100883656B1 (ko) | 2006-12-28 | 2009-02-18 | 삼성전자주식회사 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
MX2009013519A (es) * | 2007-06-11 | 2010-01-18 | Fraunhofer Ges Forschung | Codificador de audio para codificar una señal de audio que tiene una porcion similar a un impulso y una porcion estacionaria, metodos de codificacion, decodificador, metodo de decodificacion, y señal de audio codificada. |
US7761290B2 (en) * | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
EP2201566B1 (en) * | 2007-09-19 | 2015-11-11 | Telefonaktiebolaget LM Ericsson (publ) | Joint multi-channel audio encoding/decoding |
US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
KR101756834B1 (ko) * | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
-
2008
- 2008-07-14 KR KR1020080068377A patent/KR101756834B1/ko active Active
-
2009
- 2009-07-14 MY MYPI2011000202A patent/MY154100A/en unknown
- 2009-07-14 WO PCT/KR2009/003870 patent/WO2010008185A2/en active Application Filing
- 2009-07-14 BR BRPI0916449A patent/BRPI0916449A8/pt not_active Application Discontinuation
- 2009-07-14 MX MX2011000557A patent/MX2011000557A/es active IP Right Grant
- 2009-07-14 CN CN201610515415.1A patent/CN105957532B/zh active Active
- 2009-07-14 US US12/502,454 patent/US8532982B2/en active Active
- 2009-07-14 CN CN200980135987.5A patent/CN102150202B/zh active Active
- 2009-07-14 CN CN201610509620.7A patent/CN105913851B/zh active Active
- 2009-07-14 EP EP09798088.2A patent/EP2313888A4/en not_active Withdrawn
- 2009-07-14 JP JP2011518646A patent/JP2011528135A/ja active Pending
-
2011
- 2011-01-13 IL IL210664A patent/IL210664A/en active IP Right Grant
-
2013
- 2013-09-06 US US14/020,006 patent/US9355646B2/en active Active
-
2016
- 2016-05-09 US US15/149,847 patent/US9728196B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20160254005A1 (en) | 2016-09-01 |
CN102150202A (zh) | 2011-08-10 |
US9355646B2 (en) | 2016-05-31 |
CN105957532B (zh) | 2020-04-17 |
CN105913851A (zh) | 2016-08-31 |
CN105957532A (zh) | 2016-09-21 |
WO2010008185A2 (en) | 2010-01-21 |
BRPI0916449A8 (pt) | 2017-11-28 |
US20100010807A1 (en) | 2010-01-14 |
US8532982B2 (en) | 2013-09-10 |
CN105913851B (zh) | 2019-12-24 |
JP2011528135A (ja) | 2011-11-10 |
EP2313888A2 (en) | 2011-04-27 |
US20140012589A1 (en) | 2014-01-09 |
IL210664A0 (en) | 2011-03-31 |
KR20100007651A (ko) | 2010-01-22 |
CN102150202B (zh) | 2016-08-03 |
MY154100A (en) | 2015-04-30 |
IL210664A (en) | 2014-07-31 |
US9728196B2 (en) | 2017-08-08 |
KR101756834B1 (ko) | 2017-07-12 |
EP2313888A4 (en) | 2016-08-03 |
WO2010008185A3 (en) | 2010-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9728196B2 (en) | Method and apparatus to encode and decode an audio/speech signal | |
JP6173288B2 (ja) | マルチモードオーディオコーデックおよびそれに適応されるcelp符号化 | |
RU2608878C1 (ru) | Регулировка уровня во временной области для декодирования или кодирования аудиосигналов | |
JP7704802B2 (ja) | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 | |
CN110047500B (zh) | 音频编码器、音频译码器及其方法 | |
KR102725805B1 (ko) | 오디오 신호에 대한 고주파 재구성 기술의 하위 호환 통합 | |
EP2186087A1 (en) | Improved transform coding of speech and audio signals | |
AU2003243441B2 (en) | Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
KR20250036948A (ko) | 후처리 지연을 저감시킨 고주파 재구성 기술의 통합 | |
US20100268542A1 (en) | Apparatus and method of audio encoding and decoding based on variable bit rate | |
WO2008072856A1 (en) | Method and apparatus to encode and/or decode by applying adaptive window size | |
KR102702697B1 (ko) | 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합 | |
US20170206905A1 (en) | Method, medium and apparatus for encoding and/or decoding signal based on a psychoacoustic model | |
KR101847076B1 (ko) | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 | |
KR102834523B1 (ko) | 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합 | |
KR20240066586A (ko) | 복소수 양자화를 이용하는 오디오 신호의 부호화 및 복호화 방법 및 장치 | |
HK1145045A (en) | Scalable speech and audio encoding using combinatorial encoding of mdct spectrum | |
KR20080034817A (ko) | 부호화/복호화 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Grant or registration |