[go: up one dir, main page]

MXPA01007547A - Encuadramiento de datos para sistema de codificacion de longitud de bloques adaptativo. - Google Patents

Encuadramiento de datos para sistema de codificacion de longitud de bloques adaptativo.

Info

Publication number
MXPA01007547A
MXPA01007547A MXPA01007547A MXPA01007547A MXPA01007547A MX PA01007547 A MXPA01007547 A MX PA01007547A MX PA01007547 A MXPA01007547 A MX PA01007547A MX PA01007547 A MXPA01007547 A MX PA01007547A MX PA01007547 A MXPA01007547 A MX PA01007547A
Authority
MX
Mexico
Prior art keywords
sequence
segments
audio
information
segment
Prior art date
Application number
MXPA01007547A
Other languages
English (en)
Inventor
Louis Dunn Fielder
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of MXPA01007547A publication Critical patent/MXPA01007547A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Un codificador de audio aplica un proceso de codificacion de bloques adaptativo a segmentos de informacion de audio para generar cuadros de informacion codificada que estan alineados con una senal de referencia que lleva la alineacion de una secuencia de cuadros de informacion de video. La informacion de audio es analizada para determinar diversas caracteristicas de la senal de audio, tales como la aparicion de ubicacion de un transitorio, y se genera una senal de control que causa que el proceso de codificacion de bloques adaptativo codifique segmentos de longitud variable. Un decodificador complementario aplica un proceso de decodificacion de bloques adaptativo para recuperar los segmentos de informacion de audio de los cuadros de informacion codificada. En modalidades que aplican transformadas de cancelacion de distorsion por bordes dentados en el dominio de tiempo, se aplican funciones de ventana y transformadas de acuerdo a una de una pluralidad de modelos de segmentos que definen funciones de ventana y parametros de transformada para cada segmento en una secuencia de segmentos. Los segmentos en cada cuadro de una secuencia de cuadros superpuestos pueden ser recuperados sin senales espurias de distorsion por bordes dentados independientemente de la recuperacion de segmentos en otros cuadros. Las funciones de ventana estan adaptadas para que proporcionen respuesta de dominio de frecuencia preferidas, y perfiles de ganancia en el dominio del tiempo. La figura mas representativa de la invencion es la numero 3.

Description

ENCUADRAMIENTO DE DATOS PARA SISTEMA DE CODIFICACIÓN DE LONGITUD DE BLOQUES ADAPTATIVO CAMPO TÉCNICO DE LA INVENCIÓN La presente invención se refiere a procesamientos de señales de audio en el que los flujos de información de audio son codificados y ensamblados en cuadros de información codificada. En particular, la presente invención se refiere al mejoramiento de la calidad de flujos de información de audio transportados por y recuperados de los cuadros de información codificada.
DESCRICPCIÓN DE LA TÉCNICA ANTERIOR En muchos sistemas de video/audio, la información de video/audio es transportada en flujos de información que comprenden cuadros de información de audio codificada que son alineados con cuadros de información y video, lo que significa que el contenido de sonido de la información de audio que es codificada en un cuadro de audio dado es relacionada con el contenido de imagen de un cuadro de video que es sustancialmente coincidente con el cuadro de audio dado o que está adelantado o atrasado respecto al cuadro de audio dado por una cantidad especifica.
Típicamente, la información de audio es transportada en una forma codificada que tiene reducidos requerimientos de capacidad de información, de modo que el número deseado de canales de información de audio, por ejemplo entre tres y ocho canales, puedan ser transportados en el ancho de banda disponible . Estos flujos de información de video/audio son frecuentemente sometidos a una diversidad de operaciones de edición y de procesamiento de señales. Una operación de edición común corta uno o más flujos de información de video/audio en secciones y une o empalma los extremos de dos secciones para formar un nuevo flujo de información. Típicamente, los cortes son efectuados en puntos que están alineados con la información de video de modo que la sincronización de video se mantenga en el nuevo flujo de información. Un paradigma de edición simple es el proceso de cortar y empalmar películas cinematográficas. Las dos secciones de material a ser empalmadas se pueden originar de diferentes fuentes, por ejemplo, diferentes canales de información, o se pueden originar de la misma fuente. En cualquiera de los casos, el empalme en general crea una discontinuidad en la información de audio que puede o no ser perceptible.
A. Codificación dß Audio El creciente uso de audio digital ha tendido a hacer más difícil editar información de audio sin crear señales espurias audibles en la información procesada. Esta dificultad ha surgido en parte debido a que el audio digital es frecuentemente procesado o codificado en segmentos o bloques de muestras digitales que deben ser 5 procesadas como una entidad completa. Muchos sistemas de codificación de audio perceptibles o basados en psicoacústica utilizan bancos de filtros o transformadas para convertir segmentos de muestras de señales en bloques de muestras de señales de sub-bandas codificadas o 10 coeficientes de transformación que deben ser filtrados por síntesis o transformados inversamente como bloques completos para recuperar una réplica del segmento de señal original. Las operaciones de edición son más difíciles debido a que una edición de la señal de audio procesada 15 debe ser efectuada entre bloques; de lo contrario, la información de audio representada por un bloque parcial en uno de los lados de un corte no puede ser correctamente recuperada . Una limitación adicional es impuesta en la edición por 0 los sistemas de codificación que procesan segmentos superpuestos de material de programa. Debido a la naturaleza superpuesta de la información representada por los bloques codificados, un segmento de señal original no puede ser correctamente recuperado aún de un bloque 5 completo de muestras o coeficientes codificados. Í l íi a , Esta limitación es claramente ilustrada por una transformada de bloque superpuesto comúnmente utilizada, una transformada de coseno discreta modificada (DCT) que es descrita en el artículo de Princean, Johnson, y Bradley, "Codificación de sub-banda/transformada que utiliza diseños de banco de filtro basados en cancelación de distorsión por bordes dentados con dominio del tiempo", ICASSP 1987, Conf. Proc., Mayo de 1987, páginas 2161-64. Esta transformada de cancelación de distorsión por bordes dentados con dominio del tiempo (TDAC) particular, es el equivalente en dominio del tiempo de un sistema de síntesis de análisis de banda lateral única muestreado críticamente apilado en forma impar, y al que en la presente solicitud se hace referencia como Cancelación de Distorsión por Bordes Dentados con Dominio de Tiempo Apilado en forma Impar (O-TDAC) . La transformada hacia adelante o de análisis es aplicada a segmentos de muestras que son ponderados por una función de ventana de análisis y que se superponen entre sí en la mitad de una longitud de segmento. La transformada de análisis logra muestreo esencial reduciendo los coeficientes de transformada resultantes a la mitad; sin embargo, la información que se pierde por esta reducción crea distorsión por bordes dentados en el dominio de tiempo en la señal recuperada. El proceso de síntesis puede cancelar esta distorsión por bordes dentados aplicando una transformada inversa o de síntesis a los bloques de los coeficientes de transformada para generar segmentos de muestras sintetizadas, aplicando una función de ventana de síntesis conformada adecuadamente a los segmentos de muestras sintetizadas, y superponiendo y agregando los segmentos con ventanas. Por ejemplo, si un sistema de transformada de análisis de TDAC genera una secuencia de bloques B?-B2 de los cuales los segmentos S?-S2 van a ser recuperados, entonces las señales espurias de distorsión por bordes dentados en la última mitad del segmento Si y en la primera mitad del segmento S se cancelarán entre sí.
Si dos flujos de información codificados provenientes de un sistema de codificación TDAC son empalmados en un punto entre bloques, sin embargo, los segmentos a los lados de un empalme no cancelarán las señales espurias de distorsión por bordes dentados entre sí. Por ejemplo, supóngase que un flujo de información codificada es cortada de modo que sus extremos en un punto entre los bloques B?-B2 y otro flujo de información codificada es cortada de modo que comience en un punto entre los bloques B3-B4. Si estos dos flujos de información codificada son empalmados de modo que el bloque Bi inmediatamente preceda al bloque B4, entonces las señales espurias de distorsión por bordes dentados en la última mitad del segmento Si recuperado del bloque Bi y en la primera mitad del segmento S recuperado del bloque B4 en general no se cancelarán entre sí .
B. Sincronización de Audio y Video Limitaciones aún mayores son impuestas cuando se editan aplicaciones que procesan tanto información de audio como información de video por lo menos por dos razones . Una razón es que la longitud del cuadro de video en general no es igual a la longitud del bloque de audio. La segunda razón pertenece solo a ciertas normas de video, tal como la norma NTSC, que tienen una frecuencia de cuadros de video que no es un múltiplo entero de la frecuencia de muestras de audio. Los ejemplos en la siguiente discusión suponen una frecuencia de muestras de audio de 48 k muestras por segundo. La mayoría de los equipos profesionales utiliza esta frecuencia. Similares consideraciones se aplican a otras frecuencias de muestras tales como 44,1 k muestras por segundo, que es típicamente utilizada en equipos de consumidor. Las longitudes de cuadros y bloques para varias normas de codificación de video y de audio se muestran en la tabla 1 y tabla II respectivamente. Las entradas en las tablas para MPEG II Y MPEG III se refieren a las técnicas de codificación de la capa II de MPEG-2 y la capa III de MPEG- 2 especificadas en la norma ISO/IEC 13818-3 por el Grupo de Expertos en Películas Cinematográficas de la Organización de Normas Internacionales. La entrada para "AC-3" se refiere a una técnica de codificación desarrollada por los laboratorios Dolby (Dolby Laboratories, Inc.) y especificadas en la norma A-52 por el Comité de Sistemas de Televisión Avanzado. La "longitud de bloque" para PCM de 48 kHz es el intervalo de tiempo entre dos muestras adyacentes . Norma de Vídeo Longitud de Estándar Cuadro DTV (30 Hz) 33.333 mseg. NTSC 33.367 mseg. PAL 40 mseg. Película 41.667 mseg. Cuadros de Vídeo Tabla I Norma de Audio Longitud de Estándar Cuadro PCM 20.8 µseg. MPEG II 24 mseg. MPEG III 24 mseg. AC-3 32 mseg. Cuadros de Audio Tabla II En aplicaciones que reúnen conjuntamente información de video y de audio que se conforma a cualquiera de estas normas, los bloques de audio y los cuadros de video son raramente sincronizados. El intervalo de tiempo mínimo entre apariciones de sincronización de video/audio se muestra en la tabla III. Por ejemplo, la tabla muestra que las películas cinematográficas, a 24 cuadros por segundo, serán sincronizadas con límite de bloque de audio de MPEG de no más de una vez en cada período de 3 segundos, y será sincronizada con un bloque de audio AC-3 no más de una vez en cada período de 4 segundos .
Norma de Audio DTV (30 Hz) NTSC. PAL Película Estándar PCM 33.333 mseg 166.833 mseg. 40 mseg. 41.67 mseg.
MPEG II 600 mseg. 24.024 seg. 120 mseg. 3 seg. MPEG III 600 mseg. 24.024 seg. 120 mseg. 3 seg. AC-3 800 mseg. 32.032 seg. 160 mseg. 4 seg.
Intervalo de Tiempo Mínimo Entre Sincronización de Video/Audio Tabla III El intervalo mínimo entre apariciones de sincronización, expresadas en cantidades de bloques de i . audio a cuadros de video, se muestran en la Tabla IV. Por ejemplo, la sincronización aparece no más de una vez entre bloques AC-3 y cuadros de PAL dentro de un intervalo abarcado por cinco bloques de audio y cuatro cuadros de video. Norma de Audio DTV (30 Hz) NTSC. PAL Pelí¬ Estándar cula PCM 1600:1 8008:5 1920:2 . 2000:1 MPEG II 25:18 1001:720 5:3 125:72 MPEG III 25:18 1001:720 5:3 125:72 AC-3 25:24 1001:960 5:4 125:96 Número de Cuadros Entre Sincronización de Video/Audio Tabla IV Cuando se junta información de audio, la edición se produce en general en un límite de cuadro de video. En base a la información que se muestra en las tablas III y IV, se puede apreciar que tal edición solamente ocurrirá en un límite de cuadro de audio. Para video NTSC y audio AC-3, por ejemplo, la probabilidad de que una edición en un límite de video ocurra también en un límite de bloque de audio, es de no más de aproximadamente 1/960 o aproximadamente 0.1 por ciento. Por supuesto, las ediciones para ambos flujos de información que son cortadas y empalmadas deben ser sincronizadas de esta manera, de lo contrario alguna información de audio será perdida; por lo tanto, es casi cierto que un empalme de información de NTSC/AC-3 para dos ediciones al azar ocurrirá en un límite que no sea de un bloque de audio y dará como resultado uno o dos bloques de información de audio perdida. Debido a que AC-3 utiliza una transformada TDAC, sin embargo, aún casos en que ningún bloque de información sea perdido dará como resultado señales espurias de distorsión por bordes dentados no canceladas por las razones arriba expuestas .
C. Consideraciones de la Longitud de Segmentos y Bloques Además de las consideraciones que afectan la sincronización de video/audio arriba mencionadas, una consideración adicional se necesita para la longitud de los segmentos de información de audio que son codificados debido a que esta longitud afecta las características del funcionamiento de los sistemas de video/audio de varias maneras . Un efecto de la longitud de los segmentos y bloques es la cantidad de "latencia" del sistema o retardo en la propagación de información a través de un sistema. Se producen retardos durante la codificación para recibir y regular segmentos de información de audio y para efectuar el proceso de codificación deseado en los segmentos regulados que genera bloques de información codificada. Los retardos se producen durante la decodificación para recibir y regular los bloques de información codificada, para efectuar el proceso de decodificación deseado en los bloques regulados que recuperan segmentos de información de 5 audio y genera una señal de audio de salida. Los retardos de propagación en la codificación y decodificación de audio son inconvenientes debido a que hacen más difícil mantener una alineación entre la información de video y de audio. Otro efecto de la longitud de segmentos y bloques en 10 los sistemas que utilizan transformadas de bloques y codificación de cuantificación es la calidad del audio recuperado de los procesos de codificación-decodificación. Por un lado, la utilización de longitudes de segmento largas permite que las transformadas de bloques tengan una 15 alta selectividad en frecuencia, lo que es conveniente para procesos de codificación perceptible debido a que permite que las decisiones de codificación perceptible, tales como asignación de bits, sean efectuadas en forma más precisa. Por otro lado, la utilización de longitudes de segmento 0 largas da como resultado que la transformada de bloques tenga baja selectividad temporal, lo que es inconveniente para procesos de codificación perceptible debido a que impide que las decisiones de codificación perceptible, tales como asignación de bits, sean adoptadas 5 suficientemente rápido para que se explote plenamente las i-£ -A ^.i í i. características psicoacústicas del sistema auditivo humano. En particular, las señales espurias de codificación de eventos de señales altamente no estacionarias, tales como transitorios, pueden ser audibles en la señal de audio 5 recuperada si la longitud del segmento excede el intervalo de enmascarado pretemporal del sistema auditivo humano. De este modo, los procesos de codificación de longitud fija deben utilizar una longitud de segmento de compromiso que compense los requerimientos de alta resolución temporal 0 contra los requerimientos de alta resolución de frecuencia. Una solución consiste en adaptar la longitud del segmento de acuerdo a una o más características de deformación de audio a ser codificada. Por ejemplo, si se detecta un evento transitorio de suficiente amplitud, un 5 procesamiento de codificación por bloques puede optimizar su resolución temporal y de frecuencia para el evento transitorio desplazándose temporalmente a una longitud de segmento más corta. Este proceso adaptativo es algo más complicado en sistemas que utilizan una transformada de 0 TDAC, debido a que ciertas restricciones deben ser cumplidas para que se mantengan las propiedades de cancelación de distorsión por bordes dentados de la transformada. Un número de consideraciones para adaptar la longitud de las transformadas TDAC son tratadas en la 5 patente de los Estados Unidos de América 5,394,473. ¡rt.lJ At.-im, , ti',,„ i, . - -, „-• ?r, ,.? ,¡ . .. ^^..i^fia DESCRIPCIÓN DE LA INVENCIÓN Teniendo en cuenta las diversas consideraciones arriba mencionadas, un objeto de la presente invención consiste en proporcionar la codificación y decodificación de información de audio que sea transportada en cuadros alineados con cuadros de información de video, y que permita que procesos de codificación de bloques incluyan transformadas de cancelación de distorsión por bordes dentados con dominio de tiempo para adaptar longitudes de segmentos y bloques de acuerdo a las características de la señal . Ventajas adicionales que pueden ser obtenidas de diversos aspectos de la presente invención incluyen evitar o por lo menos minimizar señales espurias audibles que resulten de operaciones de edición tales como empalmado, y controlar latencia de procesamiento para mantener más fácilmente la sincronización de video/audio. De acuerdo a lo divulgado en un aspecto de la presente invención, un método para codificar información de audio comprende recibir una señal de referencia que lleve la alineación de cuadros de información de video en una secuencia de cuadros de información de video; recibir una señal de audio que lleve información de audio, analizar la señal de audio para identificar características de la información de audio; generar una señal de control en - *-* - ^ • U * .f^^^t'^a- respuesta a las características de la información de audio; aplicar un proceso de codificación de bloques adaptativos a segmentos superpuestos de la señal de audio para generar una pluralidad de bloques de información codificada, en el que el proceso de codificación de bloques adapte longitudes de segmento en respuesta a la señal de control, y ensamblar la pluralidad de bloques de información codificada y de información de control que llevan las longitudes de segmento para formar un cuadro de información codificada que esté alineada con la señal de referencia. De acuerdo a lo divulgado en otro aspecto de la presente invención, un método para decodificar información de audio comprende recibir una señal de referencia que lleve la alineación de cuadros de información de video en una secuencia de cuadros de información de video; recibir cuadros de información decodificados que estén alineados con la señal de referencia, y comprendan información de control y bloques de información de audio codificada; generar una señal de control en respuesta a la información de control; aplicar un proceso de decodificación de bloques adaptativo a la pluralidad de bloques de información de audio codificada en un respectivo cuadro de información codificado; en el que el proceso de decodificación de bloques se adapta en respuesta a la señal de control para generar una secuencia de segmentos superpuestos de información de audio. De acuerdo a lo divulgado en otro aspecto más de la presente invención, un medio de almacenamiento de información, tal como un disco óptico, un disco magnético y 5 una cinta magnética lleva información de audio dispuesta en cuadros de video e información de audio codificada, en los que un respectivo cuadro de información codificado corresponde a un respectivo cuadro de video e incluye información de control que lleva longitudes de segmento de 10 información de audio en una secuencia de segmentos superpuestos, teniendo un respectivo segmento un respectivo intervalo de superposición con un segmento adyacente y teniendo la secuencia una longitud igual al intervalo de cuadros más un intervalo de superposición de cuadros, y 15 bloques de información de audio codificada, teniendo un respectivo bloque una respectiva longitud y respectivo contenido que, cuando procesado por un proceso adaptativo de decodificación de bloques, da como resultado un respectivo segmento de información de audio en la secuencia 20 de segmentos superpuestos. En toda la presente descripción, términos como "codificación" y "codificador" se refieren a diversos métodos y dispositivos para procesamiento de señales y otros términos como "codificado" y "decodificado" se 5 refieren a los resultados de tal procesamiento. A menudo -¿¿.i í.-i estos términos son comprendidos como que se refieren a, o implican procesos como procesos de codificación de base perceptible que permiten que la información de audio sea llevada o almacenada con requerimientos reducidos de capacidad de información. Sin embargo, según se utilizan en la presente solicitud, estos términos no implican tal procesamiento. Por ejemplo, el término "codificación" incluye procesos más genéricos, tal como la generación de muestras de modulación por códigos de pulsos (PCM) para que representen una señal y se dispone o ensambla información en formatos de acuerdo a alguna especificación. Términos tales como "segmento" , "bloque" y "cuadro" según se utilizan en la presente descripción, se refieren a grupos o intervalos de información que pueden diferir de lo que esos mismos términos se refieren en otras referencias, tales como la norma ANSÍ S4. 40-1992 conocida a veces como la norma de audio digital AES-3/EBU. Términos tales como "filtro" y "banco de filtros", según se utilizan en la presente solicitud, incluyen esencialmente cualquier forma de filtrado recurrente y no recurrente, tales como filtros especulares en cuadratura (QMF) . A menos que el contexto de la descripción indique lo contrario, estos términos son también utilizados en la presente solicitud para referirse a transformadas. El término información "filtrada" se refiere al resultado de X ¡ aplicar "filtros" de análisis. Las diversas características de la presente invención y sus modalidades preferidas pueden ser mejor comprendidas con referencia a la siguiente descripción y los dibujos 5 adjuntos, en los que números de referencia similares se refieren a elementos similares en las distintas figuras. Los dibujos que ilustran los diversos dispositivos muestran componentes principales que son de ayuda para la comprensión de la presente invención. Por razones de 10 claridad, estos dibujos omiten muchas otras características que pueden ser importantes en modalidades prácticas, pero que no son importantes para la comprensión de los conceptos de la presente invención. El procesamiento de señales que se requiere para 15 llevar a la práctica la presente invención puede ser efectuado en una amplia diversidad de maneras, incluyendo programas ejecutados por microprocesadores, procesadores de señales digitales, arreglos lógicos y otras formas de circuitería de computación. Los programas de instrucciones 20 ejecutables en máquinas que implementan diversos aspectos de la presente invención pueden ser incorporados esencialmente en cualquier medio leíble por máquina, incluyendo medios magnéticos y ópticos, tales como discos ópticos, discos magnéticos y cintas magnéticas, y 25 dispositivos de estado sólido, tales como memorias de sólo lectura programable. Los filtros de señales pueden ser implementados esencialmente de cualquier manera, incluyendo filtros digitales recurrentes, no recurrentes y en retícula. Se puede utilizar tecnología digital y analógica en diversas combinaciones de acuerdo a las necesidades y características de la solicitud. Se hace mención en particular a condiciones pertenecientes al procesamiento de flujos de información de audio y video; sin embargo aspectos de la presente invención pueden ser llevados a la práctica en aplicaciones que no incluyan el procesamiento de información de video. El contenido y la siguiente descripción y los dibujos se proporcionan como ejemplo solamente, y no se debe entender que representen limitaciones del alcance de la presente invención.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La figura 1 es una representación esquemática de información de audio dispuesta en segmentos e información codificada dispuesta en bloques que están alineadas con una señal de referencia. La figura 2 es una ilustración esquemática de segmentos de información de audio dispuestos en un cuadro y bloques de información codificada dispuestos en un cuadro que está alineado con una señal de referencia. a?& La figura 3 es un diagrama de bloques de una modalidad de un codificador de audio que aplica un proceso de codificación de bloques adaptativo a segmentos de información de audio. 5 La figura 4 es un diagrama de bloques de una modalidad de un decodificador de audio que genera segmentos de información de audio aplicando un proceso de decodificación de bloques adaptativo a cuadros de información codificada. La figura 5 es un diagrama de bloques de una modalidad 10 de un codificador de bloques que aplica uno de una pluralidad de bancos de filtro a segmentos de información de audio. La figura 6 es un diagrama de bloques de una modalidad de un decodificador de bloques que aplica uno de 15 una pluralidad de bancos de filtro de síntesis a bloques de información de audio codificada. La figura 7 es un diagrama de bloques de un detector transitorio que puede ser utilizado para analizar segmentos de información de audio. 0 La figura 8 ilustra una estructura jerárquica de bloques y sub-bloques utilizados por el detector transitorio de la figura 7. La figura 9 ilustra etapas en un método para implementar el comparador en el detector transitorio de la 5 figura 7. t_2- í ? Fk La figura 10 ilustra etapas en un método para controlar un proceso de codificación de bloques. La figura 11 es un diagrama de bloques de un sistema de síntesis de análisis de cancelación de distorsión por bordes dentados por dominio de tiempo. Las figuras 12 a 15 ilustran los perfiles de ganancia de análisis y funciones de ventana de síntesis para varios modelos de segmentos de acuerdo a dos esquemas de control .
Las figuras 16A a 16C ilustran un conjunto de información de control e información de audio codificada de acuerdo a un primer formato de cuadro. Las figuras 17A a 17C ilustran un conjunto de información de control e información de audio codificada de acuerdo a un segundo formato de cuadro.
MODOS PARA LLEVAR A CABO LA INVENCIÓN A. Señales y Procesamiento 1. Segmentos, Bloques y Cuadros La presente invención se refiere a la codificación y decodificación de información de audio que está relacionada con imágenes llevadas en cuadros de información de video. Con referencia a la figura 1, se muestra una porción de una señal de audio 10 para un canal de información de audio dividida en segmentos 11 a 18 superpuestos. De acuerdo a la presente invención, los segmentos de uno o más canales de información de audio son procesados por un proceso de codificación de bloques para generar un flujo 20 de información codificada que comprende bloques 21 a 28 de información codificada. Por ejemplo, una secuencia de 5 bloques 22 a 25 codificados es generado aplicando un proceso de codificación de bloques a la secuencia de segmentos de audio 12 a 15 para un canal de información de audio. Según se muestra en la figura, un respectivo bloque codificado está atrasado respecto al correspondiente 10 segmento de audio debido a que el proceso de codificación de bloques produce un retardo que es por lo menos tan largo como el tiempo que se requiere para recibir y regular un segmento de audio completo. La cantidad de atraso que se ilustra en la figura no está destinado a ser significativo. 15 Cada segmento en la señal de audio 10 está representado en la figura 1 por una forma que sugiere el "perfil de ganancia" con dominio de tiempo de una función de ventana de análisis que puede ser utilizada en un proceso de codificación de bloques tal como codificación de 20 transformada. El perfil de ganancia de una función de ventana de análisis es la ganancia de la función de ventana en función del tiempo. El perfil de ganancia de la función de ventana para un segmento se superpone con el perfil de ganancia de la función de ventana para un subsiguiente 25 segmento en una cantidad a la que en la presente solicitud ¿fjf?ti?Í i í ..i ,1 -. í ? S . 11 se hace referencia como intervalo de superposición de segmentos. Si bien se anticipa que la codificación de transformada será utilizada en modalidades preferidas, la presente invención puede ser utilizada con esencialmente 5 cualquier tipo de proceso de codificación de bloques que genere un bloque de información codificada en respuesta a un segmento de información de audio. La señal de referencia 30 lleva la alineación de cuadros de video en un flujo de información de video. En el 0 ejemplo que se muestra, las referencias de cuadro 31 y 32 llevan la alineación de dos cuadros de video adyacentes. Las referencias pueden marcar el comienzo de cualquier otro punto deseado de un cuadro de video. Un punto de alineación comúnmente utilizado para video NTSC es la décima línea en 5 el primer campo de un respectivo cuadro de video. La presente invención puede ser utilizada en sistemas de video/audio en los que la información de audio sea llevada con cuadros de información de video. Los flujos de información de video/audio están frecuentemente expuestos a 0 una diversidad de operaciones de procesamiento de edición y señales. Estas operaciones frecuentemente cortan uno o más flujos de información de video/audio en secciones en puntos que están alineados con los cuadros de video; por lo tanto, es conveniente ensamblar la información de audio codificada 5 en la forma que esté alineada con los cuadros de video de I .?.Í , *,* .. * . ----»-*•-«-modo que estas operaciones no efectúen un corte dentro de un bloque codificado. Con referencia a la figura 2, una secuencia o cuadro 19 de segmentos para un canal de información de audio es procesada para generar una pluralidad de bloques codificados que están ensamblados en un cuadro 29, que está alineado con la referencia 31. En esta figura, las líneas discontinuas representan los límites de segmentos y bloques individuales, y las líneas continuas representan los límites de cuadros de segmentos y cuadros de bloques codificados. En particular, la forma de la línea continua para el cuadro de segmento 19 sugiere el perfil de ganancia con dominio de tiempo resultante de las funciones de ventana de análisis para una secuencia de segmentos superpuestos dentro del cuadro. A la cantidad en que el perfil de ganancia para un cuadro de segmento, tal como el segmento 19 superpone el perfil de ganancia de un subsiguiente cuadro de segmento, se hace referencia en la presente solicitud, como el intervalo de superposición de cuadro . En modalidades que utilizan funciones y transformadas de funciones de ventana de análisis, la forma de las funciones de ventana de análisis afectan la ganancia por dominio de tiempo del sistema, como también las características de respuesta de frecuencia de la - j.--...- transformada. La elección de la función de ventana puede tener un efecto significativo en las características de funcionamiento de un sistema de codificación; sin embargo, ninguna forma de ventana particular es esencial en 5 principio para la práctica de la presente invención. Información descriptiva de los efectos de las funciones de ventana se puede obtener de la patente de los Estados Unidos de América 5,109,417, patente de los Estados Unidos de América 5,394,473, patente de los Estados Unidos de 0 América 5,913,191, y la patente de los Estados Unidos de América 5,903,872. En modalidades prácticas, una separación o "banda de protección" es formada entre cuadros de información codificada para proporcionar algunas tolerancias para 5 efectuar ediciones y cortes. Información adicional sobre la formación de estas bandas de protección se puede obtener de la solicitud de patente Internacional PCT/US99/05249, presentada el 11 de Marzo de 1999. Las formas en que información útil puede ser llevada en estas bandas de 0 protección se describen en la Solicitud de Patente Internacional PCT/US99/26324, presentada el 11 de Noviembre de 1999. t fL .l¿A ..~. , LX -F - F - ^ . .. .. . J f:t...^*^ 2. Breve Descripción del Procesamiento de Señales Las señales de audio en general no son estacionarias, si bien algunos pasajes de audio pueden ser sustancialmente estacionarios. Estos pasajes pueden a menudo ser codificados por bloques más eficazmente utilizando longitudes de segmento más largas. Por ejemplo, procesos de codificación tales como de PCM compensado por bloques puede \ codificar pasajes estacionarios de audio a un nivel dado de precisión con menos bit codificando segmentos más largos de muestras. En sistemas de codificación por transformadas basados en psicoacústica, la utilización de segmentos más largos aumenta la resolución de frecuencia de la transformada para separación más precisa de componentes espectrales individuales y decisiones de codificación psicoacústica más precisa. Desafortunadamente, estas ventajas no están presentes para pasajes de audio que sean altamente no estacionarios. En pasajes que contienen un gran evento transitorio de amplitud, por ejemplo, la codificación PCM compensada por bloques de un segmento de longitud es muy ineficiente. En sistemas de codificación de transformadas basados en psicoacústica, las señales espurias causadas por cuantificación de componentes espectrales transitorios son diseminadas a través del segmento que es recuperado por la transformada de síntesis; si el segmento es suficientemente largo, estas señales espurias son dispersas a través de un intervalo que excede el intervalo de enmascarado pre-temporal del sistema auditivo humano. Consecuentemente, por lo general se prefieren longitudes de segmento más cortas para pasajes de audio que sean altamente no estacionarios. Las características de funcionamiento de un sistema de codificación pueden ser mejoradas adaptando los procesos de codificación para codificar y decodificar segmentos de longitudes variantes. Sin embargo, para algunos procesos de codificación, los cambios en longitud de segmento deben conformar a una o más restricciones. Por ejemplo, la adaptación de procesos de codificación que utilizan una transformada de cancelación de distorsión por bordes dentados con dominio de tiempo (TDAC) se deben conformar a varias restricciones si se va a lograr la cancelación de distorsión por bordes dentados. En la presente solicitud se describen modalidades de la presente invención que satisfacen restricciones de TDAC. a. Codificación La figura 3 ilustra una modalidad de un codificador de audio 40 que aplica un proceso codificador de bloques adaptativo a secuencias o cuadros de segmentos de información de audio para uno o más canales de audio para generar bloques de información de audio codificada que son ensamblados en cuadros de información codificada. Estos cuadros de bloques codificados pueden ser combinados con o incluidos en cuadros de información de video.
En esta modalidad, el analizador 45 identifica características de una o más señales de audio llevadas por la información de audio que se hace pasar a lo largo de la trayectoria 44. Ejemplos de estas características incluyen cambios rápidos en amplitud o energía para la totalidad o una porción del ancho de banda de cada señal de audio, componentes de señal de energía que experimentan un cambio rápido en frecuencia, y el tiempo o ubicación relativa dentro de una sección de una señal donde se producen tales eventos. En respuesta a estas características detectadas, el control 46 genera a lo largo de la trayectoria 47 una señal de control que lleva las longitudes de segmento en un cuadro de segmentos para ser procesadas por cada canal de audio. El codificador 50 adapta un proceso de codificación de bloques en respuesta a la señal de control recibida de la trayectoria 47 y aplica el proceso de codificación de bloques adaptado a la información de audio recibida de la trayectoria 44 para generar bloques de información de audio codificada. El formato 48 ensambla los bloques de información codificada y una representación de la señal de control en un cuadro de información codificada que es j¿ ^g^?a^^^ alineado con una señal de referencia recibida de la trayectoria 42 que lleva la alineación de cuadros de información de video. El convertidor 43 es un componente opcional que se describe en mayor detalle más adelante. 5 En modalidades del codificador 40 que procesan más de un canal de información de audio, el codificador 50 puede adaptar y aplicar un proceso de codificación de señales a algunos o la totalidad de los canales de audio. En modalidades preferidas, sin embargo, el analizador 45, el 0 controlador 46 y el codificador 50 operan para adaptar y aplicar un proceso de codificación independiente para cada canal de audio. En una modalidad preferida, por ejemplo, el codificador 40 adapta la longitud del bloque del proceso de codificación aplicado por el codificador 50 a solo un canal 5 de audio en respuesta a la detección de la aparición de un evento transitorio en ese canal de audio. En estas modalidades preferidas, la detección de un evento transitorio en un canal de audio no se utiliza para adaptar el proceso de codificación de otro canal. 0 b. Decodificación La figura 4 ilustra una modalidad del decodificador de audio 60 que genera segmentos de información de audio para uno o más canales de audio aplicando un proceso de 3-ta.J.i,¿l.J.«a.,. ? I- ... . - .^ . _. , ... -i . - .. ..J??J^O?Í? decodificación de bloques adaptativo a cuadros de información codificada que pueden ser obtenidos de señales que llevan cuadros de información de video.
En esta modalidad, el deformateador 63 recibe cuadros de información codificada que están alineados con una referencia de video recibida de la trayectoria 62. Los cuadros de información codificada llevan información de control e información de audio codificada en bloques. El controlador 65 genera a lo largo de la trayectoria 67 una señal de control que lleva las longitudes de segmentos de información de audio en un cuadro de segmentos a ser recuperados de los bloques de información de audio codificada. Opcionalmente, el controlador 65 detecta también discontinuidades en los cuadros de información codificada y genera a lo largo de la trayectoria 66 una señal de "detección de empalme" que puede ser utilizado para adaptar la operación del decodificador 70. El decodificador 70 adapta un proceso de decodificación de bloques en respuesta a la señal de control recibida de la trayectoria 67 y opcionalmente la señal de detección de empalme recibida de la trayectoria 66, y aplica el proceso de decodificación de bloques adaptado a los bloques de información de audio codificada recibida de la trayectoria 64 para generar segmentos de información de audio que -»•-»---'* * tengan longitudes que se conformen a las longitudes llevadas en la señal de control. El convertidor 68 es un componente opcional que se describe en mayor detalle más adelante .
B. Imple entaciones de Codificación de Transformadas 1. Codificador de Bloques Como se mencionó anteriormente, el codificador 50 puede efectuar una amplia variedad de procesos de codificación de bloques incluyendo PCM compasado por bloques, modulación delta, filtrado tal como provisto por Filtros Especulares en Cuadratura (QMF) y una variedad de filtros recurrentes, y no recurrentes y de retículo, transformación de bloques, tal como la proporcionada por transformadas TDAC, transformadas de Fourier discretas (DFT) y transformadas de coseno discretas (DCT) , y transformadas de tren de ondas, y cuantificación de bloques de acuerdo a asignación de bits adaptativo. Si bien ningún proceso de codificación de bloques particular es esencial para el concepto básico de la presente invención, aquí se efectúa una mención más particular a procesos que aplican transformadas de TDAC debido a las consideraciones adicionales que se requieren para lograr cancelación de distorsión por bordes dentados.
La figura 5 ilustra una modalidad de codificador 50 que aplica uno de una pluralidad de bancos de filtros implementado por transformadas de TDAC a segmentos de información de audio para un canal de audio. En esta modalidad, el regulador 51 recibe información de audio proveniente de la trayectoria 44 y ensambla la información de audio en un cuadro de segmentos superpuesto que tiene longitudes que son adaptadas de acuerdo a la señal de control recibida de la trayectoria 47. A la cantidad en que un segmento se superpone con un segmento adyacente se hace referencia en la presente solicitud como el intervalo de superposición de segmento. El conmutador 52 selecciona uno de una pluralidad de bancos de filtro para aplicar a los segmentos en el cuadro en respuesta a la señal de control recibida de la trayectoria 47. La modalidad que se ilustra en la figura muestra tres bancos de filtro; sin embargo, se puede utilizar esencialmente cualquier número de bancos de filtros . En una implementación, el conmutador 51 selecciona el banco de filtro 54 para aplicación al primer segmento en el cuadro, selecciona el banco de filtro 56 para aplicación al último segmento en el cuadro, y selecciona el banco de filtros 55 para aplicación para todos los otros segmentos en el cuadro. Bancos de filtros adicionales pueden ser incorporados en la modalidad y seleccionados para l-i... aplicación a segmentos cerca del primer segmento y el último segmento en el cuadro. Algunas de las ventajas que se pueden lograr seleccionando adaptativamente bancos de filtro de esta manera se describen más adelante. La información que se obtiene de los bancos de filtros es ensamblada en el regulador 58 para formar bloques de información codificada, que son pasadas a lo largo de la trayectoria 59 al formato 48. El tamaño de los bloques varía de acuerdo a la señal de control recibida de la trayectoria 47. Una diversidad de componentes para modelos perceptibles psicoacústicos, asignación y cuantificación de bits adaptativos, pueden ser necesarios en sistemas prácticos, pero no se incluyen en la figura para claridad ilustrativa. Componentes como estos pueden ser utilizados, pero no son requeridos para llevar a la práctica la presente invención. En una modalidad alternativa del codificador 50, un único banco de filtros es adaptado y aplicado a los segmentos de información de audio formados en el regulador 51. En otras modalidades del codificador 50 que utilizan procesos de codificación de bloques no superpuestos, tales como PCM codificado por bloques u otros filtros, no es necesario que los segmentos adyacentes se superpongan. Los componentes que se ilustran en la figura 5 o los i 1 componentes que comprenden diversas modalidades alternativas pueden ser replicados para proporcionar procesamiento paralelo para múltiples canales de audio, o estos componentes pueden ser utilizados para procesar 5 múltiples canales de audio de una manera seriada o multiplexada. 2. Decodificador de Bloques Como se mencionó anteriormente, el decodificador 70 0 puede efectuar una amplia variedad de procesos de decodificación de bloques. En un sistema práctico, el proceso de decodificación debe ser complementario al proceso de codificación de bloques utilizado para preparar la información a ser decodificada. Como se explicó anteriormente, aquí se efectúa una mención particular a procesos que aplican transformadas de TDAC debido a las consideraciones adicionales que se requieren para lograr cancelación de distorsión por bordes dentados. La figura 6 ilustra una modalidad de un decodificador 70 que aplica uno de una pluralidad de bancos de filtros inversos o de síntesis, implementados por transformadas de TDAC a bloques de información de audio codificada para un canal de audio. En esta modalidad, el regulador 71 recibe bloques de información de audio codificada de la i í-a, te„ a trayectoria 64 que tienen longitudes que varían de acuerdo a la señal de control recibida de la trayectoria 67. El conmutador 72 selecciona uno de una pluralidad de bancos de filtro de síntesis para aplicar a los bloques de información codificada en respuesta a la señal de control recibida de la trayectoria 67 y opcionalmente en respuesta a una señal de detección de empalme recibida de la trayectoria 67. La modalidad que se ilustra en la figura muestra tres bancos de filtro de síntesis; sin embargo, esencialmente se puede utilizar cualquier cantidad de bancos de filtro. En una implementación, el conmutador 71 selecciona el banco de filtros de síntesis 74 para aplicación al bloque que representa el primer segmento de audio en un cuadro de segmentos, selecciona el banco de filtro de síntesis 56 para aplicación al bloque que representa el último segmento en el cuadro, y selecciona el banco de filtros 55 para aplicación a los bloques que representan todos los otros segmentos en el cuadro. Bancos de filtros adicionales pueden ser incorporados a la modalidad y seleccionados para aplicación a bloques que representen segmentos que estén cerca del primer segmento y el último segmento en el cuadro. Algunas de las ventajas logradas por seleccionar adaptativamente bancos de filtros de síntesis en esta manera se describen más adelante. La información que se obtiene de los bancos de filtros de síntesis es ensamblada en el regulador 78 para formar segmentos superpuestos de información de audio en el cuadro de segmentos. Las longitudes de los segmentos varían de acuerdo a la señal de control recibida de la trayectoria 67. Segmentos adyacentes pueden ser agregados juntos en los intervalos de superposición de segmentos para generar un flujo de información de audio a lo largo de la trayectoria 79. Por ejemplo, la información de audio puede ser pasada a lo largo de la trayectoria 79 al convertidor 68 en modalidades que incluyan el convertidor 68. Una variedad de componentes para asignación y decuantificación de bits adaptativas pueden ser necesarias en sistemas prácticos, pero no se incluyen en la figura por claridad ilustrativa. Características como estas pueden ser utilizadas, pero no son requeridas para llevar a la práctica la presente invención. En una modalidad alternativa del decodificador 70, un único banco de filtros inverso es adaptado y aplicado a bloques de información codificada formados en el regulador 71. En otras modalidades del decodificador 70, no es necesario que segmentos adyacentes generados por el proceso de decodificación se superpongan. Los componentes que se ilustran en la figura 6 o los componentes que comprenden diversas modalidades alternativas pueden ser replicados para proporcionar procesamiento paralelo para múltiples canales de audio, o estos componentes pueden ser utilizados para procesar múltiples canales de audio en una manera seriada o multiplexada.
C. Componentes y Características Principales Se describen en mayor detalle más adelante, modalidades específicas de los componentes principales en el codificador 40 y el decodificador 60 ilustrados en las figuras 3 y 4, respectivamente. Estas modalidades particulares se describen con referencia a un canal de audio, pero pueden ser extendidas a canales de audio de múltiples procesos en un número de formas, incluyendo, por ejemplo, la replicación de componentes o la aplicación de componentes de una manera seriada o multiplexada. En los siguientes ejemplos, se supone que un cuadro o secuencia de segmentos de información de audio tiene una longitud igual a 2.048 muestras y un intervalo de superposición de cuadros con un cuadro subsiguiente igual a 256 muestras. Esta longitud de cuadros e intervalo de superposición de cuadros son preferidos para sistemas que procesan información para cuadros de video que tienen una frecuencia de cuadros de aproximadamente 30 Hz o menos. r ÁA?B - l- - 2 -* » -F . ^^ ^ -_ ._ .. ^..._ . *- - - 1 * 1. Análisis de Señales de Audio El analizador 45 puede ser implementado en una amplia variedad de maneras para identificar esencialmente cualquier característica de señal deseada. En una modalidad que se ilustra en la figura 7, el analizador 45 es un detector de evento transitorio con cuatro secciones principales que identifican la aparición y la posición de cambios rápidos o "transitorios" en la amplitud de señales. En esta modalidad, los cuadros de 2048 muestras de información de audio son divididas en treinta y dos bloques de 64 muestras no superpuestas, y cada bloque es analizado para determinar si en ese bloque aparece un evento transitorio. La primera sección del detector de eventos transitorios es un filtro 101 de paso alto (HPF) que excluye componentes de señales de frecuencias más bajas del proceso de análisis de señales. En una modalidad preferida, el HPF 101 es implementado por un filtro de respuesta de impulsos infinitos de segundo orden (IIR) con una frecuencia de corte de 3 dB nominal de aproximadamente 7 kHz. Esta frecuencia de corte óptima se puede desviar de este valor nominal de acuerdo a preferencias personales. Si se desea, la frecuencia de corte nominal puede ser refinada empíricamente con ensayos de audición. La segunda sección del detector de eventos _=^_ MÜ transitorios es el sub-bloque 102, que dispone cuadros de información de audio filtrada recibida del HPF 101 en una estructura jerárquica de bloques y sub-bloques. El sub-bloque 102 forma bloques de 64 muestras en el nivel 1 de la jerarquía y divide los bloques de 64 muestras en sub-bloques de 32 muestras en el nivel 2 de la jerarquía. Esta estructura jerárquica se ilustra en la figura 8. El bloque 111 es un bloque de 64 muestras en el nivel 1. Los sub-bloques B121 y B122 en el nivel 2 son divisiones de 32 muestras del bloque Bill. El bloque BllO representa un bloque de 64 muestras de información de audio filtrada que precede inmediatamente al bloque Bill. En este contexto, el bloque Bill es un bloque "actual" y el bloque BllO es un bloque "previo". De manera similar el bloque B120 es un sub-bloque de 32 muestras del bloque BllO que precede inmediatamente al sub-bloque 121. En casos donde el bloque actual es el primer bloque en un cuadro, el bloque previo representa el último bloque en el cuadro previo. Según se explicará más adelante, un evento transitorio es detectado comparando niveles de señales en un bloque actual con los niveles de señales en un bloque previo. La tercera sección del detector de eventos transitorios es el detector de picos 103. Arrancando en el nivel 2, el detector de picos 103 identifica la muestra de mayor magnitud en el sub-bloque B121 como el valor pico P121, e identifica la muestra de mayor magnitud en el sub- bloque B122 como el valor pico P122. Continuando en el nivel 1, el detector de picos identifica el mayor de los valores pico P121 y P122 como el valor pico Pili del bloque 5 Bill. Los valores pico P110 y P120 para los bloques BllO y B120, respectivamente, fueron determinados por el detector de picos 103 previamente cuando el bloque BllO era el bloque actual . La cuarta sección del detector de eventos transitorios 0 es el comparador 104, que examina los valores pico para determinar si un evento transitorio ocurre en un bloque particular. En la figura 9 se ilustra una manera en la que el comparador 104 puede ser implementado. La etapa S451 examina los valores pico para los sub-bloques B120 y B121 en el nivel 2. La etapa S453 examina los valores pico para los sub-bloques B121 y B122. La etapa S453 examina los valores pico para los sub-bloques en el nivel 1. Estos exámenes son efectuados comparando la proporción de los dos valores pico con un valor de umbral que sea apropiado para el nivel jerárquico. Para los sub-bloques B120 y B121 en el nivel 2, por ejemplo, esta comparación en la etapa S451 puede ser expresada como ? .i J .» í . .
P120 < TH2 (la) P121 5 donde TH2 = valor de umbral para el nivel 2. Si es necesario, una comparación similar en la etapa S452 es efectuada para los valores pico de los sub-bloques B121 y B122. Si ninguna de las comparaciones en las etapas S451 y 0 S452 para sub-bloques adyacentes en el nivel 2 es verdadera, entonces se efectúa una comparación en la etapa S453 para los valores pico en los bloques BllO y Bill en el nivel 1. Esto puede ser expresado como: P110 5 < TH1 (Ib) Plll donde TH = valor de umbral para el nivel 1. En una modalidad, TH2 es 0.15 y TH1 es 0.25; sin 0 embargo, estos umbrales pueden ser variados de acuerdo a preferencias personales. Si se desea, estos valores pueden ser refinados empíricamente con ensayos de audición. En una implementación preferida, estas comparaciones son efectuadas sin división debido a que un cosiente de dos t Ü ?^ A fi . J ».- ? valores pico es indefinido si el valor pico en el denominador es cero. Para el ejemplo arriba dado para sub- bloques B120 y B121, la comparación en la etapa S451 puede ser expresada como 5 P120<TH2*P121 (2) Si ninguna de las comparaciones efectuadas en las etapas S451 a S453 son verdaderas, la etapa S457 genera una 10 señal que indica que no se produce un evento transitorio en el bloque de 64 muestras corrientes, que en este ejemplo es el bloque Bill. El análisis de señales para el bloque de 64 muestras corrientes es terminado. Si cualquiera de las comparaciones efectuadas en las 5 etapas S451 hasta S453 son verdaderas, las etapas S454 y S455 determinan si la señal en el bloque de 64 muestras corrientes es suficientemente grande para que justifique la adaptación del proceso de codificación de bloques para cambiar la longitud del segmento. La etapa S454 compara el 0 valor pico Pili para el bloque Bill actual con un umbral de valor pico mínimo. En una modalidad, este umbral se establece a -70 dB en relación al valor pico posible máximo . Si la condición ensayada en la etapa S454 es 5 verdadera, la etapa S455 compara dos mediciones de energía M .?.?.?».*.. ^^ . . a. .. de señal para los bloques BllO y Bill. En una modalidad, la medición de señal de energía para un bloque es el promedio de los cuadrados de 64 muestras en el bloque. La medición de energía de señal para el bloque actual Bill es comparada con un valor igual al doble de la misma medición de energía de señal para el bloque previo BllO. Si el valor pico y la medición de la energía de la señal para el bloque actual cumple los dos ensayos efectuados en las etapas S454 y S455, la etapa S457 genera una señal que indica que se produce un evento transitorio en el bloque Bill actual. Si alguno de los ensayos falla, la etapa S457 genera una señal que indica que no se produce un evento transitorio en el bloque Bill actual. Este proceso de detección de evento transitorio se repite para todos los bloques de interés en cada cuadro. 2. Control de la Longitud de Segmentos A continuación se describirán modalidades del controlador 46 y el controlador 65. Estas modalidades son adecuadas para utilización en sistemas que aplican bancos de filtros TDAC a cuadros de proceso de información de audio codificada de acuerdo al segundo de los dos formatos que se describen más adelante. Según se explica más adelante, el procesamiento de acuerdo al segundo formato se J.A. -i-»-l * prefiere en un sistema que procesa información de audio que es ensamblada con o incluida dentro de cuadros de video que están destinados para transmisión con una frecuencia de cuadros de video de aproximadamente 30 Hz o menos. De acuerdo al segundo formato, el procesamiento de cada secuencia de segmentos de audio que corresponde a un cuadro de video es dividido en procesos separados pero relacionados que son aplicados a dos sub-secuencias o sub-cuadros . Los esquemas de control para sistemas que procesan cuadros de información de audio de acuerdo al primer formato pueden ser muy similares a los esquemas de control para sistemas que procesan cuadros de información de audio de acuerdo al segundo formato, que se describen más adelante. En estos sistemas para el primer formato, el procesamiento de segmentos de audio que corresponden a un cuadro de video es sustancialmente el mismo que uno de los procesos aplicados a una respectiva sub-secuencia o sub-cuadro en el segundo formato. a. Codificador En la modalidad de codificador 40 arriba descrita e ilustrada en la figura 3, el controlador 46 recibe una señal del analizador 45 que lleva la presencia y ubicación de eventos transitorios detectados en un cuadro de información de audio. En respuesta a esta señal, el control 46 genera una señal de control que lleva las longitudes de los segmentos que dividen el cuadro en dos sub-cuadros de segmentos superpuestos a ser procesados por un proceso de codificación de bloques. Abajo se describen dos esquemas para adaptar el proceso de codificación de bloques. En cada esquema, los cuadros de 2048 muestras son divididos en segmentos superpuestos que tienen longitudes que varían entre una longitud mínima de 256 muestras y una longitud máxima efectiva de 1152 muestras.
Un método de control básico tal como el que se ilustra en la figura 10 puede ser utilizado para controlar cualquiera de los esquemas. Las únicas diferencias en los métodos para controlar los dos esquemas son los intervalos de bloques o cuadros en que se ensaya la aparición de un evento transitorio. Los intervalos para los dos esquemas se enlistan en la tabla V. En el primer esquema, por ejemplo, el intervalo -2 va de la muestra 128 a la muestra 831, que corresponde a una secuencia de bloques de 64 muestras, desde el bloque 2 al bloque 12. En el segundo esquema, el intervalo -2 va desde la muestra 128 a la muestra 895, que corresponde a los números de bloque 2 a 13. i-t-i 'ti. i- INTERVALO PRIMER ESQUEMA SEGUNDO ESQUEMA DE CUADRO MUESTRAS BLOQUES MUESTRAS BLOQUES DE A DE A DE A DE A lntervalo-1 0 127 0 1 0 127 0 1 lntervalo-2 128 83 1 2 12 128 895 2 13 lntervalo-3 832 1343 13 20 896 1279 14 19 lntervalo-4 1344 2047 21 3 1 1280 2047 20 31 Intervalos de Cuadros y Control de Codif icación Tabla V Con referencia a la figura 10, la etapa S461 examina una señal recibida del analizador 45 para determinar si se produce un evento transitorio o algún otro evento de activación en cualquier bloque dentro del intervalo .3. Si esta condición es verdadera, la etapa S462 genera una señal de control que indica que el primer sub-cuadro está dividido en segmentos de acuerdo a un modelo de segmentos "corto-1", y la etapa S463 genera una señal que indica que el segundo sub-cuadro está dividido en segmentos de acuerdo a un modelo de segmentos "corto-2" . Si la condición que se ensaya en la etapa S461 no es verdadera, la etapa S464 examina la señal recibida del analizador 45 para determinar si se produce un evento transitorio u otro evento de activación en cualquier bloque dentro del intervalo-2. Si esta condición es verdadera, la -U - ^teiüib^^wá^^^ etapa S465 genera una señal de control que indica que el primer sub-cuadro está dividido en segmentos de acuerdo a un modelo de segmentos "puente-1" . Si la condición ensayada en la etapa S463 no es verdadera, la etapa 466 genera una 5 señal de control que indica que el primer sub-cuadro está dividido en segmentos de acuerdo a un modelo de segmentos "largo-2" . La etapa S467 examina la señal recibida del analizador 45 para determinar si se produce un evento transitorio u 10 otro evento de activación en cualquier bloque dentro del intervalo-4. Si esta condición es verdadera, la etapa S468 genera una señal de control que indica que el segundo sub- cuadro está dividido en segmentos de acuerdo a un modelo de segmentos "puente-2" . Si la condición ensayada en la etapa 15 S467 no es verdadera, la etapa S469 genera una señal de control que indica que el segundo sub-cuadro está dividido en segmentos de acuerdo a un modelo de segmentos "largo-2" . Los modelos de segmentos arriba mencionados se describen en mayor detalle más adelante. 0 b. Decodificador En la modalidad del decodificador 60 arriba descrito e ilustrado en la figura 4, el control 65 recibe información de control obtenida de los cuadros de información 5 codificada recibida de la trayectoria 61 y, en respuesta, t ?.. ¿ ,? L Í F genera una señal de control a lo largo de la trayectoria 67 que lleva las longitudes de segmentos de información de audio a ser recuperadas por un proceso de decodificación de bloques de los bloques de información de audio codificada. 5 En una modalidad alternativa, el control 65 detecta también discontinuidades en los cuadros de información codificada y genera una señal de "detección de empalme" a lo largo de la trayectoria 66 que puede ser utilizada para adaptar el proceso de decodificación de bloques. Esta característica 0 opcional se describe más adelante.
En general, el controlador 65 genera una señal de control que indica cual de varios modelos de segmentos van a ser recuperados de dos sub-cuadros de bloques codificados. Estos modelos de segmentos corresponden a los 5 modelos arriba descritos con referencia al codificador y se describen en mayor detalle más adelante. 3. Bancos de Filtros Adaptativos A continuación se describirán modalidades del codificador 50 y decodificador 70 que aplican bancos de 0 filtros TDAC para analizar y sintetizar segmentos de información de audio superpuestos. Las modalidades que se describen más adelante utilizan el sistema de transformada TDAC conocido como Cancelación de Distorsión por Bordes Dentados con Dominio de Tiempo Apilada Imparmente (O-TDAC) .
I .,1 J...Í ,»..-. .......i En estas modalidades, las funciones de ventana y las funciones de núcleo de transformada son adaptadas para procesar secuencias o sub-cuadros de segmentos en los que las longitudes de los segmentos pueden variar de acuerdo a 5 cualquiera de los varios modelos arriba mencionados. La longitud del segmento, la función de ventana y la función de núcleo de transformada que se utiliza para cada segmento en los diversos modelos se describe más abajo a continuación de una introducción general a las 0 transformadas TDAC. a. Breve Descripción de la TDAC (1) Transformadas Como fue descrito por Princen, y otros, y según se 5 ilustra en la figura 11, un sistema de análisis-síntesis de transformada de TDAC comprende una función de ventana de análisis 131 que se aplica a segmentos superpuestos de muestras de señales, una transformada de análisis 132 que se aplica a los segmentos provistos de ventanas, una 0 transformada de síntesis 133 que se aplica a bloques de coeficientes obtenidos de la transformada de análisis, una función de ventana de síntesis 134 que se aplica a segmentos de muestras obtenidos de la transformada de síntesis, y un proceso 135 de adición de superposición que 5 agrega correspondientes muestras de segmentos con ventanas ?-i i¿«J.I -*. Htl -rrXXt..„.f superpuestas para cancelar distorsiones por bordes dentados con dominio de tiempo y recuperar la señal original.
La transformada O-TDAC hacia adelante o de análisis puede ser expresada como 2p_ + -](/!+#?0) 'para 0 < k<N (3a) N y la transformada O-TDAC inversa o de síntesis puede ser expresada como Donde k = índice de frecuencia, n = número de muestras de señales, G = constante de escalamiento N = longitud del segmento, n0 = término para la cancelación de distorsiones por bordes dentados x(n) = muestra n de señal de entrada provista de ventana y X(k) = coeficiente de transformada k. Estas transformadas se caracterizan por los parámetros G, N y ns. El parámetro G es un parámetro de ganancia que se utiliza para lograr una ganancia deseada de extremo a extremo para el sistema de análisis-síntesis. El parámetro N se refiere al número de muestras en cada segmento, o la 5 longitud del segmento, y la misma se hace referencia en general como la longitud de la transformada. Como se mencionó anteriormente, esta longitud puede ser variada para compensar las resoluciones de frecuencia y temporal de las transformadas. El parámetro ns controla las 10 características de las transformadas de generación de distorsión por bordes dentados y de cancelación de distorsiones por bordes dentados. Las señales espurias de distorsión por bordes dentados con dominio de tiempo que son generadas por el sistema de 5 análisis-síntesis, son esencialmente replicaciones invertidas en el tiempo de la señal original. Los términos n0 en las transformadas de análisis síntesis controlan el punto de "reflexión" en cada segmento en el que las señales espurias son invertidas o reflejadas. Controlando el punto 0 de reflejos y el signo de las señales espurias de distorsión por bordes dentados, estas señales espurias pueden ser canceladas por superposición y agregado de segmentos adyacentes. Información adicional referente a cancelación de distorsiones por bordes dentados se puede 5 obtener de la patente de los Estados Unidos de América 5,394,473. (2) Funciones de Ventana En modalidades preferidas, las funciones de ventana de análisis y síntesis son construidas a partir de una o más funciones elementales que son obtenidas de funciones de ventana de base. Algunas de las funciones elementales se derivan de la función de base de ventana rectangular: f (n,p, N) para 0 < n < (4) Otras funciones elementales se derivan de otra función de ventana de base utilizando una técnica que se describe en los siguientes párrafos. Cualquier función con las propiedades apropiadas de superposición-agregado para TDAC puede ser utilizada para esta función de ventana de base; sin embargo, la función de ventana de base utilizada en una modalidad preferida es la función de ventana de Kaiser-Bessel . La primera parte de esta función de ventana puede ser expresada como : F .-A 1 i i J Donde a = factor alfa de la función de ventana de Kaiser-Bessel, n = número de muestras de ventanas, v = intervalo de superposición de segmentos para las funciones de ventana contenida, y La última parte de esta función de ventana es una réplica invertida en el tiempo de las primeras v muestras de la expresión 5. Una función KBD(n,a,N) de ventanas derivadas de Kaiser-Bessel (KBD) se obtiene a partir de la función de ventana KB(n,a,v) de Kaiser-Bessel de núcleo. La primera parte de la función de ventana de KBD se obtiene de acuerdo a: La última parte de la función de ventana de KBD es una réplica invertida en el tiempo de la expresión 6. (a) Funciones de Ventana de Análisis 5 Cada función de ventana de análisis utilizada en esta modalidad particular se obtiene concatenando dos o más funciones elementales que se muestran en la tabla VI-A 10 15 Funciones de Ventana Elementales 20 Tabla VI-A ?.- Í?AF .±.Á*J.ÍIF FX.- . ..-. .. FMiÁi fí-Jt Las funciones de ventana de análisis para varios modelos de segmentos que se utilizan en dos esquemas de control diferentes son construidas a partir de estas funciones elementales de una manera que se describe más 5 adelante. (b) Funciones de Ventana de Síntesis En sistemas TDAC convencionales, funciones de ventana de análisis y síntesis idénticas se aplican a cada segmento. En las modalidades aquí descritas, funciones de 10 ventana de análisis y síntesis idénticas son en general utilizadas para cada segmento, pero una alternativa o función de ventana de síntesis "modificada" es utilizada para algunos segmentos para mejorar las características de funcionamiento de extremo a extremo del sistema de 15 análisis-síntesis. En general, se utilizan funciones de ventana de síntesis alternativas o modificadas para segmentos en los extremos de los modelos de segmentos "cortos" y "de puente" para obtener un perfil de ganancia de cuadro de extremo a extremo para un intervalo de 20 superposición de cuadros igual a 256 muestras. La aplicación de funciones de ventana de síntesis alternativas puede ser proporcionada por una modalidad del decodificador de bloques 70 como el que se ilustra en la figura 6, que aplica diferentes bancos de filtro de síntesis a diversos segmentos dentro de un cuadro en respuesta a señales de control recibidas de la trayectoria 67 y opcionalmente la trayectoria 66. Por ejemplo, los bancos de filtros 74 y 76 utilizando funciones de ventana de síntesis alternativas pueden ser aplicados a segmentos en los extremos de los cuadros, y el banco de filtros 75 con funciones de ventana de síntesis convencionales puede ser aplicado a segmentos que sean interiores a los cuadros. 0 (i) Características de Respuesta de Frecuencia Alternativas Utilizando funciones de ventana de síntesis alternativas para segmentos "extremos" en los intervalos de superposición de cuadros, un proceso de decodificación de 5 bloques puede obtener una respuesta con dominio de frecuencia de sistema de análisis-síntesis de extremo a extremo, o respuesta (perfil de ganancia) de dominio de tiempo deseada para los segmentos en los extremos de los cuadros. La respuesta de extremo a extremo para cada 0 segmento es esencialmente igual a la respuesta de la función de ventana formada a partir del producto de la función de ventana de análisis y la función de ventana de síntesis aplicadas a ese segmento. Esto puede ser representado algebraicamente como, ¡.iíÁÁÁ ?'á í, ?,..
WP(n) = A(n) WS (n) (7) donde WA(n) = función de ventana de análisis, WS (n) = función de ventana de síntesis, y WP (n) = función de ventana de producto.
Si una función de ventana de síntesis es modificada para convertir la respuesta de frecuencia de extremo a extremo a otra respuesta deseada, es modificada de modo que un producto de la misma y la función de ventana de análisis sea igual a la ventana de producto que tenga la respuesta deseada. Si una respuesta de frecuencia que corresponde a WPD es deseada y la función de ventana de análisis WA es usada para análisis de señales, la relación puede ser expresada como: WPD(n) = WA(n) V?Sx(n) (8) donde WSx(n) = función de ventana de síntesis que se necesita para convertir la respuesta de frecuencia. Esto puede ser reformulado como: WSx (n) = fVA(n) (9) La forma real de la función de ventana WSX para el segmente extremo en un cuadro es algo más complicada si el intervalo de superposición de cuadros se extiende a un segmento lindante que superpone el segmento extremo. En cualquier caso la expresión 9 representa con precisión lo que se requiere de una función de ventana WSX en la porción del segmento extremo que no se superpone con ningún otro segmento en el cuadro. Para sistemas que utilizan O-TDAC, esa porción es igual a la mitad de la longitud del 0 segmento, o 0< n < N. Si el factor alfa para la función WPD de ventana de producto KBD es significativamente más alta que el factor alfa para la función WA de ventana de análisis KBD, la función de ventana de síntesis WSX que se utiliza para 5 modificar la respuesta de frecuencia de extremo a extremo debe tener valores muy grandes cerca del límite del cuadro. Desafortunadamente, una función de ventana de síntesis con tal forma tiene muy pobre característica de respuesta de frecuencia, y degradará la calidad del sonido de la señal 0 recuperada . Este problema puede ser minimizado o evitado descartando unas pocas muestras en el límite del cuadro donde la función de ventana de análisis tenga los valores más pequeños . Las muestras descartadas pueden ser 5 descartadas a cero o de lo contrario excluidas del procesamiento . Los sistemas que utilizan funciones de ventana KBD con valores más bajos de alfa para codificación normal, en general requerirán una modificación más pequeña a la función de ventana de síntesis y menos muestras a ser descartadas en el extremo del cuadro. Información adicional referente a la modificación de una función de ventana de síntesis para alterar la respuesta de frecuencia de extremo a extremo y la característica de perfil de ganancia de dominio de tiempo de un sistema de análisis-síntesis se puede obtener de la patente de los Estados Unidos de América N° 5,903,872. La función de ventana de producto deseada WPD(n) debe proporcionar también una respuesta con dominio de tiempo o perfil de ganancia deseados. Un ejemplo de un perfil de ganancia deseado para la ventana del producto se muestra en la expresión 10 y se describe en los siguientes párrafos. (ii) Alteración del Perfil de Ganancia de Cuadros La utilización de funciones de ventana de síntesis alternativas permite también que un proceso de decodificación de bloques obtenga un perfil de ganancia con dominio de tiempo deseado para cada cuadro. Se utiliza una función de ventana de síntesis alternativa o modificada Í?.? ?.FÍ ^» L.. i. • . É i para segmentos en el intervalo de superposición. Cuando el perfil de ganancia deseado para un cuadro difiere del perfil de ganancia que resultaría de la utilización de una función de ventana de síntesis convencional no modificada. Un perfil de ganancia "inicial" para un cuadro, antes de modificar la función de ventana de síntesis, puede ser expresado como : 0 para O = IK X (10) GP(n,a, x, v) = tf'¿D (/;, a,2v - Ax) P8a x = x < v - x \ para v - x < n < v donde x = número de muestras descartadas en el límite del cuadro, y v = intervalo de superposición de cuadro (iii) Funciones Elementales Cada función de ventana de síntesis utilizada en esta modalidad particular se obtiene concatenando dos o más funciones elementales que se muestran en las tablas VI -A y VI-B XXy.í áyf F,íLt..F A.? FUNCIÓN LONGITUD DE Descripción ELEMENTAL LA FUNCIÓN ES0(n) 192 • para 0 < 7 < 64 5 para 64</7<192 ÍGP(/7 + 64,cr = 3)x = 0, v = 256) • WA, (77) para 0 < 7 < 192 ESi'n) 256 1 WA{rí) para 192</;<256 ÍG/'(/7 + 192,a = 3,r: ^0,v = 256)XVAi(n) para o < n < 64 ES2(n) 128 i WAX (77) para 64 < 77 < 256 10 GP(/7,a = 3,x = 0, : = 256) para 0</7<128 ESiQ? 256 < WA0(n) G (//,a = 3,x = 0,v -256)-tf?0(/7) para 128 < p < 256 ££,(«) 128 G (/7 + 128,Q; = 3)X = 0,v = 256)-J ?0(/7) füara 0</?<128 ESoí-ri 192 replicacion invertida en el tiempo de ESo(n) ES (-n) 256 replicacion invertida en el tiempo de ES n) ES2(-n) A C 128 replicación invertida en el tiempo de ES2(n) 15 ES3(-n) 256 replicacion invertida en el tiempo de ESXn) ESA(-n) 128 replicacion invertida en el tiempo de ESA(n) Funciones de Ventana Elementales 0 Tabla VI-B La función Ao mostrada en la Tabla VI -B es una función de ventana de 256 muestras formada a partir de una 5 i.JJ. . .^. ^-.- concatenación de tres funciones elementales EAo(n)+EA?(- n) +E0S4 (n) . La función Ai (n) es una función de ventana de 256 muestras formada a partir de una concatenación de las funciones elementales EAi (n) +EA? (-n) . Las funciones de ventana de síntesis para varios modelos de segmentos que se utilizan en dos esquemas de control diferentes son construidos a partir de estas funciones elementales de una manera que se describe abajo. b. Esquemas de Control para Codificación de Bloques A continuación se describirán dos esquemas para adaptar un proceso de codificación de bloques. En cada esquema, cuadros de 2048 muestras son divididos en segmentos superpuestos que tienen longitudes que varían entre una longitud mínima de 256 muestras y una longitud máxima efectiva de 1152 muestras. En modalidades preferidas de sistemas que procesan información en cuadros que tienen una frecuencia de cuadros de aproximadamente 30 Hz o menos, dos sub-cuadros dentro de cada cuadro son divididos en segmentos superpuestos de longitud variante. Cada sub-cuadro es dividido en segmentos de acuerdo a uno de varios modelos de segmentos. Cada modelo especifica una secuencia de segmentos en la que cada segmento es puesto en ventana por una función de ventana de análisis particular y transformado por una transformada de análisis particular. Las funciones de ventana de análisis particulares y las transformadas de análisis que son aplicadas a diversos segmentos en un respectivo modelo de segmentos están indicadas en la tabla VII IDENTIFICADOR FUNCIÓN DE VENTANA DE TRANSFORMADA DE ANÁLISIS DE SEGMENTOS ANÁLISIS N «o A256-A EA0(n)+EA?(-n)+E0M(n) 1.15 256 257/2 A256-B EA {n)xEA?(-n) ?!oo 256 129/2 A256-C E06?n)+EA?(?xEA (-n) 115 256 1/2 A384-A £4,(/7)+£íI(-/7)-£012g(/7) 1,50 384 385/2 A384-B EA2(n)+EA¡(-n) 1.22 384 129/2 A384-C EA{(n)+EA2(-n) 1.'22 384 257/2 A384-D £Oi28(77)+£4,?7)+£í?(-/7) 1.50 384 1/2 A512-A EA 2(n)-E16A(n)+EA,(-/7)-h£064(/7) 1.41 512 257/2 A512-D E064(n)xEA i (n)+El M{n)+EA2(-n) 1.41 512 257/2 A2048-A EA2(n)+E 40(>?+IX42(-n)+E0s96(n) 3.02 2048 2049 / 2 A2048-B EO (n)+EA2(??+E\64o(n)+EA2(-n) 3.02 2048 1/2 Tipos de Segmento de Análisis Tabla VII Cada entrada de la tabla describe un tipo respectivo de segmento especificando la función de ventana de análisis a ser aplicada a un segmento de muestra y la transformada de análisis a ser aplicada al segmento de muestras puesto en ventana. Las funciones de ventana de análisis que se muestran en la tabla se describen en términos de una concatenación de funciones de ventana elementales arriba descritas. Las transformadas de análisis son descritas en términos de los parámetros G, N y ns arriba descritos. (1) Primer Esquema 5 En el primer esquema, los segmentos en cada modelo es restringido para que tenga una longitud igual a una potencia entera de dos. Esta restricción reduce los recursos de procesamiento que se requieren para implementar las transformadas de análisis y síntesis. El modelo corto-1 comprende ocho segmentos en los que el primer segmento es un segmento de tipo A256-A y los siete segmentos siguientes son segmentos del tipo A256-B. El modelo corto-2 comprende ocho segmentos en los que los primeros siete segmentos son segmentos de tipo A256-B y el último segmento es un segmento de tipo A-256-C. El modelo de puente-1 comprende siete segmentos en los que el primer segmento es un segmento de tipo A256-A, los cinco segmentos intermedios son segmentos de tipo A256-B, y el último segmento es un segmento de tipo A512-A. El modelo de puente-2 comprende siete segmentos en los que el primer segmento es un segmento de tipo A512-B, los cinco segmentos intermedios son segmentos de tipo A256-B, y el último segmento es un segmento de tipo A256-C. El modelo largo-1 comprende un único segmento de tipo A2048-A. Si bien este segmento tiene en realidad una ÍMÚ¡¡ti im *— • "fe* - - .1 ..-..... -t S .1 longitud de 2048 muestras, su longitud efectiva en términos de resolución temporal es de solo 1152 muestras, debido a que solo 1152 puntos de la función de ventana de análisis no son cero. El modelo de largo-2 comprende un único segmento de tipo A2048-B. La longitud efectiva de este segmento es 1152. Cada uno de estos modelos de segmentos se resume en la tabla VIII-A MODELO DE SEGMENTOS SECUENCIA DE TIPOS DE SEGMENTOS Corto-1 A256-A A256-B A256-B A256-B A256-B A256-B A256-B A256-B Corto-2 A256-B A256-B A256-B A256-B A256-B A256-B A256-B A256-C Puente-1 A256-A A256-B A256-B A256-B A256-B A256-B A512-A Puente-2 A512-B A256-B A256-B A256-B A256-B A256-B A256-C Largo-1 A2048-A Largo-2 A204S-B Modelos de Segmentos de Análisis Para el Primer Esquema de Control Tabla VIII-A Diversas combinaciones de los modelos de segmentos que pueden ser especificadas por el control 46 de acuerdo al primer esquema de control se ilustran en la figura 12. La hilera con la indicación "corto-corto" ilustran los perfiles de ganancia de las funciones de ventana de análisis para la combinación corto-1 a corto-2 de modelos de segmentos. La hilera con la indicación "puente-largo" t a í - . ilustra los perfiles de ganancia de las funciones de ventana de análisis para la combinación largo- 1 a puente 2 de los modelos de segmentos. Las otras hileras en la figura ilustran los perfiles de ganancia de las funciones de 5 ventana de análisis para diversas combinaciones de los modelos de puente y de segmento largo. (2) Segundo Esquema En el segundo esquema, unos pocos segmentos en algunos 0 de los modelos tienen una longitud igual a 384, que no es una potencia entera de dos. La utilización de esta longitud de segmento produce un costo adicional pero ofrece una ventaja en comparación con el primer esquema de control. El costo adicional surge de los recursos de procesamiento 5 adicionales que se requieren para implementar una transformada para un segmento de 384 muestras. El costo adicional se puede reducir dividiendo cada segmento de 384 muestras en tres sub-segmentos de 128 muestras, combinando pares de muestras en cada segmento para generar 32 valores 0 complejos, aplicando una transformada de Fourier rápida compleja (FFT) a cada segmento de muestras de valores complejos, y combinando los resultados para obtener los coeficientes de transformadas deseados. Información adicional referente a esta técnica de procesamiento se 5 puede obtener de la patente de los Estados Unidos de América 5.394.473, de la patente de los Estados Unidos de América 5.297.236, de la patente de los Estados Unidos de América N° 5.890.106, y de la publicación de Oppernheim y Schafer, "Procesamiento de Señales Digitales", Englewood 5 Cliffs, N. J. : Prentice-Hall, Inc., 1975, pp . 307-314. Las ventajas que se obtienen con la utilización de bloques de 384 muestras surgen de permitir la utilización de funciones de ventanas que tienen mejores características de respuesta de frecuencia, y de reducir los retardos de procesamiento. 0 El modelo corto-1 comprende ocho segmentos en los que el primer segmento es un segmento de tipo A384-A y los siete segmentos siguientes son segmentos de tipo A256-B. La longitud efectiva del segmento de tipo A384-A es 256. El modelo corto-2 comprende siete segmentos en los que los 5 primeros seis segmentos son segmentos de tipo A256-B y el último segmento es un segmento de tipo A384-D. La longitud efectiva del segmento de tipo A384-D es de 256. A diferencia de otras combinaciones de modelos de segmentos, las longitudes de los dos sub-cuadros para esta combinación 0 de modelos no son iguales. El modelo de puente-1 comprende siete segmentos en los que el primer segmento es un segmento de tipo A384-A, los cinco segmentos intermedios son segmentos de tipo A256-B y el último segmento es un segmento de tipo A384-C. El modelo 5 de puente-2 comprende siete segmentos en los que el primer segmento es un segmento de tipo A384-B, los cinco segmentos intermedios son segmentos de tipo A256B y el último segmento es un segmento de tipo A384-D. El modelo largo- 1 comprende un único segmento de tipo A2048-A. La longitud efectiva de este segmento es 1152. El modelo de largo-2 comprende un único segmento de tipo A2048-B. La longitud efectiva de este segmento es 1152. Cada uno de estos modelos de segmento se resume en la tabla VIII-B.
MODELO DE SEGMENTOS SECUENCIA DE TIPOS DE SEGMENTOS Corto-1 A384-A ?256-B ?250-U ?256-B A256-B ?256-B A256-B Corlo-2 A256-B ?256-B ?256-B A256-B A256-B A256-B A256-B A384-D PuenlQ-1 A384-? ?256-B A256-B ?256-B A256-B ?256-B A384-C Pueple-2 A384-B ?256-B ?256-B ?25G-B ?256-B A256-B A384-D Largo-1 A2048-A Largo-2 ?2048-B Modelos de Segmentos de Análisis Para el Segundo Esquema de Control Tabla VIII-B Diversas combinaciones de los modelos de segmentos que pueden ser especificados por el control 46 de acuerdo al segundo esquema de control se ilustran en la figura 13. La hilera con la indicación "corto-corto" ilustra los perfiles de ganancia de las funciones de ventana de análisis para la combinación de corto- 1 y corto-2 de modelos de segmentos.
La hilera con la indicación "puente largo" ilustra los perfiles de ganancia de las funciones de ventana de análisis para la combinación largo-1 a puente-2 de modelos de segmentos. Las otras hileras en las figuras ilustran los perfiles de ganancias de las funciones de ventana de análisis para otras combinaciones de los modelos de segmentos de puente y largos. La combinación de puente-1 a puente-2 no se muestra, pero es una combinación válida para este esquema de control . c. Esquemas de Control para Decodificación de Bloques A continuación se describirán dos esquemas para adaptar un proceso de decodificación de bloques. En cada esquema, los cuadros de información codificada son decodificados para generar cuadros de 2048 muestras que son divididos en segmentos superpuestos que tienen longitudes que varían entre una longitud mínima de 256 muestras y una longitud máxima efectiva de 1152 muestras. En modalidades preferidas de sistemas que procesan información en cuadros que tienen una frecuencia de cuadros de aproximadamente 30 Hz o menos, dos sub-cuadros dentro de cada cuadro son divididos en segmentos superpuestos de longitud variante. Cada sub-cuadro es dividido en segmentos de acuerdo a uno de varios modelos de segmentos. Cada modelo especifica una secuencia de segmentos en los que cada segmento es generado por una transformada de síntesis particular, y los resultados de la transformación son puestos en ventana por una función de ventana de síntesis particular. Las transformadas de síntesis particulares y las funciones de ventana de síntesis se indican en la tabla IX.
Tipos de Segmentos de Síntesis Tabla IX Cada entrada de la tabla describe un tipo respectivo de segmento especificando la transformada de síntesis a ser aplicada a un bloque de información codificada para generar liíi? AA.k.J*Aj? ...... .„.l. un segmento de muestras, y la función de ventana de síntesis a ser aplicada al segmento resultante para generar un segmento puesto en ventana de muestras. Las transformadas de síntesis se describen en términos de los parámetros N y n0 arriba indicados. Las funciones de ventana de síntesis que se muestran en la tabla se describen en términos de una concatenación de funciones de ventana elementales arriba descritas. Algunas de las funciones de ventana de síntesis utilizadas durante el proceso de decodificación son formas modificadas de las funciones indicadas en la tabla. Estas funciones de ventana modificadas o alternativas son utilizadas para mejorar las características de funcionamiento del sistema de extremo a extremo. (1) Primer Esquema En el primer esquema, la longitud de segmento en cada modelo son restringidas para que sean una potencia entera de dos. Esta restricción reduce los recursos de procesamiento que se requieren para implementar las transformadas de análisis y síntesis. El modelo corto-1 comprende ocho segmentos, en los que el primer segmento es un segmento de tipo S256-A, el segundo segmento es un segmento de tipo S256-D1, el tercer segmento es un segmento de tipo S256-D3, y los cinco segmentos siguientes son segmentos de tipo S256-B. El modelo corto-2 comprende ocho segmentos, en los que los primeros cinco segmentos son segmentos de tipo S256-B, el sexto segmento es un segmento de tipo S256-D4, el séptimo segmento es un segmento de tipo S256-D2 y el último segmento es un segmento de tipo S256-C. La forma de las funciones de ventana de análisis y síntesis y los parámetros N y n0 para las transformadas de análisis y síntesis para el primer segmento en el modelo corto- 1 están diseñadas de modo que la información de audio para este primer segmento pueda ser recuperada independientemente de otros segmentos sin señales espurias de distorsión por bordes dentados en las primeras 64 muestras del segmento. Esto permite un cuadro de información que está dividido en segmentos de acuerdo al modelo corto-1 a ser anexado a cualquier grupo arbitrario de información sin preocupar la cancelación de distorsión por bordes dentados . Las funciones de ventana de análisis y síntesis y las transformadas de análisis y síntesis para el último segmento en el modelo corto-2 están diseñadas de modo que la información de audio para este último segmento pueda ser recuperada independientemente de otros segmentos sin señales espurias de distorsión por bordes dentados en las últimas 64 muestras del segmento. Esto permite que un t ? ? ?. Í t. .a-,. . rfltiy cuadro de información que esté dividido en segmentos de acuerdo al modelo corto-2 sea seguido por un flujo arbitrario de información sin preocupación para la cancelación de distorsiones por bordes dentados. Diversas consideraciones sobre el diseño y la función de ventana y transformada se describen en mayor detalle en la patente de los Estados Unidos de América N° 5,913,191. El modelo de puente-1 comprende siete segmentos en los que el primer segmento es un segmento del tipo S256-A, el segundo segmento es un segmento de tipo S256-D1, el tercer segmento es un segmento tipo 256-D3, los siguientes tres segmentos son segmentos de tipo S256B, y el último segmento es un segmento de tipo S512-A. El modelo de puente-2 comprende siete segmentos en los que el primer segmento es un segmento de tipo S512-B, los próximos tres segmentos son segmentos de tipo S256B, el quinto segmento es un segmento de tipo S256-D4, el sexto segmento es un segmento de tipo S256-D2, y el ltimo segmento es un segmento de tipo S256-C. El primer segmento en el modelo de puente-1 y el último segmento en el modelo de puente-2 pueden ser recuperados independientemente de otros segmentos sin señales espurias de distorsión por bordes dentados en las primeras y las últimas 64 muestras, respectivamente. Esto permite que un modelo de puente-1 de segmentos siga cualquier flujo arbitrario de información sin preocupación por la cancelación de distorsiones por bordes dentados y permite que un modelo de puente-2 de segmentos pueda ser seguido por cualquier flujo arbitrario de información sin 5 preocupación por la cancelación de distorsiones por bordes dentados . El modelo largo-1 comprende un único segmento de tipo S2048-A. Si bien este segmento es en realidad de una longitud de 2048 muestras, su longitud efectiva en términos 0 de resolución temporal es de solo 1152 muestras, debido a que solo 1152 puntos de la función de ventana de síntesis no son cero. El modelo de largo-2 comprende un único segmento de tipo S2048-B. La longitud efectiva de este segmento es 1152. 5 Los segmentos en los modelos de largo-1 y largo-2 pueden ser recuperados independientemente de otros segmentos sin señales espurias de distorsión por bordes dentados en las primeras y últimas 256 muestras, respectivamente. Esto permite que un modelo de largo-1 de 0 segmentos siga cualquier flujo arbitrario de información sin preocupación por cancelación de distorsiones por bordes dentados y permite que un modelo de largo-2 de segmentos sea seguido por cualquier flujo arbitrario de información sin preocupación por la cancelación de distorsiones por 5 bordes dentados .
Cada uno de estos modelos de segmentos es resumido en la tabla X-A.
MODELO DE SEGMENTOS SECUENCIA DE TIPOS DE SEGMENTOS Corto-1 ?256-A ?250-D1 ?256-D3 A256-B ?256-B ?256-B ?256-B ?256-B Corlo-2 ?256-B A256-B A256-B ?256-D ?256-B A256-D4 ?256-D2 ?256-C Puonlo-1 ?256-A ?256-D 1 ?256-D3 A256-B A256-B ?256-B ?512-? Puenle-2 A512-B A256-B ?256-B ?256-B ?256-D4 A256-D2 ?256-C Largo-1 ?2048-A Largo-2 A2048-B Modelos de Segmentos de Síntesis Para Primer Esquema de Control Tabla X-A Varias combinaciones de modelos de segmentos que pueden ser especificadas por el controlador 65 de acuerdo al primer esquema de control se ilustran en la figura 14. La hilera con la indicación "corto-corto" ilustra los perfiles de ganancia de las funciones de ventana de síntesis para la combinación de corto-1 con corto-2 de modelos de segmentos. La hilera con la indicación "puente- largo" ilustra los perfiles de ganancia de las funciones de ventana de síntesis para la combinación largo- 1 a puente-2 de modelos de segmentos. Las otras hileras en la figura ilustran los perfiles de ganancia de las funciones de ventana de síntesis para diversas combinaciones de los modelos de segmentos de puente y largo. j}i?A&* ¿.m?M¿.. + A.J*-- - -~ ^--- - - - ^ • -• •- -"*- *•» -" "HMt*fftt i fc (2) Segundo Esquema En el segundo esquema, algunos de los segmentos tienen una longitud igual a 384, que no es una potencia entera de dos. Las ventajas y desventajas de este esquema se han 5 señalado antes . El modelo corto-1 comprende ocho segmentos en los que el primer segmento es un segmento de tipo S384-A, el segundo segmento es un segmento de tipo S256-E1, y los siguientes seis segmentos son segmentos de tipo S256-B. El 0 modelo corto-2 comprende siete segmentos en los que los primeros cinco segmentos son segmentos de tipo S256-B, el sexto segmento es un segmento tipo S256-E2, y el último segmento es un segmento de tipo S384-D. A diferencia de otras combinaciones de modelos de segmentos, las longitudes 5 de los dos sub-cuadros de esta combinación de modelos no son iguales. El primer segmento en el modelo corto-1 y el último segmento en el modelo corto-2 pueden ser recuperados independientemente de otros segmentos sin señales espurias 0 con distorsión por bordes dentados en las primeras y últimas 128 muestras, respectivamente. Esto permite que un cuadro sea dividido en segmentos de acuerdo a los modelos corto- 1 y corto-2 para que sigan o sean seguidos por cualquier flujo arbitrario de información sin preocupación 5 por la cancelación de distorsiones por bordes dentados.
E -f* fjf-~&~¿-t„.„ m El modelo de puente-1 comprende siete segmentos en los que el primer segmento es un segmento de tipo S384-A, los cinco segmentos intermedios son segmentos de tipo S256B, y el último segmento es un segmento tipo S384-C. El modelo de puente-2 comprende siete segmentos en los que el primer segmento es un segmento de tipo S384-B, los cinco segmentos intermedios son segmentos de tipo S256B, y el último segmento es un segmento tipo S384-D. Las longitudes efectivas de los segmentos de tipo S384-A, S384-B, S384-C y S384-D son de 256. El primer segmento en el modelo de puente-1 y el último segmento en el modelo de puente-2 pueden ser recuperados independientemente de otros segmentos sin señales espurias de distorsión por bordes dentados en las primeras y últimas 128 muestras, respectivamente. Esto permite que un modelo de puente-1 de segmentos siga cualquier flujo arbitrario de información sin preocupación por la cancelación de distorsiones por bordes dentados y permite que un modelo de puente-2 de segmentos sea seguido por cualquier flujo arbitrario de información sin preocupación por la cancelación de distorsiones por bordes dentados . El modelo largo-1 comprende un único segmento de tipo S2048-A. La longitud efectiva de este segmento es de 1152. El modelo de largo-2 comprende un único segmento de tipo - •- -~^-- . .*&..* . -| S2048-B. La longitud efectiva de este segmento es 1152. El modelo de largo- 1 y el modelo de largo-2 para el segundo esquema de control son idénticos al modelo de largo- 1 y de largo-2 para el primer esquema de control. Cada uno de estos modelos de segmentos se resume en la Tabla X-B.
MODELO DE SEGMENTOS SECUENCIA DE TIPOS DE SEGMENTOS Corto-1 S3S-I-? ?256- I ?256-I3 ?256-B ?256-D ?256-B ?256-B ?256-B Corlo-2 ?256-D ?256-B ?256-D ?256-13 ?256-B ?256-E2 ?384-D Puent?-1 ?3S4-? ?256-B ?256-B ?256-B A256-B ?256-B A384-C Pußnto-2 A384-B ?256-B ?256-B ?256-B ?256-B ?256-B ?384-D Largo-1 ?2048-A Largo-2 ?2048-B Modelos de Segmentos de Síntesis Para Segundo Esquema de Control Tabla X-B En la figura 15 se ilustran diversas combinaciones de modelos de segmentos que pueden ser especificados por el control 65 de acuerdo al segundo esquema de control. La hilera con la indicación de "corto-corto" ilustra los perfiles de ganancia de las funciones de ventana de síntesis para la combinación de corto-1 a corto-2 de modelos de segmentos. La hilera con la indicación "puente-largo" ilustra los perfiles de ganancia de las funciones de ventana de síntesis para la combinación largo- 1 a puente-2 r á?Í.^Xéli ,.,., de modeDcs de segmentos. Las otras hileras en la figura ilustran los perfiles de ganancia de las funciones de ventana de síntesis para diversas combinaciones de los modelos de segmentos de puente y largos . La combinación de 5 puente-1 a puente-2 no se muestra pero es una combinación válida para este esquema de control. 4. Formateado de Cuadros El cuadro 48 puede ensamblar información codificada en 0 cuadros de acuerdo a una amplia diversidad de formatos. Aquí se describen dos formatos alternativos. De acuerdo a estos dos formatos, cada cuadro lleva información codificada para segmentos concurrentes de uno o más canales de audio que pueden ser decodificados independientemente de 5 otros cuadros. Preferentemente, la información en cada cuadro es llevada por una o más "palabras" digitales de longitud de bits fija que están dispuestas en secciones. Preferentemente, la longitud de la palabra que se utiliza para un cuadro particular puede ser determinada en base al 0 contenido del cuadro de modo que un decodificador pueda adaptar su procesamiento a esta longitud. Si el flujo de información codificada es expuesto a transmisión o errores de almacenamiento, un código de detección de errores, tal como un código de verificación de redundancia cíclica (CRC) 5 o una verificación de suma de Fletcher pueden ser incluidas en cada sección de cuadro y/o proporcionada para todo el cuadro . a. Primer Formato En la figura 16A se ilustra el primer formato de cuadros. Como se muestra en la figura, el flujo de información codificada 80 comprende cuadros con información ensamblada de acuerdo a un primer formato. Los cuadros adyacentes están separados por separaciones o bandas de protección que proporcionan un intervalo en el que las ediciones o cortes pueden ser efectuadas sin causar una pérdida de información. Por ejemplo, como se muestra en la figura, un cuadro particular está separado de cuadros adyacentes por bandas de protección GB 81 y 88. De acuerdo al primer formato, la sección de cuadro 82 lleva una palabra de sincronización que tiene un modelo de datos característicos que el equipo de procesamiento de señales puede utilizar para sincronizar el funcionamiento del contenido del flujo de información. La sección de cuadro 83 lleva información de control que se refiere a la información de audio codificada llevada en la sección de cuadro 84, pero que no es parte de la información de audio codificada misma. La sección de cuadro 84 lleva información de audio codificada para uno o más canales de audio. La sección de cuadro 87 puede ser utilizada para rellenar el ? J>A «.. cuadro a una longitud total deseada. Alternativamente, la sección de cuadro 87 puede ser utilizada para llevar información en lugar de o además de relleno de cuadros. Esta información puede llevar características de la señal de audio que son representadas por la información de audio codificada, tal como, por ejemplo, lecturas de medición analógicas que son difíciles de deducir a partir de la información de audio digital codificada. Con referencia a la figura 16B, la sección de cuadro 83 lleva información de control que está dispuesta en varias sub-secciones . La sub-sección 83-1 lleva un identificador para el cuadro y una indicación del formato del cuadro. El identificador del cuadro puede ser un número de 8 bits que tenga un valor que aumente en uno para cada cuadro subsiguiente, reciclando desde el valor 256 hasta el valor 0. La indicación de formato de cuadro identifica la ubicación y extensión de la información llevada en el cuadro. La sub-sección 83-2 lleva uno o más parámetros que se necesitan para decodificar correctamente la información de audio codificada en las secciones de cuadro 84. La subsección 83-3 lleva el número de canales de audio y la configuración del programa de estos canales que está representada por la información de audio codificada en la sección de cuadro 84. Esta configuración de programa puede indicar, por ejemplo, uno o más programas monoaurales, uno ,i.?, s.,..i, ,^ j_ &£d?ttá3Í riÍ J o más programas de dos canales, o un programa con entorno de tres canales izquierdo-centro-derecho y dos canales. La sucesión 84-4 lleva un código CRC u otro código de detección de errores para la sección de cuadro 83. 5 Con referencia a la figura 16C, la sección de cuadro 84 lleva información de audio codificada dispuesta en una o más sub-secciones, cada una de las cuales lleva información codificada que representa segmentos concurrentes de respectivos canales de audio, hasta un máximo de 8 canales. 0 En las sub-secciones 84-1, 84-2, y 84-8, por ejemplo, la sección de cuadro 84 lleva información de audio codificada que representa segmentos concurrentes de audio para los números de canal 1, 2 y 8, respectivamente. La sub-sección 84-9 lleva un código CRC u otro código de detección de 5 errores para la sección de cuadro 84. b. Segundo Formato En la figura 17A se ilustra el segundo formato de cuadro. Este segundo formato es similar al primer formato, 0 pero se prefiere respecto al primer formato en aplicaciones de video/audio que tengan una frecuencia de cuadros de video de aproximadamente 30Hz o menos. Los cuadros adyacentes están separados por separaciones o bandas de protección tales como las bandas de protección 91 y 98 que 5 proporcionan un intervalo en el que se pueden efectuar ediciones o cortes sin causar una pérdida de información. De acuerdo al segundo formato, la sección de cuadro 92 lleva una palabra de sincronización. Las secciones de cuadro 93 y 94 llevan información de control e información de audio codificada similar a la arriba descrita para las secciones de cuadro 83 y 84, respectivamente, en el primer formato. La sección de cuadro 87 se puede utilizar para rellenar el cuadro a una longitud total deseada y para llevar información tal como, por ejemplo, lectura de medición analógica. El segundo formato difiere del primer formato en que la información de audio está dividida en dos sub-cuadros. La sección de cuadro 94 lleva el primer sub-cuadro de información de audio codificada que representa la primera parte de un cuadro de segmentos concurrentes para uno o más canales de audio. La sección de cuadros 96 lleva el segundo sub-cuadro de información de audio codificada que representa la segunda parte del cuadro de segmentos concurrentes. Dividiendo la información de audio en dos sub-cuadros, los retardos que se producen en el proceso de decodificación de bloques se puede reducir, según se explica más adelante. Con referencia a la figura 17B, la sección de cuadro 95 lleva información de control adicional que se refiere a la información codificada llevada en la sección de cuadro 96. La sub-sección 95-1 lleva una indicación del formato de cuadro. La sub-sección 94-4 lleva un código de CRC u otro código de detección de errores para la sección de cuadro 95. Con referencia a la figura 17C, la sección de cuadro 96 lleva el segundo sub-cuadro de información de audio codificada que está dispuesto en una o más sub-secciones, cada una de las cuales lleva información codificada para un respectivo canal de audio. En las sub-secciones 96-1, 96-2 y 96-8, por ejemplo, la sección de cuadro 96 lleva información de audio codificada que representa el segundo sub-cuadro para los números de canal de audio 1, 2 y 8, respectivamente. La sub-sección 96-9 lleva un código de CRC u otro código de detección de errores para la sección de cuadro 96. c. Características Adicionales Puede ser conveniente en algunos sistemas de codificación/desodificación impedir que ciertos modelos de datos aparezcan en la información codificada llevada por un cuadro. Por ejemplo, la palabra de sincronización arriba mencionada tiene un modelo de datos característico que no debería aparecer en ningún otro lado en un cuadro. Si este modelo de datos característico aparece en algún otro lado, tal aparición podría ser identificada falsamente como una palabra de sincronización válida, haciendo que el equipo pierda sincronización con el flujo de información. Como otro ejemplo, algunos equipos de audio que procesan palabras de datos PCM de 16 bit reservan el valor de datos 5 -32768 (expresado en notación decimal como 0x8000) para llevar información de control o de señalización; por lo tanto, es conveniente también en algunos sistemas evitar la aparición de este valor. Varias técnicas para evitar modelos de datos "reservados" o "prohibidos" se revelan en 0 la solicitud internacional de patente N° de serie PCT/US99/22410, presentada el 27 de septiembre de 1999. Estas técnicas modifican o codifican información para evitar cualquier modelo de datos especiales y que se haga pasar con información codificada una clave u otra 5 información de control que pueda ser utilizada para recuperar la información original invirtiendo las modificaciones o la codificación. En modalidades preferidas, la clave o información de control que pertenece a la información en una sección de cuadro particular, es 0 llevada en esa respectiva sección de cuadro, o, alternativamente, una clave o información de control que pertenece a todo el cuadro es llevada en algún lugar en el respectivo cuadro. 5 5. Detección de Empalmes Los dos esquemas de control arriba señalados adaptan procesos de análisis de señales y de síntesis de señales para mejorar las características de funcionamiento 5 generales del sistema para codificar y decodificar señales de audio que sean sustancialmente estacionarias en momentos que sean altamente no estacionarias en otros momentos. Sin embargo, en modalidades preferidas, características adicionales pueden proporcionar mejoras adicionales para 0 codificar información de audio que sea sometida a operaciones de edición tales como empalmado. Como se explicó anteriormente, un empalme crea en general una discontinuidad en un flujo de información de audio que puede o no ser perceptible. Si se utilizan 5 procesos convencionales de análisis-síntesis, señales espurias de distorsión por bordes dentados en uno de los lados de un empalme casi ciertamente no serán canceladas. Ambos esquemas de control arriba señalados evitan este problema recuperando cuadros individuales de información de 0 audio que estén libres de señales espurias de distorsión por bordes dentados. Como resultado, los cuadros de información de audio que sean codificados y decodificados de acuerdo a cualquiera de los esquemas de control pueden ser empalmados y unidos entre sí sin preocupación por la 5 cancelación de distorsiones por bordes dentados. Asimismo, tA4¿AA.i-<-t. utilizando funciones de ventana de síntesis alternativas o modificadas para segmentos extremos dentro de los modelos de segmentos "cortos" y de "puente" arriba descritos, cualquiera de los esquemas de control puede recuperar secuencias de cuadros de segmentos que tengan perfiles de ganancia que se superpongan y agregar dentro de intervalos de superposición de cuadros de 256 muestras para obtener una ganancia de dominio de tiempo sustancialmente constante. En consecuencia, los perfiles de ganancia de cuadros en los intervalos de superposición de cuadro es correcta para pares arbitrarios de cuadros a través de un empalme . Las características hasta aquí señaladas son sustancialmente optimizadas para procesos de codificación perceptibles implementando bancos de filtros que tengan características de respuesta de frecuencia con atenuación aumentada en las bandas de bloqueo de filtros en intercambio por una pasabanda de filtro más amplia. Desafortunadamente, las ediciones de empalme tienden a generar señales espurias espectrales o "radiaciones espurias espectrales" dentro de un rango de frecuencias que no está dentro de lo que es normalmente considerado como la banda de bloque de filtro. Por lo tanto, los bancos de filtro que son implementados por las características arriba señaladas están diseñados para optimizar características de í" A¿t *i lL A. ?B>LfA i . ¿1? . Í a , - "^?s?trJ^ funcionamiento de codificación perceptible generales pero no proporciona suficiente atenuación para hacer inaudibles estas señales espurias espectrales creadas en las ediciones de empalme . Las características de funcionamiento de sistemas pueden ser mejoradas detectando la aparición de un empalme, y, en respuesta, adaptar la respuesta de frecuencia del banco de filtros de síntesis para atenuar las radiaciones espurias espectrales. Una manera en que esto se puede efectuar se describe más adelante. Información adicional se puede obtener de la patente de los Estados Unidos de América 5.903.872 Con referencia a la figura 4, el control 65 puede detectar un empalme examinando algo de la información de control o "identificador de cuadros" que se obtiene de cada cuadro recibido de la trayectoria 61. Por ejemplo, el codificador 40 puede proporcionar un identificador de cuadros aumentando un número o generando una indicación de hora y fecha para cada cuadro sucesivo y ensamblando este identificador dentro del respectivo cuadro. Cuando el control 65 detecta una discontinuidad en una secuencia de identificadores de cuadros obtenidos de un flujo de cuadros, una señal de detección de empalme es generada a lo largo de la trayectoria 66. En respuesta a la señal de detección de empalme recibida de la trayectoria 66, el ,..j, ,Á l?.&, ¿ . '¿- ini i.....««ai •-.,. decodificador 70 puede adaptar la respuesta de frecuencia de un banco de filtros de síntesis o puede seleccionar un banco de filtros alternativo que tenga la respuesta de frecuencia deseada para que procese uno o más segmentos a uno de los lados del límite entre cuadros donde se considera que aparece un empalme. En una modalidad preferida, la respuesta de frecuencia deseada para cuadros a cada lado de un empalme detectado se obtiene aplicando un proceso de ventana de empalme. Esto se puede lograr aplicando una función de ventana de empalme de cuadro a un cuadro entero de segmentos según se obtienen de los esquemas de control arriba descritos, o puede ser logrado dentro de los esquemas de control aplicando funciones de ventana de empalme de segmentos a cada segmento obtenido de la transformada de síntesis. En principio, estos dos procesos son equivalentes. Una función de ventana de empalme de segmentos para un respectivo segmento se puede obtener multiplicando la función de ventana de síntesis normal por ese respectivo segmento, lo que se muestra en la tabla IX, por una porción de una función de ventana de empalme de cuadro que esté alineada con el respectivo segmento. Las funciones de ventanas de empalme de cuadro se obtienen concatenando dos o más funciones elementales que se muestran en la tabla VI-C.
FUNCIÓN LONGITUD DE DESCRIPCIÓN ELEMENTAL FUNCIÓN £l |536(«) 1536 », v=1.0, N=1536) 1792 <fin, v=1.0, N=1792 ) ES t) 256 GP(??, a = \, ? = \6, v = 256) ,para 0 < /; < 256 GP(n,a = 3, x = 0, v = 256) ES -n) 256 réplica invertida en el tiempo de ES5(n) Funciones de Ventana Elementales Tabla VI-C Las funciones de ventana de empalme de cuadros para tres tipos de cuadros se indican en la tabla XI .
FUNCIÓN DE VENTANA TIPO DE CUADRO DE SÍNTESIS Empalme en el comienzo del cuadro Empalme en el final del cuadro Empalmes en ambos limites del cuadro Funciones de Ventana de Empalme de Cuadros Tabla XI Utilizando las funciones de ventana de empalme de cuadros arriba indicadas, el proceso de ventana de empalme cambia esencialmente las funciones de ventana de análisis- -^---¿ -¿-^-^-^ i-^ síntesis de extremo a extremo para los segmentos en el intervalo de superposición de cuadros provenientes de las funciones de ventana KBD con un valor alfa de 3 dentro de las funciones de ventana KBD con un valor alfa de 1. Este cambio disminuye el ancho de la pasabanda de filtro en intercambio por disminuir el nivel de atenuación en la banda de bloqueo, obteniéndose de este modo una frecuencia de respuesta que suprime más eficazmente radiaciones espurias espectrales audibles . 0 6. Conversión de Señales Las modalidades de codificadores y decodificadores de audio arriba señaladas pueden ser incorporadas en aplicaciones que procesen información de audio que tengan 5 esencialmente cualquier formato y frecuencia de muestras. Por ejemplo, una frecuencia de muestras de audio de 48 kHz es normalmente utilizada en equipos profesionales y una frecuencia de muestras de 44,1 kHz es normalmente utilizada en equipos de consumidor. Asimismo, las modalidades arriba 0 señaladas pueden ser incorporadas en aplicaciones que procesen información de video en formatos de cuadros y frecuencias de cuadros que se conformen a un rango amplio de normas. Preferentemente, para aplicaciones en las que la frecuencia de cuadros de video sea de aproximadamente 30 Hz 5 o menos, la información de audio es procesada de acuerdo al segundo formato arriba descrito. La implementación de dispositivos prácticos se puede simplificar convirtiendo la información de audio a una frecuencia de muestras de audio internas de modo que la 5 información de audio pueda ser codificada en una estructura común independiente de la frecuencia de muestras de audio externas o la frecuencia de cuadros de video. Con referencia a las figuras 3 y 4, el convertidor 43 es utilizado para convertir información de audio a una 0 frecuencia de muestras interna adecuada, y el convertidor 68 es utilizado para convertir la información de audio de la frecuencia de muestras interna a la frecuencia de muestras de audio externa deseada. Las conversiones son efectuadas de modo que la frecuencia de muestras de audio 5 interna sea un múltiplo entero de la frecuencia de cuadros de video. Ejemplos de frecuencias de muestras internas adecuadas para varias frecuencias de cuadros de video se muestran en la tabla XII. La conversión permite que el mismo número de muestras de audio sea codificada y llevada 0 con un cuadro de video. 5 LM A^J»^^ .-u , . aßaaaMMMdd a ?i-- uA? A • * ' ^^ NORMA Función de cuadros Muestras de Audio Frecuencia de Muestras DE VIDEO De Video (Hz) Por cua ro Internas (kHz) DTV 30 2048 53,76 NTSC 29.97 2048 53.706 PAL 25 2048 44.8 Film 24 2048 43.008 DTV 23.976+ 2048 42.96 Frecuencia de Muestras Internas Tabla XII La frecuencia de muestras internas que se muestran en la tabla para NTSC (29.97Hz) y DTV (23.976Hz) son solo aproximadas. Las frecuencias para estas dos normas de video son iguales a 53,760,000/1001 y 43,008/1001, respectivamente. Esencialmente, se puede utilizar cualquier técnica para conversión de frecuencias de muestras. Diversas consideraciones e implementaciones para la conversión de frecuencia de muestras se describen en la publicación de Adams y Kwan, "Teoría y Arquitecturas de VLSI para Convertidores de Frecuencia de Muestras Asincrónicos", J. of Audio Engr. Soc . , Julio 1993, vol. 41, N° 7/8, pag. 539- 555. Si se utiliza conversión de frecuencia de muestras, los coeficientes de filtros para HPF 101 en el detector de tUtHiuLií j.tfÁ.: .. kyMia*AÁ F ,í*?A.. j i¿m,. fi m eventos transitorios arriba descrito para el analizador 45 puede ser necesario que sea modificado para mantener una frecuencia de corte constante. El beneficio de esta característica puede ser determinado empíricamente.
D. Retardos de Procesamiento Los procesos efectuados por el codificador de bloques 50 y el decodificador de bloques 70 tienen un retardo que son producidos para recibir y regular segmentos y bloques 0 de información. Asimismo, los dos esquemas para controlar el proceso de codificación de bloques arriba descrito producen un retardo adicional que se requiere para recibir y regular los bloques de muestras de audio que son analizados por el analizador 45 para control de la longitud 5 del segmento. Cuando se utiliza el segundo formato, el primer esquema de control debe recibir y regular 1344 muestras de audio o 21 bloques de 64 muestras de información de audio antes que pueda comenzar la primera etapa S461 en el método de control de longitud de segmentos ilustrado en la figura 10. El segundo esquema de control produce un retardo un poco más bajo, necesitando recibir y regular solo 1280 muestras de audio o 20 bloques de 64 muestras de información de audio. Si el codificador 40 va a efectuar este procesamiento ?¿iÍ«Ul-¿áalUk ^ttj^^u en tiempo real, debe completar el proceso de codificación de bloques en el tiempo restante para cada cuadro después que la primera parte de ese cuadro haya sido recibida, regulada y analizada para control de la longitud de segmento. Como el primer esquema de control produce un retardo más prolongado para comenzar a analizar los bloques, requiere que el codificador 50 complete su procesamiento en menos tiempo que lo que se requiere para el segundo esquema de control . En modalidades preferidas, el retardo total de procesamiento producido por el codificador 40 es ajustado para que sea igual al intervalo comprendido entre cuadros de video adyacentes . Un componente puede ser incluido en el codificador 40 para proporcionar retardo adicional si es necesario. Si un retardo total de intervalo de un cuadro no es posible, el retardo total puede ser ajustado para que sea igual a un entero múltiple del intervalo de cuadros de video. Ambos esquemas de control imponen requerimientos de computación sustancialmente iguales en el decodificador 60. El máximo retardo que se incurre en el decodificador 60 es difícil de establecer en términos generales, debido a que depende de un número de factores, tales como el formato de cuadros codificados preciso y el número de bits que son utilizados para llevar información de audio codificada e ¿L ^^^ información de control . Cuando se utiliza el primer formato, un cuadro entero debe ser recibido y regulado antes que el método de control de segmentos pueda comenzar. Debido a que los procesos de codificación y de conversión de frecuencia de muestras de señales no pueden ser efectuados instantáneamente, un retardo de un cuadro para el codificador 40 no es posible. En este caso, un retardo total de dos cuadros es preferido. Una limitación similar se aplica al decodificador 60. 0 i ..lr ik J ? y ^ , ^^^^

Claims (41)

  1. REIVINDICACIONES 1. Un método para codificación de audio que comprende realizar los pasos de: recibir una señal de referencia que lleva alineación de cuadros de información de video en una 5 secuencia de cuadros de información de video en la que cuadros adyacentes están separados por un intervalo de cuadros; recibir una señal de audio que lleva información de audio; analizar la señal de audio para identificar características de la información de audio; generar una 0 señal de control que lleva longitudes de segmento para segmentos de la información de audio en una secuencia de segmentos superpuestos, un segmento respectivo que tiene un intervalo de superposición respectivo con un segmento adyacente y la secuencia que tiene una longitud igual al 5 intervalo de cuadro más un intervalo de superposición de cuadro, en donde las longitudes de segmentos están adaptadas en respuesta a las características de la información de audio; aplicar un proceso de codificación de bloques adaptativo a los segmentos superpuestos en la 0 secuencia para generar una pluralidad de bloques de información codificada, en donde el proceso de codificación de bloques se adapta en respuesta a la señal de control; y ensamblar la pluralidad de bloques de información codificada y la información de control que lleva las 5 longitudes de segmento para formar un cuadro de información iri? ?J ?. H&ttíí í e? codificada que está alineada con la señal de referencia.
  2. 2. Un método para codificación de audio de conformidad con lo reclamado en la reivindicación 1, caracterizado porque el proceso de codificación de bloques aplica un banco de filtros de paso de banda o una transformada a los segmentos de la información de audio para generar bloques de señales de sub-banda o coeficientes de transformada, respectivamente .
  3. 3. Un método para codificación de audio de conformidad con lo reclamado en la reivindicación 1, caracterizado porque el proceso de codificación de bloques aplica una función de ventana de análisis respectiva a cada segmento de la información de audio para generar segmentos de ventana y aplica una transformada de análisis de cancelación de distorsión por bordes dentados en el dominio del tiempo a los segmentos de ventana para generar bloques de coeficientes de transformada.
  4. 4. Un método para codificación de audio de conformidad con lo reclamado en la reivindicación 3, caracterizado porque adapta la función de ventana de análisis y la transformada de análisis de cancelación de distorsión por bordes dentados en el dominio de tiempo para generar un bloque representativo de un segmento de extremo en la secuencia de segmentos para un cuadro de información codificada respectivo que permite una aplicación de una transformada de síntesis complementaria y la función de ventana de síntesis para recuperar información de audio con substancialmente ninguna distorsión por bordes dentados en el dominio del tiempo en el intervalo de superposición del segmento de extremo en la secuencia.
  5. 5. Un método para codificación de audio de conformidad con lo reclamado en cualquiera de las reivindicaciones 1 a 4, caracterizado porque el proceso de codificación de bloques restringe las longitudes de los segmentos a ser una potencia entera de dos.
  6. 6. Un método para codificación de audio de conformidad con lo reclamado en cualquiera de las reivindicaciones 1 a 4, caracterizado porque el proceso de codificación de bloques adapta las longitudes de los segmentos entre una longitud de segmento máxima y una longitud de segmento mínima y, para un cuadro de información codificada respectivo, aplica ya sea: una secuencia larga-larga de funciones de ventana de análisis a una secuencia de segmentos que tengan longitudes iguales a la longitud de segmento máxima; una secuencia corta-corta de funciones de ventana de análisis a una secuencia de segmentos que tengan longitudes efectivas iguales a la longitud de segmento mínima; una secuencia puente-larga de funciones de ventana de análisis a una secuencia de segmentos que tengan longitudes que van desde la longitud de segmento mínima a - * -'- - - "•* la longitud de segmento máxima, en donde la secuencia puente-larga comprende una primera secuencia puente de funciones de ventana seguida por una función de ventana para un segmento que tenga una longitud igual a la longitud de segmento máxima; una secuencia larga-puente de funciones de ventana de análisis para una secuencia de segmentos que tengan longitudes que van desde la longitud de segmento máxima a la longitud de segmento mínima, en donde la secuencia larga-puente comprende una función de ventana para un segmento que tenga una longitud igual a la longitud de segmento máxima seguida por una segunda secuencia puente de funciones de ventana; o una secuencia puente-puente de funciones de ventana de análisis a una secuencia de segmentos que tengan longitudes variantes, en la que la secuencia puente-puente comprende la primera secuencia puente seguida por la segunda secuencia puente.
  7. 7. Un método para codificación de audio de conformidad con lo reclamado en la reivindicación 6, caracterizado porque todos los segmentos en la secuencia corta-corta tienen longitudes idénticas.
  8. 8. Un método para codificación de audio de conformidad con lo reclamado en la reivindicación 6, caracterizado porque todas las funciones de ventana de análisis en la secuencia corta-corta tienen porciones no cero que son idénticas en forma y longitud y una o más de las funciones de ventana de análisis tienen una porción cero.
  9. 9. Un método para codificación de audio de conformidad con lo reclamado en cualquiera de las reivindicaciones 1 a 8, caracterizado porque comprende convertir la información de audio de una frecuencia de muestras de audio de entrada a una frecuencia de muestras de audio interna antes de aplicar el proceso de codificación de bloques, en donde la señal de referencia lleva una frecuencia de cuadro de información de video y la frecuencia de muestras de audio interna es igual a un entero múltiple de la frecuencia de cuadro de la información de video.
  10. 10. Un método para decodificación de audio que comprende la realización de los pasos de: recibir una señal de referencia que lleva la alineación de cuadros de información de video en una secuencia de cuadros de información de video en la que cuadros adyacentes están separados por un intervalo de cuadros; recibir los cuadros de información codificada que están alineados con la señal de referencia y cada uno comprende la información de control y una pluralidad de bloques de información de audio codificada; generar una señal de control que lleva longitudes de segmento para segmentos de información de audio en una secuencia de segmentos superpuestos, un segmento respectivo que tiene un intervalo de superposición respectivo con un segmento adyacente y teniendo la secuencia una longitud igual al intervalo de cuadro más un intervalo de superposición de cuadro, en donde las longitudes de los segmentos están adaptadas en respuesta a la información de control; aplicar un proceso de decodificación de bloque adaptativo a la pluralidad de bloques de información de audio codificada en un cuadro de información codificado respectivo, en donde el proceso de decodificación de bloques se adapta en respuesta a la señal de control para generar la secuencia de segmentos superpuestos de información de audio.
  11. 11. Un método para decodificación de audio de conformidad con lo reclamado en la reivindicación 10, caracterizado porque el proceso de decodificación de bloques aplica un banco de filtros de paso de banda o una transformada de síntesis a la pluralidad de bloques de información codificada para generar los segmentos superpuestos de información de audio.
  12. 12. Un método para decodificación de audio de conformidad con lo reclamado en la reivindicación 10, caracterizado porque el proceso de decodificación de bloques aplica una transformada de síntesis de cancelación de distorsión por bordes dentados en el dominio del tiempo a la pluralidad de bloques de información codificada y aplica la función de ventana de síntesis respectiva a los resultados de la transformada de síntesis para generar los .1- segmentos superpuestos de información de audio.
  13. 13. Un método para decodificación de audio de conformidad con lo reclamado en la reivindicación 12, caracterizado porque adapta la transformada de síntesis de cancelación de distorsión por bordes dentados en el dominio de tiempo y aplica una función de ventana de síntesis a los resultados de la transformada para recuperar un segmento de extremo en la secuencia para la información de cuadro de información codificada respectivo con substancialmente ninguna distorsión por bordes dentados en el dominio del tiempo en el intervalo de superposición del segmento de extremo en la secuencia.
  14. 14. Un método para decodificación de audio de conformidad con lo reclamado en cualquiera de las reivindicaciones 10 a 13, caracterizado porque el proceso de decodificación de bloques se restringe para generar segmentos que tengan longitudes que son una potencia entera de dos .
  15. 15. Un método para decodificación de audio de conformidad con lo reclamado en cualquiera de las reivindicaciones 10 a 13, caracterizado porque el proceso de decodificación de bloques decodifica bloques que representan segmentos de información de audio que tienen diferentes longitudes entre una longitud de segmento máxima y una longitud de segmento mínima y, para un cuadro de información codificada respectivo, aplica ya sea: una secuencia larga-larga de funciones de ventana de síntesis a una secuencia de segmentos que tengan longitudes iguales a la longitud de segmento máxima; una secuencia corta-corta 5 de funciones de ventana de síntesis a una secuencia de segmentos que tengan longitudes efectivas iguales a la longitud de segmento mínima; una secuencia puente-larga de funciones de ventana de síntesis a una secuencia de segmentos que tengan longitudes que van desde la longitud 0 de segmento mínima a la longitud de segmento máxima, en donde la secuencia de puente-larga comprende una primera secuencia puente de funciones de ventana seguida por una función de ventana para un segmento que tiene una longitud igual a la longitud de segmento máxima; una secuencia 5 larga-puente de funciones de ventana de síntesis a una secuencia de segmentos que tengan longitudes que van desde la longitud de segmento máxima a la longitud de segmento mínima, en donde la secuencia larga-puente comprende una función de ventana para un segmento que tiene una longitud 0 igual a la longitud de segmento máxima seguida por una segunda secuencia puente de funciones de ventana; o una secuencia puente-puente de funciones de ventana de síntesis a una secuencia de segmentos que tengan longitudes variantes, en la que la secuencia puente-puente comprende 5 la primera secuencia puente seguida por la segunda fii d.d ., i . f.r. Fi. secuencia puente.
  16. 16. Un método para decodificación de audio de conformidad con lo reclamado en la reivindicación 15, caracterizado porque todos los segmentos generados desde la 5 secuencia corta-corta tienen longitudes idénticas.
  17. 17. Un método para decodificación de audio de conformidad con lo reclamado en la reivindicación 15, caracterizado porque todas las funciones de ventana de síntesis en la secuencia corta-corta tienen porciones no 10 cero que son idénticas en forma y longitud y una o más de las funciones de ventana de análisis tienen una porción cero.
  18. 18. Un método para decodificación de audio de conformidad con lo reclamado en cualquiera de las 15 reivindicaciones 10 a 17, caracterizado porque analiza la información de control obtenida desde dos cuadros de información codificada para detectar una discontinuidad y, en respuesta, adapta las características de respuesta de frecuencia del proceso de decodificación de bloques en la 0 recuperación del primer y último segmentos de la información de audio en una secuencia respectiva de los segmentos para cualquiera de los dos cuadros de información codificada.
  19. 19. Un medio de almacenamiento de información 5 caracterizado porque lleva: información de video conformada tffaa.AA +FÍ..A.F. ^^^^A en cuadros de video; e información de audio codificada conformada en cuadros de información codificada, en donde un cuadro de información codificada respectivo corresponde a un cuadro de video respectivo e incluye información de 5 control que lleva longitudes de segmento variables para segmentos de información de audio en una secuencia de segmentos superpuestos, un segmento respectivo que tiene un intervalo de superposición respecto a un segmento adyacente y la secuencia tiene una longitud igual al intervalo de 0 cuadro más un intervalo de superposición de cuadro, y bloques de información de audio codificada, un bloque respectivo que tiene una longitud respectiva y contenido respectivo que, cuando se procesan mediante un proceso de decodificación de bloques adaptativo, resulta en un 5 segmento de información de audio respectivo en la secuencia de segmentos superpuestos.
  20. 20. Un medio de almacenamiento de información de conformidad con lo reclamado en la reivindicación 19 caracterizado porque el bloque respectivo de información 0 codificada tiene un contenido respectivo que resulta en el segmento de información de audio respectivo cuando se procesa mediante un proceso de decodificación adaptativo que incluye aplicar una transformada de síntesis de cancelación de distorsión por bordes dentados en el dominio del tiempo y aplica una función de ventana de síntesis. *£* *¿ áí Jfcj.?fc,:S,a.-fc«_»,£ j, x &Í j.
  21. 21. Un medio de almacenamiento de información de conformidad con lo reclamado en la reivindicación 20 caracterizado porque el proceso de decodificación de bloques adaptativo adapta la transformada de síntesis de 5 cancelación de distorsión por bordes dentados en el dominio del tiempo y adapta la función de ventana de síntesis para generar la secuencia de segmentos superpuestos de información de audio que independientemente no tienen substancialmente ninguna distorsión por bordes dentados en 0 el dominio del tiempo.
  22. 22. Un medio de almacenamiento de información de conformidad con lo reclamado en cualquiera de las reivindicaciones 19 a 21 caracterizado porque todos los bloques de información de audio codificada representan 5 segmentos de información de audio que tienen longitudes respectivas que son una potencia entera de dos.
  23. 23. Un medio de almacenamiento de información de conformidad con lo reclamado en cualquiera de las reivindicaciones 19 a 22 caracterizado porque la 0 información de control incluye una indicación de orden del cuadro de información codificada respectivo en una secuencia de cuadros de información codificada.
  24. 24. Un aparato para codificación de audio caracterizado porque comprende: medios para recibir una 5 señal de referencia que lleva la alineación de cuadros de información de video en una secuencia de cuadros de información de video en la que cuadros adyacentes están separados por un intervalo de cuadros; medios para recibir una señal de audio que lleva información de audio; medios 5 para analizar la señal de audio para identificar características de la información de audio; medios para generar una señal de control que lleva longitudes de segmento para segmentos de la información de audio en una secuencia de segmentos superpuestos, un segmento respectivo 0 que tiene un intervalo de superposición respectivo con un segmento adyacente y teniendo la secuencia una longitud igual al intervalo de cuadro más un intervalo de superposición de cuadro, en donde las longitudes de segmentos están adaptadas en respuesta a las 5 características de la información de audio; medios para aplicar un proceso de codificación de bloque adaptativo a los segmentos superpuestos en la secuencia para generar una pluralidad de bloques de información codificada, en donde el proceso de codificación de bloques se adapta en 0 respuesta a la señal de control; y medios para ensamblar la pluralidad de bloques de información codificada y la información de control que lleva las longitudes de segmento para formar un cuadro de información codificada que se alinea con la señal de referencia.
  25. 25. Un aparato para la codificación de audio de »1 i a conformidad con lo reclamado en la reivindicación 24 caracterizado porque el proceso de codificación de bloques aplica un banco de filtros de paso de banda o una transformada a los segmentos de la información de audio para generar bloques de señales de sub-banda o coeficientes de transformada, respectivamente.
  26. 26. Un aparato para la codificación de audio de conformidad con lo reclamado en la reivindicación 24 caracterizado porque el proceso de codificación de bloques aplica una función de ventana de análisis respectiva a cada segmento de la información de audio para generar segmentos de ventana y aplica una transformada de análisis de cancelación de distorsión por bordes dentados en el dominio del tiempo a los segmentos de ventana para generar bloques de coeficientes de transformada.
  27. 27. Un aparato para codificación de audio de conformidad con lo reclamado en la reivindicación 26, caracterizado porque comprende un medio para adaptar la función de ventana de análisis y la transformada de análisis de cancelación de distorsión por bordes dentados en el dominio del tiempo para generar un bloque que representa un segmento de extremo en la secuencia de segmentos para un cuadro de información codificada respectivo que permite una aplicación de una transformada de síntesis complementaria y la función de ventana de síntesis para recuperar información de audio con substancialmente ninguna distorsión por bordes dentados en el dominio del tiempo en el intervalo de superposición del segmento de extremo en la secuencia. 5
  28. 28. Un aparato para codificación de audio de conformidad con lo reclamado en cualquiera de las reivindicaciones 24 a 27, caracterizado porque el proceso de codificación de bloques restringe las longitudes de segmentos a ser una potencia entera de dos . 0
  29. 29. Un aparato para codificación de audio de conformidad con lo reclamado en cualquiera de las reivindicaciones 24 a 27, caracterizado porque el proceso de codificación de bloques adapta las longitudes de segmentos entre una longitud de segmento máxima y una 5 longitud de segmento mínima y, para un cuadro de información codificada respectivo, aplica ya sea: una secuencia larga-larga de funciones de ventana de análisis a una secuencia de segmentos que tengan longitudes iguales a la longitud de segmento máxima; una secuencia corta-corta 0 de funciones de ventana de análisis a una secuencia de segmentos que tengan longitudes efectivas iguales a la longitud de segmento mínima; una secuencia puente-larga de funciones de ventana de análisis a una secuencia de segmentos que tengan longitudes que van desde la longitud 5 de segmento mínima a la longitud de segmento máxima, en donde la secuencia puente-larga comprende una primera secuencia puente de funciones de ventana seguida por una función de ventana para un segmento que tiene una longitud igual a la longitud de segmento máxima; una secuencia larga-puente de funciones de ventana de análisis para una secuencia de segmentos que tienen longitudes que van desde la longitud de segmento máxima a la longitud de segmento mínima, en donde la secuencia larga-puente comprende una función de ventana para un segmento que tiene una longitud igual a la longitud de segmento máxima seguida por una segunda secuencia puente de funciones de ventana; o una secuencia puente-puente de funciones de ventana de análisis a una secuencia de segmentos que tengan longitudes variantes, en la que la secuencia puente-puente comprende la primera secuencia puente seguida por la segunda secuencia puente.
  30. 30. Un aparato para codificación de audio de conformidad con lo reclamado en la reivindicación 29, caracterizado porque todos los segmentos en la secuencia corta-corta tienen longitudes idénticas.
  31. 31. Un aparato para codificación de audio de conformidad con lo reclamado en la reivindicación 29, caracterizado porque todas las funciones de ventana de análisis en la secuencia corta-corta tienen porciones no cero que son idénticas en forma y longitud y una o más de i l^^^¿ ^ -«••--• ü las funciones de ventana de análisis tienen una porción cero.
  32. 32. Un aparato para codificación de audio de conformidad con lo reclamado en cualquiera de las reivindicaciones 24 a 31, caracterizado porque comprende un medio para convertir la información de audio de una frecuencia de muestras de audio de entrada a una frecuencia de muestras de audio interna antes de aplicar el proceso de codificación de bloques, en donde la señal de referencia lleva una frecuencia de cuadro de información de video y la frecuencia de muestras de audio interna es igual a un entero múltiple de la frecuencia de cuadro de información de video.
  33. 33. Un aparato para decodificación de audio que comprende la realización de los pasos de: medios para recibir una señal de referencia que lleva la alineación de cuadros de información de video en una secuencia de cuadros de información de video en la que cuadros adyacentes están separados por un intervalo de cuadros; medios para recibir cuadros de información codificada que están alineados con la señal de referencia y cada uno comprende la información de control y una pluralidad de bloques de información de audio codificada; medios para generar una señal de control que lleva longitudes de segmento para segmentos de la información de audio en una secuencia de segmentos superpuestos, un segmento respectivo que tiene un intervalo de superposición respectivo con un segmento adyacente y la secuencia que tiene una longitud igual al intervalo de cuadro más un intervalo de superposición de cuadro, en 5 donde las longitudes de segmentos están adaptadas en respuesta a la información de control; medios para aplicar un proceso de decodificación de bloque adaptativo a la pluralidad de bloques de información de audio codificada en un cuadro de información codificado respectivo, en donde el 0 proceso de decodificación de bloques se adapta en respuesta a la señal de control para generar la secuencia de segmentos superpuestos de información de audio.
  34. 34. Un aparato para decodificación de audio de conformidad con lo reclamado en la reivindicación 33, 5 caracterizado porque el proceso de decodificación de bloques aplica un banco de filtros de paso de banda o una transformada de síntesis a la pluralidad de bloques de información codificada para generar los segmentos superpuestos de información de audio, 0
  35. 35. Un aparato para decodificación de audio de conformidad con lo reclamado en la reivindicación 33, caracterizado porque el proceso de decodificación de bloques aplica una transformada de síntesis de cancelación de distorsión por bordes dentados en el dominio del tiempo 5 a la pluralidad de bloques de información codificada y aplica la función de ventana de síntesis respectiva a los resultados de la transformada de síntesis para generar los segmentos superpuestos de información de audio.
  36. 36. Un aparato para decodificación de audio de conformidad con lo reclamado en la reivindicación 35, caracterizado porque comprende medios para adaptar la transformada de síntesis de cancelación de distorsión por bordes dentados en el dominio del tiempo y aplica una función de ventana de síntesis a los resultados de la transformada para recuperar un segmento de extremo en la secuencia para el cuadro de información codificada respectivo con substancialmente ninguna distorsión por bordes dentados en el dominio del tiempo en el intervalo de superposición del segmento de extremo en la secuencia.
  37. 37. Un aparato para decodificación de audio de conformidad con lo reclamado en cualquiera de las reivindicaciones 33 a 36, caracterizado porque el proceso de decodificación de bloques se restringe para generar segmentos que tengan longitudes que son una potencia entera de dos .
  38. 38. Un aparato para decodificación de audio de conformidad con lo reclamado en cualquiera de las reivindicaciones 33 a 36, caracterizado porque el proceso de decodificación de bloques decodifica bloques que representan segmentos de información de audio que tienen .JS^ * ÍFA*. . 3 Ff sX i . . .l.>-t! »-<ÍH,.^-.„-.^ longitudes diferentes entre una longitud de segmento máxima y una longitud de segmento mínima y, para un cuadro de información codificada respectivo, aplica ya sea: una secuencia larga-larga de funciones de ventana de síntesis a 5 una secuencia de segmentos que tengan longitudes iguales a la longitud de segmento máxima; una secuencia corta-corta de funciones de ventana de síntesis a una secuencia de segmentos que tengan longitudes efectivas iguales a la longitud de segmento mínima; una secuencia puente-larga de 0 funciones de ventana de síntesis a una secuencia de segmentos que tengan longitudes que van desde la longitud de segmento mínima a la longitud de segmento máxima, en donde la secuencia puente-larga comprende una primera secuencia de puente de funciones de ventana seguida por una 5 función de ventana para un segmento que tiene una longitud igual a la longitud de segmento máxima; una secuencia larga-puente de funciones de ventana de síntesis a una secuencia de segmentos que tengan longitudes que van desde la longitud de segmento máxima a la longitud de segmento 0 mínima, en donde la secuencia larga-puente comprende una función de ventana para un segmento que tiene una longitud igual a la longitud de segmento máxima seguida por una segunda secuencia de puente de funciones de ventana; o una secuencia puente-puente de funciones de ventana de síntesis 5 a una secuencia de segmentos que tengan longitudes variantes, en la que la secuencia puente-puente comprende la primera secuencia de puente seguida por la segunda secuencia de puente.
  39. 39. Un aparato para decodificación de audio de conformidad con lo reclamado en la reivindicación 38, caracterizado porque todos los segmentos generados desde la secuencia corta-corta tienen longitudes idénticas.
  40. 40. Un aparato para decodificación de audio de conformidad con lo reclamado en la reivindicación 38, caracterizado porque todas las funciones de ventana de síntesis en la secuencia corta-corta tienen porciones no cero que son idénticas en forma y longitud y una o más de las funciones de ventana de análisis tienen una porción cero.
  41. 41. Un aparato para decodificación de audio de conformidad con lo reclamado en cualquiera de las reivindicaciones 33 a 40, caracterizado porque comprende un medio para analizar la información de control obtenida desde dos cuadros de información codificada para detectar una discontinuidad y, en respuesta, adaptar características de respuesta de frecuencia del proceso de decodificación de bloques en la recuperación del primer y último segmentos de información de audio en una secuencia respectiva de segmentos para cualquiera de los dos cuadros de información codificada.
MXPA01007547A 1999-01-28 2000-01-20 Encuadramiento de datos para sistema de codificacion de longitud de bloques adaptativo. MXPA01007547A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/239,345 US6226608B1 (en) 1999-01-28 1999-01-28 Data framing for adaptive-block-length coding system
PCT/US2000/001424 WO2000045389A1 (en) 1999-01-28 2000-01-20 Data framing for adaptive-block-length coding system

Publications (1)

Publication Number Publication Date
MXPA01007547A true MXPA01007547A (es) 2002-07-02

Family

ID=22901762

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA01007547A MXPA01007547A (es) 1999-01-28 2000-01-20 Encuadramiento de datos para sistema de codificacion de longitud de bloques adaptativo.

Country Status (18)

Country Link
US (1) US6226608B1 (es)
EP (1) EP1151435B1 (es)
JP (1) JP4540232B2 (es)
KR (1) KR100702058B1 (es)
CN (1) CN1255809C (es)
AR (1) AR022335A1 (es)
AT (1) ATE223612T1 (es)
AU (1) AU771332B2 (es)
BR (1) BR0007775A (es)
CA (1) CA2354396C (es)
DE (1) DE60000412T2 (es)
DK (1) DK1151435T3 (es)
ES (1) ES2179018T3 (es)
HK (1) HK1043429B (es)
MX (1) MXPA01007547A (es)
MY (1) MY128069A (es)
TW (1) TW519629B (es)
WO (1) WO2000045389A1 (es)

Families Citing this family (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
DE50001985D1 (de) * 1999-06-25 2003-06-05 Infineon Technologies Ag Programmierbares digitales bandpass-filter für eine kodec-schaltung
US6687663B1 (en) * 1999-06-25 2004-02-03 Lake Technology Limited Audio processing method and apparatus
US7283965B1 (en) * 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
EP1076297A1 (en) * 1999-08-09 2001-02-14 Deutsche Thomson-Brandt Gmbh Method for fast Fourier transformation of audio signals
US6748363B1 (en) * 2000-06-28 2004-06-08 Texas Instruments Incorporated TI window compression/expansion method
JP2002050996A (ja) * 2000-07-31 2002-02-15 Sony Corp 整数倍相互関係を有するブロック長を用いて符号化された信号を通信伝送路を介して送信する通信システム
JP2005506643A (ja) * 2000-12-22 2005-03-03 ミュビー テクノロジーズ ピーティーイー エルティーディー メディアプロダクションシステムとその方法
US7450693B2 (en) * 2001-03-07 2008-11-11 T-Mobile Deutschland Gmbh Method and device for improving voice quality on transparent telecommunication-transmission paths
US6650762B2 (en) * 2001-05-31 2003-11-18 Southern Methodist University Types-based, lossy data embedding
DE10138650A1 (de) * 2001-08-07 2003-02-27 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschlüsseln eines diskreten Signals sowie Verfahren und Vorrichtung zur Entschlüsselung
JP3779580B2 (ja) * 2001-09-27 2006-05-31 株式会社東芝 信号処理方法及び装置、信号再生方法及び装置、記録媒体
US7840412B2 (en) * 2002-01-18 2010-11-23 Koninklijke Philips Electronics N.V. Audio coding
US7328151B2 (en) 2002-03-22 2008-02-05 Sound Id Audio decoder with dynamic adjustment of signal modification
US20030233230A1 (en) * 2002-06-12 2003-12-18 Lucent Technologies Inc. System and method for representing and resolving ambiguity in spoken dialogue systems
US7426470B2 (en) * 2002-10-03 2008-09-16 Ntt Docomo, Inc. Energy-based nonuniform time-scale modification of audio signals
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
US7389226B2 (en) * 2002-10-29 2008-06-17 Ntt Docomo, Inc. Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard
US7508846B2 (en) * 2002-11-22 2009-03-24 Nortel Networks Ltd. Physical capacity aggregation system and method
US7512534B2 (en) * 2002-12-17 2009-03-31 Ntt Docomo, Inc. Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard
US7383497B2 (en) * 2003-01-21 2008-06-03 Microsoft Corporation Random access editing of media
US7117453B2 (en) * 2003-01-21 2006-10-03 Microsoft Corporation Media frame object visualization system
US7509321B2 (en) * 2003-01-21 2009-03-24 Microsoft Corporation Selection bins for browsing, annotating, sorting, clustering, and filtering media objects
US7904797B2 (en) * 2003-01-21 2011-03-08 Microsoft Corporation Rapid media group annotation
US6973538B2 (en) * 2003-04-02 2005-12-06 Motorola, Inc. Adaptive segmentation of shared cache
KR100546398B1 (ko) * 2003-11-25 2006-01-26 삼성전자주식회사 압축된 오디오 비트스트림에서 싱크 워드를 찾는 방법 및상기 방법을 기록한 기록 매체
DK1741093T3 (da) * 2004-03-25 2011-09-12 Dts Inc Skalérbar, tabsfri audio-codec og authoringsværktøj
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
US7512536B2 (en) * 2004-05-14 2009-03-31 Texas Instruments Incorporated Efficient filter bank computation for audio coding
TWI253059B (en) * 2004-08-04 2006-04-11 Via Tech Inc Sound fast-forward method and device
KR20070074546A (ko) * 2004-08-31 2007-07-12 코닌클리케 필립스 일렉트로닉스 엔.브이. 트랜스코딩을 위한 방법 및 디바이스
US8744862B2 (en) * 2006-08-18 2014-06-03 Digital Rise Technology Co., Ltd. Window selection based on transient detection and location to provide variable time resolution in processing frame-based data
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
US7937271B2 (en) * 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
KR100668319B1 (ko) * 2004-12-07 2007-01-12 삼성전자주식회사 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
US7418394B2 (en) * 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
RU2351024C2 (ru) * 2005-04-28 2009-03-27 Сименс Акциенгезелльшафт Способ и устройство для подавления шумов
JP4639966B2 (ja) * 2005-05-31 2011-02-23 ヤマハ株式会社 オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路
US7830921B2 (en) * 2005-07-11 2010-11-09 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
CN101223821B (zh) * 2005-07-15 2011-12-07 松下电器产业株式会社 音频解码器
US20070081663A1 (en) * 2005-10-12 2007-04-12 Atsuhiro Sakurai Time scale modification of audio based on power-complementary IIR filter decomposition
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
KR100735417B1 (ko) * 2006-01-24 2007-07-04 삼성전자주식회사 음성 신호에서의 피크 특징 추출이 가능한 윈도우를정렬하는 방법 및 그 시스템
US20100211690A1 (en) * 2009-02-13 2010-08-19 Digital Fountain, Inc. Block partitioning for a data stream
US20090287479A1 (en) * 2006-06-29 2009-11-19 Nxp B.V. Sound frame length adaptation
EP2040252A4 (en) * 2006-07-07 2013-01-09 Nec Corp AUDIO CODING DEVICE, AUDIO CODING METHOD, AND PROGRAM THEREOF
US7672842B2 (en) * 2006-07-26 2010-03-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for FFT-based companding for automatic speech recognition
CN100489965C (zh) * 2006-08-18 2009-05-20 广州广晟数码技术有限公司 音频编码系统
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
USRE50158E1 (en) 2006-10-25 2024-10-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
JP5083779B2 (ja) 2006-10-25 2012-11-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ副帯値を生成する装置及び方法、並びに、時間領域オーディオサンプルを生成する装置及び方法
KR20080053739A (ko) * 2006-12-11 2008-06-16 삼성전자주식회사 적응적으로 윈도우 크기를 적용하는 부호화 장치 및 방법
PL2052548T3 (pl) * 2006-12-12 2012-08-31 Fraunhofer Ges Forschung Koder, dekoder oraz sposoby kodowania i dekodowania segmentów danych reprezentujących strumień danych w dziedzinie czasu
CN101231850B (zh) * 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
US8630863B2 (en) * 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
US7852197B2 (en) * 2007-06-08 2010-12-14 Sensomatic Electronics, LLC System and method for inhibiting detection of deactivated labels using detection filters having an adaptive threshold
MY167933A (en) * 2007-06-18 2018-10-04 Panasonic Ip Corp America Sequence allocating method, transmitting method and wireless mobile station device
CN101790756B (zh) 2007-08-27 2012-09-05 爱立信电话股份有限公司 瞬态检测器以及用于支持音频信号的编码的方法
BRPI0816136B1 (pt) * 2007-08-27 2020-03-03 Telefonaktiebolaget Lm Ericsson (Publ) Método e dispositivo para processamento de sinal
US8369972B2 (en) 2007-11-12 2013-02-05 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8457951B2 (en) * 2008-01-29 2013-06-04 The Nielsen Company (Us), Llc Methods and apparatus for performing variable black length watermarking of media
US20090287489A1 (en) * 2008-05-15 2009-11-19 Palm, Inc. Speech processing for plurality of users
US8630848B2 (en) 2008-05-30 2014-01-14 Digital Rise Technology Co., Ltd. Audio signal transient detection
WO2010003532A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
BRPI0910512B1 (pt) * 2008-07-11 2020-10-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. codificador e decodificador de áudio para codificar e decodificar amostras de áudio
EP4224472B1 (en) * 2008-07-11 2024-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder
JP5245622B2 (ja) * 2008-07-31 2013-07-24 富士通株式会社 ノイズ検出装置及びノイズ検出方法
US8108887B2 (en) 2008-10-30 2012-01-31 The Nielsen Company (Us), Llc Methods and apparatus for identifying media content using temporal signal characteristics
CN101751926B (zh) * 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
JP5163545B2 (ja) * 2009-03-05 2013-03-13 富士通株式会社 オーディオ復号装置及びオーディオ復号方法
JP2010232861A (ja) * 2009-03-26 2010-10-14 Sony Corp 情報処理装置、音声信号処理方法、およびプログラム
TWI556227B (zh) 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
JP5365363B2 (ja) * 2009-06-23 2013-12-11 ソニー株式会社 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム
US8909531B2 (en) * 2009-10-02 2014-12-09 Mediatek Inc. Methods and devices for displaying multimedia data emulating emotions based on image shuttering speed
CN101694773B (zh) * 2009-10-29 2011-06-22 北京理工大学 一种基于tda域的自适应窗切换方法
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
SG184230A1 (en) * 2010-03-26 2012-11-29 Agency Science Tech & Res Methods and devices for providing an encoded digital signal
EP2619758B1 (en) * 2010-10-15 2015-08-19 Huawei Technologies Co., Ltd. Audio signal transformer and inverse transformer, methods for audio signal analysis and synthesis
US9197888B2 (en) 2012-03-13 2015-11-24 Dolby Laboratories Licensing Corporation Overlapped rate control for video splicing applications
US8725508B2 (en) * 2012-03-27 2014-05-13 Novospeech Method and apparatus for element identification in a signal
US9489962B2 (en) * 2012-05-11 2016-11-08 Panasonic Corporation Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method
WO2014046916A1 (en) 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
TWI557727B (zh) * 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
PL3028275T3 (pl) * 2013-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób przetwarzania sygnału audio z użyciem kombinacji w zakresie nakładania
ES2690577T3 (es) * 2014-05-08 2018-11-21 Telefonaktiebolaget Lm Ericsson (Publ) Discriminador y codificador de señales de audio
EP3107096A1 (en) * 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
WO2017080835A1 (en) * 2015-11-10 2017-05-18 Dolby International Ab Signal-dependent companding system and method to reduce quantization noise
CN110892478A (zh) 2017-04-28 2020-03-17 Dts公司 音频编解码器窗口和变换实现
CN112567751A (zh) * 2018-09-26 2021-03-26 华为技术有限公司 一种3d图形数据压缩和解压缩的方法及装置
CN111179970B (zh) * 2019-08-02 2023-10-20 腾讯科技(深圳)有限公司 音视频处理方法、合成方法、装置、电子设备及存储介质
EP4229633A1 (en) * 2020-10-16 2023-08-23 Dolby Laboratories Licensing Corporation Adaptive block switching with deep neural networks

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5222189A (en) 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
CA2026207C (en) * 1989-01-27 1995-04-11 Louis Dunn Fielder Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5479562A (en) * 1989-01-27 1995-12-26 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding audio information
DE3902948A1 (de) 1989-02-01 1990-08-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5369724A (en) * 1992-01-17 1994-11-29 Massachusetts Institute Of Technology Method and apparatus for encoding, decoding and compression of audio-type data using reference coefficients located within a band of coefficients
US5933567A (en) * 1993-01-13 1999-08-03 Hitachi America, Ltd. Method and apparatus for controlling the position of the heads of a digital video tape recorder during trick play operation and for recording digital data on a tape
US6137834A (en) 1996-05-29 2000-10-24 Sarnoff Corporation Method and apparatus for splicing compressed information streams
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US6124895A (en) * 1997-10-17 2000-09-26 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment
US5913190A (en) 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by audio sample rate conversion

Also Published As

Publication number Publication date
HK1043429B (zh) 2006-10-06
DE60000412T2 (de) 2003-08-07
BR0007775A (pt) 2002-02-05
ES2179018T3 (es) 2003-01-16
AU771332B2 (en) 2004-03-18
CN1255809C (zh) 2006-05-10
CA2354396A1 (en) 2000-08-03
HK1043429A1 (en) 2002-09-13
EP1151435B1 (en) 2002-09-04
CN1338104A (zh) 2002-02-27
JP2002536681A (ja) 2002-10-29
KR20010101749A (ko) 2001-11-14
EP1151435A1 (en) 2001-11-07
KR100702058B1 (ko) 2007-03-30
WO2000045389A1 (en) 2000-08-03
US6226608B1 (en) 2001-05-01
AU2621500A (en) 2000-08-18
AR022335A1 (es) 2002-09-04
JP4540232B2 (ja) 2010-09-08
MY128069A (en) 2007-01-31
TW519629B (en) 2003-02-01
ATE223612T1 (de) 2002-09-15
CA2354396C (en) 2008-10-21
DK1151435T3 (da) 2002-10-14
DE60000412D1 (de) 2002-10-10

Similar Documents

Publication Publication Date Title
MXPA01007547A (es) Encuadramiento de datos para sistema de codificacion de longitud de bloques adaptativo.
KR101822032B1 (ko) 인코딩된 오디오 신호를 디코딩하기 위한 장치, 방법 및 컴퓨터 프로그램
EP1023728B1 (en) Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment
JP4126680B2 (ja) エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化
JP4229586B2 (ja) エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化
JP4126682B2 (ja) エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化
JP2001521259A (ja) エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化
JP2001521347A5 (es)
JP2001521308A5 (es)
JP2001521310A5 (es)

Legal Events

Date Code Title Description
FG Grant or registration