[go: up one dir, main page]

ES2995244T3 - Low cost adaptation of bass post-filter - Google Patents

Low cost adaptation of bass post-filter Download PDF

Info

Publication number
ES2995244T3
ES2995244T3 ES21721487T ES21721487T ES2995244T3 ES 2995244 T3 ES2995244 T3 ES 2995244T3 ES 21721487 T ES21721487 T ES 21721487T ES 21721487 T ES21721487 T ES 21721487T ES 2995244 T3 ES2995244 T3 ES 2995244T3
Authority
ES
Spain
Prior art keywords
signal
energy
post
primary signal
decision variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES21721487T
Other languages
English (en)
Inventor
Ashour Chamran Moradi
Erik Norvell
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of ES2995244T3 publication Critical patent/ES2995244T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Un método y un decodificador para la decodificación de audio, donde una señal primaria codificada se decodifica para formar una señal primaria decodificada, seguido de un postfiltrado de la señal primaria decodificada para formar una señal postfiltrada, donde una señal de salida del decodificador es una de la señal primaria decodificada y la señal postfiltrada. Se obtienen una estimación de energía de al menos una parte de un espectro de frecuencia de la señal primaria que se reconstruye por el decodificador y un análisis de discontinuidades en el dominio del tiempo que es causado por el postfiltrado de la señal primaria decodificada. Se genera una variable de decisión basada en la estimación de energía y el análisis de discontinuidades obtenidos. La variable de decisión se compara con un umbral y la señal de salida se establece para que sea la señal primaria decodificada o la señal postfiltrada basándose en la comparación de la variable de decisión con el umbral. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Adaptación de bajo coste de postfiltro de bajos
Campo técnico
La presente descripción se refiere en general a las comunicaciones y más particularmente a métodos y aparatos para codificación y decodificación de audio mono, estéreo o multicanal.
Antecedentes
Aunque la capacidad de las redes de telecomunicaciones aumenta continuamente, sigue siendo de gran interés limitar el ancho de banda requerido por canal de comunicación. En redes móviles, anchos de banda de transmisión más pequeños para cada llamada producen un menor consumo de potencia tanto en el dispositivo móvil como en la estación base. Esto se traduce en ahorro de energía y costes para el operador móvil, mientras que el usuario final experimentará una mayor duración de la batería y un mayor tiempo de conversación. Además, con un menor consumo de ancho de banda por usuario, la red móvil puede dar servicio a un mayor número de usuarios en paralelo.
En el campo de la codificación de voz, el algoritmo ACELP (predicción lineal excitada por código algebraico) ha sido la tecnología líder en la entrega de sonido de alta calidad a bajas tasas de bits. En resumen, el modelo ACELP se compone de un filtro predictor lineal (LP), que modela el tracto vocal y proporciona la forma espectral aproximada de la voz reconstruida. El filtro LP está controlado por dos libros de códigos: un libro de códigos de frecuencias fundamentales (o libro de códigos adaptativo) que modela el componente periódico de la voz y un libro de códigos de innovación (o libro de códigos fijo) que genera los segmentos de voz no periódicos y también construye el libro de códigos de frecuencias fundamentales. El algoritmo central del algoritmo ACELP se ha mejorado aún más, incluyendo herramientas de postprocesamiento tales como los postfiltros. Los dos filtros principales son el postfiltro de formantes y el postfiltro de frecuencia fundamental, que utilizan ambos parámetros que forman parte del modelo de voz de ACELP. El postfiltro de formantes mejora la forma espectral aproximada utilizando el filtro predictor lineal (LP), y el postfiltro de frecuencia fundamental reduce la distorsión interarmónica enfatizando el período de frecuencia fundamental. Una variante del postfiltro de frecuencia fundamental, dirigida al rango de frecuencias bajas, es el postfiltro de bajos (BPF). Esta herramienta está presente en estándares recientes de códecs de voz, tales como ITU-T G.718 y 3GPP EVS, como se ilustra en 3GPP TS 26.445 V16.0.0, Códec para servicios de voz mejorados (EVS); Descripción algorítmica detallada, 6.1.4.2 Postfiltro de bajos [1].
Aunque el postfiltro de bajos generalmente mejora la calidad del audio decodificado, puede tener un impacto negativo en algunas señales. Se han utilizado varios métodos de adaptación para controlar la fuerza del postfiltro. En 3GPP EVS [1], la fuerza del postfiltro se adapta a lo bien que la señal postfiltrada se correlaciona con la señal de entrada. Una baja correlación sugiere que el filtro puede tener un impacto degradante y, como resultado, la salida del filtro se atenúa. La fuerza del postfiltro también se adapta a la estabilidad del filtro LP, donde una baja estabilidad conduce a un filtro atenuado.
El documento US 9.224.403 describe métodos de adaptación adicionales del postfiltro de bajos. Aquí, el documento US 9.224.403 ha tenido en cuenta que el códec puede utilizar múltiples modos, donde el algoritmo CELP o ACELP es uno de estos modos. Dado que el postfiltro de bajos solo está activo para el modo ACELP, la fuerza del postfiltro de bajos se puede adaptar para evitar artefactos al habilitar y deshabilitar el filtro en los casos donde haya cambios de modo frecuentes. La patente estadounidense 9.224.403 considera además lo bien que la señal de entrada está representada por el modelo de codificación ACELP o CELP. Si hay una pérdida de energía significativa, es probable que la señal no esté bien modelada y el postfiltro de bajos pueda resultar perjudicial. Para reducir el artefacto de alternar entre la activación y desactivación del filtro, la fuerza del postfiltro también se puede adaptar gradualmente para proporcionar transiciones más suaves. El análisis del impacto del filtro se puede realizar en una señal de diferencia de filtro, que describe la diferencia entre la señal filtrada y no filtrada. También se puede realizar en una señal de diferencia aproximada para reducir la complejidad computacional del método.
En H. Chiba, et al "Adaptive Post-Filtering Controlled by Pitch Frequency for CELP-based Speech Coder", 48a Conferencia de Asilomar sobre señales, sistemas y ordenadores de 2014, se reconoce que la idoneidad del postfiltro de bajos puede depender de la frecuencia fundamental, o frecuencia fundamental, de la señal. Aquí, la fuerza del postfiltro está limitada en función de la frecuencia fundamental, de modo que el postfiltro se atenúa para frecuencias más bajas. La salida del filtro también se filtra en paso bajo con una frecuencia de corte que depende de la frecuencia fundamental, lo que produce un ancho de banda operativo más bajo para frecuencias fundamentales más bajas.
El documento US2019/214035 Al describe una decisión sobre el uso del postfiltro tomada por separado de la decisión sobre el modo de codificación más adecuado. Esto hace posible mantener un estado de postfiltrado durante un período de tal duración que el cambio no molestará al oyente. Por lo tanto, el método de codificación puede prescribir que el postfiltro se mantendrá inactivo incluso aunque cambie a un modo de codificación donde el filtro está convencionalmente activo. También describe como una opción, en donde una sección de decodificación extrae una señal decodificada intermedia, mediante lo cual la señal de diferencia aproximada se puede calcular como la diferencia entre la señal decodificada intermedia y la señal decodificada intermedia cuando se somete a un postfiltrado.
El documento US 2012/101824 Al describe un método para evitar discontinuidades en los límites de la trama cuando se realiza un prefiltrado en base a la frecuencia fundamental y un postfiltrado en base a la frecuencia fundamental de una señal de audio también se describe en la presente memoria.
Compendio
Los postfiltros están destinados a reducir el ruido, pero en algunos casos pueden introducir nuevos artefactos. En particular, los cambios abruptos en los parámetros, tales como el parámetro del período de frecuencia fundamental o la fuerza del postfiltro, pueden introducir discontinuidades que se vuelven audibles en las regiones de baja energía del espectro.
La activación y desactivación gradual, como se sugiere en el documento US 9224403 B2, no aborda el hecho de que pueden ocurrir discontinuidades internamente en el filtro como efecto de los parámetros de cambio. La experiencia muestra que los intentos de suavizar las transiciones de los cambios de parámetros pueden conducir a una adaptación del filtro más lenta, lo que reduce el rendimiento del postfiltro mientras que los artefactos aún no se eliminan por completo.
En un aspecto, se proporciona un método para decodificación de audio, donde una señal primaria codificada se decodifica para formar una señal primaria decodificada, seguido de un postfiltrado de la señal primaria decodificada para formar una señal postfiltrada, donde una señal de salida del decodificador es una de la señal primaria decodificada y la señal postfiltrada. Se obtiene una estimación de energía de al menos una parte de un espectro de frecuencia de la señal primaria que está siendo reconstruida por el decodificador y un análisis de las discontinuidades en el dominio del tiempo causadas por el postfiltrado de la señal primaria decodificada. Se genera una variable de decisión en base a la estimación de energía y el análisis de discontinuidades obtenidos. La variable de decisión se compara con un umbral y se establece que la señal de salida sea la señal primaria decodificada o la señal postfiltrada en base a la comparación de la variable de decisión con el umbral.
En otro aspecto, se proporciona un decodificador adaptado para realizar operaciones que comprenden: obtener una estimación de energía de al menos una parte de un espectro de frecuencia de una señal primaria que está siendo reconstruida por el decodificador para formar una señal primaria decodificada; obtener un análisis de discontinuidades en el dominio del tiempo causadas por el postfiltrado de la señal primaria decodificada; generar una variable de decisión en base a la estimación de energía obtenida y el análisis de discontinuidades obtenido; comparar la variable de decisión con un umbral; y establecer que la señal de salida sea la señal primaria decodificada o una señal postfiltrada en base a la comparación de la variable de decisión con el umbral.
En otro aspecto, se proporciona un programa informático que comprende un código de programa a ser ejecutado por los circuitos de procesamiento de un decodificador, mediante lo cual la ejecución del código de programa hace que el decodificador realice operaciones que comprenden: obtener una estimación de energía de al menos una parte de un espectro de frecuencia de una señal primaria que está siendo reconstruida por el decodificador para formar una señal primaria decodificada; obtener un análisis de discontinuidades en el dominio del tiempo causadas por el postfiltrado de la señal primaria decodificada; generar una variable de decisión en base a la estimación de energía obtenida y el análisis de discontinuidades obtenido; comparar la variable de decisión con un umbral; y establecer que la señal de salida sea la señal primaria decodificada o una señal postfiltrada en base a la comparación de la variable de decisión con el umbral.
Una ventaja que se puede obtener utilizando los conceptos inventivos descritos en la presente memoria es la adición de una adaptación de un postfiltro de modo que se mantengan los beneficios del postfiltro, mientras que los casos problemáticos se mitigan atenuando o desactivando el postfiltro. Además, esta ventaja se logra mediante un método poco complejo que tiene un impacto limitado en la complejidad computacional global del decodificador de audio.
Breve descripción de los dibujos
Los dibujos adjuntos, que se incluyen para proporcionar una mayor comprensión de la descripción y se incorporan y constituyen parte de esta solicitud, ilustran ciertas realizaciones no limitativas de los conceptos inventivos. En los dibujos:
La Figura 1 es un diagrama que ilustra un ejemplo de un sistema decodificador que funciona en una red según algunas realizaciones;
La Figura 2 es un diagrama de bloques que ilustra un ejemplo de un decodificador con un postfiltro de frecuencia fundamental según algunas realizaciones;
La Figura 3 es una ilustración de discontinuidades que pueden aparecer en los límites de las subtramas en una señal de ajuste de postfiltro de frecuencia fundamental;
La Figura 4 es una ilustración de los espectros de potencia de una señal antes y después de aplicar el postfiltro de frecuencia fundamental denominado "postfiltro de bajos (BPF) ";
La Figura 5 es un diagrama que ilustra un decodificador con un postfiltro de frecuencia fundamental, donde el decodificador reconstruye la señal en el dominio de la frecuencia según algunas realizaciones;
La Figura 6 es un diagrama de bloques de los elementos de un postfiltro adaptativo según algunas realizaciones de los conceptos inventivos;
La Figura 7 es un diagrama de bloques que ilustra elementos del postfiltro adaptativo según algunas realizaciones de los conceptos inventivos;
La Figura 8 es un diagrama de flujo que ilustra las operaciones realizadas por un postfiltro adaptativo según algunas realizaciones de los conceptos inventivos;
La Figura 9 es un diagrama de bloques que ilustra los elementos de un postfiltro adaptativo alternativo según algunas realizaciones de los conceptos inventivos;
La Figura 10 es un diagrama de bloques que ilustra un decodificador según algunas realizaciones de los conceptos inventivos;
La Figura 11 es un diagrama de flujo que ilustra las operaciones de un decodificador según algunas realizaciones de los conceptos inventivos;
La Figura 12 es un diagrama de flujo que ilustra las operaciones de un decodificador según algunas realizaciones de los conceptos inventivos;
La Figura 13 es un diagrama de flujo que ilustra las operaciones de un decodificador según algunas realizaciones de los conceptos inventivos;
Descripción detallada
A continuación, se describirán ahora con más detalle los conceptos inventivos con referencia a los dibujos adjuntos, en los que se muestran ejemplos de realizaciones de los conceptos inventivos. Sin embargo, los conceptos inventivos pueden materializarse de muchas formas diferentes y no deben interpretarse como limitados a las realizaciones expuestas en la presente memoria. Más bien, estas realizaciones se proporcionan para que esta descripción sea exhaustiva y completa, y transmita plenamente el alcance de los presentes conceptos inventivos a los expertos en la técnica. También cabe señalar que estas realizaciones no son mutuamente excluyentes. Se puede suponer tácitamente que los componentes de una realización están presentes/son utilizados en otra realización.
La siguiente descripción presenta diversas realizaciones de la materia objeto descrita. Estas realizaciones se presentan como ejemplos didácticos y no deben interpretarse como limitativos del alcance de la materia objeto descrita. Por ejemplo, ciertos detalles de las realizaciones descritas pueden modificarse, omitirse o ampliarse sin apartarse del alcance de la materia objeto descrita.
La Figura 1 ilustra un ejemplo de un entorno operativo de un decodificador 100 que puede utilizarse para decodificar flujos de bits mono, estéreo o multicanal como se describe en la presente memoria. El decodificador 100 puede ser parte de un reproductor multimedia, un dispositivo móvil, un dispositivo decodificador, un ordenador de escritorio y similares. El decodificador 100 recibe flujos de bits codificados. Los flujos de bits pueden enviarse desde un codificador, desde un dispositivo de almacenamiento 104, desde un dispositivo en la nube a través de la red 102, etc. Durante el funcionamiento, el decodificador 100 recibe y procesa las tramas del flujo de bits como se describe en la presente memoria. El decodificador 100 emite señales de audio (por ejemplo, señales de audio mono, estéreo o multicanal) y transmite las señales de audio a un reproductor de audio 106 que tiene al menos un altavoz para reproducir señales de audio mono, estéreo o multicanal. El dispositivo de almacenamiento 104 puede ser parte de un depósito de almacenamiento de señales de audio mono, estéreo o multicanal tal como un repositorio de almacenamiento de una tienda o un servicio de música en streaming, un componente de almacenamiento separado, un componente de un dispositivo móvil, etc. El reproductor puede ser un altavoz Bluetooth, un dispositivo que tenga al menos un altavoz, un dispositivo móvil, un servicio de música en streaming, etc.
La Figura 10 es un diagrama de bloques que ilustra elementos de un dispositivo decodificador 100 configurado para proporcionar comunicación inalámbrica según realizaciones de los conceptos inventivos. Un decodificador 100 puede ser parte de un terminal móvil, un terminal de comunicación móvil, un dispositivo de comunicación inalámbrica, un terminal inalámbrico, un terminal de comunicación inalámbrica, un equipo de usuario, UE, un nodo/terminal/dispositivo de equipo de usuario, etc. Como se muestra, el decodificador 100 puede incluir un circuito de interfaz de red 1005, también denominado interfaz de red, configurado para proporcionar comunicaciones con otros dispositivos/entidades/funciones/etc. El decodificador 100 también puede incluir un circuito de procesador 1001, también denominado procesador, acoplado operativamente al circuito de interfaz de red 1005, y un circuito de memoria 1003, también denominado memoria, acoplado operativamente al circuito de procesador. El circuito de memoria 1003 puede incluir código de programa legible por ordenador que, cuando es ejecutado por el circuito de procesador 1001, hace que el circuito de procesador realice operaciones según las realizaciones descritas en la presente memoria.
Según otras realizaciones, el circuito de procesador 1001 puede definirse para incluir memoria de modo que no se requiera un circuito de memoria separado. Como se discute en la presente memoria, las operaciones del decodificador 100 pueden ser realizadas por el procesador 1001 y/o la interfaz de red 1005. Por ejemplo, el procesador 1001 puede controlar la interfaz de red 1005 para transmitir comunicaciones a reproductores de audio multicanal y/o recibir comunicaciones a través de la interfaz de red 1005 de uno o más de otros nodos/entidades/servidores de red tales como nodos codificadores, servidores de depósito, etc. Además, los módulos pueden almacenarse en la memoria 1003, y estos módulos pueden proporcionar instrucciones para que cuando las instrucciones de un módulo son ejecutadas por el procesador 1001, el procesador 1001 realice las operaciones respectivas.
La Figura 2 ilustra un sistema de decodificación de audio que incluye un postfiltro de frecuencia fundamental. El descodificador 220 recibe un flujo de bits 210 procedente, por ejemplo, de una red de transmisión o un medio de almacenamiento. El decodificador genera una señal reconstruida en el dominio del tiempoS(m, n)dondenes el índice de muestra ymes el número de trama. La señal reconstruida en el dominio del tiempos(m, n)también puede denominarse señal primaria o señal primaria decodificada en la descripción que sigue. La señal reconstruida en el dominio del tiempos(m, n)se mejora adicionalmente mediante un postfiltro de frecuencia fundamental 230 que también puede utilizar un período de frecuencia fundamentalT.
El período de frecuencia fundamentalTse obtiene a través de un análisis de frecuencia fundamental realizado en el audio decodificado, o puede provenir de un análisis en el codificador o decodificador de la señal objetivo o una señal de audio relacionada que puede tener la misma o similar frecuencia fundamental dominante que la señal de entrada del postfiltro.
La señal postfiltradaSf(m, n)puede derivarse utilizando un postfiltro de frecuencia fundamental de la forma:
(Sf(m,n)= (1 -á)s(m,n)asp(m,n)
|sp (m, n) = 0.5s(m, n — T)+ 0.5s(m,n T)
donde T es el período de frecuencia fundamental en las muestras y a E [0, 0,5] controla la fuerza del postfiltro. Una expresión equivalente para la señal postfiltrada es
Sf(m, tí) s(m, n) a (sp(m, n<) —>s(m,<n ) ) =>
dondesd i f f(rrc.n) =a (
vs ( m , n ) — sp ( m , n ) )
' es el impacto del filtro expresado como una señal de diferencia negativa o una señal de corrección o una señal de error. Los parámetrosayTnormalmente se actualizan en cada subtrama, donde una subtrama puede tener una longitud de 4 o 5 ms. Si la trama de audio completa es de 20 ms, esto significa que la trama completa se divide en 5 o 4 subtramas respectivamente. En 3GPP EVS [1], la fuerza del postfiltroase adapta en base a la estabilidad espectral de la señal. También tiene un mecanismo de seguridad contra fallos incorporado mediante la medición de la correlación con el audio postfiltrado con la señal de entrada. Si la correlación es baja, significa que es probable que el filtro tenga un impacto negativo en la calidad y que el filtro esté amortiguado o apagado.
La señal postfiltradaSf (m, n)se emite desde el sistema decodificador para ser reproducida por un reproductor de audio o potencialmente almacenada o transmitida en un formato PCM decodificado. Obsérvese que el sistema decodificador puede incluir un procesamiento adicional de la señal postfiltrada antes de que se emita la señal final, tal como mejoras adicionales o combinaciones con otras señales o componentes de señal. En tales casos, la señal reconstruida puede corresponder a una señal de diferencia o señal residual, como se describe en ITU-T G.718 "Frame error robust narrowband and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s", sección 7.14.1.2 Postfiltro de bajos dual. La señal residual se puede combinar con otra señal para proporcionar una señal de salida mejorada.
Adaptación del postfiltro de bajos - Realización A
Un inconveniente del postfiltro de bajos de la Figura 2 es que el cambio abrupto de los parámetros del postfiltro de bajos en el límite de las subtramas puede causar discontinuidades no deseadas en la señal filtrada, como se ilustra mediante las discontinuidades 300 en la Figura 3. Estas discontinuidades pueden dar distorsiones que se extienden por todo el rango de frecuencias. Dependiendo del espectro de la señal de entrada, estas distorsiones pueden ser perceptibles y resultar perturbadoras. Considérese, por ejemplo, los espectros 400 en la Figura 4, donde la operación del postfiltro genera un ruido audible 402 por encima de aproximadamente 1 kHz. Obsérvese que el filtro todavía tiene el efecto deseado por debajo de 200 Hz, donde se reduce la distorsión interarmónica.
El mecanismo de seguridad contra fallos del filtro, que mide la correlación de la salida del filtro con la señal de entrada del filtro, no aborda el problema de las transiciones de subtrama. Dado que la correlación se calcula dentro de cada subtrama, no se han considerado las transiciones entre subtramas y su impacto potencial.
Una posible técnica para reducir los efectos de las discontinuidades es aplicar suavizado a través del filtrado de paso bajo de los parámetros o mediante el desvanecimiento cruzado de la salida del postfiltro entre subtramas. Aunque se comprobó que dichas operaciones reducían los artefactos, las operaciones también ralentizaron la adaptación del filtro de modo que se redujeron los efectos positivos del filtro. Además, aunque el filtrado de paso bajo de los parámetros redujo los artefactos, se comprobó que era mejor desconectar el postfiltro para estos segmentos críticos. Por lo tanto, parece deseable mantener el postfiltro intacto en las regiones donde tiene un impacto positivo, mientras que debería desconectarse por completo cuando tiene un impacto negativo. Una adaptación del postfiltro que pueda anticipar las distorsiones y desactivar el filtro cuando sea necesario puede reducir y, en algunas realizaciones, eliminar los efectos de las discontinuidades.
El decodificador como se describe en la Figura 5 proporciona dicha adaptación. El decodificador 520 recibe un flujo de bits 510 y produce una señal reconstruidas(m, k)en el dominio de la frecuencia dondemes el número de trama ykes el índice del intervalo de frecuencias. Una transformada que se utiliza a menudo en sistemas de codificador y decodificador de audio es la MDCT (transformada de coseno discreta modificada). Cabe señalar que los conceptos presentados en la presente memoria son aplicables a cualquier dominio de transformada donde sean posibles los cálculos de energía, tales como DFT (transformada discreta de Fourier), QMF (banco de filtros de espejo de cuadratura) o un banco de filtros QMF híbrido. El bloque de procesamiento 530 realiza la transformada MDCT inversa (IMDCT) y aplica el postfiltro. Se puede describir un método de adaptación de postfiltro según algunas realizaciones de los conceptos inventivos sustituyendo el bloque de procesamiento 530 de la Figura 5 con el bloque de postfiltro adaptativo 600 de la Figura 6. La señal reconstruida 620 en el dominio de frecuenciaS(m, k)se transforma al dominio del tiempo. La señal en el dominio del tiempo resultante se introduce en un bloque 610 generador de diferencia de postfiltro. La diferencia de postfiltroSdm (m, n)630 y la señal reconstruidaS(m, k)620 en el dominio de la frecuencia se introducen en el adaptador de postfiltro 640, que toma una decisión 650 sobre si se debe aplicar o no el postfiltro. La decisión 650 se usa para controlar la salida 660 del bloque de postfiltro adaptativo activando o desactivando la sustracción de la diferencia de postfiltro de la señal primaria reconstruida.
En la Figura 9 se muestra un método alternativo, donde el postfiltro emite la señal filtrada en lugar de la señal de diferencia de filtro. Aquí, el mecanismo de decisión del bloque de postfiltro adaptativo alternativo 900 decide si utilizar la señal filtrada 902 o la señal no filtrada 904. El análisis en el dominio del tiempo de la señal filtrada se realiza en la señal filtrada 902 en lugar de la señal de diferencia, lo que obtendrá resultados similares.
El adaptador postfiltro 640 de la Figura 6 se puede describir con más detalle mediante los elementos de la Figura 7 que realizan los pasos descritos en la Figura 8. En base al análisis de los elementos problemáticos como se ilustra en la Figura 3 y la Figura 4, el método de adaptación de postfiltro puede basarse en la detección de dos condiciones:
1. El espectro tiene una fuerte inclinación o un valle profundo que puede exponer la distorsión potencial de un postfiltro como se ilustra en la Figura 4 donde la señal 400 tiene un valle que comienza cerca de 1000 Hz donde está expuesta la distorsión 402 del postfiltro, y
2. las discontinuidades en los límites de las subtramas son grandes como se ilustra en la Figura 3 mediante las discontinuidades 300.
La detección de una fuerte inclinación o un valle profundo en el espectro se puede realizar midiendo la energía del espectro en una determinada banda crítica. Una baja energía en la banda crítica podría indicar entonces que se encuentra un valle profundo en una parte perceptualmente sensible del espectro. La medición de energíaEScb (m)para cada tramamse puede realizar en la señal reconstruidaS(m, k)en el dominio de MDCT. El estimador de energía 710 en el dominio de MDCT realiza el bloque 800 midiendo la energía de la banda crítica.
Los límites del intervalo de frecuenciaskmcioy km se pueden establecer para que coincidan con el rango de frecuencias de la banda crítica. Por ejemplo, si la longitud de la trama MDCTNmdct =160, la tasa de muestreo es de 8000 Hz y el rango de frecuencias crítico es de 1000 Hz - 1600 Hz, valores adecuados pueden serkinicio= 39 y km = 64. Para una operación de filtrado estrictamente de paso alto, el límite superior debe ser 4000 Hz y km = 160. En la descripción anterior, la banda crítica puede ser adaptativa y, por ejemplo, depender de la señal reconstruida. La banda crítica podría, por ejemplo, centrarse en torno a una región de baja energía identificada medida en un espectro ponderado perceptual. Se puede generar un espectro perceptualmente ponderado en base al espectro de la señal reconstruida y transformarlo en dimensiones de frecuencia y nivel de manera que se enfaticen las regiones perceptualmente importantes. Una banda crítica adaptativa también puede tener en cuenta para qué rango de frecuencias el postfiltro puede generar distorsión.
Dado que la síntesis MDCT de S(m,k)puede implicar una operación de superposición y adición, puede ser deseable imitar la superposición y adición en la estimación de energía. Esto se puede hacer aplicando un filtro FIR de paso bajo 720 en el bloque 810 a la estimación de energía:
Aquí es un coeficiente de filtrado de paso bajo que, por ejemplo, depende de la forma de las ventanas de síntesis MDCT y la longitud de la superposición. Un valor adecuado puede ser y = 0,61.
El tamaño de las discontinuidades se mide promediando el paso en los límites de las subtramas de la señal de diferencia de filtroSd¡ff(m, n) en el bloque 820 utilizando el analizador 730 de discontinuidades de las subtramas:
Dondemdenota el número de trama, í es el número de subtrama,Nsfes el número de subtramas yni, m,,,, nnsfson los índices de muestra de los límites de las subtramas que marcan el inicio de cada nueva subtrama. Si el número de subtramasNsf =5 y la longitud de la tramaN =160, los índices de los límites de las subtramas pueden serni= 0,n2= 32,n3= 64,n4= 96,ns= 128. Obsérvese que para la primera muestrani= 0, se haría referencia a la muestraSd¡ff{m,—i),Sin embargo, esta es la misma muestra que la última muestra de la trama anterior,Sd¡ff (m— 1,N—i),En una implementación práctica, este valor de muestra se almacenaría en memoria entre tramas.
Se forma una variable de decisión en el bloque 830 en el multiplicador 740 como la relación entre
Alternativamente, en caso de que se omita el paso opcional de filtrado de paso bajo 810, se forma una variable de
decisión como la relación entre donde es la estimación de energía calculada en el bloque 800.
Para estabilizar la decisión, se puede filtrar en paso bajo aplicando un filtro de paso bajo 760 en el bloque 840 entre tramas, por ejemplo
donde ^ e es un coeficiente de filtrado de paso bajo y un valor adecuado puede ser¡3 = 0.68.
Puede ser además beneficioso limitar el rango de la relación de energía filtrada en paso bajo en el bloque 840 a través del limitador 750, en cuyo caso la expresión puede escribirse
dondeErat¡o,i¡mestablecería un límite superior para la relación de energía y donde se comprobó que un valor adecuado eraEratio,¡¡m =2. Obsérvese que cuando es 1, la relación de energía ya no se filtra en paso bajo.
La decisión de activación del postfiltro en diversas realizaciones se toma comparando la relación de energía filtrada en paso bajo con el umbral en el comparador de umbral 770 en el bloque 850 y determinando si usar o no (por ejemplo, activar) el postfiltro en el bloque 860. En una realización de los conceptos inventivos, el umbralEthrse establece en 1.
& ratio.LP( m ) <E th r
E ra tio .Lp(.m) ^ ^t/ir
dondeactivoindica que el postfiltro está activado einactivoindica que el postfiltro está desactivado. Cabe señalar que Frat¿0(m ),
si se omite el bloque opcional 840, la variable de decisión calculada en el bloque 830, se compara con el umbral. Como se indicó anteriormente, cuando se activa el postfiltro, la salida del postfiltro sustrae la diferencia de postfiltro de la señal primaria reconstruida. Cuando el postfiltro está inactivo, la salida del postfiltro es la señal primaria reconstruida.
Obsérvese que se puede realizar un análisis similar de las discontinuidades en la señal de salida del filtros i(m, n)en lugar de la señal de diferenciaSdm(m, n), como se ilustra en la Figura 9. Esto probablemente conduciría a diferentes elecciones en, por ejemplo, las constantes del filtrofi, y, Eraso.umyErnr,pero los principios de los conceptos descritos anteriormente seguirían siendo los mismos.
En algunas realizaciones, agregar algo de histéresis a los cambios para reducir la alternancia puede ser útil si la relación de energía filtrada en paso bajo ronda el umbral. Una forma de implementar la histéresis es tener dos umbrales: uno para activación y otro para desactivación. Si el umbral de activación es un poco mayor que el umbral de desactivación, esto crea una "zona muerta" para la variable de decisión y reduce la alternancia si la variable ronda el umbral. Otra forma de implementar la histéresis es determinar un recuento del número de veces que la relación de energía filtrada en paso bajo se sitúa por debajo (o alternativamente, por encima) del umbral en un período de tiempo y activar (o desactivar) el postfiltro después de un número predeterminado de veces que la relación de energía filtrada en paso bajo se sitúa por debajo (o alternativamente, por encima) del umbral en el período de tiempo.
En las realizaciones descritas anteriormente, se utiliza una banda crítica. En diversas otras realizaciones de los conceptos inventivos, puede haber presente más de una banda crítica, correspondiente a más de un valle espectral. En una realización, la banda crítica seleccionada para analizar es la región más sensible y la decisión de utilizar o no el postfiltro se realiza para la banda crítica seleccionada. En otras realizaciones, podría haber múltiples regiones donde el ruido está justo por debajo del umbral para ser perceptible, y la combinación de muchas de esas regiones puede dar como resultado que un usuario escuche el ruido mientras que el análisis por región indica que el ruido no debería ser perceptible. Una forma de tener en cuenta esto puede ser sumar la contribución de varias bandas críticas y decidir si establecer que la salida sea la señal primaria o la señal postfiltrada en base a las realizaciones descritas anteriormente. Un enfoque alternativo es analizar las bandas por separado y luego desactivar el postfiltro si se activa el umbral para cualquiera de las bandas que se están analizando.
Realización B
Un método alternativo para decidir si el ruido quedará enmascarado es comparar la energía de la señal en la región crítica antes y después del postfiltro. Se comprobó que este método alternativo daba resultados similares a los conceptos inventivos descritos en la Realización A, pero a costa de un mayor retardo y complejidad. La energía de la banda crítica de la señal reconstruida se puede medir en el dominio del tiempo:
donde/7¿'~u(O' ' es un filtro de paso alto o un filtro de paso de banda que coincide con la banda crítica. De manerasimilar, la energía de la crítica de la señal reconstruida postfiltrada se puede escribir
sf ,c b ( m >n ) = fc b( s / ( m , n ) )
Se puede tomar la decisiónD(m)de activar o desactivar el postfiltro para la tramamcomparando la relación de energía de la banda crítica de las señales antes y después de aplicar el postfiltro con un umbral de decisiónErnrcomo se ilustra a continuación, dondeactivoindica que el postfiltro está activado einactivoindica que el postfiltro está desactivado. En una realización de los conceptos inventivos, el umbralEthrse establece en 1. En otras palabras, cuando la energía por encima de una determinada frecuencia de corte es mayor después de aplicar el postfiltro, se supone que el aumento de energía es causado por el ruido y se desactiva postfiltro.
La desactivación del postfiltro para la tramamse puede implementar en algunas realizaciones utilizando la señal decodificadas(m, n)en lugar de la versión postfiltradaSí(m, n).Si la rutina del filtro produce una señal de diferencia de filtroSdm(m, n),la desactivación del filtro se puede implementar omitiendo la sustracción de la señal de diferencia de filtro de la señal decodificadas(m, n).
En algunas realizaciones, puede ser útil agregar algo de histéresis al cambio entre la señal primaria y la señal postfiltrada para reducir la alternancia si la relación de energía ronda el umbral. Una forma de implementar la histéresis es tener dos umbrales: uno para activación y otro para desactivación. Si el umbral de activación es un poco mayor que el umbral de desactivación, esto crea una "zona muerta" para la variable de decisión y reduce la alternancia si la variable ronda el umbral. Otra forma de implementar la histéresis es determinar un conteo del número de veces que la relación de energía filtrada en paso bajo se sitúa por debajo (o alternativamente, por encima) del umbral en un período de tiempo y activar (o desactivar) el postfiltro después de un número predeterminado de veces que la relación de energía filtrada en paso bajo se sitúa por debajo (o alternativamente, por encima) del umbral en el período de tiempo.
Las operaciones del decodificador 100 (implementado utilizando la estructura del diagrama de bloques de la Figura 10) se discutirán ahora con referencia al diagrama de flujo de la Figura 11 según algunas realizaciones de los conceptos inventivos. Por ejemplo, los módulos se pueden almacenar en la memoria 1003 de la Figura 3, y estos módulos pueden proporcionar instrucciones para que cuando las instrucciones de un módulo sean ejecutadas por los respectivos circuitos de procesamiento 1001 del dispositivo de comunicación, los circuitos de procesamiento 1001 realicen las respectivas operaciones del diagrama de flujo.
Volviendo ahora a la Figura 11, en el bloque 1101, los circuitos de procesamiento 1001 obtienen una estimación de energía de al menos una parte de un espectro de frecuencia de la señal primaria que está siendo reconstruida, es decir, decodificada, por el decodificador 100. La reconstrucción de la señal primaria puede realizarse en el dominio de la frecuencia. Las operaciones del bloque 1101 son análogas a las operaciones del bloque 800 descritas anteriormente. En diversas realizaciones de los conceptos inventivos, los circuitos de procesamiento 1001 pueden obtener la estimación de energía sumando coeficientes de energía de la al menos una parte del espectro de frecuencia en el dominio de la frecuencia. Por ejemplo, en algunas realizaciones, los circuitos de procesamiento 1001 obtienen la estimación de energía midiendo una energía de una banda crítica de una señal reconstruida según
S(tTI/el en dondemes un número de trama, es una energía de una banda crítica de la señal reconstruida, ’1es una señal reconstruida, y los límites del intervalo de frecuenciaskmcmykfmse establecen para coincidir con un rango de frecuencias de banda crítica.
Los circuitos de procesamiento 1001 pueden procesar además la medición aplicando un filtro de paso bajo a la energía E* ~ (m )
Scb Jde la banda crítica de la señal reconstruida según
en donde y es un coeficiente de filtrado de paso bajo que depende de la forma de las ventanas de síntesis de transformada de coseno discreta modificada, MDCT, y la longitud de una superposición.
En el bloque 1103, los circuitos de procesamiento 1001 obtienen un análisis de las discontinuidades en el dominio del tiempo causadas por el postfiltrado de la señal primaria. Las operaciones del bloque 1103 son análogas a las operaciones del bloque 820 descritas anteriormente. En diversas realizaciones de los conceptos inventivos, los circuitos de procesamiento 1001 pueden obtener el análisis de las discontinuidades en el dominio del tiempo midiendo una energía promedio de un tamaño de las discontinuidades. Por ejemplo, en algunas realizaciones, los circuitos de procesamiento 1001 miden la energía promedio del tamaño de las discontinuidades promediando un paso en los límites de las subtramas de una señal de diferencia de filtroSdrn(m, n)según
en dondemesun número de trama, /'es un número de subtrama, ^step(m ) es una energía promedio del paso en los límites de las subtramas,Nsfes un número de subtramas yni, m ,,, nnsison índices de muestra de los límites de las subtramas que marcan el inicio de cada subtrama.
En el bloque 1105, los circuitos de procesamiento 1001 generan una variable de decisión en base a la estimación de energía obtenida y el análisis de discontinuidades obtenido. Las operaciones del bloque 1105 son análogas a las operaciones del bloque 830 descritas anteriormente. En diversas realizaciones de los conceptos inventivos, los circuitos de procesamiento 1001 pueden generar la variable de decisión según
en dondeEratio(m ) es una relación de energía entre ^step(m ) y^sCb^m\^step(m ) es una energía promedio de un
paso en los límites de las subtramas, es una energía filtrada en paso bajo ^ cí>(m) de una banda crítica de una señal reconstruida.
Volviendo a la Figura 12, en algunas realizaciones de los conceptos inventivos, los circuitos de procesamiento 1001 pueden limitar la variable de decisión a un valor máximo en el bloque 1201 y filtrar en paso bajo la variable de decisión en el bloque 1203. Las operaciones de los bloques 1201 y 1203 son análogas a las operaciones del bloque 840 descritas anteriormente. En algunas realizaciones, los circuitos de procesamiento 1001 limitan la variable de decisión y filtra en paso bajo la variable de decisión según
'step(m) ^ESíJ m ) Estep(m) en dondemes un número de trama,Ératioí171)es una relación de energía entre
es una energía promedio de un paso en los límites de las subtramas, es una energía filtrada en paso bajo
de una banda crítica de una señal reconstruida, ^ £ ^ es un coeficiente de filtrado de paso bajo, yEra tio ■ ,li ■mes un |¡m¡íe SUper¡or para |a relación de energía.
Volviendo a la Figura 11, en el bloque 1107, los circuitos de procesamiento 1001 comparan la variable de decisión con un umbral. Por ejemplo, como se describió anteriormente, cuando la variable de decisión es la relación de
energía entreEsteP^m^y <|a>relación de energía se compara con un umbralEmr.
En el bloque 1109, los circuitos de procesamiento 1001 establecen una señal de salida del decodificador 100 a la señal primaria decodificada o la señal postfiltrada (formada por el postfiltrado) en base a la comparación de la variable de decisión con el umbral. Por ejemplo, como se describió anteriormente, en algunas realizaciones, los circuitos de procesamiento 1001 comparan la variable de decisión según
En diversas realizaciones de los conceptos inventivos, la energía umbralEthrse puede establecer en un valor de 1. Un ejemplo de establecimiento de la señal de salida se ilustra en la Figura 13. Volviendo a la Figura 13, los circuitos de procesamiento 1001 en el bloque 1301 comparan la relación de energía entre una energía promedio de un paso en los límites de las subtramas y una estimación de energía de la al menos una parte del espectro de frecuencia de la señal primaria con un umbral.
En el bloque 1303, en respuesta a que la relación de energía entre la energía promedio del paso en los límites de las subtramas y la estimación de energía de la al menos una parte del espectro de frecuencia de la señal primaria es menor que un umbral, los circuitos de procesamiento 1001 establecen que la señal de salida sea la señal postfiltrada. En el bloque 1305, en respuesta a que la relación de energía entre la energía promedio del paso en los límites de las subtramas y la energía de la al menos una parte del espectro de frecuencia de la señal primaria es igual al umbral o mayor que el umbral, los circuitos de procesamiento 1001 establecen que la señal de salida sea la señal primaria decodificada.
En algunas realizaciones de los conceptos inventivos, se puede agregar histéresis para establecer la salida entre la señal primaria decodificada y la señal postfiltrada para reducir la alternancia si la relación de energía ronda el umbral. A continuación, se discuten realizaciones de ejemplo.
A continuación, se proporcionan explicaciones para diversas abreviaturas/acrónimos utilizados en la presente descripción.
Abreviatura Explicación
BPF Postfiltro de bajos
DFT Transformada discreta de Fourier
MDCT Transformada de coseno discreta modificada
EVS Servicio de voz mejorado
QMF Banco de filtros de espejo en cuadratura
A continuación, se proporciona una explicación adicional.
Generalmente, todos los términos utilizados en la presente memoria deben interpretarse según su significado habitual en el campo técnico relevante, a menos que se dé claramente un significado diferente y/o esté implícito en el contexto en donde se utiliza. Todas las referencias a un/una/el elemento, aparato, componente, medio, paso, etc. deben interpretarse abiertamente como referencias a al menos una instancia del elemento, aparato, componente, medio, paso, etc., a menos que se indique explícitamente lo contrario. Los pasos de cualquiera de los métodos descritos en la presente memoria no tienen que realizarse en el orden exacto descrito, a menos que un paso se describa explícitamente como siguiente o anterior a otro paso y/o donde esté implícito que un paso debe seguir o preceder a otro paso. Cualquier característica de cualquiera de las realizaciones descritas en la presente memoria se puede aplicar a cualquier otra realización, siempre que sea apropiado. Asimismo, cualquier ventaja de cualquiera de las realizaciones se puede aplicar a cualquier otra realización, y viceversa. Otros objetivos, características y ventajas de las realizaciones adjuntas resultarán evidentes a partir de la siguiente descripción.
A continuación, se discuten más definiciones y realizaciones.
En la descripción anterior de diversas realizaciones de los presentes conceptos inventivos, se debe entender que la terminología utilizada en la presente memoria tiene el propósito de describir realizaciones particulares solamente y no pretende ser limitativa de los presentes conceptos inventivos. A menos que se defina lo contrario, todos los términos (incluidos los términos técnicos y científicos) utilizados en la presente memoria tienen el mismo significado que entiende comúnmente un experto en la técnica a la que pertenecen los presentes conceptos inventivos. Se entenderá además que los términos, tales como los definidos en los diccionarios de uso común, deben interpretarse con un significado que sea consistente con su significado en el contexto de esta especificación y la técnica relevante y no se interpretarán de en un sentido idealizado o demasiado sentido formal a menos que así se defina expresamente en la presente memoria.
Cuando se hace referencia a un elemento como "conectado", "acoplado", "que responde a" o variantes del mismo a otro elemento, puede estar directamente conectado, acoplado o responder al otro elemento o puede haber presentes elementos intermedios. Por el contrario, cuando se hace referencia a un elemento como "directamente conectado", "directamente acoplado", "que responde directamente" o variantes de los mismos a otro elemento, no hay elementos intermedios presentes. Los números similares se refieren a elementos similares en todo el documento. Además, "acoplado", "conectado", "que responde a" o variantes de los mismos como se utilizan en la presente memoria pueden incluir acoplado, conectado o que responde a de forma inalámbrica. Tal como se utilizan en la presente memoria, las formas singulares "un", "una" y "el" pretenden incluir también las formas plurales, a menos que el contexto indique claramente lo contrario. Es posible que las funciones o construcciones conocidas no se describan en detalle por motivos de brevedad y/o claridad. El término "y/o" (abreviado "1") incluye todas y cada una de las combinaciones de uno o más de los elementos enumerados asociados.
Se entenderá que, aunque los términos primero, segundo, tercero, etc. se pueden utilizar en la presente memoria para describir diversos elementos/operaciones, estos elementos/operaciones no deben estar limitados por estos términos. Estos términos sólo se utilizan para distinguir un elemento/operación de otro elemento/operación. Por lo tanto, un primer elemento/operación en algunas realizaciones podría denominarse un segundo elemento/operación en otras realizaciones sin desviarse de las enseñanzas de los presentes conceptos inventivos. Los mismos números de referencia o los mismos designadores de referencia denotan elementos iguales o similares en toda la especificación.
Como se usan en la presente memoria, los términos "comprende", "que comprende", "comprende", "incluye", "que incluye", "incluye", "tiene", "tiene", "que tiene", o variantes de los mismos son abiertos, e incluyen una o más características, números enteros, elementos, pasos, componentes o funciones indicados, pero no excluyen la presencia o adición de una o más de otras características, números enteros, elementos, pasos, componentes, funciones o grupos de los mismos. Además, como se usa en la presente memoria, la abreviatura común "e.g.", que deriva de la frase en latín "exempli gratia", puede utilizarse para introducir o especificar un ejemplo general o ejemplos de un elemento mencionado anteriormente, y no pretende ser limitativo de dicho elemento. La abreviatura común "i.e.", que deriva de la frase en latín "id est ", puede utilizarse para especificar un elemento particular de una enumeración más general.
En la presente memoria se describen realizaciones de ejemplo con referencia a diagramas de bloques y/o ilustraciones de diagramas de flujo de métodos, aparatos (sistemas y/o dispositivos) y/o productos de programa informático implementados por ordenador. Se entiende que un bloque de los diagramas de bloques y/o ilustraciones de diagramas de flujo, y combinaciones de bloques en los diagramas de bloques y/o ilustraciones de diagramas de flujo, se pueden implementar mediante instrucciones de programa informático que son realizadas por uno o más circuitos informáticos. Estas instrucciones de programa informático pueden proporcionarse a un circuito de procesador de un circuito informático de propósito general, un circuito informático de propósito especial y/u otro circuito de procesamiento de datos programable para producir una máquina, de manera que las instrucciones, que se ejecutan a través del procesador del ordenador y /u otros aparatos de procesamiento de datos programables, transforman y controlan transistores, valores almacenados en ubicaciones de memoria y otros componentes de hardware dentro de dichos circuitos para implementar las funciones/acciones especificadas en los diagramas de bloques y/o bloque o bloques de diagrama de flujo, y de ese modo crear medios (funcionalidad) y/o estructura para implementar las funciones/acciones especificadas en los diagramas de bloques y/o bloque(s) de diagrama de flujo.
Estas instrucciones de programa informático también se pueden almacenar en un medio tangible legible por ordenador que puede dirigir un ordenador u otro aparato de procesamiento de datos programable para que funcione de una manera particular, de manera que las instrucciones almacenadas en el medio legible por ordenador produzcan un artículo de fabricación que incluye instrucciones que implementan las funciones/actos especificados en los diagramas de bloques y/o en el bloque o bloques de diagrama de flujo. Por consiguiente, las realizaciones de los presentes conceptos inventivos pueden materializarse en hardware y/o en software (incluido firmware, software residente, microcódigo, etc.) que se ejecuta en un procesador tal como un procesador de señales digitales, que pueden denominarse colectivamente como "circuito", "un módulo" o variantes de los mismos.
También cabe señalar que en algunas implementaciones alternativas, las funciones/actos indicados en los bloques pueden ocurrir fuera del orden indicado en los diagramas de flujo. Por ejemplo, dos bloques mostrados en sucesión pueden de hecho ejecutarse sustancialmente al mismo tiempo o los bloques a veces pueden ejecutarse en el orden inverso, dependiendo de la funcionalidad/acciones involucrados. Además, la funcionalidad de un bloque dado de los diagramas de flujo y/o diagramas de bloques puede separarse en múltiples bloques y/o la funcionalidad de dos o más bloques de los diagramas de flujo y/o diagramas de bloques puede integrarse al menos parcialmente. Finalmente, se pueden agregar/insertar otros bloques entre los bloques que se ilustran, y/o se pueden omitir bloques/operaciones sin desviarse del alcance de los conceptos inventivos. Además, aunque algunos de los diagramas incluyen flechas en las rutas de comunicación para mostrar una dirección primaria de comunicación, debe entenderse que la comunicación puede ocurrir en la dirección opuesta a las flechas representadas.

Claims (15)

  1. REIVINDICACIONES 1. Un método para decodificación de audio, donde una señal primaria codificada se decodifica para formar una señal primaria decodificada, seguido de un postfiltrado de la señal primaria decodificada para formar una señal postfiltrada, donde una señal de salida del decodificador es una de la señal primaria decodificada y la señal postfiltrada, comprendiendo el método: obtener (1101,800) una estimación de energía de al menos una parte de un espectro de frecuencia de la señal primaria que está siendo reconstruida por el decodificador; obtener (1103, 820) un análisis de discontinuidades en el dominio del tiempo causadas por el postfiltrado de la señal primaria decodificada; generar (1105, 830) una variable de decisión en base a la estimación de energía obtenida y el análisis de discontinuidades obtenido; comparar (1107, 850) la variable de decisión con un umbral; y establecer (1109) que la señal de salida sea la señal primaria decodificada o la señal postfiltrada en base a la comparación de la variable de decisión con el umbral.
  2. 2. El método de la reivindicación 1, en donde la reconstrucción de la señal primaria se realiza en el dominio de la frecuencia.
  3. 3. El método de la reivindicación 2, en donde la obtención de la estimación de energía comprende agregar los coeficientes de energía de al menos una parte del espectro de frecuencia en el dominio de la frecuencia.
  4. 4. El método de la reivindicación 3, en donde la obtención de la estimación de energía comprende medir una energía de una banda crítica de una señal reconstruida según
    en dondemes un número de trama, ^ 9 n ) es una energía de una banda crítica de una señal reconstruida,S(m, k)es una señal reconstruida y los límites del intervalo de frecuenciaskinicioykmse establecen para coincidir con un rango de frecuencias de una banda crítica.
  5. 5. El método de la reivindicación 4, que comprende además aplicar un filtro de paso bajo a la energíaEscbO )de labanda crítica de la señal reconstruida según
    en dondeYe (0-1 ] es un coeficiente de filtrado de paso bajo que depende de la forma de las ventanas de síntesis de transformada de coseno discreta modificada, MDCT, y la longitud de una superposición.
  6. 6. El método de cualquiera de las reivindicaciones 1-5, en donde la obtención del análisis de las discontinuidades en el dominio del tiempo comprende medir una energía promedio de un tamaño de las discontinuidades.
  7. 7. El método de la reivindicación 6, en donde medir la energía promedio del tamaño de las discontinuidades comprende promediar un paso en los límites de las subtramas de una señal de diferencia de filtroSdiff (m, n)según
    E (TTl} en dondemesun número de trama, /'es un número de subtrama,step 1es una energía promedio del paso en los límites de las subtramas,Nsfes un número de subtramas yni, m ,,, nnsison índices de muestra de los límites de las subtramas que marcan el inicio de cada subtrama.
  8. 8. El método de cualquiera de las reivindicaciones 1 -7, en donde generar la variable de decisión comprende limitar (1201,840) la variable de decisión a un valor máximo.
  9. 9. El método de cualquiera de las reivindicaciones 1 a 8, que comprende además un filtrado de paso bajo (1203, 840) de la variable de decisión.
  10. 10. El método de la reivindicación 9, en donde generar la variable de decisión comprende generar la variable de decisión^a tio M ™ -)según
    E ra tio ( r n ) , E ra i i0 (j t i )<EJjra tio ,lim Eratio,l(pE ) — Eratio.lim .’^ r a t io ( ^ 0 ^E r a ii0¡î m en donde m es un número de trama,r a t io<( m )>es una relación de energía entreEsteP(.m)„E§cb(rr i)y es una energía promedio de un paso en los límites de las subtramas, es una energía filtradaE-ii en paso bajo 5. (rn) CDde una banda crítica de una señal reconstruida,B H &(o K' 11 is 1es un coeficiente de filtrado de paso bajo, yE ratio ■M ■mes un |ím¡te superior para la relación de energía.
  11. 11. El método de cualquiera de las reivindicaciones 1 a 10, en donde establecer que la señal de salida sea la señal primaria decodificada o la señal postfiltrada en base a la comparación de la variable de decisión con el umbral comprende: en respuesta a que a una relación de energía entre una energía promedio de un paso en los límites de las subtramas y una estimación de energía de al menos una parte del espectro de frecuencia de la señal primaria sea menor que un umbral (1301), establecer (1303) la señal de salida a la señal postfiltrada; y en respuesta a que la relación de energía entre la energía promedio del paso en los límites de las subtramas y la energía de la al menos una parte del espectro de frecuencia de la señal primaria sea igual al umbral o mayor que el umbral (1301), establecer (1305) la señal de salida a la señal primaria decodificada.
  12. 12. El método de la reivindicación 11, que comprende, además: proporcionar histéresis para la comparación de la variable de decisión con el umbral para evitar que la señal de salida oscile entre la señal primaria y la señal postfiltrada cuando la relación de energía se sitúa por encima y por debajo del nivel umbral en un período de tiempo específicado.
  13. 13. Un decodificador (100) adaptado para realizar operaciones que comprenden: obtener (1101,800) una estimación de energía de al menos una parte de un espectro de frecuencia de una señal primaria que está siendo reconstruida por el decodificador para formar una señal primaria decodificada; obtener (1103, 820) un análisis de discontinuidades en el dominio del tiempo causadas por el postfiltrado de la señal primaria decodificada; generar (1105, 830) una variable de decisión en base a la estimación de energía obtenida y el análisis de discontinuidades obtenido; comparar (1107, 850) la variable de decisión con un umbral; y establecer (1109) que la señal de salida sea la señal primaria decodificada o una señal postfiltrada en base a la comparación de la variable de decisión con el umbral.
  14. 14. El decodificador (100) de la reivindicación 13, en donde el decodificador (100) está adaptado para realizar operaciones según cualquiera de las reivindicaciones 2 a 12.
  15. 15. Un programa informático que comprende código de programa a ser ejecutado por circuitos de procesamiento (1001) de un decodificador (100), mediante lo cual la ejecución del código de programa hace que el decodificador (100) realice operaciones que comprenden: obtener (1101,800) una estimación de energía de al menos una parte de un espectro de frecuencia de una señal primaria que está siendo reconstruida por el decodificador para formar una señal primaria decodificada; obtener (1103, 820) un análisis de discontinuidades en el dominio del tiempo causadas por el postfiltrado de la señal primaria decodificada; generar (1105, 830) una variable de decisión en base a la estimación de energía obtenida y el análisis de discontinuidades obtenido; comparar (1107, 850) la variable de decisión con un umbral; y establecer (1109) que la señal de salida sea la señal primaria decodificada o una señal postfiltrada en base a la comparación de la variable de decisión con el umbral.
ES21721487T 2020-04-24 2021-04-23 Low cost adaptation of bass post-filter Active ES2995244T3 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202063014917P 2020-04-24 2020-04-24
PCT/EP2021/060643 WO2021214280A1 (en) 2020-04-24 2021-04-23 Low cost adaptation of bass post-filter

Publications (1)

Publication Number Publication Date
ES2995244T3 true ES2995244T3 (en) 2025-02-07

Family

ID=75674835

Family Applications (1)

Application Number Title Priority Date Filing Date
ES21721487T Active ES2995244T3 (en) 2020-04-24 2021-04-23 Low cost adaptation of bass post-filter

Country Status (8)

Country Link
US (1) US20230154479A1 (es)
EP (2) EP4478357A1 (es)
JP (2) JP7504216B2 (es)
CN (2) CN115428069A (es)
BR (1) BR112022018082A2 (es)
ES (1) ES2995244T3 (es)
MX (1) MX2022013100A (es)
WO (1) WO2021214280A1 (es)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3270922B2 (ja) * 1996-09-09 2002-04-02 富士通株式会社 符号化,復号化方法及び符号化,復号化装置
TW376611B (en) * 1998-05-26 1999-12-11 Koninkl Philips Electronics Nv Transmission system with improved speech encoder
EP2115742B1 (en) * 2007-03-02 2012-09-12 Telefonaktiebolaget LM Ericsson (publ) Methods and arrangements in a telecommunications network
EP3079152B1 (en) * 2010-07-02 2018-06-06 Dolby International AB Audio decoding with selective post filtering
US8738385B2 (en) * 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
EP2980796A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
CN105118520B (zh) * 2015-07-13 2017-11-10 腾讯科技(深圳)有限公司 一种音频开头爆音的消除方法及装置
KR102420175B1 (ko) * 2016-12-30 2022-07-12 하만 베커 오토모티브 시스템즈 게엠베하 음향 반향 제거

Also Published As

Publication number Publication date
EP4139919B1 (en) 2024-10-30
JP7504216B2 (ja) 2024-06-21
BR112022018082A2 (pt) 2022-11-01
MX2022013100A (es) 2022-12-08
EP4139919A1 (en) 2023-03-01
EP4478357A1 (en) 2024-12-18
CN115428069A (zh) 2022-12-02
EP4139919C0 (en) 2024-10-30
US20230154479A1 (en) 2023-05-18
CN119360866A (zh) 2025-01-24
JP2023522562A (ja) 2023-05-31
JP2024133490A (ja) 2024-10-02
WO2021214280A1 (en) 2021-10-28

Similar Documents

Publication Publication Date Title
US10964334B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
US10269359B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
ES2715847T3 (es) Sistemas y procedimientos de realización de filtrado para determinación de ganancia
ES2533626T3 (es) Métodos y adaptaciones en una red de telecomunicaciones
ES2995244T3 (en) Low cost adaptation of bass post-filter