[go: up one dir, main page]

ES2533626T3 - Métodos y adaptaciones en una red de telecomunicaciones - Google Patents

Métodos y adaptaciones en una red de telecomunicaciones Download PDF

Info

Publication number
ES2533626T3
ES2533626T3 ES12183033.5T ES12183033T ES2533626T3 ES 2533626 T3 ES2533626 T3 ES 2533626T3 ES 12183033 T ES12183033 T ES 12183033T ES 2533626 T3 ES2533626 T3 ES 2533626T3
Authority
ES
Spain
Prior art keywords
post filter
distance
spectral
determined
speech signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12183033.5T
Other languages
English (en)
Inventor
Volodya Grancharov
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of ES2533626T3 publication Critical patent/ES2533626T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephonic Communication Services (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

Un método para controlar un post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el método que comprende los pasos de: - medir (401) la estacionariedad de una señal de habla determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en el descodificador, - determinar (402) un coeficiente a un parámetro de control de atenuación de post filtro en base a la estacionariedad medida, y - transmitir (403) el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.

Description

5
10
15
20
25
30
35
40
45
50
55
E12183033
23-03-2015
DESCRIPCIÓN
Métodos y adaptaciones en una red de telecomunicaciones
Campo técnico
La presente invención se refiere a algoritmos post filtro, usados en codificación de habla y audio. En particular la presente invención se refiere a métodos y adaptaciones para proporcionar un post filtro mejorado.
Antecedentes
En una red de comunicación que transmite habla o audio, el habla original 100 o audio se codifica por un codificador 101 en el transmisor y un flujo de bits codificados 102 se transmite al receptor como se ilustra por la figura 3. En un receptor, el flujo de bits codificado 102 se descodifica por un descodificador 103 que reconstruye la señal de habla y audio original en una señal de habla (o audio) reconstruida 104. La codificación de habla y audio introduce ruido de cuantificación que deteriora la calidad del habla reconstruida. Por lo tanto se introducen los algoritmos post filtro 105. Los algoritmos post filtro de última tecnología 105 forman el ruido de cuantificación de manera que llega a ser menos audible. De esta manera los post filtros existentes mejoran la calidad percibida de la señal de habla reconstruida por el descodificador de manera que se proporciona una señal de habla mejorada 106. Una visión general de las técnicas post filtro se puede encontrar en J.H. Chen y A. Gersho, “Post filtrado adaptativo para mejora de calidad de habla codificada”, IEEE Trans. Proceso de Audio de Habla, vol. 3, páginas 58-71, 1985.
Todos los post filtros existentes explotan el concepto de enmascaramiento de señal. Es un fenómeno importante en un sistema auditivo humano. Ello significa que un sonido es inaudible en presencia de un sonido más fuerte. En general el umbral de enmascaramiento tiene un pico en la frecuencia del tono, y disminuye monotónicamente en ambos lados del pico. Esto significa que las componentes del ruido cerca de la frecuencia del tono (formantes de habla) se permite que tengan intensidades más altas que otras componentes de ruido que están más lejos (valles de espectro). Eso es porque los post filtros existentes se adaptan en una forma de trama a los formantes y/o estructuras de tono en el habla, en forma de coeficientes auto regresivos (AR) y/o periodo de tono.
Los post filtros más populares son el post filtro de formante (corto plazo) y el post filtro de tono (largo plazo). Un post filtro de formante reduce el efecto del ruido de cuantificación enfatizando las frecuencias de formantes y desenfatizando los valles espectrales. Esto se ilustra en la figura 1, en la que la línea continua muestra una envolvente auto regresiva de una señal antes del post filtrado y la línea discontinua muestra una envolvente auto regresiva de una señal después del post filtrado. El post filtrado de tono enfatiza las componentes de frecuencia en picos armónicos de tono, lo cual se ilustra en la figura 2. La línea continua de la figura 2 muestra el espectro de una señal antes del post filtrado mientras que la línea discontinua muestra el espectro de una señal después del post filtrado. Los gráficos de las figuras 1 y 2 conciernen a bloques de 30 ms de una señal de banda estrecha. Se debería señalar también que los gráficos de las figuras 1 y 2 no representan los parámetros de post filtro reales, sino sólo el concepto de post filtrado.
Los formantes y/o el tono indica(n) cómo se distribuye la energía en una trama que implica que las partes de la señal que se enmascaran (que son menos audibles o completamente audibles) están indicadas. Por lo tanto, la adaptación de parámetro de post filtro existente explota el concepto de enmascaramiento de señal, y por lo tanto se adapta a las estructuras de habla como frecuencias de formantes y picos armónicos de tono. Estos son todos rasgos en la trama (tal como el periodo de tono que da picos armónicos de tono y coeficientes auto regresivos que determinan los formantes), calculados bajo la suposición de que el habla es estacionaria para la trama actual (por ejemplo, habla de 20 ms).
Además de enmascarar la señal, un fenómeno psicoacústico importante es que si la dinámica de la señal es alta, entonces la distorsión es menos objetable. Ello significa que el ruido se enmascara auditivamente mediante cambios rápidos en la señal de habla. Este concepto de enmascarar de manera auditiva el ruido mediante cambios rápidos en la señal de habla está ya en uso para codificación de habla en H. Knagenhjelm y W.B. Kleijn, “La dinámica espectral es más importante que la distorsión espectral”, ICASSP, vol. 1, páginas 732-735, 1995 y para mejora en T. Quateri y R.Dunn, “Mejora de habla en base al cambio espectral auditivo”, ICASSP, vol. 1, páginas 257-260, 2002. En la adaptación de H. Knagenhjelm y W.B. Kleijn a la dinámica espectral se usa en la cuantificación de frecuencias espectrales en línea (LSF). En la adaptación de T. Quateri y R.Dunn a la dinámica espectral se usa en un pre-procesador para atenuación de ruido de fondo.
Otra técnica relacionada en el campo técnico se revela en la WO 98/39768, que se refiere a un post filtro de base sinusoidal. El post filtro puede calcular alguna medida que implica una dinámica de señal para suavizar la función de transferencia del filtro, en que el propósito de la suavización es evitar que un nuevo estado de filtro se desvíe demasiado del estado del filtro previo.
Resumen
No obstante, las soluciones de post filtro existente no tienen en consideración el hecho de que se debería realizar menos supresión cuando el contenido de la información de habla es alto, y se debería realizar más supresión
5
10
15
20
25
30
35
40
45
50
E12183033
23-03-2015
cuando la señal está en un modo de estado estable.
De esta manera un objeto con la presente invención es mejorar la calidad percibida del habla reconstruida.
Este objeto se logra por la presente invención por medio del parámetro de control de post filtro mejorado, en el que un coeficiente determinado en base a la estacionariedad de señal se aplica a un parámetro de control de post filtro convencional para lograr el parámetro de control de post filtro mejorado.
De acuerdo con un primer aspecto de la presente invención se proporciona un método para controlar un post filtro como se define en la reivindicación 1. El método mejora la calidad percibida de habla reconstruida en un descodificador de habla y comprende los pasos de medir la estacionariedad de una señal de habla reconstruida en un decodificador, determinando un coeficiente a un parámetro de control de post filtro basado en la estacionariedad medida, y transmitiendo el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada.
De acuerdo con un segundo aspecto de la presente invención se proporciona un método de post filtrado para mejorar la calidad percibida del habla reconstruida en un descodificador de habla como se define en la reivindicación
5. El método comprende los pasos de recibir un coeficiente determinado al post filtro, y procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada, en el que el coeficiente se determina en base a una estacionariedad medida de la señal de habla reconstruida en el descodificador.
De acuerdo con un tercer aspecto de la presente invención se proporciona un control de post filtro a estar asociado con un post filtro para mejorar la calidad percibida del habla reconstruida en un descodificador de habla como se define en la reivindicación 9. El control de post filtro comprende medios para medir la estacionariedad de una señal de habla reconstruida en un descodificador, medios para determinar un coeficiente a un parámetro de control de post filtro en base a la estacionariedad medida, y medios para transmitir el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada.
De acuerdo con un cuarto aspecto de la presente invención se proporciona una adaptación que comprende un control de post filtro y un post filtro para mejorar la calidad percibida del habla reconstruida en un descodificador de habla como se define en la reivindicación 13. El post filtro comprende medios para recibir un coeficiente determinado al post filtro, y un procesador para procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada, en el que el coeficiente se determina en base a una estacionariedad medida de la señal de habla reconstruida en un descodificador.
Una ventaja con la presente invención es que la adaptación de los parámetros de post filtro a la dinámica espectral ofrece un esquema simple es compatible con los post filtros existentes.
Breve descripción de los dibujos
La Fig. 1 ilustra el efecto de un post filtro de formante en la señal reconstruida de acuerdo con la técnica anterior.
La Fig. 2 ilustra el efecto de un post filtro de tono en la señal reconstruida de acuerdo con la técnica anterior.
La Fig. 3 ilustra esquemáticamente un codificador-descodificador con un post filtro de acuerdo con la técnica anterior.
La Fig. 4 ilustra esquemáticamente un codificador-descodificador de acuerdo con la figura 1 con el control de post filtro de una realización de la presente invención.
La Fig. 5 ilustra esquemáticamente un control de post filtro el post filtro de acuerdo con una realización de la presente invención.
Las Fig. 6a y 6b son diagramas de flujo de los métodos de acuerdo con la presente invención.
Descripción detallada
El concepto básico de la presente invención es modificar un post filtro existente de manera que se adapta a una dinámica espectral de una señal de habla descodificada. (Se debería señalar, que incluso si el término habla se usa aquí dentro, la especificación también se refiere a cualquier señal de audio.) La dinámica espectral implica una medida de la estacionariedad de la señal, definida como la distancia Euclidiana entre las densidades espectrales de dos segmentos de habla colindantes. Si la distancia Euclidiana entre dos segmentos de habla es alta, entonces la atenuación debería ser reducida comparado con una situación cuando la distancia Euclidiana es baja.
El post filtro modificado de acuerdo con la presente invención hace posible suprimir más ruido cuando la dinámica es baja y suprimir menos si la dinámica es alta, por ejemplo durante las transiciones de formante y los inicios vocales.
5
10
15
20
25
30
35
40
45
E12183033
23-03-2015
Esto cuenta para el hecho de que el nivel medio de ruido de cuantificación no puede cambiar rápidamente en el tiempo, sino en algunas partes de la señal el ruido será más audible que en otras partes.
Se debería señalar que el control de post filtro no sustituye la adaptación de post filtro convencional que está motivada por el fenómeno de enmascaramiento de señal pero es una adaptación complementaria que explota propiedades adicionales del sistema de audición humano, mejorando de esta manera la calidad de las soluciones de post filtro convencionales.
De esta manera, un control de post filtro que adapta el post filtro a la dinámica espectral de la señal descodificada se introduce de acuerdo con la presente invención. Una realización de la presente invención se ilustra en la figura 4. La figura 4 muestra un descodificador 201 y un post filtro 202. Un flujo de bits codificados 203 se introduce al descodificador 201 y el descodificador 201 descodifica el flujo de bits codificado 203 y reconstruye la señal de habla
204. El control de post filtro 206 mide la estacionariedad de la señal y determina un coeficiente 208 (indicado K más adelante) a ser transmitido al post filtro 202. El post filtro 202 procesa la señal de habla reconstruida usando los parámetros de post filtro convencionales que se modifican por el coeficiente 208 del control de post filtro 206 de manera que el post filtro se adapta a la dinámica espectral de la señal descodificada.
A continuación, se revela una implementación del control de post filtro de acuerdo con una realización. Esta implementación está basada en un post filtro de tono descrito en la US2005/0165603A1. Este post filtro también se describe en la C.S0052-A del 3GPP2: “Códec de Habla de Banda Ancha Multimodo de Tasa Variable (VMR-WB) Controlado por Fuente, Opciones de Servicio 62 o 63 para Sistemas de Espectro Ensanchado”, 2005 en la página 154 (ecuaciones 6.3.1-1 y 6.3.1-2). El post filtro de tono tiene la forma de
imagen1
ŝf salida de post filtro 205
ŝ entrada de post filtro 204
T periodo de tono
k es el índice de las muestras de habla en una trama
 parámetro de control de atenuación 208 (Este puede ser una función de la correlación de tono normalizada como en la C.S0052-A del 3GPP2: “Códec de Habla de Banda Ancha Multimodo de Tasa Variable (VMR-WB) Controlado por Fuente, Opciones de Servicio 62 o 63 para Sistemas de Espectro Ensanchado”, 2005.)
Todos los post filtros tienen al menos un parámetro de control  que se ajusta para obtener un habla mejorada. Se debería señalar que este parámetro de control no está limitado a  descrito en C.S0052-A del 3GPP2. Este ajuste de  se puede basar en pruebas de escucha. En el post filtro de tono descrito anteriormente, el valor del parámetro de control  depende de lo estable (grado de sonoridad vocal) que es el tono, dado que el tono existe en las tramas de voz.
Debido a razones de complejidad, en lugar de determinar la distancia espectral entre tramas adyacentes, se determina la distancia de las frecuencias espectrales de inmitancia (ISF) en esta implementación. La ISF es una representación de los coeficientes auto regresivos (también llamados coeficientes predictivos lineales).
Otra representación comúnmente usada es las Frecuencias Espectrales Lineales (LSF). La distancia entre las ISF o LSF de tramas colindantes es una aproximación de la dinámica espectral, dado que éstas son representaciones paramétricas de la envolvente espectral.
En la C.S0052-A del 3GPP2: “Códec de habla de banda ancha multimodo de tasa variable (VMR-WB) controlado por fuente, Opciones de servicio 62 y 63 para sistemas de espectro ensanchado”, 2005, en la página 151 la distancia ISF se calcula y convierte a un factor de estabilidad θ:
imagen2
El factor de estabilidad θ es sólo una normalización de la distancia ISF y por lo tanto se usa para determinar la dinámica espectral en realizaciones de la presente invención. Se debería señalar no obstante que también se pueden usar otras medidas tales como las LSF para determinar la dinámica espectral. La denotación “pasada” indica que es un vector ISF de la trama de habla previa. Usando este θ y la versión de paso bajo de θ, indicado θ_suave, se determinan dos parámetros y . θ_suave es importante ya que mide la estacionariedad de señal más allá de
12
5
10
15
20
25
30
35
E12183033
23-03-2015
la trama actual y la previa. Estos dos parámetros y se usan para determinar el coeficiente K para el parámetro
12
de control de atenuación. De acuerdo con esta realización el coeficiente se denota
imagen3
y el nuevo parámetro de control  estab_adapt = K .
El estab_adapt determinado a partir de la ecuación anterior sustituye el parámetro de control convencional. K se define como una combinación lineal de y . mide la distancia espectral entre la trama actual y la previa. mide lo
121 2
lejos que está la distancia a la distancia de paso bajo (θsuave) de las tramas pasadas. Es decir
imagen4
De esta manera, la presente invención se refiere a un control post filtro como se ilustra en la figura 5. El control post filtro 300 comprende medios para medir la estacionariedad 301 de una señal de habla reconstruida en un descodificador, medios para determinar 302 un coeficiente K a un parámetro de control de post filtro en base a la estacionariedad medida, y medios para transmitir 303 el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida usando el coeficiente determinado para obtener una señal de habla mejorada.
Además, el post filtro 304 de la presente invención comprende un procesador post filtro 305 y medios para recibir 306 el coeficiente determinado K al post filtro, y el procesador post filtro 305 comprende medios para procesar 307 la señal de habla reconstruida aplicando el coeficiente determinado K para obtener una señal de habla mejorada, en la que el coeficiente K se determina en base a una estacionariedad medida de la señal de habla reconstruida en un descodificador.
Además, la presente invención también se refiere a un método en un control de post filtro. El método se ilustra en el diagrama de flujo de la figura 4a y comprende los pasos de:
401.
Medir la estacionariedad de una señal de habla reconstruida en un descodificador.
402.
Determinar un coeficiente a un parámetro de control de post filtro en base a la estacionariedad medida.
403.
Transmitir el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada.
También se proporciona un método para el post filtro como se ilustra en el diagrama de flujo de la figura 4b. El método comprende los pasos de:
404.
Recibir un coeficiente determinado al post filtro.
405.
Procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada, en la que el coeficiente se determina en base a una estacionariedad medida de la señal de habla reconstruida en un descodificador.
La presente invención no está limitada a las realizaciones preferentes descritas anteriormente. Se pueden usar varias alternativas, modificaciones y equivalentes. Por lo tanto, las realizaciones anteriores no deberían ser tomadas como que limitan el alcance de la invención, el cual se define por las reivindicaciones adjuntas.

Claims (16)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    REIVINDICACIONES
    1. Un método para controlar un post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el método que comprende los pasos de:
    -medir (401) la estacionariedad de una señal de habla determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en el descodificador,
    -determinar (402) un coeficiente a un parámetro de control de atenuación de post filtro en base a la estacionariedad medida, y
    -transmitir (403) el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.
  2. 2.
    El método de acuerdo con la reivindicación 1, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.
  3. 3.
    El método de acuerdo con cualquiera de las reivindicaciones 1-2, en el que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia espectral de paso bajo, θsuave de las tramas pasadas.
  4. 4.
    El método de acuerdo con la reivindicación 1, en el que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.
  5. 5.
    Un método de post filtrado para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el método que comprende los pasos de:
    -recibir (404) un coeficiente determinado a un parámetro de control de atenuación de post filtro desde un control de post filtro, en el que el coeficiente se determina en base a una estacionariedad medida de una señal de habla, la estacionariedad que se mide determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en un descodificador, y
    -procesar (405) la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.
  6. 6.
    El método de acuerdo con la reivindicación 5, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.
  7. 7.
    El método de acuerdo con cualquiera de las reivindicaciones 5-6, en el que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia espectral de paso bajo, θsuave de las tramas pasadas.
  8. 8.
    El método de acuerdo con la reivindicación 5, en el que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.
  9. 9.
    Un control de post filtro (300) a ser asociado con un post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el control de post filtro comprende medios para medir la estacionariedad
    (301) de una señal de habla determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en un descodificador, medios para determinar (302) un coeficiente a un parámetro de control de atenuación de post filtro en base a la estacionariedad medida, y medios para transmitir (303) el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.
  10. 10.
    El control de post filtro de acuerdo con la reivindicación 9, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.
  11. 11.
    El control de post filtro de acuerdo con cualquiera de las reivindicaciones 9-10, en el que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia espectral de paso bajo, θsuave de las tramas pasadas.
  12. 12.
    El control de post filtro de acuerdo con la reivindicación 9, en el que el parámetro de control de atenuación de
    6
    post filtro es una función de una correlación de tono normalizado.
  13. 13. Una adaptación que comprende un post filtro (304) y un control de post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el post filtro comprende medios para recibir (306) un coeficiente determinado a un parámetro de control de atenuación de post filtro desde un control de post filtro, en el que el 5 coeficiente se determina en base a una estacionariedad medida de una señal de habla, la estacionariedad, que se mide determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en un descodificador, y un procesador (305) para procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales
    10 lineales.
  14. 14.
    El post filtro de acuerdo con la reivindicación 13, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.
  15. 15.
    El post filtro de acuerdo con cualquiera de las reivindicaciones 13-14, en la que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la
    15 previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia espectral de paso bajo, θsuave, de las tramas pasadas.
  16. 16. El post filtro de acuerdo con la reivindicación 13, en la que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.
    7
ES12183033.5T 2007-03-02 2007-11-01 Métodos y adaptaciones en una red de telecomunicaciones Active ES2533626T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US89267007P 2007-03-02 2007-03-02
US892670P 2007-03-02

Publications (1)

Publication Number Publication Date
ES2533626T3 true ES2533626T3 (es) 2015-04-13

Family

ID=39027449

Family Applications (2)

Application Number Title Priority Date Filing Date
ES12183033.5T Active ES2533626T3 (es) 2007-03-02 2007-11-01 Métodos y adaptaciones en una red de telecomunicaciones
ES07822142T Active ES2394515T3 (es) 2007-03-02 2007-11-01 Métodos y adaptaciones en una red de telecomunicaciones

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES07822142T Active ES2394515T3 (es) 2007-03-02 2007-11-01 Métodos y adaptaciones en una red de telecomunicaciones

Country Status (9)

Country Link
US (3) US20100145692A1 (es)
EP (2) EP2535894B1 (es)
JP (1) JP5291004B2 (es)
CN (1) CN101622668B (es)
DK (1) DK2535894T3 (es)
ES (2) ES2533626T3 (es)
MX (1) MX2009008055A (es)
PL (1) PL2535894T3 (es)
WO (1) WO2008107027A1 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2929090C (en) * 2010-07-02 2017-03-14 Dolby International Ab Selective bass post filter
JP2013073230A (ja) * 2011-09-29 2013-04-22 Renesas Electronics Corp オーディオ符号化装置
CN105122358B (zh) * 2013-01-29 2019-02-15 弗劳恩霍夫应用研究促进协会 用于处理编码信号的装置和方法与用于产生编码信号的编码器和方法
US9978392B2 (en) * 2016-09-09 2018-05-22 Tata Consultancy Services Limited Noisy signal identification from non-stationary audio signals
ES2995244T3 (en) * 2020-04-24 2025-02-07 Ericsson Telefon Ab L M Low cost adaptation of bass post-filter
CN115188388B (zh) * 2022-07-11 2024-05-17 北京百瑞互联技术股份有限公司 一种音频后置滤波方法、装置、存储介质及设备

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3035565A1 (de) * 1980-09-20 1982-05-06 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren zur nichtlinearen zeitanpassung von signalverlaeufen
JP2595495B2 (ja) * 1982-09-03 1997-04-02 日本電気株式会社 パタンマッチング装置
US4624008A (en) * 1983-03-09 1986-11-18 International Telephone And Telegraph Corporation Apparatus for automatic speech recognition
JPH0727398B2 (ja) * 1985-02-12 1995-03-29 日本電気株式会社 定数可変型聴感的重み付けフイルタ
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
US5533052A (en) * 1993-10-15 1996-07-02 Comsat Corporation Adaptive predictive coding with transform domain quantization based on block size adaptation, backward adaptive power gain control, split bit-allocation and zero input response compensation
US5715372A (en) * 1995-01-10 1998-02-03 Lucent Technologies Inc. Method and apparatus for characterizing an input signal
US5774849A (en) * 1996-01-22 1998-06-30 Rockwell International Corporation Method and apparatus for generating frame voicing decisions of an incoming speech signal
SE506034C2 (sv) * 1996-02-01 1997-11-03 Ericsson Telefon Ab L M Förfarande och anordning för förbättring av parametrar representerande brusigt tal
JP4307557B2 (ja) * 1996-07-03 2009-08-05 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 音声活性度検出器
JP3675054B2 (ja) * 1996-09-24 2005-07-27 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置、並びに音声復号化方法
JPH10116097A (ja) * 1996-10-11 1998-05-06 Olympus Optical Co Ltd 音声再生装置
US6075475A (en) * 1996-11-15 2000-06-13 Ellis; Randy E. Method for improved reproduction of digital signals
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
US5987406A (en) * 1997-04-07 1999-11-16 Universite De Sherbrooke Instability eradication for analysis-by-synthesis speech codecs
FR2764469B1 (fr) * 1997-06-09 2002-07-12 France Telecom Procede et dispositif de traitement optimise d'un signal perturbateur lors d'une prise de son
JP3601653B2 (ja) * 1998-03-18 2004-12-15 富士通株式会社 情報検索装置および方法
US6556967B1 (en) * 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US6633845B1 (en) * 2000-04-07 2003-10-14 Hewlett-Packard Development Company, L.P. Music summarization system and method
US6959056B2 (en) * 2000-06-09 2005-10-25 Bell Canada RFI canceller using narrowband and wideband noise estimators
JP4053424B2 (ja) * 2001-01-17 2008-02-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ロバスト・チェックサム
US7010052B2 (en) * 2001-04-16 2006-03-07 The Ohio University Apparatus and method of CTCM encoding and decoding for a digital communication system
US6941263B2 (en) * 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
FR2835125B1 (fr) * 2002-01-24 2004-06-18 Telediffusion De France Tdf Procede d'evaluation d'un signal audio numerique
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP4689269B2 (ja) * 2002-07-01 2011-05-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 静的スペクトルパワー依存型音響強調システム
GB2392358A (en) * 2002-08-02 2004-02-25 Rhetorical Systems Ltd Method and apparatus for smoothing fundamental frequency discontinuities across synthesized speech segments
FI20021936A7 (fi) * 2002-10-31 2004-05-01 Nokia Corp Vaihtuvanopeuksinen puhekoodekki
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
CN1757060B (zh) * 2003-03-15 2012-08-15 曼德斯必德技术公司 Celp语音编码的话音指数控制
WO2004086967A1 (en) * 2003-03-26 2004-10-14 Biotechplex Corporation Instantaneous autonomic nervous function and cardiac predictability based on heart and pulse rate variability analysis
US7363221B2 (en) * 2003-08-19 2008-04-22 Microsoft Corporation Method of noise reduction using instantaneous signal-to-noise ratio as the principal quantity for optimal estimation
GB0326263D0 (en) * 2003-11-11 2003-12-17 Nokia Corp Speech codecs
FI118835B (fi) * 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
CN1677493A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
WO2005096274A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
NZ553385A (en) * 2004-08-09 2010-06-25 Nielsen Co Us Llc Methods and apparatus to monitor audio/visual content from various sources
KR100631608B1 (ko) * 2004-11-25 2006-10-09 엘지전자 주식회사 음성 판별 방법
EP1686561B1 (en) * 2005-01-28 2012-01-04 Honda Research Institute Europe GmbH Determination of a common fundamental frequency of harmonic signals
KR101168466B1 (ko) * 2005-04-21 2012-07-26 에스알에스 랩스, 인크. 오디오 잡음을 감소시키는 시스템 및 방법
EP1897085B1 (en) * 2005-06-18 2017-05-31 Nokia Technologies Oy System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
CN101263734B (zh) * 2005-09-02 2012-01-25 丰田自动车株式会社 麦克风阵列用后置滤波器
US9245532B2 (en) * 2008-07-10 2016-01-26 Voiceage Corporation Variable bit rate LPC filter quantizing and inverse quantizing device and method

Also Published As

Publication number Publication date
EP2115742B1 (en) 2012-09-12
PL2535894T3 (pl) 2015-06-30
US20140249808A1 (en) 2014-09-04
US9076453B2 (en) 2015-07-07
WO2008107027A1 (en) 2008-09-12
CN101622668A (zh) 2010-01-06
JP5291004B2 (ja) 2013-09-18
US8731917B2 (en) 2014-05-20
EP2535894B1 (en) 2015-01-07
EP2535894A1 (en) 2012-12-19
JP2010520503A (ja) 2010-06-10
CN101622668B (zh) 2012-05-30
EP2115742A1 (en) 2009-11-11
DK2535894T3 (en) 2015-04-13
US20100145692A1 (en) 2010-06-10
MX2009008055A (es) 2009-08-18
US20130132075A1 (en) 2013-05-23
ES2394515T3 (es) 2013-02-01

Similar Documents

Publication Publication Date Title
KR101540371B1 (ko) 신호 분류 방법 및 장치, 및 인코딩/디코딩 방법 및 장치
EP2517202B1 (en) Method and device for speech bandwidth extension
US20060116874A1 (en) Noise-dependent postfiltering
US20100228557A1 (en) Method and apparatus for audio decoding
WO2018069900A1 (en) Audio-system and method for hearing-impaired
ES2533626T3 (es) Métodos y adaptaciones en una red de telecomunicaciones
WO2010127616A1 (en) System and method for frequency domain audio post-processing based on perceptual masking
US20190189137A1 (en) Apparatus and method for encoding an audio signal using a compensation value
ES2376178T3 (es) Post-tratamiento de reducción del ruido de cuantificación de un codificador en la decodificación.
WO2008101324A1 (en) High-frequency bandwidth extension in the time domain
EP2202726B1 (en) Method and apparatus for judging dtx
ES2978878T3 (es) Extensión de banda de frecuencia mejorada en un decodificador de señales de audiofrecuencia
EP2774148B1 (en) Bandwidth extension of audio signals
ES2741009T3 (es) Codificador de audio y método para codificar una señal de audio
KR102110284B1 (ko) 한국어 특성 기반의 청력 검사 장치 및 방법
Jokinen et al. Comparison of post-filtering methods for intelligibility enhancement of telephone speech
ES2995244T3 (en) Low cost adaptation of bass post-filter
Bouchard et al. A perceptual Post Filter for Wideband Speech and Audio ACELP Codecs
Jokinen et al. Utilization of the Lombard effect in post-filtering for intelligibility enhancement of telephone speech.
Boillot et al. A loudness enhancement technique for speech
Yoon et al. Improvement of Speech Intelligibility in Noisy Environments