ES2533626T3 - Métodos y adaptaciones en una red de telecomunicaciones - Google Patents
Métodos y adaptaciones en una red de telecomunicaciones Download PDFInfo
- Publication number
- ES2533626T3 ES2533626T3 ES12183033.5T ES12183033T ES2533626T3 ES 2533626 T3 ES2533626 T3 ES 2533626T3 ES 12183033 T ES12183033 T ES 12183033T ES 2533626 T3 ES2533626 T3 ES 2533626T3
- Authority
- ES
- Spain
- Prior art keywords
- post filter
- distance
- spectral
- determined
- speech signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000006978 adaptation Effects 0.000 title claims description 11
- 230000003595 spectral effect Effects 0.000 claims abstract description 56
- 230000008569 process Effects 0.000 claims abstract description 12
- 230000000873 masking effect Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephonic Communication Services (AREA)
- Filters That Use Time-Delay Elements (AREA)
Abstract
Un método para controlar un post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el método que comprende los pasos de: - medir (401) la estacionariedad de una señal de habla determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en el descodificador, - determinar (402) un coeficiente a un parámetro de control de atenuación de post filtro en base a la estacionariedad medida, y - transmitir (403) el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.
Description
5
10
15
20
25
30
35
40
45
50
55
E12183033
23-03-2015
DESCRIPCIÓN
Métodos y adaptaciones en una red de telecomunicaciones
Campo técnico
La presente invención se refiere a algoritmos post filtro, usados en codificación de habla y audio. En particular la presente invención se refiere a métodos y adaptaciones para proporcionar un post filtro mejorado.
Antecedentes
En una red de comunicación que transmite habla o audio, el habla original 100 o audio se codifica por un codificador 101 en el transmisor y un flujo de bits codificados 102 se transmite al receptor como se ilustra por la figura 3. En un receptor, el flujo de bits codificado 102 se descodifica por un descodificador 103 que reconstruye la señal de habla y audio original en una señal de habla (o audio) reconstruida 104. La codificación de habla y audio introduce ruido de cuantificación que deteriora la calidad del habla reconstruida. Por lo tanto se introducen los algoritmos post filtro 105. Los algoritmos post filtro de última tecnología 105 forman el ruido de cuantificación de manera que llega a ser menos audible. De esta manera los post filtros existentes mejoran la calidad percibida de la señal de habla reconstruida por el descodificador de manera que se proporciona una señal de habla mejorada 106. Una visión general de las técnicas post filtro se puede encontrar en J.H. Chen y A. Gersho, “Post filtrado adaptativo para mejora de calidad de habla codificada”, IEEE Trans. Proceso de Audio de Habla, vol. 3, páginas 58-71, 1985.
Todos los post filtros existentes explotan el concepto de enmascaramiento de señal. Es un fenómeno importante en un sistema auditivo humano. Ello significa que un sonido es inaudible en presencia de un sonido más fuerte. En general el umbral de enmascaramiento tiene un pico en la frecuencia del tono, y disminuye monotónicamente en ambos lados del pico. Esto significa que las componentes del ruido cerca de la frecuencia del tono (formantes de habla) se permite que tengan intensidades más altas que otras componentes de ruido que están más lejos (valles de espectro). Eso es porque los post filtros existentes se adaptan en una forma de trama a los formantes y/o estructuras de tono en el habla, en forma de coeficientes auto regresivos (AR) y/o periodo de tono.
Los post filtros más populares son el post filtro de formante (corto plazo) y el post filtro de tono (largo plazo). Un post filtro de formante reduce el efecto del ruido de cuantificación enfatizando las frecuencias de formantes y desenfatizando los valles espectrales. Esto se ilustra en la figura 1, en la que la línea continua muestra una envolvente auto regresiva de una señal antes del post filtrado y la línea discontinua muestra una envolvente auto regresiva de una señal después del post filtrado. El post filtrado de tono enfatiza las componentes de frecuencia en picos armónicos de tono, lo cual se ilustra en la figura 2. La línea continua de la figura 2 muestra el espectro de una señal antes del post filtrado mientras que la línea discontinua muestra el espectro de una señal después del post filtrado. Los gráficos de las figuras 1 y 2 conciernen a bloques de 30 ms de una señal de banda estrecha. Se debería señalar también que los gráficos de las figuras 1 y 2 no representan los parámetros de post filtro reales, sino sólo el concepto de post filtrado.
Los formantes y/o el tono indica(n) cómo se distribuye la energía en una trama que implica que las partes de la señal que se enmascaran (que son menos audibles o completamente audibles) están indicadas. Por lo tanto, la adaptación de parámetro de post filtro existente explota el concepto de enmascaramiento de señal, y por lo tanto se adapta a las estructuras de habla como frecuencias de formantes y picos armónicos de tono. Estos son todos rasgos en la trama (tal como el periodo de tono que da picos armónicos de tono y coeficientes auto regresivos que determinan los formantes), calculados bajo la suposición de que el habla es estacionaria para la trama actual (por ejemplo, habla de 20 ms).
Además de enmascarar la señal, un fenómeno psicoacústico importante es que si la dinámica de la señal es alta, entonces la distorsión es menos objetable. Ello significa que el ruido se enmascara auditivamente mediante cambios rápidos en la señal de habla. Este concepto de enmascarar de manera auditiva el ruido mediante cambios rápidos en la señal de habla está ya en uso para codificación de habla en H. Knagenhjelm y W.B. Kleijn, “La dinámica espectral es más importante que la distorsión espectral”, ICASSP, vol. 1, páginas 732-735, 1995 y para mejora en T. Quateri y R.Dunn, “Mejora de habla en base al cambio espectral auditivo”, ICASSP, vol. 1, páginas 257-260, 2002. En la adaptación de H. Knagenhjelm y W.B. Kleijn a la dinámica espectral se usa en la cuantificación de frecuencias espectrales en línea (LSF). En la adaptación de T. Quateri y R.Dunn a la dinámica espectral se usa en un pre-procesador para atenuación de ruido de fondo.
Otra técnica relacionada en el campo técnico se revela en la WO 98/39768, que se refiere a un post filtro de base sinusoidal. El post filtro puede calcular alguna medida que implica una dinámica de señal para suavizar la función de transferencia del filtro, en que el propósito de la suavización es evitar que un nuevo estado de filtro se desvíe demasiado del estado del filtro previo.
Resumen
No obstante, las soluciones de post filtro existente no tienen en consideración el hecho de que se debería realizar menos supresión cuando el contenido de la información de habla es alto, y se debería realizar más supresión
5
10
15
20
25
30
35
40
45
50
E12183033
23-03-2015
cuando la señal está en un modo de estado estable.
De esta manera un objeto con la presente invención es mejorar la calidad percibida del habla reconstruida.
Este objeto se logra por la presente invención por medio del parámetro de control de post filtro mejorado, en el que un coeficiente determinado en base a la estacionariedad de señal se aplica a un parámetro de control de post filtro convencional para lograr el parámetro de control de post filtro mejorado.
De acuerdo con un primer aspecto de la presente invención se proporciona un método para controlar un post filtro como se define en la reivindicación 1. El método mejora la calidad percibida de habla reconstruida en un descodificador de habla y comprende los pasos de medir la estacionariedad de una señal de habla reconstruida en un decodificador, determinando un coeficiente a un parámetro de control de post filtro basado en la estacionariedad medida, y transmitiendo el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada.
De acuerdo con un segundo aspecto de la presente invención se proporciona un método de post filtrado para mejorar la calidad percibida del habla reconstruida en un descodificador de habla como se define en la reivindicación
5. El método comprende los pasos de recibir un coeficiente determinado al post filtro, y procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada, en el que el coeficiente se determina en base a una estacionariedad medida de la señal de habla reconstruida en el descodificador.
De acuerdo con un tercer aspecto de la presente invención se proporciona un control de post filtro a estar asociado con un post filtro para mejorar la calidad percibida del habla reconstruida en un descodificador de habla como se define en la reivindicación 9. El control de post filtro comprende medios para medir la estacionariedad de una señal de habla reconstruida en un descodificador, medios para determinar un coeficiente a un parámetro de control de post filtro en base a la estacionariedad medida, y medios para transmitir el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada.
De acuerdo con un cuarto aspecto de la presente invención se proporciona una adaptación que comprende un control de post filtro y un post filtro para mejorar la calidad percibida del habla reconstruida en un descodificador de habla como se define en la reivindicación 13. El post filtro comprende medios para recibir un coeficiente determinado al post filtro, y un procesador para procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada, en el que el coeficiente se determina en base a una estacionariedad medida de la señal de habla reconstruida en un descodificador.
Una ventaja con la presente invención es que la adaptación de los parámetros de post filtro a la dinámica espectral ofrece un esquema simple es compatible con los post filtros existentes.
Breve descripción de los dibujos
La Fig. 1 ilustra el efecto de un post filtro de formante en la señal reconstruida de acuerdo con la técnica anterior.
La Fig. 2 ilustra el efecto de un post filtro de tono en la señal reconstruida de acuerdo con la técnica anterior.
La Fig. 3 ilustra esquemáticamente un codificador-descodificador con un post filtro de acuerdo con la técnica anterior.
La Fig. 4 ilustra esquemáticamente un codificador-descodificador de acuerdo con la figura 1 con el control de post filtro de una realización de la presente invención.
La Fig. 5 ilustra esquemáticamente un control de post filtro el post filtro de acuerdo con una realización de la presente invención.
Las Fig. 6a y 6b son diagramas de flujo de los métodos de acuerdo con la presente invención.
Descripción detallada
El concepto básico de la presente invención es modificar un post filtro existente de manera que se adapta a una dinámica espectral de una señal de habla descodificada. (Se debería señalar, que incluso si el término habla se usa aquí dentro, la especificación también se refiere a cualquier señal de audio.) La dinámica espectral implica una medida de la estacionariedad de la señal, definida como la distancia Euclidiana entre las densidades espectrales de dos segmentos de habla colindantes. Si la distancia Euclidiana entre dos segmentos de habla es alta, entonces la atenuación debería ser reducida comparado con una situación cuando la distancia Euclidiana es baja.
El post filtro modificado de acuerdo con la presente invención hace posible suprimir más ruido cuando la dinámica es baja y suprimir menos si la dinámica es alta, por ejemplo durante las transiciones de formante y los inicios vocales.
5
10
15
20
25
30
35
40
45
E12183033
23-03-2015
Esto cuenta para el hecho de que el nivel medio de ruido de cuantificación no puede cambiar rápidamente en el tiempo, sino en algunas partes de la señal el ruido será más audible que en otras partes.
Se debería señalar que el control de post filtro no sustituye la adaptación de post filtro convencional que está motivada por el fenómeno de enmascaramiento de señal pero es una adaptación complementaria que explota propiedades adicionales del sistema de audición humano, mejorando de esta manera la calidad de las soluciones de post filtro convencionales.
De esta manera, un control de post filtro que adapta el post filtro a la dinámica espectral de la señal descodificada se introduce de acuerdo con la presente invención. Una realización de la presente invención se ilustra en la figura 4. La figura 4 muestra un descodificador 201 y un post filtro 202. Un flujo de bits codificados 203 se introduce al descodificador 201 y el descodificador 201 descodifica el flujo de bits codificado 203 y reconstruye la señal de habla
204. El control de post filtro 206 mide la estacionariedad de la señal y determina un coeficiente 208 (indicado K más adelante) a ser transmitido al post filtro 202. El post filtro 202 procesa la señal de habla reconstruida usando los parámetros de post filtro convencionales que se modifican por el coeficiente 208 del control de post filtro 206 de manera que el post filtro se adapta a la dinámica espectral de la señal descodificada.
A continuación, se revela una implementación del control de post filtro de acuerdo con una realización. Esta implementación está basada en un post filtro de tono descrito en la US2005/0165603A1. Este post filtro también se describe en la C.S0052-A del 3GPP2: “Códec de Habla de Banda Ancha Multimodo de Tasa Variable (VMR-WB) Controlado por Fuente, Opciones de Servicio 62 o 63 para Sistemas de Espectro Ensanchado”, 2005 en la página 154 (ecuaciones 6.3.1-1 y 6.3.1-2). El post filtro de tono tiene la forma de
ŝf salida de post filtro 205
ŝ entrada de post filtro 204
T periodo de tono
k es el índice de las muestras de habla en una trama
parámetro de control de atenuación 208 (Este puede ser una función de la correlación de tono normalizada como en la C.S0052-A del 3GPP2: “Códec de Habla de Banda Ancha Multimodo de Tasa Variable (VMR-WB) Controlado por Fuente, Opciones de Servicio 62 o 63 para Sistemas de Espectro Ensanchado”, 2005.)
Todos los post filtros tienen al menos un parámetro de control que se ajusta para obtener un habla mejorada. Se debería señalar que este parámetro de control no está limitado a descrito en C.S0052-A del 3GPP2. Este ajuste de se puede basar en pruebas de escucha. En el post filtro de tono descrito anteriormente, el valor del parámetro de control depende de lo estable (grado de sonoridad vocal) que es el tono, dado que el tono existe en las tramas de voz.
Debido a razones de complejidad, en lugar de determinar la distancia espectral entre tramas adyacentes, se determina la distancia de las frecuencias espectrales de inmitancia (ISF) en esta implementación. La ISF es una representación de los coeficientes auto regresivos (también llamados coeficientes predictivos lineales).
Otra representación comúnmente usada es las Frecuencias Espectrales Lineales (LSF). La distancia entre las ISF o LSF de tramas colindantes es una aproximación de la dinámica espectral, dado que éstas son representaciones paramétricas de la envolvente espectral.
En la C.S0052-A del 3GPP2: “Códec de habla de banda ancha multimodo de tasa variable (VMR-WB) controlado por fuente, Opciones de servicio 62 y 63 para sistemas de espectro ensanchado”, 2005, en la página 151 la distancia ISF se calcula y convierte a un factor de estabilidad θ:
El factor de estabilidad θ es sólo una normalización de la distancia ISF y por lo tanto se usa para determinar la dinámica espectral en realizaciones de la presente invención. Se debería señalar no obstante que también se pueden usar otras medidas tales como las LSF para determinar la dinámica espectral. La denotación “pasada” indica que es un vector ISF de la trama de habla previa. Usando este θ y la versión de paso bajo de θ, indicado θ_suave, se determinan dos parámetros y . θ_suave es importante ya que mide la estacionariedad de señal más allá de
12
5
10
15
20
25
30
35
E12183033
23-03-2015
la trama actual y la previa. Estos dos parámetros y se usan para determinar el coeficiente K para el parámetro
12
de control de atenuación. De acuerdo con esta realización el coeficiente se denota
y el nuevo parámetro de control estab_adapt = K .
El estab_adapt determinado a partir de la ecuación anterior sustituye el parámetro de control convencional. K se define como una combinación lineal de y . mide la distancia espectral entre la trama actual y la previa. mide lo
121 2
lejos que está la distancia a la distancia de paso bajo (θsuave) de las tramas pasadas. Es decir
De esta manera, la presente invención se refiere a un control post filtro como se ilustra en la figura 5. El control post filtro 300 comprende medios para medir la estacionariedad 301 de una señal de habla reconstruida en un descodificador, medios para determinar 302 un coeficiente K a un parámetro de control de post filtro en base a la estacionariedad medida, y medios para transmitir 303 el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida usando el coeficiente determinado para obtener una señal de habla mejorada.
Además, el post filtro 304 de la presente invención comprende un procesador post filtro 305 y medios para recibir 306 el coeficiente determinado K al post filtro, y el procesador post filtro 305 comprende medios para procesar 307 la señal de habla reconstruida aplicando el coeficiente determinado K para obtener una señal de habla mejorada, en la que el coeficiente K se determina en base a una estacionariedad medida de la señal de habla reconstruida en un descodificador.
Además, la presente invención también se refiere a un método en un control de post filtro. El método se ilustra en el diagrama de flujo de la figura 4a y comprende los pasos de:
- 401.
- Medir la estacionariedad de una señal de habla reconstruida en un descodificador.
- 402.
- Determinar un coeficiente a un parámetro de control de post filtro en base a la estacionariedad medida.
- 403.
- Transmitir el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada.
También se proporciona un método para el post filtro como se ilustra en el diagrama de flujo de la figura 4b. El método comprende los pasos de:
- 404.
- Recibir un coeficiente determinado al post filtro.
- 405.
- Procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de post filtro para obtener una señal de habla mejorada, en la que el coeficiente se determina en base a una estacionariedad medida de la señal de habla reconstruida en un descodificador.
La presente invención no está limitada a las realizaciones preferentes descritas anteriormente. Se pueden usar varias alternativas, modificaciones y equivalentes. Por lo tanto, las realizaciones anteriores no deberían ser tomadas como que limitan el alcance de la invención, el cual se define por las reivindicaciones adjuntas.
Claims (16)
- 5101520253035404550REIVINDICACIONES1. Un método para controlar un post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el método que comprende los pasos de:-medir (401) la estacionariedad de una señal de habla determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en el descodificador,-determinar (402) un coeficiente a un parámetro de control de atenuación de post filtro en base a la estacionariedad medida, y-transmitir (403) el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales.
-
- 2.
- El método de acuerdo con la reivindicación 1, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.
-
- 3.
- El método de acuerdo con cualquiera de las reivindicaciones 1-2, en el que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia espectral de paso bajo, θsuave de las tramas pasadas.
-
- 4.
- El método de acuerdo con la reivindicación 1, en el que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.
-
- 5.
- Un método de post filtrado para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el método que comprende los pasos de:
-recibir (404) un coeficiente determinado a un parámetro de control de atenuación de post filtro desde un control de post filtro, en el que el coeficiente se determina en base a una estacionariedad medida de una señal de habla, la estacionariedad que se mide determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en un descodificador, y-procesar (405) la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales. -
- 6.
- El método de acuerdo con la reivindicación 5, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.
-
- 7.
- El método de acuerdo con cualquiera de las reivindicaciones 5-6, en el que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia espectral de paso bajo, θsuave de las tramas pasadas.
-
- 8.
- El método de acuerdo con la reivindicación 5, en el que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.
-
- 9.
- Un control de post filtro (300) a ser asociado con un post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el control de post filtro comprende medios para medir la estacionariedad
(301) de una señal de habla determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en un descodificador, medios para determinar (302) un coeficiente a un parámetro de control de atenuación de post filtro en base a la estacionariedad medida, y medios para transmitir (303) el coeficiente determinado a un post filtro, de manera que el post filtro pueda procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales lineales. -
- 10.
- El control de post filtro de acuerdo con la reivindicación 9, en el que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.
-
- 11.
- El control de post filtro de acuerdo con cualquiera de las reivindicaciones 9-10, en el que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia espectral de paso bajo, θsuave de las tramas pasadas.
-
- 12.
- El control de post filtro de acuerdo con la reivindicación 9, en el que el parámetro de control de atenuación de
6post filtro es una función de una correlación de tono normalizado. - 13. Una adaptación que comprende un post filtro (304) y un control de post filtro para mejorar la calidad percibida de habla reconstruida en un descodificador de habla, el post filtro comprende medios para recibir (306) un coeficiente determinado a un parámetro de control de atenuación de post filtro desde un control de post filtro, en el que el 5 coeficiente se determina en base a una estacionariedad medida de una señal de habla, la estacionariedad, que se mide determinando una distancia espectral entre tramas adyacentes de la señal de habla reconstruida en un descodificador, y un procesador (305) para procesar la señal de habla reconstruida aplicando el coeficiente determinado al parámetro de control de atenuación de post filtro para obtener una señal de habla mejorada, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales10 lineales.
-
- 14.
- El post filtro de acuerdo con la reivindicación 13, en la que la distancia espectral entre tramas adyacentes se determina como una distancia de frecuencias espectrales de inmitancia.
-
- 15.
- El post filtro de acuerdo con cualquiera de las reivindicaciones 13-14, en la que el coeficiente determinado es una combinación lineal de un primer parámetro que es una medida de la distancia espectral entre la trama actual y la
15 previa y un segundo parámetro que es una medida de lo lejos que está dicha distancia espectral a una distancia espectral de paso bajo, θsuave, de las tramas pasadas. - 16. El post filtro de acuerdo con la reivindicación 13, en la que el parámetro de control de atenuación de post filtro es una función de una correlación de tono normalizado.7
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US89267007P | 2007-03-02 | 2007-03-02 | |
US892670P | 2007-03-02 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2533626T3 true ES2533626T3 (es) | 2015-04-13 |
Family
ID=39027449
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES12183033.5T Active ES2533626T3 (es) | 2007-03-02 | 2007-11-01 | Métodos y adaptaciones en una red de telecomunicaciones |
ES07822142T Active ES2394515T3 (es) | 2007-03-02 | 2007-11-01 | Métodos y adaptaciones en una red de telecomunicaciones |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES07822142T Active ES2394515T3 (es) | 2007-03-02 | 2007-11-01 | Métodos y adaptaciones en una red de telecomunicaciones |
Country Status (9)
Country | Link |
---|---|
US (3) | US20100145692A1 (es) |
EP (2) | EP2535894B1 (es) |
JP (1) | JP5291004B2 (es) |
CN (1) | CN101622668B (es) |
DK (1) | DK2535894T3 (es) |
ES (2) | ES2533626T3 (es) |
MX (1) | MX2009008055A (es) |
PL (1) | PL2535894T3 (es) |
WO (1) | WO2008107027A1 (es) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2929090C (en) * | 2010-07-02 | 2017-03-14 | Dolby International Ab | Selective bass post filter |
JP2013073230A (ja) * | 2011-09-29 | 2013-04-22 | Renesas Electronics Corp | オーディオ符号化装置 |
CN105122358B (zh) * | 2013-01-29 | 2019-02-15 | 弗劳恩霍夫应用研究促进协会 | 用于处理编码信号的装置和方法与用于产生编码信号的编码器和方法 |
US9978392B2 (en) * | 2016-09-09 | 2018-05-22 | Tata Consultancy Services Limited | Noisy signal identification from non-stationary audio signals |
ES2995244T3 (en) * | 2020-04-24 | 2025-02-07 | Ericsson Telefon Ab L M | Low cost adaptation of bass post-filter |
CN115188388B (zh) * | 2022-07-11 | 2024-05-17 | 北京百瑞互联技术股份有限公司 | 一种音频后置滤波方法、装置、存储介质及设备 |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3035565A1 (de) * | 1980-09-20 | 1982-05-06 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren zur nichtlinearen zeitanpassung von signalverlaeufen |
JP2595495B2 (ja) * | 1982-09-03 | 1997-04-02 | 日本電気株式会社 | パタンマッチング装置 |
US4624008A (en) * | 1983-03-09 | 1986-11-18 | International Telephone And Telegraph Corporation | Apparatus for automatic speech recognition |
JPH0727398B2 (ja) * | 1985-02-12 | 1995-03-29 | 日本電気株式会社 | 定数可変型聴感的重み付けフイルタ |
CA1299750C (en) * | 1986-01-03 | 1992-04-28 | Ira Alan Gerson | Optimal method of data reduction in a speech recognition system |
US5533052A (en) * | 1993-10-15 | 1996-07-02 | Comsat Corporation | Adaptive predictive coding with transform domain quantization based on block size adaptation, backward adaptive power gain control, split bit-allocation and zero input response compensation |
US5715372A (en) * | 1995-01-10 | 1998-02-03 | Lucent Technologies Inc. | Method and apparatus for characterizing an input signal |
US5774849A (en) * | 1996-01-22 | 1998-06-30 | Rockwell International Corporation | Method and apparatus for generating frame voicing decisions of an incoming speech signal |
SE506034C2 (sv) * | 1996-02-01 | 1997-11-03 | Ericsson Telefon Ab L M | Förfarande och anordning för förbättring av parametrar representerande brusigt tal |
JP4307557B2 (ja) * | 1996-07-03 | 2009-08-05 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 音声活性度検出器 |
JP3675054B2 (ja) * | 1996-09-24 | 2005-07-27 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置、並びに音声復号化方法 |
JPH10116097A (ja) * | 1996-10-11 | 1998-05-06 | Olympus Optical Co Ltd | 音声再生装置 |
US6075475A (en) * | 1996-11-15 | 2000-06-13 | Ellis; Randy E. | Method for improved reproduction of digital signals |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
US5987406A (en) * | 1997-04-07 | 1999-11-16 | Universite De Sherbrooke | Instability eradication for analysis-by-synthesis speech codecs |
FR2764469B1 (fr) * | 1997-06-09 | 2002-07-12 | France Telecom | Procede et dispositif de traitement optimise d'un signal perturbateur lors d'une prise de son |
JP3601653B2 (ja) * | 1998-03-18 | 2004-12-15 | 富士通株式会社 | 情報検索装置および方法 |
US6556967B1 (en) * | 1999-03-12 | 2003-04-29 | The United States Of America As Represented By The National Security Agency | Voice activity detector |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US6633845B1 (en) * | 2000-04-07 | 2003-10-14 | Hewlett-Packard Development Company, L.P. | Music summarization system and method |
US6959056B2 (en) * | 2000-06-09 | 2005-10-25 | Bell Canada | RFI canceller using narrowband and wideband noise estimators |
JP4053424B2 (ja) * | 2001-01-17 | 2008-02-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ロバスト・チェックサム |
US7010052B2 (en) * | 2001-04-16 | 2006-03-07 | The Ohio University | Apparatus and method of CTCM encoding and decoding for a digital communication system |
US6941263B2 (en) * | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
FR2835125B1 (fr) * | 2002-01-24 | 2004-06-18 | Telediffusion De France Tdf | Procede d'evaluation d'un signal audio numerique |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
JP4689269B2 (ja) * | 2002-07-01 | 2011-05-25 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 静的スペクトルパワー依存型音響強調システム |
GB2392358A (en) * | 2002-08-02 | 2004-02-25 | Rhetorical Systems Ltd | Method and apparatus for smoothing fundamental frequency discontinuities across synthesized speech segments |
FI20021936A7 (fi) * | 2002-10-31 | 2004-05-01 | Nokia Corp | Vaihtuvanopeuksinen puhekoodekki |
CA2415105A1 (en) * | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
CN1757060B (zh) * | 2003-03-15 | 2012-08-15 | 曼德斯必德技术公司 | Celp语音编码的话音指数控制 |
WO2004086967A1 (en) * | 2003-03-26 | 2004-10-14 | Biotechplex Corporation | Instantaneous autonomic nervous function and cardiac predictability based on heart and pulse rate variability analysis |
US7363221B2 (en) * | 2003-08-19 | 2008-04-22 | Microsoft Corporation | Method of noise reduction using instantaneous signal-to-noise ratio as the principal quantity for optimal estimation |
GB0326263D0 (en) * | 2003-11-11 | 2003-12-17 | Nokia Corp | Speech codecs |
FI118835B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
CN1677493A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
NZ553385A (en) * | 2004-08-09 | 2010-06-25 | Nielsen Co Us Llc | Methods and apparatus to monitor audio/visual content from various sources |
KR100631608B1 (ko) * | 2004-11-25 | 2006-10-09 | 엘지전자 주식회사 | 음성 판별 방법 |
EP1686561B1 (en) * | 2005-01-28 | 2012-01-04 | Honda Research Institute Europe GmbH | Determination of a common fundamental frequency of harmonic signals |
KR101168466B1 (ko) * | 2005-04-21 | 2012-07-26 | 에스알에스 랩스, 인크. | 오디오 잡음을 감소시키는 시스템 및 방법 |
EP1897085B1 (en) * | 2005-06-18 | 2017-05-31 | Nokia Technologies Oy | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
CN101263734B (zh) * | 2005-09-02 | 2012-01-25 | 丰田自动车株式会社 | 麦克风阵列用后置滤波器 |
US9245532B2 (en) * | 2008-07-10 | 2016-01-26 | Voiceage Corporation | Variable bit rate LPC filter quantizing and inverse quantizing device and method |
-
2007
- 2007-11-01 JP JP2009551925A patent/JP5291004B2/ja active Active
- 2007-11-01 EP EP12183033.5A patent/EP2535894B1/en active Active
- 2007-11-01 EP EP07822142A patent/EP2115742B1/en active Active
- 2007-11-01 WO PCT/EP2007/061796 patent/WO2008107027A1/en active Application Filing
- 2007-11-01 MX MX2009008055A patent/MX2009008055A/es active IP Right Grant
- 2007-11-01 CN CN2007800519702A patent/CN101622668B/zh active Active
- 2007-11-01 ES ES12183033.5T patent/ES2533626T3/es active Active
- 2007-11-01 PL PL12183033T patent/PL2535894T3/pl unknown
- 2007-11-01 ES ES07822142T patent/ES2394515T3/es active Active
- 2007-11-01 DK DK12183033T patent/DK2535894T3/en active
- 2007-11-10 US US12/529,391 patent/US20100145692A1/en not_active Abandoned
-
2013
- 2013-01-21 US US13/746,143 patent/US8731917B2/en active Active
-
2014
- 2014-05-15 US US14/278,934 patent/US9076453B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP2115742B1 (en) | 2012-09-12 |
PL2535894T3 (pl) | 2015-06-30 |
US20140249808A1 (en) | 2014-09-04 |
US9076453B2 (en) | 2015-07-07 |
WO2008107027A1 (en) | 2008-09-12 |
CN101622668A (zh) | 2010-01-06 |
JP5291004B2 (ja) | 2013-09-18 |
US8731917B2 (en) | 2014-05-20 |
EP2535894B1 (en) | 2015-01-07 |
EP2535894A1 (en) | 2012-12-19 |
JP2010520503A (ja) | 2010-06-10 |
CN101622668B (zh) | 2012-05-30 |
EP2115742A1 (en) | 2009-11-11 |
DK2535894T3 (en) | 2015-04-13 |
US20100145692A1 (en) | 2010-06-10 |
MX2009008055A (es) | 2009-08-18 |
US20130132075A1 (en) | 2013-05-23 |
ES2394515T3 (es) | 2013-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101540371B1 (ko) | 신호 분류 방법 및 장치, 및 인코딩/디코딩 방법 및 장치 | |
EP2517202B1 (en) | Method and device for speech bandwidth extension | |
US20060116874A1 (en) | Noise-dependent postfiltering | |
US20100228557A1 (en) | Method and apparatus for audio decoding | |
WO2018069900A1 (en) | Audio-system and method for hearing-impaired | |
ES2533626T3 (es) | Métodos y adaptaciones en una red de telecomunicaciones | |
WO2010127616A1 (en) | System and method for frequency domain audio post-processing based on perceptual masking | |
US20190189137A1 (en) | Apparatus and method for encoding an audio signal using a compensation value | |
ES2376178T3 (es) | Post-tratamiento de reducción del ruido de cuantificación de un codificador en la decodificación. | |
WO2008101324A1 (en) | High-frequency bandwidth extension in the time domain | |
EP2202726B1 (en) | Method and apparatus for judging dtx | |
ES2978878T3 (es) | Extensión de banda de frecuencia mejorada en un decodificador de señales de audiofrecuencia | |
EP2774148B1 (en) | Bandwidth extension of audio signals | |
ES2741009T3 (es) | Codificador de audio y método para codificar una señal de audio | |
KR102110284B1 (ko) | 한국어 특성 기반의 청력 검사 장치 및 방법 | |
Jokinen et al. | Comparison of post-filtering methods for intelligibility enhancement of telephone speech | |
ES2995244T3 (en) | Low cost adaptation of bass post-filter | |
Bouchard et al. | A perceptual Post Filter for Wideband Speech and Audio ACELP Codecs | |
Jokinen et al. | Utilization of the Lombard effect in post-filtering for intelligibility enhancement of telephone speech. | |
Boillot et al. | A loudness enhancement technique for speech | |
Yoon et al. | Improvement of Speech Intelligibility in Noisy Environments |