ES2777282T3 - Extensión de ancho de banda armónico de señales de audio - Google Patents
Extensión de ancho de banda armónico de señales de audio Download PDFInfo
- Publication number
- ES2777282T3 ES2777282T3 ES15706610T ES15706610T ES2777282T3 ES 2777282 T3 ES2777282 T3 ES 2777282T3 ES 15706610 T ES15706610 T ES 15706610T ES 15706610 T ES15706610 T ES 15706610T ES 2777282 T3 ES2777282 T3 ES 2777282T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- band
- low
- linear processing
- processing function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 98
- 230000006870 function Effects 0.000 claims abstract description 165
- 238000012545 processing Methods 0.000 claims abstract description 137
- 238000000034 method Methods 0.000 claims abstract description 50
- 230000004044 response Effects 0.000 claims abstract description 17
- 230000003595 spectral effect Effects 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 5
- 230000000737 periodic effect Effects 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 13
- 238000012886 linear function Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/81—Detection of presence or absence of voice signals for discriminating voice from music
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Un procedimiento que comprende: separar, en un dispositivo, una señal de audio de entrada en al menos una señal de banda baja y una señal de banda alta, con la señal de banda baja correspondiente a un rango de frecuencias de banda baja y la señal de banda alta correspondiente a un rango de frecuencias de banda alta (402); determinar un parámetro que indica una característica de la señal de banda baja; seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal basándose en el parámetro (404); generar una primera señal extendida basándose en la señal de banda baja y la función de procesamiento no lineal (406); generar al menos un parámetro de ajuste basándose en la primera señal extendida, la señal de banda alta (408), o ambas, para multiplexar en un flujo de bits de salida; caracterizado por que la selección de la función de procesamiento no lineal comprende, seleccionar una primera función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal en respuesta a la determinación de que el parámetro asociado con una trama de la señal de audio de entrada satisface una primera condición, y seleccionar una segunda función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal en respuesta a la determinación de que el parámetro satisface una segunda condición.
Description
DESCRIPCIÓN
Extensión de ancho de banda armónico de señales de audio
I. Reivindicación de prioridad
[0001] La presente solicitud reivindica prioridad de la solicitud provisional de Estados Unidos n.° 61/939 585 presentada el 13 de febrero de 2014. y la solicitud no provisional de Estados Unidos n.° 14/617 524 presentada el 9 de febrero de 2015, ambas tituladas "HARMONIO BANDWIDTH EXTENSION OF AUDIO SIGNALS [EXTENSIÓN DE ANCHO DE BANDA ARMÓNICO DE SEÑALES DE AUDIO]".
II. Campo
[0002] La presente divulgación se refiere en general a extensión de ancho de banda armónico de señales de audio.
III. Descripción de la técnica relacionada
[0003] Los avances en la tecnología han dado como resultado dispositivos informáticos más pequeños y más potentes. Por ejemplo, existe actualmente una variedad de dispositivos informáticos personales portátiles, incluyendo dispositivos informáticos inalámbricos, tales como teléfonos inalámbricos portátiles, asistentes digitales personales (PDA) y dispositivos de radiolocalización que son pequeños, ligeros y fáciles de transportar por los usuarios. Más específicamente, los teléfonos inalámbricos portátiles, tales como los teléfonos móviles y los teléfonos de Protocolo de Internet (IP), pueden transmitir paquetes de voz y datos a través de redes inalámbricas. Además, muchos de dichos teléfonos inalámbricos incluyen otros tipos de dispositivos que están incorporados en los mismos. Por ejemplo, un teléfono inalámbrico también puede incluir una cámara fotográfica digital, una cámara de vídeo digital, un grabador digital y un reproductor de ficheros de audio.
[0004] En los sistemas telefónicos tradicionales (por ejemplo, las redes telefónicas conmutadas públicas (PSTN)), el ancho de banda de la señal está limitado al rango de frecuencias de 300 hercios (Hz) a 3,4 kilohercios (kHz). En aplicaciones de banda ancha (WB), tales como la telefonía móvil y voz sobre protocolo de Internet (VoIP), el ancho de banda de señal puede abarcar el rango de frecuencias de 50 Hz a 7 kHz. Las técnicas de codificación de superbanda ancha (SWB) admiten un ancho de banda que se extiende hasta aproximadamente 16 kHz. La extensión del ancho de banda de señal desde la telefonía de banda estrecha a 3,4 kHz hasta la telefonía SWB de 16 kHz puede mejorar la calidad de la reconstrucción, la inteligibilidad y la naturalidad de la señal.
[0005] Las técnicas de codificación de SWB típicamente implican codificar y transmitir la parte de frecuencias más bajas de la señal (por ejemplo, de 50 Hz a 7 kHz, también denominada "banda baja"). Por ejemplo, la banda baja se puede representar usando parámetros de filtro y/o una señal de excitación de banda baja. Con el fin de mejorar la eficiencia de codificación, es posible que la parte de frecuencia superior de la señal (por ejemplo, de 7 kHz a 16 kHz, también denominada la "banda alta") no se codifique y transmita completamente. Un receptor puede utilizar modelado de señal para generar una señal de banda alta sintetizada. En algunas implementaciones, los datos asociados a la banda alta pueden proporcionarse al receptor para facilitar la síntesis de banda alta. Tales datos pueden denominarse "información lateral" y pueden incluir información de ganancia, frecuencias espectrales de línea (LSF, también denominadas pares espectrales de línea (LSP)), etc. La información lateral puede generarse comparando la banda alta y una señal de banda alta sintetizada obtenidas de la banda baja. Por ejemplo, la señal de banda alta sintetizada puede basarse en la señal de banda baja y una función no lineal. Se puede usar una única función no lineal para generar la señal de banda alta sintetizada para señales de banda baja que tienen características distintas. La aplicación de la misma función no lineal para señales que tienen características distintas puede dar como resultado la generación de una señal de banda alta sintetizada de baja calidad en ciertas situaciones (por ejemplo, voz frente a música). Como resultado, la señal de banda alta sintetizada puede estar débilmente correlacionada con la señal de banda alta. El documento de patente WO2006/116025 enseña el uso de una función no lineal para crear una señal de excitación de banda alta.
IV. Sumario
[0006] Se divulgan sistemas y procedimientos para la extensión de ancho de banda armónico de las señales de audio. Un codificador puede usar una parte de banda baja de una señal de audio para generar información (por ejemplo, parámetros de ajuste) utilizada para reconstruir una parte de banda alta de la señal de audio en un descodificador. Por ejemplo, el codificador puede extender la parte de banda baja de la señal de audio basándose en las características de la parte de banda baja. La parte extendida de banda baja puede tener un ancho de banda mayor que la parte de banda baja. El codificador puede determinar los parámetros de ajuste basándose en la parte de banda baja extendida y la parte de banda alta.
[0007] El codificador puede utilizar una función de procesamiento no lineal seleccionada para generar la parte de banda baja extendida. La función de procesamiento no lineal puede seleccionarse a partir de una pluralidad de funciones de procesamiento no lineal basadas en las características de la parte de banda baja de la señal de audio.
La señal de audio puede corresponder a una trama o un paquete de audio particular. Si la parte de banda baja indica que la señal de audio es muy periódica (por ejemplo, tiene componentes armónicos intensos y/o corresponde a voz), el codificador de señal puede seleccionar una función no lineal de orden superior. Si la parte de banda baja indica que la señal de audio es muy ruidosa (por ejemplo, corresponde a música), el codificador de señal puede seleccionar una función no lineal de orden inferior. El codificador puede determinar los parámetros de ajuste basándose en una comparación de la banda alta y la parte de banda baja extendida.
[0008] Un descodificador puede recibir datos de banda baja y los parámetros de ajuste desde el codificador. El descodificador puede generar una señal de banda baja sintetizada basándose en los datos de banda baja. El descodificador puede generar una parte de banda baja extendida sintetizada basándose en la señal de banda baja sintetizada y una función de procesamiento no lineal seleccionada. El descodificador puede generar una señal de banda alta sintetizada basándose en la parte de banda baja extendida sintetizada y los parámetros de ajuste. Se puede generar una señal de salida combinando la señal de banda baja sintetizada y la señal de banda alta sintetizada en el descodificador. La invención se define mediante las reivindicaciones. De aquí en adelante, donde la expresión "modo(s) de realización" se usa para referirse a combinaciones de características no cubiertas por el alcance de las reivindicaciones adjuntas, estas combinaciones de características representan ejemplos que se presentan solo con fines ilustrativos.
[0009] En un modo de realización particular, un procedimiento incluye separar, en un dispositivo, una señal de audio de entrada en al menos una señal de banda baja y una señal de banda alta. La señal de banda baja corresponde a un rango de frecuencias de banda baja y la señal de banda alta corresponde a un rango de frecuencias de banda alta. El procedimiento también incluye seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal. El procedimiento incluye además generar una primera señal extendida basándose en la señal de banda baja y la función de procesamiento no lineal. El procedimiento también incluye generar al menos un parámetro de ajuste basándose en la primera señal extendida, la señal de banda alta o ambas.
[0010] En otro modo de realización particular, un procedimiento incluye la recepción, en un dispositivo, datos de baja banda correspondientes a al menos una señal de banda baja de una señal de audio de entrada. El procedimiento también incluye descodificar los datos de banda baja para generar una señal de audio de banda baja sintetizada. El procedimiento incluye además seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal. El procedimiento también incluye generar una señal de audio de banda alta sintetizada basándose en la señal de audio de banda baja sintetizada y la función de procesamiento no lineal.
[0011] En otro modo de realización particular, un aparato incluye un procesador y una memoria. El procesador está configurado para separar una señal de audio de entrada en al menos una señal de banda baja y una señal de banda alta. La señal de banda baja corresponde a un rango de frecuencias de banda baja y la señal de banda alta corresponde a un rango de frecuencias de banda alta. El procesador también está configurado para seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal. El procesador está configurado además para generar una primera señal extendida basándose en la señal de banda baja y la función de procesamiento no lineal. El procesador también está configurado para generar al menos un parámetro de ajuste basándose en la primera señal extendida, la señal de banda alta o ambas.
[0012] En otro modo de realización particular, un aparato incluye un procesador y una memoria. El procesador está configurado para recibir datos de banda baja correspondientes a al menos una señal de banda baja de una señal de audio de entrada. El procesador también está configurado para descodificar los datos de banda baja para generar una señal de audio de banda baja sintetizada. El procesador está configurado además para seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal. El procesador también está configurado para generar una señal de audio de banda alta sintetizada basándose en la señal de audio de banda baja sintetizada y la función de procesamiento no lineal.
[0013] En otro modo de realización particular, un dispositivo de almacenamiento legible por ordenador almacena instrucciones que, cuando son ejecutadas por un procesador, hacen que el procesador realice operaciones incluyendo la separación de una señal de audio de entrada en al menos una señal de banda baja y una señal de banda alta. La señal de banda baja corresponde a un rango de frecuencias de banda baja y la señal de banda alta corresponde a un rango de frecuencias de banda alta. Las operaciones también incluyen seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal. Las operaciones incluyen además generar una primera señal extendida basándose en la señal de banda baja y la función de procesamiento no lineal. Las operaciones también incluyen generar al menos un parámetro de ajuste basándose en la primera señal extendida, la señal de banda alta o ambas.
[0014] En otro modo de realización particular, un dispositivo de almacenamiento legible por ordenador almacena instrucciones que, cuando son ejecutadas por un procesador, hacen que el procesador realice operaciones incluyendo la recepción de datos de baja banda correspondiente a al menos una señal de banda baja de una señal de audio de entrada. Las operaciones también incluyen descodificar los datos de banda baja para generar una señal de audio de banda baja sintetizada. Las operaciones incluyen además seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal. Las operaciones también incluyen generar una señal de audio de
banda alta sintetizada basándose en la señal de audio de banda baja sintetizada y la función de procesamiento no lineal.
[0015] Las ventajas particulares proporcionadas por al menos uno de los modos de realización descritos pueden incluir la mejora de la calidad de una parte de banda alta sintetizada de una señal de salida. La calidad de la señal de salida puede mejorarse generando la parte de banda alta sintetizada usando una función no lineal seleccionada de múltiples funciones de procesamiento no lineal disponibles basándose en las características de audio de una parte de banda baja. La función no lineal seleccionada puede mejorar la correlación entre una parte de banda alta de una señal de entrada en un codificador y la parte de banda alta sintetizada de la señal de salida en el descodificador, tanto en situaciones de voz como sin voz (por ejemplo, música). Otros aspectos, ventajas y características de la presente divulgación resultarán evidentes después de revisar la solicitud, que incluye las siguientes secciones: Breve descripción de los dibujos, Descripción detallada y Reivindicaciones.
V. Breve descripción de los dibujos
[0016]
La FIG. 1 es un diagrama para ilustrar un modo de realización particular de un sistema de codificador que se puede hacer funcionar para realizar la extensión de ancho de banda armónico de señales de audio;
la FIG. 2 es un diagrama de otro modo de realización particular de un sistema de descodificador que se puede hacer funcionar para realizar una extensión de ancho de banda armónico de señales de audio;
la FIG. 3 es un diagrama de otro modo de realización particular de un sistema que se puede hacer funcionar para realizar extensión de ancho de banda armónico de señales de audio;
la FIG. 4 es un diagrama de flujo para ilustrar un modo de realización particular de un procedimiento de realización de extensión de ancho de banda armónico de señales de audio;
la FIG. 5 es un diagrama de flujo para ilustrar otro modo de realización particular de un procedimiento de realización de extensión de ancho de banda armónico de señales de audio; y
la FIG. 6 es un diagrama de bloques de un dispositivo inalámbrico operativo para realizar operaciones de procesamiento de señales de acuerdo con los sistemas y procedimientos de las FIGS. 1-5.
VI. Descripción detallada
[0017] Haciendo referencia a la FIG. 1, se muestra un diagrama de un modo de realización particular de un sistema de codificador que se puede hacer funcionar para realizar una extensión de ancho de banda armónico de señales de audio y en general se designa como 100. En un modo de realización particular, el sistema de codificador 100 puede estar integrado en un sistema o aparato de codificación (o descodificación) (por ejemplo, en un teléfono o codificador/descodificador (CODEC) inalámbrico). En otros modos de realización, el sistema de codificador 100 puede estar integrado en un descodificador, un reproductor de música, un reproductor de vídeo, una unidad de entretenimiento, un dispositivo de navegación, un dispositivo de comunicaciones, un asistente digital personal (PDA), una unidad de datos de localización fija o un ordenador.
[0018] Cabe destacar que, en la siguiente descripción, las diversas funciones realizadas por el sistema de codificador 100 de la FIG. 1 se describen como realizadas por ciertos componentes o módulos. Esta división de componentes y módulos es solo ilustrativa y no debe considerarse limitativa. En un modo de realización alternativo, una función realizada mediante un componente o módulo particular puede dividirse entre múltiples componentes o módulos. Además, en un modo de realización alternativo, dos o más componentes o módulos de la FIG. 1 pueden estar integrados en un único componente o módulo. Cada componente o módulo ilustrado en la FIG. 1 puede implementarse usando hardware (por ejemplo, un dispositivo de matriz de puertas programables in situ (FPGA), un circuito integrado específico de la aplicación (ASIC), un procesador de señales digitales (DSP), un controlador, etc.), software (por ejemplo, instrucciones ejecutables por un procesador), o cualquier combinación de los mismos.
[0019] El sistema de codificador 100 incluye un banco de análisis de filtro 110 acoplado a un codificador de banda baja 108, un estimador de armonicidad 106, un generador de señal 112, y un estimador de parámetros 190. El generador de señal 112 está acoplado a un filtro 114 y un mezclador 116. El generador de señal 112 puede incluir un selector de función 180.
[0020] Durante el funcionamiento, el banco de filtros de análisis 110 puede recibir una señal de audio de entrada 102. Por ejemplo, se puede proporcionar la señal de audio de entrada 102 mediante un micrófono u otro dispositivo de entrada. La señal de audio de entrada 102 puede incluir voz, ruido, música o una combinación de los mismos. La señal de audio 102 puede ser una señal de superbanda ancha (SWB) que incluya datos en el rango de frecuencias de aproximadamente 50 hercios (Hz) a aproximadamente 16 kilohercios (kHz). El banco de filtros de análisis 110
puede separar la señal de audio de entrada 102 en múltiples partes basándose en la frecuencia. Por ejemplo, el banco de filtros de análisis 110 puede separar la señal de audio de entrada 102 en al menos una señal de banda baja 122 y una señal de banda alta 124. En un modo de realización particular, el banco de filtros de análisis 110 puede incluir un conjunto de bancos de filtros de análisis. El conjunto de bancos de filtros de análisis puede separar la señal de audio de entrada 102 en al menos la señal de banda baja 122 y la señal de banda alta 124. En un modo de realización particular, el banco de filtros de análisis 110 puede generar más de dos salidas.
[0021] En el ejemplo de la FIG. 1, la señal de banda baja 122 y la señal de banda alta 124 ocupan bandas de frecuencias no superpuestas. Por ejemplo, la señal de banda baja 122 y la señal de banda alta 124 pueden ocupar bandas de frecuencias no superpuestas de 50 Hz7 kHz y 7 kHz16 kHz, respectivamente. En un modo de realización alternativo, la señal de banda baja 122 y la señal de banda alta 124 pueden ocupar bandas de frecuencias no superpuestas de 50 Hz - 8 kHz y 8 kHz - 16 kHz, respectivamente. En otro modo de realización alternativo, la señal de banda baja 122 y la señal de banda alta 124 se superponen (por ejemplo, 50 Hz - 8 kHz y 7 kHz - 16 kHz, respectivamente), lo cual puede permitir que un filtro de paso bajo y un filtro de paso alto del banco de filtros de análisis 110 tengan una atenuación progresiva suave, lo cual puede simplificar el diseño y reducir el coste del filtro de paso bajo y del filtro de paso alto. La superposición de la señal de banda baja 122 y de la señal de banda alta 124 también puede permitir un mezclado suave de señales de banda baja y de banda alta en un receptor, lo cual puede dar como resultado menos artefactos audibles.
[0022] Cabe señalar que, aunque el ejemplo de la FIG. 1 ilustra el procesamiento de una señal SWB, esto es solo para ilustración y no debe considerarse limitativo. En un modo de realización alternativo, la señal de audio de entrada 102 puede ser una señal de banda ancha (WB) que tiene un rango de frecuencias desde aproximadamente 50 Hz hasta aproximadamente 8 kHz. En dicho modo de realización, la señal de banda baja 122 puede corresponder a un rango de frecuencias desde aproximadamente 50 Hz hasta aproximadamente 6,4 kHz y la señal de banda alta 124 puede corresponder a un rango de frecuencias desde aproximadamente 6,4 kHz hasta aproximadamente 8 kHz.
[0023] El banco de filtros de análisis 110 puede proporcionar la señal de banda baja 122 al codificador de banda baja 108 y puede proporcionar la señal de banda alta 124 al estimador de parámetros 190. El estimador de parámetros 190 puede configurarse para comparar una primera señal extendida 182 y la señal de banda alta 124 para generar uno o más parámetros de ajuste 178, como se describe en el presente documento. El sistema de codificador 100 puede generar la primera señal extendida 182 basándose en la señal de banda baja 122 y una función de procesamiento no lineal seleccionada, como se describe en el presente documento. El mezclador 116 puede configurarse para generar la primera señal extendida 182 modulando una segunda señal extendida 172 usando una señal de ruido 176. El filtro 114 puede configurarse para generar la segunda señal extendida 172 filtrando una tercera señal extendida 174 desde el generador de señal 112.
[0024] El codificador de banda baja 108 puede recibir la señal de banda baja 122 del banco de filtros de análisis 110 y puede generar parámetros de banda baja 168. Los parámetros de banda baja 168 pueden indicar características de la señal de banda baja 122. Los parámetros de banda baja 168 pueden incluir valores asociados con la inclinación espectral, ganancia de tono, retraso, modo de voz, o una combinación de los mismos, de la señal de banda baja 122.
[0025] La inclinación espectral se puede referir a la forma de la envolvente espectral sobre una banda de paso y puede representarse mediante un primer coeficiente de reflexión cuantificado. Para los sonidos sonoros, una energía espectral puede disminuir con el aumento de la frecuencia, de tal manera que el primer coeficiente de reflexión es negativo y puede aproximarse a -1. Los sonidos sordos pueden tener un espectro que es plano, de tal manera que el primer coeficiente de reflexión es cercano a cero, o bien tiene más energía a altas frecuencias, de tal manera que el primer coeficiente de reflexión es positivo y puede aproximarse a 1.
[0026] El modo de voz (también llamado modo de sonoridad) puede indicar si una trama de audio asociada con la señal de banda baja 122 representa sonido sonoro o sordo. Un parámetro de modo de voz puede tener un valor binario basado en una o más medidas de periodicidad (por ejemplo, cruces por cero, funciones de autocorrelación normalizadas (NACF), ganancia de tono, etc.) y/o actividad de voz para la trama de audio, tal como una relación entre dicha medida y un valor de umbral. En otras implementaciones, el parámetro de modo de voz puede tener uno o más de otros estados diferentes para indicar modos tales como silencio o ruido de fondo, o una transición entre silencio y voz sonora. El codificador de banda baja 108 puede proporcionar los parámetros de banda baja 168 al generador de señal 112.
[0027] En un modo de realización particular, el generador de señal 112 puede generar la señal de banda baja 122 basándose en los parámetros de banda baja 168. Por ejemplo, el generador de señal 112 puede incluir un descodificador local (o un emulador de descodificador). El descodificador local puede emular el comportamiento de un descodificador en un dispositivo receptor. Por ejemplo, el descodificador local puede estar configurado para descodificar los parámetros de banda baja 168 para generar la señal de banda baja 122. En un modo de realización alternativo, el generador de señal 112 puede recibir la señal de banda baja 122 del banco de filtros de análisis 110.
[0028] El selector de función 180 puede seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal disponibles 118. La pluralidad de funciones de procesamiento no lineal
disponibles 118 puede incluir una función de valor absoluto, una función de rectificación de onda completa, una función de rectificación de media onda, una función de cuadratura, una función de cubicación, una función de potencia de cuatro, una función de recorte o una combinación de los mismos.
[0029] El selector de función 180 puede seleccionar la función de procesamiento no lineal basándose en una característica de la señal de banda baja 122. Para ilustrar, el selector de función 180 puede determinar un valor de la característica basándose en los parámetros de banda baja 168 o la señal de banda baja 122. Un factor de ruido puede indicar una periodicidad de una trama de audio correspondiente a la señal de banda baja 122. Por ejemplo, el factor de ruido puede corresponder a ganancia de tono, modo de voz, inclinación espectral, NACF, cruces por cero o una combinación de los mismos, asociados con la señal de banda baja 122. Si el factor de ruido satisface un primer umbral de ruido, el selector de función 180 puede seleccionar una primera función de procesamiento no lineal. Por ejemplo, si el factor de ruido indica que la señal de banda baja 122 es muy periódica (por ejemplo, corresponde a la voz), el selector de función 180 puede seleccionar una función de potencia de alto orden (por ejemplo, una potencia de cuatro funciones). Si el factor de ruido satisface un segundo umbral de ruido, el selector de función 180 puede seleccionar una segunda función de procesamiento no lineal. Por ejemplo, si el factor de ruido indica que la señal de banda baja 122 no es muy periódica o es similar al ruido (por ejemplo, corresponde a la música), el selector de función 180 puede seleccionar una función de potencia de orden bajo (por ejemplo, una función de cuadratura).
[0030] En un modo de realización particular, el selector de función 180 puede seleccionar una función de procesamiento no lineal de la pluralidad de funciones de procesamiento disponibles no lineales 118 en una trama de audio por trama audio. Además, se pueden seleccionar diferentes funciones de procesamiento no lineal para tramas consecutivas de la señal de audio de entrada 102. Por lo tanto, el selector de función 180 puede seleccionar una primera función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal en respuesta a la determinación de que un parámetro asociado con una primera trama de audio satisface una primera condición, y puede seleccionar una segunda función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal en respuesta a la determinación de que un parámetro asociado con una segunda trama de audio satisface una segunda condición. Como ejemplo ilustrativo, se puede aplicar una función de procesamiento no lineal diferente cuando la señal de audio de entrada 102 corresponde a la voz durante una llamada telefónica que cuando la señal de audio de entrada 102 corresponde a la música en espera durante la llamada telefónica. En un modo de realización particular, el parámetro asociado con la trama es uno de un modo de codificación elegido para codificar la señal de banda baja, una periodicidad de la trama, una cantidad de ruido no periódico en la trama y una inclinación espectral correspondiente a la trama.
[0031] El generador de señal 112 se puede extender armónicamente un espectro de la señal de banda baja 122 para incluir un intervalo de frecuencia superior (por ejemplo, un rango de frecuencias correspondiente a la señal de banda alta 124). Por ejemplo, el generador de señal 112 puede aumentar la muestra de la señal de banda baja 122. La señal de banda baja 122 puede muestrearse para reducir el alias al aplicar la función de procesamiento no lineal seleccionada. En un modo de realización particular, el generador de señal 112 puede aumentar la muestra de la señal de banda baja 122 en un factor particular (por ejemplo, 8). En un modo de realización particular, la operación de muestreo ascendente puede incluir rellenar a cero la señal de banda baja 122. El generador de señal 112 puede generar la tercera señal extendida 174 aplicando la función de procesamiento no lineal seleccionada a la señal muestreada de forma ascendente.
[0032] El filtro 114 puede recibir la tercera señal extendida 174 del generador de señal 112. El filtro 114 puede generar la segunda señal extendida 172 filtrando la tercera señal extendida 174. Por ejemplo, el filtro 114 puede reducir la muestra de la tercera señal extendida 174 de manera que un rango de frecuencias (por ejemplo, 7 kHz - 16 kHz) de la segunda señal extendida 172 corresponda al rango de frecuencias asociado con las señales de banda alta 124. Para ilustrar, el filtro 114 puede aplicar una operación de filtrado de paso de banda (por ejemplo, paso alto) a la tercera señal extendida 174 para generar la segunda señal extendida 172. En un modo de realización particular, el filtro 114 puede aplicar una transformación lineal (por ejemplo, una transformada discreta de coseno (DCT)) a la tercera señal extendida 174 y puede seleccionar coeficientes de transformada correspondientes al rango de altas frecuencias (por ejemplo, 7 kHz - 16 kHz). El filtro 114 puede proporcionar la segunda señal extendida 172 al mezclador 116.
[0033] El mezclador 116 puede combinar la segunda señal extendida 172 y la señal de ruido 176. El mezclador 116 puede recibir la señal de ruido 176 de un generador de ruido (no mostrado). El generador de ruido puede configurarse para producir una señal de ruido pseudoaleatorio blanco de varianza unitaria. En un modo de realización particular, la señal de ruido 176 puede no ser blanca y puede tener una densidad de potencia que varía con la frecuencia. En un modo de realización particular, el generador de ruido puede configurarse para enviar la señal de ruido 176 como una función determinista que puede duplicarse en un descodificador de un dispositivo receptor. Por ejemplo, el generador de ruido puede configurarse para generar la señal de ruido 176 como una función determinista de los parámetros de banda baja 168.
[0034] El mezclador 116 puede combinar una primera proporción de la señal de ruido 176 y una segunda parte de la segunda señal ampliada 172. Por ejemplo, el mezclador 116 puede generar la primera señal extendida 182 para tener una relación de energía armónica a energía de ruido similar a la de la señal de banda alta 124. El mezclador 116 puede determinar la primera proporción y la segunda proporción basándose en un factor de armonicidad 170. Por
ejemplo, la primera proporción puede ser mayor que la segunda proporción si el factor de armonicidad 170 indica que la señal de banda alta 124 está asociada con un sonido sordo (por ejemplo, música o ruido). Como otro ejemplo, la segunda proporción puede ser mayor que la primera proporción si el factor de armonicidad 170 indica que la señal de banda alta 124 está asociada con la voz sonora. En un modo de realización particular, el mezclador 116 puede determinar la primera proporción (o la segunda proporción) a partir del factor de armonicidad 170 y puede obtener la segunda proporción (o la primera proporción) de acuerdo con una ecuación, tal como
(la primera proporción)2 (la segunda proporción)2 = 1, (Ecuación 1).
[0035] De forma alternativa, el mezclador 116 puede seleccionar, basándose en el factor de armonicidad 170, un par correspondiente de las proporciones de una pluralidad de pares de proporciones, donde los pares se pre-calculan para satisfacer una relación de energía constate, tal como la ecuación (1). Los valores de la primera proporción pueden variar de 0,1 a 0,7 y los valores de la segunda proporción pueden variar de 0,7 a 1,0.
[0036] El estimador de armonicidad 106 puede determinar el factor de armonicidad 170 basado en una estimación de una característica (por ejemplo, la periodicidad) de la señal de audio de entrada 102. En un modo de realización particular, el estimador de armonicidad 106 puede generar el factor de armonicidad 170 basado en al menos uno de la señal de banda alta 124 y los parámetros de banda baja 168. Por ejemplo, el estimador de armonicidad 106 puede determinar el factor de armonicidad 170 basado en las características (por ejemplo, periodicidad) de la señal de banda baja 122 indicadas por los parámetros de banda baja 168. Para ilustrar, el estimador de armonicidad 106 puede asignar un valor al factor de armonicidad 170 que es proporcional a la ganancia de tono. Como otro ejemplo, el estimador de armonicidad 106 puede determinar el factor de armonicidad 170 basando en el modo de voz. Para ilustrar, el factor de armonicidad 170 puede tener un primer valor en respuesta al modo de voz que indica audio sonoro (por ejemplo, voz) y puede tener un segundo valor en respuesta al modo de voz que indica audio sonoro (por ejemplo, música).
[0037] Como otro ejemplo, el estimador de armonicidad 106 puede determinar el factor de armonicidad 170 basado en las características (por ejemplo, la periodicidad) de la señal de banda alta 124. Para ilustrar, el estimador de armonicidad 106 puede determinar el factor de armonicidad 170 basado en un valor máximo de un coeficiente de autocorrelación de la señal de banda alta 124, donde la autocorrelación se realiza en un rango de búsqueda que incluye un retraso de un retraso de tono y no incluye un retraso de cero muestras. En un modo de realización particular, el estimador de armonicidad 106 puede generar parámetros de filtro de banda alta correspondientes a la señal de banda alta 124 y puede determinar las características de la señal de banda alta 124 basándose en los parámetros de filtro de banda alta.
[0038] En un modo de realización particular, el estimador armonicidad 106 puede determinar el factor de armonicidad 170 basado en otro indicador de periodicidad (por ejemplo, ganancia de tono) y un valor umbral. Por ejemplo, el estimador de armonicidad 106 puede realizar una operación de autocorrelación en la señal de banda alta 124 si la ganancia de tono indicada por los parámetros de banda baja 168 satisface un primer valor umbral (por ejemplo, mayor o igual a 0,5). Como otro ejemplo, el estimador de armonicidad 106 puede realizar la operación de autocorrelación si el modo de voz indica un estado particular (por ejemplo, voz sonora). El factor de armonicidad 170 puede tener un valor predeterminado si la ganancia de tono no satisface el primer valor umbral y/o si el modo de voz indica otros estados.
[0039] El estimador armonicidad 106 puede determinar el factor de armonicidad 170 basado en características distintas de, o además de, la periodicidad. Por ejemplo, el factor de armonicidad puede tener un valor diferente para las señales de voz que tienen un gran retraso de tono que para las señales de voz que tienen un pequeño retraso de tono. En un modo de realización particular, el estimador de armonicidad 106 puede determinar el factor de armonicidad 170 basado en una medida de energía de la señal de banda alta 124 en múltiplos de una frecuencia fundamental con respecto a una medida de energía de la señal de banda alta 124 en otros componentes de frecuencia.
[0040] El estimador de armonicidad 106 puede proporcionar el factor de armonicidad 170 al mezclador 116. El mezclador 116 puede generar la primera señal extendida 182 basada en el factor de armonicidad 170, como se describe en el presente documento. El mezclador 116 puede proporcionar la primera señal extendida 182 al estimador de parámetros 190.
[0041] El estimador de parámetros 190 puede generar los parámetros de ajuste 178 basándose en al menos una de la señal de banda alta 124 o la primera señal ampliada 182. Por ejemplo, el estimador de parámetros 190 puede generar los parámetros de ajuste 178 basados en una relación entre la señal de banda alta 124 y la primera señal extendida 182, tal como la diferencia o relación entre las energías de las dos señales. En un modo de realización particular, los parámetros de ajuste 178 pueden corresponder a uno o más parámetros de ajuste de ganancia que indican la diferencia o relación entre las energías de las dos señales. En un modo de realización alternativo, los parámetros de ajuste 178 pueden corresponder a un índice cuantificado de los parámetros de ajuste de ganancia. En un modo de realización particular, los parámetros de ajuste 178 pueden incluir parámetros de banda alta que indican características de la señal de banda alta 124. En un modo de realización particular, el estimador de parámetros 190
puede generar los parámetros de ajuste 178 basándose en la señal de banda alta 124 y no basándose en la primera señal extendida 182.
[0042] El estimador de parámetros 190 puede proporcionar los parámetros de ajuste 178 y el codificador de banda baja 108 puede proporcionar los parámetros de banda baja 168 a un multiplexor (MUX). El MUX puede multiplexar los parámetros de ajuste 178 y los parámetros de banda baja 168 para generar un flujo de bits de salida. El flujo de bits de salida puede representar una señal de audio codificada correspondiente a la señal de audio de entrada 102. Por ejemplo, el MUX puede configurarse para insertar los parámetros de ajuste 178 en una versión codificada de la señal de audio de entrada 102 para permitir el ajuste de ganancia durante la reproducción de la señal de audio de entrada 102. El flujo de bits de salida puede transmitirse (por ejemplo, por un canal alámbrico, inalámbrico u óptico) mediante un transmisor y/o almacenarse. En un dispositivo de recepción, un desmultiplexor (DEMUX), un descodificador de banda baja, un descodificador de banda alta y un banco de filtros pueden realizar operaciones inversas para generar una señal de audio (por ejemplo, una versión reconstruida de la señal de audio de entrada 102 que se proporciona a un altavoz o a otro dispositivo de salida), como se describe con referencia a la FIG. 2. En una forma de realización particular, el estimador de armonicidad 106 puede proporcionar el factor de armonicidad 170 al MUX y el MUX puede incluir el factor de armonicidad 170 en el flujo de bits de salida.
[0043] El sistema de codificador 100 genera una señal de banda alta sintetizada (por ejemplo, la primera señal ampliada 182), en un codificador, utilizando una función de procesamiento no lineal seleccionada basándose en características de la señal de banda baja 122. El uso de la función de procesamiento no lineal seleccionada puede aumentar la correlación entre la señal de banda alta sintetizada y la señal de banda alta 124 tanto en los casos sonoros como en los no sonoros.
[0044] Con referencia a la FIG. 2, se muestra y se designa en general como 200 un modo de realización particular de un sistema de descodificador que es operativo para realizar extensión de ancho de banda armónico de señales de audio. El sistema de codificador 100 y el sistema de descodificador 200 pueden incluirse en un solo dispositivo o en dispositivos separados.
[0045] En un modo de realización particular, el sistema de descodificador 200 puede estar integrado en un sistema o aparato de codificación (o descodificación) (por ejemplo, en un teléfono o codificador/descodificador (CODEC) inalámbrico). En otros modos de realización, el sistema de descodificador 200 puede estar integrado en un descodificador, un reproductor de música, un reproductor de vídeo, una unidad de entretenimiento, un dispositivo de navegación, un dispositivo de comunicaciones, un asistente digital personal (PDA), una unidad de datos de localización fija o un ordenador.
[0046] Cabe destacar que, en la siguiente descripción, las diversas funciones realizadas por el sistema de descodificador 200 de la FIG. 2 se describen como realizadas por ciertos componentes o módulos. Esta división de componentes y módulos es solo ilustrativa y no debe considerarse limitativa. En un modo de realización alternativo, una función realizada mediante un componente o módulo particular puede dividirse entre múltiples componentes o módulos. Además, en un modo de realización alternativo, dos o más componentes o módulos de la FIG. 2 pueden estar integrados en un único componente o módulo. Cada componente o módulo ilustrado en la FIG. 2 puede implementarse usando hardware (por ejemplo, un dispositivo de matriz de puertas programables in situ (FPGA), un circuito integrado específico de la aplicación (ASIC), un procesador de señales digitales (DSP), un controlador, etc.), software (por ejemplo, instrucciones ejecutables por un procesador), o cualquier combinación de los mismos.
[0047] El sistema de descodificador 200 incluye un descodificador de banda baja 208 acoplado al generador de señal 112, el filtro 114, el mezclador 116, un generador de señal de banda alta 216, y un banco de filtros de síntesis 210.
[0048] Durante el funcionamiento, el descodificador de banda baja 208 puede recibir datos de banda baja 268. Los datos de banda baja 268 pueden corresponder a un flujo de bits de salida generado por el sistema de codificador 100 de la FIG. 1. Por ejemplo, un receptor en el sistema de descodificador 200 puede recibir (por ejemplo, a través de un canal alámbrico, inalámbrico u óptico) un flujo de bits de entrada. El flujo de bits de entrada puede corresponder a un flujo de bits de salida generado por el sistema de codificador 100. El receptor puede proporcionar el flujo de bits de entrada a un desmultiplexor (DEMUX). El DEMUX puede generar los datos de banda baja 268 y los parámetros de ajuste a partir del flujo de bits de entrada. En un modo de realización particular, el DEMUX puede extraer un factor de armonicidad del flujo de bits de entrada. El DEMUX puede proporcionar los datos de banda baja 268 al descodificador de banda baja 208.
[0049] El descodificador de banda baja 208 puede extraer parámetros de banda baja de los datos de banda baja 268. Los parámetros de banda baja pueden corresponder a los parámetros de banda baja 168 de la FIG. 1. El descodificador de banda baja 208 puede generar una señal de banda baja sintetizada 222 basándose en los parámetros de banda baja. La señal de banda baja sintetizada 222 puede aproximarse a la señal de banda baja 122 de la FIG. 1.
[0050] La señal del generador 112 puede recibir la señal de banda baja sintetizada 222 del descodificador de banda baja 208. El generador de señal 112 puede generar una tercera señal extendida 274 basándose en la señal de banda
baja sintetizada 222, como se describe con referencia a la FIG. 1. Por ejemplo, el selector de función 180 puede seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal disponibles 218 basándose en la señal de banda baja sintetizada 222. El generador de señal puede extender la señal de banda baja sintetizada 222 y puede aplicar la función de procesamiento no lineal seleccionada para generar la tercera señal extendida 274. La tercera señal extendida 274 puede aproximarse a la tercera señal extendida 174 de la FIG. 1. En un modo de realización particular, el selector de función 180 selecciona una función de procesamiento no lineal basándose en un parámetro recibido. Por ejemplo, el sistema de descodificador 200 puede recibir un parámetro que identifica (por ejemplo, mediante índice) una función de procesamiento no lineal particular que fue aplicada por un sistema de codificador (por ejemplo, el sistema de codificador 100) para codificar un trama de audio o secuencia de tramas de audio particular. Tal parámetro puede recibirse para cada trama o cuando cambia la función de procesamiento no lineal a utilizar.
[0051] El filtro 114 puede generar una segunda señal extendida 272 mediante el filtrado de la tercera señal extendida 274, como se describe con referencia a la FIG. 1. La segunda señal extendida 272 puede aproximarse a la segunda señal extendida 172 de la FIG. 1.
[0052] El mezclador 116 puede generar la primera señal ampliada 282 mediante la combinación de una señal de ruido 276 y la segunda señal extendida 272 basándose en un factor de armonicidad 270, como se describe con referencia a la FIG. 2. La señal de ruido 276 puede aproximarse a la señal de ruido 176 de la FIG. 1 y la primera señal extendida 282 puede aproximarse a la primera señal extendida 182 de la FIG. 1.
[0053] El descodificador de armonicidad 206 puede recibir los datos de banda baja 268, los parámetros de ajuste 178, un factor de armonicidad recibido (por ejemplo, parámetro), o una combinación de los mismos. Por ejemplo, el descodificador de armonicidad 206 puede recibir los datos de banda baja 268, los parámetros de ajuste 178, el factor de armonicidad recibido, o una combinación de los mismos, desde un DEMUX del sistema de descodificador 200. El descodificador de armonicidad 206 puede generar el factor de armonicidad 270 basado en los datos de banda baja 268, los parámetros de ajuste 178, el factor de armonicidad recibido o una combinación de los mismos. Por ejemplo, el descodificador de armonicidad 206 puede extraer parámetros de banda baja de los datos de banda baja 268. Como otro ejemplo, el descodificador de armonicidad 206 puede extraer parámetros de banda alta de los parámetros de ajuste 178. El descodificador de armonicidad 206 puede generar un factor de armonicidad calculado basado en los parámetros de banda baja, los parámetros de banda alta, o ambos, como se describe con referencia a la FIG. 1.
[0054] El descodificador de armonicidad 206 puede definir el factor de armonicidad 270 para ser el factor armonicidad calculado o el factor de armonicidad recibido. En un modo de realización particular, el descodificador de armonicidad 206 puede establecer el factor de armonicidad 270 en el factor de armonicidad calculado en respuesta a la detección de un error en el factor de armonicidad recibido. El descodificador de armonicidad 206 puede detectar el error en respuesta a la determinación de que una diferencia entre el factor de armonicidad recibido y el factor de armonicidad calculado satisface un valor umbral particular. El descodificador de armonicidad 206 puede proporcionar el factor de armonicidad 270 al mezclador 116. El mezclador 116 puede proporcionar la primera señal extendida 282 al generador de señal de banda alta 216.
[0055] El generador de señal de banda alta 216 puede generar una señal de banda alta sintetizada 224 basándose en al menos uno de los parámetros de ajuste 178 y la primera señal extendida 282. Por ejemplo, el generador de señal de banda alta 216 puede aplicar los parámetros de ajuste 178 a la primera señal extendida 282 para generar la señal de banda alta sintetizada 224. Para ilustrar, el generador de señal de banda alta 216 puede escalar la primera señal extendida 282 por un factor que está asociado con al menos uno de los parámetros de ajuste 178. En un modo de realización particular, uno o más de los parámetros de ajuste 178 pueden corresponder a parámetros de ajuste de ganancia. El generador de señal de banda alta 216 puede aplicar los parámetros de ajuste de ganancia a la primera señal extendida 282 para generar la señal de banda alta sintetizada 224. El banco de filtros de síntesis 210 puede recibir la señal de banda alta sintetizada 224 y la señal de banda baja sintetizada 222. La señal de audio de salida 278 puede proporcionarse a un altavoz (u otro dispositivo de salida) mediante el banco de filtros de síntesis 210 y/o almacenarse.
[0056] El sistema de descodificador 200 puede permitir que una señal de banda alta sintetizada sea generada en un descodificador utilizando una función de procesamiento no lineal seleccionada basándose en los parámetros de banda baja que indican características de una parte de banda baja de una señal de entrada recibida en un codificador. El uso de la función de procesamiento no lineal seleccionada para generar la señal de banda alta sintetizada puede mejorar la correlación entre la señal de banda alta sintetizada y una parte de banda alta de la señal de entrada en los casos sonoros y no sonoros.
[0057] Con referencia a la FIG. 3, se muestra y se designa en general como 300 un modo de realización particular de un sistema que es operativo para realizar extensión de ancho de banda armónico de señales de audio.
[0058] En un modo de realización particular, el sistema 300 (o partes del mismo) puede estar integrado en un sistema o aparato de codificación (o descodificación) (por ejemplo, en un teléfono o codificador/descodificador (CODEC) inalámbrico). En otros modos de realización, el sistema 300 (o partes del mismo) puede estar integrado en un
descodificador, un reproductor de música, un reproductor de vídeo, una unidad de entretenimiento, un dispositivo de navegación, un dispositivo de comunicaciones, un asistente digital personal (PDA), una unidad de datos de localización fija o un ordenador.
[0059] Cabe destacar que, en la siguiente descripción, las diversas funciones realizadas por el sistema 300 de la FIG.
3 se describen como realizadas por ciertos componentes o módulos. Esta división de componentes y módulos es solo ilustrativa y no debe considerarse limitativa. En un modo de realización alternativo, una función realizada mediante un componente o módulo particular puede dividirse entre múltiples componentes o módulos. Además, en un modo de realización alternativo, dos o más componentes o módulos de la FIG. 3 pueden estar integrados en un único componente o módulo. Cada componente o módulo ilustrado en la FIG. 3 puede implementarse usando hardware (por ejemplo, un dispositivo de matriz de puertas programables in situ (FPGA), un circuito integrado específico de la aplicación (ASIC), un procesador de señales digitales (DSP), un controlador, etc.), software (por ejemplo, instrucciones ejecutables por un procesador), o cualquier combinación de los mismos.
[0060] El sistema 300 incluye el banco de filtros de análisis 110, el codificador de banda baja 108, el estimador armonicidad 106, el estimador de parámetros 190, y el sistema de descodificador 200.
[0061] Durante el funcionamiento, el banco de filtros de análisis 110 puede recibir la señal de audio de entrada 102. El banco de filtros de análisis 110 puede separar la señal de audio de entrada 102 en al menos la señal de banda baja 122 y la señal de banda alta 124.
[0062] El codificador 108 de banda baja puede recibir la señal de banda baja 122 del banco de filtros de análisis 110. El codificador 108 de banda baja puede determinar los parámetros de banda baja 168 basados en la señal de banda baja 122, como se describe con referencia a la FIG. 1. El codificador de banda baja 108 puede proporcionar los parámetros de banda baja 168 al sistema de descodificador 200.
[0063] El estimador de armonicidad 106 puede recibir la señal de banda alta 124 y puede generar el factor de armonicidad 170 basándose en la señal de banda alta 124. Por ejemplo, el estimador de armonicidad 106 puede generar el factor de armonicidad 170 basándose en parámetros de banda alta que indican características de la señal de banda alta 124, como se describe con referencia a la FIG. 1. El estimador de armonicidad 106 puede proporcionar el factor de armonicidad 170 al sistema de descodificador 200.
[0064] El estimador de parámetros 190 puede generar los parámetros de ajuste 178 basándose en la señal de banda alta 124. Por ejemplo, los parámetros de ajuste 178 pueden corresponder a parámetros de banda alta que indican características de la señal de banda alta 124. El estimador de parámetros 190 puede proporcionar los parámetros de ajuste 178 al sistema de descodificador 200. El sistema de descodificador 200 puede generar la señal de banda alta sintetizada 224 basándose en los parámetros de ajuste 178, los parámetros de banda baja 168, el factor de armonicidad 170, o una combinación de los mismos, como se describe con referencia a la FIG. 2.
[0065] El sistema 300 permite que una señal de banda alta sintetizada sea generada en un descodificador utilizando una función de procesamiento no lineal seleccionada basándose en características de una señal de banda baja sintetizada. El sistema 300 puede generar los parámetros de ajuste 178 basándose en la señal de banda alta 124 y no basándose en una versión extendida de la señal de banda baja. En un modo de realización particular, el sistema 300 puede generar los parámetros de ajuste 178 más rápido que el sistema de codificador 100 ahorrando tiempo de procesamiento para extender la señal de audio de entrada 102 y mezclar la señal extendida con una señal de ruido.
[0066] Con referencia a la FIG. 4, se muestra y se designa en general por 400 un diagrama de flujo de un modo de realización particular de un procedimiento de realización de extensión de ancho de banda armónico de señales de audio. Se puede realizar el procedimiento 400 mediante el sistema de codificador 100 de la FIG. 1.
[0067] El procedimiento 400 puede incluir la separación, en un dispositivo, de una señal de audio de entrada en al menos una señal de banda baja y una señal de banda alta, en 402. La señal de banda baja puede corresponder a un rango de frecuencias de banda baja y la señal de banda alta puede corresponder a un rango de frecuencias de banda alta. Por ejemplo, el banco de filtros de análisis 110 de la FIG. 1 puede separar la señal de audio de entrada 102 en al menos la señal de banda baja 122 y la señal de banda alta 124, como se describe con referencia a la FIG. 1. La señal de banda baja 122 puede corresponder a un rango de frecuencias de banda baja (por ejemplo, 50 hercios (Hz) - 7 kilohercios (kHz)) y la señal de banda alta 124 puede corresponder a un rango de frecuencias de banda alta (por ejemplo, 7 kHz - 16 kHz).
[0068] El procedimiento 400 puede incluir también la selección de una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal, en 404. Por ejemplo, el selector de función 180 de la FIG. 1 puede seleccionar una función de procesamiento no lineal particular de la pluralidad de funciones de procesamiento no lineal disponibles 118, como se describe con referencia a la FIG. 1.
[0069] El procedimiento 400 puede además incluir la generación de una primera señal ampliada basándose en la señal de banda baja y la función de procesamiento no lineal, en 406. Por ejemplo, el mezclador 116 de la FIG. 1 puede
generar la primera señal extendida 182 basándose en la señal de banda baja 122 y la función de procesamiento no lineal seleccionada, como se describe con referencia a la FIG. 1.
[0070] El procedimiento 400 puede incluir también la generación de al menos un parámetro de ajuste basándose en al menos una de la primera señal extendida o la señal de banda alta, en 408. Por ejemplo, el estimador de parámetros 190 puede generar los parámetros de ajuste 178 basándose en al menos una de la primera señal extendida 182 o la señal de banda alta 124, como se describe con referencia a la FIG. 1.
[0071] El procedimiento 400 puede permitir la generación de una señal de banda alta sintetizada (por ejemplo, la primera señal ampliada 182), en un codificador, utilizando una función de procesamiento no lineal seleccionada basándose en características de la señal de banda baja 122. El uso de la función de procesamiento no lineal seleccionada puede aumentar la correlación entre la señal de banda alta sintetizada y la señal de banda alta 124 tanto en los casos sonoros como en los no sonoros.
[0072] En un modo de realización particular, el procedimiento 400 de la FIG. 4 puede implementarse mediante hardware (por ejemplo, un dispositivo de matriz de puertas programables in situ (FPGA), un circuito integrado específico de la aplicación (ASIC), etc.) de una unidad de procesamiento, tal como una unidad de procesamiento central (CPU), un procesador de señales digitales (DSP), o un controlador, mediante un dispositivo de firmware, o cualquier combinación de los mismos. En un ejemplo, un procesador que ejecuta instrucciones puede realizar el procedimiento 400 de la FIG. 4, como se describe con respecto a la FIG. 6.
[0073] Con referencia a la FIG. 5, se muestra y se designa en general por 500 un diagrama de flujo de un modo de realización particular de un procedimiento de realización de extensión de ancho de banda armónico de señales de audio. Se puede realizar el procedimiento 500 mediante el sistema de descodificador 200 de la FIG. 2.
[0074] El procedimiento 500 puede incluir recibir, en un dispositivo, datos de baja banda correspondientes a al menos una señal de banda baja de una señal de audio de entrada, en 502. Por ejemplo, un DEMUX del sistema de descodificador 200 puede recibir un flujo de bits de entrada a través de un receptor, como se describe con referencia a la FIG. 2. Como otro ejemplo, el descodificador de banda baja 208 puede recibir los datos de banda baja 268, como se describe con referencia a la FIG. 2.
[0075] El procedimiento 500 puede incluir también la descodificación de los datos de banda baja para generar una señal de audio de banda baja sintetizada, en 504. Por ejemplo, el descodificador de banda baja 208 puede descodificar los datos de banda baja 268 para generar la señal de banda baja sintetizada 222, como se describe con referencia a la FIG. 2.
[0076] El procedimiento 500 puede incluir además la selección de una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal, en 506. Por ejemplo, el selector de función 180 puede seleccionar una función de procesamiento no lineal particular de la pluralidad de funciones de procesamiento no lineal 118 disponibles, como se describe con referencia a la FIG. 2.
[0077] El procedimiento 500 también puede incluir la generación de una señal de audio de banda alta sintetizada basándose en la señal de audio de banda baja sintetizada y la función de procesamiento no lineal, en 508. Por ejemplo, el generador de señal de banda alta 216 puede generar la señal de banda alta sintetizada 224 basándose en la señal de banda baja sintetizada 222 y la función de procesamiento no lineal seleccionada, como se describe con referencia a la FIG. 2.
[0078] El procedimiento 500 puede permitir que se genere una señal de banda alta sintetizada en un descodificador utilizando una función de procesamiento no lineal seleccionada basándose en los parámetros de banda baja que indican características de una parte de banda baja de una señal de entrada recibida en un codificador. El uso de la función de procesamiento no lineal seleccionada para generar la señal de banda alta sintetizada puede mejorar la correlación entre la señal de banda alta sintetizada y una parte de banda alta de la señal de entrada en los casos sonoros y no sonoros.
[0079] En un modo de realización particular, el procedimiento 500 de la FIG. 5 puede implementarse mediante hardware (por ejemplo, un dispositivo de matriz de puertas programables in situ (FPGA), un circuito integrado específico de la aplicación (ASIC), etc.) de una unidad de procesamiento, tal como una unidad de procesamiento central (CPU), un procesador de señales digitales (DSP), o un controlador, mediante un dispositivo de firmware, o cualquier combinación de los mismos. En un ejemplo, un procesador que ejecuta instrucciones puede realizar el procedimiento 500 de la FIG. 5, como se describe con respecto a la FIG. 6.
[0080] Con referencia a la FIG. 6, se representa y se designa en general como 600 un diagrama de bloques de un modo de realización ilustrativo particular de un dispositivo de comunicación inalámbrica. El dispositivo 600 incluye un procesador 610 (por ejemplo, una unidad central de procesamiento (CPU), un procesador de señales digitales (DSP), etc.), acoplado a una memoria 632. La memoria 632 puede incluir instrucciones 660 ejecutables por el procesador 610. El procesador 610 también puede incluir un codificador/descodificador (CODEC) 634, como se muestra. El
CODEC 634 puede realizar, y/o las instrucciones 660 pueden ser ejecutables por el procesador 610 para realizar, los procedimientos y procesos divulgados en el presente documento, tales como el procedimiento 400 de la FIG. 4, el procedimiento 500 de la FIG. 5, o ambos.
[0081] El CODEC 634 puede incluir un codificador 690 y un descodificador 692. El codificador 690 puede incluir uno o más del banco de filtros de análisis 110, el estimador de armonicidad 106, el codificador de banda baja 108, el mezclador 116, el generador de señal 112, el filtro 114 y el estimador de parámetros 190, como se muestra. El descodificador 692 puede incluir uno o más del banco de filtros de síntesis 210, el descodificador de armonicidad 206, el descodificador de banda baja 208, el generador de señal de banda alta 216, el mezclador 116 y el filtro 114, como se muestra. En modos de realización alternativos, el codificador 690 y el descodificador 692 pueden residir dentro o como parte de múltiples procesadores. Por ejemplo, el dispositivo 600 puede incluir múltiples procesadores, tales como un DSP y un procesador de aplicaciones, y el codificador 690 y el descodificador 692, o componentes de los mismos, pueden incluirse en algunos o en todos los procesadores múltiples.
[0082] El banco de filtros de análisis 110, el estimador armonicidad 106, el codificador de banda baja 108, el mezclador 116, el generador de señal 112, el filtro 114, el estimador de parámetros 190, el banco de filtros de síntesis 210, el descodificador de armonicidad 206, el descodificador de banda baja 208, el generador de señal de banda alta 216, o una combinación de los mismos, pueden implementarse a través de hardware dedicado (por ejemplo, circuitos), mediante un procesador que ejecuta instrucciones para realizar una o más tareas, o una combinación de los mismos. A modo de ejemplo, dichas instrucciones pueden almacenarse en un dispositivo de memoria, tal como una memoria de acceso aleatorio (RAM), una memoria de acceso aleatorio magnetorresistiva (MRAM), una MRAM de transferencia de par de giro (STT-MRAM), una memoria flash, una memoria de solo lectura (ROM), una memoria de solo lectura programable (PROM), una memoria de estado sólido, una memoria de solo lectura programable y borrable (EPROM), una memoria de solo lectura programable y borrable eléctricamente (EEPROM), unos registros, un disco duro, un disco extraíble o una memoria de solo lectura de disco compacto (CD-ROM).
[0083] La FIG. 6 también muestra un controlador de pantalla 626 que está acoplado al procesador 610 y a una pantalla 628. Un altavoz 636 y un micrófono 638 se pueden acoplar al dispositivo 600. Por ejemplo, el micrófono 638 puede generar la señal de audio de entrada 102 de la FIG. 1, y el dispositivo 600 puede generar un flujo de bits de salida para su transmisión a un receptor basándose en la señal de audio de entrada 102, como se describe con referencia a la FIG. 1. Por ejemplo, el flujo de bits de salida puede ser transmitido por un transmisor a través del procesador 610, un controlador inalámbrico 640 y una antena 642. Como otro ejemplo, el altavoz 636 puede usarse para enviar una señal reconstruida por el dispositivo 600 a partir de un flujo de bits de entrada recibido por un receptor (por ejemplo, a través del controlador inalámbrico 640 y la antena 642), como se describe con referencia a la FIG. 2.
[0084] En un modo de realización particular, el procesador 610, el controlador de pantalla 626, la memoria 632, y el controlador inalámbrico 640 están incluidos en un dispositivo de sistema en un paquete, o sistema en un chip (por ejemplo, un módem de estación móvil (MSM)) 622. En un modo de realización particular, un dispositivo de entrada 630, tal como una pantalla táctil y/o un teclado, y una fuente de alimentación 644, están acoplados al dispositivo de sistema en chip 622. Además, en un modo de realización particular, como se ilustra en la FIG. 6, la pantalla 628, el dispositivo de entrada 630, el altavoz 636, el micrófono 638, la antena 642 y la fuente de alimentación 644 son externos con respecto al dispositivo de sistema en chip 622. Cada uno de la pantalla 628, el dispositivo de entrada 630, el altavoz 636, el micrófono 638, la antena 642 y la fuente de alimentación 644 se pueden acoplar a un componente del dispositivo de sistema en chip 622, tal como una interfaz o un controlador.
[0085] En conjunción con los modos de realización descritos, un primer aparato puede incluir medios para separar una señal de audio de entrada en al menos una señal de banda baja y una señal de banda alta, tal como el banco de filtros de análisis 110, uno o más de otros dispositivos o circuitos configurados para separar una señal de audio, o cualquier combinación de los mismos. La señal de banda baja puede corresponder a un rango de frecuencias de banda baja y la señal de banda alta puede corresponder a un rango de frecuencias de banda alta. El aparato también puede incluir medios para seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal, como el selector de función 180, uno o más de otros dispositivos o circuitos configurados para seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal, o cualquier combinación de los mismos. El aparato puede incluir además primeros medios para generar una primera señal extendida basándose en la señal de banda baja y la función de procesamiento no lineal, tal como el mezclador 116, uno o más de otros dispositivos o circuitos configurados para generar una señal basada en una señal de banda baja y una función de procesamiento no lineal, o cualquier combinación de los mismos. El aparato también puede incluir segundos medios para generar al menos un parámetro de ajuste basándose en la primera señal extendida, la señal de banda alta, o ambas, tales como el estimador de parámetros 190, uno o más de otros dispositivos o circuitos configurados para generar al menos uno parámetro de ajuste basándose en una señal extendida y/o una señal de banda alta, o cualquier combinación de los mismos.
[0086] En conjunción con los modos de realización descritos, un segundo aparato puede incluir medios para recibir datos de baja banda correspondiente a al menos una señal de banda baja de una señal de audio de entrada, tal como un componente (por ejemplo, un receptor) de o acoplado al sistema de descodificador 200, uno o más de otros dispositivos o circuitos configurados para recibir datos de banda baja correspondientes a una señal de banda baja de
una señal de audio de entrada, o cualquier combinación de los mismos. El aparato también puede incluir medios para descodificar los datos de banda baja para generar una señal de audio de banda baja sintetizada, como el descodificador de banda baja 208, uno o más de otros dispositivos o circuitos configurados para descodificar datos de banda baja para generar una señal de audio de banda baja sintetizada, o cualquier combinación de los mismos. El aparato puede incluir además medios para seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal, tales como el selector de función 180, uno o más de otros dispositivos o circuitos configurados para seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal, o cualquier combinación de los mismos. El aparato también puede incluir medios para generar una señal de audio de banda alta sintetizada basándose en la señal de audio de banda baja sintetizada y la función de procesamiento no lineal, como el generador de señal de banda alta 216, uno o más de otros dispositivos o circuitos configurados para generar una señal de audio de banda alta sintetizada basándose en una señal de audio de banda baja sintetizada y una función de procesamiento no lineal, o cualquier combinación de los mismos.
[0087] Los expertos en la técnica apreciarán además que los diversos bloques lógicos, configuraciones, módulos, circuitos y pasos de algoritmo ilustrativos descritos en relación con los modos de realización divulgados en el presente documento pueden implementarse como hardware electrónico, software informático ejecutado por un dispositivo de procesamiento tal como un procesador de hardware, o combinaciones de ambos. Se han descrito anteriormente diversos componentes, bloques, configuraciones, módulos, circuitos y pasos ilustrativos, en general, en lo que respecta a su funcionalidad. Que dicha funcionalidad se implemente como hardware o software ejecutable depende de la aplicación particular y de las restricciones de diseño impuestas al sistema global. Los expertos en la técnica pueden implementar la funcionalidad descrita de diferentes maneras para cada aplicación particular, pero no debe interpretarse que dichas decisiones de implementación suponen una desviación del alcance de la presente divulgación.
[0088] Los pasos de un procedimiento o algoritmo descrito en relación con los modos de realización divulgados en el presente documento pueden realizarse directamente en hardware, en un módulo de software ejecutado por un procesador o en una combinación de los dos. Un módulo de software puede residir en un dispositivo de memoria, tal como una memoria de acceso aleatorio (RAM), una memoria de acceso aleatorio magnetorresistiva (MRAM), una MRAM de transferencia de par de giro (STT-MRAM), una memoria flash, una memoria de solo lectura (ROM), una memoria de solo lectura programable (PROM), una memoria de solo lectura programable y borrable (EPROM), una memoria de solo lectura programable y borrable eléctricamente (EEPROM), unos registros, un disco duro, un disco extraíble o una memoria de solo lectura de disco compacto (CD-ROM). Un dispositivo de memoria a modo de ejemplo está acoplado al procesador de tal manera que el procesador puede leer información de, y escribir información en, el dispositivo de memoria. De forma alternativa, el dispositivo de memoria puede estar integrado en el procesador. El procesador y el medio de almacenamiento pueden residir en un circuito integrado específico de la aplicación (ASIC). El ASIC puede residir en un dispositivo informático o en un terminal de usuario. De forma alternativa, el procesador y el medio de almacenamiento pueden residir como componentes discretos en un dispositivo informático o en un terminal de usuario.
[0089] La anterior descripción de los modos de realización divulgados se proporciona para permitir que cualquier experto en la técnica realice o use los modos de realización divulgados. Diversas modificaciones de estos modos de realización resultarán fácilmente evidentes para los expertos en la técnica, y los principios definidos en el presente documento se pueden aplicar a otros modos de realización sin apartarse del alcance de la divulgación. Por tanto, la presente divulgación no pretende limitarse a los modos de realización mostrados en el presente documento, sino que se le ha de conceder el alcance más amplio posible consecuente con los principios y características novedosas, como se define en las reivindicaciones siguientes.
Claims (14)
1. Un procedimiento que comprende:
separar, en un dispositivo, una señal de audio de entrada en al menos una señal de banda baja y una señal de banda alta, con la señal de banda baja correspondiente a un rango de frecuencias de banda baja y la señal de banda alta correspondiente a un rango de frecuencias de banda alta (402);
determinar un parámetro que indica una característica de la señal de banda baja;
seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal basándose en el parámetro (404);
generar una primera señal extendida basándose en la señal de banda baja y la función de procesamiento no lineal (406);
generar al menos un parámetro de ajuste basándose en la primera señal extendida, la señal de banda alta (408), o ambas, para multiplexar en un flujo de bits de salida;
caracterizado por que la selección de la función de procesamiento no lineal comprende, seleccionar una primera función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal en respuesta a la determinación de que el parámetro asociado con una trama de la señal de audio de entrada satisface una primera condición, y
seleccionar una segunda función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal en respuesta a la determinación de que el parámetro satisface una segunda condición.
2. El procedimiento según la reivindicación 1, en el que la función de procesamiento no lineal se selecciona después de que se recibe la señal de audio de entrada en el dispositivo, en el que la primera señal extendida se genera mezclando una señal de ruido y una segunda señal extendida, y en el que el al menos un parámetro de ajuste se determina basándose en la primera señal extendida y la señal de banda alta.
3. El procedimiento según la reivindicación 2, en el que una primera proporción de la señal de ruido y una segunda proporción de la segunda señal extendida se mezclan, y en el que la primera proporción y la segunda proporción se determinan basándose en una armonicidad de al menos una de la señal de banda baja, la señal de banda alta o la señal de audio de entrada.
4. El procedimiento según la reivindicación 3, en el que la función de procesamiento no lineal se selecciona en respuesta a la recepción de la señal de audio de entrada, y que comprende además:
determinar la armonicidad basándose en una estimación de periodicidad de la señal de audio de entrada en una trama de audio.
5. El procedimiento según la reivindicación 2, que comprende además:
generar la segunda señal extendida filtrando una tercera señal extendida, en el que un ancho de banda de la segunda señal extendida corresponde al rango de frecuencias de banda alta.
6. El procedimiento según la reivindicación 5, que comprende además:
generar la tercera señal extendida aplicando la función de procesamiento no lineal a la señal de banda baja, en el que la función de procesamiento no lineal se selecciona trama por trama.
7. El procedimiento según la reivindicación 2, en el que la segunda señal extendida se genera aplicando una transformación lineal a una tercera señal extendida y seleccionando coeficientes de transformada correspondientes al rango de frecuencias de banda alta.
8. El procedimiento según la reivindicación 1, en el que la función de procesamiento no lineal se selecciona entre:
una primera función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal que corresponde a una función de potencia de bajo orden, y
una segunda función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal que corresponde a una función de potencia de alto orden.
9. El procedimiento según la reivindicación 1, que comprende además:
determinar un parámetro asociado con una trama de la señal de audio de entrada,
en el que el parámetro asociado con la trama comprende uno de un modo de codificación elegido para codificar la señal de banda baja, una periodicidad de la trama, una cantidad de ruido no periódico en la trama o una inclinación espectral correspondiente a la trama.
10. El procedimiento según la reivindicación 1, en el que al menos un parámetro de ajuste corresponde a al menos un parámetro de ajuste de ganancia asociado con la señal de banda alta.
11. Un procedimiento que comprende:
recibir, en un dispositivo, datos de banda baja correspondientes a al menos una señal de banda baja de una señal de audio de entrada (502);
descodificar los datos de banda baja para generar una señal de audio de banda baja sintetizada (504); determinar un parámetro que indica una característica de la señal de banda baja;
seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal basándose en el parámetro (506);
generar una señal de audio de banda alta sintetizada basándose en la señal de audio de banda baja sintetizada y la función de procesamiento no lineal (508);
caracterizado por que la selección de la función de procesamiento no lineal comprende, seleccionar una primera función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal en respuesta a la determinación de que el parámetro asociado con una trama de la señal de audio de entrada satisface una primera condición, y
seleccionar una segunda función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal en respuesta a la determinación de que el parámetro satisface una segunda condición.
12. Un aparato, que comprende:
medios para separar una señal de audio de entrada en al menos una señal de banda baja y una señal de banda alta, correspondiendo la señal de banda baja a un rango de frecuencias de banda baja y la señal de banda alta a un rango de frecuencias de banda alta (402);
medios para determinar un parámetro que indica una característica de la señal de banda baja; medios para seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal basándose en el parámetro (404);
primeros medios para generar una primera señal extendida basándose en la señal de banda baja y la función de procesamiento no lineal (406); y
segundos medios para generar al menos un parámetro de ajuste basándose en la primera señal extendida, la señal de banda alta (408), o ambas, para multiplexar en un flujo de bits de salida;
caracterizado por que la función de procesamiento no lineal se selecciona entre:
una primera función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal en respuesta a la determinación de que el parámetro asociado con una trama de la señal de audio de entrada satisface una primera condición, y
una segunda función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal en respuesta a la determinación de que el parámetro satisface una segunda condición.
13. Un aparato, que comprende:
medios para recibir datos de banda baja correspondientes a al menos una señal de banda baja de una señal de audio de entrada (502);
medios para descodificar los datos de banda baja para generar una señal de audio de banda baja sintetizada (504);
medios para determinar un parámetro que indica una característica de la señal de banda baja;
medios para seleccionar una función de procesamiento no lineal de una pluralidad de funciones de procesamiento no lineal basándose en el parámetro (506); y
medios para generar una señal de audio de banda alta sintetizada basándose en la señal de audio de banda baja sintetizada y la función de procesamiento no lineal (508);
caracterizado por que la función de procesamiento no lineal se selecciona entre:
una primera función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal en respuesta a la determinación de que el parámetro asociado con una trama de la señal de audio de entrada satisface una primera condición, y
una segunda función de procesamiento no lineal de la pluralidad de funciones de procesamiento no lineal en respuesta a la determinación de que el parámetro satisface una segunda condición.
14. Un dispositivo de almacenamiento legible por ordenador que almacena instrucciones que, cuando se ejecutan mediante un procesador, hacen que el procesador realice operaciones que comprenden el procedimiento de cualquiera de las reivindicaciones 1 a 11.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461939585P | 2014-02-13 | 2014-02-13 | |
US14/617,524 US9564141B2 (en) | 2014-02-13 | 2015-02-09 | Harmonic bandwidth extension of audio signals |
PCT/US2015/015242 WO2015123210A1 (en) | 2014-02-13 | 2015-02-10 | Harmonic bandwidth extension of audio signals |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2777282T3 true ES2777282T3 (es) | 2020-08-04 |
Family
ID=53775460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15706610T Active ES2777282T3 (es) | 2014-02-13 | 2015-02-10 | Extensión de ancho de banda armónico de señales de audio |
Country Status (25)
Country | Link |
---|---|
US (1) | US9564141B2 (es) |
EP (1) | EP3105757B1 (es) |
JP (1) | JP6290434B2 (es) |
KR (1) | KR101827665B1 (es) |
CN (1) | CN105981102B (es) |
AU (1) | AU2015217340B2 (es) |
BR (1) | BR112016018575B1 (es) |
CA (1) | CA2936987C (es) |
CL (1) | CL2016002009A1 (es) |
DK (1) | DK3105757T3 (es) |
ES (1) | ES2777282T3 (es) |
HU (1) | HUE046891T2 (es) |
IL (1) | IL246787B (es) |
MX (1) | MX349848B (es) |
MY (1) | MY180821A (es) |
NZ (1) | NZ721890A (es) |
PH (1) | PH12016501396B1 (es) |
PL (1) | PL3105757T3 (es) |
PT (1) | PT3105757T (es) |
RU (1) | RU2651218C2 (es) |
SA (1) | SA516371666B1 (es) |
SG (1) | SG11201605412VA (es) |
SI (1) | SI3105757T1 (es) |
TW (1) | TWI559298B (es) |
WO (1) | WO2015123210A1 (es) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103516440B (zh) | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
KR20160087827A (ko) * | 2013-11-22 | 2016-07-22 | 퀄컴 인코포레이티드 | 고대역 코딩에서의 선택적 위상 보상 |
FR3020732A1 (fr) * | 2014-04-30 | 2015-11-06 | Orange | Correction de perte de trame perfectionnee avec information de voisement |
WO2016105574A1 (en) * | 2014-12-23 | 2016-06-30 | Qualcomm Incorporated | High order b-spline sampling rate conversion (src) |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
MX385728B (es) * | 2016-03-07 | 2025-03-18 | Fraunhofer Ges Forschung | Método de ocultamiento híbrido: combinación de ocultamiento de pérdida paquete de dominio de frecuencia y tiempo en códecs de audio. |
EP3497697B1 (en) | 2016-11-04 | 2024-01-31 | Hewlett-Packard Development Company, L.P. | Dominant frequency processing of audio signals |
EP3382703A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and methods for processing an audio signal |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
CN110322882A (zh) * | 2019-05-13 | 2019-10-11 | 厦门亿联网络技术股份有限公司 | 一种生成混合语音数据的方法及系统 |
CN113963703B (zh) * | 2020-07-03 | 2025-05-02 | 华为技术有限公司 | 一种音频编码的方法和编解码设备 |
WO2024223042A1 (en) * | 2023-04-26 | 2024-10-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for harmonicity-dependent tilt control of scale parameters in an audio encoder |
TWI868764B (zh) * | 2023-06-30 | 2025-01-01 | 華碩電腦股份有限公司 | 音訊處理裝置以及音訊處理方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2381572C2 (ru) * | 2005-04-01 | 2010-02-10 | Квэлкомм Инкорпорейтед | Системы, способы и устройство широкополосного речевого кодирования |
EP1875464B9 (en) * | 2005-04-22 | 2020-10-28 | Qualcomm Incorporated | Method, storage medium and apparatus for gain factor attenuation |
US8311840B2 (en) | 2005-06-28 | 2012-11-13 | Qnx Software Systems Limited | Frequency extension of harmonic signals |
EP1772855B1 (en) * | 2005-10-07 | 2013-09-18 | Nuance Communications, Inc. | Method for extending the spectral bandwidth of a speech signal |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
EP1947644B1 (en) | 2007-01-18 | 2019-06-19 | Nuance Communications, Inc. | Method and apparatus for providing an acoustic signal with extended band-width |
BRPI0910528B1 (pt) * | 2008-07-11 | 2020-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Instrumento e método para geração de sinal estendido de largura de banda |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
EP2953131B1 (en) * | 2009-01-28 | 2017-07-26 | Dolby International AB | Improved harmonic transposition |
JP4892021B2 (ja) * | 2009-02-26 | 2012-03-07 | 株式会社東芝 | 信号帯域拡張装置 |
TWI643187B (zh) * | 2009-05-27 | 2018-12-01 | 瑞典商杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US8447617B2 (en) * | 2009-12-21 | 2013-05-21 | Mindspeed Technologies, Inc. | Method and system for speech bandwidth extension |
RU2596033C2 (ru) * | 2010-03-09 | 2016-08-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
JP5777041B2 (ja) * | 2010-07-23 | 2015-09-09 | 沖電気工業株式会社 | 帯域拡張装置及びプログラム、並びに、音声通信装置 |
-
2015
- 2015-02-09 US US14/617,524 patent/US9564141B2/en active Active
- 2015-02-10 ES ES15706610T patent/ES2777282T3/es active Active
- 2015-02-10 DK DK15706610.1T patent/DK3105757T3/da active
- 2015-02-10 BR BR112016018575-7A patent/BR112016018575B1/pt active IP Right Grant
- 2015-02-10 PL PL15706610T patent/PL3105757T3/pl unknown
- 2015-02-10 RU RU2016133008A patent/RU2651218C2/ru active
- 2015-02-10 CN CN201580007190.2A patent/CN105981102B/zh active Active
- 2015-02-10 MY MYPI2016702572A patent/MY180821A/en unknown
- 2015-02-10 JP JP2016550268A patent/JP6290434B2/ja active Active
- 2015-02-10 PT PT157066101T patent/PT3105757T/pt unknown
- 2015-02-10 CA CA2936987A patent/CA2936987C/en active Active
- 2015-02-10 SG SG11201605412VA patent/SG11201605412VA/en unknown
- 2015-02-10 SI SI201531104T patent/SI3105757T1/sl unknown
- 2015-02-10 AU AU2015217340A patent/AU2015217340B2/en active Active
- 2015-02-10 KR KR1020167024534A patent/KR101827665B1/ko active Active
- 2015-02-10 MX MX2016010358A patent/MX349848B/es active IP Right Grant
- 2015-02-10 WO PCT/US2015/015242 patent/WO2015123210A1/en active Application Filing
- 2015-02-10 NZ NZ721890A patent/NZ721890A/en unknown
- 2015-02-10 EP EP15706610.1A patent/EP3105757B1/en active Active
- 2015-02-10 HU HUE15706610A patent/HUE046891T2/hu unknown
- 2015-02-10 TW TW104104441A patent/TWI559298B/zh active
-
2016
- 2016-07-14 IL IL246787A patent/IL246787B/en active IP Right Grant
- 2016-07-14 PH PH12016501396A patent/PH12016501396B1/en unknown
- 2016-08-10 CL CL2016002009A patent/CL2016002009A1/es unknown
- 2016-08-11 SA SA516371666A patent/SA516371666B1/ar unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2777282T3 (es) | Extensión de ancho de banda armónico de señales de audio | |
ES2391292T3 (es) | Sistemas, procedimientos y aparato para la generación de una señal de excitación de banda alta | |
ES2844231T3 (es) | Modelado de señales de banda alta | |
ES2350494T3 (es) | Procedimiento y aparatos para codificar y decodificar una parte de banda alta de una señal de habla. | |
ES2711524T3 (es) | Generación de señal de excitación de banda alta | |
ES2618258T3 (es) | Sistemas y procedimientos para realizar el control de ganancia | |
ES2690251T3 (es) | Ajuste del orden de predicción lineal de un codificador de audio | |
ES2715847T3 (es) | Sistemas y procedimientos de realización de filtrado para determinación de ganancia | |
ES2807258T3 (es) | Escalado para circuitería de forma de ganancia | |
ES2690096T3 (es) | Codificación de señal de banda alta usando intervalos de frecuencias no coincidentes | |
ES2660605T3 (es) | Estimación de factores de mezcla para generar una señal de excitación de banda alta | |
ES2715476T3 (es) | Sistemas y procedimientos para realizar la modulación de ruido y el ajuste de ganancia | |
ES2774334T3 (es) | Estimación de forma de ganancia para mejorar el rastreo de características temporales de banda alta | |
ES2755364T3 (es) | Codificación de señal de banda alta que utiliza múltiples subbandas | |
US20150149157A1 (en) | Frequency domain gain shape estimation | |
ES2643828T3 (es) | Procedimiento, aparato, dispositivo, medio legible por ordenador para la extensión de ancho de banda de una señal de audio que usa una excitación de banda alta escalada | |
ES2688037T3 (es) | Aparato y procedimientos de conmutación de tecnologías de codificación en un dispositivo | |
HK1224795B (zh) | 音頻信號的諧波帶寬擴展 | |
HK1224795A1 (en) | Harmonic bandwidth extension of audio signals |