RU2013142079A - Генерирование шума в аудиокодеках - Google Patents
Генерирование шума в аудиокодеках Download PDFInfo
- Publication number
- RU2013142079A RU2013142079A RU2013142079/08A RU2013142079A RU2013142079A RU 2013142079 A RU2013142079 A RU 2013142079A RU 2013142079/08 A RU2013142079/08 A RU 2013142079/08A RU 2013142079 A RU2013142079 A RU 2013142079A RU 2013142079 A RU2013142079 A RU 2013142079A
- Authority
- RU
- Russia
- Prior art keywords
- audio signal
- background noise
- input audio
- parametric
- representation
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
- G10K15/02—Synthesis of acoustic waves
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
- Image Generation (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Optical Communication System (AREA)
Abstract
1. Аудиокодер, содержащий:- модуль (12) оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;- кодер (14) для кодирования входного аудиосигнала в поток данных в течение активной фазы; и- детектор (16), выполненный с возможностью обнаруживать вход в неактивную фазу после активной фазы на основе входного сигнала,- при этом аудиокодер выполнен с возможностью кодировать в поток данных параметрическую оценку фонового шума в неактивной фазе,- при этом:- модуль оценки фонового шума выполнен с возможностью идентифицировать локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивать спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек, или- кодер выполнен с возможностью, при кодировании входного аудиосигнала, прогнозирующим образом кодировать входной аудиосигнал в коэффициенты линейного прогнозирования и сигнал возбуждения и кодировать с преобразованием спектральное разложение сигнала возбуждения и кодировать коэффициенты линейного прогнозирования в поток данных, при этом модуль оценки фонового шума выполнен с возможностью использовать спектральное разложение сигнала возбуждения в качестве представления в форме спектрального разложения входного аудиосигнала при определении параметрической оц�
Claims (18)
1. Аудиокодер, содержащий:
- модуль (12) оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;
- кодер (14) для кодирования входного аудиосигнала в поток данных в течение активной фазы; и
- детектор (16), выполненный с возможностью обнаруживать вход в неактивную фазу после активной фазы на основе входного сигнала,
- при этом аудиокодер выполнен с возможностью кодировать в поток данных параметрическую оценку фонового шума в неактивной фазе,
- при этом:
- модуль оценки фонового шума выполнен с возможностью идентифицировать локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивать спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек, или
- кодер выполнен с возможностью, при кодировании входного аудиосигнала, прогнозирующим образом кодировать входной аудиосигнал в коэффициенты линейного прогнозирования и сигнал возбуждения и кодировать с преобразованием спектральное разложение сигнала возбуждения и кодировать коэффициенты линейного прогнозирования в поток данных, при этом модуль оценки фонового шума выполнен с возможностью использовать спектральное разложение сигнала возбуждения в качестве представления в форме спектрального разложения входного аудиосигнала при определении параметрической оценки фонового шума.
2. Аудиокодер по п. 1, в котором модуль оценки фонового шума выполнен с возможностью осуществлять определение параметрической оценки фонового шума в активной фазе с различением между компонентом шума и компонентом полезного сигнала в представлении в форме спектрального разложения входного аудиосигнала и определять параметрическую оценку фонового шума только из компонента шума.
3. Аудиокодер по п. 1 или 2, в котором модуль оценки фонового шума выполнен с возможностью идентифицировать локальные минимумы в спектральном представлении сигнала возбуждения и оценивать спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек.
4. Аудиокодер по п. 1, в котором кодер выполнен с возможностью, при кодировании входного аудиосигнала, использовать прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть нижних частот представления в форме спектрального разложения входного аудиосигнала, и использовать параметрическое кодирование для того, чтобы кодировать спектральную огибающую части верхних частот представления в форме спектрального разложения входного аудиосигнала.
5. Аудиокодер по п. 1, в котором кодер выполнен с возможностью, при кодировании входного аудиосигнала, использовать прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть нижних частот представления в форме спектрального разложения входного аудиосигнала, и выбирать между использованием параметрического кодирования для того, чтобы кодировать спектральную огибающую части верхних частот представления в форме спектрального разложения входного аудиосигнала, или оставлением части верхних частот входного аудиосигнала некодированной.
6. Аудиокодер по п. 4, в котором кодер выполнен с возможностью прерывать прогнозирующее кодирование и/или кодирование с преобразованием и параметрическое кодирование в неактивных фазах или прерывать прогнозирующее кодирование и/или кодирование с преобразованием и выполнять параметрическое кодирование спектральной огибающей части верхних частот представления в форме спектрального разложения входного аудиосигнала при более низком частотно-временном разрешении по сравнению с использованием параметрического кодирования в активной фазе.
7. Аудиокодер по п. 4, в котором кодер использует гребенку фильтров для того, чтобы спектрально раскладывать входной аудиосигнал на набор подполос, формирующих часть нижних частот, и набор подполос, формирующих часть верхних частот.
8. Аудиокодер, содержащий:
- модуль (12) оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;
- кодер (14) для кодирования входного аудиосигнала в поток данных в течение активной фазы; и
- детектор (16), выполненный с возможностью обнаруживать вход в неактивную фазу после активной фазы на основе входного сигнала,
- при этом аудиокодер выполнен с возможностью кодировать в поток данных параметрическую оценку фонового шума в неактивной фазе,
- при этом кодер выполнен с возможностью, при кодировании входного аудиосигнала, использовать прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть нижних частот представления в форме спектрального разложения входного аудиосигнала, и использовать параметрическое кодирование для того, чтобы кодировать спектральную огибающую части верхних частот представления в форме спектрального разложения входного аудиосигнала,
- при этом кодер использует гребенку фильтров для того, чтобы спектрально раскладывать входной аудиосигнал на набор подполос, формирующих часть нижних частот, и набор подполос, формирующих часть верхних частот, и
- при этом модуль оценки фонового шума выполнен с возможностью обновлять параметрическую оценку фонового шума в активной фазе на основе частей нижних и верхних частот представления в форме спектрального разложения входного аудиосигнала.
9. Аудиокодер по п. 8, в котором модуль оценки фонового шума выполнен с возможностью, при обновлении параметрической оценки фонового шума, идентифицировать локальные минимумы в частях нижних и верхних частот представления в форме спектрального разложения входного аудиосигнала и выполнять статистический анализ частей нижних и верхних частот представления в форме спектрального разложения входного аудиосигнала в локальных минимумах для того, чтобы извлекать параметрическую оценку фонового шума.
10. Аудиокодер по п. 1, в котором модуль оценки шума выполнен с возможностью продолжать непрерывное обновление оценки фонового шума в течение неактивной фазы, при этом аудиокодер выполнен с возможностью прерывисто кодировать обновления параметрической оценки фонового шума, непрерывно обновляемой в течение неактивной фазы.
11. Аудиокодер по п. 10, при этом аудиокодер выполнен с возможностью прерывисто кодировать обновления параметрической оценки фонового шума в фиксированном или переменном интервале времени.
12. Аудиодекодер для декодирования потока данных таким образом, чтобы восстанавливать из него аудиосигнал, причем поток данных содержит, по меньшей мере, активную фазу, после которой идет неактивная фаза, причем аудиодекодер содержит:
- модуль (90) оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала, полученного из потока данных таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;
- декодер (92), выполненный с возможностью восстанавливать аудиосигнал из потока данных в течение активной фазы;
- параметрический генератор (94) случайных чисел; и
- генератор (96) фонового шума, выполненный с возможностью восстанавливать аудиосигнал в течение неактивной фазы посредством управления параметрическим генератором случайных чисел в течение неактивной фазы с помощью параметрической оценки фонового шума,
- при этом модуль оценки фонового шума выполнен с возможностью идентифицировать локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивать спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек.
13. Аудиодекодер по п. 12, в котором модуль оценки фонового шума выполнен с возможностью осуществлять определение параметрической оценки фонового шума в активной фазе и с различением между компонентом шума и компонентом полезного сигнала в представлении в форме спектрального разложения входного аудиосигнала и определять параметрическую оценку фонового шума только из компонента шума.
14. Аудиодекодер по п. 12, в котором декодер выполнен с возможностью, при восстановлении аудиосигнала из потока данных, применять формирование спектрального разложения сигнала возбуждения, кодированного с преобразованием в поток данных согласно коэффициентам линейного прогнозирования, также кодированным в данные, при этом модуль оценки фонового шума выполнен с возможностью использовать спектральное разложение сигнала возбуждения в качестве представления в форме спектрального разложения входного аудиосигнала при определении параметрической оценки фонового шума, посредством идентификации локальных минимумов в спектральном представлении сигнала возбуждения и оценки спектральной огибающей фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в спектральном представлении сигнала возбуждения в качестве опорных точек.
15. Способ кодирования аудио, содержащий этапы, на которых:
- определяют параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;
- кодируют входной аудиосигнал в поток данных в течение активной фазы; и
- обнаруживают вход в неактивную фазу после активной фазы на основе входного сигнала, и
- кодируют в поток данных параметрическую оценку фонового шума в неактивной фазе,
- при этом:
- определение параметрической оценки фонового шума содержит этап, на котором идентифицируют локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивают спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек, или
- кодирование входного аудиосигнала содержит этап, на котором прогнозирующим образом кодируют входной аудиосигнал в коэффициенты линейного прогнозирования и сигнал возбуждения и кодируют с преобразованием спектральное разложение сигнала возбуждения и кодируют коэффициенты линейного прогнозирования в поток данных, при этом определение параметрической оценки фонового шума содержит этап, на котором используют спектральное разложение сигнала возбуждения в качестве представления в форме спектрального разложения входного аудиосигнала при определении параметрической оценки фонового шума.
16. Способ кодирования аудио, содержащий этапы, на которых:
- определяют параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;
- кодируют входной аудиосигнал в поток данных в течение активной фазы; и
- обнаруживают вход в неактивную фазу после активной фазы на основе входного сигнала, и
- кодируют в поток данных параметрическую оценку фонового шума в неактивной фазе,
- при этом кодирование входного аудиосигнала содержит этап, на котором используют прогнозирующее кодирование и/или кодирование с преобразованием для того, чтобы кодировать часть нижних частот представления в форме спектрального разложения входного аудиосигнала, и используют параметрическое кодирование для того, чтобы кодировать спектральную огибающую части верхних частот представления в форме спектрального разложения входного аудиосигнала,
- при этом используют гребенку фильтров для того, чтобы спектрально раскладывать входной аудиосигнал на набор подполос, формирующих часть нижних частот, и набор подполос, формирующих часть верхних частот, и
- при этом определение параметрической оценки фонового шума содержит этап, на котором обновляют параметрическую оценку фонового шума в активной фазе на основе частей нижних и верхних частот представления в форме спектрального разложения входного аудиосигнала.
17. Способ декодирования потока данных таким образом, чтобы восстанавливать из него аудиосигнал, причем поток данных содержит, по меньшей мере, активную фазу, после которой идет неактивная фаза, при этом способ содержит этапы, на которых:
- определяют параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала, полученного из потока данных таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала;
- восстанавливают аудиосигнал из потока данных в течение активной фазы;
- восстанавливают аудиосигнал в течение неактивной фазы посредством управления параметрическим генератором случайных чисел в течение неактивной фазы с помощью параметрической оценки фонового шума,
- при этом определение параметрической оценки фонового шума содержит этап, на котором идентифицируют локальные минимумы в представлении в форме спектрального разложения входного аудиосигнала и оценивают спектральную огибающую фонового шума входного аудиосигнала с использованием интерполяции между идентифицированными локальными минимумами в качестве опорных точек.
18. Компьютерная программа, содержащая программный код для осуществления, при выполнении на компьютере, способа по п. 15.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
US61/442,632 | 2011-02-14 | ||
PCT/EP2012/052464 WO2012110482A2 (en) | 2011-02-14 | 2012-02-14 | Noise generation in audio codecs |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2013142079A true RU2013142079A (ru) | 2015-03-27 |
RU2585999C2 RU2585999C2 (ru) | 2016-06-10 |
Family
ID=71943600
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013142079/08A RU2585999C2 (ru) | 2011-02-14 | 2012-02-14 | Генерирование шума в аудиокодеках |
Country Status (17)
Country | Link |
---|---|
US (1) | US8825496B2 (ru) |
EP (2) | EP2676262B1 (ru) |
JP (3) | JP5934259B2 (ru) |
KR (1) | KR101624019B1 (ru) |
CN (1) | CN103477386B (ru) |
AR (2) | AR085895A1 (ru) |
AU (1) | AU2012217162B2 (ru) |
BR (1) | BR112013020239B1 (ru) |
CA (2) | CA2968699C (ru) |
ES (1) | ES2681429T3 (ru) |
MX (1) | MX2013009305A (ru) |
MY (1) | MY167776A (ru) |
RU (1) | RU2585999C2 (ru) |
SG (1) | SG192745A1 (ru) |
TW (1) | TWI480856B (ru) |
WO (1) | WO2012110482A2 (ru) |
ZA (1) | ZA201306874B (ru) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112012029132B1 (pt) | 2011-02-14 | 2021-10-05 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Representação de sinal de informações utilizando transformada sobreposta |
MX2013009344A (es) | 2011-02-14 | 2013-10-01 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral. |
KR101525185B1 (ko) | 2011-02-14 | 2015-06-02 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 |
EP2661745B1 (en) | 2011-02-14 | 2015-04-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
EP3471092B1 (en) | 2011-02-14 | 2020-07-08 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Decoding of pulse positions of tracks of an audio signal |
BR112013020587B1 (pt) | 2011-02-14 | 2021-03-09 | Fraunhofer-Gesellschaft Zur Forderung De Angewandten Forschung E.V. | esquema de codificação com base em previsão linear utilizando modelagem de ruído de domínio espectral |
US9530424B2 (en) * | 2011-11-11 | 2016-12-27 | Dolby International Ab | Upsampling using oversampled SBR |
CN103295578B (zh) | 2012-03-01 | 2016-05-18 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
EP2869299B1 (en) * | 2012-08-29 | 2021-07-21 | Nippon Telegraph And Telephone Corporation | Decoding method, decoding apparatus, program, and recording medium therefor |
PL2922053T3 (pl) * | 2012-11-15 | 2019-11-29 | Ntt Docomo Inc | Urządzenie do kodowania audio, sposób kodowania audio, program do kodowania audio, urządzenie do dekodowania audio, sposób dekodowania audio, i program do dekodowania audio |
WO2014096280A1 (en) | 2012-12-21 | 2014-06-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Comfort noise addition for modeling background noise at low bit-rates |
BR112015014212B1 (pt) | 2012-12-21 | 2021-10-19 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Geração de um ruído de conforto com alta resolução espectro-temporal em transmissão descontínua de sinais de audio |
CN106847297B (zh) * | 2013-01-29 | 2020-07-07 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
CN105190749B (zh) * | 2013-01-29 | 2019-06-11 | 弗劳恩霍夫应用研究促进协会 | 噪声填充技术 |
CN106169297B (zh) | 2013-05-30 | 2019-04-19 | 华为技术有限公司 | 信号编码方法及设备 |
CN105247610B (zh) * | 2013-05-31 | 2019-11-08 | 索尼公司 | 编码装置和方法、解码装置和方法以及记录介质 |
EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
EP2830059A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling energy adjustment |
CN104978970B (zh) * | 2014-04-08 | 2019-02-12 | 华为技术有限公司 | 一种噪声信号的处理和生成方法、编解码器和编解码系统 |
US10715833B2 (en) * | 2014-05-28 | 2020-07-14 | Apple Inc. | Adaptive syntax grouping and compression in video data using a default value and an exception value |
CN106409304B (zh) * | 2014-06-12 | 2020-08-25 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
EP2980801A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
EP2980790A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for comfort noise generation mode selection |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
CN106971741B (zh) * | 2016-01-14 | 2020-12-01 | 芋头科技(杭州)有限公司 | 实时将语音进行分离的语音降噪的方法及系统 |
JP7011449B2 (ja) | 2017-11-21 | 2022-01-26 | ソニーセミコンダクタソリューションズ株式会社 | 画素回路、表示装置および電子機器 |
US10650834B2 (en) * | 2018-01-10 | 2020-05-12 | Savitech Corp. | Audio processing method and non-transitory computer readable medium |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
KR20220005379A (ko) | 2020-07-06 | 2022-01-13 | 한국전자통신연구원 | 천이구간 부호화 왜곡에 강인한 오디오 부호화/복호화 장치 및 방법 |
CN114935698B (zh) * | 2022-04-07 | 2025-03-18 | 苏州恩巨网络有限公司 | 背景噪声的识别方法、装置、电子设备和存储介质 |
CN118673567B (zh) * | 2024-08-12 | 2025-01-03 | 山西智绘沧穹科技有限公司 | 基于智能移动终端的地理信息监测系统 |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5657422A (en) * | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10326100A (ja) * | 1997-05-26 | 1998-12-08 | Kokusai Electric Co Ltd | 音声録音方法及び音声再生方法及び音声録音再生装置 |
JP3223966B2 (ja) * | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7124079B1 (en) * | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
CN1145928C (zh) * | 1999-06-07 | 2004-04-14 | 艾利森公司 | 用参数噪声模型统计量产生舒适噪声的方法及装置 |
JP2002118517A (ja) | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
US20040142496A1 (en) * | 2001-04-23 | 2004-07-22 | Nicholson Jeremy Kirk | Methods for analysis of spectral data and their applications: atherosclerosis/coronary heart disease |
US20020184009A1 (en) * | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) * | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118834B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
FI118835B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
US7649988B2 (en) * | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
BRPI0607247B1 (pt) * | 2005-01-31 | 2019-10-29 | Skype | método para gerar uma seqüência de saída de amostras em resposta a uma primeira e uma segunda subseqüências de amostras, código de programa executável por computador, dispositivo de armazenamento de programa, e, arranjo para receber um sinal de áudio digitalizado |
JP4519169B2 (ja) * | 2005-02-02 | 2010-08-04 | 富士通株式会社 | 信号処理方法および信号処理装置 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
EP1866915B1 (en) * | 2005-04-01 | 2010-12-15 | Qualcomm Incorporated | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
RU2296377C2 (ru) * | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Способ анализа и синтеза речи |
US7610197B2 (en) * | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
RU2312405C2 (ru) * | 2005-09-13 | 2007-12-10 | Михаил Николаевич Гусев | Способ осуществления машинной оценки качества звуковых сигналов |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
JP4810335B2 (ja) | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
US7933770B2 (en) * | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
PL2052548T3 (pl) | 2006-12-12 | 2012-08-31 | Fraunhofer Ges Forschung | Koder, dekoder oraz sposoby kodowania i dekodowania segmentów danych reprezentujących strumień danych w dziedzinie czasu |
FR2911426A1 (fr) * | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
BRPI0816136B1 (pt) | 2007-08-27 | 2020-03-03 | Telefonaktiebolaget Lm Ericsson (Publ) | Método e dispositivo para processamento de sinal |
JP4886715B2 (ja) * | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 |
US8000487B2 (en) * | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
WO2010003532A1 (en) | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
US8352279B2 (en) * | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
TWI520128B (zh) | 2008-10-08 | 2016-02-01 | 弗勞恩霍夫爾協會 | 多解析度切換音訊編碼/解碼方案(一) |
JP5699141B2 (ja) | 2009-06-23 | 2015-04-08 | ヴォイスエイジ・コーポレーション | 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し |
ES2453098T3 (es) | 2009-10-20 | 2014-04-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Códec multimodo de audio |
-
2012
- 2012-02-14 ES ES12703807.3T patent/ES2681429T3/es active Active
- 2012-02-14 MX MX2013009305A patent/MX2013009305A/es active IP Right Grant
- 2012-02-14 MY MYPI2013002983A patent/MY167776A/en unknown
- 2012-02-14 SG SG2013061353A patent/SG192745A1/en unknown
- 2012-02-14 EP EP12703807.3A patent/EP2676262B1/en active Active
- 2012-02-14 CN CN201280018251.1A patent/CN103477386B/zh active Active
- 2012-02-14 RU RU2013142079/08A patent/RU2585999C2/ru active
- 2012-02-14 CA CA2968699A patent/CA2968699C/en active Active
- 2012-02-14 KR KR1020137024347A patent/KR101624019B1/ko active Active
- 2012-02-14 CA CA2827305A patent/CA2827305C/en active Active
- 2012-02-14 WO PCT/EP2012/052464 patent/WO2012110482A2/en active Application Filing
- 2012-02-14 JP JP2013553904A patent/JP5934259B2/ja active Active
- 2012-02-14 BR BR112013020239-4A patent/BR112013020239B1/pt active IP Right Grant
- 2012-02-14 EP EP18169093.4A patent/EP3373296B1/en active Active
- 2012-02-14 AR ARP120100480A patent/AR085895A1/es active IP Right Grant
- 2012-02-14 AU AU2012217162A patent/AU2012217162B2/en active Active
- 2012-02-14 TW TW101104680A patent/TWI480856B/zh active
-
2013
- 2013-08-14 US US13/966,551 patent/US8825496B2/en active Active
- 2013-09-12 ZA ZA2013/06874A patent/ZA201306874B/en unknown
-
2015
- 2015-09-18 JP JP2015184693A patent/JP6185029B2/ja active Active
- 2015-11-19 AR ARP150103773A patent/AR102715A2/es active IP Right Grant
-
2017
- 2017-07-26 JP JP2017144156A patent/JP6643285B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2013142079A (ru) | Генерирование шума в аудиокодеках | |
RU2013141934A (ru) | Аудиокодек, использующий синтез шума в течение неактивной фазы | |
JP7568695B2 (ja) | ハーモニックフィルタツールのハーモニック依存制御 | |
RU2013142133A (ru) | Основанная на линейном предсказании схема кодирования, использующая формирование шума в спектральной области | |
US10847166B2 (en) | Coding of spectral coefficients of a spectrum of an audio signal | |
CN107533847B (zh) | 音频编码器和音频解码器及对应的方法 | |
RU2573231C2 (ru) | Устройство и способ для кодирования части аудиосигнала с использованием обнаружения неустановившегося состояния и результата качества | |
RU2016105759A (ru) | Устройство и способ для кодирования или декодирования звукового сигнала с интеллектуальным заполнением интервалов в спектральной области | |
RU2016105764A (ru) | Контекстное энтропийное кодирование выборочных значений спектральной огибающей | |
CA2716926A1 (en) | Apparatus for mixing a plurality of input data streams | |
CA2998689C (en) | Encoder and method for encoding an audio signal with reduced background noise using linear predictive coding | |
RU2015102588A (ru) | Основанное на линейном предсказании кодирование аудио с использованием улучшенной оценки распределения вероятностей | |
RU2017103102A (ru) | Аудиопроцессор и способ для обработки аудиосигнала с использованием горизонтальной фазовой коррекции | |
RU2016105517A (ru) | Заполнение шумом при многоканальном кодировании аудио | |
RU2012147587A (ru) | Аудиокодер, аудиодекодер и связанные способы обработки многоканальных аудиосигналов с использованием комплексного предсказания | |
RU2017106099A (ru) | Кодер и декодер аудиосигнала , использующие процессор частотной области, процессор временной области и кросспроцессор для непрерывной инициализации | |
RU2013134227A (ru) | Кодирование звука с малой задержкой, содержащее чередующиеся предсказательное кодирование и кодирование с преобразованием | |
ATE489703T1 (de) | Vorrichtung und verfahren zur nachbearbeitung von spektralwerten sowie kodiergerät und dekodiergerät für audiosignale | |
RU2016101336A (ru) | Способ и устройство для получения спектральных коэффициентов для заменяющего кадра аудиосигнала, декодер аудио, приемник аудио и система для передачи аудиосигналов | |
RU2015127216A (ru) | Предсказание на основе модели в наборе фильтров с критической дискретизацией | |
RU2015116434A (ru) | Кодер, декодер и способы для обратно совместимого пространственного кодирования аудиообъектов с переменным разрешением | |
RU2018115787A (ru) | Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования | |
RU2016117073A (ru) | Передискретизация звукового сигнала для кодирования/декодирования с малой задержкой | |
US20140358527A1 (en) | Inactive Sound Signal Parameter Estimation Method and Comfort Noise Generation Method and System | |
KR20160075790A (ko) | 오디오 프레임 손실 은폐 |