RU2616774C1 - Аудиодекодер для декодирования битового аудиопотока, аудиокодер для кодирования звукового сигнала и способ декодирования кадра кодированного звукового сигнала - Google Patents
Аудиодекодер для декодирования битового аудиопотока, аудиокодер для кодирования звукового сигнала и способ декодирования кадра кодированного звукового сигнала Download PDFInfo
- Publication number
- RU2616774C1 RU2616774C1 RU2016127810A RU2016127810A RU2616774C1 RU 2616774 C1 RU2616774 C1 RU 2616774C1 RU 2016127810 A RU2016127810 A RU 2016127810A RU 2016127810 A RU2016127810 A RU 2016127810A RU 2616774 C1 RU2616774 C1 RU 2616774C1
- Authority
- RU
- Russia
- Prior art keywords
- parameter
- filter
- signal
- audio
- encoding
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 111
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000001914 filtration Methods 0.000 claims abstract description 105
- 238000001228 spectrum Methods 0.000 claims description 36
- 230000005540 biological transmission Effects 0.000 claims description 9
- 230000007774 longterm Effects 0.000 claims description 9
- 230000000737 periodic effect Effects 0.000 claims description 2
- 230000003321 amplification Effects 0.000 claims 1
- 238000003199 nucleic acid amplification method Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 5
- 239000000126 substance Substances 0.000 abstract 1
- 230000004044 response Effects 0.000 description 18
- 238000012545 processing Methods 0.000 description 14
- 230000003595 spectral effect Effects 0.000 description 13
- 230000005284 excitation Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000001755 vocal effect Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 230000007704 transition Effects 0.000 description 7
- 239000000463 material Substances 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01L—MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
- G01L19/00—Details of, or accessories for, apparatus for measuring steady or quasi-steady pressure of a fluent medium insofar as such details or accessories are not special to particular types of pressure gauges
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Algebra (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Lubrication Details And Ventilation Of Internal Combustion Engines (AREA)
- Fats And Perfumes (AREA)
- Filters For Electric Vacuum Cleaners (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
Изобретение относится к кодированию цифрового звука, в частности к кодированию звуковых сигналов, содержащих составляющие разного характера. Способ декодирования кадра кодированного звукового сигнала, при этом кодированный звуковой сигнал генерируют аудиокодером, при этом способ включает: извлечение первого параметра из кодированного звукового сигнала, при этом первый параметр представляет режим кодирования для кадра; извлечение второго параметра из кодированного звукового сигнала; запуск либо первого режима декодирования, либо второго режима декодирования на основе значения первого параметра; генерирование предварительного звукового сигнала из кодированного звукового сигнала при работе либо в первом режиме декодирования, либо во втором режиме декодирования; и фильтрацию предварительного звукового сигнала с помощью фильтра высоты тона. При этом при фильтрации используют второй параметр для выборочного подключения или отключения фильтра высоты тона, и второй параметр отличный от первого параметра. Технический результат заключается в ослаблении межгармонического шума. 3 н. и 17 з.п. ф-лы, 11 ил.
Description
Область технического применения
Настоящее изобретение, в общем, относится к кодированию цифрового звука и, точнее, к способам кодирования звуковых сигналов, содержащих составляющие разного характера.
Предпосылки изобретения
Широко распространенный класс способов кодирования звуковых сигналов, содержащих речь или пение, включает линейное предсказание с кодовым возбуждением (CELP), применяемое во временном чередовании с другими способами кодирования, в том числе со способами кодирования в частотной области, в особенности адаптированными для музыки, или способами общего характера, для того чтобы учесть изменения в характере между последовательными промежутками времени звукового сигнала. Например, упрощенный декодер согласно стандарту экспертной группы по вопросам движущегося изображения (MPEG) для унифицированного кодирования речи и звука (USAC; см. стандарт ISO/IEC 23003-3), как показано в верхней части сопроводительной фиг. 2, может действовать по меньшей мере в трех режимах декодирования: в режиме перспективного звукового кодирования (ААС; см. стандарт ISO/IEC 13818-7), в режиме алгебраического CELP (ACELP) и в режиме преобразования кодированного возбуждения (ТСХ).
Различные варианты осуществления CELP адаптированы к свойствам органов речи человека и, возможно, к слуховому восприятию человека. В том смысле, в каком он употребляется в данной заявке, термин «CELP» будет относиться ко всем возможным реализациям и вариантам, в том числе в качестве неограничивающих примеров: широко- и узкополосное CELP, SB-CELP (подполоса CELP), CELP с низкой и высокой скоростью, RCELP (ослабленное CELP), LD-CELP (CELP с малой задержкой), CS-CELP (CELP с сопряженной структурой), CS-ACELP (ACELP с сопряженной структурой), PSI-CELP (инновационное CELP с синхронным основным тоном) и VSELP (линейное предсказание с возбуждением векторной суммы). Принципы CELP обсуждаются R. Schroeder и S. Atal в Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), vol. 10, pp. 937-940, 1985, a некоторые его приложения описаны в ссылках 25 - 29, цитируемых в статье Chen и Gersho, IEEE Transactions on Speech and Audio Processing, vol. 3, no. 1, 1995. Как более подробно описано в первой статье, декодер CELP (или аналогично речевой синтезатор CELP) может включать предсказатель основного тона, который восстанавливает периодическую составляющую кодированного речевого сигнала, и импульсный кодовый словарь, из которого добавляется порождающая последовательность. Предсказатель основного тона может, в свою очередь, включать предсказатель с большой задержкой, предназначенный для восстановления форманта при помощи специального формирования огибающей спектра. В этом контексте основной тон понимается как основная частота тональной составляющей звука, генерируемой голосовыми связками и дополнительно окрашиваемой резонирующими участками речевого тракта. Эта частота вместе с ее гармониками будет доминировать в речи и пении. Вообще говоря, способы CELP лучше всего подходят для обработки сольного или одноголосного пения, для которого частота основного тона хорошо выражена и относительно легко определяется.
Для улучшения воспринимаемого качества речи, кодированной CELP, общепринятой практикой является сочетание CELP с постфильтрацией (или, иначе говоря, с усилением основного тона). Патент США №4969192 и раздел II статьи Chen и Gersho раскрывают требуемые свойства таких постфильтров, а именно: их способность подавлять шумовые составляющие, находящиеся между гармониками обнаруженного голосового основного тона (долгосрочная часть, см. раздел IV). Предполагается, что значительная часть этого шума является результатом формирования огибающей спектра. Долгосрочная часть простого постфильтра может быть сконструирована так, чтобы она имела следующую передаточную функцию:
где Т - оценочный период основного тона в выражении количества дискретных значений, и α - коэффициент усиления постфильтра, как показано на фиг. 1 и 2. По способу, сходному с гребенчатым фильтром, такой фильтр ослабляет частоты 1/(2Т), 3/(2Т), 5/(2Т), которые находятся посередине между гармониками основной частоты, и соседние частоты. Ослабление зависит от значения коэффициента усиления α. Несколько более сложные постфильтры применяют это усиление только к низким частотам - отсюда широко применяемый термин «басовый постфильтр», где шум воспринимается в наибольшей степени. Это можно выразить как каскадирование вышеописанной передаточной функции НЕ и фильтра прохождения низких частот HLP. Подвергнутый постобработке декодированный SE, создаваемый постфильтром, в области преобразования будет иметь вид:
где
и S - декодированный сигнал, который подается на вход постфильтра.
Фиг. 3 показывает вариант осуществления постфильтра с такими свойствами, который в дальнейшем обсуждается в разделе 6.1.3 технического описания ETSI TS 126 290, версия 6.3.0, публикация 6. Как показывает данная фигура, информация основного тона кодируется как параметр в сигнале битового потока и извлекается модулем отслеживания основного тона, коммуникативно подключенным к фильтру долгосрочного предсказания, осуществляющему операции, выраженные как PLT.
Долгосрочная часть, описанная в предыдущем параграфе, может использоваться отдельно. В альтернативном варианте она располагается последовательно с фильтром преобразования шума, который сохраняет составляющие в интервалах частот, соответствующих формантам, и ослабляет шум в других областях спектра (краткосрочная часть, см. раздел III), т.е. во «впадинах спектра», огибающей формант. В качестве другого возможного изменения данная совокупность фильтров также дополняется последовательным фильтром, относящимся к типу фильтров прохождения верхних частот, с целью снижения воспринимаемого ухудшения качества из-за наклона спектра краткосрочной части.
Звуковые сигналы, содержащие смесь составляющих различного происхождения, - например тонального, нетонального, вокального, инструментального, немузыкального, - не всегда удовлетворительно воспроизводятся имеющимися технологиями кодирования. Точнее было отметить, что имеющиеся технологии являются недостаточными для обработки такого неоднородного звукового материала и, как правило, отдают предпочтение одной из составляющих в ущерб остальным. В частности, музыка, содержащая пение под аккомпанемент одного или нескольких инструментов или хоровые фрагменты, кодированная способами, сущность которых описана выше, часто будет декодироваться с воспринимаемыми артефактами, которые частично портят впечатление от прослушивания.
Краткое описание изобретения
Для того чтобы ослабить, по меньшей мере, некоторые из недостатков, описанных в предыдущем разделе, целью настоящего изобретения является предоставление способов и устройств, адаптированных для кодирования звука и декодирования сигналов, содержащих смесь составляющих различного происхождения. Как частные цели, изобретение добивается создания таких способов и устройств, которые являются пригодными с точки зрения эффективности кодирования и (воспринимаемой) точности воспроизведения или и того и другого.
Изобретение достигает по меньшей мере одной из этих целей путем создания системы кодера, системы декодера, способа кодирования, способа декодирования и компьютерных программных продуктов, предназначенных для осуществления каждого из указанных способов, которые определены в независимых пунктах формулы изобретения. Зависимые пункты формулы изобретения определяют варианты осуществления изобретения.
Авторы изобретения осознали, что некоторые артефакты, воспринимаемые в декодированных звуковых сигналах неоднородного происхождения, являются следствием несоответствующего переключения между различными режимами кодирования, по меньшей мере один из которых включает постфильтрацию в декодере, и по меньшей мере один из которых ее не включает. Точнее, имеющиеся постфильтры устраняют не только межгармонический шум (и там, где это применимо, шум во впадинах спектра), но также составляющие сигнала, представляющие инструментальный или вокальный аккомпанемент и другой материал «желательной» природы. То, что порог различимости во впадинах спектра может составлять вплоть до 10 дБ (как отмечено Ghitza и Goldstein, IEEE Trans. Acoust, Speech, Signal Processing, vol. ASSP-4, pp. 697-708, 1986), можно считать оправданием многих разработчиков, которое позволяет жестко фильтровать эти полосы частот. Однако само по себе ухудшение качества за счет межгармонического ослабления (и ослабления во впадинах спектра) может быть менее важно, чем ухудшение качества в случае переключения. Когда включается постфильтр, фон звуков певческого голоса внезапно приглушается, а когда фильтр деактивируется, фон немедленно становится более звучным. Если переключение происходит часто по причине сущности звукового сигнала или из-за конфигурации кодирующего устройства, будет возникать артефакт переключения. Как пример декодер USAC может действовать или в режиме ACELP в сочетании с постфильтрацией, или в режиме ТСХ без постфильтрации.
Режим ACELP используется во фрагментах, где присутствует доминантная вокальная составляющая. Поэтому переключение в режим ACELP может запускаться с началом пения, как, например, в начале новой музыкальной фразы, в начале нового куплета или просто после фрагмента, где аккомпанемент считается заглушающим певческий голос в том смысле, что вокальная составляющая больше не является выраженной. Эксперименты подтвердили, что альтернативное решение или, иначе говоря, обход проблемы, в котором кодирование ТСХ используется везде (а режим ACELP отключается), не исправляет проблему, поскольку появляются артефакты, подобные искусственному эху.
Соответственно в первой и второй особенностях изобретение предусматривает способ кодирования звука (и систему кодирования звука с соответствующими характерными признаками), который отличается тем, что принимается решение о том, следует ли устройству, которое будет декодировать битовый поток, являющийся выходным сигналом способа кодирования, применять постфильтрацию, включающую ослабление межгармонического шума. Результат принятия этого решения кодируется в битовом потоке и является доступным для декодирующего устройства.
Согласно изобретению решение о том, следует ли использовать постфильтр, принимается отдельно от решения о наиболее подходящем режиме кодирования. Это делает возможным поддержание одного состояния постфильтрации в течение всего промежутка такой длительности, что переключение не будет раздражать слушателя. Таким образом, способ кодирования может предписывать, чтобы постфильтр поддерживался в неактивном состоянии даже тогда, когда он переключается в режим кодирования, где этот фильтр обычно активен.
Следует отметить, что решение о том, следует ли применять постфильтрацию, обычно принимается по кадрам. Поэтому, во-первых, постфильтрация не применяется менее, чем для одного кадра за раз. Во-вторых, решение о том, отключать ли постфильтрацию, действительно только для длительности текущего кадра, и для следующего кадра оно может или сохраняться или пересматриваться. В формате кодирования, допускающем основной формат кадра и сокращенный формат, который является долей нормального формата, например составляет 1/8 его длины, может не быть необходимости в принятии решений о постфильтрации для отдельных сокращенных кадров. Вместо этого может рассматриваться некоторое количество сокращенных кадров, просуммированных до нормального кадра, и параметры, относящиеся к решению о фильтрации, могут быть получены путем вычисления среднего или медианы включаемых в него сокращенных кадров.
В третьей и четвертой особенностях изобретения предусматривается способ декодирования звука (и система декодирования звука, которая включает соответствующие характерные признаки), где за этапом декодирования следует этап постфильтрации, который включает ослабление межгармонического шума и отличается тем, что включает этап отключения постфильтра в соответствии с информацией о постфильтрации, кодированной в сигнале битового потока.
Благодаря своей способности деактивировать постфильтр в зависимости только от информации о постфильтрации, т.е. независимо от таких факторов, как текущий режим кодирования, способ декодирования с такими характеристиками хорошо подходит для кодирования звуковых сигналов смешанного происхождения. При применении способов кодирования, в которых активность постфильтра традиционно связана с конкретными режимами кодирования, способность отключения постфильтрации делает возможным новый рабочий режим, а именно применение без фильтрации традиционного режима декодирования с фильтрацией.
В следующей особенности изобретение также предусматривает компьютерный программный продукт, предназначенный для выполнения одного из вышеописанных способов. Кроме того, изобретение предусматривает постфильтр, предназначенный для ослабления межгармонического шума, который может действовать или в активном режиме, или в режиме пропускания, что указывается сигналом постфильтрации, подаваемым на постфильтр. Постфильтр может включать секцию принятия решения, предназначенную для автономного управления активностью постфильтра.
Как понятно специалистам, кодер, адаптированный для совестной работы с декодером, оснащается функционально эквивалентными модулями для того, чтобы он допускал достоверное воспроизведение кодированного сигнала. Указанные эквивалентные модули могут представлять собой идентичные, или сходные, модули или модули, имеющие идентичные, или сходные, передаточные характеристики. В частности, модули кодера и декодера соответственно могут представлять собой сходные или несходные блоки обработки, исполняющие соответствующие компьютерные программы, которые выполняют эквивалентные наборы математических операций.
В одном из вариантов осуществления изобретения настоящий способ включает принятие решения в отношении того, включает ли постфильтр ослабление впадин спектра (относительно огибающей формант, см. выше). Это соответствует краткосрочной части постфильтра. Поэтому преимущественной является адаптация критерия, на котором основывается решение, к сущности постфильтра.
Один из вариантов осуществления изобретения направлен на кодер, в особенности адаптированный для кодирования речи. Так как некоторые из проблем, служащих мотивом изобретения, наблюдались тогда, когда кодировалась смесь вокальных и других составляющих, особенно преимущественным является независимое принятие решения относительно постфильтрации, предоставляемое изобретением. В частности, такой декодер может включать модуль кодирования в режиме линейного предсказания с кодовым возбуждением.
В одном из вариантов осуществления изобретения кодер основывает свое решение на обнаруженном одновременном присутствии составляющей сигнала с доминантной основной частотой (основным тоном) и другой составляющей сигнала, находящейся ниже основной частоты. Обнаружение также может иметь целью нахождение совместного присутствия составляющей с доминантной основной частотой и другой составляющей с энергией, находящейся между гармониками этой основной частоты. В такой ситуации часто встречаются артефакты рассматриваемого типа. Тогда если установлено указанное одновременное присутствие, кодер будет принимать решение о том, что постфильтрация не является подходящей, что будет соответствующим образом указано в информации о постфильтрации, которая содержится в битовом потоке.
Один из вариантов осуществления изобретения использует в качестве критерия обнаружения содержание полной мощности сигнала во временном звуковом сигнале ниже частоты основного тона, где частота основного тона, возможно, оценивается в кодере при помощи долгосрочного предсказания. Если указанная мощность больше предварительно определенного порогового значения, считается, что помимо составляющей основного тона, (включая гармоники,присутствуют другие значимые составляющие, что будет приводить к отключению постфильтра.
В кодере, содержащем модуль CELP, можно извлечь пользу из того, что модуль оценивает частоту основного тона временного звукового сигнала. Тогда дальнейший критерий обнаружения, как более подробно описано выше, заключается в проверке запаса энергии между гармониками этой частоты или ниже нее.
В качестве дальнейшего развития предшествующего варианта осуществления изобретения, включающего модуль CELP, принятие решения может включать сравнение оценочной энергии звукового сигнала при его CELP-кодировании (т.е. кодировании и декодировании) с оценочной энергией звукового сигнала при CELP-кодировании и постфильтрации. Если разность энергий больше порогового значения, что может указывать на то, что значимая нешумовая составляющая сигнала будет потеряна, а кодер будет принимать решение об отключении постфильтра.
В преимущественном варианте осуществления изобретения кодер содержит модуль CELP и модуль ТСХ. Как известно в данной области техники, ТСХ-кодирование является преимущественным в отношении некоторых типов сигналов, в особенности, невокальных сигналов. Применение постфильтрации на ТСХ-кодированном сигнале не является общепринятой практикой. Поэтому кодер может выбрать или ТСХ-кодирование, или CELP-кодирование с постфильтрацией, или CELP-кодирование без постфильтрации, таким образом, охватывая значительный диапазон типов сигналов.
Как одно из дальнейших развитий предшествующего варианта осуществления изобретения, решение о выборе между тремя режимами кодирования принимается на основе критерия зависимости искажений от скорости передачи данных, т.е. с применением и оптимизацией процедуры, которая сама по себе известна в данной области техники.
В другом дальнейшем развитии предшествующего варианта осуществления изобретения кодер также включает кодер согласно стандарту усовершенствованного звукового кодирования (ААС), который, как известно, также особенно хорошо подходит для некоторых типов сигналов. Предпочтительно, решение о том, применять ли ААС-кодирование (в частотной области), принимается независимо от решения о том, какие другие режимы (линейного предсказания) использовать. Поэтому такой кодер может пониматься как действующий в двух суперрежимах: ААС или TCX/CELP, где в последнем режиме которых кодер будет делать выбор между ТСХ, CELP с постфильтрацией и CELP без фильтрации. Этот вариант осуществления изобретения позволяет обрабатывать еще более широкий диапазон типов звуковых сигналов.
В одном из вариантов осуществления изобретения кодер может принимать решение о том, что постфильтрация при декодировании должна применяться постепенно, т.е. с постепенно возрастающим усилением. Аналогично он может принять решение о том, что постфильтрация будет постепенно устраняться. Такое постепенное применение и устранение делает менее ощутимым переключение между режимами с постфильтрацией и без нее. Например, вокальному фрагменту, для которого найдено подходящим CELP-кодирование с постфильтрацией, может предшествовать инструментальный фрагмент, где оптимальным является ТСХ-кодирование; тогда декодер согласно изобретению может применять постфильтрацию постепенно вблизи или в начале вокального фрагмента так, чтобы выгоды постфильтрации сохранялись, хотя раздражающие артефакты переключения при этом устраняются.
В одном из вариантов осуществления изобретения решение о том, следует ли применять постфильтрацию, основывается на приближенном разностном сигнале, который служит приближением той составляющей сигнала, которая будет устраняться постфильтром из будущего декодированного сигнала.
В качестве одной из возможностей приближенный разностный сигнал вычисляется как разность между временным звуковым сигналом и временным звуковым сигналом, подвергнутым (имитации) постфильтрации. В качестве другой возможности секция кодирования извлекает промежуточный декодированный сигнал с тем, чтобы можно было вычислить приближенный разностный сигнал как разность между временным звуковым сигналом и промежуточным декодированным сигналом, подвергнутым постфильтрации. Промежуточный декодированный сигнал может сохраняться в буфер долгосрочного предсказания кодера. В дальнейшем он может представлять сигнал возбуждения в предположении, что для получения конечного декодированного сигнала потребуется применение дальнейшей синтезирующей фильтрации (речевой тракт, резонансы). Суть использования промежуточного декодированного сигнала заключается в том, что он фиксирует некоторые из деталей, в особенности слабости способа кодирования, и, таким образом, позволяет более реалистично оценивать влияние постфильтра. В качестве третьей возможности секция декодирования извлекает промежуточный декодированный сигнал, посредством чего можно вычислить приближенный разностный сигнал как разность между промежуточным декодированным сигналом и промежуточным декодированным сигналом, подвергнутым постфильтрации. Вероятно, эта процедура дает менее надежную оценку, чем две первые возможности, но, с другой стороны, она может осуществляться декодером автономно.
Полученный таким образом приближенный разностный сигнал затем оценивается в отношении одного из следующих критериев, которые при их установлении в утвердительном смысле будут приводить к решению об отключении постфильтра:
a) превышает ли мощность приближенного разностного сигнала предварительно определенное пороговое значение, указывающее на то, что постфильтром может быть устранена значимая часть сигнала;
b) является ли характер приближенного разностного сигнала скорее тональным, чем шумоподобным;
c) неравномерно ли распределена разность между частотными спектрами абсолютных значений приближенного разностного сигнала и временного звукового сигнала относительно частоты, что показывает, что это не столько шум, сколько сигнал, который мог бы иметь смысл для слушателя;
d) локализован ли частотный спектр абсолютных значений приближенного разностного сигнала в интервалах частот, находящихся в пределах предварительно определенной огибающей значимости, основанной на том, что может обычно ожидаться от сигнала обрабатываемого типа; и
e) локализован ли частотный спектр абсолютных значений приближенного разностного сигнала в интервалах частот, находящихся в пределах предварительно определенной огибающей значимости, полученной путем пороговой обработки частотного спектра абсолютных значений временного звукового сигнала по абсолютному значению наибольшей составляющей сигнала, здесь уменьшенной в масштабе с предварительно определенным масштабным коэффициентом.
При оценке критерия е) преимущественным является применение отслеживания пиков в спектре абсолютных значений, т.е. различение участков, имеющих форму, похожую на пик, обычно связанных скорее с тональными составляющими, чем с шумом. Составляющие, идентифицированные при помощи отслеживания пиков, которое может иметь место посредством какого-либо алгоритма, который сам по себе известен в данной области техники, могут в дальнейшем сортироваться с применением порога по высоте пика с тем, чтобы оставшиеся составляющие представляли собой тональный материал с определенным абсолютным значением. Эти составляющие обычно скорее представляют значимое содержимое сигнала, чем шум, что служит мотивом принять решение об отключении постфильтра.
В одном из вариантов осуществления изобретения как декодера решение об отключении постфильтра исполняется переключателем, управляемым секцией управления и способным обходить постфильтр в схеме. В другом варианте осуществления изобретения постфильтр имеет варьируемое усиление, управляемое секцией управления, или регулятором усиления в ней, где решение об отключении осуществляется путем присвоения коэффициенту усиления постфильтра (см. предыдущий раздел) нулевого значения или путем присвоения ему абсолютного значения ниже предварительно определенного порогового значения.
В одном из вариантов осуществления изобретения декодирование согласно настоящему изобретению включает извлечение информации о постфильтрации из декодируемого сигнала битового потока. Точнее, информация о постфильтрации может кодироваться в поле данных, включающем по меньшей мере один бит в формате, пригодном для передачи. Преимущественно поле данных представляет собой уже существующее поле данных, определяемое применяющимся стандартом, но не находящееся в употреблении, и, таким образом, информация о постфильтрации не увеличивает полезную нагрузку при передаче.
Следует отметить, что способы и устройство, раскрытые в данном разделе, могут применяться после соответствующих модификаций в пределах способностей специалиста, в том числе путем стандартных экспериментов для кодирования сигналов, содержащих несколько составляющих, возможно, относящихся к различным каналам, таким как стереофонические каналы. Везде в настоящей заявке термины «усиление основного тона» и «постфильтрация» употребляются как синонимы. Также следует отметить, что ААС обсуждается в качестве репрезентативного примера способов кодирования в частотной области. Действительно, применение изобретения к иному, чем ААС, декодеру или кодеру, действующему в режиме кодирования в частотной области, потребует лишь небольших модификаций, если вообще их потребует, в пределах способностей специалиста. Сходным образом ТСХ упоминается в качестве примера кодирования в режиме преобразования с взвешенным линейным предсказанием или кодирования с преобразованием вообще.
Характерные признаки из двух или большего количества вышеописанных вариантов осуществления изобретения могут объединяться, если они не являются дополнительными в явном виде, в дальнейшие варианты осуществления изобретения. То, что два характерных признака цитируются в различных пунктах формулы изобретения, не препятствует тому, чтобы они могли быть выгодно объединены. Аналогично дальнейшие варианты осуществления изобретения также могут снабжаться пропусками некоторых характерных признаков, которые не являются необходимыми или не являются существенными для желаемой цели.
Краткое описание графических материалов
Варианты осуществления настоящего изобретения ниже будут описаны с отсылкой к сопутствующим графическим материалам, на которых:
фиг. 1 - блок-схема, показывающая традиционный декодер с постфильтром;
фиг. 2 - принципиальная блок-схема традиционного декодера, действующего в режимах ААС, ACELP и ТСХ и включающего постфильтр, постоянно подключенный в нисходящем направлении относительно модуля ACELP;
фиг. 3 - блок схема, иллюстрирующая конструкцию постфильтра.
фиг. 4 и 5 - блок-схемы двух декодеров согласно изобретению;
фиг. 6 и 7 - блок-схемы, иллюстрирующие различия между традиционным декодером (фиг. 6) и декодером (фиг. 7) согласно изобретению;
фиг. 8 - блок-схема кодера согласно изобретению;
фиг. 9 и 10 - блок-схемы, иллюстрирующие различия между традиционным декодером (фиг. 9) и декодером (фиг. 10) согласно изобретению; и
фиг. 11 - блок-схема автономного постфильтра, который может избирательно активироваться и деактивироваться.
Подробное описание вариантов осуществления изобретения
Фиг. 4 представляет собой схематическую иллюстрацию системы 400 декодера согласно одному из вариантов осуществления изобретения, имеющего в качестве входного сигнал битового потока и звуковой сигнал на выходе. Как и в традиционных декодерах, показанных на фиг. 1, постфильтр 440 располагается в нисходящем направлении относительно модуля 410 декодирования, но может включаться или выключаться из тракта декодирования путем приведения в действие переключателя 442. В положении, показанном на фигуре, постфильтр включен. Его можно отключить, если установить переключатель в противоположное положение, посредством чего сигнал из модуля 410 декодирования будет вместо этого проводиться по шине 444 обхода. В качестве вклада, обладающего признаками изобретения, переключатель 442 управляется посредством информации о постфильтрации, содержащейся в сигнале битового потока, и, таким образом, постфильтрация может применяться и сниматься независимо от текущего состояния модуля 410 декодирования. Поскольку постфильтр 440 действует с некоторой задержкой, например, постфильтр, показанный на фиг. 3, вносит задержку с величиной, равной, по меньшей мере, периоду Т основного тона, с целью поддержания модулей в синхронизированных условиях при переключении на шине 444 обхода располагается модуль 443 компенсации задержки. Модуль 443 задержки задерживает сигнал на тот же период, на который мог бы его задерживать постфильтр 440. Для минимизации времени переключения модуль 443 компенсации задержки во все моменты времени принимает тот же сигнал, что и постфильтр 440. В альтернативном варианте осуществления изобретения, где постфильтр 440 заменяется постфильтром с нулевой задержкой (например, причинным фильтром, таким как фильтр с двумя звеньями, не зависящий от будущих значений сигнала), модуль 443 компенсации задержки может быть пропущен.
Фиг. 5 иллюстрирует дальнейший вариант осуществления изобретения в соответствии с идеями изобретения в отношении трехрежимной системы 500 декодера по фиг. 2. Модуль 511 ACELP-декодирования располагается параллельно модулю 512 ТСХ-декодирования и модулю 513 ААС-декодирования. Последовательно с модулем 511 ACELP-декодирования располагается постфильтр 540, предназначенный для ослабления шума, в частности шума, находящегося между гармониками частоты основного тона, напрямую или не напрямую получаемой из сигнала битового потока, для чего адаптирована система 500 декодера. Сигнал битового потока также кодирует информацию о постфильтрации, регулирующую положения верхнего переключателя 541, который действует для выключения постфильтра 540 из тракта обработки и его замены компенсацией ошибок 543, как на фиг. 4. Нижний переключатель 542 используется для переключения между различными режимами декодирования. В такой конструкции, когда используется один из модулей 512, 513, ТСХ или ААС, положение верхнего переключателя 541 не играет роли; поэтому информация о постфильтрации необязательно указывает это положение, за исключением режима ACELP. Какой бы из режимов декодирования ни использовался в текущий момент, сигнал подается из точки подсоединения нижнего переключателя 542 в нисходящем направлении в модуль 550 репликации спектральной полосы (SBR), который выводит звуковой сигнал. Специалистам будет понятно, что данная иллюстрация имеет концептуальную природу, что явно видно в особенности из того, что переключатели показаны схематично как отдельные физические сущности с подвижными контактными средствами. В возможной реальной имплементации системы декодера переключатели, а также и другие модули могут осуществляться посредством машиночитаемых команд.
Фиг. 6 и 7 также представляют собой блок-схемы двух трехрежимных систем декодера, действующих в режимах ACELP, ТСХ и в режиме декодирования в частотной области. С отсылкой к последней упомянутой фигуре, которая показывает вариант осуществления изобретения, сигнал битового потока подается в точку 701 ввода, которая, в свою очередь, постоянно соединена посредством соответствующих ветвей с тремя модулями 711, 712, 713 декодирования. Точка 701 ввода также содержит соединительную ветвь 702 (отсутствующую в традиционной системе декодирования по фиг. 6), направленную к модулю 740 усиления основного тона, который играет роль описанного выше постфильтра обобщенного типа. Как является общей практикой в данной области, в нисходящем направлении относительно модулей 711, 712 ACELP и ТСХ расположен первый модуль 703 кадрирования перехода, предназначенный для осуществления переходов между модулями декодирования. Второй модуль 704 перехода расположен в нисходящем направлении относительно модуля 713 декодирования в частотной области и первого модуля 703 кадрирования перехода и предназначен для осуществления перехода между двумя суперрежимами. В восходящем направлении непосредственно перед точкой 705 вывода расположен модуль 750 SBR. Ясно, что сигнал битового потока подается непосредственно (или, при необходимости, после демультиплексирования) во все три модуля 711, 712, 713 декодирования и в модуль 740 усиления основного тона. Информация, содержащаяся в битовом потоке, управляет тем, какой из модулей декодирования будет активен. Однако согласно изобретению модуль 740 усиления основного тона выполняет аналогичную самоактивацию и в ответ на информацию о постфильтрации в битовом потоке может выступать как постфильтр или просто как пропускающий канал. Например, это может реализовываться путем снабжения модуля 740 усиления основного тона секцией управления (не показана), посредством которой действие постфильтрации может включаться или выключаться. Когда система действует в режиме декодирования в частотной области или в режиме ТСХ-декодирования, где, строго говоря, какая-либо информация о постфильтрации не является необходимой, модуль 740 усиления основного тона всегда находится в режиме пропускания. Следует понимать, что модули, не образующие часть вклада, обладающего признаками изобретения, и присутствие которых очевидно для специалистов, например демультиплексор, для большей ясности пропущены на фиг. 7 и на других сходных иллюстрациях.
Как вариант система декодера по фиг. 7 может оснащаться модулем управления (не показан), предназначенным для принятия решения о том, следует ли применять постфильтрацию с использованием подхода «анализ через синтез». Указанный модуль управления коммуникативно связан с модулем 740 усиления основного тона и с модулем 711 ACELP, из которого он извлекает промежуточные декодированные сигналы , представляющие один из промежуточных этапов процесса декодирования, предпочтительно этап, соответствующий возбуждению сигнала. Модуль обнаружения содержит необходимую информацию для имитации действия модуля 740 усиления основного тона, что определяется передаточными функциями PLT(z) и HLP(z) (см. раздел Предпосылки и фиг. 3), или эквивалентно их импульсными переходными характеристиками фильтра pLT(z) и hLP(n). Как следует из обсуждения в разделе Предпосылки изобретения, составляющая, которая будет вычитаться при постфильтрации, может оцениваться при помощи приближенного разностного сигнала sAD(n), который пропорционален , где * обозначает дискретную свертку. Это приближение является приближением истинной разности между оригинальным звуковым сигналом и декодированным сигналом, подвергнутым постфильтрации, а именно:
где α - коэффициент усиления постфильтра.
Изучая полную энергию, энергию низкочастотной полосы, тональность, актуальный спектр абсолютных значений или спектр абсолютных значений этого сигнала в прошлом, как раскрывается в разделе Краткое описание изобретения и в формуле изобретения, секция управления может находить основание для принятия решения о том, активировать или деактивировать модуль 740 усиления основного тона.
Фиг. 8 показывает систему 800 кодера согласно одному из вариантов осуществления изобретения. Система 800 кодера адаптирована для обработки цифровых звуковых сигналов, которые, в общем, получаются путем сбора данных звуковой волны микрофоном и преобразования волны в аналоговый электрический сигнал. Электрический сигнал затем дискретизируется в цифровой сигнал, поддающийся передаче в подходящем формате в систему 800 кодера. В общем, система состоит из модуля 810 кодирования, модуля 820 принятия решения и мультиплексора 830. При помощи переключателей 814, 815 (представленных символически) модуль кодирования может действовать или в режиме CELP, или в режиме ТСХ, или в режиме ААС путем избирательного приведения в действие модулей 811, 812, 813. Модуль 820 принятия решения применяет один или несколько предварительно определенных критериев для принятия решения об отключении постфильтрации во время декодирования сигнала битового потока, генерируемый системой 800 кодера, будет кодировать звуковой сигнал. Для этого модуль 820 принятия решения может исследовать непосредственно звуковой сигнал или может получать данные из модуля 810 кодирования через линию связи 816. Сигнал, служащий признаком решения, которое принимается модулем 820 принятия решения, совместно с кодированным звуковым сигналом из модуля 810 кодирования доставляется в мультиплексор 830, который сцепляет сигналы в битовый поток, составляющий выходной сигнал системы 800 декодера.
Предпочтительно модуль 820 принятия решения основывает свое решение на приближенном разностном сигнале, вычисляемом из промежуточного кодированного сигнала , который может вычитаться из модуля 810 декодирования. Промежуточный декодированный сигнал представляет промежуточный этап процесса декодирования, что обсуждалось в предшествующих параграфах, но может извлекаться из соответствующего этапа процесса кодирования. Однако для системы 800 кодера доступен оригинальный звуковой сигнал SORIG, поэтому предпочтительно приближенный разностный сигнал формируется как:
Это приближение основывается на том, что вместо конечного декодированного сигнала используется промежуточный декодированный сигнал. Это позволяет оценить сущность составляющей, которую постфильтр мог бы удалять при декодировании, и, применяя один из критериев, обсуждаемых в разделе Краткое описание изобретения - модуль 820 принятия решения будет способен принять решение о том, отключать ли постфильтрацию.
Как вариант модуль 820 принятия решения может использовать оригинальный сигнал вместо промежуточного кодированного сигнала, и, таким образом, приближенным разностным сигналом будет являться сигнал . Вероятно, это приближение будет менее достоверным, но, с другой стороны, оно делает необязательным присутствие линии связи 816 между модулем 820 принятия решения и модулем 810 кодирования.
В тех других изменениях данного варианта осуществления изобретения, где модуль 820 принятия решения изучает звуковой сигнал непосредственно, может применяться один или несколько следующих критериев:
- содержит ли звуковой сигнал и составляющую с доминантной основной частотой, и составляющую, находящуюся ниже основной частоты? (Основная частота может подаваться как побочный продукт модуля 810 кодирования);
- содержит ли звуковой сигнал и составляющую с доминантной основной частотой, и составляющую, находящуюся между гармониками основной частоты?
- содержит ли звуковой сигнал значительную энергию сигнала ниже основной частоты?
- Является ли декодирование с постфильтрацией (как возможный результат) предпочтительным перед декодированием без фильтрации в отношении оптимальной зависимости искажений от скорости передачи данных?
Во всех описанных изменениях конструкции кодера, показанной на фиг. 8, т.е. независимо от основания критерия обнаружения, - секция 820 принятия решения может быть подключена для принятия решения о постепенном начале или постепенном снятии постфильтрации с тем, чтобы добиться гладких переходов. Постепенное начало и снятие может управляться путем регулировки коэффициента усиления постфильтра.
Фиг. 9 показывает традиционный декодер, действующий в режиме частотного декодирования и в режиме CELP-декодирования в зависимости от сигнала битового потока, подаваемого в декодер. Постфильтрация применяется всякий раз, когда выбирается режим CELP-декодирования. Усовершенствование этого декодера проиллюстрировано на фиг. 10, которая показывает декодер 1000 согласно одному из вариантов осуществления изобретения. Этот декодер действует не только в режиме декодирования в частотной области, где активен модуль 1013 декодирования в частотной области, и в режиме CELP-декодирования с фильтрацией, где активен модуль 1011 CELP-декодирования и постфильтр 1040, но также и в режиме CELP без фильтрации, в котором модуль 1011 CELP подает сигнал в модуль 1043 компенсации задержки по шине 1044 обхода. Переключатель 1042 управляет тем, какой из режимов декодирования активен в настоящий момент, в ответ на информацию о постфильтрации, содержащуюся в сигнале битового потока, доставляемом в декодер 1000. В этом декодере и в декодере по фиг.9 последний этап обработки выполняется модулем 1050 SBR, выходным сигналом которого является конечный звуковой сигнал.
Фиг. 11 показывает постфильтр 1100, пригодный для размещения в нисходящем направлении относительно декодера 1199. Фильтр 1100 включает модуль 1140 постфильтрации, который подключается или отключается модулем управления (не показан), в особенности двоичным или недвоичным регулятором усиления, в ответ на сигнал постфильтрации, принимаемый из модуля 1120 принятия решения в постфильтре 1100. Модуль принятия решения выполняет одно или несколько проверок сигнала, принимаемого из декодера, достигая решения о том, будет модуль постфильтрации являться активным или неактивным. Решение может приниматься в направлении функциональных возможностей модуля 820 принятия решения по фиг.8, который использует оригинальный сигнал и/или промежуточный кодированный сигнал для предсказания действия постфильтра. Решение модуля 1120 принятия решения также может основываться на информации сходной с той, которую модули принятия решения используют в тех вариантах осуществления изобретения, где формируется промежуточный декодированный сигнал. Например, модуль 1120 принятия решения может оценивать частоту основного тона (если только она не извлекается легко из сигнала битового потока) и вычислять запас энергии в сигнале ниже частоты основного тона и между ее гармониками. Если этот запас энергии является значительным, он, вероятно, представляет значимую составляющую сигнала, а не шум, что служит мотивом для принятия решения об отключении модуля 1140 постфильтрации.
Для шести человек было осуществлено испытание прослушивания, в ходе которого музыкальные фрагменты, кодированные и декодированные в соответствии с изобретением, сравнивались с отсылкой к фрагментам, содержащим ту же музыку, кодированным с применением постфильтрации традиционным образом, но с сохранением без изменений всех остальных параметров. Результаты подтверждают улучшение воспринимаемого качества.
Дальнейшие варианты осуществления настоящего изобретения станут очевидными специалистам в данной области после прочтения приведенного выше описания. И хотя настоящее описание и графические материалы раскрывают варианты осуществления изобретения и примеры, изобретение не ограничено этими конкретными примерами. Без отступления от объема настоящего изобретения, который определяется сопутствующей формулой изобретения, могут быть сделаны многочисленные модификации и изменения.
Раскрытые выше системы и способы могут быть реализованы как программное обеспечение, встроенное программное обеспечение, аппаратное обеспечение или их комбинация. Некоторые или все компоненты могут реализовываться как программное обеспечение, исполняемое процессором цифровой обработки сигналов или микропроцессором, или они могут реализовываться как встроенное программное обеспечение или как интегральная микросхема специального назначения. Указанное программное обеспечение может распространяться на машиночитаемом носителе данных, который может включать компьютерный носитель данных (или непередающую среду) или коммуникационную среду (или переходящую среду). Как хорошо известно специалистам в данной области, компьютерные носители данных включают энергозависимые и энергонезависимые, съемные и несъемные носители данных, реализуемые в любом способе или технологии хранения информации, такой как машиночитаемые команды, структуры данных, программные модули или другие данные. Компьютерные носители данных включают в качестве неограничивающих примеров RAM, ROM, EE-PROM, флэш-память или другие технологии памяти, CD-ROM, универсальный цифровой диски (DVD) или другие оптические дисковые носители данных, кассеты с магнитной лентой, магнитную ленту, магнитные дисковые носители данных или другие магнитные устройства хранения данных, или любой другой носитель, который может использоваться для хранения необходимой информации и который может быть доступен посредством компьютера. Кроме того, как хорошо известно специалистам, коммуникационная среда, как правило, осуществляет машиночитаемые команды, структуры данных, программные модули, или другие данные в модулированном информационном сигнале, таком как несущая волна или другой механизм передачи данных, и включают любые средства доставки информации.
Перечень вариантов осуществления изобретения
В первом варианте осуществления обеспечивается система (400; 500; 700; 1000) декодера, предназначенная для декодирования сигнала битового потока как временного звукового сигнала, которая содержит:
секцию (410; 511, 512, 513; 711, 712, 713; 1011, 1013) декодирования, предназначенную для декодирования сигнала битового потока как предварительного временного звукового сигнала; и
постфильтр (440; 540; 740; 1040) ослабления межгармонического шума, предназначенный для фильтрации предварительного временного звукового сигнала, чтобы получить временной звуковой сигнал,
отличающаяся наличием секции управления, адаптированной для отключения постфильтра в ответ на информацию о постфильтрации, кодированную в сигнале битового потока, где предварительный временной звуковой сигнал является выходным сигналом как временной звуковой сигнал.
Во втором варианте осуществления постфильтр системы декодера первого варианта осуществления также адаптирован для ослабления шума, находящегося во впадинах спектра.
В третьем варианте осуществления секция управления системы декодера первого варианта осуществления содержит переключатель (442; 541; 1042), предназначенный для избирательного исключения постфильтра из тракта обработки сигнала системы декодера, посредством чего постфильтр отключается.
В четвертом варианте осуществления постфильтр системы декодера первого варианта осуществления имеет варьируемый коэффициент усиления, определяющий межгармоническое ослабление, и секция управления содержит регулятор усиления, действующий для задания абсолютного значения коэффициента усиления ниже предварительно определенного порогового значения, посредством чего постфильтр отключается.
В пятом варианте осуществления указанная секция декодирования системы декодера первого варианта осуществления содержит модуль декодирования речи.
В шестом варианте осуществления указанная секция декодирования системы декодера первого варианта осуществления содержит модуль (511; 711; 1011) декодирования в режиме линейного предсказания с кодовым возбуждением, CELP.
В седьмом варианте осуществления, в системе декодера пятого варианта осуществления частота основного тона, оцениваемая в секции долгосрочного предсказания в кодере, кодируется в сигнале битового потока.
В восьмом варианте осуществления постфильтр системы декодера адаптирован для ослабления спектральных составляющих, находящихся между гармониками частоты основного тона.
В девятом варианте осуществления, в системе декодера первого варианта осуществления сигнал битового потока содержит представление частоты основного тона, и постфильтр адаптирован для ослабления спектральных составляющих, находящихся между гармониками частоты основного тона.
В десятом варианте осуществления постфильтр системы декодера восьмого или девятого варианта осуществления адаптирован для ослабления только тех спектральных составляющих, которые находятся ниже предварительно определенной частоты среза.
В одиннадцатом варианте осуществления, в системе декодера шестого варианта осуществления изобретения 6:
секция декодирования также включает модуль (512; 712) декодирования в режиме преобразования кодированного возбуждения, ТСХ, предназначенный для декодирования сигнала битового потока как временного звукового сигнала,
секция управления адаптирована для приведения в действие системы декодера по меньшей мере в трех следующих режимах:
a) модуль ТСХ подключен, и постфильтр отключен;
b) модуль CELP и постфильтр подключены; и
c) модуль CELP подключен, и постфильтр отключен там, где предварительный временной сигнал и звуковой временной сигнал совпадают.
В двенадцатом варианте осуществления, в системе декодера десятого варианта осуществления:
секция декодирования также содержит модуль (513; 713) декодирования в режиме перспективного звукового кодирования, ААС, предназначенный для декодирования сигнала битового потока как временного звукового сигнала,
секция управления адаптирована для приведения в действие декодера также в следующем режиме:
d) модуль ААС подключен, и постфильтр отключен.
В тринадцатом варианте осуществления, в системе декодера первого варианта осуществления сигнал битового потока сегментируется на временные кадры, и секция управления адаптирована для отключения всего временного кадра или последовательности полных временных кадров.
В четырнадцатом варианте осуществления, в системе декодера тринадцатого варианта осуществления секция управления также адаптирована для приема, для каждого временного кадра в битовом потоке согласно стандарту экспертной группы по вопросам движущегося изображения, MPEG, поля данных, связанного с этим временным кадром и действующая в ответ на значение этого поля данных для отключения постфильтра.
В пятнадцатом варианте осуществления, в системе декодера четвертого варианта осуществления секция управления адаптирована для постепенного понижения и/или повышения коэффициента усиления постфильтра.
В шестнадцатом варианте осуществления предусмотрена система (400; 500; 700; 1000) декодера, которая содержит:
секцию (410; 511, 512, 513; 711, 712, 713; 1011, 1013) декодирования, предназначенную для декодирования сигнала битового потока как предварительного временного звукового сигнала; и
постфильтр (440; 540; 740; 1040) ослабления межгармонического шума, предназначенный для фильтрации предварительного временного звукового сигнала с целью получения временного звукового сигнала,
отличающаяся тем, что
секция декодирования адаптирована для генерирования промежуточного декодированного сигнала, представляющего возбуждение, и для его подачи в секцию управления; и
секция управления адаптирована для вычисления приближенного разностного сигнала, который служит приближением составляющей сигнала, которую необходимо устранить постфильтром из декодированного сигнала, как разности между промежуточным декодированным сигналом и промежуточным декодированным сигналом, подвергнутым постфильтрации, и для оценки по меньшей мере одного из следующих критериев:
a) превышает ли мощность приближенного разностного сигнала предварительно определенное пороговое значение;
b) является ли тональным характер приближенного разностного сигнала;
c) является ли разность между частотными спектрами абсолютных значений приближенного разностного сигнала и временного звукового сигнала неравномерно распределенной относительно частоты;
d) локализован ли частотный спектр абсолютных значений приближенного разностного сигнала в интервалах частот, находящихся в пределах предварительно определенной огибающей значимости; и
e) локализован ли частотный спектр абсолютных значений приближенного разностного сигнала в интервалах частот, находящихся в пределах огибающей значимости, полученной путем пороговой обработки частотного спектра абсолютных значений временного звукового сигнала по абсолютному значению наибольшей составляющей сигнала, здесь уменьшенной в масштабе с предварительно определенным масштабным коэффициентом;
и в ответ на положительное определение - для отключения постфильтра, посредством чего предварительный временной звуковой сигнал является выходным как временной звуковой сигнал.
В семнадцатом варианте осуществления предусмотрен постфильтр (440; 550; 740; 1040; 1140) ослабления межгармонического шума, адаптированный для приема входного сигнала, который включает предварительный звуковой сигнал, и для подачи выходного звукового сигнала,
отличающийся наличием секции управления, предназначенной для избирательного, в соответствии со значением сигнала постфильтрации, приведения в действие постфильтра в одном из следующих режимов:
i) режим фильтрации, где он фильтрует предварительный звуковой сигнал с целью получения фильтрованного сигнала и подает его как выходной звуковой сигнал;и
ii) режим пропускания, где он подает предварительный звуковой сигнал как выходной звуковой сигнал.
В восемнадцатом варианте осуществления, в постфильтре семнадцатого варианта осуществления сигнал постфильтрации заключается во входном сигнале.
В девятнадцатом варианте осуществления постфильтр семнадцатого варианта осуществления также включает модуль (1120) принятия решения, адаптированный для оценки частоты основного тона предварительного звукового сигнала и для оценивания по меньшей мере одного из следующих критериев:
a) превышает ли мощность спектральных составляющих ниже частоты основного тона предварительно определенное пороговое значение;
b) являются ли тональными спектральные составляющие ниже частоты основного тона;
c) превышает ли мощность спектральных составляющих между гармониками частоты основного тона предварительно определенное пороговое значение; и
d) являются ли тональными спектральные составляющие между гармониками частоты основного тона;
и в ответ на положительное определение - для принятия решения о генерировании отрицательного сигнала постфильтрации, отключающего постфильтр.
В двадцатом варианте осуществления предусмотрен способ декодирования сигнала битового потока как временного звукового сигнала, включающий этапы, на которых:
декодируют сигнал битового потока как предварительный временной звуковой сигнал; и
осуществляют постфильтрацию предварительного временного звукового сигнала путем ослабления межгармонического шума, посредством чего получается временной звуковой сигнал,
отличающийся тем, что этап постфильтрации избирательно пропускается в ответ на информацию о постфильтрации, кодированную в сигнале битового потока.
В двадцать первом варианте осуществления, в способе двадцатого варианта осуществления этап постфильтрации также включает ослабление шума, находящегося во впадинах спектра.
В двадцать втором варианте осуществления, в способе двадцать первого варианта осуществления этап декодирования включает применение способа кодирования, адаптированного для кодирования речи.
В двадцать третьем варианте осуществления, в способе двадцатого варианта осуществления этап декодирования включает применение декодирования в режиме линейного предсказания с кодовым возбуждением, CELP.
В двадцать четвертом варианте осуществления, в способе двадцать второго или двадцать третьего варианта осуществления этап постфильтрации включает ослабление спектральных составляющих, находящихся между гармониками частоты основного тона, где частота основного тона извлекается из сигнала битового потока или оценивается на этапе декодирования.
В двадцать пятом варианте осуществления, в способе двадцатого варианта осуществления этап постфильтрации включает ослабление только тех спектральных составляющих, которые находятся ниже предварительно определенной частоты среза.
В двадцать шестом варианте осуществления, в способе двадцать третьего варианта осуществления этапы декодирования и постфильтрации избирательно выполняют одно из следующего:
a) ТСХ-декодирование;
b) CELP-декодирование с постфильтрацией; и
c) CELP-декодирование без постфильтрации.
В двадцать седьмом варианте осуществления, в способе двадцать шестого варианта осуществления этапы декодирования и постфильтрации избирательно выполняют один из режимов а), b), с) и
d) декодирование в режиме перспективного звукового кодирования, ААС.
В двадцать восьмом варианте осуществления, в способе двадцатого варианта осуществления сигнал битового потока сегментируется на временные кадры, и этап постфильтрации пропускается для всего временного кадра или для последовательности полных временных кадров.
В двадцать девятом варианте осуществления, в способе двадцать восьмого варианта осуществления:
сигнал битового потока представляет собой битовый поток согласно стандарту экспертной группы по вопросам движущегося изображения, MPEG, и включает для каждого временного кадра связанное поле данных; и
этап постфильтрации пропускается для временного кадра в ответ на связанное поле данных.
В тридцатом варианте осуществления, в способе двадцатого варианта осуществления указанный пропуск постфильтрации включает одного из следующего:
полный пропуск ослабления,
частичный пропуск ослабления,
постепенное увеличение ослабления, и
постепенное уменьшение ослабления.
В тридцать первом варианте осуществления предусмотрен способ декодирования сигнала битового потока как временного звукового сигнала, включающий этапы, на которых:
декодируют сигнал битового потока как предварительный временной звуковой сигнал; и
осуществляют постфильтрацию предварительного временного звукового сигнала путем ослабления межгармонического шума, посредством чего получается временной звуковой сигнал,
отличающийся тем, что этап декодирования включает:
извлечение промежуточного декодированного сигнала, представляющего возбуждение;
вычисление приближенного разностного сигнала, который служит приближением составляющей сигнала, которая будет устраняться постфильтром из декодированного сигнала, как разности между промежуточным декодированным сигналом и промежуточным декодированным сигналом, подвергнутым постфильтрации;
оценку по меньшей мере одного из следующих критериев:
a) превышает ли мощность приближенного разностного сигнала предварительно определенное пороговое значение;
b) является ли тональным характер приближенного разностного сигнала;
c) является ли разность между частотными спектрами абсолютных значений приближенного разностного сигнала и временного звукового сигнала неравномерно распределенной относительно частоты;
d) локализован ли частотный спектр абсолютных значений приближенного разностного сигнала в интервалах частот, находящихся в пределах предварительно определенной огибающей значимости;
e) локализован ли частотный спектр абсолютных значений приближенного разностного сигнала в интервалах частот, находящихся в пределах огибающей значимости, полученной путем пороговой обработки частотного спектра абсолютных значений временного звукового сигнала по абсолютному значению наибольшей составляющей сигнала, здесь уменьшенной в масштабе с предварительно определенным масштабным коэффициентом;
и в ответ на положительное определение - отключение постфильтра, посредством чего предварительный временной звуковой сигнал является выходным как временной звуковой сигнал.
В тридцать втором варианте осуществления предусмотрена система (800) кодера, предназначенная для кодирования временного звукового сигнала как сигнала битового потока, которая содержит секцию (810) кодирования, предназначенную для кодирования временного звукового сигнала как сигнала битового потока,
отличающаяся наличием секции (820) принятия решения, адаптированной для принятия решения о том, следует ли при декодировании сигнала битового потока отключать постфильтрацию, которая включает ослабление межгармонического шума, и для кодирования этого решения как информации о постфильтрации в сигнале битового потока.
В тридцать третьем варианте осуществления, в системе кодера тридцать второго варианта осуществления секция принятия решения адаптирована для принятия решения о том, отключать ли постфильтрацию, которая также включает ослабление шума, находящегося во впадинах спектра.
В тридцать четвертом варианте осуществления, в системе кодера тридцать второго варианта осуществления секция кодирования содержит модуль кодирования речи.
В тридцать пятом варианте осуществления, в системе кодера тридцать второго варианта осуществления секция кодирования включает модуль кодирования в режиме линейного предсказания с кодовым возбуждением, CELP.
В тридцать шестом варианте осуществления, в системе кодера тридцать второго варианта осуществления секция принятия решения адаптирована для:
обнаружения совместного присутствия составляющей сигнала с доминантной основной частотой и составляющей сигнала, находящейся ниже основной частоты и, необязательно, между ее гармониками; и
в ответ на это - для принятия решения об отключении.
В тридцать седьмом варианте осуществления, в системе кодера тридцать пятого варианта осуществления:
модуль CELP-кодирования адаптирован для оценки частоты основного тона во временном звуковом сигнале; и
секция принятия решения адаптирована для обнаружения спектральных составляющих, находящихся ниже оценочной частоты основного тона, и в ответ на это - для принятия решения об отключении.
В тридцать восьмом варианте осуществления, в системе кодера тридцать пятого варианта осуществления секция принятия решения адаптирована для вычисления разности между предсказываемой мощностью временного звукового сигнала при CELP-кодировании, и предсказываемой мощностью временного звукового сигнала при CELP-кодировании и постфильтрации, и
в ответ на то, что эта разность превышает предварительно определенное пороговое значение, - для принятия решения об отключении.
В тридцать девятом варианте осуществления, в системе кодера тридцать пятого варианта осуществления:
указанная секция кодирования также включает модуль кодирования в режиме преобразования кодированного возбуждения, ТСХ,
где секция принятия решения адаптирована для выбора одного из следующих режимов кодирования:
a) ТСХ-кодирования;
b) CELP-кодирования с постфильтрацией; и
c) CELP-кодирования без постфильтрации.
В сороковом варианте осуществления система кодера тридцать девятого варианта осуществления также содержит селектор (814) кодирования, адаптированный для выбора одного из следующих суперрежимов:
i) перспективное звуковое кодирование, ААС, где секция принятия решения отключена; и
ii) TCX/CELP-кодирования, где секция принятия решения подключена с целью выбора одного из режимов кодирования а), b) или с).
В сорок первом варианте осуществления, в системе кодера тридцать девятого варианта осуществления секция принятия решения адаптирована для принятия решения о том, какой режим использовать на основе оптимизации зависимости искажений от скорости передачи данных.
В сорок втором варианте осуществления система кодера тридцать второго варианта осуществления также адаптирована для сегментирования сигнала битового потока на временные кадры, где секция принятия решения адаптирована принять решение об отключении постфильтра во временных сегментах, состоящих из полных кадров.
В сорок третьем варианте осуществления, в системе кодера тридцать второго варианта осуществления секция принятия решения адаптирована для принятия решения о постепенном уменьшении и/или увеличении ослабления постфильтра.
В сорок четвертом варианте осуществления, в системе кодера тридцать второго варианта осуществления секция принятия решения адаптирована для:
вычисления мощности временного звукового сигнала ниже оценочной частоты основного тона; и
в ответ на то, что указанная мощность превышает предварительно определенное пороговое значение, - для принятия решения об отключении.
В сорок пятом варианте осуществления, в системе кодера тридцать второго варианта осуществления секция принятия решения адаптирована для:
получения из временного звукового сигнала приближенного разностного сигнала, служащего приближением составляющей сигнала, которая будет устраняться постфильтром из будущего декодированного сигнала;
оценки по меньшей мере одного из следующих критериев:
a) превышает ли мощность приближенного разностного сигнала предварительно определенное пороговое значение;
b) является ли тональным характер приближенного разностного сигнала;
c) является ли разность между частотными спектрами абсолютных значений приближенного разностного сигнала и временного звукового сигнала неравномерно распределенной относительно частоты;
d) локализован ли частотный спектр абсолютных значений приближенного разностного сигнала в интервалах частот, находящихся в пределах предварительно определенной огибающей значимости; и
e) локализован ли частотный спектр абсолютных значений приближенного разностного сигнала в интервалах частот, находящихся в пределах огибающей значимости, полученной путем пороговой обработки частотного спектра абсолютных значений временного звукового сигнала по абсолютному значению наибольшей составляющей сигнала, здесь уменьшенной в масштабе с предварительно определенным масштабным коэффициентом;
и в ответ на положительное определение - принять решение об отключении постфильтра.
В сорок шестом варианте осуществления, в системе кодера сорок пятого варианта осуществления секция принятия решения адаптирована для вычисления приближенного разностного сигнала как разности между временным звуковым сигналом и временным звуковым сигналом, подвергнутым постфильтрации.
В сорок седьмом варианте осуществления, в системе кодера сорок пятого варианта осуществления:
секция кодирования адаптирована для извлечения промежуточного кодированного сигнала, представляющего возбуждение, и для его передачи в секцию принятия решения; и
секция принятия решения адаптирована для вычисления приближенного разностного сигнала как разности между временным звуковым сигналом и промежуточным декодированным сигналом, подвергнутым постфильтрации.
В сорок восьмом варианте осуществления предусмотрен способ кодирования временного звукового сигнала как сигнала битового потока, где способ включает этап кодирования временного звукового сигнала как сигнала битового потока,
отличающийся наличием также этапа принятия решения о том, следует ли при декодировании битового потока отключить постфильтрацию, которая включает ослабление межгармонического шума, и кодированием этого решения как информации о постфильтрации в сигнале битового потока.
В сорок девятом варианте осуществления, в способе сорок восьмого варианта осуществления этап принятия решения относится к постфильтрации, которая также включает ослабление шума, находящегося во впадинах спектра.
В пятидесятом варианте осуществления, в способе сорок восьмого варианта осуществления этап кодирования включает применение способа кодирования, адаптированного для кодирования речи.
В пятьдесят первом варианте осуществления, в способе сорок восьмого варианта осуществления этап кодирования включает применение кодирования в режиме линейного предсказания с кодовым возбуждением, CELP.
В пятьдесят втором варианте осуществления способ сорок восьмого варианта осуществления также включает этап обнаружения совместного присутствия составляющей сигнала с доминантной основной частотой и составляющей сигнала, находящейся ниже основной частоты и, необязательно, между ее гармониками,
где решение об отключении постфильтрации принимается в случае положительного результата обнаружения.
В пятьдесят третьем варианте осуществления, в способе пятьдесят первого варианта осуществления
указанный этап CELP-кодирования включает оценку частоты основного тона во временном звуковом сигнале; и
этап принятия решения включает обнаружение спектральных составляющих, находящихся ниже оценочной частоты основного тона, и решение об отключении постфильтрации принимается в случае положительного результата обнаружения.
В пятьдесят четвертом варианте осуществления способ пятьдесят первого варианта осуществления также включает этап вычисления разности между предсказываемой мощностью временного звукового сигнала при CELP-кодировании и предсказываемой мощностью временного звукового сигнала при CELP-кодировании и постфильтрации,
где решение об отключении постфильтрации принимается, если эта разность превышает предварительно определенное пороговое значение.
В пятьдесят пятом варианте осуществления, в способе пятьдесят первого варианта осуществления:
этап кодирования включает избирательное применение или CELP-кодирования или кодирования в режиме преобразования кодированного возбуждения, ТСХ; и
этап обнаружения того, должна ли быть отключена постфильтрация, выполняется только тогда, когда применяется CELP-кодирование.
В пятьдесят шестом варианте осуществления, в способе пятьдесят пятого варианта осуществления этап принятия решения включает выбор на основе оптимизации зависимости искажений от скорости передачи данных одного из следующих рабочих режимов:
a) ТСХ-кодирования;
b) CELP-кодирования с постфильтрацией; и
c) CELP-кодирования без постфильтрации.
57. Способ согласно варианту осуществления изобретения 55, где этап принятия решения включает выбор на основе оптимизации зависимости искажений от скорости передачи данных одного из следующих рабочих режимов:
a) ТСХ-кодирования;
b) CELP-кодирования с постфильтрацией;
c) CELP-кодирования без постфильтрации; и
d) кодирования в режиме перспективного звукового кодирования, ААС.
В пятьдесят восьмом варианте осуществления, в способе сорок восьмого варианта осуществления:
этап кодирования включает сегментирование временного звукового сигнала на временные кадры и формирование сигнала битового потока, содержащего соответствующие временные кадры; и
этап принятия решения о том, что постфильтрация должна быть отключена, осуществляется один раз в каждом временном кадре.
В пятьдесят девятом варианте осуществления, в способе сорок восьмого варианта осуществления результат этапа принятия решения о том, что постфильтрация должна быть отключена, выбирается из следующих вариантов:
отсутствие ослабления,
полное ослабление,
частичное ослабление,
постепенно увеличивающееся ослабление, и
постепенно уменьшающееся ослабление.
В шестидесятом варианте осуществления, в способе сорок восьмого варианта осуществления этап принятия решения включает вычисление мощности временного звукового сигнала ниже оценочной частоты основного тона и, в ответ, на то, что эта мощность превышает предварительно определенное пороговое значение, - отключение постфильтра.
В шестьдесят первом варианте осуществления, в способе сорок восьмого варианта осуществления:
этап кодирования включает получение из временного звукового сигнала приближенного разностного сигнала, служащего приближением составляющей сигнала, которая будет устраняться постфильтром из будущего декодированного сигнала; и
этап принятия решения включает оценивание по меньшей мере одного из следующих критериев:
a) превышает ли мощность приближенного разностного сигнала предварительно определенное пороговое значение;
b) является ли тональным характер приближенного разностного сигнала;
c) является ли разность между частотными спектрами абсолютных значений приближенного разностного сигнала и временного звукового сигнала неравномерно распределенной относительно частоты;
d) локализован ли частотный спектр абсолютных значений приближенного разностного сигнала в интервалах частот, находящихся в пределах предварительно определенной огибающей значимости; и
e) локализован ли частотный спектр абсолютных значений приближенного разностного сигнала в интервалах частот, находящихся в пределах огибающей значимости, полученной путем пороговой обработки частотного спектра абсолютных значений временного звукового сигнала по абсолютному значению наибольшей составляющей сигнала, здесь уменьшенной в масштабе с предварительно определенным масштабным коэффициентом;
и, в ответ на по меньшей мере одно положительное определение, - отключение постфильтра.
В шестьдесят втором варианте осуществления, в способе шестьдесят первого варианта осуществления приближенный разностный сигнал вычисляется как разность между временным звуковым сигналом и временным звуковым сигналом, подвергнутым постфильтрации.
В шестьдесят третьем варианте осуществления, в способе шестьдесят первого варианта осуществления:
этап кодирования включает извлечение промежуточного декодированного сигнала, представляющего возбуждение; и
этап принятия решения включает вычисление приближенного разностного сигнала как разности между временным звуковым сигналом и промежуточным декодированным сигналом, подвергнутым постфильтрации.
В шестьдесят четвертом варианте осуществления предусмотрен машиночитаемый носитель данных, содержащий компьютерный программный продукт, хранящий команды, предназначенные для выполнения способа согласно одному из вышеприведенных вариантов осуществления изобретения.
Claims (37)
1. Аудиодекодер для декодирования битового аудиопотока, сгенерированного аудиокодером, при этом аудиодекодер содержит:
первый модуль декодирования, адаптированный для работы в первом режиме кодирования;
второй модуль декодирования, адаптированный для работы во втором режиме кодирования, при этом второй режим кодирования отличается от первого режима кодирования; и
фильтр высоты тона, включенный либо в первый режим кодирования, либо во второй режим кодирования, при этом фильтр высоты тона адаптирован для фильтрации предварительного звукового сигнала, сгенерированного первым модулем декодирования или вторым модулем декодирования для получения фильтрованного сигнала,
при этом фильтр высоты тона выборочно подключают или отключают на основе значения первого параметра, кодированного в битовом аудиопотоке, при этом первый параметр отличный от второго параметра, кодированного в битовом аудиопотоке, при этом второй параметр указывает на текущий режим кодирования аудиодекодера.
2. Аудиодекодер по п. 1, отличающийся тем, что информацию о высоте тона, связанную с фильтром высоты тона, определяют исходя из третьего параметра в битовом аудиопотоке, и коэффициент усиления, связанный с фильтром высоты тона, определяют исходя из четвертого параметра в битовом аудиопотоке, при этом первый параметр, второй параметр, третий параметр и четвертый параметр различаются.
3. Аудиодекодер по п. 1, отличающийся тем, что длина первого параметра составляет один бит, и первое значение первого параметра подключает фильтр высоты тона, а второе значение первого параметра отключает фильтр высоты тона.
4. Аудиодекодер по п. 1, отличающийся тем, что битовый аудиопоток сегментируют на кадры звукового содержимого, и первый параметр указывает на тип кадра с помощью одного или более первых значений первого параметра, подключающих фильтр высоты тона, и одного или более вторых значений первого параметра, отключающих фильтр высоты тона.
5. Аудиодекодер по п. 4, отличающийся тем, что тип кадра указывает на то, содержит ли соответствующий кадр или вероятно содержит голосовое содержимое или содержит ли соответствующий кадр или вероятно содержит неголосовое содержимое.
6. Аудиодекодер по п. 1, отличающийся тем, что фильтр высоты тона отключают путем (i) приравнивания параметра усиления к нулю, (ii) работы фильтра высоты тона в режиме пропускания, (iii) выключения фильтра высоты тона или (iv) деактивации фильтра высоты тона.
7. Аудиодекодер по п. 2, отличающийся тем, что один или более звеньев фильтра высоты тона определяют пятым параметром в битовом аудиопотоке.
8. Аудиодекодер по п. 1, отличающийся тем, что фильтр высоты тона является постфильтром или фильтром усиления тона.
9. Аудиодекодер по п. 8, отличающийся тем, что постфильтр и фильтр усиления тона адаптированы для ослабления составляющих сигнала между гармониками или ослабления впадин спектра.
10. Аудиодекодер по п. 8, отличающийся тем, что постфильтр и фильтр усиления тона адаптированы для восстановления периодической составляющей предварительного звукового сигнала.
11. Аудиодекодер по п. 1, отличающийся тем, что первый режим кодирования включает кодирование в частотной области или кодирование с преобразованием, а второй режим кодирования включает кодирование с линейным предсказанием.
12. Аудиодекодер по п. 1, отличающийся тем, что фильтр высоты тона имеет низкочастотные характеристики.
13. Способ декодирования кадра кодированного звукового сигнала, при этом кодированный звуковой сигнал генерируют аудиокодером, при этом способ включает:
извлечение первого параметра из кодированного звукового сигнала, при этом первый параметр представляет режим кодирования для кадра;
извлечение второго параметра из кодированного звукового сигнала;
запуск либо первого режима декодирования, либо второго режима декодирования на основе значения первого параметра;
генерирование предварительного звукового сигнала из кодированного звукового сигнала при работе либо в первом режиме декодирования, либо во втором режиме декодирования; и
фильтрацию предварительного звукового сигнала с помощью фильтра высоты тона,
при этом при фильтрации используют второй параметр для выборочного подключения или отключения фильтра высоты тона, и второй параметр отличный от первого параметра.
14. Способ по п. 13, отличающийся тем, что дополнительно включает:
извлечение третьего параметра из кодированного звукового сигнала, при этом третий параметр представляет информацию о высоте для фильтра высоты тона; и
извлечение четвертого параметра из кодированного звукового сигнала, при этом четвертый параметр представляет коэффициент усиления, связанный с фильтром высоты тона.
15. Способ по п. 13, отличающийся тем, что первый режим кодирования является кодированием в частотной области или кодированием с преобразованием, а второй режим кодирования является кодированием с линейным предсказанием.
16. Способ по п. 13, отличающийся тем, что фильтрация включает фильтрацию предварительного звукового сигнала с помощью долгосрочного фильтра, а затем фильтрацию результатов долгосрочного фильтра с помощью краткосрочного фильтра.
17. Аудиокодер для кодирования звукового сигнала и связанных с ним параметров для получения битового аудиопотока, при этом аудиокодер содержит:
первый кодирующий модуль, адаптированный для работы в первом режиме кодирования;
второй кодирующий модуль, адаптированный для работы во втором режиме кодирования, при этом второй режим кодирования отличается от первого режима кодирования;
модуль принятия решения для определения необходимости кодирования звукового сигнала либо первым кодирующим модулем, либо вторым кодирующим модулем; и
третий кодирующий модуль для генерирования битового аудиопотока, при этом третий кодирующий модуль адаптирован для кодирования предварительного звукового сигнала, выходящего либо с первого кодирующего модуля, либо со второго кодирующего модуля,
при этом третий кодирующий модуль дополнительно адаптирован для кодирования первого параметра и второго параметра, при этом первый параметр используют для выборочного подключения или отключения фильтра высоты тона, а второй параметр указывает на текущий режим кодирования кодера, при этом первый параметр отличный от второго параметра.
18. Аудиокодер по п. 17, отличающийся тем, что третий кодирующий модуль дополнительно адаптирован для кодирования третьего параметра и четвертого параметра в битовый аудиопоток, при этом третий параметр представляет высоту тона, связанную с фильтром высоты тона, а четвертый параметр представляет параметр усиления, связанный с фильтром высоты тона.
19. Аудиокодер по п. 17, отличающийся тем, что длина первого параметра составляет один бит, и первое значение первого параметра подключает фильтр высоты тона, а второе значение первого параметра отключает фильтр высоты тона.
20. Аудиокодер по п. 17, отличающийся тем, что битовый аудиопоток сегментируют на кадры звукового содержимого, и первый параметр указывает на тип кадра с помощью одного или более первых значений первого параметра, указывающих на необходимость подключения фильтра высоты тона, и одного или более вторых значений первого параметра, указывающих на необходимость отключения фильтра высоты тона.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US36123710P | 2010-07-02 | 2010-07-02 | |
US61/361,237 | 2010-07-02 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016117277A Division RU2642553C2 (ru) | 2010-07-02 | 2016-05-04 | Избирательный басовый постфильтр |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2616774C1 true RU2616774C1 (ru) | 2017-04-18 |
Family
ID=44504387
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013102794/08A RU2562422C2 (ru) | 2010-07-02 | 2011-06-23 | Избирательный басовый постфильтр |
RU2015117332A RU2692416C2 (ru) | 2010-07-02 | 2015-05-07 | Избирательный басовый постфильтр |
RU2016116043/08A RU2599338C1 (ru) | 2010-07-02 | 2016-04-25 | Избирательный басовый постфильтр |
RU2016117277A RU2642553C2 (ru) | 2010-07-02 | 2016-05-04 | Избирательный басовый постфильтр |
RU2016127810A RU2616774C1 (ru) | 2010-07-02 | 2016-07-11 | Аудиодекодер для декодирования битового аудиопотока, аудиокодер для кодирования звукового сигнала и способ декодирования кадра кодированного звукового сигнала |
RU2019114430A RU2707716C1 (ru) | 2010-07-02 | 2019-05-14 | Избирательный басовый постфильтр |
Family Applications Before (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013102794/08A RU2562422C2 (ru) | 2010-07-02 | 2011-06-23 | Избирательный басовый постфильтр |
RU2015117332A RU2692416C2 (ru) | 2010-07-02 | 2015-05-07 | Избирательный басовый постфильтр |
RU2016116043/08A RU2599338C1 (ru) | 2010-07-02 | 2016-04-25 | Избирательный басовый постфильтр |
RU2016117277A RU2642553C2 (ru) | 2010-07-02 | 2016-05-04 | Избирательный басовый постфильтр |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2019114430A RU2707716C1 (ru) | 2010-07-02 | 2019-05-14 | Избирательный басовый постфильтр |
Country Status (18)
Country | Link |
---|---|
US (15) | US9224403B2 (ru) |
EP (10) | EP3422346B1 (ru) |
JP (13) | JP6178236B2 (ru) |
KR (12) | KR102492622B1 (ru) |
CN (7) | CN105261370B (ru) |
AU (1) | AU2011273680B2 (ru) |
CA (14) | CA3025108C (ru) |
DK (2) | DK3079153T3 (ru) |
ES (7) | ES2683647T3 (ru) |
HK (8) | HK1183965A1 (ru) |
HU (2) | HUE038985T2 (ru) |
IL (11) | IL295473B2 (ru) |
MX (1) | MX2012014525A (ru) |
MY (4) | MY176192A (ru) |
PL (2) | PL3079152T3 (ru) |
RU (6) | RU2562422C2 (ru) |
SG (7) | SG10201605650WA (ru) |
WO (1) | WO2012000882A1 (ru) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10818306B2 (en) | 2017-03-23 | 2020-10-27 | Dolby International Ab | Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals |
RU2821284C1 (ru) * | 2019-10-30 | 2024-06-19 | Долби Лэборетериз Лайсенсинг Корпорейшн | Распределение скоростей передачи битов в иммерсивных голосовых и аудиослужбах |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2683647T3 (es) | 2010-07-02 | 2018-09-27 | Dolby International Ab | Descodificación de audio con pos-filtración selectiva |
PT2936484T (pt) * | 2013-01-29 | 2018-03-29 | Fraunhofer Ges Forschung | Aparelho e método para processar um sinal codificado e codificador e método para gerar um sinal codificado |
CN105103224B (zh) | 2013-04-05 | 2019-08-02 | 杜比国际公司 | 用于交错波形编码的音频编码器和解码器 |
EP3011764B1 (en) | 2013-06-18 | 2018-11-21 | Dolby Laboratories Licensing Corporation | Bass management for audio rendering |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
BR122020017207B1 (pt) * | 2013-08-28 | 2022-12-06 | Dolby International Ab | Método, sistema de processamento de mídia, aparelho e meio de armazenamento legível por computador não transitório |
US9666202B2 (en) | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980799A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
CN105957534B (zh) * | 2016-06-28 | 2019-05-03 | 百度在线网络技术(北京)有限公司 | 自适应滤波方法和自适应滤波器 |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US10475456B1 (en) * | 2018-06-04 | 2019-11-12 | Qualcomm Incorporated | Smart coding mode switching in audio rate adaptation |
CN115428069A (zh) | 2020-04-24 | 2022-12-02 | 瑞典爱立信有限公司 | 低音后置滤波器的低成本适配 |
JP7416134B1 (ja) | 2022-07-01 | 2024-01-17 | Toppanホールディングス株式会社 | 検出装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6098036A (en) * | 1998-07-13 | 2000-08-01 | Lockheed Martin Corp. | Speech coding system and method including spectral formant enhancer |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US7222070B1 (en) * | 1999-09-22 | 2007-05-22 | Texas Instruments Incorporated | Hybrid speech coding and system |
WO2009114656A1 (en) * | 2008-03-14 | 2009-09-17 | Dolby Laboratories Licensing Corporation | Multimode coding of speech-like and non-speech-like signals |
Family Cites Families (152)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4052568A (en) * | 1976-04-23 | 1977-10-04 | Communications Satellite Corporation | Digital voice switch |
US4696040A (en) * | 1983-10-13 | 1987-09-22 | Texas Instruments Incorporated | Speech analysis/synthesis system with energy normalization and silence suppression |
US4617676A (en) * | 1984-09-04 | 1986-10-14 | At&T Bell Laboratories | Predictive communication system filtering arrangement |
US4969192A (en) | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US4896361A (en) * | 1988-01-07 | 1990-01-23 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
FI95085C (fi) * | 1992-05-11 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi |
US5434947A (en) * | 1993-02-23 | 1995-07-18 | Motorola | Method for generating a spectral noise weighting filter for use in a speech coder |
JPH06250697A (ja) * | 1993-02-26 | 1994-09-09 | Fujitsu Ltd | 音声符号化方法及び音声符号化装置並びに音声復号化方法及び音声復号化装置 |
CA2094780A1 (en) | 1993-04-23 | 1994-10-24 | Claude Laflamme | Transform coded excitation for speech and audio coding |
FI96248C (fi) * | 1993-05-06 | 1996-05-27 | Nokia Mobile Phones Ltd | Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin |
CA2121667A1 (en) | 1994-04-19 | 1995-10-20 | Jean-Pierre Adoul | Differential-transform-coded excitation for speech and audio coding |
US6263307B1 (en) * | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US5664055A (en) | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
JPH0946268A (ja) | 1995-07-26 | 1997-02-14 | Toshiba Corp | ディジタル音声通信装置 |
JPH0950298A (ja) * | 1995-08-07 | 1997-02-18 | Mitsubishi Electric Corp | 音声符号化装置及び音声復号化装置 |
JP3483998B2 (ja) * | 1995-09-14 | 2004-01-06 | 株式会社東芝 | ピッチ強調方法および装置 |
US5864798A (en) | 1995-09-18 | 1999-01-26 | Kabushiki Kaisha Toshiba | Method and apparatus for adjusting a spectrum shape of a speech signal |
TW321810B (ru) | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JP3707116B2 (ja) * | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
CA2219358A1 (en) | 1996-02-26 | 1997-08-28 | At&T Corp. | Speech signal quantization using human auditory models in predictive coding systems |
JP2940464B2 (ja) * | 1996-03-27 | 1999-08-25 | 日本電気株式会社 | 音声復号化装置 |
US5802109A (en) | 1996-03-28 | 1998-09-01 | Nec Corporation | Speech encoding communication system |
JPH09319397A (ja) * | 1996-05-28 | 1997-12-12 | Sony Corp | ディジタル信号処理装置 |
JP3183826B2 (ja) * | 1996-06-06 | 2001-07-09 | 三菱電機株式会社 | 音声符号化装置及び音声復号化装置 |
EP0814458B1 (en) * | 1996-06-19 | 2004-09-22 | Texas Instruments Incorporated | Improvements in or relating to speech coding |
JP2974059B2 (ja) * | 1996-07-18 | 1999-11-08 | 日本電気株式会社 | ピッチポストフィルタ装置 |
JPH10143195A (ja) * | 1996-11-14 | 1998-05-29 | Olympus Optical Co Ltd | ポストフィルタ |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
JPH113099A (ja) * | 1997-04-16 | 1999-01-06 | Mitsubishi Electric Corp | 音声符号化復号化システム、音声符号化装置及び音声復号化装置 |
US6073092A (en) * | 1997-06-26 | 2000-06-06 | Telogy Networks, Inc. | Method for speech coding based on a code excited linear prediction (CELP) model |
US6114859A (en) * | 1997-07-14 | 2000-09-05 | Nissin Electric Co., Ltd. | Harmonic characteristic measuring method and harmonic characteristic measuring apparatus |
US6385195B2 (en) | 1997-07-21 | 2002-05-07 | Telefonaktiebolaget L M Ericsson (Publ) | Enhanced interworking function for interfacing digital cellular voice and fax protocols and internet protocols |
FI980132A (fi) | 1998-01-21 | 1999-07-22 | Nokia Mobile Phones Ltd | Adaptoituva jälkisuodatin |
JP3986150B2 (ja) | 1998-01-27 | 2007-10-03 | 興和株式会社 | 一次元データへの電子透かし |
TW376611B (en) * | 1998-05-26 | 1999-12-11 | Koninkl Philips Electronics Nv | Transmission system with improved speech encoder |
WO1999062055A1 (fr) | 1998-05-27 | 1999-12-02 | Ntt Mobile Communications Network Inc. | Decodeur de son et procede de decodage de son |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
KR100281181B1 (ko) * | 1998-10-16 | 2001-02-01 | 윤종용 | 약전계에서 코드 분할 다중 접속 시스템의 코덱 잡음 제거 방법 |
JP2000206999A (ja) * | 1999-01-19 | 2000-07-28 | Nec Corp | 音声符号伝送装置 |
EP1052622B1 (en) * | 1999-05-11 | 2007-07-11 | Nippon Telegraph and Telephone Corporation | Selection of a synthesis filter for CELP type wideband audio coding |
US6782360B1 (en) | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
JP3559485B2 (ja) | 1999-11-22 | 2004-09-02 | 日本電信電話株式会社 | 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体 |
US20020016161A1 (en) * | 2000-02-10 | 2002-02-07 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for compression of speech encoded parameters |
JP2001249700A (ja) * | 2000-03-06 | 2001-09-14 | Oki Electric Ind Co Ltd | 音声符号化装置及び音声復号装置 |
ATE553472T1 (de) * | 2000-04-24 | 2012-04-15 | Qualcomm Inc | Prädikitve dequantisierung von stimmhaften sprachsignalen |
US6862567B1 (en) * | 2000-08-30 | 2005-03-01 | Mindspeed Technologies, Inc. | Noise suppression in the frequency domain by adjusting gain according to voicing parameters |
JP2002149200A (ja) | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
US7020605B2 (en) * | 2000-09-15 | 2006-03-28 | Mindspeed Technologies, Inc. | Speech coding system with time-domain noise attenuation |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US7110942B2 (en) * | 2001-08-14 | 2006-09-19 | Broadcom Corporation | Efficient excitation quantization in a noise feedback coding system using correlation techniques |
US7353168B2 (en) * | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
DE60218068T2 (de) | 2001-11-30 | 2007-11-22 | Koninklijke Philips Electronics N.V. | Signalkodierung |
JP3733588B2 (ja) * | 2001-12-13 | 2006-01-11 | 日本電気株式会社 | 音声復号化装置、及び、音声復号化方法 |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
US7330812B2 (en) | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
CN1288557C (zh) * | 2003-06-25 | 2006-12-06 | 英业达股份有限公司 | 多执行线程同时停止的方法 |
DE10328777A1 (de) | 2003-06-25 | 2005-01-27 | Coding Technologies Ab | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
US20050004793A1 (en) | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
CN1212608C (zh) * | 2003-09-12 | 2005-07-27 | 中国科学院声学研究所 | 一种采用后置滤波器的多通道语音增强方法 |
US7478040B2 (en) | 2003-10-24 | 2009-01-13 | Broadcom Corporation | Method for adaptive filtering |
AU2003274864A1 (en) * | 2003-10-24 | 2005-05-11 | Nokia Corpration | Noise-dependent postfiltering |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
EP1747555B1 (en) | 2004-05-17 | 2007-08-29 | Nokia Corporation | Audio encoding with different coding models |
JP2007538282A (ja) | 2004-05-17 | 2007-12-27 | ノキア コーポレイション | 各種の符号化フレーム長でのオーディオ符号化 |
US7739120B2 (en) | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
US7596486B2 (en) | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
US20060047522A1 (en) | 2004-08-26 | 2006-03-02 | Nokia Corporation | Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (AAC) system |
US7720230B2 (en) | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
KR100640468B1 (ko) * | 2005-01-25 | 2006-10-31 | 삼성전자주식회사 | 디지털 통신 시스템에서 음성 패킷의 전송과 처리 장치 및방법 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US7573912B2 (en) | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
EP1851866B1 (en) * | 2005-02-23 | 2011-08-17 | Telefonaktiebolaget LM Ericsson (publ) | Adaptive bit allocation for multi-channel audio encoding |
SG163555A1 (en) | 2005-04-01 | 2010-08-30 | Qualcomm Inc | Systems, methods, and apparatus for highband burst suppression |
EP1881488B1 (en) * | 2005-05-11 | 2010-11-10 | Panasonic Corporation | Encoder, decoder, and their methods |
US7930176B2 (en) * | 2005-05-20 | 2011-04-19 | Broadcom Corporation | Packet loss concealment for block-independent speech codecs |
JP5461835B2 (ja) | 2005-05-26 | 2014-04-02 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の符号化/復号化方法及び符号化/復号化装置 |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
KR100718132B1 (ko) | 2005-06-24 | 2007-05-14 | 삼성전자주식회사 | 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치 |
RU2473062C2 (ru) | 2005-08-30 | 2013-01-20 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ кодирования и декодирования аудиосигнала и устройство для его осуществления |
KR100647336B1 (ko) | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
TW200737738A (en) * | 2006-01-18 | 2007-10-01 | Lg Electronics Inc | Apparatus and method for encoding and decoding signal |
WO2007083953A1 (en) | 2006-01-19 | 2007-07-26 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
KR20070077652A (ko) * | 2006-01-24 | 2007-07-27 | 삼성전자주식회사 | 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법 |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
ES2391117T3 (es) | 2006-02-23 | 2012-11-21 | Lg Electronics Inc. | Método y aparato para procesar una señal de audio |
US7454335B2 (en) | 2006-03-20 | 2008-11-18 | Mindspeed Technologies, Inc. | Method and system for reducing effects of noise producing artifacts in a voice codec |
ATE501505T1 (de) | 2006-04-27 | 2011-03-15 | Panasonic Corp | Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür |
KR20070115637A (ko) | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
DE602006002739D1 (de) | 2006-06-30 | 2008-10-23 | Fraunhofer Ges Forschung | Audiokodierer, Audiodekodierer und Audioprozessor mit einer dynamisch variablen Warp-Charakteristik |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8682652B2 (en) * | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP5190363B2 (ja) | 2006-07-12 | 2013-04-24 | パナソニック株式会社 | 音声復号装置、音声符号化装置、および消失フレーム補償方法 |
CN101145343B (zh) | 2006-09-15 | 2011-07-20 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
CN100483509C (zh) | 2006-12-05 | 2009-04-29 | 华为技术有限公司 | 声音信号分类方法和装置 |
CN101197577A (zh) * | 2006-12-07 | 2008-06-11 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
JP5171842B2 (ja) | 2006-12-12 | 2013-03-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法 |
CN101548319B (zh) | 2006-12-13 | 2012-06-20 | 松下电器产业株式会社 | 后置滤波器以及滤波方法 |
KR100964402B1 (ko) | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
KR100883656B1 (ko) | 2006-12-28 | 2009-02-18 | 삼성전자주식회사 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
EP1944761A1 (en) | 2007-01-15 | 2008-07-16 | Siemens Networks GmbH & Co. KG | Disturbance reduction in digital signal processing |
CN101231850B (zh) | 2007-01-23 | 2012-02-29 | 华为技术有限公司 | 编解码方法及装置 |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
WO2008108082A1 (ja) * | 2007-03-02 | 2008-09-12 | Panasonic Corporation | 音声復号装置および音声復号方法 |
EP2116998B1 (en) * | 2007-03-02 | 2018-08-15 | III Holdings 12, LLC | Post-filter, decoding device, and post-filter processing method |
EP2132733B1 (en) * | 2007-03-02 | 2012-03-07 | Telefonaktiebolaget LM Ericsson (publ) | Non-causal postfilter |
JP4708446B2 (ja) * | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
CN101256771A (zh) | 2007-03-02 | 2008-09-03 | 北京工业大学 | 嵌入式编码、解码方法、编码器、解码器及系统 |
RU2463674C2 (ru) | 2007-03-02 | 2012-10-10 | Панасоник Корпорэйшн | Кодирующее устройство и способ кодирования |
CN101622667B (zh) * | 2007-03-02 | 2012-08-15 | 艾利森电话股份有限公司 | 用于分层编解码器的后置滤波器 |
PL2535894T3 (pl) * | 2007-03-02 | 2015-06-30 | Ericsson Telefon Ab L M | Sposoby i układy w sieci telekomunikacyjnej |
DE102007025401B4 (de) | 2007-05-31 | 2015-10-01 | Siemens Aktiengesellschaft | Verfahren zur Auswertung eines Tomographie-Datensatzes und Tomographie-Arbeitsstation |
CN101321033B (zh) | 2007-06-10 | 2011-08-10 | 华为技术有限公司 | 帧补偿方法及系统 |
BRPI0811384A2 (pt) | 2007-06-11 | 2017-08-01 | Fraunhofer Ges Forschung | "codificador de áudio para codificar um sinal de áudio tendo uma porção tipo impulso e porção fixa, métodos de codificação, decodificador, método de decodificação, e sinal de áudio codificado" |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
KR101513028B1 (ko) * | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
KR101531910B1 (ko) | 2007-07-02 | 2015-06-29 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
JP5179578B2 (ja) * | 2007-07-06 | 2013-04-10 | フランス・テレコム | ディジタル信号の復号中に後処理ステップによってもたらされるひずみの制限 |
DE602007003220D1 (de) | 2007-08-13 | 2009-12-24 | Harman Becker Automotive Sys | Rauschverringerung mittels Kombination aus Strahlformung und Nachfilterung |
WO2009022193A2 (en) | 2007-08-15 | 2009-02-19 | Nokia Corporation | Devices, methods and computer program products for audio signal coding and decoding |
CN101383151B (zh) * | 2007-09-06 | 2011-07-13 | 中兴通讯股份有限公司 | 一种数字音频质量增强系统和方法 |
KR101505831B1 (ko) | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
KR101170137B1 (ko) | 2008-02-15 | 2012-07-31 | 노키아 코포레이션 | 복잡성이 축소된 벡터 인덱싱 및 탈-인덱싱 |
KR101452722B1 (ko) | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
US8296135B2 (en) | 2008-04-22 | 2012-10-23 | Electronics And Telecommunications Research Institute | Noise cancellation system and method |
KR20090122143A (ko) | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
CN101609684B (zh) * | 2008-06-19 | 2012-06-06 | 展讯通信(上海)有限公司 | 解码语音信号的后处理滤波器 |
CA2972812C (en) * | 2008-07-10 | 2018-07-24 | Voiceage Corporation | Device and method for quantizing and inverse quantizing lpc filters in a super-frame |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
EP2301020B1 (en) | 2008-07-11 | 2013-01-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
WO2010031049A1 (en) * | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
KR20130133917A (ko) | 2008-10-08 | 2013-12-09 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 다중 분해능 스위치드 오디오 부호화/복호화 방법 |
RU2400832C2 (ru) | 2008-11-24 | 2010-09-27 | Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФCО России) | Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием |
KR101622950B1 (ko) | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
KR20100115215A (ko) * | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
WO2011026247A1 (en) | 2009-09-04 | 2011-03-10 | Svox Ag | Speech enhancement techniques on the power spectrum |
US8260220B2 (en) * | 2009-09-28 | 2012-09-04 | Broadcom Corporation | Communication device with reduced noise speech coding |
CN102884574B (zh) * | 2009-10-20 | 2015-10-14 | 弗兰霍菲尔运输应用研究公司 | 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法 |
EP2564593B1 (en) * | 2010-04-26 | 2018-01-03 | Sun Patent Trust | Filtering mode for intra prediction inferred from statistics of surrounding blocks |
WO2011142709A2 (en) | 2010-05-11 | 2011-11-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and arrangement for processing of audio signals |
ES2683647T3 (es) | 2010-07-02 | 2018-09-27 | Dolby International Ab | Descodificación de audio con pos-filtración selectiva |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
US11429505B2 (en) * | 2018-08-03 | 2022-08-30 | Dell Products L.P. | System and method to provide optimal polling of devices for real time data |
-
2011
- 2011-06-23 ES ES16166356.2T patent/ES2683647T3/es active Active
- 2011-06-23 CA CA3025108A patent/CA3025108C/en active Active
- 2011-06-23 KR KR1020227012264A patent/KR102492622B1/ko active IP Right Grant
- 2011-06-23 AU AU2011273680A patent/AU2011273680B2/en active Active
- 2011-06-23 KR KR1020137001635A patent/KR101449979B1/ko active IP Right Grant
- 2011-06-23 SG SG10201605650WA patent/SG10201605650WA/en unknown
- 2011-06-23 PL PL16166356T patent/PL3079152T3/pl unknown
- 2011-06-23 CA CA2958350A patent/CA2958350C/en active Active
- 2011-06-23 CN CN201510680024.0A patent/CN105261370B/zh active Active
- 2011-06-23 CN CN201510680485.8A patent/CN105355209B/zh active Active
- 2011-06-23 KR KR1020207003957A patent/KR102238082B1/ko active IP Right Grant
- 2011-06-23 ES ES19196423T patent/ES2902392T3/es active Active
- 2011-06-23 SG SG10201503004WA patent/SG10201503004WA/en unknown
- 2011-06-23 EP EP18166150.5A patent/EP3422346B1/en active Active
- 2011-06-23 MY MYPI2016001264A patent/MY176192A/en unknown
- 2011-06-23 IL IL295473A patent/IL295473B2/en unknown
- 2011-06-23 RU RU2013102794/08A patent/RU2562422C2/ru active
- 2011-06-23 HU HUE16166356A patent/HUE038985T2/hu unknown
- 2011-06-23 IL IL311020A patent/IL311020B1/en unknown
- 2011-06-23 SG SG10201901308TA patent/SG10201901308TA/en unknown
- 2011-06-23 KR KR1020217009907A patent/KR102296955B1/ko active IP Right Grant
- 2011-06-23 EP EP16166358.8A patent/EP3079154B1/en active Active
- 2011-06-23 ES ES11743032.2T patent/ES2484794T3/es active Active
- 2011-06-23 CN CN201180033082.4A patent/CN103098129B/zh active Active
- 2011-06-23 CA CA2929090A patent/CA2929090C/en active Active
- 2011-06-23 ES ES14164773.5T patent/ES2666150T3/es active Active
- 2011-06-23 HU HUE16166357A patent/HUE039862T2/hu unknown
- 2011-06-23 CA CA2801805A patent/CA2801805C/en active Active
- 2011-06-23 SG SG10201604866VA patent/SG10201604866VA/en unknown
- 2011-06-23 CA CA3124114A patent/CA3124114C/en active Active
- 2011-06-23 CA CA2976485A patent/CA2976485C/en active Active
- 2011-06-23 CA CA2928180A patent/CA2928180C/en active Active
- 2011-06-23 MY MYPI2016000762A patent/MY176187A/en unknown
- 2011-06-23 CN CN201510680820.4A patent/CN105261372B/zh active Active
- 2011-06-23 KR KR1020167016672A patent/KR101730356B1/ko active IP Right Grant
- 2011-06-23 EP EP16166356.2A patent/EP3079152B1/en active Active
- 2011-06-23 MX MX2012014525A patent/MX2012014525A/es active IP Right Grant
- 2011-06-23 CA CA2976490A patent/CA2976490C/en active Active
- 2011-06-23 EP EP14164773.5A patent/EP2757560B1/en active Active
- 2011-06-23 CN CN201510681071.7A patent/CN105244035B/zh active Active
- 2011-06-23 EP EP16166357.0A patent/EP3079153B1/en active Active
- 2011-06-23 KR KR1020237002578A patent/KR20230018539A/ko not_active Application Discontinuation
- 2011-06-23 EP EP19196423.8A patent/EP3605534B1/en active Active
- 2011-06-23 PL PL16166357T patent/PL3079153T3/pl unknown
- 2011-06-23 SG SG10201604880YA patent/SG10201604880YA/en unknown
- 2011-06-23 CN CN201510680324.9A patent/CN105261371B/zh active Active
- 2011-06-23 EP EP24214429.3A patent/EP4488996A3/en active Pending
- 2011-06-23 ES ES16166357.0T patent/ES2691934T3/es active Active
- 2011-06-23 KR KR1020197028834A patent/KR102079000B1/ko active IP Right Grant
- 2011-06-23 EP EP11743032.2A patent/EP2589046B1/en active Active
- 2011-06-23 ES ES21201950T patent/ES2984913T3/es active Active
- 2011-06-23 DK DK16166357.0T patent/DK3079153T3/en active
- 2011-06-23 CA CA3207181A patent/CA3207181A1/en active Pending
- 2011-06-23 MY MYPI2012005368A patent/MY183707A/en unknown
- 2011-06-23 ES ES16166358.8T patent/ES2683648T3/es active Active
- 2011-06-23 IL IL302557A patent/IL302557B2/en unknown
- 2011-06-23 EP EP21201950.9A patent/EP3971893B1/en active Active
- 2011-06-23 CA CA2958360A patent/CA2958360C/en active Active
- 2011-06-23 US US13/703,875 patent/US9224403B2/en active Active
- 2011-06-23 WO PCT/EP2011/060555 patent/WO2012000882A1/en active Application Filing
- 2011-06-23 KR KR1020197011298A patent/KR102030335B1/ko active IP Right Grant
- 2011-06-23 KR KR1020167018666A patent/KR101696634B1/ko active IP Right Grant
- 2011-06-23 MY MYPI2016000763A patent/MY176188A/en unknown
- 2011-06-23 CA CA3239015A patent/CA3239015A1/en active Pending
- 2011-06-23 CA CA3093517A patent/CA3093517C/en active Active
- 2011-06-23 CN CN201510680507.0A patent/CN105390140B/zh active Active
- 2011-06-23 EP EP24182508.2A patent/EP4407615B1/en active Active
- 2011-06-23 CA CA3160488A patent/CA3160488C/en active Active
- 2011-06-23 IL IL317312A patent/IL317312A/en unknown
- 2011-06-23 KR KR1020217027394A patent/KR102388001B1/ko active IP Right Grant
- 2011-06-23 SG SG10202005270YA patent/SG10202005270YA/en unknown
- 2011-06-23 JP JP2013517203A patent/JP6178236B2/ja active Active
- 2011-06-23 DK DK16166356.2T patent/DK3079152T3/en active
- 2011-06-23 CA CA2937672A patent/CA2937672C/en active Active
- 2011-06-23 KR KR1020167016674A patent/KR101696632B1/ko active IP Right Grant
- 2011-06-23 KR KR1020147010347A patent/KR101972762B1/ko active IP Right Grant
- 2011-06-23 SG SG2012089884A patent/SG186209A1/en unknown
-
2012
- 2012-11-28 IL IL223319A patent/IL223319A/en active IP Right Grant
-
2013
- 2013-10-10 HK HK13111395.3A patent/HK1183965A1/xx unknown
-
2014
- 2014-12-10 HK HK14112416.5A patent/HK1199135A1/xx unknown
-
2015
- 2015-05-07 RU RU2015117332A patent/RU2692416C2/ru active
- 2015-05-07 JP JP2015094729A patent/JP6258257B2/ja active Active
- 2015-11-09 US US14/936,408 patent/US9343077B2/en active Active
- 2015-11-09 US US14/936,393 patent/US9396736B2/en active Active
- 2015-11-20 US US14/947,906 patent/US9830923B2/en active Active
-
2016
- 2016-02-04 IL IL243958A patent/IL243958A/en active IP Right Grant
- 2016-02-18 US US15/047,317 patent/US9558753B2/en active Active
- 2016-03-31 US US15/086,409 patent/US9858940B2/en active Active
- 2016-04-12 US US15/097,201 patent/US9558754B2/en active Active
- 2016-04-12 US US15/097,192 patent/US9552824B2/en active Active
- 2016-04-25 RU RU2016116043/08A patent/RU2599338C1/ru active
- 2016-04-27 US US15/140,356 patent/US9595270B2/en active Active
- 2016-05-04 RU RU2016117277A patent/RU2642553C2/ru active
- 2016-05-10 IL IL245591A patent/IL245591A/en active IP Right Grant
- 2016-06-07 HK HK16106487.9A patent/HK1218462A1/zh unknown
- 2016-06-12 HK HK16106714.4A patent/HK1218803A1/zh unknown
- 2016-06-16 HK HK16106925.9A patent/HK1218987A1/zh unknown
- 2016-06-21 HK HK16107107.7A patent/HK1219168A1/zh unknown
- 2016-06-28 JP JP2016127885A patent/JP6679433B2/ja active Active
- 2016-06-28 JP JP2016127884A patent/JP2016194711A/ja active Pending
- 2016-07-10 IL IL246684A patent/IL246684A0/en active IP Right Grant
- 2016-07-11 HK HK16108033.4A patent/HK1220036A1/zh unknown
- 2016-07-11 RU RU2016127810A patent/RU2616774C1/ru active
- 2016-08-02 HK HK16109188.5A patent/HK1221326A1/zh unknown
- 2016-10-05 JP JP2016197150A patent/JP6279686B2/ja active Active
-
2017
- 2017-10-24 US US15/792,589 patent/US10236010B2/en active Active
- 2017-12-06 JP JP2017234202A patent/JP6556815B2/ja active Active
-
2019
- 2019-03-12 US US16/351,133 patent/US10811024B2/en active Active
- 2019-03-27 IL IL265661A patent/IL265661A/en active IP Right Grant
- 2019-05-14 RU RU2019114430A patent/RU2707716C1/ru active
- 2019-07-10 JP JP2019128330A patent/JP6682683B2/ja active Active
-
2020
- 2020-03-25 JP JP2020054398A patent/JP6812585B2/ja active Active
- 2020-10-16 US US17/073,228 patent/US11183200B2/en active Active
- 2020-11-18 IL IL278805A patent/IL278805B/en unknown
- 2020-12-16 JP JP2020208421A patent/JP6944038B2/ja active Active
-
2021
- 2021-09-09 JP JP2021146950A patent/JP7073565B2/ja active Active
- 2021-09-14 IL IL286405A patent/IL286405B2/en unknown
- 2021-11-22 US US17/532,775 patent/US11610595B2/en active Active
-
2022
- 2022-05-11 JP JP2022078082A patent/JP7147090B2/ja active Active
- 2022-09-21 JP JP2022150720A patent/JP7319441B2/ja active Active
-
2023
- 2023-03-17 US US18/185,691 patent/US11996111B2/en active Active
- 2023-07-20 JP JP2023118701A patent/JP2023134779A/ja active Pending
-
2024
- 2024-04-23 US US18/643,296 patent/US20240274145A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6098036A (en) * | 1998-07-13 | 2000-08-01 | Lockheed Martin Corp. | Speech coding system and method including spectral formant enhancer |
US7222070B1 (en) * | 1999-09-22 | 2007-05-22 | Texas Instruments Incorporated | Hybrid speech coding and system |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
WO2009114656A1 (en) * | 2008-03-14 | 2009-09-17 | Dolby Laboratories Licensing Corporation | Multimode coding of speech-like and non-speech-like signals |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10818306B2 (en) | 2017-03-23 | 2020-10-27 | Dolby International Ab | Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals |
US11605391B2 (en) | 2017-03-23 | 2023-03-14 | Dolby International Ab | Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals |
US11621013B2 (en) | 2017-03-23 | 2023-04-04 | Dolby International Ab | Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals |
US11626123B2 (en) | 2017-03-23 | 2023-04-11 | Dolby International Ab | Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals |
US11676616B2 (en) | 2017-03-23 | 2023-06-13 | Dolby International Ab | Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals |
US11763830B2 (en) | 2017-03-23 | 2023-09-19 | Dolby International Ab | Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals |
US12094480B2 (en) | 2017-03-23 | 2024-09-17 | Dolby International Ab | Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals |
US12175993B2 (en) | 2017-03-23 | 2024-12-24 | Dolby International Ab | Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals |
RU2821284C1 (ru) * | 2019-10-30 | 2024-06-19 | Долби Лэборетериз Лайсенсинг Корпорейшн | Распределение скоростей передачи битов в иммерсивных голосовых и аудиослужбах |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2707716C1 (ru) | Избирательный басовый постфильтр | |
AU2016204672B2 (en) | Audio encoder and decoder with multiple coding modes | |
RU2825321C1 (ru) | Избирательный басовый постфильтр | |
RU2820285C1 (ru) | Избирательный басовый постфильтр | |
RU2802659C1 (ru) | Избирательный басовый постфильтр | |
RU2791678C2 (ru) | Избирательный басовый постфильтр | |
AU2017276209B2 (en) | Pitch Filter for Audio Signals and Method for Filtering an Audio Signal with a Pitch Filter | |
AU2015200065B2 (en) | Post filter, decoder system and method of decoding |