RU2381572C2 - Системы, способы и устройство широкополосного речевого кодирования - Google Patents
Системы, способы и устройство широкополосного речевого кодирования Download PDFInfo
- Publication number
- RU2381572C2 RU2381572C2 RU2007140382/09A RU2007140382A RU2381572C2 RU 2381572 C2 RU2381572 C2 RU 2381572C2 RU 2007140382/09 A RU2007140382/09 A RU 2007140382/09A RU 2007140382 A RU2007140382 A RU 2007140382A RU 2381572 C2 RU2381572 C2 RU 2381572C2
- Authority
- RU
- Russia
- Prior art keywords
- signal
- highband
- speech
- excitation
- excitation signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 51
- 238000012545 processing Methods 0.000 claims abstract description 15
- 230000005284 excitation Effects 0.000 claims description 264
- 230000006870 function Effects 0.000 claims description 61
- 238000003672 processing method Methods 0.000 claims description 20
- 230000002194 synthesizing effect Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 10
- 230000003321 amplification Effects 0.000 claims description 9
- 238000012886 linear function Methods 0.000 claims description 9
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 238000002156 mixing Methods 0.000 claims description 5
- 230000006386 memory function Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 abstract description 6
- 230000000694 effects Effects 0.000 abstract description 4
- 230000014759 maintenance of location Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 238000001228 spectrum Methods 0.000 description 70
- 238000010586 diagram Methods 0.000 description 59
- 238000005070 sampling Methods 0.000 description 52
- 230000003595 spectral effect Effects 0.000 description 44
- 238000004458 analytical method Methods 0.000 description 34
- 238000006243 chemical reaction Methods 0.000 description 23
- 230000003044 adaptive effect Effects 0.000 description 19
- 239000013598 vector Substances 0.000 description 18
- 230000015572 biosynthetic process Effects 0.000 description 15
- 238000003786 synthesis reaction Methods 0.000 description 15
- 230000002087 whitening effect Effects 0.000 description 14
- 238000001914 filtration Methods 0.000 description 13
- 230000007774 longterm Effects 0.000 description 13
- 230000004044 response Effects 0.000 description 12
- 238000009499 grossing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000007423 decrease Effects 0.000 description 9
- 238000013139 quantization Methods 0.000 description 9
- 230000002123 temporal effect Effects 0.000 description 9
- 230000007704 transition Effects 0.000 description 9
- 230000002829 reductive effect Effects 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 230000003247 decreasing effect Effects 0.000 description 7
- 239000004606 Fillers/Extenders Substances 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 238000012952 Resampling Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 238000003892 spreading Methods 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Analogue/Digital Conversion (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Control Of Amplification And Gain Control (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Control Of Eletrric Generators (AREA)
- Amplitude Modulation (AREA)
- Finish Polishing, Edge Sharpening, And Grinding By Specific Grinding Devices (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Image Analysis (AREA)
- Ticket-Dispensing Machines (AREA)
- Separation Using Semi-Permeable Membranes (AREA)
- Filtration Of Liquid (AREA)
- Solid-Sorbent Or Filter-Aiding Compositions (AREA)
- Filtering Of Dispersed Particles In Gases (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
- Peptides Or Proteins (AREA)
- Filters And Equalizers (AREA)
- Stereo-Broadcasting Methods (AREA)
- Crystals, And After-Treatments Of Crystals (AREA)
- Air Conditioning Control Device (AREA)
- Developing Agents For Electrophotography (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Telephonic Communication Services (AREA)
- Transmitters (AREA)
Abstract
Изобретение относится к обработке широкополосных речевых сигналов. Широкополосный речевой кодер согласно одному варианту осуществления включает в себя узкополосный кодер и кодер полосы верхних частот. Узкополосный кодер кодирует узкополосную часть широкополосного речевого сигнала как набор параметров фильтра и соответствующий кодированный сигнал возбуждения. Кодер полосы верхних частот кодирует согласно сигналу возбуждения полосы верхних частот часть полосы верхних частот широкополосного речевого сигнала для получения набора параметров фильтра. Кодер полосы верхних частот генерирует сигнал возбуждения полосы верхних частот путем применения нелинейной функции к сигналу, основанному на кодированном узкополосном сигнале возбуждения, для генерации спектрально расширенного сигнала. Технический результат - обеспечение расширения узкополосного речевого кодера для поддержания передачи и/или сохранения широкополосных речевых сигналов при увеличении пропускной способности. 6 н. и 34 з.п. ф-лы, 32 ил.
Description
Связанные заявки
Данная заявка испрашивает приоритет предварительной патентной заявки США № 60/667901 под названием "CODING THE HIGH-FREQUENCY BAND OF WIDEBAND SPEECH", поданной 1 апреля 2005 г. Данная заявка также испрашивает приоритет предварительной патентной заявки США № 60/673965 под названием "PARAMETER CODING IN A HIGH-BAND SPEECH CODER", поданной 22 апреля 2005 г.
Область техники, к которой относится изобретение
Данное изобретение относится к обработке сигнала.
Уровень техники
Голосовая связь посредством телефонной сети общего пользования (PSTN) традиционно ограничена по пропускной способности частотным диапазоном 300-3400 кГц. Новые сети для голосовой связи, например сети сотовой связи и передачи голоса по IP (интернет-протокол, VoIP), могут не иметь такие же ограничения по пропускной способности, и может оказаться желательно передавать и принимать по таким сетям голосовые передачи, которые включают в себя широкий частотный диапазон. Например, может оказаться желательно поддерживать частотный диапазон аудио с нижней границей до 50 Гц и/или верхней границей до 7 или 8 кГц. Также может оказаться желательно поддерживать другие приложения, например высококачественную аудио- или аудио/видео-конференцсвязь, которая может иметь аудио-речевой контент в диапазонах, выходящих за пределы традиционных ограничений PSTN.
Расширение диапазона, поддерживаемого речевым кодером, на более высокие частоты может повысить разборчивость речи. Например, информация, которая дифференцирует фрикативные звуки, например 'с' и 'ф', в основном содержится на высоких частотах. Расширение полосы верхних частот может повысить другие качества речи, например присутствие. Например, даже вокализованный гласный звук может иметь спектральную энергию значительно выше ограничения PSTN.
Один подход к широкополосному речевому кодированию предусматривает распространение метода узкополосного речевого кодирования (например, предназначенного для кодирования диапазона 0-4 кГц) на широкий спектр. Например, речевой сигнал можно дискретизировать на более высокой частоте, чтобы он включал в себя высокочастотные компоненты, и метод узкополосного кодирования можно адаптировать для использования большего количества коэффициентов фильтра для представления этого широкополосного сигнала. Методы узкополосного кодирования, например CELP (линейное прогнозирование с кодовым возбуждением), требуют большого объема вычислений, однако широкополосный CELP-кодер может требовать слишком много циклов обработки, чтобы иметь практическое применение во многих мобильных и иных встроенных приложениях. Кодирование всего спектра широкополосного сигнала для достижения нужного качества с использованием такого метода также может приводить к неприемлемо большому увеличению ширины полосы. Кроме того, потребовалось бы транскодирование такого кодированного сигнала, прежде чем передать даже его узкополосную часть и/или декодировать посредством системы, которая поддерживает только узкополосное кодирование.
Другой подход к широкополосному речевому кодированию предусматривает экстраполяцию спектральной огибающей полосы верхних частот из кодированной узкополосной спектральной огибающей. Хотя такой подход можно реализовать без увеличения ширины полосы и без необходимости в транскодировании, грубую спектральную огибающую или формантную структуру части полосы верхних частот речевого сигнала, в общем случае, невозможно точно прогнозировать на основании спектральной огибающей узкополосной части.
Может оказаться желательно реализовать широкополосное речевое кодирование так, чтобы, по меньшей мере, узкополосную часть кодированного сигнала можно было передавать по узкополосному каналу (например, каналу PSTN) без транскодирования или другого значительного изменения. Эффективность широкополосного расширения кодирования также может быть желательной, например, во избежание значительного сокращения количества пользователей, которые могут обслуживаться в приложениях, например, беспроводной сотовой телефонной сети и вещании по беспроводным и проводным каналам.
Сущность изобретения
Согласно одному варианту осуществления способ обработки сигнала включает в себя этапы, на которых синтезируют узкополосный речевой сигнал согласно, по меньшей мере, узкополосному сигналу возбуждения и совокупности узкополосных параметров фильтра, и генерируют сигнал возбуждения полосы верхних частот на основании узкополосного сигнала возбуждения. Способ также включает в себя этапы, на которых синтезируют речевой сигнал полосы верхних частот согласно, по меньшей мере, сигналу возбуждения полосы верхних частот и совокупности параметров фильтра полосы верхних частот, и объединяют узкополосный речевой сигнал и речевой сигнал полосы верхних частот для получения широкополосного речевого сигнала. Согласно этому способу на этапе генерации сигнала возбуждения полосы верхних частот применяют нелинейную функцию к сигналу, который основан на узкополосном сигнале возбуждения, для генерации спектрально расширенного сигнала, и сигнал возбуждения полосы верхних частот основан на спектрально расширенном сигнале.
Согласно другому варианту осуществления устройство включает в себя узкополосный декодер, способный синтезировать узкополосный речевой сигнал согласно, по меньшей мере, узкополосному сигналу возбуждения и совокупности узкополосных параметров фильтра. Устройство также включает в себя декодер полосы верхних частот, способный генерировать сигнал возбуждения полосы верхних частот на основании узкополосного сигнала возбуждения и синтезировать речевой сигнал полосы верхних частот согласно, по меньшей мере, сигналу возбуждения полосы верхних частот и совокупности параметров фильтра полосы верхних частот. Устройство также включает в себя гребенку фильтров, предназначенную для объединения узкополосного речевого сигнала и речевого сигнала полосы верхних частот для получения широкополосного речевого сигнала. Декодер полосы верхних частот может применять нелинейную функцию к сигналу, который основан на узкополосном сигнале возбуждения, для генерации спектрально расширенного сигнала и для генерации сигнала возбуждения полосы верхних частот на основании спектрально расширенного сигнала.
Согласно еще одному варианту осуществления способ обработки сигнала включает в себя этапы, на которых обрабатывают широкополосный речевой сигнал для получения узкополосного речевого сигнала и речевого сигнала полосы верхних частот, и кодируют узкополосный речевой сигнал для получения, по меньшей мере, кодированного узкополосного сигнала возбуждения и совокупности узкополосных параметров фильтра. Способ также включает в себя этапы, на которых генерируют сигнал возбуждения полосы верхних частот на основании узкополосного сигнала возбуждения, причем узкополосный сигнал возбуждения основан на кодированном узкополосном сигнале возбуждения. Способ включает в себя этапы, на которых кодируют речевой сигнал полосы верхних частот согласно сигналу возбуждения полосы верхних частот для получения, по меньшей мере, совокупности параметров фильтра полосы верхних частот. Согласно этому способу на этапе генерации сигнала возбуждения полосы верхних частот применяют нелинейную функцию к сигналу, который основан на узкополосном сигнале возбуждения, для генерации спектрально расширенного сигнала, и сигнал возбуждения полосы верхних частот основан на спектрально расширенном сигнале.
Согласно еще одному варианту осуществления устройство включает в себя гребенку фильтров, предназначенную для фильтрации широкополосного речевого сигнала для получения узкополосного речевого сигнала и речевого сигнала полосы верхних частот, и узкополосный кодер, предназначенный для кодирования узкополосного речевого сигнала для получения, по меньшей мере, кодированного узкополосного сигнала возбуждения и совокупности узкополосных параметров фильтра. Устройство включает в себя кодер полосы верхних частот, предназначенный для генерации сигнала возбуждения полосы верхних частот на основании кодированного узкополосного сигнала возбуждения, и кодирования речевого сигнала полосы верхних частот согласно сигналу возбуждения полосы верхних частот для получения, по меньшей мере, совокупности параметров фильтра полосы верхних частот. Кодер полосы верхних частот может применять нелинейную функцию к сигналу, который основан на кодированном узкополосном сигнале возбуждения, для генерации спектрально расширенного сигнала, и для генерации сигнала возбуждения полосы верхних частот на основании спектрально расширенного сигнала.
Краткое описание чертежей
Фиг.1a - блок-схема широкополосного речевого кодера A100 согласно варианту осуществления.
Фиг.1b - блок-схема реализации A102 широкополосного речевого кодера A100.
Фиг.2a - блок-схема широкополосного речевого декодера B100 согласно варианту осуществления.
Фиг.2b - блок-схема реализации B102 широкополосного речевого кодера B100.
Фиг.3a - блок-схема реализации A112 гребенки фильтров A110.
Фиг.3b - блок-схема реализации B122 гребенки фильтров B120.
Фиг.4a - полоса частот низкого и высокого диапазонов для одного примера гребенки фильтров A110.
Фиг.4b - полоса частот низкого и высокого диапазонов для другого примера гребенки фильтров A110.
Фиг.4c - блок-схема реализации A114 гребенки фильтров A112.
Фиг.4d - блок-схема реализации B124 гребенки фильтров B122.
Фиг.5a - пример графика зависимости логарифмической амплитуды от частоты для речевого сигнала.
Фиг.5b - блок-схема базовой системы кодирования с линейным прогнозированием.
Фиг.6 - блок-схема реализации A122 узкополосного кодера A120.
Фиг.7 - блок-схема реализации B112 узкополосного декодера B110.
Фиг.8a - пример графика зависимости логарифмической амплитуды от частоты для остаточного сигнала для вокализованной речи.
Фиг.8b - пример графика зависимости логарифмической амплитуды от времени для остаточного сигнала для вокализованной речи.
Фиг.9 - блок-схема базовой системы кодирования с линейным прогнозированием, которая также осуществляет долгосрочное прогнозирование.
Фиг.10 - блок-схема реализации A202 кодера A200 полосы верхних частот.
Фиг.11 - блок-схема реализации A302 генератора возбуждения A300 полосы верхних частот.
Фиг.12 - блок-схема реализации A402 расширителя спектра A400.
Фиг.12a - графики спектров сигнала в различных точках в одном примере операции расширения спектра.
Фиг.12b - графики спектров сигнала в различных точках в другом примере операции расширения спектра.
Фиг.13 - блок-схема реализации A304 генератора возбуждения A302 полосы верхних частот.
Фиг.14 - блок-схема реализации A306 генератора возбуждения A302 полосы верхних частот.
Фиг.15 - логическая блок-схема задачи T100 вычисления огибающей.
Фиг.16 - блок-схема реализации 492 объединителя 490.
Фиг.17 иллюстрирует подход к вычислению меры периодичности сигнала S30 полосы верхних частот.
Фиг.18 - блок-схема реализации A312 генератора возбуждения A302 полосы верхних частот.
Фиг.19 - блок-схема реализации A314 генератора возбуждения A302 полосы верхних частот.
Фиг.20 - блок-схема реализации A316 генератора возбуждения A302 полосы верхних частот.
Фиг.21 - логическая блок-схема задачи T200 вычисления коэффициента усиления.
Фиг.22 - логическая блок-схема реализации T210 задачи T200 вычисления коэффициента усиления.
Фиг.23a - диаграмма функции окна.
Фиг.23b - применение функции окна, показанной на фиг.23a, к подкадрам речевого сигнала.
Фиг.24 - блок-схема реализации B202 декодера B200 полосы верхних частот.
Фиг.25 - блок-схема реализации AD10 широкополосного речевого кодера A100.
Фиг.26a - схема реализации D122 линии задержки D120.
Фиг.26b - схема реализации D124 линии задержки D120.
Фиг.27 - схема реализации D130 линии задержки D120.
Фиг.28 - блок-схема реализации AD12 широкополосного речевого кодера AD10.
Фиг.29 - логическая блок-схема способа обработки сигнала MD100 согласно варианту осуществления.
Фиг.30 - логическая блок-схема способа M100 согласно варианту осуществления.
Фиг.31a - логическая блок-схема способа M200 согласно варианту осуществления.
Фиг.31b - логическая блок-схема для реализации M210 способа M200.
Фиг.32 - логическая блок-схема способа M300 согласно варианту осуществления.
На чертежах и в прилагаемом описании одинаковые ссылочные позиции обозначают одинаковые или аналогичные элементы или сигналы.
Подробное описание
Описанные здесь варианты осуществления включают в себя системы, способы и устройство, которые могут обеспечивать расширение узкополосного речевого кодера для поддержки передачи и/или сохранения широкополосных речевых сигналов при увеличении пропускной способности лишь примерно от 800 до 1000 бит/с (бит в секунду). Потенциальные преимущества таких реализаций включают в себя встроенное кодирование для поддержки совместимости с узкополосными системами, относительно легкое распределение и перераспределение битов между каналами узкополосного кодирования и кодирования полосы верхних частот, исключение операции широкополосного синтеза, требующего большого объема вычислений, и поддержку низкой частоты дискретизации для сигналов, обрабатываемых посредством процедур кодирования формы волны, требующих большого объема вычислений.
Если в явном виде не указано в контексте, термин "вычисление" используется здесь для указания любого из его обычных значений, например расчет, генерацию и выбор из списка значений. Термин "содержащий", используемый в настоящем описании и формуле изобретения, не исключает других элементов или операций. Выражение "A основано на B" используется для указания любого из его обычных значений, в том числе случаев (i) "A равно B" и (ii) "A основано на, по меньшей мере, B". Термин "интернет-протокол" включает в себя версию 4, описанную в IETF (Internet Engineering Task Force) RFC (Request for Comments) 791, и последующие версии, например версию 6.
На фиг.1a показана блок-схема широкополосного речевого кодера A100 согласно варианту осуществления. Гребенка фильтров A110 обеспечивает фильтрацию широкополосного речевого сигнала S10 для создания узкополосного сигнала S20 и сигнала S30 полосы верхних частот. Узкополосный кодер A120 может кодировать узкополосный сигнал S20 для создания узкополосных (NB) параметров фильтра S40 и узкополосного остаточного сигнала S50. Согласно приведенному здесь более подробному описанию узкополосный кодер A120 обычно создает узкополосные параметры фильтра S40 и кодированный узкополосный сигнал возбуждения S50 в виде индексов кодовой книги или в другой квантованной форме. Кодер A200 полосы верхних частот кодирует сигнал S30 полосы верхних частот согласно информации в кодированном узкополосном сигнале возбуждения S50 для создания параметров кодирования S60 полосы верхних частот. Согласно приведенному здесь более подробному описанию кодер A200 полосы верхних частот обычно создает параметры кодирования S60 полосы верхних частот в виде индексов кодовой книги или в другой квантованной форме. В одном конкретном примере широкополосный речевой кодер A100 может кодировать широкополосный речевой сигнал S10 со скоростью около 8,55 кбит/с (килобит в секунду), при этом около 7,55 кбит/с используется для узкополосных параметров фильтра S40 и кодированного узкополосного сигнала возбуждения S50, и около 1 кбит/с используется для параметров кодирования S60 полосы верхних частот.
Может оказаться желательным объединять кодированные узкополосный сигнал и сигналы полосы верхних частот в единый битовый поток. Например, может оказаться желательным мультиплексировать кодированные сигналы друг с другом для передачи (например, по проводному, оптическому или беспроводному каналу связи) или для сохранения в виде кодированного широкополосного речевого сигнала. На фиг.1b показана блок-схема реализации A102 широкополосного речевого кодера A100, который включает в себя a мультиплексор A130, обеспечивающий объединение узкополосных параметров фильтра S40, кодированного узкополосного сигнала возбуждения S50, и параметров фильтра S60 полосы верхних частот в мультиплексированный сигнал S70.
Устройство, включающее в себя кодер A102, также может включать в себя схему, обеспечивающую передачу мультиплексированного сигнала S70 в канал связи, например, проводной, оптический или беспроводной канал. Такое устройство также может осуществлять одну или несколько канальных операций кодирования над сигналом, например кодирование с коррекцией ошибок (например, сверточное кодирование, совместимое по скорости) и/или кодирование с обнаружением ошибок (например, кодирование с циклической избыточностью) и/или кодирование на одном или нескольких уровнях сетевого протокола (например, Ethernet, TCP/IP, cdma2000).
Может оказаться желательным, чтобы мультиплексор A130 встраивал кодированный узкополосный сигнал (включающий в себя узкополосные параметры фильтра S40 и кодированный узкополосный сигнал возбуждения S50) в виде разделяемого битового потока мультиплексированного сигнала S70, что позволило бы восстанавливать и декодировать кодированный узкополосный сигнал независимо от другой части мультиплексированного сигнала S70, например сигнала полосы верхних частот и/или сигнала полосы нижних частот. Например, мультиплексированный сигнал S70 может быть сформирован так, что кодированный узкополосный сигнал можно восстанавливать, отбрасывая параметры фильтра S60 полосы верхних частот. Потенциальное преимущество такой особенности в том, что это позволяет избегать необходимости транскодирования кодированного широкополосного сигнала до передачи его в систему, которая поддерживает декодирование узкополосного сигнала, но не поддерживает декодирование части полосы верхних частот.
На фиг.2a показана блок-схема широкополосного речевого декодера B100 согласно варианту осуществления. Узкополосный декодер B110 способен декодировать узкополосные параметры фильтра S40 и кодированный узкополосный сигнал возбуждения S50 для создания узкополосного сигнала S90. Декодер B200 полосы верхних частот декодирует параметры кодирования S60 полосы верхних частот согласно узкополосному сигналу возбуждения S80 на основании кодированного узкополосного сигнала возбуждения S50 для создания сигнала S100 полосы верхних частот. В этом примере узкополосный декодер B110 выдает узкополосный сигнал возбуждения S80 на декодер B200 полосы верхних частот. Гребенка фильтров B120 объединяет узкополосный сигнал S90 и сигнал S100 полосы верхних частот для создания широкополосного речевого сигнала S110.
На фиг.2b показана блок-схема реализации B102 широкополосного речевого декодера B100, который включает в себя демультиплексор B130 для создания кодированных сигналов S40, S50 и S60 из мультиплексированного сигнала S70. Устройство, включающее в себя декодер B102, содержит схему для приема мультиплексированного сигнала S70 из канала связи, например, проводного, оптического или беспроводного канала. Такое устройство также может осуществлять одну или несколько канальных операций декодирования сигнала, например декодирование с коррекцией ошибок (например, сверточное декодирование, совместимое по скорости), и/или декодирование с обнаружением ошибок (например, декодирование с циклической избыточностью), и/или декодирование на одном или нескольких уровнях сетевого протокола (например, Ethernet, TCP/IP, cdma2000).
Гребенка фильтров A110 фильтрует входной сигнал согласно схеме расщепленных диапазонов для создания низкочастотного поддиапазона и высокочастотного поддиапазона. В зависимости от критериев конструкции для конкретного приложения выходные поддиапазоны могут иметь полосы равной или неравной ширины и могут быть перекрывающимися или неперекрывающимися. Возможна также конфигурация гребенки фильтров A110, которая создает более двух поддиапазонов. Например, такая гребенка фильтров может создавать один или несколько сигналов полосы верхних частот, которые включают в себя составляющие в частотном диапазоне с частотой ниже, чем в узкополосном сигнале S20 (например, в диапазоне 50-300 Гц). Такая гребенка фильтров также может создавать один или несколько дополнительных сигналов полосы верхних частот, которые включают в себя составляющие в частотном диапазоне с частотой выше, чем в сигнале S30 полосы верхних частот (например, в диапазоне 14-20, 16-20 или 16-32 кГц). В таком случае можно реализовать широкополосный речевой кодер A100 для отдельного кодирования этого/их сигнала или сигналов и мультиплексор A130 может включать дополнительный/е кодированный/е сигнал или сигналы в мультиплексированный сигнал S70 (например, в качестве отдельной части).
На фиг.3a показана блок-схема реализации A112 гребенки фильтров A110 для создания сигналов двух поддиапазонов, имеющих сниженные частоты дискретизации. Гребенка фильтров A110 принимает широкополосный речевой сигнал S10, имеющий высокочастотную часть (или полосу верхних частот) и низкочастотную часть (или полосу нижних частот). Гребенка фильтров A112 включает в себя тракт обработки полосы нижних частот для приема широкополосного речевого сигнала S10 и создания узкополосного речевого сигнала S20 и тракт обработки полосы верхних частот для приема широкополосного речевого сигнала S10 и создания речевого сигнала S30 полосы верхних частот. Низкочастотный фильтр 110 фильтрует широкополосный речевой сигнал S10, пропуская выбранный низкочастотный поддиапазон, и высокочастотный фильтр 130 фильтрует широкополосный речевой сигнал S10, пропуская выбранный высокочастотный поддиапазон. Поскольку сигналы обоих поддиапазонов имеют более узкие полосы, чем широкополосный речевой сигнал S10, их частоты дискретизации можно снизить до некоторой степени без потери информации. Блок 120 понижения частоты дискретизации снижает частоту дискретизации низкочастотного сигнала согласно нужному коэффициенту децимации (например, путем удаления выборок сигнала и/или замены выборок средними значениями), и блок 140 понижения частоты дискретизации аналогично снижает частоту дискретизации высокочастотного сигнала согласно другому нужному коэффициенту децимации.
На фиг.3b показана блок-схема соответствующей реализации B122 гребенки фильтров B120. Блок 150 повышения частоты дискретизации повышает частоту дискретизации узкополосного сигнала S90 (например, путем вставки нулей и/или путем дублирования выборок), и низкочастотный фильтр 160 фильтрует сигнал, преобразованный с повышением частоты дискретизации, пропуская только часть полосы нижних частот (например, для предотвращения помехи дискретизации). Аналогично блок 170 повышения частоты дискретизации повышает частоту дискретизации сигнала S100 полосы верхних частот, и высокочастотный фильтр 180 фильтрует сигнал, преобразованный с повышением частоты дискретизации, пропуская только часть полосы верхних частот. Затем два полосовых сигнала суммируются для формирования широкополосного речевого сигнала S110. В некоторых реализациях декодера B100 гребенка фильтров B120 создает взвешенную сумму двух полосовых сигналов согласно одному или нескольким весовым коэффициентам, полученным и/или вычисленным декодером B200 полосы верхних частот. Возможна также конфигурация гребенки фильтров B120, которая объединяет более двух полосовых сигнала.
Каждый из фильтров 110, 130, 160, 180 можно реализовать в виде фильтра с конечной импульсной характеристикой (FIR) или фильтра с бесконечной импульсной характеристикой (IIR). Частотные характеристики фильтров 110 и 130 кодера могут иметь переходные области симметричной или асимметричной формы между полосой заграждения и полосой пропускания. Аналогично частотные характеристики фильтров 160 и 180 декодера могут иметь переходные области симметричной или асимметричной формы между полосой заграждения и полосой пропускания. Может оказаться желательно, но не строго обязательно, чтобы низкочастотный фильтр 110 имел такую же характеристику, как низкочастотный фильтр 160, и чтобы высокочастотный фильтр 130 имел такую же характеристику, как высокочастотный фильтр 180. В одном примере две пары фильтров 110, 130 и 160, 180 образуют гребенку квадратурных зеркальных фильтров (QMF), причем пара фильтров 110, 130 имеют такие же коэффициенты, как пара фильтров 160, 180.
В типичном примере низкочастотный фильтр 110 имеет полосу пропускания, которая включает в себя ограниченный диапазон PSTN 300-3400 Гц (например, полосу от 0 до 4 кГц). На фиг.4a и 4b показаны относительные ширины полосы широкополосного речевого сигнала S10, узкополосного сигнала S20 и сигнала S30 полосы верхних частот в двух разных примерах реализации. В этих двух конкретных примерах широкополосный речевой сигнал S10 имеет частоту дискретизации 16 кГц (представляющую частотные составляющие в диапазоне от 0 до 8 кГц) и узкополосный сигнал S20 имеет частоту дискретизации 8 кГц (представляющую частотные составляющие в диапазоне от 0 до 4 кГц).
В примере, приведенном на фиг.4a, нет значительного перекрытия между двумя поддиапазонами. Сигнал S30 полосы верхних частот, как показано в этом примере, можно получить с использованием высокочастотного фильтра 130 с полосой пропускания 4-8 кГц. В таком случае может оказаться желательно снизить частоту дискретизации до 8 кГц посредством преобразования с понижением частоты дискретизации фильтрованного сигнала с коэффициентом два. Такая операция, которая, предположительно, значительно снижает вычислительную сложность дальнейших операций обработки сигнала, смещает энергию полосы пропускания в диапазон от 0 до 4 кГц без потери информации.
В альтернативном примере, показанном на фиг.4b, верхний и нижний поддиапазоны имеют заметное перекрытие, вследствие чего область от 3,5 до 4 кГц описывается сигналами обоих поддиапазонов. Сигнал S30 полосы верхних частот, представленный в этом примере, можно получить с использованием высокочастотного фильтра 130 с полосой пропускания 3,5-7 кГц. В таком случае может оказаться желательно снизить частоту дискретизации до 7 кГц путем преобразования с понижением частоты дискретизации фильтрованного сигнала с коэффициентом 16/7. Такая операция, которая, предположительно, значительно снижает вычислительную сложность дальнейших операций обработки сигнала, смещает энергию полосы пропускания в диапазон от 0 до 3,5 кГц без потери информации.
В обычной телефонной трубке для телефонной связи, один или несколько преобразователей (т.е. микрофон и телефон или громкоговоритель) имеют недостаточный отклик в частотном диапазоне 7-8 кГц. В примере, приведенном на фиг.4b, часть широкополосного речевого сигнала S10 от 7 до 8 кГц не включена в кодированный сигнал. Другие конкретные примеры высокочастотного фильтра 130 имеют полосы пропускания 3,5-7,5 кГц и 3,5-8 кГц.
В некоторых реализациях обеспечение перекрытия между поддиапазонами, как в примере, приведенном на фиг.4b, позволяет использовать низкочастотный и/или высокочастотный фильтр, имеющий плавный спад характеристики в области перекрытия. Такие фильтры обычно легче проектируются, требуют меньшей сложности вычислений и/или вносят меньшую задержку по сравнению с фильтрами с более резкими или "крутыми" характеристиками. Для фильтров, имеющих резкие переходные области, свойственны более высокие боковые полосы (что может приводить к помехе дискретизации), чем у фильтров аналогичного порядка, которые имеют плавный спад характеристики. Фильтры, имеющие резкие переходные области, могут также иметь длинные импульсные характеристики, которые могут приводить к звенящим искажениям. Для реализаций гребенки фильтров, имеющей один или несколько IIR-фильтров, допускающей плавный спад характеристики в области перекрытия, можно использовать фильтр или фильтры, в которых полюсы удалены от единичной окружности, что может играть важную роль для обеспечения устойчивой реализации с фиксированной точкой.
Перекрытие поддиапазонов допускает плавное смешивание нижнего диапазона и верхнего диапазона, что может приводить к уменьшению количества слышимых искажений, снижению помехи дискретизации и/или менее заметному переходу от одного диапазона к другому. Кроме того, эффективность кодирования узкополосного кодера A120 (например, кодера формы сигнала) может снижаться с увеличением частоты. Например, качество кодирования узкополосного кодера может снижаться на малых битовых скоростях, особенно при наличии фонового шума. В таких случаях обеспечение перекрытия поддиапазонов может повысить качество воспроизводимых частотных составляющих в области перекрытия.
Кроме того, перекрытие поддиапазонов допускает плавное смешивание нижнего диапазона и верхнего диапазона, что может приводить к меньшим слышимым искажениям, снижению помехи дискретизации и/или менее заметному переходу от одного диапазона к другому. Такая мера может быть особенно желательной для реализации, в которой узкополосный кодер A120 и кодер A200 полосы верхних частот действуют согласно разным методам кодирования. Например, разные методы кодирования могут создавать сигналы, звучащие совершенно по-разному. Кодер, который кодирует спектральную огибающую в виде индексов кодовой книги, может формировать сигнал, имеющий другое звучание, чем кодер, который кодирует амплитудный спектр. Временной кодер (например, кодер на основе импульсно-кодовой модуляции (ИКМ) может формировать сигнал, имеющий другое звучание, чем частотный кодер. Кодер, который кодирует сигнал посредством представления спектральной огибающей и соответствующего остаточного сигнала, может формировать сигнал, имеющий другое звучание, чем кодер, который кодирует сигнал посредством только представления спектральной огибающей. Кодер, который кодирует сигнал в виде представления его формы волны, может создавать выходной сигнал, имеющий другое звучание, чем от синусоидального кодера. В таких случаях использованием фильтров, имеющих резкие переходные области для задания неперекрывающихся поддиапазонов, может приводить к резкому и легко воспринимаемому переходу между поддиапазонами в синтезированном широкополосном сигнале.
Хотя гребенки фильтров QMF, имеющие взаимодополняющие перекрывающиеся частотные характеристики, часто используются в методах обработки поддиапазонов, такие фильтры непригодны для, по меньшей мере, некоторых из описанных здесь реализаций широкополосного кодирования. Гребенка фильтров QMF в кодере способна создавать значительную помеху дискретизации, которая подавляется соответствующей гребенкой фильтров QMF в декодере. Такая конфигурация может не подходить для приложения, в котором сигнал подвергается значительному искажению между гребенками фильтров, поскольку искажение может снижать эффективность подавления помехи дискретизации. Например, описанные здесь приложения включают в себя реализации кодирования, предназначенные для работы на очень низких битовых скоростях. Вследствие очень низкой битовой скорости велика вероятность того, что декодированный сигнал окажется значительно искаженным по сравнению с исходным сигналом, поэтому использование гребенок фильтров QMF может приводить к неподавленной помехе дискретизации. Приложения, в которых используются гребенки фильтров QMF, обычно имеют более высокие битовые скорости (например, свыше 12 кбит/с для AMR и 64 кбит/с для G.722).
Дополнительно, кодер может создавать синтезированный сигнал, который по восприятию подобен исходному сигналу, но в действительности значительно отличается от исходного сигнала. Например, описанный здесь кодер, который выводит возбуждение полосы верхних частот из узкополосного остаточного сигнала, может создавать такой сигнал, поскольку фактический остаточный сигнал полосы верхних частот может полностью отсутствовать в декодированном сигнале. Использование гребенок фильтров QMF в таких приложениях может приводить к значительной степени искажения, обусловленного скомпенсированной помехой дискретизации.
Величину искажения, обусловленного помехой дискретизации QMF, можно снизить, если поддиапазон, подверженный влиянию, узок, поскольку эффект помехи дискретизации ограничивается шириной полосы, равной ширине поддиапазона. Однако в описанных здесь примерах, где каждый поддиапазон включает в себя около половины полосы широкополосного диапазона, искажение, обусловленное скомпенсированной помехой дискретизации, может оказывать влияние на значительную часть сигнала. На качество сигнала также может влиять положение полосы частот, в которой имеет место скомпенсированная помеха дискретизации. Например, искажение, создаваемое вблизи центра широкополосного речевого сигнала (например, между 3 и 4 кГц), может быть гораздо менее желательно, чем искажение, возникающее вблизи края сигнала (например, свыше 6 кГц).
Хотя отклики фильтров гребенки фильтров QMF строго связаны друг с другом, части полосы нижних частот и полосы верхних частот гребенок фильтров A110 и B120 могут иметь спектры, которые никак не связаны друг с другом за исключением перекрытия двух поддиапазонов. Перекрытие двух поддиапазонов определяется как расстояние от точки, в которой частотная характеристика фильтра полосы верхних частот спадает до -20 дБ, до точки, в которой частотная характеристика фильтра полосы нижних частот спадает до -20 дБ. В различных примерах гребенки фильтров A110 и/или B120, это перекрытие занимает диапазон от около 200 Гц до около 1 кГц. Диапазон от около 400 до около 600 Гц может представлять желаемый компромисс между эффективностью кодирования и воспринимаемым сглаживанием. В одном конкретном примере, упомянутом выше, перекрытие составляет около 500 Гц.
Может оказаться желательно реализовать гребенку фильтров A112 и/или B122 для осуществления операций, показанных на фиг.4a и 4b, в виде нескольких каскадов. Например, на фиг.4c показана блок-схема реализации A114 гребенки фильтров A112, которая осуществляет функциональный эквивалент операций высокочастотной фильтрации и преобразования с понижением частоты дискретизации с использованием ряда операций интерполяции, повторной дискретизации, децимации и других операций. Такая реализация упрощает конструирования и/или обеспечивает повторное использование функциональных блоков логики и/или кода. Например, один и тот же функциональный блок можно использовать для осуществления операций децимации до 14 кГц и децимации до 7 кГц, как показано на фиг.4c. Операцию обращения спектра можно реализовать посредством умножения сигнала на функцию e
jnπ или последовательность (-1)n, которая попеременно принимает значения +1 и -1. Операцию формирования спектра можно реализовать посредством низкочастотного фильтра, предназначенного для формирования сигнала для получения нужной общей характеристики фильтра.
Заметим, что вследствие операции обращения спектра спектр сигнала S30 полосы верхних частот переворачивается. Последующие операции в кодере и соответствующем декодере могут быть конфигурированы соответственно. Например, описанный здесь генератор возбуждения A300 полосы верхних частот может создавать сигнал возбуждения S120 полосы верхних частот, который также имеет спектрально обращенную форму.
На фиг.4d показана блок-схема реализации B124 гребенки фильтров B122, которая осуществляет функциональный эквивалент операций повышения частоты дискретизации и высокочастотной фильтрации с использованием ряда операций интерполяции, повторной дискретизации и других операций. Гребенка фильтров B124 включает в себя операцию обращения спектра в верхнем диапазоне, которая обращает аналогичную операцию, осуществляемую, например, в гребенке фильтров кодера, например в гребенке фильтров A114. В этом конкретном примере гребенка фильтров B124 также включает в себя узкополосные режекторные фильтры в нижнем и верхнем диапазоне, которые ослабляют составляющую сигнала на 7100 Гц, хотя такие фильтры являются необязательными и не всегда входят в состав устройства. Патентная заявка "SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING" поданная совместно с данной заявкой, номер дела поверенного 050551, включает в себя дополнительное описание и чертежи, относящиеся к характеристикам элементов конкретных реализаций гребенок фильтров A110 и B120, и этот материал включен, таким образом, посредством ссылки.
Узкополосный кодер A120 реализован согласно модели источник-фильтр, которая предусматривает кодирование входного речевого сигнала в виде (A) набора параметров, описывающих фильтр, и (B) сигнала возбуждения, который возбуждает описанный фильтр для формирования синтезированного воспроизведения входного речевого сигнала. На фиг.5a показан пример спектральной огибающей речевого сигнала. Пики, характеризующие эту спектральную огибающую, представляют резонансы речевого тракта и называются формантами. Большинство речевых кодеров кодируют, по меньшей мере, эту грубую спектральную структуру в виде набора параметров, например коэффициентов фильтра.
На фиг.5b показан пример базовой конфигурации источник-фильтр, применяемой для кодирования спектральной огибающей узкополосного сигнала S20. Модуль анализа вычисляет набор параметров, характеризующих фильтр, соответствующий звуку речи в течение периода времени (обычно 20 мс). Отбеливающий фильтр (также именуемый анализирующим фильтром или фильтром ошибок прогнозирования), настроенный согласно этим параметрам фильтра, удаляет спектральную огибающую для выравнивания спектральной характеристики сигнала. Полученный отбеленный сигнал (также именуемый остатком) имеет меньшую энергию и, таким образом, меньшую дисперсию, и легче поддается кодированию, чем исходный речевой сигнал. Ошибки, возникающие при кодировании остаточного сигнала, также могут более равномерно распределяться по спектру. Параметры фильтра и остаточный сигнал обычно квантуются для эффективной передачи по каналу. В декодере синтезирующий фильтр, настроенный согласно параметрам фильтра, возбуждается сигналом, основанным на остаточном сигнале, для создания синтезированной версии исходного звука речи. Синтезирующий фильтр обычно имеет передаточную функцию, обратную передаточной функции отбеливающего фильтра.
На фиг.6 показана блок-схема базовой реализации A122 узкополосного кодера A120. В этом примере модуль анализа 210 кодирования с линейным прогнозированием (LPC) кодирует спектральную огибающую узкополосного сигнала S20 в виде набора коэффициентов линейного прогнозирования (LP) (например, коэффициентов полюсного фильтра 1/A(z)). Модуль анализа обычно обрабатывает входной сигнал как ряд неперекрывающихся кадров, при этом для каждого кадра вычисляется новый набор коэффициентов. Период кадра это, в общем случае, период, в течение которого сигнал предположительно является локально стационарным; типичный период составляет 20 миллисекунд (что эквивалентно 160 выборкам при частоте дискретизации 8 кГц). В одном примере модуль анализа 210 LPC способен вычислять набор из десяти коэффициентов НЧ-фильтра для описания формантной структуры каждого 20-миллисекундного кадра. Также возможна реализация модуля анализа, обрабатывающего входной сигнал как ряд перекрывающихся кадров.
Модуль анализа может анализировать выборки каждого кадра напрямую, или выборки могут сначала взвешиваться согласно функции окна (например, окна Хэмминга). Анализ также может осуществляться по окну, превышающему размер кадра, например 30-миллисекундному окну. Это окно может быть симметричным (например, 5-20-5, включая в себя 5 миллисекунд непосредственно до и после 20-миллисекундного кадра) или асимметричным (например 10-20, включая в себя последние 10 миллисекунд предыдущего кадра). Модуль анализа LPC обычно вычисляет коэффициенты НЧ-фильтра с использованием рекурсивного метода Левинсона-Дурбина или алгоритма Леру-Гегюна. В другой реализации модуль анализа может вычислять набор коэффициентов косинусного преобразования Фурье для каждого кадра вместо набора коэффициентов НЧ-фильтра.
Выходную скорость кодера A120 можно значительно снижать с относительно небольшим влиянием на качество воспроизведения благодаря квантованию параметров фильтра. Коэффициенты фильтра линейного прогнозирования трудно эффективно квантовать, и их обычно отображают в другое представление, например пары спектральных линий (LSP) или частоты спектральных линий (LSF), для квантования и/или энтропийного кодирования. В примере, приведенном на фиг.6, преобразование 220 коэффициентов LP-фильтра в LSF преобразует набор коэффициентов НЧ-фильтра в соответствующий набор LSF. Другие взаимно-однозначные представления коэффициентов НЧ-фильтра включают в себя коэффициенты PARCOR; значения логарифмического отношения площадей; пары спектральных иммитансов (ISP); и частоты спектральных иммитансов (ISF), которые используются в кодеке AMR-WB (Adaptive Multirate-Wideband) GSM (Глобальной системы мобильной связи). Обычно преобразование между набором коэффициентов НЧ-фильтра и соответствующим набором LSFs обратимо, но варианты осуществления также включают в себя реализации кодера A120, в которых преобразование невозможно обратить без ошибки.
Квантователь 230 квантует набор узкополосных LSF (или других представлений коэффициентов), и узкополосный кодер A122 выводит результат этого квантования в виде узкополосных параметров фильтра S40. Такой квантователь обычно включает в себя векторный квантователь, который кодирует входной вектор как индекс для соответствующей векторной записи в таблице или кодовой книге.
Согласно фиг.6 узкополосный кодер A122 также генерирует остаточный сигнал, пропуская узкополосный сигнал S20 через отбеливающий фильтр 260 (также именуемый анализирующим фильтром или фильтром ошибок прогнозирования), настроенный согласно набору коэффициентов фильтра. В этом конкретном примере, отбеливающий фильтр 260 реализован как FIR-фильтр, хотя можно также использовать реализации IIR. Этот остаточный сигнал обычно содержит важную, с точки зрения восприятия, информацию речевого кадра, например долговременную структуру, связанную с основным тоном, которая не представлена в узкополосных параметрах фильтра S40. Квантователь 270 вычисляет квантованное представление этого остаточного сигнала для вывода в качестве кодированного узкополосного сигнала возбуждения S50. Такой квантователь обычно включает в себя векторный квантователь, который кодирует входной вектор как индекс для соответствующей векторной записи в таблице или кодовой книге. Альтернативно такой квантователь может передавать один или несколько параметров, из которых в декодере может динамически генерироваться вектор вместо извлечения его из хранилища, как в методе разреженной кодовой книги. Такой способ используется в таких схемах кодирования, как алгебраическое CELP (линейное прогнозирование с кодовым возбуждением), и таких кодеках, как 3GPP2 (Third Generation Partnership 2) EVRC (Enhanced Variable Rate Codec).
Желательно, чтобы узкополосный кодер A120 генерировал кодированный узкополосный сигнал возбуждения согласно тем же значениям параметров фильтра, которые будут доступны соответствующему узкополосному декодеру. Таким образом, результирующий кодированный узкополосный сигнал возбуждения уже может в некоторой степени учитывать неидеальности в этих значениях параметров, например ошибки квантования. Соответственно желательно настроить отбеливающий фильтр с использованием тех же значений коэффициентов, которые будут доступны в декодере. В базовом примере кодера A122, показанном на фиг.6, обратный квантователь 240 деквантует узкополосные параметры кодирования S40, преобразователь 250 LSF в коэффициенты LP-фильтра 250 отображает результирующие значения обратно на соответствующий набор коэффициентов НЧ-фильтра, и этот набор коэффициентов используется для настройки отбеливающего фильтра 260 для генерации остаточного сигнала, который квантуется квантователем 270.
Некоторые реализации узкополосного кодера A120 могут вычислять кодированный узкополосный сигнал возбуждения S50 путем идентификации одного из набора векторов кодовой книги, который лучше всех совпадает с остаточным сигналом. Однако этот узкополосный кодер A120 также можно реализовать для вычисления квантованного представления остаточного сигнала без фактической генерации остаточного сигнала. Например, узкополосный кодер A120 может использовать некоторое количество векторов кодовой книги для генерации соответствующих синтезированных сигналов (например, согласно текущему набору параметров фильтра) и выбирать вектор кодовой книги, связанный с генерированным сигналом, который лучше всех совпадает с исходным узкополосным сигналом S20 в перцептивно-взвешенной области.
На фиг.7 показана блок-схема реализации B112 узкополосного декодера B110. Обратный квантователь 310 деквантует узкополосные параметры фильтра S40 (в этом случае в набор LSF), и преобразователь 320 LSF в коэффициенты LP-фильтра преобразует LSF в набор коэффициентов фильтра (например, как описано выше со ссылкой на обратный квантователь 240 и преобразователь 250 узкополосного кодера A122). Обратный квантователь 340 деквантует узкополосный остаточный сигнал S40 для создания узкополосного сигнала возбуждения S80. На основании коэффициентов фильтра и узкополосного сигнала возбуждения S80 узкополосный синтезирующий фильтр 330 синтезирует узкополосный сигнал S90. Иными словами, узкополосный синтезирующий фильтр 330 формирует спектр узкополосного сигнала возбуждения S80 согласно деквантованным коэффициентам фильтра для создания узкополосного сигнала S90. Узкополосный декодер B112 также выдает узкополосный сигнал возбуждения S80 на кодер A200 полосы верхних частот, который использует его для описанного здесь вывода сигнала возбуждения S120 полосы верхних частот. В некоторых реализациях, описанных ниже, узкополосный декодер B110 может выдавать на декодер B200 полосы верхних частот дополнительную информацию, связанную с узкополосным сигналом, например наклон спектра, коэффициент усиления и интервал основного тона, и речевой режим.
Система узкополосного кодера A122 и узкополосного декодера B112 является основным примером речевого кодека на основе анализа через синтез. Кодирование на основе линейного прогнозирования с кодовым возбуждением (CELP) является одним популярным семейством методов кодирования на основе анализа через синтез, и реализации таких кодеров могут осуществлять кодирование на основе формы остаточного сигнала, в том числе операции выбора записей из фиксированной и адаптивной кодовых книг, операции минимизации ошибок и/или операции перцептивного взвешивания. Другие реализации кодирования на основе анализа через синтез включают в себя кодирование на основе линейного прогнозирования со смешанным возбуждением (MELP), алгебраического CELP (ACELP), релаксационного CELP (RCELP), регулярного импульсного возбуждения (RPE), многоимпульсного CELP (MPE) и линейного прогнозирования с возбуждением векторной суммой (VSELP). Родственные способы кодирования включают в себя кодирование на основе многополосного возбуждения (MBE) и интерполяции формы сигнала-прототипа (PWI). Примеры стандартных речевых кодеков на основе анализа через синтез включают в себя полноскоростной кодек ETSI (European Telecommunications Standards Institute)-GSM (GSM 06.10), который использует линейное прогнозирование с возбуждением остаточным сигналом (RELP); усовершенствованный полноскоростной кодек GSM (ETSI-GSM 06.60); стандартный кодер со скоростью 11,8 кбит/с согласно ITU (International Telecommunication Union) G.729 Приложение E; кодеки IS (Interim Standard)-641 для IS-136 (схема множественного доступа с кодовым разделением); адаптивные многоскоростные кодеки GSM (GSM-AMR); и кодек 4GV™ (Fourth-Generation Vocoder™) (QUALCOMM Incorporated, Сан-Диего, Калифорния). Узкополосный кодер A120 и соответствующий декодер B110 можно реализовать согласно любой из этих технологий или любой другой технологии речевого кодирования (известной или созданной в будущем), которая представляет речевой сигнал в виде (A) набора параметров, которые описывают фильтр, и (B) сигнала возбуждения, используемого для возбуждения описанного фильтра для воспроизведения речевого сигнала.
Даже после того как отбеливающий фильтр удалит грубую спектральную огибающую из узкополосного сигнала S20, может оставаться заметная доля тонкой гармонической структуры, особенно для вокализованной речи. На фиг.8a показан график спектра одного примера остаточного сигнала, который может быть создан отбеливающим фильтром, для вокализованного сигнала, например гласного звука. Периодическая структура, наблюдаемая в этом примере, относится к основному тону, и другие вокализованные звуки, произносимые тем же диктором, могут иметь разные формантные структуры, но аналогичные структуры основного тона. На фиг.8b показан график зависимости амплитуды от времени в одном примере такого остаточного сигнала, где показана последовательность импульсов основного тона во времени.
Эффективность кодирования и/или качество речи можно повысить с использованием одного или нескольких значений параметра для кодирования характеристик структуры основного тона. Одной важной характеристикой структуры основного тона является частота первой гармоники (также именуемая основной частотой), которая обычно находится в диапазоне от 60 до 400 Гц. Эта характеристика обычно кодируется как величина, обратная основной частоте, также именуемая интервалом основного тона. Интервал основного тона указывает количество выборок в одном периоде основного тона и может кодироваться как один или несколько индексов кодовой книги. Для речевых сигналов дикторов-мужчин характерны более длительные интервалы основного тона, чем речевые сигналы дикторов-женщин.
Другой характеристикой сигнала, связанной со структурой основного тона, является периодичность, которая указывает интенсивность гармонической структуры или, иными словами, степень гармоничности или негармоничности сигнала. Двумя типичными признаками периодичности являются прохождения через нуль и нормированные автокорреляционные функции (NACF). О периодичности также может свидетельствовать коэффициент усиления основного тона, который обычно кодируется как коэффициент усиления кодовой книги (например, квантованный коэффициент усиления адаптивной кодовой книги).
Узкополосный кодер A120 может включать в себя один или несколько модулей для кодирования долговременной гармонической структуры узкополосного сигнала S20. Согласно фиг.9 одна типичная структура CELP, которую можно использовать, включает в себя модуль анализа LPC с разомкнутым циклом, который кодирует краткосрочные характеристики или грубую спектральную огибающую, после которого следует каскад анализа долгосрочного прогнозирования с замкнутым циклом, который кодирует тонкую структуру основного тона или гармоник. Краткосрочные характеристики кодируются как коэффициенты фильтра, а долгосрочные характеристики кодируются как значения параметров, например интервал основного тона и коэффициент усиления основного тона. Например, узкополосный кодер A120 может выводить кодированный узкополосный сигнал возбуждения S50 в форме, которая включает в себя один или несколько индексов кодовой книги (например, индекс фиксированной кодовой книги и индекс адаптивной кодовой книги) и соответствующие значения коэффициента усиления. Вычисление этого квантованного представления узкополосного остаточного сигнала (например, квантователем 270) может включать в себя выбор таких индексов и вычисление таких значений. Кодирование структуры основного тона также может включать в себя интерполяцию формы сигнала-прототипа основного тона, причем эта операция может включать в себя вычисление разницы между последовательными импульсами основного тона. Моделирование долговременной структуры можно блокировать для кадров, соответствующих невокализованной речи, которая обычно шумоподобна и неструктурирована.
Реализация узкополосного декодера B110 согласно структуре, показанной на фиг.9, может выдавать узкополосный сигнал возбуждения S80 на декодер B200 полосы верхних частот после восстановления долговременной структуры (основного тона или гармонической структуры). Например, такой декодер может выводить узкополосный сигнал возбуждения S80 в качестве деквантованной версии кодированного узкополосного сигнала возбуждения S50. Конечно, можно также реализовать узкополосный декодер B110, чтобы декодер B200 полосы верхних частот осуществлял деквантование кодированного узкополосного сигнала возбуждения S50 для получения узкополосного сигнала возбуждения S80.
В реализации широкополосного речевого кодера A100 согласно схеме, показанной на фиг.9, кодер A200 полосы верхних частот может принимать узкополосный сигнал возбуждения, создаваемый краткосрочным анализом или отбеливающим фильтром. Иными словами, узкополосный кодер A120 может выдавать узкополосный сигнал возбуждения на кодер A200 полосы верхних частот до кодирования долговременной структуры. Однако желательно, чтобы кодер A200 полосы верхних частот принимал из узкополосного канала ту же информацию кодирования, которую будет принимать декодер B200 полосы верхних частот, так что параметры кодирования, сформированные кодером A200 полосы верхних частот, уже могут в некоторой степени учитывать неидеальности в этой информации. Таким образом, может быть предпочтительно, чтобы кодер A200 полосы верхних частот реконструировал узкополосный сигнал возбуждения S80 из того же параметризованного и/или квантованного кодированного узкополосного сигнала возбуждения S50, который выводится широкополосным речевым кодером A100. Одно потенциальное преимущество такого подхода состоит в более точном вычислении коэффициентов усиления S60b полосы верхних частот, описанном ниже.
Помимо параметров, характеризующих кратковременную и/или долговременную структуру узкополосного сигнала S20, узкополосный кодер A120 может создавать значения параметров, которые относятся к другим характеристикам узкополосного сигнала S20. Эти значения, которые могут быть подходящим образом квантованы для вывода широкополосным речевым кодером A100, можно включать в узкополосные параметры фильтра S40 или выводить отдельно. Кодер A200 полосы верхних частот также может вычислять параметры кодирования S60 полосы верхних частот согласно одному или нескольким из этих дополнительных параметров (например, после деквантования). В широкополосном речевом декодере B100 декодер B200 полосы верхних частот может принимать значения параметра через узкополосный декодер B110 (например, после деквантования). Альтернативно декодер B200 полосы верхних частот может принимать (и, возможно, деквантовать) значения параметра напрямую.
В одном примере дополнительных узкополосных параметров кодирования узкополосный кодер A120 создает значения наклона спектра и параметров речевого режима для каждого кадра. Наклон спектра связан с формой спектральной огибающей по полосе пропускания и обычно представлен квантованным первым коэффициентом отражения. Для большинства вокализованных звуков спектральная энергия снижается с увеличением частоты, так что первый коэффициент отражения отрицателен и может достигать -1. Большинство невокализованных звуков имеет спектр, который является либо равномерным, в результате чего первый коэффициент отражения близок к нулю либо имеет больше энергии на высоких частотах, в результате чего первый коэффициент отражения положителен и может достигать +1.
Речевой режим (также именуемый режимом вокализации) указывает, представляет ли текущий кадр вокализованную или невокализованную речь. Этот параметр может иметь двоичное значение, основанное на одной или нескольких мерах периодичности (например, прохождениях нуля, NACF, коэффициенте усиления основного тона) и/или речевой активности для кадра, например соотношении между такой мерой и пороговым значением. В других реализациях параметр речевого режима имеет один или несколько других состояний для указания таких режимов, как молчание или фоновый шум, или переход между молчанием и вокализованной речью.
Кодер A200 полосы верхних частот кодирует сигнал S30 полосы верхних частот согласно модели источник-фильтр, причем возбуждение для этого фильтра базируется на кодированном узкополосном сигнале возбуждения. На фиг.10 показана блок-схема реализации A202 кодера A200 полосы верхних частот, который формирует поток параметров кодирования S60 полосы верхних частот, включающих в себя параметры фильтра S60a полосы верхних частот и коэффициенты усиления S60b полосы верхних частот. Генератор возбуждения A300 полосы верхних частот выводит сигнал возбуждения S120 полосы верхних частот из кодированного узкополосного сигнала возбуждения S50. Модуль анализа A210 формирует набор значений параметра, характеризующих спектральную огибающую сигнала S30 полосы верхних частот. В этом конкретном примере модуль анализа A210 осуществляет анализ LPC для формирования набора коэффициентов НЧ-фильтра для каждого кадра сигнала S30 полосы верхних частот. Преобразователь 410 коэффициентов фильтра линейного прогнозирования в LSF преобразует набор коэффициентов НЧ-фильтра в соответствующий набор LSF. Как отмечено выше со ссылкой на модуль анализа 210 и преобразователь 220, модуль анализа A210 и/или преобразователь 410 могут использовать другие наборы коэффициентов (например, коэффициентов косинусного преобразования Фурье) и/или представлений коэффициентов (например, ISP).
Квантователь 420 квантует набор LSF полосы верхних частот (или другого представления коэффициентов, например ISP), и кодер A202 полосы верхних частот выводит результат этого квантования в виде параметров фильтра S60a полосы верхних частот. Такой квантователь обычно включает в себя векторный квантователь, который кодирует входной вектор как индекс для соответствующей векторной записи в таблице или кодовой книге.
Кодер A202 полосы верхних частот также включает в себя синтезирующий фильтр A220, формирующий синтезированный сигнал S130 полосы верхних частот согласно сигналу возбуждения S120 полосы верхних частот и кодированной спектральной огибающей (например, набору коэффициентов НЧ-фильтра), созданной модулем анализа A210. Синтезирующий фильтр A220 обычно реализован в виде IIR-фильтра, хотя можно использовать также реализации FIR. В конкретном примере, синтезирующий фильтр A220 реализован в виде линейного авторегрессивного фильтра шестого порядка.
Вычислитель A230 коэффициента усиления полосы верхних частот вычисляет одну или несколько разностей между уровнями исходного сигнала S30 полосы верхних частот и синтезированного сигнала S130 полосы верхних частот для определения огибающей усиления для кадра. Квантователь 430, который может быть реализован как векторный квантователь, который кодирует входной вектор как индекс для соответствующей векторной записи в таблице или кодовой книге, квантует значение или значения, определяющее/ие огибающую усиления, и кодер A202 полосы верхних частот выводит результат этого квантования как коэффициенты усиления S60b полосы верхних частот.
В реализации, показанной на фиг.10, синтезирующий фильтр A220 принимает коэффициенты фильтра от модуля анализа A210. Альтернативная реализация кодера A202 полосы верхних частот включает в себя обратный квантователь и обратный преобразователь, способные декодировать коэффициенты фильтра из параметров фильтра S60a полосы верхних частот, и в этом случае синтезирующий фильтр A220 должен вместо этого принимать декодированные коэффициенты фильтра. Такая альтернативная конфигурация может поддерживать более точное вычисление огибающей усиления вычислителем A230 коэффициента усиления полосы верхних частот.
В одном конкретном примере модуль анализа A210 и вычислитель A230 коэффициента усиления полосы верхних частот выводят набор из шести LSF и набор пяти значений коэффициента усиления на кадр соответственно, что позволяет добиться широкополосного расширения узкополосного сигнала S20 с помощью только одиннадцати дополнительных значений на кадр. Ухо менее чувствительно к частотным искажениям на высоких частотах, благодаря чему кодирование полосы верхних частот при низком порядке LPC может создавать сигнал, имеющий воспринимаемое качество, совместимое с узкополосным кодированием на более высоком порядке LPC. Типичная реализация кодера A200 полосы верхних частот может выводить от 8 до 12 битов на кадр для высококачественной реконструкции спектральной огибающей и еще от 8 до 12 битов на кадр для высококачественной реконструкции временной огибающей. В другом конкретном примере модуль анализа A210 выводит набор из восьми LSF на кадр.
Некоторые реализации кодера A200 полосы верхних частот способны создавать сигнал возбуждения S120 полосы верхних частот, генерируя случайный шумовой сигнал, имеющий частотные составляющие полосы верхних частот и модулируя по амплитуде шумовой сигнал согласно огибающей во временном измерении узкополосного сигнала S20, узкополосного сигнала возбуждения S80 или сигнала S30 полосы верхних частот. Однако хотя такой шумовой способ может давать адекватные результаты для невокализованных звуков, его применение может оказаться нежелательным для вокализованных звуков, остаточные сигналы которых обычно являются гармоническими и, следовательно, имеют некоторую периодическую структуру.
Генератор возбуждения A300 полосы верхних частот генерирует сигнал возбуждения S120 полосы верхних частот, расширяя спектр узкополосного сигнала возбуждения S80 на частотный диапазон полосы верхних частот. На фиг.11 показана блок-схема реализации A302 генератора возбуждения A300 полосы верхних частот. Обратный квантователь 450 деквантует кодированный узкополосный сигнал возбуждения S50 для создания узкополосного сигнала возбуждения S80. Расширитель спектра A400 создает гармонически расширенный сигнал S160 на основании узкополосного сигнала возбуждения S80. Объединитель 470 объединяет случайный шумовой сигнал, генерируемый генератором 480 шума, и огибающую во временном измерении, вычисляемую вычислителем 460 огибающей для создания модулированного шумового сигнала S170. Объединитель 490 смешивает гармонически расширенный сигнал S60 и модулированный шумовой сигнал S170 для создания сигнала возбуждения S120 полосы верхних частот.
В одном примере расширитель спектра A400 осуществляет операцию спектрального наложения (также именуемую зеркальным отражением) на узкополосном сигнале возбуждения S80 для создания гармонически расширенного сигнала S160. Спектральное наложение может осуществляться путем заполнения нулями сигнала возбуждения S80 с последующим применением высокочастотного фильтра для сохранения помехи дискретизации. В другом примере расширитель спектра A400 создает гармонически расширенный сигнал S160 путем переноса спектра узкополосного сигнала возбуждения S80 в верхний диапазон (например, путем повышения частоты дискретизации с последующим умножением на косинусоидальный сигнал постоянной частоты).
Способы спектрального наложения и переноса могут создавать спектрально расширенные сигналы, гармоническая структура которых имеет нарушение непрерывности с исходной гармонической структурой узкополосного сигнала возбуждения S80 по фазе и/или частоте. Например, такие способы могут создавать сигналы, пики которых в общем случае не соответствуют кратным значениям основной частоты, что может вызывать искажения с металлическим призвуком в реконструированном речевом сигнале. Этим способам также свойственно создавать высокочастотные гармоники, имеющие неестественно сильные тональные характеристики. Кроме того, поскольку сигнал PSTN может дискретизироваться с частотой 8 кГц, но ограничен по полосе частотой 3400 Гц, верхний спектр узкополосного сигнала возбуждения S80 может содержать мало энергии или вовсе не содержать энергии, в результате чего расширенный сигнал, генерируемый согласно операции спектрального наложения или спектрального переноса, может иметь спектральный провал на частотах выше 3400 Гц.
Другие способы генерации гармонически расширенного сигнала S160 включают в себя идентификацию одной или более основных частот узкополосного сигнала возбуждения S80 и генерацию гармонических тонов согласно этой информации. Например, гармоническая структура сигнала возбуждения может характеризоваться основной частотой совместно с информацией амплитуды и фазы. Другая реализация генератора возбуждения A300 полосы верхних частот генерирует гармонически расширенный сигнал S160 на основании основной частоты и амплитуды (указанной, например, интервалом основного тона и коэффициентом усиления основного тона). Однако, если гармонически расширенный сигнал не когерентен по фазе с узкополосным сигналом возбуждения S80, качество результирующей декодированной речи может быть неприемлемым.
Нелинейную функцию можно использовать для создания сигнала возбуждения полосы верхних частот, который когерентен по фазе с узкополосным возбуждением и сохраняет гармоническую структуру без нарушений непрерывности. Нелинейная функция может также обеспечивать повышенный уровень шума между высокочастотными гармониками, что обеспечивает более естественное звучание, чем тональные высокочастотные гармоники, создаваемые, например, способами спектрального наложения и спектрального переноса. Типичные нелинейные функции без запоминания, которые могут применяться в различных реализациях расширителя спектра A400, включают в себя функцию абсолютного значения (также именуемую двухполупериодным выпрямлением), однополупериодное выпрямление, возведение в квадрат, возведение в куб и ограничение. Другие реализации расширителя спектра A400 могут применять нелинейную функцию с запоминанием.
На фиг.12 показана блок-схема реализации A402 расширителя спектра A400, который применяет нелинейную функцию для расширения спектра узкополосного сигнала возбуждения S80. Блок 510 повышения частоты дискретизации преобразует с повышением частоты дискретизации узкополосный сигнал возбуждения S80. Может оказаться желательно преобразовывать сигнал с достаточным повышением частоты дискретизации для минимизации помехи дискретизации после применения нелинейной функции. В одном конкретном примере блок повышения частоты дискретизации 510 преобразует с повышением частоты дискретизации сигнал с коэффициентом восемь. Блок повышения частоты дискретизации 510 может осуществлять операцию повышения частоты дискретизации путем вставки нулей в входной сигнал и низкочастотной фильтрации результата. Вычислитель 520 нелинейной функции применяет нелинейную функцию к сигналу, преобразованному с повышением частоты дискретизации. Одно потенциальное преимущество функции абсолютного значения над другими нелинейными функциями для расширения спектра, например квадратичной функцией, состоит в отсутствии необходимости в нормализации энергии. В некоторых реализациях функцию абсолютного значения можно эффективно применять, отбрасывая или очищая знаковый бит каждой выборки. Вычислитель 520 нелинейной функции также может осуществлять амплитудную трансформацию преобразованного с повышением частоты дискретизации или спектрально расширенного сигнала.
Блок 530 понижения частоты дискретизации преобразует с понижением частоты дискретизации спектрально расширенный результат применения нелинейной функции. Может оказаться желательно, чтобы блок 530 понижения частоты дискретизации осуществлял операцию полосовой фильтрации для выбора нужной полосы частот спектрально расширенного сигнала до снижения частоты дискретизации (например, для снижения или устранения наложения спектров или искажений желательным изображением). Также может быть желательно, чтобы блок 530 понижения частоты дискретизации снижал частоту дискретизации в более чем в один этап.
На фиг.12a показана диаграмма спектров сигнала в различных точках в одном примере операции расширения спектра, где масштаб частоты одинаков для различных графиков. График (a) демонстрирует спектр одного примера узкополосного сигнала возбуждения S80. График (b) демонстрирует спектр после повышения частоты дискретизации сигнала S80 с коэффициентом восемь. График (c) демонстрирует пример расширенного спектра после применения нелинейной функции. График (d) демонстрирует спектр после низкочастотной фильтрации. В этом примере полоса пропускания доходит до верхней частотной границы сигнала S30 полосы верхних частот (например, 7 кГц или 8 кГц).
График (e) демонстрирует спектр после первого этапа преобразования с понижением частоты дискретизации, на котором частота дискретизации снижается с коэффициентом четыре для получения широкополосного сигнала. График (f) демонстрирует спектр после операции высокочастотной фильтрации для выбора части полосы верхних частот расширенного сигнала, и график (g) демонстрирует спектр после второго этапа преобразования с понижением частоты дискретизации, на котором частота дискретизации снижается с коэффициентом два. В одном конкретном примере блок 530 понижения частоты дискретизации осуществляет высокочастотную фильтрацию и второй этап преобразования с понижением частоты дискретизации, пропуская широкополосный сигнал через высокочастотный фильтр 130 и блок 140 понижения частоты дискретизации гребенки фильтров A112 (или другие структуры или процедуры, имеющие такую же характеристику) для создания спектрально расширенного сигнала, имеющего частотный диапазон и частоту дискретизации сигнала S30 полосы верхних частот.
Из графика (g) следует, что преобразование с понижением частоты дискретизации высокочастотного сигнала, показанного на графике (f), приводит к обращению его спектра. В этом примере блок 530 понижения частоты дискретизации также осуществляет операцию обращения спектра над сигналом. График (h) демонстрирует результат применения операции обращения спектра, которая может осуществляться посредством умножения сигнала на функцию e
jnπ или последовательность (-1)n, которая попеременно принимает значения +1 и -1. Такая операция эквивалентна сдвигу цифрового спектра сигнала в частотном измерении на расстояние π. Заметим, что такой же результат можно получить, применяя операции преобразования с понижением частоты дискретизации и обращения спектра в другом порядке. Операции повышения частоты дискретизации и/или преобразования с понижением частоты дискретизации также могут включать в себя повторную дискретизацию для получения спектрально расширенного сигнала, имеющего частоту дискретизации сигнала S30 полосы верхних частот (например, 7 кГц).
Как отмечено вше, гребенки фильтров A110 и B120 можно реализовать так, что один или оба из узкополосного сигнала и сигнала полосы верхних частот S20, S30, имеющих спектрально обращенную форму на выходе гребенки фильтров A110, будет кодироваться и декодироваться в спектрально обращенной форме, и снова подвергаться обращению спектра на гребенке фильтров B120 до вывода в широкополосный речевой сигнал S110. В таком случае операция обращения спектра, показанная на фиг.12a, будет не нужна, что было бы желательно для того, чтобы сигнал возбуждения S120 полосы верхних частот также имел спектрально обращенную форму.
Различные задачи повышения частоты дискретизации и преобразования с понижением частоты дискретизации операции расширения спектра, осуществляемой расширителем спектра A402, можно конфигурировать по-разному. Например, на фиг.12b показана диаграмма спектров сигнала в различных точках в другом примере операции расширения спектра, где масштаб частоты одинаков для различных графиков. График (a) демонстрирует спектр одного примера узкополосного сигнала возбуждения S80. График (b) демонстрирует спектр после повышения частоты дискретизации сигнала S80 с коэффициентом два. График (c) демонстрирует пример расширенного спектра после применения нелинейной функции. В этом случае помеха дискретизации, которая может возникать на более высоких частотах, приемлема.
График (d) демонстрирует спектр после операции обращения спектра. График (e) демонстрирует спектр после одного этапа преобразования с понижением частоты дискретизации, на котором частота дискретизации снижается с коэффициентом два для получения нужного спектрально расширенного сигнала. В этом примере сигнал находится в спектрально обращенной форме и его можно использовать в реализации кодера A200 полосы верхних частот, который обрабатывал сигнал S30 полосы верхних частот в такой форме.
Спектрально расширенный сигнал, созданный вычислителем 520 нелинейной функции, с большой вероятностью имеет ярко выраженный спад амплитуды с ростом частоты. Расширитель спектра A402 включает в себя сглаживатель спектра 540, осуществляющий операцию отбеливания сигнала, преобразованного с понижением частоты дискретизации. Сглаживатель спектра 540 может осуществлять операцию фиксированного отбеливания или операцию адаптивного отбеливания. В конкретном примере адаптивного отбеливания сглаживатель спектра 540 включает в себя модуль анализа LPC для вычисления набора из четырех коэффициентов фильтра из сигнала, преобразованного с понижением частоты дискретизации, и анализирующий фильтр четвертого порядка для отбеливания сигнала согласно этим коэффициентам. Другие реализации расширителя спектра A400 включают в себя конфигурации, в которых сглаживатель спектра 540 обрабатывает спектрально расширенный сигнал до блока 530 понижения частоты дискретизации.
Генератор возбуждения A300 полосы верхних частот может быть реализован для вывода гармонически расширенного сигнала S160 как сигнала возбуждения S120 полосы верхних частот. Однако в ряде случаев использование только гармонически расширенного сигнала в качестве возбуждения полосы верхних частот может приводить к слышимым искажениям. Гармоническая структура речи в общем случае менее ярко выражена в верхнем диапазоне, чем в нижнем диапазоне, и использование слишком гармонической структуры в сигнале возбуждения полосы верхних частот может приводить к взрывному звуку. Это искажение может быть особенно заметным в речевых сигналах дикторов-женщин.
Варианты осуществления включают в себя реализации генератора возбуждения A300 полосы верхних частот, которые смешивают гармонически расширенный сигнал S160 с шумовым сигналом. Согласно фиг.11 генератор возбуждения A302 полосы верхних частот включает в себя генератор шума 480, который создает случайный шумовой сигнал. В одном примере генератор шума 480 создает белый псевдослучайный шумовой сигнал с единичной дисперсией, хотя в других реализациях шумовой сигнал не обязательно белый и может иметь плотность мощности, изменяющуюся с частотой. Может оказаться желательно, чтобы генератор шума 480 выводил шумовой сигнал как детерминированную функцию, чтобы его состояние можно было дублировать на декодере. Например, генератор шума 480 может выводить шумовой сигнал как детерминированную функцию информации, закодированной ранее в том же кадре, например узкополосные параметры фильтра S40 и/или кодированный узкополосный сигнал возбуждения S50.
До смешивания с гармонически расширенным сигналом S160 случайный шумовой сигнал, созданный генератором шума 480, может модулироваться по амплитуде, чтобы он имел огибающую во временном измерении, которая аппроксимирует распределение энергии по времени узкополосного сигнала S20, сигнала S30 полосы верхних частот, узкополосного сигнала возбуждения S80 или гармонически расширенного сигнала S160. Согласно фиг.11 генератор возбуждения A302 полосы верхних частот включает в себя объединитель 470, модулирующий по амплитуде шумовой сигнал, создаваемый генератором шума 480, согласно огибающей во временном измерении, вычисленной вычислителем огибающей 460. Например, объединитель 470 можно реализовать в виде умножителя для масштабирования выходного сигнала генератора шума 480 согласно огибающей во временном измерении, вычисленной вычислителем огибающей 460, для создания модулированного шумового сигнала S170.
В реализации A304 генератора возбуждения A302 полосы верхних частот, показанной в блок-схеме на фиг.13, вычислитель огибающей 460 вычисляет огибающую гармонически расширенного сигнала S160. В реализации A306 генератора возбуждения A302 полосы верхних частот, показанной в блок-схеме на фиг.14, вычислитель огибающей 460 вычисляет огибающую узкополосного сигнала возбуждения S80. Другие реализации генератора возбуждения A302 полосы верхних частот, так или иначе, могут добавлять шум к гармонически расширенному сигналу S160 согласно положениям узкополосных импульсов основного тона во времени.
Вычислитель огибающей 460 может вычислять огибающую в виде задачи, включающей в себя ряд подзадач. На фиг.15 показана логическая блок-схема примера T100 такой задачи. Подзадача T110 вычисляет квадрат каждой выборки кадра сигнала, огибающую которой нужно моделировать (например, узкополосного сигнала возбуждения S80 или гармонически расширенного сигнала S160), для создания последовательности квадратов значений. Подзадача T120 реализует операцию сглаживания на последовательности квадратов значений. В одном примере подзадача T120 применяет низкочастотный IIR-фильтр первого порядка к последовательности согласно выражению
где x - входной сигнал фильтра, y - выходной сигнал фильтра, n - индекс временной области, и a - коэффициент сглаживания, имеющий значение между 0,5 и 1. Значение коэффициента сглаживания a может быть фиксированным или, в альтернативной реализации, адаптивным согласно указанию шума во входном сигнале, в результате чего a оказывается ближе к 1 в отсутствие шума и ближе к 0,5 при наличии шума. Подзадача T130 применяет функцию квадратного корня к каждой выборке сглаженной последовательности для создания огибающей временной области.
Такая реализация вычислителя огибающей 460 может осуществлять различные подзадачи задачи T100 последовательно и/или параллельно. В других реализациях задачи T100 подзадаче T110 может предшествовать операция полосовой фильтрации для выбора нужного частотного участка сигнала, огибающую которого нужно моделировать, например диапазон 3-4 кГц.
Объединитель 490 смешивает гармонически расширенный сигнал S160 и модулированный шумовой сигнал S170 для создания сигнала возбуждения S120 полосы верхних частот. Реализации объединителя 490 могут вычислять сигнал возбуждения S120 полосы верхних частот как сумму гармонически расширенного сигнала S160 и модулированного шумового сигнала S170. Такая реализация объединителя 490 может вычислять сигнал возбуждения S120 полосы верхних частот как взвешенную сумму с применением весового коэффициента к гармонически расширенному сигналу S160 и/или к модулированному шумовому сигналу S170 до суммирования. Каждый такой весовой коэффициент можно вычислять согласно одному или нескольким критериям, и он может иметь фиксированное значение или, альтернативно, адаптивное значение, вычисляемое для каждого кадра или подкадра.
На фиг.16 показана блок-схема реализации 492 объединителя 490, который вычисляет сигнал возбуждения S120 полосы верхних частот в виде взвешенной суммы гармонически расширенного сигнала S160 и модулированного шумового сигнала S170. Объединитель 492 взвешивает гармонически расширенный сигнал S160 согласно весовому коэффициенту гармонического сигнала S180, взвешивает модулированный шумовой сигнал S170 согласно весовому коэффициенту шума S190 и выводит сигнал возбуждения S120 полосы верхних частот как сумму взвешенных сигналов. В этом примере объединитель 492 включает в себя вычислитель 550 весовых коэффициентов для вычисления весового коэффициента гармонического сигнала S180 и весового коэффициента шума S190.
Вычислитель 550 весовых коэффициентов может вычислять весовые коэффициенты S180 и S190 согласно нужному отношению содержания гармоник к созданию шума в сигнале возбуждения S120 полосы верхних частот. Например, может оказаться желательно, чтобы объединитель 492 создавал сигнал возбуждения S120 полосы верхних частот, имеющий отношение энергии гармоник энергии шума, близкое к соответствующему отношению в сигнале S30 полосы верхних частот. В некоторых реализациях вычислителя 550 весовых коэффициентов весовые коэффициенты S180, S190 вычисляются согласно одному или нескольким параметрам, связанным с периодичностью узкополосного сигнала S20 или узкополосного остаточного сигнала, например коэффициенту усиления основного тона и/или речевому режиму. Такая реализация вычислителя 550 весовых коэффициентов может, например, присваивать весовому коэффициенту гармонического сигнала S180 значение, пропорциональное коэффициенту усиления основного тона, и/или присваивать весовому коэффициенту шума S190 для невокализованных речевых сигналов более высокое значение, чем для вокализованных речевых сигналов.
В других реализациях вычислитель 550 весовых коэффициентов вычисляет значения весового коэффициента гармонического сигнала S180 и/или весового коэффициента шума S190 согласно мере периодичности сигнала S30 полосы верхних частот. В одном таком примере вычислитель весовых коэффициентов 550 вычисляет весовой коэффициент гармонического сигнала S180 как максимальное значение коэффициента автокорреляции сигнала S30 полосы верхних частот для текущего кадра или подкадра, где автокорреляция определяется в диапазоне поиска, который включает в себя задержку в один интервал основного тона и не включает в себя задержку в нуль выборок. На фиг.17 показан пример такого диапазона поиска длиной в n выборок, центр которого соответствует задержке в один интервал основного тона и ширина которого не превышает один интервал основного тона.
На фиг.17 также показан пример другого подхода, согласно которому вычислитель 550 весовых коэффициентов вычисляет меру периодичности сигнала S30 полосы верхних частот в несколько этапов. На первом этапе текущий кадр делится на некоторое количество подкадров и задержка, при которой коэффициент автокорреляции достигает максимума, определяется отдельно для каждого подкадра. Как отмечено выше, автокорреляция определяется в диапазоне поиска, который включает в себя задержку в один интервал основного тона и не включает в себя задержку в нуль выборок.
На втором этапе задержанный кадр формируется посредством применения соответствующей определенной задержки для каждого подкадра, сочленения полученных подкадров для формирования кадра с оптимальной задержкой и вычисления весового коэффициента гармонического сигнала S180 в качестве коэффициента корреляции между исходным кадром и кадром с оптимальной задержкой. Альтернативно вычислитель 550 весовых коэффициентов вычисляет весовой коэффициент гармонического сигнала S180 как среднее максимальных коэффициентов автокорреляции, полученных на первом этапе для каждого подкадра. Реализации вычислителя 550 весовых коэффициентов также могут масштабировать коэффициент корреляции и/или объединять его с другим значением для вычисления значения весового коэффициента гармонического сигнала S180.
Может оказаться желательным, чтобы вычислитель 550 весовых коэффициентов вычислял меру периодичности сигнала S30 полосы верхних частот только в случаях, когда так или иначе указано наличие периодичности в кадре. Например, вычислитель 550 весовых коэффициентов может вычислять меру периодичности сигнала S30 полосы верхних частот согласно соотношению между другим указателем периодичности текущего кадра, например коэффициентом усиления основного тона, и пороговым значением. В одном примере вычислитель весовых коэффициентов 550 осуществляет операцию автокорреляции над сигналом S30 полосы верхних частот, только если коэффициент усиления основного тона кадра (например, коэффициент усиления адаптивной кодовой книги узкополосного остатка) имеет значение более 0,5 (альтернативно, по меньшей мере, 0,5). В другом примере вычислитель весовых коэффициентов 550 осуществляет операцию автокорреляции над сигналом S30 полосы верхних частот только для кадров, имеющих конкретные состояния речевого режима (например, только для вокализованных сигналов). В таких случаях вычислитель весовых коэффициентов 550 может присваивать весовой коэффициент, принятый по умолчанию, для кадров, имеющих другие состояния речевого режима и/или меньшие значения коэффициента усиления основного тона.
Варианты осуществления включают в себя дополнительные реализации вычислителя 550 весовых коэффициентов, которые вычисляют весовые коэффициенты согласно характеристикам, отличным от периодичности или дополнительным к ней. Например, такая реализация может присваивать коэффициенту усиления шума S190 для речевых сигналов, имеющих большой интервал основного тона, более высокое значение, чем для речевых сигналов, имеющих малый интервал основного тона. Другая такая реализация вычислителя 550 весовых коэффициентов определяет меру гармоничности широкополосного речевого сигнала S10 или сигнала S30 полосы верхних частот согласно мере энергии сигнала на частотах, кратных основной частоте, относительно энергии сигнала других частотных составляющих.
Некоторые реализации широкополосного речевого кодера A100 выводят индикацию периодичности или гармоничности (например, однобитовый флаг, указывающий, является ли кадр гармоническим или негармоническим) на основании коэффициента усиления основного тона и/или другой описанной здесь меры периодичности или гармоничности. В одном примере соответствующий широкополосный речевой декодер B100 использует эту индикацию для настройки такой операции, как, например, вычисление весового коэффициента. В другом примере такая индикация используется в кодере и/или декодере при вычислении значения параметра речевого режима.
Может оказаться желательным, чтобы генератор возбуждения A302 полосы верхних частот генерировал сигнал возбуждения S120 полосы верхних частот таким образом, чтобы конкретные значения весовых коэффициентов S180 и S190 не оказывали существенного влияния на энергию сигнала возбуждения. В таком случае вычислитель 550 весовых коэффициентов может вычислять значение весового коэффициента гармонического сигнала S180 или весового коэффициента шума S190 (или принимать такое значение из хранилища или другого элемента кодера A200 полосы верхних частот) и выводить значение другого весового коэффициента согласно, например, выражению
где W
harmonic обозначает весовой коэффициент гармонического сигнала S180 и W
noise обозначает весовой коэффициент шума S190. Альтернативно вычислитель 550 весовых коэффициентов может выбирать согласно значению меры периодичности текущего кадра или подкадра соответствующую одну из совокупности пар весовых коэффициентов S180, S190, где пары заранее вычислены в соответствии с постоянным отношением энергий, например, выражением (2). Для реализации вычислителя 550 весовых коэффициентов, для которого справедливо выражение (2), типичные значения весового коэффициента гармонического сигнала S180 составляют от около 0,7 до около 1,0, и типичные значения весового коэффициента шума S190 составляют от около 0,1 до около 0,7. Другие реализации вычислителя 550 весовых коэффициентов могут действовать согласно версии выражения (2), модифицированной согласно желательному основополагающему взвешиванию между гармонически расширенным сигналом S160 и модулированным шумовым сигналом S170.
Искажения могут возникать в синтезированном речевом сигнале, когда разреженная кодовая книга (записи которой в большинстве своем имеют нулевые значения) использовалась для вычисления квантованного представления остаточного сигнала. Разреженность кодовой книги имеет место в основном когда узкополосный сигнал кодируется с низкой битовой скоростью. Искажения, обусловленные разреженностью кодовой книги, обычно являются квазипериодическими во времени и возникают, в основном, на частотах свыше 3 кГц. Поскольку человеческое ухо имеет повышенное временное разрешение на более высоких частотах, эти искажения могут быть более заметны в верхнем диапазоне.
Варианты осуществления включают в себя реализации генератора возбуждения A300 полосы верхних частот, которые осуществляют фильтрацию для устранения разреженности. На фиг.18 показана блок-схема реализации A312 генератора возбуждения A302 полосы верхних частот, которая включает в себя фильтр 600 для устранения разреженности, фильтрующий деквантованный узкополосный сигнал возбуждения, создаваемый обратным квантователем 450. На фиг.19 показана блок-схема реализации A314 генератора возбуждения A302 полосы верхних частот, которая включает в себя фильтр 600 для устранения разреженности, фильтрующий спектрально расширенный сигнал, создаваемый расширителем спектра A400. На фиг.20 показана блок-схема реализации A316 генератора возбуждения A302 полосы верхних частот, которая включает в себя фильтр 600 для устранения разреженности, фильтрующий выходной сигнал объединителя 490 для создания сигнала возбуждения S120 полосы верхних частот. Конечно, возможны и, таким образом, явно раскрыты реализации генератора возбуждения A300 полосы верхних частот, объединяющие особенности любой из реализаций A304 и A306 с особенностями любой из реализаций A312, A314 и A316. Фильтр 600 для устранения разреженности также может быть предусмотрен в расширителе спектра A400, например, после любого из элементов 510, 520, 530 и 540 в расширителе спектра A402. Фильтр 600 для устранения разреженности также можно использовать с реализациями расширителя спектра A400, которые осуществляют спектральное наложение, спектральный перенос или гармоническое расширение.
Фильтр 600 для устранения разреженности может изменять фазу поступающего на него сигнала. Например, может оказаться желательно, чтобы фильтр 600 для устранения разреженности был настроен и размещен так, чтобы рандомизировать фазу сигнала возбуждения S120 полосы верхних частот, или иным образом обеспечивать ее более равномерное распределение по времени. Также может быть желательно, чтобы спектральная характеристика фильтра 600 для устранения разреженности была равномерной, чтобы амплитудно-частотная характеристика фильтрованного сигнала не претерпевала значительных изменений. В одном примере фильтр 600 для устранения разреженности реализован в виде всечастотного фильтра, передаточная функция которого выражается следующим образом:
Такой фильтр, в частности, позволяет так распределить энергию входного сигнала, чтобы она больше не концентрировалась лишь в нескольких выборках.
Искажения, обусловленные разреженностью кодовой книги, обычно более заметны для шумоподобных сигналов, где остаточный сигнал включает в себя меньше информации основного тона, а также для речи в фоновом шуме. Разреженность обычно вызывает меньшие искажения в случаях, когда возбуждение имеет долговременную структуру, и, действительно, изменение фазы может приводить к зашумлению вокализованных сигналов. Таким образом, может оказаться желательным настроить фильтр 600 для устранения разреженности на блокировку невокализованных сигналов и пропускание, по меньшей мере, некоторых вокализованных сигналов без изменения. Невокализованные сигналы характеризуются низким коэффициентом усиления основного тона (например, квантованным узкополосным коэффициентом усиления адаптивной кодовой книги) и близким к нулю или положительным наклоном спектра (например, квантованным первым коэффициентом отражения), что свидетельствует о том, что спектральная огибающая является равномерной или возрастает с увеличением частоты. Типичные реализации фильтра 600 для устранения разреженности способны фильтровать невокализованные звуки (например, указанные значением наклона спектра), фильтровать вокализованные звуки, когда коэффициент усиления основного тона ниже порогового значения (альтернативно, не превышает пороговое значение), и, в противном случае, пропускать сигнал без изменения.
Другие реализации фильтра 600 для устранения разреженности включают в себя два или более фильтра, которые имеют разные максимальные углы изменения фазы (например, до 180 градусов). В таком случае фильтр 600 для устранения разреженности может выбирать из этих компонентных фильтров согласно значению коэффициента усиления основного тона (например, квантованного коэффициента усиления адаптивной кодовой книги или LTP), чтобы больший максимальный угол изменения фазы использовался для кадров, имеющих более низкие значения коэффициента усиления основного тона. Реализация фильтра 600 для устранения разреженности также может включать в себя разные компонентные фильтры, которые способны изменять фазу в более или менее широком частотном спектре, чтобы фильтр, способный изменять фазу в более широком частотном диапазоне входного сигнала, использовался для кадров, имеющих более низкие значения коэффициента усиления основного тона.
Для точного воспроизведения кодированного речевого сигнала может оказаться желательно, чтобы отношение между уровнями части полосы верхних частот и узкополосной части синтезированного широкополосного речевого сигнала S100 было близким к соответствующему отношению в исходном широкополосном речевом сигнале S10. Помимо спектральной огибающей представленной параметрами кодирования S60a полосы верхних частот, кодер A200 полосы верхних частот может характеризовать сигнал S30 полосы верхних частот путем задания временной огибающей или огибающей усиления. Согласно фиг.10 кодер A202 полосы верхних частот включает в себя вычислитель A230 коэффициента усиления полосы верхних частот, который вычисляет один или несколько коэффициентов усиления согласно соотношению между сигналом S30 полосы верхних частот и синтезированным сигналом S130 полосы верхних частот, например разности или отношению между энергиями двух сигналов на протяжении кадра или некоторой его части. В других реализациях кодера A202 полосы верхних частот вычислитель А230 коэффициента усиления полосы верхних частот может иметь аналогичную конфигурацию, но предназначен для вычисления огибающей усиления согласно такому изменяющемуся во времени соотношению между сигналом S30 полосы верхних частот и узкополосным сигналом возбуждения S80 или сигналом возбуждения S120 полосы верхних частот.
Временные огибающие узкополосного сигнала возбуждения S80 и сигнала S30 полосы верхних частот с большой степенью вероятности сходны. Поэтому кодирование огибающей усиления, которое основано на соотношении между сигналом S30 полосы верхних частот и узкополосным сигналом возбуждения S80 (или сигналом, выведенным из него, например сигналом возбуждения S120 полосы верхних частот или синтезированным сигналом S130 полосы верхних частот), будет, в общем случае, более эффективным, чем кодирование огибающей усиления, основанное только на сигнале S30 полосы верхних частот. В типичной реализации кодер A202 полосы верхних частот выводит квантованный индекс размером от восьми до двенадцати битов, который указывает пять коэффициентов усиления для каждого кадра.
Вычислитель А230 коэффициента усиления полосы верхних частот может вычислять коэффициент усиления в виде задачи, включающей в себя одну или несколько последовательностей подзадач. На фиг.21 показана логическая блок-схема примера T200 такой задачи, которая вычисляет значение коэффициента усиления для соответствующего подкадра согласно относительной энергии сигнала S30 полосы верхних частот и синтезированного сигнала S130 полосы верхних частот. Задачи 220a и 220b вычисляют энергии соответствующих подкадров соответствующих сигналов. Например, задачи 220a и 220b могут вычислять энергию как сумму квадратов выборок соответствующего подкадра. Задача T230 вычисляет коэффициент усиления для подкадра как квадратный корень отношения этих энергий. В этом примере задача T230 вычисляет коэффициент усиления как квадратный корень отношения энергии сигнала S30 полосы верхних частот к энергии синтезированного сигнала S130 полосы верхних частот на протяжении подкадра.
Может оказаться желательно, чтобы вычислитель А230 коэффициента усиления полосы верхних частот вычислял энергии подкадров согласно функции окна. На фиг.22 показана логическая блок-схема такой реализации T210 задачи T200 вычисления коэффициента усиления. Задача T215a применяет функцию окна к сигналу S30 полосы верхних частот, и задача T215b применяет ту же функцию окна к синтезированному сигналу S130 полосы верхних частот. Реализации 222a и 222b задач 220a и 220b вычисляют энергии соответствующих окон, и задача T230 вычисляет коэффициент усиления для подкадра как квадратный корень отношения энергий.
Может оказаться желательно применять функцию окна, которая перекрывает соседние подкадры. Например, функция окна, которая создает коэффициенты усиления, которые можно применять в режиме сложения с перекрытием, может способствовать снижению или устранению нарушения непрерывности между подкадрами. В одном примере вычислитель А230 коэффициента усиления полосы верхних частот применяет трапецеидальную функцию окна, показанную на фиг.23a, в которой окно перекрывает каждый из двух соседних подкадров на одну миллисекунду. На фиг.23b показано применение этой функции окна к каждому из пяти подкадров 20-миллисекундного кадра. Другие реализации вычислителя А230 коэффициента усиления полосы верхних частот применяют функции окна, имеющие разные периоды перекрытия и/или разные формы окна (например, прямоугольную, хэммингову), которые могут быть симметричными или асимметричными. Реализация вычислителя А230 коэффициента усиления полосы верхних частот также может применять разные функции окна к разным подкадрам в кадре, и/или кадр может включать в себя подкадры разной длины.
В качестве примеров конкретных реализаций, без ограничения, представлены следующие значения. Для этих случаев предполагается 20-миллисекундный кадр, хотя можно использовать кадр любой другой длины. Для сигнала полосы верхних частот, дискретизированного с частотой 7 кГц, каждый кадр имеет 140 выборок. Если такой кадр разделить на пять подкадров равной длины, каждый подкадр будет иметь 28 выборок, и окно, показанное на фиг.23a, будет иметь ширину 42 выборки. Для сигнала полосы верхних частот, дискретизированного с частотой 8 кГц, каждый кадр имеет 160 выборок. Если такой кадр разделить на пять подкадров равной длины, каждый подкадр будет иметь 32 выборки, и окно, показанное на фиг.23a, будет иметь ширину 48 выборок. В других реализациях можно использовать подкадры любой ширины, и даже можно реализовать вычислитель А230 коэффициента усиления полосы верхних частот, создающий разные коэффициенты усиления для разных выборок кадра.
На фиг.24 показана блок-схема реализации B202 декодера B200 полосы верхних частот. Декодер B202 полосы верхних частот включает в себя генератор возбуждения B300 полосы верхних частот, создающий сигнал возбуждения S120 полосы верхних частот на основании узкополосного сигнала возбуждения S80. В зависимости от конкретных выборов конструкции системы генератор В300 возбуждения полосы верхних частот можно реализовать согласно любой из описанных здесь реализаций генератора А300 возбуждения полосы верхних частот. Обычно желательно реализовать генератор В300 возбуждения полосы верхних частот, имеющий такую же характеристику, как генератор возбуждения полосы верхних частот кодера полосы верхних частот конкретной системы кодирования. Однако, поскольку узкополосный декодер B110 обычно осуществляет деквантование кодированного узкополосного сигнала возбуждения S50, в большинстве случаев можно реализовать генератор В300 возбуждения полосы верхних частот, принимающий узкополосный сигнал возбуждения S80 от узкополосного декодера B110 и не обязательно включающий в себя обратный квантователь, способный деквантовать кодированный узкополосный сигнал возбуждения S50. Также можно реализовать узкополосный декодер B110, включающий в себя вариант фильтра 600 для устранения разреженности, фильтрующего деквантованный узкополосный сигнал возбуждения, прежде чем он поступит на узкополосный синтезирующий фильтр, например фильтр 330.
Обратный квантователь 560 деквантует параметры полосы верхних частот фильтра S60a (в этом примере, в набор LSF), и преобразователь 570 LSF в коэффициенты LP-фильтра преобразует LSF в набор коэффициентов фильтра (например, как описано выше со ссылкой на обратный квантователь 240 и преобразователь 250 узкополосного кодера A122). В других реализациях, как отмечено выше, можно использовать разные наборы коэффициентов (например, коэффициенты косинусного преобразования Фурье) и/или представления коэффициентов (например, ISP). Синтезирующий фильтр B200 полосы верхних частот создает синтезированный сигнал полосы верхних частот согласно сигналу возбуждения S120 полосы верхних частот и набору коэффициентов фильтра. Для системы, в которой кодер полосы верхних частот включает в себя синтезирующий фильтр (например, как в описанном выше примере кодера A202), может оказаться желательно реализовать синтезирующий фильтр B200 полосы верхних частот, имеющий такую же характеристику (например, такую же передаточную функцию), как у синтезирующего фильтра.
Декодер B202 полосы верхних частот также включает в себя обратный квантователь 580, деквантующий коэффициенты усиления S60b полосы верхних частот и элемент 590 регулировки усиления (например, умножитель или усилитель) применяющий деквантованные коэффициенты усиления к синтезированному сигналу полосы верхних частот для создания сигнала S100 полосы верхних частот. В случае когда огибающая усиления кадра задана более чем одним коэффициентом усиления, элемент 590 регулировки усиления может включать в себя логику, способную применять коэффициенты усиления к соответствующим подкадрам, возможно, согласно функции окна, которая может отличаться или не отличаться от функции окна, применяемой вычислителем коэффициента усиления (например, вычислителем коэффициента усиления А230 полосы верхних частот) соответствующего кодера полосы верхних частот. В других реализациях декодера B202 полосы верхних частот элемент 590 регулировки усиления имеет аналогичную конфигурацию, но применяет деквантованные коэффициенты усиления к узкополосному сигналу возбуждения S80 или к сигналу возбуждения S120 полосы верхних частот.
Как отмечено выше, может оказаться желательно получать одно и то же состояние в кодере полосы верхних частот и декодере полосы верхних частот (например, с использованием деквантованных значений при кодировании). Таким образом, в системе кодирования согласно такой реализации может оказаться желательным гарантировать одно и то же состояние для соответствующих генераторов шума в генераторах А300 и В300 возбуждения полосы верхних частот. Например, генераторы А300 и В300 возбуждения полосы верхних частот такой реализации могут иметь такую конфигурацию, что состояние генератора шума является детерминированной функцией информации, уже закодированной в том же кадре (например, узкополосных параметров фильтра S40 или их части и/или кодированного узкополосного сигнала возбуждения S50 или его части).
Один или несколько квантователей описанных здесь элементов (например, квантователь 230, 420 или 430) может осуществлять классифицированное векторное квантование. Например, такой квантователь может выбирать одну из набора кодовых книг на основании информации, уже закодированной в том же кадре в узкополосном канале и/или в канале полосы верхних частот. Такой метод обычно обеспечивает повышение эффективности кодирования за счет хранения дополнительных кодовых книг.
Как описано выше, например, со ссылкой на фиг.8 и 9, значительный объем периодической структуры может оставаться в остаточном сигнале после удаления грубой спектральной огибающей из узкополосного речевого сигнала S20. Например, остаточный сигнал может содержать последовательность приблизительно периодических импульсов или пиков во времени. Появление такой структуры, которая обычно связана с основным тоном, особенно вероятно в вокализованных речевых сигналах. Вычисление квантованного представления узкополосного остаточного сигнала может включать в себя кодирование этой структуры основного тона согласно модели долговременной периодичности, представленной, например, одной или несколькими кодовыми книгами.
Структура основного тона фактического остаточного сигнала может не точно совпадать с моделью периодичности. Например, остаточный сигнал может включать в себя небольшие флуктуации регулярности размещения импульсов основного тона, в результате чего расстояния между последовательными импульсами основного тона в кадре не точно равны и структура не является вполне регулярной. Эти нерегулярности снижают эффективность кодирования.
Некоторые реализации узкополосного кодера A120 осуществляют регуляризацию структуры основного тона за счет применения адаптивного преобразования временного масштаба к остаточному сигналу до или в ходе квантования или иного включения адаптивного преобразования временного масштаба в кодированный сигнал возбуждения. Например, такой кодер может выбирать или вычислять степень трансформации во времени (например, согласно одному или нескольким критериям перцептивного взвешивания и/или минимизации ошибки), благодаря чему результирующий сигнал возбуждения оптимально согласуется с моделью долговременной периодичности. Регуляризация структуры основного тона осуществляется поднабором кодеров CELP, называемых кодерами на основе релаксационного линейного прогнозирования с кодовым возбуждением (RCELP).
Кодер RCELP осуществляет преобразование временного масштаба в виде адаптивного временного сдвига. Этот временной сдвиг может представлять собой задержку в пределах от нескольких миллисекунд с отрицательным знаком до нескольких миллисекунд с положительным знаком и обычно изменяется плавно во избежание слышимых нарушений непрерывности. В некоторых реализациях такой кодер применяет регуляризацию в кусочно-линейном режиме, в котором каждый кадр или подкадр трансформируется с соответствующим фиксированным временным сдвигом. В других реализациях кодер применяет регуляризацию в виде непрерывной функции трансформации, в результате чего кадр или подкадр трансформируется согласно контуру основного тона (также именуемому траекторией основного тона). В ряде случаев (например, как описано в опубликованной патентной заявке США № 2004/0098255) кодер обеспечивает преобразование временного масштаба в кодированном сигнале возбуждения путем применения сдвига к перцептивно взвешенному входному сигналу, который используется для вычисления кодированного сигнала возбуждения.
Кодер вычисляет кодированный сигнал возбуждения, который регуляризуется и квантуется, и декодер деквантует кодированный сигнал возбуждения для получения сигнала возбуждения, который используется для синтеза декодированного речевого сигнала. Таким образом, декодированный выходной сигнал демонстрирует такую же изменяющуюся задержку, которая была внесена в кодированный сигнал возбуждения посредством регуляризации. Обычно на декодер не передается никакой информации, указывающей объемы регуляризации.
Регуляризация облегчает кодирование остаточного сигнала, что повышает эффективность кодирования из долгосрочного предсказателя и, таким образом, повышает общую эффективность кодирования, обычно без генерации искажений. Может оказаться желательно осуществлять регуляризацию только на вокализованных кадрах. Например, узкополосный кодер A124 может сдвигать только те кадры или подкадры, которые имеют долговременную структуру, например вокализованные сигналы. Также может оказаться желательным осуществлять регуляризацию только на подкадрах, которые включают в себя энергию импульсов основного тона. Различные реализации кодирования RCELP описаны в патентах США № 5704003 (Kleijn и др.) и 6879955 (Rao) и в опубликованной патентной заявке США № 2004/0098255 (Kovesi и др.). Существующие реализации кодеров RCELP включают в себя Enhanced Variable Rate Codec (EVRC), описанный в Telecommunications Industry Association (TIA) IS-127, и Third Generation Partnership Project 2 (3GPP2) Selectable Mode Vocoder (SMV).
К сожалению, регуляризация может создавать проблемы для широкополосного речевого кодера, в котором возбуждение полосы верхних частот выводится из кодированного узкополосного сигнала возбуждения (например, система, включающая в себя широкополосный речевой кодер A100 и широкополосный речевой декодер B100). В силу того что он выводится из сигнала с трансформированной временной шкалой, сигнал возбуждения полосы верхних частот обычно имеет иной временной профиль, чем исходный речевой сигнал полосы верхних частот. Иными словами, сигнал возбуждения полосы верхних частот не синхронизирован с исходным речевым сигналом полосы верхних частот.
Рассогласование по времени между трансформированным сигналом возбуждения полосы верхних частот и исходным речевым сигналом полосы верхних частот может вызвать ряд проблем. Например, трансформированный сигнал возбуждения полосы верхних частот уже не может обеспечивать подходящее исходное возбуждение для синтезирующего фильтра, который настроен согласно параметрам фильтра, извлеченным из исходного речевого сигнала полосы верхних частот. В результате синтезированный сигнал полосы верхних частот может содержать слышимые искажения, которые снижают воспринимаемое качество декодированного широкополосного речевого сигнала.
Рассогласование по времени также может приводить к снижению эффективности кодирования огибающей усиления. Как отмечено выше, с высокой степенью вероятности существует корреляция между временными огибающими узкополосного сигнала возбуждения S80 и сигналом S30 полосы верхних частот. Благодаря кодированию огибающей усиления сигнала полосы верхних частот согласно соотношению между этими двумя временными огибающими можно реализовать повышение эффективности кодирования по сравнению с кодированием непосредственно огибающей усиления. Однако благодаря регуляризации кодированного узкополосного сигнала возбуждения эту корреляцию можно ослабить. Рассогласование по времени между узкополосным сигналом возбуждения S80 и сигналом S30 полосы верхних частот может привести к появлению флуктуаций коэффициентов усиления S60b полосы верхних частот и падению эффективности кодирования.
Варианты осуществления включают в себя способы широкополосного речевого кодирования, которые предусматривают осуществление преобразования временного масштаба речевого сигнала полосы верхних частот согласно преобразованию временного масштаба, включенного в соответствующий кодированный узкополосный сигнал возбуждения. Потенциальные преимущества таких способов включают в себя повышение качества декодированного широкополосного речевого сигнала и/или повышение эффективности кодирования огибающей усиления полосы верхних частот.
На фиг.25 показана блок-схема реализации AD10 широкополосного речевого кодера A100. Кодер AD10 включает в себя реализацию A124 узкополосного кодера A120, который осуществляет регуляризацию в ходе вычисления кодированного узкополосного сигнала возбуждения S50. Например, узкополосный кодер A124 может быть настроен согласно одному или нескольким из рассмотренных выше реализаций RCELP.
Узкополосный кодер A124 выводит сигнал SD10 данных регуляризации, который указывает степень применяемого преобразования временного масштаба. Для различных случаев, когда узкополосный кодер A124 применяет фиксированный временной сдвиг к каждому кадру или подкадру, сигнал SD10 данных регуляризации может включать в себя ряд значений, указывающих величину каждого временного сдвига как целое или нецелое значение, выраженное в выборках, миллисекундах или другом приращении времени. В случае когда узкополосный кодер A124 иначе изменяет временную шкалу кадра или другой последовательности выборок (например, сжимая одну часть и растягивая другую часть), сигнал SD10 информации регуляризации может включать в себя соответствующее описание изменения, например набор параметров функции. В одном конкретном примере узкополосный кодер A124 делит кадр на три подкадра и вычисляет фиксированный временной сдвиг для каждого подкадра, поэтому сигнал SD10 данных регуляризации указывает три величины временного сдвига для каждого регуляризованного кадра кодированного узкополосного сигнала.
Широкополосный речевой кодер AD10 включает в себя линию задержки D120, обеспечивающую опережение или отставание частей речевого сигнала S30 полосы верхних частот согласно величинам задержки, указанным во входном сигнале, для создания речевого сигнала S30a полосы верхних частот с трансформированной временной шкалой. В примере, показанном на фиг.25, линия задержки D120 трансформирует временную шкалу речевого сигнала S30 полосы верхних частот согласно трансформации, указанной в сигнале SD10 данных регуляризации. Таким образом, преобразование временного масштаба той же величины, что и для кодированного узкополосного сигнала возбуждения S50, применяется к соответствующей части речевого сигнала S30 полосы верхних частот до анализа. Хотя в этом примере линия задержки D120 показана как элемент, отдельный от кодера A200 полосы верхних частот, в других реализациях линия задержки D120 обеспечена как часть кодера полосы верхних частот.
Другие реализации кодера A200 полосы верхних частот могут осуществлять спектральный анализ (например, анализ LPC) нетрансформированного речевого сигнала S30 полосы верхних частот и осуществлять преобразование временного масштаба речевого сигнала S30 полосы верхних частот до вычисления параметров усиления S60b полосы верхних частот. Такой кодер может включать в себя, например, реализацию линии задержки D120 для преобразования временного масштаба. В таких случаях, однако, параметры фильтра S60a полосы верхних частот, основанные на анализе нетрансформированного сигнала S30, могут описывать спектральную огибающую, рассогласованную по времени с сигналом возбуждения S120 полосы верхних частот.
Линия задержки D120 может быть выполнена согласно любой комбинации логических элементов и элементов хранения, пригодной для применения нужных операций преобразования временного масштаба к речевому сигналу S30 полосы верхних частот. Например, линия задержки D120 может считывать речевой сигнал S30 полосы верхних частот из буфера согласно нужным временным сдвигам. На фиг.26a показана схема такой реализации D122 линии задержки D120, которая включает в себя сдвиговый регистр SR1. Сдвиговый регистр SR1 - это буфер некоторой длины m, который принимает и сохраняет m самых последних выборок речевого сигнала S30 полосы верхних частот. Значение m равно, по меньшей мере, сумме максимальных поддерживаемых положительного ("опережение") и отрицательного ("отставание") временных сдвигов. Может оказаться удобным, чтобы значение m было равно длине кадра или подкадра сигнала S30 полосы верхних частот.
Линия задержки D122 выводит сигнал S30a полосы верхних частот с трансформированной временной шкалой из ячейки смещения OL сдвигового регистра SR1. Позиция ячейки смещения OL варьируется относительно опорной позиции (нулевого временного сдвига) согласно текущему временному сдвигу, указанному, например, сигналом SD10 данных регуляризации. Линия задержки D122 может поддерживать равные пределы опережения и отставания или, альтернативно, один предел больше другого, в результате чего в одном направлении может осуществлять больший сдвиг, чем в другом. На фиг.26a показан конкретный пример, где временной сдвиг в положительном направлении больше, чем в отрицательном. Линия задержки D122 может выводить одновременно одну или несколько выборок (в зависимости, например, от ширины выходной шины).
Временной сдвиг регуляризации, имеющий величину свыше нескольких миллисекунд, может приводить к слышимым искажениям в декодированном сигнале. Обычно величина временного сдвига регуляризации, осуществляемого узкополосным кодером A124, не превышает нескольких миллисекунд, поэтому временные сдвиги, указанные в сигнале данных регуляризации SD10, ограничены. Однако в таких случаях может оказаться желательным, чтобы линия задержки D122 налагала максимальное ограничение на временные сдвиги в положительном и/или отрицательном направлении (например, для обеспечения более жесткого ограничения, чем налагаемое узкополосным кодером).
На фиг.26b показана схема реализации D124 линии задержки D122, которая включает в себя окно сдвига SW. В этом примере позиция ячейки смещения OL ограничивается окном сдвига SW. Хотя на фиг.26b показан случай, когда буфер длина m больше ширины окна сдвига SW, линию задержки D124 также можно реализовать с шириной окна сдвига SW равной m.
В других реализациях линия задержки D120 записывает речевой сигнал S30 полосы верхних частот в буфер согласно нужным временным сдвигам. На фиг.27 показана схема такой реализации D130 линии задержки D120, которая включает в себя два сдвиговых регистра SR2 и SR3, принимающих и сохраняющих речевой сигнал S30 полосы верхних частот. Линия задержки D130 записывает кадр или подкадр из сдвигового регистра SR2 в сдвиговый регистр SR3 согласно временному сдвигу, указанному, например, в сигнале SD10 данных регуляризации. Сдвиговый регистр SR3 выполнен как буфер FIFO, выводящий сигнал S30 полосы верхних частот с трансформированной временной шкалой.
В конкретном примере, показанном на фиг.27, сдвиговый регистр SR2 включает в себя участок кадрового буфера FB1 и участок буфера задержки DB и сдвиговый регистр SR3 включает в себя участок кадрового буфера FB2, участок опережающего буфера AB и участок отстающего буфера RB. Длины опережающего буфера AB и отстающего буфера RB могут быть равны, или один может быть больше другого, в результате чего в одном направлении поддерживается больший сдвиг, чем в другом. Буфер задержки DB и участок отстающего буфера RB могут быть иметь одинаковую длину. Альтернативно буфер задержки DB можно сделать короче отстающего буфера RB для учета интервала времени, необходимого для переноса выборок из кадрового буфера FB1 в сдвиговый регистр SR3, который может включать в себя другие операции обработки, например трансформацию выборок до сохранения в сдвиговом регистре SR3.
В примере, приведенном на фиг.27, кадровый буфер FB1 может иметь длину, равную длине одного кадра сигнала S30 полосы верхних частот. В другом примере кадровый буфер FB1 может иметь длину, равную длине одного подкадра сигнала S30 полосы верхних частот. В таком случае линия задержки D130 может включать в себя логику для применения одинаковой (например, средней) задержки ко всем подкадрам сдвигаемого кадра. Линия задержки D130 также может включать в себя логику для усреднения значений из кадрового буфера FB1 со значениями, подлежащими перезаписи в отстающий буфер RB или опережающий буфер AB. В еще одном примере сдвиговый регистр SR3 может принимать значения сигнала S30 полосы верхних частот только через кадровый буфер FB1, и в таком случае линия задержки D130 может включать в себя логику для интерполяции в промежутках между последовательными кадрами или подкадрами, записанными в сдвиговый регистр SR3. В других реализациях линия задержки D130 может осуществлять операцию трансформации на выборках из кадрового буфера FB1 до записи их в сдвиговый регистр SR3 (например, согласно функции, описанной сигналом SD10 данных регуляризации).
Может оказаться желательным, чтобы линия задержки D120 применяла преобразование временного масштаба, основанное на, но не идентичное трансформации, заданной сигналом SD10 данных регуляризации. На фиг.28 показана блок-схема реализации AD12 широкополосного речевого кодера AD10, который включает в себя блок D110 отображения значений задержки. Блок D110 отображения значений задержки отображает трансформацию, указанную в сигнале SD10 данных регуляризации, в отображенные значения задержки SD10a. Линия задержки D120 создает речевой сигнал S30a полосы верхних частот с трансформированной временной шкалой согласно трансформации, указанной отображенными значениям задержки SD10a.
Временной сдвиг, применяемый узкополосным кодером, предположительно изменяется плавно во времени. Поэтому обычно бывает достаточно вычислить средний узкополосный временной сдвиг, применяемый к подкадрам на протяжении кадра речи и сдвинуть соответствующий кадр речевого сигнала S30 полосы верхних частот согласно этому среднему значению. В одном таком примере блок D110 отображения значений задержки вычисляет среднее для значений задержки подкадров для каждого кадра и линия задержки D120 применяет вычисленное среднее к соответствующему кадру сигнала S30 полосы верхних частот. В других примерах можно вычислять и применять среднее по более короткому периоду (например, двум подкадрам или половине кадра) или более долгому периоду (например, двум кадрам). В случае когда среднее является нецелым количеством выборок, блок D110 отображения значений задержки может округлять значение до целого количества выборок, прежде чем вывести его на линию задержки D120.
Узкополосный кодер A124 может включать временной сдвиг регуляризации, равный нецелому количеству выборок, в кодированный узкополосный сигнал возбуждения. В таком случае может оказаться желательным, чтобы блок D110 отображения значений задержки округлял узкополосный временной сдвиг до целого количества выборок и чтобы линия задержки D120 применяла округленный временной сдвиг к речевому сигналу S30 полосы верхних частот.
В некоторых реализациях широкополосного речевого кодера AD10 частоты дискретизации узкополосного речевого сигнала S20 и речевого сигнала S30 полосы верхних частот могут отличаться. В таких случаях блок D110 отображения значений задержки может регулировать величины временного сдвига, указанные в сигнале SD10 данных регуляризации для учета разности между частотами дискретизации узкополосного речевого сигнала S20 (или узкополосного сигнала возбуждения S80) и речевого сигнала S30 полосы верхних частот. Например, блок D110 отображения значений задержки может масштабировать величины временного сдвига согласно отношению частот дискретизации. В одном конкретном примере, как отмечено выше, узкополосный речевой сигнал S20 дискретизирован с частотой 8 кГц и речевой сигнал S30 полосы верхних частот дискретизирован с частотой 7 кГц. В этом случае блок D110 отображения значений задержки изменяет величину каждого сдвига на 7/8. Реализации блока D110 отображения значений задержки также могут осуществлять такую операцию масштабирования совместно с округлением до целого и/или описанную здесь операцию усреднения временного сдвига.
В еще одной реализации линия задержки D120 может иначе изменять временную шкалу кадра или другой последовательности выборок (например, сжимая одну часть и растягивая другую часть). Например, узкополосный кодер A124 может осуществлять регуляризацию согласно такой функции, как контур или траектория основного тона. В таком случае сигнал SD10 данных регуляризации может включать в себя соответствующее описание функции, например набор параметров, и линия задержки D120 может включать в себя логику, способную трансформировать кадры или подкадры речевого сигнала S30 полосы верхних частот согласно функции. В других реализациях блок отображения значений задержки D110 усредняет, масштабирует и/или округляет функцию до ее применения к речевому сигналу S30 полосы верхних частот линией задержки D120. Например, блок D110 отображения значений задержки может вычислять одно или несколько значений задержки согласно функции, причем каждое значение задержки указывает количество выборок, которые затем применяются линией задержки D120 для трансформации временного масштаба одного или нескольких соответствующих кадров или подкадров речевого сигнала S30 полосы верхних частот.
На фиг.29 показана логическая блок-схема способа MD100 преобразования временного масштаба речевого сигнала полосы верхних частот согласно преобразованию временного масштаба, включенному в соответствующий кодированный узкополосный сигнал возбуждения. Задача TD100 обрабатывает широкополосный речевой сигнал для получения узкополосного речевого сигнала и речевого сигнала полосы верхних частот. Например, задача TD100 может фильтровать широкополосный речевой сигнал с использованием гребенки фильтров, имеющей низкочастотные и высокочастотные фильтры, например реализации гребенки фильтров A110. Задача TD200 кодирует узкополосный речевой сигнал в, по меньшей мере, кодированный узкополосный сигнал возбуждения и совокупность узкополосных параметров фильтра. Кодированный узкополосный сигнал возбуждения и/или параметры фильтра могут быть квантованными, и кодированный узкополосный речевой сигнал также может включать в себя другие параметры, например параметр речевого режима. Задача TD200 также включает в себя преобразование временного масштаба в кодированном узкополосном сигнале возбуждения.
Задача TD300 генерирует сигнал возбуждения полосы верхних частот на основании узкополосного сигнала возбуждения. В этом случае узкополосный сигнал возбуждения основан на кодированном узкополосном сигнале возбуждения. Согласно, по меньшей мере, сигналу возбуждения полосы верхних частот задача TD400 кодирует речевой сигнал полосы верхних частот в, по меньшей мере, совокупность параметров фильтра полосы верхних частот. Например, задача TD400 может кодировать речевой сигнал полосы верхних частот в совокупность квантованных LSF. Задача TD500 применяет временной сдвиг к речевому сигналу полосы верхних частот, который основан на информации, связанной с преобразованием временного масштаба, включенным в кодированный узкополосный сигнал возбуждения.
Задача TD400 может осуществлять спектральный анализ (например, анализ LPC) речевого сигнала полосы верхних частот и/или вычислять огибающую усиления речевого сигнала полосы верхних частот. В таких случаях задача TD500 может применять временной сдвиг к речевому сигналу полосы верхних частот до анализа и/или вычисления огибающей усиления.
Другие реализации широкополосного речевого кодера A100 обращают преобразование временного масштаба сигнала возбуждения S120 полосы верхних частот, обусловленного преобразованием временного масштаба, включенным в кодированный узкополосный сигнал возбуждения. Например, можно реализовать генератор возбуждения A300 полосы верхних частот, включающий в себя реализацию линии задержки D120, которая принимает сигнал SD10 данных регуляризации или отображенные значения задержки SD10a и применяет соответствующий обратный временной сдвиг к узкополосному сигналу возбуждения S80 и/или к последующему сигналу на его основе, например гармонически расширенному сигналу S160 или сигналу возбуждения S120 полосы верхних частот.
Дополнительные реализации широкополосного речевого кодера могут кодировать узкополосный речевой сигнал S20 и речевой сигнал S30 полосы верхних частот независимо друг от друга, в результате чего речевой сигнал S30 полосы верхних частот кодируется как представление спектральной огибающей полосы верхних частот и сигнала возбуждения полосы верхних частот. Такая реализация может быть способна осуществлять преобразование временного масштаба остаточного сигнала полосы верхних частот или иначе включать преобразование временного масштаба в кодированный сигнал возбуждения полосы верхних частот согласно информации, связанной с преобразованием временного масштаба, включенным в кодированный узкополосный сигнал возбуждения. Например, кодер полосы верхних частот может включать в себя реализацию описанных здесь линии задержки D120 и/или блока D110 отображения значений задержки, которые применяют преобразование временного масштаба к остаточному сигналу полосы верхних частот. Потенциальные преимущества такой операции включают в себя более эффективное кодирование остаточного сигнала полосы верхних частот и лучшее совпадение между синтезированными узкополосным речевым сигналом и речевым сигналом полосы верхних частот.
Как отмечено выше, описанные варианты осуществления включают в себя реализации, которые можно использовать для осуществления встроенного кодирования, поддержки совместимости с узкополосными системами и исключения необходимости в транскодировании. Поддержка кодирования полосы верхних частот также может служить для дифференциации в зависимости от стоимости между чипами, чипсетами, устройствами и/или сетями, имеющими широкополосную поддержку с обратной совместимостью и имеющими только узкополосную поддержку. Описанную здесь поддержку кодирования полосы верхних частот также можно использовать совместно с методами поддержки кодирования полосы нижних частот, и система, способ или устройство согласно такому варианту осуществления может поддерживать кодирование частотных составляющих от, например, около 50 или 100 Гц до около 7 или 8 кГц.
Как отмечено выше, добавление поддержки полосы верхних частот к речевому кодеру может повысить разборчивость речи, особенно в отношении различения фрикативных звуков. Хотя слушатель-человек обычно может различать такие звуки на основании конкретного контекста, поддержка полосы верхних частот может служить мощным вспомогательным средством в распознавании речи и других приложениях машинной интерпретации, например системах для автоматической навигации по голосовому меню и/или автоматической обработке вызова.
Устройство согласно варианту осуществления можно встроить в портативное устройство беспроводной связи, например сотовый телефон или карманный персональный компьютер (PDA). Альтернативно такое устройство может входить в состав другого устройства связи, например телефонной трубки VoIP, персонального компьютера, способного поддерживать связь по стандарту VoIP, или сетевого устройства, способного маршрутизировать телефонные или VoIP вызовы. Например, устройство согласно варианту осуществления можно реализовать в виде чипа или чипсета для устройства связи. В зависимости от конкретного применения такое устройство также может включать в себя такие особенности, как аналого-цифровое и/или цифро-аналоговое преобразование речевого сигнала, схему для осуществления усиления и/или другой операции обработки речевого сигнала и/или радиочастотную схему для передачи и/или приема кодированного речевого сигнала.
Предполагается, что варианты осуществления могут включать в себя и/или использовать одну или несколько других особенностей, раскрытых в предварительных патентных заявках США №№ 60/667901 и 60/673965, приоритет которых испрашивает настоящая заявка. Такие особенности включают в себя удаление высокоэнергичных импульсов малой длительности, которые возникают в верхнем диапазоне и, по существу, отсутствуют в узком диапазоне. Такие особенности включают в себя фиксированное или адаптивное сглаживание представлений коэффициентов, например LSF полосы верхних частот. Такие особенности включают в себя фиксированное или адаптивное преобразование формы шума, связанного с квантованием представлений коэффициентов, например LSF. Такие особенности также включают в себя фиксированное или адаптивное сглаживание огибающей усиления и адаптивное ослабление огибающей усиления.
Вышеприведенное представление описанных вариантов осуществления обеспечено для того, чтобы специалисты в данной области могли использовать настоящее изобретение. Возможны различные модификации этих вариантов осуществления, и представленные здесь общие принципы применимы и к другим вариантам осуществления. Например, вариант осуществления можно реализовать полностью или частично в виде электронной схемы, в виде конфигурации схем, скомпонованной на специализированной интегральной схеме, или в виде программно-аппаратного обеспечения, загруженного в энергонезависимое запоминающее устройство или программного обеспечения, загружаемого из или на носитель данных в виде машинно-считываемого кода, причем такой код представляет собой команды, выполняемые матрицей логических элементов, например микропроцессором или другим блоком цифровой обработки сигнала. Носитель данных может представлять собой матрицу элементов хранения, например полупроводниковое ЗУ (которое может включать в себя, без ограничения, динамическое или статическое ОЗУ (оперативное ЗУ), ПЗУ (постоянное ЗУ), и/или флэш-память), или сегнетоэлектрическое ЗУ, магниторезистивное ЗУ, ЗУ на аморфных полупроводниках, полимерное ЗУ или ЗУ на основе фазовых переходов; или дисковый носитель, например магнитный или оптический диск. Термин "программное обеспечение" следует понимать в смысле, включающем в себя исходный код, код на языке ассемблера, машинный код, двоичный код, зашитую программу, макрокод, микрокод, один или несколько наборов или последовательностей команд, выполняемых матрицей логических элементов, и любую комбинацию таких примеров.
Различные элементы реализации генераторов возбуждения A300 и B300 полосы верхних частот, кодера A100 полосы верхних частот, декодера B200 полосы верхних частот, широкополосного речевого кодера A100 и широкополосного речевого декодера B100 можно реализовать в виде электронных и/или оптических устройств, размещенных, например, на одном и том же чипе или на двух или более чипах в чипсете, хотя возможны и другие конфигурации без такого ограничения. Один или несколько элементов такого устройства можно реализовать полностью или частично в виде одного или нескольких наборов команд, предназначенных для выполнения на одной или нескольких фиксированных или программируемых матрицах логических элементов (например, транзисторов, вентилей), например микропроцессорах, встроенных процессорах, основных услугах IP, цифровых сигнальных процессорах, FPGA (вентильных матрицах, программируемых пользователем), ASSP (специализированных стандартных продуктах), и ASIC (специализированных интегральных схемах). Один или несколько таких элементов также могут быть объединены в общую структуру (например, процессор, используемый для выполнения участков кода, соответствующих разным элементам, в разное время, набор команд, выполняемых для осуществления задач, соответствующих разным элементам, в разное время, или конфигурацию электронных и/или оптических устройств, осуществляющих операции для разных элементов в разное время). Кроме того, один или несколько таких элементов можно использовать для осуществления задач или выполнения других наборов команд, которые непосредственно не связаны с работой устройства, например задачи, относящейся к другой операции устройства, или системы, в которую встроено устройство.
На фиг.30 показана логическая блок-схема способа M100 согласно варианту осуществления кодирования части полосы верхних частот речевого сигнала, имеющего узкополосную часть и часть полосы верхних частот. Задача X100 вычисляет набор параметров фильтра, характеризующих спектральную огибающую части полосы верхних частот. Задача X200 вычисляет спектрально расширенный сигнал путем применения нелинейной функции к сигналу, полученному из узкополосной части. Задача X300 генерирует синтезированный сигнал полосы верхних частот согласно (A) набору параметров фильтра и (B) сигналу возбуждения полосы верхних частот, основанному на спектрально расширенном сигнале. Задача X400 вычисляет огибающую усиления на основании соотношения между (C) энергией части полосы верхних частот и (D) энергией сигнала, полученного из узкополосной части.
На фиг.31a показана логическая блок-схема способа M200 генерации сигнала возбуждения полосы верхних частот согласно варианту осуществления. Задача Y100 вычисляет гармонически расширенный сигнал путем применения нелинейной функции к узкополосному сигналу возбуждения, полученному из узкополосной части речевого сигнала. Задача Y200 смешивает гармонически расширенный сигнал с модулированным шумовым сигналом для генерации сигнала возбуждения полосы верхних частот. На фиг.31b показана логическая блок-схема способа M210 генерации сигнала возбуждения полосы верхних частот согласно другому варианту осуществления, включающего в себя задачи Y300 и Y400. Задача Y300 вычисляет огибающую во временном измерении в виде распределения энергии по времени для одного из узкополосного сигнала возбуждения и гармонически расширенного сигнала. Задача Y400 модулирует шумовой сигнал согласно огибающей во временном измерении для создания модулированного шумового сигнала.
На фиг.32 показана логическая блок-схема способа M300 согласно варианту осуществления декодирования части полосы верхних частот речевого сигнала, имеющего узкополосную часть и часть полосы верхних частот. Задача Z100 принимает набор параметров фильтра, характеризующих спектральную огибающую части полосы верхних частот и набор коэффициентов усиления, характеризующих временную огибающую части полосы верхних частот. Задача Z200 вычисляет спектрально расширенный сигнал путем применения нелинейной функции к сигналу, полученному из узкополосной части. Задача Z300 генерирует синтезированный сигнал полосы верхних частот согласно (A) набору параметров фильтра и (B) сигналу возбуждения полосы верхних частот, основанному на спектрально расширенном сигнале. Задача Z400 модулирует огибающую усиления синтезированного сигнала полосы верхних частот на основании набора коэффициентов усиления. Например, задача Z400 может модулировать огибающую усиления синтезированного сигнала полосы верхних частот путем применения набора коэффициентов усиления к сигналу возбуждения, полученному из узкополосной части, к спектрально расширенному сигналу, к сигналу возбуждения полосы верхних частот или к синтезированному сигналу полосы верхних частот.
Варианты осуществления также включают в себя дополнительные способы речевого кодирования, кодирования и декодирования, явно раскрытые здесь, например, посредством описаний структурных вариантов осуществления таких способов. Каждый из этих способов также может быть материально реализован (например, на одном или нескольких из вышеперечисленных носителей данных) в виде одного или нескольких наборов команд, считываемых и/или выполняемых машиной, включая матрицу логических элементов (например, процессор, микропроцессор, микроконтроллер или другой конечный автомат). Таким образом, настоящее изобретение не предусматривает ограничение вышеописанными вариантами осуществления, но подлежит рассмотрению в широчайшем объеме, согласующемся с принципами и новыми признаками, раскрытыми здесь любым образом, в том числе в формуле изобретения, которая составляет часть исходного раскрытия.
Claims (40)
1. Способ обработки сигнала для получения широкополосного речевого сигнала, причем способ содержит
декодирование кодированного речевого сигнала для получения сигнала возбуждения полосы нижних частот, совокупности параметров фильтра полосы нижних частот и совокупности параметров фильтра полосы верхних частот,
синтезирование речевого сигнала полосы нижних частот на основе сигнала возбуждения полосы нижних частот и совокупности параметров фильтра полосы нижних частот,
генерирование сигнала возбуждения полосы верхних частот на основе сигнала возбуждения полосы нижних частот,
синтезирование речевого сигнала полосы верхних частот согласно, по меньшей мере, сигналу возбуждения полосы верхних частот и совокупности параметров фильтра полосы верхних частот и
объединение речевого сигнала полосы нижних частот и речевого сигнала полосы верхних частот для получения широкополосного речевого сигнала,
причем упомянутое генерирование сигнала возбуждения полосы верхних частот включает в себя применение нелинейной функции к сигналу возбуждения полосы нижних частот для генерации спектрально расширенного сигнала.
декодирование кодированного речевого сигнала для получения сигнала возбуждения полосы нижних частот, совокупности параметров фильтра полосы нижних частот и совокупности параметров фильтра полосы верхних частот,
синтезирование речевого сигнала полосы нижних частот на основе сигнала возбуждения полосы нижних частот и совокупности параметров фильтра полосы нижних частот,
генерирование сигнала возбуждения полосы верхних частот на основе сигнала возбуждения полосы нижних частот,
синтезирование речевого сигнала полосы верхних частот согласно, по меньшей мере, сигналу возбуждения полосы верхних частот и совокупности параметров фильтра полосы верхних частот и
объединение речевого сигнала полосы нижних частот и речевого сигнала полосы верхних частот для получения широкополосного речевого сигнала,
причем упомянутое генерирование сигнала возбуждения полосы верхних частот включает в себя применение нелинейной функции к сигналу возбуждения полосы нижних частот для генерации спектрально расширенного сигнала.
2. Способ обработки сигнала по п.1, в котором упомянутое синтезирование речевого сигнала полосы нижних частот включает в себя синтезирование речевого сигнала полосы нижних частот согласно, по меньшей мере, сигналу возбуждения полосы нижних частот и совокупности коэффициентов фильтра линейного прогнозирования.
3. Способ обработки сигнала по п.1, в котором синтезирование речевого сигнала полосы верхних частот включает в себя синтезирование речевого сигнала полосы верхних частот согласно, по меньшей мере, сигналу возбуждения полосы верхних частот и совокупности коэффициентов фильтра линейного прогнозирования.
4. Способ обработки сигнала по п.1, в котором нелинейная функция является нелинейной функцией без запоминания.
5. Способ обработки сигнала по п.1, в котором нелинейная функция является функцией абсолютного значения.
6. Способ обработки сигнала по п.1, в котором упомянутое генерирование сигнала возбуждения полосы верхних частот включает в себя смешивание сигнала, который основан на спектрально расширенном сигнале, с модулированным шумовым сигналом, при этом сигнал возбуждения полосы верхних частот основан на смешанном сигнале.
7. Способ обработки сигнала по п.6, в котором модулированный шумовой сигнал основан на результате модуляции шумового сигнала согласно огибающей временной области сигнала, основанного на, по меньшей мере, одном из речевого сигнала полосы нижних частот, сигнала возбуждения полосы нижних частот и спектрально расширенного сигнала.
8. Способ обработки сигнала по п.1, содержащий, перед упомянутым объединением и согласно совокупности коэффициентов усиления, изменение амплитуды речевого сигнала полосы верхних частот во времени.
9. Способ обработки сигнала по п.8, в котором упомянутое изменение амплитуды речевого сигнала полосы верхних частот включает в себя изменение, согласно совокупности коэффициентов усиления, амплитуды во времени, по меньшей мере, одного из сигнала возбуждения полосы нижних частот, спектрально расширенного сигнала, сигнала возбуждения полосы верхних частот и речевого сигнала полосы верхних частот.
10. Устройство для декодирования кодированного широкополосного речевого сигнала, содержащее
обратный квантователь, конфигурированный для получения сигнала возбуждения полосы нижних частот, совокупности параметров фильтра полосы нижних частот и совокупности параметров фильтра полосы верхних частот из кодированного речевого сигнала,
узкополосный декодер, конфигурированный для синтезирования речевого сигнала полосы нижних частот согласно, по меньшей мере, сигналу возбуждения полосы нижних частот и совокупности параметров фильтра полосы нижних частот,
декодер полосы верхних частот, конфигурированный для генерирования сигнала возбуждения полосы верхних частот на основе сигнала возбуждения полосы нижних частот и синтезирования речевого сигнала полосы верхних частот согласно, по меньшей мере, сигналу возбуждения полосы верхних частот и совокупности параметров фильтра полосы верхних частот, и
гребенку фильтров, конфигурированную для объединения речевого сигнала полосы нижних частот и речевого сигнала полосы верхних частот для получения широкополосного речевого сигнала,
при этом декодер полосы верхних частот конфигурирован для генерации сигнала возбуждения полосы верхних частот из спектрально расширенного сигнала, полученного применением нелинейной функции к сигналу возбуждения полосы нижних частот.
обратный квантователь, конфигурированный для получения сигнала возбуждения полосы нижних частот, совокупности параметров фильтра полосы нижних частот и совокупности параметров фильтра полосы верхних частот из кодированного речевого сигнала,
узкополосный декодер, конфигурированный для синтезирования речевого сигнала полосы нижних частот согласно, по меньшей мере, сигналу возбуждения полосы нижних частот и совокупности параметров фильтра полосы нижних частот,
декодер полосы верхних частот, конфигурированный для генерирования сигнала возбуждения полосы верхних частот на основе сигнала возбуждения полосы нижних частот и синтезирования речевого сигнала полосы верхних частот согласно, по меньшей мере, сигналу возбуждения полосы верхних частот и совокупности параметров фильтра полосы верхних частот, и
гребенку фильтров, конфигурированную для объединения речевого сигнала полосы нижних частот и речевого сигнала полосы верхних частот для получения широкополосного речевого сигнала,
при этом декодер полосы верхних частот конфигурирован для генерации сигнала возбуждения полосы верхних частот из спектрально расширенного сигнала, полученного применением нелинейной функции к сигналу возбуждения полосы нижних частот.
11. Устройство по п.10, в котором узкополосный декодер конфигурирован для синтезирования речевого сигнала полосы нижних частот согласно, по меньшей мере, сигналу возбуждения полосы нижних частот и совокупности коэффициентов фильтра линейного прогнозирования.
12. Устройство по п.10, в котором декодер полосы верхних частот конфигурирован для синтезирования речевого сигнала полосы верхних частот согласно, по меньшей мере, сигналу возбуждения полосы верхних частот и совокупности коэффициентов фильтра линейного прогнозирования.
13. Устройство по п.10, в котором декодер полосы верхних частот конфигурирован для применения нелинейной функции без запоминания к сигналу, который основан на узкополосном сигнале возбуждения, для генерации спектрально расширенного сигнала.
14. Устройство по п.10, в котором декодер полосы верхних частот конфигурирован для применения функции абсолютного значения к сигналу, который основан на сигнале возбуждения полосы нижних частот, для генерации спектрально расширенного сигнала.
15. Устройство по п.10, в котором декодер полосы верхних частот конфигурирован для смешивания сигнала, который основан на спектрально расширенном сигнале, с модулированным шумовым сигналом и при этом декодер полосы верхних частот конфигурирован для генерирования сигнала возбуждения полосы частот на основе смешанного сигнала.
16. Устройство по п.15, в котором декодер полосы верхних частот конфигурирован для осуществления модуляции шумового сигнала согласно огибающей временной области сигнала, основанного на, по меньшей мере, одном из речевого сигнала полосы нижних частот, сигнала возбуждения полосы нижних частот и спектрально расширенного сигнала, при этом модулированный шумовой сигнал основан на результате модуляции.
17. Устройство по п.10, в котором декодер полосы верхних частот конфигурирован для изменения амплитуды речевого сигнала полосы верхних частот во времени согласно совокупности коэффициентов усиления.
18. Устройство по п.18, в котором декодер полосы верхних частот конфигурирован для изменения амплитуды речевого сигнала полосы верхних частот согласно совокупности коэффициентов усиления путем изменения, согласно совокупности коэффициентов усиления, амплитуды во времени, по меньшей мере, одного из сигнала возбуждения полосы нижних частот, спектрально расширенного сигнала, сигнала возбуждения полосы верхних частот и речевого сигнала полосы верхних частот.
19. Устройство по п.10, содержащее устройство для приема совокупности пакетов, согласующихся с версией Интернет-протокола, при этом совокупность пакетов описывает сигнал возбуждения полосы нижних частот, совокупность параметров фильтра полосы нижних частот и совокупность параметров фильтра полосы верхних частот.
20. Сотовый телефон, содержащий устройство по п.10.
21. Способ обработки сигнала для кодирования широкополосного речевого сигнала, причем способ содержит
обработку широкополосного речевого сигнала для получения речевого сигнала полосы нижних частот и речевого сигнала полосы верхних частот,
кодирование речевого сигнала полосы нижних частот для получения, по меньшей мере, кодированного сигнала возбуждения полосы нижних частот и совокупности параметров фильтра полосы нижних частот,
генерирование сигнала возбуждения полосы верхних частот на основе кодированного сигнала возбуждения полосы нижних частот и,
согласно сигналу возбуждения полосы верхних частот, кодирование речевого сигнала полосы верхних частот для получения, по меньшей мере, совокупности параметров фильтра полосы верхних частот,
при этом упомянутое генерирование сигнала возбуждения полосы верхних частот включает в себя генерирование спектрально расширенного сигнала путем применения нелинейной функции к кодированному сигналу возбуждения полосы нижних частот.
обработку широкополосного речевого сигнала для получения речевого сигнала полосы нижних частот и речевого сигнала полосы верхних частот,
кодирование речевого сигнала полосы нижних частот для получения, по меньшей мере, кодированного сигнала возбуждения полосы нижних частот и совокупности параметров фильтра полосы нижних частот,
генерирование сигнала возбуждения полосы верхних частот на основе кодированного сигнала возбуждения полосы нижних частот и,
согласно сигналу возбуждения полосы верхних частот, кодирование речевого сигнала полосы верхних частот для получения, по меньшей мере, совокупности параметров фильтра полосы верхних частот,
при этом упомянутое генерирование сигнала возбуждения полосы верхних частот включает в себя генерирование спектрально расширенного сигнала путем применения нелинейной функции к кодированному сигналу возбуждения полосы нижних частот.
22. Способ обработки сигнала по п.21, в котором упомянутое кодирование речевого сигнала полосы нижних частот для получения, по меньшей мере, кодированного сигнала возбуждения полосы нижних частот и совокупности параметров фильтра полосы нижних частот включает в себя кодирование речевого сигнала полосы нижних частот для получения, по меньшей мере, кодированного сигнала возбуждения полосы нижних частот и совокупности коэффициентов фильтра линейного прогнозирования.
23. Способ обработки сигнала по п.21, в котором упомянутое кодирование речевого сигнала полосы верхних частот для получения, по меньшей мере, совокупности параметров фильтра полосы верхних частот включает в себя кодирование речевого сигнала полосы верхних частот для получения, по меньшей мере, совокупности коэффициентов фильтра линейного прогнозирования.
24. Способ обработки сигнала по п.21, в котором нелинейная функция является нелинейной функцией без запоминания.
25. Способ обработки сигнала по п.21, в котором нелинейная функция является функцией абсолютного значения.
26. Способ обработки сигнала по п.21, в котором упомянутое генерирование сигнала возбуждения полосы верхних частот на основе спектрально расширенного сигнала включает в себя смешивание сигнала, который основан на спектрально расширенном сигнале, с модулированным шумовым сигналом, при этом сигнал возбуждения полосы верхних частот основан на смешанном сигнале.
27. Способ обработки сигнала по п.26, в котором модулированный шумовой сигнал основан на результате модуляции шумового сигнала согласно огибающей временной области сигнала, основанного на, по меньшей мере, одном из речевого сигнала полосы нижних частот, сигнала возбуждения полосы нижних частот и спектрально расширенного сигнала.
28. Способ обработки сигнала по п.21, содержащий вычисление огибающей усиления согласно соотношению, изменяющемуся во времени, между сигналом полосы верхних частот и сигналом, основанным на сигнале возбуждения полосы нижних частот.
29. Способ обработки сигнала по п.28, в котором упомянутое вычисление огибающей усиления содержит
генерирование синтезированного сигнала полосы верхних частот на основе сигнала возбуждения полосы верхних частот и совокупности параметров фильтра полосы верхних частот и
вычисление огибающей усиления согласно соотношению, изменяющемуся во времени, между сигналом полосы верхних частот и синтезированным сигналом полосы верхних частот.
генерирование синтезированного сигнала полосы верхних частот на основе сигнала возбуждения полосы верхних частот и совокупности параметров фильтра полосы верхних частот и
вычисление огибающей усиления согласно соотношению, изменяющемуся во времени, между сигналом полосы верхних частот и синтезированным сигналом полосы верхних частот.
30. Устройство для кодирования широкополосного речевого сигнала, содержащее
гребенку фильтров, конфигурированную для фильтрации широкополосного речевого сигнала для получения речевого сигнала полосы нижних частот и речевого сигнала полосы верхних частот,
кодер полосы нижних частот, конфигурированный для кодирования речевого сигнала полосы нижних частот для получения, по меньшей мере, кодированного сигнала возбуждения полосы нижних частот и совокупности параметров фильтра полосы нижних частот, и
кодер полосы верхних частот, конфигурированный для генерирования сигнала возбуждения полосы верхних частот на основе кодированного сигнала возбуждения полосы нижних частот и кодирования речевого сигнала полосы верхних частот, согласно сигналу возбуждения полосы верхних частот, для получения, по меньшей мере, совокупности параметров фильтра полосы верхних частот,
при этом кодер полосы верхних частот конфигурирован для генерирования сигнала возбуждения полосы верхних частот из спектрально расширенного сигнала, полученного применением нелинейной функции к кодированному сигналу возбуждения полосы нижних частот.
гребенку фильтров, конфигурированную для фильтрации широкополосного речевого сигнала для получения речевого сигнала полосы нижних частот и речевого сигнала полосы верхних частот,
кодер полосы нижних частот, конфигурированный для кодирования речевого сигнала полосы нижних частот для получения, по меньшей мере, кодированного сигнала возбуждения полосы нижних частот и совокупности параметров фильтра полосы нижних частот, и
кодер полосы верхних частот, конфигурированный для генерирования сигнала возбуждения полосы верхних частот на основе кодированного сигнала возбуждения полосы нижних частот и кодирования речевого сигнала полосы верхних частот, согласно сигналу возбуждения полосы верхних частот, для получения, по меньшей мере, совокупности параметров фильтра полосы верхних частот,
при этом кодер полосы верхних частот конфигурирован для генерирования сигнала возбуждения полосы верхних частот из спектрально расширенного сигнала, полученного применением нелинейной функции к кодированному сигналу возбуждения полосы нижних частот.
31. Устройство по п.30, в котором узкополосный кодер конфигурирован для кодирования речевого сигнала полосы нижних частот для получения, по меньшей мере, кодированного сигнала возбуждения полосы нижних частот и совокупности коэффициентов фильтра линейного прогнозирования.
32. Устройство по п.30, в котором кодер полосы верхних частот конфигурирован для кодирования речевого сигнала полосы верхних частот для получения, по меньшей мере, совокупности коэффициентов фильтра линейного прогнозирования.
33. Устройство по п.30, в котором кодер полосы верхних частот конфигурирован для применения нелинейной функции без запоминания к сигналу, который основан на кодированном сигнале возбуждения полосы нижних частот, для генерации спектрально расширенного сигнала.
34. Устройство по п.30, в котором кодер полосы верхних частот конфигурирован для применения функции абсолютного значения к сигналу, который основан на кодированном сигнале возбуждения полосы нижних частот, для генерации спектрально расширенного сигнала.
35. Устройство по п.30, в котором кодер полосы верхних частот конфигурирован для смешивания сигнала, который основан на спектрально расширенном сигнале, с модулированным шумовым сигналом и при этом кодер полосы верхних частот конфигурирован для генерирования сигнала возбуждения полосы верхних частот на основе смешанного сигнала.
36. Устройство по п.35, в котором кодер полосы верхних частот конфигурирован для модулирования шумового сигнала согласно огибающей временной области сигнала на основе, по меньшей мере, одного из речевого сигнала полосы нижних частот, кодированного сигнала возбуждения полосы нижних частот и спектрально расширенного сигнала.
37. Устройство по п.30, в котором кодер полосы верхних частот конфигурирован для вычисления огибающей усиления согласно соотношению, изменяющемуся во времени, между сигналом полосы верхних частот и сигналом, основанным на кодированном сигнале возбуждения полосы нижних частот.
38. Устройство по п.37, в котором кодер полосы верхних частот конфигурирован для генерирования синтезированного сигнала полосы верхних частот на основе сигнала возбуждения полосы верхних частот и совокупности параметров фильтра полосы верхних частот и вычисления огибающей усиления согласно соотношению, изменяющемуся во времени, между сигналом полосы верхних частот и синтезированным сигналом полосы верхних частот.
39. Устройство по п.30, содержащее устройство для передачи совокупности пакетов, согласующихся с версией Интернет-протокола, причем совокупность пакетов описывает кодированный сигнал возбуждения полосы нижних частот, совокупность параметров фильтра полосы нижних частот и совокупность параметров фильтра полосы верхних частот.
40. Сотовый телефон, содержащий устройство по п.30.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US66790105P | 2005-04-01 | 2005-04-01 | |
US60/667,901 | 2005-04-01 | ||
US67396505P | 2005-04-22 | 2005-04-22 | |
US60/673,965 | 2005-04-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2007140382A RU2007140382A (ru) | 2009-05-10 |
RU2381572C2 true RU2381572C2 (ru) | 2010-02-10 |
Family
ID=36588741
Family Applications (9)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007140382/09A RU2381572C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройство широкополосного речевого кодирования |
RU2007140429/09A RU2387025C2 (ru) | 2005-04-01 | 2006-04-03 | Способ и устройство для векторного квантования спектрального представления огибающей |
RU2007140383/09A RU2402826C2 (ru) | 2005-04-01 | 2006-04-03 | Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот |
RU2007140381/09A RU2386179C2 (ru) | 2005-04-01 | 2006-04-03 | Способ и устройство для кодирования речевых сигналов с расщеплением полосы |
RU2009131435/08A RU2491659C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для высокополосного предыскажения шкалы времени |
RU2007140394/09A RU2413191C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для устраняющей разреженность фильтрации |
RU2007140426/09A RU2402827C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройство для генерирования возбуждения в диапазоне высоких частот |
RU2007140365/09A RU2376657C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для высокополосного предыскажения шкалы времени |
RU2007140406/09A RU2390856C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для подавления высокополосных всплесков |
Family Applications After (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007140429/09A RU2387025C2 (ru) | 2005-04-01 | 2006-04-03 | Способ и устройство для векторного квантования спектрального представления огибающей |
RU2007140383/09A RU2402826C2 (ru) | 2005-04-01 | 2006-04-03 | Способы и устройство кодирования и декодирования части речевого сигнала диапазона высоких частот |
RU2007140381/09A RU2386179C2 (ru) | 2005-04-01 | 2006-04-03 | Способ и устройство для кодирования речевых сигналов с расщеплением полосы |
RU2009131435/08A RU2491659C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для высокополосного предыскажения шкалы времени |
RU2007140394/09A RU2413191C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для устраняющей разреженность фильтрации |
RU2007140426/09A RU2402827C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройство для генерирования возбуждения в диапазоне высоких частот |
RU2007140365/09A RU2376657C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для высокополосного предыскажения шкалы времени |
RU2007140406/09A RU2390856C2 (ru) | 2005-04-01 | 2006-04-03 | Системы, способы и устройства для подавления высокополосных всплесков |
Country Status (24)
Country | Link |
---|---|
US (8) | US8364494B2 (ru) |
EP (8) | EP1869673B1 (ru) |
JP (8) | JP5203929B2 (ru) |
KR (8) | KR101019940B1 (ru) |
CN (1) | CN102411935B (ru) |
AT (4) | ATE485582T1 (ru) |
AU (8) | AU2006232360B2 (ru) |
BR (8) | BRPI0608305B1 (ru) |
CA (8) | CA2603231C (ru) |
DE (4) | DE602006018884D1 (ru) |
DK (2) | DK1864101T3 (ru) |
ES (3) | ES2391292T3 (ru) |
HK (5) | HK1113848A1 (ru) |
IL (8) | IL186439A0 (ru) |
MX (8) | MX2007012189A (ru) |
NO (7) | NO20075503L (ru) |
NZ (6) | NZ562186A (ru) |
PL (4) | PL1866915T3 (ru) |
PT (2) | PT1864282T (ru) |
RU (9) | RU2381572C2 (ru) |
SG (4) | SG163556A1 (ru) |
SI (1) | SI1864282T1 (ru) |
TW (8) | TWI324335B (ru) |
WO (8) | WO2006107834A1 (ru) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2575809C2 (ru) * | 2010-07-08 | 2016-02-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодер, использующий прямое подавление помех дискретизации |
RU2604425C2 (ru) * | 2013-02-15 | 2016-12-10 | Хуавэй Текнолоджиз Ко., Лтд. | Система и способ возбуждения смешанной кодовой книги для кодирования речи |
RU2667376C2 (ru) * | 2014-07-28 | 2018-09-19 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ формирования расширенного сигнала с использованием заполнения независимым шумом |
Families Citing this family (323)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7987095B2 (en) * | 2002-09-27 | 2011-07-26 | Broadcom Corporation | Method and system for dual mode subband acoustic echo canceller with integrated noise suppression |
US7619995B1 (en) * | 2003-07-18 | 2009-11-17 | Nortel Networks Limited | Transcoders and mixers for voice-over-IP conferencing |
JP4679049B2 (ja) * | 2003-09-30 | 2011-04-27 | パナソニック株式会社 | スケーラブル復号化装置 |
US7668712B2 (en) | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
EP1744139B1 (en) * | 2004-05-14 | 2015-11-11 | Panasonic Intellectual Property Corporation of America | Decoding apparatus and method thereof |
WO2006009074A1 (ja) * | 2004-07-20 | 2006-01-26 | Matsushita Electric Industrial Co., Ltd. | 音声復号化装置および補償フレーム生成方法 |
EP2189978A1 (en) * | 2004-08-30 | 2010-05-26 | QUALCOMM Incorporated | Adaptive De-Jitter Buffer for voice over IP |
US8085678B2 (en) * | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
WO2006103488A1 (en) * | 2005-03-30 | 2006-10-05 | Nokia Corporation | Source coding and/or decoding |
RU2381572C2 (ru) * | 2005-04-01 | 2010-02-10 | Квэлкомм Инкорпорейтед | Системы, способы и устройство широкополосного речевого кодирования |
WO2006116025A1 (en) * | 2005-04-22 | 2006-11-02 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor smoothing |
PL1869671T3 (pl) * | 2005-04-28 | 2009-12-31 | Siemens Ag | Sposób i urządzenie do tłumienia szumów |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
ATE443318T1 (de) * | 2005-07-14 | 2009-10-15 | Koninkl Philips Electronics Nv | Audiosignalsynthese |
WO2007013973A2 (en) * | 2005-07-20 | 2007-02-01 | Shattil, Steve | Systems and method for high data rate ultra wideband communication |
KR101171098B1 (ko) * | 2005-07-22 | 2012-08-20 | 삼성전자주식회사 | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 |
US7734462B2 (en) * | 2005-09-02 | 2010-06-08 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
US8326614B2 (en) * | 2005-09-02 | 2012-12-04 | Qnx Software Systems Limited | Speech enhancement system |
BRPI0616624A2 (pt) * | 2005-09-30 | 2011-06-28 | Matsushita Electric Ind Co Ltd | aparelho de codificação de fala e método de codificação de fala |
BRPI0617447A2 (pt) | 2005-10-14 | 2012-04-17 | Matsushita Electric Ind Co Ltd | codificador de transformada e método de codificação de transformada |
US7991611B2 (en) * | 2005-10-14 | 2011-08-02 | Panasonic Corporation | Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals |
JP4876574B2 (ja) * | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8135047B2 (en) | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US8532984B2 (en) | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
US20080046233A1 (en) * | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Packet Loss Concealment for Sub-band Predictive Coding Based on Extrapolation of Full-band Audio Waveform |
WO2008021247A2 (en) * | 2006-08-15 | 2008-02-21 | Dolby Laboratories Licensing Corporation | Arbitrary shaping of temporal noise envelope without side-information |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US8046218B2 (en) * | 2006-09-19 | 2011-10-25 | The Board Of Trustees Of The University Of Illinois | Speech and method for identifying perceptual features |
JP4972742B2 (ja) * | 2006-10-17 | 2012-07-11 | 国立大学法人九州工業大学 | 高域信号補間方法及び高域信号補間装置 |
USRE50158E1 (en) | 2006-10-25 | 2024-10-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples |
EP3848928B1 (en) | 2006-10-25 | 2023-03-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating complex-valued audio subband values |
KR101565919B1 (ko) * | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
KR101375582B1 (ko) | 2006-11-17 | 2014-03-20 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
US8005671B2 (en) * | 2006-12-04 | 2011-08-23 | Qualcomm Incorporated | Systems and methods for dynamic normalization to reduce loss in precision for low-level signals |
GB2444757B (en) * | 2006-12-13 | 2009-04-22 | Motorola Inc | Code excited linear prediction speech coding |
US20080147389A1 (en) * | 2006-12-15 | 2008-06-19 | Motorola, Inc. | Method and Apparatus for Robust Speech Activity Detection |
FR2911020B1 (fr) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
US7873064B1 (en) * | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
US8032359B2 (en) * | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
DK3591650T3 (da) | 2007-08-27 | 2021-02-15 | Ericsson Telefon Ab L M | Fremgangsmåde og indretning til udfyldning af spektrale huller |
FR2920545B1 (fr) * | 2007-09-03 | 2011-06-10 | Univ Sud Toulon Var | Procede de trajectographie de plusieurs cetaces par acoustique passive |
BRPI0818927A2 (pt) * | 2007-11-02 | 2015-06-16 | Huawei Tech Co Ltd | Método e aparelho para a decodificação de áudio |
KR101161866B1 (ko) * | 2007-11-06 | 2012-07-04 | 노키아 코포레이션 | 오디오 코딩 장치 및 그 방법 |
RU2483368C2 (ru) * | 2007-11-06 | 2013-05-27 | Нокиа Корпорейшн | Кодер |
EP2227682A1 (en) * | 2007-11-06 | 2010-09-15 | Nokia Corporation | An encoder |
KR101444099B1 (ko) * | 2007-11-13 | 2014-09-26 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
EP2218068A4 (en) * | 2007-11-21 | 2010-11-24 | Lg Electronics Inc | METHOD AND APPARATUS FOR SIGNAL PROCESSING |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US8050934B2 (en) * | 2007-11-29 | 2011-11-01 | Texas Instruments Incorporated | Local pitch control based on seamless time scale modification and synchronized sampling rate conversion |
TWI356399B (en) * | 2007-12-14 | 2012-01-11 | Ind Tech Res Inst | Speech recognition system and method with cepstral |
KR101439205B1 (ko) * | 2007-12-21 | 2014-09-11 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
US20100280833A1 (en) * | 2007-12-27 | 2010-11-04 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
KR101413968B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
WO2009116815A2 (en) * | 2008-03-20 | 2009-09-24 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding using bandwidth extension in portable terminal |
WO2010003068A1 (en) * | 2008-07-03 | 2010-01-07 | The Board Of Trustees Of The University Of Illinois | Systems and methods for identifying speech sound features |
ES2650492T3 (es) | 2008-07-10 | 2018-01-18 | Voiceage Corporation | Dispositivo y método de cuantificación de filtro LPC de múltiples referencias |
US8788276B2 (en) * | 2008-07-11 | 2014-07-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing |
RU2621965C2 (ru) | 2008-07-11 | 2017-06-08 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
KR101614160B1 (ko) * | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
WO2010011963A1 (en) * | 2008-07-25 | 2010-01-28 | The Board Of Trustees Of The University Of Illinois | Methods and systems for identifying speech sounds using multi-dimensional analysis |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
WO2010028297A1 (en) | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
WO2010028299A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
US8352279B2 (en) * | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US20100070550A1 (en) * | 2008-09-12 | 2010-03-18 | Cardinal Health 209 Inc. | Method and apparatus of a sensor amplifier configured for use in medical applications |
KR101178801B1 (ko) * | 2008-12-09 | 2012-08-31 | 한국전자통신연구원 | 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법 |
WO2010031003A1 (en) | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
WO2010036061A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
WO2010053287A2 (en) * | 2008-11-04 | 2010-05-14 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
DE102008058496B4 (de) * | 2008-11-21 | 2010-09-09 | Siemens Medical Instruments Pte. Ltd. | Filterbanksystem mit spezifischen Sperrdämpfungsanteilen für eine Hörvorrichtung |
GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
US9947340B2 (en) * | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
WO2010070770A1 (ja) * | 2008-12-19 | 2010-06-24 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466673B (en) * | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466675B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
MY205240A (en) | 2009-01-16 | 2024-10-09 | Dolby Int Ab | Cross product enhanced harmonic transposition |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
JP5459688B2 (ja) * | 2009-03-31 | 2014-04-02 | ▲ホア▼▲ウェイ▼技術有限公司 | 復号信号のスペクトルを調整する方法、装置、および音声復号システム |
JP4921611B2 (ja) * | 2009-04-03 | 2012-04-25 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
WO2010134757A2 (ko) * | 2009-05-19 | 2010-11-25 | 한국전자통신연구원 | 계층형 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치 |
CN101609680B (zh) * | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
US8000485B2 (en) * | 2009-06-01 | 2011-08-16 | Dts, Inc. | Virtual audio processing for loudspeaker or headphone playback |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
WO2011029484A1 (en) * | 2009-09-14 | 2011-03-17 | Nokia Corporation | Signal enhancement processing |
WO2011037587A1 (en) * | 2009-09-28 | 2011-03-31 | Nuance Communications, Inc. | Downsampling schemes in a hierarchical neural network structure for phoneme recognition |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
ES2531013T3 (es) | 2009-10-20 | 2015-03-10 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, método para codificar información de audio, método para decodificar información de audio y programa de computación que usa la detección de un grupo de valores espectrales previamente decodificados |
CN102257567B (zh) | 2009-10-21 | 2014-05-07 | 松下电器产业株式会社 | 音响信号处理装置、音响编码装置及音响解码装置 |
BR112012009375B1 (pt) | 2009-10-21 | 2020-09-24 | Dolby International Ab. | Sistema configurado para gerar um componente de alta frequência de um sinal de áudio, método para gerar um componente de alta frequência de um sinal de áudio e método para projetar um transpositor de harmônicos |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
WO2011062536A1 (en) * | 2009-11-19 | 2011-05-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Improved excitation signal bandwidth extension |
CN102612712B (zh) * | 2009-11-19 | 2014-03-12 | 瑞典爱立信有限公司 | 低频带音频信号的带宽扩展 |
US8489393B2 (en) * | 2009-11-23 | 2013-07-16 | Cambridge Silicon Radio Limited | Speech intelligibility |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
RU2464651C2 (ru) * | 2009-12-22 | 2012-10-20 | Общество с ограниченной ответственностью "Спирит Корп" | Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов |
US20110167445A1 (en) * | 2010-01-06 | 2011-07-07 | Reams Robert W | Audiovisual content channelization system |
US8326607B2 (en) * | 2010-01-11 | 2012-12-04 | Sony Ericsson Mobile Communications Ab | Method and arrangement for enhancing speech quality |
AU2011206677B9 (en) * | 2010-01-12 | 2014-12-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding and decoding an audio information, and computer program obtaining a context sub-region value on the basis of a norm of previously decoded spectral values |
US8699727B2 (en) | 2010-01-15 | 2014-04-15 | Apple Inc. | Visually-assisted mixing of audio using a spectral analyzer |
US9525569B2 (en) * | 2010-03-03 | 2016-12-20 | Skype | Enhanced circuit-switched calls |
KR101445294B1 (ko) * | 2010-03-10 | 2014-09-29 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 코딩 컨텍스트의 피치 의존 적응을 이용하는 오디오 신호 디코더, 오디오 신호 인코더, 오디오 신호 디코딩 방법, 오디오 신호 인코딩 방법, 및 컴퓨터 프로그램 |
US8700391B1 (en) * | 2010-04-01 | 2014-04-15 | Audience, Inc. | Low complexity bandwidth expansion of speech |
EP2559026A1 (en) * | 2010-04-12 | 2013-02-20 | Freescale Semiconductor, Inc. | Audio communication device, method for outputting an audio signal, and communication system |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
ES2986126T3 (es) | 2010-04-13 | 2024-11-08 | Fraunhofer Ges Zur Foerderungder Angewandten Forschung E V | Decodificación de la representación exacta de una señal de audio |
EP2559028B1 (en) * | 2010-04-14 | 2015-09-16 | VoiceAge Corporation | Flexible and scalable combined innovation codebook for use in celp coder and decoder |
US9443534B2 (en) * | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
EP2559032B1 (en) | 2010-04-16 | 2019-01-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
US9378754B1 (en) | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
KR101660843B1 (ko) * | 2010-05-27 | 2016-09-29 | 삼성전자주식회사 | Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법 |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
ES2372202B2 (es) * | 2010-06-29 | 2012-08-08 | Universidad De Málaga | Sistema de reconocimiento de sonidos de bajo consumo. |
EP3079152B1 (en) | 2010-07-02 | 2018-06-06 | Dolby International AB | Audio decoding with selective post filtering |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
JP5589631B2 (ja) * | 2010-07-15 | 2014-09-17 | 富士通株式会社 | 音声処理装置、音声処理方法および電話装置 |
WO2012008891A1 (en) * | 2010-07-16 | 2012-01-19 | Telefonaktiebolaget L M Ericsson (Publ) | Audio encoder and decoder and methods for encoding and decoding an audio signal |
JP5777041B2 (ja) * | 2010-07-23 | 2015-09-09 | 沖電気工業株式会社 | 帯域拡張装置及びプログラム、並びに、音声通信装置 |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
WO2012031125A2 (en) | 2010-09-01 | 2012-03-08 | The General Hospital Corporation | Reversal of general anesthesia by administration of methylphenidate, amphetamine, modafinil, amantadine, and/or caffeine |
IL313284B1 (en) * | 2010-09-16 | 2025-01-01 | Dolby Int Ab | Method and system for harmonic, block, subchannel, and enhanced transposition by rhetorical multiplication |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US8924200B2 (en) | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
WO2012053149A1 (ja) * | 2010-10-22 | 2012-04-26 | パナソニック株式会社 | 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法 |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
PL2676267T3 (pl) | 2011-02-14 | 2017-12-29 | Fraunhofergesellschaft Zur Förderung Der Angewandten Forschung E V | Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio |
JP5849106B2 (ja) | 2011-02-14 | 2016-01-27 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法 |
TWI480857B (zh) | 2011-02-14 | 2015-04-11 | Fraunhofer Ges Forschung | 在不活動階段期間利用雜訊合成之音訊編解碼器 |
JP5712288B2 (ja) | 2011-02-14 | 2015-05-07 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 重複変換を使用した情報信号表記 |
WO2012110448A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
AU2012217269B2 (en) | 2011-02-14 | 2015-10-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
MX2013009306A (es) | 2011-02-14 | 2013-09-26 | Fraunhofer Ges Forschung | Aparato y metodo para codificar y decodificar una señal de audio utilizando una porcion alineada anticipada. |
TWI480856B (zh) * | 2011-02-14 | 2015-04-11 | Fraunhofer Ges Forschung | 音訊編解碼器中之雜訊產生技術 |
KR101585849B1 (ko) * | 2011-02-16 | 2016-01-22 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 필터 계수들을 생성하고 필터들을 구성하는 방법들 및 시스템들 |
CA3055514C (en) * | 2011-02-18 | 2022-05-17 | Ntt Docomo, Inc. | Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program |
US9026450B2 (en) | 2011-03-09 | 2015-05-05 | Dts Llc | System for dynamically creating and rendering audio objects |
US9760566B2 (en) | 2011-03-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
US9244984B2 (en) | 2011-03-31 | 2016-01-26 | Microsoft Technology Licensing, Llc | Location based conversational understanding |
US9298287B2 (en) | 2011-03-31 | 2016-03-29 | Microsoft Technology Licensing, Llc | Combined activation for natural user interface systems |
US10642934B2 (en) | 2011-03-31 | 2020-05-05 | Microsoft Technology Licensing, Llc | Augmented conversational understanding architecture |
US9842168B2 (en) | 2011-03-31 | 2017-12-12 | Microsoft Technology Licensing, Llc | Task driven user intents |
US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
CN102811034A (zh) | 2011-05-31 | 2012-12-05 | 财团法人工业技术研究院 | 信号处理装置及信号处理方法 |
US9264094B2 (en) * | 2011-06-09 | 2016-02-16 | Panasonic Intellectual Property Corporation Of America | Voice coding device, voice decoding device, voice coding method and voice decoding method |
US9070361B2 (en) * | 2011-06-10 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component |
AU2012276367B2 (en) * | 2011-06-30 | 2016-02-04 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwidth extension signal |
US9059786B2 (en) * | 2011-07-07 | 2015-06-16 | Vecima Networks Inc. | Ingress suppression for communication systems |
JP5942358B2 (ja) * | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
RU2486636C1 (ru) * | 2011-11-14 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации высокочастотных сигналов и устройство его реализации |
RU2486637C1 (ru) * | 2011-11-15 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2486638C1 (ru) * | 2011-11-15 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации высокочастотных сигналов и устройство его реализации |
RU2496222C2 (ru) * | 2011-11-17 | 2013-10-20 | Федеральное государственное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2486639C1 (ru) * | 2011-11-21 | 2013-06-27 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2496192C2 (ru) * | 2011-11-21 | 2013-10-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации |
RU2490727C2 (ru) * | 2011-11-28 | 2013-08-20 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) | Способ передачи речевых сигналов (варианты) |
RU2487443C1 (ru) * | 2011-11-29 | 2013-07-10 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ согласования комплексных сопротивлений и устройство его реализации |
JP5817499B2 (ja) * | 2011-12-15 | 2015-11-18 | 富士通株式会社 | 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム |
US9082398B2 (en) * | 2012-02-28 | 2015-07-14 | Huawei Technologies Co., Ltd. | System and method for post excitation enhancement for low bit rate speech coding |
US9437213B2 (en) * | 2012-03-05 | 2016-09-06 | Malaspina Labs (Barbados) Inc. | Voice signal enhancement |
CN108831501B (zh) * | 2012-03-21 | 2023-01-10 | 三星电子株式会社 | 用于带宽扩展的高频编码/高频解码方法和设备 |
TR201911121T4 (tr) | 2012-03-29 | 2019-08-21 | Ericsson Telefon Ab L M | Vektör niceleyici. |
US10448161B2 (en) | 2012-04-02 | 2019-10-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field |
JP5998603B2 (ja) * | 2012-04-18 | 2016-09-28 | ソニー株式会社 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
KR101343768B1 (ko) * | 2012-04-19 | 2014-01-16 | 충북대학교 산학협력단 | 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법 |
RU2504894C1 (ru) * | 2012-05-17 | 2014-01-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации |
RU2504898C1 (ru) * | 2012-05-17 | 2014-01-20 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации |
US20140006017A1 (en) * | 2012-06-29 | 2014-01-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal |
JP6127143B2 (ja) | 2012-08-31 | 2017-05-10 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | 音声アクティビティ検出のための方法及び装置 |
WO2014046916A1 (en) | 2012-09-21 | 2014-03-27 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
WO2014062859A1 (en) * | 2012-10-16 | 2014-04-24 | Audiologicall, Ltd. | Audio signal manipulation for speech enhancement before sound reproduction |
KR101413969B1 (ko) | 2012-12-20 | 2014-07-08 | 삼성전자주식회사 | 오디오 신호의 복호화 방법 및 장치 |
CN105551497B (zh) | 2013-01-15 | 2019-03-19 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
MY185176A (en) * | 2013-01-29 | 2021-04-30 | Fraunhofer Ges Forschung | Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
RU2618919C2 (ru) * | 2013-01-29 | 2017-05-12 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для синтезирования аудиосигнала, декодер, кодер, система и компьютерная программа |
CN106847297B (zh) | 2013-01-29 | 2020-07-07 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
US20140213909A1 (en) * | 2013-01-31 | 2014-07-31 | Xerox Corporation | Control-based inversion for estimating a biological parameter vector for a biophysics model from diffused reflectance data |
US9601125B2 (en) * | 2013-02-08 | 2017-03-21 | Qualcomm Incorporated | Systems and methods of performing noise modulation and gain adjustment |
US9711156B2 (en) | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
US9741350B2 (en) | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
US9336789B2 (en) * | 2013-02-21 | 2016-05-10 | Qualcomm Incorporated | Systems and methods for determining an interpolation factor set for synthesizing a speech signal |
US9715885B2 (en) | 2013-03-05 | 2017-07-25 | Nec Corporation | Signal processing apparatus, signal processing method, and signal processing program |
EP2784775B1 (en) * | 2013-03-27 | 2016-09-14 | Binauric SE | Speech signal encoding/decoding method and apparatus |
WO2014165806A1 (en) | 2013-04-05 | 2014-10-09 | Dts Llc | Layered audio coding and transmission |
CN105103224B (zh) * | 2013-04-05 | 2019-08-02 | 杜比国际公司 | 用于交错波形编码的音频编码器和解码器 |
KR101739789B1 (ko) | 2013-04-05 | 2017-05-25 | 돌비 인터네셔널 에이비 | 오디오 인코더 및 디코더 |
MX358362B (es) * | 2013-06-21 | 2018-08-15 | Fraunhofer Ges Forschung | Decodificador de audio que tiene un modulo de extension de ancho de banda con un modulo de ajuste de energia. |
RU2665253C2 (ru) * | 2013-06-21 | 2018-08-28 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для улучшенного маскирования адаптивной таблицы кодирования при acelp-образном маскировании с использованием улучшенной оценки запаздывания основного тона |
FR3007563A1 (fr) * | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
EP3014290A4 (en) | 2013-06-27 | 2017-03-08 | The General Hospital Corporation | Systems and methods for tracking non-stationary spectral structure and dynamics in physiological data |
WO2014210527A1 (en) * | 2013-06-28 | 2014-12-31 | The General Hospital Corporation | System and method to infer brain state during burst suppression |
CN104282308B (zh) | 2013-07-04 | 2017-07-14 | 华为技术有限公司 | 频域包络的矢量量化方法和装置 |
FR3008533A1 (fr) * | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
EP2830056A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain |
JP6001814B1 (ja) | 2013-08-28 | 2016-10-05 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ハイブリッドの波形符号化およびパラメトリック符号化発話向上 |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
EP3043696B1 (en) | 2013-09-13 | 2022-11-02 | The General Hospital Corporation | Systems and methods for improved brain monitoring during general anesthesia and sedation |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
CN105761723B (zh) | 2013-09-26 | 2019-01-15 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
CN108172239B (zh) * | 2013-09-26 | 2021-01-12 | 华为技术有限公司 | 频带扩展的方法及装置 |
US9224402B2 (en) | 2013-09-30 | 2015-12-29 | International Business Machines Corporation | Wideband speech parameterization for high quality synthesis, transformation and quantization |
US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10083708B2 (en) * | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US9384746B2 (en) | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
KR102271852B1 (ko) | 2013-11-02 | 2021-07-01 | 삼성전자주식회사 | 광대역 신호 생성방법 및 장치와 이를 채용하는 기기 |
EP2871641A1 (en) * | 2013-11-12 | 2015-05-13 | Dialog Semiconductor B.V. | Enhancement of narrowband audio signals using a single sideband AM modulation |
CN105765655A (zh) | 2013-11-22 | 2016-07-13 | 高通股份有限公司 | 高频带译码中的选择性相位补偿 |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
CN103714822B (zh) * | 2013-12-27 | 2017-01-11 | 广州华多网络科技有限公司 | 基于silk编解码器的子带编解码方法及装置 |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
US9564141B2 (en) | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
JP6281336B2 (ja) * | 2014-03-12 | 2018-02-21 | 沖電気工業株式会社 | 音声復号化装置及びプログラム |
JP6035270B2 (ja) * | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
WO2015151451A1 (ja) * | 2014-03-31 | 2015-10-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法、復号方法、およびプログラム |
US9542955B2 (en) | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
CN105336336B (zh) * | 2014-06-12 | 2016-12-28 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
CN107424622B (zh) | 2014-06-24 | 2020-12-25 | 华为技术有限公司 | 音频编码方法和装置 |
US9984699B2 (en) * | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
US9583115B2 (en) * | 2014-06-26 | 2017-02-28 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
CN106486129B (zh) * | 2014-06-27 | 2019-10-25 | 华为技术有限公司 | 一种音频编码方法和装置 |
US9721584B2 (en) * | 2014-07-14 | 2017-08-01 | Intel IP Corporation | Wind noise reduction for audio reception |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
WO2016024853A1 (ko) * | 2014-08-15 | 2016-02-18 | 삼성전자 주식회사 | 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기 |
CN104217730B (zh) * | 2014-08-18 | 2017-07-21 | 大连理工大学 | 一种基于k‑svd的人工语音带宽扩展方法及装置 |
CN107112025A (zh) | 2014-09-12 | 2017-08-29 | 美商楼氏电子有限公司 | 用于恢复语音分量的系统和方法 |
TWI550945B (zh) * | 2014-12-22 | 2016-09-21 | 國立彰化師範大學 | 具有急遽過渡帶的複合濾波器之設計方法及其串聯式複合濾波器 |
US9595269B2 (en) * | 2015-01-19 | 2017-03-14 | Qualcomm Incorporated | Scaling for gain shape circuitry |
WO2016123560A1 (en) | 2015-01-30 | 2016-08-04 | Knowles Electronics, Llc | Contextual switching of microphones |
KR102125410B1 (ko) | 2015-02-26 | 2020-06-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 타깃 시간 도메인 포락선을 사용하여 처리된 오디오 신호를 얻도록 오디오 신호를 처리하기 위한 장치 및 방법 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) * | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
US9830921B2 (en) * | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
WO2017064264A1 (en) * | 2015-10-15 | 2017-04-20 | Huawei Technologies Co., Ltd. | Method and appratus for sinusoidal encoding and decoding |
NO20151400A1 (en) | 2015-10-15 | 2017-01-23 | St Tech As | A system for isolating an object |
EP4462677A3 (en) | 2016-02-17 | 2024-12-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
FR3049084B1 (fr) * | 2016-03-15 | 2022-11-11 | Fraunhofer Ges Forschung | Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code |
ES2808997T3 (es) * | 2016-04-12 | 2021-03-02 | Fraunhofer Ges Forschung | Codificador de audio para codificar una señal de audio, método para codificar una señal de audio y programa informático en consideración de una región espectral del pico detectada en una banda de frecuencia superior |
US10770088B2 (en) * | 2016-05-10 | 2020-09-08 | Immersion Networks, Inc. | Adaptive audio decoder system, method and article |
US10699725B2 (en) * | 2016-05-10 | 2020-06-30 | Immersion Networks, Inc. | Adaptive audio encoder system, method and article |
US20170330575A1 (en) * | 2016-05-10 | 2017-11-16 | Immersion Services LLC | Adaptive audio codec system, method and article |
CN109416913B (zh) * | 2016-05-10 | 2024-03-15 | 易默森服务有限责任公司 | 自适应音频编解码系统、方法、装置及介质 |
US10756755B2 (en) * | 2016-05-10 | 2020-08-25 | Immersion Networks, Inc. | Adaptive audio codec system, method and article |
US10264116B2 (en) * | 2016-11-02 | 2019-04-16 | Nokia Technologies Oy | Virtual duplex operation |
KR102507383B1 (ko) * | 2016-11-08 | 2023-03-08 | 한국전자통신연구원 | 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템 |
WO2018102402A1 (en) | 2016-11-29 | 2018-06-07 | The General Hospital Corporation | Systems and methods for analyzing electrophysiological data from patients undergoing medical treatments |
PT3555885T (pt) | 2016-12-16 | 2020-07-20 | Ericsson Telefon Ab L M | Métodos, codificador e descodificador para processar coeficientes de representação de envelope |
ES2950009T3 (es) * | 2017-01-06 | 2023-10-04 | Ericsson Telefon Ab L M | Métodos y aparatos para señalizar y determinar desplazamientos de señal de referencia |
KR102687184B1 (ko) * | 2017-02-10 | 2024-07-19 | 삼성전자주식회사 | Wfst 디코딩 시스템, 이를 포함하는 음성 인식 시스템 및 wfst 데이터 저장 방법 |
US10553222B2 (en) * | 2017-03-09 | 2020-02-04 | Qualcomm Incorporated | Inter-channel bandwidth extension spectral mapping and adjustment |
US10304468B2 (en) * | 2017-03-20 | 2019-05-28 | Qualcomm Incorporated | Target sample generation |
TWI807562B (zh) * | 2017-03-23 | 2023-07-01 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
US10791014B2 (en) * | 2017-10-27 | 2020-09-29 | Terawave, Llc | Receiver for high spectral efficiency data communications system using encoded sinusoidal waveforms |
US11876659B2 (en) | 2017-10-27 | 2024-01-16 | Terawave, Llc | Communication system using shape-shifted sinusoidal waveforms |
CN109729553B (zh) * | 2017-10-30 | 2021-12-28 | 成都鼎桥通信技术有限公司 | Lte集群通信系统的语音业务处理方法及设备 |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
US10460749B1 (en) * | 2018-06-28 | 2019-10-29 | Nuvoton Technology Corporation | Voice activity detection using vocal tract area information |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
WO2020171034A1 (ja) * | 2019-02-20 | 2020-08-27 | ヤマハ株式会社 | 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム |
CN110610713B (zh) * | 2019-08-28 | 2021-11-16 | 南京梧桐微电子科技有限公司 | 一种声码器余量谱幅度参数重构方法及系统 |
US11380343B2 (en) | 2019-09-12 | 2022-07-05 | Immersion Networks, Inc. | Systems and methods for processing high frequency audio signal |
TWI723545B (zh) | 2019-09-17 | 2021-04-01 | 宏碁股份有限公司 | 語音處理方法及其裝置 |
US11295751B2 (en) * | 2019-09-20 | 2022-04-05 | Tencent America LLC | Multi-band synchronized neural vocoder |
KR102201169B1 (ko) * | 2019-10-23 | 2021-01-11 | 성균관대학교 산학협력단 | 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법 |
CN114548442B (zh) * | 2022-02-25 | 2022-10-21 | 万表名匠(广州)科技有限公司 | 一种基于互联网技术的腕表维修管理系统 |
Family Cites Families (148)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US526468A (en) * | 1894-09-25 | Charles d | ||
US525147A (en) * | 1894-08-28 | Steam-cooker | ||
US596689A (en) * | 1898-01-04 | Hose holder or support | ||
US321993A (en) * | 1885-07-14 | Lantern | ||
US1126620A (en) * | 1911-01-30 | 1915-01-26 | Safety Car Heating & Lighting | Electric regulation. |
US1089258A (en) * | 1914-01-13 | 1914-03-03 | James Arnot Paterson | Facing or milling machine. |
US1300833A (en) * | 1918-12-12 | 1919-04-15 | Moline Mill Mfg Company | Idler-pulley structure. |
US1498873A (en) * | 1924-04-19 | 1924-06-24 | Bethlehem Steel Corp | Switch stand |
US2073913A (en) * | 1934-06-26 | 1937-03-16 | Wigan Edmund Ramsay | Means for gauging minute displacements |
US2086867A (en) * | 1936-06-19 | 1937-07-13 | Hall Lab Inc | Laundering composition and process |
US3044777A (en) * | 1959-10-19 | 1962-07-17 | Fibermold Corp | Bowling pin |
US3158693A (en) * | 1962-08-07 | 1964-11-24 | Bell Telephone Labor Inc | Speech interpolation communication system |
US3855416A (en) * | 1972-12-01 | 1974-12-17 | F Fuller | Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment |
US3855414A (en) | 1973-04-24 | 1974-12-17 | Anaconda Co | Cable armor clamp |
JPS59139099A (ja) | 1983-01-31 | 1984-08-09 | 株式会社東芝 | 音声区間検出装置 |
US4616659A (en) | 1985-05-06 | 1986-10-14 | At&T Bell Laboratories | Heart rate detection utilizing autoregressive analysis |
US4630305A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4747143A (en) | 1985-07-12 | 1988-05-24 | Westinghouse Electric Corp. | Speech enhancement system having dynamic gain control |
NL8503152A (nl) * | 1985-11-15 | 1987-06-01 | Optische Ind De Oude Delft Nv | Dosismeter voor ioniserende straling. |
US4862168A (en) | 1987-03-19 | 1989-08-29 | Beard Terry D | Audio digital/analog encoding and decoding |
US4805193A (en) * | 1987-06-04 | 1989-02-14 | Motorola, Inc. | Protection of energy information in sub-band coding |
US4852179A (en) | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
JP2707564B2 (ja) | 1987-12-14 | 1998-01-28 | 株式会社日立製作所 | 音声符号化方式 |
US5285520A (en) | 1988-03-02 | 1994-02-08 | Kokusai Denshin Denwa Kabushiki Kaisha | Predictive coding apparatus |
US5077798A (en) | 1988-09-28 | 1991-12-31 | Hitachi, Ltd. | Method and system for voice coding based on vector quantization |
US5086475A (en) | 1988-11-19 | 1992-02-04 | Sony Corporation | Apparatus for generating, recording or reproducing sound source data |
JPH02244100A (ja) | 1989-03-16 | 1990-09-28 | Ricoh Co Ltd | 駆動音源信号生成装置 |
CA2068883C (en) | 1990-09-19 | 2002-01-01 | Jozef Maria Karel Timmermans | Record carrier on which a main data file and a control file have been recorded, method of and device for recording the main data file and the control file, and device for reading the record carrier |
JP2779886B2 (ja) | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
JP3191457B2 (ja) * | 1992-10-31 | 2001-07-23 | ソニー株式会社 | 高能率符号化装置、ノイズスペクトル変更装置及び方法 |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
WO1995001680A1 (fr) | 1993-06-30 | 1995-01-12 | Sony Corporation | Dispositif de codage de signaux numeriques, son dispositif de decodage, et son support d'enregistrement |
WO1995010760A2 (en) | 1993-10-08 | 1995-04-20 | Comsat Corporation | Improved low bit rate vocoders and methods of operation therefor |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5487087A (en) | 1994-05-17 | 1996-01-23 | Texas Instruments Incorporated | Signal quantizer with reduced output fluctuation |
US5797118A (en) | 1994-08-09 | 1998-08-18 | Yamaha Corporation | Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns |
JP2770137B2 (ja) | 1994-09-22 | 1998-06-25 | 日本プレシジョン・サーキッツ株式会社 | 波形データ圧縮装置 |
US5699477A (en) | 1994-11-09 | 1997-12-16 | Texas Instruments Incorporated | Mixed excitation linear prediction with fractional pitch |
FI97182C (fi) * | 1994-12-05 | 1996-10-25 | Nokia Telecommunications Oy | Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin |
JP3365113B2 (ja) * | 1994-12-22 | 2003-01-08 | ソニー株式会社 | 音声レベル制御装置 |
JP3189614B2 (ja) | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JP2798003B2 (ja) * | 1995-05-09 | 1998-09-17 | 松下電器産業株式会社 | 音声帯域拡大装置および音声帯域拡大方法 |
JP2956548B2 (ja) | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
EP0732687B2 (en) | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
US5706395A (en) * | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
US6263307B1 (en) | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
JP3334419B2 (ja) * | 1995-04-20 | 2002-10-15 | ソニー株式会社 | ノイズ低減方法及びノイズ低減装置 |
US5699485A (en) | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
US5704003A (en) | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
US6097824A (en) | 1997-06-06 | 2000-08-01 | Audiologic, Incorporated | Continuous frequency dynamic range audio compressor |
DE69530204T2 (de) * | 1995-10-16 | 2004-03-18 | Agfa-Gevaert | Neue Klasse von Gelbfarbstoffen für photographische Materialien |
JP3707116B2 (ja) | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
US5737716A (en) | 1995-12-26 | 1998-04-07 | Motorola | Method and apparatus for encoding speech using neural network technology for speech classification |
JP3073919B2 (ja) * | 1995-12-30 | 2000-08-07 | 松下電器産業株式会社 | 同期装置 |
US5689615A (en) * | 1996-01-22 | 1997-11-18 | Rockwell International Corporation | Usage of voice activity detection for efficient coding of speech |
TW307960B (en) | 1996-02-15 | 1997-06-11 | Philips Electronics Nv | Reduced complexity signal transmission system |
DE69730779T2 (de) * | 1996-06-19 | 2005-02-10 | Texas Instruments Inc., Dallas | Verbesserungen bei oder in Bezug auf Sprachkodierung |
JP3246715B2 (ja) | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
CN1188833C (zh) | 1996-11-07 | 2005-02-09 | 松下电器产业株式会社 | 声源矢量生成装置及方法 |
US6009395A (en) | 1997-01-02 | 1999-12-28 | Texas Instruments Incorporated | Synthesizer and method using scaled excitation signal |
US6202046B1 (en) | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
US6041297A (en) * | 1997-03-10 | 2000-03-21 | At&T Corp | Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations |
US5890126A (en) | 1997-03-10 | 1999-03-30 | Euphonics, Incorporated | Audio data decompression and interpolation apparatus and method |
EP0878790A1 (en) | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6889185B1 (en) | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
US6122384A (en) * | 1997-09-02 | 2000-09-19 | Qualcomm Inc. | Noise suppression system and method |
US6029125A (en) | 1997-09-02 | 2000-02-22 | Telefonaktiebolaget L M Ericsson, (Publ) | Reducing sparseness in coded speech signals |
US6231516B1 (en) * | 1997-10-14 | 2001-05-15 | Vacusense, Inc. | Endoluminal implant with therapeutic and diagnostic capability |
JPH11205166A (ja) * | 1998-01-19 | 1999-07-30 | Mitsubishi Electric Corp | ノイズ検出装置 |
US6301556B1 (en) | 1998-03-04 | 2001-10-09 | Telefonaktiebolaget L M. Ericsson (Publ) | Reducing sparseness in coded speech signals |
US6385573B1 (en) * | 1998-08-24 | 2002-05-07 | Conexant Systems, Inc. | Adaptive tilt compensation for synthesized speech residual |
US6449590B1 (en) | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
JP4170458B2 (ja) | 1998-08-27 | 2008-10-22 | ローランド株式会社 | 波形信号の時間軸圧縮伸長装置 |
US6353808B1 (en) | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
KR20000047944A (ko) | 1998-12-11 | 2000-07-25 | 이데이 노부유끼 | 수신장치 및 방법과 통신장치 및 방법 |
JP4354561B2 (ja) | 1999-01-08 | 2009-10-28 | パナソニック株式会社 | オーディオ信号符号化装置及び復号化装置 |
US6223151B1 (en) | 1999-02-10 | 2001-04-24 | Telefon Aktie Bolaget Lm Ericsson | Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders |
WO2000070769A1 (fr) | 1999-05-14 | 2000-11-23 | Matsushita Electric Industrial Co., Ltd. | Procede et appareil d'elargissement de la bande d'un signal audio |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
JP4792613B2 (ja) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
US6556950B1 (en) | 1999-09-30 | 2003-04-29 | Rockwell Automation Technologies, Inc. | Diagnostic method and apparatus for use with enterprise control |
US6715125B1 (en) | 1999-10-18 | 2004-03-30 | Agere Systems Inc. | Source coding and transmission with time diversity |
JP5220254B2 (ja) | 1999-11-16 | 2013-06-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 広帯域オーディオ伝送システム |
CA2290037A1 (en) | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US7260523B2 (en) * | 1999-12-21 | 2007-08-21 | Texas Instruments Incorporated | Sub-band speech coding system |
AU2547201A (en) | 2000-01-11 | 2001-07-24 | Matsushita Electric Industrial Co., Ltd. | Multi-mode voice encoding device and decoding device |
US6757395B1 (en) * | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6732070B1 (en) * | 2000-02-16 | 2004-05-04 | Nokia Mobile Phones, Ltd. | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching |
JP3681105B2 (ja) | 2000-02-24 | 2005-08-10 | アルパイン株式会社 | データ処理方式 |
FI119576B (fi) * | 2000-03-07 | 2008-12-31 | Nokia Corp | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin |
US6523003B1 (en) | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
ATE265732T1 (de) | 2000-05-22 | 2004-05-15 | Texas Instruments Inc | Vorrichtung und verfahren zur breitbandcodierung von sprachsignalen |
US7330814B2 (en) | 2000-05-22 | 2008-02-12 | Texas Instruments Incorporated | Wideband speech coding with modulated noise highband excitation system and method |
US7136810B2 (en) | 2000-05-22 | 2006-11-14 | Texas Instruments Incorporated | Wideband speech coding system and method |
JP2002055699A (ja) * | 2000-08-10 | 2002-02-20 | Mitsubishi Electric Corp | 音声符号化装置および音声符号化方法 |
WO2002017318A1 (en) | 2000-08-25 | 2002-02-28 | Koninklijke Philips Electronics N.V. | Method and apparatus for reducing the word length of a digital input signal and method and apparatus for recovering the digital input signal |
US6515889B1 (en) * | 2000-08-31 | 2003-02-04 | Micron Technology, Inc. | Junction-isolated depletion mode ferroelectric memory |
US7386444B2 (en) * | 2000-09-22 | 2008-06-10 | Texas Instruments Incorporated | Hybrid speech coding and system |
US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
JP2002202799A (ja) | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
JP3558031B2 (ja) | 2000-11-06 | 2004-08-25 | 日本電気株式会社 | 音声復号化装置 |
KR100865860B1 (ko) * | 2000-11-09 | 2008-10-29 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 보다 높은 지각의 품질을 위한 전화 음성의 광대역 확장 |
SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
CA2733453C (en) | 2000-11-30 | 2014-10-14 | Panasonic Corporation | Lpc vector quantization apparatus |
GB0031461D0 (en) | 2000-12-22 | 2001-02-07 | Thales Defence Ltd | Communication sets |
US20040204935A1 (en) | 2001-02-21 | 2004-10-14 | Krishnasamy Anandakumar | Adaptive voice playout in VOP |
JP2002268698A (ja) | 2001-03-08 | 2002-09-20 | Nec Corp | 音声認識装置と標準パターン作成装置及び方法並びにプログラム |
US20030028386A1 (en) | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
WO2002093561A1 (de) | 2001-05-11 | 2002-11-21 | Siemens Aktiengesellschaft | Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals |
WO2003003350A1 (en) | 2001-06-28 | 2003-01-09 | Koninklijke Philips Electronics N.V. | Wideband signal transmission system |
US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
JP2003036097A (ja) * | 2001-07-25 | 2003-02-07 | Sony Corp | 情報検出装置及び方法、並びに情報検索装置及び方法 |
TW525147B (en) | 2001-09-28 | 2003-03-21 | Inventec Besta Co Ltd | Method of obtaining and decoding basic cycle of voice |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US6988066B2 (en) * | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
TW526468B (en) | 2001-10-19 | 2003-04-01 | Chunghwa Telecom Co Ltd | System and method for eliminating background noise of voice signal |
JP4245288B2 (ja) * | 2001-11-13 | 2009-03-25 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
WO2003044777A1 (en) * | 2001-11-23 | 2003-05-30 | Koninklijke Philips Electronics N.V. | Audio signal bandwidth extension |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US6751587B2 (en) | 2002-01-04 | 2004-06-15 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
JP4290917B2 (ja) | 2002-02-08 | 2009-07-08 | 株式会社エヌ・ティ・ティ・ドコモ | 復号装置、符号化装置、復号方法、及び、符号化方法 |
JP3826813B2 (ja) | 2002-02-18 | 2006-09-27 | ソニー株式会社 | ディジタル信号処理装置及びディジタル信号処理方法 |
JP3646939B1 (ja) | 2002-09-19 | 2005-05-11 | 松下電器産業株式会社 | オーディオ復号装置およびオーディオ復号方法 |
JP3756864B2 (ja) | 2002-09-30 | 2006-03-15 | 株式会社東芝 | 音声合成方法と装置及び音声合成プログラム |
KR100841096B1 (ko) | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
US20040098255A1 (en) | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
US7242763B2 (en) * | 2002-11-26 | 2007-07-10 | Lucent Technologies Inc. | Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems |
CA2415105A1 (en) | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
KR100480341B1 (ko) * | 2003-03-13 | 2005-03-31 | 한국전자통신연구원 | 광대역 저전송률 음성 신호의 부호화기 |
EP1618557B1 (en) | 2003-05-01 | 2007-07-25 | Nokia Corporation | Method and device for gain quantization in variable bit rate wideband speech coding |
JP4212591B2 (ja) | 2003-06-30 | 2009-01-21 | 富士通株式会社 | オーディオ符号化装置 |
US20050004793A1 (en) | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
FI118550B (fi) * | 2003-07-14 | 2007-12-14 | Nokia Corp | Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä |
US7428490B2 (en) * | 2003-09-30 | 2008-09-23 | Intel Corporation | Method for spectral subtraction in speech enhancement |
US7689579B2 (en) * | 2003-12-03 | 2010-03-30 | Siemens Aktiengesellschaft | Tag modeling within a decision, support, and reporting environment |
KR100587953B1 (ko) * | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
JP4259401B2 (ja) | 2004-06-02 | 2009-04-30 | カシオ計算機株式会社 | 音声処理装置及び音声符号化方法 |
US8000967B2 (en) * | 2005-03-09 | 2011-08-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity code excited linear prediction encoding |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
RU2381572C2 (ru) | 2005-04-01 | 2010-02-10 | Квэлкомм Инкорпорейтед | Системы, способы и устройство широкополосного речевого кодирования |
CN101185127B (zh) * | 2005-04-01 | 2014-04-23 | 高通股份有限公司 | 用于编码和解码语音信号的高频带部分的方法和设备 |
WO2006116025A1 (en) | 2005-04-22 | 2006-11-02 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor smoothing |
-
2006
- 2006-04-03 RU RU2007140382/09A patent/RU2381572C2/ru active
- 2006-04-03 AT AT06740351T patent/ATE485582T1/de not_active IP Right Cessation
- 2006-04-03 SG SG201004744-7A patent/SG163556A1/en unknown
- 2006-04-03 JP JP2008504474A patent/JP5203929B2/ja active Active
- 2006-04-03 JP JP2008504479A patent/JP5203930B2/ja active Active
- 2006-04-03 BR BRPI0608305-6A patent/BRPI0608305B1/pt active IP Right Grant
- 2006-04-03 EP EP06740355A patent/EP1869673B1/en active Active
- 2006-04-03 KR KR1020077025447A patent/KR101019940B1/ko active IP Right Grant
- 2006-04-03 MX MX2007012189A patent/MX2007012189A/es active IP Right Grant
- 2006-04-03 PL PL06740357T patent/PL1866915T3/pl unknown
- 2006-04-03 AU AU2006232360A patent/AU2006232360B2/en active Active
- 2006-04-03 BR BRPI0608270-0A patent/BRPI0608270A2/pt not_active Application Discontinuation
- 2006-04-03 NZ NZ562186A patent/NZ562186A/xx not_active IP Right Cessation
- 2006-04-03 CA CA2603231A patent/CA2603231C/en active Active
- 2006-04-03 CN CN201110326747.2A patent/CN102411935B/zh active Active
- 2006-04-03 PL PL06740355T patent/PL1869673T3/pl unknown
- 2006-04-03 ES ES06784345T patent/ES2391292T3/es active Active
- 2006-04-03 WO PCT/US2006/012228 patent/WO2006107834A1/en active Application Filing
- 2006-04-03 WO PCT/US2006/012234 patent/WO2006130221A1/en active Application Filing
- 2006-04-03 RU RU2007140429/09A patent/RU2387025C2/ru active
- 2006-04-03 AU AU2006232361A patent/AU2006232361B2/en active Active
- 2006-04-03 US US11/397,432 patent/US8364494B2/en active Active
- 2006-04-03 CA CA2602804A patent/CA2602804C/en active Active
- 2006-04-03 RU RU2007140383/09A patent/RU2402826C2/ru active
- 2006-04-03 TW TW095111852A patent/TWI324335B/zh active
- 2006-04-03 KR KR1020077025255A patent/KR100956624B1/ko active IP Right Grant
- 2006-04-03 US US11/397,370 patent/US8078474B2/en active Active
- 2006-04-03 RU RU2007140381/09A patent/RU2386179C2/ru active
- 2006-04-03 EP EP06740356A patent/EP1864283B1/en active Active
- 2006-04-03 EP EP06740351A patent/EP1869670B1/en active Active
- 2006-04-03 AU AU2006232362A patent/AU2006232362B2/en active Active
- 2006-04-03 PT PT67403584T patent/PT1864282T/pt unknown
- 2006-04-03 NZ NZ562183A patent/NZ562183A/en unknown
- 2006-04-03 WO PCT/US2006/012227 patent/WO2006107833A1/en active Application Filing
- 2006-04-03 CA CA2603219A patent/CA2603219C/en active Active
- 2006-04-03 TW TW095111794A patent/TWI320923B/zh active
- 2006-04-03 MX MX2007012191A patent/MX2007012191A/es active IP Right Grant
- 2006-04-03 EP EP06740352A patent/EP1864281A1/en not_active Withdrawn
- 2006-04-03 NZ NZ562182A patent/NZ562182A/xx not_active IP Right Cessation
- 2006-04-03 CA CA2603255A patent/CA2603255C/en active Active
- 2006-04-03 DE DE602006018884T patent/DE602006018884D1/de active Active
- 2006-04-03 JP JP2008504477A patent/JP5129116B2/ja active Active
- 2006-04-03 EP EP06740357A patent/EP1866915B1/en active Active
- 2006-04-03 US US11/397,871 patent/US8140324B2/en active Active
- 2006-04-03 US US11/397,794 patent/US8484036B2/en active Active
- 2006-04-03 MX MX2007012187A patent/MX2007012187A/es active IP Right Grant
- 2006-04-03 AU AU2006232357A patent/AU2006232357C1/en active Active
- 2006-04-03 AU AU2006252957A patent/AU2006252957B2/en active Active
- 2006-04-03 WO PCT/US2006/012233 patent/WO2006107839A2/en active Application Filing
- 2006-04-03 EP EP06740358.4A patent/EP1864282B1/en active Active
- 2006-04-03 RU RU2009131435/08A patent/RU2491659C2/ru active
- 2006-04-03 MX MX2007012181A patent/MX2007012181A/es active IP Right Grant
- 2006-04-03 TW TW095111819A patent/TWI321315B/zh active
- 2006-04-03 JP JP2008504475A patent/JP5129115B2/ja active Active
- 2006-04-03 BR BRPI0607690A patent/BRPI0607690A8/pt not_active Application Discontinuation
- 2006-04-03 DE DE602006012637T patent/DE602006012637D1/de active Active
- 2006-04-03 CA CA2603187A patent/CA2603187C/en active Active
- 2006-04-03 US US11/397,433 patent/US8244526B2/en active Active
- 2006-04-03 CA CA2602806A patent/CA2602806C/en active Active
- 2006-04-03 MX MX2007012185A patent/MX2007012185A/es active IP Right Grant
- 2006-04-03 KR KR1020077025421A patent/KR100956524B1/ko active IP Right Grant
- 2006-04-03 BR BRPI0608269A patent/BRPI0608269B8/pt active IP Right Grant
- 2006-04-03 PT PT06784345T patent/PT1864101E/pt unknown
- 2006-04-03 TW TW095111800A patent/TWI321777B/zh active
- 2006-04-03 ES ES06740354T patent/ES2340608T3/es active Active
- 2006-04-03 KR KR1020077025293A patent/KR100982638B1/ko active IP Right Grant
- 2006-04-03 CA CA2603246A patent/CA2603246C/en active Active
- 2006-04-03 BR BRPI0607646-7A patent/BRPI0607646B1/pt active IP Right Grant
- 2006-04-03 MX MX2007012183A patent/MX2007012183A/es active IP Right Grant
- 2006-04-03 TW TW095111851A patent/TWI319565B/zh active
- 2006-04-03 MX MX2007012182A patent/MX2007012182A/es active IP Right Grant
- 2006-04-03 AT AT06740357T patent/ATE492016T1/de not_active IP Right Cessation
- 2006-04-03 WO PCT/US2006/012235 patent/WO2006107840A1/en active Application Filing
- 2006-04-03 JP JP2008504480A patent/JP5129118B2/ja active Active
- 2006-04-03 WO PCT/US2006/012232 patent/WO2006107838A1/en active Application Filing
- 2006-04-03 KR KR1020077025400A patent/KR100956877B1/ko active IP Right Grant
- 2006-04-03 AT AT06740354T patent/ATE459958T1/de not_active IP Right Cessation
- 2006-04-03 MX MX2007012184A patent/MX2007012184A/es active IP Right Grant
- 2006-04-03 ES ES06740358.4T patent/ES2636443T3/es active Active
- 2006-04-03 RU RU2007140394/09A patent/RU2413191C2/ru active
- 2006-04-03 DE DE602006017673T patent/DE602006017673D1/de active Active
- 2006-04-03 SI SI200632188T patent/SI1864282T1/sl unknown
- 2006-04-03 EP EP06784345A patent/EP1864101B1/en active Active
- 2006-04-03 NZ NZ562188A patent/NZ562188A/en not_active IP Right Cessation
- 2006-04-03 JP JP2008504481A patent/JP4955649B2/ja active Active
- 2006-04-03 WO PCT/US2006/012230 patent/WO2006107836A1/en active Application Filing
- 2006-04-03 NZ NZ562190A patent/NZ562190A/en not_active IP Right Cessation
- 2006-04-03 BR BRPI0609530-5A patent/BRPI0609530B1/pt active IP Right Grant
- 2006-04-03 AT AT06740355T patent/ATE482449T1/de not_active IP Right Cessation
- 2006-04-03 US US11/397,505 patent/US8332228B2/en active Active
- 2006-04-03 TW TW095111804A patent/TWI321314B/zh active
- 2006-04-03 NZ NZ562185A patent/NZ562185A/en not_active IP Right Cessation
- 2006-04-03 JP JP2008504478A patent/JP5129117B2/ja active Active
- 2006-04-03 SG SG201002303-4A patent/SG161224A1/en unknown
- 2006-04-03 KR KR1020077025290A patent/KR100956876B1/ko active IP Right Grant
- 2006-04-03 CA CA2603229A patent/CA2603229C/en active Active
- 2006-04-03 RU RU2007140426/09A patent/RU2402827C2/ru active
- 2006-04-03 EP EP06740354A patent/EP1866914B1/en active Active
- 2006-04-03 SG SG201002300-0A patent/SG161223A1/en unknown
- 2006-04-03 PL PL06784345T patent/PL1864101T3/pl unknown
- 2006-04-03 TW TW095111797A patent/TWI316225B/zh active
- 2006-04-03 US US11/397,870 patent/US8260611B2/en active Active
- 2006-04-03 DE DE602006017050T patent/DE602006017050D1/de active Active
- 2006-04-03 TW TW095111814A patent/TWI330828B/zh active
- 2006-04-03 BR BRPI0607691A patent/BRPI0607691B1/pt active IP Right Grant
- 2006-04-03 AU AU2006232364A patent/AU2006232364B2/en active Active
- 2006-04-03 BR BRPI0608306-4A patent/BRPI0608306A2/pt not_active Application Discontinuation
- 2006-04-03 US US11/397,872 patent/US8069040B2/en active Active
- 2006-04-03 RU RU2007140365/09A patent/RU2376657C2/ru active
- 2006-04-03 WO PCT/US2006/012231 patent/WO2006107837A1/en active Application Filing
- 2006-04-03 KR KR1020077025432A patent/KR100956525B1/ko active IP Right Grant
- 2006-04-03 AU AU2006232358A patent/AU2006232358B2/en not_active Expired - Fee Related
- 2006-04-03 PL PL06740358T patent/PL1864282T3/pl unknown
- 2006-04-03 KR KR1020077025422A patent/KR100956523B1/ko active IP Right Grant
- 2006-04-03 AU AU2006232363A patent/AU2006232363B2/en active Active
- 2006-04-03 DK DK06784345.8T patent/DK1864101T3/da active
- 2006-04-03 SG SG201004741-3A patent/SG163555A1/en unknown
- 2006-04-03 RU RU2007140406/09A patent/RU2390856C2/ru active
- 2006-04-03 JP JP2008504482A patent/JP5161069B2/ja active Active
- 2006-04-03 DK DK06740358.4T patent/DK1864282T3/en active
-
2007
- 2007-10-07 IL IL186439A patent/IL186439A0/en unknown
- 2007-10-07 IL IL186441A patent/IL186441A0/en active IP Right Grant
- 2007-10-07 IL IL186443A patent/IL186443A/en active IP Right Grant
- 2007-10-07 IL IL186404A patent/IL186404A/en active IP Right Grant
- 2007-10-07 IL IL186436A patent/IL186436A0/en active IP Right Grant
- 2007-10-07 IL IL186442A patent/IL186442A/en active IP Right Grant
- 2007-10-07 IL IL186405A patent/IL186405A/en active IP Right Grant
- 2007-10-07 IL IL186438A patent/IL186438A/en active IP Right Grant
- 2007-10-31 NO NO20075503A patent/NO20075503L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075511A patent/NO20075511L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075514A patent/NO340434B1/no unknown
- 2007-10-31 NO NO20075510A patent/NO20075510L/no not_active Application Discontinuation
- 2007-10-31 NO NO20075513A patent/NO340428B1/no unknown
- 2007-10-31 NO NO20075515A patent/NO340566B1/no unknown
- 2007-10-31 NO NO20075512A patent/NO20075512L/no not_active Application Discontinuation
-
2008
- 2008-08-28 HK HK08109568.5A patent/HK1113848A1/xx unknown
- 2008-09-19 HK HK08110384.5A patent/HK1115023A1/xx unknown
- 2008-09-22 HK HK08110465.7A patent/HK1114901A1/xx unknown
- 2008-09-24 HK HK12110024.5A patent/HK1169509A1/xx unknown
- 2008-09-24 HK HK08110589.8A patent/HK1115024A1/xx unknown
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2575809C2 (ru) * | 2010-07-08 | 2016-02-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодер, использующий прямое подавление помех дискретизации |
RU2575389C2 (ru) * | 2011-03-04 | 2016-02-20 | Телефонактиеболагет Л М Эрикссон (Пабл) | Коррекция коэффициента усиления после квантования при кодировании аудио |
US9972325B2 (en) | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
RU2604425C2 (ru) * | 2013-02-15 | 2016-12-10 | Хуавэй Текнолоджиз Ко., Лтд. | Система и способ возбуждения смешанной кодовой книги для кодирования речи |
RU2633105C1 (ru) * | 2013-02-15 | 2017-10-11 | Хуавэй Текнолоджиз Ко., Лтд. | Система и способ возбуждения смешанной кодовой книги для кодирования речи |
US10354663B2 (en) | 2014-07-28 | 2019-07-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
RU2667376C2 (ru) * | 2014-07-28 | 2018-09-19 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ формирования расширенного сигнала с использованием заполнения независимым шумом |
US10529348B2 (en) | 2014-07-28 | 2020-01-07 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating an enhanced signal using independent noise-filling identified by an identification vector |
US10885924B2 (en) | 2014-07-28 | 2021-01-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
US11264042B2 (en) | 2014-07-28 | 2022-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling information which comprises energy information and is included in an input signal |
US11705145B2 (en) | 2014-07-28 | 2023-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
US11908484B2 (en) | 2014-07-28 | 2024-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling at random values and scaling thereupon |
US12205604B2 (en) | 2014-07-28 | 2025-01-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling identified by an identification vector |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2381572C2 (ru) | Системы, способы и устройство широкополосного речевого кодирования | |
KR100947421B1 (ko) | 이득 계수 평활화를 위한 시스템, 방법, 및 장치 |