UA129049C2 - Інтеграція методик реконструкції високих частот звуку - Google Patents
Інтеграція методик реконструкції високих частот звуку Download PDFInfo
- Publication number
- UA129049C2 UA129049C2 UAA202007393A UAA202007393A UA129049C2 UA 129049 C2 UA129049 C2 UA 129049C2 UA A202007393 A UAA202007393 A UA A202007393A UA A202007393 A UAA202007393 A UA A202007393A UA 129049 C2 UA129049 C2 UA 129049C2
- Authority
- UA
- Ukraine
- Prior art keywords
- audio
- metadata
- bitstream
- data
- frequency
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000010354 integration Effects 0.000 title description 2
- 230000003595 spectral effect Effects 0.000 claims abstract description 93
- 230000005236 sound signal Effects 0.000 claims abstract description 73
- 230000017105 transposition Effects 0.000 claims abstract description 46
- 238000001914 filtration Methods 0.000 claims abstract description 24
- 238000012805 post-processing Methods 0.000 claims abstract description 17
- 238000013519 translation Methods 0.000 claims abstract description 3
- 238000012545 processing Methods 0.000 claims description 97
- 238000003780 insertion Methods 0.000 claims description 40
- 230000037431 insertion Effects 0.000 claims description 38
- 239000000872 buffer Substances 0.000 claims description 28
- 230000015572 biosynthetic process Effects 0.000 claims description 21
- 238000003786 synthesis reaction Methods 0.000 claims description 21
- 238000007781 pre-processing Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 14
- 238000001228 spectrum Methods 0.000 claims description 14
- 238000012546 transfer Methods 0.000 claims description 11
- 230000001052 transient effect Effects 0.000 claims description 10
- 238000000926 separation method Methods 0.000 claims description 9
- 238000012952 Resampling Methods 0.000 claims description 5
- 241000254173 Coleoptera Species 0.000 claims 1
- 101100209990 Rattus norvegicus Slc18a2 gene Proteins 0.000 claims 1
- 206010000496 acne Diseases 0.000 claims 1
- 238000011084 recovery Methods 0.000 claims 1
- 239000000945 filler Substances 0.000 description 31
- 241000036569 Carp sprivivirus Species 0.000 description 29
- 238000010586 diagram Methods 0.000 description 12
- 238000009499 grossing Methods 0.000 description 10
- 238000005070 sampling Methods 0.000 description 10
- 230000004044 response Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000010363 phase shift Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 101100316808 Arabidopsis thaliana VHA-E1 gene Proteins 0.000 description 2
- 101150009898 VATE gene Proteins 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 241001506137 Rapa Species 0.000 description 1
- YASAKCUCGLMORW-UHFFFAOYSA-N Rosiglitazone Chemical compound C=1C=CC=NC=1N(C)CCOC(C=C1)=CC=C1CC1SC(=O)NC1=O YASAKCUCGLMORW-UHFFFAOYSA-N 0.000 description 1
- 101000717863 Sporidiobolus salmonicolor Aldehyde reductase 2 Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003116 impacting effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- DMJNNHOOLUXYBV-PQTSNVLCSA-N meropenem Chemical compound C=1([C@H](C)[C@@H]2[C@H](C(N2C=1C(O)=O)=O)[C@H](O)C)S[C@@H]1CN[C@H](C(=O)N(C)C)C1 DMJNNHOOLUXYBV-PQTSNVLCSA-N 0.000 description 1
- JFRJCQJVFMHZOO-QZHHGCDDSA-N n-(2-aminoethyl)-2-[4-[[2-[4-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]amino]phenyl]acetyl]amino]phenyl]acetamide Chemical compound C1=CC(CC(=O)NCCN)=CC=C1NC(=O)CC(C=C1)=CC=C1NC1=NC=NC2=C1N=CN2[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 JFRJCQJVFMHZOO-QZHHGCDDSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
Розкритий спосіб декодування кодованого звукового бітового потоку. Спосіб включає приймання кодованого звукового бітового потоку і декодування звукових даних для генерування декодованого звукового сигналу нижнього діапазону. Спосіб додатково включає вилучення метаданих реконструкції високих частот і фільтрацію декодованого звукового сигналу нижнього діапазону за допомогою блока фільтрів аналізу для генерування фільтрованого звукового сигналу нижнього діапазону. Спосіб також включає вилучення прапора, який вказує, чи необхідно виконувати або спектральний перенос, або гармонічну транспозицію на звукових даних, і відновлення частини, що стосується верхнього діапазону, звукового сигналу з використанням фільтрованого звукового сигналу нижнього діапазону і метаданих реконструкції високих частот згідно з прапором. Відновлення високих частот виконують як операцію постобробки із затримкою 3010 дискретних значень на звуковий канал.
Description
(57) Реферат:
Розкритий спосіб декодування кодованого звукового бітового потоку. Спосіб включає приймання кодованого звукового бітового потоку і декодування звукових даних для генерування декодованого звукового сигналу нижнього діапазону. Спосіб додатково включає вилучення метаданих реконструкції високих частот і фільтрацію декодованого звукового сигналу нижнього діапазону за допомогою блока фільтрів аналізу для генерування фільтрованого звукового сигналу нижнього діапазону. Спосіб також включає вилучення прапора, який вказує, чи необхідно виконувати або спектральний перенос, або гармонічну транспозицію на звукових даних, і відновлення частини, що стосується верхнього діапазону, звукового сигналу з використанням фільтрованого звукового сигналу нижнього діапазону і метаданих реконструкції високих частот згідно з прапором. Відновлення високих частот виконують як операцію постобробки із затримкою 3010 дискретних значень на звуковий канал. ди ід Ну лк ажхалк зх дно лам пл плн ок ол дк ло пам лялосалня лак ких пах алко сяк ям аж р (Деколер) - В шк
Е т-во пе т КИ З встлвнйо пеотттттткнея І Пристрій гетех і
Звуковни : ГЕ Іійдонстема ' о ер Буйері--е Видалення | сві З вхід : ї З дненкякиктнктя | формату- Де УВИННЯ З з-д | вання стаз і і 5 кА: - З Ко КУ х : ; Коен «у по р і сілнллеткто В лю А пллггткн З ; кертуважна ЗВ і пк хе хе дю Шо ЖЖ то пк т тк пою м хо зо. ях вх жк ох оті ох хх яко ло, жо)
Фіг. 5
Перехресне посилання на споріднені заявки
Дана заявка заявляє пріоритет європейської заявки на патент ЕР1І8169156.9, поданої 25 квітня 2018 р., яка шляхом посилання включена в даний опис.
Галузь техніки
Варіанти здійснення даного винаходу стосуються обробки звукових сигналів, і зокрема кодування, декодування або транскодування звукових бітових потоків із даними керування, які задають необхідність виконання на звукових даних або базової форми реконструкції високих частот ("НЕК"), або покращеної форми НЕК.
Передумови винаходу
Звичайний звуковий бітовий потік містить як звукові дані (наприклад, кодовані звукові дані), що характеризують один або більше каналів звукового вмісту, так і метадані, що вказують щонайменше одну характеристику звукових даних або звукового вмісту. Одним добре відомим форматом для генерування кодованого звукового бітового потоку є формат МРЕО-4 "Перспективне звукове кодування" (ААС), описаний у стандарті МРЕС ІЗОЛЕС 14496-3:2009. У стандарті МРЕС-4 АДАС означає "перспективне звукове кодування" а НЕ-ААС означає "високоефективне перспективне звукове кодування".
Стандарт МРЕС-4 АДС визначає декілька звукових профілів, які визначають, які об'єкти й інструменти кодування знаходяться у сумісному кодері або декодері. Три з цих звукових профілів являються собою (1) профіль ААС, (2) профіль НЕ-ААС і (3) профіль НЕ-ААС мг.
Профіль ААС містить тип об'єкта ААС низької складності (або "ААС-Ї С"). Об'єкт ААС-Ї С являє собою аналог профілю МРЕС-2 ААС низької складності з деякими вдосконаленнями і не містить ні тип об'єкта копіювання спектральної смуги (ЗВК"), ні тип об'єкта параметричного стерео (РБ"). Профіль НЕ-ААС являє собою надмножину профілю ААС і додатково містить тип об'єкта
ЗВЕ. Профіль НЕ-ААС у2 являє собою надмножину профілю НЕ-ААС і додатково містить тип об'єкта Р5.
Тип об'єкта 5ВК містить інструмент копіювання спектральної смуги, який являє собою важливий інструмент кодування реконструкції високих частот ("НЕК"), який значно підвищує ефективність стиснення кодеків осприйманих звукових сигналів. ЗВК реконструює високочастотні складові звукового сигналу на стороні приймача (наприклад, у декодері). Таким чином, від кодера вимагається тільки кодувати і передавати низькочастотні складові, що робить можливою набагато більш високу якість звуку при низьких швидкостях передачі даних. 5ВЕ базується на копіюванні послідовностей гармонік, раніше усічених із метою зменшення швидкості передачі даних, із доступного сигналу з обмеженою смугою пропускання і даних керування, отриманих із кодера. Співвідношення між тональними і шумоподібними складовими зберігається за допомогою адаптивної зворотної фільтрації, а також необов'язкового додавання шуму і синусоїд. У стандарті МРЕС-4 ААС інструмент ЗВК виконує спектральне вставляння (яке також називається "лінійним переносом" або "спектральним переносом"), у разі якого ряд послідовних піддіапазонів квадратурного дзеркального фільтра (ОМЕ) копіюють (або "вставляють") із переданої частини, що стосується нижнього діапазону, звукового сигналу в частину, що стосується верхнього діапазону, звукового сигналу, яка генерується в декодері.
Спектральне вставляння, або лінійній перенос, може не бути ідеальним для певних типів звуку, таких як музичний вміст із відносно низькими частотами розділення. Тому є необхідними методики для вдосконалення копіювання спектральної смуги.
Стислий опис варіантів здійснення винаходу
Перший клас варіантів здійснення стосується розкриття способу декодування кодованого звукового бітового потоку. Спосіб включає приймання кодованого звукового бітового потоку і декодування звукових даних для генерування декодованого звукового сигналу нижнього діапазону. Спосіб додатково включає вилучення метаданих реконструкції високих частот і фільтрацію декодованого звукового сигналу нижнього діапазону за допомогою блока фільтрів аналізу для генерування фільтрованого звукового сигналу нижнього діапазону. Спосіб додатково включає вилучення прапора, який вказує, чи необхідно виконувати або спектральний перенос, або гармонічну транспозицію на звукових даних, і відновлення частини, що стосується верхнього діапазону, звукового сигналу з використанням фільтрованого звукового сигналу нижнього діапазону і метаданих реконструкції високих частот згідно з прапором. Зрештою, спосіб включає об'єднання фільтрованого звукового сигналу нижнього діапазону і відновленої частини, що стосується верхнього діапазону, для формування широкосмугового звукового сигналу.
Другий клас варіантів здійснення стосується декодера звуку для декодування кодованого звукового бітового потоку. Декодер містить інтерфейс введення для приймання кодованого 60 звукового бітового потоку, де кодований звуковий бітовий потік містить звукові дані, які представляють частину, що стосується нижнього діапазону, звукового сигналу, й основний декодер для декодування звукових даних для генерування декодованого звукового сигналу нижнього діапазону. Декодер також містить демультиплексор для вилучення з кодованого звукового бітового потоку метаданих реконструкції високих частот, де метадані реконструкції високих частот містять робочі параметри для процесу реконструкції високих частот, який виконує лінійний перенос послідовної кількості піддіапазонів із частини, що стосується нижнього діапазону, звукового сигналу в частину, що стосується верхнього діапазону, звукового сигналу, і блок фільтрів аналізу для фільтрації декодованого звукового сигналу нижнього діапазону для генерування фільтрованого звукового сигналу нижнього діапазону. Декодер додатково містить демультиплексор для вилучення з кодованого звукового бітового потоку прапора, який вказує, чи необхідно виконувати або лінійний перенос, або гармонічну транспозицію на звукових даних, і пристрій відновлення високих частот для відновлення частини, що стосується верхнього діапазону, звукового сигналу з використанням фільтрованого звукового сигналу нижнього діапазону і метаданих реконструкції високих частот згідно з прапором. Зрештою, декодер містить блок синтезувальних фільтрів для об'єднання фільтрованого звукового сигналу нижнього діапазону і відновленої частини, що стосується верхнього діапазону, для формування широкосмугового звукового сигналу.
Інші класи варіантів здійснення стосуються кодування і транскодування звукових бітових потоків, які містять метадані, що ідентифікують необхідність виконання обробки покращеного копіювання спектральної смуги (езвкК).
Стислий опис графічних матеріалів
На фіг. 1 показана структурна схема одного варіанта здійснення системи, яка може бути пристосована для виконання одного варіанта здійснення способу відповідно до винаходу.
На фіг. 2 показана структурна схема кодера, який являє собою один варіант здійснення блока обробки звуку відповідно до винаходу.
На фіг. З показана структурна схема системи, яка містить декодер, який являє собою один варіант здійснення блока обробки звуку відповідно до винаходу, і необов'язково також з'єднаний із ним постпроцесор.
На фіг. 4 показана структурна схема декодера, який являє собою один варіант здійснення
Зо блока обробки звуку відповідно до винаходу.
На фіг. 5 показана структурна схема декодера, який являє собою інший варіант здійснення блока обробки звуку відповідно до винаходу.
На фіг. б показана структурна схема іншого варіанта здійснення блока обробки звуку відповідно до винаходу.
На фіг. 7 показана схема блока даних бітового потоку МРЕС-4 ДАС, у тому числі сегментів, на які він розділений.
Умовні позначки й термінологія
Усюди в даному документі, у тому числі формулі винаходу, вираження виконання операції "відносно" сигналу або даних (наприклад, фільтрація, масштабування, перетворення або застосування коефіцієнта підсилення до сигналів або даних) використовується в широкому значенні для позначення виконання операції безпосередньо відносно сигналу або даних, або відносно обробленої версії сигналу або даних (наприклад, відносно версії сигналу, який був підданий попередній фільтрації або попередній обробці перед виконанням операції в його відношенні).
Усюди в даному документі, у тому числі формулі винаходу, вираження "блок обробки звуку" або "звуковий процесор" використовуються в широкому значенні, для позначення системи, пристрою або апарата, пристосованих для обробки звукових даних. Приклади блоків обробки звуку включають, але без обмеження, кодери, транскодери, декодери, кодеки, системи попередньої обробки, системи постобробки і системи обробки бітового потоку (які іноді називаються "інструментами обробки бітового потоку"). Практично вся споживча електроніка, така як мобільні телефони, телевізори, ноутбуки і планшетні комп'ютери, містить блок обробки звуку або звуковий процесор.
Усюди в даному документі, у тому числі формулі винаходу, термін "з'єднує", або "з'єднаний", використовується в широкому значенні для позначення або безпосереднього, або непрямого з'єднання. Таким чином, якщо перший пристрій з'єднаний із другим пристроєм, дане з'єднання може бути здійснене за допомогою безпосереднього з'єднання або за допомогою непрямого з'єднання через інші пристрої або з'єднання. Більше того, компоненти, які вбудовані в інші компоненти або об'єднані з ними, також пов'язані один з одним.
Докладний опис варіантів здійснення винаходу бо Стандарт МРЕС-4 ААС передбачає, що кодований бітовий потік МРЕС-4 ААС містить метадані, які вказують кожний тип обробки реконструкції високих частот ("НЕРВ"), яку необхідно застосовувати (якщо який-небудь треба застосовувати) декодеру для декодування звукового вмісту бітового потоку, й/або які керують цією обробкою НЕК, й/або вказують щонайменше одну характеристику або параметр щонайменше одного інструмента НЕК, який необхідно застосовувати для декодування звукового вмісту бітового потоку. У даному документі вираження "метадані 5ВК" використовується для позначення метаданих, що стосуються типу, описаного або згаданого в стандарті МРЕС-4 ААС для використання при копіюванні спектральної смуги (ЗВЕ"). Спеціалістам у даній галузі техніки зрозуміло, що 5ВК являє собою форму НЕК.
ЗВЕК переважно використовують як двошвидкісну систему, в якій базовий кодек діє на половині початкової частоти дискретизації, тоді як 5ВК діє на початковій частоті дискретизації.
Кодер 5ВЕК діє паралельно з базовим основним кодеком, хоча і на більш високій частоті дискретизації. Хоча 5ВК являє собою, головним чином, прикінцеву обробку в декодері, для забезпечення найбільш точної реконструкції високих частот у декодері важливі параметри вилучаються в кодері. Кодер оцінює обвідну спектра діапазону ЗВК для часового і частотного діапазону/розділення, що підходить для характеристик сегментів поточного вхідного сигналу.
Обвідна спектра оцінюється за допомогою комплексного ОМЕ-аналізу і наступного обчислення енергії. Часове і частотне розділення обвідних спектра можна вибрати з більш високим ступенем свободи, щоб забезпечити найкраще підходяще частотно-часове розділення для даного вхідного сегмента. При оцінці обвідної необхідно враховувати, що перехідний сигнал, спершу розташований, головним чином, у високочастотній ділянці (наприклад, сигнал педальної тарілки), буде лише в невеликому ступені присутнім у генерованому ЗВК верхньому діапазоні до корекції обвідної, оскільки верхній діапазон у декодері базується на нижньому діапазоні, де перехідний сигнал набагато менше виражений у порівнянні з верхнім діапазоном. Даний аспект вводить різні вимоги для частотно-часового розділення даних обвідної спектра в порівнянні зі звичайною оцінкою обвідної спектра, яка використовується в алгоритмах кодування звуку.
Окрім обвідної спектра вилучається декілька додаткових параметрів, що представляють спектральні характеристики вхідного сигналу для різних часових і частотних ділянок. Оскільки кодер відповідним чином має доступ до початкового сигналу, а також до інформації про те, як блок 5ВК у декодері буде створювати верхній діапазон, за наявності конкретного набору параметрів керування, система може обробляти ситуації, в яких нижній діапазон становить строгий гармонічний ряд, а верхній діапазон, який необхідно відтворити, становить здебільшого випадкові складові сигналу, а також ситуації, в яких у початковому верхньому діапазоні є сильні тональні складові, які не мають аналогів у нижньому діапазоні, на якому базується верхній діапазон. Крім того, кодер 5ВЕ діє в щільному зв'язку з базовим основним кодеком для оцінки того, який частотний діапазон слід охоплювати за допомогою 5ВК у даний момент часу. Дані
ЗВК ефективно кодуються перед передачею з використанням ентропійного кодування, а також канальних залежностей даних керування, у випадку стереофонічних сигналів.
Алгоритми вилучення параметрів керування зазвичай необхідно ретельно підладжувати відносно базового кодеку при заданій бітовій швидкості і заданій частоті дискретизації. Це викликано тим, що більш низька бітова швидкість зазвичай передбачає більш широкий діапазон
ЗВ у порівнянні з високою бітовою швидкістю, а різні частоти дискретизації відповідають різним часовим розділенням кадрів ЗВ.
Декодер ЗВК зазвичай містить декілька різних частин. Він містить модуль декодування бітового потоку, модуль реконструкції високих частот (НЕК), модуль додаткових високочастотних складових і модуль коректора обвідної. Система основана на блоці комплекснозначних ОМЕ-фільтрів (для високоякісного ЗВ) або блоці дійснозначних ОМЕ- фільтрів (для ЗВК малої потужності). Варіанти здійснення даного винаходу можуть застосовуватися і до високоякісного 5ВК, і до ЗВК малої потужності. У модулі вилучення бітового потоку дані керування зчитують із бітового потоку і декодують. Перед зчитуванням даних обвідної з бітового потоку для поточного кадру отримують частотно-часову сітку. Базовий основний декодер декодує звуковий сигнал поточного кадру (хоча і з більш низькою частотою дискретизації) для отримання звукових дискретних значень у часовій ділянці. Отримуваний кадр звукових даних використовується модулем НЕК для реконструкції високих частот. Декодований сигнал нижнього діапазону потім піддають аналізу з використанням блока ОМЕ-фільтрів. Потім на дискретних значеннях піддіапазонів блока ОМЕ-фільтрів виконують реконструкцію високих частот і корекцію обвідної. Високі частоти реконструюють із нижнього діапазону гнучким чином на основі заданих параметрів керування. Крім того, для забезпечення належних спектральних характеристик заданої часової/частотної ділянки реконструйований верхній діапазон піддають 60 адаптивній фільтрації на основі каналів піддіапазонів згідно з даними керування.
Вищий рівень бітового потоку МРЕС-4 ААС являє собою послідовність блоків даних (елементи "там/ дайа БіосКк"), кожний із яких являє собою сегмент даних (який у даному документі називається "блоком"), який містить звукові дані (зазвичай для проміжку часу в 1024 або 960 дискретних значень), і пов'язану інформацію й/або інші дані. У даному документі термін "блок" використовується для позначення сегмента бітового потоку МРЕС-4 ААС, який містить звукові дані (і відповідні метадані, а також необов'язково інші пов'язані дані), які визначають або вказують один (але не більше одного) елемент "гам/ даїа Біоск".
Кожний блок бітового потоку МРЕС-4 ААС може містити деяку кількість синтаксичних елементів (кожний із яких також реалізований у бітовому потоці як сегмент даних). У стандарті
МРЕС-4 ААС визначено сім типів таких синтаксичних елементів. Кожний синтаксичний елемент ідентифікують за допомогою відрізного значення елемента даних "іа зуп ее". Приклади синтаксичних елементів включають "5іпдіе спаппеї! еІетепі()», "спаппе! раїг еїетепі()» і "Й еіетепі)». Елемент одиничного каналу 5іпаіе спаппе! еіетепі являє собою контейнер, який містить звукові дані одного звукового каналу (монофонічний звуковий сигнал). Елемент пари каналів сПпаппе! раїг еїептепі містить звукові дані двох звукових каналів (тобто стереофонічний звуковий сигнал).
Заповнювальний елемент й еіетепі являє собою контейнер інформації, який містить ідентифікатор (наприклад, значення відзначеного вище елемента "ій зуп еїе"), за яким йдуть дані, що називаються "заповнювальними даними". Заповнювальні елементи історично використовували для корекції миттєвої бітової швидкості бітових потоків, які підлягають передачі по каналу з постійною швидкістю. Завдяки додаванню відповідної кількості заповнювальних даних до кожного блока можна досягнути постійної швидкості передачі даних.
Згідно з варіантами здійснення даного винаходу заповнювальні дані можуть містити один або більше елементів корисних даних розширення, які розширяють тип даних (наприклад, метадані) і можуть бути передані в бітовому потоці. Декодер, який приймає бітові потоки із заповнювальними даними, що містять новий тип даних, може необов'язково бути використаний пристроєм, який приймає бітовий потік (наприклад, декодером), для розширення функціональних можливостей пристрою. Таким чином, як може бути зрозуміло спеціалісту в даній галузі техніки, заповнювальні елементи являють собою спеціальний тип структури даних і відрізняються від структур даних, які зазвичай використовуються для передачі звукових даних (наприклад, корисних звукових даних, які містять дані каналів).
У деяких варіантах здійснення даного винаходу ідентифікатор, який використовується для ідентифікації заповнювального елемента, може складатися з трибітного цілого числа без знака, в якого спочатку передають старший значущий біт ("піт5бБг"), що має значення 0 х 6. В одному блоці може існувати декілька екземплярів синтаксичного елемента одного типу (наприклад, декілька заповнювальних елементів).
Іншим стандартом кодування звукових бітових потоків є стандарт МРЕС "Уніфіковане кодування мови і звуку" (БАС) (І5ОЛЕС 23003-3:2012). У стандарті МРЕС О5БАС описано кодування і декодування звукового вмісту з використанням обробки копіювання спектральної смуги (у тому числі обробки ЗВК, як описано в стандарті МРЕС-4 ААС, а також інших покращених форм обробки копіювання спектральної смуги). У випадку даної обробки застосовують інструменти копіювання спектральної смуги (які іноді називаються в даному документі "інструментами покращеного ЗВК" або "інструментами еВ") із розширеної і покращеної версії набору інструментів ЗВК, описаних у стандарті МРЕС-4 ДАС. Таким чином, еЗзВК (визначене в стандарті ОЗАС) являє собою вдосконалення ЗВЕ (визначеного в стандарті
МРЕС-4 ААС).
У даному документі вираження "обробка покращеного 5ВЕК" (або "обробка езВК") використовується для позначення обробки копіювання спектральної смуги з використанням щонайменше одного інструмента еЗВК (наприклад, щонайменше одного інструмента езВК, описаного або згаданого в стандарті МРЕС ИО5БАС), який не описаний або не згаданий у стандарті МРЕС-4 ААС. Прикладами таких інструментів е5ВК є гармонічна транспозиція і попередня обробка, або "попереднє згладжування", ОМЕ-вставки.
Гармонічний транспозер цілочислового порядку Т відображає синусоїду з частотою 0 в синусоїду з частотою То з одночасним збереженням тривалості сигналу. Зазвичай для отримання кожної частини потрібного вихідного діапазону частот використовується в послідовності три порядки, Т-2, 3, 4, з використанням найменшого можливого порядку транспозиції. Якщо потрібне виведення вище четвертого порядку діапазону транспозиції, його можна отримати шляхом зсувів частоти. З метою доведення до мінімуму обчислювальної складності, коли можливо, для обробки створюють дискретизовані часові ділянки основної бо смуги, близькі до критичних.
Гармонічний транспозер може базуватися або на ОМЕ, або на ОЕТ. При використанні гармонічного транспозера на основі ОМЕ розширення смуги пропускання сигналу основного кодера в часовій ділянці повністю здійснюється в ОМЕ-ділянці із використанням конструкції модифікованого фазового вокодера, яка виконує проріджування, за яким іде розтягнення за часом для кожного ОМЕ-піддіапазону. Транспозицію із використанням декількох коефіцієнтів транспозиції (наприклад, 1-2, 3, 4) здійснюють на загальному ступені перетворення аналізу/синтезу ОМЕ. Оскільки гармонічний транспозер на основі ОМЕ не володіє адаптивною до сигналу передискретизацією в частотній ділянці, відповідний прапор у бітовому потоці (5зБгОмегзатріїпо Р Іад(|сн|») може бути проігнорований.
Для зниження складності при використанні гармонічного транспозера на основі ОЕТ транспозери з коефіцієнтами З і 4 (транспозери 3-го і 4-го порядків) переважно вбудовані в транспозер із коефіцієнтом 2 (транспозер 2-го порядку) за допомогою інтерполяції. Для кожного кадру (який відповідає дискретним значенням основного кодера согеСодегЕгатеї! епадій) номінальний "повний розмір" перетворення транспозера в першу чергу визначається в бітовому потоці прапором ("збгОмегзатріїпоРІадісєп|І») адаптивної до сигналу передискретизації в частотній ділянці.
Якщо зргРаїспіпдМоде--1, із вказівкою, що для генерування верхнього діапазону необхідно використовувати лінійну транспозицію, то може бути введений додатковий етап, щоб уникнути порушень безперервності в формі обвідної спектра високочастотного сигналу, який вводиться в наступний коректор обвідної. Це покращує роботу наступного ступеня корекції обвідної, що призводить до більшої стабільності сприйманого сигналу верхнього діапазону. Операція додаткової попередньої обробки є корисною для типів сигналів, у яких груба обвідна спектра сигналу нижнього діапазону, що використовується для реконструкції високих частот, проявляє великі варіації рівня. Однак значення елемента бітового потоку можна визначити в кодері шляхом застосування будь-якого типу класифікації, яка залежить від сигналу. Додаткову попередню обробку переважно активують за допомогою однобітного елемента бітового потоку, "р5 5Ббг ргергосеб5іпд". Якщо "ре 5Ббг ргергосеззіпд' встановлений на одиницю, додаткова обробка включена. Якщо "р5 5бг ргергосеззіпд" встановлена на нуль, додаткова попередня обробка відключена. У додатковій обробці переважно використовується крива попереднього посилення, яка використовується генератором високих частот для масштабування нижнього діапазону, Хіом, для кожної вставки. Наприклад, криву попереднього посилення можна обчислити за формулою: ргесСаїп (к) - догтевомко ловіспмвіоре(ю))і?о (у «Ке Ко де Ко - перший ОМЕ-піддіапазон у таблиці діапазонів головних частот, а Іюм'Епубіоре обчислюють із використанням функції, яка обчислює коефіцієнти найкращого підходящого полінома (у значенні найменших квадратів), такої як роїуй). Наприклад, рогуні(З,Ко,х. ом/рапа ом'ЕпмІом'ЕпуиЗіоре), може бути використана (з використанням полінома третього ступеня) і де юмЕпм(к)- 1009; оєкек питтТітебіоїв. ВАТЕ 4-6 де х Іом/бапа(к) - І0...Ко-1)Ї, питТітебіої - кількість часових проміжків обвідної 5ВЕ, які існують у рамках кадру, ВАТЕ - константа, яка вказує кількість дискретних значень ОМЕ- піддіапазонів на часовий проміжок (наприклад, 2), Фк - коефіцієнт фільтра лінійного передбачення (потенційно отримуваний за допомогою коваріаційного методу), і де
Кко-ї теапмгу - З-ксо МЕПМ(К)
Ко
Бітовий потік, згенерований відповідно до стандарту МРЕС О5АС (який іноді називається в даному документі "бітовим потоком БАС"), містить кодований звуковий вміст і зазвичай містить метадані, які вказують кожний тип обробки копіювання спектральної смуги, яку необхідно застосовувати декодеру для декодування звукового вмісту бітового потоку БАС, й/або метадані, які керують такою обробкою копіювання спектральної смуги, й/або які вказують щонайменше одну характеристику або параметр щонайменше одного інструмента 5ВА й/або е5ЗВЕВ, який необхідно застосовувати для декодування звукового вмісту бітового потоку ОБАС.
У даному документі вираження "метадані покращеного 5ВА" (або "метадані еЗВЕА") використовуються для позначення метаданих, які вказують кожний тип обробки копіювання спектральної смуги, яку необхідно застосовувати декодеру для декодування звукового вмісту кодованого звукового бітового потоку (наприклад, бітового потоку ОБАС), й/або які керують такою обробкою копіювання спектральної смуги, й/або які вказують щонайменше одну характеристику або параметр щонайменше одного інструмента 5ВА й/або ебВЕ, який необхідно застосовувати для декодування такого звукового вмісту, але який не описаний або не згаданий у стандарті МРЕС-4 ААС. Прикладом метаданих е5ВА є метадані (які вказують обробку копіювання спектральної смуги або які керують нею), які описані або згадані в стандарті
МРЕС ЗАС, але не в стандарті МРЕС-4 ААДС. Таким чином, метадані е5ВК у даному документі означають метадані, які не є метаданими 5ВЕ, і метадані 5ВК у даному документі означають метадані, які не є метаданими е5зВЕ.
Бітовий потік ОБАС може містити і метадані ЗВЕ, і метадані е5ВЕ. Більш конкретно, бітовий потік ОБАС може містити метадані еЗзВЕ, які керують виконанням обробки е5ВК декодером, і метадані 5ВК, які керують виконанням обробки ЗВК декодером. Згідно зі звичайними варіантами здійснення даного винаходу метадані еб5ВК (наприклад, конфігураційні дані, специфічні для ез5ВК) включені (відповідно до даного винаходу) в бітовий потік МРЕС-4 ААС (наприклад, у контейнер 5бг ехіепвзіоп/) у кінці корисних даних ЗВК).
Під час виконання обробки еб5ВК, в ході декодування кодованого бітового потоку з використанням набору інструментів езВК (який містить щонайменше один інструмент езВК), високочастотний діапазон звукового сигналу відновлюють декодером на основі копіювання послідовностей гармонік, які були усічені під час кодування. Така обробка е5ВК зазвичай коректує обвідну спектра згенерованого високочастотного діапазону, а також застосовує зворотну фільтрацію і додає шумові і синусоїдні складові для відтворення спектральних характеристик початкового звукового сигналу.
Згідно зі звичайними варіантами здійснення даного винаходу метадані е5вк включають (наприклад, включають невелику кількість бітів керування, які являють собою метадані е5ВЕ) в один або більше сегментів метаданих кодованого звукового бітового потоку (наприклад, бітового потоку МРЕС-4 ААС), який також містить кодовані звукові дані в інших сегментах (сегментах звукових даних). Зазвичай щонайменше один такий сегмент метаданих кожного блока бітового потоку являє собою (або містить) заповнювальний елемент (який містить ідентифікатор, який вказує початок заповнювального елемента), і метадані езВвк включають у заповнювальний елемент після цього ідентифікатора.
На фіг. 1 показана структурна схема наведеного як приклад ланцюжка обробки звуку
Зо (системи обробки звукових даних), у якому один або більше елементів системи можуть бути виконані згідно з одним варіантом здійснення даного винаходу. Система містить наступні елементи, з'єднані разом, як показано: кодер 1, підсистему 2 доставки, декодер З і блок 4 постобробки. У варіаціях показаної системи опускають один або більше елементів або включають додаткові блоки обробки звукових даних.
У деяких реалізаціях кодер 1 (який необов'язково містить блок попередньої обробки) виконаний із можливістю приймання як введення дискретних значень РОМ (у часовій ділянці), які містять звуковий вміст, і виведення кодованого звукового бітового потоку (з форматом, сумісним зі стандартом МРЕС-4 ДАС), який характеризує звуковий вміст. Дані бітового потоку, які характеризують звуковий вміст, іноді називають "звуковими даними" або "кодованими звуковими даними". Якщо кодер виконаний згідно зі звичайним варіантом здійснення даного винаходу, звуковий бітовий потік, який виводиться з кодера, містить метадані езВК (і зазвичай інші метадані), а також звукові дані.
Один або більше кодованих звукових бітових потоків, які виводяться з кодера 1, можуть бути передані в підсистему 2 доставки кодованого звуку. Підсистема 2 виконана з можливістю зберігання й/(або доставки кожного кодованого бітового потоку, який виводиться з кодера 1.
Кодований звуковий бітовий потік, який виводиться з кодера 1, може бути збережений у підсистемі 2 (наприклад, у формі диска ОМО або Віси гау), або переданий підсистемою 2 (яка може реалізовувати канал або мережу зв'язку), або може бути і збережений, і переданий підсистемою 2.
Декодер З виконаний із можливістю декодування кодованого звукового бітового потоку
МРЕС-4 ААС (який генерується кодером 1), який він приймає через підсистему 2. У деяких варіантах здійснення декодер З виконаний із можливістю вилучення метаданих езвВК із кожного блока бітового потоку і декодування бітового потоку (у тому числі за допомогою виконання обробки езВК з використанням вилучених метаданих е5ВК) для генерування декодованих звукових даних (наприклад, потоків декодованих звукових дискретних значень РОМ). У деяких варіантах здійснення декодер З виконаний із можливістю вилучення метаданих ЗВК із бітового потоку (однак з ігноруванням метаданих еб5ВК, включених у бітовий потік) і декодування бітового потоку (у тому числі за допомогою виконання обробки ЗВК із використанням вилучених метаданих ЗВЕ) для генерування декодованих звукових даних (наприклад, потоків декодованих 60 звукових дискретних значень РСМ). Зазвичай декодер З містить буфер, у якому зберігаються
(наприклад, енергонезалежно) сегменти кодованого звукового бітового потоку, прийнятого з підсистеми 2.
Блок 4 постобробки за фіг. 1 виконаний із можливістю приймання потоку декодованих звукових даних із декодера З (наприклад, декодованих звукових дискретних значень РОМ) і виконання постобробки відносно них. Блок постобробки також може бути виконаний із можливістю представлення підданого постобробці звукового вмісту (або декодованого звуку, прийнятого з декодера 3) для відтворення одним або більше динаміками.
На фіг. 2 показана структурна схема кодера (100), який являє собою один варіант здійснення блока обробки звуку відповідно до винаходу. Будь-який із компонентів або елементів кодера 100 може бути реалізований як один або більше процесів й/(або одна або більше схем (наприклад, АБІС, ЕРОСА або інших інтегральних схем), в апаратному забезпеченні, програмному забезпеченні або в поєднанні апаратного і програмного забезпечення. Кодер 100 містить кодер 105, ступінь 107 формувача швидкості передачі даних/пристрою форматування, ступінь 106 генерування метаданих і буферний запам'ятовувальний пристрій 109, з'єднані таким чином, як показано. Зазвичай кодер 100 також містить інші обробляючі елементи (не показані).
Кодер 100 виконаний із можливістю перетворення вхідного звукового бітового потоку в кодований вихідний бітовий потік МРЕС-4 ДАО.
Генератор 106 метаданих з'єднаний і виконаний із можливістю генерування (й/або пропускання на ступінь 107) метаданих (у тому числі метаданих е5ВЕА і метаданих 58ВБЕ) із метою включення ступеня 107 в кодований бітовий потік для виведення з кодера 100.
Кодер 105 з'єднаний і виконаний із можливістю кодування вхідних звукових даних (наприклад, шляхом виконання їхнього стиснення) і передачі отриманого в результаті кодованого звуку на ступінь 107 із метою включення в кодований бітовий потік для виведення зі ступеня 107.
Ступінь 107 виконаний із можливістю мультиплексування кодованого звуку із кодера 105 і метаданих (у тому числі метаданих езВК і метаданих 5ВК) із генератора 106 для генерування кодованого бітового потоку для виведення зі ступеня 107, переважно таким чином, що кодований бітовий потік має формат, який задається одним із варіантів здійснення даного винаходу.
Буферний запам'ятовувальний пристрій 109 виконаний із можливістю зберігання (наприклад, енергонезалежно) щонайменше одного блока кодованого звукового бітового потоку зі ступеня 107, і послідовність блоків кодованого звукового бітового потоку потім передається з буферного запам'ятовувального пристрою 109 як виведення з кодера 100 в систему доставки.
На фіг. З показана структурна схема системи, яка містить декодер (200), що являє собою один варіант здійснення блока обробки звуку відповідно до винаходу, і необов'язково також з'єднаний із ним постпроцесор (300). Будь-який із компонентів, або елементів, декодера 200 і постпроцесора 300 може бути реалізований як один або більше процесів й/або одна або більше схем (наприклад, АБІС, ЕРСА або інших інтегральних схем), в апаратному забезпеченні, програмному забезпеченні або в поєднанні апаратного і програмного забезпечення. Декодер 200 містить буферний запам'ятовувальний пристрій 201, пристрій 205 видалення форматування (синтаксичний аналізатор) корисних даних бітового потоку, підсистему 202 декодування звуку (яка іноді називається "основним" ступенем декодування або "основною" підсистемою декодування), ступінь 203 обробки еЗзВК і ступінь 204 генерування бітів керування, з'єднані таким чином, як показано. Зазвичай декодер 200 також містить інші обробляючі елементи (не показані).
Буферний запам'ятовувальний пристрій (буфер) 201 зберігає (наприклад, енергонезалежно) щонайменше один блок кодованого звукового бітового потоку МРЕС-4 ААС, прийнятого декодером 200. У роботі декодера 200 послідовність блоків бітового потоку передається з буфера 201 в пристрій 205 видалення форматування.
У варіаціях варіанта здійснення за фіг. З (або варіанта здійснення за фіг. 4, який буде описаний), АРО, який не є декодером (наприклад, АРО 500 за фіг. б), містить буферний запам'ятовувальний пристрій (наприклад, буферний запам'ятовувальний пристрій, ідентичний із буфером 201), який зберігає (наприклад, енергонезалежно) щонайменше один блок кодованого звукового бітового потоку (наприклад, звукового бітового потоку МРЕС-4 ААС) такого же типу, як прийнятий буфером 201 за фіг. З або фіг. 4 (тобто кодованого звукового бітового потоку, який містить метадані езВК).
Також із посиланням на фіг. З пристрій 205 видалення форматування з'єднаний і виконаний із можливістю демультиплексування кожного блока бітового потоку для вилучення з нього метаданих ЗВК (у тому числі квантованих даних обвідної) і метаданих еЗВК (і зазвичай інших 60 метаданих) із метою передачі щонайменше метаданих езВК і метаданих 5ВК на ступінь 203 обробки е5ВЕ, а також зазвичай для передачі інших вилучених метаданих у підсистему 202 декодування (і необов'язково також у генератор 204 бітів керування). Пристрій 205 видалення форматування також з'єднаний і виконаний із можливістю вилучення звукових даних із кожного блока бітового потоку і передачі вилучених звукових даних у підсистему 202 декодування (ступінь декодування).
Система, показана на фіг. 3, необов'язково також містить постпроцесор 300. Постпроцесор 300 містить буферний запам'ятовувальний пристрій (буфер) 301 й інші обробляючі елементи (не показані), у тому числі щонайменше один обробляючий елемент, з'єднаний із буфером 301.
Буфер 301 зберігає (наприклад, енергонезалежно) щонайменше один блок (або кадр) декодованих звукових даних, прийнятих постпроцесором 300 із декодера 200. Обробляючі елементи постпроцесора 300 з'єднані і виконані з можливістю приймання й адаптивної обробки послідовності блоків (або кадрів) виведення декодованого звуку з буфера 301 із використанням виведення метаданих із підсистеми 202 декодування (й/(або пристрою 205 видалення форматування) й/або виведення бітів керування зі ступеня 204 декодера 200.
Підсистема 202 декодування звуку декодера 200 виконана з можливістю декодування звукових даних, вилучених синтаксичним аналізатором 205 (таке декодування можна назвати "основною" операцією декодування), для генерування декодованих звукових даних і передачі декодованих звукових даних на ступінь 203 обробки е5ВА. Декодування виконується в частотній ділянці і зазвичай включає зворотне квантування, за яким йде спектральна обробка.
Зазвичай останній ступінь обробки в підсистемі 202 застосовує перетворення із частотної ділянки в часову ділянку до декодованих звукових даних у частотній ділянці, таким чином виведення підсистеми являє собою декодовані звукові дані в часовій ділянці. Ступінь 203 виконаний із можливістю застосування інструментів ЗВК й інструментів езВК, вказаних метаданими ЗВК і еЗВК (вилученими синтаксичним аналізатором 205), до декодованих звукових даних (тобто виконання обробки 5ВК і е5ВК відносно виведення підсистеми 202 декодування з використанням метаданих ЗВК і е5зВК) для генерування повністю декодованих звукових даних, які виводяться (наприклад, у постпроцесор 300) із декодера 200. Зазвичай декодер 200 містить запам'ятовувальний пристрій (доступний для підсистеми 202 і ступеня 203), який зберігає звукові дані з видаленим форматуванням і метадані, виведені з пристрою 205 видалення форматування, і ступінь 203 виконаний із можливістю здійснення доступу до цих звукових даних і метаданих (у тому числі метаданих 5ВЕ і еЗзВЕК) в міру необхідності в ході обробки 5ВК і езВК. Обробку ЗВК і обробку еЗзВК на ступені 203 можна вважати постобробкою відносно виведення основної підсистеми 202 декодування. Необов'язково декодер 200 також містить підсистему прикінцевого підвищувального мікшування (яка може застосовувати інструменти параметричної стереофонії ("РБ") визначені в стандарті МРЕС-4 ААС, із використанням метаданих Р5, вилучених пристроєм 205 видалення форматування, й/або бітів керування, згенерованих у підсистемі 204), з'єднану і виконану з можливістю виконання підвищувального мікшування відносно виведення ступеня 203 для генерування повністю декодованого і підданого підвищувальному мікшуванню звуку, який виводиться з декодера 200.
Альтернативно постпроцесор 300 виконаний із можливістю виконання підвищувального мікшування відносно виведення декодера 200 (наприклад, із використанням метаданих Р5, вилучених пристроєм 205 видалення форматування, й/або бітів керування, згенерованих у підсистемі 204).
У відповідь на метадані, вилучені пристроєм 205 видалення форматування, генератор 204 бітів керування може генерувати дані керування, і дані керування можуть бути використані в декодері 200 (наприклад, у підсистемі прикінцевого підвищувального мікшування) й/або передані як виведення декодера 200 (наприклад, у постпроцесор 300 для використання при постобробці). У відповідь на метадані, вилучені із вхідного бітового потоку (і необов'язково також у відповідь на дані керування), ступінь 204 може генерувати (і передавати в постпроцесор 300) біти керування, які вказують, що декодовані звукові дані, які виводяться зі ступеня 203 обробки е5ВЕ, слід піддати постобробці конкретного типу. У деяких реалізаціях декодер 200 виконаний із можливістю передачі метаданих, вилучених пристроєм 205 видалення форматування із вхідного бітового потоку, в постпроцесор 300, і постпроцесор 300 виконаний із можливістю виконання постобробки відносно декодованих звукових даних, які виводяться з декодера 200, з використанням метаданих.
На фіг. 4 показана структурна схема блока обробки звуку (АРИ") (210), який являє собою інший варіант здійснення блока обробки звуку відповідно до винаходу. АРО 210 являє собою традиційний декодер, виконаний без можливості виконання обробки ебВК. Будь-який із компонентів або елементів АР 210 може бути реалізований як один або більше процесів й/або 60 одна або більше схем (наприклад, АЗІС, ЕРСА або інших інтегральних схем), в апаратному забезпеченні, програмному забезпеченні або в поєднанні апаратного і програмного забезпечення. АРО 210 містить буферний запам'ятовувальний пристрій 201, пристрій 215 видалення форматування (синтаксичний аналізатор) корисних даних бітового потоку, підсистему 202 декодування звуку (яка іноді називається "основним" ступенем декодування або "основною" підсистемою декодування) і ступінь 213 обробки 5ВК, з'єднані таким чином, як показано. Зазвичай АРи 210 також містить інші обробляючі елементи (не показані). АРО 210 може представляти, наприклад, кодер, декодер або транскодер звуку.
Елементи 201 ї 202 АР 210 є ідентичними з ідентично пронумерованими елементами декодера 200 (за фіг. 3), і їхній опис, наведений вище, повторюватися не буде. У роботі АРИО 210 послідовність блоків кодованого звукового бітового потоку (бітового потоку МРЕС-4 ААС), прийнята АРИи 210, передається з буфера 201 в пристрій 215 видалення форматування.
Пристрій 215 видалення форматування з'єднаний і виконаний із можливістю демультиплексування кожного блока бітового потоку з метою вилучення з нього метаданих 5ВК (у тому числі квантованих даних обвідної) і зазвичай інших метаданих, але з ігноруванням метаданих езВК, які можуть бути включені в бітовий потік відповідно до будь-якого з варіантів здійснення даного винаходу. Пристрій 215 видалення форматування виконаний із можливістю передачі щонайменше метаданих 5ВК на ступінь 213 обробки ЗВК. Пристрій 215 видалення форматування також з'єднаний і виконаний із можливістю вилучення звукових даних із кожного блока бітового потоку і передачі вилучених звукових даних у підсистему 202 декодування (ступінь декодування).
Підсистема 202 декодування звуку декодера 200 виконана з можливістю декодування звукових даних, вилучених пристроєм 215 видалення форматування (таке декодування можна назвати "основною" операцією декодування), для генерування декодованих звукових даних і передачі декодованих звукових даних на ступінь 213 обробки ЗВК. Декодування виконується в частотній ділянці. Зазвичай останній ступінь обробки в підсистемі 202 застосовує перетворення із частотної ділянки в часову ділянку до декодованих звукових даних у частотній ділянці, таким чином виведення підсистеми являє собою декодовані звукові дані в часовій ділянці. Ступінь 213 виконана з можливістю застосування інструментів 5ВК (але не інструментів езВК), вказаних метаданими ЗВК (вилученими пристроєм 215 видалення форматування), до декодованих звукових даних (тобто виконання обробки ЗВК відносно виведення підсистеми 202 декодування з використанням метаданих ЗВЕК) для генерування повністю декодованих звукових даних, які виводяться (наприклад, у постпроцесор 300) із АРО 210. Зазвичай АРИО 210 містить запам'ятовувальний пристрій (доступний для підсистеми 202 і ступеня 213), який зберігає звукові дані з видаленим форматуванням і метадані, виведені з пристрою 215 видалення форматування, і ступінь 213 виконаний із можливістю здійснення доступу до звукових даних і метаданих (у тому числі метаданих 5ВЕ) в міру необхідності в ході обробки 5ВК. Обробку 5ВЕ на ступені 213 можна вважати постобробкою відносно виведення основної підсистеми 202 декодування. Необов'язково АРИ 210 також містить підсистему прикінцевого підвищувального мікшування (яка може застосовувати інструменти параметричної стереофонії ("Р5"), визначені в стандарті МРЕС-4 ДАС, із використанням метаданих Р5, вилучених пристроєм 215 видалення форматування), з'єднану і виконану з можливістю виконання підвищувального мікшування відносно виведення ступеня 213 для генерування повністю декодованого і підданого підвищувальному мікшуванню звуку, який виводиться з АРИ 210. Альтернативно постпроцесор виконаний із можливістю виконання підвищувального мікшування відносно виведення АРИиИ 210 (наприклад, із використанням метаданих Р5, вилучених пристроєм 215 видалення форматування, й/або бітів керування, згенерованих в АРИШ 210).
Різні реалізації кодера 100, декодера 200 і АРи 210 виконані з можливістю виконання різних варіантів здійснення способу відповідно до винаходу.
Згідно з деякими варіантами здійснення метадані е5ВА включені (наприклад, включена невелика кількість бітів керування, які являють собою метадані е5ВА) у кодований звуковий бітовий потік (наприклад, у бітовий потік МРЕС-4 ААС), таким чином, що традиційні декодери (які виконані без можливості здійснення синтаксичного аналізу метаданих е5ВА або використання будь-якого інструмента еЗВЕА, якого стосуються метадані еб5ВА) можуть ігнорувати метадані е5ВЕ, але все таки декодувати бітовий потік у тій мірі, яка є можливою без використання метаданих е5ВА або будь-якого інструмента е5ВВ, якого стосуються метадані е5ЗВЕ, зазвичай без яких-небудь значущих втрат у якості декодованого звуку. Однак декодери еЗВЕ, виконані з можливістю синтаксичного аналізу бітового потоку, з метою ідентифікації метаданих е5ВН, і використання щонайменше одного інструмента е5ВЕ у відповідь на метадані еЗВЕ, будуть отримувати вигоду від використання щонайменше одного такого інструмента 60 е5ВА. Тому варіанти здійснення даного винаходу надають засоби для ефективної передачі даних керування або метаданих покращеного копіювання спектральної смуги (еЗВА) із забезпеченням зворотної сумісності.
Зазвичай метадані е5ВЕА у бітовому потоці вказують (наприклад, вказують щонайменше одну їхню характеристику або параметр) один або більше з наступних інструментів е5ВА (які описані в стандарті МРЕС О5АС і які могли бути або могли не бути застосовані кодером під час генерування бітового потоку): - гармонічна транспозиція; і - додаткова попередня обробка (попереднє згладжування) ОМЕ вставки.
Наприклад, метадані еЗзВЕ, включені в бітовий потік, можуть вказувати значення параметрів (описаних у стандарті МРЕС ОБАС і даному винаході): збгРаїспіпдаМоаег|сні, зБгОмегзатріїпоніад|сні, 5бгРИСНІпВіпе|сп), 5бгРіїспІпВіпо|(спу і 65 5бг ргергосезвіпа.
У даному документі позначення "ХІ|сп|», де Х - деякий параметр, означає, що параметр стосується каналу ("сп") звукового вмісту кодованого бітового потоку, який підлягає декодуванню. Для простоти вираження (сп) іноді опускається і передбачається, що відповідний параметр стосується каналу звукового вмісту.
У даному документі позначення ХІспІ(епм|, де Х - деякий параметр, означає, що параметр стосується обвідної ("епи") 5ВЕК каналу ("сп") звукового вмісту кодованого бітового потоку, який підлягає декодуванню. Для простоти вираження Цепму/| і (сп) іноді опускаються і передбачається, що відповідний параметр стосується обвідної 5ВЕ каналу звукового вмісту.
Під час декодування кодованого бітового потоку роботою гармонічної транспозиції на ступені обробки е5ВЕК декодування (для кожного каналу, "сп", звукового вмісту, вказаного бітовим потоком) керують за допомогою наступних параметрів метаданих езвк: 5зБгРаїспіпаМеае|сні: зргОмегзатріїпоРІад(сні; збгРИСпІпВіпе РІад|спІ; і збгРіїспІпВіпе|сп|.
Значення "збгРаїспіпаМоде|сп|» вказує тип транспозера, який використовується в еЗзВЕ: 5БгРаїспіпомеае|сні - 1 вказує вставку шляхом лінійної транспозиції, як описано в розділі 4.6.18 стандарту МРЕС-4 ААС (при використанні або з високоякісним 5ВК, або з 5ВК малої потужності); 5бгРаїспіпамоае|сн| - 0 вказує на гармонічне вставляння ЗВЕ, як описано в розділі 7.5.3 або 7.5.4 стандарту МРЕС БАС.
Значення "збгОмегзатріїпоНРіІадісп|» вказує на використання в е5ВК адаптивної до сигналу передискретизації в частотній ділянці в поєднанні з гармонічним вставлянням 5ВК на основі
ОЕТ, як описано в розділі 7.5.3 стандарту МРЕС ИОЗАС. Цей прапор керує розміром перетворень ОЕТ, що використовуються в транспозері: 1 вказує, що адаптивна до сигналу передискретизація в частотній ділянці включена, як описано в розділі 7.5.3.1 стандарту МРЕО
БАС; 0 вказує, що адаптивна до сигналу передискретизація в частотній ділянці відключена, як описано в розділі 7.5.3.1 стандарту МРЕС О5АС.
Значення "зБгРІіЇсСпІпВіп5РІадісп|» керує інтерпретацією параметра 5бгРіїспіпВіпе(|сн): 17 вказує, що значення в 5бгРіїспіпВіпеІсСт| є дійсним і більше нуля; 0 вказує, що значення зБгРСНПІпВіпе|сСВ| встановлено на нуль.
Значення "зБгРіїспіпВіпо(сСп|» керує додаванням множників векторного добутку в гармонічному транспозері 5ВК. Значення 5бгРіїспіпВіп5|сп| є цілим числом у діапазоні (0,127| і представляє відстань, виміряну в елементах розділення за частотою, для ОЕТ з 1536 лініями, яке діє на частоту дискретизації основного кодера.
У випадку, коли бітовий потік МРЕС-4 ДАС характеризує пару каналів 5ВЕ, при цьому канали не з'єднані (а не єдиний канал 5ВК), бітовий потік характеризує два екземпляра вищеописаного синтаксису (для гармонічної або негармонічної транспозиції), по одному для кожного каналу збг спаппеї! раїг еіетеп).
Гармонічна транспозиція інструмента езвВкК зазвичай підвищує якість декодованих музикальних сигналів при відносно низьких частотах розділення. Негармонічна транспозиція (тобто традиційне спектральне вставляння) зазвичай покращує мовні сигнали. Таким чином, початковою точкою в прийнятті рішення щодо того, транспозиція якого типу є переважною для кодування конкретного звукового вмісту, є вибір способу транспозиції залежно від виявлення мови/музики, при цьому гармонічну транспозицію застосовують до музикального вмісту, а спектральне вставляння -- до мовного вмісту.
Роботою попереднього згладжування в ході обробки е5ВК керують за допомогою значення однобітного параметра метаданих е5зВК, відомого як "р5 5бг ргергосезвзіпд", у тому значенні, що попереднє згладжування або виконують, або не виконують, залежно від значення цього єдиного біта. При використанні алгоритму ОМЕ-вставки ЗВК, описаного в розділі 4.6.18.6.3 стандарту МРЕС-4 ДАС, етап попереднього згладжування може виконуватися (якщо вказано параметром "р5 5бг ргергосеззіпд") у спробі уникнути порушень безперервності форми обвідної бо спектра високочастотного сигналу, який вводиться в коректор обвідної (коректор обвідної виконує інший ступінь обробки е5ВК). Попереднє згладжування зазвичай покращує роботу наступного ступеня корекції обвідної що призводить до більшої стабільності сприйманого сигналу верхнього діапазону.
Очікується, що загальні вимоги до бітової швидкості для включення в бітовий потік МРЕС-4
ААС метаданих езВК, які вказують вищезгадані інструменти езВК (гармонічну транспозицію і попереднє згладжування), мають порядок декількох сотень бітів у секунду, оскільки відповідно до деяких варіантів здійснення даного винаходу передаються тільки диференційні дані керування, необхідні для виконання обробки езВК. Традиційні декодери можуть ігнорувати цю інформацію, оскільки вона включена із забезпеченням зворотної сумісності (як буде роз'яснено пізніше). Тому негативний вплив на бітову швидкість, пов'язаний із включенням метаданих езЗВК, є нехтовно малим, із багатьох причин, у тому числі наступних: - втрати бітової швидкості передачі даних (через включення метаданих еЗзВК) становлять дуже невелику долю загальної бітової швидкості, оскільки передаються тільки диференційні дані керування, необхідні для виконання обробки еЗзВК (і не виконується одночасна передача даних керування З5ВК); і - налаштування інформації керування, яка стосується 5ВК, зазвичай не залежить від деталей транспозиції. Приклади того, як дані керування в дійсності залежать від роботи транспозера, обговорені в даній заявці нижче.
Отже, варіанти здійснення даного винаходу надають засоби для ефективної передачі даних керування або метаданих покращеного копіювання спектральної смуги (еЗзВК) із забезпеченням зворотної сумісності. Ця ефективна передача даних керування е5ВК знижує вимоги щодо пам'яті в декодерах, кодерах і транскодерах, у яких застосовуються аспекти даного винаходу, без відчутного негативного впливу при цьому на бітову швидкість. Крім того, складність і вимоги обробки, пов'язані з виконанням еЗзВК згідно з варіантами здійснення даного винаходу, також зменшується, оскільки дані ЗВК необхідно обробляти тільки один раз, а не передавати одночасно, як було б у випадку, якщо б е5ВК оброблялось як повністю окремий тип об'єкта в
МРЕС-4 ААС замість інтеграції в кодек МРЕС -4 ААС із забезпеченням зворотної сумісності.
Далі, з посиланням на фіг. 7, описані елементи блока ("там/ даїа БіосКк") бітового потоку
МРЕС-4 ААС, у який метадані е5ВК включені згідно з деякими варіантами здійснення даного винаходу. На фіг. 7 представлена схема блока ("там/ даїа БіосК") бітового потоку МРЕС-4 ААС, на якій показані деякі його сегменти.
Блок бітового потоку МРЕС-4 ААС може містити щонайменше один елемент "віпдіе спаппе! еїетепі)» (наприклад, елемент одного каналу, показаний на фіг. 7) й/або щонайменше один елемент "спаппеї! раїг еіетепк)» (конкретно не показаний на фіг. 7, хоча він може бути), який містить звукові дані для звукової програми. Блок також може містити ряд елементів "ТІ еІептепіє" (наприклад, заповнювальний елемент 1 й/або заповнювальний елемент 2 на фіг. 7), які містять дані (наприклад, метадані), що стосуються програми. Кожний "віпдіеє спаппе! еіетепі)» містить ідентифікатор (наприклад, "Ю1" на фіг. 7), який вказує початок елемента одного каналу, і може містити звукові дані, які характеризують окремий канал багатоканальної звукової програми. Кожний "спаппе! раїг еЇетеп!і" містить ідентифікатор (не показаний на фіг. 7), який вказує початок елемента пари каналів, і може містити звукові дані, які характеризують два канали програми.
Елемент їйЇ еІетепі (який називається в даному документі заповнювальним елементом) бітового потоку МРЕС-4 ААС містить ідентифікатор (102" на фіг. 7), який вказує початок заповнювального елемента, і заповнювальні дані після ідентифікатора. Ідентифікатор ІС2 може складатися з трибітного цілого числа без знака, в якого спочатку передається старший значущий біт ("ціт5Бі"), що має значення 0 х 6. Заповнювальні дані можуть містити елемент ехіепзіоп рауїоаді) (який іноді називається в даному документі корисними даними розширення), синтаксис якого показаний у таблиці 4.57 стандарту МРЕС-4 ААС. Існує декілька типів корисних даних розширення, які ідентифікуються за допомогою параметра "ехіепзіоп їуре", який являє собою чотирибітне ціле число без знака, в якого спочатку передають старший значущий біт ("ніт5бі").
Заповнювальні дані (наприклад, їхні корисні дані розширення) можуть містити заголовок, або ідентифікатор (наприклад, "заголовок 1" на фіг. 7), який вказує сегмент заповнювальних даних, який вказує об'єкт ЗВЕ (тобто заголовок ініціалізує тип "об'єкт ЗВК", який у стандарті
МРЕС-4 ААС називається збг ехіепзіоп даїа/))). Наприклад, корисні дані розширення копіювання спектральної смуги (ЗВЕК) ідентифікуються значенням "1101" або "1110" для поля ехіепзіоп їуре в заголовку, при цьому ідентифікатор "1101" ідентифікує корисні дані розширення з даними 5ВК, а "1110" ідентифікує корисні дані розширення з даними 5ВК і 60 циклічним контролем надмірності (СКС) для перевірки правильності даних 5ВЕ.
Якщо заголовок (наприклад, поле ехіепвіоп їуре) ініціалізує тип об'єкта ЗВЕК, метадані 5ВК (які іноді називаються в даному документі "даними копіювання спектральної смуги" і називаються 5ьг даїа() в стандарті МРЕС-4 ДАС) йдуть за заголовком, а за метаданими ЗВЕК може йти щонайменше один елемент розширення копіювання спектральної смуги (наприклад, "елемент розширення 5ВК" заповнювального елемента 1 на фіг. 7). Такий елемент розширення копіювання спектральної смуги (сегмент бітового потоку) в стандарті МРЕС-4 ДААС називається контейнером "зБбг ехіепзіоп0)». Елемент розширення копіювання спектральної смуги необов'язково містить заголовок (наприклад, "заголовок розширення ЗВК" заповнювального елемента 1 на фіг. 7).
У стандарті МРЕС-4 ДААС передбачено, що елемент розширення копіювання спектральної смуги може містити Ро (параметричні стереофонічні) дані для звукових даних програми. У стандарті МРЕС-4 ДАС передбачено, що якщо заголовок заповнювального елемента (наприклад, його корисних даних розширення) ініціалізує тип об'єкта ЗВК (як робить "заголовок 1" на фіг. 7) і елемент розширення копіювання спектральної смуги заповнювального елемента містить Ро-дані, заповнювальний елемент (наприклад, його корисні дані розширення) містить дані копіювання спектральної смуги і параметр "ре ехієпвзіоп іа", значення якого (тобто "ре ехіепзіоп ій" - 2) вказує, що Роб-дані включені в елемент розширення копіювання спектральної смуги заповнювального елемента.
Згідно з деякими варіантами здійснення даного винаходу метадані езВК (наприклад, прапор, який вказує, чи необхідно виконувати обробку покращеного копіювання спектральної смуги (еб5ВК) на звуковому вмісті блока) включені в елемент розширення копіювання спектральної смуги заповнювального елемента. Наприклад, такий прапор вказаний у заповнювальному елементі 1 на фіг. 7, при цьому прапор з'являється після заголовка (заголовка розширення 5ВК" заповнювального елемента 1) "елемента розширення ВЕК" заповнювального елемента 1. Необов'язково такий прапор і додаткові метадані езВК включені в елемент розширення копіювання спектральної смуги після заголовка елемента розширення копіювання спектральної смуги (наприклад, в елемент розширення ЗВК заповнювального елемента 1 на фіг. 7 після заголовка розширення ЗВК). Згідно з деякими варіантами здійснення даного винаходу заповнювальний елемент, який містить метадані езВК, також містить параметр "р5 ехіепвіоп іа", значення якого (наприклад, б5 ехіепзіоп ід-3) вказує, що метадані е5ВК включені в заповнювальний елемент і що на звуковому вмісті відповідного блока необхідно виконати обробку еЗзВЕ.
Згідно з деякими варіантами здійснення даного винаходу метадані е5ВК включені в заповнювальний елемент (наприклад, заповнювальний елемент 2 на фіг. 7) бітового потоку
МРЕС-4 ААС, який відрізняється від елемента розширення копіювання спектральної смуги (елемента розширення 5ВК) заповнювального елемента. Це пояснюється отим, що заповнювальні елементи, які містять ехієпзіоп рауїоаді() з даними З5ВЕК або даними 5ВК з СКС, не містять ніяких інших корисних даних розширення будь-якого іншого типу розширення. Тому в варіантах здійснення, в яких метадані е5ВК зберігають свої власні корисні дані розширення, для зберігання метаданих е5ВЕК використовується окремий заповнювальний елемент. Такий заповнювальний елемент містить ідентифікатор (наприклад, "702" на фіг. 7), який вказує початок заповнювального елемента, і заповнювальні дані після ідентифікатора. Заповнювальні дані можуть містити елемент ехіепвзіоп рауїсайді() (який іноді називається в даному документі корисними даними розширення), синтаксис якого показаний у таблиці 4.57 стандарту МРЕС-4
ААС. Заповнювальні дані (наприклад, їхні корисні дані розширення) містять заголовок (наприклад, "заголовок 2" заповнювального елемента 2 на фіг. 7), який вказує об'єкт е5зВК (тобто заголовок ініціалізує тип об'єкта покращеного копіювання спектральної смуги (езВК)), і заповнювальні дані (наприклад, їхні корисні дані розширення) містять метадані езВкК після заголовка. Наприклад, заповнювальний елемент 2 на фіг. 7 містить такий заголовок ("заголовок 273, а також містить, після заголовка, метадані е5ВК (тобто "прапор" у заповнювальному елементі 2, який вказує, чи необхідно виконувати обробку покращеного копіювання спектральної смуги (еЗзВК) на звуковому вмісті блока). Необов'язково додаткові метадані е5ВЕК також включені в заповнювальні дані заповнювального елемента 2 на фіг. 7, після "заголовка 2".
У варіантах здійснення, що описуються в даному абзаці, заголовок (наприклад, "заголовок 2" на фіг. 7) має ідентифікаційне значення, яке не є одним зі звичайних значень, заданих у таблиці 4.57 стандарту МРЕС-4 ДАС, і замість цього вказує корисні дані розширення езВК (таким чином поле ехіепвзіоп їуре заголовка вказує, що заповнювальні дані містять метадані е5ВК).
У першому класі варіантів здійснення даний винахід являє собою блок обробки звуку (наприклад, декодер), який містить: 60 запам'ятовувальний пристрій (наприклад, буфер 201, представлений на фіг. З або 4),
виконаний із можливістю зберігання щонайменше одного блока кодованого звукового бітового потоку (наприклад, щонайменше одного блока бітового потоку МРЕС-4 ААС); пристрій видалення форматування корисних даних бітового потоку (наприклад, елемент 205, представлений на фіг. 3, або єлемент 215, представлений на фіг. 4), з'єднаний із запам'ятовувальним пристроєм і виконаний із можливістю демультиплексування щонайменше однієї частини вказаного блока бітового потоку; і підсистему декодування (наприклад, елементи 202 і 203, представлені на фіг. 3, або елементи 202 ї 213, представлені на фіг. 4), з'єднану і виконану з можливістю декодування щонайменше однієї частини звукового вмісту вказаного блока бітового потоку, при цьому блок містить: заповнювальний елемент, який містить ідентифікатор, який вказує початок заповнювального елемента (наприклад, ідентифікатор "їі зуп еїе", який має значення 0 х 6, згідно з таблицею 4.85 стандарту МРЕС-4 ДАС), і заповнювальні дані після ідентифікатора, при цьому заповнювальні дані містять: щонайменше один прапор, що ідентифікує, чи необхідно виконувати обробку покращеного копіювання спектральної смуги (езВК) на звуковому вмісті блока (наприклад, із використанням даних копіювання спектральної смуги і метаданих езВК, включених у блок).
Прапор являє собою метадані езВЕК, і прикладом прапора є прапор "збБгРаїспіпдМоде".
Іншим прикладом прапора є прапор "паппопіс5 ВК". Обидва з цих прапорів вказують, чи необхідно виконувати на звукових даних блока базову форму копіювання спектральної смуги або покращену форму спектрального копіювання. Базова форма спектрального копіювання являє собою спектральне вставляння, а покращена форма копіювання спектральної смуги являє собою гармонічну транспозицію.
У деяких варіантах здійснення заповнювальні дані також містять додаткові метадані езВвкк (тобто метадані еЗзВЕ, відмінні від прапора).
Запам'ятовувальний пристрій може являти собою буферний запам'ятовувальний пристрій (наприклад, реалізацію буфера 201, представленого на фіг. 4), який зберігає (наприклад, енергонезалежно) щонайменше один блок кодованого звукового бітового потоку.
Оцінюється, що складність виконання обробки езВК (з використанням гармонічної транспозиції і попереднього згладжування езВк) декодером езВК у ході декодування бітового потоку МРЕС-4 ААС, який містить метадані езВК (які вказують ці інструменти е5зВК), буде наступною (для звичайного декодування із вказаними параметрами): - гармонічна транспозиція (16 кбіт/с, 14400/28800 Гц) - на основі ОЕТ: 3,68 М/ІМОРЗ (зважених мільйонів операцій у секунду); - на основі ОМЕ: 0,98 МИМО РБ; - попередня обробка (попереднє згладжування) ОМЕ-вставки: 0,1 М/МОР5.
Відомо, що для перехідних сигналів транспозиція на основі ОЕТ зазвичай виконується краще, ніж транспозиція на основі ОМЕ.
Згідно з деякими варіантами здійснення даного винаходу заповнювальний елемент (кодованого звукового бітового потоку), який містить метадані езВЕ, також містить параметр (наприклад, параметр "р5 ехіепзіоп Їй"), значення якого (наприклад, бБ5 ехіепвіоп ід-3) сигналізує про те, що метадані езВвК включені в заповнювальний єлемент і що обробку езВІК необхідно виконувати на звуковому вмісті відповідного блока, й/або параметр (наприклад, той же параметр "5 ехіепвіоп іа"), значення якого (наприклад, б5 ехіепзіоп ід-2) сигналізує про те, що контейнер 5бг ехіепзіоп) заповнювального елемента містить Ро-дані. Наприклад, як вказано нижче в таблиці 1, такий параметр, що має значення р5 ехієпвзіоп іа-2, може сигналізувати про те, що контейнер 5бг ехіепвзіоп/) заповнювального елемента містить Ро-дані, а такий параметр, що має значення Бб5 ехіепзіоп ід-3, може сигналізувати про те, що контейнер збг ехіепзіоп() заповнювального елемента містить метадані езВЕ: 5О0
Таблиця 1 77171770 | Зарезервовано
Згідно з деякими варіантами здійснення даного винаходу синтаксис кожного елемента розширення копіювання спектральної смуги, який містить метадані езВК й/або Ро-дані, як вказано нижче в таблиці 2 (у якій "збг ехієепзіоп()» означає контейнер, який являє собою елемент розширення копіювання спектральної смуги, "р5 ехіепзіоп Їй" є таким, як описано в таблиці 1 вище, "р5 даїйа" означає Ро5-дані і "езбг ааїа" означає метадані еЗзВК).
Таблиця 2 вот ехіепвіоп(р5 ехіепвіоп ій, пит рив ей 77777711 пннннюІн""нИШТИИВЗИТТИТЬЬТЛТООМІІІВСШСШШІШІНШТШЦКНКТНКНКНННИВХВОХОВОЛЛІВВІВВНТЬНЬСЬНТЬОНЯ ШИЯ вмйсп(рв ехівпвіоп Є 11111111 савеєхТтЕМБІОМОІЮ Р: 77777711 иакє 111 савеЕХТЕМБІОМОЮ ЕБВА! 77777771 иа 11 дей рей ВИЙ; 111111 пит вйв ей; 11 иваює 11 ра ра
Примітка ї:ре даїаО повертає кількістьзчитаних бітівб.д -/:///////Ї.7111111сС1С (Примітка2:евзбг дайа0рповертає кількістьзчитаних бітів..д-./:/ ЇЇ.
У наведеному як приклад варіанті здійснення езбг ааїйа0(), на який є посилання в таблиці 2 вище, вказує значення наступних параметрів метаданих: 1. однобітний параметр метаданих "б5 5бг ргергосевзвіпд"; і 2. для кожного каналу ("сп") звукового вмісту кодованого бітового потоку, який підлягає декодуванню, кожний із вищеописаних параметрів: "вБгРаїспіпоМоде|сні»; "вБгОмегзатріїпоРІад|сп|»; "збгРЇСспІпВіп5РІад|спі»; і "зБгРІЇСПІпВіпв|(св|».
Наприклад, для указання цих параметрів метаданих у деяких варіантах здійснення езбг даїа() може мати синтаксис, вказаний у таблиці 3.
Таблиця З еврг саїа(ій аас,ре соиріпо)ї 77771111 пнннннюІ""нЕІТІЬТЬТЬЬНЬНГ6ЦНЬШНННННИЙНТЬВ ШИОЛОТВОВОЛЛВОЛЛЛОТЛОЛОВЛВОВОТЛОИНИТООИОИНН (ба аас Я ЗСЕДЛСССССССССССС111111111111111111 вів овбгРИСЛВівІО1-0; деве(///// вргОмегзатріпонацоЇ-о: 77777777 овбгРИСЛВівІО1-0; р зевей(й аася УЮ СРС (в соціо! 771111 вів вбгРИСЛ ВВІВ МІ-0: деве(
вргОмегзатріпонацомІ-0ї 77777771 вбгРИСЛ Вів МІ-0: р зеіве(/рв соцріпа ОСС вів овбгРИСЛВівІО1-0; деве(///// вргОмегзатріпонацоЇ-о: 77777777 овбгРИСЛВівІО1-0; ннн";ьбнНиТШНИИИЬОВХЕЕСЕШШЕНВОВВИВТНТИТЦТЛТДЛООИХИ ВОЛВОІВВОИВОВОИВИВОВОВОВВВВВВВВВВВВНИ вів вбгРИСЛВИїИІяО: деве(///// вргОмегзатріпанадтія: 77777777 вбіРИСЛВИїИІяО: р р р пр
Примітка: 55 5бг ргергосезвзіпд визначений, як описано в розділі 6.2.12 ІБОЛЕС 23003-3:2012. 5зБгРаїспіпаМоаде|сн|, зБбгОмегзатріїпоРіІад(|сн)|, 5бгРіїспІпВіпеРіІадісн| і 5бБгРісНІпВіпе|сн) визначені, як описано в розділі 7.5 ІЗОЛЕС 23003-3:2012.
Вищеописаний синтаксис забезпечує можливість ефективної реалізації покращеної форми копіювання спектральної смуги, такої як гармонічна транспозиція, як розширення для традиційного декодера. Зокрема, дані езВК у таблиці З містять тільки ті параметри, які є необхідними для виконання покращеної форми копіювання спектральної смуги, які або вже не підтримуються в бітовому потоці, або не є такими, що виводяться прямо з параметрів, що вже підтримуються в бітовому потоці. Всю решту параметрів і даних обробки, необхідних для виконання покращеної форми копіювання спектральної смуги, вилучають із параметрів, які існували раніше, у вже визначених місцях бітового потоку.
Наприклад, декодер, який відповідає вимогам МРЕС-4 НЕ-ААС або НЕ-ААС м2, можна розширити таким чином, щоб він включав покращену форму копіювання спектральної смуги, таку як гармонічна транспозиція. Ця покращена форма копіювання спектральної смуги являє собою доповнення до базової форми копіювання спектральної смуги, яка вже підтримується декодером. У контексті декодера, який відповідає вимогам МРЕС-4 НЕ-ААС або НЕ-ААС хг, ця базова форма копіювання спектральної смуги являє собою інструмент спектральної ОМЕ- вставки 5ВЕ, як визначено в розділі 4.6.18 стандарту МРЕС-4 ААС.
При виконанні покращеної форми копіювання спектральної смуги розширений декодер НЕ-
ААС може знову використовувати багато з параметрів бітового потоку, вже включених у корисні дані розширення ЗВК бітового потоку. Конкретні параметри, які можуть бути знову використані, включають, наприклад, різні параметри, які визначають таблицю діапазонів головних частот. Ці параметри включають р5 в5іагі їед (параметр, який визначає початок параметра таблиці головних частот), "б5 5іор їтєд" (параметр, який визначає кінець таблиці головних частот), "ре їед зсаїе" (параметр, який визначає кількість діапазонів частот на октаву) і "б5 акКег 5саїе" (параметр, який змінює масштаб діапазонів частот). Параметри, які можуть бути знову використані також включають параметри, які визначають таблицю смуги шумів (65 поїзе Брапаз"), і параметри таблиці смуги обмежувача ("р5 Ітйег Брапаз"). Відповідно в різних варіантах здійснення щонайменше деякі з еквівалентних параметрів, заданих у стандарті
ОБАС, не включаються в бітовий потік, завдяки чому зменшується переповнення бітового потоку інформацією керування. Зазвичай, якщо параметр, заданий у стандарті ААС, має еквівалентний параметр, заданий у стандарті ОБАС, то еквівалентний параметр, заданий у стандарті ОБАС, має таку ж назву, як параметр, заданий у стандарті ААС, наприклад масштабний коефіцієнт Еогомарреія обвідної. Однак еквівалентний параметр, заданий у стандарті
ОБАС, зазвичай має інше значення, яке "налаштовано" для обробки покращеного ВК, визначеного у стандарті О5АС, а не для обробки 5ВЕ, визначеного у стандарті ААС.
Для підвищення суб'єктивної якості звукового вмісту з гармонічною частотною структурою і сильними тональними характеристиками, зокрема при низьких бітових швидкостях, рекомендується активація покращеного 5ВЕК. Значення відповідного елемента бітового потоку (тобто езбг адайа0)), який керує цими інструментами, можуть бути визначені в кодері шляхом застосування механізму класифікації, залежного від сигналу. Як правило, використання способу гармонічного вставляння (5бгРаїспіпуоМоде -- 1) є переважним для кодування музикальних сигналів із дуже низькими бітовими швидкостями, коли основний кодек може бути значно обмежений у смузі пропускання звуку. Це є особливо вірним, якщо ці сигнали мають виражену гармонічну структуру. Навпаки, використання звичайного способу вставляння 5ВК є переважним для мовних і змішаних сигналів, оскільки він забезпечує краще зберігання тимчасової структури мови.
Для покращення роботи гармонічного транспозера можна активувати етап попередньої обробки (р5 5Ббг ргергосеззіпд -- 1), який намагається уникнути внесення порушень однорідності спектра сигналу, який надходить у подальший коректор обвідної. Робота інструмента є корисною для типів сигналів, у яких груба обвідна спектра сигналу нижнього діапазону, що використовується для реконструкції високих частот, проявляє великі варіації рівня.
Для покращення перехідної характеристики гармонічного вставляння 58ВК можна застосовувати адаптивну до сигналу передискретизацію в частотній ділянці (збгОмегзатріїпуоРіад -- 1). Оскільки адаптивна до сигналу передискретизація в частотній ділянці збільшує обчислювальну складність транспозера, але дає користь тільки для кадрів, які містять перехідні сигнали, використанням цього інструмента керують за допомогою елемента бітового потоку, який передають один раз на кадр і на незалежний канал ЗВК.
Декодеру, який діє в запропонованому режимі покращеного ЗВЕ, зазвичай необхідно мати можливість переключення між традиційним і покращеним вставлянням 5ВК. Тому може вноситися затримка, яка може бути настільки тривалою, як тривалість одного базового кадру звуку, залежно від налаштувань декодера. Зазвичай затримка буде однакова і для традиційного, і для покращеного вставляння ЗВЕ.
На додаток до численних параметрів, розширений декодер НЕ-ААС при виконанні покращеної форми копіювання спектральної смуги згідно з варіантами здійснення даного винаходу може знову використовувати й інші елементи даних. Наприклад, дані обвідної і дані шумового порога також можуть бути вилучені з даних б5 даїа епу (масштабних коефіцієнтів обвідної) і р5 поіїзе епу (масштабних коефіцієнтів шумового порога) і використані в ході покращеної форми копіювання спектральної смуги.
По суті ці варіанти здійснення використовують конфігураційні параметри і дані обвідної, які вже підтримуються традиційним декодером НЕ-ААС або НЕ-ААС 2, в корисних даних розширення 5ВК для забезпечення покращеної форми копіювання спектральної смуги, яка вимагає як можна менше додаткових даних, які передаються. Метадані були спершу налаштовані для базової форми НЕК (наприклад, для операції спектрального переносу ЗВЕ), але згідно з варіантами здійснення використовуються для покращеної форми НЕК (наприклад, гармонічної транспозиції е5ВкК). Як обговорено раніше, метадані, як правило, представляють робочі параметри (наприклад, масштабні коефіцієнти обвідної, масштабні коефіцієнти шумового порога, параметри часової/частотної сітки, інформацію про додавання синусоїд, змінну частоту/діапазон розділення, режим зворотної фільтрації, розділення обвідної, режим вирівнювання, режим частотної інтерполяції), налаштовані і призначені для використання з базовою формою НЕК (наприклад, із лінійним спектральним переносом). Однак ці метадані в поєднанні з додатковими параметрами метаданих, специфічними для покращеної форми НЕК (наприклад, гармонічної транспозиції), можуть бути використані для раціональної й ефективної обробки звукових даних із використанням покращеної форми НЕК.
Відповідно розширені декодери, які підтримують покращену форму копіювання спектральної смуги, можна створювати надзвичайно ефективним чином, покладаючись на вже визначені елементи бітового потоку (наприклад, елементи в корисних даних розширення 5ВКЕ) і додаючи тільки ті параметри, які необхідні для підтримки покращеної форми копіювання спектральної бо смуги (в корисних даних розширення заповнювального елемента). Ця ознака ущільнення даних у поєднанні з розміщенням параметрів, які знову додаються, в зарезервованому полі даних, такому як контейнер розширення, суттєво знижує бар'єри для створення декодера, який підтримує покращену форму копіювання спектральної смуги, завдяки забезпеченню зворотної сумісності бітового потоку з традиційним декодером, який не підтримує покращену форму копіювання спектральної смуги.
У таблиці З число в правій колонці вказує кількість бітів відповідного параметра з лівої колонки.
У деяких варіантах здійснення тип об'єкта 5ВЕ, визначений у МРЕС-4 ДАС, оновлюють таким чином, щоб він містив інструмент 5ВК і аспекти інструмента покращеного ЗВК (еЗзВК), як вказано сигналами в елементі розширення 5ВЕ (Бб5 ехіепзіоп їй - ЕХТЕМ5ІОМ ІЮО ЕЗВК).
Якщо декодер виявляє і підтримує цей елемент розширення 5ВК, то декодер використовує вказані сигналами аспекти інструмента покращеного ЗВК. Тип об'єкта 5ВК, оновлений таким чином, називається "покращеннями 5ВЕ".
У деяких варіантах здійснення даний винахід являє собою спосіб, який включає етап кодування звукових даних із генеруванням кодованого бітового потоку (наприклад, бітового потоку МРЕС-4 ДАС), який містить метадані е52вк в щонайменше одному сегменті щонайменше одного блока кодованого бітового потоку і звукові дані в щонайменше одному іншому сегменті блока. У звичайних варіантах здійснення спосіб включає етап мультиплексування звукових даних із метаданими езВК у кожному блоці кодованого бітового потоку. При звичайному декодуванні кодованого бітового потоку в декодері езВК декодер вилучає метадані еЗзВК з бітового потоку (у тому числі за допомогою синтаксичного аналізу і демультиплексування метаданих еЗзВК і звукових даних) і використовує метадані езВК для обробки звукових даних, щоб генерувати потік декодованих звукових даних.
Інший аспект даного винаходу являє собою декодер еЗзВК, виконаний із можливістю виконання обробки езВК (наприклад, із використанням щонайменше одного з інструментів еЗзВК, відомих як гармонічна транспозиція або попереднє згладжування) в ході декодування кодованого звукового бітового потоку (наприклад, бітового потоку МРЕС-4 ААС), який не включає метадані еЗзВК. Приклад такого декодера буде описаний із посиланням на фіг. 5.
Декодер (400) еЗзВК, представлений на фіг. 5, містить буферний запам'ятовувальний пристрій 201 (ідентичний із запам'ятовувальним пристроєм 201, представленим на фіг. З і 4), пристрій 215 видалення форматування корисних даних бітового потоку (ідентичний із пристроєм 215 видалення форматування, представленим на фіг. 4), підсистему 202 декодування звуку (яка іноді називається "основним" ступенем декодування або "основною" підсистемою декодування, яка ідентична з основною підсистемою 202 декодування, представленою на фіг. 3), підсистему 401 генерування даних керування езВЕ і ступінь 203 обробки еЗзВЕ (ідентичний зі ступенем 203, представленим на фіг. 3), з'єднані таким чином, як показано. Зазвичай декодер 400 також містить інші обробляючі елементи (не показані).
У роботі декодера 400 послідовність блоків кодованого звукового бітового потоку (бітового потоку МРЕС-4 ДАС), прийнята декодером 400, передається з буфера 201 в пристрій 215 видалення форматування.
Пристрій 215 видалення форматування з'єднаний і виконаний із можливістю демультиплексування кожного блока бітового потоку для вилучення із нього метаданих 5ВЕ (у тому числі квантованих даних обвідної) і зазвичай також інших метаданих. Пристрій 215 видалення форматування виконаний із можливістю передачі щонайменше метаданих ЗВК на ступінь 203 обробки езВК. Пристрій 215 видалення форматування також з'єднаний і виконаний із можливістю вилучення звукових даних із кожного блока бітового потоку і передачі вилучених звукових даних у підсистему 202 декодування (ступінь декодування).
Підсистема 202 декодування звуку декодера 400 виконана з можливістю декодування звукових даних, вилучених пристроєм 215 видалення форматування (таке декодування можна назвати "основною" операцією декодування), для генерування декодованих звукових даних і передачі декодованих звукових даних на ступінь 203 обробки ез5ВК. Декодування виконується в частотній ділянці. Зазвичай останній ступінь обробки в підсистемі 202 застосовує перетворення із частотної ділянки в часову ділянку до декодованих звукових даних у частотній ділянці, таким чином виведення підсистеми являє собою декодовані звукові дані в часовій ділянці. Ступінь 203 виконаний із можливістю застосування інструментів 5ВК (й інструментів е5ВК), вказаних метаданими 5ВК (вилученими пристроєм 215 видалення форматування) і метаданими езвВЕК, згенерованими в підсистемі 401, до декодованих звукових даних (тобто виконання обробки 5ВК і езВК відносно виведення підсистеми 202 декодування з використанням метаданих ЗВК і еЗВК), щоб генерувати повністю декодовані звукові дані, які виводяться з декодера 400. 60 Зазвичай декодер 400 містить запам'ятовувальний пристрій (доступний для підсистеми 202 і ступеня 203), який зберігає звукові дані з видаленим форматуванням і метадані, виведені з пристрою 215 видалення форматування (і необов'язково також із підсистеми 401), і ступінь 203 виконаний із можливістю здійснення доступу до звукових даних і метаданих у міру необхідності в ході обробки 5ВЕ і езВК. Обробку 5ВК на ступені 203 можна вважати постобробкою відносно виведення основної підсистеми 202 декодування. Необов'язково декодер 400 також містить підсистему прикінцевого підвищувального мікшування (яка може застосовувати інструменти параметричної стереофонії (РБЗ"), визначені в стандарті МРЕС-4 ААС, із використанням метаданих Р5, вилучених пристроєм 215 видалення форматування), з'єднану і виконану з можливістю виконання підвищувального мікшування відносно виведення ступеня 203 для генерування повністю декодованого і підданого підвищувальному мікшуванню звуку, який виводиться з АР 210.
Параметрична стереофонія є інструментом кодування, який представляє стереофонічний сигнал із використанням лінійного знижувального мікшування лівого і правого каналів стереофонічного сигналу і набору просторових параметрів, що описують стереозображення. У параметричній стереофонії зазвичай використовують три типи просторових параметрів: (1) міжканальні різниці інтенсивності (0), що описують різниці інтенсивностей між каналами; (2) міжканальні різниці фази (ІРО), що описують різниці фази між каналами; і (3) міжканальна когерентність (СС), що описує когерентність (або подібність) між каналами. Когерентність можна виміряти як максимум взаємної кореляції залежно від часу або фази. Ці три параметра, як правило, забезпечують можливість високоякісної реконструкції стереозображення. Однак параметри ІРО задають лише відносні різниці фази між каналами стереофонічного вхідного сигналу і не вказують розподіл цих різниць фази по лівому і правому каналам. Тому додатково можна використовувати параметри четвертого типу, що описують загальний зсув фази або загальну різницю фаз (ОРЮО). У процесі реконструкції стереофонічного сигналу послідовні сегменти, що обробляються методом вікна, як прийнятого сигналу знижувального мікшування, 5(п!І, так ії декорельованої версії прийнятого знижувального мікшування, 4(п|, обробляються разом із просторовими параметрами для генерування лівого (Ік(п)) і правого (гк(п)) реконструйованих сигналів відповідно до наступної формули:
Іки)-Н(К, п)вк(п)-На((К, п)ак(пи) "к(п)-НІг(К, п)5к(п)-Наг(К, п)дк(п) де Ни, Ніг, Наї ї На визначаються стереофонічними параметрами. Сигнали ІкК(п) ї гк(п) зрештою перетворюються назад у часову ділянку за допомогою частотно-часового перетворення.
Підсистема 401 генерування даних керування, представлена на фіг. 5, з'єднана і виконана з можливістю виявлення щонайменше однієї властивості кодованого звукового бітового потоку, який підлягає декодуванню, і генерування даних керування еЗзВК (які можуть являти собою або включають метадані езВЕ. будь-якого з типів, включені в кодовані звукові бітові потоки згідно з іншими варіантами здійснення даного винаходу) у відповідь на щонайменше один результат етапу виявлення. Дані керування ебВК передаються на ступінь 203, щоб запускати застосування окремих інструментів езВЕК або комбінацій інструментів е5ВК при виявленні конкретної властивості (або комбінації властивостей) бітового потоку й/або керувати застосуванням таких інструментів е5ВК. Наприклад, для керування виконанням обробки еЗВК з використанням гармонічної транспозиції деякі варіанти здійснення підсистеми 401 генерування даних керування будуть містити: детектор музики (наприклад, спрощену версію традиційного детектора музики) для встановлення параметра 5бгРаїспіпдаМоаде|сн| (і передачі встановленого параметра на ступінь 203) у відповідь на виявлення того, що бітовий потік характеризує або не характеризує музику; детектор перехідних сигналів для встановлення параметра зБгОмегзатріїпоніІад(|сн| (і передачі встановленого параметра на ступінь 203) у відповідь на виявлення присутності або відсутності перехідних сигналів у звуковому вмісті, вказаному бітовим потоком; й/або детектор основного тону для встановлення параметрів зБгРИСНПІпВіпзЕїадіусн) і збгРЇСпІпВіпе|(сп) (і передачі встановлених параметрів на ступінь 203) у відповідь на виявлення основного тону звукового вмісту, вказаного бітовим потоком. Іншими аспектами даного винаходу є способи декодування звукового бітового потоку, які виконуються за допомогою будь-якого варіанта здійснення декодера відповідно до винаходу, описаного в цьому абзаці і попередньому абзаці.
Аспекти даного винаходу включають спосіб кодування або декодування, що стосується типу, з можливістю виконання якого виконаний (наприклад, запрограмований) будь-якій варіант здійснення АР, системи або пристрою відповідно до винаходу. Інші аспекти даного винаходу включають систему або пристрій, виконані з можливістю (наприклад, запрограмовані для) 60 виконання будь-якого варіанта здійснення способу відповідно до винаходу, Ф«і машинопрочитуваний носій (наприклад, диск), на якому зберігається (наприклад, енергонезалежно) код, призначений для реалізації будь-якого варіанта здійснення способу відповідно до винаходу або його етапів. Наприклад, система відповідно до винаходу може являти собою або включати програмований процесор загального призначення, процесор цифрової обробки сигналів або мікропроцесор, запрограмований із використанням програмного забезпечення або програмно-апаратного забезпечення й/або іншим чином виконаний із можливістю виконання будь-якої з множини операцій відносно даних, у тому числі варіанта здійснення способу відповідно до винаходу або його етапів. Такий процесор загального призначення може являти собою або включати комп'ютерну систему, яка містить пристрій введення, запам'ятовувальний пристрій і схему обробки, запрограмовану для (й/або іншим чином виконану з можливістю) виконання варіанта здійснення способу відповідно до винаходу (або його етапів) у відповідь на дані, які передаються до неї.
Варіанти здійснення даного винаходу можуть бути реалізовані в апаратному забезпеченні, програмно-апаратному забезпеченні, програмному забезпеченні або їхній комбінації (наприклад, як програмована логічна матриця). Якщо не зазначене інше, алгоритми або процеси, включені як частини даного винаходу, по своїй суті не стосуються якого-небудь конкретного комп'ютера або іншого пристрою. Зокрема, різні машини загального призначення можуть бути використані разом із програмами, написаними згідно з ідеями, викладеними в даному документі, або може бути зручніше сконструювати більш спеціалізований пристрій (наприклад, інтегральні мікросхеми) для виконання необхідних етапів способу. Таким чином, даний винахід може бути реалізований в одній або більше комп'ютерних програмах, які здійснюються на одній або більше програмованих комп'ютерних системах (наприклад, на реалізації будь-якого з елементів, представлених на фіг. 1, або кодері 100, представленому на фіг. 2, (або його елементі), або декодері 200, представленому на фіг. 3, (або його елементі), або декодері 210, представленому на фіг. 4, (або його елементі), або декодері 400, представленому на фіг. 5, (або його єлементі)), кожна з яких містить щонайменше один процесор, щонайменше одну систему зберігання даних (у тому числі енергозалежні й енергонезалежні запам'ятовувальні пристрої й/або елементи зберігання), щонайменше один пристрій або порт введення і щонайменше один пристрій або порт виведення. Програмний код застосовується до вхідних даних для виконання функцій, описаних у даному документі, і генерування вихідної інформації. Вихідна інформація відомим способом застосовується до одного або більше пристроїв виведення.
Кожна така програма може бути реалізована на будь-якій необхідній комп'ютерній мові (у тому числі машинній, асемблерній або процедурній високого рівня, логічній або об'єктно- орієнтованій мовах програмування) для здійснення зв'язку з комп'ютерною системою. У кожному разі мова може бути компільовуваною або інтерпретовуваною мовою.
Наприклад, при реалізації за допомогою послідовностей команд комп'ютерного програмного забезпечення різні функції й етапи варіантів здійснення даного винаходу можуть бути реалізовані за допомогою багатопотокових послідовностей команд програмного забезпечення, запущених на підходящому апаратному забезпеченні цифрової обробки сигналів, і в цьому випадку різні пристрої, етапи і функції варіантів здійснення можуть відповідати частинам команд програмного забезпечення.
Кожну таку комп'ютерну програму переважно зберігають або завантажують на інформаційні носії або пристрій (наприклад, твердотільний запам'ятовувальний пристрій або носії, або магнітний чи оптичний носії), що зчитуються програмованим комп'ютером загального або спеціального призначення, для налаштування конфігурації і роботи комп'ютера, коли інформаційні носії або пристрій зчитуються комп'ютерною системою для виконання процедур, описаних у даному документі. Система відповідно до винаходу також може бути реалізована у вигляді машинопрочитуваного інформаційного носія, оснащеного комп'ютерною програмою (тобто який зберігає її), де оснащений таким чином інформаційний носій викликає роботу комп'ютерної системи особливим і попередньо визначеним чином для виконання функцій, описаних у даному документі.
Був описаний ряд варіантів здійснення даного винаходу. Однак необхідно розуміти, що різні модифікації можуть бути здійснені без відступу від об'єму формули винаходу. У світі вищевикладених ідей є можливими численні модифікації і зміни даного винаходу. Наприклад, для полегшення ефективних реалізацій зсуви фази можна використовувати в комбінації з аналізом за допомогою блоків комплексних ОМЕ-фільтрів аналізу і синтезу. Блок фільтрів аналізу відповідає за фільтрацію сигналу нижнього діапазону у часовій ділянці, який генерується основним декодером, в множину піддіапазонів (наприклад, ОМЕ-піддіапазонів). 60 Блок синтезувальних фільтрів відповідає за об'єднання відновленого верхнього діапазону,
отриманого за допомогою вибраної методики НЕК (як вказано прийнятим параметром зБгРаїспіпоМоде), з декодованим нижнім діапазоном для отримання широкосмугового вихідного звукового сигналу. Дана реалізація блока фільтрів, що діє у певному режимі частоти дискретизації, наприклад в режимі звичайної двошвидкісної дії або в режимі ЗВК зі зниженою дискретизацією, не повинна, однак, мати зсуви фази, що залежать від бітового потоку. ОМЕ- блоки, що використовуються в 5ВК, являють собою комплексно-експоненціальне розширення теорії косинусно-модульованих блоків фільтрів. Можна показати, що при розширенні косинусно- модульованого блока фільтрів за допомогою комплексно-експоненціальної модуляції обмеження, пов'язані з виключенням паразитних сигналів, стають неактуальними. Таким чином, для ОМЕ-блоків ЗВК як фільтри аналізу, НкК(п), так і синтезувальні фільтри, їХп), можна визначити як:
АК (п) - (п) - ро (пек кн (п-5) оп емоексм
М 2 2 (1). де ро(п) - це дійснозначний симетричний або асиметричний фільтр-прототип (зазвичай фільтр-прототип нижніх частот), М означає кількість каналів, а М - порядок фільтра-прототипу.
Кількість каналів, які використовуються в блоці фільтрів аналізу, можуть відрізнятися від кількості каналів, які використовуються в блоці синтезувальних фільтрів. Наприклад, блок фільтрів аналізу може мати 32 канали, а блок синтезувальних фільтрів може мати 64 канали.
При роботі блока синтезувальних фільтрів у режимі зниженої дискретизації блок синтезувальних фільтрів може мати тільки 32 канали. Оскільки дискретні значення піддіапазонів із блока фільтрів є комплекснозначними, до блока фільтрів аналізу може бути прикладений додатковий, який можливо залежить від каналів, етап зсуву фази. Ці додаткові зсуви фази необхідно компенсувати перед блоком синтезувальних фільтрів. Хоча складові зсуву фаз здебільшого можуть являти собою довільні значення, без погіршення роботи ОМЕ-ланцюжку аналізу/синтезу, їх також можна обмежити певними значеннями для перевірки відповідності. На сигнал 5ВЕ буде впливати вибір фазових коефіцієнтів, а сигнал нижніх частот, який надходить із основного декодера, впливати не буде. Якість звуку вихідного сигналу не зазнає негативного впливу.
Коефіцієнти фільтра-прототипу, ро(п), можна визначити з довжиною /!, 640, як показано нижче в таблиці 4.
Зо
Таблиця 4 0 | тбо0о0о00000 | 214 | 0,0019765601 | 428 | 0,0117623832 6 | -00005040714 | 22го | -0,0319531274 | 434 | 0,0366418116 8 | -00005466565 | 222 | -0,0447806821 | 436 | 0,0434768782 9 | -00005677802 | 223 | -0,0514804176 | 437 | 0,0466303305
60 | оортоватт4о | 274 | 0,5630789140 | 488 | 0,0466843027 66 | 00029469447 | 280 | 0,6261242695 | 494 | 0,0374812850 68 | 00032739613 | 282 | 0,6461269695 | 496 | 0,0344620948 69 | 00034418874 | 283 | 0,6559016302 | 497 | 0,0329754081 80 | 00050393022 | 294 | 0,7513137456 | 508 | 0,0179433381
86 | 00055475714 | 300 | 0,7919735841 | 54 | -0,0111315548 89 | 00056455196 | 303 | 0,8087695004 | 517 | -0,0081798233 90 | 00056389199, | 304 | 0,8138191270 | 518 | -0,0072615816 96 | 00052715758 | 310 | 0,8379717337 | 524 | -0,0024826723 98 | 00049839687 | 312 | 0,8436238281 | 526 | -0,0011568135 99 | 00048109469 | 313 | 0,8459818469 | 527 | -0,0005464280
172 | 00725682583 | 386 | -0,3388722693 | 600 | -0,0002896981 178 | 00761992479 | 392 | -02736634040 | 606 | -0,0005946118 о л81 | 00768173975 | 395 | -б2423016884 | 609 | -0,0006917937
212 | 001176238320 | 426 | 000197656601..Й. 213 | 00о6в963686б2 | 427 | 00069636862.
Фільтр-прототип, ро(п), також можна отримати з таблиці 4 за допомогою однієї або більше математичних операцій, таких як округлення, субдискретизація, інтерполяція і проріджування.
Попри те, що налаштування інформації керування, яка стосується ЗВК, зазвичай не залежить від подробиць транспозиції (як обговорено раніше), в деяких варіантах здійснення певні елементи даних керування можуть передаватися одночасно в контейнері розширення еЗВА (р5 ехіепвіоп ій --ЕХТЕМЗІОМ ІЮ Е5ВК) з метою підвищення якості відновленого сигналу. Деякі з елементів, які передаються одночасно, можуть включати дані шумового порога (наприклад, масштабні коефіцієнти шумового порога і параметр, який вказує напрямок, у напрямку або частоти, або часу, різницевого кодування для кожного шумового порогу), дані зворотної фільтрації (наприклад, параметр, який вказує режим зворотної фільтрації, вибраний із відсутності зворотної фільтрації, низького рівня зворотної фільтрації, проміжного рівня зворотної фільтрації і сильного рівня зворотної фільтрації) і дані пропущених гармонік (наприклад, параметр, який вказує, чи варто додати синусоїду в конкретну смугу частот відновлюваного верхнього діапазону). Все ці елементи базуються на виконаній в кодері синтетичній емуляції транспозера декодера, і тому при правильному налаштуванні для вибраного транспозера можуть підвищувати якість відновленого сигналу.
Зокрема, в деяких варіантах здійснення дані пропущених гармонік і дані керування зворотної фільтрації передають у контейнері розширення еЗзвВК (разом з іншими параметрами бітового потоку з таблиці 3) і налаштовують для гармонічного транспозера е5ВК. Додаткова бітова швидкість, необхідна для передачі цих двох класів метаданих для гармонічного транспозера езВК, є відносно низькою. Тому відправлення налаштованих даних пропущених гармонік й/(або даних керування зворотної фільтрації в контейнері розширення е5ВК буде підвищувати якість звуку, який отримується за допомогою транспозера, лише з мінімальним при цьому впливом на бітову швидкість. Для забезпечення зворотної сумісності з традиційними декодерами параметри, налаштовані для операції спектрального переносу ЗВК, також можуть бути відправлені в бітовому потоці як частина даних керування 5ВК з використанням або прихованої, або явної сигналізації.
Складність декодера з покращеннями ЗВК, як описано в даній заявці, повинна бути обмежена таким чином, щоб значно не підвищувати загальну обчислювальну складність реалізації. Переважно РСІ (МОР) для типу об'єкта ЗВК, при використанні інструмента еЗзВК, є меншою або дорівнює 4,5, і КС для типу об'єкта 5ВЕК, при використанні інструмента е5ВК, є меншою або дорівнює 3. Наближена обчислювальна потужність дана в одиницях складності процесора (Ргосеззог Соптріехйу Опії, РСЮ), виражених у цілочислових кількостях МОР5.
Наближене завантаження КАМ дано в одиницях складності КАМ (КАМ Сотріехйу Опії5, КС), виражених в цілочислових кількостях кілослів (1000 слів). Кількості КСО не включають робочі буфери, які можуть сумісно використовуватися різними об'єктами й/або каналами. Крім того,
РОСИ є пропорційною частоті дискретизації. Значення РСІИ дані в МОР5 (мільйони операцій у секунду) на канал, а значення КОСИ - в кілословах на канал.
До стиснутих даних, таких як кодований звук НЕ-ААС, які можуть бути декодовані за допомогою різних конфігурацій декодера, необхідна особлива увага. У цьому випадку декодування можна здійснювати із забезпеченням зворотної сумісності (тільки ААС), а також у покращеному режимі (ААС-ЗВК). Якщо стиснуті дані допускають і зворотно сумісне, і розширене декодування, і якщо декодер діє в покращеному режимі таким чином, що використовує постпроцесор, який вносить деяку додаткову затримку (наприклад, постпроцесор
ЗВЕ в НЕ-ААС), то необхідно забезпечити, щоб ця додаткова часова затримка, що вноситься відносно режиму зворотної сумісності, як описано відповідним значенням п, враховувалась при представленні блока сумісності. Для забезпечення правильної обробки відміток часу сумісності (щоб звук залишався синхронізованим з іншими медіаданими), додаткова затримка, яка внесена постобробкою і дана в кількості дискретних значень (на звуковий канал) на вихідній частоті дискретизації, дорівнює 3010, якщо режим роботи декодера включає покращення 5ВЕ (у тому числі е5ВК), як описано в цій заявці. Тому для блока сумісності звуку час сумісності застосовується до 3011-го звукового дискретного значення в блоці сумісності, якщо режим роботи декодера включає покращення 5ВЕ, як описано в цій заявці.
Для підвищення суб'єктивної якості звукового вмісту з гармонічною частотною структурою і сильними тональними характеристиками, зокрема при низьких бітових швидкостях, слід активувати покращення 5ВЕК. Значення відповідного елемента бітового потоку (тобто езбг даїа/))), який керує цими інструментами, можуть бути визначені в кодері шляхом застосування механізму класифікації, залежного від сигналу.
Як правило, використання способу гармонічного вставляння (5бгРаїспіпоМоде -- 100) є переважним для кодування музикальних сигналів із дуже низькими бітовими швидкостями, коли основний кодек може бути значно обмежений у смузі пропускання звуку. Це є особливо вірним, якщо ці сигнали мають виражену гармонічну структуру. Навпаки, використання звичайного способу вставляння 5ВК є переважним для мовних і змішаних сигналів, оскільки він забезпечує краще зберігання тимчасової структури мови.
Для покращення роботи транспозера МРЕС-4 5ВК можна активувати етап попередньої обробки (р5 5бг ргергосеззіпд -- 1), який усуває внесення порушень однорідності спектра сигналу, який іде у подальший коректор обвідної. Робота інструмента є корисною для типів сигналів, у яких груба обвідна спектра сигналу нижнього діапазону, що використовується для реконструкції високих частот, проявляє великі варіації рівня.
Для покращення перехідної характеристики гармонічного вставляння 5ВК (збгРаїспіпдаМоде ж- 0) можна застосовувати адаптивну до сигналу передискретизацію в частотній ділянці (збгОмегзатріїпуоРіад -- 1). Оскільки адаптивна до сигналу передискретизація в частотній ділянці збільшує обчислювальну складність транспозера, але дає користь тільки для кадрів, які містять перехідні сигнали, використанням цього інструмента керують за допомогою елемента бітового потоку, який передають один раз на кадр і на незалежний канал ЗВК.
Звичайні рекомендовані налаштування бітової швидкості для НЕ-ААСУу2 з покращеннями
ЗВК (тобто із включенням гармонічного транспозера інструмента еЗзВЕК) відповідають 20-32 кбіт/с для стереофонічного звукового вмісту при частотах дискретизації 44,1 кГц або 48 кГц.
Відносний суб'єктивний виграш у якості покращень ЗВК збільшується в напрямку до нижньої межі бітової швидкості, і належним чином виконаний декодер дозволяє розширити цей діапазон до ще більш низьких бітових швидкостей. Представлені вище бітові швидкості являють собою лише рекомендації і можуть бути адаптовані для конкретних експлуатаційних вимог.
Декодеру, який діє в запропонованому режимі покращеного ЗВК, зазвичай необхідно мати можливість переключення між традиційним і покращеним вставлянням З5ВК. Тому може вноситися затримка, яка може бути настільки тривалою, як тривалість одного базового кадру звуку, залежно від налаштувань декодера. Зазвичай затримка буде однакова і для традиційного, і для покращеного вставляння ЗВЕ.
Необхідно розуміти, що в межах об'єму прикладеної формули винаходу даний винахід може бути реалізований на практиці інакше, у порівнянні з тим, що конкретно описано в даному документі. Будь-які посилальні позначення, що містяться в представленій нижче формулі винаходу, наведені тільки для ілюстрації, і їх ніяким чином не слід використовувати для тлумачення або обмеження формули винаходу.
Різні аспекти даного винаходу можна зрозуміти з наступних пронумерованих наведених як приклад варіантів здійснення (ПНВЗ).
ПНВЗ 1. Спосіб виконання реконструкції високих частот звукового сигналу, який включає: приймання кодованого звукового бітового потоку, при цьому кодований звуковий бітовий потік містить звукові дані, які представляють частину, що стосується нижнього діапазону, звукового сигналу, і метадані реконструкції високих частот; декодування звукових даних для генерування декодованого звукового сигналу нижнього діапазону; вилучення з кодованого звукового бітового потоку метаданих реконструкції високих частот, при цьому метадані реконструкції високих частот містять робочі параметри для процесу реконструкції високих частот, робочі параметри включають параметр режиму вставляння, бо розташований у зворотно сумісному контейнері розширення кодованого звукового бітового потоку, при цьому перше значення параметра режиму вставляння вказує на спектральний перенос, а друге значення параметра режиму вставляння вказує на гармонічну транспозицію з використанням розтягнення діапазону частот фазовим вокодером; фільтрацію декодованого звукового сигналу нижнього діапазону для генерування фільтрованого звукового сигналу нижнього діапазону; відновлення частини, що стосується верхнього діапазону, звукового сигналу з використанням фільтрованого звукового сигналу нижнього діапазону і метаданих реконструкції високих частот, при цьому відновлення включає спектральний перенос, якщо параметр режиму вставляння має перше значення, і відновлення включає гармонічну транспозицію з використанням розтягнення діапазону частот фазовим вокодером, якщо параметр режиму вставляння має друге значення; і об'єднання фільтрованого звукового сигналу нижнього діапазону з відновленої частиною, що стосується верхнього діапазону, для формування широкосмугового звукового сигналу, при цьому фільтрацію, відновлення й об'єднання виконують як операцію постобробки із затримкою в 3010 дискретних значень на звуковий канал або менше.
ПНВЗ 2. Спосіб відповідно до ПНВЗ 1, в якому кодований звуковий бітовий потік додатково включає заповнювальний елемент з ідентифікатором, який вказує початок заповнювального елемента, і заповнювальними даними після ідентифікатора, при цьому заповнювальні дані містять зворотно сумісний контейнер розширення.
ПНВЗ 3. Спосіб відповідно до ПНВЗ 2, в якому ідентифікатор являє собою трибітне ціле число без знака, у якого спочатку передають старший значущий біт, що має значення 0 х 6.
ПНВЗ 4. Спосіб відповідно до ПНВЗ 2 або ПНВЗ 3, в якому заповнювальні дані містять корисні дані розширення, при цьому корисні дані розширення містять дані розширення копіювання спектральної смуги, і корисні дані розширення ідентифікують за допомогою чотирибітного цілого числа без знака, у якого спочатку передають старший значущий біт, що має значення "1101" або "1110", і необов'язково при цьому дані розширення копіювання спектральної смуги містять: необов'язковий заголовок копіювання спектральної смуги, дані копіювання спектральної смуги після заголовка та елемент розширення копіювання спектральної смуги після даних копіювання спектральної смуги, і при цьому в елемент розширення копіювання спектральної смуги включають прапор.
ПНВЗ 5. Спосіб відповідно до будь-якого з ПНВЗ 1-4, в якому метадані реконструкції високих частот містять масштабні коефіцієнти обвідної, масштабні коефіцієнти шумового порога, інформацію часової/частотної сітки або параметр, який вказує частоту розділення.
ПНВЗ 6. Спосіб відповідно до будь-якого з ПНВЗ 1-5, в якому зворотно сумісний контейнер розширення додатково містить прапор, який вказує, чи використовується додаткова попередня обробка для уникання порушень безперервності у формі обвідної спектра частини, що стосується верхнього діапазону, коли параметр режиму вставляння дорівнює першому значенню, при цьому перше значення прапора включає додаткову попередню обробку, а друге значення прапора відключає додаткову попередню обробку.
ПНВЗ 7. Спосіб відповідно до ПНВЗ б, в якому додаткова попередня обробка включає обчислення кривої попереднього посилення з використанням коефіцієнта фільтра лінійного передбачення.
ПНВЗ 8. Спосіб відповідно до будь-якого з ПНВЗ 1-5, в якому зворотно сумісний контейнер розширення додатково містить прапор, який вказує, чи необхідно застосовувати адаптивну до сигналу передискретизацію в частотній ділянці, коли параметр режиму вставляння дорівнює другому значенню, при цьому перше значення прапора включає адаптивну до сигналу передискретизацію в частотній ділянці, а друге значення прапора відключає адаптивну до сигналу передискретизацію в частотній ділянці.
ПНВЗ 9. Спосіб відповідно до ПНВЗ 8, в якому адаптивну до сигналу передискретизацію в частотній ділянці застосовують тільки для кадрів, які містять перехідний сигнал.
ПНВЗ 10. Спосіб відповідно до будь-якого з попередніх ПНВЗ, в якому гармонічну транспозицію з використанням розтягнення діапазону частот фазовим вокодером виконують з оцінною складністю 4,5 мільйона або менше операцій у секунду і З або менше кілослів пам'яті.
ПНВЗ 11. Енергонезалежний машинопрочитуваний носій, який містить команди, які при здійсненні процесором виконують спосіб відповідно до будь-якого з ПНВЗ 1-10.
ПНВЗ 12. Комп'ютерний програмний продукт, який містить команди, які при здійсненні обчислювальним пристроєм або системою викликають здійснення вказаним обчислювальним пристроєм або системою способу відповідно до будь-якого з ПНВЗ 1-10. 60 ПНВЗ 13. Блок обробки звуку для виконання реконструкції високих частот звукового сигналу,
який містить: інтерфейс введення для приймання кодованого звукового бітового потоку, при цьому кодований звуковий бітовий потік містить звукові дані, які представляють частину, що стосується нижнього діапазону, звукового сигналу, і метадані реконструкції високих частот; основний декодер звуку для декодування звукових даних для генерування декодованого звукового сигналу нижнього діапазону; пристрій видалення форматування для вилучення з кодованого звукового бітового потоку метаданих реконструкції високих частот, при цьому метадані реконструкції високих частот містять робочі параметри для процесу реконструкції високих частот, робочі параметри включають параметр режиму вставляння, розташований у зворотно сумісному контейнері розширення кодованого звукового бітового потоку, при цьому перше значення параметра режиму вставляння вказує на спектральний перенос, а друге значення параметра режиму вставляння вказує на гармонічну транспозицію з використанням розтягнення діапазону частот фазовим вокодером; блок фільтрів аналізу для фільтрації декодованого звукового сигналу нижнього діапазону для генерування фільтрованого звукового сигналу нижнього діапазону; пристрій відновлення високих частот для реконструкції частини, що стосується верхнього діапазону, звукового сигналу з використанням фільтрованого звукового сигналу нижнього діапазону і метаданих реконструкції високих частот, при цьому реконструкція включає спектральний перенос, якщо параметр режиму вставляння має перше значення, і реконструкція включає гармонічну транспозицію з використанням розтягнення діапазону частот фазовим вокодером, якщо параметр режиму вставляння має друге значення; і блок синтезувальних фільтрів для об'єднання фільтрованого звукового сигналу нижнього діапазону з відновленої частиною, що стосується верхнього діапазону, для формування широкосмугового звукового сигналу, при цьому блок фільтрів аналізу, пристрій відновлення високих частот і блок синтезувальних фільтрів виконуються в постпроцесорі із затримкою в 3010 дискретних значень на канал звуку або менше.
ПНВЗ 14. Блок обробки звуку відповідно до ПНВЗ 13, в якому гармонічна транспозиція з використанням розтягнення діапазону частот фазовим вокодером виконується з оцінною складністю 4,5 мільйона або менше операцій у секунду і З або менше кілослів пам'яті.
Claims (13)
1. Спосіб виконання реконструкції високих частот звукового сигналу, який включає: приймання кодованого звукового бітового потоку, при цьому кодований звуковий бітовий потік містить звукові дані, які представляють частину, що стосується нижнього діапазону, звукового сигналу, і метадані реконструкції високих частот; декодування звукових даних для генерування декодованого звукового сигналу нижнього діапазону; вилучення з кодованого звукового бітового потоку метаданих реконструкції високих частот, при цьому метадані реконструкції високих частот містять робочі параметри для процесу реконструкції високих частот, робочі параметри включають параметр режиму вставляння, розташований у зворотно-сумісному контейнері розширення кодованого звукового бітового потоку, при цьому перше значення параметра режиму вставляння вказує на спектральний перенос, а друге значення параметра режиму вставляння вказує на гармонічну транспозицію з використанням розтягнення діапазону частот фазовим вокодером; фільтрацію декодованого звукового сигналу нижнього діапазону в множину піддіапазонів із використанням блока комплексних ОМЕ-фільтрів аналізу для генерування фільтрованого звукового сигналу нижнього діапазону; відновлення частини, що стосується верхнього діапазону, звукового сигналу з використанням фільтрованого звукового сигналу нижнього діапазону і метаданих реконструкції високих частот, при цьому відновлення включає спектральний перенос, якщо параметр режиму вставляння має перше значення, і відновлення включає гармонічну транспозицію з використанням розтягнення діапазону частот фазовим вокодером, якщо параметр режиму вставляння має друге значення; і об'єднання фільтрованого звукового сигналу нижнього діапазону з відновленою частиною, що стосується верхнього діапазону, із використанням блока комплексних синтезувальних ОМЕ- фільтрів для формування широкосмугового звукового сигналу, при цьому фільтри аналізу Пк(п) блока комплексних ОМЕ-фільтрів аналізу і синтезувальні 60 фільтри їк(п) блока комплексних синтезувальних ОМЕ-фільтрів визначають за формулою:
к 1 М ві) ко) «росехві кп во пемоск см М 2 2 де Ро(п) являє собою дійснозначний фільтр-прототип, М означає кількість каналів, а М являє собою порядок фільтра-прототипу; і при цьому фільтрацію, відновлення й об'єднання виконують як операцію постобробки із затримкою в 3010 дискретних значень на звуковий канал.
2. Спосіб за п. 1, який відрізняється тим, що кодований звуковий бітовий потік додатково включає заповнювальний елемент з ідентифікатором, який вказує початок заповнювального елемента, і заповнювальними даними після ідентифікатора, при цьому заповнювальні дані містять зворотно-сумісний контейнер розширення.
3. Спосіб за п. 2, який відрізняється тим, що ідентифікатор являє собою трибітне ціле число без знака, у якого спочатку передають старший значущий біт, що має значення Ох6.
4. Спосіб за п. 2 або 3, який відрізняється тим, що заповнювальні дані містять корисні дані розширення, при цьому корисні дані розширення містять дані розширення копіювання спектральної смуги і корисні дані розширення ідентифікують за допомогою чотирибітного цілого числа без знака, у якого спочатку передають старший значущий біт, що має значення "1101" або "1110", і необов'язково при цьому дані розширення копіювання спектральної смуги містять: необов'язковий заголовок копіювання спектральної смуги, дані копіювання спектральної смуги після заголовка, та елемент розширення копіювання спектральної смуги після даних копіювання спектральної смуги, і при цьому в елемент розширення копіювання спектральної смуги включають прапор.
5. Спосіб за будь-яким із пп. 1-4, який відрізняється тим, що метадані реконструкції високих частот містять масштабні коефіцієнти обвідної, масштабні коефіцієнти шумового порога, інформацію часової/частотної сітки або параметр, який вказує частоту розділення.
6. Спосіб за будь-яким із пп. 1-5, який відрізняється тим, що зворотно-сумісний контейнер розширення додатково містить прапор, який вказує, чи використовується додаткова попередня обробка для уникання порушень безперервності у формі обвідної спектра частини, що стосується верхнього діапазону, коли параметр режиму вставляння дорівнює першому значенню, при цьому перше значення прапора включає додаткову попередню обробку, а друге значення прапора відключає додаткову попередню обробку.
7. Спосіб за п. б, який відрізняється тим, що додаткова попередня обробка включає обчислення кривої попереднього посилення з використанням коефіцієнта фільтра лінійного передбачення.
8. Спосіб за будь-яким із пп. 1-5, який відрізняється тим, що зворотно-сумісний контейнер розширення додатково містить прапор, який вказує, чи необхідно застосовувати адаптивну до сигналу передискретизацію в частотній ділянці, коли параметр режиму вставляння дорівнює другому значенню, при цьому перше значення прапора включає адаптивну до сигналу передискретизацію в частотній ділянці, а друге значення прапора відключає адаптивну до сигналу передискретизацію в частотній ділянці.
9. Спосіб за п. 8, який відрізняється тим, що адаптивну до сигналу передискретизацію в частотній ділянці застосовують тільки для кадрів, які містять перехідний сигнал.
10. Спосіб за будь-яким із попередніх пунктів, який відрізняється тим, що гармонічну транспозицію з використанням розтягнення діапазону частот фазовим вокодером виконують з оцінною складністю 4,5 мільйона або менше операцій у секунду і З або менше кілослів пам'яті.
11. Машинозчитуваний носій інформації, який містить команди, які при здійсненні обчислювальним пристроєм або системою викликають здійснення вказаним обчислювальним пристроєм або системою способу за будь-яким із пп. 1-10.
12. Блок обробки звуку для виконання реконструкції високих частот звукового сигналу, який містить: інтерфейс введення для приймання кодованого звукового бітового потоку, при цьому кодований звуковий бітовий потік містить звукові дані, які представляють частину, що стосується нижнього діапазону, звукового сигналу, і метадані реконструкції високих частот; основний декодер звуку для декодування звукових даних для генерування декодованого звукового сигналу нижнього діапазону; пристрій видалення форматування для вилучення з кодованого звукового бітового потоку метаданих реконструкції високих частот, при цьому метадані реконструкції високих частот містять робочі параметри для процесу реконструкції високих частот, робочі параметри включають параметр режиму вставляння, розташований у зворотно-сумісному контейнері розширення кодованого звукового бітового потоку, при цьому перше значення параметра режиму вставляння вказує на спектральний перенос, а друге значення параметра режиму вставляння вказує на гармонічну транспозицію з використанням розтягнення діапазону частот фазовим вокодером; блок фільтрів аналізу для фільтрації декодованого звукового сигналу нижнього діапазону в множину піддіапазонів із використанням блока комплексних ОМЕ-фільтрів аналізу для генерування фільтрованого звукового сигналу нижнього діапазону; пристрій відновлення високих частот для реконструкції частини, що стосується верхнього діапазону, звукового сигналу з використанням фільтрованого звукового сигналу нижнього діапазону і метаданих реконструкції високих частот, при цьому реконструкція включає спектральний перенос, якщо параметр режиму вставляння має перше значення, і реконструкція включає гармонічну транспозицію з використанням розтягнення діапазону частот фазовим вокодером, якщо параметр режиму вставляння має друге значення; і блок синтезувальних фільтрів для об'єднання фільтрованого звукового сигналу нижнього діапазону з відновленою частиною, що стосується верхнього діапазону, із використанням блока комплексних синтезувальних ОМЕ-фільтрів для формування широкосмугового звукового сигналу, при цьому блок фільтрів аналізу, пристрій відновлення високих частот і блок синтезувальних фільтрів виконуються в постпроцесорі із затримкою в 3010 дискретних значень на канал звуку; і при цьому фільтри аналізу к(п) блока комплексних ОМЕ-фільтрів аналізу і синтезувальні фільтри іп) блока коимплекених сицнтезувальних ОМЕ-фільтрів визначають за формулою: Нк(п) - К(п) - ро(п)лехріі-ІК---|п- ХОхпаи МО «Кам М 2 2 ро(п) б «я я де Й М о. . М де являє собою дійснозначний фільтр-прототип, М означає кількість каналів, а М являє собою порядок фільтра-прототипу.
13. Блок обробки звуку за п. 12, який відрізняється тим, що гармонічна транспозиція з використанням розтягнення діапазону частот фазовим вокодером виконується з оцінною складністю 4,5 мільйона або менше операцій у секунду і З або менше кілослів пам'яті. т Биовий пот МРЕС Я А АС Сл У і Са й я З ра І-У ДРРНЕК ЕЕ КНЕЕЕККК | Ї Єістма : АКНЕ КоН ЕК, ГЕлек постоюон З З ь й: Змнемюмнхх х ях
Фіг. 1 Звукова З 2 Формувачі і ; повне пот до 77 Кодерое форматувальник 777 ВУФЕВ ко тлеНЕ ВИ жи В ! Генератор Її і секххжкхоофію Р є ши я т м 8
Фіг. 2 яв Ше ст " й з НЗЖінсж; сїжожію КЕН» жов НЕК бжрй ійж їж іже. ж кюж ЖЖ ї сніжні жо жоні ні жона тіж жсж тоні ні коні кскініжх ро фест, ЖЕ : пи Її фвудішв Зі : сіні Буфер - випалення М оНідснстеми ступ і їі ур, ар мат декодування ЯК одосбюн о і Буфер Е кскккнннкснкнн чн То у : ї сх і Е х ! зд. вання і о ЖЕ |, | ї Е заз апп коеореетееечтюотстонй У Тдя З інь і сват з - і : лу пах КОХ : ! УТ | і екератор ; ї поч кнночккнчьн нд тв спокоотнокнтчня Е і і веврувания ;
Фіг. З Її" т т т С я МАЮ ЖЖ ЖЖ Ж Ж КО ЖУК ММ. Є СКМ МАЄ ЛИЖ АЖ З МЖК СУ ЖАЄ Я ЛЮ ЖЖ Ж. Ж З БАРІ ревом ювмьовг СА І і а І Бевклриї сеть гпттнії і сененаві Буфер шк ккдалення х Бідснстема іо Ступшжь ! реч руни ЕМ деколувани свдводкн Б о Мапрнннекиї р формаиту- Ек Еккх оорожи Її, ; з ря КООВЕННЖ Коня з ЗК їі Е Ку и Ї ІК І че ! Ї шлю ххю лах ох сою ххх ху хо хо я, ан лк хх кю хо ва !
Фіг. 4 дО рен В не дню жо на са тя вк яю он мо пк пн нн п ан пал ню вс пн вк пн я ; - они дек ДУМКИ З Звуковий тек 00 | Пристрій І Підсистема і хіх пря Еуфбері--е видалення нею і " м оексоносюютесн І Вормату- екОдування і Е Хооокжч ст Бі с ЕІ вання тод Е х пот з кт кан Е тт я ТЕХ ШИН ; РО нннннинннннйннньнннюї екеннннннняю ТКТШНЬ ; генерування БІВ! З - ОНКЕ ! і хертувакня ВК і
Фіг. 5 р ; А У ПАН г : Вхід 7) Буфер! є З лчямлчнянняї ї нед ! т
Фіг. 5
Епемант оБжнЕчтнНогО о й Щ кдищлу Заповиюватькой апещент ЯХвловнвуватьникх апемавт о т тертя п р сегететннд Лутетрттттттт Б Кия т ее ї ї ї ї ї Тв : ! ; ї Ї МЕ ТІ ! З З Ї я В ТЕ і :
ЩА . йо в Ей іі і ЩЕ Іл я ДЖ жк кА В ТК жо її Шк. У мае - НУ Епімант М НЕ х Хаголовакоі БА т Хагоаловок о Заколовок познтрени ЗВ ропиошрення 7 є ЗА Козпид
Фіг. 7
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18169156 | 2018-04-25 | ||
PCT/EP2019/060600 WO2019207036A1 (en) | 2018-04-25 | 2019-04-25 | Integration of high frequency audio reconstruction techniques |
Publications (1)
Publication Number | Publication Date |
---|---|
UA129049C2 true UA129049C2 (uk) | 2025-01-01 |
Family
ID=62063367
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
UAA202007393A UA129049C2 (uk) | 2018-04-25 | 2019-04-25 | Інтеграція методик реконструкції високих частот звуку |
Country Status (16)
Country | Link |
---|---|
US (7) | US11527256B2 (uk) |
EP (1) | EP3785260A1 (uk) |
JP (3) | JP7252976B2 (uk) |
KR (1) | KR20210005164A (uk) |
CN (10) | CN118782078A (uk) |
AU (4) | AU2019258524B2 (uk) |
BR (1) | BR112020021832A2 (uk) |
CA (1) | CA3098064A1 (uk) |
CL (1) | CL2020002745A1 (uk) |
IL (5) | IL278223B2 (uk) |
MA (1) | MA52530A (uk) |
MX (10) | MX2024006662A (uk) |
SG (1) | SG11202010374VA (uk) |
UA (1) | UA129049C2 (uk) |
WO (1) | WO2019207036A1 (uk) |
ZA (2) | ZA202006518B (uk) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113436603B (zh) * | 2021-06-28 | 2023-05-02 | 北京达佳互联信息技术有限公司 | 声码器的训练方法和装置及合成音频信号的方法和声码器 |
CN114519121A (zh) * | 2021-12-30 | 2022-05-20 | 赛因芯微(北京)电子科技有限公司 | 音频串行元数据区块生成方法、装置、设备及存储介质 |
CN114627882A (zh) * | 2022-04-12 | 2022-06-14 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频处理方法、电子设备及计算机可读存储介质 |
Family Cites Families (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
SE0101175D0 (sv) | 2001-04-02 | 2001-04-02 | Coding Technologies Sweden Ab | Aliasing reduction using complex-exponential-modulated filterbanks |
PT1423847E (pt) | 2001-11-29 | 2005-05-31 | Coding Tech Ab | Reconstrucao de componentes de frequencia elevada |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
JP4817658B2 (ja) * | 2002-06-05 | 2011-11-16 | アーク・インターナショナル・ピーエルシー | 音響仮想現実エンジンおよび配信された音声改善のための新技術 |
US7933945B2 (en) | 2002-06-27 | 2011-04-26 | Openpeak Inc. | Method, system, and computer program product for managing controlled residential or non-residential environments |
US6792057B2 (en) | 2002-08-29 | 2004-09-14 | Bae Systems Information And Electronic Systems Integration Inc | Partial band reconstruction of frequency channelized filters |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
JP4937746B2 (ja) | 2004-07-20 | 2012-05-23 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
CN101140759B (zh) * | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
US20080071550A1 (en) | 2006-09-18 | 2008-03-20 | Samsung Electronics Co., Ltd. | Method and apparatus to encode and decode audio signal by using bandwidth extension technique |
EP2227682A1 (en) | 2007-11-06 | 2010-09-15 | Nokia Corporation | An encoder |
CN101458930B (zh) | 2007-12-12 | 2011-09-14 | 华为技术有限公司 | 带宽扩展中激励信号的生成及信号重建方法和装置 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
CN102789784B (zh) * | 2008-03-10 | 2016-06-08 | 弗劳恩霍夫应用研究促进协会 | 操纵具有瞬变事件的音频信号的方法和设备 |
EP2301026B1 (en) | 2008-07-11 | 2020-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal synthesizer and audio signal encoder |
JP5203077B2 (ja) | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
MY205240A (en) * | 2009-01-16 | 2024-10-09 | Dolby Int Ab | Cross product enhanced harmonic transposition |
TWI618350B (zh) | 2009-02-18 | 2018-03-11 | 杜比國際公司 | 用於高頻重建或參數立體聲之複指數調變濾波器組 |
BR122019023877B1 (pt) | 2009-03-17 | 2021-08-17 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
CO6440537A2 (es) * | 2009-04-09 | 2012-05-15 | Fraunhofer Ges Forschung | Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio |
US8971551B2 (en) * | 2009-09-18 | 2015-03-03 | Dolby International Ab | Virtual bass synthesis using harmonic transposition |
TWI484481B (zh) | 2009-05-27 | 2015-05-11 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
EP2273493B1 (en) | 2009-06-29 | 2012-12-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Bandwidth extension encoding and decoding |
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
KR101701759B1 (ko) * | 2009-09-18 | 2017-02-03 | 돌비 인터네셔널 에이비 | 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체 |
BR112012009375B1 (pt) * | 2009-10-21 | 2020-09-24 | Dolby International Ab. | Sistema configurado para gerar um componente de alta frequência de um sinal de áudio, método para gerar um componente de alta frequência de um sinal de áudio e método para projetar um transpositor de harmônicos |
EP4435779A3 (en) | 2010-01-19 | 2024-10-09 | Dolby International AB | Improved subband block based harmonic transposition |
CN103038819B (zh) | 2010-03-09 | 2015-02-18 | 弗兰霍菲尔运输应用研究公司 | 用以使用补丁边界对准处理输入音频信号的装置及方法 |
MX2012010314A (es) | 2010-03-09 | 2012-09-28 | Fraunhofer Ges Forschung | Dispositivo y metodo para respuesta de magnitud mejorada y alineacion temporaria en un metodo de extension de ancho de banda basado en un codificador de fase operado por voz para señales de audio. |
ES2986126T3 (es) | 2010-04-13 | 2024-11-08 | Fraunhofer Ges Zur Foerderungder Angewandten Forschung E V | Decodificación de la representación exacta de una señal de audio |
RU2530254C2 (ru) | 2010-07-19 | 2014-10-10 | Долби Интернешнл Аб | Обработка звуковых сигналов в ходе высокочастотной реконструкции |
US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
US8996976B2 (en) | 2011-09-06 | 2015-03-31 | Microsoft Technology Licensing, Llc | Hyperlink destination visibility |
JP2013068587A (ja) | 2011-09-22 | 2013-04-18 | Nippon Water Solution:Kk | 携帯型時間積分式漏水発見装置 |
JP6155274B2 (ja) * | 2011-11-11 | 2017-06-28 | ドルビー・インターナショナル・アーベー | 過剰サンプリングされたsbrを使ったアップサンプリング |
GB2499699A (en) | 2011-12-14 | 2013-08-28 | Wolfson Ltd | Digital data transmission involving the position of and duration of data pulses within transfer periods |
EP2631906A1 (en) | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
CN102842337A (zh) * | 2012-06-05 | 2012-12-26 | 国光电器股份有限公司 | 基于wifi的高保真音频传输方法 |
WO2015036348A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby International Ab | Time- alignment of qmf based processing data |
KR102741608B1 (ko) | 2013-10-21 | 2024-12-16 | 돌비 인터네셔널 에이비 | 오디오 신호들의 파라메트릭 재구성 |
EP2881943A1 (en) * | 2013-12-09 | 2015-06-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal with low computational resources |
EP3127109B1 (en) * | 2014-04-01 | 2018-03-14 | Dolby International AB | Efficient coding of audio scenes comprising audio objects |
TWI693594B (zh) * | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
GR1008810B (el) * | 2015-03-19 | 2016-07-07 | Νικολαος Ευστρατιου Καβουνης | Φυσικος αφρωδης οινος με βιολογικο κροκο κοζανης |
EP3208800A1 (en) | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
EP3382700A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
TWI702594B (zh) | 2018-01-26 | 2020-08-21 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建技術之回溯相容整合 |
-
2019
- 2019-04-25 SG SG11202010374VA patent/SG11202010374VA/en unknown
- 2019-04-25 CN CN202411156478.3A patent/CN118782078A/zh active Pending
- 2019-04-25 CN CN202411156783.2A patent/CN118800273A/zh active Pending
- 2019-04-25 EP EP19719519.1A patent/EP3785260A1/en not_active Ceased
- 2019-04-25 IL IL278223A patent/IL278223B2/en unknown
- 2019-04-25 CN CN202411156714.1A patent/CN118782080A/zh active Pending
- 2019-04-25 KR KR1020207033978A patent/KR20210005164A/ko active Pending
- 2019-04-25 MX MX2024006662A patent/MX2024006662A/es unknown
- 2019-04-25 CN CN202411156436.XA patent/CN118800271A/zh active Pending
- 2019-04-25 WO PCT/EP2019/060600 patent/WO2019207036A1/en active Application Filing
- 2019-04-25 IL IL303445A patent/IL303445B2/en unknown
- 2019-04-25 CN CN202411156692.9A patent/CN118782079A/zh active Pending
- 2019-04-25 UA UAA202007393A patent/UA129049C2/uk unknown
- 2019-04-25 CA CA3098064A patent/CA3098064A1/en active Pending
- 2019-04-25 IL IL310202A patent/IL310202B2/en unknown
- 2019-04-25 CN CN202411156426.6A patent/CN118824278A/zh active Pending
- 2019-04-25 CN CN202411156425.1A patent/CN118782077A/zh active Pending
- 2019-04-25 BR BR112020021832-4A patent/BR112020021832A2/pt unknown
- 2019-04-25 IL IL313391A patent/IL313391B1/en unknown
- 2019-04-25 CN CN202411156678.9A patent/CN118800272A/zh active Pending
- 2019-04-25 JP JP2020559398A patent/JP7252976B2/ja active Active
- 2019-04-25 CN CN201980034785.5A patent/CN112189231B/zh active Active
- 2019-04-25 US US17/050,669 patent/US11527256B2/en active Active
- 2019-04-25 AU AU2019258524A patent/AU2019258524B2/en active Active
- 2019-04-25 CN CN202411156370.4A patent/CN118782076A/zh active Pending
- 2019-04-25 IL IL316856A patent/IL316856A/en unknown
- 2019-04-25 MA MA052530A patent/MA52530A/fr unknown
- 2019-04-25 MX MX2020011206A patent/MX2020011206A/es unknown
-
2020
- 2020-10-20 ZA ZA2020/06518A patent/ZA202006518B/en unknown
- 2020-10-22 CL CL2020002745A patent/CL2020002745A1/es unknown
- 2020-10-22 MX MX2024006657A patent/MX2024006657A/es unknown
- 2020-10-22 MX MX2024006653A patent/MX2024006653A/es unknown
- 2020-10-22 MX MX2024006654A patent/MX2024006654A/es unknown
- 2020-10-22 MX MX2024006659A patent/MX2024006659A/es unknown
- 2020-10-22 MX MX2024006650A patent/MX2024006650A/es unknown
- 2020-10-22 MX MX2024006663A patent/MX2024006663A/es unknown
- 2020-10-22 MX MX2024006660A patent/MX2024006660A/es unknown
- 2020-10-22 MX MX2024006651A patent/MX2024006651A/es unknown
-
2022
- 2022-11-15 US US17/987,545 patent/US11810589B2/en active Active
-
2023
- 2023-01-27 ZA ZA2023/01133A patent/ZA202301133B/en unknown
- 2023-02-23 US US18/113,397 patent/US11810591B2/en active Active
- 2023-02-23 US US18/113,406 patent/US11810592B2/en active Active
- 2023-02-23 US US18/113,391 patent/US11810590B2/en active Active
- 2023-02-23 US US18/113,418 patent/US11862185B2/en active Active
- 2023-03-24 JP JP2023048111A patent/JP7493076B2/ja active Active
- 2023-11-14 US US18/508,415 patent/US12211513B2/en active Active
-
2024
- 2024-04-10 AU AU2024202301A patent/AU2024202301B2/en active Active
- 2024-04-11 AU AU2024202352A patent/AU2024202352B2/en active Active
- 2024-05-20 JP JP2024081437A patent/JP2024099068A/ja active Pending
- 2024-10-16 AU AU2024227387A patent/AU2024227387A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102560473B1 (ko) | 후처리 지연을 저감시킨 고주파 재구성 기술의 통합 | |
US20230049358A1 (en) | Backward-compatible integration of high frequency reconstruction techniques for audio signals | |
CN112863528B (zh) | 用于音频信号的高频重建的谐波转置器的后向兼容集成 | |
US20230197102A1 (en) | Integration of high frequency audio reconstruction techniques | |
EP3518233A1 (en) | Backward-compatible integration of high frequency reconstruction techniques for audio signals | |
RU2832544C2 (ru) | Интеграция методик реконструкции высоких частот с сокращенной задержкой постобработки |