[go: up one dir, main page]

RU2628900C2 - Кодер, декодер, система и способ, использующие концепцию остатка для параметрического кодирования аудиобъектов - Google Patents

Кодер, декодер, система и способ, использующие концепцию остатка для параметрического кодирования аудиобъектов Download PDF

Info

Publication number
RU2628900C2
RU2628900C2 RU2015107578A RU2015107578A RU2628900C2 RU 2628900 C2 RU2628900 C2 RU 2628900C2 RU 2015107578 A RU2015107578 A RU 2015107578A RU 2015107578 A RU2015107578 A RU 2015107578A RU 2628900 C2 RU2628900 C2 RU 2628900C2
Authority
RU
Russia
Prior art keywords
signals
audio object
downmix
estimated
residual
Prior art date
Application number
RU2015107578A
Other languages
English (en)
Other versions
RU2015107578A (ru
Inventor
Торстен КАСТНЕР
Юрген ХЕРРЕ
Йоуни ПАУЛУС
Леон ТЕРЕНТИВ
Оливер ХЕЛЛЬМУТ
Харальд ФУКС
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2015107578A publication Critical patent/RU2015107578A/ru
Application granted granted Critical
Publication of RU2628900C2 publication Critical patent/RU2628900C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к средствам для параметрического кодирования аудио. Технический результат заключается в повышении эффективности кодирования. Декодер содержит узел параметрического декодирования для генерирования множества первых оцененных сигналов аудиообъектов посредством повышающего микширования трех или более сигналов понижающего микширования. Узел параметрического декодирования сконфигурирован с возможностью повышающего микширования упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов. Более того, декодер содержит узел обработки остатка для генерирования множества вторых оцененных сигналов аудиообъектов посредством модификации одного или более из упомянутых первых оцененных сигналов аудиообъектов. Узел обработки остатка сконфигурирован с возможностью модификации упомянутого одного или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от одного или более остаточных сигналов. 9 н. и 17 з.п. ф-лы, 18 ил.

Description

Настоящее изобретение относится к кодированию, декодированию и обработке аудиосигналов, и в частности к кодеру, декодеру и способу, которые используют концепции остатка для параметрического кодирования аудиообъектов.
В последнее время параметрические методы для эффективной с точки зрения частоты следования битов (битрейта) передачи/сохранения аудиосцен, содержащих многочисленные аудиообъекты, были предложены в области кодирования аудио (см., например, [BCC], [JSC], [SAOC], [SAOC1] и [SAOC2]) и основанного на имеющейся информации разделения источников (см., например, [ISS1], [ISS2], [ISS3], [ISS4], [ISS5] и [ISS6]). Эти методы направлены на реконструкцию желаемой аудиосцены вывода или желаемого объекта аудиоисточника на основании дополнительной побочной информации, описывающей переданные и/или сохраненные аудиосцены и/или объекты аудиоисточника в аудиосцене.
Фиг. 5 представляет общий вид системы SAOC (SAOC = пространственное кодирование аудиообъектов), иллюстрирующий принцип таких параметрических систем с использованием примера SAOC MPEG (MPEG = Экспертная группа по движущемуся изображению) (см., например, [SAOC], [SAOC1] и [SAOC2]).
Общая обработка проводится избирательным по времени/частоте путем и может быть описана следующим образом:
Кодер 510 SAOC, в частности, средство 530 оценки побочной информации кодера 510 SAOC извлекает побочную информацию, описывающую характеристики максимум 32 входных сигналов s1…s32 аудиообъектов (отношения, в их простейшей форме, мощностей объектов сигналов аудиообъектов). Микшер 520 кодера 510 SAOC осуществляет понижающее микширование сигналов s1…s32 аудиообъектов для получения моно или 2-х канального результата микширования сигналов (то есть, одного или двух сигналов понижающего микширования) с использованием коэффициентов d1,1…d32,2 усиления понижающего микширования.
Сигнал(ы) понижающего микширования и побочная информация передаются или сохраняются. С этой целью аудиосигнал(ы) понижающего микширования могут быть кодированы с использованием аудиокодера 540. Аудиокодер 540 может быть хорошо известным перцептивным аудиокодером, например, аудиокодером MPEG-1 Layer II или III (другими словами .mp3), аудиокодером усовершенствованного кодирования аудио (AAC) MPEG и так далее.
На стороне приемника соответствующий аудиодекодер 550, например, перцептивный аудиодекодер, такой как аудиодекодер MPEG-1 Layer II или III (другими словами .mp3), аудиодекодер усовершенствованного кодирования аудио (AAC) MPEG и так далее, декодирует кодированный аудиосигнал(ы) понижающего микширования.
Декодер 560 SAOC концептуально пытается восстановить исходные сигналы (аудио)объектов ("разделение объектов") из упомянутого одного или двух сигналов понижающего микширования с использованием переданной и/или сохраненной побочной информации, например, посредством использования разделителя 570 виртуальных объектов. Эти аппроксимированные сигналы s1,est…s32,est (аудио)объектов затем микшируются средством 580 воспроизведения декодера 560 SAOC в целевую сцену, представленную посредством максимум 6 каналами y1,est…y6,est вывода аудио с использованием матрицы воспроизведения (описываемой коэффициентами r1,1…r32,6). Выходные данные могут представлять собой одноканальное, 2-канальное стерео или 5.1 многоканальную целевую сцену (например, один, два или шесть сигналов вывода аудио).
Вследствие основных ограничений параметрической оценки аудиообъектов на стороне декодирования в большинстве случаев, желаемая целевая сцена вывода не может быть сгенерирована идеально. На предельных рабочих точках (например, сольное воспроизведение одного аудиообъекта) часто обработка больше не может достичь адекватного субъективного звука. С этой целью схема SAOC была расширена посредством внедрения расширенных аудиообъектов (EAO) (т.е. аудиообъектов с расширенными возможностями)(см., например, [Dfx], см., например, более того, [SAOC]). Аудиообъекты, которые кодируются в качестве EAO, демонстрируют улучшенную способность отделения от других (обычных) не являющихся расширенными аудиообъектов (не-EAO), кодируемых в том же самом сигнале понижающего микширования, за счет увеличенной скорости передачи побочной информации. Концепция EAO предусматривает для каждого EAO ошибку предсказания (остаточный сигнал) параметрической модели.
Фиг. 6 представляет оценку остатка на стороне кодера, схематично иллюстрируя вычисление остаточных сигналов для каждого EAO. В кодере SAOC остаточные сигналы (вплоть до 4 EAO) оцениваются с использованием извлеченной параметрической побочной информации (PSI) и исходных сигналов источника, кодированных по форме волны и включенных в битовый поток SAOC в качестве не являющейся параметрической побочной информации об остатке (RSI). Более подробно, декодер SAOC PSI для EAO 610 генерирует оцененные сигналы sest,EAO аудиообъектов из понижающего микширования X. Узел 620 генерирования RSI затем генерирует вплоть до четырех остаточных сигналов sres,RSI,{1,…,4} на основе сгенерированных оцененных сигналов sest,EAO аудиообъектов и на основе исходных сигналов s1,…,s4 аудиообъектов EAO.
Фиг. 7 представляет базовую структуру декодера SAOC с поддержкой EAO, иллюстрируя концептуальный общий вид схемы обработки EAO, интегрированной в цепь декодирования/транскодирования SAOC (транскодирование = преобразование данных из одного кодирования в другое кодирование).
Параметры, ориентированные на сигнал понижающего микширования, а именно коэффициенты предсказания канала (CPC) получаются из параметрической побочной информации (PSI) посредством узла 710 оценки CPC.
CPC вместе с сигналом понижающего микширования подаются в блок-Два-в-N 720 (блок-ДВN). Блок-ДВN 720 концептуально пытается оценить EAO (sest,EAO) из переданного сигнала (X) понижающего микширования и обеспечить оцененное понижающее микширование не-EAO (Xest,nonEAO), состоящее только из не-EAO.
Переданные/сохраненные (и декодированные) остаточные сигналы (sres, RSI) используются посредством узла 730 обработки RSI для улучшения оценок EAO (sest, EAO) и соответствующего понижающего микширования только объектов не-EAO (XnonEAO).
Согласно уровню техники, на следующем этапе узел 730 обработки RSI подает сигнал понижающего микширования не-EAO (XnonEAO) в процессор 740 понижающего микширования SAOC (узел декодирования PSI) для оценки объектов не-EAO sest,nonEAO. Узел 740 декодирования PSI передает оцененные аудиообъекты не-EAO sest,nonEAO узлу 750 воспроизведения. Более того, узел обработки RSI непосредственно подает расширенные EAO
Figure 00000001
в узел 750 воспроизведения. Узел 750 воспроизведения затем генерирует моно или стерео выходные сигналы на основе оцененных аудиообъектов не-EAO sest,nonEAO и на основе расширенных EAO
Figure 00000001
.
Система уровня техники имеет следующие недостатки:
До применения остаточных сигналов к вычислению EAO в декодере SAOC ориентированные на понижающее микширование CPC должны быть вычислены из переданной/сохраненной параметрической побочной информации.
Все сигналы понижающего микширования должны быть обработаны в пределах концепции остатка SAOC вне зависимости от их пригодности для обработки EAO.
Концепция остатка SAOC может быть использована только с одно- или двухканальными результатами микширования сигналов вследствие ограничений блока-ДВN. Концепция остатка EAO не может быть использована в комбинации с многоканальными результатами микширования (например, 5.1-многоканальными результатами микширования).
Кроме того, вследствие соответствующей вычислительной сложности их оценки, обработка EAO SAOC устанавливает ограничения на число EAO (то есть, до 4).
Из-за этих ограничений концепция обработки остатка EAO SAOC не может быть применена к многоканальным (например, 5.1) сигналам понижающего микширования или использована для более чем 4 EAO.
Поэтому было бы предпочтительно обеспечить улучшенные концепции для кодирования аудиосигнала, декодирования аудиосигнала и обработки аудиосигнала.
Целью настоящего изобретения является обеспечение улучшенных концепций для кодирования аудиосигнала, декодирования аудиосигнала и обработки аудиосигнала. Цель настоящего изобретения решается декодером по пункту 1, генератором остаточных сигналов по пункту 11, кодером по пункту 19, системой по пункту 21, кодированным сигналом по пункту 22, способом по пункту 23, способом по пункту 24 и компьютерной программой по пункту 25.
Обеспечен декодер. Декодер содержит узел параметрического декодирования для генерирования множества первых оцененных сигналов аудиообъектов посредством повышающего микширования трех или более сигналов понижающего микширования, при этом упомянутые три или более сигналов понижающего микширования кодируют множество исходных сигналов аудиообъектов, при этом узел параметрического декодирования сконфигурирован с возможностью повышающего микширования упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов. Более того, декодер содержит узел обработки остатка для генерирования множества вторых оцененных сигналов аудиообъектов посредством модификации одного или более из упомянутых первых оцененных сигналов аудиообъектов, при этом узел обработки остатка сконфигурирован с возможностью модификации упомянутого одного или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от одного или более остаточных сигналов.
Вариант осуществления представляет объектно-ориентированную концепцию остатка, которая улучшает воспринимаемое качество EAO. В отличие от системы уровня техники, представленная концепция не ограничивается ни числом сигналов понижающего микширования, ни числом EAO. Представлены два способа для получения связанных с объектами остаточных сигналов. Каскадная концепция, с помощью которой энергия остаточного сигнала итерационно сокращается с увеличением числа EAO ценой более высокой вычислительной сложности, и вторая концепция с меньшей вычислительной сложностью, в которой все остатки оцениваются одновременно.
Кроме того, варианты осуществления обеспечивают улучшенную концепцию применения объектно-ориентированных остаточных сигналов на стороне декодера, и концепции с уменьшенной сложностью, предназначенные для сценариев применения, в которых только EAO подвергаются манипулированию на стороне декодера, или модификация не-EAO ограничивается масштабированием усиления.
Согласно варианту осуществления узел обработки остатка может быть сконфигурирован с возможностью модификации упомянутого одного или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от по меньшей мере трех остаточных сигналов. Декодер адаптирован с возможностью генерирования по меньшей мере трех каналов вывода аудио на основе упомянутого множества вторых оцененных сигналов аудиообъектов.
Согласно варианту осуществления декодер дополнительно может содержать узел модификации понижающего микширования. Узел обработки остатка может определять один или более сигналов аудиообъектов из упомянутого множества вторых оцененных сигналов аудиообъектов. Узел модификации понижающего микширования может быть адаптирован с возможностью удаления определенного одного или более вторых оцененных сигналов аудиообъектов из упомянутых трех или более сигналов понижающего микширования для получения трех или более модифицированных сигналов понижающего микширования. Узел параметрического декодирования может быть сконфигурирован с возможностью определения одного или более сигналов аудиообъектов из упомянутых первых оцененных сигналов аудиообъектов на основе упомянутых трех или более модифицированных сигналов понижающего микширования.
В конкретном варианте осуществления узел модификации понижающего микширования может, например, быть адаптирован с возможностью применения формулы
Figure 00000002
.
Более того, декодер может быть адаптирован с возможностью проведения двух или более итеративных шагов. Для каждого итеративного шага, узел параметрического декодирования может быть адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества первых оцененных сигналов аудиообъектов. Более того для упомянутого итеративного шага, узел обработки остатка может быть адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества вторых оцененных сигналов аудиообъектов посредством модификации упомянутого сигнала аудиообъекта из упомянутого множества первых оцененных сигналов аудиообъектов. Кроме того, для упомянутого итеративного шага, узел модификации понижающего микширования может быть адаптирован с возможностью удаления упомянутого сигнала аудиообъекта из упомянутого множества вторых оцененных сигналов аудиообъектов из упомянутых трех или более сигналов понижающего микширования для модификации упомянутых трех или более сигналов понижающего микширования. На следующем итеративном шаге, следующем за упомянутым итеративным шагом, узел параметрического декодирования может быть адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества первых оцененных сигналов аудиообъектов на основе упомянутых трех или более сигналов понижающего микширования, которые были модифицированы.
В варианте осуществления каждый из упомянутого одного или более остаточных сигналов может указывать различие между одним из упомянутого множества исходных сигналов аудиообъектов и одним из упомянутого одного или более первых оцененных сигналов аудиообъектов.
Согласно варианту осуществления, в котором узел обработки остатка может быть адаптирован с возможностью генерирования упомянутого множества вторых оцененных сигналов аудиообъектов посредством модификации пяти или более упомянутых первых оцененных сигналов аудиообъектов, при этом узел обработки остатка может быть сконфигурирован с возможностью модификации упомянутых пяти или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от пяти или более остаточных сигналов.
В другом варианте осуществления декодер может быть сконфигурирован с возможностью генерирования семи или более каналов вывода аудио на основе упомянутого множества вторых оцененных сигналов аудиообъектов.
Согласно дополнительному варианту осуществления декодер может быть адаптирован с возможностью не определять коэффициенты предсказания канала для определения упомянутого множества вторых оцененных сигналов аудиообъектов. Варианты осуществления обеспечивают концепции, так что вычисление коэффициентов предсказания канала, которые до сих пор были необходимы для декодирования в SAOC уровня техники, больше не является необходимым для декодирования.
В дополнительном варианте осуществления декодер может быть декодером SAOC.
Более того, обеспечен генератор остаточных сигналов. Генератор остаточных сигналов содержит узел параметрического декодирования для генерирования множества оцененных сигналов аудиообъектов посредством повышающего микширования трех или более сигналов понижающего микширования, при этом упомянутые три или более сигналов понижающего микширования кодируют множество исходных сигналов аудиообъектов, при этом узел параметрического декодирования сконфигурирован с возможностью повышающего микширования упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов. Более того, генератор остаточных сигналов содержит узел оценки остатка для генерирования множества остаточных сигналов на основе упомянутого множества исходных сигналов аудиообъектов и на основе упомянутого множества оцененных сигналов аудиообъектов, так что каждый из упомянутого множества остаточных сигналов является разностным сигналом, указывающим различие между одним из упомянутого множества исходных сигналов аудиообъектов и одним из упомянутого множества оцененных сигналов аудиообъектов.
В варианте осуществления узел оценки остатка может быть адаптирован с возможностью генерирования по меньшей мере пяти остаточных сигналов на основе по меньшей мере пяти исходных сигналов аудиообъектов из упомянутого множества исходных сигналов аудиообъектов и на основе по меньшей мере пяти оцененных сигналов аудиообъектов из упомянутого множества оцененных сигналов аудиообъектов.
В варианте осуществления генератор остаточных сигналов может дополнительно содержать узел модификации понижающего микширования, адаптированный c возможностью модификации упомянутых трех или более сигналов понижающего микширования для получения трех или более модифицированных сигналов понижающего микширования. Узел параметрического декодирования может быть сконфигурирован с возможностью определения одного или более сигналов аудиообъектов из упомянутых первых оцененных сигналов аудиообъектов на основе упомянутых трех или более модифицированных сигналов понижающего микширования.
В варианте осуществления узел модификации понижающего микширования может, например, быть сконфигурирован с возможностью модификации упомянутых трех или более исходных сигналов понижающего микширования для получения упомянутых трех или более модифицированных сигналов понижающего микширования посредством удаления одного или более из упомянутого множества исходных сигналов аудиообъектов из упомянутых трех или более исходных сигналов понижающего микширования.
В другом варианте осуществления узел модификации понижающего микширования может, например, быть сконфигурирован с возможностью модификации упомянутых трех или более исходных сигналов понижающего микширования для получения упомянутых трех или более модифицированных сигналов понижающего микширования посредством генерирования одного или более модифицированных сигналов аудиообъектов на основе одного или более из оцененных сигналов аудиообъектов и на основе одного или более из остаточных сигналов, и посредством удаления упомянутого одного или более модифицированных сигналов аудиообъектов из упомянутых трех или более исходных сигналов понижающего микширования. Например, каждый из упомянутого одного или более модифицированных сигналов аудиообъектов может быть сгенерирован посредством узла модификации понижающего микширования посредством модификации одного из оцененных сигналов аудиообъектов, при этом узел модификации понижающего микширования может быть адаптирован с возможностью модификации упомянутого оцененного сигнала аудиообъекта в зависимости от одного из упомянутого одного или более остаточных сигналов.
В обоих вариантах осуществления, описанных выше по тексту, узел модификации понижающего микширования может, например, быть адаптирован с возможностью применения формулы
Figure 00000003
, в которой
Figure 00000004
является понижающим микшированием, которое должно быть модифицировано, в которой
Figure 00000005
указывает информацию понижающего микширования, в которой
Figure 00000006
содержит исходные сигналы аудиообъектов, которые должны быть удалены, или модифицированные сигналы аудиообъектов, в которой
Figure 00000007
указывает местоположения сигналов, которые должны быть удалены, и в которой
Figure 00000008
является модифицированным сигналом понижающего микширования. Например, местоположение (позиция) сигнала аудиообъекта соответствует местоположению (позиции) его аудиообъекта в списке всех объектов.
Согласно варианту осуществления генератор остаточных сигналов может быть адаптирован с возможностью проведения двух или более итеративных шагов. Для каждого итеративного шага узел параметрического декодирования может быть адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества оцененных сигналов аудиообъектов. Более того, для упомянутого итеративного шага узел оценки остатка может быть адаптирован с возможностью определения ровно одного остаточного сигнала из упомянутого множества остаточных сигналов посредством модификации упомянутого сигнала аудиообъекта из упомянутого множества оцененных сигналов аудиообъектов. Кроме того, для упомянутого итеративного шага узел модификации понижающего микширования может быть адаптирован с возможностью модификации упомянутых трех или более сигналов понижающего микширования. На следующем итеративном шаге, следующем за упомянутым итеративным шагом, узел параметрического декодирования может быть адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества оцененных сигналов аудиообъектов на основе упомянутых трех или более сигналов понижающего микширования, которые были модифицированы.
В варианте осуществления обеспечен кодер для кодирования множества исходных сигналов аудиообъектов посредством генерирования трех или более сигналов понижающего микширования, посредством генерирования параметрический побочной информации и посредством генерирования множества остаточных сигналов. Кодер содержит генератор понижающего микширования для обеспечения упомянутых трех или более сигналов понижающего микширования, указывающих понижающее микширование упомянутого множества исходных сигналов аудиообъектов. Более того, кодер содержит средство оценки параметрический побочной информации для генерирования параметрический побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов, для получения параметрической побочной информации. Кроме того, кодер содержит генератор остаточных сигналов согласно одному из описанных выше по тексту вариантов осуществления. Узел параметрического декодирования генератора остаточных сигналов адаптирован с возможностью генерирования множества оцененных сигналов аудиообъектов посредством повышающего микширования упомянутых трех или более сигналов понижающего микширования, обеспеченных посредством генератора понижающего микширования, при этом сигналы понижающего микширования кодируют упомянутое множество исходных сигналов аудиообъектов. Узел параметрического декодирования сконфигурирован с возможностью повышающего микширования упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, сгенерированной средством оценки параметрический побочной информации. Узел оценки остатка генератора остаточных сигналов адаптирован с возможностью генерирования упомянутого множества остаточных сигналов на основе упомянутого множества исходных сигналов аудиообъектов и на основе упомянутого множества оцененных сигналов аудиообъектов, так что каждый из упомянутого множества остаточных сигналов указывает различие между одним из упомянутого множества исходных сигналов аудиообъектов и одним из упомянутого множества оцененных сигналов аудиообъектов.
В варианте осуществления кодер может быть кодером SAOC.
Более того, обеспечена система. Система содержит кодер согласно одному из описанных выше по тексту вариантов осуществления для кодирования множества исходных сигналов аудиообъектов посредством генерирования трех или более сигналов понижающего микширования, посредством генерирования параметрический побочной информации и посредством генерирования множества остаточных сигналов. Кроме того, система содержит декодер согласно одному из описанных выше по тексту вариантов осуществления, при этом декодер сконфигурирован с возможностью генерирования множества каналов вывода аудио на основе упомянутых трех или более сигналов понижающего микширования, генерируемых посредством кодера, на основе параметрической побочной информации, генерируемой посредством кодера и на основе упомянутого множества остаточных сигналов, генерируемых посредством кодера.
Кроме того, обеспечен кодированный аудиосигнал. Кодированный аудиосигнал содержит три или более сигналов понижающего микширования, параметрическую побочную информации и множество остаточных сигналов. Упомянутые три или более сигналов понижающего микширования являются понижающим микшированием множества исходных сигналов аудиообъектов. Параметрическая побочная информация содержит параметры, указывающие побочную информацию об упомянутом множестве исходных сигналов аудиообъектов. Каждый из упомянутого множества остаточных сигналов является разностным сигналом, указывающим различие между одним из упомянутого множества исходных сигналов аудиообъектов и одним из множества оцененных сигналов аудиообъектов.
Более того, обеспечен способ. Способ содержит:
- Генерирование множества первых оцененных сигналов аудиообъектов посредством повышающего микширования трех или более сигналов понижающего микширования, при этом упомянутые три или более сигналов понижающего микширования кодируют множество исходных сигналов аудиообъектов, при этом генерирование упомянутого множества первых оцененных сигналов аудиообъектов содержит повышающее микширование упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов. И:
- Генерирование множества вторых оцененных сигналов аудиообъектов посредством модификации одного или более из упомянутых первых оцененных сигналов аудиообъектов, при этом генерирование множества вторых оцененных сигналов аудиообъектов содержит модификацию упомянутого одного или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от одного или более остаточных сигналов.
Кроме того, обеспечен другой способ. Упомянутый способ содержит:
- Генерирование множества оцененных сигналов аудиообъектов посредством повышающего микширования трех или более сигналов понижающего микширования, при этом упомянутые три или более сигналов понижающего микширования кодируют множество исходных сигналов аудиообъектов, при этом генерирование упомянутого множества оцененных сигналов аудиообъектов содержит повышающее микширование упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов. И:
- Генерирование множества остаточных сигналов на основе упомянутого множества исходных сигналов аудиообъектов и на основе упомянутого множества оцененных сигналов аудиообъектов, так что каждый из упомянутого множества остаточных сигналов является разностным сигналом, указывающим различие между одним из упомянутого множества исходных сигналов аудиообъектов и одним из упомянутого множества оцененных сигналов аудиообъектов.
Более того, обеспечена компьютерная программа для реализации одного из описанных выше по тексту способов при исполнении на компьютере или процессоре сигналов.
В дальнейшем варианты осуществления настоящего изобретения описаны более подробно со ссылками на фигуры, на которых представлено следующее:
Фиг. 1A иллюстрирует декодер согласно варианту осуществления,
Фиг. 1B иллюстрирует декодер согласно другому варианту осуществления, при этом декодер дополнительно содержит средство воспроизведения,
Фиг. 2A иллюстрирует генератор остаточных сигналов согласно варианту осуществления,
Фиг. 2B иллюстрирует кодер согласно варианту осуществления,
Фиг. 3 иллюстрирует систему согласно варианту осуществления,
Фиг. 4 иллюстрирует кодированный аудиосигнал согласно варианту осуществления,
Фиг. 5 представляет общий вид системы SAOC, иллюстрирующий принцип таких параметрических систем с использованием примера SAOC MPEG,
Фиг. 6 представляет оценку остатка на стороне кодера, схематично иллюстрируя вычисление остаточных сигналов для каждого EAO,
Фиг. 7 представляет базовую структуру декодера SAOC с поддержкой EAO, иллюстрирующую концептуальный общий вид схемы обработки EAO, интегрированной в цепь декодирования/транскодирования SAOC,
Фиг. 8 представляет концептуальный общий вид представленной схемы параметрического и основанного на остатке кодирования аудиообъектов согласно варианту осуществления,
Фиг. 9 представляет концепцию для совместной оценки остаточного сигнала для каждого сигнала EAO на стороне кодера согласно варианту осуществления,
Фиг. 10 иллюстрирует концепцию совместного декодирования остатка на стороне декодера согласно варианту осуществления,
Фиг.11 иллюстрирует генератор остаточных сигналов согласно варианту осуществления, при этом генератор остаточных сигналов дополнительно содержит узел модификации понижающего микширования,
Фиг. 12 иллюстрирует декодер согласно варианту осуществления, при этом декодер дополнительно содержит узел модификации понижающего микширования,
Фиг. 13 иллюстрирует концепцию вычисления остаточных компонентов каскадным способом на стороне кодера согласно варианту осуществления,
Фиг. 14 иллюстрирует каскадно-включаемый узел "декодирования RSI", используемый в комбинации с каскадным вычислением остатка на стороне декодера согласно варианту осуществления,
Фиг. 15 иллюстрирует генератор остаточных сигналов согласно варианту осуществления, использующему каскадную концепцию, и
Фиг. 16 иллюстрирует декодер согласно варианту осуществления, использующему каскадную концепцию,
Фиг. 2A иллюстрирует генератор 200 остаточных сигналов согласно варианту осуществления.
Генератор 200 остаточных сигналов содержит узел 230 параметрического декодирования для генерирования множества оцененных сигналов аудиообъектов (оцененного сигнала #1 аудиообъекта, … оцененного сигнала #M аудиообъекта) посредством повышающего микширования трех или более сигналов понижающего микширования (сигнала #1 понижающего микширования, сигнала #2 понижающего микширования, сигнала #3 понижающего микширования, …, сигнала #N понижающего микширования). Упомянутые три или более сигналов понижающего микширования (сигнал #1 понижающего микширования, сигнал #2 понижающего микширования, сигнал #3 понижающего микширования, …, сигнал #N понижающего микширования) кодируют множество исходных сигналов аудиообъектов (исходный сигнал #1 аудиообъекта, …, исходный сигнал #M аудиообъекта). Узел 230 параметрического декодирования сконфигурирован с возможностью повышающего микширования упомянутых трех или более сигналов понижающего микширования (сигнала #1 понижающего микширования, сигнала #2 понижающего микширования, сигнала #3 понижающего микширования, …, сигнала #N понижающего микширования) в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов (исходном сигнале #1 аудиообъекта, …, исходном сигнале #M аудиообъекта).
Более того, генератор 200 остаточных сигналов содержит узел 240 оценки остатка для генерирования множества остаточных сигналов (остаточного сигнала #1, …, остаточного сигнала #M) на основе упомянутого множества исходных сигналов аудиообъектов (исходного сигнала #1 аудиообъекта, …, исходного сигнала #M аудиообъекта) и на основе упомянутого множества оцененных сигналов аудиообъектов (оцененного сигнала #1 аудиообъекта, …, оцененного сигнала #M аудиообъекта), так что каждый из упомянутого множества остаточных сигналов (остаточного сигнала #1, …, остаточного сигнала #M) является разностным сигналом, указывающим различие между одним из упомянутого множества исходных сигналов аудиообъектов (исходного сигнала #1 аудиообъекта, …, исходного сигнала #M аудиообъекта) и одним из упомянутого множества оцененных сигналов аудиообъектов (оцененного сигнала #1 аудиообъекта, … оцененного сигнала #M аудиообъекта).
Кодер согласно описанному выше по тексту варианту осуществления преодолевает ограничения SAOC (см. [SAOC]) уровня техники.
Настоящие системы SAOC проводят понижающее микширование посредством использования одного или более блоков-два-в-один или одного или более блоков три-в-два. Среди прочего, из-за этих основных ограничений, настоящие системы SAOC могут осуществлять понижающее микширование сигналов аудиообъектов в, самое большое, два канала понижающего микширования/два сигнала понижающего микширования.
Обеспечены концепции для генераторов остаточных сигналов и для кодеров, что позволяет преодолевать ограничения SAOC, так что кодирование аудиообъектов теперь является преимущественным для систем передачи, которые используют более двух каналов передачи.
В варианте осуществления узел 240 оценки остатка адаптирован с возможностью генерирования по меньшей мере пяти остаточных сигналов на основе по меньшей мере пяти исходных сигналов аудиообъектов из упомянутого множества исходных сигналов аудиообъектов и на основе по меньшей мере пяти оцененных сигналов аудиообъектов из упомянутого множества оцененных сигналов аудиообъектов.
Фиг. 2B иллюстрирует кодер согласно варианту осуществления. Кодер с Фиг. 2B содержит генератор 200 остаточных сигналов.
Более того, кодер содержит генератор 210 понижающего микширования для обеспечения упомянутых трех или более сигналов понижающего микширования (сигнала #1 понижающего микширования, сигнала #2 понижающего микширования, сигнала #3 понижающего микширования, …, сигнала #N понижающего микширования), указывающих понижающее микширование упомянутого множества исходных сигналов аудиообъектов (исходного сигнала #1 аудиообъекта, …, исходного сигнала #M аудиообъекта, дополнительного исходного сигнала(ов) аудиообъекта)).
Относительно исходного сигнала #1 аудиообъекта, …, исходного сигнала #M аудиообъекта, узел 240 оценки остатка генерирует остаточный сигнал (остаточный сигнал #1, ..., остаточный сигнал #M). Таким образом, исходный сигнал #1 аудиообъекта, …, исходный сигнал #M аудиообъекта относятся к расширенным аудиообъектам (EAO).
Однако, как видно на Фиг. 2B, по выбору, могут существовать дополнительные исходные сигнал(ы) аудиообъектов, которые подвергаются понижающему микшированию, но для которых никакие остаточные сигналы не будут генерироваться. Эти дополнительные исходные сигнал(ы) аудиообъектов относятся таким образом к не являющимся расширенными аудиообъектам (не-EAO).
Кодер с Фиг. 2B дополнительно содержит средство 220 оценки параметрический побочной информации для генерирования параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов (исходном сигнале #1 аудиообъекта, …, исходном сигнале #M аудиообъекта, дополнительном исходном сигнале(ах) аудиообъекта), для получения параметрической побочной информации. В варианте осуществления с Фиг. 2B, средство оценки параметрический побочной информации также учитывает исходные сигналы аудиообъектов (дополнительные исходные сигнал(ы) аудиообъектов), относящиеся к не-EAO.
В варианте осуществления, число исходных сигналов аудиообъектов может быть равным числу остаточных сигналов, например, когда все исходные сигналы аудиообъектов относятся к EAO.
В других вариантах осуществления, однако, число остаточных сигналов может отличаться от числа исходных сигналов аудиообъектов и/или может отличаться от числа оцененных сигналов аудиообъектов, например, когда исходные сигналы аудиообъектов относятся к не-EAO.
В некоторых вариантах осуществления, кодер является кодером SAOC.
Фиг. 1A иллюстрирует декодер согласно варианту осуществления.
Декодер содержит узел 110 параметрического декодирования для генерирования множества первых оцененных сигналов аудиообъектов (1-го оцененного сигнала #1 аудиообъекта, … 1-го оцененного сигнала #M аудиообъекта) посредством повышающего микширования трех или более сигналов понижающего микширования (сигнала #1 понижающего микширования, сигнала #2 понижающего микширования, сигнала #3 понижающего микширования, …, сигнала #N понижающего микширования), при этом упомянутые три или более сигналов понижающего микширования (сигнал #1 понижающего микширования, сигнал #2 понижающего микширования, сигнал #3 понижающего микширования, …, сигнал #N понижающего микширования) кодируют множество исходных сигналов аудиообъектов, при этом узел 110 параметрического декодирования сконфигурирован с возможностью повышающего микширования упомянутых трех или более сигналов понижающего микширования (сигнала #1 понижающего микширования, сигнала #2 понижающего микширования, сигнала #3 понижающего микширования, …, сигнала #N понижающего микширования) в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов.
Более того, декодер содержит узел 120 обработки остатка для генерирования множества вторых оцененных сигналов аудиообъектов (2-ого оцененного сигнала #1 аудиообъекта, … 2-го оцененного сигнала #M аудиообъекта) посредством модификации одного или более из упомянутых первых оцененных сигналов аудиообъектов (1-го оцененного сигнала #1 аудиообъекта, … 1-го оцененного сигнала #M аудиообъекта), при этом узел 120 обработки остатка сконфигурирован с возможностью модификации упомянутого одного или более из упомянутых первых оцененных сигналов аудиообъектов (1-го оцененного сигнала #1 аудиообъекта, … 1-го оцененного сигнала #M аудиообъекта) в зависимости от одного или более остаточных сигналов (остаточного сигнала #1, …, остаточного сигнала #M).
Декодер согласно описанному выше по тексту варианту осуществления преодолевает ограничения SAOC (см. [SAOC]) уровня техники.
Кроме того, настоящие системы SAOC проводят повышающее микширование посредством использования одного или более блоков-один-в-два (блоков ОВД) или одного или более блоков-два-в-три (блоков ДВТ). Среди прочего, из-за этих ограничений сигналы аудиообъектов, кодируемые более чем с двумя сигналами понижающего микширования/каналами понижающего микширования, не могут подвергаться повышающему микшированию посредством декодеров SAOC уровня техники.
Обеспечены концепции для декодеров, что позволяет преодолевать ограничения SAOC, так что кодирование аудиообъектов в настоящее время является преимущественным для систем передачи, которые используют более двух каналов передачи.
Фиг. 1B иллюстрирует декодер согласно другому варианту осуществления, при этом декодер дополнительно содержит узел 130 воспроизведения для генерирования упомянутого множества каналов вывода аудио (канала #1 вывода аудио, …, канала #R вывода аудио) из упомянутых вторых оцененных сигналов аудиообъектов (2-го оцененного сигнала #1 аудиообъекта, … 2-го оцененного сигнала #M аудиообъекта) в зависимости от информации воспроизведения. Например, информация воспроизведения может быть матрицей воспроизведения и/или коэффициентами матрицы воспроизведения и узел 130 воспроизведения может быть сконфигурирован с возможностью применения матрицы воспроизведения в отношении упомянутых вторых оцененных сигналах аудиообъектов (2-ого оцененного сигнала #1 аудиообъекта, … 2-ого оцененного сигнала #M аудиообъекта) для получения упомянутого множества каналов вывода аудио (канала #1 вывода аудио, …, канала #R вывода аудио).
Согласно варианту осуществления узел 120 обработки остатка сконфигурирован с возможностью модификации упомянутого одного или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от по меньшей мере трех остаточных сигналов. Декодер адаптирован с возможностью генерирования упомянутых по меньшей мере трех каналов вывода аудио на основе упомянутого множества вторых оцененных сигналов аудиообъектов.
В другом варианте осуществления каждый из упомянутого одного или более остаточных сигналов указывает различие между одним из упомянутого множества исходных сигналов аудиообъектов и одним из упомянутого одного или более первых оцененных сигналов аудиообъектов.
Согласно варианту осуществления узел 120 обработки остатка адаптирован с возможностью генерирования упомянутого множества вторых оцененных сигналов аудиообъектов посредством модификации пяти или более из упомянутых первых оцененных сигналов аудиообъектов. Узел 120 обработки остатка адаптирован с возможностью модификации упомянутых пяти или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от пяти или более остаточных сигналов.
В другом варианте осуществления декодер сконфигурирован с возможностью генерирования семи или более каналов вывода аудио на основе упомянутого множества вторых оцененных сигналов аудиообъектов.
Согласно дополнительному варианту осуществления декодер адаптирован с возможностью не определять коэффициенты предсказания канала для определения упомянутого множества вторых оцененных сигналов аудиообъектов.
В дополнительном варианте осуществления, декодер является декодером SAOC.
Фиг. 3 иллюстрирует систему согласно варианту осуществления. Система содержит кодер 310 согласно одному из описанных выше по тексту вариантов осуществления для кодирования множества исходных сигналов аудиообъектов (исходного сигнала #1 аудиообъекта, …, исходного сигнала #M аудиообъекта) посредством генерирования трех или более сигналов понижающего микширования, посредством генерирования параметрический побочной информации и посредством генерирования множества остаточных сигналов. Кроме того, система содержит декодер 320 согласно одному из описанных выше по тексту вариантов осуществления, при этом декодер 320 сконфигурирован с возможностью генерирования множества вторых оцененных сигналов аудиообъектов на основе упомянутых трех или более сигналов понижающего микширования, генерируемых посредством кодера 310, на основе параметрической побочной информации, генерируемой посредством кодера 310 и на основе упомянутого множества остаточных сигналов, генерируемых посредством кодера 310.
Фиг. 4 иллюстрирует кодированный аудиосигнал согласно варианту осуществления. Кодированный аудиосигнал содержит три или более сигналов 410 понижающего микширования, параметрическую побочную информации 420 и множество остаточных сигналов 430. Упомянутые три или более сигналов 410 понижающего микширования являются понижающим микшированием множества исходных сигналов аудиообъектов. Параметрическая побочная информация 420 содержит параметры, указывающие побочную информацию об упомянутом множестве исходных сигналов аудиообъектов. Каждый из упомянутого множества остаточных сигналов 430 является разностным сигналом, указывающим различие между одним из упомянутого множества исходных сигналов аудиообъектов и одним из множества оцененных сигналов аудиообъектов.
В последующем, обеспечен общий вид концепции согласно варианту осуществления.
Фиг. 8 представляет концептуальный общий вид представленной схемы параметрического и основанного на остатке кодирования аудиообъектов согласно варианту осуществления, при этом схема кодирования демонстрирует передовой сигнал понижающего микширования и передовую поддержку EAO.
На стороне кодера средство 220 оценки параметрический побочной информации ("узел генерирования PSI") вычисляет PSI для оценки сигналов объектов на декодере, используя характеристики, связанные с понижающим микшированием и источником. Узел 245 генерирования RSI вычисляет для каждого сигнала объекта, который должен быть расширен, информацию об остатке посредством анализа различий между оцененными и исходными сигналами объектов. Узел 245 генерирования RSI может, например, содержать узел 230 параметрического декодирования и узел 240 оценки остатка.
На стороне декодера узел 110 параметрического декодирования (узел "декодирования PSI") оценивает сигналы объекта из сигналов понижающего микширования с данной PSI. На втором этапе узел 120 обработки остатка (узел "декодирования RSI") использует RSI для улучшения качества оцененных сигналов объектов, которые должны быть расширены. Все сигналы объектов (расширенных и нерасширенных аудиообъектов) могут, например, быть переданы узлу 130 воспроизведения для генерирования целевой сцены вывода.
Следует отметить, что нет необходимости учитывать все сигналы понижающего микширования. Сигналы понижающего микширования могут быть исключены из вычисления, если можно пренебречь их вкладом в оценку или/и оценку и расширение сигналов объектов.
Для простоты понимания, этапы обработки на Фиг. 8 и последующих фигурах представлены в качестве отдельных узлов обработки. На практике, они могут быть эффективно объединены для сокращения вычислительной сложности.
В последующем, обеспечена концепция совместного кодирования/декодирования остатка.
Фиг. 9 изображает концепцию для совместной оценки остаточного сигнала для каждого сигнала EAO на стороне кодера согласно варианту осуществления.
Узел 230 параметрического декодирования (узел "декодирования PSI") вырабатывает оценку сигналов аудиообъектов (оцененных сигналов sest,PSI,{1,…,M} аудиообъектов принимая в качестве входных данных оцененную PSI и сигнал(ы) понижающего микширования. Оцененные сигналы sest,PSI{1,…,M} аудиообъектов сравниваются с исходными неизмененными сигналами s1,…,sM источника в узле 240 оценки остатка (узел "оценки RSI"). Узел 240 оценки остатка обеспечивает элемент sres,RSI,{1,…,M} остаточного сигнала/сигнала ошибки для каждого аудиообъекта, который должен быть расширен.
Фиг. 10 отображает узел "декодирования RSI", используемый в комбинации с совместным вычислением остатка в декодере. В частности, Фиг. 10 иллюстрирует концепцию совместного декодирования остатка на стороне декодера согласно варианту осуществления.
Упомянутые (первые) оцененные сигналы sest,PSI,{1,…,M} аудиообъектов из узла 110 параметрического декодирования (узла "декодирования PSI") подаются вместе с информацией об остатке ("побочной информацией об остатке") в узел 120 обработки остатка ("декодирования RSI"). Узел 120 обработки остатка вычисляет из (побочной) информации об остатке и оцененных сигналов sest,PSI,{1,…,M} аудиообъектов упомянутые вторые оцененные сигналы sest,RSI,{1,…,M} аудиообъектов, например, сигналы расширенных и нерасширенных аудиообъектов, и вырабатывает упомянутые вторые оцененные сигналы sest,RSI,{1,…,M} аудиообъектов, например, сигналы расширенных и нерасширенных аудиообъектов в качестве вывода узла 120 обработки остатка.
Дополнительно, может быть произведена повторная оценка не-EAO (не проиллюстрировано на Фиг. 10). EAO удаляются из результата микширования сигналов и оставшиеся не-EAO повторно оцениваются из этого результата микширования. Это дает улучшенную оценку этих объектов по сравнению с оценкой по результату микширования сигналов, который содержит все сигналы объектов. Эта повторная оценка может быть пропущена, если целью является манипулирование только сигналами расширенных объектов в результате микширования.
Фиг. 11 иллюстрирует генератор остаточных сигналов согласно варианту осуществления, при этом.
На Фиг. 11 генератор 200 остаточных сигналов дополнительно содержит узел 250 модификации понижающего микширования, адаптированный c возможностью модификации упомянутых трех или более сигналов понижающего микширования для получения трех или более модифицированных сигналов понижающего микширования.
Узел 230 параметрического декодирования сконфигурирован с возможностью определения одного или более сигналов аудиообъектов из упомянутых первых оцененных сигналов аудиообъектов на основе упомянутых трех или более модифицированных сигналов понижающего микширования.
Затем, узел 240 оценки остатка может, например, определять один или более остаточных сигналов на основе упомянутого одного или более сигналов аудиообъектов из упомянутых первых оцененных сигналов аудиообъектов.
В варианте осуществления узел 250 модификации понижающего микширования может, например, быть сконфигурирован с возможностью модификации упомянутых трех или более исходных сигналов понижающего микширования для получения упомянутых трех или более модифицированных сигналов понижающего микширования посредством удаления одного или более из упомянутого множества исходных сигналов аудиообъектов из упомянутых трех или более исходных сигналов понижающего микширования.
В другом варианте осуществления узел 250 модификации понижающего микширования может, например, быть сконфигурирован с возможностью модификации упомянутых трех или более исходных сигналов понижающего микширования для получения упомянутых трех или более модифицированных сигналов понижающего микширования посредством генерирования одного или более модифицированных сигналов аудиообъектов на основе одного или более из оцененных сигналов аудиообъектов и на основе одного или более из остаточных сигналов, и посредством удаления упомянутого одного или более модифицированных сигналов аудиообъектов из упомянутых трех или более исходных сигналов понижающего микширования. Например, каждый из упомянутого одного или более модифицированных сигналов аудиообъектов может быть сгенерирован посредством узла модификации понижающего микширования посредством модификации одного из оцененных сигналов аудиообъектов, при этом узел модификации понижающего микширования может быть адаптирован с возможностью модификации упомянутого оцененного сигнала аудиообъекта в зависимости от одного из упомянутого одного или более остаточных сигналов.
В обоих вариантах осуществления, описанных выше по тексту, узел модификации понижающего микширования может, например, быть адаптирован с возможностью применения формулы
Figure 00000003
,
в которой
Figure 00000004
является понижающим микшированием, которое должно быть модифицировано,
в которой
Figure 00000005
указывает связанную информацию понижающего микширования,
в которой
Figure 00000006
содержит исходные сигналы аудиообъектов, которые должны быть удалены, или модифицированные сигналы аудиообъектов, которые должны быть удалены,
в которой
Figure 00000007
указывает местоположения сигналов, которые должны быть удалены, и
в которой
Figure 00000008
является модифицированным сигналом понижающего микширования.
Например, местоположение (позиция) сигнала аудиообъекта соответствует местоположению (позиции) его аудиообъекта в списке всех объектов.
Фиг. 12 иллюстрирует декодер согласно варианту осуществления.
В варианте осуществления с Фиг. 12 декодер дополнительно содержит узел 140 модификации понижающего микширования.
Узел 120 обработки остатка определяет один или более сигналов аудиообъектов из упомянутого множества вторых оцененных сигналов аудиообъектов.
Узел 140 модификации понижающего микширования адаптирован с возможностью удаления определенного одного или более вторых оцененных сигналов аудиообъектов из упомянутых трех или более сигналов понижающего микширования для получения трех или более модифицированных сигналов понижающего микширования.
Узел 110 параметрического декодирования сконфигурирован с возможностью определения одного или более сигналов аудиообъектов из упомянутых первых оцененных сигналов аудиообъектов на основе упомянутых трех или более модифицированных сигналов понижающего микширования.
Узел 120 обработки остатка может затем, например, определять один или более дополнительных вторых оцененных сигналов аудиообъектов на основе определенного одного или более сигналов аудиообъектов из упомянутых первых оцененных сигналов аудиообъектов.
В конкретном варианте осуществления узел 130 модификации понижающего микширования может, например, быть адаптирован с возможностью применения формулы:
Figure 00000002
.
для удаления упомянутого одного или более сигналов аудиообъектов из упомянутого множества вторых оцененных сигналов аудиообъектов, определяемых посредством узла 120 обработки остатка, из упомянутых трех или более сигналов понижающего микширования, для получения трех или более модифицированных сигналов понижающего микширования, при этом
Figure 00000002
указывает упомянутые три или более сигналов понижающего микширования до их модификации
Figure 00000002
указывает упомянутые три или более модифицированных сигналов понижающего микширования
Figure 00000009
указывает матрицу понижающего микширования
Figure 00000010
указывает субматрицу отображения, обозначающую позиции (местоположения) EAO
(Для больших подробностей о конкретных вариантах этого варианта осуществления см. описание ниже по тексту).
В нижеследующем, представлена каскадная концепция кодирования/декодирования остатка.
Фиг. 13 иллюстрирует концепцию вычисления остаточных компонентов каскадным путем на стороне кодера согласно варианту осуществления. По сравнению с концепцией совместного вычисления остатка, каскадный подход сокращает на каждом итеративном шаге энергию остаточной энергии за счет более высокой вычислительной сложности. На каждом шаге, один из исходных сигналов аудиообъектов (sM) (или, в альтернативном варианте осуществления, оцененный сигнал аудиообъекта; см. пунктирные стрелки 2461, 2462) расширенного аудиообъекта удаляется из результата микширования сигналов (понижающего микширования) до того, как результат микширования сигналов (понижающее микширование) передается на следующий узел 2452 обработки. Таким образом, число сигналов объектов в результате микширования сигналов (понижающем микшировании) уменьшается с каждым шагом обработки. Посредством этого улучшается оценка сигнала расширенного аудиообъекта (упомянутого второго оцененного сигнала аудиообъекта) на следующем шаге, таким образом успешно сокращая энергию остаточных сигналов.
(Следует отметить, что в альтернативном варианте осуществления, где на каждом итеративном шаге оцененный сигнал аудиообъекта удаляется из результата микширования сигналов, подузлы 2501, 2502 модификации понижающего микширования не нуждаются в приеме исходных сигналов sM аудиообъектов.
Наоборот, в варианте осуществления, где на каждом итеративном шаге исходный сигнал аудиообъекта удаляется из результата микширования сигналов, подузлы 2501, 2502 модификации понижающего микширования не нуждаются в приеме оцененных сигналов аудиообъектов.)
Более подробно, Фиг. 13 иллюстрирует множество подузлов 2451, 2452 генерирования RSI. Упомянутое множество подузлов 2451, 2452 генерирования RSI вместе формируют узел генерирования RSI.
Каждый из упомянутого множества подузлов 2451, 2452 генерирования RSI содержит подузел 2301 параметрического декодирования. Упомянутое множество подузлов 2301 параметрического декодирования вместе формируют узел параметрического декодирования. Подузлы 2301 параметрического декодирования генерируют упомянутые первые оцененные сигналы sest,PSI,{1,…,M} аудиообъектов.
Каждый из упомянутого множества подузлов 2451, 2452 генерирования RSI содержит подузел 2401 оценки остатка. Упомянутое множество подузлов 2401 оценки остатка вместе формируют узел оценки остатка. Подузлы 2401 оценки остатка генерируют упомянутые вторые оцененные сигналы sest,RSI,M, sest,RSI,M-1 аудиообъектов.
Более того, Фиг. 13 иллюстрирует множество подузлов 2501, 2502 модификации понижающего микширования. Каждый из подузлов 2501, 2502 модификации понижающего микширования вместе формируют узел модификации понижающего микширования.
Фиг. 14 представляет каскадно-включаемый узел "декодирования RSI", используемый в комбинации с каскадным вычислением остатка на стороне декодера согласно варианту осуществления.
На каждом шаге, один из сигналов объектов, который должен быть расширен, оценивается посредством подузла 1101 параметрического декодирования ("декодирования PSI") (для получения одного из упомянутых первых оцененных сигналов sest,PSI,M аудиообъектов), и упомянутый один из упомянутых первых оцененных сигналов sest,PSI,M аудиообъектов затем обрабатывается вместе с соответствующим остаточным сигналом sres,RSI,M посредством подузла 1201 обработки остатка ("обработка RSI"), чтобы выработать расширенную версию сигнала sest,RSI,M объекта (одного из упомянутых вторых оцененных сигналов аудиообъектов). Сигнал sest,RSI,M расширенного объекта стирается из сигнала понижающего микширования посредством подузла 1401 модификации понижающего микширования ("модификации понижающего микширования") до того, как модифицированные сигналы понижающего микширования подаются в следующий подузел 1252 декодирования остатка ("декодирования остатка").
Как и в концепции совместного кодирования/декодирования остатка, не-EAO могут быть повторно оценены.
Более подробно, Фиг.14 иллюстрирует множество подузлов 1251, 1252 декодирования остатка. Упомянутое множество подузлов 1251, 1252 декодирования остатка вместе формируют узел декодирования остатка.
Каждый из упомянутого множества подузлов 1251, 1252 декодирования остатка содержит подузел 1101 параметрического декодирования. Упомянутое множество подузлов 1101 параметрического декодирования вместе формируют узел параметрического декодирования. Подузлы 1101 параметрического декодирования генерируют упомянутые первые оцененные сигналы sest,PSI,{1,…,M} аудиообъектов.
Каждый из упомянутого множества подузлов 1251, 1252 декодирования остатка содержит подузел 1201 обработки остатка. Упомянутое множество подузлов 1201 обработки остатка вместе формируют узел обработки остатка. Подузлы 1201 обработки остатка генерируют упомянутые вторые оцененные сигналы sest,RSI,M, sest,RSI,M-1 аудиообъектов.
Более того, Фиг. 14 иллюстрирует множество подузлов 1401, 1402 модификации понижающего микширования. Каждый из подузлов 1401, 1402 модификации понижающего микширования вместе формируют узел модификации понижающего микширования.
Фиг. 15 иллюстрирует генератор остаточных сигналов согласно варианту осуществления, использующему каскадную концепцию.
На Фиг. 15 генератор остаточных сигналов содержит узел 250 модификации понижающего микширования.
Генератор 200 остаточных сигналов адаптирован с возможностью проведения двух или более итеративных шагов:
Для каждого итеративного шага, узел 230 параметрического декодирования адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества оцененных сигналов аудиообъектов.
Более того, для упомянутого итеративного шага, узел 240 оценки остатка адаптирован с возможностью определения ровно одного остаточного сигнала из упомянутого множества остаточных сигналов посредством модификации упомянутого сигнала аудиообъекта из упомянутого множества оцененных сигналов аудиообъектов.
Кроме того, для упомянутого итеративного шага, узел 250 модификации понижающего микширования адаптирован с возможностью модификации упомянутых трех или более сигналов понижающего микширования.
На следующем итеративном шаге, следующем за упомянутым итеративным шагом, узел 230 параметрического декодирования адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества оцененных сигналов аудиообъектов на основе упомянутых трех или более сигналов понижающего микширования, которые были модифицированы.
Фиг. 16 иллюстрирует декодер согласно варианту осуществления, использующему каскадную концепцию. На Фиг. 16 декодер также содержит узел 140 модификации понижающего микширования.
Декодер с Фиг. 16 адаптирован с возможностью проведения двух или более итеративных шагов:
Для каждого итеративного шага, узел 110 параметрического декодирования адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества первых оцененных сигналов аудиообъектов.
Более того, для упомянутого итеративного шага, узел 120 обработки остатка адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества вторых оцененных сигналов аудиообъектов посредством модификации упомянутого сигнала аудиообъекта из упомянутого множества первых оцененных сигналов аудиообъектов.
Кроме того, для упомянутого итеративного шага, узел 140 модификации понижающего микширования адаптирован с возможностью удаления упомянутого сигнала аудиообъекта из упомянутого множества вторых оцененных сигналов аудиообъектов из упомянутых трех или более сигналов понижающего микширования для модификации упомянутых трех или более сигналов понижающего микширования.
На следующем итеративном шаге, следующем за упомянутым итеративным шагом, узел 110 параметрического декодирования адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества первых оцененных сигналов аудиообъектов на основе упомянутых трех или более сигналов понижающего микширования, которые были модифицированы.
В нижеследующем, описывается математический вывод на примере концепции совместного кодирования/декодирования остатка:
Далее по тексту используется нижеследующая система обозначений:
Величины:
Figure 00000011
- число сигналов аудиообъектов
Figure 00000012
- число сигналов понижающего микширования
Figure 00000013
- число каналов повышающего микширования
Figure 00000014
- число обработанных данных
Figure 00000015
- число EAO
Члены:
Figure 00000016
- звездный оператор (
Figure 00000017
) обозначает сопряженное транспонирование данной матрицы
Figure 00000018
- исходный сигнал аудиообъекта, обеспеченный кодеру (размера
Figure 00000019
)
Figure 00000009
- матрица понижающего микширования (размера
Figure 00000020
)
Figure 00000021
- матрица воспроизведения (размера
Figure 00000022
)
Figure 00000023
- аудиосигнал
Figure 00000024
понижающего микширования (размера
Figure 00000025
)
Figure 00000026
- идеальный выходной аудиосигнал
Figure 00000027
(размера
Figure 00000028
)
Figure 00000029
- параметрически реконструированный сигнал объекта, аппроксимирующий
Figure 00000030
, заданный как
Figure 00000031
(размера
Figure 00000019
)
Figure 00000032
- вывод декодера, содержащий все оценки сигналов не-EAO (параметрически оцененных) и EAO (параметрически плюс остаток), размера
Figure 00000019
Figure 00000033
- выходной аудиосигнал повышающего микширования, аппроксимирующий
Figure 00000034
, заданный как
Figure 00000035
(размера
Figure 00000028
)
Figure 00000010
- субматрица отображения, обозначающая местоположения не-EAO и EAO в списке всех объектов. Следует отметить
Figure 00000036
(размера
Figure 00000037
;
Figure 00000038
). Матрицы отображения не-EAO
Figure 00000039
и соответствующего
Figure 00000040
задаются как
Figure 00000041
Figure 00000042
Например, для
Figure 00000043
и объекты номер 2 и 4 являются EAO, эти матрицы являются
Figure 00000044
,
Figure 00000045
.
Figure 00000046
- субматрица понижающего микширования, соответствующая не-EAO, заданная как
Figure 00000047
(размера
Figure 00000048
)
Figure 00000049
- субматрица понижающего микширования, соответствующая EAO, заданная как
Figure 00000050
(размера
Figure 00000051
)
Figure 00000052
- матрица параметрической оценки источника (размера
Figure 00000053
)
Figure 00000054
- ковариационная матрица объектов (размера
Figure 00000055
)
Figure 00000056
- ковариационная субматрица, соответствующая не-EAO, заданная как
Figure 00000057
(размера
Figure 00000058
)
Figure 00000059
- сигнал EAO, содержащий реконструкции EAO (размера
Figure 00000060
)
Figure 00000061
- сигнал не-EAO, содержащий реконструкции не-EAO (размера
Figure 00000062
)
Figure 00000063
- остаточные сигналы для EAO (размера
Figure 00000060
)
Figure 00000064
- модифицированный сигнал понижающего микширования, содержащий только сигналы не-EAO; вычисленный как разность между понижающим микшированием SAOC и понижающим микшированием реконструированных EAO (размера
Figure 00000025
)
Все введенные матрицы (в общем) изменяются во времени и по частоте.
В настоящий момент рассматривается общий способ с повторной оценкой сигнала не-EAO на стороне декодера:
Общий способ может быть описан в качестве подхода с двумя этапами, где на первом извлекают все сигналы EAO из соответствующего сигнала понижающего микширования, а затем реконструируют все сигналы не-EAO, учитывая EAO. Сигналы объектов восстанавливаются из сигнала (
Figure 00000023
) понижающего микширования с использованием PSI (
Figure 00000065
,
Figure 00000066
) и включенного остаточного сигнала (
Figure 00000063
).
Считается, что конечный воспроизводимый выходной сигнал
Figure 00000067
задается как:
Figure 00000068
.
Выходной сигнал
Figure 00000069
объекта декодера может быть представлен в качестве следующей суммы:
Figure 00000070
.
Сигнал EAO
Figure 00000059
вычисляется из понижающего микширования
Figure 00000023
с помощью матрицы
Figure 00000071
параметрической реконструкции EAO и соответствующих остатков
Figure 00000063
EAO следующим образом:
Figure 00000072
.
Сигнал
Figure 00000061
не-EAO вычисляется из модифицированного понижающего микширования
Figure 00000064
с помощью матрицы
Figure 00000073
параметрической реконструкции не-EAO следующим образом:
Figure 00000074
.
Модифицированный сигнал
Figure 00000064
понижающего микширования определяется как разность между понижающим микшированием
Figure 00000023
и соответствующим понижающим микшированием реконструированных EAO следующим образом, таким образом, стирая EAO из сигнала
Figure 00000023
понижающего микширования:
Figure 00000002
.
Здесь матрицы параметрической реконструкции объекта для
Figure 00000071
EAO и для
Figure 00000073
не-EAO определяются с использованием PSI (
Figure 00000065
,
Figure 00000066
) следующим образом:
Figure 00000075
,
Figure 00000076
,
Figure 00000077
,
Figure 00000078
В нижеследующем описывается упрощенный способ "А" без повторной оценки сигнала не-EAO на стороне декодера:
Если в результате микширования сигналов манипулируют только EAO, целевая сцена может быть интерпретирована как линейная комбинация сигналов понижающего микширования и сигналов EAO. Поэтому, дополнительная повторная оценка сигналов не-EAO может быть пропущена. Общий способ с повторной оценкой сигнала не-EAO может быть упрощен до процедуры с одним этапом:
Figure 00000079
.
Сигнал
Figure 00000080
содержит переданные остаточные сигналы EAO и члены компенсации остатка, так что нижеследующее определение устанавливает:
Figure 00000081
.
Это условие является достаточным для воспроизведения любой акустической сцены, которая ограничивается только манипулированием EAO.
С
Figure 00000082
и
Figure 00000083
следующее ограничение для члена
Figure 00000084
должно быть выполнено:
Figure 00000085
.
Член
Figure 00000086
состоит из компонентов, которые определяются посредством кодера (и передаются или сохраняются)
Figure 00000087
и компонентов
Figure 00000088
, которые должны быть определены с использованием этого уравнения.
С использованием определений матрицы (
Figure 00000089
) понижающего микширования и члена (
Figure 00000090
) компенсации можно вывести следующее уравнение:
Figure 00000091
С
Figure 00000092
,
Figure 00000093
и
Figure 00000036
,
Figure 00000094
уравнение может быть сокращено до:
Figure 00000095
.
Решение линейного уравнения для
Figure 00000096
дает:
Figure 00000097
.
После решения этой системы линейных уравнений желаемая целевая сцена может быть вычислена как следующая сумма члена параметрического предсказания и члена расширения остатка в качестве:
Figure 00000068
,
Figure 00000079
,
Figure 00000098
.
В нижеследующем обеспечивается упрощенный способ "В" без повторной оценки сигнала не-EAO на стороне декодера:
Рассмотрение члена
Figure 00000099
компенсации как указано выше по тексту (
Figure 00000100
) для параметрического предсказания сигнала
Figure 00000101
и представление его в качестве следующей функции
Figure 00000102
остаточных сигналов
Figure 00000103
приводит к:
Figure 00000104
Альтернативная формулировка содержит три следующих части, включающих в себя надлежащую линейную комбинацию сигналов (
Figure 00000105
) понижающего микширования, расширенных объектов (
Figure 00000106
) и нерасширенных объектов (
Figure 00000107
) так, что следует:
Figure 00000108
.
Матрицы имеют размеры
Figure 00000109
,
Figure 00000110
,
Figure 00000111
и
Figure 00000112
.
Предполагая
Figure 00000113
и определение
Figure 00000114
, это может быть записано как:
Figure 00000115
Сравнивая упомянутое и вышеуказанное определения реконструированных сигналов
Figure 00000104
следует, что:
Figure 00000116
.
Можно вывести член
Figure 00000117
как:
Figure 00000118
.
Ошибка в конечной реконструкции будет минимизирована, когда минимизирован вклад нерасширенных сигналов. Таким образом, имея целью
Figure 00000119
можно решить член
Figure 00000120
из системы линейных уравнений:
Figure 00000121
.
где расширенная матрица
Figure 00000122
понижающего микширования и матрица
Figure 00000123
повышающего микширования задаются как конкатенированные матрицы:
Figure 00000124
и
Figure 00000125
и таким образом
Figure 00000126
После решения этой системы линейных уравнений желаемый поправочный член
Figure 00000127
может быть получен как:
Figure 00000128
,
Приводя к конечным выводам из
Figure 00000068
,
Figure 00000079
.
В нижеследующем рассматривается упрощенный способ "С":
Если манипулируют только EAO произвольным образом, любая целевая сцена может быть сгенерирована посредством линейной комбинации сигналов понижающего микширования и EAO. Следует отметить, что вместо понижающего микширования, также может быть использовано понижающее микширование со стертыми EAO. Целевая сцена может быть идеально сгенерирована, если обработка остатка идеально восстанавливает EAO. Воспроизведение любой целевой сцены может быть сделано с использованием определения двухкомпонентных матриц
Figure 00000129
и
Figure 00000130
воспроизведения для понижающего микширования и реконструкций EAO. Матрицы имеют размеры
Figure 00000131
и
Figure 00000132
. Целевая матрица
Figure 00000133
воспроизведения может быть представлена в качестве произведения комбинированных матриц воспроизведения и матрицы понижающего микширования как
Figure 00000134
Отсюда, R ext может быть решена с помощью:
Figure 00000134
и субматрицы
Figure 00000129
и
Figure 00000135
могут быть извлечены из решения с помощью
Figure 00000136
и
Figure 00000137
Целевая сцена в настоящий момент может быть вычислена как:
Figure 00000138
,
где
Figure 00000139
содержит полные реконструкции EAO и задается (как указано выше по тексту)
Figure 00000072
.
Аналогичное уравнение может быть сформулировано для воспроизведения цели с использованием понижающего микширования с EAO, стертыми из микширования, посредством вычитания
Figure 00000140
из понижающего микширования.
В нижеследующем, описывается другой математический вывод и дополнительные подробности о концепции совместного кодирования/декодирования остатка, и обеспечивается унификация между общим способом и упрощением "A".
Ниже в описании применяется следующая система обозначений. Если для некоторых элементов следующая система обозначений является несовместимой с системой обозначений, обеспеченной выше по тексту, в дальнейшем в описании, для этих элементов применяется только следующая система обозначений.
Определения:
Figure 00000141
- сигналы объектов размера
Figure 00000142
Figure 00000143
- ковариационная матрица объектов размера
Figure 00000144
Figure 00000145
- матрицей понижающего микширования размера
Figure 00000146
Figure 00000147
- сигнал понижающего микширования размера
Figure 00000148
Figure 00000149
- матрица повышающего микширования размера
Figure 00000150
Figure 00000151
- матрица воспроизведения размера
Figure 00000152
Figure 00000153
- остаточные сигналы размера
Figure 00000154
Figure 00000155
- матрица размера
Figure 00000156
, обозначающая позиции (местоположения) EAO, заданная как
Figure 00000157
Figure 00000158
- матрица размера
Figure 00000159
, обозначающая позиции (местоположения) не-EAO, заданная как
Figure 00000160
Субматрицы некоторых из вышеуказанных, соответствующих не-EAO, могут быть заданы с помощью матриц
Figure 00000158
выборки как:
Figure 00000161
Figure 00000162
Figure 00000163
В последующем обеспечивается другое подробное математическое описание об общем способе (с повторной оценкой сигнала не-EAO на декодере):
Сигналы объектов восстанавливаются из понижающего микширования с использованием побочной информации и включенных остаточных сигналов. Вывод из декодера
Figure 00000164
производится следующим образом
Figure 00000165
.
Член
Figure 00000166
EAO размера
Figure 00000167
с EAO вычисляется следующим образом
Figure 00000168
,
где член
Figure 00000169
остаточного сигнала размера
Figure 00000167
содержит остаточные сигналы для EAO.
Член
Figure 00000170
не-EAO размера
Figure 00000171
, содержащий не-EAO, вычисляется как
Figure 00000172
,
Figure 00000173
где модифицированный сигнал
Figure 00000064
понижающего микширования, содержащий только сигналы не-EAO, вычисляется как разность между понижающим микшированием SAOC и понижающим микшированием реконструированных EAO.
Figure 00000174
.
Ковариационная субматрица
Figure 00000175
размера
Figure 00000176
, соответствующая не-EAO, вычисляется как
Figure 00000161
.
Субматрица
Figure 00000177
понижающего микширования размера
Figure 00000178
, соответствующая не-EAO, вычисляется как
Figure 00000162
.
В нижеследующем обеспечивается другое подробное математическое описание об упрощенном способе "А" (без повторной оценки сигнала не-EAO на декодере):
Сигналы объектов восстанавливаются из понижающего микширования с использованием побочной информации и включенных остаточных сигналов. Конечный вывод из декодера
Figure 00000164
производится следующим образом
Figure 00000179
.
Член
Figure 00000180
размера
Figure 00000181
включает в себя
Figure 00000167
остаточные сигналы
Figure 00000182
для EAO и предсказанный член
Figure 00000183
для не-EAO следующим образом
Figure 00000184
Предсказанный член
Figure 00000183
оценивается следующим образом
Figure 00000185
Субматрица
Figure 00000186
понижающего микширования, соответствующая EAO, и
Figure 00000187
, соответствующая регулярным объектам, задаются как
Figure 00000188
.
В последующем рассматривается особый случай матрицы 1 воспроизведения:
Рассмотрим следующий особый случай подобной понижающему микшированию матрицы
Figure 00000189
воспроизведения размера
Figure 00000190
с произвольной модификацией EAO и только однородным масштабированием (по сравнению с понижающим микшированием) не-EAO.
Figure 00000191
.
Ниже по тексту обеспечивается подробное математическое описание общего способа:
Figure 00000192
Ниже по тексту обеспечивается подробное математическое описание упрощенного способа "А":
Figure 00000193
Может быть видно, что два результата идентичны, когда выполняется предложение матрицы воспроизведения.
Ниже по тексту рассматривается особый случай матрицы 2 воспроизведения:
Налагая дополнительное ограничение на структуру матрицы
Figure 00000194
воспроизведения размера
Figure 00000195
: все не-EAO модифицируются только посредством общего масштабного коэффициента
Figure 00000196
в сравнении с понижающим микшированием и также все EAO модифицируются только посредством общего масштабного коэффициента
Figure 00000197
в сравнении с понижающим микшированием.
Figure 00000198
Продолжая от полученных ранее результатов, выводом системы будет
Figure 00000199
Хотя некоторые аспекты были описаны в контексте устройства, понятно, что эти аспекты также представляют собой описание соответствующего способа, в котором блок или устройство соответствует этапу способа или особенности этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют собой описание соответствующего блока или элемента или особенности соответствующего устройства.
Обладающий признаками изобретения разложенный сигнал может быть сохранен на цифровом носителе данных или может быть передан по передающей среде, такой как беспроводная передающая среда или проводная передающая среда, такая как Интернет.
В зависимости от некоторых требований реализации, варианты осуществления настоящего изобретения могут быть реализованы в аппаратном обеспечении или в программном обеспечении. Реализация может быть выполнена с использованием цифрового носителя данных, например дискеты, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, имеющего электронным образом считываемые управляющие сигналы, сохраненные на нем, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой, так что выполняется соответствующий способ.
Некоторые варианты осуществления в соответствии с изобретением содержат, невременной носитель данных, имеющий электронным образом считываемые управляющие сигналы, которые способны взаимодействовать с программируемой компьютерной системой таким образом, что выполняется один из способов, описанных в этом документе.
В общем, варианты осуществления настоящего изобретения могут быть реализованы в качестве компьютерного программного продукта с программным кодом, причем программный код действует для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может, например, быть сохранен на машиночитаемом носителе.
Другие варианты осуществления включают в себя компьютерную программу для выполнения одного из способов, описанных в этом документе, сохраненных на машиночитаемом носителе.
Другими словами, вариантом осуществления обладающего признаками изобретения способа, таким образом, является компьютерная программа, имеющая программный код для выполнения одного из способов, описанных в этом документе, когда компьютерная программа выполняется на компьютере.
Другим вариантом осуществления обладающих признаками изобретения способов, таким образом, является носитель данных (или цифровой носитель данных, или считываемый компьютером носитель), содержащий записанную на нем компьютерную программу для выполнения одного из способов, описанных в этом документе.
Дополнительным вариантом осуществления обладающего признаками изобретения способа, таким образом, является, поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в этом документе. Поток данных или последовательность сигналов, например, может быть сконфигурирована с возможностью передачи через соединение передачи данных, например, через Интернет.
Дополнительный вариант осуществления содержит средство обработки, например компьютер или программируемое логическое устройство, сконфигурированное или адаптированное с возможностью выполнения одного из способов, описанных в этом документе.
Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных в этом документе.
В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для выполнения некоторых или всех функциональных возможностей способов, описанных в этом документе. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для выполнения одного из способов, описанных в этом документе. В общем, способы предпочтительно выполняются посредством любого аппаратного устройства.
Описанные выше варианты осуществления иллюстрируют лишь принципы настоящего изобретения. Следует понимать, что модификации и вариации компоновок и деталей, описанных в этом документе, будут очевидны для специалистов в данной области техники. Поэтому ограничение предполагается только объемом приложенной формулы изобретения, а не конкретными деталями, представленных в этом документе описанием и пояснением вариантов осуществления.
Список использованной литературы
[BCC] C. Faller and F. Baumgarte, “Binaural Cue Coding - Part II: Schemes and applications,” IEEE Trans. on Speech and Audio Proc., vol. 11, no. 6, Ноябрь 2003
[JSC] C. Faller, “Parametric Joint-Coding of Audio Sources”, 120th AES Convention, Париж, 2006
[SAOC1] J. Herre, S. Disch, J. Hilpert, O. Hellmuth: "From SAC To SAOC - Recent Developments in Parametric Coding of Spatial Audio", 22nd Regional UK AES Conference, Cambridge, UK, Апрель 2007
[SAOC2] J. Engdegård, B. Resch, C. Falch, O. Hellmuth, J. Hilpert, A. Hölzer, L. Terentiev, J. Breebaart, J. Koppens, E. Schuijers and W. Oomen: " Spatial Audio Object Coding (SAOC) - The Upcoming MPEG Standard on Parametric Object Based Audio Coding", 124th AES Convention, Амстердам 2008.
[SAOC] ISO/IEC, “MPEG audio technologies - Part 2: Spatial Audio Object Coding (SAOC),” ISO/IEC JTC1/SC29/WG11 (MPEG) International Standard 23003-2:2010.
[ISS1] M. Parvaix and L. Girin: “Informed Source Separation of underdetermined instantaneous Stereo Mixtures using Source Index Embedding”, IEEE ICASSP, 2010
[ISS2] M. Parvaix, L. Girin, J.-M. Brossier: “A watermarking-based method for informed source separation of audio signals with a single sensor”, IEEE Transactions on Audio, Speech and Language Processing, 2010
[ISS3] A. Liutkus and J. Pinel and R. Badeau and L. Girin and G. Richard: “Informed source separation through spectrogram coding and data embedding”, Signal Processing Journal, 2011
[ISS4] A. Ozerov, A. Liutkus, R. Badeau, G. Richard: “Informed source separation: source coding meets source separation”, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2011
[ISS5] Shuhua Zhang and Laurent Girin: “An Informed Source Separation System for Speech Signals”, INTERSPEECH, 2011
[ISS6] L. Girin and J. Pinel: “Informed Audio Source Separation from Compressed Linear Stereo Mixtures”, AES 42nd International Conference: Semantic Audio, 2011
[Dfx] C. Falch and L. Terentiev and J. Herre: “Spatial Audio Object Coding with Enhanced Audio Object Separation”, 10th International Conference on Digital Audio Effects, 2010

Claims (89)

1. Декодер, содержащий:
узел (110) параметрического декодирования для генерирования множества первых оцененных сигналов аудиообъектов посредством повышающего микширования трех или более сигналов понижающего микширования, при этом множество исходных сигналов аудиообъектов закодированы в упомянутых трех или более сигналах понижающего микширования, при этом узел (110) параметрического декодирования сконфигурирован с возможностью повышающего микширования упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов, и
узел (120) обработки остатка для генерирования множества вторых оцененных сигналов аудиообъектов посредством модификации одного или более из упомянутых первых оцененных сигналов аудиообъектов, при этом узел (120) обработки остатка сконфигурирован с возможностью модификации упомянутого одного или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от одного или более остаточных сигналов.
2. Декодер по п. 1,
при этом узел (120) обработки остатка сконфигурирован с возможностью модификации упомянутого одного или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от по меньшей мере трех остаточных сигналов, и
при этом декодер адаптирован с возможностью генерирования по меньшей мере трех каналов вывода аудио на основе упомянутого множества вторых оцененных сигналов аудиообъектов.
3. Декодер по п. 1,
при этом декодер дополнительно содержит узел (140) модификации понижающего микширования, адаптированный с возможностью удаления одного или более сигналов аудиообъектов упомянутого множества вторых оцененных сигналов аудиообъектов, определяемых посредством узла (120) обработки остатка, из упомянутых трех или более сигналов понижающего микширования, для получения трех или более модифицированных сигналов понижающего микширования, и
при этом узел (110) параметрического декодирования сконфигурирован с возможностью определения одного или более сигналов аудиообъектов из упомянутых первых оцененных сигналов аудиообъектов на основе упомянутых трех или более модифицированных сигналов понижающего микширования.
4. Декодер по п. 3,
при этом узел (140) модификации понижающего микширования адаптирован с возможностью применения формулы:
Figure 00000200
для удаления упомянутого одного или более сигналов аудиообъектов из упомянутого множества вторых оцененных сигналов аудиообъектов, определяемых посредством узла (120) обработки остатка, из упомянутых трех или более сигналов понижающего микширования, для получения трех или более модифицированных сигналов понижающего микширования,
при этом
X представляет собой упомянутые три или более сигналов понижающего микширования до их модификации,
Figure 00000201
представляет собой упомянутые три или более модифицированных сигналов понижающего микширования,
D представляет собой информацию понижающего микширования,
S eao представляет собой по меньшей мере один сигнал, содержащий упомянутый один или более сигналов аудиообъектов из упомянутого множества вторых оцененных сигналов аудиообъектов, и
Figure 00000202
представляет собой местоположения упомянутого одного или более сигналов аудиообъектов из упомянутого множества вторых оцененных сигналов аудиообъектов.
5. Декодер по п. 3,
при этом декодер адаптирован с возможностью проведения двух или более итеративных шагов,
при этом для каждого итеративного шага узел (110) параметрического декодирования адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества первых оцененных сигналов аудиообъектов,
при этом для упомянутого итеративного шага узел (120) обработки остатка адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества вторых оцененных сигналов аудиообъектов посредством модификации упомянутого сигнала аудиообъекта из упомянутого множества первых оцененных сигналов аудиообъектов,
при этом для упомянутого итеративного шага узел (140) модификации понижающего микширования адаптирован с возможностью удаления упомянутого сигнала аудиообъекта из упомянутого множества вторых оцененных сигналов аудиообъектов из упомянутых трех или более сигналов понижающего микширования для модификации упомянутых трех или более сигналов понижающего микширования, и
при этом для следующего итеративного шага, следующего за упомянутым итеративным шагом, узел (110) параметрического декодирования адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества первых оцененных сигналов аудиообъектов на основе упомянутых трех или более сигналов понижающего микширования, которые были модифицированы.
6. Декодер по п. 1, при этом каждый из упомянутого одного или более остаточных сигналов указывает различие между одним из упомянутого множества исходных сигналов аудиообъектов и одним из упомянутого одного или более первых оцененных сигналов аудиообъектов.
7. Декодер по п. 1,
при этом узел (120) обработки остатка адаптирован с возможностью генерирования упомянутого множества вторых оцененных сигналов аудиообъектов посредством модификации пяти или более из упомянутых первых оцененных сигналов аудиообъектов,
при этом узел (120) обработки остатка сконфигурирован с возможностью модификации упомянутых пяти или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от пяти или более остаточных сигналов.
8. Декодер по п. 1, при этом декодер сконфигурирован с возможностью генерирования семи или более каналов вывода аудио на основе упомянутого множества вторых оцененных сигналов аудиообъектов.
9. Декодер по п. 1, при этом декодер адаптирован с возможностью не определять коэффициенты предсказания канала для определения упомянутого множества вторых оцененных сигналов аудиообъектов.
10. Декодер по п. 1, при этом декодер является декодером SAOC.
11. Генератор (200) остаточных сигналов, содержащий:
узел (230) параметрического декодирования для генерирования множества оцененных сигналов аудиообъектов посредством повышающего микширования трех или более сигналов понижающего микширования, при этом множество исходных сигналов аудиообъектов закодированы в упомянутых трех или более сигналах понижающего микширования, при этом узел (230) параметрического декодирования сконфигурирован с возможностью повышающего микширования упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов, и
узел (240) оценки остатка для генерирования множества остаточных сигналов на основе упомянутого множества исходных сигналов аудиообъектов и на основе упомянутого множества оцененных сигналов аудиообъектов, так что каждый из упомянутого множества остаточных сигналов является разностным сигналом, указывающим различие между одним из упомянутого множества исходных сигналов аудиообъектов и одним из упомянутого множества оцененных сигналов аудиообъектов.
12. Генератор (200) остаточных сигналов по п. 11,
при этом генератор (200) остаточных сигналов дополнительно содержит узел (250) модификации понижающего микширования, адаптированный с возможностью модификации упомянутых трех или более сигналов понижающего микширования для получения трех или более модифицированных сигналов понижающего микширования, и
при этом узел (230) параметрического декодирования сконфигурирован с возможностью определения одного или более сигналов аудиообъектов из упомянутых первых оцененных сигналов аудиообъектов на основе упомянутых трех или более модифицированных сигналов понижающего микширования.
13. Генератор (200) остаточных сигналов по п. 12, при этом узел (250) модификации понижающего микширования сконфигурирован с возможностью модификации упомянутых трех или более исходных сигналов понижающего микширования для получения упомянутых трех или более модифицированных сигналов понижающего микширования посредством удаления одного или более из упомянутого множества исходных сигналов аудиообъектов из упомянутых трех или более исходных сигналов понижающего микширования.
14. Генератор остаточных сигналов по п. 13,
при этом узел (250) модификации понижающего микширования адаптирован с возможностью применения формулы:
Figure 00000203
для удаления упомянутого одного или более из упомянутого множества исходных сигналов аудиообъектов из упомянутых трех или более сигналов понижающего микширования для получения трех или более модифицированных сигналов понижающего микширования,
при этом
X представляет собой упомянутые три или более сигналов понижающего микширования до их модификации,
Figure 00000204
представляет собой упомянутые три или более модифицированных сигналов понижающего микширования,
D представляет собой информацию понижающего микширования,
S eao представляет собой по меньшей мере один сигнал, содержащий упомянутый один или более из упомянутого множества исходных сигналов аудиообъектов, и
Figure 00000205
представляет собой местоположения упомянутого одного или более из упомянутого множества исходных сигналов аудиообъектов.
15. Генератор (200) остаточных сигналов по п. 12, при этом узел (250) модификации понижающего микширования сконфигурирован с возможностью модификации упомянутых трех или более исходных сигналов понижающего микширования для получения упомянутых трех или более модифицированных сигналов понижающего микширования посредством генерирования одного или более модифицированных сигналов аудиообъектов на основе одного или более из оцененных сигналов аудиообъектов и на основе одного или более из остаточных сигналов, и посредством удаления упомянутого одного или более модифицированных сигналов аудиообъектов из упомянутых трех или более исходных сигналов понижающего микширования.
16. Генератор остаточных сигналов по п. 15,
при этом узел (250) модификации понижающего микширования адаптирован с возможностью применения формулы:
Figure 00000206
для удаления упомянутого одного или более модифицированных сигналов аудиообъектов из упомянутых трех или более сигналов понижающего микширования для получения трех или более модифицированных сигналов понижающего микширования,
при этом
X представляет собой упомянутые три или более сигналов понижающего микширования до их модификации,
Figure 00000207
представляет собой упомянутые три или более модифицированных сигналов понижающего микширования,
D представляет собой информацию понижающего микширования,
S eao представляет собой упомянутый один или более модифицированных сигналов аудиообъектов, и
Figure 00000208
представляет собой местоположения упомянутого одного или более модифицированных сигналов аудиообъектов.
17. Генератор (200) остаточных сигналов по п. 12,
при этом генератор (200) остаточных сигналов адаптирован с возможностью проведения двух или более итеративных шагов,
при этом для каждого итеративного шага узел (230) параметрического декодирования адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества оцененных сигналов аудиообъектов,
при этом для упомянутого итеративного шага узел (240) оценки остатка адаптирован с возможностью определения ровно одного остаточного сигнала из упомянутого множества остаточных сигналов посредством модификации упомянутого сигнала аудиообъекта из упомянутого множества оцененных сигналов аудиообъектов,
при этом для упомянутого итеративного шага узел (250) модификации понижающего микширования адаптирован с возможностью модификации упомянутых трех или более сигналов понижающего микширования, и
при этом для следующего итеративного шага, следующего за упомянутым итеративным шагом, узел (230) параметрического декодирования адаптирован с возможностью определения ровно одного сигнала аудиообъекта из упомянутого множества оцененных сигналов аудиообъектов на основе упомянутых трех или более сигналов понижающего микширования, которые были модифицированы.
18. Генератор (200) остаточных сигналов по п. 11, при этом узел (240) оценки остатка адаптирован с возможностью генерирования по меньшей мере пяти остаточных сигналов на основе по меньшей мере пяти исходных сигналов аудиообъектов из упомянутого множества исходных сигналов аудиообъектов и на основе по меньшей мере пяти оцененных сигналов аудиообъектов из упомянутого множества оцененных сигналов аудиообъектов.
19. Кодер для кодирования множества исходных сигналов аудиообъектов посредством генерирования трех или более сигналов понижающего микширования, посредством генерирования параметрический побочной информации и посредством генерирования множества остаточных сигналов, при этом кодер содержит:
генератор (210) понижающего микширования для обеспечения упомянутых трех или более сигналов понижающего микширования, указывающих понижающее микширование упомянутого множества исходных сигналов аудиообъектов,
средство (220) оценки параметрической побочной информации для генерирования параметрический побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов, для получения параметрической побочной информации, и
генератор (200) остаточных сигналов по одному из пп. с 11 по 18,
при этом узел (230) параметрического декодирования генератора (200) остаточных сигналов адаптирован с возможностью генерирования множества оцененных сигналов аудиообъектов посредством повышающего микширования упомянутых трех или более сигналов понижающего микширования, обеспеченных посредством генератора (210) понижающего микширования, при этом множество исходных сигналов аудиообъектов закодированы в упомянутых трех или более сигналах понижающего микширования, при этом узел (230) параметрического декодирования сконфигурирован с возможностью повышающего микширования упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, сгенерированной средством (220) оценки параметрической побочной информации, и
при этом узел (240) оценки остатка генератора (200) остаточных сигналов адаптирован с возможностью генерирования упомянутого множества остаточных сигналов на основе упомянутого множества исходных сигналов аудиообъектов и на основе упомянутого множества оцененных сигналов аудиообъектов, так что каждый из упомянутого множества остаточных сигналов указывает различие между одним из упомянутого множества исходных сигналов аудиообъектов и одним из упомянутого множества оцененных сигналов аудиообъектов.
20. Кодер по п. 19, при этом кодер является кодером SAOC.
21. Система для кодирования множества исходных сигналов аудиообъектов и для генерирования множества первых оцененных сигналов аудиообъектов и множества вторых оцененных сигналов аудиообъектов, содержащая:
кодер (310) по п. 19 или 20 для кодирования упомянутого множества исходных сигналов аудиообъектов посредством генерирования трех или более сигналов понижающего микширования, посредством генерирования параметрический побочной информации и посредством генерирования множества остаточных сигналов, и
декодер (320) по одному из пп. с 1 по 10, при этом декодер (320) сконфигурирован с возможностью генерирования упомянутого множества вторых оцененных сигналов аудиообъектов на основе сгенерированных посредством кодера (310) упомянутых трех или более сигналов понижающего микширования, на основе сгенерированной посредством кодера (310) параметрической побочной информации и на основе сгенерированного посредством кодера (310) упомянутого множества остаточных сигналов.
22. Считываемый компьютером носитель, содержащий кодированный аудиосигнал, содержащий три или более сигналов (410) понижающего микширования, параметрическую побочную информации (420) и множество остаточных сигналов (430),
при этом упомянутые три или более сигналов (410) понижающего микширования являются понижающим микшированием множества исходных сигналов аудиообъектов,
при этом параметрическая побочная информация (420) содержит параметры, указывающие побочную информацию об упомянутом множестве исходных сигналов аудиообъектов,
при этом каждый из упомянутого множества остаточных сигналов (430) является разностным сигналом, указывающим различие между одним из упомянутого множества исходных аудиосигналов и одним из множества оцененных сигналов аудиообъектов.
23. Способ генерирования множества первых оцененных сигналов аудиообъектов и множества вторых оцененных сигналов аудиообъектов, содержащий:
генерирование упомянутого множества первых оцененных сигналов аудиообъектов посредством повышающего микширования трех или более сигналов понижающего микширования, при этом множество исходных сигналов аудиообъектов закодированы в упомянутых трех или более сигналах понижающего микширования, при этом генерирование упомянутого множества первых оцененных сигналов аудиообъектов содержит повышающее микширование упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов, и
генерирование упомянутого множества вторых оцененных сигналов аудиообъектов посредством модификации одного или более из упомянутых первых оцененных сигналов аудиообъектов, при этом генерирование множества вторых оцененных сигналов аудиообъектов содержит модификацию упомянутого одного или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от одного или более остаточных сигналов.
24. Способ генерирования множества остаточных сигналов, содержащий:
генерирование множества оцененных сигналов аудиообъектов посредством повышающего микширования трех или более сигналов понижающего микширования, при этом множество исходных сигналов аудиообъектов закодированы в упомянутых трех или более сигналах понижающего микширования, при этом генерирование упомянутого множества оцененных сигналов аудиообъектов содержит повышающее микширование упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов, и
генерирование упомянутого множества остаточных сигналов на основе упомянутого множества исходных сигналов аудиообъектов и на основе упомянутого множества оцененных сигналов аудиообъектов, так что каждый из упомянутого множества остаточных сигналов является разностным сигналом, указывающим различие между одним из упомянутого множества исходных сигналов аудиообъектов и одним из упомянутого множества оцененных сигналов аудиообъектов.
25. Считываемый компьютером носитель, содержащий компьютерную программу для реализации способа по п. 23 при исполнении на компьютере или процессоре сигналов.
26. Считываемый компьютером носитель, содержащий компьютерную программу для реализации способа по п. 24 при исполнении на компьютере или процессоре сигналов.
RU2015107578A 2012-08-10 2013-04-16 Кодер, декодер, система и способ, использующие концепцию остатка для параметрического кодирования аудиобъектов RU2628900C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261681730P 2012-08-10 2012-08-10
US61/681,730 2012-08-10
PCT/EP2013/057932 WO2014023443A1 (en) 2012-08-10 2013-04-16 Encoder, decoder, system and method employing a residual concept for parametric audio object coding

Publications (2)

Publication Number Publication Date
RU2015107578A RU2015107578A (ru) 2016-09-27
RU2628900C2 true RU2628900C2 (ru) 2017-08-22

Family

ID=48092997

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015107578A RU2628900C2 (ru) 2012-08-10 2013-04-16 Кодер, декодер, система и способ, использующие концепцию остатка для параметрического кодирования аудиобъектов

Country Status (20)

Country Link
US (1) US10818301B2 (ru)
EP (1) EP2883225B1 (ru)
JP (1) JP6113282B2 (ru)
KR (2) KR101903664B1 (ru)
CN (1) CN104769669B (ru)
AR (1) AR090703A1 (ru)
AU (1) AU2013301831B2 (ru)
BR (1) BR112015002793B1 (ru)
CA (1) CA2881065C (ru)
ES (1) ES2638391T3 (ru)
HK (1) HK1211734A1 (ru)
MX (1) MX351193B (ru)
MY (1) MY176406A (ru)
PL (1) PL2883225T3 (ru)
PT (1) PT2883225T (ru)
RU (1) RU2628900C2 (ru)
SG (1) SG11201500878PA (ru)
TW (1) TWI517141B (ru)
WO (1) WO2014023443A1 (ru)
ZA (1) ZA201501570B (ru)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2880891C (en) * 2012-08-03 2017-10-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Decoder and method for multi-instance spatial-audio-object-coding employing a parametric concept for multichannel downmix/upmix cases
KR101903664B1 (ko) 2012-08-10 2018-11-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 파라미터 오디오 오브젝트 코딩을 위한 잔류 개념을 이용하는 인코더, 디코더, 시스템 및 방법
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
JP6396452B2 (ja) 2013-10-21 2018-09-26 ドルビー・インターナショナル・アーベー オーディオ・エンコーダおよびデコーダ
US9779739B2 (en) * 2014-03-20 2017-10-03 Dts, Inc. Residual encoding in an object-based audio system
CN111586552B (zh) 2015-02-06 2021-11-05 杜比实验室特许公司 用于自适应音频的混合型基于优先度的渲染系统和方法
CN110800048B (zh) 2017-05-09 2023-07-28 杜比实验室特许公司 多通道空间音频格式输入信号的处理
JP6888172B2 (ja) * 2018-01-18 2021-06-16 ドルビー ラボラトリーズ ライセンシング コーポレイション 音場表現信号を符号化する方法及びデバイス
EP3588495A1 (en) * 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding
EP3881560B1 (en) 2018-11-13 2024-07-24 Dolby Laboratories Licensing Corporation Representing spatial audio by means of an audio signal and associated metadata
EP4344194A3 (en) 2018-11-13 2024-06-12 Dolby Laboratories Licensing Corporation Audio processing in immersive audio services
EP4243014A4 (en) * 2021-01-25 2024-07-17 Samsung Electronics Co., Ltd. DEVICE AND METHOD FOR PROCESSING A MULTI-CHANNEL AUDIO SIGNAL

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2077550A1 (en) * 2008-01-04 2009-07-08 Dolby Sweden AB Audio encoder and decoder
WO2011124616A1 (en) * 2010-04-09 2011-10-13 Dolby International Ab Mdct-based complex prediction stereo coding
WO2012045816A1 (en) * 2010-10-07 2012-04-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for level estimation of coded audio frames in a bit stream domain
WO2012075246A2 (en) * 2010-12-03 2012-06-07 Dolby Laboratories Licensing Corporation Adaptive processing with multiple media processing nodes
RU2010154749A (ru) * 2008-07-17 2012-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен (DE) Схема аудио кодирования/декодирования с переключением байпас

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI498882B (zh) 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
KR100917843B1 (ko) * 2006-09-29 2009-09-18 한국전자통신연구원 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법
CA2702986C (en) * 2007-10-17 2016-08-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio coding using downmix
CN102682773B (zh) * 2007-10-22 2014-11-26 韩国电子通信研究院 多对象音频解码设备
JP5608660B2 (ja) * 2008-10-10 2014-10-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) エネルギ保存型マルチチャネルオーディオ符号化
KR101388901B1 (ko) * 2009-06-24 2014-04-24 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호 디코더, 오디오 신호를 디코딩하는 방법 및 캐스케이드된 오디오 객체 처리 단계들을 이용한 컴퓨터 프로그램
KR101569702B1 (ko) * 2009-08-17 2015-11-17 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
CA2781310C (en) * 2009-11-20 2015-12-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter
KR20110116079A (ko) * 2010-04-17 2011-10-25 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
WO2012058805A1 (en) * 2010-11-03 2012-05-10 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
KR101903664B1 (ko) 2012-08-10 2018-11-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 파라미터 오디오 오브젝트 코딩을 위한 잔류 개념을 이용하는 인코더, 디코더, 시스템 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2077550A1 (en) * 2008-01-04 2009-07-08 Dolby Sweden AB Audio encoder and decoder
RU2010154749A (ru) * 2008-07-17 2012-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен (DE) Схема аудио кодирования/декодирования с переключением байпас
WO2011124616A1 (en) * 2010-04-09 2011-10-13 Dolby International Ab Mdct-based complex prediction stereo coding
WO2012045816A1 (en) * 2010-10-07 2012-04-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for level estimation of coded audio frames in a bit stream domain
WO2012075246A2 (en) * 2010-12-03 2012-06-07 Dolby Laboratories Licensing Corporation Adaptive processing with multiple media processing nodes

Also Published As

Publication number Publication date
AR090703A1 (es) 2014-12-03
CN104769669B (zh) 2020-09-29
US10818301B2 (en) 2020-10-27
JP2015529850A (ja) 2015-10-08
CA2881065A1 (en) 2014-02-13
CA2881065C (en) 2020-03-10
MX2015001676A (es) 2015-04-10
ZA201501570B (en) 2018-05-30
ES2638391T3 (es) 2017-10-20
TWI517141B (zh) 2016-01-11
US20150162012A1 (en) 2015-06-11
MY176406A (en) 2020-08-06
KR101903664B1 (ko) 2018-11-22
WO2014023443A1 (en) 2014-02-13
KR20150040921A (ko) 2015-04-15
HK1211734A1 (en) 2016-05-27
EP2883225A1 (en) 2015-06-17
JP6113282B2 (ja) 2017-04-12
PT2883225T (pt) 2017-09-04
AU2013301831B2 (en) 2016-12-01
CN104769669A (zh) 2015-07-08
TW201407603A (zh) 2014-02-16
RU2015107578A (ru) 2016-09-27
PL2883225T3 (pl) 2017-10-31
KR20170042809A (ko) 2017-04-19
EP2883225B1 (en) 2017-06-07
BR112015002793B1 (pt) 2021-12-07
AU2013301831A1 (en) 2015-02-26
SG11201500878PA (en) 2015-03-30
MX351193B (es) 2017-10-04
KR102050455B1 (ko) 2019-12-02
BR112015002793A2 (pt) 2020-04-22

Similar Documents

Publication Publication Date Title
RU2628900C2 (ru) Кодер, декодер, система и способ, использующие концепцию остатка для параметрического кодирования аудиобъектов
JP7053725B2 (ja) フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法
CA2824935C (en) Encoding and decoding of slot positions of events in an audio signal frame
JP5122681B2 (ja) パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ
US9431019B2 (en) Apparatus for decoding a signal comprising transients using a combining unit and a mixer
RU2604337C2 (ru) Декодер и способ многоэкземплярного пространственного кодирования аудиообъектов с применением параметрической концепции для случаев многоканального понижающего микширования/повышающего микширования
CN105122355B (zh) 将隐藏对象用于信号混合操作的空间音频对象编码的设备和方法
AU2015201672B2 (en) Apparatus for generating a decorrelated signal using transmitted phase information