RU2466469C2 - Аудиодекодер - Google Patents
Аудиодекодер Download PDFInfo
- Publication number
- RU2466469C2 RU2466469C2 RU2009130352/08A RU2009130352A RU2466469C2 RU 2466469 C2 RU2466469 C2 RU 2466469C2 RU 2009130352/08 A RU2009130352/08 A RU 2009130352/08A RU 2009130352 A RU2009130352 A RU 2009130352A RU 2466469 C2 RU2466469 C2 RU 2466469C2
- Authority
- RU
- Russia
- Prior art keywords
- audio
- reduced number
- channels
- audio signals
- objects
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 192
- 230000009471 action Effects 0.000 claims abstract description 90
- 239000000203 mixture Substances 0.000 claims abstract description 14
- 230000005540 biological transmission Effects 0.000 claims description 16
- 238000000034 method Methods 0.000 claims description 12
- 230000003595 spectral effect Effects 0.000 claims description 11
- 230000003321 amplification Effects 0.000 claims description 7
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 2
- 230000004044 response Effects 0.000 claims description 2
- 230000036962 time dependent Effects 0.000 claims description 2
- 238000005303 weighing Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 238000012546 transfer Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241001342895 Chorus Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 1
- RDYMFSUJUZBWLH-UHFFFAOYSA-N endosulfan Chemical compound C12COS(=O)OCC2C2(Cl)C(Cl)=C(Cl)C1(Cl)C2(Cl)Cl RDYMFSUJUZBWLH-UHFFFAOYSA-N 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Изобретение относится к аудиодекодеру, в частности к МРЕG Surround декодеру или объектно-ориентированному декодеру. Техническим результатом является обеспечение усовершенствованного декодера для декодирования аудиообъектов, который обеспечивает более широкий диапазон манипуляций над объектами без декодирования индивидуальных аудиообъектов. Указанный результат достигается тем, что аудиодекодер содержит средство (500) действия, декодирующее средство (300) и воспроизводящее средство (400). Средство действия генерирует измененные аудиосигналы с уменьшенным числом каналов из принятых аудиосигналов с уменьшенным числом каналов, содержащих смесь множества аудиообъектов. Измененные аудиосигналы с уменьшенным числом каналов получены путем применения действий к оцененным аудиосигналам, соответствующим аудиообъектам, содержащимся в упомянутых принятых аудиосигналах с уменьшенным числом каналов. Оцененные аудиосигналы выведены из принятых аудиосигналов с уменьшенным числом каналов на основании принятых параметрических данных, которые содержат множество параметров объекта для каждого из множества аудиообъектов. Измененные аудиосигналы с уменьшенным числом каналов, основанные на типе примененного действия, декодируются декодирующим средством, или воспроизводятся воспроизводящим средством, или объединяются с выходом воспроизводящего средства. 6 н. и 8 з.п. ф-лы, 7 ил.
Description
Область техники, к которой относится изобретение
Изобретение относится к аудиодекодеру, в частности, но не исключительно, к MPEG Surround декодеру или объектно-ориентированному декодеру.
Уровень техники
В (параметрических) пространственных аудиокодерах параметры извлекаются из исходных аудиосигналов, чтобы формировать пониженное число аудиосигналов с уменьшенным числом каналов (например, только сигнал с уменьшенным до одного числом каналов, соответствующий моно, или сигнал с уменьшенным до двух числом каналов для числа каналов, уменьшенного до стерео) и соответствующий набор параметров, описывающих пространственные свойства оригинального аудиосигнала. В (параметрических) пространственных аудиодекодерах пространственные свойства описываются передаваемыми пространственными параметрами, используемыми для восстановления пространственного многоканального сигнала, который близко похож на оригинальный многоканальный аудиосигнал.
В последнее время технологии для обработки и манипулирования индивидуальными аудиообъектами на стороне декодирования уже привлекли значительный интерес. Например, в рамках MPEG начала работу рабочая группа по основанному на объекте пространственному аудиокодированию. Цель этой рабочей группы - «исследовать новую технологию и повторно использовать существующие MPEG Surround компоненты и технологии для эффективного кодирования передачи битов многосоставных источников звука или объектов в число каналов с уменьшенным количеством и соответствующие пространственные параметры». Другими словами, целью является кодировать множественные аудиообъекты в ограниченный набор каналов с уменьшенным количеством с соответствующими параметрами. На стороне декодера пользователи взаимодействуют с содержимым, например, изменяя позиционирование индивидуальных объектов.
Такое взаимодействие с содержимым легко реализуется в объектно-ориентированных декодерах. В таком случае оно реализуется включением в себя воспроизведения, которое следует за декодированием. Упомянутое воспроизведение объединяется с декодированием, чтобы предотвратить необходимость определения индивидуальных объектов. В настоящее время имеющееся в распоряжении специализированное воспроизведение включает в себя позиционирование объектов, регулирование уровня громкости или частотную коррекцию воспроизводимых аудиосигналов.
Одним недостатком известных объектно-ориентированных декодеров с объединенным воспроизведением является то, что они обеспечивают ограниченный набор манипуляций над объектами, потому что они не формируют или не действуют на индивидуальные объекты. С другой стороны декодирование в явном виде индивидуальных аудиообъектов является очень дорогостоящим и неэффективным.
Сущность изобретения
Задача изобретения заключается в том, чтобы обеспечить усовершенствованный декодер для декодирования аудиообъектов, который обеспечивает более широкий диапазон манипуляций над объектами, не требуя декодирования индивидуальных аудиообъектов для этой цели.
Эта задача достигается аудиодекодером согласно изобретению. Предполагается, что набор объектов, каждый со своей соответствующей формой волны, предварительно был закодирован в объектно-ориентированном кодере, который генерирует аудиосигнал с уменьшенным числом каналов (один сигнал в случае одного канала), упомянутый аудиосигнал с уменьшенным числом каналов является смесью множества аудиообъектов и соответствующих параметрических данных. Параметрические данные содержат набор параметров объекта для каждого из различных аудиообъектов. Приемник принимает упомянутый аудиосигнал с уменьшенным числом каналов и упомянутые параметрические данные. Этот аудиосигнал с уменьшенным числом каналов далее направляется в средство действия, которое генерирует измененный аудиосигнал с уменьшенным числом каналов, применяя действия к оценкам аудиосигналов, соответствующим выбранным аудиообъектам, содержащимся в аудиосигнале с уменьшенным числом каналов. Упомянутые оценки аудиосигналов выводятся на основании параметрических данных. Измененный аудиосигнал с уменьшенным числом каналов далее направляется в декодирующее средство или воспроизводящее средство или объединяется с выходом воспроизводящего средства, в зависимости от типа применяемого действия, например действием ввода или передачи. Декодирующее средство декодирует аудиообъекты из аудиосигнала с уменьшенным числом каналов, направленного в декодирующее средство, упомянутый аудиосигнал с уменьшенным числом каналов является первоначально принятым аудиосигналом с уменьшенным числом каналов или измененным аудиосигналом с уменьшенным числом каналов. Упомянутое декодирование представлено на основании параметрических данных. Воспроизводящее средство генерирует пространственный выходной аудиосигнал из аудиообъектов, полученных от декодирующего средства и, дополнительно, от средства действия, в зависимости от типа примененного действия.
Преимущество декодера согласно изобретению в том, что для того, чтобы применять различные типы действий, нет необходимости, чтобы объект, к которому действие должно быть применено, был доступен. Взамен изобретение предлагает применить действия к оцененным аудиосигналам, соответствующим объектам, перед или параллельно с фактическим декодированием. Таким образом, явное декодирование объекта не требуется, и воспроизведение, возникшее в декодере, сохраняется.
В варианте осуществления декодер дополнительно содержит средство изменения для изменения параметрических данных, когда спектральная или временная огибающая оцененного аудиосигнала, соответствующая объекту или множеству объектов, изменяется действием ввода.
Примером такого действия является нелинейное искажение, которое генерирует дополнительные высокочастотные спектральные компоненты, или многополосный компрессор. Если спектральные характеристики измененного аудиосигнала изменены, применение неизмененных параметров, содержащихся в параметрических данных, как они были приняты, может привести к нежелательным и, возможно, раздражающим артефактам. Поэтому адаптация параметров, чтобы привести их в соответствие с новыми спектральными или временными характеристиками, улучшает качество получаемого в результате воспроизведенного аудиосигнала.
В варианте осуществления генерация оцененных аудиосигналов, соответствующих аудиообъектам или множеству объектов, содержит зависимое от времен/частоты масштабирование аудиосигналов с уменьшенным числом каналов на основании параметров мощности, соответствующих аудиообъектам, причем упомянутые параметры мощности содержатся в принятых параметрических данных.
Преимущество такого оценивания в том, что оно содержит умножение аудиосигнала с уменьшенным числом каналов. Это делает процесс оценивания простым и эффективным.
В варианте осуществления декодирующее средство содержит декодер в соответствии с MPEG Surround стандартом и средство преобразования для преобразования параметрических данных в параметрические данные в соответствии с MPEG Surround стандартом.
Преимущество использования MPEG Surround декодера в том, что этот тип декодера используется как воспроизводящий инструмент для объектно-ориентированного декодера. В этом случае объектно-ориентированные параметры объединяются с данными пользовательского управления и преобразованными в MPEG Surround параметрами, такими как параметры уровневых различий и корреляции между каналами (парами). Поэтому MPEG Surround параметры получают в результате из объединенного действия объектно-ориентированных параметров, то есть переданной информации и желаемых свойств воспроизведения, то есть набора управляемой пользователем информации со стороны декодера. В таком случае не требуются промежуточные объектные сигналы.
Изобретение дополнительно обеспечивает приемник и систему связи, а также соответствующие способы.
В варианте осуществления действия ввода и передачи применяются одновременно. Использование, например, действий ввода не исключает использование действий передачи и наоборот.
Изобретение дополнительно обеспечивает компьютерный программный продукт, дающий возможность программируемому устройству выполнять способ согласно изобретению.
Краткое описание чертежей
Эти и другие аспекты изобретения поясняются со ссылкой на варианты осуществления, показанные на чертежах, на которых:
Фиг.1А схематично показывает объектно-ориентированный декодер;
Фиг.1В схематично показывает объектно-ориентированный декодер согласно изобретению;
Фиг.2 показывает пример средства действия для действия ввода;
Фиг.3 показывает средство изменения для изменения параметрических данных, когда спектральная огибающая оцененного аудиосигнала, соответствующего объекту или множеству объектов, изменяется действием ввода;
Фиг.4 показывает пример средства действия для действия передачи;
Фиг.5 показывает декодирующее средство, причем декодирующее средство содержит декодер в соответствии с MPEG Surround стандартом и средство преобразования для преобразования параметрических данных в параметрические данные в соответствии с MPEG Surround стандартом;
Фиг.6 показывает систему передачи для передачи аудиосигналов в соответствии с некоторыми вариантами осуществления изобретения.
На всех чертежах одинаковые ссылочные позиции обозначают подобные или соответствующие признаки. Некоторые из признаков, обозначенные в чертежах, обычно выполняются в программном обеспечении и как таковые представляют сущности программного обеспечения, такие как модули программного обеспечения или объекты.
Раскрытие изобретения
Фиг.1А схематично показывает объектно-ориентированный декодер 100, известный из, например, работы К. Фаллера: «Параметрическое Совместное Кодирование Аудиоисточников», AES 120-я Конвенция, Париж, Франция, Препринт 6752, Май 2006. Предполагается, что набор объектов, каждый с соответствующей формой волны, заранее был закодирован в объектно-ориентированном кодере, который генерирует аудиосигнал с уменьшенным числом каналов (один сигнал в случае одного канала или два сигнала в случае двух каналов (=стерео)), причем упомянутый аудиосигнал с уменьшенным числом каналов является смесью множества аудиообъектов, характеризующихся соответствующими параметрическими данными. Параметрические данные содержат набор параметров объекта для каждых различных аудиообъектов. Приемник 200 принимает упомянутый аудиосигнал с уменьшенным числом каналов и упомянутые параметрические данные.
Сигнал, направленный в приемник 200, является одним сигналом, который соответствует потоку мультиплексированных аудиоданных с уменьшенным числом каналов, которые соответствуют аудиосигналу с уменьшенным числом каналов и параметрическим данным. Назначение приемника в том, чтобы демультиплексировать два потока данных. Если аудиосигнал с уменьшенным числом каналов обеспечен в сжатой форме (такой, как MPEG-1 уровень 3), приемник 200 также выполняет декомпрессию или декодирование сжатого аудиосигнала в аудиосигнал с уменьшенным числом каналов временной области.
Несмотря на то что на входе в приемник 200 изображен единый тракт сигнала/данных, он также может содержать несколько трактов данных для отдельных сигналов с уменьшенным числом каналов и/или параметрических данных. В результате, сигналы с уменьшенным числом каналов и параметрические данные направляются в декодирующее средство 300, которое декодирует аудиообъекты из аудиосигналов с уменьшенным числом каналов на основании параметрических данных. Декодированные аудиообъекты дополнительно направляются в воспроизводящее средство 400 для генерирования, по меньшей мере, одного выходного аудиосигнала из декодированных аудиообъектов. Несмотря на то что декодирующее средство и воспроизводящее средство изображены как отдельные блоки, они очень часто объединены вместе. В результате такого объединения декодирующего и воспроизводящего средства обработки нет необходимости для явного декодирования индивидуальных аудиообъектов. Взамен воспроизведенные аудиосигналы обеспечиваются при намного меньших вычислительных затратах и без потери качества звука.
Фиг.1В схематично показывает объектно-ориентированный декодер 110 согласно изобретению. Приемник 200 принимает упомянутый аудиосигнал с уменьшенным числом каналов и упомянутые параметрические данные. Этот аудиосигнал с уменьшенным числом каналов и параметрические данные далее направляются в средство 500 действия, которое генерирует измененный аудиосигнал с уменьшенным числом каналов путем применения действий к оценкам аудиосигналов, соответствующих выбранным аудиообъектам, содержащимся в аудиосигнале с уменьшенным числом каналов. Упомянутые оценки аудиосигналов получаются на основе параметрических данных. Измененный аудиосигнал с уменьшенным числом каналов далее направляется в декодирующее средство 300 или воспроизводящее средство 400 или объединяется с выходом воспроизводящего средства, в зависимости от типа примененного действия, например действия ввода или передачи. Декодирующее средство 300 декодирует аудиообъекты из аудиосигнала с уменьшенным числом каналов, направленного в декодирующее средство, причем упомянутый аудиосигнал с уменьшенным числом каналов является первоначально принятым аудиосигналом с уменьшенным числом каналов или измененным аудиосигналом с уменьшенным числом каналов. Упомянутое декодирование выполняется на основании параметрических данных. Воспроизводящее средство 400 генерирует пространственный выходной аудиосигнал из аудиообъектов, полученных из декодирующего средства 300 и, дополнительно, из средства 500 действия, в зависимости от типа примененного действия.
Фиг.2 показывает пример средства 500 действия для действия ввода. Сигналы 501 с уменьшенным числом каналов направляются в средство 500 действия; эти сигналы направляются параллельно в блоки 511 и 512, которые содержатся в средстве 510 оценивания. Средство 510 оценивания генерирует оцененные аудиосигналы, соответствующие объекту или множеству объектов, к которым должно быть применено действие ввода, и оцененный аудиосигнал, соответствующий остальным объектам. Оценивание аудиосигналов, соответствующих объекту или множеству объектов, к которым должно быть применено действие ввода, выполняется блоком 511, в то время как оценивание аудиосигнала, соответствующего остальным объектам, выполняется блоком 512. Упомянутое оценивание основано на параметрических данных 502, которые получают от приемника 200. В результате, действие ввода применяется средством 530 ввода к оцененным аудиосигналам, соответствующим объекту или множеству объектов, к которым должно быть применено действие ввода. Сумматор 540 суммирует аудиосигналы, предоставленные средством 530 ввода, и оцененный аудиосигнал, соответствующий остальным объектам, таким образом собирая опять все объекты вместе. Полученный в результате измененный сигнал 503 с уменьшенным числом каналов далее направляется в декодирующее средство 300 объектно-ориентированного декодера 110. В остальном тексте, когда ссылаются на блоки 200, 300 или 400, они содержатся в объектно-ориентированном декодере 110.
Примерами действий ввода среди прочих являются: сжатие динамического диапазона, генерация искажения (например, чтобы имитировать гитарные усилители) или вокодер. Этот тип действий применен предпочтительно на ограниченном (предпочтительно одном) наборе аудиообъектов.
Фиг.3 показывает средство 600 изменения для изменения параметрических данных, когда спектральная огибающая оцененного аудиосигнала, соответствующего объекту или множеству объектов, изменена действием ввода. Блоки 511 и 512 оценивают, например, индивидуальные аудиообъекты, в то время как блок 513 оценивает остальные объекты вместе. Средство 530 ввода содержит отдельные блоки 531 и 532, которые применяют действия ввода к оцененным сигналам, полученным из блоков 511 и 512 соответственно. Сумматор 540 суммирует аудиосигналы, предоставленные средством 530 ввода, и оцененный аудиосигнал, соответствующий остальным объектам, таким образом собирая опять все объекты вместе. Полученный в результате измененный сигнал 503 с уменьшенным числом каналов далее направляется в декодирующее средство 300 объектно-ориентированного декодера 110.
Действия ввода, использованные в блоках 531 и 532, имеют либо одинаковый тип, либо они отличаются. Действием ввода, использованным блоком 532, может быть, например, нелинейное искажение, которое генерирует дополнительные высокочастотные спектральные компоненты, или многополосный компрессор. Если спектральные характеристики измененного аудиосигнала изменены, применение неизмененных параметров, содержащихся в параметрических данных, таких как принятые в декодирующем средстве 300, может привести к нежелательным и, возможно, раздражающим артефактам. Поэтому адаптация параметрических данных, чтобы привести их в соответствие с новыми спектральными характеристиками, улучшает качество получаемого в результате аудиосигнала. Эта адаптация параметрических данных выполняется в блоке 600. Адаптированные параметрические данные 504 направляются в декодирующее средство 300 и используются для декодирования измененного(ых) сигнала(ов) 503 с уменьшенным числом каналов.
Следует отметить, что два блока 531 и 532, содержащиеся в средстве 530 ввода, приведены только для примера. Число блоков может меняться в зависимости от числа действий ввода, которые применяются. Дополнительно, блоки 531 и 532 могут быть осуществлены в аппаратном обеспечении или программном обеспечении.
Фиг.4 показывает пример средства действия для действия передачи. Сигналы 501 с уменьшенным числом каналов направляются в средство 500 действия, эти сигналы подаются параллельно в блоки 511 и 512, которые содержатся в средстве 510 оценивания. Средство 510 оценивания генерирует оцененные аудиосигналы, соответствующие объекту или множеству объектов, к которым должно быть применено действие передачи. Упомянутое оценивание основано на параметрических данных 502, которые получают от приемника 200. Затем усиления применяются средством 560 усиления к оцененным аудиосигналам, соответствующим объекту или множеству объектов, полученных от средства 510 оценивания. Усиления, которые также могут быть названы весами, определяют степень действия на объект или множество объектов. Каждый из блоков 561 и 562 применяет усиление к индивидуальным аудиосигналам, полученным от средства оценивания. Каждый из этих блоков может применить различные усиления. Сумматор 540 суммирует аудиосигналы, предоставленные средством 560 усиления, и блок 570 применяет действие передачи. Полученный в результате сигнал 505, также называемый «сырым» выходом, направляется в воспроизводящее средство или, в качестве альтернативы, микшируется (или суммируется) с выходом воспроизводящего средства.
Примерами действий передачи среди прочих являются: реверберация, действия модуляции, например хор, фланжер или фазер.
Следует отметить, что два блока 561 и 562, содержащиеся в средстве 560 усиления, являются только примером. Число блоков может меняться в зависимости от числа сигналов, соответствующих аудиообъектам или множеству аудиообъектов, для которых уровень действия передачи должен быть установлен.
Средство 510 оценивания и средство 560 усиления могут быть объединены в единый этап обработки, который оценивает взвешенную комбинацию сигналов множества объектов. Усилители 561 и 562 могут быть введены в средства 511 и 512 оценивания соответственно. Это также описано в уравнениях ниже, где Q является (оценкой) взвешенной комбинацией сигналов объекта и получается одной единственной операцией масштабирования на элемент времени/частоты.
Усиления на объект или комбинацию объектов могут быть интерпретированы как «уровни передачи действия». В некоторых применениях величина (степень) действия на объект является предпочтительно управляемой пользователем. Например, пользователю может быть желательным один из объектов без реверберации, другой объект с малой величиной реверберации и еще один объект с полной реверберацией. В таком примере усиления на объект могут быть равны 0, 0,5, 1,0, для каждого соответственного объекта.
В варианте осуществления генерация оцененных аудиосигналов, соответствующих аудиообъекту или множеству объектов, содержит зависимое от времени/частоты масштабирование аудиосигналов с уменьшенным числом каналов на основании параметров мощности, соответствующих аудиообъектам, причем упомянутые параметры мощности содержатся в параметрических данных.
Этот вариант осуществления объяснен для следующего примера. В кодере I сигналы s i [n] объекта, i=0,…, I-1, где n индекс выборки, уменьшают число каналов, чтобы создать сигнал с уменьшенным числом каналов x[n] путем суммирования сигналов с уменьшенным числом каналов:
Сигнал с уменьшенным числом каналов сопровождается объектно-ориентированными параметрами, которые описывают (относительную) мощность сигнала каждого объекта с индивидуальными элементами времени/частоты сигнала x[n] с уменьшенным числом каналов. Сигналы s i [n] объектов, например, сначала обрабатываются методом окна с использованием наложения окон анализа w[n]:
где L - длина окна и, например, L/2 - соответствующий размер скачка (предположительное 50% наложение), m - индекс окна. Типичной формой окна анализа является окно Хеннинга:
Полученные в результате сегментированные сигналы s i [n,m] затем преобразуются в частотную область с использованием FFT:
где k - индекс ячейки FFT. Индексы k ячейки FFT затем группируются в полосы частот b параметра. Другими словами, каждая полоса частот b параметра соответствует набору индексов k ячейки смежной частоты. Для каждой полосы частот b параметра и каждого сегмента m каждого сигнала S i [k,m] объекта вычисляется значение мощности σ i²[b,m]:
где (*) - оператор комплексного сопряжения. Эти параметры σ i²[b,m] содержатся в параметрических данных (предпочтительно квантованных в логарифмическую область).
Процесс оценивания объекта или множества объектов в объектно-ориентированном аудиодекодере содержит зависимое от времени/частоты масштабирование аудиосигнала с уменьшенным числом каналов. Дискретно-временной сигнал x[n] с уменьшенным числом каналов, где n тоже индекс, разлагается на элементы X[k,m] времени/частоты, где k - индекс частоты и m - индекс кадра (временного сегмента). Это достигается, например, обработкой методом окна сигнала x[n] с окном w[n] анализа:
где L - длина окна и L/2 - соответствующий размер скачка. В этом случае предпочтительное окно анализа задается как квадратный корень окна Хеннинга:
Затем обработанный методом окна сигнал x[n,m] преобразуется в частотную область с использованием FFT:
компоненты X[k,m] частотной области затем группируются в так называемые полосы частот b(b=0,…, В-1) параметра. Эти полосы частот параметра совпадают с полосами частот параметра в кодере. В декодере оценка Ŝ i [k,m] сегмента m объекта i задается как:
где b(k) - полоса частот параметра, которая связана с индексом k частоты.
Взвешенная комбинация Q сигналов S i [n] объекта с весами g i получена как:
В объектно-ориентированном декодере Q может быть оценено в соответствии с:
Другими словами, сигнал объекта или любая линейная комбинация множества сигналов аудиообъекта может быть оценена в предложенном объектно-ориентированном аудиодекодере путем обусловленного временем/частотой масштабирования сигнала X[k,m] с уменьшенным числом каналов.
Для того чтобы получить в результате выходные сигналы временной области, каждый оцененный сигнал объекта преобразуется во временную область (с использованием обратного FFT), умножается на окно синтеза (идентичное окну анализа) и объединяется с предыдущим кадром с использованием наложения-сложения.
В варианте осуществления генерация оцененных аудиосигналов содержит взвешивание объекта или комбинации множества объектов посредством обусловленного временем/частотой масштабирования аудиосигналов с уменьшенным числом каналов на основании параметров мощности, соответствующих аудиообъектам, причем упомянутые параметры мощности содержатся в принятых параметрических данных.
Следует отметить, что блок действия передачи может иметь больше сигналов выхода, чем сигналов входа. Например, в случае стерео- или многоканальной реверберации блок имеет моносигнал входа.
В варианте осуществления сигнал с уменьшенным числом каналов и параметрические данные соответствуют стандарту MPEG Surround. Существующий MPEG Surround декодер, в дополнение к функциональности декодирования, также функционирует как воспроизводящее устройство. В подобном случае не требуются промежуточные аудиосигналы, соответствующие декодируемому объекту. Декодирование объекта и воспроизведение объединяются в едином устройстве.
Фиг.5 показывает декодирующее средство, декодирующее средство 300 содержит декодер 320 в соответствии со стандартом MPEG Surround и средство 310 преобразования для преобразования параметрических данных в параметрические данные в соответствии со стандартом MPEG Surround. Сигнал(ы) 508, соответствующий(е) сигналу(ам) 501 с уменьшенным числом каналов или измененному(ым) сигналу(ам) 503 с уменьшенным числом каналов, когда действие ввода применено, направляется(ются) в MPEG Surround декодер 320. Средство 310 преобразования, основанное на параметрических данных 506 и данных 507 пользовательского управления, преобразует параметрические данные в параметрические данные в соответствии со стандартом MPEG Surround. Параметрические данные 506 являются параметрическими данными 502 или измененными параметрическими данными 504, когда спектральная огибающая оцененного аудиосигнала, соответствующая объекту или множеству объектов, изменена действием ввода. Данные 507 пользовательского управления могут, например, означать желаемую пространственную позицию одного или множества аудиообъектов.
Согласно одному из вариантов осуществления способ содержит этапы приема, по меньшей мере, одного аудиосигнала с уменьшенным числом каналов и параметрических данных, генерирования измененных аудиосигналов с уменьшенным числом каналов, декодирования аудиообъектов из аудиосигналов с уменьшенным числом каналов и генерирования, по меньшей мере, одного выходного аудиосигнала из декодированных аудиообъектов. В способе каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов. Параметрические данные содержат множество параметров объекта для каждого множества аудиообъектов. Измененные аудиосигналы с уменьшенным числом каналов получают путем применения действий к оцененным аудиосигналам, соответствующим аудиообъектам, содержащимся в упомянутых аудиосигналах с уменьшенным числом каналов. Оцененные аудиосигналы выводятся из аудиосигналов с уменьшенным числом каналов на основании параметрических данных. Измененные аудиосигналы с уменьшенным числом каналов, основанные на типе примененного действия, декодируются декодирующим средством 300 или воспроизводятся воспроизводящим средством 400. Этап декодирования представлен декодирующим средством 300 для аудиосигналов с уменьшенным числом каналов или измененных аудиосигналов с уменьшенным числом каналов на основании параметрических данных.
Следующий этап генерирования, по меньшей мере, одного выходного аудиосигнала из декодированных аудиообъектов, который может быть назван этапом воспроизведения, может быть объединен с этапом декодирования в один этап обработки.
В варианте осуществления приемник для приема аудиосигналов содержит: принимающий элемент, средство действия, декодирующее средство и воспроизводящее средство. Элемент приемника принимает от передатчика, по меньшей мере, один аудиосигнал с уменьшенным числом каналов и параметрические данные. Каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов. Параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов.
Средство действия генерирует измененные аудиосигналы с уменьшенным числом каналов. Эти измененные аудиосигналы с уменьшенным числом каналов получают путем применения действий к оцененным аудиосигналам, соответствующим аудиообъектам, содержащимся в упомянутых аудиосигналах с уменьшенным числом каналов. Оцененные аудиосигналы выводят из аудиосигналов с уменьшенным числом каналов на основании параметрических данных. Измененные аудиосигналы с уменьшенным числом каналов на основании типа примененного действия декодируются декодирующим средством или воспроизводятся воспроизводящим средством.
Декодирующее средство декодирует аудиообъекты из аудиосигналов с уменьшенным числом каналов или измененных аудиосигналов с уменьшенным числом каналов на основании параметрических данных. Воспроизводящее средство генерирует, по меньшей мере, один выходной аудиосигнал из декодированных аудиообъектов.
Фиг.6 показывает систему передачи для передачи аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения. Система передачи содержит передатчик 700, который объединен с приемником 900 через сеть 800. Сеть 800 может быть, например, Интернетом.
Передатчик 700 является, например, записывающим сигнал устройством, и приемник 900 является, например, проигрывающим сигнал устройством. В конкретном примере, когда записывающая сигнал функция поддерживается, передатчик 700 содержит средство 710 для приема множества аудиообъектов. Затем эти объекты кодируются кодирующим средством 720 для кодирования множества аудиообъектов, по меньшей мере, в один аудиосигнал с уменьшенным числом каналов и параметрические данные. Вариант осуществления такого кодирующего средства 720 дан в работе Фаллера К. «Параметрическое Совместное Кодирование Аудиоисточников», 120-я AES Конвенция, Париж, Франция, Май 2006. Каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов. Упомянутые параметрические данные содержат множество параметров объекта для каждого множества аудиообъектов. Кодированные аудиообъекты передаются в приемник 900 средством 730 для передачи аудиосигналов с уменьшенным числом каналов и параметрических данных. Упомянутое средство 730 имеет интерфейс с сетью 800 и может передавать сигналы с уменьшенным числом каналов через сеть 800.
Приемник 900 содержит элемент 910 приемника для приема от передатчика 700, по меньшей мере, одного аудиосигнала с уменьшенным числом каналов и параметрических данных. Каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов. Упомянутые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов. Средство 920 действия генерирует измененные аудиосигналы с уменьшенным числом каналов. Упомянутые измененные аудиосигналы с уменьшенным числом каналов получаются путем применения действий к оцененным аудиосигналам, соответствующим аудиообъектам, содержащимся в упомянутых аудиосигналах с уменьшенным числом каналов. Упомянутые оцененные аудиосигналы получают из аудиосигналов с уменьшенным числом каналов на основании параметрических данных. Упомянутые измененные аудиосигналы с уменьшенным числом каналов, основанные на типе примененного действия, декодируются декодирующим средством, или воспроизводятся воспроизводящим средством, или объединяются с выходом воспроизводящего средства. Декодирующее средство декодирует аудиообъекты из аудиосигналов с уменьшенным числом каналов или измененных аудиосигналов с уменьшенным числом каналов на основании параметрических данных. Воспроизводящее средство генерирует, по меньшей мере, один выходной аудиосигнал из декодированного аудиообъекта.
В варианте осуществления действия ввода и передачи применяются одновременно.
В варианте осуществления действия применяются в ответ на ввод пользователя. Пользователь может посредством, например, кнопки, слайдера, ручки или графического интерфейса пользователя установить действия согласно своим предпочтениям.
Необходимо отметить, что вышеуказанные варианты осуществления иллюстрируют, а не ограничивают изобретение, и специалисты в данной области техники смогут разработать много альтернативных вариантов осуществления без отклонения от объема прилагаемой формулы изобретения.
В приложенной формуле изобретения некоторые ссылочные обозначения, расположенные между пояснениями, не следует толковать как ограничение пункта формулы изобретения. Слово «содержащий» не исключает наличия других элементов или этапов чем те, которые перечислены в пункте формулы изобретения. Использование элемента в единственном числе не исключает наличия множества таких элементов. Изобретение может быть осуществлено посредством аппаратного обеспечения, содержащего несколько отдельных элементов, и посредством компьютера, запрограммированного соответствующим образом.
Claims (14)
1. Аудиодекодер (100), содержащий:
средство (500) действия для генерирования измененных аудиосигналов с уменьшенным числом каналов из принятых аудиосигналов с уменьшенным числом каналов, упомянутые принятые аудиосигналы с уменьшенным числом каналов содержат смесь множества аудиообъектов, упомянутые измененные аудиосигналы с уменьшенным числом каналов получены путем применения действий к оцененным аудиосигналам, соответствующим аудиообъектам, содержащимся в упомянутых принятых аудиосигналах с уменьшенным числом каналов, причем упомянутые оцененные аудиосигналы выведены из принятых аудиосигналов с уменьшенным числом каналов на основании принятых параметрических данных, упомянутые принятые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов, причем упомянутые измененные аудиосигналы с уменьшенным числом каналов, основанные на типе примененного действия, декодируются декодирующим средством, или воспроизводятся воспроизводящим средством, или объединяются с выходом воспроизводящего средства;
декодирующее средство (300), выполненное с возможностью декодирования аудиообъектов из аудиосигналов с уменьшенным числом каналов или измененных аудиосигналов с уменьшенным числом каналов на основании параметрических данных;
воспроизводящее средство (400), выполненное с возможностью генерирования по меньшей мере одного выходного аудиосигнала из декодированных аудиообъектов.
средство (500) действия для генерирования измененных аудиосигналов с уменьшенным числом каналов из принятых аудиосигналов с уменьшенным числом каналов, упомянутые принятые аудиосигналы с уменьшенным числом каналов содержат смесь множества аудиообъектов, упомянутые измененные аудиосигналы с уменьшенным числом каналов получены путем применения действий к оцененным аудиосигналам, соответствующим аудиообъектам, содержащимся в упомянутых принятых аудиосигналах с уменьшенным числом каналов, причем упомянутые оцененные аудиосигналы выведены из принятых аудиосигналов с уменьшенным числом каналов на основании принятых параметрических данных, упомянутые принятые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов, причем упомянутые измененные аудиосигналы с уменьшенным числом каналов, основанные на типе примененного действия, декодируются декодирующим средством, или воспроизводятся воспроизводящим средством, или объединяются с выходом воспроизводящего средства;
декодирующее средство (300), выполненное с возможностью декодирования аудиообъектов из аудиосигналов с уменьшенным числом каналов или измененных аудиосигналов с уменьшенным числом каналов на основании параметрических данных;
воспроизводящее средство (400), выполненное с возможностью генерирования по меньшей мере одного выходного аудиосигнала из декодированных аудиообъектов.
2. Декодер по п.1, в котором средство (500) действия выполнено с возможностью обеспечения действия ввода и содержит:
средство (510) оценивания для генерирования оцененных аудиосигналов, соответствующих объекту или множеству объектов, к которым должно быть применено действие ввода, и генерирования оцененных аудиосигналов, соответствующих остальным объектам;
средство (530) ввода для применения действия ввода к оцененным аудиосигналам, соответствующим объекту или множеству объектов, к которым должно быть применено действие ввода;
сумматор (540) для суммирования аудиосигналов, предоставленных средством ввода, и оцененного аудиосигнала, соответствующего остальным объектам.
средство (510) оценивания для генерирования оцененных аудиосигналов, соответствующих объекту или множеству объектов, к которым должно быть применено действие ввода, и генерирования оцененных аудиосигналов, соответствующих остальным объектам;
средство (530) ввода для применения действия ввода к оцененным аудиосигналам, соответствующим объекту или множеству объектов, к которым должно быть применено действие ввода;
сумматор (540) для суммирования аудиосигналов, предоставленных средством ввода, и оцененного аудиосигнала, соответствующего остальным объектам.
3. Декодер по п.2, в котором декодер дополнительно содержит средство (600) изменения для изменения параметрических данных, когда спектральная или временная огибающая оцененного аудиосигнала, соответствующего объекту или множеству объектов, изменена действием ввода.
4. Декодер по п.1, в котором средство действия выполнено с возможностью обеспечения действия передачи и содержит:
средство (510) оценивания для генерирования оцененных аудиосигналов, соответствующих объекту или множеству объектов, к которым должно быть применено действие передачи;
средство (560) усиления для определения величины действия передачи для оцененных аудиосигналов, соответствующих объекту или множеству объектов, к которым должно быть применено действие передачи;
сумматор (540) для суммирования аудиосигналов, полученных от средства усиления;
средство (570) передачи для применения действия передачи к аудиосигналам, полученным от сумматора.
средство (510) оценивания для генерирования оцененных аудиосигналов, соответствующих объекту или множеству объектов, к которым должно быть применено действие передачи;
средство (560) усиления для определения величины действия передачи для оцененных аудиосигналов, соответствующих объекту или множеству объектов, к которым должно быть применено действие передачи;
сумматор (540) для суммирования аудиосигналов, полученных от средства усиления;
средство (570) передачи для применения действия передачи к аудиосигналам, полученным от сумматора.
5. Декодер по любому из пп.1-4, в котором генерация оцененных аудиосигналов, соответствующих аудиообъекту или множеству объектов, содержит зависимое от времени/частоты масштабирование аудиосигналов с уменьшенным числом каналов на основании параметров мощности, соответствующих аудиообъектам, причем упомянутые параметры мощности содержатся в параметрических данных.
6. Декодер по п.5, в котором генерация оцененных аудиосигналов содержит взвешивание объекта или комбинации множества объектов посредством зависимого от времени/частоты масштабирования аудиосигналов с уменьшенным числом каналов на основании параметров мощности, соответствующих аудиообъектам, причем упомянутые параметры мощности содержатся в принятых параметрических данных.
7. Декодер по п.1, в котором сигналы с уменьшенным числом каналов и параметрические данные соответствуют стандарту MPEG Surround.
8. Декодер по п.7, в котором декодирующее средство (300) содержит декодер (320) в соответствии со стандартом MPEG Surround и средство (310) преобразования для преобразования параметрических данных в параметрические данные в соответствии со стандартом MPEG Surround.
9. Способ декодирования аудиосигналов, содержащий этапы, на которых:
принимают по меньшей мере один аудиосигнал с уменьшенным числом каналов и параметрические данные, причем каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов, упомянутые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов;
генерируют измененные аудиосигналы с уменьшенным числом каналов, упомянутые измененные аудиосигналы с уменьшенным числом каналов получают путем применения действий к оцененным аудиосигналам, соответствующим аудиообъектам, содержащимся в упомянутых аудиосигналах с уменьшенным числом каналов, причем упомянутые оцененные аудиосигналы выводят из аудиосигналов с уменьшенным числом каналов на основании параметрических данных, причем упомянутые измененные аудиосигналы с уменьшенным числом каналов, основанные на типе примененного действия, декодируют декодирующим средством или воспроизводят воспроизводящим средством или объединяют с выходом воспроизводящего средства;
декодируют аудиообъекты из аудиосигналов с уменьшенным числом каналов или измененных аудиосигналов с уменьшенным числом каналов на основании параметрических данных;
генерируют по меньшей мере один выходной аудиосигнал из декодированных аудиообъектов.
принимают по меньшей мере один аудиосигнал с уменьшенным числом каналов и параметрические данные, причем каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов, упомянутые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов;
генерируют измененные аудиосигналы с уменьшенным числом каналов, упомянутые измененные аудиосигналы с уменьшенным числом каналов получают путем применения действий к оцененным аудиосигналам, соответствующим аудиообъектам, содержащимся в упомянутых аудиосигналах с уменьшенным числом каналов, причем упомянутые оцененные аудиосигналы выводят из аудиосигналов с уменьшенным числом каналов на основании параметрических данных, причем упомянутые измененные аудиосигналы с уменьшенным числом каналов, основанные на типе примененного действия, декодируют декодирующим средством или воспроизводят воспроизводящим средством или объединяют с выходом воспроизводящего средства;
декодируют аудиообъекты из аудиосигналов с уменьшенным числом каналов или измененных аудиосигналов с уменьшенным числом каналов на основании параметрических данных;
генерируют по меньшей мере один выходной аудиосигнал из декодированных аудиообъектов.
10. Приемник для приема аудиосигналов, содержащий аудиодекодер по п.1 и элемент (200) приемника для приема от передатчика по меньшей мере одного аудиосигнала с уменьшенным числом каналов и параметрических данных, каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов, упомянутые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов, причем элемент приемника связан со средством (500) действия и декодирующим средством (300).
11. Система связи для передачи аудиосигналов, содержащая:
передатчик (700) содержащий:
средство (710) для приема множества аудиообъектов,
кодирующее средство (720) для кодирования множества аудиообъектов по меньшей мере в один аудиосигнал с уменьшенным числом каналов и параметрические данные, каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов, упомянутые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов, и
средство (730) для передачи аудиосигналов с уменьшенным числом каналов и параметрических данных на приемник, и
приемник (900) по п.10.
передатчик (700) содержащий:
средство (710) для приема множества аудиообъектов,
кодирующее средство (720) для кодирования множества аудиообъектов по меньшей мере в один аудиосигнал с уменьшенным числом каналов и параметрические данные, каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов, упомянутые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов, и
средство (730) для передачи аудиосигналов с уменьшенным числом каналов и параметрических данных на приемник, и
приемник (900) по п.10.
12. Способ приема аудиосигналов, содержащий этапы, на которых:
принимают от передатчика по меньшей мере один аудиосигнал с уменьшенным числом каналов и параметрические данные, каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов, упомянутые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов;
генерируют измененные аудиосигналы с уменьшенным числом каналов, упомянутые измененные аудиосигналы с уменьшенным числом каналов получают путем применения действий к оцененным аудиосигналам, соответствующим аудиообъектам, содержащимся в упомянутых аудиосигналах с уменьшенным числом каналов, причем упомянутые оцененные аудиосигналы выводят из аудиосигналов с уменьшенным числом каналов на основании параметрических данных, причем упомянутые измененные аудиосигналы с уменьшенным числом каналов, основанные на типе примененного действия, декодируют декодирующим средством, или воспроизводят воспроизводящим средством, или объединяют с выходом воспроизводящего средства;
декодируют аудиообъекты из аудиосигналов с уменьшенным числом каналов или измененных аудиосигналов с уменьшенным числом каналов на основании параметрических данных,
генерируют воспроизводящим средством по меньшей мере один выходной аудиосигнал из декодированных аудиообъектов.
принимают от передатчика по меньшей мере один аудиосигнал с уменьшенным числом каналов и параметрические данные, каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов, упомянутые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов;
генерируют измененные аудиосигналы с уменьшенным числом каналов, упомянутые измененные аудиосигналы с уменьшенным числом каналов получают путем применения действий к оцененным аудиосигналам, соответствующим аудиообъектам, содержащимся в упомянутых аудиосигналах с уменьшенным числом каналов, причем упомянутые оцененные аудиосигналы выводят из аудиосигналов с уменьшенным числом каналов на основании параметрических данных, причем упомянутые измененные аудиосигналы с уменьшенным числом каналов, основанные на типе примененного действия, декодируют декодирующим средством, или воспроизводят воспроизводящим средством, или объединяют с выходом воспроизводящего средства;
декодируют аудиообъекты из аудиосигналов с уменьшенным числом каналов или измененных аудиосигналов с уменьшенным числом каналов на основании параметрических данных,
генерируют воспроизводящим средством по меньшей мере один выходной аудиосигнал из декодированных аудиообъектов.
13. Способ передачи и приема аудиосигналов, содержащий:
в передатчике выполнение этапов:
приема множества аудиообъектов,
кодирования множества аудиообъектов по меньшей мере в один аудиосигнал с уменьшенным числом каналов и параметрические данные, причем каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов, упомянутые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов, и
передачи аудиосигналов с уменьшенным числом каналов и параметрические данные на приемник, и
в приемнике выполнение этапов:
приема от передатчика по меньшей мере одного аудиосигнала с уменьшенным числом каналов и параметрических данных, причем каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов, упомянутые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов,
генерации измененных аудиосигналов с уменьшенным числом каналов, причем упомянутые измененные аудиосигналы с уменьшенным числом каналов получают применением действий к оцененным аудиосигналам, соответствующим аудиообъектам, содержащимся в упомянутых аудиосигналах с уменьшенным числом каналов, упомянутые оцененные аудиосигналы выводят из аудиосигналов с уменьшенным числом каналов на основании параметрических данных, причем упомянутые измененные аудиосигналы с уменьшенным числом каналов, основанные на типе примененного действия, декодируют декодирующим средством, или воспроизводят воспроизводящим средством, или объединяют с выходом воспроизводящего средства;
декодирования аудиообъектов из аудиосигналов с уменьшенным числом каналов или измененных аудиосигналов с уменьшенным числом каналов на основании параметрических данных,
генерации по меньшей мере одного выходного аудиосигнала из декодированных аудиообъектов.
в передатчике выполнение этапов:
приема множества аудиообъектов,
кодирования множества аудиообъектов по меньшей мере в один аудиосигнал с уменьшенным числом каналов и параметрические данные, причем каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов, упомянутые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов, и
передачи аудиосигналов с уменьшенным числом каналов и параметрические данные на приемник, и
в приемнике выполнение этапов:
приема от передатчика по меньшей мере одного аудиосигнала с уменьшенным числом каналов и параметрических данных, причем каждый аудиосигнал с уменьшенным числом каналов содержит смесь множества аудиообъектов, упомянутые параметрические данные содержат множество параметров объекта для каждого из множества аудиообъектов,
генерации измененных аудиосигналов с уменьшенным числом каналов, причем упомянутые измененные аудиосигналы с уменьшенным числом каналов получают применением действий к оцененным аудиосигналам, соответствующим аудиообъектам, содержащимся в упомянутых аудиосигналах с уменьшенным числом каналов, упомянутые оцененные аудиосигналы выводят из аудиосигналов с уменьшенным числом каналов на основании параметрических данных, причем упомянутые измененные аудиосигналы с уменьшенным числом каналов, основанные на типе примененного действия, декодируют декодирующим средством, или воспроизводят воспроизводящим средством, или объединяют с выходом воспроизводящего средства;
декодирования аудиообъектов из аудиосигналов с уменьшенным числом каналов или измененных аудиосигналов с уменьшенным числом каналов на основании параметрических данных,
генерации по меньшей мере одного выходного аудиосигнала из декодированных аудиообъектов.
14. Способ по любому из пп.9, 12, и 13, в котором действия применяются в ответ на ввод пользователя.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP07100339.6 | 2007-01-10 | ||
EP07100339 | 2007-01-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2009130352A RU2009130352A (ru) | 2011-02-20 |
RU2466469C2 true RU2466469C2 (ru) | 2012-11-10 |
Family
ID=39609124
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2009130352/08A RU2466469C2 (ru) | 2007-01-10 | 2008-01-07 | Аудиодекодер |
Country Status (10)
Country | Link |
---|---|
US (1) | US8634577B2 (ru) |
EP (1) | EP2109861B1 (ru) |
JP (1) | JP5455647B2 (ru) |
KR (1) | KR101443568B1 (ru) |
CN (1) | CN101578658B (ru) |
BR (1) | BRPI0806346B1 (ru) |
MX (1) | MX2009007412A (ru) |
RU (1) | RU2466469C2 (ru) |
TR (1) | TR201906713T4 (ru) |
WO (1) | WO2008084427A2 (ru) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2011011399A (es) * | 2008-10-17 | 2012-06-27 | Univ Friedrich Alexander Er | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. |
JP5679340B2 (ja) * | 2008-12-22 | 2015-03-04 | コーニンクレッカ フィリップス エヌ ヴェ | 送信効果処理による出力信号の生成 |
MX2011010889A (es) * | 2009-04-21 | 2011-11-02 | Ecolab Usa Inc | Aparato y metodo catalitico de tratamiento de agua. |
JP5576488B2 (ja) | 2009-09-29 | 2014-08-20 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号デコーダ、オーディオ信号エンコーダ、アップミックス信号表現の生成方法、ダウンミックス信号表現の生成方法、及びコンピュータプログラム |
BR122021008665B1 (pt) | 2009-10-16 | 2022-01-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Mecanismo e método para fornecer um ou mais parâmetros ajustados para a provisão de uma representação de sinal upmix com base em uma representação de sinal downmix e uma informação lateral paramétrica associada com a representação de sinal downmix, usando um valor médio |
PL3779979T3 (pl) | 2010-04-13 | 2024-01-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji |
JP5903758B2 (ja) * | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
WO2012040897A1 (en) * | 2010-09-28 | 2012-04-05 | Huawei Technologies Co., Ltd. | Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal |
CN103050124B (zh) | 2011-10-13 | 2016-03-30 | 华为终端有限公司 | 混音方法、装置及系统 |
IN2014CN03413A (ru) * | 2011-11-01 | 2015-07-03 | Koninkl Philips Nv | |
ES2555136T3 (es) | 2012-02-17 | 2015-12-29 | Huawei Technologies Co., Ltd. | Codificador paramétrico para codificar una señal de audio multicanal |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
EP2850612B1 (en) | 2012-05-18 | 2019-04-10 | Dolby Laboratories Licensing Corporation | System for maintaining reversible dynamic range control information associated with parametric audio coders |
KR20140027831A (ko) * | 2012-08-27 | 2014-03-07 | 삼성전자주식회사 | 오디오 신호 전송 장치 및 그의 오디오 신호 전송 방법, 그리고 오디오 신호 수신 장치 및 그의 오디오 소스 추출 방법 |
WO2014209902A1 (en) | 2013-06-28 | 2014-12-31 | Dolby Laboratories Licensing Corporation | Improved rendering of audio objects using discontinuous rendering-matrix updates |
EP2830065A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
US10373711B2 (en) | 2014-06-04 | 2019-08-06 | Nuance Communications, Inc. | Medical coding system with CDI clarification request notification |
US10754925B2 (en) | 2014-06-04 | 2020-08-25 | Nuance Communications, Inc. | NLU training with user corrections to engine annotations |
CN107077952B (zh) | 2014-11-19 | 2018-09-07 | 株式会社村田制作所 | 线圈部件 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10366687B2 (en) * | 2015-12-10 | 2019-07-30 | Nuance Communications, Inc. | System and methods for adapting neural network acoustic models |
WO2018057639A1 (en) | 2016-09-20 | 2018-03-29 | Nuance Communications, Inc. | Method and system for sequencing medical billing codes |
US11133091B2 (en) | 2017-07-21 | 2021-09-28 | Nuance Communications, Inc. | Automated analysis system and method |
US11024424B2 (en) | 2017-10-27 | 2021-06-01 | Nuance Communications, Inc. | Computer assisted coding systems and methods |
US11929082B2 (en) | 2018-11-02 | 2024-03-12 | Dolby International Ab | Audio encoder and an audio decoder |
CN114245036B (zh) * | 2021-12-21 | 2024-03-12 | 北京达佳互联信息技术有限公司 | 视频制作方法及装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2011119A (en) * | 1932-12-03 | 1935-08-13 | Rekuperator Gmbh | Method of protecting heating surfaces against overheating |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
DE69713779T2 (de) | 1996-09-12 | 2002-10-17 | University Of Bath, Bath | Objektorientiertes videosystem |
EP1613089A1 (en) | 1997-02-14 | 2006-01-04 | The Trustees of Columbia University in the City of New York | Object-based audio-visual terminal and corresponding bitstream structure |
WO2001095512A1 (en) * | 2000-06-06 | 2001-12-13 | Georgia Tech Research Corporation | System and method for object-oriented video processing |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
JP2005086486A (ja) * | 2003-09-09 | 2005-03-31 | Alpine Electronics Inc | オーディオ装置およびオーディオ処理方法 |
DE102004052296A1 (de) * | 2004-10-27 | 2006-05-04 | Sennheiser Electronic Gmbh & Co. Kg | Sender und Empfänger für ein drahtloses Audio-Übertragungssystem |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
US9626973B2 (en) * | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
ATE521143T1 (de) * | 2005-02-23 | 2011-09-15 | Ericsson Telefon Ab L M | Adaptive bitzuweisung für die mehrkanal- audiokodierung |
MX2008000504A (es) * | 2005-07-14 | 2008-03-07 | Koninkl Philips Electronics Nv | Codificacion y decodificacion de audio. |
TWI326448B (en) | 2006-02-09 | 2010-06-21 | Lg Electronics Inc | Method for encoding and an audio signal and apparatus thereof and computer readable recording medium for method for decoding an audio signal |
KR101065704B1 (ko) | 2006-09-29 | 2011-09-19 | 엘지전자 주식회사 | 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치 |
WO2008069595A1 (en) * | 2006-12-07 | 2008-06-12 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
-
2008
- 2008-01-07 MX MX2009007412A patent/MX2009007412A/es active IP Right Grant
- 2008-01-07 JP JP2009545259A patent/JP5455647B2/ja active Active
- 2008-01-07 US US12/521,884 patent/US8634577B2/en active Active
- 2008-01-07 BR BRPI0806346-0A patent/BRPI0806346B1/pt active IP Right Grant
- 2008-01-07 KR KR1020097016679A patent/KR101443568B1/ko active Active
- 2008-01-07 RU RU2009130352/08A patent/RU2466469C2/ru active
- 2008-01-07 WO PCT/IB2008/050029 patent/WO2008084427A2/en active Application Filing
- 2008-01-07 TR TR2019/06713T patent/TR201906713T4/tr unknown
- 2008-01-07 CN CN2008800020987A patent/CN101578658B/zh active Active
- 2008-01-07 EP EP08700207.7A patent/EP2109861B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP5455647B2 (ja) | 2014-03-26 |
CN101578658B (zh) | 2012-06-20 |
BRPI0806346B1 (pt) | 2020-09-29 |
BRPI0806346A2 (pt) | 2011-09-06 |
BRPI0806346A8 (pt) | 2015-10-13 |
KR101443568B1 (ko) | 2014-09-23 |
WO2008084427A3 (en) | 2009-03-12 |
WO2008084427A2 (en) | 2008-07-17 |
EP2109861B1 (en) | 2019-03-13 |
RU2009130352A (ru) | 2011-02-20 |
CN101578658A (zh) | 2009-11-11 |
US20100076774A1 (en) | 2010-03-25 |
US8634577B2 (en) | 2014-01-21 |
EP2109861A2 (en) | 2009-10-21 |
MX2009007412A (es) | 2009-07-17 |
KR20090113286A (ko) | 2009-10-29 |
TR201906713T4 (tr) | 2019-05-21 |
JP2010515944A (ja) | 2010-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2466469C2 (ru) | Аудиодекодер | |
RU2305870C2 (ru) | Оптимизированное по точности кодирование с переменной длиной кадра | |
RU2327304C2 (ru) | Совместимое многоканальное кодирование/декодирование | |
JP5934922B2 (ja) | 復号装置 | |
JP5608660B2 (ja) | エネルギ保存型マルチチャネルオーディオ符号化 | |
TWI476763B (zh) | A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded | |
JP5154538B2 (ja) | オーディオ復号 | |
US20090204397A1 (en) | Linear predictive coding of an audio signal | |
JP2015527610A (ja) | マルチチャンネルオーディオ信号のレンダリングを改善する方法及び装置 | |
CN101120615A (zh) | 近透明或透明的多声道编码器/解码器方案 | |
KR20070056081A (ko) | 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법 | |
CN106465028B (zh) | 音频信号处理装置和方法、编码装置和方法以及程序 | |
WO2010140350A1 (ja) | ダウンミックス装置、符号化装置、及びこれらの方法 | |
WO2013158804A1 (en) | Systems and methods for implementing efficient cross-fading between compressed audio streams | |
JP7589876B2 (ja) | 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置 | |
JPH09152896A (ja) | 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置 | |
Ferreira et al. | Stereo ACC real-time audio communication |