RU2407226C2 - Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов - Google Patents
Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов Download PDFInfo
- Publication number
- RU2407226C2 RU2407226C2 RU2008142141/09A RU2008142141A RU2407226C2 RU 2407226 C2 RU2407226 C2 RU 2407226C2 RU 2008142141/09 A RU2008142141/09 A RU 2008142141/09A RU 2008142141 A RU2008142141 A RU 2008142141A RU 2407226 C2 RU2407226 C2 RU 2407226C2
- Authority
- RU
- Russia
- Prior art keywords
- signal
- channel
- channels
- head
- filter
- Prior art date
Links
- 238000002156 mixing Methods 0.000 title claims abstract description 9
- 230000006870 function Effects 0.000 claims abstract description 93
- 238000000034 method Methods 0.000 claims abstract description 40
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 29
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 29
- 238000012546 transfer Methods 0.000 claims abstract description 14
- 230000005540 biological transmission Effects 0.000 claims description 73
- 230000001629 suppression Effects 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 12
- 238000005303 weighing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 8
- 230000008569 process Effects 0.000 abstract description 8
- 230000005236 sound signal Effects 0.000 abstract description 5
- 238000011084 recovery Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 230000008901 benefit Effects 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 10
- 238000012545 processing Methods 0.000 description 7
- 230000008447 perception Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003534 oscillatory effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
- H04S3/004—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Peptides Or Proteins (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
Изобретение относится к декодированию закодированных мультиканальных аудиосигналов. Технический результат - повышение точности воспроизведения мультиканальных аудиосигналов. Сигнал (314) понижающего микширования для наушников может быть эффективно получен из параметрического понижающего микширования мультиканального сигнала (312), когда модифицированные HRTF (310) (head related transfer functions - относящейся к голове функции передачи) получаются из HRTF (308) мультиканального сигнала, используя параметр (306) уровня, имеющего информацию о соотношении уровней между двумя каналами мультиканального сигнала, так, чтобы на модифицированную HRTF (310) сильнее влияла HRTF (308) канала, имеющего более высокий уровень, чем HRTF (308) канала, имеющего более низкий уровень. Модифицированные HRTF (310) получаются в процессе декодирования с учетом относительного уровня каналов, связанных с этими HRTF (308). Таким образом, HRTF (308) модифицируются так, чтобы сигнал (314) понижающего микширования параметрического представления мультиканального сигнала мог быть использован непосредственно для синтеза сигнала (314) понижающего микширования для наушников без необходимости в полном параметрическом мультиканальном восстановлении параметрического сигнала понижающего микширования. 7 н. и 19 з.п. ф-лы, 11 ил.
Description
Область техники, к которой относится изобретение
Данное изобретение относится к декодированию закодированных мультиканальных аудиосигналов, на основании параметрического мультиканального представления, и, в частности, к генерации двухканальных сигналов понижающего микширования, обеспечивающих восприятие объемного прослушивания, как например, сигналов понижающего микширования, совместимых с наушниками, или объемного понижающего микширования для систем с двумя динамиками.
Уровень техники
Недавние разработки в области аудиокодирования сделали доступной возможность восстановить мультиканальное представление аудиосигнала на основе стерео (или моно) сигнала и соответствующих управляющих данных. Эти способы существенно отличаются от прежних матричных способов, таких как Dolby Prologic, поскольку дополнительные управляющие данные передаются для управления восстановлением, также называемым повышающим микшированием, каналов пространственного звуковоспроизведения на основе переданных моно- или стереоканалов.
Таким образом, подобный декодер параметрического мультиканального аудио, к примеру, MPEG Surround, восстанавливает N каналов на основе М переданных каналов, где N>М, и дополнительных управляющих данных. Дополнительные управляющие данные представляют собой существенно меньшую частоту следования данных относительно передачи всех N каналов, повышая эффективность кодирования и в то же время гарантируя совместимость как с M-канальными, так и с N-канальными устройствами.
Эти способы кодирования параметрического окружающего звука обычно содержат параметризацию сигнала окружающего звука на основе IID (Inter channel Intensity Difference - разность мощностей между каналами) или CLD (Channel Level Difference - разница уровней каналов) и ICC (Inter Channel Coherence - межканальная когерентность). Эти параметры описывают соотношения мощностей и корреляцию между парами каналов в процессе повышающего микширования. Дополнительные параметры, также используемые в уровне техники, содержат параметры предсказания, используемые для предсказания промежуточных или выходных каналов в течение процедуры повышающего микширования.
Другие разработки в области воспроизведения мультиканального аудиоконтента обеспечивают средства для получения ощущения объемного звучания, используя стереонаушники. Для достижения восприятия объемного звучания посредством лишь двух динамиков наушников мультиканальные сигналы подвергаются процедуре понижающего микширования в стереосигналы с применением HRTF (head related transfer functions - функции передачи, относящиеся к голове), позволяющих принять в расчет чрезвычайно сложные с точки зрения передачи звука характеристики головы человека для обеспечения восприятия объемного звучания.
Другой связанный подход заключается в использовании обычного оборудования проигрывания двухканальных сигналов и фильтровании каналов мультиканального аудиосигнала соответствующими фильтрами с целью добиться восприятия звучания, сходного с таковым при проигрывании с исходным количеством динамиков. Эта обработка сигналов аналогична обработке в случае воспроизведения через наушники для создания обладающего требуемыми свойствами “объемного стереосигнала понижающего микширования”. В отличие от случая с наушниками сигнал от обоих динамиков достигает обоих ушей слушателя непосредственно, вызывая нежелательные “эффекты перекрестных помех”. В виду того что для оптимального качества воспроизведения этот факт необходимо принимать в расчет, фильтры, используемые для обработки сигнала, обычно называются фильтрами подавления перекрестных помех. По сути, цель этой методики есть расширение возможного круга источников звука вне базы стереодинамиков посредством подавления естественным образом возникающих перекрестных помех с помощью сложных фильтров подавления перекрестных помех.
Из-за сложности фильтрования HRTF-фильтры являются очень длинными, поскольку каждый из них может включать несколько сотен отводов. По той же причине вряд ли возможно найти такую параметризацию фильтров, которая, будучи использованной вместо реального фильтра, будет хорошо функционировать, не понижая качество восприятия.
Таким образом, с одной стороны, оптимальные с точки зрения сбережения ресурсов параметрические представления мультиканальных сигналов действительно существуют, что позволяет эффективно передавать закодированный мультиканальный сигнал. С другой стороны, простые способы создания эффекта объемного звучания для мультиканального сигнала известны только для стереонаушников и стереодинамиков. Однако в качестве входной информации для применения относящихся к голове функций передачи, которые создают сигнал понижающего микширования для наушников, они требуют полного числа каналов мультиканального сигнала. Таким образом, перед применением связанной с головой функции передачи или фильтров подавления перекрестных помех необходимы либо передача полного набора мультиканальных сигналов, либо полное восстановление параметрического представления, из-за чего неприемлемо велики либо ширина полосы пропускания, либо вычислительная сложность.
Сущность изобретения
Задача данного изобретения заключается в предоставлении концепции, позволяющей с помощью параметрических представлений мультиканальных сигналов более эффективно восстановить двухканальный сигнал, обеспечивающий эффект объемного звучания.
В соответствии с первым аспектом данного изобретения эта цель достигается посредством декодера для получения сигнала понижающего микширования наушников, используя представление понижающего микширования мультиканального сигнала, используя параметр уровня, имеющий информацию об соотношения уровней между двумя каналами мультиканального сигнала, и используя относящиеся к голове функции передачи, относящиеся к двум каналам мультиканального сигнала; причем декодер содержит: блок вычисления фильтров для получения модифицированных относящихся к голове функций передачи путем взвешивания относящихся к голове функций передачи двух каналов, используя с помощью параметра уровня так, чтобы на модифицированную относящуюся к голове функцию передачи сильнее влияла относящаяся к голове функция передачи канала, имеющего более высокий уровень, чем относящаяся к голове функция передачи канала, имеющего более низкий уровень; блок синтеза для получения сигнала понижающего микширования для наушников с использованием модифицированных относящихся к голове функций передачи и представления сигнала понижающего микширования.
В соответствии со вторым аспектом данного изобретения эта цель достигается посредством бинаурального декодера, содержащего: декодер для получения сигнала понижающего микширования для наушников, используя представление понижающего микширования мультиканального сигнала, параметр уровня, имеющий информацию о соотношении уровней между двумя каналами мультиканального сигнала, и используя относящиеся к голове функции передачи, относящиеся к двум каналам мультиканального сигнала; причем декодер содержит: блок вычисления фильтров для получения модифицированных относящихся к голове функций передачи путем взвешивания относящихся к голове функций передачи двух каналов, используя параметр уровня так, чтобы на модифицированную относящуюся к голове функцию передачи сильнее влияла относящаяся к голове функция передачи канала, имеющего более высокий уровень, чем относящаяся к голове функция передачи канала, имеющего более низкий уровень; и блок синтеза для получения сигнала понижающего микширования для наушников с помощью модифицированных относящихся к голове функций передачи и представления сигнала понижающего микширования; блок фильтров анализа для получения представления понижающего микширования мультиканального сигнала путем фильтрования под-диапазонов понижающего микширования мультиканального сигнала; и блок фильтров синтеза для получения сигнала временной области для наушников путем синтеза сигнала понижающего микширования для наушников.
В соответствии с третьим аспектом данного изобретения эта цель достигается способом получения сигнала понижающего микширования для наушников, используя представление понижающего микширования мультиканального сигнала, и используя параметр уровня, имеющий информацию о соотношении уровней между двумя каналами мультиканального сигнала, и используя относящиеся к голове функции передачи, относящиеся к двум каналам мультиканального сигнала; причем способ содержит этапы, на которых: получают, используя параметр уровня, модифицированные относящиеся к голове функции передачи путем взвешивания относящихся к голове функций передачи двух каналов так, чтобы на модифицированную относящуюся к голове функцию передачи сильнее влияла относящаяся к голове функция передачи канала, имеющего более высокий уровень, чем относящаяся к голове функция передачи канала, имеющего более низкий уровень; и получают сигнал понижающего микширования для наушников, используя модифицированные относящиеся к голове функции передачи и представление сигнала понижающего микширования.
В соответствии с четвертым аспектом данного изобретения эта цель достигается посредством приемника или аудиопроигрывателя, имеющего декодер для получения сигнала понижающего микширования для наушников, используя представление понижающего микширования мультиканального сигнала, используя параметр уровня, имеющий информацию о соотношении уровней между двумя каналами мультиканального сигнала, и используя относящиеся к голове функции передачи, относящиеся к двум каналам мультиканального сигнала; причем декодер содержит: блок вычисления фильтров для получения модифицированных относящихся к голове функций передачи путем взвешивания относящихся к голове функций передачи двух каналов с использованием параметра уровня так, чтобы на модифицированную относящуюся к голове функцию передачи сильнее влияла относящаяся к голове функция передачи канала, имеющего более высокий уровень, чем относящаяся к голове функция передачи канала, имеющего более низкий уровень; и блок синтеза для получения сигнала понижающего микширования для наушников, используя модифицированные относящиеся к голове функции передачи и представление сигнала понижающего микширования.
В соответствии с пятым аспектом данного изобретения эта цель достигается способом приема или проигрывания аудио, этот способ содержит способ получения сигнала понижающего микширования для наушников, используя представление понижающего микширования мультиканального сигнала, и используя параметр уровня, имеющий информацию о соотношении уровней между двумя каналами мультиканального сигнала, и используя относящиеся к голове функции передачи, относящиеся к двум каналам мультиканального сигнала; причем способ содержит этапы, на которых: получают, используя параметр уровня, модифицированные относящиеся к голове функции передачи путем взвешивания относящихся к голове функций передачи двух каналов так, чтобы на модифицированную относящуюся к голове функцию передачи сильнее влияла относящаяся к голове функция передачи канала, имеющего более высокий уровень, чем относящаяся к голове функция передачи канала, имеющего более низкий уровень; и получают сигнал понижающего микширования для наушников, используя модифицированные относящиеся к голове функции передачи и представление сигнала понижающего микширования.
В соответствии с шестым аспектом данного изобретения эта цель достигается посредством декодера для получения пространственного стереосигнала понижающего микширования, используя представление понижающего микширования мультиканального сигнала, и используя параметр уровня, имеющий информацию о соотношении уровней между двумя каналами мультиканального сигнала, и используя фильтры подавления перекрестных помех, связанные с двумя каналами мультиканального сигнала; причем декодер содержит: блок вычисления фильтров для получения модифицированных фильтров подавления перекрестных помех путем взвешивания фильтров подавления перекрестных помех двух каналов, используя параметр уровня так, чтобы на модифицированные фильтры подавления перекрестных помех сильнее влиял фильтр подавления перекрестных помех канала, имеющего более высокий уровень, чем фильтр подавления перекрестных помех канала, имеющего более низкий уровень; блок синтеза для получения сигнала понижающего микширования для наушников, используя модифицированные фильтры подавления перекрестных помех и представление сигнала понижающего микширования.
Данное изобретение основано на обнаружении того, что сигнал понижающего микширования для наушников может быть получен из параметрического понижающего микширования мультиканального сигнала, когда блок вычисления фильтров используется для получения модифицированных HRTF (head related transfer functions - относящихся к голове функций передачи) из исходных HRTF мультиканального сигнала, а преобразователь фильтров использует параметр уровня, имеющий информацию о соотношении уровней между двумя каналами мультиканального сигнала, так, чтобы на модифицированные HRTF сильнее влияли HRTF канала, имеющего более высокий уровень, чем HRTF канала, имеющего более низкий уровень. Модифицированные HRTF получаются в процессе декодирования с учетом относительного уровня каналов, связанных с этими HRTF. Исходные HRTF модифицируются так, чтобы сигнал понижающего микширования параметрического представления мультиканального сигнала мог быть использован непосредственно для синтеза сигнала понижающего микширования для наушников без необходимости в полном параметрическом мультиканальном восстановлении параметрического сигнала понижающего микширования.
В одном из вариантов осуществления данного изобретения используется декодер согласно изобретению для реализации как параметрического мультиканального восстановления, так и бинаурального восстановления согласно изобретению переданного параметрического понижающего микширования исходного мультиканального сигнала. Согласно данному изобретению не требуется полное восстановление мультиканального сигнала до бинаурального понижающего микширования, что дает очевидное преимущество в сильном снижении вычислительной сложности. Например, за счет этого у мобильных устройств с ограниченными источниками энергии значительно увеличивается продолжительность воспроизведения. Другое преимущество состоит в том, что одно и то же устройство может служить средством предоставления полных мультиканальных сигналов (например, сигналов 5.1, 7.1, 7.2), а также бинаурального понижающего микширования сигнала, имеющего эффект объемного звучания даже в случае использования наушников с двумя динамиками. Это может быть особенно ощутимо, к примеру, в домашних конфигурациях.
В другом варианте осуществления данного изобретения блок вычисления фильтров используется для получения модифицированных HRTF не только путем комбинирования HRTF двух каналов с применением индивидуальных весовых множителей к HRTF, но и с помощью введения дополнительных фазовых множителей для каждой из объединяемых HRTF. Введение фазового множителя дает преимущество в компенсации задержки двух фильтров до их совмещения или комбинирования. Это приводит к комбинированному отклику, который моделирует время основной задержки в соответствии с промежуточной позицией между передним и задним динамиками.
Второе преимущество заключается в том, что коэффициент усиления, который необходимо применять в процессе комбинирования фильтров для обеспечения сбережения энергии, становится гораздо стабильнее в отношении его поведения с частотой относительно случая без введения фазового множителя. Это особенно значимо для изобретательской концепции, так как согласно одному из вариантов осуществления данного изобретения представление понижающего микширования мультиканального сигнала обрабатывается внутри области блока фильтров для получения сигнала понижающего микширования для наушников. В связи с этим полосы разных частот представления сигнала понижающего микширования должны обрабатываться отдельно, и, следовательно, гладкое поведение отдельно применяемых функций усиления является необходимым.
Еще в одном варианте осуществления данного изобретения относящиеся к голове функции передачи преобразуются в фильтры под-диапазонов для областей под-диапазонов так, чтобы полное число модифицированных HRTF, использованных в области под-диапазонов, было меньше, чем полное число исходных HRTF. Это дает очевидное преимущество в виде еще большего снижения вычислительной сложности получения подвергшихся понижающему микшированию сигналов для наушников в сравнении с процессом понижающего микширования, использующим стандартные фильтры HRTF.
Реализация изобретательской концепции предусматривает использование и чрезвычайно длинных HRTF и таким образом предусматривает восстановление сигналов понижающего микширования для наушников на основе представления параметрического понижающего микширования мультиканального сигнала с безупречным качеством восприятия.
Кроме того, использование изобретательской концепции в отношении фильтров подавления перекрестных помех предусматривает генерацию понижающего микширования объемного стереосигнала, подлежащего использованию со стандартными системами с двумя динамиками, на основе представления параметрического понижающего микширования мультиканального сигнала с безупречным качеством восприятия.
Еще одно значимое преимущество изобретательской концепции декодирования состоит в том, что отдельно взятый изобретенный бинауральный декодер, реализующий изобретательскую концепцию, может быть использован для получения бинаурального понижающего микширования, а также для мультиканального восстановления переданного сигнала понижающего микширования с учетом дополнительно переданных пространственных параметров.
В одном варианте осуществления данного изобретения предложенный бинауральный декодер содержит блок фильтров анализа для получения представления понижающего микширования мультиканального сигнала в области под-диапазонов и предложенный декодер, реализующий вычисление модифицированных HRTF. Декодер, кроме того, содержит блок фильтров синтеза, чтобы получить окончательное представление во временной области сигнала понижающего микширования для наушников, готовое для проигрывания любым стандартным оборудованием проигрывания аудио.
В последующих абзацах схемы параметрического мультиканального декодирования и схемы бинаурального декодирования предшествующего уровня техники будут описаны более подробно со ссылками на сопроводительные чертежи с целью более четко обрисовать значимые преимущества изобретательской концепции.
В большинстве, описанные ниже варианты осуществления данного изобретения касаются изобретательской концепции с применением HRTF. Как замечено ранее, обработка с помощью HRTF аналогична применению фильтров подавления перекрестных помех. Поэтому все варианты осуществления могут быть истолкованы с точки зрения применения как HRTF, так и фильтров подавления перекрестных помех. Иными словами, все описанные ниже фильтры HRTF могут быть заменены фильтрами подавления перекрестных помех для применения изобретательской концепции к обработке фильтрами подавления перекрестных помех.
Краткое описание чертежей
Предпочтительные варианты осуществления данного изобретения описаны ниже со ссылками на прилагаемые чертежи, где:
на Фиг.1а изображено стандартное бинауральное синтезирование с применением HRTF;
на Фиг.1b изображено стандартное применение фильтров подавления перекрестных помех;
на Фиг.2 изображен пример мультиканального объемного кодера;
на Фиг.3 изображен пример объемного/бинаурального декодеров согласно уровню техники;
на Фиг.4 изображен пример параметрического мультиканального кодера;
на Фиг.5 изображен пример параметрического мультиканального декодера;
на Фиг.6 изображен пример предложенного декодера;
на Фиг.7 изображена блок-схема, иллюстрирующая концепцию преобразования фильтров в область под-диапазонов;
на Фиг.8 изображен пример декодера согласно изобретению;
на Фиг.9 изображен другой пример декодера согласно изобретению;
на Фиг.10 изображен пример приемника или проигрывателя аудио согласно изобретению.
Подробное описание предпочтительных вариантов осуществления
Нижеописанные варианты осуществления являются лишь иллюстрацией принципов данного изобретения для Бинаурального Декодирования Мультиканальных Сигналов Путем Фильтрования Видоизмененными HRTF. Понятно, что описанные здесь модификации и варианты устройства и деталей будут очевидными для специалистов в данной области техники. Таким образом, настоящее изобретение ограничено только объемом прилагаемой формулы изобретения, а не специфичными деталями, представленными в настоящем описании при раскрытии и разъяснении вариантов осуществления.
Для лучшего пояснения возможностей и преимуществ данного изобретения ниже дано более детальное описание уровня техники.
Стандартный бинауральный алгоритм синтеза изображен на Фиг.1а. Набор входных каналов (левый-передний (LF), правый-передний (RF), левый-окружающий (LS), правый-окружающий (RS) и центральный (C)): 10a, 10b, 10c, 10d и 10e - фильтруются набором HRTF с 12a по 12j. Каждый входной сигнал разделяется на два сигнала (на левый “L” и правый “R” компоненты), после чего каждый из компонентов сигналов фильтруется HRTF, соответствующей желаемой позиции звука. Наконец, все сигналы для левого уха суммируются сумматором 14a, генерируя левый бинауральный выходной сигнал L, а сигналы для правого уха суммируются сумматором 14b, генерируя правый бинауральный выходной сигнал R. Можно заметить, что свертка HRTF в большинстве случаев может выполняться во временной области, но выполнять фильтрование зачастую предпочтительнее в частотной области ввиду возрастания вычислений эффективности вычислений. Это значит, что и суммирование, показанное на Фиг.1а, будет выполняться в частотной области, и последующее преобразование во временную область становится необходимым.
На Фиг.1b показана обработка по подавлению перекрестных помех для достижения ощущения объемного звучания при помощи всего двух динамиков стандартного оборудования стереопроигрывания.
Цель заключается в том, чтобы мультиканальный сигнал воспроизводился системой стереопроигрывания, имеющей всего два динамика 16a и 16b, так, чтобы слушатель 18 испытывал эффект объемного звучания. Главное отличие от воспроизведения через наушники заключается в том, что сигналы обоих динамиков 16a и 16b достигают обоих ушей слушателя 18 непосредственно. Эти сигналы, обозначенные пунктирными линиями (перекрестные помехи), поэтому также должны приниматься в расчет.
Для упрощения объяснения на Фиг.1b проиллюстрирован только трехканальный входной сигнал, имеющий три источника 20a-20c. Не требует пояснений, что сценарий можно в принципе распространить на произвольное число каналов.
Для получения проигрываемого стереосигнала каждый входной источник обрабатывается двумя из фильтров подавления перекрестных помех 21a-21f, по одному фильтру на каждый канал проигрываемого сигнала. Наконец, все фильтрованные сигналы для левого канала 16a проигрывания и правого канала 16b проигрывания суммируются для проигрывания. Очевидно, что в общем случае фильтры подавления перекрестных помех будут разными для каждого из источников 20a и 20b (в зависимости от желаемых позиций восприятия) и более того могут даже зависеть от слушателя.
Вследствие высокой гибкости изобретательской концепции появляется выгода от высокой гибкости в устройстве и применении фильтров подавления перекрестных помех в том, что фильтры могут быть оптимизированы индивидуально для каждого применения и проигрывающего устройства. Еще одно преимущество в том, что способ имеет чрезвычайно высокую вычислительную эффективность, поскольку требуются только два блока фильтров синтеза.
Схема принципа работы объемного аудио- кодера изображена на Фиг.2. В столь фундаментальном сценарии кодирования пространственный декодер 40 аудио содержит пространственный кодер 42, кодер 44 понижающего микширования и мультиплексор 46.
Мультиканальный входной сигнал 50 анализируется пространственным кодером 42, извлекающим пространственные параметры, описывающие пространственные свойства входного мультиканального сигнала, который должен быть передан на сторону декодера. Подвергшийся понижающему микшированию сигнал, генерируемый пространственным кодером 42, может быть, например, монофоническим или стереофоническим сигналом, в зависимости от разных сценариев кодирования. Затем кодер 44 понижающего микширования может кодировать монофонический или стереофонический сигнал понижающего микширования, используя любую обычную схему моно- или стереокодирования. Мультиплексор 46 создает выходной битовый поток посредством объединения пространственных параметров и закодированного сигнала понижающего микширования.
На Фиг.3 изображено возможное непосредственное устройство мультиканального декодера, соответствующего кодеру на Фиг.2 и способу бинаурального синтеза, пример которого показан на Фиг.1а. Как можно увидеть, подход комбинирования возможностей из предыдущего уровня техники является простым и прозрачным. Структура содержит демультиплексор 60, декодер 62 понижающего микширования, пространственный декодер 64 и блок синтеза 66 стереосигнала. Входной битовый поток 68 демультиплексируется, давая пространственные параметры 70 и битовый поток сигнала понижающего микширования. Указанный битовый поток сигнала понижающего микширования декодируется декодером 62 понижающего микширования, содержащим обычный моно- или стереодекодер. Декодированный сигнал понижающего микширования вместе с пространственными параметрами 70 являются входными данными для пространственного декодера 64, который генерирует мультиканальный выходной сигнал 72, имеющий пространственные свойства, обозначенные пространственными параметрами 70. При полностью восстановленном мультиканальном сигнале 72 подход, заключающийся в простом добавлении бинаурального блока 66 синтеза для реализации концепции бинаурального синтеза согласно Фиг.1а, сам собой разумеется. Поэтому выходной мультиканальный сигнал 72 используется как входной для бинаурального блока 66 синтеза, который обрабатывает выходной мультиканальный сигнал для получения выходного бинаурального сигнала 74. Подход, изображенный на Фиг.3, имеет, по меньшей мере, три недостатка:
- представление полного мультиканального сигнала должно быть вычислено как промежуточный шаг, за которым следуют свертка HRTF и процесс понижающего микширования в бинауральном синтезировании. Несмотря на то что свертка HRTF должна быть выполнена на поканальной основе, ввиду того факта, что каждый из аудиоканалов имеет отличную пространственную позицию, с точки зрения сложности это является нежелательной ситуацией. Таким образом, вычислительная сложность высока, и происходят лишние затраты энергии.
- Пространственный декодер действует в области блока фильтров (QMF). Свертка HRTF, с другой стороны, типично применяется в FFT-области. Следовательно, каскад блока QMF-фильтров мультиканального синтеза, мультиканального DFT-преобразования и обратного DFT-преобразования стереосигнала является необходимым, что приводит к системе с высокими вычислительными требованиями.
- Будут слышны и, вероятно, усилены в выходных (стерео) бинауральных данных артефакты кодирования, созданные пространственным декодером для создания мультиканального восстановления.
Более подробное описание мультиканального декодирования дается на Фиг.4 и 5.
Пространственный кодер 100, показанный на Фиг.4, содержит первый OTT-блок (1-в-2 кодер) 102a, второй OTT-блок 102b и TTT-блок (3-в-2 кодер) 104. Входной мультиканальный сигнал 106, состоящий из каналов LF, LS, C, RF, RS (левого-переднего, левого-бокового, центрального, правого-переднего и правого-бокового), обрабатывается пространственным кодером 100. Каждый из OTT-блоков принимает два входных канала аудио и выдает один монофонический выходной канал аудио и соответствующие пространственные параметры, эти параметры имеют информацию о пространственных свойствах исходных каналов относительно друг друга или относительно выходного канала (например, параметры CLD, ICC). В кодере 100 каналы LF и LS обрабатываются OTT-кодером 102a, а каналы RF и RS обрабатываются OTT-кодером 102b. Генерируются два сигнала L и R, один из которых имеет информацию только о левой стороне, а другой имеет информацию только о правой стороне. Затем сигналы L, R и C обрабатываются TTT-кодером 104, генерирующим стереосигнал понижающего микширования и дополнительные параметры.
Параметры, выдаваемые из TTT-кодера, обычно состоят из пары коэффициентов предсказания для каждого диапазона параметров или же из пары разностей уровней для описания отношения энергии трех входных сигналов. Параметры 'OTT'-кодеров состоят из разностей уровней и значений когерентности или кросс-корреляции между входными сигналами для каждой полосы частот.
Можно заметить, что, хотя схематическое изображение пространственного кодера 100 указывает на последовательную обработку отдельных каналов сигнала понижающего микширования во время кодирования, полный процесс понижающего микширования кодера 100 также возможно реализовать в одной единственной матричной операции.
На Фиг.5 изображен соответствующий пространственный декодер, принимающий в качестве входных данных сигналы понижающего микширования, предоставляемые кодером согласно Фиг.4, и соответствующие пространственные параметры.
Пространственный декодер 120 содержит 2-в-3 декодер 122 и 1-в-2 декодеры 124a-124c. Сигналы понижающего микширования L0 и R0 являются входными для 2-в-3 декодера 122, который восстанавливает центральный канал C, правый канал R и левый канал L. Эти три канала далее обрабатываются OTT-декодерами - 124a-124c, выдающими шесть выходных каналов. Можно заметить, что получение низкочастотного расширенного канала LFE не является обязательным и может быть опущено, так что в пространственном декодере 120, показанном на Фиг.5, можно оставить единственный OTT-кодер.
Согласно одному из вариантов осуществления данного изобретения изобретательская концепция применяется в декодере, как показано на Фиг.6. Декодер 200 согласно изобретению содержит 2-в-3 декодер 104 и шесть HRTF-фильтров 106a-106f. Входной стереосигнал (L0, R0) обрабатывается TTT-декодером 104, выдающим три сигнала L, C и R. Можно заметить, что входной стереосигнал считается получаемым в области под-диапазонов, так как TTT-кодер может быть тем же кодером, что показан на Фиг.5, и потому приспособленным для работы на сигналах под-диапазонов. Сигналы L, R и C подвергаются обработке HRTF-параметра HRTF-фильтрами 106a-106f.
Итоговые 6 каналов суммируются для генерации выходной бинауральной стереопары (Lb, Rb).
TTT-декодер 106 может быть описан как следующая матричная операция:
где элементы матрицы mxy зависят от пространственных параметров. Взаимосвязь пространственных параметров и элементов матрицы идентична их взаимосвязи в случае 5.1-мультиканального пространственного MPEG-декодера. Каждый из трех итоговых сигналов L, R и C разделяется на два и обрабатывается с HRTF-параметрами, соответствующими желаемой (воспринимаемой) позиции звуковых источников. Для центрального канала (C) пространственные параметры позиции звукового источника могут быть применены непосредственно, имея итогом два выходных сигнала для центра LB(C) и RB(C):
Для левого канала (L) HRTF-параметры из левого-переднего и левого-окружающего (бокового) каналов объединяются в единственный набор HRTF-параметров, используя веса wlf и wrf.
Итоговые 'смешанные' HRTF-параметры эмулируют эффект как передних, так и боковых каналов в статистическом смысле. Следующие уравнения используются для генерации бинауральных выходных пар (LB, RB) для левого канала:
Аналогичным образом бинауральные выходные пары для правого канала получают согласно
При описанных выше определениях LB(C), RB(C), LB(L), RB(L), LB(R) и RB(R) полные сигналы LB и RB могут быть получены из единственной матрицы 2 на 2 на основе входного стереосигнала:
где
Выше предполагалось, что элементы HY(X) для Y=L0,R0 и X=L,R,C являются комплексными скалярами. Однако данное изобретение предлагает способ, как распространить подход бинаурального декодера с матрицей 2 на 2 для работы с HRTF-фильтрами произвольной длины. Чтобы добиться этого, данное изобретение содержит следующие этапы:
- преобразование откликов HRTF-фильтров в область блока фильтров;
- общее извлечение разности задержек или разности фаз из пар HRTF-фильтров;
- видоизменение откликов пар HRTF-фильтров как функции от CLD-параметра;
- регулировка усиления
Это достигается путем замещения шести комплексных коэффициентов усиления HY(X) для Y=L0,R0 и X=L,R,C шестью фильтрами. Эти фильтры получаются из десяти фильтров HY(X) для Y=L0,R0 и X=Lf,Ls,Rf,Rs,C, которые описывают заданные отклики HRTF-фильтров в QMF-области. Эти QMF-представления могут быть достигнуты в соответствии со способом, описанным в одном из последующих абзацев.
Иными словами, настоящее изобретение предлагает концепцию для получения модифицированных HRTF путем модифицирования (видоизменения) входных фильтров передних и боковых каналов, используя комплексные линейные комбинации в соответствии с
Как можно увидеть из вышеприведенной формулы, получение модифицированных HRTF осуществляется через взвешенную суперпозицию исходных HRTF с дополнительным применением фазовых множителей. Веса ws, wf зависят от CLD-параметров, предназначенных для использования OTT-декодерами 124a и 124b с Фиг.5.
Веса wlf и wls зависят от CLD-параметра 'OTT'-блока для Lf и Ls:
Веса wrf и wrs зависят от CLD-параметра 'OTT'-блока для Rf и Rs:
Фазовый параметр φXY может быть получен из разности времени главной задержки τXY между передним и задним HRTF-фильтрами и индекса n под-диапазона QMF-блока:
Роль этого фазового параметра в видоизменении фильтров является двоякой. Во-первых, он реализует компенсацию задержки двух фильтров перед суперпозицией, что приводит к комбинированному отклику, который формирует время основной задержки в соответствии с позицией источника между передним и задним динамиками. Во-вторых, он делает необходимый множитель g компенсации усиления гораздо более стабильным и медленнее изменяющимся в зависимости от частоты, чем в случае простой суперпозиции с φXY=0.
Множитель g усиления определяется посредством правила мощностей некогерентного сложения:
где
и pXY является вещественным значением нормализованной комплексной кросс-корреляции между фильтрами
В представленных выше уравнениях через P обозначен параметр, описывающий средний уровень на полосу частот для импульсного отклика фильтра, определенного индексами. Конечно, при известных функциях характеристики эту среднюю интенсивность получить просто.
В случае простой суперпозиции с φXY=0 значение pXY изменяется неустойчиво и колебательно как функция от частоты, что приводит к необходимости в расширенной регулировке усиления. В реализации на практике необходимо ограничивать значение коэффициента g усиления и невозможно избежать оставшегося спектрального расцвечивания сигнала.
Напротив, использование видоизменения с фазовой компенсацией на основе задержки, как предлагает данное изобретение, приводит к гладкому поведению PXY как функции от частоты. Зачастую это значение даже близко к значению в случае натуральных пар фильтров, полученных из HRTF, так как они отличаются в основном задержкой и амплитудой, и назначение фазового параметра заключается в том, чтобы принять в расчет разность задержек в области блока QMF-фильтров.
Альтернативный выгодный выбор фазового параметра φXY, предлагаемый данным изобретением, задается фазовым углом нормализованной комплексной взаимной корреляции между фильтрами
HY(Xf) и HY(Xs)
и развертыванием фазовых значений стандартными способами развертывания как функции от индекса n под-диапазона QMF-блока. Такой выбор имеет следствием то, что PXY никогда не становится отрицательным и, следовательно, коэффициент усиления компенсации g удовлетворяет неравенству 1/√2≤g≤l для всех под-диапазонов. Более того, такой выбор фазового параметра дает возможность видоизменения фильтров передних и боковых (окружающих) каналов в ситуациях, где недоступна разность времени основной задержки τXY.
Для описанного выше варианта осуществления данного изобретения предлагается точное преобразование HRTF в эффективное представление HRTF-фильтров внутри QMF-области.
На Фиг.7 дана схема принципа концепции для точного преобразования фильтров временной области в фильтры внутри области под-диапазонов, имеющие тот же совокупный эффект на восстановленный сигнал. На Фиг.7 изображен блок 300 комплексного анализа, блок 302 синтеза, соответствующий блоку 300 анализа, преобразователь 304 фильтров и фильтр 306 под-диапазона.
Подается входной сигнал 310, для которого известен фильтр 312, имеющий требуемые свойства. Цель реализации преобразователя 304 фильтра заключается в том, чтобы выходной сигнал 314 имел те же характеристики после анализа блоком 300 фильтров анализа, последующего фильтрования 306 под-диапазонов и синтеза 302, какие бы он имел после фильтрования фильтром 312 во временной области. Задача предоставления числа фильтров под-диапазонов, соответствующего числу использованных под-диапазонов, решается преобразователем 304 фильтров.
Последующее описание раскрывает способ реализации заданного FIR-фильтра h(v) в комплексной QMF-области под-диапазонов. Принцип работы показан на Фиг.7.
Фильтрование под-диапазонов здесь является простым применением одного комплекснозначного FIR-фильтра для каждого под-диапазона n=0,1,…,L-1 для преобразования исходных индексов cn в их фильтрованные дубликаты dn по следующей формуле:
Необходимо обратить внимание, что это отличается от хорошо известных способов, разработанных для критически дискретных блоков фильтров, так как эти способы требуют многополосного фильтрования с более длинными откликами. Ключевым компонентом является преобразователь фильтров, который конвертирует любой FIR-фильтр временной области в комплексные фильтры области под-диапазонов. Поскольку область под-диапазонов комплексных QMF имеет избыточную дискретизацию, для заданного фильтра временной области нет канонического набора фильтров под-диапазонов. Разные фильтры под-диапазонов могут оказывать одинаковый совокупный эффект сигнала временной области. Ниже описано чрезвычайно привлекательное приближенное решение, которое получается путем ограничения преобразователя фильтров рамками комплексного блока анализа, аналогичного QMF.
Допуская, что прототип преобразователя фильтров имеет длину 64KQ, реальный FIR-фильтр с 64KH отводами преобразуется в набор 64 комплексных фильтров под-диапазонов с KH+KQ-1 отводами. Для KQ=3 FIR-фильтр с 1024 отводами конвертируется в фильтрование под-диапазонов из 18 отводов с приблизительным качеством 50 dB.
Отводы фильтра под-диапазонов вычисляются по формуле
где q(v) является FIR-фильтром-прототипом, полученным из QMF-фильтра-прототипа. Как можно увидеть, это всего лишь комплексный анализ блоком фильтров заданного фильтра h(v).
Ниже описана изобретательская концепция для другого варианта осуществления данного изобретения, где доступно мультиканальное параметрическое представление для мультиканального сигнала с пятью каналами. Необходимо отметить, что в этом частном варианте осуществления данного изобретения исходные 10 HRTF-фильтров VY,X (как, например, заданные QMF-представлением фильтров 12a-12j на Фиг.1а) видоизменены в шесть фильтров hY,X для Y=L,R и X=L,R,C.
Десять фильтров VY,X для Y=L,R и X=FL,BL,FR,BR,C описывают отклики заданных HRTF-фильтров в гибридной QMF-области.
Комбинирование фильтров передних и боковых каналов выполняется комплексной линейной комбинацией согласно
Коэффициенты усиления gL,L,gL,R,gR,L,gR,R определяются из
Параметры CFBY,X, ICCFB'Y,X и фазовые параметры φ определяются следующим образом
Среднее отношение уровня переднего/заднего (каналов) для каждого гибридного диапазона для HRTF-фильтров определяется для Y=L,R и X=L,R из
Кроме того, фазовые параметры ФL FL,BL, ФL FR,BR, ФR FL,BL, ФR FR,BR затем определяются для Y=L,R и X=L,R из
где комплексные взаимные корреляции (CICY,X) определяются из
Развертывание фазы применяется к фазовым параметрам по индексам k под-диапазона так, чтобы абсолютное значение приращения фазы от под-диапазона k до под-диапазона k+1 было меньше или равно π и для r=0,1,…. В случае двух вариантов выбора (±π) для приращения выбирается знак приращения для измерения фазы из интервала [-π;π]. Наконец, нормализованные взаимные корреляции после фазовой компенсации для Y=L,R и X=L,R определяются из
Необходимо отметить, что в случае, когда мультиканальная обработка выполняется внутри гибридной области под-диапазонов, т.е. в области, где под-диапазоны впоследствии разлагаются на разные частотные диапазоны, отображение HRTF-откликов на фильтры гибридных диапазонов может быть выполнено, например, следующим образом.
Как и в случае без гибридного блока фильтров, все десять заданных импульсных откликов HRTF из источника X=FL,BL,FR,BR,C к целевому Y=L,R преобразуются в фильтры QMF- под-диапазонов в соответствии с вышеописанным способом. Результатом являются десять фильтров vY,X под-диапазонов с компонентами
для QMF-под-диапазонов m=0,1,…,63 и временного интервала QMF l=0,1,…,Lq-1. Обозначим через m=Q(k) отображение индексов из гибридного диапазона k в QMF-диапазон m.
Тогда HRTF-фильтры vY,X в гибридной области под-диапазонов определяются как
Для конкретного варианта осуществления, описанного в предыдущих абзацах, преобразование фильтров HRTF-фильтров в QMF-область может быть реализовано следующим образом, благодаря FIR-фильтру h(v) длины Nk, подлежащего преобразованию в комплексную область QMF-под-диапазонов:
Фильтрование под-диапазонов состоит из раздельных применений одного комплекснозначного FIR-фильтра hm(l) для каждого QMF- под-диапазона m=0,1,…,63. Ключевым компонентом является преобразователь фильтров, который преобразует заданный FIR-фильтр временной области h(v) в фильтры hm(l) комплексной области под-диапазонов. Преобразователь фильтров является комплексным блоком анализа, аналогичным блоку QMF анализа. Его фильтр-прототип q(v) имеет длину 192. Расширение нулями FIR-фильтра временной области определяется из
фильтры области под-диапазонов длины Lq=Kh+2, где Kh=, затем получают для m=0,1,…,63 и l=0,1,…,Kh+1 из
Несмотря на то что изобретательская концепция была детально описана относительно сигнала понижающего микширования с двумя каналами (т.е. переданного стереосигнала), применение изобретательской концепции никоим образом не ограничено сценарием с понижающего микширования стереосигнала.
Суммируя вышесказанное, данное изобретение относится к решению проблемы использования длинных HRTF или фильтров подавления перекрестных помех для бинауральной интерпретации параметрических мультиканальных сигналов. Изобретение предлагает новый способ расширения подхода параметрических HRTF на HRTF-фильтры произвольной длины.
Данное изобретение содержит следующие особенности:
- умножение стереосигнала понижающего микширования на матрицу 2 на 2, где каждый элемент матрицы является FIR-фильтром или фильтром произвольной длины (как задается HRTF-фильтром);
- получение фильтров в матрице 2 на 2 путем видоизменения исходных HRTF-фильтров на основе переданных мультиканальных параметров;
- вычисление видоизменения HRTF-фильтров так, чтобы получились корректные огибающая спектра и полная энергия.
На Фиг.8 изображен пример декодера 300 согласно изобретению для получения сигнала понижающего микширования для наушников. Декодер содержит блок вычисления 302 фильтров и блок 304 синтеза. Блок вычисления фильтров принимает в качестве первых входных данных параметры 306 уровня и в качестве вторых данных HRTF (head-related transfer functions - относящиеся к голове функции передачи) 308 для получения модифицированных HRTF 310, оказывающих на сигнал, будучи примененными к сигналу в области под-диапазонов, тот же совокупный эффект, что и относящиеся к голове функции 308 передачи, примененные во временной области. Модифицированные HRTF 310 служат первой входной информацией для блока 304 синтеза, который принимает в качестве второй входной информации получающего представление сигнала 312 понижающего микширования в области под-диапазонов. Представление сигнала 312 понижающего микширования получается посредством параметрического мультиканального кодера и предназначено для использования в качестве основания для восстановления мультиканальным декодером полного мультиканального сигнала. Таким образом, блок 404 синтеза имеет возможность получить сигнал 314 понижающего микширования для наушников, используя модифицированные HRTF 310 и представление сигнала 312 понижающего микширования.
Можно заметить, что HRTF могут быть предоставлены в любом возможном параметрическом представлении, например в виде связанной с фильтром функции передачи, в виде импульсного отклика фильтра или в виде последовательности коэффициентов отводов для FIR-фильтра.
В предыдущих примерах допускается, что представление сигнала понижающего микширования уже подается как представление блока фильтров, т.е. выборками, полученными с помощью блока фильтров. Тем не менее, в практических применениях сигнал понижающего микширования во временной области обычно подается и передается, чтобы также позволить непосредственное проигрывание поданного сигнала в простом оборудовании воспроизведения. Поэтому на Фиг.9 в другом варианте осуществления настоящего изобретения, где бинауральный совместимый декодер 400 содержит блок 402 фильтров анализа, блок 404 фильтров синтеза и декодер согласно изобретению, который может представлять собой, например, декодер 300 на Фиг.8. Функции декодера и их описание применимы на Фиг.9, а также на Фиг.8, потому в последующих абзацах описание декодера 300 будет опущено.
Блок 402 фильтров анализа принимает мультиканальный сигнал 406 понижающего микширования, созданный мультиканальным параметрическим кодером. Блок 402 фильтров анализа получает представление блока фильтров принятого сигнала 406 понижающего микширования, которое затем подается на вход декодера 300, который выдает сигнал 408 понижающего микширования для наушников также в области блока фильтров. То есть, понижающее микширование представляется множеством выборок или коэффициентов внутри частотных диапазонов, введенных блоком 402 фильтров анализа. Поэтому для обеспечения окончательного сигнала 410 понижающего микширования для наушников во временной области сигнал 408 понижающего микширования наушников подается на вход блока 404 фильтров синтеза, выдающего сигнал 410 понижающего микширования для наушников, готовый для проигрывания оборудованием стереовоспроизведения.
На Фиг.10 изображен ресивер или аудиоплеер 500 согласно изобретению, имеющий аудиодекодер 501 согласно изобретению, входной битовый поток 502 и выходные аудиоданные 504.
Битовый поток может быть подан на вход 502 ресивера/аудиоплеера 500 согласно изобретению. Затем битовый поток декодируется декодером 501 и декодированный сигнал выдается или проигрывается на выходе 504 ресивера/аудиоплеера 500 согласно изобретению.
Несмотря на то что примеры реализации изобретательской концепции из предшествующих абзацев рассчитаны на передачу стереосигнала понижающего микширования, изобретательская концепция также может быть применена в конфигурациях на основе одиночного монофонического канала понижающего микширования или более чем двух каналов понижающего микширования.
Одна конкретная реализация передачи относящихся к голове функций передачи в область под-диапазонов дается в описании настоящего изобретения. Тем не менее, другие техники получения фильтров под-диапазонов также могут использоваться без выхода за пределы изобретательской концепции.
Фазовые множители, введенные в получении модифицированных HRTF, могут быть получены также путем других вычислений, относительно представленных ранее. Поэтому получение этих множителей разными способами не выходит за пределы объема изобретения.
Хотя изобретательская концепция подробно показана для HRTF и фильтров подавления перекрестных помех, она может быть применена и для других фильтров, определенных для одного или нескольких отдельных каналов мультиканального сигнала в целях обеспечения вычислительно эффективной генерации высококачественного сигнала для стереопроигрывания. К тому же эти фильтры не ограничиваются фильтрами, предназначенными для моделирования окружения прослушивания. Могут быть использованы и фильтры, добавляющие к сигналу “искусственные” компоненты, такие как, например, фильтры для реверберации или других искажений.
В зависимости от конкретной реализации требований к способу согласно изобретению способы согласно изобретению могут быть реализованы в аппаратном или в программном обеспечении. Реализация может быть выполнена с использованием цифровых запоминающих носителей, в частности диска, DVD или CD, хранящих электронным образом считываемые сигналы управления, взаимодействующие с программируемой компьютерной системой с целью выполнения способов согласно изобретению. Поэтому в общем смысле данное изобретение является программным продуктом с хранящимся на машиночитаемом носителе программным кодом, который является существенным для выполнения способов согласно изобретению во время запуска программного продукта на компьютере. Поэтому иными словами способы согласно изобретению заключаются в компьютерной программе с программным кодом, выполняющим по крайней мере один из способов согласно изобретению во время запуска компьютерной программы на компьютере.
В то время как изобретение было подробно показано и описано в отношении отдельных вариантов его осуществления, специалистам в данной области техники очевидно, что без выхода за пределы сущности и объема изобретения могут быть произведены и прочие изменения в форме и деталях. Понятно, что для адаптации к разным вариантам осуществления могут быть произведены различные изменения без выхода за пределы концепции, раскрытой в настоящем описании и содержащейся в нижеприведенной формуле изобретения.
Claims (26)
1. Декодер для получения сигнала (314) понижающего микширования для наушников, используя представление понижающего микширования мультиканального сигнала (312) и используя параметр уровня (306), имеющий информацию о соотношении уровней между двумя каналами мультиканального сигнала, и используя относящиеся к голове функции (308) передачи, относящиеся к двум каналам мультиканального сигнала, содержащий:
блок вычисления (302) фильтров для получения модифицированной относящейся к голове функции (310) передачи путем взвешивания и применения фазовых множителей к относящимся к голове функциям (308) передачи двух каналов, используя параметр уровня (306) так, чтобы на упомянутую модифицированную относящуюся к голове функцию (310) передачи сильнее влияла относящаяся к голове функция (308) передачи канала, имеющего более высокий уровень, чем относящаяся к голове функция (308) передачи канала, имеющей более низкий уровень, и так, чтобы компенсация фазы относящихся к голове функций (308) передачи двух каналов достигалась до объединения взвешенных и скомпенсированных по фазе относящихся к голове функций передачи упомянутых двух каналов,
блок синтеза (304) для получения сигнала (314) понижающего микширования для наушников, используя упомянутую модифицированную относящуюся к голове функцию (310) передачи и представление сигнала (312) понижающего микширования.
блок вычисления (302) фильтров для получения модифицированной относящейся к голове функции (310) передачи путем взвешивания и применения фазовых множителей к относящимся к голове функциям (308) передачи двух каналов, используя параметр уровня (306) так, чтобы на упомянутую модифицированную относящуюся к голове функцию (310) передачи сильнее влияла относящаяся к голове функция (308) передачи канала, имеющего более высокий уровень, чем относящаяся к голове функция (308) передачи канала, имеющей более низкий уровень, и так, чтобы компенсация фазы относящихся к голове функций (308) передачи двух каналов достигалась до объединения взвешенных и скомпенсированных по фазе относящихся к голове функций передачи упомянутых двух каналов,
блок синтеза (304) для получения сигнала (314) понижающего микширования для наушников, используя упомянутую модифицированную относящуюся к голове функцию (310) передачи и представление сигнала (312) понижающего микширования.
2. Декодер по п.1, в котором блок вычисления (302) фильтров выполнен с возможностью получения модифицированных относящихся к голове функций (310) передачи посредством применения фазовых множителей к относящимся к голове функциям (308) передачи двух каналов так, чтобы относящаяся к голове функция (308) передачи канала, имеющего более низкий уровень, сдвигалась ближе к средней фазе относящихся к голове функций (308) передачи двух каналов, чем канала, имеющего более высокий уровень.
3. Декодер по п.1, в котором блок (302) вычисления фильтров выполнен так, чтобы число получаемых модифицированных относящихся к голове функций (310) передачи было меньше, чем число ассоциированных относящихся к голове функций (308) передачи двух каналов.
4. Декодер по п.1, в котором блок (302) вычисления фильтров выполнен с возможностью получения модифицированных относящихся к голове функций (310) передачи, приспособленных для применения к представлению блока фильтров сигнала понижающего микширования.
5. Декодер по п.1, приспособленный для использования представления сигнала понижающего микширования, получаемого в области блока фильтров.
6. Декодер по п.1, в котором блок (302) вычисления фильтров выполнен с возможностью получения модифицированных относящихся к голове функций (310) передачи, используя относящиеся к голове функции (308) передачи, охарактеризованные более чем тремя параметрами.
7. Декодер по п.1, в котором блок (302) вычисления фильтров выполнен с возможностью получения весовых множителей для относящихся к голове функций (308) передачи двух каналов, используя один и тот же параметр (306) уровня.
9. Декодер по п.1, в котором блок (302) вычисления фильтров выполнен с возможностью получения модифицированных относящихся к голове функций (310) передачи, применяя общий коэффициент усиления к относящимся к голове функциям (308) передачи двух каналов так, чтобы сэкономить энергию при получении модифицированных относящихся к голове функций (310) передачи.
11. Декодер по п.2, в котором блок (302) вычисления фильтров выполнен с возможностью получения фазовых множителей, используя время задержки между импульсными откликами относящихся к голове функций (308) передачи двух каналов.
12. Декодер по п.11, в котором блок (302) вычисления фильтров работает в области блока фильтров, имеющей L частотных диапазонов, и для получения индивидуальных сдвигов средней фазы для каждого частотного диапазона, используя это время задержки.
14. Декодер по п.2, в котором блок (302) вычисления фильтров выполнен с возможностью получения фазового множителя, используя фазовый угол нормализованной комплексной взаимной корреляции между импульсными откликами относящихся к голове функций (308) передачи первого и второго каналов.
15. Декодер по п.1, в котором первый канал из двух каналов является передним каналом левой или правой стороны мультиканального сигнала, а второй канал из двух каналов является задним каналом той же стороны.
16. Декодер по п.15, в котором блок вычисления фильтров выполнен с возможностью получения модифицированной относящейся к голове функции HY(Х) (310) передачи, используя относящуюся к голове функцию HY (Xf) передачи переднего канала и относящуюся к голове функцию HY(Xs) передачи заднего канала, используя следующую комплексную линейную комбинацию:
HY(X)=gwfexp(-jφXYws 2)HY (Xf)+gwsexp(jφXYwf 2)HY(Xs),
где φXY представляет собой фазовый параметр; ws и wf представляют собой весовые множители, полученные с использованием параметра (306) уровня, a g представляет собой общий коэффициент усиления, полученный с помощью параметра (306) уровня.
HY(X)=gwfexp(-jφXYws 2)HY (Xf)+gwsexp(jφXYwf 2)HY(Xs),
где φXY представляет собой фазовый параметр; ws и wf представляют собой весовые множители, полученные с использованием параметра (306) уровня, a g представляет собой общий коэффициент усиления, полученный с помощью параметра (306) уровня.
17. Декодер по п.1, приспособленный для использования представления сигнала (312) понижающего микширования, имеющего левый и правый каналы, полученные из мультиканального сигнала, имеющего левый-передний, левый боковой, правый передний, правый боковой и центральный каналы.
18. Декодер по п.1, в котором блок синтеза выполнен с возможностью получения каналов сигнала (314) понижающего микширования для наушников, применяя линейную комбинацию модифицированных относящихся к голове функций (310) передачи к представлению понижающего микширования мультиканального сигнала (312).
19. Декодер по п.18, в котором блок синтеза выполнен с возможностью использования коэффициентов для линейной комбинации относящихся к голове функций передачи, которые зависят от параметра (306) уровня.
20. Декодер по п.18, в котором блок (304) синтеза выполнен с возможностью использования коэффициентов для линейной комбинации в зависимости от дополнительных мультиканальных параметров, относящихся к дополнительным пространственным свойствам мультиканального сигнала.
21. Бинауральный декодер, содержащий:
декодер по п.1;
блок (300) фильтров анализа для получения представления понижающего микширования мультиканального сигнала (312) путем фильтрования по поддиапазонам понижающего микширования мультиканального сигнала; и
блок (302) фильтров синтеза для получения сигнала временной области для наушников путем синтеза сигнала (314) понижающего микширования для наушников.
декодер по п.1;
блок (300) фильтров анализа для получения представления понижающего микширования мультиканального сигнала (312) путем фильтрования по поддиапазонам понижающего микширования мультиканального сигнала; и
блок (302) фильтров синтеза для получения сигнала временной области для наушников путем синтеза сигнала (314) понижающего микширования для наушников.
22. Декодер для получения пространственного стереосигнала понижающего микширования, используя представление понижающего микширования мультиканального сигнала (312), и используя параметр уровня (306), имеющий информацию о соотношении уровней между двумя каналами мультиканального сигнала, и используя фильтры подавления перекрестных помех, относящиеся к упомянутым двум каналам мультиканального сигнала, содержащий:
блок (302) вычисления фильтров для получения модифицированного фильтра подавления перекрестных помех путем взвешивания и применения фазовых множителей к фильтрам подавления перекрестных помех двух каналов, используя параметр (306) уровня так, чтобы на этот модифицированный фильтр подавления перекрестных помех сильнее влиял фильтр подавления перекрестных помех канала, имеющий более высокий уровень, чем фильтр подавления перекрестных помех канала, имеющий более низкий уровень, и так, что фазовая компенсация фильтров (308) подавления перекрестных помех двух каналов достигается до объединения взвешенных и скомпенсированных по фазе фильтров подавления перекрестных помех этих двух каналов,
блок (304) синтеза для получения пространственного стереосигнала понижающего микширования, используя упомянутый модифицированный фильтр подавления перекрестных помех и представление сигнала (312) понижающего микширования.
блок (302) вычисления фильтров для получения модифицированного фильтра подавления перекрестных помех путем взвешивания и применения фазовых множителей к фильтрам подавления перекрестных помех двух каналов, используя параметр (306) уровня так, чтобы на этот модифицированный фильтр подавления перекрестных помех сильнее влиял фильтр подавления перекрестных помех канала, имеющий более высокий уровень, чем фильтр подавления перекрестных помех канала, имеющий более низкий уровень, и так, что фазовая компенсация фильтров (308) подавления перекрестных помех двух каналов достигается до объединения взвешенных и скомпенсированных по фазе фильтров подавления перекрестных помех этих двух каналов,
блок (304) синтеза для получения пространственного стереосигнала понижающего микширования, используя упомянутый модифицированный фильтр подавления перекрестных помех и представление сигнала (312) понижающего микширования.
23. Способ получения сигнала (314) понижающего микширования для наушников, используя представление понижающего микширования мультиканального сигнала (312), и используя параметр уровня (306), имеющий информацию о соотношении уровней между двумя каналами мультиканального сигнала, и используя относящиеся к голове функции (308) передачи, относящиеся к двум каналам мультиканального сигнала, причем способ содержит этапы, на которых:
получают, используя параметр уровня (306), модифицированную относящуюся к голове функцию (310) передачи путем взвешивания и применения фазовых множителей к относящимся к голове функциям (308) передачи двух каналов так, что на упомянутую модифицированную относящуюся к голове функцию передачи сильнее влияет относящаяся к голове функция передачи канала с более высоким уровнем, чем относящаяся к голове функция передачи канала с более низким уровнем, и так, что фазовая компенсация относящихся к голове функций (308) передачи этих двух каналов достигается до объединения взвешенных и скомпенсированных по фазе относящихся к голове функций передачи этих двух каналов, и
получают сигнал (314) понижающего микширования для наушников, используя эту модифицированную относящуюся к голове функцию (310) передачи и представление сигнала понижающего микширования.
получают, используя параметр уровня (306), модифицированную относящуюся к голове функцию (310) передачи путем взвешивания и применения фазовых множителей к относящимся к голове функциям (308) передачи двух каналов так, что на упомянутую модифицированную относящуюся к голове функцию передачи сильнее влияет относящаяся к голове функция передачи канала с более высоким уровнем, чем относящаяся к голове функция передачи канала с более низким уровнем, и так, что фазовая компенсация относящихся к голове функций (308) передачи этих двух каналов достигается до объединения взвешенных и скомпенсированных по фазе относящихся к голове функций передачи этих двух каналов, и
получают сигнал (314) понижающего микширования для наушников, используя эту модифицированную относящуюся к голове функцию (310) передачи и представление сигнала понижающего микширования.
24. Приемник или аудиопроигрыватель, имеющий декодер для получения сигнала (314) понижающего микширования для наушников по пп.1-20.
25. Способ приема или аудиопроигрывания, в который входит способ получения сигнала (314) понижающего микширования для наушников по п.23.
26. Считываемый компьютером носитель, имеющий сохраненную на ней компьютерную программу, имеющую программный код, для выполнения при запуске на компьютере способа по п.23.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0600674-6 | 2006-03-24 | ||
SE0600674 | 2006-03-24 | ||
US74455506P | 2006-04-10 | 2006-04-10 | |
US60/744,555 | 2006-04-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2008142141A RU2008142141A (ru) | 2010-04-27 |
RU2407226C2 true RU2407226C2 (ru) | 2010-12-20 |
Family
ID=40538857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2008142141/09A RU2407226C2 (ru) | 2006-03-24 | 2006-09-01 | Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов |
Country Status (11)
Country | Link |
---|---|
US (1) | US8175280B2 (ru) |
EP (1) | EP1999999B1 (ru) |
JP (1) | JP4606507B2 (ru) |
KR (1) | KR101010464B1 (ru) |
CN (1) | CN101406074B (ru) |
AT (1) | ATE532350T1 (ru) |
BR (1) | BRPI0621485B1 (ru) |
ES (1) | ES2376889T3 (ru) |
PL (1) | PL1999999T3 (ru) |
RU (1) | RU2407226C2 (ru) |
WO (1) | WO2007110103A1 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2639955C2 (ru) * | 2012-02-13 | 2017-12-25 | Франк РОССЕ | Способ трансаурального синтеза для придания звуку пространственной формы |
Families Citing this family (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7644282B2 (en) | 1998-05-28 | 2010-01-05 | Verance Corporation | Pre-processed information embedding system |
US6737957B1 (en) | 2000-02-16 | 2004-05-18 | Verance Corporation | Remote control signaling using audio watermarks |
CA2499967A1 (en) | 2002-10-15 | 2004-04-29 | Verance Corporation | Media monitoring, management and information system |
US7369677B2 (en) * | 2005-04-26 | 2008-05-06 | Verance Corporation | System reactions to the detection of embedded watermarks in a digital host content |
US20060239501A1 (en) | 2005-04-26 | 2006-10-26 | Verance Corporation | Security enhancements of digital watermarks for multi-media content |
WO2006126843A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US8020004B2 (en) | 2005-07-01 | 2011-09-13 | Verance Corporation | Forensic marking using a common customization function |
US8781967B2 (en) | 2005-07-07 | 2014-07-15 | Verance Corporation | Watermarking in an encrypted domain |
JP4651668B2 (ja) * | 2005-07-11 | 2011-03-16 | パナソニック株式会社 | 超音波探傷方法と超音波探傷装置 |
WO2007031905A1 (en) * | 2005-09-13 | 2007-03-22 | Koninklijke Philips Electronics N.V. | Method of and device for generating and processing parameters representing hrtfs |
TWI469133B (zh) * | 2006-01-19 | 2015-01-11 | Lg Electronics Inc | 媒體訊號處理方法及裝置 |
KR20080093419A (ko) | 2006-02-07 | 2008-10-21 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
US8027479B2 (en) * | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
CN102892070B (zh) * | 2006-10-16 | 2016-02-24 | 杜比国际公司 | 多声道下混对象编码的增强编码和参数表示 |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
KR101406531B1 (ko) * | 2007-10-24 | 2014-06-13 | 삼성전자주식회사 | 스테레오 오디오 신호로부터 바이노럴 비트를 발생시키는 장치 및 방법 |
JP2009128559A (ja) * | 2007-11-22 | 2009-06-11 | Casio Comput Co Ltd | 残響効果付加装置 |
US9445213B2 (en) | 2008-06-10 | 2016-09-13 | Qualcomm Incorporated | Systems and methods for providing surround sound using speakers and headphones |
US8259938B2 (en) | 2008-06-24 | 2012-09-04 | Verance Corporation | Efficient and secure forensic marking in compressed |
WO2010012478A2 (en) * | 2008-07-31 | 2010-02-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal generation for binaural signals |
UA101542C2 (ru) * | 2008-12-15 | 2013-04-10 | Долби Лабораторис Лайсензин Корпорейшн | Виртуализатор окружающего звука с динамическим сжатием диапазона и способ |
EP2377123B1 (en) | 2008-12-19 | 2014-10-29 | Dolby International AB | Method and apparatus for applying reverb to a multi-channel audio signal using spatial cue parameters |
JP5679340B2 (ja) * | 2008-12-22 | 2015-03-04 | コーニンクレッカ フィリップス エヌ ヴェ | 送信効果処理による出力信号の生成 |
TWI404050B (zh) * | 2009-06-08 | 2013-08-01 | Mstar Semiconductor Inc | 多聲道音頻信號解碼方法與裝置 |
JP2011066868A (ja) * | 2009-08-18 | 2011-03-31 | Victor Co Of Japan Ltd | オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置 |
CN102157149B (zh) * | 2010-02-12 | 2012-08-08 | 华为技术有限公司 | 立体声信号下混方法、编解码装置和编解码系统 |
TWI557723B (zh) * | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
KR20110116079A (ko) | 2010-04-17 | 2011-10-25 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 장치 및 방법 |
US8838977B2 (en) | 2010-09-16 | 2014-09-16 | Verance Corporation | Watermark extraction and content screening in a networked environment |
TWI573131B (zh) * | 2011-03-16 | 2017-03-01 | Dts股份有限公司 | 用以編碼或解碼音訊聲軌之方法、音訊編碼處理器及音訊解碼處理器 |
US8923548B2 (en) | 2011-11-03 | 2014-12-30 | Verance Corporation | Extraction of embedded watermarks from a host content using a plurality of tentative watermarks |
US8682026B2 (en) | 2011-11-03 | 2014-03-25 | Verance Corporation | Efficient extraction of embedded watermarks in the presence of host content distortions |
US8615104B2 (en) | 2011-11-03 | 2013-12-24 | Verance Corporation | Watermark extraction based on tentative watermarks |
US8533481B2 (en) | 2011-11-03 | 2013-09-10 | Verance Corporation | Extraction of embedded watermarks from a host content based on extrapolation techniques |
US8745403B2 (en) | 2011-11-23 | 2014-06-03 | Verance Corporation | Enhanced content management based on watermark extraction records |
US9323902B2 (en) | 2011-12-13 | 2016-04-26 | Verance Corporation | Conditional access using embedded watermarks |
US9547753B2 (en) | 2011-12-13 | 2017-01-17 | Verance Corporation | Coordinated watermarking |
US10321252B2 (en) | 2012-02-13 | 2019-06-11 | Axd Technologies, Llc | Transaural synthesis method for sound spatialization |
US9602927B2 (en) * | 2012-02-13 | 2017-03-21 | Conexant Systems, Inc. | Speaker and room virtualization using headphones |
US9571606B2 (en) | 2012-08-31 | 2017-02-14 | Verance Corporation | Social media viewing system |
US8869222B2 (en) | 2012-09-13 | 2014-10-21 | Verance Corporation | Second screen content |
US8726304B2 (en) | 2012-09-13 | 2014-05-13 | Verance Corporation | Time varying evaluation of multimedia content |
US20140075469A1 (en) | 2012-09-13 | 2014-03-13 | Verance Corporation | Content distribution including advertisements |
JP6179122B2 (ja) * | 2013-02-20 | 2017-08-16 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
US9191516B2 (en) * | 2013-02-20 | 2015-11-17 | Qualcomm Incorporated | Teleconferencing using steganographically-embedded audio data |
US9093064B2 (en) * | 2013-03-11 | 2015-07-28 | The Nielsen Company (Us), Llc | Down-mixing compensation for audio watermarking |
US9262793B2 (en) | 2013-03-14 | 2016-02-16 | Verance Corporation | Transactional video marking system |
JP6019266B2 (ja) | 2013-04-05 | 2016-11-02 | ドルビー・インターナショナル・アーベー | ステレオ・オーディオ・エンコーダおよびデコーダ |
WO2014171791A1 (ko) | 2013-04-19 | 2014-10-23 | 한국전자통신연구원 | 다채널 오디오 신호 처리 장치 및 방법 |
CN105229731B (zh) | 2013-05-24 | 2017-03-15 | 杜比国际公司 | 根据下混的音频场景的重构 |
SG11201508841UA (en) | 2013-05-24 | 2015-12-30 | Dolby Int Ab | Coding of audio scenes |
EP2830336A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Renderer controlled spatial upmix |
US9251549B2 (en) | 2013-07-23 | 2016-02-02 | Verance Corporation | Watermark extractor enhancements based on payload ranking |
US9319819B2 (en) * | 2013-07-25 | 2016-04-19 | Etri | Binaural rendering method and apparatus for decoding multi channel audio |
US9208334B2 (en) | 2013-10-25 | 2015-12-08 | Verance Corporation | Content management using multiple abstraction layers |
CN104681034A (zh) | 2013-11-27 | 2015-06-03 | 杜比实验室特许公司 | 音频信号处理 |
WO2015137146A1 (ja) * | 2014-03-12 | 2015-09-17 | ソニー株式会社 | 音場収音装置および方法、音場再生装置および方法、並びにプログラム |
JP2017514345A (ja) | 2014-03-13 | 2017-06-01 | ベランス・コーポレイション | 埋め込みコードを用いた対話型コンテンツ取得 |
US9779739B2 (en) | 2014-03-20 | 2017-10-03 | Dts, Inc. | Residual encoding in an object-based audio system |
CN104954020B (zh) * | 2014-03-28 | 2018-07-24 | 意法半导体股份有限公司 | 多通道换能器设备和其操作方法 |
US10037202B2 (en) | 2014-06-03 | 2018-07-31 | Microsoft Technology Licensing, Llc | Techniques to isolating a portion of an online computing service |
US9510125B2 (en) * | 2014-06-20 | 2016-11-29 | Microsoft Technology Licensing, Llc | Parametric wave field coding for real-time sound propagation for dynamic sources |
EP4224887A1 (en) | 2015-08-25 | 2023-08-09 | Dolby International AB | Audio encoding and decoding using presentation transform parameters |
US10225657B2 (en) | 2016-01-18 | 2019-03-05 | Boomcloud 360, Inc. | Subband spatial and crosstalk cancellation for audio reproduction |
NZ750171A (en) * | 2016-01-18 | 2022-04-29 | Boomcloud 360 Inc | Subband spatial and crosstalk cancellation for audio reproduction |
CN108632714B (zh) * | 2017-03-23 | 2020-09-01 | 展讯通信(上海)有限公司 | 扬声器的声音处理方法、装置及移动终端 |
FR3065137B1 (fr) * | 2017-04-07 | 2020-02-28 | Axd Technologies, Llc | Procede de spatialisation sonore |
CN108156575B (zh) * | 2017-12-26 | 2019-09-27 | 广州酷狗计算机科技有限公司 | 音频信号的处理方法、装置及终端 |
US10764704B2 (en) | 2018-03-22 | 2020-09-01 | Boomcloud 360, Inc. | Multi-channel subband spatial processing for loudspeakers |
US10602298B2 (en) | 2018-05-15 | 2020-03-24 | Microsoft Technology Licensing, Llc | Directional propagation |
US10798515B2 (en) | 2019-01-30 | 2020-10-06 | Facebook Technologies, Llc | Compensating for effects of headset on head related transfer functions |
KR20220024593A (ko) | 2019-06-14 | 2022-03-03 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 매개변수 인코딩 및 디코딩 |
US10932081B1 (en) | 2019-08-22 | 2021-02-23 | Microsoft Technology Licensing, Llc | Bidirectional propagation of sound |
CN114503608B (zh) | 2019-09-23 | 2024-03-01 | 杜比实验室特许公司 | 利用变换参数的音频编码/解码 |
US10841728B1 (en) | 2019-10-10 | 2020-11-17 | Boomcloud 360, Inc. | Multi-channel crosstalk processing |
CN115280411A (zh) * | 2020-03-09 | 2022-11-01 | 日本电信电话株式会社 | 声音信号缩混方法、声音信号编码方法、声音信号缩混装置、声音信号编码装置、程序及记录介质 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2138030C1 (ru) | 1993-05-05 | 1999-09-20 | Филипс Электроникс Н.В. | Система передачи, терминальный блок, кодирующее устройство, декодирующее устройство и адаптивный фильтр |
US6198827B1 (en) | 1995-12-26 | 2001-03-06 | Rocktron Corporation | 5-2-5 Matrix system |
US5771295A (en) | 1995-12-26 | 1998-06-23 | Rocktron Corporation | 5-2-5 matrix system |
ATE184140T1 (de) | 1996-03-07 | 1999-09-15 | Fraunhofer Ges Forschung | Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer |
DE19640814C2 (de) | 1996-03-07 | 1998-07-23 | Fraunhofer Ges Forschung | Codierverfahren zur Einbringung eines nicht hörbaren Datensignals in ein Audiosignal und Verfahren zum Decodieren eines nicht hörbar in einem Audiosignal enthaltenen Datensignals |
US6711266B1 (en) | 1997-02-07 | 2004-03-23 | Bose Corporation | Surround sound channel encoding and decoding |
TW429700B (en) | 1997-02-26 | 2001-04-11 | Sony Corp | Information encoding method and apparatus, information decoding method and apparatus and information recording medium |
DE19947877C2 (de) | 1999-10-05 | 2001-09-13 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals |
US6725372B1 (en) | 1999-12-02 | 2004-04-20 | Verizon Laboratories Inc. | Digital watermarking |
JP3507743B2 (ja) | 1999-12-22 | 2004-03-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 圧縮オーディオデータへの電子透かし方法およびそのシステム |
US7136418B2 (en) | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
DE10129239C1 (de) | 2001-06-18 | 2002-10-31 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal |
US7243060B2 (en) | 2002-04-02 | 2007-07-10 | University Of Washington | Single channel sound separation |
KR20040108796A (ko) | 2002-05-10 | 2004-12-24 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 워터마크 임베딩과 검색 |
JP4399362B2 (ja) * | 2002-09-23 | 2010-01-13 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声信号の生成 |
JP2005352396A (ja) * | 2004-06-14 | 2005-12-22 | Matsushita Electric Ind Co Ltd | 音響信号符号化装置および音響信号復号装置 |
ES2373728T3 (es) | 2004-07-14 | 2012-02-08 | Koninklijke Philips Electronics N.V. | Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio. |
-
2006
- 2006-09-01 BR BRPI0621485A patent/BRPI0621485B1/pt active IP Right Grant
- 2006-09-01 PL PL06777145T patent/PL1999999T3/pl unknown
- 2006-09-01 EP EP06777145A patent/EP1999999B1/en active Active
- 2006-09-01 WO PCT/EP2006/008566 patent/WO2007110103A1/en active Application Filing
- 2006-09-01 KR KR1020087023386A patent/KR101010464B1/ko active IP Right Grant
- 2006-09-01 US US11/469,799 patent/US8175280B2/en active Active
- 2006-09-01 CN CN2006800539650A patent/CN101406074B/zh active Active
- 2006-09-01 AT AT06777145T patent/ATE532350T1/de active
- 2006-09-01 RU RU2008142141/09A patent/RU2407226C2/ru active
- 2006-09-01 JP JP2009501863A patent/JP4606507B2/ja active Active
- 2006-09-01 ES ES06777145T patent/ES2376889T3/es active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2639955C2 (ru) * | 2012-02-13 | 2017-12-25 | Франк РОССЕ | Способ трансаурального синтеза для придания звуку пространственной формы |
Also Published As
Publication number | Publication date |
---|---|
JP4606507B2 (ja) | 2011-01-05 |
EP1999999B1 (en) | 2011-11-02 |
WO2007110103A1 (en) | 2007-10-04 |
EP1999999A1 (en) | 2008-12-10 |
JP2009531886A (ja) | 2009-09-03 |
CN101406074A (zh) | 2009-04-08 |
ATE532350T1 (de) | 2011-11-15 |
BRPI0621485A2 (pt) | 2011-12-13 |
KR101010464B1 (ko) | 2011-01-21 |
BRPI0621485B1 (pt) | 2020-01-14 |
US8175280B2 (en) | 2012-05-08 |
KR20080107433A (ko) | 2008-12-10 |
PL1999999T3 (pl) | 2012-07-31 |
US20070223708A1 (en) | 2007-09-27 |
CN101406074B (zh) | 2012-07-18 |
ES2376889T3 (es) | 2012-03-20 |
RU2008142141A (ru) | 2010-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2407226C2 (ru) | Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов | |
US12165656B2 (en) | Encoding of a multi-channel audio signal to generate binaural signal and decoding of an encoded binauralsignal | |
CA2593290C (en) | Compact side information for parametric coding of spatial audio | |
JP4987736B2 (ja) | オーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための装置および方法 | |
TWI424754B (zh) | 利用側邊資訊之聲道重新組配技術 | |
AU2005204715B2 (en) | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal | |
KR101236259B1 (ko) | 오디오 채널들을 인코딩하는 방법 및 장치 | |
RU2427978C2 (ru) | Кодирование и декодирование аудио | |
CN101185117A (zh) | 解码音频信号的方法和装置 | |
MX2008011994A (es) | Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal. | |
MX2008010631A (es) | Codificacion y decodificacion de audio | |
MX2008009565A (en) | Apparatus and method for encoding/decoding signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PD4A | Correction of name of patent owner |