[go: up one dir, main page]

RU2586851C2 - Устройство для формирования улучшенного сигнала микширования с понижением, способ формирования улучшенного сигнала микширования с понижением и компьютерная программа - Google Patents

Устройство для формирования улучшенного сигнала микширования с понижением, способ формирования улучшенного сигнала микширования с понижением и компьютерная программа Download PDF

Info

Publication number
RU2586851C2
RU2586851C2 RU2012140890/08A RU2012140890A RU2586851C2 RU 2586851 C2 RU2586851 C2 RU 2586851C2 RU 2012140890/08 A RU2012140890/08 A RU 2012140890/08A RU 2012140890 A RU2012140890 A RU 2012140890A RU 2586851 C2 RU2586851 C2 RU 2586851C2
Authority
RU
Russia
Prior art keywords
channel
signal
information
microphone signal
filter
Prior art date
Application number
RU2012140890/08A
Other languages
English (en)
Other versions
RU2012140890A (ru
Inventor
Фабиан КЮЕХ
Юрген ХЕРРЕ
Кристоф ФАЛЛЕР
Кристоф ТОУРНЕРИ
Original Assignee
Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Publication of RU2012140890A publication Critical patent/RU2012140890A/ru
Application granted granted Critical
Publication of RU2586851C2 publication Critical patent/RU2586851C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

Изобретение относится к технике связи. Технический результат - обеспечение формирования улучшенного сигнала микширования с понижением. Устройство для формирования улучшенного сигнала микширования с понижением на основе многоканального микрофонного сигнала включает пространственный анализатор, выполненный с возможностью вычислить ряд пространственных параметров звука, включающих информацию о направлении, описывающую направление прибытия прямого звука, информацию о мощности прямого звука и информацию о мощности диффузного звука на основе многоканального микрофонного сигнала. Устройство также включает калькулятор фильтра для того, чтобы вычислить параметры фильтра расширения в зависимости от информации о направлении, описывающей направление прибытия прямого звука, информации о мощности прямого звука и информации о мощности диффузного звука. Устройство также включает фильтр для того, чтобы фильтровать микрофонный сигнал или сигнал, полученный из микрофонного сигнала, используя параметры фильтра расширения, чтобы получить улучшенный сигнал микширования с понижением. 6 н. и 12 з.п. ф-лы, 7 ил.

Description

Решения согласно изобретению связаны с устройством для формирования улучшенного сигнала микширования с понижением, способом формирования улучшенного сигнала микширования с понижением и компьютерной программой формирования улучшенного сигнала микширования с понижением.
Решение согласно изобретению связано с вычислением улучшенного сигнала микширования с понижением для аудио микрофонов, расположенных в пространстве.
Запись звука окружения с небольшой конфигурацией микрофонов остается проблемой. Одной из таких наиболее широко известных конфигураций является микрофон «Звуковое поле» и соответствующие декодеры окружения (см., например, ссылку [3]), которые фильтруют и объединяют эти четыре почти совпадающие точечные микрофонные сигналы для формирования выходных каналов звука окружения. Слабость этого подхода заключается в ограниченном разделении каналов, связанном с ограниченной направленностью микрофонных направленных откликов первого порядка, в то время как высокая точность одноканального сигнала сохраняется.
В качестве альтернативы могут быть применены способы, основанные на параметрическом представлении наблюдаемой звуковой области. В [2] был предложен способ, использующий обычные одинаковые пары стерео микрофонов, чтобы сделать запись звука окружения. Было показано, как оценить пространственные параметры звука прямозвуковые-диффузнозвуковые-отношения и направления-прибытия звука от этих направленных микрофонов, и как использовать эту информацию, чтобы заставить пространственный кодирующий аудио синтез сформировать звук окружения. В [2] было также обсуждено, как параметрическая информация, то есть направление-прибытия звука (DOA) и диффузионно-звуковое-отношение (DSR) звуковой области может быть использовано, чтобы непосредственно рассчитать определенные пространственные параметры, которые используются в кодирующей схеме MPEG окружения (MPS) (см., например, ссылку [6]).
MPEG окружение является параметрическим представлением многоканальных аудио сигналов, представляя эффективный подход к высококачественному пространственному аудио кодированию. В MPS используется тот факт, что с перцепционной точки зрения многоканальные аудио сигналы содержат существенную избыточность в отношении различных каналов громкоговорителей. Кодирующее устройство MPS получает в качестве входных множество сигналов громкоговорителей, где соответствующая пространственная конфигурация громкоговорителей должна быть известна заранее. Основанное на этих входных сигналах кодирующее MPS устройство вычисляет пространственные параметры в частотных подгруппах, таких как: различия в уровне канала между двумя каналами (CLD) и межканальная корреляция между двумя каналами (ICC). Тогда фактическая MPS информация о стороне получается из этих пространственных параметров. Кроме того, кодирующее устройство вычисляет микшированный сигнал с понижением, который может состоять из одного или более аудио каналов.
Было обнаружено, что стерео входные сигналы микрофона хорошо подходят, чтобы оценить пространственные параметры звука. Однако было также обнаружено, что необработанный входной сигнал стерео микрофона вообще плохо подходит, чтобы непосредственно использоваться в качестве соответствующего сигнала микширования с понижением MPEG окружения. Было найдено, что во многих случаях перекрестная связь между левым и правым каналами слишком велика, что приводит к плохому разделению каналов в декодированных сигналах MPEG окружения.
Ввиду этой ситуации есть потребность в концепции формирования улучшенного сигнала микширования с понижением на основе многоканального микрофонного сигнала, такого, что улучшенный сигнал микширования с понижением приводит к достаточно хорошему пространственному качеству звука и свойству локализации после декодирования MPEG окружения.
Эта цель достигается предлагаемым устройством для того, чтобы сформировать улучшенный сигнал микширования с понижением, предлагаемым способом для того, чтобы сформировать улучшенный сигнал микширования с понижением, и предлагаемой компьютерной программой для того, чтобы сформировать улучшенный сигнал микширования с понижением.
Решение согласно изобретению создает устройство для того, чтобы сформировать улучшенный сигнал микширования с понижением на основе многоканального микрофонного сигнала. Устройство включает пространственный анализатор, выполненный с возможностью вычислить на базе многоканального микрофонного сигнала ряд пространственных параметров звука, включающих информацию о направлении, описывающую направление прибытия прямого звука, информацию о мощности прямого звука и информацию о мощности диффузного звука. Устройство также включает калькулятор фильтра для того, чтобы вычислить параметры фильтра расширения в зависимости от информации о мощности прямого звука и информации о диффузионной мощности звука. Устройство также включает фильтр для того, чтобы фильтровать микрофонный сигнал, или сигнал, полученный из микрофонного, используя параметры фильтра расширения, чтобы получить улучшенный сигнал микширования с понижением.
Это решение согласно изобретению основано на открытии того, что улучшенный сигнал микширования с понижением, который подходит лучше, чем входной многоканальный микрофонный сигнал, может быть получен из входного многоканального микрофонного сигнала операцией фильтрования, и что параметры фильтра для такой операции фильтрования, улучшающей сигнал, могут быть эффективно получены из пространственных параметров звука.
Соответственно для вычисления улучшенных параметров фильтра можно снова использовать ту же самую информацию, а именно, пространственные параметры звука, которые являются также подходящими для получения параметров MPEG окружения. Соответственно, может быть создана чрезвычайно эффективная система, используя вышеописанную концепцию.
Более того, возможно получить сигнал микширования с понижением, который учитывает хорошее разделение каналов при обработке декодером MPEG окружения, даже если сигналы канала многоканального микрофонного сигнала включают только низкое пространственное разделение. Соответственно, улучшенный сигнал микширования с понижением может привести к значительно улучшенному пространственному качеству звука и свойству локализации после декодирования MPEG окружения по сравнению с обычными системами.
Чтобы подвести итог, вышеописанное решение согласно изобретению позволяет обеспечивать улучшенный сигнал микширования с понижением, имеющий хорошие пространственные свойства разделения при умеренной вычислительной сложности.
В предпочтительном решении калькулятор фильтра выполнен с возможностью вычислить параметры фильтра расширения, таким образом, что улучшенный сигнал микширования с понижением приближается к желаемому сигналу микширования с понижением. Используя этот подход можно обеспечить, чтобы параметры фильтра расширения были хорошо приспособлены к желаемому результату фильтрования. Например, параметры фильтра расширения могут быть вычислены таким образом, чтобы одно или более статистических свойств улучшенного сигнала микширования с понижением аппроксимировали желаемые статистические свойства сигнала микширования с понижением. Соответственно может быть достигнуто, чтобы улучшенный сигнал микширования с понижением был хорошо приспособлен к ожиданиям, где ожидания могут быть определены в цифровой форме с точки зрения желаемых величин корреляции.
В предпочтительном решении калькулятор фильтра выполнен с возможностью вычислить желаемые величины корреляции между многоканальным микрофонным сигналом (или, более точно, сигналами этих каналов) и желаемыми сигналами канала микширования с понижением в зависимости от пространственных параметров звука. В этом случае калькулятор фильтра предпочтительно выполнен с возможностью вычислить параметры фильтра расширения в зависимости от желаемых величин взаимной корреляции. Было найдено, что указанные величины взаимной корреляции являются хорошей мерой того, показывают ли сигналы канала микширования с понижением достаточно хорошие характеристики разделения канала. Кроме того, было найдено, что желаемые величины корреляции могут быть вычислены при умеренной вычислительной сложности на основе пространственных параметров звука.
В предпочтительном решении калькулятор фильтра выполнен с возможностью вычисления желаемых величин взаимной корреляции в зависимости от зависимых от направления коэффициентов передачи, которые описывают желаемые вклады компонентов прямого звука многоканального микрофонного сигнала во множество сигналов громкоговорителя, и в зависимости от одной или более величин матрицы микширования с понижением, которые описывают желаемые вклады множества аудио каналов (например, сигналов громкоговорителя) в один или более каналов улучшенного сигнала микширования с понижением. Было найдено, что зависимые от направления коэффициенты передачи и величины матрицы микширования с понижением хорошо подходят для того, чтобы вычислить желаемые величины взаимной корреляции, и упомянутые зависимые от направления коэффициенты передачи и упомянутые величины матрицы микширования с понижением легко доступны. Более того было найдено, что желаемые величины взаимной корреляции легко доступны на основе данной информации.
В предпочтительном решении калькулятор фильтра выполнен с возможностью отобразить информацию о направлении на набор зависимых от направления коэффициентов передачи. Было обнаружено, что может использоваться закон о многоканальном амплитудном панорамировании, чтобы определить коэффициенты передачи с умеренной сложностью вычисления в зависимости от информации о направлении. Было обнаружено, что информация о направлении прибытия подходит для того, чтобы определить зависимые от направления коэффициенты передачи, которые могут описать, например, какие громкоговорители должны создать прямой звуковой компонент. Легко понять, что прямой звуковой компонент распределен между различными сигналами громкоговорителя в зависимости от информации о направлении прибытия (кратко определяемой как информация о направлении), и что относительно просто определить коэффициенты передачи, которые описывают, какой из громкоговорителей должен отдать прямой звуковой компонент. Например, правило отображения, которое используется для того, чтобы отобразить информацию о направлении на набор зависимых от направления коэффициентов передачи, может просто определить, что те громкоговорители, которые связаны с направлением прибытия могут отдать (или в основном отдать), прямой звуковой компонент, в то время как другие громкоговорители, которые связаны с другими указаниями, должны отдать только небольшую часть прямого звукового компонента или должны даже подавить прямой звуковой компонент.
В привилегированном решении калькулятор фильтра выполнен с возможностью использовать информацию о мощности прямого звука и информацию о мощности диффузного звука, чтобы вычислить желаемые величины взаимной корреляции. Было найдено, что рассмотрение полномочий обоих из названных звуковых компонентов (прямой звуковой компонент и диффузный звуковой компонент) приводит к особенно хорошему впечатлению слушания, потому что и прямой звуковой компонент и диффузный звуковой компонент могут быть должным образом назначены сигналам канала микширования с понижением (обычно многоканального).
В предпочтительном решении калькулятор фильтра выполнен с возможностью применить весовой коэффициент к информации о мощности прямого звука в зависимости от информации о направлении, и применить предопределенную надбавку, которая независима от информации о направлении к информации о мощности диффузного звука, чтобы вычислить желаемые величины взаимной корреляции. Соответственно они могут быть различны между прямыми звуковыми компонентами и диффузными звуковыми компонентами, что приводит к особенно реалистической оценке желаемых величин взаимной корреляции.
В предпочтительном решении калькулятор фильтра выполнен с возможностью решения уравнения Винера-Хопфа, чтобы получить параметры фильтра расширения. В этом случае уравнение Винера-Хопфа описывает отношения между величинами корреляции, описывающими корреляцию между различными парами каналов многоканального микрофонного сигнала, улучшенными параметрами фильтра и желаемыми величинами взаимной корреляции между сигналами канала многоканального микрофонного сигнала и желаемыми сигналами канала сигнала микширования с понижением. Было обнаружено, что решение такого уравнения Винера-Хопфа приводит к улучшенным параметрам фильтра, которые хорошо приспособлены к желаемым характеристикам корреляции сигналов канала сигнала микширования с понижением.
В предпочтительном решении калькулятор фильтра выполнен с возможностью вычисления улучшенных параметров фильтра в зависимости от модели желаемых каналов микширования с понижением. Моделируя желаемые каналы микширования с понижением, параметры фильтра расширения могут быть вычислены таким образом, что они приводят к сигналу микширования с понижением, который учитывает хорошую реконструкцию желаемых многоканальных сигналов громкоговорителя в многоканальном декодере.
В некоторых решениях модель желаемых каналов микширования с понижением, может включать модель идеального микширования с понижением, которое было бы выполнено, если бы сигналы канала (например, сигналы громкоговорителя) были бы доступны индивидуально. Более того, моделирование может включать модель того, как отдельные сигналы канала могут быть получены из многоканального микрофонного сигнала, даже если многоканальный микрофонный сигнал включает сигналы канала, имеющие только ограниченное пространственное разделение. Соответственно, полная модель желаемого канала микширования с понижением может быть получена, например, путем объединения моделей получения отдельных сигналов канала (например, сигналов громкоговорителя) и моделей получения желаемых каналов микширования с понижением из указанных отдельных сигналов капала. Таким образом, это достаточно хороший способ для вычисления улучшенных параметров фильтра, при относительно небольшой вычислительной сложности.
В предпочтительном решении калькулятор фильтра выполнен с возможностью выборочно выполнить одноканальное фильтрование, где первый канал сигнала микширования с понижением получен фильтрованием первого канала многоканального микрофонного сигнала, и где второй канал сигнала микширования с понижением получен фильтрованием второго канала многоканального микрофонного сигнала, избегая взаимного влияния первого канала многоканального микрофонного сигнала на второй канал сигнала микширования с понижением и второго канала многоканального микрофонного сигнала на первый канал сигнала микширования с понижением, или двухканальное фильтрование, где первый канал сигнала микширования с понижением получен путем фильтрации первого и второго каналов многоканального микрофонного сигнала, и где второй канал сигнала микширования с понижением получен путем фильтрации первого и второго каналов многоканального микрофонного сигнала.
Выбор одноканального фильтрования и двухканального фильтрования зависит от величины корреляции, описывающей корреляцию между первым каналом многоканального микрофонного сигнала и вторым каналом многоканального микрофонного сигнала. Выбирая между одноканальным фильтрованием и двухканальным фильтрованием, можно избежать численных ошибок, которые могут иногда появляться, если двухканальное фильтрование используется в ситуации, в которой левый и правый каналы сильно коррелированны. Соответственно, хорошее качество сигнала микширования с понижением может быть получено независимо от того, коррелированны ли сигналы канала многоканального микрофонного сигнала сильно или нет.
Другое решение согласно изобретению создает способ для того, чтобы создать улучшенный сигнал микширования с понижением.
Другое решение согласно изобретению создает компьютерную программу для того, чтобы выполнить способ формирования улучшенного сигнала микширования с понижением.
Способ и компьютерная программа основаны на тех же самых результатах, что и устройство и к ним могут быть добавлены любая из особенностей и функциональностей, обсужденных относительно устройства.
Краткое описание иллюстраций
Решения согласно данному изобретению будут описаны впоследствии со ссылками на иллюстрации, где:
на фиг.1 показана блок-схема устройства для того, чтобы сформировать улучшенный сигнал микширования с понижением, согласно решению изобретения;
на фиг.2 показана графическая иллюстрация пространственной аудио обработки микрофонного сигнала, согласно решению изобретения;
На фиг.3 показана графическая иллюстрация вычисления улучшенного микширования с понижением, согласно решению изобретения;
на фиг.4 показана графическая иллюстрация отображения канала для вычисления желаемых сигналов микширования с понижением Y1 и Y2, которые могут использоваться в решениях согласно изобретению;
на фиг.5 показана графическая иллюстрация вычисления улучшенного микширования с понижением, основанного на предварительно обработанных микрофонных сигналах, согласно решению изобретения;
на фиг.6 показано схематическое представление вычислений для того, чтобы получить параметры фильтра расширения из многоканального микрофонного сигнала, согласно решению изобретения; и
на фиг.7 показано схематическое представление вычислений для того, чтобы получить параметры фильтра расширения из многоканального микрофонного сигнала, согласно другому решению изобретения.
Подробное описание решений
1. Устройство для формирования улучшенного сигнала микширования с понижением согласно фиг.1
На фиг.1 показана блок-схема устройства 100 для того, чтобы сформировать улучшенный сигнал микширования с понижением на основе многоканального микрофонного сигнала. Устройство 100 выполнено с возможностью получить многоканальный микрофонный сигнал 110 и обеспечить на его основе улучшенный сигнал микширования с понижением 112. Устройство 100 включает пространственный анализатор 120 выполненный с возможностью вычислить ряд пространственных параметров звука 122 на основе многоканального микрофонного сигнала 110. Пространственные параметры звука, как правило, включают информацию о направлении, описывающую направление прибытия прямого звука (который включен в многоканальный микрофонный сигнал), информацию о мощности прямого звука и о мощности диффузного звука. Устройство 100 также включает калькулятор фильтра 130 для того, чтобы вычислить параметры фильтра расширения 132 в зависимости от пространственных параметров звука 122, то есть в зависимости от информации о направлении, описывающей направление прибытия прямого звука, в зависимости от информации о мощности прямого звука и в зависимости информации о мощности диффузного звука. Устройство 100 также включает фильтр 140 для того, чтобы фильтровать микрофонный сигнал 110, или сигнал 110', полученный из микрофонного сигнала, используя параметры фильтра расширения 132, чтобы получить улучшенный сигнал микширования с понижением 112. Сигнал 110' может быть получен из многоканального микрофонного сигнала 110, используя дополнительную предварительную обработку 150.
Относительно функциональности устройства 100 можно отметить, что по сравнению с многоканальным микрофонным сигналом 110 улучшенный сигнал микширования с понижением 112, как правило, обеспечивается таким образом, что улучшенный сигнал микширования с понижением 112, учитывает улучшенное пространственное качество звука после декодирования MPEG окружения, потому что для достижения этой цели параметры фильтра расширения 132, как правило, обеспечиваются калькулятором фильтра 130. Предоставление улучшенных параметров фильтра 130 основано на пространственных параметрах звука 122 обеспеченных пространственным анализатором так, что параметры фильтра расширения 130 формируются в соответствии с пространственной особенностью многоканального микрофонного сигнала 110, и чтобы подчеркнуть пространственную особенность многоканального микрофонного сигнала 110. Соответственно, фильтрование, выполненное фильтром 140, учитывает адаптивное к сигналу улучшение пространственной особенности улучшенного сигнала микширования с понижением 112 при сравнении с входным многоканальным микрофонным сигналом 110.
Детали относительно пространственного анализа, выполненного пространственным анализатором 120, относительно вычисления параметра фильтра, выполненного калькулятором фильтра 130 и относительно фильтрования, выполненного фильтром 140, будут описаны более подробно далее.
2. Устройство для формирования улучшенного сигнала микширования с понижением согласно фиг.2.
На фиг.2 показан блок-схема устройства 200 для того, чтобы сформировать улучшенный сигнал микширования с понижением (который может принять форму двухканального аудио сигнала), и ряд пространственных звуков, связанных с сигналом микширования с повышением, имеющим более двух каналов. Устройство 200 включает микрофонное устройство 205, выполненное с возможностью обеспечить двухканальный сигнал микрофона, включающий сигнал первого канала 210а и сигнал второго канала 210b.
Устройство 200 далее включает процессор 216 для того, чтобы обработать ряд пространственных звуков, связанных с сигналом микширования с повышением, имеющим более двух каналов на базе микрофонного сигнала с двумя каналами. Процессор 216 также выполнен с возможностью сформировать параметры фильтра расширения 232. Процессор 216 выполнен с возможностью получить в качестве входных сигнал первого канала 210а и сигнал второго канала 210b, обеспеченный микрофонным устройством 205. Устройство 216 выполнено с возможностью сформировать параметры фильтра расширения 232 и также предоставить пространственную информацию о звуке 262. Устройство 200 далее включает поставщика двухканального аудио сигнала 240, который выполнен с возможностью получить сигнал первого канала 210а и сигнал второго канала 210b, обеспеченный микрофонным устройством 205 и сформировать обработанные версии сигнала микрофона первого канала 210а и сигнала микрофона второго канала 210b в виде двухканального аудио сигнала 212, включающего сигналы каналов 212а, 212b.
Микрофонное устройство 205 включает первый направленный микрофон 206 и второй направленный микрофон 208. Первый направленный микрофон 206 и второй направленный микрофон 208 предпочтительно располагаются на расстоянии не больше чем 30 см. Соответственно сигналы, полученные первым направленным микрофоном 206 и вторым направленным микрофоном 208, сильно коррелированны, что, как было обнаружено, выгодно для вычисления анализатором сигнала 220 составляющей информации об энергии (или составляющей информации о мощности) 122а и информации о направлении 122b. Однако первый направленный микрофон 206 и второй направленный микрофон 208 ориентируются таким образом, что направленная характеристика 209 второго направленного микрофона 208 является повернутой версией направленной характеристики 207 первого направленного микрофона 206. Соответственно, сигнал микрофона первого канала 210а и сигнал микрофона второго канала 210b сильно коррелированны (из-за пространственной близости микрофонов 206, 208), но все же отличаются (из-за различных направленных характеристик 207, 209 направленных микрофонов 206, 208). В частности в случае направленного сигнала с приблизительно постоянного направления на микрофонное устройство 205 вызываются сильно коррелированные компонент сигнала микрофона первого канала 210а и сигнала микрофона второго канала 210b, имеющего постоянное во времени зависимое от направления отношение амплитуд (или отношение интенсивностей). В случае падения на микрофонное устройство 205 окружающего аудио сигнала с переменных во времени направлений приводит к существенной корреляции компонент сигнала микрофона первого канала 210а и сигнала микрофона второго канала 210, но к флуктуирующему во времени отношению амплитуд (или отношению интенсивностей). Соответственно, микрофонное устройство 205 обеспечивает двухканальный микрофонный сигнал 210а, 210b, который позволяет анализатору сигнала 220 из процессора 216 различить прямой звук и диффузный звук даже при условии, что микрофоны 206, 208 расположены близко. Таким образом, устройство 200 состоит из поставщика аудио сигнала, который может быть реализован в пространственно компактной форме, и который, однако, способен к обеспечению пространственных звуков, связанных с сигналом микширования с повышением, имеющим более двух каналов.
С использованием пространственного аудио декодера пространственные звука 262 могут использоваться в сочетании с сформированным двухканальным аудио сигналом 212а, 212b, чтобы обеспечить выходной сигнал звукового окружения ("звука вокруг").
Далее будут даны некоторые дальнейшие объяснения относительно устройства 200. Устройство 200 может включать микрофонное устройство 205, которое обеспечивает сигнал первого канала 210а и сигнал второго канала 210b. Сигнал первого канала 210а также определяется с x1(t), и сигнал второго канала 210b определяется с x2(t). Нужно также отметить, что сигнал первого канала 210а и сигнал второго канала 210b могут представлять многоканальный микрофонный сигнал 110, который поступает в устройство 100 согласно фиг.1.
Поставщик двухканального аудио сигнала 240 получает сигнал первого канала 210а и сигнал второго канала 210b, и, как правило, также получает информацию об улучшенном параметре фильтра 232. Поставщик двухканального аудио сигнала 240 может, например, выполнить функцию дополнительной предварительной обработки 150 и фильтра 140, чтобы обеспечить двухканальный аудио сигнал 212, который представлен сигналом первого канала 212а и сигналом второго канала 212b. Двухканальный аудио сигнал 212 может быть эквивалентным улучшенному сигналу микширования с понижением 112, созданному устройством 100 на фиг.1.
Анализатор сигнала 220 может быть выполнен с возможностью получить сигнал первого канала 210а и сигнал второго канала 210b. Кроме того, анализатор сигнала 220 может быть выполнен с возможностью получить компоненты информации об энергии 122а и информации о направлении 122b на основе двухканального микрофонного сигнала 210, то есть на основе сигнала первого канала 210а и сигнала второго канала 210b. Предпочтительно, анализатор сигнала 220 выполнен с возможностью получить компоненты информации о энергии 122а и информации о направлении 122b таким образом, что компонента информации о энергии 122а описывает оценку энергий (или, эквивалентно, мощностей) прямой компоненты звукового двухканального микрофонного сигнала и диффузной компоненты звукового микрофонного двухканального сигнала, и таким образом, что информация о направлении 122 описывает оценку направления, из которого исходит прямой звуковой компонент двухканального микрофонного сигнала 210а, 210b. Соответственно, анализатор сигнала 220 может иметь функцию пространственного анализатора 120, и компоненты информации об энергии 122а и информации о направлении 122b, могут быть эквивалентны пространственным параметрам звука 122. Компонента информации об энергии 122а может быть эквивалентна информации о мощности прямого звука и информации о мощности диффузного звука. Процессор 216 также включает генератор пространственной информации о стороне 260, который получает компоненты информации об энергии 122а и информации о направлении 122b от анализатора сигнала 220. Генератор пространственной информации о стороне 260 выполнен с возможностью обеспечить, на основе этого, пространственную информацию о звуке 262. Предпочтительно, генератор пространственной информации о стороне 260 выполнен с возможностью отобразить компоненту информации об энергии 122а двухканального микрофонного сигнала 210а, 210b и информацию о направлении 122b двухканального микрофонного сигнала 210а, 210b на пространственную информацию о звуке 262. Соответственно, пространственная информация о стороне 262 получена таким образом, что пространственная информация о звуке 262 описывает ряд пространственных звуков, связанных с аудио сигналом микшированным с повышением, имеющим более двух каналов.
Процессор 216 имеет в вычислительном отношении очень эффективное вычисление пространственной информации о звуке 262, которое связано с аудио сигналом микшированным с повышением, имеющим более двух каналов, на основе двухканального микрофонного сигнала 210а, 210b. Анализатор сигнала 220 способен к извлечению большого количества информации из двухканального микрофонного сигнала, а именно, компонента информации об энергии 122а, описывающего как оценку энергий прямой компоненты звукового двухканального микрофонного сигнала, так и диффузной компоненты звукового микрофонного двухканального сигнала, и информации о направлении 122b, описывающей оценки направления, из которого исходит прямой звуковой компонент микрофонного двухканального сигнала. Было обнаружено, что эта информация, которая может быть получена анализатором сигнала 220 на основе двухканального микрофонного сигнала 210а, 210b, достаточна, чтобы получить пространственную информацию о звуке 262 даже для микшированного с повышением аудио сигнала, имеющего более двух каналов. Важно, что было установлено, что компоненты информации об энергии 122а и информации о направлении 122b достаточны для непосредственного определения пространственной информации о звуке 262, без фактического использования микширования аудио каналов с повышением в качестве промежуточных данных.
Кроме того процессор 216 включает калькулятор фильтра 230, который выполнен с возможностью получить компоненты информации об энергии 122а и информации о направлении 122b и обеспечить на их основе информацию об улучшенном параметре фильтра 232. Соответственно, калькулятор фильтра 230 может иметь функцию калькулятора фильтра 130.
Суммируя сказанное, устройство 200 способно эффективным способом определить как улучшенный сигнал микширования с понижением 212, так и пространственную информацию о звуке 262, используя в обоих случаях ту же самую промежуточную информацию 122а, 122b. Кроме того, нужно отметить, что устройство 200 выполнено с возможностью использования пространственно небольшого микрофонного устройства 205, чтобы получить и (улучшенный) микшированный с понижением сигнал 212, и пространственную информацию о звуке 262. Из-за вычисления улучшенных параметров фильтра 232 калькулятором фильтра 230, микшированный с понижением сигнал 212 включает особенно хорошую пространственную характеристику разделения, несмотря на использование маленького микрофонного устройства 205 (которое может быть частью устройства 200 или которое может быть внешним к устройству 200, но связано с устройством 200). Соответственно, взятый в сочетании с пространственной информацией о звуке 262, (улучшенный) микшированный с понижением сигнал 212 может быть подходящим для пространственного представления (например, при использовании декодера MPEG окружения).
Подводя итог, на фиг.2 показана блок-схема пространственного микрофонного аудио подхода. Как видно, входные сигналы стерео микрофона 210а (также определяемый как x1(t)), и 210b (также определяемый как Х2(t)) используются в блоке 216, чтобы вычислить набор пространственной информации о звуке 262 связанный с многоканальным сигналом микширования с повышением (например, двухканальный аудио сигнал 212). Кроме того, обеспечивается двухканальный сигнал микширования с понижением 212.
В следующих разделах будут описаны необходимые шаги для определения пространственной информации о звуке 262 на базе анализа микрофонных стерео сигналов. Здесь, будет сделана ссылка на презентацию [2].
3. Анализ стерео сигнала.
Далее будет описан анализ стерео сигнала, который может быть выполнен пространственным анализатором 120 или анализатором сигнала 220. Следует отметить, что в некоторых решениях, в которых есть больше, чем два используемых микрофона, и в котором есть больше, чем два сигнала канала многоканального микрофонного сигнала, может использоваться расширенный анализ сигнала.
Описанный здесь анализ стерео сигнала, может использоваться, чтобы обеспечить пространственные параметры звука 122, которые могут принять форму компонент информации об энергии 122а и информации о направлении 122b. Следует отметить, что анализ стерео сигнала может быть выполнен в частотно временной области. Соответственно, сигналы каналов 210а, 210b многоканального микрофонного сигнала 110, 210 могут быть преобразованы в представление в частотно временной области с целью дальнейшего анализа.
Частотно временным представлением микрофонных сигналов x1(t) и x2(t) являются X1(k, i) и X2(k, i), где k и i - частотно временные индексы. Предполагается, что X1 (k, i) и X2 (k, i) могут быть моделироваться как
X1(k, i)=S(k, i)+N1(k,i)
X2(k, i)=a(k,i)S(k,i)+N2(k,i).
где a(k, i) коэффициент передачи, S (k, i) прямой звук в левом канале, и N1 (k, i) и N2(k, i) представляют диффузный звук.
Пространственное аудио кодирование (SAC) микширует с понижением сигнал 112, 212, и информация о стороне 262 вычисляется функция a, E{SS}, E{N1N1}, и E{N2N2}, где Е{.} - операция по усреднению на коротком временном интервале, и где обозначает сопряженное комплексное число. Эти величины получаются следующим образом.
Из (1) следует, что
E { X 1 X 1 } = E { S S } + E { N 1 N 1 } E { X 2 X 2 } = a 2 { S S } + E { N 2 N 2 } E { X 1 X 2 } = a E { S S } + E { N 1 N 2 }   .                                                           ( 2 )
Figure 00000001
Figure 00000002
Нужно отметить здесь, что E{SS} можно рассматривать как прямую звуковую информацию о мощности или, эквивалентно, прямую звуковую информацию об энергии, и что Е{N1N1} и Е {N2N2} можно рассматривать как диффузную звуковую информацию о мощности или диффузную звуковую информацию об энергии. Е{SS} и E{N1N1} можно рассматривать как составляющую информации об энергии, «а» может быть рассмотрена как информация о направлении.
Предполагается, что количество диффузного звука в обоих сигналах микрофона одинаковое, то есть E{N1N1}=E{N2N2}=E{NN}, и что Фdiff - нормализованный коэффициент взаимной корреляции между N1 и N2, то есть
Ф d i f f = E { N 1 N 2 } E { N 1 N 1 } E { N 2 N 2 }                                                                      ( 3 )
Figure 00000003
Фdiff может, например, принимать предопределенное значение, или может быть вычислен в соответствии с некоторым алгоритмом.
Принимая эти предположения, (2) можно записать как
E { X 1 X 1 } = E { S S } + E { N N } E { X 2 X 2 } = a 2 { S S } + E { N N } E { X 1 X 2 } = a E { S S } + Ф d i f f { N N } .                                                               ( 4 )
Figure 00000004
Figure 00000002
Пренебрежение величиной Е{SS} и «а» в (2) приводит к квадратному уравнению
A E { N N } 2 + B E { N N } + C = 0                                                             ( 5 )
Figure 00000005
где
A = 1 Ф d i f f 2 . B = 2 Ф d i f f E { X 1 X 2 } E { X 1 X 1 } E { X 2 X 2 } . C = E { X 1 X 1 } E { X 2 X 2 } E { X 1 X 2 } 2 .                                                   ( 6 )
Figure 00000006
Тогда Е{NN} одно физически возможное из двух решений (5), т.е.,
E { N N } = B B 2 4 A C 2 A .                                                                   ( 7 )
Figure 00000007
Другое решение (5) приводит к тому, что мощность диффузного звука больше, чем мощность микрофонного сигнала, что физически невозможно.
Из (7) нетрудно вычислить «а» и Е{SS}:
a = E { X 2 X 2 } E { N N } E { X 1 X 1 } E { N N } E { S S } = E { X 1 X 1 } E { N N } a 2 E { S S } = { X 2 X 2 } E { N N } .                                                         ( 8 )
Figure 00000008
Как обсуждалось в [2], направление прибытия прямого звука α(k, i) может быть вычислено как функция вычисленного амплитудного отношения а (k, i),
a ( k , i ) = f ( a ( k , i ) )                                                                                      ( 9 )
Figure 00000009
Специальное отображение, зависящее от характеристик направленности микрофонов, используется для записи звука.
4. Генерация пространственной информации о стороне
Далее будет описана генерация пространственной информации о звуке 262, которая может быть обеспечена пространственным генератором информации о стороне 260. Нужно отметить, что генерация пространственной информации о стороне в форме пространственной информации о звуке 262 не является необходимой особенностью решений данного изобретения. Соответственно, нужно отметить, что генерация пространственной информации о стороне может быть опущена в некоторых решениях. Кроме того, нужно отметить, что могут использоваться различные способы для того, чтобы получить пространственную информацию о звуке 262 или любую другую пространственную информацию о стороне.
Нужно также отметить, что обсужденную генерацию пространственной информации о стороне можно рассматривать как предпочтительную концепцию для того, чтобы сформировать пространственную информацию о звуке.
Учитывая аналитические результаты стерео сигнала 122а, 122b, то есть параметры соответственно α согласно уравнению (9), Е{SS} и Е{NN}, пространственные параметры совместимые с SAC декодированием генерируются, например, пространственным генератором информации о стороне 260. Было обнаружено, что один из эффективных способов это сделать состоит в том, чтобы рассмотреть многоканальную модель сигнала. Как пример, мы рассматриваем конфигурацию громкоговорителя, как показано на фиг.4, далее полагая:
L ( k , i ) = g 1 ( k , i ) S ˜ ( k , i ) + h 1 ( k , i ) N ˜ 1 ( k , i ) R ( k , i ) = g 2 ( k , i ) S ˜ ( k , i ) + h 2 ( k , i ) N ˜ 2 ( k , i ) C ( k , i ) = g 3 ( k , i ) S ˜ ( k , i ) + h 3 ( k , i ) N ˜ 3 ( k , i ) L s ( k , i ) = g 4 ( k , i ) S ˜ ( k , i ) + h 4 ( k , i ) N ˜ 4 ( k , i ) R s ( k , i ) = g 5 ( k , i ) S ˜ ( k , i ) + h 5 ( k , i ) N ˜ 5 ( k , i ) .                                                ( 10 )
Figure 00000010
где S ˜ ( k , i )
Figure 00000011
- прямой звуковой сигнал и от N ˜ 1
Figure 00000012
, до N ˜ 5
Figure 00000013
- диффузные (межканально независимые) сигналы. S ˜
Figure 00000014
соответствует полной скомпенсированной по усилению величине прямого звука микрофонного сигнала, т.е.
S ˜ ( k , i ) = 10 g ( a ) 20 1 + a 2 S ( k , i ) .                                                                  ( 11 )
Figure 00000015
и диффузионные звуковые сигналы от N ˜ 1
Figure 00000016
до N ˜ 5
Figure 00000017
, имеют одинаковую мощность равную E{NN}. Надо заметить, что определение этой мощности диффузного звука произвольное, поскольку окончательно определяют количество диффузионного звука коэффициенты передачи h1-h5.
Нужно отметить, что L(k, i), R(k, i), С(k, i), Ls(k, i) и RS(k, i) могут, например, быть желаемыми сигналами канала или желаемыми сигналами громкоговорителя.
На первом шаге, в качестве функции направления прибытия прямого звука α(k, i), применен многоканальный закон амплитудного панорамирования (см., например, [7] и [4]), чтобы определить коэффициенты передачи от g1 до g5. Затем используется эвристическая процедура, чтобы определить коэффициенты передачи диффузного звука от h1 до h5. Постоянные величины h1=1.0, h2=1.0, h3=0, h4=1.0, и h5=1.0 являются рациональным выбором, то есть окружение равномерно распределено к фронту и задней части, в то время как центральный канал создан как чистый сигнал. Однако, возможен различный выбор величин от h1 до h5.
Прямой звук от стороны и задней части уменьшен относительно звука, прибывающего по прямым направлениям. Прямой звук, содержащийся в сигналах микрофона, является предпочтительно компенсированным с коэффициентом передачи g(α), который зависит от диаграммы направленности микрофонов.
Чтобы получить пространственные звука для MPEG окружения, в данной модели сигнала окружения (10) к модели сигнала применен пространственный анализ звука определенного используемого SAC.
Спектры мощности сигналов, определенных в (10),
P L ( k , i ) = g 1 2 E { S ˜ S ˜ } + h 1 2 E { N N } P R ( k , i ) = g 2 2 E { S ˜ S ˜ } + h 2 2 E { N N } P C ( k , i ) = g 3 2 E { S ˜ S ˜ } + h 3 2 E { N N } P C ( k , i ) = g 3 2 E { S ˜ S ˜ } + h 3 2 E { N N } P R s ( k , i ) = g 5 2 E { S ˜ S ˜ } + h 5 2 E { N N } .                                                                 ( 12 )
Figure 00000018
где
E { S ˜ S ˜ } = 10 g ( a ) 10 ( 1 + a 2 ) E { S S } .                                                                    ( 13 )
Figure 00000019
Взаимные спектры, используемые далее, выражаются как
P L L s ( k , i ) = g 1 g 4 10 g ( a ) 10 ( 1 + a 2 ) E { S S } P R R s ( k , i ) = g 2 g 5 10 g ( a ) 10 ( 1 + a 2 ) E { S S } .                                                           ( 14 )
Figure 00000020
В MPEG окружении используется усиление - 3  dB ( g s 1 / 2 )
Figure 00000021
в каналах окружения перед их дальнейшей обработкой. Это может рассматриваться для формирования подходящего микширования с понижением и пространственной информации о стороне.
В первом блоке два к одному (ТТО) MPEG окружения используются различие на межканальном уровне (ICLD) и межканальная когерентность (ICC) между L и Ls. Основываясь на (10) и компенсируя для предварительного масштабирования каналы окружения, эти звука выражаются как
I C L D L L s = 10 log 10 P L ( k , i ) g 8 2 P L s ( k , i ) I C L D L L s = P L L s ( k , i ) P L ( k , i ) P L s ( k , i ) .                                                                   ( 15 )
Figure 00000022
Аналогично ICLD и ICC второго блока ТТО для R и Rs вычисляются как:
I C L D R R s = 10 log 10 P R ( k , i ) g 8 2 P R s ( k , i ) I C L D R R s = P R R s ( k , i ) P R ( k , i ) P R s ( k , i ) .                                                      ( 16 )
Figure 00000023
Figure 00000002
Блок три к двум (ТТТ) MPEG окружения работает in "энергетическом режиме", см., например, [1]. Note that the ТТТ box масштабирует с понижением центральный канал в 1 / 2
Figure 00000024
перед вычислением микширования с понижением и пространственной информации о стороне. Рассматривая предварительное масштабирование каналов окружения, двумя ICLD параметрами, используемыми блоком ТТТ являются
I C L D 1 = 10 log 10 P L + g s 2 P L s + P R + g 8 2 P R s 1 2 P c I C L D 2 = 10 log 10 P L + g s 2 P L s P R + g 8 2 P R s .                                                            ( 17 )
Figure 00000025
Заметим, что индексы I и k могут быть опять отброшены для краткости описания.
Соответственно, пространственная информация о звуке, включающая звука ICLDLLs, ICCLLs, ICLDRRs, ICCRRs, ICLD1 and ICLD2, формируется генератором пространственной информации о стороне 260 на основе пространственных параметров звука 122, 122а, 122b, т.е., на основе компоненты информации об энергии 122а и информации о направлении 122b.
5. Декодирование MPEG окружения
Далее будет описано возможное декодирование MPEG окружения, которое может использоваться, чтобы получить множество канальных сигналов, например, множество сигналов громкоговорителя, из сигнала микширования с понижением (например, улучшенного сигнала микширования с понижением 112, или улучшенного сигнала микширования с понижением 212), используя пространственную информацию о звуке 262 (или любую другую информацию, соответствующую пространственной информации о звуке).
В декодере MPEG окружения полученные сигналы микширования с понижением 112, 212 расширяются более чем до двух каналов, используя полученную пространственную информацию о стороне 262. Это микширование с повышением выполнено подходящим каскадированием соответствующих, так называемых блоков обратного один к двум (R-OTT) и обратного три к двум (R-TTT) (см., например, ссылку [6]). В то время как на выходе блока R-OTT формируются два аудио канала, основанные на моно звуковом входном сигнале и информации о стороне, блок R-TTT определяет три аудио канала, основанные на двухканальном входном звуковом сигнале и связанной информации о стороне. Другими словами, обратные блоки выполняют обратную обработку по сравнению с описанными выше соответствующими блоками ТТТ и ОТТ.
Аналогично многоканальной модели сигнала в кодирующем устройстве, декодер предполагает, что определенная конфигурация громкоговорителей правильно воспроизводит оригинальное звуковое окружение ("звук вокруг"). Дополнительно, декодер предполагает, что кодирующее MPS устройство (устройство, кодирующее MPEG окружение) выступает, определенное смешивание множества входных каналов, чтобы вычислить правильный сигнал смешения с понижением.
Вычисление стерео сигнала микширования с понижением MPEG окружения представлено Далее разделе.
6. Формирование стерео сигнала микширования с понижением MPEG окружения.
Далее это будет описано, формируется стерео сигнал микширования с понижением в MPEG окружении.
В предпочтительных решениях микширование с понижением определено таким образом, что нет никакой перекрестной связи между каналами громкоговорителей, соответствующими левому и правому полушарию. Это имеет преимущество в том, что нет никакой нежеланной утечки звуковой энергии от левого к правому полушарию, что значительно увеличивает разделение лево/право после расшифровки потока MPEG окружения. Кроме того, аналогичные рассуждения применяются для утечки сигнала с правых в левые каналы.
Когда MPEG окружение, используется для того, чтобы закодировать обычные 5.1, аудио сигналы окружения, используемое стерео микширование с понижением выражается как
[ Y 1 Y 2 ] T = M [ L  R C L s R s ] T .                                                                               ( 18 )
Figure 00000026
где матрица микширования с понижением
M = [ 1 0 1 2 g s 0 0 1 1 2 0 g s ] .                                                                       ( 19 )
Figure 00000027
где gs - ранее упомянутые предварительные передачи, используемые в каналах окружения.
Вычисление микширования с понижением согласно (18), (19) можно рассмотреть как отображение областей воспроизведения, созданных соответствующей конфигурацией громкоговорителей, на эти два сокращенных канала. Это отображение иллюстрировано на фиг.4 для конкретного случая вычисления обычного микширования с понижением (18), (19).
7. Вычисление улучшенного микширования с понижением
7.1 Краткий обзор улучшенного микширования с понижением
Далее будут описаны детали относительно вычисления улучшенного микширования с понижением. Чтобы облегчить понимание преимуществ данного понятия, здесь будет дано сравнение с некоторыми обычными системами.
В случае пространственного аудио микрофонного сигнала, как описано в разделе 2, сигнал микширования с понижением в основном соответствовал бы записанным стерео микрофонным сигналам (например, микрофонное устройство 205) в отсутствие описанного далее вычисления улучшенного микширования с понижением. Было обнаружено, что практические стерео микрофоны не обеспечивают желаемое разделение левых и правых компонентов сигнала из-за их определенных диаграмм направленности. Как следствие было также обнаружено, что перекрестное влияние между левыми и правыми каналами (например, канальными сигналами 210а и 210b) слишком высоко, что приводит к плохому разделению каналов в декодированном сигнале MPEG окружения.
Решения согласно изобретению создают подход к вычислению улучшенного сигнала микширования с понижением 112, 212, который приближается к желаемым SAC сигналам микширования с понижением (например, сигналам Y1, Y2), то есть этот подход показывает желаемый уровень взаимной связи между различными каналами, которая отличается от уровня взаимной связи в оригинальном входном стерео сигнале 110, 210. Это приводит к улучшенному качеству звука после пространственного декодирования аудио с использованием связанной пространственной информации о стороне 262.
Блок-схемы, показанные на фиг.1, 2, 3 и 5 иллюстрируют предложенный подход. Как видно, оригинальные микрофонные сигналы 110, 210, 310 обработаны в блоке улучшенного микширования с понижением 140, 240, 340, чтобы получить каналы улучшенного микширования с понижением 112, 212, 312. Модификацией микрофонных сигналов 110, 210, 310 управляет блок управления 120, 130, 216, 316. В блоке управления учитывается многоканальная модель сигнала воспроизведения громкоговорителями и вычисляются пространственные параметры звука 122, 122а, 122b, 322. Из этой информации блок управления определяет цель улучшения, то есть модель желаемого сигнала микширования с понижением (например, сигналы микширования с понижением Y1, Y2). Детали изобретения будут обсуждены далее.
7.2 Модель желаемого стерео сигнала микширования с понижением.
В этом разделе мы обсуждаем модель желаемого стерео сигнала микширования с понижением, который также представляет цель вычисления предложенного улучшенного микширования с понижением.
Если мы применяем уравнения (18), и (19) к нашей принятой модели сигнала окружения согласно уравнению (10), мы получаем модель желаемого сигнала микширования с понижением согласно выражению
Y 1 = ( g 1 + 1 2 g 3 + g s g 4 ) S ˜ + N ˜ 1 Y 2 = ( g 2 + 1 2 g 3 + g s g 5 ) S ˜ + N ˜ 2 .                                                             ( 20 )
Figure 00000028
где двумя диффузными звуковыми сигналами N ¯ 1
Figure 00000029
и N ¯ 2
Figure 00000030
являются
N ¯ 1 = h 1 N ˜ 1 + 1 2 N ˜ 3 + g s h 4 N ˜ 4 N ¯ 2 = h 2 N ˜ 2 + 1 2 N ˜ 3 + g s h 5 N ˜ 5 .                                                         ( 21 )
Figure 00000031
Диффузный звук в левом и правом микрофонных сигналах обозначен Ni и N2. Таким образом, микширование с понижением должно основываться на диффузном звуке, обозначенном N1 и N2. Поскольку, как определялось раньше, мощности N1, N2, и N ˜ 1
Figure 00000032
- N ˜ 5
Figure 00000033
аналогичны, диффузные сигналы, основанные на N1 и N2 с аналогичными мощностями N ¯ 1
Figure 00000034
и N ¯ 2
Figure 00000035
(21) выражаются следующим образом
N ˜ 1 = h 2 1 + 1 2 h 3 2 + g s 2 h 4 2 N 1 N ˜ 2 = h 2 2 + 1 2 h 3 2 + g s 2 h 5 2 N 2 .                                                      ( 22 )
Figure 00000036
Соответственно, модель желаемого стерео сигнала микширования с понижением, позволяет выражать сигналы Y1, Y2 канала желаемого стерео сигнала микширования с понижением как функцию величин передачи g1, g2, g3, g4, g5, gs, h1, h2, h3, h4, h5 и также в зависимости от общей величины скомпенсированного по усилению S ˜
Figure 00000037
прямого звука в микрофонном стерео сигнале и диффузном сигнале N1, N2.
7.3 Одноканальное фильтрование
Далее будет описан подход, в котором первый капал сигнала улучшенного микширования с понижением, получен из первого сигнала канала многоканального микрофонного сигнала и в котором второй канал сигнала улучшенного микширования с понижением, получен из второго сигнала канала многоканального микрофонного сигнала. Нужно отметить, что фильтрование, описанное далее, может быть выполнено фильтром 140 или формирователем двухканального аудио сигнала 240 или улучшенным микшированием с понижением 340. Нужно также отметить, что параметры фильтра расширения H1, H2 могут быть обеспечены калькулятором фильтра 130 калькулятором фильтра 230 или блоком управления 316.
Один возможный подход для определения желаемых сигналов микширования с понижением Y1(k, i) и Y2(k, i) согласно (20) - это применение фильтров расширения к оригинальному микрофонному стерео входному сигналу X1(k, i) и Х2(k, i), то есть
Y 1 ( k , i ) = H 1 ( k , i ) X 1 ( k , i ) Y 2 ( k , i ) = H 2 ( k , i ) X 2 ( k , i ) .                                                             ( 23 )
Figure 00000038
Эти фильтры выбраны таким образом, что Y 1 ( k , i )
Figure 00000039
и Y 2 ( k , i )
Figure 00000040
(то есть фактически сигналы микширования с понижением, полученные путем фильтрации сигналов канала многоканального микрофонного сигнала), приближаются соответственно к желаемым сигналам микширования с понижением Y1(k, i) и Y2(k, i). Подходящее приближение состоит в том, что Y 1 ( k , i )
Figure 00000041
и Y 2 ( k , i )
Figure 00000042
разделяют одно то же энергетическое распределение относительно энергий многоканальной модели сигнала громкоговорителя, как это имеет место в целевом сигнале микширования с понижением Y1(k, i) и Y2(k, i), соответственно. Другими словами, фильтры выбраны таким образом, что фактические сигналы микширования с понижением, полученные путем фильтрации сигналов канала многоканального микрофонного сигнала, приближаются к желаемым сигналам микширования с понижением относительно некоторых статистических свойств как, например, энергетические характеристики или характеристики взаимной корреляции.
В случае, если это, фильтры расширения соответствуют фильтрам Винера (см., например, [5]), H1(k, i) и H2(k, i) могут быть определены согласно
H 1 = E { X 1 Y 1 } E { X 1 X 1 } H 2 = E { X 2 Y 2 } E { X 2 X 2 } .                                                                                      ( 24 )
Figure 00000043
Подставляя (20) с (22) в (24), получаем
H 1 = w 1 E { S S } + w 3 E { N N } E { S S } + E { N N } H 2 = w 2 E { S S } + w 4 E { N N } a 2 E { S S } + E { N N } .                                                                ( 25 )
Figure 00000044
где
w 1 = 10 g ( a ) 20 1 + a 2 ( g 1 + 1 2 g 3 + g 8 g 4                                                   ( 26 )
Figure 00000045
w 2 = 10 g ( a ) 20 a 1 + a 2 ( g 1 + 1 2 g 3 + g 8 g 5                                                  ( 27 )  
Figure 00000046
Figure 00000002
w 4 = h 2 2 + 1 2 h 3 2 + g 8 2 h 5 2    .                                                                        ( 29 )
Figure 00000047
Figure 00000002
Как может быть замечено, фильтры расширения непосредственно зависят от различных компонентов многоканальной модели сигнала (10). Так как эти компоненты вычислены на базе пространственных параметров звука, мы можем прийти к заключению, что фильтры H1(k, i) и Н2(k, i) для вычисления улучшенного микширования с понижением также зависят от этих пространственных параметров звука. Другими словами, вычисления фильтров расширения могут управляться вычисленными пространственными параметрами звука, что также иллюстрировано на фиг.3.
7.4 Двухканальное фильтрование
В этом разделе мы представляем альтернативный способ одноканальному подходу, обсужденному в разделе, названном "одноканальное фильтрование". В этом случае каждый сигнал каналов улучшенного микширования с понижением Y ^ 1
Figure 00000048
, Y ^ 2
Figure 00000049
определен из фильтрованных версий обоих входных микрофонных сигналов X1, Х2. Поскольку этот подход в состоянии объединить оба микрофонных канала оптимальным способом, может ожидаться улучшенная работа по сравнению со способом одноканального фильтрования.
Фактический сигнал микширования с понижением может быть получен согласно
Y 1 ( k , i ) = [ H 1.1 H 1.2 ] [ X 1 ( k , i ) X 2 ( k , i ) ]                                                              ( 30 )
Figure 00000050
Y 2 ( k , i ) = [ H 2.1 H 2 .2 ] [ X 1 ( k , i ) X 2 ( k , i ) ]                                                                   ( 31 )
Figure 00000051
Далее мы приведем пример вычислений фильтра расширения, основанных на двухканальных фильтрах Винера. Для простоты представления, мы далее опускаем индексы (k, i). Уравнениями Винера-Хопфа для первого канала микширования с понижением) Y 1 ( k , i )
Figure 00000052
являются:
[ E { X 1 X 1 } E { X 1 X 2 } E { X 2 X 1 } E { X 1 X 2 } ] [ H 1.1 H 1.2 ] = [ E { X 1 Y 1 } E { X 2 Y 1 } ]                                            ( 32 )
Figure 00000053
Эти фильтры, таким образом, получаются как
Figure 00000002
[ H 1.1 H 1.2 ] = 1 d [     E { X 2 X 2 } E { X 1 X 2 } E { X 2 X 1 }     E { X 1 X 1 } ] [ E { X 1 Y 1 } E { X 2 Y 1 } ] [ H 2.1 H 2.2 ] = 1 d [     E { X 2 X 2 } E { X 1 X 2 } E { X 2 X 1 }     E { X 1 X 1 } ] [ E { X 1 Y 2 } E { X 2 Y 2 } ]                                          ( 33 )
Figure 00000054
где
d = E { X 1 X 1 } E { X 2 X 1 } E { X 1 X 2 } E { X 2 X 1 } .                                                   ( 34 )
Figure 00000055
Взаимная корреляция между входными микрофонными сигналами X1, X2 и требуемыми каналами микширования с понижением Y1, Y2 может быть выражена как
E { X 1 Y 1 } = ω 1 E { SS } + ω 3 E { NN } E { X 2 Y 1 } = 1 E { SS } + ω 3 Ф diff E { NN }                                                 ( 35 ) E { X 1 Y 2 } = ω 2 a E { SS } + ω 4 Ф diff E { NN } E { X 2 Y 2 } = ω 2 E { SS } + ω 4 E { NN }
Figure 00000056
где весовые коэффициенты wi были введены в (26)-(29).
7.5 Выбор между одноканальным фильтрованием и двухканальным фильтрованием
Далее будет описана концепция, которая учитывает адаптивный к сигналу выбор между одноканальным фильтрованием и двухканальным фильтрованием.
Как было описано, у двухканального фильтрования есть проблема, которая на практике иногда (или даже часто) приводит к фильтрам, которые вводят аудио артифакты (искажения). Всякий раз, когда левый и правый канал чрезвычайно коррелированны, матрица ковариации в уравнении Винера-Хопфа сильно обусловлена. Получающаяся вычислительная чувствительность приводит тогда к фильтрам, которые неадекватны и вызывают аудио артифакты. Чтобы предотвратить это, всякий раз, когда эти два канала превышают определенную степень корреляции, используется одноканальное фильтрование. Это может быть осуществлено, вычислением фильтров как
H 1.1 = H 1 H 1.2 = 0 H 2.1 = 0 H 2.2 = H 2 .                                                                                             ( 36 )
Figure 00000057
когда выполняется
| E { X 1 X 2 } | E { X 1 X 1 } E { X 2 X 2 } > T .                                                                         ( 37 )
Figure 00000058
где порог когерентности/корреляции T определяет, при каком уровне корреляции используется одноканальное фильтрование. Величина T=0.9 дает хорошие результаты.
Другими словами, можно выборочно переключаться между одноканальным фильтрованием и двухканальным фильтрованием в зависимости от степени корреляции между любыми сигналами канала многоканального микрофонного сигнала. Если корреляция больше, чем предопределенная величина корреляции, может использоваться одноканальное фильтрование вместо двухканального фильтрования.
7.6 Общий многоканальный случай
Далее мы обобщим процедуру вычисления стерео сигнала микширования с понижением MPEG окружения, основанную на многоканальной модели сигнала согласно (10), на более общие конфигурации каналов. Аналогично (10), обобщенная многоканальная модель сигнала с K каналами громкоговорителя, дается выражением
Z l ( k , i ) = g l ( k , i ) S ˜ ( k , i ) + h l ( k , i ) N ˜ 1 ( k , i ) .                                                  ( 38 )
Figure 00000059
где 1=1, 2…, К. Коэффициенты передачи gl(k, i) зависят от DOA прямого звука и положения l-ого громкоговорителя в конфигурации системы воспроизведения. Коэффициенты передачи hl могут быть предопределены и использоваться, как описано выше. Zl представляет требуемые канальные сигналы множества каналов, где l=1, 2, …К.
Вычисление сигнала Yj(k, i) требуемого канала микширования с понижением j осуществляется путем соответствующей операции микширования в соответствии с выражением
Y j ( k , i ) = l = o K 1 m j , l Z l ( k , i ) .                                                         ( 39 )
Figure 00000060
Весовые коэффициенты смешения mj,l представляют определенное пространственное разделение или отображение областей воспроизведения, которые связаны с положением l-ого громкоговорителя, на j-ый канал микширования с понижением.
Например: В случае, если канал l громкоговорителя, то есть определенная область воспроизводства, не должен вносить вклад в j-й, сигнал микширования с понижением, соответствующий весовой коэффициент смешивания mj,l устанавливается в ноль.
Аналогично (23), (30), и (31), соответственно, оригинальные входные микрофонные каналы Xj(k, i) модифицируются соответственно выбранными фильтрами расширения, чтобы аппроксимировать требуемые каналы микширования с понижением Yj(k, i).
В случае одноканального фильтра мы имеем
Y j ( k , i ) = H l ( k , i ) X j ( k , i ) .                                                                                  ( 40 )
Figure 00000061
где Y j
Figure 00000062
определяют фактические сигналы канала многоканального сигнала микширования с понижением.
Отметим, что выражение (40) может также быть применено в случае более двух доступных входных микрофонных сигналов. Получающиеся фильтры также зависят от предполагаемых пространственных параметров звука. Здесь, однако, мы не обсуждаем оценку пространственных параметров звука, основанную более, чем на двух входных микрофонных каналах, поскольку это не основная часть изобретения.
Возможно вывести необходимые уравнения для обобщенных многоканальных микширования с понижением фильтров расширения аналогично уравнениям (30), (31). Предполагая наличие М микрофонных входных сигналов, желаемый j-й канал микширования с понижением Yj(k, i) аппроксимируется применением М фильтров расширения к соответствующему микрофону сигналу Хm(k, i):
Y j ( k , i ) = H j T ( k , i ) X ( k , i ) .                                                            ( 41 )
Figure 00000063
X ( k , i ) = [ X 1 ( k , i ) , X 2 ( k , i ) , X M ( k , i ) ] T .                                   ( 42 )
Figure 00000064
H j ( k , i ) = [ H j .1 ( k , i ) , H j .2 ( k , i ) , H j . M ( k , i ) ] T .                        ( 43 )
Figure 00000065
Соответствующий требуемый канал микширования с понижением Yj(k, i) может быть получен из (39), используя обобщенную модель сигнала (38).
Элементы многоканальной матрицы расширения Hj(k, i) могут быть получены решением соответствующего уравнения Винера-Хопфа
E { X ( k , i ) X H ( k , i ) } H j ( k , i ) = E { X ( k , i ) Y ( k , i ) } .                          ( 44 )
Figure 00000066
где H обозначает Эрмитово сопряжение операнда.
Необходимо отметить, что описанный выше способ можно рассматривать как обобщенный подавитель взаимной связи микрофонов, основанный на пространственной информации о звуке, если число громкоговорителей K в многоканальной модели сигнала (38) выбрано большое. В этом случае положение громкоговорителя можно непосредственно рассматривать в качестве соответствующего DOA прямого звука. Используя изобретение, может быть создан гибкий подавитель взаимной связи с использованием одного или более фильтров подавления.
8. Предварительная обработка микрофонных сигналов
До сих пор мы рассмотрели только случай, когда сигналы Xj(k, i) представляют выходные микрофонные сигналы. Вместо этого, предложенная новая концепция или способ может также быть альтернативно применен к предварительно обработанным микрофонным сигналам. Соответствующий подход иллюстрирован на фиг.5.
Предварительная обработка может быть осуществлена применением инвариантного во времени формирования луча (beamforming) (см., например, [8]), основанного на оригинальных входных микрофонных сигналах. В результате предварительной обработки некоторая часть нежеланной утечки сигнала к определенным микрофонным сигналам может быть смягчена, прежде, чем применить фильтры расширения.
Фильтры расширения, основанные на предварительно обработанных входных каналах, могут быть получены аналогично фильтрам, обсужденным выше путем замены Xj(k, i) на выходные сигналы стадии предварительной обработки Xj,mod(k, i).
9. Устройство согласно фиг.3
На фиг.3 показан блок-схема устройства 300 для того, чтобы сформировать улучшенный сигнал микширования с понижением на основе многоканального микрофонного сигнала, согласно другому решению изобретения.
Устройство 300 включает два микрофона 306, 308, которые обеспечивают двухканальный микрофонный сигнал 310, включая сигнал первого канала, который представлен в частотно временной области X1(k, i), и сигнал второго канала, который представлен в частотно временной области X2(k, i). Устройство 300 также включает пространственный анализатор 320, который получает двухканальный микрофонный сигнал 310 и обеспечивает на его основе пространственные параметры звука 322. Пространственный анализатор 320 может иметь функциональность пространственного анализатора 120 или анализатора сигнала 220 так, что пространственные параметры звука 322 могут быть эквивалентными пространственным параметрам звука 122 или составной информации об энергии 122а и информации о направлении 122b. Устройство 300 также включает управляющее устройство 316, которое получает пространственные параметры звука 322 и которое также получает двухканальный микрофонный сигнал 310. Блок управления 316 также получает многоканальную модель сигнала 318 или параметры этой многоканальной модели сигнала 318. Блок управления 316 обеспечивает параметры фильтра расширения 332 для устройства улучшенного микширования с понижением 340. Блок управления 316 может, например, иметь функциональность калькулятора фильтра 130 или калькулятора фильтра 230, так, что параметры фильтра расширения 332 могут быть эквивалентными параметрам фильтра расширения 132 или параметрам фильтра расширения 232. Устройство улучшенного микширования с понижением 340 получает двухканальный микрофонный сигнал 310 и также параметры фильтра расширения 332 и обеспечивает на их основе, (фактический) многоканальный сигнал улучшенного микширования с понижением 312. Первый сигнал канала улучшенного микширования с понижением 312, представлен в частотно временной области Y 1 ( k , i )
Figure 00000067
и второй сигнал канала улучшенного микширования с понижением 312, представлен в частотно временной области Y 2 ( k , i )
Figure 00000068
. Нужно отметить, что устройство улучшенного микширования с понижением 340 может иметь функциональность фильтра 140 или поставщика двухканального аудио сигнала 240.
10. Устройство согласно фиг.5
На фиг.5 показана блок-схема устройства 500 для того, чтобы сформировать улучшенный сигнал микширования с понижением на основе многоканального микрофонного сигнала. Устройство 500 на фиг.5 очень похоже на устройство 300 на фиг.3, так что идентичные средства и сигналы определяются одинаковыми цифрами, и не будут объясняться снова. Однако, в дополнение к функциональным блокам устройства 300, устройство 500 также включает блок предварительной обработки 580, который получает многоканальный микрофонный сигнал 310 и обеспечивает на его основе, предварительно обработанную версию 310' многоканального микрофонного сигнала. В этом случае устройство улучшенного микширования с понижением 340 получает обработанную версию 310' многоканального микрофонного сигнала 210, а не сам многоканальный микрофонный сигнал 310. Кроме того, блок управления 316 получает обработанную версию 310' многоканального микрофонного сигнала, а не сам многоканальный микрофонный сигнал 310. Однако, функциональность устройства улучшенного микширования с понижением 340 и блока управления 316 существенно не затронута этой модификацией.
11. Распределение сигналов канала на сигналы микширования с понижением согласно фиг.4.
Как обсуждено выше, моделирование микширования с понижением, которое используется, чтобы получить требуемые каналы микширования с понижением Y1, Y2, или их некоторые статистические особенности, включает отображение прямого звукового компонента (например,
Figure 00000069
и диффузных звуковых компонентов (например, N ˜ 1 ( k , i ) )
Figure 00000070
на сигналы канала (например, L(k, i), R(k, i), С(k, i), Ls(k, i), Rs(k, i) или Zl(k, i)) и отображение сигналов канала громкоговорителя на сигналы канала микширования с понижением.
Относительно первого отображения прямого звукового компонента и диффузного звукового компонента на сигналы канала громкоговорителя, может использоваться отображение, зависящее от направления, которое описывается коэффициентами передачи gl. Однако, относительно отображения сигналов канала громкоговорителя на сигналы канала микширования с понижением могут использоваться установленные предположения, которые могут быть описаны матрицей микширования с понижением. Как иллюстрировано на фиг.4, можно предположить, что только сигналы C, L и Ls канала громкоговорителя должны создавать вклад в сигнал первого канала микширования с понижением Y1, и что только сигналы C, R и Rs канала громкоговорителя должны создавать вклад в сигнал второго канала микширования с понижением Y2.
Это иллюстрировано на фиг.4.
12. Поток обработки сигнала согласно фиг.6
Далее будет описан поток обработки сигнала в решении согласно изобретению, в соответствии с фиг.6. На фиг.6 показано схематическое представление потока обработки сигнала для того, чтобы получить параметры фильтра расширения Н из многоканального микрофонного сигнала, например, с использованием частотно-временных представлений X1 и X2 .
Поток обработки 600 включает, например, в качестве первого шага, пространственный анализ 610, который может иметь функциональность вычисления пространственного параметра звука. Соответственно, информация о мощности прямого звука (или информация об энергии прямого звука) Е{SS}, информация о мощности диффузного звука (или информация об энергии диффузного звука) Е{NN} и информация о направлении α, могут быть получены на основе многоканальных микрофонных сигналов. Детали относительно происхождения информации о мощности прямого звука (или информации об энергии прямого звука) информации о мощности диффузного звука (или информации об энергии диффузного звука) и информации о направлении были обсуждены выше.
Поток обработки 600 также включает отображение коэффициентов передачи 620, где информация о направлении отображается на множество коэффициентов передачи (например, коэффициентов передачи от g1 до g5). Отображение коэффициентов передачи 620, может, например, быть выполнено с использованием закона многоканального амплитудного панорамирования, как описано выше.
Поток обработки 600 также включает вычисление параметра фильтра 630, где параметры фильтра расширения Н получены из информации о мощности прямого звука, информации о мощности диффузного звука, информации о направлении и коэффициентов передачи. Вычисление параметра фильтра 630 может дополнительно использовать одно или более описание постоянных параметров, например, желаемое отображение каналов громкоговорителя сигналы канала микширования с понижением. Кроме того, могут быть применены предопределенные параметры, описывающие отображение диффузного звукового компонента на сигналы громкоговорителя.
Вычисление параметра фильтра включает, например, w-отображение 632. В w-отображении, которое может быть выполнено в соответствии с уравнениями 26 - 29, может быть получены величины от w1 до w4, которые могут служить промежуточными параметрами. Вычисление параметра фильтра 630 далее включает Н-отображение 634, которое может, например, быть выполнено согласно уравнению 25. В Н-отображении 634, могут быть определены параметры фильтра расширения Н. Для H-отображения может использоваться желаемая величина взаимной корреляции E { X 1 , Y 1 }
Figure 00000071
, E { X 2 Y 2 }
Figure 00000072
между каналами микрофонного сигнала и каналами сигнала микширования с понижением. Эти желаемые величины взаимной корреляции могут быть получены на основе информации о мощности прямого звука Е{SS} и Е{NN}, как видно из уравнений (25), которые идентичны (24).
В завершение, представленный на фиг.6 поток обработки может быть применен, чтобы получить параметры фильтра расширения Н из многоканального микрофонного сигнала, представленного канальными сигналами X1, X2.
13. Поток обработки сигнала согласно фиг.7
На фиг.7 показано схематическое представление потока обработки сигнала 700, согласно другому решению изобретения. Поток обработки сигнала 700 может использоваться, чтобы получить параметры фильтра расширения Н из многоканального микрофонного сигнала.
Поток обработки сигнала 700 включает пространственный анализ 710, который может быть идентичным пространственному анализатору 610. Кроме того, поток обработки сигнала 700 включает отображение коэффициентов передачи 720, которое может быть идентичным отображению коэффициентов передачи 620.
Поток обработки сигнала 700 также включает вычисление параметра фильтра 730. Вычисление параметра фильтра 730 может включать w-отображение 732, которое в некоторых случаях может быть идентичным w-отображению 632. Однако, если потребуется, могут использоваться различные w-отображения.
Вычисление параметра фильтра 730 также включает вычисление желаемой взаимной корреляции 734, в ходе которого вычисляются желаемая взаимная корреляция между каналами многоканального микрофонного сигнала и каналами (желаемого) сигнала микширования с понижением. Это вычисление может, например, быть выполнено в соответствии с уравнением 35. Нужно отметить, что модель желаемого сигнала микширования с понижением, может быть применена в вычислении желаемой взаимной корреляции 734. Например, предположения на том, как прямой звуковой компонент многоканального микрофонного сигнала должен быть отображен на множество сигналов громкоговорителя в зависимости от информации о направлении, могут быть применены в вычислении желаемой взаимной корреляции 734. Кроме того, предположения о том, как диффузные звуковые компоненты многоканального микрофонного сигнала должны быть отражены в сигналах громкоговорителя, могут также быть использованы при вычислении желаемой взаимной корреляции 734. Кроме того, предположения относительно желаемого отображения множества каналов громкоговорителя на сигнал микшированный с понижением могут также быть использованы в вычислении желаемой взаимной корреляции 734. Соответственно, желаемая взаимная корреляция E { X i Y j }
Figure 00000073
между каналами микрофонного сигнала и каналами (желаемого) сигнала микширования с понижением может быть получена на основе информации о мощности прямого звука, информации о мощности диффузного звука, информации о направлении и зависимых от направления коэффициентов передачи (где последняя информация может быть объединена, чтобы получить промежуточные величины w).
Вычисление параметра фильтра 730 также включает решение уравнения Винера-Хопфа 736, которое может, например, быть выполнено в соответствии с уравнениями 33 и 34. С этой целью уравнение Винера-Хопфа может быть настроено в зависимости от информации о мощности прямого звука, информации о мощности диффузного звука и желаемой взаимной корреляции между каналами многоканального микрофонного сигнала, и каналами (желаемого) сигнала микширования с понижением. В качестве решения уравнения Винера-Хопфа (например, уравнения 32) получены параметры фильтра расширения Н.
Суммируя вышеупомянутое, в некоторых решениях определение параметров фильтра расширения H может включить отдельные шаги вычисления желаемой взаимной корреляции, настройки и решения уравнения Винера-Хопфа (шаг 736).
14. Выводы
Суммируя сказанное, решения согласно изобретению создают расширенную концепцию и способ вычисления на базе входных микрофонных сигналов желаемого сигнала микширования с понижением параметрических пространственных аудио кодеров. Важный пример дан преобразованием микрофонного стерео сигнала в микширование с понижением MPEG окружения, соответствующим вычислению MPS параметров. Улучшенный сигнал микширования с понижением приводит к значительно улучшенному пространственному качеству звука и свойству локализации после MPS декодирования, по сравнению с существующим в настоящее время решением, предложенным в [2]. Простое решение согласно изобретению включает следующие шаги 1-4:
1. получение микрофонных входных сигналов;
2. вычисление пространственных параметров звука;
3. определение фильтров расширения микширования с понижением, основанных на модели желаемых каналов микширования с понижением, многоканальной модели сигнала громкоговорителя для выходного сигнала декодера и пространственных параметрах звука; и
4. применение фильтров расширения ко входным микрофонным сигналам, чтобы получить улучшенный сигнал микширования с понижением для использования с пространственными аудио микрофонами.
Другое простое решение согласно изобретению создает устройство, способ или компьютерную программу для того, чтобы сформировать сигнал микширования с понижением, устройство, способ или компьютерную программу, включающую калькулятор фильтра для того, чтобы вычислить параметры фильтра расширения, основанные на информации о микрофонном сигнале, или основанные на информации о заданных установках воспроизведения, и устройство, способ или компьютерную программу, включающую устройство фильтрации (или шаг фильтрации), для того чтобы фильтровать микрофонные сигналы, используя параметры фильтра расширения, чтобы получить улучшенный сигнал микширования с понижением.
Это устройство, способ или компьютерная программа могут быть улучшены, если калькулятор фильтра выполнен с возможностью вычислить, параметры фильтра расширения, основанные на модели желаемых каналов микширования с понижением, многоканальной модели сигнала громкоговорителя для выходного сигнала декодера или пространственных параметров звука.
15. Альтернативы применения
Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствуют шагу способа или особенности шага способа. Аналогично, аспекты, описанные в контексте шага способа также, представляют описание соответствующего блока или пункта или особенности соответствующего устройства. Некоторые или все шаги способа могут быть выполнены (или использованы) аппаратурными средствами, как, например, микропроцессор, программируемый компьютер или электронная схема. В некоторых решениях один или более самых важных шагов способа могут быть выполнены такими устройствами.
Полученный согласно изобретению закодированный аудио сигнал может быть сохранен на цифровом носителе данных или может быть передан в среде передачи, такой как беспроводная среда передачи или проводная среда передачи, такая как Интернет.
В зависимости от определенных требований внедрения решения изобретения могут быть осуществлены в виде аппаратурных средств или в виде программного обеспечения. Внедрение может быть выполнено с использованием цифрового носителя данных, например, дискеты, DVD, Blue-Ray, CD, ROM, PROM, EPROM, EEPROM или FLASH памяти, имеющих читаемые в электронном виде записанные на них управляющие сигналы, которые выполняются (или могут выполняться) программируемой компьютерной системой, таким образом, что выполняется соответствующий способ. Поэтому, цифровой носитель данных может быть читаемым с использованием компьютера.
Некоторые решения согласно изобретению включают носитель информации, имеющий в электронном виде удобочитаемые управляющие сигналы, которые могут быть выполнены программируемой компьютерной системой, так, что выполняется один из описанных здесь способов.
Вообще, решения данного изобретения могут быть осуществлены в виде компьютерной программы с кодом программы, кодом программы, служащим для того, чтобы выполнить один из способов, когда компьютерная программа выполняется на компьютере. Код программы может, например, быть сохранен на машиночитаемом носителе.
Другие решения включают компьютерную программу для того, чтобы выполнить один из описанных здесь способов, сохраненных на машиночитаемом носителе.
Другими словами, решением изобретенного способа является компьютерная программа, имеющая код программы для того, чтобы выполнить один из описанных здесь способов при выполнении компьютерной программы на компьютере.
Поэтому дальнейшим решением изобретенных способов является носитель информации (или цифровой носитель данных или удобочитаемая компьютером среда), включающая записанную на ней компьютерную программу для того, чтобы выполнить один из описанных здесь способов. Носитель информации, цифровой носитель данных или записанная среда материальны и/или не являются промежуточными.
Дальнейшим решением изобретенного способа является поток данных или последовательность сигналов, представляющих компьютерную программу для того, чтобы выполнить один из описанных здесь способов. Поток данных или последовательность сигналов могут быть выполнены с возможностью, например, быть переданными через линию передачи данных, например через Интернет.
Дальнейшее решение включает средство обработки, например компьютер или программируемое логическое устройство, выполненное с возможностью выполнить один из описанных здесь способов.
Дальнейшее решение включает компьютер с установленной на нем компьютерной программой для того, чтобы выполнить один из описанных здесь способов.
Дальнейшее решение согласно изобретению включает устройство или систему, выполненную с возможностью передать к приемнику (например, в электронном виде или оптически) компьютерную программу для того, чтобы выполнить один из описанных здесь способов. Приемник может быть, например, компьютером, мобильным устройством, устройством памяти и т.п. Устройство или система могут, например, включать файловый сервер для того, чтобы передать компьютерную программу приемнику.
В некоторых решениях может использоваться программируемое логическое устройство (например, программируемая логическая интегральная схема), чтобы выполнить некоторые или все описанные здесь способы. В некоторых решениях может использоваться программируемая логическая интегральная схема вместе с микропроцессором, чтобы выполнить один из описанных здесь способов. Вообще, способы предпочтительно выполняются аппаратурными средствами.
Вышеупомянутые описанные здесь решения просто иллюстрируют принципы данного изобретения. Подразумевается, что модификации и изменения, описанных здесь конфигураций и деталей, будут очевидны для людей квалифицированных в технике. Поэтому, намерением является ограничиться только областью формулы изобретения, а не определенными деталями, представленными посредством описания и объяснения представленных здесь решений.
Использованная литература
[1] ISO/IEC 23003-1:2007. Information technology - MPEG Audio technologies - Part 1: MPEG Surround. International Standards Organization, Geneva, Switzerland, 2007.
[2] С. Faller. Microphone front-ends for spatial audio coders. In 125th AES Convention, Paper 7508, San Francisco, Oct. 2008.
[3] M.A. Gerzon. Periphony: Width-Height Sound Reproduction. J. Aud. Eng. Soc., 21(l):2-10, 1973.
[4] D. Griesinger. Stereo and surround panning in practice. In Preprint 112th Conv. Aud. Eng. Soc., May 2002.
[5] S. Haykin. Adaptive Filter Theory (third edition). Prentice Hall, 1996.
[6] J. Herre, K. Kj"orling, J. Breebaart, C. Faller, S. Disch, H. Purnhagen, J. Koppens, J. Hilpert, J. R"od'en, W. Oomen, K. Linzmeier, and K.S. Chong. Mpeg surround - the iso/mpeg standard for efficient and compatible multi-channel audio coding. In Preprint 122th Conv. Aud. Eng. Soc., May 2007.
[7] V. Pulkki. Virtual sound source positioning using Vector Base Amplitude Panning. J. Audio Eng. Soc., 45:456-466, June 1997.
[8] В.D. Van Veen and К.М. Buckley. Beamforming: A versatile approach to spatial filtering. IEEE ASSP Magazine, 5(2):4-24, April 1988.

Claims (18)

1. Устройство (100; 200; 300; 500) для формирования улучшенного сигнала микширования с понижением (112; 212; 312) на основе многоканального микрофонного сигнала (110; 210; 310), включающее:
пространственный анализатор (120; 220; 320), выполненный с возможностью вычислить на основе многоканального микрофонного сигнала ряд пространственных параметров звука (Е{NN}, E{SS}, а, α), включающих информацию о направлении (а, α), описывающую направления прибытия прямого звука, информацию о мощности прямого звука (Е{SS}) и информацию о мощности диффузного звука (Е{NN});
калькулятор фильтра (130; 230; 316) для вычисления параметров фильтра расширения (132; 232; 332) в зависимости от информации о направлении (а, α), описывающей направление прибытия прямого звука, в зависимости от информации о мощности прямого звука (E{SS}) и в зависимости от информации о мощности диффузного звука (E{NN}); и
фильтр (140; 240; 340) для того, чтобы фильтровать микрофонный сигнал (110; 210; 310), или сигнал, сформированный из микрофонного сигнала с использованием параметров фильтра расширения (132; 232; 332), чтобы получить улучшенный сигнал микширования с расширением (112; 212; 312),
где калькулятор фильтра выполнен с возможностью вычислить параметры фильтра расширения (H1, H2; H1,1 H1,2 H2.1, Н2,2) в зависимости от зависящих от направления коэффициентов передачи (g1, g2, g3, g4, g5), которые описывают требуемые вклады компоненты прямого звука (S) многоканального микрофонного сигнала во множество сигналов громкоговорителя (L, R, С, Ls, Rs; Zl) в зависимости от одной или более величин матрицы микширования с понижением (gs; mj,l), которые описывают требуемые вклады множества аудиоканалов (L, R, С, Ls, Rs; Zl) в один или более каналов улучшенного сигнала микширования с понижением.
2. Устройство по п. 1, в котором калькулятор фильтра (130; 230; 316) выполнен с возможностью вычислить параметры фильтра расширения (132; 232; 332; H1, H2, H1.1, H1.2, H2.1, H2.1) таким образом, что улучшенный сигнал микширования с понижением (112; 212; 312; Y 1
Figure 00000074
, Y 2
Figure 00000075
) приближается к желаемому сигналу микширования с понижением,(Y1, Y2).
3. Устройство по п. 1, в котором калькулятор фильтра (130; 230; 316) выполнен с возможностью вычислить желаемые величины взаимной корреляции ( E { X 1 Y 1 }
Figure 00000076
, E { X 2 Y 1 }
Figure 00000077
, E { X 1 , Y 2 }
Figure 00000078
, E { X 2 Y 2 }
Figure 00000079
)
Figure 00000002
между канальными сигналами (Х1, X2) многоканального микрофонного сигнала (110; 210; 310) и желаемые канальные сигналы (Y1, Y2) сигнала микширования с понижением в зависимости от пространственных параметров звука, и
в котором калькулятор фильтра выполнен с возможностью вычислить параметры фильтра расширения (H1, H2; H1.1, Н1.2, H2.1, H2.2) в зависимости от желаемых значений взаимной корреляции.
4. Устройство по п. 3, в котором калькулятор фильтра выполнен с возможностью вычислить желаемые величины взаимной корреляции в зависимости от зависящих от направления коэффициентов передачи (g1, g2, g3, g4, g5), которые описывают желаемые вклады прямого звукового компонента (S) многоканального микрофонного сигнала во множество сигналов громкоговорителя (L, R, С, Ls, Rs; Zl).
5. Устройство согласно п. 4, в котором калькулятор фильтра (130; 230; 316) выполнен с возможностью отобразить информацию о направлении (а, α) на ряд зависимых от направления коэффициентов передачи (g1, g2, g3, g4, g5).
6. Устройство по п. 3, в котором калькулятор фильтра (130; 230; 316) выполнен с возможностью использовать информацию о мощности прямого звука (Е{SS}) и информацию о мощности диффузного звука (Е{NN}) для вычисления желаемых величин взаимной корреляции ( E { X 1 Y 1 }
Figure 00000080
, E { X 2 Y 1 }
Figure 00000081
, E { X 1 , Y 2 }
Figure 00000082
, E { X 2 Y 2 } )
Figure 00000083
.
7. Устройство по п. 6, в котором калькулятор фильтра (130; 230; 316) выполнен с возможностью использовать весовые коэффициенты для информации о мощности прямого звука (Е{SS}) в зависимости от информации о направлении (а, α) и применить предопределенную надбавку, которая независима от информации о направлении, к информации о мощности диффузного звука (Е{NN}), чтобы вычислить желаемые величины взаимной корреляции ( E { X 1 Y 1 }
Figure 00000084
, E { X 2 Y 1 }
Figure 00000085
, E { X 1 , Y 2 }
Figure 00000086
, E { X 2 Y 2 } )
Figure 00000087
.
8. Устройство согласно п. 1, в котором калькулятор фильтра (130; 230; 316) выполнен с возможностью вычислить коэффициенты фильтра H1, Н2 согласно выражению
H 1 = w 1 E { S S } + w 3 E { N N } E { S S } + E { N N } H 2 = w 2 E { S S } + w 4 E { N N } a 2 E { S S } + E { N N } .      
Figure 00000088

где Е{SS} - информация о мощности прямого звука,
где Е{NN} - информация о мощности диффузного звука,
где w1 и w2 - коэффициенты, которые зависят от информации о направлении (а, α), и
где w3 и w4 - коэффициенты, определенные коэффициентами передачи диффузного звука (h1, h2, h3, h4, h5); и
где фильтр (140; 240; 340) выполнен с возможностью определить первый канальный сигнал Y 1 ( k , i )
Figure 00000089
и второй канальный сигнал Y 2 ( k , i )
Figure 00000090
улучшенного сигнала микширования с понижением (112; 212; 312) в зависимости от первого канального сигнала X1(k, i) и второго канального сигнала Х2(k, i) многоканального микрофонного сигнала в соответствии с выражением
Y 1 ( k , i ) = H 1 ( k , i ) X 1 ( k , i ) Y 2 ( k , i ) = H 2 ( k , i ) X 2 ( k , i )
Figure 00000091
9. Устройство по п. 1, в котором калькулятор фильтра (130; 230; 316) выполнен с возможностью вычислить параметры фильтра (H1, H1.2, H2.1 H2.2) в соответствии с выражением
[ H 1.1 H 1.2 ] = 1 d [     E { X 2 X 2 } E { X 1 X 2 } E { X 2 X 1 }     E { X 1 X 1 } ] [ E { X 1 Y 1 } E { X 2 Y 1 } ] [ H 2.1 H 2.2 ] = 1 d [     E { X 2 X 2 } E { X 1 X 2 } E { X 2 X 1 }     E { X 1 X 1 } ] [ E { X 1 Y 2 } E { X 2 Y 2 } ]
Figure 00000092

где
d = E { X 1 X 1 } E { X 2 X 2 } E { X 1 X 2 } E { X 2 X 1 }      
Figure 00000093

X1 обозначает первый канальный сигнал многоканального микрофонного сигнала,
X2 обозначает второй канальный сигнал многоканального микрофонного сигнала,
Е{.} обозначает операцию усреднения на коротком временном промежутке,
∗ обозначает операцию комплексного сопряжения,
E { X 1 Y 1 }
Figure 00000094
, E { X 2 Y 1 }
Figure 00000095
, E { X 1 Y 2 }
Figure 00000096
и E { X 2 Y 2 }
Figure 00000097
обозначают величины взаимной корреляции между канальными сигналами X1, X2 многоканального микрофонного сигнала и желаемыми канальными сигналами Y1, Y2 улучшенного сигнала микшированного с понижением.
10. Устройство по п. 1, в котором калькулятор фильтра (130; 230; 316) выполнен с возможностью вычислить параметры фильтра расширения от Hj.l(k.i) до Hj,M(k,i) таким образом, что канальные сигналы улучшенного сигнала микширования с понижением (112; 212; 312) получены путем фильтрации канальных сигналов (X1, Х2) многоканального микрофонного сигнала в соответствии с аппроксимацией параметров фильтра расширения с использованием статистической меры подобия желаемых канальных сигналов Yj(k, i), определенных как
Y j ( k , i ) = l = o K 1 m j , l Z l ( k , i ) .  
Figure 00000098

где Z l ( k , i ) = g l ( k , i ) S ˜ ( k , i ) + h l ( k , i ) N ˜ 1 ( k , i )
Figure 00000099
,
где g1 - коэффициенты передачи, которые зависят от информации о направлении (а, α) и которые представляют желаемые вклады прямого звукового компонента ( S ˜ )
Figure 00000100
многоканального микрофонного сигнала (110; 210; 310) во множество сигналов громкоговорителя (Zl);
где hl предопределенные величины, описывающие требуемые вклады диффузного звукового компонента ( N ˜ )
Figure 00000101
многоканального микрофонного сигнала (110; 210; 310) во множество сигналов громкоговорителя.
11. Устройство по одному из пп. 1-10, в котором калькулятор фильтра (130; 230; 316) выполнен с возможностью решить уравнение Винера-Хопфа, чтобы получить параметры фильтра расширения (132; 232; 332; H1, H2, H1,1,H1,2, H2,1, H2,2),
где уравнение Винера-Хопфа описывает отношения между величинами корреляции E { X 1 X 1 }
Figure 00000102
, E { X 1 X 2 }
Figure 00000103
, E { X 2 X 1 }
Figure 00000104
,     E { X 2 X 2 }
Figure 00000105
, которые описывают отношения между различными парами каналов многоканального микрофонного сигнала, параметрами фильтра расширения (H1,1, H1,2, H2,1, H2,2) и желаемыми величинами взаимной корреляции,
Figure 00000002
( E { X 1 Y 1 }
Figure 00000106
, E { X 2 Y 1 }
Figure 00000107
, E { X 1 Y 2 }
Figure 00000108
, E { X 2 Y 2 } )
Figure 00000109
Figure 00000002
между канальными сигналами (X1, X2) многоканального микрофонного сигнала (110; 210; 310) и желаемыми канальными сигналами (Y1, Y2) сигнала микширования с понижением.
12. Устройство по п. 1, в котором калькулятор фильтра (130; 230; 316) выполнен с возможностью вычислить параметры фильтра расширения (132; 232; 332) в зависимости от модели желаемых каналов микширования с понижением.
13. Устройство по п. 1, в котором калькулятор фильтра (130; 230; 316) выполнен с возможностью выборочно выполнить одноканальное фильтрование, где первый канал ( Y 1 )
Figure 00000110
улучшенного сигнала микширования с понижением (112; 212; 312) получен фильтрованием первого канала (Х1) многоканального микрофонного сигнала (110; 210; 310) и где второй канал ( Y 2 )
Figure 00000111
улучшенного сигнала микширования с понижением получен фильтрованием второго канала (X2) многоканального микрофонного сигнала, избегая взаимного влияния первого канала многоканального микрофонного сигнала на второй канал улучшенного сигнала микширования с понижением и второго канала многоканального микрофонного сигнала на первый канал улучшенного сигнала микширования с понижением,
или двухканальное фильтрование, где первый канал ( Y 1 )
Figure 00000112
улучшенного сигнала микширования с понижением получен путем фильтрации первого и второго каналов (X1, Х2) многоканального микрофонного сигнала и где второй канал ( Y 2 )
Figure 00000113
улучшенного сигнала микширования с понижением получен путем фильтрации первого и второго каналов (X1, X2) многоканального микрофонного сигнала,
в зависимости от величины корреляции, описывающей корреляцию между первым каналом (X1) многоканального микрофонного сигнала и вторым каналом (X2) многоканального микрофонного сигнала.
14. Способ формирования улучшенного сигнала микширования с понижением на основе многоканального микрофонного сигнала, включающий:
вычисление ряда пространственных параметров звука, включающих информацию о направлении, описывающую направление прибытия прямого звука, информацию о мощности прямого звука и информацию о мощности диффузного звука на основе многоканального микрофонного сигнала;
вычисление параметров фильтра расширения в зависимости от информации о направлении, описывающей направление прибытия прямого звука, в зависимости от информации о мощности прямого звука и в зависимости от информации о мощности диффузного звука; и
фильтрование микрофонного сигнала или сигнала, полученного из микрофонного, с использованием параметров фильтра расширения, чтобы получить улучшенный сигнал микширования с понижением,
где параметры фильтра расширения (H1, Н2 H1.1, H1.2, H2.1, Н2.2) вычисляются в зависимости от зависящих от направления коэффициентов передачи (g1, g2, g3, g4, g5), которые описывают требуемые вклады компоненты прямого звука (S) многоканального микрофонного сигнала во множество сигналов громкоговорителя (L, R, С, Ls, Rs; Zl) и в зависимости от одного или более элементов матрицы микширования с понижением (gs; mj.l), которые описывают желаемые вклады множества аудиоканалов (L, R, С, Ls, Rs; Zl) в один или более канал улучшенного сигнала микширования с понижением.
15. Устройство (100; 200; 300; 500) для сформирования улучшенного сигнала микширования с понижением (112; 212; 312) на основе многоканального микрофонного сигнала (110; 210; 310), включающее:
пространственный анализатор (120; 220; 320), выполненный с возможностью вычислить на основе многоканального микрофонного сигнала ряд пространственных параметров звука (Е{NN}, E{SS}, а, α), включающих информацию о направлении (а, α), описывающую направления прибытия прямого звука, информацию о мощности прямого звука (Е{SS}) и информацию о мощности диффузного звука (Е{NN});
калькулятор фильтра (130; 230; 316) для того, чтобы вычислить параметры фильтра расширения (132; 232; 332) в зависимости от информации о направлении (а, α), описывающей направление прибытия прямого звука, в зависимости от информации о мощности прямого звука (E{SS}) и в зависимости от информации о мощности диффузного звука (E{NN∗}); и
фильтр (140; 240; 340) для того, чтобы фильтровать микрофонный сигнал (110; 210; 310) или сигнал, сформированный из микрофонного сигнала с использованием параметров фильтра расширения (132; 232; 332), чтобы получить улучшенный сигнал микширования с расширением (112; 212; 312), где калькулятор фильтра выполнен с возможностью выполнить
одноканальное фильтрование, где первый канал ( Y 1 )
Figure 00000114
  
Figure 00000115
улучшенного сигнала микширования с понижением (112; 212; 312) получен фильтрованием первого капала (X1) многоканального микрофонного сигнала (110; 210; 310) и где второй канал ( Y 2 )
Figure 00000116
улучшенного сигнала микширования с понижением получен фильтрованием второго канала (Х2) многоканального микрофонного сигнала, избегая взаимного влияния первого канала многоканального микрофонного сигнала на второй канал улучшенного сигнала микширования с понижением и второго канала многоканального микрофонного сигнала на первый канал улучшенного сигнала микширования с понижением,
или двухканальное фильтрование, где первый канал ( Y 1 )
Figure 00000117
улучшенного сигнала микширования с понижением получен путем фильтрации первого и второго каналов (X1, Х2) многоканального микрофонного сигнала и где второй канал ( Y 2 )
Figure 00000118
улучшенного сигнала микширования с понижением получен путем фильтрации первого и второго каналов (X1, X2) многоканального микрофонного сигнала,
в зависимости от величины корреляции, описывающей корреляцию между первым каналом (X1) многоканального микрофонного сигнала и вторым каналом (X2) многоканального микрофонного сигнала.
16. Способ сформирования улучшенного сигнала микширования с понижением на основе многоканального микрофонного сигнала, включающий:
вычисление ряда пространственных параметров звука, включающих информацию о направлении, описывающую направление прибытия прямого звука, информацию о мощности прямого звука и информацию о мощности диффузного звука на основе многоканального микрофонного сигнала;
вычисление параметров фильтра расширения в зависимости от информации о направлении, описывающей направление прибытия прямого звука, в зависимости от информации о мощности прямого звука и в зависимости от информации о мощности диффузного звука; и
фильтрование микрофонного сигнала или сигнала, полученного из микрофонного, с использованием параметров фильтра расширения, чтобы получить улучшенный сигнал микширования с понижением,
при этом способ включает выборочное выполнение одноканального фильтрования, где первый канал
Figure 00000119
улучшенного сигнала микширования с понижением (112; 212; 312) получен фильтрованием первого канала (X1) многоканального микрофонного сигнала (110; 210; 310) и где второй канал
Figure 00000120
улучшенного сигнала микширования с понижением получен фильтрованием второго канала (Х2) многоканального микрофонного сигнала, избегая взаимного влияния первого канала многоканального микрофонного сигнала на второй канал улучшенного сигнала микширования с понижением и второго канала многоканального микрофонного сигнала на первый канал улучшенного сигнала микширования с понижением,
или двухканальное фильтрование, где первый канал
Figure 00000121
улучшенного сигнала микширования с понижением получен путем фильтрации первого и второго каналов (Х1, Х2) многоканального микрофонного сигнала и где второй канал
Figure 00000122
улучшенного сигнала микширования с понижением получен путем фильтрации первого и второго каналов (X1, Х2) многоканального микрофонного сигнала,
в зависимости от величины корреляции, описывающей корреляцию между первым каналом (X1) многоканального микрофонного сигнала и вторым каналом (Х2) многоканального микрофонного сигнала.
17. Машиночитаемый носитель, содержащий компьютерную программу, предназначенную для осуществления способа по п. 14 при условии ее выполнения на компьютере.
18. Машиночитаемый носитель, содержащий компьютерную программу, предназначенную для осуществления способа по п. 16 при условии ее выполнения на компьютере.
RU2012140890/08A 2010-02-24 2011-02-15 Устройство для формирования улучшенного сигнала микширования с понижением, способ формирования улучшенного сигнала микширования с понижением и компьютерная программа RU2586851C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US30755310P 2010-02-24 2010-02-24
US61/307,553 2010-02-24
PCT/EP2011/052246 WO2011104146A1 (en) 2010-02-24 2011-02-15 Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program

Publications (2)

Publication Number Publication Date
RU2012140890A RU2012140890A (ru) 2014-08-20
RU2586851C2 true RU2586851C2 (ru) 2016-06-10

Family

ID=43652304

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012140890/08A RU2586851C2 (ru) 2010-02-24 2011-02-15 Устройство для формирования улучшенного сигнала микширования с понижением, способ формирования улучшенного сигнала микширования с понижением и компьютерная программа

Country Status (12)

Country Link
US (1) US9357305B2 (ru)
EP (1) EP2539889B1 (ru)
JP (1) JP5508550B2 (ru)
KR (1) KR101410575B1 (ru)
CN (2) CN102859590B (ru)
AU (1) AU2011219918B2 (ru)
BR (1) BR112012021369B1 (ru)
CA (1) CA2790956C (ru)
ES (1) ES2605248T3 (ru)
MX (1) MX2012009785A (ru)
RU (1) RU2586851C2 (ru)
WO (1) WO2011104146A1 (ru)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
RU2014133903A (ru) * 2012-01-19 2016-03-20 Конинклейке Филипс Н.В. Пространственные рендеризация и кодирование аудиосигнала
EP2665208A1 (en) * 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9219460B2 (en) 2014-03-17 2015-12-22 Sonos, Inc. Audio settings based on environment
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
CN103596116B (zh) * 2012-08-15 2015-06-03 华平信息技术股份有限公司 一种视频会议系统中自动调节实现立体声效果的方法
US10136239B1 (en) 2012-09-26 2018-11-20 Foundation For Research And Technology—Hellas (F.O.R.T.H.) Capturing and reproducing spatial sound apparatuses, methods, and systems
US20160210957A1 (en) 2015-01-16 2016-07-21 Foundation For Research And Technology - Hellas (Forth) Foreground Signal Suppression Apparatuses, Methods, and Systems
US10149048B1 (en) 2012-09-26 2018-12-04 Foundation for Research and Technology—Hellas (F.O.R.T.H.) Institute of Computer Science (I.C.S.) Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems
US9549253B2 (en) * 2012-09-26 2017-01-17 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Sound source localization and isolation apparatuses, methods and systems
US10175335B1 (en) 2012-09-26 2019-01-08 Foundation For Research And Technology-Hellas (Forth) Direction of arrival (DOA) estimation apparatuses, methods, and systems
US9955277B1 (en) 2012-09-26 2018-04-24 Foundation For Research And Technology-Hellas (F.O.R.T.H.) Institute Of Computer Science (I.C.S.) Spatial sound characterization apparatuses, methods and systems
US9554203B1 (en) 2012-09-26 2017-01-24 Foundation for Research and Technolgy—Hellas (FORTH) Institute of Computer Science (ICS) Sound source characterization apparatuses, methods and systems
SG11201507066PA (en) 2013-03-05 2015-10-29 Fraunhofer Ges Forschung Apparatus and method for multichannel direct-ambient decomposition for audio signal processing
WO2014168618A1 (en) * 2013-04-11 2014-10-16 Nuance Communications, Inc. System for automatic speech recognition and audio entertainment
CN105594227B (zh) 2013-07-30 2018-01-12 Dts(英属维尔京群岛)有限公司 利用恒定功率成对平移的矩阵解码器
ES2710774T3 (es) * 2013-11-27 2019-04-26 Dts Inc Mezcla de matriz basada en multipletes para audio de múltiples canales de alta cantidad de canales
EP2884491A1 (en) * 2013-12-11 2015-06-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Extraction of reverberant sound using microphone arrays
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
EP2942982A1 (en) * 2014-05-05 2015-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. System, apparatus and method for consistent acoustic scene reproduction based on informed spatial filtering
JP6513703B2 (ja) 2014-05-13 2019-05-15 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 辺フェージング振幅パンニングのための装置および方法
US9952825B2 (en) 2014-09-09 2018-04-24 Sonos, Inc. Audio processing algorithms
EP4243450B1 (en) * 2014-09-09 2024-08-07 Sonos, Inc. Method for transmitting a determined audio processing algorithm to a playback device, corresponding playback device, system and computer readable storage medium
DE102015203855B3 (de) * 2015-03-04 2016-09-01 Carl Von Ossietzky Universität Oldenburg Vorrichtung und Verfahren zum Ansteuern des Dynamikkompressors und Verfahren zum Ermitteln von Verstärkungswerten für einen Dynamikkompressor
JP6434165B2 (ja) * 2015-03-27 2018-12-05 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 前面ラウドスピーカによって個別の三次元音響を達成する、車内再生のためのステレオ信号を処理する装置および方法
GB2540175A (en) * 2015-07-08 2017-01-11 Nokia Technologies Oy Spatial audio processing apparatus
US9693165B2 (en) 2015-09-17 2017-06-27 Sonos, Inc. Validation of audio calibration using multi-dimensional motion check
EP3351015B1 (en) 2015-09-17 2019-04-17 Sonos, Inc. Facilitating calibration of an audio playback device
US11432095B1 (en) * 2019-05-29 2022-08-30 Apple Inc. Placement of virtual speakers based on room layout
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
US10003899B2 (en) 2016-01-25 2018-06-19 Sonos, Inc. Calibration with particular locations
US11106423B2 (en) 2016-01-25 2021-08-31 Sonos, Inc. Evaluating calibration of a playback device
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
JP6480644B1 (ja) 2016-03-23 2019-03-13 グーグル エルエルシー マルチチャネル音声認識のための適応的オーディオ強化
US9864574B2 (en) 2016-04-01 2018-01-09 Sonos, Inc. Playback device calibration based on representation spectral characteristics
US9860662B2 (en) 2016-04-01 2018-01-02 Sonos, Inc. Updating playback device configuration information based on calibration data
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
CN106024001A (zh) * 2016-05-03 2016-10-12 电子科技大学 一种提高麦克风阵列语音增强性能的方法
US11589181B1 (en) * 2016-06-07 2023-02-21 Philip Raymond Schaefer System and method for realistic rotation of stereo or binaural audio
US11032660B2 (en) * 2016-06-07 2021-06-08 Philip Schaefer System and method for realistic rotation of stereo or binaural audio
US9794710B1 (en) 2016-07-15 2017-10-17 Sonos, Inc. Spatial audio correction
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
GB2559765A (en) * 2017-02-17 2018-08-22 Nokia Technologies Oy Two stage audio focus for spatial audio processing
CN106960672B (zh) * 2017-03-30 2020-08-21 国家计算机网络与信息安全管理中心 一种立体声音频的带宽扩展方法与装置
GB201718341D0 (en) 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
CN110047478B (zh) * 2018-01-16 2021-06-08 中国科学院声学研究所 基于空间特征补偿的多通道语音识别声学建模方法及装置
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
US11206484B2 (en) 2018-08-28 2021-12-21 Sonos, Inc. Passive speaker authentication
US10299061B1 (en) 2018-08-28 2019-05-21 Sonos, Inc. Playback device calibration
CN109326296B (zh) * 2018-10-25 2022-03-18 东南大学 一种非自由场条件下的散射声有源控制方法
US10734965B1 (en) 2019-08-12 2020-08-04 Sonos, Inc. Audio calibration of a portable playback device

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5511093A (en) * 1993-06-05 1996-04-23 Robert Bosch Gmbh Method for reducing data in a multi-channel data transmission
RU2109408C1 (ru) * 1992-09-25 1998-04-20 Квэлкомм Инкорпорейтед Сетевой эхоподавитель
RU2180984C2 (ru) * 1995-12-27 2002-03-27 Эрикссон Инк. Измерение сходимости адаптивных фильтров
EP1565036A2 (en) * 2004-02-12 2005-08-17 Agere System Inc. Late reverberation-based synthesis of auditory scenes
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
EP1803325B1 (en) * 2004-10-20 2008-11-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Diffuse sound envelope shaping for binaural cue coding schemes and the like
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002358225A1 (en) * 2001-12-05 2003-06-17 Koninklijke Philips Electronics N.V. Circuit and method for enhancing a stereo signal
EP1881486B1 (en) * 2002-04-22 2009-03-18 Koninklijke Philips Electronics N.V. Decoding apparatus with decorrelator unit
JP4247037B2 (ja) * 2003-01-29 2009-04-02 株式会社東芝 音声信号処理方法と装置及びプログラム
WO2004084577A1 (en) * 2003-03-21 2004-09-30 Technische Universiteit Delft Circular microphone array for multi channel audio recording
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
ATE521143T1 (de) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
KR100588218B1 (ko) * 2005-03-31 2006-06-08 엘지전자 주식회사 모노 보강 스테레오 시스템 및 그 신호 처리 방법
US20090252339A1 (en) * 2005-09-22 2009-10-08 Pioneer Corporation Signal processing device, signal processing method, signal processing program, and computer readable recording medium
WO2007111568A2 (en) * 2006-03-28 2007-10-04 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for a decoder for multi-channel surround sound
PL1999997T3 (pl) * 2006-03-28 2011-09-30 Fraunhofer Ges Forschung Udoskonalony sposób kształtowania sygnału podczas rekonstrukcji wielokanałowego sygnału audio
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
KR100917843B1 (ko) * 2006-09-29 2009-09-18 한국전자통신연구원 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법
CN102892070B (zh) * 2006-10-16 2016-02-24 杜比国际公司 多声道下混对象编码的增强编码和参数表示
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
EP2283483B1 (en) * 2008-05-23 2013-03-13 Koninklijke Philips Electronics N.V. A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
JP5331201B2 (ja) * 2008-06-25 2013-10-30 コーニンクレッカ フィリップス エヌ ヴェ オーディオ処理
US8155714B2 (en) 2008-06-28 2012-04-10 Microsoft Corporation Portable media player having a flip form factor
US8023660B2 (en) * 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
CN102209988B (zh) * 2008-09-11 2014-01-08 弗劳恩霍夫应用研究促进协会 基于麦克风信号来提供空间提示集合的设备、方法以及用于提供双声道音频信号和空间提示集合的设备
IL195613A0 (en) 2008-11-30 2009-09-01 S P F Productions Ltd Compact gear motor assembly
WO2010092568A1 (en) * 2009-02-09 2010-08-19 Waves Audio Ltd. Multiple microphone based directional sound filter
JP5605573B2 (ja) * 2009-02-13 2014-10-15 日本電気株式会社 多チャンネル音響信号処理方法、そのシステム及びプログラム
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2109408C1 (ru) * 1992-09-25 1998-04-20 Квэлкомм Инкорпорейтед Сетевой эхоподавитель
US5511093A (en) * 1993-06-05 1996-04-23 Robert Bosch Gmbh Method for reducing data in a multi-channel data transmission
RU2180984C2 (ru) * 1995-12-27 2002-03-27 Эрикссон Инк. Измерение сходимости адаптивных фильтров
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
EP1565036A2 (en) * 2004-02-12 2005-08-17 Agere System Inc. Late reverberation-based synthesis of auditory scenes
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
EP1803325B1 (en) * 2004-10-20 2008-11-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Diffuse sound envelope shaping for binaural cue coding schemes and the like

Also Published As

Publication number Publication date
US20130216047A1 (en) 2013-08-22
BR112012021369A2 (pt) 2020-10-27
KR101410575B1 (ko) 2014-06-23
KR20120128143A (ko) 2012-11-26
AU2011219918A1 (en) 2012-09-27
WO2011104146A1 (en) 2011-09-01
CN103811010B (zh) 2017-04-12
US9357305B2 (en) 2016-05-31
CN102859590A (zh) 2013-01-02
EP2539889B1 (en) 2016-08-24
MX2012009785A (es) 2012-11-23
JP5508550B2 (ja) 2014-06-04
JP2013520691A (ja) 2013-06-06
CN102859590B (zh) 2015-08-19
ES2605248T3 (es) 2017-03-13
BR112012021369B1 (pt) 2021-11-16
RU2012140890A (ru) 2014-08-20
CA2790956C (en) 2017-01-17
EP2539889A1 (en) 2013-01-02
CA2790956A1 (en) 2011-09-01
AU2011219918B2 (en) 2013-11-28
CN103811010A (zh) 2014-05-21

Similar Documents

Publication Publication Date Title
RU2586851C2 (ru) Устройство для формирования улучшенного сигнала микширования с понижением, способ формирования улучшенного сигнала микширования с понижением и компьютерная программа
RU2493617C2 (ru) Устройство, способ и компьютерная программа для обеспечения набора пространственных указателей на основе сигнала микрофона и устройство для обеспечения двухканального аудиосигнала и набора пространственных указателей
US8023660B2 (en) Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
RU2439719C2 (ru) Устройство и способ для синтезирования выходного сигнала
EP2834813B1 (en) Multi-channel audio encoder and method for encoding a multi-channel audio signal
RU2576476C2 (ru) Декодер аудиосигнала, кодер аудиосигнала, способ формирования представления сигнала повышающего микширования, способ формирования представления сигнала понижающего микширования, компьютерная программа и бистрим, использующий значение общего параметра межобъектной корреляции
RU2509442C2 (ru) Способ и устройство для применения реверберации к многоканальному звуковому сигналу с использованием параметров пространственных меток
KR20110114605A (ko) 다운믹스 오디오 신호를 업믹싱하는 업믹서, 방법 및 컴퓨터 프로그램
JP2017535153A (ja) オーディオ・エンコーダおよびデコーダ
US9591424B2 (en) Generating an output signal by send effect processing
Jansson Stereo coding for the ITU-T G. 719 codec