JP7383685B2 - バイノーラル・ダイアログ向上 - Google Patents
バイノーラル・ダイアログ向上 Download PDFInfo
- Publication number
- JP7383685B2 JP7383685B2 JP2021205176A JP2021205176A JP7383685B2 JP 7383685 B2 JP7383685 B2 JP 7383685B2 JP 2021205176 A JP2021205176 A JP 2021205176A JP 2021205176 A JP2021205176 A JP 2021205176A JP 7383685 B2 JP7383685 B2 JP 7383685B2
- Authority
- JP
- Japan
- Prior art keywords
- presentation
- dialog
- audio signal
- audio
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Description
本願は2016年1月29日に出願された米国仮特許出願第62/288,590号および2016年1月29日に出願された欧州特許出願第16153468.0号の優先権を主張するものである。両出願の内容はここに参照によってその全体において組み込まれる。
本発明は、オーディオ信号処理の分野に関し、特に時に没入的オーディオ・コンテンツと称される立体音響化コンポーネントをもつオーディオ信号について、ダイアログ・コンポーネントの効率的な推定のための方法およびシステムを開示する。
Wightman, Frederic L., and Doris J. Kistler. "Sound localization." Human psychophysics. Springer New York, 1993. 155-192 HRIR/BRIR畳み込み手法にはいくつかの欠点が伴う。その一つは、ヘッドフォン再生のために必要とされるかなりの量の畳み込み処理である。HRIRまたはBRIR畳み込みは、すべての入力オブジェクトまたはチャネルについて別個に適用される必要があり、よって計算量は典型的にはチャネルまたはオブジェクトの数とともに線形に増大する。ヘッドフォンはしばしばバッテリー駆動のポータブル装置との関連で使われるので、高い計算量は、バッテリー寿命をかなり短くしうるので、望ましくない。さらに、たとえば同時にアクティブな100を超えるオブジェクトを含みうるオブジェクト・ベースのオーディオ・コンテンツの導入で、HRIR畳み込みの計算量は、伝統的なチャネル・ベースのコンテンツよりも実質的に高くなることがある。
Breebaart, J., Nater, F., Kohlrausch, A. (2010). Spectral and spatial parameter resolution requirements for parametric, filter-bank-based HRTF processing. J. Audio Eng. Soc., 58 No 3, p.126-140 一般に、次の形の推定器を使うことが提案される。
図4でのデコーダ実施形態では、第一および第二の呈示41、46ならびにダイアログ呈示43はみな(残響のあるまたは無響の)バイノーラル呈示である。よって、(バイノーラル)ダイアログ推定器42――および専用のパラメータ44――はバイノーラル・ダイアログ・コンポーネントを推定し、それが、ブロック45でレベル修正されて第二のオーディオ呈示46に加えられて出力47を形成する。
図5のデコーダ実施形態では、第一および第二の呈示が異なっている。図示した例では、第一の呈示51は非バイノーラル呈示であり(たとえばステレオ2.0またはサラウンド5.1)、一方、第二の呈示56はバイノーラル呈示である。この場合、ダイアログ推定パラメータ54の集合は、バイノーラル・ダイアログ推定器52が、非バイノーラル呈示51からバイノーラル・ダイアログ呈示53を推定することを許容するように構成される。呈示は逆にしてもよいことを注意しておく。その場合、バイノーラル・ダイアログ推定器はたとえばバイノーラル・オーディオ呈示からステレオ・ダイアログ呈示を推定することになる。いずれの場合にも、ダイアログ推定器は、ダイアログ・コンポーネントを抽出し、呈示変換を実行する必要がある。バイノーラル・ダイアログ呈示53はブロック55によってレベル修正され、第二の呈示56に加えられる。
図7~図11は、サイマルキャスト・システム、すなわち一つのオーディオ呈示が一組の変換パラメータと一緒にエンコードされ、デコーダに伝送されるシステムのコンテキストで本発明の実施形態を示している。それらの変換パラメータはデコーダが前記オーディオ呈示を、意図された再生システムに適応した異なる呈示(たとえば、ヘッドフォンのためのバイノーラル呈示として示される)に変換できるようにする。そのようなシステムのさまざまな側面は、ここに参照によって組み込まれる、2015年8月25日に出願された、同時係属中の未公開の米国仮特許出願第62/209,735号において詳細に記述されている。簡単のため、図7~図11はデコーダ側のみを示している。
本明細書を通じて「一つの実施形態」「いくつかの実施形態」または「ある実施形態」への言及は、その実施形態との関連で記載されている特定の特徴、構造または特性が本発明の少なくとも一つの実施形態に含まれることを意味する。よって、「一つの実施形態において」「いくつかの実施形態において」または「ある実施形態において」という句が本明細書を通じた随所に現われることは、必ずしもみなが同じ実施形態を指しているのではないが、指していてもよい。さらに、特定の特徴、構造または特性は、いかなる好適な仕方で組み合わされてもよい。このことは、一つまたは複数の実施形態において、本開示から当業者には明白であろう。
〔態様1〕
一つまたは複数のオーディオ・コンポーネントをもつオーディオ・コンテンツをダイアログ向上するための方法であって、各コンポーネントは空間位置に関連付けられており、当該方法は:
第一のオーディオ再生システムでの再生のために意図されている前記オーディオ・コンポーネントの第一のオーディオ信号呈示を提供し;
第二のオーディオ再生システムでの再生のために意図されている前記オーディオ・コンポーネントの第二のオーディオ信号呈示を提供し;
前記第一のオーディオ信号呈示からのダイアログ・コンポーネントの推定を可能にするよう構成されたダイアログ推定パラメータの集合を受領し;
ダイアログ推定パラメータの前記集合を前記第一のオーディオ信号呈示に適用し、前記ダイアログ・コンポーネントのダイアログ呈示を形成し;
前記ダイアログ呈示を前記第二のオーディオ信号呈示と組み合わせて、前記第二のオーディオ再生システムでの再生のためのダイアログ向上されたオーディオ信号呈示を形成することを含み、
前記第一および第二のオーディオ信号呈示の少なくとも一方はバイノーラル・オーディオ信号呈示である、
方法。
〔態様2〕
前記第一および第二のオーディオ信号呈示がバイノーラル・オーディオ信号呈示である、態様1記載の方法。
〔態様3〕
前記第一および第二のオーディオ信号呈示のうち一方のみがバイノーラル・オーディオ信号呈示である、態様1記載の方法。
〔態様4〕
前記第一および第二のオーディオ信号呈示のうち他方がステレオまたはサラウンド・オーディオ信号呈示である、態様3記載の方法。
〔態様5〕
ダイアログ変換パラメータの集合を受領し、ダイアログ推定パラメータの前記集合の適用の前または後にダイアログ変換パラメータの前記集合を適用して、前記第二のオーディオ信号呈示に対応する変換されたダイアログ呈示を形成することをさらに含む、態様3または4記載の方法。
〔態様6〕
前記ダイアログ推定パラメータは、前記ダイアログ呈示が前記第二のオーディオ信号呈示に対応するよう呈示変換をも実行するよう構成されている、態様3または4記載の方法。
〔態様7〕
前記第一のオーディオ信号呈示を提供することが、初期のオーディオ信号呈示および呈示変換パラメータの集合を受領し、呈示変換パラメータの前記集合を前記初期のオーディオ信号呈示に適用することを含む、態様2記載の方法。
〔態様8〕
前記第一のオーディオ信号呈示の前記第二のオーディオ信号呈示への変換を可能にするよう構成された呈示変換パラメータの集合を受領し、前記第一のオーディオ信号呈示に呈示変換パラメータの前記集合を適用して前記第二のオーディオ信号呈示を形成することをさらに含む、態様1ないし7のうちいずれか一項記載の方法。
〔態様9〕
ダイアログ推定パラメータの前記集合の適用の前または後に呈示変換パラメータの前記集合を適用して、前記第二のオーディオ信号呈示に対応する変換されたダイアログ呈示を形成することをさらに含む、態様8記載の方法。
〔態様10〕
前記ダイアログ呈示を前記第二のオーディオ信号呈示と組み合わせることが、前記ダイアログ呈示と前記第一のオーディオ信号呈示の和を形成して、該和に、呈示変換パラメータの前記集合を適用することを含む、態様8記載の方法。
〔態様11〕
前記第一のオーディオ信号呈示がエンコーダから受領される、態様1ないし10のうちいずれか一項記載の方法。
〔態様12〕
前記ダイアログ呈示に因子Gによるレベル修正を適用することをさらに含む、態様1ないし11のうちいずれか一項記載の方法。
〔態様13〕
Gが所与の閾値より小さいときは第一の処理が適用され、Gが前記閾値より大きいときは第二の処理が適用される、態様12記載の方法。
〔態様14〕
前記閾値が0に等しく、G<0はダイアログの減衰を表わし、G>0はダイアログの強調を表わす、態様13記載の方法。
〔態様15〕
前記第一の処理が、前記ダイアログ呈示と前記第一のオーディオ信号呈示の和を形成して、該和に、呈示変換パラメータの集合を適用することを含む、態様13または14記載の方法。
〔態様16〕
前記第二の処理が、ダイアログ推定パラメータの前記集合の適用の前または後に呈示変換パラメータの集合を適用して、前記第二のオーディオ信号呈示に対応する変換されたダイアログ呈示を形成することを含む、態様13ないし15のうちいずれか一項記載の方法。
〔態様17〕
一つまたは複数のオーディオ・コンポーネントをもつオーディオ・コンテンツをダイアログ向上するための方法であって、各コンポーネントは空間位置に関連付けられており、当該方法は:
第一のオーディオ再生システムでの再生のために意図されている前記オーディオ・コンポーネントの第一のオーディオ信号呈示を受領し;
前記第一のオーディオ信号呈示の、第二のオーディオ再生システムでの再生のために意図されている第二のオーディオ信号呈示への変換を可能にするよう構成された呈示変換パラメータの集合を受領し;
前記第一のオーディオ信号呈示からのダイアログ・コンポーネントの推定を可能にするよう構成されたダイアログ推定パラメータの集合を受領し;
呈示変換パラメータの前記集合を前記第一のオーディオ信号呈示に適用して、第二のオーディオ信号呈示を形成し;
ダイアログ推定パラメータの前記集合を前記第一のオーディオ信号呈示に適用して前記ダイアログ・コンポーネントのダイアログ呈示を形成し;
前記ダイアログ呈示を前記第二のオーディオ信号呈示と組み合わせて、前記第二のオーディオ再生システムでの再生のためのダイアログ向上されたオーディオ信号呈示を形成することを含み;
前記第一のオーディオ信号呈示および前記第二のオーディオ信号呈示の一方のみがバイノーラル・オーディオ信号呈示である、
方法。
〔態様18〕
前記ダイアログ呈示を前記第二のオーディオ信号呈示と組み合わせることが、前記ダイアログ呈示と前記第一のオーディオ信号呈示の和を形成して、該和に、呈示変換パラメータの前記集合を適用することを含む、態様17記載の方法。
〔態様19〕
前記ダイアログ推定パラメータは、前記ダイアログ呈示が前記第二のオーディオ信号呈示に対応するよう呈示変換をも実行するよう構成されている、態様17記載の方法。
〔態様20〕
ダイアログ推定パラメータの前記集合の適用の前または後に呈示変換パラメータの前記集合を適用して、前記第二のオーディオ信号呈示に対応する変換されたダイアログ呈示を形成することをさらに含む、態様17記載の方法。
〔態様21〕
前記ダイアログ呈示がモノ呈示であり、当該方法がさらに:
前記ダイアログ・コンポーネントに関係する位置データを受領し;
前記第二のオーディオ信号呈示と組み合わせる前に、前記位置データを使って、前記モノ・ダイアログ呈示をレンダリングすることをさらに含む、
態様17記載の方法。
〔態様22〕
前記レンダリングすることが:
前記位置データに基づいてライブラリから頭部伝達関数(HRTF)を選択し;
選択されたHRTFを前記モノ・ダイアログ呈示に適用することを含む、
態様21記載の方法。
〔態様23〕
前記レンダリングすることが、振幅パンを含む、態様21記載の方法。
〔態様24〕
一つまたは複数のオーディオ・コンポーネントをもつオーディオ・コンテンツをダイアログ向上するための方法であって、各コンポーネントは空間位置に関連付けられており、当該方法は:
第一のオーディオ再生システムでの再生のために意図されている前記オーディオ・コンポーネントの第一のオーディオ信号呈示を受領し;
前記第一のオーディオ信号呈示の、第二のオーディオ再生システムでの再生のために意図されている前記第二のオーディオ信号呈示への変換を可能にするよう構成された呈示変換パラメータの集合を受領し;
前記第二のオーディオ信号呈示からのダイアログ・コンポーネントの推定を可能にするよう構成されたダイアログ推定パラメータの集合を受領し;
呈示変換パラメータの前記集合を前記第一のオーディオ信号呈示に適用して、第二のオーディオ信号呈示を形成し;
ダイアログ推定パラメータの前記集合を前記第二のオーディオ信号呈示に適用して前記ダイアログ・コンポーネントのダイアログ呈示を形成し;
前記ダイアログ呈示を前記第二のオーディオ信号呈示と加算して、前記第二のオーディオ再生システムでの再生のためのダイアログ向上されたオーディオ信号呈示を形成することを含み、
前記第一のオーディオ信号呈示および前記第二のオーディオ信号呈示の一方のみがバイノーラル・オーディオ信号呈示である、
方法。
〔態様25〕
一つまたは複数のオーディオ・コンポーネントをもつオーディオ・コンテンツをダイアログ向上するためのデコーダであって、各コンポーネントは空間位置に関連付けられており、当該デコーダは:
第一のオーディオ再生システムでの再生のために意図されている前記オーディオ・コンポーネントの第一のオーディオ信号呈示と、前記第一のオーディオ信号呈示からダイアログ・コンポーネントを推定することを可能にするよう構成されたダイアログ推定パラメータの集合とを受領してデコードするコア・デコーダと;
ダイアログ推定パラメータの前記集合を前記第一のオーディオ信号呈示に適用して前記ダイアログ・コンポーネントのダイアログ呈示を形成するダイアログ推定器と;
前記ダイアログ呈示を第二のオーディオ信号呈示と組み合わせて、第二のオーディオ再生システムでの再生のためのダイアログ向上されたオーディオ信号呈示を形成する手段とを有し;
前記第一および第二のオーディオ信号呈示の一方のみがバイノーラル・オーディオ信号呈示である、
デコーダ。
〔態様26〕
前記第一および第二のオーディオ信号呈示のうち一方がステレオまたはサラウンド・オーディオ信号呈示である、態様25記載のデコーダ。
〔態様27〕
前記コア・デコーダが、ダイアログ変換パラメータの集合を受領するようさらに構成され、前記ダイアログ推定器が、ダイアログ推定パラメータの前記集合の適用の前または後にダイアログ変換パラメータの前記集合を適用して、前記第二のオーディオ信号呈示に対応する変換されたダイアログ呈示を形成するようさらに構成されている、態様25または26記載のデコーダ。
〔態様28〕
前記ダイアログ推定器は、前記ダイアログ呈示が前記第二のオーディオ信号呈示に対応するよう、ダイアログ推定パラメータの前記集合を使って呈示変換をも実行するよう構成されている、態様25または26記載のデコーダ。
〔態様29〕
前記コア・デコーダが、呈示変換パラメータの集合を受領するようさらに構成されており、当該デコーダがさらに:
呈示変換パラメータの前記集合を前記第一のオーディオ信号呈示に適用して前記第二のオーディオ信号呈示を形成するよう構成されている変換ユニットを有する、
態様25ないし28のうちいずれか一項記載のデコーダ。
〔態様30〕
前記ダイアログ推定器が、ダイアログ推定パラメータの前記集合の適用の前または後に呈示変換パラメータの前記集合を適用して、前記第二のオーディオ信号呈示に対応する変換されたダイアログ呈示を形成するようさらに構成されている、態様29記載のデコーダ。
〔態様31〕
前記ダイアログ呈示を前記第二のオーディオ信号呈示と組み合わせる手段が、前記ダイアログ呈示と前記第一のオーディオ信号呈示の和を形成する加算ブロックを含み、前記変換ユニットが、該和に、呈示変換パラメータの前記集合を適用するよう構成されている、態様29記載のデコーダ。
〔態様32〕
前記ダイアログ呈示に因子Gによるレベル修正を適用するよう構成されたレベル修正ブロックをさらに有する、態様25ないし31のうちいずれか一項記載のデコーダ。
〔態様33〕
Gが所与の閾値より小さいときは前記ダイアログ推定パラメータの第一の適用を選択するよう構成された選択論理をさらに有しており、Gが前記閾値より大きいときは第二の処理が適用される、態様32記載のデコーダ。
〔態様34〕
前記閾値が0に等しく、G<0はダイアログの減衰を表わし、G>0はダイアログの強調を表わす、態様33記載のデコーダ。
〔態様35〕
前記第一の適用が、前記ダイアログ呈示と前記第一のオーディオ信号呈示の和を形成して、該和に、呈示変換パラメータの集合を適用することを含む、態様33または34記載のデコーダ。
〔態様36〕
前記第二の適用が、ダイアログ推定パラメータの前記集合の適用の前または後に呈示変換パラメータの集合を適用して、前記第二のオーディオ信号呈示に対応する変換されたダイアログ呈示を形成することを含む、態様33ないし35のうちいずれか一項記載のデコーダ。
〔態様37〕
一つまたは複数のオーディオ・コンポーネントをもつオーディオ・コンテンツをダイアログ向上するためのデコーダであって、各コンポーネントは空間位置に関連付けられており、当該デコーダは:
第一のオーディオ再生システムでの再生のために意図されている前記オーディオ・コンポーネントの第一のオーディオ信号呈示と、前記第一のオーディオ信号呈示を第二のオーディオ再生システムでの再生のために意図されている第二のオーディオ信号呈示に変換できるようにするよう構成された呈示変換パラメータの集合と、前記第一のオーディオ信号呈示からダイアログ・コンポーネントを推定できるようにするよう構成されたダイアログ推定パラメータの集合とを受領するコア・デコーダと;
呈示変換パラメータの前記集合を前記第一のオーディオ信号呈示に適用して、第二のオーディオ再生システムでの再生のために意図された第二のオーディオ信号呈示を形成するよう構成された変換ユニットと;
ダイアログ推定パラメータの前記集合を前記第一のオーディオ信号呈示に適用して前記ダイアログ・コンポーネントのダイアログ呈示を形成するダイアログ推定器と;
前記ダイアログ呈示を前記第二のオーディオ信号呈示と組み合わせて、前記第二のオーディオ再生システムでの再生のためのダイアログ向上されたオーディオ信号呈示を形成する手段とを有し;
前記第一のオーディオ信号呈示および前記第二のオーディオ信号呈示のうち一方のみがバイノーラル・オーディオ信号呈示である、
デコーダ。
〔態様38〕
前記ダイアログ呈示を前記第二のオーディオ信号呈示と組み合わせる手段が、前記ダイアログ呈示と前記第一のオーディオ信号呈示の和を形成する加算ブロックを含み、前記変換ユニットが、該和に、呈示変換パラメータの前記集合を適用するよう構成されている、態様37記載のデコーダ。
〔態様39〕
前記ダイアログ推定器は、前記ダイアログ呈示が前記第二のオーディオ信号呈示に対応するよう、ダイアログ推定パラメータの前記集合を使って呈示変換をも実行するよう構成されている、態様37記載のデコーダ。
〔態様40〕
前記ダイアログ推定器は、ダイアログ推定パラメータの前記集合の適用の前または後に呈示変換パラメータの前記集合を適用して、前記第二のオーディオ信号呈示に対応する変換されたダイアログ呈示を形成するよう構成されている、態様37記載のデコーダ。
〔態様41〕
前記ダイアログ呈示がモノ呈示であり、前記コア・デコーダが、前記ダイアログ・コンポーネントに関係する位置データを受領するようさらに構成されており、当該デコーダがさらに:
前記第二のオーディオ信号呈示と組み合わせる前に、前記位置データを使って、前記モノ・ダイアログ呈示をレンダリングする構成されたレンダラーをさらに有する、
態様37記載のデコーダ。
〔態様42〕
前記レンダラーが:
前記位置データに基づいてライブラリから頭部伝達関数(HRTF)を選択し;
選択されたHRTFを前記モノ・ダイアログ呈示に適用するよう構成されている、
態様41記載のデコーダ。
〔態様43〕
前記レンダラーが振幅パンを適用するよう構成されている、態様41記載のデコーダ。
〔態様44〕
一つまたは複数のオーディオ・コンポーネントをもつオーディオ・コンテンツをダイアログ向上するためのデコーダであって、各コンポーネントは空間位置に関連付けられており、当該デコーダは:
第一のオーディオ再生システムでの再生のために意図されている前記オーディオ・コンポーネントの第一のオーディオ信号呈示と、第一のオーディオ信号呈示を第二のオーディオ再生システムでの再生のために意図されている第二のオーディオ信号呈示に変換できるようにするよう構成された呈示変換パラメータの集合と、前記第一のオーディオ信号呈示からダイアログ・コンポーネントを推定できるようにするよう構成されたダイアログ推定パラメータの集合とを受領するコア・デコーダと;
呈示変換パラメータの前記集合を前記第一のオーディオ信号呈示に適用して、第二のオーディオ再生システムでの再生のために意図された第二のオーディオ信号呈示を形成するよう構成された変換ユニットと;
ダイアログ推定パラメータの前記集合を前記第二のオーディオ信号呈示に適用して前記ダイアログ・コンポーネントのダイアログ呈示を形成するダイアログ推定器と;
前記ダイアログ呈示を前記第二のオーディオ信号呈示と加算して、前記第二のオーディオ再生システムでの再生のためのダイアログ向上されたオーディオ信号呈示を形成する加算ブロックとを有し;
前記第一のオーディオ信号呈示および前記第二のオーディオ信号呈示のうちの一方のみがバイノーラル・オーディオ信号呈示である、
デコーダ。
Claims (13)
- 一つまたは複数のオーディオ・コンポーネントをもつオーディオ・コンテンツをダイアログ向上するための方法であって、各コンポーネントは空間位置に関連付けられており、当該方法は:
第一のオーディオ再生システムでの再生のために意図されている前記オーディオ・コンポーネントの第一のオーディオ信号呈示を提供し;
第二のオーディオ再生システムでの再生のために意図されている前記オーディオ・コンポーネントの第二のオーディオ信号呈示を提供し;
前記第一のオーディオ信号呈示からのダイアログ・コンポーネントの推定を可能にするよう構成されたダイアログ推定パラメータの集合を受領し;
ダイアログ推定パラメータの前記集合を前記第一のオーディオ信号呈示に適用し、前記ダイアログ・コンポーネントのダイアログ呈示を形成し;
前記ダイアログ呈示に因子Gによるレベル修正を適用する段階であって、Gが所与の閾値より小さいときは第一の処理が適用され、Gが前記閾値より大きいときは第二の処理が適用され、前記第一の処理が、前記ダイアログ呈示と前記第一のオーディオ信号呈示の和を形成して、該和に、呈示変換パラメータの集合を適用することを含む、段階を実行し;
前記ダイアログ呈示を前記第二のオーディオ信号呈示と組み合わせて、前記第二のオーディオ再生システムでの再生のためのダイアログ向上されたオーディオ信号呈示を形成することを含み、
前記第一および第二のオーディオ信号呈示の少なくとも一方はバイノーラル・オーディオ信号呈示である、
方法。 - 前記第一および第二のオーディオ信号呈示がバイノーラル・オーディオ信号呈示である、請求項1記載の方法。
- 前記第一および第二のオーディオ信号呈示のうち一方のみがバイノーラル・オーディオ信号呈示である、請求項1記載の方法。
- 前記第一および第二のオーディオ信号呈示のうち他方がステレオまたはサラウンド・オーディオ信号呈示である、請求項3記載の方法。
- ダイアログ変換パラメータの集合を受領し、ダイアログ推定パラメータの前記集合の適用の前または後にダイアログ変換パラメータの前記集合を適用して、前記第二のオーディオ信号呈示に対応する変換されたダイアログ呈示を形成することをさらに含む、請求項3または4記載の方法。
- 前記第一のオーディオ信号呈示を提供することが、初期のオーディオ信号呈示および呈示変換パラメータの集合を受領し、呈示変換パラメータの前記集合を前記初期のオーディオ信号呈示に適用することを含む、請求項2記載の方法。
- 前記第一のオーディオ信号呈示の前記第二のオーディオ信号呈示への変換を可能にするよう構成された呈示変換パラメータの集合を受領し、前記第一のオーディオ信号呈示に呈示変換パラメータの前記集合を適用して前記第二のオーディオ信号呈示を形成することをさらに含む、請求項1ないし6のうちいずれか一項記載の方法。
- ダイアログ推定パラメータの前記集合の適用の前または後に呈示変換パラメータの前記集合を適用して、前記第二のオーディオ信号呈示に対応する変換されたダイアログ呈示を形成することをさらに含む、請求項7記載の方法。
- 前記ダイアログ呈示を前記第二のオーディオ信号呈示と組み合わせることが、前記ダイアログ呈示と前記第一のオーディオ信号呈示の和を形成して、該和に、呈示変換パラメータの前記集合を適用することを含む、請求項7記載の方法。
- 前記閾値が0に等しく、G<0はダイアログの減衰を表わし、G>0はダイアログの強調を表わす、請求項1記載の方法。
- 前記第二の処理が、ダイアログ推定パラメータの前記集合の適用の前または後に呈示変換パラメータの集合を適用して、前記第二のオーディオ信号呈示に対応する変換されたダイアログ呈示を形成することを含む、請求項10記載の方法。
- 前記ダイアログ呈示がモノ呈示であり、当該方法がさらに:
前記ダイアログ・コンポーネントに関係する位置データを受領し;
前記第二のオーディオ信号呈示と組み合わせる前に、前記位置データを使って、前記モノ・ダイアログ呈示をレンダリングすることをさらに含む、
請求項1記載の方法。 - 前記レンダリングすることが:
前記位置データに基づいてライブラリから頭部伝達関数(HRTF)を選択し;
選択されたHRTFを前記モノ・ダイアログ呈示に適用すること;または
振幅パンのいずれかを含む、
請求項12記載の方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023148875A JP7652849B2 (ja) | 2016-01-29 | 2023-09-14 | バイノーラル・ダイアログ向上 |
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662288590P | 2016-01-29 | 2016-01-29 | |
EP16153468.0 | 2016-01-29 | ||
EP16153468 | 2016-01-29 | ||
US62/288,590 | 2016-01-29 | ||
PCT/US2017/015165 WO2017132396A1 (en) | 2016-01-29 | 2017-01-26 | Binaural dialogue enhancement |
JP2018539144A JP7023848B2 (ja) | 2016-01-29 | 2017-01-26 | バイノーラル・ダイアログ向上 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018539144A Division JP7023848B2 (ja) | 2016-01-29 | 2017-01-26 | バイノーラル・ダイアログ向上 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023148875A Division JP7652849B2 (ja) | 2016-01-29 | 2023-09-14 | バイノーラル・ダイアログ向上 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022031955A JP2022031955A (ja) | 2022-02-22 |
JP7383685B2 true JP7383685B2 (ja) | 2023-11-20 |
Family
ID=55272356
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018539144A Active JP7023848B2 (ja) | 2016-01-29 | 2017-01-26 | バイノーラル・ダイアログ向上 |
JP2021205176A Active JP7383685B2 (ja) | 2016-01-29 | 2021-12-17 | バイノーラル・ダイアログ向上 |
JP2023148875A Active JP7652849B2 (ja) | 2016-01-29 | 2023-09-14 | バイノーラル・ダイアログ向上 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018539144A Active JP7023848B2 (ja) | 2016-01-29 | 2017-01-26 | バイノーラル・ダイアログ向上 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023148875A Active JP7652849B2 (ja) | 2016-01-29 | 2023-09-14 | バイノーラル・ダイアログ向上 |
Country Status (5)
Country | Link |
---|---|
US (6) | US10375496B2 (ja) |
EP (2) | EP3409029B1 (ja) |
JP (3) | JP7023848B2 (ja) |
CN (2) | CN108702582B (ja) |
WO (1) | WO2017132396A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI703557B (zh) * | 2017-10-18 | 2020-09-01 | 宏達國際電子股份有限公司 | 聲音播放裝置、方法及非暫態儲存媒體 |
GB2575511A (en) | 2018-07-13 | 2020-01-15 | Nokia Technologies Oy | Spatial audio Augmentation |
GB2575509A (en) | 2018-07-13 | 2020-01-15 | Nokia Technologies Oy | Spatial audio capture, transmission and reproduction |
CN109688513A (zh) * | 2018-11-19 | 2019-04-26 | 恒玄科技(上海)有限公司 | 无线主动降噪耳机及双主动降噪耳机通话数据处理方法 |
ES2986709T3 (es) | 2019-04-15 | 2024-11-12 | Dolby Int Ab | Potenciación de diálogo en códec de audio |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003522472A (ja) | 2000-02-04 | 2003-07-22 | ヒアリング エンハンスメント カンパニー,リミティド ライアビリティー カンパニー | 消費者アプリケーションにおける音声対残余オーディオ(vra)の使用 |
JP2010515290A (ja) | 2006-09-14 | 2010-05-06 | エルジー エレクトロニクス インコーポレイティド | ダイアログエンハンスメント技術のコントローラ及びユーザインタフェース |
WO2015031505A1 (en) | 2013-08-28 | 2015-03-05 | Dolby Laboratories Licensing Corporation | Hybrid waveform-coded and parametric-coded speech enhancement |
JP2015530825A (ja) | 2012-08-31 | 2015-10-15 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 種々の聴取環境におけるオブジェクトに基づくオーディオのレンダリング及び再生のためのシステム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080056517A1 (en) * | 2002-10-18 | 2008-03-06 | The Regents Of The University Of California | Dynamic binaural sound capture and reproduction in focued or frontal applications |
US8081762B2 (en) * | 2006-01-09 | 2011-12-20 | Nokia Corporation | Controlling the decoding of binaural audio signals |
EP1853092B1 (en) * | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
CN101518098B (zh) * | 2006-09-14 | 2013-10-23 | Lg电子株式会社 | 用于对话增强技术的控制器和用户界面 |
US20080201369A1 (en) * | 2007-02-16 | 2008-08-21 | At&T Knowledge Ventures, Lp | System and method of modifying media content |
JP5391203B2 (ja) * | 2007-10-09 | 2014-01-15 | コーニンクレッカ フィリップス エヌ ヴェ | バイノーラル音声信号を生成するための方法と装置 |
EP2146522A1 (en) | 2008-07-17 | 2010-01-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating audio output signals using object based metadata |
KR101599533B1 (ko) * | 2008-07-29 | 2016-03-03 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8537980B2 (en) * | 2009-03-27 | 2013-09-17 | Verizon Patent And Licensing Inc. | Conversation support |
KR20140010468A (ko) * | 2009-10-05 | 2014-01-24 | 하만인터내셔날인더스트리스인코포레이티드 | 오디오 신호의 공간 추출 시스템 |
IL302167B2 (en) * | 2011-07-01 | 2024-11-01 | Dolby Laboratories Licensing Corp | A system and method for producing, encoding and realizing a given voice signal |
JP2013153307A (ja) * | 2012-01-25 | 2013-08-08 | Sony Corp | 音声処理装置および方法、並びにプログラム |
CN104078050A (zh) * | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
CN109712630B (zh) * | 2013-05-24 | 2023-05-30 | 杜比国际公司 | 包括音频对象的音频场景的高效编码 |
EP2879131A1 (en) * | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
RU2701055C2 (ru) * | 2014-10-02 | 2019-09-24 | Долби Интернешнл Аб | Способ декодирования и декодер для усиления диалога |
CN111970629B (zh) | 2015-08-25 | 2022-05-17 | 杜比实验室特许公司 | 音频解码器和解码方法 |
EP4224887A1 (en) | 2015-08-25 | 2023-08-09 | Dolby International AB | Audio encoding and decoding using presentation transform parameters |
-
2017
- 2017-01-26 CN CN201780013669.6A patent/CN108702582B/zh active Active
- 2017-01-26 EP EP17702510.3A patent/EP3409029B1/en active Active
- 2017-01-26 US US16/073,149 patent/US10375496B2/en active Active
- 2017-01-26 EP EP24208742.7A patent/EP4510625A2/en active Pending
- 2017-01-26 CN CN202011117783.3A patent/CN112218229B/zh active Active
- 2017-01-26 WO PCT/US2017/015165 patent/WO2017132396A1/en active Application Filing
- 2017-01-26 JP JP2018539144A patent/JP7023848B2/ja active Active
-
2019
- 2019-08-05 US US16/532,143 patent/US10701502B2/en active Active
-
2020
- 2020-06-29 US US16/915,670 patent/US11115768B2/en active Active
-
2021
- 2021-09-02 US US17/465,733 patent/US11641560B2/en active Active
- 2021-12-17 JP JP2021205176A patent/JP7383685B2/ja active Active
-
2023
- 2023-04-28 US US18/309,099 patent/US11950078B2/en active Active
- 2023-09-14 JP JP2023148875A patent/JP7652849B2/ja active Active
-
2024
- 2024-03-15 US US18/606,040 patent/US20240406650A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003522472A (ja) | 2000-02-04 | 2003-07-22 | ヒアリング エンハンスメント カンパニー,リミティド ライアビリティー カンパニー | 消費者アプリケーションにおける音声対残余オーディオ(vra)の使用 |
JP2010515290A (ja) | 2006-09-14 | 2010-05-06 | エルジー エレクトロニクス インコーポレイティド | ダイアログエンハンスメント技術のコントローラ及びユーザインタフェース |
JP2015530825A (ja) | 2012-08-31 | 2015-10-15 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 種々の聴取環境におけるオブジェクトに基づくオーディオのレンダリング及び再生のためのシステム |
WO2015031505A1 (en) | 2013-08-28 | 2015-03-05 | Dolby Laboratories Licensing Corporation | Hybrid waveform-coded and parametric-coded speech enhancement |
Also Published As
Publication number | Publication date |
---|---|
EP3409029A1 (en) | 2018-12-05 |
US10375496B2 (en) | 2019-08-06 |
JP2019508947A (ja) | 2019-03-28 |
US11641560B2 (en) | 2023-05-02 |
US20190037331A1 (en) | 2019-01-31 |
US11115768B2 (en) | 2021-09-07 |
EP4510625A2 (en) | 2025-02-19 |
US20200329326A1 (en) | 2020-10-15 |
JP2022031955A (ja) | 2022-02-22 |
US10701502B2 (en) | 2020-06-30 |
JP2023166560A (ja) | 2023-11-21 |
WO2017132396A1 (en) | 2017-08-03 |
CN112218229A (zh) | 2021-01-12 |
US11950078B2 (en) | 2024-04-02 |
US20220060838A1 (en) | 2022-02-24 |
US20190356997A1 (en) | 2019-11-21 |
JP7023848B2 (ja) | 2022-02-22 |
JP7652849B2 (ja) | 2025-03-27 |
CN108702582A (zh) | 2018-10-23 |
US20230345192A1 (en) | 2023-10-26 |
US20240406650A1 (en) | 2024-12-05 |
EP3409029B1 (en) | 2024-10-30 |
CN112218229B (zh) | 2022-04-01 |
CN108702582B (zh) | 2020-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7383685B2 (ja) | バイノーラル・ダイアログ向上 | |
EP2524370B1 (en) | Extraction of a direct/ambience signal from a downmix signal and spatial parametric information | |
KR101010464B1 (ko) | 멀티 채널 신호의 파라메트릭 표현으로부터 공간적 다운믹스 신호의 생성 | |
CN108600935B (zh) | 音频信号处理方法和设备 | |
KR102713312B1 (ko) | 오디오 디코더 및 디코딩 방법 | |
EP1991984A1 (en) | Method, medium, and system synthesizing a stereo signal | |
KR102201308B1 (ko) | 상관해제 필터들의 적응적 제어를 위한 방법 및 장치 | |
KR20170063657A (ko) | 오디오 인코더 및 디코더 | |
CN108028988B (zh) | 处理低复杂度格式转换的内部声道的设备和方法 | |
EA042232B1 (ru) | Кодирование и декодирование звука с использованием параметров преобразования представления |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221108 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230914 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20230925 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231010 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7383685 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |