[go: up one dir, main page]

JP2019502296A - 信号処理方法および仮想スピーカアレイにオーディオをレンダリングするシステム - Google Patents

信号処理方法および仮想スピーカアレイにオーディオをレンダリングするシステム Download PDF

Info

Publication number
JP2019502296A
JP2019502296A JP2018524370A JP2018524370A JP2019502296A JP 2019502296 A JP2019502296 A JP 2019502296A JP 2018524370 A JP2018524370 A JP 2018524370A JP 2018524370 A JP2018524370 A JP 2018524370A JP 2019502296 A JP2019502296 A JP 2019502296A
Authority
JP
Japan
Prior art keywords
matrix
hrir
state space
space representation
hrirs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018524370A
Other languages
English (en)
Other versions
JP6591671B2 (ja
Inventor
モーガン ボランド、フランシス
モーガン ボランド、フランシス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of JP2019502296A publication Critical patent/JP2019502296A/ja
Application granted granted Critical
Publication of JP6591671B2 publication Critical patent/JP6591671B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • H04S7/306For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)

Abstract

オーディオレンダリングの技術は、平衡実現状態の空間モデルを各頭部伝達関数(HRTF)に適用することで、有効なFIRまたはさらには無限インパルス応答(IIR)フィルタの次数を低減することを含む。この線に沿って、各HRTF G(z)は、例えばz変換を介して頭部インパルス応答フィルタ(HRIR)から算出される。HRIRのデータは、HRTFの第1状態空間表現[A,B,C,D]を、G(z)=C(zI−A)−1B+Dの関係を介して構築するために使用されてよい。この第1状態空間表現は特異なものではないので、FIRフィルタに対して、CおよびDはHRIRデータを含む一方で、AおよびBは、単純な、2値アレイに設定されてよい。この表現は、その固有ベクトルが、ハンケルノルムにより測定されるシステム利得を最大化するシステム状態を提供する、グラム行列Qの単純な形式に通じる。さらに、Qの因数分解は、グラム行列がQの固有値の対角行列と等しい平衡状態空間への変換を提供する。ある閾値を越える固有値に関連する状態のみを考慮することにより、HRTFの平衡状態空間表現は、求められる計算量の90パーセントを削減しながら元のHRTFに非常によく近似する近似HRTFを提供するために、切り捨てられてよい。

Description

本願は、一般に信号処理方法および仮想スピーカアレイにオーディオをレンダリングするシステムに関する。
リスナーを囲むスピーカの仮想アレイは、ヘッドフォンに配信されるオーディオ用の仮想の空間音響環境の生成において、一般的に使用される。このスピーカアレイにより生成される音場は、ユーザに対して音源が移動する効果をもたらすように、または、ユーザが頭を動かす場合、その音源を固定の空間位置に不動とするように操作が可能である。これらは、仮想現実(VR)システムにおけるヘッドフォンを通じてのオーディオ配信にとって、非常に重要な処理である。
仮想スピーカへの配信のために処理されるマルチチャンネルオーディオは、左右のヘッドフォンスピーカに信号のペアを提供するために組み合わされる。マルチチャンネルオーディオを組み合わせるこの処理は、バイノーラルレンダリングとして知られている。一般に受容されている、このレンダリングの実装に最も有効な方法は、頭部伝達関数(HRTF)を実装するマルチチャンネルフィルタリングシステムを使用することである。例えばM(ただしMは任意の数)個の仮想スピーカに基づいたシステムにおいて、バイノーラルレンダラは、スピーカとユーザの左右の耳との間の伝達関数をモデル化するのに1つのスピーカにつき1つのペアが使用されるため、2M個のHRTFフィルタを有する必要がある。
バイノーラルレンダリングを実行する従来の手法は、多量の計算資源を必要とする。この手法により、HRTFがn次の有限インパルス応答(FIR)フィルタとして表現される場合、各バイノーラル出力は、1つのチャンネルにつき2Mn個の乗加算演算を必要とする。そのような演算は、バイノーラルレンダリングに対して割り当てられた限られた資源、例えば仮想現実アプリケーションに対して負担をかけ得る。
多量の計算資源を必要とするバイノーラルレンダリングを実行する従来の手法とは対照的に、改善された技術は、平衡実現状態の空間モデルを各HRTFに適用することで、有効なFIRまたはさらには無限インパルス応答(IIR)フィルタの次数を低減することを含む。この線に沿って、各HRTF G(z)は、例えばz変換を介して頭部インパルス応答フィルタ(HRIR)から算出される。HRIRのデータは、HRTFの第1状態空間表現[A,B,C,D]を、G(z)=C(zI−A)−1B+Dの関係を介して構築するために使用されてよい。この第1状態空間表現はユニークなものではないので、FIRフィルタに対して、AおよびBは、単純な2値アレイに設定されてよい一方、CおよびDはHRIRデータを含む。この表現によって、その固有ベクトルが、ハンケルノルムにより測定されるシステム利得を最大化するシステム状態を提供する、単純な形式のグラム行列Qが導かれる。さらに、Qの因数分解は、グラム行列がQの固有値の対角行列と等しい平衡状態空間への変換を提供する。ある閾値を越える固有値に関連する状態のみを考慮することにより、HRTFの平衡状態空間表現は、求められる計算量の90パーセントを削減しながらも、元のHRTFを非常によく近似する近似HRTFを提供するように切り捨てられることができる。
改善された技術の1つの一般的な態様は、人間のリスナーの左耳および右耳に音場をレンダリングする方法を含み、音場は、複数の仮想スピーカによって生成される。方法は、人間のリスナーの頭の左耳および右耳に音場をレンダリングするよう構成されたサウンドレンダリングコンピュータの処理回路が、複数の頭部インパルス応答(HRIR)を取得する工程であって、複数のHRIRの各々は、複数の仮想スピーカのうちの1つの仮想スピーカと人間のリスナーの一方の耳とに関連付けられており、複数のHRIRの各々は、1つの仮想スピーカにより生成されるオーディオインパルスに応じて生成される、特定のサンプリングレートで生成される左耳または右耳における音場のサンプルを含む工程を含んでよい。方法は、複数のHRIRの各々の第1状態空間表現を生成する工程であって、第1状態空間表現は、行列、列ベクトル、および行ベクトルを含み、第1状態空間表現の行列、列ベクトル、および行ベクトルの各々は、第1サイズを有する工程をまた含んでよい。方法は、状態空間削減演算を実行することで、複数のHRIRの各々の第2状態空間表現を生成する工程であって、第2空間表現は、行列、列ベクトル、および行ベクトルを含み、第2状態空間表現の行列、列ベクトル、および行ベクトルの各々は、第1サイズよりも小さい第2サイズを有する、状態空間削減演算実行工程をさらに含んでよい。方法は、第2状態表現に基づいて複数の頭部伝達関数(HRTF)を生成する工程であって、複数のHRTFの各々は、複数のHRIRのそれぞれのHRIRに対応しており、それぞれのHRIRに対応しているHRTFは、該HRIRが関連付けられている仮想スピーカにより生成される周波数領域音場が乗算されると、人間のリスナーの一方の耳にレンダリングされる音場の成分を生成する工程をさらに含んでよい。
状態空間削減演算実行工程は、複数のHRIRの各HRIRに対して、該HRIRの第1状態空間表現に基づき、それぞれのグラム行列を生成する工程であって、グラム行列は、大きさ順に並べられた複数の固有値を有する工程と、グラム行列および複数の固有値に基づき、該HRIRの第2状態空間表現を生成する工程であって、第2サイズは、複数の固有値のうち、特定の閾値を超える固有値の数に等しい、工程と、を含んでよい。
複数のHRIRの各HRIRの第2状態空間表現を生成する工程は、該HRIRの第1状態空間表現に基づくグラム行列に適用された場合に対角行列を生成する変換行列を形成する工程であって、対角行列の各対角要素は、複数の固有値のそれぞれの固有値に等しい工程を含んでよい。
方法は、複数のHRIRの各々に対して、該HRIRのケプストラムを生成する工程であって、ケプストラムは、正の時間に取得された因果的サンプルおよび負の時間に取得された非因果的サンプルを有する工程と、ケプストラムの非因果的サンプルの各々に対して、負の時間に取得された該非因果的サンプルを、該負の時間の反対の時間に取得されたケプストラムの因果的サンプルに加算することで、位相最小化演算を実行する工程と、ケプストラムの非因果的サンプルの各々に対する位相最小化演算の実行後に、ケプストラムの非因果的サンプルの各々をゼロに設定することで、最小位相HRIRを生成する工程と、をさらに含んでよい。
方法は、MIMO(multiple input, multiple output)状態空間表現を生成する工程であって、MIMO状態空間表現は、合成行列、列ベクトル行列、および行ベクトル行列を含み、MIMO状態空間表現の合成行列は、複数のHRIRの各々の第1表現の行列を含み、MIMO状態空間表現の列ベクトル行列は、複数のHRIRの各々の第1表現の列ベクトルを含み、MIMO状態空間表現の行ベクトル行列は、複数のHRIRの各々の第1表現の行ベクトルを含む、MIMO状態空間表現生成工程と、をさらに含んでよい。この場合、状態空間削減演算実行工程は、削減合成行列、削減列ベクトル行列、および削減行ベクトル行列を生成する工程であって、削減合成行列、削減列ベクトル行列、および削減行ベクトル行列の各々は、合成行列、列ベクトル行列、および行ベクトル行列のサイズよりそれぞれ小さいサイズを有する工程を含む。
MIMO状態空間表現生成工程は、MIMO状態空間表現の合成行列として第1ブロック行列を形成する工程であって、第1ブロック行列は、複数の仮想スピーカのうちの1つの仮想スピーカに関連付けられているHRIRの第1状態空間表現の行列を、第1ブロック行列の対角要素として有し、同様の仮想スピーカに関連付けられているHRIRの第1状態空間表現の行列は、第1ブロック行列の隣接する対角要素に存在する工程を含んでよい。MIMO状態空間表現生成工程は、MIMO状態空間表現の列ベクトル行列として第2ブロック行列を形成する工程であって、第2ブロック行列は、複数の仮想スピーカのうちの1つの仮想スピーカに関連付けられているHRIRの第1状態空間表現の列ベクトルを、第2ブロック行列の対角要素として有し、同様の仮想スピーカに関連付けられているHRIRの第1状態空間表現の列ベクトルは、第2ブロック行列の隣接する対角要素に存在する工程をまた含んでよい。MIMO状態空間表現生成工程は、MIMO状態空間表現の行ベクトル行列として第3ブロック行列を形成する工程であって、第3ブロック行列は、複数の仮想スピーカのうちの1つの仮想スピーカに関連付けられているHRIRの第1状態空間表現の行ベクトルを、第3ブロック行列の要素として有し、左耳における音をレンダリングするHRIRの第1状態空間表現の行ベクトルは、第3ブロック行列の第1行の奇数番目の要素に存在しており、右耳における音をレンダリングするHRIRの第1状態空間表現の行ベクトルは、第3ブロック行列の第2行の偶数番目の要素に存在している工程と、をさらに含んでよい。
方法は、MIMO状態空間表現生成工程の前に、複数のHRIRの各HRIRに対して、SISO(single input single output)状態空間削減演算を実行することで、該HRIRの第1状態空間表現として、該HRIRのSISO状態空間表現を生成する工程をさらに含んでよい。
方法に関して、複数の仮想スピーカの各々に対して、該仮想スピーカに関連付けられている複数のHRIRに左HRIRおよび右HRIRが存在しており、左HRIRは、該仮想スピーカにより生成される周波数領域音場が乗算されると、人間のリスナーの左耳にレンダリングされる音場の成分を生成し、右HRIRは、該仮想スピーカにより生成される周波数領域音場が乗算されると、人間のリスナーの右耳にレンダリングされる音場の成分を生成する。さらに、複数の仮想スピーカの各々に対して、該仮想スピーカに関連付けられている左HRIRと該仮想スピーカに関連付けられている右HRIRとの間の両耳間時間差(ITD)が存在しており、ITDは、ゼロ値を有する左HRIRの音場の初期サンプルの数と、ゼロ値を有する右HRIRの音場の初期サンプルの数との間の差により、左HRIRおよび右HRIRにおいて顕著になる。この場合、方法は、複数の仮想スピーカの各々に関連付けられている左HRIRと右HRIRとの間のITDに基づいてITDユニットサブシステム行列を生成する工程と、複数のHRTFにITDユニットサブシステム行列を乗算することで、複数の遅延HRTFを生成する工程と、をさらに含んでよい。
方法に関して、複数のHRTFの各々は、有限インパルスフィルタ(FIR)で表されてよい。この場合、方法は、複数のHRTFの各々に対して変換演算を実行することで、各々が無限インパルス応答フィルタ(IIR)で表される別の複数のHRTFを生成する工程をさらに含んでよい。
方法に関して、複数の仮想スピーカの各々に対して、スピーカに最も近い頭部の側面の耳に対応した該仮想スピーカに関連するHRIRが存在する。これは同側HRIRと呼ばれる。該仮想スピーカに関連する他のHRIRは、反対側HRIRと呼ばれる。複数のHRTFは2つのグループに分けられてよい。1つのグループは、全ての同側HRTFを含み、他のグループは、全ての反対側HRTFを含む。この場合、方法は、各グループに別個に適用されてよく、これによって、そのグループに適切な近似の度合いを生成する。
本明細書に記載される1つまたは複数の実施形態による、頭部追跡、アンビソニック符号化仮想スピーカに基づくバイノーラルオーディオに対する例示的なシステムを説明するブロック図。 本明細書に記載される1つまたは複数の実施形態による、ハンケル特異値を有する例示的な状態空間システムのグラフ表示。 本明細書に記載される1つまたは複数の実施形態による、例示的な状態空間システムに対する、25次の有限インパルス応答近似および6次の無限インパルス応答近似のインパルス応答を説明するグラフ表示。 本明細書に記載される1つまたは複数の実施形態による、例示的な状態空間システムに対する、25次の有限インパルス応答近似および3次の無限インパルス応答近似のインパルス応答を説明するグラフ表示。 ユーザに対するスピーカの例示的な配置を説明するブロック図。 例示的なバイノーラルレンダラシステムを説明するブロック図。 本明細書に記載される1つまたは複数の実施形態による、例示的なMIMOバイノーラルレンダラシステム説明するブロック図。 本明細書に記載される1つまたは複数の実施形態による、例示的なバイノーラルレンダラシステムを説明するブロック図。 本明細書に記載される1つまたは複数の実施形態による、バイノーラルレンダリングのために配置された例示的なコンピューティング装置を説明するブロック図。 本明細書に記載される1つまたは複数の実施形態による、第1左ノードの平衡実現を使用するSingle−Input−Single−Output(SISO)IIR近似の例示的な結果を説明するグラフ表示。 本明細書に記載される1つまたは複数の実施形態による、第1右ノードの平衡実現を使用するSingle−Input−Single−Output(SISO)IIR近似の例示的な結果を説明するグラフ表示。 本明細書に記載される1つまたは複数の実施形態による、第2左ノードの平衡実現を使用するSingle−Input−Single−Output(SISO)IIR近似の例示的な結果を説明するグラフ表示。 本明細書に記載される1つまたは複数の実施形態による、第2右ノードの平衡実現を使用するSingle−Input−Single−Output(SISO)IIR近似の例示的な結果を説明するグラフ表示。 本明細書に記載される1つまたは複数の実施形態による、第3左ノードの平衡実現を使用するSingle−Input−Single−Output(SISO)IIR近似の例示的な結果を説明するグラフ表示。 本明細書に記載される1つまたは複数の実施形態による、第3右ノードの平衡実現を使用するSingle−Input−Single−Output(SISO)IIR近似の例示的な結果を説明するグラフ表示。 本明細書に記載される1つまたは複数の実施形態による、第4左ノードの平衡実現を使用するSingle−Input−Single−Output(SISO)IIR近似の例示的な結果を説明するグラフ表示。 本明細書に記載される1つまたは複数の実施形態による、第4右ノードの平衡実現を使用するSingle−Input−Single−Output(SISO)IIR近似の例示的な結果を説明するグラフ表示。 本明細書に記載される改善された技術を実行する例示的な方法を説明するフローチャート。
本明細書に与えられた見出しは、便宜上のものに過ぎず、本開示の請求項の範囲および意味に必ずしも影響を及ぼすものではない。
図中、容易な理解および便宜のため、同一の参照記号および任意の略語は、同一または同様な構成もしくは機能を有する要素または作用を識別する。図は以下の詳細な説明において詳細に記載される。
本開示の方法およびシステムの様々な実施例および実施形態が記載される。以下の記載は、これらの実施例の十分な理解および実施可能な開示のために特定の詳細を提供する。当業者は、しかしながら、本明細書に記載される1つまたは複数の実施形態が、これらの詳細の多くの部分なしで実施され得ることを理解するだろう。同様に、当業者はまた、本発明の1つまたは複数の実施形態は、本明細書に詳細が記載されていない他の特徴を含むことが可能であることを理解するだろう。加えて、いくつかの周知の構成または機能は、関連する記載を不必要に目立たなくすることを回避するために、図示されず、また以下に詳細な記述もされていない場合がある。
本開示の方法およびシステムは、上記のバイノーラルレンダリング処理の計算量を扱う。例えば、本開示の1つまたは複数の実施形態は、2M個のフィルタ関数を実装するために必要な算術演算の数を低減する方法およびシステムに関連する。
はじめに
図1は、空間オーディオプレイヤ(本実施例の目的では、環境影響の処理は全て無視する)の最終段階は、どのようにマルチチャンネル供給を仮想スピーカのアレイに取り入れ、その供給を、ヘッドフォンを通じて再生するための信号のペアに符号化するかを示す、例示的なシステム100である。示されるように、Mチャンネルから2チャンネルへの最終的な変換は、M個の個別の1対2エンコーダを使用して行われる。ただし、各エンコーダは、左右の耳の頭部伝達関数(HRTF)のペアである。したがって、システム記述においては、演算子G(z)は次の行列である。
各サブシステムは通常、左右の耳のスピーカ位置から測定されるインパルス応答に関連した伝達関数である。以下により詳細が記載されるように、本開示の方法およびシステムは、有限インパルス応答(FIR)から無限インパルス応答(IIR)への変換処理の利用を通じて各サブシステムの次数を低減するやり方を提供する。この課題に対する従来の手法は、各サブシステムを、分離されたSISO(Single Input Single Output)システムとして捉え、その構造を単純化することである。以下では、この従来の手法を検討し、また全体のシステムを、M個の入力および2個の出力のMIMO(Multi Input Multi Output)システムとして動作させることにより、どのくらい高い効率が達成可能かについての研究も行う。
いくつかの従来の技術は、HRTFシステムのMIMOモデルに触れている一方、本開示におけるようなアンビソニック(Ambisonic)ベースの仮想スピーカシステムにおける使用を扱うものはない。本開示に記載されるシステム次数低減の原則は、ハンケルノルムとして知られる測定基準に基づいている。この測定基準は広く知られておらず、またよく理解されてもいないので、以下にこの測定基準が測定するものと、音響システム応答にとって実用的な重要性を有する理由とを説明することを試みる。
HRIR/HRTF構造
音源とリスナーの左右の耳との間のインパルス応答は、周波数領域に変換された場合、頭部インパルス応答(HRIR)およびHRTFと称される。これらの応答関数は、リスナーが音源の場所を知覚するときに必須の、ディレクションキュー(direction cue)を含む。仮想聴覚ディスプレイを生成するための信号処理は、これらの関数を、空間的に正確な音源の合成において、フィルタとして使用する。VR用途においては、ユーザビュー追跡は、例えば(i)処理資源が限られており、また(ii)低いレイテンシがしばしば必須条件なので、オーディオ合成ができるだけ効率的に実行されることを必要とする。
HRIR/HRTF、gを通じての信号伝送は、入力x[k]および出力y[k]について次のように記述されてよい(容易さのため、以下はk>Nの出力を扱う)
g=[g,g,g,..,gN−1]とすると、
z変換を行うと
Y(z)=G(z)X(z) (2)
G(z)=[g+g−1+g−2+..+gN−1N−1] (3)
である。
ここで、左(L)または右(R)耳のN点HRIRはz領域の伝達関数として提示される。HRIRの第1nL/Rサンプル値は、音源位置からL/R耳までの伝達遅れのため、ほぼゼロである。n−n差は、音源の方向についての重要なバイノーラルキュー(binaural cue)である、両耳間時間差(ITD)を成す。この点から、G(z)はいずれかのHRTFを参照する。下付きのLおよびRは、異なる性質を記述する場合にのみ使用される。
低次IIR構造によるFIRの近似
ハンケルノルム概論
以下の記載では、G(z)を代替システム
で置き換える。代替システムは、例えば低い計算負荷等の利点を提供する。それはまた、y=Gxおよび
を有する測定基準
で測定されるように、G(z)の「良好な」近似である。この差の有効な測定基準は、以下の式で定義される誤差システムのHノルムである。
このエネルギー比は、ノルムとして、システムを駆動する信号の最小エネルギーについての、上記の差における最大のエネルギーを与える。したがって、近似誤差を小さくするためには、入力xから出力yまで最小のエネルギーを伝達するモードを削除することが提案される。誤差のHノルムが以下の式に等しい実用的な関連性を有すると考えるのは有益である。
これは、Hノルムが誤差のボードゲイン線図のピークであることを示す。
しかしながら、課題は、このノルムとシステムのモードとの関係性を同定することが困難であることである。代わりに、以下では誤差についてハンケルノルムの使用を検討するが、その理由は、これがシステムの特性と有効な関係性を有しており、またHノルムに関して上限を与えることが容易に示されるためである。
システムのハンケルノルムは、畳み込みのような関係性により定義される、ハンケル演算子Φと呼ばれる演算子のためのシステムの誘導ゲインである。
k=0を「現在」時とすることにより、この演算子Φが、−∞からk=−1まで適用された入力系列x[k]がその後どのようにシステムの出力に現れるかを決定することに留意されたい。
Φによって誘導されるハンケルノルムは、以下のように定義される。
ハンケルノルムは、システムへの過去のエネルギー入力を最小化する一方で、システム出力において回収可能な将来のエネルギーの最大化を表すこともまた理解されるべきである。または、別な言い方では、任意の入力に起因する将来の出力エネルギーは、将来の入力がゼロだと仮定すれば、高々ハンケルノルムに入力のエネルギーを掛けたものである。
状態空間システム表現およびハンケルノルム
上記の記載から分かるように、ハンケルノルムは、システムを通じたエネルギー伝達の有効な尺度を提供する。しかしながら、ノルムがシステム次数およびその低減にどのように関連するかを理解するには、状態空間表現によってモデル化したシステムの内部力学を同定する必要がある。線型シフト不変(LSI)システムの状態空間モデルとその伝達関数との間の表現的関連は周知である。n次のSISO(Single−Input−Single−Output)システムを以下の伝達関数で記述すると、
w[k]εRn−1に関して、AεR(n−1)x(n−1),BεR(n−1)x1,CεR1x(n−1),およびDεRによって、このシステムは、以下の状態空間モデルS:[A,B,C,D]によって記述され得る。
w[k+1]=Aw[k]+Bx[k]
y[k]=Cw[k]+Dx[k] (9)
このシステムのZ変換は
zW(z)=AW(z)+BX(z)
Y(z)=CW(z)+DX(z)
であり、以下を与える。
Y(z)=[C(zI−A)−1B+D]X(z)=G(z)X(z) (10)
システム行列[A,B,C,D]はユニークではなく、代替の状態空間モデルが、例えば、v[k]に関して以下の相似変換を通じて取得され得ることに留意すべきである。可逆行例TεR(n−1)x(n−1),Tv=wに対して、以下を与える。
状態空間モデル
は、同一の伝達関数G(z)を有する。
本実施例の目的では、G(z)は安定したシステムである、すなわち、Sは安定していると仮定され、これは、A=λ(A)の固有値が全て単位円板|λ|<1上に存在することを意味すると理解されるべきである。
G(z)のハンケルノルムは、−∞<k≦−1に対する入力系列x[k]の結果としてw[0]に蓄えられたエネルギーと、その後このエネルギーのうちのどのくらいがk≧0に対する出力y[k]に送られるかに関して記述されてよい。
Sの内部エネルギーを記述するためには、次の2つのシステム特性を導入する必要がある。
(i)到達可能性(可制御性)グラム行列
および
(ii)可観測性グラム行列
Aは安定しているので、上記2つの総和は収束する。また、ペア(A,B)が制御可能な場合(このことは、w[0]から始まり、系列x[k],k>0はシステムをあらゆる任意の状態wにすることが可能であることを意味する)、かつその場合に限り、Pは対称的および正定値であると示すことは容易である。また、ペア(A,C)が観測可能な場合(このことは、任意の時間jにおけるシステムの状態は、k>jに対するシステム出力y[k]から決定可能であることを意味する)、その場合に限り、Qは対称的および正定値である。
PおよびQが以下のリアプノフ方程式の解として得られ得ると示すことは容易である。
APA+BB−P=0
および
QA+CC−Q=0
状態の観測エネルギーは、k≧0に対するw[0]=W0およびx[k]=0によって、軌道y[k]≧0のエネルギーである。以下の式を示すことは容易である。
最小制御エネルギー問題は、以下の最小エネルギーのものとして定義される
これは、最適制御における標準問題であり、
の場合に、以下の解を有する
k<0について、xopt[k]=B(A−(1+k)−1
上記を鑑みると、システムG(z)のハンケルノルムまたは同等にS:[A,B,C,D]を、QおよびPグラム行列に以下のように明確に関連付けることが可能である。
平衡状態空間システム表現
HRTFシステムにとって、適切な相似変換Tを計算することで以下のシステム実現
を取得して、そのシステム実現が以下の対角行列である等しい到達可能性および可観測性グラム行列を与えることは可能であることが理解されるべきである。
本開示の1つ以上の実施形態によれば、平衡状態空間システム表現の取得は、以下を含んでよい。
(i) G(z)から開始して、状態空間システムS:[A,B,C,D]であると決定する(例えば認識する)。
(ii) Sに対して、グラム行列が解かれてPおよびQを得る。
(iii) 線形代数が用いられ、以下の式を与える。
(iv) Wを単位とする因数分解P=MMおよびMQM=WT2Wにより、
である
となるよう、MおよびWが与えられる。
(v) (iv)からのTは、以下のようなシステムの新たな表現を取得するために使用されてよい。
(vi) (v)で取得した表現において、平衡状態が存在する。換言すると、システムを、1が位置iにある(0,0,..,1,0,..0)状態にする最小のエネルギーは
であり、システムがこの状態でリリースされると、その後、出力で回収されるエネルギーはである。
(vii) この平衡モデルでは、信号入力から出力までのエネルギー伝達の重要度に関して状態が順序付けられている。したがって、この構造では、状態の切捨ておよびG(z)の次数の低減は同等に、エネルギー伝達の重要度に関して状態を取り除く。
平衡状態空間システムに基づいた次数低減の実施例
以下に、FIR構造の状態空間モデルの生成および、上記の平衡システム表現を使用する次数低減を検討する。
本実施例は、伝達関数G(z)=[g+g−1+…g25−25]を有する以下の26点FIRフィルタg[k]を検討することから始まる。
以下により、25次の状態空間モデルが生成される。
図2に図示されるように、システムS:[A,B,C,D]は、ハンケル特異値(SV)を有する。
Sは
に変換される。ハンケルSVの構造(例えば図2に図示される)から、Sの6次の近似値が取得されてよい。システムは、したがって以下のように分割される。
次数が低減されたシステムは、
であり、これは、以下の次数が低減された伝達関数を与える。
比較のため、元のFIR G(z)と6次のIIR近似のインパルス応答が図3に図示される。図3に示すプロットにより、ほぼ損失のない整合であることが明らかになった。
また、比較のため、元のFIR G(z)と3次のIIR近似のインパルス応答が図4に図示される。
HRIRの平衡近似
仮想スピーカアレイおよびHRIRセット
以下に、CIPICセットの被験者15のHRIRを使用して出力がバイノーラルにミックスダウンされた、図5に図示されるような、スピーカのシンプルな正方形の配置に基づいた例示的なシナリオを記載する。これらは、44.1kHzで抽出された200点のHRIRであり、該セットは、HRIRの各ペア間の両耳間時間差(ITD)の測定値を含む関連データの範囲を含む。HRIRの伝達関数G(z)(例えば上記方程式(3))は、ゼロおよび各応答における開始遅延である複数の首位係数[g,...,g]を有し、以下の方程式(12)に示されるようなG(z)を与える。HRIRのペアの左右の開始時間の差は、HRIRのITDへの寄与を主に決定する。典型的な左HRTFの形式は、方程式(12)において与えられ、右HRTFは、同様な形式を有する。
ITDはITD=|m−m|により与えられ、これがCIPICデータベースにおける各HRIRペアに提供される。開始遅延に関連した過剰位相は、各G(z)が非最小位相であることを意味しており、HRTFの主要部分
は、非最小位相であることも示された。しかし、リスナーは、
のフィルタ効果を、H(z)で表されるその最小位相のバージョンと区別できないことも示された。したがって、FIRからIIRの近似の本実施例では、元のFIRのG(z)は、それらのFIRの最小位相では、H(z)、すなわち、各HRIRから開始遅延を取り除くアクションと同等である。
平衡実現を使用するSingle−Input−Single−Output IIR近似
1つ以上の実施形態によれば、平衡実現を使用するSISO(single−input−single−output)IIR近似は、例えば以下を含む容易な処理である。
(i) 各ノードにHRIR(l/r,1:200)を読み込む。
(ii) ケプストラムを使用して最小位相相当を取得し、HHRIR(l/r,1:200)を与える。
(iii) HHRIR(l/r,1:200)のSISO状態空間表現を、S:[A,B,C,D]として構築する。これは199次元の状態空間である。
(iv) 上記の平衡低減方法を使用し、次元rrのSの次数が低減されたバージョンを取得する。例えば、Srr:[Arr,Brr,Crr,Drr]である。
そのHRIRのケプストラムは、正の時間に取得された因果的サンプルおよび負の時間に取得された非因果的サンプルを有してよい。従って、ケプストラムの非因果的サンプルの各々に対して、負の時間に取得されたその非因果的サンプルを、その負の時間の反対の時間に取得されたケプストラムの因果的サンプルに加算することで、位相最小化演算が実行されてよい。ケプストラムの非因果的サンプルの各々に対する位相最小化演算の実行後にケプストラムの非因果的サンプルの各々をゼロに設定することで、最小位相HRIRは生成されてよい。
各ノードに対する12次(例えばrr=12に対する)による左右のHRIRの近似からの例示的な結果は、図10乃至図17に示すプロットにおいて表現されている。
図10乃至図17は、[+/−45度,+/−135度]、Fs=44100Hz、元のFIRは200点、IIR近似値が12次の場合の、CIPICのSubject 15の周波数応答を説明するグラフ表示である。
図10乃至図17にプロットされた結果は、12次のIR近似は、元のHRTFの大きさおよび位相の両方について、周波数応答に非常に近い整合を与えることを示す。これは、8x200Pt FIRを実行する代わりに、HRIR計算が8x[{6双二次}IIR部分+ ITD遅延線]として実行され得ることを意味する。
平衡実現を使用するMulti−Input−Multi−Output IIR近似
1つ以上の実施形態によれば、平衡実現を使用するMIMO(multi−input−multi−output)IIR近似は、上記SISOと同様に開始されてよい処理である。例えば、処理は以下を含んでよい。
(i) 各ノードにHRIR(l/r,1:200)を読み込む。
(ii) 上記のようにケプストラムを使用して最小位相相当を取得し、各ノードにHHRIR(l/r,1:200)を与える。
(iii) 各HHRIR(l/r,1:200)のSISO状態空間表現を、Sij:[Aij,Bij,Cij,Dij] for i=1,2 ≡left/right and j=1,2,3,4 ≡Node 1,2,3,4として構築する。各Sijは、199次元の状態空間システムである。ここで、Aij∈R199x199, Bij∈R199x1, Cij∈R1x199,およびDij∈R1x1である。
(iv) 例えば、4x199=796次元の内部状態空間と、4入力および2出力とを有する合成MIMOシステムを構築する。このシステムは、S:[A,B,C,D]であり、ただし、A,B,C,Dは以下のように構造化される。
この796次元のシステムは、本開示の1つまたは複数の実施形態にしたがって記載された、平衡低減方法を使用して低減されてよい。
少なくとも上記の例示的な実装においては、Sijの各々は、Sの生成の前に30次SISOシステムに低減される。この工程で、Sは4x30=120次元のシステムになる。これは、その後、図6に図示されるものと同様、例えばn=12次、4入力、2出力のシステムに低減されてよい。
以下にさらに詳細に記載されるように、本開示の方法およびシステムは、バイノーラルレンダリング処理の計算量を扱う。例えば、本開示の1つまたは複数の実施形態は、2M個のフィルタ関数を実装するために必要な算術演算の数を低減する方法およびシステムに関連する。
従来のバイノーラルレンダリングシステムは、HRTFフィルタ関数を組み込んでいる。これらの関数は、無限インパルス応答(IIR)フィルタ構造を使用した実装と共に有限インパルス応答(FIR)フィルタ構造を使用して実装される。FIR手法は、各耳に1つの出力サンプルを配信するために、長さnのフィルタを使用し、各HRTFに対してn個の乗加算(MA)演算(例えば400回)を必要とする。つまり、各バイノーラル出力は、nx2M個のMA演算を必要とする。例えば、典型的なバイノーラルレンダリングシステムでは、n=400が使用され得る。本開示に記載されたIIR手法は、m次の再帰構造を使用する(mは典型的には例えば12−25(15等)の範囲)。
IIRの計算負荷をFIRの計算負荷と比較するためには、分子および分母を考慮しなければならないことが理解されるべきである。各次数がmの2M個のSISO IIRに対しては、ほぼ2m×2M個のMA(つまり1つ乗算が少ない)である。MIMO構造に対しては、[(m−1)x2M+2m]MAであり、ただし{+2m}は共通の再帰部分である。MIMOにおけるmはSISOにおけるmより当然大きい。
従来の手法と異なり、本開示の方法およびシステムにおいては、例えば全ての左耳のHRTFに共通な再帰部(それぞれの右耳のHRTF)、または全ての同側の耳のHRTF等他の構造上の構成に共通な再帰部(それぞれの反対側の耳のHRTF)が存在する。
本開示の方法およびシステムは、アンビソニックオーディオシステムにおけるバイノーラルオーディオのレンダリングにとって、特に重要になり得る。これは、アンビソニックスは、仮想アレイにおける全てのスピーカを作動させるように、空間オーディオを配信するからである。したがって、Mが増加するにつれて、本技術の使用を通じた計算工程の節約は、より重要になる。
Mチャンネルから2チャンネルへの最終的なバイノーラルレンダリングは、従来はm個の個別の1対2エンコーダを使用して行われる。ただし、各エンコーダは、左右の耳の頭部伝達関数(HRTF)のペアである。したがって、システム記述は以下のHRTF演算子である。
Y(z)=G(z)X(z)
ここで、G(z)は以下の行列で与えられる。
FIRフィルタによって、各サブシステムは、以下の形式を有する。
(非最小位相
の場合、首位kij係数はゼロに等しい)
本開示の1つまたは複数の実施形態によれば、G(z)は、n次のMIMO状態空間システム
によって近似されてよい。これにより、図7に図示される例示的なMIMOバイノーラルレンダラ(例えばミキサ)システムが与えられる(1つ以上の実施形態によれば、3Dオーディオに使用されてよい。)
図7においては、ITDユニットサブシステムは、遅延線のペアのセットであり、入力チャンネル毎に、1つのペアのみが遅延となり、他は一致する。したがって、z領域において、以下のような入力/出力表現が存在する。
各ペア(1k2k)は(,)形式を有し、左耳が音源と同側である場合、=0であり、β>0がITD遅延であり、右耳が音源と同側である場合、反対に=0であり、α>0がITD遅延である。
平衡低減方法を使用してn次に低減された、M入力から2出力のMIMOシステム
は、HRTFセットを取得するために使用されてよい。そのHRTFセットは、以下のように記述され得る。
ここで、「.」はアダマール積を表す。この伝達関数行列は、各サブシステムが今度は同じ分母を有するため、上記のG(z)とは異なるこのサブシステムは、仮想スピーカjから左右の耳[i=1≡left i=2≡right]に対するHRTFのIIR形式であり、以下の形式を有する。
したがって、元のN点FIR HRTFを取得してそれらをn次{例えばn=N/10}で近似するために、(上記のような)MIMO手法への平衡低減が使用される場合は、バイノーラルレンダリングが図8に図示されるシステムとして実装されてよい。
1つ以上の実施形態によれば、図8に示される最終的なIIR部分は、空間効果フィルタリングと組み合わされてよいことに留意すべきである。
加えて、共通IIR部分を持つカスケードにおける個々の角度依存FIR部分へのこの因数分解が、実験的な研究結果と一致することが留意される。そのような実験は、HRIRが近似の因数分解にいかに適しているかを示した。
図9は、本明細書に記載された1つまたは複数の実施形態による、(例えば2M個の)フィルタ関数を実装するために必要な算術演算の数を低減することでバイノーラルレンダリングを行うために配置された例示的なコンピューティング装置(900)のハイレベルブロック図である。ごく基本的な構成(901)においては、コンピューティング装置(900)は、典型的には1つまたは複数のプロセッサ(910)およびシステムメモリ(920)を含む。メモリバス(930)は、プロセッサ(910)とシステムメモリ(920)との間の通信に使用されてよい。
所望の構成によって、プロセッサ(910)は任意の種類でよく、マイクロプロセッサ(μP)、マイクロコントローラ(μC)、デジタルシグナルプロセッサ(DSP)等、またはそれらの任意の組み合わせを含むがそれに限定されない。プロセッサ(910)は、レベル1キャッシュ(911)およびレベル2キャッシュ(912)等の1つまたは複数のレベルのキャッシングと、プロセッサコア(913)と、レジスタ(914)とを含んでよい。プロセッサコア(913)は、演算論理ユニット(ALU)、浮動小数点ユニット(FPU)、デジタル信号処理コア(DSP Core)等、またはそれらの任意の組み合わせを含んでよい。メモリコントローラ(915)は、プロセッサ(910)と共に使用されてよい。またはいくつかの実装では、メモリコントローラ(915)は、プロセッサ(910)の内部にあってよい。
所望の構成によって、システムメモリ(920)は任意の種類でよく、揮発性メモリ(RAM等)、不揮発性メモリ(ROM、フラッシュメモリ等)、またはそれらの任意の組み合わせを含むがそれに限定されない。システムメモリ(920)は、典型的にはオペレーティングシステム(921)と、1つまたは複数のアプリケーション(922)と、プログラムデータ(924)とを含む。アプリケーション(922)は、バイノーラルレンダリングのためのシステム(923)を含んでよい。本開示の1つ以上の実施形態によれば、バイノーラルレンダリングのためのシステム(923)は、バイノーラルレンダリング処理の計算量を低減するよう設計される。例えば、バイノーラルレンダリングのためのシステム(923)は、上記2M個のフィルタ関数を実装するために必要な算術演算の数を低減することが可能である。
プログラムデータ(924)は、1つまたは複数の演算装置に実行されると、システム(923)およびバイノーラルレンダリングの方法を実装する、記憶された命令を含んでよい。加えて、1つ以上の実施形態によれば、プログラムデータ(924)は、例えば、1つまたは複数の仮想スピーカからのマルチチャンネルオーディオ信号データに関連してよいオーディオデータ(925)を含んでよい。少なくともいくつかの実施形態によれば、アプリケーション(922)は、オペレーティングシステム(921)上でプログラムデータ(924)と動作するよう構成されてよい。
コンピューティング装置(900)は、追加の特徴または機能と、基本構成(901)と任意の必要な装置およびインターフェースとの間の通信を行う追加のインターフェースとを有してよい。
システムメモリ(920)はコンピュータストレージメディアの一例である。コンピュータストレージメディアは、RAM、ROM、EEPROM、フラッシュメモリ、もしくは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)、もしくは他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置、もしくは他の磁気記憶装置、または所望の情報を記憶するために使用可能およびコンピューティング装置(900)によりアクセス可能な任意の他の媒体を含むがそれに限定されない。任意のそのようなコンピュータ記憶媒体は、コンピューティング装置(900)の一部でよい。
コンピューティング装置(900)は、携帯電話、スマートフォン、携帯情報端末(PDA)、パーソナルメディアプレイヤー装置、タブレットコンピュータ(タブレット)、無線ウェブ閲覧装置、パーソナルヘッドセット装置、特定用途向け装置、または上記の機能のいずれかを含むハイブリッド装置等のスモール・フォーム・ファクター・ポータブル(またはモバイル)電子装置の一部として実装されてよい。加えて、コンピューティング装置(900)はまた、ラップトップコンピュータ構成および非ラップトップコンピュータ構成の両方、1つまたは複数のサーバ、モノのインターネットシステム等を含むパーソナルコンピュータとして実装されてもよい。
図18は、バイノーラルレンダリングを実行する例示的方法1800を説明する。方法1800は、図9に関連して記載されたソフトウェア構成により実行されてよい。ソフトウェア構成は、コンピューティング装置900のメモリ920に常駐し、プロセッサ910により実行される。
1802において、コンピューティング装置900は、複数の仮想スピーカのうちの1つの仮想スピーカと人間のリスナーの耳とに関連した複数のHRIRの各々を取得する。複数のHRIRの各々は、その仮想スピーカにより生成されるオーディオインパルスに応じて決定される、左または右耳における特定のサンプリングレートで生成される音場のサンプルを含む。
1804において、コンピューティング装置900は、複数のHRIRの各々の第1状態空間表現を生成する。第1状態空間表現は、行列、列ベクトル、および行ベクトルを含む。第1状態空間表現の行列、列ベクトル、および行ベクトルの各々は、第1サイズを有する。
1806において、コンピューティング装置900は、状態空間削減演算を実行することで、複数のHRIRの各々の第2状態空間表現を生成する。第2空間表現は、行列、列ベクトル、および行ベクトルを含む。第2状態空間表現の行列、列ベクトル、および行ベクトルの各々は、第1サイズよりも小さい第2サイズを有する。
1808において、コンピューティング装置900は、第2状態表現に基づいて複数の頭部伝達関数(HRTF)を生成する。複数のHRTFの各々は、複数のHRIRのそれぞれのHRIRに対応する。それぞれのHRIRに対応するHRTFは、それぞれのHRIRが関連する仮想スピーカにより生成される周波数領域音場が乗算されると、人間のリスナーの耳にレンダリングされる音場の成分を生成する。
前述の詳細な記載は、ブロック図、フローチャート、および/または実施例の使用を通じて装置および/または処理の様々な実施形態を説明してきた。そのようなブロック図、フローチャート、および/または実施例が1つまたは複数の機能および/または演算を含む限り、広い範囲のハードウェア、ソフトウェア、ファームウェア、または仮想的にそれらの任意の組み合わせによって、そのようなブロック図、フローチャート、または実施例内の各機能および/または演算は、個別および/または集合的に、実装可能であることが当業者に理解されるであろう。1つ以上の実施形態によれば、本明細書に記載された本主題の複数の部分は、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、デジタル信号処理装置(DSP)、または他の集積形式を介して実装されてよい。しかしながら、当業者は、本明細書に開示された実施形態のいくつかの態様は、全体的にまたは部分的に、1つまたは複数のコンピュータ上で動作する1つまたは複数のコンピュータプログラムとして、1つまたは複数のプロセッサ上で動作する1つまたは複数のプログラムとしてファームウェアとして、または仮想的にそれらの任意の組み合わせとして集積回路において同等に実装可能であること、また回路の設計および/またはソフトウェアおよび/またはファームウェアに対するコードの記述は、本開示に照らして、十分に当業者の能力の範囲内であることを認識するであろう。
加えて、当業者は、本明細書に記載された本主題の機構は、プログラム製品として様々な形式で配布可能であること、また本明細書に記載された本主題の例示の実施形態は、配布を実際に行うために使用される非一時的な信号保持媒体の特定の型式に関わらずに、適用されることを理解するであろう。非一時的な信号保持媒体の例は、例えばフロッピー(登録商標)ディスク、ハードディスクドライブ、コンパクトディスク(CD)、デジタルビデオディスク(DVD)、デジタルテープ、コンピュータメモリ等の記録可能型媒体と、デジタルおよび/またはアナログ通信媒体(例えば、光ファイバーケーブル、導波管、有線通信リンク、無線通信リンク等)等の透過型媒体とを含むがそれに限定されない。
本明細書の実質的にいかなる複数形および/または単数形の用語の使用に関しても、当業者は、文脈および/または適用に適切なように、複数形から単数形に、および/または単数形から複数形に解釈してよい。様々な単数/複数の順番が、本明細書において、明確性のために明示的に述べられてよい。
このように、本主題の特定の実施形態が記載されてきた。他の実施形態は、以下の請求項の範囲内である。いくつかの場合では、請求項に記載された動作は異なる順番で実行されてよく、それでも所望の結果を達成する。加えて、添付の図面に記載された処理は、所望の結果を達成するにあたり、示された特定の順、および順番を必ずしも必要としない。ある実装では、マルチタスキングおよび平行処理は有利であり得る。

Claims (20)

  1. 人間のリスナーの左耳および右耳に音場をレンダリングする方法であって、前記音場は、複数の仮想スピーカによって生成され、前記方法は、
    前記人間のリスナーの頭の前記左耳および前記右耳に前記音場をレンダリングするよう構成されたサウンドレンダリングコンピュータの処理回路が、複数の頭部インパルス応答(HRIR)を取得する工程であって、前記複数のHRIRの各々は、前記複数の仮想スピーカのうちの1つの仮想スピーカと前記人間のリスナーの一方の耳とに関連付けられており、前記複数のHRIRの各々は、前記1つの仮想スピーカにより生成されるオーディオインパルスに応じて生成される、特定のサンプリングレートで生成される左耳または右耳における音場のサンプルを含む工程と、
    前記複数のHRIRの各々の第1状態空間表現を生成する工程であって、前記第1状態空間表現は、行列、列ベクトル、および行ベクトルを含み、前記第1状態空間表現の前記行列、前記列ベクトル、および前記行ベクトルの各々は、第1サイズを有する工程と、
    状態空間削減演算を実行することで、前記複数のHRIRの各々の第2状態空間表現を生成する工程であって、前記第2空間表現は、行列、列ベクトル、および行ベクトルを含み、前記第2状態空間表現の前記行列、前記列ベクトル、および前記行ベクトルの各々は、第1サイズよりも小さい第2サイズを有する、状態空間削減演算実行工程と、
    前記第2状態表現に基づいて複数の頭部伝達関数(HRTF)を生成する工程であって、前記複数のHRTFの各々は、前記複数のHRIRのそれぞれのHRIRに対応しており、それぞれのHRIRに対応しているHRTFは、該HRIRが関連付けられている前記仮想スピーカにより生成される周波数領域音場が乗算されると、前記人間のリスナーの一方の耳にレンダリングされる音場の成分を生成する工程と、を備える方法。
  2. 前記状態空間削減演算実行工程は、前記複数のHRIRの各HRIRに対して、
    該HRIRの前記第1状態空間表現に基づき、それぞれのグラム行列を生成する工程であって、前記グラム行列は、大きさ順に並べられた複数の固有値を有する工程と、
    前記グラム行列および前記複数の固有値に基づき、該HRIRの前記第2状態空間表現を生成する工程であって、前記第2サイズは、前記複数の固有値のうち、特定の閾値を超える固有値の数に等しい、工程と、を含む請求項1に記載の方法。
  3. 前記複数のHRIRの各HRIRの前記第2状態空間表現を生成する工程は、該HRIRの前記第1状態空間表現に基づく前記グラム行列に適用された場合に対角行列を生成する変換行列を形成する工程であって、前記対角行列の各対角要素は、前記複数の固有値のそれぞれの固有値に等しい工程を含む請求項2に記載の方法。
  4. 前記複数のHRIRの各々に対して、
    該HRIRのケプストラムを生成する工程であって、前記ケプストラムは、正の時間に取得された因果的サンプルおよび負の時間に取得された非因果的サンプルを有する工程と、
    前記ケプストラムの前記非因果的サンプルの各々に対して、負の時間に取得された該非因果的サンプルを、該負の時間の反対の時間に取得された前記ケプストラムの因果的サンプルに加算することで、位相最小化演算を実行する工程と、
    前記ケプストラムの前記非因果的サンプルの各々に対する前記位相最小化演算の実行後に、前記ケプストラムの前記非因果的サンプルの各々をゼロに設定することで、最小位相HRIRを生成する工程と、をさらに備える請求項1に記載の方法。
  5. MIMO(multiple input, multiple output)状態空間表現を生成する工程であって、前記MIMO状態空間表現は、合成行列、列ベクトル行列、および行ベクトル行列を含み、前記MIMO状態空間表現の前記合成行列は、前記複数のHRIRの各々の第1表現の前記行列を含み、前記MIMO状態空間表現の前記列ベクトル行列は、前記複数のHRIRの各々の第1表現の前記列ベクトルを含み、前記MIMO状態空間表現の前記行ベクトル行列は、前記複数のHRIRの各々の第1表現の前記行ベクトルを含む、MIMO状態空間表現生成工程と、をさらに備え、
    前記状態空間削減演算実行工程は、削減合成行列、削減列ベクトル行列、および削減行ベクトル行列を生成する工程であって、前記削減合成行列、削減列ベクトル行列、および削減行ベクトル行列の各々は、前記合成行列、前記列ベクトル行列、および前記行ベクトル行列のサイズよりそれぞれ小さいサイズを有する工程を含む請求項1に記載の方法。
  6. 前記MIMO状態空間表現生成工程は、
    前記MIMO状態空間表現の前記合成行列として第1ブロック行列を形成する工程であって、前記第1ブロック行列は、前記複数の仮想スピーカのうちの1つの仮想スピーカに関連付けられているHRIRの前記第1状態空間表現の行列を、前記第1ブロック行列の対角要素として有し、同様の仮想スピーカに関連付けられているHRIRの前記第1状態空間表現の行列は、前記第1ブロック行列の隣接する対角要素に存在する工程と、
    前記MIMO状態空間表現の前記列ベクトル行列として第2ブロック行列を形成する工程であって、前記第2ブロック行列は、前記複数の仮想スピーカのうちの1つの仮想スピーカに関連付けられているHRIRの前記第1状態空間表現の列ベクトルを、前記第2ブロック行列の対角要素として有し、同様の仮想スピーカに関連付けられているHRIRの前記第1状態空間表現の列ベクトルは、前記第2ブロック行列の隣接する対角要素に存在する工程と、
    前記MIMO状態空間表現の前記行ベクトル行列として第3ブロック行列を形成する工程であって、前記第3ブロック行列は、前記複数の仮想スピーカのうちの1つの仮想スピーカに関連付けられているHRIRの前記第1状態空間表現の行ベクトルを、前記第3ブロック行列の要素として有し、前記左耳における音をレンダリングするHRIRの前記第1状態空間表現の行ベクトルは、前記第3ブロック行列の第1行の奇数番目の要素に存在しており、前記右耳における音をレンダリングするHRIRの前記第1状態空間表現の行ベクトルは、前記第3ブロック行列の第2行の偶数番目の要素に存在している工程と、を含む請求項5に記載の方法。
  7. 前記MIMO状態空間表現生成工程の前に、前記複数のHRIRの各HRIRに対して、SISO(single input single output)状態空間削減演算を実行することで、該HRIRの前記第1状態空間表現として、該HRIRのSISO状態空間表現を生成する工程をさらに備える請求項5に記載の方法。
  8. 前記複数の仮想スピーカの各々に対して、該仮想スピーカに関連付けられている前記複数のHRIRに左HRIRおよび右HRIRが存在しており、前記左HRIRは、該仮想スピーカにより生成される前記周波数領域音場が乗算されると、前記人間のリスナーの前記左耳にレンダリングされる前記音場の前記成分を生成し、前記右HRIRは、該仮想スピーカにより生成される前記周波数領域音場が乗算されると、前記人間のリスナーの前記右耳にレンダリングされる前記音場の前記成分を生成し、
    前記複数の仮想スピーカの各々に対して、該仮想スピーカに関連付けられている前記左HRIRと該仮想スピーカに関連付けられている前記右HRIRとの間の両耳間時間差(ITD)が存在しており、前記ITDは、ゼロ値を有する前記左HRIRの前記音場の初期サンプルの数と、ゼロ値を有する前記右HRIRの前記音場の初期サンプルの数との間の差により、前記左HRIRおよび前記右HRIRにおいて顕著になる請求項1に記載の方法。
  9. 前記複数の仮想スピーカの各々に関連付けられている左HRIRと右HRIRとの間の前記ITDに基づいてITDユニットサブシステム行列を生成する工程と、
    前記複数のHRTFに前記ITDユニットサブシステム行列を乗算することで、複数の遅延HRTFを生成する工程と、をさらに備える請求項8に記載の方法。
  10. 前記複数のHRTFの各々は、有限インパルスフィルタ(FIR)で表され、
    前記方法は、前記複数のHRTFの各々に対して変換演算を実行することで、別の複数のHRTFを生成する工程であって、前記別の複数のHRTFの各々が無限インパルス応答フィルタ(IIR)で表される工程をさらに備える請求項1に記載の方法。
  11. 非一時的な記憶媒体を備えるコンピュータプログラム製品であって、前記コンピュータプログラム製品は、人間のリスナーの左耳および右耳に音場をレンダリングするよう構成されたサウンドレンダリングコンピュータの処理回路により実行された場合、前記処理回路に方法を実行させるコードを含み、前記方法は、
    複数の頭部インパルス応答(HRIR)を取得する工程であって、前記複数のHRIRの各々は、複数の仮想スピーカのうちの1つの仮想スピーカと前記人間のリスナーの一方の耳とに関連付けられており、前記複数のHRIRの各々は、前記1つの仮想スピーカにより生成されるオーディオインパルスに応じて生成される、特定のサンプリングレートで生成される左耳または右耳における音場のサンプルを含む工程と、
    前記複数のHRIRの各々の第1状態空間表現を生成する工程であって、前記第1状態空間表現は、行列、列ベクトル、および行ベクトルを含み、前記第1状態空間表現の前記行列、前記列ベクトル、および前記行ベクトルの各々は、第1サイズを有する工程と、
    状態空間削減演算を実行することで、前記複数のHRIRの各々の第2状態空間表現を生成する工程であって、前記第2空間表現は、行列、列ベクトル、および行ベクトルを含み、前記第2状態空間表現の前記行列、前記列ベクトル、および前記行ベクトルの各々は、第1サイズよりも小さい第2サイズを有する、状態空間削減演算実行工程と、
    前記第2状態表現に基づいて複数の頭部伝達関数(HRTF)を生成する工程であって、前記複数のHRTFの各々は、前記複数のHRIRのそれぞれのHRIRに対応しており、それぞれのHRIRに対応しているHRTFは、該HRIRが関連付けられている前記仮想スピーカにより生成される周波数領域音場が乗算されると、前記人間のリスナーの一方の耳にレンダリングされる音場の成分を生成する工程と、を備えるコンピュータプログラム製品。
  12. 前記状態空間削減演算実行工程は、前記複数のHRIRの各HRIRに対して、
    該HRIRの前記第1状態空間表現に基づき、それぞれのグラム行列を生成する工程であって、前記グラム行列は、大きさ順に並べられた複数の固有値を有する工程と、
    前記グラム行列および前記複数の固有値に基づき、該HRIRの前記第2状態空間表現を生成する工程であって、前記第2サイズは、前記複数の固有値のうち、特定の閾値を超える固有値の数に等しい、工程と、を含む請求項11に記載のコンピュータプログラム製品。
  13. 前記複数のHRIRの各HRIRの前記第2状態空間表現を生成する工程は、該HRIRの前記第1状態空間表現に基づく前記グラム行列に適用された場合に対角行列を生成する変換行列を形成する工程であって、前記対角行列の各対角要素は、前記複数の固有値のそれぞれの固有値に等しい工程を含む請求項12に記載のコンピュータプログラム製品。
  14. 前記方法は、前記複数のHRIRの各々に対して、
    該HRIRのケプストラムを生成する工程であって、前記ケプストラムは、正の時間に取得された因果的サンプルおよび負の時間に取得された非因果的サンプルを有する工程と、
    前記ケプストラムの前記非因果的サンプルの各々に対して、負の時間に取得された該非因果的サンプルを、該負の時間の反対の時間に取得された前記ケプストラムの因果的サンプルに加算することで、位相最小化演算を実行する工程と、
    前記ケプストラムの前記非因果的サンプルの各々に対する前記位相最小化演算の実行後に、前記ケプストラムの前記非因果的サンプルの各々をゼロに設定することで、最小位相HRIRを生成する工程と、をさらに備える請求項11に記載のコンピュータプログラム製品。
  15. 前記方法は、MIMO(multiple input, multiple output)状態空間表現を生成する工程であって、前記MIMO状態空間表現は、合成行列、列ベクトル行列、および行ベクトル行列を含み、前記MIMO状態空間表現の前記合成行列は、前記複数のHRIRの各々の第1表現の前記行列を含み、前記MIMO状態空間表現の前記列ベクトル行列は、前記複数のHRIRの各々の第1表現の前記列ベクトルを含み、前記MIMO状態空間表現の前記行ベクトル行列は、前記複数のHRIRの各々の第1表現の前記行ベクトルを含む、MIMO状態空間表現生成工程と、をさらに備え、
    前記状態空間削減演算実行工程は、削減合成行列、削減列ベクトル行列、および削減行ベクトル行列を生成する工程であって、前記削減合成行列、削減列ベクトル行列、および削減行ベクトル行列の各々は、前記合成行列、前記列ベクトル行列、および前記行ベクトル行列のサイズよりそれぞれ小さいサイズを有する工程を含む請求項1に記載のコンピュータプログラム製品。
  16. 前記MIMO状態空間表現生成工程は、
    前記MIMO状態空間表現の前記合成行列として第1ブロック行列を形成する工程であって、前記第1ブロック行列は、前記複数の仮想スピーカのうちの1つの仮想スピーカに関連付けられているHRIRの前記第1状態空間表現の行列を、前記第1ブロック行列の対角要素として有し、同様の仮想スピーカに関連付けられているHRIRの前記第1状態空間表現の行列は、前記第1ブロック行列の隣接する対角要素に存在する工程と、
    前記MIMO状態空間表現の前記列ベクトル行列として第2ブロック行列を形成する工程であって、前記第2ブロック行列は、前記複数の仮想スピーカのうちの1つの仮想スピーカに関連付けられているHRIRの前記第1状態空間表現の列ベクトルを、前記第2ブロック行列の対角要素として有し、同様の仮想スピーカに関連付けられているHRIRの前記第1状態空間表現の列ベクトルは、前記第2ブロック行列の隣接する対角要素に存在する工程と、
    前記MIMO状態空間表現の前記行ベクトル行列として第3ブロック行列を形成する工程であって、前記第3ブロック行列は、前記複数の仮想スピーカのうちの1つの仮想スピーカに関連付けられているHRIRの前記第1状態空間表現の行ベクトルを、前記第3ブロック行列の要素として有し、前記左耳における音をレンダリングするHRIRの前記第1状態空間表現の行ベクトルは、前記第3ブロック行列の第1行の奇数番目の要素に存在しており、前記右耳における音をレンダリングするHRIRの前記第1状態空間表現の行ベクトルは、前記第3ブロック行列の第2行の偶数番目の要素に存在している工程と、を含む請求項15に記載のコンピュータプログラム製品。
  17. 前記複数の仮想スピーカの各々に対して、該仮想スピーカに関連付けられている前記複数のHRIRに左HRIRおよび右HRIRが存在しており、前記左HRIRは、該仮想スピーカにより生成される前記周波数領域音場が乗算されると、前記人間のリスナーの前記左耳にレンダリングされる前記音場の前記成分を生成し、前記右HRIRは、該仮想スピーカにより生成される前記周波数領域音場が乗算されると、前記人間のリスナーの前記右耳にレンダリングされる前記音場の前記成分を生成し、
    前記複数の仮想スピーカの各々に対して、該仮想スピーカに関連付けられている前記左HRIRと該仮想スピーカに関連付けられている前記右HRIRとの間の両耳間時間差(ITD)が存在しており、前記ITDは、ゼロ値を有する前記左HRIRの前記音場の初期サンプルの数と、ゼロ値を有する前記右HRIRの前記音場の初期サンプルの数との間の差により、前記左HRIRおよび前記右HRIRにおいて顕著になる請求項11に記載のコンピュータプログラム製品。
  18. 前記方法は、
    前記複数の仮想スピーカの各々に関連付けられている左HRIRと右HRIRとの間の前記ITDに基づいてITDユニットサブシステム行列を生成する工程と、
    前記複数のHRTFに前記ITDユニットサブシステム行列を乗算することで、複数の遅延HRTFを生成する工程と、をさらに備える請求項17に記載のコンピュータプログラム製品。
  19. 前記複数のHRTFの各々は、有限インパルスフィルタ(FIR)で表され、
    前記方法は、前記複数のHRTFの各々に対して変換演算を実行することで、別の複数のHRTFを生成する工程であって、前記別の複数のHRTFの各々が無限インパルス応答フィルタ(IIR)で表される工程をさらに備える請求項11記載のコンピュータプログラム製品。
  20. 人間のリスナーの左耳および右耳に音場をレンダリングするよう構成された電子装置であって、前記電子装置は、
    メモリと、
    メモリに接続された制御回路と、を備え、前記制御回路は、
    複数の頭部インパルス応答(HRIR)を取得する工程であって、前記複数のHRIRの各々は、複数の仮想スピーカのうちの1つの仮想スピーカと前記人間のリスナーの一方の耳とに関連付けられており、前記複数のHRIRの各々は、前記1つの仮想スピーカにより生成されるオーディオインパルスに応じて生成される、特定のサンプリングレートで生成される左耳または右耳における音場のサンプルを含む工程と、
    前記複数のHRIRの各々の第1状態空間表現を生成する工程であって、前記第1状態空間表現は、行列、列ベクトル、および行ベクトルを含み、前記第1状態空間表現の前記行列、前記列ベクトル、および前記行ベクトルの各々は、第1サイズを有する工程と、
    状態空間削減演算を実行することで、前記複数のHRIRの各々の第2状態空間表現を生成する工程であって、前記第2空間表現は、行列、列ベクトル、および行ベクトルを含み、前記第2状態空間表現の前記行列、前記列ベクトル、および前記行ベクトルの各々は、第1サイズよりも小さい第2サイズを有する工程と、
    前記第2状態表現に基づいて複数の頭部伝達関数(HRTF)を生成する工程であって、前記複数のHRTFの各々は、前記複数のHRIRのそれぞれのHRIRに対応しており、それぞれのHRIRに対応しているHRTFは、該HRIRが関連付けられている前記仮想スピーカにより生成される周波数領域音場が乗算されると、前記人間のリスナーの一方の耳にレンダリングされる音場の成分を生成する工程と、を実行するよう構成される電子装置。
JP2018524370A 2016-02-18 2017-02-08 信号処理方法および仮想スピーカアレイにオーディオをレンダリングするシステム Active JP6591671B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662296934P 2016-02-18 2016-02-18
US62/296,934 2016-02-18
US15/426,629 US10142755B2 (en) 2016-02-18 2017-02-07 Signal processing methods and systems for rendering audio on virtual loudspeaker arrays
US15/426,629 2017-02-07
PCT/US2017/017000 WO2017142759A1 (en) 2016-02-18 2017-02-08 Signal processing methods and systems for rendering audio on virtual loudspeaker arrays

Publications (2)

Publication Number Publication Date
JP2019502296A true JP2019502296A (ja) 2019-01-24
JP6591671B2 JP6591671B2 (ja) 2019-10-16

Family

ID=58057309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018524370A Active JP6591671B2 (ja) 2016-02-18 2017-02-08 信号処理方法および仮想スピーカアレイにオーディオをレンダリングするシステム

Country Status (8)

Country Link
US (1) US10142755B2 (ja)
EP (1) EP3351021B1 (ja)
JP (1) JP6591671B2 (ja)
KR (1) KR102057142B1 (ja)
AU (1) AU2017220320B2 (ja)
CA (1) CA3005135C (ja)
GB (1) GB2549826B (ja)
WO (1) WO2017142759A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10142755B2 (en) 2016-02-18 2018-11-27 Google Llc Signal processing methods and systems for rendering audio on virtual loudspeaker arrays
US9992602B1 (en) * 2017-01-12 2018-06-05 Google Llc Decoupled binaural rendering
US10009704B1 (en) 2017-01-30 2018-06-26 Google Llc Symmetric spherical harmonic HRTF rendering
US10158963B2 (en) 2017-01-30 2018-12-18 Google Llc Ambisonic audio with non-head tracked stereo based on head position and time
JP6920144B2 (ja) * 2017-09-07 2021-08-18 日本放送協会 バイノーラル再生用の係数行列算出装置及びプログラム
JP6889883B2 (ja) * 2017-09-07 2021-06-18 日本放送協会 音響信号用の制御器設計装置及びプログラム
US10667072B2 (en) * 2018-06-12 2020-05-26 Magic Leap, Inc. Efficient rendering of virtual soundfields
WO2019241760A1 (en) 2018-06-14 2019-12-19 Magic Leap, Inc. Methods and systems for audio signal filtering
CN113348681B (zh) * 2019-01-21 2023-02-24 外部回声公司 通过时变递归滤波器结构的虚拟声学渲染的方法与系统
US11076257B1 (en) * 2019-06-14 2021-07-27 EmbodyVR, Inc. Converting ambisonic audio to binaural audio
CN110705154B (zh) * 2019-09-24 2020-08-14 中国航空工业集团公司西安飞机设计研究所 航空器开环气动伺服弹性系统模型均衡降阶的优选方法
EP4169266A1 (en) 2020-06-17 2023-04-26 Telefonaktiebolaget LM ERICSSON (PUBL) Head-related (hr) filters
US11496852B2 (en) * 2020-12-03 2022-11-08 Snap Inc. Head-related transfer function
CN112861074B (zh) * 2021-03-09 2022-10-04 东北电力大学 基于Hankel-DMD的电力系统机电参数提取方法
WO2023220164A1 (en) * 2022-05-10 2023-11-16 Bacch Laboratories, Inc. Method and device for processing hrtf filters
CN115209336B (zh) * 2022-06-28 2024-10-29 华南理工大学 一种多个虚拟源动态双耳声重放方法、装置及存储介质
WO2024206901A2 (en) * 2023-03-31 2024-10-03 Iyo Inc. Virtual auditory display filters and associated systems, methods, and non-transitory computer-readable media

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006217632A (ja) * 2005-02-04 2006-08-17 Lg Electronics Inc 三次元立体音響生成方法、三次元立体音響生成装置及び移動端末機
JP2008502200A (ja) * 2004-06-04 2008-01-24 サムスン エレクトロニクス カンパニー リミテッド ワイドステレオ再生方法及びその装置
WO2014193993A1 (en) * 2013-05-29 2014-12-04 Qualcomm Incorporated Filtering with binaural room impulse responses
US20150213809A1 (en) * 2014-01-30 2015-07-30 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
JP2015530825A (ja) * 2012-08-31 2015-10-15 ドルビー ラボラトリーズ ライセンシング コーポレイション 種々の聴取環境におけるオブジェクトに基づくオーディオのレンダリング及び再生のためのシステム

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5757927A (en) * 1992-03-02 1998-05-26 Trifield Productions Ltd. Surround sound apparatus
JPH08502867A (ja) 1992-10-29 1996-03-26 ウィスコンシン アラムニ リサーチ ファンデーション 指向性音を作る方法及び装置
US6243476B1 (en) * 1997-06-18 2001-06-05 Massachusetts Institute Of Technology Method and apparatus for producing binaural audio for a moving listener
DE102004035046A1 (de) * 2004-07-20 2005-07-21 Siemens Audiologische Technik Gmbh Hörhilfe-oder Kommunikationssystem mit virtuellen Signalquellen
GB0419346D0 (en) 2004-09-01 2004-09-29 Smyth Stephen M F Method and apparatus for improved headphone virtualisation
US8467552B2 (en) 2004-09-17 2013-06-18 Lsi Corporation Asymmetric HRTF/ITD storage for 3D sound positioning
US7634092B2 (en) 2004-10-14 2009-12-15 Dolby Laboratories Licensing Corporation Head related transfer functions for panned stereo audio content
US7715575B1 (en) * 2005-02-28 2010-05-11 Texas Instruments Incorporated Room impulse response
JP4741261B2 (ja) * 2005-03-11 2011-08-03 株式会社日立製作所 ビデオ会議システム、プログラムおよび会議端末
JP4608400B2 (ja) * 2005-09-13 2011-01-12 株式会社日立製作所 音声通話システムおよび音声通話中におけるコンテンツの提供方法
EP1982326A4 (en) * 2006-02-07 2010-05-19 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
WO2007101958A2 (fr) * 2006-03-09 2007-09-13 France Telecom Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal
FR2899423A1 (fr) * 2006-03-28 2007-10-05 France Telecom Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme.
FR2899424A1 (fr) * 2006-03-28 2007-10-05 France Telecom Procede de synthese binaurale prenant en compte un effet de salle
US8374365B2 (en) * 2006-05-17 2013-02-12 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
US9197977B2 (en) * 2007-03-01 2015-11-24 Genaudio, Inc. Audio spatialization and environment simulation
US9037468B2 (en) * 2008-10-27 2015-05-19 Sony Computer Entertainment Inc. Sound localization for user in motion
KR20100071617A (ko) 2008-12-19 2010-06-29 동의과학대학 산학협력단 무한 임펄스 응답 필터 머리전달함수를 이용한 입체음향 장치 및 이에 사용되는 디지털 신호 프로세서
US8660281B2 (en) * 2009-02-03 2014-02-25 University Of Ottawa Method and system for a multi-microphone noise reduction
US20110026745A1 (en) * 2009-07-31 2011-02-03 Amir Said Distributed signal processing of immersive three-dimensional sound for audio conferences
US9522330B2 (en) * 2010-10-13 2016-12-20 Microsoft Technology Licensing, Llc Three-dimensional audio sweet spot feedback
US20130208900A1 (en) * 2010-10-13 2013-08-15 Microsoft Corporation Depth camera with integrated three-dimensional audio
US20130208897A1 (en) * 2010-10-13 2013-08-15 Microsoft Corporation Skeletal modeling for world space object sounds
US20130208926A1 (en) * 2010-10-13 2013-08-15 Microsoft Corporation Surround sound simulation with virtual skeleton modeling
US20130208899A1 (en) * 2010-10-13 2013-08-15 Microsoft Corporation Skeletal modeling for positioning virtual object sounds
TWI517028B (zh) * 2010-12-22 2016-01-11 傑奧笛爾公司 音訊空間定位和環境模擬
RU2595943C2 (ru) * 2011-01-05 2016-08-27 Конинклейке Филипс Электроникс Н.В. Аудиосистема и способ оперирования ею
JP5704013B2 (ja) * 2011-08-02 2015-04-22 ソニー株式会社 ユーザ認証方法、ユーザ認証装置、およびプログラム
US9641951B2 (en) * 2011-08-10 2017-05-02 The Johns Hopkins University System and method for fast binaural rendering of complex acoustic scenes
US10585472B2 (en) * 2011-08-12 2020-03-10 Sony Interactive Entertainment Inc. Wireless head mounted display with differential rendering and sound localization
US9131305B2 (en) * 2012-01-17 2015-09-08 LI Creative Technologies, Inc. Configurable three-dimensional sound system
US10321252B2 (en) * 2012-02-13 2019-06-11 Axd Technologies, Llc Transaural synthesis method for sound spatialization
GB201211512D0 (en) * 2012-06-28 2012-08-08 Provost Fellows Foundation Scholars And The Other Members Of Board Of The Method and apparatus for generating an audio output comprising spartial information
US9569073B2 (en) * 2012-11-22 2017-02-14 Razer (Asia-Pacific) Pte. Ltd. Method for outputting a modified audio signal and graphical user interfaces produced by an application program
JP5954147B2 (ja) * 2012-12-07 2016-07-20 ソニー株式会社 機能制御装置およびプログラム
MX2015008836A (es) * 2013-01-14 2015-10-14 Koninkl Philips Nv Codificador y decodificador de multiples canales con transmision eficiente de informacion de posicion.
WO2014111765A1 (en) * 2013-01-15 2014-07-24 Koninklijke Philips N.V. Binaural audio processing
US9973871B2 (en) * 2013-01-17 2018-05-15 Koninklijke Philips N.V. Binaural audio processing with an early part, reverberation, and synchronization
US9820074B2 (en) * 2013-03-15 2017-11-14 Apple Inc. Memory management techniques and related systems for block-based convolution
WO2014145893A2 (en) * 2013-03-15 2014-09-18 Beats Electronics, Llc Impulse response approximation methods and related systems
US9788119B2 (en) * 2013-03-20 2017-10-10 Nokia Technologies Oy Spatial audio apparatus
US9124983B2 (en) * 2013-06-26 2015-09-01 Starkey Laboratories, Inc. Method and apparatus for localization of streaming sources in hearing assistance system
KR101782916B1 (ko) * 2013-09-17 2017-09-28 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
WO2015060652A1 (ko) * 2013-10-22 2015-04-30 연세대학교 산학협력단 오디오 신호 처리 방법 및 장치
US8989417B1 (en) * 2013-10-23 2015-03-24 Google Inc. Method and system for implementing stereo audio using bone conduction transducers
US20150119130A1 (en) * 2013-10-31 2015-04-30 Microsoft Corporation Variable audio parameter setting
WO2015099430A1 (ko) * 2013-12-23 2015-07-02 주식회사 윌러스표준기술연구소 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치
EP4294055B1 (en) * 2014-03-19 2024-11-06 Wilus Institute of Standards and Technology Inc. Audio signal processing method and apparatus
EP3128766A4 (en) * 2014-04-02 2018-01-03 Wilus Institute of Standards and Technology Inc. Audio signal processing method and device
CN104408040B (zh) 2014-09-26 2018-01-09 大连理工大学 头相关函数三维数据压缩方法与系统
CN106537942A (zh) * 2014-11-11 2017-03-22 谷歌公司 3d沉浸式空间音频系统和方法
KR101627652B1 (ko) * 2015-01-30 2016-06-07 가우디오디오랩 주식회사 바이노럴 렌더링을 위한 오디오 신호 처리 장치 및 방법
JP6434157B2 (ja) * 2015-04-22 2018-12-05 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 音声信号処理装置および方法
US9464912B1 (en) * 2015-05-06 2016-10-11 Google Inc. Binaural navigation cues
US9609436B2 (en) * 2015-05-22 2017-03-28 Microsoft Technology Licensing, Llc Systems and methods for audio creation and delivery
US9860666B2 (en) * 2015-06-18 2018-01-02 Nokia Technologies Oy Binaural audio reproduction
US9906884B2 (en) * 2015-07-31 2018-02-27 The University Of North Carolina At Chapel Hill Methods, systems, and computer readable media for utilizing adaptive rectangular decomposition (ARD) to generate head-related transfer functions
CN105376690A (zh) * 2015-11-04 2016-03-02 北京时代拓灵科技有限公司 生成虚拟环绕声的方法和装置
US10142755B2 (en) 2016-02-18 2018-11-27 Google Llc Signal processing methods and systems for rendering audio on virtual loudspeaker arrays
US9584946B1 (en) * 2016-06-10 2017-02-28 Philip Scott Lyren Audio diarization system that segments audio input

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008502200A (ja) * 2004-06-04 2008-01-24 サムスン エレクトロニクス カンパニー リミテッド ワイドステレオ再生方法及びその装置
JP2006217632A (ja) * 2005-02-04 2006-08-17 Lg Electronics Inc 三次元立体音響生成方法、三次元立体音響生成装置及び移動端末機
JP2015530825A (ja) * 2012-08-31 2015-10-15 ドルビー ラボラトリーズ ライセンシング コーポレイション 種々の聴取環境におけるオブジェクトに基づくオーディオのレンダリング及び再生のためのシステム
WO2014193993A1 (en) * 2013-05-29 2014-12-04 Qualcomm Incorporated Filtering with binaural room impulse responses
US20150213809A1 (en) * 2014-01-30 2015-07-30 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients

Also Published As

Publication number Publication date
KR102057142B1 (ko) 2019-12-18
CA3005135C (en) 2021-06-22
AU2017220320A1 (en) 2018-06-07
CA3005135A1 (en) 2017-08-24
WO2017142759A1 (en) 2017-08-24
EP3351021B1 (en) 2020-04-08
AU2017220320B2 (en) 2019-04-11
GB2549826B (en) 2020-02-19
US20170245082A1 (en) 2017-08-24
US10142755B2 (en) 2018-11-27
GB2549826A (en) 2017-11-01
KR20180067661A (ko) 2018-06-20
GB201702673D0 (en) 2017-04-05
JP6591671B2 (ja) 2019-10-16
EP3351021A1 (en) 2018-07-25

Similar Documents

Publication Publication Date Title
JP6591671B2 (ja) 信号処理方法および仮想スピーカアレイにオーディオをレンダリングするシステム
CN107094277B (zh) 用于在虚拟扬声器阵列上渲染音频的信号处理方法和系统
EP2829082B1 (en) Method and system for head-related transfer function generation by linear mixing of head-related transfer functions
JP5111375B2 (ja) オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
CN106465033B (zh) 用于处理频域中的信号的设备和方法
CN109545235B (zh) 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备
KR102226071B1 (ko) 다채널 오디오 신호의 바이노럴 렌더링 방법 및 장치
JP6495910B2 (ja) 特異値分解を用いる高次Ambisonics符号化と復号の方法と装置
US9055381B2 (en) Multi-way analysis for audio processing
CN104681034A (zh) 音频信号处理
JP5753270B2 (ja) 多チャネルオーディオ信号をダウンミックスする方法及び装置
KR20210071972A (ko) 신호 처리 장치 및 방법, 그리고 프로그램
KR20200074757A (ko) 복합 차수 앰비소닉을 이용한 오디오 신호 처리 방법 및 장치
JP6463955B2 (ja) 三次元音響再生装置及びプログラム
CN113691927B (zh) 音频信号处理方法及装置
KR20250008892A (ko) 분산 대화형 양이 렌더링
WO2017050482A1 (en) Rendering system
Teal et al. Efficient projection onto a low-dimensional ball
CN118511545A (zh) 用于上混/重混/下混应用的多声道音频处理
HK1205396B (en) Method and system for head-related transfer function generation by linear mixing of head-related transfer functions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180613

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190918

R150 Certificate of patent or registration of utility model

Ref document number: 6591671

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250