JP7241447B2 - オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ - Google Patents
オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ Download PDFInfo
- Publication number
- JP7241447B2 JP7241447B2 JP2021077240A JP2021077240A JP7241447B2 JP 7241447 B2 JP7241447 B2 JP 7241447B2 JP 2021077240 A JP2021077240 A JP 2021077240A JP 2021077240 A JP2021077240 A JP 2021077240A JP 7241447 B2 JP7241447 B2 JP 7241447B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio
- reverberation
- audio signal
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
- G10K15/08—Arrangements for producing a reverberation or echo sound
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
- G10K15/08—Arrangements for producing a reverberation or echo sound
- G10K15/12—Arrangements for producing a reverberation or echo sound using electronic time-delay networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
室内インパルス応答の初期部分と後期残響とを用いてオーディオ信号を別々に処理することであって、後期残響を処理することが、スケーリングされた残響信号を生成することを含み、スケーリングがオーディオ信号に依存する、処理することと、
室内インパルス応答の初期部分を用いて処理されたオーディオ信号とスケーリングされた残響信号とを合成することと
を含む。
上記で説明した従来の手法と比較すると、本発明の手法は、完全な畳み込み結果を計算する必要なしにまたは広範で不正確な聴覚モデルを適用する必要なしに後期残響をスケーリングすることを可能にするので、有利である。本発明の手法の実施形態は、完全な畳み込み手法での残響のようにそれが聞こえるように人工的後期残響をスケーリングするための容易な方法を提供する。スケーリングは入力信号に基づき、追加の聴覚モデルまたはターゲット残響ラウドネスは不要である。スケーリングファクタは、エンコーダ/デコーダチェーン中のオーディオ素材も時間周波数領域においてしばしば利用可能でもあるので利点であるこの時間周波数領域において導出され得る。
スケーリングは、低減した計算オーバーヘッドにより入力オーディオ信号から容易に決定され得るので、これは有利である。例えば、スケーリングは、元のオーディオ信号と比較して低減した数のチャネルを含む、現在考慮されているダウンミックスチャネルにダウンミックスされる元のオーディオ信号中のチャネルの数を単に決定することによって決定され得る。代替的に、現在考慮されているダウンミックスチャネルにダウンミックスされるアクティブチャネル(現在オーディオフレーム中で何らかのアクティビティを示すチャネル)の数は、残響信号をスケーリングするための基礎を形成し得る。
あらかじめ定義された相関測度を使用することは、プロセスにおける計算複雑さを低減するので、有利である。あらかじめ定義された相関測度は、複数のオーディオ信号の分析に基づいて経験的に決定され得る、例えば0.1~0.9の範囲内の、固定値を有し得る。一方、個々に現在処理されているオーディオ信号についてより正確な測度を取得することが望まれる場合、必要とされる追加の計算リソースにもかかわらず、相関測度を計算することが有利である。
利得ファクタは、上記のパラメータに基づいて容易に計算され得、実装詳細の依存する処理チェーン中の残響器に関してフレキシブルに適用され得るので、これは有利である。
g=cu+ρ・(cc-cu)
ただし
ρ = オーディオ信号についてのあらかじめ定義されたまたは計算される相関測度、
cu、cc = オーディオ信号の1つまたは複数の入力チャネルの状態を示すファクタであり、cuは、全体として無相関なチャネルを指し、ccは、全体として相関するチャネルに関係する。
ファクタは、オーディオ信号中のアクティブチャネルの数とともに経時的にスケーリングするので、これは有利である。
Kin = アクティブまたは固定ダウンミックスチャネルの数。
ファクタは、オーディオ信号中のアクティブチャネルの数に直接依存するので、これは有利である。どのチャネルもアクティブでない場合、残響は0でスケーリングされ、より多くのチャネルがアクティブであれば、残響の振幅はより大きくなり得る。
ts = 低域フィルタの時定数
ti = フレームtiにおけるオーディオフレーム
gs = 平滑化された利得ファクタ
k = フレームサイズ、および
fs = サンプリング周波数。
スケーリングファクタについて時間とともに急激な変化が起こらないので、これは有利である。
相関は、1つのオーディオフレームの全体的な相関を記述する1つの単一の値によって記述され得るので、これは有利である。複数の周波数依存値を扱う必要はない。
上述のように、フレームごとにただ1つの単一の全体的な相関値が計算され(容易な処理)、その計算は、ゼロ平均信号およびそれの標準偏差を同じく使用する「標準」のピアソンの相関係数と同様に行われ得るので、これは有利である。
ρ[m,n] = 相関係数、
σ(xm[j]) = チャネルmの1つのタイムスロットjにわたる標準偏差、
σ(xn[j]) = チャネルnの1つのタイムスロットjにわたる標準偏差、
xm,xn = ゼロ平均変数、
i∀[1,N] = 周波数帯域、
j∀[1,M] = タイムスロット、
m,n∀[1,K] = チャネル、
* = 複素共役。
ピアソンの相関係数のためのよく知られている式が使用され得、周波数依存および時間依存式に変換されるので、これは有利である。
例えば、残響器中での処理は、より少ないチャネルを扱う必要があり、ダウンミックスプロセスが直接制御され得るので、これは有利である。
本発明の実施形態について、添付の図面に関して説明する。
図1および図2に示された3Dオーディオシステム全体のアルゴリズムブロックについて以下でさらに詳細に説明する。
E{・} = 期待値演算子
ρ{X,Y} = 相関係数、
σX,σY = 変数X、Yの標準偏差
説明する実施形態によるこの処理は、時間周波数領域、例えばQMF領域における2次元に伝達される。この2次元はタイムスロットおよびQMF帯域である。データは時間-周波数領域中でしばしば符号化され、送信もされるので、この手法は妥当である。期待値演算子は、いくつかの時間および/または周波数サンプルにわたる平均演算と置換され、したがって、(0,1)の範囲内の2つのゼロ平均変数xm、xn間の時間周波数相関測度は以下のように定義される。
ρ[m,n] = 相関係数、
σ(xm[j]) = チャネルmの1つのタイムスロットjにわたる標準偏差、
σ(xn[j]) = チャネルnの1つのタイムスロットjにわたる標準偏差、
xm,xn = ゼロ平均変数、
j∀[1,N] = 周波数帯域、
j∀[1,M] = タイムスロット、
m,n∀[1,K] = チャネル、
* = 複素共役。
1つのオーディオフレームの複数のチャネル合成(m,n)についてのこの係数の計算の後に、ρ[m,n,ti]の値は、複数の相関値ρ[m,n,ti]の平均を取る(または複数の相関値ρ[m,n,ti]を平均化する)ことによって単一の相関測度ρm(ti)に合成される。オーディオフレームは32個のQMFタイムスロットを含み得、tiはそれぞれのオーディオフレームを示すことに留意されたい。上記の処理は、1つのオーディオフレームについて以下のように要約され得る。
(i) 最初に、サイズ[N,M,K]を有するオーディオまたはデータフレームxのk個のチャネルごとの全体的な平均値
(ii) 対応するチャネルから値
(iii) 複数のチャネル合成(m,n)のそれぞれについて、定義された相関係数ρ[m,n]が計算される。
(iv) (例えばゼロ除算によって誤って計算された値を除く)複数の相関係数ρ[m,n]の平均として平均相関値が計算される。
ρ = オーディオ信号についてのあらかじめ定義されたまたは計算される相関係数、
cu、cc = オーディオ信号の1つまたは複数の入力チャネルの状態を示すファクタであり、cuは、全体として無相関なチャネルを指し、ccは、全体として相関するチャネルに関係し、
Kin = アクティブ非ゼロまたは固定ダウンミックスチャネルの数。
cuは、ダウンミックスされたチャネルが全体として無相関である(チャネル間依存性がない)場合に適用されるファクタである。1つまたは複数の入力チャネルの状態のみを使用する場合、g=cu、および、あらかじめ定義された固定相関係数は0に設定される。ccは、ダウンミックスされたチャネルが全体として相関する(信号が互いの重み付けされたバージョン(+位相シフトおよびオフセット)である)場合に適用されるファクタである。1つまたは複数の入力チャネルの状態のみを使用する場合、g=cc、および、あらかじめ定義された固定相関係数は1に設定される。これらのファクタは、((アクティブ)チャネルの数に応じて)オーディオフレーム中で後期残響の最小スケーリングと最大スケーリングとを記述する。
「チャネル数」Kinは、実施形態によれば、以下のように定義される。どの入力チャネルがどのダウンミックスチャネル中に含まれるかを定義するダウンミックス行列Q(サイズM×2、ただし、Mはオーディオ入力素材の入力チャネルの数であり、例えば5.1セットアップでは6つのチャネルである)を使用して、マルチチャネルオーディオ信号がステレオダウンミックスにダウンミックスされる。
ダウンミックス行列Qの一例は以下のとおりであり得る。
g=f(cc,cu,ρavg)=cu+ρavg・(cc-cu)
ただし、ρavgは、いくつかのKin・Kinチャネル合成[m,n]についてのすべての相関係数ρ[m,n]の平均/平均値であり、cc、cuは、以下のとおりであり得るチャネル数Kinに依存する。
・Kinは、現在考慮されているダウンミックスチャネルにダウンミックスされるチャネルの数k∈[1,2](0に等しくない値を含んでいる列k中のダウンミックス行列Q中の行の数)であり得る。この数は、ダウンミックス行列Qが、1つの入力チャネル構成についてあらかじめ定義され、1つのオーディオ入力信号の全長にわたって変化しないので、時不変である。
例えば5.1入力信号を考慮するとき、以下が適用される。
チャネル1、3、4がダウンミックスチャネル1にダウンミックスされ(上記の行列Qを参照)、
Kinはフレームごとに=3(3つのチャネル)である。
・Kinは、現在考慮されているダウンミックスチャネルにダウンミックスされるアクティブチャネルの数k∈[1,2](現在オーディオフレーム中でアクティビティがあり、また、列k中のダウンミックス行列Qの対応する行が、アクティブチャネルとQの列k中の等しくない要素との交差において、0→チャネルの数に等しくない値を含んでいる、入力チャネルの数)であり得る。この数は、Qが同じままである場合でも、信号アクティビティが時間とともに変化し得るので、1つのオーディオ入力信号の全長にわたって時変であり得る。
チャネル1、3、4がダウンミックスチャネル1にダウンミックスされ(上記の行列Qを参照)、
フレームnでは、
アクティブチャネルはチャネル1、2、4であり、
Kinは交差{1,4}におけるチャネルの数であり、
Kin(n)=2
フレームn+1では、
アクティブチャネルはチャネル1、2、3、4であり、
Kinは交差{1,3,4}におけるチャネルの数であり、
Kin(n+1)=3。
(あらかじめ定義されたフレーム中の)オーディオチャネルは、それが、あらかじめ定義されたフレーム内に、プリセットしきい値を超える振幅またはエネルギーを有する場合はアクティブであると見なされ得、例えば、実施形態によれば、(あらかじめ定義されたフレーム中の)オーディオチャネル中のアクティビティは以下のように定義され得る。
・フレーム中の(時間領域、QMF領域などにおける)信号の絶対振幅の合計または最大値が0よりも大きいか、あるいは
・フレーム中の信号エネルギー(時間領域またはQMF領域における振幅の2乗絶対値)の合計または最大値が0よりも大きい。
0の代わりに、0よりも大きい(最大エネルギーまたは振幅に対する)別のしきい値、例えば0.01のしきい値も使用され得る。
ts = [s]での低域フィルタの時定数
ti = フレームtiにおけるオーディオフレーム
gs = 平滑化された利得ファクタ
k = フレームサイズ、および
fs = [Hz]でのサンプリング周波数
フレームサイズkは、時間領域サンプル中のオーディオフレームのサイズ、例えば2048個のサンプルであり得る。
オーディオフレームx(ti)の左チャネル残響信号は、その場合、ファクタgs,left(ti)でスケーリングされ、右チャネル残響信号はファクタgs,right(ti)でスケーリングされる。スケーリングファクタは、残響器に供給されるステレオダウンミックスの左チャネル中に存在するチャネル(のアクティブ非0または総数)の数としてKinを用いて1回計算され、それにより、スケーリングファクタgs,left(ti)が得られる。次いで、スケーリングファクタは、残響器に供給されるステレオダウンミックスの右チャネル中に存在するチャネル(のアクティブ非0または総数)の数としてKinを用いてもう1回計算され、それにより、スケーリングファクタgs,right(ti)が得られる。残響器は、オーディオフレームのステレオ残響バージョンを戻す。残響バージョンの左チャネル(または残響器の入力の左チャネル)はgs,left(ti)でスケーリングされ、残響バージョンの右チャネル(または残響器の入力の右チャネル)はgs,right(ti)でスケーリングされる。
スケーリングされた人工的(合成)後期残響は、直接音と初期反射とを用いて処理されている信号506に加算されるために、加算器510に印加される。
上述のように、本発明の手法は、実施形態によれば、オーディオ信号のバイノーラル処理のためのバイノーラルプロセッサにおいて使用され得る。以下で、オーディオ信号のバイノーラル処理の一実施形態について説明する。バイノーラル処理は、復号された信号を、ヘッドフォンを介して聴取されたときにサラウンド音エクスペリエンスを提供するバイノーラルダウンミックス信号に変換する、デコーダプロセスとして行われ得る。
バイノーラル・レンダラ・モジュール800中に供給されるオーディオ信号802は、以下では入力信号と呼ばれる。バイノーラル処理の結果であるオーディオ信号830は出力信号と呼ばれる。バイノーラル・レンダラ・モジュール800の入力信号802は、コアデコーダのオーディオ出力信号である(例えば図2の信号228を参照)。以下の変数定義が使用される。
次に、入力信号の処理について説明する。バイノーラル・レンダラ・モジュールは、入力オーディオ信号の長さ=2048時間領域サンプルの連続的な重複しないフレームに作用し、長さの処理された入力フレームごとに個のサンプルの1つのフレームを出力する。
バイノーラル処理ブロックの初期化は、コアデコーダ(例えば図2の200のデコーダを参照)によって供給されるオーディオサンプルの処理が起こる前に行われる。初期化はいくつかの処理ステップからなる。
残響器モジュール816a、816bは、入力パラメータとして残響時間808とエネルギー値810との周波数依存セットを取る。これらの値は、バイノーラル処理モジュール800の初期化においてインターフェースから読み取られる。さらに、時間領域サンプルにおける初期反射から後期残響への遷移時間832が読み取られる。値は、サンプルごとに32ビット、フロート値、リトルエンディアン順序付けで書き込まれるバイナリファイルに記憶され得る。処理のために必要とされる読取り値を以下の表に述べる。
バイノーラル室内インパルス応答804は、左耳BRIRと右耳BRIRとを個々に記憶する2つの専用ファイルから読み取られる。BRIRの時間領域サンプルは、サンプルごとに24ビットの解像度と32個のチャネルとを用いて整数waveファイルに記憶される。ファイル中のBRIRの順序付けは以下の表に述べられているとおりである。
を獲得するために、1≦v≦Ltransである時間領域表現
が処理される。
(2) オーディオ信号処理
バイノーラル・レンダラ・モジュール800のオーディオ処理ブロックは、コアデコーダからNin個の入力チャネルのための時間領域オーディオサンプル802を取得し、Nout=2個のチャネルからなるバイノーラル出力信号830を生成する。
処理は、入力として以下を取る。
・コアデコーダからの復号されたオーディオデータ802、
・BRIRセット804の初期反射部分の複素QMF領域表現、および
・後期残響826a、826bを生成するためにQMF領域残響器816a、816bによって使用される周波数依存パラメータセット808、810、832。
第1の処理ステップとして、バイノーラル・レンダラ・モジュールは、(コアデコーダから来る)Ninチャネル時間領域入力信号の=2048時間領域サンプル
を、次元Ln=32QMFタイムスロット(スロットインデックスn)とK=64周波数帯域(帯域インデックスk)とのNinチャネルQMF領域信号表現802に変換する。
ISO/IEC 14496-3:2009、4.B.18.2節に概説されその修正がISO/IEC 14496-3:2009、8.6.4.2節に述べられているQMF分析が時間領域信号
のフレーム上で実施されて、1≦v≦Lおよび1≦n≦LnであるQMF領域信号
のフレームが獲得される。
次に、QMF領域オーディオ信号802とQMF領域BRIR804とを処理するために帯域的な高速畳み込み812が行われる。FFT分析が、入力信号802と各BRIR804との各チャネルのための各QMF周波数帯域について行われ得る。
QMF領域中の複素数値により、1つのFFT分析はQMF領域信号表現の実数部で行われ、1つのFFT分析はQMF領域信号表現の虚数部で行われる。結果が次いで合成されて、最終的な帯域的な複素数値擬似FFT領域信号が次のように形成され、
および以下のように帯域的な複素数値BRIRが形成され、
左耳では
右耳では
。
FFT変換の長さは、複素数値QMF領域BRIRフィルタの長さLtrans,nと、QMF領域タイムスロットLnにおけるフレーム長とに従って決定され、したがって、
LFFT=Ltrans,n+Ln-1。
複素数値擬似FFT領域信号は、次いで複素数値擬似FFT領域BRIRフィルタが掛けられて、高速畳み込み結果が形成される。入力信号のどのチャネルがBRIRデータセット中のどれBRIRペアに対応するかをシグナリングするためにベクトルmconvが使用される。
この掛算は、1≦k≦KmaxであるすべてのQMF周波数帯域kについて帯域的に行われる。最大帯域Kmaxは、18kHzまたはコアデコーダからのオーディオ信号中に存在する最大信号周波数のいずれかの周波数を表すQMF帯域によって決定される
fmax=min(fmax,decoder,18kHz)。
各BRIRペアを用いた各オーディオ入力チャネルからの掛算の結果は、1≦k≦Kmaxである各QMF周波数帯域において合計され、それにより、中間2チャネルKmax帯域擬似FFT領域信号が生じる。
および
は、QMF領域周波数帯域k
における擬似FFT畳み込み結果
である。
次に、帯域的なFFT合成が行われて、畳み込み結果がQMF領域に逆変換され、それにより、1≦n≦LFFTおよび1≦k≦KmaxであるLFFTタイムスロット
をもつ中間2チャネルKmax帯域QMF領域信号が生じる。
L=32個のタイムスロットをもつ各QMF領域入力信号フレームについて、L=32個のタイムスロットをもつ畳み込み結果信号フレームが返される。残りのLFFT-32個のタイムスロットは記憶され、後続のフレームにおいてオーバーラップ加算処理が行われる。
第2の中間信号826a、826bとして、
と呼ばれる残響信号が周波数領域残響器モジュール816a、816bによって生成される。周波数領域残響器816a、816bは、入力として以下を取る。
・入力信号の1つのフレームのQMF領域ステレオダウンミックス822、
・周波数依存残響時間808とエネルギー値810とを含んでいるパラメータセット。
周波数領域残響器816a、816bは2チャネルQMF領域後期残響テールを返す。
周波数依存パラメータセットの最大使用帯域数が、最大周波数に応じて計算される。
の1つのフレームのQMF領域ステレオダウンミックス818が行われて、入力信号チャネルの重み付けされた合計によって残響器の入力が形成される。重み付け利得はダウンミックス行列MDMX中に含まれている。重み付け利得は実数値で非負であり、ダウンミックス行列は次元Nout×Ninである。それは、入力信号のチャネルが2つの出力チャネルのうちの1つにマッピングされる、非0値を含んでいる。
を計算するために周波数領域残響器の2つのインスタンスが使用される。
信号は残響器の第1のインスタンスの第1の出力チャネルであり
は残響器の第2のインスタンスの第2の出力チャネルである。それらは、2つのチャネルと、64個の帯域と、32個のタイムスロットとの次元を有する最終的な残響信号フレームに合成される。
残響器出力の正しいスケーリングを保証するために、ステレオダウンミックス822は、入力信号フレームの相関測度820に従って両方の時間においてスケーリング821a、bされる。スケーリングファクタは、0と1との間の相関係数ccorrに応じて線形的に
の区間中の値として定義され、ただし、
および
スケーリングファクタは、1次低域フィルタによってオーディオ信号フレームにわたって平滑化され、それにより、平滑化されたスケーリングファクタ
が生じる。
次に、1つQMF領域オーディオ入力フレームについての、畳み込み結果814、
、および残響器出力826a、826b、
が、2つの信号を帯域的に合計するミキシングプロセス828によって合成される。畳み込みはKmaxまでの帯域においてしか行われないので、Kmaxよりも高い上側帯域は、
が0であることに留意されたい。
後期残響出力は、ミキシングプロセスにおいて
d=((Ltrans-20・64+1)/64+0.5)+1のタイムスロットの量だけ遅延される。
遅延dは、妥当なタイムスロットにおける後期残響の挿入を保証するために、BRIRにおける初期反射から後期反射への遷移時間、および20QMFタイムスロットの残響器の初期遅延、ならびにBRIRのQMF分析のための0.5QMFタイムスロットの分析遅延を考慮に入れる。1つのタイムスロットn
における合成信号
は、
によって計算される。
QMF領域出力信号
の32タイムスロットの1つの2チャネルフレームは、ISO/IEC 14496-3:2009、4.6.18.4.2.節によるQMF合成によって長さLで2チャネル時間領域信号フレームに変換され、それにより、最終的な時間領域出力信号830、
が生じる。
i1∀[1,N1],i2∀[N1+1,N2],...,iS∀[NS-1+N]
第1の実施形態は、
室内インパルス応答(300)に従ってオーディオ信号(504、802)を処理するための方法であって、前記方法は、
前記室内インパルス応答(300)の初期部分(301、302)と後期残響(304)とを用いて前記オーディオ信号(504、802)を別々に処理すること(502、514、812、816a、816b)であって、前記後期残響(304)を処理することが、スケーリングされた残響信号を生成することを含み、前記スケーリングが前記オーディオ信号(504、802)に依存する、処理することと、
前記室内インパルス応答の前記初期部分を用いて処理された前記オーディオ信号と前記スケーリングされた残響信号とを合成することと
を含む、方法を提供する。
第2の実施形態は、
前記スケーリングが、前記オーディオ信号(504、802)の1つまたは複数の入力チャネルの状態に依存する、前記1の実施形態の方法を提供する。
第3の実施形態は、
前記オーディオ信号(504、802)の前記1つまたは複数の入力チャネルの前記状態が、入力チャネルの数と、アクティブ入力チャネルの数と、前記入力チャネル中のアクティビティとのうちの1つまたは複数を含む、前記2の実施形態の方法を提供する。
第4の実施形態は、
前記スケーリングが、前記オーディオ信号(504、802)のあらかじめ定義されたまたは計算される相関測度に依存する、前記第1から第3の実施形態のうちのいずれか一の方法を提供する。
第5の実施形態は、
前記スケーリングされた残響信号を生成することが、利得ファクタを適用することを含み、前記利得ファクタは、前記オーディオ信号(504、802)の前記1つまたは複数の入力チャネルの前記状態に基づいておよび/または前記オーディオ信号(504、802)についての前記あらかじめ定義されたまたは計算される相関測度に基づいて決定される、前記第1から第4の実施形態のうちのいずれか一の方法を提供する。
第6の実施形態は、
前記スケーリングされた残響信号を生成することが、前記オーディオ信号(504、802)の前記後期残響(304)を処理する前に、その間にまたはその後に前記利得ファクタを適用することを含む、前記第5の実施形態の方法を提供する。
第7の実施形態は、
前記利得ファクタが以下のように決定され、
g=cu+ρ・(cc-cu)
ただし
ρ = 前記オーディオ信号(504、802)についてのあらかじめ定義されたまたは計算される相関測度、
cu、cc = 前記オーディオ信号(504、802)の前記1つまたは複数の入力チャネルの前記状態を示すファクタであり、cuは、全体として無相関なチャネルを指し、ccは、全体として相関するチャネルに関係する、
前記第5または第6の実施形態の方法を提供する。
第8の実施形態は、
cuおよびccが以下のように決定され、
Kin = アクティブまたは固定ダウンミックスチャネルの数である、
前記第7の実施形態の方法を提供する。
第9の実施形態は、
前記利得ファクタが、複数のオーディオフレームにわたって低域フィルタ処理される、前記第5から第8の実施形態うちのいずれか一の方法を提供する。
第10の実施形態は、
前記利得ファクタが以下のように低域フィルタ処理され、
ts = 前記低域フィルタの時定数
ti = フレームtiにおけるオーディオフレーム
gs = 平滑化された利得ファクタ
k = フレームサイズ、および
fs = サンプリング周波数である、
前記第9の実施形態の方法を提供する。
第11の実施形態は、
前記スケーリングされた残響信号を生成することが、前記オーディオ信号(504、802)の相関分析を含む、前記第1から第10の実施形態のうちのいずれか一の方法を提供する。
第12の実施形態は、
前記オーディオ信号(504、802)の前記相関分析が、前記オーディオ信号(504、802)のオーディオフレームについて合成相関測度を決定することを含み、前記合成相関測度は、1つのオーディオフレームの複数のチャネル合成についての相関係数を合成することによって計算され、各オーディオフレームは1つまたは複数のタイムスロットを含む、前記第11の実施形態の方法を提供する。
第13の実施形態は、
前記相関係数を合成することが、前記オーディオフレームの複数の相関係数を平均化することを含む、前記第12の実施形態の方法を提供する。
第14の実施形態は、
前記合成相関測度を決定することが、
(i) 前記1つのオーディオフレームのチャネルごとに全体的な平均値を計算することと、
(ii) 前記対応するチャネルから前記平均値を減算することによってゼロ平均オーディオフレームを計算することと、
(iii) 複数のチャネル合成について前記相関係数を計算することと、
(iv) 前記合成相関測度を複数の相関係数の前記平均として計算することと
を含む、前記第11または第12の実施形態の方法を提供する。
第15の実施形態は、
チャネル合成についての前記相関係数が以下のように計算され、
ρ[m,n] = 相関係数、
σ(xm[j]) = チャネルmの1つのタイムスロットjにわたる標準偏差、
σ(xn[j]) = チャネルnの1つのタイムスロットjにわたる標準偏差、
xm,xn = ゼロ平均変数、
i∀[1,N] = 周波数帯域、
j∀[1,M] = タイムスロット、
m,n∀[1,K] = チャネル、
* = 複素共役である、
前記第11から第14の実施形態のうちのいずれか一の方法を提供する。
第16の実施形態は、
前記スケーリングされた残響信号の開始を前記室内インパルス応答(300)における初期反射から後期残響(304)への遷移点に一致させるように前記スケーリングされた残響信号を遅延させることを含む、前記第1から第15の実施形態のうちのいずれか一の方法を提供する。
第17の実施形態は、
前記オーディオ信号(504、802)の前記後期残響(304)を処理することが、前記オーディオ信号(504、802)をダウンミックスすることと、前記ダウンミックスされたオーディオ信号を残響器に印加することとを含む、前記第1から第16の実施形態のうちのいずれか一の方法を提供する。
第18の実施形態は、
コンピュータによって実行されているとき、前記第1から第17の実施形態のうちのいずれか一の方法を行うための命令を記憶したコンピュータ可読媒体を含む非有形コンピュータ製品を提供する。
第19の実施形態は、
オーディオ信号(504、802)を受信するための入力と、
室内インパルス応答(300)の初期部分(301、302)に従って前記受信されたオーディオ信号(504、802)を処理するための初期部分プロセッサと、
前記室内インパルス応答(300)の後期残響に従って前記受信されたオーディオ信号(504、802)を処理するための後期残響プロセッサであって、前記後期残響プロセッサが、スケーリングされた残響信号を生成するように構成され、前記スケーリングが、前記受信されたオーディオ信号(504、802)に依存する後期残響プロセッサと、
前記受信されたオーディオ信号(504、802)の前記処理された初期部分と前記スケーリングされた残響信号とを出力オーディオ信号に合成するための出力と
を備える、信号処理ユニットを提供する。
第20の実施形態は、
前記後期残響プロセッサが、
前記オーディオ信号(504、802)を受信し残響信号を生成する残響器と、
前記残響器の入力または出力に結合され利得ファクタによって制御される利得段と
を備える、前記第19の実施形態の信号処理ユニットを提供する。
第21の実施形態は、
前記オーディオ信号(504、802)に依存する前記利得ファクタを生成する相関分析器を備える、前記第20の実施形態の信号処理ユニットを提供する。
第22の実施形態は、
前記利得段に結合された低域フィルタと、
前記利得段と加算器との間に結合された遅延要素と
のうちの少なくとも1つをさらに備え、前記加算器は、前記初期部分プロセッサと前記出力とにさらに結合された、前記第20または第21の実施形態の信号処理ユニットを提供する。
第23の実施形態は、
前記第19から第22のうちのいずれか一の信号処理ユニットを備える、バイノーラルレンダラを提供する。
第24の実施形態は、
コーディングより前にオーディオ信号を処理するために前記第19から第22の実施形態のうちのいずれか一の信号処理ユニットまたは前記第23のバイノーラルレンダラ
を備える、前記オーディオ信号をコーディングするためのオーディオエンコーダを提供する。
第25の実施形態は、
復号されたオーディオ信号を処理するために前記第19から第22の実施形態のうちのいずれか一の信号処理ユニットまたは前記第23のバイノーラルレンダラ
を備える、符号化されたオーディオ信号を復号するためのオーディオデコーダを提供する。
上記で説明した実施形態は本発明の原理を例示するためのものにすぎない。本明細書で説明する構成および詳細の修正形態および変形形態は、他の当業者に明らかであることを理解されたい。したがって、本明細書の実施形態の記述および説明として提示される特定の詳細によっては限定されず、直下の特許請求の範囲によってのみ限定されることが意図される。
[1] M.R.Schroeder、「Digital Simulation of Sound Transmission in Reverberant Spaces」、The Journal of the Acoustical Society of America、VoS.47、pp.424-431(1970)、および、JA. Moorer、「About This Reverberation Business」、Computer Music Journal、Vol.3、no.2、pp.13-28、MIT Press(1979)において拡張されている。
[2] Uhle,Christian、Paulus,Jouni、Herre,Jurgen:「Predicting the Perceived Level of Late Reverberation Using Computational Models of Loudness」 Proceedings、17th International Conference on Digital Signal Processing (DSP)、2011年7月6~8日、コルフ、ギリシャ。
[3] Czyzewski,Andrzej:「A Method of Artificial Reverberation Quality Testing」 J.Audio Eng.Soc.,Vol.38,No 3,1990。
Claims (22)
- 室内インパルス応答に従ってオーディオ信号を処理するための方法であって、前記方法は、
前記オーディオ信号を入力信号として初期部分プロセッサおよび後期残響プロセッサに適用することと、
前記初期部分プロセッサによって、前記室内インパルス応答の初期部分を用いて前記オーディオ信号を処理して、処理されたオーディオ信号を得ることと、
後期残響プロセッサによって、あらかじめ定義された残響パラメータを受信し、前記室内インパルス応答の後期残響に従って、前記あらかじめ定義された残響パラメータを使用して前記オーディオ信号を処理して残響信号を取得し、前記残響信号をスケーリングして、スケーリングされた残響信号を取得することと、
前記処理されたオーディオ信号と前記スケーリングされた残響信号とを合成することと
を含み、
前記後期残響プロセッサによる前記残響信号のスケーリングは、
複数のオーディオ信号の分析に基づいて経験的に決定された固定値を有する、オーディオ信号のあらかじめ定義された相関測度に従って利得ファクタを設定し、前記残響信号に前記利得ファクタを適用するか、または
前記オーディオ信号の相関分析を使用して利得ファクタを取得し、前記残響信号に前記利得ファクタを適用する、方法。 - 前記スケーリングは、前記オーディオ信号の1つまたは複数の入力チャネルの状態に依存する、請求項1に記載の方法。
- 前記オーディオ信号の前記1つまたは複数の入力チャネルの前記状態は、入力チャネルの数と、アクティブ入力チャネルの数と、前記入力チャネル中のアクティビティとのうちの1つまたは複数を含む、請求項2に記載の方法。
- 前記利得ファクタは、前記オーディオ信号の前記1つまたは複数の入力チャネルの前記状態に基づいて決定される、請求項2または3に記載の方法。
- 前記利得ファクタは以下のように決定され、
g=cu+ρ・(cc-cu)
ただし
ρ = 前記オーディオ信号についてのあらかじめ定義されたまたは計算される相関係数、
cu、cc = 前記オーディオ信号の前記1つまたは複数の入力チャネルの前記状態を示すファクタであり、cuは、全体として無相関なチャネルを指し、ccは、全体として相関するチャネルに関係する、
請求項4に記載の方法。 - 前記利得ファクタは、複数のオーディオフレームにわたって低域フィルタ処理される、請求項4から6のうちのいずれか一項に記載の方法。
- 前記オーディオ信号の前記相関分析は、前記オーディオ信号のオーディオフレームについて合成相関測度を決定することを含み、前記合成相関測度は、1つのオーディオフレームの複数のチャネル合成についての相関係数を合成することによって計算され、各オーディオフレームは1つまたは複数のタイムスロットを含む、請求項1から8のうちのいずれか一項に記載の方法。
- 前記相関係数を合成することは、前記オーディオフレームの複数の相関係数を平均化することを含む、請求項9に記載の方法。
- 前記合成相関測度を決定することは、
(i) 前記1つのオーディオフレームのチャネルごとに全体的な平均値を計算することと、
(ii) 対応するチャネルから前記平均値を減算することによってゼロ平均オーディオフレームを計算することと、
(iii) 複数のチャネル合成について前記相関係数を計算することと、
(iv) 前記合成相関測度を複数の相関係数の平均値として計算することと
を含む、請求項9または10に記載の方法。 - 前記スケーリングされた残響信号の開始を前記室内インパルス応答における初期反射から後期残響への遷移点に一致させるように前記スケーリングされた残響信号を遅延させることを含む、請求項1から12のうちのいずれか一項に記載の方法。
- 前記オーディオ信号の前記後期残響を処理することは、前記オーディオ信号をダウンミックスすることと、前記ダウンミックスされたオーディオ信号を残響器に印加することとを含む、請求項1から13のうちのいずれか一項に記載の方法。
- コンピュータによって実行されているとき、請求項1から14のうちのいずれか一項に記載の方法を行うための命令を記憶したコンピュータ可読媒体。
- オーディオ信号を受信するための入力と、
入力信号として前記受信されたオーディオ信号を受信する初期部分プロセッサであって、室内インパルス応答の初期部分に従って前記受信されたオーディオ信号を処理し、処理されたオーディオ信号を取得する初期部分プロセッサと、
入力信号として前記受信されたオーディオ信号を受信する後期残響プロセッサであって、前記室内インパルス応答の後期残響に従ってあらかじめ定義された残響パラメータを使用して前記受信されたオーディオ信号を処理する前記あらかじめ定義された残響パラメータを受信して残響信号を取得し、前記残響信号をスケーリングしてスケーリングされた残響信号を取得する後期残響プロセッサと、
前記処理されたオーディオ信号と前記スケーリングされた残響信号とを出力オーディオ信号に合成するための出力と
を備え、
前記後期残響プロセッサは、
複数のオーディオ信号の分析に基づいて経験的に決定された固定値を有する、オーディオ信号のあらかじめ定義された相関測度に従って利得ファクタを設定し、前記残響信号に前記利得ファクタを適用するか、または
前記オーディオ信号の相関分析を使用して利得ファクタを取得し、前記残響信号に前記利得ファクタを適用する、
ことによって、前記残響信号をスケーリングする、信号処理ユニット。 - 前記オーディオ信号に依存する前記利得ファクタを生成する相関分析器を備える、請求項16に記載の信号処理ユニット。
- 前記後期残響プロセッサは、
前記オーディオ信号を受信し残響信号を生成する残響器と、
前記残響器の入力または出力に結合され前記利得ファクタによって制御される利得段と
を備える、請求項16または17に記載の信号処理ユニット。 - 前記利得段に結合された低域フィルタと、
前記利得段と加算器との間に結合された遅延要素と
のうちの少なくとも1つをさらに備え、前記加算器は、前記初期部分プロセッサと前記出力とにさらに結合された、請求項18に記載の信号処理ユニット。 - 請求項16から19のうちのいずれか一項に記載の信号処理ユニットを備える、バイノーラルレンダラ。
- コーディングより前にオーディオ信号を処理するために請求項16から19のうちのいずれか一項に記載の信号処理ユニットまたは請求項20に記載のバイノーラルレンダラ
を備える、前記オーディオ信号をコーディングするためのオーディオエンコーダ。 - 復号されたオーディオ信号を処理するために請求項16から19のうちのいずれか一項に記載の信号処理ユニットまたは請求項20に記載のバイノーラルレンダラ
を備える、符号化されたオーディオ信号を復号するためのオーディオデコーダ。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023031911A JP7615193B2 (ja) | 2013-07-22 | 2023-03-02 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
JP2024231921A JP2025039612A (ja) | 2013-07-22 | 2024-12-27 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13177361.6 | 2013-07-22 | ||
EP13177361 | 2013-07-22 | ||
EP13189255.6 | 2013-10-18 | ||
EP20130189255 EP2840811A1 (en) | 2013-07-22 | 2013-10-18 | Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder |
JP2018137445A JP6879979B2 (ja) | 2013-07-22 | 2018-07-23 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018137445A Division JP6879979B2 (ja) | 2013-07-22 | 2018-07-23 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023031911A Division JP7615193B2 (ja) | 2013-07-22 | 2023-03-02 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021114799A JP2021114799A (ja) | 2021-08-05 |
JP7241447B2 true JP7241447B2 (ja) | 2023-03-17 |
Family
ID=48808220
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016528468A Active JP6374502B2 (ja) | 2013-07-22 | 2014-07-18 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
JP2018137445A Active JP6879979B2 (ja) | 2013-07-22 | 2018-07-23 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
JP2021077240A Active JP7241447B2 (ja) | 2013-07-22 | 2021-04-30 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
JP2023031911A Active JP7615193B2 (ja) | 2013-07-22 | 2023-03-02 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
JP2024231921A Pending JP2025039612A (ja) | 2013-07-22 | 2024-12-27 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016528468A Active JP6374502B2 (ja) | 2013-07-22 | 2014-07-18 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
JP2018137445A Active JP6879979B2 (ja) | 2013-07-22 | 2018-07-23 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023031911A Active JP7615193B2 (ja) | 2013-07-22 | 2023-03-02 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
JP2024231921A Pending JP2025039612A (ja) | 2013-07-22 | 2024-12-27 | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ |
Country Status (18)
Country | Link |
---|---|
US (5) | US9955282B2 (ja) |
EP (4) | EP2840811A1 (ja) |
JP (5) | JP6374502B2 (ja) |
KR (1) | KR101771533B1 (ja) |
CN (1) | CN105519139B (ja) |
AR (1) | AR097002A1 (ja) |
AU (1) | AU2014295165B2 (ja) |
BR (1) | BR112016001136B1 (ja) |
CA (1) | CA2918279C (ja) |
ES (2) | ES2968380T3 (ja) |
MX (2) | MX2016000699A (ja) |
PL (2) | PL3025520T3 (ja) |
PT (1) | PT3025520T (ja) |
RU (1) | RU2642376C2 (ja) |
SG (1) | SG11201600370UA (ja) |
TW (1) | TWI555011B (ja) |
WO (1) | WO2015011055A1 (ja) |
ZA (1) | ZA201601079B (ja) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014171791A1 (ko) | 2013-04-19 | 2014-10-23 | 한국전자통신연구원 | 다채널 오디오 신호 처리 장치 및 방법 |
EP2840811A1 (en) | 2013-07-22 | 2015-02-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder |
US9319819B2 (en) * | 2013-07-25 | 2016-04-19 | Etri | Binaural rendering method and apparatus for decoding multi channel audio |
US10469969B2 (en) | 2013-09-17 | 2019-11-05 | Wilus Institute Of Standards And Technology Inc. | Method and apparatus for processing multimedia signals |
FR3012247A1 (fr) * | 2013-10-18 | 2015-04-24 | Orange | Spatialisation sonore avec effet de salle, optimisee en complexite |
CN105874819B (zh) | 2013-10-22 | 2018-04-10 | 韩国电子通信研究院 | 生成用于音频信号的滤波器的方法及其参数化装置 |
KR102215124B1 (ko) | 2013-12-23 | 2021-02-10 | 주식회사 윌러스표준기술연구소 | 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치 |
WO2015142073A1 (ko) * | 2014-03-19 | 2015-09-24 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법 및 장치 |
US9584938B2 (en) * | 2015-01-19 | 2017-02-28 | Sennheiser Electronic Gmbh & Co. Kg | Method of determining acoustical characteristics of a room or venue having n sound sources |
WO2016130834A1 (en) * | 2015-02-12 | 2016-08-18 | Dolby Laboratories Licensing Corporation | Reverberation generation for headphone virtualization |
EP4224887A1 (en) | 2015-08-25 | 2023-08-09 | Dolby International AB | Audio encoding and decoding using presentation transform parameters |
US10115403B2 (en) * | 2015-12-18 | 2018-10-30 | Qualcomm Incorporated | Encoding of multiple audio signals |
WO2017136573A1 (en) * | 2016-02-02 | 2017-08-10 | Dts, Inc. | Augmented reality headphone environment rendering |
EP3293987B1 (en) | 2016-09-13 | 2020-10-21 | Nokia Technologies Oy | Audio processing |
US10187740B2 (en) * | 2016-09-23 | 2019-01-22 | Apple Inc. | Producing headphone driver signals in a digital audio signal processing binaural rendering environment |
CN109792582B (zh) * | 2016-10-28 | 2021-10-22 | 松下电器(美国)知识产权公司 | 用于回放多个音频源的双声道渲染装置和方法 |
CN106875953B (zh) * | 2017-01-11 | 2020-10-13 | 深圳市创成微电子有限公司 | 模拟混音音频处理方法及系统 |
CN108665902B (zh) | 2017-03-31 | 2020-12-01 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
CN108694955B (zh) * | 2017-04-12 | 2020-11-17 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
GB2562518A (en) | 2017-05-18 | 2018-11-21 | Nokia Technologies Oy | Spatial audio processing |
CN107358962B (zh) * | 2017-06-08 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 音频处理方法及音频处理装置 |
US9886939B2 (en) * | 2017-06-20 | 2018-02-06 | Signal/Noise Solutions, L.L.C. | Systems and methods for enhancing a signal-to-noise ratio |
US10388265B2 (en) * | 2017-06-20 | 2019-08-20 | Signal/Noise Solutions L.L.C. | Systems and methods for enhancing a signal-to-noise ratio |
US11089425B2 (en) * | 2017-06-27 | 2021-08-10 | Lg Electronics Inc. | Audio playback method and audio playback apparatus in six degrees of freedom environment |
CN117037814A (zh) | 2017-08-10 | 2023-11-10 | 华为技术有限公司 | 时域立体声参数的编码方法和相关产品 |
RU2020112255A (ru) | 2017-10-20 | 2021-09-27 | Сони Корпорейшн | Устройство для обработки сигнала, способ обработки сигнала и программа |
CN111164673B (zh) | 2017-10-20 | 2023-11-21 | 索尼公司 | 信号处理装置、方法和程序 |
EP3570566B1 (en) * | 2018-05-14 | 2022-12-28 | Nokia Technologies Oy | Previewing spatial audio scenes comprising multiple sound sources |
GB2574238A (en) * | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Spatial audio parameter merging |
CN109297583B (zh) * | 2018-09-14 | 2020-07-24 | 北京理工大学 | 汽车车内双耳异响时变噪声响度评价方法 |
US11503423B2 (en) * | 2018-10-25 | 2022-11-15 | Creative Technology Ltd | Systems and methods for modifying room characteristics for spatial audio rendering over headphones |
US10582299B1 (en) * | 2018-12-11 | 2020-03-03 | Amazon Technologies, Inc. | Modeling room acoustics using acoustic waves |
CN114503608B (zh) | 2019-09-23 | 2024-03-01 | 杜比实验室特许公司 | 利用变换参数的音频编码/解码 |
CN115280411A (zh) * | 2020-03-09 | 2022-11-01 | 日本电信电话株式会社 | 声音信号缩混方法、声音信号编码方法、声音信号缩混装置、声音信号编码装置、程序及记录介质 |
US20230179946A1 (en) * | 2020-03-18 | 2023-06-08 | Sony Group Corporation | Sound processing device, sound processing method, and sound processing program |
KR102500157B1 (ko) | 2020-07-09 | 2023-02-15 | 한국전자통신연구원 | 오디오 신호의 바이노럴 렌더링 방법 및 장치 |
CN112037825B (zh) * | 2020-08-10 | 2022-09-27 | 北京小米松果电子有限公司 | 音频信号的处理方法及装置、存储介质 |
JP7487060B2 (ja) * | 2020-09-28 | 2024-05-20 | 株式会社デンソーテン | 音響装置および音響制御方法 |
JP2022144500A (ja) * | 2021-03-19 | 2022-10-03 | ヤマハ株式会社 | 音信号処理方法および音信号処理装置 |
US11665377B2 (en) * | 2021-04-23 | 2023-05-30 | At&T Intellectual Property I, L.P. | System and method for identifying encrypted, pre-recorded media content in packet data networks |
US11937063B2 (en) * | 2021-06-04 | 2024-03-19 | Apple Inc. | Method and system for maintaining track length for pre-rendered spatial audio |
WO2023274400A1 (zh) * | 2021-07-02 | 2023-01-05 | 北京字跳网络技术有限公司 | 音频信号的渲染方法、装置和电子设备 |
US12126841B2 (en) * | 2021-09-20 | 2024-10-22 | Tencent America LLC | Feature compression for video coding for machines |
US11877143B2 (en) * | 2021-12-03 | 2024-01-16 | Microsoft Technology Licensing, Llc | Parameterized modeling of coherent and incoherent sound |
WO2024081957A1 (en) * | 2022-10-14 | 2024-04-18 | Virtuel Works Llc | Binaural externalization processing |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004093728A (ja) | 2002-08-30 | 2004-03-25 | Alpine Electronics Inc | 残響レベル制御装置 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06335094A (ja) * | 1993-05-25 | 1994-12-02 | Matsushita Electric Ind Co Ltd | 音場再生装置 |
US5371799A (en) * | 1993-06-01 | 1994-12-06 | Qsound Labs, Inc. | Stereo headphone sound source localization system |
JP3498888B2 (ja) * | 1996-10-11 | 2004-02-23 | 日本ビクター株式会社 | サラウンド信号処理装置と方法及び映像音声再生方法、記録媒体への記録方法及び記録装置、記録媒体、処理プログラムの伝送方法及び受信方法、並びに記録データの伝送方法及び受信方法 |
KR100261253B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
US6188769B1 (en) * | 1998-11-13 | 2001-02-13 | Creative Technology Ltd. | Environmental reverberation processor |
US20020067836A1 (en) * | 2000-10-24 | 2002-06-06 | Paranjpe Shreyas Anand | Method and device for artificial reverberation |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
JP3598993B2 (ja) * | 2001-05-18 | 2004-12-08 | ソニー株式会社 | 符号化装置及び方法 |
JP4062959B2 (ja) * | 2002-04-26 | 2008-03-19 | ヤマハ株式会社 | 残響付与装置、残響付与方法、インパルス応答生成装置、インパルス応答生成方法、残響付与プログラム、インパルス応答生成プログラムおよび記録媒体 |
US7949141B2 (en) * | 2003-11-12 | 2011-05-24 | Dolby Laboratories Licensing Corporation | Processing audio signals with head related transfer function filters and a reverberator |
KR100662247B1 (ko) | 2003-12-03 | 2007-01-02 | 한국전자통신연구원 | 잔향 처리를 위한 음향 장면 생성 및 소비 방법 |
US7412380B1 (en) * | 2003-12-17 | 2008-08-12 | Creative Technology Ltd. | Ambience extraction and modification for enhancement and upmix of audio signals |
CA2572805C (en) * | 2004-07-02 | 2013-08-13 | Matsushita Electric Industrial Co., Ltd. | Audio signal decoding device and audio signal encoding device |
TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
KR100764903B1 (ko) | 2004-09-07 | 2007-10-09 | 김병두 | 발전소용 미분탄 보일러 노 구조 |
DE102004043521A1 (de) * | 2004-09-08 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes |
RU2407073C2 (ru) * | 2005-03-30 | 2010-12-20 | Конинклейке Филипс Электроникс Н.В. | Кодирование многоканального аудио |
CN101278598B (zh) * | 2005-10-07 | 2011-05-25 | 松下电器产业株式会社 | 音频信号处理装置以及音频信号处理方法 |
US8670570B2 (en) * | 2006-11-07 | 2014-03-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | Environmental effects generator for digital audio signals |
US8208648B2 (en) * | 2007-03-09 | 2012-06-26 | Pioneer Corporation | Sound field reproducing device and sound field reproducing method |
US7742746B2 (en) * | 2007-04-30 | 2010-06-22 | Qualcomm Incorporated | Automatic volume and dynamic range adjustment for mobile audio devices |
WO2010012478A2 (en) * | 2008-07-31 | 2010-02-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal generation for binaural signals |
KR101388901B1 (ko) * | 2009-06-24 | 2014-04-24 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호 디코더, 오디오 신호를 디코딩하는 방법 및 캐스케이드된 오디오 객체 처리 단계들을 이용한 컴퓨터 프로그램 |
GB2485979A (en) * | 2010-11-26 | 2012-06-06 | Univ Surrey | Spatial audio coding |
JP2012150278A (ja) * | 2011-01-19 | 2012-08-09 | Kitakyushu Foundation For The Advancement Of Industry Science And Technology | 仮想空間のビジュアル変化に対応した音響効果の自動生成システム |
EP2541542A1 (en) * | 2011-06-27 | 2013-01-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a measure for a perceived level of reverberation, audio processor and method for processing a signal |
KR101844336B1 (ko) * | 2011-08-01 | 2018-04-02 | 삼성전자주식회사 | 공간감을 제공하는 신호 처리 장치 및 신호 처리 방법 |
US9369818B2 (en) * | 2013-05-29 | 2016-06-14 | Qualcomm Incorporated | Filtering with binaural room impulse responses with content analysis and weighting |
EP2840811A1 (en) | 2013-07-22 | 2015-02-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder |
-
2013
- 2013-10-18 EP EP20130189255 patent/EP2840811A1/en not_active Withdrawn
-
2014
- 2014-07-18 ES ES19197000T patent/ES2968380T3/es active Active
- 2014-07-18 MX MX2016000699A patent/MX2016000699A/es unknown
- 2014-07-18 CA CA2918279A patent/CA2918279C/en active Active
- 2014-07-18 PL PL14741304T patent/PL3025520T3/pl unknown
- 2014-07-18 AU AU2014295165A patent/AU2014295165B2/en active Active
- 2014-07-18 JP JP2016528468A patent/JP6374502B2/ja active Active
- 2014-07-18 TW TW103124820A patent/TWI555011B/zh active
- 2014-07-18 MX MX2016000698A patent/MX374491B/es active IP Right Grant
- 2014-07-18 ES ES14741304T patent/ES2760873T3/es active Active
- 2014-07-18 EP EP19197000.3A patent/EP3606102B1/en active Active
- 2014-07-18 RU RU2016105692A patent/RU2642376C2/ru active
- 2014-07-18 KR KR1020167003941A patent/KR101771533B1/ko active Active
- 2014-07-18 CN CN201480041811.4A patent/CN105519139B/zh active Active
- 2014-07-18 BR BR112016001136-8A patent/BR112016001136B1/pt active IP Right Grant
- 2014-07-18 PT PT147413041T patent/PT3025520T/pt unknown
- 2014-07-18 PL PL19197000.3T patent/PL3606102T3/pl unknown
- 2014-07-18 EP EP14741304.1A patent/EP3025520B1/en active Active
- 2014-07-18 EP EP23207720.6A patent/EP4297017A3/en active Pending
- 2014-07-18 WO PCT/EP2014/065534 patent/WO2015011055A1/en active Application Filing
- 2014-07-18 SG SG11201600370UA patent/SG11201600370UA/en unknown
- 2014-07-21 AR ARP140102705A patent/AR097002A1/es active IP Right Grant
-
2016
- 2016-01-20 US US15/002,177 patent/US9955282B2/en active Active
- 2016-02-17 ZA ZA2016/01079A patent/ZA201601079B/en unknown
-
2018
- 2018-03-15 US US15/922,138 patent/US10848900B2/en active Active
- 2018-07-23 JP JP2018137445A patent/JP6879979B2/ja active Active
-
2020
- 2020-11-10 US US17/094,795 patent/US11445323B2/en active Active
-
2021
- 2021-04-30 JP JP2021077240A patent/JP7241447B2/ja active Active
-
2022
- 2022-08-05 US US17/882,357 patent/US11910182B2/en active Active
-
2023
- 2023-03-02 JP JP2023031911A patent/JP7615193B2/ja active Active
-
2024
- 2024-01-22 US US18/419,160 patent/US12238508B2/en active Active
- 2024-12-27 JP JP2024231921A patent/JP2025039612A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004093728A (ja) | 2002-08-30 | 2004-03-25 | Alpine Electronics Inc | 残響レベル制御装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7241447B2 (ja) | オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ | |
US11856388B2 (en) | Method for processing an audio signal in accordance with a room impulse response, signal processing unit, audio encoder, audio decoder, and binaural renderer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210430 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210529 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230302 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7241447 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |