[go: up one dir, main page]

JP5053849B2 - マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法 - Google Patents

マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法 Download PDF

Info

Publication number
JP5053849B2
JP5053849B2 JP2007534273A JP2007534273A JP5053849B2 JP 5053849 B2 JP5053849 B2 JP 5053849B2 JP 2007534273 A JP2007534273 A JP 2007534273A JP 2007534273 A JP2007534273 A JP 2007534273A JP 5053849 B2 JP5053849 B2 JP 5053849B2
Authority
JP
Japan
Prior art keywords
signal
matrix
unit
channel
uncorrelated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007534273A
Other languages
English (en)
Other versions
JPWO2007029412A1 (ja
Inventor
良明 高木
セン・チョン コク
武志 則松
修二 宮阪
明久 川村
耕司郎 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2007534273A priority Critical patent/JP5053849B2/ja
Publication of JPWO2007029412A1 publication Critical patent/JPWO2007029412A1/ja
Application granted granted Critical
Publication of JP5053849B2 publication Critical patent/JP5053849B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Description

本発明は、複数のオーディオ信号をダウンミックスし、そのダウンミックスされた信号を元の複数のオーディオ信号に分離するマルチチャンネル音響信号処理装置に関する。
従来より、複数のオーディオ信号をダウンミックスし、そのダウンミックスされた信号を元の複数のオーディオ信号に分離するマルチチャンネル音響信号処理装置が提供されている。
図1は、マルチチャンネル音響信号処理装置の構成を示すブロック図である。
マルチチャンネル音響信号処理装置1000は、オーディオ信号の組に対する空間音響符号化を行って音響符号化信号を出力するマルチチャンネル音響符号化部1100と、その音響符号化信号を復号化するマルチチャンネル音響復号化部1200とを備えている。
マルチチャンネル音響符号化部1100は、1024サンプルや2048サンプルなどによって示されるフレーム単位でオーディオ信号(例えば、2チャンネルのオーディオ信号L,R)を処理するものであって、ダウンミックス部1110と、バイノーラルキュー算出部1120と、オーディオエンコーダ部1150と、多重化部1190とを備えている。
ダウンミックス部1110は、2チャンネルのスペクトル表現されたオーディオ信号L,Rの平均をとることによって、つまり、M=(L+R)/2によって、オーディオ信号L,Rがダウンミックスされたダウンミックス信号Mを生成する。
バイノーラルキュー算出部1120は、スペクトルバンドごとに、オーディオ信号L,Rおよびダウンミックス信号Mを比較することによって、ダウンミックス信号Mをオーディオ信号L,Rに戻すためのバイノーラルキュー情報を生成する。
バイノーラルキュー情報は、チャンネル間レベル差(inter-channel level/intensity difference)IID、チャンネル間相関(inter-channel coherence/correlation)ICC、チャンネル間位相差(inter-channel phase/delay difference)IPD、およびチャンネル予測係数(Channel Prediction Coefficients)CPCを示す。
一般に、チャンネル間レベル差IIDは、音のバランスや定位を制御するための情報であって、チャンネル間相関ICCは、音像の幅や拡散性を制御するための情報である。これらは、共に聴き手が聴覚的情景を頭の中で構成するのを助ける空間パラメータである。
スペクトル表現されたオーディオ信号L,Rおよびダウンミックス信号Mは、「パラメータバンド」からなる通常複数のグループに区分されている。したがって、バイノーラルキュー情報は、それぞれのパラメータバンド毎に算出される。なお、「バイノーラルキュー情報」と「空間パラメータ」という用語はしばしば同義的に用いられる。
オーディオエンコーダ部1150は、例えば、MP3(MPEG Audio Layer-3)や、AAC(Advanced Audio Coding)などによって、ダウンミックス信号Mを圧縮符号化する。
多重化部1190は、ダウンミックス信号Mと、量子化されたバイノーラルキュー情報とを多重化することによりビットストリームを生成し、そのビットストリームを上述の音響符号化信号として出力する。
マルチチャンネル音響復号化部1200は、逆多重化部1210と、オーディオデコーダ部1220と、分析フィルタ部1230と、マルチチャンネル合成部1240と、合成フィルタ部1290とを備えている。
逆多重化部1210は、上述のビットストリームを取得し、そのビットストリームから量子化されたバイノーラルキュー情報と、符号化されたダウンミックス信号Mとを分離して出力する。なお、逆多重化部1210は、量子化されたバイノーラルキュー情報を逆量子化して出力する。
オーディオデコーダ部1220は、符号化されたダウンミックス信号Mを復号化して分析フィルタ部1230に出力する。
分析フィルタ部1230は、ダウンミックス信号Mの表現形式を、時間/周波数ハイブリッド表現に変換して出力する。
マルチチャンネル合成部1240は、分析フィルタ部1230から出力されたダウンミックス信号Mと、逆多重化部1210から出力されたバイノーラルキュー情報とを取得する。そして、マルチチャンネル合成部1240は、そのバイノーラルキュー情報を用いて、ダウンミックス信号Mから、2つのオーディオ信号L,Rを時間/周波数ハイブリッド表現で復元する。
合成フィルタ部1290は、復元されたオーディオ信号の表現形式を、時間/周波数ハイブリッド表現から時間表現に変換し、その時間表現のオーディオ信号L,Rを出力する。
なお、上述では、2チャンネルのオーディオ信号を符号化して復号化する例を挙げてマルチチャンネル音響信号処理装置1000を説明したが、マルチチャンネル音響信号処理装置1000は、2チャンネルよりも多いチャンネルのオーディオ信号(例えば、5.1チャンネル音源を構成する、6つのチャンネルのオーディオ信号)を、符号化および復号化することもできる。
図2は、マルチチャンネル合成部1240の機能構成を示す機能ブロック図である。
マルチチャンネル合成部1240は、例えば、ダウンミックス信号Mを6つのチャンネルのオーディオ信号に分離する場合、第1分離部1241と、第2分離部1242と、第3分離部1243と、第4分離部1244と、第5分離部1245とを備える。なお、ダウンミックス信号Mは、聴取者の正面に配置されるスピーカに対する正面オーディオ信号Cと、視聴者の左前方に配置されるスピーカに対する左前オーディオ信号Lfと、視聴者の右前方に配置されるスピーカに対する右前オーディオ信号Rfと、視聴者の左横方に配置されるスピーカに対する左横オーディオ信号Lsと、視聴者の右横方に配置されるスピーカに対する右横オーディオ信号Rsと、低音出力用サブウーファースピーカに対する低域オーディオ信号LFEとがダウンミックスされて構成されている。
第1分離部1241は、ダウンミックス信号Mから第1ダウンミックス信号M1と第4ダウンミックス信号M4とを分離して出力する。第1ダウンミックス信号M1は、正面オーディオ信号Cと左前オーディオ信号Lfと右前オーディオ信号Rfと低域オーディオ信号LFEとがダウンミックスされて構成されている。第4ダウンミックス信号M4は、左横オーディオ信号Lsと右横オーディオ信号Rsとがダウンミックスされて構成されている。
第2分離部1242は、第1ダウンミックス信号M1から第2ダウンミックス信号M2と第3ダウンミックス信号M3とを分離して出力する。第2ダウンミックス信号M2は、左前オーディオ信号Lfと右前オーディオ信号Rfとがダウンミックスされて構成されている。第3ダウンミックス信号M3は、正面オーディオ信号Cと低域オーディオ信号LFEとがダウンミックスされて構成されている。
第3分離部1243は、第2ダウンミックス信号M2から左前オーディオ信号Lfと右前オーディオ信号Rfとを分離して出力する。
第4分離部1244は、第3ダウンミックス信号M3から正面オーディオ信号Cと低域オーディオ信号LFEとを分離して出力する。
第5分離部1245は、第4ダウンミックス信号M4から左横オーディオ信号Lsと右横オーディオ信号Rsとを分離して出力する。
このように、マルチチャンネル合成部1240は、マルチステージの方法によって、各分離部で1つの信号を2つの信号に分離し、単一のオーディオ信号が分離されるまで再帰的に信号の分離を繰り返す。
図3は、バイノーラルキュー算出部1120の構成を示すブロック図である。
バイノーラルキュー算出部1120は、第1レベル差算出部1121、第1位相差算出部1122および第1相関算出部1123と、第2レベル差算出部1124、第2位相差算出部1125および第2相関算出部1126と、第3レベル差算出部1127、第3位相差算出部1128および第3相関算出部1129と、第4レベル差算出部1130、第4位相差算出部1131および第4相関算出部1132と、第5レベル差算出部1133、第5位相差算出部1134および第5相関算出部1135と、加算器1136,1137,1138,1139とを備えている。
第1レベル差算出部1121は、左前オーディオ信号Lfと右前オーディオ信号Rfとの間のレベル差を算出して、その算出結果であるチャンネル間レベル差IIDを示す信号を出力する。第1位相差算出部1122は、左前オーディオ信号Lfと右前オーディオ信号Rfとの間の位相差を算出して、その算出結果であるチャンネル間位相差IPDを示す信号を出力する。第1相関算出部1123は、左前オーディオ信号Lfと右前オーディオ信号Rfとの間の相関を算出して、その算出結果であるチャンネル間相関ICCを示す信号を出力する。加算器1136は、左前オーディオ信号Lfと右前オーディオ信号Rfとを加算して所定の係数を乗算することで、第2ダウンミックス信号M2を生成して出力する。
第2レベル差算出部1124、第2位相差算出部1125および第2相関算出部1126は、上述と同様に、左横オーディオ信号Lsと右横オーディオ信号Rsとの間のチャンネル間レベル差IID、チャンネル間位相差IPDおよびチャンネル間相関ICCのそれぞれを示す信号を出力する。加算器1137は、左横オーディオ信号Lsと右横オーディオ信号Rsとを加算して所定の係数を乗算することで、第3ダウンミックス信号M3を生成して出力する。
第3レベル差算出部1127、第3位相差算出部1128および第3相関算出部1129は、上述と同様に、正面オーディオ信号Cと低域オーディオ信号LFEとの間のチャンネル間レベル差IID、チャンネル間位相差IPDおよびチャンネル間相関ICCのそれぞれを示す信号を出力する。加算器1138は、正面オーディオ信号Cと低域オーディオ信号LFEとを加算して所定の係数を乗算することで、第4ダウンミックス信号M4を生成して出力する。
第4レベル差算出部1130、第4位相差算出部1131および第4相関算出部1132は、上述と同様に、第2ダウンミックス信号M2と第3ダウンミックス信号M3との間のチャンネル間レベル差IID、チャンネル間位相差IPDおよびチャンネル間相関ICCのそれぞれを示す信号を出力する。加算器1139は、第2ダウンミックス信号M2と第3ダウンミックス信号M3とを加算して所定の係数を乗算することで、第1ダウンミックス信号M1を生成して出力する。
第5レベル差算出部1133、第5位相差算出部1134および第5相関算出部1135は、上述と同様に、第1ダウンミックス信号M1と第4ダウンミックス信号M4との間のチャンネル間レベル差IID、チャンネル間位相差IPDおよびチャンネル間相関ICCのそれぞれを示す信号を出力する。
図4は、マルチチャンネル合成部1240の構成を示す構成図である。
マルチチャンネル合成部1240は、プレマトリックス処理部1251と、ポストマトリックス処理部1252と、第1演算部1253および第2演算部1255と、無相関信号生成部1254とを備えている。
プレマトリックス処理部1251は、信号強度レベルの各チャンネルへの配分を示す行列R1を、バイノーラルキュー情報を用いて生成する。
例えば、プレマトリックス処理部1251は、ダウンミックス信号Mの信号強度レベルと、第1ダウンミックス信号M1、第2ダウンミックス信号M2、第3ダウンミックス信号M3および第4ダウンミックス信号M4の信号強度レベルとの比率を示すチャンネル間レベル差IIDを用いて、ベクトル要素R1[0]〜R1[4]によって構成される行列R1を生成する。
第1演算部1253は、分析フィルタ部1230から出力された時間/周波数ハイブリッド表現のダウンミックス信号Mを入力信号xとして取得し、例えば(数1)および(数2)に示すように、その入力信号xと行列R1との積を算出する。そして、第1演算部1253は、その行列演算結果を示す中間信号vを出力する。つまり、第1演算部1253は、分析フィルタ部1230から出力された時間/周波数ハイブリッド表現のダウンミックス信号Mから、4つのダウンミックス信号M1〜M4を分離する。
Figure 0005053849
Figure 0005053849
無相関信号生成部1254は、中間信号vに対してオールパスフィルタ処理を施すことによって、(数3)に示すように、無相関信号wを出力する。なお、無相関信号wの構成要素MrevおよびMi,revは、ダウンミックス信号M,Miに対して無相関処理が施された信号である。また、信号Mrevおよび信号Mi,revは、ダウンミックス信号M,Miと同じエネルギーを有し、音が広がっているかのような印象を与える残響を含む。
Figure 0005053849
図5は、無相関信号生成部1254の構成を示すブロック図である。
無相関信号生成部1254は、初期遅延部D100と、オールパスフィルタD200とを備えている。
初期遅延部D100は、中間信号vを取得すると、その中間信号vを予め定められた時間だけ遅延させて、つまり位相を遅らせて、オールパスフィルタD200に出力する。
オールパスフィルタD200は、周波数―振幅特性には変化がなく、周波数−位相特性のみ変化させるオールパス特性を有し、IIR(Infinite Impulse Response)フィルタとして構成されている。
このようなオールパスフィルタD200は、乗算器D201〜D207と、遅延器D221〜D223と、加減算器D211〜D223とを備えている。
図6は、無相関信号生成部1254のインパルス応答を示す図である。
無相関信号生成部1254は、図6に示すように、時刻0にインパルス信号を取得しても、時刻t10まで信号を出力せずに遅延させ、時刻t10から次第に振幅が小さくなるような信号を残響として時刻t11まで出力する。つまり、このように無相関信号生成部1254から出力される信号Mrev,Mi,revは、ダウンミックス信号M,Miの音に残響が付加された音を示す。
ポストマトリックス処理部1252は、残響の各チャンネルへの配分を示す行列R2を、バイノーラルキュー情報を用いて生成する。
例えば、ポストマトリックス処理部1252は、音像の幅や拡散性を示すチャンネル間相関ICCからミキシング係数Hijを導出し、そのミキシング係数Hijから構成される行列R2を生成する。
第2演算部1255は、無相関信号wと行列R2との積を算出し、その行列演算結果を示す出力信号yを出力する。つまり、第2演算部1255は、無相関信号wから、6つのオーディオ信号Lf,Rf,Ls,Rs,C,LFEを分離する。
例えば、図2に示すように、左前オーディオ信号Lfは、第2ダウンミックス信号M2から分離されるため、その左前オーディオ信号Lfの分離には、第2ダウンミックス信号M2と、それに対応する無相関信号wの構成要素M2,revとが用いられる。同様に、第2ダウンミックス信号M2は、第1ダウンミックス信号M1から分離されるため、その第2ダウンミックス信号M2の算出には、第1ダウンミックス信号M1と、それに対応する無相関信号wの構成要素M1,revとが用いられる。
したがって、左前オーディオ信号Lfは、下記の(数4)により示される。
Figure 0005053849
ここで、(数4)中のHij,Aは、第3分離部1243におけるミキシング係数であり、Hij,Dは、第2分離部1242におけるミキシング係数であり、Hij,Eは、第1分離部1241におけるミキシング係数である。(数4)に示す3つの数式は、以下の(数5)に示す一つのベクトル乗算式にまとめることができる。
Figure 0005053849
左前オーディオ信号Lf以外の他のオーディオ信号Rf,C,LFE,Ls,Rsも、上述のような行列と無相関信号wの行列との演算によって算出される。つまり、出力信号yは、下記の(数6)によって示される。
Figure 0005053849
図7は、ダウンミックス信号を説明するための説明図である。
ダウンミックス信号は、通常、図7に示されるように時間/周波数ハイブリッド表現で表現される。つまり、ダウンミックス信号は、時間軸方向に沿って時間単位であるパラメータセットpsに分けられ、さらに、空間軸方向に沿ってサブバンド単位であるパラメータバンドpbに分けられて表現される。したがって、バイノーラルキュー情報は、バンド(ps,pb)ごとに算出される。また、プレマトリックス処理部1251およびポストマトリックス処理部1252はそれぞれ、バンド(ps,pb)ごとに行列R1(ps,pb)と行列R2(ps,pb)とを算出する。
図8は、プレマトリックス処理部1251およびポストマトリックス処理部1252の詳細な構成を示すブロック図である。
プレマトリックス処理部1251は、行列式生成部1251aと内挿部1251bとを備えている。
行列式生成部1251aは、バンド(ps,pb)ごとのバイノーラルキュー情報から、バンド(ps,pb)ごとの行列R1(ps,pb)を生成する。
内挿部1251bは、バンド(ps,pb)ごとの行列R1(ps,pb)を、周波数高分解能時間インデックスn、およびハイブリッド表現の入力信号xのサブ・サブバンドインデックスsbに従ってマッピング、つまり内挿する。その結果、内挿部1251bは、(n,sb)ごとの行列R1(n,sb)を生成する。このように内挿部1251bは、複数のバンドの境界に渡る行列R1の遷移が滑らかであることを保証する。
ポストマトリックス処理部1252は、行列式生成部1252aと内挿部1252bとを備えている。
行列式生成部1252aは、バンド(ps,pb)ごとのバイノーラルキュー情報から、バンド(ps,pb)ごとの行列R2(ps,pb)を生成する。
内挿部1252bは、バンド(ps,pb)ごとの行列R2(ps,pb)を、周波数高分解能時間インデックスn、およびハイブリッド表現の入力信号xのサブ・サブバンドインデックスsbに従ってマッピング、つまり内挿する。その結果、内挿部1252bは、(n,sb)ごとの行列R2(n,sb)を生成する。このように内挿部1252bは、複数のバンドの境界に渡る行列R2の遷移が滑らかであることを保証する。
J. Herre、 et al、 "The Reference Model Architecture for MPEG Spatial Audio Coding"、 118th AES Convention、 Barcelona
しかしながら、従来のマルチチャンネル音響信号処理装置では演算負荷が多大であるという問題がある。
つまり、従来のマルチチャンネル合成部1240のプレマトリックス処理部1251、ポストマトリックス処理部1252、第1演算部1253、および第2演算部1255における演算負荷は多大なものとなる。
そこで、本発明は、かかる問題に鑑みてなされたものであって、演算負荷を軽減したマルチチャンネル音響信号処理装置を提供することを目的とする。
上記目的を達成するために、mチャンネル(m>1)のオーディオ信号がダウンミックスされて構成される入力信号から、前記mチャンネルのオーディオ信号を分離するマルチチャンネル音響信号処理装置であって、前記入力信号に対して、遅延とオールパスフィルタ処理による残響処理を行うことにより、前記入力信号に残響成分が含まれる無相関信号を生成する無相関信号生成手段と、信号強度レベルの配分を示すレベル配分行列と、残響成分の配分を示す残響調整行列との積を示す統合行列を生成するマトリックス生成手段と、前記無相関信号および統合行列に対する前記入力信号の位相を調整する位相調整手段と、前記位相調整手段によって位相が調整された前記入力信号および前記無相関信号により示される行列と、前記マトリックス生成手段によって生成された統合行列との積を算出することにより、mチャンネルのオーディオ信号を生成する演算手段とを備えることを特徴とする。
また、上記目的を達成するために、本発明に係るマルチチャンネル音響信号処理装置は、mチャンネル(m>1)のオーディオ信号がダウンミックスされて構成される入力信号から、前記mチャンネルのオーディオ信号を分離するマルチチャンネル音響信号処理装置であって、前記入力信号に対して残響処理を行うことにより、前記入力信号の示す音に残響が含まれるような音を示す無相関信号を生成する無相関信号生成手段と、前記無相関信号生成手段により生成された無相関信号および前記入力信号に対して、信号強度レベルの配分および残響の配分を示す行列を用いた演算を行うことにより、前記mチャンネルのオーディオ信号を生成する行列演算手段とを備えることを特徴とする。
これにより、無相関信号が生成された後に、信号強度レベルの配分および残響の配分を示す行列を用いた演算が行われるため、従来のように、信号強度レベルの配分を示す行列の演算と残響の配分を示す行列の演算とを、無相関信号の生成の前後で分けて行うことなく、これらの行列演算をまとめて行うことができる。その結果、演算負荷を軽減することができる。つまり、信号強度レベルの配分を行う処理が無相関信号の生成の後に行われて分離されたオーディオ信号と、信号強度レベルの配分を行う処理が無相関信号の生成の前に行われて分離されたオーディオ信号とは類似している。したがって、本発明では、近似計算を適用することにより、行列演算をまとめることができるのである。その結果、演算に用いられるメモリの容量を減らすことができ、装置の小型化を図ることができる。
また、前記行列演算手段は、前記信号強度レベルの配分を示すレベル配分行列と、前記残響の配分を示す残響調整行列との積を示す統合行列を生成するマトリックス生成手段と、前記無相関信号および前記入力信号により示される行列と、前記マトリックス生成手段によって生成された統合行列との積を算出することにより、前記mチャンネルのオーディオ信号を生成する演算手段とを備えることを特徴としてもよい。
これにより、統合行列を用いた行列演算を1回だけ行えば、入力信号からmチャンネルのオーディオ信号が分離されるため、演算負荷を確実に軽減することができる。
また、前記マルチチャンネル音響信号処理装置は、さらに、前記無相関信号および統合行列に対する前記入力信号の位相を調整する位相調整手段を備えることを特徴としてもよい。例えば、前記位相調整手段は、経時的に変化する前記統合行列または前記入力信号を遅延させる。
これにより、無相関信号の生成に遅延が生じても、入力信号の位相が調整されるため、無相関信号および入力信号に対して、適切な統合行列を用いた演算を行うことができ、mチャンネルのオーディオ信号を適切に出力することができる。
また、前記位相調整手段は、前記無相関信号生成手段により生成される前記無相関信号の遅延時間だけ、前記統合行列または前記入力信号を遅延させることを特徴としてもよい。または、前記位相調整手段は、前記無相関信号生成手段により生成される前記無相関信号の遅延時間に最も近い、予め定められた処理単位の整数倍の処理に要する時間だけ、前記統合行列または前記入力信号を遅延させることを特徴としてもよい。
これにより、統合行列または入力信号の遅延量が、無相関信号の遅延時間と略等しくなるため、無相関信号および入力信号に対して、より適切な統合行列を用いた演算を行うことができ、mチャンネルのオーディオ信号をより適切に出力することができる。
また、前記位相調整手段は、予め定められた検知限度以上にプリエコーが発生する場合に、前記位相を調整することを特徴としてもよい。
これにより、プリエコーが検知されるのを確実に防ぐことができる。
なお、本発明は、このようなマルチチャンネル音響信号処理装置として実現することができるだけでなく、集積回路や、方法、プログラム、そのプログラムを格納する記憶媒体としても実現することができる。
本発明のマルチチャンネル音響信号処理装置は、演算負荷を軽減することができるという作用効果を奏する。つまり、本発明では、ビットストリームシンタクスの変形や、認識可能なほどの音質の低下を引き起こすことなく、マルチチャンネル音響デコーダの処理の複雑性を軽減することができる。
以下、本発明の実施の形態におけるマルチチャンネル音響信号処理装置について図面を参照しながら説明する。
図9は、本発明の実施の形態におけるマルチチャンネル音響信号処理装置の構成を示すブロック図である。
本実施の形態におけるマルチチャンネル音響信号処理装置100は、演算負荷を軽減したものであって、オーディオ信号の組に対する空間音響符号化を行って音響符号化信号を出力するマルチチャンネル音響符号化部100aと、その音響符号化信号を復号化するマルチチャンネル音響復号化部100bとを備えている。
マルチチャンネル音響符号化部100aは、1024サンプルや2048サンプルなどによって示されるフレーム単位で入力信号(例えば、入力信号L,R)を処理するものであって、ダウンミックス部110と、バイノーラルキュー算出部120と、オーディオエンコーダ部130と、多重化部140とを備えている。
ダウンミックス部110は、2チャンネルのスペクトル表現されたオーディオ信号L,Rの平均をとることによって、つまり、M=(L+R)/2によって、オーディオ信号L,Rがダウンミックスされたダウンミックス信号Mを生成する。
バイノーラルキュー算出部120は、スペクトルバンドごとに、オーディオ信号L,Rおよびダウンミックス信号Mを比較することによって、ダウンミックス信号Mをオーディオ信号L,Rに戻すためのバイノーラルキュー情報を生成する。
バイノーラルキュー情報は、チャンネル間レベル差(inter-channel level/intensity difference)IID、チャンネル間相関(inter-channel coherence/correlation)ICC、チャンネル間位相差(inter-channel phase/delay difference)IPD、およびチャンネル予測係数(Channel Prediction Coefficients)CPCを示す。
一般に、チャンネル間レベル差IIDは、音のバランスや定位を制御するための情報であって、チャンネル間相関ICCは、音像の幅や拡散性を制御するための情報である。これらは、共に聴き手が聴覚的情景を頭の中で構成するのを助ける空間パラメータである。
スペクトル表現されたオーディオ信号L,Rおよびダウンミックス信号Mは、「パラメータバンド」からなる通常複数のグループに区分されている。したがって、バイノーラルキュー情報は、それぞれのパラメータバンド毎に算出される。なお、「バイノーラルキュー情報」と「空間パラメータ」という用語はしばしば同義的に用いられる。
オーディオエンコーダ部130は、例えば、MP3(MPEG Audio Layer-3)や、AAC(Advanced Audio Coding)などによって、ダウンミックス信号Mを圧縮符号化する。
多重化部140は、ダウンミックス信号Mと、量子化されたバイノーラルキュー情報とを多重化することによりビットストリームを生成し、そのビットストリームを上述の音響符号化信号として出力する。
マルチチャンネル音響復号化部100bは、逆多重化部150と、オーディオデコーダ部160と、分析フィルタ部170と、マルチチャンネル合成部180と、合成フィルタ部190とを備えている。
逆多重化部150は、上述のビットストリームを取得し、そのビットストリームから量子化されたバイノーラルキュー情報と、符号化されたダウンミックス信号Mとを分離して出力する。なお、逆多重化部150は、量子化されたバイノーラルキュー情報を逆量子化して出力する。
オーディオデコーダ部160は、符号化されたダウンミックス信号Mを復号化して分析フィルタ部170に出力する。
分析フィルタ部170は、ダウンミックス信号Mの表現形式を、時間/周波数ハイブリッド表現に変換して出力する。
マルチチャンネル合成部180は、分析フィルタ部170から出力されたダウンミックス信号Mと、逆多重化部150から出力されたバイノーラルキュー情報とを取得する。そして、マルチチャンネル合成部180は、そのバイノーラルキュー情報を用いて、ダウンミックス信号Mから、2つのオーディオ信号L,Rを時間/周波数ハイブリッド表現で復元する。
合成フィルタ部190は、復元されたオーディオ信号の表現形式を、時間/周波数ハイブリッド表現から時間表現に変換し、その時間表現のオーディオ信号L,Rを出力する。
なお、上述では、2チャンネルのオーディオ信号を符号化して復号化する例を挙げて本実施の形態のマルチチャンネル音響信号処理装置100を説明したが、本実施の形態のマルチチャンネル音響信号処理装置100は、2チャンネルよりも多いチャンネルのオーディオ信号(例えば、5.1チャンネル音源を構成する、6つのチャンネルのオーディオ信号)を、符号化および復号化することもできる。
ここで本実施の形態では、マルチチャンネル音響復号化部100bのマルチチャンネル合成部180に特徴がある。
図10は、本発明の実施の形態におけるマルチチャンネル合成部180の構成を示すブロック図である。
本実施の形態におけるマルチチャンネル合成部180は、演算負荷を軽減したものであって、無相関信号生成部181と、第1演算部182と、第2演算部183と、プレマトリックス処理部184と、ポストマトリックス処理部185とを備えている。
無相関信号生成部181は、上述の無相関信号生成部1254と同様に構成され、オールパスフィルタD200などを備えている。このような無相関信号生成部181は、時間/周波数ハイブリッド表現のダウンミックス信号Mを入力信号xとして取得する。そして、無相関信号生成部181は、その入力信号xに対して残響処理を行なうことにより、その入力信号xの示す音に残響が含まれるような音を示す無相関信号w’を生成して出力する。つまり、無相関信号生成部181は、入力信号xを示すベクトルをx=(M,M,M,M,M)として、(数7)に示すように無相関信号w’を生成する。なお、無相関信号w’は、入力信号xに対して相互相関が低い信号である。
Figure 0005053849
プレマトリックス処理部184は、行列式生成部184aと内挿部184bとを備え、バイノーラルキュー情報を取得し、そのバイノーラルキュー情報を用いて、信号強度レベルの各チャンネルへの配分を示す行列R1を生成する。
行列式生成部184aは、バイノーラルキュー情報のチャンネル間レベル差IIDを用いて、ベクトル要素R1[1]〜R1[5]によって構成される上述の行列R1をバンド(ps,pb)ごとに生成する。つまり、行列R1は時間経過に伴って変化する。
内挿部184bは、バンド(ps,pb)ごとの行列R1(ps,pb)を、周波数高分解能時間インデックスn、およびハイブリッド表現の入力信号xのサブ・サブバンドインデックスsbに従ってマッピング、つまり内挿する。その結果、内挿部184bは、(n,sb)ごとの行列R1(n,sb)を生成する。このように内挿部184bは、複数のバンドの境界に渡る行列R1の遷移が滑らかであることを保証する。
第1演算部182は、無相関信号w’の行列と行列R1との積を算出することにより、(数8)に示すように中間信号zを生成して出力する。
Figure 0005053849
ポストマトリックス処理部185は、行列式生成部185aと内挿部185bとを備え、バイノーラルキュー情報を取得し、そのバイノーラルキュー情報を用いて、残響の各チャンネルへの配分を示す行列R2を生成する。
行列式生成部185aは、バイノーラルキュー情報のチャンネル間相関ICCからミキシング係数Hijを導出し、そのミキシング係数Hijから構成される上述の行列R2をバンド(ps,pb)ごとに生成する。つまり、行列R2は時間経過に伴って変化する。
内挿部185bは、バンド(ps,pb)ごとの行列R2(ps,pb)を、周波数高分解能時間インデックスn、およびハイブリッド表現の入力信号xのサブ・サブバンドインデックスsbに従ってマッピング、つまり内挿する。その結果、内挿部185bは、(n,sb)ごとの行列R2(n,sb)を生成する。このように内挿部185bは、複数のバンドの境界に渡る行列R2の遷移が滑らかであることを保証する。
第2演算部183は、(数9)に示すように、中間信号zの行列と行列R2との積を算出し、その演算結果を示す出力信号yを出力する。つまり、第2演算部183は、中間信号zから、6つのオーディオ信号Lf,Rf,Ls,Rs,C,LFEを分離する。
Figure 0005053849
このように本実施の形態では、入力信号xに対して無相関信号w’が生成されて、その無相関信号w’に対して行列R1を用いた行列演算が行われる。つまり、従来では、入力信号xに対して行列R1を用いた行列演算が行われて、その演算結果である中間信号vに対して無相関信号wが生成されるが、本実施の形態では、その逆の順序で処理が行われる。
しかし、このように処理順序を逆にしても、(数8)に示すR1decorr(x)が、(数3)に示すdecorr(v)つまりdecorr(R1x)に略等しいことが経験上分かっている。即ち、本実施の形態における第2演算部183で行列R2の行列演算の対象とされる中間信号zは、従来の第2演算部1255で行列R2の行列演算の対象とされる無相関信号wと略等しい。
したがって、本実施の形態のように、処理順序を従来と逆にしても、マルチチャンネル合成部180は、従来と同様の出力信号yを出力することができる。
図11は、本実施の形態におけるマルチチャンネル合成部180の動作を示すフローチャートである。
まず、マルチチャンネル合成部180は、入力信号xを取得して(ステップS100)、その入力信号xに対する無相関信号w’を生成する(ステップS102)。また、マルチチャンネル合成部180は、バイノーラルキュー情報に基づいて行列R1および行列R2を生成する(ステップS104)。
そして、マルチチャンネル合成部180は、ステップS104で生成された行列R1と、入力信号xおよび無相関信号w’により示される行列との積を算出することにより、つまり行列R1による行列演算を行うことにより、中間信号zを生成する(ステップS106)。
さらに、マルチチャンネル合成部180は、ステップS104で生成された行列R2と、その中間信号zにより示される行列との積を算出することにより、つまり行列R2による行列演算を行うことにより、出力信号yを生成する(ステップS106)。
このように本実施の形態では、無相関信号が生成された後に、信号強度レベルの配分および残響の配分を示す行列R1および行列R2を用いた演算が行われるため、従来のように、信号強度レベルの配分を示す行列R1を用いた演算と残響の配分を示す行列R2を用いた演算とを、無相関信号の生成の前後で分けて行うことなく、これらの行列演算をまとめて行うことができる。その結果、演算負荷を軽減することができる。
ここで、本実施の形態におけるマルチチャンネル合成部180では、上述のように処理順序が変更されているため、図10に示すマルチチャンネル合成部180の構成をさらに簡略化することができる。
図12は、簡略化されたマルチチャンネル合成部180の構成を示すブロック図である。
このマルチチャンネル合成部180は、第1演算部182および第2演算部183の代わりに第3演算部186を備えるとともに、プレマトリックス処理部184およびポストマトリックス処理部185の代わりにマトリックス処理部187を備える。
マトリックス処理部187は、プレマトリックス処理部184とポストマトリックス処理部185とを統合して構成されており、行列式生成部187aと内挿部187bとを備えている。
行列式生成部187aは、バイノーラルキュー情報のチャンネル間レベル差IIDを用いて、ベクトル要素R1[1]〜R1[5]によって構成される上述の行列R1をバンド(ps,pb)ごとに生成する。さらに、行列式生成部187aは、バイノーラルキュー情報のチャンネル間相関ICCからミキシング係数Hijを導出し、そのミキシング係数Hijから構成される上述の行列R2をバンド(ps,pb)ごとに生成する。
さらに、行列式生成部187aは、上述のように生成された行列R1と行列R2との積を算出することで、その算出結果である行列R3を統合行列としてバンド(ps,pb)ごとに生成する。
内挿部187bは、バンド(ps,pb)ごとの行列R3(ps,pb)を、周波数高分解能時間インデックスn、およびハイブリッド表現の入力信号xのサブ・サブバンドインデックスsbに従ってマッピング、つまり内挿する。その結果、内挿部187bは、(n,sb)ごとの行列R3(n,sb)を生成する。このように内挿部187bは、複数のバンドの境界に渡る行列R3の遷移が滑らかであることを保証する。
第3演算部186は、(数10)に示すように、無相関信号w’および入力信号xにより示される行列と、行列R3との積を算出することにより、その算出結果を示す出力信号yを出力する。
Figure 0005053849
このように本実施の形態では、内挿部187bにおける内挿回数(補間回数)は、従来の内挿部1251bおよび内挿部1252bにおける内挿回数(補間回数)と比較して略半分となり、第3演算部186における乗算回数(行列演算の回数)は、従来の第1演算部1253および第2演算部1255における乗算回数(行列演算の回数)と比較して略半分となる。つまり、本実施の形態では、行列R3を用いた行列演算を1回だけ行えば、入力信号xから複数のチャンネルのオーディオ信号が分離される。一方、本実施の形態では、行列式生成部187aの処理が若干増加する。ところが、行列式生成部187aにおけるバイノーラルキュー情報のバンド分解能(ps,pb)は、内挿部187bや第3演算部186において扱われるバンド分解能(n,sb)よりも粗い。したがって、行列式生成部187aの演算負荷は、内挿部187bや第3演算部186に比べて小さく、全体の演算負荷に占める割合は小さい。よって、マルチチャンネル合成部180の全体およびマルチチャンネル音響信号処理装置100の全体の演算負荷を大幅に削減することができる。
図13は、簡略化されたマルチチャンネル合成部180の動作を示すフローチャートである。
まず、マルチチャンネル合成部180は、入力信号xを取得して(ステップS120)、その入力信号xに対する無相関信号w’を生成する(ステップS120)。また、マルチチャンネル合成部180は、バイノーラルキュー情報に基づいて、行列R1および行列R2の積を示す行列R3を生成する(ステップS124)。
そして、マルチチャンネル合成部180は、ステップS124で生成された行列R3と、入力信号xおよび無相関信号w’により示される行列との積を算出することにより、つまり行列R3による行列演算を行うことにより、出力信号yを生成する(ステップS126)。
(変形例1)
ここで本実施の形態における第1の変形例について説明する。
上記実施の形態におけるマルチチャンネル合成部180では、無相関信号生成部181が無相関信号w’を入力信号xに対して遅延させて出力するため、第3演算部186において、演算の対象となる入力信号xと無相関信号w'と行列R3を構成する行列R1との間でずれが生じて同期が取れない。なお、無相関信号w'の遅延は、その無相関信号w’の生成のために必然的に発生する。一方、従来例では、第1演算部1253において、演算の対象となる入力信号xと行列R1との間でずれは生じていない。
したがって、上記実施の形態におけるマルチチャンネル合成部180では、本来出力すべき理想的な出力信号yを出力することができない可能性がある。
図14は、上記実施の形態におけるマルチチャンネル合成部180によって出力される信号を説明するための説明図である。
例えば、入力信号xは、図14に示すように、時刻t=0から出力される。また、行列R3を構成する行列R1には、オーディオ信号Lに寄与する成分である行列R1Lと、オーディオ信号Rに寄与する成分である行列R1Rとが含まれている。例えば、行列R1Lおよび行列R1Rは、バイノーラルキュー情報に基づいて、図14に示すように、時刻t=0以前ではオーディオ信号Rにレベルが大きく配分され、時刻t=0〜t1の時間ではオーディオ信号Lにレベルが大きく配分され、時刻t=t1以降ではオーディオ信号Rにレベルが大きく配分されるように設定されている。
ここで、従来のマルチチャンネル合成部1240では、入力信号xと上述の行列R1との間で同期が取れているため、入力信号xから行列R1Lと行列R1Rに応じて中間信号vが生成されると、オーディオ信号Lにレベルが大きく偏るような中間信号vが生成される。そして、この中間信号vに対して無相関信号wが生成される。その結果、入力信号xから、無相関信号生成部1254による無相関信号wの遅延時間tdだけ遅れて、残響を含む出力信号yLがオーディオ信号Lとして出力され、オーディオ信号Rである出力信号yRは出力されない。このような出力信号yL,yRが理想的な出力の一例とされる。
一方、上記実施の形態におけるマルチチャンネル合成部180では、まず、入力信号xから遅延時間tdだけ遅れて、残響を含む無相関信号w’が出力される。ここで、第3演算部186によって扱われる行列R3には、上述の行列R1(行列R1Lおよび行列R1R)が含まれている。したがって、入力信号xと無相関信号w’に行列R3を用いた行列演算が行われると、入力信号x、無相関信号w’および行列R1との間で同期が取れていないため、オーディオ信号Lである出力信号yLは、時刻t=td〜t1の間だけ出力され、オーディオ信号Rである出力信号yRは、時刻t=t1以降に出力される。
このように、マルチチャンネル合成部180では、出力信号yLのみを出力すべきところ、出力信号yRも出力してしまう。即ち、チャンネルセパレーションの劣化が発生する。
そこで、本変形例にかかるマルチチャンネル合成部は、無相関信号w’および行列R3に対する入力信号xの位相を調整する位相調整手段を備え、この位相調整手段は行列式生成部187dから出力される行列R3を遅延させる。
図15は、本変形例に係るマルチチャンネル合成部の構成を示すブロック図である。
本変形例に係るマルチチャンネル合成部180aは、無相関信号生成部181aと、第3演算部186と、マトリックス処理部187cとを備えている。
無相関信号生成部181aは、上述の無相関信号生成部181と同様の機能を有するとともに、無相関信号w’のパラメータバンドpbにおける遅延量TD(pb)をマトリックス処理部187cに通知する。例えば、遅延量TD(pb)は、無相関信号w’の入力信号xに対する遅延時間tdと等しい。
マトリックス処理部187cは、行列式生成部187dと内挿部187bとを備えている。行列式生成部187dは、上述の行列式生成部187aと同様の機能を有するとともに上述の位相調整手段を備え、無相関信号生成部181aから通知された遅延量TD(pb)に応じた行列R3を生成する。つまり、行列式生成部187dは、(数11)に示すような行列R3を生成する。
Figure 0005053849
図16は、本変形例に係るマルチチャンネル合成部180aによって出力される信号を説明するための説明図である。
行列R3に含まれる行列R1(行列R1Lおよび行列R1R)は、入力信号xのパラメータバンドpbに対して遅延量TD(pb)だけ遅れて行列式生成部187dから生成される。
その結果、無相関信号w’が入力信号xから遅延時間tdだけ遅れて出力されても、行列R3に含まれる行列R1(行列R1Lおよび行列R1R)も遅延量TD(pb)だけ遅れている。したがって、このような行列R1と入力信号xと無相関信号w’との間のずれを解消して同期を取ることができる。その結果、マルチチャンネル合成部180aの第3演算部186は、出力信号yLのみを時刻t=tdから出力して、出力信号yRを出力しない。つまり、第3演算部186は、理想的な出力信号yL,yRを出力することができる。したがって、本変形例では、チャンネルセパレーションの劣化を抑えることができる。
なお、本変形例では、遅延時間td=遅延量TD(pb)としたが、これらを異ならせてもよい。また、行列式生成部187dは、所定処理単位(例えば、バンド(ps,pb))ごとに行列R3を生成しているので、遅延量TD(pb)を、遅延時間tdに最も近い、その所定処理単位の整数倍の処理に要する時間にしてもよい。
図17は、本変形例に係るマルチチャンネル合成部180aの動作を示すフローチャートである。
まず、マルチチャンネル合成部180aは、入力信号xを取得して(ステップS140)、その入力信号xに対する無相関信号w’を生成する(ステップS142)。また、マルチチャンネル合成部180aは、バイノーラルキュー情報に基づいて、行列R1および行列R2の積を示す行列R3を、遅延量TD(pb)だけ遅延させて生成する(ステップS144)。言い換えれば、マルチチャンネル合成部180aは、行列R3に含まれる行列R1を位相調整手段によって遅延量TD(pb)だけ遅延させる。
そして、マルチチャンネル合成部180aは、ステップS144で生成された行列R3と、入力信号xおよび無相関信号w’により示される行列との積を算出することにより、つまり行列R3による行列演算を行うことにより、出力信号yを生成する(ステップS146)。
このように、本変形例では、行列R3に含まれる行列R1を遅延させることで、入力信号xの位相を調整するため、無相関信号w’および入力信号xに対して、適切な行列R3を用いた演算を行うことができ、出力信号yを適切に出力することができる。
(変形例2)
ここで本実施の形態における第2の変形例について説明する。
本変形例に係るマルチチャンネル合成部は、上述の変形例1に係るマルチチャンネル合成部と同様に、無相関信号w’および行列R3に対する入力信号xの位相を調整する位相調整手段を備える。そして、本変形例に係る位相調整手段は、入力信号xの第3演算部186への入力を遅延させる。これにより本変形例においても、上述と同様に、チャンネルセパレーションの劣化を抑えることができる。
図18は、本変形例に係るマルチチャンネル合成部の構成を示すブロック図である。
本変形例に係るマルチチャンネル合成部180bは、入力信号xの第3演算部186への入力を遅延させる位相調整手段たる信号遅延部189を備えている。信号遅延部189は、例えば無相関信号生成部181の遅延時間tdだけ入力信号xを遅延させる。
これにより、本変形例では、無相関信号w’が入力信号xから遅延時間tdだけ遅れて出力されても、入力信号xの第3遅延部186への入力も遅延時間tdだけ遅延されるため、行列R3を構成する行列R1と入力信号xと無相関信号w’との間のずれを解消して同期を取ることができる。その結果、マルチチャンネル合成部180aの第3演算部186は、図16に示すように、出力信号yLのみを時刻t=tdから出力し、出力信号yRを出力しない。つまり、第3演算部186は、理想的な出力信号yL,yRを出力することができる。したがって、チャンネルセパレーションの劣化を抑えることができる。
なお、本変形例でも、遅延時間td=遅延量TD(pb)としたが、これらを異ならせてもよい。また、信号遅延部189が所定処理単位(例えば、バンド(ps,pb))ごとに遅延処理をしているような場合には、遅延量TD(pb)を、遅延時間tdに最も近い、その所定処理単位の整数倍の処理に要する時間にしてもよい。
図19は、本変形例に係るマルチチャンネル合成部180bの動作を示すフローチャートである。
まず、マルチチャンネル合成部180bは、入力信号xを取得して(ステップS160)、その入力信号xに対する無相関信号w’を生成する(ステップS162)。さらに、マルチチャンネル合成部180bは入力信号xを遅延させる(ステップS164)。
また、マルチチャンネル合成部180bは、バイノーラルキュー情報に基づいて、行列R1および行列R2の積を示す行列R3を生成する(ステップS166)。
そして、マルチチャンネル合成部180bは、ステップS166で生成された行列R3と、ステップS164で遅延された入力信号xおよび無相関信号w’により示される行列との積を算出することにより、つまり行列R3による行列演算を行うことにより、出力信号yを生成する(ステップS168)。
このように、本変形例では、入力信号xを遅延させることで、入力信号xの位相を調整するため、無相関信号w’および入力信号xに対して、適切な行列R3を用いた演算を行うことができ、出力信号yを適切に出力することができる。
以上、本発明に係るマルチチャンネル音響信号処理装置について、実施の形態およびその変形例を用いて説明したが、本発明は、これらに限定されるものではない。
例えば、変形例1および変形例2における位相調整手段は、予め定められた検知限度以上にプリエコーが発生する場合に限って、位相を調整してもよい。
つまり、上述の変形例1では、行列式生成部187dに含まれる位相調整手段が行列R3を遅延させ、上述の変形例2では、位相調整手段たる信号遅延部189が入力信号xを遅延させた。しかし、それらの位相遅延手段は、プリエコーが上記検知限度以上に発生する場合に限って遅延させてもよい。このプリエコーは、衝撃音の直前に発生するノイズであって、無相関信号w’の遅延時間tdに応じて発生しやすくなる。これにより、プリエコーが検知されるのを確実に防ぐことができる。
また、マルチチャンネル音響信号処理装置100や、マルチチャンネル音響符号化部100a、マルチチャンネル音響復号化部100b、マルチチャンネル合成部180,180a,180b、さらにこれらに含まれる各構成要素を、LSI(Large Scale Integration)などの集積回路によって構成してもよい。さらに、本発明は、これらの装置および各構成要素における動作をコンピュータに実行させるプログラムとしても実現することができる。
本発明のマルチチャンネル音響信号処理装置は、演算負荷を軽減することができるという効果を奏し、例えば、ホームシアターシステム、車載音響システムおよび電子ゲームシステムなどに適用可能であり、特に放送等の低ビットレートの応用において有用である。
図1は従来のマルチチャンネル音響信号処理装置の構成を示すブロック図である。 図2は同上のマルチチャンネル合成部の機能構成を示す機能ブロック図である。 図3は同上のバイノーラルキュー算出部の構成を示すブロック図である。 図4は同上のマルチチャンネル合成部の構成を示す構成図である。 図5は同上の無相関信号生成部の構成を示すブロック図である。 図6は同上の無相関信号生成部のインパルス応答を示す図である。 図7は同上のダウンミックス信号を説明するための説明図である。 図8は同上のプレマトリックス処理部およびポストマトリックス処理部の詳細な構成を示すブロック図である。 図9は本発明の実施の形態におけるマルチチャンネル音響信号処理装置の構成を示すブロック図である。 図10は同上のマルチチャンネル合成部の構成を示すブロック図である。 図11は同上のマルチチャンネル合成部の動作を示すフローチャートである。 図12は同上の簡略化されたマルチチャンネル合成部の構成を示すブロック図である。 図13は同上の簡略化されたマルチチャンネル合成部の動作を示すフローチャートである。 図14は同上のマルチチャンネル合成部によって出力される信号を説明するための説明図である。 図15は同上の変形例1に係るマルチチャンネル合成部の構成を示すブロック図である。 図16は同上の変形例1に係るマルチチャンネル合成部によって出力される信号を説明するための説明図である。 図17は同上の変形例1に係るマルチチャンネル合成部の動作を示すフローチャートである。 図18は同上の変形例2に係るマルチチャンネル合成部の構成を示すブロック図である。 図19は同上の変形例2に係るマルチチャンネル合成部の動作を示すフローチャートである。
符号の説明
100 マルチチャンネル音響信号処理装置
100a マルチチャンネル音響符号化部
100b マルチチャンネル音響復号化部
110 ダウンミックス部
120 バイノーラルキュー算出部
130 オーディオエンコーダ部
140 多重化部
150 逆多重化部
160 オーディオデコーダ部
170 分析フィルタ部
180 マルチチャンネル合成部
181 無相関信号生成部
182 第1演算部
183 第2演算部
184 プレマトリックス処理部
185 ポストマトリックス処理部
186 第3演算部
187 マトリックス処理部
190 合成フィルタ部

Claims (10)

  1. mチャンネル(m>1)のオーディオ信号がダウンミックスされて構成される入力信号から、前記mチャンネルのオーディオ信号を分離するマルチチャンネル音響信号処理装置であって、
    前記入力信号に対して、遅延とオールパスフィルタ処理による残響処理を行うことにより、前記入力信号に残響成分が含まれる無相関信号を生成する無相関信号生成手段と、
    信号強度レベルの配分を示すレベル配分行列と、残響成分の配分を示す残響調整行列との積を示す統合行列を生成するマトリックス生成手段と、
    前記無相関信号および統合行列に対する前記入力信号の位相を調整する位相調整手段と、
    前記位相調整手段によって位相が調整された前記入力信号および前記無相関信号により示される行列と、前記マトリックス生成手段によって生成された統合行列との積を算出することにより、mチャンネルのオーディオ信号を生成する演算手段
    を備えることを特徴とするマルチチャンネル音響信号処理装置。
  2. 前記位相調整手段は、経時的に変化する前記統合行列または前記入力信号を遅延させる
    ことを特徴とする請求項記載のマルチチャンネル音響信号処理装置。
  3. 前記位相調整手段は、前記無相関信号生成手段により生成される前記無相関信号の遅延時間だけ、前記統合行列または前記入力信号を遅延させる
    ことを特徴とする請求項記載のマルチチャンネル音響信号処理装置。
  4. 前記位相調整手段は、前記無相関信号生成手段により生成される前記無相関信号の遅延時間に最も近い、予め定められた処理単位の整数倍の処理に要する時間だけ、前記統合行列または前記入力信号を遅延させる
    ことを特徴とする請求項記載のマルチチャンネル音響信号処理装置。
  5. 前記位相調整手段は、予め定められた検知限度以上にプリエコーが発生する場合に、前記位相を調整する
    ことを特徴とする請求項記載のマルチチャンネル音響信号処理装置。
  6. mチャンネル(m>1)のオーディオ信号がダウンミックスされて構成される入力信号から、前記mチャンネルのオーディオ信号を分離するマルチチャンネル音響信号処理方法であって、
    前記入力信号に対して、遅延とオールパスフィルタ処理による残響処理を行うことにより、前記入力信号に残響成分が含まれる無相関信号を生成する無相関信号生成ステップと、
    信号強度レベルの配分を示すレベル配分行列と、残響成分の配分を示す残響調整行列との積を示す統合行列を生成するマトリックス生成ステップと、
    前記無相関信号および統合行列に対する前記入力信号の位相を調整する位相調整ステップと、
    前記位相調整ステップで位相が調整された前記入力信号および前記無相関信号により示される行列と、前記マトリックス生成ステップで生成された統合行列との積を算出することにより、mチャンネルのオーディオ信号を生成する演算ステップ
    を含むことを特徴とするマルチチャンネル音響信号処理方法。
  7. 前記位相調整ステップでは、経時的に変化する前記統合行列または前記入力信号を遅延させる
    ことを特徴とする請求項記載のマルチチャンネル音響信号処理方法。
  8. 前記位相調整ステップでは、前記無相関信号生成ステップで生成される前記無相関信号の遅延時間だけ、前記統合行列または前記入力信号を遅延させる
    ことを特徴とする請求項記載のマルチチャンネル音響信号処理方法。
  9. 前記位相調整ステップでは、前記無相関信号生成ステップで生成される前記無相関信号の遅延時間に最も近い、予め定められた処理単位の整数倍の処理に要する時間だけ、前記統合行列または前記入力信号を遅延させる
    ことを特徴とする請求項記載のマルチチャンネル音響信号処理方法。
  10. 前記位相調整ステップでは、予め定められた検知限度以上にプリエコーが発生する場合に、前記位相を調整する
    ことを特徴とする請求項記載のマルチチャンネル音響信号処理方法。
JP2007534273A 2005-09-01 2006-07-07 マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法 Active JP5053849B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007534273A JP5053849B2 (ja) 2005-09-01 2006-07-07 マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005253837 2005-09-01
JP2005253837 2005-09-01
PCT/JP2006/313574 WO2007029412A1 (ja) 2005-09-01 2006-07-07 マルチチャンネル音響信号処理装置
JP2007534273A JP5053849B2 (ja) 2005-09-01 2006-07-07 マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法

Publications (2)

Publication Number Publication Date
JPWO2007029412A1 JPWO2007029412A1 (ja) 2009-03-26
JP5053849B2 true JP5053849B2 (ja) 2012-10-24

Family

ID=37835541

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007534273A Active JP5053849B2 (ja) 2005-09-01 2006-07-07 マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法

Country Status (6)

Country Link
US (1) US8184817B2 (ja)
EP (1) EP1921605B1 (ja)
JP (1) JP5053849B2 (ja)
KR (1) KR101277041B1 (ja)
CN (1) CN101253555B (ja)
WO (1) WO2007029412A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101527874B (zh) * 2009-04-28 2011-03-23 张勤 一种动声声场系统
JP5299327B2 (ja) * 2010-03-17 2013-09-25 ソニー株式会社 音声処理装置、音声処理方法、およびプログラム
EP2586025A4 (en) * 2010-07-20 2015-03-11 Huawei Tech Co Ltd A tone signal
PT2609591T (pt) 2010-08-25 2016-07-12 Fraunhofer Ges Forschung Aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
EP2830334A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
TWI557724B (zh) 2013-09-27 2016-11-11 杜比實驗室特許公司 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器
WO2015173422A1 (de) * 2014-05-15 2015-11-19 Stormingswiss Sàrl Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
WO2018151858A1 (en) * 2017-02-17 2018-08-23 Ambidio, Inc. Apparatus and method for downmixing multichannel audio signals
US10133544B2 (en) 2017-03-02 2018-11-20 Starkey Hearing Technologies Hearing device incorporating user interactive auditory display
CN108665902B (zh) 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN108694955B (zh) * 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
FR3067511A1 (fr) * 2017-06-09 2018-12-14 Orange Traitement de donnees sonores pour une separation de sources sonores dans un signal multicanal

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1093680A (ja) * 1996-09-13 1998-04-10 Nippon Telegr & Teleph Corp <Ntt> サブバンド多チャネル音声通信会議用反響消去方法
JP2001144656A (ja) * 1999-11-16 2001-05-25 Nippon Telegr & Teleph Corp <Ntt> 多チャンネル反響消去方法及び装置並びにそのプログラムを記録した記録媒体
JP2001175296A (ja) * 1998-11-16 2001-06-29 Victor Co Of Japan Ltd 音声符号化装置
JP2002368658A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 多チャネルエコー消去装置、方法、記録媒体及び音声通信システム
JP2003500937A (ja) * 1999-05-25 2003-01-07 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 音響エコー消去
WO2004097794A2 (en) * 2003-04-30 2004-11-11 Coding Technologies Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4887297A (en) * 1986-12-01 1989-12-12 Hazeltine Corporation Apparatus for processing stereo signals and universal AM stereo receivers incorporating such apparatus
US5463424A (en) * 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
US6463410B1 (en) 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6757659B1 (en) 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
JP2000308200A (ja) 1999-04-20 2000-11-02 Nippon Columbia Co Ltd 音響信号処理回路及び増幅装置
US6961432B1 (en) 1999-04-29 2005-11-01 Agere Systems Inc. Multidescriptive coding technique for multistream communication of signals
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
AU2001284910B2 (en) 2000-08-16 2007-03-22 Dolby Laboratories Licensing Corporation Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
US7254239B2 (en) 2001-02-09 2007-08-07 Thx Ltd. Sound system and method of sound reproduction
US7433483B2 (en) 2001-02-09 2008-10-07 Thx Ltd. Narrow profile speaker configurations and systems
WO2002065815A2 (en) 2001-02-09 2002-08-22 Thx Ltd Sound system and method of sound reproduction
US7457425B2 (en) 2001-02-09 2008-11-25 Thx Ltd. Vehicle sound system
EP1881486B1 (en) * 2002-04-22 2009-03-18 Koninklijke Philips Electronics N.V. Decoding apparatus with decorrelator unit
JP4714415B2 (ja) 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメータによるマルチチャンネルオーディオ表示

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1093680A (ja) * 1996-09-13 1998-04-10 Nippon Telegr & Teleph Corp <Ntt> サブバンド多チャネル音声通信会議用反響消去方法
JP2001175296A (ja) * 1998-11-16 2001-06-29 Victor Co Of Japan Ltd 音声符号化装置
JP2003500937A (ja) * 1999-05-25 2003-01-07 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 音響エコー消去
JP2001144656A (ja) * 1999-11-16 2001-05-25 Nippon Telegr & Teleph Corp <Ntt> 多チャンネル反響消去方法及び装置並びにそのプログラムを記録した記録媒体
JP2002368658A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 多チャネルエコー消去装置、方法、記録媒体及び音声通信システム
WO2004097794A2 (en) * 2003-04-30 2004-11-11 Coding Technologies Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
JP2006524832A (ja) * 2003-04-30 2006-11-02 コーディング テクノロジーズ アクチボラゲット 複素指数変調フィルタバンクを基にした新型プロセッシングおよび適応型時間信号伝達方法

Also Published As

Publication number Publication date
EP1921605B1 (en) 2014-03-12
CN101253555A (zh) 2008-08-27
US20090262949A1 (en) 2009-10-22
EP1921605A4 (en) 2010-12-29
CN101253555B (zh) 2011-08-24
EP1921605A1 (en) 2008-05-14
KR101277041B1 (ko) 2013-06-24
WO2007029412A1 (ja) 2007-03-15
JPWO2007029412A1 (ja) 2009-03-26
KR20080039445A (ko) 2008-05-07
US8184817B2 (en) 2012-05-22

Similar Documents

Publication Publication Date Title
JP5053849B2 (ja) マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法
JP4944029B2 (ja) オーディオデコーダおよびオーディオ信号の復号方法
RU2705007C1 (ru) Устройство и способ для кодирования или декодирования многоканального сигнала с использованием сихронизации управления кадрами
JP4918490B2 (ja) エネルギー整形装置及びエネルギー整形方法
US8577686B2 (en) Method and apparatus for decoding an audio signal
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
EP2111616B1 (en) Method and apparatus for encoding an audio signal
TWI404429B (zh) 用於將多頻道音訊信號編碼/解碼之方法與裝置
US20100169102A1 (en) Low complexity mpeg encoding for surround sound recordings
JP2011522472A (ja) パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ
CN102160113A (zh) 多声道音频编码器和解码器
CN104885150A (zh) 用于多声道缩混/上混情况的通用空间音频对象编码参数化概念的解码器和方法
KR100763919B1 (ko) 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
JP4892184B2 (ja) 音響信号符号化装置及び音響信号復号装置
JP2007187749A (ja) マルチチャンネル符号化における頭部伝達関数をサポートするための新装置
JP2006325162A (ja) バイノーラルキューを用いてマルチチャネル空間音声符号化を行うための装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120726

R150 Certificate of patent or registration of utility model

Ref document number: 5053849

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150803

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250