JP4951985B2 - 音声信号処理装置、音声信号処理システム、プログラム - Google Patents
音声信号処理装置、音声信号処理システム、プログラム Download PDFInfo
- Publication number
- JP4951985B2 JP4951985B2 JP2006020653A JP2006020653A JP4951985B2 JP 4951985 B2 JP4951985 B2 JP 4951985B2 JP 2006020653 A JP2006020653 A JP 2006020653A JP 2006020653 A JP2006020653 A JP 2006020653A JP 4951985 B2 JP4951985 B2 JP 4951985B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- audio signal
- signal
- encoding
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Stereophonic System (AREA)
Description
一方で、例えばLch,Rchによる2チャンネルステレオに代表されるように、マルチチャンネルシステムよりも前から普及定着している再生システムも依然として広く使用されている。このために、マルチチャンネルの音声ソースを、上記2チャンネルステレオなどの、よりチャンネル数の少ない再生システムにより再生しなければならない状況は避け難い。
そこで、マルチチャンネルを形成する各チャンネルの音声信号を適切に分配するようにして、例えばLch,Rchによる2チャンネルステレオのチャンネル構成の音声ソースに変換するエンコード技術が知られている。例えばこのようにしてエンコードされた2チャンネルステレオの音声ソースを再生すれば、その再生音場としては、左右方向においてのみ音像が定位する一般的な2チャンネルステレオによるものとはなるが、全てのチャンネルの音声の成分が含まれているので、欠落して聴けなくなる音はなくなる。
ここで、上記したマルチチャンネルを形成するLch、Cch、Rch、Schチャンネルごとの音声信号を、それぞれSl、Sc、Sr、Ssとし、エンコード後の2チャンネルによるLch、Rchの信号を、S1、S2とする。そして、エンコード処理としては、例えば信号Sl、Sc、Sr、Ssを利用して、それぞれ下記の式(1)、(2)に示す演算を実行することで、これら信号S1、S2を得るようにされる。
S1=L+0.7C+0.7S・・・式(1)
S2=R+0.7C−0.7S・・・式(2)
このようにして、信号S1は、Lchの信号に対して、所定の係数(0.7)により乗算したCch、Schの信号を加算して得られる。また、信号S2は、Rchの信号に対して、所定の係数(0.7)により乗算したCchを加算し、Schの信号を減算したものとなっている。そして、このようにして得られた信号S1、S2による音声ソースを、2チャンネルステレオによる再生システムにより再生すれば、通常のLch,Rchによる2チャンネルステレオの音像定位ではあるが、元の音声ソースの音は欠落することなく、全て聴こえるようにして再生されることになる。
信号S1、S2は、それぞれ、方向性強調回路501、504に対して直接入力される。また、これとともに、信号S1、S2は加算器511により加算されることで信号S3として方向性強調回路502に入力される。さらに、信号S1、S2は加算器512により減算され、信号S4として方向性強調回路503に入力されるようになっている。つまり、信号S1、S2を入力して、信号S3、S4を生成する部位は、マトリクス回路としての構成を採る。
このマトリクス回路の動作に基づき、信号S3、S4は、それぞれ、下記の式(3)(4)により表される。
S3=1.4C+L+R・・・(式3)
S4=1.4S+L−R・・・(式4)
なお、図22において示される信号S1、S2としては、それぞれ、先に示した式(1)(2)により表される。
は、デコード後のLch信号成分が他のチャンネルの信号成分よりも3dB高くなっている。また、信号S2は、デコード後のRch信号成分が他のチャンネルの信号成分よりも3dB高くなっている。また、信号S3は、デコード後のCch信号成分が他のチャンネルの信号成分よりも3dB高く、信号S4は、デコード後のCch信号成分が他のチャンネルの信号成分よりも3dB高くなっている。つまり、信号S1、S2、S3、S4は、自身に含まれる各チャンネルの信号成分の間で、特定の1つのチャンネルの信号成分のみが他のチャンネルの信号成分よりも高いという性質を持つことで、それぞれ、Lch、Cch、Rch、Schチャンネルの信号としての適正を得ている。
ただし、マトリクス回路により生成されたままの段階の信号S1、S2、S3、S4の状態では、音像の分離が不十分になる。そこで、方向性強調回路501、502、503、504を設け、これらの回路に対して、それぞれ、信号S1、S2、S3、S4を通過させ、実際のLch、Cch、Rch、Schチャンネルごとの再生用信号を得るようにされている。方向性強調回路は、信号S1、S2、S3、S4のレベル差に応じてその出力レベルを変化させるように構成されている。例えば、Lchの信号S1が、他のチャンネルの信号S2、S3、S4よりもレベルが大きくなったとすると、これに適応して信号S1のレベルを動的に増強させ、Lchの音声を他のチャンネルの音声よりも際だたせるようにする。このような動作によって、4チャンネルの音声の間での音像の分離がより良好になる。
なお、上記したエンコード、デコードの技術は、例えばドルビープロロジックなどに採用されている。
例えばデコード処理にあっては、図22により説明したように、マトリクス回路により復元したマルチチャンネルごとの音声信号(S1、S2、S3、S4)について方向性強調のための処理を施している。しかし、この処理は、他のチャンネル音声よりも大きなレベルのチャンネル音声を増強させるというものである。このことは、チャンネル間の音像の分離をよりはっきりさせるという効果がある反面、チャンネルごとの出力音声のレベルが動的に変動することになり、聴感的に不自然な音量の変化を感じやすいという問題を抱える。また、全てのチャンネルの音声信号がほぼ同等レベルであるような場合には、レベル差を増強する処理が行われないことになり、例えばチャンネル間の音声の音量的分離は、3dB程度を確保できるにとどまって、音像の分離が良好でなくなる。また、音声の内容によっては、配置が隣り合うスピーカ同士の間で、一方のスピーカから出力されている音が、他方のスピーカ側に引きつけられるようにして、不用意に定位が変化することもある。つまり、図22に対応する技術では、エンコードされた音声信号をデコードし、マルチチャンネルにより再現したときの音響に関して、より高品位とする余地が残っている。
つまり、本願発明の音声信号処理装置は、所定のチャンネル構成を成すデコードチャンネルに対応する音声信号成分のそれぞれに対して、対応のデコードチャンネルとしての音源の位置に基づいて求められた空間伝達関数により表される伝達特性を与え、これらの音声信号成分をエンコードチャンネルのチャンネル構成に応じて振り分けて生成した、エンコードチャンネルの音声信号を入力して、上記デコードチャンネルにおける特定の1つのチャンネルに対応する音声信号成分を生成する音声信号生成手段を、上記デコードチャンネルごとに対応して備えるものとされる。
そして、上記音声信号生成手段の各々は、入力されたエンコードチャンネルの音声信号の各々について、その音声信号生成手段が対応するデコードチャンネルの音声信号成分に与えられた伝達特性についての補正を行う補正手段と、この補正手段により補正された信号の間での所定の近似性を検出する近似性検出手段と、この近似性検出手段の検出結果に基づいて、信号補正手段から出力されるエンコードチャンネルごとの信号から、相互に近似しているとされる信号成分を分離して出力する分離手段と、この分離手段により分離された信号成分を加算して、対応するデコードチャンネルの音声信号として出力するチャンネル音声信号出力手段とを備えることとした。
つまり、本願発明の音声信号処理システムは、所定のチャンネル構成を成す原チャンネルの音声信号の組を、この原チャンネル以外の所定のチャンネル構成を成すエンコードチャンネルの音声信号の組に変換して出力するエンコード装置と、所定のチャンネル構成を成すエンコードチャンネルの音声信号の組を入力して、所定のチャンネル構成を成すデコードチャンネルの音声信号の組に変換するデコード装置とから成る。
そして、上記エンコード装置は、1原チャンネルにつきエンコードチャンネルごとに対応したものが設けられ、入力される音声信号が対応する原チャンネルとしての音源の位置に基づいて設定される空間伝達関数により表される伝達特性を、入力される音声信号に付与する伝達特性付与手段と、エンコードチャンネルごとに対応して設けられ、伝達特性付与手段の各々によって処理が施された信号を入力して加算し、この加算した出力を、対応するエンコードチャンネルの音声信号として出力する加算手段とを備えることとした。
また、上記デコード装置は、デコードチャンネルにおける特定の1つのチャンネルに対応する音声信号成分を分離する音声信号分離手段を、デコードチャンネルごとに対応して有させることとして、これら音声信号生成手段の各々は、入力されたエンコードチャンネルごとの音声信号について、対応するデコードチャンネルの音声信号成分に与えられた伝達特性についての補正を行う補正手段と、この補正手段による補正後のエンコードチャンネルごとの信号についての所定の近似性を検出する近似性検出手段と、この近似性検出手段の検出結果に基づいて、信号補正手段から出力されるエンコードチャンネルごとの信号から、相互に近似しているとされる信号成分を分離して出力する分離手段と、この分離手段により分離された信号成分を加算して、対応するデコードチャンネルの音声信号として出力するチャンネル音声信号出力手段とを備えることとした。
なお、ここでのチャンネル構成とは、1つの音響システムを形成するためのオーディオチャンネルの数と、オーディオチャンネルに応じた音源の間での位置関係などにより決まる構成内容をいうものである。
そして、本願発明の音声信号処理装置(デコード装置)は、上記したエンコードチャンネル構成の音声信号を入力して、エンコード前と同じチャンネル構成、若しくは別のチャンネル構成による音声信号群からなる音声ソースに変換する。このためには、入力したエンコード後の各チャンネルの音声信号から、各デコードチャンネルとしての音声信号成分を分離して出力するようにされる。
1デコードチャンネルに対応する、上記音声信号成分の分離のための構成としては、エンコードチャンネルごとの音声信号のそれぞれに含まれる音声信号成分のうちから、エンコードのための伝達特性を与えられたことにより変化した、そのデコードチャンネルの音声信号成分の所定要素(例えば位相、レベル、伝搬時間差など)を補正するようにされる。そして、エンコードチャンネルの音声信号の間で、これらの要素が近似しているとされる信号成分を分離するようにされる。このようにして分離された信号成分が、対応するデコードチャンネルの音声信号として出力される。このような信号分離の処理を、デコードチャンネルごとに実行する。この場合、各デコードチャンネルの音声信号としての出力は、そのデコードチャンネルにより再生出力させるべき音声信号成分のみから成るもので、他のチャンネルの音声信号成分は含んでいないものとしてみてよい。
図1、図2は、本実施の形態のエンコード装置とデコード装置のそれぞれについての、入出力のチャンネル構成を示している。
先ず、本実施の形態のエンコード装置1としては、図1に示すようにして、マルチチャンネルといわれるチャンネル構成の1つであるL(左)ch、C(中央)ch、R(右)ch、LS(左サラウンド)ch、RSch(右サラウンド)による5チャンネル分の音声信号の組による音声ソースを入力し、Lch,Rchの2チャンネルステレオに対応するチャンネル構成による音声信号の組の音声ソースに変換して出力するものとして構成される。なお、上記したLch、Cch、Rch、LSch、RSchのチャンネル構成は、例えば5.1chサラウンドのチャンネル構成から、サブウーファのチャンネルを省略したものとしてみることができる。
また、本実施の形態のデコード装置2としては、図2に示すようにして、2チャンネルステレオに対応したチャンネル構成による音声ソースの音声信号の組を入力する。このようにして入力される音声信号は、上記エンコード装置1にてエンコードされた音声ソースのものとされる。そして、これらの入力音声信号についてデコード処理を行った結果として、エンコード装置1によりエンコードされる前と同様の5チャンネル構成の組による音声信号を出力するものとされる。
この図には、Lch、Cch、Rch、LSch、RSchのそれぞれに応じた音源として、スピーカSP−L、SP−C、SP−R、SP−LS、SP−RSが示され、これらのスピーカから出力されて左耳と右耳のそれぞれ到達する音声をリスナ(聴取者)Mが聴き取る、というモデルが示されている。
ちなみに、このようなチャンネル構成では、図示もしているように、リスナMの位置に対する左前方にスピーカSP−Lを配置し、中央前方にスピーカSP−Cを配置し、右前方にスピーカSP−Rを配置し、左後方にスピーカSP−LSを配置し、右後方にスピーカSP−RSを配置するのが通常である。また、このようなマルチチャンネルのスピーカの配置位置については、ITU−Rなどによって理想的とされる所定の配置角度、高さなどが推奨されている。
Hll:スピーカSP−Lから左耳に到達する経路の伝達関数
Hlr:スピーカSP−Lから右耳に到達する経路の伝達関数
Hcl:スピーカSP−Cから左耳に到達する経路の伝達関数
Hcr:スピーカSP−Cから右耳に到達する経路の伝達関数
Hrl:スピーカSP−Rから左耳に到達する経路の伝達関数
Hrr:スピーカSP−Rから右耳に到達する経路の伝達関数
Hlsl:スピーカSP−LSから左耳に到達する経路の伝達関数
Hlsr:スピーカSP−LSから右耳に到達する経路の伝達関数
Hrsl:スピーカSP−RSから左耳に到達する経路の伝達関数
Hrsr:スピーカSP−RSから右耳に到達する経路の伝達関数
なお、スピーカ(音源)から発せられる音の到達目標位置が、リスナの左耳、右耳ということになると、音源から、これら左耳、右耳に対して音声が到達するための経路についての空間伝達関数は、特に頭部伝達関数として扱われるものとなる。
エンコード装置1の入力としては、図1と同様にして、Lch、Cch、Rch、LSch、RSchのチャンネル構成を形成する各チャンネル(原チャンネル)ごとの音声信号が入力される。
先ず、Lchに対応した入力音声信号についてみると、この原チャンネルのLch(原チャンネル(L))としての入力音声信号は、フィルタ11a、11bに分岐して入力される。フィルタ11aでは、原チャンネル(L)の入力音声信号に対して伝達関数Hllにより表される伝達特性を与えるための処理を実行する。このためには、例えば伝達関数Hllを時間軸上に変換したインパルス応答を得て、このインパルス応答を原チャンネル(Lch)の入力音声信号に対して畳み込むためのフィルタリング処理を実行すればよい。また、フィルタ11bでは、原チャンネル(L)の入力音声信号に対して、上記と同様のフィルタリング処理により、伝達関数Hlrにより表される伝達特性を与えるための処理を実行する。
つまり、原チャンネル(C)の入力音声信号については、フィルタ12aが伝達関数Hclにより表される伝達特性を与えるとともに、フィルタ12bが伝達関数Hcrにより表される伝達特性を与えるようにされる。
原チャンネル(R)の入力音声信号については、フィルタ13aが伝達関数Hrlにより表される伝達特性を与えるとともに、フィルタ13bが伝達関数Hrrにより表される伝達特性を与えるようにされる。
原チャンネル(LS)の入力音声信号については、フィルタ14aにより伝達関数Hlslにより表される伝達特性を与えるとともに、フィルタ14bにより伝達関数Hlsrにより表される伝達特性を与えるようにされる。
原チャンネル(RS)の入力音声信号については、フィルタ15aにより伝達関数Hrslにより表される伝達特性を与えるとともに、フィルタ15bにより伝達関数Hrsrにより表される伝達特性を与えるようにされる。
また、これらフィルタ11a,11b〜15a、15bにより畳み込むインパルス応答、あるいはその基となる伝達関数は、所定の環境をつくったうえで実際に測定して求めるようにしてもよいし、あるいは、一定の環境を想定したうえで演算などにより求めることができる。また、このときに実際的にあるいは仮想的に設定する原チャンネルの音源(スピーカ)の位置は、先に説明したITU−Rの推奨に従ったものを採用することができる。また、ITU−Rの推奨以外の位置を設定してもよい。
フィルタ11a,11b〜15a、15bによりしかるべき伝達特性が与えられて出力される信号のうち、フィルタ11a、12a、13a、14a、15aから出力される信号は、加算器16aにより加算され、エンコード後のステレオチャンネル(2チャンネル)におけるLチャンネルの信号として出力される。
また、フィルタ11b、12b、13b、14b、15bから出力される信号は、加算器16bにより加算され、エンコード後のステレオチャンネルにおけるRチャンネルの信号として出力される。
例えば、このようにしてエンコードされた2チャンネルの音声ソースを、通常の2チャンネルステレオに対応した音声再生装置により再生出力させ、この再生音をヘッドフォンにより聴いたとする。
このときにヘッドフォンを装着したリスナの左右の耳で聴き取る音は、図3のスピーカSP−L、SP−C、SP−R、SP−LS、SP−RSからリスナMの左耳と右耳とにそれぞれ到達する経路の伝達特性を持っている。従って、実際にヘッドフォンを装着したリスナが知覚する音としては、通常の2チャンネルステレオのようにして頭内において定位するものではなく、例えば図3のようにして、リスナMの位置にて、スピーカSP−L、SP−C、SP−R、SP−LS、SP−RSが仮想的に在るとされる位置にて原チャンネルの各音が発せられているときの定位を知覚することになる。
なお、ここでは図3との対応を分かりやすいものとするために、本実施の形態のエンコード装置1によりエンコードした音声ソースをヘッドフォンにより再生した場合について述べているが、2チャンネルステレオ再生システムとしてL,Rの各チャンネルに対応した2つのスピーカから音声を再生出力させたときにも、例えば図3と同様の仮想音源の定位とすることは可能である。この場合には、図3に示す原チャンネルのスピーカごとに対応した伝達関数に加えて、上記L,Rの各チャンネルに対応した2つのスピーカからリスナの両耳に到達する音の経路の伝達関数を加味して、図4のフィルタ11a,11b〜15a,15bにおいて畳み込むべきインパルス応答の伝達関数を求めるようにすればよい。
例えば従来例として説明したエンコード技術により2チャンネルステレオのチャンネル構成にエンコードされた音声ソースを通常の2チャンネルステレオに対応する再生装置により再生させたときには、通常の2チャンネルステレオとしての音像定位になる。これに対して本実施の形態のエンコード装置1であれば、上記のようにして、エンコード前の原チャンネルによる仮想の音像定位が得られるものである。これにより、例えばエンコードされた音声ソースを含んだコンテンツ情報などとしては、その付加価値が高まることになる。
この図に示すようにして、デコード装置2に対しては、例えばエンコード装置1によりエンコードされた後の2チャンネルステレオによるLch、Rchの音声信号が入力される。なお、ここでは、このデコード装置2に入力されるエンコード後のチャンネル構成に対応したL,Rの各チャンネルについて、エンコードチャンネル(L)、エンコードチャンネル(R)ともいう。
エンコードチャンネル(L)の入力音声信号と、エンコードチャンネル(R)の入力信号のうち、エンコードチャンネル(L)の入力音声信号は、高速フーリエ変換部31aに入力される。フーリエ変換部31aでは、高速フーリエ変換処理を実行することで、入力された音声信号を周波数領域の信号Sglに変換する。この信号Sglは、分岐して、チャンネル信号分離ブロック32−L、32−C、32−R、32−LS、32−RS内に設けられる補正処理部41aに対してそれぞれ入力される。
また、一方のエンコードチャンネル(R)の入力音声信号は、高速フーリエ変換部31bに入力される。フーリエ変換部31bにおいても、入力音声信号について高速フーリエ変換処理を実行して、周波数領域の信号Sgrに変換し、チャンネル信号分離ブロック32−L、32−C、32−R、32−LS、32−RS内に設けられる補正処理部41bに対してそれぞれ入力させる。
図7は、チャンネル信号分離ブロック32−Lにおいて実行される信号処理動作の概念に基づいて、その内部構成を示している。
エンコードチャンネル(L)の入力音声信号を高速フーリエ変換部31aにより周波数領域に変換して得られた信号Sglは、チャンネル信号分離ブロック32−Lにおける補正処理部41aに対して入力される。この補正処理部41aにおいては、伝達関数Hllに応じたインパルス応答畳み込み処理のフィルタ特性に対して逆となるフィルタ特性によるフィルタリング処理を実行する。
この伝達関数Hllに応じたインパルス応答畳み込み処理のフィルタ特性の逆特性については、ここでは[1/Hll]のようにして伝達関数Hllの逆数により表している。
例えば伝達関数Hllに応じた伝達特性を持つとされる音声信号成分の周波数応答特性が図9(a)に示すものであるとした場合、その逆特性[1/Hll]の周波数応答特性は、図9(b)に示すようにして、図9(a)の特性を反転させたようなものとなる。
そして、上記伝達関数Hllは、図3に示した原チャンネル(L)のスピーカSP−LからリスナMの左耳に到達する経路の伝達関数であり、図4に示したエンコード装置1におけるフィルタ11aに設定されるフィルタ特性に対応する。つまり、図7の補正フィルタ41aでは、[1/Hll]として示される逆フィルタをかけているものであり、これにより、信号Sglに含まれているとされるフィルタ11a〜フィルタ15aの信号成分のうちで、フィルタ11aの出力信号成分に与えられていた伝達関数Hllによる伝達特性はキャンセルされる。このために、信号Sglに含まれるフィルタ11aの出力信号成分は、フィルタ11aに入力される前段階の原チャンネル(L)の音声信号、つまり、エンコード前の音声ソースの信号に限りなく近くなり、同等とみてよい特性にまで補正されることとなる。なお、留意すべきことは、補正フィルタ41aにより原チャンネルの音声信号と同等の特性となるようにして補正される信号成分は、原チャンネル(L)に対応したもののみであり、他の原チャンネルに対応する信号成分については、かかる補正はかけられていないままである。
なお、補正処理部41a、41bについても、例えば図5に示したようなFIR型のフィルタを形成し、例えば逆フィルタ特性に応じた係数を乗算器に設定して構成することができる。
レベル/位相比較処理ブロック51は、入力された信号Sgla、Sgraとについて、レベルの比較と位相の比較を行い、比較結果として、信号Sgla、Sgraについての周波数領域におけるレベルと位相についての近似率の値を示すとされる信号を、音源分離関数演算ブロック52に出力するようにされる。
この図8においては、分離処理部42についてのより実際的な内部構成例が示されているので、この点について説明する。図8に示される分離処理部42としては、レベル比較部61、係数発生部62、位相比較部63、係数発生部64、乗算器65,66,67,68、及び加算器55から成るものとされる。
信号Sgla、Sgraは、分離処理部42に入力されると、先ず、レベル比較部61に対して入力される。レベル比較部61は、入力された信号Sgla、Sgraについてのレベルを例えば周波数のサンプルごとに求め、その求めた両者のレベルにより、例えば信号Sglaに対する信号Sgra(あるいは信号Sgraに対する信号Sgla)のレベル比mを算出して係数発生部62に出力するようにされる。ちなみにレベル比mは0≦m≦1の範囲をとるもので、m=1であれば、相互のレベルは完全に同じであることを示す。また、レベル比mの値が小さいほど、相互のレベル差が大きくなって近似性は低くなる。
係数発生部62では、入力されたレベル比mの値に基づいて、乗算器65,66に対して設定する係数rを求める。この係数rの範囲は、0≦r≦1となる。そして、この係数rを決定するためには、所定の音源分離関数を用いた演算を行う。この音源分離関数としては、レベル比mが1に近づくのに応じて、係数rも1に近づいていくようにされた所定の関係を与えるものとされる。この係数発生部62が利用する音源分離関数の例を、図10(a)(b)(c)に示す。
例えば上記のようにして係数発生部62が求めた係数rは、乗算器65、66のそれぞれに対して設定される。乗算器65、66は、入力された信号Sgla、Sgraに対して設定された係数rを乗算して出力する。このようにして乗算器65、66から出力される信号は、先の図7における分離処理部42における、レベル/位相比較処理ブロック51、及び音源分離関数演算ブロック52についての説明に基づいて理解されるように、それぞれ、信号Sglaから信号Sgraとレベルが一定以上近似しているとされるスペクトル成分を分離抽出したものであり、信号Sgraにおいて信号Sglaとレベルが一定以上近似しているとされるスペクトル成分を分離抽出したものであることになる。そして、このことは、乗算器65、66の出力は、それぞれ、レベル的には、補正フィルタ41a、41bにより補正された原チャンネル(L)の音声信号と同じとされる信号成分であることになる。
そこで、乗算器65、66の出力は、さらに位相比較部63に入力されて、ここで位相比較が行われる。そして、その比較結果として乗算器65の出力信号に対する乗算器66(あるいは乗算器66の出力信号に対する乗算器65)の出力信号の位相差pを求めて、係数発生部64に出力するようにされる。位相差pは、例えば0≦p≦πの範囲をとるもので、p=0であれば、完全に同位相であることを示す。また、位相差pの値が大きくなって位相差が拡大するほど、位相についての信号の近似性が低くなる。
係数発生部64では、入力された位相差pの値に基づいて、乗算器67、68に対して設定する係数rpを求める。この係数rpの範囲は、0≦rp≦1となる。そして、この係数rpを決定するためには、所定の音源分離関数を用いた演算を行う。この音源分離関数としては、位相差pが0近づくのに応じて、係数rpは1に近づいていくような関係を与えるものとされる。この係数発生部62が利用する音源分離関数の例を、図11(a)(b)(c)に示す。
そして、このようにして乗算器67、68から出力される信号は、乗算器65、66の出力信号から、位相差が一定以内にある(一定以上の位相の近似性がある)とされるスペクトル成分を分離抽出したものとなる。このことから乗算器67、68から出力された信号は、レベルに関して補正フィルタ41a、41bにより補正された原チャンネル(L)の音声信号と同じとされる信号成分から、さらに、位相が同じとされる信号成分を分離したものということになる。つまり、図7の乗算器53,54から出力される信号に相当するもので、レベルと位相の両者に関して、補正フィルタ41a、41bにより補正された原チャンネル(L)の音声信号と同じとされる信号であり、従って、エンコード前の原チャンネル(L)の音声信号と同等の信号となる。
そして、このようにして得られた乗算器67、68の出力を、図7と同様にして、加算器55により加算し、この加算された信号をチャンネル信号分離処理ブロック32−Lの出力とする。
なお、図8における分離処理部42の他の構成として、前段に位相対応分離処理系(位相比較部63、係数発生部64、乗算器67,68)をおき、後段に、レベル対応分離処理系(レベル比較部61、係数発生部62、乗算器65,66)をおく構成とすることも考えられる。
また、分離処理部42として、例えばデコード装置に求められる再生音の品質などについてそれほど高品位なものを必要としないような場合には、レベル対応分離処理系と位相対応分離処理系の何れか一方のみを備えるような構成とすることも考えられる。レベル対応分離処理系と位相対応分離処理系の何れか一方の処理のみが行われても、レベルあるいは位相の何れか一方に基づいて原チャンネル(L)のエンコード前と同じとされる信号成分が抽出できるので、例えば従来のマトリクス回路及び方向性強調回路によるエンコード出力に比較すれば、相応に良好なデコード出力音声の品位を保てる。
例えば上記図7及び図8に示した構成により、チャンネル信号分離ブロック32−Lでは、エンコード前の原チャンネル(L)と同じとされる周波数成分による信号を分離して出力するようにされる。
そして、残る4つのチャンネル信号分離ブロック32−C、32−R、32−LS、32−RSとしても、ブロック構成的には、図7あるいは図8に示した構成を採る。そのうえで、チャンネル信号分離ブロック32−Cの補正処理部41a,41bは、それぞれ、伝達関数Hcl、Hcrの逆特性[1/Hcl][1/Hcr]による逆フィルタをかけるようにされる。これにより、チャンネル信号分離ブロック32−Cでは、エンコード前の原チャンネル(C)と同じとされる周波数成分による信号を分離して出力する。
また、チャンネル信号分離ブロック32−Rの補正処理部41a,41bの逆フィルタ特性は、それぞれ、伝達関数Hrl、Hrrの逆特性[1/Hrl][1/Hrr]を設定する。これにより、チャンネル信号分離ブロック32−Rの出力は、エンコード前の原チャンネル(R)と同じとされる周波数成分による信号となる。
また、チャンネル信号分離ブロック32−LSの補正処理部41a,41bの逆フィルタ特性は、それぞれ、伝達関数Hlsl、Hlsrの逆特性[1/Hlsl][1/Hlsr]を設定する。これにより、チャンネル信号分離ブロック32−LSの出力は、エンコード前の原チャンネル(LS)と同じとされる周波数成分による信号となる。
また、チャンネル信号分離ブロック32−RSの補正処理部41a,41bの逆フィルタ特性は、それぞれ、伝達関数Hrsl、Hrsrの逆特性[1/Hrsl][1/Hrsr]を設定する。これにより、チャンネル信号分離ブロック32−LSの出力は、エンコード前の原チャンネル(RS)と同じとされる周波数成分による信号となる。
これにより、本実施の形態のデコード装置2の出力である音声信号を、各チャンネルに応じて適切に配置されたスピーカなどにより再生出力させた場合には、原チャンネルの音声信号を再生出力させた場合とほぼ同等の品質の音響効果を得ることができるものである。換言すれば、従来のようにして、音量や定位の変化を生じず、良好なチャンネルセパレーションの再生音声を聴くことができる。
例えば、図12(a)には、残響のある環境を想定して測定したとされるインパルス応答波形の一例を示している。周知のようにして、インパルス応答としては、時間進行に従って、先ず、直接音に応答する直接音部分と、これに続く直接音が到達した後の反射音(間接音)に応答する間接音部分とがある。図12(a)では、区間Aで示す時間幅の応答部分が直接音部分であり、これに続く応答部分が例えば反射音部分となる。
一般に、直接音部分と反射音部分の応答時間を比較すると、反射音部分のほうが相当に長くなる。また、測定環境、条件などに応じた応答時間の変化が大きいのも反射音部である。そして、例えばこの反射音部分の応答時間が長いと、その逆特性を持つフィルタが収束しにくくなってくる、ということである。
つまり、図12(b)に示すようにして、図12(a)のインパルス応答波形の全体から、例えば区間Aとして示される直接音部分に対応する応答分のみを抜き出したインパルス応答を利用する。例えば、図12(a)のインパルス応答波形が伝達関数Hllに対応するものであるとすると、チャンネル信号分離ブロック32−Lの補正処理部41aには、図12(b)に示すようにして、本来の伝達関数Hllから反射音部分を省略したものに応じたインパルス応答により、逆フィルタ特性[1/Hll]を求め、補正処理部41aに設定するようにされる。残る補正処理部41a,41bについても同様にして、対応するエンコード時の伝達関数から反射音部分を省略したもののインパルス応答により求めた逆フィルタ特性を設定するようにされる。
この図においては、チャンネル信号分離ブロック32−L、32−C、32−R、32−C、32−LS、32−RSの各構成が、図6の場合と異なっている。つまり、チャンネル信号分離ブロック32−L、32−R、32−C、32−LS、32−RSについては、補正処理部41a,41bが省略され、代わりに、1つの補正処理部41Aが備えられる。この場合の補正処理部41Aは、信号Sgl側においてのみ設けられ、信号Sgrは、そのまま分離処理部42に入力されている。
また、チャンネル信号分離ブロック32−Cについては、補正処理部41Aは設けられず、信号Sgl、Sgrがそのまま分離処理部42に入力されるようになっている。このように、チャンネル信号分離ブロック32−Cにおいてのみ、補正処理部41Aが設けられない理由は、次の説明から理解されるように、対応する原チャンネルの音源であるスピーカSP−Cについて、図5にも示されているように、リスナの正中面に位置させることとした場合には、このスピーカSP−Cからリスナの左耳、右耳に到達する音の伝搬時間差、及びレベル差は生じないものとして扱うことができるからである。
そして、エンコード時において、伝達関数Hll、Hlrのそれぞれに応じたインパルス応答の畳み込み処理がフィルタ11a、11bにより行われることで、エンコードチャンネル(L)(R)の各音声信号に含まれる原チャンネル(L)の信号成分の間には、には、上記図14(a)(b)に示すようにインパルス応答の立ち上がり時間差(Td)が生じているものである。
補正処理部41Aは、このようにして、音声信号Sglを時間差Tdだけ遅延させるためのフィルタ処理を実行するために設けられる。
このようにして補正処理部41Aによる信号の遅延が行われることで、上記もしているように、音声信号Sgl、Sgrに含まれる原チャンネル(L)の音声信号成分の間における立ち上がり時間が同じとなるように調整される。つまり、音声信号Sgl、Sgrに含まれる特定の1つの原チャンネルの音声信号成分の時間のずれが補正される。
例えば図3におけるスピーカSP−LとリスナMとの関係についてみれば、スピーカSP−LがリスナMの左前方に偏って位置していることで、リスナMの左耳と右耳とでの到達距離差や、音の到達方向の違いなどから、スピーカSP−Lから左耳と右耳のそれぞれに到達して聴こえる音には、その伝搬時間差の他に、レベル差も生じる。
例えば図14(c)(d)には、それぞれ、伝達関数Hll、Hlrに応じたインパルス応答の周波数特性が示されている。これら図14(a)(b)を比較して分かるように、両者の基本的な周波数分布の特性は似通っているが、両者のレベル差Lvとして示すように、そのレベル差が比較的に顕著となっている。そして、このようなレベル差もまた、信号Sgl、Sgrに含まれる伝達関数Hll、Hlrの各特性が与えられた原チャンネル(L)の信号成分の間にて生じているものであり、遅延時間(伝搬時間差)とともに、音源の定位感を決定する要素となる。
チャンネル信号分離ブロック32−Lの補正処理部41Aでは、信号Sglについて、先に説明したように遅延時間Td分により遅延させるとともに、上記レベル差Lvの分によるレベル低減処理も実行するようにされる。
このようにして補正処理部41Aによる信号の遅延が行われることで、上記もしているように、音声信号Sgl、Sgrに含まれる原チャンネル(L)の音声信号成分の間におけるレベルが同じとなるように調整される。つまり、音声信号Sgl、Sgrに含まれる特定の1つの原チャンネルの音声信号成分についてのレベル差が補正される。
この図に示す記録システムは、エンコードユニット100とメディア記録ユニット101とから成る。
エンコードユニット100は、記録システムにおいて本実施の形態のエンコード装置1と同様の構成を持つユニット部位である。このエンコードユニット100には、例えば音声ソースのコンテンツとして制作されたLch、Cch、Rch、LSch、RSchのマルチチャンネル構成による音声信号を入力し、例えば図4に示した信号処理構成により、L,R2チャンネルステレオの音声信号に変換して出力する。
このような記録システムは、例えばコンテンツの制作者などが利用し、音声情報を記憶させたメディア102を、パッケージメディアとして提供するようにされる。また、エンコードユニット100により得られたLch,Rchによる2チャンネルステレオの音声信号としてのコンテンツを、ネットワーク経由で配布できるようにしてもよい。
この図に示す再生システムは、メディア再生ユニット201、デコードユニット200とを備える。メディア再生ユニット201は、メディア102を装填して、このメディアのフォーマットに対応した再生処理を実行することで、エンコード後の音声ソースである、Lch,Rchの音声信号を出力する。
このためには、先ず、記録システム側でエンコードするときに使用する伝達特性群を1つのみと決めておき、再生システムでは、この決められた伝達特性群に応じて逆フィルタ特性、あるいは遅延時間、レベル補正量などを組み込んだ補正処理部41を構成するものである。
そこで、コンテンツの作成にあたっては、任意に音響環境をつくる、あるいは、あらかじめ規定された複数の音響環境のうちから選択できるようにして、音響環境のバリエーションが与えられるようにしておく。そして、記録システムによってエンコードした音声ソースをメディア102に記録するときには、所定のフォーマットなどに従って、エンコード前の原音源に設定した音響環境を示す識別信号、あるいは音響環境設定に応じて決まるエンコード時に使用する伝達関数群を示す識別信号をともに記録するようにされる。再生システム側では、メディア102を再生するときに、この識別信号の読み出しも行って、例えばデコードユニット200に出力するようにされる。デコードユニット200は、入力された識別信号に基づいて、チャンネル信号処理ブロック32における補正処理部41などの所要の信号処理部に対するパラメータ設定を変更するようにされる。このための構成例を図17に示す。
パラメータ設定部400は、デコードユニット200に入力された識別信号を読み込む。そして、この読み込んだ識別信号に基づいて、パラメータとして、例えば補正処理部41a、41bに設定すべき逆フィルタ特性を決定するようにされる。
また、この場合のパラメータ設定部400は、係数発生部62、64の音源分離関数も決定するようにされる。例えばエンコード時に設定した音響環境などの相違に応じては、係数発生部62,63にて係数を発生させるときに利用する音源分離関数も変更する必要がある、あるいは変更したほうがより最適なデコード結果が得られて好ましいような場合のあることも考えられるからである。
また、チャンネル信号分離ブロック32の構成が、図13に示すものであった場合には、補正処理部41a、41bの逆フィルタ特性に代えて、補正処理部41Aの遅延時間、補正レベル量をパラメータとして決定する。
先ず、識別信号(識別情報)の構造内に対して設定すべきパラメータが格納されている場合には、読み込んだ識別信号からパラメータの情報を取得すればよい。
また、識別信号が、例えばエンコード時の音響環境などに応じたエンコードタイプを特定するようなものである場合には、パラメータ設定部400においてエンコードタイプに応じてパラメータを記述したテーブル情報などを用意しておき、識別信号の内容により識別したエンコードタイプと対応つけられているパラメータをテーブル情報から検索して取得するように構成することが考えられる。あるいは、識別情報により識別したエンコードタイプに応じて所定の演算式、関数に基づいた演算を実行し、その演算結果をパラメータとして出力させる構成とすることも考えられる。
また、パラメータ設定部400の実際の構成としては、CPUなどを備えたコンピュータなどが、パラメータ設定のためのプログラムを実行することで実現されるものとされればよい。
このようにして識別信号に応じたパラメータ設定が行われたチャンネル分離処理ブロック32−L、32−C、32−R、32−C、32−LS、32−RSにおける補正処理部41a、41b及び係数発生部62,64が処理を実行することで、例えばエンコード時の条件に応じて最適とされるパラメータによる信号分離の処理が行われることになるものであり、この結果、例えばデコード出力される信号については、エンコード前の原チャンネルの音声信号に非常に近い、最良とされるものが得られることになる。
この図に示す再生システムは、メディア再生ユニット201、及びスピーカ駆動ユニット202を備えて構成される。メディア再生ユニット201は、先に図16に示したものと同様にして、メディア102から、エンコード後の音声ソースであるLch,Rchの音声信号を再生して出力する。
この場合においても、メディア再生ユニット201により再生されたLch,Rchの音声信号は、ヘッドフォンにより音声として再生出力させることができるようになっている。
そして、メディア再生ユニット201により再生されたLch,Rchの音声信号は、スピーカ駆動ユニット202に対しても入力されるようになっている。
先ず、図19には、L(左),R(右)のチャンネルごとに応じた2つのスピーカSP−L,SP−Rが配置され、このスピーカSP−L,SP−Rの正中面となる位置にリスナMが位置して、スピーカSP−L,SP−Rから到達する音を聴き取るというモデルが示されている。
このモデルにおいては、スピーカSP−Lから左耳に到達する経路の伝達関数をHsll、スピーカSP−Lから右耳に到達する経路の伝達関数をHslr、スピーカSP−Rから左耳に到達する経路の伝達関数をHsrl、スピーカSP−Rから右耳に到達する経路の伝達関数をHsrrとして示している。
上記した伝達関数に応じた経路のうちで、クロストークに対応するのは、スピーカSP−Lから右耳に至る経路と、スピーカSP−Rから左耳に至る経路である。図13に示したモデルから、この2つの経路を除けば、リスナMには、スピーカSP−Lから左耳に至る経路と、スピーカSP−Rから右耳に至る経路とによる音のみが到達しているのと同じことになる。つまり、ヘッドフォンによる再生音を聴いているのと同じく、クロストークを聴かない状態で聴くことになる。
このことから、図18のスピーカ駆動ユニット202としては、入力されるL,Rチャンネルの音声信号から、クロストークに対応する経路の伝達関数Hslr、Hsrlに応じた伝達特性を除去するための信号処理を実行するようにすればよい、ということになる。これにより、実際のスピーカSP−L、SP−Rと、リスナの左右の耳との間でのクロストークはなくなり、リスナにとっては、例えばヘッドフォンによる再生音声を聴いているときと等価の、エンコード時に想定した音響環境に非常に忠実な音像定位を知覚できる。
ここで、図19に示されるスピーカSP−L、SP−RがリスナMの正中面に対して対称に配置されていることとして、スピーカがリスナMにまで到達する音の経路のうちで、クロストークではないとされる、スピーカSP−LからリスナMの左耳に至る経路と、スピーカSP−RからリスナMの右耳に至る経路とに対応した伝達関数Hsll、Hsrrについて、
Hsll=Hsrr=S
とする。また、クロストークとされる、スピーカSP−LからリスナMの右耳に至る経路と、スピーカSP−RからリスナMの左耳に至る経路とに対応した伝達関数Hsll、Hsrrについて、
Hslr=Hsrl=A
とする。そして下記の式により表される伝達関数Cを定義する。
C=−A/S
図20に示すクロストークキャンセルのための信号処理系の構成としては、図示するようにして、加算器211,213、フィルタ212,214,215,216を備える。
入力されるLch,Rchの音声信号のうち、Lchの音声信号は加算器211に対して入力されるとともに、分岐してフィルタ212に対して入力される。フィルタ212は、Lchの音声信号に対して伝達関数Cの伝達特性を与えて加算器213に出力する。
また、Rchの音声信号は加算器213に対して入力されるとともに、分岐してフィルタ214に対して入力される。フィルタ214は、Rchの音声信号に対して伝達関数Cの伝達特性を与えて加算器211に出力する。
また、加算器213によっては、Rchの音声信号と、伝達関数Cの伝達特性が与えられたLchの音声信号が加算、合成されて出力される。この加算器211から出力される信号は、元のRchの音声信号より、スピーカSP−RからリスナMの左耳にクロストークして到達する伝達特性に応じた成分をあらかじめ取り除いたものとなる。
このようにして出力されるLchの再生用音声信号とRchの再生用音声信号によりスピーカSP−L、SP−Rを駆動すると、スピーカSP−L、SP−Lから発せられる音を実際に聴くリスナMとしては、図19のスピーカSP−LからリスナMの左耳に到達する経路による音と、スピーカSP−Rからリスナの右耳に到達する経路による音のみを聴くのと等価の状態が得られることになる。つまり、クロストークがキャンセルされ、ヘッドフォンで聴く場合と同様に、エンコード時に想定した音響環境に対応した音像定位を知覚できることになる。
この図に示す構成においては、Lchの信号を、フィルタ221とフィルタ222に対して入力させる。フィルタ221はフィルタ特性F1によるフィルタリング処理を実行し、フィルタ221はフィルタ特性F2によるフィルタリング処理を実行する。
また、Rchの信号は、フィルタ特性F3を持つフィルタ223によるフィルタリング処理と、フィルタ特性F4を持つフィルタ224によるフィルタリング処理を実行する。
そして、フィルタ221とフィルタ223を加算器211により加算した出力がLchの再生用音声信号となり、フィルタ222とフィルタ224を加算器213により加算した出力がRchの再生用音声信号となる。
フィルタ221,222,223,224の各フィルタ特性F1,F2,F3,F4は、図19の伝達関数との関係では、次のようにして表される。
F1=Hsrr/(Hsll×Hsrr−Hslr×Hsrl)
F2=−Hslr/(Hsll×Hsrr−Hslr×Hsrl)
F3=−Hsrl/(Hsll×Hsrr−Hslr×Hsrl)
F4=Hsll/(Hsll×Hsrr−Hslr×Hsrl)
また、さらに実施の形態としてのデコード装置2は、エンコード装置1によりエンコードされた音声ソースを入力して、デコードチャンネルとして原チャンネルと同じチャンネル構成にデコードすることとしているが、デコードにより得られるデコードチャンネルとしてのチャンネル構成は、必ずしも、エンコード装置1が対応する原チャンネルのチャンネル構成と同じである必要は無く、他のチャンネル構成とされてもよい。このようなデコード装置は、デコード後のチャンネル構成のモデルに従った伝達関数を加味して、補正処理部41に与える特性を設定することで実現可能である。
また、本願発明としては、これまでに説明した実施の形態としての例に限定されるものではない、適宜変更が可能とされる。例えば、本実施の形態では、音の空間伝達関数は、音源からリスナの耳に到達する経路のものとされていることから、頭部伝達関数と同義とみてよいのであるが、音源の到達目標となる位置をリスナの耳ではない、何らかの他のものに対応させる場合もあると考えられる。この場合には、音源から到達目標の位置までの経路を表す伝達特性として、本来の意味での空間伝達関数を用いることになる。
Claims (11)
- 所定のチャンネル構成を成すデコードチャンネルに対応する音声信号成分のそれぞれに対して、対応のデコードチャンネルとしての音源の位置に基づいて求められた空間伝達関数により表される伝達特性を与え、これらの音声信号成分をエンコードチャンネルのチャンネル構成に応じて振り分けて生成した、エンコードチャンネルの音声信号を入力して、上記デコードチャンネルにおける特定の1つのチャンネルに対応する音声信号成分を生成する音声信号生成手段を、上記デコードチャンネルごとに対応して備え、
上記音声信号生成手段の各々は、
入力されたエンコードチャンネルの音声信号の各々について、その音声信号生成手段が対応するデコードチャンネルの音声信号成分に与えられた伝達特性についての補正を行う補正手段と、
上記補正手段により補正された信号の間での所定の近似性を検出する近似性検出手段と、
上記近似性検出手段の検出結果に基づいて、上記信号補正手段から出力されるエンコードチャンネルごとの信号から、相互に近似しているとされる信号成分を分離して出力する分離手段と、
上記分離手段により分離された信号成分を加算して、対応するデコードチャンネルの音声信号として出力するチャンネル音声信号出力手段とを備える、
ことを特徴とする音声信号処理装置。 - 上記補正手段は、
入力されたエンコードチャンネルの音声信号の各々に対して、その音声信号生成手段が対応するデコードチャンネルの音声信号に付与された伝達特性に基づいた逆特性を与えるフィルタ処理を実行するように構成される、
ことを特徴とする請求項1に記載の音声信号処理装置。 - 上記補正手段は、
その音声信号生成手段が対応するデコードチャンネルの音声信号に付与された伝達特性のインパルス応答における直接音部分の逆特性を与えるフィルタ処理を実行するようにされる、
ことを特徴とする請求項2に記載の音声信号処理装置。 - 上記補正手段は、
その音声信号生成手段が対応するデコードチャンネルの音声信号に付与された、無響環境による伝達特性の逆特性を与えるフィルタ処理を実行するようにされる、
ことを特徴とする請求項2に記載の音声信号処理装置。 - 上記近似性検出手段は、
上記補正手段による補正後のエンコードチャンネルごとの信号についての、位相についての近似性を検出する、
ことを特徴とする請求項2に記載の音声信号処理装置。 - 上記近似性検出手段は、
上記補正手段による補正後のエンコードチャンネルごとの信号についての、レベルについての近似性を検出する、
ことを特徴とする請求項2に記載の音声信号処理装置。 - 上記補正手段は、
入力されたエンコードチャンネルごとの音声信号の間での、付与されている伝達特性により生じる、対応するデコードチャンネルの音声信号成分に関する伝搬時間差を補正するための処理を実行し、
上記近似性検出手段は、
上記補正手段による補正後のエンコードチャンネルごとの信号についての伝搬時間差を近似性として検出する、
ことを特徴とする請求項1に記載の音声信号処理装置。 - 上記補正手段は、
さらに、入力されたエンコードチャンネルごとの音声信号の間での、付与されている伝達特性により生じる、対応するデコードチャンネルの音声信号成分に関するレベル差を補正するための処理を実行し、
上記近似性検出手段は、
さらに、上記補正手段による補正後のエンコードチャンネルごとの信号についてのレベル差を補正するための処理を実行するようにされる、
ことを特徴とする請求項7に記載の音声信号処理装置 - 所定のチャンネル構成を成す原チャンネルの音声信号の組を、この原チャンネル以外の所定のチャンネル構成を成すエンコードチャンネルの音声信号の組に変換して出力するエンコード装置と、
所定のチャンネル構成を成すエンコードチャンネルの音声信号の組を入力して、所定のチャンネル構成を成すデコードチャンネルの音声信号の組に変換するデコード装置とから成り、
上記エンコード装置は、
1原チャンネルにつきエンコードチャンネルごとに対応したものが設けられ、入力される音声信号が対応する原チャンネルとしての音源の位置に基づいて設定される空間伝達関数により表される伝達特性を、上記入力される音声信号に付与する伝達特性付与手段と、
エンコードチャンネルごとに対応して設けられ、上記伝達特性付与手段の各々によって処理が施された信号を入力して加算し、この加算した出力を、対応するエンコードチャンネルの音声信号として出力する加算手段とを備え、
上記デコード装置は、
上記デコードチャンネルにおける特定の1つのチャンネルに対応する音声信号成分を分離する音声信号分離手段を、上記デコードチャンネルごとに対応して有し、
上記音声信号分離手段の各々は、
入力されたエンコードチャンネルごとの音声信号について、対応するデコードチャンネルの音声信号成分に与えられた伝達特性についての補正を行う補正手段と、
上記補正手段による補正後のエンコードチャンネルごとの信号についての所定の近似性を検出する近似性検出手段と、
上記近似性検出手段の検出結果に基づいて、上記信号補正手段から出力されるエンコードチャンネルごとの信号から、相互に近似しているとされる信号成分を分離して出力する分離手段と、
上記分離手段により分離された信号成分を加算して、対応するデコードチャンネルの音声信号として出力するチャンネル音声信号出力手段とを備える、
ことを特徴とする音声信号処理システム。 - 所定のチャンネル構成を成すデコードチャンネルに対応する音声信号成分のそれぞれに対して、対応のデコードチャンネルとしての音源の位置に基づいて求められた空間伝達関数により表される伝達特性を与え、これらの音声信号成分をエンコードチャンネルのチャンネル構成に応じて振り分けて生成した、エンコードチャンネルの音声信号を入力して、上記デコードチャンネルにおける特定の1つのチャンネルに対応する音声信号成分を生成する音声信号生成手順を、上記デコードチャンネルごとに対応して実行させるもので、
上記デコードチャンネルごとに対応した音声信号生成手順として、
入力されたエンコードチャンネルの音声信号の各々について、その音声信号生成手順が対応するデコードチャンネルの音声信号成分に与えられた伝達特性についての補正を行う補正手順と、
上記補正手順により補正された信号の間での所定の近似性を検出する近似性検出手順と、
上記近似性検出手順の検出結果に基づいて、上記信号補正手順により得られるエンコードチャンネルごとの信号から、相互に近似しているとされる信号成分を分離して出力する分離手順と、
上記分離手順により分離された信号成分を加算して、対応するデコードチャンネルの音声信号として出力するチャンネル音声信号出力手順と、
を情報処理装置に実行させるプログラム。 - 所定のチャンネル構成を成す原チャンネルの音声信号の組を、この原チャンネル以外の所定のチャンネル構成を成すエンコードチャンネルの音声信号の組に変換して出力するエンコード処理と、
所定のチャンネル構成を成すエンコードチャンネルの音声信号の組を入力して、所定のチャンネル構成を成すデコードチャンネルの音声信号の組に変換するデコード処理とを情報処理装置に実行させるものであって、
上記エンコード処理は、
1原チャンネルにつきエンコードチャンネルごとに対応して実行すべき手順とされて、入力される音声信号が対応する原チャンネルとしての音源の位置に基づいて設定される空間伝達関数により表される伝達特性を、上記入力される音声信号に付与する伝達特性付与手順と、
エンコードチャンネルごとに対応して設けられ、上記伝達特性付与手順の各々によって処理が施された信号を入力して加算し、この加算した出力を、対応するエンコードチャンネルの音声信号として出力する加算手順とを情報処理装置に実行させるもので、
上記デコード処理は、
上記デコードチャンネルにおける特定の1つのチャンネルに対応する音声信号成分を分離する音声信号分離手順を、上記デコードチャンネルごとに対応して実行するものとされ、
上記音声信号分離手順の各々は、
入力されたエンコードチャンネルごとの音声信号について、対応するデコードチャンネルの音声信号成分に与えられた伝達特性についての補正を行う補正手順と、
上記補正手順による補正後のエンコードチャンネルごとの信号についての所定の近似性を検出する近似性検出手順と、
上記近似性検出手順の検出結果に基づいて、上記信号補正手順により得られるエンコードチャンネルごとの信号から、相互に近似しているとされる信号成分を分離して出力する分離手順と、
上記分離手順により分離された信号成分を加算して、対応するデコードチャンネルの音声信号として出力するチャンネル音声信号出力手順とを情報処理装置に実行させるものである、
ことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006020653A JP4951985B2 (ja) | 2006-01-30 | 2006-01-30 | 音声信号処理装置、音声信号処理システム、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006020653A JP4951985B2 (ja) | 2006-01-30 | 2006-01-30 | 音声信号処理装置、音声信号処理システム、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007202021A JP2007202021A (ja) | 2007-08-09 |
JP4951985B2 true JP4951985B2 (ja) | 2012-06-13 |
Family
ID=38456117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006020653A Expired - Fee Related JP4951985B2 (ja) | 2006-01-30 | 2006-01-30 | 音声信号処理装置、音声信号処理システム、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4951985B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009206691A (ja) | 2008-02-27 | 2009-09-10 | Sony Corp | 頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置 |
JP5540581B2 (ja) | 2009-06-23 | 2014-07-02 | ソニー株式会社 | 音声信号処理装置および音声信号処理方法 |
JP5533248B2 (ja) | 2010-05-20 | 2014-06-25 | ソニー株式会社 | 音声信号処理装置および音声信号処理方法 |
JP2012004668A (ja) | 2010-06-14 | 2012-01-05 | Sony Corp | 頭部伝達関数生成装置、頭部伝達関数生成方法及び音声信号処理装置 |
JP5907488B2 (ja) * | 2012-11-06 | 2016-04-26 | 日本電信電話株式会社 | 再生信号生成方法、収音再生方法、再生信号生成装置、収音再生システム及びそのプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04137900A (ja) * | 1990-09-27 | 1992-05-12 | Pioneer Electron Corp | 信号処理装置及び音響再生装置 |
JP2971162B2 (ja) * | 1991-03-26 | 1999-11-02 | マツダ株式会社 | 音響装置 |
US5796844A (en) * | 1996-07-19 | 1998-08-18 | Lexicon | Multichannel active matrix sound reproduction with maximum lateral separation |
JP3670562B2 (ja) * | 2000-09-05 | 2005-07-13 | 日本電信電話株式会社 | ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体 |
JP2002191099A (ja) * | 2000-09-26 | 2002-07-05 | Matsushita Electric Ind Co Ltd | 信号処理装置 |
KR20050060789A (ko) * | 2003-12-17 | 2005-06-22 | 삼성전자주식회사 | 가상 음향 재생 방법 및 그 장치 |
EP1914722B1 (en) * | 2004-03-01 | 2009-04-29 | Dolby Laboratories Licensing Corporation | Multichannel audio decoding |
JP4123376B2 (ja) * | 2004-04-27 | 2008-07-23 | ソニー株式会社 | 信号処理装置およびバイノーラル再生方法 |
JP2005352396A (ja) * | 2004-06-14 | 2005-12-22 | Matsushita Electric Ind Co Ltd | 音響信号符号化装置および音響信号復号装置 |
-
2006
- 2006-01-30 JP JP2006020653A patent/JP4951985B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007202021A (ja) | 2007-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100644617B1 (ko) | 7.1 채널 오디오 재생 방법 및 장치 | |
KR101567461B1 (ko) | 다채널 사운드 신호 생성 장치 | |
KR101368859B1 (ko) | 개인 청각 특성을 고려한 2채널 입체 음향 재생 방법 및장치 | |
KR100739776B1 (ko) | 입체 음향 생성 방법 및 장치 | |
KR100608025B1 (ko) | 2채널 헤드폰용 입체 음향 생성 방법 및 장치 | |
KR100717066B1 (ko) | 심리 음향 모델을 이용한 프론트 서라운드 사운드 재생시스템 및 그 방법 | |
KR100677629B1 (ko) | 다채널 음향 신호에 대한 2채널 입체 음향 생성 방법 및장치 | |
KR100608024B1 (ko) | 다중 채널 오디오 입력 신호를 2채널 출력으로 재생하기위한 장치 및 방법과 이를 수행하기 위한 프로그램이기록된 기록매체 | |
JP6007474B2 (ja) | 音声信号処理装置、音声信号処理方法、プログラムおよび記録媒体 | |
JP5496235B2 (ja) | 多重オーディオチャンネル群の再現の向上 | |
JP2007028624A (ja) | ワイドモノサウンドの再生方法及びシステム | |
KR20080047446A (ko) | 오디오 코딩 | |
EP2229012B1 (en) | Device, method, program, and system for canceling crosstalk when reproducing sound through plurality of speakers arranged around listener | |
JP5118267B2 (ja) | 音声信号再生装置、音声信号再生方法 | |
JP2005223713A (ja) | 音響再生装置、音響再生方法 | |
KR100636252B1 (ko) | 공간 스테레오 사운드 생성 방법 및 장치 | |
US20060269071A1 (en) | Virtual sound localization processing apparatus, virtual sound localization processing method, and recording medium | |
JP4951985B2 (ja) | 音声信号処理装置、音声信号処理システム、プログラム | |
JP5038145B2 (ja) | 定位制御装置、定位制御方法、定位制御プログラムおよびコンピュータに読み取り可能な記録媒体 | |
NL1032538C2 (nl) | Apparaat en werkwijze voor het reproduceren van virtueel geluid van twee kanalen. | |
JP2005223714A (ja) | 音響収音装置、音響収音方法、記録媒体 | |
JP2007336080A (ja) | 音響補正装置 | |
JP6463955B2 (ja) | 三次元音響再生装置及びプログラム | |
KR100275779B1 (ko) | 5채널 오디오 데이터를 2채널로 변환하여 헤드폰으로 재생하는 장치 및 방법 | |
JP2007202020A (ja) | 音声信号処理装置、音声信号処理方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110524 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120227 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4951985 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150323 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |