JP3778358B2 - 音源分離方法、その装置及びプログラム - Google Patents
音源分離方法、その装置及びプログラム Download PDFInfo
- Publication number
- JP3778358B2 JP3778358B2 JP2003126554A JP2003126554A JP3778358B2 JP 3778358 B2 JP3778358 B2 JP 3778358B2 JP 2003126554 A JP2003126554 A JP 2003126554A JP 2003126554 A JP2003126554 A JP 2003126554A JP 3778358 B2 JP3778358 B2 JP 3778358B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sound source
- band
- threshold value
- channels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
【発明の属する技術分野】
この発明は、空間的に異なる位置の複数の音源からの音響信号を、2個のマイクロホンを用いて受信し、これらマイクロホン出力信号を狭い複数の帯域に分割し、各帯域ごといずれの音源からの信号かを判別し、同一音源からの信号と判別された信号を合成して1つの音源信号を収音する音源分離方法、その装置及びプログラムに関する。
【0002】
【従来の技術】
従来のゾーン分離収音技術には、例えば、音が持つ次のような特徴を利用したものがある。音はいくつかの周波数成分の和として表現されることが知られている。そこで、複数の音源が同時に発音している場合、これを2個以上のマイクロホンで受音し、これら各マイクロホンの出力チャネル信号を、各音源信号の周波数成分が周波数軸上で重ならない程度の帯域に分割し、チャネル信号間の音響信号パラメータ値差つまり周波数成分の到達位相差や到達レベル差を基に、各周波数成分それぞれがどの音源からのものであるかを判定し、同一音源からの成分を集めて合成することにより、各音源毎の音を個別に収音する方法が用いられていた(例えば特許文献1参照)。
【0003】
この従来技術について図1を参照して簡単に説明する。例えば20cm程度の間隔で設けられたマイクロホン1と2からの出力チャネル信号はチャネル間パラメータ値差検出部3において、マイクロホン1,2の位置に起因して変化するマイクロホン1,2に到達する音響信号のパラメータ値の差、つまりマイクロホン1,2に到達した音響信号のレベル差や到達時間差がチャネル間パラメータ値差として検出される。またマイクロホン1,2の各出力チャネル信号は帯域分割部4によりそれぞれ例えば離散的フーリエ変換され、更に複数の周波数帯域の信号に分割される。この各帯域の幅は各音源信号の周波数特性の差から、ひとつの音源信号の成分のみが主として存在する程度、例えば20Hzとする。帯域分割された両チャネル信号は、帯域別チャネル間パラメータ値差検出部5において、互いに同一帯域信号ごとに音響信号のパラメータ値の差が、帯域別チャネル間パラメータ値差としてそれぞれ検出される。
【0004】
チャネル間パラメータ値差と、帯域別チャネル間パラメータ値差が音源信号判定部6Aに入力され、音源信号判定部6Aにおいて各帯域ごとにその帯域信号がいずれの音源からの信号であるかの判定がしきい値を用いて行われる(前記特許文献1の図9中のステップS34,S35)。その判定結果に基づき、各チャネル信号の帯域分割された信号中の同一音源信号と判定されたものが音源信号選択部6Bで選択され、これら同一音源信号と判定されたものが音源信号別に音源合成部7A,7Bで合成されて、それぞれ、音源8,9からの信号として出力される。
【0005】
音源信号判定部6Aで判定に用いるしきい値としては、特許文献1の段落番号[0033]及び[0034]に次のように示されている。マイクロホン1と2を結ぶ線の2等分線に対して音源8と9が対称に位置している場合は、0をしきい値とし、音源8と9がこのような関係にない場合は、音源8の信号がマイクロホン1,2に到達する帯域別チャネル間レベル差をΔLA 、到達する帯域別チャネル間時間差をΔτA 、音源9の信号がマイクロホン1,2に到達する帯域別チャネルレベル差をΔLB 、到達する帯域別チャネル間時間差をΔτB とすると、帯域別チャネル間レベル差のしきい値ΔLthは、
ΔLth=(ΔLA +ΔLB )/2
とし、帯域別チャネル間時間差のしきい値Δτthは
Δτth=(ΔτA +ΔτB )/2
とする。しかし、これは一方の音源のみ発音している理想的な場合であり、実際には、音源のマイクロホンに対する方向、距離はわかっていないため、しきい値ΔLth,Δτthを可変として、分離がよく行われるようにΔLth,Δτthを調整することが記載されている。
【0006】
【特許文献1】
特許第3355598号公報
【0007】
【発明が解決しようとする課題】
従来においてはしきい値ΔLth,Δτthを自動で計測する技術がなく、従来においては試行錯誤の上、しきい値を決定する必要があった。
また手間を掛てしきい値を決定しても、そのしきい値を長い時間用いると、音源の変動により、性能が劣化する問題があった。
【0008】
【課題を解決するための手段】
この発明の方法によれば互いに離して配置された2個のマイクロホンの各出力チャネル信号を、複数の周波数帯域に分割し、これら分割された各出力チャネル信号の各同一帯域毎に、上記複数のマイクロホンの位置に起因して変化する、マイクロホンに到達する音響信号のパラメータの値の差を、帯域別チャネル間パラメータ値差として検出し、これら各帯域の帯域別チャネル間パラメータ値差に基づき、その帯域の上記帯域分割された各出力チャネル信号のいずれがいずれの音源から入力された信号であるかをしきい値を用いて判定し、この判定に基づき、上記帯域分割された各出力チャネル信号から、同一音源から入力された信号を少なくとも一つ選択し、この同一音源からの信号として選択された複数の帯域信号を音源信号として合成する音源分離方法において、
目的音源信号と雑音信号が混ざった混合信号のチャネル間の音響信号パラメータ値差を検出し、また、雑音信号のチャネル間音響信号パラメータ値差を検出し、これら混合信号のチャネル間パラメータ値差と、雑音信号のチャネル間パラメータ値差の値に基づき、上記しきい値を求めることを特徴とする。
【0009】
【発明の実施の形態】
この発明の実施形態の機能構成例を図1に示す。図1から理解されるように、従来の音源分離装置に対し新たに機能が付け加えられる。
この発明では目的音源信号と雑音信号が混ざった混合信号のチャネル間の音響信号パラメータ値差と、雑音信号のチャネル間の音響信号パラメータ値差とをそれぞれ検出する。このためマイクロホン1,2の各出力チャネル信号が、目的音源信号と雑音信号が混ざった混合信号であるか、雑音信号であるかを有音判定部11で判定する。この例ではマイクロホン1と2の各出力チャネル信号が有音判定部11に入力され、有音判定部11は両チャネル信号のパワーが所定レベルを所定時間継続して超えたら両チャネル信号が混合信号であり、これより所定レベル以下になれば、混合信号の状態にないと判定し、また両チャネル信号のパワーが前記所定レベルより小さい所定レベル以下で継続していれば両チャネル信号は雑音信号であると判定する。あるいは音源が例えば人間がスイッチを操作して発話するようなものである場合は、そのスイッチ操作に基づく信号を有音判定部11に入力して、音源が発音状態、つまりその時の両チャネル信号は混合信号であり、スイッチ操作が停止されている状態の両チャネル信号は雑音信号と判定するようにしてもよい。
【0010】
またこの例では帯域分割されたチャネル信号について帯域別チャネル間パラメータ値差を検出した場合である。つまり帯域別チャネル間パラメータ値差検出部5で検出された各帯域別チャネル間パラメータ値差は各帯域ごとに切替えることができる切替部12へ供給され、切替部12は有音判定部11よりの混合信号と判定した出力により制御され、入力された各帯域別チャネル間パラメータ値差が信号用パラメータ値差保持部13Sに更新格納保持される。有音判定部11よりの出力が混合信号と判定していなければ、入力された各帯域別チャネル間パラメータ値差が雑音用パラメータ値差保持部13Nに更新格納保持される。この場合、有音判定部11が雑音信号と判定した出力により、帯域別チャネル間パラメータ値差を雑音用パラメータ値差保持部13Nに更新格納保持させ、混合信号とも雑音信号とも判定していない場合は、雑音用パラメータ値差保持部13Nに対する更新格納保持は行なわないようにすることが好ましい。
【0011】
信号用パラメータ値差保持部13Sに保持されている混合信号の帯域別チャネル間パラメータ値差と、雑音用パラメータ値差保持部13Nに保持されている雑音信号の帯域別パラメータ値差とに基づいてしきい値決定部14でしきい値が決定される。
例えば音源8が目的音源とし、目的音源信号をs(t)、雑音信号をn(t)とする。tは離散的時刻である。マイクロホン1の出力混合信号を(s+n)1M(t)、マイクロホン2の出力混合信号を(s+n)2M(t)、マイクロホン1の出力雑音信号をn1N(t)、マイクロホン2の出力雑音信号をn2N(t)とし、チャネルパラメータとしてレベルを用いる場合を例とし、各混合信号(s+n)1M(t)、(s+n)2M(t)の帯域分割された各帯域fi(i=1,2,…,I:Iは帯域分割数)の帯域信号レベルをL1M[fi],L2M[fi]とし、各雑音信号n1N(t),n2N(t)の帯域分割された各帯域fiの帯域信号レベルをL1N[fi],L2N[fi]とする。この時、混合信号の帯域別チャネル間レベル差ΔLM[fi]は次式で与えられる。
ΔLM[fi]=L2M[fi]−L1M[fi]
レベルの単位はdB表示である。
【0012】
雑音信号の帯域別チャネル間レベル差ΔLN[fi]は次式で与えられる。
ΔLN[fi]=L2N[fi]−L1N[fi]
これら帯域別チャネル間レベル差ΔLM[fi]とΔLN[fi]が信号用パラメータ値差保持部13S、雑音用パラメータ値差保持部13Nにそれぞれ保持される。しきい値決定部14ではこれら帯域別チャネル間レベル差ΔLM[fi]とΔLN[fi]を用いて帯域別しきい値Lth[fi]が例えば次式に示すように平均値として決定される。
Lth[fi]=(ΔLM[fi]+ΔLN[fi])/2
最初から分離性能を良くする点からはしきい値Lth[fi]としては平均値がよいが、ΔLM[fi]とΔLN[fi]との間の値、予め決めた比率でΔLM[fi]よりもΔLN[fi]に近い値をしきい値Lth[fi]としてもよい。
【0013】
このように決定された帯域別しきい値Lth[fi]はしきい値部15に設定され、音源信号判定部6Aにおいて、帯域fiの帯域信号がいずれの音源から入力された信号であるかの判定のためのしきい値として用いられる。このしきい値としては帯域別しきい値Lth[fi]の代表値Lthを代表決定部16で決定して、各帯域fiに共通のしきい値Lthを用いていずれの音源から入力された信号であるかの判定を行ってもよい。代表値Lthの決定は例えばLth[fi]の平均値あるいは最大のLth[fi]などによる。
【0014】
この音源分離装置を最初に用いる場合は、図2に示すように混合信号(s+n)1M(t),(s+n)2M(t),雑音信号n1N(t),n2N(t)を例えば3〜5秒の定めた時間、バッファ(図1中には特に示していない)に格納し(S1)、これら信号の安定したものが得られた状態で混合信号の帯域別チャネル間パラメータ値差を検出し(S2)、また雑音信号の帯域別チャネル間パラメータ値差を検出する(S3)。これらの検出は帯域分割部4及び帯域別チャネル間パラメータ値差検出部5により行う。前記バッファを省略してパラメータ値差保持部13をバッファとして作用させても、安定した信号の帯域別チャネル間パラメータ値差がパラメータ値差保持部13に更新保持されることになる。次にこれら混合信号の帯域別チャネル間パラメータ値差と雑音信号の帯域別チャネル間パラメータ値差に基づき、帯域別しきい値を決定しこれをしきい値設定部15に設定する(S4)。この初期設定の後、音源分離処理を開始する。なおしきい値としては帯域別しきい値からその代表値を決定し(S5)、これを音源信号判定に用いてもよい。
【0015】
以上のように決定したしきい値Lth[fi]又はLthをそのまま採用した場合に以下に記す不具合がおきるおそれがある。すなわち、しきい値Lth[fi]を最も精度よく求めるためには、混合信号の帯域別チャネル間レベル差ΔLM[fi]は、なるべく雑音n(t)が入らず、目的信号s(t)だけが発音している信号を使うのが望ましい。しかし、実際の環境においては、雑音が全て発生しておらず、目的音源だけが発音している状態を得ることが難しい。よって、ΔLM[fi]つまり、従来技術の項で述べた帯域別チャネル間レベル差ΔLA は目的音源信号と雑音信号が混在した信号から近似的に算出することになる。よって、必ずしも最適なしきい値Lth[fi]になっているとは限らない。
【0016】
そこで、前述のようにして決定したしきい値Lth[fi]を初期値とし、初期値を用いた場合の分離結果を評価し、つまり分離前の信号と分離後の信号とを用いて例えば分離性能を表わす評価値を分離評価部21で計算し、その評価が所定の範囲に入るようにしきい値Lth[fi]を修正部22により修正する。
【0017】
まず、初期しきい値Lth[fi]を用いて、あらかじめバッファ24に記憶してある目的音源信号と雑音信号の混合信号を分離処理する。即ち図3Aに示すように、目的音源8が発音している状態において雑音源9も発音しているから、先に述べたようにマイクロホン1,2からの混合信号(s+n)1M(t),(s+n)2M(t)がこの発明による音源分離装置10により分離処理されて、目的音源信号(s+n)′1M(t)が分離出力される。あるいは図3Bに示すように目的音源8が発音していない状態においてはマイクロホン1,2からの雑音信号n1N(t),n2N(t)が音源分離装置10により分離処理されて雑音信号n′1N(t)が分離出力される。
【0018】
これら分離前の信号(s+n)1M(t),n1N(t)と分離処理後の信号(s+n)′1M(t),n′1N(t)とのいくつかを用いて分離性能を表わす評価値を分離評価部21で計算する(S1、図4)。分離性能を表わす評価値としては例えば次に示す各種の信号対雑音比(SNR)の何れかを用いることができる。
【数1】
演算子・は相関関数を表す。0≦SNR4 ≦1である。
【0019】
評価値SNR1 〜SNR4 の何れかを計算し、その評価値が所定の範囲x1<SNR<x2dBに入るようにしきい値Lth[fi]を修正する。例えば修正判定部23において評価値SNRが上限値x2を超えているかを調べ(S2)、超えていればしきい値設定部15内のしきい値Lth[fi]を所定値Δthだけ、しきい値修正部22により減少させる(S3)。
修正判定部23ではステップS2で評価値SNRが上限値x2を超えていなければ下限値x1より小さいかを調べ(S4)、小さければしきい値設定部15内のしきい値Lth[fi]を所定値Δthだけ、しきい値修正部22により増加させる(S5)。ステップS3及びS5の後、ステップS1に戻り、修正したしきい値Lth[fi]により再び分離処理を行って評価値SNRを求める。以下同様にして、ステップS4で評価値SNRが下限値より小さくなければ、修正処理を終了する。
【0020】
例えばx1=15dB、x2=20dB程度とする。しかし雑音が大きい場合は、大きなSNRが得られないため、同一音源からの帯域信号と判定される帯域が少なくなり、分離信号の歪みが大きくなる。そのような場合はx1=10dB、x2=15dB程度がよい。修正量Δthは例えば0.1〜0.2dB程度がよい。
評価値SNR2 〜SNR4 は目的音源信号成分と、雑音信号成分との両者を用いている点で実際の環境にあっている点で分離性能との対応がよいが、SNR2 とSNR3 はSNR4 より演算量が少ない点がよい。
【0021】
評価値としては信号対歪比SDRを用いてもよい。SDRは例えば次の何れかにより求める。
【数2】
演算子・は相関関数を表す。
【0022】
SDR1 とSDR2 は分離性能との対応では同一程度であるが、SDR1 はSDR2 より計算量が少ない点がよい。この評価値SDRを用いた場合も、これが下限値y1と上限値y2との間に入るように、例えば図4に括弧書で示す手順でしきい値Lth[fi]を修正する。SDRがy1より小であれば、同一音源からの帯域信号と判定される帯域が少なくなり歪が大きくなるのでしきい値Lth[fi]を小さくし、SDRがy2より大であれば雑音の混入が多くなるのでしきい値Lth[fi]を大とする。例えば下限値y1=8dB、上限値y2=10dB程度とし、雑音が多い場合はy1=5,y2=8程度とした方が、雑音成分も除去され易い。しきい値修正量Δthは0.1〜0.2dB程度がよい。
【0023】
目的音源の位置、方向が変化したり、雑音環境が変化したりする点で設定したしきい値は適当な周期で更新するようにするとよい。また更新するようにすれば初期値として例えば0を設定させて、分離処理と、しきい値更新処理とを並列的に行わせることもできる。
例えば図5に示すように、まずしきい値の初期値としきい値設定部15に設定する(S1)。この初期値は前述したようにして求めてもよいし、適当な値を設定してもよい。
その後一定時間経過するのを待つ(S2)。この一定時間は例えば10〜30秒とするが、使用環境や目的に応じ、速く適したしきい値に追従させる必要があれば、それに応じて短時間にする。帯域分割部4において例えば離散的フーリエ変換を行うが、その変換フレーム単位でしきい値を更新してもよい。
【0024】
一定時間が経過すると、しきい値の更新処理を行う(S3)。この更新処理は図2に示した処理を行うことになる。この際、ステップS2で待っている間においても音源分離処理と併行して、有音判定部11の出力によりパラメータ値差保持部13に対する更新格納保持を行うようにすれば、更新処理が始まると、その時のパラメータ値差保持部13に保持されている帯域別チャネル間パラメータ値差を用いてしきい値を決定し、このしきい値でしきい値設定部15のしきい値を更新することにより、短時間で更新処理を行うことができる。この更新処理の後、ステップS2に戻って一定時間の経過を待つ。このようにして一定時間ごとにしきい値が更新され、品質のよい分離信号を得ることができる。
【0025】
この更新処理の際に、前回の評価値よりよくなった場合に更新を行い、よくならなければ更新を行わないようにすることが好ましい。例えば図5に示すように、ステップS2の後、図2に示した処理によりしきい値を計算し(S4)、このしきい値を用いて、分離処理を行って、分離評価部21で評価値(SNR又はSDR)を計算する(S5)。この評価値と前回の評価値とを更新判定部25で比較し(S6)、前回より良く(大きく)なっていれば更新を実行し、つまりステップS4で計算したしきい値、従ってステップS4で評価値計算に用い、その時、しきい値設定部15に設定されているしきい値をそのまま分離処理に用いる。
【0026】
しかし前回の評価値より悪く(小さく)なった場合は、それまでに用いていたしきい値、つまりステップS2で待っている時間の間、分離処理に用いていたしきい値を用いる。従って、一定時間経過しても、しきい値の更新は行わないでステップS2に戻る。この更新を行わない処理ができるように、ステップS5における評価値計算のための分離処理中は、それまでのしきい値、メモリに避難させておくか、評価値計算のための分離処理の際に用いるしきい値はしきい値決定部14内のしきい値を用い、ステップS7の更新実行において、しきい値決定部14内のしきい値をしきい値設定部15に設定更新するようにする。ステップS4のしきい値計算も、一定時間の経過を待っている間に、有音判定部11の出力により、パラメータ値差保持部13に対する更新格納を行わせておくことにより、短時間でしきい値を計算することができる。
【0027】
図4に示した計算したしきい値の修正処理は、図5中に破線で示すように、ステップS1の初期設定が図2に示した処理により行う場合は、そのしきい値に対し行ってもよく、またステップS3の更新処理で計算したしきい値に対して行ってもよく、ステップS4で計算したしきい値に対して行ってもよい。
【0028】
上述においては混合信号の帯域別チャネル間レベル差ΔLM[fi]と雑音信号の帯域別チャネル間レベル差ΔLN[fi]を用いてしきい値Lth[fi]を決定したが、混合信号のチャネル間レベル差ΔLM と雑音信号のチャネル間レベル差ΔLN を用いてしきい値Lthを決定し、これを各帯域信号について共通に用いてどの音源からの信号であるかの判定を行うようにしてもよい。このチャネル間レベル差ΔLM とΔLNは例えばチャネル間差検出部3からの出力を、有音判定部11の出力により選別して取り出せばよい。更にこの発明は混合信号の帯域別チャネル間時間差ΔτM[fi]と雑音信号の帯域別チャネル間時間差ΔτN[fi]を用いて、あるいは混合信号のチャネル間時間差ΔτM と雑音信号のチャネル間時間差ΔτN を用いて、しきい値τth[fi]又はτthを決定してもよい。要は混合信号と雑音信号について帯域別を含む広義のチャネル間パラメータ値差を用いてしきい値を決定すればよい。
【0029】
この発明による音源分離装置はコンピュータに機能させてもよい。この場合は上述したこの発明の音源分離方法の各過程をコンピュータに実行させるためのプログラムをCD−ROM、磁気ディスク、その他の記録媒体あるいは通信回線を介してコンピュータ内にダウンロードして、このプログラムを実行させればよい。
【0030】
【発明の効果】
以上述べたようにこの発明によれば、目的音源信号+雑音信号のチャネル間パラメータ値差と、雑音信号のチャネル間パラメータ値差を元にしきい値を決定することができ、従来、人手で試行錯誤して決定していたしきい値を、あらかじめ測定可能な物理量から決定でき、多くの手間と時間が省け、しかも一定の性能で音源分離装置を動作させることが可能となる。
また、必要に応じてしきい値を逐次更新する構成とすることにより、信号の時間変動にしきい値が追随し、この際、更新前のしきい値と新たに求めたしきい値の評価値を比較し、性能の高いほうのしきい値を常に選べば、この評価値の比較を行うことなく毎回しきい値を更新する場合に比べてより安定した性能で分離処理が可能となる。
【図面の簡単な説明】
【図1】この発明の装置の機能の構成例を示す図。
【図2】この発明によるしきい値を求める手順の例を示す流れ図。
【図3】評価値としてのSNR,SDRの算出に必要な信号を示す図。
【図4】しきい値修正処理の手順の例を示す流れ図。
【図5】しきい値更新の処理手順の例を示す流れ図。
Claims (6)
- 互いに離して配置された2個のマイクロホンよりの各出力チャネル信号を、複数の周波数帯域に分割する過程と、
上記分割された各出力チャネル信号の各同一帯域毎に、帯域別チャネル間の音響信号パラメータ値差を検出する過程と、
上記各帯域の帯域別チャネル間の音響信号パラメータ値差に基づき、その帯域の上記帯域分割された各出力チャネル信号のいずれがいずれの音源から入力された信号であるかをしきい値を用いて判定する過程と、
上記判定に基づき、上記帯域分割された各出力チャネル信号から、同一音源から入力された信号を少なくとも一つ選択する過程と、
上記同一音源からの信号として選択された複数の帯域信号を音源信号として合成する過程とを有する音源分離方法において、
目的音源信号と雑音信号が混ざった混合信号のチャネル間の音響信号パラメータ値差を検出する過程と、
雑音信号のチャネル間の音響信号パラメータ値差を検出する過程と、
上記混合信号のチャネル間の音響信号パラメータ値差と、上記雑音信号のチャネル間の音響信号パラメータ値差に基づいて上記しきい値を求める過程と
を有することを特徴とする音源分離方法。 - 周期的に上記混合信号のチャネル間の音響信号パラメータ値差と、上記雑音信号のチャネル間の音響信号パラメータ値差を検出し、これらを用いて上記しきい値を求め、このしきい値で上記判定に用いるしきい値を更新する更新過程を有することを特徴とする請求項1記載の音源分離方法。
- 上記更新過程において、上記判定に用いるしきい値とする前に、上記新たに求めたしきい値を用いて音源分離を行い、その分離された信号と分離前の信号を用いて分離性能を表わす評価値を計算し、その評価値が前回のしきい値を用いた場合の評価値より良ければ上記新たに求めたしきい値を上記判定に用いることを特徴とする請求項2記載の音源分離方法。
- 上記求めたしきい値を用いて音源分離を行い、その分離された信号と分離前の信号を用いて分離性能を表わす評価値を計算し、
その評価値が所定の範囲内の値になるように上記求めたしきい値を修正し、その修正したしきい値、又は修正前に所定の範囲内にあれば修正前のしきい値を上記判定に用いるしきい値とする修正過程を有することを特徴とする請求項1、2又は3記載の音源分離方法。 - 互いに離して配置された2個のマイクロホンの各出力チャネル信号を、複数の周波数帯域に分割する帯域分割部と、
上記帯域分割部で分割された各出力チャネル信号の各同一帯域毎に、帯域別チャネル間の音響信号パラメータ値差を検出する帯域別チャネル間パラメータ値差検出部と、
上記各帯域の帯域別チャネル間パラメータ値差に基づき、その帯域の上記帯域分割された各出力チャネル信号のいずれがいずれの音源から入力された信号であるかをしきい値を用いて判定する音源信号判定部と、
上記音源信号判定部の判定に基づき、上記帯域分割された各出力チャネル信号から、同一音源から入力された信号を少なくとも一つ選択する音源信号選択部と、
上記音源信号選択部で同一音源からの信号として選択された複数の帯域信号を音源信号として合成する音源合成部とを備える音源分離装置において、
上記出力チャネル信号が目的音源信号と雑音信号が混ざった混合信号であるか、雑音信号であるかを判別する有音判定部と、
上記有音判定部の判別信号により、上記混合信号のチャネル間の音響信号パラメータ値差と上記雑音信号のチャネル間の音響信号パラメータ値差を格納保持するパラメータ値差保持部と、
上記保持された混合信号のチャネル間の音響信号パラメータ値差と、上記雑音信号のチャネル間の音響信号パラメータ値差に基づき上記しきい値を求めるしきい値決定部と
を備えることを特徴とする音源分離装置。 - 請求項1〜4のいずれかに記載した音源分離方法の各過程をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003126554A JP3778358B2 (ja) | 2003-05-01 | 2003-05-01 | 音源分離方法、その装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003126554A JP3778358B2 (ja) | 2003-05-01 | 2003-05-01 | 音源分離方法、その装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004336202A JP2004336202A (ja) | 2004-11-25 |
JP3778358B2 true JP3778358B2 (ja) | 2006-05-24 |
Family
ID=33503447
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003126554A Expired - Lifetime JP3778358B2 (ja) | 2003-05-01 | 2003-05-01 | 音源分離方法、その装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3778358B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2390857C2 (ru) * | 2004-04-05 | 2010-05-27 | Конинклейке Филипс Электроникс Н.В. | Многоканальный кодировщик |
CN114966547B (zh) * | 2022-05-18 | 2023-05-12 | 珠海视熙科技有限公司 | 一种提高声源定位精度的补偿方法、系统及装置 |
-
2003
- 2003-05-01 JP JP2003126554A patent/JP3778358B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2004336202A (ja) | 2004-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8306236B2 (en) | Sound field measuring apparatus and sound field measuring method | |
US8238569B2 (en) | Method, medium, and apparatus for extracting target sound from mixed sound | |
US8229129B2 (en) | Method, medium, and apparatus for extracting target sound from mixed sound | |
US20080312918A1 (en) | Voice performance evaluation system and method for long-distance voice recognition | |
JP5985108B2 (ja) | マイクロフォンの位置を決定するための方法及び機器 | |
US20090232318A1 (en) | Output correcting device and method, and loudspeaker output correcting device and method | |
JP2007219479A (ja) | 音源分離装置、音源分離プログラム及び音源分離方法 | |
CN107409256B (zh) | 声场校正装置、声场校正方法和计算机可读介质 | |
JP4184420B2 (ja) | 特性測定装置及び特性測定プログラム | |
JP3778358B2 (ja) | 音源分離方法、その装置及びプログラム | |
JP4613966B2 (ja) | 音量調整装置及び音量調整プログラム | |
JP3716918B2 (ja) | 収音装置、方法及びプログラム、記録媒体 | |
CN112530450A (zh) | 频域中的样本精度延迟识别 | |
US20110202339A1 (en) | Speech sound detection apparatus | |
JP2004279525A (ja) | 音場制御システム及び音場制御方法 | |
US11026038B2 (en) | Method and apparatus for audio signal equalization | |
JP2004012151A (ja) | 音源方向推定装置 | |
CN115066912B (zh) | 用于通过装置进行音频渲染的方法、装置和非暂时性计算机可读介质 | |
JP7435948B2 (ja) | 収音装置、収音方法及び収音プログラム | |
JP6105861B2 (ja) | 音響処理装置および音響処理方法 | |
JP2006196940A (ja) | 音像定位制御装置 | |
JP2015049470A (ja) | 信号処理装置及びそのプログラム | |
JP7020955B2 (ja) | 音場補正装置、音場補正方法及び音場補正プログラム | |
JP2006319786A (ja) | 音場測定装置及び音場測定方法 | |
CN119743701A (zh) | 滤波器参数的确定方法、音频信号的处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060207 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060222 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3778358 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090310 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100310 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110310 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110310 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120310 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130310 Year of fee payment: 7 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |