JP2008135933A - 音声強調処理システム - Google Patents
音声強調処理システム Download PDFInfo
- Publication number
- JP2008135933A JP2008135933A JP2006320101A JP2006320101A JP2008135933A JP 2008135933 A JP2008135933 A JP 2008135933A JP 2006320101 A JP2006320101 A JP 2006320101A JP 2006320101 A JP2006320101 A JP 2006320101A JP 2008135933 A JP2008135933 A JP 2008135933A
- Authority
- JP
- Japan
- Prior art keywords
- frequency band
- sound source
- source
- target sound
- processing system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【課題】
観測された混合信号(複数の音源信号)から正面方向に存在するターゲット音源信号を抽出する音声強調処理システムを提供する。
【解決手段】
複数の音源から発生される音響信号を左右両受信部から入力する信号収音手段101と、入力した左右2入力信号を周波数帯域ごとに分割して左右2入力信号の周波数帯域成分を求める信号変換手段102と、前記周波数帯域成分から求めたコヒーレンス成分と前記周波数帯域成分から求めた両耳間レベル差(ILD)とを用いてターゲット音源を同定する音源同定手段103と、前記周波数帯域成分からノイズ源を同定するノイズ源同定手段104と、前記音源同定手段で求めたターゲット音源と、前記ノイズ源同定手段で求めたノイズ源とに基づき、周波数帯域毎にターゲット音源を抽出する音源抽出手段105とを備え、従来の手法以上にターゲット音源を良好に分離・強調することを可能にする。
【選択図】図1
観測された混合信号(複数の音源信号)から正面方向に存在するターゲット音源信号を抽出する音声強調処理システムを提供する。
【解決手段】
複数の音源から発生される音響信号を左右両受信部から入力する信号収音手段101と、入力した左右2入力信号を周波数帯域ごとに分割して左右2入力信号の周波数帯域成分を求める信号変換手段102と、前記周波数帯域成分から求めたコヒーレンス成分と前記周波数帯域成分から求めた両耳間レベル差(ILD)とを用いてターゲット音源を同定する音源同定手段103と、前記周波数帯域成分からノイズ源を同定するノイズ源同定手段104と、前記音源同定手段で求めたターゲット音源と、前記ノイズ源同定手段で求めたノイズ源とに基づき、周波数帯域毎にターゲット音源を抽出する音源抽出手段105とを備え、従来の手法以上にターゲット音源を良好に分離・強調することを可能にする。
【選択図】図1
Description
本発明は、観測された混合信号(複数の音源)から正面方向に存在するターゲット音源信号を抽出する技術に関するものである。
近年、独立成分分析(ICA: Independent Component Analysis)に基づく音源分離法として、ブラインド音源分離(BBS: Blind Source Separation)や適応型ビームフォーマ(ABF: Adaptive Beamformer)などの手法が研究されている。
また広周波数帯域での音源分離を行う両耳聴モデルとして、両耳間レベル差および両耳間位相差を用いた周波数領域両耳聴モデル(FDBM:Frequency Domain Binaural Model)が提案されている。このFDBMは、低周波数領域の信号に対しては、両耳間位相差を用い、高周波数領域の信号に対しては、両耳間レベル差を用いることによって音源の到来方向を推定する。得られた推定結果に基づき、特定方向の音源のみをフィルタリングにより分離するため、広周波数帯域での音源方向の推定精度が改善され、また分離性能が改善されている。しかしながら、この方法における音源方向の推定は、仰角が0°、すなわち水平面について推定するものであり、仰角がある音源方向を判定しようとすると、両耳間の位相差、レベル差が等しい点がいくつか空間上に存在するため、方向の推定は出来ないという問題が残っていた。
特許文献1では、この問題を解決するために、上下に存在する複数の音源から特定の音響信号を分離するシステムを提示している。このシステムは、複数の音源から発生される音響信号を左右両受音部から入力する手段と、左右両入力信号を周波数帯域ごとに分割する手段と、左右両入力信号のクロススペクトルから周波数帯域ごとの両耳間位相差(IPD)、パワースペクトルのレベル差から両耳間レベル差(ILD)を求める手段と、全周波数帯域で、IPD及び/またはILDと、データベースのそれとを比較することにより各周波数帯域ごとに音源方向の候補を推定する手段と、上記の各周波数帯域ごとに得られた音源方向のうち出現頻度が高い方向を音源方向と推定する手段と、上記より推定された音源方向情報をもとに、特定音源方向の周波数帯域を主として抽出することにより音源を分離する手段とを備え、2入力システムにより複数の音源から特定の音響信号を分離することが可能となり、さらに方位角と仰角を有する音源を分離することが可能としている。
しかしながら、従来の方法では、特に反射音が存在する環境や、周囲に非定常/定常騒音源が多数あるような環境では、音源分離の精度が向上しないという問題点がある。
本発明は、2入力を用いて抽出したい音源と抑制したいノイズ源を同定し、時間−周波数平面上で両者のS/N比を比較して抽出音源を強調することで、ターゲット音源を良好に分離・強調するシステムを提供することを目的とする。
上記目的を達成するため、請求項1に記載の音声強調処理システムは、観測された混合信号から正面方向に存在するターゲット音源信号を抽出する音声強調処理システムであって、複数の音源から発生される音響信号を左右両受信部から入力する信号収音手段と、入力した左右2入力信号を周波数帯域毎に分割して左右2入力信号の周波数帯域成分を求める信号変換手段と、前記周波数帯域成分から求めたコヒーレンス成分と前記周波数帯域成分から求めた両耳間レベル差(ILD) とに基づき、ターゲット音源を同定する音源同定手段と、前記周波数帯域成分からノイズ源を同定するノイズ源同定手段と、前記音源同定手段で求めたターゲット音源と、前記ノイズ源同定手段で求めたノイズ源とに基づき、周波数帯域毎にターゲット音源を抽出する音源抽出手段と、を備えたことを特徴とする。
請求項2に記載の音声強調処理システムは、前記音源同定手段が、前記周波数帯域成分からコヒーレンス関数を用いてコヒーレンス成分の実数部(RealCoh)を求める手段と、前記周波数帯域成分から両耳間の音圧レベル差(ILD)を求める手段と、周波数帯域毎のRealCoh値とILD値とに基づき予め設定された条件式を用いて周波数帯域毎のターゲット音源の有無(SAPCohILD)を導出する手段とを備えたことを特徴とする。
請求項3に記載の音声強調処理システムは、前記周波数帯域成分から周波数帯域毎のノイズ比を算出し、その値と予め設定された指標値とを比較することにより周波数帯域毎のノイズ源の有無(SAPNOR)を導出する手段とを備えたことを特徴とする。
請求項4に記載の音声強調処理システムは、前記音源同定手段で求めた周波数帯域毎のSAPCohILD値と、前記ノイズ源同定手段で求めたSAPNOR値とに基づき周波数帯域毎のターゲット音源の有無(SAPSNR)を導出することにより周波数帯域毎にターゲット音源を抽出する手段を備えたことを特徴とする。
請求項5に記載の音声強調処理システムは、前記音源抽出手段が、周波数帯域毎のS/N比を算出して、その値と予め設定された指標値とを比較することにより周波数帯域毎のターゲット音源の有無(SAPSNR)を導出することにより周波数帯域毎にターゲット音源を抽出する手段を備えたことを特徴とする。
請求項1に係る発明によれば、左右2入力信号間の周波数帯域成分からコヒーレンス成分の実数部(RealCoh)と両耳間レベル差(ILD)とを求めてターゲット音源を同定するとともに、左右2入力信号間の周波数帯域成分からノイズ源を同定することで、周波数帯域毎に正面方向のターゲット音源を同定することができ、従来の手法以上にターゲット音源を良好に分離・強調することが可能になる。特に、反射音が存在するような環境においても効果がある。
請求項2に係る発明によれば、周波数帯域毎にターゲット音源の有無を同定することが可能になる。
請求項3に係る発明によれば、周波数帯域毎にノイズ源の有無を同定することが可能になる。
請求項4または請求項5に係る発明によれば、音源同定手段で求めたターゲット音源と、ノイズ源同定手段で求めたノイズ源とに基づき、周波数帯域毎にターゲット音源を抽出することで、従来の手法以上にターゲット音源を良好に分離・強調することが可能になる。
次に、本発明の実施の形態に係る音声強調処理システムについて図面に基づいて説明する。なお、この実施の形態により本発明が限定されるものではない。
図1は、本発明の実施の形態に係る音声強調処理システムの構成を示す図である。図1に示すように、音声強調処理システムは、観測された混合信号から正面方向に存在するターゲット音源信号を抽出する音声強調処理システムであって、複数の音源から発生される音響信号を左右両受信部から入力する信号収音手段11と、入力した左右2入力信号を周波数帯域毎に分割して左右2入力信号の周波数帯域成分を求める信号変換手段12と、前記周波数帯域成分から求めたコヒーレンス成分と前記周波数帯域成分から求めた両耳間レベル差(ILD)とを用いてターゲット音源を同定する音源同定手段13と、前記周波数帯域成分からノイズ源を同定するノイズ源同定手段14と、前記音源同定手段で求めたターゲット音源と、前記ノイズ源同定手段で求めたノイズ源とに基づき、周波数帯域毎にターゲット音源を抽出する音源抽出手段15と、を備えている。
信号収音手段11は、複数の音源から発生される音響空間において、左右両受信部からターゲット音源Sとノイズ源Ni( i:ノイズ源の個数)とが混合された音響信号を受信する。
信号変換手段12は、信号収音手段11で入力した左右2入力信号をそれぞれFFT(Fast Fourier Transform)を用いて周波数帯域毎に分割して左右2入力信号の周波数帯域成分を求める。
音源同定手段13は、信号変換手段12で求めた周波数帯域成分からコヒーレンス関数( coherence function )を用いてコヒーレンス成分の実数部(RealCoh)を求める手段Aと、前記周波数帯域成分から両耳間の音圧レベル差(ILD)を求める手段Bと、周波数帯域毎のRealCoh値とILD値とに基づき予め設定された条件式を用いて周波数帯域毎のターゲット音源の有無(SAPCohILD)を導出する手段Cとを有する。
手段Aでは、コヒーレンス関数は式(1)で定義され、その実数部は式(2)で求められる。ここで、XLは左側入力信号の周波数帯域成分、XRは右側入力信号の周波数帯域成分、XR *はXRの共役複素数、kは周波数、lは時間を表す。
図2は、実験により全ての周波数帯域で得られたコヒーレンス関数の実数部(RealCoh)を平均化して表したものである。この実験結果から、実数部(RealCoh)は、正面方向からの信号に対しては大きな値(例えばRealCoh ≧0.9)となり、その他の方向からの信号に対しては小さな値(例えばRealCoh ≦0.2)となることがわかる。したがって、この実数部(RealCoh)を用いて、正面方向のターゲット音源と、その他の方向のノイズ源とを分別できることが導き出される。
しかしながら、この実数部(RealCoh)には周期性があり、正面方向以外の信号についても周波数によっては大きな値を有する場合がある。図3に、実験により全ての周波数帯域で得られたコヒーレンス関数の実数部(RealCoh)を表したものを示す。したがって、手段Aだけを用いて、全ての周波数帯域で正面方向のターゲット音源を抽出できるとは限らないことがわかる。
次に手段Bについて説明する。手段Bでは、左側入力信号の周波数帯域成分XLおよび右側入力信号の周波数帯域成分XRが式(3)で定義され、これを用いて両耳間の音圧レベル差(ILD)を求める。音圧レベル差(ILD)は式(4)で求められる。ここで、HLは音源から左耳までの伝達関数、HRは音源から右耳までの伝達関数、Sは音源を表す。
数式(4)から、両耳間の音圧レベル差(ILD)は、全ての周波数帯域において、正面方向からの信号に対して小さな値となり、その他の方向からの信号に対して大きな値となることが導き出される。
次に手段Cについて説明する。手段Cでは、手段Aで求めた周波数帯域毎のRealCoh値と、手段B で求めた周波数帯域毎のILD値とに基づき、予め設定された条件式を用いて周波数帯域毎のターゲット音源の有無(SAPCohILD)を導出する。SAPCohILD値は式(5)’により求められる。SAPCohILD値を用いて式(5)により周波数帯域毎にターゲット音源SL 、SRを求める。ここで、SLは左側入力信号の周波数帯域成分XLから求めるものであり、SRは右側入力信号の周波数帯域成分XRから求めるものである。
式(5)’において、T1 、T2 、P1 、P2 は予め設定された閾値である。式(5)’から、RealCoh値が閾値T1より大きく、且つILD値が閾値P1より小さい場合は、SAPCohILD値が1に設定され、RealCoh値が閾値T2より小さく、且つILD値が閾値P2より大きい場合は、SAPCohILD値が0に設定され、その他の場合は補完処理が行われ、SAPCohILD値として0と1の間の数値が設定される(例えば、0.2 or 0.5 or 0.8)。
次にノイズ源同定手段14について説明する。ノイズ源同定手段14は、信号変換手段12で求めた周波数帯域成分から周波数帯域毎のノイズ比率を算出し、その値と予め設定された指標値とを比較することにより周波数帯域毎のノイズ源の有無(SAPNOR)を導出する。
ここで、ノイズ比率を算出には従来の手法を用いる。従来の手法として、遅延和アレイを用いる手法やRoman’s Algorithmなどがある。
ここで、ノイズ比率を算出には従来の手法を用いる。従来の手法として、遅延和アレイを用いる手法やRoman’s Algorithmなどがある。
遅延和アレイを用いる手法は、マイクロホンの受信信号に適切な遅延を与えることで目的音成分を同相化(位相を揃えること)して目的音を強調する手法であり、ノイズ源同定手段14では、正面方向の音源を抽出するため、遅延が0の条件で左側入力信号の周波数帯域成分XLと右側入力信号の周波数帯域成分XRとの差分Z( = XL−XR)を算出し、式(6)によりノイズ比率OIR(w,t)を求める。ここでY1にはXLまたはXRを用いる。
またRoman’s Algorithmについて、図4にそのアルゴリズムを示す。この手法では、適応フィルタWを用いて、式(6)によりノイズ比率OIR(w,t)を求める。
式(6)により求めたノイズ比率OIR(w,t)と予め設定された指標値とを比較することにより周波数帯域毎のノイズ源の有無(SAPNOR)を導出する。指標値として−6dBを設定した場合の例を式(7)に示す。
式(7)から、ノイズ比率OIR(w,t)が-6dBより大きい場合にはSAPNOR値が0に設定され、その他の場合はSAPNOR値が1に設定される。
次に音源抽出手段15について説明する。音源抽出手段15は、周波数帯域毎のSAPCohILD値とSAPNOR値とに基づき周波数帯域毎のターゲット音源の有無(SAPSNR)を導出することにより周波数帯域毎にターゲット音源を抽出する手段Dと、周波数帯域毎のS/N比を算出して、その値と予め設定された指標値とを比較することにより周波数帯域毎のターゲット音源の有無(SAPSNR)を導出することにより周波数帯域毎にターゲット音源を抽出する手段Eとを有する。
手段Dでは、音源同定手段13で求めた周波数帯域毎のSAPCohILD値と、ノイズ源同定手段14で求めた周波数帯域毎のSAPNOR値とを比較し、周波数帯域毎にターゲット音源の有無(SAPSNR)を導出する。ここでは、
・“SAPCohILD値 = 1” and “SAPNOR値 = 0” の場合、SAPSNR値 = 1
・“SAPCohILD値 = 0” and “SAPNOR値 = 1” の場合、SAPSNR値 = 0
に設定する。上記以外の場合には、手段Eを用いてSAPSNR値を導出する。
・“SAPCohILD値 = 1” and “SAPNOR値 = 0” の場合、SAPSNR値 = 1
・“SAPCohILD値 = 0” and “SAPNOR値 = 1” の場合、SAPSNR値 = 0
に設定する。上記以外の場合には、手段Eを用いてSAPSNR値を導出する。
式(9)から、SNR(w,t)が閾値T3より小さい場合にはSAPSNR値が0に設定され、その他の場合はSAPSNR値が1に設定される。
音源抽出手段15では、上記で説明した手段Dおよび手段Eで求めたSAPSNR値に基づき、式(10)を用いて周波数帯域毎にターゲット音源SL 、SRを求める。ここで、SLは左側入力信号の周波数帯域成分XLから求めるものであり、SRは右側入力信号の周波数帯域成分XRから求めるものである。
次に、本発明の音声強調処理システムと、他の従来手法を用いたシステムとの比較実験結果について説明する。ここでは、次の3つの条件で実験を行った結果を図5、及び図6に示す。
(1)ターゲット音源:正面方向、40 sentences
ノイズ源(1個) :60度方向、40 sentences
(2)ターゲット音源:正面方向、40 sentences
ノイズ源(2個) :60度方向&−60度方向、40 sentences
(3)ターゲット音源:正面方向、40 sentences
ノイズ源(3個) :60度方向&−60度方向&30度方向、40 sentences
(1)ターゲット音源:正面方向、40 sentences
ノイズ源(1個) :60度方向、40 sentences
(2)ターゲット音源:正面方向、40 sentences
ノイズ源(2個) :60度方向&−60度方向、40 sentences
(3)ターゲット音源:正面方向、40 sentences
ノイズ源(3個) :60度方向&−60度方向&30度方向、40 sentences
図5は、それぞれのシステムにおけるS/N比を示したものであり、図6は、歪み度を示したものである。図5、及び図6の凡例において、FDBM、Romanが従来手法の結果を示すものであり、CohILDが本発明において音源同定手段13で求めたターゲット音源の有無(SAPCohILD)を用いた場合(中間段階)の結果を示すものであり、CohAndBFが本発明による結果を示すものである。
図5から、上記3条件において、本発明のシステムは、他のシステムと比べて、高いS/N比を得ることができることが実証された。また図6から、上記3条件において、本発明のシステムは、他のシステムと比べて、歪み度が少ないことが実証された。
以上から、本発明のシステムは、従来手法以上に、ターゲット音源を良好に分離・強調することが可能になることが実証された。
以上から、本発明のシステムは、従来手法以上に、ターゲット音源を良好に分離・強調することが可能になることが実証された。
11 信号収音手段
12 信号変換手段
13 音源同定手段
14 ノイズ源同定手段
15 音源抽出手段
12 信号変換手段
13 音源同定手段
14 ノイズ源同定手段
15 音源抽出手段
Claims (5)
- 観測された混合信号から正面方向に存在するターゲット音源信号を抽出する音声強調処理システムであって、複数の音源から発生される音響信号を左右両受信部から入力する信号収音手段と、入力した左右2入力信号を周波数帯域毎に分割して左右2入力信号の周波数帯域成分を求める信号変換手段と、前記周波数帯域成分から求めたコヒーレンス成分と前記周波数帯域成分から求めた両耳間レベル差(ILD) とに基づき、ターゲット音源を同定する音源同定手段と、前記周波数帯域成分からノイズ源を同定するノイズ源同定手段と、前記音源同定手段で求めたターゲット音源と前記ノイズ源同定手段で求めたノイズ源とに基づき、周波数帯域毎にターゲット音源を抽出する音源抽出手段と、を備えたことを特徴とする音声強調処理システム。
- 前記音源同定手段は、前記周波数帯域成分からコヒーレンス関数を用いてコヒーレンス成分の実数部(RealCoh)を求める手段と、前記周波数帯域成分から両耳間の音圧レベル差(ILD)を求める手段と、周波数帯域毎のRealCoh値とILD値とに基づき予め設定された条件式を用いて周波数帯域毎のターゲット音源の有無(SAPCohILD)を導出する手段とを備えたことを特徴とする請求項1に記載の音声強調処理システム。
- 前記ノイズ源同定手段は、前記周波数帯域成分から周波数帯域毎のノイズ比を算出し、その値と予め設定された指標値とを比較することにより周波数帯域毎のノイズ源の有無(SAPNOR)を導出する手段とを備えたことを特徴とする請求項1に記載の音声強調処理システム。
- 前記音源抽出手段は、前記音源同定手段で求めた周波数帯域毎のSAPCohILD値と、前記ノイズ源同定手段で求めたSAPNOR値とに基づき周波数帯域毎のターゲット音源の有無(SAPSNR)を導出することにより周波数帯域毎にターゲット音源を抽出する手段を備えたことを特徴とする請求項1に記載の音声強調処理システム。
- 前記音源抽出手段は、周波数帯域毎のS/N比を算出して、その値と予め設定された指標値とを比較することにより周波数帯域毎のターゲット音源の有無(SAPSNR)を導出することにより周波数帯域毎にターゲット音源を抽出する手段を備えたことを特徴とする請求項1に記載の音声強調処理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006320101A JP2008135933A (ja) | 2006-11-28 | 2006-11-28 | 音声強調処理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006320101A JP2008135933A (ja) | 2006-11-28 | 2006-11-28 | 音声強調処理システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008135933A true JP2008135933A (ja) | 2008-06-12 |
Family
ID=39560474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006320101A Pending JP2008135933A (ja) | 2006-11-28 | 2006-11-28 | 音声強調処理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008135933A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011527025A (ja) * | 2008-06-30 | 2011-10-20 | オーディエンス,インコーポレイテッド | ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法 |
JP2013125085A (ja) * | 2011-12-13 | 2013-06-24 | Oki Electric Ind Co Ltd | 目的音抽出装置及び目的音抽出プログラム |
US9384753B2 (en) | 2010-08-30 | 2016-07-05 | Samsung Electronics Co., Ltd. | Sound outputting apparatus and method of controlling the same |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
US9799330B2 (en) | 2014-08-28 | 2017-10-24 | Knowles Electronics, Llc | Multi-sourced noise suppression |
US9830899B1 (en) | 2006-05-25 | 2017-11-28 | Knowles Electronics, Llc | Adaptive noise cancellation |
JP2018036442A (ja) * | 2016-08-30 | 2018-03-08 | 富士通株式会社 | 音声処理プログラム、音声処理方法及び音声処理装置 |
-
2006
- 2006-11-28 JP JP2006320101A patent/JP2008135933A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9830899B1 (en) | 2006-05-25 | 2017-11-28 | Knowles Electronics, Llc | Adaptive noise cancellation |
JP2011527025A (ja) * | 2008-06-30 | 2011-10-20 | オーディエンス,インコーポレイテッド | ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法 |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US9384753B2 (en) | 2010-08-30 | 2016-07-05 | Samsung Electronics Co., Ltd. | Sound outputting apparatus and method of controlling the same |
JP2013125085A (ja) * | 2011-12-13 | 2013-06-24 | Oki Electric Ind Co Ltd | 目的音抽出装置及び目的音抽出プログラム |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
US9799330B2 (en) | 2014-08-28 | 2017-10-24 | Knowles Electronics, Llc | Multi-sourced noise suppression |
JP2018036442A (ja) * | 2016-08-30 | 2018-03-08 | 富士通株式会社 | 音声処理プログラム、音声処理方法及び音声処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008135933A (ja) | 音声強調処理システム | |
US9286908B2 (en) | Method and system for noise reduction | |
JP4906908B2 (ja) | 目的音声抽出方法、目的音声抽出装置、及び目的音声抽出プログラム | |
CN109817234B (zh) | 基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质 | |
CN110706719B (zh) | 一种语音提取方法、装置、电子设备及存储介质 | |
JP5375400B2 (ja) | 音声処理装置、音声処理方法およびプログラム | |
CN106504763A (zh) | 基于盲源分离与谱减法的麦克风阵列多目标语音增强方法 | |
JP4816711B2 (ja) | 通話音声処理装置および通話音声処理方法 | |
JP4521549B2 (ja) | 上下、左右方向の複数の音源の分離方法、そのためのシステム | |
CN105469807B (zh) | 一种多基频提取方法及装置 | |
JP2010112996A (ja) | 音声処理装置、音声処理方法およびプログラム | |
JP5605574B2 (ja) | 多チャンネル音響信号処理方法、そのシステム及びプログラム | |
JP6225245B2 (ja) | 信号処理装置、方法及びプログラム | |
JP6348427B2 (ja) | 雑音除去装置及び雑音除去プログラム | |
JP6436180B2 (ja) | 収音装置、プログラム及び方法 | |
JP2016163135A (ja) | 収音装置、プログラム及び方法 | |
KR20120020527A (ko) | 음원출력장치 및 이를 제어하는 방법 | |
JP2007047427A (ja) | 音声処理装置 | |
JP6241520B1 (ja) | 収音装置、プログラム及び方法 | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
JP6631127B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声処理装置 | |
JP6065029B2 (ja) | 収音装置、プログラム及び方法 | |
JP6106618B2 (ja) | 音声区間検出装置、音声認識装置、その方法、及びプログラム | |
KR101096091B1 (ko) | 음성 분리 장치 및 이를 이용한 단일 채널 음성 분리 방법 | |
Zeng et al. | Low-complexity Multi-Channel Speaker Extraction with Pure Speech Cues |