JP3847989B2 - Signal extraction device - Google Patents
Signal extraction device Download PDFInfo
- Publication number
- JP3847989B2 JP3847989B2 JP34806498A JP34806498A JP3847989B2 JP 3847989 B2 JP3847989 B2 JP 3847989B2 JP 34806498 A JP34806498 A JP 34806498A JP 34806498 A JP34806498 A JP 34806498A JP 3847989 B2 JP3847989 B2 JP 3847989B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sample
- samples
- adaptive filter
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Filters That Use Time-Delay Elements (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、音声信号を収音する場合に、なんらかの事情で、不必要な音響信号が混入して収音された場合、収音された信号から、所望の音声信号のみをリアルタイムで抽出する信号抽出方法および装置ならびに信号抽出プログラムを記録した媒体に関する。
【0002】
【従来の技術】
従来の雑音除去手法としては、以下に説明する、いわゆる1入力法と2入力法の手法が知られている。
まず、1入力法の手法としては、例えば、文献 S.F.Boll,“Suppression of Acoustic Noise in Speech Using Spectral Subtraction”IEEE trans., Vol. ASSP-27, No.2, pp.113-120, April(1979)に記載のスペクトルサブトラクション法を挙げることができる。この手法は、既知のあるいは無音区間から推定される雑音の短時間パワースペクトルを入力信号のスペクトルから差し引くことにより、所望の音声信号の短時間振幅スペクトルを得る手法である。
【0003】
次に、2入力法の手法としては、例えば、文献 B. Widrow et al.,“ Adaptive Noise Cancelling : Principles and Applications”,Proc.IEEE, Vol. 63, No.12, pp.1692-1716(1975)に記載の適応信号処理手法が挙げられる。この手法は、音声と雑音が混在する入力信号のほかに、参照信号として雑音成分のみが別に利用できる場合に、雑音の除去が可能な手法である。参照信号の収音系は、入力信号の収音系と異なるのが一般的であるため、参照信号は入力信号に含まれる雑音成分と一致せず、入力信号から音声信号を抽出するには、参照信号と入力信号に含まれる雑音成分とをできる限り一致させるためのフィルタ処理を施して差分をとることが必要である。このフィルタには一般に適応フィルタが用いられている。
【0004】
すなわち、この適応信号処理手法は適応フィルタを用いる信号処理手法であり、適応フィルタの制御アルゴリズムとして、上記文献 B. Widrow et al.,“ Adaptive Noise Cancelling : Principles and Applications”,Proc.IEEE, Vol. 63, No.12, pp.1692-1716(1975)に記載のLMS法や、文献 J. Nagumo et al.,“A Learning Method for System Identification ”,IEEE Trans., Vol.AC-12, No.3, pp. 282-287 JUNE (1967)に記載の学習同定法などがある。ここで適応フィルタとは、入力信号と出力すべき信号を与えると、適応フィルタの係数を自動的に逐次修正し、次第に希望出力に近い信号を出力するようになっていく、いわば一種の学習機能を具えたフィルタである。いずれのアルゴリズムもフィルタ出力と入力との差分をフィルタにフィードバックしてフィルタ係数の値を収束させていくアルゴリズムであり、学習同定法は差分値を正規化している点でLMS法と異なっている。LMS法は単純で計算量が少なく、そのため、装置化も簡単であるという利点がある一方、差分を正規化していないため、入力信号振幅への依存性が大きく、収束が緩やかで速やかな適応を必要とする用途には不向きである。一方、学習同定法はLMS法の改良版であり、正規化するための計算量は多少増加するが、収束はLMS法よりはるかに速い。
【0005】
【発明が解決しようとする課題】
放送、特に報道関連で現場から持ち込まれる素材は、誘拐事件の犯人の声、飛行機のコックピット内の会話音声などSN比が悪く、しかもほとんどの場合、参照信号のない1入力信号の形態である。
緊急を要する場合には、このような信号を対象にリアルタイムで雑音を除去するニーズが生まれるが、次に述べるように、従来技術ではこのような要求に応えることはできなかった。
【0006】
従来技術としてのスペクトルサブトラクション法では、あらかじめ識別した無音区間を切り出してこれを用いて雑音を除去している。従って、雑音成分が時間的に変動する場合については、その都度、無音区間の検出をやりなおすなど、リアルタイム処理に対する適応性が乏しい。すなわち、従来の1入力法では、パラメータの適応的な調整ができず、時々刻々と変化する1チャンネルの入力信号に対し、所望の信号成分のみを時間的に追従しながらフィルタリングすることは困難である。
【0007】
また、上述の2入力法の適応信号処理手法では、リアルタイム処理することはできても、このケースでは音声と雑音の混合された1チャンネルの信号しか与えられていないから用いることができない。すなわち、適応信号処理により、時間的な追随をしようとすると、参照信号として、雑音成分のみの信号が必要である。
【0008】
このように、1入力信号形態の場合で雑音成分が時間的に変動するときにも対応可能な雑音除去装置、さらには聴感上最も聴きとりやすい状態になるよう、効果を確認しながらリアルタイムにパラメータの調整ができる装置の開発が望まれる。
【0009】
そこで、本発明の目的は、音声信号と非音声信号が混合された1チャンネルの信号から、リアルタイムにパラメータを調整して音声信号成分のみを抽出することができる方法および装置ならびに信号抽出プログラムを記録した媒体を提供することにある。
【0010】
【課題を解決するための手段】
上記目的を達成するために、本発明では、従来の2入力法で用いられている適応信号処理手法をそのまま用いることを基本とし、音声信号と非音声信号とでは、時間的な相関の性質が異なることに着目して、聴感により判断できる非音声信号の内容に応じて、必要な参照信号として入力信号を一定時間ずらした信号を用いるようにし、さらにそれに加えて、高域強調した信号を入力信号として用いるようにしている。
【0011】
前者(必要な参照信号として入力信号を一定時間ずらした信号を用いる方法)は、楽音と音声とでは楽音の方が時間的な相関が高いことを利用して、入力信号が楽音と音声の場合に適応フィルタ処理により、時間的相関が高い楽音成分を抽出してこれを入力信号から減じて、より相関の低い音声を抽出しようとする考えに基づくものである。
【0012】
後者(前者に加えて、高域強調した信号を入力信号として用いる方法)は、雑音と音声では音声の方が時間的な相関が高いことを利用して、より時間的相関の高い音声成分を適応フィルタ処理により抽出するとともに、予め高域強調した信号を入力信号として用いることにより、高域成分が少ない音声の高域強調をも同時に達成しようとするものである。
【0013】
また、いずれの場合においても、適応フィルタの係数を収束速度を制御しながら逐次更新することにより、時々刻々変化する1チャンネルの入力信号に対し、所望の信号成分のみを時間的に追随しながらフィルタリングすることを可能としている。
【0014】
さらに言えば、前者では、入力信号とそれを所定時間遅延させた信号とから適応フィルタ処理により、時間的相関がより高い成分を抽出してこれを入力信号から減算するようにし、また、後者では、入力信号を高域強調処理して得られた出力信号と入力信号を所定時間遅延させた信号とから適応フィルタ処理によりマッチドフィルタの係数をリアルタイムで決定する系統と、決定したフィルタ係数に基づき、入力信号をフィルタ処理して出力する系統とを設け、入力信号を所定時間遅延させる遅延回路の遅延時間、一次元適応フィルタのタップ数、収束係数、および後者の場合にあっては高域強調信号ゲインを聴感上最も聴き取りやすいように、それぞれリアルタイムに調整できるようにしたことに特徴がある。
【0017】
すなわち、本発明は、時間的相関の低い所望信号と時間的相関の高い非所望信号とが混合された1チャンネルのディジタル入力信号から、前記時間的相関の低い所望信号を抽出する信号抽出装置であって、2分岐された前記ディジタル入力信号の一方の信号であってサンプル数Nの遅延が施された信号が入力され、1サンプル間隔で指定されたタップ数kからなり、フィルタ係数ベクトルが逐次更新される適応フィルタと、前記適応フィルタの出力信号を、2分岐されたディジタル入力信号の他方の信号から減算し、減算結果を前記時間的相関の低い所望信号として出力する減算手段と、前記減算手段からの出力信号と前記適応フィルタの各タップからの出力信号を用いて、
【数5】
W j :適応フィルタのフィルタ係数ベクトル
μ:収束係数
e j :減算手段の出力信号(所望信号)
X j :適応フィルタへの入力信号ベクトル
|X j |:入力信号ベクトルのノルム
を演算し、前記適応フィルタのフィルタ係数ベクトルW j を逐次更新する適応フィルタ係数逐次更新手段とを少なくとも具え、遅延された前記ディジタル入力信号の一方の信号を前記適応フィルタに入力して、
【数6】
z j :適応フィルタの出力信号
〈W j ,X j 〉:フィルタ係数ベクトルと入力信号ベクトルの内積
を演算し、演算結果である適応フィルタの出力信号z j を前記減算手段に入力して、
e j =y j −z j
y j :2分岐されたディジタル入力信号の他方の信号
を演算し、前記時間的に相関の低い所望信号e j を出力することを特徴とするものである。
【0018】
また、本発明の信号抽出装置は、前記ディジタル入力信号をFサンプル毎のブロックに分割するブロック分割手段をさらに当該装置の入力端に具えるとともに、前記2分岐されたディジタル入力信号の他方の信号が入力される前記減算手段の入力端に具える少なくともFサンプルの記憶容量を有する第1のバッファ手段であって、前記ブロック分割手段の出力信号を前記ブロック単位で順次に記憶するとともに、該記憶後に該第1のバッファ手段に記憶された該第1のバッファ手段の記憶容量に応じて予め定められた第1の所定のサンプルから数えて時間的に(F−1)サンプル前の記憶サンプルを前記2分岐されたディジタル入力信号の他方の信号として前記減算手段に入力し、前記ブロック単位の記憶に続く次のブロック単位の記憶までの間に前記第1の所定のサンプルから数えて時間的に(F−1)サンプル前の記憶サンプルから1サンプルずつ前記第1の所定のサンプル方向にずらしながら合計F個のサンプルを繰り返し前記減算手段に入力する第1のバッファ手段と、サンプル数Nの遅延を兼ねる少なくとも(N+k+F)サンプルの記憶容量を有する第2のバッファ手段であって、前記ブロック分割手段の出力信号を前記ブロック単位に順次に記憶するとともに、該記憶後に前記第1の所定のサンプルと同一タイミングで該第2のバッファ手段に記憶された該第2のバッファ手段の記憶容量に応じて予め定められた第2の所定のサンプルから数えて時間的に(N+k+F−1)サンプル前の記憶サンプルから前記第2の所定のサンプルに向かってk個連続したサンプルの組を前記適応フィルタの各タップ出力信号として前記適応フィルタに入力し、前記ブロック単位の記憶に続く次のブロック単位の記憶までの間に前記第2の所定のサンプルから数えて時間的に(N+k+F−1)サンプル前の記憶サンプルから1サンプルずつ前記第2の所定のサンプル方向にずらしながら合計F組の前記k個連続したサンプルの組を前記第1のバッファ手段と同期して繰り返し前記適応フィルタの各タップ出力信号として前記適応フィルタに入力する第2のバッファ手段とを具えてなることを特徴とするものである。
【0019】
また、本発明の信号抽出装置は、前記遅延量のサンプル数N、前記タップ数kおよび前記収束係数μをそれぞれ制御することを特徴とするものである。
【0020】
また、本発明は、時間的相関の高い所望信号と時間的相関の低い非所望信号とが混合された1チャンネルのディジタル入力信号から、前記時間的相関の高い所望信号を抽出する信号抽出装置であって、3分岐された前記ディジタル入力信号の第1の信号が入力され、該信号に高域強調処理と指定されたゲイン倍とを施して高域強調信号を出力する高域強調手段と、3分岐された前記ディジタル入力信号の第2の信号であってサンプル数Mだけ遅延された信号が入力され、1サンプル間隔で指定されたタップ数kからなり、フィルタ係数ベクトルが逐次更新される適応フィルタと、前記適応フィルタの出力信号を、前記高域強調信号から減算する減算手段と、該減算手段からの出力信号と前記適応フィルタの各タップからの出力信号を用いて、
【数7】
W j :適応フィルタのフィルタ係数ベクトル
μ:収束係数
e j :減算手段の出力信号
X j :適応フィルタへの入力信号ベクトル
|X j |:入力信号ベクトルのノルム
を演算し、前記適応フィルタのフィルタ係数ベクトルW j を逐次更新する適応フィルタ係数逐次更新手段と、前記適応フィルタと同一構成であり、前記適応フィルタのフィルタ係数ベクトルがコピーされるマッチドフィルタとを少なくとも具え、3分岐された前記ディジタル入力信号の第3の信号であってサンプル数Lだけ遅延された信号を前記マッチドフィルタに入力して、
【数8】
q j :マッチドフィルタの出力信号
P j :マッチドフィルタへの入力信号ベクトル
〈W j ,P j 〉:フィルタ係数ベクトルと入力信号ベクトルの内積
を演算し、前記時間的に相関の高い所望信号q j を出力することを特徴とするものである。
【0021】
また、本発明の信号抽出装置は、前記高域強調手段が、入力信号を1サンプル遅延させる遅延手段と、該遅延手段の入出力信号間の差分信号を生成して出力する差分手段と、前記遅延手段の前段または前記差分手段の後段に接続された入力信号を前記ゲイン倍する乗算手段とを具えてなることを特徴とするものである。
【0022】
また、本発明の信号抽出装置は、前記ディジタル入力信号をFサンプル毎のブロックに分割するブロック分割手段をさらに当該装置の入力端に具えるとともに、前記遅延手段に代わる少なくとも(F+1)サンプルの記憶容量を有する第1のバッファ手段であって、前記ブロック分割手段の出力信号または前記ゲイン倍された前記ブロック分割手段の出力信号を前記ブロック単位に順次に記憶するとともに、該記憶後に該第1のバッファ手段に記憶された該第1のバッファ手段の記憶容量に応じて予め定められた第1の所定のサンプルから数えて時間的にFサンプル前の記憶サンプルから前記第1の所定のサンプルに向かって2個連続したサンプルの組を前記差分手段の入力信号として出力し、前記ブロック単位の記憶に続く次のブロック単位の記憶までの間に前記第1の所定のサンプルから数えて時間的にFサンプル前の記憶サンプルから1サンプルずつ前記第1の所定のサンプル方向にずらしながら合計F組の前記2個連続したサンプルの組を繰り返し前記差分手段に出力する第1のバッファ手段と、サンプル数Mの遅延を兼ねる少なくとも(M+k+F)サンプルの記憶容量を有する第2のバッファ手段であって、前記ブロック分割手段の出力信号を前記ブロック単位に順次に記憶するとともに、該記憶後に前記第1の所定のサンプルと同一タイミングで該第2のバッファ手段に記憶された該第2のバッファ手段の記憶容量に応じて予め定められた第2の所定のサンプルから数えて時間的に(M+k+F−1)サンプル前の記憶サンプルから前記第2の所定のサンプルに向かってk個連続したサンプルの組を前記適応フィルタの各タップ出力信号として前記適応フィルタに入力し、前記ブロック単位の記憶に続く次のブロック単位の記憶までの間に前記第2の所定のサンプルから数えて時間的に(M+k+F−1)サンプル前の記憶サンプルから1サンプルずつ前記第2の所定のサンプル方向にずらしながら合計F組の前記k個連続したサンプルの組を前記第1のバッファ手段と同期して繰り返し前記適応フィルタの各タップ出力信号として前記適応フィルタに入力する第2のバッファ手段と、サンプル数Lの遅延を兼ねる少なくとも(L+k+F)サンプルの記憶容量を有する第3のバッファ手段であって、前記ブロック分割手段の出力信号を前記ブロック単位に順次に記憶するとともに該記憶後に前記第1の所定のサンプルと同一タイミングで該第3のバッファ手段に記憶された該第3のバッファ手段の記憶容量に応じて予め定められた第3の所定のサンプルから数えて時間的に(L+k+F−1)サンプル前の記憶サンプルから前記第3の所定のサンプルに向かってk個連続したサンプルの組を前記マッチドフィルタの各タップ出力信号として前記マッチドフィルタに入力し、前記ブロック単位の記憶に続く次のブロック単位の記憶までの間に前記第3の所定のサンプルから数えて時間的に(L+k+F−1)サンプル前の記憶サンプルから1サンプルずつ前記第3の所定のサンプル方向にずらしながら合計F組の前記k個連続したサンプルの組を前記第1のバッファ手段と同期して繰り返し前記マッチドフィルタの各タップ出力信号として前記マッチドフィルタに入力する第3のバッファ手段とを具えてなることを特徴とするものである。
【0023】
また、本発明の信号抽出装置は、前記遅延量のサンプル数MおよびL、前記タップ数k、前記収束係数μおよび前記ゲインをそれぞれ制御できることを特徴とするものである。
【0028】
【発明の実施の形態】
以下に添付図面を参照し、発明の実施の形態に基づいて本発明を詳細に説明する。
〔第1の発明〕
図1は、時間的相関の低い所望信号(例えば、音声)と時間的相関の高い非所望信号(例えば、楽音)とが混合された1チャンネルのディジタル入力信号から、時間的相関の低い所望信号を抽出する本発明信号抽出方法に係る信号処理の手順をフローチャートで示している。
【0029】
図1において、時間的相関の低い信号(音声)と時間的相関の高い信号(楽音)とが混合された1チャンネルの信号(アナログ信号)がまず入力される(ステップS1)。この信号は、例えば、マイクロホンによって収音された楽音を含んだ音声信号である。この信号は、まず、以下に説明する適応処理のためにディジタル化される(ステップS2)。ディジタル化された信号は、図示のように2分岐され、一方はそのまま、他方のディジタル信号は指定されたサンプル数(遅延量)Nだけ遅延される(ステップS3)。これらそのままおよび遅延された信号は、図2にその一実施形態を示す適応処理回路に供給され、適応処理回路においては、以下に説明するように適応処理される(ステップS4)。
【0030】
適応処理回路は、等価回路にて図2に示すように、1サンプル間隔で指定されたタップ数kの適応フィルタ(図示の場合、トランスバーサルフィルタで構成)1、適応フィルタの係数を逐次更新する適応フィルタ係数逐次更新部2、および減算器3からなっている。
【0031】
上記の構成において、適応フィルタ1にはステップS3によって遅延された信号xj (図1参照)が供給され、そのフィルタ係数(係数ベクトル
【外1】
)は、適応フィルタ係数逐次更新部2からの出力によって逐次更新される。なお、添字jは、それが時点jのものであることを示している。適応フィルタ1の出力信号zj は、減算器3の減数端子に印加され、同減算器3の被減数端子に印加された前述のそのままの信号(以下、参照信号と言う)yj (図1参照)から減算され、同減算器3の出力が図2に示す適応処理回路の出力信号ej (図1参照)となる。
【0032】
適応フィルタ係数逐次更新部2には、適応処理回路の出力信号ej と適応フィルタ1の各タップ出力信号(入力ベクトル
【外2】
)が供給され、以下に説明する学習同定法によるアルゴリズムに基づきフィルタ係数(係数ベクトル〔外1〕)が逐次更新され出力される。
【0033】
以下では、数式等において、英字の大文字はベクトル、小文字はスカラー量をそれぞれ表すものとする。
学習同定法によるフィルタ係数の逐次更新アルゴリズムは、次の(1)式によって表される。
【数9】
ここに、
〔外2〕:適応フィルタへの入力信号ベクトル
〔外1〕:適応フィルタのフィルタ係数ベクトル
μ :収束係数
zj :適応フィルタの出力信号
yj :参照信号
ej :適応処理部の出力信号
【外3】
:係数ベクトルと入力信号ベクトルの内積
【外4】
:入力信号ベクトルのノルム
【0034】
(1)式の意味するところは、次のように説明される。
減算器3において、同減算器3の被減数端子への入力信号(参照信号)yj から適応フィルタ1の出力信号zj を減算し、その減算結果ej に、収束係数μおよび
【外5】
を乗算し、さらにフィルタ係数ベクトル〔外1〕を加算して得られたものを次の時点(j+1)におけるフィルタ係数ベクトル
【外6】
とする。なお、
【外7】
の値が0のときは〔外5〕を強制的に0とする。またフィルタ係数ベクトルの初期値
【外8】
は任意の値でよいが、一般にはゼロベクトルとすることが多い。
【0035】
また、このフィルタ係数の逐次更新は、適応フィルタの出力信号zj と参照信号yj との差分ej が小さくなるように更新が行われるが、適応フィルタの入力信号xj と参照信号yj との間にはサンプル数Nだけの時間のずれがあることから、上記差分ej が小さくなるようにフィルタ係数を決めることは、時間的相関の高い信号成分を強調するフィルタリング処理をしていることに相当する。なお、時間的相関の程度はパラメータとしての遅延量Nとタップ数kとにより制御することができる。
【0036】
さらに、逐次更新のリアルタイム処理を可能とするためにはフィルタ係数の収束が速いことが必要であり、過度のオーバーシュートが生じないように収束速度の制御をパラメータとしての収束係数μ(0≦μ≦1)により制御する。上記遅延量Nとタップ数kを含め、これらのパラメータは、図1のパラメータ制御(ステップS5)において設定することができる。
【0037】
上記パラメータ(N,k,μ)の設定は、本発明装置から得られる音声を聞きながら、聴感上、それが最も聴き取りやすくなるように人手で調整する。このとき、適応フィルタ1(図2参照)の出力信号zj は楽音のスペクトルに近い形状を有するようになる。
【0038】
図1において、D/A変換(ステップS6)および音声出力(ステップS7)の各ステップは、上述した適応処理(ステップS4)によって時間的相関の低い信号成分(音声)が強調されたデジタル信号をアナログ信号化して聴取できるようにするための手順である。
【0039】
以上、本発明中、第1の発明を図1を参照して方法の発明として説明したが、適応処理(ステップS4)を行う適応処理回路が図2に示され、そのパラメータ制御も詳細に説明されたことから、第1の発明を装置の発明として構成し得ることは明らかである。
【0040】
〔第2の発明〕
図3は、時間的相関の高い所望信号(例えば、音声)と時間的相関の低い非所望信号(例えば、雑音)とが混合された1チャンネルのディジタル入力信号から、時間的相関の高い所望信号を抽出する本発明信号抽出方法に係る信号処理の手順をフローチャートで示している。
【0041】
図3において、時間的相関の高い信号(音声)と時間的相関の低い信号(雑音)とが混合された1チャンネルの信号(アナログ信号)がまず入力される(ステップS8)。この信号は、例えば、マイクロホンによって収音された雑音を含んだ音声信号である。この信号は、図1に示される場合と同様、以下に説明する適応処理のためにディジタル化される(ステップS9)。ディジタル化された信号は、図示のように分岐され、それぞれ高域強調(ステップS10)、サンプル数(遅延量)Mだけ遅延1(ステップS11)、およびサンプル数(遅延量)Lだけ遅延2(ステップS12)される。
【0042】
図4は、ステップS10で行われる高域強調のための高域強調回路の等価回路の例を示し、入力信号の1サンプル間の差分信号を生成し、それを所定のゲインAでゲイン倍して出力する構成のものである。入力信号をゲインA倍してから差分信号を生成しても同じである。
【0043】
ステップS10で高域強調された信号yj とステップS11でサンプル数(遅延量)Mだけ遅延された信号xj は、上述の、図2と同一回路構成(ただし、出力信号が目的とする信号にならないので、出力端子は必要でない)の適応処理回路の参照信号が供給される端子と適応フィルタ1にそれぞれ供給され、ステップS13によって示される適応処理が実行される。
【0044】
この場合においても、高域強調された信号yj と適応フィルタ1の出力信号、すなわち減算器3の被減算端子に供給される信号zj との差分ej 、および適応フィルタ1の各タップ出力信号に基づいて、図2について説明したのと同様、上記差分ej が小さくなるように適応フィルタ1のフィルタ係数を学習同定法により逐次更新する。このとき、適応フィルタ1の入力信号xj と参照信号yj との間には、サンプル数Mだけの時間的ずれがあることから、差分ej が小さくなるようにフィルタ係数を決めることは、時間的相関の高い信号成分を強調するフィルタリング処理をしていることに相当する。
【0045】
なお、図3のステップS14で示すパラメータ(ゲインA、遅延量M,L、タップ数k、収束係数μ)の制御は、図1においてステップS5で説明したのと同じであるから、ここでは、その説明は省略する。ただ、図1においてなかったものとして、ゲインAは、図4に示す高域強調回路の振幅レベルを制御している。
【0046】
図3において、ステップS12においてサンプル数(遅延量)Lだけ遅延されたディジタル信号は、ステップS15において、図5に示すマッチドフィルタを用いてマッチドフィルタ処理される。マッチドフィルタの出力は、そのフィルタ係数がステップS13の適応処理によって得られた適応フィルタのフィルタ係数であるとき、時間的相関の高い信号成分(音声)qj が強調されて得られることになる。図3中、白ぬきの矢印は、ステップS13で求めた適応フィルタのフィルタ係数〔外1〕を、ステップS15のマッチドフィルタのフィルタ係数にコピーすることを示している。
【0047】
このマッチドフィルタにディジタル入力信号を供給するのに、ステップS12によってサンプル数Lだけ遅延させているのは、次の理由からである。すなわち、音声は、ある時間をかけて表現された音韻が時間的に連続して成立するので、後述するようにマッチドフィルタで所望の音声を抽出するには、その音韻終了時点において適応フィルタで決まるフィルタ係数を用いてその音韻開始時点からマッチドフィルタを制御する必要があるからで、その時間差を遅延時間Lにより制御している。これらの制御パラメータである2つの遅延回路の遅延時間M,L,高域強調信号ゲインA、適応フィルタのタップ数k、および適応信号処理アルゴリズムで用いる収束係数μは、パラメータ制御(ステップS14)で設定できるようになっている。これらパラメータ(M,L,A,k,μ)の設定は、本発明装置から得られる音声を聞きながら、その音声が、聴感上、最も聴き取りやすくなるように各制御パラメータを設定するものとする。
【0048】
ステップS15で用いられるマッチドフィルタ(図5参照)は適応処理回路中の適応フィルタと同一の構成であり、適応フィルタと同一のタップ数kのフィルタ係数を有している。そして、ステップS13で使用される適応フィルタのフィルタ係数がコピーされたフィルタ係数でフィルタリングされ、そのフィルタリングされたディジタル音声出力信号qjを出力する。すなわち、マッチドフィルタのタップ数をk、マッチドフィルタの入力信号ベクトルを
【外9】
、コピーされたマッチドフィルタの係数ベクトルを〔外1〕とするマッチドフィルタの出力信号qjは次の(2)式のように表現できる。
【数10】
【0049】
なお、この場合サンプル数Lの遅延は、前述したように、適応処理回路の出力信号とマッチドフィルタに入力されるディジタル音声信号の時間軸を調整するためのものである。
マッチドフィルタからのディジタル音声出力信号qj は、ステップS16によってアナログ信号に変換され聴取(ステップS17)される。
【0050】
以上、本発明中第2の発明も、高域強調(ステップS10)を行う高域強調回路、適応処理(ステップS13)を行う適応処理回路、およびマッチドフィルタ処理(S15)を行うマッチドフィルタが、それぞれ図面等(適応処理回路は第1の発明で使用したものと同一であり、図面は省略した)により説明され、それらのパラメータ制御についても説明されたことから、第2の発明を装置の発明として構成し得ることは明らかである。
【0051】
〔第1の発明の別の実施態様〕
第1の発明を、信号抽出プログラムを記録媒体からコンピュータに読み込むことによってソフトウェア処理で実現しようとする場合、1チャンネルのディジタル入力信号を1サンプルづつ処理していたのでは、使用するCPUによっては計算処理に時間がかかり、リアルタイム処理が困難となる可能性もある。これを解決するために、ディジタル入力信号をブロック毎に処理する方法を、以下に説明する。
【0052】
図6は、この場合のデータバッファリングの構成を示している。
本実施態様を装置として構成する場合には、ブロック分割手段、第1のバッファおよび第2のバッファが必要である。
【0053】
以下に、それら第1および第2のバッファ(メモリ)の大きさやディジタル入力信号の記憶の仕方(書き込み、読み出し)について、箇条書きで説明する。これにより、信号抽出の全過程をコンピュータ処理化することができる。
▲1▼ ディジタル入力信号は、取り込み開始からFサンプル毎のブロック(ブロックデータ)に切り出される。本実施形態では、F=256サンプルである。ブロックはどこで切ってもよい。
▲2▼ 適応フィルタのタップ数をkとする。本実施形態では、初期値としてk=128を採用する。
▲3▼ 切り出されたブロックデータを、適応処理回路の入力側に設けたバッファ1と、適応処理回路に入力するNサンプルの遅延を兼ねるバッファ2に蓄える(図1参照)。
▲4▼ このとき、バッファ1は、(k+F)個のバッファ長(サンプル個数)、また、バッファ2は、サンプル数Nの遅延を含む(N+2×k+F)のバッファ長とする。
【0054】
▲5▼ 各バッファ(バッファ1、バッファ2)の最後尾からFサンプル分の場所(図6に*で示す)にブロック内の時間的に最も後の(最も新しい)サンプルが各バッファの最後尾に格納されるように、切り出したブロックデータを格納する。
▲6▼ 各バッファに格納されたデータのアドレスを制御して各バッファの先頭の2つ目のサンプルから1サンプルずつずらして読み出して上述した第1の発明の処理を行う。このように、本実施形態によれば、メモリ上でアドレス制御を行うことにより、物理的なメモリ格納場所をシフトすることなしに、上記処理が行えるので計算時間を短縮することができ、きわめて好都合である。
【0055】
ディジタル信号の書き込み、読み出しは以下のように行う。
まず、バッファ1の先頭から2つ目のサンプルを適応処理回路の参照信号yj(図1,図2参照)とする。この参照信号に対応する適応処理回路の入力信号(ステップS3の出力信号)xjは、バッファ1の先頭の2つ目のサンプルからサンプル数Nだけ遅延したサンプルであり、適応フィルタの各タップ出力信号は、そのサンプルを先頭に、さらにkサンプル遅延したサンプルに至るk個のサンプルであるから、バッファ2の先頭の2つ目のサンプルからk個のサンプルに相当する。そこで、バッファ2の先頭の2つ目のサンプルからk個のサンプルを読み出して、適応フィルタ1(図2参照)のフィルタ係数を用いてフィルタリングを行う。このフィルタリング処理、フィルタ係数の逐次更新処理および適応フィルタの出力信号を参照信号から減算して出力する処理を各バッファの先頭の2つ目のサンプルから1サンプルずつ時間方向にずらしながら繰り返し行う。すなわち、バッファ1の先頭の2つ目のサンプルからFサンプル、バッファ2の先頭の2つ目のサンプルから(F+k−1)サンプルのデータを使い、時刻jに対応するベクトルデータから時刻j+F−1に対応するベクトルデータに至るまでF回、適応フィルタのフィルタ係数を更新しながら、次の(3)式により
【数11】
適応フィルタの出力zjを得るとともに、これを参照信号yjから減算して出力信号ejを得る処理を繰り返す。
【0056】
▲8▼ 続いてバッファ1は、最後尾からのkサンプルをFサンプル分前方へシフトする。バッファ2は、最後尾からの(k×2+N)サンプルを前方へFサンプル分シフトする。次に、各バッファの最後尾のFサンプル分に次のブロックデータを格納し、▲1▼からの処理を繰り返す。
【0057】
なお、本実施形態では、便宜上、バッファ長をバッファ1については(k+F)、バッファ2については(N+2×k+F)としたが、図6から分かるように、各バッファを同一タイミングで制御するための各バッファのバッファ長はバッファ1については少なくともF、バッファ2については少なくとも(N+k+F)だけあればよい。
【0058】
〔第2の発明の別の実施態様〕
第1の発明の別の実施態様と同様、ディジタル入力信号をブロック毎に処理することにより、信号抽出プログラムを記録媒体からコンピュータに読み込むことによるソフトウェア処理の際の処理速度を高め、リアルタイム処理が可能になるようにしたものである。
【0059】
図7は、この場合のデータバッファリングの構成を示している。
本実施態様を装置として構成する場合には、ブロック分割手段、第1のバッファおよび第2のバッファに加えて、第3のバッファが必要である。
【0060】
以下に、それら第1,第2および第3のバッファ(メモリ)の大きさやディジタル入力信号の記憶の仕方(書き込み、読み出し)について、箇条書きで説明する。これにより、信号抽出の全過程をコンピュータ処理化することができる。
▲1▼ ディジタル入力信号は、取り込み開始からFサンプル毎のブロック(ブロックデータ)に切り出される。本実施形態では、F=256サンプルである。ブロックはどこで切ってもよい。
▲2▼ 適応フィルタのタップ数をkとする。本実施形態では、初期値としてk=128を採用する。
▲3▼ 切り出されたブロックデータを、高域強調回路の入力側に設けたバッファ1、適応フィルタへ入力する遅延1を兼ねるバッファ2、およびマッチドフィルタへ入力する遅延2を兼ねるバッファ3に蓄える(図3参照)。
▲4▼ このとき、バッファ1は、(k+F)個のバッファ長(サンプル個数)、バッファ2は、サンプル数Mの遅延を含む(M+2×k+F)のバッファ長、また、バッファ3にはサンプル数Lの遅延を含む(L+2×k+F)のバッファ長とする。
【0061】
▲5▼ 各バッファ(バッファ1、バッファ2およびバッファ3)の最後尾からFサンプル分の場所(図7に*で示す)にブロック内の時間的に最も後の(最も新しい)サンプルが各バッファの最後尾に格納されるように、切り出したブロックデータを格納する。
▲6▼ 各バッファに格納されたデータのアドレスを制御して各バッファの先頭の2つ目のサンプル(バッファ1については、1つ目のサンプル)から1サンプルずつずらして読み出して上述した第2の発明の処理を行う。このように、本実施形態によれば、メモリ上でアドレス制御を行うことにより、物理的なメモリ格納場所をシフトすることなしに、上記処理が行えるので計算時間を短縮することができ、きわめて好都合である。
【0062】
ディジタル信号の書き込み、読み出しは以下のように行う。
▲7▼ まず、バッファ1の先頭から1つ目のサンプルとその1つ後のサンプルの差分をとって、これを適応処理回路の参照信号とする。この参照信号に対応する適応処理回路の入力信号(ステップS11の出力信号)xj は、バッファ1の先頭の2つ目のサンプルからサンプル数Mだけ遅延したサンプルであり、適応フィルタの各タップ出力信号は、そのサンプルを先頭にさらにkサンプル遅延したサンプルに至るk個のサンプルであるから、バッファ2の先頭の2つ目のサンプルからk個のサンプルに相当する。また、そのタイミングのマッチドフィルタ入力信号(ステップS12の出力信号)は、バッファ1の先頭の2つ目のサンプルからサンプル数Lだけ遅延したサンプルであり、マッチドフィルタの各タップ出力信号は、そのサンプルを先頭にさらにkサンプル遅延したサンプルに至るk個のサンプルであるから、バッファ3の先頭の2つ目のサンプルからk個のサンプルに相当する。
【0063】
そこで、バッファ2とバッファ3の各先頭の2つ目のサンプルからk個のサンプルを読み出して、適応フィルタ1(図2参照)のフィルタ係数を用いてフィルタリングを行いながら、適応フィルタのフィルタ係数をマッチドフィルタのフィルタ係数にコピーしてフィルタリングを行って出力信号qjを得る。これらのフィルタリング処理および適応フィルタ係数の逐次更新処理を各バッファの先頭の2つ目のサンプル(バッファ1については、1つ目のサンプル)から1サンプルずつ時間方向にずらしながら繰り返し行う。すなわち、バッファ1の先頭の1つ目のサンプルからF+1サンプル、バッファ2とバッファ3の先頭の2つ目のサンプルから(F+k−1)サンプルのデータを用い、時刻jに対応するベクトルデータから時刻j+F−1に対応するベクトルデータに至るまでF回、上記の高域強調信号yjを用いて適応フィルタのフィルタ係数を更新し、それをマッチドフィルタのフィルタ係数にコピーしながら、次の(4)式により
【数12】
マッチドフィルタの出力qjを得る処理を繰り返す。
【0064】
▲8▼ 続いてバッファ1は、最後尾からのkサンプルをFサンプル分前方へシフトする。バッファ2は、最後尾からの(k×2+M)サンプルを前方へFサンプル分シフトする。バッファ3は、最後尾からの(k×2+L)サンプルを前方へFサンプル分シフトする。次に、各バッファの最後尾のFサンプル分に次のブロックデータを格納し、▲1▼からの処理を繰り返す。
【0065】
なお、本実施形態では、便宜上、バッファ長をバッファ1については(k+F)、バッファ2については(M+2×k+F)、バッファ3については(L+2×k+F)としたが、図7から分かるように各バッファを同一タイミングで制御するための各バッファのバッファ長はバッファ1については少なくとも(F+1)、バッファ2については少なくとも(M+k+F)、バッファ3については少なくとも(L+k+F)だけあればよい。
【0066】
以上説明した本発明信号抽出方法および装置中、第1の発明およびその別の実施形態(音声と楽音が混合された1チャンネルの信号から音声を抽出することができる発明)によって、楽音成分が軽減され、音声成分が強調されて得られる(本発明の効果)ことが、本発明装置の入力信号と出力信号とをそれぞれ示す図8の信号波形(a)と(b)によって示されている。
【0067】
また、同じく本発明信号抽出方法および装置中、第2の発明およびその別の実施形態(音声と雑音が混合された1チャンネルの信号から音声を抽出することができる発明)によって、雑音成分が軽減され、音声成分が強調されて得られる(本発明の効果)ことが、本発明装置の入力信号と、出力信号とをそれぞれ示す図9の信号波形(a)と(b)、および図10のランニングスペクトルの波形(a)と(b)によって示されている。
【0068】
【発明の効果】
本発明によれば、楽音や雑音が混合された1チャンネルの信号から、所望の音声信号のみを聴感上最も聴き取りやすい状態で、リアルタイムに抽出することが可能となる。
また、本発明は、音声認識の前処理や、高齢者、聴覚障害者などが使用する補聴器など、さまざまな分野での応用が考えられる。
【図面の簡単な説明】
【図1】本発明信号抽出方法(とくに、第1の発明)をフローチャートにて示している。
【図2】適応処理回路の構成を等価回路にて示している。
【図3】本発明信号抽出方法(とくに、第2の発明)をフローチャートにて示している。
【図4】高域強調回路を等価回路にて示している。
【図5】マッチドフィルタの構成を等価回路にて示している。
【図6】本発明信号抽出装置(とくに、第1の発明の別の実施形態)におけるデータバッファリングの構成を示している。
【図7】本発明信号抽出装置(とくに、第2の発明の別の実施形態)におけるデータバッファリングの構成を示している。
【図8】本発明の効果(とくに、第1の発明および第1の発明の別の実施形態)を信号波形の対比で示している。
【図9】本発明の効果(とくに、第2の発明および第2の発明の別の実施形態)を信号波形の対比で示している。
【図10】本発明の効果(とくに、第2の発明および第2の発明の別の実施形態)をランニングスペクトルの波形の対比で示している。
【符号の説明】
1 適応フィルタ
2 適応フィルタ係数逐次更新部
3 減算器
D 1サンプルディレー
Σ 総和器
A ゲイン[0001]
BACKGROUND OF THE INVENTION
The present invention is a signal for extracting only a desired audio signal in real time from a collected signal when an unnecessary acoustic signal is mixed for some reason when the audio signal is collected. The present invention relates to an extraction method and apparatus and a medium on which a signal extraction program is recorded.
[0002]
[Prior art]
As a conventional noise removal method, a so-called one-input method and two-input method described below are known.
First, as a one-input method, for example, the document SFBoll, “Suppression of Acoustic Noise in Speech Using Spectral Subtraction” IEEE trans., Vol. ASSP-27, No.2, pp.113-120, April (1979 And the spectral subtraction method described in (1). This method is a method for obtaining a short-time amplitude spectrum of a desired audio signal by subtracting a short-time power spectrum of noise estimated from a known or silent section from the spectrum of an input signal.
[0003]
Next, as a two-input method, for example, reference B. Widrow et al., “Adaptive Noise Cancelling: Principles and Applications”, Proc. IEEE, Vol. 63, No. 12, pp. 1692-1716 (1975 The adaptive signal processing method described in (1). This method is a method capable of removing noise when only a noise component can be separately used as a reference signal in addition to an input signal in which voice and noise are mixed. Since the sound collection system of the reference signal is generally different from the sound collection system of the input signal, the reference signal does not match the noise component contained in the input signal, and in order to extract the audio signal from the input signal, It is necessary to obtain a difference by performing a filter process for matching the reference signal and the noise component included in the input signal as much as possible. An adaptive filter is generally used as this filter.
[0004]
That is, this adaptive signal processing method is a signal processing method using an adaptive filter. As a control algorithm for the adaptive filter, the above-mentioned document B. Widrow et al., “Adaptive Noise Cancelling: Principles and Applications”, Proc. IEEE, Vol. 63, No. 12, pp. 1692-1716 (1975), and J. Nagumo et al., “A Learning Method for System Identification”, IEEE Trans., Vol. AC-12, No. 3, pp. 282-287 There is a learning identification method described in JUNE (1967). Here, an adaptive filter is a kind of learning function that, when given an input signal and a signal to be output, automatically corrects the coefficients of the adaptive filter and gradually outputs a signal close to the desired output. It is a filter with Each algorithm is an algorithm that feeds back the difference between the filter output and the input to the filter to converge the value of the filter coefficient. The learning identification method is different from the LMS method in that the difference value is normalized. The LMS method is simple and has a small amount of calculation, and therefore has the advantage of being easy to implement. On the other hand, since the difference is not normalized, the dependency on the input signal amplitude is large, and the convergence is gradual and the adaptation is quick. It is unsuitable for the required use. On the other hand, the learning identification method is an improved version of the LMS method, and the amount of calculation for normalization increases somewhat, but the convergence is much faster than the LMS method.
[0005]
[Problems to be solved by the invention]
The material brought in from the field for broadcasting, particularly in the press, has a poor signal-to-noise ratio such as the voice of the criminal of the kidnapping case and the conversation voice in the cockpit of the airplane, and in most cases, is a form of one input signal without a reference signal.
In the case of urgent need, there arises a need to remove noise in real time for such a signal. However, as described below, the prior art has not been able to meet such a demand.
[0006]
In the spectral subtraction method as a conventional technique, a silent section identified in advance is cut out and noise is removed using this. Therefore, in the case where the noise component fluctuates with time, the adaptability to real-time processing is poor, such as redetecting the silent section each time. That is, with the conventional one-input method, it is difficult to perform adaptive adjustment of parameters, and it is difficult to perform filtering while following only a desired signal component with respect to one-channel input signal that changes every moment. is there.
[0007]
In the above-described adaptive signal processing method using the two-input method, real-time processing can be performed, but in this case, only a single-channel signal in which voice and noise are mixed is given and cannot be used. That is, when trying to follow temporally by adaptive signal processing, a signal having only a noise component is required as a reference signal.
[0008]
In this way, in the case of a single input signal form, a noise removal device that can cope with a time-varying noise component, and further parameters in real time while confirming the effect so that it becomes the most audible state in terms of hearing. It is desirable to develop a device that can be adjusted.
[0009]
Accordingly, an object of the present invention is to record a method and apparatus capable of adjusting only parameters in real time and extracting a signal component from a single-channel signal in which a sound signal and a non-sound signal are mixed, and a signal extraction program. Is to provide such a medium.
[0010]
[Means for Solving the Problems]
In order to achieve the above object, the present invention basically uses the adaptive signal processing method used in the conventional two-input method as it is, and there is a temporal correlation property between an audio signal and a non-audio signal. Paying attention to the difference, depending on the content of the non-speech signal that can be judged by the sense of hearing, use a signal with the input signal shifted for a certain time as the necessary reference signal, and in addition, input a signal with high frequency emphasis It is used as a signal.
[0011]
The former (method using a signal obtained by shifting the input signal as a necessary reference signal for a certain period of time) takes advantage of the fact that the musical sound has a higher temporal correlation with the musical sound. In addition, this is based on the idea of extracting a sound component having a high temporal correlation by subtracting it from the input signal and extracting a voice having a lower correlation by adaptive filter processing.
[0012]
The latter (in addition to the former, a method using a high-frequency emphasized signal as an input signal) takes advantage of the fact that speech is more temporally correlated with noise and speech, and therefore, the speech component with higher temporal correlation is used. A high-frequency emphasis of speech with few high-frequency components is simultaneously achieved by using a signal that has been extracted by adaptive filter processing and previously subjected to high-frequency emphasis as an input signal.
[0013]
In any case, by sequentially updating the adaptive filter coefficients while controlling the convergence speed, filtering is performed while only a desired signal component is temporally tracked with respect to an input signal of one channel that changes every moment. It is possible to do.
[0014]
Furthermore, in the former, an adaptive filter process is used to extract a component having a higher temporal correlation from the input signal and a signal delayed by a predetermined time, and this is subtracted from the input signal. Based on the determined filter coefficient, the system that determines the coefficient of the matched filter in real time by adaptive filter processing from the output signal obtained by high-frequency emphasis processing of the input signal and the signal obtained by delaying the input signal for a predetermined time, A delay circuit that delays the input signal for a predetermined time, the number of taps of the one-dimensional adaptive filter, the convergence coefficient, and, in the latter case, a high-frequency emphasis signal. The gain is characterized in that each gain can be adjusted in real time so that it can be heard most easily.
[0017]
That is, the present inventionA signal extraction apparatus for extracting a desired signal having a low temporal correlation from a one-channel digital input signal in which a desired signal having a low temporal correlation and an undesired signal having a high temporal correlation are mixed,One of the two-branched digital input signals, which has been delayed by the number of samples N, is input, and the filter coefficient vector is sequentially updated with the number of taps k specified at one sample interval. An adaptive filter, a subtracting means for subtracting the output signal of the adaptive filter from the other signal of the two-branched digital input signal, and outputting a subtraction result as the desired signal having a low temporal correlation; Using the output signal and the output signal from each tap of the adaptive filter,
[Equation 5]
W j : Filter coefficient vector of adaptive filter
μ: Convergence coefficient
e j : Output signal of subtraction means (desired signal)
X j : Input signal vector to adaptive filter
| X j |: Norm of input signal vector
And a filter coefficient vector W of the adaptive filter j And at least adaptive filter coefficient sequential updating means for sequentially updating one of the delayed digital input signals to the adaptive filter,
[Formula 6]
z j : Output signal of adaptive filter
<W j , X j >: Inner product of filter coefficient vector and input signal vector
And the output signal z of the adaptive filter that is the result of the operation j Is input to the subtracting means,
e j = Y j -Z j
y j : The other signal of the two-branched digital input signal
And the desired signal e having a low temporal correlation is calculated. j OutputIt is characterized by this.
[0018]
Also,The signal extraction device of the present invention comprises:A block dividing means for dividing the digital input signal into blocks for each F sample is further provided at the input end of the apparatus, and the other of the two-branched digital input signals is provided.Provided at the input end of the subtraction means to which a signal is inputA first buffer means having a storage capacity of at least F samples, wherein the output signals of the block dividing means are sequentially stored in units of the blocks, and the first buffer means stored in the first buffer means after the storage; The stored sample before (F-1) samples in time from the first predetermined sample predetermined according to the storage capacity of one buffer means is used as the other signal of the two-branched digital input signal. One sample from the storage sample before (F-1) samples counted from the first predetermined sample between the input to the subtraction means and the storage of the next block unit following the storage of the block unit First buffer means for repeatedly inputting a total of F samples to the subtracting means while shifting in the first predetermined sample direction one by one;Also serves as a delay of N samplesA second buffer means having a storage capacity of at least (N + k + F) samples, wherein the output signals of the block dividing means are sequentially stored in units of blocks and at the same timing as the first predetermined sample after the storage; From the stored sample before (N + k + F-1) samples in time counting from the second predetermined sample previously determined according to the storage capacity of the second buffer means stored in the second buffer means A set of k consecutive samples toward the second predetermined sample is inputted to the adaptive filter as each tap output signal of the adaptive filter, and until the next block unit storage following the block unit storage. Each sample from the memory sample before (N + k + F−1) samples in time from the second predetermined sample. A total of F sets of k consecutive samples are repeatedly synchronized with the first buffer means while being shifted in a predetermined sample direction, and are input to the adaptive filter as tap output signals of the adaptive filter. And buffer means.
[0019]
Also,The signal extraction device of the present invention controls the number of samples N of the delay amount, the number of taps k, and the convergence coefficient μ, respectively.It is characterized by this.
[0020]
Also,The present inventionA signal extraction apparatus for extracting a desired signal having a high temporal correlation from a one-channel digital input signal in which a desired signal having a high temporal correlation and an undesired signal having a low temporal correlation are mixed,The three branchesA first signal of a digital input signal is input, and the signal is subjected to high frequency emphasis processing and designated gain multiplication to obtain a high frequency emphasis signal.OutputHigh frequency emphasis means,A second signal of the three-branched digital input signal that is delayed by the number of samples M is input, the number of taps is designated at one sample interval, and the filter coefficient vector is sequentially updated. A filter, a subtracting means for subtracting the output signal of the adaptive filter from the high frequency emphasis signal, an output signal from the subtracting means and an output signal from each tap of the adaptive filter,
[Expression 7]
W j : Filter coefficient vector of adaptive filter
μ: Convergence coefficient
e j : Subtracting means output signal
X j : Input signal vector to adaptive filter
| X j |: Norm of input signal vector
And a filter coefficient vector W of the adaptive filter j Adaptive filter coefficient successive update means for successively updating the adaptive filter coefficient, and a matched filter to which a filter coefficient vector of the adaptive filter is copied. And the signal delayed by the number of samples L is input to the matched filter,
[Equation 8]
q j : Matched filter output signal
P j : Input signal vector to matched filter
<W j , P j >: Inner product of filter coefficient vector and input signal vector
And the desired signal q having a high temporal correlation is calculated. j OutputIt is characterized by this.
[0021]
Also,The signal extraction device of the present invention comprises:The high frequency emphasizing means delays the input signal by one sample.Delay meansAnd theDelay meansDifferential means for generating and outputting a differential signal between the input and output signals ofDelay meansAnd a multiplying means for multiplying an input signal connected to the subsequent stage of the difference means by the gain.
[0022]
Also,The signal extraction device of the present invention comprises:A block dividing means for dividing the digital input signal into blocks for each F sample is further provided at the input end of the apparatus,Delay means1 is a first buffer means having a storage capacity of at least (F + 1) samples, and sequentially storing the output signal of the block dividing means or the output signal of the block dividing means multiplied by the gain in units of blocks. In addition, from the stored sample before the F sample in time counted from the first predetermined sample that is predetermined according to the storage capacity of the first buffer means stored in the first buffer means after the storage A set of two consecutive samples toward the first predetermined sample is output as an input signal of the difference means, and the first predetermined period is stored until the next block unit storage following the block unit storage. A total of F sets of samples are shifted in the first predetermined sample direction one by one from the stored sample before F samples in time. A first buffer means for outputting said difference means repeated serial two consecutive samples of the set,Doubles the sample number MA second buffer means having a storage capacity of at least (M + k + F) samples, wherein the output signals of the block dividing means are sequentially stored in units of blocks, and the same timing as the first predetermined sample after the storage; From the stored sample before (M + k + F-1) samples in time counting from the second predetermined sample previously determined according to the storage capacity of the second buffer means stored in the second buffer means A set of k consecutive samples toward the second predetermined sample is inputted to the adaptive filter as each tap output signal of the adaptive filter, and until the next block unit storage following the block unit storage. Each time from the second predetermined sample to the first (M + k + F−1) samples from the memory sample before the sample. A total of F sets of k consecutive samples are repeatedly synchronized with the first buffer means while being shifted in a predetermined sample direction, and are input to the adaptive filter as tap output signals of the adaptive filter. Buffer means;Doubles the delay of the number of samples LA third buffer means having a storage capacity of at least (L + k + F) samples, wherein the output signals of the block dividing means are sequentially stored in units of blocks, and after the storage, at the same timing as the first predetermined sample; From the stored sample before (L + k + F-1) samples in time counting from a third predetermined sample that is predetermined according to the storage capacity of the third buffer means stored in the third buffer means A set of k consecutive samples toward the third predetermined sample is input to the matched filter as each tap output signal of the matched filter, and until the next block unit storage following the block unit storage. One sample at a time from the stored sample before (L + k + F-1) samples in time from the third predetermined sample A total of F sets of k consecutive samples are repeatedly input in synchronization with the first buffer means while shifting in the third predetermined sample direction as the tap output signals of the matched filter to the matched filter. And third buffer means.
[0023]
Also,The signal extraction device of the present invention can control the number of samples M and L of the delay amount, the number of taps k, the convergence coefficient μ, and the gain, respectively.It is characterized by this.
[0028]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, the present invention will be described in detail based on an embodiment of the invention with reference to the accompanying drawings.
[First invention]
FIG. 1 shows a desired signal having a low temporal correlation from a one-channel digital input signal in which a desired signal having a low temporal correlation (for example, speech) and an undesired signal having a high temporal correlation (for example, a musical tone) are mixed. 2 shows a flowchart of a signal processing procedure according to the signal extraction method of the present invention for extracting.
[0029]
In FIG. 1, a signal of one channel (analog signal) in which a signal with low temporal correlation (speech) and a signal with high temporal correlation (musical sound) is mixed is first input (step S1). This signal is, for example, an audio signal including a musical sound collected by a microphone. This signal is first digitized for adaptive processing described below (step S2). The digitized signal is branched into two as shown in the figure, one is left as it is, and the other digital signal is delayed by the designated number of samples (delay amount) N (step S3). These directly and delayed signals are supplied to the adaptive processing circuit whose one embodiment is shown in FIG. 2, and the adaptive processing circuit performs adaptive processing as described below (step S4).
[0030]
As shown in FIG. 2, the adaptive processing circuit sequentially updates the adaptive filter having the k number of taps designated at one sample interval (in the case of a transversal filter) 1 and the coefficient of the adaptive filter in the equivalent circuit. It consists of an adaptive filter coefficient
[0031]
In the above configuration, the
[Outside 1]
) Is sequentially updated by the output from the adaptive filter coefficient
[0032]
The adaptive filter coefficient
[Outside 2]
), And the filter coefficient (coefficient vector [external 1]) is sequentially updated and output based on an algorithm based on the learning identification method described below.
[0033]
In the following, in mathematical formulas, uppercase letters of alphabets represent vectors, and lowercase letters represent scalar quantities.
The filter coefficient sequential update algorithm based on the learning identification method is expressed by the following equation (1).
[Equation 9]
here,
[Outside 2]: Input signal vector to the adaptive filter
[Outside 1]: Filter coefficient vector of the adaptive filter
μ: Convergence coefficient
zj: Output signal of adaptive filter
yj: Reference signal
ej: Output signal of adaptive processing unit
[Outside 3]
: Inner product of coefficient vector and input signal vector
[Outside 4]
: Norm of input signal vector
[0034]
The meaning of equation (1) is explained as follows.
In the
[Outside 5]
And the filter coefficient vector [outside 1] is added to obtain the filter coefficient vector at the next time point (j + 1).
[Outside 6]
And In addition,
[Outside 7]
When the value of 0 is 0, [Outside 5] is forced to 0. The initial value of the filter coefficient vector
[Outside 8]
May be any value, but in general is often a zero vector.
[0035]
In addition, the sequential update of the filter coefficient is performed by the output signal z of the adaptive filter.jAnd reference signal yjDifference withjIs updated so that the input signal x of the adaptive filter is reduced.jAnd reference signal yjSince there is a time lag of N samples, the difference ejDetermining the filter coefficient so that becomes small corresponds to performing a filtering process that emphasizes a signal component having a high temporal correlation. The degree of temporal correlation can be controlled by the delay amount N and the tap number k as parameters.
[0036]
Furthermore, in order to enable real-time processing of the sequential update, it is necessary that the filter coefficients converge quickly, and the convergence coefficient μ (0 ≦ μ) is used as a parameter for controlling the convergence speed so that excessive overshoot does not occur. Control by ≦ 1). These parameters including the delay amount N and the tap number k can be set in the parameter control (step S5) in FIG.
[0037]
The parameters (N, k, μ) are set manually by listening to the sound obtained from the device of the present invention so that it is most audible for listening. At this time, the output signal z of the adaptive filter 1 (see FIG. 2)jHas a shape close to the spectrum of musical sounds.
[0038]
In FIG. 1, in each step of D / A conversion (step S6) and voice output (step S7), a digital signal in which a signal component (voice) having a low temporal correlation is emphasized by the above-described adaptive processing (step S4). This is a procedure for making an analog signal available for listening.
[0039]
In the present invention, the first invention has been described as the method invention with reference to FIG. 1, but the adaptive processing circuit for performing the adaptive processing (step S4) is shown in FIG. 2, and its parameter control is also described in detail. From the above, it is apparent that the first invention can be configured as an apparatus invention.
[0040]
[Second invention]
FIG. 3 shows a desired signal having a high temporal correlation from a one-channel digital input signal in which a desired signal having a high temporal correlation (for example, speech) and an undesired signal having a low temporal correlation (for example, noise) are mixed. 2 shows a flowchart of a signal processing procedure according to the signal extraction method of the present invention for extracting.
[0041]
In FIG. 3, a one-channel signal (analog signal) in which a signal with high temporal correlation (voice) and a signal with low temporal correlation (noise) is mixed is first input (step S8). This signal is an audio signal including noise collected by a microphone, for example. This signal is digitized for the adaptive processing described below (step S9), as in the case shown in FIG. The digitized signals are branched as shown in the figure, and are respectively high-frequency emphasized (step S10), delayed by the number of samples (delay amount) M of 1 (step S11), and delayed by the number of samples (delay amount) L of 2 ( Step S12).
[0042]
FIG. 4 shows an example of an equivalent circuit of the high-frequency emphasis circuit for high-frequency emphasis performed in step S10. A difference signal between one sample of the input signal is generated and multiplied by a predetermined gain A. Output. It is the same even if the difference signal is generated after the input signal is multiplied by the gain A.
[0043]
Signal y enhanced in high frequency in step S10jAnd the signal x delayed by the number of samples (delay amount) M in
[0044]
Even in this case, the high-frequency emphasized signal yjAnd the output signal of the
[0045]
The control of the parameters (gain A, delay amount M, L, tap number k, convergence coefficient μ) shown in step S14 in FIG. 3 is the same as that described in step S5 in FIG. The description is omitted. However, the gain A controls the amplitude level of the high frequency emphasis circuit shown in FIG.
[0046]
In FIG. 3, the digital signal delayed by the number of samples (delay amount) L in step S12 is subjected to matched filter processing using the matched filter shown in FIG. 5 in step S15. The output of the matched filter is a signal component (speech) q having a high temporal correlation when the filter coefficient is the filter coefficient of the adaptive filter obtained by the adaptive processing in step S13.jWill be obtained with emphasis. In FIG. 3, the white arrow indicates that the filter coefficient [outside 1] of the adaptive filter obtained in step S13 is copied to the filter coefficient of the matched filter in step S15.
[0047]
The reason why the digital input signal is supplied to the matched filter by the number of samples L in step S12 is as follows. In other words, since the phoneme that is expressed over a period of time is formed continuously in terms of time, in order to extract a desired speech using a matched filter as described later, it is determined by an adaptive filter at the end of the phoneme. Since it is necessary to control the matched filter from the phoneme start time using the filter coefficient, the time difference is controlled by the delay time L. These control parameters are the delay times M and L of the two delay circuits, the high frequency emphasis signal gain A, the tap number k of the adaptive filter, and the convergence coefficient μ used in the adaptive signal processing algorithm in parameter control (step S14). It can be set. The setting of these parameters (M, L, A, k, μ) is to set each control parameter so that the sound is most easily heard in terms of audibility while listening to the sound obtained from the device of the present invention. To do.
[0048]
The matched filter (see FIG. 5) used in step S15 has the same configuration as the adaptive filter in the adaptive processing circuit, and has the same number of tap coefficients k as the adaptive filter. Then, the filter coefficient of the adaptive filter used in step S13 is filtered with the copied filter coefficient, and the filtered digital audio output signal qjIs output. That is, the number of taps of the matched filter is k, and the input signal vector of the matched filter is
[Outside 9]
, The output signal q of the matched filter with the coefficient vector of the copied matched filter as [external 1]jCan be expressed as the following equation (2).
[Expression 10]
[0049]
In this case, the delay of the sample number L is for adjusting the time axis of the output signal of the adaptive processing circuit and the digital audio signal input to the matched filter, as described above.
Digital audio output signal q from matched filterjIs converted into an analog signal in step S16 and listened to (step S17).
[0050]
As described above, in the second invention of the present invention, the high frequency emphasis circuit that performs high frequency emphasis (step S10), the adaptive processing circuit that performs adaptive processing (step S13), and the matched filter that performs matched filter processing (S15) Since each of the drawings and the like (the adaptive processing circuit is the same as that used in the first invention, the drawing is omitted) and the parameter control thereof are also explained, the second invention is an invention of the apparatus. It is obvious that it can be configured as:
[0051]
[Another embodiment of the first invention]
When the first invention is implemented by software processing by reading a signal extraction program from a recording medium into a computer, the digital input signal of one channel is processed sample by sample. Processing takes time, and real-time processing may be difficult. In order to solve this problem, a method for processing a digital input signal for each block will be described below.
[0052]
FIG. 6 shows the configuration of data buffering in this case.
When this embodiment is configured as an apparatus, block dividing means, a first buffer, and a second buffer are required.
[0053]
In the following, the size of the first and second buffers (memory) and the manner of storing (writing and reading) the digital input signal will be described in itemized form. Thereby, the whole process of signal extraction can be computerized.
(1) The digital input signal is cut out into blocks (block data) every F samples from the start of acquisition. In the present embodiment, F = 256 samples. Blocks can be cut anywhere.
(2) Let k be the number of taps of the adaptive filter. In this embodiment, k = 128 is adopted as the initial value.
{Circle around (3)} The cut block data is stored in a
(4) At this time, the
[0054]
(5) The latest (newest) sample in the block at the end of each buffer (indicated by * in FIG. 6) from the end of each buffer (
{Circle around (6)} The address of the data stored in each buffer is controlled to read out by shifting one sample at a time from the second sample at the head of each buffer, and the above-described processing of the first invention is performed. Thus, according to the present embodiment, by performing address control on the memory, the above processing can be performed without shifting the physical memory storage location, so that the calculation time can be shortened, which is very convenient. It is.
[0055]
Digital signal writing and reading are performed as follows.
First, the second sample from the top of the
## EQU11 ##
Output z of the adaptive filterjAnd the reference signal yjSubtract from output signal ejRepeat the process to get
[0056]
(8) Subsequently, the
[0057]
In this embodiment, for convenience, the buffer length is set to (k + F) for the
[0058]
[Another embodiment of the second invention]
As with the other embodiments of the first invention, the digital input signal is processed for each block, thereby increasing the processing speed during software processing by reading the signal extraction program from the recording medium into the computer and enabling real-time processing. It is intended to become.
[0059]
FIG. 7 shows the configuration of data buffering in this case.
When this embodiment is configured as an apparatus, a third buffer is required in addition to the block dividing means, the first buffer, and the second buffer.
[0060]
In the following, the sizes of the first, second and third buffers (memory) and how to store the digital input signals (writing and reading) will be described in bulleted form. Thereby, the whole process of signal extraction can be computerized.
(1) The digital input signal is cut out into blocks (block data) every F samples from the start of acquisition. In the present embodiment, F = 256 samples. Blocks can be cut anywhere.
(2) Let k be the number of taps of the adaptive filter. In this embodiment, k = 128 is adopted as the initial value.
(3) The cut block data is stored in a
(4) At this time, the
[0061]
(5) The latest (newest) sample in the block in the block is located at the position of F samples (indicated by * in FIG. 7) from the end of each buffer (
{Circle around (6)} The address of the data stored in each buffer is controlled so that the second sample described above is read out by shifting one sample at a time from the second sample at the beginning of each buffer (the first sample for buffer 1). The process of the invention is performed. Thus, according to the present embodiment, by performing address control on the memory, the above processing can be performed without shifting the physical memory storage location, so that the calculation time can be shortened, which is very convenient. It is.
[0062]
Digital signal writing and reading are performed as follows.
(7) First, the difference between the first sample from the head of the
[0063]
Therefore, the k samples are read from the second sample at the head of each of the
[Expression 12]
Matched filter output qjRepeat the process to get
[0064]
(8) Subsequently, the
[0065]
In this embodiment, for convenience, the buffer length is set to (k + F) for the
[0066]
Of the signal extraction method and apparatus of the present invention described above, the tone component is reduced by the first invention and another embodiment thereof (invention that can extract voice from a single-channel signal in which voice and music are mixed). The signal components (a) and (b) shown in FIG. 8 showing the input signal and the output signal of the device of the present invention are obtained by emphasizing the speech component (effect of the present invention).
[0067]
Similarly, among the signal extraction method and apparatus of the present invention, the noise component is reduced by the second invention and another embodiment thereof (invention that can extract sound from a single-channel signal in which sound and noise are mixed). The signal components (a) and (b) of FIG. 9 showing the input signal and the output signal of the device of the present invention, and FIG. The running spectrum is shown by waveforms (a) and (b).
[0068]
【The invention's effect】
According to the present invention, it is possible to extract only a desired audio signal in real time from a single-channel signal mixed with musical sounds and noises in a state in which it is most audible to hear.
In addition, the present invention can be applied in various fields such as speech recognition preprocessing and hearing aids used by elderly people, hearing-impaired persons, and the like.
[Brief description of the drawings]
FIG. 1 is a flowchart showing a signal extraction method (particularly, the first invention) according to the present invention.
FIG. 2 shows the configuration of an adaptive processing circuit using an equivalent circuit.
FIG. 3 is a flowchart showing the signal extraction method of the present invention (particularly, the second invention).
FIG. 4 shows a high frequency emphasis circuit as an equivalent circuit.
FIG. 5 shows a matched filter configuration with an equivalent circuit.
FIG. 6 shows a configuration of data buffering in the signal extraction device of the present invention (particularly, another embodiment of the first invention).
FIG. 7 shows a configuration of data buffering in the signal extraction device of the present invention (particularly, another embodiment of the second invention).
FIG. 8 shows the effects of the present invention (particularly, the first invention and another embodiment of the first invention) in comparison with signal waveforms.
FIG. 9 shows the effect of the present invention (particularly, the second invention and another embodiment of the second invention) in comparison with signal waveforms.
FIG. 10 shows the effects of the present invention (particularly, the second invention and another embodiment of the second invention) by comparing the waveforms of running spectra.
[Explanation of symbols]
1 Adaptive filter
2 Adaptive filter coefficient successive update unit
3 Subtractor
Σ summer
A Gain
Claims (7)
2分岐された前記ディジタル入力信号の一方の信号であってサンプル数Nの遅延が施された信号が入力され、1サンプル間隔で指定されたタップ数kからなり、フィルタ係数ベクトルが逐次更新される適応フィルタと、
前記適応フィルタの出力信号を、2分岐されたディジタル入力信号の他方の信号から減算し、減算結果を前記時間的相関の低い所望信号として出力する減算手段と、
前記減算手段からの出力信号と前記適応フィルタの各タップからの出力信号を用いて、
μ:収束係数
e j :減算手段の出力信号(所望信号)
X j :適応フィルタへの入力信号ベクトル
|X j |:入力信号ベクトルのノルム
を演算し、前記適応フィルタのフィルタ係数ベクトルW j を逐次更新する適応フィルタ係数逐次更新手段とを少なくとも具え、
遅延された前記ディジタル入力信号の一方の信号を前記適応フィルタに入力して、
〈W j ,X j 〉:フィルタ係数ベクトルと入力信号ベクトルの内積
を演算し、演算結果である適応フィルタの出力信号z j を前記減算手段に入力して、
e j =y j −z j
y j :2分岐されたディジタル入力信号の他方の信号
を演算し、前記時間的に相関の低い所望信号e j を出力することを特徴とする信号抽出装置。A signal extraction apparatus for extracting a desired signal having a low temporal correlation from a one-channel digital input signal in which a desired signal having a low temporal correlation and an undesired signal having a high temporal correlation are mixed,
One of the two-branched digital input signals, which has been delayed by the number of samples N, is input, and the filter coefficient vector is sequentially updated with the number of taps k specified at one sample interval. An adaptive filter;
Subtracting means for subtracting the output signal of the adaptive filter from the other signal of the two-branched digital input signal and outputting the subtraction result as a desired signal having a low temporal correlation;
Using the output signal from the subtracting means and the output signal from each tap of the adaptive filter,
μ: Convergence coefficient
e j : Output signal of subtraction means (desired signal)
X j : input signal vector to the adaptive filter
| X j |: Norm of input signal vector
And at least adaptive filter coefficient sequential updating means for sequentially updating the filter coefficient vector W j of the adaptive filter,
One of the delayed digital input signals is input to the adaptive filter;
<W j , X j >: inner product of filter coefficient vector and input signal vector
And the adaptive filter output signal z j which is the calculation result is input to the subtracting means,
e j = y j −z j
y j : the other signal of the two-branched digital input signal
Calculates the signal extraction apparatus and outputs a low desired signals e j of the temporally correlated.
前記ディジタル入力信号をFサンプル毎のブロックに分割するブロック分割手段をさらに当該装置の入力端に具えるとともに、
前記2分岐されたディジタル入力信号の他方の信号が入力される前記減算手段の入力端に具える少なくともFサンプルの記憶容量を有する第1のバッファ手段であって、前記ブロック分割手段の出力信号を前記ブロック単位で順次に記憶するとともに、該記憶後に該第1のバッファ手段に記憶された該第1のバッファ手段の記憶容量に応じて予め定められた第1の所定のサンプルから数えて時間的に(F−1)サンプル前の記憶サンプルを前記2分岐されたディジタル入力信号の他方の信号として前記減算手段に入力し、前記ブロック単位の記憶に続く次のブロック単位の記憶までの間に前記第1の所定のサンプルから数えて時間的に(F−1)サンプル前の記憶サンプルから1サンプルずつ前記第1の所定のサンプル方向にずらしながら合計F個のサンプルを繰り返し前記減算手段に入力する第1のバッファ手段と、
サンプル数Nの遅延を兼ねる少なくとも(N+k+F)サンプルの記憶容量を有する第2のバッファ手段であって、前記ブロック分割手段の出力信号を前記ブロック単位に順次に記憶するとともに、該記憶後に前記第1の所定のサンプルと同一タイミングで該第2のバッファ手段に記憶された該第2のバッファ手段の記憶容量に応じて予め定められた第2の所定のサンプルから数えて時間的に(N+k+F−1)サンプル前の記憶サンプルから前記第2の所定のサンプルに向かってk個連続したサンプルの組を前記適応フィルタの各タップ出力信号として前記適応フィルタに入力し、前記ブロック単位の記憶に続く次のブロック単位の記憶までの間に前記第2の所定のサンプルから数えて時間的に(N+k+F−1)サンプル前の記憶サンプルから1サンプルずつ前記第2の所定のサンプル方向にずらしながら合計F組の前記k個連続したサンプルの組を前記第1のバッファ手段と同期して繰り返し前記適応フィルタの各タップ出力信号として前記適応フィルタに入力する第2のバッファ手段と
を具えてなることを特徴とする信号抽出装置。The signal extraction device according to claim 1,
And further comprising a block dividing means for dividing the digital input signal into blocks for each F sample at the input end of the apparatus,
A first buffer means having a storage capacity of at least F samples provided at an input terminal of the subtracting means to which the other signal of the two-branched digital input signals is inputted , the output signal of the block dividing means being Sequentially storing in units of blocks, and counting from a first predetermined sample predetermined according to the storage capacity of the first buffer means stored in the first buffer means after the storage. (F-1) The stored sample before the sample is input to the subtracting means as the other signal of the two-branched digital input signal, and until the next block unit storage following the block unit storage, Counting from the first predetermined sample in time (F-1) while shifting one sample at a time from the stored sample before the sample in the first predetermined sample direction. A first buffer means for inputting to said subtraction means repeats the F samples,
A second buffer means having a storage capacity of at least (N + k + F) samples, which also serves as a delay of the number of samples N, and sequentially stores the output signal of the block dividing means in units of the blocks; (N + k + F−1) from the second predetermined sample determined in advance according to the storage capacity of the second buffer means stored in the second buffer means at the same timing as the predetermined sample. ) A set of k consecutive samples from the storage sample before the sample toward the second predetermined sample is input to the adaptive filter as each tap output signal of the adaptive filter, and the next block following the storage in the block unit Storage sample before (N + k + F-1) samples in time counting from the second predetermined sample until storage in block units The total of F sets of the k consecutive samples are repeated in synchronization with the first buffer means while shifting one sample at a time in the second predetermined sample direction, and the adaptive filter is used as each tap output signal of the adaptive filter. A signal extraction device comprising: second buffer means for inputting to a filter.
3分岐された前記ディジタル入力信号の第1の信号が入力され、該信号に高域強調処理と指定されたゲイン倍とを施して高域強調信号を出力する高域強調手段と、
3分岐された前記ディジタル入力信号の第2の信号であってサンプル数Mだけ遅延された信号が入力され、1サンプル間隔で指定されたタップ数kからなり、フィルタ係数ベクトルが逐次更新される適応フィルタと、
前記適応フィルタの出力信号を、前記高域強調信号から減算する減算手段と、
該減算手段からの出力信号と前記適応フィルタの各タップからの出力信号を用いて、
μ:収束係数
e j :減算手段の出力信号
X j :適応フィルタへの入力信号ベクトル
|X j |:入力信号ベクトルのノルム
を演算し、前記適応フィルタのフィルタ係数ベクトルW j を逐次更新する適応フィルタ係数逐次更新手段と、
前記適応フィルタと同一構成であり、前記適応フィルタのフィルタ係数ベクトルがコピーされるマッチドフィルタとを少なくとも具え、
3分岐された前記ディジタル入力信号の第3の信号であってサンプル数Lだけ遅延された信号を前記マッチドフィルタに入力して、
P j :マッチドフィルタへの入力信号ベクトル
〈W j ,P j 〉:フィルタ係数ベクトルと入力信号ベクトルの内積
を演算し、前記時間的に相関の高い所望信号q j を出力することを特徴とする信号抽出装置。A signal extraction apparatus for extracting a desired signal having a high temporal correlation from a one-channel digital input signal in which a desired signal having a high temporal correlation and an undesired signal having a low temporal correlation are mixed,
High-frequency emphasizing means for inputting a first signal of the three-branched digital input signal, performing high-frequency emphasis processing and designated gain multiplication on the signal, and outputting a high-frequency emphasizing signal;
A second signal of the three-branched digital input signal that is delayed by the number of samples M is input, the number of taps is designated at one sample interval, and the filter coefficient vector is sequentially updated. Filters,
Subtracting means for subtracting the output signal of the adaptive filter from the high frequency emphasis signal;
Using the output signal from the subtracting means and the output signal from each tap of the adaptive filter,
μ: Convergence coefficient
e j : Output signal of subtraction means
X j : input signal vector to the adaptive filter
| X j |: Norm of input signal vector
Adaptive filter coefficient sequential update means for sequentially updating the filter coefficient vector W j of the adaptive filter,
The adaptive filter has the same configuration as the adaptive filter, and includes at least a matched filter to which a filter coefficient vector of the adaptive filter is copied,
A third signal of the three-branched digital input signal that is delayed by the number of samples L is input to the matched filter,
P j : input signal vector to the matched filter
<W j , P j >: inner product of filter coefficient vector and input signal vector
And a desired signal q j having a high temporal correlation is output .
該遅延手段の入出力信号間の差分信号を生成して出力する差分手段と、
前記遅延手段の前段または前記差分手段の後段に接続された入力信号を前記ゲイン倍する乗算手段と
を具えてなることを特徴とする信号抽出装置。5. The signal extraction device according to claim 4, wherein the high frequency emphasizing means includes delay means for delaying the input signal by one sample,
Differential means for generating and outputting a differential signal between input and output signals of the delay means ;
A signal extracting apparatus comprising: a multiplying unit that multiplies the input signal connected to the preceding stage of the delaying unit or the subsequent stage of the difference unit.
前記ディジタル入力信号をFサンプル毎のブロックに分割するブロック分割手段をさらに当該装置の入力端に具えるとともに、
前記遅延手段に代わる少なくとも(F+1)サンプルの記憶容量を有する第1のバッファ手段であって、前記ブロック分割手段の出力信号または前記ゲイン倍された前記ブロック分割手段の出力信号を前記ブロック単位に順次に記憶するとともに、該記憶後に該第1のバッファ手段に記憶された該第1のバッファ手段の記憶容量に応じて予め定められた第1の所定のサンプルから数えて時間的にFサンプル前の記憶サンプルから前記第1の所定のサンプルに向かって2個連続したサンプルの組を前記差分手段の入力信号として出力し、前記ブロック単位の記憶に続く次のブロック単位の記憶までの間に前記第1の所定のサンプルから数えて時間的にFサンプル前の記憶サンプルから1サンプルずつ前記第1の所定のサンプル方向にずらしながら合計F組の前記2個連続したサンプルの組を繰り返し前記差分手段に出力する第1のバッファ手段と、
サンプル数Mの遅延を兼ねる少なくとも(M+k+F)サンプルの記憶容量を有する第2のバッファ手段であって、前記ブロック分割手段の出力信号を前記ブロック単位に順次に記憶するとともに、該記憶後に前記第1の所定のサンプルと同一タイミングで該第2のバッファ手段に記憶された該第2のバッファ手段の記憶容量に応じて予め定められた第2の所定のサンプルから数えて時間的に(M+k+F−1)サンプル前の記憶サンプルから前記第2の所定のサンプルに向かってk個連続したサンプルの組を前記適応フィルタの各タップ出力信号として前記適応フィルタに入力し、前記ブロック単位の記憶に続く次のブロック単位の記憶までの間に前記第2の所定のサンプルから数えて時間的に(M+k+F−1)サンプル前の記憶サンプルから1サンプルずつ前記第2の所定のサンプル方向にずらしながら合計F組の前記k個連続したサンプルの組を前記第1のバッファ手段と同期して繰り返し前記適応フィルタの各タップ出力信号として前記適応フィルタに入力する第2のバッファ手段と、
サンプル数Lの遅延を兼ねる少なくとも(L+k+F)サンプルの記憶容量を有する第3のバッファ手段であって、前記ブロック分割手段の出力信号を前記ブロック単位に順次に記憶するとともに該記憶後に前記第1の所定のサンプルと同一タイミングで該第3のバッファ手段に記憶された該第3のバッファ手段の記憶容量に応じて予め定められた第3の所定のサンプルから数えて時間的に(L+k+F−1)サンプル前の記憶サンプルから前記第3の所定のサンプルに向かってk個連続したサンプルの組を前記マッチドフィルタの各タップ出力信号として前記マッチドフィルタに入力し、前記ブロック単位の記憶に続く次のブロック単位の記憶までの間に前記第3の所定のサンプルから数えて時間的に(L+k+F−1)サンプル前の記憶サンプルから1サンプルずつ前記第3の所定のサンプル方向にずらしながら合計F組の前記k個連続したサンプルの組を前記第1のバッファ手段と同期して繰り返し前記マッチドフィルタの各タップ出力信号として前記マッチドフィルタに入力する第3のバッファ手段と
を具えてなることを特徴とする信号抽出装置。The signal extraction device according to claim 5, wherein
And further comprising a block dividing means for dividing the digital input signal into blocks for each F sample at the input end of the apparatus,
A first buffer means having a storage capacity of at least (F + 1) samples instead of the delay means , wherein the output signal of the block dividing means or the output signal of the block dividing means multiplied by the gain is sequentially applied to the block unit. And after the storage, the first buffer sample stored in the first buffer means is preliminarily determined according to the storage capacity of the first buffer means. A set of two consecutive samples from a stored sample toward the first predetermined sample is output as an input signal of the difference means, and the second block unit is stored between the block unit and the next block unit. Counting from one predetermined sample in time, the sample is shifted in the first predetermined sample direction by one sample from the stored sample before F samples. A first buffer means for outputting said difference means repeating a set of total Group F of the two consecutive samples,
Second buffer means having a storage capacity of at least (M + k + F) samples that also serves as a delay of the number M of samples, and sequentially stores the output signals of the block dividing means in units of blocks, and after the storage, the first buffer means (M + k + F−1) from the second predetermined sample determined in advance according to the storage capacity of the second buffer means stored in the second buffer means at the same timing as the predetermined sample ) A set of k consecutive samples from the storage sample before the sample toward the second predetermined sample is input to the adaptive filter as each tap output signal of the adaptive filter, and the next block following the storage in the block unit Storage sample before (M + k + F-1) samples in time counting from the second predetermined sample until storage in block units The total of F sets of the k consecutive samples are repeated in synchronization with the first buffer means while shifting one sample at a time in the second predetermined sample direction, and the adaptive filter is used as each tap output signal of the adaptive filter. Second buffer means for input to the filter;
A third buffer means having a storage capacity of at least (L + k + F) samples, which also serves as a delay of the number of samples L , sequentially storing the output signals of the block dividing means in units of the blocks and after the storage, the first buffer means; (L + k + F-1) in time counting from a third predetermined sample determined in advance according to the storage capacity of the third buffer means stored in the third buffer means at the same timing as the predetermined sample A set of k consecutive samples from the storage sample before the sample toward the third predetermined sample is input to the matched filter as each tap output signal of the matched filter, and the next block following the storage in the block unit Storage before (L + k + F-1) samples in time counting from the third predetermined sample until storage of units Sample sets from the sample are shifted by one sample in the third predetermined sample direction, and a total of F sets of the k consecutive samples are repeatedly synchronized with the first buffer means as each tap output signal of the matched filter. 3. A signal extraction apparatus comprising: third buffer means for inputting to a matched filter.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP34806498A JP3847989B2 (en) | 1998-12-08 | 1998-12-08 | Signal extraction device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP34806498A JP3847989B2 (en) | 1998-12-08 | 1998-12-08 | Signal extraction device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000172297A JP2000172297A (en) | 2000-06-23 |
JP3847989B2 true JP3847989B2 (en) | 2006-11-22 |
Family
ID=18394511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP34806498A Expired - Fee Related JP3847989B2 (en) | 1998-12-08 | 1998-12-08 | Signal extraction device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3847989B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4531916B2 (en) * | 2000-03-31 | 2010-08-25 | クラリオン株式会社 | Information providing system and voice doll |
JP5327735B2 (en) * | 2007-10-18 | 2013-10-30 | 独立行政法人産業技術総合研究所 | Signal reproduction device |
JP5641186B2 (en) * | 2010-01-13 | 2014-12-17 | ヤマハ株式会社 | Noise suppression device and program |
JP5319604B2 (en) * | 2010-05-18 | 2013-10-16 | 株式会社東海理化電機製作所 | Filter coefficient setting method for digital receiver and digital receiver |
-
1998
- 1998-12-08 JP JP34806498A patent/JP3847989B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000172297A (en) | 2000-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0796489B1 (en) | Method for transforming a speech signal using a pitch manipulator | |
EP0814639B1 (en) | Spectral transposition of a digital audio signal | |
EP0788089B1 (en) | Method and apparatus for suppressing background music or noise from the speech input of a speech recognizer | |
US5757937A (en) | Acoustic noise suppressor | |
US20030185411A1 (en) | Single channel sound separation | |
US20030216907A1 (en) | Enhancing the aural perception of speech | |
US5878389A (en) | Method and system for generating an estimated clean speech signal from a noisy speech signal | |
JP2003520469A (en) | Noise reduction apparatus and method | |
US20080004868A1 (en) | Sub-band periodic signal enhancement system | |
WO2004002028A2 (en) | Audio signal processing apparatus and method | |
EP1216527B1 (en) | Apparatus and method for de-esser using adaptive filtering algorithms | |
JP3847989B2 (en) | Signal extraction device | |
Shraddha et al. | Noise cancellation and noise reduction techniques: A review | |
JPH06289897A (en) | Speech signal processor | |
JPH06289898A (en) | Speech signal processor | |
JP7574563B2 (en) | Filter processing method, filter processing device, and filter processing program | |
RU2589298C1 (en) | Method of increasing legible and informative audio signals in the noise situation | |
JP2001249676A (en) | Method for extracting fundamental period or fundamental frequency of periodical waveform with added noise | |
JP2002278585A (en) | Noise removal device | |
JP3171756B2 (en) | Noise removal device | |
JPH06250695A (en) | Method and device for pitch control | |
WO2013018092A1 (en) | Method and system for speech processing | |
JPH03122699A (en) | Noise removing device and voice recognition device using same device | |
JP2997668B1 (en) | Noise suppression method and noise suppression device | |
CN118175484A (en) | Method, apparatus and article of manufacture for suppressing acoustic interference |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040114 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040415 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060320 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060712 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060718 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060801 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060824 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100901 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110901 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120901 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120901 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130901 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |