JP2002315089A - 話者方向検出回路 - Google Patents
話者方向検出回路Info
- Publication number
- JP2002315089A JP2002315089A JP2001120432A JP2001120432A JP2002315089A JP 2002315089 A JP2002315089 A JP 2002315089A JP 2001120432 A JP2001120432 A JP 2001120432A JP 2001120432 A JP2001120432 A JP 2001120432A JP 2002315089 A JP2002315089 A JP 2002315089A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- cross
- correlation
- signal
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
(57)【要約】
【課題】 話者方向の検出誤りを低減し安定性を高める
ことができる話者方向検出回路を得る。 【解決手段】 水平・垂直方向共通検出用マイクロホン
2からの信号を基にピッチ検出回路7がピッチ予測信号
を出力する。減算器9は、マイクロホン2からの信号か
らピッチ予測信号を減算する。相互相関演算回路11
は、水平方向検出用マイクロホン1からの信号と減算器
9からの信号との相互相関関数を演算して最大値検索を
行い、時間差を算出する。位置検出回路13は、その時
間差を基に話者の水平方向位置検出を行う。
ことができる話者方向検出回路を得る。 【解決手段】 水平・垂直方向共通検出用マイクロホン
2からの信号を基にピッチ検出回路7がピッチ予測信号
を出力する。減算器9は、マイクロホン2からの信号か
らピッチ予測信号を減算する。相互相関演算回路11
は、水平方向検出用マイクロホン1からの信号と減算器
9からの信号との相互相関関数を演算して最大値検索を
行い、時間差を算出する。位置検出回路13は、その時
間差を基に話者の水平方向位置検出を行う。
Description
【0001】
【発明の属する技術分野】本発明は話者方向検出回路に
関し、特にテレビジョン会議装置において画像入力用ビ
デオカメラと音声入力用マイクロホンとの設置場所が固
定されている装置のビデオカメラ撮像角制御に用いら
れ、音声信号によって装置から見た話者の方向を検出す
る話者方向検出回路に関する。
関し、特にテレビジョン会議装置において画像入力用ビ
デオカメラと音声入力用マイクロホンとの設置場所が固
定されている装置のビデオカメラ撮像角制御に用いら
れ、音声信号によって装置から見た話者の方向を検出す
る話者方向検出回路に関する。
【0002】
【従来の技術】従来、話者の方向を検出する方式におい
ては、“音響システムとディジタル処理”(大賀・山崎
・金田著、電子情報通信学会編、平成7年3月25日)
のp.197の「7.2 音の到達方向とパワーの推定
技術」に記載されているように、2つのマイクロホンへ
の音声の到達時間差(遅延)を検出する手段として、相
互相関関数が一般に用いられている。この相互相関関数
を算出することで、図13または図14に示すように、
その最大値を与える到達時間差が検出でき、この時間差
を基に音波の到達方向、すなわち話者の位置を推定でき
ることが一般に知られている。
ては、“音響システムとディジタル処理”(大賀・山崎
・金田著、電子情報通信学会編、平成7年3月25日)
のp.197の「7.2 音の到達方向とパワーの推定
技術」に記載されているように、2つのマイクロホンへ
の音声の到達時間差(遅延)を検出する手段として、相
互相関関数が一般に用いられている。この相互相関関数
を算出することで、図13または図14に示すように、
その最大値を与える到達時間差が検出でき、この時間差
を基に音波の到達方向、すなわち話者の位置を推定でき
ることが一般に知られている。
【0003】図12は複数本のマイクロホンで受信した
信号の時間差の理論を示す図である。図12において、
M1及びM2はマイクロホンであり、χ1(t)はマイ
クロホンM1の受信信号であり、χ2(t)はマイクロ
ホンM2の受信信号である。θs 方向からマイクロホン
M1及びM2に到達する音波を平面波とし、その音波が
距離dだけ離れて設置された2つのマイクロホンM1及
びM2で受信される。
信号の時間差の理論を示す図である。図12において、
M1及びM2はマイクロホンであり、χ1(t)はマイ
クロホンM1の受信信号であり、χ2(t)はマイクロ
ホンM2の受信信号である。θs 方向からマイクロホン
M1及びM2に到達する音波を平面波とし、その音波が
距離dだけ離れて設置された2つのマイクロホンM1及
びM2で受信される。
【0004】このとき、各マイクロホンM1及びM2の
受信信号である信号χ1(t)と信号χ2(t)との間
には、 χ2(t)=χ1(t−τs) τs=d×sin(θs)/c という関係が成立する。ここで、cは音速である。
受信信号である信号χ1(t)と信号χ2(t)との間
には、 χ2(t)=χ1(t−τs) τs=d×sin(θs)/c という関係が成立する。ここで、cは音速である。
【0005】したがって、逆に信号χ1(t)と信号χ
2(t)との間の時間差τsが分かれば、音波の到達方
向θsは θs=sin-1(c・τs/d) という式で求められる。
2(t)との間の時間差τsが分かれば、音波の到達方
向θsは θs=sin-1(c・τs/d) という式で求められる。
【0006】時間差τsは、χ1(t)とχ2(t)と
の相互相関関数φ12(τ)から、 φ12(τ)=E[χ1(t)・χ2(t+τ)] =E[χ1(t)・χ1(t+τ−τs)] =φ11(τ−τs) となる。ただし、E[・]は期待値を表し、φ11
(τ)は信号χ1(t)の自己相関関数である。
の相互相関関数φ12(τ)から、 φ12(τ)=E[χ1(t)・χ2(t+τ)] =E[χ1(t)・χ1(t+τ−τs)] =φ11(τ−τs) となる。ただし、E[・]は期待値を表し、φ11
(τ)は信号χ1(t)の自己相関関数である。
【0007】自己相関関数φ11(τ)はτ=0で最大
値をとることが知られているため、相互相関関数φ12
(τ)はτ=τsで最大値をとる。このことより、相互
相関関数φ12(τ)を計算し、その最大値を与えるτ
を求めればτsが得られ、その値を到達方向θsを求め
る式に代入すれば、音波の方向を推定する事ができる。
したがって、この推定結果から到達遅延時間を求め、話
者方向に換算して出力するという動作をする。
値をとることが知られているため、相互相関関数φ12
(τ)はτ=τsで最大値をとる。このことより、相互
相関関数φ12(τ)を計算し、その最大値を与えるτ
を求めればτsが得られ、その値を到達方向θsを求め
る式に代入すれば、音波の方向を推定する事ができる。
したがって、この推定結果から到達遅延時間を求め、話
者方向に換算して出力するという動作をする。
【0008】
【発明が解決しようとする課題】上述した相互相関関数
は、周波数帯域幅が広い場合は、比較的鋭いピークを持
つことが既に知られている。よって、このようにピーク
が鋭い場合は、雑音等が重畳しても精度の良い時間差τ
sを推定できる。しかしながら、ピークの鋭さは、音波
信号の周波数帯域幅に影響を受けるし、雑音の影響も受
ける。また、相互相関関数の値は、マイクロホンに到達
した音声の信号電力に依存する。そのため、何らかの方
法でそのような影響を排除しなければ、相互相関関数の
最大値の検索誤りが多発し、その結果として話者の方向
検出を誤ってしまうので、話者方向検出装置の出力信号
を用いてビデオカメラの撮像角を制御しようとした場
合、話者以外の方向にビデオカメラが向いてしまうとい
った問題が起こり、テレビジョン会議システムの利用者
に多大な不都合が生じてしまうという問題がある。
は、周波数帯域幅が広い場合は、比較的鋭いピークを持
つことが既に知られている。よって、このようにピーク
が鋭い場合は、雑音等が重畳しても精度の良い時間差τ
sを推定できる。しかしながら、ピークの鋭さは、音波
信号の周波数帯域幅に影響を受けるし、雑音の影響も受
ける。また、相互相関関数の値は、マイクロホンに到達
した音声の信号電力に依存する。そのため、何らかの方
法でそのような影響を排除しなければ、相互相関関数の
最大値の検索誤りが多発し、その結果として話者の方向
検出を誤ってしまうので、話者方向検出装置の出力信号
を用いてビデオカメラの撮像角を制御しようとした場
合、話者以外の方向にビデオカメラが向いてしまうとい
った問題が起こり、テレビジョン会議システムの利用者
に多大な不都合が生じてしまうという問題がある。
【0009】そこで、ピークの鋭さが受ける影響による
誤検出を抑えるために、全指向性マイクロホンから入力
される2つの音声信号間に存在する到達遅延時間を推定
する部分に、上記の相互相関関数の値に時間的な統計処
理を施して誤りを排除する手段を設けるようにした第1
の技術が特願2000−045306号明細書に記載さ
れている。この統計処理は、例えば相互相関関数値をあ
る時間加算した後に最大値検索を実行するものである。
したがって、統計的処理を行った後に最大値検索をする
ので、検索誤りの発生を最小限に抑えるという効果が得
られる。
誤検出を抑えるために、全指向性マイクロホンから入力
される2つの音声信号間に存在する到達遅延時間を推定
する部分に、上記の相互相関関数の値に時間的な統計処
理を施して誤りを排除する手段を設けるようにした第1
の技術が特願2000−045306号明細書に記載さ
れている。この統計処理は、例えば相互相関関数値をあ
る時間加算した後に最大値検索を実行するものである。
したがって、統計的処理を行った後に最大値検索をする
ので、検索誤りの発生を最小限に抑えるという効果が得
られる。
【0010】特願2000−045306号明細書に記
載された上記第1の技術を以下に説明する。図9は上記
第1の技術による話者方向検出回路の構成を示すブロッ
ク図であり、図3は図9のマイクロホンの配置例を示す
図である。なお、以下に示す全ての図面において、同等
部分は同一符号にて示している。
載された上記第1の技術を以下に説明する。図9は上記
第1の技術による話者方向検出回路の構成を示すブロッ
ク図であり、図3は図9のマイクロホンの配置例を示す
図である。なお、以下に示す全ての図面において、同等
部分は同一符号にて示している。
【0011】図9において、話者方向検出回路は、水平
方向検出用の全指向性マイクロホン(MIC#1)1
と、水平・垂直方向共通検出用の全指向性マイクロホン
(MIC#2)2と、垂直方向検出用の全指向性マイク
ロホン(MIC#3)3と、メモリ回路4〜6と、水平
方向検出用の相互相関演算回路11と、水平方向検出用
の評価関数回路18と、垂直方向検出用の相互相関演算
回路12と、垂直方向検出用の評価関数回路19と、位
置検出回路13とから構成されている。
方向検出用の全指向性マイクロホン(MIC#1)1
と、水平・垂直方向共通検出用の全指向性マイクロホン
(MIC#2)2と、垂直方向検出用の全指向性マイク
ロホン(MIC#3)3と、メモリ回路4〜6と、水平
方向検出用の相互相関演算回路11と、水平方向検出用
の評価関数回路18と、垂直方向検出用の相互相関演算
回路12と、垂直方向検出用の評価関数回路19と、位
置検出回路13とから構成されている。
【0012】マイクロホン1,2からの信号はメモリ回
路4,6に一旦蓄積された後、相互相関演算回路11に
供給される。ここで、マイクロホン1,2は図3に示す
マイクロホン1,2に該当するように水平方向に置か
れ、水平方向位置探索に使用される。
路4,6に一旦蓄積された後、相互相関演算回路11に
供給される。ここで、マイクロホン1,2は図3に示す
マイクロホン1,2に該当するように水平方向に置か
れ、水平方向位置探索に使用される。
【0013】相互相関演算回路11は相互相関演算を行
い、時間差毎の相互相関関数値を算出する。評価関数回
路18は相互相関演算回路11で得られた結果を基にあ
る時間分の加算処理を行った後に最大値検索を行い、時
間差を算出する。位置算出回路13はその時間差を基に
水平方向角を求める。
い、時間差毎の相互相関関数値を算出する。評価関数回
路18は相互相関演算回路11で得られた結果を基にあ
る時間分の加算処理を行った後に最大値検索を行い、時
間差を算出する。位置算出回路13はその時間差を基に
水平方向角を求める。
【0014】マイクロホン2,3からの信号はメモリ回
路5,6に一旦蓄積された後、相互相関演算回路12に
供給される。ここで、マイクロホン2,3は図3に示す
マイクロホン2,3に該当するように垂直方向に置か
れ、垂直方向位置探索に使用される。
路5,6に一旦蓄積された後、相互相関演算回路12に
供給される。ここで、マイクロホン2,3は図3に示す
マイクロホン2,3に該当するように垂直方向に置か
れ、垂直方向位置探索に使用される。
【0015】相互相関演算回路12は相互相関演算を行
い、時間差毎の相互相関関数値を算出する。評価関数回
路19は相互相関演算回路12で得られた結果を基にあ
る時間分の加算処理を行った後に最大値検索を行い、時
間差を算出する。位置算出回路13はその時間差を基に
垂直方向角を求める。
い、時間差毎の相互相関関数値を算出する。評価関数回
路19は相互相関演算回路12で得られた結果を基にあ
る時間分の加算処理を行った後に最大値検索を行い、時
間差を算出する。位置算出回路13はその時間差を基に
垂直方向角を求める。
【0016】また、相互相関関数の値はマイクロホンに
到達した音声の信号電力に依存するため、評価関数に相
互相関の2乗/時間差の自己相関を用いることによって
最大値検索をするようにした第2の技術が特願2000
−045306号明細書に記載されている。この評価関
数は、χ1(t)とχ2(t−τ)の二乗誤差を最小に
する理論式から導かれたものである。
到達した音声の信号電力に依存するため、評価関数に相
互相関の2乗/時間差の自己相関を用いることによって
最大値検索をするようにした第2の技術が特願2000
−045306号明細書に記載されている。この評価関
数は、χ1(t)とχ2(t−τ)の二乗誤差を最小に
する理論式から導かれたものである。
【0017】χ1(t)とχ2(t−τ)とがあるフレ
ーム区間毎(Nサンプル)に二乗誤差を最小にすること
を考えた場合、二乗誤差を最小にするゲインGと時間差
τとを求める。
ーム区間毎(Nサンプル)に二乗誤差を最小にすること
を考えた場合、二乗誤差を最小にするゲインGと時間差
τとを求める。
【0018】tをnとして、誤差をe(n)=χ1
(n)−χ2(n)=χ1(n)−χ1(n−τ)とす
ると、二乗誤差Eは、 E=Σe(n)2 =Σ[χ1(n)−G・χ1(n−τ)]2 =Σ[χ1(n)]2−2GΣ[χ1(n)χ1(n−
τ)]+G2 Σ[χ1(n−τ)]2 という式から求められる。ここで、Σはn=0〜(N−
1)の総和である。
(n)−χ2(n)=χ1(n)−χ1(n−τ)とす
ると、二乗誤差Eは、 E=Σe(n)2 =Σ[χ1(n)−G・χ1(n−τ)]2 =Σ[χ1(n)]2−2GΣ[χ1(n)χ1(n−
τ)]+G2 Σ[χ1(n−τ)]2 という式から求められる。ここで、Σはn=0〜(N−
1)の総和である。
【0019】Eを最小にするGについて求めるには、極
小解を求めればよいから、 −2GΣ[χ1(n)χ1(n−τ)]+G2 Σ[χ
1(n−τ)]2=0 ∴G=Σ[χ1(n)・χ1(n−τ)]/Σ[χ1
(n−τ)]2 となる。これをEの式に代入すると、 E=Σ[χ1(n)]2−{[Σ[χ1(n)χ1(n
−τ)]}2/Σ[χ1(n−τ)]2 となる。上記の右辺第2項を最大化するτを求めれば二
乗誤差が最小となる。これは、要するに、「相互相関の
2乗÷時間差τsの自己相関」を示している。
小解を求めればよいから、 −2GΣ[χ1(n)χ1(n−τ)]+G2 Σ[χ
1(n−τ)]2=0 ∴G=Σ[χ1(n)・χ1(n−τ)]/Σ[χ1
(n−τ)]2 となる。これをEの式に代入すると、 E=Σ[χ1(n)]2−{[Σ[χ1(n)χ1(n
−τ)]}2/Σ[χ1(n−τ)]2 となる。上記の右辺第2項を最大化するτを求めれば二
乗誤差が最小となる。これは、要するに、「相互相関の
2乗÷時間差τsの自己相関」を示している。
【0020】図10は上記第2の技術による話者方向検
出回路の構成を示すブロック図である。図10におい
て、話者方向検出回路は、水平方向検出用のマイクロホ
ン1と、水平・垂直方向共通検出用のマイクロホン2
と、垂直方向検出用のマイクロホン3と、メモリ回路4
〜6と、水平方向検出用の相互相関演算回路11と、水
平方向検出用の自己相関演算回路20と、水平方向検出
用の評価関数回路22と、垂直方向検出用の相互相関演
算回路12と、垂直方向検出用の自己相関演算回路21
と、垂直方向検出用の評価関数回路23と、位置検出回
路13とから構成されている。
出回路の構成を示すブロック図である。図10におい
て、話者方向検出回路は、水平方向検出用のマイクロホ
ン1と、水平・垂直方向共通検出用のマイクロホン2
と、垂直方向検出用のマイクロホン3と、メモリ回路4
〜6と、水平方向検出用の相互相関演算回路11と、水
平方向検出用の自己相関演算回路20と、水平方向検出
用の評価関数回路22と、垂直方向検出用の相互相関演
算回路12と、垂直方向検出用の自己相関演算回路21
と、垂直方向検出用の評価関数回路23と、位置検出回
路13とから構成されている。
【0021】この話者方向検出回路は、自己相関演算回
路20,21を加えた以外は図9に示す話者方向検出回
路と同様の構成となっている。これら自己相関演算回路
20,21は評価関数回路22,23にて「相互相関の
二乗÷自己相関」を評価関数として計算する際に使用す
る。
路20,21を加えた以外は図9に示す話者方向検出回
路と同様の構成となっている。これら自己相関演算回路
20,21は評価関数回路22,23にて「相互相関の
二乗÷自己相関」を評価関数として計算する際に使用す
る。
【0022】評価関数がある時間分加算処理された後に
その最大値検索が行われ、時間差が算出される。時間差
を算出した結果を基に、位置算出回路13にて水平方向
角を求める処理が行われる。ただし、自己相関演算回路
20,21の演算結果は同じなので、どちらか片方のみ
の演算を行い、その結果を評価関数回路22,23の入
力としてもよい。
その最大値検索が行われ、時間差が算出される。時間差
を算出した結果を基に、位置算出回路13にて水平方向
角を求める処理が行われる。ただし、自己相関演算回路
20,21の演算結果は同じなので、どちらか片方のみ
の演算を行い、その結果を評価関数回路22,23の入
力としてもよい。
【0023】図13に一般的な水平方向位置算出の検出
例を示す。この水平方向位置算出については当業者にと
ってよく知られており、また本発明とは直接関係しない
ので、その詳細な構成は省略する。尚、水平方向角は、 Lsinθ=νTh θ=sin-1(νTh /L) という式によって検出される。この場合、時間差(遅
延)Th はサンプリング周期[sec]×時間差[サ
ンプル]で求められる。
例を示す。この水平方向位置算出については当業者にと
ってよく知られており、また本発明とは直接関係しない
ので、その詳細な構成は省略する。尚、水平方向角は、 Lsinθ=νTh θ=sin-1(νTh /L) という式によって検出される。この場合、時間差(遅
延)Th はサンプリング周期[sec]×時間差[サ
ンプル]で求められる。
【0024】図14に一般的な垂直方向位置算出の検出
例を示す。この垂直方向位置算出についても当業者にと
ってよく知られており、また本発明とは直接関係しない
ので、その詳細な構成は省略する。すなわち、垂直方向
位置算出は上記の図13に示す水平方向位置算出と全く
同様に導ける。
例を示す。この垂直方向位置算出についても当業者にと
ってよく知られており、また本発明とは直接関係しない
ので、その詳細な構成は省略する。すなわち、垂直方向
位置算出は上記の図13に示す水平方向位置算出と全く
同様に導ける。
【0025】図11は上記第2の技術による話者方向検
出回路の動作を示すフローチャートである。これら図1
0及び図11を参照して第2の技術による話者方向検出
回路の動作について説明する。
出回路の動作を示すフローチャートである。これら図1
0及び図11を参照して第2の技術による話者方向検出
回路の動作について説明する。
【0026】回路動作開始時点で、評価結果の加算時間
分を検出するカウンタ(CNT)値を初期化する(図1
1ステップS1)。この時点で、評価関数加算値は全て
初期化されているとする。マイクロホン1〜3から音声
データを入手した後(図11ステップS2)、16kH
zサンプリングで32から40サンプル程度毎に自己相
関演算回路20,21及び相互相関演算回路11,12
で自己相関関数及び相互相関関数を計算する(図11ス
テップS3,S4)。
分を検出するカウンタ(CNT)値を初期化する(図1
1ステップS1)。この時点で、評価関数加算値は全て
初期化されているとする。マイクロホン1〜3から音声
データを入手した後(図11ステップS2)、16kH
zサンプリングで32から40サンプル程度毎に自己相
関演算回路20,21及び相互相関演算回路11,12
で自己相関関数及び相互相関関数を計算する(図11ス
テップS3,S4)。
【0027】自己相関関数及び相互相関関関数はバッフ
ァ(図示せず)にデータを蓄積してフレーム単位で一気
に処理を行うか、もしくはサンプル毎の部分に分割して
計算を行うことによっても計算することができるので、
どちらのやり方でもよい。
ァ(図示せず)にデータを蓄積してフレーム単位で一気
に処理を行うか、もしくはサンプル毎の部分に分割して
計算を行うことによっても計算することができるので、
どちらのやり方でもよい。
【0028】分割処理の場合、評価関数回路22,23
は相関関数演算が終わっているかを相関演算終了確認に
おいて判定し(図11ステップS5)、相関関数演算が
終了していなければステップS2に戻って音声データを
入手する。
は相関関数演算が終わっているかを相関演算終了確認に
おいて判定し(図11ステップS5)、相関関数演算が
終了していなければステップS2に戻って音声データを
入手する。
【0029】相関関数演算が終了していれば、評価関数
回路22,23は自己相関演算及び相互相関演算によっ
て得られた結果を基に評価関数の算出を行う(図11ス
テップS6)。評価関数は「相互相関のみ」を使用する
か、または「(相互相関の二乗)/自己相関」を使用し
て評価関数として計算する。ここで得られた評価関数を
統計的に平均化するため、評価関数回路22,23は評
価結果の加算において過去の結果に加算して蓄積する
(図11ステップS7)。
回路22,23は自己相関演算及び相互相関演算によっ
て得られた結果を基に評価関数の算出を行う(図11ス
テップS6)。評価関数は「相互相関のみ」を使用する
か、または「(相互相関の二乗)/自己相関」を使用し
て評価関数として計算する。ここで得られた評価関数を
統計的に平均化するため、評価関数回路22,23は評
価結果の加算において過去の結果に加算して蓄積する
(図11ステップS7)。
【0030】この後、カウンタ値は蓄積時間を計るのに
使用しているため、カウンタ値の更新を行う(図11ス
テップS8)。評価関数回路22,23はこの更新した
カウンタ値と予め設定したMAX値とを比較して更新し
たカウンタ値の確認を行う(図11ステップS9)。M
AX値は200msから1s程度の任意の値とすると良
い。
使用しているため、カウンタ値の更新を行う(図11ス
テップS8)。評価関数回路22,23はこの更新した
カウンタ値と予め設定したMAX値とを比較して更新し
たカウンタ値の確認を行う(図11ステップS9)。M
AX値は200msから1s程度の任意の値とすると良
い。
【0031】カウンタ値がMAX値と一致しない場合に
はステップS2に戻って音声データを入手する。カウン
タ値がMAX値と一致した場合、評価関数回路22,2
3はカウンタ値を0に初期化した後(図11ステップS
10)、評価結果の最大値検索を行い(図11ステップ
S11)、最大となるときの時間差を検出する。
はステップS2に戻って音声データを入手する。カウン
タ値がMAX値と一致した場合、評価関数回路22,2
3はカウンタ値を0に初期化した後(図11ステップS
10)、評価結果の最大値検索を行い(図11ステップ
S11)、最大となるときの時間差を検出する。
【0032】この後に、評価関数回路22,23は評価
関数加算結果を初期化し(図11ステップS12)、位
置検出回路13は評価関数回路22,23で検出された
時間差から方向を算出する(図11ステップS13)。
これによって、次に新しく開始する評価関数加算に備え
る。
関数加算結果を初期化し(図11ステップS12)、位
置検出回路13は評価関数回路22,23で検出された
時間差から方向を算出する(図11ステップS13)。
これによって、次に新しく開始する評価関数加算に備え
る。
【0033】ところで、図11におけるステップS2〜
S13の処理は水平方向及び垂直方向に対してそれぞれ
独立的に処理する必要がある。但し、自己相関の結果を
使用しない場合にはステップS3の処理を省略してよ
く、上記第1の技術ではステップS3の処理を省略した
処理動作が行われる。
S13の処理は水平方向及び垂直方向に対してそれぞれ
独立的に処理する必要がある。但し、自己相関の結果を
使用しない場合にはステップS3の処理を省略してよ
く、上記第1の技術ではステップS3の処理を省略した
処理動作が行われる。
【0034】ここで、音波の到達時間差の算出は、音声
符号化におけるピッチ予測と非常に似ており、一般に
は、ピッチの相関≦マイクロホン間の相関(相関が強い
/弱いという意味の不等号)となっている。しかし、正
弦波などのように非常に強力なピッチをもつ入力信号で
は、ピッチの相関=マイクロホン間の相関となってしま
う。この場合、上述した従来技術及び特願2000−0
45306号明細書に記載の第1,第2の技術では、検
索した最大値がピッチによるものか、マイクロホン間の
距離によるものか判別できず、到達時間差を誤検出して
しまうという問題がある。
符号化におけるピッチ予測と非常に似ており、一般に
は、ピッチの相関≦マイクロホン間の相関(相関が強い
/弱いという意味の不等号)となっている。しかし、正
弦波などのように非常に強力なピッチをもつ入力信号で
は、ピッチの相関=マイクロホン間の相関となってしま
う。この場合、上述した従来技術及び特願2000−0
45306号明細書に記載の第1,第2の技術では、検
索した最大値がピッチによるものか、マイクロホン間の
距離によるものか判別できず、到達時間差を誤検出して
しまうという問題がある。
【0035】本発明の目的は、話者方向の検出誤りを低
減し安定性を高めることができる話者方向検出回路を提
供することである。
減し安定性を高めることができる話者方向検出回路を提
供することである。
【0036】
【課題を解決するための手段】本発明による話者方向検
出回路は、2つのマイクロホンで受信された音声の音声
信号が入力され、それらの少なくとも一方からピッチの
影響を取り除いてそれらを出力するピッチ影響除去手段
と、前記ピッチ影響除去手段の出力信号を基に前記音声
信号間の時間差を算出し、その算出された時間差に基づ
いて話者の方向検出を行う検出手段とを含むことを特徴
とする。また、前記話者方向検出回路において、前記検
出手段は、前記ピッチ影響除去手段の出力信号の相互相
関関数を演算する相互相関演算手段を含み、前記相互相
関関数の最大値を検出して話者の方向検出を行うことを
特徴とする。
出回路は、2つのマイクロホンで受信された音声の音声
信号が入力され、それらの少なくとも一方からピッチの
影響を取り除いてそれらを出力するピッチ影響除去手段
と、前記ピッチ影響除去手段の出力信号を基に前記音声
信号間の時間差を算出し、その算出された時間差に基づ
いて話者の方向検出を行う検出手段とを含むことを特徴
とする。また、前記話者方向検出回路において、前記検
出手段は、前記ピッチ影響除去手段の出力信号の相互相
関関数を演算する相互相関演算手段を含み、前記相互相
関関数の最大値を検出して話者の方向検出を行うことを
特徴とする。
【0037】さらに、前記話者方向検出回路において、
前記ピッチ影響除去手段は、前記ピッチの影響を取り除
くべき前記音声信号のピッチゲイン及びピッチ周期を抽
出する抽出手段と、前記ピッチゲイン及びピッチ周期を
基にピッチ予測信号を生成するピッチ予測手段と、前記
ピッチの影響を取り除くべき前記音声信号から前記ピッ
チ予測信号を減算して前記出力信号を生成する減算手段
とを有することを特徴とする。
前記ピッチ影響除去手段は、前記ピッチの影響を取り除
くべき前記音声信号のピッチゲイン及びピッチ周期を抽
出する抽出手段と、前記ピッチゲイン及びピッチ周期を
基にピッチ予測信号を生成するピッチ予測手段と、前記
ピッチの影響を取り除くべき前記音声信号から前記ピッ
チ予測信号を減算して前記出力信号を生成する減算手段
とを有することを特徴とする。
【0038】本発明の作用は次の通りである。話者の発
した音声が2つのマイクロホンに到達する距離の差によ
って生じる到達時間差を推定すべく、まず、ピッチ影響
除去手段は、例えば、2つのマイクロホンからの音声信
号の一方からピッチの影響を取り除いて出力し、他方の
音声信号をそのまま出力する。相互相関演算手段は、ピ
ッチ影響除去手段から出力されたピッチ影響の除かれた
信号と上記他方の音声信号との相互相関関数を演算し、
検出手段が、相互相関演算手段の演算結果の最大値を検
出することで上記到達時間差を推定して話者の方向検出
を行う。
した音声が2つのマイクロホンに到達する距離の差によ
って生じる到達時間差を推定すべく、まず、ピッチ影響
除去手段は、例えば、2つのマイクロホンからの音声信
号の一方からピッチの影響を取り除いて出力し、他方の
音声信号をそのまま出力する。相互相関演算手段は、ピ
ッチ影響除去手段から出力されたピッチ影響の除かれた
信号と上記他方の音声信号との相互相関関数を演算し、
検出手段が、相互相関演算手段の演算結果の最大値を検
出することで上記到達時間差を推定して話者の方向検出
を行う。
【0039】あるいは、ピッチ影響除去手段は、例え
ば、2つのマイクロホンからの音声信号からそれぞれピ
ッチの影響を取り除いて出力する。相互相関演算手段
は、ピッチ影響除去手段から出力されたピッチ影響の除
かれた信号間の相互相関関数を演算し、検出手段が、相
互相関演算手段の演算結果の最大値を検出することで上
記到達時間差を推定して話者の方向検出を行う。
ば、2つのマイクロホンからの音声信号からそれぞれピ
ッチの影響を取り除いて出力する。相互相関演算手段
は、ピッチ影響除去手段から出力されたピッチ影響の除
かれた信号間の相互相関関数を演算し、検出手段が、相
互相関演算手段の演算結果の最大値を検出することで上
記到達時間差を推定して話者の方向検出を行う。
【0040】
【発明の実施の形態】以下に、本発明の実施例について
図面を用いて説明する。図1は本発明の第1の実施例に
よる話者方向検出回路の構成を示すブロック図であり、
図2は図1のピッチ検出回路の構成を示すブロック図で
あり、図3は図1のマイクロホンの配置例を示す図であ
る。
図面を用いて説明する。図1は本発明の第1の実施例に
よる話者方向検出回路の構成を示すブロック図であり、
図2は図1のピッチ検出回路の構成を示すブロック図で
あり、図3は図1のマイクロホンの配置例を示す図であ
る。
【0041】図1において、本発明の第1の実施例によ
る話者方向検出回路は、水平方向検出用の全指向性マイ
クロホン(MIC#1)1と、水平・垂直方向共通検出
用の全指向性マイクロホン(MIC#2)2と、垂直方
向検出用の全指向性マイクロホン(MIC#3)3と、
メモリ回路4〜6と、ピッチ検出回路7及び8と、減算
器9及び10と、水平方向検出用の相互相関演算回路1
1と、垂直方向検出用の相互相関演算回路12と、位置
検出回路13とを有している。
る話者方向検出回路は、水平方向検出用の全指向性マイ
クロホン(MIC#1)1と、水平・垂直方向共通検出
用の全指向性マイクロホン(MIC#2)2と、垂直方
向検出用の全指向性マイクロホン(MIC#3)3と、
メモリ回路4〜6と、ピッチ検出回路7及び8と、減算
器9及び10と、水平方向検出用の相互相関演算回路1
1と、垂直方向検出用の相互相関演算回路12と、位置
検出回路13とを有している。
【0042】マイクロホン1からの信号はメモリ回路4
に一旦蓄積された後、相互相関演算回路11に供給され
る。また、マイクロホン2からの信号はメモリ回路6に
一旦蓄積された後、ピッチ影響排除手段を構成するピッ
チ検出回路7と減算器9とに供給される。ここで、マイ
クロホン1,2は図3に示すマイクロホン1,2に該当
するように水平方向に置かれ、水平方向位置探索に使用
される。
に一旦蓄積された後、相互相関演算回路11に供給され
る。また、マイクロホン2からの信号はメモリ回路6に
一旦蓄積された後、ピッチ影響排除手段を構成するピッ
チ検出回路7と減算器9とに供給される。ここで、マイ
クロホン1,2は図3に示すマイクロホン1,2に該当
するように水平方向に置かれ、水平方向位置探索に使用
される。
【0043】図2において、ピッチ検出回路7は、入力
信号のピッチゲインとピッチ周期とを抽出する抽出器1
00と、抽出器100からのピッチゲインとピッチ周期
とを基にピッチ予測信号を生成出力するピッチ予測器1
10とを有している。ピッチ検出の方法としては、例え
ば「“音のコミュニケーション工学”−マルチメディア
時代の音声・音響技術−」(編者:(社)日本音響学
会,発行社:(株)コロナ社)のP28に記載されてい
るように、自己相関法、変形相関法、スペクトル処理に
よる方法などがある。なお、ピッチ検出回路8の構成は
ピッチ検出回路7と同等であるので、その説明を省略す
る。
信号のピッチゲインとピッチ周期とを抽出する抽出器1
00と、抽出器100からのピッチゲインとピッチ周期
とを基にピッチ予測信号を生成出力するピッチ予測器1
10とを有している。ピッチ検出の方法としては、例え
ば「“音のコミュニケーション工学”−マルチメディア
時代の音声・音響技術−」(編者:(社)日本音響学
会,発行社:(株)コロナ社)のP28に記載されてい
るように、自己相関法、変形相関法、スペクトル処理に
よる方法などがある。なお、ピッチ検出回路8の構成は
ピッチ検出回路7と同等であるので、その説明を省略す
る。
【0044】図1において、減算器9は、マイクロホン
2からの信号からピッチ検出回路7の出力であるピッチ
予測信号を減算して、ピッチ予測残差信号を相互相関演
算回路11に出力する。相互相関演算回路11は、マイ
クロホン1からの信号とピッチの影響を取り除かれた信
号であるピッチ予測残差信号との相互相関演算を行い、
時間差毎の相互相関関数値を算出してその最大値検索を
行い、時間差を算出する。位置算出回路13はその時間
差を基に水平方向角を求める。
2からの信号からピッチ検出回路7の出力であるピッチ
予測信号を減算して、ピッチ予測残差信号を相互相関演
算回路11に出力する。相互相関演算回路11は、マイ
クロホン1からの信号とピッチの影響を取り除かれた信
号であるピッチ予測残差信号との相互相関演算を行い、
時間差毎の相互相関関数値を算出してその最大値検索を
行い、時間差を算出する。位置算出回路13はその時間
差を基に水平方向角を求める。
【0045】マイクロホン2からの信号はメモリ回路6
に一旦蓄積された後、ピッチ影響排除手段を構成するピ
ッチ検出回路8と減算器10とに供給される。また、マ
イクロホン3からの信号はメモリ回路5に一旦蓄積され
た後、相互相関演算回路12に供給される。ここで、マ
イクロホン2,3は図3に示すマイクロホン2,3に該
当するように垂直方向に置かれ、垂直方向位置探索に使
用される。
に一旦蓄積された後、ピッチ影響排除手段を構成するピ
ッチ検出回路8と減算器10とに供給される。また、マ
イクロホン3からの信号はメモリ回路5に一旦蓄積され
た後、相互相関演算回路12に供給される。ここで、マ
イクロホン2,3は図3に示すマイクロホン2,3に該
当するように垂直方向に置かれ、垂直方向位置探索に使
用される。
【0046】減算器10は、マイクロホン2からの信号
からピッチ検出回路8の出力であるピッチ予測信号を減
算して、ピッチ予測残差信号を相互相関演算回路12に
出力する。相互相関演算回路12は、マイクロホン3か
らの信号とピッチの影響を取り除かれた信号であるピッ
チ予測残差信号との相互相関演算を行い、時間差毎の相
互相関関数値を算出してその最大値検索を行い、時間差
を算出する。位置算出回路13はその時間差を基に垂直
方向角を求める。
からピッチ検出回路8の出力であるピッチ予測信号を減
算して、ピッチ予測残差信号を相互相関演算回路12に
出力する。相互相関演算回路12は、マイクロホン3か
らの信号とピッチの影響を取り除かれた信号であるピッ
チ予測残差信号との相互相関演算を行い、時間差毎の相
互相関関数値を算出してその最大値検索を行い、時間差
を算出する。位置算出回路13はその時間差を基に垂直
方向角を求める。
【0047】図4は本発明の第2の実施例による話者方
向検出回路の構成を示すブロック図である。図4におい
て、本発明の第2の実施例による話者方向検出回路は、
ピッチ検出回路14及び15と、減算器16及び17と
を有している点で上記第1の実施例による話者方向検出
回路と相違するが、その他については同様である。な
お、ピッチ検出回路14及び15の各々の構成はピッチ
検出回路7と同等である。
向検出回路の構成を示すブロック図である。図4におい
て、本発明の第2の実施例による話者方向検出回路は、
ピッチ検出回路14及び15と、減算器16及び17と
を有している点で上記第1の実施例による話者方向検出
回路と相違するが、その他については同様である。な
お、ピッチ検出回路14及び15の各々の構成はピッチ
検出回路7と同等である。
【0048】マイクロホン1からの信号は、メモリ回路
4に一旦蓄積された後、ピッチ影響排除手段を構成する
ピッチ検出回路14と減算器16とに供給される。減算
器16は、マイクロホン1からの信号からピッチ検出回
路14の出力であるピッチ予測信号を減算して、ピッチ
予測残差信号を相互相関演算回路11に出力する。した
がって、相互相関演算回路11は、減算器16からのピ
ッチ予測残差信号と減算器9からのピッチ予測残差信号
との相互相関演算を行い、時間差毎の相互相関関数値を
算出してその最大値検索を行い、時間差を算出すること
になる。
4に一旦蓄積された後、ピッチ影響排除手段を構成する
ピッチ検出回路14と減算器16とに供給される。減算
器16は、マイクロホン1からの信号からピッチ検出回
路14の出力であるピッチ予測信号を減算して、ピッチ
予測残差信号を相互相関演算回路11に出力する。した
がって、相互相関演算回路11は、減算器16からのピ
ッチ予測残差信号と減算器9からのピッチ予測残差信号
との相互相関演算を行い、時間差毎の相互相関関数値を
算出してその最大値検索を行い、時間差を算出すること
になる。
【0049】また、マイクロホン3からの信号は、メモ
リ回路5に一旦蓄積された後、ピッチ影響排除手段を構
成するピッチ検出回路15と減算器17とに供給され
る。減算器17は、マイクロホン3からの信号からピッ
チ検出回路15の出力であるピッチ予測信号を減算し
て、ピッチ予測残差信号を相互相関演算回路12に出力
する。したがって、相互相関演算回路12は、減算器1
7からのピッチ予測残差信号と減算器10からのピッチ
予測残差信号との相互相関演算を行い、時間差毎の相互
相関関数値を算出してその最大値検索を行い、時間差を
算出することになる。
リ回路5に一旦蓄積された後、ピッチ影響排除手段を構
成するピッチ検出回路15と減算器17とに供給され
る。減算器17は、マイクロホン3からの信号からピッ
チ検出回路15の出力であるピッチ予測信号を減算し
て、ピッチ予測残差信号を相互相関演算回路12に出力
する。したがって、相互相関演算回路12は、減算器1
7からのピッチ予測残差信号と減算器10からのピッチ
予測残差信号との相互相関演算を行い、時間差毎の相互
相関関数値を算出してその最大値検索を行い、時間差を
算出することになる。
【0050】このように、マイクロホン1及び3からの
信号に対してもピッチ影響を取り除くようにすること
で、誤検出をより低減させることが可能となる。
信号に対してもピッチ影響を取り除くようにすること
で、誤検出をより低減させることが可能となる。
【0051】図5は本発明の第3の実施例による話者方
向検出回路の構成を示すブロック図である。図5におい
て、本発明の第3の実施例による話者方向検出回路は、
マイクロホン1〜3と、メモリ回路4〜6と、ピッチ検
出回路7及び8と、減算器9及び10と、相互相関演算
回路11及び12と、評価関数回路18及び19と、位
置検出回路13とを有している。
向検出回路の構成を示すブロック図である。図5におい
て、本発明の第3の実施例による話者方向検出回路は、
マイクロホン1〜3と、メモリ回路4〜6と、ピッチ検
出回路7及び8と、減算器9及び10と、相互相関演算
回路11及び12と、評価関数回路18及び19と、位
置検出回路13とを有している。
【0052】すなわち、本発明の第3の実施例による話
者方向検出回路は、図9に示す話者方向検出回路にピッ
チ検出回路7及び8と、減算器9及び10とを付加した
構成である。
者方向検出回路は、図9に示す話者方向検出回路にピッ
チ検出回路7及び8と、減算器9及び10とを付加した
構成である。
【0053】マイクロホン2からの信号はメモリ回路6
に一旦蓄積された後、ピッチ検出回路7及び8と減算器
9及び10とに供給される。したがって、相互相関演算
回路11は、マイクロホン1からの信号と減算器9から
のピッチ予測残差信号との相互相関演算を行い、時間差
毎の相互相関関数値を算出して評価関数回路18に出力
する。また、相互相関演算回路12は、マイクロホン3
からの信号と減算器10からのピッチ予測残差信号との
相互相関演算を行い、時間差毎の相互相関関数値を算出
して評価関数回路19に出力する。その他については図
9に示す話者方向検出回路と同様であるので、その説明
を省略する。
に一旦蓄積された後、ピッチ検出回路7及び8と減算器
9及び10とに供給される。したがって、相互相関演算
回路11は、マイクロホン1からの信号と減算器9から
のピッチ予測残差信号との相互相関演算を行い、時間差
毎の相互相関関数値を算出して評価関数回路18に出力
する。また、相互相関演算回路12は、マイクロホン3
からの信号と減算器10からのピッチ予測残差信号との
相互相関演算を行い、時間差毎の相互相関関数値を算出
して評価関数回路19に出力する。その他については図
9に示す話者方向検出回路と同様であるので、その説明
を省略する。
【0054】図6は本発明の第4の実施例による話者方
向検出回路の構成を示すブロック図である。図6におい
て、本発明の第4の実施例による話者方向検出回路は、
ピッチ検出回路14及び15と、減算器16及び17と
を有している点で上記第3の実施例による話者方向検出
回路と相違するが、その他については同様である。
向検出回路の構成を示すブロック図である。図6におい
て、本発明の第4の実施例による話者方向検出回路は、
ピッチ検出回路14及び15と、減算器16及び17と
を有している点で上記第3の実施例による話者方向検出
回路と相違するが、その他については同様である。
【0055】このような構成により、本発明の第4の実
施例による話者方向検出回路では、相互相関演算回路1
1は、減算器16からのピッチ予測残差信号と減算器9
からのピッチ予測残差信号との相互相関演算を行い、時
間差毎の相互相関関数値を算出して評価関数回路18に
出力することになる。また、相互相関演算回路12は、
減算器17からのピッチ予測残差信号と減算器10から
のピッチ予測残差信号との相互相関演算を行い、時間差
毎の相互相関関数値を算出して評価関数回路19に出力
することになる。
施例による話者方向検出回路では、相互相関演算回路1
1は、減算器16からのピッチ予測残差信号と減算器9
からのピッチ予測残差信号との相互相関演算を行い、時
間差毎の相互相関関数値を算出して評価関数回路18に
出力することになる。また、相互相関演算回路12は、
減算器17からのピッチ予測残差信号と減算器10から
のピッチ予測残差信号との相互相関演算を行い、時間差
毎の相互相関関数値を算出して評価関数回路19に出力
することになる。
【0056】図7は本発明の第5の実施例による話者方
向検出回路の構成を示すブロック図である。図7におい
て、本発明の第5の実施例による話者方向検出回路は、
マイクロホン1〜3と、メモリ回路4〜6と、ピッチ検
出回路7及び8と、減算器9及び10と、相互相関演算
回路11及び12と、自己相関演算回路20及び21
と、評価関数回路22及び23と、位置検出回路13と
を有している。
向検出回路の構成を示すブロック図である。図7におい
て、本発明の第5の実施例による話者方向検出回路は、
マイクロホン1〜3と、メモリ回路4〜6と、ピッチ検
出回路7及び8と、減算器9及び10と、相互相関演算
回路11及び12と、自己相関演算回路20及び21
と、評価関数回路22及び23と、位置検出回路13と
を有している。
【0057】すなわち、本発明の第5の実施例による話
者方向検出回路は、図10に示す話者方向検出回路にピ
ッチ検出回路7及び8と、減算器9及び10とを付加し
た構成である。
者方向検出回路は、図10に示す話者方向検出回路にピ
ッチ検出回路7及び8と、減算器9及び10とを付加し
た構成である。
【0058】マイクロホン2からの信号はメモリ回路6
に一旦蓄積された後、ピッチ検出回路7及び8と減算器
9及び10とに供給される。したがって、相互相関演算
回路11は、マイクロホン1からの信号と減算器9から
のピッチ予測残差信号との相互相関演算を行い、時間差
毎の相互相関関数値を算出して評価関数回路22に出力
する。そして、自己相関演算回路20は、減算器9から
のピッチ予測残差信号の自己相関演算を行い、時間差毎
の自己相関関数値を算出して評価関数回路22に出力す
る。
に一旦蓄積された後、ピッチ検出回路7及び8と減算器
9及び10とに供給される。したがって、相互相関演算
回路11は、マイクロホン1からの信号と減算器9から
のピッチ予測残差信号との相互相関演算を行い、時間差
毎の相互相関関数値を算出して評価関数回路22に出力
する。そして、自己相関演算回路20は、減算器9から
のピッチ予測残差信号の自己相関演算を行い、時間差毎
の自己相関関数値を算出して評価関数回路22に出力す
る。
【0059】また、相互相関演算回路12は、マイクロ
ホン3からの信号と減算器10からのピッチ予測残差信
号との相互相関演算を行い、時間差毎の相互相関関数値
を算出して評価関数回路23に出力する。そして、自己
相関演算回路21は、減算器10からのピッチ予測残差
信号の自己相関演算を行い、時間差毎の自己相関関数値
を算出して評価関数回路23に出力する。その他につい
ては図10に示す話者方向検出回路と同様であるので、
その説明を省略する。
ホン3からの信号と減算器10からのピッチ予測残差信
号との相互相関演算を行い、時間差毎の相互相関関数値
を算出して評価関数回路23に出力する。そして、自己
相関演算回路21は、減算器10からのピッチ予測残差
信号の自己相関演算を行い、時間差毎の自己相関関数値
を算出して評価関数回路23に出力する。その他につい
ては図10に示す話者方向検出回路と同様であるので、
その説明を省略する。
【0060】次に、本発明の第5の実施例による話者方
向検出回路の動作について図7及び図11を用いて説明
するが、図10に示す話者方向検出回路の動作と同様の
動作についてはその説明を省略する。図7及び図11に
おいて、マイクロホン1〜3から音声データを入手した
後(図11ステップS2)、16kHzサンプリングで
32から40サンプル程度毎に、ピッチ検出回路7,8
でピッチ検出処理を行い(図示せず)、同様に自己相関
演算回路20,21及び相互相関演算回路11,12で
自己相関関数及び相互相関関数を計算する(図11ステ
ップS3,S4)。
向検出回路の動作について図7及び図11を用いて説明
するが、図10に示す話者方向検出回路の動作と同様の
動作についてはその説明を省略する。図7及び図11に
おいて、マイクロホン1〜3から音声データを入手した
後(図11ステップS2)、16kHzサンプリングで
32から40サンプル程度毎に、ピッチ検出回路7,8
でピッチ検出処理を行い(図示せず)、同様に自己相関
演算回路20,21及び相互相関演算回路11,12で
自己相関関数及び相互相関関数を計算する(図11ステ
ップS3,S4)。
【0061】ピッチ検出処理では、自己相関関数及び相
互相関関関数と同様にバッファ(図示せず)にデータを
蓄積してフレーム単位で一気に処理を行うか、もしくは
サンプル毎の部分に分割して計算を行うことによっても
計算することができるので、どちらのやり方でもよい。
互相関関関数と同様にバッファ(図示せず)にデータを
蓄積してフレーム単位で一気に処理を行うか、もしくは
サンプル毎の部分に分割して計算を行うことによっても
計算することができるので、どちらのやり方でもよい。
【0062】図8は本発明の第6の実施例による話者方
向検出回路の構成を示すブロック図である。図8におい
て、本発明の第6の実施例による話者方向検出回路は、
ピッチ検出回路14及び15と、減算器16及び17と
を有している点で上記第5の実施例による話者方向検出
回路と相違するが、その他については同様である。
向検出回路の構成を示すブロック図である。図8におい
て、本発明の第6の実施例による話者方向検出回路は、
ピッチ検出回路14及び15と、減算器16及び17と
を有している点で上記第5の実施例による話者方向検出
回路と相違するが、その他については同様である。
【0063】このような構成により、本発明の第6の実
施例による話者方向検出回路では、相互相関演算回路1
1は、減算器16からのピッチ予測残差信号と減算器9
からのピッチ予測残差信号との相互相関演算を行い、時
間差毎の相互相関関数値を算出して評価関数回路22に
出力することになる。また、相互相関演算回路12は、
減算器17からのピッチ予測残差信号と減算器10から
のピッチ予測残差信号との相互相関演算を行い、時間差
毎の相互相関関数値を算出して評価関数回路23に出力
することになる。
施例による話者方向検出回路では、相互相関演算回路1
1は、減算器16からのピッチ予測残差信号と減算器9
からのピッチ予測残差信号との相互相関演算を行い、時
間差毎の相互相関関数値を算出して評価関数回路22に
出力することになる。また、相互相関演算回路12は、
減算器17からのピッチ予測残差信号と減算器10から
のピッチ予測残差信号との相互相関演算を行い、時間差
毎の相互相関関数値を算出して評価関数回路23に出力
することになる。
【0064】また、上記第1〜第6の各実施例におい
て、減算器9の出力であるピッチ予測残差信号と減算器
10の出力であるピッチ予測残差信号とは同等であるの
で、どちらか一方のピッチ検出回路,減算器のみを用い
て、その減算器の出力を相互相関演算回路11,12の
入力としてもよい(上記第5及び第6の実施例では、併
せて、自己相関演算回路20,21の入力としてもよ
い)。
て、減算器9の出力であるピッチ予測残差信号と減算器
10の出力であるピッチ予測残差信号とは同等であるの
で、どちらか一方のピッチ検出回路,減算器のみを用い
て、その減算器の出力を相互相関演算回路11,12の
入力としてもよい(上記第5及び第6の実施例では、併
せて、自己相関演算回路20,21の入力としてもよ
い)。
【0065】さらに、上記第5及び第6の実施例におい
て、自己相関演算回路20,21の出力は同等であるの
で、どちらか一方のみを用いて、その自己相関演算回路
の出力を評価関数回路22,23の入力としてもよい。
て、自己相関演算回路20,21の出力は同等であるの
で、どちらか一方のみを用いて、その自己相関演算回路
の出力を評価関数回路22,23の入力としてもよい。
【0066】なお、上述した本発明の第1の実施例、第
2の実施例、第3の実施例、第4の実施例、第5の実施
例、さらに第6の実施例に記載の内容に限定されず、本
発明の技術思想の範囲内において、各実施例は適宜変更
され得ることは明らかである。
2の実施例、第3の実施例、第4の実施例、第5の実施
例、さらに第6の実施例に記載の内容に限定されず、本
発明の技術思想の範囲内において、各実施例は適宜変更
され得ることは明らかである。
【0067】
【発明の効果】本発明による効果は、話者方向の検出誤
りを低減し安定性を高めることができることである。そ
の理由は、話者の発した音声が2つのマイクロホンに到
達する距離の差によって生じる到達時間差を推定するた
めに用いられる、相互相関演算手段又は評価関数手段に
入力される信号に対してピッチ影響除去手段を設けるこ
とで、上記入力される信号の少なくとも一方からピッチ
の影響を取り除くようにしたので、上記入力される信号
が正弦波などのように非常に強力なピッチをもつ信号で
ある場合でも、到達時間差の誤検出を抑えることができ
るためである。
りを低減し安定性を高めることができることである。そ
の理由は、話者の発した音声が2つのマイクロホンに到
達する距離の差によって生じる到達時間差を推定するた
めに用いられる、相互相関演算手段又は評価関数手段に
入力される信号に対してピッチ影響除去手段を設けるこ
とで、上記入力される信号の少なくとも一方からピッチ
の影響を取り除くようにしたので、上記入力される信号
が正弦波などのように非常に強力なピッチをもつ信号で
ある場合でも、到達時間差の誤検出を抑えることができ
るためである。
【図1】本発明の第1の実施例の話者方向検出回路の構
成を示すブロック図である。
成を示すブロック図である。
【図2】図1のピッチ検出回路の構成を示すブロック図
である。
である。
【図3】図1のマイクロホンの配置例を示す図である。
【図4】本発明の第2の実施例の話者方向検出回路の構
成を示すブロック図である。
成を示すブロック図である。
【図5】本発明の第3の実施例の話者方向検出回路の構
成を示すブロック図である。
成を示すブロック図である。
【図6】本発明の第4の実施例の話者方向検出回路の構
成を示すブロック図である。
成を示すブロック図である。
【図7】本発明の第5の実施例の話者方向検出回路の構
成を示すブロック図である。
成を示すブロック図である。
【図8】本発明の第6の実施例の話者方向検出回路の構
成を示すブロック図である。
成を示すブロック図である。
【図9】第1の技術による話者方向検出回路の構成を示
すブロック図である。
すブロック図である。
【図10】第2の技術による話者方向検出回路の構成を
示すブロック図である。
示すブロック図である。
【図11】図10に示す話者方向検出回路の動作を示す
フローチャートである。
フローチャートである。
【図12】複数本のマイクロホンで受信した信号の時間
差の理論を示す図である。
差の理論を示す図である。
【図13】一般的な水平方向位置算出の検出例を示す図
である。
である。
【図14】一般的な垂直方向位置算出の検出例を示す図
である。
である。
1 水平方向検出用のマイクロホン 2 水平・垂直方向共通検出用のマイクロホン 3 垂直方向検出用のマイクロホン 4〜6 メモリ回路 7,8,14,15 ピッチ検出回路 9,10,16,17 減算器 11,12 相互相関演算回路 13 位置検出回路 18,19,22,23 評価関数回路 20,21 自己相関演算回路 100 抽出器 110 ピッチ予測器
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D015 CC05 CC13 DD02 5D020 BB04 5J083 AA05 AB12 AC17 AD18 AE08 AF01 BE10
Claims (6)
- 【請求項1】 2つのマイクロホンで受信された音声の
音声信号が入力され、それらの少なくとも一方からピッ
チの影響を取り除いてそれらを出力するピッチ影響除去
手段と、 前記ピッチ影響除去手段の出力信号を基に前記音声信号
間の時間差を算出し、その算出された時間差に基づいて
話者の方向検出を行う検出手段とを含むことを特徴とす
る話者方向検出回路。 - 【請求項2】 前記ピッチ影響除去手段は、前記ピッチ
の影響を取り除くべき前記音声信号のピッチゲイン及び
ピッチ周期を抽出する抽出手段と、前記ピッチゲイン及
びピッチ周期を基にピッチ予測信号を生成するピッチ予
測手段と、前記ピッチの影響を取り除くべき前記音声信
号から前記ピッチ予測信号を減算して前記出力信号を生
成する減算手段とを有することを特徴とする請求項1記
載の話者方向検出回路。 - 【請求項3】 前記検出手段は、前記ピッチ影響除去手
段の出力信号の相互相関関数を演算する相互相関演算手
段を含み、前記相互相関関数の最大値を検出して話者の
方向検出を行うことを特徴とする請求項1又は2記載の
話者方向検出回路。 - 【請求項4】 前記検出手段は、前記相互相関関数の時
間差毎の加算値の最大値を検出して話者の方向検出を行
うようにしたことを特徴とする請求項3記載の話者方向
検出回路。 - 【請求項5】 前記検出手段は、前記ピッチ影響除去手
段の前記ピッチの影響を取り除かれた一の前記出力信号
の自己相関関数を演算する自己相関演算手段と、前記相
互相関関数と前記自己相関関数との関係式による評価関
数を演算する評価関数手段とを更に含み、前記評価関数
の最大値を検出して話者の方向検出を行うようにしたこ
とを特徴とする請求項3記載の話者方向検出回路。 - 【請求項6】 前記検出手段は、前記評価関数の時間差
毎の加算値の最大値を検出して話者の方向検出を行うよ
うにしたことを特徴とする請求項5記載の話者方向検出
回路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001120432A JP2002315089A (ja) | 2001-04-19 | 2001-04-19 | 話者方向検出回路 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001120432A JP2002315089A (ja) | 2001-04-19 | 2001-04-19 | 話者方向検出回路 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002315089A true JP2002315089A (ja) | 2002-10-25 |
Family
ID=18970467
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001120432A Pending JP2002315089A (ja) | 2001-04-19 | 2001-04-19 | 話者方向検出回路 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002315089A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004053581A (ja) * | 2002-04-17 | 2004-02-19 | Daimler Chrysler Ag | マイクロホンによる視線方向の検出 |
JP2005049153A (ja) * | 2003-07-31 | 2005-02-24 | Toshiba Corp | 音声方向推定装置及びその方法 |
JP2005077205A (ja) * | 2003-08-29 | 2005-03-24 | Advanced Telecommunication Research Institute International | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム |
JP2007228135A (ja) * | 2006-02-22 | 2007-09-06 | National Institute Of Advanced Industrial & Technology | 発声位置推定方法およびそれを用いた発声位置推定装置、電動車椅子 |
JP2009212953A (ja) * | 2008-03-05 | 2009-09-17 | Oki Electric Ind Co Ltd | 伝搬遅延時間推定器、プログラム及び方法、並びにエコーキャンセラ |
JP2011107714A (ja) * | 2010-12-09 | 2011-06-02 | National Institute Of Advanced Industrial Science & Technology | 電動車椅子 |
KR102209688B1 (ko) * | 2019-10-29 | 2021-01-29 | (주)파트론 | 지향성 마이크로폰 장치 |
-
2001
- 2001-04-19 JP JP2001120432A patent/JP2002315089A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004053581A (ja) * | 2002-04-17 | 2004-02-19 | Daimler Chrysler Ag | マイクロホンによる視線方向の検出 |
JP2005049153A (ja) * | 2003-07-31 | 2005-02-24 | Toshiba Corp | 音声方向推定装置及びその方法 |
JP2005077205A (ja) * | 2003-08-29 | 2005-03-24 | Advanced Telecommunication Research Institute International | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム |
JP2007228135A (ja) * | 2006-02-22 | 2007-09-06 | National Institute Of Advanced Industrial & Technology | 発声位置推定方法およびそれを用いた発声位置推定装置、電動車椅子 |
JP4682344B2 (ja) * | 2006-02-22 | 2011-05-11 | 独立行政法人産業技術総合研究所 | 発声位置推定方法およびそれを用いた発声位置推定装置、電動車椅子 |
JP2009212953A (ja) * | 2008-03-05 | 2009-09-17 | Oki Electric Ind Co Ltd | 伝搬遅延時間推定器、プログラム及び方法、並びにエコーキャンセラ |
JP2011107714A (ja) * | 2010-12-09 | 2011-06-02 | National Institute Of Advanced Industrial Science & Technology | 電動車椅子 |
KR102209688B1 (ko) * | 2019-10-29 | 2021-01-29 | (주)파트론 | 지향성 마이크로폰 장치 |
WO2021085686A1 (ko) * | 2019-10-29 | 2021-05-06 | 주식회사 파트론 | 지향성 마이크로폰 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3598932B2 (ja) | 話者方向検出回路及びそれに用いる話者方向検出方法 | |
US9269367B2 (en) | Processing audio signals during a communication event | |
KR101340520B1 (ko) | 잡음을 제거하는 장치 및 방법 | |
KR20080036897A (ko) | 음성 끝점을 검출하기 위한 장치 및 방법 | |
US20100111290A1 (en) | Call Voice Processing Apparatus, Call Voice Processing Method and Program | |
CN103688187B (zh) | 使用相位谱的声音源定位 | |
JP2002315089A (ja) | 話者方向検出回路 | |
JP2017181899A (ja) | 雑音抑圧装置、音声認識装置、雑音抑圧方法、及び雑音抑圧プログラム | |
CN113316075B (zh) | 一种啸叫检测方法、装置及电子设备 | |
JP5045938B2 (ja) | 音源方向検出方法、装置及びプログラム | |
JP2006194700A (ja) | 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム | |
JP2004109712A (ja) | 話者方向検出装置 | |
JP4348924B2 (ja) | エコーキャンセラ装置及びそれに用いるエコーキャンセラ方法 | |
JP2012149906A (ja) | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
KR100198019B1 (ko) | 마이크 어레이를 이용한 원격음성입력장치 및 그 원격음성입력 처리방법 | |
JP2005157086A (ja) | 音声認識装置 | |
JP2003271189A (ja) | 話者方向検出回路及びその検出方法 | |
JP6763319B2 (ja) | 非目的音判定装置、プログラム及び方法 | |
JP6361360B2 (ja) | 残響判定装置及びプログラム | |
JP2020024310A (ja) | 音声処理システム及び音声処理方法 | |
JP4659556B2 (ja) | 音源方向検出装置 | |
JP3332144B2 (ja) | 目的音源領域検出方法およびその装置 | |
JPH05183997A (ja) | 効果音付加自動判別装置 | |
JPH02178699A (ja) | 音声認識装置 |