JPH10282993A

JPH10282993A - 機器の音声作動式遠隔制御システム

Info

Publication number: JPH10282993A
Application number: JP10068436A
Authority: JP
Inventors: Imre Varga; ヴァルガインレ
Original assignee: Deutsche Thomson Brandt GmbH
Current assignee: Deutsche Thomson Brandt GmbH
Priority date: 1997-03-26
Filing date: 1998-03-18
Publication date: 1998-10-23
Also published as: EP0867860A3; EP0867860A2; DE19712632A1

Abstract

(57)【要約】【課題】本発明の目的は、機器の音声作動式遠隔制御
中に音響妨害に対するイミュニティが改良されたシステ
ムを提供することである。【解決手段】少なくとも１台のスピーカを介してオー
ディオ信号を送出する機器の音声作動式遠隔制御用シス
テムは、音声コマンドを電気信号に変換する１台又は複
数台のマイクロホンと、電気信号を制御コマンドに変換
する音声検出器とを有する。本発明によれば、マイクロ
ホン信号は音声コマンドとオーディオ信号と他のバック
グラウンドノイズとからなり、スピーカとマイクロホン
との間の空間内の伝送路をモデル化することにより機器
によって送出されたオーディオ信号がマイクロホンの位
置で評価され、マイクロホン信号を補正するため使用さ
れるサウンド補償器が設けられる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、機器、特に、娯楽
用電子機器の音声作動式遠隔制御方法及び装置に関す
る。

【０００２】

【従来の技術】娯楽用電子機器の音声作動式遠隔制御
は、徐々に重要になり始めている。一方で、音声作動式
遠隔制御は、人間工学性、即ち、機器が作動され得る方
式の質を著しく改善し、他方で、身体障害者が殆どの場
合に初めてその機器を使用できるようになる。

【０００３】一般的に、音声作動式制御システムは、音
声を電気信号に変換するマイクロホンと、信号処理手段
と、電気信号を語に変換する音声検出器と、システムを
制御するシステム管理装置とからなる。音声検出手段自
体はパターン認識に基づき、発声された各コマンドは記
憶された情報と比較される。

【０００４】

【発明が解決しようとする課題】このような一般的な音
声作動式制御システムでは、音声検出器がパターンを検
出できず、その結果として、ユーザの音響環境がノイズ
に晒される場合に、即ち、特に、機器の音声再生の結果
として音響妨害がある場合に、誤差に対し必要なイミュ
ニティが得られないという問題が生ずる。従って、コマ
ンドが検出されるまで、繰り返しコマンドを発する必要
がある。これは音声制御システムの魅力を低下させる。
妨害が非常に厳しい場合には、音声作動式制御が実現で
きる見込みは全くない。

【０００５】本発明の目的は、機器、特に、娯楽用電子
機器の音声作動式遠隔制御中に音響妨害に対するイミュ
ニティが改良されたシステムを提供することである。

【０００６】

【課題を解決するための手段】上記本発明の目的は請求
項１に記載されたシステムを用いて実現される。原則と
して、本発明によれば、音声コマンドを電気信号に変換
する１台又は複数台のマイクロホンと、上記電気信号を
制御コマンドに変換する音声検出器とにより構成され、
少なくとも１台のスピーカを介してオーディオ信号を送
出する機器の音声作動式遠隔制御用システムにおいて、
マイクロホン信号は、音声コマンドと、オーディオ信号
と、他のバックグラウンドノイズとからなり、スピーカ
とマイクロホンとの間の空間内の伝送路をモデル化する
ことにより機器によって送出されたオーディオ信号がマ
イクロホンの位置で評価され、マイクロホン信号を補正
するため使用されるサウンド補償器が設けられている。
その結果として、制御コマンドの検出は改良され、これ
により、音声作動式遠隔制御の誤差に対するイミュニテ
ィが改良され、又は、実際上、音声作動式遠隔制御が最
初に実現可能になる。

【０００７】この場合、マイクロホン信号は、好ましく
は、最初にサウンド補償器に供給され、補償された信号
はバックグラウンドノイズができる限り除去されるノイ
ズ抑制器に供給され、次に、信号は音声検出器に供給さ
れ、コマンドがパターン検出を用いて検出される。この
場合、マイクロホンは、その目的のため設けられたユニ
ット、例えば、遠隔制御システムに統合されても構わな
いが、１台又は複数台のマイクロホンを機器の筐体に統
合してもよい。

【０００８】特に、複数のオーディオ信号から単一信号
を受信し、単一信号をサウンド補償器に供給することに
より、サウンド補償器の複雑さが低減されるので有利で
ある。サウンド補償器は、特に、適応ＮＬＭＳ−ＦＩＲ
（正規化最小二乗平均−有限インパルス応答）フィルタ
の形式である方が有利である。これにより発話者が移動
している場合でもサウンド補償が行えるようになる。

【０００９】同様に、種々のスピーカ信号が存在する場
合、より優れた補償が行えるように種々のスピーカ信号
毎に別個の適応フィルタを設けることが有利である。最
後に、複数のマイクロホンがある場合、別々の指向性を
得るためマイクロホンをアレイ上に配置してもよい。

【００１０】

【発明の実施の形態】以下、添付図面を参照し手本発明
の実施例を説明する。図１には本発明の音声作動式制御
システムが示されている。本例において、マイクロホン
ＭＩＣは遠隔制御システムＲＣＵに統合されている。マ
イクロホンは、できる限り有用な信号、即ち、音声だけ
が受容されるように、特定の指向性（球形、心臓形、超
心臓形）を有してもよい。遠隔制御システムは、例え
ば、無線周波変調を用いて、若しくは、ケーブルを介し
てテレビジョンセットＴＶを制御するため使用され得
る。特に、テレビジョンセットＴＶには、２台のスピー
カＬ１及びＬ２と、単一化器ＭＯＮと、サウンド補償器
ＳＣＯＭＰと、ノイズ抑制器ＮＳＵＰと、音声検出器Ｓ
ＲＥＣとが統合されている。

【００１１】マイクロホン信号は、一般的に、有用な信
号と、テレビジョン音声成分と、空間内の他のノイズと
の合成により構成される。マイクロホン信号は、ＲＦ変
調され、機器ＴＶに伝送され、機器ＴＶ側のサウンド補
償器ＳＣＯＭＰの１次入力に供給される。スピーカＬ１
及びＬ２に達した信号からの単一化によって得られた信
号は、サウンド補償器ＳＣＯＭＰの別の入力（基準入力
又は２次入力）に供給される。サウンド補償器は、スピ
ーカとマイクロホンとの間の空間内の伝送路をモデル化
する。種々の信号成分の統計量は先験的には分からない
ので、適応システムがこのモデル化のために使用される
べきである。

【００１２】適応サウンド補償器の簡単な構成が図２に
示されている。マイクロホン信号ｉは１次入力に供給さ
れ、モノラルスピーカ信号ｒは、別の入力を介して適応
フィルタＡＦに供給される。マイクロホンの位置のスピ
ーカ信号は、適応フィルタＡＦで評価され、フィルタリ
ングされた信号ｙを供給する。この信号ｙは、１次入力
を介して供給された信号ｉから減算され、スピーカ信号
によって減少させられた信号ｅを出力ｏに供給する。信
号ｅは次に適応フィルタＡＦに供給される。

【００１３】適応サウンド補償器を設計する実現可能な
方法は、適応ＮＬＭＳ−ＦＩＲフィルタを使用すること
である。特殊なＬＭＳ（最小二乗平均）アルゴリズムで
あるＮＬＭＳアルゴリズムはこのようなフィルタにおい
て使用される。ＬＭＳアルゴリズムは、以下の式：ｈｉ（ｎ＋１）＝ｈｉ（ｎ）＋ａ＊ｅ（ｎ）＊ｘ（ｎ−ｉ＋１），ｉ＝１，２，．．．，Ｎに従って有限インパルス応答フィルタの係数ｈ１，ｈ
２，．．．，ｈＮを適応させる機能を果たす。式中の変
数は以下の通り定義される。

【００１４】ｎ：離散時間インデックスａ：ステップサイズｘ：基準入力のサンプリング値ｅ：誤差信号但し、ｅ＝ｄ−ｙであり、ｄ：１次入力の信号ｙ：有限インパルス応答フィルタ出力の信号ＮＬＭＳ（正規化最小二乗平均）アルゴリズムは、基準
入力信号のパワーへの適応に正規化することによりＬＭ
Ｓアルゴリズムを拡張する。ｈｉ（ｎ＋１）＝ｈｉ（ｎ）＋ａ＊ｅ（ｎ）＊ｘ（ｎ−
ｉ＋１）／Ｐｘ（ｎ）式中、Ｐｘは信号ｘのパワーを表す。Ｐｘは例えば、次
式：Ｐｘ（ｎ＋１）＝ｑ＊Ｐｘ（ｎ）＋（１−ｑ）＊ｘ
²（ｎ），ｑ＜１に従って計算される。

【００１５】ＮＬＭＳアルゴリズムは、適応特性が入力
信号のパワーとは無関係であることによりＬＭＳアルゴ
リズムよりも有利であり、このことは、脈動信号（例え
ば、音声、音楽）の場合に特に重要である。サウンド補
償器内の適応フィルタは、基準入力と相関関係があるマ
イクロホン信号の近似成分を基準入力から生成する。こ
れは、適応フィルタがスピーカから音響空間を経由して
マイクロホンに到達した上記の信号成分を、（モノラ
ル）スピーカ信号から発生させることを意味する。サウ
ンド補償器の出力は、マイクロホン信号と適応フィルタ
の出力との差信号であるため、低減されたスピーカ信号
成分と、変化していない有用な信号成分（音声）とを含
む。

【００１６】この信号は、次に、ノイズ抑制手段の入力
に供給される。この処理段は、スピーカ以外から発生し
たノイズ成分（例えば、通りの騒音、掃除機、バックグ
ラウンドミュージックなどのような他の家庭内機器の
音）を減少させる機能を有する。この例では、図３に示
される如く、ノイズ抑制のためスペクトル減算を使用す
ることが可能である。音声間隔検出器ＳＤは、入力信号
ｉ’のウィンドウ処理後、夫々のブロックに音声又は間
隔の何れが含まれているかを判定する。このブロックは
フーリエ変換ＦＦＴされ、絶対値が計算される。ブロッ
クが音声を全く含まない場合、測定されたスペクトルの
絶対値がノイズスペクトルとしてメモリＲＡＭに記憶さ
れる。一方で、ブロックが妨害を受けた音声を含む場
合、前の間隔に記憶された絶対ノイズ値のスペクトル
は、ブロックの絶対値のスペクトルから減算される。結
果として得られた絶対出力値のスペクトルは、平滑化Ｓ
Ｍ後の入力信号の位相Ｐずつ補正され、逆フーリエ変換
ＩＦＦＴを施される。最後に、連続信号が、例えば、信
号ｏ’が出力される前に、信号のサンプルを加算ＳＳす
ることによりブロックから生成される。

【００１７】従って、ノイズ抑制手段の出力の条件付き
信号のＳＮ比は高くなる。この信号は、音声検出器ＳＲ
ＥＣの入力に供給され、音声検出器ＳＲＥＣは、制御コ
マンドに対しより優れた検出レートを提供し、動作時の
誤差に対するイミュニティが大きくなる。制御コマンド
は、機器に向けられた広範囲のユーザの発話であると考
えられる。所謂コマンド・アンド・制御システムの場
合、上記発話は、例えば、「画像を明るくする」、「音
声を消す」又は「チャンネルを１にする」のようなコマ
ンドである。同様に、所謂対話システムの場合、上記発
話は、ユーザと機器との間の対話である。従って、制御
コマンドは、例えば、「今日、テニスの放送はあります
か？」のような形式である。機器は、この質問に対し、
例えば、「はいあります。午後６時半に放送されま
す。」のように応答することができる。

【００１８】音声作動式制御システムが使用できるよう
になる前に、特定話者依存形の検出器が使用されると
き、最初に音声トレーニングが行われ、その間にシステ
ムは夫々のユーザが制御コマンドを発話する仕方を学習
する。発声されたコマンドは記憶され、後で音声作動式
制御処理が行われるとき、記憶されたコマンドは発声さ
れたコマンドと比較される。特に、複数の語からなる複
雑なコマンドの場合、最初に、遠隔制御システムのディ
スプレイ又は画面にコマンド成分を表示する方が適当で
ある。一方、不特定話者検出器が使用される場合、トレ
ーニングは既に製造元によって行われている。

【００１９】本発明の更なる実施例が図４に示される。
テレビジョンＴＶ又はステレオシステム等の機器のスピ
ーカ信号は、単一信号を形成するため加算されないが、
サウンド補償器ＳＣＯＭＰの適応フィルタに個別に供給
される。このため、適応サウンド補償器のため複数の基
準入力が与えられる。誤差信号、即ち、この多重基準サ
ウンド補償器の出力信号は、マイクロホン信号と、全適
応フィルタ出力との間の差信号である。適応フィルタリ
ングに関する経費を大きくすると共に、マイクロホン信
号のテレビジョン音声信号成分のより大きい抑制が実現
されるようになる。この差信号は、例えば、５台のスピ
ーカを用いたサラウンドシステムにおいて２台以上のス
ピーカがある場合に、又は、ドルビープロロジック再生
の場合に特に重要である。

【００２０】図５に示された実施例は、アレイ状に配置
された複数のマイクロホンＭＩＣ１、ＭＩＣ２、ＭＩＣ
３を使用する点に特徴がある。本実施例の場合、別個の
指向性を得ることが可能であり、話者がマイクロホンか
ら遠ざかることが許容される。この場合の必要条件は、
有用な信号が特定の方向、特に正面からアレイに当たる
ことである。指向性はアレイの幾何学的関係の結果とし
て生じる。本例において、マイクロホンは、ハンドフリ
ー発話ができるように、機器自体、例えば、テレビジョ
ンの筐体に一体化されている。

【００２１】このような配置は、通常サウンド出力を有
するコンピュータゲームを作動するため使用され得る。
コンピュータゲームは、コンピュータ、テレビジョンセ
ット、又は、これらの機器の組合せ上で楽しまれる。コ
ンピュータ用の音声作動式制御システムの場合に、音声
は、通常、マイクロホン及びサウンドカードを介してコ
ンピュータに入力される。筐体内に統合する代わりに、
マイクロホンは、例えば、コンピュータマウス若しくは
所謂ジョイスティックのような制御装置に一体化させて
もよく、又は、ユーザの口の直ぐ正面にあるヘッドマイ
クロホンでも構わない。

【００２２】

【発明の効果】本発明を使用することにより、音声作動
式制御システムの誤差に対するイミュニティを増大さ
せ、特に、音声検出レートを著しく改良することが可能
になる。その結果として、テレビジョンセット、ビデオ
レコーダ、衛星受信器、オーディオ機器、及び、完全な
ステレオシステム、並びに、パーソナルコンピュータ及
び他の家庭用機器の改良された音声作動式遠隔制御が実
現可能になる。

【図面の簡単な説明】

【図１】マイクロホンが統合され、スピーカ信号の単一
信号形式を有する遠隔制御システムを備えた音声作動式
制御システムを表す図である。

【図２】適応サウンド補償器のブロック回路図である。

【図３】ノイズ抑制のためのスペクトル減算用配置のブ
ロック図である。

【図４】マイクロホンが統合され、スピーカ信号の単一
信号形式を用いない遠隔制御システムを備えた音声作動
式制御システムを表す図である。

【図５】テレビジョン筐体に統合された複数のマイクロ
ホンを有する音声作動式制御システムを表す図である。

【符号の説明】

ＭＩＣ，ＭＩＣ１，ＭＩＣ２，ＭＩＣ３マイクロホ
ンＲＣＵ遠隔制御システムＴＶテレビジョンセットＬ１，Ｌ２スピーカＭＯＮ単一化器ＳＣＯＭＰサウンド補償器ＮＳＵＰノイズ抑制器ＳＲＥＣ音声検出器ＡＦ適応フィルタＳＤ音声間隔検出器ＦＦＴフーリエ変換ＲＡＭメモリＳＭ平滑化ＩＦＦＴ逆フーリエ変換ＳＳサンプル加算

Claims

【特許請求の範囲】

【請求項１】音声コマンドを電気信号に変換する１台
又は複数台のマイクロホンと、上記電気信号を制御コマ
ンドに変換する音声検出器とにより構成され、少なくと
も１台のスピーカを介してオーディオ信号を送出する機
器を音声作動式に遠隔制御するシステムにおいて、マイクロホン信号は、音声コマンドと、オーディオ信号
と、他のバックグラウンドノイズとからなり、スピーカとマイクロホンとの間の空間内の伝送路をモデ
ル化することにより、上記機器によって送出されたオー
ディオ信号がマイクロホンの位置で評価され、上記マイ
クロホン信号を補正するため使用されるサウンド補償器
が設けられていることを特徴とするシステム。
【請求項２】マイクロホン信号は、最初に上記サウン
ド補償器に供給され、補償された信号がバックグラウンドノイズをできる限り
除去するノイズ抑制器に供給され、上記信号は、次に、パターン認識を用いてコマンドを検
出する音声検出器に供給されることを特徴とする請求項
１記載のシステム。
【請求項３】上記サウンド補償ユニットは一つ以上の
適応フィルタを含むことを特徴とする請求項１又は２記
載のシステム。
【請求項４】種々の適応フィルタが種々のスピーカか
らのオーディオ信号のため設けられていることを特徴と
する請求項３記載のシステム。
【請求項５】上記適応フィルタは、適応正規化最小二
乗有限インパルス応答フィルタ（ＮＬＭＳ−ＦＩＲ）の
形に構成されていることを特徴とする請求項３又は４記
載のシステム。
【請求項６】単一信号が複数のオーディオ信号から獲
得され、上記サウンド補償器に供給されることを特徴と
する請求項１乃至５のうちいずれか１項記載のシステ
ム。
【請求項７】マイクロホンは、上記機器を作動させる
ためのユニット、特に、遠隔制御システムに統合されて
いることを特徴とする請求項１乃至６のうちいずれか１
項記載のシステム。
【請求項８】少なくとも１台のマイクロホンが上記機
器の筐体に統合されていることを特徴とする請求項１乃
至７のうちいずれか１項記載のシステム。
【請求項９】複数のマイクロホンが別個の指向性を実
現するためアレイ状に配置されていることを特徴とする
請求項１乃至８のうちいずれか１項記載のシステム。