JPH10282993A - 機器の音声作動式遠隔制御システム - Google Patents
機器の音声作動式遠隔制御システムInfo
- Publication number
- JPH10282993A JPH10282993A JP10068436A JP6843698A JPH10282993A JP H10282993 A JPH10282993 A JP H10282993A JP 10068436 A JP10068436 A JP 10068436A JP 6843698 A JP6843698 A JP 6843698A JP H10282993 A JPH10282993 A JP H10282993A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- microphone
- voice
- remote control
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Selective Calling Equipment (AREA)
Abstract
(57)【要約】
【課題】 本発明の目的は、機器の音声作動式遠隔制御
中に音響妨害に対するイミュニティが改良されたシステ
ムを提供することである。 【解決手段】 少なくとも1台のスピーカを介してオー
ディオ信号を送出する機器の音声作動式遠隔制御用シス
テムは、音声コマンドを電気信号に変換する1台又は複
数台のマイクロホンと、電気信号を制御コマンドに変換
する音声検出器とを有する。本発明によれば、マイクロ
ホン信号は音声コマンドとオーディオ信号と他のバック
グラウンドノイズとからなり、スピーカとマイクロホン
との間の空間内の伝送路をモデル化することにより機器
によって送出されたオーディオ信号がマイクロホンの位
置で評価され、マイクロホン信号を補正するため使用さ
れるサウンド補償器が設けられる。
中に音響妨害に対するイミュニティが改良されたシステ
ムを提供することである。 【解決手段】 少なくとも1台のスピーカを介してオー
ディオ信号を送出する機器の音声作動式遠隔制御用シス
テムは、音声コマンドを電気信号に変換する1台又は複
数台のマイクロホンと、電気信号を制御コマンドに変換
する音声検出器とを有する。本発明によれば、マイクロ
ホン信号は音声コマンドとオーディオ信号と他のバック
グラウンドノイズとからなり、スピーカとマイクロホン
との間の空間内の伝送路をモデル化することにより機器
によって送出されたオーディオ信号がマイクロホンの位
置で評価され、マイクロホン信号を補正するため使用さ
れるサウンド補償器が設けられる。
Description
【0001】
【発明の属する技術分野】本発明は、機器、特に、娯楽
用電子機器の音声作動式遠隔制御方法及び装置に関す
る。
用電子機器の音声作動式遠隔制御方法及び装置に関す
る。
【0002】
【従来の技術】娯楽用電子機器の音声作動式遠隔制御
は、徐々に重要になり始めている。一方で、音声作動式
遠隔制御は、人間工学性、即ち、機器が作動され得る方
式の質を著しく改善し、他方で、身体障害者が殆どの場
合に初めてその機器を使用できるようになる。
は、徐々に重要になり始めている。一方で、音声作動式
遠隔制御は、人間工学性、即ち、機器が作動され得る方
式の質を著しく改善し、他方で、身体障害者が殆どの場
合に初めてその機器を使用できるようになる。
【0003】一般的に、音声作動式制御システムは、音
声を電気信号に変換するマイクロホンと、信号処理手段
と、電気信号を語に変換する音声検出器と、システムを
制御するシステム管理装置とからなる。音声検出手段自
体はパターン認識に基づき、発声された各コマンドは記
憶された情報と比較される。
声を電気信号に変換するマイクロホンと、信号処理手段
と、電気信号を語に変換する音声検出器と、システムを
制御するシステム管理装置とからなる。音声検出手段自
体はパターン認識に基づき、発声された各コマンドは記
憶された情報と比較される。
【0004】
【発明が解決しようとする課題】このような一般的な音
声作動式制御システムでは、音声検出器がパターンを検
出できず、その結果として、ユーザの音響環境がノイズ
に晒される場合に、即ち、特に、機器の音声再生の結果
として音響妨害がある場合に、誤差に対し必要なイミュ
ニティが得られないという問題が生ずる。従って、コマ
ンドが検出されるまで、繰り返しコマンドを発する必要
がある。これは音声制御システムの魅力を低下させる。
妨害が非常に厳しい場合には、音声作動式制御が実現で
きる見込みは全くない。
声作動式制御システムでは、音声検出器がパターンを検
出できず、その結果として、ユーザの音響環境がノイズ
に晒される場合に、即ち、特に、機器の音声再生の結果
として音響妨害がある場合に、誤差に対し必要なイミュ
ニティが得られないという問題が生ずる。従って、コマ
ンドが検出されるまで、繰り返しコマンドを発する必要
がある。これは音声制御システムの魅力を低下させる。
妨害が非常に厳しい場合には、音声作動式制御が実現で
きる見込みは全くない。
【0005】本発明の目的は、機器、特に、娯楽用電子
機器の音声作動式遠隔制御中に音響妨害に対するイミュ
ニティが改良されたシステムを提供することである。
機器の音声作動式遠隔制御中に音響妨害に対するイミュ
ニティが改良されたシステムを提供することである。
【0006】
【課題を解決するための手段】上記本発明の目的は請求
項1に記載されたシステムを用いて実現される。原則と
して、本発明によれば、音声コマンドを電気信号に変換
する1台又は複数台のマイクロホンと、上記電気信号を
制御コマンドに変換する音声検出器とにより構成され、
少なくとも1台のスピーカを介してオーディオ信号を送
出する機器の音声作動式遠隔制御用システムにおいて、
マイクロホン信号は、音声コマンドと、オーディオ信号
と、他のバックグラウンドノイズとからなり、スピーカ
とマイクロホンとの間の空間内の伝送路をモデル化する
ことにより機器によって送出されたオーディオ信号がマ
イクロホンの位置で評価され、マイクロホン信号を補正
するため使用されるサウンド補償器が設けられている。
その結果として、制御コマンドの検出は改良され、これ
により、音声作動式遠隔制御の誤差に対するイミュニテ
ィが改良され、又は、実際上、音声作動式遠隔制御が最
初に実現可能になる。
項1に記載されたシステムを用いて実現される。原則と
して、本発明によれば、音声コマンドを電気信号に変換
する1台又は複数台のマイクロホンと、上記電気信号を
制御コマンドに変換する音声検出器とにより構成され、
少なくとも1台のスピーカを介してオーディオ信号を送
出する機器の音声作動式遠隔制御用システムにおいて、
マイクロホン信号は、音声コマンドと、オーディオ信号
と、他のバックグラウンドノイズとからなり、スピーカ
とマイクロホンとの間の空間内の伝送路をモデル化する
ことにより機器によって送出されたオーディオ信号がマ
イクロホンの位置で評価され、マイクロホン信号を補正
するため使用されるサウンド補償器が設けられている。
その結果として、制御コマンドの検出は改良され、これ
により、音声作動式遠隔制御の誤差に対するイミュニテ
ィが改良され、又は、実際上、音声作動式遠隔制御が最
初に実現可能になる。
【0007】この場合、マイクロホン信号は、好ましく
は、最初にサウンド補償器に供給され、補償された信号
はバックグラウンドノイズができる限り除去されるノイ
ズ抑制器に供給され、次に、信号は音声検出器に供給さ
れ、コマンドがパターン検出を用いて検出される。この
場合、マイクロホンは、その目的のため設けられたユニ
ット、例えば、遠隔制御システムに統合されても構わな
いが、1台又は複数台のマイクロホンを機器の筐体に統
合してもよい。
は、最初にサウンド補償器に供給され、補償された信号
はバックグラウンドノイズができる限り除去されるノイ
ズ抑制器に供給され、次に、信号は音声検出器に供給さ
れ、コマンドがパターン検出を用いて検出される。この
場合、マイクロホンは、その目的のため設けられたユニ
ット、例えば、遠隔制御システムに統合されても構わな
いが、1台又は複数台のマイクロホンを機器の筐体に統
合してもよい。
【0008】特に、複数のオーディオ信号から単一信号
を受信し、単一信号をサウンド補償器に供給することに
より、サウンド補償器の複雑さが低減されるので有利で
ある。サウンド補償器は、特に、適応NLMS−FIR
(正規化最小二乗平均−有限インパルス応答)フィルタ
の形式である方が有利である。これにより発話者が移動
している場合でもサウンド補償が行えるようになる。
を受信し、単一信号をサウンド補償器に供給することに
より、サウンド補償器の複雑さが低減されるので有利で
ある。サウンド補償器は、特に、適応NLMS−FIR
(正規化最小二乗平均−有限インパルス応答)フィルタ
の形式である方が有利である。これにより発話者が移動
している場合でもサウンド補償が行えるようになる。
【0009】同様に、種々のスピーカ信号が存在する場
合、より優れた補償が行えるように種々のスピーカ信号
毎に別個の適応フィルタを設けることが有利である。最
後に、複数のマイクロホンがある場合、別々の指向性を
得るためマイクロホンをアレイ上に配置してもよい。
合、より優れた補償が行えるように種々のスピーカ信号
毎に別個の適応フィルタを設けることが有利である。最
後に、複数のマイクロホンがある場合、別々の指向性を
得るためマイクロホンをアレイ上に配置してもよい。
【0010】
【発明の実施の形態】以下、添付図面を参照し手本発明
の実施例を説明する。図1には本発明の音声作動式制御
システムが示されている。本例において、マイクロホン
MICは遠隔制御システムRCUに統合されている。マ
イクロホンは、できる限り有用な信号、即ち、音声だけ
が受容されるように、特定の指向性(球形、心臓形、超
心臓形)を有してもよい。遠隔制御システムは、例え
ば、無線周波変調を用いて、若しくは、ケーブルを介し
てテレビジョンセットTVを制御するため使用され得
る。特に、テレビジョンセットTVには、2台のスピー
カL1及びL2と、単一化器MONと、サウンド補償器
SCOMPと、ノイズ抑制器NSUPと、音声検出器S
RECとが統合されている。
の実施例を説明する。図1には本発明の音声作動式制御
システムが示されている。本例において、マイクロホン
MICは遠隔制御システムRCUに統合されている。マ
イクロホンは、できる限り有用な信号、即ち、音声だけ
が受容されるように、特定の指向性(球形、心臓形、超
心臓形)を有してもよい。遠隔制御システムは、例え
ば、無線周波変調を用いて、若しくは、ケーブルを介し
てテレビジョンセットTVを制御するため使用され得
る。特に、テレビジョンセットTVには、2台のスピー
カL1及びL2と、単一化器MONと、サウンド補償器
SCOMPと、ノイズ抑制器NSUPと、音声検出器S
RECとが統合されている。
【0011】マイクロホン信号は、一般的に、有用な信
号と、テレビジョン音声成分と、空間内の他のノイズと
の合成により構成される。マイクロホン信号は、RF変
調され、機器TVに伝送され、機器TV側のサウンド補
償器SCOMPの1次入力に供給される。スピーカL1
及びL2に達した信号からの単一化によって得られた信
号は、サウンド補償器SCOMPの別の入力(基準入力
又は2次入力)に供給される。サウンド補償器は、スピ
ーカとマイクロホンとの間の空間内の伝送路をモデル化
する。種々の信号成分の統計量は先験的には分からない
ので、適応システムがこのモデル化のために使用される
べきである。
号と、テレビジョン音声成分と、空間内の他のノイズと
の合成により構成される。マイクロホン信号は、RF変
調され、機器TVに伝送され、機器TV側のサウンド補
償器SCOMPの1次入力に供給される。スピーカL1
及びL2に達した信号からの単一化によって得られた信
号は、サウンド補償器SCOMPの別の入力(基準入力
又は2次入力)に供給される。サウンド補償器は、スピ
ーカとマイクロホンとの間の空間内の伝送路をモデル化
する。種々の信号成分の統計量は先験的には分からない
ので、適応システムがこのモデル化のために使用される
べきである。
【0012】適応サウンド補償器の簡単な構成が図2に
示されている。マイクロホン信号iは1次入力に供給さ
れ、モノラルスピーカ信号rは、別の入力を介して適応
フィルタAFに供給される。マイクロホンの位置のスピ
ーカ信号は、適応フィルタAFで評価され、フィルタリ
ングされた信号yを供給する。この信号yは、1次入力
を介して供給された信号iから減算され、スピーカ信号
によって減少させられた信号eを出力oに供給する。信
号eは次に適応フィルタAFに供給される。
示されている。マイクロホン信号iは1次入力に供給さ
れ、モノラルスピーカ信号rは、別の入力を介して適応
フィルタAFに供給される。マイクロホンの位置のスピ
ーカ信号は、適応フィルタAFで評価され、フィルタリ
ングされた信号yを供給する。この信号yは、1次入力
を介して供給された信号iから減算され、スピーカ信号
によって減少させられた信号eを出力oに供給する。信
号eは次に適応フィルタAFに供給される。
【0013】適応サウンド補償器を設計する実現可能な
方法は、適応NLMS−FIRフィルタを使用すること
である。特殊なLMS(最小二乗平均)アルゴリズムで
あるNLMSアルゴリズムはこのようなフィルタにおい
て使用される。LMSアルゴリズムは、以下の式: hi(n+1)=hi(n)+a*e(n)*x(n−i+1), i=1,2,...,N に従って有限インパルス応答フィルタの係数h1,h
2,...,hNを適応させる機能を果たす。式中の変
数は以下の通り定義される。
方法は、適応NLMS−FIRフィルタを使用すること
である。特殊なLMS(最小二乗平均)アルゴリズムで
あるNLMSアルゴリズムはこのようなフィルタにおい
て使用される。LMSアルゴリズムは、以下の式: hi(n+1)=hi(n)+a*e(n)*x(n−i+1), i=1,2,...,N に従って有限インパルス応答フィルタの係数h1,h
2,...,hNを適応させる機能を果たす。式中の変
数は以下の通り定義される。
【0014】 n:離散時間インデックス a:ステップサイズ x:基準入力のサンプリング値 e:誤差信号 但し、e=d−y であり、 d:1次入力の信号 y:有限インパルス応答フィルタ出力の信号 NLMS(正規化最小二乗平均)アルゴリズムは、基準
入力信号のパワーへの適応に正規化することによりLM
Sアルゴリズムを拡張する。 hi(n+1)=hi(n)+a*e(n)*x(n−
i+1)/Px(n) 式中、Pxは信号xのパワーを表す。Pxは例えば、次
式: Px(n+1)=q*Px(n)+(1−q)*x
2 (n),q<1 に従って計算される。
入力信号のパワーへの適応に正規化することによりLM
Sアルゴリズムを拡張する。 hi(n+1)=hi(n)+a*e(n)*x(n−
i+1)/Px(n) 式中、Pxは信号xのパワーを表す。Pxは例えば、次
式: Px(n+1)=q*Px(n)+(1−q)*x
2 (n),q<1 に従って計算される。
【0015】NLMSアルゴリズムは、適応特性が入力
信号のパワーとは無関係であることによりLMSアルゴ
リズムよりも有利であり、このことは、脈動信号(例え
ば、音声、音楽)の場合に特に重要である。サウンド補
償器内の適応フィルタは、基準入力と相関関係があるマ
イクロホン信号の近似成分を基準入力から生成する。こ
れは、適応フィルタがスピーカから音響空間を経由して
マイクロホンに到達した上記の信号成分を、(モノラ
ル)スピーカ信号から発生させることを意味する。サウ
ンド補償器の出力は、マイクロホン信号と適応フィルタ
の出力との差信号であるため、低減されたスピーカ信号
成分と、変化していない有用な信号成分(音声)とを含
む。
信号のパワーとは無関係であることによりLMSアルゴ
リズムよりも有利であり、このことは、脈動信号(例え
ば、音声、音楽)の場合に特に重要である。サウンド補
償器内の適応フィルタは、基準入力と相関関係があるマ
イクロホン信号の近似成分を基準入力から生成する。こ
れは、適応フィルタがスピーカから音響空間を経由して
マイクロホンに到達した上記の信号成分を、(モノラ
ル)スピーカ信号から発生させることを意味する。サウ
ンド補償器の出力は、マイクロホン信号と適応フィルタ
の出力との差信号であるため、低減されたスピーカ信号
成分と、変化していない有用な信号成分(音声)とを含
む。
【0016】この信号は、次に、ノイズ抑制手段の入力
に供給される。この処理段は、スピーカ以外から発生し
たノイズ成分(例えば、通りの騒音、掃除機、バックグ
ラウンドミュージックなどのような他の家庭内機器の
音)を減少させる機能を有する。この例では、図3に示
される如く、ノイズ抑制のためスペクトル減算を使用す
ることが可能である。音声間隔検出器SDは、入力信号
i’のウィンドウ処理後、夫々のブロックに音声又は間
隔の何れが含まれているかを判定する。このブロックは
フーリエ変換FFTされ、絶対値が計算される。ブロッ
クが音声を全く含まない場合、測定されたスペクトルの
絶対値がノイズスペクトルとしてメモリRAMに記憶さ
れる。一方で、ブロックが妨害を受けた音声を含む場
合、前の間隔に記憶された絶対ノイズ値のスペクトル
は、ブロックの絶対値のスペクトルから減算される。結
果として得られた絶対出力値のスペクトルは、平滑化S
M後の入力信号の位相Pずつ補正され、逆フーリエ変換
IFFTを施される。最後に、連続信号が、例えば、信
号o’が出力される前に、信号のサンプルを加算SSす
ることによりブロックから生成される。
に供給される。この処理段は、スピーカ以外から発生し
たノイズ成分(例えば、通りの騒音、掃除機、バックグ
ラウンドミュージックなどのような他の家庭内機器の
音)を減少させる機能を有する。この例では、図3に示
される如く、ノイズ抑制のためスペクトル減算を使用す
ることが可能である。音声間隔検出器SDは、入力信号
i’のウィンドウ処理後、夫々のブロックに音声又は間
隔の何れが含まれているかを判定する。このブロックは
フーリエ変換FFTされ、絶対値が計算される。ブロッ
クが音声を全く含まない場合、測定されたスペクトルの
絶対値がノイズスペクトルとしてメモリRAMに記憶さ
れる。一方で、ブロックが妨害を受けた音声を含む場
合、前の間隔に記憶された絶対ノイズ値のスペクトル
は、ブロックの絶対値のスペクトルから減算される。結
果として得られた絶対出力値のスペクトルは、平滑化S
M後の入力信号の位相Pずつ補正され、逆フーリエ変換
IFFTを施される。最後に、連続信号が、例えば、信
号o’が出力される前に、信号のサンプルを加算SSす
ることによりブロックから生成される。
【0017】従って、ノイズ抑制手段の出力の条件付き
信号のSN比は高くなる。この信号は、音声検出器SR
ECの入力に供給され、音声検出器SRECは、制御コ
マンドに対しより優れた検出レートを提供し、動作時の
誤差に対するイミュニティが大きくなる。制御コマンド
は、機器に向けられた広範囲のユーザの発話であると考
えられる。所謂コマンド・アンド・制御システムの場
合、上記発話は、例えば、「画像を明るくする」、「音
声を消す」又は「チャンネルを1にする」のようなコマ
ンドである。同様に、所謂対話システムの場合、上記発
話は、ユーザと機器との間の対話である。従って、制御
コマンドは、例えば、「今日、テニスの放送はあります
か?」のような形式である。機器は、この質問に対し、
例えば、「はいあります。午後6時半に放送されま
す。」のように応答することができる。
信号のSN比は高くなる。この信号は、音声検出器SR
ECの入力に供給され、音声検出器SRECは、制御コ
マンドに対しより優れた検出レートを提供し、動作時の
誤差に対するイミュニティが大きくなる。制御コマンド
は、機器に向けられた広範囲のユーザの発話であると考
えられる。所謂コマンド・アンド・制御システムの場
合、上記発話は、例えば、「画像を明るくする」、「音
声を消す」又は「チャンネルを1にする」のようなコマ
ンドである。同様に、所謂対話システムの場合、上記発
話は、ユーザと機器との間の対話である。従って、制御
コマンドは、例えば、「今日、テニスの放送はあります
か?」のような形式である。機器は、この質問に対し、
例えば、「はいあります。午後6時半に放送されま
す。」のように応答することができる。
【0018】音声作動式制御システムが使用できるよう
になる前に、特定話者依存形の検出器が使用されると
き、最初に音声トレーニングが行われ、その間にシステ
ムは夫々のユーザが制御コマンドを発話する仕方を学習
する。発声されたコマンドは記憶され、後で音声作動式
制御処理が行われるとき、記憶されたコマンドは発声さ
れたコマンドと比較される。特に、複数の語からなる複
雑なコマンドの場合、最初に、遠隔制御システムのディ
スプレイ又は画面にコマンド成分を表示する方が適当で
ある。一方、不特定話者検出器が使用される場合、トレ
ーニングは既に製造元によって行われている。
になる前に、特定話者依存形の検出器が使用されると
き、最初に音声トレーニングが行われ、その間にシステ
ムは夫々のユーザが制御コマンドを発話する仕方を学習
する。発声されたコマンドは記憶され、後で音声作動式
制御処理が行われるとき、記憶されたコマンドは発声さ
れたコマンドと比較される。特に、複数の語からなる複
雑なコマンドの場合、最初に、遠隔制御システムのディ
スプレイ又は画面にコマンド成分を表示する方が適当で
ある。一方、不特定話者検出器が使用される場合、トレ
ーニングは既に製造元によって行われている。
【0019】本発明の更なる実施例が図4に示される。
テレビジョンTV又はステレオシステム等の機器のスピ
ーカ信号は、単一信号を形成するため加算されないが、
サウンド補償器SCOMPの適応フィルタに個別に供給
される。このため、適応サウンド補償器のため複数の基
準入力が与えられる。誤差信号、即ち、この多重基準サ
ウンド補償器の出力信号は、マイクロホン信号と、全適
応フィルタ出力との間の差信号である。適応フィルタリ
ングに関する経費を大きくすると共に、マイクロホン信
号のテレビジョン音声信号成分のより大きい抑制が実現
されるようになる。この差信号は、例えば、5台のスピ
ーカを用いたサラウンドシステムにおいて2台以上のス
ピーカがある場合に、又は、ドルビープロロジック再生
の場合に特に重要である。
テレビジョンTV又はステレオシステム等の機器のスピ
ーカ信号は、単一信号を形成するため加算されないが、
サウンド補償器SCOMPの適応フィルタに個別に供給
される。このため、適応サウンド補償器のため複数の基
準入力が与えられる。誤差信号、即ち、この多重基準サ
ウンド補償器の出力信号は、マイクロホン信号と、全適
応フィルタ出力との間の差信号である。適応フィルタリ
ングに関する経費を大きくすると共に、マイクロホン信
号のテレビジョン音声信号成分のより大きい抑制が実現
されるようになる。この差信号は、例えば、5台のスピ
ーカを用いたサラウンドシステムにおいて2台以上のス
ピーカがある場合に、又は、ドルビープロロジック再生
の場合に特に重要である。
【0020】図5に示された実施例は、アレイ状に配置
された複数のマイクロホンMIC1、MIC2、MIC
3を使用する点に特徴がある。本実施例の場合、別個の
指向性を得ることが可能であり、話者がマイクロホンか
ら遠ざかることが許容される。この場合の必要条件は、
有用な信号が特定の方向、特に正面からアレイに当たる
ことである。指向性はアレイの幾何学的関係の結果とし
て生じる。本例において、マイクロホンは、ハンドフリ
ー発話ができるように、機器自体、例えば、テレビジョ
ンの筐体に一体化されている。
された複数のマイクロホンMIC1、MIC2、MIC
3を使用する点に特徴がある。本実施例の場合、別個の
指向性を得ることが可能であり、話者がマイクロホンか
ら遠ざかることが許容される。この場合の必要条件は、
有用な信号が特定の方向、特に正面からアレイに当たる
ことである。指向性はアレイの幾何学的関係の結果とし
て生じる。本例において、マイクロホンは、ハンドフリ
ー発話ができるように、機器自体、例えば、テレビジョ
ンの筐体に一体化されている。
【0021】このような配置は、通常サウンド出力を有
するコンピュータゲームを作動するため使用され得る。
コンピュータゲームは、コンピュータ、テレビジョンセ
ット、又は、これらの機器の組合せ上で楽しまれる。コ
ンピュータ用の音声作動式制御システムの場合に、音声
は、通常、マイクロホン及びサウンドカードを介してコ
ンピュータに入力される。筐体内に統合する代わりに、
マイクロホンは、例えば、コンピュータマウス若しくは
所謂ジョイスティックのような制御装置に一体化させて
もよく、又は、ユーザの口の直ぐ正面にあるヘッドマイ
クロホンでも構わない。
するコンピュータゲームを作動するため使用され得る。
コンピュータゲームは、コンピュータ、テレビジョンセ
ット、又は、これらの機器の組合せ上で楽しまれる。コ
ンピュータ用の音声作動式制御システムの場合に、音声
は、通常、マイクロホン及びサウンドカードを介してコ
ンピュータに入力される。筐体内に統合する代わりに、
マイクロホンは、例えば、コンピュータマウス若しくは
所謂ジョイスティックのような制御装置に一体化させて
もよく、又は、ユーザの口の直ぐ正面にあるヘッドマイ
クロホンでも構わない。
【0022】
【発明の効果】本発明を使用することにより、音声作動
式制御システムの誤差に対するイミュニティを増大さ
せ、特に、音声検出レートを著しく改良することが可能
になる。その結果として、テレビジョンセット、ビデオ
レコーダ、衛星受信器、オーディオ機器、及び、完全な
ステレオシステム、並びに、パーソナルコンピュータ及
び他の家庭用機器の改良された音声作動式遠隔制御が実
現可能になる。
式制御システムの誤差に対するイミュニティを増大さ
せ、特に、音声検出レートを著しく改良することが可能
になる。その結果として、テレビジョンセット、ビデオ
レコーダ、衛星受信器、オーディオ機器、及び、完全な
ステレオシステム、並びに、パーソナルコンピュータ及
び他の家庭用機器の改良された音声作動式遠隔制御が実
現可能になる。
【図1】マイクロホンが統合され、スピーカ信号の単一
信号形式を有する遠隔制御システムを備えた音声作動式
制御システムを表す図である。
信号形式を有する遠隔制御システムを備えた音声作動式
制御システムを表す図である。
【図2】適応サウンド補償器のブロック回路図である。
【図3】ノイズ抑制のためのスペクトル減算用配置のブ
ロック図である。
ロック図である。
【図4】マイクロホンが統合され、スピーカ信号の単一
信号形式を用いない遠隔制御システムを備えた音声作動
式制御システムを表す図である。
信号形式を用いない遠隔制御システムを備えた音声作動
式制御システムを表す図である。
【図5】テレビジョン筐体に統合された複数のマイクロ
ホンを有する音声作動式制御システムを表す図である。
ホンを有する音声作動式制御システムを表す図である。
MIC,MIC1,MIC2,MIC3 マイクロホ
ン RCU 遠隔制御システム TV テレビジョンセット L1,L2 スピーカ MON 単一化器 SCOMP サウンド補償器 NSUP ノイズ抑制器 SREC 音声検出器 AF 適応フィルタ SD 音声間隔検出器 FFT フーリエ変換 RAM メモリ SM 平滑化 IFFT 逆フーリエ変換 SS サンプル加算
ン RCU 遠隔制御システム TV テレビジョンセット L1,L2 スピーカ MON 単一化器 SCOMP サウンド補償器 NSUP ノイズ抑制器 SREC 音声検出器 AF 適応フィルタ SD 音声間隔検出器 FFT フーリエ変換 RAM メモリ SM 平滑化 IFFT 逆フーリエ変換 SS サンプル加算
Claims (9)
- 【請求項1】 音声コマンドを電気信号に変換する1台
又は複数台のマイクロホンと、上記電気信号を制御コマ
ンドに変換する音声検出器とにより構成され、少なくと
も1台のスピーカを介してオーディオ信号を送出する機
器を音声作動式に遠隔制御するシステムにおいて、 マイクロホン信号は、音声コマンドと、オーディオ信号
と、他のバックグラウンドノイズとからなり、 スピーカとマイクロホンとの間の空間内の伝送路をモデ
ル化することにより、上記機器によって送出されたオー
ディオ信号がマイクロホンの位置で評価され、上記マイ
クロホン信号を補正するため使用されるサウンド補償器
が設けられていることを特徴とするシステム。 - 【請求項2】 マイクロホン信号は、最初に上記サウン
ド補償器に供給され、 補償された信号がバックグラウンドノイズをできる限り
除去するノイズ抑制器に供給され、 上記信号は、次に、パターン認識を用いてコマンドを検
出する音声検出器に供給されることを特徴とする請求項
1記載のシステム。 - 【請求項3】 上記サウンド補償ユニットは一つ以上の
適応フィルタを含むことを特徴とする請求項1又は2記
載のシステム。 - 【請求項4】 種々の適応フィルタが種々のスピーカか
らのオーディオ信号のため設けられていることを特徴と
する請求項3記載のシステム。 - 【請求項5】 上記適応フィルタは、適応正規化最小二
乗有限インパルス応答フィルタ(NLMS−FIR)の
形に構成されていることを特徴とする請求項3又は4記
載のシステム。 - 【請求項6】 単一信号が複数のオーディオ信号から獲
得され、上記サウンド補償器に供給されることを特徴と
する請求項1乃至5のうちいずれか1項記載のシステ
ム。 - 【請求項7】 マイクロホンは、上記機器を作動させる
ためのユニット、特に、遠隔制御システムに統合されて
いることを特徴とする請求項1乃至6のうちいずれか1
項記載のシステム。 - 【請求項8】 少なくとも1台のマイクロホンが上記機
器の筐体に統合されていることを特徴とする請求項1乃
至7のうちいずれか1項記載のシステム。 - 【請求項9】 複数のマイクロホンが別個の指向性を実
現するためアレイ状に配置されていることを特徴とする
請求項1乃至8のうちいずれか1項記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE1997112632 DE19712632A1 (de) | 1997-03-26 | 1997-03-26 | Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten |
DE19712632:4 | 1997-03-26 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10282993A true JPH10282993A (ja) | 1998-10-23 |
Family
ID=7824636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10068436A Pending JPH10282993A (ja) | 1997-03-26 | 1998-03-18 | 機器の音声作動式遠隔制御システム |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP0867860A3 (ja) |
JP (1) | JPH10282993A (ja) |
DE (1) | DE19712632A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001117587A (ja) * | 1999-09-14 | 2001-04-27 | Deutsche Thomson Brandt Gmbh | マイクロホンアレイを有するボイス制御システム |
JP2009104156A (ja) * | 2001-12-17 | 2009-05-14 | Asahi Kasei Homes Kk | 電話通信端末 |
CN108271096A (zh) * | 2018-01-30 | 2018-07-10 | 上海乐愚智能科技有限公司 | 一种任务执行方法、装置、智能音箱及存储介质 |
Families Citing this family (129)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6584439B1 (en) | 1999-05-21 | 2003-06-24 | Winbond Electronics Corporation | Method and apparatus for controlling voice controlled devices |
US7283964B1 (en) | 1999-05-21 | 2007-10-16 | Winbond Electronics Corporation | Method and apparatus for voice controlled devices with improved phrase storage, use, conversion, transfer, and recognition |
EP1079352B1 (en) * | 1999-08-27 | 2012-10-10 | Thomson Licensing | Remote voice control system |
DE19943872A1 (de) * | 1999-09-14 | 2001-03-15 | Thomson Brandt Gmbh | Vorrichtung zur Anpassung der Richtcharakteristik von Mikrofonen für die Sprachsteuerung |
DE19944467C2 (de) * | 1999-09-16 | 2002-06-06 | Siemens Audiologische Technik | Verfahren zur Reduzierung von akustischen Störsignalen |
CN1134767C (zh) * | 1999-09-23 | 2004-01-14 | 皇家菲利浦电子有限公司 | 消音模块和语音识别设备以及消费者电子系统 |
DE10002321C2 (de) * | 2000-01-20 | 2002-11-14 | Micronas Munich Gmbh | Sprachgesteuerte Vorrichtung und System mit einer derartigen sprachgesteuerten Vorrichtung |
EP1269306A4 (en) * | 2000-01-28 | 2008-09-03 | Dolby Lab Licensing Corp | SPACE-COMPONENT AUDIO SYSTEM FOR USE IN A GEOGRAPHICAL ENVIRONMENT |
JP2003521202A (ja) | 2000-01-28 | 2003-07-08 | レイク テクノロジー リミティド | 地理的な環境で使用される空間オーディオシステム。 |
DE10006240A1 (de) * | 2000-02-11 | 2001-08-16 | Bsh Bosch Siemens Hausgeraete | Elektrogerät mit Spracheingabeeinheit und Verfahren zur Spracheingabe |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US7035796B1 (en) | 2000-05-06 | 2006-04-25 | Nanyang Technological University | System for noise suppression, transceiver and method for noise suppression |
KR20020032621A (ko) * | 2000-07-28 | 2002-05-03 | 요트.게.아. 롤페즈 | 음성 명령으로 장치를 제어하는 시스템 |
DE10058786A1 (de) * | 2000-11-27 | 2002-06-13 | Philips Corp Intellectual Pty | Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts |
KR100552468B1 (ko) * | 2001-07-19 | 2006-02-15 | 삼성전자주식회사 | 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법 |
US7349849B2 (en) * | 2001-08-08 | 2008-03-25 | Apple, Inc. | Spacing for microphone elements |
JP4195267B2 (ja) * | 2002-03-14 | 2008-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識装置、その音声認識方法及びプログラム |
DE10252457A1 (de) * | 2002-11-12 | 2004-05-27 | Harman Becker Automotive Systems Gmbh | Spracheingabe-Interface |
US20060087924A1 (en) * | 2004-10-22 | 2006-04-27 | Lance Fried | Audio/video portable electronic devices providing wireless audio communication and speech and/or voice recognition command operation |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
JP5589323B2 (ja) * | 2009-08-27 | 2014-09-17 | ヤマハ株式会社 | 音信号処理装置 |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US8977584B2 (en) | 2010-01-25 | 2015-03-10 | Newvaluexchange Global Ai Llp | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR102516577B1 (ko) | 2013-02-07 | 2023-04-03 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
KR101959188B1 (ko) | 2013-06-09 | 2019-07-02 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101809808B1 (ko) | 2013-06-13 | 2017-12-15 | 애플 인크. | 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법 |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US11170798B2 (en) * | 2018-12-12 | 2021-11-09 | Bby Solutions, Inc. | Remote audio pickup and noise cancellation system and method |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8911153D0 (en) * | 1989-05-16 | 1989-09-20 | Smiths Industries Plc | Speech recognition apparatus and methods |
US5267323A (en) * | 1989-12-29 | 1993-11-30 | Pioneer Electronic Corporation | Voice-operated remote control system |
JPH0522779A (ja) * | 1991-07-09 | 1993-01-29 | Sony Corp | 音声認識遠隔制御装置 |
US5812972A (en) * | 1994-12-30 | 1998-09-22 | Lucent Technologies Inc. | Adaptive decision directed speech recognition bias equalization method and apparatus |
DE19514849A1 (de) * | 1995-04-26 | 1996-10-31 | Sel Alcatel Ag | Verfahren zur Fernsteuerung und Vorrichtung dafür |
DE19521258A1 (de) * | 1995-06-10 | 1996-12-12 | Philips Patentverwaltung | Spracherkennungssystem |
-
1997
- 1997-03-26 DE DE1997112632 patent/DE19712632A1/de not_active Withdrawn
-
1998
- 1998-03-14 EP EP98104636A patent/EP0867860A3/en not_active Withdrawn
- 1998-03-18 JP JP10068436A patent/JPH10282993A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001117587A (ja) * | 1999-09-14 | 2001-04-27 | Deutsche Thomson Brandt Gmbh | マイクロホンアレイを有するボイス制御システム |
JP2009104156A (ja) * | 2001-12-17 | 2009-05-14 | Asahi Kasei Homes Kk | 電話通信端末 |
CN108271096A (zh) * | 2018-01-30 | 2018-07-10 | 上海乐愚智能科技有限公司 | 一种任务执行方法、装置、智能音箱及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP0867860A3 (en) | 1999-04-14 |
EP0867860A2 (en) | 1998-09-30 |
DE19712632A1 (de) | 1998-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH10282993A (ja) | 機器の音声作動式遠隔制御システム | |
JP4792156B2 (ja) | マイクロホンアレイを有するボイス制御システム | |
EP3295681B1 (en) | Acoustic echo cancelling system and method | |
TWI520127B (zh) | 應用於音訊裝置的控制器與相關的操作方法 | |
EP1556857B1 (en) | Controlling an apparatus based on speech | |
CN106664473B (zh) | 信息处理装置、信息处理方法和程序 | |
US8842851B2 (en) | Audio source localization system and method | |
US10359991B2 (en) | Apparatus, systems and methods for audio content diagnostics | |
JP4286637B2 (ja) | マイクロホン装置および再生装置 | |
US11373665B2 (en) | Voice isolation system | |
JP4897169B2 (ja) | 音声認識装置及び消費者電子システム | |
JP2005084253A (ja) | 音響処理装置、方法、プログラム及び記憶媒体 | |
CN110557710A (zh) | 具有语音控制的低复杂度多声道智能扩音器 | |
CN111354368B (zh) | 补偿处理后的音频信号的方法 | |
JP2001100785A (ja) | Av機器用音声認識装置 | |
WO2003107327A1 (en) | Controlling an apparatus based on speech | |
CN107197403B (zh) | 一种终端音频参数管理方法、装置及系统 | |
JPH0522779A (ja) | 音声認識遠隔制御装置 | |
CN118660262A (zh) | 一种集成mems扬声器与麦克风的混合信号处理方法及系统 | |
JP2003533110A (ja) | オーディオシステム | |
US11721351B2 (en) | Remote audio pickup and noise cancellation system and method | |
CN1194427A (zh) | 对设备进行语音操作遥控的方法和装置 | |
Reindl et al. | An acoustic front-end for interactive TV incorporating multichannel acoustic echo cancellation and blind signal extraction | |
US20220369030A1 (en) | Spatially informed acoustic echo cancelation | |
WO2023117272A1 (en) | Noise cancellation |