JP4295846B2 - 音声装置及び音声装置の自己初期化方法 - Google Patents
音声装置及び音声装置の自己初期化方法 Download PDFInfo
- Publication number
- JP4295846B2 JP4295846B2 JP32005198A JP32005198A JP4295846B2 JP 4295846 B2 JP4295846 B2 JP 4295846B2 JP 32005198 A JP32005198 A JP 32005198A JP 32005198 A JP32005198 A JP 32005198A JP 4295846 B2 JP4295846 B2 JP 4295846B2
- Authority
- JP
- Japan
- Prior art keywords
- network
- user
- voice
- command
- vocabulary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/40—Bus networks
- H04L12/40052—High-speed IEEE 1394 serial bus
- H04L12/40117—Interconnection of audio or video/imaging devices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Automation & Control Theory (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Selective Calling Equipment (AREA)
- Small-Scale Networks (AREA)
- Telephonic Communication Services (AREA)
Description
【発明の属する技術分野】
本発明は、音声装置と、遠隔制御可能なネットワーク機器、及び音声装置の自己初期化方法に関する。
【0002】
【従来の技術】
近年、音声認識装置が、テレビジョン受像機、ラジオ受信機、車載ナビゲーション、携帯電話、ビデオカメラ、パーソナルコンピュータ(以下、PCという。)、プリンタ、暖房機器といった民生用機器を音声によって制御するために、少しであるが用いられるようになっている。音声認識装置は、制御される機器自体に内蔵されている。音声認識装置の語彙、文法、コマンド等のプロパティは、個々の機器に特有の機能に適するように作られている。
【0003】
また、上述した民生用機器を、例えばIEEE1394シリアルバスのような専用バスシステムによって接続する技術が利用されている。このようなシステムに接続された機器は、コマンドやデータを互いに送受して通信を行っている。通常、このような機器は、ネットワークに接続されているとき、それぞれ他の機器と識別されるように、ネットワークコントローラによって固有のアドレスが与えられる。これらのアドレスは、互いに通信するために、他の全ての機器によって用いられる。新しい機器が接続された場合は、このネットワークに接続されている他の全ての機器に、この新しく接続された機器のアドレスと機種が通知される。このようなネットワークは、家庭や、車に導入されている。
【0004】
例えば、カーステレオの制御などの民生用機器の操作は、より複雑になってきているが、音声認識装置を用いることによって、操作が容易になり、また、車中で用いると、安全性も増す。また、家庭のネットワークでも、音声認識装置を用いると、例えばビデオテープレコーダのプログラミング、又はテレビジョン受像機のチャンネル選択といった操作を簡単に行うことができる。しかしながら、音声認識装置は、複雑な回路構成が必要であり、確実で柔軟な操作を確保するには、非常に費用のかかる技術を要する。したがって、音声認識装置は、上述した機器には、ほんの少ししか採用されておらず、ほとんど普及していない。
【0005】
【発明が解決しようとする課題】
本発明は、上述した実情に鑑みてなされたものであり、本発明の目的は、複数の機器を制御することができる汎用の音声装置を提供することである。また、本発明の目的は、音声により、ネットワークを介して簡単に制御することができる遠隔制御可能な機器を提供することである。
【0006】
【課題を解決するための手段】
本発明に係る音声装置は、マイクロホンからのユーザの音声信号を認識する音声認識手段と、ネットワークを介して遠隔制御可能なネットワーク機器から、ネットワーク機器の記憶部又はネットワーク機器に挿入された記録媒体固有の語彙及び/又は文法と、語彙及び/又は文法に基づくユーザネットワークコマンドとを受信するための通信制御ネットワークコマンドをネットワーク機器に送信するとともに、ネットワーク機器からその機器の種類を示すデータを受信し、受信した語彙及び/又は文法、及びユーザネットワークコマンドと、機器の種類を示すデータとを対応させて、ネットワーク機器の種類に対応したユーザネットワークコマンドを生成する制御手段と、受信した語彙及び/又は文法、及びユーザネットワークコマンドを記憶する記憶手段とを備え、制御手段は、音声認識手段からの音声信号を記憶手段に記憶された語彙及び/又は文法に基づいて認識解読して、対応するユーザネットワークコマンドを記憶手段から読み出してネットワーク機器に送信する。
また、本発明に係る音声装置の自己初期化方法は、ネットワーク機器に接続された音声装置の自己初期化方法において、ネットワークを介して遠隔制御可能なネットワーク機器から、ネットワーク機器の記憶部又はネットワーク機器に挿入された記録媒体固有の語彙及び/又は文法と、語彙及び/又は文法に基づくユーザネットワークコマンドとを受信するための通信制御ネットワークコマンドを、ネットワーク機器に送信するステップと、ネットワーク機器から送られてくる語彙及び/又は文法、及びユーザネットワークコマンドを受信するステップと、ネットワーク機器に論理名又は識別子の送信を要求するステップと、ネットワーク機器から送られてくる論理名又は識別子を受信するステップと、受信した語彙及び/又は文法、及びユーザネットワークコマンドと、論理名又は識別子とを対応させて、ネットワーク機器固有のユーザネットワークコマンドを生成し、内蔵のメモリに記憶している語彙及び/又は文法、及びユーザネットワークコマンドを、受信した語彙及び/又は文法、及びユーザネットワークコマンドによって更新するステップとを有する。
【0008】
【発明の実施の形態】
以下、本発明に係る音声装置及び遠隔制御可能なネットワーク機器について、図面を参照しながら説明する。
【0009】
図1は、本発明を適用した音声装置の具体的な構成を示すブロック図である。この音声装置10には、マイクロホン1と、ラウドスピーカ2とが接続されている。これらは、音声装置10に内蔵するようにしてもよい。音声装置10は、音声認識機能、音声解読機能、音声合成機能、対話機能等を有し、IEEE1394シリアルバス3に接続されている。マイクロホン1は、ユーザが発した音声を音声信号に変換し、このアナログ音声信号はアナログ/デジタル(A/D)変換器(図示せず)によってデジタル音声信号に変換されて音声装置10に供給される。スピーカ2には、音声装置10からのデジタル音声信号がデジタル/アナログ(D/A)変換器(図示せず)によりアナログ音声信号に変換されて供給される。
【0010】
IEEE1394規格は、娯楽機器、通信機器及び電子計算機を民生用のマルチメディアに統合する、低価格のデジタルインタフェースを規定した国際規格である。ユーザは、IEEE1394シリアルバスがアクティブな状態においても、IEEE1394規格に準拠した機器を取り外したり取り付けたり(活線挿抜)することができ、IEEE1394シリアルバスは、低価格で使いやすいバスシステムである。本発明は、このIEEE1394シリアルバス及びIEEE1394規格に準拠した機器(以下、ネットワーク機器という。)を用いて説明されているが、本発明は、この特定のIEEE1394シリアルバスに限らず、全ての種類の有線又は無線のホームネットワーク、又は他のネットワーク上でも応用することができる。
【0011】
後に詳しく説明するが、音声装置10は、図1に示すように、IEEE1394シリアルバス(以下、ホームネットワークともいう。)3に接続されている。この音声装置10は、一般的な語彙を備え、一般的な目的で使用される音声認識及び合成装置を含んでいる。そして、1つの音声装置10が、ホームネットワーク3に接続されている全てのネットワーク機器20を制御する。音声装置10は、マイクロホン1を介してユーザからの音声コマンドをピックアップし、この音声コマンドを、例えばIEEE1394規格のホームネットワークに適した制御コード(以下、ユーザネットワークコマンドともいう。)に変換する。このユーザネットワークコマンドは、適切なネットワーク機器20に送信され、そのネットワーク機器20は、そのユーザネットワークコマンドに基づいて動作する。
【0012】
全てのネットワーク機器20がユーザの音声によって制御されるようにするためには、音声装置10は、個々のネットワーク機器20を動作させるのに必要なコマンドを知識として持っている必要がある。音声装置10は、例えば複数の機器に共通のコマンドである基本的なコマンドを知っている。多くのユーザからの音声コマンドは、単一のユーザネットワークコマンドとされることもある。音声コマンドは、例えば、再生、ラジオ局YXZの選局、電話番号等の続き番号などである。これらの音声コマンドは、それのみで発せられることもあるし、又はそれが文(Full Sentence)の中に組み込まれていることもある。文も、音声コマンドである。
【0013】
音声装置10における音声認識、解読及び対話の技術は、周知のことであるので、本発明では詳しくは説明しないが、基本的には、音声装置10は、語彙のセットと、文法のセットを備えており、これらの語彙と文法に基づいて、ユーザからの音声コマンドをユーザネットワークコマンドに変換し、ネットワーク機器20は、そのユーザネットワークコマンドに従って動作する。また、音声装置10は、各単語に対応する発音を数パターン有し、ユーザと対話、すなわちユーザに対して音声を発する。
【0014】
本発明を適用した音声装置10は、デジタルシグナルプロセッサ(以下、DSPという。)11を備えており、このDSP11には、マイクロホン1が接続されている。このDSP11は、マイクロホン1から、ユーザが発した音声コマンドに対応したデジタル音声信号が供給され、これらのデジタル音声信号を、中央処理装置(以下、CPUという。)12が認識可能なデジタル言語に変換する処理を行う。この変換処理を行うために、DSP11には、DSP11が実行する処理についての情報を記憶しているメモリ16が双方向通信可能に接続されており、またDSP11には、音声認識部11aが内蔵されている。また、DSP11には、メモリ15の中の特徴抽出部15eが接続されており、この特徴抽出部15eには、音声コマンドに対応するデジタル音声信号を、どのようにしてデジタル言語に変換するかについての情報が記憶されている。すなわち、DSP11は、マイクロホン1を介してユーザが発した音声コマンドを、例えばテキストコードなどのコンピュータが認識可能な形式に変換する。
【0015】
DSP11は、このようにして生成したデジタル言語を、CPU12に供給する。CPU12は、これらのデジタル言語をユーザネットワークコマンドに変換し、ホームネットワーク3に送信する。したがって、DSP11及びCPU12は、音声認識機能、対話機能、音声解読機能を有している。
【0016】
なお、DSP11が、マイクロホン1を介してのユーザからの音声コマンドのスペクトル分析のみを行い、語の認識自体は、CPU12が、ユーザネットワークコマンドへの変換とともに、行うようにしてもよい。また、CPU12の能力によっては、CPU12がスペクトル分析も行い、DSP11を削除するようにしてもよい。
【0017】
更に、CPU12は、音声装置10が新しい語彙、文法、及びネットワーク機器20に送信されるユーザネットワークコマンドを学習できるようにするための学習機能を備えている。この学習機能を実現するために、CPU12には、CPU12が実行する処理についての情報を記憶しているメモリ16が、双方向通信可能に接続されている。更に、CPU12には、メモリ15が接続されており、このメモリ15は、初期語彙部15aと、付加語彙部15bと、初期文法部15cと、付加文法部15dとから成り、CPU12と双方向通信可能になっている。また、メモリ15は、認識部と文字素/音素変換(grapheme/phoneme conversion)部とを備えたソフトウエア部15fを有し、このソフトウェア部15fは、CPU12と双方向通信可能に接続されている。また、CPU12には、DSP17が接続されており、CPU12は、DSP17にメッセージのデータを供給する。DSP17は、音声合成及び生成部17aを内蔵し、メッセージのデータから音声を合成して、ラウドスピーカ2を介して出力する。
【0018】
CPU12には、リンクレイヤ制御回路13及びI/F物理レイヤ回路14を介して、ホームネットワーク3が、双方向通信可能に接続されている。リンクレイヤ制御回路13及びI/F物理レイヤ回路14は、ユーザネットワークコマンドをホームネットワーク3に接続されている選択された機器に送信するとともに、ホームネットワーク3を介して送られてくる、例えば新たな種類のユーザネットワークコマンドを受信する。
【0019】
すなわち、音声装置10は、新しいユーザネットワークコマンド及びそれに対応する語彙及び文法を、他のネットワーク機器20から直接に学習することもできる。このような学習をするために、音声装置10は、ネットワーク機器20を制御するためのメモリ16に記憶されている制御コマンドを、制御ネットワークコマンドとしてネットワーク機器20に送信する。この制御ネットワークコマンドは、ユーザがネットワーク機器20を制御する際に用いるユーザネットワークコマンド、それに対応する語彙及び文法を、音声装置10に送信するように、ネットワーク機器20に要求するためのコマンドである。メモリ15は、付加語彙部15bと、付加文法部15dとを備えており、これらは、新しく入力された語彙及び文法を記憶する。付加語彙部15b及び付加文法部15dはそれぞれ、初期語彙部15aと、初期文法部15cと同じように機能するが、付加語彙部15b及び付加文法部15dは、CPU12の制御の下に、新しく入力されたユーザネットワークコマンド及びこれを認識するのに必要な語彙や文法等の情報を記憶する。このようにして、音声装置10は、いかなるネットワーク機器20が有するユーザネットワークコマンド、それに対応する語彙及び文法をも学習することができる。新しいネットワーク機器20は、音声認識部を内蔵している必要はなく、ネットワーク上の独立した音声装置10が制御可能なユーザネットワークコマンド、それに対応する語彙及び文法等の情報を送信する機能のみを備えていればよい。すなわち、本発明を適用した音声装置10は、ユーザネットワークコマンドと、それに対応する語彙及び文法とを学習することができ、ユーザは、音声装置10を介して各ネットワーク機器20を、音声で制御されることができる。
【0020】
初期語彙部15a及び初期文法部15cは、様々なネットワーク機器20に対して用いられる基本的なユーザネットワークコマンドのセットを記憶しており、これらのユーザネットワークコマンドは、例えば「電源オン」、「電源オフ」、「一時停止」、「音量アップ」等の音声コマンドに対応するユーザネットワークコマンドである。これらのユーザネットワークコマンドとCPU12が必要とするそれに対応した語彙及び文法は、DSP11に内蔵されている音声認識部11aによって生成されるデジタル言語と区別するために、初期語彙部15a及び初期文法部15cに記憶されている。更に、基本的な質問又はメッセージが、メモリ16に記憶されている。これらは、音声装置10からユーザに対して発せられる。このような質問又はメッセージは、例えば「もう一度言って下さい」、「どの機器の電源を切りたいのですか」などであり、ユーザが発したコマンドを適切なユーザネットワークコマンドにするために、音声装置10とユーザの対話の際に用いられるものである。これらの質問又はメッセージは、CPU12が必要とする音声データとともに記憶されており、CPU12は、デジタル言語を生成して、DSP17の中の音声合成及び生成部17aに出力し、音声合成及び生成部17aは、メッセージを生成して、ラウドスピーカ2を介しててユーザに出力する。かくして、CPU12は、マイクロホン1、DSP11,17及びラウドスピーカ2を用いてユーザと双方向通信ができ、すなわち音声装置10は、ユーザと対話することができ、ユーザからも学習することができる。換言すると、音声装置10は、ネットワーク機器20からの学習と同様に、メモリ16に記憶されている制御ネットワークコマンドのセットを用いて、様々な情報を音声装置10に提供するように、ユーザに要求することができる。
【0021】
上述したように、音声装置10からユーザに対して、制御ネットワークコマンドがメッセージとなって発せられた場合、ユーザもまた、マイクロホン1及びDSP11を介して、ユーザネットワークコマンドと、それに対応する語彙及び文法とを、CPU12に対して教えることができる。ユーザが、音声装置10を学習モードにさせるための音声コマンドを発すると、CPU12は、メモリ16に記憶されている制御ネットワークコマンドに基づいて、ユーザと対話をし、新しいユーザネットワークコマンド、それに対応する語彙及び文法を学習して、メモリ15の各部に記憶する。
【0022】
また、新しいユーザネットワークコマンドの学習は、半分は、音声装置10とあるネットワーク機器20との通信によって自動的に行われ、もう半分は、音声装置10とユーザとの対話によって行われるようにしてもよい。このように、この音声装置10には、ネットワーク機器20によるユーザネットワークコマンドの他に、ユーザが関わるユーザネットワークコマンドが生成される。
【0023】
上述したように、音声装置10は、3種類のコマンド、すなわちユーザが発する音声コマンドと、この音声コマンドに対応するデジタル信号等であるユーザネットワークコマンドと、制御ネットワークコマンドとを処理する。この制御ネットワークコマンドは、他のネットワーク機器20又はユーザから新しいユーザネットワークコマンドを学習するためのネットワーク機器20又はユーザとの通信を行うために用いられる。また、制御ネットワークコマンドは、ユーザが新しい音声コマンドを入力できるように、音声コマンドにある機能を付加したり、既に記憶しているユーザネットワークコマンドに新しい機能を付加したりするために用いられる。
【0024】
音声装置10がユーザに向かって発する音声は、合成された音声か、予め録音された音声かのどちらであってもよい。例えば、頻繁に使われるメッセージには、予め録音された音声を用いて、他のメッセージには、合成された音声を用いるなどの両方を混合してもよい。また、どのネットワーク機器20も、音声装置10に対してメッセージを送信することができる。ネットワーク機器20は、これらのメッセージを、文字列(orthographic form)、符号化して、又はある方法における識別子として送信する。そして、これらの文字列のメッセージは、例えば、音声装置10に接続されているラウドスピーカ2を介して出力される。メッセージは、いかなる種類の情報でもよく、また、その情報は通常、ネットワーク機器20の表示部に表示されている。更に、メッセージは、対話の一部として、ユーザに対して発せられる質問であってもよい。上述したように、このような対話は、音声装置10自体がユーザの音声コマンドを確認するために行われ、又は音声装置10が、新しいユーザネットワークコマンド、それに対応する語彙及び文法を学習するために、制御ネットワークコマンドに基づいて行われる。
【0025】
なお、例えば、マイクロホン1とラウドスピーカ2は、1つの音声入力及び/又は出力装置と構成してもよい。この場合、メッセージの交換は、音声装置10と音声入力及び/又は出力装置との間で、文字列によって行われる。
【0026】
ユーザは、ホームネットワーク3にどのような機器が接続されているのかについて、音声装置10に確認したい場合がある。この場合、「どの機器の電源を入れましょうか?」といった、音声装置10自体がユーザに発する音声メッセージに対して、ユーザが、「ネットワークに接続中の機器は?」といったメッセージを音声装置10に聞き返す。そして、音声装置10が、「ネットワークに接続中の機器は?」といったユーザからのメッセージに答えた後、ユーザは、「どの機器の電源を入れましょうか?」といった音声装置10からのメッセージに答える。
【0027】
図2は、本発明を適用した遠隔制御可能な機器、すなわちホームネットワーク3を介して音声装置10と接続されたネットワーク機器20の具体的な構造を示すブロック図である。なお、この図2には、音声制御に必要な回路ブロックのみが示されている。
【0028】
このようなネットワーク機器20のCPU21は、リンクレイヤ制御部26及びI/F物理レイヤ回路25を介して、ホームネットワーク3に接続されている。音声装置10における場合と同じように、CPU21とホームネットワーク3は、双方向通信可能に接続されており、これにより、CPU21は、ホームネットワーク3から、ユーザネットワークコマンド、制御ネットワークコマンド、他の情報を受信し、また、ホームネットワーク3を介して、他のネットワーク機器20又は音声装置10に対して、制御ネットワークコマンド、メッセージ、他の情報を送信する。また、一部のネットワーク機器20は、ユーザネットワークコマンドを送信する。CPU21には、メモリ23が、双方向通信可能に接続されており、このメモリ23には、他のネットワーク機器20との通信に必要な一連の制御コマンドを含む、CPU21の処理に必要な情報が、全て記憶されている。また、CPU21には、ネットワーク機器20の全ての処理を制御する機器制御ソフトウェア部24が、双方向通信可能に接続されている。ネットワーク機器20を制御する全てのユーザネットワークコマンドと、それに対応する語彙及び文法とを記憶しているメモリ22もまた、CPU21と双方向通信可能に接続されている。これらのユーザネットワークコマンドと、それに対応する語彙及び文法は、ネットワーク機器20のCPU21と、ネットワーク機器20のリンクレイヤ制御部26及びI/F物理レイヤ回路25と、ホームネットワーク3と、音声装置10のI/F物理レイヤ回路14及びリンクレイヤ制御回路13と、音声装置10のCPU12とを介して、各ネットワーク機器20の機器名とともに、音声装置10に内蔵されているメモリ15の付加語彙部15b及び付加文法部15dに、ダウンロードされる。すなわち、本発明に適用した音声装置10は、上述のようにして、ネットワーク機器20を制御するのに必要な全てのユーザネットワークコマンドと、それに対応する語彙及び文法を学習することができる。したがって、本発明を適用したネットワーク機器20は、音声で制御できるようにするための音声認識部をそれぞれ内蔵する必要はなく、音声装置10にダウンロードするための機器毎のユーザネットワークコマンドと、それに対応する語彙及び文法とを記憶したメモリさえ備えていればよい。なお、語彙を新たに更新しなくても、音声装置10は、ネットワーク機器20に対して、基本的な制御を行うことはできる。すなわち、ネットワーク機器毎のユーザネットワークコマンドと、それに対応する語彙及び文法がなくても、音声装置10は、ネットワーク機器20に対して、例えば「電源オン」、「電源オフ」、「音量アップ」、「チャンネル変更」、「再生」、「停止」等のどのような機器にも共通する基本的な制御を行うことができる。
【0029】
図3は、IEEE1394シリアルバス3を用いたネットワークシステムの形態の一例を示す図である。このネットワークシステムには、マイクロホン1及びラウドスピーカ2を備えた1つの音声装置10と、4つのネットワーク機器20とが接続されている。
【0030】
図4は、IEEE1394シリアルバス3を用いたネットワークシステムの形態の他の例を示す図である。このネットワークシステムでは、4つのネットワーク機器20の他に、マイクロホン1及びラウドスピーカ2を備えた音声装置10を内蔵したネットワーク機器30が、ホームネットワーク3に接続されている。このような、音声装置10を内蔵したネットワーク機器30は、ネットワーク機器20と音声装置10を合わせた機能を有する。そして、音声装置10は、ネットワーク機器20と、音声装置10を内蔵したネットワーク機器30とを制御する。
【0031】
図5は、IEEE1394シリアルバス3を用いたネットワークシステムの形態の他の例を示す図である。ネットワークシステムAは、図3におけるネットワークシステムと似ているが、6つのネットワーク機器20が、ホームネットワーク3に接続されている。ホームネットワーク3に接続されている音声装置10は、ネットワーク機器20をいくつでも制御することができる。どのネットワーク機器20でも、ホームネットワーク3に接続されていれば、音声装置10によって制御される。
【0032】
図6は、図3乃至図5のIEEE1394シリアルバス3を用いたネットワークシステムにおける機器間のより詳細な接続を示す図である。この図6のネットワークシステムBに示すように、1つの音声装置10と5つのネットワーク機器20は、閉ループを構成することなく、IEEE1394シリアルバス3を介してディジーテェーン又はスター状に接続されている。したがって、互いに直接接続されていない音声装置10又はネットワーク機器20同士は、それらの中間に接続された音声装置10又はネットワーク機器20を介して通信するようになっている。すなわち、IEEE1394シリアルバスでは、自分宛でない情報は、次の機器に転送することにより、図3乃至5に示すようなバスを擬似的に形成している。したがって、本発明は、上述したIEEE1394シリアルバスを用いたネットワークシステムに限定されるものではなく、様々なネットワークシステムにも適用することができる。
【0033】
例えば、図7は、本発明を適用した音声装置10とネットワーク機器20を用いた無線ネットワークシステムを示す図である。ここでは、全ての機器が、各自が内蔵している送信機と受信機を介して、互いに直接に通信を行うようになっている。この例では、複数の音声装置10が、1つのネットワークの中に接続されている。これらの音声装置10は、両方とも同じ機能を持っていてもよいし、又は互いに異なる機能を持っていてもよい。このよう構成することにより、各ユーザが個人用の音声装置10を携帯して、様々なネットワーク機器20を制御することができる。また、無線の個人用の音声装置10では、他の場所のネットワークシステムに携帯して持っていき、その他のネットワークシステムに自動的にログインすることができ、また個人的な操作が全てできるという利点がある。なお、例えば、この個人用の音声装置10を、有線ネットワーク上で用いるようにしてもよい。
【0034】
また、例えば、ある特定のユーザの暗証番号等を用いて、そのユーザが発する音声コマンドのみをユーザネットワークコマンドに変換するように、個人用のネットワーク機器を構成するようにしてもよい。この場合、その登録されている本人が、その音声装置10を使うときのみ、アクセスが可能であるため、個人個人のアクセス権を保護できる。したがって、例えば、ネットワーク自体へのアクセス、ネットワークに接続されている機器へのアクセス、部屋、ビデオテープレコーダ、テレビジョン受像機等へのアクセス等のあらゆる種類のアクセスを、この方法で管理制御することができる。
【0035】
また、例えば、電話帳を、音声装置10に記憶させておくようにしてもよい。例えば、「職場」等の名前で機能を呼ぶ方法は、個々のユーザによって異なる。個人用の音声装置10では、別々のユーザがそれぞれ異なる呼び方で、同じ機能を実行することができる。また、例えば「私のテレビの電源を入れよ。」といった音声コマンドを、特定の機器を制御する特定のユーザネットワークコマンドに割り当てるようにしてもよい。また、例えば、別のユーザが、同じユーザネットワークコマンドに対して、別の名前の音声コマンドを割り当てるようにしてもよい。したがって、この場合、音声装置10は、2つの異なる音声コマンドに対して、同じユーザネットワークコマンドを生成することになる。また、例えば、ネットワークにテレビジョン受像機が2台あるなど、同じ機種の機器が1台以上あるとき、異なる複数のユーザが、例えば「私のテレビの電源を入れよ。」など、同じ音声コマンドを発しても、異なるユーザネットワークコマンドを生成し、適切な機器の方に、そのユーザネットワークコマンドを送信するようにしてもよい。
【0036】
また、例えば、1つの音声装置10に、1人のユーザ、又は別のユーザの個人的な情報をいれるようにしてもよい。また、例えば、1人のユーザのための個人用の音声装置10は、携帯用で無線であるので、ユーザが常に携帯したり、同じものを家、車の中、又は職場などの他のネットワークに置くようにしてもよい。
【0037】
個人用の音声装置10は、ユーザが、登録された特定のユーザであるかを確認することができる。個人用の音声装置10は、ユーザの音声を確認し、ユーザに、その音声で登録された機器のみを制御させるようにする。これは、部屋、車、又は電話機等の機器へのアクセスを管理制御することができる。認識性能を高めるために、個人用の音声装置10に、1人専用の音声認識部を内蔵させてもよい。
【0038】
図8は、3つの部屋から成るホームネットワークシステムの一例を示す図である。このうちの1つ部屋、例えば台所には、IEEE1394シリアルバス61が設けられている。このIEEE1394シリアルバス61には、放送受信機65と、デジタルテレビジョン受像機64と、プリンタ63と、電話機62と、長距離中継器66が接続されている。放送受信機65は、放送用保安装置60を介して、家の外のCATVに接続されている。また、IEEE1394シリアルバス61は、長距離中継器66及びIEEE1394ブリッジ74を介して、第2の部屋である居間に設置されたIEEE1394シリアルバス67に繋がっている。この居間のIEEE1394シリアルバス67には、音声装置70と、パーソナルコンピュータ(以下、PCという。)69と、電話機68と、ビデオテープレコーダ71と、ビデオカメラ72と、デジタルテレビジョン受像機73aとが接続されている。また、IEEE1394シリアルバス67は、IEEE1394ブリッジ74及び長距離中継器75を介して、第3の部屋である書斎に設置されたIEEE1394シリアルバス78に繋がっている。IEEE1394シリアルバスバス78には、PC76と、電話機77と、ハードディスク79と、プリンタ80と、デジタルテレビジョン受像機81と、電話NIU82とが接続されている。電話NIU82は、電話機用保安装置83に接続されている。
【0039】
上述したネットワークシステムでは、IEEE1394シリアルバス61,67,78と、IEEE1394ブリッジ74と、中継器66,75とを介して、どの機器も、他の機器と通信できるように構成されている。居間に設置されている音声装置70は、全ての機器と通信を行い、これらの機器を制御する。この音声装置70は、上述した音声装置10と同様の構成を有する。図8に示す例では、例えば、居間のデジタルテレビジョン受像機73と書斎のデジタルテレビジョン受像機81のように、同じ機種の機器が複数存在しているので、ユーザが機器名を定義するようにする。複数の同じ機種の機器がネットワークに設置された場合、又はある機種の機器が接続されているネットワークに、新たに同じ機種の機器が接続された場合、音声装置70は、ユーザに、それぞれの機器に対して名前を付けるように要求する。例えば「居間のテレビジョン受像機」と「書斎のテレビジョン受像機」と名付けるように要求する。これらの名前を音声装置70に学習させるには、次のうちのいずれか方法を用いて行う。
【0040】
1.ユーザは、その機器の名前の文字列を、タイプ又は手書きで音声装置に入力する。音声装置は、その文字列を、音素記号列にマッピングする。
【0041】
2.個人用の音声装置では、その機器の名前に対応するユーザ定義の音声名を、ベクトル特性として記憶させる。そして、このベクトル特性を参照パターンとして、パターンマッチングにより音声名を認識するようにする。
【0042】
3.音声装置が、音素認識部を用いて、自動的にその名前に対応する音素記号列を学習する。
【0043】
そして、ユーザは、それらの機器に、例えば「居間のテレビジョン受像機」といった名前を付ける。音声装置70は、この名前を、適切なネットワークアドレスにマッピングする。この名前は、デフォルトとして、特定の機器の機能に対応付けられる。ユーザが発するコマンドは、その発した名前が最も最近に付けられた機器に送信される。なお、これらの名前は、後に変更することはいうまでもない。
【0044】
ユーザは、電話機を介して、家にある機器にアクセスしたい場合が多くあると考えられる。例えば、遠隔地から、ファックスを読み出したり、暖房機器を制御したりしたい場合がある。図9及び図10は、このような遠隔地からのアクセスを実現させる2つの形態を示している。
【0045】
図9は、音声装置10が、ネットワーク機器20を有するホームネットワークシステムと、公衆電話ネットワークとに接続されている具体例を示す図である。ユーザからの音声コマンドは、公衆電話ネットワークを介して、音声装置10に送信され、音声装置10は、その音声コマンドをユーザネットワークコマンドに変換して、指定されたネットワーク機器20を制御する。ユーザは、公衆電話ネットワークにアクセスできれば、どんな所からでも、他の装置は用いずに、音声装置10のみを用いて、自分のホームネットワークシステム内のネットワーク機器20を制御することができる。
【0046】
図10は、ユーザが、個人用の音声装置10を携帯して、あるホームネットワークAの領域にいる場合の例を示す図である。ユーザが、自分の個人用の音声装置10に向かって、音声コマンドを発すると、個人用の音声装置10は、その音声コマンドを、ユーザネットワークコマンドに変換して、ホームネットワークAに送信する。ホームネットワークAは、送受信機84及び公衆電話ネットワークを介して、このユーザネットワークコマンドを、ユーザが発した音声コマンドによって制御されるネットワーク機器20が属しているホームネットワークBに送信する。この場合に利用できる機能は、使用されているネットワークに依存する。
【0047】
上述したように、音声装置10は、音声出力装置を内蔵しているか、あるいは直接に又はネットワークを介して音声出力装置に接続されており、音声装置10は、ネットワーク機器20からのメッセージを音声に合成して出力し、これにより、音声装置10とユーザの対話が成される。このような対話は、例えば、ビデオテープレコーダをプログラムする際に役に立つ。メッセージには、例えば、ジュークボックスに入っているコンパクトディスクのタイトル等の、ネットワーク機器20の状態についての付加的な情報も盛り込むことができる。すなわち、メッセージの数や種類は制限されない。
【0048】
図11,図12及び図13は、音声装置10及びネットワーク機器20からなる音声システムにおける、例えばビデオテープレコーダをプログラムする際の音声システムとユーザとの対話の文法を、一部例示したものである。“S”は、音声システムの質問で、“U”は、ユーザによる音声コマンド又は他の発話である。対話の各ステップで発せられる音声コマンド又は他の発話は、特定の文法及び語で示される。
【0049】
ユーザが、定形の一連の語を発するように、又は対話を定まった一連の対話ステップに限定するために、例えば有限状態変位文法(finite state grammar)等の文法を用いる。このような文法は、例えば、ビデオテープレコーダのプログラミングに適している。各対話ステップによって、異なる有限状態変位文法が用いられる。これらの文法は、音声装置によって直接用いられるが、各機器によって異なる。したがって、音声システムの中に特定の有限状態変位文法を入れておくのは、実用的ではない。むしろ、新しい機器がネットワークに接続された際、その機器固有の文法を、その機器から音声装置に送信するようにするのが望ましい。
【0050】
図11は、音声システムとユーザとの対話ステップを示す図である。ステップS1において、音声システムは、例えばユーザに対して「チャンネルは?」というメッセージを出力して、ユーザにチャンネルの種類を尋ねる。ステップS2において、ユーザは、所望のチャンネルの音声コマンドを発することで、音声システムに、一連の語「U_CHANNEL」が入力される。ステップS3において、音声システムは、設定された動作を今日するべきかを尋ねる。ステップS4において、ユーザは、設定された動作を今日するべきかについて「はい」又は「いいえ」で答え、「いいえ」の場合は、所望の日付を言うことで、音声システムに、一連の語「U_Y/N_DATE」が入力される。日付が今日で、すなわちユーザが、音声システムの質問に「はい」と答えた場合、音声システムは、ステップS5において、「どの映画ですか?」と尋ねる。ステップS6において、ユーザは、所望の映画を音声システムに伝えることで、一連の語「U_FILM」が入力される。ステップ4において、ユーザが「いいえ」と答えた場合、音声装置は、ステップS7において、日付を尋ねる。ステップS8において、ユーザは、所望の日付の音声コマンドを発することで、一連の語「U_DATE」が入力され、ステップ5へと続く。
【0051】
図12は、図11の例に対応する一連の語の文法を示す図である。図11のステップS4において、ユーザは、一連の語「U_Y/N_DATE」として、「はい」を入力するか、又は「いいえ」、すなわち日付を入力するかのどちらかを行う。図11で示したように、一連の語「U_Y/N_DATE」において、ユーザは、図12のステップS41において一連の語「U_Y/N」を入力するか、又は、ステップS42において一連の語「U_DATE」を入力するかのどちらかを行う。一連の語「U_Y/N」において、ユーザは、ステップS43において一連の語「U_NO」を入力するか、又は、ステップS44において一連の語「U_YES」を入力するかのどちらかを行う。一連の語「U_DATE」において、ユーザは、ステップS45において一連の語「NO_1_31」を入力して日にちを特定し、ステップS46において一連の語「NO_1_12」を入力して月を特定する。
【0052】
図13は、これらの一連の語に対応する語彙を示している。例えば、一連の語「U_YES」は、「はい」又は「ええ」に対応しており、一連の語「U_NO」は、「いいえ」に対応しており、一連の語「NO_1_31」は、1,2,...31又は1日、2日、...31日と対応しており、一連の語「NO_1_12」は、1...12又は1月...12月と対応している。
【0053】
図14は、ユーザ、音声装置及びネットワーク機器間のプロトコルを示す図である。
【0054】
ステップS1において、ユーザは、音声コマンド「再生」を発する。音声装置は、ネットワークに接続されている、再生可能な機器が複数あることを認識する。すなわち、音声装置は、音声コマンド「再生」だけでは、特定のネットワーク機器を制御するのに十分な情報ではないと認識する。ステップS2において、音声装置は、「どの機器を再生したいですか?」というメッセージをユーザに対して出力する。ステップS3において、ユーザは、音声装置に対して、「ビデオテープレコーダ」と答える。この時点で、音声装置は、ユーザが所望の特定のネットワーク機器を制御するのに十分な情報を提供したと認識し、ビデオテープレコーダを再生状態にする。ステップS4において、音声装置は、ネットワークを介して、ユーザの答えに対応するユーザネットワークコマンドを、ビデオテープレコーダのアドレスに送信する。ビデオテープレコーダは、このユーザネットワークコマンドを受信し、所望の動作を行おうとする。ここでは、ビデオテープレコーダは、カセットを検出することができず、再生状態にできないため、ステップS5において、ビデオテープレコーダは、エラーIDであるXを、音声装置のアドレスに送信する。音声装置は、このエラーメッセージを受信し、認識して、ステップS6において、対応するメッセージ「ビデオテープレコーダの中にカセットがありません」をユーザに対して出力する。
【0055】
音声装置は、ネットワークに接続されているすべてのネットワーク機器や、1人以上のユーザを含めて、ネットワークの間のインタフェースとして機能している。ユーザがネットワークの領域にいる場合、そして、ネットワークの状態を認識し、伝えることのできる音声装置が、適切なユーザネットワークコマンドが作られているか、そうでなければ、適切な対応するユーザネットワークコマンドを作るのに必要なメッセージ又は音声コマンドを送信するようにユーザに要求するメッセージを、ユーザに送信するか、のいずれかがなされているか確認している場合、ユーザは、ネットワークに接続されている音声装置に対して、音声コマンドを発すればよい。
【0056】
音声装置は、ネットワークに接続されている機器が、新しい機能を読み込んで、認識していくのを、常に監視している必要がある。すなわち、音声装置は、ネットワークに接続されている機器が、新しい音声制御機能を持つことを、監視している。音声装置はまた、機器がネットワークから外されることも、監視している必要がある。
【0057】
図15は、このような監視のプロセスにおけるユーザ、音声装置及びネットワーク機器間のプロトコルを示す図である。ステップS1において、音声装置は、ネットワークに接続されているネットワーク機器の機器アドレスに対して、その機器の名称及び機種を含むIDを送信するように要求するメッセージを送信する。この時点では、このネットワーク機器を音声で制御することはできない。その機器が、音声装置からのID送信の要求を受信すると、ステップS2において、その機器は、音声装置のアドレスにIDを送信する。ステップS3において、音声装置は、その機器のアドレスに対して、その機器のユーザネットワークコマンドのリストを送信するように要求するメッセージを送信する。その機器がこのメッセージを受信すると、ステップS4において、その機器は、音声装置に対して、その機器のユーザネットワークコマンドのリストを送信する。音声装置は、そのユーザネットワークコマンドのリストを受信し、語彙を、その機器から受け取った語彙及び文法に更新する。ステップS5において、音声装置は、その機器のアドレスに、領収の確認メッセージを送信する。この時点で、ユーザは、音声でその機器を制御することができる。ステップS6において、音声装置は、新しい音声制御機能を搭載した機器が利用可能であるということをユーザに対して通知する。
【0058】
図16は、新しい機器が追加されたときのユーザ、音声装置及びネットワーク機器間のプロトコル(初期化プロトコル)を示す図である。新しい機器がネットワークに接続された場合、新しい機器は、音声装置に対して、新しい音声制御機能を提供することを知らせる。ステップS1において、音声装置は、新しい機器に対して、ネットワークアドレス、名称、機種を含むIDを送信するように要求する。ステップS2において、その新しい機器は、音声装置に、そのIDを送信する。ステップS3において、音声装置は、その機器に対して、ユーザネットワークコマンドのリストを送信するように要求する。ステップS4において、その機器は、音声装置に対して、ユーザネットワークコマンドのリストを送信する。ステップS5において、音声装置は、ユーザに対して、その新しく接続された機器に論理名を付けるように要求する。ステップS6において、ユーザは、その新しく接続された機器の論理名を付け、それをタイプするか、又は書いて、音声装置がそれを受信できるようにする。当然ながら、ユーザは、その新しい名前を音声で発するだけでもよい。音声装置は、ユーザから論理名を受信して、その機器の語彙及び文法を更新する。ステップS7において、音声装置は、新しくネットワークに接続されたそのIEEE1394規格に準拠した機器に対して、領収の確認メッセージを送信する。この時点で、ユーザは、この新しい機器を音声で制御できる。
【0059】
機器から音声装置に送るユーザネットワークコマンドのリストは、適切なユーザネットワークコマンドに対応する音声コマンドの文字列のみでもよいし、又は、これらの音声コマンドの文字列に、例えば発音記号などの、発音情報を付加してもよい。後者の場合、音声装置には、新しいユーザネットワークコマンドが付加される。ユーザネットワークコマンドのリストに、音声コマンドの文字列のみが入れられていて、発音記号が入れられていなかった場合、ソフトウエア部15fに内蔵されている文字素/音素変換部が、その文字列に対して、発音と、他の発音の仕方とを作り出し、ユーザネットワークコマンドのリストを完成させる。その機器の語彙及び文法が更新されると、ユーザは、その新しい機器を音声で制御できるようになる。
【0060】
もし、新しく接続された機器と音声装置との間に、このような相互のやりとりが行われないと、音声装置に記憶されている初期の語彙で構成されるユーザネットワークコマンドの中で、その新しい機器が有しているユーザネットワークコマンドのみによる基本的な機能だけが使用可能になる。他の機器用のユーザネットワークコマンドを、新しい機器に適応させることは可能だが、この方法では、完全に音声によって制御できるかどうかは、保証されない。したがって、新しい機器がネットワークにアクセスを持つには、音声装置は、その機器のIDを認識している必要があるので、音声装置と、その機器と、他の機器との間で、その機器のIDについてのやりとりが行われる必要がある。
【0061】
例えば、コンパクトディスク(以下、CDという。)の名前、曲のタイトル、映画のタイトル、又は放送局の名前等の記録媒体の名前を含むコマンドには、一部音声装置が認識していない語彙が含まれている。したがって、音声装置は、この認識していない情報を、他の情報源から獲得しなければならない。この分野の従来技術では、ユーザは、この情報をタイプするか、又は書くかして入力している。一方、本発明を適用した音声装置では、上述したようなプロセスで、語彙及び文法を入力することができる。記録媒体に関する情報の文字列及び/又は発音は、次のような方法で、入手することができる。
【0062】
・データベースから、例えば、CD−ROMのようなある記録媒体に情報を獲得する。
【0063】
・例えば、CD、装置基本制御ブロック(DVB)等の記録媒体自体が、その詳細及びその発音を有しており、ここから情報を獲得する。例えば、CDに歌手の名前及び曲のタイトルが記憶されていて、読み出し可能である。
【0064】
・例えば、インターネット、個別アドレスビーコンシステム(以下、DABという。)、ホームネットワーク、電話網等の情報伝達装置を介してアクセスしたデータベースから情報を獲得する。
【0065】
なお、これらの方法の他に、ユーザは、情報をタイプするか、又は書くかして入力してもよい。
【0066】
例えば、新しいCDが初めてプレーヤに挿入されたり、プログラムを入手できる装置がバスに接続された場合に、音声装置又はそれに変わる装置は、ホームネットワークに接続されているすべての機器に対して、新しい記録媒体又はプログラムの情報を送信するように要求するための、情報検索要求を出す。その後、ネットワークに接続されている機器のいずれかから、この要求に対する回答がある可能性がある。可能性のある機器は、例えば次のような機器である。
【0067】
・例えば、ディスクのジュークボックスに入っているCD−ROM、テープの内容を知らせるビデオテーププレーヤ、PC等上でユーザが入力したデータベース、番組の名前などによってチャンネルを知らせるセットトップボックス等、送られてきたデータベースを読み込むことができる機器。
【0068】
・例えば、WEB−TV、セットトップボックス、DABレシーバ、PC等、他の情報伝達装置に接続されている機器であり、少なくとも時々インターネットに接続されているか、又は、番組情報又は他の情報を持つシステムと接続するためのモデムを有している機器。
【0069】
・例えば、頻繁に再生される曲の名前は何か、現在見ている番組は何か等の質問をユーザに尋ねる等、内容についての質問をしたり、また、ユーザが記録媒体を新しく購入して、タイプするか、書くか、発話するかによって、そのタイトルを入力したい場合に、ユーザと対話したりして、ユーザとやりとりする機器。
【0070】
図17は、複数の機器が記録媒体の内容に関する語彙を付加することに関する複数の機器及び音声装置間のプロトコルを示す図である。最初の時点では、情報は、音声装置からも、記録媒体を入れている機器からも送信されない。新しい記録媒体がプレーヤに初めて挿入されると、ステップS1において、プレーヤは、記録媒体Xを挿入したという通知の情報を、音声装置に送信する。ステップS2において、音声装置は、そのプレーヤと、ネットワークに接続されている他の全ての機器に対して、制御ネットワークコマンドを用いて、記録媒体Xの情報を送信するように要求するメッセージを送信する。この時点では、この要求に対して、複数の機器からの回答がある可能性がある。ステップS3において、ネットワークに接続されている機器のうちのいずれか1台が、音声装置に対して、記録媒体Xに関する情報を送信する。音声装置は、その語彙を更新し、ステップS4において、そのプレーヤと、記録媒体Xに関する情報を送信した機器に対して、領収の確認メッセージを送信する。この時点で、ユーザは、例えば、「チャイコフスキーピアノコンチェルトロ短調を再生せよ。」などの音声コマンドによって、その記録媒体の内容にアクセスすることができる。
【0071】
図18は、複数の機器が記録媒体の内容に関する語彙を付加することに関する複数の機器及び音声装置間のプロトコルの他の例を示す図である。この例では、2台の機器が、要求に回答している。第1の回答が、語彙の更新に選択され、第2の回答は、破棄されている。
【0072】
新しい記録媒体がプレーヤに初めて挿入されると、ステップS1において、プレーヤは、記録媒体Xを挿入したという通知の情報を、音声装置に送信する。ステップS2において、音声装置は、そのプレーヤと、ネットワークに接続されている他の全ての機器に対して、記録媒体Xの情報を制御ネットワークコマンド形式で送信するように要求するメッセージを送信する。この時点では、この要求に対して、複数の機器からの回答がある可能性がある。この例では、そのプレーヤに記録媒体Xの情報が入っているので、ステップS3において、そのプレーヤが、音声装置に対して、記録媒体Xに関する情報を送信する。音声装置は、その語彙及び/又は文法を更新し、ステップS4において、そのプレーヤと、記録媒体Xに関する情報を送信した機器に対して、領収の確認メッセージを送信する。ステップS5において、他の機器が記録媒体Xに関する情報を送信するが、音声装置は、この情報を破棄する。
【0073】
遠隔制御可能なネットワーク機器のユーザネットワークコマンド及びそれに対応する語彙及び/又は文法は、CD−ROM等の記録媒体に入れられているデータベースや、インターネットページのようなインターネットに記憶されているデータベースや、又は、デジタル放送によって伝送されるデータベースに記憶されている場合もある。例えば、新しい機器20がネットワークに接続される時や、ユーザが語彙を更新する時に、その記録媒体の情報は、音声装置10によってダウンロードされる。このような機器自体が、この情報をメモリに持っている必要はなく、この情報は、他の機器20が読み込めるデータ媒体に伝送され、その機器に送られる。又は、この情報は、インターネット又はデジタル放送を介して、その機器の製造元から提供される。
【0074】
【発明の効果】
本発明に係る音声装置は、マイクロホンからのユーザの音声信号を認識する音声認識手段と、ネットワークを介して遠隔制御可能なネットワーク機器から、ネットワーク機器の記憶部又はネットワーク機器に挿入された記録媒体固有の語彙及び/又は文法と、語彙及び/又は文法に基づくユーザネットワークコマンドとを受信するための通信制御ネットワークコマンドをネットワーク機器に送信するとともに、ネットワーク機器からその機器の種類を示すデータを受信し、受信した語彙及び/又は文法、及びユーザネットワークコマンドと、機器の種類を示すデータとを対応させて、ネットワーク機器の種類に対応したユーザネットワークコマンドを生成する制御手段と、受信した語彙及び/又は文法、及びユーザネットワークコマンドを記憶する記憶手段とを備え、制御手段は、音声認識手段からの音声信号を記憶手段に記憶された語彙及び/又は文法に基づいて認識解読して、対応するユーザネットワークコマンドを記憶手段から読み出してネットワーク機器に送信する。
【0075】
また、本実施の形態に係る遠隔制御可能なネットワーク機器は、音声装置から、音声入力に対応するユーザネットワークコマンドをネットワークを介して受信して、ネットワークコマンドに基づいてその機能を制御する制御手段を備え、制御手段は、ネットワーク機器がネットワークに接続されたときに、音声装置から通信制御ネットワークコマンドを受信して、ネットワーク機器固有のユーザネットワークコマンド、及び語彙及び/又は文法をネットワークを介して音声装置に送信する。
【0076】
これにより、1つの音声装置を用いて、複数のネットワーク機器を制御することができ、ネットワークシステム全体のコストを低減することができる。
【図面の簡単な説明】
【図1】 本発明を適用した音声装置の具体的な構成を示すブロック図である。
【図2】 本発明を適用したネットワーク機器の具体的な構成を示すブロック図である。
【図3】 IEEE1394シリアルバスを用いたネットワークの形態の一例を示す図である。
【図4】 IEEE1394シリアルバスを用いたネットワークの形態の他の例を示す図である。
【図5】 ネットワークの形態の一例を示す図である。
【図6】 ネットワークの形態の他の例を示す図である。
【図7】 ネットワークの形態の他の例を示す図である。
【図8】 3つの部屋から成るホームネットワークの一例を示す図である。
【図9】 音声装置を介してネットワーク機器を遠隔制御する一例を示す図である。
【図10】 音声装置を介してネットワーク機器を遠隔制御する他の例を示す図である。
【図11】 ビデオテープレコーダのプログラミングにおける、音声システムとユーザとの対話の文法を、一部例示した図である。
【図12】 ビデオテープレコーダのプログラミングにおける、音声システムとユーザとの対話の文法に対応する一連の語の文法を示す図である。
【図13】 ビデオテープレコーダのプログラミングにおける、一連の語の文法に対応する語彙を示す図である。
【図14】 ユーザ、音声装置及びネットワーク機器の間のやりとりのプロトコルの一例を示す図である。
【図15】 音声装置が、ネットワーク機器が読込及び認識した新しい機能を学習するプロセスの一例を示す図である。
【図16】 音声装置が新しい機器を初期化する一例を示す図である。
【図17】 複数の機器による、記録媒体の内容に関する語彙を付加することに関するやりとりの一例を示す図である。
【図18】 複数の機器による、記録媒体の内容に関する語彙を付加することに関するやりとりの他の例を示す図である。
【符号の説明】
1 マイクロホン、2 ラウドスピーカ、3 ホームネットワーク、10 音声装置、11 DSP、11a 音声認識部、12 CPU、13 リンクレイヤ制御部、14 I/F物理レイヤ部、15 メモリ、15a 初期語彙部、15b 付加語彙部、15c 初期文法部、15d 付加文法部、15e 特徴抽出部、15f ソフトウェア部、16 メモリ、17 DSP、17a 音声合成・生成部
Claims (14)
- マイクロホンからのユーザの音声信号を認識する音声認識手段と、
ネットワークを介して遠隔制御可能なネットワーク機器から、該ネットワーク機器の記憶部又は該ネットワーク機器に挿入された記録媒体固有の語彙及び/又は文法と、該語彙及び/又は文法に基づくユーザネットワークコマンドとを受信するための通信制御ネットワークコマンドを該ネットワーク機器に送信するとともに、該ネットワーク機器からその機器の種類を示すデータを受信し、受信した該語彙及び/又は文法、及び該ユーザネットワークコマンドと、該機器の種類を示すデータとを対応させて、該ネットワーク機器の種類に対応したユーザネットワークコマンドを生成する制御手段と、
受信した上記語彙及び/又は文法、及びユーザネットワークコマンドを記憶する記憶手段とを備え、
上記制御手段は、上記音声認識手段からの音声信号を上記記憶手段に記憶された語彙及び/又は文法に基づいて認識解読して、対応するユーザネットワークコマンドを上記記憶手段から読み出して上記ネットワーク機器に送信する音声装置。 - 新たなネットワーク機器がネットワークに接続されたとき及び/又はネットワーク機器に新たな記録媒体が挿入されたときに、上記通信制御ネットワークコマンドを該ネットワーク機器に送信する請求項1記載の音声装置。
- 上記ユーザネットワークコマンド及び上記通信制御ネットワークコマンドを、ネットワークを介して上記ネットワーク機器に送信するとともに、該ネットワーク機器から該ネットワークを介してデータ及びメッセージを受信するインタフェースを備える請求項1又は2に記載の音声装置。
- 上記ネットワークは、有線又は無線のネットワークである請求項1乃至3のいずれか1項に記載の音声装置。
- 上記音声認識手段は、上記マイクロホンからの複数のユーザの音声信号に基づいて、個々のユーザを識別し、上記制御手段は、個々のユーザに適用されるユーザ固有のユーザネットワークコマンドを生成する請求項1乃至4のいずれか1項に記載の音声装置。
- 上記ネットワーク機器及び当該音声装置からのメッセージを、音声信号に合成して、ラウドスピーカに出力する音声合成手段を備える請求項1乃至5のいずれか1項に記載の音声装置。
- 上記マイクロホン及び/又はラウドスピーカを内蔵する請求項6に記載の音声装置。
- 上記マイクロホン及び/又はラウドスピーカは、有線又は無線で当該音声装置に接続されている請求項6に記載の音声装置。
- 上記インタフェースは、公衆電話ネットワークを介して、上記ネットワークに接続している請求項3に記載の音声装置。
- 上記インタフェースは、インターネットネットワークを介して、上記ネットワークに接続している請求項3に記載の音声装置。
- 上記ネットワークは、IEEE1394シリアルバスである請求項1乃至10のいずれか1項に記載の音声装置。
- ネットワーク機器に接続された音声装置の自己初期化方法において、
ネットワークを介して遠隔制御可能なネットワーク機器から、該ネットワーク機器の記憶部又は該ネットワーク機器に挿入された記録媒体固有の語彙及び/又は文法と、該語彙及び/又は文法に基づくユーザネットワークコマンドとを受信するための通信制御ネットワークコマンドを、該ネットワーク機器に送信するステップと、
上記ネットワーク機器から送られてくる語彙及び/又は文法、及びユーザネットワークコマンドを受信するステップと、
上記ネットワーク機器に論理名又は識別子の送信を要求するステップと、
上記ネットワーク機器から送られてくる論理名又は識別子を受信するステップと、
受信した上記語彙及び/又は文法、及びユーザネットワークコマンドと、上記論理名又は識別子とを対応させて、上記ネットワーク機器固有のユーザネットワークコマンドを生成し、内蔵のメモリに記憶している語彙及び/又は文法、及びユーザネットワークコマンドを、受信した語彙及び/又は文法、及びユーザネットワークコマンドによって更新するステップと
を有する音声装置の自己初期化方法。 - 上記ネットワーク機器の論理名は、ユーザ又は上記ネットワーク機器自体のいずれかによって決定される請求項12に記載の音声装置の自己初期化方法。
- 上記識別子は、上記ネットワークにおけるネットワーク機器のアドレス及び名前を含む請求項12又は13に記載の音声装置の自己初期化方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP97118470.0 | 1997-10-23 | ||
EP97118470A EP0911808B1 (en) | 1997-10-23 | 1997-10-23 | Speech interface in a home network environment |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11311996A JPH11311996A (ja) | 1999-11-09 |
JP4295846B2 true JP4295846B2 (ja) | 2009-07-15 |
Family
ID=8227517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP32005198A Expired - Fee Related JP4295846B2 (ja) | 1997-10-23 | 1998-10-23 | 音声装置及び音声装置の自己初期化方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6535854B2 (ja) |
EP (1) | EP0911808B1 (ja) |
JP (1) | JP4295846B2 (ja) |
DE (1) | DE69712485T2 (ja) |
Families Citing this family (357)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020002039A1 (en) * | 1998-06-12 | 2002-01-03 | Safi Qureshey | Network-enabled audio device |
US20050261907A1 (en) | 1999-04-12 | 2005-11-24 | Ben Franklin Patent Holding Llc | Voice integration platform |
US6408272B1 (en) * | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
EP1045374B1 (en) * | 1999-04-13 | 2010-08-11 | Sony Deutschland GmbH | Merging of speech interfaces for concurrent use of devices and applications |
GB9911971D0 (en) | 1999-05-21 | 1999-07-21 | Canon Kk | A system, a server for a system and a machine for use in a system |
EP1063636A3 (en) * | 1999-05-21 | 2001-11-14 | Winbond Electronics Corporation | Method and apparatus for standard voice user interface and voice controlled devices |
US6584439B1 (en) | 1999-05-21 | 2003-06-24 | Winbond Electronics Corporation | Method and apparatus for controlling voice controlled devices |
US7283964B1 (en) | 1999-05-21 | 2007-10-16 | Winbond Electronics Corporation | Method and apparatus for voice controlled devices with improved phrase storage, use, conversion, transfer, and recognition |
ATE253764T1 (de) * | 1999-06-21 | 2003-11-15 | Palux Ag | Einrichtung zur steuerung von automaten |
US20020023123A1 (en) * | 1999-07-26 | 2002-02-21 | Justin P. Madison | Geographic data locator |
JP4314680B2 (ja) | 1999-07-27 | 2009-08-19 | ソニー株式会社 | 音声認識制御システム及び音声認識制御方法 |
AU6630800A (en) | 1999-08-13 | 2001-03-13 | Pixo, Inc. | Methods and apparatuses for display and traversing of links in page character array |
NL1012860C2 (nl) * | 1999-08-19 | 2001-02-20 | Nedap Nv | Boerderijautomatiseringssysteem. |
US6330537B1 (en) * | 1999-08-26 | 2001-12-11 | Matsushita Electric Industrial Co., Ltd. | Automatic filtering of TV contents using speech recognition and natural language |
US6513006B2 (en) * | 1999-08-26 | 2003-01-28 | Matsushita Electronic Industrial Co., Ltd. | Automatic control of household activity using speech recognition and natural language |
US6553345B1 (en) * | 1999-08-26 | 2003-04-22 | Matsushita Electric Industrial Co., Ltd. | Universal remote control allowing natural language modality for television and multimedia searches and requests |
DE29915685U1 (de) * | 1999-09-07 | 2000-01-13 | Siemens AG, 80333 München | Schalteinrichtung |
EP1083545A3 (en) * | 1999-09-09 | 2001-09-26 | Xanavi Informatics Corporation | Voice recognition of proper names in a navigation apparatus |
DE19943875A1 (de) | 1999-09-14 | 2001-03-15 | Thomson Brandt Gmbh | System zur Sprachsteuerung mit einem Mikrofonarray |
DE19944325A1 (de) * | 1999-09-15 | 2001-03-22 | Thomson Brandt Gmbh | Verfahren und Vorrichtung zur Spracherkennung |
JP4065381B2 (ja) | 1999-11-10 | 2008-03-26 | ヤフー! インコーポレイテッド | インターネットラジオ及びブロードキャスト方法 |
US7013283B1 (en) * | 1999-11-17 | 2006-03-14 | Sarnoff Corporation | System and method for providing programming content in response to an audio signal |
US6526382B1 (en) | 1999-12-07 | 2003-02-25 | Comverse, Inc. | Language-oriented user interfaces for voice activated services |
US6389467B1 (en) | 2000-01-24 | 2002-05-14 | Friskit, Inc. | Streaming media search and continuous playback system of media resources located by multiple network addresses |
DE10003779A1 (de) * | 2000-01-28 | 2001-09-27 | Majchrzyk Horacek Matthias | Sprachsteuerungssystem und Verfahren |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US7096185B2 (en) | 2000-03-31 | 2006-08-22 | United Video Properties, Inc. | User speech interfaces for interactive media guidance applications |
JP2003529864A (ja) * | 2000-04-04 | 2003-10-07 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | インターネット経由の家庭内ネットワークへのアクセス |
JP2001296881A (ja) * | 2000-04-14 | 2001-10-26 | Sony Corp | 情報処理装置および方法、並びに記録媒体 |
US20070078552A1 (en) * | 2006-01-13 | 2007-04-05 | Outland Research, Llc | Gaze-based power conservation for portable media players |
DE10021389A1 (de) * | 2000-05-03 | 2001-11-08 | Nokia Mobile Phones Ltd | Verfahren zum Steuern eines Systems, insbesondere eines elektrischen und/oder elektronischen Systems mit zumindest einer Anwendungseinrichtung |
US7024485B2 (en) * | 2000-05-03 | 2006-04-04 | Yahoo! Inc. | System for controlling and enforcing playback restrictions for a media file by splitting the media file into usable and unusable portions for playback |
US7162482B1 (en) * | 2000-05-03 | 2007-01-09 | Musicmatch, Inc. | Information retrieval engine |
US7251665B1 (en) | 2000-05-03 | 2007-07-31 | Yahoo! Inc. | Determining a known character string equivalent to a query string |
US8352331B2 (en) | 2000-05-03 | 2013-01-08 | Yahoo! Inc. | Relationship discovery engine |
US6654720B1 (en) | 2000-05-09 | 2003-11-25 | International Business Machines Corporation | Method and system for voice control enabling device in a service discovery network |
JP2001319045A (ja) | 2000-05-11 | 2001-11-16 | Matsushita Electric Works Ltd | 音声マンマシンインタフェースを用いたホームエージェントシステム、及びプログラム記録媒体 |
DE60039076D1 (de) * | 2000-06-26 | 2008-07-10 | Mitsubishi Electric Corp | System zum Betreiben eines Gerätes |
WO2002005264A1 (de) * | 2000-07-07 | 2002-01-17 | Siemens Aktiengesellschaft | Sprachgesteuerte anordnung und verfahren zur spracheingabe und -erkennung |
JP2002116787A (ja) * | 2000-07-10 | 2002-04-19 | Matsushita Electric Ind Co Ltd | 優先順位決定装置、優先順位決定方法及び優先順位決定プログラム |
DE10196421T5 (de) * | 2000-07-11 | 2006-07-13 | Launch Media, Inc., Santa Monica | Online Playback-System mit Gemeinschatsausrichtung |
EP1305791A1 (en) * | 2000-07-21 | 2003-05-02 | Koninklijke Philips Electronics N.V. | Speech control over a plurality of devices |
GB2365145A (en) * | 2000-07-26 | 2002-02-13 | Canon Kk | Voice control of a machine |
JP2002062894A (ja) * | 2000-08-17 | 2002-02-28 | Daiichikosho Co Ltd | 音声認識リモコン機能付きワイヤレスマイクロホン |
EP1184841A1 (de) * | 2000-08-31 | 2002-03-06 | Siemens Aktiengesellschaft | Sprachgesteuerte Anordnung und Verfahren zur Spracheingabe und -erkennung |
WO2002021512A1 (en) * | 2000-09-07 | 2002-03-14 | Koninklijke Philips Electronics N.V. | Voice control and uploadable user control information |
WO2002023389A1 (en) * | 2000-09-15 | 2002-03-21 | Robert Fish | Systems and methods for translating an item of information using a distal computer |
GB0025331D0 (en) | 2000-10-16 | 2000-11-29 | Canon Kk | Control apparatus |
US8271333B1 (en) | 2000-11-02 | 2012-09-18 | Yahoo! Inc. | Content-related wallpaper |
US6963838B1 (en) * | 2000-11-03 | 2005-11-08 | Oracle International Corporation | Adaptive hosted text to speech processing |
US7653691B2 (en) * | 2000-11-15 | 2010-01-26 | Pacific Datavision Inc. | Systems and methods for communicating using voice messages |
US7054863B2 (en) * | 2000-11-15 | 2006-05-30 | Pacific Datavision, Inc. | System and method for originating, storing, processing and delivering message data |
GB0028732D0 (en) * | 2000-11-24 | 2001-01-10 | Nokia Oy Ab | Improvements in and relating to a broadcast network |
JP3838029B2 (ja) * | 2000-12-18 | 2006-10-25 | セイコーエプソン株式会社 | 音声認識を用いた機器制御方法および音声認識を用いた機器制御システム |
JP4109414B2 (ja) * | 2000-12-18 | 2008-07-02 | セイコーエプソン株式会社 | 音声認識を用いた機器制御方法および音声認識を用いた機器制御システムならびに音声認識を用いた機器制御プログラムを記録した記録媒体 |
US8949902B1 (en) | 2001-02-06 | 2015-02-03 | Rovi Guides, Inc. | Systems and methods for providing audio-based guidance |
US7406529B2 (en) * | 2001-02-09 | 2008-07-29 | Yahoo! Inc. | System and method for detecting and verifying digitized content over a computer network |
DE10109156C2 (de) * | 2001-02-24 | 2003-01-09 | Diehl Ako Stiftung Gmbh & Co | Intelligente Haushaltsgrossgeräte |
US20020169597A1 (en) * | 2001-03-12 | 2002-11-14 | Fain Systems, Inc. | Method and apparatus providing computer understanding and instructions from natural language |
JP2002297185A (ja) * | 2001-03-29 | 2002-10-11 | Pioneer Electronic Corp | 情報処理装置および情報処理方法 |
US7698228B2 (en) * | 2001-04-27 | 2010-04-13 | Accenture Llp | Tracking purchases in a location-based services system |
US7970648B2 (en) * | 2001-04-27 | 2011-06-28 | Accenture Global Services Limited | Advertising campaign and business listing management for a location-based services system |
US6848542B2 (en) * | 2001-04-27 | 2005-02-01 | Accenture Llp | Method for passive mining of usage information in a location-based services system |
US7437295B2 (en) * | 2001-04-27 | 2008-10-14 | Accenture Llp | Natural language processing for a location-based services system |
US6944447B2 (en) * | 2001-04-27 | 2005-09-13 | Accenture Llp | Location-based services |
US7574513B2 (en) | 2001-04-30 | 2009-08-11 | Yahoo! Inc. | Controllable track-skipping |
US7023975B2 (en) * | 2001-08-14 | 2006-04-04 | Sharp Laboratories Of America, Inc. | Privacy mode system and method for home network telephone |
US7324947B2 (en) * | 2001-10-03 | 2008-01-29 | Promptu Systems Corporation | Global speech user interface |
US20030069734A1 (en) * | 2001-10-05 | 2003-04-10 | Everhart Charles Allen | Technique for active voice recognition grammar adaptation for dynamic multimedia application |
JP2003122847A (ja) * | 2001-10-11 | 2003-04-25 | Sanyo Electric Co Ltd | 健康管理支援システム及びペット型健康管理支援端末 |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
CA2410114C (en) * | 2001-10-26 | 2011-07-19 | Research In Motion Limited | System and method for remotely controlling mobile communication devices |
JP4240874B2 (ja) * | 2001-11-09 | 2009-03-18 | 日本電気株式会社 | 情報提供システム、情報端末、情報提供装置、判定装置及びそれらに用いるプログラム並びに情報提供方法 |
EP1315147A1 (en) * | 2001-11-27 | 2003-05-28 | Sony International (Europe) GmbH | Method for processing user requests with respect to a network of electronic devices |
DE10159850A1 (de) * | 2001-12-06 | 2003-11-06 | Siemens Ag | Bedienung von Endgeräten |
EP1466307A1 (en) * | 2002-01-08 | 2004-10-13 | Philips Electronics N.V. | Controlling application devices simultaneously |
US20030163324A1 (en) * | 2002-02-27 | 2003-08-28 | Abbasi Asim Hussain | System and method for voice commands recognition and controlling devices wirelessly using protocol based communication |
KR100434545B1 (ko) * | 2002-03-15 | 2004-06-05 | 삼성전자주식회사 | 홈네트워크로 연결된 가전기기들을 제어하는 방법 및 장치 |
US6895379B2 (en) * | 2002-03-27 | 2005-05-17 | Sony Corporation | Method of and apparatus for configuring and controlling home entertainment systems through natural language and spoken commands using a natural language server |
JP3715584B2 (ja) * | 2002-03-28 | 2005-11-09 | 富士通株式会社 | 機器制御装置および機器制御方法 |
US7707221B1 (en) | 2002-04-03 | 2010-04-27 | Yahoo! Inc. | Associating and linking compact disc metadata |
AU2003212587A1 (en) * | 2002-04-08 | 2003-10-20 | Koninklijke Philips Electronics N.V. | Controlling an apparatus based on speech |
FR2838278B1 (fr) * | 2002-04-08 | 2004-08-13 | France Telecom | Terminal mobile multimedia et procede de telecommande d'une passerelle domestique au moyen d'un tel terminal |
US7305483B2 (en) | 2002-04-25 | 2007-12-04 | Yahoo! Inc. | Method for the real-time distribution of streaming data on a network |
US20030210774A1 (en) * | 2002-05-08 | 2003-11-13 | Wanderlich Ronald E. | System and method for simultaneous communication and apparatus activation and control |
DE10229388A1 (de) * | 2002-06-26 | 2004-01-15 | Deutsche Telekom Ag | Multimediales System |
US7184960B2 (en) * | 2002-06-28 | 2007-02-27 | Intel Corporation | Speech recognition command via an intermediate mobile device |
JP4398144B2 (ja) * | 2002-12-24 | 2010-01-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体 |
EP1478154A1 (en) * | 2003-05-14 | 2004-11-17 | Sony International (Europe) GmbH | Method for serving user requests |
WO2005004031A1 (en) * | 2003-07-02 | 2005-01-13 | Philips Intellectual Property & Standards Gmbh | Method of entering a security code for a network apparatus |
US20050035855A1 (en) * | 2003-08-11 | 2005-02-17 | Visteon Global Technologies, Inc. | Voice command system for remote control and monitoring of home networked devices |
US7672873B2 (en) * | 2003-09-10 | 2010-03-02 | Yahoo! Inc. | Music purchasing and playing system and method |
DE112004002282D2 (de) * | 2003-09-16 | 2006-08-10 | Ip2H Ag | Verteilte Steuerung von unterschiedlichen Heimnetzgeräten |
US7552221B2 (en) | 2003-10-15 | 2009-06-23 | Harman Becker Automotive Systems Gmbh | System for communicating with a server through a mobile communication device |
TWI234961B (en) * | 2003-11-25 | 2005-06-21 | Kye Systems Corp | Control apparatus of household appliances for use in the wireless network |
DE602004016683D1 (de) * | 2003-12-05 | 2008-10-30 | Kenwood Corp | Einrichtungssteuereinrichtung und einrichtungssteuerverfahren |
DE602004016681D1 (de) * | 2003-12-05 | 2008-10-30 | Kenwood Corp | Audioeinrichtungs-steuereinrichtung, audioeinrichtungs-steuerverfahren und programm |
US20050193092A1 (en) * | 2003-12-19 | 2005-09-01 | General Motors Corporation | Method and system for controlling an in-vehicle CD player |
EP1555652B1 (en) * | 2004-01-19 | 2007-11-14 | Harman Becker Automotive Systems GmbH | Activation of a speech dialogue system |
ATE415684T1 (de) | 2004-01-29 | 2008-12-15 | Harman Becker Automotive Sys | Verfahren und system zur sprachdialogschnittstelle |
EP1560199B1 (en) | 2004-01-29 | 2008-07-09 | Harman Becker Automotive Systems GmbH | Multimodal data input |
JP4581441B2 (ja) * | 2004-03-18 | 2010-11-17 | パナソニック株式会社 | 家電機器システム、家電機器および音声認識方法 |
JP2005286426A (ja) * | 2004-03-26 | 2005-10-13 | Sharp Corp | ホームネットワークサーバ、デジタル放送番組配信方法、無線端末、ホームネットワークシステム、プログラム、および記録媒体 |
US20060041926A1 (en) * | 2004-04-30 | 2006-02-23 | Vulcan Inc. | Voice control of multimedia content |
FR2871978B1 (fr) * | 2004-06-16 | 2006-09-22 | Alcatel Sa | Procede de traitement de signaux sonores pour un terminal de communication et terminal de communication mettant en oeuvre ce procede |
WO2006016307A1 (en) * | 2004-08-06 | 2006-02-16 | Philips Intellectual Property & Standards Gmbh | Ontology-based dialogue system with application plug-and-play and information sharing |
JP3824168B2 (ja) * | 2004-11-08 | 2006-09-20 | 松下電器産業株式会社 | ディジタル映像再生装置 |
US8942985B2 (en) * | 2004-11-16 | 2015-01-27 | Microsoft Corporation | Centralized method and system for clarifying voice commands |
US7778821B2 (en) | 2004-11-24 | 2010-08-17 | Microsoft Corporation | Controlled manipulation of characters |
TWI269268B (en) * | 2005-01-24 | 2006-12-21 | Delta Electronics Inc | Speech recognizing method and system |
US20060194181A1 (en) * | 2005-02-28 | 2006-08-31 | Outland Research, Llc | Method and apparatus for electronic books with enhanced educational features |
US8041570B2 (en) | 2005-05-31 | 2011-10-18 | Robert Bosch Corporation | Dialogue management using scripts |
WO2007008248A2 (en) * | 2005-07-11 | 2007-01-18 | Voicedemand, Inc. | Voice control of a media player |
US7438414B2 (en) | 2005-07-28 | 2008-10-21 | Outland Research, Llc | Gaze discriminating electronic control apparatus, system, method and computer program product |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
US20070003913A1 (en) * | 2005-10-22 | 2007-01-04 | Outland Research | Educational verbo-visualizer interface system |
US7429108B2 (en) * | 2005-11-05 | 2008-09-30 | Outland Research, Llc | Gaze-responsive interface to enhance on-screen user reading tasks |
US20070040033A1 (en) * | 2005-11-18 | 2007-02-22 | Outland Research | Digital mirror system with advanced imaging features and hands-free control |
CN101326571B (zh) * | 2005-12-07 | 2012-05-23 | 三菱电机株式会社 | 声音识别装置 |
DE102005059630A1 (de) * | 2005-12-14 | 2007-06-21 | Bayerische Motoren Werke Ag | Verfahren zur Erzeugung von Sprachmustern für eine sprachgesteuerte Senderwahl |
US20090222270A2 (en) * | 2006-02-14 | 2009-09-03 | Ivc Inc. | Voice command interface device |
US7925975B2 (en) | 2006-03-10 | 2011-04-12 | Microsoft Corporation | Searching for commands to execute in applications |
US7626572B2 (en) * | 2006-06-15 | 2009-12-01 | Microsoft Corporation | Soap mobile electronic human interface device |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US20080133974A1 (en) * | 2006-11-30 | 2008-06-05 | Kestrelink Corporation | Media player test fixture |
US20080165195A1 (en) * | 2007-01-06 | 2008-07-10 | Outland Research, Llc | Method, apparatus, and software for animated self-portraits |
KR20080069841A (ko) * | 2007-01-24 | 2008-07-29 | 삼성전자주식회사 | 홈 네트워크 통신 시스템 |
US20080262968A1 (en) * | 2007-03-26 | 2008-10-23 | Infosys Technologies Ltd. | Software licensing control via mobile devices |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
CA2685947A1 (en) | 2007-05-14 | 2008-11-27 | Kopin Corporation | Mobile wireless display for accessing data from a host and method for controlling |
US8590028B2 (en) | 2007-07-09 | 2013-11-19 | Infosys Limited | Content licensing and conditional access using a mobile device |
US8825468B2 (en) * | 2007-07-31 | 2014-09-02 | Kopin Corporation | Mobile wireless display providing speech to speech translation and avatar simulating human attributes |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8620662B2 (en) * | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8478578B2 (en) | 2008-01-09 | 2013-07-02 | Fluential, Llc | Mobile speech-to-speech interpretation system |
CN101493987B (zh) * | 2008-01-24 | 2011-08-31 | 深圳富泰宏精密工业有限公司 | 手机声控遥控系统及方法 |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US8521235B2 (en) * | 2008-03-27 | 2013-08-27 | General Motors Llc | Address book sharing system and method for non-verbally adding address book contents using the same |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US9202460B2 (en) * | 2008-05-14 | 2015-12-01 | At&T Intellectual Property I, Lp | Methods and apparatus to generate a speech recognition library |
US9077933B2 (en) | 2008-05-14 | 2015-07-07 | At&T Intellectual Property I, L.P. | Methods and apparatus to generate relevance rankings for use by a program selector of a media presentation system |
CN101600009A (zh) * | 2008-06-04 | 2009-12-09 | 深圳富泰宏精密工业有限公司 | 无线控制装置及具有该控制装置的无线通信装置 |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US10127231B2 (en) * | 2008-07-22 | 2018-11-13 | At&T Intellectual Property I, L.P. | System and method for rich media annotation |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8265862B1 (en) | 2008-08-22 | 2012-09-11 | Boadin Technology, LLC | System, method, and computer program product for communicating location-related information |
US8078397B1 (en) | 2008-08-22 | 2011-12-13 | Boadin Technology, LLC | System, method, and computer program product for social networking utilizing a vehicular assembly |
US8131458B1 (en) | 2008-08-22 | 2012-03-06 | Boadin Technology, LLC | System, method, and computer program product for instant messaging utilizing a vehicular assembly |
US8073590B1 (en) | 2008-08-22 | 2011-12-06 | Boadin Technology, LLC | System, method, and computer program product for utilizing a communication channel of a mobile device by a vehicular assembly |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
KR101057191B1 (ko) * | 2008-12-30 | 2011-08-16 | 주식회사 하이닉스반도체 | 반도체 소자의 미세 패턴 형성방법 |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US8788256B2 (en) * | 2009-02-17 | 2014-07-22 | Sony Computer Entertainment Inc. | Multiple language voice recognition |
DE102009011395A1 (de) * | 2009-03-03 | 2010-09-09 | Rohde & Schwarz Gmbh & Co. Kg | System zur sprachgesteuerten Steuerung von Messgeräten |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US20110110534A1 (en) * | 2009-11-12 | 2011-05-12 | Apple Inc. | Adjustable voice output based on device status |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US8600743B2 (en) | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US8682667B2 (en) * | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8639516B2 (en) | 2010-06-04 | 2014-01-28 | Apple Inc. | User-specific noise suppression for voice quality improvements |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US20120059655A1 (en) * | 2010-09-08 | 2012-03-08 | Nuance Communications, Inc. | Methods and apparatus for providing input to a speech-enabled application program |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US20150106089A1 (en) * | 2010-12-30 | 2015-04-16 | Evan H. Parker | Name Based Initiation of Speech Recognition |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
CN202014321U (zh) | 2011-03-21 | 2011-10-19 | 海尔集团公司 | 遥控器及电视机系统 |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US20120310642A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Automatically creating a mapping between text data and audio data |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US20130030789A1 (en) | 2011-07-29 | 2013-01-31 | Reginald Dalce | Universal Language Translator |
DE102011109932B4 (de) * | 2011-08-10 | 2014-10-02 | Audi Ag | Verfahren zum Ansteuern funktioneller Einrichtungen in einem Fahrzeug bei Sprachbefehl-Bedienung |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
KR20130027665A (ko) * | 2011-09-08 | 2013-03-18 | 삼성전자주식회사 | 휴대단말기의 홈 네트워크 서비스 제어장치 및 방법 |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US8340975B1 (en) * | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
EP2665059B1 (en) * | 2011-10-25 | 2016-02-10 | Olympus Corporation | Endoscope operation system |
US9026441B2 (en) | 2012-02-29 | 2015-05-05 | Nant Holdings Ip, Llc | Spoken control for user construction of complex behaviors |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9441847B2 (en) * | 2012-03-19 | 2016-09-13 | Wojciech Maciej Grohman | System for controlling HVAC and lighting functionality |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
WO2013185109A2 (en) | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9288421B2 (en) * | 2012-07-12 | 2016-03-15 | Samsung Electronics Co., Ltd. | Method for controlling external input and broadcast receiving apparatus |
US8554559B1 (en) * | 2012-07-13 | 2013-10-08 | Google Inc. | Localized speech recognition with offload |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
KR102091236B1 (ko) * | 2012-09-28 | 2020-03-18 | 삼성전자 주식회사 | 전자기기 및 그 제어방법 |
KR101330671B1 (ko) | 2012-09-28 | 2013-11-15 | 삼성전자주식회사 | 전자장치, 서버 및 그 제어방법 |
US9230560B2 (en) | 2012-10-08 | 2016-01-05 | Nant Holdings Ip, Llc | Smart home automation systems and methods |
US20150019229A1 (en) | 2012-10-10 | 2015-01-15 | Robert D. Fish | Using Voice Commands To Execute Contingent Instructions |
US10438591B1 (en) * | 2012-10-30 | 2019-10-08 | Google Llc | Hotword-based speaker recognition |
KR20140060040A (ko) | 2012-11-09 | 2014-05-19 | 삼성전자주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
US20140156281A1 (en) * | 2012-12-03 | 2014-06-05 | Qualcomm Incorporated | Voice-controlled configuration of an automation system |
US9165566B2 (en) | 2013-01-24 | 2015-10-20 | Microsoft Technology Licensing, Llc | Indefinite speech inputs |
KR102516577B1 (ko) | 2013-02-07 | 2023-04-03 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
US10078487B2 (en) | 2013-03-15 | 2018-09-18 | Apple Inc. | Context-sensitive handling of interruptions |
US11151899B2 (en) | 2013-03-15 | 2021-10-19 | Apple Inc. | User training by intelligent digital assistant |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US9384751B2 (en) * | 2013-05-06 | 2016-07-05 | Honeywell International Inc. | User authentication of voice controlled devices |
US9472205B2 (en) * | 2013-05-06 | 2016-10-18 | Honeywell International Inc. | Device voice recognition systems and methods |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
KR101959188B1 (ko) | 2013-06-09 | 2019-07-02 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101809808B1 (ko) | 2013-06-13 | 2017-12-15 | 애플 인크. | 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법 |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
US10089976B2 (en) * | 2013-10-14 | 2018-10-02 | Honeywell International Inc. | Building automation systems with voice control |
DE102013019208A1 (de) * | 2013-11-15 | 2015-05-21 | Audi Ag | Kraftfahrzeug-Sprachbedienung |
US9215510B2 (en) | 2013-12-06 | 2015-12-15 | Rovi Guides, Inc. | Systems and methods for automatically tagging a media asset based on verbal input and playback adjustments |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
EP3115905A4 (en) | 2014-03-03 | 2017-10-25 | Sony Corporation | Information processing apparatus, information processing method, and program |
CN105023575B (zh) * | 2014-04-30 | 2019-09-17 | 中兴通讯股份有限公司 | 语音识别方法、装置和系统 |
US9860076B2 (en) * | 2014-05-07 | 2018-01-02 | Vivint, Inc. | Home automation via voice control |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
CN105490890A (zh) * | 2014-09-16 | 2016-04-13 | 中兴通讯股份有限公司 | 智能家庭终端及其控制方法 |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
DE102014219763A1 (de) | 2014-09-30 | 2016-03-31 | Robert Bosch Gmbh | Verfahren und Vorrichtung zur Inbetriebnahme eines Smart-Home-Gerätes |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9811312B2 (en) * | 2014-12-22 | 2017-11-07 | Intel Corporation | Connected device voice command support |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10274911B2 (en) * | 2015-06-25 | 2019-04-30 | Intel Corporation | Conversational interface for matching text of spoken input based on context model |
CN106469040B (zh) | 2015-08-19 | 2019-06-21 | 华为终端有限公司 | 通信方法、服务器及设备 |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
KR102417682B1 (ko) * | 2015-09-09 | 2022-07-07 | 삼성전자주식회사 | 음성 인식을 이용한 닉네임 관리 장치 및 방법 |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
JP2016029495A (ja) * | 2015-10-08 | 2016-03-03 | パナソニックIpマネジメント株式会社 | 映像表示装置および映像表示方法 |
JP6710037B2 (ja) * | 2015-10-23 | 2020-06-17 | シャープ株式会社 | 通信装置 |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10026401B1 (en) | 2015-12-28 | 2018-07-17 | Amazon Technologies, Inc. | Naming devices via voice commands |
US10484484B2 (en) | 2016-02-05 | 2019-11-19 | International Business Machines Corporation | Context-aware task processing for multiple devices |
US10044798B2 (en) | 2016-02-05 | 2018-08-07 | International Business Machines Corporation | Context-aware task offloading among multiple devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US11176930B1 (en) * | 2016-03-28 | 2021-11-16 | Amazon Technologies, Inc. | Storing audio commands for time-delayed execution |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
US9934784B2 (en) | 2016-06-30 | 2018-04-03 | Paypal, Inc. | Voice data processor for distinguishing multiple voice inputs |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US9940390B1 (en) * | 2016-09-27 | 2018-04-10 | Microsoft Technology Licensing, Llc | Control system using scoped search and conversational interface |
US10229678B2 (en) | 2016-10-14 | 2019-03-12 | Microsoft Technology Licensing, Llc | Device-described natural language control |
JP6760394B2 (ja) | 2016-12-02 | 2020-09-23 | ヤマハ株式会社 | コンテンツ再生機器、収音機器、及びコンテンツ再生システム |
WO2018101458A1 (ja) * | 2016-12-02 | 2018-06-07 | ヤマハ株式会社 | 収音機器、コンテンツ再生機器、及びコンテンツ再生システム |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
WO2018140420A1 (en) | 2017-01-24 | 2018-08-02 | Honeywell International, Inc. | Voice control of an integrated room automation system |
US10013979B1 (en) * | 2017-04-17 | 2018-07-03 | Essential Products, Inc. | Expanding a set of commands to control devices in an environment |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10984329B2 (en) | 2017-06-14 | 2021-04-20 | Ademco Inc. | Voice activated virtual assistant with a fused response |
US11069349B2 (en) * | 2017-11-08 | 2021-07-20 | Dillard-Apple, LLC | Privacy-preserving voice control of devices |
JP2019144790A (ja) * | 2018-02-20 | 2019-08-29 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
US11314481B2 (en) | 2018-03-07 | 2022-04-26 | Google Llc | Systems and methods for voice-based initiation of custom device actions |
US11183182B2 (en) | 2018-03-07 | 2021-11-23 | Google Llc | Systems and methods for voice-based initiation of custom device actions |
US20190332848A1 (en) | 2018-04-27 | 2019-10-31 | Honeywell International Inc. | Facial enrollment and recognition system |
KR102714866B1 (ko) * | 2018-05-08 | 2024-10-08 | 현대자동차주식회사 | 차량 단말에서의 IoT 기기 매칭 방법 및 이를 위한 차량 단말 |
US10832010B2 (en) * | 2018-06-05 | 2020-11-10 | International Business Machines Corporation | Training of conversational agent using natural language |
US20190390866A1 (en) | 2018-06-22 | 2019-12-26 | Honeywell International Inc. | Building management system with natural language interface |
US11627012B2 (en) | 2018-10-09 | 2023-04-11 | NewTekSol, LLC | Home automation management system |
JP7242248B2 (ja) * | 2018-10-31 | 2023-03-20 | キヤノン株式会社 | 電子機器、その制御方法、およびそのプログラム |
CN111508483B (zh) * | 2019-01-31 | 2023-04-18 | 北京小米智能科技有限公司 | 设备控制方法及装置 |
JP2021110768A (ja) * | 2020-01-07 | 2021-08-02 | ソニーグループ株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4974191A (en) * | 1987-07-31 | 1990-11-27 | Syntellect Software Inc. | Adaptive natural language computer interface system |
US4989081A (en) * | 1988-11-14 | 1991-01-29 | Sony Corporation | Home-bus-information system |
US5086385A (en) * | 1989-01-31 | 1992-02-04 | Custom Command Systems | Expandable home automation system |
US5317693A (en) * | 1991-04-04 | 1994-05-31 | Digital Equipment Corporation | Computer peripheral device network with peripheral address resetting capabilities |
NL9100926A (nl) * | 1991-05-29 | 1992-12-16 | Nederland Ptt | Bussysteem, in het bijzonder voor huis- of klein-zakelijk gebruik. |
JP3243803B2 (ja) * | 1991-08-28 | 2002-01-07 | ソニー株式会社 | Av機器 |
US5341166A (en) * | 1992-02-27 | 1994-08-23 | Video Control Technology, Inc. | System for controlling selected devices having unique sets of control codes |
EP0574636B1 (fr) * | 1992-06-19 | 1996-08-21 | EURO CP s.a.r.l. | Procédés pour adresser une unité fonctionnelle et pour mettre en correspondance deux unités fonctionnelles ; unité fonctionnelle et installation s'y rapportant |
GB2268816B (en) * | 1992-07-14 | 1996-01-17 | Sony Broadcast & Communication | Controlling equipment |
US5774859A (en) * | 1995-01-03 | 1998-06-30 | Scientific-Atlanta, Inc. | Information system having a speech interface |
US5774628A (en) * | 1995-04-10 | 1998-06-30 | Texas Instruments Incorporated | Speaker-independent dynamic vocabulary and grammar in speech recognition |
US5890123A (en) * | 1995-06-05 | 1999-03-30 | Lucent Technologies, Inc. | System and method for voice controlled video screen display |
US5802149A (en) * | 1996-04-05 | 1998-09-01 | Lucent Technologies Inc. | On-line training of an automated-dialing directory |
US6018568A (en) * | 1996-09-25 | 2000-01-25 | At&T Corp. | Voice dialing system |
US5777571A (en) * | 1996-10-02 | 1998-07-07 | Holtek Microelectronics, Inc. | Remote control device for voice recognition and user identification restrictions |
US5915001A (en) * | 1996-11-14 | 1999-06-22 | Vois Corporation | System and method for providing and using universally accessible voice and speech data files |
US5909183A (en) * | 1996-12-26 | 1999-06-01 | Motorola, Inc. | Interactive appliance remote controller, system and method |
-
1997
- 1997-10-23 DE DE69712485T patent/DE69712485T2/de not_active Expired - Lifetime
- 1997-10-23 EP EP97118470A patent/EP0911808B1/en not_active Expired - Lifetime
-
1998
- 1998-10-19 US US09/175,382 patent/US6535854B2/en not_active Expired - Lifetime
- 1998-10-23 JP JP32005198A patent/JP4295846B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6535854B2 (en) | 2003-03-18 |
US20020069063A1 (en) | 2002-06-06 |
DE69712485T2 (de) | 2002-12-12 |
EP0911808A1 (en) | 1999-04-28 |
DE69712485D1 (de) | 2002-06-13 |
EP0911808B1 (en) | 2002-05-08 |
JPH11311996A (ja) | 1999-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4295846B2 (ja) | 音声装置及び音声装置の自己初期化方法 | |
JP6683794B2 (ja) | スマート設備の機能案内方法及システム | |
US8095527B2 (en) | Reproducing apparatus and method, information processing apparatus and method, recording medium, and program | |
US6584439B1 (en) | Method and apparatus for controlling voice controlled devices | |
US20020193989A1 (en) | Method and apparatus for identifying voice controlled devices | |
US20030093281A1 (en) | Method and apparatus for machine to machine communication using speech | |
JP2001005489A (ja) | ネットワークの制御方法 | |
CN101449538A (zh) | 媒体文件的文本-语法改进 | |
JP2005521962A (ja) | 機器ネットワークの制御方法 | |
JP3519712B2 (ja) | 電気機器遠隔制御システム、その方法、そのプログラム及びそのプログラムが記録された記録媒体 | |
EP1267523A1 (en) | Extended user interface in a wireless headset | |
JPH09292971A (ja) | 翻訳装置 | |
JP2020064300A (ja) | 備忘録作成システム、備忘録作成方法、および備忘録作成システムのログ管理サーバのプログラム | |
JP2007235328A (ja) | 音声通話用端末装置及び音声通話用プログラム | |
JP2006146996A (ja) | コンテンツ再生システム | |
JP2004509385A (ja) | キー入力データを用いた音声認識及び明瞭度のための入力デバイス。 | |
JP3934071B2 (ja) | 利用者の携帯電話機を媒介として効果音を発生させるカラオケ演奏装置 | |
JP2020061046A (ja) | 音声操作装置、音声操作方法、コンピュータプログラムおよび音声操作システム | |
JP2003131682A (ja) | 音声コマンドによる機器コントロールシステム | |
JP2007263994A (ja) | カラオケ再生装置 | |
CN101393429A (zh) | 利用音调的自动控制系统及自动控制装置 | |
JP2002507772A (ja) | 情報再生用または機能実行用の装置 | |
JP2007506344A (ja) | ソースデバイス及び再生デバイスを制御するシステム | |
JP2004185621A (ja) | 音声確認システム及び方法 | |
JP2001209400A (ja) | 音声合成装置及び音声案内システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071016 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080729 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081029 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090317 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090413 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120417 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120417 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130417 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130417 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140417 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |