[go: up one dir, main page]

JP4295846B2 - 音声装置及び音声装置の自己初期化方法 - Google Patents

音声装置及び音声装置の自己初期化方法 Download PDF

Info

Publication number
JP4295846B2
JP4295846B2 JP32005198A JP32005198A JP4295846B2 JP 4295846 B2 JP4295846 B2 JP 4295846B2 JP 32005198 A JP32005198 A JP 32005198A JP 32005198 A JP32005198 A JP 32005198A JP 4295846 B2 JP4295846 B2 JP 4295846B2
Authority
JP
Japan
Prior art keywords
network
user
voice
command
vocabulary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32005198A
Other languages
English (en)
Other versions
JPH11311996A (ja
Inventor
ペーター ブフナー
シルケ ゴロンジー
ラルフ コンペ
ステファン ラップ
Original Assignee
ソニー インターナショナル (ヨーロッパ) ゲゼルシャフト ミット ベシュレンクテル ハフツング
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー インターナショナル (ヨーロッパ) ゲゼルシャフト ミット ベシュレンクテル ハフツング filed Critical ソニー インターナショナル (ヨーロッパ) ゲゼルシャフト ミット ベシュレンクテル ハフツング
Publication of JPH11311996A publication Critical patent/JPH11311996A/ja
Application granted granted Critical
Publication of JP4295846B2 publication Critical patent/JP4295846B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L12/40052High-speed IEEE 1394 serial bus
    • H04L12/40117Interconnection of audio or video/imaging devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Automation & Control Theory (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Selective Calling Equipment (AREA)
  • Small-Scale Networks (AREA)
  • Telephonic Communication Services (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声装置と、遠隔制御可能なネットワーク機器、及び音声装置の自己初期化方法に関する。
【0002】
【従来の技術】
近年、音声認識装置が、テレビジョン受像機、ラジオ受信機、車載ナビゲーション、携帯電話、ビデオカメラ、パーソナルコンピュータ(以下、PCという。)、プリンタ、暖房機器といった民生用機器を音声によって制御するために、少しであるが用いられるようになっている。音声認識装置は、制御される機器自体に内蔵されている。音声認識装置の語彙、文法、コマンド等のプロパティは、個々の機器に特有の機能に適するように作られている。
【0003】
また、上述した民生用機器を、例えばIEEE1394シリアルバスのような専用バスシステムによって接続する技術が利用されている。このようなシステムに接続された機器は、コマンドやデータを互いに送受して通信を行っている。通常、このような機器は、ネットワークに接続されているとき、それぞれ他の機器と識別されるように、ネットワークコントローラによって固有のアドレスが与えられる。これらのアドレスは、互いに通信するために、他の全ての機器によって用いられる。新しい機器が接続された場合は、このネットワークに接続されている他の全ての機器に、この新しく接続された機器のアドレスと機種が通知される。このようなネットワークは、家庭や、車に導入されている。
【0004】
例えば、カーステレオの制御などの民生用機器の操作は、より複雑になってきているが、音声認識装置を用いることによって、操作が容易になり、また、車中で用いると、安全性も増す。また、家庭のネットワークでも、音声認識装置を用いると、例えばビデオテープレコーダのプログラミング、又はテレビジョン受像機のチャンネル選択といった操作を簡単に行うことができる。しかしながら、音声認識装置は、複雑な回路構成が必要であり、確実で柔軟な操作を確保するには、非常に費用のかかる技術を要する。したがって、音声認識装置は、上述した機器には、ほんの少ししか採用されておらず、ほとんど普及していない。
【0005】
【発明が解決しようとする課題】
本発明は、上述した実情に鑑みてなされたものであり、本発明の目的は、複数の機器を制御することができる汎用の音声装置を提供することである。また、本発明の目的は、音声により、ネットワークを介して簡単に制御することができる遠隔制御可能な機器を提供することである。
【0006】
【課題を解決するための手段】
本発明に係る音声装置は、マイクロホンからのユーザの音声信号を認識する音声認識手段と、ネットワークを介して遠隔制御可能なネットワーク機器から、ネットワーク機器の記憶部又はネットワーク機器に挿入された記録媒体固有の語彙及び/又は文法と、語彙及び/又は文法に基づくユーザネットワークコマンドとを受信するための通信制御ネットワークコマンドをネットワーク機器に送信するとともに、ネットワーク機器からその機器の種類を示すデータを受信し、受信した語彙及び/又は文法、及びユーザネットワークコマンドと、機器の種類を示すデータとを対応させて、ネットワーク機器の種類に対応したユーザネットワークコマンドを生成する制御手段と、受信した語彙及び/又は文法、及びユーザネットワークコマンドを記憶する記憶手段とを備え、制御手段は、音声認識手段からの音声信号を記憶手段に記憶された語彙及び/又は文法に基づいて認識解読して、対応するユーザネットワークコマンドを記憶手段から読み出してネットワーク機器に送信する。
また、本発明に係る音声装置の自己初期化方法は、ネットワーク機器に接続された音声装置の自己初期化方法において、ネットワークを介して遠隔制御可能なネットワーク機器から、ネットワーク機器の記憶部又はネットワーク機器に挿入された記録媒体固有の語彙及び/又は文法と、語彙及び/又は文法に基づくユーザネットワークコマンドとを受信するための通信制御ネットワークコマンドを、ネットワーク機器に送信するステップと、ネットワーク機器から送られてくる語彙及び/又は文法、及びユーザネットワークコマンドを受信するステップと、ネットワーク機器に論理名又は識別子の送信を要求するステップと、ネットワーク機器から送られてくる論理名又は識別子を受信するステップと、受信した語彙及び/又は文法、及びユーザネットワークコマンドと、論理名又は識別子とを対応させて、ネットワーク機器固有のユーザネットワークコマンドを生成し、内蔵のメモリに記憶している語彙及び/又は文法、及びユーザネットワークコマンドを、受信した語彙及び/又は文法、及びユーザネットワークコマンドによって更新するステップとを有する。
【0008】
【発明の実施の形態】
以下、本発明に係る音声装置及び遠隔制御可能なネットワーク機器について、図面を参照しながら説明する。
【0009】
図1は、本発明を適用した音声装置の具体的な構成を示すブロック図である。この音声装置10には、マイクロホン1と、ラウドスピーカ2とが接続されている。これらは、音声装置10に内蔵するようにしてもよい。音声装置10は、音声認識機能、音声解読機能、音声合成機能、対話機能等を有し、IEEE1394シリアルバス3に接続されている。マイクロホン1は、ユーザが発した音声を音声信号に変換し、このアナログ音声信号はアナログ/デジタル(A/D)変換器(図示せず)によってデジタル音声信号に変換されて音声装置10に供給される。スピーカ2には、音声装置10からのデジタル音声信号がデジタル/アナログ(D/A)変換器(図示せず)によりアナログ音声信号に変換されて供給される。
【0010】
IEEE1394規格は、娯楽機器、通信機器及び電子計算機を民生用のマルチメディアに統合する、低価格のデジタルインタフェースを規定した国際規格である。ユーザは、IEEE1394シリアルバスがアクティブな状態においても、IEEE1394規格に準拠した機器を取り外したり取り付けたり(活線挿抜)することができ、IEEE1394シリアルバスは、低価格で使いやすいバスシステムである。本発明は、このIEEE1394シリアルバス及びIEEE1394規格に準拠した機器(以下、ネットワーク機器という。)を用いて説明されているが、本発明は、この特定のIEEE1394シリアルバスに限らず、全ての種類の有線又は無線のホームネットワーク、又は他のネットワーク上でも応用することができる。
【0011】
後に詳しく説明するが、音声装置10は、図1に示すように、IEEE1394シリアルバス(以下、ホームネットワークともいう。)3に接続されている。この音声装置10は、一般的な語彙を備え、一般的な目的で使用される音声認識及び合成装置を含んでいる。そして、1つの音声装置10が、ホームネットワーク3に接続されている全てのネットワーク機器20を制御する。音声装置10は、マイクロホン1を介してユーザからの音声コマンドをピックアップし、この音声コマンドを、例えばIEEE1394規格のホームネットワークに適した制御コード(以下、ユーザネットワークコマンドともいう。)に変換する。このユーザネットワークコマンドは、適切なネットワーク機器20に送信され、そのネットワーク機器20は、そのユーザネットワークコマンドに基づいて動作する。
【0012】
全てのネットワーク機器20がユーザの音声によって制御されるようにするためには、音声装置10は、個々のネットワーク機器20を動作させるのに必要なコマンドを知識として持っている必要がある。音声装置10は、例えば複数の機器に共通のコマンドである基本的なコマンドを知っている。多くのユーザからの音声コマンドは、単一のユーザネットワークコマンドとされることもある。音声コマンドは、例えば、再生、ラジオ局YXZの選局、電話番号等の続き番号などである。これらの音声コマンドは、それのみで発せられることもあるし、又はそれが文(Full Sentence)の中に組み込まれていることもある。文も、音声コマンドである。
【0013】
音声装置10における音声認識、解読及び対話の技術は、周知のことであるので、本発明では詳しくは説明しないが、基本的には、音声装置10は、語彙のセットと、文法のセットを備えており、これらの語彙と文法に基づいて、ユーザからの音声コマンドをユーザネットワークコマンドに変換し、ネットワーク機器20は、そのユーザネットワークコマンドに従って動作する。また、音声装置10は、各単語に対応する発音を数パターン有し、ユーザと対話、すなわちユーザに対して音声を発する。
【0014】
本発明を適用した音声装置10は、デジタルシグナルプロセッサ(以下、DSPという。)11を備えており、このDSP11には、マイクロホン1が接続されている。このDSP11は、マイクロホン1から、ユーザが発した音声コマンドに対応したデジタル音声信号が供給され、これらのデジタル音声信号を、中央処理装置(以下、CPUという。)12が認識可能なデジタル言語に変換する処理を行う。この変換処理を行うために、DSP11には、DSP11が実行する処理についての情報を記憶しているメモリ16が双方向通信可能に接続されており、またDSP11には、音声認識部11aが内蔵されている。また、DSP11には、メモリ15の中の特徴抽出部15eが接続されており、この特徴抽出部15eには、音声コマンドに対応するデジタル音声信号を、どのようにしてデジタル言語に変換するかについての情報が記憶されている。すなわち、DSP11は、マイクロホン1を介してユーザが発した音声コマンドを、例えばテキストコードなどのコンピュータが認識可能な形式に変換する。
【0015】
DSP11は、このようにして生成したデジタル言語を、CPU12に供給する。CPU12は、これらのデジタル言語をユーザネットワークコマンドに変換し、ホームネットワーク3に送信する。したがって、DSP11及びCPU12は、音声認識機能、対話機能、音声解読機能を有している。
【0016】
なお、DSP11が、マイクロホン1を介してのユーザからの音声コマンドのスペクトル分析のみを行い、語の認識自体は、CPU12が、ユーザネットワークコマンドへの変換とともに、行うようにしてもよい。また、CPU12の能力によっては、CPU12がスペクトル分析も行い、DSP11を削除するようにしてもよい。
【0017】
更に、CPU12は、音声装置10が新しい語彙、文法、及びネットワーク機器20に送信されるユーザネットワークコマンドを学習できるようにするための学習機能を備えている。この学習機能を実現するために、CPU12には、CPU12が実行する処理についての情報を記憶しているメモリ16が、双方向通信可能に接続されている。更に、CPU12には、メモリ15が接続されており、このメモリ15は、初期語彙部15aと、付加語彙部15bと、初期文法部15cと、付加文法部15dとから成り、CPU12と双方向通信可能になっている。また、メモリ15は、認識部と文字素/音素変換(grapheme/phoneme conversion)部とを備えたソフトウエア部15fを有し、このソフトウェア部15fは、CPU12と双方向通信可能に接続されている。また、CPU12には、DSP17が接続されており、CPU12は、DSP17にメッセージのデータを供給する。DSP17は、音声合成及び生成部17aを内蔵し、メッセージのデータから音声を合成して、ラウドスピーカ2を介して出力する。
【0018】
CPU12には、リンクレイヤ制御回路13及びI/F物理レイヤ回路14を介して、ホームネットワーク3が、双方向通信可能に接続されている。リンクレイヤ制御回路13及びI/F物理レイヤ回路14は、ユーザネットワークコマンドをホームネットワーク3に接続されている選択された機器に送信するとともに、ホームネットワーク3を介して送られてくる、例えば新たな種類のユーザネットワークコマンドを受信する。
【0019】
すなわち、音声装置10は、新しいユーザネットワークコマンド及びそれに対応する語彙及び文法を、他のネットワーク機器20から直接に学習することもできる。このような学習をするために、音声装置10は、ネットワーク機器20を制御するためのメモリ16に記憶されている制御コマンドを、制御ネットワークコマンドとしてネットワーク機器20に送信する。この制御ネットワークコマンドは、ユーザがネットワーク機器20を制御する際に用いるユーザネットワークコマンド、それに対応する語彙及び文法を、音声装置10に送信するように、ネットワーク機器20に要求するためのコマンドである。メモリ15は、付加語彙部15bと、付加文法部15dとを備えており、これらは、新しく入力された語彙及び文法を記憶する。付加語彙部15b及び付加文法部15dはそれぞれ、初期語彙部15aと、初期文法部15cと同じように機能するが、付加語彙部15b及び付加文法部15dは、CPU12の制御の下に、新しく入力されたユーザネットワークコマンド及びこれを認識するのに必要な語彙や文法等の情報を記憶する。このようにして、音声装置10は、いかなるネットワーク機器20が有するユーザネットワークコマンド、それに対応する語彙及び文法をも学習することができる。新しいネットワーク機器20は、音声認識部を内蔵している必要はなく、ネットワーク上の独立した音声装置10が制御可能なユーザネットワークコマンド、それに対応する語彙及び文法等の情報を送信する機能のみを備えていればよい。すなわち、本発明を適用した音声装置10は、ユーザネットワークコマンドと、それに対応する語彙及び文法とを学習することができ、ユーザは、音声装置10を介して各ネットワーク機器20を、音声で制御されることができる。
【0020】
初期語彙部15a及び初期文法部15cは、様々なネットワーク機器20に対して用いられる基本的なユーザネットワークコマンドのセットを記憶しており、これらのユーザネットワークコマンドは、例えば「電源オン」、「電源オフ」、「一時停止」、「音量アップ」等の音声コマンドに対応するユーザネットワークコマンドである。これらのユーザネットワークコマンドとCPU12が必要とするそれに対応した語彙及び文法は、DSP11に内蔵されている音声認識部11aによって生成されるデジタル言語と区別するために、初期語彙部15a及び初期文法部15cに記憶されている。更に、基本的な質問又はメッセージが、メモリ16に記憶されている。これらは、音声装置10からユーザに対して発せられる。このような質問又はメッセージは、例えば「もう一度言って下さい」、「どの機器の電源を切りたいのですか」などであり、ユーザが発したコマンドを適切なユーザネットワークコマンドにするために、音声装置10とユーザの対話の際に用いられるものである。これらの質問又はメッセージは、CPU12が必要とする音声データとともに記憶されており、CPU12は、デジタル言語を生成して、DSP17の中の音声合成及び生成部17aに出力し、音声合成及び生成部17aは、メッセージを生成して、ラウドスピーカ2を介しててユーザに出力する。かくして、CPU12は、マイクロホン1、DSP11,17及びラウドスピーカ2を用いてユーザと双方向通信ができ、すなわち音声装置10は、ユーザと対話することができ、ユーザからも学習することができる。換言すると、音声装置10は、ネットワーク機器20からの学習と同様に、メモリ16に記憶されている制御ネットワークコマンドのセットを用いて、様々な情報を音声装置10に提供するように、ユーザに要求することができる。
【0021】
上述したように、音声装置10からユーザに対して、制御ネットワークコマンドがメッセージとなって発せられた場合、ユーザもまた、マイクロホン1及びDSP11を介して、ユーザネットワークコマンドと、それに対応する語彙及び文法とを、CPU12に対して教えることができる。ユーザが、音声装置10を学習モードにさせるための音声コマンドを発すると、CPU12は、メモリ16に記憶されている制御ネットワークコマンドに基づいて、ユーザと対話をし、新しいユーザネットワークコマンド、それに対応する語彙及び文法を学習して、メモリ15の各部に記憶する。
【0022】
また、新しいユーザネットワークコマンドの学習は、半分は、音声装置10とあるネットワーク機器20との通信によって自動的に行われ、もう半分は、音声装置10とユーザとの対話によって行われるようにしてもよい。このように、この音声装置10には、ネットワーク機器20によるユーザネットワークコマンドの他に、ユーザが関わるユーザネットワークコマンドが生成される。
【0023】
上述したように、音声装置10は、3種類のコマンド、すなわちユーザが発する音声コマンドと、この音声コマンドに対応するデジタル信号等であるユーザネットワークコマンドと、制御ネットワークコマンドとを処理する。この制御ネットワークコマンドは、他のネットワーク機器20又はユーザから新しいユーザネットワークコマンドを学習するためのネットワーク機器20又はユーザとの通信を行うために用いられる。また、制御ネットワークコマンドは、ユーザが新しい音声コマンドを入力できるように、音声コマンドにある機能を付加したり、既に記憶しているユーザネットワークコマンドに新しい機能を付加したりするために用いられる。
【0024】
音声装置10がユーザに向かって発する音声は、合成された音声か、予め録音された音声かのどちらであってもよい。例えば、頻繁に使われるメッセージには、予め録音された音声を用いて、他のメッセージには、合成された音声を用いるなどの両方を混合してもよい。また、どのネットワーク機器20も、音声装置10に対してメッセージを送信することができる。ネットワーク機器20は、これらのメッセージを、文字列(orthographic form)、符号化して、又はある方法における識別子として送信する。そして、これらの文字列のメッセージは、例えば、音声装置10に接続されているラウドスピーカ2を介して出力される。メッセージは、いかなる種類の情報でもよく、また、その情報は通常、ネットワーク機器20の表示部に表示されている。更に、メッセージは、対話の一部として、ユーザに対して発せられる質問であってもよい。上述したように、このような対話は、音声装置10自体がユーザの音声コマンドを確認するために行われ、又は音声装置10が、新しいユーザネットワークコマンド、それに対応する語彙及び文法を学習するために、制御ネットワークコマンドに基づいて行われる。
【0025】
なお、例えば、マイクロホン1とラウドスピーカ2は、1つの音声入力及び/又は出力装置と構成してもよい。この場合、メッセージの交換は、音声装置10と音声入力及び/又は出力装置との間で、文字列によって行われる。
【0026】
ユーザは、ホームネットワーク3にどのような機器が接続されているのかについて、音声装置10に確認したい場合がある。この場合、「どの機器の電源を入れましょうか?」といった、音声装置10自体がユーザに発する音声メッセージに対して、ユーザが、「ネットワークに接続中の機器は?」といったメッセージを音声装置10に聞き返す。そして、音声装置10が、「ネットワークに接続中の機器は?」といったユーザからのメッセージに答えた後、ユーザは、「どの機器の電源を入れましょうか?」といった音声装置10からのメッセージに答える。
【0027】
図2は、本発明を適用した遠隔制御可能な機器、すなわちホームネットワーク3を介して音声装置10と接続されたネットワーク機器20の具体的な構造を示すブロック図である。なお、この図2には、音声制御に必要な回路ブロックのみが示されている。
【0028】
このようなネットワーク機器20のCPU21は、リンクレイヤ制御部26及びI/F物理レイヤ回路25を介して、ホームネットワーク3に接続されている。音声装置10における場合と同じように、CPU21とホームネットワーク3は、双方向通信可能に接続されており、これにより、CPU21は、ホームネットワーク3から、ユーザネットワークコマンド、制御ネットワークコマンド、他の情報を受信し、また、ホームネットワーク3を介して、他のネットワーク機器20又は音声装置10に対して、制御ネットワークコマンド、メッセージ、他の情報を送信する。また、一部のネットワーク機器20は、ユーザネットワークコマンドを送信する。CPU21には、メモリ23が、双方向通信可能に接続されており、このメモリ23には、他のネットワーク機器20との通信に必要な一連の制御コマンドを含む、CPU21の処理に必要な情報が、全て記憶されている。また、CPU21には、ネットワーク機器20の全ての処理を制御する機器制御ソフトウェア部24が、双方向通信可能に接続されている。ネットワーク機器20を制御する全てのユーザネットワークコマンドと、それに対応する語彙及び文法とを記憶しているメモリ22もまた、CPU21と双方向通信可能に接続されている。これらのユーザネットワークコマンドと、それに対応する語彙及び文法は、ネットワーク機器20のCPU21と、ネットワーク機器20のリンクレイヤ制御部26及びI/F物理レイヤ回路25と、ホームネットワーク3と、音声装置10のI/F物理レイヤ回路14及びリンクレイヤ制御回路13と、音声装置10のCPU12とを介して、各ネットワーク機器20の機器名とともに、音声装置10に内蔵されているメモリ15の付加語彙部15b及び付加文法部15dに、ダウンロードされる。すなわち、本発明に適用した音声装置10は、上述のようにして、ネットワーク機器20を制御するのに必要な全てのユーザネットワークコマンドと、それに対応する語彙及び文法を学習することができる。したがって、本発明を適用したネットワーク機器20は、音声で制御できるようにするための音声認識部をそれぞれ内蔵する必要はなく、音声装置10にダウンロードするための機器毎のユーザネットワークコマンドと、それに対応する語彙及び文法とを記憶したメモリさえ備えていればよい。なお、語彙を新たに更新しなくても、音声装置10は、ネットワーク機器20に対して、基本的な制御を行うことはできる。すなわち、ネットワーク機器毎のユーザネットワークコマンドと、それに対応する語彙及び文法がなくても、音声装置10は、ネットワーク機器20に対して、例えば「電源オン」、「電源オフ」、「音量アップ」、「チャンネル変更」、「再生」、「停止」等のどのような機器にも共通する基本的な制御を行うことができる。
【0029】
図3は、IEEE1394シリアルバス3を用いたネットワークシステムの形態の一例を示す図である。このネットワークシステムには、マイクロホン1及びラウドスピーカ2を備えた1つの音声装置10と、4つのネットワーク機器20とが接続されている。
【0030】
図4は、IEEE1394シリアルバス3を用いたネットワークシステムの形態の他の例を示す図である。このネットワークシステムでは、4つのネットワーク機器20の他に、マイクロホン1及びラウドスピーカ2を備えた音声装置10を内蔵したネットワーク機器30が、ホームネットワーク3に接続されている。このような、音声装置10を内蔵したネットワーク機器30は、ネットワーク機器20と音声装置10を合わせた機能を有する。そして、音声装置10は、ネットワーク機器20と、音声装置10を内蔵したネットワーク機器30とを制御する。
【0031】
図5は、IEEE1394シリアルバス3を用いたネットワークシステムの形態の他の例を示す図である。ネットワークシステムAは、図3におけるネットワークシステムと似ているが、6つのネットワーク機器20が、ホームネットワーク3に接続されている。ホームネットワーク3に接続されている音声装置10は、ネットワーク機器20をいくつでも制御することができる。どのネットワーク機器20でも、ホームネットワーク3に接続されていれば、音声装置10によって制御される。
【0032】
図6は、図3乃至図5のIEEE1394シリアルバス3を用いたネットワークシステムにおける機器間のより詳細な接続を示す図である。この図6のネットワークシステムBに示すように、1つの音声装置10と5つのネットワーク機器20は、閉ループを構成することなく、IEEE1394シリアルバス3を介してディジーテェーン又はスター状に接続されている。したがって、互いに直接接続されていない音声装置10又はネットワーク機器20同士は、それらの中間に接続された音声装置10又はネットワーク機器20を介して通信するようになっている。すなわち、IEEE1394シリアルバスでは、自分宛でない情報は、次の機器に転送することにより、図3乃至5に示すようなバスを擬似的に形成している。したがって、本発明は、上述したIEEE1394シリアルバスを用いたネットワークシステムに限定されるものではなく、様々なネットワークシステムにも適用することができる。
【0033】
例えば、図7は、本発明を適用した音声装置10とネットワーク機器20を用いた無線ネットワークシステムを示す図である。ここでは、全ての機器が、各自が内蔵している送信機と受信機を介して、互いに直接に通信を行うようになっている。この例では、複数の音声装置10が、1つのネットワークの中に接続されている。これらの音声装置10は、両方とも同じ機能を持っていてもよいし、又は互いに異なる機能を持っていてもよい。このよう構成することにより、各ユーザが個人用の音声装置10を携帯して、様々なネットワーク機器20を制御することができる。また、無線の個人用の音声装置10では、他の場所のネットワークシステムに携帯して持っていき、その他のネットワークシステムに自動的にログインすることができ、また個人的な操作が全てできるという利点がある。なお、例えば、この個人用の音声装置10を、有線ネットワーク上で用いるようにしてもよい。
【0034】
また、例えば、ある特定のユーザの暗証番号等を用いて、そのユーザが発する音声コマンドのみをユーザネットワークコマンドに変換するように、個人用のネットワーク機器を構成するようにしてもよい。この場合、その登録されている本人が、その音声装置10を使うときのみ、アクセスが可能であるため、個人個人のアクセス権を保護できる。したがって、例えば、ネットワーク自体へのアクセス、ネットワークに接続されている機器へのアクセス、部屋、ビデオテープレコーダ、テレビジョン受像機等へのアクセス等のあらゆる種類のアクセスを、この方法で管理制御することができる。
【0035】
また、例えば、電話帳を、音声装置10に記憶させておくようにしてもよい。例えば、「職場」等の名前で機能を呼ぶ方法は、個々のユーザによって異なる。個人用の音声装置10では、別々のユーザがそれぞれ異なる呼び方で、同じ機能を実行することができる。また、例えば「私のテレビの電源を入れよ。」といった音声コマンドを、特定の機器を制御する特定のユーザネットワークコマンドに割り当てるようにしてもよい。また、例えば、別のユーザが、同じユーザネットワークコマンドに対して、別の名前の音声コマンドを割り当てるようにしてもよい。したがって、この場合、音声装置10は、2つの異なる音声コマンドに対して、同じユーザネットワークコマンドを生成することになる。また、例えば、ネットワークにテレビジョン受像機が2台あるなど、同じ機種の機器が1台以上あるとき、異なる複数のユーザが、例えば「私のテレビの電源を入れよ。」など、同じ音声コマンドを発しても、異なるユーザネットワークコマンドを生成し、適切な機器の方に、そのユーザネットワークコマンドを送信するようにしてもよい。
【0036】
また、例えば、1つの音声装置10に、1人のユーザ、又は別のユーザの個人的な情報をいれるようにしてもよい。また、例えば、1人のユーザのための個人用の音声装置10は、携帯用で無線であるので、ユーザが常に携帯したり、同じものを家、車の中、又は職場などの他のネットワークに置くようにしてもよい。
【0037】
個人用の音声装置10は、ユーザが、登録された特定のユーザであるかを確認することができる。個人用の音声装置10は、ユーザの音声を確認し、ユーザに、その音声で登録された機器のみを制御させるようにする。これは、部屋、車、又は電話機等の機器へのアクセスを管理制御することができる。認識性能を高めるために、個人用の音声装置10に、1人専用の音声認識部を内蔵させてもよい。
【0038】
図8は、3つの部屋から成るホームネットワークシステムの一例を示す図である。このうちの1つ部屋、例えば台所には、IEEE1394シリアルバス61が設けられている。このIEEE1394シリアルバス61には、放送受信機65と、デジタルテレビジョン受像機64と、プリンタ63と、電話機62と、長距離中継器66が接続されている。放送受信機65は、放送用保安装置60を介して、家の外のCATVに接続されている。また、IEEE1394シリアルバス61は、長距離中継器66及びIEEE1394ブリッジ74を介して、第2の部屋である居間に設置されたIEEE1394シリアルバス67に繋がっている。この居間のIEEE1394シリアルバス67には、音声装置70と、パーソナルコンピュータ(以下、PCという。)69と、電話機68と、ビデオテープレコーダ71と、ビデオカメラ72と、デジタルテレビジョン受像機73aとが接続されている。また、IEEE1394シリアルバス67は、IEEE1394ブリッジ74及び長距離中継器75を介して、第3の部屋である書斎に設置されたIEEE1394シリアルバス78に繋がっている。IEEE1394シリアルバスバス78には、PC76と、電話機77と、ハードディスク79と、プリンタ80と、デジタルテレビジョン受像機81と、電話NIU82とが接続されている。電話NIU82は、電話機用保安装置83に接続されている。
【0039】
上述したネットワークシステムでは、IEEE1394シリアルバス61,67,78と、IEEE1394ブリッジ74と、中継器66,75とを介して、どの機器も、他の機器と通信できるように構成されている。居間に設置されている音声装置70は、全ての機器と通信を行い、これらの機器を制御する。この音声装置70は、上述した音声装置10と同様の構成を有する。図8に示す例では、例えば、居間のデジタルテレビジョン受像機73と書斎のデジタルテレビジョン受像機81のように、同じ機種の機器が複数存在しているので、ユーザが機器名を定義するようにする。複数の同じ機種の機器がネットワークに設置された場合、又はある機種の機器が接続されているネットワークに、新たに同じ機種の機器が接続された場合、音声装置70は、ユーザに、それぞれの機器に対して名前を付けるように要求する。例えば「居間のテレビジョン受像機」と「書斎のテレビジョン受像機」と名付けるように要求する。これらの名前を音声装置70に学習させるには、次のうちのいずれか方法を用いて行う。
【0040】
1.ユーザは、その機器の名前の文字列を、タイプ又は手書きで音声装置に入力する。音声装置は、その文字列を、音素記号列にマッピングする。
【0041】
2.個人用の音声装置では、その機器の名前に対応するユーザ定義の音声名を、ベクトル特性として記憶させる。そして、このベクトル特性を参照パターンとして、パターンマッチングにより音声名を認識するようにする。
【0042】
3.音声装置が、音素認識部を用いて、自動的にその名前に対応する音素記号列を学習する。
【0043】
そして、ユーザは、それらの機器に、例えば「居間のテレビジョン受像機」といった名前を付ける。音声装置70は、この名前を、適切なネットワークアドレスにマッピングする。この名前は、デフォルトとして、特定の機器の機能に対応付けられる。ユーザが発するコマンドは、その発した名前が最も最近に付けられた機器に送信される。なお、これらの名前は、後に変更することはいうまでもない。
【0044】
ユーザは、電話機を介して、家にある機器にアクセスしたい場合が多くあると考えられる。例えば、遠隔地から、ファックスを読み出したり、暖房機器を制御したりしたい場合がある。図9及び図10は、このような遠隔地からのアクセスを実現させる2つの形態を示している。
【0045】
図9は、音声装置10が、ネットワーク機器20を有するホームネットワークシステムと、公衆電話ネットワークとに接続されている具体例を示す図である。ユーザからの音声コマンドは、公衆電話ネットワークを介して、音声装置10に送信され、音声装置10は、その音声コマンドをユーザネットワークコマンドに変換して、指定されたネットワーク機器20を制御する。ユーザは、公衆電話ネットワークにアクセスできれば、どんな所からでも、他の装置は用いずに、音声装置10のみを用いて、自分のホームネットワークシステム内のネットワーク機器20を制御することができる。
【0046】
図10は、ユーザが、個人用の音声装置10を携帯して、あるホームネットワークAの領域にいる場合の例を示す図である。ユーザが、自分の個人用の音声装置10に向かって、音声コマンドを発すると、個人用の音声装置10は、その音声コマンドを、ユーザネットワークコマンドに変換して、ホームネットワークAに送信する。ホームネットワークAは、送受信機84及び公衆電話ネットワークを介して、このユーザネットワークコマンドを、ユーザが発した音声コマンドによって制御されるネットワーク機器20が属しているホームネットワークBに送信する。この場合に利用できる機能は、使用されているネットワークに依存する。
【0047】
上述したように、音声装置10は、音声出力装置を内蔵しているか、あるいは直接に又はネットワークを介して音声出力装置に接続されており、音声装置10は、ネットワーク機器20からのメッセージを音声に合成して出力し、これにより、音声装置10とユーザの対話が成される。このような対話は、例えば、ビデオテープレコーダをプログラムする際に役に立つ。メッセージには、例えば、ジュークボックスに入っているコンパクトディスクのタイトル等の、ネットワーク機器20の状態についての付加的な情報も盛り込むことができる。すなわち、メッセージの数や種類は制限されない。
【0048】
図11,図12及び図13は、音声装置10及びネットワーク機器20からなる音声システムにおける、例えばビデオテープレコーダをプログラムする際の音声システムとユーザとの対話の文法を、一部例示したものである。“S”は、音声システムの質問で、“U”は、ユーザによる音声コマンド又は他の発話である。対話の各ステップで発せられる音声コマンド又は他の発話は、特定の文法及び語で示される。
【0049】
ユーザが、定形の一連の語を発するように、又は対話を定まった一連の対話ステップに限定するために、例えば有限状態変位文法(finite state grammar)等の文法を用いる。このような文法は、例えば、ビデオテープレコーダのプログラミングに適している。各対話ステップによって、異なる有限状態変位文法が用いられる。これらの文法は、音声装置によって直接用いられるが、各機器によって異なる。したがって、音声システムの中に特定の有限状態変位文法を入れておくのは、実用的ではない。むしろ、新しい機器がネットワークに接続された際、その機器固有の文法を、その機器から音声装置に送信するようにするのが望ましい。
【0050】
図11は、音声システムとユーザとの対話ステップを示す図である。ステップS1において、音声システムは、例えばユーザに対して「チャンネルは?」というメッセージを出力して、ユーザにチャンネルの種類を尋ねる。ステップS2において、ユーザは、所望のチャンネルの音声コマンドを発することで、音声システムに、一連の語「U_CHANNEL」が入力される。ステップS3において、音声システムは、設定された動作を今日するべきかを尋ねる。ステップS4において、ユーザは、設定された動作を今日するべきかについて「はい」又は「いいえ」で答え、「いいえ」の場合は、所望の日付を言うことで、音声システムに、一連の語「U_Y/N_DATE」が入力される。日付が今日で、すなわちユーザが、音声システムの質問に「はい」と答えた場合、音声システムは、ステップS5において、「どの映画ですか?」と尋ねる。ステップS6において、ユーザは、所望の映画を音声システムに伝えることで、一連の語「U_FILM」が入力される。ステップ4において、ユーザが「いいえ」と答えた場合、音声装置は、ステップS7において、日付を尋ねる。ステップS8において、ユーザは、所望の日付の音声コマンドを発することで、一連の語「U_DATE」が入力され、ステップ5へと続く。
【0051】
図12は、図11の例に対応する一連の語の文法を示す図である。図11のステップS4において、ユーザは、一連の語「U_Y/N_DATE」として、「はい」を入力するか、又は「いいえ」、すなわち日付を入力するかのどちらかを行う。図11で示したように、一連の語「U_Y/N_DATE」において、ユーザは、図12のステップS41において一連の語「U_Y/N」を入力するか、又は、ステップS42において一連の語「U_DATE」を入力するかのどちらかを行う。一連の語「U_Y/N」において、ユーザは、ステップS43において一連の語「U_NO」を入力するか、又は、ステップS44において一連の語「U_YES」を入力するかのどちらかを行う。一連の語「U_DATE」において、ユーザは、ステップS45において一連の語「NO_1_31」を入力して日にちを特定し、ステップS46において一連の語「NO_1_12」を入力して月を特定する。
【0052】
図13は、これらの一連の語に対応する語彙を示している。例えば、一連の語「U_YES」は、「はい」又は「ええ」に対応しており、一連の語「U_NO」は、「いいえ」に対応しており、一連の語「NO_1_31」は、1,2,...31又は1日、2日、...31日と対応しており、一連の語「NO_1_12」は、1...12又は1月...12月と対応している。
【0053】
図14は、ユーザ、音声装置及びネットワーク機器間のプロトコルを示す図である。
【0054】
ステップS1において、ユーザは、音声コマンド「再生」を発する。音声装置は、ネットワークに接続されている、再生可能な機器が複数あることを認識する。すなわち、音声装置は、音声コマンド「再生」だけでは、特定のネットワーク機器を制御するのに十分な情報ではないと認識する。ステップS2において、音声装置は、「どの機器を再生したいですか?」というメッセージをユーザに対して出力する。ステップS3において、ユーザは、音声装置に対して、「ビデオテープレコーダ」と答える。この時点で、音声装置は、ユーザが所望の特定のネットワーク機器を制御するのに十分な情報を提供したと認識し、ビデオテープレコーダを再生状態にする。ステップS4において、音声装置は、ネットワークを介して、ユーザの答えに対応するユーザネットワークコマンドを、ビデオテープレコーダのアドレスに送信する。ビデオテープレコーダは、このユーザネットワークコマンドを受信し、所望の動作を行おうとする。ここでは、ビデオテープレコーダは、カセットを検出することができず、再生状態にできないため、ステップS5において、ビデオテープレコーダは、エラーIDであるXを、音声装置のアドレスに送信する。音声装置は、このエラーメッセージを受信し、認識して、ステップS6において、対応するメッセージ「ビデオテープレコーダの中にカセットがありません」をユーザに対して出力する。
【0055】
音声装置は、ネットワークに接続されているすべてのネットワーク機器や、1人以上のユーザを含めて、ネットワークの間のインタフェースとして機能している。ユーザがネットワークの領域にいる場合、そして、ネットワークの状態を認識し、伝えることのできる音声装置が、適切なユーザネットワークコマンドが作られているか、そうでなければ、適切な対応するユーザネットワークコマンドを作るのに必要なメッセージ又は音声コマンドを送信するようにユーザに要求するメッセージを、ユーザに送信するか、のいずれかがなされているか確認している場合、ユーザは、ネットワークに接続されている音声装置に対して、音声コマンドを発すればよい。
【0056】
音声装置は、ネットワークに接続されている機器が、新しい機能を読み込んで、認識していくのを、常に監視している必要がある。すなわち、音声装置は、ネットワークに接続されている機器が、新しい音声制御機能を持つことを、監視している。音声装置はまた、機器がネットワークから外されることも、監視している必要がある。
【0057】
図15は、このような監視のプロセスにおけるユーザ、音声装置及びネットワーク機器間のプロトコルを示す図である。ステップS1において、音声装置は、ネットワークに接続されているネットワーク機器の機器アドレスに対して、その機器の名称及び機種を含むIDを送信するように要求するメッセージを送信する。この時点では、このネットワーク機器を音声で制御することはできない。その機器が、音声装置からのID送信の要求を受信すると、ステップS2において、その機器は、音声装置のアドレスにIDを送信する。ステップS3において、音声装置は、その機器のアドレスに対して、その機器のユーザネットワークコマンドのリストを送信するように要求するメッセージを送信する。その機器がこのメッセージを受信すると、ステップS4において、その機器は、音声装置に対して、その機器のユーザネットワークコマンドのリストを送信する。音声装置は、そのユーザネットワークコマンドのリストを受信し、語彙を、その機器から受け取った語彙及び文法に更新する。ステップS5において、音声装置は、その機器のアドレスに、領収の確認メッセージを送信する。この時点で、ユーザは、音声でその機器を制御することができる。ステップS6において、音声装置は、新しい音声制御機能を搭載した機器が利用可能であるということをユーザに対して通知する。
【0058】
図16は、新しい機器が追加されたときのユーザ、音声装置及びネットワーク機器間のプロトコル(初期化プロトコル)を示す図である。新しい機器がネットワークに接続された場合、新しい機器は、音声装置に対して、新しい音声制御機能を提供することを知らせる。ステップS1において、音声装置は、新しい機器に対して、ネットワークアドレス、名称、機種を含むIDを送信するように要求する。ステップS2において、その新しい機器は、音声装置に、そのIDを送信する。ステップS3において、音声装置は、その機器に対して、ユーザネットワークコマンドのリストを送信するように要求する。ステップS4において、その機器は、音声装置に対して、ユーザネットワークコマンドのリストを送信する。ステップS5において、音声装置は、ユーザに対して、その新しく接続された機器に論理名を付けるように要求する。ステップS6において、ユーザは、その新しく接続された機器の論理名を付け、それをタイプするか、又は書いて、音声装置がそれを受信できるようにする。当然ながら、ユーザは、その新しい名前を音声で発するだけでもよい。音声装置は、ユーザから論理名を受信して、その機器の語彙及び文法を更新する。ステップS7において、音声装置は、新しくネットワークに接続されたそのIEEE1394規格に準拠した機器に対して、領収の確認メッセージを送信する。この時点で、ユーザは、この新しい機器を音声で制御できる。
【0059】
機器から音声装置に送るユーザネットワークコマンドのリストは、適切なユーザネットワークコマンドに対応する音声コマンドの文字列のみでもよいし、又は、これらの音声コマンドの文字列に、例えば発音記号などの、発音情報を付加してもよい。後者の場合、音声装置には、新しいユーザネットワークコマンドが付加される。ユーザネットワークコマンドのリストに、音声コマンドの文字列のみが入れられていて、発音記号が入れられていなかった場合、ソフトウエア部15fに内蔵されている文字素/音素変換部が、その文字列に対して、発音と、他の発音の仕方とを作り出し、ユーザネットワークコマンドのリストを完成させる。その機器の語彙及び文法が更新されると、ユーザは、その新しい機器を音声で制御できるようになる。
【0060】
もし、新しく接続された機器と音声装置との間に、このような相互のやりとりが行われないと、音声装置に記憶されている初期の語彙で構成されるユーザネットワークコマンドの中で、その新しい機器が有しているユーザネットワークコマンドのみによる基本的な機能だけが使用可能になる。他の機器用のユーザネットワークコマンドを、新しい機器に適応させることは可能だが、この方法では、完全に音声によって制御できるかどうかは、保証されない。したがって、新しい機器がネットワークにアクセスを持つには、音声装置は、その機器のIDを認識している必要があるので、音声装置と、その機器と、他の機器との間で、その機器のIDについてのやりとりが行われる必要がある。
【0061】
例えば、コンパクトディスク(以下、CDという。)の名前、曲のタイトル、映画のタイトル、又は放送局の名前等の記録媒体の名前を含むコマンドには、一部音声装置が認識していない語彙が含まれている。したがって、音声装置は、この認識していない情報を、他の情報源から獲得しなければならない。この分野の従来技術では、ユーザは、この情報をタイプするか、又は書くかして入力している。一方、本発明を適用した音声装置では、上述したようなプロセスで、語彙及び文法を入力することができる。記録媒体に関する情報の文字列及び/又は発音は、次のような方法で、入手することができる。
【0062】
・データベースから、例えば、CD−ROMのようなある記録媒体に情報を獲得する。
【0063】
・例えば、CD、装置基本制御ブロック(DVB)等の記録媒体自体が、その詳細及びその発音を有しており、ここから情報を獲得する。例えば、CDに歌手の名前及び曲のタイトルが記憶されていて、読み出し可能である。
【0064】
・例えば、インターネット、個別アドレスビーコンシステム(以下、DABという。)、ホームネットワーク、電話網等の情報伝達装置を介してアクセスしたデータベースから情報を獲得する。
【0065】
なお、これらの方法の他に、ユーザは、情報をタイプするか、又は書くかして入力してもよい。
【0066】
例えば、新しいCDが初めてプレーヤに挿入されたり、プログラムを入手できる装置がバスに接続された場合に、音声装置又はそれに変わる装置は、ホームネットワークに接続されているすべての機器に対して、新しい記録媒体又はプログラムの情報を送信するように要求するための、情報検索要求を出す。その後、ネットワークに接続されている機器のいずれかから、この要求に対する回答がある可能性がある。可能性のある機器は、例えば次のような機器である。
【0067】
・例えば、ディスクのジュークボックスに入っているCD−ROM、テープの内容を知らせるビデオテーププレーヤ、PC等上でユーザが入力したデータベース、番組の名前などによってチャンネルを知らせるセットトップボックス等、送られてきたデータベースを読み込むことができる機器。
【0068】
・例えば、WEB−TV、セットトップボックス、DABレシーバ、PC等、他の情報伝達装置に接続されている機器であり、少なくとも時々インターネットに接続されているか、又は、番組情報又は他の情報を持つシステムと接続するためのモデムを有している機器。
【0069】
・例えば、頻繁に再生される曲の名前は何か、現在見ている番組は何か等の質問をユーザに尋ねる等、内容についての質問をしたり、また、ユーザが記録媒体を新しく購入して、タイプするか、書くか、発話するかによって、そのタイトルを入力したい場合に、ユーザと対話したりして、ユーザとやりとりする機器。
【0070】
図17は、複数の機器が記録媒体の内容に関する語彙を付加することに関する複数の機器及び音声装置間のプロトコルを示す図である。最初の時点では、情報は、音声装置からも、記録媒体を入れている機器からも送信されない。新しい記録媒体がプレーヤに初めて挿入されると、ステップS1において、プレーヤは、記録媒体Xを挿入したという通知の情報を、音声装置に送信する。ステップS2において、音声装置は、そのプレーヤと、ネットワークに接続されている他の全ての機器に対して、制御ネットワークコマンドを用いて、記録媒体Xの情報を送信するように要求するメッセージを送信する。この時点では、この要求に対して、複数の機器からの回答がある可能性がある。ステップS3において、ネットワークに接続されている機器のうちのいずれか1台が、音声装置に対して、記録媒体Xに関する情報を送信する。音声装置は、その語彙を更新し、ステップS4において、そのプレーヤと、記録媒体Xに関する情報を送信した機器に対して、領収の確認メッセージを送信する。この時点で、ユーザは、例えば、「チャイコフスキーピアノコンチェルトロ短調を再生せよ。」などの音声コマンドによって、その記録媒体の内容にアクセスすることができる。
【0071】
図18は、複数の機器が記録媒体の内容に関する語彙を付加することに関する複数の機器及び音声装置間のプロトコルの他の例を示す図である。この例では、2台の機器が、要求に回答している。第1の回答が、語彙の更新に選択され、第2の回答は、破棄されている。
【0072】
新しい記録媒体がプレーヤに初めて挿入されると、ステップS1において、プレーヤは、記録媒体Xを挿入したという通知の情報を、音声装置に送信する。ステップS2において、音声装置は、そのプレーヤと、ネットワークに接続されている他の全ての機器に対して、記録媒体Xの情報を制御ネットワークコマンド形式で送信するように要求するメッセージを送信する。この時点では、この要求に対して、複数の機器からの回答がある可能性がある。この例では、そのプレーヤに記録媒体Xの情報が入っているので、ステップS3において、そのプレーヤが、音声装置に対して、記録媒体Xに関する情報を送信する。音声装置は、その語彙及び/又は文法を更新し、ステップS4において、そのプレーヤと、記録媒体Xに関する情報を送信した機器に対して、領収の確認メッセージを送信する。ステップS5において、他の機器が記録媒体Xに関する情報を送信するが、音声装置は、この情報を破棄する。
【0073】
遠隔制御可能なネットワーク機器のユーザネットワークコマンド及びそれに対応する語彙及び/又は文法は、CD−ROM等の記録媒体に入れられているデータベースや、インターネットページのようなインターネットに記憶されているデータベースや、又は、デジタル放送によって伝送されるデータベースに記憶されている場合もある。例えば、新しい機器20がネットワークに接続される時や、ユーザが語彙を更新する時に、その記録媒体の情報は、音声装置10によってダウンロードされる。このような機器自体が、この情報をメモリに持っている必要はなく、この情報は、他の機器20が読み込めるデータ媒体に伝送され、その機器に送られる。又は、この情報は、インターネット又はデジタル放送を介して、その機器の製造元から提供される。
【0074】
【発明の効果】
本発明に係る音声装置は、マイクロホンからのユーザの音声信号を認識する音声認識手段と、ネットワークを介して遠隔制御可能なネットワーク機器から、ネットワーク機器の記憶部又はネットワーク機器に挿入された記録媒体固有の語彙及び/又は文法と、語彙及び/又は文法に基づくユーザネットワークコマンドとを受信するための通信制御ネットワークコマンドをネットワーク機器に送信するとともに、ネットワーク機器からその機器の種類を示すデータを受信し、受信した語彙及び/又は文法、及びユーザネットワークコマンドと、機器の種類を示すデータとを対応させて、ネットワーク機器の種類に対応したユーザネットワークコマンドを生成する制御手段と、受信した語彙及び/又は文法、及びユーザネットワークコマンドを記憶する記憶手段とを備え、制御手段は、音声認識手段からの音声信号を記憶手段に記憶された語彙及び/又は文法に基づいて認識解読して、対応するユーザネットワークコマンドを記憶手段から読み出してネットワーク機器に送信する。
【0075】
また、本実施の形態に係る遠隔制御可能なネットワーク機器は、音声装置から、音声入力に対応するユーザネットワークコマンドをネットワークを介して受信して、ネットワークコマンドに基づいてその機能を制御する制御手段を備え、制御手段は、ネットワーク機器がネットワークに接続されたときに、音声装置から通信制御ネットワークコマンドを受信して、ネットワーク機器固有のユーザネットワークコマンド、及び語彙及び/又は文法をネットワークを介して音声装置に送信する。
【0076】
これにより、1つの音声装置を用いて、複数のネットワーク機器を制御することができ、ネットワークシステム全体のコストを低減することができる。
【図面の簡単な説明】
【図1】 本発明を適用した音声装置の具体的な構成を示すブロック図である。
【図2】 本発明を適用したネットワーク機器の具体的な構成を示すブロック図である。
【図3】 IEEE1394シリアルバスを用いたネットワークの形態の一例を示す図である。
【図4】 IEEE1394シリアルバスを用いたネットワークの形態の他の例を示す図である。
【図5】 ネットワークの形態の一例を示す図である。
【図6】 ネットワークの形態の他の例を示す図である。
【図7】 ネットワークの形態の他の例を示す図である。
【図8】 3つの部屋から成るホームネットワークの一例を示す図である。
【図9】 音声装置を介してネットワーク機器を遠隔制御する一例を示す図である。
【図10】 音声装置を介してネットワーク機器を遠隔制御する他の例を示す図である。
【図11】 ビデオテープレコーダのプログラミングにおける、音声システムとユーザとの対話の文法を、一部例示した図である。
【図12】 ビデオテープレコーダのプログラミングにおける、音声システムとユーザとの対話の文法に対応する一連の語の文法を示す図である。
【図13】 ビデオテープレコーダのプログラミングにおける、一連の語の文法に対応する語彙を示す図である。
【図14】 ユーザ、音声装置及びネットワーク機器の間のやりとりのプロトコルの一例を示す図である。
【図15】 音声装置が、ネットワーク機器が読込及び認識した新しい機能を学習するプロセスの一例を示す図である。
【図16】 音声装置が新しい機器を初期化する一例を示す図である。
【図17】 複数の機器による、記録媒体の内容に関する語彙を付加することに関するやりとりの一例を示す図である。
【図18】 複数の機器による、記録媒体の内容に関する語彙を付加することに関するやりとりの他の例を示す図である。
【符号の説明】
1 マイクロホン、2 ラウドスピーカ、3 ホームネットワーク、10 音声装置、11 DSP、11a 音声認識部、12 CPU、13 リンクレイヤ制御部、14 I/F物理レイヤ部、15 メモリ、15a 初期語彙部、15b 付加語彙部、15c 初期文法部、15d 付加文法部、15e 特徴抽出部、15f ソフトウェア部、16 メモリ、17 DSP、17a 音声合成・生成部

Claims (14)

  1. マイクロホンからのユーザの音声信号を認識する音声認識手段と、
    ネットワークを介して遠隔制御可能なネットワーク機器から、該ネットワーク機器の記憶部又は該ネットワーク機器に挿入された記録媒体固有の語彙及び/又は文法と、該語彙及び/又は文法に基づくユーザネットワークコマンドとを受信するための通信制御ネットワークコマンドを該ネットワーク機器に送信するとともに、該ネットワーク機器からその機器の種類を示すデータを受信し、受信した該語彙及び/又は文法、及び該ユーザネットワークコマンドと、該機器の種類を示すデータとを対応させて、該ネットワーク機器の種類に対応したユーザネットワークコマンドを生成する制御手段と、
    受信した上記語彙及び/又は文法、及びユーザネットワークコマンドを記憶する記憶手段とを備え、
    上記制御手段は、上記音声認識手段からの音声信号を上記記憶手段に記憶された語彙及び/又は文法に基づいて認識解読して、対応するユーザネットワークコマンドを上記記憶手段から読み出して上記ネットワーク機器に送信する音声装置。
  2. 新たなネットワーク機器がネットワークに接続されたとき及び/又はネットワーク機器に新たな記録媒体が挿入されたときに、上記通信制御ネットワークコマンドを該ネットワーク機器に送信する請求項1記載の音声装置。
  3. 上記ユーザネットワークコマンド及び上記通信制御ネットワークコマンドを、ネットワークを介して上記ネットワーク機器に送信するとともに、該ネットワーク機器から該ネットワークを介してデータ及びメッセージを受信するインタフェースを備える請求項1又は2に記載の音声装置。
  4. 上記ネットワークは、有線又は無線のネットワークである請求項1乃至3のいずれか1項に記載の音声装置。
  5. 上記音声認識手段は、上記マイクロホンからの複数のユーザの音声信号に基づいて、個々のユーザを識別し、上記制御手段は、個々のユーザに適用されるユーザ固有のユーザネットワークコマンドを生成する請求項1乃至4のいずれか1項に記載の音声装置。
  6. 上記ネットワーク機器及び当該音声装置からのメッセージを、音声信号に合成して、ラウドスピーカに出力する音声合成手段を備える請求項1乃至5のいずれか1項に記載の音声装置。
  7. 上記マイクロホン及び/又はラウドスピーカを内蔵する請求項に記載の音声装置。
  8. 上記マイクロホン及び/又はラウドスピーカは、有線又は無線で当該音声装置に接続されている請求項に記載の音声装置。
  9. 上記インタフェースは、公衆電話ネットワークを介して、上記ネットワークに接続している請求項に記載の音声装置。
  10. 上記インタフェースは、インターネットネットワークを介して、上記ネットワークに接続している請求項に記載の音声装置。
  11. 上記ネットワークは、IEEE1394シリアルバスである請求項1乃至10のいずれか1項に記載の音声装置。
  12. ネットワーク機器に接続された音声装置の自己初期化方法において、
    ネットワークを介して遠隔制御可能なネットワーク機器から、該ネットワーク機器の記憶部又は該ネットワーク機器に挿入された記録媒体固有の語彙及び/又は文法と、該語彙及び/又は文法に基づくユーザネットワークコマンドとを受信するための通信制御ネットワークコマンドを、該ネットワーク機器に送信するステップと、
    上記ネットワーク機器から送られてくる語彙及び/又は文法、及びユーザネットワークコマンドを受信するステップと、
    上記ネットワーク機器に論理名又は識別子の送信を要求するステップと、
    上記ネットワーク機器から送られてくる論理名又は識別子を受信するステップと、
    受信した上記語彙及び/又は文法、及びユーザネットワークコマンドと、上記論理名又は識別子とを対応させて、上記ネットワーク機器固有のユーザネットワークコマンドを生成し、内蔵のメモリに記憶している語彙及び/又は文法、及びユーザネットワークコマンドを、受信した語彙及び/又は文法、及びユーザネットワークコマンドによって更新するステップと
    を有する音声装置の自己初期化方法。
  13. 上記ネットワーク機器の論理名は、ユーザ又は上記ネットワーク機器自体のいずれかによって決定される請求項12に記載の音声装置の自己初期化方法。
  14. 上記識別子は、上記ネットワークにおけるネットワーク機器のアドレス及び名前を含む請求項12又は13に記載の音声装置の自己初期化方法。
JP32005198A 1997-10-23 1998-10-23 音声装置及び音声装置の自己初期化方法 Expired - Fee Related JP4295846B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP97118470.0 1997-10-23
EP97118470A EP0911808B1 (en) 1997-10-23 1997-10-23 Speech interface in a home network environment

Publications (2)

Publication Number Publication Date
JPH11311996A JPH11311996A (ja) 1999-11-09
JP4295846B2 true JP4295846B2 (ja) 2009-07-15

Family

ID=8227517

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32005198A Expired - Fee Related JP4295846B2 (ja) 1997-10-23 1998-10-23 音声装置及び音声装置の自己初期化方法

Country Status (4)

Country Link
US (1) US6535854B2 (ja)
EP (1) EP0911808B1 (ja)
JP (1) JP4295846B2 (ja)
DE (1) DE69712485T2 (ja)

Families Citing this family (357)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020002039A1 (en) * 1998-06-12 2002-01-03 Safi Qureshey Network-enabled audio device
US20050261907A1 (en) 1999-04-12 2005-11-24 Ben Franklin Patent Holding Llc Voice integration platform
US6408272B1 (en) * 1999-04-12 2002-06-18 General Magic, Inc. Distributed voice user interface
EP1045374B1 (en) * 1999-04-13 2010-08-11 Sony Deutschland GmbH Merging of speech interfaces for concurrent use of devices and applications
GB9911971D0 (en) 1999-05-21 1999-07-21 Canon Kk A system, a server for a system and a machine for use in a system
EP1063636A3 (en) * 1999-05-21 2001-11-14 Winbond Electronics Corporation Method and apparatus for standard voice user interface and voice controlled devices
US6584439B1 (en) 1999-05-21 2003-06-24 Winbond Electronics Corporation Method and apparatus for controlling voice controlled devices
US7283964B1 (en) 1999-05-21 2007-10-16 Winbond Electronics Corporation Method and apparatus for voice controlled devices with improved phrase storage, use, conversion, transfer, and recognition
ATE253764T1 (de) * 1999-06-21 2003-11-15 Palux Ag Einrichtung zur steuerung von automaten
US20020023123A1 (en) * 1999-07-26 2002-02-21 Justin P. Madison Geographic data locator
JP4314680B2 (ja) 1999-07-27 2009-08-19 ソニー株式会社 音声認識制御システム及び音声認識制御方法
AU6630800A (en) 1999-08-13 2001-03-13 Pixo, Inc. Methods and apparatuses for display and traversing of links in page character array
NL1012860C2 (nl) * 1999-08-19 2001-02-20 Nedap Nv Boerderijautomatiseringssysteem.
US6330537B1 (en) * 1999-08-26 2001-12-11 Matsushita Electric Industrial Co., Ltd. Automatic filtering of TV contents using speech recognition and natural language
US6513006B2 (en) * 1999-08-26 2003-01-28 Matsushita Electronic Industrial Co., Ltd. Automatic control of household activity using speech recognition and natural language
US6553345B1 (en) * 1999-08-26 2003-04-22 Matsushita Electric Industrial Co., Ltd. Universal remote control allowing natural language modality for television and multimedia searches and requests
DE29915685U1 (de) * 1999-09-07 2000-01-13 Siemens AG, 80333 München Schalteinrichtung
EP1083545A3 (en) * 1999-09-09 2001-09-26 Xanavi Informatics Corporation Voice recognition of proper names in a navigation apparatus
DE19943875A1 (de) 1999-09-14 2001-03-15 Thomson Brandt Gmbh System zur Sprachsteuerung mit einem Mikrofonarray
DE19944325A1 (de) * 1999-09-15 2001-03-22 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Spracherkennung
JP4065381B2 (ja) 1999-11-10 2008-03-26 ヤフー! インコーポレイテッド インターネットラジオ及びブロードキャスト方法
US7013283B1 (en) * 1999-11-17 2006-03-14 Sarnoff Corporation System and method for providing programming content in response to an audio signal
US6526382B1 (en) 1999-12-07 2003-02-25 Comverse, Inc. Language-oriented user interfaces for voice activated services
US6389467B1 (en) 2000-01-24 2002-05-14 Friskit, Inc. Streaming media search and continuous playback system of media resources located by multiple network addresses
DE10003779A1 (de) * 2000-01-28 2001-09-27 Majchrzyk Horacek Matthias Sprachsteuerungssystem und Verfahren
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7096185B2 (en) 2000-03-31 2006-08-22 United Video Properties, Inc. User speech interfaces for interactive media guidance applications
JP2003529864A (ja) * 2000-04-04 2003-10-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ インターネット経由の家庭内ネットワークへのアクセス
JP2001296881A (ja) * 2000-04-14 2001-10-26 Sony Corp 情報処理装置および方法、並びに記録媒体
US20070078552A1 (en) * 2006-01-13 2007-04-05 Outland Research, Llc Gaze-based power conservation for portable media players
DE10021389A1 (de) * 2000-05-03 2001-11-08 Nokia Mobile Phones Ltd Verfahren zum Steuern eines Systems, insbesondere eines elektrischen und/oder elektronischen Systems mit zumindest einer Anwendungseinrichtung
US7024485B2 (en) * 2000-05-03 2006-04-04 Yahoo! Inc. System for controlling and enforcing playback restrictions for a media file by splitting the media file into usable and unusable portions for playback
US7162482B1 (en) * 2000-05-03 2007-01-09 Musicmatch, Inc. Information retrieval engine
US7251665B1 (en) 2000-05-03 2007-07-31 Yahoo! Inc. Determining a known character string equivalent to a query string
US8352331B2 (en) 2000-05-03 2013-01-08 Yahoo! Inc. Relationship discovery engine
US6654720B1 (en) 2000-05-09 2003-11-25 International Business Machines Corporation Method and system for voice control enabling device in a service discovery network
JP2001319045A (ja) 2000-05-11 2001-11-16 Matsushita Electric Works Ltd 音声マンマシンインタフェースを用いたホームエージェントシステム、及びプログラム記録媒体
DE60039076D1 (de) * 2000-06-26 2008-07-10 Mitsubishi Electric Corp System zum Betreiben eines Gerätes
WO2002005264A1 (de) * 2000-07-07 2002-01-17 Siemens Aktiengesellschaft Sprachgesteuerte anordnung und verfahren zur spracheingabe und -erkennung
JP2002116787A (ja) * 2000-07-10 2002-04-19 Matsushita Electric Ind Co Ltd 優先順位決定装置、優先順位決定方法及び優先順位決定プログラム
DE10196421T5 (de) * 2000-07-11 2006-07-13 Launch Media, Inc., Santa Monica Online Playback-System mit Gemeinschatsausrichtung
EP1305791A1 (en) * 2000-07-21 2003-05-02 Koninklijke Philips Electronics N.V. Speech control over a plurality of devices
GB2365145A (en) * 2000-07-26 2002-02-13 Canon Kk Voice control of a machine
JP2002062894A (ja) * 2000-08-17 2002-02-28 Daiichikosho Co Ltd 音声認識リモコン機能付きワイヤレスマイクロホン
EP1184841A1 (de) * 2000-08-31 2002-03-06 Siemens Aktiengesellschaft Sprachgesteuerte Anordnung und Verfahren zur Spracheingabe und -erkennung
WO2002021512A1 (en) * 2000-09-07 2002-03-14 Koninklijke Philips Electronics N.V. Voice control and uploadable user control information
WO2002023389A1 (en) * 2000-09-15 2002-03-21 Robert Fish Systems and methods for translating an item of information using a distal computer
GB0025331D0 (en) 2000-10-16 2000-11-29 Canon Kk Control apparatus
US8271333B1 (en) 2000-11-02 2012-09-18 Yahoo! Inc. Content-related wallpaper
US6963838B1 (en) * 2000-11-03 2005-11-08 Oracle International Corporation Adaptive hosted text to speech processing
US7653691B2 (en) * 2000-11-15 2010-01-26 Pacific Datavision Inc. Systems and methods for communicating using voice messages
US7054863B2 (en) * 2000-11-15 2006-05-30 Pacific Datavision, Inc. System and method for originating, storing, processing and delivering message data
GB0028732D0 (en) * 2000-11-24 2001-01-10 Nokia Oy Ab Improvements in and relating to a broadcast network
JP3838029B2 (ja) * 2000-12-18 2006-10-25 セイコーエプソン株式会社 音声認識を用いた機器制御方法および音声認識を用いた機器制御システム
JP4109414B2 (ja) * 2000-12-18 2008-07-02 セイコーエプソン株式会社 音声認識を用いた機器制御方法および音声認識を用いた機器制御システムならびに音声認識を用いた機器制御プログラムを記録した記録媒体
US8949902B1 (en) 2001-02-06 2015-02-03 Rovi Guides, Inc. Systems and methods for providing audio-based guidance
US7406529B2 (en) * 2001-02-09 2008-07-29 Yahoo! Inc. System and method for detecting and verifying digitized content over a computer network
DE10109156C2 (de) * 2001-02-24 2003-01-09 Diehl Ako Stiftung Gmbh & Co Intelligente Haushaltsgrossgeräte
US20020169597A1 (en) * 2001-03-12 2002-11-14 Fain Systems, Inc. Method and apparatus providing computer understanding and instructions from natural language
JP2002297185A (ja) * 2001-03-29 2002-10-11 Pioneer Electronic Corp 情報処理装置および情報処理方法
US7698228B2 (en) * 2001-04-27 2010-04-13 Accenture Llp Tracking purchases in a location-based services system
US7970648B2 (en) * 2001-04-27 2011-06-28 Accenture Global Services Limited Advertising campaign and business listing management for a location-based services system
US6848542B2 (en) * 2001-04-27 2005-02-01 Accenture Llp Method for passive mining of usage information in a location-based services system
US7437295B2 (en) * 2001-04-27 2008-10-14 Accenture Llp Natural language processing for a location-based services system
US6944447B2 (en) * 2001-04-27 2005-09-13 Accenture Llp Location-based services
US7574513B2 (en) 2001-04-30 2009-08-11 Yahoo! Inc. Controllable track-skipping
US7023975B2 (en) * 2001-08-14 2006-04-04 Sharp Laboratories Of America, Inc. Privacy mode system and method for home network telephone
US7324947B2 (en) * 2001-10-03 2008-01-29 Promptu Systems Corporation Global speech user interface
US20030069734A1 (en) * 2001-10-05 2003-04-10 Everhart Charles Allen Technique for active voice recognition grammar adaptation for dynamic multimedia application
JP2003122847A (ja) * 2001-10-11 2003-04-25 Sanyo Electric Co Ltd 健康管理支援システム及びペット型健康管理支援端末
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
CA2410114C (en) * 2001-10-26 2011-07-19 Research In Motion Limited System and method for remotely controlling mobile communication devices
JP4240874B2 (ja) * 2001-11-09 2009-03-18 日本電気株式会社 情報提供システム、情報端末、情報提供装置、判定装置及びそれらに用いるプログラム並びに情報提供方法
EP1315147A1 (en) * 2001-11-27 2003-05-28 Sony International (Europe) GmbH Method for processing user requests with respect to a network of electronic devices
DE10159850A1 (de) * 2001-12-06 2003-11-06 Siemens Ag Bedienung von Endgeräten
EP1466307A1 (en) * 2002-01-08 2004-10-13 Philips Electronics N.V. Controlling application devices simultaneously
US20030163324A1 (en) * 2002-02-27 2003-08-28 Abbasi Asim Hussain System and method for voice commands recognition and controlling devices wirelessly using protocol based communication
KR100434545B1 (ko) * 2002-03-15 2004-06-05 삼성전자주식회사 홈네트워크로 연결된 가전기기들을 제어하는 방법 및 장치
US6895379B2 (en) * 2002-03-27 2005-05-17 Sony Corporation Method of and apparatus for configuring and controlling home entertainment systems through natural language and spoken commands using a natural language server
JP3715584B2 (ja) * 2002-03-28 2005-11-09 富士通株式会社 機器制御装置および機器制御方法
US7707221B1 (en) 2002-04-03 2010-04-27 Yahoo! Inc. Associating and linking compact disc metadata
AU2003212587A1 (en) * 2002-04-08 2003-10-20 Koninklijke Philips Electronics N.V. Controlling an apparatus based on speech
FR2838278B1 (fr) * 2002-04-08 2004-08-13 France Telecom Terminal mobile multimedia et procede de telecommande d'une passerelle domestique au moyen d'un tel terminal
US7305483B2 (en) 2002-04-25 2007-12-04 Yahoo! Inc. Method for the real-time distribution of streaming data on a network
US20030210774A1 (en) * 2002-05-08 2003-11-13 Wanderlich Ronald E. System and method for simultaneous communication and apparatus activation and control
DE10229388A1 (de) * 2002-06-26 2004-01-15 Deutsche Telekom Ag Multimediales System
US7184960B2 (en) * 2002-06-28 2007-02-27 Intel Corporation Speech recognition command via an intermediate mobile device
JP4398144B2 (ja) * 2002-12-24 2010-01-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体
EP1478154A1 (en) * 2003-05-14 2004-11-17 Sony International (Europe) GmbH Method for serving user requests
WO2005004031A1 (en) * 2003-07-02 2005-01-13 Philips Intellectual Property & Standards Gmbh Method of entering a security code for a network apparatus
US20050035855A1 (en) * 2003-08-11 2005-02-17 Visteon Global Technologies, Inc. Voice command system for remote control and monitoring of home networked devices
US7672873B2 (en) * 2003-09-10 2010-03-02 Yahoo! Inc. Music purchasing and playing system and method
DE112004002282D2 (de) * 2003-09-16 2006-08-10 Ip2H Ag Verteilte Steuerung von unterschiedlichen Heimnetzgeräten
US7552221B2 (en) 2003-10-15 2009-06-23 Harman Becker Automotive Systems Gmbh System for communicating with a server through a mobile communication device
TWI234961B (en) * 2003-11-25 2005-06-21 Kye Systems Corp Control apparatus of household appliances for use in the wireless network
DE602004016683D1 (de) * 2003-12-05 2008-10-30 Kenwood Corp Einrichtungssteuereinrichtung und einrichtungssteuerverfahren
DE602004016681D1 (de) * 2003-12-05 2008-10-30 Kenwood Corp Audioeinrichtungs-steuereinrichtung, audioeinrichtungs-steuerverfahren und programm
US20050193092A1 (en) * 2003-12-19 2005-09-01 General Motors Corporation Method and system for controlling an in-vehicle CD player
EP1555652B1 (en) * 2004-01-19 2007-11-14 Harman Becker Automotive Systems GmbH Activation of a speech dialogue system
ATE415684T1 (de) 2004-01-29 2008-12-15 Harman Becker Automotive Sys Verfahren und system zur sprachdialogschnittstelle
EP1560199B1 (en) 2004-01-29 2008-07-09 Harman Becker Automotive Systems GmbH Multimodal data input
JP4581441B2 (ja) * 2004-03-18 2010-11-17 パナソニック株式会社 家電機器システム、家電機器および音声認識方法
JP2005286426A (ja) * 2004-03-26 2005-10-13 Sharp Corp ホームネットワークサーバ、デジタル放送番組配信方法、無線端末、ホームネットワークシステム、プログラム、および記録媒体
US20060041926A1 (en) * 2004-04-30 2006-02-23 Vulcan Inc. Voice control of multimedia content
FR2871978B1 (fr) * 2004-06-16 2006-09-22 Alcatel Sa Procede de traitement de signaux sonores pour un terminal de communication et terminal de communication mettant en oeuvre ce procede
WO2006016307A1 (en) * 2004-08-06 2006-02-16 Philips Intellectual Property & Standards Gmbh Ontology-based dialogue system with application plug-and-play and information sharing
JP3824168B2 (ja) * 2004-11-08 2006-09-20 松下電器産業株式会社 ディジタル映像再生装置
US8942985B2 (en) * 2004-11-16 2015-01-27 Microsoft Corporation Centralized method and system for clarifying voice commands
US7778821B2 (en) 2004-11-24 2010-08-17 Microsoft Corporation Controlled manipulation of characters
TWI269268B (en) * 2005-01-24 2006-12-21 Delta Electronics Inc Speech recognizing method and system
US20060194181A1 (en) * 2005-02-28 2006-08-31 Outland Research, Llc Method and apparatus for electronic books with enhanced educational features
US8041570B2 (en) 2005-05-31 2011-10-18 Robert Bosch Corporation Dialogue management using scripts
WO2007008248A2 (en) * 2005-07-11 2007-01-18 Voicedemand, Inc. Voice control of a media player
US7438414B2 (en) 2005-07-28 2008-10-21 Outland Research, Llc Gaze discriminating electronic control apparatus, system, method and computer program product
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
US20070003913A1 (en) * 2005-10-22 2007-01-04 Outland Research Educational verbo-visualizer interface system
US7429108B2 (en) * 2005-11-05 2008-09-30 Outland Research, Llc Gaze-responsive interface to enhance on-screen user reading tasks
US20070040033A1 (en) * 2005-11-18 2007-02-22 Outland Research Digital mirror system with advanced imaging features and hands-free control
CN101326571B (zh) * 2005-12-07 2012-05-23 三菱电机株式会社 声音识别装置
DE102005059630A1 (de) * 2005-12-14 2007-06-21 Bayerische Motoren Werke Ag Verfahren zur Erzeugung von Sprachmustern für eine sprachgesteuerte Senderwahl
US20090222270A2 (en) * 2006-02-14 2009-09-03 Ivc Inc. Voice command interface device
US7925975B2 (en) 2006-03-10 2011-04-12 Microsoft Corporation Searching for commands to execute in applications
US7626572B2 (en) * 2006-06-15 2009-12-01 Microsoft Corporation Soap mobile electronic human interface device
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US20080133974A1 (en) * 2006-11-30 2008-06-05 Kestrelink Corporation Media player test fixture
US20080165195A1 (en) * 2007-01-06 2008-07-10 Outland Research, Llc Method, apparatus, and software for animated self-portraits
KR20080069841A (ko) * 2007-01-24 2008-07-29 삼성전자주식회사 홈 네트워크 통신 시스템
US20080262968A1 (en) * 2007-03-26 2008-10-23 Infosys Technologies Ltd. Software licensing control via mobile devices
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
CA2685947A1 (en) 2007-05-14 2008-11-27 Kopin Corporation Mobile wireless display for accessing data from a host and method for controlling
US8590028B2 (en) 2007-07-09 2013-11-19 Infosys Limited Content licensing and conditional access using a mobile device
US8825468B2 (en) * 2007-07-31 2014-09-02 Kopin Corporation Mobile wireless display providing speech to speech translation and avatar simulating human attributes
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8620662B2 (en) * 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8478578B2 (en) 2008-01-09 2013-07-02 Fluential, Llc Mobile speech-to-speech interpretation system
CN101493987B (zh) * 2008-01-24 2011-08-31 深圳富泰宏精密工业有限公司 手机声控遥控系统及方法
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8521235B2 (en) * 2008-03-27 2013-08-27 General Motors Llc Address book sharing system and method for non-verbally adding address book contents using the same
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US9202460B2 (en) * 2008-05-14 2015-12-01 At&T Intellectual Property I, Lp Methods and apparatus to generate a speech recognition library
US9077933B2 (en) 2008-05-14 2015-07-07 At&T Intellectual Property I, L.P. Methods and apparatus to generate relevance rankings for use by a program selector of a media presentation system
CN101600009A (zh) * 2008-06-04 2009-12-09 深圳富泰宏精密工业有限公司 无线控制装置及具有该控制装置的无线通信装置
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US10127231B2 (en) * 2008-07-22 2018-11-13 At&T Intellectual Property I, L.P. System and method for rich media annotation
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8265862B1 (en) 2008-08-22 2012-09-11 Boadin Technology, LLC System, method, and computer program product for communicating location-related information
US8078397B1 (en) 2008-08-22 2011-12-13 Boadin Technology, LLC System, method, and computer program product for social networking utilizing a vehicular assembly
US8131458B1 (en) 2008-08-22 2012-03-06 Boadin Technology, LLC System, method, and computer program product for instant messaging utilizing a vehicular assembly
US8073590B1 (en) 2008-08-22 2011-12-06 Boadin Technology, LLC System, method, and computer program product for utilizing a communication channel of a mobile device by a vehicular assembly
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
KR101057191B1 (ko) * 2008-12-30 2011-08-16 주식회사 하이닉스반도체 반도체 소자의 미세 패턴 형성방법
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8788256B2 (en) * 2009-02-17 2014-07-22 Sony Computer Entertainment Inc. Multiple language voice recognition
DE102009011395A1 (de) * 2009-03-03 2010-09-09 Rohde & Schwarz Gmbh & Co. Kg System zur sprachgesteuerten Steuerung von Messgeräten
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US20110110534A1 (en) * 2009-11-12 2011-05-12 Apple Inc. Adjustable voice output based on device status
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US8682667B2 (en) * 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8639516B2 (en) 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US20120059655A1 (en) * 2010-09-08 2012-03-08 Nuance Communications, Inc. Methods and apparatus for providing input to a speech-enabled application program
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US20150106089A1 (en) * 2010-12-30 2015-04-16 Evan H. Parker Name Based Initiation of Speech Recognition
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
CN202014321U (zh) 2011-03-21 2011-10-19 海尔集团公司 遥控器及电视机系统
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US20120310642A1 (en) 2011-06-03 2012-12-06 Apple Inc. Automatically creating a mapping between text data and audio data
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
US20130030789A1 (en) 2011-07-29 2013-01-31 Reginald Dalce Universal Language Translator
DE102011109932B4 (de) * 2011-08-10 2014-10-02 Audi Ag Verfahren zum Ansteuern funktioneller Einrichtungen in einem Fahrzeug bei Sprachbefehl-Bedienung
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
KR20130027665A (ko) * 2011-09-08 2013-03-18 삼성전자주식회사 휴대단말기의 홈 네트워크 서비스 제어장치 및 방법
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US8340975B1 (en) * 2011-10-04 2012-12-25 Theodore Alfred Rosenberger Interactive speech recognition device and system for hands-free building control
EP2665059B1 (en) * 2011-10-25 2016-02-10 Olympus Corporation Endoscope operation system
US9026441B2 (en) 2012-02-29 2015-05-05 Nant Holdings Ip, Llc Spoken control for user construction of complex behaviors
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9441847B2 (en) * 2012-03-19 2016-09-13 Wojciech Maciej Grohman System for controlling HVAC and lighting functionality
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
WO2013185109A2 (en) 2012-06-08 2013-12-12 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9288421B2 (en) * 2012-07-12 2016-03-15 Samsung Electronics Co., Ltd. Method for controlling external input and broadcast receiving apparatus
US8554559B1 (en) * 2012-07-13 2013-10-08 Google Inc. Localized speech recognition with offload
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
KR102091236B1 (ko) * 2012-09-28 2020-03-18 삼성전자 주식회사 전자기기 및 그 제어방법
KR101330671B1 (ko) 2012-09-28 2013-11-15 삼성전자주식회사 전자장치, 서버 및 그 제어방법
US9230560B2 (en) 2012-10-08 2016-01-05 Nant Holdings Ip, Llc Smart home automation systems and methods
US20150019229A1 (en) 2012-10-10 2015-01-15 Robert D. Fish Using Voice Commands To Execute Contingent Instructions
US10438591B1 (en) * 2012-10-30 2019-10-08 Google Llc Hotword-based speaker recognition
KR20140060040A (ko) 2012-11-09 2014-05-19 삼성전자주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법
US20140156281A1 (en) * 2012-12-03 2014-06-05 Qualcomm Incorporated Voice-controlled configuration of an automation system
US9165566B2 (en) 2013-01-24 2015-10-20 Microsoft Technology Licensing, Llc Indefinite speech inputs
KR102516577B1 (ko) 2013-02-07 2023-04-03 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US10078487B2 (en) 2013-03-15 2018-09-18 Apple Inc. Context-sensitive handling of interruptions
US11151899B2 (en) 2013-03-15 2021-10-19 Apple Inc. User training by intelligent digital assistant
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US9384751B2 (en) * 2013-05-06 2016-07-05 Honeywell International Inc. User authentication of voice controlled devices
US9472205B2 (en) * 2013-05-06 2016-10-18 Honeywell International Inc. Device voice recognition systems and methods
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
KR101959188B1 (ko) 2013-06-09 2019-07-02 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101809808B1 (ko) 2013-06-13 2017-12-15 애플 인크. 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
US10089976B2 (en) * 2013-10-14 2018-10-02 Honeywell International Inc. Building automation systems with voice control
DE102013019208A1 (de) * 2013-11-15 2015-05-21 Audi Ag Kraftfahrzeug-Sprachbedienung
US9215510B2 (en) 2013-12-06 2015-12-15 Rovi Guides, Inc. Systems and methods for automatically tagging a media asset based on verbal input and playback adjustments
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
EP3115905A4 (en) 2014-03-03 2017-10-25 Sony Corporation Information processing apparatus, information processing method, and program
CN105023575B (zh) * 2014-04-30 2019-09-17 中兴通讯股份有限公司 语音识别方法、装置和系统
US9860076B2 (en) * 2014-05-07 2018-01-02 Vivint, Inc. Home automation via voice control
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
CN105490890A (zh) * 2014-09-16 2016-04-13 中兴通讯股份有限公司 智能家庭终端及其控制方法
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
DE102014219763A1 (de) 2014-09-30 2016-03-31 Robert Bosch Gmbh Verfahren und Vorrichtung zur Inbetriebnahme eines Smart-Home-Gerätes
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9811312B2 (en) * 2014-12-22 2017-11-07 Intel Corporation Connected device voice command support
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10274911B2 (en) * 2015-06-25 2019-04-30 Intel Corporation Conversational interface for matching text of spoken input based on context model
CN106469040B (zh) 2015-08-19 2019-06-21 华为终端有限公司 通信方法、服务器及设备
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
KR102417682B1 (ko) * 2015-09-09 2022-07-07 삼성전자주식회사 음성 인식을 이용한 닉네임 관리 장치 및 방법
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
JP2016029495A (ja) * 2015-10-08 2016-03-03 パナソニックIpマネジメント株式会社 映像表示装置および映像表示方法
JP6710037B2 (ja) * 2015-10-23 2020-06-17 シャープ株式会社 通信装置
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10026401B1 (en) 2015-12-28 2018-07-17 Amazon Technologies, Inc. Naming devices via voice commands
US10484484B2 (en) 2016-02-05 2019-11-19 International Business Machines Corporation Context-aware task processing for multiple devices
US10044798B2 (en) 2016-02-05 2018-08-07 International Business Machines Corporation Context-aware task offloading among multiple devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US11176930B1 (en) * 2016-03-28 2021-11-16 Amazon Technologies, Inc. Storing audio commands for time-delayed execution
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
US9934784B2 (en) 2016-06-30 2018-04-03 Paypal, Inc. Voice data processor for distinguishing multiple voice inputs
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US9940390B1 (en) * 2016-09-27 2018-04-10 Microsoft Technology Licensing, Llc Control system using scoped search and conversational interface
US10229678B2 (en) 2016-10-14 2019-03-12 Microsoft Technology Licensing, Llc Device-described natural language control
JP6760394B2 (ja) 2016-12-02 2020-09-23 ヤマハ株式会社 コンテンツ再生機器、収音機器、及びコンテンツ再生システム
WO2018101458A1 (ja) * 2016-12-02 2018-06-07 ヤマハ株式会社 収音機器、コンテンツ再生機器、及びコンテンツ再生システム
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
WO2018140420A1 (en) 2017-01-24 2018-08-02 Honeywell International, Inc. Voice control of an integrated room automation system
US10013979B1 (en) * 2017-04-17 2018-07-03 Essential Products, Inc. Expanding a set of commands to control devices in an environment
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10984329B2 (en) 2017-06-14 2021-04-20 Ademco Inc. Voice activated virtual assistant with a fused response
US11069349B2 (en) * 2017-11-08 2021-07-20 Dillard-Apple, LLC Privacy-preserving voice control of devices
JP2019144790A (ja) * 2018-02-20 2019-08-29 富士ゼロックス株式会社 情報処理装置及びプログラム
US11314481B2 (en) 2018-03-07 2022-04-26 Google Llc Systems and methods for voice-based initiation of custom device actions
US11183182B2 (en) 2018-03-07 2021-11-23 Google Llc Systems and methods for voice-based initiation of custom device actions
US20190332848A1 (en) 2018-04-27 2019-10-31 Honeywell International Inc. Facial enrollment and recognition system
KR102714866B1 (ko) * 2018-05-08 2024-10-08 현대자동차주식회사 차량 단말에서의 IoT 기기 매칭 방법 및 이를 위한 차량 단말
US10832010B2 (en) * 2018-06-05 2020-11-10 International Business Machines Corporation Training of conversational agent using natural language
US20190390866A1 (en) 2018-06-22 2019-12-26 Honeywell International Inc. Building management system with natural language interface
US11627012B2 (en) 2018-10-09 2023-04-11 NewTekSol, LLC Home automation management system
JP7242248B2 (ja) * 2018-10-31 2023-03-20 キヤノン株式会社 電子機器、その制御方法、およびそのプログラム
CN111508483B (zh) * 2019-01-31 2023-04-18 北京小米智能科技有限公司 设备控制方法及装置
JP2021110768A (ja) * 2020-01-07 2021-08-02 ソニーグループ株式会社 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4974191A (en) * 1987-07-31 1990-11-27 Syntellect Software Inc. Adaptive natural language computer interface system
US4989081A (en) * 1988-11-14 1991-01-29 Sony Corporation Home-bus-information system
US5086385A (en) * 1989-01-31 1992-02-04 Custom Command Systems Expandable home automation system
US5317693A (en) * 1991-04-04 1994-05-31 Digital Equipment Corporation Computer peripheral device network with peripheral address resetting capabilities
NL9100926A (nl) * 1991-05-29 1992-12-16 Nederland Ptt Bussysteem, in het bijzonder voor huis- of klein-zakelijk gebruik.
JP3243803B2 (ja) * 1991-08-28 2002-01-07 ソニー株式会社 Av機器
US5341166A (en) * 1992-02-27 1994-08-23 Video Control Technology, Inc. System for controlling selected devices having unique sets of control codes
EP0574636B1 (fr) * 1992-06-19 1996-08-21 EURO CP s.a.r.l. Procédés pour adresser une unité fonctionnelle et pour mettre en correspondance deux unités fonctionnelles ; unité fonctionnelle et installation s'y rapportant
GB2268816B (en) * 1992-07-14 1996-01-17 Sony Broadcast & Communication Controlling equipment
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
US5774628A (en) * 1995-04-10 1998-06-30 Texas Instruments Incorporated Speaker-independent dynamic vocabulary and grammar in speech recognition
US5890123A (en) * 1995-06-05 1999-03-30 Lucent Technologies, Inc. System and method for voice controlled video screen display
US5802149A (en) * 1996-04-05 1998-09-01 Lucent Technologies Inc. On-line training of an automated-dialing directory
US6018568A (en) * 1996-09-25 2000-01-25 At&T Corp. Voice dialing system
US5777571A (en) * 1996-10-02 1998-07-07 Holtek Microelectronics, Inc. Remote control device for voice recognition and user identification restrictions
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
US5909183A (en) * 1996-12-26 1999-06-01 Motorola, Inc. Interactive appliance remote controller, system and method

Also Published As

Publication number Publication date
US6535854B2 (en) 2003-03-18
US20020069063A1 (en) 2002-06-06
DE69712485T2 (de) 2002-12-12
EP0911808A1 (en) 1999-04-28
DE69712485D1 (de) 2002-06-13
EP0911808B1 (en) 2002-05-08
JPH11311996A (ja) 1999-11-09

Similar Documents

Publication Publication Date Title
JP4295846B2 (ja) 音声装置及び音声装置の自己初期化方法
JP6683794B2 (ja) スマート設備の機能案内方法及システム
US8095527B2 (en) Reproducing apparatus and method, information processing apparatus and method, recording medium, and program
US6584439B1 (en) Method and apparatus for controlling voice controlled devices
US20020193989A1 (en) Method and apparatus for identifying voice controlled devices
US20030093281A1 (en) Method and apparatus for machine to machine communication using speech
JP2001005489A (ja) ネットワークの制御方法
CN101449538A (zh) 媒体文件的文本-语法改进
JP2005521962A (ja) 機器ネットワークの制御方法
JP3519712B2 (ja) 電気機器遠隔制御システム、その方法、そのプログラム及びそのプログラムが記録された記録媒体
EP1267523A1 (en) Extended user interface in a wireless headset
JPH09292971A (ja) 翻訳装置
JP2020064300A (ja) 備忘録作成システム、備忘録作成方法、および備忘録作成システムのログ管理サーバのプログラム
JP2007235328A (ja) 音声通話用端末装置及び音声通話用プログラム
JP2006146996A (ja) コンテンツ再生システム
JP2004509385A (ja) キー入力データを用いた音声認識及び明瞭度のための入力デバイス。
JP3934071B2 (ja) 利用者の携帯電話機を媒介として効果音を発生させるカラオケ演奏装置
JP2020061046A (ja) 音声操作装置、音声操作方法、コンピュータプログラムおよび音声操作システム
JP2003131682A (ja) 音声コマンドによる機器コントロールシステム
JP2007263994A (ja) カラオケ再生装置
CN101393429A (zh) 利用音调的自动控制系统及自动控制装置
JP2002507772A (ja) 情報再生用または機能実行用の装置
JP2007506344A (ja) ソースデバイス及び再生デバイスを制御するシステム
JP2004185621A (ja) 音声確認システム及び方法
JP2001209400A (ja) 音声合成装置及び音声案内システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071016

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090317

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090413

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140417

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees