[go: up one dir, main page]

JP4518619B2 - ネットワークの制御方法 - Google Patents

ネットワークの制御方法 Download PDF

Info

Publication number
JP4518619B2
JP4518619B2 JP2000117217A JP2000117217A JP4518619B2 JP 4518619 B2 JP4518619 B2 JP 4518619B2 JP 2000117217 A JP2000117217 A JP 2000117217A JP 2000117217 A JP2000117217 A JP 2000117217A JP 4518619 B2 JP4518619 B2 JP 4518619B2
Authority
JP
Japan
Prior art keywords
network
user
document
commands
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000117217A
Other languages
English (en)
Other versions
JP2001005489A (ja
Inventor
ラップ ステファン
ゴロンジー シルケ
コンペ ラルフ
ブフナー ペーター
ジロン フランク
ルッケ ヘルムート
Original Assignee
ソニー インターナショナル (ヨーロッパ) ゲゼルシャフト ミット ベシュレンクテル ハフツング
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー インターナショナル (ヨーロッパ) ゲゼルシャフト ミット ベシュレンクテル ハフツング filed Critical ソニー インターナショナル (ヨーロッパ) ゲゼルシャフト ミット ベシュレンクテル ハフツング
Publication of JP2001005489A publication Critical patent/JP2001005489A/ja
Application granted granted Critical
Publication of JP4518619B2 publication Critical patent/JP4518619B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)
  • Selective Calling Equipment (AREA)
  • Details Of Television Systems (AREA)
  • Computer And Data Communications (AREA)
  • Telephonic Communication Services (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ホームネットワーク環境において、ネットワーク機器から送信される機器又は媒体に依存した語彙に基づいて、語彙を動的にそして能動的に拡張することのできる音声インターフェイスに関する。特に、本発明は、音声インターフェイス等を実現する音声装置内で、語彙を拡張できるネットワーク機器の制御方法に関する。本発明を適用した装置は、例えばビデオテープレコーダ(VTR)等のハードウェアにより構成してもよく、あるいは、例えば電子番組ガイド(electronic programming guide)等のソフトウェアでもよい。
【0002】
【従来の技術】
欧州特許公開公報EP−A−97118470号には、ホームネットワーク環境において、自らの機能を記述する語彙及び音声インターフェイスを音声装置に送信する機器が開示されている。音声装置は、受信され認識されたユーザの発話を対応するユーザネットワークコマンドに変換し、このユーザネットワークコマンドに基づいて、この機器を制御する。
【0003】
1998年9月に、モトローラ社(Motorola)は、拡張可能マークアップ言語XML(Extensible Markup Language:以下、XMLという。)に基づくVoxマークアップ言語1.0(VoxML1.0)に関連する言語を公開した。この言語は、プロンプト及び一般的に利用可能なオプションのリストからなる対話ステップを指定することによって、ダイアログ(対話)システムを記述するのに用いられる。ハイパーメディア記述言語HTML(Hypertext Markup Language:以下、HTMLという。)により、リッチテキストとともに、画像、ハイパーテキストリンク、グラフィックユーザインターフェイス入力コントロールを容易に記述できるように、VoxML1.0によれば、音声アプリケーションの記述が容易となる。このVoxML1.0は、複数の要素とこれら要素の属性のシンタクス、用例、Voxマークアップ言語文書又はダイアログの構成、及びVoxマークアップ言語を用いるアプリケーションを開発するときに役立つ他のリファレンスを指示するポインターに関する情報を含む。
【0004】
同様に、ギリシャのロートス島における、欧州音響学会主催のユーロスピーチ97で、リチャード・スプロートによって発表された論文「テキスト音声合成のためのマークアップ言語、ISSN 1018−4074の1774ページ("a markup language for text-to-speech synthesis" by Richard Sproat et al. ESCA. Eurospeech 97, Rhodes, Greece, ISSN 1018-4074, page 1774)には、音声テキストマークアップ言語(spoken text markup language)(STML)が開示されている。このSTMLは、テキスト音声(TTS)合成器(text-to-speech synthesizers)にテキストの構成に関する知識を提供するものである。STMLテキストは、例えば、多言語のTTSシステムにおいて、言語を設定し、その言語に対して話者を初期化して、適切な言語と話者特定テーブルがロードされるようにする。
【0005】
さらに、フィリップス社(Phillips)は、HDDLと呼ばれる対話記述言語を開発した。HDDLは特に、自動問い合わせシステムにおいて用いられる対話のための言語である。対話システムは、HDDLを用いてオフラインモードで作成された後、販売される。
【0006】
【発明が解決しようとする課題】
図3は、従来の音声装置21を示す図である。音声装置21は、マイクロホン22とスピーカ30及びバス40に接続されている。マイクロホン22の入力信号は、メモリ23aを内蔵したデジタルシグナルプロセッサ(DSP)23で処理された後、中央演算処理装置(CPU)24に供給される。CPU24は、演算結果を、メモリ29aを内蔵したDSP29を介してスピーカ30に出力し、あるいは、リンクレイヤ制御部25及びI/F物理レイヤ部26を介してバス40に出力する。DSP23及びCPU24は、メモリ28にアクセスすることもできる。メモリ28には、入力信号の処理を制御するために必要な全ての情報が格納されている。さらに、DSP23は、メモリ27の特徴抽出部27eにアクセスする。メモリ27には、音声認識及び音声合成に必要な全ての情報が格納されている。CPU24は、複数の機器、ここでは機器#1と機器#2及び機器#3のための各音声インターフェイス定義部及び汎用音声インターフェイス定義部だけでなく、認識部及び書記素/音素変換部27fにもアクセスする。なお、各音声インターフェイス定義部及び汎用音声インターフェイス定義部は、メモリ27内に別々に記憶されている。
【0007】
このように従来の音声装置21では、音声インターフェイス定義部を機器別に設けるとともに、汎用音声インターフェイス定義部を別個に備えていたため、複数の機器が共有するコマンドを個別に管理する必要があり、構造が複雑となり、処理や分析の効率が悪かった。
【0008】
そこで本発明は、上述した実情に鑑みてなされたものであり、本発明の目的は、ネットワーク機器の機能及び音声インターフェイスをネットワークの音声装置に送信し、音声装置内で複数のネットワーク機器の機能及び音声インターフェイスを操作する簡易且つ効率的なネットワーク機器の制御方法を提供することを目的とする。
【0009】
すなわち、本発明の目的は、ネットワーク内で、音声装置によってネットワークに接続されたネットワーク機器を制御するための簡単で、迅速で柔軟性のある方法を提供することである。音声装置とは、ユーザコマンドをユーザネットワークコマンドに変換して、ネットワーク機器の機能及び音声インターフェイスに基づいてネットワークを介してネットワーク機器を制御する装置である。
【0010】
【課題を解決するための手段】
本発明によると、ネットワークに接続された全てのネットワーク機器は、ネットワーク機器の機能及び音声インターフェイスを定義する少なくとも1つの機器文書に対応している。機器文書は、ネットワーク機器自身が備えていてもよく、あるいは、ネットワーク機器の外部に作成してもよい。機器文書は、ネットワーク機器のユーザコマンド解釈要素と関連するユーザネットワークコマンドとの対を1組以上有する。さらに、音声装置は、機器文書を受信し、受信した機器文書を統合して1つの音声インターフェイス記述を作成する。この統合された音声インターフェイス記述は、音声装置の言語に基づいて作成される。また、音声インターフェイス記述を、全ネットワークのための汎用文書として参照することができる。音声装置によって受信され認識されたユーザの発話コマンドは、ユーザコマンド解釈要素と汎用文書に含まれる関連するユーザネットワークコマンドの全ての対に基づいて、ユーザネットワークコマンドに変換される。ユーザコマンド解釈及び実行要素は、例えば、語彙要素、文法の定義、発音定義を有する。
【0011】
欧州特許公報第EP−A−97118470号に開示されているように、音声装置は、機器文書を音声装置が備える記憶装置又はリモートに存在するデータベースからフェッチする。
【0012】
汎用文書は、実行時に、ネットワーク機器から機器文書が受信された後、音声装置内で、純粋に統語的に適応化され得る。ネットワーク機器は複数の機器文書を有してもよい。それらの文書それぞれは、ネットワーク機器の機能の一部及びインターフェイスの一部を記述したものである。そして、それらのうちで実際に必要とされる文書だけが音声装置に転送される。このような文書は、例えば、ある言語を用いてネットワーク機器の機能を記述した文書又はネットワーク機器の機能の一部を定義する文書である。音声装置又は個々のネットワーク機器自身は、それら個々のネットワーク機器のさらなる音声機能を必要とすると判定した場合は、そのさらなる音声機能に対応する機器文書を音声装置に送信できる。音声装置は、このさらなる文書に基づいて汎用文書を適応化し、実行時に、その適応化された汎用文書に基づいて対応するユーザネットワークコマンドを生成する。
【0013】
【発明の実施の形態】
図1は、本発明を適用した音声装置1を示す図である。音声装置1は、マイクロホン2と、スピーカ10、バス20に接続されている。マイクロホン2に入力された音声に基づく入力信号は、メモリ3aを内蔵したデジタルシグナルプロセッサ(DSP)3で処理された後、中央演算処理装置(CPU)4に供給される。CPU4は、演算結果を、メモリ9aを内蔵したDSP9を介してスピーカ10に出力し、あるいは、リンクレイヤ制御部5及びI/F物理レイヤ部6を介してバス20に出力する。DSP3及びCPU4は、メモリ8にアクセスすることもできる。メモリ8には、入力信号の処理を制御するために必要な全ての情報が格納されている。さらに、DSP3は、メモリ7の特徴抽出部7eにアクセスする。メモリ7には、音声認識及び音声合成に必要な全ての情報が格納されている。
【0014】
従来の音声装置では、接続された複数のネットワーク機器のそれぞれに対応する複数の音声インターフェイス定義部と、1つの汎用音声インターフェイス定義部とが設けられていた。一方、本発明を適用した音声装置1は、唯一の統合された音声インターフェイス定義部を有する。この統合された音声インターフェイス定義部は、従来の汎用音声インターフェイス定義部に記述された汎用文書に対応している。
【0015】
図2は、本発明を適用したネットワーク機器11の機能的ブロック図である。ネットワーク機器11は、CPU12を備える。CPU12は、ネットワーク機器11を制御するための機器制御用ソフトウェア15と、メモリ14と、リンク層制御部17と、I/F物理層部16とインタラクションし、種々の情報をバス10に出力する。さらに、CPU12は、メモリ13とインタラクションすることもできる。本発明によると、メモリ13は、音声インターフェイス定義すなわち、1つ以上の機器文書を記憶している。
【0016】
上述のように、ネットワーク機器11は、音声インターフェイス定義部を有するメモリ13を必ずしも備えていなくてもよい。ネットワーク機器11の音声インターフェイス定義は、音声インターフェイス定義提供装置により提供してもよい。音声インターフェイス定義提供装置には、図1に示す音声装置1がアクセスすることができる。
【0017】
以下に説明する本発明の実施例においては、1つの音声装置1を備えるネットワークに2つのネットワーク機器11が接続されている。初期的には、音声装置1の汎用文書は空で、2つのネットワーク機器11の言語を定義する2つの機器文書は、音声装置1内で1つのインターフェイスの記述に併合(マージ)されている。なお、ネットワークに接続されるネットワーク機器11の数は、2以上の任意のn個であってもよい。また、音声装置1の汎用文書を新たに受信された機器文書に基づいて適応化することができる。以下では、説明を簡潔に行うために、機器文書は、1つの語彙要素からなるユーザコマンド解釈要素を有するものとする。
【0018】
以下の説明において、L1は、受理言語(accepted language)すなわち、第1の機器の語彙要素及び対応するコマンドを示す。同様にL2は、第2の機器の語彙要素及び対応するコマンドを示す。数学的表現によれば、L1は、少なくとも1つの語彙要素、すなわち単語wiとこの単語wiに対応するユーザネットワークコマンドの集合である。なお、単語wiは、単一の語ではなくてもよく、複数の単語からなる完全な発話であってもよい。受理言語は、語彙要素に加えて、例えば、発音、単語列のための文法及び/又は音声理解(speech understanding)及び対話のための規則を含んでもよい。
【0019】
第1の実施例においては、L1とL2は、同じ語彙要素すなわち共通の単語を含んでいない。したがって、L1∩L2={}であり、インターフェイス記述のためにマージされた受理言語Lは、L=L1∪L2となる。すなわち、音声装置1内の汎用文書は、第1の機器の言語L1により記述された機器文書1と、第2の機器の言語L2により記述された機器文書2から得られる語彙要素と対応するコマンドの対を併合することにより構築される。L1とL2は同じ語彙要素を含まないので、語彙要素は対応するコマンドとともにその語彙要素がどの機器に対してのものであるかを暗示するため、ユーザネットワークコマンドは、適切に生成されて、対応する機器に正しく送信される。
【0020】
第1の実施例において、2つのネットワーク機器は、例えばテレビジョンセットとCDプレーヤである。このとき、テレビジョンセットに対応するL1とCDプレーヤに対応するL2はそれぞれ、機器文書内で以下の語彙要素からなる。
【0021】
L1={MTV,CNN}
L2={再生,停止}
L1とL2は、同じ語彙要素を含まない、すなわちL1∩L2={}であるので、インターフェイス記述のマージされた受理言語Lは、L=L1∪L2={MTV,CNN,再生,停止}となる。例えば、これらの語彙要素はそれぞれ以下のリストに提示されるような機能を有するユーザネットワークコマンドと対応している。
【0022】
MTV→<テレビジョンをMTVに切り換える>
CNN→<テレビジョンをCNNに切り換える>
再生→<CDプレーヤを再生モードにする>
停止→<CDプレーヤを停止モードにする>
しかしながら、2つの機器が同じ語彙要素すなわち同じ語を共有する場合、L1∩L2≠{}となる。本発明によれば、これら共通の語彙も識別可能である。本発明の第1の実施例において、機器の名称が各受理言語間、すなわちL1とL2間の少なくとも共通部分を形成する同じ語彙要素に前置又は後置される。したがって、ユーザは、ユーザの発話コマンドを所望の各機器の名称の前に及び/又は後ろに付加しなければならない。上述のように、コマンドが共通のものでない場合は、機器の名称を付加する必要はないが、付加してもよい。
【0023】
以下の第2の実施例においては、機器の名称は各コマンドの前に付加され、インターフェイスの記述を形成する新しい言語Lは、2つの言語L1とL2の間で混同されるおそれのない単語の併合と機器の名称が前置された機器の言語で示される。機器の名称をそれぞれn1及びn2とすると、
L=L1\(L1∩L2)∪L2\(L1∩L2)∪n1L1∪n2L2となる。
【0024】
以下では、CD再生装置及びテープ再生装置を備えるネットワークを例に、上述の実施例を説明し、本発明によるネットワーク機器の制御方法を明らかにする。ここで、CD再生装置及びテープ再生装置はそれぞれ、「CD」、「テープ」と命名されている。CD再生装置の受理言語L1とテープ再生装置の受理言語L2をそれぞれ構成する語彙要素を以下に示す。
【0025】
L1={再生,停止,スキップ}
L2={再生,録音,停止,巻き戻し}
音声インターフェイスの受理言語は、L=(L1\(L1∩L2)∪(L2\(L1∩L2)∪n1L1∪n2L2={スキップ,録音,巻き戻し,CD再生,CD停止,CDスキップ,テープ録音,テープ停止,テープ巻き戻し}となる。対応するユーザネットワークコマンドの機能は、以下のようになる。
【0026】
スキップ→<CDの次のトラックへスキップする>
録音→<テープ再生装置を録音モードにする>
巻き戻し→<テープを巻き戻す>
CD再生→<CD再生装置を再生モードにする>
CD停止→<CD再生装置の再生を停止する>
CDスキップ→<CDの次のトラックへスキップする>
テープ再生→<テープ再生装置を再生モードにする>
テープ録音→<テープ再生装置を録音モードにする>
テープ停止→<テープ再生装置の再生/録音を停止する>
テープ巻き戻し→<テープを巻き戻す>
【0027】
この第2の実施例では、同一単語問題(same words problem)は、認識されたコマンドが多義的であるとき、ユーザに対して自動的に問い合わせを行い、ユーザに所望する機器を明示させることによって解決される。この場合のシナリオは、形式的には、第1の実施例における識別性を有する言語と同じであるが、その解釈が変わる。この解釈のバリエーションを明示するこの実施例を明確にする第3の実施例は、第2の実施例に基づいており、すなわち、ネットワーク機器としてのCD再生装置及びテープ再生装置に付与されたシナリオに基づいている。受理言語Lは、受理言語L1と受理言語L2の共有部分に含まれる語彙要素を認識するときに選択処理が行われるという点では、第1の実施例の受理言語Lと同様に形成される。すなわち、L=L1∪L2である。第2の実施例のように、受理言語L1と受理言語L2がそれぞれ同じ語彙要素を有するという条件のもとで、音声装置の受理言語Lを構成する語彙要素は、L={再生,停止,スキップ,録音,巻き戻し}となる。この場合の対応するユーザネットワークコマンドは、
再生→<明確にせよ#1>
停止→<明確にせよ#2>
スキップ→<CDの次のトラックへスキップする>
録音→<テープ再生装置を録音モードにする>
巻き戻し→<テープを巻き戻す>
である。ここで、「明確にせよ#1」は、音声認識部がどの機器に対するコマンドか("on what device")という問い合わせを出力して、受理言語Lを受理言語Laに切り換えるということを意味する。Laは、La={CD,テープ}という語彙要素からなり、対応するユーザネットワークコマンドの機能は、
CD→<CD再生装置を再生モードにする>及び<Lにスイッチバックする>となり、
テープ→<テープ再生装置を再生モードにする>及び<Lにスイッチバックする>となる。
【0028】
またここで、「明確にせよ#2」は、音声装置1がどの機器に対するコマンドかという問い合わせを出力して、受理言語Lを受理言語Lbに切り換えるということを意味する。Lbは、Lb=La={CD,テープ}と示される語彙要素からなり、対応するユーザネットワークコマンドの機能は、
CD→<CD再生装置を停止モードにする>及び<Lにスイッチバックする>となり、
Tape→<テープ再生装置を停止モードにする>及び<Lにスイッチバックする>となる。
【0029】
本発明の第3の実施例において、第2の実施例に示される音声装置の制御処理を短縮することもできる。この場合、音声装置1は直前に用いられた機器をデフォルト機器とみなして、音声装置1とデフォルト機器の統合された受理言語Lからなる汎用文書に基づいて、受信され認識されたユーザの発話コマンドを対応するユーザネットワークコマンドに変換する。直前に用いられた機器以外の他の機器を再度制御する場合にも、音声装置の制御処理を短縮することができる。この場合、例えば単に機器の名称を発することによって、機器を制御するよう音声装置に指示する。
【0030】
第4の実施例では、ダイアログの適応化が行われる。上述のような状況においては、多義的な語を正しく割り当てるために、機器明示の問い合わせが、ユーザに対して出力され、システムはその問い合わせに対するユーザの反応を認識する。機器明示のための問い合わせに対するユーザの回答の大部分が直前に指定された機器である場合、問い合わせをスキップし、ユーザネットワークコマンドを直前の機器に直接供給するようにしてもよい。また、コマンドがどの機器に対して出されたのかを予測するために、複数の情報源を用いてもよい。例えば、直前に使用された機器を考慮するだけでなく、各機器の類似点又は機器の分類も考慮する。例えば、記録コマンドは、ユーザがテレビを観ている間に出される場合は、オーディオテープへの記録ではなく、ビデオテープへの記録である可能性が高い。一方、ユーザがラジオを聴いている間に出される記録コマンドは、オーディオテープへの記録である可能性が高い。そこで、使用される可能性の高いネットワーク機器を、例えば電源が投入されているネットワーク機器から選択するようにしてもよい。また、機器の分類は、ユーザの行為又は機器の機能に関する記述を調査することによって学習することもできる。
【0031】
上述の全ての実施例において、ネットワーク機器がネットワークに接続された後又は、機器がユーザネットワークコマンドを音声装置1から受信した後に、各ネットワーク機器は、機器文書を音声装置1に直接送信することができる。また、現在のステータスから独立した機器文書等を音声装置に送信してもよい。機器は、複数の機器文書を有していてもよい。または、機器は、内容情報(contentinformation)の変更に基づいて動的に機能を変えて、その変化を認めるときにダイアログ及び音声認識能力を更新してもよい。あるいは、新しい文書を音声装置に送信することによって、定期的に機能を変えてもよい。機器文書は、対応する機器内に格納されずに、例えば装置製造者のインターネットサーバのような機器文書提供装置内に格納されてもよい。この場合、音声装置1は上記の機器がネットワークに接続されていると認識すると、機器文書をダウンロードしてもよい。
【0032】
機器は、それぞれが異なる国の言語による機器全体の受理言語を含む複数の文書を有することができる。例えば、このような機器は、最初にドイツ語の機器文書を音声装置に送信する。続いて、ユーザから対応するコマンドを受信した後に、英語の機器文書を音声装置に送信することができる。これにより、音声装置は、ドイツ語又は英語のいずれかのユーザコマンドをユーザネットワークコマンドに変換して機器を制御することができる。
【0033】
語彙要素の他に、認識又は合成を行うときに用いられる語のための発音の定義を機器文書の要素として含ませてもよい。そして、それらの発音の定義を音声装置の汎用文書に直接統合してもよい。発音の定義が言語に含まれるとき、それらの発音の定義は、例えば、1つの機器用の認識及び合成部に専用に用いてもよく、又は、全ての機器で共有してもよい。すなわち、第1の機器によって導入された発音の定義は、第2の機器、すなわちネットワークに接続された他の機器に対して発せられた語に対しても有効とすることができる。
【0034】
合成を行うために、複数の機器文書を統合し、音声装置内で、汎用文書の適応化を行ってもよい。問い合わせに対する回答を1つの機器だけでなく、複数の機器に対して行ってもよい。複数の機器からの発話の合成は、同時に出力されないことを保証する必要がある。発話の中には、供給優先度に基づいて、例えば警告のような外部の事象によって生じるものがある。例えばそれらの発話は、他の発話に割り込み、ユーザの非活動期間が終わると、割り込まれた発話は再導入され、ダイアログは続行する。ユーザの入力及びユーザの発話に一致する尤度が高いと考えられるストリームが継続している間、全てのストリームがアクティブな状態にあるという事実を前提として、複数のダイアログのストリームが平行して管理される。
【0035】
音声装置の汎用文書は、初期的には空であってもよく、あるいは、1つ以上のネットワーク機器のための、インターフェイスを記述する要素の基本セットを有していてもよい。後者の場合、機器から音声装置に送信される文書は、具体性を有さず、汎用文書を部分的に参照するものであってもよい。
【0036】
例えば、特定の機器のためのダイアログ文法のみを機器文書において特定し、発話の言い回しのためのデフォルト文法を汎用文書のユーザコマンド解釈要素の基本的なセットに含ませてもよい。また、音声認識部の汎用文書内に、ある機能を完全に記述してもよい。例えば、電子番組ガイドを、音声ダイアログによって、どのように制御するのかを記述する。この場合、デフォルト文法及び一連の単語のための文法には、例えば、番組名、製作者名、俳優名、時間帯及び放送日に関する情報を示す変数が含まれており、電子番組ガイド装置から音声装置に送信される文書は、これら変数を満たす情報のみを含む。
【0037】
他の実施例においては、機器から音声装置に送信される機器文書は、ネットワークコマンドに対応するキーワードとカテゴリ識別子とを含む。音声装置は、これらのカテゴリ識別子に基づいて、発生し得る連続するユーザの発話に対して、単語列に関するどの文法を適用するかを決定する。例えば、キーワードが「ボイス・オブ・アメリカ(voice of America)」であり、カテゴリが「ラジオ」である場合、ユーザは、「ボイス・オブ・アメリカを聴きたい(I want to listen to voice of America)」又は「ボイス・オブ・アメリカをオン(Turn on voiceof America)」等と発生する。また、カテゴリが「ラジオカセットレコーダ」である場合、発生し得るユーザの発話は、「ボイス・オブ・アメリカを録音(Please record voice of America)」等である。
【0038】
汎用文書の適応化を行うために、音声理解の基礎を形成する概念/値の組、例えばある処理を開始するために必要な(時刻,8:00)といった組を音声装置に送信される機器文書に機器用の文法として含ませてもよい。音声インターフェイスを記述する機器文書は、規則を含み、この規則は、単語列と概念との間のマッピング及びどのように変数値を埋めるかを定義する。さらに、機器文書は、概念/値を一対の組から動作へのマッピングを定義する規則を有する。例えば(コマンド,記録)、(タイトル,風とともに去りぬ)及び(時刻,8:00)という組は、VTRの録画処理を表す。ダイアログは、ユーザ側からはじめてもよく、すなわち発話の順番は、ユーザを主導としてもよい。発話の順番とは、例えば、「8時、映画、風とともに去りぬ」等である。1つ以上の発話で情報が伝えられる場合は、発話の順番は、ユーザに任せられる。システムは、例えば、文法に基づきそして各ネットワーク機器に送信されたユーザネットワークコマンドによって動作を始動するために必要な情報を収集する。このシステムは、例えば、付加的な文法を含むさらなる文書を音声装置に送信し、音声装置は、情報が欠落している場合、ユーザに情報を聞き返すことができ、また、新しく認識されたユーザの発話をさらなるユーザネットワークコマンドに割り当てることもできる。
【0039】
機器文書は、ユーザコマンド解釈要素として、語彙要素、発音、単語列のための文法、音声理解及びダイアログのための規則に関する情報の他に、同一又は同等のユーザネットワークコマンドに割り当てられる複数言語に対応する同様な情報、すなわち語彙要素、発音、単語列のための文法、音声理解及びダイアログのための規則関する情報を含んでもよい。この情報によって、ユーザはいかなる言語によっても機器を制御することができる。上述のように、この情報を同じ機器が有する複数の機器文書中に含ませてもよい。これによって、複数言語の音声による処理を実現することができる1つの音声装置のインターフェイスを特定できる。上記の概念/値の対は言語独立であるので、ダイアログの文法は言語独立とすることができる。
【0040】
上述のように、機器文書は、発話のための文法によって明示的にあるいは暗示的に付与された語彙を含む。1つ以上の発音を各語彙要素、すなわち各語に対して任意に付与することもできる。任意の発音が機器文書に付与されないときは、これを自動的に生成してもよい。しかしこの場合、特に単語が固有名詞、外来語、略語である場合や方言又は外国語による特殊な発音を認識しなくてはならない場合、エラーが発生しやすい。発音は、単音又は異音のモデルのセットが与えられた認識部内に単語のモデルを生成するための基礎となる。
【0041】
機器文書は、複数の利用可能な機器に関する複合コマンドを作成するユーザコマンド解釈要素及び関連するユーザコマンドの他に、標準化された情報、例えば「VTR」のような機器のカテゴリに関する情報及び/又は「記録可能なテープを有する」等の機能に関する情報を含んでもよい。例えばユーザは、テレビジョンセットに表示される電子番組ガイドから将来放映される予定の映画を選択するとき、「この映画を録画して下さい(Please record this movie)」と発する。つまり、ネットワークコマンドが、適切なチャンネル、日付及び時間帯に関する情報を番組ガイド装置からVTRに送信する必要がある。そして、適切な録画が行われることを保証するコマンドをVTRに送信する必要がある。これに類似した状況として、映画をあるVTRテープから別のVTRテープにダビングする場合がある。このような状況では、各機器の音声インターフェイス記述は、通常、このような発話、すなわち適切なチャンネル、日付及び時間帯等に関する発話を定義しない。したがって、音声装置は、推論部による推論に基づいて汎用文書を適応化してもよい。推論部は、推論構成要素として機器文書内に含まれており、単語列に関する文法及びダイアログを含む音声インターフェイスの記述を複数の機器に関する複合コマンドの1つに含まれる可能性のある追加的機能に提供する。
【0042】
ネットワーク機器を制御するための全ての情報は、音声装置内の1つの汎用文書に含まれるので、処理あるいは分析を容易に行うことができる。特に、ユーザコマンド解釈要素の異なる利用可能な内容間又は/及び汎用文書内の同様又は同等のユーザネットワークコマンドに割り当てられた二重の情報間に関連があるときは特に容易である。
【0043】
したがって、本発明によると、ネットワークが備える音声装置を介して制御することのできるネットワーク機器は、機器の機能及び音声インターフェイスを記述する機器文書を音声装置に送信することができる。音声装置は、機器文書を汎用文書に統合する。汎用文書は、接続されたネットワーク機器を制御するために、認識されたユーザコマンドをユーザコマンド解釈要素を用いてユーザネットワークコマンドに変換するための基礎を形成する。機器文書は例えばユーザコマンド解釈要素及び関連するユーザネットワークコマンドのような語彙からなる。さらに、複数言語に対応するこれらと同様な情報、又は、音声理解における動的なダイアログに関する情報だけでなく、発音、単語列のための文法、音声理解及びダイアログのための規則を機器文書のユーザコマンド解釈要素内に含めてもよい。1つの機器が複数の機器文書を有し、必要時にそれらを動的に音声装置に送信してもよい。さらに、ネットワーク機器は、音声機能に関する仕様を実行時に音声装置に送信するので、本発明を適用することにより、機器は、機器文書の内容の変更に基づいてその機能を動的に変えることができる。機器がその機能を動的に変える場合、ネットワーク機器は、動的に機器文書を生成する、又は、既存の機器文書を更新する。更新は、例えば、放送局の名称を更新する又は挿入することによって行われ、ネットワーク機器は、更新された機器文書を音声装置に送信する。
【0044】
【発明の効果】
以上のように、本発明に係るネットワーク機器の制御方法では、ネットワーク機器に対応し、ユーザコマンド解釈要素と関連するユーザネットワークコマンドの少なくとも1つの対からなる言語を含む少なくとも1つの機器文書を受信し、受信された機器文書を、機器文書の言語と同様に構成される音声装置の言語からなる汎用文書に適応化する適応化し、受信及び認識された音声のユーザコマンドを、ユーザコマンド解釈要素と汎用文書に含まれる関連するユーザネットワークコマンドの全ての対に基づいて、対応するユーザネットワークコマンドに変換する。これにより、本発明に係るネットワーク機器の制御方法によれば、音声装置を備えるネットワークに接続された複数のネットワーク機器を制御するユーザネットワークコマンドを簡易且つ効率的に管理、処理、及び分析することができる。
【図面の簡単な説明】
【図1】本発明を適用した音声装置の構成を示すブロック図である。
【図2】本発明を適用したネットワーク機器の構成を示すブロック図である。
【図3】従来の音声装置の構成を示すブロック図である。
【符号の説明】
1 音声装置、2 マイクロホン、3 DSP、4 CPU、5 リンク層制御部、6 I/F物理層部、7 メモリ、8 メモリ、9 DSP、10 スピーカ、20 バス

Claims (22)

  1. 音声装置によってユーザコマンドを関連するユーザネットワークコマンドに変換し、関連するユーザネットワークコマンドにより、ネットワークを介して、該ネットワークに接続されたネットワーク機器を制御するネットワーク機器の制御方法において、
    上記ネットワーク機器に対応し、上記ユーザコマンド解釈要素及び上記関連するユーザネットワークコマンドの少なくとも1つの対からなる言語を含む少なくとも1つの機器文書を受信する受信ステップと、
    上記受信された機器文書を、該機器文書の言語と同様に構成される上記音声装置の言語からなる汎用文書に適応化する適応化ステップと、
    受信及び認識された音声のユーザコマンドを、上記ユーザコマンド解釈要素及び上記汎用文書に含まれる関連するユーザネットワークコマンドの全ての対に基づいて、対応するユーザネットワークコマンドに変換する変換ステップとを有し、
    上記適応化ステップは、
    上記音声装置の言語と、新たに受信された機器文書の言語とが少なくとも1つの同様なユーザコマンド解釈要素を含んでいるか否かを判定するステップと、
    上記同様なユーザコマンド解釈要素が存在しない場合、上記音声装置の言語を更新して、上記音声装置の言語のユーザコマンド解釈要素及び関連するユーザネットワークコマンドの全ての対と、上記新たに受信された機器文書の言語のユーザコマンド解釈要素及び関連するユーザネットワークコマンドの全ての対とが全て含まれるように結合するステップと、
    上記少なくとも1つの同様なユーザコマンド解釈要素が存在する場合、上記音声装置の言語を更新して、共通しない上記音声装置の言語のユーザコマンド解釈要素及び関連するユーザネットワークコマンドの全ての対と、上記新たに受信された機器文書の言語のユーザコマンド解釈要素及び関連するユーザネットワークコマンドの全ての対とを結合し、同様な上記音声装置の言語のユーザコマンド解釈要素及び関連するユーザネットワークコマンドの全ての対と、該新たに受信された機器文書の言語のユーザコマンド解釈要素及び関連するユーザネットワークコマンドの全ての対のそれぞれに対して関連する機器を定義する識別子を付与するステップとを有するネットワーク機器の制御方法。
  2. 上記識別子は、上記ユーザコマンド解釈要素と関連するユーザネットワークコマンドの各対のユーザコマンド解釈要素に対して前置又は後置されて付与される機器の名称であることを特徴とする請求項記載のネットワーク機器の制御方法。
  3. 上記適応化ステップは、
    上記音声装置の言語のユーザコマンド解釈要素及び関連するユーザネットワークコマンドの全ての対と、上記新たに受信された機器文書の言語のユーザコマンド解釈要素及び関連するユーザネットワークコマンドの全ての対とを結合して、該音声装置の言語を更新するステップを有し、
    各ユーザコマンド解釈要素が上記音声装置の言語と上記新たに受信された機器文書の言語との共通部分に含まれているユーザコマンド解釈要素及び関連するユーザネットワークコマンドの対の全てのユーザコマンドは、上記汎用文書に含まれるユーザコマンド解釈要素及び関連するユーザネットワークコマンドの全ての対と選択処理とに基づいて対応するユーザネットワークコマンドに変換され
    上記選択処理は、
    ユーザに対してどの機器を使用するかに関する問い合わせを送信するステップと、
    ユーザからの回答を受信し、認識するステップと、
    上記認識したユーザからの回答、及びユーザコマンド解釈要素と上記汎用文書に含まれる関連するユーザネットワークコマンドとの全ての対に基づいて、対応するユーザネットワークコマンドを選択するステップとを有することを特徴とする請求項1記載のネットワーク機器の制御方法。
  4. 上記選択処理は、
    上記ネットワークに対してどの機器が直前に使用されたかという問い合わせを送信するステップと、
    上記ネットワークからの回答を受信し認識するステップと、
    上記受信したネットワークからの回答及びユーザコマンド解釈要素と上記汎用文書に含まれるユーザネットワークコマンドの全ての対に基づいて、対応するユーザネットワークコマンドを選択するステップとを有する請求項記載のネットワーク機器の制御方法。
  5. 上記選択処理は、
    上記ユーザの発話を受信し認識するステップと、
    上記受信したユーザの発話及びユーザコマンド解釈要素と上記汎用文書に含まれるユーザネットワークコマンドの全ての対に基づいて、対応するユーザネットワークコマンドを選択するステップとを有する請求項3又は4記載のネットワーク機器の制御方法。
  6. 上記選択処理は、
    上記ネットワークに対してどの機器が最も用いられる可能性が高いかという問い合わせを送信するステップと、
    上記ネットワークからの回答を受信するステップと、
    上記受信したネットワークからの回答及びユーザコマンド解釈要素と上記汎用文書に含まれる関連するユーザネットワークコマンドの全ての対に基づいて、対応するユーザネットワークコマンドを選択するステップとを有する請求項乃至のいずれか1項記載のネットワーク機器の制御方法。
  7. 上記最も用いられる可能性の高いネットワーク機器は、電源が投入されているネットワーク機器から選択される請求項記載のネットワーク機器の制御方法。
  8. ネットワーク機器が上記ネットワークに接続された後に、該ネットワーク機器から、機器文書が上記音声装置に直接送信される請求項1乃至のいずれか1項記載のネットワーク機器の制御方法。
  9. ネットワーク機器が、上記音声装置からユーザネットワークコマンドを受信した後に、該ネットワーク機器から機器文書が音声装置に送信される請求項1乃至のいずれか1項記載のネットワーク機器の制御方法。
  10. ネットワーク機器が上記ネットワークに接続されるか、あるいは、機器文書提供装置が上記音声装置から特定の機器文書を要求するユーザネットワークコマンドを受信した後、該機器文書提供装置から音声装置に該機器文書が送信される請求項1乃至のいずれか1項記載のネットワーク機器の制御方法。
  11. 上記音声装置内に格納されている汎用文書は、初期的には空である請求項1乃至10のいずれか1項記載のネットワーク機器の制御方法。
  12. 上記音声装置内に格納されている汎用文書は、ユーザコマンド解釈要素及び関連するユーザネットワークコマンドの対の基本セットを初期的に含んでいる請求項1乃至10のいずれか1項記載のネットワーク機器の制御方法。
  13. 上記ユーザコマンド解釈要素及び関連するユーザネットワークコマンドの対の基本セットは、発話の言い回しに関する初期的文法を定義する請求項12記載のネットワーク機器の制御方法。
  14. 上記ユーザコマンド解釈要素は、語彙要素を含む請求項1乃至13のいずれか1項記載のネットワーク機器の制御方法。
  15. 上記ユーザコマンド解釈要素は、キーワード及び/又はカテゴリに基づいて、出現する可能性のあるユーザの連続的発話に関する文法の定義を含む請求項1乃至14のいずれか1項記載のネットワーク機器の制御方法。
  16. 上記ユーザコマンド解釈要素は、発音に関する定義を含む請求項1乃至15のいずれか1項記載のネットワーク機器の制御方法。
  17. 上記発音に関する定義は、任意のネットワーク機器の言語に関連付けられている請求項16記載のネットワーク機器の制御方法。
  18. 上記発音に関する定義は、複数のネットワーク機器の言語に関連付けられている請求項16記載のネットワーク機器の制御方法。
  19. 上記ユーザコマンド解釈要素は、少なくとも1つの単語列に関する文法を含む請求項1乃至18のいずれか1項記載のネットワーク機器の制御方法。
  20. 上記ユーザコマンド解釈要素は、単語列と任意のユーザコマンドに関連する概念の間のマッピングを定義する規則を含む請求項1乃至19のいずれ1項記載のネットワーク機器の制御方法。
  21. 上記ユーザコマンド解釈要素は、他の発話言語用のユーザコマンド解釈要素及び関連するユーザネットワークコマンドの対と同様の情報を含む請求項1乃至20のいずれか1項記載のネットワーク機器の制御方法。
  22. 上記ユーザコマンド解釈要素は、ネットワーク機器のカテゴリ及び/又は該ネットワーク機器の機能に関する標準化された情報を含む請求項1乃至21のいずれか1記載のネットワーク機器の制御方法。
JP2000117217A 1999-04-13 2000-04-13 ネットワークの制御方法 Expired - Fee Related JP4518619B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP99107201.8 1999-04-13
EP99107201A EP1045374B1 (en) 1999-04-13 1999-04-13 Merging of speech interfaces for concurrent use of devices and applications

Publications (2)

Publication Number Publication Date
JP2001005489A JP2001005489A (ja) 2001-01-12
JP4518619B2 true JP4518619B2 (ja) 2010-08-04

Family

ID=8237945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000117217A Expired - Fee Related JP4518619B2 (ja) 1999-04-13 2000-04-13 ネットワークの制御方法

Country Status (6)

Country Link
US (1) US6615177B1 (ja)
EP (1) EP1045374B1 (ja)
JP (1) JP4518619B2 (ja)
KR (1) KR100726692B1 (ja)
CN (1) CN1145927C (ja)
DE (1) DE69942663D1 (ja)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4314680B2 (ja) * 1999-07-27 2009-08-19 ソニー株式会社 音声認識制御システム及び音声認識制御方法
US6513006B2 (en) * 1999-08-26 2003-01-28 Matsushita Electronic Industrial Co., Ltd. Automatic control of household activity using speech recognition and natural language
US6654720B1 (en) 2000-05-09 2003-11-25 International Business Machines Corporation Method and system for voice control enabling device in a service discovery network
US6950792B1 (en) * 2000-10-25 2005-09-27 Cisco Technology, Inc. Arrangement for providing international prompts in a unified messaging system
GB0111607D0 (en) * 2001-05-11 2001-07-04 Netdecisions Ltd Spoken interface systems
US20030014254A1 (en) * 2001-07-11 2003-01-16 You Zhang Load-shared distribution of a speech system
US7660400B2 (en) * 2003-12-19 2010-02-09 At&T Intellectual Property Ii, L.P. Method and apparatus for automatically building conversational systems
JP4424057B2 (ja) * 2004-05-10 2010-03-03 富士ゼロックス株式会社 学習装置およびプログラム
US20060036438A1 (en) * 2004-07-13 2006-02-16 Microsoft Corporation Efficient multimodal method to provide input to a computing device
WO2006016307A1 (en) * 2004-08-06 2006-02-16 Philips Intellectual Property & Standards Gmbh Ontology-based dialogue system with application plug-and-play and information sharing
US8942985B2 (en) 2004-11-16 2015-01-27 Microsoft Corporation Centralized method and system for clarifying voice commands
US7778821B2 (en) 2004-11-24 2010-08-17 Microsoft Corporation Controlled manipulation of characters
US20060253272A1 (en) * 2005-05-06 2006-11-09 International Business Machines Corporation Voice prompts for use in speech-to-speech translation system
JP4680714B2 (ja) * 2005-08-03 2011-05-11 パナソニック株式会社 音声認識装置および音声認識方法
JP4770374B2 (ja) * 2005-10-04 2011-09-14 株式会社デンソー 音声認識装置
GB0525096D0 (en) * 2005-12-09 2006-01-18 Nokia Corp Global navigation satellite system receiver
DE102005061365A1 (de) * 2005-12-21 2007-06-28 Siemens Ag Verfahren zur Ansteuerung zumindest einer ersten und zweiten Hintergrundapplikation über ein universelles Sprachdialogsystem
US7925975B2 (en) 2006-03-10 2011-04-12 Microsoft Corporation Searching for commands to execute in applications
US8175885B2 (en) * 2007-07-23 2012-05-08 Verizon Patent And Licensing Inc. Controlling a set-top box via remote speech recognition
DE102009011395A1 (de) * 2009-03-03 2010-09-09 Rohde & Schwarz Gmbh & Co. Kg System zur sprachgesteuerten Steuerung von Messgeräten
US9113190B2 (en) 2010-06-04 2015-08-18 Microsoft Technology Licensing, Llc Controlling power levels of electronic devices through user interaction
US8620113B2 (en) 2011-04-25 2013-12-31 Microsoft Corporation Laser diode modes
US8760395B2 (en) 2011-05-31 2014-06-24 Microsoft Corporation Gesture recognition techniques
US8635637B2 (en) 2011-12-02 2014-01-21 Microsoft Corporation User interface presenting an animated avatar performing a media reaction
US9100685B2 (en) 2011-12-09 2015-08-04 Microsoft Technology Licensing, Llc Determining audience state or interest using passive sensor data
US8898687B2 (en) 2012-04-04 2014-11-25 Microsoft Corporation Controlling a media program based on a media reaction
CA2775700C (en) 2012-05-04 2013-07-23 Microsoft Corporation Determining a future portion of a currently presented media program
US10042603B2 (en) * 2012-09-20 2018-08-07 Samsung Electronics Co., Ltd. Context aware service provision method and apparatus of user device
KR102070196B1 (ko) 2012-09-20 2020-01-30 삼성전자 주식회사 사용자 디바이스에서 상황 인식 서비스 제공 방법 및 장치
KR20140060040A (ko) 2012-11-09 2014-05-19 삼성전자주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법
US20140180671A1 (en) * 2012-12-24 2014-06-26 Maria Osipova Transferring Language of Communication Information
US9135911B2 (en) * 2014-02-07 2015-09-15 NexGen Flight LLC Automated generation of phonemic lexicon for voice activated cockpit management systems
US10249296B1 (en) * 2014-05-27 2019-04-02 Amazon Technologies, Inc. Application discovery and selection in language-based systems
JP2016024212A (ja) * 2014-07-16 2016-02-08 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US9811312B2 (en) * 2014-12-22 2017-11-07 Intel Corporation Connected device voice command support
US20160322044A1 (en) * 2015-04-01 2016-11-03 Elwha Llc Networked User Command Recognition
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US9922648B2 (en) * 2016-03-01 2018-03-20 Google Llc Developer voice actions system
US10868720B2 (en) 2016-04-29 2020-12-15 Dcb Solutions Limited Data driven orchestrated network using a voice activated light weight distributed SDN controller
WO2017186916A1 (en) * 2016-04-29 2017-11-02 Sanctum Networks Limited A data driven orchestrated network with installation control using a light weight distributed controller
US9691384B1 (en) 2016-08-19 2017-06-27 Google Inc. Voice action biasing system
US10229678B2 (en) 2016-10-14 2019-03-12 Microsoft Technology Licensing, Llc Device-described natural language control
US10978046B2 (en) * 2018-10-15 2021-04-13 Midea Group Co., Ltd. System and method for customizing portable natural language processing interface for appliances
KR20220072480A (ko) * 2020-11-25 2022-06-02 삼성전자주식회사 사용자 발화를 처리하는 전자 장치 및 그 작동 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06259473A (ja) * 1992-12-31 1994-09-16 Xerox Corp データベースへの単語記憶方法、データベースへの単語追加装置及び語彙トランスジューサの作成及び修正方法
JPH07321942A (ja) * 1994-05-30 1995-12-08 Toshiba Corp 無線による遠隔操作方法ならびに装置
JPH0887396A (ja) * 1994-09-20 1996-04-02 Fujitsu Ltd 音声ウィンドウシステム
JPH09244686A (ja) * 1996-02-09 1997-09-19 Canon Inc 情報処理方法及び装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890123A (en) * 1995-06-05 1999-03-30 Lucent Technologies, Inc. System and method for voice controlled video screen display
JP2000507021A (ja) * 1997-01-09 2000-06-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ モジュール式会話構造に基づくような両面音声の形態における人間―機械会話を実行する方法および装置
US5983190A (en) * 1997-05-19 1999-11-09 Microsoft Corporation Client server animation system for managing interactive user interface characters
DE69712485T2 (de) * 1997-10-23 2002-12-12 Sony International (Europe) Gmbh Sprachschnittstelle für ein Hausnetzwerk
US6144938A (en) * 1998-05-01 2000-11-07 Sun Microsystems, Inc. Voice user interface with personality

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06259473A (ja) * 1992-12-31 1994-09-16 Xerox Corp データベースへの単語記憶方法、データベースへの単語追加装置及び語彙トランスジューサの作成及び修正方法
JPH07321942A (ja) * 1994-05-30 1995-12-08 Toshiba Corp 無線による遠隔操作方法ならびに装置
JPH0887396A (ja) * 1994-09-20 1996-04-02 Fujitsu Ltd 音声ウィンドウシステム
JPH09244686A (ja) * 1996-02-09 1997-09-19 Canon Inc 情報処理方法及び装置

Also Published As

Publication number Publication date
CN1270360A (zh) 2000-10-18
KR100726692B1 (ko) 2007-06-13
CN1145927C (zh) 2004-04-14
JP2001005489A (ja) 2001-01-12
DE69942663D1 (de) 2010-09-23
EP1045374B1 (en) 2010-08-11
US6615177B1 (en) 2003-09-02
EP1045374A1 (en) 2000-10-18
KR20010020734A (ko) 2001-03-15

Similar Documents

Publication Publication Date Title
JP4518619B2 (ja) ネットワークの制御方法
US10930263B1 (en) Automatic voice dubbing for media content localization
US9626959B2 (en) System and method of supporting adaptive misrecognition in conversational speech
US8326634B2 (en) Systems and methods for responding to natural language speech utterance
US6324512B1 (en) System and method for allowing family members to access TV contents and program media recorder over telephone or internet
US6430531B1 (en) Bilateral speech system
US8731929B2 (en) Agent architecture for determining meanings of natural language utterances
EP1794747B1 (en) Interactive conversational dialogue for cognitively overloaded device users
EP1079615A2 (en) System for identifying and adapting a TV-user profile by means of speech technology
JP7058305B2 (ja) 情報処理装置、音声出力方法、音声出力プログラム
US20070129950A1 (en) Speech act-based voice XML dialogue apparatus for controlling dialogue flow and method thereof
Rapp et al. Dynamic speech interfaces
Cavedon et al. Developing a conversational in-car dialog system
Matassoni et al. The DICIT project: an example of distant-talking based spoken dialogue interactive system
Pegam et al. User expectations and selected notions in the context of the spoken dialogue system INSPIRE
CN114664298A (zh) 一种基于方言语音交互的控制方法、智能终端、存储介质
Schatter et al. Structured Speech Control for Semantic Radio Based on an Embedded VoiceXML System
James et al. A Multimodal Home Entertainment Interface via a Mobile Device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100511

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100518

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees