JP2002073080A - 音声対話システム - Google Patents
音声対話システムInfo
- Publication number
- JP2002073080A JP2002073080A JP2000266027A JP2000266027A JP2002073080A JP 2002073080 A JP2002073080 A JP 2002073080A JP 2000266027 A JP2000266027 A JP 2000266027A JP 2000266027 A JP2000266027 A JP 2000266027A JP 2002073080 A JP2002073080 A JP 2002073080A
- Authority
- JP
- Japan
- Prior art keywords
- dialogue
- voice
- mode
- interaction
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- User Interface Of Digital Computer (AREA)
- Navigation (AREA)
Abstract
化すると共に、ユーザへの快適性を改良した音声応答シ
ステムを提供する。 【解決手段】 対話処理部にはアシスト機構7を設け、
この中にグローバル遷移条件テーブル8とアシスト対話
モード生成手段9を形成する。該テーブル8には、いか
なる対話状態のもとでも共通に使用される複数の条件を
格納する。また該手段9は、通常の基本対話モードがス
ムーズに流れないときにユーザを援助するアシスト対話
モードを提供する。
Description
関する。人間と機械との間の情報交換を行ういわゆるマ
ン・マシンインタフェースの一形態として、近年、音声
対話型インタフェースが急速に普及し始めている。その
代表的な一例としては、車載情報機器であるオーディオ
装置やナビゲーション装置に適用される音声対話型イン
タフェースがあり、車輛を運転中のユーザにとって当該
車載情報機器に対する操作容易性は飛躍的に向上してい
る。
実現するための音声対話システムについて述べる。
型を示す図である。本図において、音声対話システム1
は、音声認識部2と、対話処理部3と、音声合成部4と
に大別される。さらに対話処理部3は、「意味理解系」
と「対話管理系」とに機能分類することができる。前者
は、発話モデルデータを収容した発話データベース5を
主構成要素とし、後者は、対話スクリプトデータを収容
した対話データベース6を主構成要素としている。尚、
「意味理解系」は、音声認識部2にその機能を持たせる
構成とする考え方もある。
ァーストフード店を例にとって説明すると、音声認識部
2は来店客に対面して設けられ、一方、音声合成部4は
当店の店員の代替として機能する。来店客が仮に、「バ
ーガー、2つ」と発声したとすると、音声認識部2は、
当該音声をテキスト(text)データに変換する。こ
の場合、〔バーガー〕と〔フタツ〕に変換できる。
して、対話処理部3は、まず、発話データベース5を参
照して、その文字コードの意味付けを行う。この場合、
〔ハンバーガー=注文〕および〔フタツ=注文数〕と意
味付けることができる。対話処理部3は上記の意味付け
をもとに、対話データベース6を参照して、対話の流れ
を決定する。つまり引き続いてどのような対話を来店客
に与えるべきか決定する。この場合例えば、〔こちらで
お召し上がりですか?〕および〔お飲み物は?〕という
ことになる。ここに決定した対話は、音声合成部4にて
電子的に合成された音声となり、当該来店客に返され
る。来店客はさらにこれに答えて、次々と対話が遷移し
ていく。
対話システムは、ファーストフード店を例にとって説明
したが、例えば既述のナビゲーション装置では、対話の
内容はかなり複雑多岐に亘り、対話の流れも何階層にも
遷移していく。このため音声対話システムとしては一層
の改良が求められる。その改良すべき点は多種に及ぶ
が、本発明ではその改良すべき点として、対話スクリプ
トデータに着目する。
は、起こり得る全てのパターンについてそれぞれ個別に
対話スクリプトデータを用意していた。また第2に、音
声認識部2から正常な認識結果が得られないときには、
標準的な対話スクリプトデータだけでは、それ以上通常
の対話の流れを継続させることができない。
データのデータサイズがきわめて大きくなり対話データ
ベース6のメモリ容量が膨大になってしまう、という問
題が生ずる(第1の問題)。また上記第2の点に関して
は、対話がスムーズに流れないことから、ユーザに不快
感を与える、という問題が生ずる(第2の問題)。
話データベースにおけるデータサイズを小さくし、ま
た、ユーザに快適な対話を提供できるようにした、音声
対話システムを実現することを目的とするものである。
す図である。本図に示すように、本発明の特徴は、対話
処理部(図18の3に相当)内に、アシスト機構7を設
けることである。そしてこのアシスト機構7内には、グ
ローバル遷移条件テーブル8と、アシスト対話モード生
成手段9が含まれる。
ーザの発話状態において、いかなる対話状態のもとでも
共通に使用される複数のグローバル遷移条件を予め格納
する。対話処理部は、その発話状態におけるユーザの発
声の内容が上記グローバル遷移条件に該当するとき、グ
ローバル遷移条件テーブル8にアクセスして対話内容を
生成するものである。
ての対話遷移を記述する必要がなくなり、既述の第1の
問題を解決することができる。一方、前記アシスト対話
モード生成手段9は、対話処理部が、基本対話モードの
他にアシスト対話モードでも動作することを可能にす
る。ここに基本対話モードは、ナビゲーション装置等の
アプリケーションプログラムが要求する各種情報を収集
する通常の一連の対話の流れを形成するモードであり、
アシスト対話モードは、一連の対話の流れを維持できな
い異常時に形成されるモードである。
スムーズに進めることができ快適性は向上するので、既
述の第2の問題を解決することができる。
テムの全体構成例を示す図である。本図に示すとおり、
本発明に係る音声対話システム1は、基本的に、発話状
態においてユーザから発声された音声を、例えばマイク
を介して、入力する音声入力部11と、この音声入力部
11からの音声を認識してその意味を解析する音声認識
部12と、この音声認識部12による認識結果に基づい
て、予め対話データベース14内に収容された対話スク
リプトデータを参照しつつ、ユーザに返すべき対話内容
を生成する対話処理部13と、その対話内容に基づいて
ユーザに対して合成音声を返す音声出力部16と、を備
え、ユーザによる発声の都度、対話スクリプトデータに
より規定される一連の対話状態を次々に遷移させて、ア
プリケーションプログラムが要求する各種情報をユーザ
から対話形式で収集するようにした音声対話システムで
ある。
処理部13により参照されるグローバル遷移条件テーブ
ル15(図1の8に相当)をさらに設けることである。
このグローバル遷移条件テーブル15には、上記の発話
状態において、いかなる対話状態のもとでも共通に使用
される複数のグローバル遷移条件を予め格納する。ここ
に対話処理部13は、上記の発話状態における発声の内
容がそのグローバル遷移条件に該当するとき、グローバ
ル遷移条件テーブル15にアクセスして上記の対話内容
を生成する。
な内容を説明する前に、図2の構成要素についてさらに
詳しく述べておく。マイクからなる音声入力部11から
の音声入力は、音声認識部12(図18の2)を構成す
る連続単語認識エンジン17にて各単語に切り出され
て、かつ、テキストに変換される。このテキストは、同
じく音声認識部12を構成する発話適応ユニット18に
入力される。該ユニット18は、発話モデルデータ(図
18の5)を参照して、その入力されたテキスト(単
語)の意味を理解して、その認識結果を対話処理部13
(図18の3に相当)に送る。例えばナビゲーション装
置において、認識されたテキスト(音声)が「行きた
い」ならば、認識結果は「目的地」ということになる。
話データベース14内の対話スクリプトデータ(図18
の6)をもとに、当該対話の流れを決定して組み立て
る。例えば上記の「目的地」に対しては、「遊園地?」
→「△△県?」→「○○ランド?」という流れを決定す
る。いずれもユーザとの対話形式で進行するので、音声
出力部16を構成する音声合成部19(図18の4)で
次の対話が音声合成され、スピーカよりユーザに返され
る。
的地・遊園地・△△県・○○ランド」は、対話結果とし
て、ナビゲーション装置を動かすアプリケーションプロ
グラムに与えられる。次にグローバル遷移条件テーブル
15について説明する。グローバル遷移条件テーブル1
5は、予め定めた複数のグローバル遷移条件のそれぞれ
に対応した個別の対話内容を格納する複数のグローバル
遷移ファイルのいずれかを特定する。
示すると次のとおりである。 i)認識せず ii)認識エラー iii )戻る(戻りたい) iv)中止(取り消す) v)分からない vi)間違い 上記のi)〜ii)は、音声認識部12が自ら発するグロ
ーバル遷移条件であり、iii )〜vi)はユーザ側から発
せられるグローバル遷移条件である。これらのいずれの
ケースも、あらゆる対話パターンの中に共通に起こり得
る事象である。このために、「グローバル」と名付けて
いる。
の対話パターンに持たせていたため、対話データベース
15のデータサイズはきわめて膨大なものとなってしま
った。図3はグローバル遷移ファイルを図解的に示す図
である。本図のグローバル遷移ファイルG−1,G−2
〜G−6は、上記のグローバル遷移条件i),ii)〜v
i)にそれぞれ対応している。ただし、G−3〜G−5
は図示を省略する。
図2の対話データベース14の中にさらに追加して形成
してもよいし、あるいは、ファイルG−1〜G−6とし
て独立に存在させてもよい。いずれにしても、グローバ
ル遷移条件テーブル15を介して対話処理部13がその
ファイルの内容を読み込む。図4はグローバル遷移条件
テーブル15の内容を図解的に示す図である。
ず」であれば、ファイルG−1へアクセスすべきことを
指定する。「認識せず」とは、ユーザが発話状態にあり
ながら何も発声しないことを意味する。また音声認識部
12による認識結果が「認識エラー」であれば、ファイ
ルG−2へアクセスすべきことを指定する。「認識エラ
ー」とは、ユーザが発声はしているものの、周囲の騒音
が大きいか、声が大き過ぎるか、または声が小さ過ぎる
ために、音声認識部12が正しく認識できないことを意
味する。
はファイルG−3に飛び、以前の対話状態に戻すための
対話シーケンスに入る。ユーザから「中止」と発声され
たときは、ファイルG−4に飛び、対話を終結させる対
話シーケンスに入る。図5はグローバル遷移ファイルの
データ構造の一例を図解的に示す図である。ただし、フ
ァイルG−1とG−2のみについて示す。
話スクリプトデータの対話シーケンスの「S−5」を選
択し、かつ、その対話シーケンス「S−5」の中のノー
ドIDの「2」を選択すべきことを指示する情報が書い
てある。ファイルG−2についても上記と同様であり、
対話ID「S−21」とその中のノードID「4」が書
かれている。
1,G−2…は、遷移先対話IDを特定する対話ID情
報と、特定された該遷移先対話IDにより展開される一
連の対話シーケンス内の遷移先ノードIDを特定するノ
ードID情報とを格納する。図6は対話シーケンスにつ
いて一例を表す図である。例えば対話シーケンスS−1
は、通常の基本対話モードのシーケンスであり、そのノ
ード1では例えば「行きたい」というユーザからの発声
により、目的地の設定が行われる。
い」との問いかけをユーザに対して行う。ノード3で
は、ユーザは「兵庫県」と発声する。ノード4では、
「市町村名をはなして下さい」との問いかけをユーザに
対して行う。
一連の対話の流れを進めるべきところ、仮に、上記ノー
ド2において、音声認識部12からの認識結果が「認識
せず」であったとすると、対話処理部13は、グローバ
ル遷移条件テーブル15をアクセスする。そこには、図
5に示すように対話番号G−1の「認識せず」に対応す
る対話シーケンスを開始し、所定のガイダンスに沿っ
て、ユーザから再指示を引き出す。その後グローバル遷
移ファイルG−1に書かれた遷移先対話ID「S−5」
と遷移先ノードID「2」従い、図6の二重丸の「2」
へ遷移する。
に示す図である。対話番号G−3では、直前の対話ID
(移動して来る前の対話ID)における直前のu(移動
して来る前の対話処理部13からの発声ノード)へ遷移
する。対話番号G−4では、直前の対話ID(移動して
来る前の対話ID)における直前のu(移動して来る前
のユーザの発声ノード)へ遷移する。
の対話ID情報および既述のノードID情報が、それぞ
れ、各種の遷移先を機能表現(PREV−previo
us)したコードによって記述される。このように機能
表現することにより、1つ1つのケースにおいて具体的
に対話シーケンスのIDを特定する必要がなりなり、フ
ァイル(G−1〜G−6)のデータサイズは一層小さく
できる。
ト対話モード生成手段9について説明する。このアシス
ト対話モード生成手段9を機能させた対話処理部13
は、基本対話モードの他にアシスト対話モードでも動作
することができる。ここに基本対話モードは、アプリケ
ーションプログラム(図2の上方参照)が要求する各種
情報を収集する通常の一連の対話の流れを形成するモー
ドであり、アシスト対話モードは、その一連の対話の流
れを維持できない異常時に形成されるモードである。
る第1の動作態様を表すフローチャートである。この第
1の動作態様において、対話処理部13は、音声認識部
12より「認識せず」を示す認識結果が連続して与えら
れたとき、アシスト対話モードに移行して動作する。
受け取った、「認識せず」という認識結果が1回目のも
のか否か判断する。 ステップS12:その判断結果がNoであると、すなわ
ち「認識せず」という認識結果を2回またはそれ以上、
連続して受け取ると、対話処理部13は、この第1の動
作態様のもとでのアシスト対話モードに移行する。
とき、すなわち初めて「認識せず」という認識結果を受
け取ったときは、前の対話IDならびにノードIDに戻
る。上記アシスト対話モードについて具体的に説明す
る。今仮に基本対話モードでの問いかけが「都道府県名
をおはなし下さい」であったものとして、これに対する
ユーザからの応答について、音声認識部12による認識
結果が連続して「認識せず」であったとすると、今度
は、アシスト対話モードに移行する。このアシスト対話
モードでは、上記の問いかけの言い方を別の言い方に変
える。例えば上記の例に対しては、「大阪府や兵庫県の
ようにおはなし下さい」というような別の言い方に変え
る。
とができ快適な対話がスムーズに流れる。図9はアシス
ト対話モード生成手段9による第2の動作態様を表すフ
ローチャートである。この第2の動作態様において、対
話処理部13は、音声認識部12より「認識エラーあ
り」を示す認識結果が連続して与えられたとき、音声入
力を中止するための中止対話モードで動作する。
受け取った、「認識エラー」という認識結果が1回目の
ものか否か判断する。 ステップS22:その判断結果がNoであると、すなわ
ち「認識エラー」という認識結果を2回またはそれ以
上、連続して受け取ると、対話処理部13は、この第2
の動作態様のもとでの中止対話モードに移行する。
とき、すなわち初めて「認識エラー」という認識結果を
受け取ったときは、前の対話IDならびにノードIDに
戻る。上記中止対話モードについて具体的に説明する。
基本対話モードでの問いかけに対して「認識エラー」が
連続したときは、中止対話モードとしていろいろな中止
対話でユーザを援助することができる。その二、三の例
は以下のとおりである。
入力を中止します(または中止しますか?)」 「あなたの音声を正しく認識できない状態にあります」 「もう少し大きくはっきりとはなして下さい」 等である。
ない理由を知ることができ、従来の不快な待ち時間から
解放される。図10はアシスト対話モード生成手段9に
よる第3および第4の動作態様を表すフローチャートで
ある。第3の動作態様において、対話処理部13は、音
声認識部12より予め定めた一定時間を経過しても、認
識結果が与えられないとき、タイムアウト処理を実行す
る。
対話モードであるときは、上記のタイムアウト処理の実
行によりアシスト対話モードを形成する。また第4の動
作態様は、前記の一定時間でのモードがアシスト対話モ
ードである場合に現れる。このときは上記のタイムアウ
ト処理の実行により当該対話を一時停止するための一時
停止対話に移行する。
ら認識結果を受信したか否か判断する。受信していれば
(Yes)、次の対話へ移行する(END)。 ステップS32:対話処理部13は、上記の受信がなけ
れば(No)、上記のタイムアウト処理を実行し、上記
の一定時間が経過したか否か判断する。経過していなけ
れば(No)、上記ステップS31とS32を繰り返
す。
の一定時間が経過いていれば(Yes)、その一定時間
での(現在の)モードが基本対話モードか否か判断す
る。 ステップS34:上記の判断結果が、基本対話モードで
あることを示していれば(Yes)、上記アシスト対話
モードへ移行する。 ステップS35:上記の判断結果が、基本対話モードで
ないことを示していれば(No)、上記の一時停止対話
に移行する。
ユーザを手助けする対話へユーザを案内することができ
る。また上記ステップS35に入れば、対話処理部13
は、例えば「ここで対話を一時停止します」というメッ
セージをユーザに返し、ユーザは自分の置かれている状
況を確認することができる。図11はアシスト対話モー
ド生成手段9による第5および第6の動作態様を表すフ
ローチャートである。
の動作態様での対話を一時停止するための一時停止対話
のもとで、ユーザが対話再開スイッチ(図1のSW)を
オンとした後にタイムアウト処理が実行されるとき、こ
のタイムアウト処理の実行により、音声入力を中止する
ための中心対話に移行する。また第6の動作態様では、
対話処理部13が、アシスト対話モードで動作中に再び
前述の一定時間が経過したとき、そのアシスト対話モー
ドとは異なる、一層詳細な対話内容を有する別のアシス
ト対話モードに移行する。
ら認識結果を受信したか否か判断する。受信していれば
(Yes)、次の対話へ移行する(END)。 ステップS42:対話処理部13は、上記の受信がなけ
れば(No)、上記のタイムアウト処理を実行し、上記
の一定時間が経過したか否か判断する。経過していなけ
れば(No)、上記ステップS41とS42を繰り返
す。
の一定時間が経過していれば(Yes)、その一定時間
でのモード(現在のモード)が一時停止対話か否か判断
する。 ステップS44:上記の判断結果が、一時停止対話であ
ることを示していれば(Yes)、上記の中止対話へ移
行する。
停止対話でないことを示していれば(No)、対話処理
部13は、現在の対話状態がアシスト対話モードか否か
判断する。Noであれば、図10のa)へ進む。 ステップS46:上記の判断の結果がYesであれば、
上述した異なる、一層詳細な対話内容を有する別のアシ
スト対話モードへ移行する。
ッセージを受け取ることができる。図12はアシスト対
話モード生成手段9による第7および第8の動作態様を
表すフローチャートである。第7の動作態様では、対話
処理部13が、ユーザの発話状態中に音声認識部12よ
り特定の音声入力を示す認識結果が与えられたとき、ア
シスト対話モードに移行する。
部13が、ユーザの発話状態中に特定のスイッチ(図1
のSW2)がオンになったことを検出したとき、アシス
ト対話モードに移行する。図12を参照すると、 ステップS51:対話処理部13は、ユーザから音声入
力を受け付ける対話状態であるか否か判断する。その判
断結果がNoならば処理を終了する(END)。
ならば、音声認識部12より、アシスト対話モードへ移
行することを示す音声入力の認識結果を受信したか否か
判断する。 ステップS53:上記の判断の結果がYesならば、ア
シスト対話モードに移行する。
ならば、ユーザにより、上記特定のスイッチSW2がオ
ンとされたか判断する。この判断結果がNoならば処理
を終了するが(END)、Yesならばアシスト対話モ
ードに移行する。かくしてユーザはより一層内容の深い
アシストメッセージを音声出力部16から得ることがで
きる。
カルなスイッチでも良いしタッチパネル形のスイッチで
も良く、あるいはGUI(Graphical Use
rInterface)でも良い。ユーザが発声により
指示することが逆に面倒ならば、このようなスイッチ操
作によることもできる。図13はアシスト対話モード生
成手段9による第9の動作態様を表すフローチャートで
あり、図14は第9の動作態様を図解的に表す図であ
る。
部13は、前述した基本対話モードおよびアシスト対話
モードのそれぞれの使用履歴を例えばメモリ(図示せ
ず)に保存し、そのアシスト対話モードの使用頻度が基
本対話モードの使用頻度を超えたとき、アシスト対話モ
ードと基本対話モードとを入れ替えるように動作する。
まず図14の方を参照すると、ある基本対話が、対話ノ
ード1→2→4のように進むように対話スクリプトデー
タに書き込まれていたものとする。そしてそれに対応す
るアシスト対話が、対話ノード1→3→5のように進む
ように同様に書き込まれていたものとする。
ところ、対話ノード1→3→5の使用頻度が、対話ノー
ド1→2→4の使用頻度よりも多いことが判明したもの
とする。そうすると対話処理部13は、上記の事実に基
づき、対話ノード1へ来たとき、初めから対話ノード3
→5へと遷移するシーケンスを設定するようにする。
対話シーケンスを、ユーザに最初から提供することがで
き、快適性は向上する。次に図13を参照すると、 ステップS 61:ユーザが通過した図14の対話ノード
の回数に関し、ノード3の回数がノード2の回数より大
きいか否か判断する。
sならば、対話ノード2と3の入替えを行う。 ステップS63:上記の判断の結果がNoならば、現状
のままとする。図15はアシスト対話モード生成手段9
による第10の動作態様を説明するための図(その1)
であり、図16は同図(その2)であり、図17は同図
(その3)である。
基本対話モードおよびアシスト対話モードが、それぞ
れ、階層構造をなす一連の複数対話ノードで構成される
とき、基本対話モードおよびアシスト対話モードの少な
くとも一方のモードについて、各対話ノードの使用履歴
を例えばメモリ(図示せず)に保存し、各対話ノードの
使用頻度が高い階層のノードから低い階層のノードへ順
次階層の入替えを行う。
対話ノード2に遷移してくる対話の流れを示しており、
該ノード1→2→8は基本対話モードに属し該ノード3
→4→5→7はアシスト対話モードに属するものとす
る。ここでその対話ノード2に推移してくる各対話ノー
ドの使用履歴が、例えば図16に示すような結果になっ
たものとする。そうすると、最終的に対話ノード5を通
過する回数は4回、同様に、対話ノード4は3回、対話
ノード3は2回ということになり、対話ノードは使用頻
度の高い順から5→4→3となる。
の並べ替えをすると、図17に示すごとくなる。このよ
うにすると当該ユーザにとって最も自然な対話の流れに
自動的に移っていくことになり、快適性は向上する。
1に、対話データベース5に収容される対話スクリプト
データのデータサイズを従来よりも大幅に縮少すること
ができる。また第2に、ユーザにとって従来よりも一層
快適な対話環境を提供することができる。
示す図である。
る。
的に示す図である。
図解的に示す図である。
ある。
作態様を表すフローチャートである。
作態様を表すフローチャートである。
よび第4の動作態様を表すフローチャートである。
よび第6の動作態様を表すフローチャートである。
よび第8の動作態様を表すフローチャートである。
動作態様を表すフローチャートである。
の動作態様を説明するための図(その1)である。
の動作態様を説明するための図(その2)である。
の動作態様を説明するための図(その3)である。
ある。
Claims (15)
- 【請求項1】 発話状態においてユーザから発声された
音声を入力する音声入力部と、 前記音声入力部からの前記音声を認識してその意味を解
析する音声認識部と、 前記音声認識部による認識結果に基づいて、予め対話デ
ータベース内に収容された対話スクリプトデータを参照
しつつ、ユーザに返すべき対話内容を生成する対話処理
部と、 前記対話内容に基づいて前記ユーザに対して合成音声を
返す音声出力部と、を備え、前記ユーザによる発声の都
度、前記対話スクリプトデータにより規定される一連の
対話状態を次々に遷移させて、アプリケーションプログ
ラムが要求する各種情報を前記ユーザから対話形式で収
集する音声対話システムにおいて、 前記対話処理部により参照されるグローバル遷移条件テ
ーブルをさらに設けてなり、該グローバル遷移条件テー
ブルには、前記発話状態において、いかなる前記対話状
態のもとでも共通に使用される複数のグローバル遷移条
件を予め格納し、 前記対話処理部は、前記発話状態における前記の発声の
内容が該グローバル遷移条件に該当するとき、前記グロ
ーバル遷移条件テーブルにアクセスして前記対話内容を
生成することを特徴とする音声対話システム。 - 【請求項2】 前記グローバル遷移条件テーブルは、予
め定めた複数のグローバル遷移条件のそれぞれに対応し
た個別の対話内容を格納する複数のグローバル遷移ファ
イルを特定することを特徴とする請求項1に記載の音声
対話システム。 - 【請求項3】 前記複数のグローバル遷移ファイルの各
々は、遷移先対話IDを特定する対話ID情報と、特定
された該遷移先対話IDにより展開される一連の対話シ
ーケンス内の遷移先ノードIDを特定するノードID情
報とを格納することを特徴とする請求項1または2に記
載の音声対話システム。 - 【請求項4】 前記対話ID情報および前記ノードID
情報が、それぞれ、各種の遷移先を機能表現したコード
によって記述されることを特徴とする請求項3に記載の
音声対話システム。 - 【請求項5】 発話状態においてユーザから発声された
音声を入力する音声入力部と、 前記音声入力部からの前記音声を認識してその意味を解
析する音声認識部と、 前記音声認識部による認識結果に基づいて、予め対話デ
ータベース内に収容された対話スクリプトデータを参照
しつつ、ユーザに返すべき対話内容を生成する対話処理
部と、 前記対話内容に基づいて前記ユーザに対して合成音声を
返す音声出力部と、を備え、前記ユーザによる発声の都
度、前記対話スクリプトデータにより規定される一連の
対話状態を次々に遷移させて、アプリケーションプログ
ラムが要求する各種情報を前記ユーザから対話形式で収
集する音声対話システムにおいて、 前記対話処理部は、基本対話モードの他にアシスト対話
モードでも動作し、 ここに前記基本対話モードは、前記アプリケーションプ
ログラムが要求する各種情報を収集する通常の一連の対
話の流れを形成するモードであり、前記アシスト対話モ
ードは、前記一連の対話の流れを維持できない異常時に
形成されるモードであることを特徴とする音声対話シス
テム。 - 【請求項6】 前記対話処理部は、前記音声認識部より
「認識せず」を示す認識結果が連続して与えられたと
き、前記アシスト対話モードに移行して動作することを
特徴とする請求項5に記載の音声対話システム。 - 【請求項7】 前記対話処理部は、前記音声認識部より
「認識エラーあり」を示す認識結果が連続して与えられ
たとき、音声入力を中止するための中止対話モードで動
作することを特徴とする請求項5に記載の音声対話シス
テム。 - 【請求項8】 前記対話処理部は、前記音声認識部より
予め定めた一定時間を経過しても、前記認識結果が与え
られないとき、タイムアウト処理を実行し、 前記一定時間でのモードが前記基本対話モードであると
きは、前記タイムアウト処理の実行により前記アシスト
対話モードを形成することを特徴とする請求項5に記載
の音声対話システム。 - 【請求項9】 前記対話処理部は、前記音声認識部より
予め定めた一定時間を経過しても、前記認識結果が与え
られないとき、タイムアウト処理を実行し、 前記一定時間でのモードが前記アシスト対話モードであ
るときは、前記タイムアウト処理の実行により当該対話
を一時停止するための一時停止対話に移行することを特
徴とする請求項5に記載の音声対話システム。 - 【請求項10】 前記の対話を一時停止するための一時
停止対話のもとで、対話再開スイッチをオンとした後に
前記タイムアウト処理が実行されるとき、該タイムアウ
ト処理の実行により、音声入力を中止するための中止対
話に移行することを特徴とする請求項9に記載の音声対
話システム。 - 【請求項11】 前記対話処理部が、前記アシスト対話
モードで動作中に再び前記一定時間が経過したとき、そ
のアシスト対話モードとは異なる対話内容を有する別の
アシスト対話モードに移行することを特徴とする音声対
話システム。 - 【請求項12】 前記対話処理部が、前記アシスト対話
モードでユーザの発話状態中に前記音声認識部より特定
の音声入力を示す認識結果が与えられたとき、アシスト
対話モードに移行することを特徴とする請求項5に記載
の音声対話システム。 - 【請求項13】 前記対話処理部が、ユーザの発話状態
中に特定のスイッチがオンになったことを検出したと
き、アシスト対話モードに移行することを特徴とする請
求項5に記載の音声対話システム。 - 【請求項14】 前記基本対話モードおよび前記アシス
ト対話モードのそれぞれの使用履歴を保存し、該アシス
ト対話モードの使用頻度が該基本対話モードの使用頻度
を超えたとき、該アシスト対話モードと該基本対話モー
ドとを入れ替えることを特徴とする請求項5に記載の音
声対話システム。 - 【請求項15】 前記基本対話モードおよび前記アシス
ト対話モードが、それぞれ、階層構造をなす一連の複数
対話ノードで構成されるとき、 前記基本対話モードおよび前記アシスト対話モードの少
なくとも一方のモードについて、各前記対話ノードの使
用履歴を保存し、各該対話ノードの使用頻度が高い階層
のノードから低い階層のノードへ順次階層の入替えを行
うことを特徴とする請求項5に記載の音声対話システ
ム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000266027A JP2002073080A (ja) | 2000-09-01 | 2000-09-01 | 音声対話システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000266027A JP2002073080A (ja) | 2000-09-01 | 2000-09-01 | 音声対話システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002073080A true JP2002073080A (ja) | 2002-03-12 |
Family
ID=18753198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000266027A Pending JP2002073080A (ja) | 2000-09-01 | 2000-09-01 | 音声対話システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002073080A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316385A (ja) * | 2002-04-24 | 2003-11-07 | Hitachi Ltd | 音声対話システム及び音声対話方法 |
CN107943834A (zh) * | 2017-10-25 | 2018-04-20 | 百度在线网络技术(北京)有限公司 | 人机对话的实现方法、装置、设备及存储介质 |
JP2020530606A (ja) * | 2017-10-04 | 2020-10-22 | グーグル エルエルシー | ユーザ構成され、カスタマイズされた対話型ダイアログアプリケーション |
CN113539261A (zh) * | 2021-06-30 | 2021-10-22 | 大众问问(北京)信息科技有限公司 | 人机语音交互方法、装置、计算机设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04338817A (ja) * | 1991-05-16 | 1992-11-26 | Sony Corp | 電子機器の制御装置及び制御方法 |
JPH07160289A (ja) * | 1993-12-06 | 1995-06-23 | Canon Inc | 音声認識方法及び装置 |
JPH07239694A (ja) * | 1994-03-02 | 1995-09-12 | Oki Electric Ind Co Ltd | 音声対話装置 |
JPH07295784A (ja) * | 1994-04-25 | 1995-11-10 | Hitachi Ltd | 音声による情報処理装置 |
JPH09114493A (ja) * | 1995-10-19 | 1997-05-02 | N T T Data Tsushin Kk | 対話制御装置 |
JPH1031497A (ja) * | 1996-07-18 | 1998-02-03 | Hitachi Ltd | 音声対話制御方法および音声対話システム |
JPH10111698A (ja) * | 1996-10-07 | 1998-04-28 | Mitsubishi Electric Corp | 音声対話システム |
JPH11325995A (ja) * | 1998-05-21 | 1999-11-26 | Matsushita Electric Ind Co Ltd | 流量計測装置 |
JP2000122685A (ja) * | 1998-10-09 | 2000-04-28 | Denso Corp | ナビゲーションシステム |
-
2000
- 2000-09-01 JP JP2000266027A patent/JP2002073080A/ja active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04338817A (ja) * | 1991-05-16 | 1992-11-26 | Sony Corp | 電子機器の制御装置及び制御方法 |
JPH07160289A (ja) * | 1993-12-06 | 1995-06-23 | Canon Inc | 音声認識方法及び装置 |
JPH07239694A (ja) * | 1994-03-02 | 1995-09-12 | Oki Electric Ind Co Ltd | 音声対話装置 |
JPH07295784A (ja) * | 1994-04-25 | 1995-11-10 | Hitachi Ltd | 音声による情報処理装置 |
JPH09114493A (ja) * | 1995-10-19 | 1997-05-02 | N T T Data Tsushin Kk | 対話制御装置 |
JPH1031497A (ja) * | 1996-07-18 | 1998-02-03 | Hitachi Ltd | 音声対話制御方法および音声対話システム |
JPH10111698A (ja) * | 1996-10-07 | 1998-04-28 | Mitsubishi Electric Corp | 音声対話システム |
JPH11325995A (ja) * | 1998-05-21 | 1999-11-26 | Matsushita Electric Ind Co Ltd | 流量計測装置 |
JP2000122685A (ja) * | 1998-10-09 | 2000-04-28 | Denso Corp | ナビゲーションシステム |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316385A (ja) * | 2002-04-24 | 2003-11-07 | Hitachi Ltd | 音声対話システム及び音声対話方法 |
JP2020530606A (ja) * | 2017-10-04 | 2020-10-22 | グーグル エルエルシー | ユーザ構成され、カスタマイズされた対話型ダイアログアプリケーション |
US11341968B2 (en) | 2017-10-04 | 2022-05-24 | Google Llc | User-configured and customized interactive dialog application |
US11676602B2 (en) | 2017-10-04 | 2023-06-13 | Google Llc | User-configured and customized interactive dialog application |
CN107943834A (zh) * | 2017-10-25 | 2018-04-20 | 百度在线网络技术(北京)有限公司 | 人机对话的实现方法、装置、设备及存储介质 |
CN107943834B (zh) * | 2017-10-25 | 2021-06-11 | 百度在线网络技术(北京)有限公司 | 人机对话的实现方法、装置、设备及存储介质 |
CN113539261A (zh) * | 2021-06-30 | 2021-10-22 | 大众问问(北京)信息科技有限公司 | 人机语音交互方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7546382B2 (en) | Methods and systems for authoring of mixed-initiative multi-modal interactions and related browsing mechanisms | |
US7249025B2 (en) | Portable device for enhanced security and accessibility | |
US6430531B1 (en) | Bilateral speech system | |
JP3811280B2 (ja) | ハイパーリンク化された情報との音声化されたインターフェースのためのシステムおよび方法 | |
KR101042119B1 (ko) | 음성 이해 시스템, 및 컴퓨터 판독가능 기록 매체 | |
KR100679043B1 (ko) | 음성 대화 인터페이스 장치 및 방법 | |
JP4155854B2 (ja) | 対話制御システム及び方法 | |
JP3178426B2 (ja) | 自然言語対話システム及び自然言語対話プログラム記録媒体 | |
JPH0991112A (ja) | マルチモーダル対話装置及び対話方法 | |
US6456973B1 (en) | Task automation user interface with text-to-speech output | |
CN102024013A (zh) | 启动包括第一功能和第二功能的多个功能的系统和方法 | |
WO2004032113A1 (ja) | 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム | |
JP2001268669A (ja) | 移動電話端末を利用した機器制御装置、方法、及び記録媒体 | |
JP4783608B2 (ja) | 対話方法、対話装置、対話プログラムおよび記録媒体 | |
JP2002073080A (ja) | 音声対話システム | |
JP2001056694A (ja) | 対話型ユーザインタフェース装置 | |
JP3468572B2 (ja) | 対話処理装置 | |
JP2003030187A (ja) | 自動通訳システム、会話学習装置、自動通訳装置及びその方法並びにそのプログラム | |
JP4377718B2 (ja) | 対話制御システム及び方法 | |
JP3615309B2 (ja) | データ検索装置および方法、情報記憶媒体 | |
JP2006058641A (ja) | 音声認識装置 | |
JP2002259113A (ja) | 音声マクロ処理装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体 | |
Schnelle et al. | Audio Navigation Patterns. | |
JP2005004716A (ja) | 異言語間対話処理方法およびその装置、ならびにそのプログラムと記録媒体 | |
JP2005164944A (ja) | 動作パラメータ決定装置、電子装置、音声合成装置、対話システム、動作パラメータ決定方法、及びコンピュータで読み取り可能な制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070903 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100629 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101214 |