JP2004240225A - 音声対話装置、音声対話システム、音声対話方法、プログラム及び記録媒体 - Google Patents
音声対話装置、音声対話システム、音声対話方法、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2004240225A JP2004240225A JP2003030156A JP2003030156A JP2004240225A JP 2004240225 A JP2004240225 A JP 2004240225A JP 2003030156 A JP2003030156 A JP 2003030156A JP 2003030156 A JP2003030156 A JP 2003030156A JP 2004240225 A JP2004240225 A JP 2004240225A
- Authority
- JP
- Japan
- Prior art keywords
- understanding
- utterance
- voice
- language understanding
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 59
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 title claims description 21
- 238000012545 processing Methods 0.000 claims abstract description 16
- 230000005540 biological transmission Effects 0.000 claims description 13
- 238000012546 transfer Methods 0.000 abstract description 2
- 230000006854 communication Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
【課題】複数の音声対話装置の間で協調して利用者との対話によって所定の動作を行うことを可能にする。
【解決手段】現在処理を行っている音声対話装置(例えば40−1)で利用者の発話の言語理解に失敗した場合に、該音声対話装置40−1は、利用者の直前の発話を処理した他の音声対話装置(例えば40−2)へ言語理解失敗を伝達する。音声対話装置40−2は、音声対話装置40−1から言語理解の失敗を受理すると、生成済みの理解状態をもとに、言語理解規則を逆解析して、取り得る発話内容を言語理解失敗元の音声対話装置40−1へ伝達する。音声対話装置40−1は、音声対話装置40−2から逆解析結果の発話内容を受理すると、該発話内容をもとに装置の現在の理解状態を生成する。
【選択図】 図1
【解決手段】現在処理を行っている音声対話装置(例えば40−1)で利用者の発話の言語理解に失敗した場合に、該音声対話装置40−1は、利用者の直前の発話を処理した他の音声対話装置(例えば40−2)へ言語理解失敗を伝達する。音声対話装置40−2は、音声対話装置40−1から言語理解の失敗を受理すると、生成済みの理解状態をもとに、言語理解規則を逆解析して、取り得る発話内容を言語理解失敗元の音声対話装置40−1へ伝達する。音声対話装置40−1は、音声対話装置40−2から逆解析結果の発話内容を受理すると、該発話内容をもとに装置の現在の理解状態を生成する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、音声対話装置に関し、詳しくは、利用者と音声による対話によって所定の動作を行う音声対話装置が複数存在する環境において、現在処理を行っている音声対話装置で理解不能な場合に、他の音声対話装置との通信により音声対話を可能にする技術に関する。
【0002】
【従来の技術】
近年、音声認識技術の発展により、利用者との対話によって所定の動作を行う音声対話装置が実用化されてきている。たとえば、天気情報の案内やスケジュール管理や飛行機の乗り換えなどを音声での対話によって行う音声対話装置が知られている。このような音声対話装置が複数存在し、一人の利用者が続けて利用する場合、文脈を利用した処理を行うと利用者にとっての利便性が増すと考えられる。
【0003】
例えば、カレンダ検索を行う音声対話装置とスケジュール管理を行う音声対話装置が存在する場合での以下のような対話を考える。
【0004】
利用者:「来週の木曜日は何日だっけ?」
カレンダ検索装置:「18日です。」
利用者:「その日の予定を教えて」
スケジュール管理装置:「午後から山田部長との打ちあわせです。」
【0005】
この対話例では、利用者の2回目の発話における「その日」が「来週の木曜日」つまり「18日」であることがスケジュール管理装置に理解できて初めて成立する。
【0006】
このような文脈を利用した処理を行うために少なくとも解決されなけばならない課題として音声対話装置が保持している利用者発話の理解内容を音声対話装置間で交換する方法が必要である。従来、このような交換方法として、やりとりの規格を決めた上でCORBAやソケット通信などを介して音声対話装置間の情報交換をする方法が提案されている(例えば、非特許文献1参照)。
【0007】
【非特許文献1】
「会話型エージェントシステムの実現」1999年電子情報通信学会基礎・境界ソサイエティ大会講演論文集,SA−6−8,pp.241−242,September,1999
【0008】
【発明が解決しようとする課題】
しかし、上記のような方法を取る場合、音声対話装置が単一で動作する場合の機構に加えて、他のシステムとの通信用に特別な機構を準備する必要がある。これらの特別な機構は2つに大別でき、1つはCORBAやソケットという通信手段に関する機構であり、もう1つはその通信手段の上でやりとりする通信内容を決定する機構である。
【0009】
さらに、通信相手における情報の保持形態に合わせた変更が必要であるという問題もある。例えば、音声対話装置Aにおいて、都市という概念を表現するために「〇〇県」という県名と「〇〇市」という市名の2つの項目に分けていたとする。一方、音声対話装置Bにおいては、都市という概念を表現うるために「〇〇県〇〇市」という1つの項目で表現していたとする。これらの音声対話装置AとBの間の通信を行うためには、どちらか一方の表現形式を変更するか、通信過程において表現方法を変更する必要がある。
【0010】
本発明の目的は、上記のような問題点に鑑み、音声対話装置が単体で動作するときに必要な機構に僅かな変更を加えるだけで、他の音声対話装置と情報をやり取りし、協調して利用者と音声対話を行えるようにすることにある。
【0011】
【課題を解決するための手段】
本発明は、利用者の発話を文字列に変換する手段、前記文字列を、あらかじめ保持されている言語理解規則によって装置が理解できる表現の理解状態に変換する手段、前記理解状態の内容に応じて装置の発話内容を決定する手段、前記決定された発話内容に従って音声を生成する手段を備えた音声対話装置において、所定の理解状態が得られない場合に、言語理解が失敗したことを利用者の直前の発話を受理した他の音声対話装置に伝達する手段と、前記他の音声対話装置から言語理解の失敗を受理した場合、生成済みの理解状態をもとに、言語理解規則を逆解析して、取り得る発話内容を逆解析結果として前記他の音声対話装置へ伝達する手段と、前記他の音声対話装置から逆解析結果の発話内容を受理した場合に、該発話内容をもとに装置の現在の理解状態を生成する手段とを有することを特徴としている。
【0012】
また、本発明は、各々が利用者の発話を文字列に変換する手段、前記文字列を、あらかじめ保持されている言語理解規則によって装置が理解できる表現の理解状態に変換する手段、前記理解状態の内容に応じて装置の発話内容を決定する手段、前記決定された発話内容に従って音声を生成する手段を備えた複数の音声対話装置からなる音声対話システムにおいて、利用者の発話毎に適切な音声対話装置を選択し、該選択した音声対話装置へ利用者の発話を出力する対話装置選択部と、前記対話装置選択部による装置選択履歴を保持する選択履歴記憶部とを備え、また、前記音声対話装置は、所定の理解状態が得られない場合に、無前記選択履歴記憶部を参照して、言語理解が失敗したことを利用者の直前の発話を受理した他の音声対話装置に伝達する手段、前記他の音声対話装置から言語理解の失敗を受理した場合、生成済みの理解状態をもとに、言語理解規則を逆解析して、取り得る発話内容を逆解析結果として前記他の音声対話装置へ伝達する手段、前記他の音声対話装置から逆解析結果の発話内容を受理した場合に、該発話内容をもとに装置の現在の理解状態を生成する手段を更に備えることを特徴とする。
【0013】
【発明の実施の形態】
図1に本発明にかかる音声対話システムの一実施例の全体ブロック図を示す。
本音声対話システムは、利用者の音声を電気信号である音声信号に変換するマイク等の音声入力部10、利用者の発話毎に音声対話装置を選択する対話装置選択部20、該対話装置選択部20による装置選択履歴を記憶する選択履歴記憶部30、それぞれ利用者と音声による対話によって所定の動作を行う複数の音声対話装置40−1〜40−N、該音声対話装置40−1〜40−Nからの音声信号を音声に変換して利用者へ出力するスピーカ等の音声出力部50から構成される。
【0014】
ここで、対話装置選択部20は、具体的には、利用者の発話が音声入力部10によって電気信号に変換された音声信号を受け取り、発話毎に適切な音声対話装置を選択して、該選択された音声対話装置へ利用者の発話内容の音声信号を出力し、選択されなかった音声対話装置への出力は抑制する。
【0015】
対話装置選択部20での装置選択の実現方法としては、一つは利用者が手動選択する方法、もう一つは利用者の発話した音声内容に従って自動選択する方法がある。
【0016】
利用者が手動選択する方法の場合、対話装置選択部20では、音声入力部10からの利用者発話内容の他に、利用者の意図(装置指定)を反映するスイッチの出力を入力として受け取る。利用者意図を反映するためのスイッチは、例えば、各音声対話装置40−1〜40−Nの担当する話題分野の名前、例えば、「スケジュール管理」や「カレンダ」などを記したいボタンとして実現される。対話装置選択部20は、スイッチ等の出力を受け取ることで、利用者の意図(指定)した音声対話装置を選択する。
【0017】
一方、自動選択する方法は、本発明者等が別途提案した話題分野選択技術を利用する(特願2003−28913)。これは、あらかじめ収集した利用者の発話から作成された発話の文字列と話題分野の対応関係を保持する話題分野選択データベースを利用する方法である。対話装置選択部20は、利用者の発話内容の音声信号を認識し、認識結果の文字列を出力する音声認識手段を内蔵し、該認識結果の文字列をもとに、話題分野選択データベースを参照して、利用者の発話に対する適切な話題分野を判定し、適切な音声対話装置を選択する。
【0018】
上記した利用者が手動選択する方法または自動選択する方法のいずれにおいても、対話装置選択部20では、選択動作毎に、ユーザ発話と選択通し番号と選択した対話装置名との3つ組を選択履歴記憶部30に記録しておく。選択履歴記憶部30は各音声対話装置40−1〜40−Nで共有されて、後述するように、現在処理を行っている音声対話装置で理解不能になった場合、当該音声対話装置が直前に処理を行った他の音声対話装置を選択する際に利用される。
【0019】
図2に音声対話装置40−1の一実施例の構成図を示す。この構成は他の音声対話装置40−2〜40−Nについてもまったく同様である。図2において、音声認識部41、言語理解部42、対話制御部43、発話生成部44、理解規則記憶部45、理解状態記憶部46は既存の一般的な音声対話装置の構成と同じである。すなわち、音声認識部41は、音声入力部10からの利用者が発話した音声信号を対話装置選択部20を介して入力し、該入力された音声信号を文字列に変換する。言語理解部42は、音声認識部41の出力した文字列を理解状態と呼ばれる該装置内で理解できる表現に変換する。理解規則記憶部45は言語理解規則と呼ばれる利用者(ユーザ)の発話に対応する文字列から理解状態に変換するための規則を保持している。言語理解部42では、該理解規則記憶部45の言語理解規則を参照して、発話の文字列を理解状態に変換する。変換された理解状態は理解状態記憶部46に保持する。対話制御部43は、該理解状態の内容に応じて当該装置の発話内容を決定する。発話生成部44は、該決定された発話内容に沿った音声信号を生成して音声出力部50へ出力する。
【0020】
ここで、理解状態は1つのユーザ(利用者)の要求の種識別子と複数の項目名と値の組で構成されている。たとえば、カレンダ検索を行う音声対話装置であれば、曜日を問う要求種識別子askdayofweek、日付を問う要求種識別子askdateなどが要求種級別子として用意され、項目名としては「年」「月」「日」「曜日」「特別な日」などをもち、それぞれの値としては、たとえば、「2002」「10」「20」「金曜日」「勤労感謝の日」などが入り得る。後述する図5の理解規則の場合、例えば、「2002年の元旦は何曜日ですか」という発話は、理解規則1によって、
「(req=askdayofweek、特別な日=元旦、年=2002)」
という理解状態をもたらす。
【0021】
言語理解失敗伝達部47は、理解規則中に適当な規則が存在しないために、言語理解部42において利用者の言語発話文字列から理解状態への変換に失敗(言語理解の失敗)した場合、該言語理解が失敗したことを利用者の一つ前の発話を受理した他の音声対話装置の言語理解逆解析部に伝達する。どれが利用者の一つ前の発話を受理した音声対話装置であるかは、図1の選択履歴記憶部30を参照して、通し番号の値が最大値よりも一つ小さい値であるような音声対話装置を選択することによって実現することができる。
【0022】
言語理解逆解析部48は、他の音声対話装置に組み込まれた言語理解失敗伝達部より言語理解の失敗を受理した場合に、理解状態記憶部46に既に保持された理解状態をもとに、理解規則記憶部45の言語理解規則を逆解析して、相手音声対話装置(言語理解失敗元音声対話装置)の現在の理解状態をもたらしうる全ての発話内容(文字列)を生成する。生成した発話内容は送信元音声対話装置に組み込まれた逆解析結果受領部に伝達する。
【0023】
逆解析結果受領部49は、他の音声対話装置に組み込まれた言語理解逆解析部より発話内容を受理した場合、該発話内容を文字列として言語理解部42によって言語解析して理解状態を生成する。すなわち、受理した逆解析結果の発話内容それぞれを、当該音声対話装置が単体の音声対話装置として動作する場合と同様に言語理解部42を用いて言語理解を試みる。もしもどの逆解析結果も対応する理解規則がなく言語理解に失敗した場合は空の理解状態のまま通常の対話装置の動作を行う。もしも逆解析結果のうち理解規則を作成できるものがあった場合は、その理解規則の適用結果を装置の新しい理解状態とする。この際、もし複数の理解規則が適用可能であった場合、多数決、つまりもっとも多数作成された理解状態を装置の新しい理解状態とする。もしも多数決の場合に1位の結果が枚数ある場合は、理解状態中で値が定まっている項目数がもっとも多い結果を採用する。
【0024】
図3に本音声対話システムの全体的処理フロー図を示す。ここでは、音声対話装置40−1が利用者の現在発話を入力し、また、音声対話装置40−2が利用者の一つ前の発話を受理して、その理解状態が得られているとする。
【0025】
音声対話装置40−1では、音声入力部10から対話装置選択部20を介して利用者の発話音声信号を入力すると(S101)、音声認識部41が利用者の発話を文字列に変換し(S102)、言語処理部42が理解規則記憶部45の理解規則を参照して該文字列の理解状態への変換を試みる(S103)。ここで、言語理解が成功した場合(S104でNO)、言語理解部42にて理解状態が生成される(S105)。対話制御部43は、理解状態の内容に応じて該対話装置40−1の発話内容を決定し(S106)、発話生成部44は該決定した発話内容に従って音声信号を生成し、音声出力部50へ出力する(S107)。一方、言語理解部42において言語理解に失敗した場合(S104でYES)、言語理解失敗伝達部47は、選択履歴記憶部30を参照して利用者の一つ前の発話を受理した音声対話装置(ここでは、音声対話装置40−2)を選択し、該対話装置40−2の言語理解逆理解部に対して、言語理解が失敗したことを伝達する(S111)。伝達文には発信元装置ID、受信先装置IDが追加される。
【0026】
音声対話装置40−2の言語理解逆解析部48は、音声対話装置40−1から言語理解の失敗を受理すると(S201)、理解状態記憶部46に保持されている利用者の一つ前の発話に対する理解状態をもとに、理解規則記憶部45の言語理解規則を逆解析することで、音声対話装置40−1の現在の理解状態をもたらしうるすべて発話内容を生成する(S202)。そして、言語理解逆解析部48は、この生成した一つあるいはそれ以上の発話内容(文字列)を逆解析結果として音声対話装置40−1の逆解析結果受領部へ伝達する(S203)。この場合も、伝達文には発信元装置ID、受信先装置IDが追加される。
【0027】
音声対話装置40−1の逆解析結果受領部49は、音声対話装置40−2から逆解析結果の発話内容を受理すると(S112)、その発話内容それぞれについて、言語理解部42を用いて言語理解処理を試みる(S113)。そして、逆解析結果のうち、対応する理解規則の適用結果を当該装置の新しい理解状態とする。その後の動作は先の言語理解に成功した場合と同様である。また、もしも複数の理解規則が適用可能であった場合には、多数決等で理解状態を決める。また、もしもど逆解析結果も対応する理解規則がなく言語理解に失敗した場合は空の理解状態のまま通常の対話装置の動作を行う。
【0028】
次に、本音声対話システム、音声対話装置の具体的動作例について詳述する。例として、言語理解失敗伝達元がカレンダ検索を行う音声対話装置であり、言語理解失敗伝達先がスケジュール管理を行う音声対話装置である場合を考える。
【0029】
図4にシステムの概念図を示す。図4において、40−Aがスケジュール管理を行う音声対話装置(以下、スケジュール管理装置)、40−Bがカレンダ検索を行う音声対話装置(以下、カレンダ検索装置)であるとする。また、図4では本発明に関係する構成のみを示し、他は省略してある。図5にカレンダ検索装置40−Bが具備する言語理解規則の一例を示す。また、図6にスケジュール管理装置40−Aが具備する言語理解規則の一例を示す。
【0030】
いま、利用者がカレンダ検索装置40−Bに対してカレンダ検索を行った後、スケジュール管理装置40−Aに対してスケジュールの案内を要求する場合を考える。具体例として、
「1月1日は何の日」
(カレンダ装置応答)
「その日の予定は」
(スケジュール装置応答)
という発話系列を用いる。
【0031】
カレンダ検索装置40−Bの言語理解部42Bでは、「1月1日は何の日」という発話は、図5における理解規則8と対応がつくのでこの規則が適用される。
この規則が適用された結果、理解状態「(req=askspeciel,月=1月,日=1日)」が得られる。この結果、カレンダ検索装置40−Bは単体の装置の場合と同様、「元日です」といった発話を行うことになる。
【0032】
次に、図4においては、利用者は、「その日の予定は」という発話がスケジュール管理装置40−Aに向けらている。図6に示すスケジュール管理装置40−Aの理解規則中には適当な規則が存在しないため、言語理解部42Aにおける言語理解は失敗する。この場合、言語理解失敗伝達部47Aは、1つ前の発話を受理したカレンダ検索装置40−Bの言語理解逆解析部48Bに対して言語理解の失敗を伝達する。もしもスケジュール管理装置40−A中に利用者発話に対応する理解規則が存在し、言語理解に成功した場合には、言語理解失敗伝達部47Aは何も行わない。
【0033】
カレンダ検索装置40−Bの言語理解逆解析部48Bはスケジュール管理装置40−Aの言語理解失敗伝達部47Aより言語理解の失敗を受理した場合、当該カレンダ検索装置40−Bの言語理解規則(図5)を逆解析して、スケジュール管理装置40−Aの最後の理解状態をもたらしうるすべての発話を再現する。
【0034】
まず、理解規則の中から、装置の最後の理解状態中の要求種識別子と同一の要求種識別子を理解規則の右辺(→の右側)の理解状態中にもつ規則の左辺(→の左側)をすべて集める。次に集めた規則の左辺の変数部分(*月など)を装置の最後の理解状態中の対応する項目の値によって置き換える。もしも規則の左辺の変数部分に対応する項目の値が存在しない場合はその規則に関しては言語理解逆解析部48Bはこれ以上の処理は行わない。こうして置き換えによって得られた逆解析結果の文字列を、言語理解に失敗したスケジュール管理装置40−Aの逆解析結果受領部49Aに送信する。以上で逆解析の完了である。
【0035】
いま、カレンダ検索装置40−Bでの最後の理解状態が「(req=askpecial,月=1月,日=1日)」であるので、まず、図5に示す理解規則6,7,8の左辺である「*月 *日 は *特別な日だっけ」「*月 *日は」「*月 *日 は 何の日」が集められる。理解規則6は最後の理解状態中の項目がないので無視され、結局、言語理解逆解析結果として、理解規則7,8に対応する「1月1日は」「1月1日は何の日」という文字列が得られる。
【0036】
このように、言語理解逆解析部では、言語理解部の逆解析による発話内容生成するために、現在の理解状態をもたらしうる理解規則を検索する。すなわち、理解規則の右辺にある理解状態によって満たされている項目名と、現在の理解状態において満たされれている項目名が一致するような理解規則を検索する。次に、検索された理解規則の右辺の変数を、理解状態中の項目の値で置き換える。
【0037】
スケジュール管理装置40−Aの逆解析結果受領部49Aでは、カレンダ検索装置40−Bの言語理解逆解析部48Bより送られてきた逆解析結果について言語理解部42Aを用いて、理解状態を作成する。すなわち、逆解析結果それぞれを、当該スケジュール管理装置40−Aが単体の音声対話装置として動作する場合と同様に言語理解部42Aを用いて言語理解を試みる。もしもどの逆解析結果も対応する理解規則がなく言語理解に失敗した場合は空の理解状態のまま通常の対話装置の動作を行う。もしも逆解析結果のうち理解規則を作成できるものがあった場合は、その理解規則の適用結果を装置の新しい理解状態とする。この際、もし複数の理解規則が適用可能であった場合、多数決、つまりもっとも多数作成された理解状態を装置の新しい理解状態とする。もしも多数決の場合に1位の結果が枚数ある場合は、理解状態中で値が定まっている項目数がもっとも多い結果を採用する。
【0038】
例では、スケジュール管理装置40−Aの逆解析結果受領部49Aでは、カレンダ検索装置40−Bの言語理解逆解析部より送られた「1月1日は」「1月1日は何の日」を受けとる。図6より、「1月1日は」はスケジュール管理装置40−Aの理解規則2に対応するので、理解状態「(req=ask,月=1月,日=1日)」を作成可能である。一方、「1月1日は何の日」に対応する理解規則は存在しないので、理解状態を作成できない。この結果、逆解析結果受領部49Aは、言語理解部42Aに対して該スケジュール管理装置40−Aの理解状態を「(req=ask,月=1月,日=1日)」とするように指示する。この結果、スケジュール管理装置40−Aは「その日は会議の予定です」などの動作を行うことが可能になる。
【0039】
なお、図1、図2で示した装置における各部の一部もしくは全部の処理機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、あるいは、図3で示した処理手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることは言うまでもない。また、コンピュータでその処理機能を実現するためのプログラム、あるいは、コンピュータにその処理手順を実行させるためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えば、FD、MO、ROM、メモリカード、CD、DVD、リムーバブルディスクなどに記録して、保存したり、提供したりすることができるとともに、インターネット等のネットワークを通してそのプログラムを配布したりすることが可能である。
【0040】
【発明の効果】
本発明によれば、音声対話装置が単体で動作する際に必要な機構に加えて僅かな変更によって、複数の音声対話装置が協調して音声対話動作を行うための情報交換を実現することができる。
【図面の簡単な説明】
【図1】本発明にかかる音声対話システムの一実施例の全体構成図である。
【図2】本発明にかかる音声対話装置の一実施例の全体構成図である。
【図3】本発明にかかる音声対話システム・音声対話装置の全体的処理フロー図である。
【図4】本発明をカレンダ検索装置とスケジュール管理装置の組み合せに適用した場合のシステム概念図である。
【図5】カレンダ検索装置の言語理解規則の一例である。
【図6】スケジュール管理装置の言語理解規則の一例である。
【符号の説明】
10 音声入力部
20 対話装置選択部
30 選択履歴記憶部
40−1〜40−N 音声対話装置
50 音声出力部
41 音声認識部
42 言語理解部
43 対話制御部
44 発話生成部
45 理解規則記憶部
46 理解状態記憶部
47 言語理解失敗伝達部
48 言語理解逆解析部
49 逆解析結果受領部
【発明の属する技術分野】
本発明は、音声対話装置に関し、詳しくは、利用者と音声による対話によって所定の動作を行う音声対話装置が複数存在する環境において、現在処理を行っている音声対話装置で理解不能な場合に、他の音声対話装置との通信により音声対話を可能にする技術に関する。
【0002】
【従来の技術】
近年、音声認識技術の発展により、利用者との対話によって所定の動作を行う音声対話装置が実用化されてきている。たとえば、天気情報の案内やスケジュール管理や飛行機の乗り換えなどを音声での対話によって行う音声対話装置が知られている。このような音声対話装置が複数存在し、一人の利用者が続けて利用する場合、文脈を利用した処理を行うと利用者にとっての利便性が増すと考えられる。
【0003】
例えば、カレンダ検索を行う音声対話装置とスケジュール管理を行う音声対話装置が存在する場合での以下のような対話を考える。
【0004】
利用者:「来週の木曜日は何日だっけ?」
カレンダ検索装置:「18日です。」
利用者:「その日の予定を教えて」
スケジュール管理装置:「午後から山田部長との打ちあわせです。」
【0005】
この対話例では、利用者の2回目の発話における「その日」が「来週の木曜日」つまり「18日」であることがスケジュール管理装置に理解できて初めて成立する。
【0006】
このような文脈を利用した処理を行うために少なくとも解決されなけばならない課題として音声対話装置が保持している利用者発話の理解内容を音声対話装置間で交換する方法が必要である。従来、このような交換方法として、やりとりの規格を決めた上でCORBAやソケット通信などを介して音声対話装置間の情報交換をする方法が提案されている(例えば、非特許文献1参照)。
【0007】
【非特許文献1】
「会話型エージェントシステムの実現」1999年電子情報通信学会基礎・境界ソサイエティ大会講演論文集,SA−6−8,pp.241−242,September,1999
【0008】
【発明が解決しようとする課題】
しかし、上記のような方法を取る場合、音声対話装置が単一で動作する場合の機構に加えて、他のシステムとの通信用に特別な機構を準備する必要がある。これらの特別な機構は2つに大別でき、1つはCORBAやソケットという通信手段に関する機構であり、もう1つはその通信手段の上でやりとりする通信内容を決定する機構である。
【0009】
さらに、通信相手における情報の保持形態に合わせた変更が必要であるという問題もある。例えば、音声対話装置Aにおいて、都市という概念を表現するために「〇〇県」という県名と「〇〇市」という市名の2つの項目に分けていたとする。一方、音声対話装置Bにおいては、都市という概念を表現うるために「〇〇県〇〇市」という1つの項目で表現していたとする。これらの音声対話装置AとBの間の通信を行うためには、どちらか一方の表現形式を変更するか、通信過程において表現方法を変更する必要がある。
【0010】
本発明の目的は、上記のような問題点に鑑み、音声対話装置が単体で動作するときに必要な機構に僅かな変更を加えるだけで、他の音声対話装置と情報をやり取りし、協調して利用者と音声対話を行えるようにすることにある。
【0011】
【課題を解決するための手段】
本発明は、利用者の発話を文字列に変換する手段、前記文字列を、あらかじめ保持されている言語理解規則によって装置が理解できる表現の理解状態に変換する手段、前記理解状態の内容に応じて装置の発話内容を決定する手段、前記決定された発話内容に従って音声を生成する手段を備えた音声対話装置において、所定の理解状態が得られない場合に、言語理解が失敗したことを利用者の直前の発話を受理した他の音声対話装置に伝達する手段と、前記他の音声対話装置から言語理解の失敗を受理した場合、生成済みの理解状態をもとに、言語理解規則を逆解析して、取り得る発話内容を逆解析結果として前記他の音声対話装置へ伝達する手段と、前記他の音声対話装置から逆解析結果の発話内容を受理した場合に、該発話内容をもとに装置の現在の理解状態を生成する手段とを有することを特徴としている。
【0012】
また、本発明は、各々が利用者の発話を文字列に変換する手段、前記文字列を、あらかじめ保持されている言語理解規則によって装置が理解できる表現の理解状態に変換する手段、前記理解状態の内容に応じて装置の発話内容を決定する手段、前記決定された発話内容に従って音声を生成する手段を備えた複数の音声対話装置からなる音声対話システムにおいて、利用者の発話毎に適切な音声対話装置を選択し、該選択した音声対話装置へ利用者の発話を出力する対話装置選択部と、前記対話装置選択部による装置選択履歴を保持する選択履歴記憶部とを備え、また、前記音声対話装置は、所定の理解状態が得られない場合に、無前記選択履歴記憶部を参照して、言語理解が失敗したことを利用者の直前の発話を受理した他の音声対話装置に伝達する手段、前記他の音声対話装置から言語理解の失敗を受理した場合、生成済みの理解状態をもとに、言語理解規則を逆解析して、取り得る発話内容を逆解析結果として前記他の音声対話装置へ伝達する手段、前記他の音声対話装置から逆解析結果の発話内容を受理した場合に、該発話内容をもとに装置の現在の理解状態を生成する手段を更に備えることを特徴とする。
【0013】
【発明の実施の形態】
図1に本発明にかかる音声対話システムの一実施例の全体ブロック図を示す。
本音声対話システムは、利用者の音声を電気信号である音声信号に変換するマイク等の音声入力部10、利用者の発話毎に音声対話装置を選択する対話装置選択部20、該対話装置選択部20による装置選択履歴を記憶する選択履歴記憶部30、それぞれ利用者と音声による対話によって所定の動作を行う複数の音声対話装置40−1〜40−N、該音声対話装置40−1〜40−Nからの音声信号を音声に変換して利用者へ出力するスピーカ等の音声出力部50から構成される。
【0014】
ここで、対話装置選択部20は、具体的には、利用者の発話が音声入力部10によって電気信号に変換された音声信号を受け取り、発話毎に適切な音声対話装置を選択して、該選択された音声対話装置へ利用者の発話内容の音声信号を出力し、選択されなかった音声対話装置への出力は抑制する。
【0015】
対話装置選択部20での装置選択の実現方法としては、一つは利用者が手動選択する方法、もう一つは利用者の発話した音声内容に従って自動選択する方法がある。
【0016】
利用者が手動選択する方法の場合、対話装置選択部20では、音声入力部10からの利用者発話内容の他に、利用者の意図(装置指定)を反映するスイッチの出力を入力として受け取る。利用者意図を反映するためのスイッチは、例えば、各音声対話装置40−1〜40−Nの担当する話題分野の名前、例えば、「スケジュール管理」や「カレンダ」などを記したいボタンとして実現される。対話装置選択部20は、スイッチ等の出力を受け取ることで、利用者の意図(指定)した音声対話装置を選択する。
【0017】
一方、自動選択する方法は、本発明者等が別途提案した話題分野選択技術を利用する(特願2003−28913)。これは、あらかじめ収集した利用者の発話から作成された発話の文字列と話題分野の対応関係を保持する話題分野選択データベースを利用する方法である。対話装置選択部20は、利用者の発話内容の音声信号を認識し、認識結果の文字列を出力する音声認識手段を内蔵し、該認識結果の文字列をもとに、話題分野選択データベースを参照して、利用者の発話に対する適切な話題分野を判定し、適切な音声対話装置を選択する。
【0018】
上記した利用者が手動選択する方法または自動選択する方法のいずれにおいても、対話装置選択部20では、選択動作毎に、ユーザ発話と選択通し番号と選択した対話装置名との3つ組を選択履歴記憶部30に記録しておく。選択履歴記憶部30は各音声対話装置40−1〜40−Nで共有されて、後述するように、現在処理を行っている音声対話装置で理解不能になった場合、当該音声対話装置が直前に処理を行った他の音声対話装置を選択する際に利用される。
【0019】
図2に音声対話装置40−1の一実施例の構成図を示す。この構成は他の音声対話装置40−2〜40−Nについてもまったく同様である。図2において、音声認識部41、言語理解部42、対話制御部43、発話生成部44、理解規則記憶部45、理解状態記憶部46は既存の一般的な音声対話装置の構成と同じである。すなわち、音声認識部41は、音声入力部10からの利用者が発話した音声信号を対話装置選択部20を介して入力し、該入力された音声信号を文字列に変換する。言語理解部42は、音声認識部41の出力した文字列を理解状態と呼ばれる該装置内で理解できる表現に変換する。理解規則記憶部45は言語理解規則と呼ばれる利用者(ユーザ)の発話に対応する文字列から理解状態に変換するための規則を保持している。言語理解部42では、該理解規則記憶部45の言語理解規則を参照して、発話の文字列を理解状態に変換する。変換された理解状態は理解状態記憶部46に保持する。対話制御部43は、該理解状態の内容に応じて当該装置の発話内容を決定する。発話生成部44は、該決定された発話内容に沿った音声信号を生成して音声出力部50へ出力する。
【0020】
ここで、理解状態は1つのユーザ(利用者)の要求の種識別子と複数の項目名と値の組で構成されている。たとえば、カレンダ検索を行う音声対話装置であれば、曜日を問う要求種識別子askdayofweek、日付を問う要求種識別子askdateなどが要求種級別子として用意され、項目名としては「年」「月」「日」「曜日」「特別な日」などをもち、それぞれの値としては、たとえば、「2002」「10」「20」「金曜日」「勤労感謝の日」などが入り得る。後述する図5の理解規則の場合、例えば、「2002年の元旦は何曜日ですか」という発話は、理解規則1によって、
「(req=askdayofweek、特別な日=元旦、年=2002)」
という理解状態をもたらす。
【0021】
言語理解失敗伝達部47は、理解規則中に適当な規則が存在しないために、言語理解部42において利用者の言語発話文字列から理解状態への変換に失敗(言語理解の失敗)した場合、該言語理解が失敗したことを利用者の一つ前の発話を受理した他の音声対話装置の言語理解逆解析部に伝達する。どれが利用者の一つ前の発話を受理した音声対話装置であるかは、図1の選択履歴記憶部30を参照して、通し番号の値が最大値よりも一つ小さい値であるような音声対話装置を選択することによって実現することができる。
【0022】
言語理解逆解析部48は、他の音声対話装置に組み込まれた言語理解失敗伝達部より言語理解の失敗を受理した場合に、理解状態記憶部46に既に保持された理解状態をもとに、理解規則記憶部45の言語理解規則を逆解析して、相手音声対話装置(言語理解失敗元音声対話装置)の現在の理解状態をもたらしうる全ての発話内容(文字列)を生成する。生成した発話内容は送信元音声対話装置に組み込まれた逆解析結果受領部に伝達する。
【0023】
逆解析結果受領部49は、他の音声対話装置に組み込まれた言語理解逆解析部より発話内容を受理した場合、該発話内容を文字列として言語理解部42によって言語解析して理解状態を生成する。すなわち、受理した逆解析結果の発話内容それぞれを、当該音声対話装置が単体の音声対話装置として動作する場合と同様に言語理解部42を用いて言語理解を試みる。もしもどの逆解析結果も対応する理解規則がなく言語理解に失敗した場合は空の理解状態のまま通常の対話装置の動作を行う。もしも逆解析結果のうち理解規則を作成できるものがあった場合は、その理解規則の適用結果を装置の新しい理解状態とする。この際、もし複数の理解規則が適用可能であった場合、多数決、つまりもっとも多数作成された理解状態を装置の新しい理解状態とする。もしも多数決の場合に1位の結果が枚数ある場合は、理解状態中で値が定まっている項目数がもっとも多い結果を採用する。
【0024】
図3に本音声対話システムの全体的処理フロー図を示す。ここでは、音声対話装置40−1が利用者の現在発話を入力し、また、音声対話装置40−2が利用者の一つ前の発話を受理して、その理解状態が得られているとする。
【0025】
音声対話装置40−1では、音声入力部10から対話装置選択部20を介して利用者の発話音声信号を入力すると(S101)、音声認識部41が利用者の発話を文字列に変換し(S102)、言語処理部42が理解規則記憶部45の理解規則を参照して該文字列の理解状態への変換を試みる(S103)。ここで、言語理解が成功した場合(S104でNO)、言語理解部42にて理解状態が生成される(S105)。対話制御部43は、理解状態の内容に応じて該対話装置40−1の発話内容を決定し(S106)、発話生成部44は該決定した発話内容に従って音声信号を生成し、音声出力部50へ出力する(S107)。一方、言語理解部42において言語理解に失敗した場合(S104でYES)、言語理解失敗伝達部47は、選択履歴記憶部30を参照して利用者の一つ前の発話を受理した音声対話装置(ここでは、音声対話装置40−2)を選択し、該対話装置40−2の言語理解逆理解部に対して、言語理解が失敗したことを伝達する(S111)。伝達文には発信元装置ID、受信先装置IDが追加される。
【0026】
音声対話装置40−2の言語理解逆解析部48は、音声対話装置40−1から言語理解の失敗を受理すると(S201)、理解状態記憶部46に保持されている利用者の一つ前の発話に対する理解状態をもとに、理解規則記憶部45の言語理解規則を逆解析することで、音声対話装置40−1の現在の理解状態をもたらしうるすべて発話内容を生成する(S202)。そして、言語理解逆解析部48は、この生成した一つあるいはそれ以上の発話内容(文字列)を逆解析結果として音声対話装置40−1の逆解析結果受領部へ伝達する(S203)。この場合も、伝達文には発信元装置ID、受信先装置IDが追加される。
【0027】
音声対話装置40−1の逆解析結果受領部49は、音声対話装置40−2から逆解析結果の発話内容を受理すると(S112)、その発話内容それぞれについて、言語理解部42を用いて言語理解処理を試みる(S113)。そして、逆解析結果のうち、対応する理解規則の適用結果を当該装置の新しい理解状態とする。その後の動作は先の言語理解に成功した場合と同様である。また、もしも複数の理解規則が適用可能であった場合には、多数決等で理解状態を決める。また、もしもど逆解析結果も対応する理解規則がなく言語理解に失敗した場合は空の理解状態のまま通常の対話装置の動作を行う。
【0028】
次に、本音声対話システム、音声対話装置の具体的動作例について詳述する。例として、言語理解失敗伝達元がカレンダ検索を行う音声対話装置であり、言語理解失敗伝達先がスケジュール管理を行う音声対話装置である場合を考える。
【0029】
図4にシステムの概念図を示す。図4において、40−Aがスケジュール管理を行う音声対話装置(以下、スケジュール管理装置)、40−Bがカレンダ検索を行う音声対話装置(以下、カレンダ検索装置)であるとする。また、図4では本発明に関係する構成のみを示し、他は省略してある。図5にカレンダ検索装置40−Bが具備する言語理解規則の一例を示す。また、図6にスケジュール管理装置40−Aが具備する言語理解規則の一例を示す。
【0030】
いま、利用者がカレンダ検索装置40−Bに対してカレンダ検索を行った後、スケジュール管理装置40−Aに対してスケジュールの案内を要求する場合を考える。具体例として、
「1月1日は何の日」
(カレンダ装置応答)
「その日の予定は」
(スケジュール装置応答)
という発話系列を用いる。
【0031】
カレンダ検索装置40−Bの言語理解部42Bでは、「1月1日は何の日」という発話は、図5における理解規則8と対応がつくのでこの規則が適用される。
この規則が適用された結果、理解状態「(req=askspeciel,月=1月,日=1日)」が得られる。この結果、カレンダ検索装置40−Bは単体の装置の場合と同様、「元日です」といった発話を行うことになる。
【0032】
次に、図4においては、利用者は、「その日の予定は」という発話がスケジュール管理装置40−Aに向けらている。図6に示すスケジュール管理装置40−Aの理解規則中には適当な規則が存在しないため、言語理解部42Aにおける言語理解は失敗する。この場合、言語理解失敗伝達部47Aは、1つ前の発話を受理したカレンダ検索装置40−Bの言語理解逆解析部48Bに対して言語理解の失敗を伝達する。もしもスケジュール管理装置40−A中に利用者発話に対応する理解規則が存在し、言語理解に成功した場合には、言語理解失敗伝達部47Aは何も行わない。
【0033】
カレンダ検索装置40−Bの言語理解逆解析部48Bはスケジュール管理装置40−Aの言語理解失敗伝達部47Aより言語理解の失敗を受理した場合、当該カレンダ検索装置40−Bの言語理解規則(図5)を逆解析して、スケジュール管理装置40−Aの最後の理解状態をもたらしうるすべての発話を再現する。
【0034】
まず、理解規則の中から、装置の最後の理解状態中の要求種識別子と同一の要求種識別子を理解規則の右辺(→の右側)の理解状態中にもつ規則の左辺(→の左側)をすべて集める。次に集めた規則の左辺の変数部分(*月など)を装置の最後の理解状態中の対応する項目の値によって置き換える。もしも規則の左辺の変数部分に対応する項目の値が存在しない場合はその規則に関しては言語理解逆解析部48Bはこれ以上の処理は行わない。こうして置き換えによって得られた逆解析結果の文字列を、言語理解に失敗したスケジュール管理装置40−Aの逆解析結果受領部49Aに送信する。以上で逆解析の完了である。
【0035】
いま、カレンダ検索装置40−Bでの最後の理解状態が「(req=askpecial,月=1月,日=1日)」であるので、まず、図5に示す理解規則6,7,8の左辺である「*月 *日 は *特別な日だっけ」「*月 *日は」「*月 *日 は 何の日」が集められる。理解規則6は最後の理解状態中の項目がないので無視され、結局、言語理解逆解析結果として、理解規則7,8に対応する「1月1日は」「1月1日は何の日」という文字列が得られる。
【0036】
このように、言語理解逆解析部では、言語理解部の逆解析による発話内容生成するために、現在の理解状態をもたらしうる理解規則を検索する。すなわち、理解規則の右辺にある理解状態によって満たされている項目名と、現在の理解状態において満たされれている項目名が一致するような理解規則を検索する。次に、検索された理解規則の右辺の変数を、理解状態中の項目の値で置き換える。
【0037】
スケジュール管理装置40−Aの逆解析結果受領部49Aでは、カレンダ検索装置40−Bの言語理解逆解析部48Bより送られてきた逆解析結果について言語理解部42Aを用いて、理解状態を作成する。すなわち、逆解析結果それぞれを、当該スケジュール管理装置40−Aが単体の音声対話装置として動作する場合と同様に言語理解部42Aを用いて言語理解を試みる。もしもどの逆解析結果も対応する理解規則がなく言語理解に失敗した場合は空の理解状態のまま通常の対話装置の動作を行う。もしも逆解析結果のうち理解規則を作成できるものがあった場合は、その理解規則の適用結果を装置の新しい理解状態とする。この際、もし複数の理解規則が適用可能であった場合、多数決、つまりもっとも多数作成された理解状態を装置の新しい理解状態とする。もしも多数決の場合に1位の結果が枚数ある場合は、理解状態中で値が定まっている項目数がもっとも多い結果を採用する。
【0038】
例では、スケジュール管理装置40−Aの逆解析結果受領部49Aでは、カレンダ検索装置40−Bの言語理解逆解析部より送られた「1月1日は」「1月1日は何の日」を受けとる。図6より、「1月1日は」はスケジュール管理装置40−Aの理解規則2に対応するので、理解状態「(req=ask,月=1月,日=1日)」を作成可能である。一方、「1月1日は何の日」に対応する理解規則は存在しないので、理解状態を作成できない。この結果、逆解析結果受領部49Aは、言語理解部42Aに対して該スケジュール管理装置40−Aの理解状態を「(req=ask,月=1月,日=1日)」とするように指示する。この結果、スケジュール管理装置40−Aは「その日は会議の予定です」などの動作を行うことが可能になる。
【0039】
なお、図1、図2で示した装置における各部の一部もしくは全部の処理機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、あるいは、図3で示した処理手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることは言うまでもない。また、コンピュータでその処理機能を実現するためのプログラム、あるいは、コンピュータにその処理手順を実行させるためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えば、FD、MO、ROM、メモリカード、CD、DVD、リムーバブルディスクなどに記録して、保存したり、提供したりすることができるとともに、インターネット等のネットワークを通してそのプログラムを配布したりすることが可能である。
【0040】
【発明の効果】
本発明によれば、音声対話装置が単体で動作する際に必要な機構に加えて僅かな変更によって、複数の音声対話装置が協調して音声対話動作を行うための情報交換を実現することができる。
【図面の簡単な説明】
【図1】本発明にかかる音声対話システムの一実施例の全体構成図である。
【図2】本発明にかかる音声対話装置の一実施例の全体構成図である。
【図3】本発明にかかる音声対話システム・音声対話装置の全体的処理フロー図である。
【図4】本発明をカレンダ検索装置とスケジュール管理装置の組み合せに適用した場合のシステム概念図である。
【図5】カレンダ検索装置の言語理解規則の一例である。
【図6】スケジュール管理装置の言語理解規則の一例である。
【符号の説明】
10 音声入力部
20 対話装置選択部
30 選択履歴記憶部
40−1〜40−N 音声対話装置
50 音声出力部
41 音声認識部
42 言語理解部
43 対話制御部
44 発話生成部
45 理解規則記憶部
46 理解状態記憶部
47 言語理解失敗伝達部
48 言語理解逆解析部
49 逆解析結果受領部
Claims (5)
- 利用者の発話を文字列に変換する手段、前記文字列を、あらかじめ保持されている言語理解規則によって装置が理解できる表現の理解状態に変換する手段、前記理解状態の内容に応じて装置の発話内容を決定する手段、前記決定された発話内容に従って音声を生成する手段を備えた音声対話装置において、
所定の理解状態が得られない場合に、言語理解が失敗したことを利用者の直前の発話を受理した他の音声対話装置に伝達する手段と、
前記他の音声対話装置から言語理解の失敗を受理した場合に、生成済みの理解状態をもとに、言語理解規則を逆解析して、取り得る発話内容を逆解析結果として前記他の音声対話装置へ伝達する手段と、
前記他の音声対話装置から逆解析結果の発話内容を受理した場合に、該発話内容をもとに装置の現在の理解状態を生成する手段と、を有することを特徴とする音声対話装置。 - 各々が利用者の発話を文字列に変換する手段、前記文字列を、あらかじめ保持されている言語理解規則によって装置が理解できる表現の理解状態に変換する手段、前記理解状態の内容に応じて装置の発話内容を決定する手段、前記決定された発話内容に従って音声を生成する手段を備えた複数の音声対話装置からなる音声対話システムにおいて、
利用者の発話毎に適切な音声対話装置を選択し、該選択した音声対話装置へ利用者の発話を出力する対話装置選択部と、
前記対話装置選択部による装置選択の履歴を保持する選択履歴記憶部と、
前記音声対話装置は、所定の理解状態が得られない場合に、前記選択履歴記憶部を参照して、言語理解が失敗したことを利用者の直前の発話を受理した他の音声対話装置に伝達する手段、前記他の音声対話装置から言語理解の失敗を受理した場合、生成済みの理解状態をもとに、言語理解規則を逆解析して、取り得る発話内容を逆解析結果として前記他の音声対話装置へ伝達する手段、前記他の音声対話装置から逆解析結果の発話内容を受理した場合に、該発話内容をもとに装置の現在の理解状態を生成する手段を更に備えることを特徴とする音声対話システム。 - 複数の音声対話装置の間で協調して利用者との音声対話を行う音声対話方法であって、
現在処理を行っている音声対話装置で利用者の発話の言語理解に失敗した場合に、該音声対話装置(以下、言語理解失敗伝達元装置)は、利用者の直前の発話を処理した他の音声対話装置(以下、言語理解失敗伝達先装置)へ言語理解失敗を伝達し、
前記言語理解失敗伝達先装置は、前記言語理解失敗伝達元装置から言語理解の失敗を受理すると、生成済みの理解状態をもとに、言語理解規則を逆解析して、取り得る発話内容を逆解析結果として前記言語理解失敗伝達元装置へ伝達し、
前記言語理解失敗伝達元装置は、前記言語理解失敗伝達先装置から逆解析結果の発話内容を受理すると、該発話内容をもとに装置の現在の理解状態を生成する、ことを特徴とする音声対話方法。 - 利用者の発話を文字列に変換し、前記文字列を、あらかじめ保持されている言語理解規則によって装置が理解できる表現の理解状態に変換し、前記理解状態の内容に応じて装置の発話内容を決定し、前記決定された発話内容に従って音声を生成することで、利用者と音声による対話によって所定の動作を行う音声対話装置の処理をコンピュータで実行するためのプログラムであって、
所定の理解状態が得られない場合に、言語理解が失敗したことを利用者の直前の発話を受理した他の音声対話装置に伝達するステップと、
前記他の音声対話装置から言語理解の失敗を受理した場合に、生成済みの理解状態をもとに、言語理解規則を逆解析して、取り得る発話内容を逆解析結果として前記他の音声対話装置へ伝達するステップと、
前記他の音声対話装置から逆解析結果の発話内容を受理した場合に、該発話内容をもとに装置の現在の理解状態を生成するステップと、を有することを特徴とする音声対話プログラム。 - 請求項4に記載の音声対話プログラムを記録したコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003030156A JP2004240225A (ja) | 2003-02-06 | 2003-02-06 | 音声対話装置、音声対話システム、音声対話方法、プログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003030156A JP2004240225A (ja) | 2003-02-06 | 2003-02-06 | 音声対話装置、音声対話システム、音声対話方法、プログラム及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004240225A true JP2004240225A (ja) | 2004-08-26 |
Family
ID=32957111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003030156A Pending JP2004240225A (ja) | 2003-02-06 | 2003-02-06 | 音声対話装置、音声対話システム、音声対話方法、プログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004240225A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017168637A1 (ja) * | 2016-03-30 | 2017-10-05 | 三菱電機株式会社 | 意図推定装置及び意図推定方法 |
WO2020044822A1 (ja) * | 2018-08-30 | 2020-03-05 | ソニー株式会社 | 情報処理装置、および情報処理方法 |
WO2021140816A1 (ja) * | 2020-01-07 | 2021-07-15 | ソニーグループ株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
-
2003
- 2003-02-06 JP JP2003030156A patent/JP2004240225A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017168637A1 (ja) * | 2016-03-30 | 2017-10-05 | 三菱電機株式会社 | 意図推定装置及び意図推定方法 |
JP6275354B1 (ja) * | 2016-03-30 | 2018-02-07 | 三菱電機株式会社 | 意図推定装置及び意図推定方法 |
WO2020044822A1 (ja) * | 2018-08-30 | 2020-03-05 | ソニー株式会社 | 情報処理装置、および情報処理方法 |
WO2021140816A1 (ja) * | 2020-01-07 | 2021-07-15 | ソニーグループ株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10540596B2 (en) | Conversation branching for more efficient resolution | |
KR102189855B1 (ko) | 다이얼로그 시스템들에서의 파라미터 수집 및 자동 다이얼로그 생성 | |
CN108010523B (zh) | 信息处理方法以及记录介质 | |
US12086550B2 (en) | System for focused conversation context management in a reasoning agent/behavior engine of an agent automation system | |
EP3385946B1 (en) | Dynamically updatable offline grammar model for resource-constrained offline device | |
JP4155854B2 (ja) | 対話制御システム及び方法 | |
KR102269618B1 (ko) | 패킷화된 오디오 신호의 인증 | |
CN113504888B (zh) | 用于序列相关数据消息整合的系统和方法 | |
KR20180090729A (ko) | 음성 활성 데이터 패킷의 데이터 구조 풀링 | |
JP2008225191A (ja) | 議事録作成方法、その装置及びそのプログラム | |
KR101938806B1 (ko) | 리소스 제한된 디바이스에서 오프라인의 시맨틱 처리의 간이화 | |
US20210342553A1 (en) | Dialogue data generation device, dialogue data generation method, and program | |
JP2021067830A (ja) | 議事録作成システム | |
KR20200024511A (ko) | 대화 에이전트의 동작 방법 및 그 장치 | |
JP2018120203A (ja) | 情報処理方法及びプログラム | |
CN117708266A (zh) | 意图识别方法、装置、电子设备及存储介质 | |
US10140981B1 (en) | Dynamic arc weights in speech recognition models | |
JP2004240225A (ja) | 音声対話装置、音声対話システム、音声対話方法、プログラム及び記録媒体 | |
US11984125B2 (en) | Speech recognition using on-the-fly-constrained language model per utterance | |
US11803400B2 (en) | Method and system for asynchronous notifications for users in contextual interactive systems | |
JP3844367B2 (ja) | 音声情報通信システム | |
JP4741777B2 (ja) | データベースのエントリを決定する方法 | |
JP2018054926A (ja) | 音声対話装置および音声対話方法 | |
KR20220122101A (ko) | 대화 텍스트를 카테고리화하여 저장 가능한 회의보조 시스템 | |
KR20220122100A (ko) | 다중언어의 종류에 따른 회의보조 시스템 |