JP2003316385A - 音声対話システム及び音声対話方法 - Google Patents
音声対話システム及び音声対話方法Info
- Publication number
- JP2003316385A JP2003316385A JP2002122491A JP2002122491A JP2003316385A JP 2003316385 A JP2003316385 A JP 2003316385A JP 2002122491 A JP2002122491 A JP 2002122491A JP 2002122491 A JP2002122491 A JP 2002122491A JP 2003316385 A JP2003316385 A JP 2003316385A
- Authority
- JP
- Japan
- Prior art keywords
- dialogue
- voice
- terminal
- sequence
- dialog
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Navigation (AREA)
- Traffic Control Systems (AREA)
Abstract
に行うことができるようにし、各種車載情報サービス
を、安価に、かつ、効率的に、使い勝手よく利用可能と
する。 【解決手段】 タスク管理処理802は、サービスする
各種情報のタスクに関するタスクドキュメント801を
データとして、具体的に必須な対話シーケンスの表現を
生成する。この対話シーケンスに基づいて、各タスクに
おいて出現する応答ダイアログ806や、時間ダイアロ
グ807、場所ダイアログ808、会場ダイアログ80
9等の具体的な対話のダイアログが、実際の時間辞書8
010、地名辞書8011、会場名辞書8012等を利
用して、より詳細な対話ダイアログに生成される。そし
て、音声認識に必須な対話の流れがVoiceXML記述言語等
により表現されて、実際の音声対話のサービスが実行さ
れる。
Description
及び音声対話方法に係り、特に、音声入出力機能を有す
るネットワーク型の車載情報サービスシステム、電話を
端末とした音声ポータルによるネットワーク型の各種情
報サービスシステム等に適用して好適で、効率的に端末
とセンターとの機能分担を行って音声による対話を行う
ことを可能とした音声対話システム及び音声対話方法に
関する。
テムの1つとして、例えば、カーナビシステムが知られ
ている。一般に、カーナビシステムは、ネットワーク型
の構成となっていないため、ユーザがセンター側の情報
を自由に入手することができない。また、ネットワーク
型構成のものも知られているが、音声入力の対話シーケ
ンスが一意なものであり、自由な音声入力ができないも
のである。
の音声対話機能を有するシステムは、ユーザがセンター
側の情報を自由に入手することができなかったり、自由
な音声の入力ができないという問題点を有している。
解決し、例えば、車載情報サービスシステムにおいて、
音声入力による対話を自由に、かつ、効率的に行うこと
ができるようにし、車の中に居ながら道路の混雑状況、
旅行先、施設等の利用状況及び音楽配信等の各種車載情
報サービスを、安価に、かつ、効率的に、使い勝手よく
利用することができる音声対話システム及び音声対話方
法を提供することにある。
は、音声入出力機能を具備する端末と、該端末が通信手
段によりネットワークを介して結合されているセンター
との間で音声により対話する音声対話システムにおい
て、前記センターが、端末からの音声入力の内容に応じ
て、音声入出力の対話シーケンスを生成、変更する手段
を有することにより、また、変更された音声入出力の対
話シーケンスの情報を、通信で結合された端末へ転送す
る手段を有することにより達成される。
する端末と、該端末が通信手段によりネットワークを介
して結合されているセンターとの間で音声による対話を
行う音声対話方法において、前記センターが、前記端末
から入力される話題の項目を認識し、該話題の項目の詳
細情報を、複数の話題の項目について各項目間の関係を
含む詳細情報と前記各項目毎の対話シーケンスとを記録
している記録部から読み出し、前記読み出された詳細情
報に基づいて、前記項目に対応する対話シーケンスを前
記記録部から読み出し、前記読み出した対話シーケンス
を合成し、この対話シーケンスを前記端末にダウンロー
ドすることにより達成される。
及び音声対話システムの実施形態を図面により詳細に説
明する。
マルチメディアシステムの概念と現行のカーナビシステ
ムとを説明する図である。
ムは、「単体」の装置として使用され、経路誘導等に使
用されるのが一般的である。一方、今後のカーナビシス
テムは、インターネット等のネットワークに結合した
「ネットワーク型」のシステムへ展開されて車載情報シ
ステムとして使用されるようになると予想される。その
際、従来のカーナビシステムでの音声インタフェース機
能の他に、車載情報サービスを効率よく、かつ、サービ
スの質を向上させるために、車載での端末とネットワー
ク側のセンターとの効率的な融合が必須となってくる。
そして、ネットワーク型の車載情報システムに対するサ
ービスとしては、例えば、インターネット上にある各種
店舗、レストラン等の時々刻々と変化するサービス情
報、スキー場等のスポーツ施設近辺の天気予報、交通状
態に関する情報、音楽等のエンタテーメントの配信情報
等のサービスがあり、また、緊急時の連絡に関するサー
ビスも必須となってくる。これらの情報サービスのため
に、「テレマティクス・サービス」が台頭してくると、
「音声ポータル」を使用した音声による情報サービスも
必須となってくる。
の本発明の一実施形態による端末とネットワークとの構
成を示す概念図である。図2において、200はユー
ザ、201は端末、202は音声ポータルゲートウェイ
(Gateway)、203はネットワーク、204〜206は
情報サービスWebセンタサーバである。
ルゲートウェイ202を介してインターネット等のネッ
トワーク203に結合されている。ネットワーク203
上には、各種のコンテンツサーバである情報サービスW
ebセンタサーバ204〜206が結合されている。利
用者であるユーザ200は、端末201が有する音声イ
ンタフェースを利用して音声入力を行い、各種情報サー
ビスを利用することが可能である。端末201は、車載
情報システムの場合、車に搭載されている車載端末であ
り、通信手段としては、携帯電話等で使用しているイン
フラであるPDC(Personal Digital Communication)の
通信手段を利用することができる。また、携帯電話を端
末として利用することも可能である。
情報サービスシステムの構成例を示す図である。図3に
おいて、301は車載システム、302は音声ポータル
システム、303はネットワーク、3011は車載端
末、3012は雑音抑圧処理部、3013は音声認識
部、3014は対話管理部、3015はVoiceXMLインタ
プリタ、3016はオーディオ、カーナビ等の車載機器
である。図3に示す例は、サービスの内容が、ルートガ
イダンスと天気予報とのサービスであるとして、その具
体例を説明する例である。
1の車載端末3011の音声インタフェースを利用し
て、センター側のサーバにアクセスすることにより、目
的地までの距離と目的地の天気とに関する情報を入手す
ることができる。音声インタフェースを実現する音声認
識部3013と対話管理部3014とは、車載端末側と
音声ポータル側とのどちらにもある備えられる場合があ
り、効率的な連携をもって、ユーザであるドライバーへ
必要な情報を供給する。音声認識部の前段に、車載利用
に耐えるような雑音抑圧の前処理を行う雑音抑圧処理部
3012が具備されることが多い。さらに、VoiceXMLイ
ンタプリタ3014が、車載システム301側あるいは
音声ポータルセンター302側の両方に具備されてい
る。音声ポータルセンター302は、少なくとも、対話
管理部、音声認識部及び音声合成部を具備し、対話シー
ケンスをVoiceXML記述言語により実現するものとしてい
る。車載端末3011の音声処理部と音声ポータルでの
音声処理部との連携、例えば、車載オーディオ等の機器
3016の操作等のネットワークに接続する必要のない
サービス要求に関しては、車載端末だけで処理を完了さ
せて、時々刻々変動する道路情報等は、センターに接続
して、ネットワーク303を介してWWW等から入手す
る。その際、音声ポータルゲートウェイ等で、音声認識
処理、対話管理処理等を分担連携することが、通信料の
削減や通信線路の音声の歪み回避等の面から重要であ
る。
報サービスシステムの構成例を示す図である。図4にお
いて、401は携帯電話機、402は電話網、403は
VoiceXMLゲートウェイ(あるいは音声ポータルゲートウ
ェイ)、405、406はホームページ、407は音声
ポータル、408はパソコン(PC)、409はHTM
L、4010はインターネットである。
0等のネットワークへ接続してサービスを受ける構成と
して、従来、パソコンP(PC)408から入力を行う
方法が主流であった。この場合、インターネット401
0に接続されているコンテンツに関するホームページ
は、通常のHTML409で記述されている。しかし、
携帯電話401等の入力手段を利用する場合、電話網4
02を利用して、VoiceXMLゲートウェイ(あるいは音声
ポータルゲートウェイ)403を介して、VoiceXMLで記
述されているホームページ405、406にアクセスす
ることになる。VoiceXMLは、このような音声によるホー
ムページアクセスに対処したコンテンツの記述言語であ
り、現在、VoiceXMLフォーラムとW3C(WWWコンソ
ーシアム)とにより、世界標準化作業が進められてい
る。VoiceXMLゲートウェイ403は、例えば、VoiceXML
インタプリタ、音声認識、音声合成、DTMF等の処理
モジュールで構成される。
載情報サービス等に使用される音声対話システムの構成
例を示すブロック図、図6は図5における音声認識部の
機能構成例を示すブロック図である。図5、図6におい
て、501は入力音声、502は雑音抑圧部、503は
音声認識部、504は対話管理部、505はVoiceXML記
述言語、506は音響モデル単語辞書、507は対話コ
ーパス、508はユーザプロファイル、509は認識結
果、602は音声入力部、603は音声分析部、604
は音声検出部、605は照合部、606はHMM連結
部、607はHMM音響モデル、608は単語辞書、6
09は判定部である。
部502と、音声認識部503と、対話管理部504と
により構成され、音声501が雑音抑圧部502に入力
され、雑音抑圧部502、音声認識部503、対話管理
部504により順に処理されて認識結果509として出
力される。音声認識部503は、通常、音響モデル情報
及び単語辞書情報506を持ち、また、対話管理部50
4は、対話コーパス507とユーザプロファイル508
とに関する情報を有する。音声認識と対話管理とは、Vo
iceXML記述言語505により、より密接に連携されて、
対話シーケンスを実現している。
音声入力部602、音声分析部603、音声検出部60
4、照合部605、HMM連結部606、HMM音響モ
デル607、単語辞書608、判定部609により構成
されている。
おいて、入力された音声501は、音声入力部602で
サンプリングの折り返し雑音を除去するためにLPF(L
ow Pass Filtering)処理が施され、A/D(Analog to D
igital)変換器によりアナログデータからデジタルデー
タへ変換される。デジタルデータに変換された音声波形
データは、音声分析部603でスペクトル分析により、
音声のスペクトル情報へ変換される。その後、このスペ
クトル情報は、音声検出部604ににより音声区間の検
出が行われ、音声区間内の音声データとされる。この音
声データは、照合部605により標準音声データとの類
似度との算出が施され、判定部609により、最終的に
入力音声の内容が認識、決定されて認識結果509が出
力される。 前述における照合部605の処理は、現
在、最もよく使用されている隠れマルコフモデル(HM
M:Hidden Markov Model)方式を用いることとしてい
る。この場合、標準音声データとして、少なくてもHM
M音響モデル607、単語辞書608及びHMM連結部
606の構成が必要となる。隠れマルコフモデル方式に
よる音声認識に関しては、文献「確率モデルによる音声
認識(中川聖一著、電子情報通信学会編)」に記載され
たものが知られている。前述した照合部605の例は、
隠れマルコフモデルを使用するとしたが、本発明は、ニ
ューラルネットワーク等による認識方式使用することが
できる。
成例を示すブロック図である。音声認識や合成は、パソ
コン等のソフトウェアによっても実現することができる
が、図7に示す例は、汎用マイコンを使用した音声認
識、合成ボードにより実現した例である。図7におい
て、701はA/D変換モジュール701、702はシ
ステムコントローラ、703はROM、704はマイコ
ン、705はRAM、706はバス、707はRS23
2CI/F、708はD/A変換モジュールである。
端末装置は、入力音声501をA/D変換するA/D変
換モジュール701と、サンプリングされた音声データ
を編集するシステムコントローラ702と、音声認識ミ
ドルウェアと標準音声データが記憶されているROM(R
ead Only Memory)703と、主処理部であるマイコン7
04と、ワークメモリとして働くRAM(Random Access
Memory)705と、それらを有機的に結合処理するBU
S706と、認識結果509の出力を行うインタフェー
スであるRS232CI/F707とにより構成され
る。音声合成ボードには、音声合成音709を出力する
D/A変換モジュール708が備えられている。
機能による例を示したものであり、この他に、種々の回
路構成をとることができる。
用いた車載サービスにおける対話ダイアログの生成につ
いて説明する図である。図8において、801はタスク
ドキュメント、802はタスク管理処理、803は天気
予報VoiceXML、804は観光ガイドVoiceXML、805は
催し物ガイドVoiceXML、806は応答ダイアログ、80
7は時間ダイアログ、808は場所ダイアログ、809
は会場ダイアログ、8010は時間辞書、8011は地
名辞書、8012は会場名辞書である。
天気予報の情報入手や観光案内情報の等の各タスクに関
するデータであるタスクドキュメント801をデータと
して、具体的に必須な対話シーケンスの表現を生成す
る。この対話シーケンスに基づいて、各タスクにおいて
出現する応答ダイアログ806や、時間ダイアログ80
7、場所ダイアログ808、会場ダイアログ809等の
具体的な対話のダイアログが、実際の時間辞書801
0、地名辞書8011、会場名辞書8012等を利用し
て、より詳細な対話ダイアログに生成される。前述のタ
スクの対話シーケンスから具体的な対話ダイアログの流
れへの生成過程は、自動的に行われる。その結果、音声
認識に必須な対話の流れがVoiceXML記述言語等により表
現されて、実際の音声対話のサービスが実行されること
になる。
対話シーケンスが、天気予報VoiceXML803、観光ガイ
ドVoiceXML804、催し物ガイドVoiceXML805等のモ
ジュールとして自動生成される。この自動生成されたVo
iceXMLモジュールは、センター側あるいは端末へ転送さ
れて、実際の音声対話を利用したサービスが実施される
ことになる。
運転中の道案内に適用した場合の具体例について説明す
る。
話により目的地(ここでは四川楼)を設定したときの対
話シーケンスを説明する図である。ここで注意すべきこ
とは、四川楼という目的地を設定した後でなければ、道
案内の対話シーケンスが決まらないこと、換言すると道
案内の対話シーケンスは、四川楼という目的地が決まっ
た後で自動生成しなければならないことである。この対
話シーケンスの自動生成は、すでに説明したように、各
タスクに関するデータ(タスクドキュメント)801を
データとして、タスク管理処理802により、具体的に
必須な対話シーケンスに表現されるように行われる。そ
の対話シーケンスに基づいて、各タスクにおいて出現す
るダイアログが、図示していない店名辞書、地名辞書等
を利用して自動生成される。ここで以後の説明のため、
道案内の対話シーケンスを図9のように、3つの区間
A、B、Cに分ける。
との対応を説明する図、図11は図10に示す対話シー
ケンスを状態遷移モデルにより表現した図である。い
ま、ドライバーが「四川楼に行きたい」と発話すると、
端末は「桜通を東に向かってください」と案内する。車
両が図10に示す区間Aを通過し、点P1に到達する
と、端末は「伏見通りで右折してください」と案内す
る。車両が区間Bを通過し、点P2に到達すると端末は
「四川楼はまもなく左側にあります」と案内する。そし
て、車両が目的地に到着して対話シーケンスが完了す
る。
モデルにより表現すると、図11に示すようになる。図
11において、A301〜A305はノードであり、ノ
ード間が有向リンクにより接続されている。ドライバー
が「四川楼に行きたい」と発話すると、対話プログラム
は、制御をノードA301に移し、「桜通を東に向かっ
てください」と案内して、制御をノードA302に移
す。車両が区間Aを通過している時点で制御はノードA
302にある。そして、車両が点P1に到達すると、対
話プログラムは、「伏見通りで右折してください」と案
内する。そして制御をA303に移す。車両が区間Bを
通過している時点で制御はA303にある。そして、車
両が点P2に到達すると、対話プログラムは、「四川楼
はまもなく左側にあります」と案内し、制御をノードA
304に移す。そして、車両が目的地に到着すると、制
御をノードA305に移す。そして、対話シーケンスが
完了する。
シーケンスは、前述の自動生成により作成されたもので
あり、XMLベースの記述言語で記述される。
道案内のように目的地が確定した後に対話シーケンスを
生成しなければならないような事例に対して特に効果を
発揮する。
ライバーが駐車場情報を問い合わせた場合の対話シーケ
ンスについて説明する図、図13は対話シーケンスと実
際の運転状況との対応を説明する図、図14は図13に
示す対話シーケンスを状態遷移モデルにより表現した図
である。図12において注意すべきことは、駐車場情報
問い合わせは、区間A、B、Cのいずれの区間において
も起こり得ることである。
ードA501、A502は駐車場案内の対話シーケンス
を表現しており、ノードA501に制御が移ると、「お
店の裏手に駐車場があります」と案内してノードA50
2に制御を移して対話を完了する。
応するノードから、ノードA501に有向リンクにより
接続され、「駐車場はある?」といった駐車場案内の問
い合わせ発話をドライバーが発したとき、制御は、前記
有向リンクを辿ってノードA501に到達する。この時
点で、対話制御プログラムは、復帰先記憶手段にどのノ
ードから制御が移ったかを記憶する。復帰先記憶手段
は、いわゆるスタックで構成される。ここでは、区間B
走行中に駐車場問い合わせが発生したので、復帰先とし
てA303がpushされる。「お店の裏手に駐車場が
あります」という案内をした後、制御はノードA502
に移る。駐車場案内対話が終了すると、対話プログラム
は、復帰先記憶手段から復帰先をpopし、ノードA3
03に制御を復帰させる。
前述した自動生成機能により自動的に生成したものであ
る。また、道案内対話シーケンスの各ノードA302〜
A304から、ノードA501への有向リンクの接続
も、自動生成することが可能である。具体的には、XM
Lベースの記述言語で、有向リンクをどのノードからど
のノードに接続するか、また、どのような発話が入力さ
れたとき、その有向リンクを辿るかを記述する。この機
能により、ある対話の最中に、違う対話を割り込ませる
対話シーケンスの自動生成が可能となる。さらに、復帰
先記憶手段としてスタックを用いることにより、道案内
の最中に寄り道情報を尋ね、さらに寄り道情報を尋ねて
いる最中に天気情報を尋ねるというような2回以上の対
話の割り込みも可能となる。このような複雑な対話シー
ケンスの制御は、各タスクに関するデータ(タスクドキ
ュメント)801をデータとして、タスク管理処理80
2により、具体的に必須な対話シーケンスに表現され
る。本発明の実施形態は、その対話シーケンスに基づい
て、各タスクにおいて出現するダイアログが、図示しな
い店名辞書、地名辞書等を利用して自動生成されるこ
と、また、各対話シーケンスを表現するノード間の接続
を自動生成するという手法を用いることにより、前述で
説明したような音声による案内を行うことができるもの
である。
の内部表現の一例を説明する図である。ここでは、県名
と地名とを入力することにより、その土地の天気の情報
を入手するタスクを前提としている。そして、図示例で
は、「お天気情報サービスへようこそ」というシステム
からのプロンプトを開始として、ユーザは県名と地名と
を音声で入力することにより、知りたい土地の天気の情
報を入手することになる。
成を示すブロック図である。図16において、1001
は対話コーパス、1002は対話ドキュメント、100
3は対話内容管理部、1004はVoiceXML生成部であ
り、他の符号は図8の場合と同一である。
可能とする対話管理部の構成を示しており、実際には、
データ制御部と記録部とを有するシステムとして構成さ
れ、制御部によって処理が制御される。3階層構造は、
タスク管理部802、対話内容(対話ダイアログ)管理
部1003、及び、VoiceXML生成部1004である。そ
して、有人システムとユーザとによる実際の対話を記録
した対話コーパス1001を基に事前作成されたタスク
ドキュメント801と対話ドキュメント1002とを使
用して、タスク管理部802は、各タスクにより話され
る対話シーケンスを明記する。その後、対話内容管理部
1003は、対話シーケンスをより具体化し、詳細な対
話内容(対話ダイアログ)を対話ドキュメント1002
を基にして表記する。最後に、VoiceXML生成部1004
は、音声入力処理の必要なVoiceXMLモジュールを自動生
成する。
て説明する。対話コーパス1001は、例えば、図9に
示されるような道路を走行中のドライバーが音声対話に
より目的地(を設定した時の対話シーケンス等)の詳細
をテキストに書き起こしたものであり、話題(タスク)
の種類に従って、どのような具体的な対話シーケンスと
なっているかを整理した情報をも有する。タスクドキュ
メント801は、対話コーパス1001に格納されてい
る情報の中から、話題(タスク)に関する情報を纏めた
ものである。
対話ドキュメント1002の例とを説明する図である。
タスクドキュメント801には、サービス名として「車
載情報サービス」、具体的話題タスクとして、タスク
1:天気予報、タスク2:観光案内等のように、車載情
報サービスで必要となる各種タスクの詳細が、単独タス
クと、結合タスクとのような形で明記されている。対話
ドキュメント1002には、各タスクに使用される具体
的な対話ダイアログの詳細が明記されている。例えば、
天気予報のタスク1には、応答ダイアログ、時間ダイア
ログ、場所ダイアログ等のように、各対話で使用される
具体的な対話(ダイアログ)の詳細が明記されている。
タスク管理部802は、音声認識で得られた結果を基
に、現在ユーザ(ドライバー)が、どの話題に関して入
力しているのかを判断し、タスク手順を明記して、次の
対話内容管理部1003に送る。対話内容管理部100
3は、対話ドキュメント1002の情報に基づいて、具
体的な対話内容の手順を生成する。そして、生成された
対話シーケンスを基に、音声認識を稼動させるためのVo
iceXML記述言語による表現が自動生成されることにな
る。
る各種の機能部及びその処理は、プログラムとして構成
することができ、このプログラムは、HD、DAT、F
D、MO、DVD−ROM、CD−ROM等の記録媒体
に格納して提供することができる。
ディアシステムの機能構成を示す図である。
での必須な要件としては、図18に示すように、ヒュー
マンインタフェース、マシンインタフェース、基盤技術
の3項目を挙げることができる。これらの中で、将来の
車載情報サービスシステム、いわゆる、カーマルチメデ
ィアを実現する重要な要素として、音声によるインタフ
ェースがある。前述した本発明の実施形態は、このよう
な重要な要素としての音声を用いたインタフェースで、
必須となる音声対話の自動生成の手法を提供することが
できる。
の中に居ながら道路の混雑状況、旅行先、施設等の利用
状況及び音楽配信等の各種車載情報サービスを、安価
に、かつ、効率的入力、使い勝手よく利用することが可
能となる。
ィアシステムの概念と現行のカーナビシステムとを説明
する図である。
一実施形態による端末とネットワークとの構成を示す概
念図である。
スシステムの構成例を示す図である。
システムの構成例を示す図である。
ビス等に使用される音声対話システムの構成例を示すブ
ロック図である。
ロック図である。
ブロック図である。
サービスにおける対話ダイアログの生成について説明す
る図である。
的地(ここでは四川楼)を設定したときの対話シーケン
スを説明する図である。
説明する図である。
ルにより表現した図である。
駐車場情報を問い合わせた場合の対話シーケンスについ
て説明する図である。
説明する図である。
ルにより表現した図である。
の一例を説明する図である。
ロック図である。
メント1002の例とを説明する図である。
テムの機能構成を示す図である。
ゲートウェイ) 405、406 ホームページ 407 音声ポータル 408 パソコン(PC) 409 HTML 4010 インターネット 501 入力音声 502 雑音抑圧部 503 音声認識部 504 対話管理部 505 VoiceXML記述言語 506 音響モデル単語辞書 507 対話コーパス 508 ユーザプロファイル 509 認識結果 602 音声入力部 603 音声分析部 604 音声検出部 605 照合部 606 HMM連結部 607 HMM音響モデル 608 単語辞書 609 判定部 701 A/D変換モジュール701 702 システムコントローラ 703 ROM 704 マイコン 705 RAM 706 バス 707 RS232CI/F 708 D/A変換モジュール 801 タスクドキュメント 802 タスク管理処理 803 天気予報VoiceXML 804 観光ガイドVoiceXML 805 催し物ガイドVoiceXML 806 応答ダイアログ 807 時間ダイアログ 808 場所ダイアログ 809 会場ダイアログ 8010 時間辞書 8011 地名辞書 8012 会場名辞書 1001 対話コーパス 1002 対話ドキュメント 1003 対話内容管理部 1004 VoiceXML生成部
Claims (9)
- 【請求項1】 音声入出力機能を具備する端末と、該端
末が通信手段によりネットワークを介して結合されてい
るセンターとの間で音声により対話する音声対話システ
ムにおいて、前記センターは、端末からの音声入力の内
容に応じて、音声入出力の対話シーケンスを生成、変更
する手段を有することを特徴とする音声対話システム。 - 【請求項2】 前記センターは、変更された音声入出力
の対話シーケンスの情報を、通信で結合された端末へ転
送する手段を有すること特徴とする請求項1記載の音声
対話システム。 - 【請求項3】 前記端末は、音声入出力部、音声分析
部、音声認識部、対話管理部を備えて構成され、前記セ
ンターは、前記端末と連携動作する対話管理部、音声分
析部、音声認識部を備えて構成されたことを特徴とする
請求項1または2記載の音声対話システム。 - 【請求項4】 前記センターに備えられる対話管理部
は、対話シーケンスをXMLベースの記述言語により表
現することを特徴とする請求項3記載の音声対話システ
ム。 - 【請求項5】 前記センターに設けられる対話管理部
は、XMLベースの記述言語による対話シーケンスを、
前記端末からの音声入力の内容に応じて変更して前記端
末にダウンロードすることを特徴とする請求項4記載の
音声対話システム。 - 【請求項6】 前記センターに設けられる対話管理部
は、対話シナリオ表記手段と、対話ダイアログ表記手段
と、対話シーケンス表記手段とによる少なくとも3階層
構造の対話管理手段を備えて構成されたことを特徴とす
る請求項4または5記載の音声対話システム。 - 【請求項7】 前記端末にダウンロードする情報は、対
話シーケンス表記手段により表記された情報であること
を特徴とする請求項5記載の音声対話システム。 - 【請求項8】 音声入出力機能を具備する端末と、該端
末が通信手段によりネットワークを介して結合されてい
るセンターとの間で音声による対話を行う音声対話方法
において、前記センターは、前記端末から入力される話
題の項目を認識し、該話題の項目の詳細情報を、複数の
話題の項目について各項目間の関係を含む詳細情報と前
記各項目毎の対話シーケンスとを記録している記録部か
ら読み出し、前記読み出された詳細情報に基づいて、前
記項目に対応する対話シーケンスを前記記録部から読み
出し、前記読み出した対話シーケンスを合成し、この対
話シーケンスを前記端末にダウンロードすることによ
り、端末との間での音声による対話を行うことを特徴と
する音声対話方法。 - 【請求項9】 端末から入力される話題の項目を認識す
るステップと、該話題の項目の詳細情報を、複数の話題
の項目について各項目間の関係を含む詳細情報と前記各
項目毎の対話シーケンスとを記録している記録部から読
み出すステップと、前記読み出された詳細情報に基づい
て、前記項目に対応する対話シーケンスを前記記録部か
ら読み出すステップと、前記読み出した対話シーケンス
を合成するステップと、この対話シーケンスを前記端末
にダウンロードするステップとをコンピュータに実行さ
せて音声による対話を行うことを特徴とするプログラ
ム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002122491A JP4174233B2 (ja) | 2002-04-24 | 2002-04-24 | 音声対話システム及び音声対話方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002122491A JP4174233B2 (ja) | 2002-04-24 | 2002-04-24 | 音声対話システム及び音声対話方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003316385A true JP2003316385A (ja) | 2003-11-07 |
JP4174233B2 JP4174233B2 (ja) | 2008-10-29 |
Family
ID=29538092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002122491A Expired - Fee Related JP4174233B2 (ja) | 2002-04-24 | 2002-04-24 | 音声対話システム及び音声対話方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4174233B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005284543A (ja) * | 2004-03-29 | 2005-10-13 | Chugoku Electric Power Co Inc:The | 業務支援システム及び方法 |
WO2007013521A1 (ja) * | 2005-07-26 | 2007-02-01 | Honda Motor Co., Ltd. | ユーザと機械とのインタラクションを実施するための装置、方法、およびプログラム |
US7660664B2 (en) | 2004-11-25 | 2010-02-09 | Denso Corporation | Information service system |
US7672757B2 (en) | 2006-12-08 | 2010-03-02 | Hyundai Motor Company | Interface system between human and car |
JP2011108083A (ja) * | 2009-11-19 | 2011-06-02 | Fujitsu Advanced Engineering Ltd | 音声シナリオ生成プログラム及び音声シナリオ生成装置 |
JP2013206319A (ja) * | 2012-03-29 | 2013-10-07 | Toyota Motor Corp | 車両用遠隔支援システム |
JP2014182307A (ja) * | 2013-03-19 | 2014-09-29 | Sharp Corp | 音声認識システム、および発話システム |
JP2014191272A (ja) * | 2013-03-28 | 2014-10-06 | Kddi Corp | 対話シナリオにユーザ操作を反映させる対話プログラム、サーバ及び方法 |
JP2016206249A (ja) * | 2015-04-15 | 2016-12-08 | シャープ株式会社 | 対話装置、対話システム、及び対話装置の制御方法 |
CN111382237A (zh) * | 2018-12-27 | 2020-07-07 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置及任务对话系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07311671A (ja) * | 1994-05-17 | 1995-11-28 | Oki Electric Ind Co Ltd | 音声情報通信システム |
JPH09265300A (ja) * | 1996-03-29 | 1997-10-07 | Sony Corp | 音声処理装置および音声処理方法 |
JPH10111698A (ja) * | 1996-10-07 | 1998-04-28 | Mitsubishi Electric Corp | 音声対話システム |
JP2000339314A (ja) * | 1999-05-25 | 2000-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 自動応答方法及び対話解析方法並びに応答文生成方法、その装置、そのプログラムを記録した媒体 |
JP2001056694A (ja) * | 1999-08-19 | 2001-02-27 | Denso Corp | 対話型ユーザインタフェース装置 |
JP2002033832A (ja) * | 2000-07-18 | 2002-01-31 | Ntt Docomo Inc | サービス提供システム、ボイスゲートウェイ、コンテンツサーバおよびサービス提供方法 |
JP2002073080A (ja) * | 2000-09-01 | 2002-03-12 | Fujitsu Ten Ltd | 音声対話システム |
-
2002
- 2002-04-24 JP JP2002122491A patent/JP4174233B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07311671A (ja) * | 1994-05-17 | 1995-11-28 | Oki Electric Ind Co Ltd | 音声情報通信システム |
JPH09265300A (ja) * | 1996-03-29 | 1997-10-07 | Sony Corp | 音声処理装置および音声処理方法 |
JPH10111698A (ja) * | 1996-10-07 | 1998-04-28 | Mitsubishi Electric Corp | 音声対話システム |
JP2000339314A (ja) * | 1999-05-25 | 2000-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 自動応答方法及び対話解析方法並びに応答文生成方法、その装置、そのプログラムを記録した媒体 |
JP2001056694A (ja) * | 1999-08-19 | 2001-02-27 | Denso Corp | 対話型ユーザインタフェース装置 |
JP2002033832A (ja) * | 2000-07-18 | 2002-01-31 | Ntt Docomo Inc | サービス提供システム、ボイスゲートウェイ、コンテンツサーバおよびサービス提供方法 |
JP2002073080A (ja) * | 2000-09-01 | 2002-03-12 | Fujitsu Ten Ltd | 音声対話システム |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005284543A (ja) * | 2004-03-29 | 2005-10-13 | Chugoku Electric Power Co Inc:The | 業務支援システム及び方法 |
US7660664B2 (en) | 2004-11-25 | 2010-02-09 | Denso Corporation | Information service system |
JP4901736B2 (ja) * | 2005-07-26 | 2012-03-21 | 本田技研工業株式会社 | ユーザと機械とのインタラクションを実施するための装置、方法、およびプログラム |
WO2007013521A1 (ja) * | 2005-07-26 | 2007-02-01 | Honda Motor Co., Ltd. | ユーザと機械とのインタラクションを実施するための装置、方法、およびプログラム |
US8352273B2 (en) | 2005-07-26 | 2013-01-08 | Honda Motor Co., Ltd. | Device, method, and program for performing interaction between user and machine |
US7672757B2 (en) | 2006-12-08 | 2010-03-02 | Hyundai Motor Company | Interface system between human and car |
JP2011108083A (ja) * | 2009-11-19 | 2011-06-02 | Fujitsu Advanced Engineering Ltd | 音声シナリオ生成プログラム及び音声シナリオ生成装置 |
JP2013206319A (ja) * | 2012-03-29 | 2013-10-07 | Toyota Motor Corp | 車両用遠隔支援システム |
JP2014182307A (ja) * | 2013-03-19 | 2014-09-29 | Sharp Corp | 音声認識システム、および発話システム |
JP2014191272A (ja) * | 2013-03-28 | 2014-10-06 | Kddi Corp | 対話シナリオにユーザ操作を反映させる対話プログラム、サーバ及び方法 |
JP2016206249A (ja) * | 2015-04-15 | 2016-12-08 | シャープ株式会社 | 対話装置、対話システム、及び対話装置の制御方法 |
CN111382237A (zh) * | 2018-12-27 | 2020-07-07 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置及任务对话系统 |
CN111382237B (zh) * | 2018-12-27 | 2024-02-06 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置及任务对话系统 |
Also Published As
Publication number | Publication date |
---|---|
JP4174233B2 (ja) | 2008-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9558745B2 (en) | Service oriented speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same | |
Kuhn et al. | Hybrid in-car speech recognition for mobile multimedia applications | |
US10679620B2 (en) | Speech recognition arbitration logic | |
JP5233989B2 (ja) | 音声認識システム、音声認識方法、および音声認識処理プログラム | |
US20120253823A1 (en) | Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing | |
WO2009140884A1 (zh) | 一种车载语音交互系统 | |
US20070112568A1 (en) | Method for speech recognition and communication device | |
JP2009530666A (ja) | 外部ユーザの自動音声認識、口述、録音および再生を提供する方法 | |
US9302677B2 (en) | Methods for providing operator support utilizing a vehicle telematics service system | |
CN105702254A (zh) | 基于移动终端的语音控制装置及其语音控制方法 | |
JP2009300537A (ja) | 音声作動システム、音声作動方法および車載装置 | |
JP2003316385A (ja) | 音声対話システム及び音声対話方法 | |
WO2000010160A1 (fr) | Dispositif et procede de reconnaissance vocale, dispositif de navigation, telephone portable et processeur d'informations | |
JP2006317573A (ja) | 情報端末 | |
US7587322B2 (en) | Robust speech recognition with data bank accession organized by semantic attribute | |
JP4890721B2 (ja) | 音声対話システムを動作させる方法 | |
JP2006099424A (ja) | 音声情報サービスシステム及び音声情報サービス端末 | |
JP2002150039A (ja) | サービス仲介装置 | |
JP6050171B2 (ja) | 認識処理制御装置、認識処理制御方法および認識処理制御プログラム | |
Hataoka et al. | Robust speech dialog interface for car telematics service | |
JP4611823B2 (ja) | 音声認識候補文字列選択装置 | |
JP2005134436A (ja) | 音声認識装置 | |
JP4190735B2 (ja) | 音声認識方法および装置とナビゲーション装置 | |
WO2015075903A1 (ja) | 音声認識装置 | |
JP2004037813A (ja) | 車載用音声認識装置およびそれを用いた音声認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060710 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060912 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061113 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20061129 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20061222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080709 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080818 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4174233 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110822 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120822 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120822 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130822 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |