JP2010048980A - 自動会話システム、並びに会話シナリオ編集装置 - Google Patents
自動会話システム、並びに会話シナリオ編集装置 Download PDFInfo
- Publication number
- JP2010048980A JP2010048980A JP2008212191A JP2008212191A JP2010048980A JP 2010048980 A JP2010048980 A JP 2010048980A JP 2008212191 A JP2008212191 A JP 2008212191A JP 2008212191 A JP2008212191 A JP 2008212191A JP 2010048980 A JP2010048980 A JP 2010048980A
- Authority
- JP
- Japan
- Prior art keywords
- conversation
- sentence
- answer
- unit
- scenario
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】この会話シナリオ編集装置は、ユーザ発話を音声認識することにより入力文を生成し、この入力文に応じた回答文を会話サーバに要求する会話装置と、会話装置から回答文を要求された場合、会話シナリオに基づいて回答文を決定し、この回答文を会話装置に送信し、回答文をユーザに出力させる会話サーバとを有する自動会話システムのために、会話シナリオを生成する会話シナリオ編集装置であって、会話シナリオに基づいて、会話装置が音声認識を行う場合に使用する言語モデルを生成する言語モデル生成部とを有する。
【選択図】図1
Description
本発明は、会話シナリオ編集装置として提案される。この会話シナリオ編集装置は、ユーザ発話を音声認識することにより入力文を生成し、この入力文に応じた回答文を会話サーバに要求する会話装置と、会話装置から回答文を要求された場合、会話シナリオに基づいて回答文を決定し、この回答文を会話装置に送信し、回答文をユーザに出力させる会話サーバとを有する自動会話システムのために、会話シナリオを生成する会話シナリオ編集装置であって、前記会話シナリオに基づいて、会話装置が音声認識を行う場合に使用する言語モデルを生成する言語モデル生成手段(例えば、言語モデル生成部)とを有することを特徴としている。
・会話シナリオが「対象(回答文)と射(入力文)」を連結しながら構築できるので、シナリオの表現が明快である。
・対象の引用機能を開発しているので、対象に関して引用元の情報(ある対象を引用している対象に関わる情報)が利用できる。
・対象の遷移先と引用元により、対象の状態遷移関係が一覧できる。
・対象と射を並べた「回答列」で「対象と射」の基本性質を表現することができる。
・「回答列」は正に「台本」に類するものであり、一般の台本作成という観点では「回答列は極めて明快な情報」である。
・会話シナリオ編集装置・会話サーバ・会話装置の全体により、「台本通りに会話装置を動作させる」ことが実現できる。
なお、会話シナリオ編集装置は「対象と射とからなる会話シナリオ」が扱えるような仕組みであれば、上記の内容に限定されることはない。
また、上記会話シナリオ編集装置において、会話シナリオ編集装置は、予め定めた内容のユーザ発話以外の全てのユーザ発話を一つの射として記述することが可能であるようにしてもよい。かかる会話シナリオ編集装置によれば、無限のユーザ発話を被覆可能な回答文を定義することが可能となる。
を有することを特徴としている。
かかる自動会話システムによれば、ユーザ発話(入力文)に応答しながら、予め用意した会話の流れに沿った会話内容を実現する会話シナリオに基づいた言語モデルを生成して、より的確な音声認識にもとづいた会話内容を実現可能とすることができる。
また、上記自動会話システムにおいて、前記会話シナリオは、対象と射とからなり、射である入力文と、その射に対応する対象である回答文とを有する前記会話シナリオを生成する編集手段をさらに有するようにしてもよい。
かかる自動会話システムによれば、従来の自動会話装置においては、KBに基づいて会話を実行する会話エンジンに特有の知識が理解できるKB(知識ベース)技術者のみしか作成できなかったが、会話装置を動作させる知識を一般の人(エンドユーザなど)にも自由に「対象と射の枠組み」からなる会話シナリオが構築できるようにすることで、より的確な音声認識にもとづいた会話内容を実現可能とすることができる。しかも、これにより、KB作成者は「会話シナリオ」の全体が把握できるようになる。
また、上記の自動会話システムにおいて、前記会話シナリオから射に対応する対象を検索するための動的知識を生成する動的知識生成手段をさらに有するようにしてもよい。
また、上記会話シナリオ編集装置において、会話シナリオ編集装置は、予め定めた内容のユーザ発話以外の全てのユーザ発話を一つの射として記述することが可能であるようにしてもよい。かかる会話シナリオ編集装置によれば、無限のユーザ発話を被覆可能な回答文を定義することが可能となる。
本実施の形態は、予め用意された会話シナリオに基づいて、ユーザの発話などに応答して回答を出力する自動会話システム、及び会話シナリオを生成、編集する会話シナリオ編集装置として提案される。
以下、自動会話システム、会話シナリオ編集装置の構成例について説明する。図1は、自動会話システム1の構成例を示すブロック図である。自動会話システム1は、会話装置10と、会話装置10に接続された会話サーバ20と、会話サーバ20が使用する会話シナリオを生成、編集する会話シナリオ編集装置30で構成される。
[1.1.会話装置]
会話装置10は、ユーザの発話(ユーザ発話)を入力として取得し、この入力内容(以下、入力文と呼ぶ)を会話サーバ20に送信し、会話サーバ20から返信されてくる回答及び動作制御情報を受信し、受信内容に基づいて、回答の出力及び動作制御情報に応じた動作を実行する機能を有する。
前処理部110は、音声信号であるアナログ信号をデジタル信号に変換し、またノイズを除去して特徴抽出を容易にする雑音除去処理を行う。
識別演算部140は、探索の結果得られた単語列を入力文として出力し、会話制御部処理部12に渡す。
以上で識別部130、音声認識部15の説明を終了する。
会話処理部12は、音声認識部15から受け取った入力文を会話サーバ20に送り、入力文に応じた回答文及びその回答文に対応する動作制御情報を送信するよう、会話サーバ20に要求する。また、会話処理部12は、会話サーバ20から回答文及びその回答文に対応する動作制御情報を受信すると、回答文を出力部14に渡して出力させるとともに、動作制御情報を動作制御部13に渡す。
会話サーバ20は、会話シナリオに基づいて発話内容に対する返事である回答とこの回答に対応した動作であって会話装置10に実行させる動作を記述した情報である動作制御情報を決定し、回答及び動作制御情報を会話装置10に出力する機能を有する装置である。
会話シナリオ編集装置30は、前述の会話サーバ20が使用する会話シナリオを新たに生成し、又は生成済みの会話シナリオを変更し、内容を追加し、又は内容の一部削除を行って修正された会話シナリオを生成する機能を有する。
また、エディタ部32は、生成されている会話シナリオにおいて適正な状態遷移関係が保たれているか否かをチェックし、違反が生じている場合にはオペレータに違反が生じていること、違反が生じている入力文又は回答文を知らせるメッセージ等を生成し、出力部に表示等させる機能を有していても良い。
また、エディタ部32は会話サーバ20の意味解釈辞書部23に相当する意味解釈辞書部をさらに有していても良く、エディタ部32はこの意味解釈辞書部を用いて、会話シナリオにおいて重複する意味内容の入力文又は回答文が存在する場合、これらを整理したり統合したりする、或いは整理、統合をオペレータに促す機能を有していても良い。
ここで、会話シナリオ40について説明する。本発明における会話シナリオは下記の特徴を有する。
この特徴を備えることにより、会話シナリオが定める会話の流れを「状態遷移図」で表現することが可能となる。本発明の会話シナリオは、後述する「その他」機能を用いることにより、全ての入力文(ユーザ発話)に対応した回答文の出力が可能となる。また、後述する「タイマー」発話によりユーザの「無言」(入力無し)に対応できる(無言を射として扱える)。
この特徴により、主シナリオから分岐するような発話を受け付けることができるようになるとともに、分岐しても元(主シナリオ)に戻すことができる。従って、会話シナリオの作成者は自らが思い描く会話の流れ「ストーリー」が構築でき、このストーリーに沿った会話を会話システムに行わせることができる。
なお、上記図7の会話シナリオを回答列として表現すると、図8のような内容となる。ここにX2はX2の引用である。引用されたX2の引用元はX2であり、形式的には、対象X1とX2との間に射「(嫌いです) X3 (<その他>|<timer>)」が定められていることに相当する。この射は、射「嫌いです」と射「<その他>|<timer>」の合成である。
(イ) ユーザ発話に対して「強制回答」をすることができる。
図9は、強制回答を行う会話シナリオの例を示した状態遷移図である。この例では、回答文X1「私はラーメンが好きです。ラーメンこそグルメの本質」の出力時において、NULLの付いた第1の射<その他>が規定されており、どのような入力文(ユーザ発話)であっても、入力文を無視して「私はラーメンが好きです。ラーメンこそグルメの本質」の強制出力がなされる。一方、回答文X1「私はラーメンが好きです。ラーメンこそグルメの本質」の出力後、第2の射<timer>により回答文X2「本当に美味しい店を紹介してあげる」に遷移する。
この例では、相手の発話を無視することを「NULL」と表記している。図9に示した例では、全ての発話を無視するために<その他>にNULLを付けているが、「嫌い」だけを無視するようにすることもできる。
(<その他>|<timer>) X2 (<その他>|<timer>)
X3 (<その他>|<timer>) X4 (<その他>|<timer>)
を単位元と呼ぶ。この場合の単位元は「閉ループ」を構成している。
以上で、「項目(3)単位元が定義できる」の説明を終了する。
この特徴により、ある射に対応する回答列Sに対して、異なる2つの経路に沿う回答列S1とS2の構築が可能であり、しかもそれらが等しいものとして扱うことができる。このとき、Sをある問題に関わる回答列とすると、S1とS2は、Sに対する異なる解釈を与える回答列であり、問題解決に関わる情報を提供している。この特徴を有するが故に、本発明にかかる会話シナリオでは、ロジカルなユーザ発話に対応することができる。
図15に、射の合成に結合法則が成り立つ会話シナリオの例の状態遷移図を示す。なお、上記図15の会話シナリオを回答列として表現すると、図16のような内容となる。ここに、X2はX2の引用である。形式的に次式が成立する。
(ヒントは) X3 (××です) X4 (<その他>|<timer>)
= (××です) X4 (<その他>|<timer>)
= (ヒントは) X3 (<その他>|<timer>)
この特徴により、任意の対象に到着するための射が定義できる。このため、シナリオにゴールが設定できるとともに、シナリオ全体の把握ができることとなる。
本発明は、「入力文を対象とし、回答文を射として扱える談話の範囲」では「検索の仕組みが全く異なるため、「入力文を射とし、回答文を対象として扱える談話の範囲」と同様の扱いはできない。本件では、前者のような談話の範囲は扱わない。
ここで、本発明の会話シナリオ編集装置30の位置づけについてまとめる。
(1)対象と射とを有する会話シナリオに関しては、以下の特徴をあげることができる。
・回答文を対象、入力文を射とする(状態遷移)
・入力文を尊重しつつ、固執したい回答文に導く(文脈維持:合成)
・入力文とは関係なく、回答文を言い切る(強制回答:単位元)
・相手に対して必要な発話を言うまで繰り返し催促する(固執回答:単位元)
・閉じられたループの中で入力文を促す(閉ループ:単位元)
・問題解決に繋がるような会話を行う(問題解決:結合法則)
・ゴールに向かうような会話を行う(ゴールのある会話:可換な図式)
なお、回答列によっても上記の特徴を整理することができる。会話シナリオ編集装置30は、上記の会話シナリオの特徴を回答列で表現する機能を有したものである。
次に、上記会話シナリオ編集装置30の動作例について説明する。
本実施の形態にかかる会話シナリオ編集装置30は、複数の異なる主題(会話のテーマ)についてユーザとの会話を成立させることが出来る。図18は、会話シナリオ保持部33及び会話シナリオ記憶部22(以下、単に会話シナリオ保持部33と略す)が記憶する会話シナリオのデータ構成例を示す図である。
例えば、上記の会話シナリオは以下のようなユーザとシステムの会話となる。
ユーザ発話文210−1:「いい天気ですね」
システム発話文220―1:「いい天気は好きですか?」
ユーザ発話文210−1:「はい、好きですよ」
システム発話文220―1:「雨の日は嫌いですか?」
次に、会話シナリオの入力例について説明する。図19から図23は、あるドメイン200について会話シナリオを入力した場合の入力画面の遷移の一例を示した図である。
図20は、このドメイン200に格納される会話シナリオの開始であるユーザ発話文401が入力され他状態の画面例である。
[3.変形例]
本実施の形態は、以下のように変形されても成立する。
(1)会話シナリオ編集装置の変形例
図24に変形例にかかる会話シナリオ編集装置30Xの機能ブロック図である。会話シナリオ編集装置30Xは、基本的に前述した会話シナリオ編集装置30と同様の構成を有しており、会話シナリオ保持部33に接続された動的知識生成部35を有している点が異なっている。なお、同一の構成要素については同一の参照符号を付し、それらの説明については省略する。
動的知識生成部35は、会話シナリオ保持部33に記憶される会話シナリオ40にもとづいて、動的知識40Xを生成する機能を有する。動的知識40Xは、回答列である会話シナリオ40から、会話サーバ20がより高速且つ高効率に射である入力文および、その対象である回答文を検索できるように再構成されたデータである。
かかる変形例によれば、会話サーバ20の処理負荷を低減させ、高速な回答文の返信を可能とすることができる。
[4.会話サーバの構成の別の例]
本発明にかかる会話サーバ20、回答処理部21は下記のような構成を採用しても、本発明を実現可能である。以下、会話サーバ20,より詳しくは回答処理部21の構成例について述べる。図25は、回答処理部21の拡大ブロック図であって、会話制御部300及び文解析部400の具体的構成例を示すブロック図である。回答処理部21は、会話制御部300と、文解析部400と、会話データベース500を有している。会話データベース500は、会話シナリオ40又は、動的知識40Xを記憶する機能を有する。
次に、図25を参照しながら文解析部400の構成例について説明する。
形態素抽出部420は、文字列特定部410で区切られた一文節の文字列に基づいて、その一文節の文字列の中から、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するものである。ここで、形態素とは、本実施の形態では、文字列に現された語構成の最小単位を意味するものとする。この語構成の最小単位としては、例えば、名詞、形容詞、動詞などの品詞が挙げられる。
入力種類判定部440は、文字列特定部410で特定された文字列に基づいて、発話内容の種類(発話種類)を判定するものである。この発話種類は、発話内容の種類を特定する情報であって、本実施の形態では、例えば図27に示す「発話文のタイプ」を意味する。図27は、「発話文のタイプ」と、その発話文のタイプを表す二文字のアルファベット、及びその発話文のタイプに該当する発話文の例を示す図である。
次に、会話データベース500が記憶するデータのデータ構成例について図29を参照しながら説明する。図29は、会話データベース500が記憶するデータの構成例を示す概念図である。
話題特定情報810「佐藤」には、複数の話題タイトル(820)1−1、1−2、…が対応付けされている。それぞれの話題タイトル(820)1−1,1−2,…には回答文(830)1−1,1−2、…が対応付けされて記憶されている。回答文830は、回答種類840ごとに用意されている。
ここで図25に戻り、会話制御部300の構成例を説明する。
会話制御部300は、回答処理部21内の各構成要素(音声認識部200,文解析部400、会話データベース500,出力部600,音声認識辞書記憶部700)間のデータの受け渡しを制御するとともに、ユーザ発話に応答する回答文の決定、出力を行う機能を有する。
[4.1.6.1.管理部]
管理部310は談話履歴を記憶し、且つ必要に応じて更新する機能を有する。管理部310は話題特定情報検索部350と、省略文補完部360と、話題検索部370と、回答取得部380からの要求に応じて、記憶している談話履歴の全部又は一部をこれら各部に渡す機能を有する。
プラン会話処理部320は、プランを実行し、プランに従った会話をユーザとの間で成立させる機能を有する。「プラン」とは、予め定めた順番に従って予め定めた回答をユーザに提供することをいう。以下、プラン会話処理部320について説明する。
図25に戻り、会話制御部300の構成例の説明を続ける。
談話空間会話制御処理部330は、話題特定情報検索部350と、省略文補完部360と、話題検索部370と、回答取得部380とを有している。前記管理部310は、会話制御部300の全体を制御するものである。
[4.1.6.3.1.話題特定情報検索部]
話題特定情報検索部350は、形態素抽出部420で抽出された第一形態素情報と各話題特定情報とを照合し、各話題特定情報の中から、第一形態素情報を構成する形態素と一致する話題特定情報を検索するものである。具体的に、話題特定情報検索部350は、形態素抽出部420から入力された第一形態素情報が「佐藤」及び「好き」の二つの形態素で構成される場合には、入力された第一形態素情報と話題特定情報群とを照合する。
省略文補完部360は、前記第一形態素情報を、前回までに検索された話題特定情報810(以下、「着目話題特定情報」と呼ぶ)及び前回の回答文に含まれる話題特定情報810(以下、「回答文話題特定情報」と呼ぶ)を利用して、補完することにより複数種類の補完された第一形態素情報を生成する。例えばユーザ発話が「好きだ」という文であった場合、省略文補完部360は、着目話題特定情報「佐藤」を、第一形態素情報「好き」に含めて、補完された第一形態素情報「佐藤、好き」を生成する。
話題検索部370は、省略文補完部360で話題タイトル810が決まらなかったとき、第一形態素情報と、利用者入力文話題特定情報に対応する各話題タイトル810とを照合し、各話題タイトル810の中から、第一形態素情報に最も適する話題タイトル810を検索するものである。
具体的に、省略文補完部360から検索命令信号が入力された話題検索部370は、入力された検索命令信号に含まれる利用者入力文話題特定情報及び第一形態素情報に基づいて、その利用者入力文話題特定情報に対応付けられた各話題タイトルの中から、その第一形態素情報に最も適した話題タイトル810を検索する。話題検索部370は、その検索した話題タイトル810を検索結果信号として回答取得部380に出力する。
話題検索部370は、その照合結果に基づいて、各話題タイトル(820)1-1〜1-2の中から、入力された第一形態素情報「佐藤、好き」と一致する話題タイトル(820)1-1(佐藤;*;好き)を特定する。話題検索部340は、検索した話題タイトル(820)1-1(佐藤;*;好き)を検索結果信号として回答取得部380に出力する。
回答取得部380は、省略文補完部360,或いは話題検索部370で検索された話題タイトル820に基づいて、その話題タイトル820に対応付けられた回答文830を取得する。また、回答取得部380は、話題検索部370で検索された話題タイトル820に基づいて、その話題タイトル820に対応付けられた各回答種類と、入力種類判定部440で判定された発話種類とを照合する。その照合をした回答取得部380は、各回答種類の中から、判定された発話種類と一致する回答種類を検索する。
ここで、上記"DA"、"TA"等のうち、"A"は、肯定形式を意味する。従って、発話種類及び回答種類に"A"が含まれているときは、ある事柄について肯定することを示している。また、発話種類及び回答種類には、"DQ"、"TQ"等の種類を含めることもできる。この"DQ"、"TQ"等のうち"Q"は、ある事柄についての質問を意味する。
CA会話処理部340は、ユーザ発話に対して、プラン会話処理部320および談話空間会話制御処理部330のいずれにおいても回答文が決定しない場合に、ユーザ発話の内容に応じて、ユーザとの会話を継続できるような回答文を出力する機能を有する。
以上で回答処理部21の構成例の説明を終了する。
上記構成を有する回答処理部21は、以下のように動作することにより会話制御方法を実行する。本実施の形態にかかる回答処理部21,より詳しくは会話制御部300の動作について説明する。
基本制御状態情報は、プランの基本制御状態を記述する役割を有する。
この基本制御状態は、ユーザ発話が実行中のプラン1402、より詳しくはプラン1402に対応する話題タイトル820や用例文1701に一致する場合である。この場合は、プラン会話処理部320は当該プラン1402を終了し、次プラン指定情報1502にて指定された回答文1501に対応するプラン1402に移行する。
この基本制御状態は、ユーザ発話内容がプラン1402の終了を要求していると判断される場合、またはユーザの関心が実行中のプラン以外の事項に移ったと判定される場合に、設定される基本制御状態である。基本制御状態情報が破棄を示している場合は、プラン会話処理部320は、破棄の対象となったプラン1402以外にユーザ発話に対応するプラン1402がないかどうかを検索し、存在する場合にはそのプラン1402の実行を開始し、存在しない場合には、プランの実行を終了する。
この基本制御状態は、ユーザ発話が、実行中のプラン1402に対応するに対応する話題タイトル820(図33参照)や用例文1701(図37参照)に該当しない場合であって、かつユーザ発話が基本制御状態「破棄」に該当するものではないと判断される場合に、基本制御状態情報に記述される基本制御状態である。
この状態は、ユーザ発話が、実行中のプラン1402に含まれる回答文1501に対応しない場合であって、かつユーザ発話内容が基本制御状態「破棄」に該当するものではないと判断され、かつユーザ発話から解釈されるユーザの意図が明瞭でない場合に、設定される基本制御状態である。
基本制御状態情報を参照したプラン会話処理部320は、基本制御状態情報が示す基本制御状態が「結束」であるか否かを判定する(S1902)。基本制御状態が「結束」であると判定した場合(S1902、Yes)は、プラン会話処理部320は、基本制御状態情報が示す実行中のプラン1402において、回答文1501が最終回答文であるかどうかを判定する(S1903)。
回答文出力処理(S1908)後、プラン会話処理部320はプラン会話制御処理を終了する。
以上で、プラン会話制御処理の説明を終了する。
プラン会話制御処理(S1801)を終了すると、会話制御部300は談話空間会話制御処理を開始する(S1802)。ただし、プラン会話制御処理(S1801)において回答文出力を行った場合は、会話制御部300は談話空間会話制御処理(S1802)、および後に説明するCA会話制御処理(S1803)のいずれも行わず、基本制御情報更新処理(S1904)を行ってメイン処理を終了する。
先ず、入力部100が、利用者からの発話内容を取得するステップを行う(ステップS2201)。具体的には、入力部100は、利用者の発話内容を構成する音声を取得する。入力部100は、取得した音声を音声信号として音声認識部200に出力する。なお、入力部100は、利用者からの音声ではなく、利用者から入力された文字列(例えば、テキスト形式で入力された文字データ)を取得してもよい。この場合、入力部100はマイクではなく、キーボードやタッチパネルなどの文字入力装置となる。
この照合をした形態素抽出部420は、入力された文字列の中から、予め記憶された形態素群に含まれる各形態素と一致する各形態素(m1、m2、…)を抽出する。形態素抽出部420は、抽出した各形態素を第一形態素情報として話題特定情報検索部350に出力する。
第一形態素情報を構成する形態素と着目話題タイトル820focusとが一致する場合、話題特定情報検索部350は、その話題タイトル820を回答取得部380に出力する。一方、話題特定情報検索部350は、第一形態素情報を構成する形態素と話題タイトル820とが一致しなかった場合には、入力された第一形態素情報及び利用者入力文話題特定情報を検索命令信号として省略文補完部360に出力する。
会話制御部300は談話空間会話制御処理を終了すると、CA会話制御処理を実行する(S1803)。ただし、プラン会話制御処理(S1801)および談話空間会話制御処理(S1801)において回答文出力を行った場合は、会話制御部300はCA会話制御処理(S1803)を行わず、基本制御情報更新処理(S1804)を行ってメイン処理を終了する。
10 … 会話装置
20 … 会話サーバ
30 … 会話シナリオ編集装置
40 … 会話シナリオ
Claims (8)
- ユーザ発話を音声認識することにより入力文を生成し、この入力文に応じた回答文を会話サーバに要求する会話装置と、前記会話装置から回答文を要求された場合、会話シナリオに基づいて回答文を決定し、この回答文を前記会話装置に送信し、回答文をユーザに出力させる会話サーバとを有する自動会話システムのために、前記会話シナリオを用いる会話シナリオ編集装置であって、
前記会話シナリオに基づいて、前記会話装置が音声認識を行う場合に使用する言語モデルを生成する言語モデル生成手段
を有することを特徴とする会話シナリオ編集装置。 - 前記会話シナリオは、対象と射とからなり、
射である入力文と、その射に対応する対象である回答文とを有する前記会話シナリオを生成する編集手段をさらに有することを特徴とする請求項1に記載の会話シナリオ編集装置。 - 前記会話シナリオから射に対応する対象を検索するための動的知識を生成する動的知識生成手段をさらに有することを特徴とする請求項2に記載の会話シナリオ編集装置。
- ユーザ発話を音声認識することにより入力文を生成し、この入力文に応じた回答文を会話サーバに要求する会話装置と、
前記会話装置から回答文を要求された場合、会話シナリオに基づいて回答文を決定し、この回答文を前記会話装置に送信し、回答文をユーザに出力させる会話サーバと、
前記会話シナリオに基づいて、前記会話装置が音声認識を行う場合に使用する言語モデルを生成する言語モデル生成手段を有する会話シナリオ編集装置と
を有することを特徴とする自動会話システム。 - 前記会話シナリオは、対象と射とからなり、
射である入力文と、その射に対応する対象である回答文とを有する前記会話シナリオを生成する編集手段をさらに有することを特徴とする請求項4に記載の自動会話システム。 - 前記会話シナリオから射に対応する対象を検索するための動的知識を生成する動的知識生成手段をさらに有することを特徴とする請求項5に記載の自動会話システム。
- 前記会話サーバは、前記会話装置に行わせる動作を記述した動作制御情報を前記会話装置に送信し、前記会話装置は前記動作制御情報に基づいて、回答文の出力とともに動作を実行する、ことを特徴とする請求項4から6に記載の自動会話システム。
- 前記会話装置は、前記動作制御情報によって動作を制御される端末装置であることを特徴とする、請求項7に記載の自動会話システム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008212191A JP5149737B2 (ja) | 2008-08-20 | 2008-08-20 | 自動会話システム、並びに会話シナリオ編集装置 |
US12/542,311 US8935163B2 (en) | 2008-08-20 | 2009-08-17 | Automatic conversation system and conversation scenario editing device |
EP09010660.0A EP2157570B1 (en) | 2008-08-20 | 2009-08-19 | Automatic conversation system and conversation scenario editing device |
CN2009101670565A CN101656799B (zh) | 2008-08-20 | 2009-08-19 | 自动会话系统以及会话情节编辑装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008212191A JP5149737B2 (ja) | 2008-08-20 | 2008-08-20 | 自動会話システム、並びに会話シナリオ編集装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010048980A true JP2010048980A (ja) | 2010-03-04 |
JP5149737B2 JP5149737B2 (ja) | 2013-02-20 |
Family
ID=41319846
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008212191A Expired - Fee Related JP5149737B2 (ja) | 2008-08-20 | 2008-08-20 | 自動会話システム、並びに会話シナリオ編集装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8935163B2 (ja) |
EP (1) | EP2157570B1 (ja) |
JP (1) | JP5149737B2 (ja) |
CN (1) | CN101656799B (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013172014A1 (ja) * | 2012-05-17 | 2013-11-21 | 日本電気株式会社 | 言語モデル生成装置、音声認識装置、言語モデル生成方法およびプログラム記憶媒体 |
JP2019159969A (ja) * | 2018-03-14 | 2019-09-19 | 株式会社日立製作所 | シナリオ作成支援システム及びシナリオ作成支援方法 |
JP2021018797A (ja) * | 2019-07-23 | 2021-02-15 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 対話の交互方法、装置、コンピュータ可読記憶媒体、及びプログラム |
CN112735407A (zh) * | 2020-12-24 | 2021-04-30 | 北京三快在线科技有限公司 | 一种对话处理方法及装置 |
CN114299959A (zh) * | 2021-12-14 | 2022-04-08 | 北京捷通华声科技股份有限公司 | 一种通过语音指令生成可视化多轮对话的方法及装置 |
JP7576290B1 (ja) | 2023-06-09 | 2024-10-31 | 株式会社サイバーエージェント | 話題モジュールセット作成装置、対話装置、話題モジュールセット作成方法、対話方法及びコンピュータプログラム |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8374859B2 (en) | 2008-08-20 | 2013-02-12 | Universal Entertainment Corporation | Automatic answering device, automatic answering system, conversation scenario editing device, conversation server, and automatic answering method |
US10223636B2 (en) * | 2012-07-25 | 2019-03-05 | Pullstring, Inc. | Artificial intelligence script tool |
US8972324B2 (en) | 2012-07-25 | 2015-03-03 | Toytalk, Inc. | Systems and methods for artificial intelligence script modification |
KR101909141B1 (ko) | 2012-07-27 | 2018-10-17 | 엘지전자 주식회사 | 전자기기 및 전자기기의 제어방법 |
CN103177519B (zh) * | 2013-02-22 | 2015-03-25 | 秦方 | 具有房门报警和即时声音回应功能的远程监控方法 |
CN103297503B (zh) * | 2013-05-08 | 2016-08-17 | 南京邮电大学 | 基于分层次信息提取服务器的移动终端群智感知系统 |
US10152972B1 (en) * | 2013-05-15 | 2018-12-11 | Allscripts Software, Llc | Conversational agent |
CN103578464B (zh) * | 2013-10-18 | 2017-01-11 | 威盛电子股份有限公司 | 语言模型的建立方法、语音辨识方法及电子装置 |
JP5996603B2 (ja) * | 2013-10-31 | 2016-09-21 | シャープ株式会社 | サーバ、発話制御方法、発話装置、発話システムおよびプログラム |
CN104834651B (zh) * | 2014-02-12 | 2020-06-05 | 北京京东尚科信息技术有限公司 | 一种提供高频问题回答的方法和装置 |
KR102193559B1 (ko) * | 2014-02-18 | 2020-12-22 | 삼성전자주식회사 | 대화형 서버 및 이의 제어 방법 |
US9437189B2 (en) * | 2014-05-29 | 2016-09-06 | Google Inc. | Generating language models |
JP6390264B2 (ja) * | 2014-08-21 | 2018-09-19 | トヨタ自動車株式会社 | 応答生成方法、応答生成装置及び応答生成プログラム |
KR20160056548A (ko) * | 2014-11-12 | 2016-05-20 | 삼성전자주식회사 | 질의 응답을 위한 디스플레이 장치 및 방법 |
JP6440483B2 (ja) * | 2014-12-17 | 2018-12-19 | シャープ株式会社 | 通信システム、サーバ装置、ロボット、情報処理方法、およびプログラム |
JP6589514B2 (ja) * | 2015-09-28 | 2019-10-16 | 株式会社デンソー | 対話装置及び対話制御方法 |
US10311862B2 (en) | 2015-12-23 | 2019-06-04 | Rovi Guides, Inc. | Systems and methods for conversations with devices about media using interruptions and changes of subjects |
US20190311716A1 (en) * | 2016-10-06 | 2019-10-10 | Sharp Kabushiki Kaisha | Dialog device, control method of dialog device, and a non-transitory storage medium |
RU2707149C2 (ru) | 2017-12-27 | 2019-11-22 | Общество С Ограниченной Ответственностью "Яндекс" | Устройство и способ модифицирования вывода аудиосигнала устройства |
USD885366S1 (en) | 2017-12-27 | 2020-05-26 | Yandex Europe Ag | Speaker device |
RU2711104C2 (ru) | 2017-12-27 | 2020-01-15 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и компьютерное устройство для определения намерения, связанного с запросом для создания зависящего от намерения ответа |
EP3732676A4 (en) * | 2017-12-29 | 2021-09-22 | DMAI, Inc. | SYSTEM AND METHOD FOR INTELLIGENT INITIATION OF A HUMAN-MACHINE DIALOGUE BASED ON MULTIMODAL SENSORY INPUTS |
RU2693332C1 (ru) | 2017-12-29 | 2019-07-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и компьютерное устройство для выбора текущего зависящего от контекста ответа для текущего пользовательского запроса |
CN110019736B (zh) * | 2017-12-29 | 2021-10-01 | 北京京东尚科信息技术有限公司 | 基于语言模型的问答匹配方法、系统、设备及存储介质 |
EP3576084B1 (de) * | 2018-05-29 | 2020-09-30 | Christoph Neumann | Effiziente dialoggestaltung |
USD931294S1 (en) | 2018-06-22 | 2021-09-21 | 5 Health Inc. | Display screen or portion thereof with a graphical user interface |
US20190392926A1 (en) * | 2018-06-22 | 2019-12-26 | 5 Health Inc. | Methods and systems for providing and organizing medical information |
JP2020154269A (ja) * | 2019-03-22 | 2020-09-24 | 株式会社日立ビルシステム | 複数人対話システムおよび複数人対話方法 |
CN111831795B (zh) * | 2019-04-11 | 2023-10-27 | 北京猎户星空科技有限公司 | 多轮对话处理方法、装置、电子设备及存储介质 |
CN110096191B (zh) * | 2019-04-24 | 2021-06-29 | 北京百度网讯科技有限公司 | 一种人机对话方法、装置及电子设备 |
CN112017642B (zh) * | 2019-05-31 | 2024-04-26 | 华为技术有限公司 | 语音识别的方法、装置、设备及计算机可读存储介质 |
CN110347792B (zh) * | 2019-06-25 | 2022-12-20 | 腾讯科技(深圳)有限公司 | 对话生成方法及装置、存储介质、电子设备 |
USD947152S1 (en) | 2019-09-10 | 2022-03-29 | Yandex Europe Ag | Speaker device |
CN110827821B (zh) * | 2019-12-04 | 2022-04-12 | 三星电子(中国)研发中心 | 一种语音交互装置、方法和计算机可读存储介质 |
WO2021112642A1 (en) * | 2019-12-04 | 2021-06-10 | Samsung Electronics Co., Ltd. | Voice user interface |
JP7566476B2 (ja) * | 2020-03-17 | 2024-10-15 | 東芝テック株式会社 | 情報処理装置、情報処理システム及びその制御プログラム |
CN111611368B (zh) * | 2020-05-22 | 2023-07-04 | 北京百度网讯科技有限公司 | 多轮对话中公共场景对话回溯的方法和装置 |
US11908477B2 (en) * | 2020-08-28 | 2024-02-20 | Cisco Technology, Inc. | Automatic extraction of conversation highlights |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004310628A (ja) * | 2003-04-10 | 2004-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 対話シナリオ生成方法、対話シナリオ生成装置、対話シナリオ生成用プログラム |
JP2006003413A (ja) * | 2004-06-15 | 2006-01-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声自動応答方法、この方法を実施する装置、音声自動応答プログラムおよびその記録媒体 |
JP2007052043A (ja) * | 2005-08-15 | 2007-03-01 | Nippon Telegr & Teleph Corp <Ntt> | 音声対話シナリオ作成方法、装置、音声対話シナリオ作成プログラム、記録媒体 |
JP2007115144A (ja) * | 2005-10-21 | 2007-05-10 | Aruze Corp | 会話制御装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7003463B1 (en) * | 1998-10-02 | 2006-02-21 | International Business Machines Corporation | System and method for providing network coordinated conversational services |
US6266642B1 (en) * | 1999-01-29 | 2001-07-24 | Sony Corporation | Method and portable apparatus for performing spoken language translation |
US20030182113A1 (en) * | 1999-11-22 | 2003-09-25 | Xuedong Huang | Distributed speech recognition for mobile communication devices |
GB2372864B (en) * | 2001-02-28 | 2005-09-07 | Vox Generation Ltd | Spoken language interface |
US20020138274A1 (en) * | 2001-03-26 | 2002-09-26 | Sharma Sangita R. | Server based adaption of acoustic models for client-based speech systems |
JP4340024B2 (ja) | 2001-06-07 | 2009-10-07 | 日本放送協会 | 統計的言語モデル生成装置および統計的言語モデル生成プログラム |
US20050080628A1 (en) * | 2003-10-10 | 2005-04-14 | Metaphor Solutions, Inc. | System, method, and programming language for developing and running dialogs between a user and a virtual agent |
JP2007114621A (ja) * | 2005-10-21 | 2007-05-10 | Aruze Corp | 会話制御装置 |
JP4846336B2 (ja) * | 2005-10-21 | 2011-12-28 | 株式会社ユニバーサルエンターテインメント | 会話制御装置 |
JP4849663B2 (ja) | 2005-10-21 | 2012-01-11 | 株式会社ユニバーサルエンターテインメント | 会話制御装置 |
JP4888996B2 (ja) | 2005-10-21 | 2012-02-29 | 株式会社ユニバーサルエンターテインメント | 会話制御装置 |
JP4018743B1 (ja) | 2007-02-28 | 2007-12-05 | ネット株式会社 | 保護具、制御用基板及び遊技機 |
-
2008
- 2008-08-20 JP JP2008212191A patent/JP5149737B2/ja not_active Expired - Fee Related
-
2009
- 2009-08-17 US US12/542,311 patent/US8935163B2/en active Active
- 2009-08-19 CN CN2009101670565A patent/CN101656799B/zh not_active Expired - Fee Related
- 2009-08-19 EP EP09010660.0A patent/EP2157570B1/en not_active Not-in-force
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004310628A (ja) * | 2003-04-10 | 2004-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 対話シナリオ生成方法、対話シナリオ生成装置、対話シナリオ生成用プログラム |
JP2006003413A (ja) * | 2004-06-15 | 2006-01-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声自動応答方法、この方法を実施する装置、音声自動応答プログラムおよびその記録媒体 |
JP2007052043A (ja) * | 2005-08-15 | 2007-03-01 | Nippon Telegr & Teleph Corp <Ntt> | 音声対話シナリオ作成方法、装置、音声対話シナリオ作成プログラム、記録媒体 |
JP2007115144A (ja) * | 2005-10-21 | 2007-05-10 | Aruze Corp | 会話制御装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013172014A1 (ja) * | 2012-05-17 | 2013-11-21 | 日本電気株式会社 | 言語モデル生成装置、音声認識装置、言語モデル生成方法およびプログラム記憶媒体 |
JP2019159969A (ja) * | 2018-03-14 | 2019-09-19 | 株式会社日立製作所 | シナリオ作成支援システム及びシナリオ作成支援方法 |
JP7060985B2 (ja) | 2018-03-14 | 2022-04-27 | 株式会社日立製作所 | シナリオ作成支援システム及びシナリオ作成支援方法 |
JP2021018797A (ja) * | 2019-07-23 | 2021-02-15 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 対話の交互方法、装置、コンピュータ可読記憶媒体、及びプログラム |
US11322153B2 (en) | 2019-07-23 | 2022-05-03 | Baidu Online Network Technology (Beijing) Co., Ltd. | Conversation interaction method, apparatus and computer readable storage medium |
JP7150770B2 (ja) | 2019-07-23 | 2022-10-11 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 対話方法、装置、コンピュータ可読記憶媒体、及びプログラム |
CN112735407A (zh) * | 2020-12-24 | 2021-04-30 | 北京三快在线科技有限公司 | 一种对话处理方法及装置 |
CN112735407B (zh) * | 2020-12-24 | 2023-07-21 | 北京三快在线科技有限公司 | 一种对话处理方法及装置 |
CN114299959A (zh) * | 2021-12-14 | 2022-04-08 | 北京捷通华声科技股份有限公司 | 一种通过语音指令生成可视化多轮对话的方法及装置 |
JP7576290B1 (ja) | 2023-06-09 | 2024-10-31 | 株式会社サイバーエージェント | 話題モジュールセット作成装置、対話装置、話題モジュールセット作成方法、対話方法及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP2157570B1 (en) | 2017-07-05 |
US8935163B2 (en) | 2015-01-13 |
CN101656799B (zh) | 2013-08-14 |
EP2157570A1 (en) | 2010-02-24 |
CN101656799A (zh) | 2010-02-24 |
US20100049513A1 (en) | 2010-02-25 |
JP5149737B2 (ja) | 2013-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5149737B2 (ja) | 自動会話システム、並びに会話シナリオ編集装置 | |
JP5897240B2 (ja) | 顧客対応システム、並びに会話サーバ | |
JP4849663B2 (ja) | 会話制御装置 | |
JP4849662B2 (ja) | 会話制御装置 | |
US10936664B2 (en) | Dialogue system and computer program therefor | |
US20210158795A1 (en) | Generating audio for a plain text document | |
US20200395008A1 (en) | Personality-Based Conversational Agents and Pragmatic Model, and Related Interfaces and Commercial Models | |
US9154629B2 (en) | System and method for generating personalized tag recommendations for tagging audio content | |
CN110782880B (zh) | 一种韵律生成模型的训练方法及装置 | |
JP5620349B2 (ja) | 対話装置、対話方法および対話プログラム | |
JP2007115142A (ja) | 会話制御装置 | |
US8359200B2 (en) | Generating profiles of words | |
JP2007115143A (ja) | 会話制御装置 | |
CN113505198B (zh) | 关键词驱动的生成式对话回复方法、装置及电子设备 | |
Tseng et al. | Approaching Human Performance in Behavior Estimation in Couples Therapy Using Deep Sentence Embeddings. | |
Xin et al. | Laughter synthesis using pseudo phonetic tokens with a large-scale in-the-wild laughter corpus | |
Roque | Language technology enables a poetics of interactive generation | |
JP3706758B2 (ja) | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 | |
Vlasenko et al. | Fusion of acoustic and linguistic information using supervised autoencoder for improved emotion recognition | |
JP6067616B2 (ja) | 発話生成手法学習装置、発話生成手法選択装置、発話生成手法学習方法、発話生成手法選択方法、プログラム | |
CN114333763A (zh) | 一种基于重音的语音合成方法及相关装置 | |
JP6743108B2 (ja) | パターン認識モデル及びパターン学習装置、その生成方法、それを用いたfaqの抽出方法及びパターン認識装置、並びにプログラム | |
Khan et al. | Robust Feature Extraction Techniques in Speech Recognition: A Comparative Analysis | |
Mehta et al. | Artificial Intelligence in Forensic Linguistics | |
Hrešková et al. | Haiku poetry generation using interactive evolution vs. poem models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110224 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110622 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120822 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5149737 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D04 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |