JP7249378B2 - 対話装置、プログラム、及び対話方法 - Google Patents
対話装置、プログラム、及び対話方法 Download PDFInfo
- Publication number
- JP7249378B2 JP7249378B2 JP2021092863A JP2021092863A JP7249378B2 JP 7249378 B2 JP7249378 B2 JP 7249378B2 JP 2021092863 A JP2021092863 A JP 2021092863A JP 2021092863 A JP2021092863 A JP 2021092863A JP 7249378 B2 JP7249378 B2 JP 7249378B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- slot
- weight
- dialogue
- weighting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本願明細書と各図において、既に説明したものと同様の要素には同一の符号を付して詳細な説明は適宜省略する。
図1に示すように、対話システム110は、取得部10及び処理部20を含む。取得部10は、情報を取得する。処理部20は、その情報の処理を行う。
図2は、第1実施形態に係る対話システムの動作を例示する模式図である。
文章TX1において、対話システム110は、ユーザUSの希望を尋ねる。この質問に対して、ユーザUSは、文章TX2において、希望する料理の種類を発声する。文章TX1及びTX2による情報の授受により、対話システム110は、料理の種類に関するユーザUSの意図を理解する。文章TX1及びTX2のように、対話システム110及びユーザUSの一方から他方に向けて情報が提供され、対話システム110及びユーザUSの他方から一方に向けて情報が提供される一連の流れを「ターン」と言う。
この意図を受けて、対話システム110は、川崎駅の中にあるレストランを検索する。例えば、複数のレストランが見つかった場合、対話システム110は、文章TX7において、1つレストランの名前をユーザUSに伝える(提案する)。例えば、ユーザUSは、文章TX8において、この提案を受け入れることを対話システム110に伝える。
一方、文章TX6では、「料理の種類」に関する希望が取り消される。このため、文章TX6を取得した後では、対話状態の「料理の種類」に関する部分については、「None(希望なし)」となり、対話状態の「場所」に関する部分については、「川崎駅の中」を維持することが望ましい。
対話システム110は、推定の際に、予め設定された「分類」と、その「分類」に含まれる「言葉」を参照する。この「分類」は、スロットと呼ばれる。この「言葉」は、スロットパラメータまたはバリューと呼ばれる。図3は、レストランに関する複数のスロットS1~Smを例示する。それぞれのスロットには、複数のバリューが設定される。例えば、料理の種類に関するスロットS1は、和食のバリューV11、中華料理のバリューV12、イタリア料理のバリューV13などを含む。場所に関するスロットS2は、川崎駅のバリューV21、東京駅のバリューV22、新宿駅のバリューV23などを含む。それぞれのバリューには、特徴量が設定されている。対話システム110は、複数のスロットS1~Smを参照し、ユーザUSが意図しているバリューを推定して、そのバリューに関する応答文を生成する。
取得部10は、ユーザUSによって入力された文章を取得する(ステップSt1)。文章は、例えば、ユーザUSによって入力される。文章は、例えば、音情報(音声情報)及び文字情報の少なくともいずれかで表される。音声が入力され、その音声情報から導出された文字情報が、取得部10により取得されても良い。文章は、GUI(Graphical User Interface)部品へのタッチなどの操作情報に基づいても良い。取得部10は、例えば、キーボード、マイクロフォン、及びタッチパネルの少なくともいずれかを含む。
対話システム110は、例えば、第1記憶部31、第2記憶部32、第3記憶部33、第4記憶部34、第1モデル記憶部41、及び第2モデル記憶部42をさらに含む。
第2記憶部32は、複数のスロットと、それぞれのスロットに含まれる複数のスロットパラメータと、を記憶する。
好ましくない一例として、[文章に「和食」が含まれていたら「料理の種類」のスロットに関する重みパラメータを1にする]というルールが設定される。この場合、「トルコ料理」などの他のスロットパラメータが文章に含まれている場合に、「料理の種類」のスロットに関する重みパラメータを1にできない。一方で、[「○○を食べたい」があったら「料理の種類」のスロットに関する重みパラメータを1にする]というルールでは、○○が和食またはトルコ料理であれば重みパラメータを1にできる。
または、対話状態の推定までを一つのRNNとして構築しても良い。この場合、対話状態を示すラベルが付与された文章を用いた教師付き学習が事前に実施される。
上述した対話システム110によれば、以下の処理を実行可能である。
図6は、第1実施形態に係る対話システムの動作を例示するフローチャートである。
第2重み付け量は、第1意図量と、第1文章に係わる第2重みと、に基づいて算出される。第4重み付け量は、第2意図量と、第1文章に係わる第4重みと、に基づいて算出される。第4重みは、例えば、第3重みと異なる。第4重み付け量は、例えば、第2意図量と第4重みとの積に基づく値である。処理部20は、第2重み付け量及び第4重み付け量を、第1記憶部31に記憶する(ステップSt26)。
図7は、第1実施形態に係る対話システムの動作を例示するフローチャートである。
図8は、ユーザUSが食事を望む場合の1つの例を示す。第1実施形態に係る対話システム110によれば、図8に示す例をより適切に処理できる。
例えば、文章TX14では、「料理の種類」のスロットパラメータへの言及は無い。従って、文章TX14に対応するベクトルと、「料理の種類」に含まれる各スロットパラメータのベクトルと、の間の類似度は小さくなる。文章TX16では、「料理の種類」の「中華料理」のスロットパラメータを否定している。従って、文章TX16に対応するベクトルと「中華料理」のスロットパラメータのベクトルとの間の類似度は高くなる。しかし、文章TX16は、中華料理を否定しているため、類似度は低い。例えば、言及が無い場合と否定の場合に応じて、重みパラメータを変化させることで、文章TX14を取得したときに第2優先度を低下させず、文章TX16を取得したときに第2優先度を大きく低下させることができる。この結果、対話システム110は、ユーザUSが、和食を希望していることを適切に推定できる。
ステップSt40及びSt41は、図4に示したフローチャートのステップSt1及びSt2と同様に実行される。抽出部23は、入力された文章から複数の重みパラメータを抽出する(ステップSt42)。複数の重みパラメータは、それぞれ、過去の複数の対話状態にどの程度注目すべきかを表す。例えば、推定部24による対話状態の推定に第1履歴~第N履歴が用いられる場合、N個の重みパラメータが抽出される。複数の重みパラメータのそれぞれは、例えば、「1」または「0」で表わされる。例えば、「1」は、その履歴に注目すべきことを表し、「0」は、その履歴に注目しないことを表す。複数の重みパラメータのそれぞれは、注目すべき度合いを表す0以上1以下の実数値であっても良い。または、複数の重みパラメータのそれぞれは、注目すべき度合いを表すベクトルであっても良い。
図10に示す例では、4ターン目の文章TX28で、話題(ユーザUSの希望)が転換し、以前の話題に戻っている。すなわち、ユーザUSは、文章TX28で、話題を1ターン目の文章TX22で言及した中華料理に戻している。
図11は、第1実施形態に係る対話システムの動作を例示するフローチャートである。
図12に示した対話システム120は、抽出部23を含んでいない。この場合、重みは、例えば、取得された文章におけるスロットへの言及の有無または言及の度合いに基づいて決定される。
取得部10は、ユーザによって入力された文章を取得する(ステップSt71)。処理部20は、取得部10によって取得された文章を解析する(ステップSt72)。これにより、文章に含まれるユーザの意図が推定される。処理部20は、文章に基づいて重みを決定する(ステップSt73)。さらに、処理部20は、過去の対話状態を参照する(ステップSt74)。
図14に示す例では、文章TX31~TX34を含む1ターン目および2ターン目の対話により、例えば、「料理の種類」については、「中華料理」の確率が1となる。「場所」については、「川崎駅」の確率が1となる。その後の文章TX35において、ユーザUSは、和食を希望している。より具体的には、この文章TX35は、ユーザUSが中華料理では無く和食を希望する意図を含む。対話システム120によれば、文章TX35の取得に基づき、「和食」の確率を「中華料理」の確率よりも高めることができる。この結果、対話システム120は、川崎駅の中の和食のレストランを検索し、その検索結果を文章TX36においてユーザUSに伝える。
対話システム210は、ユーザによって入力された文章だけでなく、直前に対話システム210が提供した情報(質問)も用いて処理を行う。
対話制御部27は、システム応答を決定し(ステップSt80)、システム応答をシステム応答取得部26及び出力部50に送る。例えば、対話が開始した直後は、「いらっしゃいませ。ご用件をお伺いします」がシステム応答である。その後は、対話状態に基づきシステム応答が決定される。この応答制御には、例えば、事前に作成されたルールまたは事前に学習されたモデルが用いられる。
対話システム210によれば、システム応答取得部26が、システム応答を取得する。これにより、重みパラメータを抽出する際に、「そう」が肯定を表していることが分かり、システム応答への重みを大きくできる。この結果、ユーザが和食を希望していると適切に推定できる。
上述した各実施形態に係る対話システムは、例えば、図15に示した対話装置310により実現される。対話装置310は、一例として、一般のコンピュータ(情報処理装置)と同様のハードウェア構成により実現される。対話装置310は、CPU(Central Processing Unit)311と、取得部312と、出力部313と、ROM(Read Only Memory)314と、RAM(Random Access Memory)315と、記憶部316と、通信装置317と、バス318とを含む。各部は、バス318により接続される。
Claims (9)
- キーボード、マイクロフォン、及びタッチパネルの少なくともいずれかを用いて入力された第1文章が取得されると、前記第1文章が取得される前の第1対話状態の第1スロットに含まれる複数のスロットパラメータの確率分布である第1特徴量と、ニューラルネットを含む学習済みのモデルへの前記第1文章の適用により得られ、前記第1文章における前記第1スロットへの言及の第1度合いを示す第1重みと、の積に基づく第1重み付け量を参照し、
前記第1文章に含まれる第1意図の前記第1スロットに関する第1意図量と、前記第1重みとは別の、前記モデルへの前記第1文章の適用により得られる第2重みと、の積に基づく第2重み付け量を参照し、
前記第1重み付け量および前記第2重み付け量の和を用いて、前記第1文章が取得された後の第2対話状態の前記第1スロットに関する第2特徴量を出力し、
前記第2対話状態の前記第2特徴量に基づく応答文を生成する、
演算処理装置を備えた対話装置。 - 前記第1スロットへの言及の前記第1度合いが小さいほど、前記第1重みは小さい請求項1記載の対話装置。
- 前記第1スロットは、複数の第1スロットパラメータを含み、
前記演算処理装置は、前記第1文章に対応する第1ベクトルと、前記複数の第1スロットパラメータのそれぞれのベクトルと、の類似度に基づいて前記第1意図量を算出する請求項1又は2に記載の対話装置。 - 前記演算処理装置は、さらに、
前記第1対話状態の第2スロットに含まれる複数のスロットパラメータの確率分布である第3特徴量と、前記モデルへの前記第1文章の適用により得られ、前記第1文章における前記第2スロットへの言及の度合いを示す第3重みと、の積に基づく第3重み付け量を参照し、
前記第1意図の前記第2スロットに関する第2意図量と、前記第3重みとは別の、前記モデルへの前記第1文章の適用により得られる第4重みと、の積に基づく第4重み付け量を参照し、
前記第3重み付け量および前記第4重み付け量の和を用いて、前記第2対話状態の前記第2スロットに関する第4特徴量を出力し、
前記第2特徴量に加えて前記第4特徴量に基づいて前記応答文を生成する、
請求項1~3のいずれか1つに記載の対話装置。 - 前記演算処理装置は、前記第1文章の取得及び前記応答文の生成の後に第2文章が取得されると、
前記第2特徴量と、前記モデルへの前記第2文章の適用により得られ、前記第2文章における前記第1スロットへの言及の度合いを示す第5重みと、の積に基づく第5重み付け量を参照し、
前記第2文章に含まれる第2意図の前記第1スロットに関する第3意図量と、前記第5重みとは別の、前記モデルへの前記第2文章の適用により得られる第6重みと、の積に基づく第6重み付け量を参照し、
前記第5重み付け量および前記第6重み付け量の和を用いて、前記第2文章を取得した後の第3対話状態の前記第1スロットに関する第5特徴量を出力し、
前記第3対話状態の前記第5特徴量に基づく応答文を生成する、
請求項1~4のいずれか1つに記載の対話装置。 - 前記演算処理装置は、
前記第1特徴量と、前記第5重みおよび前記第6重みとは別の、前記モデルへの前記第2文章の適用により得られる第7重みと、の積に基づく第7重み付け量をさらに参照し、
前記第5重み付け量、前記第6重み付け量、及び前記第7重み付け量の和を用いて前記第5特徴量を出力する、
請求項5記載の対話装置。 - 前記第1対話状態は、過去の対話状態であり、
前記第2対話状態は、現在の対話状態である、請求項1~6のいずれか1つに記載の対話装置。 - コンピュータを、請求項1~7のいずれか1つに記載の対話装置として機能させるプログラム。
- 対話装置の演算処理装置が、
キーボード、マイクロフォン、及びタッチパネルの少なくともいずれかを用いて入力された第1文章が取得されると、前記第1文章が取得される前の第1対話状態の第1スロットに含まれる複数のスロットパラメータの確率分布である第1特徴量と、ニューラルネットを含む学習済みのモデルへの前記第1文章の適用により得られ、前記第1文章における前記第1スロットへの言及の第1度合いを示す第1重みと、の積に基づく第1重み付け量を参照し、
前記第1文章に含まれる第1意図の前記第1スロットに関する第1意図量と、前記第1重みとは別の、前記モデルへの前記第1文章の適用により得られる第2重みと、の積に基づく第2重み付け量を参照し、
前記第1重み付け量および前記第2重み付け量の和を用いて、前記第1文章が取得された後の第2対話状態の前記第1スロットに関する第2特徴量を出力し、
前記第2対話状態の前記第2特徴量に基づく応答文を生成する、
対話方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021092863A JP7249378B2 (ja) | 2017-12-13 | 2021-06-02 | 対話装置、プログラム、及び対話方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017238764A JP2019106054A (ja) | 2017-12-13 | 2017-12-13 | 対話システム |
JP2021092863A JP7249378B2 (ja) | 2017-12-13 | 2021-06-02 | 対話装置、プログラム、及び対話方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017238764A Division JP2019106054A (ja) | 2017-12-13 | 2017-12-13 | 対話システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021131907A JP2021131907A (ja) | 2021-09-09 |
JP7249378B2 true JP7249378B2 (ja) | 2023-03-30 |
Family
ID=66697149
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017238764A Pending JP2019106054A (ja) | 2017-12-13 | 2017-12-13 | 対話システム |
JP2021092863A Active JP7249378B2 (ja) | 2017-12-13 | 2021-06-02 | 対話装置、プログラム、及び対話方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017238764A Pending JP2019106054A (ja) | 2017-12-13 | 2017-12-13 | 対話システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11087753B2 (ja) |
JP (2) | JP2019106054A (ja) |
CN (1) | CN110019746B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102448388B1 (ko) * | 2018-03-05 | 2022-09-28 | 구글 엘엘씨 | 자동화 어시스턴트를 이용한 이전 대화 컨텍스트사이의 전환 |
KR102133825B1 (ko) * | 2018-06-22 | 2020-07-16 | 서강대학교 산학협력단 | 단어자질을 강화한 음성 대화 방법 및 시스템 |
US11971910B2 (en) * | 2018-10-22 | 2024-04-30 | International Business Machines Corporation | Topic navigation in interactive dialog systems |
KR102281581B1 (ko) * | 2019-07-17 | 2021-07-23 | 에스케이텔레콤 주식회사 | 목표지향 대화시스템에서의 대화상태 추적방법 및 장치 |
US11250216B2 (en) * | 2019-08-15 | 2022-02-15 | International Business Machines Corporation | Multiple parallel delineated topics of a conversation within the same virtual assistant |
US11567788B1 (en) | 2019-10-18 | 2023-01-31 | Meta Platforms, Inc. | Generating proactive reminders for assistant systems |
US11636438B1 (en) | 2019-10-18 | 2023-04-25 | Meta Platforms Technologies, Llc | Generating smart reminders by assistant systems |
CN110827831A (zh) * | 2019-11-15 | 2020-02-21 | 广州洪荒智能科技有限公司 | 基于人机交互的语音信息处理方法、装置、设备及介质 |
US11727926B1 (en) * | 2020-09-18 | 2023-08-15 | Amazon Technologies, Inc. | Systems and methods for noise reduction |
WO2023219261A1 (ko) * | 2022-05-09 | 2023-11-16 | 삼성전자주식회사 | 대화 컨텐츠를 기반으로 이벤트를 생성하는 전자 장치, 제어 방법 및 비일시적 컴퓨터 판독 가능 저장 매체 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004354787A (ja) | 2003-05-30 | 2004-12-16 | Nippon Telegr & Teleph Corp <Ntt> | 統計情報を用いた対話方法及びその装置と、対話プログラム及びそのプログラムを記録した記録媒体 |
JP2005301780A (ja) | 2004-04-14 | 2005-10-27 | Sony Corp | 情報処理装置および情報処理方法、並びに、プログラム |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3716870B2 (ja) * | 1995-05-31 | 2005-11-16 | ソニー株式会社 | 音声認識装置および音声認識方法 |
US7346492B2 (en) * | 2001-01-24 | 2008-03-18 | Shaw Stroz Llc | System and method for computerized psychological content analysis of computer and media generated communications to produce communications management support, indications, and warnings of dangerous behavior, assessment of media images, and personnel selection support |
US8041570B2 (en) * | 2005-05-31 | 2011-10-18 | Robert Bosch Corporation | Dialogue management using scripts |
US20100076843A1 (en) * | 2006-02-28 | 2010-03-25 | Speaksoft, Inc. | Live-agent-enabled teis systems |
WO2008034111A2 (en) * | 2006-09-14 | 2008-03-20 | Google Inc. | Integrating voice-enabled local search and contact lists |
JP2010020273A (ja) * | 2007-12-07 | 2010-01-28 | Sony Corp | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
US8793119B2 (en) * | 2009-07-13 | 2014-07-29 | At&T Intellectual Property I, L.P. | System and method for generating manually designed and automatically optimized spoken dialog systems |
CN103038818B (zh) * | 2010-06-24 | 2016-10-12 | 本田技研工业株式会社 | 在车载语音识别系统与车外语音识别系统之间的通信系统和方法 |
US9329832B2 (en) * | 2011-05-09 | 2016-05-03 | Robert Allen Blaisch | Voice internet system and method |
JP5967569B2 (ja) * | 2012-07-09 | 2016-08-10 | 国立研究開発法人情報通信研究機構 | 音声処理システム |
US9070366B1 (en) * | 2012-12-19 | 2015-06-30 | Amazon Technologies, Inc. | Architecture for multi-domain utterance processing |
WO2014109421A1 (ko) * | 2013-01-09 | 2014-07-17 | 엘지전자 주식회사 | 단말기 및 그 동작 제어 방법 |
US9231898B2 (en) * | 2013-02-08 | 2016-01-05 | Machine Zone, Inc. | Systems and methods for multi-user multi-lingual communications |
AU2014233517B2 (en) * | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
US9898789B2 (en) * | 2013-04-16 | 2018-02-20 | Palo Alto Research Center Incorporated | Method and a system for providing hosted services based on a generalized model of a health/wellness program |
US9589565B2 (en) * | 2013-06-21 | 2017-03-07 | Microsoft Technology Licensing, Llc | Environmentally aware dialog policies and response generation |
CN105659316A (zh) | 2013-11-25 | 2016-06-08 | 三菱电机株式会社 | 对话控制装置和对话控制方法 |
US9361589B2 (en) * | 2013-11-28 | 2016-06-07 | Akademia Gorniczo-Hutnicza Im. Stanislawa Staszira W. Krakowie | System and a method for providing a dialog with a user |
JP6235360B2 (ja) * | 2014-02-05 | 2017-11-22 | 株式会社東芝 | 発話文収集装置、方法、及びプログラム |
US9263042B1 (en) * | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
US20160034249A1 (en) * | 2014-07-31 | 2016-02-04 | Microsoft Technology Licensing Llc | Speechless interaction with a speech recognition device |
US9836452B2 (en) * | 2014-12-30 | 2017-12-05 | Microsoft Technology Licensing, Llc | Discriminating ambiguous expressions to enhance user experience |
JP6334815B2 (ja) * | 2015-03-20 | 2018-05-30 | 株式会社東芝 | 学習装置、方法、プログラムおよび音声対話システム |
WO2016157642A1 (ja) * | 2015-03-27 | 2016-10-06 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP6604542B2 (ja) * | 2015-04-02 | 2019-11-13 | パナソニックIpマネジメント株式会社 | 対話方法、対話プログラム及び対話システム |
US10229671B2 (en) * | 2015-12-02 | 2019-03-12 | GM Global Technology Operations LLC | Prioritized content loading for vehicle automatic speech recognition systems |
KR102447513B1 (ko) * | 2016-01-22 | 2022-09-27 | 한국전자통신연구원 | 점증적 대화지식 자가학습 기반 대화장치 및 그 방법 |
US9978367B2 (en) * | 2016-03-16 | 2018-05-22 | Google Llc | Determining dialog states for language models |
WO2017179101A1 (ja) * | 2016-04-11 | 2017-10-19 | 三菱電機株式会社 | 応答生成装置、対話制御システムおよび応答生成方法 |
US10431205B2 (en) * | 2016-04-27 | 2019-10-01 | Conduent Business Services, Llc | Dialog device with dialog support generated using a mixture of language models combined using a recurrent neural network |
JP6671020B2 (ja) * | 2016-06-23 | 2020-03-25 | パナソニックIpマネジメント株式会社 | 対話行為推定方法、対話行為推定装置及びプログラム |
WO2018000278A1 (zh) * | 2016-06-29 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 一种基于状态机上下文敏感多轮对话管理系统及方法 |
US10451430B2 (en) * | 2016-07-26 | 2019-10-22 | International Business Machines Corporation | Navigation alerting using conversation analysis |
CN107704482A (zh) * | 2016-08-09 | 2018-02-16 | 松下知识产权经营株式会社 | 方法、装置以及程序 |
JP7036015B2 (ja) * | 2016-08-17 | 2022-03-15 | ソニーグループ株式会社 | 対話制御装置および方法 |
US10403273B2 (en) * | 2016-09-09 | 2019-09-03 | Oath Inc. | Method and system for facilitating a guided dialog between a user and a conversational agent |
US9947319B1 (en) * | 2016-09-27 | 2018-04-17 | Google Llc | Forming chatbot output based on user state |
US10796217B2 (en) * | 2016-11-30 | 2020-10-06 | Microsoft Technology Licensing, Llc | Systems and methods for performing automated interviews |
US10636418B2 (en) * | 2017-03-22 | 2020-04-28 | Google Llc | Proactive incorporation of unsolicited content into human-to-computer dialogs |
US10224032B2 (en) * | 2017-04-19 | 2019-03-05 | International Business Machines Corporation | Determining an impact of a proposed dialog act using model-based textual analysis |
US10360908B2 (en) * | 2017-04-19 | 2019-07-23 | International Business Machines Corporation | Recommending a dialog act using model-based textual analysis |
US10453454B2 (en) * | 2017-10-26 | 2019-10-22 | Hitachi, Ltd. | Dialog system with self-learning natural language understanding |
-
2017
- 2017-12-13 JP JP2017238764A patent/JP2019106054A/ja active Pending
-
2018
- 2018-08-31 US US16/119,674 patent/US11087753B2/en active Active
- 2018-08-31 CN CN201811008382.7A patent/CN110019746B/zh active Active
-
2021
- 2021-06-02 JP JP2021092863A patent/JP7249378B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004354787A (ja) | 2003-05-30 | 2004-12-16 | Nippon Telegr & Teleph Corp <Ntt> | 統計情報を用いた対話方法及びその装置と、対話プログラム及びそのプログラムを記録した記録媒体 |
JP2005301780A (ja) | 2004-04-14 | 2005-10-27 | Sony Corp | 情報処理装置および情報処理方法、並びに、プログラム |
Non-Patent Citations (2)
Title |
---|
杉山 聡 外2名,対話履歴を利用した協調的応答生成,言語処理学会第6回年次大会発表論文集,日本,言語処理学会 ,2000年03月07日,pp.227-23 |
福井 教順 外3名,補助シナリオを利用したマルチモーダル対話システム の検討,第69回(平成19年)全国大会講演論文集(2) 人工知能と認知科学,日本,社団法人情報処理学会,2007年03月06日,pp.2-409~2-410 |
Also Published As
Publication number | Publication date |
---|---|
US11087753B2 (en) | 2021-08-10 |
US20190180743A1 (en) | 2019-06-13 |
CN110019746A (zh) | 2019-07-16 |
JP2019106054A (ja) | 2019-06-27 |
CN110019746B (zh) | 2023-10-10 |
JP2021131907A (ja) | 2021-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7249378B2 (ja) | 対話装置、プログラム、及び対話方法 | |
CN110111775B (zh) | 一种流式语音识别方法、装置、设备及存储介质 | |
US10847151B2 (en) | Dialogue system and dialogue method | |
EP3384488B1 (en) | System and method for implementing a vocal user interface by combining a speech to text system and a speech to intent system | |
CN111627432B (zh) | 主动式外呼智能语音机器人多语种交互方法及装置 | |
US9742912B2 (en) | Method and apparatus for predicting intent in IVR using natural language queries | |
US20240153489A1 (en) | Data driven dialog management | |
US20190130904A1 (en) | Dialog system with self-learning natural language understanding | |
CN112435673B (zh) | 一种模型训练方法及电子终端 | |
CN112673421A (zh) | 训练和/或使用语言选择模型以自动确定用于口头话语的话音辨识的语言 | |
KR102544249B1 (ko) | 발화의 문맥을 공유하여 번역을 수행하는 전자 장치 및 그 동작 방법 | |
KR102688236B1 (ko) | 인공 지능을 이용한 음성 합성 장치, 음성 합성 장치의 동작 방법 및 컴퓨터로 판독 가능한 기록 매체 | |
EP3980991B1 (en) | System and method for recognizing user's speech | |
US20210327415A1 (en) | Dialogue system and method of controlling the same | |
JP6408080B1 (ja) | 生成装置、生成方法及び生成プログラム | |
US12190883B2 (en) | Speaker recognition adaptation | |
CN111161726B (zh) | 一种智能语音交互方法、设备、介质及系统 | |
CN115497465B (zh) | 语音交互方法、装置、电子设备和存储介质 | |
CN110998719A (zh) | 信息处理设备和信息处理方法 | |
KR20210019920A (ko) | 사용자의 음성을 인식하는 시스템 및 방법 | |
CN113051384A (zh) | 基于对话的用户画像抽取方法及相关装置 | |
KR102631143B1 (ko) | 인공 지능을 이용한 음성 합성 장치, 음성 합성 장치의 동작 방법 및 컴퓨터로 판독 가능한 기록 매체 | |
CN113421573A (zh) | 身份识别模型训练方法、身份识别方法及装置 | |
CN115640387A (zh) | 一种基于多模态特征的人机协同方法及装置 | |
JP2023074463A (ja) | 多次元対話行為選択のための強化学習エージェント |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210602 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210602 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230216 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230317 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7249378 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |