JP6828667B2 - 音声対話装置、音声対話方法及びプログラム - Google Patents
音声対話装置、音声対話方法及びプログラム Download PDFInfo
- Publication number
- JP6828667B2 JP6828667B2 JP2017228235A JP2017228235A JP6828667B2 JP 6828667 B2 JP6828667 B2 JP 6828667B2 JP 2017228235 A JP2017228235 A JP 2017228235A JP 2017228235 A JP2017228235 A JP 2017228235A JP 6828667 B2 JP6828667 B2 JP 6828667B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- response sentence
- sentence
- candidate
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
上記目的を達成するための本発明の一態様は、取得されたユーザの音声を解析し、該解析結果に基づいて該音声を繰り返すためのオウム返し応答文を生成し、該生成したオウム返し応答文を出力する音声対話装置であって、過去のユーザの音声を記憶する記憶手段と、前記記憶手段に記憶された過去のユーザの音声に基づいて、該ユーザの音声の長さを示す音声文長の平均値を算出する平均算出手段と、前記取得されたユーザの音声に含まれる名詞と係り受け関係が成立する係受け語を組み合わせて複数の応答文候補を生成する候補生成手段と、前記候補生成手段により生成された複数の応答文候補の中から、予め設定された数の係受け語を含む応答文候補を選択し、前記平均算出手段により算出された音声文長の平均値に近付けるように、前記選択した応答文候補に対して係受け語を更に付加する、あるいは、前記選択した応答文候補から係受け語を削除して最終的な応答文候補とし、該応答文候補をそのまま又は加工して前記オウム返し応答文として生成する繰返生成手段と、を備える、ことを特徴とする音声対話装置であってもよい。
この一態様において、前記繰返生成手段は、前記候補生成手段により生成された複数の応答文候補の中から、前記平均算出手段により算出された音声文長の平均値に最も近い音声文長の該応答文候補を選択してもよい。
この一態様において、前記候補生成手段は、前記取得されたユーザの音声に含まれる述語項を抽出し、該抽出した述語項に含まれる名詞と係り受け関係が成立する少なくとも1つの係受け語を、該抽出した述語項に連結して、複数パターンの前記応答文候補を生成してもよい。
この一態様において、前記繰返生成手段は、前記選択した応答文候補の文末に予め設定された付加語を付加することで前記オウム返し応答文を生成してもよい。
上記目的を達成するための本発明の一態様は、取得されたユーザの音声を解析し、該解析結果に基づいて該音声を繰り返すためのオウム返し応答文を生成し、該生成したオウム返し応答文を出力する音声対話方法であって、過去のユーザの音声を記憶するステップと、前記記憶された過去のユーザの音声に基づいて、該ユーザの音声の長さを示す音声文長の平均値を算出するステップと、前記取得されたユーザの音声に含まれる単語を組み合わせて複数の応答文候補を生成するステップと、前記算出された音声文長の平均値に対応付けて、前記生成された複数の応答文候補の中から、1つの該応答文候補を選択し、該選択した応答文候補をそのまま又は加工して前記オウム返し応答文として生成するステップと、を含む、ことを特徴とする音声対話方法であってもよい。
上記目的を達成するための本発明の一態様は、取得されたユーザの音声を解析し、該解析結果に基づいて該音声を繰り返すためのオウム返し応答文を生成し、該生成したオウム返し応答文を出力するプログラムであって、記憶された過去のユーザの音声に基づいて、該ユーザの音声の長さを示す音声文長の平均値を算出する処理と、前記取得されたユーザの音声に含まれる名詞と係り受け関係が成立する係受け語を組み合わせて複数の応答文候補を生成する処理と、前記算出された音声文長の平均値に対応付けて、前記生成された複数の応答文候補の中から、1つの該応答文候補を選択し、該選択した応答文候補をそのまま又は加工して前記オウム返し応答文として生成する処理と、をコンピュータに実行させる、ことを特徴とするプログラムであってもよい。
以下、図面を参照して本発明の実施の形態について説明する。
図1は、本発明の実施形態1に係る音声対話装置の概略的なシステム構成を示すブロック図である。本実施形態1に係る音声対話装置1は、取得されたユーザの音声を解析し、該解析結果に基づいて該音声を繰り返すためのオウム返し応答文を生成し、該生成したオウム返し応答文を出力する。
本発明の実施形態2において、繰返生成部8は、候補生成部7により生成された複数の応答文候補の中から、予め設定された数の係受け語を含む応答文候補を選択する。さらに、繰返生成部8は、平均算出部6により算出された音声文長の平均値に近付けるように、選択した応答文候補に対して係受け語を更に付加して、あるいは、選択した応答文候補から係受け語を削除して、最終的な応答文候補とする。繰返生成部8は、その最終的な応答文候補をそのまま又は加工して、オウム返し応答文として生成する。係受け語の数は、記憶部5などに設定されている。
本実施形態2に係る繰返生成部8は、上述の如く、設定した最適な数の係受け語を含む応答候補を選択する。さらに、繰返生成部8は、適応的に、過去のユーザの音声文長の平均値に近付けるように、選択した応答文候補の係受け語を増減させ、調整を行う。これにより、過去のユーザの音声の平均的な文長に合わせた適切な文長のオウム返し応答文を生成できる。すなわち、ユーザの音声に合わせた文長のオウム返し応答文を生成できる。
なお、本実施形態2において、他の構成は上記実施形態1と略同一であるため、同一部分には同一符号を付して詳細な説明は省略する。
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。
Claims (7)
- 取得されたユーザの音声を解析し、該解析結果に基づいて該音声を繰り返すためのオウム返し応答文を生成し、該生成したオウム返し応答文を出力する音声対話装置であって、
過去のユーザの音声を記憶する記憶手段と、
前記記憶手段に記憶された過去のユーザの音声に基づいて、該ユーザの音声の長さを示す音声文長の平均値を算出する平均算出手段と、
前記取得されたユーザの音声に含まれる名詞と係り受け関係が成立する係受け語を組み合わせて複数の応答文候補を生成する候補生成手段と、
前記平均算出手段により算出された音声文長の平均値に対応付けて、前記候補生成手段により生成された複数の応答文候補の中から、1つの該応答文候補を選択し、該選択した応答文候補をそのまま又は加工して前記オウム返し応答文として生成する繰返生成手段と、を備える、
ことを特徴とする音声対話装置。 - 取得されたユーザの音声を解析し、該解析結果に基づいて該音声を繰り返すためのオウム返し応答文を生成し、該生成したオウム返し応答文を出力する音声対話装置であって、
過去のユーザの音声を記憶する記憶手段と、
前記記憶手段に記憶された過去のユーザの音声に基づいて、該ユーザの音声の長さを示す音声文長の平均値を算出する平均算出手段と、
前記取得されたユーザの音声に含まれる名詞と係り受け関係が成立する係受け語を組み合わせて複数の応答文候補を生成する候補生成手段と、
前記候補生成手段により生成された複数の応答文候補の中から、予め設定された数の係受け語を含む応答文候補を選択し、前記平均算出手段により算出された音声文長の平均値に近付けるように、前記選択した応答文候補に対して係受け語を更に付加する、あるいは、前記選択した応答文候補から係受け語を削除して最終的な応答文候補とし、該応答文候補をそのまま又は加工して前記オウム返し応答文として生成する繰返生成手段と、
を備える、ことを特徴とする音声対話装置。 - 請求項1記載の音声対話装置であって、
前記繰返生成手段は、前記候補生成手段により生成された複数の応答文候補の中から、前記平均算出手段により算出された音声文長の平均値に最も近い音声文長の該応答文候補を選択する、
ことを特徴とする音声対話装置。 - 請求項1又は2に記載の音声対話装置であって、
前記候補生成手段は、前記取得されたユーザの音声に含まれる述語項を抽出し、該抽出した述語項に含まれる名詞と係り受け関係が成立する少なくとも1つの係受け語を、該抽出した述語項に連結して、複数パターンの前記応答文候補を生成する、
ことを特徴とする音声対話装置。 - 請求項1乃至4のうちいずれか1項記載の音声対話装置であって、
前記繰返生成手段は、前記選択した応答文候補の文末に予め設定された付加語を付加することで前記オウム返し応答文を生成する、
ことを特徴とする音声対話装置。 - 取得されたユーザの音声を解析し、該解析結果に基づいて該音声を繰り返すためのオウム返し応答文を生成し、該生成したオウム返し応答文を出力する音声対話方法であって、
過去のユーザの音声を記憶するステップと、
前記記憶された過去のユーザの音声に基づいて、該ユーザの音声の長さを示す音声文長の平均値を算出するステップと、
前記取得されたユーザの音声に含まれる単語を組み合わせて複数の応答文候補を生成するステップと、
前記算出された音声文長の平均値に対応付けて、前記生成された複数の応答文候補の中から、1つの該応答文候補を選択し、該選択した応答文候補をそのまま又は加工して前記オウム返し応答文として生成するステップと、
を含む、ことを特徴とする音声対話方法。 - 取得されたユーザの音声を解析し、該解析結果に基づいて該音声を繰り返すためのオウム返し応答文を生成し、該生成したオウム返し応答文を出力するプログラムであって、
記憶された過去のユーザの音声に基づいて、該ユーザの音声の長さを示す音声文長の平均値を算出する処理と、
前記取得されたユーザの音声に含まれる名詞と係り受け関係が成立する係受け語を組み合わせて複数の応答文候補を生成する処理と、
前記算出された音声文長の平均値に対応付けて、前記生成された複数の応答文候補の中から、1つの該応答文候補を選択し、該選択した応答文候補をそのまま又は加工して前記オウム返し応答文として生成する処理と、
をコンピュータに実行させる、ことを特徴とするプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017228235A JP6828667B2 (ja) | 2017-11-28 | 2017-11-28 | 音声対話装置、音声対話方法及びプログラム |
EP18203267.2A EP3489951B1 (en) | 2017-11-28 | 2018-10-30 | Voice dialogue apparatus, voice dialogue method, and program |
US16/181,524 US10825455B2 (en) | 2017-11-28 | 2018-11-06 | Voice dialogue apparatus, voice dialogue method, and non-transitory computer readable media |
CN201811416206.7A CN110033762B (zh) | 2017-11-28 | 2018-11-26 | 语音对话设备、语音对话方法和程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017228235A JP6828667B2 (ja) | 2017-11-28 | 2017-11-28 | 音声対話装置、音声対話方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019101065A JP2019101065A (ja) | 2019-06-24 |
JP6828667B2 true JP6828667B2 (ja) | 2021-02-10 |
Family
ID=64048717
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017228235A Active JP6828667B2 (ja) | 2017-11-28 | 2017-11-28 | 音声対話装置、音声対話方法及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10825455B2 (ja) |
EP (1) | EP3489951B1 (ja) |
JP (1) | JP6828667B2 (ja) |
CN (1) | CN110033762B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6828667B2 (ja) * | 2017-11-28 | 2021-02-10 | トヨタ自動車株式会社 | 音声対話装置、音声対話方法及びプログラム |
CN111460115B (zh) * | 2020-03-17 | 2023-05-26 | 深圳市优必选科技股份有限公司 | 智能人机对话模型训练方法、模型训练装置及电子设备 |
JP7295828B2 (ja) * | 2020-06-23 | 2023-06-21 | Kddi株式会社 | 対話中の文脈の因果関係に応じた応答文を推定するプログラム、装置及び方法 |
CN114238607B (zh) * | 2021-12-17 | 2022-11-22 | 北京斗米优聘科技发展有限公司 | 深度交互式ai智能求职顾问方法、系统及存储介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0962286A (ja) * | 1995-08-22 | 1997-03-07 | Sony Corp | 音声合成装置および音声合成方法 |
JP2006039120A (ja) * | 2004-07-26 | 2006-02-09 | Sony Corp | 対話装置および対話方法、並びにプログラムおよび記録媒体 |
JP2009193448A (ja) * | 2008-02-15 | 2009-08-27 | Oki Electric Ind Co Ltd | 対話システム、方法及びプログラム |
US20090210411A1 (en) * | 2008-02-15 | 2009-08-20 | Oki Electric Industry Co., Ltd. | Information Retrieving System |
CN102455786B (zh) * | 2010-10-25 | 2014-09-03 | 三星电子(中国)研发中心 | 一种对中文句子输入法的优化系统及方法 |
JP6028556B2 (ja) * | 2012-12-19 | 2016-11-16 | 富士通株式会社 | 対話制御方法及び対話制御用コンピュータプログラム |
JP6221301B2 (ja) * | 2013-03-28 | 2017-11-01 | 富士通株式会社 | 音声処理装置、音声処理システムおよび音声処理方法 |
JP6295869B2 (ja) | 2014-07-23 | 2018-03-20 | トヨタ自動車株式会社 | 応答生成装置、応答生成方法及びプログラム |
JP6122816B2 (ja) * | 2014-08-07 | 2017-04-26 | シャープ株式会社 | 音声出力装置、ネットワークシステム、音声出力方法、および音声出力プログラム |
JP6390264B2 (ja) * | 2014-08-21 | 2018-09-19 | トヨタ自動車株式会社 | 応答生成方法、応答生成装置及び応答生成プログラム |
JP2016080981A (ja) * | 2014-10-21 | 2016-05-16 | トヨタ自動車株式会社 | 応答生成装置、応答生成方法及び応答生成プログラム |
JP6287754B2 (ja) * | 2014-10-21 | 2018-03-07 | トヨタ自動車株式会社 | 応答生成装置、応答生成方法及び応答生成プログラム |
WO2016157650A1 (ja) * | 2015-03-31 | 2016-10-06 | ソニー株式会社 | 情報処理装置、制御方法、およびプログラム |
JP6731326B2 (ja) * | 2016-10-31 | 2020-07-29 | ファーハット ロボティクス エービー | 音声対話装置及び音声対話方法 |
JP6828667B2 (ja) * | 2017-11-28 | 2021-02-10 | トヨタ自動車株式会社 | 音声対話装置、音声対話方法及びプログラム |
-
2017
- 2017-11-28 JP JP2017228235A patent/JP6828667B2/ja active Active
-
2018
- 2018-10-30 EP EP18203267.2A patent/EP3489951B1/en active Active
- 2018-11-06 US US16/181,524 patent/US10825455B2/en active Active
- 2018-11-26 CN CN201811416206.7A patent/CN110033762B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
EP3489951A1 (en) | 2019-05-29 |
US20190164550A1 (en) | 2019-05-30 |
US10825455B2 (en) | 2020-11-03 |
EP3489951B1 (en) | 2022-08-17 |
CN110033762A (zh) | 2019-07-19 |
JP2019101065A (ja) | 2019-06-24 |
CN110033762B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102161579B1 (ko) | 응답문 생성 장치, 방법 및 프로그램, 그리고 음성 대화 시스템 | |
JP6696923B2 (ja) | 音声対話装置、その処理方法及びプログラム | |
JP5327054B2 (ja) | 発音変動規則抽出装置、発音変動規則抽出方法、および発音変動規則抽出用プログラム | |
JP6523893B2 (ja) | 学習装置、音声合成装置、学習方法、音声合成方法、学習プログラム及び音声合成プログラム | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
JP6828667B2 (ja) | 音声対話装置、音声対話方法及びプログラム | |
JP6390264B2 (ja) | 応答生成方法、応答生成装置及び応答生成プログラム | |
JP6299563B2 (ja) | 応答生成方法、応答生成装置及び応答生成プログラム | |
Liu et al. | The IFLYTEK system for blizzard challenge 2017 | |
JP2014062970A (ja) | 音声合成方法、装置、及びプログラム | |
JP6295869B2 (ja) | 応答生成装置、応答生成方法及びプログラム | |
JP2016080981A (ja) | 応答生成装置、応答生成方法及び応答生成プログラム | |
JP6773074B2 (ja) | 応答生成方法、応答生成装置及び応答生成プログラム | |
Anumanchipalli et al. | Accent group modeling for improved prosody in statistical parameteric speech synthesis | |
JP6176137B2 (ja) | 音声対話装置、音声対話システム及びプログラム | |
JP6287754B2 (ja) | 応答生成装置、応答生成方法及び応答生成プログラム | |
Sarkar et al. | Modeling pauses for synthesis of storytelling style speech using unsupervised word features | |
KR102632872B1 (ko) | 음성인식 오류 교정 방법 및 그 시스템 | |
KR102116014B1 (ko) | 음성인식엔진과 성대모사용음성합성엔진을 이용한 화자 성대모사시스템 | |
JP2004272134A (ja) | 音声認識装置及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210104 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6828667 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |