JP2017083713A - 対話装置、対話機器、対話装置の制御方法、制御プログラム、および記録媒体 - Google Patents
対話装置、対話機器、対話装置の制御方法、制御プログラム、および記録媒体 Download PDFInfo
- Publication number
- JP2017083713A JP2017083713A JP2015213246A JP2015213246A JP2017083713A JP 2017083713 A JP2017083713 A JP 2017083713A JP 2015213246 A JP2015213246 A JP 2015213246A JP 2015213246 A JP2015213246 A JP 2015213246A JP 2017083713 A JP2017083713 A JP 2017083713A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- output
- control unit
- data
- determination result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 35
- 230000003993 interaction Effects 0.000 title abstract description 87
- 230000004044 response Effects 0.000 claims abstract description 140
- 230000002452 interceptive effect Effects 0.000 claims description 99
- 238000004891 communication Methods 0.000 claims description 98
- 230000006870 function Effects 0.000 description 26
- 238000012545 processing Methods 0.000 description 25
- 230000008569 process Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 18
- 230000005540 biological transmission Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000009118 appropriate response Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000004397 blinking Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
本発明の一実施形態について、図1〜図6に基づいて説明すれば以下のとおりである。
図2は、音声対話システム100の概要を示す図である。音声対話システム100は、ユーザと家庭用電子機器(以下、家電と称する。図2の例では冷蔵庫4)との音声対話を実現するものである。具体的には、音声対話システム100は、図2に示すように、ユーザが冷蔵庫4に向かって「おはよう」と発話した場合、ユーザに対して冷蔵庫4が「おはよう、今日はいい天気だね」と応答音声を出力することで、音声対話を実現するシステムである。なお、図2に示すユーザの発話の内容と、応答音声の内容とは一例であり、図2の例に限定されるものではない。
図3および図4は、音声対話システム100にて実行される処理の概要を示すシーケンス図である。
図1は、音声対話システム100に含まれる音声対話装置1およびクラウドサーバ2の要部構成の一例を示すブロック図である。
クラウドサーバ2は、制御部20、通信部21および記憶部22を備える。
図5は、音声対話装置1が実行する処理の流れの一例を示すフローチャートである。
図6は、クラウドサーバ2が実行する処理の流れの一例を示すフローチャートである。
本発明の他の実施形態について、図7〜図9に基づいて説明すれば、以下のとおりである。
図8は、音声対話システム100aにて実行される処理の概要を示すシーケンス図である。
図7は、音声対話システム100aに含まれる音声対話装置1aおよびクラウドサーバ2の要部構成の一例を示すブロック図である。なお、クラウドサーバ2については、実施形態1にて図1を参照して既に説明しているため、ここでの説明を省略する。
図9は、音声対話装置1aが実行する処理の流れの一例を示すフローチャートである。なお、図5と同様の処理については、その説明を省略する。
本発明のさらに別の実施形態について、図10〜図13に基づいて説明すれば、以下のとおりである。
図11は、音声対話システム100bにて実行される処理の概要を示すシーケンス図である。
図10は、音声対話システム100bに含まれる音声対話装置1bおよびクラウドサーバ2の要部構成の一例を示すブロック図である。なお、クラウドサーバ2については、実施形態1にて図1を参照して既に説明しているため、ここでの説明を省略する。
図12は、音声対話装置1bが実行する処理の流れの一例を示すフローチャートであり、図13は、図12に示す「A」以降の処理の流れの一例を示すフローチャートである。なお、図5と同様の処理については、その説明を省略する。
本発明のさらに別の実施形態について、図14に基づいて説明すれば、以下のとおりである。
図14は、音声対話システム100cに含まれる音声対話装置1cおよびクラウドサーバ2の要部構成の一例を示すブロック図である。なお、クラウドサーバ2については、実施形態1にて図1を参照して既に説明しているため、ここでの説明を省略する。
本発明のさらに別の実施形態について、図15に基づいて説明すれば、以下のとおりである。
空調装置5は、音声対話装置1が内蔵された家電(例えば冷蔵庫4)のユーザが所有する、音声対話装置1が内蔵された家電とは異なる家電である。本実施形態では、クラウドサーバ2dは自装置と通信可能に接続された家電について、家電を識別するための機器IDと、家電を所有するユーザを識別するユーザIDとを対応付けて管理している。つまり、冷蔵庫4および空調装置5の機器IDは、クラウドサーバ2dにおいて同一のユーザIDと対応付けられて管理されている。
図15は、音声対話システム100dに含まれる音声対話装置1dおよびクラウドサーバ2dの要部構成の一例を示すブロック図である。
出力時間制御部205は、実施形態3にて説明した所定時間t1、所定時間t2、所定時間t3を延長するか否かを決定する。具体的には、出力時間制御部205は、空調装置5に指示を伝達してから(機器特定部204から通知を取得してから)、空調装置5からの通知を受信するまで(通信部21dから通知を取得するまで)の時間(通信時間)を、タイマ(不図示)を用いて計測する。そして、通信時間が閾値(本実施形態では8秒であるが、この例に限定されない)を超えるか否かを判定する。8秒を超える場合、所定時間t1、所定時間t2、所定時間t3を延長するための延長指示を、判定した時刻を示す時刻情報とともに、通信部21dを介して音声対話装置1dに送信する。具体的には、出力時間制御部205は、機器データベース222を参照して、取得した機器IDが対応付けられているユーザIDと、同一のユーザIDが対応付けられた機器IDが示す音声対話装置1d(または、音声対話装置1dが接続された家電(冷蔵庫4))を特定する。そして、特定した音声対話装置1dに、延長指示および時刻情報を送信する。
次に、図15を参照して、音声対話装置1dの要部構成について説明する。音声対話装置1dは、実施形態4にて説明した音声対話装置1cと異なり、制御部10cに代えて制御部10dを備える。また、通信部14に代えて通信部14dを備える。
実施形態3〜5では、所定時間t1が経過した時点で判定結果を受信していない場合に報知サウンドを出力し、所定時間t2が経過した時点で応答音声データを出力可能な状態となっていない場合に定型音声(例えば「えーっと…」)を出力し、所定時間t3が経過した時点で応答音声データを出力可能な状態となっていない場合に定型音声(例えば「通信状態が良くないみたい。確かめてみてね」)を出力するとともに音声対話を終了する構成を説明した。しかしながら、音声対話装置1b、1c、1dは、これら3つの処理の少なくとも1つを実行する構成であってもよい。
上述した各実施形態では、応答音声が出力される旨をユーザに報知するために、報知サウンドを出力する例を説明した。しかしながら、当該報知は音声出力に限定されない。例えば、応答音声が出力される旨を表示部(不図示)に表示したり、LEDなどの点灯部(不図示)を点灯または点滅させることで、応答音声が出力されることをユーザに報知したりしてもよい。当該表示部および点灯部は、音声対話装置1、1a〜1dに設けられていてもよいし、家電(冷蔵庫4)に設けられていてもよいし、音声対話装置1、1a〜1dまたは冷蔵庫4に接続されるものであってもよい。
音声対話装置1、1a〜1d、クラウドサーバ2、2dの制御ブロック(特に制御部10、10a〜10d、制御部20、20d)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
本発明の態様1に係る対話装置(音声対話装置1)は、ユーザと対話を実行する対話装置であって、入力装置(音声入力部12)に入力された音声のデータを取得する音声取得部(音声取得制御部101)と、当該音声に対する応答音声を出力装置(音声出力部13)に出力させる出力制御部(出力制御部103)と、を備え、上記音声取得部は、上記データの取得後に上記データの取得を停止し、当該音声が認識可能であるか否かを示す判定結果を取得する判定結果取得部(通信制御部102)をさらに備え、上記判定結果が認識可能であることを示している場合、上記出力制御部は、上記音声を受け付けた旨を示す受付情報を上記出力装置に出力させる一方、上記判定結果が認識不可能であることを示している場合、上記出力制御部は、上記受付情報を上記出力装置に出力させず、上記音声取得部は、上記データの取得を再開する。
2、2d クラウドサーバ(サーバ)
4 冷蔵庫(対話機器)
12 音声入力部(入力装置)
13 音声出力部(出力装置)
101 音声取得制御部(音声取得部)
102 通信制御部(判定結果取得部、応答音声取得部)
103 出力制御部
104 出力時間決定部(期間調整部)
S1 取得再開ステップ
S2 音声取得ステップ
S4 取得停止ステップ
S5 判定結果取得ステップ
S7 受付情報出力ステップ
S9 出力制御ステップ
Claims (10)
- ユーザと対話を実行する対話装置であって、
入力装置に入力された音声のデータを取得する音声取得部と、
当該音声に対する応答音声を出力装置に出力させる出力制御部と、を備え、
上記音声取得部は、上記データの取得後に上記データの取得を停止し、
当該音声が認識可能であるか否かを示す判定結果を取得する判定結果取得部をさらに備え、
上記判定結果が認識可能であることを示している場合、上記出力制御部は、上記音声を受け付けた旨を示す受付情報を上記出力装置に出力させる一方、
上記判定結果が認識不可能であることを示している場合、上記出力制御部は、上記受付情報を上記出力装置に出力させず、上記音声取得部は、上記データの取得を再開することを特徴とする対話装置。 - 上記認識不可能との判定結果を上記判定結果取得部が連続して所定回数取得した場合、または、所定期間内に所定回数取得した場合、上記対話の実行を終了することを特徴とする請求項1に記載の対話装置。
- 上記音声取得部が上記データを取得してから所定期間内に上記判定結果取得部が上記判定結果を取得しない場合、上記出力制御部は、上記受付情報を上記出力装置に出力させることを特徴とする請求項1または2に記載の対話装置。
- 上記出力制御部は、上記受付情報を上記出力装置に出力させてから所定期間内に上記応答音声を出力装置に出力させることができない場合、上記対話の間を持たせるための音声を上記出力装置に出力させることを特徴とする請求項3に記載の対話装置。
- 上記出力制御部は、上記対話の間を持たせるための音声を上記出力装置に出力させてから所定期間内に上記応答音声を出力装置に出力させることができない場合、上記応答音声を出力できない旨を示す音声を上記出力装置に出力させると共に、上記対話の実行を停止することを特徴とする請求項4に記載の対話装置。
- 取得した音声のデータを外部のサーバに送信することにより、当該音声に対する判定結果および応答音声のデータを上記サーバから取得する応答音声取得部と、
上記サーバとの通信状態に応じて、上記所定期間を調整する期間調整部と、をさらに備えることを特徴とする請求項3から5のいずれか1項に記載の対話装置。 - 請求項1から6のいずれか1項に記載の対話装置と、上記入力装置と、上記出力装置とを備えることを特徴とする対話機器。
- ユーザと対話を実行する対話装置の制御方法であって、
入力装置に入力された音声のデータを取得する音声取得ステップと、
当該音声に対する応答音声を出力装置に出力させる出力制御ステップと、
上記データの取得後に上記データの取得を停止する取得停止ステップと、
当該音声が認識可能であるか否かを示す判定結果を取得する判定結果取得ステップと、
上記判定結果が認識可能であることを示している場合、上記音声を受け付けた旨を示す受付情報を上記出力装置に出力させる受付情報出力ステップと、
上記判定結果が認識不可能であることを示している場合、上記受付情報を上記出力装置に出力させず、上記データの取得を再開する取得再開ステップと、を含むことを特徴とする対話装置の制御方法。 - 請求項1に記載の対話装置としてコンピュータを機能させるための制御プログラムであって、上記音声取得部、上記出力制御部、および上記判定結果取得部としてコンピュータを機能させるための制御プログラム。
- 請求項9に記載の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015213246A JP6636303B2 (ja) | 2015-10-29 | 2015-10-29 | 対話装置、対話機器、対話装置の制御方法、制御プログラム、および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015213246A JP6636303B2 (ja) | 2015-10-29 | 2015-10-29 | 対話装置、対話機器、対話装置の制御方法、制御プログラム、および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017083713A true JP2017083713A (ja) | 2017-05-18 |
JP6636303B2 JP6636303B2 (ja) | 2020-01-29 |
Family
ID=58713011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015213246A Expired - Fee Related JP6636303B2 (ja) | 2015-10-29 | 2015-10-29 | 対話装置、対話機器、対話装置の制御方法、制御プログラム、および記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6636303B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109147801A (zh) * | 2018-09-30 | 2019-01-04 | 深圳市元征科技股份有限公司 | 语音交互方法、系统、终端及存储介质 |
WO2019106902A1 (ja) * | 2017-11-30 | 2019-06-06 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
CN110633066A (zh) * | 2019-08-14 | 2019-12-31 | 厦门快商通科技股份有限公司 | 语音采集方法、系统、移动终端及存储介质 |
CN111161736A (zh) * | 2018-11-08 | 2020-05-15 | 夏普株式会社 | 冰箱 |
CN111369972A (zh) * | 2018-12-06 | 2020-07-03 | 阿尔派株式会社 | 引导声音输出控制系统及引导声音输出控制方法 |
CN111626706A (zh) * | 2020-05-27 | 2020-09-04 | 中国联合网络通信集团有限公司 | 用户意图识别方法及设备 |
CN112133296A (zh) * | 2020-08-27 | 2020-12-25 | 北京小米移动软件有限公司 | 全双工语音控制方法、装置、存储介质及语音设备 |
JP2021152589A (ja) * | 2020-03-24 | 2021-09-30 | シャープ株式会社 | 電子機器の制御装置、制御プログラム、制御方法、電子機器 |
JP7522651B2 (ja) | 2020-12-18 | 2024-07-25 | 本田技研工業株式会社 | 情報処理装置、移動体、プログラム及び情報処理方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06175687A (ja) * | 1992-12-04 | 1994-06-24 | Fujitsu Ltd | 音声認識装置 |
JP2002006875A (ja) * | 2000-06-20 | 2002-01-11 | Seiko Epson Corp | 音声による情報提供システムおよびその音声入力状況報知方法 |
JP2002196789A (ja) * | 2000-12-25 | 2002-07-12 | Matsushita Electric Ind Co Ltd | 音声対話装置 |
JP2006251059A (ja) * | 2005-03-08 | 2006-09-21 | Nissan Motor Co Ltd | 音声対話装置および音声対話方法 |
WO2014141676A1 (ja) * | 2013-03-12 | 2014-09-18 | パナソニック株式会社 | 情報通信端末、対話提供方法 |
JP2015135420A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
-
2015
- 2015-10-29 JP JP2015213246A patent/JP6636303B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06175687A (ja) * | 1992-12-04 | 1994-06-24 | Fujitsu Ltd | 音声認識装置 |
JP2002006875A (ja) * | 2000-06-20 | 2002-01-11 | Seiko Epson Corp | 音声による情報提供システムおよびその音声入力状況報知方法 |
JP2002196789A (ja) * | 2000-12-25 | 2002-07-12 | Matsushita Electric Ind Co Ltd | 音声対話装置 |
JP2006251059A (ja) * | 2005-03-08 | 2006-09-21 | Nissan Motor Co Ltd | 音声対話装置および音声対話方法 |
WO2014141676A1 (ja) * | 2013-03-12 | 2014-09-18 | パナソニック株式会社 | 情報通信端末、対話提供方法 |
JP2015135420A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7207322B2 (ja) | 2017-11-30 | 2023-01-18 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
WO2019106902A1 (ja) * | 2017-11-30 | 2019-06-06 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JPWO2019106902A1 (ja) * | 2017-11-30 | 2020-12-03 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US11302344B2 (en) | 2017-11-30 | 2022-04-12 | Sony Corporation | Information processing apparatus, information processing method, and program |
CN109147801A (zh) * | 2018-09-30 | 2019-01-04 | 深圳市元征科技股份有限公司 | 语音交互方法、系统、终端及存储介质 |
CN111161736A (zh) * | 2018-11-08 | 2020-05-15 | 夏普株式会社 | 冰箱 |
CN111161736B (zh) * | 2018-11-08 | 2024-12-06 | 夏普株式会社 | 冰箱 |
CN111369972A (zh) * | 2018-12-06 | 2020-07-03 | 阿尔派株式会社 | 引导声音输出控制系统及引导声音输出控制方法 |
CN111369972B (zh) * | 2018-12-06 | 2024-06-07 | 阿尔派株式会社 | 引导声音输出控制系统及引导声音输出控制方法 |
CN110633066A (zh) * | 2019-08-14 | 2019-12-31 | 厦门快商通科技股份有限公司 | 语音采集方法、系统、移动终端及存储介质 |
CN110633066B (zh) * | 2019-08-14 | 2022-12-06 | 厦门快商通科技股份有限公司 | 语音采集方法、系统、移动终端及存储介质 |
JP2021152589A (ja) * | 2020-03-24 | 2021-09-30 | シャープ株式会社 | 電子機器の制御装置、制御プログラム、制御方法、電子機器 |
CN111626706A (zh) * | 2020-05-27 | 2020-09-04 | 中国联合网络通信集团有限公司 | 用户意图识别方法及设备 |
CN112133296B (zh) * | 2020-08-27 | 2024-05-21 | 北京小米移动软件有限公司 | 全双工语音控制方法、装置、存储介质及语音设备 |
CN112133296A (zh) * | 2020-08-27 | 2020-12-25 | 北京小米移动软件有限公司 | 全双工语音控制方法、装置、存储介质及语音设备 |
JP7522651B2 (ja) | 2020-12-18 | 2024-07-25 | 本田技研工業株式会社 | 情報処理装置、移動体、プログラム及び情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6636303B2 (ja) | 2020-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6636303B2 (ja) | 対話装置、対話機器、対話装置の制御方法、制御プログラム、および記録媒体 | |
US8015014B2 (en) | Speech recognition system with user profiles management component | |
CN106297781B (zh) | 控制方法和控制器 | |
KR102293063B1 (ko) | 사용자 정의 가능한 웨이크업 음성 명령 | |
US10055190B2 (en) | Attribute-based audio channel arbitration | |
US9583102B2 (en) | Method of controlling interactive system, method of controlling server, server, and interactive device | |
CN106257355B (zh) | 设备控制方法和控制器 | |
JP6054283B2 (ja) | 音声認識端末、サーバ、サーバの制御方法、音声認識システム、音声認識端末の制御プログラム、サーバの制御プログラムおよび音声認識端末の制御方法 | |
US9466286B1 (en) | Transitioning an electronic device between device states | |
JP2020525903A (ja) | 音声アシスタントシステムのための発話による特権の管理 | |
JP2011176879A (ja) | 注目期間を有する音声入力装置 | |
WO2016194740A1 (ja) | 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法 | |
KR102483833B1 (ko) | 등록된 사용자에 의한 인증을 통해 새로운 사용자를 등록하기 위한 전자 장치 및 방법 | |
JP2018109663A (ja) | 音声処理装置、対話システム、端末装置、プログラム及び音声処理方法 | |
CN107342085A (zh) | 语音处理方法及装置 | |
JP2019090942A (ja) | 情報処理装置、情報処理システム、情報処理方法、および情報処理プログラム | |
WO2017141530A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN110751948A (zh) | 一种语音识别方法、装置、存储介质及语音设备 | |
WO2017151417A1 (en) | Speech recognition | |
US11074912B2 (en) | Identifying a valid wake input | |
CN110099295A (zh) | 电视机语音控制方法、装置、设备及存储介质 | |
CN112767916A (zh) | 智能语音设备的语音交互方法、装置、设备、介质及产品 | |
JP2019215449A (ja) | 会話補助装置、会話補助方法及びプログラム | |
CN113658601A (zh) | 语音交互方法、装置、终端设备、存储介质及程序产品 | |
CN113314115B (zh) | 终端设备的语音处理方法、终端设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180920 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190903 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191029 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6636303 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |