JP2008009153A - 音声対話システム - Google Patents
音声対話システム Download PDFInfo
- Publication number
- JP2008009153A JP2008009153A JP2006179985A JP2006179985A JP2008009153A JP 2008009153 A JP2008009153 A JP 2008009153A JP 2006179985 A JP2006179985 A JP 2006179985A JP 2006179985 A JP2006179985 A JP 2006179985A JP 2008009153 A JP2008009153 A JP 2008009153A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- recognition
- unit
- dictionary
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】音声対話システムに、入力された音声を音声データに変換する音声入力部2と、複数の単語が格納される第1の認識辞書と、第1の認識辞書に格納されている何れかの単語と対応付けられた第2の認識辞書とを記憶する音声認識辞書記憶部3と、第1の認識辞書を用いて、変換した音声データの中に含まれるキーワードを音声認識すると共に、その音声認識されたキーワードの信頼度を算出し、算出した信頼度が所定の閾値以上である場合、第2の認識辞書を用いて、音声データを音声認識する音声認識部4と、音声認識の結果を出力する出力部8と、各部の動作を制御する対話管理部6と、を設ける。そして、対話管理部6は、ユーザとの対話状況に応じて閾値を変更する。
【選択図】図1
Description
先ず、本発明に関する第1実施形態を図2、図3のフローチャートを踏まえながら説明する。
続いて、本発明の第2実施形態について図2、図3のフローチャートを踏まえながら説明する。なお、第2実施形態は、上述した第1実施形態のS1070の処理を変更したものであり、それ以外の部分は第1実施形態のものと同じである。そのため、以下では、第1実施形態と異なる部分を中心に説明する。
続いて、本発明の第2実施形態の変形例1について図2、図3のフローチャートを踏まえながら説明する。なお、第2実施形態の変形例1は、上述した第1実施形態のS1070の処理を変更したものであり、それ以外の部分は第1実施形態のものと同じである。そのため、以下では、第1実施形態と異なる部分を中心に説明する。
続いて、本発明の第2実施形態の変形例2について、図2、図3のフローチャートを踏まえながら説明する。なお、第2実施形態の変形例2は、上述した第1実施形態のS1070の処理を変更したものであり、それ以外の部分は第1実施形態のものと同じである。そのため、以下では、第1実施形態と異なる部分を中心に説明する。
続いて、本発明の第3実施形態について図2、図3、図6のフローチャートを踏まえながら説明する。第3実施形態は、第1実施形態のS1080〜S1100(図2)の処理を図6に示す処理に置き換えたものであり、それ以外の部分は第1実施形態のものと同じである。そのため、以下では、第1実施形態と異なる部分を中心に説明する。
続いて、本発明の第4実施形態について、図7、図8のフローチャートを踏まえながら説明する。
まず、第4実施形態の変形例1を示す。具体的には、第4実施形態の変形例1では、各ユーザ発話の継続時間、ユーザの発話音声の大きさ、ユーザの発話音声の高さを判断基準として、キーワード数を変更する。これらのパラメータは、ユーザが訂正発話や再発話を行う際に、特徴的な変化をすることがある。それらを検出し、キーワード数を少なくし、認識率を高める。また、ユーザが再発話であることが確認できた場合、複数の種類あるキーワードのうち、一部の種類のキーワードだけを採用するといった戦略を取ることができる。例えば、所定値以上の信頼度を有するキーワードを用いることとする。
つぎに、第4実施形態の変形例2を示す。具体的には、変形例2は、第4実施形態において、雑音の大きさを判断基準として使用することにより、キーワード数を変更するようにしたものである。雑音が大きい状況では、音声認識の性能が低下することが予想される。そこで、キーワード数を少なくし、認識率を高めることが考えられる。また、第4実施形態の変形例1と同様、複数の種類あるキーワードのうち、一部の種類のキーワードだけを採用し、辞書を選定するという戦略もとることができる(S4095)。これにより、雑音が大きく音声認識が困難な状況でも、タスク達成率を高めることができる。
つぎに、第4実施形態の変形例3を示す。変形例3は、第4実施形態において、雑音の大きさと発話回数・対話時間情報を複合して、キーワード数を変更するようにしてものである。たとえば、雑音が少なく高認識率が期待できるときには、発話回数が多くなるほどキーワード数を減らしていく。一方、雑音が大きな場合、最初からキーワード数を少なくする、あるいはキーワードの種類を少なくするなどの対策が取られる。このことにより、どんな環境に対してでも、よりユーザがスムーズにタスクを完了させることが可能となる。
続いて、本発明の第5実施形態について、図2、図3のフローチャートと、図12の内部状態図とを用いて説明する。本実施形態は、図2のS1070の条件分岐において、音声認識結果記憶部5に保存されている最新の認識結果の信頼度だけでなく、過去の対話の認識結果の信頼度も判断基準とすることを特徴としている。以下、本実施形態での音声対話システムの内部状態を示す図12に従い、場面ごとに説明する。なお、以下では、ユーザが最初に、「東京」とだけ発話した場合を例にする。
続いて、本発明の第6実施形態を説明する。第6実施形態では、対話の状況に応じて、信頼度閾値の変更とキーワード数の変更の両方を行うものである。たとえば、ユーザ発話回数が増えていった場合に、信頼度の閾値で確認を増やす範囲を大きくし、かつキーワード数を減らすことが考えられる。このことによって、より確実にタスク達成へ導くことができる。
Claims (7)
- ユーザから入力された音声を音声データに変換する音声入力部と、
複数の単語が格納される第1の認識辞書と、上記第1の認識辞書に格納されている何れかの単語と対応付けられた単語が格納される第2の認識辞書とを記憶する音声認識辞書記憶部と、
上記第1の認識辞書を用いて、上記変換した音声データの中に含まれるキーワードを音声認識すると共に、該音声認識されたキーワードの信頼度を算出し、該信頼度が所定の閾値以上である場合に、上記第2の認識辞書を用いて、上記音声データを音声認識する音声認識部と、
上記音声認識部が行った音声認識の結果を出力する出力部と、
上記音声入力部、上記音声認識辞書記憶部、上記音声認識部、および上記出力部の動作を制御する対話管理部と、を有し、
上記対話管理部は、ユーザとの対話状況に応じて上記閾値を変更すること
を特徴とする音声対話システム。 - 請求項1に記載の音声対話システムであって、
上記対話管理部は、上記音声認識されたキーワードの信頼度が上記所定の閾値に満たない場合、上記出力部を介して、再度の音声入力を求める出力又は上記音声認識されたキーワードの確認を求める出力を行うこと
を特徴とする音声対話システム。 - 請求項1又は2に記載の音声対話システムであって、
上記音声認識辞書記憶部は、上記第1の認識辞書および第2の認識辞書の何れにも格納されない単語を格納する第3の認識辞書を有し、
上記音声認識部は、上記信頼度が所定の閾値に満たない場合には、上記第3の辞書を用いて上記音声データの音声認識を行うこと
特徴とする音声対話システム。 - ユーザから入力された音声を音声データに変換する音声入力部と、
複数の単語が格納される第1の認識辞書と、上記第1の認識辞書に格納されている何れかの単語と対応付けられた単語が格納される第2の認識辞書とを記憶する音声認識辞書記憶部と、
上記第1の認識辞書を用いて、上記変換した音声データの中に含まれるキーワードを音声認識すると共に、該音声認識されたキーワードの信頼度を算出し、該信頼度が所定の閾値以上である場合に、上記第2の認識辞書を用いて、上記音声データを音声認識する音声認識部と、
上記音声認識部が行った音声認識の結果を出力する出力部と、
上記音声入力部、上記音声認識辞書記憶部、上記音声認識部、および上記出力部の動作を制御する対話管理部と、を有し、
上記対話管理部は、ユーザとの対話状況に応じて、上記第1の認識辞書に格納されるキーワードの数を変更すること
を特徴とする音声対話システム。 - 請求項1〜4のいずれか一項に記載の音声対話システムであって、
上記対話状況には、上記音声認識結果中のユーザの発話回数、対話開始からの継続時間、各ユーザ発話の継続時間、ユーザの発話音声の大きさ、ユーザの発話音声の高さ、および雑音の大きさのうちの少なくとも何れかが含まれること
を特徴とする音声対話システム。 - 請求項1〜5のいずれか一項に記載の音声対話システムであって、
上記第1の認識辞書は、ユーザの発話順にキーワードと任意の音韻列を認識するモデルである未知語とを接続した規則に基づいて構成されていること
を特徴とする音声対話システム。 - 請求項1に記載の音声対話システムにおいて、
複数の上記音声認識されたキーワードの一部を用いて上記第2の認識辞書の選択を行うこと
を特徴とする音声対話システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006179985A JP2008009153A (ja) | 2006-06-29 | 2006-06-29 | 音声対話システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006179985A JP2008009153A (ja) | 2006-06-29 | 2006-06-29 | 音声対話システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008009153A true JP2008009153A (ja) | 2008-01-17 |
Family
ID=39067440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006179985A Pending JP2008009153A (ja) | 2006-06-29 | 2006-06-29 | 音声対話システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008009153A (ja) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010014885A (ja) * | 2008-07-02 | 2010-01-21 | Advanced Telecommunication Research Institute International | 音声認識機能付情報処理端末 |
JP2010224153A (ja) * | 2009-03-23 | 2010-10-07 | Toyota Central R&D Labs Inc | 音声対話装置及びプログラム |
WO2010128560A1 (ja) * | 2009-05-08 | 2010-11-11 | パイオニア株式会社 | 音声認識装置、音声認識方法、及び音声認識プログラム |
JP2012073361A (ja) * | 2010-09-28 | 2012-04-12 | Fujitsu Ltd | 音声認識装置及び音声認識方法 |
US20130080161A1 (en) * | 2011-09-27 | 2013-03-28 | Kabushiki Kaisha Toshiba | Speech recognition apparatus and method |
WO2014112226A1 (ja) * | 2013-01-16 | 2014-07-24 | シャープ株式会社 | 電子機器及び掃除機 |
JP2014142626A (ja) * | 2013-01-24 | 2014-08-07 | ▲華▼▲為▼終端有限公司 | 音声識別方法および装置 |
JP2014182307A (ja) * | 2013-03-19 | 2014-09-29 | Sharp Corp | 音声認識システム、および発話システム |
JP2015087728A (ja) * | 2013-11-01 | 2015-05-07 | 富士ソフト株式会社 | 音声認識システムおよび音声認識システムの制御方法 |
CN105229724A (zh) * | 2013-02-20 | 2016-01-06 | 索尼电脑娱乐公司 | 混合性能缩放或语音识别 |
JP2016048338A (ja) * | 2014-08-28 | 2016-04-07 | アルパイン株式会社 | 音声認識装置及びコンピュータプログラム |
WO2016088411A1 (ja) * | 2014-12-02 | 2016-06-09 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
JP2016529603A (ja) * | 2013-12-25 | 2016-09-23 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | オンライン音声翻訳方法及び装置 |
JP2017058545A (ja) * | 2015-09-17 | 2017-03-23 | 本田技研工業株式会社 | 音声処理装置および音声処理方法 |
US9607619B2 (en) | 2013-01-24 | 2017-03-28 | Huawei Device Co., Ltd. | Voice identification method and apparatus |
JP2019079034A (ja) * | 2017-10-26 | 2019-05-23 | 株式会社日立製作所 | 自己学習自然言語理解を伴うダイアログ・システム |
US10553219B2 (en) | 2015-09-23 | 2020-02-04 | Samsung Electronics Co., Ltd. | Voice recognition apparatus, voice recognition method of user device, and non-transitory computer readable recording medium |
CN114691076A (zh) * | 2020-12-28 | 2022-07-01 | 本田技研工业株式会社 | 信息处理装置、信息处理方法及存储介质 |
JP2022101663A (ja) * | 2021-08-18 | 2022-07-06 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | ヒューマンコンピュータインタラクション方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6060080B2 (ja) * | 1977-12-28 | 1985-12-27 | 日本電気株式会社 | 音声認識装置 |
JPH01321499A (ja) * | 1988-06-23 | 1989-12-27 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2004334228A (ja) * | 2004-06-07 | 2004-11-25 | Denso Corp | 単語列認識装置 |
-
2006
- 2006-06-29 JP JP2006179985A patent/JP2008009153A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6060080B2 (ja) * | 1977-12-28 | 1985-12-27 | 日本電気株式会社 | 音声認識装置 |
JPH01321499A (ja) * | 1988-06-23 | 1989-12-27 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2004334228A (ja) * | 2004-06-07 | 2004-11-25 | Denso Corp | 単語列認識装置 |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010014885A (ja) * | 2008-07-02 | 2010-01-21 | Advanced Telecommunication Research Institute International | 音声認識機能付情報処理端末 |
JP2010224153A (ja) * | 2009-03-23 | 2010-10-07 | Toyota Central R&D Labs Inc | 音声対話装置及びプログラム |
WO2010128560A1 (ja) * | 2009-05-08 | 2010-11-11 | パイオニア株式会社 | 音声認識装置、音声認識方法、及び音声認識プログラム |
JPWO2010128560A1 (ja) * | 2009-05-08 | 2012-11-01 | パイオニア株式会社 | 音声認識装置、音声認識方法、及び音声認識プログラム |
JP2012073361A (ja) * | 2010-09-28 | 2012-04-12 | Fujitsu Ltd | 音声認識装置及び音声認識方法 |
US20130080161A1 (en) * | 2011-09-27 | 2013-03-28 | Kabushiki Kaisha Toshiba | Speech recognition apparatus and method |
JP2013072974A (ja) * | 2011-09-27 | 2013-04-22 | Toshiba Corp | 音声認識装置、方法及びプログラム |
JP2014137430A (ja) * | 2013-01-16 | 2014-07-28 | Sharp Corp | 電子機器及び掃除機 |
CN104871239A (zh) * | 2013-01-16 | 2015-08-26 | 夏普株式会社 | 电子设备和吸尘器 |
WO2014112226A1 (ja) * | 2013-01-16 | 2014-07-24 | シャープ株式会社 | 電子機器及び掃除機 |
US9607619B2 (en) | 2013-01-24 | 2017-03-28 | Huawei Device Co., Ltd. | Voice identification method and apparatus |
JP2014142626A (ja) * | 2013-01-24 | 2014-08-07 | ▲華▼▲為▼終端有限公司 | 音声識別方法および装置 |
US9666186B2 (en) | 2013-01-24 | 2017-05-30 | Huawei Device Co., Ltd. | Voice identification method and apparatus |
CN105229724A (zh) * | 2013-02-20 | 2016-01-06 | 索尼电脑娱乐公司 | 混合性能缩放或语音识别 |
CN112863510A (zh) * | 2013-02-20 | 2021-05-28 | 索尼电脑娱乐公司 | 混合性能缩放或语音识别 |
JP2014182307A (ja) * | 2013-03-19 | 2014-09-29 | Sharp Corp | 音声認識システム、および発話システム |
JP2015087728A (ja) * | 2013-11-01 | 2015-05-07 | 富士ソフト株式会社 | 音声認識システムおよび音声認識システムの制御方法 |
US9910851B2 (en) | 2013-12-25 | 2018-03-06 | Beijing Baidu Netcom Science And Technology Co., Ltd. | On-line voice translation method and device |
JP2016529603A (ja) * | 2013-12-25 | 2016-09-23 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | オンライン音声翻訳方法及び装置 |
JP2016048338A (ja) * | 2014-08-28 | 2016-04-07 | アルパイン株式会社 | 音声認識装置及びコンピュータプログラム |
CN107004406A (zh) * | 2014-12-02 | 2017-08-01 | 索尼公司 | 信息处理设备、信息处理方法及程序 |
WO2016088411A1 (ja) * | 2014-12-02 | 2016-06-09 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US10540968B2 (en) | 2014-12-02 | 2020-01-21 | Sony Corporation | Information processing device and method of information processing |
JP2017058545A (ja) * | 2015-09-17 | 2017-03-23 | 本田技研工業株式会社 | 音声処理装置および音声処理方法 |
US10553219B2 (en) | 2015-09-23 | 2020-02-04 | Samsung Electronics Co., Ltd. | Voice recognition apparatus, voice recognition method of user device, and non-transitory computer readable recording medium |
JP2019079034A (ja) * | 2017-10-26 | 2019-05-23 | 株式会社日立製作所 | 自己学習自然言語理解を伴うダイアログ・システム |
CN110019745A (zh) * | 2017-10-26 | 2019-07-16 | 株式会社日立制作所 | 具有自学习自然语言理解的对话系统 |
CN114691076A (zh) * | 2020-12-28 | 2022-07-01 | 本田技研工业株式会社 | 信息处理装置、信息处理方法及存储介质 |
JP2022101663A (ja) * | 2021-08-18 | 2022-07-06 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | ヒューマンコンピュータインタラクション方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008009153A (ja) | 音声対話システム | |
US11948571B2 (en) | Wakeword selection | |
US7996218B2 (en) | User adaptive speech recognition method and apparatus | |
US9754586B2 (en) | Methods and apparatus for use in speech recognition systems for identifying unknown words and for adding previously unknown words to vocabularies and grammars of speech recognition systems | |
US7203644B2 (en) | Automating tuning of speech recognition systems | |
US7529678B2 (en) | Using a spoken utterance for disambiguation of spelling inputs into a speech recognition system | |
JP4542974B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
Souvignier et al. | The thoughtful elephant: Strategies for spoken dialog systems | |
WO2007118020A2 (en) | Method and system for managing pronunciation dictionaries in a speech application | |
JP2000122691A (ja) | 綴り字読み式音声発話の自動認識方法 | |
US20080154591A1 (en) | Audio Recognition System For Generating Response Audio by Using Audio Data Extracted | |
KR20210034276A (ko) | 대화 시스템, 대화 처리 방법 및 전자 장치 | |
US20150310853A1 (en) | Systems and methods for speech artifact compensation in speech recognition systems | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
WO2006093092A1 (ja) | 会話システムおよび会話ソフトウェア | |
Bousquet-Vernhettes et al. | Error handling in spoken dialogue systems: toward corrective dialogue | |
KR100622019B1 (ko) | 음성 인터페이스 시스템 및 방법 | |
JP4639990B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JP2007183516A (ja) | 音声対話装置及び音声認識方法 | |
JP4537755B2 (ja) | 音声対話システム | |
JP2009003205A (ja) | 音声認識装置、および音声認識方法 | |
JPH06161488A (ja) | 音声認識装置 | |
JP2006023444A (ja) | 音声対話装置 | |
JP4946358B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
EP1160767A2 (en) | Speech recognition with contextual hypothesis probabilities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090420 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111128 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120110 |