JP2018116206A - 音声認識装置、音声認識方法及び音声認識システム - Google Patents
音声認識装置、音声認識方法及び音声認識システム Download PDFInfo
- Publication number
- JP2018116206A JP2018116206A JP2017008105A JP2017008105A JP2018116206A JP 2018116206 A JP2018116206 A JP 2018116206A JP 2017008105 A JP2017008105 A JP 2017008105A JP 2017008105 A JP2017008105 A JP 2017008105A JP 2018116206 A JP2018116206 A JP 2018116206A
- Authority
- JP
- Japan
- Prior art keywords
- word
- recognition
- recognized
- unit
- registered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 79
- 238000001514 detection method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Navigation (AREA)
Abstract
Description
第1実施形態に係る音声認識装置について、図1〜図8を参照して説明する。本実施形態に係る音声認識装置は、音声認識技術により、発話された音声を認識し、認識された音声に応じた制御を実行する任意の装置に適用可能である。このような装置として、車載装置、オーディオ装置、テレビ、スマートフォン、携帯電話、タブレット端末、PC(Personal Computer)及びサーバなどが挙げられる。車載装置には、車載のオーディオ装置、ナビゲーション装置、テレビ、及びこれらが一体化された一体型装置などが含まれる。以下では、音声認識装置が車載装置(一体型装置)である場合を例に説明する。
第2実施形態に係る音声認識装置1について、図9を参照して説明する。本実施形態では、認識部14による認識処理の他の例について説明する。なお、本実施形態に係る音声認識装置1のハードウェア構成及び機能構成は第1実施形態と同様である。
第3実施形態に係る音声認識装置1について、図10〜図13を参照して説明する。本実施形態では、取り消し期間の調整について説明する。なお、本実施形態に係る音声認識装置1のハードウェア構成は、第1実施形態と同様である。
第4実施形態に係る音声認識システム2について、図14及び図15を参照して説明する。本実施形態に係る音声認識システム2は、第1実施形態に係る音声認識装置1と同様の機能を実現する。
2:音声認識システム
11:集音部
12:取得部
13:辞書記憶部
14:認識部
15:制御部
21:音声認識端末
22:対象装置
Claims (10)
- 音データに基づいて、予め登録された第1ワードの認識処理を実行し、前記第1ワードを認識した場合、認識された前記第1ワードに応じた取り消し期間の間、予め登録された第2ワードの認識処理を実行する認識部と、
前記認識部により前記第1ワードが認識された場合、認識された前記第1ワードに応じた制御を実行し、前記認識部により前記第2ワードが認識された場合、前記制御を取り消す制御部と、
を備える音声認識装置。 - 前記認識部は、前記第1ワードを認識した場合、認識された前記第1ワードに応じた前記取り消し期間の間、予め登録された第3ワードの認識処理を実行する
請求項1に記載の音声認識装置。 - 前記認識部は、前記第3ワードを認識した場合、前記第2ワードの認識処理を終了する
請求項2に記載の音声認識装置。 - 前記第1ワードの認識確度に基づいて、前記取り消し期間を調整する調整部を更に備える
請求項1乃至請求項3のいずれか1項に記載の音声認識装置。 - 前記調整部は、前記第1ワードの前記認識確度が高いほど前記取り消し期間が短くなるように、前記取り消し期間を調整する
請求項4に記載の音声認識装置。 - 前記第1ワードと、前記第2ワードと、はそれぞれ異なる辞書に登録される
請求項1乃至請求項5のいずれか1項に記載の音声認識装置。 - 前記第1ワードと、前記第2ワードと、は同一の辞書に登録される
請求項1乃至請求項5のいずれか1項に記載の音声認識装置。 - 前記認識部は、所定時間毎に、前記音データと前記第1ワードとの類似度を算出し、算出された前記類似度に基づいて、前記第1ワードを認識する
請求項1乃至請求項7のいずれか1項に記載の音声認識装置。 - 音データに基づいて、予め登録された第1ワードの認識処理を実行し、前記第1ワードを認識した場合、認識された前記第1ワードに応じた取り消し期間の間、予め登録された第2ワードの認識処理を実行する認識工程と、
前記認識工程により前記第1ワードが認識された場合、認識された前記第1ワードに応じた制御を実行し、前記認識工程により前記第2ワードが認識された場合、前記制御を取り消す制御工程と、
を含む音声認識方法。 - ネットワークを介して接続された音声認識端末及び対象装置を備える音声認識システムであって、
前記音声認識端末は、音データに基づいて、予め登録された第1ワードの認識処理を実行し、前記第1ワードを認識した場合、認識された前記第1ワードに応じた取り消し期間の間、予め登録された第2ワードの認識処理を実行する認識部を備え、
前記対象装置は、前記認識部により前記第1ワードが認識された場合、認識された前記第1ワードに応じた制御を実行し、前記認識部により前記第2ワードが認識された場合、前記制御を取り消す制御部を備える
音声認識システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017008105A JP2018116206A (ja) | 2017-01-20 | 2017-01-20 | 音声認識装置、音声認識方法及び音声認識システム |
US15/725,639 US20180211661A1 (en) | 2017-01-20 | 2017-10-05 | Speech recognition apparatus with cancellation period |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017008105A JP2018116206A (ja) | 2017-01-20 | 2017-01-20 | 音声認識装置、音声認識方法及び音声認識システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018116206A true JP2018116206A (ja) | 2018-07-26 |
Family
ID=62906561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017008105A Pending JP2018116206A (ja) | 2017-01-20 | 2017-01-20 | 音声認識装置、音声認識方法及び音声認識システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20180211661A1 (ja) |
JP (1) | JP2018116206A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190065199A (ko) | 2019-05-21 | 2019-06-11 | 엘지전자 주식회사 | 음성 인식을 위한 음성 입출력 장치 및 그 방법 |
JP2021051252A (ja) * | 2019-09-26 | 2021-04-01 | 株式会社Mobility Technologies | 操作受付装置及びプログラム |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021066816A1 (en) * | 2019-10-01 | 2021-04-08 | Visa International Service Association | Graph learning and automated behavior coordination platform |
KR102517661B1 (ko) * | 2022-07-15 | 2023-04-04 | 주식회사 액션파워 | 텍스트 정보에서 타겟 단어에 대응하는 단어를 식별하는 방법 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH096384A (ja) * | 1995-06-21 | 1997-01-10 | Nec Corp | 音声認識装置 |
JPH11143492A (ja) * | 1997-11-10 | 1999-05-28 | Sony Corp | 音声操作機能付き電子機器、電子機器における音声操作方法、及び音声操作機能付き電子機器を備える自動車 |
JP2007286356A (ja) * | 2006-04-17 | 2007-11-01 | Funai Electric Co Ltd | 電子機器 |
US20120089392A1 (en) * | 2010-10-07 | 2012-04-12 | Microsoft Corporation | Speech recognition user interface |
JP2014115594A (ja) * | 2012-12-12 | 2014-06-26 | Fuji Soft Inc | 音声認識システムおよび音声認識システムの制御方法 |
JP2016014967A (ja) * | 2014-07-01 | 2016-01-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 情報管理方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58115497A (ja) * | 1981-12-28 | 1983-07-09 | シャープ株式会社 | 音声認識方法 |
US6289140B1 (en) * | 1998-02-19 | 2001-09-11 | Hewlett-Packard Company | Voice control input for portable capture devices |
US6937984B1 (en) * | 1998-12-17 | 2005-08-30 | International Business Machines Corporation | Speech command input recognition system for interactive computer display with speech controlled display of recognized commands |
FI116991B (fi) * | 1999-01-18 | 2006-04-28 | Nokia Corp | Menetelmä puheen tunnistamisessa, puheentunnistuslaite ja puheella ohjattava langaton viestin |
US7103542B2 (en) * | 2001-12-14 | 2006-09-05 | Ben Franklin Patent Holding Llc | Automatically improving a voice recognition system |
KR100668297B1 (ko) * | 2002-12-31 | 2007-01-12 | 삼성전자주식회사 | 음성인식방법 및 장치 |
JP4906379B2 (ja) * | 2006-03-22 | 2012-03-28 | 富士通株式会社 | 音声認識装置、音声認識方法、及びコンピュータプログラム |
JP4158937B2 (ja) * | 2006-03-24 | 2008-10-01 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 字幕修正装置 |
US8355913B2 (en) * | 2006-11-03 | 2013-01-15 | Nokia Corporation | Speech recognition with adjustable timeout period |
US8618958B2 (en) * | 2008-12-16 | 2013-12-31 | Mitsubishi Electric Corporation | Navigation device |
KR101556594B1 (ko) * | 2009-01-14 | 2015-10-01 | 삼성전자 주식회사 | 신호처리장치 및 신호처리장치에서의 음성 인식 방법 |
CN104756185B (zh) * | 2012-11-05 | 2018-01-09 | 三菱电机株式会社 | 语音识别装置 |
US9830039B2 (en) * | 2013-03-04 | 2017-11-28 | Microsoft Technology Licensing, Llc | Using human wizards in a conversational understanding system |
JP2015060332A (ja) * | 2013-09-18 | 2015-03-30 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法およびプログラム |
JP6011584B2 (ja) * | 2014-07-08 | 2016-10-19 | トヨタ自動車株式会社 | 音声認識装置及び音声認識システム |
-
2017
- 2017-01-20 JP JP2017008105A patent/JP2018116206A/ja active Pending
- 2017-10-05 US US15/725,639 patent/US20180211661A1/en not_active Abandoned
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH096384A (ja) * | 1995-06-21 | 1997-01-10 | Nec Corp | 音声認識装置 |
JPH11143492A (ja) * | 1997-11-10 | 1999-05-28 | Sony Corp | 音声操作機能付き電子機器、電子機器における音声操作方法、及び音声操作機能付き電子機器を備える自動車 |
JP2007286356A (ja) * | 2006-04-17 | 2007-11-01 | Funai Electric Co Ltd | 電子機器 |
US20120089392A1 (en) * | 2010-10-07 | 2012-04-12 | Microsoft Corporation | Speech recognition user interface |
JP2014115594A (ja) * | 2012-12-12 | 2014-06-26 | Fuji Soft Inc | 音声認識システムおよび音声認識システムの制御方法 |
JP2016014967A (ja) * | 2014-07-01 | 2016-01-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 情報管理方法 |
Non-Patent Citations (1)
Title |
---|
野口 淳, 外4名: "パソコン音声認識ソフトウェアを用いた音声ダイヤラの試作", 電子情報通信学会技術研究報告, vol. 第94巻, 第372号, JPN6020043601, 25 November 1994 (1994-11-25), JP, pages 7 - 14, ISSN: 0004562413 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190065199A (ko) | 2019-05-21 | 2019-06-11 | 엘지전자 주식회사 | 음성 인식을 위한 음성 입출력 장치 및 그 방법 |
JP2021051252A (ja) * | 2019-09-26 | 2021-04-01 | 株式会社Mobility Technologies | 操作受付装置及びプログラム |
JP7377043B2 (ja) | 2019-09-26 | 2023-11-09 | Go株式会社 | 操作受付装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20180211661A1 (en) | 2018-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106796786B (zh) | 语音识别系统 | |
US10733986B2 (en) | Apparatus, method for voice recognition, and non-transitory computer-readable storage medium | |
US11076219B2 (en) | Automated control of noise reduction or noise masking | |
CN105793923A (zh) | 本地和远程语音处理 | |
US9224404B2 (en) | Dynamic audio processing parameters with automatic speech recognition | |
JP2014142566A (ja) | 音声認識システムおよび音声認識方法 | |
JP2002091466A (ja) | 音声認識装置 | |
JP2018116206A (ja) | 音声認識装置、音声認識方法及び音声認識システム | |
EP3654329B1 (en) | In-vehicle device and speech recognition method | |
JP2015219440A (ja) | 操作補助装置および操作補助方法 | |
JP6459330B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP2008033198A (ja) | 音声対話システム、音声対話方法、音声入力装置、プログラム | |
US9262796B2 (en) | Communication apparatus | |
US10468017B2 (en) | System and method for understanding standard language and dialects | |
JP6673243B2 (ja) | 音声認識装置 | |
JP4056711B2 (ja) | 音声認識装置 | |
JP2001154694A (ja) | 音声認識装置及び方法 | |
JP6966374B2 (ja) | 音声認識システム及びコンピュータプログラム | |
JP2006208486A (ja) | 音声入力装置 | |
JP2019139089A (ja) | 音声秘匿装置および音声秘匿プログラム | |
KR100749088B1 (ko) | 대화형 네비게이션 시스템 및 그 제어방법 | |
JP2007183516A (ja) | 音声対話装置及び音声認識方法 | |
JP6999236B2 (ja) | 音声認識システム | |
JP2020091435A (ja) | 音声認識システム、音声認識システムの通知方法、プログラム、及び移動体搭載機器 | |
JP7429107B2 (ja) | 音声翻訳装置、音声翻訳方法及びそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190827 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200526 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201117 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210803 |