JP4528540B2 - 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 - Google Patents
音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 Download PDFInfo
- Publication number
- JP4528540B2 JP4528540B2 JP2004059829A JP2004059829A JP4528540B2 JP 4528540 B2 JP4528540 B2 JP 4528540B2 JP 2004059829 A JP2004059829 A JP 2004059829A JP 2004059829 A JP2004059829 A JP 2004059829A JP 4528540 B2 JP4528540 B2 JP 4528540B2
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- vocabulary
- dictionary
- speech
- acoustic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
音声が入力されると、予め用意されている認識辞書を用いて暫定的な音声認識結果を求める音声認識処理を行う第1の音声認識ステップ(ステップ1)と、
単語間の関連性の情報を格納するデータベースを参照して、暫定的な音声認識結果の単語系列の各単語と関連性の高い単語である関連語彙を、該データベースから獲得する語彙獲得ステップ(ステップ2)と、
獲得した関連語彙を予め用意されている認識辞書に追加した拡張辞書を作成する語彙拡張ステップ(ステップ3)と、
拡張辞書を用いて再度音声認識処理を行う第2の音声認識ステップ(ステップ4)と、を行う。
暫定的な音声認識結果から関連語彙を獲得する際に、該暫定的な音声認識結果の信頼度に基づいて音声認識結果と該関連語彙の関連度を算出する関連度算出ステップを含む。
入力された音声を前記辞書記憶手段の前記予め用意されている認識辞書を用いて求めた暫定的な第1の音声認識結果180から、その内容に対する関連語彙を、単語間の関連性の情報を格納する語彙データベース380を参照して、該暫定的な第1の音声認識結果180の単語系列の各単語と関連性の高い単語である関連語彙を該語彙データベース380から獲得し、獲得した関連語彙を該辞書記憶手段に追加した、拡張辞書200を作成する語彙拡張手段190と、
拡張辞書200を用いて求めた音声認識結果を出力する再探索手段210と、を有する。
暫定的な第1の音声認識結果から関連語彙を獲得する際に、該暫定的な第1の音声認識結果180の信頼度に基づいて音声認識結果と該関連語彙の関連度を算出する関連度算出手段を含む。
120 音響分析部
130 音響特徴パラメータ系列
140 音響モデル
150 言語モデル
160 認識辞書
170 探索部
180 暫定的な第1の音声認識結果、音声認識結果(1回目)
190 語彙拡張手段、語彙拡張部
200 拡張辞書、拡張認識辞書
210 再探索手段、再探索部
220 音声認識結果
310 関連語彙獲得部
320 関連語彙
370 語彙関連度算出部
380 語彙データベース
410 拡張認識辞書生成部
520 音声認識プログラムメモリ
530 CPU
540 記憶部
Claims (6)
- 入力されたディジタル信号から音響特徴パラメータを抽出し、該音響特徴パラメータに対して、言語モデルと予め用意されている認識辞書により与えられた言語スコアと、音響モデルが与える音響スコアとを計算し、該言語スコアと該音響スコアに基づいて計算されるスコアが最も高い言語単位系列を認識結果として出力する音声認識方法において、
音声が入力されると、前記予め用意されている認識辞書を用いて暫定的な音声認識結果を求める音声認識処理を行う第1の音声認識ステップと、
単語間の共起情報を単語間の関連性の情報とした、単語間の関連性の情報を格納するデータベースを参照して、前記暫定的な音声認識結果の単語系列の各単語と関連性の高い単語である関連語彙を、該データベースから獲得する語彙獲得ステップと、
獲得した前記関連語彙を前記予め用意されている認識辞書に追加した拡張辞書を作成する語彙拡張ステップと、
前記拡張辞書を用いて再度音声認識処理を行う第2の音声認識ステップと、を行うことを特徴とする音声認識方法。 - 前記語彙獲得ステップにおいて、
前記暫定的な音声認識結果から関連語彙を獲得する際に、該暫定的な音声認識結果の信頼度に基づいて音声認識結果と該関連語彙の関連度を算出する関連度算出ステップを含む請求項1記載の音声認識方法。 - 入力される音声信号をディジタル信号に変換し、該ディジタル信号から音響特徴パラメータ系列を抽出する音響分析手段と、音響モデルが格納されている音響モデル記憶手段と、言語モデルが格納されている言語モデル記憶手段と、予め用意されている認識辞書が格納されている辞書記憶手段と、該音響モデル記憶手段、該言語モデル記憶手段、該辞書記憶手段からそれぞれ音響モデル、言語モデル、該予め用意されている認識辞書を入力し、入力音声の該音響特徴パラメータ系列に対して、該言語モデルと該予め用意されている認識辞書により与えられた言語スコアと、該音響モデルが与える音響スコアとを計算し、該言語スコアと該音響スコアとに基づいて計算されるスコアが最も高い言語単位系列を音声認識結果として出力する探索手段とを有する音声認識装置であって、
入力された音声を前記辞書記憶手段の前記予め用意されている認識辞書を用いて求めた暫定的な第1の音声認識結果から、その内容に対する関連語彙を、単語間の共起情報を単語間の関連性の情報とした、単語間の関連性の情報を格納する語彙データベースを参照して、該暫定的な第1の音声認識結果の単語系列の各単語と関連性の高い単語である関連語彙を該語彙データベースから獲得し、獲得した関連語彙を該辞書記憶手段に追加した、拡張辞書を作成する語彙拡張手段と、
前記拡張辞書を用いて求めた音声認識結果を出力する再探索手段と、を有することを特徴とする音声認識装置。 - 前記語彙拡張手段は、
前記暫定的な第1の音声認識結果から関連語彙を獲得する際に、該暫定的な第1の音声認識結果の信頼度に基づいて音声認識結果と該関連語彙の関連度を算出する関連度算出手段を含む請求項3記載の音声認識装置。 - 請求項3または4に記載の音声認識装置を構成する各手段としてコンピュータを機能させるための音声認識プログラム。
- 請求項5に記載の音声認識プログラムを格納したことを特徴とする音声認識プログラムを格納した記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004059829A JP4528540B2 (ja) | 2004-03-03 | 2004-03-03 | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004059829A JP4528540B2 (ja) | 2004-03-03 | 2004-03-03 | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005250071A JP2005250071A (ja) | 2005-09-15 |
JP4528540B2 true JP4528540B2 (ja) | 2010-08-18 |
Family
ID=35030609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004059829A Expired - Fee Related JP4528540B2 (ja) | 2004-03-03 | 2004-03-03 | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4528540B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4897737B2 (ja) * | 2008-05-12 | 2012-03-14 | 日本電信電話株式会社 | 単語追加装置、単語追加方法、そのプログラム |
JP5336788B2 (ja) * | 2008-08-13 | 2013-11-06 | Kddi株式会社 | 音声認識装置およびプログラム |
JP5480760B2 (ja) * | 2010-09-15 | 2014-04-23 | 株式会社Nttドコモ | 端末装置、音声認識方法および音声認識プログラム |
JP5670293B2 (ja) * | 2011-11-21 | 2015-02-18 | 日本電信電話株式会社 | 単語追加装置、単語追加方法、およびプログラム |
JP5546565B2 (ja) * | 2012-02-22 | 2014-07-09 | 日本電信電話株式会社 | 単語追加装置、単語追加方法、およびプログラム |
JP6179509B2 (ja) * | 2012-05-17 | 2017-08-16 | 日本電気株式会社 | 言語モデル生成装置、音声認識装置、言語モデル生成方法およびプログラム記憶媒体 |
CN109920430A (zh) * | 2019-01-10 | 2019-06-21 | 上海言通网络科技有限公司 | 语音识别语义处理系统及其方法 |
JP7587104B2 (ja) | 2020-07-03 | 2024-11-20 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法、プログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03276367A (ja) * | 1990-03-26 | 1991-12-06 | A T R Jido Honyaku Denwa Kenkyusho:Kk | 用例主導型機械翻訳方法 |
JPH08278794A (ja) * | 1995-04-07 | 1996-10-22 | Sony Corp | 音声認識装置および音声認識方法並びに音声翻訳装置 |
JPH08328585A (ja) * | 1995-05-31 | 1996-12-13 | Sony Corp | 自然言語処理装置および自然言語処理方法、並びに音声認識装置および音声認識方法 |
JP2001236089A (ja) * | 1999-12-17 | 2001-08-31 | Atr Interpreting Telecommunications Res Lab | 統計的言語モデル生成装置、音声認識装置、情報検索処理装置及びかな漢字変換装置 |
JP2002006878A (ja) * | 2000-06-07 | 2002-01-11 | Sony Internatl Europ Gmbh | 音声フレーズ認識方法及び音声認識装置 |
-
2004
- 2004-03-03 JP JP2004059829A patent/JP4528540B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03276367A (ja) * | 1990-03-26 | 1991-12-06 | A T R Jido Honyaku Denwa Kenkyusho:Kk | 用例主導型機械翻訳方法 |
JPH08278794A (ja) * | 1995-04-07 | 1996-10-22 | Sony Corp | 音声認識装置および音声認識方法並びに音声翻訳装置 |
JPH08328585A (ja) * | 1995-05-31 | 1996-12-13 | Sony Corp | 自然言語処理装置および自然言語処理方法、並びに音声認識装置および音声認識方法 |
JP2001236089A (ja) * | 1999-12-17 | 2001-08-31 | Atr Interpreting Telecommunications Res Lab | 統計的言語モデル生成装置、音声認識装置、情報検索処理装置及びかな漢字変換装置 |
JP2002006878A (ja) * | 2000-06-07 | 2002-01-11 | Sony Internatl Europ Gmbh | 音声フレーズ認識方法及び音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2005250071A (ja) | 2005-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6188831B2 (ja) | 音声検索装置および音声検索方法 | |
US10210862B1 (en) | Lattice decoding and result confirmation using recurrent neural networks | |
JP5480760B2 (ja) | 端末装置、音声認識方法および音声認識プログラム | |
Chang et al. | Large vocabulary Mandarin speech recognition with different approaches in modeling tones. | |
US8321218B2 (en) | Searching in audio speech | |
JP5310563B2 (ja) | 音声認識システム、音声認識方法、および音声認識用プログラム | |
US20110077943A1 (en) | System for generating language model, method of generating language model, and program for language model generation | |
JPH08278794A (ja) | 音声認識装置および音声認識方法並びに音声翻訳装置 | |
KR20050082249A (ko) | 도메인 기반 대화 음성인식방법 및 장치 | |
JPWO2007097176A1 (ja) | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム | |
JP2001101187A (ja) | 翻訳装置および翻訳方法、並びに記録媒体 | |
JP2002258890A (ja) | 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体 | |
JP2001249684A (ja) | 音声認識装置および音声認識方法、並びに記録媒体 | |
JP2004170765A (ja) | 音声処理装置および方法、記録媒体並びにプログラム | |
Hasan et al. | A spell-checker integrated machine learning based solution for speech to text conversion | |
JP4528540B2 (ja) | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 | |
KR100480790B1 (ko) | 양방향 n-그램 언어모델을 이용한 연속 음성인식방법 및장치 | |
JP4269625B2 (ja) | 音声認識辞書作成方法及びその装置と音声認識装置 | |
JP4595415B2 (ja) | 音声検索システムおよび方法ならびにプログラム | |
JP2001242885A (ja) | 音声認識装置および音声認識方法、並びに記録媒体 | |
JP4987530B2 (ja) | 音声認識辞書作成装置および音声認識装置 | |
KR20050101695A (ko) | 인식 결과를 이용한 통계적인 음성 인식 시스템 및 그 방법 | |
KR20050101694A (ko) | 문법적 제약을 갖는 통계적인 음성 인식 시스템 및 그 방법 | |
JP2938865B1 (ja) | 音声認識装置 | |
Raghudathesh et al. | Review of toolkit to build automatic speech recognition models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060414 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090421 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090615 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100414 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20100506 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100528 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100607 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130611 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |