JP4897737B2 - 単語追加装置、単語追加方法、そのプログラム - Google Patents
単語追加装置、単語追加方法、そのプログラム Download PDFInfo
- Publication number
- JP4897737B2 JP4897737B2 JP2008124295A JP2008124295A JP4897737B2 JP 4897737 B2 JP4897737 B2 JP 4897737B2 JP 2008124295 A JP2008124295 A JP 2008124295A JP 2008124295 A JP2008124295 A JP 2008124295A JP 4897737 B2 JP4897737 B2 JP 4897737B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- appearance probability
- additional word
- additional
- language dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 53
- 238000011156 evaluation Methods 0.000 claims description 36
- 238000004364 calculation method Methods 0.000 claims description 25
- 230000007423 decrease Effects 0.000 claims 3
- 238000012545 processing Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 235000013527 bean curd Nutrition 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 235000013305 food Nutrition 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Description
P(Wi│Wi−1)=P(Wi│Ci)P(Ci│Ci−1) (1)
ただし、Wi∈Ciとする。従って、単語Wの単語出現確率P(Wi│Ci)は非常に重要な要素になる。
中川聖一著「確率モデルによる音声認識」、コロナ社、p109−120
E1(A)<Th1 (2)
であるか否かということである。第1誤り値E1(A)が「(湧き出し誤り数/評価音声データベース内の単語数)*100」である場合には、第1閾値Th1は例えば0以上100未満の定数であり、例えばTh1=1(%)などと設定すればよい。第1誤り値E1(A)が上記式(2)を満たすということは、追加単語Aの単語出現確率が第1出現確率P1である場合の音声認識処理において、追加単語Aの湧き出し誤りが生じない傾向にある(生じにくい)ということである。
(E2(A)/E1(A))*100<Th2 (3)
を満たすかどうかの判定である。この場合にはTh2とは0以上100未満の定数であり、例えば10(%)である。
(C2(A)/C1(A))*100<Th3 (4)
の式を満たすかどうかの判定を行えばよい。この場合にはTh3とは0以上100未満の定数であり、例えば10(%)である。
次に、単語追加装置200の変形例を説明する。図5に変形例の単語追加装置200’の処理フローを示す。単語追加装置200’の処理フローは、単語追加装置200の処理フロー(図4参照)と比較して、ステップS4の処理において、例えば、E1(A)≧Th1と判定された場合に、ステップS20、S22、S24の処理(実施例4で説明)が行われ、ステップS22の処理の後、ステップS10の処理が行われる。つまり、単語追加装置200の処理は、ステップS4において、E1(A)≧Th1と判定されると、E1(A)/E2(A)<Th2か否かの判定を行っていたが、単語追加装置200’の処理は、ステップS4において、E1(A)≧Th1と判定されると、C1(A)/C2(A)<Th3か否かの判定を行っている。また、C1(A)/C2(A)≧Th3と判定された場合には、その時点で処理を終了をしてもよく、次のステップS10に移っても良い。
本発明は上述の実施の形態に限定されるものではない。また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
本実施例の単語追加装置は、上述のようなハードウェアに所定のプログラムが読み込まれ、CPUがそれを実行することによって構築される。以下、このように構築される各装置の機能構成を説明する。
Claims (10)
- 追加前言語辞書に追加単語と当該追加単語の第1出現確率とを対応付けて追加した言語辞書と、評価音声データベースとを用いて、前記追加単語の第1誤り値を求める誤り値計算部と、
前記第1誤り値を用いて、音声認識処理において前記追加単語の湧き出し誤りが生じない傾向にある(以下、「第1関係を満たす」という。)か否かを判定する判定部と、
前記第1関係を満たすと判定されると、前記追加単語の単語出現確率として、第1中出現確率より大きい値である大出現確率を出力する出現確率出力部と、
前記追加単語と前記単語出現確率とを対応付けて前記追加前言語辞書に追加した言語辞書を出力する言語辞書出力部と、を備え、
前記誤り値計算部は、前記第1関係を満たさないと判定されると、前記追加前言語辞書に前記追加単語と前記第1出現確率未満である第2出現確率とを対応付けて追加した言語辞書と、前記評価音声データベースとを用いて、第2誤り値を求めるものであり、
前記判定部は、前記第1誤り値および前記第2誤り値を用いて、前記追加単語の単語出現確率が下がると、音声認識処理において前記追加単語の湧き出し誤りが生じない傾向にある(以下、「第2関係を満たす」という。)か否かを判定するものであり、
前記出現確率出力部は、前記第1関係を満たさず、前記第2関係を満たすと判定されると、追加単語の単語出現確率として前記大出現確率未満の値である前記第1中出現確率を出力するものであることを特徴とする単語追加装置。 - 請求項1記載の単語追加装置であって、
前記出現確率出力部は、前記第1関係および前記第2関係を満たさないと判定されると、追加単語の単語出現確率として前記第1中出現確率未満の値である小出現確率を出力するものであることを特徴とする単語追加装置。 - 請求項1記載の単語追加装置であって、
更に、前記追加前言語辞書に、追加単語と前記第1出現確率とを対応付けて追加した言語辞書と、評価音声データベースを用いて、前記追加単語の第1正解値を求め、
前記追加前言語辞書に、追加単語と前記第2出現確率とを対応付けて追加した言語辞書と、評価音声データベースを用いて、前記追加単語の第2正解値を求める正解値計算部と、を具備し、
前記判定部は、前記第1正解値および前記第2正解値を用いて、前記追加単語の単語出現確率が下がると、音声認識処理において前記追加単語の正解が生じない傾向にある(以下、「第3関係を満たす」という。)か否かを判定するものであり、
前記出現確率出力部は、前記第1関係および前記第2関係を満たさず、前記第3関係を満たすと判定されると、追加単語の単語出現確率として前記大出現確率未満の値である第2中出現確率を出力するものであることを特徴とする単語追加装置。 - 請求項3記載の単語追加装置であって、
前記出現確率出力部は、前記第1関係、前記第2関係、前記第3関係を全て満たさないと判定されると、追加単語の単語出現確率として前記第2中出現確率未満の値である小出現確率を出力するものであることを特徴とする単語追加装置。 - 追加前言語辞書に追加単語と当該追加単語の第1出現確率とを対応付けて追加した言語辞書と、評価音声データベースとを用いて、前記追加単語の第1誤り値を求める誤り値計算部と、
前記第1誤り値を用いて、音声認識処理において前記追加単語の湧き出し誤りが生じない傾向にある(以下、「第1関係を満たす」という。)か否かを判定する判定部と、
前記第1関係を満たすと判定されると、前記追加単語の単語出現確率として、第2中出現確率より大きい値である大出現確率を出力する出現確率出力部と、
前記追加単語と前記単語出現確率とを対応付けて前記追加前言語辞書に追加した言語辞書を出力する言語辞書出力部と、
前記追加前言語辞書に、追加単語と前記第1出現確率とを対応付けて追加した言語辞書と、評価音声データベースを用いて、前記追加単語の第1正解値を求め、
追加前言語辞書に、追加単語と第1出現確率未満である第2出現確率とを対応付けて追加した言語辞書と、評価音声データベースを用いて、前記追加単語の第2正解値を求める正解値計算部と、を備え、
前記判定部は、前記第1正解値および前記第2正解値を用いて、前記追加単語の出現確率が下がると、音声認識処理において前記追加単語の正解が生じない傾向にある(以下、「第3関係を満たす」という。)か否かを判定するものであり、
前記出現確率出力部は、前記第1関係を満たさず、前記第3関係を満たすと判定されると、前記追加単語の単語出現確率として、前記大出現確率未満の値である前記第2中出現確率を出力するものであることを特徴とする単語追加装置。 - 請求項5記載の単語追加装置であって、
前記誤り値計算部は、前記第3関係を満たさないと判定されると、前記追加前言語辞書に前記追加単語と前記第2出現確率とを対応付けて追加した言語辞書と、前記評価音声データベースとを用いて、第2誤り値を求めるものであり、
前記判定部は、前記第1誤り値および前記第2誤り値を用いて、前記追加単語の出現確率が下がると、音声認識処理において前記追加単語の湧き出し誤りが生じない傾向にある(以下、「第2関係を満たす」という。)か否かを判定するものであり、
前記出現確率出力部は、前記第1関係および前記第3関係を満たさず、前記第2関係を満たすと判定されると、前記追加単語の単語出現確率として、前記大出現確率未満の値である第1中出現確率を出力するものであることを特徴とする単語追加装置。 - 請求項6記載の単語追加装置であって、
前記出現確率出力部は、前記第1関係、前記第2関係、前記第3関係を全て満たさないと判定されると、前記追加単語の単語出現確率として、前記第2中出現確率未満の値である小出現確率を出力するものであることを特徴とする単語追加装置。 - 追加前言語辞書に追加単語と当該追加単語の第1出現確率とを対応付けて追加した言語辞書と、評価音声データベースとを用いて、前記追加単語の第1誤り値を求める過程と、
前記第1誤り値を用いて、音声認識処理において前記追加単語の湧き出し誤りが生じない傾向にある(以下、「第1関係を満たす」という。)か否かを判定する過程と、
前記第1関係を満たすと判定されると、前記追加単語の単語出現確率として、第1中出現確率より大きい値である大出現確率を出力する過程と、
前記第1関係を満たさないと判定されると、前記追加前言語辞書に前記追加単語と前記第1出現確率未満である第2出現確率とを対応付けて追加した言語辞書と、前記評価音声データベースとを用いて、第2誤り値を求める過程と、
前記第1誤り値および前記第2誤り値を用いて、前記追加単語の単語出現確率が下がると、音声認識処理において前記追加単語の湧き出し誤りが生じない傾向にある(以下、「第2関係を満たす」という。)か否かを判定する過程と、
前記第1関係を満たさず、前記第2関係を満たすと判定されると、追加単語の単語出現確率として前記大出現確率未満の値である前記第1中出現確率を出力する過程と、
前記追加単語と前記単語出現確率とを対応付けて前記追加前言語辞書に追加した言語辞書を出力する過程と、を有する単語追加方法。 - 追加前言語辞書に追加単語と当該追加単語の第1出現確率とを対応付けて追加した言語辞書と、評価音声データベースとを用いて、前記追加単語の第1誤り値を求める過程と、
前記第1誤り値を用いて、音声認識処理において前記追加単語の湧き出し誤りが生じない傾向にある(以下、「第1関係を満たす」という。)か否かを判定する過程と、
前記第1関係を満たすと判定されると、前記追加単語の単語出現確率として、第2中出現確率より大きい値である大出現確率を出力する過程と、
前記追加前言語辞書に、追加単語と前記第1出現確率とを対応付けて追加した言語辞書と、評価音声データベースを用いて、前記追加単語の第1正解値を求める過程と、
追加前言語辞書に、追加単語と第1出現確率未満である第2出現確率とを対応付けて追加した言語辞書と、評価音声データベースを用いて、前記追加単語の第2正解値を求める過程と、
前記第1正解値および前記第2正解値を用いて、前記追加単語の出現確率が下がると、音声認識処理において前記追加単語の正解が生じない傾向にある(以下、「第3関係を満たす」という。)か否かを判定する過程と、
前記第1関係を満たさず、前記第3関係を満たすと判定されると、前記追加単語の単語出現確率として、前記大出現確率未満の値である前記第2中出現確率を出力する過程と、
前記追加単語と前記単語出現確率とを対応付けて前記追加前言語辞書に追加した言語辞書を出力する過程と、を有する単語追加方法。 - 請求項1〜7何れかに記載の単語追加装置としてコンピュータを動作させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008124295A JP4897737B2 (ja) | 2008-05-12 | 2008-05-12 | 単語追加装置、単語追加方法、そのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008124295A JP4897737B2 (ja) | 2008-05-12 | 2008-05-12 | 単語追加装置、単語追加方法、そのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009271465A JP2009271465A (ja) | 2009-11-19 |
JP4897737B2 true JP4897737B2 (ja) | 2012-03-14 |
Family
ID=41438042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008124295A Active JP4897737B2 (ja) | 2008-05-12 | 2008-05-12 | 単語追加装置、単語追加方法、そのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4897737B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5480844B2 (ja) * | 2011-05-16 | 2014-04-23 | 日本電信電話株式会社 | 単語追加装置、単語追加方法及びそのプログラム |
JP5713963B2 (ja) * | 2012-06-18 | 2015-05-07 | 日本電信電話株式会社 | 音声認識単語追加装置とその方法とプログラム |
JP6276516B2 (ja) * | 2013-05-08 | 2018-02-07 | 日本放送協会 | 辞書作成装置、及び辞書作成プログラム |
US10140983B2 (en) | 2015-08-28 | 2018-11-27 | International Business Machines Corporation | Building of n-gram language model for automatic speech recognition (ASR) |
US20220277731A1 (en) * | 2019-08-06 | 2022-09-01 | Ntt Docomo, Inc. | Word weight calculation system |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3907880B2 (ja) * | 1999-09-22 | 2007-04-18 | 日本放送協会 | 連続音声認識装置および記録媒体 |
JP4089861B2 (ja) * | 2001-01-31 | 2008-05-28 | 三菱電機株式会社 | 音声認識文章入力装置 |
JP2003186494A (ja) * | 2001-12-17 | 2003-07-04 | Sony Corp | 音声認識装置および方法、記録媒体、並びにプログラム |
JP4528540B2 (ja) * | 2004-03-03 | 2010-08-18 | 日本電信電話株式会社 | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 |
JP4554272B2 (ja) * | 2004-05-25 | 2010-09-29 | 三菱電機株式会社 | 音声対話装置 |
JP4245530B2 (ja) * | 2004-08-19 | 2009-03-25 | 三菱電機株式会社 | 言語モデル作成装置及び方法並びにプログラム |
US8719021B2 (en) * | 2006-02-23 | 2014-05-06 | Nec Corporation | Speech recognition dictionary compilation assisting system, speech recognition dictionary compilation assisting method and speech recognition dictionary compilation assisting program |
CN101454826A (zh) * | 2006-05-31 | 2009-06-10 | 日本电气株式会社 | 语音识别词典/语言模型制作系统、方法、程序,以及语音识别系统 |
US20090313017A1 (en) * | 2006-07-07 | 2009-12-17 | Satoshi Nakazawa | Language model update device, language Model update method, and language model update program |
-
2008
- 2008-05-12 JP JP2008124295A patent/JP4897737B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009271465A (ja) | 2009-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10957312B2 (en) | Scalable dynamic class language modeling | |
US20170140754A1 (en) | Dialogue apparatus and method | |
TWI455111B (zh) | 使用聲音資料之用於字素至音素轉換的方法、電腦系統,及與其相關的電腦可讀取媒體 | |
US20030195739A1 (en) | Grammar update system and method | |
US10410622B2 (en) | Systems and methods for automatic repair of speech recognition engine output using a sliding window mechanism | |
WO2019065263A1 (ja) | 発音誤り検出装置、発音誤り検出方法、プログラム | |
JP4897737B2 (ja) | 単語追加装置、単語追加方法、そのプログラム | |
JPWO2008004666A1 (ja) | 音声認識装置、音声認識方法、および音声認識用プログラム | |
US20080281598A1 (en) | Method and system for prompt construction for selection from a list of acoustically confusable items in spoken dialog systems | |
JP6738436B2 (ja) | 音声認識結果リランキング装置、音声認識結果リランキング方法、プログラム | |
WO2019156101A1 (ja) | 音声認識精度劣化要因推定装置、音声認識精度劣化要因推定方法、プログラム | |
JP4594885B2 (ja) | 音響モデル適応装置、音響モデル適応方法、音響モデル適応プログラム及び記録媒体 | |
JP5713963B2 (ja) | 音声認識単語追加装置とその方法とプログラム | |
KR20060044753A (ko) | 삭제된 보간 n-그램 언어 모델의 arpa 표준 형식 표현 | |
JP5376341B2 (ja) | モデル適応装置、その方法及びそのプログラム | |
JPWO2019107170A1 (ja) | 緊急度推定装置、緊急度推定方法、プログラム | |
JP5290218B2 (ja) | 文書平易化装置および平易化規則テーブル作成装置、ならびにプログラム | |
JP5852550B2 (ja) | 音響モデル生成装置とその方法とプログラム | |
JP5986883B2 (ja) | 言語モデル評価方法とその装置とプログラム | |
JP6549064B2 (ja) | 音声認識装置、音声認識方法、プログラム | |
JP2009075249A (ja) | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム | |
JP5982265B2 (ja) | 音声認識装置、音声認識方法、およびプログラム | |
JP5089651B2 (ja) | 音声認識装置及び音響モデル作成装置とそれらの方法と、プログラムと記録媒体 | |
JP2014102345A (ja) | 音響モデル学習用テキスト作成装置とその方法とプログラム | |
JP5762365B2 (ja) | 音声認識装置、音声認識方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100514 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110720 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111213 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111222 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4897737 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150106 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |