JPH03179498A - 音声日本語変換方式 - Google Patents
音声日本語変換方式Info
- Publication number
- JPH03179498A JPH03179498A JP1319867A JP31986789A JPH03179498A JP H03179498 A JPH03179498 A JP H03179498A JP 1319867 A JP1319867 A JP 1319867A JP 31986789 A JP31986789 A JP 31986789A JP H03179498 A JPH03179498 A JP H03179498A
- Authority
- JP
- Japan
- Prior art keywords
- word
- composite
- candidates
- candidate
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 10
- 150000001875 compounds Chemical class 0.000 claims description 62
- 238000011156 evaluation Methods 0.000 claims description 16
- 238000000034 method Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 abstract description 7
- 239000000284 extract Substances 0.000 abstract description 4
- 239000002131 composite material Substances 0.000 abstract 12
- 239000000470 constituent Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
「産業上の利用分野」
この発明は単語、単音節などの音声認識用標準パタンを
用いて、入力音声中の単語、単音節などの認識を行い、
この認識結果を、単語辞書、活用語尾テーブル及び付属
語辞書を用いて日本語に変換する日本語変換方式に関す
る。
用いて、入力音声中の単語、単音節などの認識を行い、
この認識結果を、単語辞書、活用語尾テーブル及び付属
語辞書を用いて日本語に変換する日本語変換方式に関す
る。
「従来の技術」
音声認識を利用した日本語入力方式、つまり音声日本語
変換方式の多くは、文節の単位として複合語を含まない
方式が一般的である。この場合利用者は複合語を構成す
る各単語を1つの文節として区切って発声するか、その
各単語ごとに文節境界をキー人力する必要があり、利用
者は複合語をどの様に単語に分割するかを判断せねばな
らない。
変換方式の多くは、文節の単位として複合語を含まない
方式が一般的である。この場合利用者は複合語を構成す
る各単語を1つの文節として区切って発声するか、その
各単語ごとに文節境界をキー人力する必要があり、利用
者は複合語をどの様に単語に分割するかを判断せねばな
らない。
これは、利用者にとってかなりの負担となり、単語とは
どのようなものかを知っていなければならない。しかし
、一般の利用者に複合語を正しく単語に分割させること
はほとんど不可能である。このため、単語分割の間違い
から日本語変換率の低下をまねくこととなる。また、利
用者が複合語を単語に分割して人力することを回避する
ため、利用者は複合語を区切らずに発声して人力し、装
置側で複合語を処理する場合は、複合語を構成すること
ができる単語の品詞を制限する程度しか行なわれておら
ず、単語候補を組み合わせた複合語の候補が多く生成さ
れ、日本語変換性能が低い。
どのようなものかを知っていなければならない。しかし
、一般の利用者に複合語を正しく単語に分割させること
はほとんど不可能である。このため、単語分割の間違い
から日本語変換率の低下をまねくこととなる。また、利
用者が複合語を単語に分割して人力することを回避する
ため、利用者は複合語を区切らずに発声して人力し、装
置側で複合語を処理する場合は、複合語を構成すること
ができる単語の品詞を制限する程度しか行なわれておら
ず、単語候補を組み合わせた複合語の候補が多く生成さ
れ、日本語変換性能が低い。
「課題を解決するための手段」
この発明はこれらの欠点を解決するために、人力する文
章の分野が限定された場合に利用者が使用する複合語も
限定されることを利用して、あらかしめ人力する分野の
文書を形態素解析するなどして単語分割し、複合語を構
成する単語のバタンを抽出し、複合語を構成する単語の
系列を記述した複合語パタンテーブルを設け、この複合
語パタンテーブルを用いて、認識結果を単語の候補に変
換した結果得られた複数の連続した単語候補の系列から
なる複合語の候補がその複合語パタンテーブルに登録さ
れているか否かを調べ、登録されている場合はその複合
語候補の評価値を、その複合語候補に含まれている単語
候補の評価値から央まる評価値より高くする。このよう
にして日本語変換性能を高める。
章の分野が限定された場合に利用者が使用する複合語も
限定されることを利用して、あらかしめ人力する分野の
文書を形態素解析するなどして単語分割し、複合語を構
成する単語のバタンを抽出し、複合語を構成する単語の
系列を記述した複合語パタンテーブルを設け、この複合
語パタンテーブルを用いて、認識結果を単語の候補に変
換した結果得られた複数の連続した単語候補の系列から
なる複合語の候補がその複合語パタンテーブルに登録さ
れているか否かを調べ、登録されている場合はその複合
語候補の評価値を、その複合語候補に含まれている単語
候補の評価値から央まる評価値より高くする。このよう
にして日本語変換性能を高める。
「実施例」
この発明の実施例を第1図に示す。音声人力部1から利
用者により人力された人力音声と、標準バタンM積部2
にあらかしめ蓄えられている単音節および単語の標準バ
タンとのマツチングを音声認識部3で行い、人力音声の
単音節、単語の認識を行ない、その認識結果は単語辞書
照合部4に送られる。単語辞書照合部4では、人力され
た認識結果と単語辞書5とを照合し、単語候補および複
数の連続した単語候補の系列からなる複合語の候補を抽
出する。その複合語候補については、複合語バタン処理
部6において複合語パタンテーブル7に登録されている
か否かを調べ、登録されている場合はその複合語候補の
評価値を、その複合語候補に含まれる各単語候補の各評
価値の和よりもαだけ高い値する。この場合複合語にな
り得る確度、例えば使用頻度情報が高い程、αの値を太
きくし、複合語候補が複合語パタンテーブル7にない場
合は、複合語候補の評価値を、その複合語候補に含まれ
ている各単語候補の評価値から決る値よりもβだけ下げ
る。認識候補がまだ残っているときには、文法処理部8
で活用語尾テーブル9および付属語辞書10を用いて文
法的に正しい文節候補のみを残す。文節候補選択部11
で最終的に残った文節候補の内、評価値が高いものから
順に数個を残して蓄積し、最も評価値の高かった文節候
補を表示及び確認修正部12で日本語変換候補として画
面に表示し、利用者が6I ra して正しくない場合
は残りの文節候補の中から正しいものを選択する。
用者により人力された人力音声と、標準バタンM積部2
にあらかしめ蓄えられている単音節および単語の標準バ
タンとのマツチングを音声認識部3で行い、人力音声の
単音節、単語の認識を行ない、その認識結果は単語辞書
照合部4に送られる。単語辞書照合部4では、人力され
た認識結果と単語辞書5とを照合し、単語候補および複
数の連続した単語候補の系列からなる複合語の候補を抽
出する。その複合語候補については、複合語バタン処理
部6において複合語パタンテーブル7に登録されている
か否かを調べ、登録されている場合はその複合語候補の
評価値を、その複合語候補に含まれる各単語候補の各評
価値の和よりもαだけ高い値する。この場合複合語にな
り得る確度、例えば使用頻度情報が高い程、αの値を太
きくし、複合語候補が複合語パタンテーブル7にない場
合は、複合語候補の評価値を、その複合語候補に含まれ
ている各単語候補の評価値から決る値よりもβだけ下げ
る。認識候補がまだ残っているときには、文法処理部8
で活用語尾テーブル9および付属語辞書10を用いて文
法的に正しい文節候補のみを残す。文節候補選択部11
で最終的に残った文節候補の内、評価値が高いものから
順に数個を残して蓄積し、最も評価値の高かった文節候
補を表示及び確認修正部12で日本語変換候補として画
面に表示し、利用者が6I ra して正しくない場合
は残りの文節候補の中から正しいものを選択する。
第2図に複合語パタンテーブルの作成法を示す。
あらかじめ用意した該当する分野の文書データを解析し
、複合語を抽出する。各複合語はその複合語を構成する
単語に分解する。各単語は単語辞書5のアドレスもしく
は意味カテゴリ番号が付与されであるので、これにより
各複合語をその構成単語系列、つまり複合語バタンを記
述する。抽出した複合語は構成する単語の系列を単語辞
書5のアドレスもしくは意味的なカテゴリ番号を用いて
第3図のようにその使用頻度情報と共にテーブル化する
。第3図の例では1複合語の最大構成単語数が8の場合
である。第4図は複合語バタン処理の例である。同図A
の音声認識結果で音節候補の組合せを作威し、単語辞書
と照合し、単語の候補を抽出する。1つの単語候補を抽
出すると、単語辞書との照合開始位置をその前の単語音
節候補組合せの終端位置の1つ次の位置にずらして再び
1ffl識結果と単語辞書を照合する。このようにして
抽出された同図Bの複合語の候補と第3図の複合語パタ
ンテーブルを照合し、使用頻度の高い複合語の候補はそ
の複合語の構成単語候補の評価値で決る評価値(和の(
l!りより大きく高い評価値とし、複合語パターンテー
ブルに無い複合語の候補の評価値はその複合語の構成単
語候補の評価値で決る評価値より低くする。この結果、
同図Cに示すように入力した複合語を高精度に得ること
が可能となる。なお前記αは一定値でもよい。
、複合語を抽出する。各複合語はその複合語を構成する
単語に分解する。各単語は単語辞書5のアドレスもしく
は意味カテゴリ番号が付与されであるので、これにより
各複合語をその構成単語系列、つまり複合語バタンを記
述する。抽出した複合語は構成する単語の系列を単語辞
書5のアドレスもしくは意味的なカテゴリ番号を用いて
第3図のようにその使用頻度情報と共にテーブル化する
。第3図の例では1複合語の最大構成単語数が8の場合
である。第4図は複合語バタン処理の例である。同図A
の音声認識結果で音節候補の組合せを作威し、単語辞書
と照合し、単語の候補を抽出する。1つの単語候補を抽
出すると、単語辞書との照合開始位置をその前の単語音
節候補組合せの終端位置の1つ次の位置にずらして再び
1ffl識結果と単語辞書を照合する。このようにして
抽出された同図Bの複合語の候補と第3図の複合語パタ
ンテーブルを照合し、使用頻度の高い複合語の候補はそ
の複合語の構成単語候補の評価値で決る評価値(和の(
l!りより大きく高い評価値とし、複合語パターンテー
ブルに無い複合語の候補の評価値はその複合語の構成単
語候補の評価値で決る評価値より低くする。この結果、
同図Cに示すように入力した複合語を高精度に得ること
が可能となる。なお前記αは一定値でもよい。
この場合は複合語パターンテーブルに使用頻度情報を記
憶しておかなくてもよい。
憶しておかなくてもよい。
「発明の効果」
以上説明したように、この発明においては利用者が複合
語を単語に分割する必要がなく、複合語をそのまま人力
しても高精度に日本語変換することが可能となる。
語を単語に分割する必要がなく、複合語をそのまま人力
しても高精度に日本語変換することが可能となる。
第1図はこの発明の実施例を示すブロック図、第2図は
複合語パタンテーブルの作成法の一例で、文章から複合
語を抽出し、複合語を単語に分割し、各単語の単語辞書
5のアドレスもしくは意味カテゴリ番号を複合語テーブ
ルに登録し、使用頻度情報も加える例を示す図、第3図
は複合語パタンテーブルの例を示す図、第4図は複合語
バタン処理の例で、Aは音声認識結果、Bは単語辞書照
合結果得られた複合語の候補、Cは複合語処理を行った
結果目的の複合語が得られた例を示す図である。
複合語パタンテーブルの作成法の一例で、文章から複合
語を抽出し、複合語を単語に分割し、各単語の単語辞書
5のアドレスもしくは意味カテゴリ番号を複合語テーブ
ルに登録し、使用頻度情報も加える例を示す図、第3図
は複合語パタンテーブルの例を示す図、第4図は複合語
バタン処理の例で、Aは音声認識結果、Bは単語辞書照
合結果得られた複合語の候補、Cは複合語処理を行った
結果目的の複合語が得られた例を示す図である。
Claims (1)
- (1)単語、単音節などの音声認識用標準パタンを用い
て入力音声中の単語、単音節などの認識を行い、この認
識結果を、単語辞書、活用語尾テーブル及び付属語辞書
を用いて日本語に変換する日本語変換方式において、 複合語を構成する単語の系列を記述した複合語パタンテ
ーブルを設け、 上記認識結果と上記単語辞書とを照合して得られた複数
の連続した単語候補の系列からなる複合語の候補が上記
複合語パタンテーブルに登録されているか否かを調べ、 その複合語の候補が上記複合語パタンテーブルに登録さ
れている場合は、その複合語候補の評価値を、その複合
語候補に含まれている単語候補の各評価値から決まる評
価値より高くすることを特徴とする音声日本語変換方式
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1319867A JPH03179498A (ja) | 1989-12-08 | 1989-12-08 | 音声日本語変換方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1319867A JPH03179498A (ja) | 1989-12-08 | 1989-12-08 | 音声日本語変換方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03179498A true JPH03179498A (ja) | 1991-08-05 |
Family
ID=18115121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1319867A Pending JPH03179498A (ja) | 1989-12-08 | 1989-12-08 | 音声日本語変換方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03179498A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07507880A (ja) * | 1992-03-06 | 1995-08-31 | ドラゴン システムズ インコーポレイテッド | 複合ワードを有する言語のための音声認識装置 |
JPH1097286A (ja) * | 1996-08-02 | 1998-04-14 | Fujitsu Ltd | 単語・連語分類処理方法、連語抽出方法、単語・連語分類処理装置、音声認識装置、機械翻訳装置、連語抽出装置及び単語・連語記憶媒体 |
JP2013254055A (ja) * | 2012-06-06 | 2013-12-19 | Nippon Telegr & Teleph Corp <Ntt> | 用件区間抽出用特徴的単語学習装置と用件区間抽出装置とそれらの方法とプログラム |
-
1989
- 1989-12-08 JP JP1319867A patent/JPH03179498A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07507880A (ja) * | 1992-03-06 | 1995-08-31 | ドラゴン システムズ インコーポレイテッド | 複合ワードを有する言語のための音声認識装置 |
JPH1097286A (ja) * | 1996-08-02 | 1998-04-14 | Fujitsu Ltd | 単語・連語分類処理方法、連語抽出方法、単語・連語分類処理装置、音声認識装置、機械翻訳装置、連語抽出装置及び単語・連語記憶媒体 |
JP2013254055A (ja) * | 2012-06-06 | 2013-12-19 | Nippon Telegr & Teleph Corp <Ntt> | 用件区間抽出用特徴的単語学習装置と用件区間抽出装置とそれらの方法とプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Marchand et al. | A multistrategy approach to improving pronunciation by analogy | |
US6108627A (en) | Automatic transcription tool | |
US7937263B2 (en) | System and method for tokenization of text using classifier models | |
IL109268A (en) | Method and system for image recognition | |
US4769844A (en) | Voice recognition system having a check scheme for registration of reference data | |
EP0108609B1 (en) | Method and apparatus for the phonetic recognition of words | |
JPH03179498A (ja) | 音声日本語変換方式 | |
JPH1097285A (ja) | 音声認識装置 | |
Akinwonmi | Development of a prosodic read speech syllabic corpus of the Yoruba language | |
JP2820093B2 (ja) | 単音節認識装置 | |
JP3240691B2 (ja) | 音声認識方法 | |
JP2002189490A (ja) | ピンイン音声入力の方法 | |
JPS62251986A (ja) | 誤読文字訂正処理装置 | |
JP3128251B2 (ja) | 音声認識装置 | |
JPH03116100A (ja) | 大語彙音声認識装置 | |
JP2615643B2 (ja) | 単語音声認識装置 | |
JP3001334B2 (ja) | 認識用言語処理装置 | |
KR100931786B1 (ko) | 한국어 철자 발화에 따른 음성인식 방법 | |
JP2660998B2 (ja) | 日本語処理装置 | |
JPH0222730A (ja) | 音声入力による文書作成装置 | |
JP3123181B2 (ja) | 文字認識装置 | |
JPS62121570A (ja) | 接続確率に基づく連文節変換処理方式 | |
JPS61121167A (ja) | 区切り発声に基づく音声ワ−ドプロセツサ | |
JPH0473694A (ja) | 日本語音声認識方法 | |
JPH0632021B2 (ja) | 日本語音声認識装置 |