JPH0758499B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH0758499B2 JPH0758499B2 JP62223154A JP22315487A JPH0758499B2 JP H0758499 B2 JPH0758499 B2 JP H0758499B2 JP 62223154 A JP62223154 A JP 62223154A JP 22315487 A JP22315487 A JP 22315487A JP H0758499 B2 JPH0758499 B2 JP H0758499B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- character
- characters
- same
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000000470 constituent Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 3
- 244000201986 Cassia tora Species 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- NCAIGTHBQTXTLR-UHFFFAOYSA-N phentermine hydrochloride Chemical compound [Cl-].CC(C)([NH3+])CC1=CC=CC=C1 NCAIGTHBQTXTLR-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字認識装置に関し、特に文字単位の認識
後、単語単位に認識を行う文字認識装置に関するもので
ある。
後、単語単位に認識を行う文字認識装置に関するもので
ある。
(従来の技術) 従来、この種の文字認識装置では、例えば電気学会編
「電子計算機入力のための文字図形の自動認識」P251〜
252に開示されており、住所、姓、名、商品名や文章な
どを認識対象として次のように認識処理が行われる。ま
ず、帳票上を走査して得られた入力文字パタン(イメー
ジパタン)を文字単位に切出して文字の認識を行う。こ
の認識の結果、複数の候補文字が得られ、一意に決定で
きなかった場合、前後の文字又は単語を単位として、候
補文字を組合せて得られた複数の候補単語について、あ
らかじめ用意した単語辞書と照合し、候補単語のうち単
語辞書に存在する単語の名称又は単語を構成する文字名
を認識結果として出力する。
「電子計算機入力のための文字図形の自動認識」P251〜
252に開示されており、住所、姓、名、商品名や文章な
どを認識対象として次のように認識処理が行われる。ま
ず、帳票上を走査して得られた入力文字パタン(イメー
ジパタン)を文字単位に切出して文字の認識を行う。こ
の認識の結果、複数の候補文字が得られ、一意に決定で
きなかった場合、前後の文字又は単語を単位として、候
補文字を組合せて得られた複数の候補単語について、あ
らかじめ用意した単語辞書と照合し、候補単語のうち単
語辞書に存在する単語の名称又は単語を構成する文字名
を認識結果として出力する。
(発明が解決しようとする問題点) しかしながら、前記従来の文字認識装置では、例えば、
地名において などのように同じ地名を示し、読みが同じで、・印を付
した文字だけが異なる複数の単語が書き手によって区別
されずに使用される例が多く、単語辞書には同じ意味の
複数の単語を全て登録する必要があり、そのため単語辞
書の増大ひいては処理時間の増大を招くという問題点が
あった。
地名において などのように同じ地名を示し、読みが同じで、・印を付
した文字だけが異なる複数の単語が書き手によって区別
されずに使用される例が多く、単語辞書には同じ意味の
複数の単語を全て登録する必要があり、そのため単語辞
書の増大ひいては処理時間の増大を招くという問題点が
あった。
本発明は前記問題点を解決し、簡単で処理速度の速い文
字認識装置を提供することを目的とする。
字認識装置を提供することを目的とする。
(問題点を解決するための手段) 本発明は前記問題点を解決するために、帳票上を走査し
て得られるイメージパタンを文字単位に切出して文字の
認識を行う第1の認識部と、該認識結果の候補文字を単
語単位に組立てた候補単語と単語辞書内の単語とを照合
して単語の認識を行う第2の認識部とを備えた文字認識
装置において、構成文字のうち1部の文字のみが同音同
意文字で異なる同音同意の単語については当該同音同意
文字を特殊文字で置き換えた代表単語を前記単語辞書に
予め格納すると共に、前記特殊文字をアドレスとした同
音同意文字のテーブルを設けたものである。
て得られるイメージパタンを文字単位に切出して文字の
認識を行う第1の認識部と、該認識結果の候補文字を単
語単位に組立てた候補単語と単語辞書内の単語とを照合
して単語の認識を行う第2の認識部とを備えた文字認識
装置において、構成文字のうち1部の文字のみが同音同
意文字で異なる同音同意の単語については当該同音同意
文字を特殊文字で置き換えた代表単語を前記単語辞書に
予め格納すると共に、前記特殊文字をアドレスとした同
音同意文字のテーブルを設けたものである。
好ましい実施態様では、前記第2の認識部は、代表単語
との照合の際に、当該同音同意の候補単語の同音同意文
字をマスクして照合し、一致した場合には前記テーブル
を参照して得られる同音同意文字を代表単語の特殊文字
と順次置き換えて照合するものである。
との照合の際に、当該同音同意の候補単語の同音同意文
字をマスクして照合し、一致した場合には前記テーブル
を参照して得られる同音同意文字を代表単語の特殊文字
と順次置き換えて照合するものである。
(作用) 本発明によれば以上のように文字認識装置を構成したの
で技術的手段は次のように作用する。第2の認識部(例
えば後述する単語照合部)は、第1の認識部からの候補
文字を組立てた候補単語と単語辞書内の単語との照合の
際に、その単語が代表単語の場合には、例えば候補単語
としての同音同意の単語を構成する文字のうち同音同意
文字をマスクして照合するように働く。この結果、一致
する場合には、第2の認識部は、代表単語が示す特殊文
字に対応するテーブルを参照し、この結果得られる同音
同意文字を代表単語の特殊文字と順次置き換えた単語に
対し、当該同音同意の候補単語を照合するように働く。
この照合の結果、一致する場合には、第2の認識部は一
致した単語を構成する文字名(例えば文字コード)を認
識結果として順次出力する。従って、同音同意の複数の
単語は個別に登録せずに1つの代表単語を単語辞書に登
録すればよく、また意味の異なる単語に対しても同音同
意文字を共有できるので、単語辞書として必要な単語数
を少なくできると共に、認識のための処理時間を短かく
できる。
で技術的手段は次のように作用する。第2の認識部(例
えば後述する単語照合部)は、第1の認識部からの候補
文字を組立てた候補単語と単語辞書内の単語との照合の
際に、その単語が代表単語の場合には、例えば候補単語
としての同音同意の単語を構成する文字のうち同音同意
文字をマスクして照合するように働く。この結果、一致
する場合には、第2の認識部は、代表単語が示す特殊文
字に対応するテーブルを参照し、この結果得られる同音
同意文字を代表単語の特殊文字と順次置き換えた単語に
対し、当該同音同意の候補単語を照合するように働く。
この照合の結果、一致する場合には、第2の認識部は一
致した単語を構成する文字名(例えば文字コード)を認
識結果として順次出力する。従って、同音同意の複数の
単語は個別に登録せずに1つの代表単語を単語辞書に登
録すればよく、また意味の異なる単語に対しても同音同
意文字を共有できるので、単語辞書として必要な単語数
を少なくできると共に、認識のための処理時間を短かく
できる。
(実施例) 第1図は本発明の一実施例を示す文字認識装置の構成図
である。本実施例の文字認識装置は文字認識部1,単語照
合部2,単語辞書3及び同音同意文字テーブル4から構成
される。
である。本実施例の文字認識装置は文字認識部1,単語照
合部2,単語辞書3及び同音同意文字テーブル4から構成
される。
第2図(a),(b)は、それぞれ単語辞書3、同音同
意文字テーブル4(即ちいずれもメモリ)のフォーマッ
ト例を示すものであり、第3図は入力文字パタン例に対
する候補文字例を示すものである。
意文字テーブル4(即ちいずれもメモリ)のフォーマッ
ト例を示すものであり、第3図は入力文字パタン例に対
する候補文字例を示すものである。
次に、第2図及び第3図を参照して本実施例の動作を説
明する。
明する。
まず、帳票面上を走査したときの反射光である光信号が
文字認識部1に入力されて光電変換される。この結果得
られた入力文字パタン(イメージパタン)を1文字単位
に切出し、切出したパタンに対し認識処理を行って得ら
れた候補文字名を単語照合部2に出力する。単語照合部
2では、文字認識部1より得られた候補文字名を単語単
位に区切り、かつ1文字につき候補文字名が複数の場合
は、それらを組み合わせて複数の候補単語を組み立て、
それら候補単語と単語辞書3に格納されている単語との
照合を同音同意文字テーブル4を参照して行う。単語辞
書3にはあらかじめ認識対象とする単語が登録されてい
る。また のような同音同意単語については・印を付した同音同意
文字を特殊文字に置き換え、1つの単語(即ち、代表単
語)として登録されている。第2図(a)の単語辞書の
例では「の」,「ノ」等は「(A)」に置き換えて登録
されている。同音同意文字テーブル4には単語辞書3内
の同音同意単語に与えた特殊文字に対応した実際の文字
(・印を付した同音同意文字)が格納されている。第2
図(b)の例では、例えば第2図(a)の特殊文字
(A)に対応して「の」「ノ」「之」「乃」が格納され
ている。
文字認識部1に入力されて光電変換される。この結果得
られた入力文字パタン(イメージパタン)を1文字単位
に切出し、切出したパタンに対し認識処理を行って得ら
れた候補文字名を単語照合部2に出力する。単語照合部
2では、文字認識部1より得られた候補文字名を単語単
位に区切り、かつ1文字につき候補文字名が複数の場合
は、それらを組み合わせて複数の候補単語を組み立て、
それら候補単語と単語辞書3に格納されている単語との
照合を同音同意文字テーブル4を参照して行う。単語辞
書3にはあらかじめ認識対象とする単語が登録されてい
る。また のような同音同意単語については・印を付した同音同意
文字を特殊文字に置き換え、1つの単語(即ち、代表単
語)として登録されている。第2図(a)の単語辞書の
例では「の」,「ノ」等は「(A)」に置き換えて登録
されている。同音同意文字テーブル4には単語辞書3内
の同音同意単語に与えた特殊文字に対応した実際の文字
(・印を付した同音同意文字)が格納されている。第2
図(b)の例では、例えば第2図(a)の特殊文字
(A)に対応して「の」「ノ」「之」「乃」が格納され
ている。
単語照合部2の動作を第3図の入力文字パタン「虎ノ
門」について述べる。この場合「門」の候補文字が複数
存在するので、それらを組合せた「虎ノ門」及び「虎ノ
問」が候補単語となる。次に前記候補単語が単語辞書3
内に存在するか調べる。候補単語と単語辞書3内の単語
が一致した場合には、当該単語を構成する文字名を例え
ば文字コードとして出力する。また、第3図の入力文字
パタン例のように、同音同意文字があてはまることを示
す特殊文字以外の文字が一致した場合は、その特殊文字
に対応する同音同意文字を同音同意文字テーブル4から
取り出し、単語辞書3内の当該単語の該特殊文字と置き
換えて、さらにその単語と候補単語との照合を行う。こ
の照合によって一致する単語が存在するとき、当該単語
を構成する文字名を文字コードで出力する。第3図の例
では、候補単語「虎ノ問」は単語辞書3に存在しない
が、候補単語「虎ノ門」に対して第2図(a)に示す単
語辞書3内の「虎(A)門」が対応する。さらに第2図
(b)に示す同音同意文字テーブル4内の特殊文字
(A)に対応する欄(即ちアドレス(A))の同音同意
文字を順次取り出し、これを特殊文字(A)と置き換え
て照合すると、同音同意文字「ノ」の場合に、「虎ノ
門」と一致する。よって、入力文字パタン「虎ノ門」は
正しく認識される。
門」について述べる。この場合「門」の候補文字が複数
存在するので、それらを組合せた「虎ノ門」及び「虎ノ
問」が候補単語となる。次に前記候補単語が単語辞書3
内に存在するか調べる。候補単語と単語辞書3内の単語
が一致した場合には、当該単語を構成する文字名を例え
ば文字コードとして出力する。また、第3図の入力文字
パタン例のように、同音同意文字があてはまることを示
す特殊文字以外の文字が一致した場合は、その特殊文字
に対応する同音同意文字を同音同意文字テーブル4から
取り出し、単語辞書3内の当該単語の該特殊文字と置き
換えて、さらにその単語と候補単語との照合を行う。こ
の照合によって一致する単語が存在するとき、当該単語
を構成する文字名を文字コードで出力する。第3図の例
では、候補単語「虎ノ問」は単語辞書3に存在しない
が、候補単語「虎ノ門」に対して第2図(a)に示す単
語辞書3内の「虎(A)門」が対応する。さらに第2図
(b)に示す同音同意文字テーブル4内の特殊文字
(A)に対応する欄(即ちアドレス(A))の同音同意
文字を順次取り出し、これを特殊文字(A)と置き換え
て照合すると、同音同意文字「ノ」の場合に、「虎ノ
門」と一致する。よって、入力文字パタン「虎ノ門」は
正しく認識される。
また入力文字パタン「虎の門」に対する候補単語「虎の
門」が文字認識部1から出力された場合についても同様
の動作で認識することができる。さらに についても、・印を付した文字に対して第2図(b)に
示す同音同意文字テーブル4の(A)欄を対応づけるこ
とにより、単語辞書3には「丸(A)内」を登録するだ
けで良い。
門」が文字認識部1から出力された場合についても同様
の動作で認識することができる。さらに についても、・印を付した文字に対して第2図(b)に
示す同音同意文字テーブル4の(A)欄を対応づけるこ
とにより、単語辞書3には「丸(A)内」を登録するだ
けで良い。
このように本実施例によれば、同音同意文字テーブル4
を用いることにより、単語文字列の一部文字だけが異な
り、読みの同じである単語を個別に登録する必要がなく
なるので単語辞書3を小型にできる。また、 の例のように、・印を付した同音同意文字を意味の異な
る単語間で共有することも可能である。
を用いることにより、単語文字列の一部文字だけが異な
り、読みの同じである単語を個別に登録する必要がなく
なるので単語辞書3を小型にできる。また、 の例のように、・印を付した同音同意文字を意味の異な
る単語間で共有することも可能である。
したがって性能を低下させることなく単語辞書3を小型
化できるので、ハード規模が小さく高速の文字認識装置
が実現できる。
化できるので、ハード規模が小さく高速の文字認識装置
が実現できる。
(発明の効果) 以上詳細に説明したように本発明によれば、同音同意の
単語については代表単語で単語辞書に登録するようにす
ると共に代表単語の示す特殊文字をアドレスとする同音
同意文字のテーブルを設けたので、単語辞書の小型化と
認識処理速度の高速化を図ることができる。
単語については代表単語で単語辞書に登録するようにす
ると共に代表単語の示す特殊文字をアドレスとする同音
同意文字のテーブルを設けたので、単語辞書の小型化と
認識処理速度の高速化を図ることができる。
第1図は本発明の一実施例を示す文字認識装置のブロッ
ク図、第2図(a),(b)はそれぞれ単語辞書、同音
同意文字テーブルのフォーマット例を示す図、第3図は
本実施例の動作説明図である。 1…文字認識部、2…単語照合部、3…単語辞書、4…
同音同意文字テーブル。
ク図、第2図(a),(b)はそれぞれ単語辞書、同音
同意文字テーブルのフォーマット例を示す図、第3図は
本実施例の動作説明図である。 1…文字認識部、2…単語照合部、3…単語辞書、4…
同音同意文字テーブル。
Claims (2)
- 【請求項1】帳票上を走査して得られるイメージパタン
を文字単位に切出して文字の認識を行う第1の認識部
と、該認識結果の候補文字を単語単位に組立てた候補単
語と単語辞書内の単語とを照合して単語の認識を行う第
2の認識部とを備えた文字認識装置において、 構成文字のうち1部の文字のみが同音同意文字で異なる
同音同意の単語については当該同音同意文字を特殊文字
で置き換えた代表単語を前記単語辞書に予め格納すると
共に、前記特殊文字に対応する同音同意文字のテーブル
を設けたことを特徴とする文字認識装置。 - 【請求項2】前記第2の認識部は、代表単語との照合の
際に、当該同音同意の候補単語の同音同意文字をマスク
して照合し、一致した場合には前記テーブルを参照して
得られる同音同意文字を代表単語の特殊文字と順次置き
換えて照合する特許請求の範囲第1項記載の文字認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62223154A JPH0758499B2 (ja) | 1987-09-08 | 1987-09-08 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62223154A JPH0758499B2 (ja) | 1987-09-08 | 1987-09-08 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6466790A JPS6466790A (en) | 1989-03-13 |
JPH0758499B2 true JPH0758499B2 (ja) | 1995-06-21 |
Family
ID=16793637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62223154A Expired - Lifetime JPH0758499B2 (ja) | 1987-09-08 | 1987-09-08 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0758499B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3542902B2 (ja) | 1998-03-13 | 2004-07-14 | セイコープレシジョン株式会社 | El素子 |
US7353173B2 (en) * | 2002-07-11 | 2008-04-01 | Sony Corporation | System and method for Mandarin Chinese speech recognition using an optimized phone set |
US7353172B2 (en) * | 2003-03-24 | 2008-04-01 | Sony Corporation | System and method for cantonese speech recognition using an optimized phone set |
US7353174B2 (en) * | 2003-03-31 | 2008-04-01 | Sony Corporation | System and method for effectively implementing a Mandarin Chinese speech recognition dictionary |
-
1987
- 1987-09-08 JP JP62223154A patent/JPH0758499B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS6466790A (en) | 1989-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0682403B2 (ja) | 光学式文字読取装置 | |
JP2847715B2 (ja) | 文字認識装置及び文字認識方法 | |
JPH0758499B2 (ja) | 文字認識装置 | |
JPH0441388B2 (ja) | ||
JPS63138479A (ja) | 文字認識装置 | |
JP2827066B2 (ja) | 数字列混在文書の文字認識の後処理方法 | |
JP2996823B2 (ja) | 文字認識装置 | |
JP2874199B2 (ja) | 単語辞書照合装置 | |
JPS63268082A (ja) | パタ−ン認識装置 | |
JPS6095689A (ja) | 光学的文字読取装置 | |
JPH0778155A (ja) | 文書認識装置 | |
JPH08297720A (ja) | 一般文書読み取り装置 | |
JPS61114388A (ja) | 文字入力装置 | |
JP2839515B2 (ja) | 文字読取システム | |
JP3476872B2 (ja) | 文字認識装置 | |
JPH08305698A (ja) | 自然語解析方法及び装置 | |
JPH0272497A (ja) | 光学的文字読取装置 | |
JP2917310B2 (ja) | 単語照合における単語辞書検索方式 | |
JPH0528323A (ja) | 文字認識装置 | |
KR20210047192A (ko) | 음소 기반 텍스트 검색 장치 및 방법 | |
JPS6115288A (ja) | 光学的文字読取装置 | |
JPH024035B2 (ja) | ||
JPS60207983A (ja) | 文字認識用辞書作成方式 | |
JPS60144886A (ja) | 文字認識装置における後処理方式 | |
JPH0746374B2 (ja) | 文字認識方法 |