[go: up one dir, main page]

JP3911942B2 - 文字認識装置 - Google Patents

文字認識装置 Download PDF

Info

Publication number
JP3911942B2
JP3911942B2 JP37326799A JP37326799A JP3911942B2 JP 3911942 B2 JP3911942 B2 JP 3911942B2 JP 37326799 A JP37326799 A JP 37326799A JP 37326799 A JP37326799 A JP 37326799A JP 3911942 B2 JP3911942 B2 JP 3911942B2
Authority
JP
Japan
Prior art keywords
character
similar
uppercase
characters
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP37326799A
Other languages
English (en)
Other versions
JP2001188881A (ja
Inventor
浩司 黒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP37326799A priority Critical patent/JP3911942B2/ja
Publication of JP2001188881A publication Critical patent/JP2001188881A/ja
Application granted granted Critical
Publication of JP3911942B2 publication Critical patent/JP3911942B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、活字文字の文字認識を行う文字認識装置に関し、特に識別が困難な相似型の文字を識別する技術に関するものである。
【0002】
例えば、ひらがな大文字の「つ」と小文字の「っ」のように大文字と小文字がほぼ相似型の文字パターンの文字(以下相似文字と称する)は、一定のサイズに正規化(圧縮又は、伸長される)された後、文字パターンの特徴量が抽出されるため、所定のフォントの文字の特徴量を抽出した文字辞書とのパターンマッチング技術のみでは、文字認識結果を確定することが出来ない場合がある。
このため、パターンマッチング技術による文字認識とは別に大文字か小文字かを識別する技術が必要とされている。
【0003】
【従来の技術】
図5に従来例の相似文字識別方法の説明図を示す。
【0004】
上記の文字認識装置は、入力した文字パターンから、行の上基準線、下基準線および行の標準幅を決定して、各文字の上空白比(上空白/行の標準幅)を求め、その値と所定の閾値との比較により、大文字か小文字かの識別を行う。
【0005】
図5に示すように、フォントおよびポイント数が同一であれば、大文字に対応する上側空白と小文字に対応する上側空白とは大きく異なっているから、標準行幅に対して、判別対象の文字に対応する上側空白が占める割合に基づいて、その文字が大文字であるか小文字であるかを容易に識別することができる。
【0006】
【発明が解決しようとする課題】
しかしながら、最近の文書は、多数のフォントの切り替え等による多彩な表現手法が用いられるようになっている。
【0007】
例えば、かなには、フォントにより、その高さが変化する物が多い。
【0008】
図6に示すように例えば「さ」については、フォント間で大きさに違いは見られないが、「エ」は、ゴシック体に比べ明朝体の高さが低い。
【0009】
明朝体「エ」の図6の閾値(大文字と小文字の上端の中間)で識別すると、ゴシック体「エ」の小文字を大文字と誤識別する場合が発生することがある。
【0010】
このように従来の相似文字識別方法では、判別対象の文字についての空白比と固定の閾値との比較結果に基づいて判別しているため、このような文書に含まれる相似文字の全てを正確に識別することは困難である。
【0011】
本発明の文字認識装置は、様々なフォントや強調表現が混在する文書に柔軟に対応し、相似文字の大文字、小文字の識別率の向上を目的とする。
【0012】
【課題を解決するための手段】
文書画像から文字パターンの特徴量を抽出し文字辞書の特徴量と照合して特徴量の近い文字を選択する文字認識手段と、認識した結果から形状が相似の大文字と小文字を識別して出力する相似文字識別手段を有する文字認識装置であって、
相似文字識別手段は、文字認識結果により、各文字の種類を相似文字型とその他の文字型に区分しマークする文字型マーク手段と、認識結果の文字の中から所定数の文字パターンを取得し、その外接矩形に接する基準線を設定し、設定した基準線から所定の距離を閾値として設定する閾値設定手段と、所定数の文字パターンの中で、相似文字型とマークされた文字パターンについて基準線から重心までの長さが閾値より小さい文字を小文字と判別する相似文字判別手段とを備えた構成である。
【0013】
この構成により、相似文字の基準線から重心までの距離が大文字と小文字で相違する点に着目し、所定の閾値を設定することで、相似文字の大文字小文字の判別が簡単で高精度に実現できる。
【0014】
また、文字認識結果により各文字の種類を相似文字型と相似文字型の大文字相当の高さを有する大文字型とその他の文字型に区分しマークする文字型マーク手段と、認識結果の文字の中から取得した所定数の文字パターンから大文字型とマークされた文字パターンを選択し、選択した文字パターンの外接矩形に接して設定した基準線から大文字型の文字パターンの重心までの距離の最短値を取得し、取得した最短値をもとに閾値を設定する閾値設定手段とを備えた構成である。
【0015】
この構成により、相似文字型の大文字の高さを有する大文字型の基準線から文字の重心までの最短の距離から閾値を求めることで、これより小さい相似型の文字は、小文字、大きい文字は、大文字と簡単に高精度に判別できる。
【0016】
文字認識結果により各文字の種類を相似文字型と相似文字型の大文字相当の高さを有する大文字型とその他の文字型に区分しマークする文字型マーク手段と、
認識結果の文字の中から取得した所定数の文字パターンの中に大文字型とマークされた文字パターンがなかったときに、所定数の文字パターンの外接矩形に接して設定した基準線からその他の文字型にマークされた文字パターンの重心までの距離の最長値を取得し、取得した最長値をもとに閾値を設定する閾値設定手段とを備えた構成である。
【0017】
この構成により、大文字型が所定数の文字パターン内に見つからない場合は、漢字などの文字の基準線から重心までの距離が最長のものを選ぶことで、相似文字の大文字、子文字の判別を可能としている。これは、漢字などの文字は、文字の高さが変動するものが多いため、最短だと、判別ができないため、最長で、判別している。
【0018】
【発明の実施の形態】
図1に実施例の文字認識装置1の構成図を示す。
【0019】
文字認識装置1は、画像入力部11、文字認識部12、相似文字識別部2、文字処理部13から構成される。
【0020】
図2に文字認識装置の処理の流れ図を示す。
【0021】
文字認識装置1は、文書を画像入力部11で読み込む(S1 ステップ)。
そして画像入力部11で読取った文字パターンを文字認識部12は、正規化して特徴量を抽出し、文字辞書の保持する文字の特徴量と照合してその差分の最も小さい文字を選択する。そして文字認識した結果と文字パターンを相似文字識別部2へ渡す(S2 ステップ)。
図3に文字認識装置の相似文字識別部の処理の流れ図を示す(S3 ステップ)。
【0022】
「かな」についての例を説明する。
【0023】
相似文字識別部2は、図1に示すように文字情報記憶部3、文字型マーク部4、相似文字識別制御部5、判別結果出力部6から構成される。
【0024】
文字情報記憶部3で文字認識部12からの文字認識結果と入力された文字パターンを行単位に記憶する(S11 ステップ)。
そして文字型マーク部4は、文字情報記憶部3に記憶されている文字認識結果から「かな」について、全文字情報の文字型を判定し、判定結果をマークとして文字情報記憶部3に記憶する(S12 ステップ)。
以下に文字型例を示す。
・相似文字型−形状が相似で大きさの異なるかな
あいうえおつやゆよわぁぃぅぇぉっゃゅょゎ
アイウエオツヤユヨワァィゥェォッャュョヮ
・大文字型−−大文字型線と基準線に接し、かつ相似文字でないかな
かがきぎくぐけげこごさざしじすずそぞただちぢとどなにぬね
はばぱふぶぷほぼぽまみむもらりるれろゐゑをん
ガキギクグゲサザタダチヂトドナネホボポミメリヲ
・対象除外型−フォントにより高さが変動するなど
大文字型の条件を満たさないことがある文字
こごせぜてでのひびぴへべぺめ
ヴコゴシジスズセゼソゾヅテデニヌノ
ハバパヒビピフブプヘベペマムモラルレロヰヱン
次に、相似文字識別制御部5は、まず大文字型を含む行の基準線を求める。
【0025】
基準線は、読取った文書画像の頁単位に、1頁内の大文字型に属するかな外接矩形型の下辺の中点の集合から最小自乗近似法により直線を決定する(S13 ステップ)。
次に文字情報を行単位に識別して行く。
【0026】
文字型を判定した結果が相似文字型を一部含む行であるのか、行内の文字に相似文字型が含まれないとき又は、相似型のみの行であるのかを判別する。
【0027】
そして、行内の文字に相似文字型が含まれないとき又は相似型のみの行のときには、そのまま認識結果を判別結果出力部6に渡す(S14 ステップ)。
文字型を判定した結果が相似文字型を一部含む行のときには、一行の中の大文字型の有無を確認する(S15 ステップ)。
行中に大文字型が有る場合は、基準線から矩形の重心までの長さが一番短いものを求める。基準線から重心までが一番短い大文字型の長さに所定の定数(例えば0.86)をかけたものを閾値とし、相似文字型の中でそれより小さい場合を小文字、大きい場合を大文字と判定し、判別結果出力部6に渡す(S16 ステップ)。
図4に実施例の相似文字識別部の説明図を示す。
【0028】
図4(a) に大文字型の文字を基にした閾値設定を示す。
【0029】
大文字型の文字「ぬし」の基準線から外接矩形の重心までの距離を求める。その結果、「し」の重心が「ぬ」の重心に比べて低い位置のため、「し」の重心が最短距離となる。そして、次に閾値を求めて、相似文字「あ」「っ」の重心距離を比較すると「あ」の重心位置が閾値より大きく、「っ」の重心位置は、閾値より小さいため、「あ」は大文字、「っ」は、小文字と判断する。
【0030】
一行中に大文字型がなかった場合は、その行の外接矩形の下辺から基準線を設定する。
【0031】
そして、求めた基準線からその行の対象除外型の文字パターンの外接矩形の重心までの距離が一番長い文字を漢字、数字、かなから求め、それを大文字型とみなす。その長さに所定の定数(例えば0.86)をかけたものを閾値として同様の処理を行う(S17 ステップ)。
図4(b) に大文字型以外の文字を基にした閾値設定を示す。
【0032】
漢字「ニ番」、対象除外型のかな「て」の基準線から重心までの距離を求める。その結果漢字「番」の基準線から重心までの距離が一番長い。そして、次に閾値を求めて、相似文字「あ」「っ」の重心距離を比較すると「あ」の重心位置が閾値より大きく、「っ」の重心位置は、閾値より小さいため、「あ」は大文字、「っ」は、小文字と判断する。
【0033】
そして判別結果出力部6は、大文字、子文字の判別した結果を出力する(S18 ステップ)。
文字処理部13は、相似文字識別部2で判別した結果にもとづき、文字認識部12で認識した結果を修正して、ディスプレイ等に文字認識結果を出力する(S4ステップ)。
【0034】
【発明の効果】
本発明によれば、相似文字識別の中の「かな」の相似文字判定を高精度に行うことができる。
【図面の簡単な説明】
【図1】 実施例の文字認識装置の構成図
【図2】 実施例の文字認識装置の処理の流れ図
【図3】 実施例の相似文字識別部の処理の流れ図
【図4】 実施例の相似文字識別部の説明図
【図5】 従来例の相似文字識別方法の説明図
【図6】 従来の問題点の説明図
【符号の説明】
1 文字認識装置
2 相似文字識別部
3 文字情報記憶部
4 文字型マーク部
5 相似文字識別制御部
6 判別結果出力部
11 画像入力部
12 文字認識部
13 文字処理部

Claims (2)

  1. 文書画像から文字パターンの特徴量を抽出し文字辞書の特徴量と照合して特徴量の近い文字を選択する文字認識手段と、認識した結果から形状が相似の大文字と小文字を識別して出力する相似文字識別手段を有する文字認識装置であって、
    相似文字識別手段は、
    文字認識結果により各文字の種類を相似文字型と相似文字型の大文字相当の高さを有する大文字型とその他の文字型に区分しマークする文字型マーク手段と、
    認識結果の文字の中から取得した所定数の文字パターンから大文字型とマークされた文字パターンを選択し、選択した文字パターンの外接矩形に接して設定した基準線から大文字型の文字パターンの重心までの距離の最短値を取得し、取得した最短値に所定の定数をかけたものを閾値として設定する閾値設定手段と、
    所定数の文字パターンの中で相似文字型とマークされた文字パターンについて基準線から重心までの長さが閾値より小さい文字を小文字と判別する相似文字判別手段とを備えたことを特徴とする文字認識装置。
  2. 認識結果の文字の中から取得した所定数の文字パターンの中に大文字型とマークされた文字パターンがなかったときに、所定数の文字パターンの外接矩形に接して設定した基準線からその他の文字型にマークされた文字パターンの重心までの距離の最長値を取得し、取得した最長値に所定の定数をかけたものを閾値として設定する閾値設定手段とを備えたことを特徴とする請求項1記載の文字認識装置。
JP37326799A 1999-12-28 1999-12-28 文字認識装置 Expired - Fee Related JP3911942B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP37326799A JP3911942B2 (ja) 1999-12-28 1999-12-28 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP37326799A JP3911942B2 (ja) 1999-12-28 1999-12-28 文字認識装置

Publications (2)

Publication Number Publication Date
JP2001188881A JP2001188881A (ja) 2001-07-10
JP3911942B2 true JP3911942B2 (ja) 2007-05-09

Family

ID=18501879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP37326799A Expired - Fee Related JP3911942B2 (ja) 1999-12-28 1999-12-28 文字認識装置

Country Status (1)

Country Link
JP (1) JP3911942B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102402148B1 (ko) 2017-08-22 2022-05-26 삼성전자주식회사 전자 장치 및 그의 문자 인식 방법
WO2019049187A1 (ja) * 2017-09-05 2019-03-14 富士通株式会社 プログラム、情報処理装置、及び情報処理方法

Also Published As

Publication number Publication date
JP2001188881A (ja) 2001-07-10

Similar Documents

Publication Publication Date Title
KR100658119B1 (ko) 문자 인식 장치 및 방법
US7437001B2 (en) Method and device for recognition of a handwritten pattern
US4903312A (en) Character recognition with variable subdivisions of a character region
EP1703444A2 (en) Detecting an orientation of characters in a document image
JPH11120293A (ja) 文字認識/修正方式
US5621818A (en) Document recognition apparatus
JP2000315247A (ja) 文字認識装置
JP3911942B2 (ja) 文字認識装置
JP6310155B2 (ja) 文字認識装置、文字認識方法及び文字認識プログラム
JP2001283157A (ja) 単語認識方法および単語認識プログラム
JP2917427B2 (ja) 図面読取装置
JP3457094B2 (ja) 文字認識装置及び文字認識方法
JP2510722B2 (ja) 英文の大文字,小文字の判別方法
JP2697790B2 (ja) 文字タイプ決定方法
JP2002109472A (ja) 文字認識装置及び文字認識方法
JP2004005761A (ja) キーワード抽出・検索装置
JPH10162103A (ja) 文字認識装置
JP2993252B2 (ja) 同形異文字判別方法および装置
KR100204618B1 (ko) 문자 또는 도형의 인식 방법 및 시스템
Kim et al. Segmentation of touching characters in printed Korean/English document recognition
JP2004030695A (ja) キーワード抽出・検索装置
JPH11134439A (ja) 単語認識方法
Soua et al. Efficient multiscale and multifont optical character recognition system based on robust feature description
JP3595081B2 (ja) 文字認識方法
JP4143148B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070122

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110209

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110209

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120209

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130209

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130209

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140209

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees