JPH05189606A - 文字列領域検出方法 - Google Patents
文字列領域検出方法Info
- Publication number
- JPH05189606A JPH05189606A JP4002792A JP279292A JPH05189606A JP H05189606 A JPH05189606 A JP H05189606A JP 4002792 A JP4002792 A JP 4002792A JP 279292 A JP279292 A JP 279292A JP H05189606 A JPH05189606 A JP H05189606A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- image data
- code
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 キーボードから入力した文字列が画像データ
中のいずれの位置に存在するかを自動的に識別可能な文
字領域検出方法を提供する。 【構成】 文字のイメージデータを文字コードに変換す
る文字認識手段と、該文字認識のための文字辞書とを備
えた文字領域検出方法であって、画像データ中の図形に
含まれる画素の識別および消去、文字列領域の候補の切
り出し、文字領域候補のイメージデータからの文字コー
ド取得、入力文字列コードと該文字コードの候補との照
合による文字列領域候補の識別を順次実行する。
中のいずれの位置に存在するかを自動的に識別可能な文
字領域検出方法を提供する。 【構成】 文字のイメージデータを文字コードに変換す
る文字認識手段と、該文字認識のための文字辞書とを備
えた文字領域検出方法であって、画像データ中の図形に
含まれる画素の識別および消去、文字列領域の候補の切
り出し、文字領域候補のイメージデータからの文字コー
ド取得、入力文字列コードと該文字コードの候補との照
合による文字列領域候補の識別を順次実行する。
Description
【0001】
【産業上の利用分野】本発明は、文字や図形が混在する
画像データに対する処理に関し、特に、画像データ中に
含まれる文字列領域を検出するための文字列領域検出方
法に関するものである。
画像データに対する処理に関し、特に、画像データ中に
含まれる文字列領域を検出するための文字列領域検出方
法に関するものである。
【0002】
【従来の技術】計算機システムにデータを入力する手段
に、文字認識技術を応用した装置が開発されており、キ
ーボードからのデータ入力に比べ操作が簡単等の理由か
ら次第に普及しつつある。この種の装置は、スキャナ等
から読み込んだイメージデータ(微小な画素データの集
合)中の文字イメージデータをJISやシフトJIS等
の文字コードに変換する機能を有し、主に、書式の定ま
った伝票等の文書入力に使用されている。一方、昨今で
は、文字だけでなく図形が混在した地図等を簡単に入力
したいという要望があり、このためにも文字認識技術は
有効な技術の1つである。しかし、現状の文字認識技術
では、認識対象とする文字イメージデータの品質が良好
で、文字以外のイメージが混在しない場合に実用的な文
字認識率が確保されるが、上記の地図等のように文字と
図形が混在したイメージデータに対しては、高い文字認
識率を期待することはできない。そこで、地図データ等
の計算機への入力においては文字部分を所定の位置にキ
ーボードから投入する方法が確実な方法として行われて
いる。
に、文字認識技術を応用した装置が開発されており、キ
ーボードからのデータ入力に比べ操作が簡単等の理由か
ら次第に普及しつつある。この種の装置は、スキャナ等
から読み込んだイメージデータ(微小な画素データの集
合)中の文字イメージデータをJISやシフトJIS等
の文字コードに変換する機能を有し、主に、書式の定ま
った伝票等の文書入力に使用されている。一方、昨今で
は、文字だけでなく図形が混在した地図等を簡単に入力
したいという要望があり、このためにも文字認識技術は
有効な技術の1つである。しかし、現状の文字認識技術
では、認識対象とする文字イメージデータの品質が良好
で、文字以外のイメージが混在しない場合に実用的な文
字認識率が確保されるが、上記の地図等のように文字と
図形が混在したイメージデータに対しては、高い文字認
識率を期待することはできない。そこで、地図データ等
の計算機への入力においては文字部分を所定の位置にキ
ーボードから投入する方法が確実な方法として行われて
いる。
【0003】
【発明が解決しようとする課題】上述のキーボードから
の文字投入の方法には、稠密な地図等を対象とする場合
には、文字列の投入位置を画像データ中で探索するため
に多くの時間を必要とし、データ投入効率が悪いという
問題があった。
の文字投入の方法には、稠密な地図等を対象とする場合
には、文字列の投入位置を画像データ中で探索するため
に多くの時間を必要とし、データ投入効率が悪いという
問題があった。
【0004】本発明は、上記事情に鑑みてなされたもの
であり、その目的とするところは、従来の技術における
上述の如き問題を解消し、キーボードから入力した文字
列が画像データ中のいずれの位置に存在するかを自動的
に識別可能な文字領域検出方法を提供することにある。
であり、その目的とするところは、従来の技術における
上述の如き問題を解消し、キーボードから入力した文字
列が画像データ中のいずれの位置に存在するかを自動的
に識別可能な文字領域検出方法を提供することにある。
【0005】本発明の上記ならびにその他の目的および
新規な特徴は、本明細書の記述および添付図面によって
明らかにする。
新規な特徴は、本明細書の記述および添付図面によって
明らかにする。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、文字列や図形が混在する画像データを対
象とした処理において、文字のイメージデータを文字コ
ードに変換する文字認識手段と、当該文字認識のための
文字辞書とを備えた文字領域検出方法であって、当該画
像データ中の画素の連なりを追跡することにより、当該
画像データ中の図形に含まれる画素の識別および消去を
行い、該消去処理によって残された画像データから文字
列領域の候補の切り出しを行い、上記文字認識手段によ
り当該切り出し処理によって得られる画像データを文字
コードの候補に変換し、別途指定された文字列コードと
当該文字コードの候補との照合により指定文字列コード
中の文字コードを対応する文字位置において最も多く含
む文字列領域の候補を識別し、該識別文字列領域の画像
データ中における位置情報を出力することを最も主要な
特徴とする。
に、本発明は、文字列や図形が混在する画像データを対
象とした処理において、文字のイメージデータを文字コ
ードに変換する文字認識手段と、当該文字認識のための
文字辞書とを備えた文字領域検出方法であって、当該画
像データ中の画素の連なりを追跡することにより、当該
画像データ中の図形に含まれる画素の識別および消去を
行い、該消去処理によって残された画像データから文字
列領域の候補の切り出しを行い、上記文字認識手段によ
り当該切り出し処理によって得られる画像データを文字
コードの候補に変換し、別途指定された文字列コードと
当該文字コードの候補との照合により指定文字列コード
中の文字コードを対応する文字位置において最も多く含
む文字列領域の候補を識別し、該識別文字列領域の画像
データ中における位置情報を出力することを最も主要な
特徴とする。
【0007】
【作用】上述の手段によれば、画像データ中の図形に含
まれる画素の識別および消去、文字列領域の候補の切り
出し、文字領域候補のイメージデータからの文字コード
取得、入力文字列コードと該文字コードの候補との照合
による文字列領域候補の識別を順次実行することによ
り、当該識別文字列領域の画像データ中における位置情
報を出力するので、入力しようとする文字列コードの入
力位置を画像データ中において示すことができ、これに
よって投入時間の短縮が可能な文字列コード入力方法を
実現することが可能となる。また、画像データ中の文字
列を直接検索可能な文字列探索方法を容易に実現するこ
とができる。
まれる画素の識別および消去、文字列領域の候補の切り
出し、文字領域候補のイメージデータからの文字コード
取得、入力文字列コードと該文字コードの候補との照合
による文字列領域候補の識別を順次実行することによ
り、当該識別文字列領域の画像データ中における位置情
報を出力するので、入力しようとする文字列コードの入
力位置を画像データ中において示すことができ、これに
よって投入時間の短縮が可能な文字列コード入力方法を
実現することが可能となる。また、画像データ中の文字
列を直接検索可能な文字列探索方法を容易に実現するこ
とができる。
【0008】
【実施例】以下、図面を用いて本発明の実施例を詳細に
説明する。
説明する。
【0009】図1は、本発明の一実施例に係わる文字列
領域検出方法を実施する文字列領域検出装置の構成を示
すブロック図である。図1において、101は背景図形
消去手段であり、リード線106より入力される画像デ
ータに対して、文字以外の記号等の背景図形を消去し、
全文字領域を含む画像データをリード線107へ出力す
る。尚、背景図形消去手段101については、後に図2
を用いて詳細に説明する。
領域検出方法を実施する文字列領域検出装置の構成を示
すブロック図である。図1において、101は背景図形
消去手段であり、リード線106より入力される画像デ
ータに対して、文字以外の記号等の背景図形を消去し、
全文字領域を含む画像データをリード線107へ出力す
る。尚、背景図形消去手段101については、後に図2
を用いて詳細に説明する。
【0010】102は文字列領域候補検出手段であり、
リード線107から入力される背景図形が消去された画
像データから文字列領域の候補を検出し、文字列領域と
推定されるイメージデータ(文字列領域候補)のみを、
その画像データ中における座標情報とともにリード線1
08へ出力する。尚、文字列領域候補検出手段102に
ついては、後に図3を用いて詳細に説明する。
リード線107から入力される背景図形が消去された画
像データから文字列領域の候補を検出し、文字列領域と
推定されるイメージデータ(文字列領域候補)のみを、
その画像データ中における座標情報とともにリード線1
08へ出力する。尚、文字列領域候補検出手段102に
ついては、後に図3を用いて詳細に説明する。
【0011】103は文字認識手段であり、リード線1
08より入力される文字列領域候補に対して、各文字領
域の切り出しおよび文字辞書104を用いた認識を行っ
て、各文字イメージに対応する文字候補をリード線11
0へ出力する。尚、文字認識手段103については、後
に図4を用いて詳細に説明する。
08より入力される文字列領域候補に対して、各文字領
域の切り出しおよび文字辞書104を用いた認識を行っ
て、各文字イメージに対応する文字候補をリード線11
0へ出力する。尚、文字認識手段103については、後
に図4を用いて詳細に説明する。
【0012】105は用語照合手段であり、前記文字認
識手段103からの出力である文字列対応の文字候補
と、別途、リード線111より入力される文字列コード
との突き合わせを行い、入力された文字列に最も符合す
る用語候補に対応する文字列イメージ領域の座標をリー
ド線112に出力する。尚、用語照合手段105につい
ては、後に図5を用いて詳細に説明する。
識手段103からの出力である文字列対応の文字候補
と、別途、リード線111より入力される文字列コード
との突き合わせを行い、入力された文字列に最も符合す
る用語候補に対応する文字列イメージ領域の座標をリー
ド線112に出力する。尚、用語照合手段105につい
ては、後に図5を用いて詳細に説明する。
【0013】次に、図1に示す実施例の、画像データ入
力から文字列領域候補の出力までの動作原理を図6の例
で説明する。尚、図6は、地図中における文字列領域候
補を検出する例を示している。図6において、601は
入力画像データ、602は背景図形消去後の画像デー
タ、603は各文字領域の外接矩形および文字列領域の
外接矩形である。604から606までは、出力された
文字列領域候補である。入力画像データ601からの背
景図形の消去には、例えば、文字部分の線密度と図形部
分の線密度の相違ならびに線素の長さによって図形部分
を検出する方法を用いることができる。具体的には、図
6に示す例においては、画像データ中の黒画素の連続を
追跡し、文字の線素(ストローク)より長い線素につい
てはこれを図形と識別し、また、単位面積当たりのスト
ローク数が別途定める一定数を越える領域に含まれるス
トローク群を文字部分として識別する。
力から文字列領域候補の出力までの動作原理を図6の例
で説明する。尚、図6は、地図中における文字列領域候
補を検出する例を示している。図6において、601は
入力画像データ、602は背景図形消去後の画像デー
タ、603は各文字領域の外接矩形および文字列領域の
外接矩形である。604から606までは、出力された
文字列領域候補である。入力画像データ601からの背
景図形の消去には、例えば、文字部分の線密度と図形部
分の線密度の相違ならびに線素の長さによって図形部分
を検出する方法を用いることができる。具体的には、図
6に示す例においては、画像データ中の黒画素の連続を
追跡し、文字の線素(ストローク)より長い線素につい
てはこれを図形と識別し、また、単位面積当たりのスト
ローク数が別途定める一定数を越える領域に含まれるス
トローク群を文字部分として識別する。
【0014】画像データ602中の文字および文字列イ
メージデータに対する外接矩形の生成は、黒画素の縦横
両方向の接線を検出し、これら縦横の接線によって構成
される矩形を文字の外接矩形とし、これら文字の外接矩
形のうち、近傍に一定間隔で並んだ文字外接矩形の連な
りを文字列の外接矩形とすることで実現できる。この
後、各文字領域の外接矩形に対して、例えば、萩田他著
の「外郭方向寄与度特徴による漢字の識別」(電子情報
通信学会論文誌、Vol. J66−D, No.10
(1983年))に開示される文字認識法等によって文
字候補を得ることができる。尚、各文字外接矩形に対し
ては複数(m個)の文字候補が得られ、文字列外接矩形
(文字外接矩形×文字数n)から得られる文字認識結果
全体としてはm×nのマトリクス状に文字認識結果が得
られるので、以降、文字列全体に対する文字認識結果を
文字マトリクスと呼ぶことにする。
メージデータに対する外接矩形の生成は、黒画素の縦横
両方向の接線を検出し、これら縦横の接線によって構成
される矩形を文字の外接矩形とし、これら文字の外接矩
形のうち、近傍に一定間隔で並んだ文字外接矩形の連な
りを文字列の外接矩形とすることで実現できる。この
後、各文字領域の外接矩形に対して、例えば、萩田他著
の「外郭方向寄与度特徴による漢字の識別」(電子情報
通信学会論文誌、Vol. J66−D, No.10
(1983年))に開示される文字認識法等によって文
字候補を得ることができる。尚、各文字外接矩形に対し
ては複数(m個)の文字候補が得られ、文字列外接矩形
(文字外接矩形×文字数n)から得られる文字認識結果
全体としてはm×nのマトリクス状に文字認識結果が得
られるので、以降、文字列全体に対する文字認識結果を
文字マトリクスと呼ぶことにする。
【0015】次に、図1に示す実施例の、文字マトリク
スから対応する文字列領域の座標を求める動作原理を図
7の例で説明する。尚、図7は、文字列コードとして
「武蔵野センタ」が入力され、文字マトリクス2に対応
する文字列領域候補IIの座標が出力される例を示してい
る。図7において、701から703は文字マトリクス
の例、704は最大得点領域の選択部であり、文字マト
リクスに対して行う用語照合によって計算される用語得
点によって最も確からしい文字列領域を選択し、その座
標を出力する最大得点領域の選択を行う。
スから対応する文字列領域の座標を求める動作原理を図
7の例で説明する。尚、図7は、文字列コードとして
「武蔵野センタ」が入力され、文字マトリクス2に対応
する文字列領域候補IIの座標が出力される例を示してい
る。図7において、701から703は文字マトリクス
の例、704は最大得点領域の選択部であり、文字マト
リクスに対して行う用語照合によって計算される用語得
点によって最も確からしい文字列領域を選択し、その座
標を出力する最大得点領域の選択を行う。
【0016】また、図7において、文字マトリクス中の
網掛けを施した文字候補は、入力された文字列コード中
に含まれる文字候補であることを示している。各文字マ
トリクスに含まれる情報は、各文字外接矩形内のイメー
ジデータに対する文字認識結果として得られる文字候補
と、それら文字候補の確からしさを示す文字得点であ
る。入力文字列コードの探索(用語照合)では、入力さ
れた文字列コード「武蔵野センタ」の先頭の文字から順
に、各文字マトリクス中において対応する文字位置を対
象に探索を行い、該当する文字が見つかった場合には、
各文字マトリクス中に保持している当該文字得点を加算
していく。文字列コードに含まれる全ての文字につい
て、上記の文字探索を実行した結果として、最終的に入
力文字列コード中の全文字(用語)に対する、全文字マ
トリクスを対象とした探索結果が用語得点として得られ
る。図7の例では、文字マトリクス1の用語得点が52
点、文字マトリクス2の用語得点が420点、文字マト
リクス3の用語得点が0点となる。その結果、最大得点
領域の選択部704においては、最も高い用語得点であ
る702の文字マトリクス2、すなわち文字列領域候補
IIが選択され、その座標が出力される。
網掛けを施した文字候補は、入力された文字列コード中
に含まれる文字候補であることを示している。各文字マ
トリクスに含まれる情報は、各文字外接矩形内のイメー
ジデータに対する文字認識結果として得られる文字候補
と、それら文字候補の確からしさを示す文字得点であ
る。入力文字列コードの探索(用語照合)では、入力さ
れた文字列コード「武蔵野センタ」の先頭の文字から順
に、各文字マトリクス中において対応する文字位置を対
象に探索を行い、該当する文字が見つかった場合には、
各文字マトリクス中に保持している当該文字得点を加算
していく。文字列コードに含まれる全ての文字につい
て、上記の文字探索を実行した結果として、最終的に入
力文字列コード中の全文字(用語)に対する、全文字マ
トリクスを対象とした探索結果が用語得点として得られ
る。図7の例では、文字マトリクス1の用語得点が52
点、文字マトリクス2の用語得点が420点、文字マト
リクス3の用語得点が0点となる。その結果、最大得点
領域の選択部704においては、最も高い用語得点であ
る702の文字マトリクス2、すなわち文字列領域候補
IIが選択され、その座標が出力される。
【0017】ここで説明した方法によれば、文字イメー
ジあるいは字体の品質が悪くて、高い文字認識精度が得
られないような場合においても、入力された文字列コー
ドを最も多く含む文字認識結果が得られる文字列領域の
選択を行うため、高い精度で正しい文字列領域を選択す
ることができる。
ジあるいは字体の品質が悪くて、高い文字認識精度が得
られないような場合においても、入力された文字列コー
ドを最も多く含む文字認識結果が得られる文字列領域の
選択を行うため、高い精度で正しい文字列領域を選択す
ることができる。
【0018】次に、図2を用いて図1の実施例に示した
背景図形消去手段101について詳細に説明する。図2
において、201は連結線分消去手段であり、入力画像
データ中の黒画素を追跡し、連結線分の検出および消去
を実行する。
背景図形消去手段101について詳細に説明する。図2
において、201は連結線分消去手段であり、入力画像
データ中の黒画素を追跡し、連結線分の検出および消去
を実行する。
【0019】202は破線消去手段であり、前記連結線
分消去手段201では消去できない破線等の間隙を有す
る線分を有する線分を消去する。破線等の消去には、例
えば、記述される破線等のパタン(破線部分間隔等)を
予め与えておき、このパタンを画像データ中で探索する
方法等によって実現できる。
分消去手段201では消去できない破線等の間隙を有す
る線分を有する線分を消去する。破線等の消去には、例
えば、記述される破線等のパタン(破線部分間隔等)を
予め与えておき、このパタンを画像データ中で探索する
方法等によって実現できる。
【0020】203は非線分画素消去手段であり、前記
連結線分消去手段201および破線消去手段202では
消去できない塗りつぶしや網掛け等の非線分画素を消去
する。非線分画素の消去には、例えば、船久保著「視覚
パターンの処理と認識」(pp.118−127,啓学
出版,1990年)に示されるテクスチャ(きめ、模
様)特徴を用いて非線分画素領域を検出し、これを消去
する方法等により実現できる。 図2に示した背景図形
消去手段によれば、上記のとおり、入力画像データ中の
連結線分、破線等の線分および塗りつぶし等の非線分画
素を消去し、文字と推定されるイメージデータの抽出を
実現することができる。
連結線分消去手段201および破線消去手段202では
消去できない塗りつぶしや網掛け等の非線分画素を消去
する。非線分画素の消去には、例えば、船久保著「視覚
パターンの処理と認識」(pp.118−127,啓学
出版,1990年)に示されるテクスチャ(きめ、模
様)特徴を用いて非線分画素領域を検出し、これを消去
する方法等により実現できる。 図2に示した背景図形
消去手段によれば、上記のとおり、入力画像データ中の
連結線分、破線等の線分および塗りつぶし等の非線分画
素を消去し、文字と推定されるイメージデータの抽出を
実現することができる。
【0021】次に、図3を用いて図1の実施例に示した
文字列領域候補検出手段102について詳細に説明す
る。図3において、301は文字外接矩形検出手段であ
り、背景図形が消去された画像データ中において、文字
と推定される黒画素領域の外接矩形を検出する。
文字列領域候補検出手段102について詳細に説明す
る。図3において、301は文字外接矩形検出手段であ
り、背景図形が消去された画像データ中において、文字
と推定される黒画素領域の外接矩形を検出する。
【0022】302は隣接矩形検出手段であり、前記文
字外接矩形検出手段301によって検出された文字外接
矩形のうち、同じ文字列(用語)領域に属する文字外接
矩形の候補を、それらの位置関係(主に近さ)から検出
する。
字外接矩形検出手段301によって検出された文字外接
矩形のうち、同じ文字列(用語)領域に属する文字外接
矩形の候補を、それらの位置関係(主に近さ)から検出
する。
【0023】303は隣接矩形統合手段であり、前記隣
接矩形検出手段302によって検出された隣接矩形に対
して、印字もしくは記入の方向を検出して最終的に同じ
文字列に属する文字外接矩形を確定し、これらを統合し
た文字列領域に対する外接矩形を検出する。印字もしく
は記入の方向の検出には、例えば、同一サイズで間隔が
等しい文字外接矩形を探索することにより実現できる。
接矩形検出手段302によって検出された隣接矩形に対
して、印字もしくは記入の方向を検出して最終的に同じ
文字列に属する文字外接矩形を確定し、これらを統合し
た文字列領域に対する外接矩形を検出する。印字もしく
は記入の方向の検出には、例えば、同一サイズで間隔が
等しい文字外接矩形を探索することにより実現できる。
【0024】図3に示す文字列領域候補検出手段102
によれば、背景図形消去済みイメージデータから、文字
列領域と推定される候補を検出することが可能となる。
によれば、背景図形消去済みイメージデータから、文字
列領域と推定される候補を検出することが可能となる。
【0025】次に、図4を用いて図1の実施例に示した
文字認識手段103について詳細に説明する。図4にお
いて、401は文字特徴抽出手段であり、文字列領域候
補内に含まれる各文字外接矩形内のイメージデータから
文字特徴を抽出する。
文字認識手段103について詳細に説明する。図4にお
いて、401は文字特徴抽出手段であり、文字列領域候
補内に含まれる各文字外接矩形内のイメージデータから
文字特徴を抽出する。
【0026】402は文字特徴照合手段であり、予め標
準字体のイメージデータから抽出した文字特徴を集めた
文字辞書104と、前記文字特徴抽出手段401によっ
て抽出した文字特徴とを照合し、最も近い文字特徴を当
該文字辞書104から探し出す。文字特徴の照合におい
ては、その結果として、最も近い文字特徴に対応する文
字のコード(JISコード、シフトJISコード等)
と、特徴の類似度を定量的に示す文字得点とを、文字列
の単位に文字マトリクスとして出力する。尚、文字特徴
および文字特徴照合については、例えば、萩田他著の
「外郭方向寄与度特徴による漢字の識別」(電子情報通
信学会論文誌、Vol. J66−D, No.10(1
983年))等により実現可能である。
準字体のイメージデータから抽出した文字特徴を集めた
文字辞書104と、前記文字特徴抽出手段401によっ
て抽出した文字特徴とを照合し、最も近い文字特徴を当
該文字辞書104から探し出す。文字特徴の照合におい
ては、その結果として、最も近い文字特徴に対応する文
字のコード(JISコード、シフトJISコード等)
と、特徴の類似度を定量的に示す文字得点とを、文字列
の単位に文字マトリクスとして出力する。尚、文字特徴
および文字特徴照合については、例えば、萩田他著の
「外郭方向寄与度特徴による漢字の識別」(電子情報通
信学会論文誌、Vol. J66−D, No.10(1
983年))等により実現可能である。
【0027】次に、図5を用いて図1の実施例に示した
用語照合手段105について詳細に説明する。図5にお
いて、501は文字マトリクス探索手段であり、前記文
字辞書104の出力である各文字マトリクスを対象に、
リード線111より入力される文字列コードに含まれる
文字コードを、対応する文字位置において探索する。
用語照合手段105について詳細に説明する。図5にお
いて、501は文字マトリクス探索手段であり、前記文
字辞書104の出力である各文字マトリクスを対象に、
リード線111より入力される文字列コードに含まれる
文字コードを、対応する文字位置において探索する。
【0028】502は文字列領域選択手段であり、各文
字マトリクス中のうち、入力された文字列コード中の文
字コードと一致した文字候補の有する文字得点を、文字
マトリクス毎に加算し、入力文字列コード中の全ての文
字コードに対する探索が終了した時点で、文字得点の加
算結果が最も多い文字マトリクス、すなわち文字列領域
を選択する。文字列領域の選択結果としては、選択され
た文字列領域の、入力画像データ中における座標を出力
する。
字マトリクス中のうち、入力された文字列コード中の文
字コードと一致した文字候補の有する文字得点を、文字
マトリクス毎に加算し、入力文字列コード中の全ての文
字コードに対する探索が終了した時点で、文字得点の加
算結果が最も多い文字マトリクス、すなわち文字列領域
を選択する。文字列領域の選択結果としては、選択され
た文字列領域の、入力画像データ中における座標を出力
する。
【0029】以上、本発明を実施例に基づき具体的に説
明したが、本発明は、実施例に限定されるものではな
く、その要旨を逸脱しない範囲において種々変更し得る
ことはいうまでもない。
明したが、本発明は、実施例に限定されるものではな
く、その要旨を逸脱しない範囲において種々変更し得る
ことはいうまでもない。
【0030】
【発明の効果】以上、説明したように、本発明によれ
ば、画像データ中の図形に含まれる画素の識別および消
去、文字列領域の候補の切り出し、文字領域候補のイメ
ージデータからの文字コード取得、入力文字列コードと
該文字コードの候補との照合による文字列領域候補の識
別を順次実行することにより、該識別文字列領域の画像
データ中における位置情報を出力するので、入力しよう
とする文字列コードの入力位置を画像データ中において
示すことができ、これによって投入時間の短縮が可能な
文字列コード入力方法を実現することが可能となる。ま
た、画像データ中の文字列を直接検索可能な文字列探索
方法を容易に実現することができる。
ば、画像データ中の図形に含まれる画素の識別および消
去、文字列領域の候補の切り出し、文字領域候補のイメ
ージデータからの文字コード取得、入力文字列コードと
該文字コードの候補との照合による文字列領域候補の識
別を順次実行することにより、該識別文字列領域の画像
データ中における位置情報を出力するので、入力しよう
とする文字列コードの入力位置を画像データ中において
示すことができ、これによって投入時間の短縮が可能な
文字列コード入力方法を実現することが可能となる。ま
た、画像データ中の文字列を直接検索可能な文字列探索
方法を容易に実現することができる。
【図1】 本発明の一実施例に係わる文字列領域検出方
法を実施する文字列領域検出装置の構成を示すブロック
図、
法を実施する文字列領域検出装置の構成を示すブロック
図、
【図2】 図1の文字列領域検出装置に使用される背景
図形消去手段の構成図、
図形消去手段の構成図、
【図3】 図1の文字列領域検出装置に使用される文字
列領域候補検出手段の構成図、
列領域候補検出手段の構成図、
【図4】 図1の文字列領域検出装置に使用される文字
認識手段の構成図、
認識手段の構成図、
【図5】 図1の文字列領域検出装置に使用される用語
照合手段の構成図、
照合手段の構成図、
【図6】 図1の文字列領域検出装置の入力画像データ
から文字列領域候補を得るまでの動作原理の説明図、
から文字列領域候補を得るまでの動作原理の説明図、
【図7】 図1の文字列領域検出装置の文字認識結果か
ら文字列領域候補を得るまでの動作原理の説明図。
ら文字列領域候補を得るまでの動作原理の説明図。
101…背景図形消去手段、102…文字列領域候補検
出手段、103…文字認識手段、105…用語照合手
段、201…連結線分消去手段、202…破線消去手
段、203…非線分画素消去手段、301…文字外接矩
形検出手段、302…隣接矩形検出手段、303…隣接
矩形統合手段、401…文字特徴抽出手段、402…文
字特徴照合手段、501…文字マトリクス探索手段、5
02…文字列領域選択手段、601…入力画像データ、
602…背景図形消去後の画像データ、603…各文字
領域の外接矩形および文字列領域の外接矩形、604〜
606…文字列領域候補、701〜703…文字マトリ
クスの例、704…最大得点領域の選択部。
出手段、103…文字認識手段、105…用語照合手
段、201…連結線分消去手段、202…破線消去手
段、203…非線分画素消去手段、301…文字外接矩
形検出手段、302…隣接矩形検出手段、303…隣接
矩形統合手段、401…文字特徴抽出手段、402…文
字特徴照合手段、501…文字マトリクス探索手段、5
02…文字列領域選択手段、601…入力画像データ、
602…背景図形消去後の画像データ、603…各文字
領域の外接矩形および文字列領域の外接矩形、604〜
606…文字列領域候補、701〜703…文字マトリ
クスの例、704…最大得点領域の選択部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 坂本 富栄 東京都千代田区内幸町一丁目1番6号 日 本電信電話株式会社内
Claims (1)
- 【請求項1】 文字のイメージデータを文字コードに変
換する文字認識手段と、当該文字認識のための文字辞書
とを備えた文字列領域検出方法であって、当該画像デー
タ中の画素の連なりを追跡することにより当該画像デー
タ中の図形に含まれる画素の識別および消去を行い、該
消去処理によって残された画像データから文字列領域の
候補の切り出しを行い、上記文字認識手段により当該切
り出し処理によって得られる画像データを文字コードの
候補に変換し、別途指定された文字列コードと当該文字
コードの候補との照合により指定文字列コード中の文字
コードを対応する文字位置において最も多く含む文字列
領域の候補を識別し、該識別文字列領域の画像データ中
における位置情報を出力することを特徴とする文字列領
域検出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4002792A JPH05189606A (ja) | 1992-01-10 | 1992-01-10 | 文字列領域検出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4002792A JPH05189606A (ja) | 1992-01-10 | 1992-01-10 | 文字列領域検出方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05189606A true JPH05189606A (ja) | 1993-07-30 |
Family
ID=11539220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4002792A Pending JPH05189606A (ja) | 1992-01-10 | 1992-01-10 | 文字列領域検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05189606A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0883331A (ja) * | 1994-09-13 | 1996-03-26 | Sharp Corp | 画像処理装置 |
WO2010113217A1 (ja) * | 2009-03-31 | 2010-10-07 | 富士通フロンテック株式会社 | 文字認識装置及び文字認識方法 |
-
1992
- 1992-01-10 JP JP4002792A patent/JPH05189606A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0883331A (ja) * | 1994-09-13 | 1996-03-26 | Sharp Corp | 画像処理装置 |
WO2010113217A1 (ja) * | 2009-03-31 | 2010-10-07 | 富士通フロンテック株式会社 | 文字認識装置及び文字認識方法 |
US8577147B2 (en) | 2009-03-31 | 2013-11-05 | Fujitsu Frontech Limited | Character recognition apparatus and character recognition method |
JP5385372B2 (ja) * | 2009-03-31 | 2014-01-08 | 富士通フロンテック株式会社 | 文字認識装置及び文字認識方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3469345B2 (ja) | 画像のファイリング装置及びファイリング方法 | |
US7630551B2 (en) | Method and system for line extraction in digital ink | |
US6600834B1 (en) | Handwriting information processing system with character segmentation user interface | |
EP1971957B1 (en) | Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text | |
EP0534446B1 (en) | System with approximation means for recognizing graphical elements in a drawing | |
JP3452774B2 (ja) | 文字認識方法 | |
EP1564675B1 (en) | Apparatus and method for searching for digital ink query | |
US5515455A (en) | System for recognizing handwritten words of cursive script | |
JP3294995B2 (ja) | 帳票読取装置 | |
US6614929B1 (en) | Apparatus and method of detecting character writing area in document, and document format generating apparatus | |
US6947596B2 (en) | Character recognition method, program and recording medium | |
JP3917349B2 (ja) | 文字認識結果を利用して情報を検索する検索装置および方法 | |
US6421461B1 (en) | Pattern recognition apparatus which compares input pattern feature and size data to registered feature and size pattern data, an apparatus for registering feature and size data, and corresponding methods and memory media therefor | |
JPH05189606A (ja) | 文字列領域検出方法 | |
EP1010128B1 (en) | Method for performing character recognition on a pixel matrix | |
JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
CN109409370B (zh) | 一种远程桌面字符识别方法和装置 | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP2537973B2 (ja) | 文字認識装置 | |
Rocha et al. | New method for word recognition without segmentation | |
JP2994992B2 (ja) | 手書き文字オンライン認識装置とその字体登録・学習方法 | |
KR900005141B1 (ko) | 문자인식장치 | |
JP2005004395A (ja) | 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置 | |
JPH1185905A (ja) | 書体識別装置および書体識別方法および情報記憶媒体 | |
JP3209197B2 (ja) | 文字認識装置及び文字認識プログラムを記録した記録媒体 |