JPH01253077A - 文字列検出方法 - Google Patents
文字列検出方法Info
- Publication number
- JPH01253077A JPH01253077A JP63069969A JP6996988A JPH01253077A JP H01253077 A JPH01253077 A JP H01253077A JP 63069969 A JP63069969 A JP 63069969A JP 6996988 A JP6996988 A JP 6996988A JP H01253077 A JPH01253077 A JP H01253077A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character string
- boundary
- area
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 claims description 49
- 238000001914 filtration Methods 0.000 abstract description 5
- 238000012545 processing Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 11
- 238000007796 conventional method Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 235000010585 Ammi visnaga Nutrition 0.000 description 1
- 244000153158 Ammi visnaga Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/155—Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
A、産業上の利用分野
本発明は、図やイラストを含む文書画像中の文字列を検
出する方゛式に関する。
出する方゛式に関する。
B、従来技術
近年オフィスのさまざまな文書(マニュアルや設計図面
など)を(光ファイリングシステムにより)電子的に立
積・ (ファクシミリにより)伝送することが可能にな
りオフィスのペーパーレス化が進んでいる。しかしなが
ら、現在のところ文書は白黒の画像情報として扱われて
おり、イメージの切り貼り以上の高度な処理や、より効
率的な蓄積・伝送を行うためには、画像情報の構造化(
文字コード、グラフィックコマンドを含むマルチメディ
ア情報への変換)が必要になる。画像情報の構造化処理
においては1図や絵を含む画像から文字列のみを抽出す
る(文字列に外接する長方形の画像中での位置データを
求める)作業が最初に行なわれることが多い。
など)を(光ファイリングシステムにより)電子的に立
積・ (ファクシミリにより)伝送することが可能にな
りオフィスのペーパーレス化が進んでいる。しかしなが
ら、現在のところ文書は白黒の画像情報として扱われて
おり、イメージの切り貼り以上の高度な処理や、より効
率的な蓄積・伝送を行うためには、画像情報の構造化(
文字コード、グラフィックコマンドを含むマルチメディ
ア情報への変換)が必要になる。画像情報の構造化処理
においては1図や絵を含む画像から文字列のみを抽出す
る(文字列に外接する長方形の画像中での位置データを
求める)作業が最初に行なわれることが多い。
例えば、CAD/CAMのための自動画面入力システム
においては、最初に図面中の文字列と線図形とを分離し
たのちそれぞれを認識する必要があるし、新聞・雑誌等
の画像の領域分割く画像を文字、図表、写真等の領域に
分割すること)においても、ある領域内に文字列が存在
するか否かという情報は非常に有用である。また、これ
まで文字のみが印刷されている文書を処理の対象として
いたOCRにおいても、ロゴや署名、アンダーライン程
度は自動的に無視して文字のみを認識するような機能が
求められている。
においては、最初に図面中の文字列と線図形とを分離し
たのちそれぞれを認識する必要があるし、新聞・雑誌等
の画像の領域分割く画像を文字、図表、写真等の領域に
分割すること)においても、ある領域内に文字列が存在
するか否かという情報は非常に有用である。また、これ
まで文字のみが印刷されている文書を処理の対象として
いたOCRにおいても、ロゴや署名、アンダーライン程
度は自動的に無視して文字のみを認識するような機能が
求められている。
しかし、文字列抽出処理は画像全体を処理の対象とする
ため、かなり時間のかかる処理である。
ため、かなり時間のかかる処理である。
しかも、印刷英数字の認識等がパソコン上のソフトウェ
アで行なわれるようになっている現状では文字列抽出も
パソコン上で行えるのが望ましく、高速な文字列抽出方
式が求められている。この文字列抽出の過程は次のよう
な二つのステップにわけることができる。
アで行なわれるようになっている現状では文字列抽出も
パソコン上で行えるのが望ましく、高速な文字列抽出方
式が求められている。この文字列抽出の過程は次のよう
な二つのステップにわけることができる。
1)画像中の文字列を検出する。
2)文字列の外接長方形の正確な位置と大きさを決定す
る。
る。
ステップ1の文字列検出とは1画像を走査して文字列の
位置データに関するおおよその情報を得ることをいう。
位置データに関するおおよその情報を得ることをいう。
ステップ2では、ステップ1で得られた情報(座標、大
きさなど)をもとにして処理を行うためほとんど時間は
かからない。したがってCPUに負担のかかるのはステ
ップ1の文字列検出処理であり、画像情報の構造化のア
プリケーションがオフィスへ普及するためには、高価な
専用ハードウェアやホストコンピュータを必要としない
高速な文字列検出方式が不可欠である。
きさなど)をもとにして処理を行うためほとんど時間は
かからない。したがってCPUに負担のかかるのはステ
ップ1の文字列検出処理であり、画像情報の構造化のア
プリケーションがオフィスへ普及するためには、高価な
専用ハードウェアやホストコンピュータを必要としない
高速な文字列検出方式が不可欠である。
従来用いられていた文字列検出方法としては次のような
ものがある。(ただし、図面固有の知識を利用する方法
はここでは除外している。)(1)ヒストグラムを使う
方法 画像を走査して黒画素数を数えそのヒストグラムから文
字列を検出する。文字だけの画像に対しては最もよく使
われている方法である。図や絵を含む画像に対しては走
査する範囲を変えて何度かヒストグラムをとりながら文
字列だけの領域をもとめる方法が提案されている。下記
の論文はこの方法を記述した文献の1例である。
ものがある。(ただし、図面固有の知識を利用する方法
はここでは除外している。)(1)ヒストグラムを使う
方法 画像を走査して黒画素数を数えそのヒストグラムから文
字列を検出する。文字だけの画像に対しては最もよく使
われている方法である。図や絵を含む画像に対しては走
査する範囲を変えて何度かヒストグラムをとりながら文
字列だけの領域をもとめる方法が提案されている。下記
の論文はこの方法を記述した文献の1例である。
Masuda、 Hagita、 Akiyama著”
Approach t。
Approach t。
Smart DocuIlent Reader Sy
stem”、 Proc。
stem”、 Proc。
Conference CVPR+San Franc
isco、1985+pp。
isco、1985+pp。
(2)図形の大きさに着目する方法
第12図に示すように、連結している黒画素を追跡し、
連結領域に外接する長方形(121,122,123)
をもとめる。文字の黒画素連結領域は他の図形の黒画素
連結領域よりも小さいので外接長方形の大きさから文字
を識別することができる。多くのシステムで採用されて
いる方法である。下記の本はこの方法を記述した文献の
1例である。
連結領域に外接する長方形(121,122,123)
をもとめる。文字の黒画素連結領域は他の図形の黒画素
連結領域よりも小さいので外接長方形の大きさから文字
を識別することができる。多くのシステムで採用されて
いる方法である。下記の本はこの方法を記述した文献の
1例である。
Rosanfeld、 Kak著“Digital P
ictureProcessing”、Academi
c Press、 New York、 1976(3
)図形の複雑さに着目する方法 黒画素の近傍において図形の複雑さを調べ文字を構成す
る画素であるか判定し、それらが集中している領域を文
字領域とする。図形の複雑さとして例えば近接線密度を
用いる場合には、画像中のすべての黒画素について、そ
の画素を中心として上下左右の四方向に走査を行ない画
素が白から黒にかわる回数を数え、複雑さの尺度とする
。
ictureProcessing”、Academi
c Press、 New York、 1976(3
)図形の複雑さに着目する方法 黒画素の近傍において図形の複雑さを調べ文字を構成す
る画素であるか判定し、それらが集中している領域を文
字領域とする。図形の複雑さとして例えば近接線密度を
用いる場合には、画像中のすべての黒画素について、そ
の画素を中心として上下左右の四方向に走査を行ない画
素が白から黒にかわる回数を数え、複雑さの尺度とする
。
第13図を例にとって説明すると、現在着目している黒
画素131を中心として、領域132として表わされる
範囲で走査が行われる。走査範囲内で白が黒に変わるの
は3回であり、したがって。
画素131を中心として、領域132として表わされる
範囲で走査が行われる。走査範囲内で白が黒に変わるの
は3回であり、したがって。
近接線密度は3となる。近接線密度が高い黒画素は文字
を構成する画素であると判断される。下記論文は、この
方法を記載した文献の1例である。
を構成する画素であると判断される。下記論文は、この
方法を記載した文献の1例である。
Kubota、 Iwaki+Arakatia著、”
DocumentUnderstanding Sys
tem”、7th ICPR,Montreal、19
84、pp、 612−614 (4)前処理を行った画像から文字列を検出する方法近
接している黒画素領域の間の白画素を黒画素で置き換え
た画像を作り(この結果、文字列中の文字は連結され一
つの黒画素領域になる。)、その画像中の黒画素連結領
域の形や大きさから文字列であるか否かを判定する。白
画素を黒画素で置き換える方法としては連長フィルタリ
ング処理がよく用いられている。連長フィルタリング処
理とは、第14図に示すように、まず画像をラスター走
査しである長さ以上の白ランを残して後はすべて黒画素
で置き換えた画像を作り、次いで主走査と副走査の方向
をいれかえてラスター走査を行ない同様の処理を行った
後、二つの画像のAND演算をとる処理である。下記論
文は、この方法を記述した文献の1例である。
DocumentUnderstanding Sys
tem”、7th ICPR,Montreal、19
84、pp、 612−614 (4)前処理を行った画像から文字列を検出する方法近
接している黒画素領域の間の白画素を黒画素で置き換え
た画像を作り(この結果、文字列中の文字は連結され一
つの黒画素領域になる。)、その画像中の黒画素連結領
域の形や大きさから文字列であるか否かを判定する。白
画素を黒画素で置き換える方法としては連長フィルタリ
ング処理がよく用いられている。連長フィルタリング処
理とは、第14図に示すように、まず画像をラスター走
査しである長さ以上の白ランを残して後はすべて黒画素
で置き換えた画像を作り、次いで主走査と副走査の方向
をいれかえてラスター走査を行ない同様の処理を行った
後、二つの画像のAND演算をとる処理である。下記論
文は、この方法を記述した文献の1例である。
Wong、 Ca5ay、 Vahl著“Docume
nt AnalysisSystem”、 IBM J
、RES、DEVELOP Vol、26.No、6.
PP。
nt AnalysisSystem”、 IBM J
、RES、DEVELOP Vol、26.No、6.
PP。
647−656.1982/11
また、これらの方法を組合せて用いたり、個々の文字の
切り出しや認識の結果をフィードバックして最初の結果
を修正していくシステムもある。
切り出しや認識の結果をフィードバックして最初の結果
を修正していくシステムもある。
C0発明が解決しようとする問題点
以下に速度および検出精度の面からみた従来方法の問題
点を述べる。
点を述べる。
文字列検出の速度は、画像に対するアクセスの回数と画
像を処理する単位に大きく依存する。アクセスの回数は
ラスター走査1回、画像を処理する単位は汎用プロセッ
サのデータ処理の単位(バイト(s bit)やワード
(16bit) )と同じであることが望ましい。
像を処理する単位に大きく依存する。アクセスの回数は
ラスター走査1回、画像を処理する単位は汎用プロセッ
サのデータ処理の単位(バイト(s bit)やワード
(16bit) )と同じであることが望ましい。
方法(1)では図や絵の領域を切分けるためには複数回
の走査が必要になり、その数は画像内の図や絵の領域の
数がふえるにつれ増加する。方法(2)では1回の走査
で連結領域の外接長方形をもとめることができる(ただ
し、途中結果を格納するのに複雑なデータ構造が必要に
なる。)、方法(3)では画像を1回走査する必要があ
るのに加えて、黒画素がある度にその上下左右(近接線
密度の場合)へのアクセスが生じる。方法(4)では。
の走査が必要になり、その数は画像内の図や絵の領域の
数がふえるにつれ増加する。方法(2)では1回の走査
で連結領域の外接長方形をもとめることができる(ただ
し、途中結果を格納するのに複雑なデータ構造が必要に
なる。)、方法(3)では画像を1回走査する必要があ
るのに加えて、黒画素がある度にその上下左右(近接線
密度の場合)へのアクセスが生じる。方法(4)では。
前処理で3回、連結領域を調べるのに1回、計4回の走
査が必要になる。
査が必要になる。
処理の単位については、方法(1)ではテーブルルック
アップによるバイト(ワード)単位での処理が可能であ
る。方法(2)と方法(3)では画集を走査するとき1
ドツトずつ白か黒かを調べていく必要がある。方法(4
)では、前処理ではバイト(ワード)単位での処理が可
能であるが、連結領域を調べる処理はドツト単位になる
。
アップによるバイト(ワード)単位での処理が可能であ
る。方法(2)と方法(3)では画集を走査するとき1
ドツトずつ白か黒かを調べていく必要がある。方法(4
)では、前処理ではバイト(ワード)単位での処理が可
能であるが、連結領域を調べる処理はドツト単位になる
。
したがって方法(2)、(3)、(4)では画像データ
をビット単位でハンドリングする必要が生じる。
をビット単位でハンドリングする必要が生じる。
従来方法でアクセスの回数と処理単位の最適な組合せを
実現しているものは存在せず、十分な速度を達成するた
めにはエンジニアリング・ワークステーションか専用の
ハードウェアが必要である。
実現しているものは存在せず、十分な速度を達成するた
めにはエンジニアリング・ワークステーションか専用の
ハードウェアが必要である。
文字列検出の精度を比較する場合、二つの基準が考えら
れる。一つは検出漏れがないかということ、もう一つは
余計な図形を文字列として検出しないかということであ
る。余計な検出は外接長方形の決定、個々の文字の切り
出し、認識の過程で容易に発見・修正ができるのでここ
では検出漏れについて述べる。
れる。一つは検出漏れがないかということ、もう一つは
余計な図形を文字列として検出しないかということであ
る。余計な検出は外接長方形の決定、個々の文字の切り
出し、認識の過程で容易に発見・修正ができるのでここ
では検出漏れについて述べる。
方法(1)ではヒストグラムの山と谷から文字列を検出
するので文字列がイラストの間に点在している場合には
全く検出できないことがある。
するので文字列がイラストの間に点在している場合には
全く検出できないことがある。
方法(2)と方法(4)では文字が他の図形と接触して
いる場合に問題が生じる。図形と接触している文字の外
接長方形は大きなものとなり文字ではないと判断されて
しまうからである。黒画素領域の境界を追跡し接触個所
を切りはなす方法(面出、銘木、阿部著″境界追跡を用
いた流れ図中の文字と図形の分離−文字と図形が接して
いる場合″第28回情報処理学会全国大会 lN−41
984/3)も提案されているが非常に時間がかかる処
理であるし1図形の一部分が切り離されてしまうおそれ
がある。
いる場合に問題が生じる。図形と接触している文字の外
接長方形は大きなものとなり文字ではないと判断されて
しまうからである。黒画素領域の境界を追跡し接触個所
を切りはなす方法(面出、銘木、阿部著″境界追跡を用
いた流れ図中の文字と図形の分離−文字と図形が接して
いる場合″第28回情報処理学会全国大会 lN−41
984/3)も提案されているが非常に時間がかかる処
理であるし1図形の一部分が切り離されてしまうおそれ
がある。
方法(4)では前処理によって文字と他の図形が接触す
る頻度がますので検出漏れの可能性はさらに高くなる。
る頻度がますので検出漏れの可能性はさらに高くなる。
方法(3)では数字などの筐単な構造の文字の列に関す
る複雑度が低くなり、他の図形との識別が困難になる。
る複雑度が低くなり、他の図形との識別が困難になる。
D0問題点を解決するための手段
多くの文書中に出現する文字列は次のような性質を持っ
ている。
ている。
1)文字はほぼ水平または垂直に書かれている。
2)水平の場合の文字の高さ、垂直の場合の文字の幅は
文字列中でほぼ一定。
文字列中でほぼ一定。
3)ある文字列の上下左右には他の図形要素を隔てる白
ランが存在する。(必ずしも文字列の回りに白画素の連
結領域が存在するわけではない、)したがって画像中の
個々の文字列領域を細長い長方形で近似的に表現するこ
とができる。文字列を検出するためにはこの長方形の上
下(水平に書かれている場合)・左右(垂直に書かれて
いる場合)の辺を検出すればよい。
ランが存在する。(必ずしも文字列の回りに白画素の連
結領域が存在するわけではない、)したがって画像中の
個々の文字列領域を細長い長方形で近似的に表現するこ
とができる。文字列を検出するためにはこの長方形の上
下(水平に書かれている場合)・左右(垂直に書かれて
いる場合)の辺を検出すればよい。
好適な実施例では、辺の検出は、白ランにローパスフィ
ルタリングを行って文字列領域内の空白を黒画素で埋め
た画像を考え、その画像内の黒画素連結領域の上下(左
右)の境界線分候補を求めることにより行う。
ルタリングを行って文字列領域内の空白を黒画素で埋め
た画像を考え、その画像内の黒画素連結領域の上下(左
右)の境界線分候補を求めることにより行う。
E、実施例
(I)アプリケーション全体の概略
第1図に文字列検出のアプリケーションの処理の概略を
示す、対象としたアプリケーションは自動車の補修用部
品番号の入力システムである。このシステムは、第2図
にその一部を示すような補修用カタログの分解図(各部
品のイラストとその番号が印刷されている)をスキャナ
ーより読みこみ、部品番号をあらbす文字列を抽出した
後、文字認識プログラムにより文字コードに変換する。
示す、対象としたアプリケーションは自動車の補修用部
品番号の入力システムである。このシステムは、第2図
にその一部を示すような補修用カタログの分解図(各部
品のイラストとその番号が印刷されている)をスキャナ
ーより読みこみ、部品番号をあらbす文字列を抽出した
後、文字認識プログラムにより文字コードに変換する。
大きな画像(約640 k bytes)中にイラス
トとともに点在する文字列を抽出しなければならないた
め、従来は専用ハードウェアかエンジニアリグ・ワーク
ステーションでなければ困難だとされていたアプリケー
ションである。
トとともに点在する文字列を抽出しなければならないた
め、従来は専用ハードウェアかエンジニアリグ・ワーク
ステーションでなければ困難だとされていたアプリケー
ションである。
(II)文字列検出
以下に1文字列検出の実施例について説明する。
■ 境界線分の検出
画像をラスター走査して、1ライン分ずつイメージを読
みこみ、ランレングス表現に変換する。
みこみ、ランレングス表現に変換する。
このとき、黒ランと黒ランの間の白ランが短い場合には
二つの黒ランを連結して一つの黒ランとして、その位置
データ(今の場合は、始点位置と長さ)を発生し、記録
しておく、これをグループ化ランレングス表現と呼ぶこ
とにする。以後の処理はこのグループ化ランレングス表
現上で行なわれ、画像に対するアクセスは生じない。
二つの黒ランを連結して一つの黒ランとして、その位置
データ(今の場合は、始点位置と長さ)を発生し、記録
しておく、これをグループ化ランレングス表現と呼ぶこ
とにする。以後の処理はこのグループ化ランレングス表
現上で行なわれ、画像に対するアクセスは生じない。
第3図は、ライン・イメージのグループ化ランレングス
表現への変換を例示したものである。ここでは、長さが
20未満の白ラン3A、3B、3Cを無視している。理
解を容易にするために、第3図では中間のランレングス
表現も記載したが、実際にはライン・イメージからグル
ープ化ランレングス表現が直接作られる。
表現への変換を例示したものである。ここでは、長さが
20未満の白ラン3A、3B、3Cを無視している。理
解を容易にするために、第3図では中間のランレングス
表現も記載したが、実際にはライン・イメージからグル
ープ化ランレングス表現が直接作られる。
グループ化ランレングス表現への変換は本来ならば画像
を1ドツトずつ調べて行わなければならない処理である
が5水力式では、第4図に示す一連のステップに従って
、バイトまたはワード単位での処理を可能にしている。
を1ドツトずつ調べて行わなければならない処理である
が5水力式では、第4図に示す一連のステップに従って
、バイトまたはワード単位での処理を可能にしている。
グループ化の際にはある長さ以下の白ランを無視してそ
の左右の黒ランとして表現しているが、その閾値はバイ
ト長(8)やワード長(16)よりも大きい。したがっ
て第5図のように読みこまれた8または16ビツト長の
データが複数の黒ランを含んでいても、黒ランの間に挟
まれた白ラン5A、5Bの長さを調べるまでもなく、そ
れらは連結しているものとして処理できる。つまり、白
ラン5A、5Bは無視される。ランレングス表現に変換
するためには左端の黒ランの始点とそこから右端の黒ラ
ンの終点までの長さがわかればよい。これらの値をバイ
トの場合は26個、ワードの場合は21C個のパターン
に対して求めてテーブルにしておき参照することにより
、バイト(ワード)単位で画像を読みこみ、あるバイト
(ワード)の右端の白ラン長と次のバイト(ワード)の
左端の白ラン長を加算して無視できる長さの白ランかど
うか判定し、グループ化ランレングス表現に変換してゆ
くことができる。
の左右の黒ランとして表現しているが、その閾値はバイ
ト長(8)やワード長(16)よりも大きい。したがっ
て第5図のように読みこまれた8または16ビツト長の
データが複数の黒ランを含んでいても、黒ランの間に挟
まれた白ラン5A、5Bの長さを調べるまでもなく、そ
れらは連結しているものとして処理できる。つまり、白
ラン5A、5Bは無視される。ランレングス表現に変換
するためには左端の黒ランの始点とそこから右端の黒ラ
ンの終点までの長さがわかればよい。これらの値をバイ
トの場合は26個、ワードの場合は21C個のパターン
に対して求めてテーブルにしておき参照することにより
、バイト(ワード)単位で画像を読みこみ、あるバイト
(ワード)の右端の白ラン長と次のバイト(ワード)の
左端の白ラン長を加算して無視できる長さの白ランかど
うか判定し、グループ化ランレングス表現に変換してゆ
くことができる。
連続する2ライン分のイメージがグループ化ランレング
ス表現に変換されたところで、これら2ラインに関する
黒ランの位置データを比較して、文字列領域(矩形)の
上下の境界候補となる黒ランを検出する。第6図に示す
ように、ある黒ランの上が白ランであればその黒ランは
上の境界候補の一部であるとし、逆に黒ランの下に白ラ
ンがある場合はその黒ランは下の境界候補の一部だと判
断する。
ス表現に変換されたところで、これら2ラインに関する
黒ランの位置データを比較して、文字列領域(矩形)の
上下の境界候補となる黒ランを検出する。第6図に示す
ように、ある黒ランの上が白ランであればその黒ランは
上の境界候補の一部であるとし、逆に黒ランの下に白ラ
ンがある場合はその黒ランは下の境界候補の一部だと判
断する。
第7図に示す一連のステップに従って、ランレングスで
表現された黒ランの始点の位置と長さを比較することに
より、上下の境界候補を検出することができる。第7図
において、黒ランの位置データとは黒ランの始点の位置
と長さの組みを意味する。また、図中の処理で境界候補
をもとめるとは境界候補の始点と長さを計算することを
いう。
表現された黒ランの始点の位置と長さを比較することに
より、上下の境界候補を検出することができる。第7図
において、黒ランの位置データとは黒ランの始点の位置
と長さの組みを意味する。また、図中の処理で境界候補
をもとめるとは境界候補の始点と長さを計算することを
いう。
具体的には、第8A図に示すように、黒ランAとその下
の黒ランBが重なっている場合は始点がi+1n(Aの
始点、Bの始点)で長さがwax(Aの始点。
の黒ランBが重なっている場合は始点がi+1n(Aの
始点、Bの始点)で長さがwax(Aの始点。
Bの始点) −akin (Aの始点、Bの始点)であ
るようなラン、第8B図に示すように黒ランAとBの重
なりのない場合はAとBのうち始点の値の小さいランそ
のものの位置データを求めることになる。
るようなラン、第8B図に示すように黒ランAとBの重
なりのない場合はAとBのうち始点の値の小さいランそ
のものの位置データを求めることになる。
境界候補の検出を画像全体に対して行うときはグループ
化ランレングス表現を記録しておく領域を2ライン分用
意しておき、iライン口とi+1ライン目のデータの比
較が終わったらi+1ライン目のデータをiライン目の
データのあった領域に移しく実際にはポインタの付は替
えですむ)、i+1ライン目のデータをおいていた領域
にi+2ライン目のイメージに対するグループ化ランレ
ングス表現をセットすることにる。
化ランレングス表現を記録しておく領域を2ライン分用
意しておき、iライン口とi+1ライン目のデータの比
較が終わったらi+1ライン目のデータをiライン目の
データのあった領域に移しく実際にはポインタの付は替
えですむ)、i+1ライン目のデータをおいていた領域
にi+2ライン目のイメージに対するグループ化ランレ
ングス表現をセットすることにる。
境界候補の検出後、第9八図ないし第9c図に示すよう
に、適当な閾値の範囲内で縦方向のずれや左右のとぎれ
をつなげる処理を行ってもよい。
に、適当な閾値の範囲内で縦方向のずれや左右のとぎれ
をつなげる処理を行ってもよい。
■文字列の検出
上境界候補すべてについて次の条件を満たす上境界候補
が存在するか調べる。
が存在するか調べる。
条件1: 上境界候補が上境界候補の下にあり、Y座標
の差がある範囲内(文字の高さの最小値と最大値の間)
である。ここで、Y軸は副走査方向に対応する。
の差がある範囲内(文字の高さの最小値と最大値の間)
である。ここで、Y軸は副走査方向に対応する。
条件2: 二つの境界線分候補の始点の位置と長さがあ
る閾値内で等しい。これらの条件が満たされたとき、二
つの境界線分候補のそれぞれの少なくとも一部を上下の
端とする文字列領域が存在すると判定する。
る閾値内で等しい。これらの条件が満たされたとき、二
つの境界線分候補のそれぞれの少なくとも一部を上下の
端とする文字列領域が存在すると判定する。
上境界候補と上境界候補の組合せに基づいて文字列領域
だと判断される矩形は、インプリメント(閾値)次第で
いかようにも変えることができる。
だと判断される矩形は、インプリメント(閾値)次第で
いかようにも変えることができる。
このアプリケーションにおいては、第9C図に示される
上下の境界候補の対を例にとると、始点の位置と長さが
ある閾値内で等しいと判断され、第10図に示す矩形1
01が文字列領域だと判定される。そして、左上の頂点
101Aの位置(XY座標)および2辺101B、l0
ICの長さが矩形101の位置データとして発生される
。第11図に示すような上下の境界の対を例にとると、
矩形111が文字列領域だと判定され、その位置データ
が発生される。
上下の境界候補の対を例にとると、始点の位置と長さが
ある閾値内で等しいと判断され、第10図に示す矩形1
01が文字列領域だと判定される。そして、左上の頂点
101Aの位置(XY座標)および2辺101B、l0
ICの長さが矩形101の位置データとして発生される
。第11図に示すような上下の境界の対を例にとると、
矩形111が文字列領域だと判定され、その位置データ
が発生される。
境界線分候補を上下の端とする長方形は必ずしも文字列
の外接長方形とはならないが前に述べたように文字列の
おおよその位置と大きささえわがっていれば個々の文字
の切り出し時または認識時にその補正を行うことは容易
である。
の外接長方形とはならないが前に述べたように文字列の
おおよその位置と大きささえわがっていれば個々の文字
の切り出し時または認識時にその補正を行うことは容易
である。
(ハ)その後の処理
第1図のアプリケーションでは最初に文字列検出ルーチ
ンが画像を1回走査した後、検出した文字列の位置デー
タをテーブルにセットする。システムはこのテーブルの
データにしたがって文字列周辺のイメージをロードし、
文字列の正確な外接長方形をもとめ1個々の文字の切り
出しと認識を行う。文字列検出ルーチンがイラストの一
部を文字列として検出してしまうこともあるが、それら
は文字の切り出しや認識の過程でチエツクされリジェク
トされる。
ンが画像を1回走査した後、検出した文字列の位置デー
タをテーブルにセットする。システムはこのテーブルの
データにしたがって文字列周辺のイメージをロードし、
文字列の正確な外接長方形をもとめ1個々の文字の切り
出しと認識を行う。文字列検出ルーチンがイラストの一
部を文字列として検出してしまうこともあるが、それら
は文字の切り出しや認識の過程でチエツクされリジェク
トされる。
なお、第1図に示す後処理ルーチンはアプリケーション
固有の知識を利用して誤りの検出や回復を行うルーチン
である。
固有の知識を利用して誤りの検出や回復を行うルーチン
である。
本実施例の長所を以下に述べる。
1)処理速度
本発明における画像へのアクセスはラスター走査1回分
ですみ、アクセスの単位もバイト(ワード)単位である
。したがって従来方法のどれよりも速い処理が期待でき
る。実際にパソコン(CPUはインテル社の80286
8MHzメモリーウェイト有り)上でC言語を用いて
インプリメンテーションを行い、第2図にその約1/6
を示す図面に対して文字列検出を行ったところ37秒(
イメージの入力を除く)ですべての部品番号を検出する
ことができた。2)検出精度 本発明ではイラスト中の文字列や図形と接触している文
字列であっても問題なく検出することができる。短い白
ランを無視するため左右の図形と連結してしまう文字列
もあるが他の図形との接触のために上下の境界そのもの
がなくなってしまうことはないからである。
ですみ、アクセスの単位もバイト(ワード)単位である
。したがって従来方法のどれよりも速い処理が期待でき
る。実際にパソコン(CPUはインテル社の80286
8MHzメモリーウェイト有り)上でC言語を用いて
インプリメンテーションを行い、第2図にその約1/6
を示す図面に対して文字列検出を行ったところ37秒(
イメージの入力を除く)ですべての部品番号を検出する
ことができた。2)検出精度 本発明ではイラスト中の文字列や図形と接触している文
字列であっても問題なく検出することができる。短い白
ランを無視するため左右の図形と連結してしまう文字列
もあるが他の図形との接触のために上下の境界そのもの
がなくなってしまうことはないからである。
3)圧縮データに対応可能
本発明はランレングス表現上で処理を行っており画像の
走査もラスタースキャン1回ですむので、MH方式やM
MR方式により圧縮されたデータを処理することが容易
である。これは従来方法(1)、(3)、(4)には無
い特長である。
走査もラスタースキャン1回ですむので、MH方式やM
MR方式により圧縮されたデータを処理することが容易
である。これは従来方法(1)、(3)、(4)には無
い特長である。
4)省メモリー
本発明で画像を走査するさいに必要になる作業領域は画
像1ライン分とランレングス表現2ライン分のみである
。また走査の過程で記録される境界線分候補は、ランレ
ングス表現への変換、白ランを埋めて1本の黒ランで表
す、上下の境界となるランだけを残す、という3段階の
圧縮・ふるいが行なわれた結果であり、必要な主記憶領
域が少なくてすむ。
像1ライン分とランレングス表現2ライン分のみである
。また走査の過程で記録される境界線分候補は、ランレ
ングス表現への変換、白ランを埋めて1本の黒ランで表
す、上下の境界となるランだけを残す、という3段階の
圧縮・ふるいが行なわれた結果であり、必要な主記憶領
域が少なくてすむ。
5)特定の大きさ(主に高さ)の文字列のみを検出の対
象にすることが可能。
象にすることが可能。
いずれの方法であっても文字列の外接長方形が求まって
しまえば特定の大きさの文字列を選ぶことは可能である
が、本発明では検出の過程において指定された範囲外の
大きさの文字列をふるいにかけることができる。このた
め、例えば見出しの文字列だけを検出する等の作業が他
の方式より高速に行える。
しまえば特定の大きさの文字列を選ぶことは可能である
が、本発明では検出の過程において指定された範囲外の
大きさの文字列をふるいにかけることができる。このた
め、例えば見出しの文字列だけを検出する等の作業が他
の方式より高速に行える。
6)水平線分の検出が可能
文字列と同様に水平線分の検出を行うことができる(上
境界線分候補と下境界線分候補のY座標の差が閾値以下
であれば文字列ではなく水平線分と判断される)。ry
JやrqJと接触しているアンダーラインの検出が可能
であり、個々の文字の切り出しの際に有用な情報となる
。
境界線分候補と下境界線分候補のY座標の差が閾値以下
であれば文字列ではなく水平線分と判断される)。ry
JやrqJと接触しているアンダーラインの検出が可能
であり、個々の文字の切り出しの際に有用な情報となる
。
以上の説明は読取対象となる文字列(複数個の文字で構
成されている)が横方向(ラスター走査の主走査の方向
)に延びている場合について行った0文字が縦に書かれ
ている場合には、前処理で画像を回転させる(90度単
位の回転を行う程度のハードウェアは、パソコンでも利
用可能になってきている)、スキャン時に図面を横にお
いて入力する等の工夫により、画像内において文字列の
延びる方向と該画像の主走査の方向とを一致させてやれ
ばよい。
成されている)が横方向(ラスター走査の主走査の方向
)に延びている場合について行った0文字が縦に書かれ
ている場合には、前処理で画像を回転させる(90度単
位の回転を行う程度のハードウェアは、パソコンでも利
用可能になってきている)、スキャン時に図面を横にお
いて入力する等の工夫により、画像内において文字列の
延びる方向と該画像の主走査の方向とを一致させてやれ
ばよい。
一つの文字が他の文字と極端に離れて書かれている場合
については、上下の境界線分候補の組みを調べる際((
■)の■の部分)の閾値の決め方である程度対応できる
。ただし、文字以外の図形を文字として検出してしまう
割合が高くなる。
については、上下の境界線分候補の組みを調べる際((
■)の■の部分)の閾値の決め方である程度対応できる
。ただし、文字以外の図形を文字として検出してしまう
割合が高くなる。
原稿が様々な方向に延びる文字列を含む場合には本発明
は不利だが、実質的に一方向に延びる文字列のみを含む
原稿については本発明はきわめて有利である。
は不利だが、実質的に一方向に延びる文字列のみを含む
原稿については本発明はきわめて有利である。
F、効果
本発明によれば、実質的に同一方向に延びる文字列のみ
を含む原稿を読取って得られる画像の中の文字列領域を
、高速かつ高精度で検出することができる。しかも、本
発明は汎用パソコン上で容易にインプリメントができる
。
を含む原稿を読取って得られる画像の中の文字列領域を
、高速かつ高精度で検出することができる。しかも、本
発明は汎用パソコン上で容易にインプリメントができる
。
第1図は、本発明を利用した部品番号入力システムの処
理の概略を示すフローチャート、第2図は、本発明で処
理される図面の例、第3図は、グループ化ランレングス
表現を説明するための図、第4図はライン・イメージを
グループ化ランレングス表現に変換する処理を説明する
ためのフローチャート、第5図は、バイト(またはワー
ド)内の黒ランにはさまれた白ランは無視して処理が行
えることを説明するための図、第6図は上境界・下境界
候補を説明するための図、第7図は、グループ化ランレ
ングス表現を比較して境界候補を検出する処理を説明す
るためのフローチャート、第8A図および第8B図は、
検出される境界候補を2つの異なる場合について説明す
るための図、第9A図ないし第9C図は、境界候補の上
下のずれや左右のとぎれをつなげる処理を説明するため
の図、第10図および第11図は文字列領域だと判断さ
れる矩形を説明するための図である。 また、第12図、第13図、第14図はそれぞれ従来方
法の(2)、従来方法の(3)、連長フィルタリング処
理を説明するための図である。 Nq Nψ 第5図 第8A図 第8BB 原画像 第9A図 検出1にt、L境界儂筒と丁境芥儂浦(長;2秩とのも
の4示1 )第9B図 と境界候補を二ついマ上下のずれやとぎ托を修正しプ二
例筒9C図 第11図 第123 ギ牛奢
理の概略を示すフローチャート、第2図は、本発明で処
理される図面の例、第3図は、グループ化ランレングス
表現を説明するための図、第4図はライン・イメージを
グループ化ランレングス表現に変換する処理を説明する
ためのフローチャート、第5図は、バイト(またはワー
ド)内の黒ランにはさまれた白ランは無視して処理が行
えることを説明するための図、第6図は上境界・下境界
候補を説明するための図、第7図は、グループ化ランレ
ングス表現を比較して境界候補を検出する処理を説明す
るためのフローチャート、第8A図および第8B図は、
検出される境界候補を2つの異なる場合について説明す
るための図、第9A図ないし第9C図は、境界候補の上
下のずれや左右のとぎれをつなげる処理を説明するため
の図、第10図および第11図は文字列領域だと判断さ
れる矩形を説明するための図である。 また、第12図、第13図、第14図はそれぞれ従来方
法の(2)、従来方法の(3)、連長フィルタリング処
理を説明するための図である。 Nq Nψ 第5図 第8A図 第8BB 原画像 第9A図 検出1にt、L境界儂筒と丁境芥儂浦(長;2秩とのも
の4示1 )第9B図 と境界候補を二ついマ上下のずれやとぎ托を修正しプ二
例筒9C図 第11図 第123 ギ牛奢
Claims (1)
- (1)実質的に同一方向に延びる文字列のみを複数個含
む原稿を読み取つて得られる画像の中の文字列領域を検
出する方法であつて、 (a)上記画像において上記文字列の延びる方向を該画
像の主走査方向と一致させて、上記原稿の画像データを
画像メモリに記憶し、 (b)上記画像メモリにアクセスして上記画像を走査す
ることにより、各ラインごとに、該ライン中の黒ランの
位置データを発生し、 (c)上記画像中の隣接する2つのラインの対の何れに
ついても、上記(b)のステップで得られた該2つのラ
イン中の黒ランの位置データを比較し、後行ライン中の
黒ランに先行ライン中の黒ランとは隣接しない部分があ
れば、該部分を文字列領域の第1種の境界候補と判断し
てその位置データを発生し、かつこれを記憶手段中のテ
ーブルに記憶するとともに、先行ライン中の黒ランに後
行ライン中の黒ランとは隣接しない部分があれば、該部
分を文字列領域の第2種の境界候補と判断してその位置
データを発生し、かつこれを上記テーブルに記憶し、 (d)上記テーブルを参照して、上記主走査方向に関す
る位置が共通する部分を持つ上記第1種の境界候補と第
2種の境界候補の対を決定し、対をなす境界候補のそれ
ぞれの少なくとも一部を境界として持つ矩形領域を文字
列領域と判断してその位置データを発生することを特徴
とする文字列検出方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63069969A JPH06101049B2 (ja) | 1988-03-25 | 1988-03-25 | 文字列検出方法 |
DE68922772T DE68922772T2 (de) | 1988-03-25 | 1989-02-06 | Verfahren zur Zeichenkettenermittlung. |
EP89301144A EP0334472B1 (en) | 1988-03-25 | 1989-02-06 | Methods of detecting character strings |
CA000592549A CA1309180C (en) | 1988-03-25 | 1989-03-02 | Method for detecting character strings |
US07/321,036 US5033104A (en) | 1988-03-25 | 1989-03-09 | Method for detecting character strings |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63069969A JPH06101049B2 (ja) | 1988-03-25 | 1988-03-25 | 文字列検出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH01253077A true JPH01253077A (ja) | 1989-10-09 |
JPH06101049B2 JPH06101049B2 (ja) | 1994-12-12 |
Family
ID=13417988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63069969A Expired - Fee Related JPH06101049B2 (ja) | 1988-03-25 | 1988-03-25 | 文字列検出方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5033104A (ja) |
EP (1) | EP0334472B1 (ja) |
JP (1) | JPH06101049B2 (ja) |
CA (1) | CA1309180C (ja) |
DE (1) | DE68922772T2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04303278A (ja) * | 1990-12-29 | 1992-10-27 | Gold Star Co Ltd | 圧縮映像の文字列分離方式 |
JP2017046248A (ja) * | 2015-08-27 | 2017-03-02 | 株式会社沖データ | 画像形成装置 |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5191438A (en) * | 1989-12-12 | 1993-03-02 | Sharp Kabushiki Kaisha | Facsimile device with skew correction and text line direction detection |
JPH03266677A (ja) * | 1990-03-16 | 1991-11-27 | Toshiba Corp | 画像形成装置 |
US5267325A (en) * | 1991-09-06 | 1993-11-30 | Unisys Corporation | Locating characters for character recognition |
GB9120902D0 (en) * | 1991-10-02 | 1991-11-13 | Bp Chem Int Ltd | Purification process |
US5321770A (en) * | 1991-11-19 | 1994-06-14 | Xerox Corporation | Method for determining boundaries of words in text |
CA2077969C (en) * | 1991-11-19 | 1997-03-04 | Daniel P. Huttenlocher | Method of deriving wordshapes for subsequent comparison |
CA2077970C (en) * | 1991-11-19 | 1999-02-23 | Daniel P. Huttenlocher | Optical word recognition by examination of word shape |
JP3576570B2 (ja) * | 1991-11-19 | 2004-10-13 | ゼロックス コーポレイション | 比較方法 |
US5594814A (en) * | 1992-10-19 | 1997-01-14 | Fast; Bruce B. | OCR image preprocessing method for image enhancement of scanned documents |
JP3042945B2 (ja) * | 1993-07-07 | 2000-05-22 | 富士通株式会社 | 画像抽出装置 |
JP3599367B2 (ja) * | 1993-12-29 | 2004-12-08 | キヤノン株式会社 | 画像処理装置およびその方法 |
US6744921B1 (en) | 1993-12-29 | 2004-06-01 | Canon Kabushiki Kaisha | Image processing apparatus and method that determines the thickness of characters and lines |
US6795576B2 (en) * | 1994-07-29 | 2004-09-21 | Canon Kabushiki Kaisha | Image processing method and apparatus |
US6005680A (en) * | 1995-04-04 | 1999-12-21 | Canon Information Systems, Inc. | Method for capturing a document image, a scanner using the method and a document image management system using the scanner |
US5915039A (en) * | 1996-11-12 | 1999-06-22 | International Business Machines Corporation | Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition |
US5995661A (en) * | 1997-10-08 | 1999-11-30 | Hewlett-Packard Company | Image boundary detection for a scanned image |
JP3204259B2 (ja) * | 1999-10-06 | 2001-09-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置 |
US6950553B1 (en) * | 2000-03-23 | 2005-09-27 | Cardiff Software, Inc. | Method and system for searching form features for form identification |
US7054509B2 (en) * | 2000-10-21 | 2006-05-30 | Cardiff Software, Inc. | Determining form identification through the spatial relationship of input data |
US6807309B1 (en) * | 2000-12-27 | 2004-10-19 | Canon Kabushiki Kaisha | Linear list compression |
US7400768B1 (en) * | 2001-08-24 | 2008-07-15 | Cardiff Software, Inc. | Enhanced optical recognition of digitized images through selective bit insertion |
JP2007104642A (ja) * | 2005-09-07 | 2007-04-19 | Toshiba Corp | 画像処理方法、画像処理装置および記録物 |
US8620080B2 (en) * | 2008-09-26 | 2013-12-31 | Sharp Laboratories Of America, Inc. | Methods and systems for locating text in a digital image |
JP5357612B2 (ja) * | 2009-04-13 | 2013-12-04 | 株式会社日立ソリューションズ | 下線除去装置 |
EP3749589A1 (en) | 2018-02-05 | 2020-12-16 | Ecolab USA, Inc. | Packaging and docking system for non-contact chemical dispensing |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3805237A (en) * | 1971-04-30 | 1974-04-16 | Ibm | Technique for the conversion to digital form of interspersed symbolic and graphic data |
US4229768A (en) * | 1978-03-30 | 1980-10-21 | Canon Kabushiki Kaisha | Information processing apparatus |
US4517604A (en) * | 1983-04-04 | 1985-05-14 | International Business Machines Corporation | Method for reducing line width variations in bilevel video images |
DE3414455C2 (de) * | 1983-04-26 | 1996-04-25 | Wollang Peter Michael | Verfahren und Vorrichtung zum Lesen und Verarbeiten von Information, die aus dekodierbarer Schriftinformation und/oder nichtdekodierbarer Graphikinformation besteht |
-
1988
- 1988-03-25 JP JP63069969A patent/JPH06101049B2/ja not_active Expired - Fee Related
-
1989
- 1989-02-06 EP EP89301144A patent/EP0334472B1/en not_active Expired - Lifetime
- 1989-02-06 DE DE68922772T patent/DE68922772T2/de not_active Expired - Fee Related
- 1989-03-02 CA CA000592549A patent/CA1309180C/en not_active Expired - Lifetime
- 1989-03-09 US US07/321,036 patent/US5033104A/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04303278A (ja) * | 1990-12-29 | 1992-10-27 | Gold Star Co Ltd | 圧縮映像の文字列分離方式 |
JP2017046248A (ja) * | 2015-08-27 | 2017-03-02 | 株式会社沖データ | 画像形成装置 |
Also Published As
Publication number | Publication date |
---|---|
DE68922772D1 (de) | 1995-06-29 |
EP0334472A3 (en) | 1992-04-29 |
EP0334472B1 (en) | 1995-05-24 |
DE68922772T2 (de) | 1995-11-30 |
EP0334472A2 (en) | 1989-09-27 |
CA1309180C (en) | 1992-10-20 |
US5033104A (en) | 1991-07-16 |
JPH06101049B2 (ja) | 1994-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH01253077A (ja) | 文字列検出方法 | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
KR100390264B1 (ko) | 폼처리중자동페이지등록및자동영역검출을위한시스템및방법 | |
US5335290A (en) | Segmentation of text, picture and lines of a document image | |
US6640010B2 (en) | Word-to-word selection on images | |
Kasturi et al. | Document image analysis: A primer | |
US5854854A (en) | Skew detection and correction of a document image representation | |
JP4065460B2 (ja) | 画像処理方法及び装置 | |
EP1999688B1 (en) | Converting digital images containing text to token-based files for rendering | |
Das et al. | A fast algorithm for skew detection of document images using morphology | |
JP3259993B2 (ja) | 語形測定方法及び画像信号処理方法 | |
JPH05282495A (ja) | 比較方法 | |
JPH05242292A (ja) | 分離方法 | |
US10423851B2 (en) | Method, apparatus, and computer-readable medium for processing an image with horizontal and vertical text | |
Shafii | Optical character recognition of printed persian/arabic documents | |
Borovikov | A survey of modern optical character recognition techniques | |
Liebl et al. | From historical newspapers to machine-readable data: the origami OCR pipeline | |
RU2626656C2 (ru) | Способ и система определения ориентации изображения текста | |
Verma et al. | Removal of obstacles in Devanagari script for efficient optical character recognition | |
StevensÝ et al. | Automatic processing of document annotations | |
Bhaskar et al. | Implementing optical character recognition on the android operating system for business cards | |
US20030123730A1 (en) | Document recognition system and method using vertical line adjacency graphs | |
Kesidis et al. | Providing access to old Greek documents using keyword spotting techniques | |
CN115497115B (zh) | 基于深度学习的页眉页脚检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |