JP3547025B2 - 情報抽出方法 - Google Patents
情報抽出方法 Download PDFInfo
- Publication number
- JP3547025B2 JP3547025B2 JP23340095A JP23340095A JP3547025B2 JP 3547025 B2 JP3547025 B2 JP 3547025B2 JP 23340095 A JP23340095 A JP 23340095A JP 23340095 A JP23340095 A JP 23340095A JP 3547025 B2 JP3547025 B2 JP 3547025B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- pixel
- information
- pixels
- unknown
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/155—Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
- Character Input (AREA)
- Processing Or Creating Images (AREA)
Description
【発明の属する技術分野】
本発明は、仕上げられた(情報が書き加えられた)フォームドキュメントの走査画像から、情報を抽出するための情報抽出方法および画像修復方法並びに画像修復システムに関し、特に、フォームドキュメント上の情報を電気的に取得し、該情報のうち、フォームドキュメントに書き加えられた情報をフォームドキュメント自体の情報と識別する技術に関する。
【0002】
【従来の技術】
在来のドキュメント処理において共通の問題は、種々のフォームタイプのドキュメントから情報を抽出することにある。フォームドキュメントは、典型的には、空欄(ブランク)や空いた領域をもつ予め印刷された紙シートであり、フォームドキュメント上への情報は、フォームを仕上げる個々の者によってフォームドキュメントに書き込まれる(書き加えられる)ようになっている。このフォームは、これに書き込まれた情報に基づいて所定の行動をとることが予期される者,すなわちこれに書き込まれた(書き加えられた)情報を最終的に必要とする者によって処理される前に、幾人かの者の手に渡り、各々の者がこのフォームにさらに追加の情報を書き加えることも考えられる。これに書き込まれた情報を最終的に必要とする者は、例えば、このフォームに予め印刷されている部分と関連させてこのフォームに書き加えられた情報を解釈して、決定を行なったり特定の行動をとる。このようなフォームは、良く知られており、例えば、購買注文票,出荷伝票,労務管理簿,保険記録票などがある。
【0003】
このようなフォームの処理を容易にし、また、これらのフォームから情報を抽出するのに、フォームに書き加えられている情報をフォームに予め印刷されている情報から分離するのが望ましい。例えば、このフォームを仕上げる個々の者の名前および住所の情報を抽出し、この情報を、予め印刷されている名前,住所,市などの欄の情報(ブランクフォーマットの情報)と識別するのが望ましい。
【0004】
例えば良く知られているドキュメントスキャナを用いて、このフォームを走査する場合、このフォームに予め印刷されている情報は、このフォームに書き加えられている情報とともに、検出される。光学的文字認識や他の同様な技術を用いる場合には、このような処理の後になされるドキュメント処理動作においてこのフォームに書き加えられた情報だけを用いることができるように、2種類の情報を分離するのは非常に難しい。
【0005】
【発明が解決しようとする課題】
この問題を解決する一手段として、従来では、フォームについて特定の印刷カラー(色)を用い、また、仕上げたフォームを走査する際に、上記特定の印刷カラー(色)と整合のとれたカラーフィルタ(色フィルタ)を用いていた。このような場合に、フォームに予め印刷されているカラーインクとは異なるカラーインクを用いてフォームを仕上げる(フォームに情報を書き込む)。
【0006】
仕上げられたフォームの走査中、フォームドキュメント自体がスキャナによって読取られずに、フォームに書き加えられた情報だけがスキャナで検出できるように、整合カラーフィルタが用いられる。この技法は、実用的ではあるが、フォームの供給者やフォームの使用業務が非常に多種のフォームを取扱う場合には、これに対応させて、非常に多種のカラーフィルタが必要となる。
【0007】
また、上記問題を解決する他の手段として、従来では、標準的なテストフォームにおけるテストの問題とこれに対する答えのように、答えの部分をドキュメント自体と分離させるドキュメント処理技術を用いていた。米国特許第5,229,589号には、この技術の一例が示されており、仕上げられた(情報が書き加えられた)答案を走査して読み込み、読み込まれた答案画像から空白(ブランク)の答案画像を差し引き、書き加えられた情報を検出するようにしている。しかしながら、このような技法では、書き加えられた情報が元の空白(ブランク)の答案部分と重なり合うときに、書き加えられた情報のうち元の空白(ブランク)の答案部分と重なり合う情報が除去されてしまい、これによって、書き加えられた情報の内容を解釈するのに、手書き文字認識,光学文字認識や他の手法を使用することができなくなるという欠点がある。
【0008】
フォームから情報を抽出する他の技法は、米国特許第5,140,650号に記載されている。この特許では、空白のフォーム(ブランクフォーム)と仕上げられた(書き込まれた)フォームとの各々を走査し、空白のフォームの画像を仕上げられたフォームの画像と比較する。次いで、マスク領域を定めてデータを抽出し、次いで、このデータを光学文字認識によって解析する。しかしながら、この技法では、フォームの除去処理において、データが存在する領域のフォームの全てが常に除去されるわけではないので、エラーが生じ、この結果、解析にエラーが生じてしまう。
【0009】
本発明は、特別なカラーフィルタや特別なフォームなどを用いる必要なく、フォームに書き加えられた情報をフォーム自体に含まれている情報から良好に識別(電気的に分離)することの可能な情報抽出方法を提供することを目的としている。
【0010】
【課題を解決するための手段】
上記目的を達成するために、請求項1記載の発明では、ユーザによって情報が書き加えられる前のドキュメントの画像を第1画像として取得し、ユーザによって情報が書き加えられた後のドキュメントの画像を第2画像として取得し、第2画像から第1画像を差し引き、差し引いた結果の画像を作成し、差し引き画像において、第2画像から第1画像を差し引いたことによって除去された、ユーザによって書き加えられた情報の除去部分を修復するようになっており、前記差し引いた結果の画像において、差し引かれた部分の画素を未知画素領域の画素として特定し、閾値および近傍配置を設定し、前記未知画素領域内の各画素に対して、その近傍配置によって規定される領域内に存在する既知画素の個数を計数し、該計数値が閾値よりも大きい場合には、その未知画素に対して値を計算して与え、全ての未知画素について上記各処理を繰り返し行ない、上記の処理において値が計算された画素について、これを未知画素領域から取り除いて、既知画素領域に加え、所望の場合には、前記閾値を調整し、未知画素の個数が所望個数となるまで前記各処理を繰り返すことを特徴としている。
【0012】
また、請求項2乃至請求項6記載の発明では、請求項1記載の情報抽出方法において、前記近傍配置は、未知画素に隣接し、未知画素を取り囲む幾何学的領域であり、また、前記閾値は、近傍の画素数よりも小さな値であり、また、未知画素の値は、近傍画素のうち既知の値をもつ既知画素の値に数学的演算を施して計算され、また、各画素はマトリックスに配置され、前記近傍配置は3×3の大きさの領域であり、また、閾値を調整する場合には、閾値を“1”ずつ減少させることを特徴としている。
【0013】
また、請求項7記載の発明では、請求項1記載の情報抽出方法において、前記差し引き処理は、前記第2画像から前記第1画像を差し引く前に、第1画像において情報をもつ画素を膨張し、これによって、第2画像から差し引かれるべき画素数を増加させる工程を含むことを特徴としている。
【0014】
また、請求項8乃至請求項11記載の発明では、請求項1記載の情報抽出方法において、前記第2画像は、ユーザによって情報が書き加えられたドキュメントを走査することによって得られ、また、前記第1画像は、ユーザによって仕上げられたドキュメントに対応したブランクドキュメントを走査することによって得られ、また、前記差し引き処理は、第1画像と第2画像とを電気的に比較し、第1画像と第2画像との両方に同じ情報をもつ領域を第2画像から差し引くことによってなされ、また、前記差し引き処理は、前記第2画像から前記第1画像を差し引く前に、第1画像において情報をもつ画素を膨張し、これによって、第2画像から差し引かれるべき画素数を増加させる工程を含むことを特徴としている。
【0017】
【発明の実施の形態】
以下、本発明の実施形態を図面に基づいて説明する。本発明は、特別なカラーフィルタや特別なフォームなどを用いる必要なく、フォームに書き加えられた情報をフォーム自体に含まれている情報から識別(電気的に分離)することを意図している。
【0018】
このため、本発明では、仕上げられた(情報が書き加えられた)フォームとともに、空白(ブランク)のフォーム(すなわち、情報が書き加えられていない状態でのフォーム)を走査し、これら2つのフォームドキュメントをほぼ整列させることによって、フォーム自体を表現する画素を仕上げられたフォームの画像から差し引き、フォームに書き加えられたもののみの画像を抽出し(残し)、次いで、本願の発明者によって案出された画像修復処理を用いて、フォームに書き加えられたもののみの画像に修復処理を施して、フォームに書き加えられた全ての情報を修復するようになっている。これにより、在来の手書き文字認識技術,光学文字認識技術や他の技術を用いることができて、本発明の処理によって得られた情報を他の装置で使用することができる。
【0019】
図1は本発明に係る情報抽出装置の構成例を示す図である。図1を参照すると、この情報抽出装置は、ユーザによって情報が書き加えられる前のドキュメントの画像を第1画像として取得する第1画像取得部1と、ユーザによって情報が書き加えられた後のドキュメントの画像を第2画像として取得する第2画像取得部2と、第2画像から第1画像を差し引き、差し引いた結果の画像を作成する差し引き画像作成部3と、差し引き画像において、第2画像から第1画像を差し引いたことによって除去された、ユーザによって書き加えられた情報の除去部分を修復する修復部4とを備えている。
【0020】
すなわち、本発明の好敵な実施形態では、ドキュメントすなわちフォームに書き加えられた情報を電気的に抽出するのに、先ず、ユーザによって情報が書き加えられる前の状態でのドキュメントの画像(すなわち、例えば、空白フォーマット(ブランクフォーマット)に所定情報が予め印刷されているようなドキュメントの画像)を第1画像として獲得し、次いで、このドキュメントにユーザによって情報が書き加えられた後のこのドキュメントの画像を第2画像として獲得し、このように第1画像および第2画像の2つの画像を獲得した後、ドキュメントに印刷されている情報に対応する第1画像の各領域ごとに、各領域を第2画像から除去し、これによって、第2画像から第1画像を差し引いた(除去した)画像に相当する画像を作成し、最後に、ユーザによって書き加えられた情報のうち、上記のような除去処理で除去された情報を電気的に修復するようになっている。
【0021】
好ましくは、ドキュメントを走査することによって第1画像および第2画像を電気的に取得し、次いで、これら2つの画像を整列させ、第2画像(情報が書き加えられたフォームの画像)から第1画像(ブランクフォームの画像)を差し引くのが良い。この差し引き処理により、ユーザによって書き加えられた情報のうちある部分が除去されてしまうことがあるが、本発明では、この画像を修復するために、この画像に所定の処理を行なうに先立って、画像の継なぎ処理(image continuation technique)を用いるようにしている(上記修復部4に画像継なぎ技術を用いるようにしている)。
【0022】
この“画像継なぎ技術”は、既知の画素値をもつある定まった画像領域(既知画像領域)と未知の画素値をもつある定まった画像領域(未知画像領域)との知識に基づいて、既知画像領域と未知画像領域とを有する画像に対して修復処理を行なう技術である。例えば、後述のように、図8には、黒領域が全て既知の画素値をもつ画像領域である一方、白領域が既知の画素値と未知の画素値との両方をもつ画像領域が示されている。すなわち、オリジナルフォームの水平ラインが除去された領域については、その画素値が黒であるか白であるかは未知である(文字領域では、ユーザが情報を書き加えており、一方、文字間の領域では、ユーザは情報を書き加えていない)。本発明の画像継なぎ技術では、画素値が未知あるいは不確かな値をもつ未知画素領域(ドロップアウト領域),図8の例では水平ラインの除去された領域に含まれる画素に対してのみに画像処理を施すようにしている。
【0023】
すなわち、本発明の画像継なぎ技術では、所定の未知画素領域(上記例では、水平ラインの除去された領域)内の各画素が当初、完全に未知の値あるいは不確かな値をもつ未知画素であるとし、未知画素領域内の特定の未知画素に着目するとき、該未知画素の近傍画素のうちで既知の値をもつ既知画素の個数が所定の閾値よりも大きい場合に限り、近傍画素のうちの既知画素の値を用いて未知画素の値を決定する一方、既知画素の個数が所定の閾値よりも小さいときには、未知画素の値を決定せず未知画素のまま残すようになっており、未知画素領域内の各画素について所定の閾値での前記処理がなされた後、値の決定された未知画素を既知画素として既知画素領域に組み込む。そして、残された未知画素について上記の処理を繰り返し行ない、残された未知画素について最早、値が得られなくなると、閾値を変更し、残されている未知画素に対して前記処理を繰り返し行なうようになっている。
【0024】
ここで、閾値および近傍領域(近傍配置)については、初期条件として設定される。近傍領域は、修復されるべきターゲート画素(ある1つの未知画素)を取り囲む例えば所定数の画素からなる幾何学的領域のことである。また、閾値は、近傍領域の画素のうちの既知画素の個数に対して設定される。
【0025】
より詳細には、本発明の画像継なぎ技術では、1つの未知画素領域(ドロップアウト領域)内の各画素について、その近傍領域に関して解析を行なう。この近傍領域内において、未知画素ではない画素(すなわち既知画素)の個数を計数する。この結果、計数値が閾値よりも小さい場合は、未知画素の値を決定せず、計数値が閾値よりも大きい場合に、未知画素の値を計算する。この計算は、例えば、近傍領域の各画素の値の平均をとることによってなされる。あるいは、他の例として、黒画素に対して白画素よりも大きな重み付けを行なうことによってなされる。例えば、平均が黒画素比率で0.33以上(白画素比率で0.67以下)であれば、未知画素の値を黒とする。未知画素を解析してその値を計算する上記の処理は、閾値よりも大きな個数の近傍画素をもつ未知画素が残らなくなるまで(「近傍画素の個数が閾値を超える」という閾値判定条件を満たす未知画素が残らなくなるまで)、続けられる。
【0026】
このようにして、各未知画素について、計数値が閾値よりも大きいか否かを判断し、計数値が閾値よりも大きい未知画素についてのみ、画素値が計算されると、計算された画素値を未知画素領域に戻す(設定する)。これにより、値の計算された未知画素は既知画素となり、未知画素領域の大きさ(サイズ),すなわち未知画素は減り、既知画素領域,すなわち既知画素は増加する。しかる後、残された未知画素を解析してその結果を閾値と比較する処理を繰り返し行なう。この処理は、値を計算できる未知画素の個数(上記閾値判定条件を満たす未知画素の個数)が十分少なくなるまで(例えば“0”になるまで)、続けられる。しかる後、閾値を減少させて、同様の処理を繰り返し行なう。このようにして、全ての未知画素は、最終的に既知画素となり、これにより、画像が修復される。
【0027】
図2は本発明を実現するためのシステムの一例を示す図である。図2のシステムは、コンピュータシステム200を有している。このコンピュータシステム200には、例えば、ワークステーションやパーソナルコンピュータ、あるいは、特別な画像処理用コンピュータを有する良く知られたコンピュータシステムを用いることができる。コンピュータシステム200には、画像情報を少なくとも一時的に蓄積するための画像蓄積装置(画像蓄積媒体)203が接続されている。画像蓄積装置203としては、半導体メモリ,ハードディスクメモリ,テープ装置などの良く知られた記憶装置を用いることができる。
【0028】
また、コンピュータシステム200には、画像取得システム(画像入力システム)205が接続されている。この画像取得システム205には、画像を読取って、画像をデジタル画素値アレイに変換する機能を有するもの、例えば、スキャナ,ファクシミリ,複写機等の良く知られた画像入力システムを用いることができ、画像取得システム205としては処理されるべきアナログ画像をデジタル情報に変換しうるものであれば良く、画像取得システム205の特徴等については本発明にとって重要ではない。さらに、ある用途では、コンピュータシステム200には、表示/制御装置208が接続される。表示/制御装置208としては、キーボード,モニタ,あるいはコンピュータシステム200の動作を制御するための他の制御装置を用いることができる。また、表示/制御装置208として、本発明のシステムを起動するための付加的なプッシュボタンや他の簡単な装置を用いることもできる。さらには、表示/制御装置208を自動制御装置として構成し、ユーザから見えないようにすることもできる。このため、図において、表示/制御装置208を破線で囲んでいる。図2のシステムは、コンピュータプログラムの制御の下で作動し、本発明の情報抽出処理,画像修復処理を実行するようになっている。
【0029】
ここで、ブランクフォームの画像と仕上げられたフォームの画像とは、画像取得システム205によって得られ、それぞれ画像蓄積装置203に格納される。次いで、コンピュータシステム200は、仕上げられたフォームの画像をブランクフォームの画像から差し引き、その結果の画像に対して修復処理を施すようになっている。
【0030】
図3,図4は本発明の画像修復処理(図1の修復部の処理)の処理例を示すフローチャートである。なお、画像修復処理を実際に開始する前提として、差し引かれた結果の画像データ(画素データ)(ステップ100)において、未知画素からなる未知画素領域(ドロップアウト領域)と、未知画素領域以外の既知画素からなる既知画素領域とが、特定されており、未知画素領域の各未知画素の存在する位置(例えばメモリ内位置)がわかっている必要がある(ステップ110)。いまの場合、未知画素領域の各未知画素の位置は、オリジナルドキュメント(ブランクドキュメント)の黒画素によって特定される。すなわち、ブランクドキュメントの黒画素に対応する画素が未知画素として特定される。
【0031】
また、1つの未知画素に対する近傍画素が予め定義されている必要がある(例えば、近傍の形状,大きさなど)(ステップ117)。また、閾値kの初期値が設定されている必要がある(ステップ120)。なお、閾値kの初期値は、例えばオペレータの指定によって設定することができる。また、処理演算の種類(例えば近傍画素のうちの既知画素の値の平均値をとるなどの演算の種類)が設定されている必要がある。
【0032】
すなわち、近傍画素の定義,閾値の初期値,演算の種類が、処理対象となる画像の種類(例えば、画像が2値画像であるか多値画像であるかなど)に応じて、あるいは、未知画素領域の種類(未知画素領域の大きさ,形状など)に応じて、適切なものに設定されている必要がある。
【0033】
このような前提が整った後、実際の修復処理を開始する。すなわち、先ず、差し引かれた画像の画素データを解析して、画像中に、未知画素が残っているか否かを調べる(ステップ102)。この処理は、例えばメモリ等に保持されている未知画素の個数および位置の記録を参照することによってなされる。未知画素の個数が、“0”(あるいは許容されうる程度の小さい数)になると、処理を終了する(ステップ112)。
【0034】
これに対し、未知画素が画像中に残っているならば、次の未知画素位置を読出す(ステップ114)。ステップ115では、いま読出した未知画素に関して、既知のデータ値をもつ近傍画素の個数をカウントする。
【0035】
ここで、近傍画素は、前述のようにステップ117で予め定義されており、近傍画素として、例えば近傍画素のすぐ近くの画素(例えば隣接画素),すなわち、未知画素として選択された1つの画素を囲む8つの画素を定義することができる。これらの8つの画素は、1つの未知画素の上の行の3つの画素と、未知画素の下の行の3つの画素と、ドロップアウト画素の左右のそれぞれ1つの画素とからなっている。
【0036】
なお、この近傍の定義は任意であることが認識されるべきである。従って、ステップ117においては、画像のタイプ,品質が異なる毎に、システムの性能を最適化するよう、「近傍」の定義を選ぶことができる。例えば、他のタイプの画像では、半球レンズ状のパターン,より大きい領域のパターン,あるいは他のパターンを用いることができる。
【0037】
既知のデータ値をもつ近傍画素数のカウントが完了すると、このカウント値KNを閾値kと比較する(ステップ122)。
【0038】
ここで、閾値kは、前述のようにステップ120で予め初期設定されており、この閾値は、既知の値をもっている必要がある近傍画素の数に対応している。1つの例では、この閾値は、“7”(8つの近傍画素のうち7個)に設定されている。8つの近傍画素に対して“7”の閾値を用いることによって、処理結果画像は高品質のものとなる。処理をより高速にするために、後述のように、より小さな値の閾値を選択することもできる。
【0039】
ある1つの未知画素に関し、既知のデータ値をもつ近傍画素数が十分でなく、閾値kよりも小さい場合には、この未知画素を未知画素のまま残し、次の未知画素を選択するため、ステップ114に戻る。これに対し、ステップ122において、近傍画素数が閾値kと同じかこれよりも大きい場合には、この未知画素に対して、新しい値を計算する(ステップ125)。この新しい値は、適当な手段を用いて計算することができる。例えば、近傍の画素の値の平均値として計算できる。あるいは、変形例として、あるドキュメントの解析においては、1つのカラーの画素(例えば黒画素)を他のカラーの画素(例えば白画素)よりも優先させるのが好ましいことがある。このような場合、1つのカラーの画素(例えば黒画素)に対する閾値(重み付け)を、他のカラーの画素(例えば白画素)に対する閾値(重み付け)と異なるものに設定することができ、これにより、未知画素の画素値を良好に決定できる可能性をより一層増加させることができる。もちろん、重み付け平均や、統計的相関のようなより複雑な数学演算を含む他の手法を用いたり、より大きな比較領域を用いて、計算することもできる。
【0040】
ステップ125において、1つの未知画素の値が計算されると、値を計算することの可能な他の未知画素が残っているか否かを調べる(ステップ127)。値を計算することの可能な他の未知画素がまだ残っている場合には、次の未知画素を取り込み、ステップ114に戻る。このような処理を繰り返し、最早、値を計算することができる未知画素がなくなると、ステップ130に進む。このことからわかるように、この段階の処理では、多数の未知画素が残っている可能性があるが、これらの画素はいずれも、既知の値を持つ近傍画素の個数が閾値を満たしていないもの(閾値よりも小さいもの)である。
【0041】
値を計算することができる未知画素が最早なくなると、画像は、新しい値に更新される。換言すれば、いま計算のなされた結果、値をもった未知画素を、既知画素として、計算された値を用いて画像中に戻す。これにより、既知の画素の組が拡張し、未知画素の組は減少する。
【0042】
次に、“十分”な個数の未知画素が更新されたかを調べる(ステップ135)。ここで、“十分”な個数を、任意所望の画素数,パ−セント,あるいは他の画素尺度のものにすることができる。このステップ135のゴールは、システムの繰り返し数を学習することである。例えば、上記ステップ114乃至130を繰り返し行なった結果、1つ,2つ,あるいは2,3の画素の値しか計算できなかった場合には、閾値を設定し直すことによって、より効率的に処理を行なうことができる。十分な(多数の)画素が更新されたならば、次の画素を処理するため、ステップ114に戻る。
【0043】
これに対し、少数の画素しか更新されなかった場合には、画素の更新を促進するため、閾値を設定し直すことができる。この場合、ステップ102に戻り、次の繰り返し処理がなされる。未知画素が最早残っていない場合には、処理を終了する(ステップ112)。
【0044】
要約すると、本発明の方法では、画像からの既知の情報と未知画素の位置についての既知の情報とを使用している。また、未知画素の各々について、画像中の局所的な近傍画素を考慮している。十分な近傍情報が知られているならば、その未知画素の位置をマークし、その位置に値をセーブする。各未知画素を順次に調べた後、マークされた位置の値によって、画素を更新し、次いで、これらを未知画素でなく既知画素とする。これによって、次の処理では、既知の画素の個数が増加している。このような処理を繰り返し行なって、値を計算することのできる未知画素の個数が十分に小さくなると(例えば“0”になると)、必要に応じ、閾値を変更して処理を繰り返し行ない、全ての未知画素位置が値をもつようになったとき、最終的に処理を終了する。
【0045】
好適な例では、全ての未知画素が値をもったときに(修復されたときに)処理を終了するようになっているが、未知画素の全てが値をもつ必要はなく(すなわち、未知画素の全てが修復される必要はなく)、この場合でも処理を終了することができる。
【0046】
元の画像は、任意のものであるので、本発明は、元の画像情報の内容については何ら条件を設けていない。全ての必要な情報は、画素レベルである。
【0047】
上述した本発明の画像修復処理の第1の特徴(利点)は、未知画素領域内の画素の値のみを決定することにある。すなわち、画像中の全ての画素に対する処理を行なうのではなく、画像中の一部の領域の画素に対してだけ処理を行なうので、画像処理時間を従来に比べ短縮することができ、また、処理を行なう必要のない既知画素領域内の画素については処理を行なわないので、全体の画像品質を劣化させずに済む。
【0048】
また、上述した処理の第2の特徴(利点)は、未知画素のうち、最も信頼性良く値が決定されうる画素から順に、値を決定することである。すなわち、既知の値をもつ近傍画素数が最も多い未知画素から順に値が決定される。
【0049】
また、上述した処理の第3の特徴(利点)は、未知画素の値が決定され、この未知画素が既知の値をもつ既知画素となるとき、次の段階で、この画素を近傍画素の既知の値をもつ画素の仲間に加えて、未知のまま残っている画素の値を決定することにある。これにより、各画素の連続性を確保することができる。
【0050】
また、上述した処理の第4の特徴(利点)は、画像の種類に依らず、全ての種類の画像を処理対象とすることができることにある。すなわち、近傍画素の定義,閾値の初期値,演算の種類を適宜設定することにより、画像が2値画像であっても、また、多値画像であっても、差し引かれた画像の修復を良好に行なうことができることにある。
【0051】
図5はフォームの一例を示す図である。図5に示すフォームは、このフォームを仕上げる(このフォームに情報を書き加える)ユーザにその指示を与える各種の印刷領域を有しているという点で、代表的なものである。図5に示すフォームの場合、一人以上のユーザがこのフォームに情報を書き込み(書き加え)、このフォームを他の場所に持ち運び、そこで、ドキュメント処理を行なう。ドキュメント処理では、このフォームにユーザによって書き加えられた情報を抽出し、抽出した情報を用いることができるようにするのが望ましい。仕上げられた(情報が書き加えられた)フォームを処理するための光学文字認識や他の技術は、フォームを仕上げるためのユーザへの指示情報をも含めて、フォーム上の全ての情報を抽出するので、ユーザによって書き加えられた情報を処理するに先立って、この指示情報を除去するのが望ましい。フォームから指示情報,ライン等を除去することによって、これらが除去された結果の情報を、単に画像としてでなく、情報内容として処理することが可能となる。ここで、ユーザによる情報の書き込みがなされる前のドキュメントの情報内容を表わすのに、以後、“ブランクフォーム(空白のフォーム)”,“ブランクフォーマット(空白のフォーマット)のドキュメント”などの用語を用いる。
【0052】
図6は図5に示すドキュメントが一人あるいはそれ以上のユーザによって部分的に仕上げられた(情報が書き込まれた)後の状態を示す図である。図6に示すように、フォームには、個人証明に関する情報が書き加えられている。図6に示す情報,すなわちユーザによって情報が書き加えられた後のドキュメントを、“仕上げられた(書き加えられた)フォーム”と称する。
【0053】
本発明は、仕上げられるフォームの内容(中身)に関するものであるが、本発明は、2つのドキュメント間の相違を電気的に検出し、所望の仕方で処理する任意の用途に適用可能であることが認識されるべきである。ユーザによってドキュメントに書き加えられる情報と等価なものとして、例えば、任意の種類のドキュメントに付された注釈を考えることができる。従って、本発明は、オリジナルドキュメントのコピーをとることが可能な限り、同じドキュメントの2つのバージョン間の変化を検出するのに適用可能である。
【0054】
本発明の好適な実施形態では、図5および図6に示すように情報が書き加えられる前のドキュメントと情報が書き加えられた後のドキュメントとのそれぞれについて、フォームの画像を電気的に取得する。好ましくは、市販されている良く知られた光学スキャナを用いて、各フォームの画像を電気的に取得する。典型的には、このようなスキャナには、走査したドキュメントのデジタル画像が得られるよう電荷結合素子(CCD)や同様なセンサが用いられる。
【0055】
上記のような2つの画像が電気的に得られ、これらが記憶された後、本発明では、これらを以下のように処理する。
【0056】
本発明の一実施形態では、ブランクフォーム(空白のフォーム)上の情報を膨張(拡大)して、フォームの情報内容に対応する画素数を増加させる。この膨張処理によって、フォームの情報内容を表わしている黒領域は、白部分に対して拡大される。例えば、フォーム上で、1行分の画素を占める1つの水平ラインのサイズ(大きさ)を、3行分の画素を占めるように、拡大することができる。この膨張処理は、空白フォーム(ブランクフォーム)のバージョンを作成し、これを、情報が書き加えられたフォームのバージョンから除去するためになされる。すなわち、膨張処理により、フォームの情報内容を与える黒領域(dark region)は、所望量だけ白領域内に拡がり(grown)、黒領域のサイズ(大きさ)が増加する。黒領域のサイズが増加することによって、仕上げられた(書き加えられた)フォームからブランクドキュメント(空白ドキュメント)を差し引くとき、ブランクドキュメントの全ての情報内容を仕上げられたドキュメントから確実に除去することが可能となる。このような膨張処理は、良く知られた既存の技術を用いて行なうことができる。なお、ドキュメントが簡単(単純)なものである場合やユーザによって書き加えられた部分が簡単(単純)なものである場合には、ブランクフォームにおけるドキュメントの膨張処理は、必ずしも用いる必要はない。
【0057】
図7は図6に示したドキュメントの一部分の拡大図である。なお、図7は本発明による処理をより詳細に説明するのに用いるものであるが、図7を用いずとも、本発明による処理が理解されるべきである。図7に示すように、処理対象となる仕上げられた(情報が書き加えられた)ドキュメントの画像は、オリジナルドキュメント(ブランクドキュメント)自体の下地部分に、ユーザによって書き加えられた情報が重なり合った部分を有している。
【0058】
図8に示すように、ブランクドキュメントの画像は、これが膨張(拡大)されている状態,膨張(拡大)されていない状態のいずれの場合であっても、仕上げられたドキュメントの画像から取り除かれる。この処理は、好ましくは、ブランクドキュメント(ブランクフォーム)の画像と仕上げられたドキュメント(仕上げられたフォーム)の画像とを互いに比較して整列させ、次いで、ブランクフォームの画像を、これが膨張(拡大)されている状態,膨張(拡大)されていない状態のいずれの場合であっても、仕上げられたフォームの画像から差し引くことによってなされるのが良い。これら2つのフォームの整列処理は、在来のパターンマッチングアルゴリズムを用いて行うことができる。例えば、フォームの印刷時に、フォームに整列用のマークを予め印刷しておき、2つのフォームの画像において整列用マークの特徴を用いることによって、2つのフォームの整列処理を行なうことができる。なお、図8においては、オリジナルドキュメントの水平ラインの部分がわずかに膨張(拡大)処理をされていることにより、除去された部分は、フォームのオリジナルな部分よりもわずかに大きなサイズのものとなっている。
【0059】
ブランクドキュメントが差し引かれた後、ユーザによって書き加えられた情報ができる限り多く修復されることが望まれる。光学的文字認識技術の多くは、文字を認識するために情報内容が連続していることを前提としている。例えば、OCRは、交差している2つの斜線ストロークを“X”として認識できるが、図8に示すような2セグメントストロークのところの5セグメントストロークを“X”として正しく認識することはできない。在来の光学的文字認識技術を用いて図8の画像を処理すると、多くの認識エラーが生じてしまう。このような問題を回避するため、本発明では、前述のような画像継なぎ(image continuation)技術を用いる。
【0060】
図8の画像に対してこのような画像継なぎ技術を適用すると(例えば、第1の画像(ブランクドキュメントの画像)が差し引かれた部分(除去された部分)を初期の未知画素領域として画像継なぎ技術を適用すると)、情報が失われた画素(すなわち、水平ラインの除去された領域の画素)が修復されて図9に示すような画像となる。図9において、文字“X”の1つのストロークと文字“S”の下部とに僅かな欠陥があるものの、画像継なぎ技術により全ての文字のオリジナルな形を修復できたことがわかる。
【0061】
図10は図6に示されたドキュメントの他の部分の拡大図である。図10を参照すると、その上部には仕上げられた(書き加えられた)フォームが示され、また、その中間部には仕上げられたドキュメントからブランクドキュメントを差し引いた結果が示され、また、その下部には、画像修復技術(画像継なぎ技術)を適用して、差し引き処理によって除去された画素を修復した結果が示されている。図10から文字“X”が“単一”の文字に修復され、名前において“Y”の下部が修復され、電話番号のエリアコードの上部が修復されていることがわかる。
【0062】
図11はフォームのライン上に“copy”の語が手書きで書き込まれている完成ドキュメントの拡大部分を示す図であり、図12は、図11の仕上げられたドキュメントの画像からブランクドキュメントの画像を差し引いた画像を示す図であり、図13は図12の画像を黒画素と白画素とを同じ重み付けで修復した後の修復画像を示す図である。
【0063】
上述の実施形態は、あくまで例示であり、これに限定されるべきでなく、本発明は、特許請求の範囲を逸脱しない限り、広義に捉えられるべきである。
【0064】
【発明の効果】
以上に説明したように、請求項1乃至請求項11記載の発明によれば、ドキュメントにユーザによって書き加えられた情報を電気的に抽出する情報抽出方法であって、ユーザによって情報が書き加えられる前のドキュメントの画像を第1画像として取得し、ユーザによって情報が書き加えられた後のドキュメントの画像を第2画像として取得し、第2画像から第1画像を差し引き、差し引いた結果の画像を作成し、差し引き画像において、第2画像から第1画像を差し引いたことによって除去された、ユーザによって書き加えられた情報の除去部分を修復するようになっており、この修復処理では、前記差し引いた結果の画像において、差し引かれた部分の画素を未知画素領域の画素として特定し、閾値および近傍配置を設定し、前記未知画素領域内の各画素に対して、その近傍配置によって規定される領域内に存在する既知画素の個数を計数し、該計数値が閾値よりも大きい場合には、その未知画素に対して値を計算して与え、全ての未知画素について上記各処理を繰り返し行ない、上記処理において値が計算された画素について、これを未知画素領域から取り除いて、既知画素領域に加え、所望の場合には、前記閾値を調整し、未知画素の個数が所望個数となるまで前記処理を繰り返すようにしているので、特別なカラーフィルタや特別なフォームなどを用いる必要なく、フォームに書き加えられた情報をフォーム自体に含まれている情報から良好に識別(電気的に分離)することができる。
【図面の簡単な説明】
【図1】本発明に係る情報抽出装置の構成例を示す図である。
【図2】本発明を実現するためのシステムの一例を示す図である。
【図3】本発明の好適な処理例を示すフローチャートである。
【図4】本発明の好適な処理例を示すフローチャートである。
【図5】フォームの一例を示す図である。
【図6】図5のフォームにユーザによって情報が書き込まれた後の状態を示す図である。
【図7】図6に示したドキュメントの一部分の拡大図である。
【図8】差し引き画像の一例を示す図である。
【図9】図8の差し引き画像を本発明の画像継なぎ技術により修復した結果の画像を示す図である。
【図10】図6に示したドキュメントの他の部分の拡大図である。
【図11】フォームのライン上に“copy”の語が手書きで書き込まれている完成ドキュメントの拡大部分を示す図である。
【図12】図11の仕上げられたドキュメントの画像からブランクドキュメントの画像を差し引いた画像を示す図である。
【図13】図12の画像を黒画素と白画素とを同じ重み付けで修復した後の修復画像を示す図である。
【符号の説明】
1 第1画像取得部
2 第2画像取得部
3 差し引き画像作成部
4 修復部
200 コンピュータシステム
203 画像蓄積装置
205 画像取得システム
208 表示/制御装置
Claims (11)
- ドキュメントにユーザによって書き加えられた情報を電気的に抽出する情報抽出方法であって、
ユーザによって情報が書き加えられる前のドキュメントの画像を第1画像として取得し、
ユーザによって情報が書き加えられた後のドキュメントの画像を第2画像として取得し、
第2画像から第1画像を差し引き、差し引いた結果の画像を作成し、
差し引き画像において、第2画像から第1画像を差し引いたことによって除去された、ユーザによって書き加えられた情報の除去部分を修復する情報抽出方法であって、
( a ) 前記差し引いた結果の画像において、差し引かれた部分の画素を未知画素領域の画素として特定し、
( b ) 閾値および近傍配置を設定し、
( c ) 前記未知画素領域内の各画素に対して、
( 1 ) その近傍配置によって規定される領域内に存在する既知画素の個数を計数し、
( 2 ) 該計数値が閾値よりも大きい場合には、その未知画素に対して値を計算して与え、
( 3 ) 全ての未知画素について上記各処理を繰り返し行ない、
( d ) 上記 ( c ) の処理において値が計算された画素について、これを未知画素領域から取り除いて、既知画素領域に加え、
( e ) 所望の場合には、前記閾値を調整し、未知画素の個数が所望個数となるまで前記 ( c ) および ( d ) の処理を繰り返すことを特徴とする情報抽出方法。 - 請求項1記載の情報抽出方法において、前記近傍配置は、未知画素に隣接し、未知画素を取り囲む幾何学的領域であることを特徴とする情報抽出方法。
- 請求項1記載の情報抽出方法において、前記閾値は、近傍の画素数よりも小さな値であることを特徴とする情報抽出方法。
- 請求項1記載の情報抽出方法において、未知画素の値は、近傍画素のうち既知の値をもつ既知画素の値に数学的演算を施して計算されることを特徴とする情報抽出方法。
- 請求項1記載の情報抽出方法において、各画素はマトリックスに配置され、前記近傍配置は3×3の大きさの領域であることを特徴とする情報抽出方法。
- 請求項1記載の情報抽出方法において、(e)の処理では閾値を“1”ずつ減少させることを特徴とする情報抽出方法。
- 請求項1記載の情報抽出方法において、前記差し引き処理は、前記第2画像から前記第1画像を差し引く前に、第1画像において情報をもつ画素を膨張し、これによって、第2画像から差し引かれるべき画素数を増加させる工程を含むことを特徴とする情報抽出方法。
- 請求項1記載の情報抽出方法において、前記第2画像は、ユーザによって情報が書き加えられたドキュメントを走査することによって得られることを特徴とする情報抽出方法。
- 請求項8記載の情報抽出方法において、前記第1画像は、ユーザによって仕上げられたドキュメントに対応したブランクドキュメントを走査することによって得られることを特徴とする情報抽出方法。
- 請求項9記載の情報抽出方法において、前記差し引き処理は、第1画像と第2画像とを電気的に比較し、第1画像と第2画像との両方に同じ情報をもつ領域を第2画像から差し引くことによってなされることを特徴とする情報抽出方法。
- 請求項10記載の情報抽出方法において、前記差し引き処理は、前記第2画像から前記第1画像を差し引く前に、第1画像において情報をもつ画素を膨張し、これによって、第2画像から差し引かれるべき画素数を増加させる工程を含むことを特徴とする情報抽出方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US29441894A | 1994-08-23 | 1994-08-23 | |
| US08/294418 | 1994-08-23 | ||
| US08/712,663 US5694494A (en) | 1993-04-12 | 1996-09-13 | Electronic retrieval of information from form documents |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0863546A JPH0863546A (ja) | 1996-03-08 |
| JP3547025B2 true JP3547025B2 (ja) | 2004-07-28 |
Family
ID=26968516
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP23340095A Expired - Fee Related JP3547025B2 (ja) | 1994-08-23 | 1995-08-18 | 情報抽出方法 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US5694494A (ja) |
| JP (1) | JP3547025B2 (ja) |
| DE (1) | DE19530829C2 (ja) |
Families Citing this family (24)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6519046B1 (en) * | 1997-03-17 | 2003-02-11 | Fuji Photo Film Co., Ltd. | Printing method and system for making a print from a photo picture frame and a graphic image written by a user |
| GB2342207B (en) * | 1998-10-01 | 2003-08-06 | Isis Innovation | Method and apparatus for distinguishing part of a scene |
| WO2000051065A1 (en) | 1999-02-26 | 2000-08-31 | Raf Technology, Inc. | Method and system for identifying a reference region on an image of a dropped-out form |
| WO2000060531A2 (en) * | 1999-04-07 | 2000-10-12 | Raf Technology, Inc. | Extracting user data from a scanned image of a pre-printed form |
| US6290349B1 (en) * | 1999-05-25 | 2001-09-18 | Silverbrook Research Pty Ltd | Printer consumable cartridge |
| US6816274B1 (en) * | 1999-05-25 | 2004-11-09 | Silverbrook Research Pty Ltd | Method and system for composition and delivery of electronic mail |
| US6728426B1 (en) * | 1999-08-23 | 2004-04-27 | International Business Machines Corporation | Compression of form images in gray-level |
| JP3708768B2 (ja) * | 1999-11-22 | 2005-10-19 | シャープ株式会社 | 読取り装置及びデータ処理システム |
| JP4078009B2 (ja) * | 2000-02-28 | 2008-04-23 | 東芝ソリューション株式会社 | 帳票における文字記録領域の検出装置、帳票における文字記録領域の検出方法、記憶媒体及び帳票フォーマット作成装置 |
| US6909805B2 (en) * | 2001-01-31 | 2005-06-21 | Matsushita Electric Industrial Co., Ltd. | Detecting and utilizing add-on information from a scanned document image |
| JP4133370B2 (ja) * | 2003-01-28 | 2008-08-13 | 富士フイルム株式会社 | 電子ペーパ読取装置 |
| JP4269059B2 (ja) * | 2003-05-30 | 2009-05-27 | 株式会社Pfu | 帳票処理プログラム、方法及び装置 |
| US20050094192A1 (en) * | 2003-11-03 | 2005-05-05 | Harris Rodney C. | Systems and methods for enabling electronic document ratification |
| US20060045344A1 (en) * | 2004-09-02 | 2006-03-02 | Adi, Llc | Handprint recognition test deck |
| EP1650945A1 (en) * | 2004-10-21 | 2006-04-26 | Océ-Technologies B.V. | Apparatus and method for automatically analysing a filled in questonnaire |
| JP2006350680A (ja) | 2005-06-16 | 2006-12-28 | Fuji Xerox Co Ltd | 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム |
| JP4789065B2 (ja) * | 2006-03-03 | 2011-10-05 | 富士ゼロックス株式会社 | 画像処理装置および画像処理プログラム |
| JP2007241356A (ja) * | 2006-03-06 | 2007-09-20 | Fuji Xerox Co Ltd | 画像処理装置および画像処理プログラム |
| US20080235263A1 (en) * | 2007-03-02 | 2008-09-25 | Adi, Llc | Automating Creation of Digital Test Materials |
| US8055104B2 (en) | 2007-03-02 | 2011-11-08 | Adi, Llc | Process performance evaluation for Enterprise data systems |
| US9019570B1 (en) | 2013-11-27 | 2015-04-28 | Mcgraw-Hill School Education Holdings Llc | Systems and methods for computationally distinguishing handwritten pencil marks from preprinted marks in a scanned document |
| WO2017208171A1 (en) * | 2016-06-02 | 2017-12-07 | Kumar Pratap | Method and device for producing an electronic health record from paper |
| CN110045844B (zh) * | 2019-04-15 | 2022-12-30 | 南京孜博汇信息科技有限公司 | 位置编码表单数据处理系统 |
| US11080545B2 (en) * | 2019-04-25 | 2021-08-03 | International Business Machines Corporation | Optical character recognition support system |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5533348A (en) * | 1978-08-31 | 1980-03-08 | Fuji Xerox Co Ltd | Noise elimination system |
| US4601056A (en) * | 1984-08-13 | 1986-07-15 | Recognition Equipment Incorporated | Video correlator for video format unit |
| JPS62154179A (ja) * | 1985-12-27 | 1987-07-09 | インタ−ナシヨナル・ビジネス・マシ−ンズ・コ−ポレ−シヨン | 多値画像処理装置および方法 |
| US5017763A (en) * | 1987-04-20 | 1991-05-21 | Cognitronics Corp. | Scanning apparatus storing both processed and unprocessed scan data signals for separate read-out and method of operating same |
| US5020122A (en) * | 1987-07-20 | 1991-05-28 | Litton Industrial Automation Systems, Inc. | Automatic document image revision |
| US4979136A (en) * | 1988-03-01 | 1990-12-18 | Transitions Research Corporation | Processing system and method for enhancing image data |
| US5140650A (en) * | 1989-02-02 | 1992-08-18 | International Business Machines Corporation | Computer-implemented method for automatic extraction of data from printed forms |
| US5115475A (en) * | 1990-06-04 | 1992-05-19 | Motorola, Inc. | Automatic semiconductor package inspection method |
| JPH04343190A (ja) * | 1991-05-21 | 1992-11-30 | Hitachi Ltd | 文字データ入力方式 |
| US5237628A (en) * | 1991-06-03 | 1993-08-17 | Nynex Corporation | System and method for automatic optical data entry |
| US5229589A (en) * | 1991-11-21 | 1993-07-20 | Optimum Solutions Corp., Inc. | Questionnaire scanning system employing expandable answer mark areas for efficient scanning and mark detection |
| US5214470A (en) * | 1992-04-09 | 1993-05-25 | Xerox Corporation | Method and apparatus for compensating for dirt or etched areas on a document platen |
-
1995
- 1995-08-18 JP JP23340095A patent/JP3547025B2/ja not_active Expired - Fee Related
- 1995-08-22 DE DE19530829A patent/DE19530829C2/de not_active Expired - Fee Related
-
1996
- 1996-09-13 US US08/712,663 patent/US5694494A/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| DE19530829C2 (de) | 2000-06-15 |
| JPH0863546A (ja) | 1996-03-08 |
| DE19530829A1 (de) | 1996-02-29 |
| US5694494A (en) | 1997-12-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3547025B2 (ja) | 情報抽出方法 | |
| JP4065460B2 (ja) | 画像処理方法及び装置 | |
| JP3792747B2 (ja) | 文字認識装置及び方法 | |
| JP3696920B2 (ja) | ドキュメント格納装置及び方法 | |
| JP3727974B2 (ja) | 画像処理装置及び方法 | |
| JPH0869505A (ja) | 画像処理システム | |
| JP4904175B2 (ja) | 低解像度のグリフ・イメージから高忠実度のグリフ・プロトタイプを作成するための方法および装置 | |
| US20070031802A1 (en) | Educational material processing apparatus, educational material processing method, educational material processing program and computer-readable recording medium | |
| Al-Salman et al. | An arabic optical braille recognition system | |
| CN113592735A (zh) | 文本页面图像还原方法及系统、电子设备和计算机可读介质 | |
| CN1964422A (zh) | 水印信息嵌入装置、水印信息嵌入方法、及计算机程序 | |
| CN113177556A (zh) | 一种文本图像增强模型、训练方法、增强方法及电子设备 | |
| JP3090070B2 (ja) | 帳票識別方法及び装置 | |
| US20080260200A1 (en) | Image Processing Method and Image Processing Device | |
| JP4116377B2 (ja) | 画像処理方法および画像処理装置 | |
| US20060290999A1 (en) | Image processing apparatus and network system | |
| JP3730073B2 (ja) | テンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体 | |
| JP2908495B2 (ja) | 文字画像抽出装置 | |
| JP4254008B2 (ja) | パターン検出装置及び方法 | |
| JP2613211B2 (ja) | 画像入力装置 | |
| JP3756660B2 (ja) | 画像認識方法、装置および記録媒体 | |
| Suda et al. | How can document analysis help in capturing five million pages? | |
| CN119992573A (zh) | 用于在报告中提取检定信息的方法及装置及存储介质 | |
| JP3281786B2 (ja) | 点字複写装置 | |
| CN121074912A (zh) | 文本处理方法、可读介质、电子设备和程序产品 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040407 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040408 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080423 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090423 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090423 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100423 Year of fee payment: 6 |
|
| LAPS | Cancellation because of no payment of annual fees |