JP2004062350A

JP2004062350A - 文書情報入力プログラム、文書情報入力装置、および文書情報入力方法

Info

Publication number: JP2004062350A
Application number: JP2002217386A
Authority: JP
Inventors: Koji Kurokawa; 黒川　浩司; Katsuto Fujimoto; 藤本　克仁; Misako Suwa; 諏訪　美佐子; Yoshinobu Hotta; 堀田　悦伸; Satoshi Naoi; 直井　聡
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2002-07-26
Filing date: 2002-07-26
Publication date: 2004-02-26
Also published as: US7280693B2; CN1484165A; KR20040010364A; US20040017940A1

Abstract

【課題】本発明は、既存文書から情報を認識して文書に入力する文書情報入力プログラム、文書情報入力装置、および文書情報入力方法に関し、指定手段で指定された文書中の処理対象の正確な位置、属性を検出し、当該位置、属性をもとに撮像した画像から文字認識、表認識、図処理などに適した処理を行って電子文書に貼り付け、既存文書から電子文書への文字列、表、図などの情報入力を高速かつ高精度に実現することを目的とする。
【解決手段】コンピュータに、既存文書上で指定手段により指定された処理対象領域を検出する手段と、検出された処理対象領域の画像を少なくとも読み取る手段と、読み取った処理対象領域の画像について、文字認識する手段と、文字認識した結果を、画面上の該当個所に貼り付ける手段として実行させるための文書情報入力プログラムである。
【選択図】　図１

Description

【０００１】
【発明の属する技術分野】
本発明は、既存文書から情報を認識して文書に入力する文書情報入力プログラム、文書情報入力装置、および文書情報入力方法に関するものである。
【０００２】
【従来の技術】
従来、文書中の文字列をコンピュータの画面上に入力したい場合、文書をスキャナーで読みって画像を生成し、当該画像を文字認識し、文字認識した文字列をコピーして画面上の該当個所に貼り付けることにより行っていた。
【０００３】
また、特開平１１−２０３４０３号公報では，ＣＣＤカメラにより文書の画像を低解像度で随時撮影し、指やペンが撮像された際に前回の画像との差分を取り、認識領域の指定の判断を行い、指定領域について高解像度画像を新たに撮像し、文字認識を行うようにしていた。
【０００４】
【発明が解決しようとする課題】
上述した従来の前者の手法では、文書中から領域を指定して文字認識し画面上の該当個所に入力するのに、手順が複雑で画像入力も時間がかかり、効率が悪いという問題があった。
【０００５】
また、後者の手法では、随時撮像された画像を処理する必要があり、負荷が増大すると共に、低解像度画像から指やペン先の位置を検出して領域指定を検出して当該領域について文字認識する必要があるため、情報が少なく正確な認識領域を抽出し難いと共に、高解像度画像を撮像する必要があり、多くの時間が必要となってしまうという問題があった。
【０００６】
本発明は、これらの問題を解決するため、指定手段で指定された文書中の処理対象の正確な位置、属性を検出し、当該位置、属性をもとに撮像した画像から文字認識、表認識、図処理などに適した処理を行って電子文書に貼り付け、既存文書から電子文書への文字列、表、図などの情報入力を高速かつ高精度に実現することを目的としている。
【０００７】
【課題を解決するための手段】
図１を参照して課題を解決するための手段を説明する。
【０００８】
図１において、処理装置１は、既存文書を読み取って文字認識し、画面上の該当個所に貼り付けるものであって、ここでは、属性検出手段１１、領域検出手段１２、認識手段１３、および貼り付け手段１４などから構成されるものである。
【０００９】
属性検出手段１１は、文書から読み取る領域の属性（テキスト、表、図など）を検出するものである。
【００１０】
領域検出手段１２は、文書中から文字認識する領域を検出するものである。
認識手段１３は、文書中から検出された領域について、検出された属性に従い文字認識などするものである。
【００１１】
貼り付け手段１４は、画面上の該当位置に貼り付けるものである。
撮像装置２は、文書の画像を読み取るものである。
【００１２】
指定手段３は、文書上の位置を指定するもの（例えば電子ペン）である。
次に、動作を説明する。
【００１３】
領域検出手段１２が文書上で指定手段３により指定された処理対象領域を検出し、撮像装置２が検出された処理対象領域の画像を少なくとも読み取り、認識手段１３が読み取った処理対象領域の画像について文字認識し、貼り付け手段１４が文字認識した結果を、画面上の該当個所に貼り付けるようにしている。
【００１４】
この際、属性検出手段１１が指定手段３により指定された処理対象領域を検出する際に、指定された処理対象領域がテキスト領域、表領域あるいは図領域のいずれかの属性を検出するようにしている。
【００１５】
また、指定手段３により画面上で指定された領域に対応して、テキスト領域、表領域あるいは図領域を検出するようにしている。
【００１６】
また、指定手段３により始点から終点に向かう方向の違いで、テキスト領域、表領域あるいは図領域を検出するようにしている。
【００１７】
また、指定手段３により処理対象領域がテキスト領域と検出されたときに、更に、テキスト領域について文字認識する、指定されたモードを検出するようにしている。
【００１８】
また、表領域と検出されたときに、指定手段３で指定された位置がセル内のときは指定されたセル内の領域を処理対象領域、あるいはセル外のときは指定された位置の文字を中心に各隣接距離が所定値以内の文字列を含む領域を処理対象領域とするようにしている。
【００１９】
従って、指定手段３で指定された文書中の処理対象の正確な位置、属性を検出し、当該位置、属性をもとに撮像した画像から文字認識、表認識、図処理などに適した処理を行って電子文書に貼り付けることにより、既存文書から電子文書への文字列、表、図などの情報入力を高速かつ高精度に実現することが可能となる。
【００２０】
【発明の実施の形態】
次に、図１から図１１を用いて本発明の実施の形態および動作を順次詳細に説明する。ここで、本願発明が処理対象とする文書（既成文書）は、紙文書、車などのナンバープレート、看板などの既に作成された文書である（文字、表、図、式などが印刷、プリントアウトなどされた文書である）。
【００２１】
図１は、本発明のシステム構成図を示す。
図１において、処理装置１は、プログラムに従い各種処理を実行するものであって、ここでは、既存文書を読み取って文字認識し、画面上の該当個所に貼り付けるものであり、属性検出手段１１、領域検出手段１２、認識手段１３、および貼り付け手段１４などから構成されるものである。
【００２２】
属性検出手段１１は、文書から読み取る領域の属性（テキスト、表、図など）を検出するものである（図３から図１１を用いて後述する）。
【００２３】
領域検出手段１２は、文書中から文字認識する領域を検出するものである（図３から図１１を用いて後述する）。
【００２４】
認識手段１３は、文書中から検出された領域についいて、検出された属性に従い文字認識などするものである（図３から図１１を用いて後述する）。
【００２５】
貼り付け手段１４は、画面（文書を表示した画面、グラフィックソフトで開いた画面、エクセルなどで開いたワークシートなどの貼り付け可能な画面など）の該当位置に貼り付けるものである（図３から図１１を用いて後述する）。
【００２６】
撮像装置２は、文書の画像を読み取るものであって、例えばデジタルカメラ、スキャナーなどである。
【００２７】
指定手段３は、文書上の位置を指定するもの（例えば電子ペン）である。
出力装置４は、各種出力装置であって、ここでは、ディスプレイ装置、プリンタ装置などである。
【００２８】
次に、図２のフローチャートの順番に従い、図１の構成の全体の動作を説明する。
【００２９】
図２は、本発明の動作説明フローチャートを示す。
図２において、Ｓ１は、座標を取得する。これは、図１の指定手段３により、例えば後述する図３の（１）の紙文書上で電子ペンをＯＮ（始点）してドラッグしＯＦＦ（終点）したことに対応して、当該始点および終点の座標（また、必要に応じて軌跡の座標）を取得する（左上の受信機で検出して始点と終点などの座標を取得する）。
【００３０】
Ｓ２は、画像を取得する。これは、図１の撮像装置２で文書の画像を撮像して取得する。
【００３１】
Ｓ３は、属性を検出する。これは、指定手段３で指定された領域に対応する属性（テキスト、表、図）を検出、あるいは指定手段３で指定された始点から終点に向かう向きの違いで属性（テキスト、表、図）を検出などする。
【００３２】
Ｓ４は、領域を検出する。これは、指定手段３で指定された例えば始点と終点で決まる領域を検出する。
【００３３】
Ｓ５は、認識する。これは、Ｓ４で検出した領域内の画像について、Ｓ３で検出した属性（テキスト、表、図）に従い、文字認識などする。
【００３４】
Ｓ６は、貼り付ける。これは、Ｓ５で認識した結果を、画面上の文書中の指定された位置に貼り付ける。
【００３５】
以上によって、紙文書上で領域および属性を検出し、検出された領域について検出された属性に従い文字認識などし、その結果を指定された画面上の個所に貼り付けることにより、簡易かつ迅速に紙文書中のテキスト、表、図などを電子文書中の該当個所に貼り付ける（入力する）ことが可能となる。以下順次詳細に説明する。
【００３６】
図３は、本発明の説明図（その１）を示す。
図３の（１）は、座標取得および画像取得の例を示す。
【００３７】
図３の（１）において、紙文書は、紙（例えばＡ４の紙）上に文字が印刷されたテキスト領域（左側）、表が印刷された表領域（右下）、図が印刷された図領域（右上）がそれぞれ図示のように存在するものである。
【００３８】
受信機は、図示外のペン（電子ペン）を紙文書上で押下してペンＯＮにするとそのペンＯＮの座標（始点）を検出し、電子ペンがドラッグされるとその軌跡の座標を検出し、電子ペンをＯＦＦにするとその座標（終点）を検出する公知のものである。
【００３９】
以上の構成のもとで、ここでは、紙文書上で電子ペンが押下された始点および終点の座標を検出、および紙文書をデジタルカメラ、スキャナーなどで読み取って画像を生成することが可能となる。
【００４０】
図３の（２）は、認識の例を示す。ここでは、
・左側の紙文書中のテキスト領域については文字認識を行う。
【００４１】
・中央の紙文書中の表領域については表中の各セルの文字認識を行う。
・右側の紙文書中の図領域については図であるので、ここでは、文字認識しない。
【００４２】
以上により、紙文書中のテキスト領域および表領域については文字認識されることとなる。
【００４３】
図３の（３）は、貼り付け例を示す。ここでは、
・左側の紙文書中のテキスト領域については、図３の（２）で文字認識結果を、画面上の文書のカーソルのある位置を先頭に貼り付ける（入力する）。
【００４４】
・中央の紙文書中の表領域については、図３の（２）で文字認識結果を、画面上のここでは、表中のカーソルのある位置に貼り付ける（入力する）。
【００４５】
・右側の紙文書中の図領域については、図３の（１）で取得した画像中から切り出した当該図領域の図をそのまま画面上にそのまま貼り付ける（必要に応じてサイズ、貼り付け個所を指定する）。
【００４６】
以上により、画面上の電子文書中に、紙文書中から取り出したテキスト領域、表領域から認識した文字列、更に図領域については図を電子文書中の該当位置に貼り付けることが簡易かつ高精度かつ迅速に行うことが可能となる。
【００４７】
図４は、本発明の詳細フローチャート（その１）を示す。
図４において、Ｓ１１は、電子ペンがＯＮか判別する。これは、既述した図３の（１）の紙文書上で、電子ペンが押下されて、ＯＮが検出されたか判別する。ＹＥＳの場合には、Ｓ１２に進む。ＮＯの場合には、Ｓ１１を繰り返し待機する。
【００４８】
Ｓ１２は、Ｓ１１のＹＥＳで、電子ペンＯＮが検出されたので、軌跡を取得する。これは、Ｓ１１のＹＥＳで電子ペンＯＮが検出され、ドラッグされたのでそのドラッグされた位置の軌跡（座標）を取得する。
【００４９】
Ｓ１３は、電子ペンがＯＦＦか判別する。これは、Ｓ１２で電子ペンがドラッグされてＯＦＦが検出されたか判別する。ＹＥＳの場合には、Ｓ１４に進む。ＮＯの場合には、Ｓ１３を繰り返し行い待機する。
【００５０】
Ｓ１４は、Ｓ１３のＹＥＳで電子ペンがＯＦＦされたと検出されたので、Ｓ１１のＹＥＳで電子ペンＯＮ検出時の始点座標および電子ペンＯＦＦ検出時の終点座標をもとに決まる領域の画像を、図１の撮像装置２で撮像して取得する。
【００５１】
以上によって、既述した図３の（１）で紙文書上で例えば左側の▲１▼の始点および終点が検出されたときは当該始点と終点を含む矩形領域の画像を例えば図示の点線のように撮像装置２で撮像して取得する。そして、既述した図３の（２）の認識の処理に進む。
【００５２】
図５は、本発明の詳細フローチャート（その２）を示す。
図５において、Ｓ２１は、軌跡を含む表を抽出する。これは、既述した図３の（１）の▲２▼の表領域について、既述した図４のフローチャートに従い検出した始点と終点の軌跡を含む表領域の画像を抽出する。
【００５３】
Ｓ２２は、セル毎の文字列情報を得る。これは、Ｓ２１で抽出した表領域中から各セル毎に文字認識して文字認識情報を得る。
【００５４】
Ｓ２３は、表の論理構造を認識する。これは、図３の（１）の▲２▼の表領域について、罫線をもとに表の論理構造（セルの行列の情報など）を認識する。
【００５５】
Ｓ２４は、貼り付ける。これは、既述した図３の（３）の中央に示すように、画面上の電子文書中の該当セルに、認識したそれぞれのセル毎の文字認識情報を貼り付け、入力する。
【００５６】
以上によって、図３の（１）の紙文書中の表領域について、当該表の各セル毎に文字認識および表の論理構造を認識し、電子文書中の該当する表のセルに文字情報を正確かつ迅速に貼り付けて入力することが可能となる。
【００５７】
図６は、本発明の説明図（その２）を示す。
図６において、下段の属性指定領域は、上段の紙文書の領域の属性を指定する領域である。いずれかの属性を電子ペンでクリック（電子ペンでＯＮ−ＯＦＦ）して属性を指定し、次に、既述した図３の（１）の紙文書上で電子ペンをＯＮ−ドラッグ−ＯＦＦし、その始点と終点を含む所定の矩形領域を抽出し、当該指定した属性で抽出した領域の認識、更に、電子文書の該当個所への貼り付けを行うようにしたものである。ここで属性指定領域には、図示の下記の属性指定領域を設ける。
【００５８】
・テキスト：
・氏名文字列：
・住所文字列：
・電話番号文字列：
・表：
・図：
ここで、テキストで氏名文字列、住所文字列および電話番号文字列のいずれかの領域が電子ペンでクリックして指定されたときは、紙文書上で電子ペンにより指定された始点と終点を含む矩形領域の画像を取得し、当該取得した画像について指定された氏名文字列、住所文字列、電話番号文字列を認識するために最適な例えば氏名辞書、住所辞書、電話番号辞書、およびこれらを認識する最適な文字の切り出し方法を設定して高精度で文字認識を行うことが可能となる。また、表については、縦横の罫線を検出して各セルの位置、サイズなどを認識する認識エンジンを起動および表内の文字の認識に最適な認識方法を設定し、高精度に各セルおよびセル内の文字認識を行う。図については、当該図の画像を拡大、縮小、回転などを必要に応じて行い、電子文書中の該当個所に貼り付けて入力する。
【００５９】
以上のように、電子ペンで属性指定領域中の任意の個所をクリックして属性を指定し、当該指定した属性で紙文書中から取得した画像を認識し、電子文書中の該当個所に貼り付けて入力を行うことにより、それぞれの属性（テキスト、表、図など）に適合した最適かつ高精度で認識し、電子文書の該当個所への貼り付けを行うことが可能となる。
【００６０】
図７は、本発明の詳細フローチャート（その３）を示す。
図７において、Ｓ３１は、属性指定する。これは、例えば既述した図６の属性指定領域のいずれかの領域を電子ペンでクリックして指定する。
【００６１】
Ｓ３２は、Ｓ３１の属性指定で、文字（テキスト）であって、氏名モード、住所モード、電話番号モードのいずれかが指定された場合、当該指定されたモードで最適に設定した辞書（氏名辞書、住所辞書、電話番号辞書）かつ文字の切り出し方法（氏名に最適な文字切り出し方法、住所に最適な文字切り出し方法、電話番号に最適な文字切り出し方法）で、図３の（２）の左側の文字認識を高精度かつ迅速に行う。そして、図３の（３）で、電子文書中のカーソル位置に貼り付けて入力する。
【００６２】
Ｓ３３は、Ｓ３１の属性指定で、表が指定された場合、当該指定された表に最適に設定した表認識処理を起動し、表の論理構造（各セルの行列とサイズなど）を検出し、図３の（２）の中央の文字認識（各セル内の文字認識）を高精度かつ迅速に行う。そして、図３の（３）で、電子文書中の表中の該当個所に論理構造を復元して貼り付けて入力する。
【００６３】
Ｓ３４は、Ｓ３１の属性指定で、図が指定された場合、当該指定された図に最適に設定したエンジンを起動し、図について、必要に応じて拡大、縮小などし、図３の（３）で、電子文書中の該当個所に貼り付けて入力する。
【００６４】
以上のように、紙文書中の認識しようとする領域の属性を電子ペンで指定し、当該指定された属性に最適な設定（辞書、文字切り出し方法など）をし、認識を高精度かつ迅速に行い、電子文書中の該当個所に貼り付けて入力することが可能となる。
【００６５】
図８は、本発明の詳細フローチャート（その４）を示す。
図８において、Ｓ４１は、軌跡を取得する。これは、既述した図３の（１）の紙文書上で、電子ペンでＯＮし、ドラッグし、ＯＦＦする軌跡（座標）を取得する。
【００６６】
Ｓ４２は、Ｓ４１で取得した電子ペンの軌跡の始点と終点が、図示のように左から右方向にほぼ水平の場合、１行文字列と判定（始点と終点で横切った文字列を認識と判定）し、当該文字列を含む矩形領域の画像を取得し、図３の（２）の文字認識を行う。
【００６７】
Ｓ４３は、Ｓ４１で取得した電子ペンの軌跡の始点と終点が、図示のように左下から右上に向かう場合、当該始点と終点の軌跡で横切った複数の文字列の矩形領域の画像を取得し、図３の（２）の文字認識を行う。そして、文字認識した結果を、電子文書上のカーソルの位置に貼り付けて入力する。
【００６８】
Ｓ４４は、Ｓ４１で取得した電子ペンの軌跡の始点と終点が、図示のように左上から右下に向かう場合、当該始点と終点の軌跡で決まる矩形の表領域の画像取得し、図３の（２）の表認識（表の各セル内の文字認識および表の論理構造（行列など）の認識）を行う。そして、文字認識した結果を、電子文書上のカーソルの位置などに貼り付けて入力する。
【００６９】
Ｓ４５は、Ｓ４１で取得した電子ペンの軌跡の始点と終点が、図示のように右上から左下に向かう場合、当該始点と終点の軌跡で決まる図領域の画像を取得し、図３の（３）の電子文書上の該当個所に貼り付けて入力する。
【００７０】
以上により、紙文書上で電子ペンをＯＮしてドラッグしてＯＦＦするという一連の簡単な操作により、紙文書上の認識対象の領域および認識する属性（文字列、表、図）を検出させて電子文書中に貼り付けて迅速に入力することが可能となる。
【００７１】
図９は、本発明の詳細フローチャート（その５）を示す。
図９において、Ｓ５１は、軌跡を取得する。これは、既述した例えば図８のＳ４１の軌跡を取得し、ここでは、領域と表である旨を検出する（図８のＳ４４）。
【００７２】
Ｓ５２は、画像を取得する。これは、Ｓ５１で取得した軌跡をもとに検出した領域の画像を取得する。
【００７３】
Ｓ５３は、表を認識する。これは、Ｓ５１で取得した画像から表の罫線、セルの認識（抽出）を行う。
【００７４】
Ｓ５４は、ペンのポイントがセルに含まれか判別する。ＹＥＳの場合には、電子ペンでポイントされた位置が表中のセルに含まれると判明したので、Ｓ５５でセルの内接領域を抽出し、図３の（２）の文字認識を行い、当該セル内の文字列の認識を行う。そして、文字認識した結果を、既述した図３の（３）の中央の電子文書上の表の該当個所に貼り付けて入力する。一方、Ｓ５４のＮＯの場合には、電子ペンでポイントされた位置が表中のセルに含まれないと判明したので、Ｓ５６でペンのポイントを含む領域の文字列を抽出（電子ペンでポイントされた位置の文字と隣接する文字が所定距離範囲内の他の文字をまとめて一連の文字列として当該領域の文字列の画像を抽出）し、図３の（２）の文字認識を行い、認識結果を電子文書上の該当位置に貼り付けて入力する。
【００７５】
以上により、表内のセルあるいは表外の文字列の画像を抽出して文字認識し、電子文書上の該当個所に貼り付けて迅速に入力することが可能となる。
【００７６】
図１０は、本発明の詳細フローチャート（その６）を示す。
図１０において、Ｓ６１は、軌跡を取得する。これは、既述した図６の属性指定領域で電子ペンで指定された軌跡（この場合には、電子ペンでクリックするので、始点と終点がほぼ同じ座標値となる軌跡）を取得する。
【００７７】
Ｓ６２は、領域を抽出する。ここでは、図６の氏名文字列の領域が指定されたと抽出する。
【００７８】
Ｓ６３は、属性を文字認識を用いて検出する。これは、Ｓ６２で抽出された領域の属性のモードここでは、例えば「氏名」と検出する。当該検出は、抽出された領域の画像を文字認識して例えば「氏名」と認識してもよいし、当該領域の範囲に対応する予め設定されている属性（ここでは、「氏名」）を検出してもよい。
【００７９】
Ｓ６４は、Ｓ６３で検出された属性のモード（氏名モード、住所モード、電話番号モードなど）に最適な辞書、文字の切り出し方法などを設定し、Ｓ６５に進む。
【００８０】
Ｓ６５は、軌跡を取得する。これは、図６の紙文書上で電子ペンでＯＮし、ドラッグし、ＯＦＦした軌跡を取得する。
【００８１】
Ｓ６６は、領域を抽出する。これは、Ｓ６５で取得した軌跡、例えば始点と終点の座標をもとに領域を抽出する。
【００８２】
Ｓ６７は、選択された辞書（モード）を使った文字認識を行う。これにより、氏名モードの場合には、画像から当該氏名に最適な氏名辞書および画像中から文字を切り出す方法を使用して文字認識するため、高精度に文字認識することができる。
【００８３】
Ｓ６８は、貼り付ける。これは、Ｓ６７で認識した認識結果を、電子文書上の例えば意カーソルのある位置に貼り付けて入力する。
【００８４】
以上により、文字列の場合に氏名、住所、電話番号などのモードを合わせて指定し、当該モードに最適な辞書や文字切り出し方法を設定して文字認識し、認識結果を電子文書上の該当個所に貼り付けて入力することにより、専用の辞書および文字切り出し方法などを用いて高精度に文字認識して電子文書上の該当個所に入力することが可能となる。
【００８５】
図１１は、本発明の属性／モードの概略説明図を示す。
図１１において、
・属性「文字」には、更に、モード「氏名」、「住所」、「電話番号」、その他がある。文字の場合に、更にモード指定することで、指定されたモードに最適な辞書や画像からの文字切り出し方法を設定することで、高精度かつ迅速に文字認識することが可能となる。
【００８６】
・属性「表」は、属性のみである。表認識の場合には、縦横の罫線を検出し、各セルの行列の情報とサイズなどの表の論理構成を検出する必要があるので、当該属性「表」用の認識エンジンを起動して認識させる。
【００８７】
・属性「図」は、属性のみである。図の場合には、紙文書中の図領域から画像を取得し、必要に応じて拡大、縮小、回転などし、電子文書上の該当個所に貼り付けて入力するので、当該拡大、縮小、回転などを行うエンジン（ソフト）を起動して実行させるようにする。
【００８８】
尚、本実施例では、文字列（氏名、住所、電話番号など）、表、図について区別して属性を検出し、それぞれの属性に最適な処理を説明したが、この他に、数式、帳票などの特別な文字や記号を使ったりする既存文書では、当該専用の属性を設けて専用の辞書、文字切り出し方法などを設定し、指定された属性に最適な辞書、文字切り出し方法を使用して高精度かつ迅速に既存文書から切り出して認識して電子文書に貼り付けて入力するようにすることが可能である。
【００８９】
【発明の効果】
以上説明したように、本発明によれば、指定手段３で指定された文書中の処理対象の正確な位置、属性を検出し、当該位置、属性をもとに撮像した画像から文字認識、表認識、図処理などに適した処理を行って電子文書に貼り付ける構成を採用しているため、既存文書から電子文書への文字列、表、図などの情報入力を高速かつ高精度に実現することが可能となる。
【図面の簡単な説明】
【図１】本発明のシステム構成図である。
【図２】本発明の動作説明フローチャートである。
【図３】本発明の説明図（その１）である。
【図４】本発明の詳細フローチャート（その１）ある。
【図５】本発明の詳細フローチャート（その２）である。
【図６】本発明の説明図（その２）である。
【図７】本発明の詳細フローチャート（その３）である。
【図８】本発明の詳細フローチャート（その４）である。
【図９】本発明の詳細フローチャート（その５）である。
【図１０】本発明の詳細フローチャート（その６）である。
【図１１】本発明の属性／モードの概略説明図である。
【符号の説明】
１：処理装置
１１：属性検出手段
１２：領域検出手段
１３：認識手段
１４：貼り付け手段
２：撮像装置
３：指定手段
４：出力装置

Claims

既存文書から情報を認識して文書に入力する文書情報入力プログラムにおいて、
コンピュータに、
既存文書上で指定手段により指定された処理対象領域を検出する手段と、
前記検出された処理対象領域の画像を少なくとも読み取る手段と、
前記読み取った処理対象領域の画像について、文字認識する手段と、
前記文字認識した結果を、画面上の該当個所に貼り付ける手段と
して実行させるための文書情報入力プログラム。
前記指定手段により指定された前記処理対象領域を検出する際に、指定された当該処理対象領域がテキスト領域、表領域あるいは図領域のいずれかの属性を検出することを特徴とする請求項１記載の文書情報入力プログラム。
前記指定手段により指定された領域に対応して、前記テキスト領域、表領域あるいは図領域を検出することをことを特徴とする請求項１あるいは請求項２記載の文書情報入力プログラム。
前記指定手段により始点から終点に向かう方向の違いで、前記テキスト領域、表領域あるいは図領域を検出することを特徴とする請求項１あるいは請求項２記載の文書情報入力プログラム。
前記指定手段により処理対象領域がテキスト領域と検出されたときに、更に、当該テキスト領域について文字認識する、指定されたモードを検出することを特徴とする請求項１から請求項４のいずれかに記載の文書情報入力プログラム。
前記表領域と検出されたときに、指定手段で指定された位置がセル内のときは当該指定されたセル内の領域を前記処理対象領域、あるいはセル外のときは当該指定された位置の文字を中心に各隣接距離が所定値以内の文字列を含む領域を処理対象領域とすることを特徴とする請求項１から請求項５記載の文書情報入力プログラム。
既存文書から情報を認識して文書に入力する文書情報入力装置において、
既存文書上で指定手段によって指定された処理対象領域を検出する手段と、
前記検出された処理対象領域の画像を少なくとも読み取る手段と、
前記読み取った処理対象領域の画像について、文字認識する手段と、
前記文字認識した結果を、画面上の該当個所に貼り付ける手段と
を備えたことを特徴とする文書情報入力装置。
既存文書から情報を認識して文書に入力する文書情報入力方法において、
既存文書上で指定手段によって指定された処理対象領域を検出するステップと、
前記検出された処理対象領域の画像を少なくとも読み取るステップと、
前記読み取った処理対象領域の画像について、文字認識するステップと、
前記文字認識した結果を、画面上の該当個所に貼り付けるステップと
を有する文書情報入力方法。