[go: up one dir, main page]

JP2004062350A - 文書情報入力プログラム、文書情報入力装置、および文書情報入力方法 - Google Patents

文書情報入力プログラム、文書情報入力装置、および文書情報入力方法 Download PDF

Info

Publication number
JP2004062350A
JP2004062350A JP2002217386A JP2002217386A JP2004062350A JP 2004062350 A JP2004062350 A JP 2004062350A JP 2002217386 A JP2002217386 A JP 2002217386A JP 2002217386 A JP2002217386 A JP 2002217386A JP 2004062350 A JP2004062350 A JP 2004062350A
Authority
JP
Japan
Prior art keywords
area
document
information input
processing target
specified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002217386A
Other languages
English (en)
Inventor
Koji Kurokawa
黒川 浩司
Katsuto Fujimoto
藤本 克仁
Misako Suwa
諏訪 美佐子
Yoshinobu Hotta
堀田 悦伸
Satoshi Naoi
直井 聡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002217386A priority Critical patent/JP2004062350A/ja
Priority to US10/602,624 priority patent/US7280693B2/en
Priority to KR1020030050906A priority patent/KR20040010364A/ko
Priority to CNA031498140A priority patent/CN1484165A/zh
Publication of JP2004062350A publication Critical patent/JP2004062350A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0486Drag-and-drop
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Character Input (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)
  • Studio Devices (AREA)

Abstract

【課題】本発明は、既存文書から情報を認識して文書に入力する文書情報入力プログラム、文書情報入力装置、および文書情報入力方法に関し、指定手段で指定された文書中の処理対象の正確な位置、属性を検出し、当該位置、属性をもとに撮像した画像から文字認識、表認識、図処理などに適した処理を行って電子文書に貼り付け、既存文書から電子文書への文字列、表、図などの情報入力を高速かつ高精度に実現することを目的とする。
【解決手段】コンピュータに、既存文書上で指定手段により指定された処理対象領域を検出する手段と、検出された処理対象領域の画像を少なくとも読み取る手段と、読み取った処理対象領域の画像について、文字認識する手段と、文字認識した結果を、画面上の該当個所に貼り付ける手段として実行させるための文書情報入力プログラムである。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、既存文書から情報を認識して文書に入力する文書情報入力プログラム、文書情報入力装置、および文書情報入力方法に関するものである。
【0002】
【従来の技術】
従来、文書中の文字列をコンピュータの画面上に入力したい場合、文書をスキャナーで読みって画像を生成し、当該画像を文字認識し、文字認識した文字列をコピーして画面上の該当個所に貼り付けることにより行っていた。
【0003】
また、特開平11−203403号公報では,CCDカメラにより文書の画像を低解像度で随時撮影し、指やペンが撮像された際に前回の画像との差分を取り、認識領域の指定の判断を行い、指定領域について高解像度画像を新たに撮像し、文字認識を行うようにしていた。
【0004】
【発明が解決しようとする課題】
上述した従来の前者の手法では、文書中から領域を指定して文字認識し画面上の該当個所に入力するのに、手順が複雑で画像入力も時間がかかり、効率が悪いという問題があった。
【0005】
また、後者の手法では、随時撮像された画像を処理する必要があり、負荷が増大すると共に、低解像度画像から指やペン先の位置を検出して領域指定を検出して当該領域について文字認識する必要があるため、情報が少なく正確な認識領域を抽出し難いと共に、高解像度画像を撮像する必要があり、多くの時間が必要となってしまうという問題があった。
【0006】
本発明は、これらの問題を解決するため、指定手段で指定された文書中の処理対象の正確な位置、属性を検出し、当該位置、属性をもとに撮像した画像から文字認識、表認識、図処理などに適した処理を行って電子文書に貼り付け、既存文書から電子文書への文字列、表、図などの情報入力を高速かつ高精度に実現することを目的としている。
【0007】
【課題を解決するための手段】
図1を参照して課題を解決するための手段を説明する。
【0008】
図1において、処理装置1は、既存文書を読み取って文字認識し、画面上の該当個所に貼り付けるものであって、ここでは、属性検出手段11、領域検出手段12、認識手段13、および貼り付け手段14などから構成されるものである。
【0009】
属性検出手段11は、文書から読み取る領域の属性(テキスト、表、図など)を検出するものである。
【0010】
領域検出手段12は、文書中から文字認識する領域を検出するものである。
認識手段13は、文書中から検出された領域について、検出された属性に従い文字認識などするものである。
【0011】
貼り付け手段14は、画面上の該当位置に貼り付けるものである。
撮像装置2は、文書の画像を読み取るものである。
【0012】
指定手段3は、文書上の位置を指定するもの(例えば電子ペン)である。
次に、動作を説明する。
【0013】
領域検出手段12が文書上で指定手段3により指定された処理対象領域を検出し、撮像装置2が検出された処理対象領域の画像を少なくとも読み取り、認識手段13が読み取った処理対象領域の画像について文字認識し、貼り付け手段14が文字認識した結果を、画面上の該当個所に貼り付けるようにしている。
【0014】
この際、属性検出手段11が指定手段3により指定された処理対象領域を検出する際に、指定された処理対象領域がテキスト領域、表領域あるいは図領域のいずれかの属性を検出するようにしている。
【0015】
また、指定手段3により画面上で指定された領域に対応して、テキスト領域、表領域あるいは図領域を検出するようにしている。
【0016】
また、指定手段3により始点から終点に向かう方向の違いで、テキスト領域、表領域あるいは図領域を検出するようにしている。
【0017】
また、指定手段3により処理対象領域がテキスト領域と検出されたときに、更に、テキスト領域について文字認識する、指定されたモードを検出するようにしている。
【0018】
また、表領域と検出されたときに、指定手段3で指定された位置がセル内のときは指定されたセル内の領域を処理対象領域、あるいはセル外のときは指定された位置の文字を中心に各隣接距離が所定値以内の文字列を含む領域を処理対象領域とするようにしている。
【0019】
従って、指定手段3で指定された文書中の処理対象の正確な位置、属性を検出し、当該位置、属性をもとに撮像した画像から文字認識、表認識、図処理などに適した処理を行って電子文書に貼り付けることにより、既存文書から電子文書への文字列、表、図などの情報入力を高速かつ高精度に実現することが可能となる。
【0020】
【発明の実施の形態】
次に、図1から図11を用いて本発明の実施の形態および動作を順次詳細に説明する。ここで、本願発明が処理対象とする文書(既成文書)は、紙文書、車などのナンバープレート、看板などの既に作成された文書である(文字、表、図、式などが印刷、プリントアウトなどされた文書である)。
【0021】
図1は、本発明のシステム構成図を示す。
図1において、処理装置1は、プログラムに従い各種処理を実行するものであって、ここでは、既存文書を読み取って文字認識し、画面上の該当個所に貼り付けるものであり、属性検出手段11、領域検出手段12、認識手段13、および貼り付け手段14などから構成されるものである。
【0022】
属性検出手段11は、文書から読み取る領域の属性(テキスト、表、図など)を検出するものである(図3から図11を用いて後述する)。
【0023】
領域検出手段12は、文書中から文字認識する領域を検出するものである(図3から図11を用いて後述する)。
【0024】
認識手段13は、文書中から検出された領域についいて、検出された属性に従い文字認識などするものである(図3から図11を用いて後述する)。
【0025】
貼り付け手段14は、画面(文書を表示した画面、グラフィックソフトで開いた画面、エクセルなどで開いたワークシートなどの貼り付け可能な画面など)の該当位置に貼り付けるものである(図3から図11を用いて後述する)。
【0026】
撮像装置2は、文書の画像を読み取るものであって、例えばデジタルカメラ、スキャナーなどである。
【0027】
指定手段3は、文書上の位置を指定するもの(例えば電子ペン)である。
出力装置4は、各種出力装置であって、ここでは、ディスプレイ装置、プリンタ装置などである。
【0028】
次に、図2のフローチャートの順番に従い、図1の構成の全体の動作を説明する。
【0029】
図2は、本発明の動作説明フローチャートを示す。
図2において、S1は、座標を取得する。これは、図1の指定手段3により、例えば後述する図3の(1)の紙文書上で電子ペンをON(始点)してドラッグしOFF(終点)したことに対応して、当該始点および終点の座標(また、必要に応じて軌跡の座標)を取得する(左上の受信機で検出して始点と終点などの座標を取得する)。
【0030】
S2は、画像を取得する。これは、図1の撮像装置2で文書の画像を撮像して取得する。
【0031】
S3は、属性を検出する。これは、指定手段3で指定された領域に対応する属性(テキスト、表、図)を検出、あるいは指定手段3で指定された始点から終点に向かう向きの違いで属性(テキスト、表、図)を検出などする。
【0032】
S4は、領域を検出する。これは、指定手段3で指定された例えば始点と終点で決まる領域を検出する。
【0033】
S5は、認識する。これは、S4で検出した領域内の画像について、S3で検出した属性(テキスト、表、図)に従い、文字認識などする。
【0034】
S6は、貼り付ける。これは、S5で認識した結果を、画面上の文書中の指定された位置に貼り付ける。
【0035】
以上によって、紙文書上で領域および属性を検出し、検出された領域について検出された属性に従い文字認識などし、その結果を指定された画面上の個所に貼り付けることにより、簡易かつ迅速に紙文書中のテキスト、表、図などを電子文書中の該当個所に貼り付ける(入力する)ことが可能となる。以下順次詳細に説明する。
【0036】
図3は、本発明の説明図(その1)を示す。
図3の(1)は、座標取得および画像取得の例を示す。
【0037】
図3の(1)において、紙文書は、紙(例えばA4の紙)上に文字が印刷されたテキスト領域(左側)、表が印刷された表領域(右下)、図が印刷された図領域(右上)がそれぞれ図示のように存在するものである。
【0038】
受信機は、図示外のペン(電子ペン)を紙文書上で押下してペンONにするとそのペンONの座標(始点)を検出し、電子ペンがドラッグされるとその軌跡の座標を検出し、電子ペンをOFFにするとその座標(終点)を検出する公知のものである。
【0039】
以上の構成のもとで、ここでは、紙文書上で電子ペンが押下された始点および終点の座標を検出、および紙文書をデジタルカメラ、スキャナーなどで読み取って画像を生成することが可能となる。
【0040】
図3の(2)は、認識の例を示す。ここでは、
・左側の紙文書中のテキスト領域については文字認識を行う。
【0041】
・中央の紙文書中の表領域については表中の各セルの文字認識を行う。
・右側の紙文書中の図領域については図であるので、ここでは、文字認識しない。
【0042】
以上により、紙文書中のテキスト領域および表領域については文字認識されることとなる。
【0043】
図3の(3)は、貼り付け例を示す。ここでは、
・左側の紙文書中のテキスト領域については、図3の(2)で文字認識結果を、画面上の文書のカーソルのある位置を先頭に貼り付ける(入力する)。
【0044】
・中央の紙文書中の表領域については、図3の(2)で文字認識結果を、画面上のここでは、表中のカーソルのある位置に貼り付ける(入力する)。
【0045】
・右側の紙文書中の図領域については、図3の(1)で取得した画像中から切り出した当該図領域の図をそのまま画面上にそのまま貼り付ける(必要に応じてサイズ、貼り付け個所を指定する)。
【0046】
以上により、画面上の電子文書中に、紙文書中から取り出したテキスト領域、表領域から認識した文字列、更に図領域については図を電子文書中の該当位置に貼り付けることが簡易かつ高精度かつ迅速に行うことが可能となる。
【0047】
図4は、本発明の詳細フローチャート(その1)を示す。
図4において、S11は、電子ペンがONか判別する。これは、既述した図3の(1)の紙文書上で、電子ペンが押下されて、ONが検出されたか判別する。YESの場合には、S12に進む。NOの場合には、S11を繰り返し待機する。
【0048】
S12は、S11のYESで、電子ペンONが検出されたので、軌跡を取得する。これは、S11のYESで電子ペンONが検出され、ドラッグされたのでそのドラッグされた位置の軌跡(座標)を取得する。
【0049】
S13は、電子ペンがOFFか判別する。これは、S12で電子ペンがドラッグされてOFFが検出されたか判別する。YESの場合には、S14に進む。NOの場合には、S13を繰り返し行い待機する。
【0050】
S14は、S13のYESで電子ペンがOFFされたと検出されたので、S11のYESで電子ペンON検出時の始点座標および電子ペンOFF検出時の終点座標をもとに決まる領域の画像を、図1の撮像装置2で撮像して取得する。
【0051】
以上によって、既述した図3の(1)で紙文書上で例えば左側の▲1▼の始点および終点が検出されたときは当該始点と終点を含む矩形領域の画像を例えば図示の点線のように撮像装置2で撮像して取得する。そして、既述した図3の(2)の認識の処理に進む。
【0052】
図5は、本発明の詳細フローチャート(その2)を示す。
図5において、S21は、軌跡を含む表を抽出する。これは、既述した図3の(1)の▲2▼の表領域について、既述した図4のフローチャートに従い検出した始点と終点の軌跡を含む表領域の画像を抽出する。
【0053】
S22は、セル毎の文字列情報を得る。これは、S21で抽出した表領域中から各セル毎に文字認識して文字認識情報を得る。
【0054】
S23は、表の論理構造を認識する。これは、図3の(1)の▲2▼の表領域について、罫線をもとに表の論理構造(セルの行列の情報など)を認識する。
【0055】
S24は、貼り付ける。これは、既述した図3の(3)の中央に示すように、画面上の電子文書中の該当セルに、認識したそれぞれのセル毎の文字認識情報を貼り付け、入力する。
【0056】
以上によって、図3の(1)の紙文書中の表領域について、当該表の各セル毎に文字認識および表の論理構造を認識し、電子文書中の該当する表のセルに文字情報を正確かつ迅速に貼り付けて入力することが可能となる。
【0057】
図6は、本発明の説明図(その2)を示す。
図6において、下段の属性指定領域は、上段の紙文書の領域の属性を指定する領域である。いずれかの属性を電子ペンでクリック(電子ペンでON−OFF)して属性を指定し、次に、既述した図3の(1)の紙文書上で電子ペンをON−ドラッグ−OFFし、その始点と終点を含む所定の矩形領域を抽出し、当該指定した属性で抽出した領域の認識、更に、電子文書の該当個所への貼り付けを行うようにしたものである。ここで属性指定領域には、図示の下記の属性指定領域を設ける。
【0058】
・テキスト:
・氏名文字列:
・住所文字列:
・電話番号文字列:
・表:
・図:
ここで、テキストで氏名文字列、住所文字列および電話番号文字列のいずれかの領域が電子ペンでクリックして指定されたときは、紙文書上で電子ペンにより指定された始点と終点を含む矩形領域の画像を取得し、当該取得した画像について指定された氏名文字列、住所文字列、電話番号文字列を認識するために最適な例えば氏名辞書、住所辞書、電話番号辞書、およびこれらを認識する最適な文字の切り出し方法を設定して高精度で文字認識を行うことが可能となる。また、表については、縦横の罫線を検出して各セルの位置、サイズなどを認識する認識エンジンを起動および表内の文字の認識に最適な認識方法を設定し、高精度に各セルおよびセル内の文字認識を行う。図については、当該図の画像を拡大、縮小、回転などを必要に応じて行い、電子文書中の該当個所に貼り付けて入力する。
【0059】
以上のように、電子ペンで属性指定領域中の任意の個所をクリックして属性を指定し、当該指定した属性で紙文書中から取得した画像を認識し、電子文書中の該当個所に貼り付けて入力を行うことにより、それぞれの属性(テキスト、表、図など)に適合した最適かつ高精度で認識し、電子文書の該当個所への貼り付けを行うことが可能となる。
【0060】
図7は、本発明の詳細フローチャート(その3)を示す。
図7において、S31は、属性指定する。これは、例えば既述した図6の属性指定領域のいずれかの領域を電子ペンでクリックして指定する。
【0061】
S32は、S31の属性指定で、文字(テキスト)であって、氏名モード、住所モード、電話番号モードのいずれかが指定された場合、当該指定されたモードで最適に設定した辞書(氏名辞書、住所辞書、電話番号辞書)かつ文字の切り出し方法(氏名に最適な文字切り出し方法、住所に最適な文字切り出し方法、電話番号に最適な文字切り出し方法)で、図3の(2)の左側の文字認識を高精度かつ迅速に行う。そして、図3の(3)で、電子文書中のカーソル位置に貼り付けて入力する。
【0062】
S33は、S31の属性指定で、表が指定された場合、当該指定された表に最適に設定した表認識処理を起動し、表の論理構造(各セルの行列とサイズなど)を検出し、図3の(2)の中央の文字認識(各セル内の文字認識)を高精度かつ迅速に行う。そして、図3の(3)で、電子文書中の表中の該当個所に論理構造を復元して貼り付けて入力する。
【0063】
S34は、S31の属性指定で、図が指定された場合、当該指定された図に最適に設定したエンジンを起動し、図について、必要に応じて拡大、縮小などし、図3の(3)で、電子文書中の該当個所に貼り付けて入力する。
【0064】
以上のように、紙文書中の認識しようとする領域の属性を電子ペンで指定し、当該指定された属性に最適な設定(辞書、文字切り出し方法など)をし、認識を高精度かつ迅速に行い、電子文書中の該当個所に貼り付けて入力することが可能となる。
【0065】
図8は、本発明の詳細フローチャート(その4)を示す。
図8において、S41は、軌跡を取得する。これは、既述した図3の(1)の紙文書上で、電子ペンでONし、ドラッグし、OFFする軌跡(座標)を取得する。
【0066】
S42は、S41で取得した電子ペンの軌跡の始点と終点が、図示のように左から右方向にほぼ水平の場合、1行文字列と判定(始点と終点で横切った文字列を認識と判定)し、当該文字列を含む矩形領域の画像を取得し、図3の(2)の文字認識を行う。
【0067】
S43は、S41で取得した電子ペンの軌跡の始点と終点が、図示のように左下から右上に向かう場合、当該始点と終点の軌跡で横切った複数の文字列の矩形領域の画像を取得し、図3の(2)の文字認識を行う。そして、文字認識した結果を、電子文書上のカーソルの位置に貼り付けて入力する。
【0068】
S44は、S41で取得した電子ペンの軌跡の始点と終点が、図示のように左上から右下に向かう場合、当該始点と終点の軌跡で決まる矩形の表領域の画像取得し、図3の(2)の表認識(表の各セル内の文字認識および表の論理構造(行列など)の認識)を行う。そして、文字認識した結果を、電子文書上のカーソルの位置などに貼り付けて入力する。
【0069】
S45は、S41で取得した電子ペンの軌跡の始点と終点が、図示のように右上から左下に向かう場合、当該始点と終点の軌跡で決まる図領域の画像を取得し、図3の(3)の電子文書上の該当個所に貼り付けて入力する。
【0070】
以上により、紙文書上で電子ペンをONしてドラッグしてOFFするという一連の簡単な操作により、紙文書上の認識対象の領域および認識する属性(文字列、表、図)を検出させて電子文書中に貼り付けて迅速に入力することが可能となる。
【0071】
図9は、本発明の詳細フローチャート(その5)を示す。
図9において、S51は、軌跡を取得する。これは、既述した例えば図8のS41の軌跡を取得し、ここでは、領域と表である旨を検出する(図8のS44)。
【0072】
S52は、画像を取得する。これは、S51で取得した軌跡をもとに検出した領域の画像を取得する。
【0073】
S53は、表を認識する。これは、S51で取得した画像から表の罫線、セルの認識(抽出)を行う。
【0074】
S54は、ペンのポイントがセルに含まれか判別する。YESの場合には、電子ペンでポイントされた位置が表中のセルに含まれると判明したので、S55でセルの内接領域を抽出し、図3の(2)の文字認識を行い、当該セル内の文字列の認識を行う。そして、文字認識した結果を、既述した図3の(3)の中央の電子文書上の表の該当個所に貼り付けて入力する。一方、S54のNOの場合には、電子ペンでポイントされた位置が表中のセルに含まれないと判明したので、S56でペンのポイントを含む領域の文字列を抽出(電子ペンでポイントされた位置の文字と隣接する文字が所定距離範囲内の他の文字をまとめて一連の文字列として当該領域の文字列の画像を抽出)し、図3の(2)の文字認識を行い、認識結果を電子文書上の該当位置に貼り付けて入力する。
【0075】
以上により、表内のセルあるいは表外の文字列の画像を抽出して文字認識し、電子文書上の該当個所に貼り付けて迅速に入力することが可能となる。
【0076】
図10は、本発明の詳細フローチャート(その6)を示す。
図10において、S61は、軌跡を取得する。これは、既述した図6の属性指定領域で電子ペンで指定された軌跡(この場合には、電子ペンでクリックするので、始点と終点がほぼ同じ座標値となる軌跡)を取得する。
【0077】
S62は、領域を抽出する。ここでは、図6の氏名文字列の領域が指定されたと抽出する。
【0078】
S63は、属性を文字認識を用いて検出する。これは、S62で抽出された領域の属性のモードここでは、例えば「氏名」と検出する。当該検出は、抽出された領域の画像を文字認識して例えば「氏名」と認識してもよいし、当該領域の範囲に対応する予め設定されている属性(ここでは、「氏名」)を検出してもよい。
【0079】
S64は、S63で検出された属性のモード(氏名モード、住所モード、電話番号モードなど)に最適な辞書、文字の切り出し方法などを設定し、S65に進む。
【0080】
S65は、軌跡を取得する。これは、図6の紙文書上で電子ペンでONし、ドラッグし、OFFした軌跡を取得する。
【0081】
S66は、領域を抽出する。これは、S65で取得した軌跡、例えば始点と終点の座標をもとに領域を抽出する。
【0082】
S67は、選択された辞書(モード)を使った文字認識を行う。これにより、氏名モードの場合には、画像から当該氏名に最適な氏名辞書および画像中から文字を切り出す方法を使用して文字認識するため、高精度に文字認識することができる。
【0083】
S68は、貼り付ける。これは、S67で認識した認識結果を、電子文書上の例えば意カーソルのある位置に貼り付けて入力する。
【0084】
以上により、文字列の場合に氏名、住所、電話番号などのモードを合わせて指定し、当該モードに最適な辞書や文字切り出し方法を設定して文字認識し、認識結果を電子文書上の該当個所に貼り付けて入力することにより、専用の辞書および文字切り出し方法などを用いて高精度に文字認識して電子文書上の該当個所に入力することが可能となる。
【0085】
図11は、本発明の属性/モードの概略説明図を示す。
図11において、
・属性「文字」には、更に、モード「氏名」、「住所」、「電話番号」、その他がある。文字の場合に、更にモード指定することで、指定されたモードに最適な辞書や画像からの文字切り出し方法を設定することで、高精度かつ迅速に文字認識することが可能となる。
【0086】
・属性「表」は、属性のみである。表認識の場合には、縦横の罫線を検出し、各セルの行列の情報とサイズなどの表の論理構成を検出する必要があるので、当該属性「表」用の認識エンジンを起動して認識させる。
【0087】
・属性「図」は、属性のみである。図の場合には、紙文書中の図領域から画像を取得し、必要に応じて拡大、縮小、回転などし、電子文書上の該当個所に貼り付けて入力するので、当該拡大、縮小、回転などを行うエンジン(ソフト)を起動して実行させるようにする。
【0088】
尚、本実施例では、文字列(氏名、住所、電話番号など)、表、図について区別して属性を検出し、それぞれの属性に最適な処理を説明したが、この他に、数式、帳票などの特別な文字や記号を使ったりする既存文書では、当該専用の属性を設けて専用の辞書、文字切り出し方法などを設定し、指定された属性に最適な辞書、文字切り出し方法を使用して高精度かつ迅速に既存文書から切り出して認識して電子文書に貼り付けて入力するようにすることが可能である。
【0089】
【発明の効果】
以上説明したように、本発明によれば、指定手段3で指定された文書中の処理対象の正確な位置、属性を検出し、当該位置、属性をもとに撮像した画像から文字認識、表認識、図処理などに適した処理を行って電子文書に貼り付ける構成を採用しているため、既存文書から電子文書への文字列、表、図などの情報入力を高速かつ高精度に実現することが可能となる。
【図面の簡単な説明】
【図1】本発明のシステム構成図である。
【図2】本発明の動作説明フローチャートである。
【図3】本発明の説明図(その1)である。
【図4】本発明の詳細フローチャート(その1)ある。
【図5】本発明の詳細フローチャート(その2)である。
【図6】本発明の説明図(その2)である。
【図7】本発明の詳細フローチャート(その3)である。
【図8】本発明の詳細フローチャート(その4)である。
【図9】本発明の詳細フローチャート(その5)である。
【図10】本発明の詳細フローチャート(その6)である。
【図11】本発明の属性/モードの概略説明図である。
【符号の説明】
1:処理装置
11:属性検出手段
12:領域検出手段
13:認識手段
14:貼り付け手段
2:撮像装置
3:指定手段
4:出力装置

Claims (8)

  1. 既存文書から情報を認識して文書に入力する文書情報入力プログラムにおいて、
    コンピュータに、
    既存文書上で指定手段により指定された処理対象領域を検出する手段と、
    前記検出された処理対象領域の画像を少なくとも読み取る手段と、
    前記読み取った処理対象領域の画像について、文字認識する手段と、
    前記文字認識した結果を、画面上の該当個所に貼り付ける手段と
    して実行させるための文書情報入力プログラム。
  2. 前記指定手段により指定された前記処理対象領域を検出する際に、指定された当該処理対象領域がテキスト領域、表領域あるいは図領域のいずれかの属性を検出することを特徴とする請求項1記載の文書情報入力プログラム。
  3. 前記指定手段により指定された領域に対応して、前記テキスト領域、表領域あるいは図領域を検出することをことを特徴とする請求項1あるいは請求項2記載の文書情報入力プログラム。
  4. 前記指定手段により始点から終点に向かう方向の違いで、前記テキスト領域、表領域あるいは図領域を検出することを特徴とする請求項1あるいは請求項2記載の文書情報入力プログラム。
  5. 前記指定手段により処理対象領域がテキスト領域と検出されたときに、更に、当該テキスト領域について文字認識する、指定されたモードを検出することを特徴とする請求項1から請求項4のいずれかに記載の文書情報入力プログラム。
  6. 前記表領域と検出されたときに、指定手段で指定された位置がセル内のときは当該指定されたセル内の領域を前記処理対象領域、あるいはセル外のときは当該指定された位置の文字を中心に各隣接距離が所定値以内の文字列を含む領域を処理対象領域とすることを特徴とする請求項1から請求項5記載の文書情報入力プログラム。
  7. 既存文書から情報を認識して文書に入力する文書情報入力装置において、
    既存文書上で指定手段によって指定された処理対象領域を検出する手段と、
    前記検出された処理対象領域の画像を少なくとも読み取る手段と、
    前記読み取った処理対象領域の画像について、文字認識する手段と、
    前記文字認識した結果を、画面上の該当個所に貼り付ける手段と
    を備えたことを特徴とする文書情報入力装置。
  8. 既存文書から情報を認識して文書に入力する文書情報入力方法において、
    既存文書上で指定手段によって指定された処理対象領域を検出するステップと、
    前記検出された処理対象領域の画像を少なくとも読み取るステップと、
    前記読み取った処理対象領域の画像について、文字認識するステップと、
    前記文字認識した結果を、画面上の該当個所に貼り付けるステップと
    を有する文書情報入力方法。
JP2002217386A 2002-07-26 2002-07-26 文書情報入力プログラム、文書情報入力装置、および文書情報入力方法 Pending JP2004062350A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2002217386A JP2004062350A (ja) 2002-07-26 2002-07-26 文書情報入力プログラム、文書情報入力装置、および文書情報入力方法
US10/602,624 US7280693B2 (en) 2002-07-26 2003-06-25 Document information input apparatus, document information input method, document information input program and recording medium
KR1020030050906A KR20040010364A (ko) 2002-07-26 2003-07-24 문서 정보 입력 프로그램, 문서 정보 입력 장치 및 문서정보 입력 방법
CNA031498140A CN1484165A (zh) 2002-07-26 2003-07-25 文件信息的输入设备,输入方法,输入程序以及记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002217386A JP2004062350A (ja) 2002-07-26 2002-07-26 文書情報入力プログラム、文書情報入力装置、および文書情報入力方法

Publications (1)

Publication Number Publication Date
JP2004062350A true JP2004062350A (ja) 2004-02-26

Family

ID=30767971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002217386A Pending JP2004062350A (ja) 2002-07-26 2002-07-26 文書情報入力プログラム、文書情報入力装置、および文書情報入力方法

Country Status (4)

Country Link
US (1) US7280693B2 (ja)
JP (1) JP2004062350A (ja)
KR (1) KR20040010364A (ja)
CN (1) CN1484165A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012098594A (ja) * 2010-11-04 2012-05-24 Ricoh Co Ltd 撮像装置および撮像方法
JP2016034098A (ja) * 2014-07-31 2016-03-10 ブラザー工業株式会社 プログラム、情報処理装置および情報処理装置の制御方法
JP2017208655A (ja) * 2016-05-17 2017-11-24 京セラドキュメントソリューションズ株式会社 情報処理装置、情報処理方法及びプログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006209687A (ja) * 2005-01-31 2006-08-10 Sony Corp データ処理回路
US7787158B2 (en) * 2005-02-01 2010-08-31 Canon Kabushiki Kaisha Data processing apparatus, image processing apparatus, data processing method, image processing method, and programs for implementing the methods
JP4920928B2 (ja) * 2005-08-08 2012-04-18 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP4321549B2 (ja) * 2005-09-28 2009-08-26 セイコーエプソン株式会社 文書作成システム、文書作成方法、プログラムおよび記憶媒体
JP4888071B2 (ja) * 2006-11-15 2012-02-29 富士通株式会社 プログラム、コピーアンドペースト処理方法、装置及び記録媒体
JP2008276487A (ja) * 2007-04-27 2008-11-13 Fuji Xerox Co Ltd 文書処理プログラム、文書処理装置及び文書処理システム
CN101667251B (zh) * 2008-09-05 2014-07-23 三星电子株式会社 具备辅助定位功能的ocr识别方法和装置
CN101609365B (zh) * 2009-07-21 2012-10-31 上海合合信息科技发展有限公司 字符输入方法及系统、电子设备及其键盘
WO2011079432A1 (en) * 2009-12-29 2011-07-07 Nokia Corporation Method and apparatus for generating a text image
CN104020847A (zh) * 2014-05-15 2014-09-03 上海合合信息科技发展有限公司 字符输入方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5258855A (en) * 1991-03-20 1993-11-02 System X, L. P. Information processing methodology
JP3173067B2 (ja) * 1991-10-17 2001-06-04 富士ゼロックス株式会社 グラフ作成装置および方法
JPH11203403A (ja) 1998-01-16 1999-07-30 Oki Electric Ind Co Ltd 情報処理装置
JP2000331117A (ja) 1999-05-24 2000-11-30 Oki Electric Ind Co Ltd 文書読取システム
JP2001297303A (ja) * 2000-02-09 2001-10-26 Ricoh Co Ltd 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
US7162084B2 (en) * 2003-01-29 2007-01-09 Microsoft Corporation System and method for automatically detecting and extracting objects in digital image data
US7305612B2 (en) * 2003-03-31 2007-12-04 Siemens Corporate Research, Inc. Systems and methods for automatic form segmentation for raster-based passive electronic documents

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012098594A (ja) * 2010-11-04 2012-05-24 Ricoh Co Ltd 撮像装置および撮像方法
JP2016034098A (ja) * 2014-07-31 2016-03-10 ブラザー工業株式会社 プログラム、情報処理装置および情報処理装置の制御方法
JP2017208655A (ja) * 2016-05-17 2017-11-24 京セラドキュメントソリューションズ株式会社 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
US7280693B2 (en) 2007-10-09
CN1484165A (zh) 2004-03-24
KR20040010364A (ko) 2004-01-31
US20040017940A1 (en) 2004-01-29

Similar Documents

Publication Publication Date Title
CN101667251B (zh) 具备辅助定位功能的ocr识别方法和装置
EP2306270B1 (en) Character input method and system
US8494257B2 (en) Music score deconstruction
JP2004062350A (ja) 文書情報入力プログラム、文書情報入力装置、および文書情報入力方法
JP2011008752A (ja) ドキュメント操作システム、ドキュメント操作方法およびそのためのプログラム
JP2013502861A (ja) 連絡先情報入力方法及びシステム
JPH08235341A (ja) ドキュメントファイリング装置および方法
US10152472B2 (en) Apparatus and method for generating summary data of E-book or E-note
JP2022066321A (ja) 情報処理装置及びプログラム
JP2008204184A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP2001092967A (ja) 図面認識装置および図面認識方法
JP6019939B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP2001202475A (ja) 文字認識装置及び文字認識装置の制御方法
CN113869301A (zh) 一种扫描打印方法、装置、设备及存储介质
JP4697387B2 (ja) 原稿画像判定装置、原稿画像判定方法及びそのプログラム
CN113157194B (zh) 文本显示方法以及电子设备、存储装置
JPH0635987A (ja) 回路図作成装置および回路図作成方法
JP2013250927A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2000285237A (ja) 画像処理装置、画像処理方法及び画像処理プログラムを記録した記録媒体
CN119443065A (zh) 表格处理方法、装置以及计算机程序产品
JP4431335B2 (ja) 文字列読み取りプログラム
TWI312487B (en) A snapshot characters recognition system of a hand-carried data processing device and its method
JP4001846B2 (ja) 画像表示装置、画像表示方法、画像表示プログラムおよび画像表示プログラムを格納した記録媒体
JPH07160811A (ja) 文字認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050112

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071009

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080205