[go: up one dir, main page]

JPH11288445A - Form recognition method and apparatus - Google Patents

Form recognition method and apparatus

Info

Publication number
JPH11288445A
JPH11288445A JP10090196A JP9019698A JPH11288445A JP H11288445 A JPH11288445 A JP H11288445A JP 10090196 A JP10090196 A JP 10090196A JP 9019698 A JP9019698 A JP 9019698A JP H11288445 A JPH11288445 A JP H11288445A
Authority
JP
Japan
Prior art keywords
image data
character
information
communication network
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10090196A
Other languages
Japanese (ja)
Inventor
Motohiro Machida
基宏 町田
Yuzuru Togashi
譲 富樫
Tomonori Izumitani
知範 泉谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10090196A priority Critical patent/JPH11288445A/en
Publication of JPH11288445A publication Critical patent/JPH11288445A/en
Pending legal-status Critical Current

Links

Landscapes

  • Facsimiles In General (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To attain the character recognition of various kinds of slips with high recognition precision in a facsimile communication network without preparing any FAX-OCR(optical character reading) device or plural lines at a user side, or without using any specific slip in which format information or the like is embedded. SOLUTION: The controller of a facsimile communication network is provided with an image storing part 22 for storing image information, identification information sorting part 25 for storing identification information for identifying the kind of a slip, format information storing part 23 and character attribute information storing part 24 for storing slip information being information related with the entry area of the slip, slip identifying part 29 for identifying the kind of the slip by referring to the identification information storing part 25 from the received already entried slip image data, and character recognizing part 30 for operating the segmentation of a character area and character recognition by referring to the format information storing part 23 and the character attribute information storing part 24.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、ファクシミリ通信
網における帳票認識方法及び装置に関し、特に、送信端
末からファクシミリ通信網に向けて発信された記入済み
の帳票イメージデータをファクシミリ通信網内の装置に
蓄積してこの帳票イメージデータに対して文字認識処理
を実行し、記入済み帳票イメージデータにおける各記入
領域内の文字を認識する帳票認識方法及び装置に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a form recognition method and apparatus in a facsimile communication network, and more particularly, to a form recognition apparatus in a facsimile communication network for transmitting filled-out form image data transmitted from a transmission terminal to the facsimile communication network. The present invention relates to a form recognition method and apparatus for accumulating and performing character recognition processing on this form image data and recognizing characters in each entry area in the completed form image data.

【0002】[0002]

【従来の技術】ファクシミリデータの蓄積変換機能と電
話網とを組み合わせたファクシミリ通信網では、従来よ
り、文字認識サービスを提供している。この文字認識サ
ービスは、ファクシミリ通信網のメディア変換機能を利
用したものであって、送信端末側(エンド側)において
帳票に文字等を記入しファクシミリ装置を介してこの帳
票をファクシミリイメージとしてファクシミリ通信網側
に送出することにより、ファクシミリ通信網内において
このファクシミリイメージに対して文字認識処理を行
い、得られた認識結果である(文字)コード情報を受信
側(センタ側)に送るものである。この文字認識サービ
スは、商品の受発注などに広く使用されている。例え
ば、末端の小売店が翌日入荷予定分の商品の発注データ
を帳票に記入しファクシミリ通信網を介して卸売業者側
に送信すると、ファクシミリ通信網内において、帳票に
記入されているイメージデータである発注データが文字
データであるコード情報に変換され、センタ側である卸
売業者に伝送される。卸売業者は、コード情報に変換さ
れた発注データに基づいて受注処理を行うことになるの
で、受注処理を自動化することができ、コストの削減や
迅速な配送を実現することが可能になっている。
2. Description of the Related Art A facsimile communication network combining a facsimile data storage conversion function and a telephone network has conventionally provided a character recognition service. This character recognition service utilizes a media conversion function of a facsimile communication network. A character or the like is written in a form on a transmission terminal side (end side), and the form is converted into a facsimile image via a facsimile apparatus. By transmitting the data to the facsimile communication network, the facsimile image is subjected to character recognition processing, and the obtained recognition result (character) code information is transmitted to the receiving side (center side). This character recognition service is widely used for ordering products and the like. For example, when the terminal retailer fills out a form with order data of goods to be received the next day and sends it to the wholesaler via the facsimile communication network, the image data is written in the form in the facsimile communication network. The order data is converted into code information, which is character data, and transmitted to the wholesaler on the center side. Since the wholesaler performs order processing based on the order data converted into the code information, it is possible to automate the order processing, thereby realizing cost reduction and quick delivery. .

【0003】なお、ここで使用する帳票のことを俗にマ
ークシートとも呼ぶが、単にマークにしるしが付される
だけでなく認識対象となる文字もこの帳票には記入され
るので、厳密には、マークシートではなく帳票と呼ぶべ
きである。
[0003] The form used here is also commonly referred to as a mark sheet, but not only a mark is added to the mark but also a character to be recognized is entered in this form. It should be called a form, not a mark sheet.

【0004】さて、帳票のファクシミリデータ(記入済
み帳票イメージデータ)から文字認識を行って精度よく
コード情報を抽出するためには、帳票の書式に関する情
報が不可欠である。しかしながら、ファクシミリ通信網
における文字認識サービスの場合、多数のユーザからの
多種多様な書式による帳票イメージデータを処理しなけ
ればならないため、ファクシミリ通信網内にはユーザご
との帳票に関する書式情報等は保持せず、その代わり、
予めマークを帳票に刷り込んでおくことにより、帳票自
体に書式情報等を埋め込むようにしていた。具体的に
は、例えば、認識すべき文字が記入されている位置を黒
塗りのマークで表現したり、縦方向のマークと横方向の
マークのそれぞれの延長の交点が文字の記入位置となる
ようにしている。また、記入されるべき文字の文字種に
関しては、マークの形態及びその数により、数字、記
号、英字(アルファベット)、かな文字等の種類の別を
指定するようにしている。
In order to accurately extract code information by performing character recognition from facsimile data of a form (completed form image data), information on the form of the form is indispensable. However, in the case of a character recognition service in a facsimile communication network, it is necessary to process form image data in a variety of formats from a large number of users. Instead,
By printing the mark on the form in advance, format information and the like are embedded in the form itself. Specifically, for example, the position where the character to be recognized is written is represented by a black mark, or the intersection of the extension of each of the vertical mark and the horizontal mark becomes the character writing position. I have to. Regarding the character type of the character to be entered, the type of numeral, symbol, alphabet (alphabet), kana character, or the like is specified according to the form and number of marks.

【0005】特開平9−179917号公報には、網内
の画像蓄積交換機において帳票の文字認識を行うものと
して、帳票の特定の位置に予め刷り込まれている帳票I
Dを利用し、帳票の種類を識別するシステムが開示され
ている。しかしながらこの方法の場合、全ての利用者に
対して同じ位置に帳票IDを刷り込むことを要求するの
で、不特定の利用者を対象とし、多種多様な帳票の使用
できるようにする立場からは、使い勝手が悪いものとな
ってしまう。
Japanese Patent Application Laid-Open No. 9-179917 discloses a form I which is pre-printed at a specific position on a form, assuming that an image storage and exchange device in the network performs character recognition of the form.
A system that uses D to identify the type of form is disclosed. However, this method requires all users to imprint the form ID at the same position, so that it is easy to use from the standpoint of targeting unspecified users and using various forms. Is bad.

【0006】ところで、ユーザが記入した文字を含む帳
票のイメージデータから文字のコード情報を抽出するも
のとして、OCR(光学式文字読み取り装置)や、この
OCRとファクシミリ受信機を組み合わせたFAX−O
CR装置がある。個別のユーザ側にこのようなOCRや
FAX−OCRを設けた場合、その個別のユーザが使用
する帳票種別は限定されることがほとんどであるから、
帳票を読み込む前に、予め、使用する帳票に関する書式
情報等を登録することが一般的である。
By the way, as a device for extracting character code information from image data of a form including characters entered by a user, an OCR (optical character reader) or a FAX-O which combines this OCR and a facsimile receiver is used.
There is a CR device. When such an OCR or FAX-OCR is provided on the individual user side, the form type used by the individual user is almost always limited.
Before reading a form, it is common to register in advance format information and the like on the form to be used.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、ファク
シミリ通信網を使用することなく、FAX−OCR装置
を用いた場合、ある程度以上の枚数の帳票を受信して処
理しようとすると、帳票イメージデータの送信がある時
間帯に集中しやすいこともあって、多くの回線とFAX
−OCR装置を用意する必要があり、経済的な問題を生
じる。一方、ファクシミリ通信網を使用する場合、ファ
クシミリ通信網自体がファクシミリデータの蓄積機能を
有しており、かつ、ファクシミリ通信網からユーザ(セ
ンタ側)に送られるデータはコード情報であってイメー
ジデータに比べてデータサイズが小さいから、ユーザ側
での設備の負担は少なくて済むものの、ファクシミリ通
信網側では帳票の書式情報を保持しないことから、マー
ク等を予め刷り込んだ特殊な帳票を使用しなければなら
ず、使い勝手等が悪く、また、刷り込まれているマーク
等が正しく検出できなかった場合には文字の誤認識や認
識不能となるという問題点がある。
However, if a facsimile communication network is used without using a facsimile communication network and a facsimile is used to receive and process a certain number of forms, the form image data is transmitted. There are many lines and faxes because it is easy to concentrate in a certain time zone
-It is necessary to prepare an OCR device, which causes an economic problem. On the other hand, when a facsimile communication network is used, the facsimile communication network itself has a function of storing facsimile data, and the data sent from the facsimile communication network to the user (center side) is code information and is converted into image data. Since the data size is smaller, the burden on the equipment on the user side can be reduced, but since the facsimile communication network does not retain the format information of the form, unless special forms preprinted with marks etc. are used. In addition, there is a problem that the usability is poor, and if the imprinted mark or the like cannot be detected correctly, characters are erroneously recognized or cannot be recognized.

【0008】本発明の目的は、ユーザ側でFAX−OC
R装置や多数の受信用回線を用意することなく、また、
書式情報等を埋め込んだ特殊な帳票を使用することな
く、ファクシミリ通信網内で多種多様な帳票の文字認識
を高い認識精度で行うことができ、高い利便性を有する
帳票認識方法及び装置を提供することにある。
[0008] An object of the present invention is to provide a FAX-OC on the user side.
Without preparing R device and many receiving lines,
Provided is a form recognition method and apparatus that can perform character recognition of a variety of forms with high recognition accuracy in a facsimile communication network without using a special form in which format information or the like is embedded, and has high convenience. It is in.

【0009】[0009]

【課題を解決するための手段】本発明では、帳票に関す
る書式情報、例えば、記入欄の位置、記入欄ごとにその
記入欄に記入されるべき文字の種別、記入欄の属性(種
類)などの情報をファクシミリ通信網内に保持すること
とし、そのために、ファクシミリ通信網にこれらの書式
情報をユーザ側から登録できるようにする手段を新たに
設けている。このように構成することにより、ファクシ
ミリ通信網の有する利点を保ったまま、多数の利用者に
対して利便性を提供でき、また1ユーザに対しては様々
な帳票を使用することができるようになる。
According to the present invention, format information on a form, such as the position of an entry column, the type of character to be entered in the entry column for each entry column, the attribute (type) of the entry column, etc. The information is held in the facsimile communication network, and for this purpose, a means for enabling the user to register such format information in the facsimile communication network is newly provided. With this configuration, it is possible to provide convenience to many users while maintaining the advantages of the facsimile communication network, and to use various forms for one user. Become.

【0010】すなわち本発明の帳票認識方法は、ファク
シミリ通信網に向けて発信された記入済み帳票イメージ
データをファクシミリ通信網の制御装置内に蓄積し、記
入済み帳票イメージデータに対して文字認識処理を実行
し、記入済み帳票イメージデータにおける各記入領域内
の文字を認識する帳票認識方法において、未記入の帳票
に対応する未記入帳票イメージデータを作成して制御装
置内に蓄積し、未記入帳票イメージデータからその帳票
のイメージデータとしての特徴量を含んで帳票種類の識
別のために使用される識別情報を生成し、帳票の種類ご
とに、当該帳票の識別情報と、当該帳票の記入領域に関
する情報である帳票情報とを制御装置内に蓄積し、未記
入の帳票に対応するデータをエンド側利用者に配信し、
エンド側利用者が記入済み帳票イメージデータをファク
シミリ通信網にあてて送信した場合に、制御装置内にお
いて、送信されてきた記入済み帳票イメージデータに対
して、識別情報を用いてその送信されてきた記入済み帳
票イメージデータに対応する帳票種類を識別し、帳票情
報に基づいてその送信されてきた記入済み帳票イメージ
データから文字領域を切り出し、文字認識を行う。
That is, in the form recognition method of the present invention, filled-out form image data transmitted to a facsimile communication network is stored in a control device of the facsimile communication network, and a character recognition process is performed on the completed form image data. In the form recognition method for executing and recognizing characters in each entry area in the completed form image data, blank form image data corresponding to the blank form is created and stored in the control device, and the blank form image is created. Generates identification information used for identifying a form type from the data, including a feature amount as image data of the form, and for each type of form, the identification information of the form and information on an entry area of the form. Is stored in the control device, and data corresponding to the blank form is distributed to the end-side user.
When the end user transmits the filled-out form image data to the facsimile communication network, the control apparatus transmits the filled-out form image data using the identification information. A form type corresponding to the filled-out form image data is identified, a character area is cut out from the transmitted filled-out form image data based on the form information, and character recognition is performed.

【0011】本発明の帳票認識装置は、ファクシミリ通
信網に向けて発信された記入済み帳票イメージデータを
ファクシミリ通信網内に蓄積し、記入済み帳票イメージ
データに対して文字認識処理を実行し、記入済み帳票イ
メージデータにおける各記入領域内の文字を認識する帳
票認識装置において、ファクシミリ通信網内に設けられ
た制御装置を有し、制御装置内に、未記入帳票イメージ
データ及び記入済み帳票イメージデータを蓄積するイメ
ージ蓄積手段と、帳票のイメージデータとしての特徴量
を含んで帳票種類の識別のために使用される識別情報を
帳票の種類ごとに蓄積する識別情報蓄積手段と、帳票の
記入領域に関する情報である帳票情報を帳票の種類ごと
に蓄積する帳票情報蓄積手段と、帳票イメージデータか
ら特徴量を算出して識別情報とする特徴量算出手段と、
受信した記入済み帳票イメージデータから識別情報蓄積
手段を参照して帳票の種類を識別する帳票識別手段と、
帳票情報蓄積手段を参照して当該記入済み帳票イメージ
データから文字領域を切り出し文字認識を行う文字認識
手段とが設けられている。
A form recognition apparatus according to the present invention accumulates filled-out form image data transmitted to a facsimile communication network in a facsimile communication network, executes a character recognition process on the completed form image data, and fills in the form. In a form recognition device for recognizing characters in each entry area in completed form image data, a control device provided in a facsimile communication network is provided, and in the control device, blank form image data and filled form image data are stored. Image storage means for storing, identification information storage means for storing, for each type of form, identification information used for identifying the type of form including the feature amount as image data of the form, and information on the entry area of the form Form information storage means for storing form information for each form type, and calculating a feature amount from form image data A feature quantity calculating means and the identification information,
Form identification means for identifying the type of the form by referring to the identification information storage means from the received completed form image data,
There is provided a character recognizing means for extracting a character area from the filled-out form image data with reference to the form information accumulating means and performing character recognition.

【0012】本発明においては、帳票情報は、典型的に
は、帳票における各記入領域の位置及びサイズを含む書
式情報と、各記入領域ごとの記入されているべき文字の
種類の属性を示す文字属性情報とから構成されている。
In the present invention, the form information typically includes format information including the position and size of each entry area in the form, and a character indicating the type of character to be entered for each entry area. And attribute information.

【0013】本発明では、ファクシミリ通信網で受信す
る記入済み帳票イメージデータには、書式情報等を帳票
に埋め込むためのマーク等は含まれていない。そのた
め、ファクシミリ通信網側では、まず、受信した帳票イ
メージデータがどの帳票に対応するものかを識別する必
要があり、この識別は、ユーザがファクシミリ通信網側
に対して予め登録した帳票の識別情報を参照して実行さ
れる。しかしながら、ファクシミリ通信網が識別しなけ
ればならない帳票の種類の数は膨大になると予想され、
通常のパターン認識方法を適用したのでは、高速かつ正
確な識別が難しいことがある。そこで本発明では、さら
に、受信したイメージデータに含まれる帳票の種類を識
別する際に、まず、帳票全体から大まかな特徴を抽出す
るとともに、局所的な特徴を抽出し、これら2つの特徴
の組み合わせに基づいて帳票の種類の識別を行うように
してもよい。
In the present invention, the filled-out form image data received by the facsimile communication network does not include a mark for embedding format information and the like in the form. Therefore, on the facsimile communication network side, first, it is necessary to identify which form the received form image data corresponds to, and this identification is based on the identification information of the form registered in advance by the user with respect to the facsimile communication network side. Is executed with reference to However, the number of types of forms that the facsimile communication network must identify is expected to be enormous,
If a normal pattern recognition method is applied, high-speed and accurate identification may be difficult. Therefore, in the present invention, when identifying the type of a form included in the received image data, first, a rough feature is extracted from the entire form, a local feature is extracted, and a combination of these two features is extracted. The type of the form may be identified based on the form.

【0014】[0014]

【発明の実施の形態】次に、本発明の好ましい実施の形
態について、図面を参照して説明する。図1は、本発明
の好ましい実施の一形態の帳票認識装置を構成するファ
クシミリ通信網の構成を示す図である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, a preferred embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing a configuration of a facsimile communication network constituting a form recognition apparatus according to a preferred embodiment of the present invention.

【0015】ファクシミリ通信網は、一般に、公衆電話
網あるいは公衆サービス統合デジタル網(ISDN)
に、ファクシミリイメージの蓄積装置やサービス処理装
置を付加(アド・オン)する形で実現される。ここで
も、ファクシミリ通信網は、公衆電話網やISDNなど
のネットワーク11に対して、ファクシミリ通信網とし
ての蓄積装置でもある制御装置12が接続することによ
って、構成されている。ネットワーク11には、エンド
側利用者13の電話機14及びファクシミリ装置15が
接続し、また、センタ側利用者16の電話機17及びデ
ータ端末18が接続している。ここでデータ端末18
は、例えば、FAXモデムを介してネットワークに接続
しているパーソナルコンピュータであり、ネットワーク
18からは独立してワードプロセッシング(ワープロ)
のアプリケーションプログラムなどが実行できるように
なっている。また、このデータ端末18は、ファクシミ
リ通信網側が記入済み帳票イメージデータに対して行っ
た文字認識結果をコード情報として受信する端末でもあ
る。
A facsimile communication network is generally a public telephone network or a public service integrated digital network (ISDN).
In addition, a facsimile image storage device and a service processing device are added (added on). Also in this case, the facsimile communication network is configured by connecting a control device 12, which is also a storage device as a facsimile communication network, to a network 11, such as a public telephone network or ISDN. The telephone 11 and the facsimile device 15 of the end user 13 are connected to the network 11, and the telephone 17 and the data terminal 18 of the center user 16 are connected. Here the data terminal 18
Is, for example, a personal computer connected to a network via a FAX modem, and is independent of the network 18 for word processing (word processing).
Application programs and the like can be executed. The data terminal 18 is also a terminal that receives, as code information, the result of character recognition performed on the filled-out form image data by the facsimile communication network side.

【0016】エンド側利用者13とは、例えば手書き文
字を含むような記入済み帳票を、ファクシミリ装置を介
して送信する利用者のことであり、センタ側利用者16
とは、エンド側利用者13がファクシミリ通信網に向け
て送信した記入済み帳票イメージデータから抽出された
文字(コード)情報をファクシミリ通信網側から受信す
る利用者である。本発明では、多数の利用者がそれぞれ
多種類の帳票を取り扱えるようになっているが、ファク
シミリ通信網に対して帳票の書式情報を登録するのは、
一般には、センタ側利用者16である。ここではエンド
側利用者13及びセンタ側利用者16はそれぞれ1つづ
つしか図示されていないが、実際には、非常に多数のエ
ンド側利用者13と多数のセンタ側利用者16がネット
ワーク11に接続している。
The end-side user 13 is a user who transmits a filled-out form including, for example, handwritten characters via a facsimile machine.
Is a user who receives character (code) information extracted from the filled-out form image data transmitted by the end-side user 13 to the facsimile communication network from the facsimile communication network side. In the present invention, a large number of users can handle various types of forms, respectively.However, registering form information of forms in a facsimile communication network is as follows.
Generally, it is the center user 16. Here, only one end-side user 13 and one center-side user 16 are shown, but in reality, a very large number of end-side users 13 and many center-side users 16 are connected to the network 11. doing.

【0017】図2は、制御装置12の構成を示すブロッ
ク図である。この制御装置12は、ネットワーク11側
と接続している本体部21と、イメージ情報を蓄積する
とともに本体部21に接続するイメージ蓄積部22と、
帳票の種類ごとに帳票における各記入領域の幾何学的位
置・サイズやその記入領域を囲む枠線の線幅などの情報
(以下、書式情報という)を格納する書式情報蓄積部2
3と、帳票ごとにその帳票の各記入領域における文字の
種類に関する情報(以下、文字属性情報という)を格納
する文字属性情報蓄積部24と、帳票ごとにその帳票の
イメージデータとしての特徴量を識別情報として蓄積す
る識別情報蓄積部25と、ファクシミリ通信網の蓄積装
置としての基本的な通信制御処理を行う通信制御処理部
26と、帳票のイメージデータからその帳票のイメージ
データとしての特徴量を算出する特徴量算出部27と、
利用者側と対話的にデータをやり取りすることによっ
て、帳票の書式情報を書式情報蓄積部23に格納し帳票
の各記入領域に記入されるべき文字の文字属性情報を文
字属性情報蓄積部24に格納する登録処理部28と、イ
メージ蓄積部22、書式情報蓄積部23及び識別情報蓄
積部25を参照して、記入済み帳票イメージデータから
その帳票イメージデータに対応する帳票の種類を識別す
る帳票識別部29と、帳票識別部29での識別結果に基
づき、書式情報蓄積部23及び文字属性情報蓄積部24
を参照しながら各記入領域から文字のイメージデータを
切り出し、文字認識処理を行う文字認識部30と、から
構成されている。
FIG. 2 is a block diagram showing the configuration of the control device 12. As shown in FIG. The control device 12 includes a main unit 21 connected to the network 11 side, an image storage unit 22 that stores image information and is connected to the main unit 21,
A format information storage unit 2 for storing information (hereinafter referred to as format information) such as the geometric position and size of each entry area in the form and the line width of a frame line surrounding the entry area for each type of form.
3, a character attribute information storage unit 24 for storing information on the type of character in each entry area of the form (hereinafter referred to as character attribute information), and a feature amount as image data of the form for each form. An identification information storage unit 25 for storing as identification information, a communication control processing unit 26 for performing basic communication control processing as a storage device of a facsimile communication network, and a feature amount as image data of the form from the image data of the form. A feature amount calculation unit 27 to be calculated;
By interactively exchanging data with the user, the form information of the form is stored in the form information storage unit 23, and the character attribute information of the character to be entered in each entry area of the form is stored in the character attribute information storage unit 24. With reference to the registration processing unit 28 to be stored, the image storage unit 22, the format information storage unit 23, and the identification information storage unit 25, the form identification for identifying the type of the form corresponding to the form image data from the completed form image data. Unit 29 and a format information storage unit 23 and a character attribute information storage unit 24 based on the identification result of the form identification unit 29.
And a character recognizing unit 30 that cuts out character image data from each entry area and performs a character recognition process.

【0018】通信制御処理部26、特徴量算出部27、
登録処理部28、帳票識別部29及び文字認識部30
は、本体部21の内部に設けられている。イメージ蓄積
部22、書式情報蓄積部23、文字属性情報蓄積部24
及び識別情報蓄積部25は、それぞれ、磁気ディスク装
置などの外部記憶装置として、本体部21に接続してい
る。イメージ蓄積部22は、文字認識を行わない通常の
ファクシミリ通信におけるファクシミリイメージデータ
の一時蓄積にも使用されるものである。また、通信制御
処理部26は、ファクシミリ通信網として通常の通信制
御処理を行って、ネットワーク11側から受信したファ
クシミリイメージデータをイメージ蓄積部22に蓄積す
るとともに、未記入及び記入済みの帳票イメージデータ
をイメージ蓄積部22に蓄積する。なお、イメージ蓄積
部22、書式情報蓄積部23、文字属性情報蓄積部24
及び識別情報蓄積部25は、それぞれ、イメージ蓄積手
段、書式情報蓄積手段、文字属性情報蓄積手段及び識別
情報蓄積手段であり、特に、書式情報蓄積部23及び文
字属性情報蓄積部24は帳票情報蓄積手段を構成してい
る。また、特徴量算出部27、登録処理部28、帳票識
別部29及び文字認識部30は、それぞれ、特徴量算出
手段、登録処理手段、帳票識別手段及び文字認識手段で
ある。
A communication control processing section 26, a feature quantity calculating section 27,
Registration processing unit 28, form identification unit 29, and character recognition unit 30
Is provided inside the main body 21. Image storage unit 22, format information storage unit 23, character attribute information storage unit 24
The identification information storage unit 25 is connected to the main unit 21 as an external storage device such as a magnetic disk device. The image storage unit 22 is also used for temporary storage of facsimile image data in normal facsimile communication without character recognition. The communication control processing unit 26 performs normal communication control processing as a facsimile communication network, stores the facsimile image data received from the network 11 side in the image storage unit 22, and stores the unfilled and filled-out form image data. Is stored in the image storage unit 22. The image storage unit 22, the format information storage unit 23, and the character attribute information storage unit 24
And the identification information storage unit 25 are an image storage unit, a format information storage unit, a character attribute information storage unit, and an identification information storage unit, respectively. In particular, the format information storage unit 23 and the character attribute information storage unit 24 store the form information. Means. Further, the feature amount calculation unit 27, the registration processing unit 28, the form identification unit 29, and the character recognition unit 30 are a feature amount calculation unit, a registration processing unit, a form identification unit, and a character recognition unit, respectively.

【0019】次に、このファクシミリ通信網を用いた帳
票認識処理について説明する。図3は、この帳票認識処
理の全体的な流れを示すフローチャートである。
Next, a form recognition process using the facsimile communication network will be described. FIG. 3 is a flowchart showing the overall flow of this form recognition process.

【0020】まず、センタ側利用者16において、帳票
設計を行い、パーソナルコンピュータなどであるデータ
端末18のワープロ機能を用いて、未記入の帳票を作成
する。この作成された未記入の帳票は、FAXモデム
(不図示)などによって帳票イメージデータに変換され
てネットワーク11側に送出され、制御装置12のイメ
ージ蓄積部22内に蓄積される(ステップ101)。そ
して、その帳票に対する帳票情報の登録処理を実行する
(ステップ102)。帳票情報の登録処理は、後で詳述
するが、センタ側利用者16と登録処理部28がインタ
ラクティブにデータを交換することによってこの帳票に
対する書式情報及び文字属性情報をそれぞれ書式情報蓄
積部23及び文字属性情報蓄積部24に登録し、特徴量
算出部27によってその帳票のイメージデータから特徴
量を算出し識別情報として識別情報蓄積部25に蓄積す
る処理である。
First, the center user 16 designs a form, and creates a blank form using the word processing function of the data terminal 18 such as a personal computer. The created blank form is converted into form image data by a facsimile modem (not shown) or the like, transmitted to the network 11, and stored in the image storage unit 22 of the control device 12 (step 101). Then, form information registration processing for the form is executed (step 102). The registration process of the form information will be described later in detail, but the center side user 16 and the registration processing unit 28 interactively exchange data so that the format information and the character attribute information for the form are stored in the format information storage unit 23 and the This is a process of registering in the character attribute information storage unit 24, calculating the feature amount from the image data of the form by the feature amount calculation unit 27, and storing the calculated feature amount in the identification information storage unit 25 as identification information.

【0021】このように帳票情報の登録処理が終了した
ら、ファクシミリ通信網の同報通信機能を利用して、イ
メージ蓄積部22内の未記入の帳票イメージデータを予
め指定した各エンド側利用者13のファクシミリ装置1
5に向けて配送する(ステップ103)。
When the form information registration process is completed in this way, each end-side user 13 who has previously designated unfilled form image data in the image storage unit 22 using the broadcast communication function of the facsimile communication network. Facsimile machine 1
5 (step 103).

【0022】エンド側利用者13では、ファクシミリ装
置15から出力された帳票に対し、例えば、発注データ
などの文字を記入する(ステップ104)。そして、エ
ンド側利用者13では、記入済みの帳票をファクシミリ
装置15を介してファクシミリ通信網側に送信する。こ
れにより、ネットワーク11を介した帳票収集処理が行
われたことになり(ステップ105)、各エンド利用者
13からの記入済みの帳票イメージデータは、イメージ
蓄積部22に蓄積される。
The end user 13 enters characters such as order data into the form output from the facsimile machine 15 (step 104). Then, the end-side user 13 transmits the completed form to the facsimile communication network via the facsimile device 15. Thus, the form collection processing via the network 11 has been performed (step 105), and the filled-out form image data from each end user 13 is stored in the image storage unit 22.

【0023】次に、イメージ蓄積部22に蓄積された各
記入済み帳票イメージデータに対して、帳票識別部29
により、それが、ステップ102で既に登録してある帳
票に対応するものかどうか、また、登録された帳票であ
るとして登録済みのうちのどの帳票に対応するものであ
るかどうかを識別する帳票識別処理を実行する(ステッ
プ106)。ここで記入済み帳票イメージデータが登録
済み帳票に対応するものであるかどうかで条件分岐を行
うこととし(ステップ107)、登録済み帳票に対応す
るときは、帳票情報を用いて文字切り出し処理と文字認
識処理を実行し(ステップ108)、認識結果をコード
情報としてセンタ側利用者16に送信い(ステップ10
9)、処理を終了する。一方、ステップ107で登録済
み帳票に対応しないものであるときは、その帳票イメー
ジデータを送信したエンド側利用者13に対し、処理対
象の帳票データではない旨のエラーメッセージを添え
て、その帳票イメージデータを送り返し(ステップ11
0)、処理を終了する。
Next, a form identification unit 29 is used for each filled-out form image data stored in the image storage unit 22.
The form identification identifies whether the form corresponds to the form already registered in step 102, and whether the form corresponds to the form registered as a registered form. The process is executed (Step 106). Here, conditional branching is performed based on whether or not the filled-out form image data corresponds to the registered form (step 107). The recognition processing is executed (step 108), and the recognition result is transmitted to the center user 16 as code information (step 10).
9), end the processing. On the other hand, if the form does not correspond to the registered form in step 107, an error message indicating that the form data is not to be processed is attached to the end user 13 who transmitted the form image data. Send back the data (step 11
0), and the process ends.

【0024】次に、ステップ102での帳票情報の登録
処理について、図4を用いて説明する。
Next, the registration processing of the form information in step 102 will be described with reference to FIG.

【0025】まず、図3のステップ101での処理とし
て、センタ側利用者16が未記入の帳票イメージデータ
を送信し(ステップ111)、この帳票イメージデータ
をイメージ蓄積部22に蓄積する(ステップ112)。
次に、未記入の帳票イメージデータを送信してきたセン
タ側利用者16に対して登録処理部28がその帳票イメ
ージデータを送り返し、これによって、センタ側利用者
16のデータ端末18の画面上に、登録された帳票イメ
ージが表示される(ステップ113)。
First, as the processing in step 101 of FIG. 3, the center-side user 16 transmits blank form image data (step 111), and stores the form image data in the image storage unit 22 (step 112). ).
Next, the registration processing unit 28 sends back the form image data to the center-side user 16 that has transmitted the unfilled form image data, thereby displaying the form image data on the screen of the data terminal 18 of the center-side user 16. The registered form image is displayed (step 113).

【0026】センタ側利用者16では、表示された帳票
イメージにしたがって、その帳票中の記入欄の相当する
座標を指定する(ステップ114)。これによって、文
字記入欄の座標が確定する。そしてセンタ側利用者16
では、各記入欄(記入領域)ごとにその記入欄に記入さ
れるべき文字の種類を指定する(ステップ115)。こ
の指定操作は、グラフィカル・ユーザ・インタフェース
によって、登録処理部28との間でインタラクティブに
行われ、記入欄の座標や記入されるべき文字の種類につ
いての情報は、ネットワーク11を介してセンタ側利用
者16から登録処理部28に送られる。登録処理部28
は、このように送られてきた情報に基づいて帳票情報を
生成し、書式情報は書式情報蓄積部23に蓄積し、文字
属性情報は文字属性情報蓄積部24に蓄積する(ステッ
プ116)。さらに、特徴量算出部27が、登録されて
いる帳票イメージから特徴量(黒画素分布の特徴や記入
欄の配置など)を抽出し(ステップ117)、これを識
別情報として、識別情報蓄積部25に蓄積する(ステッ
プ118)。以上により、ステップ102での帳票情報
の登録処理が終了する。
In accordance with the displayed form image, the center-side user 16 specifies the corresponding coordinates of the entry column in the form (step 114). Thereby, the coordinates of the character entry field are determined. And the center side user 16
Then, for each entry field (entry area), the type of character to be entered in that entry field is specified (step 115). This designation operation is performed interactively with the registration processing unit 28 by a graphical user interface, and the information on the coordinates of the entry fields and the types of characters to be entered is transmitted to the center side via the network 11. Is sent from the user 16 to the registration processing unit 28. Registration processing unit 28
Generates form information based on the information transmitted in this way, stores the format information in the format information storage unit 23, and stores the character attribute information in the character attribute information storage unit 24 (step 116). Further, the characteristic amount calculating unit 27 extracts characteristic amounts (the characteristics of the black pixel distribution and the arrangement of the entry columns) from the registered form image (step 117), and uses the extracted characteristic amounts as identification information. (Step 118). Thus, the registration processing of the form information in step 102 is completed.

【0027】次に、エンド側利用者13から記入済み帳
票イメージデータが送られてきたときの処理(ステップ
106〜108)の詳細について、図5を用いて説明す
る。
Next, details of the processing (steps 106 to 108) when the completed form image data is sent from the end-side user 13 will be described with reference to FIG.

【0028】まず、送信されてきた記入済み帳票イメー
ジデータから特徴量算出部27によて特徴量を抽出し
(ステップ119)、次に、帳票識別部29に処理を移
して、抽出された特徴量に基づく識別情報と、識別情報
蓄積部25に既に登録済みになっている識別情報との差
を求め、この差がしきい値以下であるかどうかを判断す
る(ステップ120)。この時点ではどの種類の帳票か
分からないから、登録済みの全ての識別情報との差を求
めることとする。しきい値以下でない場合には、登録済
み帳票に対応しないものであるとして処理を終了し、し
きい値以下である場合には、書式情報蓄積部23及び文
字属性情報蓄積部24に蓄積されている帳票情報に基づ
いて、その帳票イメージデータにおける記入領域の位置
を推定し(ステップ121)、推定された位置の近傍の
範囲内で記入欄の検出を実行する(ステップ122)。
検出された記入欄の位置と推定された記入欄の位置との
差を求め、その差がしきい値以下であるかどうかを判定
する(ステップ123)。ステップ123でしきい値以
下であれば、記入欄が検出されたものとし、文字領域の
切り出しを行い(ステップ124)、文字認識部30に
よって切り出された文字に対する文字認識を実行し(ス
テップ125)、処理を終了する。一方、ステップ12
3でしきい値以下でない場合には、登録済み帳票に対応
しないものであるとして処理を終了する。
First, the characteristic amount is extracted from the transmitted filled-out form image data by the characteristic amount calculating section 27 (step 119), and then the processing is moved to the form identifying section 29 to extract the extracted characteristic. The difference between the identification information based on the amount and the identification information already registered in the identification information storage unit 25 is determined, and it is determined whether the difference is equal to or smaller than a threshold (step 120). At this point, since it is not known which type of form, the difference from all the registered identification information is determined. If it is not below the threshold, the processing is terminated assuming that it does not correspond to the registered form, and if it is below the threshold, it is stored in the format information storage unit 23 and the character attribute information storage unit 24. Based on the existing form information, the position of the entry area in the form image data is estimated (step 121), and the entry column is detected within a range near the estimated position (step 122).
The difference between the detected position of the entry field and the estimated position of the entry field is determined, and it is determined whether the difference is equal to or less than a threshold value (step 123). If it is equal to or smaller than the threshold value in step 123, it is assumed that the entry column has been detected, and a character area is cut out (step 124), and character recognition is performed on the cut out character by the character recognition unit 30 (step 125). , And the process ends. Step 12
If it is not equal to or smaller than the threshold value at 3, it is determined that it does not correspond to the registered form, and the process is terminated.

【0029】以上の過程によって、エンド側利用者13
からの送信済み帳票データが処理される。ここでステッ
プ119からステップ123までの処理が、図3におけ
る帳票識別処理(ステップ106)(とそれに引き続く
ステップ107の条件分岐)に対応し、ステップ124
とステップ125が図3のステップ108に対応する。
By the above process, the end user 13
The transmitted form data from is processed. Here, the processing from step 119 to step 123 corresponds to the form identification processing (step 106) in FIG. 3 (and the subsequent conditional branch in step 107), and the processing in step 124
And step 125 correspond to step 108 in FIG.

【0030】ところで、本実施の形態の場合、ファクシ
ミリ通信網内に蓄積される帳票イメージデータは大量で
あって、複数のエンド側利用者13から多種類の帳票イ
メージデータが送信されてきたとすると、これらのデー
タがどの種類の帳票に対応するものであるかを即座に判
別することが困難となることが考えられる。
By the way, in the case of the present embodiment, if the form image data stored in the facsimile communication network is large, and various types of form image data are transmitted from a plurality of end users 13, It may be difficult to immediately determine which type of form these data corresponds to.

【0031】そこで、帳票イメージデータの仕分けにつ
いて、まず、大まかに分類することが考えられる。
Therefore, the sorting of the form image data may be roughly classified first.

【0032】人間が手で複数種類の帳票を分類する場
合、記入欄が多いとか少ないとか、特徴的な文字が何で
あるか、などに着目して仕分けを行っていると考えられ
る。そこで、ここでも、このようなやり方を参考にし、
まず、大まかな分類を行い、次に、詳細な分類を行っ
て、帳票を識別することが考えられる。
When a person classifies a plurality of types of forms by hand, it is considered that sorting is performed by paying attention to whether there are many or few entry fields or what are characteristic characters. So, here again, referring to this method,
First, a rough classification is performed, and then a detailed classification is performed to identify a form.

【0033】実際の手順として、まず、帳票イメージデ
ータの上方の行部分(紙形態の帳票でいえばヘッダ部
分)に着目し、予め小さな特定領域を設定し、この特定
領域内の文字を認識することにより、何に関連する帳票
かを大分類する。通常、この位置には帳票のタイトルが
書かれていると考えられるから、タイトル全部を認識す
るようにしてもよいし、タイトルの一部分のみを認識し
てもよい。特定領域のサイズ、位置、個数等は、帳票の
性質、種類数、処理速度等を考慮して適宜に設定できる
ようにしておけばよい。
As an actual procedure, first, a small specific area is set in advance by paying attention to a line portion (a header part in a paper form) of the form image data, and characters in the specific area are recognized. By doing so, what is related to the form is roughly classified. Usually, it is considered that the title of the form is written in this position, so that the entire title may be recognized or only a part of the title may be recognized. The size, position, number, and the like of the specific area may be appropriately set in consideration of the properties of the form, the number of types, the processing speed, and the like.

【0034】また、帳票の記入欄が罫線で囲まれて罫線
枠領域となっているとして、記入欄の領域が大きいか小
さいかで大まかに判別することも考えられる。この場
合、罫線の長さがしきい値以上であるものを抽出するこ
とがまず考えられ、これによって、罫線枠が単独で孤立
しているような小さな枠は無視され、大きな罫線枠領域
のみが抽出対象となる。このように構成すると、表形式
の記入欄のように、交差する横線や縦線が多い場合に
は、外枠と、内部の特定の領域枠のみが抽出されるよう
になる。さらに、罫線相互が交差する交差点の数がしき
い値以下のもののみを抽出するようにすれば、例えば、
細かな記入欄をたくさん含むような表形式の部分が除外
されるようになる。
Assuming that the entry column of the form is a ruled line frame area surrounded by ruled lines, it may be roughly determined whether the entry column region is large or small. In this case, it is conceivable to first extract a ruled line whose length is greater than or equal to the threshold value. In this case, a small frame in which a ruled line frame is isolated alone is ignored, and only a large ruled line frame area is extracted. Becomes With such a configuration, when there are many intersecting horizontal and vertical lines as in the entry column in a table format, only the outer frame and a specific area frame inside are extracted. Furthermore, if only the intersections at which the ruled lines intersect with each other are equal to or smaller than a threshold, for example,
Tabular parts that contain many small entries will be excluded.

【0035】本発明では、上述したような大まかな分類
を行って、候補となる帳票の種類の数を減らしてから、
細かい仕分けを実行し、最終的に記入済み帳票イメージ
データに対応する帳票の種類を識別する。
In the present invention, the above rough classification is performed to reduce the number of candidate form types,
Fine sorting is performed, and finally, the type of the form corresponding to the completed form image data is identified.

【0036】あるいは、全体の特徴と局所的特徴の2つ
を組み合わせたものを特徴量(識別情報)として識別情
報の抽出処理を行うことができる。このような処理を行
うことにより、大まかな特徴で分類する際の識別情報蓄
積部内での検索範囲を絞り込むことが可能になり、ま
た、全部の領域から詳細な特徴を抽出する手間を省ける
ようになる。また、特定の領域の特徴に着目してこれと
比較することにより、精度の向上を図ることができる。
Alternatively, identification information can be extracted by using a combination of two features, that is, an overall feature and a local feature, as a feature amount (identification information). By performing such processing, it is possible to narrow down the search range in the identification information storage unit when classifying by rough features, and to save the trouble of extracting detailed features from all regions. Become. In addition, by focusing on the characteristics of a specific region and comparing with the characteristics, accuracy can be improved.

【0037】図6は、このような手順による識別情報抽
出処理を示す図である。ここでは、上端部に沿って「注
文シート」と大きな文字で表記された帳票イメージデー
タ41から識別情報を抽出する場合を考える。
FIG. 6 is a diagram showing an identification information extracting process according to such a procedure. Here, a case is considered where identification information is extracted from the form image data 41 written in large letters as “order sheet” along the upper end.

【0038】まず、帳票イメージデータ41の全体か
ら、大きな特徴となる、しきい値以上の長さのある罫線
を抽出し、抽出された罫線の位置、長さと、相互の配置
の関係を特徴量とする。この特徴量を用いることで、第
2の特徴を参照する際にその参照範囲を限定する効果が
生じる。帳票イメージデータ42は、このとき抽出され
た罫線を示している。
First, from the entire form image data 41, a ruled line having a length equal to or longer than a threshold, which is a major feature, is extracted, and the relationship between the position and length of the extracted ruled line and the mutual arrangement is characterized. And The use of this feature amount has the effect of limiting the reference range when referring to the second feature. The form image data 42 indicates the ruled lines extracted at this time.

【0039】次に、局所的な特定領域の黒画素分布や文
字の配置を第2の特徴量として抽出する。この特定領域
は、精度を向上するために、複数箇所に設定することも
可能である。帳票イメージデータ43は、ここで参照す
る文字の配置の例を示しており、例えば、図示破線で囲
んだ領域を特定領域として、この特定領域内での文字の
配置(ここでは「注文」)を第2の特徴量として抽出す
る。
Next, the distribution of black pixels and the arrangement of characters in a local specific region are extracted as the second feature value. This specific area can be set at a plurality of locations in order to improve the accuracy. The form image data 43 shows an example of the arrangement of characters to be referred to here. For example, an area surrounded by a dashed line in the drawing is a specific area, and the arrangement of characters in this specific area (here, “order”) is described. It is extracted as a second feature amount.

【0040】以上の2つの特徴量を抽出してその組み合
わせ関係を識別情報蓄積部に登録して参照することによ
って、識別情報抽出処理の効率化を図ることができる。
The efficiency of the identification information extracting process can be improved by extracting the above two feature amounts and registering and referring to the combination relationship in the identification information storage unit.

【0041】以上、本発明の好ましい実施の形態につい
て説明したが、ここで、センタ側利用者からエンド側利
用者に対して未記入帳票に関するデータを配信する方法
は、ファクシミリ通信網の同報通信機能を利用するもの
に限定されるものではない。
Although the preferred embodiment of the present invention has been described above, the method of distributing data relating to an unfilled form from a center-side user to an end-side user is described below by using a broadcast communication of a facsimile communication network. It is not limited to the one that uses the function.

【0042】例えば、図3のステップ101で帳票を作
成した際のワープロの文書データをデジタル形式のま
ま、ネットワーク11を介して各エンド側利用者13に
配送してもよい。その場合は、各エンド側利用者13
は、不図示のモデムを介してネットワーク11に接続し
たパーソナルコンピュータなどからなるデータ端末(不
図示)によってこの文書データを受信する。そして、デ
ータ端末のワープロ機能を用いてその文書データを印刷
し、印刷された帳票に記入してファクシミリ装置によっ
て送信してもよい。また、モデムがFAXモデムである
場合には、ワープロ機能を用いてその文書データを編集
しつつ帳票に対する記入事項を文書データに加入し、F
AXモデムを用いてファクシミリ通信網側に直接送信す
るようにしてもよい。FAXモデムを用いて直接送信す
る場合には、紙にプリントアウトする必要がなくなる。
For example, the document data of the word processor when the form was created in step 101 of FIG. 3 may be delivered to each end user 13 via the network 11 in the digital format. In that case, each end user 13
The document data is received by a data terminal (not shown) including a personal computer or the like connected to the network 11 via a modem (not shown). Then, the document data may be printed using the word processing function of the data terminal, entered in the printed form, and transmitted by the facsimile machine. When the modem is a FAX modem, the document data is added to the document data while editing the document data using a word processing function.
The data may be directly transmitted to the facsimile communication network using an AX modem. In the case of direct transmission using a FAX modem, there is no need to print out on paper.

【0043】[0043]

【発明の効果】以上説明したように本発明は、ファクシ
ミリ通信網内に、帳票情報と識別情報とを保持し、これ
らを用いてファクシミリ通信網内で記入済み帳票イメー
ジデータの識別と文字認識を行うことにより、ユーザ側
でFAX−OCR装置や多数の受信用回線を用意するこ
となく、また、書式情報等を埋め込んだ特殊な帳票を使
用することなく、多種多様な帳票の文字認識を高い認識
精度で行うことができ、高い利便性が得られるという効
果がある。また、識別情報は未記入帳票イメージデータ
から自動的に生成するようにし、帳票情報の登録をユー
ザ側とインタラクティブに行えるようにすることによ
り、識別情報、帳票情報の登録自体が容易になるという
効果がある。
As described above, according to the present invention, the form information and the identification information are stored in the facsimile communication network, and the identification and the character recognition of the filled-out form image data are performed in the facsimile communication network by using these. By doing so, high-level recognition of characters in a wide variety of forms can be performed without preparing a FAX-OCR device or a large number of receiving lines on the user side, and without using a special form in which format information is embedded. It is possible to carry out with high accuracy and to obtain high convenience. Also, the identification information is automatically generated from the blank form image data, and the registration of the form information can be performed interactively with the user side, so that the registration of the identification information and the form information itself becomes easy. There is.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の好ましい実施の一形態の帳票認識装置
を構成するファクシミリ通信網の構成を示す図である。
FIG. 1 is a diagram showing a configuration of a facsimile communication network constituting a form recognition apparatus according to a preferred embodiment of the present invention.

【図2】ファクシミリ通信網の制御装置の構成を示すブ
ロック図である。
FIG. 2 is a block diagram illustrating a configuration of a control device of the facsimile communication network.

【図3】本発明の好ましい実施の形態の帳票認識方法で
の全体的な処理手順を示すフローチャートである。
FIG. 3 is a flowchart showing an overall processing procedure in a form recognition method according to a preferred embodiment of the present invention.

【図4】帳票登録処理を説明するフローチャートであ
る。
FIG. 4 is a flowchart illustrating a form registration process.

【図5】帳票認識処理を説明するフローチャートであ
る。
FIG. 5 is a flowchart illustrating a form recognition process.

【図6】識別情報抽出処理を説明する図である。FIG. 6 is a diagram illustrating identification information extraction processing.

【符号の説明】[Explanation of symbols]

11 ネットワーク 12 制御装置 13 エンド側利用者 14,17 電話機 15 ファクシミリ装置 16 センタ側利用者 18 データ端末 21 本体部 22 イメージ蓄積部 23 書式情報蓄積部 24 文字属性情報蓄積部 25 識別情報蓄積部 26 通信制御処理部 27 特徴量算出部 28 登録処理部 29 帳票識別部 30 文字認識部 41 帳票イメージデータ 101〜126 ステップ DESCRIPTION OF SYMBOLS 11 Network 12 Control device 13 End user 14, 17 Telephone 15 Facsimile device 16 Center user 18 Data terminal 21 Main unit 22 Image storage unit 23 Format information storage unit 24 Character attribute information storage unit 25 Identification information storage unit 26 Communication Control processing unit 27 Feature calculation unit 28 Registration processing unit 29 Form identification unit 30 Character recognition unit 41 Form image data 101 to 126 steps

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 ファクシミリ通信網に向けて発信された
記入済み帳票イメージデータを前記ファクシミリ通信網
の制御装置内に蓄積し、前記記入済み帳票イメージデー
タに対して文字認識処理を実行し、前記記入済み帳票イ
メージデータにおける各記入領域内の文字を認識する帳
票認識方法において、 未記入の帳票に対応する未記入帳票イメージデータを作
成して前記制御装置内に蓄積し、 前記未記入帳票イメージデータからその帳票のイメージ
データとしての特徴量を含んで帳票種類の識別のために
使用される識別情報を生成し、 帳票の種類ごとに、当該帳票の識別情報と、当該帳票の
記入領域に関する情報である帳票情報とを前記制御装置
内に蓄積し、 前記未記入の帳票に対応するデータをエンド側利用者に
配信し、 前記エンド側利用者が記入済み帳票イメージデータを前
記ファクシミリ通信網にあてて送信した場合に、前記制
御装置内において、送信されてきた記入済み帳票イメー
ジデータに対して、前記識別情報を用いてその送信され
てきた記入済み帳票イメージデータに対応する帳票種類
を識別し、前記帳票情報に基づいてその送信されてきた
記入済み帳票イメージデータから文字領域を切り出し、
文字認識を行うことを特徴とする、帳票認識方法。
1. A filled-out form image data transmitted to a facsimile communication network is stored in a control device of the facsimile communication network, and a character recognition process is performed on the filled-out form image data, and In a form recognition method for recognizing characters in each entry area in the completed form image data, an empty form image data corresponding to an unfilled form is created and stored in the control device, and from the blank form image data Generates identification information used for identifying a form type including a feature amount as image data of the form, and for each type of form, the identification information of the form and information on an entry area of the form. Form information is stored in the control device, data corresponding to the blank form is distributed to an end-side user, and the end-side use is performed. When the transmitted form image data is transmitted to the facsimile communication network, the transmitted form image data is transmitted to the transmitted form image data using the identification information in the control device. Identify the form type corresponding to the completed form image data, cut out the character area from the filled-in form image data that has been transmitted based on the form information,
A form recognition method characterized by performing character recognition.
【請求項2】 前記帳票情報が、前記帳票における各記
入領域の位置及びサイズを含む書式情報と、前記各記入
領域ごとに記入されているべき文字の種類の属性を示す
文字属性情報とから少なくともなる請求項1に記載の帳
票認識方法。
2. The form information includes at least form information including a position and a size of each entry area in the form and character attribute information indicating an attribute of a character type to be entered for each entry area. The form recognition method according to claim 1.
【請求項3】 前記未記入帳票イメージデータを前記フ
ァクシミリ通信網を介して前記エンド側利用者に配信す
ることによって、前記未記入の帳票に対応するデータの
前記エンド側利用者への配信が行われる請求項1に記載
の帳票認識方法。
3. By distributing the blank form image data to the end-side user via the facsimile communication network, data corresponding to the blank form is distributed to the end-side user. 2. The form recognition method according to claim 1, wherein:
【請求項4】 前記未記入帳票イメージデータを再生す
ることが可能な文書データを前記エンド側利用者に配信
することによって、前記未記入の帳票に対応するデータ
の前記エンド側利用者への配信が行われる請求項1に記
載の帳票認識方法。
4. Distributing document data capable of reproducing the blank form image data to the end-side user to distribute data corresponding to the blank form to the end-side user. 2. The form recognition method according to claim 1, wherein
【請求項5】 前記帳票種類の識別に際し、しきい値以
上の長さの罫線を有する罫線枠領域の抽出、及び/また
は、帳票イメージデータ上の特定領域に含まれる文字イ
メージの抽出、を行う請求項1乃至4いずれか1項に記
載の帳票認識方法。
5. When identifying the form type, extraction of a ruled line frame area having a ruled line having a length equal to or longer than a threshold value and / or extraction of a character image included in a specific area on the form image data are performed. The form recognition method according to claim 1.
【請求項6】 帳票イメージデータの全体の特徴と、前
記帳票イメージデータにおける局所的特徴とを組み合わ
せることによって、前記帳票種類の識別を実行する請求
項1乃至4いずれか1項に記載の帳票認識方法。
6. The form recognition according to any one of claims 1 to 4, wherein the form type is identified by combining the overall characteristics of the form image data with the local characteristics in the form image data. Method.
【請求項7】 ファクシミリ通信網に向けて発信された
記入済み帳票イメージデータを前記ファクシミリ通信網
内に蓄積し、前記記入済み帳票イメージデータに対して
文字認識処理を実行し、前記記入済み帳票イメージデー
タにおける各記入領域内の文字を認識する帳票認識装置
において、 前記ファクシミリ通信網内に設けられた制御装置を有
し、 前記制御装置内に、 未記入帳票イメージデータ及び前記記入済み帳票イメー
ジデータを蓄積するイメージ蓄積手段と、 帳票のイメージデータとしての特徴量を含んで帳票種類
の識別のために使用される識別情報を帳票の種類ごとに
蓄積する識別情報蓄積手段と、 帳票の記入領域に関する情報である帳票情報を帳票の種
類ごとに蓄積する帳票情報蓄積手段と、 帳票イメージデータから特徴量を算出して識別情報とす
る特徴量算出手段と、 受信した記入済み帳票イメージデータから前記識別情報
蓄積手段を参照して帳票の種類を識別する帳票識別手段
と、 前記帳票情報蓄積手段を参照して当該記入済み帳票イメ
ージデータから文字領域を切り出し文字認識を行う文字
認識手段とが設けられている、帳票認識装置。
7. A completed form image data transmitted to a facsimile communication network is stored in the facsimile communication network, a character recognition process is performed on the completed form image data, and the completed form image A form recognition device for recognizing characters in each entry area in data, comprising a control device provided in the facsimile communication network, wherein the control device stores unfilled form image data and the filled form image data. Image storage means for storing, identification information storage means for storing, for each type of form, identification information used for identification of the form type, including a feature amount as image data of the form, and information on the entry area of the form Form information storage means for storing form information for each form type, and calculating feature values from form image data A feature value calculating unit that outputs and uses the form information as identification information; a form identification unit that identifies the type of a form by referring to the identification information storage unit from the received filled-out form image data; A form recognizing device, comprising: a character recognizing unit that cuts out a character area from completed form image data and performs character recognition.
【請求項8】 前記未記入帳票イメージデータを作成し
た利用者と通信して前記帳票情報を生成しかつ生成した
帳票情報を前記帳票情報蓄積手段に蓄積する登録処理手
段を前記制御装置内に有する請求項7に記載の帳票認識
装置。
8. The control device includes a registration processing unit that communicates with a user who has created the blank form image data, generates the form information, and stores the generated form information in the form information storage unit. The form recognition device according to claim 7.
【請求項9】 前記帳票情報が、前記帳票における各記
入領域の位置及びサイズを含む書式情報と、前記各記入
領域ごとに記入されているべき文字の種類の属性を示す
文字属性情報とからなり、 前記帳票情報蓄積手段が、前記書式情報を蓄積する書式
情報蓄積手段と、前記文字属性情報を蓄積する文字属性
情報蓄積手段とからなる請求項7または8に記載の帳票
認識装置。
9. The form information includes format information including the position and size of each entry area in the form, and character attribute information indicating an attribute of a character type to be entered for each entry area. 9. The form recognition apparatus according to claim 7, wherein said form information storage means comprises: format information storage means for storing said format information; and character attribute information storage means for storing said character attribute information.
【請求項10】 しきい値以上の長さの罫線を有する罫
線枠領域の抽出、及び/または、帳票イメージデータ上
の特定領域に含まれる文字イメージの抽出、を行うこと
によって、前記帳票種類の識別がなされる請求項7乃至
9いずれか1項に記載の帳票認識装置。
10. Extracting a ruled line frame area having a ruled line having a length equal to or longer than a threshold value and / or extracting a character image included in a specific area on the form image data. The form recognition device according to claim 7, wherein identification is performed.
【請求項11】 帳票イメージデータの全体の特徴と、
前記帳票イメージデータにおける局所的特徴とを組み合
わせることによって、前記帳票種類の識別がなされる請
求項7乃至9いずれか1項に記載の帳票認識装置。
11. An overall feature of the form image data,
The form recognition apparatus according to claim 7, wherein the form type is identified by combining a local feature in the form image data.
JP10090196A 1998-04-02 1998-04-02 Form recognition method and apparatus Pending JPH11288445A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10090196A JPH11288445A (en) 1998-04-02 1998-04-02 Form recognition method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10090196A JPH11288445A (en) 1998-04-02 1998-04-02 Form recognition method and apparatus

Publications (1)

Publication Number Publication Date
JPH11288445A true JPH11288445A (en) 1999-10-19

Family

ID=13991738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10090196A Pending JPH11288445A (en) 1998-04-02 1998-04-02 Form recognition method and apparatus

Country Status (1)

Country Link
JP (1) JPH11288445A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005311990A (en) * 2004-04-26 2005-11-04 Fuji Xerox Co Ltd Transmission apparatus
JP2008299541A (en) * 2007-05-30 2008-12-11 Being:Kk Integration book creation device and program
JP2009070246A (en) * 2007-09-14 2009-04-02 Ricoh Co Ltd Information processing system, information processing device, program, and recording medium
JP2011065311A (en) * 2009-09-16 2011-03-31 Fuji Xerox Co Ltd Image processor and image processing program
JP2017199086A (en) * 2016-04-25 2017-11-02 富士通株式会社 Method, device, program, and dictionary data for recognizing business form
JP2019207735A (en) * 2019-08-29 2019-12-05 株式会社Pfu Mobile terminal, image processing method, and program
US10885375B2 (en) 2016-03-17 2021-01-05 Pfu Limited Mobile terminal, image processing method, and computer-readable recording medium

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005311990A (en) * 2004-04-26 2005-11-04 Fuji Xerox Co Ltd Transmission apparatus
JP2008299541A (en) * 2007-05-30 2008-12-11 Being:Kk Integration book creation device and program
JP2009070246A (en) * 2007-09-14 2009-04-02 Ricoh Co Ltd Information processing system, information processing device, program, and recording medium
JP2011065311A (en) * 2009-09-16 2011-03-31 Fuji Xerox Co Ltd Image processor and image processing program
US10885375B2 (en) 2016-03-17 2021-01-05 Pfu Limited Mobile terminal, image processing method, and computer-readable recording medium
JP2017199086A (en) * 2016-04-25 2017-11-02 富士通株式会社 Method, device, program, and dictionary data for recognizing business form
JP2019207735A (en) * 2019-08-29 2019-12-05 株式会社Pfu Mobile terminal, image processing method, and program

Similar Documents

Publication Publication Date Title
CN100440108C (en) Image processing apparatus, control method therefor, and program
EP0463471B1 (en) Image processing system for documentary data
CA2116600C (en) Methods and apparatus for inferring orientation of lines of text
EP0654746B1 (en) Form identification and processing system
EP1139272A2 (en) Method and apparatus for identification of documents, and computer product
US20020168090A1 (en) Method and system for image processing
CN100493127C (en) Image processing apparatus, control method therefor
JP2002324166A (en) Form, form processing system, form creation system, form printing system, form processing method, form creation method, and form printing method
JPH11288445A (en) Form recognition method and apparatus
JP4983464B2 (en) Form image processing apparatus and form image processing program
CN100501728C (en) Image processing method, system, program, program storage medium and information processing apparatus
US7995869B2 (en) Information processing apparatus, information processing method, and information storing medium
JPH10207981A (en) Document recognition method
US7110600B1 (en) Document identifying device and method
JP2006260396A (en) Barcode generating apparatus, barcode generating method, barcode generating program, barcode reading apparatus, barcode reading method, barcode reading program, and printing apparatus
JP3959451B2 (en) Image reading system
JPS6234192B2 (en)
JP3196603B2 (en) Barcode recognition method and system
JP2004164376A (en) Form with attached identification code, form reading program, and form creation program
JP2000331117A (en) Document reading system
CN108197512B (en) Bill magnetic code recognition method and device, bill processing equipment and storage medium
JP2003323586A (en) Document form registering method and document recognizing method
JPH1166192A (en) Slip processing device and storage medium
JPH04309B2 (en)
JP2570571B2 (en) Optical character reader

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees