[go: up one dir, main page]

JPH02123486A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPH02123486A
JPH02123486A JP63277930A JP27793088A JPH02123486A JP H02123486 A JPH02123486 A JP H02123486A JP 63277930 A JP63277930 A JP 63277930A JP 27793088 A JP27793088 A JP 27793088A JP H02123486 A JPH02123486 A JP H02123486A
Authority
JP
Japan
Prior art keywords
character
color
reading
form image
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63277930A
Other languages
English (en)
Inventor
Hidenori Yamamoto
山本 秀範
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63277930A priority Critical patent/JPH02123486A/ja
Publication of JPH02123486A publication Critical patent/JPH02123486A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
[発明の目的] (産業上の利用分野) 本発明は、帳票に記録された文字の読取を行なう光学的
文字読取装置に関する。 (従来の技術) 一般に、光学的文字読取装置では、読取処理の対象とす
る帳票を光学的に走査して帳票イメージを検出する。光
学的文字読取装置は、この帳票イメージからフォーマッ
トコントロール情報(以下、FC情報と略称する)と呼
ばれる読取制御情報に基づいて文字認識処理を行なう。 FC情報には、文字が記録される読取フィールドの位置
を示す情報、この読取フィールドに記録される文字の字
体・字種を示す情報1文字認識結果をチエツクするため
のチエツクコードを示す情報等が設定される。 光学的文字読取装置は、このFC情報に基づいて例えば
認識処理部において文字認識処理を行なう。認識処理部
では、帳票イメージから読取−ノイールドの位置を示す
情報によって指定される部分のイメージ、つまり文字パ
ターンを読出して1文字毎に切出しを行なう。そして、
読取フィールドに対応する字体・字種を示す情報によっ
て指定される文字認識用の辞書と、切出された文字パタ
ーンとを照合することによって文字の認識を行なう。 こうして得られた認識結果は、チエツクコードによって
正しく認識されたか否かチエツクされる。 このチエツクコードは、帳票に記録されている文字が複
数の数字の場合、この数字の例えば合計を記録しておく
ものである。そ(7て、文字認識処理の結果得られた数
字の合計と、このチェックコドとして記録された数字と
の比較を行ない、一致すれば正しく文字(数字)の読取
りが行なわれたと判断するものである。 このような、文字認識処理に用いられるFC情報は、一
般にはFC定義用シー1・を光学的文字読取装置によっ
て読取らけることによ7って設定している。このFC定
義用シートには、読取対象とする帳票の読取フィールド
位置、この読取フィールドに記録される文字の字体・字
種を示す情報を含んだ各種読取制御に用いられる情報が
オペ1ノータによって記録される。光学的文字読取装置
は、FC定義用シートに記録された各種情報に基づいて
認識処理を行なうために用いられるFC情報を生成する
。 (発明が解決しようとする課題) このような、文字認識処理を制御するだめのFC情報は
、帳票のフォーマットによってそれぞれ設定しなりれば
ならない。このため、読取処理の対象とする帳票に応じ
て、オペレータは、FC定義用シートに各種FC情報を
設定するための情報を記入するという作業が必要となり
、非常に煩わI7いという問題があった。 本発明は前記のような点に鑑みてなされたもので、帳票
に記録された文字の認識処理を行なう際に必要な読取制
御情報(FC情報)を、読取処理の勾象とする帳票に応
じて予め設定することなく文字の読取りを行なうことが
i’iJ能な光学的文字読取装置を提供することを]」
的とする。 [発明の構成] (課題を解決するだめの手段) 本発明は、少なくとも一つの読取フィールドがカラー印
刷され、同フィールドには、その印刷色に固有の字体・
字種の文字が記録される帳票を光学的に走査I7、各画
素の色情報を含む第1の帳票イメー ジを検出して帳票
イメージ格納手段に格納する。そして、帳票イメージ格
納手段に格納された第1の帳票イメージから、予め設定
された複数の色に一ついて各色毎にその色からなる第2
の帳票イメージを検出し、この第2の帳票イメージから
その色による読取フィールドの位置を検出する。 こうして検出された読取フィールド位置をもとに、同フ
ィールドに記録されている同フィールドの色に固有な字
体・字種の文字パターンを前記第1の帳票イメージから
切出し、切lidされた文字バタンについて、この文字
パターンに固有の字体・字種の情報に基づいて認識処理
を行なうように構成するものである。 (作用) このようにして構成される光学的文字読取装置では、帳
票を文字読取処理に供する際に、この帳票における読取
フィールドの位置、及び同フィルドに記録される文字の
字体・字種等を示す読取処理のための情報が、帳票に記
録された情報(カラー印刷された読取フィールド等)に
基づいて設定される。 (実施例) 以下、図面を参照して本発明の一実施例を説明する。第
1図は、同実施例に係わる光学的文字読取装置の構成を
示すブロック図である。第1図に示す光学的文字読取装
置は、図示せぬホストコンピュータの制御のもとに、帳
票に記録された文字等の読取処理を行なう。ホストコン
ピュータは、システム全体を制御するものであり、制御
部11に対して文字認識処理の起動等の指示を与える。 制御部11は、ホストコンピュータから与えられる指示
に従い、後述する各部の制御を行なうことによって帳票
に記録された文字の読取りを行なう。 カラースキャナ12は、読取対象とする帳票を搬送させ
ながら光学的に走査する。カラースキャナ12には、量
子化部13が接続され、カラースキャナ12により検出
された信号を多値のデジタル信号に量子化しシートバッ
ファ14に格納する。シートバッファ14は、読取帳票
の各画素位置における色成分(例えば赤、緑、青)の濃
度情報(第1の帳票イメージ)を格納する。シートバッ
ファ14に格納されたデータは、制御部11の指示に応
じて色検出部15、または文字切出し部16に読出され
る。色検出部15は、制御部11から与えられる色指定
情報に応じて、各画素位置のデータが指定された色デー
タであるか否かを検出する。色検出部15には、文字枠
検出部17が接続されている。文字枠検出部17は、色
検出部15による各画素位置の色データの検出結果に応
じて、内部に設けられているメモリ(図示せず)に、制
御部11により指定された色からなる二次元パターン(
第2の帳票イメージ)を展開する。そして、文字枠検出
部17は、メモリに展開された帳票イメージから、読取
フィールドを示す枠を検出し、この枠の帳票上における
位置情報(座標情報)を文字切出し部16に出力する。 文字切出し部16は、シートバッファ14から文字枠検
出部17からの位置情報によって指定される部分のイメ
ージデータ(文字パターン)を読出し、2値のデータに
変換して内部に設けられているメモリに格納する。文字
切出し部16は、イメージデータから1文字毎の文字パ
ターンを切出し、認識部18に出力する。また、認識部
18には、字体・字種指定情報格納部19が接続されて
いる。字体・字種指定情報格納部19は、制御部11か
らの色指定情報によって、これに対応する字体・字種を
指定する字体・字種コードを認識部18に出力する。認
識部18は、字体・字種コードによって指定される辞書
データを辞書格納部20から読出して、文字切出し部1
6からの文字パターンとの照合を行なう。辞書格納部2
0には、字体1字種毎に分類された文字認識処理を行な
う際の基準文字パターンとなる辞書データが格納されて
いる。認識部18における文字認識結果は、演算チエツ
ク部21に保持される。演算チエツク部21は、後述す
る演算定義用データと、一般の文字認識データとを分類
して格納する。演算チエツク部21は、演算定義用デー
タに基づいて、一般の文字認識データが正しく認識され
たものか否かをチエツクする。こうして得られた文字読
取結果は、制御部11を介してホストコンピュータに出
力される。 次に、同実施例の動作を説明する。 まず、同実施例における光学的文字読取装置において、
文字読取処理が行なわれる帳票について説明する。光学
的文字読取装置によって、読取処理が行なわれる帳票3
0は、第2図に示すように、4つの読取フィールド31
〜34と、非読取対象領域85、 Hが設けられている
。読取フィールド81〜84は、帳票30の左上からF
1〜F4のカウント番号が付けられている。また、読取
フィールド31を示す枠は赤色で印刷され、読取フィー
ルド32.84を示す枠は青色で印刷され、読取フィー
ルド33を示す枠は紫色で印刷されている。非読取対象
領域85゜8Bには、読取対象としない帳票に必要な記
載事項、または絵等が記録される。 また、読取フィールド31〜34は、枠の印刷色に応じ
て記録される文字の字体・字種が予め規定されている。 ここでは、青色枠の読取フィールド32゜84にはJI
S−Bフォントによる数字、紫色枠の読取フィールド3
3には手書き文字による英数字、赤色枠の読取フィール
ド31にはJ I S−Bフォントによる英数字が記録
されるものとする。また、読取フィールド(赤色枠> 
31には、演算定義用データが記録される。この演算定
義用データは、例えばrF2−10>6+F3−6−F
4−7Jという演算式が記録されるものとする。この演
算定祝用デー タは、読取フィールド32に記録された
左から10桁1」からの6文字と読取フィールド33の
6文字とを合t1しまた結果が、読取フィールド34の
7文字と一致するか否かを演算チエツクすることを指示
するものである。なお、読取フィールド31−34に記
録される読取対象とする文字は、黒色によ・)で記録さ
れるものとする。 ここで、前記のような規定に従って文字が記録された帳
票30に′〕いて文字読取処理を行なう。はじめに、帳
票30は、カラースキャナ12によって光学的に走査さ
れる。カラースキャナ12からの出力は、量子化部13
によって量子化されシートバッファ14に格納される。 シートバッファ14では、例えば各画素毎に色成分(赤
、緑、青)の濃度情報が8ビットで表わされて格納され
ている。 制御部11は、はじめに演算定義用データ記録用の読取
フィールド31を示す色指定情報(つまり、赤色を示す
情報)を色検出部15に出力する。そして、シートバッ
ファ14に格納されたデータを画素毎に読出す。色検出
部15は、読出されたデータが] 1 色指定情報によって指定される色データであるか否か、
各色成分の濃度情報に基づいて検出する。 文字枠検出部17は、色検出部15における検出結果に
基づいて、色指定情報によ−って指定された色データと
検出された画素位置を“1“と15、それ以外を“0”
とし7て内部に設けられたメモリに格納する。つまり、
文字枠検出部17におい゛C1制御部11からの色指定
情報によ−って指定される色部分(読取フィールドを示
す枠)のイメージが展開される。文字枠検出部17は、
メモリに展開された二次元パターンから、読取フィール
ドを示す枠を検出する。つまり、二次元パターンから線
分を検出し、この線分が予め設定された読取フィールド
を示す枠の規定に適合するか否かによって判断する。 したがって、例えば非読取対象領域35.38を示す枠
が赤色で印刷されている場合であっても、この枠のサイ
ズが読取フィールドと1.て規定されたものでなければ
、読取フィールドを示す枠として検出されない。文字枠
検出部17は、読取フィールド31枠として検出された
イメージの位置を示す座標情報を文字切出l一部16に
出力すると共に、制御部11に色指定情報によって指定
された色による読取フィールドが存在することを通知す
る。(なお、指定された色による読取フィールドが存在
しない場合には、この旨を制御部11に通知する。そし
て、制御部11は、別の印刷色による読取フィールドの
処理に移る。)制御部11は、文字枠検出部17からの
通知に応じて、字体・字種指定情報格納部19に色指定
情報(ここCは、赤色を示す情報)を出力する。字体・
字種指定情報格納部19には、色指定情報と字体・字種
コードが対応づけられたテーブルが設定されている。字
体・字種指定情報格納部19は、色指定情報に応じてJ
II−Bフォント。 英数字を示す字体・字種コードを認識部18に出力する
。また、制御部11は、文字枠検出部17から赤色印刷
による読取フィールド31の存在が通知されると、演算
チエツク部21に対して認識処理の対象と
【7ている文
字が演算定義用データであることを通知する。文字切出
し部16は、文字枠検出部17で検出された読取フィー
ルド31内に黒色で記録され]3 た文字のイメージデータをシートバッファ14から読込
み格納する。そして、文字切出1,2部]6は、1文字
毎に文字パターンを切出【7て認識部18に出力する。 認識部18は、字体・字種指定情報格納部19から与え
られる字体・字種コードに対応する辞書データを辞書格
納部20から読出し、文字切出し部16によって切出さ
れた文字パターンとの照合を行なう。認識部18におい
て得られた文字認識結果は、演算チエツク部21に出力
される。演算チエツク部21は、認識処理の対象として
いる文字が演算定義用データであることを制御部11か
ら通知されているため、認識部18における文字認識結
果を演算定義用データとして保持する。演算チエツク部
21は、読取フィールド31についての文字認識処理が
終了すると、制御部11にこの旨を通知する。 こうして、制御部】】は、赤色枠の読取フィールド31
について処理が終了したことを通知されると、次に青色
により印刷された読取フィールド32.34の読取処理
を行なう。つまり、色検出部15に対して青色を示す色
指定情報を出力する。以下、赤色枠読取フィールド31
の処理と同様に行なう。ただし、赤色枠の読取フィール
ド31以外は、一般の読取対象とする文字が記録される
読取フィールドである(演算定義用データではない)た
め、制御部11から演算チエツク部21に対して演算定
義用データであるという通知は行なわない。そして、読
取フィールド32〜34についての文字認識結果は、演
算定義用データと分類されて演算チエツク部21に保持
される。 こうして、各印刷色(赤、青、紫)の読取フィールド3
1〜84について文字認識処理が終了すると、演算チエ
ツク部21は、演算定義用データに基づいて文字認識処
理の結果得られた文字について演算チエツクを行なう。 読取フィールド31には、演算定義用データとしてrF
2−10>6+F3−6−F4−7Jという演算式が記
録されているため、これに応じて演算チエツクを行なう
。演算チエツク部21は、認識結果について演算チエツ
クを行なった後、文字認識処理の結果得られた文字デー
タ、及び演算チエツクの結果を制御部11を介してホス
トコンピュータに出力する。演算チエツク部21におい
て、文字認識結果に正しく認識されなかった文字がある
と判断されると、表示器(図示せず)等によってオペレ
ータに通知するようにする。 なお、前記実施例においては、読取フィールドを示す枠
の印刷に用いられる色は、赤、青、紫の三色としたが、
これに限るものではない。また、印刷色に対応する字体
・字種は、任意に設定することが可能である。 さらに、演算定義用データは、前記実施例に用いた形式
に限るものではなく、システムにより自由に定義される
。 [発明の効果コ 以上のように本発明によれば、帳票に記録された文字の
認識処理を行なう際に必要な読取制御情報(FC情報)
である読取フィールドの位置、及び同フィールドに記録
される文字に対応する字体・字種を示す情報を、帳票に
応じて予め設定することなく文字の読取りを行なうこと
が可能となる。このため、帳票の文字読取作業を効率的
に行なうことができるようになるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図は同実施例に用いられ
る帳票の構成を示す図である。 11・・・制御部、12・・・カラースキャナ、13・
・・量子化部、14・・・シートバッファ、15・・・
色検出部、16・・・文字切出し部、17・・・文字枠
検出部(読取フィールド位置検出手段)18・・・認識
部、19・・・字体・字種指定情報格納部、2o・・・
辞書格納部、21・・・演算チエツク部。 出願人代理人 弁理士 鈴江武彦

Claims (1)

  1. 【特許請求の範囲】 少なくとも一つの読取フィールドがカラー印刷され、同
    フィールドには、その印刷色に固有の字体・字種の文字
    が記録される帳票と、 前記帳票を光学的に走査して各画素の色情報を含む第1
    の帳票イメージを検出する帳票イメージ検出手段と、 前記帳票イメージ検出手段により検出された第1の帳票
    イメージを格納する帳票イメージ格納手段と、 前記帳票イメージ格納手段に格納された第1の帳票イメ
    ージから、予め設定されたいくつかの色について各色毎
    にその色からなる第2の帳票イメージを検出し、この第
    2の帳票イメージからその色による読取フィールドの位
    置を検出する読取フィールド位置検出手段と、 前記読取フィールド位置検出手段によって検出された読
    取フィールド位置をもとに、同フィールドに記録されて
    いる文字パターンを前記第1の帳票イメージから切出す
    文字切出し手段と、 前記文字切出し手段により切出された文字パターンにつ
    いて、この文字パターンに固有の字体・字種の情報に基
    づいて認識処理を行なう認識処理手段と、 を具備したことを特徴とする光学的文字読取装置。
JP63277930A 1988-11-02 1988-11-02 光学的文字読取装置 Pending JPH02123486A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63277930A JPH02123486A (ja) 1988-11-02 1988-11-02 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63277930A JPH02123486A (ja) 1988-11-02 1988-11-02 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPH02123486A true JPH02123486A (ja) 1990-05-10

Family

ID=17590265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63277930A Pending JPH02123486A (ja) 1988-11-02 1988-11-02 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPH02123486A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0438246A2 (en) * 1990-01-19 1991-07-24 Canon Kabushiki Kaisha Method and device for outputting multicolor document
EP0575134A2 (en) * 1992-06-15 1993-12-22 Canon Kabushiki Kaisha Method and apparatus for printing according to a graphic language
JPH10154191A (ja) * 1996-11-26 1998-06-09 Nec Corp 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0438246A2 (en) * 1990-01-19 1991-07-24 Canon Kabushiki Kaisha Method and device for outputting multicolor document
EP0575134A2 (en) * 1992-06-15 1993-12-22 Canon Kabushiki Kaisha Method and apparatus for printing according to a graphic language
EP0575134A3 (en) * 1992-06-15 1994-12-28 Canon Kk Method and device for printing according to a graphic language.
JPH10154191A (ja) * 1996-11-26 1998-06-09 Nec Corp 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体

Similar Documents

Publication Publication Date Title
US4408342A (en) Method for recognizing a machine encoded character
US20100001073A1 (en) Image capture apparatus and method
EP0353842A2 (en) Technique for reading bar codes
US4962432A (en) Selective retrieval of data from microfilm images of different forms by reading a memory index form cord (bar code) recorded on each image frame
US5038379A (en) Image information searching apparatus
JPH02123486A (ja) 光学的文字読取装置
JPH07152856A (ja) 光学的文字読取装置
JPS5949671A (ja) 光学的文字読取装置
JP2005208872A (ja) 画像処理システム
JP3006294B2 (ja) 光学的文字読取装置
JP2529421B2 (ja) 文字認識装置
JPH0661112B2 (ja) パタ−ン認識方式
JPH01199285A (ja) 光学的文字読取装置
JP2833040B2 (ja) 光学的文字読み取り装置
JPH04251395A (ja) 光学的文字図形読取装置
JPH04348475A (ja) 画像情報検索方法及びその装置
JPH06251192A (ja) 光学的文字読み取り装置
JPH0528314A (ja) 光学的文字読取装置
JPH06176193A (ja) 光学的文字読取装置
JPH06314321A (ja) 画像データベースシステム、管理台帳及び編集方法
JPH021354A (ja) 記録装置
JPH01144181A (ja) 光学的文字読取装置
JPH0362281A (ja) 光学的文字読取装置
JPH0423184A (ja) 光学的文字読取装置
JPH06259594A (ja) 光学的読取りデータの処理方法及び同装置