[go: up one dir, main page]

JP2002288675A - 帳票識別方法、帳票識別プログラム、および帳票識別方式 - Google Patents

帳票識別方法、帳票識別プログラム、および帳票識別方式

Info

Publication number
JP2002288675A
JP2002288675A JP2001093160A JP2001093160A JP2002288675A JP 2002288675 A JP2002288675 A JP 2002288675A JP 2001093160 A JP2001093160 A JP 2001093160A JP 2001093160 A JP2001093160 A JP 2001093160A JP 2002288675 A JP2002288675 A JP 2002288675A
Authority
JP
Japan
Prior art keywords
character string
memory
character
coordinate information
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001093160A
Other languages
English (en)
Inventor
Naoya Tanaka
直哉 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001093160A priority Critical patent/JP2002288675A/ja
Publication of JP2002288675A publication Critical patent/JP2002288675A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】帳票の辞書登録操作においてオペレータの作業
量を低減し、帳票の識別操作において高精度な識別を実
現するシステムを提供することにある。 【解決手段】スキャナから読んだ帳票のディジタル画像
を帳票の傾き補正と帳票周囲の余白除去を行った上で画
像メモリ12に格納する画像入力部52と、画像メモリ
12にあるディジタル画像から帳票のサイズを検出する
と共に文字パターンを文字列単位で検出して文字列単位
で特徴量へ変換して特徴メモリ13に保持する特徴抽出
部53と、入力する帳票のフォーマットを登録する場合
には特徴メモリ13にある複数組みの文字列の特徴量か
ら各組共通の特徴量を抽出して辞書メモリ15に登録す
る共通特徴抽出部55と、入力する帳票のフォーマット
の識別を行う場合には特徴メモリ13にある処理対照の
帳票の文字列の特徴量と辞書メモリ15にある帳票毎の
文字列の特徴量とを照合する照合部54とを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票を識別するた
めのシステムに関し、特に、帳票が入力された場合に、
記入内容の異なる等の帳票をフォーマットして登録す
る、または登録された帳票のフォーマットの種別を識別
するための帳票識別方法、帳票識別プログラム、および
帳票識別方式に関する。
【0002】
【従来の技術】従来の帳票識別方法の一例が、特開平1
1−282959号公報に記載されている。この従来の
帳票識別システムは、画像入力手段と、画像記憶部と、
画像中の帳票位置を検出する帳票位置検出手段と、辞書
記憶部に登録された文字列の位置を前記画像記憶部の座
標系へと変換する座標変換手段と、座標変換手段で得ら
れた文字列の位置と前記画像中の実際の文字列の位置と
のずれを文字単位に補正する文字座標補正手段と、文字
単位に辞書と処理対象の画像中の文字パターンとを照合
する図形照合手段とから構成されている。
【0003】このような構成を有する従来の帳票識別シ
ステムは、次のように動作する。すなわち、帳票を光学
的に走査して光電変換されディジタル化されて得られた
ディジタル画像は、画像記憶部に保持される。該帳票の
ディジタル画像に対し、まず、帳票位置検出手段におい
て、帳票の4辺の位置が検出され、帳票の画像中での位
置が求められる。次に、座標変換手段において、辞書に
保持された帳票のプレ印刷文字列の文字単位の位置情報
が帳票位置検出手段で得られた該帳票の位置情報を利用
して該ディジタル画像中での位置情報へと座標変換され
る。次に、文字座標補正手段において、座標変換手段に
よって変換された辞書登録された文字パターンの座標と
実際の画像中の文字パターンの座標との位置ずれが補正
される。さらに、図形照合手段において、辞書登録され
た文字パターンの特徴量と画像中の文字パターンの特徴
量が照合される。辞書登録された帳票種毎に全ての文字
パターンが照合された後、類似度が尤も高い帳票種が処
理対象の帳票の帳票種として判定される。
【0004】
【発明が解決しようとする課題】しかしながら、この従
来技術には、次のような問題点があった。第1の問題点
は、文字間隔が狭い文字列の場合は文字座標補正手段の
中で行われる文字パターンの切り出しに失敗してしま
い、帳票識別を実行できない場合があるということであ
る。文字サイズが小さくてかつ、文字間隔の狭い文字列
の場合にこの問題は顕著である。
【0005】第2の問題点は、辞書所登録する文字列を
オペレータが指定する必要があるため、オペレータの負
担が大きいということである。
【0006】本発明の目的は、上記問題点を鑑み、帳票
の辞書登録操作においてオペレータの作業量を低減し、
帳票の識別操作において高精度な識別を実現するシステ
ムを提供することにある。
【0007】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明の帳票識別方法は、情報処理装置に帳票を
識別させる帳票識別方法であって、入力された未記入の
帳票のディジタル画像から文字列を検出し、その検出し
た文字列毎の座標情報を抽出し、さらにその文字列と同
一の高さを持つ矩形状の特徴抽出範囲を制限する窓領域
を文字列上で文字列に沿って移動させながら特徴量を抽
出し、その抽出した文字列の座標情報と特徴量とをメモ
リに登録することで帳票識別フォーマットを作成するこ
とを特徴としている。
【0008】また、本発明の帳票識別方法は、情報処理
装置に帳票を識別させる帳票識別方法であって、入力さ
れた同一フォーマットで記入内容の異なる複数の記入済
み帳票のディジタル画像から各々文字列を検出し、その
検出した文字列毎の座標情報を抽出し、さらにその文字
列と同一の高さを持つ矩形状の特徴抽出範囲を制限する
窓領域を文字列上で文字列に沿って移動させながら特徴
量を抽出し、その抽出した文字列毎の座標情報および特
徴量が前記の入力された同一フォーマットで記入内容の
異なる複数の記入済み帳票の全てで一致するか否かを比
較照合し、その座標情報および特徴量が一致する文字列
の座標情報と特徴量とをメモリに登録することで帳票識
別フォーマットを作成することを特徴としている。
【0009】また、本発明の帳票識別方法は、情報処理
装置に帳票を識別させる帳票識別方法であって、入力さ
れた帳票のディジタル画像から文字列を検出し、その検
出した文字列毎の座標情報と特徴量とを抽出し、その抽
出した文字列の座標情報および特徴量とあらかじめ帳票
の種別毎に登録された文字列の座標情報および特徴量と
を比較することで帳票の種別を識別することを特徴とし
ている。
【0010】また、本発明の帳票識別方法は、情報処理
装置に帳票を識別させる帳票識別方法であって、新しい
フォーマットで未記入の帳票を入力した場合に、入力さ
れた帳票のディジタル画像を第1のメモリに保持する第
1の保持ステップと、前記第1のメモリに保持されたデ
ィジタル画像から帳票サイズを測定するサイズ測定ステ
ップと、前記第1のメモリに保持されたディジタル画像
から文字列を検出してその検出した文字列の座標情報を
算出し、さらにその文字列と同一の高さを持つ矩形状の
特徴抽出範囲を制限する窓領域を文字列上で文字列に沿
って移動させながら特徴量を算出する特徴量算出ステッ
プと、その算出した座標情報と特徴量とを第2のメモリ
に保持する第2の保持ステップと、文字列の存在がなく
なるまで前記特徴量算出ステップと前記第2の保持ステ
ップとを繰り返す第1の繰返しステップと、前記第1の
繰返しステップが終了すると前記第1のメモリに保持さ
れた帳票サイズと前記第2のメモリに保持された全ての
文字列の座標情報毎の特徴量とを第3のメモリに登録す
る登録ステップとを含むことを特徴としている。
【0011】また、本発明の帳票識別方法は、情報処理
装置に帳票を識別させる票識別方法であって、フォーマ
ットに記入された帳票を入力した場合に、入力された帳
票のディジタル画像を第1のメモリに保持する第1の保
持ステップと、前記入力された帳票の識別を行うための
識別コードを発生する発生ステップと、前記第1のメモ
リに保持されたディジタル画像から帳票サイズを測定す
るサイズ測定ステップと、前記第1のメモリに保持され
たディジタル画像から文字列を検出してその検出した文
字列の座標情報を算出し、さらにその文字列と同一の高
さを持つ矩形状の特徴抽出範囲を制限する窓領域を文字
列上で文字列に沿って移動させながら特徴量を算出する
特徴量算出ステップと、その算出した座標情報と特徴量
とを第2のメモリに前記識別コードを基に保持する第2
の保持ステップと、文字列の存在がなくなるまで前記特
徴量算出ステップと前記第2の保持ステップとを繰り返
す第1の繰返しステップと、前記第1の繰返しステップ
終了後に前記入力された帳票と同一のフォーマットで記
入された帳票が入力されると、前記発生ステップと前記
サイズ測定ステップと前記特徴量算出ステップと前記第
2の保持ステップと前記第1の繰返しステップとを繰り
返す第2の繰返しステップと、前記第2の繰返しステッ
プ終了後に前記第2のメモリに保持されたある識別コー
ドにある文字列の座標情報が前記第2のメモリに保持さ
れた別の識別コードにある文字列の座標情報と一致する
かを全て比較する比較ステップと、前記比較ステップで
一致するものがあれば、一致した座標情報に該当する特
徴量との類似度を算出してあらかじめ決められた値以上
であれば一致したものとして文字列の座標情報と特徴量
を全て抽出する抽出ステップと、抽出が終わると抽出し
た全ての文字列の座標情報毎の特徴量と前記第2のメモ
リに書き込まれた帳票サイズとを第3のメモリに登録す
る登録ステップとを含むことを特徴としている。
【0012】また、本発明の帳票識別方法は、情報処理
装置に帳票を識別させる帳票識別方法であって、フォー
マットに記入された帳票を入力した場合に、入力された
帳票のディジタル画像を第1のメモリに保持する第1の
保持ステップと、前記第1のメモリに保持されたディジ
タル画像から帳票サイズを測定するサイズ測定ステップ
と、前記第1のメモリに保持されたディジタル画像から
文字列を検出してその検出した文字列の座標情報を算出
し、さらにその文字列と同一の高さを持つ矩形状の特徴
抽出範囲を制限する窓領域を文字列上で文字列に沿って
移動させながら特徴量を算出する特徴量算出ステップ
と、その算出した座標情報と特徴量とを第2のメモリに
保持する第2の保持ステップと、文字列の存在がなくな
るまで前記特徴量算出ステップと前記第2の保持ステッ
プとを繰り返す第1の繰返しステップと、前記第1の繰
返しステップが終了後に前記第2のメモリに保持された
文字列の座標と,前記第2のメモリに保存されている帳
票サイズと同じ帳票サイズで第3のメモリに登録されて
いる帳票の文字列の座標情報とを比較する比較ステップ
と、前記比較ステップで一致した場合に文字列の特徴量
同士の類似度を算出してあらかじめ決められた値以上で
あれば文字列が一致したと判断して帳票の種別を識別す
る識別ステップとを含むことを特徴としている。
【0013】また、本発明の帳票識別プログラムは、コ
ンピュータに処理させるための帳票を識別する帳票識別
プログラムであって、新しいフォーマットで未記入の帳
票を入力した場合に、入力された帳票のディジタル画像
を第1のメモリに保持する第1の保持ステップと、前記
第1のメモリに保持されたディジタル画像から帳票サイ
ズを測定するサイズ測定ステップと、前記第1のメモリ
に保持されたディジタル画像から文字列を検出してその
検出した文字列の座標情報を算出し、さらにその文字列
と同一の高さを持つ矩形状の特徴抽出範囲を制限する窓
領域を文字列上で文字列に沿って移動させながら特徴量
を算出する特徴量算出ステップと、その算出した座標情
報と特徴量とを第2のメモリに保持する第2の保持ステ
ップと、文字列の存在がなくなるまで前記特徴量算出ス
テップと前記第2の保持ステップとを繰り返す第1の繰
返しステップと、前記第1の繰返しステップが終了する
と前記第1のメモリに保持された帳票サイズと前記第2
のメモリに保持された全ての文字列の座標情報毎の特徴
量とを第3のメモリに登録する登録ステップとを含む処
理を前記コンピュータに実行させることを特徴としてい
る。
【0014】また、本発明の帳票識別プログラムは、コ
ンピュータに処理させるための帳票を識別する帳票識別
プログラムであって、フォーマットに記入された帳票を
入力した場合に、入力された帳票のディジタル画像を第
1のメモリに保持する第1の保持ステップと、前記入力
された帳票の識別を行うための識別コードを発生する発
生ステップと、前記第1のメモリに保持されたディジタ
ル画像から帳票サイズを測定するサイズ測定ステップ
と、前記第1のメモリに保持されたディジタル画像から
文字列を検出してその検出した文字列の座標情報を算出
し、さらにその文字列と同一の高さを持つ矩形状の特徴
抽出範囲を制限する窓領域を文字列上で文字列に沿って
移動させながら特徴量を算出する特徴量算出ステップ
と、その算出した座標情報と特徴量とを第2のメモリに
前記識別コードを基に保持する第2の保持ステップと、
文字列の存在がなくなるまで前記特徴量算出ステップと
前記第2の保持ステップとを繰り返す第1の繰返しステ
ップと、前記第1の繰返しステップ終了後に前記入力さ
れた帳票と同一のフォーマットで記入された帳票が入力
されると、前記発生ステップと前記サイズ測定ステップ
と前記特徴量算出ステップと前記第2の保持ステップと
前記第1の繰返しステップとを繰り返す第2の繰返しス
テップと、前記第2の繰返しステップ終了後に前記第2
のメモリに保持されたある識別コードにある文字列の座
標情報が前記第2のメモリに保持された別の識別コード
にある文字列の座標情報と一致するかを全て比較する比
較ステップと、前記比較ステップで一致するものがあれ
ば、一致した座標情報に該当する特徴量との類似度を算
出してあらかじめ決められた値以上であれば一致したも
のとして文字列の座標情報と特徴量を全て抽出する抽出
ステップと、抽出が終わると抽出した全ての文字列の座
標情報毎の特徴量と前記第2のメモリに書き込まれた帳
票サイズとを第3のメモリに登録する登録ステップとを
含む処理を前記コンピュータに実行させることを特徴と
している。
【0015】また、本発明の帳票識別プログラムは、コ
ンピュータに処理させるための帳票を識別する帳票識別
プログラムであって、フォーマットに記入された帳票を
入力した場合に、入力された帳票のディジタル画像を第
1のメモリに保持する第1の保持ステップと、前記第1
のメモリに保持されたディジタル画像から帳票サイズを
測定するサイズ測定ステップと、前記第1のメモリに保
持されたディジタル画像から文字列を検出してその検出
した文字列の座標情報を算出し、さらにその文字列と同
一の高さを持つ矩形状の特徴抽出範囲を制限する窓領域
を文字列上で文字列に沿って移動させながら特徴量を算
出する特徴量算出ステップと、その算出した座標情報と
特徴量とを第2のメモリに保持する第2の保持ステップ
と、文字列の存在がなくなるまで前記特徴量算出ステッ
プと前記第2の保持ステップとを繰り返す第1の繰返し
ステップと、前記第1の繰返しステップが終了後に前記
第2のメモリに保持された文字列の座標と,前記第2の
メモリに保存されている帳票サイズと同じ帳票サイズで
第3のメモリに登録されている帳票の文字列の座標情報
とを比較する比較ステップと、前記比較ステップで一致
した場合に文字列の特徴量同士の類似度を算出してあら
かじめ決められた値以上であれば文字列が一致したと判
断して帳票の種別を識別する識別ステップとを含む処理
を前記コンピュータに実行させることを特徴としてい
る。
【0016】また、本発明の帳票識別方式は、帳票を入
力するとディジタル画像に変換する入力装置と、帳票の
識別処理を行う制御装置とを備えた帳票を識別する帳票
識別方式において、前記制御装置は、前記入力装置から
読み取った帳票のディジタル画像を格納する画像入力手
段と、画像入力手段により保持された前記帳票のディジ
タル画像から帳票のサイズを検出すると共に文字パター
ンを文字列単位で検出して文字列単位で特徴量へ変換し
て保持する特徴抽出手段と、前記入力する帳票のフォー
マットを登録する場合には前記特徴抽出手段から出力さ
れる複数組みの文字列の特徴量から各組共通の特徴量を
抽出して辞書メモリに登録する共通特徴抽出手段と、前
記入力する帳票のフォーマットの識別を行う場合には前
記特徴抽出手段から出力される処理対象の帳票の文字列
の特徴量とあらかじめ前記辞書メモリに帳票毎に保持さ
れた文字列の特徴量とを照合する照合手段とを有するこ
とを特徴としている。
【0017】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。図2を参照すると、本発明
の第1の実施の形態は、パソコン等の情報処理装置(コ
ンピュータ)である制御装置1と、帳票表面を光学的に
走査してディジタル画像を生成するイメージスキャナ2
と、制御装置1に文字等を入力するキーボード3と、制
御装置1の制御の下で表示を行う表示装置4(例えば、
CRT,LCD等)とから構成される。なお、イメージ
スキャナ2は、入力した画像情報をディジタル画像に変
換するディジタルカメラ等の入力装置を使用しても良
い。
【0018】制御装置1は、図示していないプロセッサ
(CPU)によりプログラムで動作する制御部11と、
帳票のディジタル画像を保持する画像メモリ12と、特
徴抽出部53(後述)で記入内容の異なる同一フォーマ
ットの帳票から検出された文字列の特徴量の組を複数個
保持する特徴メモリ13と、帳票の読取り動作時のモー
ドを含む制御部11の動作時の制御の状態等を記憶する
制御メモリ14と、帳票種をインデックスとして文字列
の特徴量を該文字列の座標と共に格納する辞書メモリ1
5と、帳票識別プログラムが格納されているプログラム
メモリ16と、イメージスキャナ2とキーボード3と表
示装置4とのデータのやり取り(例えば、USBインタ
フェースで制御)を行うインタフェース部17とから構
成される。なお、画像メモリ12、特徴量メモリ13、
および制御メモリは、データの読み出しと書き込みので
きるメモリ[この場合のメモリは、内部メモリ(例え
ば、RAM)、外部メモリ(例えば磁気ディスク)の種
別は問わない]であって、同一のメモリ内のエリアにそ
れぞれ設けても良い。また、プログラムメモリ16は、
データの読み出しと書き込みのできるメモリであって、
電源を落としても消えないように不揮発性のメモリ(例
えば、EPROM、磁気ディスク等)を使用することが
望ましい。
【0019】制御部11の内部の構成は、制御部11が
プログラムメモリ16内の帳票識別プログラムを実行す
る場合の機能構成を示しており、帳票識別プログラムを
実行する場合の全体の動作の制御を行う共通部51と、
イメージスキャナ2から読取った帳票のディジタル画像
に対して帳票の傾き補正と余白除去を行った後にその画
像を画像メモリ12に保持(格納)する画像入力部52
と、画像メモリ12に保持された帳票のディジタル画像
から帳票のサイズを検出すると共に文字パターンを文字
列単位で検出して文字列単位で特徴量へ変換して特徴メ
モリ13に保持する特徴抽出部53と、特徴量メモリ1
3に保持される同一フォーマットで記入内容の異なる複
数の帳票から検出された文字列の特徴量から各帳票共通
の文字列の特徴量のみを選択して辞書メモリ15へ書き
込む共通特徴抽出部55と、特徴抽出部53から出力さ
れる処理対象の帳票の文字列特徴量と辞書メモリ15に
帳票種毎に保持された文字列特徴量とを照合し、特徴抽
出部53から出力される処理対象の帳票の文字列特徴と
最も類似度の高い帳票種を決定して出力する照合部54
とを含む。
【0020】特徴抽出部53は、画像メモリ12に保持
されている帳票のディジタル画像から帳票のサイズを検
出する帳票サイズ検出部531と、画像メモリ12に保
持されている帳票のディジタル画像から文字パターンを
文字列単位で検出して文字列単位で特徴量へ変換し特徴
量メモリ13へ書き込む文字列特徴検出部532とを含
む。
【0021】図1を参照すると、図1の制御装置1のプ
ログラムメモリ16に保持されている帳票プログラムを
制御部11が実行した場合における制御部11内の各機
能ブロックおよび各メモリ12〜15間の関係を示した
概略図である。
【0022】図2を参照して、本発明の第1の実施の形
態を説明する。共通部51の下で、画像入力部52は、
イメージスキャナ2で得られる帳票表面を格子状にサン
プリングしてその濃度値を量子化して得られたディジタ
ル画像を読取った後、このディジタル画像中の帳票の傾
き補正と余白除去を行って得られた画像を画像メモリ1
2に格納する。この場合の画像入力部52における帳票
の傾き補正と帳票周囲の余白除去の処理について、図9
を用いて説明する。
【0023】図9は、イメージスキャナ2で得られるデ
ィジタル画像fの例である。帳票の周囲部分の画素値を
1、帳票上の何も書かれていない部分の画素値を0、帳
票上の文字が書かれている部分の画素値を1で表す2値
画像であるとする。ただし、値1の画素を黒画素、値0
の画素を白画素とも呼ぶとする。画像fの座標系は、画
像左上隅を原点Oとし、原点から右方向へ+X軸,原点か
ら下方向へ+Y軸を取るxy座標系とする。また、この
画像f中における帳票の傾きは最大でも±45度の範囲
内(+45度と−45度は含まず)とする。まず、画像
入力部52は、画像f中の帳票の4隅の座標値を検出す
る。具体的には、例えば図9に示されるように画像fの
4隅から夫々45度または135度の斜めの方向に画像
fを走査して背景を表す黒画素から帳票上(の空白)を
表す白画素へ変化する初めての点の座標を検出する。こ
のようにして画像入力部52により帳票の4隅が検出さ
れる。ここでは以上のようにして求められた帳票の左上
隅をP1(x1, y1)、同右上隅をP2(x2, y2)、同左
下隅をP3(x3, y3)、同右下隅をP4(x4, y4)とす
る。画像f中の帳票の傾きθは、例えばP1とP2の座
標値から arctan((x2−x1)/(y2−y1)) として求まる。
また、帳票上の領域は、帳票の上辺、下辺、左辺、右辺
を表す方程式をもとにして、不等式(1)(2)(3)(4): y ≧((y2−y1)/(x2−x1))・x+(x1・y2−x2・y1)/(x1−x2) ・・・・(1) y ≦((y4−y3)/(x4−x3))・x+(x3・y4−x4・y3)/(x3−x4) ・・・・(2) x ≧((x3−x1)/(y3−y1))・y+(y1・x3−y3・x1)/(y1−y3) ・・・・(3) x ≦((x4−x2)/(y4−y2))・y+(y2・x4−y4・x2)/(y2−y4) ・・・・(4) を全て満たす領域として表現できる。また、帳票の幅W
と高さHはそれぞれ、 W=SQRT((x2−x1)・(x2−x1)+(y2−y1)・(y2−y1)) ・・・・(5) H=SQRT((x3−x1)・(x3−x1)+(y3−y1)・(y3−y1)) ・・・・(6) として求めることができる。ただし、SQRT(x)はxの
平方根を求める演算を表す。傾き補正および余白除去の
変換は、変換後の画像gの座標値(X, Y)から変換前の画
像fの座標値(x, y)を求める式: cosθ・X−sinθ・Y+x1=x ・・・・(7) sinθ・X+cosθ・Y+y1=y ・・・・(8) を用いて行うことができる。つまり、XとYの値を夫
々、X={X|0≦X≦W}、 Y={Y|0≦Y≦H} の範囲で変化さ
せ、変換後の画像g(X, Y) の画素値を式(7)(8)
によって変換前の画像f(x, y)から求めることによって
生成することができる。ここで、xおよびyの値が整数
にならない場合は、それぞれ四捨五入した値を用いると
する。変換後の画像上の位置は、帳票の左上隅を原点に
取り原点から右方向へ+X、原点から下方向へ+Yを取る
座標系で表すとする。以上の説明はスキャナで得られる
画像が2値画像でなく濃淡画像の場合でも、傾き補正お
よび余白除去の変換において一旦適切なしきい値によっ
て2値画像へ変換して帳票の4隅の座標値を検出した
後、元の濃淡画像を式(7)(8)で変換することによ
り適用できる。
【0024】画像メモリ12は、入力された帳票のディ
ジタル画像に対して傾き補正と余白除去を行った画像を
保持することになる。この後、画像入力部52は、制御
を特徴抽出部53に渡すため共通部51に一旦戻す。
【0025】共通部51から制御を引き継いだ特徴抽出
部53は、帳票サイズ検出部531で帳票のサイズを検
出し、文字列特徴検出部532で画像メモリ12に保持
された帳票のディジタル画像から活字文字パターンを文
字列単位で検出し、文字列単位で特徴量へ変換する。な
お、この場合の活字文字パターンの文字列単位の検出に
ついては、従来、多くの報告がある。例えば、まず、画
像メモリに保持される前記2値画像に対して、黒画素の
連結成分単位にラベリング処理(黒画素の連結成分単位
にラベル値を付与して各黒画素の連結成分を区別して扱
えるようにする処理)を行い、得られたラベル図形成分
の中で上下左右方向で近接(数画素程度の距離に存在)
するもの同士を結合して新たなラベル図形成分とする。
次に、この結合処理の完了したラベル図形成分に対し
て、各々幅および高さを測定して文字らしいサイズのラ
ベル図形成分を選出する。この時、幅については文字間
隔の狭い文字同士が前記結合処理において連結している
ことを考慮して文字数個分の幅に相当する値を持つラベ
ル図形成分も文字として選出する。こうして選出された
ラベル図形成分に対して、x方向の距離が近く、上端と
下端のy座標値の近いものを次々にグループ化する。グ
ループ化できるラベル図形成分がなくなった時点でグル
ープ化処理を終了し、グループ化されたラベル図形成分
の組を各々文字列パターンとする。
【0026】以上のようにして検出された文字列パター
ンに対して、特徴抽出部53の文字列特徴検出部532
は、文字列単位の特徴量を抽出する。文字列単位の特徴
量は、図7に示されるように、対象とする文字列パター
ン上に2画素〜20画素程度の幅(200DPI程度の
解像度の画像の場合)を持ち文字列と同じ高さを持つ特
徴量抽出用の窓領域を、文字列方向(横書き文字列では
横方向)に沿って1画素〜数十画素単位で移動させなが
ら、特徴抽出用の窓領域に含まれる文字パターンの特徴
を逐次抽出したものを用いる。このとき特徴抽出用の窓
領域は、図10に示されるようにさらに上下にN(1〜
9程度)個(図10では5個)の部分領域に分割する。
文字パターンの特徴はこの部分領域毎に集計する。
【0027】この文字パターンの特徴は文字パターンと
その背景の境界にある画素のこの境界に対する接線方向
(またはその接線方向に直交する方向)とする。接線方
向は、N(例えば8)方向に量子化して、図10に示さ
れるように窓領域内に設定した部分領域毎に量子化した
方向別に画素数をカウントする。さらに1つの窓領域内
で検出された境界画素の総数がK(例えば100)とな
るように各部分領域内で方向別に正規化する。つまり、
ある窓領域内で実際に検出された境界画素の総数がK
1、そのうち、その窓領域のある部分領域の1つの方向
にカウントされた画素数がMだった場合、Mの値は、M
×K/K1のように正規化される。
【0028】前記文字パターンの特徴は他にも、部分領
域内の黒画素の密度を用いることもできる。例えば、”
111”のようにアラビア数字の1が並ぶ文字列の黒画
素密度の変動を窓領域内の分割領域が1として数量化
(窓領域内の黒画素の占める密度の割合で最大100と
する)したパターンは、「0,10,30,90,10
0,90,30,10,0,0,0,10,30,9
0,100,90,30,0,0,0,10,30,9
0,100,90,30,10」のようになる。
【0029】特徴抽出部53は、制御メモリ14からモ
ードを読み出したときに帳票の読取り動作時のモードが
帳票登録モードでかつ未記入モードであれば、検出した
帳票サイズと検出した文字列毎の特徴量とを特徴量メモ
リ13に保持し、共通特徴抽出部55へ制御を引き渡す
ために共通部51に一旦制御を戻す。この場合の特徴量
メモリ13は、特徴抽出部53で得られた帳票のサイズ
と文字列単位の特徴量とを保持することになる。特徴抽
出部53は、帳票の読取り動作時のモードが帳票登録モ
ードでかつ記入済みモードであれば、オペレータの指示
があるまで、繰り返し入力された同一フォーマットで記
入内容の異なる帳票から文字列単位の特徴量を抽出して
帳票サイズと帳票毎に検出した文字列単位の特徴量の組
とを特徴メモリ13に保持する。この場合の特徴量メモ
リ13は、特徴抽出部53で得られた帳票のサイズと同
一フォーマットで記入内容の異なる帳票から抽出された
複数組の文字列単位の特徴量とを保持することになる。
特徴メモリ13は、同一フォーマットで記入内容の異な
る複数個の帳票から検出された文字列の特徴量を帳票毎
(この場合、辞書メモリ15で未使用の識別コードを自
動的に付与する)に複数保持する容量を備える。なお、
文字列単位(または文字列ごと)の特徴量を特徴量メモ
リ13または辞書メモリに保持(または登録)するとい
うことは、本発明では、文字列の座標情報「例えば左上
隅座標(左上隅からのX,Y座標)と横方向の長さと縦
方向の高さとを含む」が文字列に相当し、その文字列の
座標情報毎に特徴量(パターン)を保持(または登録)
することを意味する。なお、この場合の座標毎に特徴量
を保持(または登録)するとは、座標情報が必要とされ
るメモリに書き込まれ、その書き込まれた座標情報をに
対比して特徴量が書き込まれることをいう。
【0030】制御メモリ14からモードを読み出したと
きに帳票の読取り動作時のモードが帳票登録モードであ
れば、共通部51は共通特徴抽出部55へ制御を引き継
ぐ。共通部51から制御を引き継いだ共通特徴抽出部5
5は、特徴量メモリ13に保持された同一フォーマット
で記入内容の異なる帳票間で共通な文字列の座標とその
文字列特徴を、文字列の座標および文字列特徴量の同一
性から抽出する。文字列同士の座標値の差が一定値(数
画素程度)以内なら座標値は同一とみなし、文字列特徴
同士の類似度、つまり、互いの特徴量をそれぞれ1列に
並べた特徴ベクトルをu,vとするとき、u・v/‖u
‖‖v‖ (ただし、・は内積演算を表す)で計算され
る値が、一定値(例えば0.95)以上であれば同一で
あるとみなす。ただし、文字列特徴の同一性の判定は従
来の様々な文字認識手法を応用して用いることも可能で
ある。
【0031】抽出された共通な文字列の特徴量は、辞書
メモリ15へ自動付与される帳票識別コードをインデッ
クスとして登録される。この場合、特徴量メモリ13に
保持された帳票サイズも辞書メモリ15に登録される。
すなわち、辞書メモリ15には、帳票サイズと検出され
た文字列の座標値毎(文字列単位毎)の特徴量とが、帳
票識別コードをインデックスとして保持されることにな
る。
【0032】特徴抽出部53は、制御メモリ14からモ
ードを読み出したときに帳票識別モードであれば、照合
部54に制御を渡すために共通部51に制御を一旦戻
す。
【0033】共通部51から制御を引き継いだ照合部5
4は、帳票認識モードにおいて、特徴抽出部53から出
力される処理対象の帳票のディジタル画像から検出され
た帳票サイズと文字列の座標値およびその特徴量を、辞
書メモリ15に登録された帳票種と逐次照合する。処理
対象の帳票と同一サイズを持ち、該帳票種に登録された
全ての文字列について座標情報が処理対象の帳票上のい
ずれかの文字列と座標値が同一であり、かつ、その文字
列の特徴量が同一である場合、処理対象の帳票は該帳票
種であると判定してその判定結果を出力する。文字列の
座標値の同一性および文字列の特徴量の同一性の判定に
ついては、共通特徴抽出部の説明で述べた判定方法を用
いる。
【0034】次に、図1および図2を、図3および図4
のフローチャートを参照して本発明の実施の形態の全体
の動作について説明する。
【0035】本発明の帳票読取り時の動作は、帳票登録
モードと、帳票識別モードに分かれる。帳票登録モード
は、辞書メモリに帳票識別用の特徴量を登録するモード
であり、さらに未記入モードと記入済みモードとに分か
れる。未記入モードは未使用の帳票を用いて帳票の特徴
量を辞書メモリに登録するための処理であり、記入済み
モードは複数枚の記入済み帳票を用いて帳票の特徴量を
辞書メモリに登録するための処理である。帳票識別モー
ドは、辞書メモリに登録された特徴量と処理対象の帳票
から検出された特徴量とを照合して、処理対象の帳票の
種別を判定する処理である。
【0036】先ず、オペレータが制御装置1を立上げ、
キーボード3から帳票識別プログラムを実行させると、
制御装置1の制御部11は、プログラムメモリ16に保
持されている帳票識別プログラムを読み出して実行す
る。すると、制御部11の共通部51は、インタフェー
ス部17を介して、表示装置4にメニュー画面を表示す
る。このメニュー画面には、帳票登録モードにして処理
するか帳票識別モードに処理するかの選択を促す項目が
含まれている。更に、帳票登録モードには、未記入モー
ド(新規の帳票:帳票のフォーマットだけが記入)また
は記入済みモード(記入された帳票:帳票のフォーマッ
トに従って記入)の2種類があり、帳票識別モード選択
時にメニュー画面から選択できるようになっている。
【0037】オペレータがキーボード3を使用して、表
示部4のメニュー画面から「帳票登録モードで未記入モ
ード」を選択して実行させると、制御部11の共通部5
1はあ、制御メモリ14のモードエリアに「帳票登録モ
ードで未記入モード(例えば、帳票登録モードで未記入
モードを16進表示で「00」、帳票登録モードで記入
済みモードを「0F」、帳票識別モードを16進表示で
「FF」とする)」を登録する。登録した後、共通部5
1は、帳票の入力待ちとなる。
【0038】以下、帳票登録モードで未記入モードの動
作について説明する。オペレータがイメージスキャナ2
から未記入の帳票を入力すると、イメージスキャナ2
は、帳票表面を光学的に走査して光電変換を行い、帳票
のディジタル画像を生成する。その生成した帳票のディ
ジタル画像を共通部51を介して画像入力部52が読み
取って、帳票の傾き補正と帳票周囲の余白除去を行った
後に画像メモリ12に保持する(図3のステップA0
1)。画像メモリ12に保持した後、画像入力部52
は、特徴抽出部53に制御を引き継ぐため、共通部51
に一旦制御を戻す。
【0039】制御部51から制御を引き継いだ特徴抽出
部53は、読取った帳票の識別を行うために辞書メモリ
に登録されていない識別コードをランダムに発生させ、
帳票サイズ検出部531に対して画像メモリ12に保持
された帳票のサイズを測定させ、発生させた識別コード
と測定した帳票のサイズを特徴量メモリ13に書き込む
(ステップA02)。更に、特徴抽出部53は、文字列
特徴検出部532に対して画像メモリ12に保持された
帳票の文字パターンを文字列単位で検出させ、検出され
た文字列単位の文字パターンから特徴量を算出させる
(ステップA03,A04)。この場合、特徴抽出部5
3の文字列特徴検出部532は、特徴量を算出した文字
列毎に座標情報[例えば、左上隅座標(左上隅からの
X,Y座標)と横方向の長さと高さを示す:文字列のエ
リアの位置を示す]を算出する。この座標情報は文字列
を識別に利用されることになる。特徴抽出部53は、こ
の算出した座標情報と算出した特徴量とを先程発生させ
た識別コードをインデックスとして特徴量メモリ13に
書き込む(ステップA05)。このようにして特徴抽出
部53は、文字列の存在がなくなるまで、ステップA0
3〜A05を繰り返す(ステップA06)。すなわち、
特徴量メモリ13には、識別コードをインデックスとし
たその帳票のサイズと、各文字列毎(座標情報毎)の特
徴量とが書き込まれることになる。この後、特徴抽出部
53は、共通部51に一旦制御を戻す。
【0040】共通部51は、制御メモリ14のモードエ
リアからモードを読み出すと、帳票登録モードで未記入
モードに設定されているため、制御を共通特徴抽出部5
5に制御を渡す(ステップA07)。
【0041】帳票登録モードで未記入モードの制御を引
き継いだ共通特徴抽出部55は、未記入モードになって
いるため、特徴メモリ13に書き込まれた帳票サイズと
特徴メモリ13に書き込まれた全ての文字列の座標情報
毎の特徴量とを、帳票識別コードをインデックスとして
辞書メモリに登録する(ステップA06,A07,A0
9)。この場合、共通特徴抽出部55は、辞書メモリ1
5への登録時における帳票識別コードとして、オペレー
タに帳票識別コードを入力させるかそのまま(特徴量メ
モリ13に書き込まれた帳票サイズ+識別コードを帳票
識別コード)にするのかを促す画面をインタフェース部
17を介して表示装置4に表示させる。すなわち、辞書
メモリには、帳票識別コードをインデックスとして、帳
票のサイズと文字列の座標情報毎の特徴量とが登録され
ることになる。
【0042】次に、帳票登録モードで記入済みモードの
場合について説明する オペレータがキーボード3を使用して、表示部4のメニ
ュー画面から「帳票登録モードで記入済みモード」を選
択して実行させると、制御部11の共通部51は、制御
メモリ14のモードエリアに「帳票登録モードで記入済
みモード」を登録する。登録した後、共通部51は、帳
票の入力待ちとなる。
【0043】オペレータがイメージスキャナ2から未記
入の帳票を入力すると、イメージスキャナ2は、帳票表
面を光学的に走査して光電変換を行い、帳票のディジタ
ル画像を生成する。その生成した帳票のディジタル画像
を共通部51の画像入力部52が読取って帳票の傾き補
正と帳票周囲の余白除去を行った上で画像メモリ12に
保持する(図3のステップA01)。画像メモリ12に
保持した後、画像入力部52は、特徴抽出部53に制御
を渡すため、共通部51に一旦制御を戻す。
【0044】制御部51から制御を引き継いだ特徴抽出
部53は、読取った帳票の識別を行うために辞書メモリ
に登録されていない識別コードをランダムに発生させ、
帳票サイズ検出部531に対して画像メモリ12に保持
された帳票のサイズを測定させ、算出した識別コードと
測定した帳票のサイズを特徴量メモリ13に書き込む
(ステップA02)。更に、特徴抽出部53は、文字列
特徴検出部532に対して画像メモリ12に保持された
帳票の文字パターンを文字列単位で検出させ、検出され
た文字列単位の文字パターンから特徴量を算出させる
(ステップA03,A04)。この場合、特徴抽出部5
3の文字列特徴検出部532は、特徴量を算出した文字
列毎に座標情報[例えば、左上隅座標(左上隅からの
X,Y座標)と横方向の長さと高さを示す:文字列のエ
リアの位置を示す]を算出する。特徴抽出部53は、こ
の算出した座標情報と算出した特徴量とを先程算出した
識別コードをインデックスとして特徴量メモリ13に書
き込む(ステップA05)。このようにして特徴抽出部
53は、文字列の存在がなくなるまで、ステップA03
〜A05を繰り返す(ステップA06)。すなわち、特
徴量メモリ13には、識別コードをインデックスとした
その帳票のサイズと、各文字列毎(座標情報毎)の特徴
量が書き込まれることになる。この後、特徴抽出部53
は、共通部51に一旦制御を戻す。
【0045】共通部51は、制御メモリ14のモードエ
リアからモードを読み出すと、「帳票登録モードで記入
済みモード」に設定されているため、表示部4に前回読
み込ませた帳票の同一のフォーマットで記入済みの帳票
を読み込ませるもの(追加するもの)があるかの選択を
オペレータに促す画面を表示する。オペレータが「追加
するもの」を選択した場合には、オペレータは先に処理
した帳票と同一フォーマットで記入内容の異なるものを
用意し、イメージスキャナ2から読み込ませることにな
る。追加するものがなくなるまで、制御部11は、ステ
ップA01〜A07の動作を繰り返す(ステップA0
8)。この場合、ステップA05において、特徴量メモ
リ13に書き込まれる帳票のサイズ、各文字列の座標情
報毎の特徴量は、未使用の識別コードに割り当てられた
特徴メモリ13のエリアに書き込まれる。
【0046】ステップA08において、追加するものが
なければ、共通部51は、共通特徴抽出部55に制御を
渡す。記入済みモードでの制御を引き継いだ共通特徴抽
出部55は、記入済みモードになっているため、特徴量
メモリ13に書き込まれたある識別コードにある文字列
の座標情報が別の識別コードにある文字列の座標情報と
が一致するかを全て比較する。一致するものがあれば、
共通特徴抽出部55は、一致した座標情報に該当する特
徴量との類似度を算出し、あらかじめ決められた値以上
であれば、一致したものとして、そのときの文字列の座
標情報と特徴量を全て抽出する(ステップA09)。こ
の場合、類似度を算出する共通特徴抽出部55は、窓領
域毎のパターン値を比較し、一致した数を全体の数(合
計の窓領域の数)で割って得た比率を類似度として求め
る。すなわち、共通抽出部55は、算出した類似度があ
らかじめ決められた値(例えば0.95)以上であれ
ば、一致したものと判定する。従って、文字単位のパタ
ーン分解が困難なサイズの小さな文字でも文字列として
求めたパターンで比較するため、文字単位に分解する必
要はなく、処理も簡単となり、帳票識別精度を向上する
ことができる。
【0047】抽出が終わると、共通特徴抽出部55は、
帳票識別コードをインデックスとして、抽出した全ての
文字列の座標情報毎の特徴量と特徴メモリ13に書き込
まれた帳票のサイズとを辞書メモリ15に登録する(ス
テップA06,A07,A09)。この場合、共通特徴
抽出部55は、辞書メモリ15への登録時における帳票
識別コードとして、オペレータに帳票識別コードを入力
させるかそのまま(特徴量メモリ13に書き込まれた識
別コードを帳票識別コード)にするのかを促す画面をイ
ンタフェース部17を介して表示装置4に表示させる。
すなわち、辞書メモリには、帳票識別コードをインデッ
クスとして、帳票のサイズと文字列の座標情報毎の特徴
量とが登録されることになる。
【0048】次に、帳票識別モードの場合について説明
する オペレータがキーボード3を使用して、表示部4のメニ
ュー画面から「帳票識別モード」を選択して実行させる
と、制御部11の共通部51は、制御メモリ14のモー
ドエリアに「帳票識別モード」を登録する。登録した
後、共通部51は、帳票の入力待ちとなる。
【0049】オペレータがイメージスキャナ2から帳票
を入力すると、イメージスキャナ2は、帳票表面を光学
的に走査して光電変換を行い、帳票のディジタル画像を
生成する。その生成した帳票のディジタル画像を共通部
51の画像入力部52が読取って帳票の傾き補正と帳票
周囲の余白除去を行った上で画像メモリ12に保持する
(図4のステップB01)。画像メモリ12に保持した
後、画像入力部52は、特徴抽出部53に制御を渡すた
め、共通部51に一旦制御を戻す。
【0050】制御部51から制御を引き継いだ特徴抽出
部53は、読取った帳票の識別を行うために辞書メモリ
で未使用の識別コードを発生させ、帳票サイズ検出部5
31に対して画像メモリ12に保持された帳票のサイズ
を測定させ、算出した識別コードと測定した帳票のサイ
ズを特徴量メモリ13に書き込む(ステップB02)。
更に、特徴抽出部53は、文字列特徴検出部532に対
して画像メモリ12に保持された帳票の文字パターンを
文字列単位で検出させ、検出された文字列単位の文字パ
ターンから特徴量を算出させる(ステップB03,B0
4)。この場合、特徴抽出部53の文字列特徴検出部5
32は、特徴量を算出した文字列毎に座標情報[例え
ば、左上隅座標(左上隅からのX,Y座標)と横方向の
長さと高さを示す:文字列のエリアの位置を示す]を算
出する。特徴抽出部53は、この算出した座標情報と算
出した特徴量とを先程発生させた識別コードをインデッ
クスとして特徴量メモリ13に書き込む(ステップB0
5)。このようにして特徴抽出部53は、文字列の存在
がなくなるまで、ステップB03〜B05を繰り返す
(ステップB06)。すなわち、特徴量メモリ13に
は、識別コードをインデックスとしたその帳票のサイズ
と、各文字列毎(座標情報毎)の特徴量を書き込まれる
ことになる。この後、特徴抽出部53は、共通部51に
一旦制御を戻す。以上は、帳票登録モードの動作におけ
るステップA01〜A06までの処理と同じである。
【0051】共通部51は、制御メモリ14のモードエ
リアからモードを読み出すと、「帳票識別モード」に設
定されているため、制御を照合部54に渡す。照合部5
4は、特徴量メモリ13に書き込まれた特徴量と辞書メ
モリ15に登録されている同じ帳票サイズの特徴量を逐
次読み出して照合を行う。例えば、辞書メモリ15に登
録されている帳票Cでは、まず、サイズの一致を確認し
た後、帳票Cの文字列の座標値を逐次読み出して処理対
象の帳票から検出された全ての文字列の座標値と比較す
る。座標値が一致した場合には、照合部54は、文字列
の特徴量同士の類似度を算出し、類似度があらかじめ定
めたしきい値以上であれば文字列が一致したと見なす。
更に、照合部54は、辞書メモリ15に登録された帳票
Cの全ての文字列が処理対象の帳票上にすべて存在した
時、処理対象の帳票の種別を前記帳票Cと判定する(ス
テップB07)。この場合、処理対象の帳票の種別が判
定された時には、照合部54は、辞書メモリに登録され
た未照合の帳票との照合は行わない。よって、出現頻度
の高い帳票から順に辞書メモリへ登録しておくものとす
る。なお、照合部54が類似度を算出して文字列を一致
とみなす手順は、共通特徴抽出部55が類似度を算出し
て文字列を一致とみなす手順と同じであるので説明を省
略する。
【0052】次に、本発明の第1の実施の形態における
具体例を用いて説明する。図5に示されるような具体例
における未記入の帳票Aを辞書登録する動作について説
明する。この場合、図5に示される未記入の帳票Aにお
いて、文字列2と文字列3は文字サイズが小さく(例え
ば高さ2mm程度)、文字間隔も狭い(例えば0.5m
m)ため、OCRで通常利用される200DPIの解像
度の画像からは文字単位の切出しが困難な文字列の例で
ある。
【0053】先ず、イメージスキャナ2の帳票の読取り
によってディジタル画像が生成され、画像入力部52に
より傾きを補正され余白を除去された帳票画像に変換さ
れ画像メモリ12に保持される。特徴抽出部53では、
画像メモリ12のディジタル画像から帳票サイズと文字
列1、文字列2、文字列3の3つの文字列が検出され
る。3つの文字列からはそれぞれ特徴量が抽出され、特
徴メモリ13へ書き込まれる。更に、特徴メモリ13か
らオペレータの与える帳票識別コードをインデックスと
して文字列(座標情報)に対応した特徴量が辞書メモリ
06へ書き込まれる。
【0054】次に、図6に示されるような具体例におけ
る記入済みの帳票Aを辞書登録する動作について説明す
る。先ず、図6の帳票A1がイメージスキャナ2から画
像入力部52を介して読込まれ、画像メモリ12に保持
される。特徴抽出部53では、画像メモリ12のディジ
タル画像から帳票サイズと文字列1、文字列2、文字列
3、文字列4、文字列5の5つの文字列が検出される。
5つの文字列からはそれぞれ特徴量が抽出され特徴量メ
モリ13へ書き込まれる。次に、図6の帳票A2が同様
にイメージスキャナ2から画像入力部52を介して読込
まれ、画像メモリ12に保持され、特徴抽出部53によ
って、帳票サイズと文字列1’、文字列2’、文字列
3’、文字列4’、文字列5’が検出され、特徴量メモ
リ13へ書き込まれる。次に、共通特徴抽出部55にお
いて、帳票A1と帳票A2に含まれる文字列が比較され
る。その結果、文字列1と文字列1’は位置情報と特徴
量が共に一致する。文字列2と文字列2’、文字列3と
文字列3’も同様である。しかしながら、文字列4と文
字列4’は位置情報は一致するものの文字パターンが異
なるため、特徴量の照合結果は一致しない。文字列5と
文字列5’も同様に位置情報は一致するが、特徴量の照
合結果は一致しない。よって、帳票Aの識別用の特徴量
は文字列1(文字列1’)、文字列2(文字列2’)、
文字列3(文字列3’)に限定されて辞書メモリ15へ
書き込まれる。
【0055】つまり、同一フォーマットの記入済み帳票
を複数枚用意することによって、辞書登録すべき文字列
をオペレータが指定する等の作業を必要とせず、未記入
帳票を用意するのと同様にオペレータの負担を増大させ
ることなく帳票識別用の特徴量の辞書登録ができる。
【0056】図5または図6の帳票を用いて登録された
辞書メモリ15を使って帳票識別を行う場合には、先
ず、処理対象の帳票がイメージスキャナ2から画像入力
部52を介して読込まれ、帳票の傾き補正と帳票周囲の
余白除去が行われた後に画像メモリ12に保持される。
特徴抽出部53では、画像メモリ12のディジタル画像
から帳票サイズと含まれている文字列が全て検出され
る。その後、辞書登録された帳票Aと帳票サイズが照合
された後、帳票サイズが一致値したなら、辞書登録され
ている帳票Aの文字列1、文字列2、文字列3の位置情
報および文字列パターンの特徴量がそれぞれ順に、処理
対象の帳票から検出された文字列の特徴量と照合され
る。その結果、文字列1,文字列2、文字列3の全てが
処理対象の帳票から検出された文字列と一致すれば、処
理対象の帳票は帳票Aであると判定される。
【0057】次に、本発明の第2の実施の形態について
図面を参照して説明する。図8を参照すると、本発明の
第2の実施の形態は、パソコン等の情報処理装置である
制御装置1と、帳票を読み出すイメージスキャナ2と、
制御装置1に文字等を入力するキーボード3と、制御装
置1の制御の下で表示を行う表示装置4(例えば、CR
T,LCD等)と、フロッピディスク装置であるFDD
5と、帳票識別プログラムを記録した記録媒体6とから
構成される。この記録媒体6は磁気ディスク、半導体メ
モリその他の記録媒体であってよい。この場合のFDD
5は、その記録媒体に対応した記憶制御装置となる。
【0058】すなわち、第2の実施の形態は、FDD5
と記録媒体6とが追加した点で第1の実施の形態で示す
図2と相違する。従って、制御装置1の内部の構成は、
図2の制御装置1の内部と同じなので説明を省略する。
【0059】次に、本発明の第2の実施の形態の動作に
ついて説明する。帳票識別プログラムを記録した記録媒
体6をFDD5に挿入し、制御装置1に内蔵されている
FDD読み出し用のプログラム(例えば、パソコンであ
れば、エクスプローラ)を実行すると、記録媒体6にあ
る帳票識別プログラムがプログラムメモリ16に読み込
まれる。すなわち、プログラムメモリ16に帳票識別プ
ログラムが格納されたことになり、これ以降の動作につ
いては、第1の実施の形態における動作と同じなので説
明を省略する。
【0060】以上説明したように、本発明は、帳票上の
文字を検出して特徴量に変換する際に、1つ1つの文字
に分解することなく文字列単位に検出するために、文字
切り出し誤りを修正するオペレータの作業負担を軽減す
ることができる。
【0061】また、本発明は、辞書登録に利用する帳票
が記入済みの帳票であった場合や、郵便振込帳票のよう
に帳票レイアウトが一部しか規定されていない場合で
も、特徴メモリの保持される複数組の文字列の特徴量か
ら各組共通の特徴量を抽出して辞書メモリに書き込むよ
うにしているため、オペレータの確認作業を軽減するこ
とができる。
【0062】また、本発明は、文字特徴を文字単位に分
解することなく文字列単位で文字列の特徴量を照合する
ため、文字単位のパターン分解が困難なサイズの小さな
文字も識別特徴として利用ができ、帳票識別精度が向上
する。
【0063】
【発明の効果】以上説明したようの、本発明の第1の効
果は、文字パターンの間隔が狭かったり、サイズの小さ
な文字でも帳票識別の特徴として辞書登録できるため、
認識精度が向上することにある。その理由は、文字パタ
ーンの照合を文字単位ではなく文字列単位に行うため、
文字列内で文字パターンを切り分けて検出する必要がな
いためである。また、本発明の第2の効果は、オペレー
タの作業負担を軽減できることにある。その理由は、第
1の効果で述べたように従来不可能であった間隔の狭い
文字パターンや小さい文字パターンの登録が可能になる
他、登録できない文字列が無くなるためと、記入済み帳
票を複数画像入力して共通な文字列での文字パターンを
抽出する手段を備えるため、プレ印字のみを自動的に選
択して辞書登録できるためである。オペレータが帳票識
別の特徴として登録する文字列を選択して指定する必要
がなくなる。
【図面の簡単な説明】
【図1】図2の制御部がプログラムメモリに格納されて
いる帳票識別プログラムを実行した場合の機能ブロック
レベルでの動作の流れを示す構成概略図である。
【図2】本発明の第1の実施の形態の構成を示すブロッ
ク図である。
【図3】図2の制御部が帳票登録モード時における動作
を示すフローチャートである。
【図4】図2の制御部が帳票識別モード時における動作
を示すフローチャートである。
【図5】未記入の帳票例を示した概略図である。
【図6】記入済みの帳票例を示した概略図である。
【図7】図2の特徴抽出部が帳票の文字列から特徴を抽
出する概要を示した概略図である。
【図8】本発明の第2の実施の形態の構成を示すブロッ
ク図である。
【図9】図2の画像入力部が帳票の傾きを補正して帳票
周囲の余白を除去する概要を示した概略図である。
【図10】図7の窓領域を「住」の位置で拡大した図で
ある。
【符号の説明】
1 制御装置 2 イメージスキャナ 3 キーボード 4 表示装置 5 FDD 6 記録媒体 11 制御部 12 画像メモリ 13 特徴量メモリ 14 制御メモリ 15 辞書メモリ 16 プログラムメモリ 17 インタフェース部 51 共通部 52 画像入力部 53 特徴抽出部 54 照合部 55 共通特徴抽出部 531 帳票サイズ検出部 532 文字列特徴検出部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 情報処理装置に帳票を識別させる帳票識
    別方法であって、入力された未記入の帳票のディジタル
    画像から文字列を検出し、その検出した文字列毎の座標
    情報を抽出し、さらにその文字列と同一の高さを持つ矩
    形状の特徴抽出範囲を制限する窓領域を文字列上で文字
    列に沿って移動させながら特徴量を抽出し、その抽出し
    た文字列の座標情報と特徴量とをメモリに登録すること
    で帳票識別フォーマットを作成することを特徴とする帳
    票識別方法。
  2. 【請求項2】 情報処理装置に帳票を識別させる帳票識
    別方法であって、入力された同一フォーマットで記入内
    容の異なる複数の記入済み帳票のディジタル画像から各
    々文字列を検出し、その検出した文字列毎の座標情報を
    抽出し、さらにその文字列と同一の高さを持つ矩形状の
    特徴抽出範囲を制限する窓領域を文字列上で文字列に沿
    って移動させながら特徴量を抽出し、その抽出した文字
    列毎の座標情報および特徴量が前記の入力された同一フ
    ォーマットで記入内容の異なる複数の記入済み帳票の全
    てで一致するか否かを比較照合し、その座標情報および
    特徴量が一致する文字列の座標情報と特徴量とをメモリ
    に登録することで帳票識別フォーマットを作成すること
    を特徴とする帳票識別方法。
  3. 【請求項3】 情報処理装置に帳票を識別させる帳票識
    別方法であって、入力された帳票のディジタル画像から
    文字列を検出し、その検出した文字列毎の座標情報と特
    徴量とを抽出し、その抽出した文字列の座標情報および
    特徴量とあらかじめ帳票の種別毎に登録された文字列の
    座標情報および特徴量とを比較することで帳票の種別を
    識別することを特徴とする帳票識別方法。
  4. 【請求項4】 情報処理装置に帳票を識別させる帳票識
    別方法であって、新しいフォーマットで未記入の帳票を
    入力した場合に、入力された帳票のディジタル画像を第
    1のメモリに保持する第1の保持ステップと、前記第1
    のメモリに保持されたディジタル画像から帳票サイズを
    測定するサイズ測定ステップと、前記第1のメモリに保
    持されたディジタル画像から文字列を検出してその検出
    した文字列の座標情報を算出し、さらにその文字列と同
    一の高さを持つ矩形状の特徴抽出範囲を制限する窓領域
    を文字列上で文字列に沿って移動させながら特徴量を算
    出する特徴量算出ステップと、その算出した座標情報と
    特徴量とを第2のメモリに保持する第2の保持ステップ
    と、文字列の存在がなくなるまで前記特徴量算出ステッ
    プと前記第2の保持ステップとを繰り返す第1の繰返し
    ステップと、前記第1の繰返しステップが終了すると前
    記第1のメモリに保持された帳票サイズと前記第2のメ
    モリに保持された全ての文字列の座標情報毎の特徴量と
    を第3のメモリに登録する登録ステップとを含むことを
    特徴とする帳票識別方法。
  5. 【請求項5】 情報処理装置に帳票を識別させる票識別
    方法であって、フォーマットに記入された帳票を入力し
    た場合に、入力された帳票のディジタル画像を第1のメ
    モリに保持する第1の保持ステップと、前記入力された
    帳票の識別を行うための識別コードを発生する発生ステ
    ップと、前記第1のメモリに保持されたディジタル画像
    から帳票サイズを測定するサイズ測定ステップと、前記
    第1のメモリに保持されたディジタル画像から文字列を
    検出してその検出した文字列の座標情報を算出し、さら
    にその文字列と同一の高さを持つ矩形状の特徴抽出範囲
    を制限する窓領域を文字列上で文字列に沿って移動させ
    ながら特徴量を算出する特徴量算出ステップと、その算
    出した座標情報と特徴量とを第2のメモリに前記識別コ
    ードを基に保持する第2の保持ステップと、文字列の存
    在がなくなるまで前記特徴量算出ステップと前記第2の
    保持ステップとを繰り返す第1の繰返しステップと、前
    記第1の繰返しステップ終了後に前記入力された帳票と
    同一のフォーマットで記入された帳票が入力されると、
    前記発生ステップと前記サイズ測定ステップと前記特徴
    量算出ステップと前記第2の保持ステップと前記第1の
    繰返しステップとを繰り返す第2の繰返しステップと、
    前記第2の繰返しステップ終了後に前記第2のメモリに
    保持されたある識別コードにある文字列の座標情報が前
    記第2のメモリに保持された別の識別コードにある文字
    列の座標情報と一致するかを全て比較する比較ステップ
    と、前記比較ステップで一致するものがあれば、一致し
    た座標情報に該当する特徴量との類似度を算出してあら
    かじめ決められた値以上であれば一致したものとして文
    字列の座標情報と特徴量を全て抽出する抽出ステップ
    と、抽出が終わると抽出した全ての文字列の座標情報毎
    の特徴量と前記第2のメモリに書き込まれた帳票サイズ
    とを第3のメモリに登録する登録ステップとを含むこと
    を特徴とする帳票識別方法。
  6. 【請求項6】 情報処理装置に帳票を識別させる帳票識
    別方法であって、フォーマットに記入された帳票を入力
    した場合に、入力された帳票のディジタル画像を第1の
    メモリに保持する第1の保持ステップと、前記第1のメ
    モリに保持されたディジタル画像から帳票サイズを測定
    するサイズ測定ステップと、前記第1のメモリに保持さ
    れたディジタル画像から文字列を検出してその検出した
    文字列の座標情報を算出し、さらにその文字列と同一の
    高さを持つ矩形状の特徴抽出範囲を制限する窓領域を文
    字列上で文字列に沿って移動させながら特徴量を算出す
    る特徴量算出ステップと、その算出した座標情報と特徴
    量とを第2のメモリに保持する第2の保持ステップと、
    文字列の存在がなくなるまで前記特徴量算出ステップと
    前記第2の保持ステップとを繰り返す第1の繰返しステ
    ップと、前記第1の繰返しステップが終了後に前記第2
    のメモリに保持された文字列の座標と,前記第2のメモ
    リに保存されている帳票サイズと同じ帳票サイズで第3
    のメモリに登録されている帳票の文字列の座標情報とを
    比較する比較ステップと、前記比較ステップで一致した
    場合に文字列の特徴量同士の類似度を算出してあらかじ
    め決められた値以上であれば文字列が一致したと判断し
    て帳票の種別を識別する識別ステップとを含むことを特
    徴とする帳票識別方法。
  7. 【請求項7】 コンピュータに処理させるための帳票を
    識別する帳票識別プログラムであって、新しいフォーマ
    ットで未記入の帳票を入力した場合に、入力された帳票
    のディジタル画像を第1のメモリに保持する第1の保持
    ステップと、前記第1のメモリに保持されたディジタル
    画像から帳票サイズを測定するサイズ測定ステップと、
    前記第1のメモリに保持されたディジタル画像から文字
    列を検出してその検出した文字列の座標情報を算出し、
    さらにその文字列と同一の高さを持つ矩形状の特徴抽出
    範囲を制限する窓領域を文字列上で文字列に沿って移動
    させながら特徴量を算出する特徴量算出ステップと、そ
    の算出した座標情報と特徴量とを第2のメモリに保持す
    る第2の保持ステップと、文字列の存在がなくなるまで
    前記特徴量算出ステップと前記第2の保持ステップとを
    繰り返す第1の繰返しステップと、前記第1の繰返しス
    テップが終了すると前記第1のメモリに保持された帳票
    サイズと前記第2のメモリに保持された全ての文字列の
    座標情報毎の特徴量とを第3のメモリに登録する登録ス
    テップとを含む処理を前記コンピュータに実行させるこ
    とを特徴とする帳票識別プログラム。
  8. 【請求項8】 コンピュータに処理させるための帳票を
    識別する帳票識別プログラムであって、フォーマットに
    記入された帳票を入力した場合に、入力された帳票のデ
    ィジタル画像を第1のメモリに保持する第1の保持ステ
    ップと、前記入力された帳票の識別を行うための識別コ
    ードを発生する発生ステップと、前記第1のメモリに保
    持されたディジタル画像から帳票サイズを測定するサイ
    ズ測定ステップと、前記第1のメモリに保持されたディ
    ジタル画像から文字列を検出してその検出した文字列の
    座標情報を算出し、さらにその文字列と同一の高さを持
    つ矩形状の特徴抽出範囲を制限する窓領域を文字列上で
    文字列に沿って移動させながら特徴量を算出する特徴量
    算出ステップと、その算出した座標情報と特徴量とを第
    2のメモリに前記識別コードを基に保持する第2の保持
    ステップと、文字列の存在がなくなるまで前記特徴量算
    出ステップと前記第2の保持ステップとを繰り返す第1
    の繰返しステップと、前記第1の繰返しステップ終了後
    に前記入力された帳票と同一のフォーマットで記入され
    た帳票が入力されると、前記発生ステップと前記サイズ
    測定ステップと前記特徴量算出ステップと前記第2の保
    持ステップと前記第1の繰返しステップとを繰り返す第
    2の繰返しステップと、前記第2の繰返しステップ終了
    後に前記第2のメモリに保持されたある識別コードにあ
    る文字列の座標情報が前記第2のメモリに保持された別
    の識別コードにある文字列の座標情報と一致するかを全
    て比較する比較ステップと、前記比較ステップで一致す
    るものがあれば、一致した座標情報に該当する特徴量と
    の類似度を算出してあらかじめ決められた値以上であれ
    ば一致したものとして文字列の座標情報と特徴量を全て
    抽出する抽出ステップと、抽出が終わると抽出した全て
    の文字列の座標情報毎の特徴量と前記第2のメモリに書
    き込まれた帳票サイズとを第3のメモリに登録する登録
    ステップとを含む処理を前記コンピュータに実行させる
    ことを特徴とする帳票識別プログラム。
  9. 【請求項9】 コンピュータに処理させるための帳票を
    識別する帳票識別プログラムであって、フォーマットに
    記入された帳票を入力した場合に、入力された帳票のデ
    ィジタル画像を第1のメモリに保持する第1の保持ステ
    ップと、前記第1のメモリに保持されたディジタル画像
    から帳票サイズを測定するサイズ測定ステップと、前記
    第1のメモリに保持されたディジタル画像から文字列を
    検出してその検出した文字列の座標情報を算出し、さら
    にその文字列と同一の高さを持つ矩形状の特徴抽出範囲
    を制限する窓領域を文字列上で文字列に沿って移動させ
    ながら特徴量を算出する特徴量算出ステップと、その算
    出した座標情報と特徴量とを第2のメモリに保持する第
    2の保持ステップと、文字列の存在がなくなるまで前記
    特徴量算出ステップと前記第2の保持ステップとを繰り
    返す第1の繰返しステップと、前記第1の繰返しステッ
    プが終了後に前記第2のメモリに保持された文字列の座
    標と,前記第2のメモリに保存されている帳票サイズと
    同じ帳票サイズで第3のメモリに登録されている帳票の
    文字列の座標情報とを比較する比較ステップと、前記比
    較ステップで一致した場合に文字列の特徴量同士の類似
    度を算出してあらかじめ決められた値以上であれば文字
    列が一致したと判断して帳票の種別を識別する識別ステ
    ップとを含む処理を前記コンピュータに実行させること
    を特徴とする帳票識別プログラム。
  10. 【請求項10】 帳票を入力するとディジタル画像に変
    換する入力装置と、帳票の識別処理を行う制御装置とを
    備えた帳票を識別する帳票識別方式において、前記制御
    装置は、前記入力装置から読み取った帳票のディジタル
    画像を格納する画像入力手段と、画像入力手段により保
    持された前記帳票のディジタル画像から帳票のサイズを
    検出すると共に文字パターンを文字列単位で検出して文
    字列単位で特徴量へ変換して保持する特徴抽出手段と、
    前記入力する帳票のフォーマットを登録する場合には前
    記特徴抽出手段から出力される複数組みの文字列の特徴
    量から各組共通の特徴量を抽出して辞書メモリに登録す
    る共通特徴抽出手段と、前記入力する帳票のフォーマッ
    トの識別を行う場合には前記特徴抽出手段から出力され
    る処理対象の帳票の文字列の特徴量とあらかじめ前記辞
    書メモリに帳票毎に保持された文字列の特徴量とを照合
    する照合手段とを有することを特徴とする帳票識別方
    式。
JP2001093160A 2001-03-28 2001-03-28 帳票識別方法、帳票識別プログラム、および帳票識別方式 Pending JP2002288675A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001093160A JP2002288675A (ja) 2001-03-28 2001-03-28 帳票識別方法、帳票識別プログラム、および帳票識別方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001093160A JP2002288675A (ja) 2001-03-28 2001-03-28 帳票識別方法、帳票識別プログラム、および帳票識別方式

Publications (1)

Publication Number Publication Date
JP2002288675A true JP2002288675A (ja) 2002-10-04

Family

ID=18947528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001093160A Pending JP2002288675A (ja) 2001-03-28 2001-03-28 帳票識別方法、帳票識別プログラム、および帳票識別方式

Country Status (1)

Country Link
JP (1) JP2002288675A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011033857A1 (ja) * 2009-09-17 2011-03-24 日本電気株式会社 画像処理装置、画像処理方法、区分機およびプログラム
JP2012063822A (ja) * 2010-09-14 2012-03-29 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2017005307A (ja) * 2015-06-04 2017-01-05 キヤノン株式会社 情報処理装置、その制御方法及びコンピュータプログラム
KR102187554B1 (ko) * 2019-08-27 2020-12-07 주식회사 한글과컴퓨터 스프레드시트 상에서 지정된 두 영역 간의 유사도 측정이 가능한 전자 장치 및 그 동작 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011033857A1 (ja) * 2009-09-17 2011-03-24 日本電気株式会社 画像処理装置、画像処理方法、区分機およびプログラム
JP2012063822A (ja) * 2010-09-14 2012-03-29 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2017005307A (ja) * 2015-06-04 2017-01-05 キヤノン株式会社 情報処理装置、その制御方法及びコンピュータプログラム
KR102187554B1 (ko) * 2019-08-27 2020-12-07 주식회사 한글과컴퓨터 스프레드시트 상에서 지정된 두 영역 간의 유사도 측정이 가능한 전자 장치 및 그 동작 방법

Similar Documents

Publication Publication Date Title
US7567730B2 (en) Detecting an orientation of characters in a document image
US7926732B2 (en) OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
US6614929B1 (en) Apparatus and method of detecting character writing area in document, and document format generating apparatus
CN101226594B (zh) 图案分离提取装置和图案分离提取方法
CN114663897B (zh) 表格提取方法与表格提取系统
US20110286669A1 (en) Form processing system, ocr device, form creation device, and computer readable medium
CN111860450A (zh) 票证识别装置以及票证信息管理系统
JP4594952B2 (ja) 文字認識装置及び文字認識方法
CN104809099A (zh) 文档文件生成装置及文档文件生成方法
JP7076772B2 (ja) 認証システムおよび認証方法
JP5094682B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2003018393A (ja) 画像処理システム
JP3733310B2 (ja) 文書書式識別装置および識別方法
JP2002288675A (ja) 帳票識別方法、帳票識別プログラム、および帳票識別方式
JPH07168910A (ja) 文書レイアウト解析装置及び文書フォ−マット識別装置
CN116682118A (zh) 一种古文字识别方法、系统、终端及介质
JP2004504650A (ja) フォーム認識及びデジタル化画像処理のための方法及びシステム
JP2001126010A (ja) 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP4792117B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP4958868B2 (ja) 文書特徴量抽出装置及び方法
US20110135162A1 (en) Image processing apparatus, image processing method and recording medium
US20250014361A1 (en) Methods and systems for detecting stamps in scanned documents
JPH08123904A (ja) 書体種類処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050207

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050315

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050405