[go: up one dir, main page]

JPH06290251A - 電子ファイル装置の文書画像処理方法 - Google Patents

電子ファイル装置の文書画像処理方法

Info

Publication number
JPH06290251A
JPH06290251A JP5073348A JP7334893A JPH06290251A JP H06290251 A JPH06290251 A JP H06290251A JP 5073348 A JP5073348 A JP 5073348A JP 7334893 A JP7334893 A JP 7334893A JP H06290251 A JPH06290251 A JP H06290251A
Authority
JP
Japan
Prior art keywords
document
image
memory
index
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5073348A
Other languages
English (en)
Inventor
Kazuyuki Kodama
和行 児玉
Tatsuya Murakami
達也 村上
Yoshitsugu Ikuno
尚嗣 生野
Hidekazu Hatano
英一 羽田野
Masaaki Fujinawa
雅章 藤縄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5073348A priority Critical patent/JPH06290251A/ja
Publication of JPH06290251A publication Critical patent/JPH06290251A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Storing Facsimile Image Data (AREA)

Abstract

(57)【要約】 【目的】 文書イメージからインデックスを認識するこ
とにより、大量の文書を自動的に登録する電子ファイリ
ング装置に関し、特に守秘項目が存在する文書を対象と
し、守秘項目をマスクした画像表示などの出力を行なう
ための文書画像処理方法を提供する。 【構成】 登録においては、あらかじめ作成した書式情
報を利用して文書構造を解析し、守秘項目の記載領域を
抽出して、その座標値を、画像データとともに光ディス
クなどの大容量のメモリへ格納する。文書イメージを使
用する際には、守秘項目領域に対応した画像マスクパタ
ーンを生成し出力する。また、インデックス修正に際し
ては、守秘項目領域の座標値を読み出し、該領域に対応
した画像マスクパターンを生成し、画像データと該マス
クパターンとの論理演算をした後、ディスプレイなどに
出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書イメージからイン
デックスを認識することにより、大量の文書を自動的に
登録する電子ファイル装置に関する。特に守秘項目が存
在する文書を対象とし、誤認識したインデックスを修正
する上で、守秘項目をマスクした画像表示をするに好適
な文書画像処理方法に関する。
【0002】
【従来の技術】文書自動登録を目的とした従来技術とし
て、例えば、特開昭61−59568号公報記載の「文
書理解方式」では、文書画像から枠部分を抽出して書式
情報を作成し、書式情報を用いて文書上の文字を読み取
る方式が開示されている。また、特開昭60−1016
81号公報記載の「文字読取方式」では、文字記入欄毎
に記述した書式情報を利用して認識方式を制御すること
により、多様な字種の存在する文書の認識精度を高める
技術が開示されている。
【0003】また、機密保護に関しては、例えば、特開
昭61−285578号公報記載の「フアリング方式」
では、文書画像全面に網かけ等特定のパターンを重畳し
て出力する方式が開示されている。
【0004】
【発明が解決しようとする課題】しかしながら、自動登
録した文書を精度良く検索するために、認識結果を修正
しておく必要があり、この修正作業は、登録文書数の増
加、文書書式の多様化にともない、文書管理部門以外で
行なう場合が多くなっている。ここに、多様な書式を有
する文書を対象として、インデックス記載領域の画像は
鮮明に、部外秘項目記載領域の画像はマスクして(覆い
隠して)表示する必要が新たに生じている。
【0005】本発明は、上記事情に鑑みてなされたもの
で、その目的とするところは、文書イメージからインデ
ックスを認識することにより、大量の文書を自動的に登
録する電子ファイル装置に関し、特に守秘項目が存在す
る文書を対象として、守秘項目記載領域をマスクして出
力する文書画像処理方法を提供することにある。さら
に、誤認識したインデックスを修正する上で、守秘項目
領域のみをマスクして出力する文書画像処理方法を提供
することにある。
【0006】
【課題を解決するための手段】本発明による文書画像処
理方法は、帳票に代表される表形式の文書を電子ファイ
ル装置へ自動的に登録する方法、および登録した文書を
表示する方法ものである。
【0007】具体的には、紙面上の文書イメージを光
電変換するスキャナと、該変換されたイメージを一時
記憶する第一のメモリと、該メモリに記憶されたイメ
ージ情報から文書の書式を同定して、インデックス記載
領域および守秘項目記載領域を抽出する文書構造解析部
と、上記インデックス記載領域のイメージ情報を第一
のメモリから読み出し、文字パターンを認識してテキス
トコードに変換するとともに、該パターン認識の類似度
を出力する文字認識部と、多数の文書イメージとその
インデックスを格納する大容量の第二のメモリとを具備
した電子ファイル装置であって、(a)上記第一のメモリ
に記憶された文書イメージと、文書構造解析で抽出した
インデックス記載領域および守秘項目記載領域の位置情
報と、文字認識したインデックスのテキストコード(と
類似度)を関連付けて第二のメモリへ格納し、(b)格納
した文書イメージを使用するに際し、守秘項目記載領域
の位置情報に対応した画像マスクパターンを生成し、該
領域を覆い隠した文書イメージの表示あるいは印刷を行
なう、または、(b)'格納した文書イメージを用いてイ
ンデックスを修正するに際し、類似度があらかじめ設定
した値以下の文書データを第二のメモリから検索して読
み出し、守秘項目記載領域の位置情報に対応した画像マ
スクパターンを生成し、該領域を覆い隠した文書イメー
ジの表示あるいは印刷を行なう、ことを特徴とする。
【0008】
【作用】本発明による文書画像処理方法の代表的な作用
は、以下の通りである。まず、登録においては、あらか
じめ作成した書式情報を利用して文書構造を解析し、守
秘項目の記載領域を抽出して、その座標値を、画像デー
タとともに第二メモリへ格納する。
【0009】次に、文書イメージの使用に際しては、守
秘項目記載領域の位置情報に対応した画像マスクパター
ンを生成し、その領域を覆い隠した文書イメージの表示
あるいは印刷を行なう。
【0010】また、インデックス修正のための表示で
は、第二メモリへ格納された守秘項目記載領域の座標値
を読み出し、該領域に対応した画像マスクパターンを生
成し、画像データと該マスクパターンとの論理演算をし
た後、ディスプレイに表示する。この方法により、登録
対象とする文書の書式が相違しても、守秘領域のみを覆
い隠した画像の表示が可能になる。
【0011】
【実施例】以下、本発明の実施例を図面により詳細に説
明する。まず、図8に、電子ファイル装置(電子ファイ
リング装置ともいう)への自動登録の対象とする文書の
書式例を示す。同図は報酬明細書の例で、罫線Lx、L
y等で囲まれた領域F1、F2、F4、およびFnに
は、文書のインデックス、換言すれば文書検索のキーワ
ードになる項目f1、f2、f4、およびfnが記載さ
れている。具体的には、f1は「報酬明細書平成5年3
月分」等の日付、f2は被報酬者の個人識別番号、f4
は従事日数、fnは合計金額である。領域F3には、報
酬支払関係者以外には見せてはならない守秘項目f3
(被報酬者氏名)が記載されている。また、本報酬明細
書には、発行事業所毎に領域Fの位置および大きさが少
しずつ相違している、項目fの書体が異なるという特徴
がある。
【0012】次に、図9を用いて、本発明が適用される
文書自動登録機能を有する電子ファイリング装置の構成
を説明する。同図中、SCNは、図8で示した書式の文
書を1インチ当たり200または400ドットの画素数
で光学的に読み取り、1画素当たり1ビットに2値化し
て画像を出力するイメージスキャナを示す。SCCは、
後述するマイクロプロセッサμPの命令により、スキャ
ナSCNとバスとを接続する制御部を示す。
【0013】MMはメインメモリを示し、マイクロプロ
セッサのプログラムを蓄え、スキャナから出力された画
像データ等を一時的に蓄える。MMは4MB(メガバイ
ト)の半導体メモリで構成されている。
【0014】FORは、文書構造解析部を示し、スキャ
ナから入力した画像データの罫線の長さ、始点座標等の
特徴を分析し、磁気ディスクDKにあらかじめ蓄積した
書式情報と照合することにより入力文書の書式を同定
し、インデックス記載領域の座標値を求める。OCR
は、文字認識部を示し、上記FORで求めたインデック
ス記載領域の座標値に基づいて画像データを切り出し、
その領域内の文字パターンを認識してテキストデータに
変換する。
【0015】IPUは、画像処理プロセッサを示し、
メインメモリMMから読み出された2値画像を、MMR
符号化方式を用いて圧縮し、光ディスクに転送する、
逆に、圧縮した画像を伸張し、表示用ビットマップメモ
リへ送出する、画像を部分的にマスクする(覆い隠
す)パターンを生成する、伸張した画像データとマス
クパターンとのオア演算をする、といった画像処理機能
を有する。
【0016】ODは、1枚当たり600MBの記憶容量
を持つ光ディスクとその駆動装置を示し、スキャナS
CNから入力され、画像処理プロセッサIPUで圧縮さ
れた画像データと、文字認識部OCRでテキストデー
タに変換された文書インデックス、すなわち文書検索用
のキーワードを関連付けて蓄積する。ODCは、マイク
ロプロセッサμPの命令に応じて、光ディスクODの読
み出し/書き込み制御を行なう光ディスク制御部であ
り、最大100枚の光ディスクを制御することができ
る。なお、スキャナSCNで読み取った文書画像データ
は効率良く圧縮されるので、1枚の光ディスクに3万枚
程度の文書を登録することが可能である。
【0017】マイクロプロセッサμPは、キーボードK
Bから入力されるユーザの処理要求に応じて、スキャナ
SCN、文書構造解析部FOR、文字認識部OCR,画
像処理プロセッサIPU、光ディスクOD等の動作を制
御する。BUSは、32ビット幅のデータバスである。
CRTは、装置の操作ガイダンス、文書インデックス、
および文書画像を表示するディスプレイである。BM
は、ビットマップメモリで、CRTに表示する画像デー
タが蓄えられる。DCは、マイクロプロセッサμPの表
示データと画像処理プロセッサIPUから出力される画
像データとを合成してビットマップメモリBMへ書き込
む表示制御部を示す。KBは装置への処理要求、検索条
件等を入力するためのキーボード、KBCはキーボード
制御部である。
【0018】次に、文書登録時に、光ディスクの所定の
セクタに書込まれるキーワード情報の構成を図10に示
す。図は、1文書当たりのキーワード情報を示したもの
で、情報の長さKは512B(バイト)である。文書の
インデックス、すなわちキーワードは、いくつかの項目
(項目K1、項目K2、…、項目Kn)について付与す
ることができる。これらの項目の例としては、報酬明細
書の場合には、日付、個人番号、従事日数、合計金額等
が挙げられる。キーワード構成情報フィールドPには、
項目数、各項目名、各項目のデータ長が書かれ、各項目
フィールドQには、文字認識部OCRの出力であるキー
ワードが書込まれる。光ディスク管理情報フィールドR
には、文書画像データが蓄積された番地と画像データ長
が書かれる。
【0019】本発明による文書画像自動登録、修正表
示、および検索表示方法を図1〜図7を用いて説明す
る。特徴は、登録においては、文書構造解析により求
めた守秘項目記載領域の座標値を、画像データおよび文
字認識部で認識したインデックスとともに光ディスクに
蓄積し、修正・検索表示では、光ディスクから読み出
した画像の守秘項目記載領域をマスクして表示すること
により、守秘部分の適正な表示を実現したものである。
以下、登録、修正、および検索方法毎に詳細に説明す
る。
【0020】(1)文書自動登録方法 まず、図6に、書式情報を示す。書式情報は、入力され
た文書の書式を同定し、各項目が記載された領域の座標
値等を求める上で必要である。図は、書式を定量的に記
述する方法を示したもので、文書インデックスが記載さ
れた領域、および守秘項目が記載された領域を(Xij,
Yij)、ΔXij、ΔYijで、各項目の属性をaij、sij
で記述する。ここに、 (Xij,Yij):領域Fiを形成する罫線の始点座標の値 ΔXij :領域Fiを形成する罫線のX方向の長さ ΔYij :領域Fiを形成する罫線のY方向の長さ aij :領域Fiに記載された項目fiの文字の
種類が 機械書き数字のとき、aij=0 機械書き漢字のとき、aij=1 手書き数字のとき、 aij=2 手書き漢字のとき、 aij=3 (機械とは、ワードプロセッサ等を言う) sij :領域Fiに記載された項目fiが 守秘項目でないとき、sij=0 守秘項目のとき、 sij=1 である。なお、添字jは、書式番号を表わす。これは、
報酬明細書の発行事業所毎に書式、すなわち領域Fiの
位置および大きさ、項目fiの文字の書体が相違するた
めである。
【0021】このようにして、図7に示すように、いく
つかの書式(書式1〜m)に対して書式情報をあらかじ
め作成し、書式情報ファイルとして磁気ディスクに用意
しておく。
【0022】次に、図1により、文書画像の登録方法を
説明する。同図で、キーボードKBから「文書登録」要
求が入力されると、 手順JINTで、マイクロプロセッサμPは、入力文
書番号jを1に設定し、次の手順SCNでスキャナを起
動する。スキャナは、手順IMGで文書画像を光学的に
読み取り、2値化する。μPは、画像データimgjを
メインメモリMM上のM1番地に書き込む。
【0023】次に、手順FORで、文書構造解析部
は、画像データimgjの罫線の長さ、始点座標等の特
徴を分析し、磁気ディスクDKにあらかじめ用意した書
式情報TFORと照合することにより入力文書の書式を
同定し、該当した書式mの項目記載領域の座標データ
(Xim,Yim)、ΔXim、およびΔYim(これらを総称し
てsecijと言う)と、項目の属性データaim、sim
(それぞれaij、sijと言う)をメインメモリのM2番
地に転送する。
【0024】書式同定の具体的な方法は、 a)入力画像imgjに存在する連続した黒画素を追跡
し、閉じた罫線枠を抽出する。 b)該罫線枠の始点座標(Xk,Yk)と、長さΔXk、Δ
Ykを求める。 c)書式情報ファイルから((Xim,Yim)、ΔXim、Δ
Yim)を読み出す。 d)各書式ごとに、((Xk,Yk)、ΔXk、ΔYk)と
((Xim,Yim)、ΔXim、ΔYim)を対応付ける。すな
わち、すべての領域iに対して
【0025】
【数1】 min[(Xim−Xk)2+(Yim−Yk)2] …(数1) k(k=1〜n) となるkを求め、領域kの((Xk,Yk)、ΔXk、ΔYk)
を((Xi,Yi)、ΔXi、ΔYi)に置き換える。 e)次に、各書式に対して、
【0026】
【数2】
【0027】
【数3】
【0028】
【数4】 ΔPm=ΔNm+ΔLm …(数4) を計算する。 f)数4のΔPmを最小とする書式mが、入力された文
書の書式と同一である。
【0029】g)書式mの((Xim,Yim)、ΔXim、Δ
Yim)、aim、およびsimを書式情報ファイルから読み
出し、メインメモリへ転送する。
【0030】次に、手順SECで、文字認識部は、s
ij=0(領域iが守秘項目でない)ならば、上記FOR
により求めたインデックス記載領域の座標データsec
ijで規定される範囲の画像データをメインメモリのM1
番地から読み出し(画像切り出し)、手順OCRで、該
画像中の文字パターンを認識してテキストデータind
ijに変換する(文字認識)。OCRでは、同時に、パ
ターン照合の類似度likijも出力する。
【0031】なお、文字認識では、項目の属性データa
ijに基づいて、最適な認識方式を選択駆動することによ
り、認識精度の向上を図ることが可能である。
【0032】手順FILでは、画像データimgjを
メインメモリのM1番地から読み出し、画像処理プロセ
ッサIPUで圧縮した後、光ディスクODに蓄積(ファ
イリング)する。各項目記載領域の座標データseci
j、守秘項目であるか否かの情報sijも画像データと同
様に光ディスクに蓄積する。上述OCRの出力であるイ
ンデックステキストデータindij、および類似度l
ikijは、光ディスクのキーワードフィールド(図1
0でK1、K2、…、Kn)に書き込む。
【0033】なお、手順IINT、IEND、および
IINCは、一文書について所定数の領域の画像切り出
し、および文字認識処理を繰り返して行なうことを示
す。また、手順JINT、JEND、およびJINC
は、スキャナにセットされたすべての文書に対して、S
CNからFILまでの一連の登録処理を繰り返して行な
うことを示す。
【0034】(2)文書インデックス修正表示方法 一般に、自動登録では、インデックス記載領域の文字パ
ターンを認識してテキストデータに変換し、光ディスク
に検索用キーワードとして書き込む。しかし、文字を1
00%正しく認識することは非常に困難であるので、精
度の高い検索を行なうためには、認識結果を修正してお
く必要がある。修正は、原画像と認識結果とを同時に表
示し、両者を見比べながら、誤認識文字については、キ
ーボードから正しい文字を入力することにより行なう
が、登録する文書数が膨大なため、修正作業を文書管理
部門以外の専門部に依頼する場合が多く、守秘項目はマ
スクして画像表示する必要が生じている。
【0035】図2により、文書インデックス(検索用キ
ーワード)修正のための、画像表示方法を説明する。同
図で、キーボードKBから「修正開始」要求を入力した
後、 手順THINで、修正者はKBから類似度閾値Lth
を入力する。これは、認識誤りの可能性が大きいインデ
ックスほど、類似度が低いという事実を利用して、修正
が必要な文書を選定するためである。
【0036】次に、手順SRHで、光ディスクのキー
ワードフィールド(図10、Ki)から、類似度lik
ijを読み出し、
【0037】
【数5】 likij≦Lth …(数5) なる文書を検索する。
【0038】手順PATでは、キーワード情報の光デ
ィスク管理情報フィールドRを参照することにより、s
ij=1なる領域(守秘項目が記載されている領域)の座
標データsecijを光ディスクODから読み出し、該領
域部分のみ”0”の値を持つマスクパターンを生成す
る。
【0039】手順MSKおよびDSPで、ODから文
書全体の画像データimgjを読み出して画像処理プロ
セッサで伸張し、上記マスクパターンを重畳してディス
プレイに表示する。
【0040】具体的には、Imgjを伸張後の原画像、
Mijをマスクパターン(secij、 すなわち(Xim,
Yim)、ΔXim、およびΔYimで規定される範囲はMij
=0、 以外の範囲ではMij=1)として、
【0041】
【数6】 Dspj=Imgj∧Mij …(数6) を演算し(∧は論理積演算子を表わす)、Dspjを表示
する。また、守秘領域が複数ある場合には、
【0042】
【数7】 Dspj=((Imgj∧M1j)∧M2j)∧M3j … …(数7) を表示する。
【0043】以上の手順による表示画面例を、図4に示
す。図で、CRTはディスプレイ画面を、WINは画像
表示用のウィンドウを示す。DOCは数6の演算による
文書画像Dspjを表示した結果である。領域F3に守
秘項目が記載されている場合で、F3の領域をマスク
し、文字f3を覆い隠して表示している。
【0044】ここでは省略したが、別なウィンドウに
は、項目f1、f2、f4、およびfnをOCRで認識
した結果(indij)と、KBから入力した修正文字
列を表示する。
【0045】図2手順REVでは、修正者は図4の画
面を見ながら認識誤りがある場合は文書インデックスを
修正する。手順ENTでは、修正したインデックスを再
びODのキーワードフィールドに書き込む(旧インデッ
クスを書き替える)。
【0046】手順JINT、JEND、およびJIN
Cにより、likij≦Lthなる文書がODに存在し
なくなるまで、SRHからENTまでの一連の修正処理
を繰り返す。
【0047】(3)文書検索表示方法 図3により、文書検索での画像表示方法を説明する。同
図で、キーボードKBから「検索開始」要求を入力した
後、 手順PWINで、使用者はKBからパスワードPWを
入力する。
【0048】手順TMINで、使用者はKBから検索
ターム(検索条件)TMを入力する。
【0049】次に、手順SRHでは、光ディスクのキ
ーワードフィールド(図10でK1、K2、…、Kn)
を読み出し、検索タームTMに一致するインデックスを
持つ文書、すなわち、
【0050】
【数8】 indij=TM …(数8) なる文書を検索する。
【0051】手順PCHKでは、PWINで入力され
たパスワードPWと、あらかじめ電子ファイリング装置
に検索者登録したパスワードPWoとを照合し、それら
が一致すれば手順IMG、手順DSPにより文書画像表
示する。この手順による表示画面を図5に示す。同図
で、文書画像DOCは、守秘領域をマスクせずに、 全
領域を表示している。
【0052】PW≠PWoの場合は、手順PAT、MS
K、およびDSPにより、図4と同様に守秘領域をマス
クした表示を行なう。方法は、前述した修正表示と同一
である。
【0053】手順SENDで、検索終了がKBから入
力されない場合は、手順TWINに戻って、次の文書検
索処理を行なう。
【0054】なお、以上の実施例においては、電子ファ
イリング装置に自動登録して、修正検索する文書とし
て、報酬明細書を取り挙げ、書式(項目記載領域の位
置、大きさ等)が少しずつ相違している文書例を説明し
たが、書式情報は登録する文書に対応して作成するの
で、表形式文書であるならば報酬明細書、履歴書、勤務
表等、様式の相違する文書が混在してもよい。
【0055】また、メインメモリに格納し、画像マスク
に用いる守秘項目記載領域の座標値は、書式情報ファイ
ルの値ではなく、文書構造解析値(図1で説明した、手
順b)における((Xk,Yk)、ΔXk、ΔYk))であっ
てもよい。さらに、書式情報ファイルの値による領域
と、文書構造解析値による領域の和であってもよい。
【0056】
【発明の効果】以上述べた如く、本発明によれば、電子
ファイリング装置において表形式文書を自動登録し、修
正表示、および検索する上で、 登録においては、文書構造解析で抽出した守秘項目記
載領域の座標値を、画像データおよび文字認識部で認識
したインデックスとともに光ディスクに蓄積し、 修正・検索では、光ディスクから読み出した画像デー
タの守秘項目記載領域は上記座標値にもとづいてマスク
し、該領域以外は原画像の状態で表示するので、文書書
式が相違しても、守秘項目記載領域のみをマスクして表
示できるという効果を奏するものである。
【図面の簡単な説明】
【図1】本発明の実施例における文書画像の登録方法を
示す図。
【図2】実施例における文書インデックス修正のための
画像表示方法を示す図。
【図3】実施例における文書検索での画像表示方法を示
す図。
【図4】実施例における守秘領域をマスクした文書画像
の表示画面を示す図。
【図5】実施例における文書画像の全領域を表示した画
面を示す図。
【図6】実施例における書式を定量的に記述した、書式
情報を示す図。
【図7】実施例における書式情報ファイルを示す図。
【図8】電子ファイリング装置で自動登録の対象とする
文書の書式例を示す図。
【図9】本発明が適用される文書自動登録機能を有する
電子ファイリング装置の構成を示す図。
【図10】本発明が適用される電子ファイリング装置で
の光ディスクのキーワード情報の構成を示す図。
【符号の説明】
SCN…スキャナ、FOR…文書構造解析部、OCR…
文字認識部、IPU…画像処理プロセッサ、OD…光デ
ィスク、DK…磁気ディスク、MM…メインメモリ、μ
P…マイクロプロセッサ、Fi…インデックスまたは守
秘項目記載領域、fi…インデックスまたは守秘項目、
secij…インデックスまたは守秘項目記載領域座標
データ、aij…インデックス記載領域の属性、sij…
守秘項目識別情報、imgj…文書画像データ、ind
ij…文字認識したインデックス、likij…文字認識
の類似度、DOC…文書画像、MSK…画像マスク、T
M…検索ターム、Ki…キーワード。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 羽田野 英一 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 藤縄 雅章 神奈川県小田原市国府津2880番地 株式会 社日立製作所ストレージシステム事業部内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】紙面上の文書イメージを光電変換するスキ
    ャナと、 該変換されたイメージを一時記憶する第一のメモリと、 該メモリに記憶されたイメージ情報から文書の書式を同
    定して、インデックス記載領域および守秘項目記載領域
    を抽出する文書構造解析部と、 上記インデックス記載領域のイメージ情報を第一のメモ
    リから読み出し、文字パターンを認識してテキストコー
    ドに変換する文字認識部と、 多数の文書イメージとそのインデックスを格納する大容
    量の第二のメモリとを具備し、表形式の文書を登録し、
    登録した文書を出力する電子ファイル装置であって、 (a)上記第一のメモリに記憶された文書イメージと、文
    書構造解析で抽出した守秘項目記載領域の位置情報と、
    文字認識したインデックスのテキストコードを関連付け
    て第二のメモリへ格納し、 (b)格納した文書イメージを使用するに際し、上記守秘
    項目記載領域の位置情報に対応した領域を覆い隠した文
    書イメージの表示あるいは印刷をすることを特徴とする
    電子ファイル装置の文書画像処理方法。
  2. 【請求項2】電子ファイル装置使用者が入力するパスワ
    ードにより、格納した文書イメージの全領域を表示ある
    いは印刷する動作モードと、守秘項目記載領域を覆い隠
    した文書イメージを表示あるいは印刷する動作モードと
    を切り替えることを特徴とする請求項1記載の電子ファ
    イル装置の文書画像処理方法。
  3. 【請求項3】紙面上の文書イメージを光電変換するスキ
    ャナと、 該変換されたイメージを一時記憶する第一のメモリと、 該メモリに記憶されたイメージ情報から文書の書式を同
    定して、インデックス記載領域および守秘項目記載領域
    を抽出する文書構造解析部と、 上記インデックス記載領域のイメージ情報を第一のメモ
    リから読み出し、文字パターンを認識してテキストコー
    ドに変換するとともに、該パターン認識の類似度を出力
    する文字認識部と、 多数の文書イメージとそのインデックスを格納する大容
    量の第二のメモリとを具備し、表形式の文書を登録し、
    登録した文書を出力する電子ファイル装置であって、 (a)上記第一のメモリに記憶された文書イメージと、文
    書構造解析で抽出したインデックス記載領域および守秘
    項目記載領域の位置情報と、文字認識したインデックス
    のテキストコードと類似度を関連付けて第二のメモリへ
    格納し、 (b)格納した文書イメージを用いてインデックスを修正
    するに際し、類似度があらかじめ設定した値以下の文書
    イメージを第二のメモリから検索して読み出し、上記守
    秘項目記載領域の位置情報に対応した領域を覆い隠した
    文書イメージの表示あるいは印刷を行なう、ことを特徴
    とする電子ファイル装置の文書画像処理方法。
  4. 【請求項4】請求項3記載の電子ファイル装置におい
    て、 (a)認識の類似度があらかじめ設定した閾値以上の場
    合、すなわち認識の信頼度が高い場合には、認識したイ
    ンデックスのテキストコードを第二のメモリへ格納し、
    認識の類似度が閾値以下の場合には、第一のメモリに
    記憶された文書イメージと、文書構造解析で抽出したイ
    ンデックス記載領域および守秘項目記載領域の位置情報
    と、認識したインデックスのテキストコードを関連付け
    て第二のメモリへ格納し、 (b)格納した文書イメージを用いてインデックスを修正
    するに際し、上記守秘項目記載領域の位置情報に対応し
    た領域を覆い隠した文書イメージの表示あるいは印刷を
    行なう、ことを特徴とする電子ファイル装置の文書画像
    処理方法。
JP5073348A 1993-03-31 1993-03-31 電子ファイル装置の文書画像処理方法 Pending JPH06290251A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5073348A JPH06290251A (ja) 1993-03-31 1993-03-31 電子ファイル装置の文書画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5073348A JPH06290251A (ja) 1993-03-31 1993-03-31 電子ファイル装置の文書画像処理方法

Publications (1)

Publication Number Publication Date
JPH06290251A true JPH06290251A (ja) 1994-10-18

Family

ID=13515571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5073348A Pending JPH06290251A (ja) 1993-03-31 1993-03-31 電子ファイル装置の文書画像処理方法

Country Status (1)

Country Link
JP (1) JPH06290251A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030089778A (ko) * 2002-05-18 2003-11-28 에스케이 텔레콤주식회사 이동 통신 시스템에서의 고객 신청서 및 정보 관리 방법
JP2006318100A (ja) * 2005-05-11 2006-11-24 Oki Electric Ind Co Ltd 照合確認方法、帳票データ化装置および帳票データ化システム
JP2007535771A (ja) * 2004-04-30 2007-12-06 ザ・ボーイング・カンパニー 文書情報マイニングツール
WO2008007597A1 (fr) * 2006-07-12 2008-01-17 Olympus Corporation Système d'analyse
JP2008146358A (ja) * 2006-12-11 2008-06-26 Fuji Xerox Co Ltd 画像形成システムおよび画像形成プログラム
JP2012234344A (ja) * 2011-04-28 2012-11-29 Fujitsu Frontech Ltd 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム
US8769406B2 (en) 2006-08-14 2014-07-01 Konica Minolta, Inc. Image display apparatus capable of displaying image while retaining confidentiality
JP6077625B1 (ja) * 2015-10-23 2017-02-08 株式会社ヒメナ・アンド・カンパニー 個人情報保護が可能なスキャナシステム、コンピュータプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030089778A (ko) * 2002-05-18 2003-11-28 에스케이 텔레콤주식회사 이동 통신 시스템에서의 고객 신청서 및 정보 관리 방법
JP2007535771A (ja) * 2004-04-30 2007-12-06 ザ・ボーイング・カンパニー 文書情報マイニングツール
JP4808705B2 (ja) * 2004-04-30 2011-11-02 ザ・ボーイング・カンパニー 文書情報マイニングツール
JP2006318100A (ja) * 2005-05-11 2006-11-24 Oki Electric Ind Co Ltd 照合確認方法、帳票データ化装置および帳票データ化システム
WO2008007597A1 (fr) * 2006-07-12 2008-01-17 Olympus Corporation Système d'analyse
US8769406B2 (en) 2006-08-14 2014-07-01 Konica Minolta, Inc. Image display apparatus capable of displaying image while retaining confidentiality
JP2008146358A (ja) * 2006-12-11 2008-06-26 Fuji Xerox Co Ltd 画像形成システムおよび画像形成プログラム
JP2012234344A (ja) * 2011-04-28 2012-11-29 Fujitsu Frontech Ltd 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム
JP6077625B1 (ja) * 2015-10-23 2017-02-08 株式会社ヒメナ・アンド・カンパニー 個人情報保護が可能なスキャナシステム、コンピュータプログラム

Similar Documents

Publication Publication Date Title
KR100412317B1 (ko) 문자인식/수정방법및장치
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
JPH0750483B2 (ja) 文書画像追加情報の蓄積方法
JPH06290251A (ja) 電子ファイル装置の文書画像処理方法
US5854860A (en) Image filing apparatus having a character recognition function
JP3448895B2 (ja) 取引処理装置
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JPH08263587A (ja) 文書入力方法および文書入力装置
JP3727422B2 (ja) 文字認識装置及びその方法
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
JP3946043B2 (ja) 帳票識別装置及び識別方法
JP2932667B2 (ja) 情報の検索方法および情報蓄積装置
JPH10187751A (ja) 認識データ処理装置およびそのプログラム記録媒体
JPH06103402A (ja) 名刺認識装置
JPH0327471A (ja) 画像登録方式
JPH0757040A (ja) Ocr付きファイリング装置
JP2931485B2 (ja) 文字切出し装置及び方法
JP3419425B2 (ja) 認識文字補正装置
JPH0619884A (ja) 名称入力システム
JPH05210635A (ja) 入力装置
JP3243389B2 (ja) 文書識別方法
JPH0589279A (ja) 文字認識装置
JP2963474B2 (ja) 類似文字識別方法
JP3251704B2 (ja) 認識処理装置
JP2001056840A (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体