[go: up one dir, main page]

JPH08202859A - 電子ファイリング装置及びその方法 - Google Patents

電子ファイリング装置及びその方法

Info

Publication number
JPH08202859A
JPH08202859A JP7013789A JP1378995A JPH08202859A JP H08202859 A JPH08202859 A JP H08202859A JP 7013789 A JP7013789 A JP 7013789A JP 1378995 A JP1378995 A JP 1378995A JP H08202859 A JPH08202859 A JP H08202859A
Authority
JP
Japan
Prior art keywords
character
document
image data
area
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7013789A
Other languages
English (en)
Inventor
Takayuki Shimizu
高幸 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7013789A priority Critical patent/JPH08202859A/ja
Priority to US08/562,450 priority patent/US5821929A/en
Publication of JPH08202859A publication Critical patent/JPH08202859A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 レイアウトに特徴のない文書でも容易に識別
できるようにする。 【構成】 読み込んだ文書のイメージデータの領域分割
を行ない、領域分割された領域から1つの文字領域を特
定して、この特定された文字領域から特定の大きさのイ
メージデータを切り出す。そして、読み込んだ文書のイ
メージデータと、切り出されたイメージデータとを関連
付けて記憶し、検索の要求に応じて、この記憶されたイ
メージデータを表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、所定の管理情報と関連
付けて記憶された文書のイメージデータの検索、表示、
印刷などを行なう電子ファイリング装置及びその方法に
関するものである。
【0002】
【従来の技術】近年、文書をスキャナ等で読み込むなど
して作成した文書のイメージデータに文書管理情報を関
連付けて記憶し、これらの情報に対して検索、表示、印
刷等を行なう電子ファイリング装置が発表されている。
このような電子ファイリング装置では、従来、文書管理
情報として、文書名、ページ数、登録日、キーワードな
どを登録し、文書の一覧や検索結果リストなどを表示す
る場合には、文書を識別するための情報として、これら
の文書管理情報を表示している。
【0003】しかし、このような文書管理情報のみで
は、その文書の概要を識別するのが困難である。そのた
め、文書の縮小画像を作成、登録し、それを文書の一覧
や検索結果リストなどにおいて表示することができる電
子ファイリング装置が発表されている。
【0004】このような電子ファイリング装置は、例え
ば、図41に示すように、文書読み込み部1000、縮
小画像作成部1001、文書記憶部1002、表示制御
部1003とを備えている。これらの内、文書読み込み
部1000は、不図示のスキャナ装置などから読み込ま
れた文書のイメージデータを読み込む。また、縮小画像
作成部1001は、文書読み込み部1000により読み
込まれた文書のイメージデータから、適当な大きさに縮
小したイメージデータを作成し、文書登録部1002
は、文書読み込み部1000により読み込まれた文書の
イメージデータと、縮小画像作成部1001により作成
された文書の縮小画像データとを関連付けて記憶する。
そして、表示制御部1003は、文書記憶部1002に
記憶されている文書のイメージデータや縮小画像の表示
の制御を行ない、例えば、図42に示すような縮小画像
による文書の一覧表示を行なう。
【0005】さらに、近年、作成した文書のイメージデ
ータに、キーワードなどの文書管理情報を関連付けて記
憶し、これらの情報に対して検索、表示、印刷などを行
なう電子ファイリング装置が開発されている。このよう
なキーワードは、以前は、文書の登録時などにユーザが
手作業で入力する必要があったが、近年では、文書のイ
メージデータに対して文字認識を行ない、その認識結果
に対応する文字列を文書に関連付けて自動的に登録し、
その文字列に対して全文検索を行なうなど、キーワード
を特に登録する必要がないものが発表されている。
【0006】このような電子ファイリング装置では、登
録した文書の文字列に対して検索を行なうのみならず、
文書の文字列から特定の文字列を取り出し、別ファイル
に保存したり、他のアプリケーションに複写することが
でき、その場合、文書の文字列から特定の文字列を選択
している。
【0007】この種の電子ファイリング装置としては、
例えば、図43に示すような装置がある。同図に示す装
置は、文書読み込み部3001、文字認識部3002、
文書記憶部3003、不図示のディスプレイ装置などか
らなるイメージ表示部3004、文字読み込み部300
5、イメージ表示部3004と同一のディスプレイ装置
などからなる文字表示部3006、ポインティングデバ
イスなどからなる選択範囲指定部3007、選択文字取
得部3008を備えている。
【0008】上記の構成要素の内、文書読み込み部30
01は、例えば、スキャナ装置などから読み込まれた文
書のイメージデータを読み込み、そのイメージデータを
文字認識部3002と文書記憶部3003に供給する。
文字認識部3002は、文書読み込み部3001からの
イメージデータに対して文字認識を行ない、文書に記さ
れている文字列を抽出して、抽出した文字列を文書記憶
部3003に供給する。文書記憶部3003は、文書読
み込み部3001から文書のイメージデータを、また、
文字認識部3002から文書の文字列を受け取り、これ
らを他の文書管理情報と関連付けて記憶する。
【0009】イメージ表示部3004は、文書記憶部3
003から文書のイメージデータを読み込み、そのイメ
ージデータを表示する。また、文字読み込み部3005
は、文書記憶部3003から文書の文字列を読み込み、
読み込んだ文書の文字列を文字表示部3006に供給す
る。この文字表示部3006は、文字読み込み部300
5から文書の文字列を受け取り、その文字列を所定の位
置に表示して、文字列と各文字列の表示の位置情報を選
択文字取得部300に供給するとともに、オペレータが
特定の文字列を選択した場合は、選択範囲指定部300
7から選択範囲の位置情報を受け取り、選択範囲を反転
表示する。
【0010】選択範囲指定部3007は、文字表示部3
006の表示画面上でオペレータにより指定される選択
範囲の位置情報を、文字表示部3006と選択文字取得
部3008に供給する。そして、選択文字取得部300
8は、文字表示部3006から文書の文字列と各文字の
表示の位置情報を受け取り、選択範囲指定部3007か
ら選択範囲の位置情報を受け取って、文書の文字列から
選択範囲内の文字列を取得する。
【0011】図44は、この種の電子ファイリング装置
における文書の表示画面例である。同図に示すように、
上記イメージ表示部3004により、文書のイメージデ
ータが、符号4001にて示される位置に表示され、文
字表示部3006により、文書の文字列が符号4002
の位置に表示され、さらに、選択範囲指定部3007に
より、符号4003にて示される範囲内の文字列が選択
される。
【0012】
【発明が解決しようとする課題】しかしながら、上記従
来の電子ファイリング装置では、文書の一覧や検索結果
リストなどの表示において、文書の縮小画像から文書の
概要を識別することはできるものの、識別できるのは文
書全体のレイアウトぐらいであり、文書に記されている
文字を識別することはできない。このため、レイアウト
が似ている文書や、大きな文字や図形などがなく、特徴
の少ないレイアウトの文書などを識別することは非常に
困難であるという問題がある。
【0013】さらに、図43にて示される、上記従来の
電子ファイリング装置では、文書の文字列から特定の文
字列を選択する場合、文書の文字列を表示する文字表示
部において選択する必要があり、通常、電子ファイリン
グ装置では、オペレータは、まず、文書のイメージデー
タを表示するイメージ表示部により文書の内容を確認す
るために、選択したい文字列も必然的にイメージ表示部
で確認することになる。そこで、文字列を選択するに
は、イメージ表示部において文書の内容と選択したい文
字列を確認し、それから文字表示部により文書の文字列
を表示して、そこであらためて選択したい文字列を探し
て選択する必要があるので、文字選択の操作が繁雑にな
るという問題がある。
【0014】本発明は、上述の課題に鑑みてなされたも
のであり、その目的とするところは、文書の一覧や検索
結果リストなどの表示において、レイアウトが似ている
文書や、あまり特徴のないレイアウトの文書でも容易に
識別できる電子ファイリング装置及びその方法を提供す
ることである。
【0015】また、本発明の他の目的は、文字領域の組
方向にかかわらず文字領域のイメージデータを適切に切
り出して表示できる電子ファイリング装置及びその方法
を提供することである。
【0016】また、本発明のさらなる目的は、文書に記
されている文字列から文字選択を容易に行なえる電子フ
ァイリング装置及びその方法を提供することである。
【0017】
【課題を解決するための手段】及び
【作用】上記の目的を達成するため、本発明は、読み込
んだ複数の文書を検索する電子ファイリング装置におい
て、前記読み込んだ文書のイメージデータに対して領域
分割を行なう手段と、前記領域分割された領域から文字
領域を判別する手段と、前記文字領域が複数ある場合、
該複数の文字領域から1つの文字領域を特定する特定手
段と、前記特定された文字領域から特定の大きさのイメ
ージデータを切り出す切出し手段と、前記読み込んだ文
書のイメージデータと、前記切り出されたイメージデー
タとを関連付けて記憶する記憶手段と、前記検索に対応
させて、前記記憶されたイメージデータを表示する表示
手段とを備える。
【0018】また、他の発明は、読み込んだ複数の文書
を検索する電子ファイリング装置において、前記読み込
んだ文書のイメージデータに対して領域分割を行なう手
段と、前記領域分割された領域から文字領域を判別する
手段と、前記文字領域のイメージデータに対して文字認
識を行なう手段と、前記文字認識に基づいて所定の情報
を抽出する手段と、前記読み込んだ文書のイメージデー
タと、前記所定の情報とを関連付けて記憶する記憶手段
と、前記読み込んだ文書のイメージデータを表示する手
段と、前記表示された文書のイメージデータ上において
特定の範囲を指定する手段と、前記所定の情報から、前
記特定の範囲の文字列を取得する取得手段とを備える。
【0019】以上の構成において、レイアウトの似た文
書やレイアウトに特徴のない文書でも容易に識別でき、
また、文字領域の組方向にかかわらず文字領域のイメー
ジデータを適切に切り出して表示するよう機能する。
【0020】また、文字列から文字選択を容易に行なえ
るよう機能する。
【0021】
【実施例】以下、添付図面を参照して、本発明に係る好
適な実施例を詳細に説明する。 [第1実施例]図1は、本発明の第1の実施例に係る電
子ファイリング装置の構成を示すブロック図である。同
図に示す電子ファイリング装置は、文書読み込み部1
0、領域分割部1、先頭文字領域特定部2、文字領域切
り出し部3、文書登録部4、ファイル装置5、表示制御
部6を備えている。
【0022】文書読み込み部10は、不図示のスキャナ
装置などから読み込まれた文書のイメージデータを、内
蔵するメモリに読み込む。領域分割部1は、文書読み込
み部10より読み込んだ文書のイメージデータの中か
ら、文字領域や図形領域などを抽出する。また、先頭文
字領域特定部2は、領域分割部1で抽出した文字領域の
順序付けを行ない、最初の文字領域を特定する。そし
て、文字領域切り出し部3は、先頭文字領域特定部2で
特定された文字領域から、特定の大きさのイメージデー
タを切り出す。
【0023】文書登録部4は、文書読み込み部10で読
み込んだ文書のイメージデータと、文字領域切り出し部
3で切り出した文字領域のイメージデータとを関連付け
てファイル装置5に登録する。ファイル装置5は、文書
のイメージデータとキーワードなどの文書管理情報とを
関連付けてデータベースとして記憶する。また、表示制
御部6は、ファイル装置5にて記憶した文字領域のイメ
ージデータのディスプレイ(不図示)などへの表示を制
御する。
【0024】なお、本実施例に係る電子ファイリング装
置には、上記以外にも、ファイル装置5に記憶された文
書の情報に対して、検索、印刷などの機能を実現するた
めの種々の構成要素が設けられているが、ここでは、そ
れらの説明を省略する。
【0025】次に、上記の構成をとる、本実施例に係る
電子ファイリング装置における文書登録処理について、
図2に示すフローチャートに従って説明する。
【0026】まず、電子ファイリング装置では、ユーザ
からの所定の開始指示により処理を開始し、スキャナ装
置などで読み込んだ文書のイメージデータをメモリ上に
読み込み(ステップS1)、そのイメージデータに対し
て領域分割を行なう(ステップS2)。
【0027】ここでの領域分割とは、文書全体のイメー
ジデータを、文章、図形、表などの様々な属性の領域に
分割し、抽出するもので、通常、文字認識の前処理とし
て行なわれている。また、領域の属性は、文字領域とイ
メージ領域とに大別され、文字領域からは、属性情報と
して領域の位置、領域のサイズ、領域内の文字の平均文
字サイズなどが抽出される。なお、領域分割の方法につ
いは、本発明と直接関係がないので、その説明を省略す
る。
【0028】次に、読み込んだ文書に文字領域があるか
どうかを判別し(ステップS3)、その文書に文字領域
がある場合は、文字領域の順序付けを行なって、最初の
文字領域を特定する(ステップS4)。ここで、最初の
文字領域を特定するのは、一般的に、文書の最初の部分
にその文書の特徴的な文があるからである。
【0029】上記の文字領域の順序付けとは、分割した
文字領域毎に文字認識した文字列を、その前後関係に基
づいて適切に結合し、一つの文章として再生するために
行なうもので、上記の領域分割とともに文字認識の前処
理として行なわれている。なお、この順序付けの方法に
ついても本発明の主眼ではないので、その説明を省略す
る。
【0030】図3は、本実施例における文書の領域分割
と文字領域の順序付けを説明するための図である。同図
では、領域分割によりイメージ領域と文字領域が分割、
抽出された様子を示している。これらの内、イメージ領
域については、灰色で塗りつぶした矩形領域で、また、
文字領域については、フレームの矩形領域で示されてい
る。そして、順序付けにより文字領域が順序付けられた
様子を、文字領域を示すフレームの中の番号で示してい
る。
【0031】一方、ステップS3で、文書中に文字領域
がないと判定された場合には、適当な1つのイメージ領
域を特定する(ステップS5)。このイメージ領域を特
定する条件は、領域の位置やサイズなどから適当に決め
る。
【0032】次に、上記のように特定された領域の属性
情報としての、領域の位置と領域のサイズをもとに、あ
らかじめ定められた大きさを超えない幅と高さのイメー
ジデータを、特定された領域の左上隅から切り出し(ス
テップS6)、切り出したイメージデータを、ページ
数、登録日など、他の文書管理情報とともに文書のイメ
ージデータと関連付けてデータベースに登録し(ステッ
プS7)、本処理を終了する。
【0033】以下、図1の構成をとる電子ファイリング
装置における文字領域あるいはイメージ領域のイメージ
データを一覧表示する処理手順について、図4に示すフ
ローチャートに従って説明する。
【0034】ユーザからの開始指示により本処理を開始
し、文書の登録日やページ数などの文書管理情報での分
類分けなどの結果から一覧表示する文書を確定する(ス
テップS11)。また、このステップS11で確定した
文書で、まだ表示していない文書があるかどうかを判別
し(ステップS12)、まだ表示していない文書があれ
ば、その文書に関連付けられて記憶されている文字領域
あるいはイメージ領域のイメージデータを読み込む(ス
テップS13)。
【0035】次に、読み込んだイメージデータを所定の
位置に表示し(ステップS14)、その後、処理をステ
ップS12に戻して、上記のステップS12〜ステップ
S14の処理を繰り返す。そして、確定したすべての文
書の表示を完了したならば(ステップS12でYE
S)、本処理を終了する。
【0036】図5は、上記のような一覧表示処理にて表
示される文書領域画像一覧の表示画面の一例である。同
図に示すように、3つの文書11,12,14に対して
は文字領域のイメージデータが表示され、また、1つの
文書13については、文字領域がないためイメージ領域
のイメージデータが表示される。
【0037】以上説明したように、本実施例によれば、
文書の文字領域のイメージデータを登録し、それを表示
することで、文書の一覧や検索結果リストなどの表示に
おいて、文書に記されている文字の一部を識別すること
ができ、レイアウトの似た文書や、あまり特徴のないレ
イアウトの文書でも容易に識別することができる。
【0038】また、一般に特徴的な文を有する文書の最
初の文字領域のイメージデータを登録し、表示すること
で、文書の識別がより容易になる。
【0039】さらに、文書中に文字領域がある場合とな
い場合とで、表示されるイメージデータの種類が異なる
ので、文書の特徴として文字を含まないのか否かを即、
知ることができる。 [第2実施例]本発明に係る第2の実施例について説明
する。
【0040】図6は、本発明の第2の実施例に係る電子
ファイリング装置の構成を示すブロック図である。な
お、同図に示す電子ファイリング装置において、図1に
示す、上記第1実施例と同様の機能を有するものには、
同一符号を付して、ここでは、それらの説明を省略す
る。
【0041】本実施例に係る電子ファイリング装置は、
文書読み込み部10、領域分割部1、最大文字領域特定
部7、文字領域切り出し部3、文書登録部4、ファイル
装置5、表示制御部6を備えている。これらの構成要素
の内、最大文字領域特定部7は、領域分割部1で領域分
割した文字領域から、文字領域の属性情報の平均文字サ
イズが一番大きい文字領域を特定する。
【0042】次に、上記の構成を有する電子ファイリン
グ装置での文書登録処理手順について、図7に示すフロ
ーチャートに従って説明する。なお、図7のステップS
21〜S23,S25〜S27での処理は、図2に示
す、上記第1の実施例に係る文書登録処理の内、ステッ
プS1〜S3,S5〜S7における処理と同様であるた
め、ここでは、それらの説明を省略する。
【0043】図7のステップS24では、上記のステッ
プS22で文字領域の属性情報として抽出されている平
均文字サイズと領域の位置とから、1つの文字領域を特
定する処理を行なう。
【0044】ここで、図8に示すフローチャートに従
い、上記のステップS24での文字領域特定処理の動作
をさらに詳細に説明する。
【0045】まず、領域分割された各文字領域の平均文
字サイズを比較し、最大の平均文字サイズの文字領域を
特定する(図8のステップS31)。次に、最大の平均
文字サイズの文字領域が1つに特定されたかどうかを判
別し(ステップS32)、それが特定されない場合に
は、ステップS31にて特定されている文字領域の垂直
位置を比較し、最も上に位置する文字領域を特定する
(ステップS33)。
【0046】ステップS34では、上記のステップS3
3で文字領域が1つに特定されたかどうかを判別し、そ
れが特定されない場合には、ステップS33にて特定さ
れている文字領域の水平位置を比較して、最も左に位置
する文字領域を特定する(ステップS35)。そして、
これらの内のいずれかの文字領域特定の処理により1つ
の文字領域が特定されるので、図7のステップS26に
処理を移す。
【0047】なお、図6に示す構成を有する、本実施例
に係る電子ファイリング装置における文字領域あるいは
イメージ領域のイメージデータを一覧表示する処理手順
は、図4に示す、上記第1の実施例に係る領域画像表示
処理と同様であるため、ここでは、その説明を省略す
る。
【0048】このように、本実施例によれば、上記第1
実施例における効果に加えて、文書のタイトルなど、そ
の文書の特徴的な文書列がある文書中の最も大きい文字
サイズの文字領域のイメージデータを登録し、表示する
ことで、文書をより容易に識別することができる。 [第3実施例]図9は、本発明の第3の実施例に係る電
子ファイリング装置の構成を示すブロック図である。同
図に示すように、本実施例に係る装置は、文書読み込み
部11、領域分割部12、文字領域特定部13、文字領
域切り出し部14、文書登録部15、ファイル装置1
6、表示制御部17を備えている。
【0049】これらの内、文書読み込み部11は、スキ
ャナ装置(不図示)などから読み込まれた文書のイメー
ジデータを領域分割部12と文字領域切り出し部14、
及び文書登録部15に供給する。領域分割部12は、文
書読み込み部11から文書のイメージデータを受け取
り、そのイメージデータに対して領域分割を行なう。そ
して、文字領域とその属性情報として領域の位置と大き
さ、組方向が抽出され、抽出したすべての文字領域の属
性情報が文字領域特定部13に供給される。
【0050】文字領域特定部13は、領域分割部12か
らすべての文字領域の属性情報を受け取り、それらの属
性情報から1つの文字領域を特定し、特定した文字領域
の属性情報を文字領域切り出し部14に供給する。この
文字領域切り出し部14は、文書読み込み部11から文
書のイメージデータを、また、文字領域特定部13か
ら、特定された文字領域の属性情報を受け取り、その文
字領域の位置、大きさ、組方向より決定される領域のイ
メージデータを文書のイメージデータから切り出し、そ
のイメージデータと組方向情報を文書登録部15に供給
する。
【0051】文書登録部15は、文書読み込み部11か
ら文書のイメージデータを、また、文字領域切り出し部
14から文字領域のイメージデータと組方向情報を受け
取り、これらを他の文書管理情報と関連付けてファイル
装置16に登録する。なお、ファイル装置16は、文書
のイメージデータとキーワードなどの文書管理情報とを
関連付けてデータベースとして記憶する。また、表示制
御部17は、ファイル装置16にて記憶した組方向情報
と文字領域のイメージデータを読み込み、読み込んだ組
方向情報に従って文字領域のイメージデータをディスプ
レイ(不図示)などへの表示を制御する。
【0052】なお、本実施例に係る電子ファイリング装
置においても、上記以外に、ファイル装置16に記憶さ
れた文書の情報に対して、検索、印刷などの機能を実現
するための種々の構成要素が設けられているが、ここで
は、それらの説明を省略する。
【0053】次に、上記のように構成をとる、本実施例
に係る電子ファイリング装置での文書登録処理の動作に
ついて、図10に示すフローチャートに従って説明す
る。
【0054】まず、ユーザーの開始指示により処理を開
始し、処理スキャナ装置等(不図示)で読み込んだ文書
のイメージデータをメモリ上に読み込む(ステップS4
1)。そして、そのイメージデータに対して領域分割を
行ない、文字領域とその属性情報として位置、大きさ、
組方向を抽出する(ステップS42)。
【0055】ここでの領域分割とは、文書全体のイメー
ジデータから、文章、図形、表などの様々な属性の領域
とその属性情報を抽出するものであり、文字認識の前処
理として行なわれている。なお、領域分割の方法につい
ては、詳細な説明を省略する。
【0056】続く処理では、抽出したすべての文字領域
から最も左上に位置する1つの文字領域を特定する(ス
テップS43)。この文字領域を特定する方法として
は、他にも、文字領域の属性情報から文字領域の順序付
けを行ない、最初の文字領域を選択したり、平均文字サ
イズが最大の文字領域を選択する方法などがあるが、こ
こでは、それらの詳細な説明を省略する。
【0057】次に、特定された文字領域の位置、大き
さ、組方向から、あらかじめ定められた大きさを超えな
い幅と高さの領域を決定し、文書のイメージデータから
その領域のイメージデータを切り出す(ステップS4
4)。そして、切り出したイメージデータと文字領域の
組方向情報を、ページ数、登録日などの他の文書管理情
報とともに、文書のイメージデータと関連付けてデータ
ベースに登録し(ステップS45)、本処理を終了す
る。
【0058】以下、図11に示すフローチャートに従
い、本実施例における文書登録処理の内、図10のステ
ップS44での文字領域切り出し処理の詳細を説明す
る。
【0059】まず、上記の領域分割により抽出された組
方向情報により、文字領域が横書きか否かを判定し(ス
テップS51)、それが横書きであれば、横書きに適し
た切り出し領域を確定する(ステップS52)。また、
縦書きであれば、縦書きに適した切り出し領域を確定す
る(ステップS53)。
【0060】次に、上記のように確定された領域のイメ
ージデータを文書のイメージデータから切り出し(ステ
ップS54)、その後、図10のステップS45の処理
に移行する。
【0061】図12は、図11のステップS52の横書
きの文字領域の切り出し領域確定処理の詳細フローチャ
ートである。なお、ここでは、座標系は、水平方向は右
方向が正で、垂直方向は下方向が正であるとする。ま
た、領域分割により抽出された文字領域の左上隅の水平
位置をx1、垂直位置をy1、幅をw1、高さをh1と
し、切り出す領域の左上隅の水平位置をx、垂直位置を
y、幅をw、高さをhとし、さらに、横書きの文字領域
から切り出す領域の幅の上限をa、高さの上限をbとす
る。これらの上限a,bは、あらかじめ定められた値、
あるいは、ユーザーが定める値である。
【0062】最初の処理として、まず、xをx1に、y
をy1に設定する(ステップS61)。次に、w1がa
を超えているかどうかを判別し(ステップS62)、w
1がaを超えている場合は、wをaに設定し(ステップ
S63)、w1がaを超えていない場合には、wをw1
に設定する(ステップS64)。
【0063】そして、h1がbを超えているか否かを判
別し(ステップS65)、h1がbを超えている場合
は、hをbに設定し(ステップS66)、h1がbを超
えていない場合は、hをh1に設定して(ステップS6
7)、処理を図11のステップS54に処理を移す。
【0064】図13は、上記のステップS52での処理
により、文書中の横書きの文字領域20において切り出
し領域21が確定された様子を示す図である。
【0065】図14は、図11のステップS53での縦
書きの文字領域の切り出し領域確定処理の動作を、さら
に詳細に説明するためのフローチャートである。なお、
ここでは、縦書きの文字領域から切り出す領域の幅の上
限をc、高さの上限をdとする。これらの上限c,d
は、あからじめ定められた値、あるいは、ユーザーが定
める値である。また、その他の記号は、図12における
記号と同じ意味を有する。
【0066】図14において、まず、yをy1に設定す
る(ステップS71)。次に、w1がcを超えているか
どうかを判別し(ステップS72)、w1がcを超えて
いる場合は、xをx1+w1−cに、また、wをcに設
定する(ステップS73)。また、w1がcを超えてい
ない場合は、xをx1に、wをw1に設定する(ステッ
プS74)。
【0067】そして、次に、h1がdを超えているか否
を判別し(ステップS75)、h1がdを超えている場
合は、hをdに設定し(ステップS76)、h1がdを
超えていない場合には、hをh1に設定して(ステップ
S77)、処理を図11のステップS54に移す。
【0068】図15は、上記ステップS53での処理に
より、文書中の縦書きの文字領域25において切り出し
領域26が確定された様子を示したものである。
【0069】次に、本実施例に係る電子ファイリング装
置における文字領域のイメージデータを一覧表示する処
理手順について、図16に示すフローチャートに従って
説明する。
【0070】まず、ユーザーからの開始指示により処理
を開始し、文書の登録日やページ数などの文書管理情報
での分類分けなどの結果から、一覧表示する文書を確定
する(ステップS81)。次に、ステップS81で確定
した文書で、まだ表示していない文書があるかどうかを
判別し(ステップS82)、まだ表示していない文書が
あれば、その文書に関連付けられて記憶されている組方
向情報と文字領域のイメージデータを読み込む(ステッ
プS83,S84)。
【0071】続く処理では、読み込んだイメージデータ
を縦書きと横書きとで分けて所定の位置に表示し(ステ
ップS85)、ステップS82の処理に戻る。そして、
ステップS82〜ステップS85の処理を繰り返し行な
い、ステップS82で、確定したすべての文書の表示を
完了したと判定されたならば、本処理を終了する。
【0072】図17は、上記のような一覧表示処理によ
り表示される文書領域画像一覧の表示画面の一例であ
る。同図は、ウィンドウの左側に縦書きの文字領域のイ
メージデータが表示され、右側に横書きの文字領域のイ
メージデータが表示されている様子を示している。
【0073】以上説明したように、本実施例によれば、
上記第1実施例における効果に加えて、読み込んだ文書
のイメージデータに対して領域分割を行ない、文字領域
の位置、大きさ、組方向を抽出し、文字領域の組み方向
に適した領域のイメージデータを切り出して、記憶し、
表示することで、文字領域の組方向にかかわらず文字領
域のイメージデータを適切に切り出し、表示することが
できる。
【0074】また、組方向を記憶し、組方向ごとに分け
て文字領域のイメージデータを表示することで、識別し
やすい状態にて文字領域のイメージデータを表示するこ
とができる。 [第4実施例]図18は、本発明の第4の実施例に係る
電子ファイリング装置の構成を示すブロック図である。
同図に示す電子ファイリング装置は、文書読み込み部3
1、領域分割部32、文字認識部33、文書登録部3
4、ファイル装置35、文字情報読み込み部37、不図
示のディスプレイ装置などからなるイメージ表示部3
6、ポインティングデバイスなどからなる選択範囲指定
部38、選択文字取得部39を備えている。
【0075】文書読み込み部31は、スキャナ装置など
から読み込まれた文書のイメージデータを領域分割部3
2と文書登録部34に供給する。この領域分割部32
は、文書読み込み部31から文書のイメージデータに対
して領域分割を行ない、すべての文字領域の左上隅の水
平位置、垂直位置、右下隅の水平位置、垂直位置とから
なる文字領域の位置情報と、文字領域の組方向(縦書き
/横書き)を文字領域情報として抽出し、抽出した文字
領域情報を文書のイメージデータとともに文字認識部3
3に供給する。
【0076】文字認識部33は、領域分割部32から文
書のイメージデータとすべての文字領域の文字領域情報
を受け取り、すべての文字領域のイメージデータに対し
て文字認識を行ない、各文字領域に記されている文字列
と、各文字のイメージデータの領域の左上隅の水平位
置、垂直位置、右下隅の水平位置、垂直位置を文字列情
報として抽出し、抽出した文字列情報を文字領域情報と
ともに文書登録部34に供給する。
【0077】文書登録部34は、文書読み込み部31か
ら文書のイメージデータを、また、文字認識部33から
すべての文字領域の文字領域情報と文字列情報を受け取
り、これらを他の文書管理情報と関連付けてファイル装
置35に登録する。このファイル装置35は、文書のイ
メージデータと、文書名や登録日などの文書管理情報と
を関連付けてデータベースとして記憶する。
【0078】また、文字情報読み込み部37は、ファイ
ル装置35からすべての文字領域の文字領域情報と文字
列情報を読み込み、読み込んだ文字領域情報と文字列情
報をイメージ表示部36と選択文字取得部39に供給す
る。イメージ表示部36は、ファイル装置35から文書
のイメージデータを読み込み、そのイメージデータを表
示するとともに、文字情報読み込み部37からすべての
文字領域の文字領域情報と文字列情報と受け取る。そし
て、オペレータがイメージ表示部36の表示画面上で特
定の2点からなる範囲を指定した場合は選択範囲指定部
38から指定範囲を受け取り、指定範囲を含む文字領域
のフレームを表示するとともに、指定範囲に含まれる文
字列の部分を反転表示する。
【0079】選択範囲指定部38は、オペレータがイメ
ージ表示部36の表示画面上で指定した範囲を取得し、
取得した指定範囲をイメージ表示部36と選択文字取得
部39に供給する。選択文字取得部39は、文字情報読
み込み部37からすべての文字領域の文字領域の文字領
域情報と文字列情報を受け取り、また、選択範囲指定部
38から指定範囲を受け取って、指定位置を含む文字領
域の文字列を取得する。
【0080】なお、上記の電子ファイリング装置には、
上記以外にも、ファイル装置35に記憶された文書の情
報に対して、検索、印刷などの機能を実現するための種
々の構成要素が設けられているが、ここでは、それらの
説明を省略する。
【0081】次に、上記のような構成をとる、本実施例
に係る電子ファイリング装置における文書登録処理の動
作について、図19に示すフローチャートに従って説明
する。
【0082】まず、オペレータからの開始指示により処
理を開始、例えば、処理スキャナ装置などで読み込んだ
文書のイメージデータをメモリ上に読み込む(ステップ
S91)。そして、読み込んだイメージデータに対して
領域分割を行ない、文字領域情報として、文書のイメー
ジデータのすべての文字領域の左上隅の水平位置、垂直
位置、右下隅の水平位置、垂直位置と、その組方向(縦
書き/横書き)を抽出する(ステップS92)。
【0083】図20は、本実施例における領域分割の動
作を説明するための図である。同図は、文書のイメージ
データに対して領域分割を行ない、縦書きの文字領域と
して領域40を抽出し、横書きの文字領域として領域4
1,42を抽出した様子を示している。また、同図にお
いては、文字領域42の左上隅の水平位置をleft、垂直
位置をtop、右下隅の水平位置をright、垂直位置をbott
omとして示している。
【0084】なお、領域分割は、文書のイメージデータ
から、文章、図形、表などの様々な属性の領域とその属
性情報を抽出するものであり、通常、文字認識の前処理
として行なわれるが、その領域分割の方法については、
詳細な説明を省略する。
【0085】次に、抽出した文字領域のイメージデータ
に対して文字認識を行ない、文字列情報として、各文字
イメージデータの領域の左上隅の水平位置、垂直位置、
右上隅の水平位置、垂直位置と、その文字コードを抽出
する(ステップS93)。
【0086】図21は、本実施例における文字認識によ
り抽出される各文字のイメージデータの領域を説明する
ための図である。同図では、「さしすせそ」の各文字の
領域として50,51,52,53,54を抽出した様
子を示している。また、「さ」の文字の領域の左上隅の
水平位置をleft、垂直位置をtop,右下隅の水平位置をr
ight、垂直位置をbottomとして示している。なお、ここ
での文字認識の方法については、周知の技術を使用すれ
ばよいので、その詳細な説明を省略する。
【0087】本実施例に係る文書登録処理では、上記の
ステップS92により抽出した文字領域情報と、ステッ
プS93により抽出した文字列情報とから、図22に示
すような文字情報データを作成し(ステップS94)、
作成した文書の文字情報データを、ページ数、登録日な
どの他の文書管理情報とともに、文書のイメージデータ
と関連付けてデータベースに登録して(ステップS9
5)、本処理を終了する。
【0088】次に、図18に示すように構成された、本
実施例に係る電子ファイリング装置での文書表示処理の
動作について、図23に示すフローチャートに従って説
明する。
【0089】まず、オペレータの開始指示により処理を
開始し、オペレータが文書の一覧表示画面において文書
を選択するなどして、表示する文書を確定する(ステッ
プS100)。次に、このステップS100で確定した
文書に関連付けられて記憶されている文書のイメージデ
ータと文字情報データをデータベースから読み込み(ス
テップS101)、読み込んだ文書のイメージデータを
表示して(ステップS102)、本処理を終了する。
【0090】以下、本実施例に係る電子ファイリング装
置における文書の文字列の選択処理の動作について、図
24に示すフローチャートを参照して説明する。
【0091】最初にオペレータが、上記の文書表示処理
(図23参照)により文書のイメージデータを表示後、
その表示画面上でポインタの位置を所望の位置に合わせ
てポインティングデバイス(不図示)のボタンを押すこ
とにより処理を開始する。そして、そのときのポインタ
の水平位置と垂直位置を、それぞれバッファstart
Pos.xとstartPos.yに取得し(ステップ
S110)、点(startPos.x,startP
os.y)を含む文字領域があるかどうかを、文字情報
データの各文字領域の位置情報から判別する(ステップ
S111)。
【0092】上記の点(startPos.x,sta
rtPos.y)を含む文字領域がある場合には、その
文字領域のフレームを文字領域に位置情報により表示し
(ステップS112)、その文字領域の各文字の位置情
報から、その文字領域内の行を抽出して、行情報データ
を作成する(ステップS113)。そして、作成した行
情報データとその文字領域の各文字の位置情報から、点
(startPos.x,startPos.y)によ
り指定される文字を確定し、その文字番号をバッファs
elect1に取得する(ステップS114)。
【0093】次に、オペレータがポインティングデバイ
スのボタンを押したまま、ポインタを移動することによ
り、そのときのポインタの水平位置と垂直位置を、それ
ぞれバッファendPos.xとendPos.yに取
得し(ステップS115)、上記のステップS114と
同様の処理で、点(endPos.x,endPos.
y)により指定される文字を確定し、その文字番号をバ
ッファselect2に取得する(ステップS11
6)。
【0094】そして、select1とselect2
の間の行の領域を反転表示し(ステップS117)、オ
ペレータがポインティングデバイスのボタンを離したか
否かを判別する(ステップS118)。ここで、オペレ
ータがポインティングデバイスのボタンを離していない
場合は、処理をステップS115に戻し、オペレータが
ポインティングデバイスのボタンを離すまで、ステップ
S115からステップS118の処理を繰り返し行な
う。
【0095】オペレータがポインティングデバイスのボ
タンを離した場合、文字列情報からselect1とs
elect2の間の文字コードをバッファstring
にコピーし(ステップS119)、本処理を終了する。
なお、上記のステップS111で、点(startPo
s.x,startPos.y)を含む文字領域がない
と判断された場合は、何ら処理をせずに終了する。
【0096】ここで、図25に示すフローチャートに従
い、上記の文字列選択処理における行情報データの作成
処理(ステップS113)の動作について、さらに詳細
に説明する。
【0097】なお、ここでは、座標系は、水平方向は右
方向が正で、垂直方向は下方向が正であるとする。ま
た、文字列情報におけるi番目の文字の上の位置をch
ar(i).top、下の位置をchar(i).bo
ttomとし、作成する行情報データのi番目の行の先
頭文字の番号をline(i).start、最終文字
の番号をline(i).end、上の位置をline
(i).top、下の位置をline(i).bott
omとする。さらに、行番号のカウンタをl、文字番号
のカウンタをm,nとし、抽出中の行の上の位置をto
p、下の位置をbottomとする。
【0098】まず、文字領域の組方向が横書きかどうか
を判別し(ステップS120)、横書きの場合は、カウ
ンタl,m,nを1に、topをchar(1).to
pに、bottomをchar(1).bottomに
初期設定する(ステップS121)。そして、次に、c
har(n).topがbottomより下にあるかど
うかを判別し(ステップS122)、char(n).
topがbottomより下にある場合は、その文字は
次の行にあるものとし、その行の行情報としてline
(l).startにmを、line(l).endに
n−1を、line(l).topにtopを、lin
e(l).bottomにbottomを入れる(ステ
ップS123)。
【0099】次に、次の行情報を抽出するため、上記の
lを1インクリメントし(ステップS124)、mにn
を、topにchar(n).topを、bottom
にchar(n).bottomに入れる(ステップS
125)。
【0100】しかし、char(n).topがbot
tomより下にない場合(ステップS122での判断が
NO)は、その文字は、まだ同じ行にあるものとして、
char(n).topがtopより上にあるかどうか
を判別し(ステップS126)、char(n).to
pがtopより上にある場合にのみ、topにchar
(n).topを入れる(ステップS127)。そし
て、char(n).bottomがbottomより
下にある場合にのみ、bottomにchar(n).
bottomを入れる(ステップS129)。
【0101】ステップS130では、その文字領域にn
+1番目の文字があるかどうかを判別し、n+1番目の
文字ある場合、次の文字を調べるためにnを1インクリ
メントして(ステップS131)、処理をステップS1
22に戻す。そして、最後の文字を調べるまで、ステッ
プS122からステップS131の処理を繰り返し行な
う。しかし、その文字領域にn+1番目の文字がない場
合には、その行の行情報としてline(l).sta
rtにmを、line(l).endにnを、line
(l).topにtopを、line(l).bott
omにbottomを入れ(ステップS132)、処理
を、図24のステップS114に移す。
【0102】一方、ステップS120の判別で、組方向
が横書きでない場合は、縦書きの文字領域として行情報
データを作成し(ステップS133)、その後、図24
のステップS114に処理を移す。なお、このステップ
S133での処理は、上記のステップS121からステ
ップS132の横書き文字領域の行情報データの作成処
理と同様の方法で行なえるので、ここでは、その説明を
省略する。
【0103】図26は、上記のような行情報データ作成
処理により作成される行情報データの構成を示したもの
である。同図に示すように、各行の行情報は、その行の
先頭文字の番号、最終文字の番号、上の位置、下の位置
からなり、すべての行についてこれらの情報を持つ。
【0104】また、図27,図28は、横書きの文字領
域から実際に作成される行情報データを説明するための
図である。図27では、横書きで25文字を含む文字領
域60において、1番目から7番目の文字まで、8番目
から12番目の文字まで、13番目から21番目の文字
まで、そして、22番目から25番目の文字までをそれ
ぞれ行として抽出し、そのときの行の上の位置をtop
1からtop4とし、行の下の位置をbottom1か
らbottom4として抽出した様子を示している。ま
た、図28は、図27に示す文字領域から作成される行
情報データの内容を示している。
【0105】次に、図29に示すフローチャートに従
い、上記の文字列選択処理(図24参照)におけるステ
ップS114及びステップS116の指定文字の確定処
理の動作について、さらに詳細に説明する。
【0106】なお、ここでは、文字列情報におけるi番
目の文字の左の位置をchar(i).left、右の
位置をchar(i).rightとする。また、ポイ
ンティングデバイスの位置をpoint.x,poin
t.y、確定した文字の番号をselectとする。他
の記号については、図25に示すフローチャートでの説
明における記号と同じである。
【0107】まず、文字領域の組方向が横書きかどうか
を判別し(ステップS140)、それが横書きの場合に
は、lを1に初期設定する(ステップS141)。そし
て、point.yがline(l).topより上に
あるかどうかを判別し(ステップS142)、poin
t.yがline(l).topより上にない場合は、
次に、point.yがline(l).topとli
ne(l).bottomの間にあるかどうかを判別す
る(ステップS143)。
【0108】上記のpoint.yがline(l).
topとline(l).bottomの間にない場合
は、l+1番目の行があるか否かを判別し(ステップS
144)、l+1番目の行がある場合には、次の行を調
べるために、lを1インクリメントして(ステップS1
45)、処理をステップS142に戻す。そして、最後
の行を調べるまで、ステップS142からステップS1
45の処理を繰り返し行ない、point.yが最後の
行よりも下にある場合、selectに文字領域の最後
の文字の番号line(l).endを入れて(ステッ
プS146)、次のステップに処理を移す。
【0109】しかし、point.yがline
(l).topより上にある場合には、selectに
文字領域の最初の文字の番号line(l).star
tを入れ(ステップS147)、次のステップに処理を
移す。
【0110】一方、point.yがline(l).
topとline(l).bottomの間にある場合
(ステップS143での判定がYES)は、mにlin
e(l).startを入れ(ステップS148)、次
の処理にて、point.xがchar(m).rig
htより左にあるかどうかを判別する(ステップS14
9)。そして、point.xがchar(m).ri
ghtより左にない場合(ステップS149での判断が
NO)は、1番目の行にm+1番目の文字があるか否か
を判別し(ステップS150)、そこにm+1番目の文
字がある場合には、次の文字を調べるためにmを1イン
クリメントしてから(ステップS151)、ステップS
149の処理に戻る。行の最後の文字を調べるまで、ス
テップS149からステップS151の処理を繰り返し
行なう。
【0111】point.xがchar(m).rig
htより左にある場合、または、m+1番目の文字がな
い場合には、selectにmを入れ(ステップS15
2)、次のステップ(図24における指定文字の確定処
理に続く処理)に処理を移す。
【0112】ステップS140での判別で、組方向が縦
書きでない場合は、縦書きの文字領域として指定文字を
確定し(ステップS153)、次のステップに処理を移
す。なお、ステップS153での処理は、上記ステップ
S141からステップS152による横書きの文字領域
の指定文字の確定処理と同様の方法で行なえるので、こ
こでは、その説明を省略する。
【0113】図30は、上記のような文字列選択処理の
表示画面の一例である。同図では、オペレータが文書の
イメージデータの表示画面上で、符号70にて示される
文字領域内の範囲71の文字列を指定した様子を示して
いる。
【0114】以上説明したように、本実施例によれば、
抽出した文字領域情報と文字列情報とから文字情報デー
タを作成し、文書のイメージデータと文字情報データと
を関連付けて記憶するとともに、表示された文書のイメ
ージデータ上で2点を指定し、最初に指定した点を含む
文字領域内の行情報データを作成して指定点の文字を確
定し、確定した2つの文字の間の行の領域を反転表示
し、確定した2つの文字の間の文字列を取得すること
で、文書の文字列の表示画面上であらためて選択したい
文字列を探して選択することなく、文書のイメージデー
タの表示画面上で文書の文字列からの文字選択を容易に
行なうことができる。
【0115】また、特定の文字領域を確定し、その文字
領域内の任意の文字列を選択することで、異なる文字領
域にまたがった、文章として意味をなさない文字列を選
択することなく、任意の文字列を容易に選択することが
できる。 <変形例1>以下、上記第4実施例の変形例1について
説明する。
【0116】図31は、本変形例に係る電子ファイリン
グ装置の構成を示すブロック図である。なお、同図にお
いて、図18に示す上記第4実施例に係る装置と同一構
成要素には同一符号を付し、ここでは、簡単にそれらを
説明する。
【0117】図31において、領域分割部32は、すべ
ての文字領域の左上隅の水平位置、垂直位置、幅、高さ
からなる領域情報を抽出する。また、文字認識部33
は、すべての文字領域の領域情報と文字列を文書登録部
34に供給する。さらに、イメージ表示部36は、文書
のイメージデータとずべての文字領域のフレームを表示
するとともに、イメージ表示部36の表示画面上の特定
位置を指定した場合は、文字領域指定部75から指定位
置を受け取り、その指定位置を含む文字領域のフレーム
を強調表示する。
【0118】次に、上記のような構成をとる、本変形例
に係る電子ファイリング装置における文書登録処理の動
作について、図32に示すフローチャートに従って説明
する。
【0119】まず、オペレータからの開始指示により処
理を開始、例えば、処理スキャナ装置などで読み込んだ
文書のイメージデータをメモリ上に読み込む(ステップ
S161)。そして、読み込んだイメージデータに対し
て領域分割を行ない、文字領域情報として、文書のイメ
ージデータのすべての文字領域の左上隅の水平位置、垂
直位置、幅、高さからなる領域情報を抽出する(ステッ
プS162)。
【0120】なお、ここでの領域分割は、上記第1実施
例において説明した領域分割と同様であるため、その説
明を省略する。
【0121】次に、抽出した文字領域のイメージデータ
に対して文字認識を行ない、その文字領域に記されてい
る文字列を抽出し、図33に示すような、文字領域の領
域情報と文字列からなる文字情報データを作成する(ス
テップS163)。そして、ステップS163で作成し
た文書の文字情報データを、ページ数、登録日などの他
の文書管理情報とともに、文書のイメージデータと関連
付けてデータベースに登録し(ステップS164)、本
処理を終了する。
【0122】なお、本変形例における文書表示処理は、
図23に示す、上記第4実施例に係る装置における文書
表示処理と同じであるため、ここでは、その説明を省略
する。
【0123】次に、図31に示すような構成を有する電
子ファイリング装置における文書の文字列の選択処理の
動作について、図34に示すフローチャートに従って説
明する。
【0124】まず、オペレータの開始指示により処理を
開始し、文書表示処理により読み込まれた文字情報デー
タの文字領域の領域情報をもとに、すべての文字領域の
矩形領域のフレームを文書のイメージデータ上に重ねて
表示する(ステップS171)。そして、オペレータが
文書のイメージデータの表示画面上でポインタを所望の
位置に合わせてポインティングデバイスのボタンを押し
たかどうかを判別し(ステップS172)、それを押し
ていない場合は、オペレータがそのボタンを押すまで、
ステップS172の処理を繰り返し行なう。
【0125】オペレータが文書のイメージデータの表示
画面上でポインティングデバイスのボタンを押した場合
は、ボタンを押した位置をバッファselectPointに取得
する(ステップS173)。
【0126】次に、文字情報データに、まだ、以下に述
べるステップS174以降の処理をしていない文字情報
データがあるか否かを判別し(ステップS174)、未
処理の文字情報データがある場合は、まず、1番目の文
字領域の領域情報を取得して(ステップS175)、そ
の水平位置、垂直位置、高さ、幅からなる文字領域がse
lectPointを含むかどうかを判別する(ステップS17
6)。
【0127】上記の文字領域が指定点selectPointを含
まない場合は、処理をステップS174に戻し、次の文
字領域に対して、ステップS174からステップS17
6の処理を繰り返し行ない、最後の文字領域の領域情報
まで調べたならば、本処理を終了する。
【0128】しかし、上記の文字領域が指定点selectPo
intを含む場合(ステップS176での判定がYES)
は、その文字領域のフレームを強調表示し(ステップS
177)、その文字領域の文字列を取得して(ステップ
S178)、本処理を終了する。
【0129】図35は、上記のような文字烈選択処理の
表示画面の一例である。同図では、文書のイメージデー
タ上に、文字領域を示すフレーム80,81,82,8
3,84が表示され、オペレータが文字領域82を指定
すると、その文字領域が強調表示され、その文字領域の
文字列が選択される様子を示している。
【0130】このように、文書の文字領域の位置情報と
文字領域に記されている文字列を抽出し、文書のイメー
ジデータと文字領域のフレームを重ねて表示した画面上
でオペレータがポインティングデバイスで指定した文字
領域のフレームを強調表示後、その文字領域の文字列を
取得することで、文書の文字列の表示画面上であらため
て選択したい文字列を捜して選択することなく、文書の
イメージデータの表示画面上で文書の文字列からの文字
選択を容易に行なうことができる。
【0131】また、文字領域ごとに文字列を選択するこ
とができるので、纏まりのある文章の文字選択を容易に
行なうことができる。 <変形例2>以下、上記第4実施例の変形例2について
説明する。
【0132】図36は、本変形例に係る電子ファイリン
グ装置の構成を示すブロック図である。なお、同図に示
す電子ファイリング装置において、図18に示す、上記
第4実施例に係る装置と同一構成要素には同一符号を付
し、それらについては、簡単に説明する。
【0133】図36において、文字認識部33は、文書
読み込み部31からの文書のイメージデータを受け取
り、そのイメージデータに対して文字認識を行ない、文
書に記されている文字列と、各文字のイメージデータの
領域の位置と大きさからなる位置を抽出し、抽出した文
字列と位置情報を文書登録部34に供給する。
【0134】文書登録部34は、文書読み込み部31か
ら文書のイメージデータを、文字認識部33から文字列
と位置情報を受け取り、これらを他の文書管理情報と関
連付けてファイル装置35に登録する。
【0135】ここでは、文字情報読み込み部37は、フ
ァイル装置35からの文字列と位置情報を読み込み、そ
れらを選択文字取得部39に供給する。イメージ表示部
36は、ファイル装置35から文書のイメージデータを
読み込み、そのイメージデータを表示するとともに、オ
ペレータが特定の領域を選択した場合は、選択範囲指定
部38から選択領域の位置情報を受け取り、その領域の
フレームを文書のイメージデータに重ねて表示する。
【0136】選択範囲指定部38は、オペレータにより
指定される選択領域の位置情報をイメージ表示部36と
選択文字取得部39に供給する。そして、選択文字取得
部39は、文字情報読み込み部37からの文書の文字列
と位置情報と文字列情報を、また、選択範囲指定部38
からの選択領域の位置情報を受け取って、文書の文字列
から選択領域の文字列を取得する。
【0137】次に、上記の構成を有する、本変形例に係
る電子ファイリング装置における文書登録処理の動作に
ついて、図37に示すフローチャートに従って説明す
る。
【0138】まず、オペレータの開始指示により処理を
開始し、例えば、処理スキャナ装置などで読み込んだ文
書のイメージデータをメモリ上に読み込む(ステップS
181)。そして、そのイメージデータに対して文字認
識を行ない、文書に記されている文字列と、各文字のイ
メージ領域を抽出し、図38に示すような、文字コー
ド、文字のイメージ領域の左上隅の水平位置、左上隅の
垂直位置、幅、高さからなる文書の文字情報データを作
成する(ステップS182)。
【0139】上記の文字認識処理においては、従来よ
り、文字切りと呼ばれる処理で各文字のイメージ領域を
抽出し、それから各文字のイメージ領域のイメージデー
タにおいて文字認識を行ない、その文字の文字コードを
抽出する。しかし、ここでは、これら文字認識の方法に
ついては、その詳細な説明は省略する。
【0140】次に、ステップS182で作成した文書の
文字情報データを、ページ数、登録日などの他の文書管
理情報とともに、文書のイメージデータと関連付けてデ
ータベースに登録し(ステップS183)、本処理を終
了する。
【0141】なお、本変形例に係る文書表示処理につい
ても、図23に示す、上記第4実施例に係る装置におけ
る文書表示処理と同じであるため、ここでは、その説明
を省略する。
【0142】以下、本変形例に係る電子ファイリング装
置における文書の文字列の選択処理の動作について、図
39に示すのフローチャートに従って説明する。
【0143】まず、オペレータが、文書表示処理によ
り、文書のイメージデータの表示画面上でポインタを所
望の位置に合わせて、ポインティングデバイスのボタン
を押すことにより処理を開始し、そのときのポインタの
水平位置と垂直位置を、それぞれバッファstartPos.xと
startPos.yに取得する(ステップS191)。次に、オ
ペレータがポインティングデバイスのボタンを押したま
ま、その位置を移動することにより、そのときのポイン
タの水平位置と垂直位置を、それぞれバッファendPos.x
とendPos.yに取得する(ステップS192)。このとき
のstartPos.x、startPos.y、endPos.x、endPos.yからな
る矩形領域のフレームを文書のイメージデータに重ねて
表示する(ステップS193)。
【0144】そして、オペレータがポインティングデバ
イスのボタンを離したかどうかを判別し(ステップS1
94)、オペレータが、まだ、ポインティングデバイス
のボタンを離していない場合は、処理をステップS19
2に戻し、オペレータがポインティングデバイスのボタ
ンを離すまで、上記のステップS192からステップS
194の処理を繰り返し行なう。
【0145】一方、オペレータがポインティングデバイ
スのボタンを離したならば、文書表示処理により読み込
まれた文字情報データに、まだ、後述するステップS1
95以降の処理をしていないデータがあるか否かを判別
し(ステップS195)、未処理の文字情報データがあ
る場合は、まず、1番目の要素の文字情報を文字コー
ド、水平位置、垂直位置、高さ、幅からなる構造体text
Infoに取得する(ステップS196)。
【0146】次に、上記の水平位置、垂直位置、高さ、
幅からなる文字の領域が、startPos.x、startPos.y、en
dPos.x、endPos.yからなる選択領域に完全に含まれるか
どうかを判別する(ステップS197)。そして、文字
の領域が完全に含まれる場合は、その文字の文字コード
をバッファstringにコピーし(ステップS198)、処
理をステップS195に戻す。
【0147】また、文字の領域が選択領域に完全に含ま
れない場合は、何も処理せずに、ステップS195の処
理に戻る。そして、文字情報のデータのすべての要素に
対して、上記のステップS195からステップS198
の処理を繰り返し行ない、最後の要素まで調べたなら
ば、本処理を終了する。なお、このとき、stringには、
選択領域に完全に含まれるすべての文字の文字コードが
取得されている。
【0148】図40は、上記のような文字列選択処理に
おける表示画面の一例を示す図である。同図では、オペ
レータが、文書のイメージデータの表示画面上で、領域
90を指定し、その領域内の文字列が選択された様子を
示している。
【0149】このように、文書のイメージデータから文
字認識を行ない、文書の文字列と各文字のイメージ領域
の位置情報を抽出して、文書のイメージデータの表示画
面上の選択領域の位置情報と文字情報から選択文字を取
得することで、文書の文字列の表示画面上であらためて
選択したい文字列を捜して選択することなく、文書のイ
メージデータの表示画面上で直接文書の文字列を選択す
ることができ、文書に記されている文字列からの文字選
択を容易に行なうことができる。
【0150】なお、本発明は、複数の機器から構成され
るシステムに適用しても、1つの機器から成る装置に適
用しても良い。また、本発明は、システムあるいは装置
にプログラムを供給することによって達成される場合に
も適用できることは言うまでもない。
【0151】
【発明の効果】以上説明したように、本発明によれば、
特定された文書の文字領域のイメージデータを表示する
ことで、文書に記されている文字の一部の識別や、似た
レイアウト、特徴のないレイアウトの文書の識別が容易
になり、また、文字領域の組方向にかかわらず適切な表
示が可能となる。
【0152】また、他の発明によれば、文書のイメージ
データ上で指定された特定範囲や文字領域より文字列を
取得することで、文書の文字列からの文字選択が容易に
行なえる。
【0153】
【図面の簡単な説明】
【図1】本発明の第1実施例に係る電子ファイリング装
置の構成を示すブロック図である。
【図2】第1実施例に係る電子ファイリング装置におけ
る文書登録処理を示すフローチャートである。
【図3】第1実施例における文書の領域分割と文字領域
の順序付けを説明するための図である。
【図4】イメージデータ領域のイメージデータを一覧表
示する処理手順を示すフローチャートである。
【図5】一覧表示処理にて表示される文書領域画像一覧
の表示画面の一例を示す図である。
【図6】第2の実施例に係る電子ファイリング装置の構
成を示すブロック図である。
【図7】第2実施例における文書登録処理手順を示すフ
ローチャートである。
【図8】文字領域特定処理の動作の詳細手順を示すフロ
ーチャートである。
【図9】第3の実施例に係る電子ファイリング装置の構
成を示すブロック図である。
【図10】第3実施例における文書登録処理の動作を示
すフローチャートである。
【図11】文字領域切り出し処理の詳細手順を示すフロ
ーチャートである。
【図12】横書きの文字領域の切り出し領域確定処理の
詳細フローチャートである。
【図13】文書中の横書きの文字領域において切り出し
領域が確定された様子を示す図である。
【図14】縦書きの文字領域の切り出し領域確定処理の
動作を詳細に示すフローチャートである。
【図15】文書中の縦書きの文字領域において切り出し
領域が確定された様子を示す図である。
【図16】文字領域のイメージデータを一覧表示する処
理手順を示すフローチャートである。
【図17】一覧表示処理により表示される文書領域画像
一覧の表示画面の一例を示す図である。
【図18】第4の実施例に係る電子ファイリング装置の
構成を示すブロック図である。
【図19】第4実施例における文書登録処理の動作を示
すフローチャートである。
【図20】第4実施例における領域分割の動作を説明す
るための図である。
【図21】文字認識により抽出される各文字のイメージ
データの領域を説明するための図である。
【図22】作成された文字情報データを示す図である。
【図23】第4実施例における文書表示処理の動作を示
すフローチャートである。
【図24】文書の文字列の選択処理の動作を示すフロー
チャートである。
【図25】文字列選択処理における行情報データの作成
処理の詳細を示すフローチャートである。
【図26】行情報データ作成処理により作成される行情
報データの構成を示す図である。
【図27】横書きの文字領域から実際に作成される行情
報データを説明するための図である。
【図28】横書きの文字領域から実際に作成される行情
報データを説明するための図である。
【図29】文字列選択処理における指定文字の確定処理
の詳細フローチャートである。
【図30】文字列選択処理の表示画面の一例を示す図で
ある。
【図31】第4実施例の変形例1に係る電子ファイリン
グ装置の構成を示すブロック図である。
【図32】変形例1における文書登録処理を示すフロー
チャートである。
【図33】文字領域の領域情報と文字列からなる文字情
報データを示す図である。
【図34】文書の文字列の選択処理を示すフローチャー
トである。
【図35】文字列選択処理の表示画面の一例を示す図で
ある。
【図36】第4実施例の変形例2に係る電子ファイリン
グ装置の構成を示すブロック図である。
【図37】変形例2に係る文書登録処理を示すフローチ
ャートである。
【図38】文書の文字情報データを示す図である。
【図39】変形例2における文書の文字列の選択処理を
示すフローチャートである。
【図40】文字列選択処理における表示画面の一例を示
す図である。
【図41】従来の電子ファイリング装置の構成を示すブ
ロック図である。
【図42】従来の装置における縮小画像による文書の一
覧表示を示す図である。である。
【図43】従来の電子ファイリング装置の他の構成を示
すブロック図である。
【図44】従来の電子ファイリング装置における文書の
表示画面例を示す図である。
【符号の説明】
1,32 領域分割部 2 先頭文字領域特定部 3 文字領域切り出し部 4,34 文書登録部 5,35 ファイル装置 6 表示制御部 7 最大文字領域特定部 10,31 文書読み込み部 37 文字情報読み込み部 39 選択文字取得部

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 読み込んだ複数の文書を検索する電子フ
    ァイリング装置において、 前記読み込んだ文書のイメージデータに対して領域分割
    を行なう手段と、 前記領域分割された領域から文字領域を判別する手段
    と、 前記文字領域が複数ある場合、該複数の文字領域から1
    つの文字領域を特定する特定手段と、 前記特定された文字領域から特定の大きさのイメージデ
    ータを切り出す切出し手段と、 前記読み込んだ文書のイメージデータと、前記切り出さ
    れたイメージデータとを関連付けて記憶する記憶手段
    と、 前記検索に対応させて、前記記憶されたイメージデータ
    を表示する表示手段とを備えることを特徴とする電子フ
    ァイリング装置。
  2. 【請求項2】 さらに、前記複数の文字領域の順序付け
    を行なう手段を備え、前記特定手段は、前記順序付けの
    内、該順序が最初の文字領域を特定することを特徴とす
    る請求項1に記載の電子ファイリング装置。
  3. 【請求項3】 さらに、前記複数の文字領域の各領域に
    おける平均文字サイズを抽出する手段と、 前記抽出された平均文字サイズを相互に比較する手段と
    を備え、 前記特定手段は、前記比較された平均文字サイズの内、
    最大の平均文字サイズを有する領域を特定することを特
    徴とする請求項1に記載の電子ファイリング装置。
  4. 【請求項4】 さらに、前記文字領域の領域情報及び組
    方向を抽出する手段を備え、前記切出し手段は、該文字
    領域の領域情報及び組方向にて決定される領域を切り出
    すことを特徴とする請求項1に記載の電子ファイリング
    装置。
  5. 【請求項5】 前記記憶手段は、前記切り出されたイメ
    ージデータと前記組方向とを関連付けて記憶し、前記表
    示手段は、該記憶されたイメージデータを該組方向に従
    った方向で表示することを特徴とする請求項4に記載の
    電子ファイリング装置。
  6. 【請求項6】 読み込んだ複数の文書を検索する電子フ
    ァイリング装置において、 前記読み込んだ文書のイメージデータに対して領域分割
    を行なう手段と、 前記領域分割された領域から文字領域を判別する手段
    と、 前記文字領域のイメージデータに対して文字認識を行な
    う手段と、 前記文字認識に基づいて所定の情報を抽出する手段と、 前記読み込んだ文書のイメージデータと、前記所定の情
    報とを関連付けて記憶する記憶手段と、 前記読み込んだ文書のイメージデータを表示する手段
    と、 前記表示された文書のイメージデータ上において特定の
    範囲を指定する手段と、 前記所定の情報から、前記特定の範囲の文字列を取得す
    る取得手段とを備えることを特徴とする電子ファイリン
    グ装置。
  7. 【請求項7】 前記所定の情報は、前記文字領域の領域
    情報と組方向からなる文字領域情報、及び該文字領域に
    記された文字列と各文字のイメージデータの領域情報か
    らなる文字列情報であることを特徴とする請求項6に記
    載の電子ファイリング装置。
  8. 【請求項8】 前記所定の情報は、前記文字領域の領域
    情報、及び該文字領域の文字列であることを特徴とする
    請求項6に記載の電子ファイリング装置。
  9. 【請求項9】 前記所定の情報は、前記文書に記された
    文字列、及び各文字のイメージデータの領域情報である
    ことを特徴とする請求項6に記載の電子ファイリング装
    置。
  10. 【請求項10】 さらに、前記表示された文書のイメー
    ジデータ上で、前記特定の範囲として指定された2点の
    内、最初に指定した点を含む文字領域についての行情報
    データを作成する手段を備え、前記取得手段は、該行情
    報データをもとに前記文字列を取得することを特徴とす
    る請求項6に記載の電子ファイリング装置。
  11. 【請求項11】 さらに、前記特定の範囲についての文
    字領域を、前記表示された文書のイメージデータに対し
    て反転表示することを特徴とする請求項6に記載の電子
    ファイリング装置。
  12. 【請求項12】 さらに、前記特定の範囲についての文
    字領域を、前記表示された文書のイメージデータに対し
    て強調表示することを特徴とする請求項6に記載の電子
    ファイリング装置。
  13. 【請求項13】 読み込んだ複数の文書を検索する電子
    ファイリング方法において、 前記読み込んだ文書のイメージデータに対して領域分割
    を行なう工程と、 前記領域分割された領域から文字領域を判別する工程
    と、 前記文字領域が複数ある場合、該複数の文字領域から1
    つの文字領域を特定する工程と、 前記特定された文字領域から特定の大きさのイメージデ
    ータを切り出す工程と、 前記読み込んだ文書のイメージデータと、前記切り出さ
    れたイメージデータとを関連付けて記憶する工程と、 前記検索に対応させて、前記記憶されたイメージデータ
    を表示する工程とを備えることを特徴とする電子ファイ
    リング方法。
  14. 【請求項14】 読み込んだ複数の文書を検索する電子
    ファイリング方法において、 前記読み込んだ文書のイメージデータに対して領域分割
    を行なう工程と、 前記領域分割された領域から文字領域を判別する工程
    と、 前記文字領域のイメージデータに対して文字認識を行な
    う工程と、 前記文字認識に基づいて所定の情報を抽出する工程と、 前記読み込んだ文書のイメージデータと、前記所定の情
    報とを関連付けて記憶する工程と、 前記読み込んだ文書のイメージデータを表示する工程
    と、 前記表示された文書のイメージデータ上において特定の
    範囲を指定する工程と、前記所定の情報から、前記特定
    の範囲の文字列を取得する工程とを備えることを特徴と
    する電子ファイリング方法。
JP7013789A 1994-11-30 1995-01-31 電子ファイリング装置及びその方法 Pending JPH08202859A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7013789A JPH08202859A (ja) 1995-01-31 1995-01-31 電子ファイリング装置及びその方法
US08/562,450 US5821929A (en) 1994-11-30 1995-11-24 Image processing method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7013789A JPH08202859A (ja) 1995-01-31 1995-01-31 電子ファイリング装置及びその方法

Publications (1)

Publication Number Publication Date
JPH08202859A true JPH08202859A (ja) 1996-08-09

Family

ID=11843024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7013789A Pending JPH08202859A (ja) 1994-11-30 1995-01-31 電子ファイリング装置及びその方法

Country Status (1)

Country Link
JP (1) JPH08202859A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169827A (ja) * 2000-12-04 2002-06-14 Advance Design Corp 一括検索サイト
JP2006092048A (ja) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd 画像処理装置
CN116092108A (zh) * 2023-03-20 2023-05-09 四川竺信档案数字科技有限责任公司 一种实体文档扫描生成pdf文件的方法、系统及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169827A (ja) * 2000-12-04 2002-06-14 Advance Design Corp 一括検索サイト
JP2006092048A (ja) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd 画像処理装置
JP4548062B2 (ja) * 2004-09-22 2010-09-22 富士ゼロックス株式会社 画像処理装置
CN116092108A (zh) * 2023-03-20 2023-05-09 四川竺信档案数字科技有限责任公司 一种实体文档扫描生成pdf文件的方法、系统及存储介质

Similar Documents

Publication Publication Date Title
US5754712A (en) Image processing apparatus
US6002798A (en) Method and apparatus for creating, indexing and viewing abstracted documents
JP2816241B2 (ja) 画像情報検索装置
EP1661064B1 (en) Document scanner
JP2005108254A (ja) アイコン生成方法、アイコン選択方法及び文書検索方法
JPH10162150A (ja) ページ解析システム
US20080244384A1 (en) Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus
JP4054428B2 (ja) 画像検索装置及びその方法、コンピュータ可読メモリ
JP2005182460A (ja) 情報処理装置、注釈処理方法、情報処理プログラムおよび情報処理プログラムを格納した記録媒体
US6504540B1 (en) Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP3319203B2 (ja) 文書ファイリング方法及び装置
JPH08180068A (ja) 電子ファイリング装置
JPH08202859A (ja) 電子ファイリング装置及びその方法
JPH11238072A (ja) 文書保管装置
JPH03276260A (ja) 文字コードのタイトル処理機能を備えた電子フアイリング装置
JPH10162024A (ja) 電子ファイリング方法及び電子ファイリング装置
JPH08153110A (ja) 文書ファイリング装置及び方法
JP2550068B2 (ja) 情報の検索・表示方法
JP2021157627A (ja) 情報処理装置
JPH1166065A (ja) 画像配置装置およびそのプログラム記録媒体
JP4501731B2 (ja) 画像処理装置
JPS63293674A (ja) 文章を検索・表示する方法
JPH1115826A (ja) 文書解析装置及び方法
JPH09269970A (ja) 文字認識方法とその装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050221

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050617