JP2000322417A - 画像ファイリング装置及び方法及び記憶媒体 - Google Patents
画像ファイリング装置及び方法及び記憶媒体Info
- Publication number
- JP2000322417A JP2000322417A JP11126398A JP12639899A JP2000322417A JP 2000322417 A JP2000322417 A JP 2000322417A JP 11126398 A JP11126398 A JP 11126398A JP 12639899 A JP12639899 A JP 12639899A JP 2000322417 A JP2000322417 A JP 2000322417A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- storing
- character code
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 21
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 文書画像をファイリングして所望とする文字
列で検索させたとき、その文字列が文書画像中のどの位
置の文字列画像に対応するかを明示する。 【解決手段】 原稿画像を読み取り、その中のテキスト
領域中の文字画像を認識する。そして、読み取って得ら
れた原稿画像データ、認識して得られた文字コード、及
び、認識対象となった文字画像の位置情報を記憶する。
そして、検索時には、与えられた検索文字列に一致する
文字列を探し出し、その文字列を有する画像を表示す
る。且つ、表示する画像中の該当する文字列画像部分を
強調表示する。
列で検索させたとき、その文字列が文書画像中のどの位
置の文字列画像に対応するかを明示する。 【解決手段】 原稿画像を読み取り、その中のテキスト
領域中の文字画像を認識する。そして、読み取って得ら
れた原稿画像データ、認識して得られた文字コード、及
び、認識対象となった文字画像の位置情報を記憶する。
そして、検索時には、与えられた検索文字列に一致する
文字列を探し出し、その文字列を有する画像を表示す
る。且つ、表示する画像中の該当する文字列画像部分を
強調表示する。
Description
【0001】
【発明の属する技術分野】本発明は画像ファイリング装
置及び方法及び記憶媒体に関するものである。
置及び方法及び記憶媒体に関するものである。
【0002】
【従来の技術】紙の文書をスキャナで光学信号から電気
信号に変換する文書の電子化は、今日ではごく一般的に
行われている。特に、近年の文字認識技術の発展によ
り、文書を単なる画像データとしてではなく、その内容
までも計算機に可読な形でコード化することが可能にな
った。
信号に変換する文書の電子化は、今日ではごく一般的に
行われている。特に、近年の文字認識技術の発展によ
り、文書を単なる画像データとしてではなく、その内容
までも計算機に可読な形でコード化することが可能にな
った。
【0003】その技術を応用すると、紙で与えられた文
書中から、ある特定の単語、文字列に関連する情報をピ
ックアップするために、これまで人手を介して入力して
いた作業が不要になると共に、与えられた文書内の全て
の文字コード列が検索対象として使用できるようにもな
る。
書中から、ある特定の単語、文字列に関連する情報をピ
ックアップするために、これまで人手を介して入力して
いた作業が不要になると共に、与えられた文書内の全て
の文字コード列が検索対象として使用できるようにもな
る。
【0004】図5は、文書画像を入力して、その中に記
載された文字コード列を得る、いわゆる文字認識ソフト
ウェアの実行画面の例である。ディスプレイ上のマルチ
ウィンドウ表示を用い、左側に入力された文書画像のビ
ットマップ表示、右側に認識出力された、文書内の文字
コード列のテキスト表示がなされている。図例では更
に、テキスト表示の内容に対し、「レイアウト」という
文字列の検索が行なわれており、検出された部分が反転
で強調表示されていることを示している。この検出結果
から、文書中の所望の文字列を索引として取得すること
ができる。
載された文字コード列を得る、いわゆる文字認識ソフト
ウェアの実行画面の例である。ディスプレイ上のマルチ
ウィンドウ表示を用い、左側に入力された文書画像のビ
ットマップ表示、右側に認識出力された、文書内の文字
コード列のテキスト表示がなされている。図例では更
に、テキスト表示の内容に対し、「レイアウト」という
文字列の検索が行なわれており、検出された部分が反転
で強調表示されていることを示している。この検出結果
から、文書中の所望の文字列を索引として取得すること
ができる。
【0005】しかし、現在の文字認識技術では、比較的
状態のよい印刷文書を対象にしてさえも100%の完全
な認識率を得るのは難しい。したがって、前記のテキス
ト表示部に表示された文字コード列は、元の文書の情報
を完全に正しく再現しているとは限らない。さらに、文
書には図、写真等、テキスト表示部には現れない情報が
含まれていることもある。よって、情報を正しく得るた
めには、図5の例では、テキスト表示ではなく、画像デ
ータ表示部から、検索結果の文字列に対応する部分を見
つけて情報を参照する必要がある。
状態のよい印刷文書を対象にしてさえも100%の完全
な認識率を得るのは難しい。したがって、前記のテキス
ト表示部に表示された文字コード列は、元の文書の情報
を完全に正しく再現しているとは限らない。さらに、文
書には図、写真等、テキスト表示部には現れない情報が
含まれていることもある。よって、情報を正しく得るた
めには、図5の例では、テキスト表示ではなく、画像デ
ータ表示部から、検索結果の文字列に対応する部分を見
つけて情報を参照する必要がある。
【0006】
【発明が解決しようとする課題】前述の例では、テキス
ト表示部に示された検索の結果から、画像表示部の画像
データの対応づけは、オペレータが行わなければならな
い。特に、文書が多数の段組からなっていたり、複雑な
文字配置になっている場合、さらに、複数ページからな
る大量の文書から検索を行った場合など、テキスト表示
部の文字列に対応する部分を表示画像から目視で探索す
る手間は非常に大きかった。
ト表示部に示された検索の結果から、画像表示部の画像
データの対応づけは、オペレータが行わなければならな
い。特に、文書が多数の段組からなっていたり、複雑な
文字配置になっている場合、さらに、複数ページからな
る大量の文書から検索を行った場合など、テキスト表示
部の文字列に対応する部分を表示画像から目視で探索す
る手間は非常に大きかった。
【0007】本発明はかかる問題点に鑑みなされたもの
であり、文書画像をファイリングして所望とする文字列
で検索させたとき、その文字列が文書画像中のどの位置
の文字列画像に対応するかを明示することを可能ならし
める画像ファイリング装置及び方法及び記憶媒体を提供
しようとするものである。
であり、文書画像をファイリングして所望とする文字列
で検索させたとき、その文字列が文書画像中のどの位置
の文字列画像に対応するかを明示することを可能ならし
める画像ファイリング装置及び方法及び記憶媒体を提供
しようとするものである。
【0008】
【課題を解決するための手段】この課題を解決するた
め、例えば本発明の画像ファイリング装置は以下の構成
を備える。すなわち、原稿画像を読み取り記憶保存する
画像ファイリング装置であって、読み取って得られた原
稿画像データ中のテキスト領域中の文字画像を認識する
文字認識手段と、認識して得られた文字コード及び認識
された文字画像の前記原稿画像データ中における位置情
報を、前記原稿画像データと関連づけて保存する保存手
段と、入力された文字コード列を検索文字コード列と
し、前記保存手段に保存された文字コード群の中から検
索する検索手段と、該検索手段によって一致する文字コ
ード列を含む画像を前記保存手段で保存された中から抽
出し、表示する画像表示手段と、該表示手段で表示され
る画像中の、検索された文字コード群のそれぞれの位置
情報に基づく領域を強調表示する強調表示手段とを備え
る。
め、例えば本発明の画像ファイリング装置は以下の構成
を備える。すなわち、原稿画像を読み取り記憶保存する
画像ファイリング装置であって、読み取って得られた原
稿画像データ中のテキスト領域中の文字画像を認識する
文字認識手段と、認識して得られた文字コード及び認識
された文字画像の前記原稿画像データ中における位置情
報を、前記原稿画像データと関連づけて保存する保存手
段と、入力された文字コード列を検索文字コード列と
し、前記保存手段に保存された文字コード群の中から検
索する検索手段と、該検索手段によって一致する文字コ
ード列を含む画像を前記保存手段で保存された中から抽
出し、表示する画像表示手段と、該表示手段で表示され
る画像中の、検索された文字コード群のそれぞれの位置
情報に基づく領域を強調表示する強調表示手段とを備え
る。
【0009】
【発明の実施の形態】以下、添付図面に従って本発明に
かかる実施形態を詳細に説明する。
かかる実施形態を詳細に説明する。
【0010】図1は本発明の第一の実施例の構成を示す
ブロック図である。
ブロック図である。
【0011】101は原稿を光電変換により画像データ
に変換する、スキャナ等の入力装置、102は画像デー
タ、およびオペレータ操作の表示インタフェースとなる
ディスプレイ装置、103はオペレータ操作の入力イン
タフェースであるキーボード、マウス等の入力装置、1
04は画像データやテキスト文字を紙に印刷する印刷装
置である。
に変換する、スキャナ等の入力装置、102は画像デー
タ、およびオペレータ操作の表示インタフェースとなる
ディスプレイ装置、103はオペレータ操作の入力イン
タフェースであるキーボード、マウス等の入力装置、1
04は画像データやテキスト文字を紙に印刷する印刷装
置である。
【0012】105は文書画像をテキスト領域、図領
域、表領域といった性質の異るブロックに分割する領域
分割部、106はテキスト領域部の文字を認識して文字
コード列とする文字認識部、107は文字コード列か
ら、オペレータの指示した検索文字列を検索する、文字
列検索部である。
域、表領域といった性質の異るブロックに分割する領域
分割部、106はテキスト領域部の文字を認識して文字
コード列とする文字認識部、107は文字コード列か
ら、オペレータの指示した検索文字列を検索する、文字
列検索部である。
【0013】108は105,106,107の動作を
制御しながら、102,103,104,105と入出
力を行い実施例全体を制御する中央制御装置(以下、C
PU)である。109メモリはCPU108が行う制御
プログラム、および取り扱われる画像や文字コードなど
を収める、RAM、ハードデイスク等の記憶装置であ
る。
制御しながら、102,103,104,105と入出
力を行い実施例全体を制御する中央制御装置(以下、C
PU)である。109メモリはCPU108が行う制御
プログラム、および取り扱われる画像や文字コードなど
を収める、RAM、ハードデイスク等の記憶装置であ
る。
【0014】本発明の第1の実施例の動作を、図2のフ
ローチャートを用いて説明する。
ローチャートを用いて説明する。
【0015】先ず、ステップS201にて、原稿文書
(紙)をスキャナ等を用いて画像データへと変換する。
手動、あるいはオートドキュメントフィーダなどを用い
て、複数枚を入力した場合は、枚数と同じ個別の画像デ
ータが生成され、それぞれに与えられた個別の画像ID
を割り当て、入力順にメモリ109に保存していく。
(紙)をスキャナ等を用いて画像データへと変換する。
手動、あるいはオートドキュメントフィーダなどを用い
て、複数枚を入力した場合は、枚数と同じ個別の画像デ
ータが生成され、それぞれに与えられた個別の画像ID
を割り当て、入力順にメモリ109に保存していく。
【0016】全ての原稿画像データの保存が終わると、
ステップS202に進んで、メモリ109に格納された
中の未処理の画像データを入力順に1つ選択する。次い
で、ステップS203に進み、選択された画像データに
対しテキスト領域、図領域、表領域といった性質の異る
ブロックに分割する。
ステップS202に進んで、メモリ109に格納された
中の未処理の画像データを入力順に1つ選択する。次い
で、ステップS203に進み、選択された画像データに
対しテキスト領域、図領域、表領域といった性質の異る
ブロックに分割する。
【0017】この処理の内容を図3を用いて説明する。
選択された画像データは、その領域識別処理を行って、
性質の異なる矩形領域(ブロック)に分割し、各ブロッ
クについてそのブロックがテキスト領域であるのか、図
形領域であるのかを判断する。判断する手法としては、
本実施形態の場合、領域の黒画素の密集度などを用いて
行ったが、勿論、これ以外の公知技術を用いてもよい。
選択された画像データは、その領域識別処理を行って、
性質の異なる矩形領域(ブロック)に分割し、各ブロッ
クについてそのブロックがテキスト領域であるのか、図
形領域であるのかを判断する。判断する手法としては、
本実施形態の場合、領域の黒画素の密集度などを用いて
行ったが、勿論、これ以外の公知技術を用いてもよい。
【0018】ステップS204では、こうして判別され
たブロックの中で、テキスト領域として判別されたブロ
ックのすべてに対し文字認識処理を行い、結果を文字コ
ード列としてメモリに保存する。文字認識処理そのもの
は公知のものを用いるものとするが、実施形態では、認
識対象の切り出そうとする文字イメージの原稿画像中の
どの位置にあるのかを示す位置情報及びその大ききなど
の情報が各文字に伴なわれて記憶していく。
たブロックの中で、テキスト領域として判別されたブロ
ックのすべてに対し文字認識処理を行い、結果を文字コ
ード列としてメモリに保存する。文字認識処理そのもの
は公知のものを用いるものとするが、実施形態では、認
識対象の切り出そうとする文字イメージの原稿画像中の
どの位置にあるのかを示す位置情報及びその大ききなど
の情報が各文字に伴なわれて記憶していく。
【0019】こうして得られた文字コード列のデータの
例を図4に示す。なお、図示の左端の「文字」は文字コ
ードに対応する文字が如何なるものであるのかを示して
いるだけであり、実際はそれ以外の文字コード、その文
字コードが存在する画像ID、そして座標位置とサイズ
情報が記憶されることになる。また、文字イメージの位
置情報はその文字の切り出し位置の左下位置を(x、
y)形式で保存し、その位置から垂直及び水平方向のド
ット数をサイズ情報として記憶するようにした。
例を図4に示す。なお、図示の左端の「文字」は文字コ
ードに対応する文字が如何なるものであるのかを示して
いるだけであり、実際はそれ以外の文字コード、その文
字コードが存在する画像ID、そして座標位置とサイズ
情報が記憶されることになる。また、文字イメージの位
置情報はその文字の切り出し位置の左下位置を(x、
y)形式で保存し、その位置から垂直及び水平方向のド
ット数をサイズ情報として記憶するようにした。
【0020】図2に戻って、上記のようにして文字認識
処理を行うが、未処理の画像データがある場合はステッ
プS202に戻り、すべての画像を処理していく。
処理を行うが、未処理の画像データがある場合はステッ
プS202に戻り、すべての画像を処理していく。
【0021】以上の結果、スキャナ101で全ての原稿
に対応する画像データが特有のIDで記憶管理されると
共に、各画像中のテキストブロックの認識結果である文
字コードが、どの画像のものであるかを示す情報(I
D)とその座標位置及び大きさと共に関連づけられて保
存されることになる。
に対応する画像データが特有のIDで記憶管理されると
共に、各画像中のテキストブロックの認識結果である文
字コードが、どの画像のものであるかを示す情報(I
D)とその座標位置及び大きさと共に関連づけられて保
存されることになる。
【0022】次いで、ステップS206に処理が進む
と、オペレータが、キーボードやマウス等を用いて検索
指示を行い、検索文字列を入力して検索処理を行わせる
と、ステップS207に進んで、その検索文字列に合致
する文字コード群を、メモリ109に保存されている文
字コード群の中から探し出す。
と、オペレータが、キーボードやマウス等を用いて検索
指示を行い、検索文字列を入力して検索処理を行わせる
と、ステップS207に進んで、その検索文字列に合致
する文字コード群を、メモリ109に保存されている文
字コード群の中から探し出す。
【0023】ステップS208では、文字コード列中の
検出された文字列と対応するIDを持つ画像を画像表示
装置に表示する。このとき、検索文字列と一致する文字
コードに付随する座標データ及びそのサイズ情報を得る
ことができるので、それらの情報に基づいて、表示され
た画像中の該当する文字画像領域の強調表示させる。
検出された文字列と対応するIDを持つ画像を画像表示
装置に表示する。このとき、検索文字列と一致する文字
コードに付随する座標データ及びそのサイズ情報を得る
ことができるので、それらの情報に基づいて、表示され
た画像中の該当する文字画像領域の強調表示させる。
【0024】図6は、検索文字列として「レイアウト」
を設定して上記処理を行った例を示している。図示の如
く、検索処理を行ったとき、レイアウトなる文字画像部
分がハイライト表示され、その画像が検索条件に一致し
たこと、及び、どの位置の文字画像が一致したかが一目
瞭然とさせることができる。
を設定して上記処理を行った例を示している。図示の如
く、検索処理を行ったとき、レイアウトなる文字画像部
分がハイライト表示され、その画像が検索条件に一致し
たこと、及び、どの位置の文字画像が一致したかが一目
瞭然とさせることができる。
【0025】なお、強調表示には、反転表示に限るもの
ではなく、文字部分の背景がまわりの背景とは異なる色
にしたり、アンダーラインを施したりしても良い。
ではなく、文字部分の背景がまわりの背景とは異なる色
にしたり、アンダーラインを施したりしても良い。
【0026】また、検索文字列に一致する文字列が複数
の画像で検出された場合には、まず先頭の文字列に対応
する画像を表示する。そして、図示の操作ウインドウ6
00の上下のボタンをマウス等で操作することで、次の
画像、前の画像へと切り替えて表示する。画像の切り換
わりが行われたとき、その画像中の一致した文字画像を
強調表示するのは勿論である。
の画像で検出された場合には、まず先頭の文字列に対応
する画像を表示する。そして、図示の操作ウインドウ6
00の上下のボタンをマウス等で操作することで、次の
画像、前の画像へと切り替えて表示する。画像の切り換
わりが行われたとき、その画像中の一致した文字画像を
強調表示するのは勿論である。
【0027】こうして、更に別の文字列の検索を行うと
の指示があると、処理はステップS206に戻り、上記
処理を再度行う。また、検索終了の指示があると、本処
理を終える。
の指示があると、処理はステップS206に戻り、上記
処理を再度行う。また、検索終了の指示があると、本処
理を終える。
【0028】なお、図2のフローチャートは、一連の処
理をまとめてたものであり、実際は、ステップS201
〜S205と、ステップS206〜ステップS209は
それぞれ独立して起動できるものである。
理をまとめてたものであり、実際は、ステップS201
〜S205と、ステップS206〜ステップS209は
それぞれ独立して起動できるものである。
【0029】以上説明したように本実施形態によれば、
操作者からすれば、文書画像をファイリングしていって
データベースを構築できると共に、あたかもキーボード
等から入力した文字列を検索文字列として検索させ、該
当する文字画像を有する文書画像を検索することが可能
となる。しかも、そのとき、文書画像中のどの位置の文
字列画像が検索に一致したかが一目瞭然とさせることも
可能になる。
操作者からすれば、文書画像をファイリングしていって
データベースを構築できると共に、あたかもキーボード
等から入力した文字列を検索文字列として検索させ、該
当する文字画像を有する文書画像を検索することが可能
となる。しかも、そのとき、文書画像中のどの位置の文
字列画像が検索に一致したかが一目瞭然とさせることも
可能になる。
【0030】先に説明したように、従来は、文字認識し
て得られたテキストウインドウを別個に表示して、その
中で検索していたのに対し、本実施形態の処理にしたが
えば、テキストウインドウを表示するスペースも不要に
なり、表示スペースを有効利用することも可能になる。
て得られたテキストウインドウを別個に表示して、その
中で検索していたのに対し、本実施形態の処理にしたが
えば、テキストウインドウを表示するスペースも不要に
なり、表示スペースを有効利用することも可能になる。
【0031】なお、上記実施形態では、紙の文書を画像
データ化して文字認識を行い、その文字コード列に対す
る検索を行って、結果を画像データ中の文字列強調とし
て、ディスプレイに表示したが、画像データを紙に印刷
できるプリンタ等の印刷装置を用い、検索結果の文字列
への強調修飾を含んだ画像データをプリントアウトして
もよい。
データ化して文字認識を行い、その文字コード列に対す
る検索を行って、結果を画像データ中の文字列強調とし
て、ディスプレイに表示したが、画像データを紙に印刷
できるプリンタ等の印刷装置を用い、検索結果の文字列
への強調修飾を含んだ画像データをプリントアウトして
もよい。
【0032】その場合、紙の文書中にある任意の検索文
字列に関連する情報を得るために、オペレータは元文書
と同じ形式で、かつ検索結果文字列が強調印刷された紙
の文書を得ることができ、それをチェックするだけで所
望の情報を容易に参照できるようになる。よって検索に
よる情報収集作業の効率が向上する。
字列に関連する情報を得るために、オペレータは元文書
と同じ形式で、かつ検索結果文字列が強調印刷された紙
の文書を得ることができ、それをチェックするだけで所
望の情報を容易に参照できるようになる。よって検索に
よる情報収集作業の効率が向上する。
【0033】また、本発明は、複数の機器(例えばホス
トコンピュータ、インタフェイス機器、リーダ、プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置に適用してもよい。また、ファイリン
グ装置により作成されたデータベースをネットワーク上
のサーバに設け、クライアント側から検索するシステム
に適用しても構わない。
トコンピュータ、インタフェイス機器、リーダ、プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置に適用してもよい。また、ファイリン
グ装置により作成されたデータベースをネットワーク上
のサーバに設け、クライアント側から検索するシステム
に適用しても構わない。
【0034】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納されたプログ
ラムコードを読み出し実行することによっても、達成さ
れることは言うまでもない。この場合、記憶媒体から読
み出されたプログラムコード自体が前述した実施形態の
機能を実現することになり、そのプログラムコードを記
憶した記憶媒体は本発明を構成することになる。また、
コンピュータが読み出したプログラムコードを実行する
ことにより、前述した実施形態の機能が実現されるだけ
でなく、そのプログラムコードの指示に基づき、コンピ
ュータ上で稼働しているオペレーティングシステム(OS)
などが実際の処理の一部または全部を行い、その処理に
よって前述した実施形態の機能が実現される場合も含ま
れることは言うまでもない。
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納されたプログ
ラムコードを読み出し実行することによっても、達成さ
れることは言うまでもない。この場合、記憶媒体から読
み出されたプログラムコード自体が前述した実施形態の
機能を実現することになり、そのプログラムコードを記
憶した記憶媒体は本発明を構成することになる。また、
コンピュータが読み出したプログラムコードを実行する
ことにより、前述した実施形態の機能が実現されるだけ
でなく、そのプログラムコードの指示に基づき、コンピ
ュータ上で稼働しているオペレーティングシステム(OS)
などが実際の処理の一部または全部を行い、その処理に
よって前述した実施形態の機能が実現される場合も含ま
れることは言うまでもない。
【0035】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0036】
【発明の効果】以上説明したように本発明によれば、文
書画像をファイリングして所望とする文字列で検索させ
たとき、その文字列が文書画像中のどの位置の文字列画
像に対応するかを明示することが可能になる。
書画像をファイリングして所望とする文字列で検索させ
たとき、その文字列が文書画像中のどの位置の文字列画
像に対応するかを明示することが可能になる。
【図1】実施形態の装置のブロック構成図である。
【図2】実施形態の処理手順を示すフローチャートであ
る。
る。
【図3】実施形態における領域分割の例を示す図であ
る。
る。
【図4】実施形態における文字認識結果の情報の構造を
示す図である。
示す図である。
【図5】従来の文字認識ソフトウェアを用いた文字列検
索の例を示す図である。
索の例を示す図である。
【図6】実施形態における文字列検索結果の一例を示す
図である。
図である。
Claims (5)
- 【請求項1】 原稿画像を読み取り記憶保存する画像フ
ァイリング装置であって、 読み取って得られた原稿画像データ中のテキスト領域中
の文字画像を認識する文字認識手段と、 認識して得られた文字コード及び認識された文字画像の
前記原稿画像データ中における位置情報を、前記原稿画
像データと関連づけて保存する保存手段と、 入力された文字コード列を検索文字コード列とし、前記
保存手段に保存された文字コード群の中から検索する検
索手段と、 該検索手段によって一致する文字コード列を含む画像を
前記保存手段で保存された中から抽出し、表示する画像
表示手段と、 該表示手段で表示される画像中の、検索された文字コー
ド群のそれぞれの位置情報に基づく領域を強調表示する
強調表示手段とを備えることを特徴とする画像ファイリ
ング装置。 - 【請求項2】 前記保存手段で保存する位置情報には、
文字画像のサイズ情報が含まれることを特徴とする請求
項第1項に記載の画像ファイリング装置。 - 【請求項3】 前記強調表示手段は、文字画像の位置と
サイズ情報に基づいて、該当する文字画像を反転して表
示する手段であることを特徴とする請求項第2項に記載
の画像ファイリング装置。 - 【請求項4】 原稿画像を読み取り記憶保存する画像フ
ァイリング方法であって、 読み取って得られた原稿画像データ中のテキスト領域中
の文字画像を認識する文字認識工程と、 認識して得られた文字コード及び認識された文字画像の
前記原稿画像データ中における位置情報を、前記原稿画
像データと関連づけて保存する保存工程と、 入力された文字コード列を検索文字コード列とし、前記
保存工程によって保存された文字コード群の中から検索
する検索工程と、 該検索工程によって一致する文字コード列を含む画像を
前記保存工程によって保存された中から抽出し、表示す
る画像表示工程と、 該画像表示工程によって表示される画像中の、検索され
た文字コード群のそれぞれの位置情報に基づく領域を強
調表示する強調表示工程とを備えることを特徴とする画
像ファイリング方法。 - 【請求項5】 コンピュータが読み込み実行するプログ
ラムコードを格納する記憶媒体であって、 読み取って得られた原稿画像データ中のテキスト領域中
の文字画像を認識する文字認識手段と、 認識して得られた文字コード及び認識された文字画像の
前記原稿画像データ中における位置情報を、前記原稿画
像データと関連づけて保存する保存手段と、 入力された文字コード列を検索文字コード列とし、前記
保存手段に保存された文字コード群の中から検索する検
索手段と、 該検索手段によって一致する文字コード列を含む画像を
前記保存手段で保存された中から抽出し、表示する画像
表示手段と、 該表示手段で表示される画像中の、検索された文字コー
ド群のそれぞれの位置情報に基づく領域を強調表示する
強調表示手段として機能するプログラムコードを格納す
る記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11126398A JP2000322417A (ja) | 1999-05-06 | 1999-05-06 | 画像ファイリング装置及び方法及び記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11126398A JP2000322417A (ja) | 1999-05-06 | 1999-05-06 | 画像ファイリング装置及び方法及び記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000322417A true JP2000322417A (ja) | 2000-11-24 |
Family
ID=14934174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11126398A Withdrawn JP2000322417A (ja) | 1999-05-06 | 1999-05-06 | 画像ファイリング装置及び方法及び記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000322417A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007058605A (ja) * | 2005-08-24 | 2007-03-08 | Ricoh Co Ltd | 文書管理システム |
WO2009005021A1 (en) | 2007-06-29 | 2009-01-08 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and computer program |
WO2009005019A1 (en) | 2007-06-29 | 2009-01-08 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and computer program |
EP2071493A2 (en) | 2007-12-12 | 2009-06-17 | Canon Kabushiki Kaisha | Image processing device, image processing method, and program and recording medium thereof |
JP2010267174A (ja) * | 2009-05-18 | 2010-11-25 | Nec Casio Mobile Communications Ltd | 端末装置およびプログラム |
JP2010286882A (ja) * | 2009-06-09 | 2010-12-24 | Mitsubishi Electric Corp | プログラマブル表示器、ドキュメント表示方法とその方法を実行するプログラムおよびそれを記録した記録媒体、並びにキーワード位置情報作成方法とその方法を実行するプログラムおよびそれを記録した記録媒体 |
KR101018310B1 (ko) | 2008-02-19 | 2011-03-04 | 캐논 가부시끼가이샤 | 전자 문서 생성장치, 전자 문서 생성방법, 및 기억매체 |
JP2019109704A (ja) * | 2017-12-18 | 2019-07-04 | トッパン・フォームズ株式会社 | 文書マークアップ装置、文書マークアップ方法、及びプログラム |
JP2019211811A (ja) * | 2018-05-31 | 2019-12-12 | 富士ゼロックス株式会社 | 画像処理装置およびプログラム |
CN113435166A (zh) * | 2021-06-09 | 2021-09-24 | 深圳市世强元件网络有限公司 | 一种加下划线方法和系统、计算机装置、可读存储介质 |
-
1999
- 1999-05-06 JP JP11126398A patent/JP2000322417A/ja not_active Withdrawn
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007058605A (ja) * | 2005-08-24 | 2007-03-08 | Ricoh Co Ltd | 文書管理システム |
RU2437152C2 (ru) * | 2007-06-29 | 2011-12-20 | Кэнон Кабусики Кайся | Устройство обработки изображений, способ и компьютерная программа обработки изображений |
EP2162859A4 (en) * | 2007-06-29 | 2010-07-28 | Canon Kk | Image processing device, image processing method and computer program |
US8532388B2 (en) | 2007-06-29 | 2013-09-10 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and computer program |
WO2009005021A1 (en) | 2007-06-29 | 2009-01-08 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and computer program |
EP2162839A4 (en) * | 2007-06-29 | 2010-07-28 | Canon Kk | IMAGE PROCESSING APPARATUS, IMAGE PROCESSING METHOD, AND COMPUTER PROGRAM |
US8077971B2 (en) | 2007-06-29 | 2011-12-13 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and computer program |
US8503773B2 (en) | 2007-06-29 | 2013-08-06 | Canon Kabushiki Kaisha | Glyph selection and electronic document generation |
KR101128602B1 (ko) | 2007-06-29 | 2012-03-23 | 캐논 가부시끼가이샤 | 화상 처리 장치, 화상 처리 방법 및 컴퓨터 판독 가능 저장 매체 |
WO2009005019A1 (en) | 2007-06-29 | 2009-01-08 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and computer program |
EP2400454A1 (en) | 2007-06-29 | 2011-12-28 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and computer program |
EP2071493A3 (en) * | 2007-12-12 | 2013-08-14 | Canon Kabushiki Kaisha | Image processing device, image processing method, and program and recording medium thereof |
EP2071493A2 (en) | 2007-12-12 | 2009-06-17 | Canon Kabushiki Kaisha | Image processing device, image processing method, and program and recording medium thereof |
KR101018310B1 (ko) | 2008-02-19 | 2011-03-04 | 캐논 가부시끼가이샤 | 전자 문서 생성장치, 전자 문서 생성방법, 및 기억매체 |
JP2010267174A (ja) * | 2009-05-18 | 2010-11-25 | Nec Casio Mobile Communications Ltd | 端末装置およびプログラム |
JP2010286882A (ja) * | 2009-06-09 | 2010-12-24 | Mitsubishi Electric Corp | プログラマブル表示器、ドキュメント表示方法とその方法を実行するプログラムおよびそれを記録した記録媒体、並びにキーワード位置情報作成方法とその方法を実行するプログラムおよびそれを記録した記録媒体 |
JP2019109704A (ja) * | 2017-12-18 | 2019-07-04 | トッパン・フォームズ株式会社 | 文書マークアップ装置、文書マークアップ方法、及びプログラム |
JP2019211811A (ja) * | 2018-05-31 | 2019-12-12 | 富士ゼロックス株式会社 | 画像処理装置およびプログラム |
CN113435166A (zh) * | 2021-06-09 | 2021-09-24 | 深圳市世强元件网络有限公司 | 一种加下划线方法和系统、计算机装置、可读存储介质 |
CN113435166B (zh) * | 2021-06-09 | 2024-03-19 | 深圳市世强元件网络有限公司 | 一种加下划线方法和系统、计算机装置、可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4461769B2 (ja) | 文書検索・閲覧手法及び文書検索・閲覧装置 | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
JP2009146064A (ja) | 画像処理装置、画像処理方法、そのプログラム及び記憶媒体 | |
CN113111881A (zh) | 信息处理装置及记录媒体 | |
JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
JP2000322417A (ja) | 画像ファイリング装置及び方法及び記憶媒体 | |
JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
JP2740335B2 (ja) | 自動セル属性判定機能を有する表読取装置 | |
US5854860A (en) | Image filing apparatus having a character recognition function | |
JP4136282B2 (ja) | 画像処理装置及び画像処理方法並びに記憶媒体 | |
JPH05303619A (ja) | 電子スクラップブック | |
JP2024084452A (ja) | 情報処理装置とその制御方法、及びプログラム | |
JP2006221569A (ja) | 文書処理システム、文書処理方法、プログラムおよび記憶媒体 | |
JP4143245B2 (ja) | 画像処理方法および装置並びに記憶媒体 | |
JPH07114610A (ja) | 情報処理システムの入力装置及び情報処理システムの入力方法 | |
JPH08161350A (ja) | 電子ファイリング方法および装置 | |
JP4294456B2 (ja) | 特定キャラクタ列検索装置、特定キャラクタ列検索方法、特定キャラクタ列検索プログラム、および記録媒体 | |
US20230102476A1 (en) | Information processing apparatus, non-transitory computer readable medium storing program, and information processing method | |
JPH11203402A (ja) | 画像処理装置及び画像処理方法 | |
JPH11187231A (ja) | 画像検索装置及び画像検索方法 | |
JP3424942B2 (ja) | 対訳画像形成装置 | |
JP2993880B2 (ja) | 電子ファイル装置 | |
JP2993881B2 (ja) | キーワード生成方法 | |
JP2023170130A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JPH0678119A (ja) | 画像ファイリング装置および画像読取処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060801 |