JP2007174523A

JP2007174523A - 画像処理装置、画像処理方法、プログラムコード及び記憶媒体

Info

Publication number: JP2007174523A
Application number: JP2005372431A
Authority: JP
Inventors: Tetsuomi Tanaka; 哲臣田中
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2005-12-26
Filing date: 2005-12-26
Publication date: 2007-07-05
Also published as: US8515186B2; US20070147689A1

Abstract

【課題】部分画像データが表す画像の文字部を効率良く認識することができる。また、上記文字認識された画像を効率良く圧縮することができる。
【解決手段】画像の大きさを識別する識別手段と、前記画像の大きさに基づいて解像度を設定する解像度設定手段と、前記解像度において文字の存在を認識する認識手段とを備える。また、前記認識手段の認識結果に基づいて、前記画像を圧縮する圧縮手段とを備える。
【選択図】図２

Description

本発明は、文字を含む画像を圧縮する技術に関するものである。

近年、情報を共有するためにスキャナから紙文書を読取ることにより文書を電子化する機会、電子化文書のフォーマットを変換する機会が増えている。一般的に、スキャナから取り込んだページはラスターデータとなる。また、電子化文書の形式変換として、ある形式からラスターデータ化することもある。また、電子化文書はそのままではデータ量が大きくなるため、例えば特許文献１の様にＪＰＥＧ圧縮等を用いてデータ量を削減することが知られている。
ＪＰＥＧ圧縮は、写真などの多値画像の圧縮には適しているが、文字部などの圧縮には適していない。圧縮されるべき画像が、多値画像と文字部が混在している画像などを効率良く圧縮する方法として例えば以下の文献が知られている。
特開平０８−１４７４４６号公報特開２００３−０１８４１３号公報

１ページを構成するデータの一部である部分画像データを扱う際、その部分画像データが表す画像中の文字のサイズはさまざまであるが、従来、そのような部分画像に含まれる文字を効率良く認識する技術は確立されていなかった。またその認識結果を用いて行われる圧縮も効率良く行えなかった。

本発明は上記問題を解決するべくなされたものであって、上記部分画像データが表す画像の文字部を効率良く認識することを目的とする。

また上記文字認識された画像を効率良く圧縮することを目的とする。

本発明の目的を達成するために、例えば本発明の画像処理装置は、画像の大きさを識別する識別手段と、前記画像の大きさに基づいて、解像度を設定する解像度設定手段と、前記解像度において文字の存在を認識する認識手段とを備えることを特徴とする。

また、前記認識手段の認識結果に基づいて、前記画像を圧縮する圧縮手段とを備えることを特徴とする。

本発明によれば、画像の文字部を効率良く認識することができる。また文字認識された画像を効率良く圧縮することができる。

＜実施形態１＞
図１に本実施形態における画像圧縮装置の基本構成を示す。１０１はＣＰＵで、ＲＡＭ１０２やＲＯＭ１０３に格納されたプログラムやデータを用いて本装置全体の制御を行うと共に、後述の画像処理を行う。１０２はＲＡＭで、外部記憶装置１０４や記憶媒体ドライブ１０９からロードされたプログラムやデータ、画像入力装置１０８から入力された画像データなどを一時的に記憶するエリアを備える。また、ＣＰＵ１０１が各種の処理を実行する際に用いるワークエリアも備える。

１０３はＲＯＭで、本装置全体の制御プログラムやブートプログラム、本装置の設定データ等を格納する。１０４はハードディスクなどの外部記憶装置で、記憶媒体ドライブ１０９からロードされたプログラムやデータなどを保存することができる。また、ワークエリアのサイズがＲＡＭ１０２のサイズを越えた場合、越えた分のエリアをファイルとして提供することもできる。

１０５，１０６は夫々キーボード、マウスで、ポインティングデバイスとして機能し、各種の指示を本装置に入力することができる。

１０７は表示装置で、ＣＲＴや液晶画面などにより構成されており、画像情報や文字情報を表示することができる。１０８は画像入力装置で、スキャナやディジタルカメラなどにより構成されており、画像をデータとして入力することができる。

尚、画像入力装置１０８は本装置と接続するためのインターフェースを含む。１０９は記憶媒体ドライブで、ＣＤ−ＲＯＭドライブ、ＤＶＤ−ＲＯＭドライブ、フロッピー（登録商標）ディスク（ＦＤ）ドライブ等により構成されており、ＣＤ−ＲＯＭやＤＶＤ−ＲＯＭやＦＤ等の記憶媒体からプログラムやデータなどを読み込むことができる。１１０は上述の各部を繋ぐバスである。

図２に本実施形態における画像処理装置の機能構成を示す。
２０１は複数のページから構成される電子文書（文書画像データ）を入力する電子文書入力部である。２０２は電子文書入力部２０１で入力された電子文書における処理対象ページを、ページ単位で取り出すページ取出部である。

２０３はページ取出部２０２で取り出された処理対象ページ内にＪＰＥＧ等で圧縮された多値画像があるか否かを判定する画像判定部である。また画像判定部２０３は、処理対象ページ内に多値画像があった場合に、その多値画像がページ全面を構成する単一全面画像であるか、ページ内の一部を構成する部分画像であるかを判定する。

２０４はその部分画像を表すデータ量とページ内の表示領域の大きさから解像度を予想して最適と思われる解像度の設定を行う解像度設定部である。２０５は、対象となるＪＰＥＧ等で圧縮された多値画像が文字を含むか否かを判定する文書判定部である。

２０６は、処理対象ページを解析して圧縮データを生成する圧縮部である。２０７は、圧縮部２０６で生成された圧縮データを元の電子文書の形式に合わせて変換処理をする変換部である。

図３のフローチャートを用いて本実施形態における電子文書の圧縮方法について説明する。

なお、電子文書（文書画像データ）を入力し、圧縮する一連の処理は、特に言及しない限り、全て“データ”の状態での処理であるものとする。

まずステップＳ３０１において、入力部２０１は、複数のページから構成される電子文書を入力する。ここでの電子文書とは、例えば複数のページから構成される紙文書をスキャナ等で電子化した電子文書（文書画像データ）である。また、文字部だけで構成されるページだけでなく、文字部と多値画像が混在したページ、或いはページ全体が多値画像のみで構成されるページも含む電子文書である。

ステップＳ３０２において、ページ取出部２０２は、入力部２０１によって入力された電子文書から処理対象ページを取り出す。

ステップＳ３０３において、Ｓ３０２で処理対象ページが取り出された場合は、ステップＳ３０４へ進む。処理対象ページが取り出されなかった場合は処理を終了する。例えば複数のページで構成される電子文書が入力された場合、ページ取出部は、入力された電子文書の先頭ページを取り出す。そして先頭ページの処理が終了すると、次のページを取り出す。この処理をページの枚数分繰り返す。

ステップＳ３０４において、画像判定部２０３は、処理対象ページ内にＪＰＥＧ等で圧縮された多値画像があるか否かを調べる。多値画像がある場合はステップＳ３０５進む。多値画像がない場合はＳ３０２へ戻り、次の処理対象ページの処理を行う。

ここで多値画像とは、絵、イラスト、写真、表、図等を表す。

また、ステップＳ３０５において、画像判定部２０３は、処理対象ページ内の多値画像が、単一全面画像であるかどうかを判定する。単一全面画像とは、その処理対象ページが単一の多値画像のみで構成されるページのことである。また処理対象ページが単一全面画像の場合は、その単一全面画像を生成した背景として以下の場合が考えられる。まず、スキャナ等で取り込んだ画像を貼り付けた場合が考えられる。

また、対象となる電子文書を作成・編集・表示等をするアプリケーションが、それとは異なる別のアプリケーションからコンテンツ（多値画像）をコピーする際に、コピー対象のページ全体をＪＰＥＧ等で圧縮し、一枚の画像として取り込んだ場合が考えられる。例えば、電子文書の形式に変換できないデータを含んでいるためコピー対象のページ全体を一枚の画像として取り込んだ場合である。

そしてステップＳ３０５において、処理対象ページが単一全面画像の場合は、その全面画像を抽出してステップＳ３０６へ進む。単一全面画像でない場合は、すなわち部分画像である場合は、その部分画像を抽出してステップＳ３０８へ進む。

ステップＳ３０６において、圧縮部２０６は、抽出された単一全面画像を解析して、図４の方法（後述）により圧縮する。

抽出された画像が、単一全面画像、もしくは部分画像のいずれであっても、その画像は文字を含むことがある。よって、文字を含んだ画像の圧縮には図４の圧縮方法が有効である。文字を含んだ画像の圧縮においては、文字部分を含む画像かという判定と、文字部分を正確に抽出するために対象画像の解像度を適切に設定することが重要になる。

もし、抽出された画像がスキャナ等で取り込まれた画像ならば、その画像のヘッダに記載されている解像度情報を用いて設定すればよいが、ページ内の画像は表示上の大きさと解像度は必ずしも一致しない。ただし、単一全面画像の圧縮においては、その画像を表示する大きさ（そのページの原稿サイズ）と、縦横画素数から計算される解像度情報を用いることができる。

また、この単一全面画像が文字を含んでいない場合は、図４の圧縮方法により、解像度を低下させた画像（縮小画像）に置き換わる。

ステップＳ３０７において、出力部２０７は、ステップＳ３０６で生成された圧縮データを、元の電子文書の形式に合わせて変換処理する。

ステップＳ３０７の処理後はステップＳ３０２へ戻り、次のページデータの処理をする。

ステップＳ３０８以降の処理は、処理対象のページが多値画像を含み、かつその多値画像が部分画像である場合の処理である。

電子文書における部分画像は、画像編集用アプリケーション等により生成されたデータをＪＰＥＧ等で圧縮し、一枚の画像として取り込んだものか、写真などの自然画や紙原稿をスキャンして貼り付けたものなどが考えられる。その部分画像を貼り付ける場合としては、部分画像の表示領域（ページ内で部分画像が貼り付けられる領域）に合わせて、この部分画像の解像度を縮小して貼り付ける場合が考えられる。

また同様に、画像の解像度を縮小せずに、見かけ上の解像度を上げて貼り付ける場合（解像度３００ｄｐｉ、Ａ４サイズの画像を、その画像を表すデータ量を変更することなく、表示上のサイズをかえて貼り付ける）など多数の場合が考えられる。

そのためステップＳ３０８において、解像度設定部２０４は、部分画像を表すデータ量とページ内の表示領域の大きさから解像度を予測して最適と思われる解像度の設定を行う。

解像度の設定方法は、まず処理対象ページ中の対象部分画像の、ページ内に占める面積から推定される解像度、すなわち印刷時の部分画像の実際の幅と画像の縦横画素数から求められる解像度Ａを求める。

次に、対象部分画像がＡ４等の標準的な原稿サイズであったものを縮小したものと仮定して、画像の縦横幅から計算される解像度Ｂを求める。解像度Ｂが標準的な原稿サイズの解像度（Ａ４で３００ｄｐｉ程度）以上の値であれば解像度Ｂを、そうでなければ解像度Ａを採用するものとする。予め決める標準原稿サイズは任意であるが、電子文書で使用されている言語を用いる地域で最もよく使用される原稿サイズに設定するのが良い。

また、その他の設定方法として、部分画像中に文字があるならば、その文字の大きさを、良く使われるポイント数（文字サイズ）と仮定して解像度を求める方法もある。これは、まず上記解像度Ａを求める。そして解像度Ａの値を使用して部分画像から文字領域の抽出を行う。（文字領域抽出部４０４による）次に、文字領域中の文字の平均の縦画素数を求め、その文字が所定のポイント数と仮定して解像度Ｃを設定する。

ステップＳ３０９において、文書判定部２０５は、対象となる部分画像が文字を含むか否かの判定を行う。図４の圧縮方法によれば、文字を含まない画像でも，解像度を縮小するので圧縮効果がある。しかし、文字部分を抽出するための重要な解像度の設定を誤って行う可能性もあるため、文字部分の抽出処理に誤りを生じる確率が上がる。よって圧縮効果があっても画質的に劣ることが起こりえる。これを防ぐため部分画像が文書を含む画像かどうか判定を行う。
判定方法は、ステップＳ３０８で設定した解像度により図４の文字領域抽出部４０４を用いて文字領域の抽出を行い、その抽出された文字領域の画像全体（１ページ分の画像）に占める割合によって判定する。ただし本発明はこれに限らず、例えば、文字認識技術の一部として知られる文書方向判別手段を用いて文書方向（文書の文字列の方向）を識別できるかどうかによって判定しても良い。

上記の方法で、部分画像が文字を含む画像であると判定された場合はステップＳ３１１へ進む。文字を含まない画像であると判定された場合はステップＳ３１３へ進む。

ステップＳ３１１において、圧縮部２０６は、抽出された部分画像を解析して圧縮データを生成する。このステップＳ３１１はステップＳ３０６と同一の処理であるので説明を省略する。

ステップＳ３１２において、出力部２０７は、ステップＳ３１１で生成された圧縮データを元の電子文書の形式に合わせて出力をする。

ステップＳ３１２とステップＳ３０７は、ステップＳ３０７で用いる解像度は表示上の解像度と常に一致するが、Ｓ３１２では圧縮データを作るために使用された解像度が表示上の解像度とは一致する場合と一致しない場合があるという点で異なる。一致しない場合に表示上の大きさに合うように調整して変換する。

ステップＳ３１３において、出力部２０７は、画像縮小処理を行う。対象となる部分画像は文字を含まないので表示上の解像度によらず、予め決められた解像度相当に画像を縮小する。予め決められた値が１００ｄｐｉである場合、対象画像の表示上の解像度と比較して１００ｄｐｉよりも大きい場合は１００ｄｐｉ相当に縮小する。１００ｄｐｉよりも小さい場合は縮小せずに出力する。

ステップＳ３１４において、出力部２０７は、ステップＳ３１３の画像縮小に合わせて電子文書の記述を変更する。

ステップＳ３１５において、画像判定部２０３は、処理対象ページに他の部分画像があるか否かを調べる。他に部分画像がある場合はステップＳ３０８へ進む。部分画像がない場合はステップＳ３０２へ進む。

そして電子文書の最終ページまで処理を行い終了する。

ステップＳ３０６及びＳ３１１における、単一全面画像もしくは部分画像から圧縮データを生成する処理について、図４を用いて説明する。

４０１はステップＳ３０４及びステップＳ３１５で抽出された画像（多値画像）であり、ステップＳ３０６またはステップＳ３１１において圧縮処理の対象となる画像である。４０２は画像を入力し、画像の最適二値化を行う画像二値化部である。４０３は画像二値化部により二値化された二値画像である。入力された画像が二値画像であった場合は、画像二値化部４０２は省略する。４０４は、二値画像４０３を入力して文字領域を検出し、文字領域座標４１２を生成する文字領域検出部である。

４０５は文字領域座標４１２を入力し、二値画像４０３の黒の領域を特定すると共に、二値画像４０３の黒の領域に該当する画像データ中の領域を抜いて、抜いた領域を黒の領域の周囲の色で塗りつぶし、画像Ａを生成する文字部塗りつぶし部である。４０６は画像Ａを入力し、縮小して画像Ｂを生成する縮小部である。４０７は画像Ｂを入力し、ＪＰＥＧ圧縮して圧縮コードＸ４１３を生成するＪＰＥＧ圧縮部である。

４０８は文字領域座標４１２を入力し、その座標の原画像と二値画像４０３を参照しながら、二値画像の黒の領域に該当する原画像の領域の色を算出し、複数の文字の代表色を抽出し文字色情報４１４を生成する文字色抽出部４０８である。

４０９は文字領域座標と文字色情報４１４と二値画像４０３を参照しながら各色単位に分割した二値画像４１０を生成する二値画像生成部である。

４１１は二値画像４１０を入力してＭＭＲ圧縮して夫々の色毎の二値画像４１０に応じた複数の圧縮コードＹ４１５を生成するＭＭＲ圧縮部である。圧縮手段は、例えばＪＢＩＧなど文字画像の圧縮効率のよい二値の可逆圧縮手段であれば、どのような方法を用いてもよい。どれを用いるかは対象となる電子文書形式で扱える形式に依存する。

以上の各部により生成される４１２から４１５までのデータが結合して、圧縮データ１Ａとなる。なお文字領域そのものが存在しない場合、圧縮データ１Ａに含まれるデータは圧縮コードＸ４１３のみとなる。

図４の動作について図５〜７を用いて説明する。

ステップＳ５０１では画像４０１を読み込む。ステップＳ５０２ではＳ５０１で入力された画像から二値画像を生成する。ステップＳ５０３では画像の文字領域判別４０４を行い、図７ｂのように文字領域と非文字領域に分離する。ステップＳ５０４ではＳ５０３において抽出された各文字領域に文字の色を抽出する。

図７の例ではＴＥＸＴ１とＴＥＸＴ３の領域は赤、ＴＥＸＴ２の領域は黒、赤、青の３色からなる文字領域と判定されＴＥＸＴ４の領域は黒、ＴＥＸＴ５は青文字であると判定される。

ステップＳ５０５において複数色と判定されたＴＥＸＴ２の領域は、図７ｃの様に判定された色ごとの二値画像に分解する。この例ではＴＥＸＴ２の領域は、赤部分はＴＥＸＴ６、黒部分はＴＥＸＴ７、青はＴＥＸＴ８に３分割される。

ステップＳ５０６ではＳ５０４で抽出された文字色をそれぞれ比較し同色と判断したテキストブロックは結合した場合の新たな文字色を決定し二値圧縮保存される。結合されたテキストブロックはそれぞれＴＥＸＴ１’、ＴＥＸＴ２’、ＴＥＸＴ３’として図７ｄのように再定義される。

同色の判定は、例えばＲＧＢ各８ビットをＲＧＢ各２ビットや３ビットなど予め決められた色範囲に減色して同一色になるかどうかでグループ分けする。どの程度まで減色するかは圧縮した画像にどの程度階調性を持たせるかによって決まる。例えば人の目の青色に対する感度が低いことを利用してＲＧＢ２／２／１ｂｉｔやＲＧＢ３／３／２ｂｉｔなどにしてもよい。

より正確に同色の判定を行いたい場合はＲＧＢ形式ではなくより色差を比較しやすいＹＵＶ形式やＬＡＢ形式に変換して２ビットや３ビットでグループ分けをすると良い。

ステップＳ５０７でＳ５０６において同色と判断された文字ブロックの画像を結合して図７ｅに示すような新たな二値画像を生成する。ステップＳ５０８ではカラー画像から二値画像の文字部分を消去する。ステップＳ５０９では文字部を消去したカラー画像を多値圧縮する。ここで１０６下地の画像を縮小して圧縮しても良い。

ステップＳ５１０は結果の出力で図４の圧縮データ１Ａが出力される。

図６は図５ステップＳ５０６、Ｓ５０７の詳細処理フローである。

ステップＳ６０１ではＳ５０５で同一色であると判定されたテキストブロック群の中から基準となる一つのテキストブロックを選択する。もしテキストブロックがなければ（Ｓ６０２）、ステップＳ６１０へ進み終了する。テキストブロックがある場合はステップＳ６０３で同一色のテキストブロックの中からそのテキストブロックに最も近いテキストブロックを探して選択する。

Ｓ６０４で同色のテキストブロックがある場合はＳ６０５へ進む。同色のテキストブロックがない場合はステップＳ６０９へ進む。

ステップＳ６０５では２つのテキストブロックを結合させた場合の矩形を求める。

ステップＳ６０６ではブロック結合した場合とブロック結合しない場合の圧縮後のサイズを算出する。ここで実際に圧縮を施して正確なサイズを出す方法もあるが、以下の方法で簡易的に算出すれば処理時間を軽減できる。予め測定していたテキスト部の圧縮率Ａを用いて、分割して圧縮した場合のサイズは
分割圧縮サイズ＝（ＴＥＸＴ１の面積＋ＴＥＸＴ２の面積）×Ａ＋２×ヘッダサイズ
となる。

ブロック結合を行い圧縮した場合は、必ず二つのテキストブロックの隙間部分が生ずる。この部分はデータが無いので、普通にテキスト部を圧縮した場合に比べてはるかに高圧縮率で圧縮できる。この圧縮率をＢとすると
結合圧縮サイズ＝（ＴＥＸＴ部分の面積）×Ａ＋（隙間部分の面積）×Ｂ＋ヘッダサイズ
となる。

Ｓ６０７で画像を結合した場合と結合しない場合の圧縮サイズを比較して、結合した場合の方が、サイズが小さくなる場合はＳ６０８へ進み、大きくなる場合はＳ６０３へ戻り、次のテキストブロックを探す。

ステップＳ６０８では選択されたブロックを後の処理で画像の結合を行うためのリストに追加する。以下Ｓ６０３からＳ６０８を同色のテキストブロックが無くなるまで繰り返し、無くなったらＳ６０９へ進む。

ステップＳ６０９ではテキストブロックを結合した画像を作り圧縮を行う。Ｓ６０３からＳ６０８の判定で結合されるブロックがない場合は単独ブロックの画像を対象とする。

次にＳ６０１に戻りＳ６０１からＳ６０９を圧縮していないテキストブロックが無くなるまで繰り返す。上記テキストブロックが無くなるとステップＳ６１０へ進み処理を終了する。

以上の実施形態によれば、部分画像データが表す部分画像の文字部を効率良く認識することができる。また文字認識された画像を効率良く圧縮することができる。

＜実施形態２＞
実施形態１の図３のステップＳ３０８では、複数考えられる解像度から１つを選択して仮の解像度を設定しているが、これは処理効率を優先した方法である。これに対して本実施形態は、より適切な解像度を選択できる可能性を高める。
図８のフローチャートを用いて本実施形態における電子文書の圧縮方法について説明する。

本実施形態では、処理時間に余裕がある場合、或いは解像度の特定を正確にしたい場合に、複数の解像度において文書画像かどうかの判定を行い（ステップＳ８０８）、その結果に基づいて解像度を選択する。（ステップＳ８０９）
なお、以下に説明する処理以外については、第１の実施形態と同様である。

ステップＳ８０９における解像度の選択の際、文字を含む部分画像か否かの判定として方向判別手段を用いている場合には、その答えの確からしさを選択基準として用いる。また、文字を含む部分画像か否かの判定として、文字領域の抽出方法を用いた場合には、各解像度において抽出した文字領域の割合の高さを選択基準とする。そして、文字領域の割合が高い方の解像度を選択する。これにより、より正確に部分画像データが表す部分画像の文字部を効率良く認識することができる。また文字認識された画像を効率良く圧縮することができる。

＜他の実施形態＞
また、本発明は上記実施形態を実現する為の装置及び方法のみに限定されるものではない。上記システム又は装置内のコンピュータ（ＣＰＵあるいはＭＰＵ）に、上記実施形態を実現する為のソフトウェアのプログラムコードを供給し、このプログラムコードに従って上記システムあるいは装置のコンピュータが上記各種デバイスを動作させる。これにより上記実施形態を実現する場合も本発明の範疇に含まれる。

またこの場合、ソフトウェアのプログラムコード自体が上記実施形態の機能を実現することになる。つまり、そのプログラムコード自体、及びそのプログラムコードをコンピュータに供給する為の手段、具体的には上記プログラムコードを格納した記憶媒体は本発明の範疇に含まれる。

この様なプログラムコードを格納する記憶媒体としては、例えばフロッピー（登録商標）ディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ−ＲＯＭ、磁気テープ、不揮発性のメモリカード、ＲＯＭ等を用いることができる。

また、上記コンピュータが、供給されたプログラムコードのみに従って各種デバイスを制御することにより、上記実施形態の機能が実現される。またこの場合だけではなく、上記プログラムコードがコンピュータ上で稼働しているＯＳ（オペレーティングシステム）、あるいは他のアプリケーションソフト等と共同して上記実施形態が実現される場合にもかかるプログラムコードは本発明の範疇に含まれる。

更に、この供給されたプログラムコードの指示に基づいてコンピュータの機能拡張ボードやコンピュータに接続された機能格納ユニットに備わるＣＰＵ等が処理の一部又は全部を行い、その処理によって上記実施形態が実現される場合も本発明の範疇に含まれる。

実施形態１における画像処理装置のハードウェア構成を示す図実施形態１における画像処理装置の機能構成を示す図実施形態１における画像処理のフローチャート圧縮処理の機能構成を示す図圧縮処理のフローチャートＳ５０６、Ｓ５０７の具体的な処理のフローチャート本発明の画像処理説明図、（ａ）圧縮処理対象となる元の画像（全面画像または部分画像）（ｂ）領域判別の結果（ｃ）テキストブロックの結合結果（ｄ）結合されたテキストブロックの画像実施形態２における処理のフローチャート

符号の説明

２０３画像判定部
２０４解像度設定部
２０５文書判定部

Claims

画像の大きさを識別する識別手段と、
前記画像の大きさに基づいて、解像度を設定する解像度設定手段と、
前記解像度において文字の存在を認識する認識手段とを備えることを特徴とする画像処理装置。
前記画像は、部分画像であることを特徴とする前記請求項１に記載の画像処理装置。
更に前記認識手段の認識結果に基づいて、前記画像を圧縮する圧縮手段とを備えることを特徴とする前記請求項１に記載の画像処理装置。
前記認識手段によって画像に文字が存在しないと認識された場合に、前記画像を前記圧縮手段とは異なるアルゴリズムに基づいて圧縮する第２の圧縮手段を備えることを特徴とする請求項３に記載の画像処理装置。
前記解像度設定手段は、前記画像のデータ量とページ内での表示の大きさから、可能性の有る複数の解像度を予測して、該複数の解像度のうちの１つを設定することを特徴とする請求項１に記載の画像処理装置。
前記解像度設定手段は、１ページ内の対象画像の占める面積から推定した解像度と、該画像を１ページ全体の大きさに拡大した画像の縦横幅から推定した解像度のいずれか一つを設定することを特徴とする前記請求項５に記載の画像処理装置。
前記解像度設定手段は、可能性の有る複数の解像度において、文字の存在を識別できる試験を行った結果に応じて、該複数の解像度のうちの１つを設定することを特徴とする請求項１に記載の画像処理装置。
画像の大きさを識別する識別工程と、
前記画像の大きさに基づいて、解像度を設定する解像度設定工程と、
前記解像度において文字の存在を認識する認識工程とを備えることを特徴とする画像処理方法。
請求項８に記載の画像処理方法を実行するプログラムコード。
請求項９に記載のプログラムコードをコンピュータが読み込み可能な状態で格納した記憶媒体。