[go: up one dir, main page]

JP2007174523A - 画像処理装置、画像処理方法、プログラムコード及び記憶媒体 - Google Patents

画像処理装置、画像処理方法、プログラムコード及び記憶媒体 Download PDF

Info

Publication number
JP2007174523A
JP2007174523A JP2005372431A JP2005372431A JP2007174523A JP 2007174523 A JP2007174523 A JP 2007174523A JP 2005372431 A JP2005372431 A JP 2005372431A JP 2005372431 A JP2005372431 A JP 2005372431A JP 2007174523 A JP2007174523 A JP 2007174523A
Authority
JP
Japan
Prior art keywords
image
resolution
character
image processing
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005372431A
Other languages
English (en)
Inventor
Tetsuomi Tanaka
哲臣 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005372431A priority Critical patent/JP2007174523A/ja
Priority to US11/611,722 priority patent/US8515186B2/en
Publication of JP2007174523A publication Critical patent/JP2007174523A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/642Adapting to different types of images, e.g. characters, graphs, black and white image portions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】 部分画像データが表す画像の文字部を効率良く認識することができる。また、上記文字認識された画像を効率良く圧縮することができる。
【解決手段】 画像の大きさを識別する識別手段と、前記画像の大きさに基づいて解像度を設定する解像度設定手段と、前記解像度において文字の存在を認識する認識手段とを備える。また、前記認識手段の認識結果に基づいて、前記画像を圧縮する圧縮手段とを備える。
【選択図】 図2

Description

本発明は、文字を含む画像を圧縮する技術に関するものである。
近年、情報を共有するためにスキャナから紙文書を読取ることにより文書を電子化する機会、電子化文書のフォーマットを変換する機会が増えている。一般的に、スキャナから取り込んだページはラスターデータとなる。また、電子化文書の形式変換として、ある形式からラスターデータ化することもある。また、電子化文書はそのままではデータ量が大きくなるため、例えば特許文献1の様にJPEG圧縮等を用いてデータ量を削減することが知られている。
JPEG圧縮は、写真などの多値画像の圧縮には適しているが、文字部などの圧縮には適していない。圧縮されるべき画像が、多値画像と文字部が混在している画像などを効率良く圧縮する方法として例えば以下の文献が知られている。
特開平08−147446号公報 特開2003−018413号公報
1ページを構成するデータの一部である部分画像データを扱う際、その部分画像データが表す画像中の文字のサイズはさまざまであるが、従来、そのような部分画像に含まれる文字を効率良く認識する技術は確立されていなかった。またその認識結果を用いて行われる圧縮も効率良く行えなかった。
本発明は上記問題を解決するべくなされたものであって、上記部分画像データが表す画像の文字部を効率良く認識することを目的とする。
また上記文字認識された画像を効率良く圧縮することを目的とする。
本発明の目的を達成するために、例えば本発明の画像処理装置は、画像の大きさを識別する識別手段と、前記画像の大きさに基づいて、解像度を設定する解像度設定手段と、前記解像度において文字の存在を認識する認識手段とを備えることを特徴とする。
また、前記認識手段の認識結果に基づいて、前記画像を圧縮する圧縮手段とを備えることを特徴とする。
本発明によれば、画像の文字部を効率良く認識することができる。また文字認識された画像を効率良く圧縮することができる。
<実施形態1>
図1に本実施形態における画像圧縮装置の基本構成を示す。101はCPUで、RAM102やROM103に格納されたプログラムやデータを用いて本装置全体の制御を行うと共に、後述の画像処理を行う。102はRAMで、外部記憶装置104や記憶媒体ドライブ109からロードされたプログラムやデータ、画像入力装置108から入力された画像データなどを一時的に記憶するエリアを備える。また、CPU101が各種の処理を実行する際に用いるワークエリアも備える。
103はROMで、本装置全体の制御プログラムやブートプログラム、本装置の設定データ等を格納する。104はハードディスクなどの外部記憶装置で、記憶媒体ドライブ109からロードされたプログラムやデータなどを保存することができる。また、ワークエリアのサイズがRAM102のサイズを越えた場合、越えた分のエリアをファイルとして提供することもできる。
105,106は夫々キーボード、マウスで、ポインティングデバイスとして機能し、各種の指示を本装置に入力することができる。
107は表示装置で、CRTや液晶画面などにより構成されており、画像情報や文字情報を表示することができる。108は画像入力装置で、スキャナやディジタルカメラなどにより構成されており、画像をデータとして入力することができる。
尚、画像入力装置108は本装置と接続するためのインターフェースを含む。109は記憶媒体ドライブで、CD−ROMドライブ、DVD−ROMドライブ、フロッピー(登録商標)ディスク(FD)ドライブ等により構成されており、CD−ROMやDVD−ROMやFD等の記憶媒体からプログラムやデータなどを読み込むことができる。110は上述の各部を繋ぐバスである。
図2に本実施形態における画像処理装置の機能構成を示す。
201は複数のページから構成される電子文書(文書画像データ)を入力する電子文書入力部である。202は電子文書入力部201で入力された電子文書における処理対象ページを、ページ単位で取り出すページ取出部である。
203はページ取出部202で取り出された処理対象ページ内にJPEG等で圧縮された多値画像があるか否かを判定する画像判定部である。また画像判定部203は、処理対象ページ内に多値画像があった場合に、その多値画像がページ全面を構成する単一全面画像であるか、ページ内の一部を構成する部分画像であるかを判定する。
204はその部分画像を表すデータ量とページ内の表示領域の大きさから解像度を予想して最適と思われる解像度の設定を行う解像度設定部である。205は、対象となるJPEG等で圧縮された多値画像が文字を含むか否かを判定する文書判定部である。
206は、処理対象ページを解析して圧縮データを生成する圧縮部である。207は、圧縮部206で生成された圧縮データを元の電子文書の形式に合わせて変換処理をする変換部である。
図3のフローチャートを用いて本実施形態における電子文書の圧縮方法について説明する。
なお、電子文書(文書画像データ)を入力し、圧縮する一連の処理は、特に言及しない限り、全て“データ”の状態での処理であるものとする。
まずステップS301において、入力部201は、複数のページから構成される電子文書を入力する。ここでの電子文書とは、例えば複数のページから構成される紙文書をスキャナ等で電子化した電子文書(文書画像データ)である。また、文字部だけで構成されるページだけでなく、文字部と多値画像が混在したページ、或いはページ全体が多値画像のみで構成されるページも含む電子文書である。
ステップS302において、ページ取出部202は、入力部201によって入力された電子文書から処理対象ページを取り出す。
ステップS303において、S302で処理対象ページが取り出された場合は、ステップS304へ進む。処理対象ページが取り出されなかった場合は処理を終了する。例えば複数のページで構成される電子文書が入力された場合、ページ取出部は、入力された電子文書の先頭ページを取り出す。そして先頭ページの処理が終了すると、次のページを取り出す。この処理をページの枚数分繰り返す。
ステップS304において、画像判定部203は、処理対象ページ内にJPEG等で圧縮された多値画像があるか否かを調べる。多値画像がある場合はステップS305進む。多値画像がない場合はS302へ戻り、次の処理対象ページの処理を行う。
ここで多値画像とは、絵、イラスト、写真、表、図等を表す。
また、ステップS305において、画像判定部203は、処理対象ページ内の多値画像が、単一全面画像であるかどうかを判定する。単一全面画像とは、その処理対象ページが単一の多値画像のみで構成されるページのことである。また処理対象ページが単一全面画像の場合は、その単一全面画像を生成した背景として以下の場合が考えられる。まず、スキャナ等で取り込んだ画像を貼り付けた場合が考えられる。
また、対象となる電子文書を作成・編集・表示等をするアプリケーションが、それとは異なる別のアプリケーションからコンテンツ(多値画像)をコピーする際に、コピー対象のページ全体をJPEG等で圧縮し、一枚の画像として取り込んだ場合が考えられる。例えば、電子文書の形式に変換できないデータを含んでいるためコピー対象のページ全体を一枚の画像として取り込んだ場合である。
そしてステップS305において、処理対象ページが単一全面画像の場合は、その全面画像を抽出してステップS306へ進む。単一全面画像でない場合は、すなわち部分画像である場合は、その部分画像を抽出してステップS308へ進む。
ステップS306において、圧縮部206は、抽出された単一全面画像を解析して、図4の方法(後述)により圧縮する。
抽出された画像が、単一全面画像、もしくは部分画像のいずれであっても、その画像は文字を含むことがある。よって、文字を含んだ画像の圧縮には図4の圧縮方法が有効である。文字を含んだ画像の圧縮においては、文字部分を含む画像かという判定と、文字部分を正確に抽出するために対象画像の解像度を適切に設定することが重要になる。
もし、抽出された画像がスキャナ等で取り込まれた画像ならば、その画像のヘッダに記載されている解像度情報を用いて設定すればよいが、ページ内の画像は表示上の大きさと解像度は必ずしも一致しない。ただし、単一全面画像の圧縮においては、その画像を表示する大きさ(そのページの原稿サイズ)と、縦横画素数から計算される解像度情報を用いることができる。
また、この単一全面画像が文字を含んでいない場合は、図4の圧縮方法により、解像度を低下させた画像(縮小画像)に置き換わる。
ステップS307において、出力部207は、ステップS306で生成された圧縮データを、元の電子文書の形式に合わせて変換処理する。
ステップS307の処理後はステップS302へ戻り、次のページデータの処理をする。
ステップS308以降の処理は、処理対象のページが多値画像を含み、かつその多値画像が部分画像である場合の処理である。
電子文書における部分画像は、画像編集用アプリケーション等により生成されたデータをJPEG等で圧縮し、一枚の画像として取り込んだものか、写真などの自然画や紙原稿をスキャンして貼り付けたものなどが考えられる。その部分画像を貼り付ける場合としては、部分画像の表示領域(ページ内で部分画像が貼り付けられる領域)に合わせて、この部分画像の解像度を縮小して貼り付ける場合が考えられる。
また同様に、画像の解像度を縮小せずに、見かけ上の解像度を上げて貼り付ける場合(解像度300dpi、A4サイズの画像を、その画像を表すデータ量を変更することなく、表示上のサイズをかえて貼り付ける)など多数の場合が考えられる。
そのためステップS308において、解像度設定部204は、部分画像を表すデータ量とページ内の表示領域の大きさから解像度を予測して最適と思われる解像度の設定を行う。
解像度の設定方法は、まず処理対象ページ中の対象部分画像の、ページ内に占める面積から推定される解像度、すなわち印刷時の部分画像の実際の幅と画像の縦横画素数から求められる解像度Aを求める。
次に、対象部分画像がA4等の標準的な原稿サイズであったものを縮小したものと仮定して、画像の縦横幅から計算される解像度Bを求める。解像度Bが標準的な原稿サイズの解像度(A4で300dpi程度)以上の値であれば解像度Bを、そうでなければ解像度Aを採用するものとする。予め決める標準原稿サイズは任意であるが、電子文書で使用されている言語を用いる地域で最もよく使用される原稿サイズに設定するのが良い。
また、その他の設定方法として、部分画像中に文字があるならば、その文字の大きさを、良く使われるポイント数(文字サイズ)と仮定して解像度を求める方法もある。これは、まず上記解像度Aを求める。そして解像度Aの値を使用して部分画像から文字領域の抽出を行う。(文字領域抽出部404による)次に、文字領域中の文字の平均の縦画素数を求め、その文字が所定のポイント数と仮定して解像度Cを設定する。
ステップS309において、文書判定部205は、対象となる部分画像が文字を含むか否かの判定を行う。図4の圧縮方法によれば、文字を含まない画像でも,解像度を縮小するので圧縮効果がある。しかし、文字部分を抽出するための重要な解像度の設定を誤って行う可能性もあるため、文字部分の抽出処理に誤りを生じる確率が上がる。よって圧縮効果があっても画質的に劣ることが起こりえる。これを防ぐため部分画像が文書を含む画像かどうか判定を行う。
判定方法は、ステップS308で設定した解像度により図4の文字領域抽出部404を用いて文字領域の抽出を行い、その抽出された文字領域の画像全体(1ページ分の画像)に占める割合によって判定する。ただし本発明はこれに限らず、例えば、文字認識技術の一部として知られる文書方向判別手段を用いて文書方向(文書の文字列の方向)を識別できるかどうかによって判定しても良い。
上記の方法で、部分画像が文字を含む画像であると判定された場合はステップS311へ進む。文字を含まない画像であると判定された場合はステップS313へ進む。
ステップS311において、圧縮部206は、抽出された部分画像を解析して圧縮データを生成する。このステップS311はステップS306と同一の処理であるので説明を省略する。
ステップS312において、出力部207は、ステップS311で生成された圧縮データを元の電子文書の形式に合わせて出力をする。
ステップS312とステップS307は、ステップS307で用いる解像度は表示上の解像度と常に一致するが、S312では圧縮データを作るために使用された解像度が表示上の解像度とは一致する場合と一致しない場合があるという点で異なる。一致しない場合に表示上の大きさに合うように調整して変換する。
ステップS313において、出力部207は、画像縮小処理を行う。対象となる部分画像は文字を含まないので表示上の解像度によらず、予め決められた解像度相当に画像を縮小する。予め決められた値が100dpiである場合、対象画像の表示上の解像度と比較して100dpiよりも大きい場合は100dpi相当に縮小する。100dpiよりも小さい場合は縮小せずに出力する。
ステップS314において、出力部207は、ステップS313の画像縮小に合わせて電子文書の記述を変更する。
ステップS315において、画像判定部203は、処理対象ページに他の部分画像があるか否かを調べる。他に部分画像がある場合はステップS308へ進む。部分画像がない場合はステップS302へ進む。
そして電子文書の最終ページまで処理を行い終了する。
ステップS306及びS311における、単一全面画像もしくは部分画像から圧縮データを生成する処理について、図4を用いて説明する。
401はステップS304及びステップS315で抽出された画像(多値画像)であり、ステップS306またはステップS311において圧縮処理の対象となる画像である。402は画像を入力し、画像の最適二値化を行う画像二値化部である。403は画像二値化部により二値化された二値画像である。入力された画像が二値画像であった場合は、画像二値化部402は省略する。404は、二値画像403を入力して文字領域を検出し、文字領域座標412を生成する文字領域検出部である。
405は文字領域座標412を入力し、二値画像403の黒の領域を特定すると共に、二値画像403の黒の領域に該当する画像データ中の領域を抜いて、抜いた領域を黒の領域の周囲の色で塗りつぶし、画像Aを生成する文字部塗りつぶし部である。406は画像Aを入力し、縮小して画像Bを生成する縮小部である。407は画像Bを入力し、JPEG圧縮して圧縮コードX413を生成するJPEG圧縮部である。
408は文字領域座標412を入力し、その座標の原画像と二値画像403を参照しながら、二値画像の黒の領域に該当する原画像の領域の色を算出し、複数の文字の代表色を抽出し文字色情報414を生成する文字色抽出部408である。
409は文字領域座標と文字色情報414と二値画像403を参照しながら各色単位に分割した二値画像410を生成する二値画像生成部である。
411は二値画像410を入力してMMR圧縮して夫々の色毎の二値画像410に応じた複数の圧縮コードY415を生成するMMR圧縮部である。圧縮手段は、例えばJBIGなど文字画像の圧縮効率のよい二値の可逆圧縮手段であれば、どのような方法を用いてもよい。どれを用いるかは対象となる電子文書形式で扱える形式に依存する。
以上の各部により生成される412から415までのデータが結合して、圧縮データ1Aとなる。なお文字領域そのものが存在しない場合、圧縮データ1Aに含まれるデータは圧縮コードX413のみとなる。
図4の動作について図5〜7を用いて説明する。
ステップS501では画像401を読み込む。ステップS502ではS501で入力された画像から二値画像を生成する。ステップS503では画像の文字領域判別404を行い、図7bのように文字領域と非文字領域に分離する。ステップS504ではS503において抽出された各文字領域に文字の色を抽出する。
図7の例ではTEXT1とTEXT3の領域は赤、TEXT2の領域は黒、赤、青の3色からなる文字領域と判定されTEXT4の領域は黒、TEXT5は青文字であると判定される。
ステップS505において複数色と判定されたTEXT2の領域は、図7cの様に判定された色ごとの二値画像に分解する。この例ではTEXT2の領域は、赤部分はTEXT6、黒部分はTEXT7、青はTEXT8に3分割される。
ステップS506ではS504で抽出された文字色をそれぞれ比較し同色と判断したテキストブロックは結合した場合の新たな文字色を決定し二値圧縮保存される。結合されたテキストブロックはそれぞれTEXT1’、TEXT2’、TEXT3’として図7dのように再定義される。
同色の判定は、例えばRGB各8ビットをRGB各2ビットや3ビットなど予め決められた色範囲に減色して同一色になるかどうかでグループ分けする。どの程度まで減色するかは圧縮した画像にどの程度階調性を持たせるかによって決まる。例えば人の目の青色に対する感度が低いことを利用してRGB2/2/1bitやRGB3/3/2bitなどにしてもよい。
より正確に同色の判定を行いたい場合はRGB形式ではなくより色差を比較しやすいYUV形式やLAB形式に変換して2ビットや3ビットでグループ分けをすると良い。
ステップS507でS506において同色と判断された文字ブロックの画像を結合して図7eに示すような新たな二値画像を生成する。ステップS508ではカラー画像から二値画像の文字部分を消去する。ステップS509では文字部を消去したカラー画像を多値圧縮する。ここで106下地の画像を縮小して圧縮しても良い。
ステップS510は結果の出力で図4の圧縮データ1Aが出力される。
図6は図5ステップS506、S507の詳細処理フローである。
ステップS601ではS505で同一色であると判定されたテキストブロック群の中から基準となる一つのテキストブロックを選択する。もしテキストブロックがなければ(S602)、ステップS610へ進み終了する。テキストブロックがある場合はステップS603で同一色のテキストブロックの中からそのテキストブロックに最も近いテキストブロックを探して選択する。
S604で同色のテキストブロックがある場合はS605へ進む。同色のテキストブロックがない場合はステップS609へ進む。
ステップS605では2つのテキストブロックを結合させた場合の矩形を求める。
ステップS606ではブロック結合した場合とブロック結合しない場合の圧縮後のサイズを算出する。ここで実際に圧縮を施して正確なサイズを出す方法もあるが、以下の方法で簡易的に算出すれば処理時間を軽減できる。予め測定していたテキスト部の圧縮率Aを用いて、分割して圧縮した場合のサイズは
分割圧縮サイズ=(TEXT1の面積+TEXT2の面積)×A+2×ヘッダサイズ
となる。
ブロック結合を行い圧縮した場合は、必ず二つのテキストブロックの隙間部分が生ずる。この部分はデータが無いので、普通にテキスト部を圧縮した場合に比べてはるかに高圧縮率で圧縮できる。この圧縮率をBとすると
結合圧縮サイズ=(TEXT部分の面積)×A+(隙間部分の面積)×B+ヘッダサイズ
となる。
S607で画像を結合した場合と結合しない場合の圧縮サイズを比較して、結合した場合の方が、サイズが小さくなる場合はS608へ進み、大きくなる場合はS603へ戻り、次のテキストブロックを探す。
ステップS608では選択されたブロックを後の処理で画像の結合を行うためのリストに追加する。以下S603からS608を同色のテキストブロックが無くなるまで繰り返し、無くなったらS609へ進む。
ステップS609ではテキストブロックを結合した画像を作り圧縮を行う。S603からS608の判定で結合されるブロックがない場合は単独ブロックの画像を対象とする。
次にS601に戻りS601からS609を圧縮していないテキストブロックが無くなるまで繰り返す。上記テキストブロックが無くなるとステップS610へ進み処理を終了する。
以上の実施形態によれば、部分画像データが表す部分画像の文字部を効率良く認識することができる。また文字認識された画像を効率良く圧縮することができる。
<実施形態2>
実施形態1の図3のステップS308では、複数考えられる解像度から1つを選択して仮の解像度を設定しているが、これは処理効率を優先した方法である。これに対して本実施形態は、より適切な解像度を選択できる可能性を高める。
図8のフローチャートを用いて本実施形態における電子文書の圧縮方法について説明する。
本実施形態では、処理時間に余裕がある場合、或いは解像度の特定を正確にしたい場合に、複数の解像度において文書画像かどうかの判定を行い(ステップS808)、その結果に基づいて解像度を選択する。(ステップS809)
なお、以下に説明する処理以外については、第1の実施形態と同様である。
ステップS809における解像度の選択の際、文字を含む部分画像か否かの判定として方向判別手段を用いている場合には、その答えの確からしさを選択基準として用いる。また、文字を含む部分画像か否かの判定として、文字領域の抽出方法を用いた場合には、各解像度において抽出した文字領域の割合の高さを選択基準とする。そして、文字領域の割合が高い方の解像度を選択する。これにより、より正確に部分画像データが表す部分画像の文字部を効率良く認識することができる。また文字認識された画像を効率良く圧縮することができる。
<他の実施形態>
また、本発明は上記実施形態を実現する為の装置及び方法のみに限定されるものではない。上記システム又は装置内のコンピュータ(CPUあるいはMPU)に、上記実施形態を実現する為のソフトウェアのプログラムコードを供給し、このプログラムコードに従って上記システムあるいは装置のコンピュータが上記各種デバイスを動作させる。これにより上記実施形態を実現する場合も本発明の範疇に含まれる。
またこの場合、ソフトウェアのプログラムコード自体が上記実施形態の機能を実現することになる。つまり、そのプログラムコード自体、及びそのプログラムコードをコンピュータに供給する為の手段、具体的には上記プログラムコードを格納した記憶媒体は本発明の範疇に含まれる。
この様なプログラムコードを格納する記憶媒体としては、例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
また、上記コンピュータが、供給されたプログラムコードのみに従って各種デバイスを制御することにより、上記実施形態の機能が実現される。またこの場合だけではなく、上記プログラムコードがコンピュータ上で稼働しているOS(オペレーティングシステム)、あるいは他のアプリケーションソフト等と共同して上記実施形態が実現される場合にもかかるプログラムコードは本発明の範疇に含まれる。
更に、この供給されたプログラムコードの指示に基づいてコンピュータの機能拡張ボードやコンピュータに接続された機能格納ユニットに備わるCPU等が処理の一部又は全部を行い、その処理によって上記実施形態が実現される場合も本発明の範疇に含まれる。
実施形態1における画像処理装置のハードウェア構成を示す図 実施形態1における画像処理装置の機能構成を示す図 実施形態1における画像処理のフローチャート 圧縮処理の機能構成を示す図 圧縮処理のフローチャート S506、S507の具体的な処理のフローチャート 本発明の画像処理説明図、 (a)圧縮処理対象となる元の画像(全面画像または部分画像) (b)領域判別の結果 (c)テキストブロックの結合結果 (d)結合されたテキストブロックの画像 実施形態2における処理のフローチャート
符号の説明
203 画像判定部
204 解像度設定部
205 文書判定部

Claims (10)

  1. 画像の大きさを識別する識別手段と、
    前記画像の大きさに基づいて、解像度を設定する解像度設定手段と、
    前記解像度において文字の存在を認識する認識手段とを備えることを特徴とする画像処理装置。
  2. 前記画像は、部分画像であることを特徴とする前記請求項1に記載の画像処理装置。
  3. 更に前記認識手段の認識結果に基づいて、前記画像を圧縮する圧縮手段とを備えることを特徴とする前記請求項1に記載の画像処理装置。
  4. 前記認識手段によって画像に文字が存在しないと認識された場合に、前記画像を前記圧縮手段とは異なるアルゴリズムに基づいて圧縮する第2の圧縮手段を備えることを特徴とする請求項3に記載の画像処理装置。
  5. 前記解像度設定手段は、前記画像のデータ量とページ内での表示の大きさから、可能性の有る複数の解像度を予測して、該複数の解像度のうちの1つを設定することを特徴とする請求項1に記載の画像処理装置。
  6. 前記解像度設定手段は、1ページ内の対象画像の占める面積から推定した解像度と、該画像を1ページ全体の大きさに拡大した画像の縦横幅から推定した解像度のいずれか一つを設定することを特徴とする前記請求項5に記載の画像処理装置。
  7. 前記解像度設定手段は、可能性の有る複数の解像度において、文字の存在を識別できる試験を行った結果に応じて、該複数の解像度のうちの1つを設定することを特徴とする請求項1に記載の画像処理装置。
  8. 画像の大きさを識別する識別工程と、
    前記画像の大きさに基づいて、解像度を設定する解像度設定工程と、
    前記解像度において文字の存在を認識する認識工程とを備えることを特徴とする画像処理方法。
  9. 請求項8に記載の画像処理方法を実行するプログラムコード。
  10. 請求項9に記載のプログラムコードをコンピュータが読み込み可能な状態で格納した記憶媒体。
JP2005372431A 2005-12-26 2005-12-26 画像処理装置、画像処理方法、プログラムコード及び記憶媒体 Withdrawn JP2007174523A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005372431A JP2007174523A (ja) 2005-12-26 2005-12-26 画像処理装置、画像処理方法、プログラムコード及び記憶媒体
US11/611,722 US8515186B2 (en) 2005-12-26 2006-12-15 Image processor, image processing method and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005372431A JP2007174523A (ja) 2005-12-26 2005-12-26 画像処理装置、画像処理方法、プログラムコード及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2007174523A true JP2007174523A (ja) 2007-07-05

Family

ID=38193805

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005372431A Withdrawn JP2007174523A (ja) 2005-12-26 2005-12-26 画像処理装置、画像処理方法、プログラムコード及び記憶媒体

Country Status (2)

Country Link
US (1) US8515186B2 (ja)
JP (1) JP2007174523A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6272061B2 (ja) * 2014-01-31 2018-01-31 キヤノン株式会社 画像形成装置、その制御方法、及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5907835A (en) 1994-11-18 1999-05-25 Canon Kabushiki Kaisha Electronic filing system using different application program for processing drawing commands for printing
JP3683925B2 (ja) 1994-11-18 2005-08-17 キヤノン株式会社 電子ファイリング装置
US7236637B2 (en) * 1999-11-24 2007-06-26 Ge Medical Systems Information Technologies, Inc. Method and apparatus for transmission and display of a compressed digitized image
JP2002077526A (ja) * 2000-08-23 2002-03-15 Fuji Photo Film Co Ltd 画像形成装置
JP4693289B2 (ja) 2001-07-03 2011-06-01 キヤノン株式会社 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
US7133565B2 (en) * 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
US6922487B2 (en) * 2001-11-02 2005-07-26 Xerox Corporation Method and apparatus for capturing text images
KR100633140B1 (ko) * 2004-04-27 2006-10-12 삼성전자주식회사 해상도 보상 기능을 갖는 화상형성장치 및 화상형성장치의해상도 보상방법

Also Published As

Publication number Publication date
US8515186B2 (en) 2013-08-20
US20070147689A1 (en) 2007-06-28

Similar Documents

Publication Publication Date Title
US8203748B2 (en) Image processing apparatus, control method therefor, and program
EP0964353B1 (en) Image processing apparatus and method, and computer-readable memory
US7321688B2 (en) Image processor for character recognition
US7805022B2 (en) Image processing apparatus, image processing method and computer program
US8244035B2 (en) Image processing apparatus and control method thereof
CN101626448B (zh) 图像处理装置和图像处理方法
JP4655335B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2007336226A (ja) 情報処理装置、制御方法、およびコンピュータプログラム
US20030039394A1 (en) Image processing device, image processing method, image processing program, and computer readable recording medium on which image processing program is recorded
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP2010056827A (ja) 画像処理装置および画像処理プログラム
JP4613397B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
JP2007004621A (ja) 文書管理支援装置、文書管理支援方法およびプログラム
JP7063121B2 (ja) 情報処理装置及びプログラム
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP4135656B2 (ja) 画像領域判定方法、画像処理装置およびプログラム
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2007174523A (ja) 画像処理装置、画像処理方法、プログラムコード及び記憶媒体
JP4569162B2 (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
JP2022167414A (ja) 画像処理装置、画像処理方法およびプログラム
JP2002236921A (ja) 文書画像認識方法、文書画像認識装置及び記録媒体
JP5517028B2 (ja) 画像処理装置
JP4228905B2 (ja) 画像処理装置及びプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20090303