JP3792762B2 - 画像処理装置および画像処理方法 - Google Patents
画像処理装置および画像処理方法 Download PDFInfo
- Publication number
- JP3792762B2 JP3792762B2 JP26805895A JP26805895A JP3792762B2 JP 3792762 B2 JP3792762 B2 JP 3792762B2 JP 26805895 A JP26805895 A JP 26805895A JP 26805895 A JP26805895 A JP 26805895A JP 3792762 B2 JP3792762 B2 JP 3792762B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- compression
- image data
- image processing
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/005—Statistical coding, e.g. Huffman, run length coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Image Processing (AREA)
- Character Input (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【発明の属する技術分野】
本発明は、入力された画像データから写真領域や網点画像領域、文字領域を分離抽出する画像処理装置および画像処理方法に関する。
【0002】
【従来の技術】
従来より、複写機やOCR機器等において、画像を空間周波数軸上のデータに変換し、写真領域や網点画像領域、文字領域を分離する方法が考案されている。以下、かかる従来の方法を概説する。
【0003】
(1)画像電子学会研究会予稿93−01−02においては、文字画像と網点画像の周波数特性の違いに着目して像域分離する方法が開示されている。この方法では、まず、画像データを8×8サイズの小ブロックに分割し、離散コサイン変換(DCT;Discrete Cosine Transform)を行う。DCTは、JPEG(Joint Photographic Expert Group)標準などの画像符号化方式に広く利用されており、画像データを周波数軸上のデータに変換するものである。この結果として、各ブロックの係数は、1行1列がブロックの直流成分、列方向は水平方向の周波数、行方向は垂直方向の周波数を表すようになる。各方向とも、行(列)の番号が増えるにしたがって、より高い周波数の強さを示している。このDCTに続いて、ジグザグスキャン処理を行ない、2次元のブロックデータを1次元に変換する。これもJPEG標準で用いられている処理方法であり、図11に示すように、低周波部分から高周波部分へ斜め方向にスキャンを行う。次のステップとして、次式に従って「ジグザグレート」を計算する。
【0004】
ZigZag_Rate[i] = ZigZag[i]×2−ZigZag[i-1]−ZigZag[i+1] (i:1〜63)
続いて、ジグザグレートの低周波部分と高周波部分での積算を行ない、それぞれZZ_Rate_moji,ZZ_Rate_HTとする。そして、次式(1)の判定条件が成り立つときは文字画像と判定し、次式(2)の判定条件が成り立つときは網点画像と判定する。これは、ジグザグレートの「文字画像は低周波部分の値が大きく、網点画像は高周波部分の値が大きい」という性質を利用したものである。
【0005】
ZZ_Rate_moji + key ≧ k1 …(1)
ZZ_Rate_HT + key ≧ k2 …(2)
ここで、定数k1,k2は実験的に設定したものを用い、値keyは周囲4ブロックの判定結果を次式に従って計算したものを用いる。そして、次式中のflagは、判定結果が文字ならば負の値を採り、網点ならば正の値を採る関数である。
【0006】
key=0.25(flag(上)+flag(左))+0.125(flag(二つ左)+flag(斜め上))
(2)画像電子学会誌第20巻5号の「適応的量子化を用いたDCT符号化法」においては、文字画像と網点画像とを分離して画像圧縮の量子化テーブルを切り換えることで、文字画像の劣化防止と網点画像部分の圧縮率向上を図る方法が開示されている。同方法においても、初めに画像データを8×8サイズのブロックに分割し、DCTを行う。次に、図12(a)〜(e)の領域100〜104含まれる係数の絶対値の和をそれぞれ算出する。そして、領域101〜104の係数和の最大値が領域100より大きく、且つ領域101〜104の係数和の最大値が所定の閾値Aより大きいときに、当該ブロックを網点画像であると判定する。また、図12(f)において、領域105に含まれる係数の絶対値の和が閾値Bより大きく、且つ、網点画像ブロックと判別されなかった場合には、当該ブロックを文字画像ブロックであると判定する。
【0007】
(3)特開平2−202771号公報記載の「ファクシミリ装置」においては、二値画像領域と中間調画像領域の分離の明確化を図る方法が開示されている。この装置の像域分離パラメータ決定部は、画像データを4×4サイズのブロックに分割し、二次元アダマール変換を行う。像域分離パラメータLは、Yijをアダマール変換の係数要素とすると、次式で計算する。
【0008】
L=ΣΣYij2 (i+j=3,4,5,6)
そして、Lの値に従って、二値化のスライスレベルを決定する。これは、「二値画領域に仮定した変換結果の方が空間周波数の高域に対してエネルギーが大」であることによっている。すなわち、二値画像領域はLが大きな値になり、中間調画像領域はLが小さな値になることを示している。
【0009】
【発明が解決しようとする課題】
しかしながら、上記従来の方法では、非可逆圧縮処理を施されたことのある画像とそうでない画像が混在したときに、文字抽出率が低下するという欠点があった。すなわち、非可逆圧縮処理は、画像の高周波成分を量子化して切捨てることで圧縮するので、伸張された画像の周波数分布は原画像と異なったものとなる。しかし、従来の方法では、これらの画像を一律な閾値で判定していたために、誤抽出が多く発生するのである。特に、圧縮履歴をもつ画像の二値画領域の像分離パラメータLと原画像の中間調領域の像域分離パラメータLは同様な値をとるので、適切な閾値が設定できなかった。
【0010】
一方、これをユーザが指示するように構成した機器では、圧縮履歴をもつ画像か否かをいちいち設定することになり、非常に使い勝手が悪くなるという欠点があった。
【0011】
図13は、各画像における閾値設定の一例を示す図である。図中、欄110は各画像の二値画部分の像域分離パラメータLの平均値を示し、欄111は中間調部分のLの平均値を示し、欄112は分離するための閾値を示し、欄113は文字抽出率を示している。また、抽出結果114は、圧縮履歴のない原画像を処理をした例であり、抽出結果115および116は、圧縮履歴のある画像を処理した例である。抽出結果114は、原画像例において、判定閾値を二値画領域と中間調領域のLの平均値とすることで、抽出率90%を得ている。抽出結果115は、圧縮履歴画像において、判定閾値を同様に設定することで、抽出率90%を得ている。ここで、圧縮履歴画像と原画像が混在した場合は、例えば、原画像の閾値で全てを判定することになる。これを行なった場合、抽出結果116に示されるように、二値画領域のほぼ全てが中間調画領域と判定されることになり、抽出率が非常に悪くなる。
【0012】
本発明は、上記問題に鑑みてなされたもので、入力画像に圧縮履歴があるか否かに拘わらず、所望の画像を高い抽出率で切出すことが可能な画像処理装置および画像処理方法を提供することを目的とする。
【0013】
【課題を解決するための手段】
上記目的を達成するため本発明の画像処理装置は、入力された画像データに直交変換を施す直交変換手段と、前記直交変換手段による直交変換結果に基づいて、前記入力された画像データの周波数特性を発生させる画像特性発生手段と、前記入力された画像データが非可逆圧縮処理されたものであるか否かを判定する圧縮処理判定手段と、前記圧縮処理判定手段による判定結果に応じて属性判定の閾値を設定する閾値設定手段と、前記画像特性発生手段によって発生された周波数特性と前記閾値設定手段によって設定された閾値とを比較演算することにより、所望の属性の画像領域を検出する画像領域検出手段とを有することを特徴とする。
【0018】
上記目的を達成するため本発明の画像処理装置は、入力された画像データに直交変換を施すステップと、該直交変換結果に基づいて、前記入力された画像データの周波数特性を発生させるステップと、前記入力された画像データが非可逆圧縮処理されたものであるか否かを判定するステップと、該判定結果に応じて属性判定の閾値を設定するステップと、前記発生された周波数特性と前記設定された閾値とを比較演算することにより、所望の属性の画像領域を検出するステップとを有することを特徴とする。
【0023】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて詳細に説明する。
【0024】
図1は、本発明の実施の第1形態に係る画像処理装置の概略構成を示すブロック図であり、本実施の形態の画像処理装置は、例えば外部インタフェースから画像を入力し、蓄積する画像入力蓄積装置を設けたパーソナルコンピュータにより構成されている。また、本実施の形態の画像処理装置は、入力画像から文字領域を切出して保存しておき、これを用いて画像検索を行う機能をも備えている。
【0025】
図1において、1は、装置全体の制御を行うCPUであり、メモリ部3に格納されたプログラムに従って演算やI/O制御などの処理を実行する。CPU1は、バス12を介して、下記の構成要素2〜9と相互に接続されている。
【0026】
周辺機器コントローラ2は、CPU1とセットで用いられ、図示しない周辺機器を制御するのに必要なI/O制御(シリアル通信、パラレル通信、リアルタイムクロック、タイマ、割り込み制御、DMA制御等)を行う。
【0027】
メモリ部3は、CPU1の主記憶として、例えばDRAM、キャッシュRAM、ROM等のメモリを含み、また、画像領域検出処理におけるワークエリアとしての機能も兼ねている。
【0028】
HDD4は、ユーザデータや装置の設定、画像データの記憶を行うハードディスクドライブである。
【0029】
FDD制御部5は、フロッピーディスクドライブ(FDD)10を制御するためのものでである。
【0030】
キーボード制御部6は、キーボード11に対してスキャン信号を送信し、そのスキャン結果に応じてキーコードを発生する処理等を行う。
【0031】
表示ユニット7は、各種情報を表示するためのユニットであり、液晶パネル7bに表示される1画面分の表示データを格納するVRAM7aと、各種ファイルの情報を表示するとともに画像データを表示する液晶パネル7bと、VRAM7aから表示データを順次読みだし、階調変換等を行ないながら、液晶パネル7bへデータを転送表制御部7cとにより構成されている。また、表示制御部7cは、CPU1からVRAM7aのアクセスと、VRAM7aから液晶パネル7bへのデータ転送の調停を行う。
【0032】
通信ユニット8は、図示しない外部機器と各種データのやり取りを行うためのユニットであり、通信制御部8aおよび通信インタフェース8bにより構成されている。通信規格は、RS−232C、イーサネット等のシリアル通信、セントロニクス、SCSI等のパラレル通信のインタフェースであり、テキスト等の各種データや画像データの入出力を行う。また、NTSC方式などのテレビ信号を入力するインタフェースも備えている。
【0033】
画像領域検出部9は、画像データから文字領域を抽出するものである。
【0034】
図2は、この画像領域検出部9の概略構成を示すブロック図である。
【0035】
同図において、画像領域検出部9は、入力した画像を小ブロックに分割して周波数変換を行う周波数画像変換部21と、文字を含む小ブロックを検出する領域抽出部22と、入力画像が以前に非可逆圧縮処理を施されたことがあるか否かを検出する圧縮検出部23と、該圧縮検出部23からの出力に応じて、領域抽出部22での判定閾値を出力する判定テーブル部24とにより構成されている。
【0036】
周波数画像変換部21は、画像データを8×8の小ブロックに分割するブロック分割部21aと、この小ブロックに対して離散コサイン変換(DCT)を行ない、空間周波数軸上の係数データに変換するDCT部21bとに構成されている。なお、ブロック分割部21aおよびDCT部21bは、JPEG方式やMPEG(Motion Picture Experts Group)方式などの標準規格で使用されている技術と同様であるので、その詳細な原理の説明は省略する。
【0037】
領域抽出部22は、小ブロックの周波数係数から文字領域と画像領域とを分離する特徴の検出を行う係数演算部22aと、該係数演算部22aの結果を閾値と比較して、当該ブロックが文字領域であるか否かの判定を行う属性判定部22bとにより構成されている。本実施の形態では、係数演算部22aは、従来技術(3)で述べた像域分離パラメータLを計算する。なお、この係数演算方法は、これに限らず、文字領域の特徴が検出できるものであれば、他のどのような方法を用いてもよい。また、属性判定部22bが使用する判定閾値は、判定テーブル部24から供給され、属性判定部22bは、従来技術と同様に周辺ブロックの判定結果を判定条件として使用する。
【0038】
以上のように構成された画像処理装置が実行する制御処理を、以下、図3〜7を参照して説明する。
【0039】
図3は、本実施の形態の画像処理装置、特に画像領域検出部9が行う文字切り出し処理の概要を説明するための図である。本実施の形態では、画像領域検出部9は、例えば写真の混在する文書画像が入力されると、その中から文字領域を抽出する処理を行う。
【0040】
図3(a)は、入力された文書画像の一例であり、文字30〜32、写真33の4つの要素で構成されている。図中のマス目は、後述する小ブロックの境界を表わしており、元の文書画像には表示されていない。図3(b)は文字抽出結果を表わす図であり、文字領域30、31、32のみが切り出されている。すなわち画像領域検出部9が行う処理は、図3(a)の入力画像から、図3(b)の画像を作成することである。
【0041】
図4は、CPU1が実行する文字領域抽出処理の手順を示すフローチャートであり、画像領域検出部9を用いて行なう。その処理の概要は、まず、入力画像を周波数変換して、非可逆圧縮処理を施されたことがあるか否かを検出し、次に、圧縮検出処理の結果に応じて属性判定の閾値を設定し、周波数変換された画像(以下、「周波数画像」という)の小ブロック毎に属性判定処理を行う。
【0042】
図4において、まずステップS1では、メモリ部3やHDD4から画像データの読込みを行う。
【0043】
次に、ステップS2では、図5を用いて後述する圧縮検出処理サブルーチンに従って画像の圧縮履歴を検出し、ステップS3では、画像が圧縮されたことががあるか否かを判定する。この判定で、画像が圧縮されたものであればステップS4へ進み、圧縮されたものでなければステップS4をスキップしてステップS5へ進む。
【0044】
ステップS4では、圧縮検出の結果に応じて判定テーブル部24のテーブルデータを検索し、検索された閾値を属性判定部22bに設定する。
【0045】
ステップS5では、像域分離パラメータLを閾値と比較する属性判定処理を行う。これによって、各小ブロックが、文字領域であるか写真領域であるかが判定され、その判定結果に応じて画像が分離される。
【0046】
続くステップS6では、文字領域を抽出した画像をHDD4などに出力して、本文字領域抽出処理を終了する。
【0047】
図5は、前記ステップS2の圧縮検出処理サブルーチンの詳細な手順を示すフローチャートである。本圧縮検出処理は、周波数画像の振幅ヒストグラムを作成し、周波数分布を閾値と比較する。これによって、圧縮履歴の有無の判定を行う。
【0048】
図5において、まずステップS11では、周波数画像の振幅ヒストグラムの作成を行う。振幅ヒストグラムは、空間周波数毎の振幅度数分布を積算したものである。
【0049】
図6は、このようにして作成された振幅ヒストグラムの一例を示す図である。本実施の形態では、画像中から100ブロックを代表させて、積算を行なっている。縦軸は周波数をとり、横軸は振幅値を4分割してある。例えば、欄41は、「周波数1で振幅が192〜255であるブロックの度数」を表している。このヒストグラムの構成は、任意のものであってもよい。積算対象とするブロックは、画面内の全ブロックであってもよいし、任意に抽出したブロックであってもよい。また、分類する周波数も、縦横の二次元の周波数であってもよいし、一方向の周波数だけであってもよい。
【0050】
図5に戻って、ステップS12では、振幅ヒストグラムの度数から分布比率を計算する。本実施の形態では、次の式に従って分布比率を求める。周波数fおよび振幅値aの度数をx(f,a)とすると、
周波数 = Σx(f,a) (f=6,7) / Σx(f,a) (f=1〜5)
振幅比 = Σx(f,a) (a=2〜4) / Σx(f,1) ;(f=5〜7)
続くステップS13では、前記ステップS12で計算した比率を分布閾値と比較して、圧縮状況を判定する。分布閾値は、予め判定テーブル部24に格納されている。
【0051】
図7は、この判定テーブル部24に格納されたテーブルデータの一例を示す図である。図中、欄52は周波数比を示し、欄53は振幅比の分布閾値を示している。本実施の形態では、周波数比を分布閾値と比較して状態判定を行う。図では、周波数比が値0.4以上ならば「圧縮なし」の状態、値0.3〜0.4ならば「圧縮1」の状態と判定される。また、周波数比と振幅比を組み合わせて状態を判定するようにしてもよい。欄51は、分布閾値によって判定される圧縮状態であり、本実施の形態では、4状態に分類されている。タイプAは、「圧縮なし」であり、以前に非可逆圧縮処理をされたことがない画像である。タイプB〜Dは、それぞれ「圧縮1〜3」であり、非可逆圧縮処理を受けたことがある画像が分類される。「圧縮1〜3」の違いは、高周波域の劣化度合の差である。非可逆圧縮処理では高周波域の減衰量を制御することで圧縮率を変えており、これによる劣化の度合いで状態を区分する。
【0052】
次に、文字領域の判定閾値の設定について説明する。図7において、欄54は、4状態のそれぞれに対応する判定閾値を示している。上述のように判定された圧縮状態に従って、欄54の各判定閾値を検索し、この検索結果(圧縮状態に対応する判定閾値)を属性判定部22bに設定する。このようにして、画像の圧縮履歴に応じて、属性判定の閾値を設定することができる。
【0053】
以上説明したように本実施の形態では、入力画像が圧縮履歴を有するか否かを検出し、その検出結果に応じて属性判定閾値を切り換えるように構成したので、、入力画像の周波数特性に適した判定処理が可能となり、文字領域抽出率を向上させることが可能となる。
【0054】
なお、本発明は、上述の実施の形態に限られることなく、幅広く応用することができる。例えば、本実施の形態では、直交変換の方法としてDCTを使用して説明したが、フーリエ変換やアダマール変換であってもよい。また、係数演算方法として、本実施の形態では「像域分離パラメータL」を計算する方法を用いて説明したが、文字領域の特徴を検出するものであれば、他のどのような方法であってももちろんよい。さらに、圧縮履歴の検出方法は、ヒストグラムを用いず、分布関数などを定義して、直接に計算するようにしてもよい。
【0055】
次に、本発明の実施の第2形態に係る画像処理装置を説明する。
【0056】
前記実施の形態では、周波数画像の振幅ヒストグラムを作成して閾値判定をすることで、属性判定閾値の変更を行うのに対して、本実施の形態では、画像ヘッダ中の圧縮履歴情報を検出して属性判定閾値の変更を行う点が異なっている。したがって、本実施の形態の画像処理装置は、前記図2の画像領域検出部9を図8の画像領域検出部9′に変更することで実現できる。
【0057】
なお、図8中、図2と同一の構成要素には同一符号を付し、特にその説明を行なわない。図2と比較することによって分かるように、図8の画像領域検出部9′には圧縮検出部23がなく、圧縮検出処理をCPU1で行うようにしたことが前記の実施の形態と異なる。したがって、判定テーブル部24は、CPU1から検索および設定がなされるように構成される。
【0058】
以上のように構成された画像処理装置が実行する制御処理を、以下、図9および10を参照して説明する。
【0059】
図9は、圧縮検出処理サブルーチンの詳細な手順を示すフローチャートであり、前記図5の圧縮検出処理サブルーチンに対応するものである。図9中、図5と同様の処理には同一符号を付し、その詳細な説明は省略する。この圧縮検出処理は、画像ヘッダ中の圧縮履歴譲歩を検出して属性判定閾値の検索を行うものである。
【0060】
図9において、まずステップS21では、入力画像のヘッダ部から圧縮履歴情報を検索する。
【0061】
図10は、入力画像ファイルの構成の一例を示す図である。同図において、入力画像ファイルは、ヘッダ部60と画像データの格納されるフレーム部61とにより構成される。ヘッダ部60は、一般の画像属性情報が記録される一般情報ヘッダ62と、当該画像の圧縮履歴が格納される圧縮履歴ヘッダ63〜65とにより構成され、圧縮履歴ヘッダ63〜65は、非可逆圧縮処理を行う毎に、その方式名と量子化テーブルの値が記録されていく。図の例では、JPEG方式の圧縮とMPEG方式の圧縮をそれぞれ一度ずつ施されていたことが記録されている。
【0062】
このステップS21では、圧縮ヘッダを入力し、最も劣化の激しかった圧縮履歴を検索する。この方法としては、量子化テーブルの高周波の値が最も大きいものを検索する方法などで実現できる。
【0063】
次に、ステップS12では、量子化テーブルから分布比率を計算する。この比率は、前記実施の形態で説明した周波数比や振幅比など任意のものを使用できる。
【0064】
続くステップS13では、ステップS12で計算した分布比率で判定テーブル部24の検索を行ない、属性判定部22bに閾値を設定した後に、本処理を終了する。このときの判定テーブル部24のテーブルデータは、周波数比や振幅比の数値は異なるが、その構成は前記実施の形態の判定テーブル部24(図2)のテーブルデータと同様のものを用いることができる。
【0065】
以上説明したように本実施の形態では、前記実施の形態と全く同様な抽出結果が得られ、さらに、前回圧縮時の劣化特性が正確に分かるので、より正確な閾値設定が可能になり、領域抽出率の向上を図ることができる。
【0066】
なお、本発明は、本実施の形態に限られることなく、幅広く応用することができる。例えば、画像ヘッダ60の構成は、画像劣化の程度が特定できるものであれば、任意の構成でよい。また、画像圧縮を行うときに、分布比率を計算して、これを圧縮履歴ヘッダに記録するようにしてもよい。
【0067】
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。さらに、本発明はシステム或いはプログラムを供給することによって達成される場合にも適用できることは云うまでもない。この場合、本発明を達成するためのソフトウェアによって表されるプログラムを格納した記憶媒体を該システム或いは装置に読み出すことによって、そのシステム或いは装置が、本発明の効果を享受することが可能となる。
【0068】
【発明の効果】
以上説明したように、本発明に依れば、画像特性発生手段により発生された画像特性を比較演算して所望の属性の画像領域を検出するときに、その比較演算が、入力された画像データが非可逆圧縮処理されたものであるか否かに応じて制御されるので、入力画像に圧縮履歴があるか否かに拘わらず、所望の画像を高い抽出率で切出すことが可能となる効果を奏する。
【図面の簡単な説明】
【図1】本発明の実施の第1形態に係る画像処理装置の概略構成を示すブロック図である。
【図2】図1の画像領域検出部の概略構成を示すブロック図である。
【図3】図1の画像領域検出部が行う文字切り出し処理の概要を説明するための図である。
【図4】図1のCPUが実行する文字領域抽出処理の手順を示すフローチャートである。
【図5】図4のステップS2の圧縮検出処理サブルーチンの詳細な手順を示すフローチャートである。
【図6】図1のCPUが作成した周波数画像の振幅ヒストグラムの一例を示す図である。
【図7】図2の判定テーブルに格納されたデータの構成の一例を示す図である。
【図8】本発明の実施の第2形態に係る画像処理装置の画像領域検出部の概略構成を示すブロック図である。
【図9】本発明の実施の第2形態に係る画像処理装置のCPUが実行する圧縮検出処理サブルーチンの詳細な手順を示すフローチャートである。
【図10】入力画像ファイルの構成の一例を示す図である。
【図11】従来技術におけるジグザグスキャン処理の順序を説明するための図である。
【図12】従来技術における係数の積算領域を説明するための図である。
【図13】従来術における像域分離パラメータと閾値設定の関係を説明するための図である。
【符号の説明】
1 CPU
9 画像領域検出部
22 領域抽出部
23 圧縮検出部
24 判定テーブル
Claims (14)
- 入力された画像データに直交変換を施す直交変換手段と、
前記直交変換手段による直交変換結果に基づいて、前記入力された画像データの周波数特性を発生させる画像特性発生手段と、
前記入力された画像データが非可逆圧縮処理されたものであるか否かを判定する圧縮処理判定手段と、
前記圧縮処理判定手段による判定結果に応じて属性判定の閾値を設定する閾値設定手段と、
前記画像特性発生手段によって発生された周波数特性と前記閾値設定手段によって設定された閾値とを比較演算することにより、所望の属性の画像領域を検出する画像領域検出手段と
を有することを特徴とする画像処理装置。 - 前記周波数特性は、前記直交変換の係数要素を演算して求められるパラメータであり、
前記画像領域検出手段は、当該求められたパラメータと前記設定された閾値とを比較演算することにより、前記所望の属性の画像領域を検出することを特徴とする請求項1記載の画像処理装置。 - 前記直交変換は、離散コサイン変換またはアダマール変換のいずれか一方の変換であることを特徴とする請求項1記載の画像処理装置。
- 前記所望の属性の画像領域は、文字により構成される領域であることを特徴とする請求項1乃至3のいずれかに記載の画像処理装置。
- 前記圧縮処理判定手段は、前記直交変換手段による直交変換結果に基づいて周波数に対する振幅ヒストグラムを作成し、当該作成された振幅ヒストグラムに基づいて分布比率を算出し、該算出された分布比率を予め設定された閾値と比較することにより、当該入力された画像データが非可逆圧縮処理されたものであるか否かを判定することを特徴とする請求項1記載の画像処理装置。
- 前記圧縮処理判定手段は、前記入力された画像データの付加情報を用いて、当該入力された画像データが非可逆圧縮処理されたものであるか否かを判定することを特徴とする請求項1記載の画像処理装置。
- 前記圧縮処理判定手段は、更に、前記入力された画像データに対する非可逆圧縮処理による劣化度合を判定し、
前記閾値設定手段は、前記劣化度合の判定結果に応じた閾値を設定することを特徴とする請求項1記載の画像処理装置。 - 入力された画像データに直交変換を施すステップと、
該直交変換結果に基づいて、前記入力された画像データの周波数特性を発生させるステップと、
前記入力された画像データが非可逆圧縮処理されたものであるか否かを判定するステップと、
該判定結果に応じて属性判定の閾値を設定するステップと、
前記発生された周波数特性と前記設定された閾値とを比較演算することにより、所望の属性の画像領域を検出するステップと
を有することを特徴とする画像処理方法。 - 前記周波数特性は、前記直交変換の係数要素を演算して求められるパラメータであり、
前記画像領域を検出するステップは、当該求められたパラメータと前記設定された閾値とを比較演算することにより、前記所望の属性の画像領域を検出することを特徴とする請求項8記載の画像処理方法。 - 前記直交変換は、離散コサイン変換またはアダマール変換のいずれか一方の変換であることを特徴とする請求項8記載の画像処理方法。
- 前記所望の属性の画像領域は、文字により構成される領域であることを特徴とする請求項8乃至10のいずれかに記載の画像処理方法。
- 前記圧縮処理を判定するステップは、前記直交変換結果に基づいて周波数に対する振幅ヒストグラムを作成し、当該作成された振幅ヒストグラムに基づいて分布比率を算出し、該算出された分布比率を予め設定された閾値と比較することにより、当該入力された画像データが非可逆圧縮処理されたものであるか否かを判定することを特徴とする請求項8記載の画像処理方法。
- 前記圧縮処理を判定するステップは、前記入力された画像データの付加情報を用いて、当該入力された画像データが非可逆圧縮処理されたものであるか否かを判定することを特徴とする請求項8記載の画像処理方法。
- 前記圧縮処理を判定するステップでは、更に、前記入力された画像データに対する非可逆圧縮処理による劣化度合を判定し、
前記閾値を設定するステップでは、前記劣化度合の判定結果に応じた閾値を設定することを特徴とする請求項8記載の画像処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26805895A JP3792762B2 (ja) | 1995-09-22 | 1995-09-22 | 画像処理装置および画像処理方法 |
US08/717,071 US6249609B1 (en) | 1995-09-22 | 1996-09-20 | Apparatus and method for processing images |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26805895A JP3792762B2 (ja) | 1995-09-22 | 1995-09-22 | 画像処理装置および画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0991374A JPH0991374A (ja) | 1997-04-04 |
JP3792762B2 true JP3792762B2 (ja) | 2006-07-05 |
Family
ID=17453310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26805895A Expired - Fee Related JP3792762B2 (ja) | 1995-09-22 | 1995-09-22 | 画像処理装置および画像処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6249609B1 (ja) |
JP (1) | JP3792762B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6816491B1 (en) * | 1998-11-04 | 2004-11-09 | Hitachi, Ltd. | Multiplexed audio data decoding apparatus and receiver apparatus |
US6680974B1 (en) * | 1999-12-02 | 2004-01-20 | Lucent Technologies Inc. | Methods and apparatus for context selection of block transform coefficients |
US9569681B2 (en) * | 2014-04-10 | 2017-02-14 | Xerox Corporation | Methods and systems for efficient image cropping and analysis |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63173485A (ja) * | 1987-01-13 | 1988-07-18 | Toshiba Corp | 画像デ−タ圧縮装置 |
US5187755A (en) * | 1988-06-30 | 1993-02-16 | Dainippon Screen Mfg. Co., Ltd. | Method of and apparatus for compressing image data |
US5086487A (en) * | 1988-11-24 | 1992-02-04 | Canon Kabushiki Kaisha | Method and apparatus for image encoding in which reference pixels for predictive encoding can be selected based on image size |
US5046121A (en) * | 1989-01-31 | 1991-09-03 | Konica Corporation | Image data compression apparatus |
JPH02202771A (ja) | 1989-01-31 | 1990-08-10 | Nec Corp | ファクシミリ装置 |
US5333212A (en) * | 1991-03-04 | 1994-07-26 | Storm Technology | Image compression technique with regionally selective compression ratio |
US5657399A (en) * | 1991-05-17 | 1997-08-12 | Canon Kabushiki Kaisha | Encoding/decoding apparatus using quantizing steps information |
US5432870A (en) * | 1993-06-30 | 1995-07-11 | Ricoh Corporation | Method and apparatus for compressing and decompressing images of documents |
US5517327A (en) * | 1993-06-30 | 1996-05-14 | Minolta Camera Kabushiki Kaisha | Data processor for image data using orthogonal transformation |
-
1995
- 1995-09-22 JP JP26805895A patent/JP3792762B2/ja not_active Expired - Fee Related
-
1996
- 1996-09-20 US US08/717,071 patent/US6249609B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US6249609B1 (en) | 2001-06-19 |
JPH0991374A (ja) | 1997-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3733161B2 (ja) | 画像処理装置および方法 | |
US6996184B2 (en) | Image-data processing apparatus | |
JP2001143066A (ja) | 画像処理装置、画像処理システム及び記憶装置、画像処理方法、並びに記憶媒体 | |
US5995657A (en) | Image processing method and apparatus | |
US8064707B2 (en) | Image recognition method and image recognition apparatus | |
JP3792762B2 (ja) | 画像処理装置および画像処理方法 | |
JPH09186858A (ja) | 画像処理方法及び装置、及びコンピュータ制御装置 | |
JPH05176173A (ja) | 画像データ圧縮方法 | |
JPH10108011A (ja) | データ処理装置 | |
JP4649237B2 (ja) | 画像圧縮装置、画像圧縮方法及び画像圧縮プログラム | |
JPH118838A (ja) | 画像信号処理装置及び方法並びに予測パラメータの学習方法 | |
JPH04356873A (ja) | カラー文書画像の適応符号化方式 | |
JP3373117B2 (ja) | 画像符号化装置 | |
KR100473944B1 (ko) | 디지털 영상신호의 텍스트 추출방법 | |
JPH07154794A (ja) | 画像符号変換装置 | |
JP3774498B2 (ja) | 画像処理方法とその装置 | |
JPH06225213A (ja) | 画像処理方法と装置 | |
JPH0774966A (ja) | 画像処理装置 | |
JP2013207777A (ja) | 画像圧縮装置 | |
JP2003338934A (ja) | 画像処理装置および方法 | |
JPH0918877A (ja) | フラクタル画像圧縮装置 | |
JPH05176174A (ja) | 画像データ圧縮方法 | |
JPH0993427A (ja) | 画像処理装置及び方法 | |
JPH0927904A (ja) | 画像処理方法及びその装置 | |
JPH05181961A (ja) | ファイリング装置の文書検索装置および連続文書表示装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051024 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060406 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |