JP3792762B2

JP3792762B2 - 画像処理装置および画像処理方法

Info

Publication number: JP3792762B2
Application number: JP26805895A
Authority: JP
Inventors: 伸一砂川; 一弘松林
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1995-09-22
Filing date: 1995-09-22
Publication date: 2006-07-05
Anticipated expiration: 2015-09-22
Also published as: US6249609B1; JPH0991374A

Description

【０００１】
【発明の属する技術分野】
本発明は、入力された画像データから写真領域や網点画像領域、文字領域を分離抽出する画像処理装置および画像処理方法に関する。
【０００２】
【従来の技術】
従来より、複写機やＯＣＲ機器等において、画像を空間周波数軸上のデータに変換し、写真領域や網点画像領域、文字領域を分離する方法が考案されている。以下、かかる従来の方法を概説する。
【０００３】
（１）画像電子学会研究会予稿９３−０１−０２においては、文字画像と網点画像の周波数特性の違いに着目して像域分離する方法が開示されている。この方法では、まず、画像データを８×８サイズの小ブロックに分割し、離散コサイン変換（ＤＣＴ；Discrete Cosine Transform）を行う。ＤＣＴは、ＪＰＥＧ（Joint Photographic Expert Group）標準などの画像符号化方式に広く利用されており、画像データを周波数軸上のデータに変換するものである。この結果として、各ブロックの係数は、１行１列がブロックの直流成分、列方向は水平方向の周波数、行方向は垂直方向の周波数を表すようになる。各方向とも、行（列）の番号が増えるにしたがって、より高い周波数の強さを示している。このＤＣＴに続いて、ジグザグスキャン処理を行ない、２次元のブロックデータを１次元に変換する。これもＪＰＥＧ標準で用いられている処理方法であり、図１１に示すように、低周波部分から高周波部分へ斜め方向にスキャンを行う。次のステップとして、次式に従って「ジグザグレート」を計算する。
【０００４】
ZigZag_Rate[i] ＝ ZigZag[i]×2−ZigZag[i-1]−ZigZag[i+1] (i:1〜63)
続いて、ジグザグレートの低周波部分と高周波部分での積算を行ない、それぞれZZ_Rate_moji，ZZ_Rate_HTとする。そして、次式（１）の判定条件が成り立つときは文字画像と判定し、次式（２）の判定条件が成り立つときは網点画像と判定する。これは、ジグザグレートの「文字画像は低周波部分の値が大きく、網点画像は高周波部分の値が大きい」という性質を利用したものである。
【０００５】
ZZ_Rate_moji ＋ key ≧ k1 …（１）
ZZ_Rate_HT ＋ key ≧ k2 …（２）
ここで、定数ｋ１，ｋ２は実験的に設定したものを用い、値ｋｅｙは周囲４ブロックの判定結果を次式に従って計算したものを用いる。そして、次式中のflagは、判定結果が文字ならば負の値を採り、網点ならば正の値を採る関数である。
【０００６】
key＝0.25(flag(上)＋flag(左))＋0.125(flag(二つ左)＋flag(斜め上))
（２）画像電子学会誌第２０巻５号の「適応的量子化を用いたＤＣＴ符号化法」においては、文字画像と網点画像とを分離して画像圧縮の量子化テーブルを切り換えることで、文字画像の劣化防止と網点画像部分の圧縮率向上を図る方法が開示されている。同方法においても、初めに画像データを８×８サイズのブロックに分割し、ＤＣＴを行う。次に、図１２（ａ）〜（ｅ）の領域１００〜１０４含まれる係数の絶対値の和をそれぞれ算出する。そして、領域１０１〜１０４の係数和の最大値が領域１００より大きく、且つ領域１０１〜１０４の係数和の最大値が所定の閾値Ａより大きいときに、当該ブロックを網点画像であると判定する。また、図１２（ｆ）において、領域１０５に含まれる係数の絶対値の和が閾値Ｂより大きく、且つ、網点画像ブロックと判別されなかった場合には、当該ブロックを文字画像ブロックであると判定する。
【０００７】
（３）特開平２−２０２７７１号公報記載の「ファクシミリ装置」においては、二値画像領域と中間調画像領域の分離の明確化を図る方法が開示されている。この装置の像域分離パラメータ決定部は、画像データを４×４サイズのブロックに分割し、二次元アダマール変換を行う。像域分離パラメータＬは、Ｙijをアダマール変換の係数要素とすると、次式で計算する。
【０００８】
Ｌ＝ΣΣＹij² （ｉ＋ｊ＝３，４，５，６）
そして、Ｌの値に従って、二値化のスライスレベルを決定する。これは、「二値画領域に仮定した変換結果の方が空間周波数の高域に対してエネルギーが大」であることによっている。すなわち、二値画像領域はＬが大きな値になり、中間調画像領域はＬが小さな値になることを示している。
【０００９】
【発明が解決しようとする課題】
しかしながら、上記従来の方法では、非可逆圧縮処理を施されたことのある画像とそうでない画像が混在したときに、文字抽出率が低下するという欠点があった。すなわち、非可逆圧縮処理は、画像の高周波成分を量子化して切捨てることで圧縮するので、伸張された画像の周波数分布は原画像と異なったものとなる。しかし、従来の方法では、これらの画像を一律な閾値で判定していたために、誤抽出が多く発生するのである。特に、圧縮履歴をもつ画像の二値画領域の像分離パラメータＬと原画像の中間調領域の像域分離パラメータＬは同様な値をとるので、適切な閾値が設定できなかった。
【００１０】
一方、これをユーザが指示するように構成した機器では、圧縮履歴をもつ画像か否かをいちいち設定することになり、非常に使い勝手が悪くなるという欠点があった。
【００１１】
図１３は、各画像における閾値設定の一例を示す図である。図中、欄１１０は各画像の二値画部分の像域分離パラメータＬの平均値を示し、欄１１１は中間調部分のＬの平均値を示し、欄１１２は分離するための閾値を示し、欄１１３は文字抽出率を示している。また、抽出結果１１４は、圧縮履歴のない原画像を処理をした例であり、抽出結果１１５および１１６は、圧縮履歴のある画像を処理した例である。抽出結果１１４は、原画像例において、判定閾値を二値画領域と中間調領域のＬの平均値とすることで、抽出率９０％を得ている。抽出結果１１５は、圧縮履歴画像において、判定閾値を同様に設定することで、抽出率９０％を得ている。ここで、圧縮履歴画像と原画像が混在した場合は、例えば、原画像の閾値で全てを判定することになる。これを行なった場合、抽出結果１１６に示されるように、二値画領域のほぼ全てが中間調画領域と判定されることになり、抽出率が非常に悪くなる。
【００１２】
本発明は、上記問題に鑑みてなされたもので、入力画像に圧縮履歴があるか否かに拘わらず、所望の画像を高い抽出率で切出すことが可能な画像処理装置および画像処理方法を提供することを目的とする。
【００１３】
【課題を解決するための手段】
上記目的を達成するため本発明の画像処理装置は、入力された画像データに直交変換を施す直交変換手段と、前記直交変換手段による直交変換結果に基づいて、前記入力された画像データの周波数特性を発生させる画像特性発生手段と、前記入力された画像データが非可逆圧縮処理されたものであるか否かを判定する圧縮処理判定手段と、前記圧縮処理判定手段による判定結果に応じて属性判定の閾値を設定する閾値設定手段と、前記画像特性発生手段によって発生された周波数特性と前記閾値設定手段によって設定された閾値とを比較演算することにより、所望の属性の画像領域を検出する画像領域検出手段とを有することを特徴とする。
【００１８】
上記目的を達成するため本発明の画像処理装置は、入力された画像データに直交変換を施すステップと、該直交変換結果に基づいて、前記入力された画像データの周波数特性を発生させるステップと、前記入力された画像データが非可逆圧縮処理されたものであるか否かを判定するステップと、該判定結果に応じて属性判定の閾値を設定するステップと、前記発生された周波数特性と前記設定された閾値とを比較演算することにより、所望の属性の画像領域を検出するステップとを有することを特徴とする。
【００２３】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて詳細に説明する。
【００２４】
図１は、本発明の実施の第１形態に係る画像処理装置の概略構成を示すブロック図であり、本実施の形態の画像処理装置は、例えば外部インタフェースから画像を入力し、蓄積する画像入力蓄積装置を設けたパーソナルコンピュータにより構成されている。また、本実施の形態の画像処理装置は、入力画像から文字領域を切出して保存しておき、これを用いて画像検索を行う機能をも備えている。
【００２５】
図１において、１は、装置全体の制御を行うＣＰＵであり、メモリ部３に格納されたプログラムに従って演算やＩ／Ｏ制御などの処理を実行する。ＣＰＵ１は、バス１２を介して、下記の構成要素２〜９と相互に接続されている。
【００２６】
周辺機器コントローラ２は、ＣＰＵ１とセットで用いられ、図示しない周辺機器を制御するのに必要なＩ／Ｏ制御（シリアル通信、パラレル通信、リアルタイムクロック、タイマ、割り込み制御、ＤＭＡ制御等）を行う。
【００２７】
メモリ部３は、ＣＰＵ１の主記憶として、例えばＤＲＡＭ、キャッシュＲＡＭ、ＲＯＭ等のメモリを含み、また、画像領域検出処理におけるワークエリアとしての機能も兼ねている。
【００２８】
ＨＤＤ４は、ユーザデータや装置の設定、画像データの記憶を行うハードディスクドライブである。
【００２９】
ＦＤＤ制御部５は、フロッピーディスクドライブ（ＦＤＤ）１０を制御するためのものでである。
【００３０】
キーボード制御部６は、キーボード１１に対してスキャン信号を送信し、そのスキャン結果に応じてキーコードを発生する処理等を行う。
【００３１】
表示ユニット７は、各種情報を表示するためのユニットであり、液晶パネル７ｂに表示される１画面分の表示データを格納するＶＲＡＭ７ａと、各種ファイルの情報を表示するとともに画像データを表示する液晶パネル７ｂと、ＶＲＡＭ７ａから表示データを順次読みだし、階調変換等を行ないながら、液晶パネル７ｂへデータを転送表制御部７ｃとにより構成されている。また、表示制御部７ｃは、ＣＰＵ１からＶＲＡＭ７ａのアクセスと、ＶＲＡＭ７ａから液晶パネル７ｂへのデータ転送の調停を行う。
【００３２】
通信ユニット８は、図示しない外部機器と各種データのやり取りを行うためのユニットであり、通信制御部８ａおよび通信インタフェース８ｂにより構成されている。通信規格は、ＲＳ−２３２Ｃ、イーサネット等のシリアル通信、セントロニクス、ＳＣＳＩ等のパラレル通信のインタフェースであり、テキスト等の各種データや画像データの入出力を行う。また、ＮＴＳＣ方式などのテレビ信号を入力するインタフェースも備えている。
【００３３】
画像領域検出部９は、画像データから文字領域を抽出するものである。
【００３４】
図２は、この画像領域検出部９の概略構成を示すブロック図である。
【００３５】
同図において、画像領域検出部９は、入力した画像を小ブロックに分割して周波数変換を行う周波数画像変換部２１と、文字を含む小ブロックを検出する領域抽出部２２と、入力画像が以前に非可逆圧縮処理を施されたことがあるか否かを検出する圧縮検出部２３と、該圧縮検出部２３からの出力に応じて、領域抽出部２２での判定閾値を出力する判定テーブル部２４とにより構成されている。
【００３６】
周波数画像変換部２１は、画像データを８×８の小ブロックに分割するブロック分割部２１ａと、この小ブロックに対して離散コサイン変換（ＤＣＴ）を行ない、空間周波数軸上の係数データに変換するＤＣＴ部２１ｂとに構成されている。なお、ブロック分割部２１ａおよびＤＣＴ部２１ｂは、ＪＰＥＧ方式やＭＰＥＧ（Motion Picture Experts Group）方式などの標準規格で使用されている技術と同様であるので、その詳細な原理の説明は省略する。
【００３７】
領域抽出部２２は、小ブロックの周波数係数から文字領域と画像領域とを分離する特徴の検出を行う係数演算部２２ａと、該係数演算部２２ａの結果を閾値と比較して、当該ブロックが文字領域であるか否かの判定を行う属性判定部２２ｂとにより構成されている。本実施の形態では、係数演算部２２ａは、従来技術（３）で述べた像域分離パラメータＬを計算する。なお、この係数演算方法は、これに限らず、文字領域の特徴が検出できるものであれば、他のどのような方法を用いてもよい。また、属性判定部２２ｂが使用する判定閾値は、判定テーブル部２４から供給され、属性判定部２２ｂは、従来技術と同様に周辺ブロックの判定結果を判定条件として使用する。
【００３８】
以上のように構成された画像処理装置が実行する制御処理を、以下、図３〜７を参照して説明する。
【００３９】
図３は、本実施の形態の画像処理装置、特に画像領域検出部９が行う文字切り出し処理の概要を説明するための図である。本実施の形態では、画像領域検出部９は、例えば写真の混在する文書画像が入力されると、その中から文字領域を抽出する処理を行う。
【００４０】
図３（ａ）は、入力された文書画像の一例であり、文字３０〜３２、写真３３の４つの要素で構成されている。図中のマス目は、後述する小ブロックの境界を表わしており、元の文書画像には表示されていない。図３（ｂ）は文字抽出結果を表わす図であり、文字領域３０、３１、３２のみが切り出されている。すなわち画像領域検出部９が行う処理は、図３（ａ）の入力画像から、図３（ｂ）の画像を作成することである。
【００４１】
図４は、ＣＰＵ１が実行する文字領域抽出処理の手順を示すフローチャートであり、画像領域検出部９を用いて行なう。その処理の概要は、まず、入力画像を周波数変換して、非可逆圧縮処理を施されたことがあるか否かを検出し、次に、圧縮検出処理の結果に応じて属性判定の閾値を設定し、周波数変換された画像（以下、「周波数画像」という）の小ブロック毎に属性判定処理を行う。
【００４２】
図４において、まずステップＳ１では、メモリ部３やＨＤＤ４から画像データの読込みを行う。
【００４３】
次に、ステップＳ２では、図５を用いて後述する圧縮検出処理サブルーチンに従って画像の圧縮履歴を検出し、ステップＳ３では、画像が圧縮されたことががあるか否かを判定する。この判定で、画像が圧縮されたものであればステップＳ４へ進み、圧縮されたものでなければステップＳ４をスキップしてステップＳ５へ進む。
【００４４】
ステップＳ４では、圧縮検出の結果に応じて判定テーブル部２４のテーブルデータを検索し、検索された閾値を属性判定部２２ｂに設定する。
【００４５】
ステップＳ５では、像域分離パラメータＬを閾値と比較する属性判定処理を行う。これによって、各小ブロックが、文字領域であるか写真領域であるかが判定され、その判定結果に応じて画像が分離される。
【００４６】
続くステップＳ６では、文字領域を抽出した画像をＨＤＤ４などに出力して、本文字領域抽出処理を終了する。
【００４７】
図５は、前記ステップＳ２の圧縮検出処理サブルーチンの詳細な手順を示すフローチャートである。本圧縮検出処理は、周波数画像の振幅ヒストグラムを作成し、周波数分布を閾値と比較する。これによって、圧縮履歴の有無の判定を行う。
【００４８】
図５において、まずステップＳ１１では、周波数画像の振幅ヒストグラムの作成を行う。振幅ヒストグラムは、空間周波数毎の振幅度数分布を積算したものである。
【００４９】
図６は、このようにして作成された振幅ヒストグラムの一例を示す図である。本実施の形態では、画像中から１００ブロックを代表させて、積算を行なっている。縦軸は周波数をとり、横軸は振幅値を４分割してある。例えば、欄４１は、「周波数１で振幅が１９２〜２５５であるブロックの度数」を表している。このヒストグラムの構成は、任意のものであってもよい。積算対象とするブロックは、画面内の全ブロックであってもよいし、任意に抽出したブロックであってもよい。また、分類する周波数も、縦横の二次元の周波数であってもよいし、一方向の周波数だけであってもよい。
【００５０】
図５に戻って、ステップＳ１２では、振幅ヒストグラムの度数から分布比率を計算する。本実施の形態では、次の式に従って分布比率を求める。周波数ｆおよび振幅値ａの度数をｘ(ｆ,ａ)とすると、
周波数＝ Σｘ(ｆ,ａ) （ｆ＝６，７）／ Σｘ(ｆ,ａ) （ｆ＝１〜５）
振幅比＝ Σｘ(ｆ,ａ) （ａ＝２〜４）／ Σｘ(ｆ,１) ；（ｆ＝５〜７）
続くステップＳ１３では、前記ステップＳ１２で計算した比率を分布閾値と比較して、圧縮状況を判定する。分布閾値は、予め判定テーブル部２４に格納されている。
【００５１】
図７は、この判定テーブル部２４に格納されたテーブルデータの一例を示す図である。図中、欄５２は周波数比を示し、欄５３は振幅比の分布閾値を示している。本実施の形態では、周波数比を分布閾値と比較して状態判定を行う。図では、周波数比が値０．４以上ならば「圧縮なし」の状態、値０．３〜０．４ならば「圧縮１」の状態と判定される。また、周波数比と振幅比を組み合わせて状態を判定するようにしてもよい。欄５１は、分布閾値によって判定される圧縮状態であり、本実施の形態では、４状態に分類されている。タイプＡは、「圧縮なし」であり、以前に非可逆圧縮処理をされたことがない画像である。タイプＢ〜Ｄは、それぞれ「圧縮１〜３」であり、非可逆圧縮処理を受けたことがある画像が分類される。「圧縮１〜３」の違いは、高周波域の劣化度合の差である。非可逆圧縮処理では高周波域の減衰量を制御することで圧縮率を変えており、これによる劣化の度合いで状態を区分する。
【００５２】
次に、文字領域の判定閾値の設定について説明する。図７において、欄５４は、４状態のそれぞれに対応する判定閾値を示している。上述のように判定された圧縮状態に従って、欄５４の各判定閾値を検索し、この検索結果（圧縮状態に対応する判定閾値）を属性判定部２２ｂに設定する。このようにして、画像の圧縮履歴に応じて、属性判定の閾値を設定することができる。
【００５３】
以上説明したように本実施の形態では、入力画像が圧縮履歴を有するか否かを検出し、その検出結果に応じて属性判定閾値を切り換えるように構成したので、、入力画像の周波数特性に適した判定処理が可能となり、文字領域抽出率を向上させることが可能となる。
【００５４】
なお、本発明は、上述の実施の形態に限られることなく、幅広く応用することができる。例えば、本実施の形態では、直交変換の方法としてＤＣＴを使用して説明したが、フーリエ変換やアダマール変換であってもよい。また、係数演算方法として、本実施の形態では「像域分離パラメータＬ」を計算する方法を用いて説明したが、文字領域の特徴を検出するものであれば、他のどのような方法であってももちろんよい。さらに、圧縮履歴の検出方法は、ヒストグラムを用いず、分布関数などを定義して、直接に計算するようにしてもよい。
【００５５】
次に、本発明の実施の第２形態に係る画像処理装置を説明する。
【００５６】
前記実施の形態では、周波数画像の振幅ヒストグラムを作成して閾値判定をすることで、属性判定閾値の変更を行うのに対して、本実施の形態では、画像ヘッダ中の圧縮履歴情報を検出して属性判定閾値の変更を行う点が異なっている。したがって、本実施の形態の画像処理装置は、前記図２の画像領域検出部９を図８の画像領域検出部９′に変更することで実現できる。
【００５７】
なお、図８中、図２と同一の構成要素には同一符号を付し、特にその説明を行なわない。図２と比較することによって分かるように、図８の画像領域検出部９′には圧縮検出部２３がなく、圧縮検出処理をＣＰＵ１で行うようにしたことが前記の実施の形態と異なる。したがって、判定テーブル部２４は、ＣＰＵ１から検索および設定がなされるように構成される。
【００５８】
以上のように構成された画像処理装置が実行する制御処理を、以下、図９および１０を参照して説明する。
【００５９】
図９は、圧縮検出処理サブルーチンの詳細な手順を示すフローチャートであり、前記図５の圧縮検出処理サブルーチンに対応するものである。図９中、図５と同様の処理には同一符号を付し、その詳細な説明は省略する。この圧縮検出処理は、画像ヘッダ中の圧縮履歴譲歩を検出して属性判定閾値の検索を行うものである。
【００６０】
図９において、まずステップＳ２１では、入力画像のヘッダ部から圧縮履歴情報を検索する。
【００６１】
図１０は、入力画像ファイルの構成の一例を示す図である。同図において、入力画像ファイルは、ヘッダ部６０と画像データの格納されるフレーム部６１とにより構成される。ヘッダ部６０は、一般の画像属性情報が記録される一般情報ヘッダ６２と、当該画像の圧縮履歴が格納される圧縮履歴ヘッダ６３〜６５とにより構成され、圧縮履歴ヘッダ６３〜６５は、非可逆圧縮処理を行う毎に、その方式名と量子化テーブルの値が記録されていく。図の例では、ＪＰＥＧ方式の圧縮とＭＰＥＧ方式の圧縮をそれぞれ一度ずつ施されていたことが記録されている。
【００６２】
このステップＳ２１では、圧縮ヘッダを入力し、最も劣化の激しかった圧縮履歴を検索する。この方法としては、量子化テーブルの高周波の値が最も大きいものを検索する方法などで実現できる。
【００６３】
次に、ステップＳ１２では、量子化テーブルから分布比率を計算する。この比率は、前記実施の形態で説明した周波数比や振幅比など任意のものを使用できる。
【００６４】
続くステップＳ１３では、ステップＳ１２で計算した分布比率で判定テーブル部２４の検索を行ない、属性判定部２２ｂに閾値を設定した後に、本処理を終了する。このときの判定テーブル部２４のテーブルデータは、周波数比や振幅比の数値は異なるが、その構成は前記実施の形態の判定テーブル部２４（図２）のテーブルデータと同様のものを用いることができる。
【００６５】
以上説明したように本実施の形態では、前記実施の形態と全く同様な抽出結果が得られ、さらに、前回圧縮時の劣化特性が正確に分かるので、より正確な閾値設定が可能になり、領域抽出率の向上を図ることができる。
【００６６】
なお、本発明は、本実施の形態に限られることなく、幅広く応用することができる。例えば、画像ヘッダ６０の構成は、画像劣化の程度が特定できるものであれば、任意の構成でよい。また、画像圧縮を行うときに、分布比率を計算して、これを圧縮履歴ヘッダに記録するようにしてもよい。
【００６７】
また、本発明は、複数の機器から構成されるシステムに適用しても、１つの機器からなる装置に適用してもよい。さらに、本発明はシステム或いはプログラムを供給することによって達成される場合にも適用できることは云うまでもない。この場合、本発明を達成するためのソフトウェアによって表されるプログラムを格納した記憶媒体を該システム或いは装置に読み出すことによって、そのシステム或いは装置が、本発明の効果を享受することが可能となる。
【００６８】
【発明の効果】
以上説明したように、本発明に依れば、画像特性発生手段により発生された画像特性を比較演算して所望の属性の画像領域を検出するときに、その比較演算が、入力された画像データが非可逆圧縮処理されたものであるか否かに応じて制御されるので、入力画像に圧縮履歴があるか否かに拘わらず、所望の画像を高い抽出率で切出すことが可能となる効果を奏する。
【図面の簡単な説明】
【図１】本発明の実施の第１形態に係る画像処理装置の概略構成を示すブロック図である。
【図２】図１の画像領域検出部の概略構成を示すブロック図である。
【図３】図１の画像領域検出部が行う文字切り出し処理の概要を説明するための図である。
【図４】図１のＣＰＵが実行する文字領域抽出処理の手順を示すフローチャートである。
【図５】図４のステップＳ２の圧縮検出処理サブルーチンの詳細な手順を示すフローチャートである。
【図６】図１のＣＰＵが作成した周波数画像の振幅ヒストグラムの一例を示す図である。
【図７】図２の判定テーブルに格納されたデータの構成の一例を示す図である。
【図８】本発明の実施の第２形態に係る画像処理装置の画像領域検出部の概略構成を示すブロック図である。
【図９】本発明の実施の第２形態に係る画像処理装置のＣＰＵが実行する圧縮検出処理サブルーチンの詳細な手順を示すフローチャートである。
【図１０】入力画像ファイルの構成の一例を示す図である。
【図１１】従来技術におけるジグザグスキャン処理の順序を説明するための図である。
【図１２】従来技術における係数の積算領域を説明するための図である。
【図１３】従来術における像域分離パラメータと閾値設定の関係を説明するための図である。
【符号の説明】
１ＣＰＵ
９画像領域検出部
２２領域抽出部
２３圧縮検出部
２４判定テーブル

Claims

入力された画像データに直交変換を施す直交変換手段と、
前記直交変換手段による直交変換結果に基づいて、前記入力された画像データの周波数特性を発生させる画像特性発生手段と、
前記入力された画像データが非可逆圧縮処理されたものであるか否かを判定する圧縮処理判定手段と、
前記圧縮処理判定手段による判定結果に応じて属性判定の閾値を設定する閾値設定手段と、
前記画像特性発生手段によって発生された周波数特性と前記閾値設定手段によって設定された閾値とを比較演算することにより、所望の属性の画像領域を検出する画像領域検出手段と
を有することを特徴とする画像処理装置。
前記周波数特性は、前記直交変換の係数要素を演算して求められるパラメータであり、
前記画像領域検出手段は、当該求められたパラメータと前記設定された閾値とを比較演算することにより、前記所望の属性の画像領域を検出することを特徴とする請求項１記載の画像処理装置。
前記直交変換は、離散コサイン変換またはアダマール変換のいずれか一方の変換であることを特徴とする請求項１記載の画像処理装置。
前記所望の属性の画像領域は、文字により構成される領域であることを特徴とする請求項１乃至３のいずれかに記載の画像処理装置。
前記圧縮処理判定手段は、前記直交変換手段による直交変換結果に基づいて周波数に対する振幅ヒストグラムを作成し、当該作成された振幅ヒストグラムに基づいて分布比率を算出し、該算出された分布比率を予め設定された閾値と比較することにより、当該入力された画像データが非可逆圧縮処理されたものであるか否かを判定することを特徴とする請求項１記載の画像処理装置。
前記圧縮処理判定手段は、前記入力された画像データの付加情報を用いて、当該入力された画像データが非可逆圧縮処理されたものであるか否かを判定することを特徴とする請求項１記載の画像処理装置。
前記圧縮処理判定手段は、更に、前記入力された画像データに対する非可逆圧縮処理による劣化度合を判定し、
前記閾値設定手段は、前記劣化度合の判定結果に応じた閾値を設定することを特徴とする請求項１記載の画像処理装置。
入力された画像データに直交変換を施すステップと、
該直交変換結果に基づいて、前記入力された画像データの周波数特性を発生させるステップと、
前記入力された画像データが非可逆圧縮処理されたものであるか否かを判定するステップと、
該判定結果に応じて属性判定の閾値を設定するステップと、
前記発生された周波数特性と前記設定された閾値とを比較演算することにより、所望の属性の画像領域を検出するステップと
を有することを特徴とする画像処理方法。
前記周波数特性は、前記直交変換の係数要素を演算して求められるパラメータであり、
前記画像領域を検出するステップは、当該求められたパラメータと前記設定された閾値とを比較演算することにより、前記所望の属性の画像領域を検出することを特徴とする請求項８記載の画像処理方法。
前記直交変換は、離散コサイン変換またはアダマール変換のいずれか一方の変換であることを特徴とする請求項８記載の画像処理方法。
前記所望の属性の画像領域は、文字により構成される領域であることを特徴とする請求項８乃至１０のいずれかに記載の画像処理方法。
前記圧縮処理を判定するステップは、前記直交変換結果に基づいて周波数に対する振幅ヒストグラムを作成し、当該作成された振幅ヒストグラムに基づいて分布比率を算出し、該算出された分布比率を予め設定された閾値と比較することにより、当該入力された画像データが非可逆圧縮処理されたものであるか否かを判定することを特徴とする請求項８記載の画像処理方法。
前記圧縮処理を判定するステップは、前記入力された画像データの付加情報を用いて、当該入力された画像データが非可逆圧縮処理されたものであるか否かを判定することを特徴とする請求項８記載の画像処理方法。
前記圧縮処理を判定するステップでは、更に、前記入力された画像データに対する非可逆圧縮処理による劣化度合を判定し、
前記閾値を設定するステップでは、前記劣化度合の判定結果に応じた閾値を設定することを特徴とする請求項８記載の画像処理方法。