[go: up one dir, main page]

JP4418736B2 - 画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 - Google Patents

画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 Download PDF

Info

Publication number
JP4418736B2
JP4418736B2 JP2004331105A JP2004331105A JP4418736B2 JP 4418736 B2 JP4418736 B2 JP 4418736B2 JP 2004331105 A JP2004331105 A JP 2004331105A JP 2004331105 A JP2004331105 A JP 2004331105A JP 4418736 B2 JP4418736 B2 JP 4418736B2
Authority
JP
Japan
Prior art keywords
encoding
color component
value
encoded data
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004331105A
Other languages
English (en)
Other versions
JP2006140967A5 (ja
JP2006140967A (ja
Inventor
友希 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004331105A priority Critical patent/JP4418736B2/ja
Publication of JP2006140967A publication Critical patent/JP2006140967A/ja
Publication of JP2006140967A5 publication Critical patent/JP2006140967A5/ja
Application granted granted Critical
Publication of JP4418736B2 publication Critical patent/JP4418736B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は、画像データを符号化する技術に関するものである。
従来、画像処理装置を構成する一手法として、可逆符号化データの符号量を検出し、その可逆符号量が所定量以上の場合には、可逆符号化ではなく非可逆符号化に切り替えるという技術が知られている(特許文献1)。
また、ブロック内の色数がある閾値以内であれば可逆符号化方式を選択し、それ以外であれば非可逆符号化方式を選択する技術も知られている(特許文献2)。
特開平6−54208号公報 特開平8−167030号公報
可逆符号化は一般的に非可逆符号化よりも符号量が大きくなるとされていた。よって符号量を所定以内に収めようとするいわゆる符号量制御技術においては、例えば可逆符号化データのデータ量が大きい場合に可逆符号化の代わりに非可逆符号化を用いるという一方通行の符号化切り替えが一般的である。
ところが、近年知られるJPEG−LS等の可逆符号化は、符号化対象の画像の種類によっては非可逆符号化よりも圧縮率が良いことで注目されている。
よって、従来の様な上記一方通行の符号化切り替えをするのではなく、例えば、最初から可逆符号化データと非可逆符号化データのお互いの符号量を比較して、符号化データ量が少ない方を選択する方式も有効と考えられる。
本発明は上記状況に鑑みてなされたものであり、可逆符号化と非可逆符号化を画素ブロック単位に適宜切り換えて、再現した際の画質の劣化を抑制しつつ、画像全体を高い圧縮率で符号化する技術を提供しようとするものである。
この課題を解決するため、例えば本発明の画像符号化装置は以下の構成を備える。すなわち、
画像データを符号化する画像符号化装置であって、
画像データを複数画素からなるブロックに分割するブロック分割手段と、
前記ブロック分割手段で得られたブロック内の各色成分の取り得る成分値の範囲で、幾つの成分値が存在したか示す出現数を計数する計数手段と、
該計数手段で得られた各色成分の出現数と所定の閾値とを比較することで、重み付け係数を決定する重み付け係数決定手段と、
前記ブロック内の実在する各画素の色成分値に、連続する値のインデックス値の1つを割り当てることで、前記実在する各画素値の前記色成分値と一対一の関係を有するインデックステーブルを、前記色成分毎に生成するインデックステーブル生成手段と、
前記ブロック内に実在する各画素の色成分値を、該当する色成分の前記インデックステーブルを参照してインデックス値に変換するインデックス変換手段と、
前記計数手段で得られた着目色成分の出現数が予め設定された閾値より小さい場合は、前記インデックス変換手段で得られた前記着目色成分のインデックス値を符号化対象データとして選択出力し、前記着目色成分の出現数が予め設定された閾値以上の場合には着目色成分値を前記符号化対象データとして選択出力することを、全色成分について実行する第1の選択手段と、
該第1の選択手段で選択出力された前記符号化対象データを可逆符号化し、前記ブロックの可逆符号化データを生成する可逆符号化手段と、
前記ブロック分割手段で得られたブロックを単位に非可逆符号化し、非可逆符号化データを生成する非可逆符号化手段と、
前記可逆符号化手段で得られた可逆符号化データ量と、前記非可逆符号化手段で得られた非可逆符号化データ量とを、前記重み付け係数決定手段で得られた重み付け係数を用いて比較する比較手段と、
該比較手段による重み付け比較結果に基づき、符号化データ量の少ない符号化データを選択し出力する第2の選択手段とを備える。
本発明によれば、可逆符号化と非可逆符号化を画素ブロック単位に適宜切り換えて、再現した際の画質の劣化を抑制しつつ、画像全体を高い圧縮率で符号化することが可能になる。
以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
[第1の実施形態]
図1は本実施形態に係る画像処理装置のブロック構成図である。
図1に示すように、本実施形態に係る画像処理装置は、ストライプバッファ101、ブロック分割部102、タイルバッファ103、有効レベル数カウント部104、インデックステーブル用メモリ105、インデックス変換部106、セレクタ107、タイルデータ可逆符号化部108、可逆符号列形成部109、インデックステーブル生成部113、タイルデータ非可逆符号化部114、セレクタ115、符号列形成部116とを備える。また、符号110、111、112はバス信号線を示している。
本実施形態に係る画像処理装置の符号化対象とする画像データは、RGBカラー画像データであり、各コンポーネント(色)は8ビットで、それぞれ0〜255の範囲の輝度値を表現した画素データにより構成されるものとする。符号化対象の画像データの並びは点順次、即ち、ラスタースキャン順に各画素を並べ、その各画素はR,G,Bの順番でデータを並べて構成されるものとする。信号線110より入力される符号化対象の画像データは水平方向W画素、垂直方向H画素により構成されるものとする。
以下、図1を参照して、本実施形態に係る画像処理装置が行う画像符号化処理について説明する。
符号化対象画像データは信号線110から、ラスタースキャン順に入力される。
ストライプバッファ101は画像データを所定のライン数(Th)分格納する領域を持ち、信号線110から入力される画像データを順次格納していく。
以降、符号化対象画像データをThラインの幅で分割した部分的な画像データをストライプデータもしくは単にストライプと呼ぶ。ストライプバッファ101に必要とされる容量、即ち1ストライプのデータ量はW×Th×3(RGB分)バイトである。説明の便宜上、垂直方向画素数HはThの整数倍であるとし、画像の末尾で不完全なストライプが発生しないものとする。
ストライプバッファ101に1ストライプの画像データ、即ち、Thライン分の画像データが格納されるとブロック分割部102はストライプバッファ101に格納されるThライン分の画像データを水平方向Tw画素、垂直方向Th画素で構成される矩形ブロックに分割して、ブロック単位に読み出してタイルバッファ103へと格納する。説明の便宜上、画像の水平方向に並ぶ画素数WはTwの整数倍であるとし、矩形ブロックに分割した場合に不完全なブロックが発生しないものとする。この水平方向Tw画素、垂直方向Th画素で構成される矩形ブロックを以降ではタイルデータもしくは単にタイルと呼ぶ。
タイルバッファ103は、1タイル分の画素データを格納する領域を持ち、ブロック分割部102から出力されるタイルデータを順次格納していく。よってタイルバッファ103に必要とされる最低容量はTw×Th×3(RGB分)バイトである。タイルバッファ103に格納される1タイル分の画素データの水平方向画素位置x、垂直方向画素位置yにある画素のコンポーネントcの輝度値をP(x、y、c)と定義する。xは0からTw−1まで、yは0からTh−1まで、cはR,G,Bのいずれかである。
有効レベル数カウント部104は、タイルバッファ103に格納される1タイルの画素データについて、コンポーネント毎に、そこで使用されている輝度レベル数(言い換えると、何種類の輝度レベルが使われているか)をカウントする。
以降、タイル内にて使用されている輝度レベルを有効レベルと呼び、その個数を有効レベル数と呼び、R、G、Bの各コンポーネントの有効レベル数をそれぞれNLV(R)、NLV(G)、NLV(B)として表す。
有効レベル数カウント部104はその内部に図5に示すようなフラグの配列F(c,i)を保持する。cはコンポーネントを表し、R,G,Bのいずれかである。iは輝度値を表し、0〜255のいずれかの値である。フラグF(c,i)=0は着目するタイルのコンポーネントcにおいて輝度値iが出現しないことを意味し、フラグF(c、i)=1はタイルのコンポーネントcにおいて輝度値iが出現することを意味する。
図6は有効レベル数カウント部104の処理の流れを示すフローチャートである。以下、図6に示したフローチャートを参照して、有効レベル数カウント部104の行う処理について説明する。
まず、有効レベル数カウント部104の内部に保持するフラグ配列F(c,i)を全て0に初期化する(ステップS601)。
次に、タイル内垂直方向画素位置を示す変数yを0に設定する(ステップS602)。
同様にタイル内水平方向画素位置を示す変数xを0に設定する(ステップS603)。
タイルバッファ103に格納されるP(x,y,R)、P(x,y,G)、P(x,y,B)を参照し、フラグ配列F(R,P(x,y,R))、F(G,P(x,y,G))、F(B,P(x,y,B))に1を設定する(ステップS604)。
例えば、タイル内の位置x、yのR、G、Bの値がそれぞれ10、20、30である場合、
F(R、10)←1
F(G、20)←1
F(B、30)←1
とし、R成分の有効レベル“10”が存在したことを示す情報をセットする。G、B成分についても同様である。
次に、タイル内垂直方向画素位置を示す変数xに1を加算する(ステップS605)。そして、変数xとタイルの水平方向画素数Twを比較し、x<Twの場合(YES)にはステップS604に処理を移して右隣の画素について処理を行い、そうでない場合(NO)にはステップS607へと処理を移す。
ステップS607ではタイル内垂直方向画素位置を示す変数yに1を加算する(ステップS607)。
変数yとタイルの垂直方向画素数Thを比較し、y<Thの場合(YES)にはステップS603に処理を戻し、上記処理を繰り返す。
以上の処理を、タイルの全画素について処理すると、そのタイル内に出現した各色成分の有効レベルが判明する。したがって、ステップS609では、各色成分毎の有効レベル数NLV(R)、NLV(G)、NLV(B)は次のようにして求めることができる。
NLV(R)=ΣF(R,i)
NLV(G)=ΣF(G,i)
NLV(B)=ΣF(B,i)
ここで『Σ』はi=0〜255までの累積加算を示すものである。
以上の処理により各コンポーネントの有効レベル数NLV(c)(cはR、G、Bのいずれか)を生成し、出力する。
インデックステーブル用メモリ105には図7に示すようなインデックス変換テーブルIDX(c、i)を保持する。
ここでも、cはコンポーネントを表し、R,G,Bのいずれかであり、iは輝度値を表し、0〜255のいずれかの値である。このインデックス変換テーブルIDX(c、i)は後述するインデックス変換部106において輝度値をインデックス値に変換する際に参照される。
インデックステーブル生成部113は有効レベル数カウント部104に保持されているフラグ配列F(c,i)を参照して、インデックステーブル用メモリ105にインデックス変換テーブルIDX(c、i)を生成する。同時に符号列に付加情報として含めて伝送するための変換テーブル情報を可逆符号列形成部109へと出力する。
図8はインデックステーブル生成部113の処理の流れを示すフローチャートである。この処理は、各コンポーネント毎の、出現した有効レベル(F(c,i)=1となっている輝度)に0、1、2とインデックス番号を割り当てるものである。
以下、図8に示したフローチャートを参照して、インデックステーブル生成部113の行う処理について説明する。インデックステーブル生成部113によるインデックステーブル生成の処理はコンポーネント毎に行われるが、各コンポーネント毎の処理は同一であるので、ここではコンポーネントをcとして処理を説明する。
まず、インデックステーブル用メモリ105の内部に保持するインデックス変換テーブルIDX(c,i)を全て−1等のインデックスとしてあり得ない値で初期化する(ステップS801)。
次に、輝度値を示す変数iに0を初期設定し(ステップS802)、インデックス値を表す変数idx(c)を0に初期化する(ステップS803)。
次いで、有効レベル数カウント部104に保持されているフラグ配列F(c,i)を参照し、着目する輝度値iについてF(c,i)=1かどうかを判断する(ステップS804)。
F(c,i)=1である場合(YES)はステップS805へ、そうでない場合(NO)はステップS807へと処理を移す。
F(c,i)=1である場合、コンポーネントcの輝度値iが注目タイル内に存在したことを示すことを意味するので、ステップS805にて、IDX(c,i)にidx(c)を設定するとともに、idx(c)を可逆符号列形成部109へ出力する(ステップS805)。
続いてidx(c)に1を加えて値を更新する(ステップS806)。
ステップS807では輝度値を示す変数iに1を加えて更新し(ステップS807)、変数iと256と比較し、i<256である場合(YES)にはステップS804に処理を戻して次の輝度値について処理を継続し、それ以外の場合(NO)にはステップS809へと処理を移す。
ステップS809では1つのコンポーネントについての付加情報の終了コードとして値−1を可逆符号列形成部109へと出力する。
以上の処理をR,G,B各コンポーネントについて順番に行い、インデックステーブル用メモリ105内部にインデックステーブル用メモリを生成する。
着目するタイルについて、有効レベル数カウント部104による有効レベル数カウント処理と、インデックステーブル生成部113によるインデックステーブル生成処理が終了すると、インデックス変換部106、セレクタ107、タイルデータ予測符号化部108により、タイルバッファ103に格納されるタイルデータの符号化処理を開始する。
本実施形態の画像符号化装置では、タイルの符号化データをコンポーネント順に読み出して符号化する。即ち、まず、タイルのRコンポーネントを先ず符号化し、続いてGコンポーネント、Bコンポーネントの順に符号化していく。各コンポーネントについてはタイル内をラスタースキャン順にデータを読み出して符号化処理を行う。各コンポーネントの符号化処理は共通であるので、以下、コンポーネントをcとして符号化処理を説明する。
インデックス変換部106はインデックステーブル用メモリ105に格納されるインデックス変換テーブルIDX(c,i)を参照して、タイルバッファ103からコンポーネント順、ラスタースキャン順に読み出される輝度値P(x,y,c)をインデックス値IDX(c、P(x、y、c))に置き換えて出力する。
セレクタ107はタイルバッファ103から順次読み出される画素値P(x,y,c)とインデックス変換部106から出力されるインデックス値IDX(c、P(x,y,c))を受け取り、選択して出力する。セレクタ内部には所定の閾値ML(タイルサイズに依存して決定されることが望ましい)を保持しておき、有効レベル数カウント部104から出力される有効レベルNLV(c)と閾値MLを比較し、NLV(c)<MLである場合にはインデックス変換された値、即ちインデックス変換部106からの入力値を選択して出力し、NLV(c)≧MLである場合にはインデックス変換されていない値P(x,y,c)を選択して出力する。
タイルデータ可逆符号化部108は、信号線111から入力される画素値、またはインデックス値を可逆符号化して符号列を信号線112を介して可逆符号列形成部109へと出力する。
タイルデータ可逆符号化部108の内部は可逆符号化方式であれば適用可能であり、例えば、連続階調静止画像の可逆及び準可逆圧縮の国際標準として勧告されるJPEG−LS(ISO/IEC14495−1および2)などを適用することができる。ここでは、図2に示すブロック構成図で示される構成になっているものとする。
同図に於いて201はバッファ、202は予測器、203は減算器、204はメモリ、205はハフマン符号化器である。図2は、画像データを予測誤差に変換する系列変換の処理に周辺画素を用いた予測変換を用い、符号化処理にはハフマン符号化を用いる画像圧縮方式の例である。
同図において、実際の符号化が行われる前に、予め幾つかの画像を示す画像データを系列変換して得られた予測誤差の頻度分布を調べ、これに応じてハフマンテーブルを作成し、メモリ204に格納される。
予測誤差の頻度分布の一般的性質として予測誤差0を中心として出現頻度が高く、予測誤差の絶対値が大きくなるにつれて出現頻度が下がっていく傾向にあるため、メモリ204に格納されるハフマン符号では予測誤差0近辺に短い符号語が割り当てられ、予測誤差の絶対値が大きい部分には長い符号語が割り当てられる。
最初に信号線111からタイルデータが順に入力される。バッファ201は信号線111から入力されるタイルデータを2ライン分格納する。予測器202はバッファ201から符号化対象画素の直前の画素aと,1ライン前の同じ水平位置の画素bのタイルデータ(図3参照)を取り出し、p=(a+b)/2の演算を行う事により予測値pを生成する。
減算器203は符号化対象画素のタイルデータxと予測値pとの差分値eとして出力する。ハフマン符号器205は、予めメモリ204に格納されるハフマンテーブルを参照して、差分値eに対応する符号化データを信号線112から出力する。
メモリ204には予め幾つかのサンプル画像を予測符号化した際の予測誤差の特性に基づいて作成されたハフマンテーブルを格納しておく。図4はメモリ204に格納されるハフマンテーブルの一例である。
可逆符号列形成部109は、インデックステーブル生成部113から出力される付加情報と、タイルデータ予測符号化部108から出力される符号化データを結合させて、予測符号化方式の出力となる符号列を形成して出力する。
図10(a)、(b)は1つのタイルの可逆符号列のデータフォーマットを示す図である。また、同図(c)はタイルデータ非可逆符号化部114により出力される非可逆符号列のデータフォーマット示している。
各データの先頭の1バイトの最上位ビットMSB(=ビット7)は、可逆、非可逆を区別するデータを格納する。実施形態の場合、MSBが“0”を可逆符号化を示す情報にアサインし、“1”の場合には非可逆符号化を示す情報にアサインした。また、下位3ビットのビット2、1、0は、コンポーネントR,G,Bに対応し、それぞれ閾値ML(セレクタ107の保持する閾値に同じ)以上か以下かを表す情報を割り当てた。
つまり、ビット2にはNLV(R)<MLであるかどうかを表し、NLV(R)<MLである場合には“1”、それ以外の場合には“0”を設定する。ビット1にはNLV(G)<MLであるかどうかを表し、NLV(G)<MLである場合には“1”、それ以外の場合には“0”を設定する。ビット0にはNLV(B)<MLであるかどうかを表し、NLV(B)<MLである場合には“1”、それ以外の場合には“0”を設定する。また、ビット6からビット3については常に0を設定する。
NLV(R)、NLV(G)、NLV(B)のいずれかが所定の閾値ML以下である場合、即ち、先頭バイトのMSBが“0”で、下位7ビットの値が0でない場合にはタイルの符号列の先頭バイトに続き、変換テーブル情報が付随する。
インデックステーブル生成部113から変換テーブル情報が出力されるが、有効レベル数カウント部104から出力される有効レベル数NLV(c)を所定の閾値MLと比較して、NLV(c)<MLであるコンポーネントについてのみ変換テーブル情報を符号列に付加する。
例えば、或るタイルについてインデックステーブル生成部から出力される変換テーブル情報が、
0、1,2,3,4,…,254、255,−1,0,128,255,−1,0,64,128,192,255
であるとき、NLV(R)=255、NLV(G)=3、NLV(B)=5となる。
ここで、閾値MLを“32”と仮定する。この場合、コンポーネントRの有効レベル数「255」は閾値“32”より大きいので、注目タイルの符号化データ列の先頭1バイトのビット2は“0”となる。また、コンポーネントG、Bそれぞれの有効レベル数は閾値“32”未満であるので、符号化データ列の先頭1バイトのビット1、0は共に“1”となる。
注目タイルは、可逆符号化であるのでMSBは“0”、ビット3乃至6も“0”としているわけであるから、上記の場合、先頭の1バイトは“3”という値になる。
また、符号化データ列中の「変換テーブル情報」を生成する際、−1をコンポーネントの変換テーブル情報の区切りとして識別し、コンポーネントGとコンポーネントBについての変換テーブル情報を生成する。
上述の例では「変換テーブル情報」は、次のようになる。
0,128,255,0,0,64,128,192,255
変換テーブル情報の区切りを表す−1は0に置き換えられ、最後の0は削除される。復号する際には、先頭の1バイトのMSBが“0”であり、下位3ビットを調べれば、どの色成分についての変換テーブルが存在するかが判明するので、変換テーブル情報を左から右に順番に見て、隣の値よりも小さくなるか等しい部分は区切り情報であると判断してインデックス値から輝度値に変換する情報を取得すれば良いことになる。
タイル毎に独立に符号化を行い、必要な変換テーブル情報を各タイルの符号化データに含むことにより、復号時にはタイルデータを独立に復号することが可能となる。
図10の出力符号列の構成には示していないが、符号化データ中に所定の値が発生しないように工夫を加えて特殊なマーカを設定し、各タイルデータの先頭、または末尾にマーカを置く、あるいは、各タイルの符号列の長さを別途管理することでタイル単位のランダムアクセスを可能とすることができる。
タイルデータ可逆符号化部108で可逆符号化を行うと同時に、タイルデータ非可逆符号化部114で、ブロックに分割されたデータの画素値を受け取り、非可逆符号化を行う。非可逆符号化には、多値自然画像を対象とした非可逆圧縮の国際標準として勧告されたJPEG(ITUT−T.81|ISO/IEC IS10918)などを適用することができる。JPEGについての詳細は規格書などあるためここでは説明は省略するが、図10(c)に示すように、先頭1バイトのMSBを“1”にした符号化列を生成する。これは、該当するタイルが可逆、非可逆符号化のいずれで符号化されているかを識別するためである。
セレクタ115は、可逆符号列形成部109から出力される可逆符号化データと、非可逆符号化部114から出力される非可逆符号化データを入力し、そのいずれか一方を選択し出力する。この際の選択条件は次の通りである。
CLK≦CLH+α の関係を満たすとき、可逆符号化データを選択出力する。
CLK>CLH+α の関係を満たすとき、非可逆符号化データを選択出力する。
ここで、CLHは非可逆符号化データの符号量(符号長)を示し、CLKは可逆符号化データの符号量(符号長)を示し、αは重み付け係数である。
ここで、全コンポーネントの有効レベル数が閾値ML未満である場合、すなわち、
NLV(R)<ML
NLV(G)<ML
NLV(B)<ML
である場合には、可逆符号化データの方が選択されやすいようにするため、α=正の定数で、例えば“100”とする。
一方、各コンポーネントの有効レベル数の1つでも閾値ML以上の場合には、α=0とする。
例えば、あるタイルの符号化を行った際の非可逆符号化データ量CLH=750(バイト)、可逆符号化データ量CLK=800(バイト)であるものとする。そして、そのタイルの全コンポーネントの有効レベル数NLV(c)<閾値ML(cは、R、G、B)を満足する場合には、重み付け係数αは“100”になるので、
800<{750+100}
となり、可逆符号化データが選択され出力されることになる。
なお、本発明は、タイル単位での有効レベル数に応じて符号量比較の重み付けをする方法に限らず、例えば、NLV<MLであるコンポーネントの数に応じて、符号量比較の際の重み付けを行う様にしても良い。
次に、実施形態における符号列形成部116を説明する。符号列形成部116は、セレクタ115から出力されるタイルごとの符号化データを結合させて受け取り、入力画像全体に対応する符号列を形成して出力する。そのため、符号化データの先頭には、図9に示すように、画像を復号するために必要となる情報、例えば、画像の水平方向画素数、垂直方向画素数(タイルサイズは固定とするので、タイル数を示す情報でもある)、コンポーネント数、各コンポーネントのビット数などの付加情報がヘッダとして付けられる。
以上説明したように本実施形態によれば、画像データを符号化する際に、その画像データを所定サイズのブロック(実施形態ではタイル)に分割し、基本的には非可逆符号化データ量と可逆符号化データ量とを重み付け比較して、小さい方を選択して画像全体の符号化データを生成するので、高い圧縮率が期待できる。
しかも、2つの符号化データの一方を選択する際の重み付け比較の際には、全色成分の有効レベル数、すなわち、R、G、Bのそれぞれの色成分で実在する輝度値の種類数が所定閾値(実施形態では閾値ML)未満である場合、可逆符号化データが選択され易く作用する。このような状況は、一般には、文字・線画領域、或いは下地色や単調な色の画像領域に相当するものである。したがって、特に、可逆であるが故に、文字や線画についてはそのエッジが明瞭な状態で符号化されることになり、高い画質が期待できる。
特に、可逆符号化の場合、実施形態では、入力された各色成分値をそのまま利用した可逆符号化と、インデックス値による可逆符号化の2つが存在することにより、文字・線画領域では、そのほとんどがインデックス値に基づく符号化が採用されることになり、更に高い圧縮率が期待できる。
また、有効レベル数が閾値MLを超える状況とは、そのブロックには多数の色が存在することを意味し、一般に自然画に多く見られる状況である。したがって、このような状況では、JPEG等の非可逆符号化データを選択しても、画質的に問題となることはないであろうし、高い圧縮率が期待できる。
<変形例の説明>
上記実施形態では図1の構成に基づく説明であったが、パーソナルコンピュータ等の汎用の情報処理装置(以下、PC)上で実行するコンピュータプログラムでもっても実現する例を以下に説明する。
図11はPCのブロック構成図である。図示において、1401は装置全体を制御するCPUであり、1402はメインメモリとなるRAMである。1403はBIOSやブートプログラムを格納しているROMである。1404はキーボード、1405はマウス(登録商標)等のポインティングデバイス(PD)である。1406はCRTや液晶等の表示装置である。1407はハードディスク装置等の外部記憶装置であり、ここにOSをはじめ、画像圧縮に関するプログラムが格納されている。また、各種データファイルもここに格納される。1408はフロッピー(登録商標)ディスクドライブ、CD−ROMドライブ等の記憶媒体ドライブであり、1409はスキャナ装置等の外部装置と接続するためのインタフェースである。そして、1410は上記構成を電気的に接続するためのバスである。
上記構成において、本装置の電源をONにすると、CPU1401はROM1403に格納されたOSをRAM1402にロードし、起動することになる。OS起動後、本変形例における画像符号化アプリケーションプログラムをOSを介して外部記憶装置1407からRAM1402にロードし、実行する。
ここでは説明を簡単なものとするため、インタフェース1409にイメージスキャナが接続されていて、原稿を読取り、その画像を符号化し、外部記憶装置1407にファイルとして格納する例を説明する。説明を簡単なものとするため、入力画像は上記の実施形態と同じ、R、G、B各8ビットで表わされているものとする。
図12、図13は本変形例における符号化処理を示すフローチャートである。
ステップS1201では、原稿画像を読取り、RAM1402に確保されたバッファーに1ストライプ分の画像データを格納する。
そして、ステップS1202にて、1タイル分の画像データをバッファより読み出し、ステップS1203にてJPEG符号化等の非可逆符号化を行う。この結果、1タイル分の非可逆符号化データ量をCLHとする。
次いで、可逆符号化を行うが、前段階で、ステップS1204にて、読出した1タイル中のR、G、Bの有効レベル数NLV(R)、NLV(G)、NLV(B)を算出する。この処理は、図6に示すフローチャートにしたがえば良いであろう。
そして、ステップS1205にて、R成分の有効レベル数NLV(R)と閾値MLとを比較し、「NLV(R)≧ML」の関係を満たす場合には、ステップS1206に進んで、入力したタイルのR成分値をそのまま利用して可逆符号化を行う。
また、「NLV(R)<ML」の関係にあると判断した場合には、ステップS1207にてインデックス化し、ステップS1208にてインデックス値を可逆符号化する。
上記はR成分についての可逆符号化処理であるが、上記と同様の処理を、G、B成分についても行う。これを示すのがステップS1209、S1210である。それぞれの処理内容は、NLV(G)、NLV(B)と置換えれば良いので説明するまでもないであろう。
1つのタイルに対するR、G、Bの全コンポーネントの可逆符号化処理が完了すると、ステップS1211にて、全有効レベル数NLV(R)、NLV(G)、NLV(B)が閾値ML未満であるか否かを判断する。もしこの条件を満たすと判断した場合には、ステップS1212にて重み付け係数αに正の所定値(実施形態では仮に“100”)を設定する。また、1つの色成分の有効レベル数が閾値ML以上になった場合には、重み付け係数αには“0”を設定する。
こうして、重み付け係数αの設定処理を終えると、処理はステップS1214に進み、「CLK≦CLH+α」を満足するか否かを判定する。
「CLK≦CLH+α」を満たすと判断した場合には、先のステップS1205乃至S1210で得られた可逆符号化データを、注目タイルの符号化データとしてRAM1402に確保された出力バッファに出力する(ステップS1215)。この際、データフォーマットは図10(a)もしくは図10(b)の形式である。
また、「CLK>CLH+α」と判断した場合には、先のステップS1203の処理で得られた非可逆符号化データを、注目タイルの符号化データとして出力バッファに出力する(ステップS1216)。
ステップS1217は、注目タイルが注目ストライプの最後のタイルであるか否かを判断する。否の場合には、ステップS1202以降の処理を繰り返す。
また、注目タイルが注目ストライプの最後のタイルであると判断した場合には、ステップS1218に進み、注目ストライプが画像データの最終ストライプであるか否かを判断し、否の場合にはステップS1201以降の処理を繰り返す。
最終ストライプの最終タイルであった場合、画像全体の符号化が完了したことを意味するので、ステップS1219に進み、ヘッダ情報を付加し、出力バッファに格納された符号化データをファイルとして外部記憶装置1407に書き込み保存し、本処理を終了することになる。
以上説明したように、先に説明した第1の実施形態と同様の処理を、PC等の汎用の情報処理装置上で実行するアプリケーションプログラムとしても実現できることになり、同様の作用効果を奏することが可能になる。
なお、復号処理であるが、復号処理は基本的に符号化処理とは逆の手順にしたがって行えばよいのは、自明のことであろうから、ここでの説明については省略する。
また、実施形態では、符号化対象の画像データはR、G、B成分で表現され、各8ビットであるものとして説明したが、これに限られるものではなく、他の色空間、他のビット数でも構わない。これは以下に説明する例でも同様である。
[第2の実施形態]
上記第1の実施形態、並びにその変形例では、着目するタイルの有効レベル数に応じて符号化処理(または符号化データ)の選択の際に加算する重み付け係数を求めるものであった。
しかし、上記の処理によって本願発明が限定されるものではない。例えば、2つの符号化データの一方を選択され易いようにするためには、一方に重み付け係数を加算すること以外に、減算する手法を採用しても構わないし、乗算、除算を採用しても構わない。
例えば、乗算を利用するのであれば、ステップS1212にてαに“1.1”を設定し、ステップS1213ではαに“1.0”を設定する。そして、ステップS1214では、「CLK≦CLH×α」を満たすか否かを判断すれば良い。
[第3の実施形態]
第3の実施形態では、属性情報をも利用する例を説明する。
図14は第3の実施形態における画像符号化装置のブロック構成図である。図1に示した第1の実施形態の画像処理装置と同じ機能ブロックについては同じ番号を付し、その説明については省略する。
図1と異なる点は、属性情報検出部1501、タイル属性判定部1502を設け、セレクタ115はタイル属性判定部1502の判定結果をも加味して、符号化データの選択出力する点にある。
属性情報検出部1501は、タイルバッファ103に格納される1タイルの画像データから属性情報を取得する。取得する属性情報は画素ごとに、文字であるなら1、文字以外であるなら0のフラグを持つようなものであり、その情報を出力する。文字か文字以外かの判定は、タイルのRGBデータをLab色空間に変換し、隣接する画素の輝度成分Lの差が所定の閾値以上あるか否かを判断することで対処すればよい。すなわち、一般に、文字線画は、そのエッジで濃度(或いは輝度)が急峻に変化することを利用する。
タイル属性判定部1502では、属性情報検出部1501から出力された属性情報を受け取り、画素ごとの属性情報からタイル中に文字属性を持った画素がどれくらいの割合で存在しているかを判定し出力する。ここで出力される文字属性画素の割合をMZとする。
セレクタ115は、タイルデータ可逆符号化部108とタイルデータ非可逆符号化部114から出力される符号化データと、タイル属性判定部1502から出力される文字属性画素の割合MZを受け取り、それらから符号化方式の選択を行い、選択された符号化方式の符号化結果を出力する。
このとき、文字であるかそうでないかを判定する閾値をMC、重み付けにより付加する符号量をNとし、NLV(c)>MLであり有効レベル数のみでは重み付けできないような場合においても、MZ>MCであれば非可逆符号化した符号量CLHにNだけ重み付けを行う。
例えば、非可逆符号化の符号量CLHが500バイト、可逆符号化の符号量CLKが590バイト、付加する符号量Nを100バイトとし、有効レベル数NLV(c)が33で、閾値MLが32、またMCであるとすると、第1の実施形態における重み付けでは重みは付加されず非可逆符号化が選択されてしまうが、本実施形態では画素の情報から、タイル中の文字属性の割合MZが90%以上であれば、CLHに100バイト符号量を加えることになる。そのため、単純に符号量比較をした場合にはCLH<CLKとなり非可逆符号化方式が選択されてしまうものが、インデックス化された値を符号化することによる効果と属性情報による重み付けを行うことで可逆符号化方式が選択され易くなり、文字線画領域については画質劣化を更に抑制することが可能になる。
以上の動作により、アンチエリアスありの文字などの、非可逆符号化の符号量CLHは小さく、可逆符号化の符号量CLKが大きくなるという特徴をもつ画像などにおいて、符号量比較のみでは符号化方式の正確な切換えが困難であったものに対して、符号化方式選択精度が向上し、劣化の見えやすい文字部分で可逆符号化が選択されるため、視覚的に画質劣化の無い画像を実現可能となる。
なお、重み付けの方法としては、NLV≦MLかつMZ>MCの場合には非可逆符号化した符号量CLHにNだけ重み付けを行う方法や、NLV<MLだが、MZ<MCの場合可逆符号化した符号量CLKにNだけ重み付けを行う方法など、有効レベル数NLVと属性情報MZを用いて重み付けを調整していれば、どのような形式でもよい。
また、上記第3の実施形態については、第1の実施形態と同様、コンピュータプログラムによっても実現できるのは、先の変形例で説明した如く、明らかである。
また、通常、コンピュータプログラムは、それを格納したCD−ROM等のコンピュータ可読記憶媒体を、コンピュータにセットし、システムにコピーもしくはインストールすることで実行可能になるわけであるから、当然、このようなコンピュータ可読記憶媒体も本願発明の範疇にあることも明らかである。
第1の実施形態に係る画像処理装置のブロック構成図である。 可逆符号化部の構成を示す図である。 可逆符号化部における予測値を求める際の注目画素と近傍画素との関係を示す図である。 メモリ204に格納されるハフマンテーブルの例を示す図である。 フラグ配列F(c,i)のデータフォーマットを示す図である。 有効レベル数カウント部104の処理の流れを示すフローチャートである。 インデックス変換テーブルIDX(c、i )の内容の一例を示す図である。 インデックステーブル生成部113の処理を示すフローチャートである。 本画像処理装置の出力符号列のデータフォーマットを示す図である。 実施形態における1つのタイルの符号列のデータフォーマットを示す図である。 第1の実施形態の変形例の装置のブロック構成図である。 第1の実施形態の変形例における画像符号化処理手順を示すフローチャートである。 第1の実施形態の変形例における画像符号化処理手順を示すフローチャートである。 第3の実施形態における画像処理装置のブロック構成図である。

Claims (6)

  1. 画像データを符号化する画像符号化装置であって、
    画像データを複数画素からなるブロックに分割するブロック分割手段と、
    前記ブロック分割手段で得られたブロック内の各色成分の取り得る成分値の範囲で、幾つの成分値が存在したか示す出現数を計数する計数手段と、
    該計数手段で得られた各色成分の出現数と所定の閾値とを比較することで、重み付け係数を決定する重み付け係数決定手段と、
    前記ブロック内の実在する各画素の色成分値に、連続する値のインデックス値の1つを割り当てることで、前記実在する各画素値の前記色成分値と一対一の関係を有するインデックステーブルを、前記色成分毎に生成するインデックステーブル生成手段と、
    前記ブロック内に実在する各画素の色成分値を、該当する色成分の前記インデックステーブルを参照してインデックス値に変換するインデックス変換手段と、
    前記計数手段で得られた着目色成分の出現数が予め設定された閾値より小さい場合は、前記インデックス変換手段で得られた前記着目色成分のインデックス値を符号化対象データとして選択出力し、前記着目色成分の出現数が予め設定された閾値以上の場合には着目色成分値を前記符号化対象データとして選択出力することを、全色成分について実行する第1の選択手段と、
    該第1の選択手段で選択出力された前記符号化対象データを可逆符号化し、前記ブロックの可逆符号化データを生成する可逆符号化手段と、
    前記ブロック分割手段で得られたブロックを単位に非可逆符号化し、非可逆符号化データを生成する非可逆符号化手段と、
    前記可逆符号化手段で得られた可逆符号化データ量と、前記非可逆符号化手段で得られた非可逆符号化データ量とを、前記重み付け係数決定手段で得られた重み付け係数を用いて比較する比較手段と、
    該比較手段による重み付け比較結果に基づき、符号化データ量の少ない符号化データを選択し出力する第2の選択手段と
    を備えることを特徴とする画像符号化装置。
  2. 前記重み付け係数決定手段は、色成分C1、C2、C3それぞれの出現数をNLV(C1)、NLV(C2)、NLV(C3)とし、予め設定された値をMLとしたとき、
    条件1:NLV(C1)<ML & NLV(C2)<ML & NLV(C3)<ML
    を満たす場合、前記非可逆符号化データ量を相対的に増やすための重み付け係数値を生成することを特徴とする請求項1に記載の画像符号化装置。
  3. 更に、ブロック内の文字・線画の属性を有する画素を検出する検出手段と、
    文字・線画の属性を有する画素数を計数する第2の計数手段とを備え、
    前記重み付け係数決定手段は、前記条件1を満たさない場合、
    条件2:第2の計数手段で得られた画素数>所定の閾値
    を満足する場合、前記非可逆符号化データ量を相対的に増やすための重み付け係数値を生成することを特徴とする請求項に記載の画像符号化装置。
  4. 画像データを符号化する画像符号化方法であって、
    画像データを複数画素からなるブロックに分割するブロック分割工程と、
    前記ブロック分割工程で得られたブロック内の各色成分の取り得る成分値の範囲で、幾つの成分値が存在したか示す出現数を計数する計数工程と、
    該計数工程で得られた各色成分の出現数と所定の閾値とを比較することで、重み付け係数を決定する重み付け係数決定工程と、
    前記ブロック内の実在する各画素の色成分値に、連続する値のインデックス値の1つを割り当てることで、前記実在する各画素値の前記色成分値と一対一の関係を有するインデックステーブルを、前記色成分毎に生成するインデックステーブル生成工程と、
    前記ブロック内に実在する各画素の色成分値を、該当する色成分の前記インデックステーブルを参照してインデックス値に変換するインデックス変換工程と、
    前記計数工程で得られた着目色成分の出現数が予め設定された閾値より小さい場合は、前記インデックス変換工程で得られた前記着目色成分のインデックス値を符号化対象データとして選択出力し、前記着目色成分の出現数が予め設定された閾値以上の場合には着目色成分値を前記符号化対象データとして選択出力することを、全色成分について実行する第1の選択工程と、
    該第1の選択工程で選択出力された前記符号化対象データを可逆符号化し、前記ブロックの可逆符号化データを生成する可逆符号化工程と、
    前記ブロック分割工程で得られたブロックを単位に非可逆符号化し、非可逆符号化データを生成する非可逆符号化工程と、
    前記可逆符号化工程で得られた可逆符号化データ量と、前記非可逆符号化工程で得られた非可逆符号化データ量とを、前記重み付け係数決定工程で得られた重み付け係数を用いて比較する比較工程と、
    該比較工程による重み付け比較結果に基づき、符号化データ量の少ない符号化データを選択し出力する第2の選択工程と
    を備えることを特徴とする画像符号化方法。
  5. コンピュータが読み込み実行することで、前記コンピュータを、画像データを符号化する画像符号化装置として機能させるコンピュータプログラムであって、
    画像データを複数画素からなるブロックに分割するブロック分割手段と、
    前記ブロック分割手段で得られたブロック内の各色成分の取り得る成分値の範囲で、幾つの成分値が存在したか示す出現数を計数する計数手段と、
    該計数手段で得られた各色成分の出現数と所定の閾値とを比較することで、重み付け係数を決定する重み付け係数決定手段と、
    前記ブロック内の実在する各画素の色成分値に、連続する値のインデックス値の1つを割り当てることで、前記実在する各画素値の前記色成分値と一対一の関係を有するインデックステーブルを、前記色成分毎に生成するインデックステーブル生成手段と、
    前記ブロック内に実在する各画素の色成分値を、該当する色成分の前記インデックステーブルを参照してインデックス値に変換するインデックス変換手段と、
    前記計数手段で得られた着目色成分の出現数が予め設定された閾値より小さい場合は、前記インデックス変換手段で得られた前記着目色成分のインデックス値を符号化対象データとして選択出力し、前記着目色成分の出現数が予め設定された閾値以上の場合には着目色成分値を前記符号化対象データとして選択出力することを、全色成分について実行する第1の選択手段と、
    該第1の選択手段で選択出力された前記符号化対象データを可逆符号化し、前記ブロックの可逆符号化データを生成する可逆符号化手段と、
    前記ブロック分割手段で得られたブロックを単位に非可逆符号化し、非可逆符号化データを生成する非可逆符号化手段と、
    前記可逆符号化手段で得られた可逆符号化データ量と、前記非可逆符号化手段で得られた非可逆符号化データ量とを、前記重み付け係数決定手段で得られた重み付け係数を用いて比較する比較手段と、
    該比較手段による重み付け比較結果に基づき、符号化データ量の少ない符号化データを選択し出力する第2の選択手段
    として機能させることを特徴とするコンピュータプログラム。
  6. 請求項5に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
JP2004331105A 2004-11-15 2004-11-15 画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 Expired - Fee Related JP4418736B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004331105A JP4418736B2 (ja) 2004-11-15 2004-11-15 画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004331105A JP4418736B2 (ja) 2004-11-15 2004-11-15 画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Publications (3)

Publication Number Publication Date
JP2006140967A JP2006140967A (ja) 2006-06-01
JP2006140967A5 JP2006140967A5 (ja) 2007-12-27
JP4418736B2 true JP4418736B2 (ja) 2010-02-24

Family

ID=36621425

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004331105A Expired - Fee Related JP4418736B2 (ja) 2004-11-15 2004-11-15 画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Country Status (1)

Country Link
JP (1) JP4418736B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10506137B2 (en) 2018-02-08 2019-12-10 Seiko Epson Corporation Image coding device, image coding method, and image coding system

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110071231A (ko) * 2009-12-21 2011-06-29 엠텍비젼 주식회사 부호화 방법, 복호화 방법 및 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10506137B2 (en) 2018-02-08 2019-12-10 Seiko Epson Corporation Image coding device, image coding method, and image coding system

Also Published As

Publication number Publication date
JP2006140967A (ja) 2006-06-01

Similar Documents

Publication Publication Date Title
JP4418762B2 (ja) 画像符号化装置及び画像復号装置及びそれらの制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP4732203B2 (ja) 画像符号化装置及び復号装置及びそれらの制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP4979323B2 (ja) 画像処理装置及びその制御方法
US6243416B1 (en) Image coding and decoding methods, image coder, and image decoder
US7912300B2 (en) Image processing apparatus and control method therefor
US7689048B2 (en) Image encoding apparatus, method, and computer-readable storage medium for encoding a pixel value
US7650039B2 (en) Image encoding apparatus, image decoding apparatus, control method therefor, computer program, and computer-readable storage medium
AU2007249106B2 (en) A lossless compressor for image data values
JP4847398B2 (ja) 画像処理装置およびその方法
JP2000050268A (ja) 画像符号化装置
US8396308B2 (en) Image coding based on interpolation information
JP4418736B2 (ja) 画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
WO2021145105A1 (ja) データ圧縮装置、およびデータ圧縮方法
JP4084802B2 (ja) 画像を処理する装置
JP2006080793A (ja) 画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2008109478A (ja) 画像符号化装置及び方法及びプログラム及び記憶媒体
JP4324079B2 (ja) 画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2008042683A (ja) 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2008042681A (ja) 画像処理方法及び装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP4771541B2 (ja) 画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP4377351B2 (ja) データ圧縮装置およびデータ圧縮プログラム
JP3263218B2 (ja) 画情報データ圧縮再生装置
JP6572093B2 (ja) 画像符号化装置及びその制御方法
JP4377352B2 (ja) データ圧縮装置およびデータ圧縮プログラム
JP4860558B2 (ja) 符号化装置及び符号化方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071108

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090525

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091130

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121204

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131204

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees