[go: up one dir, main page]

JP2006295852A - 画像符号化装置,画像符号化方法,撮像装置およびプログラム - Google Patents

画像符号化装置,画像符号化方法,撮像装置およびプログラム Download PDF

Info

Publication number
JP2006295852A
JP2006295852A JP2005117577A JP2005117577A JP2006295852A JP 2006295852 A JP2006295852 A JP 2006295852A JP 2005117577 A JP2005117577 A JP 2005117577A JP 2005117577 A JP2005117577 A JP 2005117577A JP 2006295852 A JP2006295852 A JP 2006295852A
Authority
JP
Japan
Prior art keywords
information amount
image
scale
unit
target information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005117577A
Other languages
English (en)
Inventor
Takao Suzuki
隆夫 鈴木
Ichiro Tanji
一郎 丹治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005117577A priority Critical patent/JP2006295852A/ja
Publication of JP2006295852A publication Critical patent/JP2006295852A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 目標情報量を上回る符号化を回避し,発生情報量の上限を予測可能にする。
【解決手段】 可変ビットレート制御に基づき,画像の質に応じて無制限にビットレートを割り当てると,記憶媒体としての1枚のディスクに何時間分の動画像が記憶できるかが分からない。本発明は,その記憶容量の予測値に対して,実際の記憶容量を少なく押さえる方向に制御することによって,目標情報量を上回る符号化を回避し,ユーザは,発生情報量の上限を予測することが可能となる。
【選択図】 図9

Description

本発明は,可変ビットレート制御を行うことが可能な画像符号化装置,画像符号化方法,撮像装置およびプログラムに関する。
被写体を撮像して記憶媒体に記憶する撮像装置は,画像処理能力,例えばCPUやその他のデバイスの性能向上により高度かつ用途の広い撮像を行えるようになった。
その機能の一つとして,撮像した画像信号を圧縮して記憶する技術が知られている。かかる技術は,撮像部から得られたアナログの画像信号を単純にデジタル信号に変換した場合と比べて,発生する情報量を少なくすることができ,長時間の撮像が可能となる。
上記の画像信号の符号化に関する標準化技術としてMPEG(Motion Picture Expert Group)がある。このMPEGは,人の目の特性(視覚特性)を勘案し,最終的な画像に対して影響の少ない信号部分を間引くことによって,発生情報量を少なくしている。
また,撮像した画像を一定の質が維持されるように表現すると,撮像したフレーム毎に情報量を増減する必要が生じる。このように画像の質に応じてビットレートを変更する可変ビットレート制御は,固定ビットレート制御と比較して,一定の画質を維持しつつ,情報量を少なくすることができる。
上記の可変ビットレート制御に基づく,例えば,2パス符号化制御では,視覚特性に拘わらず,量子化スケールを固定して画質を一定に保っていた。しかし,かかる技術では,適切なビット割り当てが行われない。そこで,画像の質,例えば画質の劣化可能性の大小に応じて量子化スケールを変更し,適切な情報量の割り当てを行う技術(例えば,特許文献1)が生み出された。
しかし,かかる技術では,画質の劣化可能性の大小に基づいて単純に量子化スケールを変更している。従って,劣化が目立ちやすい画像において量子化スケールが限りなくゼロに近くなり,過剰なビットが割り当てられ,情報量が著しく大きくなるといった問題が生じていた。
特開平9−37242号公報
本発明は,従来の画像符号化方法が有する上記問題点に鑑みてなされたものであり,本発明の目的は,目標情報量を上回る符号化を回避し,発生情報量の上限を予測可能とすることで安定した画像の符号化が可能な,新規かつ改良された画像符号化装置,画像符号化方法,撮像装置およびプログラムを提供することである。
画像の質に応じて無制限にビットレートを割り当てると,記憶媒体としての1枚のディスクに何時間分の動画像が記憶できるかが分からない。本発明は,その記憶容量の予測値に対して,実際の記憶容量を少なく押さえる方向に制御することを特徴としている。従って,ディスクの記憶時間も延ばす方向に働くこととなる。
上記課題を解決するために,本発明のある観点によれば,画像の質に応じてビットレートを変更する可変ビットレート制御に基づいて,画像信号を符号化し,目標情報量に相当する情報量の符号化信号を生成する画像符号化装置であって:目標情報量を決定する情報量決定部と;1フレームの画像を複数のマクロブロックに分割し,該マクロブロック毎に離散コサイン(DCT)変換を行う離散コサイン変換部と;上記1フレームの発生情報量を上記目標情報量に合わせるため,既に量子化されている情報量と上記目標情報量とを用いて,マクロブロック毎の量子化スケールを決定するスケール決定部と;上記スケール決定部で決定された量子化スケールを制限するスケール制限部と;上記離散コサイン変換された信号を,上記スケール制限部で制限された量子化スケールで量子化する量子化部と;を備えることを特徴とする,画像符号化装置が提供される。
ここで,離散コサイン(DCT)変換は,離散フーリエ変換の一種で,例えば8×8ピクセルのデータの周波数分解を行う変換である。ここでは,人間の目の特性を勘案して,画像の高周波成分のデータを削っている。
本発明の特徴は,例えば,2パス符号化制御等における発生情報量の調整を行う際,発生情報量を目標情報量に近づけつつ,量子化スケールに制限を設けて発生情報量が目標情報量を上回らないところにある。その結果,発生情報量の上限を予測することができ,安定した画像の符号化が可能となる。
上記スケール制限部における量子化スケールの制限は,所定の数値による下限であるとしても良い。
例えば,量子化スケールの範囲が0〜N,下限が0〜Nの間のMの値をとるとき,0〜Mの量子化スケールは強制的にMに変更され,M〜Nの量子化スケールはそのままの数値が維持される。
上記量子化スケールは,下限としての上記数値から最大値まで,2次導関数が正または0のみの非線形曲線によって滑らかに制限されているとしても良い。
上述したように,本発明では,発生情報量を目標情報量に近づけつつ,量子化スケールに制限を設けて発生情報量が目標情報量を上回らないようにしている。量子化スケールが徐々に制限されることで,量子化スケールを下げられないことによる画質の劣化が目立たなくなり,違和感のない符号化を達成することができる。
上記量子化スケールは,下限としての上記数値から最大値まで,制限される値が比例するとしても良い。
例えば,量子化スケールの範囲が0〜N,下限がM,制限される前の量子化スケールをLとすると,制限後の量子化スケールは,(N―M)/N×L+Mで表される。量子化スケールが線形的に制限されることで,量子化スケールを下げられないことによる画質の劣化が目立たなくなり,違和感のない符号化を達成することができる。
上記情報量決定部は,上記動画像信号のフレーム毎に,該フレームのみに着目して目標情報量を決定するとしても良い。
従来,かかる画像の符号化においては,1フレームの発生情報量が前後のフレームや記憶可能な残りの情報量といった消費情報量の進捗に応じて決定されていた。この場合,残りの情報量に余裕があるとビットレートを高くすることができるが,余裕がないと必然的にビットレートを下げなくてはならない。このような状況下では,同じ画像を符号化してもその符号化した時間の隔たりによって発生情報量が相違する結果となる。
かかる1フレームの情報のみに着目して目標情報量を決定することで,前後の画像に影響されない安定した発生情報量を維持することができ,情報量の消費進捗による画質変動を防止できる。
上記目標情報量は上限が設けられるとしても良い。
従来,かかる画像の符号化,例えば,2パス符号化制御においては,劣化が目立ちやすい画像には高い目標情報量が割り当てられ,劣化が目立ち難い画像には低い情報量が割り当てられていた。かかる目標情報量に上限を設けることによって,劣化が目立ちやすい画像には上限以下の高い目標情報量が割り当てられ,劣化が目立ち難い画像には,さらに低い情報量が割り当てられるので,発生情報量は必然的に頭打ちになる。
こうして所望の目標情報量を上回る符号化を回避し,安定した発生情報量を維持することができる。従って,ユーザは,発生情報量の上限を予測することができ,安定した画像の符号化が可能となる。
また,上記画像符号化装置として機能するプログラムやそのプログラムを記憶した記憶媒体も提供される。
上記課題を解決するために,本発明の別の観点によれば,画像の質に応じてビットレートを変更する可変ビットレート制御に基づいて,画像信号を符号化し,目標情報量に相当する情報量の符号化信号を生成する画像符号化方法であって:目標情報量を決定する情報量決定ステップと;1フレームの画像を複数のマクロブロックに分割する画像分割ステップと;該分割されたマクロブロック毎に,離散コサイン変換を行う離散コサイン変換ステップと;上記1フレームの発生情報量を上記目標情報量に合わせるため,既に量子化されている情報量と上記目標情報量とを用いて,マクロブロック毎の量子化スケールを決定するスケール決定ステップと;上記スケール決定ステップで決定された量子化スケールを制限するスケール制限ステップと;上記離散コサイン変換された信号を,上記制限された量子化スケールで量子化する量子化ステップと;を含むことを特徴とする,画像符号化方法が提供される。
かかる構成により,目標情報量を上回る符号化を回避し,発生情報量の上限を予測可能とすることで安定した画像の符号化が可能となる。
上述した画像符号化装置において従属している構成は,当該画像符号化方法においても適用することが可能である。
上記課題を解決するために,本発明の別の観点によれば,画像の質に応じてビットレートを変更する可変ビットレート制御に基づいて,撮像した画像信号を符号化し,目標情報量に相当する情報量の符号化信号を生成する撮像装置であって:撮像によって画像を得る撮像部と;上記撮像された画像の目標情報量を決定する情報量決定部と;1フレームの画像を複数のマクロブロックに分割し,該マクロブロック毎に離散コサイン変換を行う離散コサイン変換部と;上記1フレームの発生情報量を上記目標情報量に合わせるため,既に量子化されている情報量と上記目標情報量とを用いて,マクロブロック毎の量子化スケールを決定するスケール決定部と;上記スケール決定部で決定された量子化スケールを制限するスケール制限部と;上記離散コサイン変換された信号を,上記スケール制限部で制限された量子化スケールで量子化する量子化部と;上記量子化された符号化信号を記憶媒体に記憶する信号記憶部と;を備えることを特徴とする,撮像装置が提供される。
このようにして上述した画像符号化装置の構成を,被写体を撮像して記憶媒体に記憶する撮像装置に適用することができる。従って上記画像符号化装置において従属している構成は,当該画像符号化方法においても適用することが可能である。
かかる画像符号化装置や撮像装置における各構成要素は,各々独立した複数の装置で構成することも可能である。
以上説明したように本発明によれば,例えば,2パス符号化制御等における発生情報量の調整を行う際,発生情報量を目標情報量に近づけつつ,量子化スケールに制限を設けて発生情報量が目標情報量を超えないようにすることができる。こうして所望の目標情報量を上回る符号化を回避し,その結果,ユーザは,発生情報量の上限を予測することが可能となる。
以下に添付図面を参照しながら,本発明の好適な実施の形態について詳細に説明する。なお,本明細書及び図面において,実質的に同一の機能構成を有する構成要素については,同一の符号を付することにより重複説明を省略する。
(第1の実施形態:撮像装置)
まず,本発明の画像符号化装置を適用することが可能な撮像装置について詳細に説明する。なお,以下では,本実施形態にかかる撮像装置として静止画像及び/又は動画像をカラー撮像可能なビデオカメラの例を挙げて説明するが,当該実施形態に限定されるものではない。
図1は,第1の実施形態における撮像装置100を概略的に示したブロック図である。かかる撮像装置100は,レンズ部110と,プリズム部112と,CCD部114と,A/Dコンバータ部116と,リニアマトリクス回路118と,イメージ強調部120と,加算器122と,ニー回路124と,ガンマ回路126と,クリップ回路128と,Yマトリクス回路130と,MPEGエンコーダ132と,バッファメモリ134と,フォーマッタ136と,ディスク部138と,MPEGデコーダ140と,再生表示部142とを含んで構成される。
上記レンズ部110は,被写体の光学像を撮像デバイスの感光面上に結像させる光学部品を含んで構成される。当該撮像装置100において,被写体からの光がレンズ部110を通して入射され,例えば光学ローパスフィルタ(LPF),赤外カットフィルタ及びカラーフィルタ(いずれも図示せず。)などを通じて,プリズム部112に出力される。また,マイクロコントローラ(図示せず)は,レンズ部110の絞りを制御して入射光量を調整する。
上記プリズム部112は,例えば三角柱のガラス等により形成され,レンズに入射された入射光を,波長毎の単色光に分解する。この単色光は他のプリズム部112を使ったとしても,さらに多くの光に分解することはできない。ここでは,特に,Red,Green,Blueといった光の3原色に分解される。かかるプリズム部112を通過した後,色信号毎にDCクランプ,ゲイン調整を行うとしても良い。
上記CCD部114は,レンズ部110によって結像された光学像を電気信号に変換するための撮像デバイスである。かかるCCD部114は,タイミングジェネレータ(図示せず。)により駆動され,光電変換された電気信号である画像信号を随時読み出す。このタイミングジェネレータのシャッタースピードは,上述したマイクロコントローラによって制御される。また,本実施形態では,上記プリズム部112によって分光された3原色それぞれにCCD部114が準備され,各原色に関して光電変換が行われる。
上記レンズ部110,プリズム部112,CCD部114は,本実施形態における撮像部として機能するが,撮像部はかかる構成に限られず,例えば,撮像デバイスとして補色単板CCDを用いるとしても良いし,CMOSを利用しても良い。
上記A/D(アナログ/デジタル)コンバータ116は,CCD部114により得られたアナログ電気信号を,デジタル処理するためのデジタル信号に変換し,変換したデジタル信号を後段の回路に伝達する。
上記リニアマトリクス回路118は,A/Dコンバータ部116から得られた光学系の3原色に分解した後の色信号の漏れを,リニア領域におけるマトリクス演算によって補正する。
上記イメージ強調部120は,リニアマトリクス回路118の前段,即ち,A/Dコンバータ部116から得られた光学系の3原色の細かい部分を強調して各色信号に関するディテイル信号を生成する。
上記加算器122は,リニアマトリクス回路118からの色信号とイメージ強調部120からのディテイル信号を加算し,後段の回路に伝達する。
上記ニー回路124は,最終的な映像の表示における高輝度領域の再現性を高めるため,ニーカーブの特性を利用して高輝度域を圧縮する。かかるニーカーブにおいては,高輝度領域の信号レベルを制限する変換を行うことによって,映像の高輝度領域における再現性を確保している。
上記ガンマ回路126は,逆ガンマ特性によりブラウン管モニタ等の映像再生表示部の映像が変化するのを,ガンマ特性を利用して防止し,最終的な映像のリニアな表示を実現する。ガンマ特性を有するガンマカーブにおいては,任意領域の信号レベルを非線形に増幅する変換を行っている。
上記クリップ回路128は,後段の回路において,処理することができない,もしくは無視される領域の信号レベルをカットする。上記の領域は,取扱可能な信号レベルの最大値以上,もしくは最小値以下の信号であり,上記カットは,例えば,バンドパスフィルタ(BPF)等により実現可能である。
上記Yマトリクス回路130は,クリップ回路128を通過した3つの色信号からY(輝度)信号を生成する。このとき,同時にPb/Pr(色差)信号を生成するとしても良い。
上記MPEGエンコーダ132は,画像を圧縮処理するエンコーダの一つであり,Yマトリクス回路130で生成されたY信号およびPb/Pr信号を受信し,情報量を圧縮する手段としてのMPEGエンコード処理を行い,1つのMPEGストリーム信号を生成する。
上記バッファメモリ134は,SRAM,DRAM,DPRAM,EEPROM等のスタティックなメモリで構成され,MPEGエンコーダ132によるMPEGストリーム信号を一旦保持する。
上記フォーマッタ136は,バッファメモリ134に保持されたMPEGストリーム信号を,ディスク部138に格納されるディスク形態の記憶媒体に記憶するためのフォーマットに変換し,変換後のMPEGストリーム信号を,ディスク部138のアクセスタイミングに応じてディスク部138に出力する。
上記ディスク部138は,回転により記憶位置が移動するディスク形態の記憶媒体,例えば光ディスク,磁気ディスク,ブルーレイディスクといったディスクを回転支持して,その記憶媒体にフォーマッタ136でフォーマットされたMPEGストリーム信号を書き込みおよび/または読み出しする。
上記MPEGデコーダ140は,ディスク部138の記憶媒体に記憶されたMPEGストリーム信号をディスク部138のアクセスタイミングで読み出し,フォーマット変換を行い,その信号からY信号およびPb/Pr信号を生成して再生表示部142に伝送する。
上記再生表示部142は,液晶等の表示装置で形成することができ,MPEGデコーダ140から受信したY信号およびPb/Pr信号によって,記憶媒体に記憶された画像を表示(再生)することができる。
上述した撮像装置により,本発明を実施するための基本的な機能が実現可能となる。かかる撮像装置において説明されたMPEGエンコーダ132は,本発明の画像符号化装置として適用することができる。以下に,本発明による実施形態の具体的な機能を説明する。
(第2の実施形態:画像符号化装置200)
上述したようにMPEGエンコーダ132は,標準化技術としてのMPEGに基づいて,画像を圧縮処理(符号化)する。かかるMPEGは,人の目の特性(視覚特性)を利用し,例えば,画像の細かい信号部分を間引くことによって発生情報量を少なくしている。人の目には,画像の細かい部分には鈍感という特性がある。従って,MPEGでは,目につきにくい高周波成分は粗く量子化(ビットレートを低く)し,目につきやすい低周波成分は細かく量子化(ビットレートを高く)している。
このように画像の質に応じてビットレートを変更し,撮像した画像の質を一定に維持する可変ビットレート制御を以下でも取りあげる。
2パス符号化制御では,予め符号化するフレームの解析を行い,画像の質,例えば画質の劣化可能性の大小に応じて量子化スケールを変更し,適切な情報量の割り当てを行っている。ここでは,画質の劣化可能性の大小に基づいて単純に量子化スケールを変更しているので,劣化が目立ちやすい画像においては量子化スケールが限りなくゼロに近くなり,情報量が過剰に大きくなる。
本実施形態では,例えば,2パス符号化制御等における発生情報量の調整を行う際,発生情報量を目標情報量に近づけつつ,量子化スケールに制限を設けて発生情報量が目標情報量を超えないようにしている。こうして所望の目標情報量を上回る符号化を回避している。その結果,ユーザは,発生情報量の上限を予測することができ,安定した画像の符号化が可能となる。
図2は,第2の実施形態における画像符号化装置200の概略的な構成を示したブロック図である。かかる画像符号化装置200は,情報量決定部210と,離散コサイン変換部212と,スケール決定部214と,スケール制限部216と,量子化部218とを含んで構成される。
上記情報量決定部210は,与えられたビットレート,ピクチャータイプおよび入力された1フレーム分の画像の難しさに応じて,そのフレームの発生情報量の目標値,即ち,目標情報量を決定する。ここでは,画像の質,例えば画質の劣化可能性の大小に応じて適切な目標情報量を割り当てる。かかる劣化可能性の判断は,画像の難しさを画像の難易度パラメータとして表し,直前にエンコードされた画像の難易度パラメータと比較して決定されるとしても良い。
そもそも可変ビットレート制御は,目につきにくい高周波成分は粗く量子化(ビットレートを低く)し,目につきやすい低周波成分は細かく量子化(ビットレートを高く)することを目的としている。従って,水平線上の青空といった低周波成分で構成される画像に対しては,目標情報量が大きく設定され,オフィス街での人混みといった高周波成分で構成される画像に対しては,目標情報量が小さく設定される。
また,本実施形態における情報量決定部210は,目標情報量に上限を設けている。
従来,かかる画像の符号化,例えば,2パス符号化制御においては,単に,劣化が目立ちやすい画像には高い目標情報量が割り当てられ,劣化が目立ち難い画像には低い情報量が割り当てられていた。本実施形態では,目標情報量に上限を設けているので,劣化が目立ちやすい画像には高い目標情報量が割り当てられるがその情報量は無制限ではなく,所定の上限によって制限される。また,劣化が目立ち難い画像には,従来通りの低い情報量が割り当てられる。
このように発生情報量を頭打ちすることにより,発生情報量を一定量以下に収めることが可能となる。従って,ユーザは,発生情報量の上限を予測することができ,安定した画像の符号化が可能となる。かかる実施形態では,発生情報量の予測値を下回ることは考えられるが,予測値を超すことがないので,その画像を記憶するために記憶容量に余裕を見て記憶媒体を準備する必要がなくなる。
さらに,本実施形態における情報量決定部210は,該フレームのみに着目して目標情報量を決定している。
従来,かかる画像の符号化においては,1フレームの発生情報量が前後のフレームや記憶可能な残情報量といった消費情報量の進捗に応じて決定されていた。このような状況下では,同画像を符号化してもその符号化した時間の隔たりによって発生情報量が相違する結果となる。例えば,動画像を符号化する場合に,初期には,記憶媒体の容量も余裕があったので発生情報量を大きくとっていたが,その後も目標情報量を大きくとる画像が連続したため記憶媒体に余裕がなくなり,終端において同一の画像を撮像したとしても目標情報量が小さくなるといった状況が起こり得る。
上記の動画像は,全体を連続して再生する場合あまり問題にならない。しかし,クリップの任意の場所,例えば初期の画像と終端の画像とを編集によってつなげた場合,その画質が変化しているのが分かってしまう。
本実施形態では,動画像信号のフレーム毎に,その1フレームの情報のみに着目して目標情報量を決定しているので,消費情報量の進捗に影響されない安定した発生情報量を維持することができる。上記の例においても,初期の画像と終端の画像の目標情報量は等しくなり,発生情報量もほぼ等しくなる。従って,その画像編集において両画像をつなげたとしても,画質の変化を確認できない。
また,こうした目標情報量は,上述した目標情報量の上限以下において設定されるため,所望の目標情報量を上回る符号化を回避し,安定した発生情報量を維持することができる。
上記離散コサイン変換部212は,1フレームの画像を複数のマクロブロックに分割し,該マクロブロック毎に離散コサイン変換を行う。
図3は,離散コサイン変換部212によるマクロブロックへの分割を説明するための説明図である。まず,離散コサイン変換部212は,画像250を複数のマクロブロック,例えば,水平方向に160,垂直方向に96に分割する。その後の離散コサイン変換は,かかるマクロブロック252単位で,例えば,マクロブロックの1ライン目の1ブロック,2ブロック,…,2ライン目の1ブロック,…160ライン目の96ブロックといった順番で行われる。
上記離散コサイン変換は,例えば,マクロブロック252をさらに8画素254×8ライン256の2次元マトリクスの乗算で実施され,変換の結果として,マクロブロック252内の画素数と同じ数(64個)の変換係数が得られる。かかる変換係数の(0,0)成分は直流成分計数と呼ばれ,マクロブロック252内の画素値の平均を示し,残りは交流成分と呼ばれる。かかる離散コサイン変換は従来から知られている様々な方法を適用することができる。従って,ここでは詳細な説明を省略する。
上記スケール決定部214は,1フレームの発生情報量を,情報量決定部210で決定された目標情報量に合わせるため,既に量子化されている情報量と上記目標情報量とを用いて,マクロブロック毎の量子化スケールを決定する。
上記量子化スケールは,後述する量子化部218で符号化信号を得るために利用される。上述した離散コサイン変換単独では,データの圧縮はできず,データの圧縮は,離散コサイン変換により生じた変換係数のエネルギ分布の偏りを利用して行われる。ここでは,上記変換係数を単に量子化スケールで除算することによって量子化が行われる。
人間の視覚は,ローパスフィルタの特性を有しており,高周波成分のAC係数に対しては,多少粗い量子化スケールで量子化しても,主観的にあまり劣化が目立つことはない。例えば,量子化スケールを小さくすれば復号画像の品質は良くなるが,発生情報量は大きくなる。逆に,量子化スケールを大きくすると発生情報量は少なくなるが,復号画像の品質は低下する。
従って,本実施形態においては,一旦情報量決定部210で決定された目標情報量に発生情報量を合わせるため,目標情報量と既に量子化されている情報量との差分から,あとどのくらいの情報量を発生することが可能であるか計算し,その範囲内で許される量子化スケールを当該マクロブロックの画質に応じて決定する。
図4は,上記で挙げたマクロブロックの画質と量子化スケールとの関係を説明するための説明図である。図4には,1フレーム分の画像270が示され,その中の2つのマクロブロック272,274が例として挙げられている。
例えば,マクロブロック272は,動特性が少なく,全体的に同一の画素,即ち低周波成分で構成されるで,量子化スケールを小さくとり,その情報量を増やさなければならない。それに対して,マクロブロック274は,マクロブロック内で変化の大きい,即ち高周波成分で構成されるので,量子化スケールを大きくすることができ,情報量も少なくて済む。
このようにして,劣化が目立ちやすい画像には大きな情報量が割り当てられる。しかし,量子化スケールを無制限に小さくすると,かかる情報量も無制限に大きくなる。従って,目標情報量に対して発生情報量が超えてしまう問題が生じる。
図5は,目標情報量に対する量子化スケールおよび情報量の推移を説明するための説明図である。かかる図5の横軸310は,処理が完了したマクロブロックの数であり,縦軸312は,その処理毎の発生情報量の積算値を示している。
かかる量子化では,発生情報量を目標情報量に近づけることを目的とする。従って,マクロブロック処理の進捗に対する発生情報量の蓄積値は,波線314に示した軌跡を辿るのが理想であるが,実際は,そのマクロブロック毎の画質により曲線316のような不安定な軌跡を描く。
例えば,3840個目のマクロブロック318の量子化スケールは,目標情報量と既に量子化されている情報量Aとの差分からあとどのくらいの情報量を発生することが可能であるか計算され,その範囲内で当該マクロブロックの画質に応じて決定される。このようにして曲線316を描きつつ目標情報量に近い発生情報量320を生成する。
しかし,図5において理解されるように,上記最終的な発生情報量320は目標情報量を超している。これは,ユーザの予測した総情報量を少なくとも上回る可能性があることを示し,故にユーザは,予測値より多い情報量を記憶できる記憶媒体を準備する必要が生じる。かかる問題は,以下のスケール制限部216により解決される。
上記スケール制限部216は,スケール決定部214で決定された量子化スケールを制限する。このように量子化スケールを制限することにより,後述の量子化において極端に大きな情報量が発生することを回避でき,最終的な発生情報量を目標情報量以下に抑えることができる。以下に,かかる制限の方法を3種類上げているが,本実施形態はこれに限られず,様々な方法で実施することができる。また,上記制限は,複数の次数を有する関数によっても制限可能である。
図6は,単純に量子化スケールに下限を設定した場合の量子化スケールを表した説明図である。かかる図6において,横軸410は,スケール制限部216に入力される量子化スケールであり,縦軸412は,スケール制限部216から出力される量子化スケールである。
図6においては,スケール決定部214で決定された量子化スケールの範囲が0〜Nである場合に,その範囲内のMの下限が設けられる。この下限を有した曲線420により,スケール制限部216に入力された量子化スケールは,0〜Mの範囲で,強制的にMに変更され,M〜Nの範囲で,そのままの数値が維持される。
かかる構成により,マクロブロックの画質が,劣化の目立つ低周波成分の多い画質であったとしても,量子化スケールが著しく小さくなることがないので,量子化された情報量が極端に大きくならない。
図7は,下限から最大値まで,2次導関数が正または0のみの非線形曲線によって滑らかに制限される場合の量子化スケールを表した説明図である。かかる図7においても,横軸410は,スケール制限部216に入力される量子化スケールであり,縦軸412は,スケール制限部216から出力される量子化スケールである。
図7においては,スケール決定部214で決定された量子化スケールの範囲が0〜Nである場合にMの下限が設けられている。図7と図6とを比較すると,その制限が下限値に向かう滑らかな曲線450で表されているところが相違している。この下限により,スケール制限部216に入力された量子化スケールは,低くなるほど制限を受ける形になる。
かかる量子化スケールが徐々に制限される構成により,量子化スケールを下げられないことによる画質の劣化が目立たなくなり,違和感のない符号化を達成することができる。
図8は,下限から最大値まで,制限される値が比例する場合の量子化スケールを表した説明図である。かかる図8においても,横軸410は,スケール制限部216に入力される量子化スケールであり,縦軸412は,スケール制限部216から出力される量子化スケールである。
図8においては,スケール決定部214で決定された量子化スケールの範囲が0〜Nである場合に,Mの下限が設けられている。かかる下限Mを有する直線470は,制限される前の量子化スケール,即ち入力量子化スケールがLであった場合,(N―M)/N×L+Mで表される。
かかる量子化スケールが線形的に制限される構成により,量子化スケールを下げられないことによる画質の劣化が目立たなくなり,違和感のない符号化を達成することができる。
上記のように量子化スケールに下限を設けることによって,画像1フレーム分の発生情報量を,目標情報量を超えない値に制限することができる。このような目標情報量と発生情報量との関係を以下に説明する。
図9は,本実施形態における目標情報量に対する量子化スケールおよび情報量の推移を説明するための説明図である。かかる図9の横軸310は,図5同様に処理が完了したマクロブロックの数であり,縦軸312は,その処理毎の発生情報量の積算値を示している。
かかる量子化でも図5同様に,発生情報量を目標情報量に近づけることを目的とする。従って,マクロブロック処理の進捗に対する発生情報量の蓄積値は,波線314に示した軌跡に近い曲線480のような不安定な軌跡を描く。
例えば,3840個目のマクロブロック482の量子化スケールは,目標情報量と既に量子化されている情報量Bとの差分から,残りどのくらいの情報量を発生することが可能であるか計算され,その範囲内で当該マクロブロックの画質に応じて決定される。このようにして曲線480を描きつつ目標情報量に近い情報量を生成する。
かかる図9は,最終的な発生情報量484が必ず目標情報量以下になる点で図5の場合と相違する。これは,上記スケール制限部216が量子化スケールを制限することで達成される。ただし,エンコードノイズが目立ちやすい部分に関しては補正を行う。これは,ユーザの予測した総情報量と等しいかもしくは下回ることを示し,故にユーザは,予測値より多い情報量を記憶できる記憶媒体を準備する必要がない。
上記量子化部218は,離散コサイン変換された信号を,スケール制限部216で制限された量子化スケールで量子化する。かかる量子化は,量子化スケールによる除算で実行可能である。
また,上記画像符号化装置として機能するプログラムおよびそのプログラムが記憶された記憶媒体も提供される。
(第3の実施形態:撮像装置500)
画像符号化装置200は,上述したように撮像装置にも適用し得る。
図10は,第3の実施形態における撮像装置500の概略的な構成を示したブロック図である。かかる撮像装置500は,撮像部510と,情報量決定部210と,離散コサイン変換部212と,スケール決定部214と,スケール制限部216と,量子化部218と,信号記憶部512と,表示部514とを含んで構成される。
第2の実施形態における構成要素として既に述べた情報量決定部210と,離散コサイン変換部212と,スケール決定部214と,スケール制限部216と,量子化部218とは,実質的に機能が同一なので重複説明を省略し,ここでは,新たな機能を有す撮像部510と,信号記憶部512と,表示部514とを主に説明する。
上記撮像部510は,第1の実施形態で説明したレンズ部110,プリズム部112,CCD部114等を含んで構成され,被写体を撮像することによって画像を得る。この撮像された画像は画素単位でシリアル転送される。また,必要に応じて,第1の実施形態で説明したA/Dコンバータ部,リニアマトリクス回路,イメージ強調部,加算器,ニー回路,ガンマ回路,クリップ回路,Yマトリクス回路等を含んで構成することもできる。
上記信号記憶部512は,上記量子化された符号化信号を,外部から挿入されたもしくは既存の記憶媒体230に記憶する。ここで,記憶媒体230は,書き込み位置もしくは読み出し位置が回転移動するディスク形態であるとしても良く,信号記憶部512は,削減画像を一旦保持し,記憶媒体230へのアクセス(書き込みもしくは読み出し)タイミングで出力するディスクバッファ(図示せず)を備えることもできる。
上記表示部514は,撮像部510による撮像中の画像確認のため,液晶ディスプレイ等の表示装置に,撮像部510で撮像されている画像を直接表示する。かかる表示部514によって被写体のピント合わせや露光調整等も行うことができる。
かかる撮像装置500の構成により,目標情報量を上回る符号化を回避し,発生情報量の上限を予測可能とすることで安定した画像の符号化が可能となる。
(第4の実施形態:画像符号化方法)
続いて,上述した画像符号化装置200を利用して実現可能な画像符号化方法を説明する。
図11は,第4の実施形態における画像符号化方法の流れを示したフローチャートである。ここでは,画像の質に応じてビットレートを変更する可変ビットレート制御に基づいて,画像信号を符号化し,目標情報量に相当する情報量の符号化信号を生成している。
先ず,画像符号化装置200において,1フレーム分の画像を読み出し(S600),その画像の質に応じて目標情報量を決定する(S602)。続いて,読み出した1フレームの画像を複数のマクロブロック,例えば,水平方向に160,垂直方向に96に分割する(S604)。以下では,かかる分割されたマクロブロック毎に処理が行われる。
分割されたマクロブロックの1つを読み出し,さらにそのマクロブロックを,例えば8画素×8ラインに分割し,離散コサイン変換を行う(S610)。次に,読み出した1フレームの画像における発生情報量を,情報量決定ステップ(S602)で決定された目標情報量に合わせるため,既に量子化されている情報量と上記目標情報量とを用いて,マクロブロック毎の量子化スケールを決定する(S612)。そして,そのスケール決定ステップ(S612)で決定された量子化スケールを,特に所定の数値による下限によって制限する(S614)。
次に,離散コサイン変換ステップ(S610)によって離散コサイン変換された信号を,スケール制限ステップ(S612)で制限された量子化スケールによって量子化する(S616)。ここで,エンコードノイズが目立ちやすい部分に関しては補正を行う。こうして符号化された信号は,記憶媒体230に記憶される(S618)。このとき画像分割ステップ(S604)で分割されたマクロブロック全てに関して処理が終わっているか確認され(S620),全て終わっていれば当該画像符号化方法を終了し,次のフレームを読み出す。
かかる画像符号化方法においても,目標情報量を上回る符号化を回避し,発生情報量の上限を予測可能とすることで安定した画像の符号化が可能となる。
当該撮像方法や画像符号化方法における各ステップは,必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく,並列的あるいは個別に実行される処理(例えば,並列処理あるいはオブジェクトによる処理)も含むとしても良い。
以上,添付図面を参照しながら本発明の好適な実施形態について説明したが,本発明は係る例に限定されないことは言うまでもない。当業者であれば,特許請求の範囲に記載された範疇内において,各種の変更例または修正例に想到し得ることは明らかであり,それらについても当然に本発明の技術的範囲に属するものと了解される。
例えば,上記の実施形態においては,スケール制限部が固定された下限値を有しているが,かかる場合に限られず,画像の質やビットレートに応じて下限値が変動するとしても良い。このような構成により,ビットレートが高くなるときは下限を上げ,ビットレートが低いときは下限を低く,もしくは下限を設けないとする処理を行うことができ,より効率的な発生情報量を生成できる。
また,上記の実施形態においては,スケール制限部が下限を有している場合のみ説明されているが,かかる場合に限られず,例えば,ディスク等の記憶媒体に無制限に記憶することができる場合,逆に上限を設けることにより発生情報量を意図的に増やすことも可能である。
また,上記の実施形態においては,ディスク形態の記憶媒体への画像の記憶を基本に説明したが,かかる場合に限られず,ストレージやHDD等他の記憶媒体を用いることもできる。
第1の実施形態における撮像装置を概略的に示したブロック図である。 第2の実施形態における画像符号化装置の概略的な構成を示したブロック図である。 離散コサイン変換部によるマクロブロックへの分割を説明するための説明図である。 マクロブロックの画質と量子化スケールとの関係を説明するための説明図である。 目標情報量に対する量子化スケールおよび情報量の推移を説明するための説明図である。 単純に量子化スケールに下限を設定した場合の量子化スケールを表した説明図である。 下限から最大値まで,2次導関数が正または0のみの非線形曲線によって滑らかに制限される場合の量子化スケールを表した説明図である。 下限から最大値まで,制限される値が比例する場合の量子化スケールを表した説明図である。 第3の施形態における目標情報量に対する量子化スケールおよび情報量の推移を説明するための説明図である。 第3の実施形態における撮像装置の概略的な構成を示したブロック図である。 第4の実施形態における画像符号化方法の流れを示したフローチャートである。
符号の説明
100,500 撮像装置
210 情報量決定部
212 離散コサイン変換部
214 スケール決定部
216 スケール制限部
218 量子化部
510 撮像部
512 信号記憶部
514 表示部
S602 情報量決定ステップ
S604 画像分割ステップ
S610 離散コサイン変換ステップ
S612 スケール決定ステップ
S614 スケール制限ステップ
S616 量子化ステップ

Claims (9)

  1. 画像の質に応じてビットレートを変更する可変ビットレート制御に基づいて,画像信号を符号化し,目標情報量に相当する情報量の符号化信号を生成する画像符号化装置であって:
    目標情報量を決定する情報量決定部と;
    1フレームの画像を複数のマクロブロックに分割し,該マクロブロック毎に離散コサイン変換を行う離散コサイン変換部と;
    前記1フレームの発生情報量を前記目標情報量に合わせるため,既に量子化されている情報量と前記目標情報量とを用いて,マクロブロック毎の量子化スケールを決定するスケール決定部と;
    前記スケール決定部で決定された量子化スケールを制限するスケール制限部と;
    前記離散コサイン変換された信号を,前記スケール制限部で制限された量子化スケールで量子化する量子化部と;
    を備えることを特徴とする,画像符号化装置。
  2. 前記スケール制限部における量子化スケールの制限は,所定の数値による下限であることを特徴とする,請求項1に記載の画像符号化装置。
  3. 前記量子化スケールは,下限としての前記数値から最大値まで,2次導関数が正または0のみの非線形曲線によって滑らかに制限されていることを特徴とする,請求項2に記載の画像符号化装置。
  4. 前記量子化スケールは,下限としての前記数値から最大値まで,制限される値が比例することを特徴とする,請求項2に記載の画像符号化装置。
  5. 前記情報量決定部は,前記動画像信号のフレーム毎に,該フレームのみに着目して目標情報量を決定することを特徴とする,請求項1に記載の画像符号化装置。
  6. 前記目標情報量は上限が設けられていることを特徴とする,請求項1に記載の画像符号化装置。
  7. 画像の質に応じてビットレートを変更する可変ビットレート制御に基づいて,画像信号を符号化し,目標情報量に相当する情報量の符号化信号を生成するプログラムであって:
    コンピュータを,
    目標情報量を決定する情報量決定部と;
    1フレームの画像を複数のマクロブロックに分割し,該マクロブロック毎に離散コサイン変換を行う離散コサイン変換部と;
    前記1フレームの発生情報量を前記目標情報量に合わせるため,既に量子化されている情報量と前記目標情報量とを用いて,マクロブロック毎の量子化スケールを決定するスケール決定部と;
    前記スケール決定部で決定された量子化スケールを制限するスケール制限部と;
    前記離散コサイン変換された信号を,前記スケール制限部で制限された量子化スケールで量子化する量子化部と;
    して機能させることを特徴とする,プログラム。
  8. 画像の質に応じてビットレートを変更する可変ビットレート制御に基づいて,画像信号を符号化し,目標情報量に相当する情報量の符号化信号を生成する画像符号化方法であって:
    目標情報量を決定する情報量決定ステップと;
    1フレームの画像を複数のマクロブロックに分割する画像分割ステップと;
    該分割されたマクロブロック毎に,
    離散コサイン変換を行う離散コサイン変換ステップと;
    前記1フレームの発生情報量を前記目標情報量に合わせるため,既に量子化されている情報量と前記目標情報量とを用いて,マクロブロック毎の量子化スケールを決定するスケール決定ステップと;
    前記スケール決定ステップで決定された量子化スケールを制限するスケール制限ステップと;
    前記離散コサイン変換された信号を,前記制限された量子化スケールで量子化する量子化ステップと;
    を含むことを特徴とする,画像符号化方法。
  9. 画像の質に応じてビットレートを変更する可変ビットレート制御に基づいて,撮像した画像信号を符号化し,目標情報量に相当する情報量の符号化信号を生成する撮像装置であって:
    撮像によって画像を得る撮像部と;
    前記撮像された画像の目標情報量を決定する情報量決定部と;
    1フレームの画像を複数のマクロブロックに分割し,該マクロブロック毎に離散コサイン変換を行う離散コサイン変換部と;
    前記1フレームの発生情報量を前記目標情報量に合わせるため,既に量子化されている情報量と前記目標情報量とを用いて,マクロブロック毎の量子化スケールを決定するスケール決定部と;
    前記スケール決定部で決定された量子化スケールを制限するスケール制限部と;
    前記離散コサイン変換された信号を,前記スケール制限部で制限された量子化スケールで量子化する量子化部と;
    前記量子化された符号化信号を記憶媒体に記憶する信号記憶部と;
    を備えることを特徴とする,撮像装置。
JP2005117577A 2005-04-14 2005-04-14 画像符号化装置,画像符号化方法,撮像装置およびプログラム Pending JP2006295852A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005117577A JP2006295852A (ja) 2005-04-14 2005-04-14 画像符号化装置,画像符号化方法,撮像装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005117577A JP2006295852A (ja) 2005-04-14 2005-04-14 画像符号化装置,画像符号化方法,撮像装置およびプログラム

Publications (1)

Publication Number Publication Date
JP2006295852A true JP2006295852A (ja) 2006-10-26

Family

ID=37415883

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005117577A Pending JP2006295852A (ja) 2005-04-14 2005-04-14 画像符号化装置,画像符号化方法,撮像装置およびプログラム

Country Status (1)

Country Link
JP (1) JP2006295852A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009139303A1 (ja) 2008-05-16 2009-11-19 シャープ株式会社 映像記録装置
WO2020066326A1 (ja) * 2018-09-26 2020-04-02 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03190482A (ja) * 1989-12-20 1991-08-20 Matsushita Electric Ind Co Ltd 動画像符号化装置
JPH08149413A (ja) * 1994-09-22 1996-06-07 Matsushita Electric Ind Co Ltd 可変ビットレート符号化装置および記録装置および記録媒体
JP2001169284A (ja) * 1999-10-26 2001-06-22 Sharp Corp 動画符号化装置における量子化ステップ設定方法及びその方法を用いた動画符号化装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03190482A (ja) * 1989-12-20 1991-08-20 Matsushita Electric Ind Co Ltd 動画像符号化装置
JPH08149413A (ja) * 1994-09-22 1996-06-07 Matsushita Electric Ind Co Ltd 可変ビットレート符号化装置および記録装置および記録媒体
JP2001169284A (ja) * 1999-10-26 2001-06-22 Sharp Corp 動画符号化装置における量子化ステップ設定方法及びその方法を用いた動画符号化装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009139303A1 (ja) 2008-05-16 2009-11-19 シャープ株式会社 映像記録装置
CN102027745A (zh) * 2008-05-16 2011-04-20 夏普株式会社 视频记录装置
RU2479146C2 (ru) * 2008-05-16 2013-04-10 Шарп Кабусики Кайся Устройство видеозаписи
US8837918B2 (en) 2008-05-16 2014-09-16 Sharp Kabushiki Kaisha Video recording apparatus
WO2020066326A1 (ja) * 2018-09-26 2020-04-02 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム
JPWO2020066326A1 (ja) * 2018-09-26 2021-08-30 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム
US11223826B2 (en) 2018-09-26 2022-01-11 Fujifilm Corporation Image processing device, imaging device, image processing method, and image processing program
US12256073B2 (en) 2018-09-26 2025-03-18 Fujifilm Corporation Device and method for adaptive quantization based on video capturing mode

Similar Documents

Publication Publication Date Title
CN107409213B (zh) 用于高动态范围图像的内容自适应感知量化器
US7444031B2 (en) Image processing apparatus
US10701359B2 (en) Real-time content-adaptive perceptual quantizer for high dynamic range images
US8233060B2 (en) Image data processing apparatus, image data processing method, and program
US8634458B2 (en) Image processing apparatus
IL300136B2 (en) Image reshaping in video coding using rate distortion optimization
EP1949705B1 (en) Image signal processing apparatus
JP4169768B2 (ja) 画像符号化装置、画像処理装置、画像符号化方法、及び画像処理方法
JPH0723383A (ja) ビット固定のための映像圧縮方法と伸張方法及びその装置
US5838379A (en) Image processing apparatus having means for controlling exposure using an orthogonal transformation coefficient
TW200913674A (en) Video camera
JP6806466B2 (ja) 画像符号化装置及びその制御方法
JPH07177464A (ja) リアルタイム画像圧縮処理装置
JP6700798B2 (ja) 撮像装置及びその制御方法
JP2008113112A (ja) 撮像装置
JP2006295852A (ja) 画像符号化装置,画像符号化方法,撮像装置およびプログラム
US7801214B2 (en) Method and apparatus for controlling encoding rate and quantization scales
JP2004187036A (ja) 輪郭補正システム
JP2003023637A (ja) 画像符号化方法および画像符号化装置
JP2004040300A (ja) 画像処理装置
JP4430731B2 (ja) ディジタルカメラおよび撮影方法
JPH0468770A (ja) 画像符号化方式
JP3307367B2 (ja) 可変転送レート符号化装置
JPH0481176A (ja) 電子スチルカメラ
JP2020109923A (ja) 画像符号化装置及びその制御方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101130

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110329