JP4123452B2 - Image processing apparatus and image processing method - Google Patents
Image processing apparatus and image processing method Download PDFInfo
- Publication number
- JP4123452B2 JP4123452B2 JP16785598A JP16785598A JP4123452B2 JP 4123452 B2 JP4123452 B2 JP 4123452B2 JP 16785598 A JP16785598 A JP 16785598A JP 16785598 A JP16785598 A JP 16785598A JP 4123452 B2 JP4123452 B2 JP 4123452B2
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- bit
- thinned
- pixels
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000005070 sampling Methods 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 22
- 230000002123 temporal effect Effects 0.000 claims description 11
- 230000006866 deterioration Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000002093 peripheral effect Effects 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 description 28
- 238000010586 diagram Methods 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Images
Landscapes
- Picture Signal Circuits (AREA)
- Television Signal Processing For Recording (AREA)
- Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、画像処理装置および画像処理方法に関し、特に、動画像の画質等の劣化を低減することができるようにする画像処理装置および画像処理方法に関する。
【0002】
【従来の技術】
従来より、動画像を表示するときの走査方法の1つとして、インターレース走査がある。
【0003】
即ち、例えば、ビデオカメラなどで画像を撮影した場合に、本来ならば、図14に示すように、その内蔵するCCD(Charge Coupled Device)などの光電変換素子が有する画素と同一配置の画素(同図において、○印で示す)で、各フレームを構成し、伝送や記録を行うのが、画質や解像度などの面からは理想的である。
【0004】
しかしながら、これでは、伝送や記録等する情報量が多くなる。そこで、情報量の低減のために、図15に示すように、最初の画面(インターレース走査では、フィールド)は、奇数ラインの画素(同図において●印で示す)を間引いて、偶数ラインの画素(同図において○印で示す)だけで構成され、次の画面は、偶数ラインの画素(同図において●印で示す)を間引いて、奇数ラインの画素(同図において○印で示す)だけで構成され、さらに次の画面は、最初の画面と同様に構成され、以下、同様にして、画面が構成される。
【0005】
ここで、インターレース走査は、上述したことから、情報量を低減するための画素を間引く手法の1つと考えることができるので、このような間引きの手法を、以下、適宜、インターレース間引きという。
【0006】
【発明が解決しようとする課題】
ところで、画像の垂直方向の解像度は、そのライン数に依存する。従って、インターレース間引きを行うと、その間引き後の画像の垂直方向の解像度は、間引き前の画像の垂直方向の解像度の1/2になる。その結果、垂直方向の速い変化を表現するのが困難となり、そのような動きがあると、画質が劣化する課題があった。
【0007】
本発明は、このような状況に鑑みてなされたものであり、画素(画素データ)のレベル方向におけるビット間引きによる画質の劣化を低減することができるようにするものである。
【0008】
【課題を解決するための手段】
請求項1に記載の画像処理装置は、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すビット間引き手段を備えることを特徴とする。
【0009】
請求項3に記載の画像処理方法は、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことを特徴とする。
【0012】
請求項4に記載の画像処理装置は、動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施すことにより得られる所定のビットが間引かれた画素である第1のビット間引き画素と、所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなる間引き画像データであって、第1または第2のビット間引き画素が、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことにより得られる間引き画像データを構成する第1および第2の画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより一方の画素の元の画素値を復元する、または一方の画素の元の画素値を予測するのに用いられるデータである予測データと、他方の画素の画素値との積和演算によって、一方の画素の元の画素値を復元する復元手段を備えることを特徴とする。
【0013】
請求項1に記載の画像処理装置においては、ビット間引き手段が、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すようになされている。
【0014】
請求項3に記載の画像処理方法においては、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すようになされている。
【0017】
請求項4に記載の画像処理装置においては、復元手段が、動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施すことにより得られる所定のビットが間引かれた画素である第1のビット間引き画素と、所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなる間引き画像データであって、第1または第2のビット間引き画素が、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことにより得られる間引き画像データを構成する第1および第2の画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより一方の画素の元の画素値を復元する、または一方の画素の元の画素値を予測するのに用いられるデータである予測データと、他方の画素の画素値との積和演算によって、一方の画素の元の画素値を復元するようになされている。
【0018】
【発明の実施の形態】
以下に、本発明の実施の形態を説明するが、その前に、特許請求の範囲に記載の発明の各手段と以下の実施の形態との対応関係を明らかにするために、各手段の後の括弧内に、対応する実施の形態(但し、一例)を付加して、本発明の特徴を記述すると、次のようになる。
【0019】
即ち、請求項1に記載の画像処理装置は、動画像を構成する画像データを、復元処理時の画質の劣化を抑制して圧縮する画像処理装置において、動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施し、所定のビットが間引かれた画素である第1のビット間引き画素と、所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなるビット間引き画像データを生成するビット間引き手段(例えば、図1に示すレベル方向ビットサブサンプリング回路2など)と、ビット間引き画像データを構成する第1および第2のビット間引き画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより一方の画素の元の画素値を復元する復元処理、または一方の画素の元の画素値を予測するのに用いられるデータである予測データと、他方の画素の画素値との積和演算によって、一方の画素の元の画素値を復元する復元処理によって、元の画像データに復元されるビット間引き画像データを出力する出力手段(例えば、図1に示す送信処理回路4など)とを備え、ビット間引き手段が、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことを特徴とする。
【0020】
請求項4に記載の画像処理装置は、動画像を構成する画像データの画素を間引くことにより生成されたビット間引き画像データを伸張する画像処理装置において、動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施すことにより得られる所定のビットが間引かれた画素である第1のビット間引き画素と、所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなる間引き画像データであって、第1または第2のビット間引き画素が、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことにより得られるビット間引き画像データを受信する受信手段(例えば、図1に示す受信処理回路8など)と、ビット間引き画像データを構成する第1および第2のビット間引き画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより一方の画素の元の画素値を復元する、または一方の画素の元の画素値を予測するのに用いられるデータである予測データと、他方の画素の画素値との積和演算によって、一方の画素の元の画素値を復元する復元手段(例えば、図1に示すクラスタップ/予測タップ切り出し回路11、クラスタリング回路12、メモリ13、および画素データ生成回路14など)とを備えることを特徴とする。
【0021】
請求項6に記載の画像処理装置は、復元手段が、ビット間引き画像データの所定の注目画素に対して、注目画素の周辺に位置する周辺画素に基づいて、注目画素の特徴を表す所定のクラスを決定する決定手段(例えば、図1に示すクラスタリング回路12など)と、決定手段が出力するクラスに対応するデータであって、かつ、ビット間引きが施される前の一方の画素の画素値を予測するのに用いられるデータである予測データと、他方の画素の画素値との積和演算によって、一方の画素である注目画素に対応するビット間引きが施される前の画素の画素値を予測し、その画素値を発生する発生手段(例えば、図1に示すメモリ13や画素データ生成回路14など)とを有することを特徴とする。
【0022】
請求項7に記載の画像処理装置は、発生手段が、学習用の動画像を構成する画像データを用いて、あらかじめ学習を行うことにより生成されたクラスごとの所定の予測データを、クラスごとに記憶する記憶手段(例えば、図1に示すメモリ13など)を有し、決定手段が出力するクラスに対応する予測データを、記憶手段から読み出し、その読み出された予測データと、他方の画素の画素値との積和演算によって、注目画素に対応するビット間引きが施される前の画素の画素値を発生することを特徴とする。
【0023】
請求項8に記載の画像処理装置は、記憶手段が、予測データとして、積和演算に用いる、クラスごとの所定の予測係数のセットを記憶しており、発生手段が、決定手段が出力するクラスに対応する予測係数のセットを、記憶手段から読み出し、その読み出された予測係数のセットと、注目画素の周辺に位置する、ビット間引き画像データの複数の画素の画素値であって、かつ、他方の画素の画素値との積和演算によって、注目画素に対応するビット間引きが施される前の画素の画素値を算出する演算手段(例えば、図1に示す画素データ生成回路14など)をさらに有することを特徴とする。
【0024】
なお、勿論この記載は、各手段を上記したものに限定することを意味するものではない。
【0025】
図1は、本発明を適用した送受信システム(システムとは、複数の装置が論理的に集合したものをいい、各構成の装置が同一筐体中にあるか否かは問わない)の一実施の形態の構成例を示している。
【0026】
この送受信システムは、送信装置100と受信装置200とで構成されている。そして、送信装置100は、入力端子1、レベル方向ビットサブサンプリング回路2、エンコーダ3、送信処理回路4、および出力端子5で構成され、画像の各画素(画素データ)のレベル方向の所定のビットを間引くことにより圧縮して送信するようになされており、受信装置200は、入力端子7、受信処理回路8、デコーダ9、クラスタップ/予測タップ切り出し回路11、クラスタリング回路12、メモリ13、画素データ生成回路14、および出力端子15で構成され、送信装置100からの圧縮された画像を伸張するようになされている。
【0027】
即ち、送信装置100には、例えば、図示せぬビデオカメラなどで撮影され、その内蔵するCCDなどの光電変換素子が有する画素と同一配置の画素で、各フレームが構成される動画像(以下、適宜、全画素動画像という)のディジタル画像データが供給される。ここで、このような全画素動画像は、いわゆるプログレッシブカメラ(光電変換素子上の画素すべてを、いわゆるラスタスキャン順に走査して、1フレームの画像信号として出力するビデオカメラ)や、全画素カメラ(光電変換素子上の画素すべてにおける信号を、一度に、1フレームの画像信号として出力するビデオカメラ)などによって得ることができる。
【0028】
このディジタル画像データは、入力端子1を介して、レベル方向ビットサブサンプリング回路2に供給される。レベル方向ビットサブサンプリング回路2に供給されるディジタル画像データとしての動画像を構成する各フレームの画素(画素データ)は、例えば8ビットで構成されており、レベル方向ビットサブサンプリング回路2では、その8ビットの各画素が、図2に示すように、空間方向および時間方向の両方向に、五の目格子状に、画素のレベル方向に対して異なるビット間引きにより間引かれることにより圧縮される。
【0029】
ここで、図2において(後述する図3乃至図6および図12においても同様)、●印および○印の両方が、全画素動画像を構成するフレームの画素(画素データ)を示している。そして、図3(A)に示されるように、レベル方向ビットサブサンプリング回路2は、そのうちの●印の8ビットの画素データについては、そのレベル方向のMSB(Most Significant Bit)から2番目、4番目、6番目及び8番目(LSB(Least Significant Bit))のビットを間引き、MSBから1番目、3番目、5番目及び7番目のビットから構成される4ビットの画素データ(以下、第1のビット間引き画素(画素データ)という)を構成する。また、レベル方向ビットサブサンプリング回路2は、○印の8ビットの画素データについては、そのレベル方向のMSBから1番目、3番目、5番目及び7番目のビットを間引き、MSBから2番目、4番目、6目及び8番目のビットから構成される4ビットの画素データ(以下、第2のビット間引き画素(画素データ)という)を構成する。
【0030】
従って、レベル方向ビットサブサンプリング回路2では、全画素動画像の第1フレームについては、例えば、図4(A)に示すように、その1ライン目の2列目、4列目、6列目、8列目、・・・,2ライン目の1列目、3列目、5列目、7列目、・・・の画素(同図(A)に●印で示す)が第1のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれ、また、その1ライン目の1列目、3列目、5列目、7列目、・・・,2ライン目の2列目、4列目、6列目、8列目、・・・の画素(同図(A)に○印で示す)が第2のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれる。以下、同様にして、奇数フレームについては、第1または第2のビット間引き画素それぞれが、空間方向に、五の目格子状に並ぶように、各画素のレベル方向に対してビット間引きが行われる。
【0031】
また、第2フレームについては、例えば、図4(B)に示すように、その1ライン目の1列目、3列目、5列目、7列目、・・・,2ライン目の2列目、4列目、6列目、8列目、・・・の画素(同図(B)に●印で示す)が第1のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれ、その1ライン目の2列目、4列目、6列目、8列目、・・・,2ライン目の1列目、3列目、5列目、7列目、・・・の画素(同図(B)に○印で示す)が第2のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれる。以下、同様にして、偶数フレームについても、第1または第2のビット間引き画素それぞれが、空間方向に、五の目格子状に並ぶように、各画素のレベル方向のビット間引きが行われる。
【0032】
この場合、ある1ラインまたは1列に注目すれば、例えば、図5に示すように、第1フレームについては、その注目ラインまたは注目列を構成する2番目,4番目,6番目,8番目,・・・の画素(同図において●印で示す)が第1のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれ、第2フレームについては、注目ラインまたは注目列を構成する1番目,3番目,5番目,7番目,・・・の画素(同図において●印で示す)が第1のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれる。そして、第3フレームについては、再び、注目ラインまたは注目列を構成する2番目,4番目,6番目,8番目,・・・の画素(同図において●印で示す)が第1のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれる
【0033】
さらに、第1フレームについては、その注目ラインまたは注目列を構成する1番目,3番目,5番目,7番目,・・・の画素(同図において○印で示す)が第2のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれ、第2フレームについては、注目ラインまたは注目列を構成する2番目,4番目,6番目,8番目,・・・の画素(同図において○印で示す)が第2のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれる。そして、第3フレームについては、再び、注目ラインまたは注目列を構成する1番目,3番目,5番目,7番目,・・・の画素(同図において○印で示す)が第2のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれる。
【0034】
以下、同様にして、ビット間引きが行われることにより、レベル方向ビットサブサンプリング回路2では、時間方向にも、第1または第2のビット間引き画素それぞれが、五の目格子状に並ぶように、各画素のレベル方向のビット間引きが行われる。
【0035】
全画素動画像の各フレームについて、以上のように、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に、五の目格子状に並ぶように、各画素のレベル方向のビット間引き(以下、適宜、空間/時間五の目レベル方向ビット間引きという)が行われることにより、空間方向および時間方向のいずれの方向にも、第1のビット間引き画素(画素データ)と第2のビット間引き画素(画素データ)が交互(1つおき)に存在するようになる。従って、空間/時間五の目レベル方向ビット間引き後の情報量は、単純には、従来技術のインターレース間引きを行った場合と同様に、元の情報量の1/2になる。
【0036】
空間/時間五の目レベル方向ビット間引きは、このように情報量を低減することができる。さらに、間引き後の画素数自体は、元の画素数と変わらないから、水平方向、垂直方向、および斜め方向のいずれの解像度も維持することができ、その結果、これらのいずれの方向の速い変化をも表現することが可能となり、そのような動きがある場合の画質の劣化を低減(防止)することが可能となる。従って、空間/時間五の目レベル方向ビット間引きによれば、ディジタル画像データについて、いわば均一な間引きを実現できる。
【0037】
図1に戻り、レベル方向ビットサブサンプリング回路2において、空間/時間五の目レベル方向ビット間引きが施されることにより得られるビット間引き画像データは、エンコーダ3に供給される。エンコーダ3では、レベル方向ビットサブサンプリング回路2からのビット間引き画像データ(第1のビット間引き画素と第2のビット間引き画素で構成される画像データ)が高能率符号化される。ここで、高能率符号化方式としては、例えば、DCT(Discrete Cosine Transform)などの直交変換と動き補償を組み合わせたハイブリッド方式、DCTと量子化を組み合わせたハイブリッド方式、ADRC(Adaptive Dynamic Range Coding)などを用いることが可能である。なお、ADRCについては、例えば、本出願人が先に出願している特開昭61-144989号公報などに、その詳細が記載されている。なお、場合によっては(例えば、伝送路6の容量が充分大きい場合など)、このエンコーダ3は省略することが可能である。
【0038】
エンコーダ3において、ビット間引き画像データが高能率符号化されることにより得られる符号化データは、送信処理回路4に供給される。送信処理回路4では、エンコーダ3からの符号化データに対して、例えば、エラー訂正、パケット化、チャネル符号化などの必要な信号処理が施され、その結果得られる伝送データが、出力端子5を介して出力される。この伝送データは、所定の伝送路6を介して送信される。なお、伝送路6には、例えば、衛星回線や、地上波、CATV網、公衆網、インターネットなどの通信回線の他、例えば、磁気記録/再生のプロセス、さらには、磁気ディスク、光ディスク、磁気テープ、光磁気ディスク、相変化ディスクその他の記録媒体も含まれる。
【0039】
伝送路6からの伝送データは、受信装置200の入力端子7を介して、受信処理回路8で受信される。受信処理回路8では、伝送データに対して、チャネル復号化、アンパケット化、エラー訂正などの必要な信号処理が施され、その結果得られる符号化データが、送信装置のエンコーダ3に対応するデコーダ9に供給される。デコーダ9では、その符号化データがエンコーダ3の符号化処理に対応する復号処理によりデコードされ、第1のビット間引き画素と第2のビット間引き画素で構成されるビット間引き画像データとされ、クラスタップ/予測タップ切り出し回路11に供給される。
【0040】
クラスタップ/予測タップ切り出し回路11は、例えば、図6に示すように、4ビットにレベル方向のビット間引きが施された所定のビット間引き画素(画素データ)x’を注目画素(注目ビット間引き画素)としたとき、その注目ビット間引き画素x’と、その空間方向の上下左右に隣接する4つのビット間引き画素(画素データ)a,b,c,dとを後述するクラスタリング回路12でクラスを決定するのに用いる画素(以下、適宜、クラスタップという)として切り出すとともに、後述する画素データ生成回路14で注目ビット間引き画素x’を元の8ビットの画素データxに復元するのに用いる画素(以下、予測タップという)として切り出す。この切り出されたクラスタップまたは予測タップは、クラスタリング回路12または画素データ生成回路14にそれぞれ供給される。なお、ここでは、ある注目ビット間引き画素について、クラスタップと予測タップを同一のビット間引き画素から構成することとしたが、異なるビット間引き画素から構成することも可能である。クラスタップ/予測タップ切り出し回路11は、すべてのビット間引き画素(つまり、第1のビット間引き画素(画素データ)及び第2のビット間引き画素(画素データ))について、その上下左右に隣接するビット間引き画素でなるクラスタップまたは予測タップを構成し、クラスタリング回路12または画素データ生成回路14に、それぞれ供給する。
【0041】
クラスタリング回路12は、クラスタップ/予測タップ切り出し回路11からのクラスタップを受け取り、そのクラスタップを構成する4ビットのビット間引き画素の性質に応じてクラスタリングを行い、注目ビット間引き画素に対する所定のクラスを発生する。
【0042】
ここで、クラスタリングについて簡単に説明する。いま、例えば、図7(A)に示すように、2×2画素でなるクラスタップを考え、各画素が、1ビットで表現される(0または1のうちのいずれかのレベルをとる)ものとすると、この2×2の4画素のクラスタップは、各画素のレベル分布により、図7(B)に示すように、16(=(21)4)パターンにクラス分けすることができる。このようなクラス分けがクラスタリングであり、このような処理がクラスタリング回路12において行われる。なお、ここでは、説明の簡略化を考え、各画素を1ビットで表現した場合について説明したが、本実施の形態では、クラスタップを構成する各画素を、例えば2ビットで表現し、そのようなクラスタップを対象にクラスタリングが行われるようになされている。
【0043】
即ち、本実施の形態では、各画素(ビット間引き画素)には、4ビットが(その画素値を表現するために)割り当てられている。また、本実施の形態においては、上述したように、クラスタップは5画素(ビット間引き画素x’,a,b,c,d)で構成される。従って、このようなクラスタップを対象にクラスタリングを行ったのでは、(24)5という膨大な数のクラスが生じることになる。
【0044】
そこで、クラスタリング回路12は、図8に示すように、2ビットADRC回路16を有しており、この2ビットADRC回路16において、クラスタップに対して、2ビットADRC処理が施されるようになされている。これにより、クラスタップを構成する各画素(ビット間引き画素)のビット数を4ビットから2ビットに減少させ、クラス数を削減するようになされている。
【0045】
即ち、例えば、いま、説明を簡単にするため、図9(A)に示すように、直線上に並んだ4画素で構成されるクラスタップを考えると、ADRC処理においては、その画素値の最大値MAXと最小値MINが検出される。そして、DR=MAX−MINを、ブロックの局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、ブロックを構成する画素の画素値がKビットに再量子化される。
【0046】
即ち、ブロック内の各画素値から、最小値MINを減算し、その減算値をDR/2Kで除算する。そして、その結果得られる除算値に対応するコード(ADRCコード)に変換される。具体的には、2ビットADRC回路16では、K=2として、図9(B)に示すように、除算値が、ダイナミックレンジDRを4(=22)等分して得られるいずれの範囲に属するかが判定され、除算値が、例えば、最も下のレベルの範囲、下から2番目のレベルの範囲、下から3番目のレベルの範囲、または最も上のレベルの範囲に属する場合には、それぞれ、例えば、00B,01B,10B、または11Bなどの2ビットにコード化される(Bは2進数であることを表す)。
【0047】
なお、その復号は、ADRCコード00B,01B,10B、または11Bを、例えば、ダイナミックレンジDRを4等分して得られる最も下のレベルの範囲の中心値L00、下から2番目のレベルの範囲の中心値L01、下から3番目のレベルの範囲の中心値L10、または最も上のレベルの範囲の中心値L11に変換し、その値に、最小値MINを加算することで行うことができる。
【0048】
また、クラスタリングは、上述したように、クラスタップを構成する各画素(ビット間引き画素)のレベルそのものに基づいて行う他、例えば、クラスタップを構成する画素のレベルの傾向(例えば、すべての画素のレベルがほぼ揃っているとか、右にある画素のレベルが他の画素のレベルよりも高いまたは低いとかなど)など基づいて行うことも可能である。
【0049】
2ビットADRC回路16において、5画素のクラスタップに、2ビットADRC処理が施されることにより、5画素それぞれのビット数が2ビットにされたクラスタップが得られる。2ビットADRC回路16は、このビット数が2ビットの5画素の画素値を並べた10ビットのデータを、注目ビット間引き画素に対する仮のクラスとして出力する。
【0050】
クラスタリング回路12は、図8に示すように、2ビットADRC回路16の他、ビット付加回路17も有しており、2ビットADRC回路16が出力する10ビットの仮のクラスコードは、ビット付加回路17に供給される。
【0051】
ビット付加回路17は、2ビットADRC回路16からの仮のクラスコードに対して1ビットを付加し、最終的なクラスコードを生成する。即ち、ビット付加回路17は、クラスタップに対する注目ビット間引き画素が第1のビット間引き画素(画素データ)であるかもしくは第2のビット間引き画素(画素データ)であるかによって異なる1ビットを付加ビットとして仮のクラスコードに付加する。例えば、注目ビット間引き画素が第1のビット間引き画素(画素データ)である場合には、ビット“0”を、注目ビット間引き画素が第2のビット間引き画素(画素データ)である場合には、ビット“1”を付加する。そして、この1ビットが付加された合計11ビットが、注目ビット間引き画素に対する最終的なクラスとして、クラスタリング回路12から出力される。
【0052】
再び、図1に戻り、以上のようなクラスタリングにより得られた注目ビット間引き画素に対するクラス(クラスコード)は、メモリ13に対して、アドレスとして与えられる。メモリ13は、全画素動画像を構成する画素からレベル方向に対して空間/時間五の目レベル方向ビット間引きの施されたビット間引き画素(注目ビット間引き画素)x’に対応する元の画素xを予測するための予測データを、クラスごとに記憶しており、クラスタリング回路12からアドレスとしてのクラス(クラスコード)が与えられると、そのクラスに対応する予測データを読み出し、画素データ生成回路14に供給する。
【0053】
ここで、いまの場合、メモリ13においては、例えば、注目画素(注目ビット間引き画素)x’に対応する元の画素xを、その注目ビット間引き画素x’と、その上下左右に隣接するビット間引き画素(画素データ)a乃至d(図6)からなる予測タップを用いた線形一次式により予測するための、その線形一次式の係数(予測係数)のセットw1,w2,w3,w4,w5が、予測データとして記憶されている。従って、メモリ13から画素データ生成回路14には、注目ビット間引き画素のクラスに対応する係数のセットw1乃至w5が、予測データとして供給される。
【0054】
画素データ生成回路14は、予測データw1乃至w5を受信すると、その予測データである係数のセットw1乃至w5と、クラスタップ/予測タップ切り出し回路11から供給された予測タップを構成するビット間引き画素(画素データ)の画素値x’,a乃至dとを用いて、次の線形一次式を演算することにより、注目ビット間引き画素x’に対応する元の8ビットの画素(画素データ)xを生成(予測)する。
【0055】
x=w1a+w2b+w3c+w4d+w5x’
・・・(1)
【0056】
画素データ生成回路14で求められた8ビットの画素(画素データ)xは、出力端子15に供給されて順次出力される。この結果、出力端子15からは、元の全画素動画像を構成するフレームのデータが出力される。
【0057】
次に、クラス毎の予測データの生成について説明する。注目ビット間引き画素である4ビットのビット間引き画素x’から元の8ビットの画素(画素データ)xを求めるのに、式(1)の線形一次式を構成するための予測データである係数のセットw1,w2,w3,w4,w5は、学習により求められるようになされている。
【0058】
図10は、予測データである係数のセットw1乃至w5を求めるための学習を行う学習装置の一実施の形態の構成例を示している。
【0059】
学習では、学習用の全画素動画像が複数用意され、入力端子20には、その学習用の全画素動画像が、例えば、フレーム単位で入力される。ここで、学習用の全画素動画像は、予測データとして係数のセットw1乃至w5の作成を考慮した標準的なものであるのが望ましい。
【0060】
入力端子20に入力された全画素動画像の各フレームは、レベル方向ビットサンプリング回路21に供給されるとともに、タップ切り出し回路22に供給される。レベル方向ビットサンプリング回路21では、上述した図1に示されるレベル方向ビットサブサンプリング回路2と同様に、全画素動画像に対して空間/時間方向五の目レベル方向ビット間引きが施され、第1のビット間引き画素(画素データ)と第2のビット間引き画素(画素データ)でなるビット間引き画像データが生成される。このビット間引き画像データは、タップ切り出し回路22に供給される。
【0061】
タップ切り出し回路22は、入力端子20から供給された全画素動画像の各フレームを構成する画素から、図6に示した注目ビット間引き画素x’に対応する8ビットの画素xを教師画素(画素データ)として切り出すとともに、レベル方向ビットサブサンプリング回路21から供給されたビット間引き画像データから注目ビット間引き画素x’と、その上下左右に隣接する4つのビット間引き画素(画素データ)a乃至dをクラスタップ及び予測タップとして切り出す。そして、タップ切り出し回路22で切り出された5つのビット間引き画素(画素データ)x’,a乃至dからなるクラスタップはクラスタリング回路24に供給される。さらに、タップ切り出し回路22で切り出された5つのビット間引き画素(画素データ)x’,a乃至dからなる予測タップと8ビットの教師画素(画素データ)xはデータメモリ23の入力端子INに供給される。
【0062】
クラスタリング回路24は、図1のクラスタリング回路12と同様に、そこに供給されるクラスタップをADRC処理することによりクラスタリングする。さらに、その結果得られる仮のクラスコードに、注目ビット間引き画素が第1のビット間引き画素(画素データ)であるか、または第2のビット間引き画素(画素データ)であるかどうかを示す1ビットを付加し、それにより得られる最終的なクラスコードを注目ビット間引き画素のクラスとして、スイッチ25の端子25aに供給する。ここで、スイッチ25は、学習用の全画素動画像から得られるすべてのビット間引きについて、上述したクラスタリング処理及びデータメモリ23への供給処理が終了するまでは、端子25aを選択しており、従って、クラスタリング回路24が出力する注目ビット間引き画素に対するクラスは、スイッチ25を介して、データメモリ23のアドレス端子ADに供給される。
【0063】
データメモリ23は、そのアドレス端子ADに供給されるクラスに対応するアドレスに、その入力端子INに供給されるデータを記憶する。
【0064】
ここで、例えば、所定のクラスClassに分類される注目ビット間引き画素x1’,x2’,・・・,xn’について、その各注目ビット間引き画素x1’,x2’,・・・,xn’の位置に対応する、学習用の全画素動画像から得られる教師画素(画素データ)をx1,x2,・・・,xnとする。また、注目ビット間引き画素x1’の上下左右に隣接する予測タップを構成する4つのビット間引き画素(画素データ)をa1,b1,c1,d1と、注目ビット間引き画素x2’の上下左右に隣接する予測タップを構成する4つのビット間引き画素(画素データ)をa2,b2,c2,d2と、・・・、注目ビット間引き画素xn’の上下左右に隣接する予測タップを構成する4つのビット間引き画素(画素データ)をan,bn,cn,dnと、それぞれする。この場合、上述の処理により、メモリ23の、クラスClassに対応するアドレスには、教師画素(画素データ)x1,x2,・・・,xn,予測タップを構成するビット間引き画素(画素データ)a1,a2,・・・,an,b1,b2,・・・,bn,c1,c2,・・・,cn,d1,d2,・・・,dn,x1’,x2’,・・・,xn’が記憶される。
【0065】
学習用の全画素動画像から得られるすべての教師画素についてのクラスタリング処理及びデータメモリ23への記憶処理が終了すると、スイッチ25は端子25bを選択する。端子25bには、カウンタ26の出力が供給されるようになされており、カウンタ26は、所定のクロックCKをカウントすることにより、順次変化するアドレスを発生するようになされている。従って、カウンタ26が発生するアドレスは、スイッチ25を介して出力される。カウンタ26からスイッチ25を介して出力されるアドレスは、データメモリ23のアドレス端子ADと、メモリ28のアドレス端子ADとに供給される。
【0066】
データメモリ23においては、そのアドレス端子ADに供給される、カウンタ26からのアドレスにしたがって、そのアドレスに対応する記憶内容(教師画素(画素データ)と予測タップを構成する5つのビット間引き画素(画素データ))が読み出され、最小自乗法演算回路27に供給される。最小自乗法演算回路27では、データメモリ23から供給される教師画素(画素データ)と予測タップを構成するビット間引き画素(画素データ)に基づいて、方程式がたてられ、これが、例えば、最小自乗法によって解かれることにより、予測データとしての係数のセットw1乃至w5が求められる。
【0067】
即ち、上述のクラスClassに注目した場合、最小自乗法演算回路27では、データメモリ23の、クラスClassに対応するアドレスに記憶された教師画素(画素データ)x1,x2,・・・,xn、予測タップを構成する5つのビット間引き画素(画素データ)a1,a2,・・・,an,b1,b2,・・・,bn,c1,c2,・・・,cn,d1,d2,・・・,dn,x1’,x2’,・・・,xn’を用いて、式(1)に対応する、以下のような連立方程式がたてられる。
x1=w1a1+w2b1+w3c1+w4d1+w5x1’
x2=w1a2+w2b2+w3c2+w4d2+w5x2’
・
・
・
xn=w1an+w2bn+w3cn+w4dn+w5xn’
・・・(2)
【0068】
そして、最小自乗法演算回路27は、式(2)の連立方程式を、最小自乗法によって解くことにより、クラスClassについての予測データとしての係数のセットw1乃至w5を求める。他のクラスについての予測データとしての係数のセットも同様にして求められる。
【0069】
最小自乗法演算回路27で求められた予測データとしての係数のセットw1乃至w5は、メモリ28に供給される。従って、クラスClassについての予測データとしての係数のセットw1乃至w5は、メモリ23において、データx1,x2,・・・,xn,a1,a2,・・・,an,b1,b2,・・・,bn,c1,c2,・・・,cn,d1,d2,・・・,dn,x1’,x2’,・・・,xn’が記憶されていたアドレスと同一のメモリ28のアドレスに記憶される。他のクラスについての予測データとしての係数のセットも、同様にして、メモリ28に記憶される。
【0070】
図1のメモリ13には、以上のようにしてメモリ28に記憶された予測データとしての係数のセットが記憶されている。
【0071】
次に、図1のメモリ13には、予測データとして、式(1)に示した線形一次式を計算するための係数ではなく、8ビットの画素値そのものを記憶させておくようにすることができる。
【0072】
図11は、8ビットの画素値を予測データとしてメモリ13に記憶させる場合の、その予測データを求める学習装置の一実施の形態の構成例を示している。なお、図中、図10における場合と対応する部分については、同一の符号を付してある。
【0073】
入力端子20に入力された全画素動画像の各フレームは、レベル方向ビットサンプリング回路21に供給されるとともに、タップ切り出し回路22に供給される。レベル方向ビットサンプリング回路21では、上述した図1に示されるレベル方向ビットサブサンプリング回路と同様に、全画素動画像に対して空間/時間方向五の目レベル方向ビット間引きが施され、第1のビット間引き画素(画素データ)と第2のビット間引き画素(画素データ)でなるビット間引き画像データが生成される。このビット間引き画像データは、タップ切り出し回路22に供給される。
【0074】
タップ切り出し回路22は、入力端子20から供給された全画素動画像の各フレームを構成する画素から、図6に示した注目ビット間引き画素x’に対応する8ビットの画素xを教師画素(画素データ)として切り出すとともに、レベル方向ビットサブサンプリング回路21から供給されたビット間引き画像データから注目ビット間引き画素x’と、その上下左右に隣接する4つのビット間引き画素(画素データ)a乃至dをクラスタップとして切り出す。そして、タップ切り出し回路22は、その5つのビット間引き画素(画素データ)x’,a乃至dからなるクラスタップをクラスタリング回路24に供給するとともに、8ビットの教師画素(画素データ)xを演算器34に供給する。
【0075】
クラスタリング回路24は、図1のクラスタリング回路12と同様に、そこに供給されるクラスタップをクラスタリングし、その結果得られるクラスを、データメモリ30のアドレス端子ADと、度数メモリ31のアドレス端子ADとに供給する。ここで、データメモリ30および度数メモリ31は、学習を開始する前に、その記憶内容が0にクリアされるようになされている。
【0076】
度数メモリ31では、そのアドレス端子ADに、アドレスとしてのクラス(クラスコード)が供給されると、そのアドレスの記憶内容としての度数が読み出され、その出力端子OUTから出力される。度数メモリ31から出力された度数は、演算器32に供給され、1だけインクリメントされる。このインクリメント結果は、度数メモリ31の入力端子INに供給され、インクリメント前の度数が記憶されていたアドレスに記憶される(上書きされる)。
【0077】
一方、データメモリ30では、そのアドレス端子ADに、アドレスとしてのクラス(クラスコード)が供給されると、やはり、そのアドレスの記憶内容が読み出され、その出力端子OUTから出力される。データメモリ30の出力は、演算器33に供給される。演算器33には、さらに、度数メモリ31が出力する度数も供給されており、そこでは、この度数と、データメモリ30の出力とが乗算される。この乗算結果は、演算器34に供給される。
【0078】
演算器34では、演算器33における乗算結果と、タップ切り出し回路22からの注目画素(8ビットの画素値)とが加算され、その加算値は、演算器35に供給される。演算器35には、さらに、演算器32による度数のインクリメント結果も供給されており、そこでは、演算器34の加算結果を被除数とするとともに、加算器32のインクリメント結果を除数として、除算が行われる。この除算結果は、データメモリ30の入力端子INに供給され、クラスタリング回路24が出力するクラス(クラスコード)に対応するアドレスに記憶される(上書きされる)。
【0079】
図11の学習装置において、データメモリ30および度数メモリ31のあるアドレスadへのアクセスが最初に行われる場合には、タップ切り出し回路22から演算器34に供給される8ビットの教師画素(画素データ)x1がそのまま、データメモリ30のアドレスadに書き込まれ、また、度数メモリ31のアドレスadには、1が書き込まれる。その後、再度、アドレスadへのアクセスが行われ、このときにタップ切り出し回路22から演算器34に供給される8ビットの教師画素(画素データ)がx2であったとすると、演算器32の出力は2となり、また、演算器34の出力はx1+x2となるから、演算器35の出力は(x1+x2)/2となり、これが、データメモリ30のアドレスadに書き込まれる。そして、度数メモリ31のアドレスadには、演算器32の出力である2が書き込まれる。さらに、再び、アドレスadへのアクセスが行われ、このときにタップ切り出し回路22から演算器34に供給される8ビットの教師画素(画素データ)がx3であったとすると、同様の処理により、データメモリ30のアドレスadには、(x1+x2+x3)/3が書き込まれ、度数メモリ31のアドレスadには、3が書き込まれる。
【0080】
以上のようにして、データメモリ30には、各クラスに分類されるビット間引き画素に対応する教師画素(画素データ)の8ビットの画素値の平均値が記憶される。
【0081】
なお、図1のメモリ13に、データメモリ30に記憶された8ビットの画素値を、予測データとして記憶させる場合には、その予測データとしての8ビットの画素値を、メモリ13から読み出して出力することが8ビットの画素を予測することになるから、画素データ生成回路14は設ける必要がなく、さらに、クラスタップ/予測タップ切り出し回路11でも予測タップの生成、出力を行わずに済むようになる。
【0082】
ところで、上述の場合には、図1のクラスタップ/予測タップ切り出し回路11において、図6に示したように、ビット間引き画素(注目ビット間引き画素)x’と、その空間方向の上下左右に隣接する4つのビット間引き画素(画素データ)a,b,c,dで1つのクラスタップ及び予測タップを構成するようにしたが、クラスタップ及び予測タップは、注目ビット間引き画素としてのビット間引き画素x’の時間方向に隣接するビット間引き画素も含めて構成することが可能である。
【0083】
即ち、例えば、図12に示すように、第nフレームのある注目ビット間引き画素x’についてクラスタップ及び予測タップを構成する場合においては、注目ビット間引き画素x’、その同一フレーム内の上下左右に隣接する4つのビット間引き画素(画素データ)a,b,c,d、並びに第n−1フレームの、注目ビット間引き画素x’と同一位置にあるビット間引き画素(画素データ)e、および第n+1フレームの、注目ビット間引き画素x’と同一位置にあるビット間引き画素(画素データ)fの合計7つのビット間引き画素(画素データ)などでクラスタップ及び予測タップを構成することが可能である。
【0084】
この場合、時間方向のビット間引き画素(画素データ)e,fをも考慮してクラスタリングや、式(1)の演算が行われるので、注目ビット間引き画素x’を、より元のものに近い画素xに復元することが可能となる。なお、この場合、学習時においても、同様にクラスタップを構成する必要がある。また、クラスタップは、注目ビット間引き画素x’の時間方向にある間引き後画素だけで構成することも可能である。
【0085】
次に、以上では、受信装置200において、学習を行うことにより得られた予測データを用いて、ビット間引き画素から元の8ビットの画素を予測するようにしたので、ビット間引き画素で構成される画像に含まれていない高周波成分も復元することができるが、ビット間引画素に対する元の画素の復元は、単純なビット補間によって行うことも可能である。
【0086】
図13は、そのような送受信システムの一実施の形態の構成例を示している。なお、図中、図1における場合と対応する部分については、同一の符号を付してある。即ち、この送受信システムは、クラスタップ/予測タップ切り出し回路11、クラスタリング回路12、メモリ13、および画素データ生成回路14に代えて、補間フィルタ40が設けられている他は、図1の送受信システムと同様に構成されている。
【0087】
補間フィルタ40は、デコーダ9からの注目ビット間引き画素(画素データ)の間引かれたビットを、その周辺にあるビット間引き画素(画素データ)を用いて補間して出力する。この場合、図1における場合のように、ビット間引き画素で構成される画像に含まれていない高周波成分を復元することはできないが、受信装置200の構成を簡単化することができる。
【0088】
以上、本発明を適用した送受信システムについて説明したが、このような送受信システムは、テレビジョン放送は勿論、画像を記録/再生する場合などにも用いることができる。
【0089】
なお、本実施の形態では、あるビット間引き画素に注目した場合において、クラスタリングで使用されるクラスタップに用いるビット間引き画素(画素データ)と、式(1)に示した線形一次式を計算するのに使用される予測タップに用いるビット間引き画素(画素データ)とを同一のものとしたが、これらは、同一である必要はなく、クラスタップと予測タップとには、それぞれ別々のビット間引き画素の集合を用いることができる。即ち、クラスタップを構成する画素と、予測タップを構成する画素とは、それぞれ、クラスタップ/予測タップ切り出し回路11に適応的に切り出させることができる。なお、予測タップ、クラスタップの切り出し方は、画像の空間的な特徴(アクティビティ)や動き等に応じて適応的に変えてもよい。
【0090】
また、本実施の形態においては、クラスタップや予測タップに、注目ビット間引き画素(画素データ)を含めるようにしたが、注目ビット間引き画素を含めないようにすることも可能である。この場合、クラス毎の予測データを生成する学習時においても同様に、クラスタップや予測タップに注目ビット間引き画素(画素データ)を含めないようにする必要がある。
【0091】
さらに、クラスタップとしてのビット間引き画素(画素データ)や、予測タップとしてのビット間引き画素(画素データ)は、注目ビット間引き画素に対して、空間的または時間的に隣接している必要はない。但し、注目ビット間引き画素の周辺にあるビット間引き画素(画素データ)を用いるのが望ましい。
【0092】
また、本実施の形態においては、動画像を構成する各フレームの8ビットの画素を4ビットの画素にビット間引きするようにしたが、本発明はこれに限らず、例えば、12ビットの画素を6ビットの画素にビット間引きしたり、12ビットの画素を8ビットや4ビットに間引いてもよい。即ち、オリジナルの動画像や空間/時間五の目レベル方向ビット間引き後のビット間引き画像データの各画素のビット数は、特に限定されるものではない。
【0093】
さらに、本実施の形態においては、動画像データの画素の8ビットの画素値を、1ビットおきに間引き、4ビットの画素値とするようにしたが、本発明はこれに限らず、例えば、第1のビット間引き画素は、元の画素のレベル方向のMSBから3番目、4番目、5番目及び6番目のビットを間引き、MSBから1番目、2番目、7番目及び8番目のビットの4ビットの画素データから構成し、第2のビット間引き画素は、元の画素のレベル方向のMSBから1番目、2番目、7番目及び8番目(LSB)のビットを間引き、MSBから3番目、4番目、5番目及び6番目のビットの4ビットの画素データから構成してもよい。
【0094】
また、本実施の形態では、第1と第2のビット間引き画素それぞれを生成するのにあたって、元の画素から、それぞれ相補的な関係にあるビットを間引くようにしたが、即ち、第1のビット間引き画素は、元の画素のMSBから偶数番目のビットを間引くことによって、第2のビット間引き画素は、元の画素のMSBから奇数番目のビットを間引くことによって、それぞれ生成するようにしたが、第1または第2のビット間引き画素それぞれを生成するにあたっては、元の画素から、一部重複するビットを間引くようにすることも可能である。
【0095】
さらに、本実施の形態においては、予測タップとして5ビットのビット間引き画素データを用い、係数との線形一時結合により元の画素データを復元することとしたが、その他、例えば、4ビットのビット間引き画素データを一時的に8ビットの画素データに変換し、その8ビットの画素データと係数とを用いた線形一時結合により元の画素データを復元してもよい。4ビットのビット間引き画素を、一時的に8ビットの画素に変換する方法としては、例えば、間引かれたビット位置に、一時的にビット“0”または“1”を補間して、8ビットの画素データにする方法がある。この場合、クラス毎の予測データとしての係数のセットを生成する学習時においても同様に、4ビットのビット間引き画素データから8ビットの画素データに一時的に変換したものを用いる必要がある。
【0096】
【発明の効果】
請求項1に記載の画像処理装置および請求項3に記載の画像処理方法によれば、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きが施される。従って、動画像の水平、垂直、および斜め方向の解像度を維持しながら、その情報量を低減することが可能となる。
【0098】
請求項4に記載の画像処理装置によれば、動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施すことにより得られる所定のビットが間引かれた画素である第1のビット間引き画素と、所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなる間引き画像データであって、第1または第2のビット間引き画素が、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことにより得られる間引き画像データを構成する第1および第2のビット間引き画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより一方の画素の元の画素値を復元する、または一方の画素の元の画素値を予測するのに用いられるデータである予測データと、他方の画素の画素値との積和演算によって、一方の画素の元の画素値が復元される。従って、画質の劣化の少ない画像を得ることが可能となる。
【図面の簡単な説明】
【図1】本発明を適用した送受信システムの第1実施の形態の構成例を示すブロック図である。
【図2】図1のレベル方向ビットサブサンプリング回路2の処理を説明するための図である。
【図3】図1のレベル方向ビットサブサンプリング回路2の処理を説明するための図である。
【図4】図1のレベル方向ビットサブサンプリング回路2の処理を説明するための図である。
【図5】図1のレベル方向ビットサブサンプリング回路2の処理を説明するための図である。
【図6】図1のクラスタップ/予測タップ切り出し回路11の処理を説明するための図である。
【図7】図1のクラスタリング回路12の処理を説明するための図である。
【図8】図1のクラスタリング回路12の構成例を示す図である。
【図9】ADRCを説明するための図である。
【図10】予測用データを求める学習装置の第1実施の形態の構成例を示すブロック図である。
【図11】予測用データを求める学習装置の第2実施の形態の構成例を示すブロック図である。
【図12】図1のクラスタップ/予測タップ切り出し回路11の他の処理を説明するための図である。
【図13】本発明を適用した送受信システムの第2実施の形態の構成例を示すブロック図である。
【図14】インターレース間引きがされる前の画像を示す図である。
【図15】インターレース間引きがされる後の画像を示す図である。
【符号の説明】
1 入力端子, 2 レベル方向ビットサブサンプリング回路, 3 エンコーダ, 4 送信処理装置, 5 出力端子, 6 伝送路, 7 入力端子,8 受信処理回路, 9 デコーダ, 11 クラスタップ/予測タップ切り出し回路, 12 クラスタリング回路, 13 メモリ, 14 画素データ生成回路, 15 出力端子, 20 入力端子, 21 レベル方向サブサンプリング回路, 22 タップ切り出し回路, 23 データメリ, 24 クラスタリング回路, 25 スイッチ, 25a,25b 端子, 26 カウンタ, 27 最小自乗法演算回路, 28 メモリ, 30 データメモリ, 31 度数メモリ, 32乃至35 演算器, 40 補間フィルタ, 100 送信装置, 200 受信装置[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus and an image processing method. Law In particular, an image processing apparatus and an image processing method capable of reducing deterioration in image quality and the like of moving images Law About.
[0002]
[Prior art]
Conventionally, interlaced scanning is one of scanning methods for displaying moving images.
[0003]
That is, for example, when an image is taken with a video camera or the like, as shown in FIG. 14, pixels (same as the pixels) of the same arrangement as the pixels of a photoelectric conversion element such as a built-in CCD (Charge Coupled Device), It is ideal in terms of image quality, resolution, etc. that each frame is configured and transmitted and recorded by (indicated by circles in the figure).
[0004]
However, this increases the amount of information to be transmitted and recorded. Therefore, in order to reduce the amount of information, as shown in FIG. 15, the first screen (field in the case of interlaced scanning) is obtained by thinning out odd-numbered pixels (indicated by ● in the figure) to obtain even-numbered pixels. The next screen is composed of only even-line pixels (indicated by a circle in the figure) by thinning out even-line pixels (indicated by a circle in the figure). The next screen is configured in the same manner as the first screen, and the screen is configured in the same manner.
[0005]
Here, since the interlaced scanning can be considered as one of the methods for thinning out pixels for reducing the information amount as described above, such a thinning-out method is hereinafter referred to as interlaced thinning as appropriate.
[0006]
[Problems to be solved by the invention]
Incidentally, the vertical resolution of an image depends on the number of lines. Therefore, when interlace decimation is performed, the vertical resolution of the image after decimation is ½ of the vertical resolution of the image before decimation. As a result, it is difficult to express a fast change in the vertical direction, and there is a problem that image quality deteriorates when there is such a movement.
[0007]
The present invention has been made in view of such circumstances, and is intended to reduce image quality degradation due to bit thinning in the level direction of a pixel (pixel data).
[0008]
[Means for Solving the Problems]
The image processing apparatus according to
[0009]
[0012]
[0013]
2. The image processing apparatus according to
[0014]
[0017]
[0018]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below, but before that, in order to clarify the correspondence between the respective means of the invention described in the claims and the following embodiments, after each means, A corresponding embodiment (however, an example) is added in parentheses to describe the characteristics of the present invention, and the following is obtained.
[0019]
That is, the image processing apparatus according to claim 1 restores image data constituting a moving image. processing In an image processing apparatus that compresses while suppressing deterioration of image quality at the time, bits are thinned out in the level direction for pixels of each frame constituting a moving image, and predetermined bits are thinned out. Is a pixel Bit thinning means (for example, a level shown in FIG. 1) for generating bit thinned image data composed of a first bit thinned pixel and a second bit thinned pixel that is a pixel from which a bit different from a predetermined bit is thinned. Direction
[0020]
[0021]
[0022]
[0023]
[0024]
Of course, this description does not mean that the respective means are limited to those described above.
[0025]
FIG. 1 shows an embodiment of a transmission / reception system to which the present invention is applied (a system is a logical collection of a plurality of devices, regardless of whether or not each component device is in the same casing). The example of a structure of the form is shown.
[0026]
This transmission / reception system includes a transmission device 100 and a
[0027]
That is, for example, the transmission apparatus 100 captures a moving image (hereinafter, referred to as “video”), which is captured by a video camera (not shown), and each frame is composed of pixels arranged in the same manner as pixels included in a photoelectric conversion element such as a built-in CCD. Digital image data of all pixel moving images is supplied as appropriate. Here, such an all-pixel moving image is a so-called progressive camera (a video camera that scans all the pixels on the photoelectric conversion element in a so-called raster scan order and outputs them as a one-frame image signal) or an all-pixel camera ( The signal in all the pixels on the photoelectric conversion element can be obtained by a video camera that outputs the image signal as one frame at a time.
[0028]
This digital image data is supplied to the level direction bit
[0029]
Here, in FIG. 2 (the same applies to FIGS. 3 to 6 and FIG. 12 described later), both the ● mark and the ○ mark indicate the pixels (pixel data) of the frame constituting the all-pixel moving image. Then, as shown in FIG. 3A, the level direction bit
[0030]
Therefore, in the level direction bit
[0031]
For the second frame, for example, as shown in FIG. 4B, the first, third, fifth, seventh,... The pixels in the 4th, 4th, 6th, 8th,... Columns (indicated by the ● marks in FIG. 5B) are configured as the first bit thinned pixels (pixel data). Of the 8 bits of each pixel data, 4 bits are thinned out, and the second, fourth, sixth, eighth,...,. The pixels in the fifth column, the seventh column, the seventh column,... (Shown by circles in FIG. 5B) are configured as second bit thinned pixels (pixel data). Of the 8 bits, 4 bits are skipped. Similarly, for even frames, bit thinning is performed in the level direction of each pixel so that the first or second bit thinned pixels are arranged in a grid pattern in the spatial direction.
[0032]
In this case, if attention is paid to a certain line or column, for example, as shown in FIG. 5, for the first frame, the second, fourth, sixth, eighth, .. (Indicated by a black circle in the figure) is configured as a first bit-thinned pixel (pixel data), 4 bits of the 8 bits of each pixel data are thinned, and the second As for the frame, the first, third, fifth, seventh,... Pixels (indicated by ● in the figure) constituting the target line or target column are the first bit thinned pixels (pixel data). As configured, 4 bits out of 8 bits of each pixel data are thinned out. Then, with respect to the third frame, the second, fourth, sixth, eighth,... Pixels (indicated by the mark ● in the figure) constituting the target line or target column are again reduced to the first bit. 4 bits out of 8 bits of each pixel data are thinned out so as to be configured as a pixel (pixel data).
[0033]
Further, for the first frame, the first, third, fifth, seventh,... Pixels (indicated by circles in the figure) constituting the target line or target column are the second bit thinned pixels. 4 bits out of 8 bits of each pixel data are thinned out so as to be configured as (pixel data), and for the second frame, the second, fourth, sixth, 4 bits out of 8 bits of each pixel data are thinned out so that the eighth,... Pixel (indicated by a circle in the figure) is configured as a second bit thinned pixel (pixel data). . For the third frame, the first, third, fifth, seventh,... Pixels (indicated by a circle in the figure) constituting the target line or target column are again thinned by the second bit. Of the 8 bits of each pixel data, 4 bits are thinned out so as to be configured as pixels (pixel data).
[0034]
Hereinafter, in the same manner, by performing bit thinning, in the level direction bit
[0035]
For each frame of all pixel moving images, as described above, the level direction of each pixel is such that the first or second bit-thinned pixels are arranged in a five-point grid in both the spatial direction and the temporal direction. Bit thinning (hereinafter referred to as space / time fifth eye level direction bit thinning as appropriate), the first bit thinned pixel (pixel data) and the first bit thinned in both the spatial direction and the temporal direction. Two bit-thinned pixels (pixel data) are present alternately (every other). Therefore, the information amount after the space / time fifth eye level direction bit decimation is simply ½ of the original information amount as in the case of the interlace decimation in the prior art.
[0036]
Space / time fifth eye level direction bit decimation can thus reduce the amount of information. Furthermore, since the number of pixels after thinning is not different from the original number of pixels, it is possible to maintain any resolution in the horizontal direction, the vertical direction, and the diagonal direction, and as a result, fast change in any of these directions. Can also be expressed, and it is possible to reduce (prevent) degradation of image quality when there is such movement. Therefore, according to space / time fifth eye level direction bit thinning, so-called uniform thinning can be realized for digital image data.
[0037]
Returning to FIG. 1, the bit direction thinned image data obtained by performing the space level / time fifth level direction bit thinning in the level direction bit
[0038]
In the
[0039]
Transmission data from the
[0040]
For example, as illustrated in FIG. 6, the class tap / predictive
[0041]
The
[0042]
Here, the clustering will be briefly described. Now, for example, as shown in FIG. 7A, a class tap composed of 2 × 2 pixels is considered, and each pixel is represented by 1 bit (takes a level of 0 or 1). Then, as shown in FIG. 7B, the class tap of 2 × 2 4 pixels is 16 (= (2 1 ) Four ) Can be classified into patterns. Such classification is clustering, and such processing is performed in the
[0043]
That is, in this embodiment, 4 bits are allocated to each pixel (bit thinned pixel) (in order to express the pixel value). In the present embodiment, as described above, the class tap is composed of five pixels (bit thinned pixels x ′, a, b, c, d). Therefore, when clustering is performed for such class taps, (2 Four ) Five A huge number of classes will be generated.
[0044]
Therefore, the
[0045]
That is, for example, for the sake of simplicity, as shown in FIG. 9A, when a class tap composed of four pixels arranged on a straight line is considered, in ADRC processing, the maximum pixel value is A value MAX and a minimum value MIN are detected. Then, DR = MAX−MIN is set as the local dynamic range of the block, and the pixel values of the pixels constituting the block are requantized to K bits based on the dynamic range DR.
[0046]
That is, the minimum value MIN is subtracted from each pixel value in the block, and the subtracted value is converted into DR / 2. K Divide by. Then, it is converted into a code (ADRC code) corresponding to the division value obtained as a result. Specifically, in the 2-
[0047]
The decoding is performed by dividing the ADRC code 00B, 01B, 10B, or 11B, for example, by dividing the dynamic range DR into four equal parts, the center value L00 of the lowest level range, and the second level range from the bottom. Is converted to the center value L10 of the range of the third level from the bottom, or the center value L11 of the range of the uppermost level, and the minimum value MIN is added to that value.
[0048]
Further, as described above, the clustering is performed based on the level of each pixel (bit thinned pixel) constituting the class tap as described above. For example, the tendency of the level of the pixel constituting the class tap (for example, all the pixels) It is also possible to perform the determination based on whether the levels are almost the same or the level of the pixel on the right is higher or lower than the level of other pixels.
[0049]
In the 2-
[0050]
As shown in FIG. 8, the
[0051]
The
[0052]
Returning to FIG. 1 again, the class (class code) for the target bit thinned pixel obtained by the clustering as described above is given to the
[0053]
Here, in this case, in the
[0054]
The pixel
[0055]
x = w 1 a + w 2 b + w Three c + w Four d + w Five x '
... (1)
[0056]
The 8-bit pixel (pixel data) x obtained by the pixel
[0057]
Next, generation of prediction data for each class will be described. In order to obtain the original 8-bit pixel (pixel data) x from the 4-bit bit-thinned pixel x ′, which is the target bit-thinned pixel, the coefficient of prediction data for constructing the linear linear expression of Expression (1) Set w 1 , W 2 , W Three , W Four , W Five Is required by learning.
[0058]
FIG. 10 shows a coefficient set w which is prediction data. 1 Thru
[0059]
In learning, a plurality of learning all-pixel moving images are prepared, and the learning all-pixel moving images are input to the
[0060]
Each frame of the all-pixel moving image input to the
[0061]
The tap cut-
[0062]
Similar to the
[0063]
The
[0064]
Here, for example, a target bit thinning pixel x classified into a predetermined class Class 1 ', X 2 ', ..., x n For each pixel of interest, 1 ', X 2 ', ..., x n X represents the teacher pixel (pixel data) obtained from the learning all-pixel moving image corresponding to the position of x 1 , X 2 , ..., x n And In addition, the target bit thinning pixel x 1 4 bits thinned out pixels (pixel data) constituting prediction taps adjacent to the top, bottom, left and right of ' 1 , B 1 , C 1 , D 1 And the target bit thinning pixel x 2 4 bits thinned out pixels (pixel data) constituting prediction taps adjacent to the top, bottom, left and right of ' 2 , B 2 , C 2 , D 2 ..., The target bit thinning pixel x n 4 bits thinned out pixels (pixel data) constituting prediction taps adjacent to the top, bottom, left and right of ' n , B n , C n , D n And do each. In this case, the address corresponding to the class Class in the
[0065]
When the clustering process and the storage process in the
[0066]
In the
[0067]
That is, when attention is focused on the above-described class class, the least squares method
x 1 = W 1 a 1 + W 2 b 1 + W Three c 1 + W Four d 1 + W Five x 1 '
x 2 = W 1 a 2 + W 2 b 2 + W Three c 2 + W Four d 2 + W Five x 2 '
・
・
・
x n = W 1 a n + W 2 b n + W Three c n + W Four d n + W Five x n '
... (2)
[0068]
Then, the least square
[0069]
Coefficient set w as prediction data obtained by the least squares
[0070]
The
[0071]
Next, the
[0072]
FIG. 11 shows a configuration example of an embodiment of a learning device for obtaining prediction data when an 8-bit pixel value is stored in the
[0073]
Each frame of the all-pixel moving image input to the
[0074]
The tap cut-
[0075]
Similar to the
[0076]
In the
[0077]
On the other hand, in the
[0078]
In the
[0079]
In the learning apparatus shown in FIG. 11, when an address ad in the
[0080]
As described above, the
[0081]
When the 8-bit pixel value stored in the
[0082]
By the way, in the above case, in the class tap / predictive
[0083]
That is, for example, as shown in FIG. 12, in the case of configuring a class tap and a prediction tap for a target bit thinning pixel x ′ in the nth frame, the target bit thinning pixel x ′ is vertically and horizontally in the same frame. Four adjacent bit-thinned pixels (pixel data) a, b, c, d, and bit-thinned pixel (pixel data) e at the same position as the target bit-thinned pixel x ′ in the (n−1) th frame, and n + 1th A class tap and a prediction tap can be configured by a total of seven bit thinned pixels (pixel data) of bit thinned pixels (pixel data) f located in the same position as the target bit thinned pixel x ′ in the frame.
[0084]
In this case, since the clustering and the calculation of Expression (1) are performed in consideration of the bit-thinned pixels (pixel data) e and f in the time direction, the target bit-thinned pixel x ′ is a pixel closer to the original one. It is possible to restore to x. In this case, it is necessary to configure a class tap in the same manner during learning. Further, the class tap can also be configured by only the pixels after decimation in the time direction of the target bit decimation pixel x ′.
[0085]
Next, in the above, since the receiving
[0086]
FIG. 13 shows a configuration example of an embodiment of such a transmission / reception system. In the figure, parts corresponding to those in FIG. 1 are denoted by the same reference numerals. That is, this transmission / reception system is the same as the transmission / reception system of FIG. 1 except that an
[0087]
The
[0088]
The transmission / reception system to which the present invention is applied has been described above. However, such a transmission / reception system can be used not only for television broadcasting but also for recording / reproducing images.
[0089]
In this embodiment, when attention is paid to a certain bit-thinned pixel, the bit-thinned pixel (pixel data) used for the class tap used in clustering and the linear linear expression shown in Expression (1) are calculated. The bit-thinned pixels (pixel data) used for the prediction taps used in the above are the same, but they need not be the same. The class tap and the prediction tap have different bit-thinned pixels. Sets can be used. That is, the pixel constituting the class tap and the pixel constituting the prediction tap can be adaptively cut out by the class tap / prediction
[0090]
In the present embodiment, the target bit thinning pixel (pixel data) is included in the class tap or the prediction tap, but it is also possible not to include the target bit thinning pixel. In this case, it is also necessary to prevent the target bit thinning pixel (pixel data) from being included in the class tap or the prediction tap during learning for generating prediction data for each class.
[0091]
Furthermore, the bit-thinned pixel (pixel data) as the class tap and the bit-thinned pixel (pixel data) as the prediction tap need not be spatially or temporally adjacent to the target bit-thinned pixel. However, it is desirable to use a bit thinned pixel (pixel data) around the target bit thinned pixel.
[0092]
In the present embodiment, the 8-bit pixels of each frame constituting the moving image are thinned out to 4-bit pixels. However, the present invention is not limited to this, and for example, a 12-bit pixel is used. Bits may be thinned out to 6-bit pixels, or 12-bit pixels may be thinned out to 8 bits or 4 bits. That is, the number of bits of each pixel of the original moving image or the bit thinned image data after the space / time fifth eye level direction bit thinning is not particularly limited.
[0093]
Furthermore, in the present embodiment, the 8-bit pixel value of the pixel of the moving image data is thinned out every other bit to be a 4-bit pixel value. However, the present invention is not limited to this, for example, The first bit-thinned pixel thins out the third, fourth, fifth, and sixth bits from the MSB in the level direction of the original pixel, and 4th of the first, second, seventh, and eighth bits from the MSB. The second bit thinned pixel is composed of bit pixel data, and the first, second, seventh and eighth (LSB) bits are thinned from the MSB in the level direction of the original pixel, and the third, fourth, You may comprise from 4 bits pixel data of the 5th, 5th, and 6th bits.
[0094]
In the present embodiment, when generating the first and second bit thinned pixels, the complementary bits are thinned from the original pixels. That is, the first bit The decimation pixel is generated by decimation of even-numbered bits from the MSB of the original pixel, and the second bit decimation pixel is generated by decimation of odd-numbered bits from the MSB of the original pixel. In generating each of the first or second bit thinned pixels, it is possible to thin out partially overlapping bits from the original pixels.
[0095]
Furthermore, in this embodiment, 5-bit bit thinned pixel data is used as a prediction tap, and the original pixel data is restored by linear temporary combination with a coefficient. However, for example, 4-bit bit thinning is performed. The pixel data may be temporarily converted into 8-bit pixel data, and the original pixel data may be restored by linear temporary combination using the 8-bit pixel data and a coefficient. As a method for temporarily converting a 4-bit bit-thinned pixel into an 8-bit pixel, for example, the bit “0” or “1” is temporarily interpolated at the thinned-out bit position, and then 8-bit There is a method of making the pixel data. In this case, it is necessary to use data obtained by temporarily converting 4-bit bit-thinned pixel data into 8-bit pixel data in learning to generate a coefficient set as prediction data for each class.
[0096]
【The invention's effect】
An image processing apparatus according to
[0098]
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration example of a first embodiment of a transmission / reception system to which the present invention is applied.
FIG. 2 is a diagram for explaining processing of a level direction bit
3 is a diagram for explaining processing of a level direction bit
4 is a diagram for explaining processing of a level direction bit
5 is a diagram for explaining processing of a level direction bit
6 is a diagram for explaining processing of a class tap / predicted
7 is a diagram for explaining processing of the
FIG. 8 is a diagram illustrating a configuration example of the
FIG. 9 is a diagram for explaining ADRC;
FIG. 10 is a block diagram illustrating a configuration example of a first embodiment of a learning device for obtaining prediction data.
FIG. 11 is a block diagram illustrating a configuration example of a second embodiment of a learning device that obtains prediction data;
12 is a diagram for explaining another process of the class tap / predicted
FIG. 13 is a block diagram showing a configuration example of a second embodiment of a transmission / reception system to which the present invention is applied.
FIG. 14 is a diagram illustrating an image before interlace thinning is performed.
FIG. 15 is a diagram illustrating an image after interlace thinning is performed.
[Explanation of symbols]
1 input terminal, 2 level direction bit sub-sampling circuit, 3 encoder, 4 transmission processing device, 5 output terminal, 6 transmission path, 7 input terminal, 8 reception processing circuit, 9 decoder, 11 class tap / predictive tap cut-out circuit, 12 Clustering circuit, 13 memory, 14 pixel data generation circuit, 15 output terminal, 20 input terminal, 21 level direction sub-sampling circuit, 22 tap extraction circuit, 23 data merit, 24 clustering circuit, 25 switch, 25a, 25b terminal, 26 counter, 27 Least Squares Arithmetic Circuit, 28 Memory, 30 Data Memory, 31 Frequency Memory, 32 to 35 Calculator, 40 Interpolation Filter, 100 Transmitter, 200 Receiver
Claims (9)
動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施し、所定のビットが間引かれた画素である第1のビット間引き画素と、前記所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなるビット間引き画像データを生成するビット間引き手段と、
前記ビット間引き画像データを構成する前記第1および第2のビット間引き画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより前記一方の画素の元の画素値を復元する前記復元処理、または前記一方の画素の元の画素値を予測するのに用いられるデータである予測データと、前記他方の画素の画素値との積和演算によって、前記一方の画素の元の画素値を復元する前記復元処理によって、元の画像データに復元される前記ビット間引き画像データを出力する出力手段と
を備え、
前記ビット間引き手段は、前記第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施す
ことを特徴とする画像処理装置。In an image processing apparatus that compresses image data constituting a moving image while suppressing deterioration in image quality during restoration processing ,
Bits are thinned out in the level direction for pixels of each frame constituting a moving image, and a first bit thinned pixel that is a pixel from which a predetermined bit is thinned, and a bit different from the predetermined bit Bit thinning means for generating bit thinned image data composed of second thinned pixels which are thinned pixels;
For the first and second bit thinned pixels constituting the bit thinned image data, the one pixel is obtained by interpolating the bit thinned by one pixel using the pixel value of the other pixel. By the product-sum operation of the restoration process for restoring the original pixel value of the pixel, or prediction data that is data used to predict the original pixel value of the one pixel and the pixel value of the other pixel, Output means for outputting the bit-thinned image data restored to the original image data by the restoration processing for restoring the original pixel value of the one pixel ;
The image processing apparatus according to claim 1, wherein the bit thinning unit performs bit thinning so that the first or second bit thinning pixels are arranged in a five-mesh lattice pattern in both a spatial direction and a temporal direction.
ことを特徴とする請求項1に記載の画像処理装置。The bit decimation means generates the first bit decimation pixel by decimation of even-numbered or odd-numbered bits from the most significant bit of the level of the pixel, and decimation of the other bit to decipher the first bit. The image processing apparatus according to claim 1, wherein two bit-thinned pixels are generated.
動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施し、所定のビットが間引かれた画素である第1のビット間引き画素と、前記所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなるビット間引き画像データを生成するビット間引きステップと、
前記ビット間引き画像データを構成する前記第1および第2のビット間引き画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより前記一方の画素の元の画素値を復元する前記復元処理、または前記一方の画素の元の画素値を予測するのに用いられるデータである予測データと、前記他方の画素の画素値との積和演算によって、前記一方の画素の元の画素値を復元する前記復元処理によって、元の画像データに復元される前記ビット間引き画像データを出力する出力ステップと
を含み、
前記ビット間引きステップでは、前記第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施す
ことを特徴とする画像処理方法。In an image processing method for compressing image data constituting a moving image while suppressing deterioration in image quality during restoration processing ,
Bits are thinned out in the level direction for pixels of each frame constituting a moving image, and a first bit thinned pixel that is a pixel from which a predetermined bit is thinned, and a bit different from the predetermined bit A bit thinning step for generating bit thinned image data comprising a second bit thinned pixel that is a thinned pixel ;
For the first and second bit thinned pixels constituting the bit thinned image data, the one pixel is obtained by interpolating the bit thinned by one pixel using the pixel value of the other pixel. By the product-sum operation of the restoration process for restoring the original pixel value of the pixel, or prediction data that is data used to predict the original pixel value of the one pixel and the pixel value of the other pixel, An output step of outputting the bit-thinned image data restored to the original image data by the restoration processing for restoring the original pixel value of the one pixel ;
Including
In the bit thinning step, the first or second bit thinning pixel is subjected to bit thinning so that each of the first and second bit thinning pixels is arranged in a five-dimensional lattice pattern in both the spatial direction and the temporal direction.
動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施すことにより得られる所定のビットが間引かれた画素である第1のビット間引き画素と、前記所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなる前記ビット間引き画像データであって、前記第1または第2のビット間引き画素が、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことにより得られる前記ビット間引き画像データを受信する受信手段と、
前記ビット間引き画像データを構成する前記第1および第2のビット間引き画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより前記一方の画素の元の画素値を復元する、または前記一方の画素の元の画素値を予測するのに用いられるデータである予測データと、前記他方の画素の画素値との積和演算によって、前記一方の画素の元の画素値を復元する復元手段と
を備えることを特徴とする画像処理装置。In an image processing apparatus for decompressing bit-thinned image data generated by thinning out pixels of image data constituting a moving image,
The first bit thinned pixel, which is a pixel obtained by thinning a predetermined bit obtained by performing bit thinning in the level direction with respect to the pixel of each frame constituting the moving image, and the predetermined bit The bit-thinned image data comprising second bit-thinned pixels that are pixels from which different bits are thinned, wherein the first or second bit-thinned pixel has five bits in both the spatial direction and the time direction. Receiving means for receiving the bit-thinned image data obtained by performing bit-thinning so as to be arranged in a grid pattern;
For the first and second bit sampling pixel constituting the bit thinned image data, the one pixel by the bits are thinned out in one of its pixels is interpolated using the pixel values of other pixel The original pixel value of the one pixel is restored , or prediction data, which is data used to predict the original pixel value of the one pixel, and the pixel value of the other pixel are obtained by a product-sum operation. An image processing apparatus comprising: restoration means for restoring an original pixel value of a pixel .
ことを特徴とする請求項4に記載の画像処理装置。Each of the first bit thinned pixels is generated by thinning one of the even-numbered and odd-numbered bits from the most significant bit of the level of the pixel, and the second bit thinned pixel is the other The image processing apparatus according to claim 4 , wherein the image processing apparatus is generated by thinning out the bits.
前記ビット間引き画像データの所定の注目画素に対して、前記注目画素の周辺に位置する周辺画素に基づいて、前記注目画素の特徴を表す所定のクラスを決定する決定手段と、
前記決定手段が出力する前記クラスに対応するデータであって、かつ、ビット間引きが施される前の前記一方の画素の画素値を予測するのに用いられるデータである前記予測データと、前記他方の画素の画素値との前記積和演算によって、前記一方の画素である前記注目画素に対応するビット間引きが施される前の画素の画素値を予測し、その画素値を発生する発生手段と
を有する
ことを特徴とする請求項4又は5のうちのいずれかに記載の画像処理装置。The restoration means includes
Determining means for determining a predetermined class representing a feature of the target pixel based on peripheral pixels located around the target pixel with respect to the predetermined target pixel of the bit-thinned image data;
A data corresponding to the class in which the determining means outputs, and the prediction data is data used for predicting the pixel value of the one pixel before the bit thinning is performed, the other of by the product-sum operation between the pixel values of the pixels, and generating means for bit thinned corresponding to the pixel of interest the which is one pixel predicts the pixel value of the previous pixel to be subjected, to generate the pixel value the image processing apparatus according to any one of claims 4 or 5, characterized in that it has a.
学習用の動画像を構成する画像データを用いて、あらかじめ学習を行うことにより生成された前記クラスごとの所定の予測データを、前記クラスごとに記憶する記憶手段を有し、
前記決定手段が出力する前記クラスに対応する前記予測データを、前記記憶手段から読み出し、その読み出された予測データと、前記他方の画素の画素値との前記積和演算によって、前記注目画素に対応するビット間引きが施される前の画素の画素値を発生する
ことを特徴とする請求項6に記載の画像処理装置。The generating means includes
Using image data constituting a moving image for learning, and having a storage means for storing, for each class, predetermined prediction data for each class generated by performing learning in advance.
The prediction data corresponding to the class output by the determining unit is read from the storage unit, and the pixel-of-interest is calculated by the product-sum operation of the read prediction data and the pixel value of the other pixel. The image processing apparatus according to claim 6 , wherein a pixel value of a pixel before corresponding bit thinning is generated is generated.
前記発生手段は、前記決定手段が出力する前記クラスに対応する前記予測係数のセットを、前記記憶手段から読み出し、その読み出された予測係数のセットと、前記注目画素の周辺に位置する、前記ビット間引き画像データの複数の画素の画素値であって、かつ、前記他方の画素の画素値との前記積和演算によって、前記注目画素に対応するビット間引きが施される前の画素の画素値を算出する演算手段をさらに有する
ことを特徴とする請求項7に記載の画像処理装置。The storage means stores, as the prediction data, a set of predetermined prediction coefficients for each class used for the product-sum operation ,
The generation means reads the set of prediction coefficients corresponding to the class output by the determination means from the storage means, and is located around the read prediction coefficient set and the pixel of interest. Pixel values of a plurality of pixels of the bit-thinned image data , and the pixel values before the bit-thinning corresponding to the target pixel is performed by the product-sum operation with the pixel value of the other pixel The image processing apparatus according to claim 7 , further comprising a calculation unit that calculates the value.
ことを特徴とする請求項6に記載の画像処理装置。The determining means determines the class using a plurality of pixels of the bit-thinned image data located in either one or both of a spatial direction and a temporal direction with respect to the target pixel. The image processing apparatus according to claim 6 .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16785598A JP4123452B2 (en) | 1998-06-16 | 1998-06-16 | Image processing apparatus and image processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16785598A JP4123452B2 (en) | 1998-06-16 | 1998-06-16 | Image processing apparatus and image processing method |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2000004436A JP2000004436A (en) | 2000-01-07 |
JP2000004436A5 JP2000004436A5 (en) | 2005-09-02 |
JP4123452B2 true JP4123452B2 (en) | 2008-07-23 |
Family
ID=15857350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16785598A Expired - Fee Related JP4123452B2 (en) | 1998-06-16 | 1998-06-16 | Image processing apparatus and image processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4123452B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4633577B2 (en) * | 2005-08-24 | 2011-02-16 | 富士フイルム株式会社 | Data compression apparatus and data compression program |
-
1998
- 1998-06-16 JP JP16785598A patent/JP4123452B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000004436A (en) | 2000-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4126709B2 (en) | Image processing apparatus and image processing method | |
US5666164A (en) | Image signal converting apparatus | |
US5193003A (en) | Apparatus for decoding digital video data with small memory requirement | |
JPH07147681A (en) | Hierarchical coding/decoding device for digital image signal | |
JP3912627B2 (en) | Image coding apparatus, image coding method, and transmission method | |
US20110135009A1 (en) | Combined lossy and lossless video compression | |
JP3946781B2 (en) | Image information conversion apparatus and method | |
JPH0795591A (en) | Digital picture signal processing unit | |
JP3271095B2 (en) | High-efficiency encoder and decoder for digital image signal | |
JP4123452B2 (en) | Image processing apparatus and image processing method | |
KR980013427A (en) | Image Coding Apparatus, Image Coding Method, Image Decoding Method, Image Decoding Apparatus, Image Coding Method, Image Decoding Method, Image Decofing Apparatus, Image Data Transmitting Method and Recording Medium | |
JP3747970B2 (en) | Image encoding device, image encoding method, image decoding device, and image decoding method | |
JP3759538B2 (en) | Image signal processing method and image signal transmission apparatus | |
JP3870428B2 (en) | Image information conversion apparatus and method, and coefficient data generation apparatus and method | |
JP3723995B2 (en) | Image information conversion apparatus and method | |
JP3912558B2 (en) | Image encoding apparatus, image encoding method, and recording medium | |
JP3480015B2 (en) | Apparatus and method for generating image data | |
JP3480461B2 (en) | Digital image signal processing apparatus and processing method | |
JP3271109B2 (en) | Digital image signal processing apparatus and processing method | |
JPH0746548A (en) | Digital image signal processor | |
JP3988738B2 (en) | Image conversion apparatus and image conversion method | |
JPH0797754B2 (en) | Encoding transmission device | |
JP3907623B2 (en) | Video signal encoding / decoding device and encoding / decoding method | |
JP3831955B2 (en) | Class classification adaptive processing apparatus and method | |
JP4001143B2 (en) | Coefficient generation apparatus and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050309 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071030 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080321 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080411 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080424 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110516 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120516 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130516 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |