[go: up one dir, main page]

JP4123452B2 - Image processing apparatus and image processing method - Google Patents

Image processing apparatus and image processing method Download PDF

Info

Publication number
JP4123452B2
JP4123452B2 JP16785598A JP16785598A JP4123452B2 JP 4123452 B2 JP4123452 B2 JP 4123452B2 JP 16785598 A JP16785598 A JP 16785598A JP 16785598 A JP16785598 A JP 16785598A JP 4123452 B2 JP4123452 B2 JP 4123452B2
Authority
JP
Japan
Prior art keywords
pixel
bit
thinned
pixels
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP16785598A
Other languages
Japanese (ja)
Other versions
JP2000004436A (en
JP2000004436A5 (en
Inventor
哲二郎 近藤
智紀 奥脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP16785598A priority Critical patent/JP4123452B2/en
Publication of JP2000004436A publication Critical patent/JP2000004436A/en
Publication of JP2000004436A5 publication Critical patent/JP2000004436A5/ja
Application granted granted Critical
Publication of JP4123452B2 publication Critical patent/JP4123452B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Picture Signal Circuits (AREA)
  • Television Signal Processing For Recording (AREA)
  • Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理装置および画像処理方に関し、特に、動画像の画質等の劣化を低減することができるようにする画像処理装置および画像処理方に関する。
【0002】
【従来の技術】
従来より、動画像を表示するときの走査方法の1つとして、インターレース走査がある。
【0003】
即ち、例えば、ビデオカメラなどで画像を撮影した場合に、本来ならば、図14に示すように、その内蔵するCCD(Charge Coupled Device)などの光電変換素子が有する画素と同一配置の画素(同図において、○印で示す)で、各フレームを構成し、伝送や記録を行うのが、画質や解像度などの面からは理想的である。
【0004】
しかしながら、これでは、伝送や記録等する情報量が多くなる。そこで、情報量の低減のために、図15に示すように、最初の画面(インターレース走査では、フィールド)は、奇数ラインの画素(同図において●印で示す)を間引いて、偶数ラインの画素(同図において○印で示す)だけで構成され、次の画面は、偶数ラインの画素(同図において●印で示す)を間引いて、奇数ラインの画素(同図において○印で示す)だけで構成され、さらに次の画面は、最初の画面と同様に構成され、以下、同様にして、画面が構成される。
【0005】
ここで、インターレース走査は、上述したことから、情報量を低減するための画素を間引く手法の1つと考えることができるので、このような間引きの手法を、以下、適宜、インターレース間引きという。
【0006】
【発明が解決しようとする課題】
ところで、画像の垂直方向の解像度は、そのライン数に依存する。従って、インターレース間引きを行うと、その間引き後の画像の垂直方向の解像度は、間引き前の画像の垂直方向の解像度の1/2になる。その結果、垂直方向の速い変化を表現するのが困難となり、そのような動きがあると、画質が劣化する課題があった。
【0007】
本発明は、このような状況に鑑みてなされたものであり、画素(画素データ)のレベル方向におけるビット間引きによる画質の劣化を低減することができるようにするものである。
【0008】
【課題を解決するための手段】
請求項1に記載の画像処理装置は、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すビット間引き手段を備えることを特徴とする。
【0009】
請求項に記載の画像処理方法は、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことを特徴とする。
【0012】
請求項に記載の画像処理装置は、動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施すことにより得られる所定のビットが間引かれた画素である第1のビット間引き画素と、所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなる間引き画像データであって、第1または第2のビット間引き画素が、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことにより得られる間引き画像データを構成する第1および第2の画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより一方の画素の元の画素値を復元する、または一方の画素の元の画素値を予測するのに用いられるデータである予測データと、他方の画素の画素値との積和演算によって、一方の画素の元の画素値を復元する復元手段を備えることを特徴とする。
【0013】
請求項1に記載の画像処理装置においては、ビット間引き手段が、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すようになされている。
【0014】
請求項に記載の画像処理方法においては、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すようになされている。
【0017】
請求項に記載の画像処理装置においては、復元手段が、動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施すことにより得られる所定のビットが間引かれた画素である第1のビット間引き画素と、所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなる間引き画像データであって、第1または第2のビット間引き画素が、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことにより得られる間引き画像データを構成する第1および第2の画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより一方の画素の元の画素値を復元する、または一方の画素の元の画素値を予測するのに用いられるデータである予測データと、他方の画素の画素値との積和演算によって、一方の画素の元の画素値を復元するようになされている。
【0018】
【発明の実施の形態】
以下に、本発明の実施の形態を説明するが、その前に、特許請求の範囲に記載の発明の各手段と以下の実施の形態との対応関係を明らかにするために、各手段の後の括弧内に、対応する実施の形態(但し、一例)を付加して、本発明の特徴を記述すると、次のようになる。
【0019】
即ち、請求項1に記載の画像処理装置は、動画像を構成する画像データを、復元処理時の画質の劣化を抑制して圧縮する画像処理装置において、動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施し、所定のビットが間引かれた画素である第1のビット間引き画素と、所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなるビット間引き画像データを生成するビット間引き手段(例えば、図1に示すレベル方向ビットサブサンプリング回路2など)と、ビット間引き画像データを構成する第1および第2のビット間引き画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより一方の画素の元の画素値を復元する復元処理、または一方の画素の元の画素値を予測するのに用いられるデータである予測データと、他方の画素の画素値との積和演算によって、一方の画素の元の画素値を復元する復元処理によって、元の画像データに復元されるビット間引き画像データを出力する出力手段(例えば、図1に示す送信処理回路4など)とを備え、ビット間引き手段が、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことを特徴とする。
【0020】
請求項に記載の画像処理装置は、動画像を構成する画像データの画素を間引くことにより生成されたビット間引き画像データを伸張する画像処理装置において、動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施すことにより得られる所定のビットが間引かれた画素である第1のビット間引き画素と、所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなる間引き画像データであって、第1または第2のビット間引き画素が、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことにより得られるビット間引き画像データを受信する受信手段(例えば、図1に示す受信処理回路8など)と、ビット間引き画像データを構成する第1および第2のビット間引き画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより一方の画素の元の画素値を復元するまたは一方の画素の元の画素値を予測するのに用いられるデータである予測データと、他方の画素の画素値との積和演算によって、一方の画素の元の画素値を復元する復元手段(例えば、図1に示すクラスタップ/予測タップ切り出し回路11、クラスタリング回路12、メモリ13、および画素データ生成回路14など)とを備えることを特徴とする。
【0021】
請求項に記載の画像処理装置は、復元手段が、ビット間引き画像データの所定の注目画素に対して、注目画素の周辺に位置する周辺画素に基づいて、注目画素の特徴を表す所定のクラスを決定する決定手段(例えば、図1に示すクラスタリング回路12など)と、決定手段が出力するクラスに対応するデータであって、かつ、ビット間引きが施される前の一方の画素の画素を予測するのに用いられるデータである予測データと、他方の画素の画素値との積和演算によって一方の画素である注目画素に対応するビット間引きが施される前の画素の画素値を予測し、その画素を発生する発生手段(例えば、図1に示すメモリ13や画素データ生成回路14など)とを有することを特徴とする。
【0022】
請求項に記載の画像処理装置は、発生手段が、学習用の動画像を構成する画像データを用いて、あらかじめ学習を行うことにより生成されたクラスごとの所定の予測データを、クラスごとに記憶する記憶手段(例えば、図1に示すメモリ13など)を有し、決定手段が出力するクラスに対応する予測データを、記憶手段から読み出し、その読み出された予測データと、他方の画素の画素値との積和演算によって、注目画素に対応するビット間引きが施される前の画素の画素を発生することを特徴とする。
【0023】
請求項に記載の画像処理装置は、記憶手段が、予測データとして、積和演算に用いる、クラスごとの所定の予測係数のセットを記憶しており、発生手段が、決定手段が出力するクラスに対応する予測係数のセットを、記憶手段から読み出し、その読み出された予測係数のセットと、注目画素の周辺に位置する、ビット間引き画像データの複数の画素の画素値であって、かつ、他方の画素の画素値の積和演算によって、注目画素に対応するビット間引きが施される前の画素の画素を算出する演算手段(例えば、図1に示す画素データ生成回路14など)をさらに有することを特徴とする。
【0024】
なお、勿論この記載は、各手段を上記したものに限定することを意味するものではない。
【0025】
図1は、本発明を適用した送受信システム(システムとは、複数の装置が論理的に集合したものをいい、各構成の装置が同一筐体中にあるか否かは問わない)の一実施の形態の構成例を示している。
【0026】
この送受信システムは、送信装置100と受信装置200とで構成されている。そして、送信装置100は、入力端子1、レベル方向ビットサブサンプリング回路2、エンコーダ3、送信処理回路4、および出力端子5で構成され、画像の各画素(画素データ)のレベル方向の所定のビットを間引くことにより圧縮して送信するようになされており、受信装置200は、入力端子7、受信処理回路8、デコーダ9、クラスタップ/予測タップ切り出し回路11、クラスタリング回路12、メモリ13、画素データ生成回路14、および出力端子15で構成され、送信装置100からの圧縮された画像を伸張するようになされている。
【0027】
即ち、送信装置100には、例えば、図示せぬビデオカメラなどで撮影され、その内蔵するCCDなどの光電変換素子が有する画素と同一配置の画素で、各フレームが構成される動画像(以下、適宜、全画素動画像という)のディジタル画像データが供給される。ここで、このような全画素動画像は、いわゆるプログレッシブカメラ(光電変換素子上の画素すべてを、いわゆるラスタスキャン順に走査して、1フレームの画像信号として出力するビデオカメラ)や、全画素カメラ(光電変換素子上の画素すべてにおける信号を、一度に、1フレームの画像信号として出力するビデオカメラ)などによって得ることができる。
【0028】
このディジタル画像データは、入力端子1を介して、レベル方向ビットサブサンプリング回路2に供給される。レベル方向ビットサブサンプリング回路2に供給されるディジタル画像データとしての動画像を構成する各フレームの画素(画素データ)は、例えば8ビットで構成されており、レベル方向ビットサブサンプリング回路2では、その8ビットの各画素が、図2に示すように、空間方向および時間方向の両方向に、五の目格子状に、画素のレベル方向に対して異なるビット間引きにより間引かれることにより圧縮される。
【0029】
ここで、図2において(後述する図3乃至図6および図12においても同様)、●印および○印の両方が、全画素動画像を構成するフレームの画素(画素データ)を示している。そして、図3(A)に示されるように、レベル方向ビットサブサンプリング回路2は、そのうちの●印の8ビットの画素データについては、そのレベル方向のMSB(Most Significant Bit)から2番目、4番目、6番目及び8番目(LSB(Least Significant Bit))のビットを間引き、MSBから1番目、3番目、5番目及び7番目のビットから構成される4ビットの画素データ(以下、第1のビット間引き画素(画素データ)という)を構成する。また、レベル方向ビットサブサンプリング回路2は、○印の8ビットの画素データについては、そのレベル方向のMSBから1番目、3番目、5番目及び7番目のビットを間引き、MSBから2番目、4番目、6目及び8番目のビットから構成される4ビットの画素データ(以下、第2のビット間引き画素(画素データ)という)を構成する。
【0030】
従って、レベル方向ビットサブサンプリング回路2では、全画素動画像の第1フレームについては、例えば、図4(A)に示すように、その1ライン目の2列目、4列目、6列目、8列目、・・・,2ライン目の1列目、3列目、5列目、7列目、・・・の画素(同図(A)に●印で示す)が第1のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれ、また、その1ライン目の1列目、3列目、5列目、7列目、・・・,2ライン目の2列目、4列目、6列目、8列目、・・・の画素(同図(A)に○印で示す)が第2のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれる。以下、同様にして、奇数フレームについては、第1または第2のビット間引き画素それぞれが、空間方向に、五の目格子状に並ぶように、各画素のレベル方向に対してビット間引きが行われる。
【0031】
また、第2フレームについては、例えば、図4(B)に示すように、その1ライン目の1列目、3列目、5列目、7列目、・・・,2ライン目の2列目、4列目、6列目、8列目、・・・の画素(同図(B)に●印で示す)が第1のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれ、その1ライン目の2列目、4列目、6列目、8列目、・・・,2ライン目の1列目、3列目、5列目、7列目、・・・の画素(同図(B)に○印で示す)が第2のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれる。以下、同様にして、偶数フレームについても、第1または第2のビット間引き画素それぞれが、空間方向に、五の目格子状に並ぶように、各画素のレベル方向のビット間引きが行われる。
【0032】
この場合、ある1ラインまたは1列に注目すれば、例えば、図5に示すように、第1フレームについては、その注目ラインまたは注目列を構成する2番目,4番目,6番目,8番目,・・・の画素(同図において●印で示す)が第1のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれ、第2フレームについては、注目ラインまたは注目列を構成する1番目,3番目,5番目,7番目,・・・の画素(同図において●印で示す)が第1のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれる。そして、第3フレームについては、再び、注目ラインまたは注目列を構成する2番目,4番目,6番目,8番目,・・・の画素(同図において●印で示す)が第1のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれる
【0033】
さらに、第1フレームについては、その注目ラインまたは注目列を構成する1番目,3番目,5番目,7番目,・・・の画素(同図において○印で示す)が第2のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれ、第2フレームについては、注目ラインまたは注目列を構成する2番目,4番目,6番目,8番目,・・・の画素(同図において○印で示す)が第2のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれる。そして、第3フレームについては、再び、注目ラインまたは注目列を構成する1番目,3番目,5番目,7番目,・・・の画素(同図において○印で示す)が第2のビット間引き画素(画素データ)として構成されるように、各画素データの8ビットのうちの4ビットが間引かれる。
【0034】
以下、同様にして、ビット間引きが行われることにより、レベル方向ビットサブサンプリング回路2では、時間方向にも、第1または第2のビット間引き画素それぞれが、五の目格子状に並ぶように、各画素のレベル方向のビット間引きが行われる。
【0035】
全画素動画像の各フレームについて、以上のように、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に、五の目格子状に並ぶように、各画素のレベル方向のビット間引き(以下、適宜、空間/時間五の目レベル方向ビット間引きという)が行われることにより、空間方向および時間方向のいずれの方向にも、第1のビット間引き画素(画素データ)と第2のビット間引き画素(画素データ)が交互(1つおき)に存在するようになる。従って、空間/時間五の目レベル方向ビット間引き後の情報量は、単純には、従来技術のインターレース間引きを行った場合と同様に、元の情報量の1/2になる。
【0036】
空間/時間五の目レベル方向ビット間引きは、このように情報量を低減することができる。さらに、間引き後の画素数自体は、元の画素数と変わらないから、水平方向、垂直方向、および斜め方向のいずれの解像度も維持することができ、その結果、これらのいずれの方向の速い変化をも表現することが可能となり、そのような動きがある場合の画質の劣化を低減(防止)することが可能となる。従って、空間/時間五の目レベル方向ビット間引きによれば、ディジタル画像データについて、いわば均一な間引きを実現できる。
【0037】
図1に戻り、レベル方向ビットサブサンプリング回路2において、空間/時間五の目レベル方向ビット間引きが施されることにより得られるビット間引き画像データは、エンコーダ3に供給される。エンコーダ3では、レベル方向ビットサブサンプリング回路2からのビット間引き画像データ(第1のビット間引き画素と第2のビット間引き画素で構成される画像データ)が高能率符号化される。ここで、高能率符号化方式としては、例えば、DCT(Discrete Cosine Transform)などの直交変換と動き補償を組み合わせたハイブリッド方式、DCTと量子化を組み合わせたハイブリッド方式、ADRC(Adaptive Dynamic Range Coding)などを用いることが可能である。なお、ADRCについては、例えば、本出願人が先に出願している特開昭61-144989号公報などに、その詳細が記載されている。なお、場合によっては(例えば、伝送路6の容量が充分大きい場合など)、このエンコーダ3は省略することが可能である。
【0038】
エンコーダ3において、ビット間引き画像データが高能率符号化されることにより得られる符号化データは、送信処理回路4に供給される。送信処理回路4では、エンコーダ3からの符号化データに対して、例えば、エラー訂正、パケット化、チャネル符号化などの必要な信号処理が施され、その結果得られる伝送データが、出力端子5を介して出力される。この伝送データは、所定の伝送路6を介して送信される。なお、伝送路6には、例えば、衛星回線や、地上波、CATV網、公衆網、インターネットなどの通信回線の他、例えば、磁気記録/再生のプロセス、さらには、磁気ディスク、光ディスク、磁気テープ、光磁気ディスク、相変化ディスクその他の記録媒体も含まれる。
【0039】
伝送路6からの伝送データは、受信装置200の入力端子7を介して、受信処理回路8で受信される。受信処理回路8では、伝送データに対して、チャネル復号化、アンパケット化、エラー訂正などの必要な信号処理が施され、その結果得られる符号化データが、送信装置のエンコーダ3に対応するデコーダ9に供給される。デコーダ9では、その符号化データがエンコーダ3の符号化処理に対応する復号処理によりデコードされ、第1のビット間引き画素と第2のビット間引き画素で構成されるビット間引き画像データとされ、クラスタップ/予測タップ切り出し回路11に供給される。
【0040】
クラスタップ/予測タップ切り出し回路11は、例えば、図6に示すように、4ビットにレベル方向のビット間引きが施された所定のビット間引き画素(画素データ)x’を注目画素(注目ビット間引き画素)としたとき、その注目ビット間引き画素x’と、その空間方向の上下左右に隣接する4つのビット間引き画素(画素データ)a,b,c,dとを後述するクラスタリング回路12でクラスを決定するのに用いる画素(以下、適宜、クラスタップという)として切り出すとともに、後述する画素データ生成回路14で注目ビット間引き画素x’を元の8ビットの画素データxに復元するのに用いる画素(以下、予測タップという)として切り出す。この切り出されたクラスタップまたは予測タップは、クラスタリング回路12または画素データ生成回路14にそれぞれ供給される。なお、ここでは、ある注目ビット間引き画素について、クラスタップと予測タップを同一のビット間引き画素から構成することとしたが、異なるビット間引き画素から構成することも可能である。クラスタップ/予測タップ切り出し回路11は、すべてのビット間引き画素(つまり、第1のビット間引き画素(画素データ)及び第2のビット間引き画素(画素データ))について、その上下左右に隣接するビット間引き画素でなるクラスタップまたは予測タップを構成し、クラスタリング回路12または画素データ生成回路14に、それぞれ供給する。
【0041】
クラスタリング回路12は、クラスタップ/予測タップ切り出し回路11からのクラスタップを受け取り、そのクラスタップを構成する4ビットのビット間引き画素の性質に応じてクラスタリングを行い、注目ビット間引き画素に対する所定のクラスを発生する。
【0042】
ここで、クラスタリングについて簡単に説明する。いま、例えば、図7(A)に示すように、2×2画素でなるクラスタップを考え、各画素が、1ビットで表現される(0または1のうちのいずれかのレベルをとる)ものとすると、この2×2の4画素のクラスタップは、各画素のレベル分布により、図7(B)に示すように、16(=(214)パターンにクラス分けすることができる。このようなクラス分けがクラスタリングであり、このような処理がクラスタリング回路12において行われる。なお、ここでは、説明の簡略化を考え、各画素を1ビットで表現した場合について説明したが、本実施の形態では、クラスタップを構成する各画素を、例えば2ビットで表現し、そのようなクラスタップを対象にクラスタリングが行われるようになされている。
【0043】
即ち、本実施の形態では、各画素(ビット間引き画素)には、4ビットが(その画素値を表現するために)割り当てられている。また、本実施の形態においては、上述したように、クラスタップは5画素(ビット間引き画素x’,a,b,c,d)で構成される。従って、このようなクラスタップを対象にクラスタリングを行ったのでは、(245という膨大な数のクラスが生じることになる。
【0044】
そこで、クラスタリング回路12は、図8に示すように、2ビットADRC回路16を有しており、この2ビットADRC回路16において、クラスタップに対して、2ビットADRC処理が施されるようになされている。これにより、クラスタップを構成する各画素(ビット間引き画素)のビット数を4ビットから2ビットに減少させ、クラス数を削減するようになされている。
【0045】
即ち、例えば、いま、説明を簡単にするため、図9(A)に示すように、直線上に並んだ4画素で構成されるクラスタップを考えると、ADRC処理においては、その画素値の最大値MAXと最小値MINが検出される。そして、DR=MAX−MINを、ブロックの局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、ブロックを構成する画素の画素値がKビットに再量子化される。
【0046】
即ち、ブロック内の各画素値から、最小値MINを減算し、その減算値をDR/2Kで除算する。そして、その結果得られる除算値に対応するコード(ADRCコード)に変換される。具体的には、2ビットADRC回路16では、K=2として、図9(B)に示すように、除算値が、ダイナミックレンジDRを4(=22)等分して得られるいずれの範囲に属するかが判定され、除算値が、例えば、最も下のレベルの範囲、下から2番目のレベルの範囲、下から3番目のレベルの範囲、または最も上のレベルの範囲に属する場合には、それぞれ、例えば、00B,01B,10B、または11Bなどの2ビットにコード化される(Bは2進数であることを表す)。
【0047】
なお、その復号は、ADRCコード00B,01B,10B、または11Bを、例えば、ダイナミックレンジDRを4等分して得られる最も下のレベルの範囲の中心値L00、下から2番目のレベルの範囲の中心値L01、下から3番目のレベルの範囲の中心値L10、または最も上のレベルの範囲の中心値L11に変換し、その値に、最小値MINを加算することで行うことができる。
【0048】
また、クラスタリングは、上述したように、クラスタップを構成する各画素(ビット間引き画素)のレベルそのものに基づいて行う他、例えば、クラスタップを構成する画素のレベルの傾向(例えば、すべての画素のレベルがほぼ揃っているとか、右にある画素のレベルが他の画素のレベルよりも高いまたは低いとかなど)など基づいて行うことも可能である。
【0049】
2ビットADRC回路16において、5画素のクラスタップに、2ビットADRC処理が施されることにより、5画素それぞれのビット数が2ビットにされたクラスタップが得られる。2ビットADRC回路16は、このビット数が2ビットの5画素の画素値を並べた10ビットのデータを、注目ビット間引き画素に対する仮のクラスとして出力する。
【0050】
クラスタリング回路12は、図8に示すように、2ビットADRC回路16の他、ビット付加回路17も有しており、2ビットADRC回路16が出力する10ビットの仮のクラスコードは、ビット付加回路17に供給される。
【0051】
ビット付加回路17は、2ビットADRC回路16からの仮のクラスコードに対して1ビットを付加し、最終的なクラスコードを生成する。即ち、ビット付加回路17は、クラスタップに対する注目ビット間引き画素が第1のビット間引き画素(画素データ)であるかもしくは第2のビット間引き画素(画素データ)であるかによって異なる1ビットを付加ビットとして仮のクラスコードに付加する。例えば、注目ビット間引き画素が第1のビット間引き画素(画素データ)である場合には、ビット“0”を、注目ビット間引き画素が第2のビット間引き画素(画素データ)である場合には、ビット“1”を付加する。そして、この1ビットが付加された合計11ビットが、注目ビット間引き画素に対する最終的なクラスとして、クラスタリング回路12から出力される。
【0052】
再び、図1に戻り、以上のようなクラスタリングにより得られた注目ビット間引き画素に対するクラス(クラスコード)は、メモリ13に対して、アドレスとして与えられる。メモリ13は、全画素動画像を構成する画素からレベル方向に対して空間/時間五の目レベル方向ビット間引きの施されたビット間引き画素(注目ビット間引き画素)x’に対応する元の画素xを予測するための予測データを、クラスごとに記憶しており、クラスタリング回路12からアドレスとしてのクラス(クラスコード)が与えられると、そのクラスに対応する予測データを読み出し、画素データ生成回路14に供給する。
【0053】
ここで、いまの場合、メモリ13においては、例えば、注目画素(注目ビット間引き画素)x’に対応する元の画素xを、その注目ビット間引き画素x’と、その上下左右に隣接するビット間引き画素(画素データ)a乃至d(図6)からなる予測タップを用いた線形一次式により予測するための、その線形一次式の係数(予測係数)のセットw1,w2,w3,w4,w5が、予測データとして記憶されている。従って、メモリ13から画素データ生成回路14には、注目ビット間引き画素のクラスに対応する係数のセットw1乃至w5が、予測データとして供給される。
【0054】
画素データ生成回路14は、予測データw1乃至w5を受信すると、その予測データである係数のセットw1乃至w5と、クラスタップ/予測タップ切り出し回路11から供給された予測タップを構成するビット間引き画素(画素データ)の画素値x’,a乃至dとを用いて、次の線形一次式を演算することにより、注目ビット間引き画素x’に対応する元の8ビットの画素(画素データ)xを生成(予測)する。
【0055】
x=w1a+w2b+w3c+w4d+w5x’
・・・(1)
【0056】
画素データ生成回路14で求められた8ビットの画素(画素データ)xは、出力端子15に供給されて順次出力される。この結果、出力端子15からは、元の全画素動画像を構成するフレームのデータが出力される。
【0057】
次に、クラス毎の予測データの生成について説明する。注目ビット間引き画素である4ビットのビット間引き画素x’から元の8ビットの画素(画素データ)xを求めるのに、式(1)の線形一次式を構成するための予測データである係数のセットw1,w2,w3,w4,w5は、学習により求められるようになされている。
【0058】
図10は、予測データである係数のセットw1乃至w5を求めるための学習を行う学習装置の一実施の形態の構成例を示している。
【0059】
学習では、学習用の全画素動画像が複数用意され、入力端子20には、その学習用の全画素動画像が、例えば、フレーム単位で入力される。ここで、学習用の全画素動画像は、予測データとして係数のセットw1乃至w5の作成を考慮した標準的なものであるのが望ましい。
【0060】
入力端子20に入力された全画素動画像の各フレームは、レベル方向ビットサンプリング回路21に供給されるとともに、タップ切り出し回路22に供給される。レベル方向ビットサンプリング回路21では、上述した図1に示されるレベル方向ビットサブサンプリング回路2と同様に、全画素動画像に対して空間/時間方向五の目レベル方向ビット間引きが施され、第1のビット間引き画素(画素データ)と第2のビット間引き画素(画素データ)でなるビット間引き画像データが生成される。このビット間引き画像データは、タップ切り出し回路22に供給される。
【0061】
タップ切り出し回路22は、入力端子20から供給された全画素動画像の各フレームを構成する画素から、図6に示した注目ビット間引き画素x’に対応する8ビットの画素xを教師画素(画素データ)として切り出すとともに、レベル方向ビットサブサンプリング回路21から供給されたビット間引き画像データから注目ビット間引き画素x’と、その上下左右に隣接する4つのビット間引き画素(画素データ)a乃至dをクラスタップ及び予測タップとして切り出す。そして、タップ切り出し回路22で切り出された5つのビット間引き画素(画素データ)x’,a乃至dからなるクラスタップはクラスタリング回路24に供給される。さらに、タップ切り出し回路22で切り出された5つのビット間引き画素(画素データ)x’,a乃至dからなる予測タップと8ビットの教師画素(画素データ)xはデータメモリ23の入力端子INに供給される。
【0062】
クラスタリング回路24は、図1のクラスタリング回路12と同様に、そこに供給されるクラスタップをADRC処理することによりクラスタリングする。さらに、その結果得られる仮のクラスコードに、注目ビット間引き画素が第1のビット間引き画素(画素データ)であるか、または第2のビット間引き画素(画素データ)であるかどうかを示す1ビットを付加し、それにより得られる最終的なクラスコードを注目ビット間引き画素のクラスとして、スイッチ25の端子25aに供給する。ここで、スイッチ25は、学習用の全画素動画像から得られるすべてのビット間引きについて、上述したクラスタリング処理及びデータメモリ23への供給処理が終了するまでは、端子25aを選択しており、従って、クラスタリング回路24が出力する注目ビット間引き画素に対するクラスは、スイッチ25を介して、データメモリ23のアドレス端子ADに供給される。
【0063】
データメモリ23は、そのアドレス端子ADに供給されるクラスに対応するアドレスに、その入力端子INに供給されるデータを記憶する。
【0064】
ここで、例えば、所定のクラスClassに分類される注目ビット間引き画素x1’,x2’,・・・,xn’について、その各注目ビット間引き画素x1’,x2’,・・・,xn’の位置に対応する、学習用の全画素動画像から得られる教師画素(画素データ)をx1,x2,・・・,xnとする。また、注目ビット間引き画素x1’の上下左右に隣接する予測タップを構成する4つのビット間引き画素(画素データ)をa1,b1,c1,d1と、注目ビット間引き画素x2’の上下左右に隣接する予測タップを構成する4つのビット間引き画素(画素データ)をa2,b2,c2,d2と、・・・、注目ビット間引き画素xn’の上下左右に隣接する予測タップを構成する4つのビット間引き画素(画素データ)をan,bn,cn,dnと、それぞれする。この場合、上述の処理により、メモリ23の、クラスClassに対応するアドレスには、教師画素(画素データ)x1,x2,・・・,xn,予測タップを構成するビット間引き画素(画素データ)a1,a2,・・・,an,b1,b2,・・・,bn,c1,c2,・・・,cn,d1,d2,・・・,dn,x1’,x2’,・・・,xn’が記憶される。
【0065】
学習用の全画素動画像から得られるすべての教師画素についてのクラスタリング処理及びデータメモリ23への記憶処理が終了すると、スイッチ25は端子25bを選択する。端子25bには、カウンタ26の出力が供給されるようになされており、カウンタ26は、所定のクロックCKをカウントすることにより、順次変化するアドレスを発生するようになされている。従って、カウンタ26が発生するアドレスは、スイッチ25を介して出力される。カウンタ26からスイッチ25を介して出力されるアドレスは、データメモリ23のアドレス端子ADと、メモリ28のアドレス端子ADとに供給される。
【0066】
データメモリ23においては、そのアドレス端子ADに供給される、カウンタ26からのアドレスにしたがって、そのアドレスに対応する記憶内容(教師画素(画素データ)と予測タップを構成する5つのビット間引き画素(画素データ))が読み出され、最小自乗法演算回路27に供給される。最小自乗法演算回路27では、データメモリ23から供給される教師画素(画素データ)と予測タップを構成するビット間引き画素(画素データ)に基づいて、方程式がたてられ、これが、例えば、最小自乗法によって解かれることにより、予測データとしての係数のセットw1乃至w5が求められる。
【0067】
即ち、上述のクラスClassに注目した場合、最小自乗法演算回路27では、データメモリ23の、クラスClassに対応するアドレスに記憶された教師画素(画素データ)x1,x2,・・・,xn、予測タップを構成する5つのビット間引き画素(画素データ)a1,a2,・・・,an,b1,b2,・・・,bn,c1,c2,・・・,cn,d1,d2,・・・,dn,x1’,x2’,・・・,xn’を用いて、式(1)に対応する、以下のような連立方程式がたてられる。
1=w11+w21+w31+w41+w51
2=w12+w22+w32+w42+w52



n=w1n+w2n+w3n+w4n+w5n
・・・(2)
【0068】
そして、最小自乗法演算回路27は、式(2)の連立方程式を、最小自乗法によって解くことにより、クラスClassについての予測データとしての係数のセットw1乃至w5を求める。他のクラスについての予測データとしての係数のセットも同様にして求められる。
【0069】
最小自乗法演算回路27で求められた予測データとしての係数のセットw1乃至w5は、メモリ28に供給される。従って、クラスClassについての予測データとしての係数のセットw1乃至w5は、メモリ23において、データx1,x2,・・・,xn,a1,a2,・・・,an,b1,b2,・・・,bn,c1,c2,・・・,cn,d1,d2,・・・,dn,x1’,x2’,・・・,xn’が記憶されていたアドレスと同一のメモリ28のアドレスに記憶される。他のクラスについての予測データとしての係数のセットも、同様にして、メモリ28に記憶される。
【0070】
図1のメモリ13には、以上のようにしてメモリ28に記憶された予測データとしての係数のセットが記憶されている。
【0071】
次に、図1のメモリ13には、予測データとして、式(1)に示した線形一次式を計算するための係数ではなく、8ビットの画素値そのものを記憶させておくようにすることができる。
【0072】
図11は、8ビットの画素値を予測データとしてメモリ13に記憶させる場合の、その予測データを求める学習装置の一実施の形態の構成例を示している。なお、図中、図10における場合と対応する部分については、同一の符号を付してある。
【0073】
入力端子20に入力された全画素動画像の各フレームは、レベル方向ビットサンプリング回路21に供給されるとともに、タップ切り出し回路22に供給される。レベル方向ビットサンプリング回路21では、上述した図1に示されるレベル方向ビットサブサンプリング回路と同様に、全画素動画像に対して空間/時間方向五の目レベル方向ビット間引きが施され、第1のビット間引き画素(画素データ)と第2のビット間引き画素(画素データ)でなるビット間引き画像データが生成される。このビット間引き画像データは、タップ切り出し回路22に供給される。
【0074】
タップ切り出し回路22は、入力端子20から供給された全画素動画像の各フレームを構成する画素から、図6に示した注目ビット間引き画素x’に対応する8ビットの画素xを教師画素(画素データ)として切り出すとともに、レベル方向ビットサブサンプリング回路21から供給されたビット間引き画像データから注目ビット間引き画素x’と、その上下左右に隣接する4つのビット間引き画素(画素データ)a乃至dをクラスタップとして切り出す。そして、タップ切り出し回路22は、その5つのビット間引き画素(画素データ)x’,a乃至dからなるクラスタップをクラスタリング回路24に供給するとともに、8ビットの教師画素(画素データ)xを演算器34に供給する。
【0075】
クラスタリング回路24は、図1のクラスタリング回路12と同様に、そこに供給されるクラスタップをクラスタリングし、その結果得られるクラスを、データメモリ30のアドレス端子ADと、度数メモリ31のアドレス端子ADとに供給する。ここで、データメモリ30および度数メモリ31は、学習を開始する前に、その記憶内容が0にクリアされるようになされている。
【0076】
度数メモリ31では、そのアドレス端子ADに、アドレスとしてのクラス(クラスコード)が供給されると、そのアドレスの記憶内容としての度数が読み出され、その出力端子OUTから出力される。度数メモリ31から出力された度数は、演算器32に供給され、1だけインクリメントされる。このインクリメント結果は、度数メモリ31の入力端子INに供給され、インクリメント前の度数が記憶されていたアドレスに記憶される(上書きされる)。
【0077】
一方、データメモリ30では、そのアドレス端子ADに、アドレスとしてのクラス(クラスコード)が供給されると、やはり、そのアドレスの記憶内容が読み出され、その出力端子OUTから出力される。データメモリ30の出力は、演算器33に供給される。演算器33には、さらに、度数メモリ31が出力する度数も供給されており、そこでは、この度数と、データメモリ30の出力とが乗算される。この乗算結果は、演算器34に供給される。
【0078】
演算器34では、演算器33における乗算結果と、タップ切り出し回路22からの注目画素(8ビットの画素値)とが加算され、その加算値は、演算器35に供給される。演算器35には、さらに、演算器32による度数のインクリメント結果も供給されており、そこでは、演算器34の加算結果を被除数とするとともに、加算器32のインクリメント結果を除数として、除算が行われる。この除算結果は、データメモリ30の入力端子INに供給され、クラスタリング回路24が出力するクラス(クラスコード)に対応するアドレスに記憶される(上書きされる)。
【0079】
図11の学習装置において、データメモリ30および度数メモリ31のあるアドレスadへのアクセスが最初に行われる場合には、タップ切り出し回路22から演算器34に供給される8ビットの教師画素(画素データ)x1がそのまま、データメモリ30のアドレスadに書き込まれ、また、度数メモリ31のアドレスadには、1が書き込まれる。その後、再度、アドレスadへのアクセスが行われ、このときにタップ切り出し回路22から演算器34に供給される8ビットの教師画素(画素データ)がx2であったとすると、演算器32の出力は2となり、また、演算器34の出力はx1+x2となるから、演算器35の出力は(x1+x2)/2となり、これが、データメモリ30のアドレスadに書き込まれる。そして、度数メモリ31のアドレスadには、演算器32の出力である2が書き込まれる。さらに、再び、アドレスadへのアクセスが行われ、このときにタップ切り出し回路22から演算器34に供給される8ビットの教師画素(画素データ)がx3であったとすると、同様の処理により、データメモリ30のアドレスadには、(x1+x2+x3)/3が書き込まれ、度数メモリ31のアドレスadには、3が書き込まれる。
【0080】
以上のようにして、データメモリ30には、各クラスに分類されるビット間引き画素に対応する教師画素(画素データ)の8ビットの画素値の平均値が記憶される。
【0081】
なお、図1のメモリ13に、データメモリ30に記憶された8ビットの画素値を、予測データとして記憶させる場合には、その予測データとしての8ビットの画素値を、メモリ13から読み出して出力することが8ビットの画素を予測することになるから、画素データ生成回路14は設ける必要がなく、さらに、クラスタップ/予測タップ切り出し回路11でも予測タップの生成、出力を行わずに済むようになる。
【0082】
ところで、上述の場合には、図1のクラスタップ/予測タップ切り出し回路11において、図6に示したように、ビット間引き画素(注目ビット間引き画素)x’と、その空間方向の上下左右に隣接する4つのビット間引き画素(画素データ)a,b,c,dで1つのクラスタップ及び予測タップを構成するようにしたが、クラスタップ及び予測タップは、注目ビット間引き画素としてのビット間引き画素x’の時間方向に隣接するビット間引き画素も含めて構成することが可能である。
【0083】
即ち、例えば、図12に示すように、第nフレームのある注目ビット間引き画素x’についてクラスタップ及び予測タップを構成する場合においては、注目ビット間引き画素x’、その同一フレーム内の上下左右に隣接する4つのビット間引き画素(画素データ)a,b,c,d、並びに第n−1フレームの、注目ビット間引き画素x’と同一位置にあるビット間引き画素(画素データ)e、および第n+1フレームの、注目ビット間引き画素x’と同一位置にあるビット間引き画素(画素データ)fの合計7つのビット間引き画素(画素データ)などでクラスタップ及び予測タップを構成することが可能である。
【0084】
この場合、時間方向のビット間引き画素(画素データ)e,fをも考慮してクラスタリングや、式(1)の演算が行われるので、注目ビット間引き画素x’を、より元のものに近い画素xに復元することが可能となる。なお、この場合、学習時においても、同様にクラスタップを構成する必要がある。また、クラスタップは、注目ビット間引き画素x’の時間方向にある間引き後画素だけで構成することも可能である。
【0085】
次に、以上では、受信装置200において、学習を行うことにより得られた予測データを用いて、ビット間引き画素から元の8ビットの画素を予測するようにしたので、ビット間引き画素で構成される画像に含まれていない高周波成分も復元することができるが、ビット間引画素に対する元の画素の復元は、単純なビット補間によって行うことも可能である。
【0086】
図13は、そのような送受信システムの一実施の形態の構成例を示している。なお、図中、図1における場合と対応する部分については、同一の符号を付してある。即ち、この送受信システムは、クラスタップ/予測タップ切り出し回路11、クラスタリング回路12、メモリ13、および画素データ生成回路14に代えて、補間フィルタ40が設けられている他は、図1の送受信システムと同様に構成されている。
【0087】
補間フィルタ40は、デコーダ9からの注目ビット間引き画素(画素データ)の間引かれたビットを、その周辺にあるビット間引き画素(画素データ)を用いて補間して出力する。この場合、図1における場合のように、ビット間引き画素で構成される画像に含まれていない高周波成分を復元することはできないが、受信装置200の構成を簡単化することができる。
【0088】
以上、本発明を適用した送受信システムについて説明したが、このような送受信システムは、テレビジョン放送は勿論、画像を記録/再生する場合などにも用いることができる。
【0089】
なお、本実施の形態では、あるビット間引き画素に注目した場合において、クラスタリングで使用されるクラスタップに用いるビット間引き画素(画素データ)と、式(1)に示した線形一次式を計算するのに使用される予測タップに用いるビット間引き画素(画素データ)とを同一のものとしたが、これらは、同一である必要はなく、クラスタップと予測タップとには、それぞれ別々のビット間引き画素の集合を用いることができる。即ち、クラスタップを構成する画素と、予測タップを構成する画素とは、それぞれ、クラスタップ/予測タップ切り出し回路11に適応的に切り出させることができる。なお、予測タップ、クラスタップの切り出し方は、画像の空間的な特徴(アクティビティ)や動き等に応じて適応的に変えてもよい。
【0090】
また、本実施の形態においては、クラスタップや予測タップに、注目ビット間引き画素(画素データ)を含めるようにしたが、注目ビット間引き画素を含めないようにすることも可能である。この場合、クラス毎の予測データを生成する学習時においても同様に、クラスタップや予測タップに注目ビット間引き画素(画素データ)を含めないようにする必要がある。
【0091】
さらに、クラスタップとしてのビット間引き画素(画素データ)や、予測タップとしてのビット間引き画素(画素データ)は、注目ビット間引き画素に対して、空間的または時間的に隣接している必要はない。但し、注目ビット間引き画素の周辺にあるビット間引き画素(画素データ)を用いるのが望ましい。
【0092】
また、本実施の形態においては、動画像を構成する各フレームの8ビットの画素を4ビットの画素にビット間引きするようにしたが、本発明はこれに限らず、例えば、12ビットの画素を6ビットの画素にビット間引きしたり、12ビットの画素を8ビットや4ビットに間引いてもよい。即ち、オリジナルの動画像や空間/時間五の目レベル方向ビット間引き後のビット間引き画像データの各画素のビット数は、特に限定されるものではない。
【0093】
さらに、本実施の形態においては、動画像データの画素の8ビットの画素値を、1ビットおきに間引き、4ビットの画素値とするようにしたが、本発明はこれに限らず、例えば、第1のビット間引き画素は、元の画素のレベル方向のMSBから3番目、4番目、5番目及び6番目のビットを間引き、MSBから1番目、2番目、7番目及び8番目のビットの4ビットの画素データから構成し、第2のビット間引き画素は、元の画素のレベル方向のMSBから1番目、2番目、7番目及び8番目(LSB)のビットを間引き、MSBから3番目、4番目、5番目及び6番目のビットの4ビットの画素データから構成してもよい。
【0094】
また、本実施の形態では、第1と第2のビット間引き画素それぞれを生成するのにあたって、元の画素から、それぞれ相補的な関係にあるビットを間引くようにしたが、即ち、第1のビット間引き画素は、元の画素のMSBから偶数番目のビットを間引くことによって、第2のビット間引き画素は、元の画素のMSBから奇数番目のビットを間引くことによって、それぞれ生成するようにしたが、第1または第2のビット間引き画素それぞれを生成するにあたっては、元の画素から、一部重複するビットを間引くようにすることも可能である。
【0095】
さらに、本実施の形態においては、予測タップとして5ビットのビット間引き画素データを用い、係数との線形一時結合により元の画素データを復元することとしたが、その他、例えば、4ビットのビット間引き画素データを一時的に8ビットの画素データに変換し、その8ビットの画素データと係数とを用いた線形一時結合により元の画素データを復元してもよい。4ビットのビット間引き画素を、一時的に8ビットの画素に変換する方法としては、例えば、間引かれたビット位置に、一時的にビット“0”または“1”を補間して、8ビットの画素データにする方法がある。この場合、クラス毎の予測データとしての係数のセットを生成する学習時においても同様に、4ビットのビット間引き画素データから8ビットの画素データに一時的に変換したものを用いる必要がある。
【0096】
【発明の効果】
請求項1に記載の画像処理装置および請求項に記載の画像処理方法によれば、第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きが施される。従って、動画像の水平、垂直、および斜め方向の解像度を維持しながら、その情報量を低減することが可能となる。
【0098】
請求項に記載の画像処理装置によれば、動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施すことにより得られる所定のビットが間引かれた画素である第1のビット間引き画素と、所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなる間引き画像データであって、第1または第2のビット間引き画素が、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことにより得られる間引き画像データを構成する第1および第2のビット間引き画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより一方の画素の元の画素値を復元する、または一方の画素の元の画素値を予測するのに用いられるデータである予測データと、他方の画素の画素値との積和演算によって、一方の画素の元の画素値が復元される。従って、画質の劣化の少ない画像を得ることが可能となる。
【図面の簡単な説明】
【図1】本発明を適用した送受信システムの第1実施の形態の構成例を示すブロック図である。
【図2】図1のレベル方向ビットサブサンプリング回路2の処理を説明するための図である。
【図3】図1のレベル方向ビットサブサンプリング回路2の処理を説明するための図である。
【図4】図1のレベル方向ビットサブサンプリング回路2の処理を説明するための図である。
【図5】図1のレベル方向ビットサブサンプリング回路2の処理を説明するための図である。
【図6】図1のクラスタップ/予測タップ切り出し回路11の処理を説明するための図である。
【図7】図1のクラスタリング回路12の処理を説明するための図である。
【図8】図1のクラスタリング回路12の構成例を示す図である。
【図9】ADRCを説明するための図である。
【図10】予測用データを求める学習装置の第1実施の形態の構成例を示すブロック図である。
【図11】予測用データを求める学習装置の第2実施の形態の構成例を示すブロック図である。
【図12】図1のクラスタップ/予測タップ切り出し回路11の他の処理を説明するための図である。
【図13】本発明を適用した送受信システムの第2実施の形態の構成例を示すブロック図である。
【図14】インターレース間引きがされる前の画像を示す図である。
【図15】インターレース間引きがされる後の画像を示す図である。
【符号の説明】
1 入力端子, 2 レベル方向ビットサブサンプリング回路, 3 エンコーダ, 4 送信処理装置, 5 出力端子, 6 伝送路, 7 入力端子,8 受信処理回路, 9 デコーダ, 11 クラスタップ/予測タップ切り出し回路, 12 クラスタリング回路, 13 メモリ, 14 画素データ生成回路, 15 出力端子, 20 入力端子, 21 レベル方向サブサンプリング回路, 22 タップ切り出し回路, 23 データメリ, 24 クラスタリング回路, 25 スイッチ, 25a,25b 端子, 26 カウンタ, 27 最小自乗法演算回路, 28 メモリ, 30 データメモリ, 31 度数メモリ, 32乃至35 演算器, 40 補間フィルタ, 100 送信装置, 200 受信装置
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus and an image processing method. Law In particular, an image processing apparatus and an image processing method capable of reducing deterioration in image quality and the like of moving images Law About.
[0002]
[Prior art]
Conventionally, interlaced scanning is one of scanning methods for displaying moving images.
[0003]
That is, for example, when an image is taken with a video camera or the like, as shown in FIG. 14, pixels (same as the pixels) of the same arrangement as the pixels of a photoelectric conversion element such as a built-in CCD (Charge Coupled Device), It is ideal in terms of image quality, resolution, etc. that each frame is configured and transmitted and recorded by (indicated by circles in the figure).
[0004]
However, this increases the amount of information to be transmitted and recorded. Therefore, in order to reduce the amount of information, as shown in FIG. 15, the first screen (field in the case of interlaced scanning) is obtained by thinning out odd-numbered pixels (indicated by ● in the figure) to obtain even-numbered pixels. The next screen is composed of only even-line pixels (indicated by a circle in the figure) by thinning out even-line pixels (indicated by a circle in the figure). The next screen is configured in the same manner as the first screen, and the screen is configured in the same manner.
[0005]
Here, since the interlaced scanning can be considered as one of the methods for thinning out pixels for reducing the information amount as described above, such a thinning-out method is hereinafter referred to as interlaced thinning as appropriate.
[0006]
[Problems to be solved by the invention]
Incidentally, the vertical resolution of an image depends on the number of lines. Therefore, when interlace decimation is performed, the vertical resolution of the image after decimation is ½ of the vertical resolution of the image before decimation. As a result, it is difficult to express a fast change in the vertical direction, and there is a problem that image quality deteriorates when there is such a movement.
[0007]
The present invention has been made in view of such circumstances, and is intended to reduce image quality degradation due to bit thinning in the level direction of a pixel (pixel data).
[0008]
[Means for Solving the Problems]
The image processing apparatus according to claim 1 includes bit thinning means for performing bit thinning so that each of the first or second bit thinned pixels is arranged in a five-mesh lattice pattern in both the spatial direction and the time direction. It is characterized by.
[0009]
Claim 3 The image processing method described in (1) is characterized in that bit thinning is performed so that each of the first or second bit thinning pixels is arranged in a five-mesh lattice pattern in both the spatial direction and the temporal direction.
[0012]
Claim 4 Is obtained by performing bit thinning out in the level direction on the pixels of each frame constituting the moving image. A pixel with a predetermined bit thinned out A first bit decimation pixel and , A pixel with bits different from the predetermined bit thinned out Thinned-out image data composed of second bit-thinned pixels, by performing bit-thinning so that the first or second bit-thinned pixels are arranged in a five grid pattern in both the spatial and temporal directions Thinned image data obtained Constituting the first and second About pixels The original pixel value of one pixel is restored by interpolating the bits decimated by the one pixel using the pixel value of the other pixel, or the original pixel value of one pixel is predicted The original pixel value of one pixel is obtained by multiply-and-accumulate the prediction data, which is data used for the above, and the pixel value of the other pixel. It is characterized by comprising a restoring means for restoring.
[0013]
2. The image processing apparatus according to claim 1, wherein the bit thinning means performs bit thinning so that each of the first or second bit thinned pixels is arranged in a five-dot lattice in both the spatial direction and the time direction. It is made like that.
[0014]
Claim 3 In the image processing method described in 1), bit thinning is performed so that each of the first or second bit thinning pixels is arranged in a five-mesh lattice pattern in both the spatial direction and the temporal direction.
[0017]
Claim 4 In the image processing apparatus described in (2), the restoration means is obtained by performing bit thinning out in the level direction for the pixels of each frame constituting the moving image. A pixel with a predetermined bit thinned out A first bit decimation pixel and , A pixel with bits different from the predetermined bit thinned out Thinned-out image data composed of second bit-thinned pixels, by performing bit-thinning so that the first or second bit-thinned pixels are arranged in a five grid pattern in both the spatial and temporal directions Thinned image data obtained Constituting the first and second About pixels The original pixel value of one pixel is restored by interpolating the bits decimated by the one pixel using the pixel value of the other pixel, or the original pixel value of one pixel is predicted The original pixel value of one pixel is obtained by multiply-and-accumulate the prediction data, which is data used for the above, and the pixel value of the other pixel. Has been made to restore.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below, but before that, in order to clarify the correspondence between the respective means of the invention described in the claims and the following embodiments, after each means, A corresponding embodiment (however, an example) is added in parentheses to describe the characteristics of the present invention, and the following is obtained.
[0019]
That is, the image processing apparatus according to claim 1 restores image data constituting a moving image. processing In an image processing apparatus that compresses while suppressing deterioration of image quality at the time, bits are thinned out in the level direction for pixels of each frame constituting a moving image, and predetermined bits are thinned out. Is a pixel Bit thinning means (for example, a level shown in FIG. 1) for generating bit thinned image data composed of a first bit thinned pixel and a second bit thinned pixel that is a pixel from which a bit different from a predetermined bit is thinned. Direction bit sub-sampling circuit 2 etc.), For the first and second bit-thinned pixels constituting the bit-thinned image data, by interpolating the bit thinned out in one pixel using the pixel value of the other pixel, The original processing of one pixel is performed by a sum-of-products operation of the prediction data, which is data used to predict the original pixel value of one pixel, and the pixel value of the other pixel The original image data is restored by the restoration process that restores the pixel values. Output means (for example, the transmission processing circuit 4 shown in FIG. 1) that outputs bit-thinned image data, and the bit-thinning means includes each of the first and second bit-thinned pixels in both the spatial direction and the time direction. In addition, bit thinning is performed so as to be arranged in a five-lattice grid.
[0020]
Claim 4 The image processing apparatus described in the above is an image processing apparatus that decompresses bit-thinned image data generated by thinning out the pixels of image data constituting a moving image. Predetermined bits obtained by thinning out bits in the level direction were thinned out Is a pixel Thinned-out image data composed of a first bit-thinned pixel and a second bit-thinned pixel that is a pixel from which a bit different from a predetermined bit is thinned, wherein the first or second bit-thinned pixel is Receiving means (for example, the reception processing circuit 8 shown in FIG. 1) for receiving bit-thinned image data obtained by performing bit-thinning so as to be arranged in the form of a five grid in both the spatial direction and the time direction; Configure thinned image data First and second bit decimation About pixels One Bit thinned out by pixel The other Pixel value of the pixel Restore original pixel value of one pixel by interpolating with , Or, by calculating the sum of products of prediction data, which is data used to predict the original pixel value of one pixel, and the pixel value of the other pixel, Pixels The original pixel value of For example, a class tap / predictive tap cut-out circuit 11, a clustering circuit 12, a memory 13, and a pixel data generation circuit 14 shown in FIG. 1).
[0021]
Claim 6 In the image processing apparatus described in (1), the restoration unit determines a predetermined class representing a feature of the target pixel based on peripheral pixels located around the target pixel with respect to the predetermined target pixel of the bit-thinned image data. The data corresponding to the class output by the determining means (for example, the clustering circuit 12 shown in FIG. 1) and the determining means, and before the bit thinning is performed One Pixel pixel value Predictive data that is used to predict And the sum of products of the pixel value of the other pixel , One of the pixels Pixel before bit thinning corresponding to the target pixel Pixel value of Predict that pixel value And generating means (for example, the memory 13 and the pixel data generation circuit 14 shown in FIG. 1).
[0022]
Claim 7 In the image processing apparatus described in the above, the generation unit stores, for each class, predetermined prediction data for each class generated by performing learning in advance using image data constituting a moving image for learning. The prediction data corresponding to the class output by the determining means is read out from the storage means, and the read prediction data is provided (for example, the memory 13 shown in FIG. 1). And the sum of products of the pixel value of the other pixel The pixel of the pixel before the bit thinning corresponding to the target pixel is performed value It is characterized by generating.
[0023]
Claim 8 In the image processing apparatus described in the above, the storage unit has the prediction data as Used for multiply-accumulate operations, A set of predetermined prediction coefficients for each class is stored, and the generation unit reads a set of prediction coefficients corresponding to the class output by the determination unit from the storage unit, and the read set of prediction coefficients, Multiple pixels of bit-thinned image data located around the pixel of interest And the pixel value of the other pixel When By multiply-and-accumulate The pixel of the pixel before the bit thinning corresponding to the target pixel is performed value Further, it is characterized by further comprising a calculation means (for example, the pixel data generation circuit 14 shown in FIG.
[0024]
Of course, this description does not mean that the respective means are limited to those described above.
[0025]
FIG. 1 shows an embodiment of a transmission / reception system to which the present invention is applied (a system is a logical collection of a plurality of devices, regardless of whether or not each component device is in the same casing). The example of a structure of the form is shown.
[0026]
This transmission / reception system includes a transmission device 100 and a reception device 200. The transmission apparatus 100 includes an input terminal 1, a level direction bit sub-sampling circuit 2, an encoder 3, a transmission processing circuit 4, and an output terminal 5, and a predetermined bit in the level direction of each pixel (pixel data) of the image. The reception device 200 is configured to compress and transmit by thinning out the input terminal 7, the reception processing circuit 8, the decoder 9, the class tap / prediction tap cutout circuit 11, the clustering circuit 12, the memory 13, and the pixel data. The generation circuit 14 and the output terminal 15 are configured to expand the compressed image from the transmission apparatus 100.
[0027]
That is, for example, the transmission apparatus 100 captures a moving image (hereinafter, referred to as “video”), which is captured by a video camera (not shown), and each frame is composed of pixels arranged in the same manner as pixels included in a photoelectric conversion element such as a built-in CCD. Digital image data of all pixel moving images is supplied as appropriate. Here, such an all-pixel moving image is a so-called progressive camera (a video camera that scans all the pixels on the photoelectric conversion element in a so-called raster scan order and outputs them as a one-frame image signal) or an all-pixel camera ( The signal in all the pixels on the photoelectric conversion element can be obtained by a video camera that outputs the image signal as one frame at a time.
[0028]
This digital image data is supplied to the level direction bit sub-sampling circuit 2 via the input terminal 1. The pixels (pixel data) of each frame constituting a moving image as digital image data supplied to the level direction bit sub-sampling circuit 2 are composed of, for example, 8 bits. As shown in FIG. 2, each 8-bit pixel is compressed by being thinned by different bit thinning out in the direction of the level of the pixel in a grid pattern in both the spatial direction and the temporal direction.
[0029]
Here, in FIG. 2 (the same applies to FIGS. 3 to 6 and FIG. 12 described later), both the ● mark and the ○ mark indicate the pixels (pixel data) of the frame constituting the all-pixel moving image. Then, as shown in FIG. 3A, the level direction bit sub-sampling circuit 2 takes the second and fourth from the MSB (Most Significant Bit) in the level direction for the 8-bit pixel data marked with ●. The fourth, sixth and eighth (LSB (Least Significant Bit)) bits are thinned out, and 4-bit pixel data (hereinafter referred to as the first bit) composed of the first, third, fifth and seventh bits from the MSB. A bit thinned pixel (pixel data)). Further, the level direction bit sub-sampling circuit 2 thins out the first, third, fifth and seventh bits from the MSB in the level direction for the 8-bit pixel data marked with ○, and the second, 4th from the MSB. 4-bit pixel data (hereinafter referred to as second-bit thinned-out pixels (pixel data)) composed of the sixth, eighth, and eighth bits is configured.
[0030]
Therefore, in the level direction bit sub-sampling circuit 2, for the first frame of all pixel moving images, as shown in FIG. 4A, for example, the second, fourth, and sixth columns of the first line , 8th row,..., Pixels in the 1st row, 3rd row, 5th row, 7th row,. Of the 8 bits of each pixel data, 4 bits are thinned out so as to be configured as bit thinned pixels (pixel data), and the first, third, fifth, and seventh lines of the first line are also thinned out. Pixels in the second row, second row, fourth row, sixth row, eighth row,... In the second row,. Of the 8 bits of each pixel data, 4 bits are thinned out so as to be configured as a pixel (pixel data). Hereinafter, similarly, for odd frames, bit thinning is performed in the level direction of each pixel so that the first or second bit thinned pixels are arranged in the form of a fifth grid in the spatial direction. .
[0031]
For the second frame, for example, as shown in FIG. 4B, the first, third, fifth, seventh,... The pixels in the 4th, 4th, 6th, 8th,... Columns (indicated by the ● marks in FIG. 5B) are configured as the first bit thinned pixels (pixel data). Of the 8 bits of each pixel data, 4 bits are thinned out, and the second, fourth, sixth, eighth,...,. The pixels in the fifth column, the seventh column, the seventh column,... (Shown by circles in FIG. 5B) are configured as second bit thinned pixels (pixel data). Of the 8 bits, 4 bits are skipped. Similarly, for even frames, bit thinning is performed in the level direction of each pixel so that the first or second bit thinned pixels are arranged in a grid pattern in the spatial direction.
[0032]
In this case, if attention is paid to a certain line or column, for example, as shown in FIG. 5, for the first frame, the second, fourth, sixth, eighth, .. (Indicated by a black circle in the figure) is configured as a first bit-thinned pixel (pixel data), 4 bits of the 8 bits of each pixel data are thinned, and the second As for the frame, the first, third, fifth, seventh,... Pixels (indicated by ● in the figure) constituting the target line or target column are the first bit thinned pixels (pixel data). As configured, 4 bits out of 8 bits of each pixel data are thinned out. Then, with respect to the third frame, the second, fourth, sixth, eighth,... Pixels (indicated by the mark ● in the figure) constituting the target line or target column are again reduced to the first bit. 4 bits out of 8 bits of each pixel data are thinned out so as to be configured as a pixel (pixel data).
[0033]
Further, for the first frame, the first, third, fifth, seventh,... Pixels (indicated by circles in the figure) constituting the target line or target column are the second bit thinned pixels. 4 bits out of 8 bits of each pixel data are thinned out so as to be configured as (pixel data), and for the second frame, the second, fourth, sixth, 4 bits out of 8 bits of each pixel data are thinned out so that the eighth,... Pixel (indicated by a circle in the figure) is configured as a second bit thinned pixel (pixel data). . For the third frame, the first, third, fifth, seventh,... Pixels (indicated by a circle in the figure) constituting the target line or target column are again thinned by the second bit. Of the 8 bits of each pixel data, 4 bits are thinned out so as to be configured as pixels (pixel data).
[0034]
Hereinafter, in the same manner, by performing bit thinning, in the level direction bit sub-sampling circuit 2, the first or second bit thinned pixels are also arranged in a five-point grid in the time direction. Bit thinning is performed in the level direction of each pixel.
[0035]
For each frame of all pixel moving images, as described above, the level direction of each pixel is such that the first or second bit-thinned pixels are arranged in a five-point grid in both the spatial direction and the temporal direction. Bit thinning (hereinafter referred to as space / time fifth eye level direction bit thinning as appropriate), the first bit thinned pixel (pixel data) and the first bit thinned in both the spatial direction and the temporal direction. Two bit-thinned pixels (pixel data) are present alternately (every other). Therefore, the information amount after the space / time fifth eye level direction bit decimation is simply ½ of the original information amount as in the case of the interlace decimation in the prior art.
[0036]
Space / time fifth eye level direction bit decimation can thus reduce the amount of information. Furthermore, since the number of pixels after thinning is not different from the original number of pixels, it is possible to maintain any resolution in the horizontal direction, the vertical direction, and the diagonal direction, and as a result, fast change in any of these directions. Can also be expressed, and it is possible to reduce (prevent) degradation of image quality when there is such movement. Therefore, according to space / time fifth eye level direction bit thinning, so-called uniform thinning can be realized for digital image data.
[0037]
Returning to FIG. 1, the bit direction thinned image data obtained by performing the space level / time fifth level direction bit thinning in the level direction bit sub-sampling circuit 2 is supplied to the encoder 3. In the encoder 3, the bit-thinned image data (image data composed of the first bit-thinned pixel and the second bit-thinned pixel) from the level direction bit sub-sampling circuit 2 is subjected to high efficiency coding. Here, as a high-efficiency encoding method, for example, a hybrid method combining orthogonal transform and motion compensation such as DCT (Discrete Cosine Transform), a hybrid method combining DCT and quantization, ADRC (Adaptive Dynamic Range Coding), etc. Can be used. The details of ADRC are described in, for example, Japanese Patent Application Laid-Open No. 61-144989 previously filed by the present applicant. In some cases (for example, when the capacity of the transmission line 6 is sufficiently large), the encoder 3 can be omitted.
[0038]
In the encoder 3, encoded data obtained by high-efficiency encoding of the bit-thinned image data is supplied to the transmission processing circuit 4. In the transmission processing circuit 4, for example, necessary signal processing such as error correction, packetization, and channel coding is performed on the encoded data from the encoder 3, and transmission data obtained as a result is sent to the output terminal 5. Is output via. This transmission data is transmitted via a predetermined transmission path 6. The transmission path 6 includes, for example, a satellite line, a communication line such as a terrestrial wave, a CATV network, a public network, and the Internet, for example, a magnetic recording / reproducing process, and a magnetic disk, an optical disk, a magnetic tape Also included are magneto-optical disks, phase change disks and other recording media.
[0039]
Transmission data from the transmission path 6 is received by the reception processing circuit 8 via the input terminal 7 of the reception device 200. The reception processing circuit 8 performs necessary signal processing such as channel decoding, unpacketization, and error correction on the transmission data, and the encoded data obtained as a result is a decoder corresponding to the encoder 3 of the transmission apparatus. 9 is supplied. In the decoder 9, the encoded data is decoded by a decoding process corresponding to the encoding process of the encoder 3, and is converted into bit-thinned image data composed of a first bit-thinned pixel and a second bit-thinned pixel. / The prediction tap cut-out circuit 11 is supplied.
[0040]
For example, as illustrated in FIG. 6, the class tap / predictive tap cutout circuit 11 converts a predetermined bit thinned pixel (pixel data) x ′ obtained by performing bit thinning in the level direction to four bits to a target pixel (target bit thinned pixel). ), The class is determined by the clustering circuit 12 which will be described later with respect to the target bit thinned pixel x ′ and four bit thinned pixels (pixel data) a, b, c, and d adjacent in the spatial direction. A pixel (hereinafter referred to as a class tap as appropriate) that is used to perform the extraction, and a pixel (hereinafter referred to as “pixel tap”) that is used to restore the target bit thinned pixel x ′ to the original 8-bit pixel data x by the pixel data generation circuit 14 described later. Cut out as a prediction tap). The extracted class tap or prediction tap is supplied to the clustering circuit 12 or the pixel data generation circuit 14, respectively. Note that here, for a certain bit-thinned pixel, the class tap and the prediction tap are configured from the same bit-thinned pixel, but can be configured from different bit-thinned pixels. The class tap / prediction tap cutout circuit 11 performs bit thinning on all the bit thinned pixels (that is, the first bit thinned pixel (pixel data) and the second bit thinned pixel (pixel data)) adjacent to each other in the vertical and horizontal directions. A class tap or a prediction tap composed of pixels is formed and supplied to the clustering circuit 12 or the pixel data generation circuit 14, respectively.
[0041]
The clustering circuit 12 receives the class tap from the class tap / predictive tap cut-out circuit 11, performs clustering according to the properties of the 4-bit bit thinned pixels constituting the class tap, and selects a predetermined class for the target bit thinned pixel. appear.
[0042]
Here, the clustering will be briefly described. Now, for example, as shown in FIG. 7A, a class tap composed of 2 × 2 pixels is considered, and each pixel is represented by 1 bit (takes a level of 0 or 1). Then, as shown in FIG. 7B, the class tap of 2 × 2 4 pixels is 16 (= (2 1 ) Four ) Can be classified into patterns. Such classification is clustering, and such processing is performed in the clustering circuit 12. Here, in consideration of simplification of the description, the case where each pixel is expressed by 1 bit has been described. However, in this embodiment, each pixel constituting the class tap is expressed by 2 bits, for example. Clustering is performed for various class taps.
[0043]
That is, in this embodiment, 4 bits are allocated to each pixel (bit thinned pixel) (in order to express the pixel value). In the present embodiment, as described above, the class tap is composed of five pixels (bit thinned pixels x ′, a, b, c, d). Therefore, when clustering is performed for such class taps, (2 Four ) Five A huge number of classes will be generated.
[0044]
Therefore, the clustering circuit 12 has a 2-bit ADRC circuit 16 as shown in FIG. 8, and the 2-bit ADRC circuit 16 performs 2-bit ADRC processing on the class tap. ing. As a result, the number of bits of each pixel (bit thinned pixel) constituting the class tap is reduced from 4 bits to 2 bits to reduce the number of classes.
[0045]
That is, for example, for the sake of simplicity, as shown in FIG. 9A, when a class tap composed of four pixels arranged on a straight line is considered, in ADRC processing, the maximum pixel value is A value MAX and a minimum value MIN are detected. Then, DR = MAX−MIN is set as the local dynamic range of the block, and the pixel values of the pixels constituting the block are requantized to K bits based on the dynamic range DR.
[0046]
That is, the minimum value MIN is subtracted from each pixel value in the block, and the subtracted value is converted into DR / 2. K Divide by. Then, it is converted into a code (ADRC code) corresponding to the division value obtained as a result. Specifically, in the 2-bit ADRC circuit 16, as shown in FIG. 9B, assuming that K = 2, the division value has a dynamic range DR of 4 (= 2 2 ) It is determined which range is obtained by equally dividing, and the division value is, for example, the range of the lowest level, the range of the second level from the bottom, the range of the third level from the bottom, or the highest In the case of belonging to the upper level range, for example, it is coded into 2 bits such as 00B, 01B, 10B, or 11B (B represents a binary number).
[0047]
The decoding is performed by dividing the ADRC code 00B, 01B, 10B, or 11B, for example, by dividing the dynamic range DR into four equal parts, the center value L00 of the lowest level range, and the second level range from the bottom. Is converted to the center value L10 of the range of the third level from the bottom, or the center value L11 of the range of the uppermost level, and the minimum value MIN is added to that value.
[0048]
Further, as described above, the clustering is performed based on the level of each pixel (bit thinned pixel) constituting the class tap as described above. For example, the tendency of the level of the pixel constituting the class tap (for example, all the pixels) It is also possible to perform the determination based on whether the levels are almost the same or the level of the pixel on the right is higher or lower than the level of other pixels.
[0049]
In the 2-bit ADRC circuit 16, by performing 2-bit ADRC processing on the class tap of 5 pixels, a class tap in which the number of bits of each 5 pixel is 2 bits is obtained. The 2-bit ADRC circuit 16 outputs 10-bit data in which the pixel values of 5 pixels having 2 bits are arranged as a temporary class for the target bit thinned-out pixel.
[0050]
As shown in FIG. 8, the clustering circuit 12 has a bit addition circuit 17 in addition to the 2-bit ADRC circuit 16, and the 10-bit provisional class code output from the 2-bit ADRC circuit 16 is a bit addition circuit. 17 is supplied.
[0051]
The bit addition circuit 17 adds one bit to the temporary class code from the 2-bit ADRC circuit 16 and generates a final class code. That is, the bit addition circuit 17 adds one bit depending on whether the target bit thinning pixel for the class tap is the first bit thinning pixel (pixel data) or the second bit thinning pixel (pixel data). Is added to the temporary class code. For example, when the target bit thinned pixel is a first bit thinned pixel (pixel data), bit “0” is set. When the target bit thinned pixel is a second bit thinned pixel (pixel data), Bit “1” is added. Then, a total of 11 bits to which this 1 bit is added is output from the clustering circuit 12 as the final class for the target bit thinned pixel.
[0052]
Returning to FIG. 1 again, the class (class code) for the target bit thinned pixel obtained by the clustering as described above is given to the memory 13 as an address. The memory 13 stores the original pixel x corresponding to the bit thinned pixel (the target bit thinned pixel) x ′ subjected to bit thinning in the space level / time of the fifth level in the level direction from the pixels constituting the all-pixel moving image. Prediction data for predicting is stored for each class, and when a class (class code) as an address is given from the clustering circuit 12, the prediction data corresponding to the class is read out to the pixel data generation circuit 14 Supply.
[0053]
Here, in this case, in the memory 13, for example, the original pixel x corresponding to the target pixel (target bit thinning pixel) x ′ is replaced with the target bit thinning pixel x ′ and the bit thinning adjacent to the upper, lower, left, and right sides thereof. A set w of coefficients (prediction coefficients) of the linear linear expression for prediction by a linear linear expression using prediction taps composed of pixels (pixel data) a to d (FIG. 6). 1 , W 2 , W Three , W Four , W Five Is stored as prediction data. Therefore, the coefficient set w corresponding to the class of the pixel of interest thinning-out is sent from the memory 13 to the pixel data generation circuit 14. 1 Thru w Five Are supplied as prediction data.
[0054]
The pixel data generation circuit 14 calculates the prediction data w 1 Thru w Five Is received, the coefficient set w which is the prediction data 1 Thru w Five And the pixel values x ′ and a to d of the bit thinned pixels (pixel data) constituting the prediction tap supplied from the class tap / prediction tap cutout circuit 11 to calculate the following linear linear expression The original 8-bit pixel (pixel data) x corresponding to the target bit thinning pixel x ′ is generated (predicted).
[0055]
x = w 1 a + w 2 b + w Three c + w Four d + w Five x '
... (1)
[0056]
The 8-bit pixel (pixel data) x obtained by the pixel data generation circuit 14 is supplied to the output terminal 15 and sequentially output. As a result, the output terminal 15 outputs the data of the frames constituting the original all-pixel moving image.
[0057]
Next, generation of prediction data for each class will be described. In order to obtain the original 8-bit pixel (pixel data) x from the 4-bit bit-thinned pixel x ′, which is the target bit-thinned pixel, the coefficient of prediction data for constructing the linear linear expression of Expression (1) Set w 1 , W 2 , W Three , W Four , W Five Is required by learning.
[0058]
FIG. 10 shows a coefficient set w which is prediction data. 1 Thru w Five 2 shows an example of the configuration of an embodiment of a learning device that performs learning for obtaining the above.
[0059]
In learning, a plurality of learning all-pixel moving images are prepared, and the learning all-pixel moving images are input to the input terminal 20 in units of frames, for example. Here, the learning all-pixel moving image is a coefficient set w as prediction data. 1 Thru w Five It is desirable that the standard is taken into consideration.
[0060]
Each frame of the all-pixel moving image input to the input terminal 20 is supplied to the level direction bit sampling circuit 21 and also to the tap cutout circuit 22. In the level direction bit sampling circuit 21, like the level direction bit sub-sampling circuit 2 shown in FIG. 1 described above, the fifth level direction bit thinning is performed on all the pixel moving images in the space / time direction. Bit-thinned image data composed of the second bit-thinned pixel (pixel data) and the second bit-thinned pixel (pixel data) is generated. The bit thinned image data is supplied to the tap cutout circuit 22.
[0061]
The tap cut-out circuit 22 converts the 8-bit pixel x corresponding to the target bit thinning-out pixel x ′ shown in FIG. 6 from the pixels constituting each frame of the all-pixel moving image supplied from the input terminal 20 as a teacher pixel (pixel). Data) and classifying the target bit-thinned pixel x ′ from the bit-thinned image data supplied from the level direction bit sub-sampling circuit 21 and the four bit-thinned pixels (pixel data) a to d adjacent in the vertical and horizontal directions Cut out as a tap and prediction tap. Then, the class tap composed of the five bit thinned pixels (pixel data) x ′, a to d cut out by the tap cutout circuit 22 is supplied to the clustering circuit 24. Further, the prediction tap composed of the five bit thinned pixels (pixel data) x ′, a to d and the 8-bit teacher pixel (pixel data) x cut out by the tap cutout circuit 22 are supplied to the input terminal IN of the data memory 23. Is done.
[0062]
Similar to the clustering circuit 12 of FIG. 1, the clustering circuit 24 performs clustering by subjecting the class taps supplied thereto to ADRC processing. Further, in the temporary class code obtained as a result, 1 bit indicating whether the target bit thinned pixel is the first bit thinned pixel (pixel data) or the second bit thinned pixel (pixel data) And the final class code obtained as a result is supplied to the terminal 25a of the switch 25 as the class of the target bit thinning pixel. Here, the switch 25 selects the terminal 25a until the above-described clustering process and the supply process to the data memory 23 are completed for all the bit thinning obtained from the all-pixel moving image for learning. The class for the target bit thinned pixel output from the clustering circuit 24 is supplied to the address terminal AD of the data memory 23 via the switch 25.
[0063]
The data memory 23 stores data supplied to the input terminal IN at an address corresponding to the class supplied to the address terminal AD.
[0064]
Here, for example, a target bit thinning pixel x classified into a predetermined class Class 1 ', X 2 ', ..., x n For each pixel of interest, 1 ', X 2 ', ..., x n X represents the teacher pixel (pixel data) obtained from the learning all-pixel moving image corresponding to the position of x 1 , X 2 , ..., x n And In addition, the target bit thinning pixel x 1 4 bits thinned out pixels (pixel data) constituting prediction taps adjacent to the top, bottom, left and right of ' 1 , B 1 , C 1 , D 1 And the target bit thinning pixel x 2 4 bits thinned out pixels (pixel data) constituting prediction taps adjacent to the top, bottom, left and right of ' 2 , B 2 , C 2 , D 2 ..., The target bit thinning pixel x n 4 bits thinned out pixels (pixel data) constituting prediction taps adjacent to the top, bottom, left and right of ' n , B n , C n , D n And do each. In this case, the address corresponding to the class Class in the memory 23 is assigned to the teacher pixel (pixel data) x by the above processing. 1 , X 2 , ..., x n , Bit thinned pixels (pixel data) a constituting the prediction tap 1 , A 2 , ..., a n , B 1 , B 2 , ..., b n , C 1 , C 2 , ..., c n , D 1 , D 2 , ..., d n , X 1 ', X 2 ', ..., x n 'Is remembered.
[0065]
When the clustering process and the storage process in the data memory 23 for all the teacher pixels obtained from the learning all-pixel moving image are completed, the switch 25 selects the terminal 25b. The output of the counter 26 is supplied to the terminal 25b, and the counter 26 generates a sequentially changing address by counting a predetermined clock CK. Therefore, the address generated by the counter 26 is output via the switch 25. The address output from the counter 26 via the switch 25 is supplied to the address terminal AD of the data memory 23 and the address terminal AD of the memory 28.
[0066]
In the data memory 23, in accordance with the address from the counter 26 supplied to the address terminal AD, the storage contents (teacher pixel (pixel data) corresponding to the address and five bit thinned pixels (pixels) constituting the prediction tap are provided. Data)) is read out and supplied to the least squares operation circuit 27. In the least squares operation circuit 27, an equation is established based on the teacher pixels (pixel data) supplied from the data memory 23 and the bit thinned pixels (pixel data) constituting the prediction tap. Set of coefficients w as prediction data by being solved by multiplication 1 Thru w Five Is required.
[0067]
That is, when attention is focused on the above-described class class, the least squares method arithmetic circuit 27 in the data memory 23 stores the teacher pixel (pixel data) x stored in the address corresponding to the class class. 1 , X 2 , ..., x n , 5 bit thinned pixels (pixel data) a constituting the prediction tap 1 , A 2 , ..., a n , B 1 , B 2 , ..., b n , C 1 , C 2 , ..., c n , D 1 , D 2 , ..., d n , X 1 ', X 2 ', ..., x n Using ', the following simultaneous equations corresponding to equation (1) are established.
x 1 = W 1 a 1 + W 2 b 1 + W Three c 1 + W Four d 1 + W Five x 1 '
x 2 = W 1 a 2 + W 2 b 2 + W Three c 2 + W Four d 2 + W Five x 2 '



x n = W 1 a n + W 2 b n + W Three c n + W Four d n + W Five x n '
... (2)
[0068]
Then, the least square method arithmetic circuit 27 solves the simultaneous equations of Equation (2) by the least square method, thereby setting a coefficient set w as prediction data for the class Class. 1 Thru w Five Ask for. A set of coefficients as prediction data for other classes is obtained in the same manner.
[0069]
Coefficient set w as prediction data obtained by the least squares arithmetic circuit 27 1 Thru w Five Is supplied to the memory 28. Therefore, the set of coefficients w as prediction data for class Class w 1 Thru w Five Is stored in the memory 23 with data x 1 , X 2 , ..., x n , A 1 , A 2 , ..., a n , B 1 , B 2 , ..., b n , C 1 , C 2 , ..., c n , D 1 , D 2 , ..., d n , X 1 ', X 2 ', ..., x n 'Is stored at the same address of the memory 28 as the stored address. A set of coefficients as prediction data for other classes is stored in the memory 28 in the same manner.
[0070]
The memory 13 in FIG. 1 stores a set of coefficients as prediction data stored in the memory 28 as described above.
[0071]
Next, the memory 13 in FIG. 1 may store an 8-bit pixel value itself as prediction data, not a coefficient for calculating the linear linear expression shown in Expression (1). it can.
[0072]
FIG. 11 shows a configuration example of an embodiment of a learning device for obtaining prediction data when an 8-bit pixel value is stored in the memory 13 as prediction data. In the figure, parts corresponding to those in FIG. 10 are denoted by the same reference numerals.
[0073]
Each frame of the all-pixel moving image input to the input terminal 20 is supplied to the level direction bit sampling circuit 21 and also to the tap cutout circuit 22. In the level direction bit sampling circuit 21, as in the above-described level direction bit sub-sampling circuit shown in FIG. 1, the fifth level direction bit thinning is performed on all the pixel moving images in the space / time direction. Bit-thinned image data composed of bit-thinned pixels (pixel data) and second bit-thinned pixels (pixel data) is generated. The bit thinned image data is supplied to the tap cutout circuit 22.
[0074]
The tap cut-out circuit 22 converts an 8-bit pixel x corresponding to the target bit thinning-out pixel x ′ shown in FIG. 6 from the pixels constituting each frame of the all-pixel moving image supplied from the input terminal 20 as a teacher pixel (pixel). Data) and classifying the target bit-thinned pixel x ′ from the bit-thinned image data supplied from the level direction bit sub-sampling circuit 21 and the four bit-thinned pixels (pixel data) a to d adjacent in the vertical and horizontal directions Cut out as a tap. The tap cut-out circuit 22 supplies the class tap composed of the five bit thinned-out pixels (pixel data) x ′ and a to d to the clustering circuit 24 and outputs the 8-bit teacher pixel (pixel data) x to the arithmetic unit. 34.
[0075]
Similar to the clustering circuit 12 of FIG. 1, the clustering circuit 24 clusters the class taps supplied thereto, and class obtained as a result is assigned to the address terminal AD of the data memory 30 and the address terminal AD of the frequency memory 31. To supply. Here, the stored contents of the data memory 30 and the frequency memory 31 are cleared to 0 before learning is started.
[0076]
In the frequency memory 31, when a class (class code) as an address is supplied to the address terminal AD, the frequency as the stored contents of the address is read and output from the output terminal OUT. The frequency output from the frequency memory 31 is supplied to the calculator 32 and incremented by one. This increment result is supplied to the input terminal IN of the frequency memory 31 and stored (overwritten) at the address where the frequency before the increment was stored.
[0077]
On the other hand, in the data memory 30, when a class (class code) as an address is supplied to the address terminal AD, the stored contents of the address are also read out and output from the output terminal OUT. The output of the data memory 30 is supplied to the calculator 33. The computing unit 33 is also supplied with the frequency output from the frequency memory 31, where the frequency is multiplied by the output of the data memory 30. The multiplication result is supplied to the calculator 34.
[0078]
In the computing unit 34, the multiplication result in the computing unit 33 and the target pixel (8-bit pixel value) from the tap cutout circuit 22 are added, and the added value is supplied to the computing unit 35. The arithmetic unit 35 is also supplied with the frequency increment result from the arithmetic unit 32, where the addition result of the arithmetic unit 34 is used as a dividend, and the increment result of the adder 32 is used as a divisor to perform division. Is called. This division result is supplied to the input terminal IN of the data memory 30 and stored (overwritten) at an address corresponding to the class (class code) output from the clustering circuit 24.
[0079]
In the learning apparatus shown in FIG. 11, when an address ad in the data memory 30 and the frequency memory 31 is first accessed, an 8-bit teacher pixel (pixel data) supplied from the tap cutout circuit 22 to the computing unit 34 is obtained. ) X1 is written as it is to the address ad of the data memory 30, and 1 is written to the address ad of the frequency memory 31. Thereafter, access to the address ad is performed again. At this time, if the 8-bit teacher pixel (pixel data) supplied from the tap cutout circuit 22 to the calculator 34 is x2, the output of the calculator 32 is 2 and the output of the calculator 34 is x1 + x2, the output of the calculator 35 is (x1 + x2) / 2, which is written to the address ad of the data memory 30. Then, 2 that is the output of the arithmetic unit 32 is written in the address ad of the frequency memory 31. Furthermore, if access to the address ad is performed again, and the 8-bit teacher pixel (pixel data) supplied from the tap cutout circuit 22 to the computing unit 34 is x3, (X1 + x2 + x3) / 3 is written to the address ad of the memory 30, and 3 is written to the address ad of the frequency memory 31.
[0080]
As described above, the data memory 30 stores an average value of 8-bit pixel values of teacher pixels (pixel data) corresponding to the bit thinned pixels classified into the respective classes.
[0081]
When the 8-bit pixel value stored in the data memory 30 is stored as prediction data in the memory 13 of FIG. 1, the 8-bit pixel value as the prediction data is read from the memory 13 and output. Therefore, it is not necessary to provide the pixel data generation circuit 14, and the class tap / prediction tap cutout circuit 11 does not need to generate and output a prediction tap. Become.
[0082]
By the way, in the above case, in the class tap / predictive tap cutout circuit 11 in FIG. 1, as shown in FIG. The four bit thinned pixels (pixel data) a, b, c, and d constitute one class tap and a prediction tap, and the class tap and the prediction tap are bit thinned pixels x as a target bit thinned pixel. It is possible to include a bit-thinned pixel adjacent in the time direction.
[0083]
That is, for example, as shown in FIG. 12, in the case of configuring a class tap and a prediction tap for a target bit thinning pixel x ′ in the nth frame, the target bit thinning pixel x ′ is vertically and horizontally in the same frame. Four adjacent bit-thinned pixels (pixel data) a, b, c, d, and bit-thinned pixel (pixel data) e at the same position as the target bit-thinned pixel x ′ in the (n−1) th frame, and n + 1th A class tap and a prediction tap can be configured by a total of seven bit thinned pixels (pixel data) of bit thinned pixels (pixel data) f located in the same position as the target bit thinned pixel x ′ in the frame.
[0084]
In this case, since the clustering and the calculation of Expression (1) are performed in consideration of the bit-thinned pixels (pixel data) e and f in the time direction, the target bit-thinned pixel x ′ is a pixel closer to the original one. It is possible to restore to x. In this case, it is necessary to configure a class tap in the same manner during learning. Further, the class tap can also be configured by only the pixels after decimation in the time direction of the target bit decimation pixel x ′.
[0085]
Next, in the above, since the receiving apparatus 200 predicts the original 8-bit pixel from the bit-thinned pixel using the prediction data obtained by performing learning, it is configured by the bit-thinned pixel. High-frequency components not included in the image can also be restored, but the original pixel can be restored to the bit-thinned pixel by simple bit interpolation.
[0086]
FIG. 13 shows a configuration example of an embodiment of such a transmission / reception system. In the figure, parts corresponding to those in FIG. 1 are denoted by the same reference numerals. That is, this transmission / reception system is the same as the transmission / reception system of FIG. 1 except that an interpolation filter 40 is provided instead of the class tap / prediction tap extraction circuit 11, the clustering circuit 12, the memory 13, and the pixel data generation circuit 14. It is constituted similarly.
[0087]
The interpolation filter 40 interpolates the bit thinned out pixel (pixel data) of interest from the decoder 9 using the bit thinned pixel (pixel data) around it, and outputs the result. In this case, as in the case of FIG. 1, high-frequency components that are not included in the image composed of bit-thinned pixels cannot be restored, but the configuration of the receiving device 200 can be simplified.
[0088]
The transmission / reception system to which the present invention is applied has been described above. However, such a transmission / reception system can be used not only for television broadcasting but also for recording / reproducing images.
[0089]
In this embodiment, when attention is paid to a certain bit-thinned pixel, the bit-thinned pixel (pixel data) used for the class tap used in clustering and the linear linear expression shown in Expression (1) are calculated. The bit-thinned pixels (pixel data) used for the prediction taps used in the above are the same, but they need not be the same. The class tap and the prediction tap have different bit-thinned pixels. Sets can be used. That is, the pixel constituting the class tap and the pixel constituting the prediction tap can be adaptively cut out by the class tap / prediction tap cutout circuit 11 respectively. Note that the method of extracting the prediction tap and the class tap may be adaptively changed according to the spatial characteristics (activity) and movement of the image.
[0090]
In the present embodiment, the target bit thinning pixel (pixel data) is included in the class tap or the prediction tap, but it is also possible not to include the target bit thinning pixel. In this case, it is also necessary to prevent the target bit thinning pixel (pixel data) from being included in the class tap or the prediction tap during learning for generating prediction data for each class.
[0091]
Furthermore, the bit-thinned pixel (pixel data) as the class tap and the bit-thinned pixel (pixel data) as the prediction tap need not be spatially or temporally adjacent to the target bit-thinned pixel. However, it is desirable to use a bit thinned pixel (pixel data) around the target bit thinned pixel.
[0092]
In the present embodiment, the 8-bit pixels of each frame constituting the moving image are thinned out to 4-bit pixels. However, the present invention is not limited to this, and for example, a 12-bit pixel is used. Bits may be thinned out to 6-bit pixels, or 12-bit pixels may be thinned out to 8 bits or 4 bits. That is, the number of bits of each pixel of the original moving image or the bit thinned image data after the space / time fifth eye level direction bit thinning is not particularly limited.
[0093]
Furthermore, in the present embodiment, the 8-bit pixel value of the pixel of the moving image data is thinned out every other bit to be a 4-bit pixel value. However, the present invention is not limited to this, for example, The first bit-thinned pixel thins out the third, fourth, fifth, and sixth bits from the MSB in the level direction of the original pixel, and 4th of the first, second, seventh, and eighth bits from the MSB. The second bit thinned pixel is composed of bit pixel data, and the first, second, seventh and eighth (LSB) bits are thinned from the MSB in the level direction of the original pixel, and the third, fourth, You may comprise from 4 bits pixel data of the 5th, 5th, and 6th bits.
[0094]
In the present embodiment, when generating the first and second bit thinned pixels, the complementary bits are thinned from the original pixels. That is, the first bit The decimation pixel is generated by decimation of even-numbered bits from the MSB of the original pixel, and the second bit decimation pixel is generated by decimation of odd-numbered bits from the MSB of the original pixel. In generating each of the first or second bit thinned pixels, it is possible to thin out partially overlapping bits from the original pixels.
[0095]
Furthermore, in this embodiment, 5-bit bit thinned pixel data is used as a prediction tap, and the original pixel data is restored by linear temporary combination with a coefficient. However, for example, 4-bit bit thinning is performed. The pixel data may be temporarily converted into 8-bit pixel data, and the original pixel data may be restored by linear temporary combination using the 8-bit pixel data and a coefficient. As a method for temporarily converting a 4-bit bit-thinned pixel into an 8-bit pixel, for example, the bit “0” or “1” is temporarily interpolated at the thinned-out bit position, and then 8-bit There is a method of making the pixel data. In this case, it is necessary to use data obtained by temporarily converting 4-bit bit-thinned pixel data into 8-bit pixel data in learning to generate a coefficient set as prediction data for each class.
[0096]
【The invention's effect】
An image processing apparatus according to claim 1 and a claim 3 According to the image processing method described in 1), bit thinning is performed so that each of the first or second bit thinned pixels is arranged in a five-mesh lattice pattern in both the spatial direction and the time direction. Accordingly, it is possible to reduce the amount of information while maintaining the horizontal, vertical, and diagonal resolution of the moving image.
[0098]
Claim 4 According to the image processing device described in the above, it is obtained by performing bit thinning out in the level direction for each frame pixel constituting the moving image. A pixel with a predetermined bit thinned out A first bit decimation pixel and , A pixel with bits different from the predetermined bit thinned out Thinned-out image data composed of second bit-thinned pixels, by performing bit-thinning so that the first or second bit-thinned pixels are arranged in a five grid pattern in both the spatial and temporal directions Thinned image data obtained First and second bit thinning out About pixels The original pixel value of one pixel is restored by interpolating the bits decimated by the one pixel using the pixel value of the other pixel, or the original pixel value of one pixel is predicted The original pixel value of one pixel is obtained by multiply-and-accumulate the prediction data, which is data used for the above, and the pixel value of the other pixel. Is restored. Therefore, it is possible to obtain an image with little deterioration in image quality.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration example of a first embodiment of a transmission / reception system to which the present invention is applied.
FIG. 2 is a diagram for explaining processing of a level direction bit sub-sampling circuit 2 in FIG. 1;
3 is a diagram for explaining processing of a level direction bit sub-sampling circuit 2 in FIG. 1; FIG.
4 is a diagram for explaining processing of a level direction bit sub-sampling circuit 2 in FIG. 1; FIG.
5 is a diagram for explaining processing of a level direction bit sub-sampling circuit 2 of FIG. 1; FIG.
6 is a diagram for explaining processing of a class tap / predicted tap cutout circuit 11 in FIG. 1; FIG.
7 is a diagram for explaining processing of the clustering circuit 12 of FIG. 1; FIG.
FIG. 8 is a diagram illustrating a configuration example of the clustering circuit 12 of FIG. 1;
FIG. 9 is a diagram for explaining ADRC;
FIG. 10 is a block diagram illustrating a configuration example of a first embodiment of a learning device for obtaining prediction data.
FIG. 11 is a block diagram illustrating a configuration example of a second embodiment of a learning device that obtains prediction data;
12 is a diagram for explaining another process of the class tap / predicted tap cutout circuit 11 of FIG. 1; FIG.
FIG. 13 is a block diagram showing a configuration example of a second embodiment of a transmission / reception system to which the present invention is applied.
FIG. 14 is a diagram illustrating an image before interlace thinning is performed.
FIG. 15 is a diagram illustrating an image after interlace thinning is performed.
[Explanation of symbols]
1 input terminal, 2 level direction bit sub-sampling circuit, 3 encoder, 4 transmission processing device, 5 output terminal, 6 transmission path, 7 input terminal, 8 reception processing circuit, 9 decoder, 11 class tap / predictive tap cut-out circuit, 12 Clustering circuit, 13 memory, 14 pixel data generation circuit, 15 output terminal, 20 input terminal, 21 level direction sub-sampling circuit, 22 tap extraction circuit, 23 data merit, 24 clustering circuit, 25 switch, 25a, 25b terminal, 26 counter, 27 Least Squares Arithmetic Circuit, 28 Memory, 30 Data Memory, 31 Frequency Memory, 32 to 35 Calculator, 40 Interpolation Filter, 100 Transmitter, 200 Receiver

Claims (9)

動画像を構成する画像データを、復元処理時の画質の劣化を抑制して圧縮する画像処理装置において、
動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施し、所定のビットが間引かれた画素である第1のビット間引き画素と、前記所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなるビット間引き画像データを生成するビット間引き手段と、
前記ビット間引き画像データを構成する前記第1および第2のビット間引き画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより前記一方の画素の元の画素値を復元する前記復元処理、または前記一方の画素の元の画素値を予測するのに用いられるデータである予測データと、前記他方の画素の画素値との積和演算によって、前記一方の画素の元の画素値を復元する前記復元処理によって、元の画像データに復元される前記ビット間引き画像データを出力する出力手段と
を備え、
前記ビット間引き手段は、前記第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施す
ことを特徴とする画像処理装置。
In an image processing apparatus that compresses image data constituting a moving image while suppressing deterioration in image quality during restoration processing ,
Bits are thinned out in the level direction for pixels of each frame constituting a moving image, and a first bit thinned pixel that is a pixel from which a predetermined bit is thinned, and a bit different from the predetermined bit Bit thinning means for generating bit thinned image data composed of second thinned pixels which are thinned pixels;
For the first and second bit thinned pixels constituting the bit thinned image data, the one pixel is obtained by interpolating the bit thinned by one pixel using the pixel value of the other pixel. By the product-sum operation of the restoration process for restoring the original pixel value of the pixel, or prediction data that is data used to predict the original pixel value of the one pixel and the pixel value of the other pixel, Output means for outputting the bit-thinned image data restored to the original image data by the restoration processing for restoring the original pixel value of the one pixel ;
The image processing apparatus according to claim 1, wherein the bit thinning unit performs bit thinning so that the first or second bit thinning pixels are arranged in a five-mesh lattice pattern in both a spatial direction and a temporal direction.
前記ビット間引き手段は、前記画素のレベルの最上位ビットから偶数番目または奇数番目の一方のビットを間引くことにより、前記第1のビット間引き画素を生成し、他方のビットを間引くことにより、前記第2のビット間引き画素を生成する
ことを特徴とする請求項1に記載の画像処理装置。
The bit decimation means generates the first bit decimation pixel by decimation of even-numbered or odd-numbered bits from the most significant bit of the level of the pixel, and decimation of the other bit to decipher the first bit. The image processing apparatus according to claim 1, wherein two bit-thinned pixels are generated.
動画像を構成する画像データを、復元処理時の画質の劣化を抑制して圧縮する画像処理方法において、
動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施し、所定のビットが間引かれた画素である第1のビット間引き画素と、前記所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなるビット間引き画像データを生成するビット間引きステップと、
前記ビット間引き画像データを構成する前記第1および第2のビット間引き画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより前記一方の画素の元の画素値を復元する前記復元処理、または前記一方の画素の元の画素値を予測するのに用いられるデータである予測データと、前記他方の画素の画素値との積和演算によって、前記一方の画素の元の画素値を復元する前記復元処理によって、元の画像データに復元される前記ビット間引き画像データを出力する出力ステップと
を含み、
前記ビット間引きステップでは、前記第1または第2のビット間引き画素それぞれが、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施す
ことを特徴とする画像処理方法。
In an image processing method for compressing image data constituting a moving image while suppressing deterioration in image quality during restoration processing ,
Bits are thinned out in the level direction for pixels of each frame constituting a moving image, and a first bit thinned pixel that is a pixel from which a predetermined bit is thinned, and a bit different from the predetermined bit A bit thinning step for generating bit thinned image data comprising a second bit thinned pixel that is a thinned pixel ;
For the first and second bit thinned pixels constituting the bit thinned image data, the one pixel is obtained by interpolating the bit thinned by one pixel using the pixel value of the other pixel. By the product-sum operation of the restoration process for restoring the original pixel value of the pixel, or prediction data that is data used to predict the original pixel value of the one pixel and the pixel value of the other pixel, An output step of outputting the bit-thinned image data restored to the original image data by the restoration processing for restoring the original pixel value of the one pixel ;
Including
In the bit thinning step, the first or second bit thinning pixel is subjected to bit thinning so that each of the first and second bit thinning pixels is arranged in a five-dimensional lattice pattern in both the spatial direction and the temporal direction.
動画像を構成する画像データの画素を間引くことにより生成されたビット間引き画像データを伸張する画像処理装置において、
動画像を構成する各フレームの画素に対して、そのレベル方向にビット間引きを施すことにより得られる所定のビットが間引かれた画素である第1のビット間引き画素と、前記所定のビットとは異なるビットが間引かれた画素である第2のビット間引き画素とからなる前記ビット間引き画像データであって、前記第1または第2のビット間引き画素が、空間方向および時間方向の両方向に五の目格子状に並ぶようにビット間引きを施すことにより得られる前記ビット間引き画像データを受信する受信手段と、
前記ビット間引き画像データを構成する前記第1および第2のビット間引き画素について、その一方の画素で間引かれているビットを、他方の画素の画素値を用いて補間することにより前記一方の画素の元の画素値を復元するまたは前記一方の画素の元の画素値を予測するのに用いられるデータである予測データと、前記他方の画素の画素値との積和演算によって、前記一方の画素の元の画素値を復元する復元手段と
を備えることを特徴とする画像処理装置。
In an image processing apparatus for decompressing bit-thinned image data generated by thinning out pixels of image data constituting a moving image,
The first bit thinned pixel, which is a pixel obtained by thinning a predetermined bit obtained by performing bit thinning in the level direction with respect to the pixel of each frame constituting the moving image, and the predetermined bit The bit-thinned image data comprising second bit-thinned pixels that are pixels from which different bits are thinned, wherein the first or second bit-thinned pixel has five bits in both the spatial direction and the time direction. Receiving means for receiving the bit-thinned image data obtained by performing bit-thinning so as to be arranged in a grid pattern;
For the first and second bit sampling pixel constituting the bit thinned image data, the one pixel by the bits are thinned out in one of its pixels is interpolated using the pixel values of other pixel The original pixel value of the one pixel is restored , or prediction data, which is data used to predict the original pixel value of the one pixel, and the pixel value of the other pixel are obtained by a product-sum operation. An image processing apparatus comprising: restoration means for restoring an original pixel value of a pixel .
前記第1のビット間引き画素は、それぞれ、前記画素のレベルの最上位ビットから偶数番目または奇数番目の一方のビットを間引くことにより生成されたものであり、前記第2のビット間引き画素は、他方のビットを間引くことにより生成されたものである
ことを特徴とする請求項に記載の画像処理装置。
Each of the first bit thinned pixels is generated by thinning one of the even-numbered and odd-numbered bits from the most significant bit of the level of the pixel, and the second bit thinned pixel is the other The image processing apparatus according to claim 4 , wherein the image processing apparatus is generated by thinning out the bits.
前記復元手段は、
前記ビット間引き画像データの所定の注目画素に対して、前記注目画素の周辺に位置する周辺画素に基づいて、前記注目画素の特徴を表す所定のクラスを決定する決定手段と、
前記決定手段が出力する前記クラスに対応するデータであって、かつ、ビット間引きが施される前の前記一方の画素の画素を予測するのに用いられるデータである前記予測データと、前記他方の画素の画素値との前記積和演算によって前記一方の画素である前記注目画素に対応するビット間引きが施される前の画素の画素値を予測し、その画素を発生する発生手段と
を有する
ことを特徴とする請求項又はのうちのいずれかに記載の画像処理装置。
The restoration means includes
Determining means for determining a predetermined class representing a feature of the target pixel based on peripheral pixels located around the target pixel with respect to the predetermined target pixel of the bit-thinned image data;
A data corresponding to the class in which the determining means outputs, and the prediction data is data used for predicting the pixel value of the one pixel before the bit thinning is performed, the other of by the product-sum operation between the pixel values of the pixels, and generating means for bit thinned corresponding to the pixel of interest the which is one pixel predicts the pixel value of the previous pixel to be subjected, to generate the pixel value the image processing apparatus according to any one of claims 4 or 5, characterized in that it has a.
前記発生手段は、
学習用の動画像を構成する画像データを用いて、あらかじめ学習を行うことにより生成された前記クラスごとの所定の予測データを、前記クラスごとに記憶する記憶手段を有し、
前記決定手段が出力する前記クラスに対応する前記予測データを、前記記憶手段から読み出し、その読み出された予測データと、前記他方の画素の画素値との前記積和演算によって、前記注目画素に対応するビット間引きが施される前の画素の画素を発生する
ことを特徴とする請求項に記載の画像処理装置。
The generating means includes
Using image data constituting a moving image for learning, and having a storage means for storing, for each class, predetermined prediction data for each class generated by performing learning in advance.
The prediction data corresponding to the class output by the determining unit is read from the storage unit, and the pixel-of-interest is calculated by the product-sum operation of the read prediction data and the pixel value of the other pixel. The image processing apparatus according to claim 6 , wherein a pixel value of a pixel before corresponding bit thinning is generated is generated.
前記記憶手段は、前記予測データとして、前記積和演算に用いる、前記クラスごとの所定の予測係数のセットを記憶しており、
前記発生手段は、前記決定手段が出力する前記クラスに対応する前記予測係数のセットを、前記記憶手段から読み出し、その読み出された予測係数のセットと、前記注目画素の周辺に位置する、前記ビット間引き画像データの複数の画素の画素値であって、かつ、前記他方の画素の画素値の前記積和演算によって、前記注目画素に対応するビット間引きが施される前の画素の画素を算出する演算手段をさらに有する
ことを特徴とする請求項に記載の画像処理装置。
The storage means stores, as the prediction data, a set of predetermined prediction coefficients for each class used for the product-sum operation ,
The generation means reads the set of prediction coefficients corresponding to the class output by the determination means from the storage means, and is located around the read prediction coefficient set and the pixel of interest. Pixel values of a plurality of pixels of the bit-thinned image data , and the pixel values before the bit-thinning corresponding to the target pixel is performed by the product-sum operation with the pixel value of the other pixel The image processing apparatus according to claim 7 , further comprising a calculation unit that calculates the value.
前記決定手段は、前記注目画素に対して、空間方向若しくは時間方向のうちのいずれか一方、または両方に位置する、前記ビット間引き画像データの複数の画素を用いて、前記クラスを決定する
ことを特徴とする請求項に記載の画像処理装置。
The determining means determines the class using a plurality of pixels of the bit-thinned image data located in either one or both of a spatial direction and a temporal direction with respect to the target pixel. The image processing apparatus according to claim 6 .
JP16785598A 1998-06-16 1998-06-16 Image processing apparatus and image processing method Expired - Fee Related JP4123452B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16785598A JP4123452B2 (en) 1998-06-16 1998-06-16 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16785598A JP4123452B2 (en) 1998-06-16 1998-06-16 Image processing apparatus and image processing method

Publications (3)

Publication Number Publication Date
JP2000004436A JP2000004436A (en) 2000-01-07
JP2000004436A5 JP2000004436A5 (en) 2005-09-02
JP4123452B2 true JP4123452B2 (en) 2008-07-23

Family

ID=15857350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16785598A Expired - Fee Related JP4123452B2 (en) 1998-06-16 1998-06-16 Image processing apparatus and image processing method

Country Status (1)

Country Link
JP (1) JP4123452B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4633577B2 (en) * 2005-08-24 2011-02-16 富士フイルム株式会社 Data compression apparatus and data compression program

Also Published As

Publication number Publication date
JP2000004436A (en) 2000-01-07

Similar Documents

Publication Publication Date Title
JP4126709B2 (en) Image processing apparatus and image processing method
US5666164A (en) Image signal converting apparatus
US5193003A (en) Apparatus for decoding digital video data with small memory requirement
JPH07147681A (en) Hierarchical coding/decoding device for digital image signal
JP3912627B2 (en) Image coding apparatus, image coding method, and transmission method
US20110135009A1 (en) Combined lossy and lossless video compression
JP3946781B2 (en) Image information conversion apparatus and method
JPH0795591A (en) Digital picture signal processing unit
JP3271095B2 (en) High-efficiency encoder and decoder for digital image signal
JP4123452B2 (en) Image processing apparatus and image processing method
KR980013427A (en) Image Coding Apparatus, Image Coding Method, Image Decoding Method, Image Decoding Apparatus, Image Coding Method, Image Decoding Method, Image Decofing Apparatus, Image Data Transmitting Method and Recording Medium
JP3747970B2 (en) Image encoding device, image encoding method, image decoding device, and image decoding method
JP3759538B2 (en) Image signal processing method and image signal transmission apparatus
JP3870428B2 (en) Image information conversion apparatus and method, and coefficient data generation apparatus and method
JP3723995B2 (en) Image information conversion apparatus and method
JP3912558B2 (en) Image encoding apparatus, image encoding method, and recording medium
JP3480015B2 (en) Apparatus and method for generating image data
JP3480461B2 (en) Digital image signal processing apparatus and processing method
JP3271109B2 (en) Digital image signal processing apparatus and processing method
JPH0746548A (en) Digital image signal processor
JP3988738B2 (en) Image conversion apparatus and image conversion method
JPH0797754B2 (en) Encoding transmission device
JP3907623B2 (en) Video signal encoding / decoding device and encoding / decoding method
JP3831955B2 (en) Class classification adaptive processing apparatus and method
JP4001143B2 (en) Coefficient generation apparatus and method

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050309

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080321

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080411

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080424

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees