[go: up one dir, main page]

JPH10126775A - 画像信号の符号化方法 - Google Patents

画像信号の符号化方法

Info

Publication number
JPH10126775A
JPH10126775A JP26887796A JP26887796A JPH10126775A JP H10126775 A JPH10126775 A JP H10126775A JP 26887796 A JP26887796 A JP 26887796A JP 26887796 A JP26887796 A JP 26887796A JP H10126775 A JPH10126775 A JP H10126775A
Authority
JP
Japan
Prior art keywords
block
edge
coding
image
dct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP26887796A
Other languages
English (en)
Other versions
JP3967405B2 (ja
Inventor
Yuji Ito
裕二 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Priority to JP26887796A priority Critical patent/JP3967405B2/ja
Priority to US08/947,575 priority patent/US6608865B1/en
Priority to EP19970308006 priority patent/EP0836328A3/en
Publication of JPH10126775A publication Critical patent/JPH10126775A/ja
Application granted granted Critical
Publication of JP3967405B2 publication Critical patent/JP3967405B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

(57)【要約】 【課題】 画像に対する効率の良い圧縮符号化。 【解決手段】 本実施例における画像信号の符号化にお
いては、ブロック10で、入力画像の1フレーム内でエ
ッジを抽出する。ブロック11で、エッジが存在するブ
ロックと存在しないブロックに分類する。ブロック12
で、エッジが存在するブロックについて、エッジの方向
とDCT係数の分布との間の相関性に基き最適な走査順
序を定めてその走査順序で符号化する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画像信号の処理技術
に関し、特に圧縮符号化の技術に関する。
【0002】
【従来の技術及びその課題】離散コサイン変換(DC
T)符号化は像圧縮符号化のための効率の良い手段であ
り(N.Ahmed他著「Discrete cosi
ne transform」IEEE Trans.C
omput.,vol.C−23,pp.90−93,
1974)、DCTを基本とする符号化の符号化効率を
更に改善する為に多くの努力が払われている。この為に
は、像信号の非静止性のため変換係数を適応型に処理す
ることが必要とされている。
【0003】適応型DCT符号化方式(adaptiv
e DCT coding system)では、コー
ドを像ブロックの特定の特性に適応させることが必要で
ある。このための方法には、可変ブロックサイズ方式及
び適応型量子化がある。可変ブロックサイズ方式は、最
初に像を異なるサイズのブロックに分解して、低精細領
域を一層大きいサイズのブロックとして表わし、その
後、可変ブロックサイズDCTを適応する。これは、低
精細領域のビットを節約することにより、高精細領域を
伝送する為に追加のビットを利用できるようにするもの
である。この為、この方式は画質を高めることができ
る。又、適応型量子化は閾値符号化及び区域符号化を含
み、閾値符号化では、その大きさが所定の閾値を越える
係数だけが伝送され、伝送される係数の場所及び大きさ
が符号化される。こう云う情報を符号化する典形的な方
法は、JPEG及びMPEGに採用されているラン・レ
ベル符号化(run−level coding)であ
る。他方、区域符号化(zonal coding)で
は、区域と呼ばれる特定された領域内に存在する係数だ
けが符号化される。区域の形は、それが符号化効率に大
きな影響を持つので、慎重に定める必要がある。実際に
は、大きさの小さい或る係数を符号化し、大きさの大き
い係数は棄てることができる。これは、区域の形が予め
特定されているからである。このメカニズムは符号化効
率を更に改善する可能性を有している。
【0004】上に述べた各方式は、各々のブロックがど
の類に属するかを受取側に知らせる必要があるか、又は
受取側が導き出すことを可能にする必要があるかという
ブロック分類方法(block classifica
tion method)でカテゴリー化される。ブロ
ックのサイズが小さすぎず、類(class)の数が多
すぎない場合、このオーバヘッド情報はあまりペナルテ
ィをかけずに直接伝送することができる。しかし、そう
でない場合、他の方法を用いなければならない。例え
ば、8×8画素のブロックに対して16個の類を用いる
と、1ブロック当たり4ビットを必要とし、画像の共通
フォーマットの一つであるSIFサイズの像(輝度に対
して352×240ペル、8ビット/ペル)、4:2:
0のクロマ・フォーマット、及び20:1の圧縮比を仮
定すると、合計のオーバヘッド情報は5,280ビット
になり、これは圧縮されるデータの10%を越えてしま
う。オーバヘッド量、即ち脇役の情報に対する符号化利
得に基づいて、兼ね合いを取らなければならないことに
なる。
【0005】
【課題を解決するための手段及び作用】本発明は、幾何
学的なエッジ表示に基づく適応型DCT符号化を提供す
る。このアルゴリズムでは、適応型走査を用いることに
よって、区域符号化を一層融通性のある方法に変更し、
可変ブロックサイズ方式を並行して取り入れることを可
能にした。エッジの場所及び方向の情報を含む幾何学的
なエッジ情報が、脇役の情報に対するビットを節約する
一方、ブロック分類を直接伝えることの代わりになり得
る。その新規なアルゴリズムが、ブロック分類情報を効
率よく伝えることにより、適応型でない符号化を性能の
点で凌ぐことを可能にする。本発明における符号化方法
は、入力画像の1フレーム上でエッジを抽出し、前記フ
レームを、前記抽出エッジが存在するブロックと存在し
ないブロックに分類し、前記抽出エッジが存在する前記
ブロックについて、エッジの方向とDCT係数の分布と
の間の相関性に基き最適な走査順序を定めてその走査順
序で符号化するステップを含む。
【0006】
【実施の形態】本発明の実施例を、理論的考察を含め以
下に詳述する。図1に従来の典形的な適応型DCT符号
化方式のブロック図を示す。ブロック1で実施される離
散コサイン変換(DCT)は、ペルの値のブロック(a
block of pel values)を水平及
び垂直空間周波数係数のマトリクスに変換する。M×M
の2次元DCTが次の様に定義される。
【0007】
【数1】 ここでu,v,x,y=0,1,2,…,M−1であ
り、x及びyはサンプル領域の空間座標、u,vは変換
領域の座標である。
【0008】ペルの値のブロックは、空間周波数係数に
対して逆DCT(IDCT)を実施することによって再
生することができる。
【数2】
【0009】一般的に、大部分のエネルギは低周波数係
数に集中している。ブロックの左上のDCT係数はDC
係数と呼ばれ、これはブロックの平均のペルの値に対応
し、他の項はAC係数と呼ばれる。ここでは、大抵の像
/ビデオ圧縮アルゴリズムが採用する16×16及び8
×8−DCTを考える。
【0010】通常、自然の像は、可変量の細部及び情報
を持つ異なるサイズの領域に分割することができる。像
のこの様なセグメント分割は、像データの効率のよい符
号化にとって有利であり、プログレッシブ・トランスミ
ッションによる像の圧縮では特にそうである。カッドト
リー(QT)符号化が、像の分解、即ち多層化を表わす
主な方式であり、この時、像は2次元の均質(homo
geneous)な方形領域に分割され、分解によって
トリーができる。トリーの各々の節は4つの子を持ち、
それが像の一意的に限定された領域に関連している。根
は像全体と関係している。
【0011】ブロック2で実施される量子化は、値の範
囲をその範囲内の1個の値によって表わす。一層高い空
間周波数に対応する係数の量子化レベルは、係数の値が
特定の量子化レベルの上方にない限り、人間の目が特定
の空間周波数が失われたことを知覚しそうにない様に、
量子化の段のサイズを選ぶことにより、0のAC係数を
発生するのに有利である。高次係数の0の値が連続する
係数の予想ランの統計的な符号化が、相当の圧縮利得が
得られる理由である。系列内の早い所でゼロでない係数
をまとめ、ゼロでない最後の係数に続いて、できるだけ
多くの0の係数を符号化する為、変換係数は、空間周波
数が高くなる順序に走査する。図2にJPEG及びMP
EGで特定されている所謂ジグザク走査順序を示す。
【0012】DC係数の扱いはこれとは異なる。即ち、
目は面積の大きい輝度誤差に対して非常に敏感であり、
その為、DC値を符号化する精度を固定する。MPEG
に特定されているマクロブロック内に対するデフォルト
量子化マトリクスを図3に示す。
【0013】エッジの方向は対応するDCT係数と高い
相関性を持つという、即ち、DCT係数はエッジの方向
に対して垂直な方向に沿って現われるという有用な性質
がある。垂直のエッジを持つ像のブロックが存在すると
仮定すると、比較的大きなマグニチュードを有する対応
するDCT係数が水平方向に現われることが広く知られ
ている。これを図4に示すが、今述べた場合がこの図の
タイプbに対応することに注意されたい。この相関性を
区域符号化で利用することができる。図4はエッジ方向
とDCT係数の分布との関係を示し、(1)のエッジの
タイプa,b,cが(2)の区域A,B,Cにそれぞれ
対応する。A,B及びCの様な区域の形が定められてい
て、各々のブロックに対して適当なブロックのタイプが
得られれば、係数を伝送する為のビットを減らすことが
できる。これは、問題のエリアが区域に狭められると、
その位置に関してのエントロピーが減少するからであ
る。
【0014】ブロック3で実施される可変長符号化(V
LC)は、符号化しようとする値にコードワードを割当
てる統計的な符号化方式である。発生頻度の高い値には
短いコードワードを割当て、発生が頻繁でない値には長
いコードワードを割当てる。平均すると、頻度が多くて
一層短いコードワードが支配的になり、コード・ストリ
ングが元のデータより短くなる。この為、合計のコード
ワード長を短縮することができる。MPEG及びH.2
61に使われるDCT係数に対するVLCテーブルが、
表1に示す様なACラン−レベル・シンボルで構成され
る。
【0015】
【表1】 本発明のアルゴリズムの概念を図5にブロック図で示
す。これは、ブロック分類過程が、エッジ情報を用いて
一意的に履行されると云う新しい考えを特徴としてい
る。普通、従来の適応型DCT符号化では、ブロックの
分類が最初のパス(path)で実施され、その後2番
目のパスで実際の符号化が行なわれる。これに対して、
ここで提案する方式は、最初に全体の像の中のエッジを
抽出し、その後各々のブロックを符号化する。前に述べ
た様に、エッジの方向と対応するDCT係数の分布との
間には相関性がある。従って、この性質を利用すること
により、ブロック内の符号化される最後の係数までの走
査パスを最短にする1組の適当な走査順序を定めること
ができる。言い換えれば、ブロック内の伝送される最後
の係数までの合計ランは、走査順序をブロック毎に適応
型で変えることによって減少することができる。この
為、適応型走査方式は、画質に影響を与えずに、変換係
数に対するコードワードの合計の長さを短縮することが
できる。これは、復号器に於ける逆走査動作の後の係数
は、非適応型符号化と完全に同一でなけばならないから
である。
【0016】MPEG−2では、別の走査順序が既に定
められており、そのシンタクスによって、走査順序をジ
グザグ走査順序と別のものとの間で切り換えることがで
きる。適応はフレーム毎に行なわれているが、本実施例
ではブロック毎に行なう。
【0017】ノン・エッジ(エッジのない)ブロックの
ポピュレーションは、像の内容に応じて、平均して約2
0%乃至80%になる。これは適応型走査に必ずしも有
利でない。エッジのあるブロック(エッジ・ブロック)
に対して10%の符号化利得が得られても、最低の全体
的な符号化利得が2%になることがある。ノン・エッジ
・ブロックは、エッジ・ブロックよりも、DCT領域に
於けるエネルギ圧縮が一層大きいから、ノン・エッジ・
ブロックを16×16画素のブロックに統合する。その
後、16×16画素のノン・エッジ・ブロックが16×
16 DCTによって変換され、その後DCT係数が、
DC係数から64番目の係数までジグザグ型で走査さ
れ、これによって8×8 DCTと同じVLCテーブル
を使うことができる。16×16ブロックに対する量子
化マトリクスは、8×8ブロックに対するものと同様に
調製される。これによって、エッジ・ブロックを伝送す
る為に追加のビットが利用できる様になるが、ノン・エ
ッジ・ブロックに於ける品質の劣化を持ち込むことは殆
どない。
【0018】本発明に係る適応型DCT符号化(図5の
ブロック12)の一実施例の詳細ブロック図を図6に示
す。
【0019】1.エッジの抽出 入力画像上のエッジを線近似方式により抽出する(図5
のブロック10)。この方式は、階層型エッジ検出(h
ierarchical edge detectio
n)と呼ばれる。オーバヘッドを減らす為、減数した像
(decimated image)に対してエッジの
抽出を適用する。これは、エッジのデータ、計算の複雑
さ並びに、ブロック分類の為メモリ空間が減少すると云
う利点がある。その結果行なわれるブロックの分類が主
符号化過程、即ち、適応型DCT符号化にとって適切で
あることを保証するくらいに、エッジの場所が精密でな
ければならないから、1/4のサイズの像(水平方向も
垂直方向も1/2)を使う。ブロックの分類は若干変更
するが、その違いによっては、全体的な符号化性能の低
下は殆ど起こらない。使う減数フィルタは符号器の選択
に任される。これは、フィルタがその後に続く過程、即
ち、エッジの抽出に余り影響しないからである。エッジ
抽出過程の詳細は後述する。
【0020】2.ブロック分類(図5のブロック11)
【0021】この段階では、各々のブロックが例えばK
個の類の内の1つ{Ck ,k=0,…K−1}に分類さ
れる。ここで、各々の類は走査順序と関係している。エ
ッジデータは基本的には出発点の座標、方向及び長さで
構成される。従って、再生されたエッジが、エッジの幾
何学的な特徴を示す。ブロック分類の例を図7に示す。
2本のエッジが存在するブロック(マルチ・エッジ・ブ
ロック)がb0とb1、1本のエッジが存在するブロッ
ク(エッジ・ブロック)がa0、a1、a2、b2及び
c0、エッジの存在しないブロック(ノン・エッジ・ブ
ロック)がc1及びc2の分類される。
【0022】各々のエッジは図8に示す様に、16の方
向に量子化されるので、各々のブロックは多くて18個
の類に分類される。即ち、K=18であり、これが16
個のエッジブロック、1つのマルチ・エッジを持つブロ
ック及び1つのノン・エッジ・ブロックで構成される。
マルチ・エッジを持つブロックは、2つ又は更に多くの
エッジを持つブロックであり、ノン・エッジ・ブロック
は何等エッジを持っていない。1/4サイズの像をエッ
ジの抽出に使う時、8×8ブロックの代わりに、4×4
ブロックを検査する。
【0023】前に述べた様に、ノン・エッジ・ブロック
は、図9に示す様に16×16画素のブロックに統合さ
れる。図9に示す様に8×8であるように残された若干
のノン・エッジ・ブロックは、16×16のノン・エッ
ジ・ブロックとは別個に取り扱う。
【0024】3.適応型走査(図5のブロック12及び
図6の各ブロック) ブロック分類が行なわれた後、各々のブロックが、類に
関連する走査順序で符号化される(図5のブロック1
2)が、詳細には、先ず、入力ブロックに対して可変ブ
ロックサイズDCTの処理が行われる(図6のブロック
13)。可変ブロックサイズDCTは数式(1)のMの
値をブロックサイズ(例えば、16×16ブロックDC
Tの場合はM=16)とすることで実現できる。ブロッ
クサイズの分類はエッジの有無により行われ、16×1
6のブロック内にエッジが存在すれば4分割して8×8
ブロックDCTとして処理し、エッジが存在しなければ
16×16ブロックDCTとして処理する。次に量子化
が実施されるが(ブロック4)、この動作は図1で説明
された量子化(ブロック2)の動作と基本的には同一で
あるが、本実施例ではブロックの類に依らず、図3の量
子化マトリックスを用いている。適切な数の類は像の形
式、即ち、ブロックDCT係数の分布に関係するもので
なければならない。その為、像順序を符号化する前に、
何組かの走査順序が限定される融通性を持った制御機構
を採用し、その後、フレーム毎に、その中で各々の類に
対する最適の走査順序を選ぶ(図6のブロック15)。
シミュレーションでは、5組の走査順序Si ,i=0,
1…,S−1(S=5)が決められている。S0 及びS
4 が夫々図10及び11に示されており、S2 は図2の
ジグザグ型走査と同一である。S1 はS0 とS2 の中間
であり、S3 もS4 とS2の中間である。続いて可変長
符号化が行われる(ブロック16)が、この動作は図1
で説明したVLC(ブロック3)の動作と同じである。
【0025】適応型走査方法がどの様に作用するかを説
明する。ブロックに垂直のエッジが存在すると仮定する
と、伝送すべき対応するDCT AC係数は図12に示
す様になり得る。ブロックがS0 に関係したものに分類
されることが予想され、ここで実際にそうなったと仮定
する。その時、ジグザグ走査順序及びS0 を用いたDC
T係数に対するコードワードが表2に示されている。本
実施例においては、MPEG−1で特定されたVLC及
び量子化が使用される。これにより、DCT係数を符号
化する時に8ビットを節約することができる。
【0026】
【表2】
【0027】像シーケンスの符号化では、各々の類に対
する最適走査を求める制御ルーチンが必要である。この
為、符号器は、類毎に各々の座標で伝送されるDCT係
数の発生を計数しなければならない。然し、常にジグザ
グ走査されるので、16×16のノン・エッジ・ブロッ
クに対する係数は計数する必要はない。映像を処理した
後、s及びkが走査順序及び類を表わすものとして、判
定基準δ(s,k)を次の様に計算する。
【数3】 ここでs=0,1…S−1,及びk=0,1…K−1で
あり、path[s][i][j]は走査sの(i,
j)に於ける順序、cnt[k][i][j]は類kの
(i,j)に於ける係数の数を表わす。
【0028】この後、上に述べた判定基準を使って最終
的な判定が下される。
【0029】
【数4】
【0030】従って、各々の類に対してどの走査順序が
用いられるかを示すK log2 Sビットが、映像を符
号化する前に伝送されなければならない。シミュレーシ
ョンでは、一つの映像で下された判定が次の映像でも使
われ、走査順序の初期状態が次の様に設定された。
【0031】
【数5】
【0032】[エッジの抽出]エッジの抽出(図5のブ
ロック10)に関して図13を用いて詳述する。図13
はエッジの抽出のブロック図を示す。この過程の各部分
を次に説明する。
【0033】1.単位エッジの検出(ブロック18) エッジの場所を突き止める為、最初に、周知のラプラー
ス演算子を入力像に適応し(ブロック17)、その後、
強度変動が大きい位置、即ち、エッジを表わす2進像
(バイナリ・イメージ)が、μ+K・σを用いた閾値作
用によって求められる。ここで、μ,σ及びKはそれぞ
れ、平均、微分空間の標準偏差及び係数である。8方向
の小さいセグメント・パターンの一例が図14に示され
ており、これらが、n=0,1…7として、テンプレー
トTn によって表わされており、(j,k)に於ける各
々の入口がtn (j,n)によって表わされる。Λ
(x,y)を、j,k=0,1,2,3,4として、λ
(x+j,y+k)で表わされる、5×5画素領域で構
成された2進像内の部分領域とする。テンプレートTn
及びΛ(x,y)の間の相互相関Rn (x,y)が次の
式によって計算される。
【0034】
【数6】
【0035】この後、Rn (x,y)が8に等しいか又
はそれより大きくなる様なnが存在すれば、n−ビット
平面内の座標(x,y)でフラグを高にする。ここでn
は0から7まで変化する。これは、座標(x,y)でテ
ンプレートtn が整合パターンとして検出されたことを
示す。この過程は2進像全体に適用されなければならな
い。こうして単位エッジが得られる。
【0036】2.マクロエッジの検出(ブロック19) 単位エッジを抽出した後、図15に示す様に、マクロエ
ッジの検出が実施される。単位エッジが接続されてマク
ロエッジになる。このマクロエッジは、16の方向に、
即ち11.25°間隔で定められる。検出の出発点は、
8個の内の任意のビット平面のフラグが作用している画
素と定めることができる。こう云う点は、ラスター走査
式に求めて、出発点の下方に接続する探索区域を局限す
ることができる。
【0037】n−ビット平面内のフラグが作用している
出発点が見つかったと仮定すると、検出過程の方向Nが
N=2nに従って定められ、そこから後続の探索動作が
適用される。探索動作の前にマクロエッジの方向を予め
決定するのはリスクがあるので、考えられる3つの方
向、即ち、N,N−1及びN+1の内の最も考えられる
方向を選ぶ。考えられる各々の方向で、各方向に沿った
単位長Lunit毎にある各々の接続点(図15参照)で、
マクロエッジが接続されているかどうかを判断する。
n,(N−1)/2,又は(N+1)/2の何れかのビ
ット平面内のフラグが接続点又はその近辺で、即ち8個
の隣り合う画素で作用していれば、マクロエッジを接続
点まで延長する。こうして得られた3つのマクロエッジ
の候補の内、最も長いものが符号化されるマクロエッジ
となる権利を持つ。一旦マクロエッジが検出されると、
同様なマクロエッジを抽出することを避ける為の後処理
を用いることが望ましい。n,(N−1)/2,又は
(N+1)/2の何れかのビット平面内の抽出されたマ
クロエッジ及びそれに隣り合う8個の画素に対応する一
連の画素を中立とする。これはマクロエッジを減衰させ
る役割を果たし、像内の抽出されるマクロエッジの数を
減らすのを大いに助ける。
【0038】3.エッジデータの符号化 表3はマクロエッジ当たりの符号化されるメッセージで
ある。出発点に関するメッセージは、適正な符号化方式
を使うことによって更に圧縮することができる。
【0039】
【表3】 本発明に係るブロック分類に基づいて、各々の類に対す
る伝送されるDCT係数の分布を解明する為の予備実験
を実施した。基準モデルとしてMPEG−1のI映像符
号化を用い、比較を公平にする為、シュミレーション実
験を繰り返して実行して、ビットの合計数が基準モデ
ル、即ち、MPEG−1のそれとなるべく近くなる様に
した。表4は、この実験で得られた統計結果を示す。
【0040】
【表4】 本発明におけるアルゴリズムがブロック分類の為のビッ
トをかなり節約することができることが認められる。表
に示した幾何学的なエッジ表示に対するデータ速度は常
に1,320×log2 5である。ここで、1,320
は、352×240サイズの像内にある8×8ブロック
の数に対応し、log2 5は各々のブロックに対して5
つの候補の間の走査順序を示す為に必要である。
【0041】この結果から、本アルゴリズムが、ビット
を約8%節約することにより、全般的に基準モデルの性
能を凌ぐことが示された。
【0042】上述の様に実施例に関し説明したが、本発
明はこれに限られるものではない。
【0043】
【発明の効果】画像信号に対し効率の良い圧縮符号化を
達成する。
【図面の簡単な説明】
【図1】従来の適応型DCT符号化方式のブロック図。
【図2】ジグザグ走査順序を説明する図。
【図3】デフォルト量子化マトリクスを説明する図。
【図4】エッジ方向とDCT係数との関係を説明する
図。
【図5】本発明のアルゴリズムを示すブロック図。
【図6】本発明におけるDCT符号化の一実施例を示す
ブロック図。
【図7】ブロック分類の一例を示す図。
【図8】各エッジが16の方向に量子化されることを示
す図。
【図9】ノン・エッジ・ブロックが統合されることを説
明する図。
【図10】シミュレーションで使用した走査順序S0を
示す図。
【図11】シミュレーションで使用した走査順序S4を
示す図。
【図12】DCT AC係数の一例を示す図。
【図13】本発明におけるエッジ抽出プロセスの一実施
例を示すブロック図。
【図14】単位エッジ検出における8方向セグメント・
パターンを示す図。
【図15】マクロエッジ検出を説明する図。
【符号の説明】
10 エッジ抽出ステップ 11 ブロック分類ステップ 12 適応型DCT符号化ステップ 13 可変ブロックサイズDCTステップ 14 量子化ステップ 15 走査順序制御ステップ 16 可変長符号化ステップ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力画像の1フレーム上でエッジを抽出
    し、 前記フレームを、前記抽出エッジが存在するブロックと
    存在しないブロックに分類し、 前記抽出エッジが存在する前記ブロックについて、エッ
    ジの方向と離散コサイン変換係数の分布との間の相関性
    に基き最適な走査順序を定めてその走査順序で符号化す
    るステップを含む画像信号の符号化方法。
JP26887796A 1996-10-09 1996-10-09 画像信号の符号化方法 Expired - Fee Related JP3967405B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP26887796A JP3967405B2 (ja) 1996-10-09 1996-10-09 画像信号の符号化方法
US08/947,575 US6608865B1 (en) 1996-10-09 1997-10-09 Coding method for video signal based on the correlation between the edge direction and the distribution of the DCT coefficients
EP19970308006 EP0836328A3 (en) 1996-10-09 1997-10-09 A coding method for a video signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26887796A JP3967405B2 (ja) 1996-10-09 1996-10-09 画像信号の符号化方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007052344A Division JP4128604B2 (ja) 2007-03-02 2007-03-02 画像信号の符号化方法

Publications (2)

Publication Number Publication Date
JPH10126775A true JPH10126775A (ja) 1998-05-15
JP3967405B2 JP3967405B2 (ja) 2007-08-29

Family

ID=17464509

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26887796A Expired - Fee Related JP3967405B2 (ja) 1996-10-09 1996-10-09 画像信号の符号化方法

Country Status (3)

Country Link
US (1) US6608865B1 (ja)
EP (1) EP0836328A3 (ja)
JP (1) JP3967405B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040027047A (ko) * 2002-09-27 2004-04-01 삼성전자주식회사 예측 스캐닝을 이용한 영상 부호화/복호화 방법 및 장치
JP2008004983A (ja) * 2006-06-20 2008-01-10 Sony Corp 画像理装置および方法、プログラム、並びに記録媒体
JP4824259B2 (ja) * 2000-07-17 2011-11-30 テレフオンアクチーボラゲット エル エム エリクソン(パブル) より良い予測のための代替ブロック順序
JP2012169762A (ja) * 2011-02-10 2012-09-06 Sony Corp 画像符号化装置と画像復号化装置およびその方法とプログラム
JP2018509069A (ja) * 2015-02-08 2018-03-29 同済大学 画像符号化方法及び装置並びに画像復号方法及び装置

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1041826A1 (en) * 1999-04-01 2000-10-04 Lucent Technologies Inc. Apparatus for coding data and apparatus for decoding block transform coefficients
FI117533B (fi) * 2000-01-20 2006-11-15 Nokia Corp Menetelmä digitaalisten videokuvien suodattamiseksi
US20030099294A1 (en) * 2001-11-27 2003-05-29 Limin Wang Picture level adaptive frame/field coding for digital video content
US7162094B2 (en) * 2001-11-27 2007-01-09 General Instrument Corporation Frequency coefficient scanning paths for coding digital video content
FI116710B (fi) * 2002-12-20 2006-01-31 Oplayo Oy Kuvien koodausmenetelmä ja -järjestely
US8824553B2 (en) * 2003-05-12 2014-09-02 Google Inc. Video compression method
US7521174B2 (en) * 2003-12-05 2009-04-21 Albert Einstein College Of Medicine Of Yeshiva University Universal red blood cells, methods of preparing same, and uses thereof
US7953152B1 (en) 2004-06-28 2011-05-31 Google Inc. Video compression and encoding method
US8311119B2 (en) 2004-12-31 2012-11-13 Microsoft Corporation Adaptive coefficient scan order
US20060227865A1 (en) * 2005-03-29 2006-10-12 Bhaskar Sherigar Unified architecture for inverse scanning for plurality of scanning scheme
US7885335B2 (en) * 2005-09-16 2011-02-08 Sont Corporation Variable shape motion estimation in video sequence
US20070064805A1 (en) * 2005-09-16 2007-03-22 Sony Corporation Motion vector selection
US8107748B2 (en) * 2005-09-16 2012-01-31 Sony Corporation Adaptive motion search range
US7596243B2 (en) 2005-09-16 2009-09-29 Sony Corporation Extracting a moving object boundary
US7620108B2 (en) * 2005-09-16 2009-11-17 Sony Corporation Integrated spatial-temporal prediction
US7894527B2 (en) * 2005-09-16 2011-02-22 Sony Corporation Multi-stage linked process for adaptive motion vector sampling in video compression
US7894522B2 (en) * 2005-09-16 2011-02-22 Sony Corporation Classified filtering for temporal prediction
US8059719B2 (en) * 2005-09-16 2011-11-15 Sony Corporation Adaptive area of influence filter
US8005308B2 (en) * 2005-09-16 2011-08-23 Sony Corporation Adaptive motion estimation for temporal prediction filter over irregular motion vector samples
US7957466B2 (en) * 2005-09-16 2011-06-07 Sony Corporation Adaptive area of influence filter for moving object boundaries
US8165205B2 (en) * 2005-09-16 2012-04-24 Sony Corporation Natural shaped regions for motion compensation
US8200033B2 (en) 2005-11-30 2012-06-12 Koninklijke Philips Electronics N.V. Encoding method and apparatus applying coefficient reordering
KR20090097689A (ko) * 2008-03-12 2009-09-16 삼성전자주식회사 영상의 인트라 예측 부호화/복호화 방법 및 장치
JPWO2010052833A1 (ja) * 2008-11-07 2012-03-29 三菱電機株式会社 画像符号化装置及び画像復号装置
US10992958B2 (en) 2010-12-29 2021-04-27 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
US9826229B2 (en) 2012-09-29 2017-11-21 Google Technology Holdings LLC Scan pattern determination from base layer pixel information for scalable extension
US9350988B1 (en) 2012-11-20 2016-05-24 Google Inc. Prediction mode-based block ordering in video coding
US9681128B1 (en) 2013-01-31 2017-06-13 Google Inc. Adaptive pre-transform scanning patterns for video and image compression

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3049672B2 (ja) * 1991-12-26 2000-06-05 キヤノン株式会社 画像処理方法及び装置
US5410350A (en) * 1992-10-28 1995-04-25 Sony Corporation Motion picture encoding and/or decoding system
EP0607484B1 (en) 1993-01-20 1998-09-09 Samsung Electronics Co. Ltd. Method and device for encoding and decoding image data
US5724097A (en) * 1993-10-18 1998-03-03 Mitsubishi Denki Kabushiki Kaisha Adaptive quantization of video based on edge detection
JP3415270B2 (ja) * 1994-06-03 2003-06-09 ソニー株式会社 画像信号符号化方法及び復号方法
US5552832A (en) * 1994-10-26 1996-09-03 Intel Corporation Run-length encoding sequence for video signals
KR0181032B1 (ko) 1995-03-20 1999-05-01 배순훈 인터리빙을 이용한 물체 기반 부호화방법 및 장치

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4824259B2 (ja) * 2000-07-17 2011-11-30 テレフオンアクチーボラゲット エル エム エリクソン(パブル) より良い予測のための代替ブロック順序
KR20040027047A (ko) * 2002-09-27 2004-04-01 삼성전자주식회사 예측 스캐닝을 이용한 영상 부호화/복호화 방법 및 장치
JP2008004983A (ja) * 2006-06-20 2008-01-10 Sony Corp 画像理装置および方法、プログラム、並びに記録媒体
JP2012169762A (ja) * 2011-02-10 2012-09-06 Sony Corp 画像符号化装置と画像復号化装置およびその方法とプログラム
US9153041B2 (en) 2011-02-10 2015-10-06 Sony Corporation Image coding device, image decoding device, methods thereof, and programs
US9852521B2 (en) 2011-02-10 2017-12-26 Sony Corporation Image coding device, image decoding device, methods thereof, and programs
JP2018509069A (ja) * 2015-02-08 2018-03-29 同済大学 画像符号化方法及び装置並びに画像復号方法及び装置

Also Published As

Publication number Publication date
EP0836328A3 (en) 1999-07-14
JP3967405B2 (ja) 2007-08-29
EP0836328A2 (en) 1998-04-15
US6608865B1 (en) 2003-08-19

Similar Documents

Publication Publication Date Title
JP3967405B2 (ja) 画像信号の符号化方法
US9698821B2 (en) Method and arrangement for coding transform coefficients in picture and/or video coders and decoders and a corresponding computer program and a corresponding computer-readable storage medium
AU2002318196B2 (en) An apparatus and method for encoding digital image data in a lossless manner
JP4113114B2 (ja) Golomb−riceコーディングを使用するdct圧縮
KR100530681B1 (ko) 부호화된비디오화상의송신및수신방법
EP1423971A2 (en) Lossless intraframe encoding using golomb-rice
AU2002316546A1 (en) Lossless intraframe encoding using golomb-rice
JP2015039176A (ja) ディジタル画像および音声データを無損失に復号化するためのシステムおよび方法
JP2004531995A5 (ja)
AU2002318196A1 (en) An apparatus and method for encoding digital image data in a lossless manner
CN1539239A (zh) 帧间编码的方法和装置
US6084913A (en) Method for compressing dynamic image information and system and device therefor
JP4128604B2 (ja) 画像信号の符号化方法
JP2839987B2 (ja) 画像信号復号器
Itoh An adaptive DCT coding with geometrical edge representation
WO1999005649A1 (en) Adaptive entropy encoding/decoding
JP3708218B2 (ja) 画像の符号化方法
CN119728974A (zh) 图像解码和编码方法、装置、设备及存储介质
JPH09116899A (ja) 画像データの圧縮方法
Vermeirsch et al. Region-Adaptive Probability Model Selection for the Arithmetic Coding of Video Texture Authors: K. Vermeirsch, J. Barbari
JP2002209220A (ja) 動画像情報の圧縮方法およびそのシステム
HK1067953B (en) A system and method for decoding digital image and audio data in a lossless manner

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050902

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20051202

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20051207

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20061205

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20061211

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070410

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070531

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110608

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130608

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees