[go: up one dir, main page]

JP2008511261A - 効率的なビデオスライシング - Google Patents

効率的なビデオスライシング Download PDF

Info

Publication number
JP2008511261A
JP2008511261A JP2007530055A JP2007530055A JP2008511261A JP 2008511261 A JP2008511261 A JP 2008511261A JP 2007530055 A JP2007530055 A JP 2007530055A JP 2007530055 A JP2007530055 A JP 2007530055A JP 2008511261 A JP2008511261 A JP 2008511261A
Authority
JP
Japan
Prior art keywords
video
size
ltu
slice
video slice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007530055A
Other languages
English (en)
Other versions
JP4995725B2 (ja
Inventor
リー、イエン−チ
ツァイ、ミン−チャン
エル−マレー、クハレド・ヘルミ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2008511261A publication Critical patent/JP2008511261A/ja
Application granted granted Critical
Publication of JP4995725B2 publication Critical patent/JP4995725B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • H04N19/68Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving the insertion of resynchronisation markers into the bitstream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【解決手段】本開示は、複雑さの低減、帯域幅効率化、および誤り回復力を促進するビデオスライシング技術に向けられる。ビデオエンコーダは、RMを、各論理送信ユニット(LTU)の開始近くに配置する。これによって、各ビデオスライスの非常に小さな終了セグメントの殆どが、LTU内に実質的に適合するようになる。LTU境界における正確なRMの配置を必要とするのではなく、ビデオエンコーダは、近似アラインメント技術を適用する。RMが、各LTUの開始近く、例えばLTU内の最初のMBの終わりに配置できるようにビデオスライスは符号化される。前のスライスからの最後のMBの一部は、次のLTUへ移る。実際、LTUの損失は、現在のスライス全体に、前のスライスの極く一部を加えたものの損失となる。
【選択図】 図2

Description

本開示は、デジタルビデオ符号化に関し、特に、デジタルビデオフレームをスライスする技術に関する。
典型的なビデオエンコーダ実装では、送信中のデータ損失のインパクトを低減するために、エンコーダ側において、デジタルビデオフレームがビデオスライスへ分割される。ビデオスライスはそれぞれ独立して符号化されて復号される。誤りが検出される場合、デコーダは、破壊されたスライス内に、全てマクロブロック(MB)を隠蔽(conceal)する。隠蔽は、誤って復号されたMBの表示及び伝搬を防ぐ。そうしなければ、ユーザへ表示されるビデオの品質が低下しうる。
ビデオスライスは、一般に、誤りが検知された場合、同期を再設定するためにデコーダによって使用される再同期マーカ(RM:resynchronization marker)を用いて開始される。データ損失を最小にするために、ビデオスライスは、理想的には、ビデオ伝送システム内の最も少ない損失単位に相当する。この最も少ない損失単位は、通信チャンネルを介して送信される最も小さな情報単位である。無線システムでは、この最も小さな損失単位は、論理送信ユニット(LTU:logical transmission unit)と呼ばれる。それは固定長又は可変長を持つ。
ビデオスライスがそれぞれLTUのサイズならば、LTU損失による如何なる誤りも、他のスライスに影響を与えずに、損失スライス内に局在化されるだろう。しかしながら、ビデオスライスとLTUとの間の正確なアライメントを達成するのは難しい。特に、RMは、MB境界にのみ配置することができ、ビデオフレーム内に任意に配置することはできない。その結果、エンコーダが、与えられたLTU内で正確に適合するようにスライスサイズを調節することは難しい。
LTUスライスアライメント用の1つの技術は、MBの量子化ステップサイズを調節し、スライス長を調節するスライスレベルレート制御を含む。不運にも、この技術は、エンコーダ設計に著しい複雑さを加え、かつ必ずしも正確ではない。他の技術は、そのサイズが予め定めた長さを超えるまでスライスを符号化することと、次に、符号化されたビデオの終わりと、LTUの終わりとの間にパディングバイトを加えることとを含む。しかしながら、このアプローチは、帯域幅効率を低下させる。
本出願は、2004年8月23日に出願され、その全ての内容が参照により本明細書に組み込まれている米国仮出願60/603,978号の利益を要求する。
一般に、本開示は、複雑さの低減、帯域幅効率化、及びおよび誤り回復力を促進するビデオスライシング技術に向けられる。この技術によれば、ビデオエンコーダは、RMを、各論理送信ユニット(LTU)の開始近くに配置する。これによって、各ビデオスライスの非常に小さな終了セグメントの殆どが、LTU内に実質的に適合するようになる。
ビデオスライス及びLTUの厳密なアライメントに要求されるような、LTUの開始における正確なRM配置を必要とするのではなく、ビデオエンコーダは、近似アラインメント技術を適用する。この技術によれば、RMが、各LTUの開始近く、例えばLTU内の最初のMBの終わりに配置できるようにビデオスライスは符号化される。よって、前のスライスからの最後のMBの一部は、次のLTU上へ移る。この場合、LTUの損失は、スライス全体に、前のスライスの極く一部、例えば1MBを加えた損失となる。
前のスライスのように、損失したスライスの極く僅かな部分、例えば1MBが次のLTUへ運ばれるだろう。しかしながら、その部分は復号に使用されないだろう。この近似アラインメント技術は、正確なアライメント技術に比べて、損失データ内に単に1つのMBを追加するだけで、複雑さを著しく低減して達成することができる。LTU境界にRMを正確に配置するか、あるいはMB量子化ステップのスライスレベル制御を提供する必要性はない。これによって、複雑さを低減することができる。更に、スライス内にバイトをパディングする必要もない。これによって、帯域幅効率化を図ることができる。
1つの実施形態では、本開示はビデオ符号化方法を記述する。この方法は、論理送信ユニット(LTU)のサイズを決定することと、LTUサイズと等価な目標ビデオスライスサイズを生成することと、そのサイズが、前記目標ビデオスライスサイズよりも大きくなるまで第1のビデオスライスを符号化することとを含む。この方法は更に、第1のビデオスライスのサイズと、目標ビデオスライスサイズとの差を判定するここと、第1のビデオスライスの終わりに再同期マーカ(RM)を挿入することと、目標ビデオスライスサイズを、LTUサイズから前記差を引いたものに等しくなるように更新することと、第2のビデオスライスを、そのサイズが、更新された目標ビデオスライスサイズよりも大きくなるまで符号化することとを含む。本開示はまた、そのような方法をプロセッサに実行させる命令を含むコンピュータ読取可能媒体を意図する。
別の実施形態では、本開示は、論理送信ユニット(LTU)のサイズを推定する論理送信ユニット(LTU)サイズ推定モジュールと、目標ビデオスライスサイズを決定するスライスサイズ決定モジュールと、目標ビデオスライスサイズよりもそのサイズが大きくなるまで第1のビデオスライスを符号化し、第1のビデオスライスのサイズと、目標ビデオスライスサイズとの差を判定するビデオスライスジェネレータと、第1のビデオスライスの終わりに、再同期マーカ(RM)を挿入することとを備えるビデオ符号化システムを記述する。スライスサイズ決定モジュールは、LTUサイズからこの差を引いたものに等しくなるように目標ビデオスライスサイズを更新する。ビデオスライスジェネレータは、更新された目標ビデオスライスサイズよりもそのサイズが大きくなるまで第2のビデオスライスを符号化する。
更なる実施形態では、本開示は、デジタルビデオフレームをビデオスライスへ分割することと、各スライスの第1の部分が1つの第1の物理レイヤ論理送信ユニット(LTU)内に存在し、高々1マクロブロック(MB)のサイズを持つ各スライスの第2の部分が第2の物理レイヤLTU内に存在するようにスライスの各々をサイジングすることとを含むビデオ符号化方法を記述する。
1つ又は複数の実施形態の詳細が、添附図面及び下記記述において説明される。他の特徴、目的および長所は、この記述と図面、及び特許請求の範囲から明白になるであろう。
図1は、ビデオ符号化及び復号システム10を図示するブロック図である。図1に示すように、システム10は、伝送チャネル16によって接続されたエンコーダシステム12とデコーダシステム14とを含む。エンコーダシステム12は、マルチプレクサ(MUX)18、ビデオエンコーダ20、およびオーディオエンコーダ22を含む。デコーダシステム14は、デマルチプレクサ(DEMUX)26、ビデオデコーダ28、およびオーディオデコーダ30を含む。
システム10は、例えばビデオ電話通信のために、双方向ビデオ送信を提供しうる。従って、相反する符号化と復号、MUXとDEMUXの各コンポーネントが、チャネル16の反対端上で提供されうる。いくつかの実施形態では、エンコーダシステム12およびデコーダシステム14は、ビデオストリーミング、ビデオ電話通信あるいはその両方のために装備された無線モバイル端末のようなビデオ通信デバイス内で具体化されうる。モバイル端末は、国際電気通信連合H.324M規格、あるいはRTP/UDP/IPのような他の規格に従ってビデオ電話通信をサポートする。
ビデオエンコーダ20は、MPEG−4のような画像圧縮方法によって符号化されるビデオデータを生成する。国際電気通信連合(ITU)H.263、ITU H.264あるいはMPEG2方法のような他の画像圧縮方法が使用されてもよい。オーディオエンコーダ22は、ビデオデータを伴うオーディオデータを符号化する。
MUX 18は、ビデオエンコーダ20およびオーディオエンコーダ22から適応レイヤビデオユニットおよびオーディオデータユニットを得る。MUX 18は、ビデオデータおよびオーディオデータを多重化し、チャネル16を経由した送信用の多重データユニットのシリーズを形成する。一例として、MUX 18およびDEMUX 26は、ITUによって公表されたH.223マルチプレクサプロトコルに従って動作しうる。しかしながら、ユーザデータグラムプロトコル(UDP)のような他のプロトコルが使用されてもよい。
チャネル16は、多重化された情報を、物理レイヤデータユニットとしてデコーダシステム14へ搬送する。これは、論理送信ユニット(LTU)と称される。チャンネル16は、エンコーダシステム12とデコーダシステム14との間の任意の物理的接続でありうる。例えば、チャネル16は、ローカルあるいは広域ネットワークのような有線接続かもしれない。あるいは、本明細書に記述しているように、チャネル16は、例えばセルラ、衛星、又は光接続のような無線接続かもしれない。
DEMUX 26は、LTUから多重データユニットを識別し、多重レイヤデータユニットのコンテンツを非多重化し、ビデオ及びオーディオ適応レイヤデータユニットを生成する。適応レイヤデータユニットは、適応レイヤにおいて処理され、ビデオデータフレームが生成される。ビデオデコーダ28は、アプリケーションレイヤにおいてビデオデータフレームを復号し、ディスプレイデバイスを駆動する際に使用されるビデオデータのストリームを生成する。ビデオデコーダ28は、特に、ビデオデータフレーム内の個々のビデオスライスを復号する。オーディオデコーダ30は、オーディオデータを復号し、オーディオを生成する。
本開示に従って、エンコーダシステム12は、帯域幅効率化及び誤り回復力を提供する複雑さの少ないビデオスライシング技術を適用する。ビデオスライスとLTUとの厳密なアラインメントに必要なように、LTUの開始にRMを正確に配置する必要はなく、エンコーダシステム10は、近似アラインメント技術を適用する。この技術によれば、例えば、LTU内の第1のMBの終わりにおいてのように、各LTUの開始近くにRMが配置されるようにビデオスライスが符号化される。この場合、前のスライスからの1つのMBは、次のLTUへ移る。
近似アラインメント技術を使用して、LTUの損失は、実質的に、スライス全体に、例えば1MBのような、前のスライスの極く一部を加えた損失となる。特に、各LTUは、現在のスライスの大部分が続く前のスライスの非常に小さな終了セグメントを含む。そして、現在のスライスは、前のスライスのように、次のLTUへ移る小さな終了セグメントを有する。従って、スライスはそれぞれ、僅かにオーバラップしている2つの連続したLTU部分にまたがる。例えば1MBのようなスライスの極く一部は、次のLTUに移るであろうが、その部分は、前のLTUが送信中に失われた場合、復号のために使用されないだろう。しかしながら、前のLTUが失われないのであれば、この部分は、今までどおりフレーム完全性のために、復号に使用することができる。したがって、実際には、LTUの損失は、スライス全体の損失に、前のスライスからのMBの損失を加えたものとなる。
近似アラインメント技術は、本明細書で記載したとおり、正確なアライメント技術と比較して、単に1つの損失MBをもたらすだけで、複雑さの大幅な低減が達成される。1つの追加損失MBは、損失LTUに移る前のスライスからのMBである。この技術によれば、LTU境界に正確にRMを配置する必要も、スライスレベルにおいてMB量子化ステップを制御する必要もないので、エンコーダ実装の複雑さを低減する。更に、スライス内にバイトをパディングする必要もないので、より帯域幅効率化を図ることができる。
図2は、本開示に従った効率的なビデオスライシング技術を適用するビデオエンコーダシステム12の実施形態を図示するブロック図である。ビデオエンコーダシステム12は、例えばH.324Mビデオ会議のようなストリーミングビデオ又はビデオ電話通信の配信を含む様々なビデオアプリケーションをサポートしうる。図2に示すように、ビデオエンコーダシステム12は、MUX 18及びビデオエンコーダ20を含んでいる。ビデオエンコーダ20は、例えばビデオカメラ又はビデオアーカイブのようなビデオ入力デバイス24からビデオを受け取るエンコーダエンジン22を含む。エンコーダエンジン22は、到来するビデオビットストリームから一連のマクロブロック(MB)を生成する。
ビデオスライスジェネレータ26は、エンコーダエンジン22からのビデオビットストリームを、ビデオスライスに分割する。各ビデオスライスは、一連のMBを伝送する。それは数が異なるかもしれない。連続的なスライスを示すために、ビデオスライスジェネレータ26はRMを挿入する。RMは、選択されたMBの境界に挿入される。従って、与えられたビデオフレーム内で一連のスライスを形成するために、ビデオスライスジェネレータ26は、選択されたMB境界に、一連のRMを選択的に挿入する。
説明するように、スライスサイズ決定モジュール28は、適切な位置においてスライスを生成するようにビデオスライスジェネレータ26を導く。スライスサイズ決定モジュール28は、ビデオスライスジェネレータ26によって生成された前のスライスサイズと、ビデオLTUサイズとを活用して、目標スライスサイズを生成する。ビデオスライスジェネレータ26は、この目標スライスサイズを用いて次のスライスを生成する。
本開示では、用語「LTU」およびビデオLTUは、物理レイヤLTUのビデオ部分を称するために、置き換え可能で使用されうる。しかしながら、物理レイヤLTUは、通常、オーディオLTUとして明示されうるオーディオ情報を含むと理解されるべきである。ビデオスライスのLTU境界とのアラインメントに関して、そのような境界は、物理レイヤLTU内でのオーディオLTUおよびビデオLTUの組合せを考慮しているかもしれないこと、また、そのような境界は、そのような組合せからの連続したLTU間の境界を指すかもしれないことが理解されるべきである。
適応レイヤモジュール30は、ビデオスライスへ分割されたビデオフレームをビデオスライスジェネレータ26から受け取り、ビデオ適応レイヤプロトコルデータユニット(AL−PDU)を生成する。MUX 18は、ビデオAL−PDUを受け取り、それをオーディオエンコーダから受け取ったオーディオAL−PDUと合成するMUXエンジン32と、無線モデム34、無線周波数送信機/受信機(TX/RX)35、およびアンテナ36を経由して送信されるMUX PDUを生成するオーディオ適応レイヤモジュール(図示せず)とを含む。TX/RX 35は、符号分割多元接続(CDMA)、広帯域CDMA(W−CDMA)、あるいは時分割多元接続(TDMA)のような様々な無線送信技術のうちの何れかに従ってラジオ周波数(RF)無線信号を送信するように構成されうる。
MUX 18の内のビデオLTUサイズ推定モジュール38は、MUXエンジン32によって生成された各MUX PDUのビデオ部分のサイズ、および無線送信機34によって生成された物理レイヤLTUのサイズを追跡する。例えば、MUXエンジン32は、各MUX PDU内のビデオ情報に対するオーディオ情報の比率の表示(AUDIO:VIDEO)を、ビデオLTUサイズ推定モジュール38に提供しうる。さらに、無線モデム34は、空気インタフェースを通して送信されたLTUの実際のサイズの表示を、ビデオLTUサイズ推定モジュール38に提供する。
これらのパラメータを使用して、ビデオLTUサイズ推定モジュール38は、各LTUのビデオ部分のサイズ、すなわち、ビデオLTUサイズを推定する。いくつかの実装では、AUDIO:VIDEO比率及びLTUサイズは共に固定されているかもしれない。他の実装では、LTUサイズは固定されているかもしれないが、例えば、可変レートオーディオ符号化が使用される場合には、AUDIO:VIDEO比率は変わりうる。いずれの場合も、ビデオ符号化システム12は、物理レイヤ、MUXレイヤ、及びアプリケーションレイヤによって提供される情報に基づいてスライスサイズが決定されるユニークな伝送エンコーダクロスレイヤ設計を提供することが明らかである。
ビデオLTU推定モジュール38は、ビデオエンコーダ20内のスライスサイズ決定モジュール28へ、ビデオLTUサイズを通信する。従って、スライスサイズ決定モジュール28は、MUX 18の内のビデオLTUサイズ推定モジュール38から得られたビデオLTUサイズと、ビデオスライスジェネレータ26によって提供された前のスライスサイズとを使用して、目標スライスサイズを決定する。そして、スライスサイズ決定モジュール28は、スライスを生成する際にビデオスライスジェネレータ26によって使用される目標スライスサイズを生成する。これによって、ビデオフレーム内の適切なMB境界にRMを挿入することが可能となる。
いくつかの実施形態では、物理レイヤLTUはW−CDMA RLC PDUでありうる。あるいは、物理レイヤLTUは、例えばCDMA2000 1x RLP PDU、CDMA2000 1x EV−DO RLP PDU、CDMA2000 EV−DV RLP PDUのような様々な異なる形式をとってもよい。MUXエンジン32は、ITU H.223のような多重化プロトコルに従ってMUX PDUを生成する。しかしながら、本明細書に記載の技術は、例えばRTP/UDP/IP(Realtime Transport Protocol/User Datagram Protocol/Internet Protocol)を用いたSIPベースのプロトコル及びH.323ビデオ電話通信プロトコルのようなその他のビデオ伝送プロトコルにも適用可能でありうる。
W−CDMA又はCDMA2000を用いたMPEG−4無線送信の場合、RLC PDU又はRLP PDUが、送信中に損失を被る最小のユニットである。例えば、W−CDMA RLC−PDUは、長さ160バイトであり、20ミリ秒毎に送信される。LTUのサイズにおおよそ等しいビデオスライスを生成するために、LTUサイズは既知でなければならない。いくつかの実装では、LTUサイズは時間にわたって変動するかもしれず、下にある伝送プロトコル/物理レイヤが、ビデオエンコーダ20にLTUサイズを通知する必要がある。その目的のために、ビデオLTUサイズ推定器38は、個々のビデオLTUのサイズを推定し、この情報を、ビデオエンコーダ20内のスライスサイズ決定モジュール28に通信する。
ビデオLTUサイズ推定器38は、様々な方法で実装されうる。W−CDMA上のいくつかの回路切替ビデオアプリケーションでは、LTUサイズは一定で、常に160バイトである。一例として、オーディオ符号化が、12.2Kbpsのレートで動作する場合、ビデオによって使用することができるバイト数は124バイトである。従って、この場合、ビデオLTUサイズは124バイトである。オーディオ符号化レートが変化する場合、ビデオLTUサイズは変化する。いずれの場合も、ビデオLTUサイズ推定器38は、ビデオスライス操作を行なうために、この情報をビデオエンコーダ20まで渡す。CDMA2000 1xのようなパケット交換ネットワークの場合、各RLP−PDUのためにビデオLTUサイズを動的に決定することが必要かもしれない。ビデオ会議サービスのために3GPP2によって検討されているように、ヘッダーオーバヘッドが取り除かれる場合、ビデオLTUサイズの動的な判定は容易になるかもしれない。
上述したように、LTUサイズ情報を物理レイヤからMUX 18へ渡し、ビデオLTUサイズ情報をMUX 18からビデオエンコーダ20へ渡すことによって、ビデオエンコーダシステム12は、効率的なビデオスライシングを促進するユニークな伝送エンコーダクロスレイヤ設計を提供する。このクロスレイヤ設計に従って、トランスポートレイヤは、RMを効率的に配置するために、追加情報をビデオエンコーダ20に渡す。その結果、不正確ではあるが、ビデオスライスとビデオLTUとの近似のアライメントが得られる。
本明細書に記述する技術は、汎用マイクロプロセッサー、デジタルシグナルプロセッサー(DSP)、特定用途向けIC(ASIC)、フィールドプログラム可能なゲートアレー(FPGA)、あるいはその他の等価ロジックデバイス内で実施されうる。例えば、ビデオエンコーダシステム12、及びそのコンポーネントは、デジタルシグナルプロセッサー(DSP)あるいはその他の処理デバイス上で動作するエンコード処理、すなわち符号化/復号(CODEC)処理の一部として実施されるかもしれない。従って、モジュールと記述されたコンポーネントは、そのような処理のプログラム可能な特徴を形成しうる。ビデオエンコーダシステム12は、専用のハードウェア、ソフトウェア、ファームウェア、あるいはこれらの組合せと同様に、命令及びデータを格納するための専用メモリを有しうる。ソフトウェアとして実施される場合、これら技術は、ランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、不揮発性ランダムアクセスメモリ(NVRAM)、電気消去可能プログラマブル読出し専用メモリ(EEPROM)、FLASHメモリ等のようなコンピュータ読取可能媒体上の命令として具体化されうる。これら命令は、1つ又は複数のプロセッサに、本開示で記述された機能のある局面を実行させる。
図3、図4および図5は、本明細書で記述された近似アラインメント技術に対する比較の目的のために、異なるビデオスライシング技術を図示するブロック図である。図3は、ビデオLTU境界へのRMの正確なアラインメントを必要とし、結果として、1つのビデオLTUが損失した場合に、1つのスライスのみが損失する技術を例示している。このアプローチは、実装が極めて複雑になる。図4は、ビデオLTU境界にRMをアライメントするのに何の努力もなされない技術を例示している。代わりに、RMは、各ビデオLTUにドリフトする傾向にあり、結果として、1つのビデオLTUが損失した場合に、多数のスライスを損失する。図5は、各スライスの終わりにおいてパディングバイトを用いることにより、固定スライスがビデオLTUにアライメントされるスライシング技術を例示している。この場合、パディングバイトは、著しい帯域幅非能率を生む。
図3の例では、スライスは、最も小さな損失単位、すなわちビデオLTUと正確にアライメントされる。しかしながら、図3のアプローチを実現するために、ビデオエンコーダは、ビデオビットストリーム上のLTU境界を知り、配置しなければならない。そして更に、2つのLTU境界の間に同じサイズのスライスを生成しなければならない。しかしながら、そのような実装を達成するのは非常に難しく、かつ高価である。特に、RMは、MB境界に挿入されねばならないし、ビットストリーム内の任意のバイト位置に配置することができない。この制約により、エンコーダが各スライスのサイズを制御するのは難しい。スライスの目標サイズがKである場合、エンコーダは通常、MB境界にRMを挿入する必要性のために、正確なサイズKのスライスを生成することができない。
図3に示すように、正確なアラインメントのために、RM 42,44,46は、それぞれビデオLTU54,56,58の始まりを指定しているビデオLTU境界48,50,52にそれぞれ正確に配置される。連続したビデオデータフレームは、前のビデオデータフィールドの終わりを示すビデオオブジェクトプレーン(VOP)フィールド60,62によって境界付けられる。正確なアラインメントによって、1つのLTUの損失は、1つのビデオスライスの損失となる。図3の例では、例えば、ビデオLTU 56の損失は、MB55からMB72、すなわち[55,72]を含む対応するビデオスライスの損失となる。前のビデオLTU 54にアライメントされたスライスと、次のビデオLTU 58にアライメントされたスライスとは、完全なままであり、復号することが可能である。一方、損失したビデオLTU56にアライメントされたスライスのMB[55,72]は、デコーダによって隠蔽される。
実装をより単純にするために、ビデオエンコーダは、目標サイズKにおいてスライスを符号化するが、Kより大きいスライスサイズも許可するように構成されうる。図4に示すように、そのような実装は、ビデオRLC境界70,72,74それぞれからドリフトする傾向にあるRM 64,66,68が配置される結果となる。このドリフトは、参照番号76、78、80によって表わされる。図4の例では、1つのビデオLTUが損失した場合、損失したビデオLTUの境界に遭遇する2つのスライスからデータが失われるだろう。従って、図4のアプローチは、無線ネットワーキングのような、特に誤りがちなアプリケーションで、顕著な性能劣化となる。
他のいくつかの実装は、図5に示すように、ビデオLTUサイズKよりも小さいビデオスライスを生成し、更に、次のRMが次のビデオLTUの始まりにおいて正確に配置されるように各スライスにパディングバイトを加える。図5に示すように、RM 82,84は、連続したビデオLTU 90,92,94の境界86,88のそれぞれに正確に配置される。しかしながら、各スライスのサイズは、ビデオLTUサイズ未満になるように選択される。従って、スライスはそれぞれ、符号化されたビデオの終わりと、次のビデオLTU境界との間の空間を埋めるためにパディングバイト96,98,100を含んでいる。当然、このアプローチは、デコーダによって利用されないパディングバイトが存在するので、帯域幅における非効率である。さらに、このアプローチは、エンコーダ実装を複雑にする傾向がある。特に、現在のスライスサイズがビデオLTUサイズKを超過しているとエンコーダが判定すると、1MB戻り、スライスを生成し、新たなスライスを開始し、更に、次のMBを再符号化する必要がある。
更なる解決策は、量子化パラメータ(QP)と呼ばれ、異なる量子化ステップサイズ用に各MBに費やされる正確なビット数を正確に推定するレート制御アルゴリズムの使用を含む。スライスレベルレート制御技術は、各スライスに含まれるMBの数と、このMBについて対応するQPとの最良の組合せの決定を試みる。明らかに、このアプローチは計算費用が高くなる。更に、このアプローチは、ビデオLTUサイズKに近いビデオスライスのみを生成する。特に、可変サイズをもってしても、MB境界は、ビデオLTU境界上に必ずしも正確に来るとは限らないだろう。この場合、パディングバイトの使用はまだ避けられない。従って、レート制御アルゴリズムは、実装の複雑さと、帯域幅非能率との両方を示す。
図6および図7は、本開示に従うスライスとLTUとの近似アラインメントに基づいたビデオスライシング技術を例示するブロック図である。図6および図7内に示すビデオスライシング技術は、図2のビデオエンコーダシステム12内に実装されうる。一般に、ビデオスライシング技術は、誤り回復力と帯域幅効率化との両方を達成しながら、さほど複雑ではない実装で済む。上述したように、ビデオスライシング技術は、RMのビデオLTU境界との正確なアラインメントを必要としない。従って、1つのスライスは、1つのビデオLTUに正確にフィットする必要はない。代わりに、RMが個々のビデオLTUの始まり近くに配置されるように各ビデオスライス作成される。従って、スライスレベルにおいて、正確なアライメント、あるいはタイトなレート制御を行う必要はなく、エンコーダ実装の複雑さが低減される結果となる。
図6は、ビデオLTU境界に対するスライス及びRMの配置に関するビデオスライシング技術を示す。図6は、ビデオLTU 102,104,106,108、ビデオLTU境界110,112,114、及びRM 116,118,120を示す。スライスはそれぞれ1つのRMから次のRMまで及ぶ。図6に示すように、個々のビデオLTUの始まりは、前のスライスの小さな終了セグメント122,124,126を含んでいる。そして、現在のスライスの大部分は、各ビデオLTU 102,104,106内の前のスライスの小さな終了セグメント122,124,126に続く。前のスライスと同様、現在のスライスは、次のビデオLTUへ伸びる小さな終了セグメントを含んでいる。従って、ビデオLTUはそれぞれ、前のスライスからの少しのデータと、現在のスライスからの殆どのデータとを含んでいる。
スライスとLTUとの間の正確なアラインメントが必要とされる図3の例と比較した場合、図6のビデオのスライシングアプローチは、スライス(RMからRMへ)とLTU(LTU境界からLTU境界へ)との間の近似アラインメントを生むことと見なすことができる。各スライスについては、スライスの小さな終了セグメントが、次のビデオLTUへ移るように、目標スライスサイズが選択される。そして、次のRMは、その終了セグメントの終わりで規定されるMB境界に容易に挿入される。したがって、一般には、1つのMBの一部のみが、次のビデオLTUへ移るだろう。
図7は、LTUが損失した場合に隠蔽されねばならないMB数に関して、図6の近似アライメント技術のパフォーマンスを例示する。図7に示すように、1つのビデオLTU106の損失は、1つのスライスを失うこととほぼ等価である。このスライスの非常に小さな終了セグメント126は、次のLTU108へ運ばれる。これは、損失されることなく、正確に受け取られる。しかしながら、デコーダはスライスを独立して復号するので、この小さな終了セグメント126は、復号に使用されないだろう。したがって、実際には、ビデオLTU106にまたがるスライス全体は、この小さな終了セグメント126とともに失われる。損失したLTU106とともに1つのスライス全体を失うなうことに加えて、LTU104内の前のスライスからの非常に小さい終了セグメント124もまた失われるだろう。なぜなら、この終了セグメントは、現在のLTU106に移るからである。しかしながら、前のスライスの残りは、完全であり、復号することができる。典型的な実装では、次のLTUへ移されるスライスの終了セグメントは、1つのMBの一部のみとなるであろう。
図3の正確なアラインメントアプローチと比較して、図6および図7によって例示された近似アラインメントアプローチは、比較的良好な帯域幅効率および誤り回復力を備え、複雑さを低減する。図3の例では、正確なアラインメントアプローチは、LTUが失われた場合、55から72までのMB(MB[55,72])が失われるという結果になる。明らかに、図7に示すように、近似アラインメントアプローチによって、1つのMB、すなわちMB[54,72]のうちのMB54、しか追加損失しないという結果になる。この追加損失MBは、現在のビデオLTU106に移行する前のスライスの終了セグメントからのMBである。したがって、本開示で記述した近似アラインメントアプローチを使用することの犠牲は、1つの追加MBの損失のみである。しかしながら、この犠牲は、実装複雑さの低減と、帯域幅効率化とによって補われる。
動作時には、LTU誤りが検知された場合、損失したビデオLTU106の前のビデオLTU104における前のスライスの全てが喪失(drop)されないことを保証するために、デコーダシステム14は、エンコーダシステム12によって適用される近似アライメントアプローチに敏感であるように構成されるべきである。いくつかの実施形態では、デコーダシステム14は、近似アラインメントアプローチに従って生成されるスライスを取り扱うよう具体的に構成されうる。他の実施形態では、エンコーダシステム12およびデコーダシステム14は、エンコーダシステムが近似アライメントアプローチを使用しており、デコーダシステムはそれに従って自分自身を構成すべきであることを明示する制御情報を交換しうる。更なる代案として、いくつかのエンコーダシステム12およびデコーダシステム14は、上述したような近似アライメント、正確なアライメント、パディング、又はスライスレベルレート制御技術を切り換えるオペレーションモードを提供するように構成されうる。
図8は、本開示に従ったビデオスライスサイズの計算を例示するブロック図である。図8に示すように、近似アライメントビデオスライス技術を実行するために、エンコーダシステム12は、K(n)で表される各LTUのサイズを取得する。ここでnは、空気インタフェースによって送信される一連のLTUにおける各ビデオLTUの位置を示すインデクスである。エンコーダシステム12は、到来するビデオビットストリームのビットを符号化し、符号化されたビット数が、現在の目標スライスサイズT(n)を越える場合には、ビデオスライスを生成する。ここで、nは、一連のスライスにおける各スライスの位置を示すインデクスである。
しかしながら、この技術によれば、スライスの目標スライスサイズT(n)は、K(n)に等しくなく、正確なアライメントを必要とするだろう。再度述べるように、MB境界にRMを挿入する必要により、スライスとビデオLTUとの正確なアラインメントは困難である。代わりに、次のLTU境界の後、例えば、ビデオLTU境界の1MB以内に、次のRMが直ちに表れることを保証するために、スライスが生成される毎に目標スライスサイズが調整される。言いかえれば、LTU境界にRMをそれぞれ配置する必要はないが、LTU境界の1MB以内にあるべきである。この処理は、RMがLTU境界に配置されねばならない技術に比べて複雑さを低減し、RMが常に境界に十分近いことを保証し、パディングバイトの必要性をも回避する。
目標スライスサイズT(n)の調整は、実際に符号化された前のスライスサイズLと、前の目標スライスサイズT(n)との差を計算し、この差を、K(n)から引くことによって実現される。図8に示すように、目標スライスサイズT(n)の調整は、
Figure 2008511261
によって行われる。上記式では、T(n)は現在の目標スライスサイズ、K(n)は現在のビデオLTUサイズ、d(n−1)は、実際に符号化された前のスライスサイズと、前の目標スライスサイズとの差である。この値は、エンコーダシステム12によって生成される各スライスのために再計算される。
図8に関連して上述したスライスサイズ計算は、以下の中間コードによって表すことができる。
Figure 2008511261
図9は、本開示に従ったビデオスライシング技術の動作を図示するフロー図である。このビデオスライシング技術は、図2のビデオスライスジェネレータ26、スライスサイズ決定モジュール28、およびビデオLTUサイズ推定器38のような様々なコンポーネントを用いて実現されうる。このフロー図は、一般に、上記の中間コードによって表わされる動作と結果を追跡する。図9に示すように、この技術は、現在のビデオLTUのサイズKを取得すること(126)と、目標スライスサイズTを生成すること(128)とを含む。先ず、フレームにおける第1のスライスについて、目標スライスサイズTが、LTUサイズKに等しくなるように設定される(128)。ビデオLTUサイズKは、ビデオLTUサイズ推定器38から取得される(図2)。ビデオスライシング処理は、符号化されるビデオフレームが存在する限り繰り返される(130)。特に、この処理は、フレームからフレームへと進む(132)。与えられたフレーム内では、この処理は、利用可能なフレーム内に、符号化される更なるMBが存在する限り繰り返される(134)。従って、この処理は、フレーム内のMBからMBへと進む(136)。
与えられたフレームおよびMBについて、このビデオスライシング技術は、現在のスライスサイズLが、目標スライスサイズTよりも大きいか、又は等しいかを判定する(138)。現在のスライスサイズLは、与えられたスライスについて既に符号化されたMBの数によって決定される。従って、実際のスライスサイズLは、符号化される各MBとともに増加するだろう。先ず、目標スライスサイズTは、現在のLTUサイズKと等しくなるだろう(128)。現在のスライスサイズLが、その目標スライスサイズTとなるか、または超えるのであれば(138)、処理は、現在のスライスサイズLと、目標スライスサイズTとの差dを判定する(140)。現在のスライスサイズLが、目標スライスサイズTと等しくなく、超えもしない場合、処理は、MBを符号化し(142)、現在のスライスサイズLを更新し(144)、更なるMBを処理することに戻る(134)ことを継続する。
この処理は、次に、目標スライスサイズTが、次のビデオLTUのサイズKと差dとの差に等しくなるように調整する(146)。このようにして、目標スライスサイズTは、ループによって、次のパスのために調整される。特に、次の目標スライスサイズTは、前のスライスの終了セグメントのサイズと等しい量、つまり量d、LTUサイズKよりも小さくなるであろう。この時点で、処理は、現在のスライスの終わりに達する。したがって、この処理は、次のパスのために現在のスライスサイズLをリセットし(148)、スライスの終わりにRMを挿入し、新たなスライスを開始する(150)。現在のスライスサイズLを更新すると(144)、この処理は、もしも利用可能であれば、利用可能なビデオフレームにおける更なるMBの処理に戻る。
現在のスライスサイズLが、目標スライスサイズTになることも、それを超えもしない場合、与えられたフレーム内で処理される更なるMBは存在せず、この処理は、フレームの終わりに達する。この場合、この処理は、フレームの終わりにおけるスライスのみについてパディングバイトを挿入し、利用可能な残りのスライスを埋める。しかしながら、これは、スライスLTUアライメント処理のために、各ビデオスライス内にパディングバイトを配置することとは対象的である。パディングバイトを挿入する代わりに、次のフレームからのデータが、スライスへ挿入されることもある。前のフレームからのデータを含んでいるスライス内で、次のフレームからのデータを挿入するこのアプローチの結果、1フレームの遅れが生じうる。しかしながら、この遅れは、帯域幅効率化とのトレードオフによって正当に理由付けされうる。
本開示に従って、ビデオエンコーダシステム12は、ビデオエンコーダ20と、下部レイヤ、すなわちMUX18及びモデム34との間のクロスレイヤ設計を実現する。このように、ビデオエンコーダ20は、ビットストリームがどのように分割され、トランスポートレイヤ内のLTUへ多重化されるのかを決定する。特に、各スライスのサイズは、下部レイヤから提供される。スライスサイズは、ビデオデータがオーディオデータとどのように多重化されるかに依存して変わりうる。さらに、この技術は、LTUが損失される前に得られた有用なデータを破棄しないように、ビデオデコーダ18が、この具体的な符号化アプローチを知っていると仮定する。
広範な実験による予備結果は、ビデオスライシングのための近似アライメント技術を用いることによって、損失するMBの数が、スライスとLTU境界との間のドリフトをもたらす既存の技術と比較して26%乃至32%低減されることを示す。この既存の技術によれば、ビデオエンコーダは、120バイトの固定目標スライスサイズを設定するだろう。そして、現在のスライスサイズが120バイトを超える場合、ビデオは、現在のスライスを終了し、新しいスライスを開始するだろう。上述したように、そのような既存技術は、著しいドリフトをもたらす結果となりうる。本明細書で説明した近似アライメント技術によって得られる改良点は、顕著であり、上述したように、損失するMBを26%乃至32%低減する。
様々な実施形態が記述された。これら実施形態およびその他の実施形態は、特許請求の範囲内である。
図1は、ビデオ/オーディオ符号化及び復号システムを図示するブロック図である。 図2は、本開示に従ったビデオスライシング技術を適用するビデオエンコーダシステムを図示するブロック図である。 図3は、異なるビデオスライシング技術を図示するブロック図である。 図4は、異なるビデオスライシング技術を図示するブロック図である。 図5は、異なるビデオスライシング技術を図示するブロック図である。 図6は、本開示に従ったビデオスライシング技術を図示するブロック図である。 図7は、本開示に従ったビデオスライシング技術を図示するブロック図である。 図8は、本開示に従ったビデオスライスサイズの計算を例示するブロック図である。 図9は、本開示に従ったビデオスライシング技術の動作を例示するフローチャートである。

Claims (39)

  1. ビデオ論理送信ユニット(LTU)のサイズを決定することと、
    目標ビデオスライスサイズを生成することと、
    第1のビデオスライスを、前記第1のビデオスライスのサイズが前記目標ビデオスライスサイズよりも大きくなるまで符号化することと、
    前記第1のビデオスライスのサイズと、前記目標ビデオスライスサイズとの差を計算することと、
    前記第1のビデオスライスの終わりに再同期マーカ(RM)を挿入することと、
    前記目標ビデオスライスサイズを、前記ビデオLTUのサイズから前記差を引いたものに等しくなるように更新することと、
    第2のビデオスライスを、前記第2のビデオスライスのサイズが、前記更新された目標ビデオスライスサイズよりも大きくなるまで符号化することとを備えるビデオ符号化方法。
  2. 目標ビデオスライスサイズを生成することは、前記ビデオLTUサイズと等価な目標ビデオスライスサイズを生成することを含む請求項1の方法。
  3. ビデオフレーム内の複数のビデオスライスに対し前記計算、挿入、更新、及び符号化する動作を繰り返すことを更に備える請求項1の方法。
  4. 前記ビデオLTUサイズを決定することは、ビデオ部分及びオーディオ部分を含む物理レイヤLTUのサイズを決定することと、前記オーディオ部分に対する前記ビデオ部分の比率を決定することと、前記物理レイヤLTUのサイズと前記比率とに基づいて、前記ビデオLTUサイズを決定することとを含む請求項1の方法。
  5. 物理レイヤLTUサイズを、ビデオ通信デバイス内の多重化レイヤへ渡すことと、
    前記多重化レイヤから、前記ビデオ通信デバイス内の符号化レイヤへ前記ビデオLTUサイズを渡すこととを更に備える請求項1の方法。
  6. 前記RMを挿入することは、マクロブロック(MB)境界に前記RMを挿入することを含む請求項1の方法。
  7. 前記差は、1マクロブロック(MB)未満のサイズである請求項1の方法。
  8. 前記第1のビデオスライスと前記第2のビデオスライスとに、実質的にパディングバイトを入れないことを更に備える請求項1の方法。
  9. 前記RMを挿入することは、前記RMを、連続するビデオLTUの間の境界に対応する位置に、あるいはその位置の後ろに挿入することを含む請求項1の方法。
  10. ビデオスライスに含まれる情報を前記オーディオ情報とともに多重化して、複数の多重化プロトコルデータユニット(MUX PDU)を生成することを更に備える請求項1の方法。
  11. 前記第1のビデオスライスの第1の部分は、第1の物理レイヤLTU内に存在し、前記第2のビデオスライスの第1の部分は、第2の物理レイヤLTU内に存在する請求項1の方法。
  12. 前記第1のビデオスライスの前記第2の部分は、1マクロブロック(MB)未満のサイズである請求項11の方法。
  13. ビデオ論理送信ユニット(LTU)のサイズを推定するビデオ論理送信ユニット(LTU)サイズ推定モジュールと、
    目標ビデオスライスサイズを決定するスライスサイズ決定モジュールと、
    第1のビデオスライスのサイズが、前記目標ビデオスライスサイズより大きいか、又は等しくなるまで前記第1のビデオスライスを符号化するビデオスライスジェネレータであって、前記第1のビデオスライスのサイズと、前記目標ビデオスライスサイズとの差を計算し、前記第1のビデオスライスの終わりに、再同期マーカ(RM)を挿入するビデオスライスジェネレータとを備え、
    前記スライスサイズ決定モジュールは、前記ビデオLTUサイズから前記差を引いたものに等しくなるように前記目標ビデオスライスサイズを更新し、
    前記ビデオスライスジェネレータは、第2のビデオスライスのサイズが、前記更新された目標ビデオスライスサイズより大きいか、又は等しくなるまで前記第2のビデオスライスを符号化するビデオ符号化システム。
  14. 前記スライスサイズ決定モジュールは、前記ビデオLTUサイズと等価な前記目標ビデオスライスサイズを決定する請求項13のシステム。
  15. 前記ビデオLTUサイズ推定モジュールは、ビデオ部分及びオーディオ部分を含む物理レイヤLTUのサイズを決定し、前記オーディオ部分に対する前記ビデオ部分の比率を決定し、前記物理レイヤLTUのサイズと前記比率とに基づいて、前記ビデオLTUサイズを推定する請求項13のシステム。
  16. 前記ビデオLTUサイズ推定モジュールは、前記システム内の多重化レイヤ内に存在する請求項15のシステム。
  17. 前記ビデオLTUサイズ推定モジュールは、前記システム内のモデムから前記物理レイヤLTUのサイズを取得する請求項15のシステム。
  18. 前記ビデオLTUサイズ推定モジュールは、前記システム内の多重化エンジンから前記比率を取得する請求項15のシステム。
  19. 前記ビデオLTUサイズ推定モジュールは、前記システム内の多重化レイヤ内に存在し、
    前記多重化レイヤから、前記システムの符号化レイヤ内の前記スライスサイズ決定モジュールへ前記ビデオLTUサイズを渡す請求項13のシステム。
  20. 前記ビデオスライスジェネレータは、マクロブロック(MB)境界に前記RMを挿入する請求項13のシステム。
  21. 前記差は、1マクロブロック(MB)未満のサイズである請求項13のシステム。
  22. 前記ビデオスライスジェネレータは、前記第1のビデオスライスと前記第2のビデオスライスとに、実質的にパディングバイトを入れない請求項13のシステム。
  23. 前記ビデオスライスジェネレータは、前記RMを、連続するビデオLTUの間の境界に対応する位置に、あるいはその位置の後ろに挿入する請求項13のシステム。
  24. ビデオスライスに含まれる情報を前記オーディオ情報とともに多重化して、複数の多重化プロトコルデータユニット(MUX PDU)を生成する多重化エンジンを更に備える請求項13のシステム。
  25. 前記ビデオスライスジェネレータは、前記第1のビデオスライスの第1の部分が第1の物理レイヤLTU内に存在し、前記第2のビデオスライスの第1の部分が第2の物理レイヤLTU内に存在するように前記RMを挿入する請求項13のシステム。
  26. 前記第1のビデオスライスの前記第2の部分は、1マクロブロック(MB)未満のサイズである請求項25のシステム。
  27. ビデオ論理送信ユニット(LTU)のサイズを決定し、
    目標ビデオスライスサイズを生成し、
    第1のビデオスライスを、前記第1のビデオスライスのサイズが前記目標ビデオスライスサイズよりも大きくなるまで符号化し、
    前記第1のビデオスライスのサイズと、前記目標ビデオスライスサイズとの差を計算し、
    前記第1のビデオスライスの終わりに再同期マーカ(RM)を挿入し、
    前記目標ビデオスライスサイズを、前記ビデオLTUのサイズから前記差を引いたものに等しくなるように更新し、
    第2のビデオスライスを、前記第2のビデオスライスのサイズが、前記更新された目標ビデオスライスサイズよりも大きくなるまで符号化するようプロセッサに実行させる命令を備えたコンピュータ読取可能媒体。
  28. 前記生成された目標ビデオスライスサイズは、前記ビデオLTUサイズと等価である請求項27のコンピュータ読取可能媒体。
  29. ビデオフレーム内の複数のビデオスライスに対し前記計算、挿入、更新、及び符号化する動作を繰り返すよう前記プロセッサに実行させる命令を更に備える請求項27のコンピュータ読取可能媒体。
  30. ビデオ部分及びオーディオ部分を含む物理レイヤLTUのサイズを決定し、
    前記オーディオ部分に対する前記ビデオ部分の比率を決定し、
    前記物理レイヤLTUのサイズと前記比率とに基づいて、前記ビデオLTUサイズを決定するよう前記プロセッサに実行させる命令を更に備える請求項27のコンピュータ読取可能媒体。
  31. マクロブロック(MB)境界に前記RMを挿入するよう前記プロセッサに実行させる命令を更に備える請求項27のコンピュータ読取可能媒体。
  32. 前記差は、1マクロブロック(MB)未満のサイズである請求項27のコンピュータ読取可能媒体。
  33. 前記第1のビデオスライスと前記第2のビデオスライスとに、実質的にパディングバイトを入れないよう前記プロセッサに実行させる命令を更に備える請求項27のコンピュータ読取可能媒体。
  34. 前記RMを、連続するビデオLTUの間の境界に対応する位置の後ろに挿入するよう前記プロセッサに実行させる命令を更に備える請求項27のコンピュータ読取可能媒体。
  35. 前記第1のビデオスライスの第1の部分が第1の物理レイヤLTU内に存在し、前記第2のビデオスライスの第1の部分が第2の物理レイヤLTU内に存在するように前記RMを挿入するよう前記プロセッサに実行させる命令を更に備える請求項27のコンピュータ読取可能媒体。
  36. 前記第1のビデオスライスの第2の部分は、1マクロブロック(MB)未満のサイズである請求項35のコンピュータ読取可能媒体。
  37. ビデオ論理送信ユニット(LTU)のサイズを決定する手段と、
    目標ビデオスライスサイズを生成する手段と、
    第1のビデオスライスを、前記第1のビデオスライスのサイズが前記目標ビデオスライスサイズよりも大きくなるまで符号化する手段と、
    前記第1のビデオスライスのサイズと、前記目標ビデオスライスサイズとの差を計算する手段と、
    前記第1のビデオスライスの終わりに再同期マーカ(RM)を挿入する手段と、
    前記目標ビデオスライスサイズを、前記LTUのサイズから前記差を引いたものに等しくなるように更新する手段と、
    第2のビデオスライスを、前記第2のビデオスライスのサイズが、前記更新された目標ビデオスライスサイズよりも大きくなるまで符号化する手段とを備えるビデオ符号化システム。
  38. デジタルビデオフレームをビデオスライスへ分割することと、
    各スライスの第1の部分が第1の物理レイヤ論理送信ユニット(LTU)内に存在し、各スライスの第2の部分が第2の物理レイヤLTU内に存在し、前記第2の部分が、高々1マクロブロック(MB)のサイズであるように前記スライスの各々をサイジングすることとを備えるビデオ符号化方法。
  39. デジタルビデオフレームをビデオスライスへ分割する手段と、
    各スライスの第1の部分が第1の物理レイヤ論理送信ユニット(LTU)内に存在し、各スライスの第2の部分が第2の物理レイヤLTU内に存在し、 前記第2の部分が、高々1マクロブロック(MB)のサイズであるように前記スライスの各々をサイジングする手段とを備えるビデオ符号化システム。
JP2007530055A 2004-08-23 2005-08-22 効率的なビデオスライシング Expired - Fee Related JP4995725B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US60397804P 2004-08-23 2004-08-23
US60/603,978 2004-08-23
US11/018,076 US7885337B2 (en) 2004-08-23 2004-12-20 Efficient video slicing
US11/018,076 2004-12-20
PCT/US2005/029987 WO2006023928A1 (en) 2004-08-23 2005-08-22 Efficient video slicing

Publications (2)

Publication Number Publication Date
JP2008511261A true JP2008511261A (ja) 2008-04-10
JP4995725B2 JP4995725B2 (ja) 2012-08-08

Family

ID=35432066

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007530055A Expired - Fee Related JP4995725B2 (ja) 2004-08-23 2005-08-22 効率的なビデオスライシング

Country Status (6)

Country Link
US (1) US7885337B2 (ja)
EP (1) EP1784987B1 (ja)
JP (1) JP4995725B2 (ja)
KR (1) KR100955852B1 (ja)
CN (1) CN101036394B (ja)
WO (1) WO2006023928A1 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060062312A1 (en) * 2004-09-22 2006-03-23 Yen-Chi Lee Video demultiplexer and decoder with efficient data recovery
US8223845B1 (en) 2005-03-16 2012-07-17 Apple Inc. Multithread processing of video frames
JP2006319701A (ja) * 2005-05-13 2006-11-24 Hitachi Ltd デジタル放送受信装置及び受信方法
WO2007003627A1 (en) * 2005-07-06 2007-01-11 Thomson Licensing Method and device for coding a video content comprising a sequence of pictures and a logo
KR100703502B1 (ko) * 2006-01-17 2007-04-03 삼성전자주식회사 Dmb 서비스에 대한 ip 멀티캐스팅 방식의 재전송 장치
US20100211690A1 (en) * 2009-02-13 2010-08-19 Digital Fountain, Inc. Block partitioning for a data stream
US8379733B2 (en) * 2006-09-26 2013-02-19 Qualcomm Incorporated Efficient video packetization methods for packet-switched video telephony applications
WO2008086243A1 (en) * 2007-01-04 2008-07-17 Qualcomm Incorporated Method and apparatus for distributed spectrum sensing for wireless communication
US8995522B2 (en) * 2007-04-13 2015-03-31 Apple Inc. Method and system for rate control
US8724698B2 (en) * 2007-04-13 2014-05-13 Apple Inc. Method and system for video rate control
US8230125B2 (en) * 2007-10-30 2012-07-24 Mediatek Inc. Methods for reserving index memory space in AVI recording apparatus
US9357233B2 (en) * 2008-02-26 2016-05-31 Qualcomm Incorporated Video decoder error handling
US8374134B2 (en) * 2009-01-30 2013-02-12 Qualcomm Incorporated Local broadcast of data using available channels of a spectrum
US8902995B2 (en) * 2009-07-02 2014-12-02 Qualcomm Incorporated Transmitter quieting and reduced rate encoding
US8958475B2 (en) * 2009-07-02 2015-02-17 Qualcomm Incorporated Transmitter quieting and null data encoding
US8780982B2 (en) * 2009-07-02 2014-07-15 Qualcomm Incorporated Transmitter quieting and different encoding rates for portions of a set of frames
US9112618B2 (en) * 2009-07-02 2015-08-18 Qualcomm Incorporated Coding latency reductions during transmitter quieting
US8537772B2 (en) 2009-07-02 2013-09-17 Qualcomm Incorporated Transmitter quieting during spectrum sensing
US8687648B2 (en) * 2009-07-17 2014-04-01 Qualcomm Incorporated Wireless transmission of data using an available channel of a spectrum
US20110176060A1 (en) * 2010-01-21 2011-07-21 Qualcomm Incorporated Data feedback for broadcast applications
JP5440220B2 (ja) * 2010-01-29 2014-03-12 株式会社デンソー ナビゲーション装置
US20110317762A1 (en) * 2010-06-29 2011-12-29 Texas Instruments Incorporated Video encoder and packetizer with improved bandwidth utilization
CN102143542A (zh) * 2011-01-21 2011-08-03 意法·爱立信半导体(北京)有限公司 一种在通信终端上实现可视电话的方法和通信终端
CN102123303B (zh) * 2011-03-25 2012-10-24 天脉聚源(北京)传媒科技有限公司 一种音视频文件播放方法、系统及传输控制装置
CN102611915A (zh) * 2012-03-15 2012-07-25 华为技术有限公司 视频启动的方法、装置及系统
FR2992134B1 (fr) * 2012-06-19 2014-06-20 Sagemcom Energy & Telecom Sas Dispositif et procede de gestion de repartition de bande passante entre donnees sous forme de circuits et donnees sous forme de paquets
CN102883127B (zh) * 2012-09-21 2016-05-11 浙江宇视科技有限公司 一种录像切片的方法和装置
US9270991B2 (en) * 2013-01-07 2016-02-23 Qualcomm Incorporated Inter-layer reference picture generation for HLS-only scalable video coding
US9602822B2 (en) * 2013-04-17 2017-03-21 Qualcomm Incorporated Indication of cross-layer picture type alignment in multi-layer video coding
US10602158B2 (en) * 2015-02-11 2020-03-24 Ati Technologies Ulc Method for maximizing video slice size constraint
US11252429B2 (en) * 2018-04-27 2022-02-15 Ati Technologies Ulc Low-latency consumption of an encoded video bitstream
CN110661997B (zh) * 2018-06-28 2022-01-11 视联动力信息技术股份有限公司 一种模拟信号的传输方法和装置
CN112311727B (zh) * 2019-07-29 2022-05-24 杭州海康威视数字技术股份有限公司 无线传输视频的控制方法和系统
US11395963B2 (en) * 2019-10-01 2022-07-26 Sony Interactive Entertainment Inc. High speed scan-out of server display buffer for cloud gaming applications
US11843772B2 (en) 2019-12-06 2023-12-12 Ati Technologies Ulc Video encode pre-analysis bit budgeting based on context and features
US11070829B2 (en) 2019-12-16 2021-07-20 Ati Technologies Ulc Reducing latency in wireless virtual and augmented reality systems

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000175189A (ja) * 1998-12-07 2000-06-23 Univ Tokyo 動画符号化方法およびそれに用いる動画符号化装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6304607B1 (en) * 1997-03-18 2001-10-16 Texas Instruments Incorporated Error resilient video coding using reversible variable length codes (RVLCS)
US6529528B1 (en) * 1997-06-27 2003-03-04 Samsung Electronics Co., Ltd. Multimedia multiplexing method
EP1005233A1 (en) * 1998-10-12 2000-05-31 STMicroelectronics S.r.l. Constant bit-rate coding control in a video coder by way of pre-analysis of the slices of the pictures
US7124429B2 (en) * 1999-03-05 2006-10-17 Kabushiki Kaisha Toshiba Video coding apparatus and video decoding apparatus
JP2002016442A (ja) 2000-06-30 2002-01-18 Toshiba Corp Fm信号発振回路及び変調レベル補正方法
WO2003041326A2 (en) 2001-11-09 2003-05-15 Matsushita Electric Industrial Co., Ltd. Moving picture coding method and apparatus
US7027515B2 (en) * 2002-10-15 2006-04-11 Red Rock Semiconductor Ltd. Sum-of-absolute-difference checking of macroblock borders for error detection in a corrupted MPEG-4 bitstream
US7340667B2 (en) * 2004-05-10 2008-03-04 Via Telecom Co., Ltd. Method and/or apparatus implemented in hardware to discard bad logical transmission units (LTUs)

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000175189A (ja) * 1998-12-07 2000-06-23 Univ Tokyo 動画符号化方法およびそれに用いる動画符号化装置

Also Published As

Publication number Publication date
KR100955852B1 (ko) 2010-05-06
CN101036394B (zh) 2013-01-23
CN101036394A (zh) 2007-09-12
US7885337B2 (en) 2011-02-08
WO2006023928A1 (en) 2006-03-02
JP4995725B2 (ja) 2012-08-08
EP1784987A1 (en) 2007-05-16
KR20070046943A (ko) 2007-05-03
EP1784987B1 (en) 2014-04-23
US20060039483A1 (en) 2006-02-23

Similar Documents

Publication Publication Date Title
JP4995725B2 (ja) 効率的なビデオスライシング
JP5296123B2 (ja) 帯域外ディレクトリ情報を使用するエラー耐性の改良
JP5483774B2 (ja) ビデオ符号化方法
US20060227870A1 (en) Context-adaptive bandwidth adjustment in video rate control
KR101380505B1 (ko) 무선 채널을 통한 멀티미디어 데이터의 송신을 위한 보호 및 압축 파라미터들의 결정 방법
US8111757B2 (en) Method and apparatus for video signal processing
US6470049B1 (en) Method for dealing with missing or untimely synchronization signals in digital communications systems
EP2312857A2 (en) Time slicing techniques for variable data rate encoding
US8379733B2 (en) Efficient video packetization methods for packet-switched video telephony applications
EP1310103B1 (en) Method and apparatus for video encoding
EP1555788A1 (en) Method for improving the quality of an encoded video bit stream transmitted over a wireless link, and corresponding receiver
HK1107211A (en) Efficient video slicing
US10455263B2 (en) Method and apparatus for bandwidth optimization using staggercast
Lee et al. Foveation-based error resilience for video transmission over mobile networks
Banham et al. Video coding standards: error resilience and concealment
Zsiros et al. Joint Optimization in UMTS‐Based Video Transmission
HK1131709A (en) Systems and methods for channel switching

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100330

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100910

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20101013

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20101105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120510

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4995725

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees