[go: up one dir, main page]

JP4791129B2 - 画像符号化装置、画像符号化方法及び画像編集装置 - Google Patents

画像符号化装置、画像符号化方法及び画像編集装置 Download PDF

Info

Publication number
JP4791129B2
JP4791129B2 JP2005289912A JP2005289912A JP4791129B2 JP 4791129 B2 JP4791129 B2 JP 4791129B2 JP 2005289912 A JP2005289912 A JP 2005289912A JP 2005289912 A JP2005289912 A JP 2005289912A JP 4791129 B2 JP4791129 B2 JP 4791129B2
Authority
JP
Japan
Prior art keywords
picture
image
encoding
stream
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005289912A
Other languages
English (en)
Other versions
JP2007104182A (ja
Inventor
智之 奥山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renesas Electronics Corp
Original Assignee
Renesas Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renesas Electronics Corp filed Critical Renesas Electronics Corp
Priority to JP2005289912A priority Critical patent/JP4791129B2/ja
Priority to TW95134613A priority patent/TWI334309B/zh
Priority to KR20060097323A priority patent/KR100834322B1/ko
Priority to US11/541,548 priority patent/US20070077023A1/en
Priority to CNB2006101420759A priority patent/CN100553343C/zh
Publication of JP2007104182A publication Critical patent/JP2007104182A/ja
Application granted granted Critical
Publication of JP4791129B2 publication Critical patent/JP4791129B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/036Insert-editing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/322Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier used signal is digitally coded
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234354Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering signal-to-noise ratio parameters, e.g. requantization
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、非圧縮の映像データを符号化した符号化ストリームを編集し、復号し、再符号化することができる画像符号化装置、画像符号化方法及び画像編集装置に関する。
近年のディジタル技術の発展に伴い、HDD(Hard Disc Drive)若しくはDVD(Digital Versatile Disc)レコーダやDVDプレーヤのようなディジタル方式の音声/画像記録再生装置が実用化されている。このようなディジタル方式では、画像データはMPEG(Moving Picture Experts Group)方式で圧縮しストリーム化されている
MPEG2方式(ISO/IEC13818−2)は、フレーム内符号化画像(以下Iピクチャ:intra coded picture)、片方向予測によりフレーム間符号化された画像(以下Pピクチャ:predictive coded picture)、及び双方向予測によりフレーム間符号化された画像(以下Bピクチャ:bi-directionally predictive coded picture)により符号化ストリームが形成されている。
MPEG2方式のビデオストリームはGOP(group of pictures)という単位で符号化されている。1つのGOPは、通常15枚程度のピクチャから構成され、Iピクチャから始まり、Pピクチャ又はBピクチャが含まれる。
Iピクチャは画像内符号化により作られるもので、前画像からの予測符号化を行わない、すなわち、他の画像を参照せずにピクチャ内符号化を行なうものであり、復号に必要な全ての情報を有する画像である。Pピクチャは時間的に前のIピクチャ又はPピクチャを参照してピクチャ間予測符号化を行なうピクチャであり、したがって、ストリーム順で先行する既に復号されたIピクチャ又はPピクチャの情報が必要な画像である。Bピクチャは、前後(過去及び未来)の2枚のIピクチャ又はPピクチャを使用し、双方向からの予測符号化を行うピクチャであり、復号には、ストリーム順で先行する既に復号化されたIピクチャ又はPピクチャ2画像の情報が必要な画像である。
したがって、Bピクチャが存在する場合には、符号画像順と表示画像順は一致しない。すなわち、Bピクチャの復号には該画像よりも再生順で後に表示される画像を参照するため、符号順ではBピクチャよりも先にその参照画像となるIピクチャ又はPピクチャが配置される。したがって、このようなMPEG2方式で得られたビデオストリームを編集する際には、Pピクチャ及びBピクチャに符号化された画像の参照画像が編集により変わってしまうため、必要なピクチャのデータを抜き出して単純に連結することができない。
そこで、MPEG方式で符号化された動画像の編集を行なう際には、簡単には、GOP単位で編集することが考えられる。しかしながら、GOPの途中にシーチェンジがある場合に、その点で編集を行なうことができないという問題点がある。そこで、GOPの途中にある編集点と、GOPの途中にある編集点とを連結するビデオストリームの編集方法が特許文献1に記載されている。
この特許文献1に記載の編集方法においては、フレーム間予測符号化された第1のビデオストリームの一部又は全部と第2のビデオストリームの一部又は全部を連結して連続再生可能なビデオストリームを得る。この場合、第1のビデオストリームから、フレーム内予測符号化または片方向のフレーム間予測により符号化されたピクチャの直前までの、第1の部分ビデオストリームを切り出す。そして、第2のビデオストリームから、フレーム内符号化または片方向のフレーム間予測により符号化されたピクチャ以降の、第2の部分ビデオストリームを切り出す。第2のビデオストリームから切り出された第2の部分ストリームの直前に表示されるピクチャがフレーム内符号化されたピクチャであるか否かを判定し、フレーム内符号化されたピクチャであると判定された場合には、このピクチャを第1のフレーム内符号化ピクチャとし、フレーム内符号化されたピクチャでないと判定された場合には、該ピクチャの直前にあるフレーム内符号化ピクチャから該ピクチャまでの片方向フレーム間予測符号化ピクチャを順に復号化することで該ピクチャの復号画像を得た後、復号された該ピクチャをフレーム内符号化処理により再符号化し、第1のビデオストリームから得られた第1の部分ストリームと、第2のビデオストリームから得られた第2の部分ストリームとの間に、再符号化したフレーム内符号化ピクチャを挿入することで、GOPの途中に編集点がある場合においても編集を可能としている。
しかしながら、このような符号化されたままのストリームを編集する場合には、ストリームの一部を削除することで全体の符号量を小さくすることはできるものの、符号化の際のビットレートを変更することができず、編集後における符号量を調整することが難しい。
例えば、非圧縮のディジタル映像データを、MPEG等の方法によりIピクチャ、Bピクチャ及びPピクチャから構成されるGOP単位に圧縮符号化して光磁気ディスク(MOディスク;magneto-optical disc)等の記録媒体に記録する際には、圧縮符号化後の圧縮映像データのデータ量(ビット量)を、伸長復号後の映像の品質を高く保ちつつ記録媒体の記録容量以下、あるいは、通信回線の伝送容量以下にする必要がある。
このため、事前解析を用いた動画像の符号化方法が採用される場合がある。事前解析を用いた符号化方法においては、先ず、1パス目で非圧縮映像データを予備的に圧縮符号化して圧縮符号化後のデータ量を見積もり、次の2パス目に、見積もったデータ量に基づいて圧縮率を調節し、圧縮符号化後のデータ量が記録媒体の記録容量以下になるように圧縮符号化する(以下、このような圧縮符号化方法を2パス・エンコードともいう)。
この2パス・エンコードにおいては、符号量の割当てによるバッファ占有量の推移を考慮しなければ実際の符号化処理の際に、バッファでオーバーフローやアンダーフローなどのバッファの破綻を引き起こす。仮に、実際の符号化処理の際に、バッファの破綻を回避する処理が組み込まれていたとしても、画像を符号化する際に発生する符号量が割当てられた目標符号量から外れたものになり、発生後の符号量制御が正確にできなくなる。この場合には、本来、割当てるべき符号量と異なった符号量を画像に割当ててしまうこととなり、符号化における画質の劣化を引き起してしまう。
そこで、特許文献2には、入力画像を符号化する前に画像の解析を行い、画像毎の複雑度を算出し、この複雑度に応じた符号量を一定区間内の画像に一括して割当て、符号量がバッファに占める占有量の推移を見積ることでバッファの破綻を回避し、与えられたビットレートとバッファサイズとに基づいて適切な符号配分を行うことにより符号化した画像の画質を向上させる事前解析を用いた動画像符号化装置が開示されている。
特開2002−300528号公報 特開2002−232882号公報
しかしながら、上記特許文献2に記載の2パス・エンコード方法の場合、1パス目でエンコードしたストリームをピクチャ単位で編集すると、編集したストリームを復号して再度符号化したときには編集点以後のピクチャ位相を1パス目の符号化ストリームのピクチャ位相と一致させることができない。この場合、例えば元々Bピクチャとして符号化されていたピクチャをIピクチャとして符号化する場合などが生じ、編集後の画像が劣化してしまう場合がある。更には、編集したストリームのピクチャ位相が、事前解析済みの1パス目の符号化ストリームのピクチャ位相と一致しなくなることから、編集点以降の複雑度を参照できなくなり、編集したストリームを2パス・エンコードすることができなくなってしまう。
本発明にかかる画像符号化装置は、非圧縮の映像データを符号化した符号化ストリームを編集する画像符号化装置であって、前記符号化ストリームを1又は複数の編集点で編集されるよう編集指示を作成する編集部と、前記編集指示に従って前記符号化ストリームを復号して編集済ストリームを生成する復号処理部と、前記編集済ストリームを再符号化して編集済符号化ストリームを生成する符号化処理部とを有し、前記符号化処理部は、前記符号化ストリームと同一フレームにおいては同一のピクチャタイプになるようピクチャ位相を揃えて前記編集済符号化ストリームを生成するものであって、前記編集済ストリームにおける前記編集点の前及び/又は後に所定の画像からなる挿入画像を挿入することで、前記符号化ストリーム及び前記編集済符号化ストリームの前記編集点まで及び/又は編集点後のピクチャ位相が同一になるよう前記編集済符号化ストリームを生成するものである。
本発明においては、非圧縮の映像データを符号化した符号化ストリームを編集して再度符号化する際、元の符号化ストリームと同一フレームにおいては同一ピクチャとなるよう、ピクチャ位相を揃えて再符号化することができるため、例えば元々BピクチャだったものをIピクチャに符号化するようなことがなく、画質の劣化を防止することができる。
本発明にかかる画像編集装置は、非圧縮の映像データを符号化した符号化ストリームを編集する画像符号化処理部と、符号化ストリームを記録する2以上の記録部とを備え、
前記画像符号化処理部は、一方の記憶装置に記録された前記符号化ストリームを1又は複数の編集点で編集されるよう編集指示を生成する編集部と、前記編集指示に従って前記符号化ストリームを復号して編集済ストリームを生成する復号処理部と、前記編集済みストリームを再符号化して編集済符号化ストリームを生成する符号化処理部とを有し、前記符号化処理部は、前記符号化ストリームと同一フレームにおいては同一のピクチャタイプになるようピクチャ位相を揃えて前記編集済符号化ストリームを生成するものであって、前記編集済みストリームにおける前記編集点の前及び/又は後に所定の画像からなる挿入画像を挿入することで、前記符号化ストリーム及び前記編集済符号化ストリームの前記編集点まで及び/又は編集点後のピクチャ位相が同一になるよう前記編集済符号化ストリームを生成し、前記他方の記憶装置は、前記編集済符号化ストリームを記録するものである。
本発明においては、一方の記憶装置に記録された元の符号化ストリームから編集したデータを、元の符号化ストリームと同一フレームにおいては同一ピクチャとなるよう、ピクチャ位相を揃えて再符号化するので、画質を劣化させることなくこれを他方の記憶装置にダビングすることができる。また、符号化ストリームと同一フレームにおいては同一のピクチャタイプになるようピクチャ位相を揃えて編集済みストリームを符号化するので、元の符号化ストリームを生成する際に各フレームの複雑度を解析しておけば、編集済みストリームの2パス・エンコードが可能になる。
本発明によれば、符号化ストリームの任意のピクチャ位置で編集しても、編集後に符号化して得られる符号化ストリームと編集前の符号化ストリームのピクチャ位相を揃えることができ、再符号化した画質の劣化を抑制することができる。そして、本発明によれば、符号化ストリームを編集しても編集前の符号化ストリームと同一のピクチャ位相とすることができるので、符号化ストリームについて予め事前解析を行なっておけば、編集後であっても2パス・エンコードを行なうことができる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、2パス・エンコード方法を用いた編集機能付き動画像符号化装置に適用したものである。
本実施の形態にかかる画像符号化装置は、2パス・エンコード機能を有する。2パス・エンコードは、非圧縮オーディオ/ビデオデータを予備的に圧縮符号化して圧縮符号化後のデータ量を見積もり(1パス目)、次に、見積もったデータ量に基づいて圧縮率を調節し、圧縮符号化後のデータ量が記録媒体の記録容量以下になるように圧縮符号化する(2パス目)方法である。このため、1パス目において、非圧縮の映像データなどのタイトルを例えばMPEG符号化して記録する際に各フレームを解析してその複雑度を求め(事前解析)、この複雑度を、MPEG符号化したタイトルと共に記録しておく。そして、2パス目に、予め定められるビットレートとなるよう、上記複雑度に応じて符号量を割り当て符号化する。複雑度を用いて符号量を割り当てることで、限られたビットレートにおける画質の向上を図り、バッファのアンダーフローやオーバーフローを防止することができる。
そして、本実施の形態における画像符号化装置は、MPEG符号化された記録済みのタイトル(番組)をピクチャ単位で編集したプレイリスト又は編集済みタイトルを生成しても、上記2パス・エンコードを可能にするものである。
通常、事前解析された符号化ストリームは、各フレーム毎の複雑度が求められているが、各フレームは所定のピクチャタイプに符号化されており、複雑度もピクチャタイプに対応したものとなっている。したがって、符号化ストリームをGOPの途中で編集して復号してしまうと、再び編集後のタイトルを符号化する場合、編集前の符号化ストリームと対応するフレームが同じピクチャタイプに符号化されなくなる。すなわち、もともと例えばBピクチャで符号化されていたフレームがIピクチャで符号化される場合などが生じ、編集後の符号化ストリームにおいては画質が劣化する場合がある。
更に編集後の符号化ストリームが、編集前の事前解析された符号化ストリームとは対応するフレーム(同一画像)が異なるピクチャタイプのピクチャに符号化されると、事前解析結果を用いて最適な目標符号量を設定して符号化する2パス・エンコードが不可能になる。これに対し、本実施の形態にかかる画像符号化装置は、編集後の符号化ストリームにおいて、所定の画像(以下、挿入画像という。)を挿入することにより、編集前の事前解析済みの符号化ストリームと対応するフレームが同一ピクチャタイプのピクチャに符号化されるようピクチャ位相を揃えるものである。すなわち、ピクチャ位相を揃えるとは、一旦符号化した符号化ストリームの構成ピクチャを、復号し再符号化する際において当該構成ピクチャのピクチャタイプと同一のピクチャタイプになるよう、ピクチャタイプを一致させて符号化することを示す。ピクチャ位相を揃えることにより、事前解析された符号化ストリームにおいて、GOPの途中に編集点を設けて編集し再符号化する場合であっても編集前の符号化ストリームの事前解析結果を参照することができ、2パス・エンコードを可能にする。
ここでは、先ず、本実施の形態にかかる画像符号化装置の構成について説明し、次に、編集後のMPEGストリーム(以下、編集済符号化ストリームST1という。)を編集前のMPRGストリーム(以下、オリジナルストリームST0という。)のピクチャ位相に合わせる方法について説明し、最後にオリジナルストリームの事前解析結果を用いた編集済みストリームの2パス・エンコード方法について説明する。
図1は、本実施の形態にかかる画像符号化装置を示すブロック図である。画像符号化装置1は、符号化処理部2、編集部3、復号処理部4、表示部5、及びストレージインターフェース(I/F)6、7を有する。なお、表示部5は、画像符号化装置1とは異なる装置であってもよい。また、ストレージI/Fは本実施の形態においては、2つとして説明するが、2以上あってもよいことは勿論である。ストレージI/F6は、例えばHDD等の記憶装置30と接続され、ストレージI/F7は例えばDVDレコーダ等の記憶装置40と接続される。また、これら記憶装置30、40が画像符号化装置に含まれる構成としてもよい。
本実施の形態にかかる画像符号化装置1は、符号化処理部2により、入力される非圧縮の映像データを、MPEG符号化して記憶装置30、40に記録したり、編集部3により、記憶装置30、40に記録された符号化ストリームを編集したりする。また、復号処理部4により符号化ストリームを復号して表示部5にて表示(再生)する。ここで、本画像符号化装置1は、上述したように、映像データを符号化処理部2にて符号化した符号化ストリーム(以下、オリジナルストリームという。)を編集して編集済符号化ストリームST1を生成する場合に、オリジナルストリームST0と編集済符号化ストリームST1のピクチャ位相を揃える機能を有する。すなわち、オリジナルストリームST0において、例えばIピクチャに符号化されたフレームは編集済みストリームにおいてもIピクチャに符号化される。
このことにより、オリジナルストリームST0を生成する際にその複雑度を解析し、オリジナルストリームST0と共に保存しておけば、編集済みストリームST1を生成する際に、その複雑度を参照することができる。したがって、この複雑度に応じた最適な符号量を割り当てることができる。すなわち、編集済み符号化ストリームST1を生成する際の符号量を制御しつつ符号化する2パス・エンコードを可能とする。これにより、オリジナルストリームの符号化時よりビットレートを小さくしても画質の劣化を抑制し、例えばDVD等の記憶容量が限られたメディアに記録することができる。
以下、各ブロックについて詳細に説明する。図2は、符号化処理部の詳細を示すブロック図である。符号化処理部2は、図2に示すように、外部から供給される非圧縮の映像データ又は復号処理部4からの復号データが入力され、これをMPEG符号化する符号化部21及び符号化したデータを一時保存する符号化バッファ22を有する。また、符号化の際の各種情報を解析して複雑度を算出する解析部23を有する。更に、複雑度に基づき各ピクチャの目標符号量を割り当てる符号量割り当て部24を有し、これにより2パス・エンコードを可能にする。更にまた、図示せぬ制御部から指定される符号量又は符号量割り当て部24にて割り当てられた符号量で符号化するよう符号化部21を制御する符号量制御部25を有する。更に、2パス・エンコードの際、編集前後のピクチャ位相を一致させるために、符号化処理の一時停止、再開のタイミングを制御するポーズ/レジューム制御部26を有する。
符号化処理部2は、通常、タイトルを記録する場合には、入力される非圧縮の映像データから例えば比較的高いビットレートでMPEG符号化し、符号化したストリーム(オリジナルストリーム)をストレージI/F6を介して例えばHDD等の記憶容量が大きい記憶装置30に記憶する。そのとき解析部23は、上記映像データの各フレームを所定のピクチャに符号化する際に発生する符号量や量子化スケールに基づき複雑度Xを解析する。この複雑度Xは、各フレームを所定のピクチャタイプのピクチャに符号化する際の複雑度を示すものであって、各ピクチャに対応付けられたものとなっている。この複雑度Xは、オリジナルストリームと共に記憶装置30に記憶される。なお、複雑度Xは、記憶装置30ではなく、その他、装置内に設けられたメモリ(図示せず)等に記録するようにしてもよい。
解析部23は、特徴量観測部51及び複雑度算出部52を有する。特徴量観測部51は、1パス目の符号化の際に、特徴量としての画像の発生符号量と平均量子化スケールとを観測する。例えば、符号化部21が符号量制御部25の制御のもと、指定のビットレートRに基づいて非圧縮映像データからなるタイトルを符号化する際の各フレームfの発生符号量S[f]と平均量子化スケールQ[f]とを観測する。
複雑度算出部52は、特徴量観測部51で観測された発生符号量と平均量子化スケールとに基づいて複雑度を計算する。例えば、発生符号量をS[f]、平均量子化スケールをQ[f]、複雑度X[f]とした場合、複雑度X[f]は、
X[f]=S[f]*Q[f]
と計算することができる。
なお、2パス・エンコードの際の目標符号量を算出するための複雑度Xの計算方法の詳細は、例えば特許文献2に記載されている。通常は、このようにして算出された複雑度から符号量割り当て部24にて目標符号量を算出し、2パス目のエンコードの際に当該目標符号量となるよう符号化が行なわれる。
ここで、後述するように、編集済みストリームには、その符号化後にオリジナルストリームとピクチャ位相を一致させるため、編集点前及び/または編集点後に必要に応じて挿入画像が挿入される。本実施の形態における複雑度算出部52は、編集済みストリームを符号化して編集済符号化ストリームST1を生成する際には、オリジナルストリームST0の生成の際に解析した複雑度を参照し、オリジナルストリームにおける対応するフレームの複雑度を符号量割り当て部24に供給する。また、挿入画像を符号化してピクチャ(以下、挿入ピクチャという。)を生成する際の複雑度を、オリジナルストリームの複雑度から算出して符号量割り当て部24へ供給する。
符号量割り当て部24は、複雑度算出部52から供給される複雑度に基づき各フレームを符号化する(各ピクチャを生成する)際の目標符号量を割り当てる。目標符号量は、例えば、所定のGOP長などに対応する符号量の割当て区間で使用できる総符号量を画像毎の複雑度に応じて配分する。符号量の割当て区間をLフレームとし、第fフレームから第f+L−1フレームまでのフレームに割当てることができる総符号量をRa[f]とした場合、Ra[f]を複雑度X[f]で比例配分した各フレームの目標符号量T[f]は、割り当て区間の複雑度X[f]の総和をXsumとした場合、
T[f]=(X[f]/Xsum)*Ra[f]
として算出することができる。
符号量制御部25は、1パス目のエンコードの際には、予め設定されたか又は外部から指示されるビットレートで符号化されるよう符号化処理部2を制御する。2パス目のエンコードの際には、符号割当て部24からの情報に基づき、量子化スケールを計算し、この量子化スケールにより符号化させる。この際に実際に発生した発生符号量を計測して発生符号量と割当てた符号量とに差がある場合は、符号量が所定のビットレートに近づくようにフィードバック制御をかけて符号量を制御することで、目標符号量となるよう符号化が行なわれる。簡単には、発生符号量が目標符号量を上回っている場合には、量子化スケールを大きくして符号の発生を抑制し、下回っている場合には、量子化スケールを小さくして符号の発生を多くする。
更に、符号量制御部25は、符号化バッファ22のバッファ占有量を監視し、符号化した際に発生する符号量が符号化バッファ22でオーバーフロー又はアンダーフローを起こさないように監視して量子化スケールの調整やスタッフィングなどの制御を行う。例えば、符号化バッファ22のオーバーフローを回避する場合には、量子化スケールを大きくして符号の発生を抑制し、又は符号化すべき情報を符号化せず削除して発生符号量を抑制する。一方、符号化バッファ22のアンダーフローを回避する場合には、量子化スケールを小さくして符号の発生量を多くし、又はスタッフィングを行って発生符号量を増加させる。
符号化部21は、外部から供給される非圧縮の映像データや復号処理部4から送られる復号データを与えられたパラメタに従って符号化し、圧縮データを生成する。また、符号化部21は、発生符号量を計測して符号量制御部25に通知する。更に、1パス目の符号化の際には、発生符号量、平均量子化スケールを特徴量観測部51へ通知する。
符号化バッファ22は、符号化部21で符号化されたデータを蓄積し、固定のビットレートで出力することもできる。この符号化バッファ22により、画像ごとの発生符号量の変動を吸収することができる。
図1に戻って復号処理部4は、記憶装置30、40に記録されているMPEGストリームを復号して表示部5を介して表示する他、再符号化するために符号化処理部2へ供給する。図3は、復号処理部4の詳細を示すブロック図である。
復号処理部4は、符号化処理部2にて符号化された符号化ストリーム、又は記憶装置30、40に記録されている符号化ストリームを復号する復号部61と、復号されたオーディオ/ビデオデータを一時保存する復号バッファ62と、復号部61の復号処理のタイミングを制御するポーズ/レジューム制御部63とを有する。
上述の2パス・エンコードを実行する際には、復号処理部4にて、1パス目で符号化されたオリジナルストリームST0を復号する。ここで、符号化処理部2にて編集済符号化ストリームST1を生成する場合には、編集部3により生成された仮想のタイトルに当たる編集指示(プレイリスト)に従って、編集部3から順次GOPが供給され、これを復号処理する。この際、ポーズ/レジューム制御部63により、後述するように編集点がGOPの途中にある場合には、その直前の復号画像を繰り返し出力したり、編集済符号化ストリームに必要な復号画像のみを出力したりの制御を行う。こうして、復号処理部4が復号して出力する復号データ(編集済ストリーム)を符号化処理部2にて編集済符号化ストリームST1に符号化する。
図1に戻って、編集部3は、記憶装置30に記憶されたオリジナルストリームを所望の編集点で編集されるよう仮想のタイトルに当たるプレイリストを生成する。また、本実施の形態における編集部3は、プレイリスト編集した映像を2パス・エンコードさせるため、符号化処理部2及び復号処理部4を制御する機能を有する。なお復号処理部4及び符号化処理部2を制御するための制御部を別途設けてもよい。この制御方法についての詳細は後述する。
編集済符号化ストリームST1を生成する際には、編集部3には、例えば、ユーザにより所望の編集点間をカットするなどの指示と、編集済符号化ストリームST1を生成する際のビットレート等が指示される。編集部3は、その編集点の指示によりプレイリストを生成することで、オリジナルストリームST0を編集する。編集部3は、このプレイリストに従ってオリジナルストリームST0のGOPを復号処理部4へ供給させることで、編集済みストリームを再生することができる。また、編集済みストリームを2パス・エンコードを行なう場合には、復号処理部4に、編集済みストリームを出力させ、符号化処理部2にこれを2パス・エンコードさせる。すなわち、エンコード後の編集済み符号化ストリームST1が所望のデータ容量となるよう、ビットレートを指示し、複雑度Xに応じた目標符号量を割り当てさせ、これに基づき編集済みストリームを符号化させ編集済み符号化ストリームST1を生成させる。
次に、2パス・エンコードによる編集済み符号化ストリームST1の生成方法について詳細に説明する。本実施の形態においては、この画像符号化装置1により、既に記録済みのタイトル(オリジナルストリーム)に対して、例えば任意の2つのピクチャを指定して編集を行い、編集したタイトルのダビングをおこなう場合について説明する。
図4は、オリジナルストリームST0の編集方法を示す図である。図4(a)はオリジナルストリームを示す図、図4(b)は、編集点を含むオリジナルストリームのGOPを抜き出して示す図、図4(c)は、編集後のプレイリストの一部を示す図である。
図4(a)に示すように、オリジナルストリームST0は、複数のGOP#1、#2,・・#j,・・,#k,・・から構成される。なお、本実施の形態においては、説明の簡単のため、各GOPは、N(Nは整数)枚のピクチャから構成されるものとし、更に例えばI、P、B、B、P・・などのピクチャの並び順(符号化規則)も同一の構成であるものとして説明する。なお、オリジナルストリームST0と編集済符号化ストリームST1とにおいて同一フレームが同一ピクチャで符号化されていれば本願を適用することができる。つまり、GOP長や符号化規則がGOP間で異なっていてもオリジナルストリームST0と編集済符号化ストリームST1との間でピクチャ位相が一致していれば、GOP長、符号化規則等を全てのGOPで同一とする必要はない。
また、オリジナルストリームST0(GOP)を構成する各ピクチャの複雑度は、映像データからオリジナルストリームST0を生成する際に解析部23によって解析され複雑度Xとして記憶装置30に格納されているものとする。
以下の説明においては、図4に示す編集点A、Bを使用し、編集済符号化ストリームST1を生成する場合について説明する。ここで、オリジナルストリームST0は、GOP#s(1≦s≦S)からなり、各GOP#sは、ピクチャ#t(1≦t≦N)から構成されるものとする。編集点Aは、GOP#j(1≦j≦S)のピクチャ#n(1≦n≦N)と#n+1の間を示すものとする。なお、ピクチャ#n=#Nの場合には、編集点AはGOP境界を示す。更に、編集点A以降のピクチャはカットされるものとする。また、編集点Bは、GOP#k(1≦k≦S)の#m−1と#m(1≦m≦N)との間を示すものとする。なお、ピクチャ#m=#1の場合は、編集点BはGOP境界を示す。更に、編集点B以前のピクチャはカットされるものとする。
例えば、図4(b)に示すように、GOP単位で見た場合には、GOP#jの先頭ピクチャ#1乃至編集点A直前のピクチャ#nまでのストリームと、GOP#kの編集点B直後のピクチャ#m乃至最終ピクチャ#Nまでのストリームとが抜き出され、図4(c)に示すように、編集点A、Bが連続するよう編集される。
編集部3は、オリジナルストリーム中の任意の2つの編集点Aと編集点Bを指定してオリジナルストリーム(タイトル)を編集することができる。すなわち、編集点Aで編集済みストリームを終了させたり、編集点Bで編集済みストリームを開始させたり、又は編集点Aと編集点Bとを連続して再生されるような編集済みストリームとすることができる。編集の際にはオリジナルストリームへ操作の有無に関わらず、仮想のタイトルに当たるプレイリストを生成する。なお、プレイリストを生成する際にオリジナルストリームを編集操作してもよい。この編集部3は、このプレイリストを参照しながら、MPEG AVデコーダである復号処理部4へGOP単位でストリームを供給することにより、例えば編集点Aと編集点Bとを連続再生させる。
この復号処理部4が出力するオーディオ及びビデオ信号を表示部5に出力することで編集済みストリームを再生することができ、また、復号処理部4が復号した編集済みストリームを符号化処理部2へ入力して符号化処理する際にオリジナルストリームの複雑度を参照することで2パス・エンコードを行なう。そして、これを記憶装置40へ供給することでオリジナルストリームから編集した編集済みストリームの2パス・エンコードでの記録(ダビング)を行なうことができる。
2パス・エンコードでは、2パス目の符号化時の各フレームのピクチャ・タイプ(ピクチャ位相)は1パス目の符号化時と同じであることが条件となる。1パス目において解析した複雑度に応じて符号量を割り当てるため、ピクチャ位相が異なると適切な符号量を割り当てることができないためである。
よって、符号化処理部2が生成する編集済み符号化ストリームST1の各GOPでのピクチャ構造の規則とGOP長(GOP中のピクチャ総数)(以下、これらをピクチャ構成ともいう。)は、1パス目の符号化時と同様にする必要がある。すなわち、編集済み符号化ストリームST1のピクチャ位相をオリジナルストリームの位相と一致させる必要がある。
図5乃至図7は、編集済みストリームを生成する方法を説明する図である。編集部3は、図5乃至図7に示す6通りの場合に分けて、復号処理部4及び符号化処理部2を制御する。図5に示すのは、2つの編集点A、Bをつなぎ合わせる場合であって、図4(c)に示すGOP#jのピクチャ#1乃至#n及びGOP#kのピクチャ#m乃至#Nからなるピクチャ群(以下、編集ピクチャ群という。)に含まれるピクチャ総数がNの整数倍とは異なる場合には、編集点A、Bの間に所定の画像(挿入画像)を1又は複数枚挿入し、これを符号化した際のピクチャ群(以下、再符号化ピクチャ群という。)に含まれるピクチャ総数がNの整数倍となるよう制御する。
また、図6に示すのは、編集ピクチャ群に含まれるピクチャ総数がN又は2N枚である場合である。この場合には、編集点Bは編集済符号化ストリームST1においてGOP境界と一致するため挿入画像を挿入する必要がない。更に図7に示すのは、編集点が1箇所の場合であり、編集点Bが先頭にくる場合や、編集点Aで編集済みストリームが終了する場合を示す。これらの6通りの編集方法を1以上組み合わせて編集済みストリームが生成される。
先ず、編集ピクチャ群に含まれるピクチャ総数がNの整数倍にならない場合について説明する。
(1)n+(N−m+1)<N(図5(a)参照)
図5(a)に示すように、編集ピクチャ群に含まれるピクチャ総数(n+(N−m+1))<Nの場合とは、GOP#jの先頭ピクチャ#1乃至編集点Aまでのピクチャ#n(GOP#jの一部)102に含まれるピクチャ数n、GOP#kの編集点B以降のピクチャ#m乃至最終ピクチャ#N(GOP#kの一部)103に含まれるピクチャ数(N−m+1)の和n+(N−m+1)がN未満である場合である。
この場合、編集部3は、GOP#j中の編集点Aと編集点Bとの間に、GOP#jのピクチャ#nを復号した第1の復号画像Jを(m−n−1)枚挿入して再符号化ピクチャ群101を生成するよう符号化処理部2を制御する。すなわち、編集部3は、復号画像Jを編集ピクチャ群の編集点A、Bの間に(m−n−1)枚挿入させることで、再符号化ピクチャ群のピクチャ枚数をN枚とする。このことにより、再符号化ピクチャ群101をGOPと同一ピクチャ枚数とする。
復号画像Jを(m−n−1)枚挿入することで、GOP#jの一部102、GOP#kの一部103を、それぞれGOP#j、#kと同一ピクチャ位相とすることができる。これにより、ピクチャ位相が一致しているGOP#jの一部102、GOP#kの一部103については、GOP#j、#kの複雑度Xを参照することができる。
ところで、復号画像Jを符号化した挿入ピクチャ(第1の挿入ピクチャ)は、オリジナルストリームST0には存在しないピクチャであり、その複雑度は解析されていない。しかし、この復号画像Jは、GOP#jのピクチャ#nを復号した画像であり、画像JからGOP#jのピクチャ#nを生成する際の複雑度は事前解析により得られている。そこで、本実施の形態においては、復号画像Jから生成する挿入ピクチャの複雑度を、このGOP#jのピクチャ#nを生成する際に事前解析された複雑度に基づき算出することとする。これにより、編集済みストリームの各ピクチャを生成する際の複雑度が参照又は演算により求まることで、編集済みストリームを生成する際には、最適な符号量を割り当て2パス・エンコードを行なうことができる。復号画像Jから生成する挿入ピクチャの複雑度の算出方法及び複雑度を利用した符号化処理については後述する。
(2)n+(N−m+1)>N(図5(b)参照)
図5(b)に示すように、編集ピクチャ群に含まれるピクチャ総数(n+(N−m+1))>Nの場合とは、GOP#jの先頭ピクチャ#1乃至編集点Aまでのピクチャ#n(GOP#jの一部)102に含まれるピクチャ数n、GOP#kの編集点B以降のピクチャ#m乃至最終ピクチャ#N(GOP#kの一部)103に含まれるピクチャ数(N−m+1)の和n+(N−m+1)がNを超える場合である。
この場合、編集部3は、GOP#j中の編集点Aと編集点Bとの間に、GOP#jのピクチャ#nを復号した復号画像Jを((N−m)+m−1)枚挿入して再符号化ピクチャ群111を生成するよう符号化処理部2を制御する。すなわち、編集部3は、GOP#jのピクチャ#nの復号画像Jを、編集ピクチャ群の編集点A、Bの間に((N−m)+m−1)枚挿入させることで、再符号化ピクチャ群のピクチャ枚数を2N枚とする。
復号画像Jを((N−m)+m−1)枚挿入することで、GOP#jの一部102、GOP#kの一部103を、それぞれGOP#j、#kと同一ピクチャ位相とすることができる。これにより、ピクチャ位相が一致しているGOP#jの一部102、GOP#kの一部103については、GOP#j、#kの複雑度Xを参照することができる。また、挿入ピクチャの複雑度については上述と同様に、GOP#jのピクチャ#nの複雑度から算出するものとする。
更に、上述の場合には、GOP#jのピクチャ#nの復号画像Jを挿入する場合について説明したが、挿入画像を以下のようにしてもよい。すなわち、挿入画像として、復号画像Jのみならず、GOP#kのピクチャ#mの復号画像Kを使用する。そして、GOP#jの一部102に挿入画像Jを挿入することでフレーム数をN枚とし、挿入画像KとGOP#kの一部103とでフレーム数をN枚とし、これらにより2N枚からなる再符号化ピクチャ群を構成してもよい。この場合には、編集点Aから編集点Bまでを復号した映像は、復号画像J、Kの静止画像となり、復号画像Jのみとするより、より自然な編集結果を得られる。
(3)n+(N−m+1)=2N(図6(a)参照)
図6(a)に示すように、編集ピクチャ群に含まれるピクチャ総数(n+(N−m+1))=2Nの場合とは、GOP#jの先頭ピクチャ#1乃至編集点Aまでのピクチャ#n(GOP#jの一部)102に含まれるピクチャ数n、GOP#kの編集点B以降のピクチャ#m乃至最終ピクチャ#N(GOP#kの一部)103に含まれるピクチャ数(N−m+1)の和n+(N−m+1)=2Nの場合である。
すなわち、GOP#jのピクチャ#n=ピクチャ#N、GOP#jのピクチャ#m=ピクチャ#1であり、GOP#jの一部102がGOP#jの全部に一致し、GOP#kの一部103がGOP#kの全部に一致する場合であって編集点A、Bを接続した編集後の再符号化ピクチャ群(=編集ピクチャ群)121は1パス目のGOPと同位相となる場合である。この場合には、上記(1)、(2)とは異なり、挿入画像を挿入することなく、そのままGOPの複雑度を用いて2パス目のエンコードを行なうことができる。この場合、GOP#kの一部103=GOP#kをクローズドGOP化してもよい。
(4)n+(N−m+1)=N(図6(b)参照)
図6(b)に示すように、編集ピクチャ群に含まれるピクチャ総数(n+(N−m+1))=2Nの場合とは、GOP#jの先頭ピクチャ#1乃至編集点Aまでのピクチャ#n(GOP#jの一部)102に含まれるピクチャ数n、GOP#kの編集点B以降のピクチャ#m乃至最終ピクチャ#N(GOP#kの一部)103に含まれるピクチャ数(N−m+1)の和n+(N−m+1)=Nの場合である。
この場合においても、編集点A、Bを接続した編集後の再符号化ピクチャ群(=編集ピクチャ群)131は、GOPと同一ピクチャ位相となっており、上記(3)と同様、挿入画像を挿入する処理をすることなく、このまま2パス目のエンコードを行なうことができる。
(5)GOP#kが先頭に位置する場合(図7(a)参照)
図7(a)に示すように、例えば図4の編集点Bからオリジナルストリームの最終ピクチャまでを編集済みストリームとする場合、すなわち、GOP#k=GOP#1の場合である。
この場合、GOP#kの編集点B以降のピクチャ#m乃至最終ピクチャ#N(GOP#kの一部)103が編集ピクチャ群となるが、これをこのまま先頭GOPとすると、GOP#kのピクチャ#mがIピクチャに符号化されることになり、このままでは2パス目のエンコードの際にピクチャ位相が一致せず、オリジナルストリームの複雑度を参照することができない。よって、GOP#kの一部103の前に(m−1)枚の挿入画像を挿入して再符号化ピクチャ群141を得ることで、ピクチャ枚数をN枚とする。この場合、位相を揃えるために挿入する挿入画像は、予め用意した例えば単色画像M1〜M(m−1)とすることができる。なお、例えばGOP#kのピクチャ#mを復号した復号画像Kを挿入画像とするなどしてもよい。位相合わせのために単色画像を挿入する場合には、符号量が少なくてすむため、単色画像用の予め用意された複雑度を設定することができる。
ここで、上記挿入画像を符号化した挿入ピクチャもオリジナルストリームには存在しないピクチャであり、その複雑度は解析されていないが、単色画像を符号化して挿入ピクチャとする場合、その符号量は極めて少なくてよく、複雑度の値を適宜設定しておくことができる。また、復号画像Kを挿入画像とする場合には、上述と同様に、GOP#kのピクチャ#mを生成した際の複雑度から算出するものとする。
(6)GOP#jが末尾に位置する場合(図7(b)参照)
図7(b)に示すように、例えば図4の編集点Bからオリジナルストリームの最終ピクチャまでを編集済みストリームとする場合、すなわち、GOP#k=GOP#Sの場合である。
この場合、GOP#jの先頭ピクチャ#1乃至編集点Aまでのピクチャ#n(GOP#jの一部)102が編集ピクチャ群となるが、そのピクチャ枚数はn枚である。この場合には、上述と同様、GOP#jの一部102の後ろにGOP#jのピクチャ#nを復号した画像Jを(N−n)枚挿入して再符号化ピクチャ群151とすることで、そのピクチャ総数をN枚としてGOP長を揃えることができる。
ただし、GOP#jが最終GOPである場合には、必ずしも(N−n)枚の挿入画像を挿入せずともピクチャ位相を揃え、2パス目のエンコードの際に1パス目の複雑度を参照することができる。つまり、例えばピクチャ#nがピクチャ#1でIピクチャである場合には、挿入画像を挿入せずとも編集点Aまでの複雑度はオリジナルストリームST0の複雑度を引用でき、2パス・エンコードが可能である。またピクチャ#nがPピクチャやBピクチャである場合には、ピクチャ#nを復号できる最低限の枚数の挿入画像を挿入するものとすれば2パス・エンコードが可能となる。この場合、上述と同様、編集点Aまでの複雑度はオリジナルストリームST0の複雑度を引用し、挿入ピクチャの複雑度は、GOP#jのピクチャ#nの複雑度から算出すればよい。
以上のようにして、オリジナルストリームを構成するGOPの途中で編集し、編集後に復号し、再度符号化して符号化ストリームを生成しても、オリジナルストリームと同じフレームについてはピクチャタイプを一致させ、ピクチャ位相を揃えることができる。したがって、編集済みストリームは、オリジナルストリームと同じピクチャタイプに符号化されるため、画質の劣化がない。また、このことにより、オリジナルストリームを生成する際に複雑度を解析しておけば、編集済み符号化ストリームを生成する際には、その複雑度を参照することができ、この複雑度に応じて最適な符号量を割り当てた2パス・エンコードを可能にする。
なお、上記(1)、(4)、(5)、(6)においては、それぞれ再符号化ピクチャ群101、131、141、151のピクチャ総数をN枚とする場合、(2)、(3)においては、それぞれ再符号化ピクチャ群111、121のピクチャ総数を2N枚とする場合について説明したが、再符号化ピクチャ群のピクチャ総数はこれらに限らない。すなわち、再符号化ピクチャ群のピクチャ総数がNの整数倍であれば、編集済符号化ストリームST1における編集点Aについては、編集済符号化ストリームST1における編集点前後におけるフレームをオリジナルストリームST0と同一のピクチャタイプとしてピクチャ位相を一致させることができる。
次に、本実施の形態にかかる2パス・エンコード方法について詳細に説明する。図8、図9は、2パス目のエンコード方法を示すフローチャートである。画像符号化装置1に接続される記憶装置30には、予め複雑度が解析されたオリジナルストリームが記憶されているものとする。ユーザは、このタイトルを編集したプレイリストを作成し、これを2パス・エンコードを用いて記憶装置40に記録するものとする。
なお、本実施の形態においては、表示部5にて編集済みのタイトルを再生しつつ、これを再符号化して記憶装置40に記録する場合について説明するが、表示部5にて再生することなく記録するようにしてもよい。また、記憶装置30に記録されているオリジナルストリームST0を1パス目のオリジナルの符号化ストリーム、記憶装置40に記録する編集済符号化ストリームST1を2パス・エンコードにより符号化して記憶する編集済みのMPEG符号化ストリームとして説明する。
図8に示すように、先ず、画像符号化装置1は、編集されたプレイリストから全ピクチャ数、編集点を含むGOPの再生時刻、及び編集点のピクチャ再生時刻の情報を取得する(ステップS1)。各種情報を取得した後、編集されたオリジナルストリーム(タイトル)を表示部5にて表示する(ステップS2)。そして、編集部3は、編集点が上述した(1)〜(6)のいずれに当てはまるかを判断し、この判断結果に応じて復号処理部4、符号化処理部2を制御しつつ2パス・エンコードを実行させる。先ず、プレイリストの先頭GOPに編集点が存在するか否かを判定する(ステップS3)。先頭GOPに編集点が存在しない場合には、後述する図9に示す処理を実行する。
一方、先頭GOPに編集点がある場合は、編集部3は以下の処理を行う。ここでは、上述の(5)、図7(a)に示す場合、すなわち、先頭GOPに編集点Bが存在する場合について説明する。この場合、編集部3の制御のもと、復号処理部4は、先頭GOPから復号処理を開始するが、編集点Bの再生時刻まではGOPを出力させない。すなわち、表示部5では、再生画像については予め用意された単色画像などの挿入画像を表示し(挿入画像出力(ビデオ・ミュート制御))、音声についてはミュート処理を行う(オーディオ・ミュート制御)(ステップS4)。符号化処理部2は、復号処理部4から出力される単色画像などの挿入画像を2パス・エンコード、すなわち複雑度に応じて符号量を制御しつつ符号化を行なう。
上記処理中の編集点Bまでは、復号処理部4から出力される上記挿入画像を、所定の形式のピクチャに符号化していく。この場合、簡単には、オリジナルストリームのGOPのピクチャ構成と同一ピクチャ構成になるよう符号化すればよいが、N−m枚の挿入画像を挿入すれば、編集点B以降のピクチャ位相を揃えることができるので、挿入画像を符号化する際のピクチャタイプは、オリジナルストリームのGOPのピクチャ構成と異なっていてもよい。この挿入画像はオリジナルストリームST0には存在しない画像であるため、当該挿入画像の複雑度も存在しない。
そこで、本実施の形態においては、複雑度算出部52がこの挿入画像の複雑度を適宜算出するものとする。例えば、オリジナルストリームの先頭GOPの対応する複雑度に基づき算出することができる。なお、挿入画像が単色画像である場合には、符号量は極めて小さくてよく、予め用意された複雑度等を用いてもよい。また、先頭に配置される挿入画像はIピクチャとして復号されるため、その複雑度はオリジナルストリームの先頭GOPの先頭ピクチャの複雑度又はその数分の1などとしてもよい。符号量割り当て部24は、当該複雑度を取得し、この複雑度に応じて目標符号量を決定して挿入画像をGOPと同一ピクチャ位相として順次符号化していく(ステップS5)。
そして、編集点Bの再生時刻になった時点(ステップS6:Yes)で、復号処理部4はGOP#kのピクチャ#m以降の復号結果を出力させる(復号画像出力(ビデオ・アンミュート)/オーディオ・アンミュート制御)(ステップS7)。これにより、符号化処理部2は、編集点B以降は、オリジナルストリームの復号データを受け取り符号化する。編集点B以降は、オリジナルストリームとピクチャ位相が同じであるため、複雑度算出部52は、記憶装置30に保存されているオリジナルストリームの複雑度を読出し、符号量割り当て部24は、この複雑度に応じて目標符号量を決定し、符号化部2はこの目標符号量で復号データをMPEG符号化していき、後述するステップS10へ進む。
次に、ステップS3において、先頭GOPに編集点がない場合には、図9のステップS8に進み、プレイリストの先頭GOPに編集点がない場合には、復号処理部4にて先頭GOPから復号を開始する。そして、符号化処理部2では、複雑度算出部52がオリジナルストリームの対応するGOPの各ピクチャの複雑度を読み出し、符号量割り当て部24が目標符号量を算出して割り当て、符号化部21はこの目標符号量で復号処理部4が出力する復号データをMPEG符号化していく(ステップS9)。
こうして復号処理部4にて復号した画像を符号化処理部2にて、編集点Aの再生時刻まで、複雑度に応じて符号量を制御しつつ符号化する2パス・エンコードを行なう。そして、編集点Aの再生時刻になったら(ステップS10:Yes)、復号処理部4は、その出力を、その直前に復号したGOP#jのピクチャ#nの復号画像Jを繰り返し復号するなどして、そのままポーズする(デコード・ポーズ制御)。その際、オーディオはミュートする(オーディオ・ミュート制御)(ステップS11)。
そして、編集点Aとこの編集点Aと接続される編集点Bとを含む編集ピクチャ群に含まれるピクチャ総数(n+(N−m+1))がNより小さいとき(ステップS12:Yes)、すなわち、上記(1)、図5(a)の場合には、上記復号画像Jをm−n−1枚符号化する処理を実行する。この場合、符号化処理部2の複雑度算出部52が後述する複雑度Xpr、Xbrを算出し、符号量割り当て部24がこの複雑度Xpr、Xbrから目標符号量を算出し、符号化部21はこの目標符号量になるよう符号化処理をする(ステップS13)。
そして、符号化部21が(m−n−1)枚分の復号画像Jを符号化したら、すなわち(m−n−1)枚分の挿入画像である画像Jを挿入したら(ステップS14:Yes)、編集部3は、符号化部21の符号化を一旦停止させる(エンコード・ポーズ制御)(ステップS15)。すなわち、編集部3は、再符号化ピクチャ群のピクチャ総数がN枚となるよう、GOP#jのピクチャ#nを復号した画像Jを符号化した挿入ピクチャを、編集点A、Bの間に(m−n−1)枚挿入させることで、再符号化ピクチャ群のピクチャ総数をN枚とする。このことにより、再符号化ピクチャ群の編集点Aまで及び編集点A以降のピクチャ位相をオリジナルストリームのピクチャ位相に一致させることができる。
次いで、編集部3は復号処理部4のデコード・ポーズ制御及びオーディオ・ミュート制御を解除し、編集点A以降のGOP#jの残りを復号させる(ステップS16)。復号処理部4がGOP#jを最後まで復号したら、編集部3は、次に編集点Aと連続される編集点Bを含むGOP#kを復号処理部4へ供給する。復号処理部4は、編集点Bを含むGOP#kを復号する(ステップS17)。そして、編集点Bの再生時刻になったら(ステップS18:Yes)、編集部3は、符号化処理部2のエンコード・ポーズ制御を解除する(エンコード・レジューム制御)。これにより、符号化部21は、編集点B以降の復号された画像データの符号化を開始する(ステップS19)。
次に、編集ピクチャ群に含まれるピクチャ総数(n+(N−m+1))がNより大きい場合(ステップS12:No、ステップS20:Yes)、すなわち、上記(2)、図5(b)の場合には、符号化処理部2の複雑度算出部52が後述する複雑度Xir、Xpr、Xbrを算出し、この複雑度複雑度Xir、Xpr、Xbから符号量割り当て部24が目標符号量を算出し、符号化処理部2はこの目標符号量になるよう符号化処理をする(ステップS21)。
そして、符号化処理部2が(N−n+m−1)枚分の復号画像Jを符号化したら、すなわち。復号画像Jを符号化した挿入ピクチャを(N−n+m−1)枚挿入したら(ステップS22:Yes)、上述のステップS15からの処理を実行する。すなわち、編集部3は符号化処理部2のエンコード・ポーズ制御を行い、復号処理部4にGOP#jの残りの復号をさせ、更にGOP#kの先頭ピクチャから復号を開始させ、そして、編集点Bの再生時刻で符号化処理部2のエンコード・レジューム制御を実行する(ステップS15〜S19)。なお、上述したように、復号画像Jを符号化したピクチャを(N−n)枚挿入し、復号画像Kを符号化したピクチャを(m−1)枚挿入するようにしてもよい。
次に、編集ピクチャ群に含まれるピクチャ総数(n+(N−m+1))が2N枚である場合(ステップS20:No、ステップS23:Yes)、すなわち、上記(3)、図6(a)の場合、及び編集ピクチャ群に含まれるピクチャ総数(n+(N−m+1))がN枚である場合(ステップS23:No)、すなわち、上記(4)、図6(b)の場合には、ステップS25へ進む。ここで、ピクチャ総数(n+(N−m+1))が2N枚の場合(ステップS23:Yes)には、編集部3は符号化処理部2に指示して編集点Bを含むGOP#kをクローズドGOP化させてもよい。
以上、2パス・エンコードする編集ピクチャ群のピクチャ総数(n+(N−m+1))の枚数に応じて編集部3は復号処理部4、符号化処理部2を適宜制御する。編集点がない場合には、復号処理部4は編集部3から供給されるプレイリストで指定されるGOPを復号し、符号化処理部2は、復号された画像を順次MPEG符号化していく。こうして復号処理部4がプレイリストの最終GOPを復号し、符号化処理部2がこれを符号化したら(ステップS25:Yes)、編集部3は符号化処理部2のエンコードを終了させる(ステップS26)。
本実施の形態においては、このように、必要に応じて単色画像を符号化したピクチャ又は編集点直前または直後のピクチャを復号した復号画像を挿入することで、編集点A以前、及び/又は編集点B以降のエンコード後のピクチャ位相をオリジナルストリームのピクチャ位相と一致させることができる。このことにより、オリジナルストリームの符号化の際に解析された複雑度を引用し、目標符号量を設定して2パス・エンコードを可能とする。
ここで、2パス・エンコードを可能とするため、復号処理部4をポーズ・制御し、例えば図5に示す復号画像Jを1又は複数枚挿入することでピクチャ位相を揃えるが、この際、挿入画像(復号画像J、K、単色画像など)を符号化したピクチャは、オリジナルストリームにはないものであるため、複雑度も引用することができない。そこで、本実施の形態においては、この挿入画像の複雑度を、元の符号化ストリームの複雑度から推定算出する。
次に、符号化処理部2の符号量割り当て部における目標符号量を算出する方法、及びオリジナルストリームには存在しない挿入画像を符号化する際の複雑度の算出方法について説明する。図10、図11は、複雑度を用いて目標符号量を算出する方法を示すフローチャート、図12は、挿入するピクチャの複雑度を算出する方法を示すフローチャートである。
フレームfの符号化までに、入力された復号画像の解析ができるフレーム数をLaとする。図12に示すように、複雑度算出部52は、先ず、プレイリストから編集点の総数、編集点を含むGOP位置、編集点のピクチャ位置を取得する(ステップS31)。符号量割り当て部24は、入力された復号画像のフレーム番号fを−La+1と初期化する(ステップS32)
そして、複雑度算出部52は、プレイリストに従って順次GOPの複雑度X[s,t]を読み込んでいく(ステップS33)。オリジナルストリームST0の複雑度は、予め解析され、例えばオリジナルストリームST0と共に保存されている。ここで、複雑度[s,t]は、オリジナルストリームST0におけるGOP#s(1≦s≦S)のピクチャ#t(1≦t≦N)の複雑度を示すものとする。
そして、編集点Aの直前ピクチャの複雑度X[s,t]=X[#j,#n]まで読み込んだら(ステップS34:Yes)、本実施の形態においては、以降に必要に応じて位相を揃えるための挿入画像が挿入される。よって、編集点間に挿入される挿入画像の複雑度を算出する(ステップS35)。この詳細は、図12を参照して後述する。
複雑度算出部52は、入力されたフレームfがフレーム数Laを満たすか否かを判断する(ステップS36)。入力された画像のフレーム枚数がフレーム数La未満である場合(すなわち−La+1に初期化された画像のフレーム番号fがf<0の場合)、複雑度算出部52は、fの値をインクリメントし(ステップS38)、次の画像の複雑度を読み出す。
一方、入力された画像のフレーム枚数がフレーム数Laと同じになった場合(j=0)、複雑度算出部52は、フレームfが符号化処理を行う単位区間Cの倍数であるか否かを判断する(ステップS37)。
フレームfが符号処理を行う単位区間Cの倍数でない場合、複雑度算出部52はフレームfの値をインクリメントし(ステップS38)、次の画像の複雑度を読み出す。
一方、フレームfが符号化処理を行う単位区間Cの整数倍である場合、符号割当て部24は、符号量割り当て区間Cに対し符号量を割当てる。
先ず、割当て区間内の総符号量Raを、2パス目の符号化処理のビットレートに基づき算出する。この際、バッファ占有量BOC[f]を考慮して、総符号量を調整することも可能である。(ステップS39)
次に、符号量割当て部24は、各フレームの目標符号量を計算する。各フレームの目標符号量T[f]は、符号量の割当て区間に割当てることができる総符号量Ra[f]を複雑度X[s,t]で比例配分し、
T[f]=(X[s,t]/Xsum)*R[f]
と算出することができる。ここでXsumは割当て区間の複雑度X[s,t]の総和を示す。目標符号量T[f]は、フレームfからフレームf+L−1までの各々について計算する(ステップS41)。
続いて、符号量割り当て部24は、割当てられた目標符号量の符号化バッファ22におけるバッファ占有量を計算する(ステップS41)。例えば、バッファ占有量をBOC[f]は、
BOC[f]=BOC[f−1]+T[f]−Rframe
と計算することができる。ここでRframeは、本符号化で使うビットレートRから計算されたフレームあたりの符号量を示す。また、バッファ占有量の初期値BOC[0]=0とする
そして、符号量割り当て部24は、計算したバッファ占有量BOC[f]に基づき、符号化バッファ22がオーバーフロー又はアンダーフローを起こすか否かを判断する。例えば、符号化バッファの上限をBとした場合、バッファ占有量BOC[j]がB−Rframeより小さいか否かを判断する。
符号化バッファがアンダーフローを起こしている場合(ステップS42:Yes)、符号量割り当て部24は、符号化バッファ22がアンダーフローを起こさないように符号量を調節する(ステップS43)。例えば、符号化バッファ22の符号占有量が最小となるフレームfuを検出し、フレームfからfuまでに割当てた符号を、fuで符号化バッファがアンダーフローを起こさないように割当てを増加させる。そして、増加させた分の符号量は、fu+1からf+L−1のフレームに割当てた符号量から減少させる。
また、符号化バッファがオーバーフローを起こしている場合(ステップS44:Yes)、符号量割り当て部24は、符号化バッファ22がオーバーフローを起こさないように符号量を調節する。例えば、符号化バッファの符号量の占有量が最大となるフレームfoを検出し、フレームfからfoまでに割当てた符号量を、foで符号化バッファがオーバーフローを起こさないよう符号量の割当てを減少させる。そして、減少させた分の符号量は、fo+1からf+L−1のフレームに割当てる(ステップS45)
また、符号化バッファ22でオーバーフロー又はアンダーフローのいずれも起こさない、適切な割当てとなっている場合(ステップS42:No、ステップS44:No)、符号化部21は、割り当て区間Cの符号化を行う(ステップS46)。そして、ステップS38へ進み、フレームfの値をインクリメントし(ステップS38)、複雑度算出部52は次の画像の複雑度を読み出し、上述の処理を繰り返す。
次に、挿入画像Jの複雑度を算出する処理について説明する。図12に示すように、先ず、再符号化ピクチャ群の総数n+(N−m+1)がNより小さいか否かを判定する(ステップS51)。小さい場合には、s=j、t=n+1にセットし(ステップS52)、t=m−1に達するまで(ステップS53)、順次複雑度X[s,t]を算出する(ステップS54)。
ここで、t=n〜m−1までの間は、同一の復号画像Jを符号化する処理である。すなわち、この場合には、上述したように、編集点Aにおいて、復号画像Jがポーズ表示され、これを符号化処理するため、1パス・エンコードのオリジナルストリームには存在しない新た画像を挿入することになる。このため、1パス目の符号化処理では、この画像の複雑度が求められていない。よって、このままでは、ピクチャ毎の目標符号量を算出することができない。
ところで、この挿入画像はt=nにおける復号画像Jである。そこで本実施の形態においては、復号画像Jの複雑度X[#j,#n]に基づき、復号画像Jを符号化するピクチャタイプに応じて算出する。すなわち、をPピクチャに符号化するのであれば、
複雑度Xpr=X[#j,#n]/Dp
とし、Bピクチャに符号化するのであれば、
複雑度Xbr=X[#j,#n]/Db
として算出する。
ここで、0<Dp≦Dbであり、例えばXpr=X[#j,#n]/3、Xbr=X[#j,#n]/10等とすることができる。このDp、Dbは、1パス・エンコード時に同ピクチャの繰り返し箇所があれば、それの複雑度を参照してもよい。また、挿入される(m−n−1)枚分のピクチャは、編集点B以降の位相を揃えるために挿入するものであり、必ずしもこの(m−n−1)枚のピクチャは、オリジナルストリームにおけるt=n+1〜m−1までのピクチャタイプと同一である必要はない。編集点A以前又は編集点B以降に割り当てる符号量を増加したい場合には、オリジナルストリームよりBピクチャを増やし、挿入ピクチャの複雑度を小さくするなどしてもよい。
なお、ここでは、挿入画像をt=nにおける復号画像Jとして説明したが、上述したように、挿入画像としてs=k、t=mにおける復号画像Kを使用することもできる。すなわち、GOP#kのピクチャ#mを復号した復号画像Kの複雑度X[#k,#m]に基づき、挿入画像の複雑度を上記と同様に算出することも可能である。
更に、復号画像J又は復号画像Kのオリジナルストリームにおけるピクチャタイプに応じて、Dp、Dbの値を適宜調整することも可能である。例えば復号画像J又は復号画像KがオリジナルストリームST0においてIピクチャである場合には、Dp、Dbを大きくし、Bピクチャである場合にはDp、Dbを相対的に小さくしたりしてもよい。すなわち、上記の例では、Dp=3、Db=10として説明したが、復号画像J又は復号画像Kのピクチャタイプ等に応じ、Dp=1/3、Db=1など設定し、復号画像J又は復号画像Kを符号化する際の複雑度と同等以上の複雑度とすることも可能である。
そして、tを順次インクリメントし(ステップS55)、t=mとなったら、挿入ピクチャ総数=m−n−1(枚)、すなわち、挿入画像のフレーム分(m−n−1)、fを増加させてフレームf=f+(m−n−1)とし(ステップS56)、図10のステップS36へ進む。
また、再符号化ピクチャ群の総数n+(N−m+1)がNより大きく2Nより小さい場合には(ステップS57)、先ずs=j、t=n+1にセットし(ステップS58)、t=Nに達するまで(ステップS59)、tをインクリメントしながら上述のステップS54と同様の方法で複雑度Xpr、Xbrを算出する(ステップS60、S61)。
そして、t=Nより大きくなったらs=k、t=1にセットし(ステップS62)、tがmに達するまで(ステップS63)、tをインクリメントしながら複雑度X[s,t]を算出する(ステップS64、S65)。ここで、s=k、t=1に配置されるピクチャは、GOPの先頭ピクチャであるため、Iピクチャとされる。このIピクチャも復号画像Jの静止画像であるが、Iピクチャであるので、その符号量は他のPピクチャ、Bピクチャより多く割り当てられる必要がある。よって、Iピクチャとなるs=k、t=1における複雑度X[#k,#1]は、オリジナルストリームST0の複雑度X[#k,#1]をそのまま参照する。t=1以降のPピクチャ、Bピクチャは、上記と同様、複雑度Xpr=X[#j,#n]/Dp、複雑度Xbr=X[#j,#n]/Dbとして算出する。こうしてt=mに達したら、挿入ピクチャ総数=(N−n)+m−1(枚)、すなわち、挿入画像のフレーム分(N−n)+m−1、fを増加させてフレームf=f+(N−n)+m−1とし(ステップS66)、図10のステップS36へ進む。
なお、図10乃至図12の処理のタイミングは、符号化処理部2における図8、図9に示す2パス・エンコード時、各フレーム(復号画像)の符号化に先行して、その目標符号量が算出できればよい。
本実施の形態によれば、オリジナルストリームからフレーム(ピクチャ)単位で編集した編集済のタイトル(プレイリスト)において、編集点前後のピクチャ位相をオリジナルストリームST0のピクチャ位相と一致させることができる。したがって、ビットレートを下げて再符号化しても画質の劣化を最小限とすることができる。更に、オリジナルストリームを符号化する際に解析して複雑度を求めておけば、これを参照することができ、この複雑度に基づき目標符号量を算出して2パス・エンコードした編集済み符号化ストリームST1を得ることができる。よって、例えば記憶容量の大きいHDD等に録画された高ビットレートのオリジナルストリームをピクチャ単位で編集しても、2パス・エンコードにより画質の劣化を最低限に抑制しつつ記憶容量の小さいDVD等に記録(ダビング)するための編集済み符号化ストリームST1を生成することができる。
すなわち、編集点間においては、編集点直前の復号画像を符号化し、所望のフレーム(挿入画像)を挿入することで、編集点においてGOP境界に跨ぐピクチャ位相を維持することが可能となる。更に、挿入フレームは、ポーズ表示中の編集点直前の復号画像であるため、当該復号画像を符号化する際の複雑度Xを、オリジナルストリームにて得られる複雑度のDp又はDb分の1として決定することが可能となる。以上の処理によって、編集済み符号化ストリームST1を生成する際の各ピクチャの複雑度が得られるため、2パス・エンコード処理が可能となる。
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。例えば、上述の実施の形態において、図1乃至図3に示す各ブロックにおける任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。
本発明の実施の形態にかかる画像符号化装置を示すブロック図である。 本発明の実施の形態にかかる画像符号化装置の符号化処理部の詳細を示すブロック図である。 本発明の実施の形態にかかる画像符号化装置の復号処理部の詳細を示すブロック図である。 本発明の実施の形態にかかる画像符号化装置におけるオリジナルストリームの編集方法を示す図であって、(a)はオリジナルストリームを示す図、(b)は、編集点を含むオリジナルストリームのGOPを抜き出して示す図、(c)は、編集後のプレイリストの一部を示す図である。 本発明の実施の形態にかかる画像符号化装置における編集済みストリームを生成する方法を説明する図であって、(a)は、再符号化ピクチャ群に含まれるピクチャ総数(n+(N−m+1))<Nの場合、(b)は、n+(N−m+1)>Nの場合を説明する図である。 本発明の実施の形態にかかる画像符号化装置における編集済みストリームを生成する方法を説明する図であって、(a)は、再符号化ピクチャ群に含まれるピクチャ総数(n+(N−m+1))=2Nの場合、(b)は、n+(N−m+1)=Nの場合を説明する図である。 本発明の実施の形態にかかる画像符号化装置における編集済みストリームを生成する方法を説明する図であって、(a)は、編集点Bが先頭GOPに位置する場合、(b)は、編集点Aが最終GOPに位置する場合を説明する図である。 本発明の実施の形態にかかる画像符号化装置における2パス目のエンコード方法を示すフローチャートである。 同じく、本発明の実施の形態にかかる画像符号化装置における2パス目のエンコード方法を示すフローチャートである。 編集済みストリームにおいて、複雑度を用いて目標符号量を算出する方法を示すフローチャートである。 同じく、編集済みストリームにおいて、複雑度を用いて目標符号量を算出する方法を示すフローチャートである。 編集済みストリームにおいて、ピクチャ位相を揃えるために挿入するフレームの複雑度を算出する方法を示すフローチャートである。
符号の説明
2 符号化処理部
3 編集部
4 復号処理部
5 表示部
6,7 ストレージI/F
21 符号化部
22 符号化バッファ
23 解析部
24 符号割当て部
25 符号量制御部
26 ポーズ/レジューム制御部
30,40 記憶装置
51 特徴量観測部
52 複雑度算出部
61 復号部
62 復号バッファ
63 ポーズ/レジューム制御部

Claims (22)

  1. 非圧縮の映像データを符号化した符号化ストリームを編集する画像符号化装置であって、
    前記符号化ストリームを1又は複数の編集点で編集されるよう編集指示を作成する編集部と、
    前記編集指示に従って前記符号化ストリームを復号して編集済ストリームを生成する復号処理部と、
    前記編集済ストリームを再符号化して編集済符号化ストリームを生成する符号化処理部とを有し、
    前記符号化処理部は、前記符号化ストリームと同一フレームにおいては同一のピクチャタイプになるようピクチャ位相を揃えて前記編集済符号化ストリームを生成するものであって、前記編集済ストリームにおける前記編集点の前及び/又は後に所定の画像からなる挿入画像を挿入することで、前記符号化ストリーム及び前記編集済符号化ストリームの前記編集点まで及び/又は編集点後のピクチャ位相が同一になるよう前記編集済符号化ストリームを生成する画像符号化装置。
  2. 前記符号化ストリームは、符号化して各ピクチャを生成する際の複雑度が事前解析により算出されているものであって、
    前記符号化処理部は、前記複雑度に応じた目標符号量となるよう前記復号された編集済ストリームを符号化する
    ことを特徴とする請求項1記載の画像符号化装置。
  3. 前記挿入画像は、前記符号化ストリームに含まれる一のピクチャを復号した画像であって、
    前記符号化処理部は、前記一のピクチャを符号化した際の複雑度に基づき前記挿入画像を符号化する際の目標符号量を決定する
    ことを特徴とする請求項1又は2項記載の画像符号化装置。
  4. 前記符号化処理部は、前記符号化ストリームを構成する各ピクチャを符号化する際の複雑度を解析する解析部と、
    前記解析された複雑度に基づき前記各フレームに目標符号量を割り当てる符号量割り当て部とを有し、
    前記解析部は、前記符号化ストリームに含まれる一のピクチャを復号した復号画像の複雑度と、当該復号画像を前記挿入画像として符号化する際のピクチャタイプとに基づき、前記挿入画像の複雑度を決定する
    ことを特徴とする請求項1乃至3のいずれか1項記載の画像符号化装置。
  5. 前記符号化ストリームは、N(Nは整数)枚のピクチャを有する複数のGOPから構成されるものであって、
    前記編集部は、前記符号化ストリームの第1のGOPに含まれる第1の編集点と、第2のGOPに含まれる第2の編集点とが連続して再生されるよう前記編集指示を生成し、
    前記復号処理部は、前記第1のGOPを復号し、前記第2のGOPを復号し、
    前記符号化処理部は、前記第1の編集点と前記第2の編集点との間に1又は複数の前記挿入画像を挿入し、前記第1のGOPの先頭ピクチャ乃至前記第1の編集点、1又は複数の前記挿入画像を符号化した挿入ピクチャ、及び前記第2の編集点乃至前記第2のGOPの最終ピクチャまでに含まれるピクチャから構成される再符号化ピクチャ群のピクチャ総数をNの整数倍とする
    ことを特徴とする請求項1乃至4のいずれか1項記載の画像符号化装置。
  6. 前記第1のGOPの先頭ピクチャ乃至前記第1の編集点及び前記第2の編集点乃至前記第2のGOPの最終ピクチャまでに含まれるピクチャ総数がN(Nは整数)未満である場合、1又は複数の前記挿入画像を挿入することにより、前記再符号化ピクチャ群のピクチャ総数をNとする
    ことを特徴とする請求項5記載の画像符号化装置。
  7. 前記第1のGOPの先頭ピクチャ乃至前記第1の編集点及び前記第2の編集点乃至前記第2のGOPの最終ピクチャまでに含まれるピクチャ総数がN(Nは整数)より大きい場合、1又は複数の前記挿入画像を挿入することにより、前記再符号化ピクチャ群のピクチャ総数を2Nとする
    ことを特徴とする請求項5項記載の画像符号化装置。
  8. 前記挿入画像は、前記第1の編集点直前のピクチャである第1のピクチャを復号した第1の復号画像である
    ことを特徴とする請求項5項記載の画像符号化装置。
  9. 前記挿入画像は、前記第1の編集点直前のピクチャである第1のピクチャを復号した第1の復号画像であり、
    前記第1のピクチャの複雑度をX、Pピクチャに符号化する際の複雑度を算出するための定数Dp、及びBピクチャに符号化する際の複雑度を算出するための定数Dbとしたとき、前記符号化処理部は、前記第1の挿入画像をPピクチャに符号化する場合には、その複雑度をX/Dpとし、前記第1の挿入画像をBピクチャに符号化する場合には、その複雑度をX/Db(1<Dp≦Db)とし、当該複雑度に基づき前記第1の挿入画像の目標符号量を決定して前記挿入画像を生成する
    ことを特徴とする請求項8項記載の画像符号化装置。
  10. 前記符号化処理部は、前記第1の挿入画像をIピクチャに符号化する場合には、その複雑度を前記第2のGOPに含まれるIピクチャの複雑度とし、当該複雑度に基づき前記挿入画像の目標符号量を決定して前記挿入ピクチャを生成する
    ことを特徴とする請求項9項記載の画像符号化装置。
  11. 前記第1の編集点直前のピクチャである第1のピクチャを復号した画像を第1の復号画像とし、前記第2の編集点直後のピクチャである第2のピクチャを復号した画像を第2の復号画像とし、
    前記符号化処理部は、前記第1の編集点の直後に1又は複数の前記第1の復号画像を挿入し、前記第1のGOPの先頭ピクチャ乃至前記第1の編集点までに含まれるピクチャ、及び1又は複数の前記第1の復号画像を符号化した第1の挿入ピクチャのピクチャ総数をN(Nは整数)としてGOPを生成し、前記第2の編集点直前に1又は複数の前記第2復号画像を挿入し、1又は複数の前記第2の挿入画像を符号化した第2の挿入ピクチャ及び前記第2の編集点乃至前記第2のGOPの最終ピクチャまでに含まれるピクチャのピクチャ総数をNとしてGOPを生成する
    ことを特徴とする請求項7項記載の画像符号化装置。
  12. 前記符号化ストリームは、N(Nは整数)枚のピクチャを有する複数のGOPから構成され、第2の編集点を有する第2のGOPを含み、前記第2のGOPの先頭ピクチャから前記第2の編集点までのピクチャがカットされるものであって、
    前記編集部は、前記第2のGOPが前記編集済ストリームの先頭となるよう前記符号化ストリームを編集し、
    前記復号処理部は、前記第2の編集点直前に所定の画像である第3の挿入画像を1又は複数挿入し、前記1又は複数の第3の挿入画像を符号化した第3の挿入ピクチャ及び前記第2の編集点乃至前記第2のGOPの最終ピクチャまでに含まれるピクチャのピクチャ総数をNとしてGOPを生成する
    ことを特徴とする請求項1乃至4のいずれか1項記載の画像符号化装置。
  13. 前記第3の挿入画像は、単色画像である
    ことを特徴とする請求項12項記載の画像符号化装置。
  14. 前記第3の挿入画像をIピクチャに符号化する場合には、その複雑度を前記第2のGOPに含まれるIピクチャの複雑度とし、当該複雑度に基づき前記第3の挿入画像の目標符号量を決定して前記第3の挿入画像を生成する
    ことを特徴とする請求項12又は13項記載の画像符号化装置。
  15. 前記第3の挿入画像をPピクチャ又はBピクチャに符号化する場合には、予め定められた複雑度とし、当該複雑度に基づき前記第3の挿入画像の目標符号量を決定して前記3の挿入画像を生成する
    ことを特徴とする請求項12乃至14のいずれか1項記載の画像符号化装置。
  16. 前記符号化ストリームは、N(Nは整数)枚のピクチャを有する複数のGOPから構成され、第1の編集点を有する第1のGOPを含み、前記第1のGOPは前記第1の編集点から最終ピクチャまでがカットされるものであって、
    前記編集部は、前記第1のGOPの前記第1の編集点直前のピクチャが前記編集済ストリームの最終ピクチャとなるよう前記符号化ストリームを編集し、
    前記符号化処理部は、所定の画像である第4の挿入画像を前記第1の編集点直後に1又は複数挿入し、前記第1のGOPの先頭乃至前記編集点までに含まれるピクチャ及び前記1又は複数の第4の挿入画像を符号化した第4の挿入ピクチャのピクチャ総数をN(Nは整数)枚としてGOPを生成する
    ことを特徴とする請求項1乃至4のいずれか1項記載の画像符号化装置。
  17. 前記第4の挿入画像は、前記第1の編集点直前の第1のピクチャを復号した第1の復号画像である
    ことを特徴とする請求項16項記載の画像符号化装置。
  18. 前記第4の挿入画像は、単色画像である
    ことを特徴とする請求項16項記載の画像符号化装置。
  19. 非圧縮の映像データを符号化した符号化ストリームを編集する画像符号化方法であって、
    非圧縮の映像データを符号化した符号化ストリームを1又は複数の編集点で編集されるよう復号して編集済ストリームを生成する工程と、
    前記符号化ストリームと同一フレームにおいては同一のピクチャタイプになるようピクチャ位相を揃えて前記編集済ストリームを符号化するする工程とを有し、
    前記編集済ストリームを符号化する工程では、前記編集済ストリームにおける前記編集点の前及び/又は後に所定の画像からなる挿入画像を挿入し、前記符号化ストリーム及び前記編集済符号化ストリームの前記編集点まで及び/又は編集点後のピクチャ位相が同一になるよう編集済符号化ストリームを生成する画像符号化方法
  20. 非圧縮の映像データをMPEG符号化すると共に、各ピクチャを生成する際の複雑度を算出し、
    前記編集後の復号データを符号化する際、前記複雑度を使用して2パス・エンコードを実施する
    ことを特徴とする請求項19記載の画像符号化方法。
  21. 非圧縮の映像データを符号化した符号化ストリームを編集する画像符号化処理部と、
    符号化ストリームを記録する2以上の記録部とを備え、
    前記画像符号化処理部は、
    一方の記憶装置に記録された前記符号化ストリームを1又は複数の編集点で編集されるよう編集指示を生成する編集部と、
    前記編集指示に従って前記符号化ストリームを復号して編集済ストリームを生成する復号処理部と、
    前記編集済ストリームを再符号化して編集済符号化ストリームを生成する符号化処理部とを有し、
    前記符号化処理部は、前記符号化ストリームと同一フレームにおいては同一のピクチャタイプになるようピクチャ位相を揃えて前記編集済符号化ストリームを生成するものであって、前記編集済ストリームにおける前記編集点の前及び/又は後に所定の画像からなる挿入画像を挿入することで、前記符号化ストリーム及び前記編集済符号化ストリームの前記編集点まで及び/又は編集点後のピクチャ位相が同一になるよう前記編集済符号化ストリームを生成し、
    前記他方の記憶装置は、前記編集済符号化ストリームを記録する画像編集装置。
  22. 前記符号化ストリームは、符号化して各ピクチャを生成する際の複雑度が事前解析により算出されているものであって、
    前記符号化処理部は、前記複雑度に応じた目標符号量となるよう前記復号された編集済ストリームを符号化する
    ことを特徴とする請求項21記載の画像編集装置。
JP2005289912A 2005-10-03 2005-10-03 画像符号化装置、画像符号化方法及び画像編集装置 Expired - Fee Related JP4791129B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2005289912A JP4791129B2 (ja) 2005-10-03 2005-10-03 画像符号化装置、画像符号化方法及び画像編集装置
TW95134613A TWI334309B (en) 2005-10-03 2006-09-19 Image encoding apparatus, picture encoding method and image editing apparatus
KR20060097323A KR100834322B1 (ko) 2005-10-03 2006-10-02 이미지 인코딩 장치, 화상 인코딩 방법 및 이미지 편집장치
US11/541,548 US20070077023A1 (en) 2005-10-03 2006-10-03 Image encoding apparatus, picture encoding method and image editing apparatus
CNB2006101420759A CN100553343C (zh) 2005-10-03 2006-10-08 图像编码设备、画面编码方法和图像编辑设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005289912A JP4791129B2 (ja) 2005-10-03 2005-10-03 画像符号化装置、画像符号化方法及び画像編集装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010166173A Division JP2010252394A (ja) 2010-07-23 2010-07-23 画像符号化装置、画像符号化方法及び画像編集装置

Publications (2)

Publication Number Publication Date
JP2007104182A JP2007104182A (ja) 2007-04-19
JP4791129B2 true JP4791129B2 (ja) 2011-10-12

Family

ID=37944904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005289912A Expired - Fee Related JP4791129B2 (ja) 2005-10-03 2005-10-03 画像符号化装置、画像符号化方法及び画像編集装置

Country Status (5)

Country Link
US (1) US20070077023A1 (ja)
JP (1) JP4791129B2 (ja)
KR (1) KR100834322B1 (ja)
CN (1) CN100553343C (ja)
TW (1) TWI334309B (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4438994B2 (ja) * 2004-09-30 2010-03-24 ソニー株式会社 動画像データの編集装置および動画像データの編集方法
JP5381297B2 (ja) * 2009-04-30 2014-01-08 ソニー株式会社 情報処理装置及び編集方法
KR101953522B1 (ko) * 2011-06-17 2019-02-28 가부시키가이샤 제이브이씨 켄우드 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화 프로그램, 및 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
KR101589388B1 (ko) * 2011-06-20 2016-01-27 가부시키가이샤 제이브이씨 켄우드 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화 프로그램, 또한 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
MY173199A (en) 2011-06-28 2020-01-03 Samsung Electronics Co Ltd Method and apparatus for image encoding and decoding using intra prediction
TWI478540B (zh) * 2012-10-05 2015-03-21 Univ Nat Pingtung Sci & Tech 影像壓縮方法
JP6410483B2 (ja) 2013-08-09 2018-10-24 キヤノン株式会社 画像処理装置
CN105516734B (zh) * 2015-12-10 2019-11-15 腾讯科技(深圳)有限公司 一种视频可播放性的检测方法和装置
CN106231319A (zh) * 2016-07-14 2016-12-14 观止云(北京)信息技术有限公司 一种基于软硬件结合的逐帧对齐的方法
JP7130050B2 (ja) * 2018-11-26 2022-09-02 グーグル エルエルシー 安全かつデバイス間で一貫性のあるビデオ圧縮
JP7273504B2 (ja) * 2018-12-27 2023-05-15 日本放送協会 映像符号化ストリーム編集装置及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3182329B2 (ja) * 1995-11-15 2001-07-03 株式会社東芝 符号化データ編集装置とデータ復号装置
JP3094899B1 (ja) * 1996-03-13 2000-10-03 ダイキン工業株式会社 デジタル圧縮データ部分編集方法およびその装置
JPH1098713A (ja) * 1996-09-20 1998-04-14 Sony Corp 映像信号切換装置
EP1467563A1 (en) * 1997-07-25 2004-10-13 Sony Corporation Editing device and method
JPH11341435A (ja) * 1998-05-22 1999-12-10 Sony Corp 編集方法および編集装置
US6310915B1 (en) * 1998-11-20 2001-10-30 Harmonic Inc. Video transcoder with bitstream look ahead for rate control and statistical multiplexing
JP3736503B2 (ja) * 2002-07-08 2006-01-18 ソニー株式会社 画像データ処理装置及び方法
JP3736504B2 (ja) * 2002-07-08 2006-01-18 ソニー株式会社 画像データ処理装置及び方法
JP2004165894A (ja) * 2002-11-12 2004-06-10 Kddi Corp 符号化器のビットレート制御方法
JP4221667B2 (ja) * 2004-08-25 2009-02-12 ソニー株式会社 情報処理装置および情報処理方法、記録媒体、並びに、プログラム

Also Published As

Publication number Publication date
TW200715870A (en) 2007-04-16
CN100553343C (zh) 2009-10-21
TWI334309B (en) 2010-12-01
CN1946183A (zh) 2007-04-11
KR20070037695A (ko) 2007-04-06
KR100834322B1 (ko) 2008-06-02
JP2007104182A (ja) 2007-04-19
US20070077023A1 (en) 2007-04-05

Similar Documents

Publication Publication Date Title
KR100834322B1 (ko) 이미지 인코딩 장치, 화상 인코딩 방법 및 이미지 편집장치
JP4045553B2 (ja) 編集装置、編集方法、再符号化装置、再符号化方法、スプライシング装置及びスプライシング方法
JP4221676B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JP4207072B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
US6256451B1 (en) Apparatus and method of editing video data
JPH10145798A (ja) デジタル符号化信号処理方式
JP2001189940A (ja) 映像データフォーマット装置及び映像データストレージ装置
JP3529599B2 (ja) 符号化装置における編集可能点挿入方法および符号化装置
JP2000165802A (ja) ストリーム編集装置と編集方法
KR100975170B1 (ko) 화상 데이터 재생 장치 및 방법
KR101119685B1 (ko) 정보 처리 장치, 정보 처리 방법, 및 기록 매체
JP4743119B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JPH08251582A (ja) 符号化データ編集装置
JPH10336679A (ja) 可変レート符号化装置
JP3918332B2 (ja) 多重化装置、多重化方法及び記録媒体
JP3982354B2 (ja) 画像データ再生装置及び方法
JP2003052040A (ja) Mpegデータ再生装置
JP2010252394A (ja) 画像符号化装置、画像符号化方法及び画像編集装置
JP4416845B2 (ja) 符号化装置及びその方法、および、記録装置及びその方法
JP2008258858A (ja) 動画像符号化装置
JPH0918830A (ja) 映像編集装置
JPH1198514A (ja) 画像符号化装置および方法
JP4301237B2 (ja) 符号化装置及びその方法、記録装置及びその方法、および、記録媒体
JP3897783B2 (ja) 画像処理装置及びその制御方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP4333522B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びに、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080714

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100712

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110719

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110721

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140729

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees