JP2006157855A - Information recording medium, image encoding method, and image decoding method - Google Patents
Information recording medium, image encoding method, and image decoding method Download PDFInfo
- Publication number
- JP2006157855A JP2006157855A JP2005049981A JP2005049981A JP2006157855A JP 2006157855 A JP2006157855 A JP 2006157855A JP 2005049981 A JP2005049981 A JP 2005049981A JP 2005049981 A JP2005049981 A JP 2005049981A JP 2006157855 A JP2006157855 A JP 2006157855A
- Authority
- JP
- Japan
- Prior art keywords
- picture
- information
- field
- image
- random access
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
【課題】 VC−1においてランダムアクセス単位の先頭がP/Iピクチャであると、シームレス接続やマルチアングル再生時に、P/Iピクチャの第1フィールドであるPピクチャが復号できず、解像度が半分になるという課題があった。
【解決手段】 クローズドGOP型のRAUであることを識別するフラグがセットされている際には、RAUの先頭にはP/Iピクチャを配置しない。画像復号装置では、RAUの先頭がP/Iピクチャであるかどうかに応じて表示動作を切替えるための手段が不要となる。
【選択図】 図34PROBLEM TO BE SOLVED: To prevent a P picture, which is the first field of a P / I picture, from being decoded at the time of seamless connection or multi-angle playback when the head of a random access unit is a P / I picture in VC-1, and the resolution is halved There was a problem of becoming.
When a flag for identifying a closed GOP type RAU is set, a P / I picture is not arranged at the head of the RAU. In the image decoding apparatus, means for switching the display operation depending on whether or not the head of the RAU is a P / I picture becomes unnecessary.
[Selection] Figure 34
Description
本発明は、シームレス接続やマルチアングル再生などの特殊再生時に有効な補助情報を符号化する画像符号化方法と画像復号方法、およびそのストリームに関する。 The present invention relates to an image encoding method and an image decoding method for encoding auxiliary information effective during special reproduction such as seamless connection and multi-angle reproduction, and a stream thereof.
近年、音声,画像,その他の画素値を統合的に扱うマルチメディア時代を迎え、従来からの情報メディア,つまり新聞,雑誌,テレビ,ラジオ,電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形、音声、特に画像等を同時に関連づけて表すことをいうが、上記従来の情報メディアをマルチメディアの対象とするには、その情報をディジタル形式にして表すことが必須条件となる。 In recent years, with the era of multimedia that handles sound, images, and other pixel values in an integrated manner, conventional information media, that is, means for transmitting information such as newspapers, magazines, televisions, radios, telephones, etc., to people have become multimedia. It has come to be taken up as a target. In general, multimedia refers to not only characters but also figures, sounds, especially images, etc. that are associated with each other at the same time. It is an essential condition.
ところが、上記各情報メディアの持つ情報量をディジタル情報量として見積もってみると、文字の場合1文字当たりの情報量は1〜2バイトであるのに対し、音声の場合1秒当たり64Kbits(電話品質)、さらに動画については1秒当たり100Mbits(現行テレビ受信品質)以上の情報量が必要となり、上記情報メディアでその膨大な情報をディジタル形式でそのまま扱うことは現実的では無い。例えば、テレビ電話は、64Kbit/s〜1.5Mbits/sの伝送速度を持つサービス総合ディジタル網(ISDN : Integrated Services Digital Network)によってすでに実用化されているが、テレビ・カメラの映像をそのままISDNで送ることは不可能である。 However, when the information amount of each information medium is estimated as a digital information amount, the amount of information per character is 1 to 2 bytes in the case of characters, whereas 64 Kbits (phone quality) per second in the case of speech. In addition, for a moving image, an information amount of 100 Mbits (current television reception quality) or more per second is required, and it is not realistic to handle the enormous amount of information in the digital format as it is with the information medium. For example, a video phone has already been put into practical use by an integrated services digital network (ISDN) having a transmission speed of 64 Kbit / s to 1.5 Mbits / s. It is impossible to send.
そこで、必要となってくるのが情報の圧縮技術であり、例えば、テレビ電話の場合、ITU−T(国際電気通信連合 電気通信標準化部門)で勧告されたH.261やH.263規格の動画圧縮技術が用いられている。また、MPEG−1規格の情報圧縮技術によると、通常の音楽用CD(コンパクト・ディスク)に音声情報とともに画像情報を入れることも可能となる。 Therefore, what is required is information compression technology. For example, in the case of a videophone, H.264 recommended by ITU-T (International Telecommunication Union Telecommunication Standardization Sector). 261 and H.264. H.263 standard video compression technology is used. In addition, according to the information compression technology of the MPEG-1 standard, it is possible to put image information together with audio information on a normal music CD (compact disc).
ここで、MPEG(Moving Picture Experts Group)とは、ISO/IEC(国際標準化機構 国際電気標準会議)で標準化された動画像信号圧縮の国際規格であり、MPEG−1は、動画像信号を1.5Mbpsまで、つまりテレビ信号の情報を約100分の1にまで圧縮する規格である。また、MPEG−1規格では対象とする品質を伝送速度が主として約1.5Mbpsで実現できる程度の中程度の品質としたことから、さらなる高画質化の要求をみたすべく規格化されたMPEG−2では、動画像信号を2〜15MbpsでTV放送品質を実現する。さらに現状では、MPEG−1,MPEG−2と標準化を進めてきた作業グループ(ISO/IEC JTC1/SC29/WG11)によって、MPEG−1,MPEG−2を上回る圧縮率を達成し、更に物体単位で符号化・復号・操作を可能とし、マルチメディア時代に必要な新しい機能を実現するMPEG−4が規格化された。MPEG−4では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、現在はインタレース画像も含む高ビットレートも含む、より汎用的な符号化に拡張されている。その後、ISO/IECとITU−Tが共同でより高圧縮率の次世代画像符号化方式として、MPEG−4 AVC(Advanced Video Coding)がされ、さらに、現在SMPTE(Society of Motion Picture and Television Engineers)においてVC−1(非特許文献1)が規格化中である。VC−1では、MPEG−2、およびMPEG−4の方式をベースとして、符号化ツール等の拡張を行っている。このうちVC−1は、BD(Blu−ray disc)、HD(High Definition)−DVDなど次世代の光ディスク関連機器などで使用される見込みである。 Here, MPEG (Moving Picture Experts Group) is an international standard for video signal compression standardized by ISO / IEC (International Electrotechnical Commission). This is a standard for compressing information of a television signal up to 5 Mbps, that is, about 1/100. In addition, since the MPEG-1 standard sets the target quality to a medium quality that can be realized mainly at a transmission rate of about 1.5 Mbps, the MPEG-2 standardized to meet the demand for higher image quality. Then, the TV broadcast quality is realized at 2 to 15 Mbps for the moving image signal. Furthermore, at present, the working group (ISO / IEC JTC1 / SC29 / WG11) that has been standardizing with MPEG-1 and MPEG-2 achieves a compression ratio that exceeds MPEG-1 and MPEG-2, and further, in units of objects. MPEG-4 has been standardized that enables encoding, decoding, and operation, and that realizes new functions required in the multimedia era. In MPEG-4, it was originally aimed at standardizing a low bit rate encoding method, but now it has been extended to a more general encoding including a high bit rate including interlaced images. Thereafter, MPEG-4 AVC (Advanced Video Coding) was jointly developed by ISO / IEC and ITU-T as a next-generation image coding method with a higher compression rate, and now SMPTE (Society of Motion Picture and Television Engineers). VC-1 (Non-Patent Document 1) is being standardized. In VC-1, the encoding tool and the like are expanded based on the MPEG-2 and MPEG-4 systems. Of these, VC-1 is expected to be used in next-generation optical disc related devices such as BD (Blu-ray disc) and HD (High Definition) -DVD.
一般に動画像の符号化では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ピクチャとの差分値に対して符号化を行う。ここで、ピクチャとは1枚の画面を表す用語であり、プログレッシブ画像ではフレームを意味し、インタレース画像ではフレームもしくはフィールドを意味する。ここで、インタレース画像とは、1つのフレームが時刻の異なる2つのフィールドから構成される画像である。インタレース画像の符号化や復号処理においては、1つのフレームをフレームのまま処理したり、2つのフィールドとして処理したり、フレーム内のブロック毎にフレーム構造またはフィールド構造として処理したりすることができる。 In general, in encoding of moving images, the amount of information is compressed by reducing redundancy in the time direction and the spatial direction. Therefore, in inter-picture predictive coding for the purpose of reducing temporal redundancy, motion is detected and a predicted image is created in units of blocks with reference to the forward or backward picture, and the resulting predicted image and the encoded image are encoded. Encoding is performed on the difference value from the target picture. Here, a picture is a term representing a single screen, which means a frame in a progressive image and a frame or field in an interlaced image. Here, an interlaced image is an image in which one frame is composed of two fields having different times. In interlaced image encoding and decoding processing, one frame can be processed as a frame, processed as two fields, or processed as a frame structure or a field structure for each block in the frame. .
参照画像を持たず画面内予測符号化を行うものをIピクチャと呼ぶ。また、1枚のピクチャのみを参照し画面間予測符号化を行うものをPピクチャと呼ぶ。また、同時に2枚のピクチャを参照して画面間予測符号化を行うことのできるものをBピクチャと呼ぶ。Bピクチャは表示時間が前方もしくは後方から任意の組み合わせとして2枚のピクチャを参照することが可能である。ただし、これらのピクチャを符号化および復号する場合の条件として、参照するピクチャが既に符号化および復号されている必要がある。 A picture that does not have a reference picture and performs intra prediction coding is called an I picture. A picture that performs inter-frame predictive coding with reference to only one picture is called a P picture. A picture that can be subjected to inter-picture prediction coding with reference to two pictures at the same time is called a B picture. The B picture can refer to two pictures as an arbitrary combination of display times from the front or the rear. However, as a condition for encoding and decoding these pictures, the picture to be referenced needs to be already encoded and decoded.
次に、VC−1のストリーム構造について説明する。VC−1も基本的にはMPEG−2と同一のストリーム構造をもつ。ただし、ランダムアクセスポイントは、エントリ・ポイント(Entry Point)と呼ばれ、エントリ・ポイントにはヘッダ(Entry Point Header)が付加される。エントリ・ポイントから次のエントリ・ポイントまでのデータがランダムアクセス単位となり、MPEG−2におけるGOP(Group of Pictures)に相当する。以降、VC−1におけるランダムアクセス単位をRAU(Random Access Point)と呼ぶ。ここで、RAUには、RAUを構成するピクチャについてのユーザーデータ(エントリ・ポイントレベルのユーザーデータ)を格納することができ、エントリ・ポイント・ヘッダの直後に格納される。 Next, the stream structure of VC-1 will be described. VC-1 also basically has the same stream structure as MPEG-2. However, the random access point is called an entry point (Entry Point), and a header (Entry Point Header) is added to the entry point. Data from an entry point to the next entry point is a random access unit and corresponds to GOP (Group of Pictures) in MPEG-2. Hereinafter, the random access unit in VC-1 is referred to as RAU (Random Access Point). Here, in the RAU, user data (entry point level user data) regarding the pictures constituting the RAU can be stored, and is stored immediately after the entry point header.
VC−1におけるピクチャのタイプについて以下に示す。まず、I、P、BピクチャについてはMPEG−2と同等の予測構造をもつが、これら3種類のピクチャに加えて、Skippedピクチャ、およびBIピクチャの2種類が定義される。Skippedピクチャとは、画素データを含まないピクチャであり、復号順で直前の参照ピクチャと同一の画素データを持つPピクチャとして扱う。例えば、下記の例では、S6がP4と同一であるとみなされるため、ストリームの復号時の動作は(1)と(2)で同一となる。 The types of pictures in VC-1 are shown below. First, I, P, and B pictures have a prediction structure equivalent to that of MPEG-2, but in addition to these three kinds of pictures, two kinds of Skipped pictures and BI pictures are defined. A skipped picture is a picture that does not include pixel data, and is handled as a P picture having the same pixel data as the immediately preceding reference picture in decoding order. For example, in the following example, since S6 is considered to be the same as P4, the operation at the time of decoding the stream is the same in (1) and (2).
(1)表示順: I0 B1 P2 B3 P4 B5 S6 (SはSkippedピクチャを示す)
(2)表示順: I0 B1 P2 B3 P4 B5 P4
Skippedピクチャは、画像が静止しているケースにおいて特に有効である。例えば、RAUの途中から画像が静止する際には、I0 P1 P2 P3 S4 S5 S6..のように、画像が静止している部分についてはSkippedピクチャを使用することで、符号量が削減できる。また、BIピクチャとは、BピクチャとIピクチャの性質を併せ持つピクチャである。具体的には、復号と表示の順序は異なり、他のピクチャからは参照されないという点でBピクチャの性質をもち、全てのマクロブロックが画面内符号化されており、他のピクチャを参照しないという点でIピクチャの性質をもつ。
(1) Display order: I0 B1 P2 B3 P4 B5 S6 (S indicates a skipped picture)
(2) Display order: I0 B1 P2 B3 P4 B5 P4
The skipped picture is particularly effective when the image is stationary. For example, when the image is stopped from the middle of the RAU, I0 P1 P2 P3 S4 S5 S6. . As described above, the code amount can be reduced by using a skipped picture for a portion where the image is stationary. A BI picture is a picture having both the characteristics of a B picture and an I picture. Specifically, the order of decoding and display is different, and it has the property of a B picture in that it is not referenced from other pictures, and all macroblocks are intra-coded and do not refer to other pictures. It has the characteristics of an I picture at a point.
次に、I、P、B、Skipped、およびBIピクチャの判別方法を説明する。基本的にはピクチャレイヤのピクチャタイプを参照することによりピクチャのタイプが判別できるが、ピクチャレイヤにより示すことのできるピクチャタイプはプロファイルに応じて下記のように規定される。 Next, a method for discriminating I, P, B, Skipped, and BI pictures will be described. Basically, the picture type can be determined by referring to the picture type of the picture layer, but the picture type that can be indicated by the picture layer is defined as follows according to the profile.
シンプル・プロファイル: I、P
メイン・プロファイル: I、P、B、BI
アドバンスト・プロファイル: I、P、B、BI、Skipped
Simple profile: I, P
Main profile: I, P, B, BI
Advanced Profile: I, P, B, BI, Skipped
ここで、シンプル、メインの両プロファイルではピクチャレイヤのピクチャタイプにからはSkippedピクチャを判別できないため、任意のピクチャタイプをもつピクチャのサイズが1バイト以下である際に、当該ピクチャがSkippedピクチャであると規定されている。また、メイン・プロファイルでは、BまたはBIピクチャを示すピクチャタイプが定義されており、ピクチャタイプからBピクチャとBIピクチャとを区別することはできない。 Here, in both the simple and main profiles, the skipped picture cannot be determined from the picture type of the picture layer. Therefore, when the size of a picture having an arbitrary picture type is 1 byte or less, the picture is a skipped picture. It is prescribed. In the main profile, a picture type indicating a B or BI picture is defined, and the B picture and the BI picture cannot be distinguished from the picture type.
VC−1のRAUにおいても、MPEG−2と同様にオープンGOP型とクローズドGOP型とがある。クローズドGOP型とは、RAU内のBピクチャが復号順で直前のRAU内のIピクチャあるいはPピクチャを参照しないタイプである。一方、オープンGOP型は、RAU内のBピクチャが復号順で直前のRAU内のIピクチャあるいはPピクチャを参照してもよいタイプである。なお、オープン型、クローズド型ともに、RAU内のIピクチャとPピクチャは、復号順で直前のRAU内のIピクチャとPピクチャを参照できない。 The VC-1 RAU also has an open GOP type and a closed GOP type as in MPEG-2. The closed GOP type is a type in which the B picture in the RAU does not refer to the I picture or P picture in the immediately preceding RAU in the decoding order. On the other hand, the open GOP type is a type in which a B picture in an RAU may refer to an I picture or P picture in the immediately preceding RAU in decoding order. In both the open type and the closed type, the I picture and P picture in the RAU cannot refer to the I picture and P picture in the immediately preceding RAU in the decoding order.
次に、フィールド符号化時に1フレームを構成するフィールドのタイプについて説明する。VC−1では、アドバンスト・プロファイルだけがフィールド符号化に対応しており、フィールド符号化時の第1フィールドと第2フィールドのピクチャタイプは、ピクチャレイヤにおけるフィールド・ピクチャタイプにより示される。フィールド・ピクチャタイプは、(第1フィールドのピクチャタイプ、第2フィールドのピクチャタイプ)として、(I、I)、(I、P)、(P、I)、(P、P)、(B、B)、(B、BI)、(BI、B)、(BI、BI)の8通りが定義されている。以降、これらのピクチャを、それぞれI/Iピクチャ、I/Iピクチャ、I/Pピクチャ、P/Iピクチャ、P/Pピクチャ、B/Bピクチャ、B/BIピクチャ、BI/Iピクチャ、BI/BIピクチャと呼ぶ。ここで、1フレームを構成する2つのフィールドは、フィールド・ペアと呼ばる。I/Pピクチャなど上記8通りのピクチャは、ピクチャと表記するが、全てフィールド・ペアである。なお、MPEG−2においては、P/Iピクチャ、B/BIピクチャ、BI/Iピクチャ、およびBI/BIピクチャは存在しない。 Next, the types of fields constituting one frame at the time of field encoding will be described. In VC-1, only the advanced profile supports field coding, and the picture type of the first field and the second field at the time of field coding is indicated by the field picture type in the picture layer. The field picture type is (I, I), (I, P), (P, I), (P, P), (B, Eight types of B), (B, BI), (BI, B), and (BI, BI) are defined. Hereinafter, these pictures are referred to as I / I picture, I / I picture, I / P picture, P / I picture, P / P picture, B / B picture, B / BI picture, BI / I picture, BI / This is called a BI picture. Here, the two fields constituting one frame are called field pairs. The above eight pictures such as I / P pictures are referred to as pictures, but are all field pairs. In MPEG-2, there are no P / I picture, B / BI picture, BI / I picture, and BI / BI picture.
図35は、従来の画像符号化方法を実現する画像符号化装置1のブロック図である。
画像符号化装置1は、入力される画像信号Vin を圧縮符号化して可変長符号化等のビットストリームに変換した画像符号化信号Str を出力する装置であり、動き検出ユニットME、動き補償ユニットMC、減算ユニットSub、直交変換ユニットT、量子化ユニットQ、逆量子化ユニットIQ、逆直交変換ユニットIT、加算ユニットAdd、ピクチャメモリPicMem、スイッチSW、および可変長符号化ユニットVLCを備えている。
FIG. 35 is a block diagram of an
The
画像信号Vin は、減算ユニットSubおよび動き検出ユニットMEに入力される。減算ユニットSubは、入力された画像信号Vin と予測画像の差分値を計算し、直交変換ユニットTに出力する。直交変換ユニットTは、差分値を周波数係数に変換し、量子化ユニットQに出力する。量子化ユニットQは、入力された周波数係数を量子化し、量子化値Qcoefを可変長符号化ユニットに出力する。 The image signal Vin is input to the subtraction unit Sub and the motion detection unit ME. The subtraction unit Sub calculates a difference value between the input image signal Vin and the predicted image and outputs the difference value to the orthogonal transform unit T. The orthogonal transform unit T converts the difference value into a frequency coefficient and outputs it to the quantization unit Q. The quantization unit Q quantizes the input frequency coefficient and outputs the quantized value Qcoef to the variable length coding unit.
逆量子化ユニットIQは、量子化値Qcoefを逆量子化して周波数係数に復元し、逆直交変換ユニットITに出力する。逆直交変換ユニットITは、周波数係数から画素差分値に逆周波数変換し、加算ユニットAddに出力する。加算ユニットAddは、画素差分値と動き補償ユニットMCから出力される予測画像とを加算して復号画像とする。スイッチSWは、当該復号画像の保存が指示された場合にONになり、復号画像はピクチャメモリPicMemに保存される。 The inverse quantization unit IQ inversely quantizes the quantized value Qcoef to restore the frequency coefficient, and outputs the frequency coefficient to the inverse orthogonal transform unit IT. The inverse orthogonal transform unit IT performs inverse frequency conversion from the frequency coefficient to the pixel difference value, and outputs the result to the addition unit Add. The addition unit Add adds the pixel difference value and the predicted image output from the motion compensation unit MC to obtain a decoded image. The switch SW is turned ON when an instruction to store the decoded image is given, and the decoded image is stored in the picture memory PicMem.
一方、画像信号Vin がマクロブロック単位で入力された動き検出ユニットMEは、ピクチャメモリPicMemに格納されている復号画像を探索対象とし、最も入力画像信号に近い画像領域を検出することによってその位置を指し示す動きベクトルMVを決定する。 On the other hand, the motion detection unit ME to which the image signal Vin is input in units of macroblocks uses the decoded image stored in the picture memory PicMem as a search target and detects the position by detecting the image region closest to the input image signal. A motion vector MV to be pointed is determined.
動き補償ユニットMCでは、上記処理によって検出された動きベクトルなどを用いて、ピクチャメモリPicMemに格納されている復号画像から予測画像に最適な画像領域を取り出す。 In the motion compensation unit MC, using the motion vector detected by the above processing, an image region optimal for the predicted image is extracted from the decoded image stored in the picture memory PicMem.
ピクチャ予測構造決定ユニットPTYPEはRAU開始ピクチャRAUinによって対象ピクチャがRAUの開始位置であれば、対象ピクチャをランダムアクセスが可能な特別なピクチャとして符号化(画面内符号化)するように、ピクチャタイプPtypeで動き検出ユニットMEおよび動き補償ユニットMCに指示し、更にそのピクチャタイプPtypeを可変長符号化ユニットVLCで符号化する。ここで、先頭ピクチャをフィールドとして符号化する際のピクチャタイプとしては、I/I、I/P、およびP/Iピクチャを自由に選択できる。 If the target picture is the start position of the RAU by the RAU start picture RAUin, the picture prediction structure determination unit PTYPE encodes the target picture as a special picture that can be randomly accessed (intra-screen coding). Then, the motion detection unit ME and the motion compensation unit MC are instructed, and the picture type Ptype is encoded by the variable length encoding unit VLC. Here, I / I, I / P, and P / I pictures can be freely selected as picture types when the first picture is encoded as a field.
可変長符号化ユニットVLCは量子化値Qcoef、ピクチャタイプPtypeおよび動きベクトルMVなどを可変長符号化して符号化ストリームStrとする。 The variable length coding unit VLC performs variable length coding on the quantized value Qcoef, the picture type Ptype, the motion vector MV, and the like to obtain an encoded stream Str.
図36は、従来の画像復号方法を実現する画像復号装置3のブロック図である。同図において、図35の画像符号化装置1のブロック図と同じ動作をするユニットは同じ記号を付し、説明を省略する。可変長復号ユニットVLDは符号化ストリームStrを復号し、量子化値Qcoef、相対インデックスIndex、ピクチャタイプPtypeおよび動きベクトルMVを出力する。量子化値Qcoef、相対インデックスIndexおよび動きベクトルMVは、ピクチャメモリPicMem、動き補償ユニットMCおよび逆量子化ユニットIQに入力され復号処理が行われるが、その動作は図14の従来の画像符号化方法を実現する画像符号化装置のブロック図で説明済みである。バッファメモリBufMemは、復号画像Voutを格納するメモリである。表示方法切替ユニットModeSetは、次に表示するピクチャがRAUの先頭ピクチャである際には、ピクチャタイプを取得するために必要なデータPinfをバッファメモリBufMemに格納された復号画像データから取得する。さらに、当該ピクチャがP/Iピクチャである際には、第1フィールドと第2フィールドにおいて同一の画像を表示する旨を表示命令modeによって表示ユニットDispに通知する。P/Iピクチャでなければ、第1フィールドと第2フィールドは、1フレームを構成するフィールド・ペアにおける第1フィールドと第2フィールドを、それぞれ表示するように表示ユニットDispに指示する。表示ユニットDispは、バッファメモリBufMemから復号画像Dinを取得し、表示命令modeに従って表示する。なお、ピクチャメモリPicMemとバッファメモリBufMemは共用してもよい。
FIG. 36 is a block diagram of an
図37は、従来の画像復号装置3において、マルチアングル再生や、同一ストリーム内の異なる区間を連続して再生するなどの特殊再生時の表示動作を示すフローチャートである。まず、ステップS1001において表示対象のピクチャがRAUの先頭ピクチャであるかどうか判定する。先頭ピクチャであれば、ステップS1002に進み、先頭ピクチャでなければステップS1005に進む。ステップS1002では、ピクチャのピクチャタイプを取得して、ステップS1003においてP/Iピクチャであったかどうか判定する。P/Iピクチャである際にはステップS1004に進み、P/IピクチャでなければステップS1005に進む。ステップS1004では、第2フィールドを2回繰り返して表示すると決定する。つまり、P/Iピクチャにおいては、第1フィールドであるPピクチャは復号できないため、第2フィールドであるIピクチャをPピクチャの代わりに表示することになる。ステップS1005では、フィールド・ペアを構成する第1フィールドと第2フィールドを、それぞれ順番に表示すると決定する。
RAUの先頭ピクチャがP/Iピクチャであると、飛び込み再生やマルチアングル再生などの特殊再生時に、P/Iピクチャの第1フィールドであるPピクチャが再生できないという課題があった。また、RAUの先頭がP/Iピクチャである際には、第2フィールドを繰り返して表示するなどして、P/Iピクチャ以外のピクチャとは表示動作を切替える必要があり、表示に係る処理が増加するという課題もあった。以下に、特殊再生時の課題について説明する。 When the leading picture of the RAU is a P / I picture, there is a problem that the P picture, which is the first field of the P / I picture, cannot be played back during special playback such as jump playback or multi-angle playback. In addition, when the head of the RAU is a P / I picture, it is necessary to switch the display operation to a picture other than the P / I picture by repeatedly displaying the second field, etc. There was also a problem of increasing. Hereinafter, problems during special reproduction will be described.
図27が示すように、P/IピクチャをRAUの先頭ピクチャとして用いることも可能である。RAUの先頭は特殊再生等における再生開始点として指定することができる位置であるが、P/Iピクチャを先頭ピクチャとして有しているRAUから再生を開始する場合、第1フィールドであるPピクチャは前方の他のピクチャを参照しているために復号することができない。そのため、第2フィールドであるIピクチャからデコードを開始することになり、このP/Iピクチャであるフレームの画像を表示するときには、第2フィールドの画像のみからフレームを表示することになる。例えば、第2フィールドの画像を2回出力することにより、1フレームの画像を表示する。 As shown in FIG. 27, it is also possible to use a P / I picture as the leading picture of the RAU. The head of the RAU is a position that can be designated as a playback start point in special playback or the like. However, when playback is started from an RAU that has a P / I picture as the head picture, the P picture that is the first field is It cannot be decoded because it refers to another picture in front. Therefore, decoding is started from the I picture that is the second field, and when displaying the image of the frame that is the P / I picture, the frame is displayed only from the image of the second field. For example, by outputting the second field image twice, one frame image is displayed.
さらに、図28が示すように、RAU先頭のピクチャのみ読み込む早送り再生のような特殊再生をする場合、同様にPピクチャはデコードできないので、1フレームのうちの1フィールドしかデコードできず、解像度が半分に落ちてしまう欠点がある。 Furthermore, as shown in FIG. 28, in the case of special reproduction such as fast-forward reproduction in which only the RAU head picture is read, P picture cannot be decoded in the same way, so only one field in one frame can be decoded, and the resolution is halved. There is a fault that falls.
また、DVDやBDなどでは、プレイリストを用いて同一ストリームにおいて異なる時間位置のストリームを連続再生する、あるいは、マルチアングル再生時に異なるアングルを構成するストリームを連続して再生するなどの特殊再生が一般的に行われる。さらに、追記型、あるいは書き換え型のディスクにおいては、編集後のストリームをプレイリストによって仮想的に連結することもある。このとき、プレイリストでは、プレイアイテムと呼ばれる再生区間を連続して再生する。図29は、プレイリストから指される第1プレイアイテムと第2プレイアイテムとを連続的に再生する例を示す。ここで、第2プレイアイテムの先頭ピクチャがP/Iピクチャであると、P/Iピクチャを構成するPピクチャは復号できず、第1プレイアイテムから第2プレイアイテムへのシームレスな接続が実現できない。 Also, for DVD, BD, etc., special playback such as continuous playback of streams at different time positions in the same stream using a playlist, or continuous playback of streams constituting different angles during multi-angle playback is common. Done. Further, in a write-once or rewritable disc, the edited streams may be virtually linked by a playlist. At this time, in the playlist, playback sections called play items are continuously played back. FIG. 29 shows an example in which the first play item and the second play item pointed to by the play list are continuously reproduced. Here, if the first picture of the second play item is a P / I picture, the P picture constituting the P / I picture cannot be decoded, and a seamless connection from the first play item to the second play item cannot be realized. .
本発明は、以上の課題を解決するためになされたものである。
本発明の請求項1にかかる情報記録媒体は、少なくとも動画像の符号化データを多重化したストリームとその管理情報とを記録した情報記録媒体であって、前記管理情報は前記ストリーム内の動画像の再生時刻情報、サイズ情報、およびストリーム内での開始アドレス情報とを記録し、前記動画像の符号化データは、1以上のランダムアクセス可能な単位から構成され、前記動画像の符号化方式においては、1フレームの画像をフィールド単位で符号化する際に、第1フィールドを前方予測ピクチャとし、第2フィールドを面内符号化ピクチャとして符号化されたフィールド・ペアを使用できる際に、前記符号化データにおいて前記フィールド・ペアが存在するかどうかを示す識別情報を格納することを特徴とする。
The present invention has been made to solve the above problems.
An information recording medium according to
本発明の請求項2にかかる情報記録媒体は、前記ランダムアクセス単位には、ランダムアクセス単位内の双方向予測ピクチャが、復号順で直前のランダムアクセス単位内のピクチャを参照することを禁止した、クローズド型のランダムアクセス単位と、ランダムアクセス単位内の双方向予測ピクチャが、復号順で直前のランダムアクセス単位内のピクチャを参照することを許容した、オープン型のランダムアクセス単位と、の2種類があり、前記識別情報は、前記ランダムアクセス単位がクローズド型であるかどうかを示す情報であり、前記ランダムアクセス単位がクローズド型である際には、前記ランダムアクセス単位の先頭に前記フィールド・ペアが存在しないことを特徴とする請求項1記載の情報記録媒体である。
In the information recording medium according to
本発明の請求項3にかかる情報記録媒体は、前記識別情報は、前記符号化ストリームのビットレートが所定の値以下であるかどうかを示す情報であることを特徴とする請求項1記載の情報記録媒体である。
The information recording medium according to
本発明の請求項4にかかる情報記録媒体は、前記動画像は再生時刻に応じて複数の再生区間に分割され、前記管理情報は、1以上の前記動画像における1以上の前記再生区間を連続して再生するための情報を格納し、前記識別情報は、前記管理情報に格納され、前記連続して再生される前記再生区間がシームレスに接続されるかどうかを示し、前記シームレスに接続されることが示される際には、接続先となる前記再生区間の先頭は前記フィールド・ペアでないことを特徴とする請求項1の情報記録媒体である。
In the information recording medium according to a fourth aspect of the present invention, the moving image is divided into a plurality of reproduction sections according to a reproduction time, and the management information includes one or more reproduction sections in one or more moving images. Information for playback is stored, and the identification information is stored in the management information and indicates whether the playback sections that are continuously played back are seamlessly connected, and is seamlessly connected. The information recording medium according to
本発明の請求項5にかかる情報記録媒体は、前記動画像は再生時刻に応じて複数の再生区間に分割され、前記管理情報は、1以上の前記動画像における1以上の前記再生区間を連続して再生するための情報を格納し、前記識別情報は、前記管理情報に格納され、前記連続して再生される区間が、それぞれ異なる動画像のストリームに属するかどうかを識別する情報であり、前記異なる動画ストリームに属することが示される際には、接続先となる前記再生区間の先頭は前記フィールド・ペアでないことを特徴とする。
In the information recording medium according to
本発明の請求項6にかかる画像符号化方法は、動画像を1以上のランダムアクセス単位に符号化する画像符号化方法であって、前記動画像の符号化方式においては、1フレームの画像をフィールド単位で符号化する際に、第1フィールドを前方予測ピクチャとし、第2フィールドを面内符号化ピクチャとして符号化されたフィールド・ペアを使用できる際に、前記ランダムアクセス単位の先頭ピクチャが前記フィールド・ペアであるかどうかを示す情報を作成する補助情報作成ステップと、前記作成した補助情報と画素を符号化して符号化ストリームを作成する符号化ステップと、を備えることを特徴とする。 An image encoding method according to a sixth aspect of the present invention is an image encoding method for encoding a moving image in one or more random access units. In the moving image encoding method, an image of one frame is encoded. When a field pair encoded with a first field as a forward prediction picture and a second field as an in-plane encoded picture can be used when encoding in field units, the first picture of the random access unit is Auxiliary information creating step for creating information indicating whether the pair is a field pair, and an encoding step for coding the created auxiliary information and pixels to create an encoded stream are provided.
本発明の請求項7にかかる画像符号化装置は、動画像を1以上のランダムアクセス単位に符号化する画像符号化装置であって、前記動画像の符号化方式においては、1フレームの画像をフィールド単位で符号化する際に、第1フィールドを前方予測ピクチャとし、第2フィールドを面内符号化ピクチャとして符号化されたフィールド・ペアを使用できる際に、前記ランダムアクセス単位の先頭ピクチャが前記フィールド・ペアであるかどうかを示す情報を作成する補助情報作成手段と、前記作成した補助情報と画素を符号化して符号化ストリームを作成する符号化手段と、を備えることを特徴とする。 An image encoding apparatus according to a seventh aspect of the present invention is an image encoding apparatus that encodes a moving image in one or more random access units. In the moving image encoding method, an image of one frame is encoded. When a field pair encoded with a first field as a forward prediction picture and a second field as an in-plane encoded picture can be used when encoding in field units, the first picture of the random access unit is Auxiliary information creating means for creating information indicating whether the pair is a field pair, and coding means for coding the created auxiliary information and pixels to create a coded stream are provided.
本発明の請求項8にかかる画像復号方法は、請求項1の情報記録媒体に記録された符号化データを復号して再生する画像復号方法であって、前記識別情報により、前記ランダムアクセス単位の先頭ピクチャが前記フィールド・ペアでないことが示される場合に、前記先頭ピクチャにおける第1フィールド、および第2フィールドを、それぞれ1番目と2番目に表示する表示ステップ、を備えることを特徴とする。 An image decoding method according to an eighth aspect of the present invention is an image decoding method for decoding and reproducing the encoded data recorded on the information recording medium of the first aspect, wherein the random access unit is decoded based on the identification information. And a display step of displaying the first field and the second field in the first picture in the first and second directions, respectively, when it is indicated that the first picture is not the field pair.
本発明の請求項9にかかる画像復号装置は、請求項1の情報記録媒体に記録された符号化データを復号して再生する画像復号装置であって、前記識別情報により、前記ランダムアクセス単位の先頭ピクチャが前記フィールド・ペアでないことが示される場合に、前記先頭ピクチャにおける第1フィールド、および第2フィールドを、それぞれ1番目と2番目に表示する表示手段、を備えることを特徴とする。 An image decoding apparatus according to a ninth aspect of the present invention is an image decoding apparatus that decodes and reproduces the encoded data recorded on the information recording medium of the first aspect, wherein the random access unit is determined based on the identification information. Display means for displaying the first field and the second field in the first picture first and second respectively when the first picture is indicated not to be the field pair.
本発明の請求項10にかかる情報記録媒体は、少なくとも動画像の符号化データを多重化したストリームとその管理情報とを記録した情報記録媒体であって、前記管理情報は前記ストリーム内の動画像の再生時刻情報、サイズ情報、およびストリーム内での開始アドレス情報とを記録し、前記動画像の符号化データは、1以上のランダムアクセス可能な単位から構成され、前記動画像の符号化方式においては、1フレームの画像をフィールド単位で符号化する際に、第1フィールドを前方予測ピクチャとし、第2フィールドを面内符号化ピクチャとして符号化されたフィールド・ペアを使用できる際に、前記ランダムアクセス単位の先頭とは異なるピクチャが前記フィールド・ペアであるときには、前記ランダムアクセス単位内のピクチャであって、前記フィールド・ペアよりも表示順が後であるピクチャは、前記フィールド・ペアの第1フィールドを参照しないことが保証され、前記保証されることを示す情報を前記ストリーム内に格納することを特徴とする。 An information recording medium according to a tenth aspect of the present invention is an information recording medium that records at least a stream in which encoded data of moving images is multiplexed and management information thereof, and the management information is a moving image in the stream. Reproduction time information, size information, and start address information in the stream, and the encoded data of the moving image is composed of one or more randomly accessible units, and in the encoding method of the moving image When a field pair encoded with a first field as a forward-predicted picture and a second field as an in-plane encoded picture can be used when an image of one frame is encoded in units of fields, the random field When the picture different from the head of the access unit is the field pair, the picture in the random access unit Thus, a picture whose display order is later than the field pair is guaranteed not to refer to the first field of the field pair, and information indicating the guarantee is stored in the stream. It is characterized by.
本発明の請求項11にかかる情報記録媒体は、少なくとも動画像の符号化データを多重化したストリームとその管理情報とを記録した情報記録媒体であって、前記管理情報は前記ストリーム内の動画像の再生時刻情報、サイズ情報、およびストリーム内での開始アドレス情報とを記録し、前記動画像の符号化データは、1以上のランダムアクセス可能な単位から構成され、前記動画像の符号化方式においては、1フレームの画像をフィールド単位で符号化する際に、第1フィールドを前方予測ピクチャとし、第2フィールドを面内符号化ピクチャとして符号化されたフィールド・ペアを使用できる際に、前記ランダムアクセス単位の先頭とは異なるピクチャが前記フィールド・ペアであるときには、前記ランダムアクセス単位内のピクチャであって、前記フィールド・ペアよりも表示順が後であるピクチャは、前記フィールド・ペアの第1フィールドを参照する場合としない場合とがあり、前記フィールド・ペアよりも表示順が後であるピクチャが、前記フィールド・ペアの第1フィールドを参照するかどうかを示す情報を前記ストリーム内に格納することを特徴とする。 An information recording medium according to an eleventh aspect of the present invention is an information recording medium in which at least a stream in which encoded data of a moving image is multiplexed and management information thereof are recorded, and the management information is a moving image in the stream. Reproduction time information, size information, and start address information in the stream, and the encoded data of the moving image is composed of one or more randomly accessible units, and in the encoding method of the moving image When a field pair encoded with a first field as a forward-predicted picture and a second field as an in-plane encoded picture can be used when an image of one frame is encoded in units of fields, the random field When the picture different from the head of the access unit is the field pair, the picture in the random access unit Thus, the picture whose display order is later than the field pair may or may not refer to the first field of the field pair, and the picture whose display order is later than the field pair. Stores in the stream information indicating whether to refer to the first field of the field pair.
本発明の請求項12にかかる情報記録媒体は、少なくとも動画像の符号化データを多重化したストリームとその管理情報とを記録した情報記録媒体であって、前記管理情報は前記ストリーム内の動画像の再生時刻情報、サイズ情報、およびストリーム内での開始アドレス情報とを記録し、前記動画像の符号化データは、1以上のピクチャをまとめたグループ化単位が複数連結されたデータであり、前記管理情報は、ランダムアクセスすることができる前記グループ化単位の一覧情報を格納し、前記動画像の符号化方式においては、1フレームの画像をフィールド単位で符号化する際に、第1フィールドを前方予測ピクチャとし、第2フィールドを面内符号化ピクチャとして符号化されたフィールド・ペアを使用できる際に、前記ストリームは、前記一覧情報から指されない前記グループ化単位の先頭ピクチャが前記フィールド・ペアであるかどうかを示す情報を格納することを特徴とする。 An information recording medium according to a twelfth aspect of the present invention is an information recording medium in which at least a stream in which encoded data of a moving image is multiplexed and management information thereof are recorded, and the management information is a moving image in the stream. Reproduction time information, size information, and start address information in a stream, and the encoded data of the moving image is data in which a plurality of grouping units each including one or more pictures are concatenated, The management information stores the list information of the grouping units that can be randomly accessed. In the moving image encoding method, the first field is moved forward when the image of one frame is encoded in the field unit. When a pair of fields encoded as a predictive picture and a second field as an intra-coded picture can be used, the stream is Wherein the leading picture of the grouping units not pointed from the list information stores information indicating whether the field pair.
以上のように、本発明によれば、P/Iピクチャを使用する際に、ストリームおよび管理情報を制約することにより、特殊再生時の再生品質を向上させることができ、特殊再生機能が重視されるパッケージメディアにおいて、特にその実用的価値が高い。 As described above, according to the present invention, when using a P / I picture, the playback quality during special playback can be improved by restricting the stream and management information, and the special playback function is emphasized. In particular, its practical value is high.
以下、本発明の実施の形態について、図面を参照しながら説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
(実施の形態1)
まず最初に本発明の第1の実施の形態について説明する。
(Embodiment 1)
First, a first embodiment of the present invention will be described.
(ディスク上の論理データ構造)
図1は、BD−ROMの構成、特にディスク媒体であるBDディスク(104)と、ディスクに記録されているデータ(101、102、103)の構成を示す図である。BDディスク(104)に記録されるデータは、AVデータ(103)と、AVデータに関する管理情報およびAV再生シーケンスなどのBD管理情報(102)と、インタラクティブを実現するBD再生プログラム(101)である。本実施の形態では、説明の都合上、映画のAVコンテンツを再生するためのAVアプリケーションを主眼においてのBDディスクの説明を行うが、他の用途として用いても勿論同様である。
(Logical data structure on disk)
FIG. 1 is a diagram showing a configuration of a BD-ROM, particularly a configuration of a BD disc (104) that is a disc medium and data (101, 102, 103) recorded on the disc. The data recorded on the BD disc (104) is AV data (103), BD management information (102) such as management information related to AV data and an AV playback sequence, and a BD playback program (101) that realizes interactive processing. . In the present embodiment, for convenience of explanation, the BD disc is mainly described with reference to an AV application for playing back AV content of a movie.
図2は、上述したBDディスクに記録されている論理データのディレクトリ・ファイル構成を示した図である。BDディスクは、他の光ディスク、例えばDVDやCDなどと同様にその内周から外周に向けてらせん状に記録領域を持ち、内周のリード・インと外周のリード・アウトの間に論理データを記録できる論理アドレス空間を有している。また、リード・インの内側にはBCA(Burst Cutting Area)と呼ばれるドライブでしか読み出せない特別な領域がある。この領域はアプリケーションから読み出せないため、例えば著作権保護技術などに利用されることがある。 FIG. 2 is a diagram showing a directory / file structure of logical data recorded on the BD disc. A BD disc has a spiral recording area from its inner periphery to its outer periphery, like other optical discs such as DVDs and CDs, and stores logical data between the inner lead-in and outer lead-out. It has a logical address space that can be recorded. Further, inside the lead-in, there is a special area that can be read only by a drive called BCA (Burst Cutting Area). Since this area cannot be read from an application, it may be used for copyright protection technology, for example.
論理アドレス空間には、ファイルシステム情報(ボリューム)を先頭に映像データなどのアプリケーションデータが記録されている。ファイルシステムとは従来技術で説明した通り、UDFやISO9660などのことであり、通常のPCと同じように記録されている論理データをディレクトリ、ファイル構造を使って読み出しする事が可能になっている。 Application data such as video data is recorded in the logical address space with file system information (volume) at the head. As described in the prior art, the file system is UDF, ISO9660 or the like, and logical data recorded in the same way as a normal PC can be read using a directory and file structure. .
本実施例の場合、BDディスク上のディレクトリ、ファイル構造は、ルートディレクトリ(ROOT)直下にBDVIDEOディレクトリが置かれている。このディレクトリはBDで扱うAVコンテンツや管理情報などのデータ(図1で説明した101、102、103)が格納されているディレクトリである。 In the case of this embodiment, the directory and file structure on the BD disc is a BDVIDEO directory placed directly under the root directory (ROOT). This directory is a directory in which data (101, 102, 103 described in FIG. 1) such as AV contents and management information handled by the BD is stored.
BDVIDEOディレクトリの下には、次の7種類のファイルが記録されている。 The following seven types of files are recorded under the BDVIDEO directory.
BD.INFO(ファイル名固定)
「BD管理情報」の一つであり、BDディスク全体に関する情報を記録したファイルである。BDプレーヤは最初にこのファイルを読み出す。
BD. INFO (fixed file name)
This is one of “BD management information” and is a file in which information related to the entire BD disc is recorded. The BD player first reads this file.
BD.PROG(ファイル名固定)
「BD再生プログラム」の一つであり、BDディスク全体に関わる再生制御情報を記録したファイルである。
BD. PROG (fixed file name)
It is one of “BD playback programs” and is a file in which playback control information related to the entire BD disc is recorded.
XXX.PL(「XXX」は可変、拡張子「PL」は固定)
「BD管理情報」の一つであり、シナリオ(再生シーケンス)であるプレイリスト情報を記録したファイルである。プレイリスト毎に1つのファイルを持っている。
XXX. PL ("XXX" is variable, extension "PL" is fixed)
It is one of “BD management information” and is a file in which playlist information that is a scenario (playback sequence) is recorded. I have one file per playlist.
XXX.PROG(「XXX」は可変、拡張子「PL」は固定)
「BD再生プログラム」の一つであり、前述したプレイリスト毎の再生制御情報を記録したファイルである。プレイリストとの対応はファイルボディ名(「XXX」が一致する)によって識別される。
XXX. PROG ("XXX" is variable, extension "PL" is fixed)
It is one of “BD playback programs” and is a file in which playback control information for each playlist is recorded. Correspondence with a playlist is identified by a file body name (“XXX” matches).
YYY.VOB(「YYY」は可変、拡張子「VOB」は固定)
「AVデータ」の一つであり、VOB(従来例で説明したVOBと同じ)を記録したファイルである。VOB毎に1つのファイルを持っている。
YYY. VOB ("YYY" is variable, extension "VOB" is fixed)
It is one of “AV data” and is a file in which VOB (same as VOB described in the conventional example) is recorded. There is one file for each VOB.
YYY.VOBI(「YYY」は可変、拡張子「VOBI」は固定)
「BD管理情報」の一つであり、AVデータであるVOBに関わるストリーム管理情報を記録したファイルである。VOBとの対応はファイルボディ名(「YYY」が一致する)によって識別される。
YYY. VOBI ("YYY" is variable, extension "VOBI" is fixed)
It is one of “BD management information” and is a file in which stream management information related to VOB as AV data is recorded. The correspondence with the VOB is identified by the file body name (“YYY” matches).
ZZZ.PNG(「ZZZ」は可変、拡張子「PNG」は固定)
「AVデータ」の一つであり、字幕およびメニューを構成するためのイメージデータPNG(W3Cによって標準化された画像フォーマットであり「ピング」と読む)を記録したファイルである。1つのPNGイメージ毎に1つのファイルを持つ。
ZZZ. PNG ("ZZZ" is variable, extension "PNG" is fixed)
It is one of “AV data” and is a file in which image data PNG (image format standardized by W3C and read as “ping”) for composing subtitles and menus is recorded. There is one file for each PNG image.
(プレーヤの構成)
次に、前述したBDディスクを再生するプレーヤの構成について図6および図7を用いて説明する。
(Player configuration)
Next, the configuration of the player that plays the above-described BD disc will be described with reference to FIGS. 6 and 7. FIG.
図3は、プレーヤの大まかな機能構成を示すブロック図である。
BDディスク(201)上のデータは、光ピックアップ(202)を通して読み出される。読み出されたデータは夫々のデータの種類に応じて専用のメモリに転送される。BD再生プログラム(「BD.PROG」または「XXX.PROG」ファイルの中身)はプログラム記録メモリ(203)に、BD管理情報(「BD.INFO」、「XXX.PL」または「YYY.VOBI」)は管理情報記録メモリ(204)に、AVデータ(「YYY.VOB」または「ZZZ.PNG」)はAV記録メモリ(205)に夫々転送される。
FIG. 3 is a block diagram showing a rough functional configuration of the player.
Data on the BD disc (201) is read through the optical pickup (202). The read data is transferred to a dedicated memory according to the type of each data. The BD playback program (the contents of the “BD.PROG” or “XXX.PROG” file) is stored in the program recording memory (203) in the BD management information (“BD.INFO”, “XXX.PL” or “YYY.VOBI”). Are transferred to the management information recording memory (204), and the AV data ("YYY.VOB" or "ZZZ.PNG") are transferred to the AV recording memory (205).
プログラム記録メモリ(203)に記録されたBD再生プログラムはプログラム処理部(206)によって、管理情報記録メモリ(204)に記録されたBD管理情報は管理情報処理部(207)によって、また、AV記録メモリ(205)に記録されたAVデータはプレゼンテーション処理部(208)によって夫々処理される。 The BD playback program recorded in the program recording memory (203) is recorded by the program processing unit (206), and the BD management information recorded in the management information recording memory (204) is recorded by the management information processing unit (207). The AV data recorded in the memory (205) is processed by the presentation processing unit (208).
プログラム処理部(206)は、管理情報処理部(207)より再生するプレイリストの情報やプログラムの実行タイミングなどのイベント情報を受け取りプログラムの処理を行う。また、プログラムでは再生するプレイリストを動的に変える事が可能であり、この場合は管理情報処理部(207)に対してプレイリストの再生命令を送ることで実現する。プログラム処理部(206)は、ユーザからのイベント、即ちリモコンキーからのリクエストを受け、ユーザイベントに対応するプログラムがある場合は、それを実行する。 The program processing unit (206) receives event information such as playlist information to be played back and program execution timing from the management information processing unit (207), and processes the program. Also, the program can dynamically change the play list to be played back. In this case, the play list play command is sent to the management information processing unit (207). The program processing unit (206) receives an event from the user, that is, a request from the remote control key, and executes a program corresponding to the user event if there is a program.
管理情報処理部(207)は、プログラム処理部(206)の指示を受け、対応するプレイリストおよびプレイリストに対応したVOBの管理情報を解析し、プレゼンテーション処理部(208)に対象となるAVデータの再生を指示する。また、管理情報処理部(207)は、プレゼンテーション処理部(208)より基準時刻情報を受け取り、時刻情報に基づいてプレゼンテーション処理部(208)にAVデータ再生の停止指示を行い、また、プログラム処理部(206)に対してプログラム実行タイミングを示すイベントを生成する。 The management information processing unit (207) receives an instruction from the program processing unit (206), analyzes the management information of the VOB corresponding to the corresponding playlist and the playlist, and the AV data to be processed by the presentation processing unit (208). Instruct to play. Also, the management information processing unit (207) receives the reference time information from the presentation processing unit (208), instructs the presentation processing unit (208) to stop AV data reproduction based on the time information, and the program processing unit An event indicating the program execution timing is generated for (206).
プレゼンテーション処理部(208)は、映像、音声、字幕/イメージ(静止画)の夫々に対応するデコーダを持ち、管理情報処理部(207)からの指示に従い、AVデータのデコードおよび出力を行う。映像データ、字幕/イメージの場合は、デコード後に夫々の専用プレーン、ビデオプレーン(210)およびイメージプレーン(209)に描画され、合成処理部(211)によって映像の合成処理が行われTVなどの表示デバイスへ出力される。 The presentation processing unit (208) has a decoder corresponding to each of video, audio, and subtitle / image (still image), and decodes and outputs AV data in accordance with an instruction from the management information processing unit (207). In the case of video data and subtitles / images, after decoding, the video data and subtitles / images are drawn on the dedicated plane, video plane (210) and image plane (209), and the video is synthesized by the synthesis processing unit (211). Output to the device.
このように図3に示すように、BDプレーヤは図1で示したBDディスクに記録されているデータ構成に基づいた機器構成をとっている。 In this way, as shown in FIG. 3, the BD player has a device configuration based on the data configuration recorded on the BD disc shown in FIG.
図4は前述したプレーヤ構成を詳細化したブロック図である。図7では、AV記録メモリ(205)はイメージメモリ(308)とトラックバッファ(309)に、プログラム処理部(206)はプログラムプロセッサ(302)とUOPマネージャ(303)に、管理情報処理部(207)はシナリオプロセッサ(305)とプレゼンテーションコントローラ(306)に、プレゼンテーション処理部(208)はクロック(307)、デマルチプレクサ(310)、イメージプロセッサ(311)、ビデオプロセッサ(312)とサウンドプロセッサ(313)に夫々対応/展開している。 FIG. 4 is a detailed block diagram of the player configuration described above. In FIG. 7, the AV recording memory (205) is in the image memory (308) and the track buffer (309), the program processing unit (206) is in the program processor (302) and the UOP manager (303), and the management information processing unit (207). ) Is a scenario processor (305) and a presentation controller (306), and a presentation processing unit (208) is a clock (307), a demultiplexer (310), an image processor (311), a video processor (312) and a sound processor (313). Are corresponding to each.
BDディスク(201)から読み出されたVOBデータ(MPEGストリーム)はトラックバッファ(309)に、イメージデータ(PNG)はイメージメモリ(308)に夫々記録される。デマルチプレクサ(310)がクロック(307)の時刻に基づき、トラックバッファ(309)に記録されたVOBデータを抜き出し、映像データをビデオプロセッサ(312)に音声データをサウンドプロセッサ(313)に夫々送り込む。ビデオプロセッサ(312)およびサウンドプロセッサ(313)は夫々MPEGシステム規格で定める通りに、デコーダバッファとデコーダから夫々構成されている。即ち、デマルチプレクサ(310)から送りこまれる映像、音声夫々のデータは、夫々のデコーダバッファに一時的に記録され、クロック(307)に従い個々のデコーダでデコード処理される。 The VOB data (MPEG stream) read from the BD disc (201) is recorded in the track buffer (309), and the image data (PNG) is recorded in the image memory (308). The demultiplexer (310) extracts the VOB data recorded in the track buffer (309) based on the time of the clock (307), and sends the video data to the video processor (312) and the audio data to the sound processor (313). The video processor (312) and the sound processor (313) are each composed of a decoder buffer and a decoder as defined by the MPEG system standard. That is, the video and audio data sent from the demultiplexer (310) are temporarily recorded in the respective decoder buffers and decoded by the individual decoders according to the clock (307).
イメージメモリ(308)に記録されたPNGは、次の2つの処理方法がある。
イメージデータが字幕用の場合は、プレゼンテーションコントローラ(306)によってデコードタイミングが指示される。クロック(307)からの時刻情報をシナリオプロセッサ(305)が一旦受け、適切な字幕表示が行えるように、字幕表示時刻(開始および終了)になればプレゼンテーションコントローラ(306)に対して字幕の表示、非表示の指示を出す。プレゼンテーションコントローラ(306)からデコード/表示の指示を受けたイメージプロセッサ(311)は対応するPNGデータをイメージメモリ(308)から抜き出し、デコードし、イメージプレーン(314)に描画する。
The PNG recorded in the image memory (308) has the following two processing methods.
If the image data is for subtitles, the presentation controller (306) instructs the decoding timing. In order for the scenario processor (305) to receive the time information from the clock (307) once and display the appropriate subtitles, the subtitles are displayed to the presentation controller (306) at the subtitle display time (start and end). Give hidden instructions. The image processor (311) that has received the decode / display instruction from the presentation controller (306) extracts the corresponding PNG data from the image memory (308), decodes it, and draws it on the image plane (314).
次に、イメージデータがメニュー用の場合は、プログラムプロセッサ(302)によってデコードタイミングが指示される。プログラムプロセッサ(302)が何時イメージのデコードを指示するかは、プログラムプロセッサ(302)が処理しているBDプログラムに因るものであって一概には決まらない。 Next, when the image data is for a menu, the program processor (302) instructs the decoding timing. The time when the program processor (302) instructs to decode the image depends on the BD program being processed by the program processor (302), and is not generally determined.
イメージデータおよび映像データは、図6で説明したように夫々デコード後にイメージプレーン(314)、ビデオプレーン(315)に出力され、合成処理部(316)によって合成後出力される。 As described with reference to FIG. 6, the image data and the video data are output to the image plane (314) and the video plane (315) after decoding, respectively, and are output after being combined by the combining processing unit (316).
BDディスク(201)から読み出された管理情報(シナリオ、AV管理情報)は、管理情報記録メモリ(304)に格納されるが、シナリオ情報(「BD.INFO」および「XXX.PL」)はシナリオプロセッサ(305)へ読み込み処理される。また、AV管理情報(「YYY.VOBI」)はプレゼンテーションコントローラ(306)によって読み出され処理される。 The management information (scenario, AV management information) read from the BD disc (201) is stored in the management information recording memory (304), but the scenario information ("BD.INFO" and "XXX.PL") is stored in the management information recording memory (304). It is read into the scenario processor (305). The AV management information (“YYY.VOBI”) is read and processed by the presentation controller (306).
シナリオプロセッサ(305)は、プレイリストの情報を解析し、プレイリストによって参照されているVOBとその再生位置をプレゼンテーションコントローラ(306)に指示し、プレゼンテーションコントローラ(306)は対象となるVOBの管理情報(「YYY.VOBI」)を解析して、対象となるVOBを読み出すようにドライブコントローラ(317)に指示を出す。 The scenario processor (305) analyzes the information of the playlist, and instructs the presentation controller (306) the VOB referenced by the playlist and the playback position thereof. The presentation controller (306) manages the management information of the target VOB. ("YYY.VOBI") is analyzed, and an instruction is issued to the drive controller (317) to read out the target VOB.
ドライブコントローラ(317)はプレゼンテーションコントローラ(306)の指示に従い、光ピックアップを移動させ、対象となるAVデータの読み出しを行う。読み出されたAVデータは、前述したようにイメージメモリ(308)またはトラックバッファ(309)に読み出される。 The drive controller (317) moves the optical pickup according to the instruction of the presentation controller (306), and reads the target AV data. The read AV data is read to the image memory (308) or the track buffer (309) as described above.
また、シナリオプロセッサ(305)は、クロック(307)の時刻を監視し、管理情報で設定されているタイミングでイベントをプログラムプロセッサ(302)に投げる。 The scenario processor (305) monitors the time of the clock (307) and throws an event to the program processor (302) at the timing set in the management information.
プログラム記録メモリ(301)に記録されたBDプログラム(「BD.PROG」または「XXX.PROG」)は、プログラムプロセッサ302によって実行処理される。プログラムプロセッサ(302)がBDプログラムを処理するのは、シナリオプロセッサ(305)からイベントが送られてきた場合か、UOPマネージャ(303)からイベントが送られてきた場合である。UOPマネージャ(303)は、ユーザからリモコンキーによってリクエストが送られてきた場合に、プログラムプロセッサ(302)に対するイベントを生成する。
The BD program (“BD.PROG” or “XXX.PROG”) recorded in the program recording memory (301) is executed by the
(アプリケーション空間)
図5は、BDのアプリケーション空間を示す図である。
(Application space)
FIG. 5 shows a BD application space.
BDのアプリケーション空間では、プレイリスト(PlayList)が一つの再生単位になっている。プレイリストはセル(Cell)の連結で、連結の順序により決定される再生シーケンスである静的なシナリオと、プログラムによって記述される動的なシナリオを有している。プログラムによる動的なシナリオが無い限り、プレイリストは個々のセルを順に再生するだけであり、また、全てのセルの再生を終了した時点でプレイリストの再生は終了する。一方で、プログラムは、プレイリストを超えての再生記述や、ユーザ選択またはプレーヤの状態によって再生する対象を動的に変えることが可能である。典型的な例としてはメニューがあげられる。BDの場合、メニューとはユーザの選択によって再生するシナリオと定義でき、プログラムによってプレイリストを動的に選択することである。 In the application space of the BD, a play list (PlayList) is one playback unit. A playlist is a concatenation of cells (Cell) and has a static scenario that is a reproduction sequence determined by the order of concatenation and a dynamic scenario described by a program. Unless there is a dynamic scenario by the program, the playlist only reproduces the individual cells in order, and the reproduction of the playlist ends when the reproduction of all the cells is completed. On the other hand, the program can dynamically change the playback target depending on the playback description beyond the playlist, the user selection, or the player status. A typical example is a menu. In the case of BD, a menu can be defined as a scenario to be played back by user selection, and is to dynamically select a playlist by a program.
ここで言うプログラムとは、時間イベントまたはユーザイベントによって実行されるイベントハンドラの事である。 The program referred to here is an event handler executed by a time event or a user event.
時間イベントは、プレイリスト中に埋め込まれた時刻情報に基づいて生成されるイベントである。図4で説明したシナリオプロセッサ(305)からプログラムプロセッサ(302)に送られるイベントがこれに相当する。時間イベントが発行されると、プログラムプロセッサ(302)はIDによって対応付けられるイベントハンドラを実行処理する。前述した通り、実行されるプログラムが他のプレイリストの再生を指示することが可能であり、この場合には、現在再生されているプレイリストの再生は中止され、指定されたプレイリストの再生へと遷移する。 The time event is an event generated based on time information embedded in the playlist. The event sent from the scenario processor (305) described in FIG. 4 to the program processor (302) corresponds to this. When a time event is issued, the program processor (302) executes an event handler associated with the ID. As described above, the program to be executed can instruct playback of another playlist. In this case, playback of the currently played playlist is stopped and playback of the designated playlist is started. And transition.
ユーザイベントは、ユーザのリモコンキー操作によって生成されるイベントである。ユーザイベントは大きく2つのタイプに分けられる。一つ目は、カーソルキー(「上」「下」「左」「右」キー)または「決定」キーの操作によって生成されるメニュー選択のイベントである。メニュー選択のイベントに対応するイベントハンドラはプレイリスト内の限られた期間でのみ有効であり(プレイリストの情報として、個々のイベントハンドラの有効期間が設定されている)、リモコンの「上」「下」「左」「右」キーまたは「決定」キーが押された時に有効なイベントハンドラを検索して、有効なイベントハンドラがある場合は当該イベントハンドラが実行処理される。他の場合は、メニュー選択のイベントは無視されることになる。 A user event is an event generated by a user's remote control key operation. User events are roughly divided into two types. The first is a menu selection event generated by operating a cursor key ("Up", "Down", "Left", "Right" key) or a "Determination" key. The event handler corresponding to the event selected from the menu is valid only for a limited period in the playlist (the validity period of each event handler is set as playlist information). A valid event handler is searched when the “down”, “left”, “right” key, or “decision” key is pressed. If there is a valid event handler, the event handler is executed. In other cases, menu selection events will be ignored.
二つ目のユーザイベントは、「メニュー」キーの操作によって生成されるメニュー呼び出しのイベントである。メニュー呼び出しのイベントが生成されると、グローバルイベントハンドラが呼ばれる。グローバルイベントハンドラはプレイリストに依存せず、常に有効なイベントハンドラである。この機能を使うことにより、DVDのメニューコール(タイトル再生中に音声、字幕メニューなどを呼び出し、音声または字幕を変更後に中断した地点からのタイトル再生を実行する機能等)を実装することができる。 The second user event is a menu call event generated by operating the “menu” key. When a menu call event is generated, a global event handler is called. A global event handler does not depend on a playlist and is always an effective event handler. By using this function, it is possible to implement a DVD menu call (such as a function for calling a voice or subtitle menu during title reproduction and executing title reproduction from a point where the voice or subtitle was interrupted after the change).
プレイリストで静的シナリオを構成する単位であるセル(Cell)はVOB(MPEGストリーム)の全部または一部の再生区間を参照したものである。セルはVOB内の再生区間を開始、終了時刻の情報として持っている。個々のVOBと一対になっているVOB管理情報(VOBI)は、その内部にデータの再生時刻に対応した記録アドレスのテーブル情報であるタイムマップ(Time MapまたはTMAP)を有しており、このタイムマップによって前述したVOBの再生、終了時刻をVOB内(即ち対象となるファイル「YYY.VOB」内)での読み出し開始アドレスおよび終了アドレスを導き出すことが可能である。なおタイムマップの詳細は後述する。 A cell (Cell), which is a unit constituting a static scenario in a playlist, refers to all or part of a playback section of a VOB (MPEG stream). The cell has a playback section in the VOB as start and end time information. The VOB management information (VOBI) paired with each VOB has a time map (Time Map or TMAP) which is a table information of recording addresses corresponding to the reproduction time of the data in the VOB management information (VOBI). It is possible to derive the read start address and end address in the VOB (that is, in the target file “YYY.VOB”) with the above-described VOB playback and end time using the map. Details of the time map will be described later.
(VOBの詳細)
図6は、本実施例で使用するMPEGストリーム(VOB)の構成図である。
(Details of VOB)
FIG. 6 is a configuration diagram of an MPEG stream (VOB) used in this embodiment.
図6に示すように、VOBは複数のVOBU(Video Object Unit)によって構成されている。VOBUは、MPEGビデオストリームで言うGOP(Group Of Pictures)を基準として、音声データも含んだ多重化ストリームとしての一再生単位である。VOBUは1.0秒以下のビデオ再生時間を持ち、通常は0.5秒程度の再生時間を持っている。 As shown in FIG. 6, the VOB is composed of a plurality of VOBUs (Video Object Units). The VOBU is one playback unit as a multiplexed stream including audio data on the basis of GOP (Group Of Pictures) referred to as an MPEG video stream. A VOBU has a video playback time of 1.0 seconds or less, and usually has a playback time of about 0.5 seconds.
VOBU先頭のTSパケット(MPEG−2 Transport Stream Packet)は、シーケンスヘッダとそれに続くGOPヘッダとIピクチャ(Intra−coded)を格納しており、このIピクチャからの復号が開始可能なようになっている。また、このVOBU先頭のIピクチャの先頭を含むTSパケットのアドレス(開始アドレス)と、この開始アドレスからIピクチャの最後を含むTSパケットまでのアドレス(終了アドレス)と、このIピクチャの再生開始時刻(PTS)をタイムマップで管理している。したがって、タイムマップのエントリーはVOBU先頭のTSパケットごとに与えられている。 The TS packet (MPEG-2 Transport Stream Packet) at the head of the VOBU stores a sequence header, a subsequent GOP header, and an I picture (Intra-coded), so that decoding from the I picture can be started. Yes. Also, the address (start address) of the TS packet including the head of the I picture at the head of this VOBU, the address (end address) from this start address to the TS packet including the end of the I picture, and the playback start time of this I picture (PTS) is managed by a time map. Therefore, a time map entry is given for each TS packet at the head of the VOBU.
VOBUは、その内部にビデオパケット(V_PKT)とオーディオパケット(A_PKT)を有している。各パケットは188バイトであり、図6に図示してはいないが、各TSパケットの直前には、そのTSパケットの相対的なデコーダ供給開始時刻であるATS(Arrival Time Stamp)が付与されている。 The VOBU has a video packet (V_PKT) and an audio packet (A_PKT) therein. Each packet is 188 bytes, and although not shown in FIG. 6, immediately before each TS packet, an ATS (Arrival Time Stamp) that is a relative decoder supply start time of the TS packet is given. .
ATSを各TSパケットごとに付与するのは、このTSストリームのシステムレートが固定レートでなく、可変レートであるためである。一般的にシステムレートを固定にする場合にはNULLパケットと呼ばれるダミーのTSパケットを挿入することになるが、限られた記録容量の中に高画質で記録するためには、可変レートが適しており、BDではATS付きのTSストリームとして記録している。 The reason why ATS is assigned to each TS packet is that the system rate of this TS stream is not a fixed rate but a variable rate. In general, when the system rate is fixed, a dummy TS packet called a NULL packet is inserted, but a variable rate is suitable for recording with high image quality within a limited recording capacity. In BD, it is recorded as a TS stream with ATS.
図7は、TSパケットの構成を示した図である。
図7に示すように、TSパケットは、TSパケットヘッダと、適用フィールドと、ペイロード部から構成される。TSパケットヘッダにはPID(Packet Identifier)が格納され、これにより、TSパケットがどのような情報を格納しているのか識別される。適用フィールドにはPCR(Program Clock Reference)が格納される。PCRはストリームをデコードする機器の基準クロック(System Time Clock、STCと呼ぶ)の参照値である。機器は典型的にはPCRのタイミングでシステムストリームをデマルチプレクスし、ビデオストリーム等の各種ストリームを再構築する。ペイロードにはPESパケットが格納される。
FIG. 7 is a diagram showing the structure of a TS packet.
As shown in FIG. 7, the TS packet includes a TS packet header, an application field, and a payload portion. The TS packet header stores a PID (Packet Identifier), thereby identifying what information the TS packet stores. The application field stores PCR (Program Clock Reference). PCR is a reference value of a standard clock (referred to as System Time Clock, STC) of a device that decodes a stream. The device typically demultiplexes the system stream at the timing of PCR and reconstructs various streams such as a video stream. A PES packet is stored in the payload.
PESパケットヘッダには、DTS(Decoding Time Stamp)とPTS(Presentation Time Stamp)が格納される。DTSは当該PESパケットに格納されるピクチャ/オーディオフレームのデコードタイミングを示し、PTSは映像音声出力等のプレゼンテーションタイミングを示す。ビデオデータおよびオーディオデータといったエレメンタリデータは、PESパケットペイロード(PES Packet Payload)と呼ばれるパケット(PES Packet)のデータ格納領域に先頭から順次入れられていく。PESパケットヘッダには、ペイロードに格納してあるデータがどのストリームなのかを識別するためのID(stream_id)も記録されている。 In the PES packet header, DTS (Decoding Time Stamp) and PTS (Presentation Time Stamp) are stored. DTS indicates the decoding timing of the picture / audio frame stored in the PES packet, and PTS indicates the presentation timing such as video / audio output. Elementary data such as video data and audio data is sequentially put into a data storage area of a packet (PES Packet) called a PES packet payload from the head. In the PES packet header, an ID (stream_id) for identifying which stream is the data stored in the payload is also recorded.
TSストリームの詳細についてはISO/IEC13818−1で規定されており、BDで特徴的なのはATSを各TSパケットごとに付与したことである。 Details of the TS stream are defined in ISO / IEC13818-1, and a characteristic of BD is that an ATS is assigned to each TS packet.
(VOBのインターリーブ記録)
次に図8および図9を用いてVOBファイルのインターリーブ記録について説明する。
(VOB interleaved recording)
Next, interleaved recording of a VOB file will be described with reference to FIGS.
図8上段は、前述したプレーヤ構成図の一部である。図の通り、BDディスク上のデータは、光ピックアップを通してVOB即ちMPEGストリームであればトラックバッファへ入力され、PNG即ちイメージデータであればイメージメモリへと入力される。 The upper part of FIG. 8 is a part of the player configuration diagram described above. As shown in the figure, the data on the BD disc is input to the track buffer if it is a VOB or MPEG stream through the optical pickup, and is input to the image memory if it is PNG or image data.
トラックバッファはFIFOであり、入力されたVOBのデータは入力された順にデマルチプレクサへと送られる。この時、前述したATSに従って個々のTSパケットはトラックバッファから引き抜かれデマルチプレクサを介してビデオプロセッサまたはサウンドプロセッサへとデータが送り届けられる。一方で、イメージデータの場合は、どのイメージを描画するかはプレゼンテーションコントローラによって指示される。また、描画に使ったイメージデータは、字幕用イメージデータの場合は同時にイメージメモリから削除されるが、メニュー用のイメージデータの場合は、そのメニュー描画中はイメージメモリ内にそのまま残される。これはメニューの描画はユーザ操作に依存しており、ユーザーの操作に追従してメニューの一部分を再表示もしくは異なるイメージに置き換えることがあり、その際に再表示される部分のイメージデータをデコードし易くするためである。 The track buffer is a FIFO, and the input VOB data is sent to the demultiplexer in the input order. At this time, individual TS packets are extracted from the track buffer according to the ATS described above, and data is sent to the video processor or sound processor via the demultiplexer. On the other hand, in the case of image data, the presentation controller instructs which image to draw. The image data used for drawing is deleted from the image memory at the same time in the case of subtitle image data, but in the case of menu image data, it remains in the image memory during the menu drawing. This is because the menu drawing depends on the user's operation, and part of the menu may be redisplayed or replaced with a different image following the user's operation, and the image data of the redisplayed part will be decoded. This is to make it easier.
図8下段は、BDディスク上でのVOBファイルおよびPNGファイルのインターリーブ記録を示す図である。一般的にROM、例えばCD−ROMやDVD−ROMの場合、一連の連続再生単位となるAVデータは連続記録されている。これは、連続記録されている限り、ドライブは順次データを読み出し、デコーダに送り届けるだけで良いが、連続データが分断されてディスク上に離散配置されている場合は、個々の連続区間の間でシーク操作が入ることになり、この間データの読み出しが止まることになり、データの供給が止まる可能性があるからである。BDの場合も同様に、VOBファイルは連続領域に記録することができる方が望ましいが、例えば字幕データのようにVOBに記録されている映像データと同期して再生されるデータがあり、VOBファイルと同様に字幕データも何らかの方法によってBDディスクから読み出す事が必要になる。 The lower part of FIG. 8 is a diagram showing interleaved recording of a VOB file and a PNG file on a BD disc. In general, in the case of a ROM such as a CD-ROM or a DVD-ROM, AV data serving as a series of continuous reproduction units is continuously recorded. As long as continuous recording is performed, the drive only needs to read the data sequentially and send it to the decoder. However, if the continuous data is divided and discretely arranged on the disk, seek is performed between individual continuous sections. This is because an operation is entered, and during this time, reading of data is stopped, and supply of data may be stopped. Similarly, in the case of a BD, it is desirable that a VOB file can be recorded in a continuous area. However, for example, there is data that is reproduced in synchronization with video data recorded in the VOB, such as caption data, and the VOB file Similarly, it is necessary to read the caption data from the BD disc by some method.
字幕データの読み出し方法の一手段として、VOBの再生開始前に一まとめで字幕用のイメージデータ(PNGファイル)を読み出してしまう方法がある。しかしながら、この場合には大量のメモリが必要となり、非現実的である。 As one method of reading subtitle data, there is a method of reading subtitle image data (PNG file) all at once before the start of VOB reproduction. However, in this case, a large amount of memory is required, which is unrealistic.
そこで、VOBファイルを幾つかのブロックに分けて、イメージデータとインターリーブ記録する方式を使用している。図8下段はそのインターリーブ記録を説明した図である。 Therefore, a method is used in which the VOB file is divided into several blocks and interleaved with image data. The lower part of FIG. 8 illustrates the interleave recording.
VOBファイルとイメージデータを適切にインターリーブ配置することで、前述したような大量の一時記録メモリ無しに、必要なタイミングでイメージデータをイメージメモリに格納することが可能になる。しかしながらイメージデータを読み出している際には、VOBデータの読み込みは当然のことながら停止することになる。 By appropriately interleaving the VOB file and the image data, it becomes possible to store the image data in the image memory at a necessary timing without the large amount of temporary recording memory as described above. However, when reading the image data, the reading of the VOB data is naturally stopped.
図9は、この問題を解決するトラックバッファを使ったVOBデータ連続供給モデルを説明する図である。 FIG. 9 is a diagram for explaining a VOB data continuous supply model using a track buffer that solves this problem.
既に説明したように、VOBのデータは、一旦トラックバッファに蓄積される。トラックバッファへのデータ入力レート(Va)とトラックバッファからのデータ出力レート(Vb)の間に差(Va>Vb)を設けると、BDディスクからデータを読み出し続けている限り、トラックバッファのデータ蓄積量は増加をしていくことになる。 As described above, VOB data is temporarily stored in the track buffer. When a difference (Va> Vb) is provided between the data input rate (Va) to the track buffer and the data output rate (Vb) from the track buffer, as long as data is continuously read from the BD disc, the data storage in the track buffer The amount will increase.
図9の上段に記すようにVOBの一連続記録領域が論理アドレスの”a1”から”a2”まで続くとする。”a2”から”a3”の間は、イメージデータが記録されていて、VOBデータの読み出しが行えない区間であるとする。 As shown in the upper part of FIG. 9, it is assumed that a continuous recording area of VOB continues from “a1” to “a2” of logical addresses. It is assumed that between “a2” and “a3” is an interval in which image data is recorded and VOB data cannot be read.
図9の下段は、トラックバッファの内部を示す図である。横軸が時間、縦軸がトラックバッファ内部に蓄積されているデータ量を示している。時刻”t1”がVOBの一連続記録領域の開始点である”a1”の読み出しを開始した時刻を示している。この時刻以降、トラックバッファにはレートVa−Vbでデータが蓄積されていくことになる。このレートは言うまでもなくトラックバッファの入出力レートの差である。時刻”t2”は一連続記録領域の終了点である”a2”のデータを読み込む時刻である。即ち時刻”t1”から”t2”の間レートVa−Vbでトラックバッファ内はデータ量が増加していき、時刻”t2”でのデータ蓄積量はB(t2)は下式によって求めることができる。
B(t2) = (Va−Vb)×(t2−t1) (式1)
この後、BDディスク上のアドレス”a3”まではイメージデータが続くため、トラックバッファへの入力は0となり、出力レートである”−Vb”でトラックバッファ内のデータ量は減少していくことになる。これは読み出し位置”a3”まで、時刻でいう”t3”までになる。
The lower part of FIG. 9 shows the inside of the track buffer. The horizontal axis indicates time, and the vertical axis indicates the amount of data stored in the track buffer. Time “t1” indicates the time when reading of “a1”, which is the starting point of one continuous recording area of the VOB, is started. After this time, data is accumulated in the track buffer at the rate Va-Vb. Needless to say, this rate is the difference between the input and output rates of the track buffer. The time “t2” is the time when the data “a2”, which is the end point of one continuous recording area, is read. That is, the amount of data in the track buffer increases from time “t1” to “t2” at the rate Va−Vb, and the data accumulation amount at time “t2” can be obtained by the following equation. .
B (t2) = (Va−Vb) × (t2−t1) (Formula 1)
After this, since the image data continues until the address “a3” on the BD disc, the input to the track buffer becomes 0, and the data amount in the track buffer decreases at the output rate “−Vb”. Become. This is up to the read position “a3” and “t3” in time.
ここで大事なことは、時刻”t3”より前にトラックバッファに蓄積されているデータ量が0になると、デコーダへ供給するVOBのデータが無くなってしまい、VOBの再生がストップしてしまう可能性がある。しかしながら、時刻”t3”でトラックバッファにデータが残っている場合には、VOBの再生がストップすることなく連続できることを意味している。 What is important here is that if the amount of data stored in the track buffer before time “t3” becomes zero, there is no VOB data to be supplied to the decoder, and there is a possibility that VOB reproduction stops. There is. However, if data remains in the track buffer at time “t3”, this means that VOB playback can be continued without stopping.
この条件は下式によって示すことができる。
B(t2) ≧ −Vb×(t3−t2) (式2)
即ち、式2を満たすようにイメージデータ(非VOBデータ)の配置を決めればよい事になる。
This condition can be expressed by the following equation.
B (t2) ≧ −Vb × (t3−t2) (Formula 2)
That is, the arrangement of the image data (non-VOB data) should be determined so as to satisfy
(ナビゲーションデータ構造)
図10から図16を用いて、BDのナビゲーションデータ(BD管理情報)構造について説明をする。
(Navigation data structure)
The structure of BD navigation data (BD management information) will be described with reference to FIGS.
図10は、VOB管理情報情報ファイル(”YYY.VOBI”)の内部構造を示した図である。 FIG. 10 shows the internal structure of the VOB management information information file (“YYY.VOBI”).
VOB管理情報は、当該VOBのストリーム属性情報(Attribute)とタイムマップを有している。ストリーム属性は、ビデオ属性(Video)、オーディオ属性(Audio#0〜Audio#m)個々に持つ構成となっている。特にオーディオストリームの場合は、VOBが複数本のオーディオストリームを同時に持つことができることから、オーディオストリーム数(Number)によって、データフィールドの有無を示している。
The VOB management information includes stream attribute information (Attribute) of the VOB and a time map. Each stream attribute has a video attribute (Video) and an audio attribute (
下記はビデオ属性(Video)の持つフィールドと夫々が持ち得る値である。
圧縮方式(Coding):
MPEG1
MPEG2
MPEG4
MPEG4−AVC(Advanced Video Coding)
解像度(Resolution):
1920x1080
1440x1080
1280x720
720x480
720x565
アスペクト比(Aspect)
4:3
16:9
フレームレート(Framerate)
60
59.94(60/1.001)
50
30
29.97(30/1.001)
25
24
23.976(24/1.001)
The following are the fields that the video attribute (Video) has and the values that each can have.
Compression method (Coding):
MPEG1
MPEG2
MPEG4
MPEG4-AVC (Advanced Video Coding)
Resolution:
1920x1080
1440x1080
1280x720
720x480
720x565
Aspect ratio (Aspect)
4: 3
16: 9
Frame rate
60
59.94 (60 / 1.001)
50
30
29.97 (30 / 1.001)
25
24
23.976 (24 / 1.001)
下記はオーディオ属性(Audio)の持つフィールドと夫々が持ち得る値である。
圧縮方式(Coding):
AC3
MPEG1
MPEG2
LPCM
チャンネル数(Ch):
1〜8
言語属性(Language):
The following are the fields that the audio attribute (Audio) has and the values that each can have.
Compression method (Coding):
AC3
MPEG1
MPEG2
LPCM
Number of channels (Ch):
1-8
Language attribute:
タイムマップ(TMAP)はVOBU毎の情報を持つテーブルであって、当該VOBが有するVOBU数(Number)と各VOBU情報(VOBU#1〜VOBU#n)を持つ。個々のVOBU情報は、VOBU先頭TSパケット(Iピクチャ開始)のアドレスI_startと、そのIピクチャの終了アドレスまでのオフセットアドレス(I_end)、およびそのIピクチャの再生開始時刻(PTS)から構成される。
The time map (TMAP) is a table having information for each VOBU, and has the number of VOBUs (Number) possessed by the VOB and each VOBU information (
なお、I_endの値はオフセット値、すなわちIピクチャのサイズを持たせるのではなく、実際のIピクチャの終了アドレスを持たせてもよい。 Note that the value of I_end does not have an offset value, that is, the size of the I picture, but may have the actual end address of the I picture.
図11はVOBU情報の詳細を説明する図である。
広く知られているように、MPEGビデオストリームは高画質記録するために可変ビットレート圧縮されることがあり、その再生時間とデータサイズ間に単純な相関はない。逆に、音声の圧縮規格であるAC3は固定ビットレートでの圧縮を行っているため、時間とアドレスとの関係は1次式によって求めることができる。しかしながらMPEGビデオデータの場合は、個々のフレームは固定の表示時間、例えばNTSCの場合は1フレームは1/29.97秒の表示時間を持つが、個々のフレームの圧縮後のデータサイズは絵の特性や圧縮に使ったピクチャタイプ、いわゆるI/P/Bピクチャによってデータサイズは大きく変わってくる。従って、MPEGビデオの場合は、時間とアドレスの関係は一次式の形で表現することは不可能である。
FIG. 11 is a diagram for explaining the details of the VOBU information.
As is widely known, an MPEG video stream may be compressed at a variable bit rate for high-quality recording, and there is no simple correlation between playback time and data size. Conversely, since AC3, which is a voice compression standard, performs compression at a fixed bit rate, the relationship between time and address can be obtained by a linear expression. However, in the case of MPEG video data, each frame has a fixed display time, for example, in the case of NTSC, one frame has a display time of 1 / 29.97 seconds, but the data size after compression of each frame is picture size. The data size varies greatly depending on the characteristics and the picture type used for compression, so-called I / P / B picture. Therefore, in the case of MPEG video, the relationship between time and address cannot be expressed in a linear form.
当然の事として、MPEGビデオデータを多重化しているMPEGシステムストリーム、即ちVOBも時間とデータサイズとを一次式の形で表現することは不可能である。このため、VOB内での時間とアドレスとの関係を結びつけるのがタイムマップ(TMAP)である。 Naturally, an MPEG system stream in which MPEG video data is multiplexed, that is, VOB, cannot express time and data size in a linear form. For this reason, the time map (TMAP) links the relationship between time and address in the VOB.
このようにして、ある時刻情報が与えられた場合、先ずは当該時刻がどのVOBUに属するのかを検索(VOBU毎のPTSを追っていく)して、当該時刻の直前のPTSをTMAPに持つVOBUに飛びこみ(I_startで指定されたアドレス)、VOBU先頭のIピクチャから復号を開始し、当該時刻のピクチャから表示を開始する。 In this way, when given time information is provided, first, the VOBU to which the time belongs is searched (following the PTS for each VOBU), and the VOBU having the PTS immediately before the time is stored in the VOBU. Jumping in (address specified by I_start), decoding starts from the I picture at the head of the VOBU, and display starts from the picture at that time.
次に図12を使って、プレイリスト情報(”XXX.PL”)の内部構造を説明する。
プレイリスト情報は、セルリスト(CellList)とイベントリスト(EventList)から構成されている。
Next, the internal structure of the playlist information (“XXX.PL”) will be described with reference to FIG.
The playlist information includes a cell list (CellList) and an event list (EventList).
セルリスト(CellList)は、プレイリスト内の再生セルシーケンスであり、本リストの記述順でセルが再生される事になる。セルリスト(CellList)の中身は、セルの数(Number)と各セル情報(Cell#1〜Cell#n)である。
The cell list (CellList) is a reproduction cell sequence in the playlist, and the cells are reproduced in the description order of the list. The contents of the cell list (CellList) are the number of cells (Number) and cell information (
セル情報(Cell#)は、VOBファイル名(VOBName)、当該VOB内での開始時刻(In)および終了時刻(Out)と、字幕テーブル(SubtitleTable)を持っている。開始時刻(In)および終了時刻(Out)は、夫々当該VOB内でのフレーム番号で表現され、前述したタイムマップを使うことによって再生に必要なVOBデータのアドレスを得る事ができる。 The cell information (Cell #) has a VOB file name (VOBName), a start time (In) and an end time (Out) in the VOB, and a caption table (SubtitleTable). The start time (In) and the end time (Out) are each expressed by a frame number in the VOB, and the address of VOB data necessary for reproduction can be obtained by using the time map described above.
字幕テーブル(SubtitleTable)は、当該VOBと同期再生される字幕情報を持つテーブルである。字幕は音声同様に複数の言語を持つことができ、字幕テーブル(SubtitleTable)最初の情報も言語数(Number)とそれに続く個々の言語ごとのテーブル(Language#1〜Language#k)から構成されている。
The caption table (SubtitleTable) is a table having caption information that is reproduced in synchronization with the VOB. Subtitles can have multiple languages as well as audio, and the first information of the subtitle table (SubtitleTable) consists of the number of languages (Number) followed by tables for each language (
各言語のテーブル(Language#)は、言語情報(Lang)と、個々に表示される字幕の字幕情報数(Number)と、個々に表示される字幕の字幕情報(Speech#1〜Speech#j)から構成され、字幕情報(Speech#)は対応するイメージデータファイル名(Name)、字幕表示開始時刻(In)および字幕表示終了時刻(Out)と、字幕の表示位置(Position)から構成されている。
Each language table (Language #) includes language information (Language), the number of subtitle information displayed individually (Number), and subtitle information displayed individually (
イベントリスト(EventList)は、当該プレイリスト内で発生するイベントを定義したテーブルである。イベントリストは、イベント数(Number)に続いて個々のイベント(Event#1〜Event#m)から構成され、個々のイベント(Event#)は、イベントの種類(Type)、イベントのID(ID)、イベント発生時刻(Time)と有効期間(Duration)から構成されている。
The event list (EventList) is a table that defines events that occur in the play list. The event list is made up of individual events (
図13は、個々のプレイリスト毎のイベントハンドラ(時間イベントと、メニュー選択用のユーザイベント)を持つイベントハンドラテーブル(”XXX.PROG”)である。 FIG. 13 is an event handler table (“XXX.PROG”) having event handlers (time events and user events for menu selection) for each playlist.
イベントハンドラテーブルは、定義されているイベントハンドラ/プログラム数(Number)と個々のイベントハンドラ/プログラム(Program#1〜Program#n)を有している。各イベントハンドラ/プログラム(Program#)内の記述は、イベントハンドラ開始の定義(<event_handler>タグ)と前述したイベントのIDと対になるイベントハンドラのID(ID)を持ち、その後に当該プログラムもFunctionに続く括弧”{”と”}”の間に記述する。前述の”XXX.PL”のイベントリスト(EventList)に格納されたイベント(Event#1〜Event#m)は”XXX.PROG”のイベントハンドラのID(ID)を用いて特定される。
The event handler table has a defined number of event handlers / programs (Number) and individual event handlers / programs (
次に図14を用いてBDディスク全体に関する情報(”BD.INFO”)の内部構造を説明する。 Next, the internal structure of information relating to the entire BD disc (“BD.INFO”) will be described with reference to FIG.
BDディスク全体情報は、タイトルリスト(TitleList)とグローバルイベント用のイベントテーブル(EventList)から構成されている。 The entire BD disc information includes a title list (TitleList) and an event table for global events (EventList).
タイトルリスト(TitleList)は、ディスク内のタイトル数(Number)と、これに続く各タイトル情報(Title#1〜Title#n)から構成されている。個々のタイトル情報(Title#)は、タイトルに含まれるプレイリストのテーブル(PLTable)とタイトル内のチャプタリスト(ChapterList)を含んでいる。プレイリストのテーブル(PLTable)はタイトル内のプレイリストの数(Number)と、プレイリスト名(Name)即ちプレイリストのファイル名を有している。
The title list (TitleList) is composed of the number of titles (Number) in the disc and the following pieces of title information (
チャプタリスト(ChapterList)は、当該タイトルに含まれるチャプタ数(Number)と個々のチャプタ情報(Chapter#1〜Chapter#n)から構成され、個々のチャプタ情報(Chapter#)は当該チャプタが含むセルのテーブル(CellTable)を持ち、セルのテーブル(CellTable)はセル数(Number)と個々のセルのエントリ情報(CellEntry#1〜CellEntry#k)から構成されている。セルのエントリ情報(CellEntry#)は当該セルを含むプレイリスト名と、プレイリスト内でのセル番号によって記述されている。
The chapter list (ChapterList) is composed of the number of chapters (Number) included in the title and individual chapter information (
イベントリスト(EventList)は、グローバルイベントの数(Number)と個々のグローバルイベントの情報を持っている。ここで注意すべきは、最初に定義されるグローバルイベントは、ファーストイベント(FirstEvent)と呼ばれ、BDディスクがプレーヤに挿入された時、最初に呼ばれるイベントである。グローバルイベント用イベント情報はイベントタイプ(Type)とイベントのID(ID)だけを持っている。 The event list (EventList) includes the number of global events (Number) and information on individual global events. It should be noted that the global event defined first is called a first event (FirstEvent), and is the first event called when a BD disc is inserted into a player. The event information for global events has only an event type (Type) and an event ID (ID).
図15は、グローバルイベントハンドラのプログラムのテーブル(”BD.PROG”)である。 FIG. 15 is a table (“BD.PROG”) of the global event handler program.
本テーブルは、図16で説明したイベントハンドラテーブルと同一内容である。 This table has the same contents as the event handler table described in FIG.
(イベント発生のメカニズム)
図16から図18を使ってイベント発生のメカニズムについて説明する。
(Event generation mechanism)
The event generation mechanism will be described with reference to FIGS.
図16はタイムイベントの例である。
前述したとおり、タイムイベントはプレイリスト情報(”XXX.PL”)のイベントリスト(EventList)で定義される。タイムイベントとして定義されているイベント、即ちイベントタイプ(Type)が”TimeEvent”の場合、イベント生成時刻(”t1”)になった時点で、ID”Ex1”を持つタイムイベントがシナリオプロセッサからプログラムプロセッサに対してあげられる。プログラムプロセッサは、イベントID”Ex1”を持つイベントハンドラを探し、対象のイベントハンドラを実行処理する。例えば、本実施例の場合では、2つのボタンイメージの描画を行うなどを行うことができる。
FIG. 16 is an example of a time event.
As described above, a time event is defined by an event list (EventList) of playlist information (“XXX.PL”). When an event defined as a time event, that is, when the event type (Type) is “TimeEvent”, the time event having the ID “Ex1” is transferred from the scenario processor to the program processor when the event generation time (“t1”) is reached. Against. The program processor searches for an event handler having the event ID “Ex1” and executes the target event handler. For example, in this embodiment, two button images can be drawn.
図17はメニュー操作を行うユーザーイベントの例である。
前述したとおり、メニュー操作を行うユーザイベントもプレイリスト情報(”XXX.PL”)のイベントリスト(EventList)で定義される。ユーザイベントとして定義されるイベント、即ちイベントタイプ(Type)が”UserEvent”の場合、イベント生成時刻(”t1”)になった時点で、当該ユーザイベントがレディとなる。この時、イベント自身は未だ生成されてはいない。当該イベントは、有効期間情報(Duration)で記される期間レディ状態にある。
FIG. 17 shows an example of a user event for performing a menu operation.
As described above, the user event for performing the menu operation is also defined in the event list (EventList) of the playlist information (“XXX.PL”). When an event defined as a user event, ie, an event type (Type) is “UserEvent”, the user event becomes ready when the event generation time (“t1”) is reached. At this time, the event itself has not yet been generated. The event is in a ready state for the period indicated by the valid period information (Duration).
図17に描くように、ユーザがリモコンキーの「上」「下」「左」「右」キーまたは「決定」キーを押した場合、先ずUOPイベントがUOPマネージャによって生成されプログラムプロセッサに上げられる。プログラムプロセッサは、シナリオプロセッサに対してUOPイベントを流し、シナリオプロセッサはUOPイベントを受け取った時刻に有効なユーザイベントが存在するかを検索し、対象となるユーザイベントがあった場合は、ユーザイベントを生成し、プログラムプロセッサに持ち上げる。プログラムプロセッサでは、イベントID”Ev1”を持つイベントハンドラを探し、対象のイベントハンドラを実行処理する。例えば、本実施例の場合では、プレイリスト#2の再生を開始する。
As illustrated in FIG. 17, when the user presses the “up”, “down”, “left”, “right”, or “decision” keys of the remote control key, a UOP event is first generated by the UOP manager and raised to the program processor. The program processor sends a UOP event to the scenario processor. The scenario processor searches for a valid user event at the time when the UOP event is received. If there is a target user event, the user event is Generate and lift to the program processor. The program processor searches for an event handler having the event ID “Ev1” and executes the target event handler. For example, in the case of the present embodiment, reproduction of
生成されるユーザイベントには、どのリモコンキーがユーザによって押されたかの情報は含まれていない。選択されたリモコンキーの情報は、UOPイベントによってプログラムプロセッサに伝えられ、仮想プレーヤが持つレジスタSPRM(8)に記録保持される。イベントハンドラのプログラムは、このレジスタの値を調べ分岐処理を実行することが可能である。 The generated user event does not include information on which remote control key is pressed by the user. Information on the selected remote control key is transmitted to the program processor by a UOP event, and is recorded and held in the register SPRM (8) of the virtual player. The event handler program can check the value of this register and execute branch processing.
図18はグローバルイベントの例である。
前述したとおり、グローバルイベントはBDディスク全体に関する情報(”BD.INFO”)のイベントリスト(EventList)で定義される。グローバルイベントとして定義されるイベント、即ちイベントタイプ(Type)が”GlobalEvent”の場合、ユーザのリモコンキー操作があった場合にのみイベントが生成される。
FIG. 18 shows an example of a global event.
As described above, a global event is defined by an event list (EventList) of information (“BD. INFO”) relating to the entire BD disc. When an event defined as a global event, that is, an event type (Type) is “GlobalEvent”, an event is generated only when a user operates a remote control key.
ユーザが”メニュー”を押した場合、先ずUOPイベントがUOPマネージャによって生成されプログラムプロセッサに上げられる。プログラムプロセッサは、シナリオプロセッサに対してUOPイベントを流し、シナリオプロセッサは、該当するグローバルイベントを生成し、プログラムプロセッサに送る。プログラムプロセッサでは、イベントID”menu”を持つイベントハンドラを探し、対象のイベントハンドラを実行処理する。例えば、本実施例の場合ではプレイリスト#3の再生を開始している。
When the user presses “Menu”, a UOP event is first generated by the UOP manager and raised to the program processor. The program processor sends a UOP event to the scenario processor, and the scenario processor generates a corresponding global event and sends it to the program processor. The program processor searches for an event handler having the event ID “menu” and executes the target event handler. For example, in the case of the present embodiment, reproduction of
本実施例では、単に”メニュー”キーと呼んでいるが、DVDのように複数のメニューキーがあってもよい。各メニューキーに対応するIDを夫々定義することで対応することが可能である。 In this embodiment, it is simply called a “menu” key, but there may be a plurality of menu keys as in a DVD. It is possible to cope by defining IDs corresponding to the respective menu keys.
(仮想プレーヤマシン)
図19を用いてプログラムプロセッサの機能構成を説明する。
(Virtual player machine)
The functional configuration of the program processor will be described with reference to FIG.
プログラムプロセッサは、内部に仮想プレーヤマシンを持つ処理モジュールである。仮想プレーヤマシンはBDとして定義された機能モデルであって、各BDプレーヤの実装には依存しないものである。即ち、どのBDプレーヤにおいても同様の機能を実行するできることを保証している。 The program processor is a processing module having a virtual player machine inside. The virtual player machine is a functional model defined as a BD and does not depend on the implementation of each BD player. That is, it is guaranteed that the same function can be executed in any BD player.
仮想プレーヤマシンは大きく2つの機能を持っている。プログラミング関数とプレーヤ変数(レジスタ)である。プログラミング関数は、Java(登録商標)Scriptをベースとして、以下に記す2つの機能をBD固有関数として定義している。 The virtual player machine has two functions. Programming functions and player variables (registers). The programming function is based on Java (registered trademark) Script, and the following two functions are defined as BD specific functions.
リンク関数:現在の再生を停止し、指定するプレイリスト、セル、時刻からの再生を開始する
Link(PL#,Cell#,time)
PL# : プレイリスト名
Cell# : セル番号
time : セル内での再生開始時刻
PNG描画関数:指定PNGデータをイメージプレーンに描画する
Draw(File,X,Y)
File : PNGファイル名
X : X座標位置
Y : Y座標位置
イメージプレーンクリア関数:イメージプレーンの指定領域をクリアする
Clear(X,Y,W,H)
X : X座標位置
Y : Y座標位置
W : X方向幅
H : Y方向幅
プレーヤ変数は、プレーヤの状態を示すシステムパラメータ(SPRM)と一般用途として使用可能なゼネラルパラメータ(GPRM)とがある。
Link function: Stops the current playback and starts playback from the specified playlist, cell, and time Link (PL #, Cell #, time)
PL #: Playlist name Cell #: Cell number time: Playback start time in the cell PNG drawing function: Draws specified PNG data on the image plane Draw (File, X, Y)
File: PNG file name X: X coordinate position Y: Y coordinate position Image plane clear function: Clear specified area of image plane Clear (X, Y, W, H)
X: X-coordinate position Y: Y-coordinate position W: X-direction width H: Y-direction width Player variables include a system parameter (SPRM) indicating the state of the player and a general parameter (GPRM) that can be used for general purposes.
図20はシステムパラメータ(SPRM)の一覧である。
SPRM(0) : 言語コード
SPRM(1) : 音声ストリーム番号
SPRM(2) : 字幕ストリーム番号
SPRM(3) : アングル番号
SPRM(4) : タイトル番号
SPRM(5) : チャプタ番号
SPRM(6) : プログラム番号
SPRM(7) : セル番号
SPRM(8) : 選択キー情報
SPRM(9) : ナビゲーションタイマー
SPRM(10) : 再生時刻情報
SPRM(11) : カラオケ用ミキシングモード
SPRM(12) : パレンタル用国情報
SPRM(13) : パレンタルレベル
SPRM(14) : プレーヤ設定値(ビデオ)
SPRM(15) : プレーヤ設定値(オーディオ)
SPRM(16) : 音声ストリーム用言語コード
SPRM(17) : 音声ストリーム用言語コード(拡張)
SPRM(18) : 字幕ストリーム用言語コード
SPRM(19) : 字幕ストリーム用言語コード(拡張)
SPRM(20) : プレーヤリージョンコード
SPRM(21) : 予備
SPRM(22) : 予備
SPRM(23) : 再生状態
SPRM(24) : 予備
SPRM(25) : 予備
SPRM(26) : 予備
SPRM(27) : 予備
SPRM(28) : 予備
SPRM(29) : 予備
SPRM(30) : 予備
SPRM(31) : 予備
なお、本実施例では、仮想プレーヤのプログラミング関数をJavaScriptベースとしたが、JavaScriptではなく、UNIX(登録商標) OSなどで使われているB−Shellや、Perl Scriptなど他のプログラミング関数であっても構わなく、言い換えれば、本発明はJavaScriptに限定されるものでは無い。
FIG. 20 is a list of system parameters (SPRM).
SPRM (0): Language code SPRM (1): Audio stream number SPRM (2): Subtitle stream number SPRM (3): Angle number SPRM (4): Title number SPRM (5): Chapter number SPRM (6): Program Number SPRM (7): Cell number SPRM (8): Selection key information SPRM (9): Navigation timer SPRM (10): Playback time information SPRM (11): Karaoke mixing mode SPRM (12): Parental country information SPRM (13): Parental level SPRM (14): Player set value (video)
SPRM (15): Player setting value (audio)
SPRM (16): Audio stream language code SPRM (17): Audio stream language code (extended)
SPRM (18): Language code for subtitle stream SPRM (19): Language code for subtitle stream (extended)
SPRM (20): Player region code SPRM (21): Reserve SPRM (22): Reserve SPRM (23): Playback state SPRM (24): Reserve SPRM (25): Reserve SPRM (26): Reserve SPRM (27): Spare SPRM (28): Spare SPRM (29): Spare SPRM (30): Spare SPRM (31): Spare In this embodiment, the programming function of the virtual player is based on JavaScript, but is not based on JavaScript. Other programming functions such as B-Shell and Perl Script used in the registered OS can be used. In other words, the present invention is not limited to JavaScript.
(プログラムの例)
図21および図22は、イベントハンドラでのプログラムの例である。
(Program example)
21 and 22 show examples of programs in event handlers.
図21は、2つの選択ボタンを持ったメニューの例である。
セル(PlayList#1.Cell#1)先頭でタイムイベントを使って図24左側のプログラムが実行される。ここでは、最初にゼネラルパラメータの一つGPRM(0)に”1”がセットされている。GPRM(0)は、当該プログラムの中で、選択されているボタンを識別するのに使っている。最初の状態では、左側に配置するボタン1が選択されている事を初期値として持たされている。
FIG. 21 shows an example of a menu having two selection buttons.
The program on the left side of FIG. 24 is executed using the time event at the head of the cell (PlayList # 1.Cell # 1). Here, “1” is first set to GPRM (0), one of the general parameters. GPRM (0) is used to identify the selected button in the program. In the initial state, the initial value is that the
次に、PNGの描画を描画関数であるDrawを使ってボタン1、ボタン2夫々について行っている。ボタン1は、座標(10、200)を起点(左端)としてPNGイメージ”1black.png”を描画している。ボタン2は、座標(330,200)を起点(左端)としてPNGイメージ”2white.png”を描画している。
Next, PNG drawing is performed for each of the
また、本セル最後ではタイムイベントを使って図24右側のプログラムが実行される。ここでは、Link関数を使って当該セルの先頭から再度再生するように指定している。 At the end of this cell, the program on the right side of FIG. 24 is executed using a time event. Here, it is specified to play again from the beginning of the cell using the Link function.
図22は、メニュー選択のユーザイベントのイベントハンドラの例である。
「左」キー、「右」キー、「決定」キー何れかのリモコンキーが押された場合夫々に対応するプログラムがイベントハンドラに書かれている。ユーザがリモコンキーを押した場合、図17で説明したとおり、ユーザイベントが生成され、図22のイベントハンドラが起動されることになる。本イベントハンドラでは、選択ボタンを識別しているGPRM(0)の値と、選択されたリモコンキーを識別するSPRM(8)を使って分岐処理を行っている。
FIG. 22 shows an example of an event handler for a user event for menu selection.
When the remote control key of “Left” key, “Right” key, or “Determination” key is pressed, a corresponding program is written in the event handler. When the user presses the remote control key, as described with reference to FIG. 17, a user event is generated and the event handler of FIG. 22 is activated. In this event handler, branch processing is performed using the value of GPRM (0) identifying the selection button and SPRM (8) identifying the selected remote control key.
条件1)ボタン1が選択されている、かつ、選択キーが「右」キーの場合
GPRM(0)を2に再設定して、選択状態にあるボタンを右ボタン2に変更する。
ボタン1、ボタン2のイメージを夫々書き換える。
条件2)選択キーが「決定(OK)」の場合で、ボタン1が選択されている場合
プレイリスト#2の再生を開始する
条件3)選択キーが「決定(OK)」の場合で、ボタン2が選択されている場合
プレイリスト#3の再生を開始する
上記のようにして実行処理が行われる。
Condition 1) When
Rewrite the images of
Condition 2) When the selection key is “OK (OK)” and the
(プレーヤ処理フロー)
次に図23から図26を用いてプレーヤでの処理フローを説明する。
(Player processing flow)
Next, the processing flow in the player will be described with reference to FIGS.
図23は、AV再生までの基本処理フローである。
BDディスクを挿入すると(S101)、BDプレーヤはBD.INFOファイルの読み込みと解析(S102)、BD.PROGの読み込み(S103)を実行する。BD.INFOおよびBD.PROGは共に管理情報記録メモリに一旦格納され、シナリオプロセッサによって解析される。
FIG. 23 is a basic processing flow up to AV playback.
When the BD disc is inserted (S101), the BD player receives the BD. Reading and analysis of INFO file (S102), BD. PROG reading (S103) is executed. BD. INFO and BD. Both PROGs are temporarily stored in the management information recording memory and analyzed by the scenario processor.
続いて、シナリオプロセッサは、BD.INFOファイル内のファーストイベント(FirstEvent)情報に従い、最初のイベントを生成する(S104)。生成されたファーストイベントは、プログラムプロセッサで受け取られ、当該イベントに対応するイベントハンドラを実行処理する(S105)。 Subsequently, the scenario processor is BD. The first event is generated according to the first event (FirstEvent) information in the INFO file (S104). The generated first event is received by the program processor, and an event handler corresponding to the event is executed (S105).
ファーストイベントに対応するイベントハンドラには、最初に再生するべきプレイリスト情報が記録されていることが期待される。仮に、プレイリスト再生が指示されていない場合には、プレーヤは何も再生することなく、ユーザイベントを受け付けるのを待ち続けるだけになる。(S201)。BDプレーヤはユーザからのリモコン操作を受け付けると、UOPマネージャはプログラムマネージャに対してUOPイベントを立ち上げる(S202)。 It is expected that playlist information to be reproduced first is recorded in the event handler corresponding to the first event. If play list reproduction is not instructed, the player does not reproduce anything and simply waits for acceptance of a user event. (S201). When the BD player receives a remote control operation from the user, the UOP manager raises a UOP event to the program manager (S202).
プログラムマネージャは、UOPイベントがメニューキーかを判別し(S203)、メニューキーの場合は、シナリオプロセッサにUOPイベントを流し、シナリオプロセッサがユーザイベントを生成する(S204)。プログラムプロセッサは生成されたユーザイベントに対応するイベントハンドラを実行処理する(S205)。 The program manager determines whether the UOP event is a menu key (S203). If the UOP event is a menu key, it sends a UOP event to the scenario processor, and the scenario processor generates a user event (S204). The program processor executes an event handler corresponding to the generated user event (S205).
図24は、PL再生開始からVOB再生開始までの処理フローである。
前述したように、ファーストイベントハンドラまたはグローバルイベントハンドラによってプレイリスト再生が開始される(S301)。シナリオプロセッサは、再生対象のプレイリスト再生に必要な情報として、プレイリスト情報”XXX.PL”の読み込みと解析(S302)、プレイリストに対応するプログラム情報”XXX.PROG”の読み込みを行う(S303)。続いてシナリオプロセッサは、プレイリストに登録されているセル情報に基づいてセルの再生を指示する(S304)。セル再生は、シナリオプロセッサからプレゼンテーションコントローラに対して要求が出さる事を意味し、プレゼンテーションコントローラはAV再生を開始する(S305)。
FIG. 24 is a processing flow from the start of PL playback to the start of VOB playback.
As described above, play list reproduction is started by the first event handler or the global event handler (S301). The scenario processor reads and analyzes playlist information “XXX.PL” as information necessary for playback of the playlist to be played back (S302), and reads program information “XXX.PROG” corresponding to the playlist (S303). ). Subsequently, the scenario processor instructs the reproduction of the cell based on the cell information registered in the playlist (S304). Cell playback means that a request is sent from the scenario processor to the presentation controller, and the presentation controller starts AV playback (S305).
AV再生の開始(S401)を開始すると、プレゼンテーションコントローラは再生するセルに対応するVOBの情報ファイル(XXX.VOBI)を読み込みおよび解析をする(S402)。プレゼンテーションコントローラは、タイムマップを使って再生開始するVOBUとそのアドレスを特定し、ドライブコントローラに読み出しアドレスを指示し、ドライブコントローラは対象となるVOBデータを読み出し(S403)、VOBデータがデコーダに送られ再生が開始される(S404)。 When the start of AV playback (S401) is started, the presentation controller reads and analyzes the VOB information file (XXX.VOBI) corresponding to the cell to be played back (S402). The presentation controller uses the time map to specify the VOBU to start playback and its address, and instructs the drive controller to specify the read address. The drive controller reads the target VOB data (S403), and the VOB data is sent to the decoder. Playback is started (S404).
VOB再生は、当該VOBの再生区間が終了するまで続けられ(S405)、終了すると次のセル再生S304へ移行する。次にセルが無い場合は、再生が停止する(S406)。 The VOB playback is continued until the playback section of the VOB ends (S405), and when it ends, the process proceeds to the next cell playback S304. Next, if there is no cell, playback stops (S406).
図25は、AV再生開始後からのイベント処理フローである。
BDプレーヤはイベントドリブン型のプレーヤモデルである。プレイリストの再生を開始すると、タイムイベント系、ユーザイベント系、字幕表示系のイベント処理プロセスが夫々起動され、平行してイベント処理を実行するようになる。
FIG. 25 is an event processing flow after the start of AV playback.
The BD player is an event-driven player model. When playback of the playlist is started, event processing processes for the time event system, the user event system, and the caption display system are started, and the event processing is executed in parallel.
S500系の処理は、タイムイベント系の処理フローである。
プレイリスト再生開始後(S501)、プレイリスト再生が終了しているかを確認するステップ(S502)を経て、シナリオプロセッサは、タイムイベント発生時刻になったかを確認する(S503)。タイムイベント発生時刻になっている場合には、シナリオプロセッサはタイムイベントを生成し(S504)、プログラムプロセッサがタイムイベントを受け取りイベントハンドラを実行処理する(S505)。
The S500 system processing is a time event system processing flow.
After the play list reproduction is started (S501), the scenario processor confirms whether or not the time event occurrence time is reached (S503) through a step (S502) for confirming whether the play list reproduction is completed. If the time event occurrence time is reached, the scenario processor generates a time event (S504), and the program processor receives the time event and executes the event handler (S505).
ステップS503でタイムイベント発生時刻になっていない場合、または、ステップS504でイベントハンドラ実行処理後は再度ステップS502へ戻り、上述した処理を繰り返す。また、ステップS502でプレイリスト再生が終了したことが確認されると、タイムイベント系の処理は強制的に終了する。 If the time event occurrence time is not reached in step S503, or after the event handler execution process in step S504, the process returns to step S502 again, and the above-described process is repeated. Also, when it is confirmed in step S502 that the play list reproduction has been completed, the time event processing is forcibly terminated.
S600系の処理は、ユーザイベント系の処理フローである。
プレイリスト再生開始後(S601)、プレイリスト再生終了確認ステップ(S602)を経て、UOP受付確認ステップの処理に移る(S603)。UOPの受付があった場合、UOPマネージャはUOPイベントを生成し(S604)、UOPイベントを受け取ったプログラムプロセッサはUOPイベントがメニューコールであるかを確認し(S605)、メニューコールであった場合は、プログラムプロセッサはシナリオプロセッサにイベントを生成させ(S607)、プログラムプロセッサはイベントハンドラを実行処理する(S608)。
The S600 system processing is a user event system processing flow.
After the play list reproduction is started (S601), the play list reproduction end confirmation step (S602) is performed, and then the process proceeds to the UOP reception confirmation step (S603). When the UOP is accepted, the UOP manager generates a UOP event (S604), and the program processor that receives the UOP event checks whether the UOP event is a menu call (S605). The program processor causes the scenario processor to generate an event (S607), and the program processor executes the event handler (S608).
ステップS605でUOPイベントがメニューコールで無いと判断された場合、UOPイベントはカーソルキーまたは「決定」キーによるイベントである事を示している。この場合、現在時刻がユーザイベント有効期間内であるかをシナリオプロセッサが判断し(S606)、有効期間内である場合には、シナリオプロセッサがユーザイベントを生成し(S607)、プログラムプロセッサが対象のイベントハンドラを実行処理する(S608)。 If it is determined in step S605 that the UOP event is not a menu call, it indicates that the UOP event is an event by a cursor key or a “decision” key. In this case, the scenario processor determines whether the current time is within the user event valid period (S606), and if it is within the valid period, the scenario processor generates a user event (S607) and the program processor is targeted. The event handler is executed (S608).
ステップS603でUOP受付が無い場合、ステップS606で現在時刻がユーザイベント有効期間に無い場合、または、ステップS608でイベントハンドラ実行処理後は再度ステップS602へ戻り、上述した処理を繰り返す。また、ステップS602でプレイリスト再生が終了したことが確認されると、ユーザイベント系の処理は強制的に終了する。 If no UOP is accepted in step S603, if the current time is not in the user event valid period in step S606, or after the event handler execution process in step S608, the process returns to step S602 again to repeat the above-described process. Further, when it is confirmed in step S602 that the play list reproduction has ended, the user event processing is forcibly ended.
図26は字幕処理のフローである。
プレイリスト再生開始後(S701)、プレイリスト再生終了確認ステップ(S702)を経て、字幕描画開始時刻確認ステップに移る(S703)。字幕描画開始時刻の場合、シナリオプロセッサはプレゼンテーションコントローラに字幕描画を指示し、プレゼンテーションコントローラはイメージプロセッサに字幕描画を指示する(S704)。ステップS703で字幕描画開始時刻で無いと判断された場合、字幕表示終了時刻であるかを確認する(S705)。字幕表示終了時刻であると判断された場合は、プレゼンテーションコントローラがイメージプロセッサに字幕消去指示を行い、描画されている字幕をイメージプレーンから消去する(S706)。
FIG. 26 is a flowchart of caption processing.
After the play list reproduction is started (S701), the play list reproduction end confirmation step (S702) is followed by the subtitle drawing start time confirmation step (S703). In the case of the caption rendering start time, the scenario processor instructs the presentation controller to render captions, and the presentation controller instructs the image processor to render captions (S704). If it is determined in step S703 that it is not the caption drawing start time, it is confirmed whether it is the caption display end time (S705). If it is determined that the subtitle display end time is reached, the presentation controller instructs the image processor to delete the subtitle and deletes the drawn subtitle from the image plane (S706).
字幕描画ステップS704終了後、字幕消去ステップS706終了後、または、字幕表示終了時刻確認ステップS705で当該時刻でないことが判断された場合、ステップS702に戻り、上述した処理を繰り返す。また、ステップS702でプレイリスト再生が終了したことが確認されると、字幕表示系の処理は強制的に終了する。 After the caption drawing step S704 ends, after the caption erasure step S706 ends, or when it is determined that the time is not the same at the caption display end time confirmation step S705, the process returns to step S702 and the above-described processing is repeated. Also, when it is confirmed in step S702 that the playlist reproduction has been completed, the caption display processing is forcibly terminated.
(実施の形態2)
本実施の形態では、P/Iピクチャを使用する際に、ストリームおよび管理情報を制約することにより特殊再生時の再生品質を向上させる。以下に、符号化ストリームを多重化する際の制約事項について説明する。
(Embodiment 2)
In this embodiment, when P / I pictures are used, the playback quality during special playback is improved by restricting the stream and management information. Hereinafter, restrictions on multiplexing the encoded stream will be described.
まず、タイムマップと符号化ストリームとの関係について説明する。タイムマップからは、再生開始点として選択できる位置や、特殊再生時に読み込むことができるピクチャ指すことができる。本発明のタイムマップは、再生開始点として選択できる位置や、特殊再生時に読み込むことができる点として、P/Iピクチャから開始するRAUは選択しない。 First, the relationship between the time map and the encoded stream will be described. From the time map, a position that can be selected as a playback start point and a picture that can be read during special playback can be indicated. The time map of the present invention does not select a RAU starting from a P / I picture as a position that can be selected as a playback start point or a point that can be read during special playback.
図30は、タイムマップとRAUの関係を示している。再生開始点や特殊再生時に読み込まれるRAU先頭のピクチャの位置は、図30が示すようにタイムマップに時間と関連付けられてアドレスが格納されている。時間を指定されると、タイムマップを利用して、再生開始するアドレスを割り出し、シークを行って再生を開始するわけである。この際、P/Iピクチャは、再生開始位置や特殊再生時に読み込まれるピクチャとして適切ではないため、タイムマップには登録しない。こうすることにより、再生開始点や特殊再生時には選択されず、解像度が半分に落ちた画像から再生が開始されることが回避できる。 FIG. 30 shows the relationship between the time map and the RAU. The playback start point and the position of the RAU head picture read at the time of special playback are stored in the time map in association with time as shown in FIG. When the time is specified, the time map is used to determine the address to start playback, and seek is performed to start playback. At this time, the P / I picture is not registered in the time map because it is not appropriate as a playback start position or a picture read at the time of special playback. By doing so, it is possible to avoid starting playback from an image whose resolution has been reduced to half, without being selected at the playback start point or special playback.
また、タイムマップの属性情報の1つとして、ストリーム中にP/Iピクチャが存在しないことを保証するフラグがあってもよい。このフラグが有効であれば、P/Iピクチャは存在しないので、どのRAU先頭から再生を開始してもよい。 In addition, as one of the attribute information of the time map, there may be a flag that guarantees that no P / I picture exists in the stream. If this flag is valid, there is no P / I picture, so playback may be started from any RAU head.
また、タイムマップの属性情報の1つとして、タイムマップがP/Iピクチャを指していないことを保証するフラグがあってもよい。このフラグが有効であれば、タイムマップはP/Iピクチャを指していないため、タイムマップに登録してあるRAU先頭位置から再生を開始すればよい。 Further, as one of the attribute information of the time map, there may be a flag for guaranteeing that the time map does not point to the P / I picture. If this flag is valid, the time map does not point to a P / I picture, and therefore playback may be started from the RAU head position registered in the time map.
この2つの属性情報のいずれかがあれば、プレーヤはストリームを解析することなく、タイムマップを参照するだけで、十分な解像度をもって再生を開始できる再生開始位置の情報を取得することが可能となる。 If either of these two pieces of attribute information is present, the player can acquire information on the reproduction start position at which reproduction can be started with sufficient resolution, by simply referring to the time map without analyzing the stream. .
図31は、タイムマップに属性情報を追加して、タイムマップが指すピクチャのピクチャタイプを登録できるようにした例である。このようにピクチャタイプが分かれば、再生開始位置としてP/Iピクチャは選ばないよう、プレーヤが判断することも可能となるので、このような方法も有効である。 FIG. 31 shows an example in which attribute information is added to the time map so that the picture type of the picture pointed to by the time map can be registered. If the picture type is known in this way, the player can also decide not to select a P / I picture as the playback start position, so this method is also effective.
なお、図32に示すように、P/Iピクチャにおいて、第1フィールドのPピクチャが第2フィールドのIピクチャを参照している場合、最初のフレームをデコードすることが可能となるため、これまで述べてきたP/Iピクチャと区別して、こちらの場合は再生開始点や特殊再生時に表示できるピクチャとして選択してもよい。 As shown in FIG. 32, in the P / I picture, when the P picture in the first field refers to the I picture in the second field, the first frame can be decoded. Different from the P / I picture described above, in this case, it may be selected as a picture that can be displayed at the playback start point or special playback.
以下に、制約方法の他の例について説明する。
ストリームの接続点、あるいはアングルの切替え点においては、切替え前後で再生画像をシームレスに連結できることが重要である。従って、シームレスな接続を実現するために、切替え後の先頭ピクチャとしてP/Iピクチャを禁止することは有効であり、下記が可能である。
Hereinafter, another example of the restriction method will be described.
At stream connection points or angle switching points, it is important that playback images can be seamlessly connected before and after switching. Therefore, in order to realize a seamless connection, it is effective to prohibit the P / I picture as the first picture after switching, and the following is possible.
1.タイムマップからP/Iピクチャを指さない
2.ストリームにおいてRAUの先頭をP/Iピクチャとしない
以下、1、2の順に説明する。
1. 1. Do not point to a P / I picture from the time map. In the stream, the top of the RAU is not a P / I picture.
タイムマップには、現プレイアイテムと直前のプレイアイテムとがシームレスに接続できるかどうかを示すフラグが格納される。従って、当該フラグにより、シームレスに接続できることが示されるプレイアイテムにおいては、プレイアイテムの先頭ピクチャとしてP/Iピクチャを配置しないことにしてもよい。また、タイムマップにおいては、プレイアイテムが1以上のアングルについての情報を示すことができ、さらに、アングル切替えをシームレスに行えるかどうかを示すフラグが格納できる。従って、シームレスなアングル切替えが可能であると示される際には、各アングルの先頭ピクチャとしてP/Iピクチャを配置しないことにしてもよい。あるいは、アングル切替えのポイントにおいては、シームレスであるかどうかに関わらず、アングル切替わり後の先頭ピクチャとしてはP/Iピクチャを禁止してもよい。また、各プレイアイテムをランダムアクセス再生することがコンテンツ作成者によって許可されているかどうかを示すフラグも格納されるため、ランダムアクセスが許可される際には、プレイアイテムの先頭にP/Iピクチャを配置しないことにしてもよい。図33の例は、シームレス接続可能であることを示すフラグがセットされていれば、プレイアイテムの先頭ピクチャはI/Iピクチャ、またはI/Pピクチャのみであり、セットされていなければ、P/Iピクチャがプレイアイテムの先頭であってもよいことを示す。 The time map stores a flag indicating whether or not the current play item and the immediately preceding play item can be seamlessly connected. Therefore, in a play item that can be seamlessly connected by the flag, the P / I picture may not be arranged as the first picture of the play item. In the time map, the play item can indicate information on one or more angles, and a flag indicating whether or not the angle can be switched seamlessly can be stored. Therefore, when it is indicated that seamless angle switching is possible, the P / I picture may not be arranged as the first picture of each angle. Alternatively, at the point of angle switching, a P / I picture may be prohibited as the first picture after the angle switching regardless of whether the angle is seamless. In addition, since a flag indicating whether or not random access reproduction of each play item is permitted by the content creator is stored, when random access is permitted, a P / I picture is added at the head of the play item. You may decide not to arrange. In the example of FIG. 33, if the flag indicating that seamless connection is possible is set, the first picture of the play item is an I / I picture or only an I / P picture. If the flag is not set, P / Indicates that the I picture may be the head of the play item.
なお、本方式はP/Iピクチャに限定されるものではなく、RAUの先頭ピクチャの復号が保証できないケース全般において使用できる。なお、シームレスに接続できるかどうかを示す情報は、現プレイアイテムと直後のプレイアイテムとの関係を示してもよいし、プレイリストにより示される全てのプレイアイテムについての情報であってもよい。 Note that this method is not limited to P / I pictures, and can be used in all cases where the decoding of the leading RAU picture cannot be guaranteed. Note that the information indicating whether or not the connection can be seamless may indicate the relationship between the current play item and the immediately following play item, or may be information on all the play items indicated by the playlist.
次に、タイムマップと組み合わせずに、VC−1のストリーム内で制約する例について説明する。P/Iピクチャの有無は、RAU内のピクチャの復号を開始する前に判定できることが望ましいことから、RAUの先頭ピクチャがP/Iピクチャであるかどうかを示す情報をRAUの先頭に格納する。先に、VC−1のRAUには、クローズドGOP型とオープンGOP型の2種類があることを述べた。RAUがどちらのタイプであるかは、エントリ・ポイントのヘッダ内のフラグにより示され、フラグがセットされていればクローズドGOP型、セットされていなければオープンGOP型となる。シームレス接続やマルチアングル再生などにおいては、クローズドGOP型のRAUから再生を開始するのが一般的であるため、クローズドRAUの先頭ピクチャをP/Iピクチャとしないことにする。このとき、RAUがクローズドGOP型であるかどうかを示すフラグを、RAUの先頭ピクチャがP/Iピクチャであるかどうかを示すフラグとして使うことができる。従って、図34に示すように、エントリ・ポイントのヘッダにおいてクローズドGOP型のRAUであることが示される場合には、RAUの先頭ピクチャとしてP/Iピクチャを禁止し、オープンGOP型のRAUであることが示される場合にはRAUの先頭ピクチャとしてP/Iピクチャを使用可能とする。なお、RAUの先頭がP/Iピクチャであるかどうかを示す情報を、ユーザーデータなどを利用して別途格納してもよい。 Next, an example of restricting within a VC-1 stream without combining with a time map will be described. Since it is desirable that the presence / absence of a P / I picture can be determined before decoding of a picture in the RAU is started, information indicating whether or not the leading picture of the RAU is a P / I picture is stored at the leading edge of the RAU. As described above, there are two types of VC-1 RAUs, a closed GOP type and an open GOP type. The type of RAU is indicated by a flag in the header of the entry point. If the flag is set, it is a closed GOP type, and if it is not set, it is an open GOP type. In seamless connection, multi-angle playback, and the like, since playback is generally started from a closed GOP type RAU, the top picture of the closed RAU is not set as a P / I picture. At this time, a flag indicating whether or not the RAU is a closed GOP type can be used as a flag indicating whether or not the leading picture of the RAU is a P / I picture. Therefore, as shown in FIG. 34, when the entry point header indicates that it is a closed GOP type RAU, the P / I picture is prohibited as the first picture of the RAU, and the RAU is an open GOP type RAU. Is indicated, a P / I picture can be used as the leading picture of the RAU. Information indicating whether or not the head of the RAU is a P / I picture may be separately stored using user data or the like.
さらに、タイムマップの情報とストリーム内の情報とを組み合わせて使うことにより、ランダムアクセス単位の属性として下記4種類の情報を示すことができる。 Furthermore, by using a combination of time map information and information in the stream, the following four types of information can be shown as attributes of a random access unit.
1.クローズドGOP型のRAUであり、RAUの先頭ピクチャはP/Iピクチャではない
2.クローズドGOP型のRAUであり、RAUの先頭ピクチャはP/Iピクチャであってもよい
3.オープンGOP型のRAUであり、RAUの先頭ピクチャはP/Iピクチャではない
4.オープンGOP型のRAUであり、RAUの先頭ピクチャはP/Iピクチャであってもよい
1. 1. It is a closed GOP type RAU, and the first picture of the RAU is not a P / I picture. 2. It is a closed GOP type RAU, and the first picture of the RAU may be a P / I picture. 3. It is an open GOP type RAU, and the first picture of the RAU is not a P / I picture. It is an open GOP type RAU, and the first picture of the RAU may be a P / I picture
例えば、(ストリーム内でクローズド型のGOPであるかどうかを示すフラグ、タイムマップにおいてシームレス接続可能かどうかを示すフラグ)=(1,1)、(1,0)、(0,1)、(0,0)の組み合わせが、それぞれ上記1、2、3、4を示すとする。こうすることで、Iピクチャのみの高速再生、飛び込み再生、シームレス接続、あるいはマルチアングル再生など、アプリケーションによって重視されるパターンに応じて上記のいずれかの属性を選択して使用できる。具体的には、上記1と、上記3あるいは上記4を選択すれば、オープンGOP型のRAUにおいてはI/Pピクチャの配置に対しては制約がなく、クローズドGOP型のRAUではI/Pピクチャを先頭に配置しないことになる。なお、上記1と上記2、およびオープンGOP型のRAUの3種類を定義してもよい。 For example, (a flag indicating whether or not the GOP is a closed GOP in the stream, a flag indicating whether or not seamless connection is possible in the time map) = (1, 1), (1, 0), (0, 1), ( Assume that the combinations of (0, 0) indicate 1, 2, 3, and 4, respectively. In this way, any one of the above-described attributes can be selected and used according to the pattern important by the application, such as high-speed playback of only I pictures, jump-in playback, seamless connection, or multi-angle playback. Specifically, if 1 and 3 or 4 are selected, there is no restriction on the arrangement of the I / P picture in the open GOP type RAU, and the I / P picture in the closed GOP type RAU. Will not be placed at the beginning. Note that three types of the above 1 and 2 and an open GOP type RAU may be defined.
また、ストリームのビットレートに応じてP/Iピクチャが使用できるかどうかを切替えてもよい。P/Iピクチャは、フレーム内の第2フィールドにおいてシーンチェンジが発生する際に有効であり、特に、低ビットレート時に有効である。従って、VC−1のストリーム、あるいは管理情報により示されるビットレートが所定の値以下、あるいは未満である場合にのみP/Iピクチャを使用可能としてもよい。ビットレートは、シーケンス・レイヤにおいて示すことができる。さらに、エントリ・ポイントレベルなどのユーザーデータにおいて、ビットレートを示してもよい。ここで、ユーザーデータにおいてビットレートを直接示さずに、RAUの先頭がP/Iピクチャであることを示す情報などが存在すれば、対応するRAU、あるいはストリーム全体におけるビットレートが所定の値以下、あるいは未満であるとしてもよい。ここで、再生機器の処理能力の上限値を設定するという意味で最大ビットレートが望ましいが、平均ビットレートであってもよい。また、VC−1規格では複数のレベルを設けて、レベル毎にビットレートや復号時に必要なバッファサイズなどを規定している。従って、レベルに応じてP/Iピクチャが使用できるかどうかを切替えてもよい。なお、レベルはシーケンス・レイヤなどにより示される。 Further, whether or not the P / I picture can be used may be switched according to the bit rate of the stream. The P / I picture is effective when a scene change occurs in the second field in the frame, and particularly effective at a low bit rate. Therefore, the P / I picture may be usable only when the bit rate indicated by the VC-1 stream or the management information is equal to or less than a predetermined value. The bit rate can be indicated in the sequence layer. Furthermore, the bit rate may be indicated in user data such as an entry point level. Here, if there is information indicating that the head of the RAU is a P / I picture without directly indicating the bit rate in the user data, the bit rate of the corresponding RAU or the entire stream is equal to or less than a predetermined value, Or it may be less. Here, the maximum bit rate is desirable in terms of setting the upper limit value of the processing capability of the playback device, but it may be an average bit rate. In the VC-1 standard, a plurality of levels are provided, and a bit rate and a buffer size necessary for decoding are defined for each level. Therefore, whether or not the P / I picture can be used may be switched according to the level. The level is indicated by a sequence layer or the like.
なお、上記の各制約方法を組み合わせて使用してもよく、例えば、ビットレートが所定の値以下である際には、オープンGOP型のRAUにおいてのみP/Iピクチャを使用可能とする、などとしてもよい。これは、クローズドGOP型のRAUではGOPの先頭ピクチャから画質を劣化させずに再生できることが望ましいが、オープンGOP型のRAUでは、元々ランダムアクセス時に復号できないピクチャが存在し得るため、P/Iピクチャの存在により復号できないピクチャが1枚増加することに対する許容度が大きいことによる。 The above restriction methods may be used in combination. For example, when the bit rate is a predetermined value or less, the P / I picture can be used only in the open GOP type RAU. Also good. It is desirable that the closed GOP type RAU can be reproduced from the first picture of the GOP without degrading the image quality. However, in the open GOP type RAU, there may be a picture that cannot be decoded originally at the time of random access. This is because there is a large tolerance for an increase in the number of pictures that cannot be decoded by the presence of.
なお、BDやHD−DVDなど特定のアプリケーションでVC−1ストリームを使用する際には、RAUの先頭をP/Iピクチャとすることを禁止してもよい。このとき、BD−ROMであれば、BD−INFOなど特定の名前のディレクトリが存在するかどうかによってアプリケーションの種類が示される。また、VC−1のストリームがメインのコンテンツであるか、ボーナス映像など付加的なコンテンツであるかに応じてP/Iピクチャの使用可否を切替えてもよい。一般に、付加的なコンテンツはビットレートが低く、P/Iピクチャが有効であるため、P/Iピクチャを使用可とし、ビットレートの高いメインのコンテンツにおいてはP/Iピクチャの使用を禁止する。ここで、メインのコンテンツであるか、付加的なコンテンツであるかは、BD管理情報内のフラグにより示される。あるいは、ネットワーク経由、ハードディスクなど光ディスクとは異なる場所に蓄積されたコンテンツを付加的なコンテンツとみなすこともできる。 Note that when a VC-1 stream is used in a specific application such as a BD or HD-DVD, it may be prohibited to set the head of the RAU to a P / I picture. At this time, in the case of a BD-ROM, the type of application is indicated by whether or not a directory with a specific name such as BD-INFO exists. Further, the availability of the P / I picture may be switched according to whether the VC-1 stream is the main content or additional content such as a bonus video. In general, since the additional content has a low bit rate and the P / I picture is effective, the P / I picture can be used, and the use of the P / I picture is prohibited in the main content having a high bit rate. Here, whether the content is main content or additional content is indicated by a flag in the BD management information. Alternatively, content stored in a location different from the optical disk such as a hard disk via a network can be regarded as additional content.
また、符号化ストリームはVC−1に限定されるものではなく、第1フィールドがPピクチャで、第2フィールドがIピクチャであるフィールド・ペアを使える任意の符号化方式に適用できる。 Also, the encoded stream is not limited to VC-1, and can be applied to any encoding scheme that can use a field pair in which the first field is a P picture and the second field is an I picture.
(実施の形態3)
図38は、実施の形態2に係るVC−1のストリームを符号化する本発明の符号化方法のフローチャートであり、クローズドGOP型のRAUでは先頭にP/Iピクチャを配置しないように制約するステップS1101からステップS1103を新たに備えた点において従来の符号化方法と異なる。
(Embodiment 3)
FIG. 38 is a flowchart of the encoding method of the present invention for encoding a VC-1 stream according to the second embodiment, and is a step of restricting a P / I picture from being placed at the head in a closed GOP type RAU. It differs from the conventional encoding method in that step S1103 to step S1103 are newly provided.
まず、ステップS1101では、符号化するピクチャがRAUの先頭ピクチャであるかどうか判定し、先頭ピクチャであればステップS1102に進み、そうでなければステップS1104に進む。ステップS1103では、RAUがクローズドGOP型であるかどうか判定し、クローズドGOP型である際にはステップS1103に進み、そうでなければステップS1104に進む。ステップS1103では、ピクチャをフィールドとして符号化する際には、I/Iピクチャ、またはI/Pピクチャを用い、P/Iピクチャは使用しないと決定する。続いて、ステップS1104では、ステップS1103の決定に基づいてRAUを構成するピクチャを符号化する。ここで、クローズドGOP型のRAUである際には、RAUがクローズドGOP型であることを示すフラグをセットする。なお、ステップS1101に先立ってステップS1102の処理を行ってもよい。 First, in step S1101, it is determined whether the picture to be encoded is the leading picture of the RAU. If it is the leading picture, the process proceeds to step S1102, and if not, the process proceeds to step S1104. In step S1103, it is determined whether the RAU is a closed GOP type. If the RAU is a closed GOP type, the process proceeds to step S1103, and if not, the process proceeds to step S1104. In step S1103, when a picture is encoded as a field, it is determined that an I / I picture or an I / P picture is used and no P / I picture is used. Subsequently, in step S1104, the pictures constituting the RAU are encoded based on the determination in step S1103. If the RAU is a closed GOP type, a flag indicating that the RAU is a closed GOP type is set. Note that step S1102 may be performed prior to step S1101.
また、本符号化方法により符号化したストリームを、オーディオなどと多重化してもよい。多重化方式としては、MPEG−2のトランスポートストリーム、あるいはBD(Blu−ray Disc)などパッケージメディア毎に規定された方式がある。 Further, a stream encoded by this encoding method may be multiplexed with audio or the like. As a multiplexing method, there is a method defined for each package medium such as an MPEG-2 transport stream or a BD (Blu-ray Disc).
なお、出力されたストリームを多重化する際には、シームレス接続マルチアングル再生におけるアングルの切替りにおいては、接続点あるいは切替り点の直後の先頭ピクチャがP/Iピクチャとならないようにタイムマップを作成する。具体的には、接続点や切替り点としてはクローズドGOP型のRAUのみを指定してもよい。 When multiplexing the output stream, when switching the angle in seamless connection multi-angle playback, a time map is used so that the connection picture or the first picture immediately after the change point does not become a P / I picture. create. Specifically, only a closed GOP type RAU may be specified as a connection point or a switching point.
図39は、本実施の形態の符号化方法を実現する画像符号化装置10の構成を示すブロック図である。画像符号化装置10は、上記ステップS1101からステップS1103までの処理を行うタイプ制限ユニットLIMITを備えた点において従来の画像符号化装置1と異なる。予測構造決定ユニットPTYEは、タイプ制限ユニットLIMITにより指定されたピクチャタイプの制限情報LmtInfに基づいてピクチャの予測構造を決定する。
FIG. 39 is a block diagram showing a configuration of an
(実施の形態4)
図40は、実施の形態2に係るVC−1ストリームの多重化データを復号する画像復号方法において、マルチアングル再生や、同一ストリーム内の異なる区間を連続して再生するなどの特殊再生時の表示動作を示すフローチャートである。本画像復号方法では、RAUの先頭ピクチャがP/Iピクチャであるかどうかに応じてピクチャの表示動作を切替えるステップS1001からステップS1004までの動作が不要である点において従来の画像復号方法と異なる。
(Embodiment 4)
FIG. 40 shows display during special playback such as multi-angle playback or continuous playback of different sections in the same stream in the image decoding method for decoding multiplexed data of a VC-1 stream according to the second embodiment. It is a flowchart which shows operation | movement. This image decoding method is different from the conventional image decoding method in that the operation from step S1001 to step S1004 for switching the picture display operation depending on whether or not the leading picture of the RAU is a P / I picture is unnecessary.
なお、タイムマップなどの管理情報によってマルチアングル再生が可能である、あるいは、シームレスに接続できることが保証される場合に限り、表示動作を切替えないことにして、当該情報が管理情報から識別できない場合には、従来の画像復号方法と同様に表示動作を切替えてもよい。 Note that only when management information such as a time map enables multi-angle playback or when seamless connection is guaranteed, the display operation is not switched and the information cannot be identified from the management information. The display operation may be switched as in the conventional image decoding method.
なお、RAUがクローズドGOP型である際には表示動作を切替えずに、オープンGOP型であれば従来の画像復号方法と同様に表示動作を切替えてもよい。 When the RAU is a closed GOP type, the display operation may be switched as in the conventional image decoding method without switching the display operation if it is an open GOP type.
図41は、本実施の形態の復号方法を実現する画像復号装置30の構成を示すブロック図である。画像復号装置30は、表示切替ユニットModeSetを備えない点において従来の画像復号装置と異なる。
FIG. 41 is a block diagram illustrating a configuration of an
なお、上記各実施の形態における動画像の符号化方式はVC−1に限定されるものではなく、同様の予測構造を有する符号化方式全般に適用できる。 Note that the moving picture coding scheme in each of the above embodiments is not limited to VC-1, and can be applied to all coding schemes having a similar prediction structure.
(実施の形態5)
本実施の形態5では、P/Iピクチャを用いることにより、ランダムアクセス再生や逆再生などの特殊再生の機能性向上を実現するデータ構造について説明する。
(Embodiment 5)
In the fifth embodiment, a data structure that realizes improved functionality of special playback such as random access playback and reverse playback by using a P / I picture will be described.
まず、従来のデータ構造における第1の課題について説明する。図43は、従来のRAUの構造例を示す。図43の例では、各ピクチャはフィールド構造で符号化されており、RAUの途中にはP/Iピクチャが存在する。VC−1規格では、RAUの先頭ピクチャとなるP/Iピクチャについては、表示順がP/Iピクチャよりも後であるピクチャが、P/IピクチャにおけるPピクチャを参照することを禁止しているが、RAUの途中のP/Iピクチャについては、前記制約は規定していない。従って、図43に示すように、P/Iピクチャよりも後のピクチャがP/IピクチャのPピクチャを参照してもよい。このとき、P/IピクチャのPピクチャは、表示順で前方のPピクチャを参照できることから、P/Iピクチャ以降のピクチャを復号するためには、RAUの先頭ピクチャから復号しなければならない。従って、ユーザ操作などにより、P/Iピクチャ以降のピクチャから再生を開始する場合にも、タイムマップからランダムアクセス・ポイントとして指されたRAUの先頭から、IピクチャとPピクチャを少なくとも復号する必要がある。特に、RAUの再生時間長が長く、RAUを構成するピクチャの数が増えると、飛び込み位置から再生開始するために復号が必要なピクチャの数が増え、遅延および処理量が増大するという第1の課題がある。 First, the first problem in the conventional data structure will be described. FIG. 43 shows an example of the structure of a conventional RAU. In the example of FIG. 43, each picture is encoded with a field structure, and a P / I picture exists in the middle of the RAU. In the VC-1 standard, for a P / I picture that is the first picture of an RAU, a picture whose display order is later than the P / I picture is prohibited from referring to the P picture in the P / I picture. However, the restriction is not defined for P / I pictures in the middle of RAU. Therefore, as shown in FIG. 43, a picture subsequent to the P / I picture may refer to the P picture of the P / I picture. At this time, since the P picture of the P / I picture can refer to the forward P picture in the display order, it is necessary to decode from the leading picture of the RAU in order to decode the pictures after the P / I picture. Therefore, even when playback is started from a picture after the P / I picture by a user operation or the like, it is necessary to decode at least the I picture and the P picture from the head of the RAU pointed to as a random access point from the time map. is there. In particular, when the playback time length of the RAU is long and the number of pictures constituting the RAU increases, the number of pictures that need to be decoded in order to start playback from the jump position increases, and the delay and the processing amount increase. There are challenges.
図44は、従来のデータ構造の第2の課題について示す。実施の形態1から実施の形態4で述べたように、RAUの先頭ピクチャがP/Iピクチャであると、RAUの先頭のフレーム、あるいはフィールド・ペアのみを再生して高速再生を実現する際の再生品質が低下することから、RAUの先頭にはP/Iピクチャを配置しないように規定することがある。ここで、図44(a)に示すように、第1フィールドと第2フィールドの間でシーンチェンジが発生したとする。特殊再生時には、シーンチェンジの発生位置から飛込み再生できることが望ましいため、RAUを分割することを考えると、RAUの先頭にはP/Iピクチャを配置できないことから、図44(b)に示すようにRAUの先頭ピクチャをI/Iピクチャとする必要がある。この例のように、第1フィールドと第2フィールドの間でシーンチェンジが発生している際には、第1フィールドについては表示順で前の画像との相関が高いため、P/Iピクチャを使用したほうが符号化効率が向上する。従って、先頭ピクチャをI/Iピクチャにすることにより符号化効率が低下するという第2の課題がある。 FIG. 44 shows a second problem of the conventional data structure. As described in the first to fourth embodiments, when the first picture of the RAU is a P / I picture, only the first frame or field pair of the RAU is reproduced to realize high-speed reproduction. Since reproduction quality deteriorates, it may be specified that a P / I picture is not arranged at the head of an RAU. Here, as shown in FIG. 44A, it is assumed that a scene change has occurred between the first field and the second field. In special playback, since it is desirable to be able to play back from the position where the scene change occurred, considering the division of the RAU, a P / I picture cannot be placed at the beginning of the RAU. Therefore, as shown in FIG. The leading picture of the RAU needs to be an I / I picture. As in this example, when a scene change occurs between the first field and the second field, the first field has a high correlation with the previous image in the display order. Encoding efficiency is improved when it is used. Therefore, there is a second problem that encoding efficiency is lowered by making the first picture an I / I picture.
図45は、本実施の形態のRAU構造例を示す。図45のRAUでは、RAUの途中のP/Iピクチャの予測構造について次の制約を設ける。 FIG. 45 shows an example of the RAU structure of the present embodiment. In the RAU of FIG. 45, the following restriction is provided for the prediction structure of the P / I picture in the middle of the RAU.
・表示順がP/Iピクチャよりも後であるピクチャは、P/IピクチャにおけるPピクチャを参照しない。 A picture whose display order is later than the P / I picture does not refer to the P picture in the P / I picture.
これにより、ユーザ操作などにより、P/Iピクチャ以降のピクチャから再生を開始する場合にも、P/IピクチャにおけるIピクチャから復号開始することにより、P/Iピクチャ以降のピクチャを復号でき、飛び込み再生時の遅延および処理量が軽減できるという効果が得られる。また、逆再生を行う場合にも、P/Iピクチャ以降のピクチャを再生する際に、RAUの先頭ピクチャから読み込んで復号する必要がなく、P/IピクチャのIピクチャ、および以降のピクチャのみを読み込めばよいため、逆再生時に必要なバッファメモリのサイズ、あるいは、バッファメモリへのデータ読み込み回数を低減できるという効果が得られる。なお、P/Iピクチャは、通常、第1フィールドと第2フィールドの間でシーンチェンジが発生する際に使用されるため、P/Iピクチャ以降のピクチャと、P/IピクチャにおけるPピクチャとの相関関係は低く、当該Pピクチャへの参照を制約しても符号化効率への影響は軽微である。 Thus, even when playback is started from a picture after the P / I picture by a user operation or the like, the picture after the P / I picture can be decoded by starting decoding from the I picture in the P / I picture. The effect of reducing the delay and processing amount during reproduction can be obtained. Also, in the case of performing reverse playback, it is not necessary to read and decode from the first picture of the RAU when playing back the picture after the P / I picture, and only the I picture of the P / I picture and the following pictures are not decoded. Since it is sufficient to read the data, it is possible to reduce the size of the buffer memory required for reverse reproduction or the number of times data is read into the buffer memory. Since the P / I picture is normally used when a scene change occurs between the first field and the second field, the picture after the P / I picture and the P picture in the P / I picture The correlation is low, and even if the reference to the P picture is restricted, the influence on the coding efficiency is negligible.
図46は、本実施の形態のRAU構造の他の例である。図45の例では、タイムマップにおいてランダムアクセス・ポイントとして指される位置と、RAUとが一対一に対応していた。一方、図46では、タイムマップが指すN番目とN+1番目のランダムアクセス・ポイントの間に複数のRAUが存在する。つまり、タイムマップから指されないRAUが存在し、ここでは、RAU2はタイムマップから指されない。図46は、図45のRAUをRAU1とRAU2の2つのRAUに分割したものであり、RAUの先頭ピクチャはP/Iピクチャとなる。ここで、RAU2の先頭P/Iピクチャ以降のピクチャから再生を開始する場合、RAU内の後続ピクチャは先頭P/IピクチャのPピクチャを参照しないことが保証されるため、先頭P/IピクチャのIピクチャから復号開始すればよい。 FIG. 46 shows another example of the RAU structure of the present embodiment. In the example of FIG. 45, the position pointed to as the random access point in the time map and the RAU correspond one-on-one. On the other hand, in FIG. 46, there are a plurality of RAUs between the Nth and N + 1th random access points indicated by the time map. That is, there is an RAU that is not pointed out from the time map, and here, RAU2 is not pointed out from the time map. 46 divides the RAU of FIG. 45 into two RAUs, RAU1 and RAU2, and the leading picture of the RAU is a P / I picture. Here, when playback is started from a picture after the first P / I picture of RAU2, it is guaranteed that subsequent pictures in the RAU do not refer to the P picture of the first P / I picture. Decoding may be started from the I picture.
このように、特殊再生時に復号動作をリセットするポイントとして、P/Iピクチャが使用できる。さらに、P/Iピクチャよりも後のピクチャがP/IピクチャのPピクチャを参照しないという制約は、RAU内の全てのP/Iピクチャに対して適用してもよいが、特殊再生時の効率を向上させるには、P/Iピクチャに対して選択的に制約をかければよく、P/Iピクチャに対して制約が適用されるかどうかを示す情報を付加することは有効である。この情報は、符号化ストリーム内に格納してもよいし、管理情報に格納してもよい。図47は、表示順がP/Iピクチャよりも後のピクチャがP/IピクチャのPピクチャを参照しないという制約が適用されるかどうかを示す情報を符号化ストリーム内に格納した例である。ここでは、RAUマップと呼ぶマップ情報により当該情報を格納する。図47(a)に示すように、RAUマップはRAU内のピクチャデータよりも前に配置される。例えば、VC−1であればエントリ・ポイントレベルのユーザデータに格納できる。ここで、図47(a)のRAUマップは、図47(b)のRAUについての情報を示す。図47(b)のRAUでは、RAU内に4つのP/Iピクチャが存在し、2番目のP/Iピクチャについてのみ参照関係が制約されている。従って、2番目のP/Iピクチャは、特殊再生時に復号動作をリセットするポイントとして使用できる。そこで、RAUマップには、1番目、3番目、4番目のP/Iピクチャについては参照関係が制約されていることが保証されておらず、2番目のP/Iピクチャについては参照関係が制約されていることが保証されている、ことが示される。 In this way, a P / I picture can be used as a point for resetting the decoding operation during special reproduction. Further, the restriction that the picture after the P / I picture does not refer to the P picture of the P / I picture may be applied to all the P / I pictures in the RAU. In order to improve the P / I picture, it is sufficient to selectively restrict the P / I picture, and it is effective to add information indicating whether the restriction is applied to the P / I picture. This information may be stored in the encoded stream or may be stored in management information. FIG. 47 is an example in which information indicating whether or not the restriction that the picture after the P / I picture does not refer to the P picture of the P / I picture is applied is stored in the encoded stream. Here, the information is stored by map information called an RAU map. As shown in FIG. 47A, the RAU map is arranged before the picture data in the RAU. For example, VC-1 can be stored in entry / point level user data. Here, the RAU map in FIG. 47A shows information on the RAU in FIG. In the RAU of FIG. 47B, there are four P / I pictures in the RAU, and the reference relationship is restricted only for the second P / I picture. Therefore, the second P / I picture can be used as a point for resetting the decoding operation during special reproduction. Therefore, the RAU map does not guarantee that the reference relationship is restricted for the first, third, and fourth P / I pictures, and the reference relationship is restricted for the second P / I picture. It is shown that it is guaranteed that
図54は、RAUマップのシンタックス例である。図54(a)は、RAUを構成するフレーム、あるいはフィールド・ペアのタイプの一覧を復号順に示したテーブルである。各パラメータの定義は以下の通りとする。 FIG. 54 shows an example of the syntax of the RAU map. FIG. 54A is a table showing a list of frame or field pair types constituting the RAU in decoding order. The definition of each parameter is as follows.
num_frame_in_RAU: RAUを構成するフレーム、あるいはフィールド・ペアの個数
frame_flag: フレームであるかフィールド・ペアであるかを判別するフラグ
frame_type: フレームのタイプ(Iフレーム、Pフレーム、Bフレーム、BIフレーム、Skippedフレームなど)を示す識別子
field_pair_type: フィールド・ペアのタイプ(I/Iピクチャ、I/Pピクチャ、P/Iピクチャなど)
num_frame_in_RAU: the number of frames or field pairs constituting the RAU frame_flag: a flag for determining whether the frame or the field pair frame_type: frame type (I frame, P frame, B frame, BI frame, Skipped frame) Etc.) field_pair_type: field pair type (I / I picture, I / P picture, P / I picture, etc.)
ここで、field_pair_typeにおいて、復号動作がリセットできることが保証されたP/Iピクチャと、復号動作がリセットできることが保証されていないP/Iピクチャとで、異なる識別子を用いることにより、両者を区別できる。 Here, in field_pair_type, it is possible to distinguish between the P / I picture for which the decoding operation is guaranteed to be reset and the P / I picture for which the decoding operation is not guaranteed to be reset by using different identifiers.
図54(b)は、RAUを構成するフレーム、あるいはフィールドのタイプの一覧を復号順に示したテーブルである。各パラメータの定義は以下の通りとする。 FIG. 54B is a table showing a list of frame or field types constituting the RAU in decoding order. The definition of each parameter is as follows.
num_picture_in_RAU: RAUを構成するフレーム、あるいはフィールドの個数
frame_flag: フレームであるかフィールドであるかを判別するフラグ
picture_type: フレーム、あるいはフィールドのタイプ
num_picture_in_RAU: the number of frames or fields constituting the RAU frame_flag: a flag for discriminating whether the frame or the field picture_type: the type of the frame or field
ここで、P/Iピクチャの第1フィールドであるPピクチャについて、復号動作がリセットできることが保証されたP/IピクチャのPピクチャと、復号動作がリセットできることが保証されていないP/IピクチャのPピクチャとは、picture_typeにおいて異なる識別子を用いることにより区別される。 Here, with respect to the P picture which is the first field of the P / I picture, the P picture of the P / I picture whose decoding operation is guaranteed to be reset, and the P / I picture whose decoding operation is not guaranteed to be reset A P picture is distinguished by using a different identifier in picture_type.
なお、frame_flagには、フレームであるかフィールドであるかだけではなく、フレームにおけるに3:2プルダウン(テレシネ変換)についての情報などを含めてもよい。 The frame_flag may include not only the frame or the field but also information on 3: 2 pull-down (telecine conversion) in the frame.
RAU内に復号動作をリセットするポイントを設けることは、RAUの再生時間長が長い場合に特に有効である。ここで、RAUの時間長は、Iピクチャの間隔に依存し、IピクチャはPピクチャやBピクチャに比べて符号量が多いため、RAUの時間長を長くしてIピクチャの間隔を長くすることにより、結果としてビットレートを低減できる。従って、低ビットレート時にはRAUの時間長を長くすることが有効である。このため、RAUの再生時間長が所定の値以上、あるいは、符号化ストリームのビットレートが所定の値以下である場合にのみ、P/Iピクチャに対する参照関係の制約を適用する、あるいは、RAUマップを付加してP/Iピクチャに対する参照関係の制約があるかどうかを示してもよい。さらに、RAUの先頭Iピクチャのみを再生する高速再生など特殊再生時の再生品質を考慮して、RAUの再生時間長を所定の時間以下としてもよい。また、タイムマップにより指されるランダムアクセス・ポイント間の表示時刻あるいは復号時刻の差分値を所定の値以下としてもよい。ここで、オープンGOP型のRAUでは、タイムマップにより指されるIピクチャの表示時刻よりも、RAU内で最初に表示されるBピクチャなどの表示時刻のほうが早くなることに注意する。 Providing a point for resetting the decoding operation in the RAU is particularly effective when the playback time length of the RAU is long. Here, the RAU time length depends on the I picture interval, and the I picture has a larger amount of code than the P picture and B picture, so the RAU time length is increased to increase the I picture interval. As a result, the bit rate can be reduced. Therefore, it is effective to increase the RAU time length at a low bit rate. For this reason, only when the playback time length of the RAU is equal to or greater than a predetermined value or the bit rate of the encoded stream is equal to or less than the predetermined value, the reference relationship restriction for the P / I picture is applied, or the RAU map May be added to indicate whether there is a restriction on the reference relationship for the P / I picture. Furthermore, the playback time length of the RAU may be set to a predetermined time or less in consideration of playback quality at the time of special playback such as high-speed playback that plays back only the first I picture of the RAU. Also, the difference value between the display times or the decoding times between the random access points pointed to by the time map may be set to a predetermined value or less. Here, it should be noted that in the open GOP type RAU, the display time of the B picture or the like displayed first in the RAU is earlier than the display time of the I picture pointed to by the time map.
RAU内に複数のP/Iピクチャが存在する場合には、特殊再生の実現容易性を考慮して、当該P/Iピクチャについて参照関係を制約するかどうかを決定できる。例えば、1秒など所定の単位で、特殊再生時に復号動作がリセットできるポイントを設ける際には、P/Iピクチャ間の表示時刻の差分が前記所定の単位以下となるように、P/Iピクチャについての参照関係を制約できる。 When there are a plurality of P / I pictures in the RAU, it is possible to determine whether or not to restrict the reference relationship for the P / I picture in consideration of the ease of special reproduction. For example, when providing a point at which the decoding operation can be reset during special playback in a predetermined unit such as one second, the P / I picture is set so that the difference in display time between P / I pictures is equal to or less than the predetermined unit. The reference relationship about can be constrained.
以下に、図46のようなケースでも、タイムマップが示す連続した2つのランダムアクセス・ポイントの間に特殊再生時の復号動作をリセットできるポイントが存在するかどうか示す方法を示す。図48は、タイムマップによりランダムアクセス・ポイントであることが示されるRAUの前にRAUマップを配置して、次のランダムアクセス・ポイントとの間にあるRAUについての情報を示す例である。ここでは、ランダムアクセス・ポイントの間には、2つのRAUが存在し、それぞれの再生時間長が1秒であることが示される。RAUは、復号動作をリセットするポイントとして使用できるため、各RAUの再生時間長に基づいて、何番目のRAUから復号を開始すればよいか決定できる。さらに、RAUマップにおいて、各RAUマップの先頭がP/Iピクチャであるかどうかを示してもよい。図48におけるRAUマップと、図47に示したRAU単位のマップ情報とを合わせて使用してもよい。 A method for indicating whether or not there is a point that can reset the decoding operation at the time of special reproduction between two consecutive random access points indicated by the time map even in the case shown in FIG. FIG. 48 is an example in which an RAU map is placed before an RAU that is indicated as a random access point by a time map, and information about an RAU between the next random access point is shown. Here, two RAUs exist between the random access points, and each of the playback time lengths is 1 second. Since the RAU can be used as a point to reset the decoding operation, it can be determined from which RAU the decoding should be started based on the playback time length of each RAU. Further, in the RAU map, it may be indicated whether the head of each RAU map is a P / I picture. The RAU map in FIG. 48 and the map information for each RAU shown in FIG. 47 may be used together.
(実施の形態6)
本実施の形態6では、実施の形態5で示したデータを生成する画像符号化方法、および画像符号化装置について説明する。
(Embodiment 6)
In the sixth embodiment, an image coding method and an image coding apparatus for generating data shown in the fifth embodiment will be described.
図49は、本実施の形態の画像符号化方法において、ピクチャの参照関係を制約するかどうかを判定する際の動作を示すフローチャートである。まず、ステップS2001において、現フレームあるいはフィールド・ペアをP/Iピクチャとして符号化するかどうか判定し、ステップS2002に進む。ステップS2002では、現フレームあるいはフィールド・ペアがRAUの先頭フレームを構成するピクチャであるかどう判定し、先頭フレームを構成するピクチャであればステップS2003に進み、そうでなければステップS2004に進む。ステップS2003では、現フレームあるいはフィールド・ペアが復号動作をリセットできるピクチャとするかどうか判定し、リセットするピクチャであればステップS2004に進み、そうでなければ処理を終了する。ステップS2004では、RAU内において表示順が現P/Iピクチャよりも後であるピクチャが、現P/IピクチャにおけるPピクチャを参照しないように、後続ピクチャの参照関係を制約すると決定する。なお、全てのP/Iピクチャを、復号動作がリセットできるピクチャとしてもよい。 FIG. 49 is a flowchart showing an operation when determining whether or not to restrict the reference relationship of pictures in the image coding method according to the present embodiment. First, in step S2001, it is determined whether to encode the current frame or field pair as a P / I picture, and the process proceeds to step S2002. In step S2002, it is determined whether or not the current frame or field pair is a picture constituting the first frame of the RAU. If it is a picture constituting the first frame, the process proceeds to step S2003. Otherwise, the process proceeds to step S2004. In step S2003, it is determined whether or not the current frame or field pair is a picture for which the decoding operation can be reset. If it is a picture to be reset, the process proceeds to step S2004, and if not, the process ends. In step S2004, it is determined that the reference relationship of subsequent pictures is restricted so that a picture whose display order is later than the current P / I picture in the RAU does not refer to the P picture in the current P / I picture. Note that all P / I pictures may be pictures for which the decoding operation can be reset.
図50は、RAUマップをRAUの先頭に付加する際の動作を示すフローチャートである。本フローチャートでは、RAUマップの生成動作を主に説明し、各ピクチャの符号化動作の詳細については説明を省略する。まず、ステップS2101では、P/Iピクチャに関連して後続ピクチャの参照関係を制約するかどうか判定する。次に、ステップS2102では、ステップS2101で決定した制約を満たすように、ピクチャの参照関係を決定し、ステップS2103に進む。ステップS2103では、現ピクチャがRAUの最終ピクチャであるかどうか判定し、最終ピクチャであればステップS2104に進み、そうでなければ処理を終了する。なお、ステップS2013では、現ピクチャがRAU内の最終P/Iピクチャであるかどうか判定してもよい。最後に、ステップS2014では、P/Iピクチャについての情報を格納したRAUマップを生成し、RAUを構成するピクチャデータの前に付加する。 FIG. 50 is a flowchart showing an operation when a RAU map is added to the head of the RAU. In this flowchart, the RAU map generation operation is mainly described, and the details of the encoding operation of each picture are omitted. First, in step S2101, it is determined whether or not the reference relationship of the subsequent picture is restricted in relation to the P / I picture. In step S2102, the picture reference relationship is determined so as to satisfy the constraint determined in step S2101, and the process advances to step S2103. In step S2103, it is determined whether or not the current picture is the last picture of the RAU. If it is the last picture, the process proceeds to step S2104; otherwise, the process ends. In step S2013, it may be determined whether the current picture is the last P / I picture in the RAU. Finally, in step S2014, a RAU map storing information about the P / I picture is generated and added before the picture data constituting the RAU.
図51は、本実施の形態の画像符号化方法を実現する画像符号化装置2000の構成を示すブロック図である。画像符号化装置2000は、P/I制約決定ユニットPlimとマップ情報作成ユニットMapInfoを新たに備えた点、および予測構造決定ユニットPTYPEの動作が異なる点において従来の画像符号化装置1と異なる。P/I制約決定ユニットPlimは、ステップS2001からステップS2004までの処理を行い、符号化されるピクチャがP/Iピクチャである際には、RAU内の後続ピクチャが当該P/IピクチャのPピクチャを参照しないとするかどうか決定する。予測構造決定ユニットPTYPEは、P/I制約決定ユニットPlimで決定された条件を満たすように、ピクチャの符号化タイプおよび参照関係などを決定する。一方、マップ情報作成ユニットMapInfoは、実施の形態5で述べたRAUマップを生成する。
FIG. 51 is a block diagram showing a configuration of an
(実施の形態7)
本実施の形態7では、実施の形態5で示したデータを復号する画像復号方法、および画像復号装置について説明する。
(Embodiment 7)
In the seventh embodiment, an image decoding method and an image decoding apparatus for decoding data shown in the fifth embodiment will be described.
図52は、本実施の形態の画像復号方法における特殊再生時の復号動作を示すフローチャートである。本方法は、ユーザ操作などにより飛び込み再生、あるいは逆再生などを行う際に、復号を開始するピクチャを決定する際に特に有効である。まず、ステップS2201において、タイムマップにより指されるピクチャとは異なるピクチャ(Pic_st)から再生開始するかどうか判定し、Pic_stと異なるピクチャから再生開始する際には、ステップS2202に進み、そうでなければステップS2204に進む。ステップS2202では、Pic_stよりも復号順が前である、復号動作をリセットできるP/Iピクチャ(PI_st)が存在するかどうか判定する。ここで、判定時には、RAUマップを参照して、復号順が、
・Pic_stよりも前であり、
・タイムマップにより指されるRAUの先頭ピクチャよりも後である、
復号動作がリセットできるP/Iピクチャを検索する。なお、PI_stは、Pic_stよりも復号順が前であり、かつ復号順がPic_stに最も近いピクチャとする。
FIG. 52 is a flowchart showing a decoding operation during special playback in the image decoding method according to the present embodiment. This method is particularly effective in determining a picture to start decoding when performing jump reproduction or reverse reproduction by a user operation or the like. First, in step S2201, it is determined whether or not to start playback from a picture (Pic_st) different from the picture pointed to by the time map. When playback starts from a picture different from Pic_st, the process proceeds to step S2202, otherwise The process proceeds to step S2204. In step S2202, it is determined whether there is a P / I picture (PI_st) whose decoding order is earlier than Pic_st and whose decoding operation can be reset. Here, at the time of determination, referring to the RAU map, the decoding order is
・ Before Pic_st,
After the first picture of the RAU pointed to by the time map,
Search for a P / I picture whose decoding operation can be reset. Note that PI_st is a picture whose decoding order is earlier than Pic_st and whose decoding order is closest to Pic_st.
次に、ステップS2203では、PI_stにおけるIピクチャから復号開始すると決定する。ステップS2204では、タイムマップにより指されるRAUの先頭ピクチャから復号開始すると決定する。 Next, in step S2203, it is determined to start decoding from the I picture in PI_st. In step S2204, it is determined to start decoding from the first picture of the RAU pointed to by the time map.
図53は、本実施の形態の画像復号方法を実現する画像復号装置3000の構成を示すブロック図である。画像復号装置3000は、PI情報取得ユニットPIselを備える点において従来の画像復号装置3と異なる。
FIG. 53 is a block diagram illustrating a configuration of an
ユーザ操作などにより特殊再生を指示する信号TrickModeがPI情報取得ユニットPIselに入力されると、PI情報取得ユニットPIselは、可変長復号ユニットVLDからRAUマップの情報MapInfを取得する。ここで、可変長復号ユニットVLDは、符号化ストリームを解析してRAUマップを取得し、PI情報取得ユニットPIselに入力する。さらに、PI情報取得ユニットPIselは、RAUマップの情報MapInfを解析して、復号を開始するピクチャを決定し、決定した復号開始ピクチャを示す情報SelPicをストリーム抽出ユニットEXTに入力する。 When a signal TrickMode instructing special reproduction is input to the PI information acquisition unit PIsel by a user operation or the like, the PI information acquisition unit PIsel acquires RAU map information MapInf from the variable length decoding unit VLD. Here, the variable length decoding unit VLD acquires the RAU map by analyzing the encoded stream and inputs it to the PI information acquisition unit PIsel. Further, the PI information acquisition unit PIsel analyzes the information MapInf of the RAU map, determines a picture to start decoding, and inputs information SelPic indicating the determined decoding start picture to the stream extraction unit EXT.
(実施の形態8)
さらに、上記各実施の形態で示した画像符号化方法および画像復号方法を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
(Embodiment 8)
Furthermore, by recording the program for realizing the image encoding method and the image decoding method shown in each of the above embodiments on a recording medium such as a flexible disk, the processing shown in each of the above embodiments Can be easily implemented in an independent computer system.
図42は、上記各実施の形態の画像符号化方法および画像復号方法を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。 FIG. 42 is an explanatory diagram when the image encoding method and the image decoding method of each of the above embodiments are implemented by a computer system using a program recorded on a recording medium such as a flexible disk.
図42(b)は、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示し、図42(a)は、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスクFDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクでは、上記フレキシブルディスクFD上に割り当てられた領域に、上記プログラムが記録されている。 FIG. 42B shows an appearance, a cross-sectional structure, and a flexible disk as viewed from the front of the flexible disk, and FIG. 42A shows an example of a physical format of the flexible disk that is a recording medium body. The flexible disk FD is built in the case F, and a plurality of tracks Tr are formed concentrically on the surface of the disk from the outer periphery toward the inner periphery, and each track is divided into 16 sectors Se in the angular direction. ing. Therefore, in the flexible disk storing the program, the program is recorded in an area allocated on the flexible disk FD.
また、図42(c)は、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。画像符号化方法および画像復号方法を実現する上記プログラムをフレキシブルディスクFDに記録する場合は、コンピュータシステムCsから上記プログラムをフレキシブルディスクドライブを介して書き込む。また、フレキシブルディスク内のプログラムにより画像符号化方法および画像復号方法を実現する上記画像符号化方法および画像復号方法をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムに転送する。 FIG. 42C shows a configuration for recording and reproducing the program on the flexible disk FD. When the program for realizing the image encoding method and the image decoding method is recorded on the flexible disk FD, the program is written from the computer system Cs via the flexible disk drive. When the image encoding method and the image decoding method for realizing the image encoding method and the image decoding method by a program in a flexible disk are constructed in a computer system, the program is read from the flexible disk by a flexible disk drive, and the computer Transfer to system.
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。 In the above description, a flexible disk is used as the recording medium, but the same can be done using an optical disk. Further, the recording medium is not limited to this, and any recording medium such as an IC card or a ROM cassette capable of recording a program can be similarly implemented.
本発明に係る画像符号化方法および画像復号方法は、VC−1のストリームを再生する際に、高速や逆再生などの特殊再生機能を備える機器全般に適用することができ、特殊再生機能が重視される光ディスク関連機器において特に有効である。 The image encoding method and the image decoding method according to the present invention can be applied to all devices having special reproduction functions such as high speed and reverse reproduction when reproducing a VC-1 stream, and special reproduction functions are important. This is particularly effective in the optical disc related equipment.
LIMIT タイプ制限ユニット
PTYPE 予測構造決定ユニット
VLC 可変長符号化ユニット
PicMem ピクチャメモリ
LIMIT type limit unit PTYPE prediction structure determination unit VLC variable length coding unit PicMem picture memory
Claims (12)
前記動画像の符号化データは、1以上のランダムアクセス可能な単位から構成され、
前記動画像の符号化方式においては、1フレームの画像をフィールド単位で符号化する際に、第1フィールドを前方予測ピクチャとし、第2フィールドを面内符号化ピクチャとして符号化されたフィールド・ペアを使用できる際に、
前記符号化データにおいて前記フィールド・ペアが存在するかどうかを示す識別情報を格納する
ことを特徴とする情報記録媒体。 An information recording medium that records at least a stream obtained by multiplexing encoded data of moving images and management information thereof, wherein the management information includes reproduction time information, size information, and information on the moving images in the stream. Record start address information,
The encoded data of the moving image is composed of one or more randomly accessible units,
In the moving picture coding method, when a frame image is coded in a field unit, a field pair coded with a first field as a forward prediction picture and a second field as an in-plane coded picture. When you can use
An information recording medium for storing identification information indicating whether or not the field pair exists in the encoded data.
ランダムアクセス単位内の双方向予測ピクチャが、復号順で直前のランダムアクセス単位内のピクチャを参照することを禁止した、クローズド型のランダムアクセス単位と、
ランダムアクセス単位内の双方向予測ピクチャが、復号順で直前のランダムアクセス単位内のピクチャを参照することを許容した、オープン型のランダムアクセス単位と、
の2種類があり、
前記識別情報は、前記ランダムアクセス単位がクローズド型であるかどうかを示す情報であり、
前記ランダムアクセス単位がクローズド型である際には、前記ランダムアクセス単位の先頭に前記フィールド・ペアが存在しない
ことを特徴とする請求項1記載の情報記録媒体。 The random access unit includes
A closed random access unit that prohibits bi-predictive pictures in the random access unit from referring to pictures in the previous random access unit in decoding order; and
An open random access unit that allows bi-predictive pictures in a random access unit to refer to pictures in the previous random access unit in decoding order;
There are two types of
The identification information is information indicating whether the random access unit is a closed type,
The information recording medium according to claim 1, wherein when the random access unit is a closed type, the field pair does not exist at the head of the random access unit.
ことを特徴とする請求項1記載の情報記録媒体。 The information recording medium according to claim 1, wherein the identification information is information indicating whether a bit rate of the encoded stream is equal to or less than a predetermined value.
前記識別情報は、前記管理情報に格納され、前記連続して再生される前記再生区間がシームレスに接続されるかどうかを示し、
前記シームレスに接続されることが示される際には、接続先となる前記再生区間の先頭は前記フィールド・ペアでない
ことを特徴とする請求項1の情報記録媒体。 The moving image is divided into a plurality of playback sections according to playback time, and the management information stores information for continuously playing the one or more playback sections in the one or more moving images,
The identification information is stored in the management information and indicates whether the playback sections that are continuously played are seamlessly connected;
The information recording medium according to claim 1, wherein when the seamless connection is indicated, a head of the reproduction section to be a connection destination is not the field pair.
前記識別情報は、前記管理情報に格納され、前記連続して再生される区間が、それぞれ異なる動画像のストリームに属するかどうかを識別する情報であり、
前記異なる動画ストリームに属することが示される際には、接続先となる前記再生区間の先頭は前記フィールド・ペアでない
ことを特徴とする請求項1の情報記録媒体。 The moving image is divided into a plurality of playback sections according to playback time, and the management information stores information for continuously playing the one or more playback sections in the one or more moving images,
The identification information is information that is stored in the management information and identifies whether or not the continuously reproduced sections belong to different moving image streams,
2. The information recording medium according to claim 1, wherein when it is indicated that the video data belongs to the different video stream, the head of the playback section to be connected is not the field pair.
前記動画像の符号化方式においては、1フレームの画像をフィールド単位で符号化する際に、第1フィールドを前方予測ピクチャとし、第2フィールドを面内符号化ピクチャとして符号化されたフィールド・ペアを使用できる際に、
前記ランダムアクセス単位の先頭ピクチャが前記フィールド・ペアであるかどうかを示す情報を作成する補助情報作成ステップと、
前記作成した補助情報と画素を符号化して符号化ストリームを作成する符号化ステップと
を備えることを特徴とした画像符号化方法。 An image encoding method for encoding a moving image into one or more random access units,
In the moving picture coding method, when a frame image is coded in a field unit, a field pair coded with a first field as a forward prediction picture and a second field as an in-plane coded picture. When you can use
An auxiliary information creating step for creating information indicating whether the first picture of the random access unit is the field pair;
An image encoding method comprising: the generated auxiliary information; and an encoding step of encoding pixels to generate an encoded stream.
前記動画像の符号化方式においては、1フレームの画像をフィールド単位で符号化する際に、第1フィールドを前方予測ピクチャとし、第2フィールドを面内符号化ピクチャとして符号化されたフィールド・ペアを使用できる際に、
前記ランダムアクセス単位の先頭ピクチャが前記フィールド・ペアであるかどうかを示す情報を作成する補助情報作成手段と、
前記作成した補助情報と画素を符号化して符号化ストリームを作成する符号化手段と、
を備えることを特徴とした画像符号化装置。 An image encoding device that encodes a moving image into one or more random access units,
In the moving picture coding method, when a frame image is coded in a field unit, a field pair coded with a first field as a forward prediction picture and a second field as an in-plane coded picture. When you can use
Auxiliary information creating means for creating information indicating whether the first picture of the random access unit is the field pair;
Encoding means for encoding the created auxiliary information and pixels to create an encoded stream;
An image encoding apparatus comprising:
前記識別情報により、前記ランダムアクセス単位の先頭ピクチャが前記フィールド・ペアでないことが示される場合に、前記先頭ピクチャにおける第1フィールド、および第2フィールドを、それぞれ1番目と2番目に表示する表示ステップ、
を備えることを特徴とした画像復号方法。 An image decoding method for decoding and reproducing encoded data recorded on an information recording medium according to claim 1, comprising:
When the identification information indicates that the first picture of the random access unit is not the field pair, the display step of displaying the first field and the second field in the first picture as the first and second, respectively ,
An image decoding method comprising:
前記識別情報により、前記ランダムアクセス単位の先頭ピクチャが前記フィールド・ペアでないことが示される場合に、前記先頭ピクチャにおける第1フィールド、および第2フィールドを、それぞれ1番目と2番目に表示する表示手段、
を備えることを特徴とした画像復号装置。 An image decoding apparatus for decoding and reproducing encoded data recorded on an information recording medium according to claim 1,
When the identification information indicates that the first picture of the random access unit is not the field pair, display means for displaying the first field and the second field in the first picture first and second respectively, ,
An image decoding apparatus comprising:
前記動画像の符号化データは、1以上のランダムアクセス可能な単位から構成され、
前記動画像の符号化方式においては、1フレームの画像をフィールド単位で符号化する際に、第1フィールドを前方予測ピクチャとし、第2フィールドを面内符号化ピクチャとして符号化されたフィールド・ペアを使用できる際に、
前記ランダムアクセス単位の先頭とは異なるピクチャが前記フィールド・ペアであるときには、前記ランダムアクセス単位内のピクチャであって、前記フィールド・ペアよりも表示順が後であるピクチャは、前記フィールド・ペアの第1フィールドを参照しないことが保証され、
前記保証されることを示す情報を前記ストリーム内に格納することを特徴とする情報記録媒体。 An information recording medium that records at least a stream obtained by multiplexing encoded data of moving images and management information thereof, wherein the management information includes reproduction time information, size information, and information on the moving images in the stream. Record start address information,
The encoded data of the moving image is composed of one or more randomly accessible units,
In the moving picture coding method, when a frame image is coded in a field unit, a field pair coded with a first field as a forward prediction picture and a second field as an in-plane coded picture. When you can use
When the picture different from the head of the random access unit is the field pair, the picture in the random access unit, which is later in display order than the field pair, is the field pair. Guaranteed not to reference the first field,
An information recording medium characterized in that information indicating the guarantee is stored in the stream.
前記動画像の符号化データは、1以上のランダムアクセス可能な単位から構成され、
前記動画像の符号化方式においては、1フレームの画像をフィールド単位で符号化する際に、第1フィールドを前方予測ピクチャとし、第2フィールドを面内符号化ピクチャとして符号化されたフィールド・ペアを使用できる際に、
前記ランダムアクセス単位の先頭とは異なるピクチャが前記フィールド・ペアであるときには、前記ランダムアクセス単位内のピクチャであって、前記フィールド・ペアよりも表示順が後であるピクチャは、前記フィールド・ペアの第1フィールドを参照する場合としない場合とがあり、
前記フィールド・ペアよりも表示順が後であるピクチャが、前記フィールド・ペアの第1フィールドを参照するかどうかを示す情報を前記ストリーム内に格納することを特徴とする情報記録媒体。 An information recording medium that records at least a stream obtained by multiplexing encoded data of moving images and management information thereof, wherein the management information includes reproduction time information, size information, and information on the moving images in the stream. Record start address information,
The encoded data of the moving image is composed of one or more randomly accessible units,
In the moving picture coding method, when a frame image is coded in a field unit, a field pair coded with a first field as a forward prediction picture and a second field as an in-plane coded picture. When you can use
When the picture different from the head of the random access unit is the field pair, the picture in the random access unit, which is later in display order than the field pair, is the field pair. With or without reference to the first field,
An information recording medium characterized in that information indicating whether a picture whose display order is later than the field pair refers to the first field of the field pair is stored in the stream.
前記動画像の符号化データは、1以上のピクチャをまとめたグループ化単位が複数連結されたデータであり、
前記管理情報は、ランダムアクセスすることができる前記グループ化単位の一覧情報を格納し、
前記動画像の符号化方式においては、1フレームの画像をフィールド単位で符号化する際に、第1フィールドを前方予測ピクチャとし、第2フィールドを面内符号化ピクチャとして符号化されたフィールド・ペアを使用できる際に、
前記ストリームは、前記一覧情報から指されない前記グループ化単位の先頭ピクチャが前記フィールド・ペアであるかどうかを示す情報を格納することを特徴とする情報記録媒体。 An information recording medium that records at least a stream obtained by multiplexing encoded data of moving images and management information thereof, wherein the management information includes reproduction time information, size information, and information on the moving images in the stream. Record start address information,
The encoded data of the moving image is data in which a plurality of grouping units each grouping one or more pictures are concatenated,
The management information stores list information of the grouping units that can be randomly accessed,
In the moving picture coding method, when a frame image is coded in a field unit, a field pair coded with a first field as a forward prediction picture and a second field as an in-plane coded picture. When you can use
The information recording medium characterized in that the stream stores information indicating whether or not a head picture of the grouping unit not pointed out from the list information is the field pair.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005049981A JP2006157855A (en) | 2004-11-04 | 2005-02-25 | Information recording medium, image encoding method, and image decoding method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004321350 | 2004-11-04 | ||
JP2005049981A JP2006157855A (en) | 2004-11-04 | 2005-02-25 | Information recording medium, image encoding method, and image decoding method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006157855A true JP2006157855A (en) | 2006-06-15 |
Family
ID=36635532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005049981A Pending JP2006157855A (en) | 2004-11-04 | 2005-02-25 | Information recording medium, image encoding method, and image decoding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006157855A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008047962A (en) * | 2006-08-10 | 2008-02-28 | Sony Corp | Information processing device, information processing method, and computer program |
US8731065B2 (en) | 2008-01-24 | 2014-05-20 | Nec Corporation | Dynamic image stream processing method and device, and dynamic image reproduction device and dynamic image distribution device using the same |
WO2018150934A1 (en) * | 2017-02-20 | 2018-08-23 | ソニー株式会社 | Image processing device and method |
-
2005
- 2005-02-25 JP JP2005049981A patent/JP2006157855A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008047962A (en) * | 2006-08-10 | 2008-02-28 | Sony Corp | Information processing device, information processing method, and computer program |
US8731065B2 (en) | 2008-01-24 | 2014-05-20 | Nec Corporation | Dynamic image stream processing method and device, and dynamic image reproduction device and dynamic image distribution device using the same |
WO2018150934A1 (en) * | 2017-02-20 | 2018-08-23 | ソニー株式会社 | Image processing device and method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4099512B2 (en) | Moving picture coding method, moving picture coding apparatus, moving picture decoding method, moving picture decoding apparatus, recording medium, recording method, and moving picture decoding system | |
JP4185567B1 (en) | Moving picture stream generation apparatus, moving picture stream generation method, moving picture decoding apparatus, moving picture decoding method, recording method on recording medium, and moving picture decoding system | |
JP4790776B2 (en) | Multiplexing device, multiplexing method, reproducing device, reproducing method, recording method, and reproducing system | |
JP4718616B2 (en) | Moving picture coding method, moving picture coding apparatus, moving picture recording method, moving picture reproduction method, and moving picture reproduction apparatus | |
MXPA06004544A (en) | Stream generation apparatus, stream generation method, coding apparatus, coding method, recording medium and program thereof. | |
JP2008263640A (en) | Image encoding device, image decoding device, image encoding method, and image decoding method | |
JP2006157855A (en) | Information recording medium, image encoding method, and image decoding method | |
JP2006050192A (en) | Multiplexing method, information recording medium, and data reproducing method | |
JP2006157846A (en) | Information recording medium, image encoding method, and image decoding method |