JP7591878B2 - Encoding device, decoding device, and program - Google Patents
Encoding device, decoding device, and program Download PDFInfo
- Publication number
- JP7591878B2 JP7591878B2 JP2020112196A JP2020112196A JP7591878B2 JP 7591878 B2 JP7591878 B2 JP 7591878B2 JP 2020112196 A JP2020112196 A JP 2020112196A JP 2020112196 A JP2020112196 A JP 2020112196A JP 7591878 B2 JP7591878 B2 JP 7591878B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- video
- area
- sub
- hierarchical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、符号化装置、復号装置、及びプログラムに関する。 The present invention relates to an encoding device, a decoding device, and a program.
大画面且つ高精細な映像を用いたサービスの実現が期待されているが、高精細な映像はデータの量が膨大となるため、伝送をともなうサービスには広帯域な伝送路が必要となる。伝送に電波を用いる場合、周波数帯域が限られるため、伝送帯域に応じて映像データを圧縮符号化する技術が用いられる。 There is hope for services that use large-screen, high-definition video, but high-definition video requires a huge amount of data, so services that involve transmission require broadband transmission paths. When using radio waves for transmission, the frequency band is limited, so technology is used to compress and encode video data according to the transmission band.
しかし、圧縮符号化は符号化劣化を引き起こし、圧縮率が大きいほど劣化も大きくなる。このため、サービスに適する品質を得るための圧縮率には限度があり、例えば、地上波(6MHzの伝送帯域幅)で8Kの放送を行おうとすると、十分な画質が得られず、このままではサービスを提供できない。 However, compression encoding causes encoding degradation, and the higher the compression rate, the greater the degradation. For this reason, there is a limit to the compression rate required to obtain quality suitable for a service. For example, if you try to broadcast 8K over terrestrial waves (6 MHz transmission bandwidth), you will not be able to obtain sufficient image quality, and the service cannot be provided as it is.
十分な伝送帯域が確保できない条件では、映像の解像度を下げることで符号化劣化の発生は抑えることができるが、この場合はサービスそのものの品質が下がることとなる。例えば、8Kの映像を4Kにダウンコンバートして放送すれば、当然サービスは4Kの品質となる。 When sufficient transmission bandwidth cannot be secured, encoding degradation can be suppressed by lowering the video resolution, but this will result in a decrease in the quality of the service itself. For example, if 8K video is down-converted to 4K and broadcast, the service will naturally have 4K quality.
そこで、付加的な伝送手段を用いて、補完情報を別途伝送し、これらの伝送路で送られてきたデータを共に用いることで高い品質の映像を得ることを考える。つまり、伝送帯域の限られる地上波では4Kのサービスを行い、別の伝送路で付加情報を伝送し、これと4Kのデータを組み合わせて8Kの映像を得ることを考える。このようなサービス形態を実現する手段として階層符号化を用いることが考えられる(例えば、特許文献1参照)。なお、階層符号化は、スケーラブル符号化と呼ばれることもある。 Therefore, it is considered that high quality video can be obtained by separately transmitting complementary information using additional transmission means and using the data sent over these transmission paths together. In other words, 4K service can be provided over terrestrial broadcasting, which has a limited transmission bandwidth, and additional information can be transmitted over a separate transmission path, which can then be combined with the 4K data to obtain 8K video. One possible method for achieving this type of service is to use hierarchical coding (see, for example, Patent Document 1). Note that hierarchical coding is also sometimes called scalable coding.
階層符号化では、基本階層と拡張階層とを組み合わせると高品質な映像が再生でき、基本階層単独でも品質は落ちるが映像の再生が可能である。階層符号化を実現する技術として、これまでにいくつかの手法が提案されている。前述の4Kと8Kのような画素数(解像度)の異なる映像をスケーラブルに符号化する方法としては、空間階層符号化と呼ばれる方法がある。 In hierarchical coding, high-quality video can be reproduced by combining the base layer and the enhancement layer, and video can be reproduced using the base layer alone, although the quality will be reduced. Several techniques have been proposed to achieve hierarchical coding. One method for scalably encoding video with different numbers of pixels (resolutions), such as the aforementioned 4K and 8K, is called spatial hierarchical coding.
また、映像信号を粗い情報から細かい情報へと階層的に符号化する技術も知られている。(例えば、特許文献2参照) There is also a known technology that hierarchically encodes video signals from coarse information to fine information (see, for example, Patent Document 2).
空間階層符号化では、例えば、解像度の低い4K映像をアップコンバートして8K映像を生成し、4K映像から8K映像を生成するための付加情報を拡張階層として伝送するため、予測精度が悪く、符号化効率が低いことが課題とされている。特に、地上波を用いた放送など、高い圧縮率となる場合に、この傾向は顕著である。
In spatial hierarchical coding, for example, low-
このため、伝送帯域が限られる中で空間階層符号化を用いて十分な品質の8K映像を得るためには、4Kに対して8Kを得るために必要な付加情報が増加する。したがって、階層符号化を用いずに4Kと8Kの映像をそのまま伝送する場合と比較して、同じ品質を得るために必要な伝送路容量がほとんど変わらないといったことも予想され、階層符号化を採用するメリットは小さいと考えられる。 For this reason, in order to obtain 8K video of sufficient quality using spatial hierarchical coding within a limited transmission bandwidth, the amount of additional information required to obtain 8K will increase compared to 4K. Therefore, it is expected that there will be almost no change in the transmission path capacity required to obtain the same quality compared to transmitting 4K and 8K video as is without using hierarchical coding, and the benefits of adopting hierarchical coding are considered to be small.
よって、従来の階層符号化は有用であるものの、条件によっては符号化効率が悪いという課題があった。 Thus, although conventional hierarchical coding is useful, there is the problem that the coding efficiency is poor under certain conditions.
そこで、本発明は、階層符号化における符号化効率を改善する符号化装置、復号装置、及びプログラムを提供することを目的とする。 The present invention aims to provide an encoding device, a decoding device, and a program that improve the coding efficiency in hierarchical coding.
第1の態様に係る符号化装置は、入力映像を複数の映像に切り出し、切り出された前記複数の映像を階層的に符号化する装置である。前記符号化装置は、前記入力映像に含まれる主たる映像領域の位置及び大きさを指定する切り出し制御情報を出力する切り出し位置指定部と、前記切り出し制御情報に基づいて、前記入力映像に含まれる前記主たる映像領域を切り出す領域切り出し部と、前記入力映像を構成する前記主たる映像領域以外の映像領域を複数のサブピクチャに分割する領域分割部と、前記領域切り出し部が出力する前記主たる映像領域を符号化し、符号化された前記主たる映像のみの基本階層符号化ストリームを出力する基本階層符号化部と、前記領域分割部が出力する前記複数のサブピクチャのそれぞれを符号化し、前記基本階層符号化ストリームと組み合わせて利用可能な拡張階層符号化ストリームを出力する拡張階層符号化部とを備える。 The encoding device according to the first aspect is a device that cuts out an input video into a plurality of videos and hierarchically encodes the plurality of cut out videos. The encoding device includes a cut-out position designation unit that outputs cut-out control information that designates the position and size of a main video area included in the input video, a region cut-out unit that cuts out the main video area included in the input video based on the cut-out control information, a region division unit that divides a video area other than the main video area that constitutes the input video into a plurality of sub-pictures, a base hierarchical encoding unit that encodes the main video area output by the region cut-out unit and outputs a base hierarchical encoding stream of only the encoded main video, and an extension hierarchical encoding unit that encodes each of the plurality of sub-pictures output by the region division unit and outputs an extension hierarchical encoding stream that can be used in combination with the base hierarchical encoding stream.
第2の態様に係る復号装置は、階層符号化により得られた符号化ストリームを復号する装置である。前記復号装置は、基本階層符号化ストリームを復号し、入力映像に含まれる主たる映像領域を出力する基本階層復号部と、前記基本階層符号化ストリームと組み合わせて利用可能な拡張階層符号化ストリームを復号し、前記入力映像のうち前記主たる映像領域以外の映像領域を構成する複数のサブピクチャを出力する拡張階層復号部と、前記拡張階層復号部が出力する前記複数のサブピクチャを合成し、前記主たる映像領域以外の映像領域を出力する領域合成部と、前記基本階層復号部が出力する前記主たる映像領域と、前記領域合成部が出力する前記主たる映像領域以外の映像領域とを合成し、前記入力映像を復元する階層合成部とを備える。 The decoding device according to the second aspect is a device that decodes an encoded stream obtained by hierarchical encoding. The decoding device includes a base hierarchical decoding unit that decodes a base hierarchical encoded stream and outputs a main video area included in an input video, an extension hierarchical decoding unit that decodes an extension hierarchical encoded stream that can be used in combination with the base hierarchical encoded stream and outputs a plurality of sub-pictures that constitute a video area other than the main video area of the input video, a region synthesis unit that synthesizes the plurality of sub-pictures output by the extension hierarchical decoding unit and outputs a video area other than the main video area, and a hierarchical synthesis unit that synthesizes the main video area output by the base hierarchical decoding unit and the video area other than the main video area output by the region synthesis unit to restore the input video.
第3の態様に係るプログラムは、コンピュータを第1の態様に係る符号化装置として機能させる。 The program according to the third aspect causes a computer to function as the encoding device according to the first aspect.
第4の態様に係るプログラムは、コンピュータを第2の態様に係る復号装置として機能させる。 The program according to the fourth aspect causes a computer to function as a decryption device according to the second aspect.
本発明によれば、階層符号化における符号化効率を改善する符号化装置、復号装置、及びプログラムを提供できる。 The present invention provides an encoding device, a decoding device, and a program that improve the coding efficiency in hierarchical coding.
図面を参照して、実施形態に係る符号化装置及び復号装置について説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。 The encoding device and the decoding device according to the embodiment will be described with reference to the drawings. In the following description of the drawings, the same or similar parts are denoted by the same or similar reference numerals.
(映像伝送システム)
まず、実施形態に係る映像伝送システムについて説明する。図1は、実施形態に係る映像伝送システム100の構成を示す図である。
(Video Transmission System)
First, a video transmission system according to an embodiment will be described. Fig. 1 is a diagram showing a configuration of a
図1に示すように、映像伝送システム100は、送信装置10と、受信装置20Aと、受信装置20Bとを有する。送信装置10は、伝送路を介して受信装置20A及び20Bに対する映像伝送を行う。送信装置10は、入力映像に対して階層符号化を行う符号化装置1を有する。以下において、伝送する映像が8Kの映像である場合について例示するが、必ずしも8Kに限定する必要はない。
As shown in FIG. 1, the
符号化装置1は、階層符号化により基本階層符号化ストリーム及び拡張階層符号化ストリームを出力する。図1に示す例において、送信装置10は、放送伝送路30を介して基本階層符号化ストリームを受信装置20A及び20Bに送信する。例えば、放送伝送路30は、地上波を用いる伝送路である。送信装置10は、伝送帯域の限られる地上波で4Kの映像伝送サービスを提供する。
The encoding device 1 outputs a base hierarchically encoded stream and an extended hierarchically encoded stream by hierarchical encoding. In the example shown in FIG. 1, the
また、送信装置10は、通信伝送路40を介して拡張階層符号化ストリームを受信装置20Bに送信する。例えば、通信伝送路40は、インターネットなどの有線通信回線である。送信装置10は、付加的な伝送手段を用いて、補完情報としての拡張階層符号化ストリームを別途伝送する。
The transmitting
受信装置20Aは、放送伝送路30を介して基本階層符号化ストリームを受信する。受信装置20Aは、基本階層符号化ストリームから4Kの映像を復号する復号装置2Aを有する。受信装置20Aは、基本階層符号化ストリームにより、品質は落ちるものの映像の再生が可能である。
The
受信装置20Bは、放送伝送路30を介して基本階層符号化ストリームを受信するとともに、通信伝送路40を介して拡張階層符号化ストリームを受信する。受信装置20Bは、基本階層符号化ストリームと拡張階層符号化ストリームとを組み合わせて8Kの映像を復号する復号装置2Bを有する。受信装置20Bは、基本階層と拡張階層とを組み合わせて高品質な映像を再生可能である。
The
このようにして、映像伝送システム100は、階層符号化により4K及び8Kの映像伝送を行う。ここで、8Kのような大画面且つ高精細な映像サービスの場合、視聴者は画面全体を均等に注視し続けているわけではなく、通常は画面のある部分を中心に意識を集中させながら視聴することが一般的であると考えられる。
In this way, the
その点を考慮すれば、8Kから4Kの映像を生成する際には、全画面を縮小する必要はなく、重要情報が集中している注目部分を含むように4K映像を(縮小することなく)切り出すことで、十分に情報を伝えることが可能である。 With this in mind, when generating 4K video from 8K, there is no need to reduce the entire screen; by cropping the 4K video (without reducing it) to include the focal part where the important information is concentrated, it is possible to convey sufficient information.
実施形態に係る送信装置10の符号化装置1は、8Kの映像内の主たる映像領域(以下、「基本階層領域」と呼ぶ)を切り出すことで4Kの映像を生成し、切り出した4Kの基本階層領域を階層符号化における基本階層に用い、残りの領域(以下、「基本階層領域」と呼ぶ)を拡張階層として伝送する。これにより、4K映像のサービスを行いながら、符号化効率を低下させずに8K映像のサービスを行うことが可能となる。
The encoding device 1 of the
ここで、4Kの基本階層領域を切り出す位置は、固定されていてもよいし、フレームごとに変更しても構わない。また、基本階層領域として、8Kの映像から4Kの映像を切り出す場合を例示するが、基本階層を表示する装置の性能にあわせるなど、基本階層領域の大きさを変更しても構わない。 The position where the 4K basic layer area is cut out may be fixed or may be changed for each frame. Also, an example of a basic layer area where 4K video is cut out from 8K video is shown, but the size of the basic layer area may be changed to suit the performance of the device that displays the basic layer.
受信装置20Aの復号装置2Aは、基本階層復号ストリームを復号し、4Kの基本階層の映像を得る。一方、受信装置20Bの復号装置2Bは、基本階層ストリームから基本階層領域を復号するとともに、拡張階層ストリームから拡張階層領域を復号し、基本階層領域と拡張階層領域とを合成して8Kの映像を得る。このようにして、4Kの映像と8Kの映像をそれぞれ得ることができる。
よって、実施形態に係る映像伝送システム100によれば、符号化効率を低下させずに、4K(基本階層)及び8K(基本階層+拡張階層)の映像を両立させることで、多様で高品質なサービスの実現が期待できる。これを用いて、帯域の狭い地上波で4Kを放送し、インターネットなどの有線通信で付加情報を送信するといった方法で、4Kと8Kの階層的なサービスを実現することができる。
Therefore, according to the
(符号化装置)
次に、実施形態に係る符号化装置について説明する。図2は、実施形態に係る符号化装置1の構成を示す図である。
(Encoding device)
Next, a coding device according to an embodiment will be described. Fig. 2 is a diagram showing a configuration of a coding device 1 according to an embodiment.
図2に示すように、符号化装置1は、切り出し位置指定部11と、領域切り出し部12と、基本階層符号化部13と、領域分割部14と、拡張階層符号化部15とを有する。
As shown in FIG. 2, the encoding device 1 has a cutout
切り出し位置指定部11は、基本階層領域の位置及び大きさを指定する切り出し制御情報を、領域切り出し部12、領域分割部14、及び拡張階層符号化部15に出力する。ここで、切り出し位置の決定にあたっては、基本階層領域に重要な情報が含まれるように番組制作時に配慮することが望ましい。或いは、8K映像から重要情報として切り出す領域を判定する手段を別途用いて指定することも可能である。
The cut-out
図3は、実施形態に係る切り出し位置の指定方法を示す図である。図3に示すように、切り出し位置指定部11は、8Kの入力映像から切り出す4Kの基本階層領域の位置及び大きさを切り出し制御情報として指定する。例えば、切り出し位置指定部11は、基本階層領域の左上の座標値(x,y)及び水平垂直の画素数(w、h)を切り出し制御情報として出力する。
Figure 3 is a diagram showing a method for specifying a cut-out position according to an embodiment. As shown in Figure 3, the cut-out
ここで、切り出し位置は、固定でも構わないし、映像コンテンツの内容に応じて変化させても構わない。座標値の指定は、コンテンツ制作時に決定した値を入力してもよいし、入力映像から自動的に検出して指定する方法を備えても構わない。例えば、切り出し位置指定部11は、入力映像に対する顔認識処理等により、8K映像から重要情報として切り出す基本階層領域を指定してもよい。切り出す基本階層領域の大きさについても、映像コンテンツの内容に応じて変化させても構わない。
Here, the cut-out position may be fixed or may be changed according to the content of the video content. The coordinate values may be specified by inputting values determined at the time of content production, or a method of automatically detecting and specifying from the input video may be provided. For example, the cut-out
また、4Kの基本階層領域の長辺が8Kの入力映像の長辺と平行になるように基本階層領域を配置する一例を示しているが、必ずしも平行でなくてもよく、基本階層領域が水平方向に対して傾きを有していてもよい。ただし、平行ではない場合、後述する拡張階層の分割方法や符号化処理はより複雑になる。 In addition, an example is shown in which the base layer area is positioned so that the long side of the 4K base layer area is parallel to the long side of the 8K input video, but this does not necessarily have to be parallel, and the base layer area may be tilted relative to the horizontal direction. However, if they are not parallel, the division method and encoding process of the enhancement layer, which will be described later, will become more complicated.
領域切り出し部12は、切り出し位置指定部11が出力する切り出し制御情報、すなわち、座標値(x,y)及び領域の大きさ(w、h)に基づいて、入力映像から基本階層領域を切り出し、切り出した基本階層領域を基本階層符号化部13及び領域分割部14に出力する。
The
基本階層符号化部13は、領域切り出し部12が出力する基本階層領域を符号化し、単独で利用可能な基本階層符号化ストリームを出力する。基本階層符号化部13が用いる符号化方式は任意の方式で構わない。
The base
領域分割部14は、切り出し位置指定部11が出力する切り出し制御情報に基づいて、入力映像のうち基本階層領域以外の拡張階層領域を、拡張階層符号化部15で符号化が可能な形状の領域に分割する。分割されたこれらの領域をそれぞれ「サブピクチャ」と呼ぶ。一般的な符号化方式では長方形の領域を入力として符号化を行うことを考慮し、各サブピクチャの形状は長方形であるものとする。分割の方法は事前に決定しておいてもよいし、コンテンツ内容等に応じて変更し、分割方法をその都度ストリームに多重するなどの方法によって復号側に伝えるとしてもよい。
Based on the cut-out control information output by the cut-out
図4は、実施形態に係る領域分割部14における第1の分割例を示す図である。
Figure 4 shows a first example of division in the
図4に示すように、第1の分割例では、基本階層領域の垂直の辺を延長することによって基本階層領域以外の拡張階層領域を4つのサブピクチャに分割する。分割された矩形の領域、つまりサブピクチャをA、B、C、Dとする。サブピクチャA、B、C、Dのそれぞれの形状(水平、垂直画素数)は、切り出し制御情報として指定される値(x,y,w,h)が決まれば一意に決定される。つまり、「垂直の辺を延長することによって分割する」という分割方法が指定されていれば、サブピクチャA、B、C、Dの順番と(x,y,w,h)の情報のみによって、元の映像を復元することが可能である。 As shown in Figure 4, in the first division example, the extended hierarchical area other than the base hierarchical area is divided into four sub-pictures by extending the vertical sides of the base hierarchical area. The divided rectangular areas, i.e., the sub-pictures, are A, B, C, and D. The shape (horizontal and vertical pixel count) of each of the sub-pictures A, B, C, and D is uniquely determined once the values (x, y, w, h) specified as the crop control information are determined. In other words, if the division method of "dividing by extending the vertical sides" is specified, it is possible to restore the original image using only the order of the sub-pictures A, B, C, and D and the (x, y, w, h) information.
図5は、実施形態に係る領域分割部14における第2の分割例を示す図である。
Figure 5 shows a second example of division in the
図5に示すように、第2の分割例では、基本階層領域の上辺を左方向に延長し、基本階層領域の左辺を下方向に延長し、基本階層領域の下辺を右方向に延長し、基本階層領域の右辺を上方向に延長することによって基本階層領域以外の領域を4つのサブピクチャに分割する。この場合でも第1の分割例と同様に、分割の方法を事前に指定しておけば、切り出し制御情報として指定される値(x,y,w,h)のみによって復元が可能となる。 As shown in Figure 5, in the second division example, the top edge of the base layer area is extended to the left, the left edge of the base layer area is extended downward, the bottom edge of the base layer area is extended to the right, and the right edge of the base layer area is extended upward, thereby dividing the area other than the base layer area into four sub-pictures. In this case, as in the first division example, if the division method is specified in advance, restoration is possible using only the values (x, y, w, h) specified as the cut-out control information.
図6は、実施形態に係る領域分割部14における第3の分割例を示す図である。
Figure 6 shows a third example of division in the
図6に示すように、第3の分割例では、拡張階層領域をさらに小さい領域に分割して複数のサブピクチャを得る。例えば、同じ形状(同じサイズ)の小領域で拡張階層領域を分割できるような構成とすれば、後述の拡張階層符号化処理でのサブエンコーダをすべて同一にできるというメリットがある。ただし、拡張階層領域が水平垂直それぞれ整数個の同一の小領域で過不足なく分割できるような数値に(x,y,w,h)を限定する必要がある。 As shown in Figure 6, in the third division example, the enhancement hierarchical region is divided into smaller regions to obtain multiple sub-pictures. For example, if the enhancement hierarchical region can be divided into small regions of the same shape (same size), there is an advantage in that the sub-encoders in the enhancement hierarchical encoding process described below can all be the same. However, it is necessary to limit (x, y, w, h) to values that allow the enhancement hierarchical region to be divided into an integer number of identical small regions both horizontally and vertically, without any excess or deficiency.
拡張階層符号化部15は、領域分割部14が出力する複数のサブピクチャのそれぞれを符号化し、拡張階層符号化ストリームを出力する。図7は、実施形態に係る拡張階層符号化部15の構成を示す図である。図7に示すように、拡張階層符号化部15は、複数のサブエンコーダ151a,151b,151c・・・と、ストリーム合成部152とを有する。
The extension
複数のサブエンコーダ151a,151b,151c・・・は、領域分割部14が出力する複数のサブピクチャをそれぞれ符号化し、複数の符号化ストリームをストリーム合成部152に出力する。図4及び図5の例では、サブピクチャはA、B、C、Dの4つであるので、サブエンコーダも4系統を用いれば十分である。
The multiple sub-encoders 151a, 151b, 151c, etc. each encode the multiple sub-pictures output by the
ストリーム合成部152は、複数のサブエンコーダ151a,151b,151c・・・が出力する複数の符号化ストリームと、切り出し位置指定部11が出力する切り出し制御情報とを合成し、拡張階層符号化ストリームを出力する。合成の方法は任意の手法で構わないが、切り出し制御情報、及び、どのサブピクチャに該当するストリームであるかを判別して分離することを可能とするようにする。
The
このように、実施形態に係る符号化装置1は、入力映像に対して階層符号化を行う装置であって、入力映像に含まれる主たる映像領域(基本階層領域)を切り出す領域切り出し部12と、入力映像のうち主たる映像領域以外の残りの映像領域(拡張階層領域)を複数のサブピクチャに分割する領域分割部14と、領域切り出し部12が出力する主たる映像領域を符号化し、単独で利用可能な基本階層符号化ストリームを出力する基本階層符号化部13と、領域分割部14が出力する複数のサブピクチャのそれぞれを符号化し、基本階層符号化ストリームと組み合わせて利用可能な拡張階層符号化ストリームを出力する拡張階層符号化部15とを有する。これにより、符号化効率を低下させずに、4K(基本階層)及び8K(基本階層+拡張階層)の映像を両立させることで、多様で高品質なサービスの実現が期待できる。
In this way, the encoding device 1 according to the embodiment is a device that performs hierarchical encoding on input video, and includes an
(復号装置)
次に、実施形態に係る復号装置について説明する。図8は、実施形態に係る復号装置2の構成を示す図である。ここでは、復号装置2として、図1に示す復号装置2Bの構成を示している。
(Decoding device)
Next, a decoding device according to an embodiment will be described. Fig. 8 is a diagram showing the configuration of a
図8に示すように、復号装置2は、基本階層復号部21と、拡張階層復号部22と、領域合成部23と、階層合成部24とを有する。
As shown in FIG. 8, the
基本階層復号部21は、基本階層符号化ストリームを復号し、基本階層領域を出力する。なお、復号装置2が図1に示す復号装置2Aである場合、4Kの映像である基本階層領域のみが再生されることになる。
The base
拡張階層復号部22は、拡張階層符号化ストリームを復号し、拡張階層領域を構成する複数のサブピクチャと切り出し制御情報とを出力する。図9は、実施形態に係る拡張階層復号部22の構成を示す図である。図9に示すように、拡張階層復号部22は、ストリーム分離部221と、複数のサブデコーダ222a,222b,222c・・・とを有する。
The enhancement
ストリーム分離部221は、拡張階層符号化ストリームを、複数のサブピクチャに対応する複数の符号化ストリームと切り出し制御情報とに分離し、複数の符号化ストリームを複数のサブデコーダ222a,222b,222c・・・に出力するとともに、切り出し制御情報を領域合成部23及び階層合成部24に出力する。ここで、ストリームを分離して該当のサブデコーダに出力する方法は、符号化装置1のストリーム合成部152での合成方法に対応した方法とする。
The
複数のサブデコーダ222a,222b,222c・・・は、ストリーム分離部221が出力する複数の符号化ストリームから複数のサブピクチャをそれぞれ復号し、復号したサブピクチャを領域合成部23に出力する。
The multiple sub-decoders 222a, 222b, 222c, etc. decode multiple sub-pictures from the multiple encoded streams output by the
領域合成部23は、拡張階層復号部22(複数のサブデコーダ222a,222b,222c・・・)が出力する複数のサブピクチャを合成し、拡張階層領域を出力する。合成の方法は、符号化装置1の領域分割部14での分割の方法に対応した方法とする。上述したように、符号化装置1における分割の方法は事前に決定しておいてもよいし、コンテンツ内容等に応じて変更し、その都度ストリームに多重するなどの方法で伝えられる方法としてもよい。サブピクチャ分割の方法及び切り出し制御情報によって合成の方法は決定されるので、それに応じて、領域合成部23が複数のサブピクチャを合成して拡張階層領域を出力する。
The
階層合成部24は、拡張階層復号部22が出力する切り出し制御情報に基づいて、基本階層復号部21が出力する基本階層領域と、領域合成部23が出力する拡張階層領域とを合成し、8Kの映像を復元して出力する。
The
このように、実施形態に係る復号装置2は、階層符号化により得られた符号化ストリームを復号する装置であって、単独で利用可能な基本階層符号化ストリームを復号し、入力映像に含まれる主たる映像領域(基本階層領域)を出力する基本階層復号部21と、基本階層符号化ストリームと組み合わせて利用可能な拡張階層符号化ストリームを復号し、入力映像のうち主たる映像領域以外の残りの映像領域(拡張階層領域)を構成する複数のサブピクチャを出力する拡張階層復号部22と、拡張階層復号部22が出力する複数のサブピクチャを合成し、残りの映像領域を出力する領域合成部23と、基本階層復号部21が出力する主たる映像領域と、領域合成部23が出力する残りの映像領域とを合成し、入力映像を復元する階層合成部24とを有する。これにより、符号化効率を低下させずに、4K(基本階層)及び8K(基本階層+拡張階層)の映像を両立させることで、多様で高品質なサービスの実現が期待できる。
In this way, the
(その他の実施形態)
実施形態において、基本階層と拡張階層とを用いて2階層として階層符号化を構成する一例について説明したが、実施形態に係る方法を再帰的に用いて3階層以上とする、或いは、他の階層符号化と組み合わせるなどの方法も考えられる。
Other Embodiments
In the embodiment, an example of configuring hierarchical coding as two layers using a base layer and an extension layer has been described, but it is also possible to use the method according to the embodiment recursively to configure three or more layers, or to combine it with other hierarchical coding methods.
通信伝送路40を利用し、受信装置20(復号装置2)側から送信装置10(符号化装置1)側へ視聴者が注目する領域の情報をフィードバックしてもよい。この場合、切り出し位置指定部11は、フィードバックされた情報に基づいて、重要情報として切り出す基本階層領域を判定してもよい。
By using the
実施形態において、入力映像から切り出す基本階層領域が1つである一例について説明したが、領域切り出し部12は、入力映像から2以上の基本階層領域を切り出してもよい。受信装置20は、当該2以上の基本階層領域の中から復号する1つの基本階層領域を選択し、選択した基本階層領域のみを復号してもよい。
In the embodiment, an example has been described in which one base layer area is extracted from the input video, but the
符号化装置1が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。また、復号装置2が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。
A program may be provided that causes a computer to execute each process performed by the encoding device 1. Also, a program may be provided that causes a computer to execute each process performed by the
符号化装置1が行う各処理を実行する回路を集積化し、符号化装置1を半導体集積回路(チップセット、SoC)により構成してもよい。復号装置2が行う各処理を実行する回路を集積化し、復号装置2を半導体集積回路(チップセット、SoC)により構成してもよい。
The circuits that execute the processes performed by the encoding device 1 may be integrated, and the encoding device 1 may be configured as a semiconductor integrated circuit (chip set, SoC). The circuits that execute the processes performed by the
以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。 The above describes the embodiment in detail with reference to the drawings, but the specific configuration is not limited to the above, and various design changes can be made without departing from the spirit of the invention.
1 :符号化装置
2 :復号装置
2A :復号装置
2B :復号装置
10 :送信装置
11 :切り出し位置指定部
12 :領域切り出し部
13 :基本階層符号化部
14 :領域分割部
15 :拡張階層符号化部
20 :受信装置
20A :受信装置
20B :受信装置
21 :基本階層復号部
22 :拡張階層復号部
23 :領域合成部
24 :階層合成部
30 :放送伝送路
40 :通信伝送路
100 :映像伝送システム
151a :サブエンコーダ
151b :サブエンコーダ
151c :サブエンコーダ
152 :ストリーム合成部
221 :ストリーム分離部
222a :サブデコーダ
222b :サブデコーダ
222c :サブデコーダ
1: Encoding device 2: Decoding
Claims (7)
前記入力映像に含まれる主たる映像領域の位置及び大きさを指定する切り出し制御情報を出力する切り出し位置指定部と、
前記切り出し制御情報に基づいて、前記入力映像に含まれる前記主たる映像領域を切り出す領域切り出し部と、
前記入力映像を構成する前記主たる映像領域以外の映像領域を複数のサブピクチャに分割する領域分割部と、
前記領域切り出し部が出力する前記主たる映像領域を符号化し、符号化された前記主たる映像のみの基本階層符号化ストリームを出力する基本階層符号化部と、
前記領域分割部が出力する前記複数のサブピクチャのそれぞれを符号化し、前記基本階層符号化ストリームと組み合わせて利用可能な拡張階層符号化ストリームを出力する拡張階層符号化部と、を備えることを特徴とする符号化装置。 1. An encoding device that cuts out an input video into a plurality of videos and hierarchically encodes the plurality of cut out videos, comprising:
a cut-out position designation unit that outputs cut-out control information that designates a position and a size of a main image area included in the input image;
an area cutout unit that cuts out the main image area included in the input image based on the cutout control information;
an area dividing unit that divides an image area other than the main image area constituting the input image into a plurality of sub-pictures;
a base hierarchical encoding unit that encodes the main video area output by the area extraction unit and outputs a base hierarchical encoded stream including only the encoded main video;
an extension hierarchical coding unit that codes each of the plurality of sub-pictures output by the region division unit and outputs an extension hierarchical coding stream that can be used in combination with the base hierarchical coding stream.
前記複数のサブピクチャをそれぞれ符号化する複数のサブエンコーダと、
前記複数のサブエンコーダが出力する複数の符号化ストリームと、前記切り出し位置指定部が出力する前記切り出し制御情報とを合成し、前記拡張階層符号化ストリームを出力するストリーム合成部と、を含むことを特徴とする請求項1に記載の符号化装置。 The enhancement hierarchical coding unit includes:
a plurality of sub-encoders each encoding the plurality of sub-pictures;
2. The encoding device according to claim 1, further comprising: a stream synthesis unit that synthesizes a plurality of encoded streams output by the plurality of sub-encoders and the cut-out control information output by the cut-out position designation unit, and outputs the extended hierarchical encoded stream.
基本階層符号化ストリームを復号し、入力映像に含まれる主たる映像領域を出力する基本階層復号部と、
前記基本階層符号化ストリームと組み合わせて利用可能な拡張階層符号化ストリームを復号し、前記入力映像のうち前記主たる映像領域以外の映像領域を構成する複数のサブピクチャを出力する拡張階層復号部と、
前記拡張階層復号部が出力する前記複数のサブピクチャを合成し、前記主たる映像領域以外の映像領域を出力する領域合成部と、
前記基本階層復号部が出力する前記主たる映像領域と、前記領域合成部が出力する前記主たる映像領域以外の映像領域とを合成し、前記入力映像を復元する階層合成部と、を備えることを特徴とする復号装置。 A decoding device that decodes a coded stream obtained by hierarchical coding, comprising:
a base layer decoding unit that decodes the base layer encoded stream and outputs a main video area included in the input video;
an enhancement layer decoding unit that decodes an enhancement layer coded stream that can be used in combination with the base layer coded stream, and outputs a plurality of sub-pictures that constitute an image area other than the main image area of the input image;
a region synthesis unit that synthesizes the plurality of sub-pictures output by the enhancement layer decoding unit and outputs a video region other than the main video region;
A decoding device characterized by comprising a hierarchical synthesis unit that synthesizes the main video area output by the base hierarchical decoding unit with a video area other than the main video area output by the area synthesis unit to restore the input video.
前記拡張階層符号化ストリームを、前記複数のサブピクチャに対応する複数の符号化ストリームと、前記主たる映像領域の位置及び大きさを指定する切り出し制御情報とに分離するストリーム分離部と、
前記複数の符号化ストリームから前記複数のサブピクチャをそれぞれ復号する複数のサブデコーダと、を含み、
前記領域合成部は、前記切り出し制御情報に基づいて前記複数のサブピクチャを合成し、前記主たる映像領域以外の映像領域を出力することを特徴とする請求項3に記載の復号装置。 The enhancement layer decoding unit
a stream separator that separates the enhancement hierarchical coded stream into a plurality of coded streams corresponding to the plurality of sub-pictures and cut-out control information that specifies a position and a size of the main video area;
a plurality of sub-decoders each decoding the plurality of sub-pictures from the plurality of encoded streams,
4. The decoding device according to claim 3, wherein the area synthesis unit synthesizes the plurality of sub-pictures based on the cut-out control information, and outputs an image area other than the main image area.
前記符号化ストリームと組み合わせて利用可能な符号化ストリームを復号し、前記入力映像のうち前記第1映像領域以外の映像領域を構成する1つ以上のサブピクチャを出力する第2復号部と、
前記第1映像領域の位置及び大きさを指定する制御情報を取得する取得部と、
前記制御情報に基づいて、前記第1復号部が出力する前記第1映像領域と、前記第2復号部が出力する前記1つ以上のサブピクチャとを合成し、前記入力映像を復元する合成部と、を備えることを特徴とする復号装置。 a first decoding unit that decodes the encoded stream and outputs a first video region included in the input video;
a second decoding unit that decodes an encoded stream that can be used in combination with the encoded stream, and outputs one or more sub-pictures that constitute an image area of the input video other than the first image area;
an acquisition unit that acquires control information that specifies a position and a size of the first video area;
a synthesis unit that synthesizes the first video area output by the first decoding unit and the one or more sub-pictures output by the second decoding unit based on the control information to restore the input video.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020112196A JP7591878B2 (en) | 2020-06-29 | 2020-06-29 | Encoding device, decoding device, and program |
JP2024201690A JP2025019108A (en) | 2020-06-29 | 2024-11-19 | Decoding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020112196A JP7591878B2 (en) | 2020-06-29 | 2020-06-29 | Encoding device, decoding device, and program |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024201690A Division JP2025019108A (en) | 2020-06-29 | 2024-11-19 | Decoding device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022011207A JP2022011207A (en) | 2022-01-17 |
JP7591878B2 true JP7591878B2 (en) | 2024-11-29 |
Family
ID=80148082
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020112196A Active JP7591878B2 (en) | 2020-06-29 | 2020-06-29 | Encoding device, decoding device, and program |
JP2024201690A Pending JP2025019108A (en) | 2020-06-29 | 2024-11-19 | Decoding device |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024201690A Pending JP2025019108A (en) | 2020-06-29 | 2024-11-19 | Decoding device |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7591878B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008538057A (en) | 2005-03-18 | 2008-10-02 | シャープ株式会社 | Method and system for image level adaptation in extended spatial scalability |
JP2016519517A (en) | 2013-04-08 | 2016-06-30 | ソニー株式会社 | Scalability of attention area in SHVC |
WO2020056247A1 (en) | 2018-09-14 | 2020-03-19 | Vid Scale, Inc. | Methods and apparatus for flexible grid regions |
JP2022543627A (en) | 2019-08-06 | 2022-10-13 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Drawing surface size expandable video coding |
-
2020
- 2020-06-29 JP JP2020112196A patent/JP7591878B2/en active Active
-
2024
- 2024-11-19 JP JP2024201690A patent/JP2025019108A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008538057A (en) | 2005-03-18 | 2008-10-02 | シャープ株式会社 | Method and system for image level adaptation in extended spatial scalability |
JP2016519517A (en) | 2013-04-08 | 2016-06-30 | ソニー株式会社 | Scalability of attention area in SHVC |
WO2020056247A1 (en) | 2018-09-14 | 2020-03-19 | Vid Scale, Inc. | Methods and apparatus for flexible grid regions |
JP2022500914A (en) | 2018-09-14 | 2022-01-04 | ヴィド スケール インコーポレイテッド | Methods and equipment for flexible grid regions |
JP2022543627A (en) | 2019-08-06 | 2022-10-13 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Drawing surface size expandable video coding |
Also Published As
Publication number | Publication date |
---|---|
JP2022011207A (en) | 2022-01-17 |
JP2025019108A (en) | 2025-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12081797B2 (en) | Coding and decoding of interleaved image data | |
US20210105449A1 (en) | Method and system for encoding a video data signal, encoded video data signal, method and system for decoding a video data signal | |
US8773584B2 (en) | Playback apparatus, playback method, integrated circuit, broadcast system, and broadcast method using a broadcast video and additional video | |
KR101353115B1 (en) | Method of encoding video content | |
JPWO2012111325A1 (en) | Video encoding apparatus, video encoding method, video encoding program, video playback apparatus, video playback method, and video playback program | |
KR20180009725A (en) | Method and apparatus for providing 360 degree virtual reality broadcasting services | |
WO2013015116A1 (en) | Encoding device and encoding method, and decoding device and decoding method | |
WO2013099289A1 (en) | Playback device, transmission device, playback method and transmission method | |
JP6008292B2 (en) | Video stream video data creation device and playback device | |
JP7591878B2 (en) | Encoding device, decoding device, and program | |
KR102219419B1 (en) | 3d broadcast service provding method and apparatus, and 3d broadcast service reproduction method and apparatus for using image of asymmetric aspect ratio | |
WO2009136681A1 (en) | Method for encoding and decoding image, and apparatus for displaying image | |
JP2022094631A (en) | Dynamic image encoding device, dynamic image decoding device, dynamic image encoding method, and dynamic image decoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230529 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240520 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240910 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241021 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7591878 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |