[go: up one dir, main page]

JP7591878B2 - Encoding device, decoding device, and program - Google Patents

Encoding device, decoding device, and program Download PDF

Info

Publication number
JP7591878B2
JP7591878B2 JP2020112196A JP2020112196A JP7591878B2 JP 7591878 B2 JP7591878 B2 JP 7591878B2 JP 2020112196 A JP2020112196 A JP 2020112196A JP 2020112196 A JP2020112196 A JP 2020112196A JP 7591878 B2 JP7591878 B2 JP 7591878B2
Authority
JP
Japan
Prior art keywords
unit
video
area
sub
hierarchical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020112196A
Other languages
Japanese (ja)
Other versions
JP2022011207A (en
Inventor
菊文 神田
敦郎 市ヶ谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2020112196A priority Critical patent/JP7591878B2/en
Publication of JP2022011207A publication Critical patent/JP2022011207A/en
Priority to JP2024201690A priority patent/JP2025019108A/en
Application granted granted Critical
Publication of JP7591878B2 publication Critical patent/JP7591878B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、符号化装置、復号装置、及びプログラムに関する。 The present invention relates to an encoding device, a decoding device, and a program.

大画面且つ高精細な映像を用いたサービスの実現が期待されているが、高精細な映像はデータの量が膨大となるため、伝送をともなうサービスには広帯域な伝送路が必要となる。伝送に電波を用いる場合、周波数帯域が限られるため、伝送帯域に応じて映像データを圧縮符号化する技術が用いられる。 There is hope for services that use large-screen, high-definition video, but high-definition video requires a huge amount of data, so services that involve transmission require broadband transmission paths. When using radio waves for transmission, the frequency band is limited, so technology is used to compress and encode video data according to the transmission band.

しかし、圧縮符号化は符号化劣化を引き起こし、圧縮率が大きいほど劣化も大きくなる。このため、サービスに適する品質を得るための圧縮率には限度があり、例えば、地上波(6MHzの伝送帯域幅)で8Kの放送を行おうとすると、十分な画質が得られず、このままではサービスを提供できない。 However, compression encoding causes encoding degradation, and the higher the compression rate, the greater the degradation. For this reason, there is a limit to the compression rate required to obtain quality suitable for a service. For example, if you try to broadcast 8K over terrestrial waves (6 MHz transmission bandwidth), you will not be able to obtain sufficient image quality, and the service cannot be provided as it is.

十分な伝送帯域が確保できない条件では、映像の解像度を下げることで符号化劣化の発生は抑えることができるが、この場合はサービスそのものの品質が下がることとなる。例えば、8Kの映像を4Kにダウンコンバートして放送すれば、当然サービスは4Kの品質となる。 When sufficient transmission bandwidth cannot be secured, encoding degradation can be suppressed by lowering the video resolution, but this will result in a decrease in the quality of the service itself. For example, if 8K video is down-converted to 4K and broadcast, the service will naturally have 4K quality.

そこで、付加的な伝送手段を用いて、補完情報を別途伝送し、これらの伝送路で送られてきたデータを共に用いることで高い品質の映像を得ることを考える。つまり、伝送帯域の限られる地上波では4Kのサービスを行い、別の伝送路で付加情報を伝送し、これと4Kのデータを組み合わせて8Kの映像を得ることを考える。このようなサービス形態を実現する手段として階層符号化を用いることが考えられる(例えば、特許文献1参照)。なお、階層符号化は、スケーラブル符号化と呼ばれることもある。 Therefore, it is considered that high quality video can be obtained by separately transmitting complementary information using additional transmission means and using the data sent over these transmission paths together. In other words, 4K service can be provided over terrestrial broadcasting, which has a limited transmission bandwidth, and additional information can be transmitted over a separate transmission path, which can then be combined with the 4K data to obtain 8K video. One possible method for achieving this type of service is to use hierarchical coding (see, for example, Patent Document 1). Note that hierarchical coding is also sometimes called scalable coding.

階層符号化では、基本階層と拡張階層とを組み合わせると高品質な映像が再生でき、基本階層単独でも品質は落ちるが映像の再生が可能である。階層符号化を実現する技術として、これまでにいくつかの手法が提案されている。前述の4Kと8Kのような画素数(解像度)の異なる映像をスケーラブルに符号化する方法としては、空間階層符号化と呼ばれる方法がある。 In hierarchical coding, high-quality video can be reproduced by combining the base layer and the enhancement layer, and video can be reproduced using the base layer alone, although the quality will be reduced. Several techniques have been proposed to achieve hierarchical coding. One method for scalably encoding video with different numbers of pixels (resolutions), such as the aforementioned 4K and 8K, is called spatial hierarchical coding.

また、映像信号を粗い情報から細かい情報へと階層的に符号化する技術も知られている。(例えば、特許文献2参照) There is also a known technology that hierarchically encodes video signals from coarse information to fine information (see, for example, Patent Document 2).

特開2017-135522号公報JP 2017-135522 A 特開2011-244403号公報JP 2011-244403 A

空間階層符号化では、例えば、解像度の低い4K映像をアップコンバートして8K映像を生成し、4K映像から8K映像を生成するための付加情報を拡張階層として伝送するため、予測精度が悪く、符号化効率が低いことが課題とされている。特に、地上波を用いた放送など、高い圧縮率となる場合に、この傾向は顕著である。 In spatial hierarchical coding, for example, low-resolution 4K video is upconverted to generate 8K video, and additional information for generating 8K video from the 4K video is transmitted as an extension layer, resulting in poor prediction accuracy and low coding efficiency. This tendency is particularly noticeable in cases where a high compression rate is required, such as terrestrial broadcasting.

このため、伝送帯域が限られる中で空間階層符号化を用いて十分な品質の8K映像を得るためには、4Kに対して8Kを得るために必要な付加情報が増加する。したがって、階層符号化を用いずに4Kと8Kの映像をそのまま伝送する場合と比較して、同じ品質を得るために必要な伝送路容量がほとんど変わらないといったことも予想され、階層符号化を採用するメリットは小さいと考えられる。 For this reason, in order to obtain 8K video of sufficient quality using spatial hierarchical coding within a limited transmission bandwidth, the amount of additional information required to obtain 8K will increase compared to 4K. Therefore, it is expected that there will be almost no change in the transmission path capacity required to obtain the same quality compared to transmitting 4K and 8K video as is without using hierarchical coding, and the benefits of adopting hierarchical coding are considered to be small.

よって、従来の階層符号化は有用であるものの、条件によっては符号化効率が悪いという課題があった。 Thus, although conventional hierarchical coding is useful, there is the problem that the coding efficiency is poor under certain conditions.

そこで、本発明は、階層符号化における符号化効率を改善する符号化装置、復号装置、及びプログラムを提供することを目的とする。 The present invention aims to provide an encoding device, a decoding device, and a program that improve the coding efficiency in hierarchical coding.

第1の態様に係る符号化装置は、入力映像を複数の映像に切り出し、切り出された前記複数の映像を階層的に符号化する装置である。前記符号化装置は、前記入力映像に含まれる主たる映像領域の位置及び大きさを指定する切り出し制御情報を出力する切り出し位置指定部と、前記切り出し制御情報に基づいて、前記入力映像に含まれる前記主たる映像領域を切り出す領域切り出し部と、前記入力映像を構成する前記主たる映像領域以外の映像領域を複数のサブピクチャに分割する領域分割部と、前記領域切り出し部が出力する前記主たる映像領域を符号化し、符号化された前記主たる映像のみの基本階層符号化ストリームを出力する基本階層符号化部と、前記領域分割部が出力する前記複数のサブピクチャのそれぞれを符号化し、前記基本階層符号化ストリームと組み合わせて利用可能な拡張階層符号化ストリームを出力する拡張階層符号化部とを備える。 The encoding device according to the first aspect is a device that cuts out an input video into a plurality of videos and hierarchically encodes the plurality of cut out videos. The encoding device includes a cut-out position designation unit that outputs cut-out control information that designates the position and size of a main video area included in the input video, a region cut-out unit that cuts out the main video area included in the input video based on the cut-out control information, a region division unit that divides a video area other than the main video area that constitutes the input video into a plurality of sub-pictures, a base hierarchical encoding unit that encodes the main video area output by the region cut-out unit and outputs a base hierarchical encoding stream of only the encoded main video, and an extension hierarchical encoding unit that encodes each of the plurality of sub-pictures output by the region division unit and outputs an extension hierarchical encoding stream that can be used in combination with the base hierarchical encoding stream.

第2の態様に係る復号装置は、階層符号化により得られた符号化ストリームを復号する装置である。前記復号装置は、基本階層符号化ストリームを復号し、入力映像に含まれる主たる映像領域を出力する基本階層復号部と、前記基本階層符号化ストリームと組み合わせて利用可能な拡張階層符号化ストリームを復号し、前記入力映像のうち前記主たる映像領域以外の映像領域を構成する複数のサブピクチャを出力する拡張階層復号部と、前記拡張階層復号部が出力する前記複数のサブピクチャを合成し、前記主たる映像領域以外の映像領域を出力する領域合成部と、前記基本階層復号部が出力する前記主たる映像領域と、前記領域合成部が出力する前記主たる映像領域以外の映像領域とを合成し、前記入力映像を復元する階層合成部とを備える。 The decoding device according to the second aspect is a device that decodes an encoded stream obtained by hierarchical encoding. The decoding device includes a base hierarchical decoding unit that decodes a base hierarchical encoded stream and outputs a main video area included in an input video, an extension hierarchical decoding unit that decodes an extension hierarchical encoded stream that can be used in combination with the base hierarchical encoded stream and outputs a plurality of sub-pictures that constitute a video area other than the main video area of the input video, a region synthesis unit that synthesizes the plurality of sub-pictures output by the extension hierarchical decoding unit and outputs a video area other than the main video area, and a hierarchical synthesis unit that synthesizes the main video area output by the base hierarchical decoding unit and the video area other than the main video area output by the region synthesis unit to restore the input video.

第3の態様に係るプログラムは、コンピュータを第1の態様に係る符号化装置として機能させる。 The program according to the third aspect causes a computer to function as the encoding device according to the first aspect.

第4の態様に係るプログラムは、コンピュータを第2の態様に係る復号装置として機能させる。 The program according to the fourth aspect causes a computer to function as a decryption device according to the second aspect.

本発明によれば、階層符号化における符号化効率を改善する符号化装置、復号装置、及びプログラムを提供できる。 The present invention provides an encoding device, a decoding device, and a program that improve the coding efficiency in hierarchical coding.

実施形態に係る映像伝送システムの構成を示す図である。1 is a diagram showing a configuration of a video transmission system according to an embodiment. 実施形態に係る符号化装置の構成を示す図である。FIG. 1 is a diagram illustrating a configuration of an encoding device according to an embodiment. 実施形態に係る切り出し位置の指定方法を示す図である。11A to 11C are diagrams illustrating a method for specifying a cut-out position according to the embodiment. 実施形態に係る領域分割部における第1の分割例を示す図である。FIG. 4 is a diagram illustrating a first division example in an area dividing section according to the embodiment. 実施形態に係る領域分割部における第2の分割例を示す図である。FIG. 13 is a diagram illustrating a second division example in the region dividing unit according to the embodiment. 実施形態に係る領域分割部における第3の分割例を示す図である。FIG. 13 is a diagram illustrating a third example of division in the region dividing unit according to the embodiment. 実施形態に係る拡張階層符号化部の構成を示す図である。FIG. 2 is a diagram illustrating a configuration of an extension hierarchical encoding unit according to the embodiment. 実施形態に係る復号装置の構成を示す図である。FIG. 2 is a diagram illustrating a configuration of a decoding device according to an embodiment. 実施形態に係る拡張階層復号部の構成を示す図である。FIG. 13 is a diagram illustrating a configuration of an enhancement layer decoding unit according to the embodiment.

図面を参照して、実施形態に係る符号化装置及び復号装置について説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。 The encoding device and the decoding device according to the embodiment will be described with reference to the drawings. In the following description of the drawings, the same or similar parts are denoted by the same or similar reference numerals.

(映像伝送システム)
まず、実施形態に係る映像伝送システムについて説明する。図1は、実施形態に係る映像伝送システム100の構成を示す図である。
(Video Transmission System)
First, a video transmission system according to an embodiment will be described. Fig. 1 is a diagram showing a configuration of a video transmission system 100 according to an embodiment.

図1に示すように、映像伝送システム100は、送信装置10と、受信装置20Aと、受信装置20Bとを有する。送信装置10は、伝送路を介して受信装置20A及び20Bに対する映像伝送を行う。送信装置10は、入力映像に対して階層符号化を行う符号化装置1を有する。以下において、伝送する映像が8Kの映像である場合について例示するが、必ずしも8Kに限定する必要はない。 As shown in FIG. 1, the video transmission system 100 has a transmitting device 10, a receiving device 20A, and a receiving device 20B. The transmitting device 10 transmits video to the receiving devices 20A and 20B via a transmission path. The transmitting device 10 has an encoding device 1 that performs hierarchical encoding on input video. In the following, an example is given of the case where the video to be transmitted is an 8K video, but it is not necessarily limited to 8K.

符号化装置1は、階層符号化により基本階層符号化ストリーム及び拡張階層符号化ストリームを出力する。図1に示す例において、送信装置10は、放送伝送路30を介して基本階層符号化ストリームを受信装置20A及び20Bに送信する。例えば、放送伝送路30は、地上波を用いる伝送路である。送信装置10は、伝送帯域の限られる地上波で4Kの映像伝送サービスを提供する。 The encoding device 1 outputs a base hierarchically encoded stream and an extended hierarchically encoded stream by hierarchical encoding. In the example shown in FIG. 1, the transmitting device 10 transmits the base hierarchically encoded stream to the receiving devices 20A and 20B via the broadcast transmission path 30. For example, the broadcast transmission path 30 is a transmission path that uses terrestrial waves. The transmitting device 10 provides a 4K video transmission service using terrestrial waves, which have a limited transmission band.

また、送信装置10は、通信伝送路40を介して拡張階層符号化ストリームを受信装置20Bに送信する。例えば、通信伝送路40は、インターネットなどの有線通信回線である。送信装置10は、付加的な伝送手段を用いて、補完情報としての拡張階層符号化ストリームを別途伝送する。 The transmitting device 10 also transmits the enhanced hierarchical coding stream to the receiving device 20B via the communication transmission path 40. For example, the communication transmission path 40 is a wired communication line such as the Internet. The transmitting device 10 separately transmits the enhanced hierarchical coding stream as complementary information using an additional transmission means.

受信装置20Aは、放送伝送路30を介して基本階層符号化ストリームを受信する。受信装置20Aは、基本階層符号化ストリームから4Kの映像を復号する復号装置2Aを有する。受信装置20Aは、基本階層符号化ストリームにより、品質は落ちるものの映像の再生が可能である。 The receiving device 20A receives the base hierarchical encoded stream via the broadcast transmission path 30. The receiving device 20A has a decoding device 2A that decodes 4K video from the base hierarchical encoded stream. The receiving device 20A is able to play video from the base hierarchical encoded stream, although the quality is reduced.

受信装置20Bは、放送伝送路30を介して基本階層符号化ストリームを受信するとともに、通信伝送路40を介して拡張階層符号化ストリームを受信する。受信装置20Bは、基本階層符号化ストリームと拡張階層符号化ストリームとを組み合わせて8Kの映像を復号する復号装置2Bを有する。受信装置20Bは、基本階層と拡張階層とを組み合わせて高品質な映像を再生可能である。 The receiving device 20B receives the base layer encoded stream via the broadcast transmission path 30, and receives the extension layer encoded stream via the communication transmission path 40. The receiving device 20B has a decoding device 2B that combines the base layer encoded stream and the extension layer encoded stream to decode 8K video. The receiving device 20B can play back high-quality video by combining the base layer and the extension layer.

このようにして、映像伝送システム100は、階層符号化により4K及び8Kの映像伝送を行う。ここで、8Kのような大画面且つ高精細な映像サービスの場合、視聴者は画面全体を均等に注視し続けているわけではなく、通常は画面のある部分を中心に意識を集中させながら視聴することが一般的であると考えられる。 In this way, the video transmission system 100 transmits 4K and 8K video using hierarchical coding. Here, in the case of a large-screen, high-definition video service such as 8K, it is considered that viewers do not keep their eyes evenly fixed on the entire screen, but rather typically concentrate on a certain part of the screen while watching.

その点を考慮すれば、8Kから4Kの映像を生成する際には、全画面を縮小する必要はなく、重要情報が集中している注目部分を含むように4K映像を(縮小することなく)切り出すことで、十分に情報を伝えることが可能である。 With this in mind, when generating 4K video from 8K, there is no need to reduce the entire screen; by cropping the 4K video (without reducing it) to include the focal part where the important information is concentrated, it is possible to convey sufficient information.

実施形態に係る送信装置10の符号化装置1は、8Kの映像内の主たる映像領域(以下、「基本階層領域」と呼ぶ)を切り出すことで4Kの映像を生成し、切り出した4Kの基本階層領域を階層符号化における基本階層に用い、残りの領域(以下、「基本階層領域」と呼ぶ)を拡張階層として伝送する。これにより、4K映像のサービスを行いながら、符号化効率を低下させずに8K映像のサービスを行うことが可能となる。 The encoding device 1 of the transmission device 10 according to the embodiment generates 4K video by extracting the main video area (hereinafter referred to as the "base layer area") from the 8K video, uses the extracted 4K base layer area as the base layer in the hierarchical encoding, and transmits the remaining area (hereinafter referred to as the "base layer area") as an enhancement layer. This makes it possible to provide 8K video services without reducing encoding efficiency while providing 4K video services.

ここで、4Kの基本階層領域を切り出す位置は、固定されていてもよいし、フレームごとに変更しても構わない。また、基本階層領域として、8Kの映像から4Kの映像を切り出す場合を例示するが、基本階層を表示する装置の性能にあわせるなど、基本階層領域の大きさを変更しても構わない。 The position where the 4K basic layer area is cut out may be fixed or may be changed for each frame. Also, an example of a basic layer area where 4K video is cut out from 8K video is shown, but the size of the basic layer area may be changed to suit the performance of the device that displays the basic layer.

受信装置20Aの復号装置2Aは、基本階層復号ストリームを復号し、4Kの基本階層の映像を得る。一方、受信装置20Bの復号装置2Bは、基本階層ストリームから基本階層領域を復号するとともに、拡張階層ストリームから拡張階層領域を復号し、基本階層領域と拡張階層領域とを合成して8Kの映像を得る。このようにして、4Kの映像と8Kの映像をそれぞれ得ることができる。 Decoding device 2A of receiving device 20A decodes the base layer decoded stream to obtain 4K base layer video. Meanwhile, decoding device 2B of receiving device 20B decodes the base layer region from the base layer stream and decodes the enhancement layer region from the enhancement layer stream, and combines the base layer region and the enhancement layer region to obtain 8K video. In this way, 4K video and 8K video can be obtained.

よって、実施形態に係る映像伝送システム100によれば、符号化効率を低下させずに、4K(基本階層)及び8K(基本階層+拡張階層)の映像を両立させることで、多様で高品質なサービスの実現が期待できる。これを用いて、帯域の狭い地上波で4Kを放送し、インターネットなどの有線通信で付加情報を送信するといった方法で、4Kと8Kの階層的なサービスを実現することができる。 Therefore, according to the video transmission system 100 according to the embodiment, it is possible to realize diverse and high-quality services by achieving both 4K (base layer) and 8K (base layer + enhanced layer) video without reducing the encoding efficiency. Using this, it is possible to realize hierarchical services of 4K and 8K by broadcasting 4K on narrow-band terrestrial waves and transmitting additional information via wired communication such as the Internet.

(符号化装置)
次に、実施形態に係る符号化装置について説明する。図2は、実施形態に係る符号化装置1の構成を示す図である。
(Encoding device)
Next, a coding device according to an embodiment will be described. Fig. 2 is a diagram showing a configuration of a coding device 1 according to an embodiment.

図2に示すように、符号化装置1は、切り出し位置指定部11と、領域切り出し部12と、基本階層符号化部13と、領域分割部14と、拡張階層符号化部15とを有する。 As shown in FIG. 2, the encoding device 1 has a cutout position designation unit 11, a region cutout unit 12, a base hierarchical encoding unit 13, a region division unit 14, and an extended hierarchical encoding unit 15.

切り出し位置指定部11は、基本階層領域の位置及び大きさを指定する切り出し制御情報を、領域切り出し部12、領域分割部14、及び拡張階層符号化部15に出力する。ここで、切り出し位置の決定にあたっては、基本階層領域に重要な情報が含まれるように番組制作時に配慮することが望ましい。或いは、8K映像から重要情報として切り出す領域を判定する手段を別途用いて指定することも可能である。 The cut-out position designation unit 11 outputs cut-out control information that designates the position and size of the base hierarchical layer region to the region cut-out unit 12, the region division unit 14, and the extended hierarchical coding unit 15. When determining the cut-out position, it is desirable to take care during program production so that important information is included in the base hierarchical layer region. Alternatively, it is also possible to designate the cut-out position using a separate means for determining the region to be cut out as important information from the 8K video.

図3は、実施形態に係る切り出し位置の指定方法を示す図である。図3に示すように、切り出し位置指定部11は、8Kの入力映像から切り出す4Kの基本階層領域の位置及び大きさを切り出し制御情報として指定する。例えば、切り出し位置指定部11は、基本階層領域の左上の座標値(x,y)及び水平垂直の画素数(w、h)を切り出し制御情報として出力する。 Figure 3 is a diagram showing a method for specifying a cut-out position according to an embodiment. As shown in Figure 3, the cut-out position specification unit 11 specifies the position and size of a 4K basic layer area to be cut out from an 8K input video as cut-out control information. For example, the cut-out position specification unit 11 outputs the coordinate values (x, y) of the top left corner of the basic layer area and the number of horizontal and vertical pixels (w, h) as the cut-out control information.

ここで、切り出し位置は、固定でも構わないし、映像コンテンツの内容に応じて変化させても構わない。座標値の指定は、コンテンツ制作時に決定した値を入力してもよいし、入力映像から自動的に検出して指定する方法を備えても構わない。例えば、切り出し位置指定部11は、入力映像に対する顔認識処理等により、8K映像から重要情報として切り出す基本階層領域を指定してもよい。切り出す基本階層領域の大きさについても、映像コンテンツの内容に応じて変化させても構わない。 Here, the cut-out position may be fixed or may be changed according to the content of the video content. The coordinate values may be specified by inputting values determined at the time of content production, or a method of automatically detecting and specifying from the input video may be provided. For example, the cut-out position specification unit 11 may specify a basic hierarchical region to be cut out from the 8K video as important information by face recognition processing on the input video. The size of the basic hierarchical region to be cut out may also be changed according to the content of the video content.

また、4Kの基本階層領域の長辺が8Kの入力映像の長辺と平行になるように基本階層領域を配置する一例を示しているが、必ずしも平行でなくてもよく、基本階層領域が水平方向に対して傾きを有していてもよい。ただし、平行ではない場合、後述する拡張階層の分割方法や符号化処理はより複雑になる。 In addition, an example is shown in which the base layer area is positioned so that the long side of the 4K base layer area is parallel to the long side of the 8K input video, but this does not necessarily have to be parallel, and the base layer area may be tilted relative to the horizontal direction. However, if they are not parallel, the division method and encoding process of the enhancement layer, which will be described later, will become more complicated.

領域切り出し部12は、切り出し位置指定部11が出力する切り出し制御情報、すなわち、座標値(x,y)及び領域の大きさ(w、h)に基づいて、入力映像から基本階層領域を切り出し、切り出した基本階層領域を基本階層符号化部13及び領域分割部14に出力する。 The area cutout unit 12 cuts out a base layer area from the input video based on the cutout control information output by the cutout position designation unit 11, i.e., the coordinate values (x, y) and the area size (w, h), and outputs the cut out base layer area to the base layer coding unit 13 and the area division unit 14.

基本階層符号化部13は、領域切り出し部12が出力する基本階層領域を符号化し、単独で利用可能な基本階層符号化ストリームを出力する。基本階層符号化部13が用いる符号化方式は任意の方式で構わない。 The base layer coding unit 13 codes the base layer region output by the region extraction unit 12 and outputs a base layer coded stream that can be used independently. The coding method used by the base layer coding unit 13 may be any method.

領域分割部14は、切り出し位置指定部11が出力する切り出し制御情報に基づいて、入力映像のうち基本階層領域以外の拡張階層領域を、拡張階層符号化部15で符号化が可能な形状の領域に分割する。分割されたこれらの領域をそれぞれ「サブピクチャ」と呼ぶ。一般的な符号化方式では長方形の領域を入力として符号化を行うことを考慮し、各サブピクチャの形状は長方形であるものとする。分割の方法は事前に決定しておいてもよいし、コンテンツ内容等に応じて変更し、分割方法をその都度ストリームに多重するなどの方法によって復号側に伝えるとしてもよい。 Based on the cut-out control information output by the cut-out position designation unit 11, the region division unit 14 divides the extended hierarchical region other than the base hierarchical region of the input video into regions of shapes that can be encoded by the extended hierarchical encoding unit 15. Each of these divided regions is called a "sub-picture." Considering that a typical encoding method involves encoding a rectangular region as input, the shape of each sub-picture is assumed to be rectangular. The division method may be determined in advance, or may be changed depending on the content, etc., and the division method may be communicated to the decoding side by a method such as multiplexing the stream each time.

図4は、実施形態に係る領域分割部14における第1の分割例を示す図である。 Figure 4 shows a first example of division in the region division unit 14 according to the embodiment.

図4に示すように、第1の分割例では、基本階層領域の垂直の辺を延長することによって基本階層領域以外の拡張階層領域を4つのサブピクチャに分割する。分割された矩形の領域、つまりサブピクチャをA、B、C、Dとする。サブピクチャA、B、C、Dのそれぞれの形状(水平、垂直画素数)は、切り出し制御情報として指定される値(x,y,w,h)が決まれば一意に決定される。つまり、「垂直の辺を延長することによって分割する」という分割方法が指定されていれば、サブピクチャA、B、C、Dの順番と(x,y,w,h)の情報のみによって、元の映像を復元することが可能である。 As shown in Figure 4, in the first division example, the extended hierarchical area other than the base hierarchical area is divided into four sub-pictures by extending the vertical sides of the base hierarchical area. The divided rectangular areas, i.e., the sub-pictures, are A, B, C, and D. The shape (horizontal and vertical pixel count) of each of the sub-pictures A, B, C, and D is uniquely determined once the values (x, y, w, h) specified as the crop control information are determined. In other words, if the division method of "dividing by extending the vertical sides" is specified, it is possible to restore the original image using only the order of the sub-pictures A, B, C, and D and the (x, y, w, h) information.

図5は、実施形態に係る領域分割部14における第2の分割例を示す図である。 Figure 5 shows a second example of division in the region division unit 14 according to the embodiment.

図5に示すように、第2の分割例では、基本階層領域の上辺を左方向に延長し、基本階層領域の左辺を下方向に延長し、基本階層領域の下辺を右方向に延長し、基本階層領域の右辺を上方向に延長することによって基本階層領域以外の領域を4つのサブピクチャに分割する。この場合でも第1の分割例と同様に、分割の方法を事前に指定しておけば、切り出し制御情報として指定される値(x,y,w,h)のみによって復元が可能となる。 As shown in Figure 5, in the second division example, the top edge of the base layer area is extended to the left, the left edge of the base layer area is extended downward, the bottom edge of the base layer area is extended to the right, and the right edge of the base layer area is extended upward, thereby dividing the area other than the base layer area into four sub-pictures. In this case, as in the first division example, if the division method is specified in advance, restoration is possible using only the values (x, y, w, h) specified as the cut-out control information.

図6は、実施形態に係る領域分割部14における第3の分割例を示す図である。 Figure 6 shows a third example of division in the region division unit 14 according to the embodiment.

図6に示すように、第3の分割例では、拡張階層領域をさらに小さい領域に分割して複数のサブピクチャを得る。例えば、同じ形状(同じサイズ)の小領域で拡張階層領域を分割できるような構成とすれば、後述の拡張階層符号化処理でのサブエンコーダをすべて同一にできるというメリットがある。ただし、拡張階層領域が水平垂直それぞれ整数個の同一の小領域で過不足なく分割できるような数値に(x,y,w,h)を限定する必要がある。 As shown in Figure 6, in the third division example, the enhancement hierarchical region is divided into smaller regions to obtain multiple sub-pictures. For example, if the enhancement hierarchical region can be divided into small regions of the same shape (same size), there is an advantage in that the sub-encoders in the enhancement hierarchical encoding process described below can all be the same. However, it is necessary to limit (x, y, w, h) to values that allow the enhancement hierarchical region to be divided into an integer number of identical small regions both horizontally and vertically, without any excess or deficiency.

拡張階層符号化部15は、領域分割部14が出力する複数のサブピクチャのそれぞれを符号化し、拡張階層符号化ストリームを出力する。図7は、実施形態に係る拡張階層符号化部15の構成を示す図である。図7に示すように、拡張階層符号化部15は、複数のサブエンコーダ151a,151b,151c・・・と、ストリーム合成部152とを有する。 The extension hierarchical coding unit 15 codes each of the multiple sub-pictures output by the region division unit 14, and outputs an extension hierarchical coding stream. FIG. 7 is a diagram showing the configuration of the extension hierarchical coding unit 15 according to an embodiment. As shown in FIG. 7, the extension hierarchical coding unit 15 has multiple sub-encoders 151a, 151b, 151c, ... and a stream synthesis unit 152.

複数のサブエンコーダ151a,151b,151c・・・は、領域分割部14が出力する複数のサブピクチャをそれぞれ符号化し、複数の符号化ストリームをストリーム合成部152に出力する。図4及び図5の例では、サブピクチャはA、B、C、Dの4つであるので、サブエンコーダも4系統を用いれば十分である。 The multiple sub-encoders 151a, 151b, 151c, etc. each encode the multiple sub-pictures output by the region division unit 14, and output the multiple encoded streams to the stream synthesis unit 152. In the example of Figures 4 and 5, there are four sub-pictures, A, B, C, and D, so it is sufficient to use four sub-encoders.

ストリーム合成部152は、複数のサブエンコーダ151a,151b,151c・・・が出力する複数の符号化ストリームと、切り出し位置指定部11が出力する切り出し制御情報とを合成し、拡張階層符号化ストリームを出力する。合成の方法は任意の手法で構わないが、切り出し制御情報、及び、どのサブピクチャに該当するストリームであるかを判別して分離することを可能とするようにする。 The stream synthesis unit 152 synthesizes the multiple encoded streams output by the multiple sub-encoders 151a, 151b, 151c, etc. with the cut-out control information output by the cut-out position specification unit 11, and outputs an extended hierarchical encoded stream. Any synthesis method may be used, but it is necessary to be able to determine the cut-out control information and which sub-picture the stream corresponds to, and separate them.

このように、実施形態に係る符号化装置1は、入力映像に対して階層符号化を行う装置であって、入力映像に含まれる主たる映像領域(基本階層領域)を切り出す領域切り出し部12と、入力映像のうち主たる映像領域以外の残りの映像領域(拡張階層領域)を複数のサブピクチャに分割する領域分割部14と、領域切り出し部12が出力する主たる映像領域を符号化し、単独で利用可能な基本階層符号化ストリームを出力する基本階層符号化部13と、領域分割部14が出力する複数のサブピクチャのそれぞれを符号化し、基本階層符号化ストリームと組み合わせて利用可能な拡張階層符号化ストリームを出力する拡張階層符号化部15とを有する。これにより、符号化効率を低下させずに、4K(基本階層)及び8K(基本階層+拡張階層)の映像を両立させることで、多様で高品質なサービスの実現が期待できる。 In this way, the encoding device 1 according to the embodiment is a device that performs hierarchical encoding on input video, and includes an area extraction unit 12 that extracts a main video area (basic hierarchical area) included in the input video, an area division unit 14 that divides the remaining video area (extended hierarchical area) of the input video other than the main video area into multiple sub-pictures, a base hierarchical encoding unit 13 that encodes the main video area output by the area extraction unit 12 and outputs a base hierarchical encoding stream that can be used alone, and an extension hierarchical encoding unit 15 that encodes each of the multiple sub-pictures output by the area division unit 14 and outputs an extension hierarchical encoding stream that can be used in combination with the base hierarchical encoding stream. This makes it possible to realize a variety of high-quality services by achieving both 4K (basic hierarchical layer) and 8K (basic hierarchical layer + extended hierarchical layer) video without reducing encoding efficiency.

(復号装置)
次に、実施形態に係る復号装置について説明する。図8は、実施形態に係る復号装置2の構成を示す図である。ここでは、復号装置2として、図1に示す復号装置2Bの構成を示している。
(Decoding device)
Next, a decoding device according to an embodiment will be described. Fig. 8 is a diagram showing the configuration of a decoding device 2 according to an embodiment. Here, as the decoding device 2, the configuration of the decoding device 2B shown in Fig. 1 is shown.

図8に示すように、復号装置2は、基本階層復号部21と、拡張階層復号部22と、領域合成部23と、階層合成部24とを有する。 As shown in FIG. 8, the decoding device 2 has a base layer decoding unit 21, an enhancement layer decoding unit 22, a region synthesis unit 23, and a layer synthesis unit 24.

基本階層復号部21は、基本階層符号化ストリームを復号し、基本階層領域を出力する。なお、復号装置2が図1に示す復号装置2Aである場合、4Kの映像である基本階層領域のみが再生されることになる。 The base layer decoding unit 21 decodes the base layer encoded stream and outputs the base layer area. Note that when the decoding device 2 is the decoding device 2A shown in FIG. 1, only the base layer area, which is a 4K video, is reproduced.

拡張階層復号部22は、拡張階層符号化ストリームを復号し、拡張階層領域を構成する複数のサブピクチャと切り出し制御情報とを出力する。図9は、実施形態に係る拡張階層復号部22の構成を示す図である。図9に示すように、拡張階層復号部22は、ストリーム分離部221と、複数のサブデコーダ222a,222b,222c・・・とを有する。 The enhancement layer decoding unit 22 decodes the enhancement layer encoded stream and outputs a plurality of sub-pictures constituting the enhancement layer area and cutout control information. FIG. 9 is a diagram showing the configuration of the enhancement layer decoding unit 22 according to an embodiment. As shown in FIG. 9, the enhancement layer decoding unit 22 has a stream separation unit 221 and a plurality of sub-decoders 222a, 222b, 222c, etc.

ストリーム分離部221は、拡張階層符号化ストリームを、複数のサブピクチャに対応する複数の符号化ストリームと切り出し制御情報とに分離し、複数の符号化ストリームを複数のサブデコーダ222a,222b,222c・・・に出力するとともに、切り出し制御情報を領域合成部23及び階層合成部24に出力する。ここで、ストリームを分離して該当のサブデコーダに出力する方法は、符号化装置1のストリーム合成部152での合成方法に対応した方法とする。 The stream separation unit 221 separates the enhanced hierarchical encoding stream into multiple encoding streams corresponding to multiple sub-pictures and cut-out control information, outputs the multiple encoding streams to multiple sub-decoders 222a, 222b, 222c, etc., and outputs the cut-out control information to the region synthesis unit 23 and the hierarchical synthesis unit 24. Here, the method of separating the streams and outputting them to the corresponding sub-decoders corresponds to the synthesis method used by the stream synthesis unit 152 of the encoding device 1.

複数のサブデコーダ222a,222b,222c・・・は、ストリーム分離部221が出力する複数の符号化ストリームから複数のサブピクチャをそれぞれ復号し、復号したサブピクチャを領域合成部23に出力する。 The multiple sub-decoders 222a, 222b, 222c, etc. decode multiple sub-pictures from the multiple encoded streams output by the stream separation unit 221, and output the decoded sub-pictures to the region synthesis unit 23.

領域合成部23は、拡張階層復号部22(複数のサブデコーダ222a,222b,222c・・・)が出力する複数のサブピクチャを合成し、拡張階層領域を出力する。合成の方法は、符号化装置1の領域分割部14での分割の方法に対応した方法とする。上述したように、符号化装置1における分割の方法は事前に決定しておいてもよいし、コンテンツ内容等に応じて変更し、その都度ストリームに多重するなどの方法で伝えられる方法としてもよい。サブピクチャ分割の方法及び切り出し制御情報によって合成の方法は決定されるので、それに応じて、領域合成部23が複数のサブピクチャを合成して拡張階層領域を出力する。 The region synthesis unit 23 synthesizes multiple sub-pictures output by the extension hierarchical decoding unit 22 (multiple sub-decoders 222a, 222b, 222c, ...) and outputs an extension hierarchical region. The synthesis method corresponds to the division method used by the region division unit 14 of the encoding device 1. As described above, the division method used by the encoding device 1 may be determined in advance, or may be changed depending on the content, etc., and communicated each time by multiplexing the method into the stream, for example. The synthesis method is determined by the sub-picture division method and the cut-out control information, and the region synthesis unit 23 synthesizes multiple sub-pictures accordingly to output the extension hierarchical region.

階層合成部24は、拡張階層復号部22が出力する切り出し制御情報に基づいて、基本階層復号部21が出力する基本階層領域と、領域合成部23が出力する拡張階層領域とを合成し、8Kの映像を復元して出力する。 The layer synthesis unit 24 synthesizes the base layer region output by the base layer decoding unit 21 and the extended layer region output by the region synthesis unit 23 based on the cut-out control information output by the extended layer decoding unit 22, and restores and outputs the 8K video.

このように、実施形態に係る復号装置2は、階層符号化により得られた符号化ストリームを復号する装置であって、単独で利用可能な基本階層符号化ストリームを復号し、入力映像に含まれる主たる映像領域(基本階層領域)を出力する基本階層復号部21と、基本階層符号化ストリームと組み合わせて利用可能な拡張階層符号化ストリームを復号し、入力映像のうち主たる映像領域以外の残りの映像領域(拡張階層領域)を構成する複数のサブピクチャを出力する拡張階層復号部22と、拡張階層復号部22が出力する複数のサブピクチャを合成し、残りの映像領域を出力する領域合成部23と、基本階層復号部21が出力する主たる映像領域と、領域合成部23が出力する残りの映像領域とを合成し、入力映像を復元する階層合成部24とを有する。これにより、符号化効率を低下させずに、4K(基本階層)及び8K(基本階層+拡張階層)の映像を両立させることで、多様で高品質なサービスの実現が期待できる。 In this way, the decoding device 2 according to the embodiment is a device that decodes an encoded stream obtained by hierarchical encoding, and has a base layer decoding unit 21 that decodes a base layer encoded stream that can be used alone and outputs a main video area (base layer area) included in the input video, an extension layer decoding unit 22 that decodes an extension layer encoded stream that can be used in combination with the base layer encoded stream and outputs a plurality of sub-pictures that constitute the remaining video area (extension layer area) other than the main video area of the input video, a region synthesis unit 23 that synthesizes the plurality of sub-pictures output by the extension layer decoding unit 22 and outputs the remaining video area, and a layer synthesis unit 24 that synthesizes the main video area output by the base layer decoding unit 21 and the remaining video area output by the region synthesis unit 23 to restore the input video. This makes it possible to realize a variety of high-quality services by achieving both 4K (base layer) and 8K (base layer + extension layer) video without reducing encoding efficiency.

(その他の実施形態)
実施形態において、基本階層と拡張階層とを用いて2階層として階層符号化を構成する一例について説明したが、実施形態に係る方法を再帰的に用いて3階層以上とする、或いは、他の階層符号化と組み合わせるなどの方法も考えられる。
Other Embodiments
In the embodiment, an example of configuring hierarchical coding as two layers using a base layer and an extension layer has been described, but it is also possible to use the method according to the embodiment recursively to configure three or more layers, or to combine it with other hierarchical coding methods.

通信伝送路40を利用し、受信装置20(復号装置2)側から送信装置10(符号化装置1)側へ視聴者が注目する領域の情報をフィードバックしてもよい。この場合、切り出し位置指定部11は、フィードバックされた情報に基づいて、重要情報として切り出す基本階層領域を判定してもよい。 By using the communication transmission path 40, information on the area that the viewer pays attention to may be fed back from the receiving device 20 (decoding device 2) to the transmitting device 10 (encoding device 1). In this case, the cut-out position designation unit 11 may determine the base layer area to be cut out as important information based on the fed-back information.

実施形態において、入力映像から切り出す基本階層領域が1つである一例について説明したが、領域切り出し部12は、入力映像から2以上の基本階層領域を切り出してもよい。受信装置20は、当該2以上の基本階層領域の中から復号する1つの基本階層領域を選択し、選択した基本階層領域のみを復号してもよい。 In the embodiment, an example has been described in which one base layer area is extracted from the input video, but the area extraction unit 12 may extract two or more base layer areas from the input video. The receiving device 20 may select one base layer area to decode from the two or more base layer areas, and decode only the selected base layer area.

符号化装置1が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。また、復号装置2が行う各処理をコンピュータに実行させるプログラムが提供されてもよい。プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにプログラムをインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROM等の記録媒体であってもよい。 A program may be provided that causes a computer to execute each process performed by the encoding device 1. Also, a program may be provided that causes a computer to execute each process performed by the decoding device 2. The program may be recorded on a computer-readable medium. Using a computer-readable medium, it is possible to install the program on a computer. Here, the computer-readable medium on which the program is recorded may be a non-transient recording medium. The non-transient recording medium is not particularly limited, and may be, for example, a recording medium such as a CD-ROM or a DVD-ROM.

符号化装置1が行う各処理を実行する回路を集積化し、符号化装置1を半導体集積回路(チップセット、SoC)により構成してもよい。復号装置2が行う各処理を実行する回路を集積化し、復号装置2を半導体集積回路(チップセット、SoC)により構成してもよい。 The circuits that execute the processes performed by the encoding device 1 may be integrated, and the encoding device 1 may be configured as a semiconductor integrated circuit (chip set, SoC). The circuits that execute the processes performed by the decoding device 2 may be integrated, and the decoding device 2 may be configured as a semiconductor integrated circuit (chip set, SoC).

以上、図面を参照して実施形態について詳しく説明したが、具体的な構成は上述のものに限られることはなく、要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。 The above describes the embodiment in detail with reference to the drawings, but the specific configuration is not limited to the above, and various design changes can be made without departing from the spirit of the invention.

1 :符号化装置
2 :復号装置
2A :復号装置
2B :復号装置
10 :送信装置
11 :切り出し位置指定部
12 :領域切り出し部
13 :基本階層符号化部
14 :領域分割部
15 :拡張階層符号化部
20 :受信装置
20A :受信装置
20B :受信装置
21 :基本階層復号部
22 :拡張階層復号部
23 :領域合成部
24 :階層合成部
30 :放送伝送路
40 :通信伝送路
100 :映像伝送システム
151a :サブエンコーダ
151b :サブエンコーダ
151c :サブエンコーダ
152 :ストリーム合成部
221 :ストリーム分離部
222a :サブデコーダ
222b :サブデコーダ
222c :サブデコーダ
1: Encoding device 2: Decoding device 2A: Decoding device 2B: Decoding device 10: Transmitting device 11: Cut-out position designation unit 12: Area cut-out unit 13: Base layer encoding unit 14: Area division unit 15: Enhancement layer encoding unit 20: Receiving device 20A: Receiving device 20B: Receiving device 21: Base layer decoding unit 22: Enhancement layer decoding unit 23: Area synthesis unit 24: Layer synthesis unit 30: Broadcast transmission path 40: Communication transmission path 100: Video transmission system 151a: Sub-encoder 151b: Sub-encoder 151c: Sub-encoder 152: Stream synthesis unit 221: Stream separation unit 222a: Sub-decoder 222b: Sub-decoder 222c: Sub-decoder

Claims (7)

入力映像を複数の映像に切り出し、切り出された前記複数の映像を階層的に符号化する符号化装置であって、
前記入力映像に含まれる主たる映像領域の位置及び大きさを指定する切り出し制御情報を出力する切り出し位置指定部と、
前記切り出し制御情報に基づいて、前記入力映像に含まれる前記主たる映像領域を切り出す領域切り出し部と、
前記入力映像を構成する前記主たる映像領域以外の映像領域を複数のサブピクチャに分割する領域分割部と、
前記領域切り出し部が出力する前記主たる映像領域を符号化し、符号化された前記主たる映像のみの基本階層符号化ストリームを出力する基本階層符号化部と、
前記領域分割部が出力する前記複数のサブピクチャのそれぞれを符号化し、前記基本階層符号化ストリームと組み合わせて利用可能な拡張階層符号化ストリームを出力する拡張階層符号化部と、を備えることを特徴とする符号化装置。
1. An encoding device that cuts out an input video into a plurality of videos and hierarchically encodes the plurality of cut out videos, comprising:
a cut-out position designation unit that outputs cut-out control information that designates a position and a size of a main image area included in the input image;
an area cutout unit that cuts out the main image area included in the input image based on the cutout control information;
an area dividing unit that divides an image area other than the main image area constituting the input image into a plurality of sub-pictures;
a base hierarchical encoding unit that encodes the main video area output by the area extraction unit and outputs a base hierarchical encoded stream including only the encoded main video;
an extension hierarchical coding unit that codes each of the plurality of sub-pictures output by the region division unit and outputs an extension hierarchical coding stream that can be used in combination with the base hierarchical coding stream.
前記拡張階層符号化部は、
前記複数のサブピクチャをそれぞれ符号化する複数のサブエンコーダと、
前記複数のサブエンコーダが出力する複数の符号化ストリームと、前記切り出し位置指定部が出力する前記切り出し制御情報とを合成し、前記拡張階層符号化ストリームを出力するストリーム合成部と、を含むことを特徴とする請求項1に記載の符号化装置。
The enhancement hierarchical coding unit includes:
a plurality of sub-encoders each encoding the plurality of sub-pictures;
2. The encoding device according to claim 1, further comprising: a stream synthesis unit that synthesizes a plurality of encoded streams output by the plurality of sub-encoders and the cut-out control information output by the cut-out position designation unit, and outputs the extended hierarchical encoded stream.
階層符号化により得られた符号化ストリームを復号する復号装置であって、
基本階層符号化ストリームを復号し、入力映像に含まれる主たる映像領域を出力する基本階層復号部と、
前記基本階層符号化ストリームと組み合わせて利用可能な拡張階層符号化ストリームを復号し、前記入力映像のうち前記主たる映像領域以外の映像領域を構成する複数のサブピクチャを出力する拡張階層復号部と、
前記拡張階層復号部が出力する前記複数のサブピクチャを合成し、前記主たる映像領域以外の映像領域を出力する領域合成部と、
前記基本階層復号部が出力する前記主たる映像領域と、前記領域合成部が出力する前記主たる映像領域以外の映像領域とを合成し、前記入力映像を復元する階層合成部と、を備えることを特徴とする復号装置。
A decoding device that decodes a coded stream obtained by hierarchical coding, comprising:
a base layer decoding unit that decodes the base layer encoded stream and outputs a main video area included in the input video;
an enhancement layer decoding unit that decodes an enhancement layer coded stream that can be used in combination with the base layer coded stream, and outputs a plurality of sub-pictures that constitute an image area other than the main image area of the input image;
a region synthesis unit that synthesizes the plurality of sub-pictures output by the enhancement layer decoding unit and outputs a video region other than the main video region;
A decoding device characterized by comprising a hierarchical synthesis unit that synthesizes the main video area output by the base hierarchical decoding unit with a video area other than the main video area output by the area synthesis unit to restore the input video.
前記拡張階層復号部は、
前記拡張階層符号化ストリームを、前記複数のサブピクチャに対応する複数の符号化ストリームと、前記主たる映像領域の位置及び大きさを指定する切り出し制御情報とに分離するストリーム分離部と、
前記複数の符号化ストリームから前記複数のサブピクチャをそれぞれ復号する複数のサブデコーダと、を含み、
前記領域合成部は、前記切り出し制御情報に基づいて前記複数のサブピクチャを合成し、前記主たる映像領域以外の映像領域を出力することを特徴とする請求項3に記載の復号装置。
The enhancement layer decoding unit
a stream separator that separates the enhancement hierarchical coded stream into a plurality of coded streams corresponding to the plurality of sub-pictures and cut-out control information that specifies a position and a size of the main video area;
a plurality of sub-decoders each decoding the plurality of sub-pictures from the plurality of encoded streams,
4. The decoding device according to claim 3, wherein the area synthesis unit synthesizes the plurality of sub-pictures based on the cut-out control information, and outputs an image area other than the main image area.
符号化ストリームを復号し、入力映像に含まれる第1映像領域を出力する第1復号部と、
前記符号化ストリームと組み合わせて利用可能な符号化ストリームを復号し、前記入力映像のうち前記第1映像領域以外の映像領域を構成する1つ以上のサブピクチャを出力する第2復号部と、
前記第1映像領域の位置及び大きさを指定する制御情報を取得する取得部と、
前記制御情報に基づいて、前記第1復号部が出力する前記第1映像領域と、前記第2復号部が出力する前記1つ以上のサブピクチャとを合成し、前記入力映像を復元する合成部と、を備えることを特徴とする復号装置。
a first decoding unit that decodes the encoded stream and outputs a first video region included in the input video;
a second decoding unit that decodes an encoded stream that can be used in combination with the encoded stream, and outputs one or more sub-pictures that constitute an image area of the input video other than the first image area;
an acquisition unit that acquires control information that specifies a position and a size of the first video area;
a synthesis unit that synthesizes the first video area output by the first decoding unit and the one or more sub-pictures output by the second decoding unit based on the control information to restore the input video.
コンピュータを請求項1又は2に記載の符号化装置として機能させることを特徴とするプログラム。 A program that causes a computer to function as the encoding device according to claim 1 or 2. コンピュータを請求項3乃至のいずれか1項に記載の復号装置として機能させることを特徴とするプログラム。 A program for causing a computer to function as the decoding device according to any one of claims 3 to 5 .
JP2020112196A 2020-06-29 2020-06-29 Encoding device, decoding device, and program Active JP7591878B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020112196A JP7591878B2 (en) 2020-06-29 2020-06-29 Encoding device, decoding device, and program
JP2024201690A JP2025019108A (en) 2020-06-29 2024-11-19 Decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020112196A JP7591878B2 (en) 2020-06-29 2020-06-29 Encoding device, decoding device, and program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024201690A Division JP2025019108A (en) 2020-06-29 2024-11-19 Decoding device

Publications (2)

Publication Number Publication Date
JP2022011207A JP2022011207A (en) 2022-01-17
JP7591878B2 true JP7591878B2 (en) 2024-11-29

Family

ID=80148082

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020112196A Active JP7591878B2 (en) 2020-06-29 2020-06-29 Encoding device, decoding device, and program
JP2024201690A Pending JP2025019108A (en) 2020-06-29 2024-11-19 Decoding device

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024201690A Pending JP2025019108A (en) 2020-06-29 2024-11-19 Decoding device

Country Status (1)

Country Link
JP (2) JP7591878B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008538057A (en) 2005-03-18 2008-10-02 シャープ株式会社 Method and system for image level adaptation in extended spatial scalability
JP2016519517A (en) 2013-04-08 2016-06-30 ソニー株式会社 Scalability of attention area in SHVC
WO2020056247A1 (en) 2018-09-14 2020-03-19 Vid Scale, Inc. Methods and apparatus for flexible grid regions
JP2022543627A (en) 2019-08-06 2022-10-13 ドルビー ラボラトリーズ ライセンシング コーポレイション Drawing surface size expandable video coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008538057A (en) 2005-03-18 2008-10-02 シャープ株式会社 Method and system for image level adaptation in extended spatial scalability
JP2016519517A (en) 2013-04-08 2016-06-30 ソニー株式会社 Scalability of attention area in SHVC
WO2020056247A1 (en) 2018-09-14 2020-03-19 Vid Scale, Inc. Methods and apparatus for flexible grid regions
JP2022500914A (en) 2018-09-14 2022-01-04 ヴィド スケール インコーポレイテッド Methods and equipment for flexible grid regions
JP2022543627A (en) 2019-08-06 2022-10-13 ドルビー ラボラトリーズ ライセンシング コーポレイション Drawing surface size expandable video coding

Also Published As

Publication number Publication date
JP2022011207A (en) 2022-01-17
JP2025019108A (en) 2025-02-06

Similar Documents

Publication Publication Date Title
US12081797B2 (en) Coding and decoding of interleaved image data
US20210105449A1 (en) Method and system for encoding a video data signal, encoded video data signal, method and system for decoding a video data signal
US8773584B2 (en) Playback apparatus, playback method, integrated circuit, broadcast system, and broadcast method using a broadcast video and additional video
KR101353115B1 (en) Method of encoding video content
JPWO2012111325A1 (en) Video encoding apparatus, video encoding method, video encoding program, video playback apparatus, video playback method, and video playback program
KR20180009725A (en) Method and apparatus for providing 360 degree virtual reality broadcasting services
WO2013015116A1 (en) Encoding device and encoding method, and decoding device and decoding method
WO2013099289A1 (en) Playback device, transmission device, playback method and transmission method
JP6008292B2 (en) Video stream video data creation device and playback device
JP7591878B2 (en) Encoding device, decoding device, and program
KR102219419B1 (en) 3d broadcast service provding method and apparatus, and 3d broadcast service reproduction method and apparatus for using image of asymmetric aspect ratio
WO2009136681A1 (en) Method for encoding and decoding image, and apparatus for displaying image
JP2022094631A (en) Dynamic image encoding device, dynamic image decoding device, dynamic image encoding method, and dynamic image decoding method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230529

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20241029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241119

R150 Certificate of patent or registration of utility model

Ref document number: 7591878

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150