JP7530751B2 - Multiplex signal conversion device, program thereof, and receiver - Google Patents
Multiplex signal conversion device, program thereof, and receiver Download PDFInfo
- Publication number
- JP7530751B2 JP7530751B2 JP2020101091A JP2020101091A JP7530751B2 JP 7530751 B2 JP7530751 B2 JP 7530751B2 JP 2020101091 A JP2020101091 A JP 2020101091A JP 2020101091 A JP2020101091 A JP 2020101091A JP 7530751 B2 JP7530751 B2 JP 7530751B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- cmaf
- descriptor
- metadata
- mpu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000006243 chemical reaction Methods 0.000 title claims description 114
- 239000012634 fragment Substances 0.000 claims description 100
- 238000000605 extraction Methods 0.000 claims description 35
- 238000012217 deletion Methods 0.000 claims description 26
- 230000037430 deletion Effects 0.000 claims description 26
- 239000000284 extract Substances 0.000 claims description 11
- 238000000926 separation method Methods 0.000 claims description 11
- VKALYYFVKBXHTF-UHFFFAOYSA-N 4-(methylsulfanyl)-m-cresol Chemical compound CSC1=CC=C(O)C=C1C VKALYYFVKBXHTF-UHFFFAOYSA-N 0.000 description 39
- 238000000034 method Methods 0.000 description 23
- 230000005540 biological transmission Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 102100037812 Medium-wave-sensitive opsin 1 Human genes 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- AWSBQWZZLBPUQH-UHFFFAOYSA-N mdat Chemical compound C1=C2CC(N)CCC2=CC2=C1OCO2 AWSBQWZZLBPUQH-UHFFFAOYSA-N 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
本発明は、多重信号変換装置及びそのプログラム、並びに、受信機に関する。 The present invention relates to a multiplex signal conversion device, a program for the device, and a receiver.
従来のデジタル放送で用いられているMPEG-2 TS(Transport Stream)に代わる、IP(Internet Protocol)ベースの新たなメディアトランスポート方式の国際標準規格として、MMT(MPEG Media Transport)が策定されている(非特許文献1)。また、日本国内のデジタル放送サービスにおけるMMTの利用方法が規格化され(非特許文献2)、MMTを採用した新4K8K衛星放送が2018年12月に開始された。 MMT (MPEG Media Transport) has been established as an international standard for a new IP (Internet Protocol)-based media transport method to replace MPEG-2 TS (Transport Stream) used in conventional digital broadcasting (Non-Patent Document 1). In addition, the method of using MMT in digital broadcasting services in Japan has been standardized (Non-Patent Document 2), and new 4K8K satellite broadcasting that uses MMT was launched in December 2018.
MMTで規定されるアプリケーション層のパケットフォーマット(パケットヘッダのデータ構造)をMMTP(MMT Protocol)と呼ぶ。MMTPパケットは、UDP(User Diagram Protocol)/IPパケットのペイロードとして、図8(a)に示すように、放送や通信の伝送路上を片方向に伝送される。 The application layer packet format (packet header data structure) defined by MMT is called MMTP (MMT Protocol). MMTP packets are transmitted unidirectionally over broadcast or communication transmission paths as the payload of UDP (User Diagram Protocol)/IP packets, as shown in Figure 8 (a).
MMTでは、映像・音声コーデックの処理単位をMPU(Media Processing Unit)と呼ぶ。MPUの先頭データは、過去に送信されたデータに依存せずに処理が可能なランダムアクセスポイントである必要がある。MMTの放送利用を規定する非特許文献2では、映像符号化のイントラ(Intra)フレーム(フレーム内圧縮を行うフレーム)を先頭とするGOP(Group Of Picture)をMPUとして扱う。なお、映像符号化方式の一例として用いられるHEVCの規格上ではGOPという用語は使用されていないが、MPEG-2 Videoなどの従来方式にならい、イントラフレームを先頭とするフレームの集合を便宜上、GOPと呼ぶことがある。
In MMT, the processing unit of video and audio codec is called MPU (Media Processing Unit). The first data of an MPU needs to be a random access point that can be processed without relying on previously transmitted data. In
図8(b)に示すように、放送サービスでは、受信チャンネル変更時のランダムアクセス性を確保するため、0.5秒程度の周期でGOPが構成される。具体例として、HEVCでは、32フレームをGOPとする場合がある。音声符号化方式の一例として用いられるAAC(Advanced Audio Coding)では、例えば、音圧をサンプリング周波数48kHzでサンプリングした音声サンプルについて、1024サンプルごとに独立して符号化処理を行ったデータブロックをAU(Access Unit)として扱う。一般に、各AUの先頭がランダムアクセスポイントとなるが、MPUの中に複数のランダムアクセスポイントがあっても構わないため、1つ以上の音声AUの集合をMPUとして扱うことができる。MMTPにより伝送されるMPUは、MPUシーケンス番号によって一意に特定ができる。MPUシーケンス番号は、該当MPUをペイロードとして格納するMMTPパケットのMMTPペイロードヘッダ部に記載される。 As shown in FIG. 8(b), in broadcasting services, GOPs are configured with a period of about 0.5 seconds to ensure random access when changing the receiving channel. As a specific example, in HEVC, 32 frames may be used as a GOP. In AAC (Advanced Audio Coding), which is used as an example of an audio coding method, for example, for audio samples in which sound pressure is sampled at a sampling frequency of 48 kHz, a data block in which encoding processing is performed independently for every 1024 samples is treated as an AU (Access Unit). Generally, the beginning of each AU is a random access point, but since there may be multiple random access points in an MPU, a set of one or more audio AUs can be treated as an MPU. An MPU transmitted by MMTP can be uniquely identified by an MPU sequence number. The MPU sequence number is written in the MMTP payload header of an MMTP packet that stores the corresponding MPU as a payload.
非特許文献1によれば、本来、MPUは、ISOBMFF(ISO Base Media File Format)形式をベースとして規定されている。また、非特許文献1では、MMTPにより、ISOBMFFのメタデータ部分をMPUメタデータ及びムービーフラグメントメタデータとして送信する方法が規定されている。しかし、非特許文献2で規定される放送用途では、処理の低遅延化を図るためムービーフラグメントメタデータの生成・伝送を省略しており、HEVCエンコーダが生成するNAL(Network Abstraction Layer)ユニットをそのままメディアフラグメントユニットとして、MMTP/UDP/IPパケットに多重して送信している。
According to Non-Patent Document 1, MPU is originally defined based on the ISOBMFF (ISO Base Media File Format). Non-Patent Document 1 also defines a method of transmitting the metadata portion of ISOBMFF as MPU metadata and movie fragment metadata by MMTP. However, in the broadcasting applications defined in
ISOBMFFは、基本のデータ構造が非特許文献3で規定されており、MPEG-4規格の一部であることから、一般的にはMP4(.mp4)と呼ばれることがある。ISOBMFFで定義されるメタデータ記述方法であるBox形式は、拡張性があり、アプリケーションの要求に応じて、新たなメタデータのデータ構造の追加や、より詳細な運用方法を規定できる。例えば、非特許文献4では、HTTP(Hypertext Transfer Protocol)/TCP(Transmission Control Protocol)通信を用いた映像ストリーミング配信方式であるMPEG-DASH(Dynamic Adaptive Streaming over HTTP)において、詳細なISOBMFFメタデータの運用方法やデータ構造を規定している。MPEG-DASHでは、数秒から数十秒程度の映像をファイル化したセグメントをWEBサーバ上に公開し、再生端末はマニュフェストファイルに従ってセグメントを連続的にダウンロードして映像再生を行う。 The basic data structure of ISOBMFF is specified in Non-Patent Document 3, and since it is part of the MPEG-4 standard, it is commonly called MP4 (.mp4). The Box format, which is a metadata description method defined in ISOBMFF, is extensible, and new metadata data structures can be added and more detailed operation methods can be specified according to the requirements of the application. For example, Non-Patent Document 4 specifies detailed operation methods and data structures of ISOBMFF metadata in MPEG-DASH (Dynamic Adaptive Streaming over HTTP), a video streaming distribution method using HTTP (Hypertext Transfer Protocol)/TCP (Transmission Control Protocol) communication. In MPEG-DASH, video segments lasting several to several tens of seconds are made public on a WEB server, and the playback terminal continuously downloads the segments according to the manifest file to play the video.
MPEG-DASHと同様にHTTP/TCPを用いる動画ストリーミング配信方式として、非特許文献5に規定されているHLS(HTTP Live Streaming)が知られている。現在、HLSは、MPEG-DASHと並んで広範に使用されている。HLSでは、当初、MPEG-2 TS形式のセグメントを採用していたが、MPEG-DASHと同じISOBMFF形式のセグメントを使用できるように改定された。これにより、MPEG-DASHとHLSでは、再生時に用いるマニュフェストファイルが異なるもののセグメントを共通化することで、CDN(Contents Delivery Network)等を用いた映像配信の効率化が可能となった。
HLS (HTTP Live Streaming), defined in Non-Patent
MPEG-DASHとHLSで共通に使用できるISOBMFFベースのセグメント形式については、非特許文献6でCMAFとして規定されている。なお、CMAFは、非特許文献1及び非特許文献2よりも新しい規格である。
An ISOBMFF-based segment format that can be used in common with MPEG-DASH and HLS is specified as CMAF in Non-Patent Document 6. Note that CMAF is a newer standard than
CMAFでは、セグメント形式の共通化の他、映像ストリーミング配信の低遅延化を図る技術として、セグメント構造をさらに細分化するチャンク構造が定義されている。セグメントが一般的に数秒から数十秒であるのに対して、チャンクは数フレームなどより短い時間の映像データである。一般的なHTTPによるファイル単位の転送では、一つのセグメント全体が完成してからファイルを転送するため、セグメントの時間分(数秒から数十秒)の映像遅延が原理上避けられない。実際には、再生を安定化させるために受信機でも数個のセグメントをバッファに蓄えることから、通算の映像遅延は数十秒から数分になる場合がある。一方、CMAFのチャンク構造(数フレーム)を、HTTPの拡張技術であるChunked Transferを使用して受信機に伝送する場合では、セグメント全体の完成を待つことなく、数フレームのチャンク単位で伝送することで、数秒の遅延での映像ストリーミング配信が実現可能とされている。ISOBMFFの規格当初、数フレーム単位でのメタデータの生成は考慮されていなかったが、通信技術の発展に伴う新たなアプリケーションの要求に応じて、機能が拡張されたと言える。 In addition to standardizing segment formats, CMAF defines a chunk structure that further subdivides the segment structure as a technology for reducing delays in video streaming delivery. While a segment is generally several to tens of seconds long, a chunk is video data that is shorter than the duration of a few frames. In general file-based transfers using HTTP, a file is transferred only after an entire segment is completed, so in principle, a video delay of the duration of the segment (several to tens of seconds) is unavoidable. In reality, the receiver also stores several segments in a buffer to stabilize playback, so the total video delay can be several tens of seconds to several minutes. On the other hand, when the chunk structure (several frames) of CMAF is transmitted to the receiver using Chunked Transfer, an extension technology of HTTP, video streaming delivery with a delay of a few seconds is possible by transmitting in chunks of several frames without waiting for the entire segment to be completed. When the ISOBMFF standard was first created, the generation of metadata in units of a few frames was not taken into consideration, but the functionality has been expanded to meet the demands of new applications that have arisen with the development of communication technology.
MMTによる映像伝送においても、セグメントに相当するMPU全体の符号化が終わった後にメタデータを生成し、それをMPUメタデータ及びムービーフラグメントメタデータとして伝送する場合には、MPEG-DASH等でセグメントをファイル化するのと同様の遅延が原理上避けられない。そこで、非特許文献2では、放送における映像伝送の低遅延化を図るために、ISOBMFF形式のメタデータ生成と、MPUメタデータ及びムービーフラグメントメタデータとしての伝送とを省略している。しかし、ムービーフラグメントメタデータの伝送を省略すると、DTS-PTS差分情報(dts_pts_offset)を受信機に伝送できないという問題があった。このDTS-PTS差分情報は、映像符号化のフレーム間参照構造に伴う、映像フレームの復号タイミングを指示するDTS(Decoding Timestamp)と映像フレームの提示タイミングを指示するPTS(Presentation Timestamp)との差分値を指示する情報である。そこで、非特許文献2では、このDTS-PTS差分情報を別途記述する「拡張MPUタイムスタンプ記述子」を定義し、制御メッセージであるMPテーブル(MMT Package Table)内の記述子として伝送することを規定した。ここで、記述子とは、制御メッセージで様々な補助的な情報を多重して伝送するために、制御メッセージを拡張するためのデータ構造の一般的な名称である。例えば、MMTでは、制御メッセージであるMPテーブルの構造が非特許文献1で規定されるのに対して、それを拡張する各種記述子は非特許文献2で規定されるなど、各国の標準化機関やサービス事業者が独自に記述子を追加定義することができる。「拡張MPUタイムスタンプ記述子」は、MPUを構成する全フレームのDTS-PTS差分情報を列挙した構造体であり、MPUの先頭フレームのPTSを指示する「MPUタイムスタンプ記述子」とは別に伝送される。なお、「MPUタイムスタンプ記述子」は、非特許文献1に別途規定されている。
Even in video transmission by MMT, if metadata is generated after the entire MPU corresponding to a segment is encoded and transmitted as MPU metadata and movie fragment metadata, delays similar to those when converting segments into files using MPEG-DASH or the like are unavoidable in principle. Therefore, in Non-Patent
また、非特許文献6においては、実際のサービス(高度広帯域衛星デジタル放送)を対象として、より詳細なMMTの運用方法が規定されている。非特許文献6では、「拡張MPUタイムスタンプ記述子」について、該当するMPUよりも早いタイミングで伝送することを要求している。このとき、図8(b)に示すように、「MPUタイムスタンプ記述子」に記載するPTSは、MPU(GOP)の先頭で決定する(符号α)。その一方、「拡張MPUタイムスタンプ記述子」は、MPU全体の映像符号化が終わった後でなければ生成できない(符号β)。このため、MPUの映像符号データの伝送をMPU長の時間以上に遅延させる必要が生じた。 Furthermore, Non-Patent Document 6 specifies a more detailed method of operating MMT for an actual service (advanced wideband digital satellite broadcasting). Non-Patent Document 6 requires that the "extended MPU timestamp descriptor" be transmitted at an earlier timing than the corresponding MPU. In this case, as shown in FIG. 8(b), the PTS written in the "MPU timestamp descriptor" is determined at the beginning of the MPU (GOP) (symbol α). On the other hand, the "extended MPU timestamp descriptor" can only be generated after video coding of the entire MPU has been completed (symbol β). This has created a need to delay the transmission of the MPU's video code data by more than the MPU length.
このような映像遅延を回避するために、MMTにおいても、図9(a)に示すように、新たにCMAFで規定されたチャンク構造のISOBMFFメタデータを使用することが考えられる。CMAFチャンクは、ISOBMFFをベースにした構造であるため、非特許文献1の規定に従ってMMTPでの多重が可能である。CMAFチャンクのISOBMFFメタデータでは、チャンク内の各フレームの提示タイミングと復号タイミングとの差分値を指示するBox形式のメタデータが規定されているため、チャンク長の遅延でメタデータを生成できる。Box形式のメタデータをMMTに適用した場合、図9(b)に示すように、チャンク長の遅延でメタデータを生成して、MPUを送信することが可能である。これにより、MMTを用いた映像伝送において、メタデータの生成に伴うMPU長の遅延を回避できる。図9(b)では、一例として、32フレームのGOPを4分割した8フレームの集合をチャンクとして構成している。また、ISOBMFF及びCMAFで規定されたBox形式のメタデータ構造でDTS-PTS差分情報を記述し、MMTPのムービーフラグメントメタデータとして伝送することで、「拡張MPUタイムスタンプ記述子」を使用せずとも、デコーダに対して必要なメタデータを伝送できる。具体的に、CMAFでは、「TrackFragmentRunBox(‘trun’)」の「sample_composition_time_offset」により、チャンク内の各フレームにDTS-PTS差分情報を記述することができる。 In order to avoid such video delay, it is possible to use ISOBMFF metadata with a chunk structure newly defined in CMAF in MMT as shown in FIG. 9(a). Since the CMAF chunk has a structure based on ISOBMFF, multiplexing in MMTP is possible according to the provisions of Non-Patent Document 1. In the ISOBMFF metadata of the CMAF chunk, metadata in a Box format that indicates the difference value between the presentation timing and the decoding timing of each frame in the chunk is defined, so that metadata can be generated with a chunk length delay. When the Box format metadata is applied to MMT, it is possible to generate metadata with a chunk length delay and transmit an MPU as shown in FIG. 9(b). This makes it possible to avoid the MPU length delay associated with the generation of metadata in video transmission using MMT. In FIG. 9(b), as an example, a set of 8 frames obtained by dividing a 32-frame GOP into 4 is configured as a chunk. In addition, by describing DTS-PTS differential information in a box-format metadata structure defined in ISOBMFF and CMAF and transmitting it as MMTP movie fragment metadata, it is possible to transmit the necessary metadata to the decoder without using the "extended MPU timestamp descriptor." Specifically, in CMAF, DTS-PTS differential information can be described for each frame in a chunk using "sample_composition_time_offset" in "TrackFragmentRunBox ('trun')."
以下、映像符号化のパラメータセットについて説明する。ISOBMFFでは、コーデックの識別にアルファベット4文字で定義されるFourCC(Four Character Code)を用いており、例えば、HEVCでは、「hev1」と「hvc1」の2種類が規定されている。ここで、「hev1」は、HEVCで規定される映像符号化のパラメータセットであるVPS(Video Parameter Set)、SPS(Sequence Parameter Set)、PPS(Picture Parameter Set)をメディアフラグメントユニットの中に含む形式であることを示す。また、「hvc1」は、パラメータセットをMPUメタデータに含む形式であることを示す。 Below, the video coding parameter set is explained. ISOBMFF uses FourCC (Four Character Code), which is defined by four alphabetical letters, to identify codecs. For example, HEVC specifies two types, "hev1" and "hvc1". Here, "hev1" indicates a format in which the video coding parameter sets specified in HEVC, VPS (Video Parameter Set), SPS (Sequence Parameter Set), and PPS (Picture Parameter Set), are included in the media fragment unit. Also, "hvc1" indicates a format in which the parameter sets are included in the MPU metadata.
つまり、CMAFを適用して映像符号化データ等を多重したMMTPパケットは、図9(b)に示すように、パラメータセットをMPUメタデータ(「hvc1」の場合)又はメディアフラグメントユニット(「hev1」の場合)に含んでいる。以後、CMAFを適用して映像符号化データ等を多重したMMTPパケットを「CMAF適用MMT」と略記する場合がある。つまり、CMAF適用MMTは、「hvc1」の場合と、「hev1」の場合とがある。なお、特殊な例ではあるが、各パラメータセットを、メディアフラグメントユニットとMPUメタデータとの両方で伝送することも技術的には可能である。 In other words, an MMTP packet in which video coding data, etc. are multiplexed by applying CMAF includes a parameter set in the MPU metadata (in the case of "hvc1") or in the media fragment unit (in the case of "hev1"), as shown in FIG. 9(b). Hereinafter, an MMTP packet in which video coding data, etc. are multiplexed by applying CMAF may be abbreviated as "CMAF-applied MMT." In other words, CMAF-applied MMT may be "hvc1" or "hev1." Note that, although it is a special case, it is technically possible to transmit each parameter set in both the media fragment unit and the MPU metadata.
一方、CMAFを適用せずに映像符号化データ等を多重したMMTでは、図8(b)に示すように、MPUメタデータを伝送せず、パラメータセットをメディアフラグメントユニットに含んだ形式で伝送するため、「hev1」のみに対応する。以後、CMAFを適用せずに映像符号化データ等を多重したMMTPパケットを「CMAF非適用MMT」と略記する場合がある。 On the other hand, in an MMT in which video coding data, etc. are multiplexed without applying CMAF, as shown in FIG. 8(b), MPU metadata is not transmitted, and the parameter set is transmitted in a format including the media fragment unit, so it only supports "hev1". Hereinafter, an MMTP packet in which video coding data, etc. are multiplexed without applying CMAF may be abbreviated as "MMT without applying CMAF".
なお、MPUメタデータは、ISOBMFFで規定される「MovieBox(’moov’)」を含むため、一般的には、ムービーメタデータと呼ばれる。また、ムービーフラグメントメタデータについては、ISOBMFFで規定される「MovieFragmentBox(’moof’)」を含むため、一般的にも、ムービーフラグメントメタデータと呼ばれる。また、メディアフラグメントユニットは、ISOBMFFで規定される「MediaDataBox(’mdat’)」を含むため、一般的には、メディアデータと呼ばれる。また、CMAFでは、MPUのようなランダムアクセスポイントを先頭に持つ処理単位を、フラグメントと呼ぶ。 Note that MPU metadata is generally called movie metadata because it includes the "MovieBox ('moov')" defined in ISOBMFF. Movie fragment metadata is also generally called movie fragment metadata because it includes the "MovieFragmentBox ('moof')" defined in ISOBMFF. Media fragment units are generally called media data because they include the "MediaDataBox ('mdat')" defined in ISOBMFF. In CMAF, a processing unit that starts with a random access point such as an MPU is called a fragment.
前記したCMAF適用MMTを、CMAFに対応していない受信機に入力した場合、正常に映像・音声を再生できないことや、処理エラーにより異常終了することがある。これと同様、CMAF非適用MMTを、CMAFに対応した受信機に入力した場合も、正常に映像・音声を再生できないことや、処理エラーにより異常終了することがある。 If the above-mentioned CMAF-applied MMT is input to a receiver that does not support CMAF, video and audio may not be played back properly, or the program may terminate abnormally due to a processing error. Similarly, if a CMAF-unapplied MMT is input to a receiver that supports CMAF, video and audio may not be played back properly, or the program may terminate abnormally due to a processing error.
そこで、本発明は、CMAFの適否に関わらず、受信機が正常に映像・音声を再生できる多重信号変換装置及びそのプログラム、並びに、受信機を提供することを課題とする。 The present invention aims to provide a multiplex signal conversion device and associated program, as well as a receiver, that allows the receiver to play video and audio normally, regardless of whether CMAF is appropriate.
前記課題を解決するため、本発明に係る多重信号変換装置は、CMAFを適用した多重信号であるCMAF適用多重信号を、CMAFを適用していない多重信号であるCMAF非適用多重信号に変換する多重信号変換装置であって、分離部と、記述子変換部と、記述子追加部と、出力部と、混合部とを備える構成とした。 To solve the above problems, the multiplexed signal conversion device of the present invention is a multiplexed signal conversion device that converts a CMAF-applied multiplexed signal, which is a multiplexed signal to which CMAF is applied, into a CMAF-non-applied multiplexed signal, which is a multiplexed signal to which CMAF is not applied, and is configured to include a separation unit, a descriptor conversion unit, a descriptor addition unit, an output unit, and a mixing unit.
かかる構成によれば、分離部は、CMAF適用多重信号からムービーメタデータとムービーフラグメントメタデータと制御メッセージとメディアデータとを分離する。
記述子変換部は、ムービーフラグメントメタデータのDTS-PTS差分情報を記述子に変換する。
記述子追加部は、その記述子を制御メッセージに追加する。
出力部は、制御メッセージの出力タイミングに従って、フラグメント単位でメディアデータを出力する。
混合部は、記述子追加部からの制御メッセージと出力部からのメディアデータとを混合し、CMAF非適用多重信号として出力する。
According to this configuration, the separation unit separates the movie metadata, the movie fragment metadata, the control message, and the media data from the CMAF applied multiplexed signal.
The descriptor conversion unit converts the DTS-PTS difference information of the movie fragment metadata into a descriptor.
The descriptor adder adds the descriptor to the control message.
The output unit outputs the media data in fragment units in accordance with the output timing of the control message.
The mixer mixes the control message from the descriptor adding unit with the media data from the output unit, and outputs the result as a CMAF non-applied multiplex signal.
このように、多重信号変換装置は、CMAF適用多重信号をCMAF非適用多重信号に変換できるので、CMAFの適否に関わらず、受信機が正常に映像・音声を再生できる。 In this way, the multiplex signal conversion device can convert a CMAF-applied multiplex signal into a CMAF-non-applied multiplex signal, allowing the receiver to play video and audio normally regardless of whether CMAF is appropriate.
また、前記課題を解決するため、本発明に係る多重信号変換装置は、CMAFを適用していない多重信号であるCMAF非適用多重信号を、CMAFを適用した多重信号であるCMAF適用多重信号に変換する多重信号変換装置であって、分離部と、記述子抽出・削除部と、変換部と、出力部と、混合部とを備える構成とした。 In order to solve the above problem, the multiplexed signal conversion device according to the present invention is a multiplexed signal conversion device that converts a CMAF non-applied multiplexed signal, which is a multiplexed signal to which CMAF is not applied, into a CMAF-applied multiplexed signal, which is a multiplexed signal to which CMAF is applied, and is configured to include a separation unit, a descriptor extraction/deletion unit, a conversion unit, an output unit, and a mixing unit.
かかる構成によれば、分離部は、CMAF非適用多重信号から制御メッセージとメディアデータとを分離する。
記述子抽出・削除部は、制御メッセージからDTS-PTS差分情報を含む記述子を抽出すると共に、制御メッセージの記述子を削除する。
変換部は、記述子のDTS-PTS差分情報をムービーフラグメントメタデータに変換する。
出力部は、ムービーフラグメントメタデータの出力タイミングに従って、チャンク単位でメディアデータを出力する。
混合部は、記述子抽出・削除部からの制御メッセージと変換部からのムービーフラグメントメタデータと出力部からのメディアデータとを混合し、CMAF適用多重信号として出力する。
According to this configuration, the demultiplexer demultiplexes the control message and the media data from the CMAF non-applied multiplex signal.
The descriptor extraction and deletion unit extracts a descriptor including DTS-PTS difference information from the control message, and deletes the descriptor from the control message.
The conversion unit converts the DTS-PTS difference information of the descriptor into movie fragment metadata.
The output unit outputs the media data in chunk units in accordance with the output timing of the movie fragment metadata.
The mixer mixes the control message from the descriptor extractor/deleter, the movie fragment metadata from the converter, and the media data from the output unit, and outputs the result as a CMAF-applied multiplexed signal.
このように、多重信号変換装置は、CMAF非適用多重信号をCMAF適用多重信号に変換できるので、CMAFの適否に関わらず、受信機が正常に映像・音声を再生できる。 In this way, the multiplex signal conversion device can convert a CMAF-non-applied multiplex signal into a CMAF-applied multiplex signal, allowing the receiver to play video and audio normally regardless of whether CMAF is appropriate.
なお、本発明は、コンピュータを、前記した多重信号変換装置として機能させるためのプログラムで実現することもできる。
また、本発明は、前記した多重信号変換装置を備える受信機で実現することもできる。
The present invention can also be realized by a program for causing a computer to function as the multiplex signal conversion device described above.
The present invention can also be realized in a receiver including the above-mentioned multiple signal conversion device.
本発明によれば、CMAFの適否に関わらず、受信機が正常に映像・音声を再生できる。 According to the present invention, the receiver can play video and audio normally regardless of whether CMAF is appropriate.
以下、本発明の各実施形態について図面を参照して説明する。但し、以下に説明する実施形態は、本発明の技術思想を具体化するためのものであって、特定的な記載がない限り、本発明を以下のものに限定しない。また、各実施形態において、同一の手段には同一の符号を付し、説明を省略することがある。 Each embodiment of the present invention will be described below with reference to the drawings. However, the embodiments described below are intended to embody the technical concept of the present invention, and unless otherwise specified, the present invention is not limited to the following. In addition, in each embodiment, the same means are given the same reference numerals, and the description may be omitted.
(第1実施形態)
[放送システムの概略]
図1を参照し、第1実施形態に係る放送システム100の概略について説明する。
図1に示すように、放送システム100は、デジタル放送を行うものであり、符号化装置2と、送出装置3と、受信機4とを備える。また、受信機4は、後記するMMT変換装置(多重信号変換装置)1を内蔵している。
First Embodiment
[Broadcasting system overview]
With reference to FIG. 1, an overview of a broadcasting system 100 according to a first embodiment will be described.
1, the broadcasting system 100 performs digital broadcasting and includes an
符号化装置2は、所定の映像符号化方式で放送番組の映像を符号化し、符号化した映像を送出装置3に出力するものである。本実施形態では、映像符号化方式がHEVCであることとする。
The
送出装置3は、所定の多重方式で放送番組の映像や音声を多重し、受信機4に送出するものである。本実施形態では、多重方式がMMTであることとする。つまり、送出装置3は、符号化装置2から入力した映像や音声を多重し、MMTPパケット列として受信機4に送出する。
The transmission device 3 multiplexes the video and audio of a broadcast program using a predetermined multiplexing method and transmits it to the receiver 4. In this embodiment, the multiplexing method is MMT. In other words, the transmission device 3 multiplexes the video and audio input from the
受信機4は、送出装置3が送出したMMTPパケット列を受信・多重分離し、放送番組の映像や音声を復号・再生するものである。例えば、受信機4としては、一般的なテレビ、スマートフォン、タブレットがあげられる。なお、図1では、図面を見やすくするために受信機4を1台のみ図示したが、通常、受信機4は複数台である。 The receiver 4 receives and demultiplexes the MMTP packet sequence sent by the sending device 3, and decodes and plays back the video and audio of the broadcast program. For example, the receiver 4 may be a general television, a smartphone, or a tablet. Note that in FIG. 1, only one receiver 4 is shown to make the drawing easier to understand, but typically there are multiple receivers 4.
ここで、CMAFに対応した送出装置3が、CMAFに対応していない受信機4に対し、CMAF適応MMT(CMAF適用多重信号)を送出することがある。そこで、受信機4は、内蔵したMMT変換装置1によって、CMAF適応MMTをCMAF非適応MMT(CMAF非適用多重信号)に変換する。
なお、本実施形態では、HEVCによる映像信号をアセットとして伝送するCMAF適応MMTが「hvc1」に対応し、パラメータセットをMPUメタデータに含むこととする。
Here, a sending device 3 compatible with CMAF may send a CMAF-adapted MMT (CMAF-applied multiplex signal) to a receiver 4 that does not support CMAF. In this case, the receiver 4 converts the CMAF-adapted MMT into a CMAF-non-adapted MMT (CMAF-non-applied multiplex signal) using a built-in MMT conversion device 1.
In this embodiment, the CMAF-adaptive MMT that transmits HEVC video signals as assets corresponds to "hvc1", and the parameter set is included in the MPU metadata.
[MMT変換装置の構成]
図2を参照し、MMT変換装置1の構成について説明する。
MMT変換装置1は、図9(b)のCMAF適応MMT(hvc1)を図8(b)のCMAF非適応MMTに変換するものである。図2に示すように、MMT変換装置1は、パケットフィルタ(分離部)10と、メッセージバッファ11と、記述子変換部12と、記述子追加部13と、パラメータセット抽出部14と、パラメータセット追加部15と、MPUバッファ(出力部)16と、パケット混合部(混合部)17とを備える。
[Configuration of MMT conversion device]
The configuration of the MMT conversion device 1 will be described with reference to FIG.
The MMT conversion device 1 converts the CMAF-adapted MMT (hvc1) in Fig. 9(b) into the CMAF-non-adapted MMT in Fig. 8(b). As shown in Fig. 2, the MMT conversion device 1 includes a packet filter (separation unit) 10, a
パケットフィルタ10は、CMAF適用MMTから、ムービーフラグメントメタデータと、MPUメタデータ(ムービーメタデータ)と、制御メッセージ(MPテーブル)と、メディアフラグメントユニット(メディアデータ)と、その他のパケットとを分離するものである。
The
図9(b)に示すように、パケットフィルタ10は、CMAF適用MMT(MMTPパケット)のPID及びフラグメントタイプ(fragment_type)を参照し、ムービーフラグメントメタデータ等の分離を行う。具体的には、パケットフィルタ10は、PID=0のMMTPパケットを制御メッセージ(MPテーブル)、PID=Xかつフラグメントタイプ=0のMMTPパケットをMPUメタデータ、PID=Xかつフラグメントタイプ=1のMMTPパケットをムービーフラグメントメタデータ、PID=Xかつフラグメントタイプ=2のMMTPパケットをメディアフラグメントユニットとして、CMAF適用MMTから分離する。また、パケットフィルタ10は、前記したムービーフラグメントメタデータ等以外のデータ(例えば、MPテーブル以外の制御メッセージ)をその他のパケットとして、CMAF適用MMTから分離する。
As shown in FIG. 9B, the
ここで、パケットフィルタ10は、MPテーブル内のアセットロケーション情報を参照することで、変換対象のアセットを伝送するPID(=X)を特定できる。なお、エントリポイントであるPID=0の制御メッセージにはパッケージリストテーブルが含まれ、パッケージリストテーブルから参照される別のPIDでMPテーブルが伝送される場合がある。この場合、パケットフィルタ10は、パッケージリストテーブルを参照することで制御メッセージ(MPテーブル)を伝送するPIDを特定し、制御メッセージ(MPテーブル)を分離できる。
Here, the
そして、パケットフィルタ10は、制御メッセージ(MPテーブル)をメッセージバッファ11に出力し、ムービーフラグメントメタデータを記述子変換部12に出力し、MPUメタデータをパラメータセット抽出部14に出力する。さらに、パケットフィルタ10は、メディアフラグメントユニットをパラメータセット追加部15に出力し、その他のパケットをパケット混合部17に出力する。
Then, the
メッセージバッファ11は、パケットフィルタ10から入力した制御メッセージ(MPテーブル)を蓄積するバッファである。また、メッセージバッファ11は、記述子変換部12からの出力指示に従って、制御メッセージ(MPテーブル)を記述子追加部13に出力する。
The
記述子変換部12は、パケットフィルタ10から入力したムービーフラグメントメタデータのDTS-PTS差分情報を、制御メッセージに多重して伝送するための記述子に変換するものである。本実施形態では、記述子が拡張MPUタイムスタンプ記述子であることとする。具体的には、記述子変換部12は、ムービーフラグメントメタデータを解析して、DTS-PTS差分情報を拡張MPUタイムスタンプ記述子の形式に変換する。そして、記述子変換部12は、MPU1個分のDTS-PTS差分情報の変換が完了すると、メッセージバッファ11に出力指示を行うと共に、記述子追加部13に拡張MPUタイムスタンプ記述子を出力する。記述子変換部12からメッセージバッファ11への出力指示は、例えば、MPUシーケンス番号を指定し、そのMPUに対応する記述子(例えば、MPUタイムスタンプ記述子)を含む制御メッセージ(MPテーブル)を出力させるものである。
The
記述子追加部13は、記述子変換部12から入力した拡張MPUタイムスタンプ記述子を、メッセージバッファ11から入力した制御メッセージ(MPテーブル)に追加するものである。つまり、この制御メッセージは、拡張MPUタイムスタンプ記述子を追加したMPテーブルを有する。そして、記述子追加部13は、この制御メッセージ(MPテーブル)をパケット混合部17に出力する。さらに、記述子追加部13は、パケット混合部17に制御メッセージ(MPテーブル)を出力した後、MPUバッファ16に対し、拡張MPUタイムスタンプ記述子に対応するMPUの出力指示を行う。
The
パラメータセット抽出部14は、パケットフィルタ10より入力したMPUメタデータから、映像符号化のパラメータセットを抽出するものである。具体的には、パラメータセット抽出部14は、MPUメタデータのBox形式のメタデータからHEVCのパラメータセットを抽出し、抽出したパラメータセットをパラメータセット追加部15に出力する。
The parameter set
パラメータセット追加部15は、パラメータセット抽出部14から入力したパラメータセットを、パケットフィルタ10から入力したメディアフラグメントユニットに追加するものである。具体的には、パラメータセット追加部15は、HEVCのパラメータセットを、MPUの先頭フレームのメディアフラグメントユニットの先頭に追加する。そして、パラメータセット追加部15は、このメディアフラグメントユニットをMPUバッファ16に出力する。
The parameter set
MPUバッファ16は、パラメータセット追加部15から入力したメディアフラグメントユニットを蓄積するバッファである。また、MPUバッファ16は、制御メッセージ(MPテーブル)の出力タイミングに従って、パラメータセットが追加されたメディアフラグメントユニットをMPU(フラグメント)単位で出力する。つまり、MPUバッファ16は、記述子追加部13からの出力指示で指定されたMPUのメディアフラグメントユニットをパケット混合部17に出力する。記述子追加部13からMPUバッファ16への出力指示は、例えば、MPUシーケンス番号によりMPUを指定して出力させるものである。
The
パケット混合部17は、記述子追加部13から入力した制御メッセージ(MPテーブル)と、MPUバッファ16から入力したメディアフラグメントユニットと、パケットフィルタ10から入力したその他のパケットとを混合し、CMAF非適用MMTとして出力するものである。
The
ここで、メッセージバッファ11、記述子変換部12、記述子追加部13、パラメータセット抽出部14、パラメータセット追加部15及びMPUバッファ16の各処理においては、MMTPパケットの形式を維持して処理してもよいし、又は、MMTPパケットのペイロードである処理対象データを一旦抽出した形式で処理してもよい。前者の場合、パケット混合部17は、複数のMMTPパケット列を入力として、それらを混合した単一のMMTPパケット列として出力する。後者の場合、パケット混合部17は、制御メッセージ(MPテーブル)、メディアフラグメントユニットをペイロードとして含むMMTPパケットを生成し、それらをその他のパケットとして入力されるMMTPパケット列に混合して、単一のMMTPパケット列として出力する。さらに、パケット混合部17は、必要に応じて、出力するMMTPパケット列についてパケットシーケンス番号の連続性を修正するなど、ヘッダ部を書き換えてもよい。
Here, in the processing of the
[MMT変換装置の動作]
図3を参照し、MMT変換装置1の動作について説明する。
図3に示すように、ステップS1において、パケットフィルタ10は、CMAF適用MMTから、MPUメタデータと、ムービーフラグメントメタデータと、制御メッセージ(MPテーブル)と、メディアフラグメントユニットと、その他のパケットとを分離する。また、メッセージバッファ11は、パケットフィルタ10が分離した制御メッセージ(MPテーブル)を蓄積する。
[Operation of MMT conversion device]
The operation of the MMT conversion device 1 will be described with reference to FIG.
3, in step S1, the
ステップS2において、パラメータセット抽出部14は、MPUメタデータからパラメータセットを抽出する。
ステップS3において、パラメータセット追加部15は、パラメータセットをメディアフラグメントユニットに追加する。メディアフラグメントユニットは、記述子追加部13から出力指示があるまでMPUバッファ16にバッファされる。
In step S2, the parameter
In step S3, the parameter
ステップS4において、記述子変換部12は、ムービーフラグメントメタデータのDTS-PTS差分情報を拡張MPUタイムスタンプ記述子に変換し、MPU1個分のDTS-PTS差分情報の変換が完了すると、メッセージバッファ11に出力指示を行う。すると、メッセージバッファ11は、記述子変換部12からの出力指示に従って、制御メッセージ(MPテーブル)を記述子追加部13に出力する。
In step S4, the
ステップS5において、記述子追加部13は、拡張MPUタイムスタンプ記述子を制御メッセージ(MPテーブル)に追加し、制御メッセージ(MPテーブル)を出力する。さらに、記述子追加部13は、MPUバッファ16に対し、拡張MPUタイムスタンプ記述子に対応するMPUの出力指示を行う。
In step S5, the
ステップS6において、MPUバッファ16は、記述子追加部13からの出力指示で指定されたMPUのメディアフラグメントユニットをパケット混合部17に出力する。
ステップS7において、パケット混合部17は、制御メッセージ(MPテーブル)と、メディアフラグメントユニットと、その他のパケットとを混合し、CMAF非適用MMTとして出力する。
In step S 6 , the
In step S7, the
なお、ステップS1~S7の処理は、図3の順序で逐次的に実行せずとも、入力されたパケットの種別や順序に応じて、各ステップの処理順序を入れ替えたり、各ステップの処理を同時並列に実行してもよい。 The processing of steps S1 to S7 does not have to be performed sequentially in the order shown in FIG. 3. Depending on the type and order of input packets, the processing order of each step may be changed, or each step may be performed simultaneously in parallel.
[作用・効果]
以上のように、MMT変換装置1は、CMAF適応MMTをCMAF非適応MMTに変換するので、CMAFの適否に関わらず、受信機4が正常に映像・音声を再生できる。このように、受信機4は、CMAFで規定されたチャンク構造のISOBMFFメタデータに対応しない場合でも、MMT変換装置1によって、正常に映像・音声を再生できる。
[Action and Effects]
As described above, the MMT conversion device 1 converts a CMAF-compliant MMT into a CMAF-non-compliant MMT, so that the receiver 4 can normally play back video and audio regardless of the suitability of CMAF. In this way, even if the receiver 4 does not support ISOBMFF metadata with a chunk structure defined by CMAF, the MMT conversion device 1 can normally play back video and audio.
(変形例1)
図4を参照し、変形例1に係るMMT変換装置1Bについて、第1実施形態と異なる点を説明する。
変形例1では、CMAF適応MMTが「hev1」に対応し、パラメータセットをメディアフラグメントユニットに含むこととする。つまり、MMT変換装置1Bは、パラメータセットが入力のメディアフラグメントユニットに元々含まれており、そのまま出力すればよいので、パラメータセットをMPUメタデータから抽出してメディアフラグメントユニットに追加する必要がない。
(Variation 1)
With reference to FIG. 4, an
In the first modification, the CMAF-adaptive MMT corresponds to "hev1", and the parameter set is included in the media fragment unit. In other words, since the parameter set is originally included in the input media fragment unit and the
MMT変換装置1Bは、図9(b)のCMAF適応MMT(hev1)を図8(b)のCMAF非適応MMTに変換するものである。図4に示すように、MMT変換装置1Bは、パケットフィルタ(分離部)10Bと、メッセージバッファ11と、記述子変換部12と、記述子追加部13と、MPUバッファ(出力部)16Bと、パケット混合部(混合部)17とを備える。
The
パケットフィルタ10Bは、CMAF適用MMTから分離したムービーフラグメントメタデータを記述子変換部12に出力する。また、パケットフィルタ10Bは、CMAF適用MMTから分離したメディアフラグメントユニットをMPUバッファ16Bに出力する。なお、MPUメタデータが入力された場合、パケットフィルタ10Bは、そのMPUメタデータを破棄して出力しない。この他、パケットフィルタ10Bは、第1実施形態と同様のため、説明を省略する。
The
MPUバッファ16Bは、制御メッセージ(MPテーブル)の出力タイミングに従って、パケットフィルタ10Bから入力したメディアフラグメントユニットをMPU単位で出力する。この他、MPUバッファ16Bは、第1実施形態と同様のため、説明を省略する。
The
[作用・効果]
以上のように、MMT変換装置1Bは、CMAF適応MMTが「hev1」に対応する場合でも、第1実施形態と同様にCMAF適応MMTをCMAF非適応MMTに変換するので、CMAFの適否に関わらず、受信機4が正常に映像・音声を再生できる。
[Action and Effects]
As described above, even when the CMAF-adaptive MMT corresponds to "hev1", the
(第2実施形態)
[放送システムの概略]
図1を参照し、第2実施形態に係る放送システム100Cの概略について説明する。
図1に示すように、放送システム100Cは、デジタル放送を行うものであり、符号化装置2と、送出装置3Cと、受信機4Cとを備える。
Second Embodiment
[Broadcasting system overview]
The outline of a broadcasting system 100C according to the second embodiment will be described with reference to FIG.
As shown in FIG. 1, a broadcasting system 100C performs digital broadcasting, and includes an
本実施形態では、CMAFに対応していない送出装置3Cが、CMAFに対応している受信機4Cに対し、CMAF非適応MMTを送出することとする。そこで、受信機4Cは、内蔵したMMT変換装置(多重信号変換装置)5によって、CMAF非適応MMTをCMAF適応MMTに変換する。 In this embodiment, a sending device 3C that does not support CMAF sends a CMAF-non-compliant MMT to a receiver 4C that supports CMAF. Therefore, the receiver 4C converts the CMAF-non-compliant MMT to a CMAF-compliant MMT using an internal MMT conversion device (multiplexed signal conversion device) 5.
[MMT変換装置の構成]
図5を参照し、MMT変換装置5の構成について説明する。
MMT変換装置5は、図8(b)のCMAF非適応MMTを図9(b)のCMAF適応MMT(hvc1)に変換するものである。図5に示すように、MMT変換装置5は、パケットフィルタ(分離部)50と、記述子抽出・削除部51と、パラメータセット抽出・削除部52と、メタデータ変換部(変換部)53と、MPUバッファ(出力部)54と、パケット混合部(混合部)55とを備える。
[Configuration of MMT conversion device]
The configuration of the
The
パケットフィルタ50は、CMAF非適用MMTから、制御メッセージ(MPテーブル)と、メディアフラグメントユニット(メディアデータ)と、その他のパケットとを分離するものである。
The
図8(b)に示すように、パケットフィルタ50は、CMAF非適用MMT(MMTPパケット)のPIDを参照し、メディアフラグメントユニット等の分離を行う。具体的には、パケットフィルタ50は、PID=0のMMTPパケットを制御メッセージ(MPテーブル)、PID=XのMMTPパケットをメディアフラグメントユニットとして、CMAF非適用MMTから分離する。また、パケットフィルタ50は、制御メッセージ(MPテーブル)及びメディアフラグメントユニット以外のデータをその他のパケットとして、CMAF非適用MMTから分離する。
As shown in FIG. 8(b), the
ここで、パケットフィルタ50は、MPテーブル内のアセットロケーション情報を参照することで、変換対象のアセットを伝送するPID(=X)を特定できる。なお、エントリポイントであるPID=0の制御メッセージにはパッケージリストテーブルが含まれ、パッケージリストテーブルから参照される別のPIDでMPテーブルが伝送される場合がある。この場合、パケットフィルタ50は、パッケージリストテーブルを参照することで制御メッセージ(MPテーブル)を伝送するPIDを特定し、制御メッセージ(MPテーブル)を分離できる。
Here, the
また、パケットフィルタ50は、制御メッセージ(MPテーブル)を記述子抽出・削除部51に出力し、メディアフラグメントユニットをパラメータセット抽出・削除部52に出力し、その他のパケットをパケット混合部55に出力する。
The
記述子抽出・削除部51は、パケットフィルタ50より入力した制御メッセージ(MPテーブル)から拡張MPUタイムスタンプ記述子を抽出すると共に、制御メッセージ(MPテーブル)の拡張MPUタイムスタンプ記述子を削除するものである。そして、記述子抽出・削除部51は、制御メッセージ(MPテーブル)から抽出した拡張MPUタイムスタンプ記述子をメタデータ変換部53に出力する。さらに、記述子抽出・削除部51は、拡張MPUタイムスタンプ記述子を削除した制御メッセージ(MPテーブル)をパケット混合部55に出力する。
The descriptor extraction/
パラメータセット抽出・削除部52は、パケットフィルタ50より入力したメディアフラグメントユニットから映像符号化のパラメータセットを抽出すると共に、メディアフラグメントユニットのパラメータセットを削除するものである。具体的には、パラメータセット抽出・削除部52は、MPU先頭のフレームのメディアフラグメントユニットからHEVCのパラメータセットを抽出し、抽出したパラメータセットをメタデータ変換部53に出力する。さらに、パラメータセット抽出・削除部52は、パラメータセットを削除したメディアフラグメントユニットをMPUバッファ54に出力する。
The parameter set extraction/
メタデータ変換部53は、記述子抽出・削除部51から入力した拡張MPUタイムスタンプ記述子のDTS-PTS差分情報をムービーフラグメントメタデータに変換するものである。具体的には、メタデータ変換部53は、拡張MPUタイムスタンプ記述子を解析して、DTS-PTS差分情報をISOBMFF及びCMAFで規定されるBox形式のメタデータに変換する。
The
また、メタデータ変換部53は、パラメータセット抽出・削除部52から入力したパラメータセットを含むMPUメタデータ(ムービーメタデータ)を生成する。具体的には、メタデータ変換部53は、HEVCのパラメータセットをISOBMFF及びCMAFで規定されるBox形式のメタデータを生成し、MPUメタデータとしてパケット混合部55に出力する。なお、MPUメタデータは、MPUの先頭で一度だけ出力する。
The
そして、メタデータ変換部53は、チャンク1個分のDTS-PTS差分情報の変換が完了すると、ムービーフラグメントメタデータをパケット混合部55に出力すると共に、MPUバッファ54に出力指示を行う。この出力指示は、ムービーフラグメントメタデータの出力タイミングに同期させて、MPUバッファ54が出力すべきチャンクを指定している。
Then, when the
MPUバッファ54は、パラメータセット抽出・削除部52から入力したメディアフラグメントユニットを蓄積するバッファである。また、MPUバッファ54は、ムービーフラグメントメタデータの出力タイミングに従って、チャンク単位でメディアフラグメントユニットを出力する。つまり、MPUバッファ54は、メタデータ変換部53からの出力指示で指定されたチャンクに対応するメディアフラグメントユニットをパケット混合部55に出力する。メタデータ変換部53からMPUバッファ54への出力指示は、例えば、MPUシーケンス番号とそのMPUの中の何番目のチャンクかにより、チャンクを指定して出力させるものである。
The
パケット混合部55は、記述子抽出・削除部51から入力した制御メッセージ(MPテーブル)と、メタデータ変換部53から入力したMPUメタデータ及びムービーフラグメントメタデータと、MPUバッファ54から入力したメディアフラグメントユニットと、パケットフィルタ50から入力したその他のパケットとを混合し、CMAF適用MMTとして出力するものである。
The
ここで、記述子抽出・削除部51、パラメータセット抽出・削除部52及びMPUバッファ54の各処理においては、MMTPパケットの形式を維持して処理し、メタデータ変換部53でMMTPパケットを生成してもよいし、又は、MMTPパケットのペイロードである処理対象データを一旦抽出した形式で処理してもよい。前者の場合、パケット混合部55は、複数のMMTPパケット列を入力として、それらを混合した単一のMMTPパケット列として出力する。後者の場合、パケット混合部55は、制御メッセージ(MPテーブル)、MPUメタデータ、ムービーフラグメントメタデータ、及び、メディアフラグメントユニットをペイロードとして含むMMTPパケットを生成し、それらをその他のパケットとして入力されるMMTPパケット列に混合して、単一のMMTPパケット列として出力する。さらに、パケット混合部55は、必要に応じて、出力するMMTPパケット列についてパケットシーケンス番号の連続性を修正するなど、ヘッダ部を書き換えてもよい。
Here, in the processes of the descriptor extraction/
[MMT変換装置の動作]
図6を参照し、MMT変換装置5の動作について説明する。
図6に示すように、ステップS10において、パケットフィルタ50は、CMAF非適用MMTから、制御メッセージ(MPテーブル)と、メディアフラグメントユニットと、その他のパケットとを分離する。
[Operation of MMT conversion device]
The operation of the
As shown in FIG. 6, in step S10, the
ステップS11において、パラメータセット抽出・削除部52は、メディアフラグメントユニットから映像符号化のパラメータセットを抽出すると共に、メディアフラグメントユニットのパラメータセットを削除する。
In step S11, the parameter set extraction/
ステップS12において、記述子抽出・削除部51は、制御メッセージ(MPテーブル)から拡張MPUタイムスタンプ記述子を抽出すると共に、制御メッセージ(MPテーブル)の拡張MPUタイムスタンプ記述子を削除する。
In step S12, the descriptor extraction/
ステップS13において、メタデータ変換部53は、抽出したパラメータセットを含むMPUメタデータを生成する。
ステップS14において、メタデータ変換部53は、拡張MPUタイムスタンプ記述子のDTS-PTS差分情報を変換したムービーフラグメントメタデータを生成する。
In step S13, the
In step S14, the
ステップS15において、MPUバッファ54は、ムービーフラグメントメタデータの出力タイミングに従って、チャンク単位でメディアフラグメントユニットを出力する。
ステップS16において、パケット混合部55は、制御メッセージと、MPUメタデータと、ムービーフラグメントメタデータと、メディアフラグメントユニットと、その他のパケットとを混合し、CMAF適用MMTとして出力する。
In step S15, the
In step S16, the
なお、ステップS10~S16の処理は、図6の順序で逐次的に実行せずとも、入力されたパケットの種別や順序に応じて、各ステップの処理順序を入れ替えたり、各ステップの処理を同時並列に実行してもよい。 The processing of steps S10 to S16 does not have to be performed sequentially in the order shown in FIG. 6. Depending on the type and order of the input packets, the processing order of each step may be changed, or each step may be performed simultaneously in parallel.
[作用・効果]
以上のように、MMT変換装置5は、CMAF非適応MMTをCMAF適応MMTに変換するので、CMAFの適否に関わらず、受信機4Cが正常に映像・音声を再生できる。このように、受信機4Cは、CMAFで規定されたチャンク構造のISOBMFFメタデータのみに対応する場合でも、MMT変換装置5によって、正常に映像・音声を再生できる。
[Action and Effects]
As described above, the
(変形例2)
図7を参照し、変形例2に係るMMT変換装置5Bについて、第2実施形態と異なる点を説明する。
変形例2では、CMAF適応MMTが「hev1」に対応し、パラメータセットをメディアフラグメントユニットに含むこととする。つまり、MMT変換装置5Bは、パラメータセットが入力のメディアフラグメントユニットに元々含まれており、そのまま出力すればよいので、パラメータセットをメディアフラグメントユニットから抽出して削除する必要がない。
(Variation 2)
With reference to FIG. 7, an
In the second modification, the CMAF-adapted MMT corresponds to "hev1", and the parameter set is included in the media fragment unit. In other words, the
MMT変換装置5Bは、図8(b)のCMAF非適応MMTを図9(b)のCMAF適応MMT(hev1)に変換するものである。図7に示すように、MMT変換装置5Bは、パケットフィルタ(分離部)50Bと、記述子抽出・削除部51と、メタデータ変換部(変換部)53Bと、MPUバッファ(出力部)54Bと、パケット混合部(混合部)55とを備える。
The
パケットフィルタ50Bは、CMAF適用MMTから分離した制御メッセージ(MPテーブル)を記述子抽出・削除部51に出力する。この他、パケットフィルタ50Bは、第2実施形態と同様のため、説明を省略する。
The
メタデータ変換部53Bは、パラメータセットを含むMPUメタデータを生成しない以外、第2実施形態と同様のため、説明を省略する。なお、メタデータ変換部53Bは、パラメータセットを含まないMPUメタデータ(図示せず)を生成して出力してもよい。
The
MPUバッファ54Bは、制御メッセージ(MPテーブル)の出力タイミングに従って、パケットフィルタ50Bから入力したメディアフラグメントユニットをチャンク単位で出力する。この他、MPUバッファ54Bは、第2実施形態と同様のため、説明を省略する。
The MPU buffer 54B outputs the media fragment units input from the
[作用・効果]
以上のように、MMT変換装置5Bは、CMAF適応MMTが「hev1」に対応する場合でも、第2実施形態と同様にCMAF非適応MMTをCMAF適応MMTに変換するので、CMAFの適否に関わらず、受信機4Cが正常に映像・音声を再生できる。
[Action and Effects]
As described above, even when the CMAF-adaptive MMT corresponds to "hev1", the
以上、本発明の各実施形態を詳述してきたが、本発明はこれらに限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
前記した各実施形態では、多重方式がMMTであることとして説明したが、これに限定されない。例えば、MMT変換装置時への入力及びMMT変換装置からの出力の少なくとも一方において、多重方式がDASH/ROUTEであってもよい。
Although each embodiment of the present invention has been described in detail above, the present invention is not limited to these, and includes design modifications and the like within the scope of the gist of the present invention.
In the above-described embodiments, the multiplexing method is described as MMT, but is not limited thereto. For example, the multiplexing method may be DASH/ROUTE in at least one of the input to the MMT conversion device and the output from the MMT conversion device.
前記した各実施形態では、映像符号化方式がHEVCであることとして説明したが、これに限定されない。例えば、映像符号化方式は、AVC(Advanced Video Coding)、VVC(Versatile Video Coding)であってもよい。また、本発明は、符号化方式が映像符号化方式に限られず、音声符号化方式であるAACや3DA(3D Audio)にも適用できる。 In the above-described embodiments, the video encoding method is described as HEVC, but this is not limited to this. For example, the video encoding method may be AVC (Advanced Video Coding) or VVC (Versatile Video Coding). Furthermore, the encoding method of the present invention is not limited to the video encoding method, and can also be applied to audio encoding methods such as AAC and 3DA (3D Audio).
前記した各実施形態では、MMT変換装置が受信機に内蔵されていることとして説明したが、これに限定されない。例えば、MMT変換装置は、独立したハードウェアとして実装してもよい。また、放送局側の符号化装置又は送出装置がMMT変換装置を内蔵してもよい。 In each of the above-described embodiments, the MMT conversion device is described as being built into the receiver, but this is not limited to the above. For example, the MMT conversion device may be implemented as independent hardware. Also, the MMT conversion device may be built into the encoding device or transmission device on the broadcasting station side.
また、コンピュータが備えるCPU、メモリ、ハードディスク等のハードウェア資源を、前記したMMT変換装置として動作させるプログラムで実現することもできる。これらのプログラムは、通信回線を介して配布してもよく、CD-ROMやフラッシュメモリ等の記録媒体に書き込んで配布してもよい。 It can also be realized by a program that causes the hardware resources of a computer, such as a CPU, memory, and hard disk, to operate as the MMT conversion device described above. These programs may be distributed via a communication line, or written to a recording medium such as a CD-ROM or flash memory and distributed.
1,1B MMT変換装置(多重信号変換装置)
10,10B パケットフィルタ(分離部)
11 メッセージバッファ
12 記述子変換部
13 記述子追加部
14 パラメータセット抽出部
15 パラメータセット追加部
16,16B MPUバッファ(出力部)
17 パケット混合部(混合部)
2 符号化装置
3,3C 送出装置
4,4C 受信機
5,5B MMT変換装置(多重信号変換装置)
50,50B パケットフィルタ(分離部)
51 記述子抽出・削除部
52 パラメータセット抽出・削除部
53,53B メタデータ変換部(変換部)
54,54B MPUバッファ(出力部)
55 パケット混合部(混合部)
100,100C 放送システム
1,1B MMT conversion device (multiplex signal conversion device)
10, 10B Packet filter (separation unit)
11
17 Packet Mixing Unit (Mixing Unit)
2 Encoding device 3, 3C Transmission device 4,
50, 50B Packet filter (separation section)
51 Descriptor extraction/
54, 54B MPU buffer (output section)
55 Packet Mixing Unit (Mixing Unit)
100, 100C Broadcasting System
Claims (9)
前記CMAF適用多重信号からムービーメタデータとムービーフラグメントメタデータと制御メッセージとメディアデータとを分離する分離部と、
前記ムービーフラグメントメタデータのDTS-PTS差分情報を記述子に変換する記述子変換部と、
前記記述子を前記制御メッセージに追加する記述子追加部と、
前記制御メッセージの出力タイミングに従って、フラグメント単位で前記メディアデータを出力する出力部と、
前記記述子追加部からの制御メッセージと前記出力部からのメディアデータとを混合し、前記CMAF非適用多重信号として出力する混合部と、
を備えることを特徴とする多重信号変換装置。 A multiple signal conversion device that converts a CMAF-applied multiple signal, which is a multiple signal to which CMAF is applied, into a CMAF non-applied multiple signal, which is a multiple signal to which CMAF is not applied,
a separation unit for separating movie metadata, movie fragment metadata, control messages, and media data from the CMAF applied multiplexed signal;
a descriptor conversion unit that converts the DTS-PTS difference information of the movie fragment metadata into a descriptor;
a descriptor adding unit for adding the descriptor to the control message;
an output unit that outputs the media data in units of fragments in accordance with an output timing of the control message;
a mixer that mixes the control message from the descriptor adding unit and the media data from the output unit and outputs the mixed signal as the CMAF non-applied multiplex signal;
A multiplex signal conversion device comprising:
前記パラメータセットを前記メディアデータに追加するパラメータセット追加部と、をさらに備え、
前記出力部は、前記制御メッセージの出力タイミングに従って、前記パラメータセットが追加されたメディアデータを前記フラグメント単位で出力することを特徴とする請求項1に記載の多重信号変換装置。 a parameter set extraction unit for extracting an encoding parameter set from the movie metadata;
a parameter set adding unit for adding the parameter set to the media data,
2. The multiplexed signal conversion device according to claim 1, wherein the output unit outputs the media data to which the parameter set has been added in units of the fragments in accordance with an output timing of the control message.
前記CMAF非適用多重信号から制御メッセージとメディアデータとを分離する分離部と、
前記制御メッセージからDTS-PTS差分情報を含む記述子を抽出すると共に、前記制御メッセージの前記記述子を削除する記述子抽出・削除部と、
前記記述子のDTS-PTS差分情報をムービーフラグメントメタデータに変換する変換部と、
前記ムービーフラグメントメタデータの出力タイミングに従って、チャンク単位で前記メディアデータを出力する出力部と、
前記記述子抽出・削除部からの制御メッセージと前記変換部からのムービーフラグメントメタデータと前記出力部からのメディアデータとを混合し、前記CMAF適用多重信号として出力する混合部と、
を備えることを特徴とする多重信号変換装置。 A multiplex signal conversion device that converts a CMAF non-applied multiplex signal, which is a multiplex signal to which CMAF is not applied, into a CMAF-applied multiplex signal, which is a multiplex signal to which CMAF is applied,
a separation unit that separates a control message and media data from the CMAF non-applied multiplex signal;
a descriptor extraction and deletion unit that extracts a descriptor including DTS-PTS differential information from the control message and deletes the descriptor from the control message;
A conversion unit that converts the DTS-PTS difference information of the descriptor into movie fragment metadata;
an output unit that outputs the media data in chunk units according to an output timing of the movie fragment metadata;
a mixer that mixes the control message from the descriptor extractor/deleter, the movie fragment metadata from the converter, and the media data from the output unit, and outputs the mixed signal as the CMAF applied multiplexed signal;
A multiplex signal conversion device comprising:
前記変換部は、前記パラメータセットを含むムービーメタデータを生成することを特徴とする請求項3に記載の多重信号変換装置。 a parameter set extraction/deletion unit that extracts an encoding parameter set from the media data and deletes the parameter set from the media data,
The multiple signal conversion device according to claim 3 , wherein the conversion unit generates movie metadata including the parameter set.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020101091A JP7530751B2 (en) | 2020-06-10 | 2020-06-10 | Multiplex signal conversion device, program thereof, and receiver |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020101091A JP7530751B2 (en) | 2020-06-10 | 2020-06-10 | Multiplex signal conversion device, program thereof, and receiver |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021197584A JP2021197584A (en) | 2021-12-27 |
JP7530751B2 true JP7530751B2 (en) | 2024-08-08 |
Family
ID=79196185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020101091A Active JP7530751B2 (en) | 2020-06-10 | 2020-06-10 | Multiplex signal conversion device, program thereof, and receiver |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7530751B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7104819B1 (en) | 2021-01-21 | 2022-07-21 | 三菱電機インフォメーションネットワーク株式会社 | Video data transmission device, video data transmission program and video data transmission method |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019131200A1 (en) | 2017-12-28 | 2019-07-04 | ソニー株式会社 | Decoder, decoding method, and program |
-
2020
- 2020-06-10 JP JP2020101091A patent/JP7530751B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019131200A1 (en) | 2017-12-28 | 2019-07-04 | ソニー株式会社 | Decoder, decoding method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP2021197584A (en) | 2021-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7506219B2 (en) | Reproduction method and device | |
US10129609B2 (en) | Method for transceiving media files and device for transmitting/receiving using same | |
US10009660B2 (en) | Media content transceiving method and transceiving apparatus using same | |
JP6302274B2 (en) | Transmitting apparatus and receiving apparatus | |
JP2017034664A (en) | Transmission method, reception method, transmission device and reception device | |
JP7293433B2 (en) | Transmission method, reception method, transmission device and reception device | |
JP7307237B2 (en) | Receiving method, transmitting method, receiving device and transmitting device | |
CN115767140A (en) | Receiving device, receiving method and transmission unit in transmission system | |
KR20170107580A (en) | Method and apparatus for transmitting and receiving media data | |
JP7361287B2 (en) | Transmission method and transmission device | |
CN109640162B (en) | Code stream conversion method and system | |
US9854019B2 (en) | Method and apparatus for modifying a stream of digital content | |
JP7530751B2 (en) | Multiplex signal conversion device, program thereof, and receiver | |
JP2019220974A (en) | Decoder | |
KR102393158B1 (en) | A method and apparatus for service provisioning using a bitstream including metadata | |
JP7323684B2 (en) | Transmission method, reception method, transmission device and reception device | |
JP7257646B2 (en) | Transmission method, reception method, transmission device and reception device | |
WO2016038851A1 (en) | Transmission device, reception device, transmission method and reception method | |
JP2022084018A (en) | Encoding device | |
JP2022084017A (en) | Decoding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230508 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240729 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7530751 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |