JP4695015B2 - Code amount estimation method, frame rate estimation method, code amount estimation device, frame rate estimation device, code amount estimation program, frame rate estimation program, and computer-readable recording medium recording those programs - Google Patents
Code amount estimation method, frame rate estimation method, code amount estimation device, frame rate estimation device, code amount estimation program, frame rate estimation program, and computer-readable recording medium recording those programs Download PDFInfo
- Publication number
- JP4695015B2 JP4695015B2 JP2006131608A JP2006131608A JP4695015B2 JP 4695015 B2 JP4695015 B2 JP 4695015B2 JP 2006131608 A JP2006131608 A JP 2006131608A JP 2006131608 A JP2006131608 A JP 2006131608A JP 4695015 B2 JP4695015 B2 JP 4695015B2
- Authority
- JP
- Japan
- Prior art keywords
- frame rate
- code amount
- value
- video
- calculated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明は、フレーム間予測を伴う映像符号化で用いられて、与えられたフレームレートで映像を符号化する場合に発生する符号量を推定する符号量推定方法および装置と、その符号量推定技術を利用して、与えられた符号量の制約条件下において達成可能な最大のフレームレートを推定するフレームレート推定方法および装置と、その符号量推定方法の実現に用いられる符号量推定プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体と、そのフレームレート推定方法の実現に用いられるフレームレート推定プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体とに関する。 The present invention relates to a code amount estimation method and apparatus used in video coding with inter-frame prediction to estimate the amount of code generated when a video is coded at a given frame rate, and its code amount estimation technique , A frame rate estimation method and apparatus for estimating the maximum frame rate achievable under a given code amount constraint condition, a code amount estimation program used for realizing the code amount estimation method, and the program And a frame rate estimation program used for realizing the frame rate estimation method and a computer readable recording medium recording the program.
近年、臨場感あふれる大画面のスポーツ映像やデジタルシネマに代表される超高画質映像への期待が高まっている。これを受けて、映像の高画質化に関する研究が精力的に行われている。 In recent years, there are growing expectations for super-high-quality images such as large-screen sports images and digital cinema that are full of realism. In response to this, research on high-quality video has been vigorously conducted.
超高画質映像の実現には次の四要素が必要である。すなわち、空間解像度、画素値深度、色再現性、時間解像度である。これを受けて、前者の3つの要素についてはデジタルシネマ等の応用およびナチュラルビジョンプロジェクトにおいて検討が進められている。 The following four elements are necessary to realize super high-quality video. That is, spatial resolution, pixel value depth, color reproducibility, and temporal resolution. In response, the former three elements are being studied in applications such as digital cinema and natural vision projects.
しかし、被写体の自然な動きを表現するために不可欠な時間解像度の向上、すなわち、映像の高フレームレート化については、充分な検討がなされていない。 However, sufficient studies have not been made on the improvement of time resolution, that is, the increase of the video frame rate, which is indispensable for expressing the natural movement of the subject.
Spillmannらによれば、網膜の出力細胞である神経節細胞が出力するパルス数の上限は毎秒300〜400個程度であるとする生理学的な知見が示されている。このため、人の視覚系は最も短くて1/150〜1/200秒程度までの発光の違いを知覚できると推察される。これは、知覚可能なフレームレートの検知限が150〜200[フレーム/秒]であることを意味する。現行映像のフレームレートである30,60[フレーム/秒]は、フリッカーの検知限から定められたものであり、自然な動きを表現するのに十分な値ではない。 According to Spillmann et al., Physiological knowledge is shown that the upper limit of the number of pulses output by ganglion cells, which are output cells of the retina, is about 300 to 400 pulses per second. For this reason, it is presumed that the human visual system is the shortest and can perceive the difference in light emission up to 1/150 to 1/200 second. This means that the perceivable frame rate detection limit is 150 to 200 [frames / second]. The current video frame rate of 30, 60 [frames / second] is determined from the flicker detection limit and is not a sufficient value to express natural motion.
一方、映像の超高画質化はデータ量の爆発的な増加を招くことから、ネットワークの帯域制限等の理由により符号量が制限される場合には、効率的な符号量制御技術が必要となる。 On the other hand, since the super high image quality of the video leads to an explosive increase in the amount of data, an efficient code amount control technique is required when the code amount is limited for reasons such as network bandwidth limitation. .
符号量制御の目的は、符号量に関する制約条件下で、最高の画質を達成することである。符号量制御の要素としては、量子化パラメータ、フレームあたりの画素数、フレームレート等がある。高フレームレート映像の符号化では、フレームレートのダウンサンプリングによる符号量削減効果が大きいため、フレームレートと符号量との関係を把握することが重要となる。直感的には、フレームレートの増加に伴い、フレーム間予測誤差信号の持つフレームあたりの情報量は減少することが予想される。しかし、これまで、その定量的な性質は把握されていない。 The purpose of the code amount control is to achieve the highest image quality under the constraint conditions related to the code amount. Elements of code amount control include a quantization parameter, the number of pixels per frame, a frame rate, and the like. In encoding a high frame rate video, the effect of reducing the code amount by down-sampling the frame rate is large, so it is important to grasp the relationship between the frame rate and the code amount. Intuitively, it is expected that the amount of information per frame included in the inter-frame prediction error signal decreases as the frame rate increases. However, until now, its quantitative nature has not been grasped.
また、従来研究として、フレームレートと情報量との関係に注目した可変フレームレートによる時間スケーラビリティの検討が行われているが、60[フレーム/秒]以下の低フレームレート映像に関する内容が中心であり、高フレームレート映像信号についての知見は得られていない(例えば、非特許文献1,2参照)。
上述したように、高フレームレート映像の符号化では、フレームレートのダウンサンプリングによる符号量削減効果が大きいため、フレームレートと符号量との関係を把握することが重要となる。直感的には、フレームレートの増加に伴い、フレーム間予測誤差信号の持つフレームあたりの情報量は減少することが予想される。しかし、これまで、その定量的な性質は把握されていない。 As described above, in encoding of a high frame rate video, the effect of reducing the code amount by down-sampling the frame rate is great, so it is important to grasp the relationship between the frame rate and the code amount. Intuitively, it is expected that the amount of information per frame included in the inter-frame prediction error signal decreases as the frame rate increases. However, until now, its quantitative nature has not been grasped.
これから、従来技術に従っていると、高フレームレート映像信号に対する符号化処理において、効率的な符号量制御方法の設計法が確立されていないという問題がある。 Thus, according to the prior art, there is a problem that an efficient code amount control method design method has not been established in encoding processing for a high frame rate video signal.
このような事情に鑑みて、本発明者らは、先に出願した特願2006-20082で、フレームの間引きに基づいたフレームレートのダウンサンプリングを想定して、フレームレートとフレーム間予測誤差信号の情報量との関係を表す理論モデルを構築し、そのモデルに基づいてフレームレート毎の発生符号量を推定し、効率的な符号量制御方法の設計法を確立する発明を開示した。 In view of such circumstances, the present inventors, in the previously filed Japanese Patent Application No. 2006-20082, assume frame rate down-sampling based on frame decimation and the frame rate and inter-frame prediction error signal. An invention has been disclosed in which a theoretical model representing the relationship with the information amount is constructed, the generated code amount for each frame rate is estimated based on the model, and a design method for an efficient code amount control method is established.
しかしながら、特願2006-20082で開示した発明では、フレームの間引きに基づいたフレームレートのダウンサンプリングを想定しており、撮像系のシャッターの開口時間の違いを考慮したものではない。 However, the invention disclosed in Japanese Patent Application No. 2006-20082 assumes frame rate down-sampling based on frame decimation and does not take into account the difference in the shutter opening time of the imaging system.
本発明はかかる事情に鑑みてなされたものであって、特願2006-20082で開示した発明を一歩進めて、フレーム間予測を伴う映像符号化において、撮像系の開ロ時間に応じて発生する積分効果の影響を考慮した形で、フレームレートとフレーム間予測誤差信号の情報量との関係を表す理論モデルを構築し、そのモデルに基づいてフレームレート毎の発生符号量を推定し、効率的な符号量制御方法の設計法を確立することを目的とする。 The present invention has been made in view of such circumstances, and is advanced one step from the invention disclosed in Japanese Patent Application No. 2006-20082, and is generated in accordance with the open time of the imaging system in video encoding with inter-frame prediction. Establishing a theoretical model that represents the relationship between the frame rate and the amount of information in the inter-frame prediction error signal, taking into account the effects of integration effects, and estimating the amount of generated code for each frame rate based on that model It aims at establishing the design method of a code amount control method.
〔1〕第1の発明
上記の目的を達成するために、本発明の符号量推定装置は、フレーム間予測を伴う映像符号化において、与えられたフレームレートで映像を符号化する場合に発生する符号量を推定することを実現するために、(イ)4個のモデルパラメータを入力する入力手段と、(ロ)入力手段の入力した4個のモデルパラメータを係数として用い、推定予測誤差電力の算出に用いられるフレームレートの逆数、フレームレートの平方根の逆数、フレームレートの一乗値および定数項の線形和とするコスト関数を決定する決定手段と、(ハ)決定手段の決定したコスト関数の対数とフレームレートとを乗じることで得られる算出式に対して、与えられたフレームレートの値を代入することで算出値を得て、その算出値に基づいて、与えられたフレームレートで映像を符号化する場合に発生する符号量を算出する算出手段とを備えるように構成する。
[1] First Invention In order to achieve the above object, the code amount estimation apparatus of the present invention occurs when video is encoded at a given frame rate in video encoding with inter-frame prediction. In order to realize the estimation of the code amount, (b) the input means for inputting four model parameters and (b) the four model parameters input by the input means are used as coefficients, and the estimated prediction error power (C) a logarithm of the cost function determined by the determining means; and (c) a determining function for determining a cost function as a linear sum of a reciprocal of the frame rate, a reciprocal of the square root of the frame rate, a square value of the frame rate, and a constant term. The calculated value is obtained by substituting the value of the given frame rate for the calculation formula obtained by multiplying the value by the frame rate. And calculating means for calculating the amount of code generated when the video is encoded at the specified frame rate.
以上の各処理手段が動作することで実現される本発明の符号量推定方法はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。 The code amount estimation method of the present invention realized by the operation of each of the above processing means can also be realized by a computer program, and this computer program is provided by being recorded on an appropriate computer-readable recording medium. The present invention is realized by being provided via a network, installed when the present invention is implemented, and operating on a control means such as a CPU.
〔2〕第2の発明
上記の目的を達成するために、本発明の符号量推定装置は、フレーム間予測を伴う映像符号化において、与えられたフレームレートで映像を符号化する場合に発生する符号量を推定することを実現するために、(イ)3個のモデルパラメータを入力する入力手段と、(ロ)入力手段の入力した3個のモデルパラメータを係数として用い、推定予測誤差電力の算出に用いられるフレームレートの平方根の逆数、フレームレートの一乗値および定数項の線形和とするコスト関数を決定する決定手段と、(ハ)決定手段の決定したコスト関数の対数とフレームレートとを乗じることで得られる算出式に対して、与えられたフレームレートの値を代入することで算出値を得て、その算出値に基づいて、与えられたフレームレートで映像を符号化する場合に発生する符号量を算出する算出手段とを備えるように構成する。
[2] Second invention In order to achieve the above object, the code amount estimation apparatus of the present invention occurs when video is encoded at a given frame rate in video encoding with inter-frame prediction. In order to realize the estimation of the code amount, (b) the input means for inputting three model parameters and (b) the three model parameters input by the input means are used as coefficients, and the estimated prediction error power A determining means for determining a cost function as a reciprocal of the square root of the frame rate used for calculation, a square value of the frame rate and a linear sum of constant terms ; and (c) a logarithm of the cost function determined by the determining means and the frame rate. A calculated value is obtained by substituting the value of the given frame rate into the calculation formula obtained by multiplying, and based on the calculated value, the image is obtained at the given frame rate. And a calculating means for calculating the amount of code generated when the image is encoded.
以上の各処理手段が動作することで実現される本発明の符号量推定方法はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。 The code amount estimation method of the present invention realized by the operation of each of the above processing means can also be realized by a computer program, and this computer program is provided by being recorded on an appropriate computer-readable recording medium. The present invention is realized by being provided via a network, installed when the present invention is implemented, and operating on a control means such as a CPU.
〔3〕第3の発明
上記の目的を達成するために、本発明のフレームレート推定装置は、フレーム間予測を伴う映像符号化において、与えられた符号量の制約条件下において達成可能な最大のフレームレートを推定することを実現するために、(イ)4個のモデルパラメータを入力し、その入力した4個のモデルパラメータを係数として用い、推定予測誤差電力の算出に用いられるフレームレートの逆数、フレームレートの平方根の逆数、フレームレートの一乗値および定数項の線形和とするコスト関数を決定して、その決定したコスト関数の対数とフレームレートとを乗じることで求められる算出式を導出する導出手段と、(ロ)導出手段の導出した算出式に対して、複数のフレームレートの値を代入することで算出値を得て、それらの算出値に基づいて、それらのフレームレートで映像を符号化する場合に発生する符号量を算出して、それらの算出した符号量と制約条件となる符号量とを比較することで、その符号量の制約条件下において達成可能な最大のフレームレートを推定する推定手段とを備えるように構成する。
[3] Third invention In order to achieve the above object, the frame rate estimation apparatus according to the present invention is the maximum achievable under the constraint condition of a given code amount in video coding with inter-frame prediction. In order to realize the estimation of the frame rate, (a) four model parameters are input, and the four model parameters thus input are used as coefficients, and the reciprocal of the frame rate used to calculate the estimated prediction error power. A cost function that is a reciprocal of the square root of the frame rate, a square value of the frame rate, and a linear sum of the constant terms is determined, and a calculation formula obtained by multiplying the logarithm of the determined cost function and the frame rate is derived. Deriving means and (b) Substituting multiple frame rate values into the calculation formula derived by the deriving means to obtain calculated values and calculate them Based on the value, the code amount generated when the video is encoded at those frame rates is calculated, and the calculated code amount is compared with the code amount that is the constraint condition, so that the code amount And estimating means for estimating the maximum frame rate that can be achieved under the constraint condition.
この構成を採るときに、推定手段は、評価対象となるフレームレートの値を設定して、導出手段の導出した算出式に対して、そのフレームレートの値を代入することで算出値を得て、その算出値に基づいて、そのフレームレートで映像を符号化する場合に発生する符号量を算出し、その算出した符号量と制約条件となる符号量とを比較して、その比較結果に基づいて、評価対象となるフレームレートの値を順次大きくあるいは小さくしていくことを繰り返すことにより、達成可能な最大のフレームレートを推定するように処理することがある。 When adopting this configuration, the estimation means sets the value of the frame rate to be evaluated, and obtains the calculated value by substituting the value of the frame rate for the calculation formula derived by the derivation means. Based on the calculated value, the code amount generated when the video is encoded at the frame rate is calculated, the calculated code amount is compared with the code amount as a constraint condition, and the comparison result is obtained. Thus, there are cases where processing is performed so as to estimate the maximum achievable frame rate by repeatedly increasing or decreasing the value of the frame rate to be evaluated.
以上の各処理手段が動作することで実現される本発明のフレームレート推定方法はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。 The frame rate estimation method of the present invention realized by the operation of each of the above processing means can also be realized by a computer program, and this computer program is provided by being recorded on an appropriate computer-readable recording medium. The present invention is realized by being provided via a network, installed when the present invention is implemented, and operating on a control means such as a CPU.
〔4〕第4の発明
上記の目的を達成するために、本発明のフレームレート推定装置は、フレーム間予測を伴う映像符号化において、与えられた符号量の制約条件下において達成可能な最大のフレームレートを推定することを実現するために、(イ)3個のモデルパラメータを入力し、その入力した3個のモデルパラメータを係数として用い、推定予測誤差電力の算出に用いられるフレームレートの平方根の逆数、フレームレートの一乗値および定数項の線形和とするコスト関数を決定して、その決定したコスト関数の対数とフレームレートとを乗じることで求められる算出式を導出する導出手段と、(ロ)導出手段の導出した算出式に対して、複数のフレームレートの値を代入することで算出値を得て、それらの算出値に基づいて、それらのフレームレートで映像を符号化する場合に発生する符号量を算出して、それらの算出した符号量と制約条件となる符号量とを比較することで、その符号量の制約条件下において達成可能な最大のフレームレートを推定する推定手段とを備えるように構成する。
[4] Fourth invention In order to achieve the above object, the frame rate estimation apparatus of the present invention provides the maximum achievable under the constraint condition of a given code amount in video coding with inter-frame prediction. In order to realize the estimation of the frame rate, (a) three model parameters are input, and the input three model parameters are used as coefficients to calculate the square root of the frame rate used for calculating the estimated prediction error power. Derivation means for deriving a calculation formula obtained by determining a cost function as a linear sum of a reciprocal of the frame rate, a square value of the frame rate and a constant term , and multiplying the logarithm of the determined cost function and the frame rate; B) Substituting multiple frame rate values into the calculation formula derived by the deriving means to obtain calculated values, and based on those calculated values, Achievable under the constraint condition of the code amount by calculating the code amount generated when encoding the video at the frame rate and comparing the calculated code amount with the code amount as the constraint condition And an estimation means for estimating the maximum frame rate.
この構成を採るときに、推定手段は、評価対象となるフレームレートの値を設定して、導出手段の導出した算出式に対して、そのフレームレートの値を代入することで算出値を得て、その算出値に基づいて、そのフレームレートで映像を符号化する場合に発生する符号量を算出し、その算出した符号量と制約条件となる符号量とを比較して、その比較結果に基づいて、評価対象となるフレームレートの値を順次大きくあるいは小さくしていくことを繰り返すことにより、達成可能な最大のフレームレートを推定するように処理することがある。 When adopting this configuration, the estimation means sets the value of the frame rate to be evaluated, and obtains the calculated value by substituting the value of the frame rate for the calculation formula derived by the derivation means. Based on the calculated value, the code amount generated when the video is encoded at the frame rate is calculated, the calculated code amount is compared with the code amount as a constraint condition, and the comparison result is obtained. Thus, there are cases where processing is performed so as to estimate the maximum achievable frame rate by repeatedly increasing or decreasing the value of the frame rate to be evaluated.
以上の各処理手段が動作することで実現される本発明のフレームレート推定方法はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。 The frame rate estimation method of the present invention realized by the operation of each of the above processing means can also be realized by a computer program, and this computer program is provided by being recorded on an appropriate computer-readable recording medium. The present invention is realized by being provided via a network, installed when the present invention is implemented, and operating on a control means such as a CPU.
本発明により、撮像系の開ロ時間に応じて発生する積分効果の影響を考慮した形で、所望のフレームレートで符号化する場合に必要となる符号量を予め見積もることができるようになる。これにより、ネットワークの伝送帯域の設定を適切に行うことが可能となる。 According to the present invention, it is possible to estimate in advance the amount of code required for encoding at a desired frame rate in consideration of the influence of the integration effect generated according to the open time of the imaging system. This makes it possible to appropriately set the network transmission band.
そして、本発明により、撮像系の開ロ時間に応じて発生する積分効果の影響を考慮した形で、与えられた符号量を用いて実現可能な最高のフレームレートを推定することが可能となる。これにより、符号化時に適切なフレームレートの設定を行うことができ、復号画像の画質向上を見込める。 According to the present invention, it is possible to estimate the maximum frame rate that can be realized using a given code amount in consideration of the influence of the integration effect generated according to the open time of the imaging system. . As a result, it is possible to set an appropriate frame rate at the time of encoding, and to improve the image quality of the decoded image.
さらに、第2の発明や第4の発明により、この実現を図るときに、符号量とフレームレートとの関係を表すモデルの自由度(パラメータ数)を小さくすることが可能となり、そのモデルに関するパラメータ推定を簡略化できる。これにより、モデル推定の高速化を実現できるようになる。 Furthermore, according to the second and fourth inventions, when realizing this, it is possible to reduce the degree of freedom (number of parameters) of the model representing the relationship between the code amount and the frame rate, and the parameters relating to the model. Estimation can be simplified. As a result, the model estimation can be speeded up.
次に、実施の形態に従って本発明を詳細に説明する。 Next, the present invention will be described in detail according to embodiments.
本発明では、フレーム間予測を伴う映像符号化において、撮像系の開ロ時間に応じて発生する積分効果の影響を考慮した形で、フレームレートとフレーム間予測誤差信号の情報量との関係を表す理論モデルを構築し、そのモデルに基づいてフレームレート毎の発生符号量を推定することを実現するとともに、与えられた符号量の制約条件下において達成可能な最大のフレームレートを推定することを実現する。 In the present invention, in video coding with inter-frame prediction, the relationship between the frame rate and the amount of information of the inter-frame prediction error signal is calculated in consideration of the influence of the integration effect that occurs according to the open time of the imaging system. It is possible to construct a theoretical model to represent and estimate the generated code amount for each frame rate based on the model, and to estimate the maximum frame rate achievable under the constraints of the given code amount. Realize.
〔1〕フレームレートと情報量との関係
次に、フレームレートとフレーム間予測誤差信号の情報量との関係を解析的に導出する。ここでは、簡単のため1次元信号を例にとり説明する。
[1] Relationship between Frame Rate and Information Amount Next, the relationship between the frame rate and the information amount of the inter-frame prediction error signal is analytically derived. Here, for simplicity, a one-dimensional signal will be described as an example.
位置xにおいて、シャッターを時刻tからt+δの間、開口して撮影した信号をft '(x,δ)とする。このとき、シャッターの開口時間をmδ(mは自然数)に伸張した場合に得られる信号fmt(x,mδ)は、信号ft '(x,δ)を用いて以下のように表せる。 At a position x, a signal obtained by opening the shutter from time t to t + δ and taking a picture is defined as ft ′ (x, δ). At this time, a signal f mt (x, mδ) obtained when the shutter opening time is extended to mδ (m is a natural number) can be expressed as follows using the signal f t ′ (x, δ).
この式(1)は、信号fmt(x,mδ)が、連続して撮影されたm個の信号ft '(x,δ)の平均値で定義されるということを示している。 This equation (1) indicates that the signal f mt (x, mδ) is defined by an average value of m signals f t ′ (x, δ) that have been taken continuously.
信号fmt(x,mδ)に対して、区間Lを単位として動き補償(推定変位量dm * )を行った場合、同区間内の動き補償後の予測誤差は次のように表現できる。なお、以下では、位置xにおける真の変位量をdm (x)としている。 When motion compensation (estimated displacement d m * ) is performed on the signal f mt (x, mδ) using the section L as a unit, the prediction error after motion compensation in the section can be expressed as follows. In the following, the true displacement amount at the position x is d m (x).
ここで、φ(x)はテイラー展開の2次以降の項である。また、n(m)は雑音成分に起因する項である。 Here, φ (x) is the second and subsequent terms of Taylor expansion. N (m) is a term due to a noise component.
フレーム間での動きを等速運動とみなせば、変位量はフレーム間隔(フレームレートの逆数)に比例することから、フレームレートとは反比例の関係にある。このため、F=(m・δ)-1とおくと、dm (x)−dm * は次式のように表せる。 If the movement between frames is regarded as a constant velocity motion, the amount of displacement is proportional to the frame interval (the reciprocal of the frame rate), and thus has an inversely proportional relationship with the frame rate. Therefore, if F = (m · δ) −1 , d m (x) −d m * can be expressed as the following equation.
dm (x)−dm * =(vm (x)−vm * )・m・δ
ここで、vm (x)は位置xの画素毎に定まる比例定数であり、vm * は区間Lに対して定まる比例定数である。両比例定数の物理的な意味はいずれも速度となる。
d m (x) −d m * = (v m (x) −v m * ) · m · δ
Here, v m (x) is a proportionality constant determined for each pixel at the position x, and v m * is a proportionality constant determined for the section L. The physical meaning of both proportionality constants is speed.
なお、以下では簡単のために、ft '(x,δ)をft '(x)と略記する。 Note that for simplicity in the following, f t '(x, δ ) a f t' is abbreviated as (x).
上式を式(2)に代入し、雑音成分の独立性、およびテイラー展開の一次近似を利用し、次式を得る。 By substituting the above equation into equation (2) and using the independence of noise components and the first order approximation of Taylor expansion, the following equation is obtained.
ここで、A(m),B(m),N(m)は以下の通りである。 Here, A (m), B (m), and N (m) are as follows.
A(m),B(m)については以下のように展開でき、また、N(m)を構成する雑音成分n(m)については以下のように展開できる。なお、以下では、
μmt(x)=(1/m)Σfm(t-1)+i'(x)
但し、Σはi=0〜m−1についての総和
ε(x)=(vm (x)−vm * )
とおく。
A (m) and B (m) can be expanded as follows, and the noise component n (m) constituting N (m) can be expanded as follows. In the following,
μ mt (x) = (1 / m) Σf m (t-1) + i '(x)
Where Σ is the sum of i = 0 to m−1
ε (x) = (v m (x) −v m * )
far.
A(m)は以下のように展開できる。 A (m) can be expanded as follows.
ここで、β=Σx ε(x)2 とする。また、上述の近似では、ε(x)とμmt(x)は統計的に独立と仮定した。また、以下の斉次モデルを用いた。 Here, it is assumed that β = Σ x ε (x) 2 . In the above approximation, it is assumed that ε (x) and μ mt (x) are statistically independent. The following homogeneous model was used.
さらに、以下の近似を用いた。 Furthermore, the following approximation was used.
ここで、<di >および<dj >は各々、di (x)およびdj (x)(x∈L)の平均値である。また、αi,j は平均変移量(<di >,<dj >)を用いた近似に対する補正パラメータである。 Here, <d i > and <d j > are average values of d i (x) and d j (x) (x∈L), respectively. Α i, j is a correction parameter for approximation using the average displacement (<d i >, <d j >).
ρは画像信号の自己相関のため、1以下であり、かつ、1に近い値とみなすことができる。このため、
(1−ρ)/ρ≪1
という不等式が成立する。
ρ is 1 or less because of autocorrelation of the image signal, and can be regarded as a value close to 1. For this reason,
(1-ρ) / ρ << 1
The inequality is established.
この不等式を用いることで、式(5)は以下の通り近似できる。 By using this inequality, equation (5) can be approximated as follows.
mはダウンサンプされたフレームレートFの最大フレームレートF0 に対する比なので、次式を得る。 Since m is the ratio of the downsampled frame rate F to the maximum frame rate F 0 , we obtain:
同様にして、B(m)を次式のように近似する。 Similarly, B (m) is approximated as follows:
ここで、γは1あるいは−1とする。 Here, γ is 1 or −1.
次に、N(m)を構成する雑音成分n(m)について考察する。雑音成分n(m)は画像信号と統計的に独立だと仮定しているため、式(1)の平均化処理は、雑音成分を低減させる。即ち、フレームレートF0 のシーケンスに含まれる雑音成分をn0 とすると、n(m)は次式のように表される。 Next, the noise component n (m) constituting N (m) will be considered. Since it is assumed that the noise component n (m) is statistically independent from the image signal, the averaging process of Equation (1) reduces the noise component. That is, if the noise component included in the sequence at the frame rate F 0 is n 0 , n (m) is expressed as the following equation.
ここで、『L』はセグメントL内の要素数である。 Here, “L” is the number of elements in the segment L.
予測誤差がラプラス分布に従うと仮定し、同分布のdifferential entropyを用いて、予測誤差の情報量I(F)[bits/pel]を見積もると次式の関係を得る。なお、以下では、対数の底は2とする。 Assuming that the prediction error follows a Laplace distribution and estimating the information amount I (F) [bits / pel] of the prediction error using the differential entropy of the distribution, the following relationship is obtained. In the following, the base of the logarithm is 2.
ここで、A”,B”,C”およびD”は次式となる。 Here, A ″, B ″, C ″ and D ″ are as follows.
式(13)において、フレームレートが大きな場合、F-1が小さな値となることから第1項が無視できるとみなし、I(F)を以下のI# (F)として近似する。 In Expression (13), when the frame rate is large, F −1 becomes a small value, so that the first term is considered negligible, and I (F) is approximated as I # (F) below.
式(13)を用いる場合には、
σe 2 =A”F-1+B”F-1/2+C”F+D”
という算出式に従って推定予測誤差電力を算出するのに対して、この式(15)を用いる場合には、
σe 2 =B”F-1/2+C”F+D”
という算出式に従って推定予測誤差電力を算出することになる。
When using equation (13),
σ e 2 = A ″ F −1 + B ″ F −1/2 + C ″ F + D ″
In contrast to calculating the estimated prediction error power according to the calculation formula, when using this formula (15),
σ e 2 = B ″ F −1/2 + C ″ F + D ″
The estimated prediction error power is calculated according to the calculation formula.
〔2〕符号量推定
第1および第2の発明では、フレームレートをFとして符号化するという制約条件が与えられた場合に、必要となる符号量を推定する処理を行う。
[2] Code Amount Estimation In the first and second inventions, a process for estimating the required code amount is performed when a constraint condition that the frame rate is encoded as F is given.
これは、図1に示すように、指定されたフレームレートFに対応する発生符号量を推定する処理である。符号化時の制約条件として、フレームレートが与えられる例としては、(i)映像伝送サービスにおいて品質保証を行う目的から、復号側の映像表示端末において一定値以上のフレームレートでの表示が義務付けられている場合、(ii)時間軸方向の画質(フレームレート)の最大化を図る目的から、復号側の映像表示端末で表示可能な最大フレームレートで符号化する場合、等がある。 This is a process of estimating the generated code amount corresponding to the designated frame rate F as shown in FIG. For example, the frame rate is given as a restriction condition at the time of encoding. (I) For the purpose of quality assurance in the video transmission service, the video display terminal on the decoding side is required to display at a frame rate higher than a certain value. (Ii) for the purpose of maximizing image quality (frame rate) in the time axis direction, encoding is performed at the maximum frame rate that can be displayed on the video display terminal on the decoding side.
〔2−1〕第1の発明
第1の発明では、式(13)を用いた発生符号量推定を行う。すなわち、与えられたフレームレートFの映像を符号化する際、発生符号量の推定値は次式となる。
[2-1] First Invention In the first invention, the generated code amount estimation using Expression (13) is performed. That is, when encoding a video with a given frame rate F, the estimated value of the generated code amount is given by the following equation.
なお、A”,B”,C”,D”については、別途、外部から与えられるものとする。A”,B”,C”,D”を第1の発明におけるモデルパラメータと呼ぶ。 Note that A ″, B ″, C ″, and D ″ are separately given from the outside. A ″, B ″, C ″, D ″ are referred to as model parameters in the first invention.
〔2−2〕第2の発明
第2の発明では、式(15)を用いた発生符号量推定を行う。すなわち、与えられたフレームレートFの映像を符号化する際、発生符号量の推定値は次式となる。
[2-2] Second Invention In the second invention, the generated code amount estimation using Expression (15) is performed. That is, when encoding a video with a given frame rate F, the estimated value of the generated code amount is given by the following equation.
なお、B”,C”,D”については、別途、外部から与えられるものとする。B”,C”,D”を第2の発明におけるモデルパラメータと呼ぶ。 Note that B ″, C ″, and D ″ are separately given from the outside. B ″, C ″, and D ″ are referred to as model parameters in the second invention.
〔3〕フレームレート推定
第3および第4の発明では、符号量をR以下に抑えるという制約条件が与えられた場合に、それを実現する最大のフレームレートを推定する処理を行う。
[3] Frame Rate Estimation In the third and fourth aspects of the invention, when a constraint condition that the code amount is suppressed to R or less is given, a process for estimating the maximum frame rate for realizing it is performed.
これは、図2に示すように、選択可能なフレームレートの候補の中から、符号量の制約条件を満たす最大のフレームレートを選択する処理である。なお、こうした符号量に関する制約は、ネットワーク帯域等に起因して発生する。以下では、制約条件として与えられる符号量の許容値を許容符号量と呼ぶ。 As shown in FIG. 2, this is a process of selecting the maximum frame rate that satisfies the code amount constraint from the selectable frame rate candidates. Such a restriction on the amount of codes occurs due to the network bandwidth or the like. Hereinafter, the allowable value of the code amount given as the constraint condition is referred to as an allowable code amount.
〔3−1〕第3の発明
第3の発明では、符号量をR以下に抑えるという条件下で、時間軸方向の画質(フレームレート)を最大化する場合に、式(13)を用いて、次式を満たすフレームレートF1 を求める。
[3-1] Third Invention In the third invention, when the image quality (frame rate) in the time axis direction is maximized under the condition that the code amount is suppressed to R or less, Expression (13) is used. A frame rate F 1 satisfying the following equation is obtained.
ここで、argmaxF は、次に続く関数を最大化するFを返す。式(13)におけるA”,B”,C”,D”については、別途、外部から与えられるものとする。A”,B”,C”,D”を第3の発明におけるモデルパラメータと呼ぶ。 Here, argmax F returns F that maximizes the next function. A ″, B ″, C ″, and D ″ in Equation (13) are separately given from the outside. A ″, B ″, C ″, D ″ are called model parameters in the third invention.
〔3−2〕第4の発明
第4の発明では、符号量をR以下に抑えるという条件下で、時間軸方向の画質(フレームレート)を最大化する場合に、式(15)を用いて、次式を満たすフレームレートF2 を求める。
[3-2] Fourth Invention In the fourth invention, when maximizing the image quality (frame rate) in the time axis direction under the condition that the code amount is suppressed to R or less, the equation (15) is used. Then, a frame rate F 2 satisfying the following equation is obtained.
ここで、argmaxF は、次に続く関数を最大化するFを返す。式(15)におけるB”,C”,D”については、別途、外部から与えられるものとする。B”,C”,D”を第4の発明におけるモデルパラメータと呼ぶ。 Here, argmax F returns F that maximizes the next function. B ″, C ″, and D ″ in Expression (15) are separately given from the outside. B ″, C ″, and D ″ are referred to as model parameters in the fourth invention.
次に、実施例に従って本発明を詳細に説明する。 Next, the present invention will be described in detail according to examples.
〔1〕本発明の発生符号量推定装置の構成
図3に、本発明の発生符号量推定装置10の装置構成の一実施例を図示する。
[1] Configuration of Generated Code Amount Estimating Device of the Present Invention FIG. 3 shows an embodiment of the device configuration of the generated code amount estimating device 10 of the present invention.
この図に示すように、本発明の発生符号量推定装置10は、入力部100と、モデルパラメータ記憶部101と、フレームレート記憶部102と、フレームレート演算算出部103と、フレームレート演算結果記憶部104と、推定予測誤差電力算出部105と、推定予測誤差電力記憶部106と、対数値算出部107と、対数値記憶部108と、発生符号量推定値算出部109と、発生符号量推定値記憶部110と、発生符号量推定値出力部111とを備える。
As shown in this figure, the generated code amount estimation apparatus 10 of the present invention includes an
この入力部100は、発生符号量推定の評価対象となるフレームレートFを入力するとともに、第1の発明を実現する場合には、上述したモデルパラメータA”,B”,C”,D”を入力し、第2の発明を実現する場合には、上述したモデルパラメータB”,C”,D”を入力する。
The
モデルパラメータ記憶部101は、入力部100の入力したモデルパラメータを記憶する。フレームレート記憶部102は、入力部100の入力したフレームレートFを記憶する。
The model parameter storage unit 101 stores model parameters input from the
フレームレート演算算出部103は、第1の発明を実現する場合には、フレームレート記憶部102の記憶するフレームレートFの逆数F-1、同平方根逆数F-1/2、同一乗値Fを算出し、第2の発明を実現する場合には、フレームレート記憶部102の記憶するフレームレートFの平方根逆数F-1/2、同一乗値Fを算出する。 When realizing the first invention, the frame rate calculation / calculation unit 103 obtains the reciprocal F −1 , the reciprocal square root F −1/2 , and the same power F of the frame rate F stored in the frame rate storage unit 102. When calculating and realizing the second invention, the inverse square root F −1/2 of the frame rate F stored in the frame rate storage unit 102 and the same power value F are calculated.
フレームレート演算結果記憶部104は、フレームレート演算算出部103の算出したフレームレートFについての演算結果を記憶する。
The frame rate calculation
推定予測誤差電力算出部105は、モデルパラメータ記憶部101の記憶するモデルパラメータと、フレームレート演算結果記憶部104の記憶するフレームレートFについての演算結果とを使い、第1の発明を実現する場合には、
σe 2 =A”F-1+B”F-1/2+C”F+D”
という算出式に従って推定予測誤差電力を算出し、第2の発明を実現する場合には、
σe 2 =B”F-1/2+C”F+D”
という算出式に従って推定予測誤差電力を算出する。
The estimated prediction error
σ e 2 = A ″ F −1 + B ″ F −1/2 + C ″ F + D ″
When the estimated prediction error power is calculated according to the calculation formula, and the second invention is realized,
σ e 2 = B ″ F −1/2 + C ″ F + D ″
The estimated prediction error power is calculated according to the following calculation formula.
推定予測誤差電力記憶部106は、推定予測誤差電力算出部105の算出した推定予測誤差電力を記憶する。
The estimated prediction error
対数値算出部107は、推定予測誤差電力記憶部106の記憶する推定予測誤差電力の対数値を算出する。対数値記憶部108は、対数値算出部107の算出した推定予測誤差電力の対数値を記憶する。
The logarithmic value calculation unit 107 calculates the logarithmic value of the estimated prediction error power stored in the estimated prediction error
発生符号量推定値算出部109は、対数値記憶部108の記憶する推定予測誤差電力の対数値と、フレームレート記憶部102の記憶するフレームレートFとの乗算値を算出し、さらにその乗算値に0.5を乗算することで、評価対象となるフレームレートFで符号化する場合に発生する符号量の推定値を算出する。
The generated code amount estimated
発生符号量推定値記憶部110は、発生符号量推定値算出部109の算出した発生符号量の推定値を記憶する。発生符号量推定値出力部111は、発生符号量推定値記憶部110の記憶する発生符号量の推定値を出力する。
The generated code amount estimated value storage unit 110 stores the generated code amount estimated value calculated by the generated code amount estimated
図4に、図3のように構成される本発明の発生符号量推定装置10の実行する処理フローの一例を図示する。 FIG. 4 shows an example of a processing flow executed by the generated code amount estimation apparatus 10 of the present invention configured as shown in FIG.
次に、図4の処理フローに従って、本発明の発生符号量推定装置10の実行する処理について詳細に説明する。 Next, processing executed by the generated code amount estimation apparatus 10 according to the present invention will be described in detail according to the processing flow of FIG.
本発明の発生符号量推定装置10は、符号量の推定要求が発行されると、図4の処理フローに示すように、先ず最初に、ステップS10で、評価対象となるフレームレートFを入力する。 When a code amount estimation request is issued, the generated code amount estimation apparatus 10 of the present invention first inputs a frame rate F to be evaluated in step S10 as shown in the processing flow of FIG. .
続いて、ステップS11で、第1の発明を実現する場合には、上述したモデルパラメータA”,B”,C”,D”を入力し、第2の発明を実現する場合には、上述したモデルパラメータB”,C”,D”を入力する。 Subsequently, in step S11, when the first invention is realized, the above-described model parameters A ″, B ″, C ″, D ″ are input, and when the second invention is realized, the above-described model parameters A ″, B ″, C ″, D ″ are input. Enter model parameters B ", C", D ".
続いて、ステップS12で、第1の発明を実現する場合には、入力したフレームレートFの逆数F-1、同平方根逆数F-1/2、同一乗値Fを算出し、第2の発明を実現する場合には、入力したフレームレートFの平方根逆数F-1/2、同一乗値Fを算出する。 Subsequently, in step S12, when the first invention is realized, the reciprocal F −1 , the reciprocal square root F −1/2 , and the same power value F of the input frame rate F are calculated, and the second invention is calculated. Is realized, the square root reciprocal F −1/2 and the same power value F of the input frame rate F are calculated.
続いて、ステップS13で、第1の発明を実現する場合には、
σe 2 =A”F-1+B”F-1/2+C”F+D”
という算出式に従って推定予測誤差電力を算出し、第2の発明を実現する場合には、
σe 2 =B”F-1/2+C”F+D”
という算出式に従って推定予測誤差電力を算出する。
Subsequently, when realizing the first invention in step S13,
σ e 2 = A ″ F −1 + B ″ F −1/2 + C ″ F + D ″
When the estimated prediction error power is calculated according to the calculation formula, and the second invention is realized,
σ e 2 = B ″ F −1/2 + C ″ F + D ″
The estimated prediction error power is calculated according to the following calculation formula.
続いて、ステップS14で、算出した推定予測誤差電力の対数値を算出する。すなわち、第1の発明を実現する場合には、算出した推定予測誤差電力「A”F-1+B”F-1/2+C”F+D”」の対数値を算出し、第2の発明を実現する場合には、算出した推定予測誤差電力「B”F-1/2+C”F+D”」の対数値を算出するのである。 Subsequently, in step S14, a logarithmic value of the calculated estimated prediction error power is calculated. That is, when the first invention is realized, a logarithmic value of the calculated estimated prediction error power “A ″ F −1 + B ″ F −1/2 + C ″ F + D ″” is calculated to realize the second invention. In this case, the logarithmic value of the calculated estimated prediction error power “B ″ F −1/2 + C ″ F + D ″” is calculated.
続いて、ステップS15で、算出した推定予測誤差電力の対数値と入力したフレームレートFとの乗算値を算出する。 Subsequently, in step S15, a multiplication value of the calculated logarithmic value of the estimated prediction error power and the input frame rate F is calculated.
続いて、ステップS16で、ステップS15で算出した乗算値の値に0.5を乗じることで、評価対象となるフレームレートFで符号化する場合に発生する符号量の推定値を算出する。すなわち、第1の発明を実現する場合には、式(16)に従って評価対象となるフレームレートFで符号化する場合に発生する符号量の推定値を算出し、第2の発明を実現する場合には、式(17)に従って評価対象となるフレームレートFで符号化する場合に発生する符号量の推定値を算出するのである。 Subsequently, in step S16, by multiplying the value of the multiplication value calculated in step S15 by 0.5, an estimated value of the amount of code generated when encoding at the frame rate F to be evaluated is calculated. In other words, when the first invention is realized, an estimated value of a code amount generated when encoding is performed at the frame rate F to be evaluated according to the equation (16), and the second invention is realized. In this case, an estimated value of the amount of code generated when encoding is performed at the frame rate F to be evaluated according to the equation (17).
そして、最後に、ステップS17で、算出した発生符号量の推定値を出力して、処理を終了する。 Finally, in step S17, the calculated generated code amount estimation value is output, and the process is terminated.
このようにして、本発明の発生符号量推定装置10は、フレームレートをFとして符号化するという制約条件が与えられた場合に、必要となる符号量を推定する処理を行うのである。 In this way, the generated code amount estimation apparatus 10 according to the present invention performs a process of estimating the necessary code amount when the constraint condition that the frame rate is F is given.
〔2〕本発明のフレームレート推定装置の構成
図5に、本発明のフレームレート推定装置20の装置構成の一実施例を図示する。
[2] Configuration of Frame Rate Estimation Device of the Present Invention FIG. 5 shows an embodiment of the device configuration of the frame rate estimation device 20 of the present invention.
この図に示すように、本発明のフレームレート推定装置20は、入力部200と、許容符号量記憶部201と、モデルパラメータ記憶部202と、フレームレート記憶部203と、フレームレート増分値記憶部204と、フレームレート更新部205と、発生符号量推定部206と、発生符号量推定値記憶部207と、発生符号量推定値判定部208と、フレームレート出力部209とを備える。
As shown in this figure, the frame rate estimation apparatus 20 of the present invention includes an input unit 200, an allowable code amount storage unit 201, a model parameter storage unit 202, a frame rate storage unit 203, and a frame rate increment value storage unit. 204, a frame
この入力部200は、許容符号量と初期フレームレートとフレームレート増分値とを入力するとともに、第3の発明を実現する場合には、上述したモデルパラメータA”,B”,C”,D”を入力し、第4の発明を実現する場合には、上述したモデルパラメータB”,C”,D”を入力する。 The input unit 200 inputs an allowable code amount, an initial frame rate, and a frame rate increment value. When the third invention is realized, the above-described model parameters A ″, B ″, C ″, D ″ are input. When the fourth invention is realized, the above-described model parameters B ″, C ″, D ″ are input.
ここで、許容符号量として与えられるのは、例えば、帯域制限等により定められる目標符号量である。また、初期フレームレートとしては十分に小さな値を用いる。 Here, what is given as the allowable code amount is, for example, a target code amount determined by band limitation or the like. Also, a sufficiently small value is used as the initial frame rate.
許容符号量記憶部201は、入力部200の入力した許容符号量を記憶する。モデルパラメータ記憶部202は、入力部200の入力したモデルパラメータを記憶する。フレームレート記憶部203は、現在のフレームレートを記憶するものであり、その初期値として入力部200の入力した初期フレームレートを記憶する。フレームレート増分値記憶部204は、入力部200の入力したフレームレート増分値を記憶する。 The allowable code amount storage unit 201 stores the allowable code amount input by the input unit 200. The model parameter storage unit 202 stores the model parameters input from the input unit 200. The frame rate storage unit 203 stores the current frame rate, and stores the initial frame rate input by the input unit 200 as its initial value. The frame rate increment value storage unit 204 stores the frame rate increment value input from the input unit 200.
フレームレート更新部205は、発生符号量推定値判定部208からフレームレートの更新指示がある場合に、フレームレート記憶部203の記憶するフレームレートをフレームレート増分値記憶部204の記憶するフレームレート増分値分インクリメントして、上書きする形で更新する。
When there is a frame rate update instruction from the generated code amount estimated value determination unit 208, the frame
発生符号量推定部206は、図3に示す本発明の発生符号量推定装置10と同じ装置構成で構成されて、モデルパラメータ記憶部202の記憶するモデルパラメータと、フレームレート記憶部203の記憶するフレームレートとを入力として、そのフレームレートで符号化する場合に発生する符号量の推定値を算出する。発生符号量推定値記憶部207は、発生符号量推定部206の算出した発生符号量推定値を記憶する。
The generated code amount estimation unit 206 is configured with the same apparatus configuration as the generated code amount estimation device 10 of the present invention shown in FIG. 3, and stores the model parameters stored in the model parameter storage unit 202 and the frame rate storage unit 203. Using the frame rate as an input, an estimated value of the amount of code generated when encoding at that frame rate is calculated. The generated code amount estimated
発生符号量推定値判定部208は、発生符号量推定値記憶部207の記憶する発生符号量推定値と、許容符号量記憶部201の記憶する許容符号量とを比較して、発生符号量推定値より許容符号量の方が大きい場合には、フレームレート更新部205に対してフレームレートの更新を指示し、許容符号量より発生符号量推定値の方が大きい場合には、フレームレート出力部209に対して、フレームレート記憶部203に格納されたフレームレートの値の出力を指示する。
The generated code amount estimated value determination unit 208 compares the generated code amount estimated value stored in the generated code amount estimated
フレームレート出力部209は、発生符号量推定値判定部208により出力指示されるフレームレートを出力する。
The frame
図6に、図5のように構成される本発明のフレームレート推定装置20の実行する処理フローの一例を図示する。 FIG. 6 shows an example of a processing flow executed by the frame rate estimation apparatus 20 of the present invention configured as shown in FIG.
次に、図6の処理フローに従って、本発明のフレームレート推定装置20の実行する処理について詳細に説明する。 Next, processing executed by the frame rate estimation apparatus 20 of the present invention will be described in detail according to the processing flow of FIG.
本発明のフレームレート推定装置20は、フレームレートの推定要求が発行されると、図6の処理フローに示すように、先ず最初に、ステップS20で、許容符号量を入力する。 When a frame rate estimation request is issued, the frame rate estimation apparatus 20 of the present invention first inputs an allowable code amount in step S20 as shown in the processing flow of FIG.
続いて、ステップS21で、第3の発明を実現する場合には、上述したモデルパラメータA”,B”,C”,D”を入力し、第4の発明を実現する場合には、上述したモデルパラメータB”,C”,D”を入力する。 Subsequently, in step S21, when the third invention is realized, the above-described model parameters A ″, B ″, C ″, D ″ are input, and when the fourth invention is realized, the above-described model parameters A ″, B ″, C ″, D ″ are input. Enter model parameters B ", C", D ".
続いて、ステップS22で、フレームレートの初期値を入力して、現在のフレームレートをその初期値に設定し、さらに、その値をレジスタSに格納する。続いて、ステップS23で、フレームレートの増分値を入力して、フレームレートの増分値を設定する。 Subsequently, in step S22, an initial value of the frame rate is input, the current frame rate is set to the initial value, and the value is stored in the register S. In step S23, the frame rate increment value is input to set the frame rate increment value.
続いて、ステップS24で、図3に示す本発明の発生符号量推定装置10と同じ装置構成で構成される発生符号量推定部206の処理に従って、現在のフレームレート(フレームレート記憶部203に記憶されるフレームレート)で符号化した場合に発生する符号量の推定値を算出する。 Subsequently, in step S24, the current frame rate (stored in the frame rate storage unit 203) according to the processing of the generated code amount estimation unit 206 having the same apparatus configuration as the generated code amount estimation apparatus 10 of the present invention shown in FIG. The estimated amount of code generated when encoding is performed at a frame rate).
すなわち、第3の発明を実現する場合には、入力したモデルパラメータA”,B”,C”,D”と、現在のフレームレートとを使って、図4の処理フローを実行することで、式(16)に従って現在のフレームレートで符号化した場合に発生する符号量の推定値を算出し、第4の発明を実現する場合には、入力したモデルパラメータB”,C”,D”と、現在のフレームレートとを使って、図4の処理フローを実行することで、式(17)に従って現在のフレームレートで符号化した場合に発生する符号量の推定値を算出するのである。 That is, when realizing the third invention, by executing the processing flow of FIG. 4 using the input model parameters A ″, B ″, C ″, D ″ and the current frame rate, When an estimated value of a code amount generated when encoding is performed at the current frame rate according to the equation (16) and the fourth invention is realized, the input model parameters B ″, C ″, D ″ and By executing the processing flow of FIG. 4 using the current frame rate, an estimated value of the code amount generated when encoding is performed at the current frame rate according to the equation (17) is calculated.
続いて、ステップS25で、算出した発生符号量の推定値が入力した許容符号量よりも小さいの否かを判断して、発生符号量の推定値の方が許容符号量よりも小さいことを判断するときには、ステップS26に進んで、現在のフレームレートをレジスタSに格納する。 Subsequently, in step S25, it is determined whether or not the calculated estimated amount of generated code is smaller than the input allowable code amount, and it is determined that the estimated generated code amount is smaller than the allowable code amount. If so, the process proceeds to step S26, and the current frame rate is stored in the register S.
続いて、ステップS27で、フレームレートの増分値に応じて、現在のフレームレートをインクリメントしてから、ステップS24の処理に戻る。 Subsequently, in step S27, the current frame rate is incremented according to the increment value of the frame rate, and then the process returns to step S24.
このようにして、ステップS24〜ステップS27の処理を繰り返していくことで、ステップS25で、算出した発生符号量の推定値の方が入力した許容符号量よりも大きくなったことを判断するときには、ステップS28に進んで、レジスタSに格納してあるフレームレート(1つ前に更新したフレームレート)を出力して、処理を終了する。 In this way, by repeating the processing of step S24 to step S27, when it is determined in step S25 that the calculated estimated code amount is larger than the input allowable code amount, Proceeding to step S28, the frame rate (frame rate updated immediately before) stored in the register S is output, and the process is terminated.
このようにして、本発明のフレームレート推定装置20は、符号量を許容符号量以下に抑えるという制約条件が与えられた場合に、それを実現する最大のフレームレートを推定する処理を行うのである。 In this way, the frame rate estimation apparatus 20 according to the present invention performs a process of estimating the maximum frame rate that realizes the restriction when the code amount is limited to the allowable code amount or less. .
10 発生符号量推定装置
100 入力部
101 モデルパラメータ記憶部
102 フレームレート記憶部
103 フレームレート演算算出部
104 フレームレート演算結果記憶部
105 推定予測誤差電力算出部
106 推定予測誤差電力記憶部
107 対数値算出部
108 対数値記憶部
109 発生符号量推定値算出部
110 発生符号量推定値記憶部
111 発生符号量推定値出力部
DESCRIPTION OF SYMBOLS 10 Generated code
Claims (13)
4個のモデルパラメータを入力する過程と、
上記入力した4個のモデルパラメータを係数として用い、推定予測誤差電力の算出に用いられるフレームレートの逆数、フレームレートの平方根の逆数、フレームレートの一乗値および定数項の線形和とするコスト関数を決定する過程と、
上記決定したコスト関数の対数とフレームレートとを乗じることで得られる算出式に対して、与えられたフレームレートの値を代入することで算出値を得て、その算出値に基づいて、与えられたフレームレートで映像を符号化する場合に発生する符号量を算出する過程とを備えることを、
特徴とする符号量推定方法。 A code amount estimation method that is used in video encoding with inter-frame prediction and estimates a code amount generated when video is encoded at a given frame rate,
Input four model parameters,
Using the four model parameters input as coefficients , a cost function that is a reciprocal of the frame rate used to calculate the estimated prediction error power, a reciprocal of the square root of the frame rate, a square value of the frame rate, and a linear sum of constant terms The decision process,
A calculated value is obtained by substituting the value of the given frame rate for the calculation formula obtained by multiplying the logarithm of the cost function determined above and the frame rate, and is given based on the calculated value. And a process of calculating a code amount generated when video is encoded at a different frame rate,
A characteristic code amount estimation method.
3個のモデルパラメータを入力する過程と、
上記入力した3個のモデルパラメータを係数として用い、推定予測誤差電力の算出に用いられるフレームレートの平方根の逆数、フレームレートの一乗値および定数項の線形和とするコスト関数を決定する過程と、
上記決定したコスト関数の対数とフレームレートとを乗じることで得られる算出式に対して、与えられたフレームレートの値を代入することで算出値を得て、その算出値に基づいて、与えられたフレームレートで映像を符号化する場合に発生する符号量を算出する過程とを備えることを、
特徴とする符号量推定方法。 A code amount estimation method that is used in video encoding with inter-frame prediction and estimates a code amount generated when video is encoded at a given frame rate,
The process of entering three model parameters;
A process of determining a cost function that uses the three input model parameters as coefficients and that is a reciprocal of a square root of a frame rate, a square value of a frame rate, and a linear sum of constant terms used to calculate an estimated prediction error power;
A calculated value is obtained by substituting the value of the given frame rate for the calculation formula obtained by multiplying the logarithm of the cost function determined above and the frame rate, and is given based on the calculated value. And a process of calculating a code amount generated when video is encoded at a different frame rate,
A characteristic code amount estimation method.
4個のモデルパラメータを入力し、その入力した4個のモデルパラメータを係数として用い、推定予測誤差電力の算出に用いられるフレームレートの逆数、フレームレートの平方根の逆数、フレームレートの一乗値および定数項の線形和とするコスト関数を決定して、その決定したコスト関数の対数とフレームレートとを乗じることで求められる算出式を導出する過程と、
上記導出した算出式に対して、複数のフレームレートの値を代入することで算出値を得て、それらの算出値に基づいて、それらのフレームレートで映像を符号化する場合に発生する符号量を算出して、それらの算出した符号量と制約条件となる符号量とを比較することで、その符号量の制約条件下において達成可能な最大のフレームレートを推定する過程とを備えることを、
特徴とするフレームレート推定方法。 A frame rate estimation method for estimating a maximum frame rate that is used in video encoding with inter-frame prediction and can be achieved under a given code amount constraint condition,
Four model parameters are input, and the input four model parameters are used as coefficients. The reciprocal of the frame rate, the reciprocal of the square root of the frame rate, the square value of the frame rate, and a constant are used to calculate the estimated prediction error power. Determining a cost function as a linear sum of terms and deriving a calculation formula obtained by multiplying the logarithm of the determined cost function and the frame rate;
The amount of code generated when a calculated value is obtained by substituting a plurality of frame rate values into the derived calculation formula, and video is encoded at the frame rate based on the calculated value. And calculating a maximum frame rate achievable under the constraint condition of the code amount by comparing the calculated code amount and the code amount that is the constraint condition,
A characteristic frame rate estimation method.
3個のモデルパラメータを入力し、その入力した3個のモデルパラメータを係数として用い、推定予測誤差電力の算出に用いられるフレームレートの平方根の逆数、フレームレートの一乗値および定数項の線形和とするコスト関数を決定して、その決定したコスト関数の対数とフレームレートとを乗じることで求められる算出式を導出する過程と、
上記導出した算出式に対して、複数のフレームレートの値を代入することで算出値を得て、それらの算出値に基づいて、それらのフレームレートで映像を符号化する場合に発生する符号量を算出して、それらの算出した符号量と制約条件となる符号量とを比較することで、その符号量の制約条件下において達成可能な最大のフレームレートを推定する過程とを備えることを、
特徴とするフレームレート推定方法。 A frame rate estimation method for estimating a maximum frame rate that is used in video encoding with inter-frame prediction and can be achieved under a given code amount constraint condition,
Three model parameters are input, and the input three model parameters are used as coefficients. The reciprocal of the square root of the frame rate used to calculate the estimated prediction error power, the square value of the frame rate, and the linear sum of the constant terms Determining a cost function to be calculated, and deriving a calculation formula obtained by multiplying the logarithm of the determined cost function and the frame rate,
The amount of code generated when a calculated value is obtained by substituting a plurality of frame rate values into the derived calculation formula, and video is encoded at the frame rate based on the calculated value. And calculating a maximum frame rate achievable under the constraint condition of the code amount by comparing the calculated code amount and the code amount that is the constraint condition,
A characteristic frame rate estimation method.
上記推定する過程では、評価対象となるフレームレートの値を設定して、上記導出した算出式に対して、そのフレームレートの値を代入することで算出値を得て、その算出値に基づいて、そのフレームレートで映像を符号化する場合に発生する符号量を算出し、その算出した符号量と制約条件となる符号量とを比較して、その比較結果に基づいて、評価対象となるフレームレートの値を順次大きくあるいは小さくしていくことを繰り返すことを、
特徴とするフレームレート推定方法。 In the frame rate estimation method according to claim 3 or 4,
In the estimation process, a frame rate value to be evaluated is set, and a calculated value is obtained by substituting the frame rate value for the derived calculation formula. Based on the calculated value, The amount of code generated when video is encoded at the frame rate is calculated, the calculated amount of code is compared with the amount of code that is a constraint condition, and the frame to be evaluated based on the comparison result Repeating increasing or decreasing rate values sequentially,
A characteristic frame rate estimation method.
4個のモデルパラメータを入力する手段と、
上記入力した4個のモデルパラメータを係数として用い、推定予測誤差電力の算出に用いられるフレームレートの逆数、フレームレートの平方根の逆数、フレームレートの一乗値および定数項の線形和とするコスト関数を決定する手段と、
上記決定したコスト関数の対数とフレームレートとを乗じることで得られる算出式に対して、与えられたフレームレートの値を代入することで算出値を得て、その算出値に基づいて、与えられたフレームレートで映像を符号化する場合に発生する符号量を算出する手段とを備えることを、
特徴とする符号量推定装置。 A code amount estimation device that is used in video encoding with inter-frame prediction and estimates a code amount generated when video is encoded at a given frame rate,
Means for inputting four model parameters;
Using the four model parameters input as coefficients , a cost function that is a reciprocal of the frame rate used to calculate the estimated prediction error power, a reciprocal of the square root of the frame rate, a square value of the frame rate, and a linear sum of constant terms Means to determine,
A calculated value is obtained by substituting the value of the given frame rate for the calculation formula obtained by multiplying the logarithm of the cost function determined above and the frame rate, and is given based on the calculated value. Means for calculating the amount of code generated when video is encoded at a different frame rate,
Characteristic code amount estimation apparatus.
3個のモデルパラメータを入力する手段と、
上記入力した3個のモデルパラメータを係数として用い、推定予測誤差電力の算出に用いられるフレームレートの平方根の逆数、フレームレートの一乗値および定数項の線形和とするコスト関数を決定する手段と、
上記決定したコスト関数の対数とフレームレートとを乗じることで得られる算出式に対して、与えられたフレームレートの値を代入することで算出値を得て、その算出値に基づいて、与えられたフレームレートで映像を符号化する場合に発生する符号量を算出する手段とを備えることを、
特徴とする符号量推定装置。 A code amount estimation device that is used in video encoding with inter-frame prediction and estimates a code amount generated when video is encoded at a given frame rate,
Means for inputting three model parameters;
Means for determining a cost function that uses the three input model parameters as coefficients and uses a reciprocal of a square root of a frame rate, a square value of a frame rate, and a linear sum of a constant term used to calculate an estimated prediction error power;
A calculated value is obtained by substituting the value of the given frame rate for the calculation formula obtained by multiplying the logarithm of the cost function determined above and the frame rate, and is given based on the calculated value. Means for calculating the amount of code generated when video is encoded at a different frame rate,
Characteristic code amount estimation apparatus.
4個のモデルパラメータを入力し、その入力した4個のモデルパラメータを係数として用い、推定予測誤差電力の算出に用いられるフレームレートの逆数、フレームレートの平方根の逆数、フレームレートの一乗値および定数項の線形和とするコスト関数を決定して、その決定したコスト関数の対数とフレームレートとを乗じることで求められる算出式を導出する手段と、
上記導出した算出式に対して、複数のフレームレートの値を代入することで算出値を得て、それらの算出値に基づいて、それらのフレームレートで映像を符号化する場合に発生する符号量を算出して、それらの算出した符号量と制約条件となる符号量とを比較することで、その符号量の制約条件下において達成可能な最大のフレームレートを推定する手段とを備えることを、
特徴とするフレームレート推定装置。 A frame rate estimation device that is used in video encoding with inter-frame prediction and estimates the maximum frame rate that can be achieved under a given code amount constraint condition,
Four model parameters are input, and the input four model parameters are used as coefficients. The reciprocal of the frame rate, the reciprocal of the square root of the frame rate, the square value of the frame rate, and a constant are used to calculate the estimated prediction error power. Means for deriving a calculation formula obtained by determining a cost function as a linear sum of terms and multiplying the logarithm of the determined cost function and a frame rate;
The amount of code generated when a calculated value is obtained by substituting a plurality of frame rate values into the derived calculation formula, and video is encoded at the frame rate based on the calculated value. And a means for estimating the maximum frame rate achievable under the constraint condition of the code amount by comparing the calculated code amount and the code amount that is the constraint condition,
A frame rate estimation device as a feature.
3個のモデルパラメータを入力し、その入力した3個のモデルパラメータを係数として用い、推定予測誤差電力の算出に用いられるフレームレートの平方根の逆数、フレームレートの一乗値および定数項の線形和とするコスト関数を決定して、その決定したコスト関数の対数とフレームレートとを乗じることで求められる算出式を導出する手段と、
上記導出した算出式に対して、複数のフレームレートの値を代入することで算出値を得て、それらの算出値に基づいて、それらのフレームレートで映像を符号化する場合に発生する符号量を算出して、それらの算出した符号量と制約条件となる符号量とを比較することで、その符号量の制約条件下において達成可能な最大のフレームレートを推定する手段とを備えることを、
特徴とするフレームレート推定装置。 A frame rate estimation device that is used in video encoding with inter-frame prediction and estimates the maximum frame rate that can be achieved under a given code amount constraint condition,
Three model parameters are input, and the input three model parameters are used as coefficients. The reciprocal of the square root of the frame rate used to calculate the estimated prediction error power, the square value of the frame rate, and the linear sum of the constant terms Determining a cost function to be calculated, and deriving a calculation formula obtained by multiplying the logarithm of the determined cost function and the frame rate;
The amount of code generated when a calculated value is obtained by substituting a plurality of frame rate values into the derived calculation formula, and video is encoded at the frame rate based on the calculated value. And a means for estimating the maximum frame rate achievable under the constraint condition of the code amount by comparing the calculated code amount and the code amount that is the constraint condition,
A frame rate estimation device as a feature.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006131608A JP4695015B2 (en) | 2006-05-10 | 2006-05-10 | Code amount estimation method, frame rate estimation method, code amount estimation device, frame rate estimation device, code amount estimation program, frame rate estimation program, and computer-readable recording medium recording those programs |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006131608A JP4695015B2 (en) | 2006-05-10 | 2006-05-10 | Code amount estimation method, frame rate estimation method, code amount estimation device, frame rate estimation device, code amount estimation program, frame rate estimation program, and computer-readable recording medium recording those programs |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007306223A JP2007306223A (en) | 2007-11-22 |
JP4695015B2 true JP4695015B2 (en) | 2011-06-08 |
Family
ID=38839803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006131608A Expired - Fee Related JP4695015B2 (en) | 2006-05-10 | 2006-05-10 | Code amount estimation method, frame rate estimation method, code amount estimation device, frame rate estimation device, code amount estimation program, frame rate estimation program, and computer-readable recording medium recording those programs |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4695015B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4616234B2 (en) * | 2006-10-31 | 2011-01-19 | 日本電信電話株式会社 | Code amount estimation method, frame rate estimation method, code amount estimation device, frame rate estimation device, code amount estimation program, frame rate estimation program, and computer-readable recording medium recording these programs |
JP4785890B2 (en) * | 2008-04-18 | 2011-10-05 | 日本電信電話株式会社 | Motion estimation accuracy estimation method, motion estimation accuracy estimation device, motion estimation accuracy estimation program, and computer-readable recording medium recording the program |
JP5118005B2 (en) * | 2008-12-10 | 2013-01-16 | 日本電信電話株式会社 | FRAME RATE CONVERSION METHOD, FRAME RATE CONVERSION DEVICE, FRAME RATE CONVERSION PROGRAM, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING THE PROGRAM |
JP5118087B2 (en) * | 2009-03-03 | 2013-01-16 | 日本電信電話株式会社 | Frame rate conversion method, frame rate conversion device, and frame rate conversion program |
JP5161172B2 (en) * | 2009-08-25 | 2013-03-13 | 日本電信電話株式会社 | Frame rate conversion method, frame rate conversion device, and frame rate conversion program |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005151280A (en) * | 2003-11-18 | 2005-06-09 | Matsushita Electric Ind Co Ltd | Camera apparatus |
-
2006
- 2006-05-10 JP JP2006131608A patent/JP4695015B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005151280A (en) * | 2003-11-18 | 2005-06-09 | Matsushita Electric Ind Co Ltd | Camera apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP2007306223A (en) | 2007-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11354785B2 (en) | Image processing method and device, storage medium and electronic device | |
JP5521202B2 (en) | Multi-view image encoding method, multi-view image decoding method, multi-view image encoding device, multi-view image decoding device, multi-view image encoding program, and multi-view image decoding program | |
KR102285738B1 (en) | Method and apparatus for assessing subjective quality of a video | |
JP6905093B2 (en) | Optical flow estimation of motion compensation prediction in video coding | |
JP5436458B2 (en) | Multi-view image encoding method, multi-view image decoding method, multi-view image encoding device, multi-view image decoding device, multi-view image encoding program, and multi-view image decoding program | |
US20170359586A1 (en) | Transcoding techniques for alternate displays | |
EP3343923B1 (en) | Motion vector field coding method and decoding method, and coding and decoding apparatuses | |
EP2727344B1 (en) | Frame encoding selection based on frame similarities and visual quality and interests | |
US12262032B2 (en) | Reinforcement learning based rate control | |
JP4695015B2 (en) | Code amount estimation method, frame rate estimation method, code amount estimation device, frame rate estimation device, code amount estimation program, frame rate estimation program, and computer-readable recording medium recording those programs | |
TW200913668A (en) | Video noise reduction | |
KR20220139800A (en) | Machine learning model-based video compression | |
WO2019001283A1 (en) | Method and apparatus for controlling encoding resolution ratio | |
JP2007201975A (en) | Code amount estimating method, frame rate estimating method, code amount estimating apparatus, frame rate estimating apparatus, code amount estimating program, frame rate estimating program, and computer readable storage medium for storing program | |
JP6626319B2 (en) | Encoding device, imaging device, encoding method, and program | |
JP4236654B2 (en) | Video encoding apparatus and method | |
JP4764136B2 (en) | Moving picture coding apparatus and fade scene detection apparatus | |
JP2018006831A (en) | Video filtering method, video filtering device and video filtering program | |
KR20130046377A (en) | Methods for coding and reconstructing a pixel block and corresponding devices | |
JP4616234B2 (en) | Code amount estimation method, frame rate estimation method, code amount estimation device, frame rate estimation device, code amount estimation program, frame rate estimation program, and computer-readable recording medium recording these programs | |
JP5118087B2 (en) | Frame rate conversion method, frame rate conversion device, and frame rate conversion program | |
JP5107879B2 (en) | FRAME RATE CONVERSION METHOD, FRAME RATE CONVERSION DEVICE, FRAME RATE CONVERSION PROGRAM, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING THE PROGRAM | |
JP4785890B2 (en) | Motion estimation accuracy estimation method, motion estimation accuracy estimation device, motion estimation accuracy estimation program, and computer-readable recording medium recording the program | |
JP4833934B2 (en) | Aperture ratio setting method, aperture ratio setting device, aperture ratio setting program, and computer-readable recording medium recording the program | |
JP4824712B2 (en) | Motion estimation accuracy estimation method, motion estimation accuracy estimation device, motion estimation accuracy estimation program, and computer-readable recording medium recording the program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080529 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080801 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100331 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100622 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110222 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110224 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140304 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |