JP4747109B2 - Calculation amount adjustment device - Google Patents
Calculation amount adjustment device Download PDFInfo
- Publication number
- JP4747109B2 JP4747109B2 JP2007005760A JP2007005760A JP4747109B2 JP 4747109 B2 JP4747109 B2 JP 4747109B2 JP 2007005760 A JP2007005760 A JP 2007005760A JP 2007005760 A JP2007005760 A JP 2007005760A JP 4747109 B2 JP4747109 B2 JP 4747109B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- target
- amount
- calculation
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004364 calculation method Methods 0.000 title claims description 208
- 238000012545 processing Methods 0.000 claims description 78
- 238000000034 method Methods 0.000 claims description 75
- 230000008569 process Effects 0.000 claims description 51
- 238000013459 approach Methods 0.000 claims description 6
- 230000033001 locomotion Effects 0.000 description 38
- 238000005259 measurement Methods 0.000 description 24
- 238000013441 quality evaluation Methods 0.000 description 23
- 238000004891 communication Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 230000015556 catabolic process Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000006731 degradation reaction Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000013139 quantization Methods 0.000 description 8
- 230000002123 temporal effect Effects 0.000 description 7
- 230000007423 decrease Effects 0.000 description 5
- 230000006866 deterioration Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- ZKFQEACEUNWPMT-UHFFFAOYSA-N Azelnidipine Chemical compound CC(C)OC(=O)C1=C(C)NC(N)=C(C(=O)OC2CN(C2)C(C=2C=CC=CC=2)C=2C=CC=CC=2)C1C1=CC=CC([N+]([O-])=O)=C1 ZKFQEACEUNWPMT-UHFFFAOYSA-N 0.000 description 2
- 229950004646 azelnidipine Drugs 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、テレビ会議システム、監視カメラ、映像記録再生装置、映像作成装置など、動画像の符号化、復号化、またはその両方を行うシステムにおいて、符号化処理および復号化処理に使用される演算量が目標とする演算量になるように画像の符号化情報を調整する演算量調整装置および方法に関する。 The present invention relates to operations used for encoding processing and decoding processing in a system that performs encoding, decoding, or both of moving images, such as a video conference system, a surveillance camera, a video recording / playback device, and a video creation device. The present invention relates to a calculation amount adjustment apparatus and method for adjusting coding information of an image so that the amount becomes a target calculation amount.
デジタル化された動画像はそのままでは膨大なデータ量であり、そのハンドリングは困難であるが、このデータ量を削減する技術である動画像の符号化/復号化を用いることにより、近年では、各種映像装置やパーソナルコンピュータ(以下PC)や携帯電話などのような機器で、動画像を記録/再生/編集することが可能となってきている。この動画像の符号化/復号化方式の規格としてMPEG−1、MPEG−2、MPEG−4などのMPEG(Motion Picture Image Coding Experts Group)で標準化された規格、また、H.261、H.262、H.263、H.264などのITU−T(International Telecommunication Union Telecommunication Standardization Sector)が勧告するH.260番台の規格が広く用いられている。まず、これらの規格に準拠した動画像符号化/復号化方式について説明する。 A digitized moving image has an enormous amount of data as it is, and its handling is difficult. However, by using moving image encoding / decoding, which is a technology for reducing this data amount, It has become possible to record / play / edit moving images with devices such as video devices, personal computers (hereinafter referred to as PCs), and mobile phones. As a standard for the encoding / decoding method of the moving image, a standard standardized by MPEG (Motion Picture Image Coding Experts Group) such as MPEG-1, MPEG-2, MPEG-4, etc. 261, H.H. 262, H.C. 263, H.M. H.264, etc. recommended by ITU-T (International Telecommunication Union Telecommunication Standardization Sector). The 260 series standards are widely used. First, a video encoding / decoding system compliant with these standards will be described.
図17は、MPEGおよびITU−T H.260番台の動画像符号化/復号化方式規格に準拠した動画像処理システムの機能的な構成を示すブロック図である。これらの規格は、時間的に冗長な情報を削減する動き補償予測、空間的に冗長な情報を削減する空間周波数変換、出現頻度に応じた符号量割り当てにより情報量を削減するエントロピー符号化を組み合わせたハイブリッド符号化方式を定めている。 FIG. 17 shows MPEG and ITU-T H.264. It is a block diagram which shows the functional structure of the moving image processing system based on the 260th moving image encoding / decoding system specification. These standards combine motion-compensated prediction that reduces temporally redundant information, spatial frequency conversion that reduces spatially redundant information, and entropy coding that reduces the amount of information by assigning a code amount according to the appearance frequency. A hybrid encoding scheme is defined.
符号化装置である符号化部13010では、まず、ME(Motion Estimation、動き検出)13011およびMC(Motion Compensation、動き補償)13012が、符号化対象画像である原画像13001に対し、原画像13001に対し時間的に前または後ろの画像である参照画像A13002を参照し、動き補償予測を行うことにより時間的に冗長な情報を削減する。
In an
つぎに、DCT(Discrete Cosine Transform、離散コサイン変換)13013が、時間的冗長情報を削減したデータを空間周波数に変換し、更に、Q(Quantize、量子化)13014が、それを量子化することにより、空間的に冗長な情報を削減する。なお、このQ13014が行う量子化のステップ幅を制御することにより、発生する符号化情報量を調整させている。 Next, DCT (Discrete Cosine Transform) 13013 converts the data with reduced temporal redundancy information into a spatial frequency, and Q (Quantize) 13014 quantizes it. Reduce spatially redundant information. Note that the amount of encoded information generated is adjusted by controlling the step width of the quantization performed by Q13014.
最後に、VLC(Variable Length Coding、可変長符号化)13015が空間的冗長情報を削減したデータをエントロピー符号化することにより、情報量を削減し、符号化情報を出力する。 Finally, VLC (Variable Length Coding) 13015 entropy-encodes the data with reduced spatial redundancy information, thereby reducing the amount of information and outputting encoded information.
復号化装置である復号化部13020では、VLD(Variable Length Decoding、可変長復号化)13021、IQ(Inverse Quantize、逆量子化)13012、IDCT(Inverse Discrete Cosine Transform、逆離散コサイン変換)13023、IMC(Inverse Motion Compensation、逆動き補償)13024がそれぞれ、VLC13015、Q13014、DCT13013、MC13012とは逆の変換を行うことにより、符号化情報から復号化された再生画像である復号化画像13004を出力する。
In a
参照画像B13003は、IMC13024が逆動き補償を行うときに参照される画像であり、これには、時間的に前または後ろの復号化画像13004が用いられる。また、符号化部13010でも、Q13014が出力する空間的冗長情報を削減したデータに対し、IQ13016、IDCT13017、IMC13018を行うことにより、符号化情報から復号化された再生画像である参照画像A13002を生成しており、DCTおよびQの演算誤差を無視すれば、符号化部13010の参照画像A13002と復号化部13020の参照画像B13003とは、原理的に同じ画像である。
A reference image B13003 is an image that is referred to when the
図18に、MPEGおよびITU−T H.260番台の動画像符号化/復号化方式規格における処理データ単位を説明する図を示す。 FIG. 18 shows MPEG and ITU-T H.264. The figure explaining the process data unit in the moving image encoding / decoding system specification of the 260 series is shown.
Picture14001はある時刻tの1枚の画像全体を表すデータ単位であり、(M×16画素,N×16ライン)の大きさをもつ(M、Nは自然数)。Slice14002は、Picture14001を垂直方向に16ライン単位で分割した領域を表すデータ単位であり、(N×16N画素,16ライン)の大きさをもつ。MB(Macro Block)14003は、Slice14002を水平方向16画素単位で分割した領域を表すデータ単位であり、(16画素,16ライン)の大きさをもつ。Block14004は、MB14003を水平および垂直方向とも2分割した領域を表すデータ単位であり、(8画素,8ライン)の大きさをもつ。Pixel14005は、Block14004に含まれる16×16個の画素を表すデータ単位であり、DCT13013が行う空間周波数変換の後のデータに関してはDC係数またはAC係数とも呼ばれる。
符号化部13010および復号化部13020はそれぞれ、時間順に並ぶ複数のPicture14001を順次、符号化および復号化処理して行く。このとき、各Picture14001を、ME13011、MC13012、IMC13018、IMC13024はMB14003のデータ単位で処理し、DCT13013、IDCT13017、IDCT13023はBlock14004のデータ単位で処理し、Q13014、IQ13016、VLC13015、VLD13021はPixelまたは係数14005の単位で処理する。
Each of the
つぎに、限られた演算資源量および通信資源量を持つ機器において、これらMPEGおよびITU−T H.260番台の規格に準じた動画像符号化/復号化方式により、1または複数の動画像符号化/復号化処理を実行し、または、動画像符号化/復号化処理と他のアプリケーションを同時に実行する技術について説明する。 Next, in a device having a limited amount of computing resources and communication resources, these MPEG and ITU-T H.264 standards are used. Execute one or more moving image encoding / decoding processes or simultaneously execute moving image encoding / decoding processes and other applications using a moving image encoding / decoding method according to the 260 series standards The technology to do is explained.
動画像の各Picture14001の入出力タイミングは予め定められている(例えば、NTSC方式では各Picture14001は約1/30秒間隔)ため、その期間内で各Picture14001の符号化/復号化処理、および、符号化部13010が出力/送信する符号化情報を通信回線と介して復号化部13020に入力/受信させる必要があるように、動画像符号化/復号化処理はリアルタイム性が要求される。
Since the input / output timing of each
しかしながら、機器が持つ演算資源量および通信資源量では動画像符号化/復号化処理のリアルタイム性を満たせない場合には、動画像符号化/復号化処理に対して演算量および通信量を削減/調整させるための何かしらの対策を施さなければならない。 However, if the computing resource amount and the communication resource amount possessed by the device cannot satisfy the real-time property of the moving image encoding / decoding process, the calculation amount and the communication amount are reduced with respect to the moving image encoding / decoding process. Some measures must be taken to make adjustments.
このようなリアルタイム性に関する困難は、例えば、復号化部13020が動作する演算機器において復号化部13020以外のアプリケーションが同時に動作すること、符号化対象である原画像13001の画像内容によって符号化部13010または復号化部13020の演算量が変動し(この詳細については発明が解決しようとする課題に記す)、想定していた以上の演算資源量が必要となること、および符号化部13010または復号化部13020の機能拡張/バグフィックスなどで必要となる演算資源量が増加することなどによって生じる。
Such difficulties related to real-time characteristics are caused by, for example, the fact that an application other than the
なお、動画像符号化/復号化処理のリアルタイム性を満たすために十分な演算資源量および通信資源量を事前に用意する対策も考えられるが、組込み機器ではコスト制約が強く、限られた演算資源量でリアルタイムな動画像符号化/復号化処理を行うことを強く要請されており、また、符号化部13010または復号化部13020が使用する演算資源量の増加にあわせて、それらが動作する演算機器を再設計するのでは、開発時間とコストがかかり過ぎる。
Although it is possible to prepare a sufficient amount of computing resources and communication resources in advance to satisfy the real-time nature of video encoding / decoding processing, embedded devices are limited in cost and have limited computing resources. There is a strong demand to perform real-time video encoding / decoding processing in an amount, and operations that operate as the amount of arithmetic resources used by the
特許文献1は、このような問題の解決を図る技術を開示している。特許文献1に示される技術では、符号化情報に含まれる1秒間当りのPicture14001の枚数であるフレームレートを低くすること、Picture14001の大きさである画像サイズ(または解像度)を1/2または1/4にすること、Q13014の量子化ステップ幅を制御することで符号化部13010が出力/送信する符号化情報量を削減することにより、動画像符号化/復号化処理が使用する演算資源量および通信資源量の削減を実現する。
なお、フレームレート、画像サイズ、量子化ステップ幅と、演算資源量や通信資源量との対応関係は、予め測定した複数の代表値をスプライン関数で近似して得ている。
しかしながら、特許文献1に開示される技術によっても、依然として2つの課題が残る。以下にそれぞれの課題について説明する。
However, even with the technique disclosed in
第1の課題は、特許文献1の技術では、符号化/復号化処理の対象となる動画像の1秒間当りのPicture14001の枚数であるフレームレートを低くする、Picture14001の大きさである画像サイズを1/2または1/4にするなどにより符号化/復号化処理に必要となる演算量を削減するが、その調整の単位が粗いことである。
The first problem is that in the technique of
調整の単位を単純に計算すれば、フレームレートの調整では符号化/復号化全演算量の1/30単位、画像サイズの調整では符号化/復号化全演算量の1/2または1/4単位という粗い量である。特許文献1の技術では、この単位よりも細かな単位で符号化/復号化処理の演算量を削減できないため、演算量が過剰に削減されるように符号化情報を調整してしまい、この単位未満の量の演算資源を使用することなく余す事態が生じ得る。その場合には、演算資源をちょうど使い切るような復号化画像の画質よりも劣る画質の復号化画像をユーザに提供することになる。
If the unit of adjustment is simply calculated, the adjustment of the frame rate is 1/30 unit of the total amount of encoding / decoding, and the adjustment of the image size is 1/2 or 1/4 of the total amount of encoding / decoding. This is a coarse unit. In the technique of
このように、特許文献1の技術によれば、削減の調整量の単位が粗いために、演算資源を使い切ることなく余してしまい、より良い画質の復号化画像をユーザに提供することができない事態が起こるという課題がある。演算の調整量の単位は、より細かい方がよい。
As described above, according to the technique of
第2の課題は、特許文献1では、動き補償予測により時間的冗長情報を削減されるデータの量に対する考慮がなされていない点にある。
The second problem is that
上記説明したようにMPEGおよびITU−T H.260番台の動画像符号化/復号化方式規格の処理では、動き補償予測により時間的冗長情報を削減したデータに対し、符号化部13010のDCT13013、およびそれ以降のIQ13014、VLC13015、IQ13016、IDCT13017、IMC13018、復号化部13020内の全ての処理がなされることになる。
MPEG and ITU-T H.264 as described above. In the processing of the 260th video coding / decoding scheme standards, for data in which temporal redundancy information is reduced by motion compensation prediction,
このため、動き補償予測により時間的冗長情報を削減したデータ量に依存して、これらの演算量が変化する。動き補償予測により削減されるデータ量は、符号化対象である原画像13001の画像内容(絵柄)に依存し、1つの画像シーケンス内でも時間的にも変化する(以後これをコンテンツ依存性と呼ぶ)。例えば、画像内で時間的変化がない背景領域の多少で、動き補償予測により削減されるデータ量は増減する。特許文献1では、この点が考慮されていない。
For this reason, the amount of calculation changes depending on the amount of data in which temporal redundancy information is reduced by motion compensation prediction. The amount of data reduced by motion compensation prediction depends on the image content (picture) of the
フレームレート、画像サイズ、量子化ステップ幅などの調整パラメータに対する演算量や通信量の対応関係テーブルを事前に決定することは、上記コンテンツ依存性の面から困難であり、また多くのコンテンツの統計データから近似するにしても、世の中に存在する全てのコンテンツから統計データをとる必要があり、これも困難である。このように、コンテンツ依存性のために、調整パラメータに対する演算量や通信量の対応関係を正確に事前に見積もることは困難である。 It is difficult to determine in advance the correspondence table of calculation amount and communication amount for adjustment parameters such as frame rate, image size, quantization step width, etc. from the viewpoint of the content dependency described above, and statistical data of many contents Even if it is approximated from the above, it is necessary to take statistical data from all the contents existing in the world, which is also difficult. As described above, because of the content dependency, it is difficult to accurately estimate the correspondence between the calculation amount and the communication amount with respect to the adjustment parameter in advance.
最も演算量および通信量が大きくなる最悪ケースの画像を想定し、その量に基づいて対応関係を作成してもよい。しかし、この場合、想定した最悪ケースの画像でない画像を符号化/復号化する場合には、演算資源を余してしまい、より良い画質の復号化画像をユーザに提供することができない事態が起こる。 A worst-case image with the largest amount of computation and communication may be assumed, and a correspondence relationship may be created based on the amount. However, in this case, when an image other than the assumed worst case image is encoded / decoded, a calculation resource is left over, and a situation in which a decoded image with better image quality cannot be provided to the user occurs. .
また、調整パラメータに対する演算量や通信量の対応関係をニューラルネットワークやファジイクラシファイシステムに学習させることも考えられる、シーンチェンジなど画像内容が劇的に変化する場合、その追従能力は学習の収束スピードに依存し、学習中は適切な対応関係とならない。この学習結果に基づき演算量を調整した場合、演算資源を余す、または、演算資源が不足するなどの結果を招く。 In addition, if the image content changes drastically, such as scene changes, it may be possible to let the neural network or fuzzy classification system learn the correspondence between the calculation amount and communication amount for the adjustment parameter. Depends on the situation and does not correspond properly during learning. When the calculation amount is adjusted based on the learning result, a result such as surplus calculation resources or a shortage of calculation resources is caused.
上記従来の技術を解決するために、本発明の演算量調整装置の1つの態様は、動画像を各々が1画像よりも小さく個々に処理される複数のデータ単位から構成される符号化情報に符号化する符号化部と、前記符号化情報を動画像に復号化する復号化部とから構成される動画像処理システムに用いられる演算量調整装置であって、前記復号化部が使用可能な演算資源量である残存演算資源量を測定する演算資源量測定手段と、前記測定された残存演算資源量と、前記復号化部で1つのデータ単位を処理するために使用される演算資源量とから、前記復号化部で処理できるデータ単位の上限数を決定し、前記決定された上限数以下で、かつ前記符号化情報で表される画像の画質が予め指定された目標画質に近づくように、前記符号化情報に含まれるデータ単位の目標数である目標データ単位数を決定する目標データ単位数決定手段と、前記符号化情報に含まれる前記データ単位の数を、前記目標データ単位数以下に制限するデータ単位数制御手段とを備える。
また、本発明の演算量調整装置の1つの態様は、動画像を各々が1画像よりも小さく個々に処理される複数のデータ単位から構成される符号化情報に符号化する符号化部と、前記符号化情報を動画像に復号化する復号化部とから構成される動画像処理システムに用いられる演算量調整装置であって、前記符号化部が使用可能な演算資源量である残存演算資源量を算出する演算資源量測定手段と、前記算出された残存演算資源量と、前記復号化部で1つのデータ単位を処理するために使用される演算資源量とから、前記復号化部で処理できるデータ単位の上限数を決定し、前記決定された上限数以下で、かつ前記符号化情報で表される画像の画質が予め指定された目標画質に近づくように、前記符号化情報に含まれるデータ単位の目標数である目標データ単位数を決定する目標データ単位数決定手段と、前記符号化情報に含まれる前記データ単位の数を、前記目標データ単位数以下に制限するデータ単位数制御手段とを備える。
In order to solve the above-described conventional technique, one aspect of the calculation amount adjustment apparatus according to the present invention is to convert encoded images into encoded information composed of a plurality of data units each individually processed smaller than one image. A calculation amount adjustment device used in a moving image processing system including an encoding unit for encoding and a decoding unit for decoding the encoded information into a moving image, and the decoding unit can be used A computing resource amount measuring means for measuring a remaining computing resource amount that is a computing resource amount, the measured remaining computing resource amount, and a computing resource amount used for processing one data unit in the decoding unit; From this, the upper limit number of data units that can be processed by the decoding unit is determined, and the image quality of the image represented by the encoding information is less than the determined upper limit number and approaches the target image quality specified in advance. Included in the encoded information Target data unit number determining means for determining a target data unit number, which is the target number of data units, and data unit number control means for limiting the number of data units included in the encoded information to the target data unit number or less. With.
Also, one aspect of the calculation amount adjustment apparatus of the present invention is an encoding unit that encodes a moving image into encoding information composed of a plurality of data units each processed smaller than one image, A calculation amount adjustment device used in a moving image processing system including a decoding unit that decodes the encoded information into a moving image, the remaining calculation resource being an amount of calculation resources usable by the encoding unit Processing in the decoding unit from the calculation resource amount measuring means for calculating the amount, the calculated remaining calculation resource amount, and the calculation resource amount used for processing one data unit in the decoding unit The upper limit number of data units that can be determined is determined, and is included in the encoding information so that the image quality of the image represented by the encoding information is less than the determined upper limit number and approaches the target image quality specified in advance. The target number of data units Comprising the target data unit number determining means for determining a target number of data units, the number of the data units included in the coding information, and a data unit number control means for limiting the following number of the target data unit.
ここで、前記データ単位は、前記符号化情報は、Motion Picture Image Coding Experts Groupで標準化された規格に準拠した動画像データ、又はInternational Telecommunication Union Telecommunication Standardization Sectorが勧告する規格に準拠した動画像データであり、前記データ単位は、画素、係数、ブロック、マクロブロック、及びスライスのうちの少なくとも1つであるとしてもよい。 In this case, the encoding unit is video data that conforms to a standard standardized by Motion Picture Image Coding Experts Group, or a video that is recommended by an international telecommunications union telecommunications standard standard video. The data unit may be at least one of a pixel, a coefficient, a block, a macroblock, and a slice.
この構成によれば、従来の技術に比べてより細かい単位で、また、コンテンツ依存性なく、前記符号化情報を、前記演算装置で使用可能な演算資源量の中で符号化処理又は復号化処理されるように調整できる。 According to this configuration, the encoding information is encoded or decoded within a calculation resource amount that can be used by the arithmetic device in a finer unit than the conventional technology and without content dependency. Can be adjusted.
また、前記データ単位数制御手段は、前記符号化情報から取り除いた場合に復号化して得られる画像の画質劣化がより目立ちにくいデータ単位を優先して取り除くことにより、前記データ単位の数を前記目標データ単位数以下に制御してもよい。 In addition, the data unit number control means preferentially removes data units that are less noticeable in image quality deterioration of an image obtained by decoding when removed from the encoded information, thereby determining the number of data units. You may control below the number of data units.
この構成によれば、前記符号化情報を調整した結果、復号化することにより得られる画像に生じる画質劣化の印象を、抑制することができる。 According to this configuration, as a result of adjusting the encoding information, it is possible to suppress an impression of image quality degradation that occurs in an image obtained by decoding.
また、前記目標データ単位数決定手段は、先に復号化して得られた画像の画質が所定の目標画質よりも悪かった場合には、前記画像を表す符号化情報を生成する際に決定された目標データ単位数よりも大きな値を前記目標データ単位数として決定してもよい。 Further, the target data unit number determining means is determined when generating the encoding information representing the image when the image quality of the image obtained by the previous decoding is worse than a predetermined target image quality. A value larger than the target data unit number may be determined as the target data unit number.
この構成によれば、前記目標データ単位数が、前記符号化情報を復号化することにより得られる画像の画質を目標画質に近づけるように決定される結果、前記符号化情報の調整によって演算資源量を制限しつつ、目標画質を維持できる可能性が高まる。 According to this configuration, as a result of determining the target data unit number so that the image quality of the image obtained by decoding the encoded information is close to the target image quality, the amount of computation resources is adjusted by adjusting the encoded information. The possibility that the target image quality can be maintained is increased.
また、前記目標データ単位数決定手段は、前記符号化情報を復号化して得られる画像の画質を前記所定の目標画質とするために決定すべき値が前記上限数を超える場合、ユーザに対して目標画質の下方修正を促す通知を行うか、若しくは前記演算機器において前記生成処理又は前記復号化処理以外の処理を行うアプリケーションプログラムが使用する演算資源量を減少させる制御を行ってもよい。 In addition, the target data unit number determining means is configured to notify a user when a value to be determined to set the image quality of an image obtained by decoding the encoded information to the predetermined target image quality exceeds the upper limit number. Control for reducing the amount of computing resources used by an application program that performs a process other than the generation process or the decoding process in the computing device may be performed to notify the target image quality to be corrected downward.
この構成によれば、演算資源量の制限と、目標画質の維持とを両立できない場合に、ユーザの介入、又は他のアプリケーションプログラムに対する制御によって、演算資源量と目標画質との新たなトレードオフを見出すことができる。 According to this configuration, when it is impossible to achieve both the limitation of the computational resource amount and the maintenance of the target image quality, a new trade-off between the computational resource amount and the target image quality can be achieved through user intervention or control over other application programs. Can be found.
また、前記目標データ単位数決定手段は、先に復号化して得られた複数の画像の画質のばらつきが一定値以上となった場合、ユーザに対して目標画質の上方修正を促す通知を行うか、若しくは前記演算機器において前記生成処理又は前記復号化処理以外の処理を行うアプリケーションプログラムが使用する演算資源量を減少させる制御を行ってもよい。 Whether the target data unit number determining means notifies the user of upward correction of the target image quality when variations in the image quality of the plurality of images obtained by the previous decoding exceed a certain value. Alternatively, control may be performed to reduce the amount of computing resources used by an application program that performs processing other than the generation processing or the decoding processing in the arithmetic device.
この構成によれば、画質の時間的ばらつきによる画質印象の劣化を軽減することができる。 According to this configuration, it is possible to reduce deterioration in image quality impression due to temporal variations in image quality.
また、前記目標データ単位数決定手段は、前記演算機器において、新たな生成処理又は新たな復号化処理を開始できるだけの演算資源量がない場合、ユーザに対して目標画質の下方修正を促す通知を行うか、若しくは先に動作している生成処理又は復号化処理が使用する演算資源量を減少させる制御を行ってもよい。 In addition, the target data unit number determination means notifies the user of a downward correction of the target image quality when there is not enough calculation resource amount to start a new generation process or a new decoding process in the arithmetic device. Alternatively, control may be performed to reduce the amount of computing resources used by the generation process or the decoding process that is operating earlier.
この構成によれば、ユーザの介入、又は先に動作している生成処理又は復号化処理に対する制御によって、前記新たな符号化処理又は前記新たな復号化処理を開始できる可能性が高まる。 According to this configuration, the possibility that the new encoding process or the new decoding process can be started is increased by user intervention or the control over the generation process or decoding process that is operating earlier.
なお、本発明は、演算量調整装置を含む動画像処理システムとして実現することもできる。また、演算量調整方法、およびその方法をコンピュータに実行させるプログラムとして実現することもできる。また、複数の演算量調整装置が動作するシステムとして実現することできる。また、本発明に係るプログラムをCD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができることは言うまでもない。 The present invention can also be realized as a moving image processing system including a calculation amount adjustment device. Further, the calculation amount adjustment method and a program for causing a computer to execute the method can also be realized. Further, it can be realized as a system in which a plurality of calculation amount adjusting devices operate. Needless to say, the program according to the present invention can be distributed via a recording medium such as a CD-ROM or a transmission medium such as the Internet.
本発明の演算量調整装置によれば、1画像を構成する1画像よりも小さなデータ単位である、Pixel、係数、Block、MB、Sliceのデータ単位で、符号化処理により生成される符号化情報に含まれる上記データ単位のデータ数を制限するので、従来の技術に比べてより細かな単位で、前記符号化情報の処理に必要な演算資源量を制限することができる。 According to the calculation amount adjustment apparatus of the present invention, the encoding information generated by the encoding process in the data unit of Pixel, coefficient, Block, MB, and Slice, which is a data unit smaller than one image constituting one image. Since the number of data units included in the data unit is limited, it is possible to limit the amount of calculation resources necessary for processing the encoded information in a finer unit than the conventional technique.
これにより、演算資源を過剰に抑制することがなくなるので、演算資源をぎりぎりまで使い切きり、より良い画質の復号化画像をユーザに提供することが可能となる。また、コンテンツに依存せず演算量をある一定値以下に調整することができるため、演算資源を過剰に抑制する、抑制し足りず必要な演算資源が不足する、または、画質が急激に変化することによる画質印象の劣化などを起こすことがない。 As a result, the computation resources are not excessively suppressed, so that the computation resources can be used up to the limit, and a decoded image with better image quality can be provided to the user. In addition, since the amount of computation can be adjusted to a certain value or less without depending on the content, the computation resources are excessively suppressed, insufficient computation resources are insufficient, or the image quality changes rapidly. There will be no degradation of the image quality impression.
更には、符号化処理または復号化処理を行う演算機器の演算資源量、または、演算機器に残存する演算資源量に基づき、符号化または復号化処理で使用する演算資源量を調整するので、予め正確な演算量を見積もりする必要がない。また、同時に他のアプリケーションが動作する状況や、符号化処理または復号化処理の機能拡張又はバグフィックスなどで当初より必要な演算資源量が増加する状況においても、状況に追従して好適な調整を行うことが可能となる。 Furthermore, since the amount of computing resources used in the encoding or decoding process is adjusted based on the amount of computing resources of the computing device that performs the encoding process or the decoding process or the amount of computing resources remaining in the computing device, There is no need to estimate the exact amount of calculation. Also, in situations where other applications are operating at the same time, or in situations where the amount of computational resources required from the beginning increases due to functional enhancements or bug fixes of the encoding process or decoding process, suitable adjustments are made following the situation. Can be done.
以下、本発明の実施の形態について、図面を参照しながら説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
(実施の形態1)
本実施の形態では、復号化部の演算量を調整する機能を持つ動画像処理システム、及びその動画像処理システムに含まれる演算量調整装置について、図1〜図4を用いて説明する。
(Embodiment 1)
In the present embodiment, a moving image processing system having a function of adjusting the calculation amount of the decoding unit and a calculation amount adjusting device included in the moving image processing system will be described with reference to FIGS.
まず、演算量調整装置を含む動画像処理システムの機能的な構成について説明する。
図1は、本発明の実施の形態1における画像処理システムの機能的な構成を表すブロック図である。図1において、符号化部110におけるME111、MC112、DCT113、Q114、VLC115、IQ116、IDCT117、IMC118、および、復号化部120におけるVLD121、IQ122、IDCT123、IMC124は、背景技術の項で説明したMPEGおよびITU−T H.260番台の動画像符号化/復号化方式規格に準拠した機能ブロックである(図17を参照)。
First, a functional configuration of a moving image processing system including a calculation amount adjusting device will be described.
FIG. 1 is a block diagram showing a functional configuration of an image processing system according to
符号化部110では、符号化対象である原画像101を参照画像A102および参照画像B103を参照しながら符号化/復号化処理を行うことによって符号化情報を生成し、復号化部120では、その符号化情報から復号化画像である復号化画像104を得ている。
The
演算資源量測定部131は、復号化部120が動作している演算機器の、復号化部120によって使用される演算資源量と残存演算資源量とを、例えば次の考え方に従って測定する。
The computing resource
背景技術において説明したように、MPEGおよびITU−T H.260番台の動画像符号化/復号化方式規格の各機能ブロックについて、例えばIDCT123であればBlock14004単位でというように、処理を行うためのデータ単位が決まっている。また、各機能ブロックをソフトウエアまたはハードウエアロジックに実装した時点で、各機能ブロックが1データ単位を処理するために使用する演算資源量(例えば、前記演算機器が動作する時間)は決定している。
As described in the background art, MPEG and ITU-T H.264. For each functional block of the 260th video coding / decoding scheme standard, for example, in the case of IDCT123, the data unit for processing is determined such as in
そこで、各機能ブロックが処理すべきデータ単位の数と1つのデータ単位の処理に使用される演算資源量とを乗じて総和を取ることにより、復号化部120が使用する演算資源量を算出する。さらに、復号化部120が動作している演算機器で使用可能な全ての演算資源量を測定し、その測定の結果から前記算出された演算資源量を引くことにより、符号化部120が動作した場合にその演算機器で使用可能な残存演算資源量を算出する。
Therefore, the amount of computing resources used by the
この残存演算資源量は、演算機器の全ての演算資源量よりも復号化部120によって使用される演算資源量が大きい場合、負の量として算出される。負の残存演算資源量は、その演算機器で使用可能な全ての演算資源を使用しても、符号化部120は処理すべき全てのデータ単位を処理しきれないことを意味する。
This remaining computing resource amount is calculated as a negative amount when the computing resource amount used by the
画質評価部132は、参照画像A102の画質を評価する。背景技術において説明したように、参照画像A102は、符号化部110が生成した符号化情報から復号化された再生画像であり、復号化部120の参照画像B103は参照画像A102と同じ画像である。また、参照画像B103は復号化部120で再生される復号化画像104に対し、時間的に前または後ろの画像であり、参照画像A102の画質を評価することは、復号化部120で再生される復号化画像104の画質を評価することとほぼ等しい。
The image
画質評価方式としては一般的によく知られた、PSNR(Peak Signal to Noise Ratio、ピーク信号対雑音比)を用いるが、画像の良し悪しを判定する指数を導き出す方式であれば、その他の方式であってもよい。また、復号化画像104を直接人間が見て、主観評価によりその指数を示してもよい。
PSNR (Peak Signal to Noise Ratio), which is generally well-known as an image quality evaluation method, is used. However, any other method can be used as long as it can derive an index for determining the quality of an image. There may be. Alternatively, the decoded
目標画質133は、復号化部120の復号化画像の画質の目標を前述した指数で表した情報あり、これは復号化部120の処理に先立って、または処理中に、ユーザ、他のアプリケーションなどによって設定、または変更される。
The target image quality 133 is information representing the image quality target of the decoded image of the
目標Block数決定部134は、演算資源量測定部131が出力する、復号化部120が動作している演算機器における復号化部120によって使用される演算資源量と残存演算資源量、画質評価部132が出力する参照画像A102の画質、目標画質133をもとに、符号化部110が出力する符号化情報に含まれる1Picture14001あたりのBlock14004の目標数を決定する。
The target block
Block数制御部135は、目標Block数決定部134が決定した目標数に従って、Q114が出力する情報に含まれる1Picture14001あたりのBlock14004の数を制限し、その制限した情報をVLC115に出力する。
The block
背景技術において説明したように、符号化情報においては、ME111およびMC112により時間的に冗長な情報が削減された後に、DCT113およびQ114により空間的に冗長な情報が削減されている。
As described in the background art, in encoded information, temporally redundant information is reduced by
図2は、符号化情報における時間的および空間的に冗長な情報の削減を模式的に説明する図である。図2において、Picture14003内の各四角形はBlock14004を示し、4つのBlock14004のかたまりがMB14003を示す。黒く塗りつぶした各四角形で示される箇所には係数14005が存在し(係数が0ではない)、黒く塗りつぶしていない箇所には係数14005が存在しない(係数が0である)。
FIG. 2 is a diagram schematically illustrating reduction of temporally and spatially redundant information in encoded information. In FIG. 2, each square in the
図2に示すように、時間的および空間的に冗長な情報が削減された情報には係数14005を持たないBlock14004があり、これらのBlock14004は、符号化情報として復号化部120には送られない。係数14005を持つBlock14004のみが符号化情報として復号化部120に送られ、復号化処理される。
As shown in FIG. 2, the information in which the temporally and spatially redundant information is reduced includes a
符号化部110のIDCT117、および復号化部120のIDCT123は、Block14004単位で符号化情報を処理するため、符号化情報に含まれる1Picture14001あたりのBlock14004の数を制限することにより、IDCT117およびIDCT123がその符号化情報を処理する際に使用する演算資源量を制限することが可能になる。
The
つぎに、本発明の実施の形態における動画像処理システムの実装及び動作環境について説明する。 Next, the mounting and operating environment of the moving image processing system in the embodiment of the present invention will be described.
本実施の形態における動画像処理システムは、図1に示されるように、符号化部110、復号化部120、演算資源量測定部131、画質評価部132、目標Block数決定部134、Block数制御部135によって構成される。これらの部の全てまたは一部が、ソフトウエアとして実装されてもよく、また、ハードウエアロジックとして実装されてもよい。
As shown in FIG. 1, the moving image processing system according to the present embodiment includes an
これらの部の中で、演算資源量測定部131、画質評価部132、目標Block数決定部134、Block数制御部135が連携して、符号化情報に含まれるBlockの数を制限することにより、IDCT117およびIDCT123がその符号化情報を処理する際に使用する演算資源量を削減する。つまり、演算資源量測定部131、画質評価部132、目標Block数決定部134、Block数制御部135が、本発明の実施の形態における演算量調整装置を構成する。
Among these units, the calculation resource
図3は、動画像処理システムの動作環境の一例を示す図である。
PC310は一般的なパーソナルコンピュータであり、CPU、DSP、ハードウエアロジックなどで実現される演算部301、メモリやハードディスクなどで実現される記憶部302、カメラやディスプレイなどである画像入出力部303、有線LANアダプタや無線LANアダプタなどである通信部304から構成される。
FIG. 3 is a diagram illustrating an example of an operating environment of the moving image processing system.
The
各PC310の通信部304は、有線LANや無線LANなどであるLAN311を介して接続されている。
The
本発明の演算量調整装置を含む動画像処理システムの各部は、各PC310内の演算部301で実行され、参照画像A102および参照画像B103や、実行中の中間情報や符号化情報は記憶部302に一時的に記憶させてもよい。
Each unit of the moving image processing system including the calculation amount adjustment apparatus of the present invention is executed by the
また、動画像処理システムの各部がソフトウエアとして実装されている場合には、そのソフトウエアのプログラムは記憶部302に記憶される。符号化対象画像である原画像101および復号化画像である復号化画像104は画像入出力部303により取得され、かつ表示される。符号化部と復号化部とが異なるPC310に実装される場合、符号化情報は通信部304およびLAN311を介して、それらのPC310間で伝送される。
When each unit of the moving image processing system is implemented as software, the software program is stored in the
また、動画像処理システムの各部は、どのPC310に実装され動作しているかは特に特定されない。各PC310が通信部304およびLAN311により通信可能だから、各機能ブロック間のデータの受け渡しは通信部304およびLAN311を介して行えばよく、動画像処理システムの各部はどのPC310に実装されているとしても動作可能である。全てが1台のPC310に実装/実行されてもよく、極端な例では、全てが異なるPC310に実装/実行されてもよい。
In addition, it is not particularly specified in which
更に、符号化部110と復号化部120は同時刻に実行されてもよく、また異なる時刻に実行されてもよい。同時刻に実行する例としては、TV放送やTV会議のように、リアルタイムに符号化情報を復号化して復号化画像を見る例があり、異なる時刻に実行する例としては、映像録画/再生機のように、符号化情報を記憶部302に記録し、後で復号化して復号化画像を見る例がある。
Furthermore, the
符号化部110と復号化部120とが異なる時刻に実行される場合、演算資源量測定部131は、符号化部110の実行中には復号化部120が動作する予定の演算機器の残存演算資源量を測定することはできないため、復号化部120の演算量を0とすることにより、前記演算機器で使用可能な全ての演算資源量を残存演算資源量として測定する。
When the
また、動画像処理システムを構成する、符号化部110、復号化部120、演算資源量測定部131、画質評価部132、目標Block数決定部134、Block数制御部135の組が、1つまたは複数、PC310に実装され実行していてもよい。動画像処理システムの複数の組が同一PC310で実行されている場合は、共通する部の演算資源をタイムシュアして利用してもよい。その場合、演算資源量測定部131が測定する演算量は、演算資源のタイムシュアしている時間比を加味して測定されるべきである。
In addition, there is one set of the
つぎに、実施の形態1における演算量の調整に関する基本的な考え方について以下に説明する。 Next, the basic concept regarding the adjustment of the calculation amount in the first embodiment will be described below.
この説明において、復号化部120内のVLD121およびIQ122およびIMC124の演算量は変動しない、または、固定であると仮定する。背景技術において説明したように、VLD121およびIQ122は係数14005単位、IMC124はMB14003単位で符号化情報を処理する。符号化部110がCBR(Constant Bit Rate、固定ビットレート)で符号化を行うのであれば、符号化情報に含まれる1Picture14001あたりの係数14005の数はほぼ一定である。
In this description, it is assumed that the calculation amounts of the
また、IMC124は、復号化画像104を構成するために、符号化情報には含まれないMB14003をも参照画像B103から参照する必要がある。この参照のための演算資源量が符号化情報に含まれるMB14003を参照するための演算資源量と等しいのであれば、IMC124は符号化情報によらず一定の演算量となる。このため、上記仮定は、このような場合正しい。
Further, in order to configure the decoded
復号化部120内のVLD121およびIQ122およびIMC124の演算量は変動しない、または固定であるのであれば、復号化部120が使用する演算資源量の変動要因は、IDCT123における演算量の変化のみとなる。IDCT123はBlock14004単位で符号化情報を処理するから、符号化情報に含まれる1Picture14001あたりのBlock14004の数を制限すれば、復号化部120が使用する演算資源量をある一定値以下に制限させることが可能になる。
If the calculation amounts of the
つぎに、動画像処理システムの動作について、図4を参照しながら以下に説明する。
符号化部110は、その構成要素であるME111、MC112、DCT113、Q114、VLC115、IQ116、IDCT117、IMC118により、画像入出力部302から入力される時間的に異なる一連の原画像101を順次符号化し、符号化情報を出力する。符号化情報は復号化部120に入力され、その構成要素であるVLD121、IQ122、IDCT123、IMC124により、符号化情報を復号化し、復号化画像である復号化画像104を画像入出力部302から出力する。
Next, the operation of the moving image processing system will be described below with reference to FIG.
The
この動きと並行して、1Picture14001毎に、演算資源量測定部131は、復号化部120の演算量および復号化部120が動作している演算機器の残存演算資源量を順次測定し(ステップ15001)、画質評価部132は、参照画像A102の画質を順次評価する(ステップ15002)。
In parallel with this movement, for each
そして、演算資源量測定部131の測定結果および画質評価部132の画質評価結果は順次、目標Block数決定部134に入力される。目標Block数決定部134は、演算資源量測定部131の測定結果、画質評価部132の画質評価結果および目標画質133から、以下のように、1Picture14001毎に、目標Block数を決定する(ステップ15003)。
Then, the measurement result of the calculation resource
復号化部120が動作しているPC310で使用可能な全ての演算量を使用して復号化部120を動作させるのであれば、(式1)に従って目標Block数を決定する。
(式1)において、Tblock_aは目標Block数(IDCT123が処理できるBlock数の上限を表す)、T’blockは前回(1Picture前)の目標Block数(1Picture前が存在しない場合0)、Rcalは演算資源量測定部131で測定された復号化部120が動作しているPC310の残存演算資源量、CIDCTはIDCT123が1Block14004の処理に使用する演算資源量である。(式1)において画質は考慮されていない。
In (Expression 1), T block — a represents the target number of blocks (represents the upper limit of the number of blocks that can be processed by the IDCT 123), T ′ block represents the previous number of target blocks (before 1 picture) (0 if there is no before 1 picture), and R cal Is the amount of remaining computing resources of the
ここで、(式1)は、PC310の残存演算資源量(PC310で使用可能な演算資源量)が正値つまり残余なら、その残余によって処理可能となるBlock数だけ目標Block数を増やし、負値つまり不足なら、その不足によって処理不能となるBlock数だけ目標Block数を減らすことにより、目標Block数を相対的に決定することに注意する。 Here, (Equation 1) indicates that if the amount of remaining computing resources of the PC 310 (the amount of computing resources that can be used in the PC 310) is a positive value, that is, a residual, the target block number is increased by the number of blocks that can be processed by the residual, and a negative value is obtained. In other words, if it is insufficient, it should be noted that the target number of blocks is relatively determined by reducing the number of target blocks by the number of blocks that cannot be processed due to the shortage.
他方、画質を考慮して、復号化部120で得られる復号化画像の画質が目標画質133に近づくように、PC310で復号化部120を動作させるのであれば、符号化情報に含まれるBlock数が増えるほど画質は向上するため、(式2)に従って目標Block数を決定する。
(式2)において、Tblock_bは目標Block数、Qnowは画質評価部132が評価した現在の画質、Qtargetは目標画質133、αは係数である。但し、PC310で使用可能な演算量を超えてはならないので、Tblock_bは(式1)のTblock_a以下に制限される。
In (Expression 2), T block — b is the target number of blocks, Q now is the current image quality evaluated by the image
(式2)のTblock_bがTblock_aを超える値となる場合は、目標画質133とするには復号化部120が動作しているPC310の残存演算資源量では不足であることを意味する。このような場合、図1には示されていないが、目標Block数決定部134は、復号化部120を使用するユーザにその旨を通知し、目標画質133を下げるようユーザに再設定を促してもよい。
When T block_b in (Expression 2) exceeds T block_a , it means that the amount of remaining computing resources of the
また、復号化部120が実装/実行されているPC310における残存演算資源量を増加させるために、PC130で同時に動作している他のアプリケーションを、停止させるか、または、演算量を減少させるように制御してもよい。例えば、PC130でもう一組の演算量調整装置を含む動画像処理システムが動作している場合、その演算量調整装置に対して目標画質を下げるよう要求することにより、その動画像処理システムが使用する演算資源量を減少させ、その結果として、残存演算資源量を増加させることが可能である。
Further, in order to increase the amount of remaining computing resources in the
(式2)の係数αは固定値でもよいが、(式3)に示す式により決定してもよい。
(式3)において、βは係数である。(式3)により、目標画質Qtargetと現在の画質Qnowとの差が大きい程、係数αは大きな値となり、より早く目標画質となるような目標Block数Tblock_bに収束する。 In (Expression 3), β is a coefficient. According to (Equation 3), as the difference between the target image quality Q target and the current image quality Q now is larger, the coefficient α becomes a larger value and converges to the target number of blocks T block — b that achieves the target image quality earlier.
なお、(式3)では、目標画質Qtargetと現在の画質Qnowとの差の絶対値としたが、目標画質Qtargetと現在の画質Qnowとの差の二乗値、四乗値としてもよい。目標画質Qtargetと現在の画質Qnowとの差が大きい程、係数αは大きな値となり、目標画質Qtargetと現在の画質Qnowとの差が小さい程、係数αは0となる式であれば、どのような式であってもよい。 In (Equation 3), although the absolute value of the difference between the target quality Q target and current quality Q now, the square value of the difference between the target quality Q target and current quality Q now, even fourth power value Good. The larger the difference between the target image quality Q target and the current image quality Q now , the larger the coefficient α, and the smaller the difference between the target image quality Q target and the current image quality Q now , the coefficient α becomes 0. Any formula may be used.
なお、このような目標Block数の決定は、1Picture14001毎に、目標Block数決定部134によって行われる。目標Block数決定部134は、この決定を、演算資源量測定部131が測定した残存演算資源量および画質評価部132が評価した画質を用いて行う。
Such determination of the target number of blocks is performed by the target number-of-
目標Block数決定部134が決定した目標Block数は、Block数制御部135に入力される。Block数制御部135は、以下に述べるようにして、Q114が出力する情報から目標Block数を上回るBlock14004を取り除くことにより、その情報に含まれる1Picture14001あたりのBlock14004の数を制限する(ステップ15003〜15007)。
The target block number determined by the target block
まず、Block数制御部135が取り除く取り除き対象Blockの選択基準について説明する。取り除き対象Blockは、それを取り除いた場合に、復号化画像である復号化画像104ができる限り画質劣化しないBlockとする。
First, the selection criteria for the removal target block to be removed by the block
Q114が出力する情報は時間的に冗長な情報が削減された情報であるので、その情報の量(係数の数や係数の大きさ)の大きさは、原画像101と参照画像Aの時間的な差の大きさを示す。このため、情報の量が大きいBlockほど、それを取り除いた場合、画質に影響を大きく及ぼしてしまうので、情報の量が少ないBlockを優先して取り除き対象Blockとする。
Since the information output by Q114 is information in which redundant information is reduced in time, the amount of information (the number of coefficients and the size of the coefficients) is the time of the
また、Q114が出力する情報は空間周波数に変換された情報であるが、人間の目は低周波成分の欠落による画質劣化は高周波成分の欠落による画質劣化より敏感である。このため、低周波成分の量(係数の数や係数の量)が少ないBlockを優先して取り除き対象Blockとする。 The information output by Q114 is information converted into a spatial frequency, but the human eye is more sensitive to image quality degradation due to lack of low frequency components than image quality degradation due to lack of high frequency components. For this reason, a block with a small amount of low-frequency components (number of coefficients and amount of coefficients) is preferentially removed and set as a target block.
このように、1Blockデータ単位の情報内で情報の量が小さいBlockほど、さらに、低周波成分の量が少ないBlockほど、優先して取り除き対象Blockとする。 As described above, a block having a smaller amount of information in the information of one block data unit and a block having a smaller amount of low-frequency components are preferentially removed as a target block.
なお、以上説明した選択基準は、一例でしかなく、取り除き対象Blockは、それを取り除いた場合に、復号化画像である復号化画像104ができる限り画質劣化しないBlockを選択する基準であれば、他の選択基準であってもよい。例えば、候補となるBlockを取り除いた場合の画質劣化度合いをPSNRで評価し、その指数をもとに選択してもよい。
Note that the selection criterion described above is only an example, and the block to be removed is a criterion for selecting a block in which the decoded
つぎに、Block数制御部135が上記選択基準に基づいて、Q114が出力する情報から取り除き対象Blockを取り除く動作について説明する。
Next, an operation in which the block
Block数制御部135は、所定の蓄積単位に含まれる1以上のBlockを一時的に蓄える。ここで、所定の蓄積単位とは、例えば、所定複数のBlock14004、1以上の所定数のMB14003、1以上の所定数のSlice14002、または、1つのPicture14001である。
The block
そして、その蓄えた情報の中から、Block数が目標Block数以下になるまで、上記選択基準に基づいて取り除き対象Blockの情報を取り除き、残ったBlockの情報をVLC115およびIQ116に出力する(ステップ15005)。
From the stored information, the information on the target block to be removed is removed based on the selection criteria until the number of blocks is equal to or less than the target number of blocks, and the remaining block information is output to the
目標Block数決定部134は、1Picture14001あたりの目標Block数を出力するので、Picture14001単位でBlockを一時的に蓄える場合、その目標Block数はそのまま適用される。
Since the target block
また、所定数のBlock14004、所定数のMB14003、または、所定数のSlice14002を1蓄積単位として、その蓄積単位に含まれるBlockを蓄える場合、目標Block数決定部134から出力される目標Block数は、それぞれの蓄積単位に応じた目標Block数に変換される(ステップ15004)。ステップ15004は、一例として、1つのMB14003を蓄積単位とする場合を示している。
Further, when storing a predetermined number of
(式4)に、その変換に用いられる式を示す。
(式4)において、Tblock_Xは蓄積単位あたりの目標Block数、Tblock_pictureは1Picture14001あたりの目標Block数、NX_MAXは1Picture14001に含まれる蓄積単位の数である。 In (Expression 4), T block_X is the target number of blocks per storage unit, T block_picture is the target number of blocks per picture 14001, and N X_MAX is the number of storage units included in one picture 14001.
また、1Picture14001の処理中に、複数の蓄積単位について順次、Q114から出力される情報の蓄積、Blockの取り除き、VLC115およびIQ116への情報の出力を行う場合、(式5)に示す式を用いて、その処理の進行時点に応じた好適な目標Block数を定めてもよい。
(式5)において、NXは現在までに情報を蓄積した蓄積単位の総数(Pictureの先頭で0にリセット)、Oblockは現在までにBlock数制御部135から出力されたBlockの総数(Pictureの先頭で0にリセット)である。
In (Expression 5), N X is the total number of storage units that have accumulated information so far (reset to 0 at the beginning of the picture), and O block is the total number of blocks output from the block
図5は、(式5)により定められる目標Block数に従って、情報の蓄積、Blockの取り除き、情報の出力が行われる場合に、Block数制御部135に蓄えられている情報量の変動の一例をBlock数で表したグラフである。
FIG. 5 shows an example of variation in the amount of information stored in the block
図5には、NX_MAXが4である、すなわち1Pictureに4つの蓄積単位(例えば4つのSliceとしてもよい)が含まれる例が示される。NX(NX=1〜4)番目の蓄積単位の処理における目標Block数は、(式5)により(NX×Tblock_picture/4)−Oblockである。 FIG. 5 shows an example in which N X_MAX is 4, that is, one picture includes four storage units (for example, four slices may be included). The target number of blocks in the processing of the N X (N X = 1 to 4) -th accumulation unit is (N X × T block_picture / 4) −O block according to (Equation 5).
4つの蓄積単位について順次、情報が蓄積され、この目標Block数に従ってBlockが取り除かれ、そして残ったBlockの情報が出力される。その結果、Block数制御部135に蓄えられる情報量は、図5に示されるように変化する。出力されたBlock数が目標Block数を下回った場合(図5における第2蓄積単位)、目標Block数と出力されたBlock数との差δは後続の蓄積単位の目標Block数に加算される。
Information is sequentially stored for the four storage units, the blocks are removed according to the target number of blocks, and information on the remaining blocks is output. As a result, the amount of information stored in the block
以上、Block数制御部135によって行われる、データ数の制限動作を説明した。この動作において、Block数制御部135は、Q114が出力する情報から、Block数が目標Block数以下になるように、Block14004単位でデータを取り除くことにより、その情報に含まれる1Picture14001あたりのBlock14004の数を制限する。
The operation of limiting the number of data performed by the block
以上、実施の形態1に係る演算量調整装置、及びその演算量調整装置を含む動画像処理システムについて説明した。以上のように、符号化部110が画像入出力部302から入力される時間的に異なる一連の原画像101を順次符号化し、符号化情報を出力し、復号化部120が、その符号化情報を復号化し、復号化画像である復号化画像104を画像入出力部302から出力/表示する。
In the foregoing, the calculation amount adjustment device according to the first embodiment and the moving image processing system including the calculation amount adjustment device have been described. As described above, the
また、この動きと並行して、演算資源量測定部131が測定した復号化部120の演算量および復号化部120が動作している演算機器の残存演算資源量、および、画質評価部132が評価した参照画像A102の画質、および、目標画質133をもとに、目標Block数決定部134が1Picture14001データ単位あたりの目標Block数を決定する。
In parallel with this movement, the calculation amount of the
Block数制御部135が、決定された目標Block数以下となるように、符号化情報に含まれる1Picture14001あたりのBlockの数を制限する。
The number-of-
この結果、IDCT123が符号化情報を処理するために使用する演算資源量が、目標Block数に応じた一定量に制限され、その結果、復号化部120の演算量はある一定量以下に制限される。
As a result, the amount of operation resources used by the
ここで一定量とは、演算資源量測定部131が測定した復号化部120が必要とする演算資源量および復号化部120が動作している演算機器の残存演算資源量、画質評価部132が評価した画質、および、目標画質133に基づいて定められ、復号化部120が動作している演算機器の残存演算資源量を超えず、かつ、復号化される画像の画質を目標画質133に近づけるような演算量である。
Here, the fixed amount is the amount of computing resources required by the
このようにして、本演算量調整装置を含む動画像処理システムによれば、復号化部120が動作している演算機器の残存演算資源量を超えず、かつ、復号化される画像の画質を目標画質133に近づけるような演算量で復号化部120が復号化可能な好適な符号化情報が、符号化部110で生成される。
In this way, according to the moving image processing system including the present calculation amount adjusting apparatus, the image quality of the image to be decoded can be reduced without exceeding the remaining calculation resource amount of the calculation device in which the
また、本演算量調整装置によれば、従来の技術が演算量を調整するためにその数を削減していたデータの単位であるPicture14001などより、はるかに小さいBlock14004単位で演算量を調整している。例えば、Picture14001データ単位の大きさは、一般のNTSC方式のTV画像の場合、720×480画素程度であり、Block14004データ単位の大きさは、MPEGおよびITU−T H.260番台の動画像符号化/復号化方式規格によれば8×8画素程度である。
In addition, according to the calculation amount adjustment device, the calculation amount is adjusted by a much
このため、Block14004単位での調整は、符号化/復号化全演算量の1/5400単位という極めて細かい単位で調整可能である。これは従来の技術に比べ数段細かく、また、発明が解決しようとする課題に説明したように、この単位はより細かい方が、演算資源を余すことがより少なくなり、より良い画質の復号化画像をユーザに提供することが可能である。
For this reason, the adjustment in units of
このため、本演算量調整装置によれば、従来の技術に比べ、より細かい単位で演算量を調整することにより、演算資源量をより余すことなく、より良い画質の復号化画像をユーザに提供することができる。 For this reason, according to this calculation amount adjustment device, by adjusting the calculation amount in finer units as compared with the conventional technology, a decoded image with better image quality can be provided to the user without leaving a large amount of calculation resources. can do.
また、本演算量調整装置によれば、演算資源量測定部131が測定した復号化部120の演算量および復号化部120が動作している演算機器の残存演算資源量に基づき、目標Block数決定部134が決定した目標Block数以下に、Block数制御部135が符号化情報に含まれる1Picture14001あたりのBlockの数を制限することにより、符号化対象画像である原画像101の画像内容によらず、つまりコンテンツ依存性なく、復号化部120が動作している演算機器の演算資源量に収まる演算量に演算量を調整する。
Further, according to the calculation amount adjusting apparatus, the target number of blocks based on the calculation amount of the
このため、本演算量調整装置は、発明が解決しようとする課題の項で説明したコンテンツ依存性による問題を起こすことがない。 For this reason, this calculation amount adjustment device does not cause the problem due to the content dependency described in the section of the problem to be solved by the invention.
なお、背景技術および本実施の形態1では説明を簡単にするために、暗黙の内にデータは輝度データとし、特に色データについて言及しなかった。 In the background art and the first embodiment, for simplicity of explanation, the data is implicitly luminance data, and color data is not particularly mentioned.
符号化対象データである原画像101に色データが含まれる場合、図18に示す処理データ単位のMB14003に、輝度データとは別に色データに関するBlockが含まれることになる。この場合、単にMB14003に含まれるBlock数が多くなるだけであるので、実施の形態1で説明した演算量調整装置を同様に適用可能である。そして、その適用によって、符号化対象データである原画像101に色データが含まれる場合においても同様の効果が得られることは言うまでもない。
When color data is included in the
また、本実施の形態1では、1Picture14001あたりのBlock14004の数を制限したが、所定複数のPicture14001あたり、1以上の所定数のSlice14002あたりなどでBlock14004の数を制限しても、同様の効果が得られることは言うまでもない。
In the first embodiment, the number of
また、背景技術および本実施の形態1では、MPEGおよびITU−T H.260番台の動画像符号化/復号化方式規格に順ずる符号化/復号化方式を取り上げたが、これらの標準化された規格以外の符号化/復号化方式、または、今後開発される符号化/復号化方式であっても、これら動画像符号化/復号化方式と同じく、時間的に冗長な情報を削減させる動き補償予測、空間的に冗長な情報を削減する空間周波数変換、出現頻度に応じた符号量割り当てにより情報量を削減するエントロピー符号化を組み合わせたハイブリッド符号化/復号化方式であれば、本演算量調整装置を適用することが可能であり、その適用によって同様の効果が得られることは言うまでもない。 In the background art and the first embodiment, MPEG and ITU-T H.264 are used. The encoding / decoding schemes in conformity with the 260 series moving image encoding / decoding scheme standards have been taken up. However, encoding / decoding schemes other than these standardized standards, or encoding / decoding schemes to be developed in the future will be described. Even in the case of decoding schemes, motion compensation prediction that reduces temporally redundant information, spatial frequency conversion that reduces spatially redundant information, and frequency of appearance, similar to these video encoding / decoding schemes If this is a hybrid encoding / decoding scheme combined with entropy encoding that reduces the amount of information by assigning the amount of code, the calculation amount adjustment device can be applied, and the same effect can be obtained by applying the hybrid encoding / decoding method. Needless to say.
(実施の形態2)
本実施の形態では、実施の形態1で説明した演算量調整装置およびその演算量調整装置を含む動画像処理システムの変形例について、図6〜図8を用いて説明する。
(Embodiment 2)
In the present embodiment, a modification example of the calculation amount adjustment device described in the first embodiment and a moving image processing system including the calculation amount adjustment device will be described with reference to FIGS.
実施の形態1では、復号化部120内のVLD121およびIQ122およびIMC124の演算量は変動しない、または、固定であると仮定していたが、この中で、IMC124の演算量は変動するとした場合の実施の形態について以下に説明する。
In the first embodiment, it is assumed that the calculation amount of the
まず、演算量調整装置を含む動画像処理システムを構成する機能ブロックについて、以下に説明する。図6は、本発明の実施の形態2における演算量調整装置の機能ブロック図である。
First, functional blocks constituting the moving image processing system including the calculation amount adjusting device will be described below. FIG. 6 is a functional block diagram of a calculation amount adjustment device according to
図6において、符号化部110におけるME111、MC112、DCT113、Q114、VLC115、IQ116、IDCT117、IMC118、および、復号化部120におけるVLD121、IQ122、IDCT123、IMC124は、それぞれ実施の形態1で説明した部と同一である。また、演算資源量測定部131、画質評価部132、目標画質133、目標Block数決定部134、Block数制御部135も、それぞれ実施の形態1で説明した部と同様である。実施の形態1との相違点は、目標MB数決定部136およびMB数制御部137が追加された点である。
In FIG. 6, ME 111,
つぎに、実施の形態1と異なる箇所のみ、実施の形態2における演算量調整装置の構成及び動作について図7を参照しながら説明する。目標MB数決定部136は、目標Block数決定部134と同様に動作することによって、目標とするBlock14004の数ではなく、目標とするMB14003の数を決定する。
Next, only the differences from the first embodiment will be described with reference to FIG. 7 for the configuration and operation of the calculation amount adjustment apparatus according to the second embodiment. The target MB
目標MB数決定部136は、(式6)または(式7)により、1Picture14001あたりのMB14003の数の目標数を決定する(ステップ16003)。
(式6)および(式7)において、TMB_aおよびTMB_bは目標Block数、T’MBは前回(1Picture前)の目標MB数(1Picture前が存在しない場合0)、Rcalは演算資源量測定部131が測定した復号化部120が動作しているPC310の残存演算資源量、CIMCはIMC124のMB14003あたりの演算量、Qnowは画質評価部132が評価した現在の画質、Qtargetは目標画質133、αは係数である。
In (Expression 6) and (Expression 7), T MB — a and T MB — b are the target block numbers, T ′ MB is the previous target MB number (before 1 picture) (0 if there is no previous one picture), and R cal is the computational resource amount. The amount of remaining computing resources of the
但し、PC310において使用可能な演算量を超えてはならないので、TMB_bはTMB_a以下に制限する。
However, T MB_b is limited to T MB_a or less because the amount of computation that can be used in the
また、PC310において使用可能な演算量を超えてはならないので、目標Block数決定部134の目標Block数の決定式である(式1)のRcalと、目標MB数決定部136の目標MB数の決定式である(式6)のRcalとの和は、PC310の残存演算資源量を超えないように制限しなければならない。
In addition, since the calculation amount that can be used in the
このため、(式8)により、Block及びMBについてぞれぞれのRcalを求めるものとする。
(式8)において、Rcal_blockは(式1)のRcal、Rcal_MBは(式6)のRcal、Rcalは演算資源量測定部131が測定した復号化部120が動作しているPC310の残存演算資源量、CIDCTはIDCT 125が1つのBlock14004を処理するために使用する演算資源量、CIMCはIMC124が1つのMB14003を処理するために使用する演算資源量である。
In (Equation 8), R cal_block is operating R cal, R cal_MB is R cal, R cal decoding unit 120 calculating the resource
なお、(式8)に示す割り当て方は一例であり、Rcal_blockとRcal_MBの和がRcalを超えない割り当て方であれば、別の割り当て方であってもよい。 The assignment method shown in (Equation 8) is an example, and another assignment method may be used as long as the sum of R cal_block and R cal_MB does not exceed R cal .
更に、MB14003を構成するBlock14004の数は、一定数Kと決まっている(例えば、図18ではK=4)。このため、目標Block数決定部134が決定する目標Block数は、目標MB数決定部136が決定する目標MB数のK倍以上となっても、MB数制御部137がMB数を制限しているために、Block数制御部135には目標MB数のK倍以上のBlock数を含む情報が入力されないので、無意味である。
Further, the number of
そこで、目標MB数決定部136と目標Block数決定部134は、お互いの目標数を、目標Block数が目標MB数のK倍以上とならず、PC310で使用可能な演算量を超えない値に調整する。例えば、図8に示す処理フローチャートのように、目標MB数決定部136が決定した目標MB数を目標Block数決定部134に通知し(ステップ17001)、目標Block数決定部134は目標Block数が目標MB数のK倍以下に制限し(ステップ17002〜ステップ17003)、その結果もし、PC310の残存演算資源量がCIMC以上残っているのであれば(ステップ17004)、目標MB数決定部136は目標MB数を1増加させ(ステップ17005)、その結果もし更に、PC310の残存演算資源量がCIDCT以上残っているのであれば(ステップ17006)、目標Block数を再計算する(ステップ17007)。
Therefore, the target MB
以上を、PC310の残存演算資源量がCIMCまたはCIDCT以上残らなくなるまで繰り返す。
The above is repeated until the amount of remaining computing resources of the
なお、図8に示す処理は、目標Block数決定部134が目標Block数を決定し(図4のステップ15003)、かつ、目標MB数決定部136が目標MB数を決定した(図7のステップ16003)直後に行われ、図8に示す処理が完了した後は、続く処理(図4のステップ15004および図7のステップ16004)が行われる。
In the process shown in FIG. 8, the target block
MB数制御部137は、Block数制御部135と同様に動作することによって、Block14004の数ではなく、MB14003の数を制限する。
The MB
MB数制御部137は、(式9)または(式10)により、PictureあたりのMB14003の目標数を、所定のデータ単位(例えばSlice)あたりのMB14003の目標数に変換し(ステップ16004)、その目標数以下になるようにMBの数を制限し(ステップ16005)、その結果、MC112が出力する情報に含まれる1Picture14001あたりのBlock14004の数を制限する。
(式9)および(式10)において、TMB_Xは所定のデータ単位(例えばSlice)あたりの目標MB数、TMB_pictureは1Picture14001あたりの目標MB数、NX_MAXは1Picture14001に含まれる前記データ単位の個数、NXは現在までにMB数制御部137に一時的に蓄えられた前記データ単位の総数(Pictureの先頭で0にリセット)、OMBは現在までにMB数制御部137から出力されたMBの総数(Pictureの先頭で0にリセット)である。
In (Expression 9) and (Expression 10), T MB_X is the target number of MBs per predetermined data unit (for example, Slice), T MB_picture is the target number of MBs per Picture 14001, and N X_MAX is the number of data units included in 1 Picture 14001. , N X is the total number of the data units temporarily stored in the MB
但し、Block数制御部135がBlock数を制限した結果、あるMBに含まれるBlockが全てなくなり、その結果、1Picture14001あたりのMB14003の数が減少することがある。
However, as a result of the block
このため、Block数制御部135は、MB14003の数が減少した場合、その減少数をMB数制御部137に通知し、MB数制御部137はその減少数を加味した(式11)または(式12)により、所定のデータ単位あたりのMB14003データ単位のデータ数の目標数を決定するのが望ましい。
(式11)および(式12)において、DMBはBlock数制御部135において減少したMB数である。
In (Expression 11) and (Expression 12), D MB is the number of MBs decreased in the block
以上、実施の形態1と異なる箇所のみ、実施の形態2における演算量調整装置、及びその演算量調整装置を含む動画像処理システムについて説明した。以上から、IMC124の演算量が変動する場合においても、実施の形態1と同様の効果が得られることが明らかである。
As described above, the calculation amount adjustment device according to the second embodiment and the moving image processing system including the calculation amount adjustment device have been described only in the points different from the first embodiment. From the above, it is apparent that the same effect as in the first embodiment can be obtained even when the calculation amount of the
また、実施の形態1では、復号化部120内のVLD121およびIQ122およびIMC124の演算量は変動しない、または、固定と仮定していたが、この中で、VLD121およびIQ122の演算量は変動するとした場合に適用可能な変形例を考えることもできる。
Further, in
その場合、実施の形態1および実施の形態2と同様に、目標係数数決定部および係数数制御部を新設し(係数数制御部はBlock数制御部135の後段に新設)、目標係数数決定部が、演算資源量測定部131および画質評価部132の出力と目標画質133をもとに目標とする係数数を決定し、係数数制御部が符号化情報に含まれる1Picture14001あたりの係数14005の数を制限する。これにより、実施の形態1と同様の効果が得られることは言うまでもない。
In that case, similarly to the first embodiment and the second embodiment, a target coefficient number determination unit and a coefficient number control unit are newly provided (the coefficient number control unit is newly provided after the block number control unit 135) to determine the target coefficient number. The unit determines the target coefficient number based on the outputs of the calculation resource
目標係数数決定部および係数数制御部はそれぞれ、目標Block数決定部134および目標MB数決定部136、Block数制御部135およびMB数制御部137と同様に動作することによって、係数の数に関して目標数の決定とその数の制限とを行う。
The target coefficient number determination unit and the coefficient number control unit operate in the same manner as the target block
(実施の形態3)
本実施の形態では、符号化部の演算量を調整する機能を持つ動画像処理システム、及びその動画像処理システムに含まれる演算量調整装置について、図9を用いて説明する。
(Embodiment 3)
In the present embodiment, a moving image processing system having a function of adjusting the calculation amount of the encoding unit and a calculation amount adjusting device included in the moving image processing system will be described with reference to FIG.
まず、演算量調整装置を含む動画像処理システムの機能的な構成について、以下に説明する。 First, a functional configuration of a moving image processing system including a calculation amount adjustment device will be described below.
図9は、本発明の実施の形態3における画像処理システムの機能的な構成を表すブロック図である。図9において、符号化部110におけるME111、MC112、DCT113、Q114、VLC115、IQ116、IDCT117、IMC118、および、復号化部120におけるVLD121、IQ122、IDCT123、IMC124は、実施の形態1及び実施の形態2で説明した部と同一である。
FIG. 9 is a block diagram showing a functional configuration of the image processing system according to the third embodiment of the present invention. 9, ME 111,
また、演算資源量測定部131、画質評価部132、目標画質133、目標Block数決定部134、Block数制御部135も、実施の形態1および実施の形態2で説明した部と同一である。但し、演算資源量測定部131は、復号化部120ではなく、符号化部110が動作している演算機器の、符号化部110によって使用される演算資源量と残存演算資源量とを測定する。
In addition, the calculation resource
実施の形態1及び実施の形態2との相違点は、目標MB数決定部136が目標MB数および目標Block数決定部138に変更され、MB数制御部137であったものがMB数およびBlock数制御部139に変更される点である。
The difference between the first embodiment and the second embodiment is that the target MB
つぎに、実施の形態3における演算量の調整に関する基本的な考え方について以下に説明する。実施の形態1及び実施の形態2において、1Picture14001あたりのBlock14004の数を制限し、さらに必要であれば、1Picture14001あたりのMB14003の数や、1Picture14001あたりの係数14005の数を制限することにより、復号化部120の演算量を制御した。
Next, the basic concept regarding the adjustment of the calculation amount in the third embodiment will be described below. In the first embodiment and the second embodiment, the number of
符号化部110において、ME111およびMC112の演算量は、Picture14001を構成するMB14003の数だけ必ず処理を行うため固定である。また、IMC118、IDCT117、IQ116、および、Q114、VLC115は復号化部120におけるIMC124、IDCT123、IQ112、VLD121と同じかまたは逆変換であるので、実施の形態1及び実施の形態2と同様にして、それらの演算量を制御することができる。
In the
従って、符号化部110において残るDCT113が使用する演算量を制御すれば、符号化部110の全体的な演算量を制御することが可能になる。
Therefore, if the amount of calculation used by the
つぎに、実施の形態3における演算量調整装置の動作について、実施の形態1および実施の形態2の説明と異なる事項のみ以下に説明する。 Next, the operation of the calculation amount adjustment apparatus according to the third embodiment will be described below only in matters different from those described in the first and second embodiments.
演算資源量測定部131、画質評価部132、目標Block数決定部134、Block数制御部135はそれぞれ、実施の形態1および実施の形態2で説明した動作と同一の動作をする。
The calculation resource
また、目標MB数および目標Block数決定部138、MB数およびBlock数制御部139は、それぞれ目標MB数決定部136、MB数制御部137と同様の動作を行うと共に、それぞれ目標Block数決定部134、Block数制御部135と同様の動作をも行う。
The target MB number and target block
背景技術で説明したように、符号化部110におけるDCT113の処理は、Block14004単位で行われるので、MB数およびBlock数制御部139により、DCT113に入力する情報に含まれる1Picture14001あたりのBlock14004の数を制限することにより、DCT113の演算量を制御する。
As described in the background art, since the
目標MB数および目標Block数決定部138が目標Block数を決定する処理の手順、及びMB数およびBlock数制御部139がBlock数を制限する処理の手順はそれぞれ、実施の形態2で説明した目標Block数を決定する処理の手順、Block数を制限する処理の手順と同一である。
The target MB number and target block
Q114が係数を制限した結果、あるBlockに含まれる係数が全てなくなることがあるので、目標MB数および目標Block数決定部138が決定する目標Block数は、目標Block数決定部134が決定する目標Block数より大きくするほうがよい。これは、実施の形態2における、目標Block数が目標MB数のK倍以上となる場合は無意味になることと、同じ関係である。
As a result of limiting the coefficients by Q114, all the coefficients included in a certain block may disappear. Therefore, the target MB number and the target block number determined by the target block
以上、実施の形態3における演算量調整装置について、実施の形態1および実施の形態2と異なる事項のみ説明した。以上により、本発明の演算量調整装置は、符号化部110においても、演算量を符号化部110が動作している演算機器の残存演算資源量、または、目標画質133にするだけに必要な演算量以下に制限することができることは明らかである。
Heretofore, only the matters different from the first embodiment and the second embodiment have been described regarding the calculation amount adjustment device in the third embodiment. As described above, the calculation amount adjustment apparatus of the present invention is necessary only for the
(実施の形態4)
本実施の形態では、実施の形態1から実施の形態3までに説明した演算量調整装置、及びその演算量調整装置を含む動画像処理システムにおける、符号化情報の制限量と復号化画像の画質と関係について図10〜図13を用いて説明する。また、ユーザに認識される画質の劣化を緩和する方法についても説明する。
(Embodiment 4)
In the present embodiment, the amount of encoded information and the quality of the decoded image in the calculation amount adjusting apparatus described in the first to third embodiments and the moving image processing system including the calculation amount adjusting apparatus are described. The relationship will be described with reference to FIGS. A method for alleviating the degradation of image quality recognized by the user will also be described.
まず、本発明の演算量調整装置を含む動画像処理システムによる符号化/復号化をシミュレーションした結果を以下に示す。この符号化/復号化シミュレーションでは、4:2:0、640×480画素、600枚の一連の画像を符号化対象画像としている。 First, the result of simulating encoding / decoding by a moving image processing system including the calculation amount adjustment apparatus of the present invention is shown below. In this encoding / decoding simulation, a series of 4: 2: 0, 640 × 480 pixels, 600 images is used as an encoding target image.
図10に符号化対象画像の一部を示す。この一連の画像は、天井から撮影され、人物が右から左へ移動し(Picture70からPicture130)、手前から奥へまた奥から手前へ移動する(Picture310からPicture500)様子が撮影されている。
FIG. 10 shows a part of the encoding target image. This series of images is taken from the ceiling, and a person moves from right to left (
動画像処理システムは、この一連の画像を、符号化方式としてMPEG−2方式を用い、動き検出範囲±31.5、M=1、N=150、発生符号量4Mbit/secのCBRで符号化する。 The moving image processing system uses the MPEG-2 system as an encoding system and encodes this series of images with a CBR having a motion detection range of ± 31.5, M = 1, N = 150, and a generated code amount of 4 Mbit / sec. To do.
図11に、Block数を調整しないか、又はそれぞれ異なる度合いで調整した4つの場合について、Picture70の復号化画像を示す。また、前記4つの場合のそれぞれについて、図12に、復号化画像の輝度(Y)の画質(PSNR)を示し、図13に、Q114で用いられるQステップ幅の1Picture14001期間での平均値を示す。
FIG. 11 shows decoded pictures of the
ここで、“Block数調整なし”とは、本発明の演算量調整装置を用いず、通常のMPEG−2で符号化/復号化した場合の結果である。 Here, “no block number adjustment” is a result of encoding / decoding with normal MPEG-2 without using the calculation amount adjusting apparatus of the present invention.
また、“Block数を1/2以下に調整”とは、本発明の演算量調整装置を用い、符号化情報に含まれる1Picture14001あたりのBlock14004の数を1/2以下に調整した結果である。具体的には、640×480画素の大きさの1Picture14001に含まれる8×8画素の大きさのBlock14004の最大数4800個に対して、Block数を1/2以下つまり、2400個以下に調整している。
Further, “adjusting the number of blocks to ½ or less” is a result of adjusting the number of
“Block数を1/3以下に調整”、および、“Block数を1/6以下に調整”に関しても“Block数を1/2以下に調整”と同様であり、それぞれ、1PictureあたりのBlock数を1/3以下(1600個以下)、1/6以下(800個以下)に調整した結果である。なお、“Block数調整なし”時の符号化情報に含まれる1Picture14001データ単位あたりのBlock14004データ単位のデータ数は、平均4380個程度であった。
“Adjusting the number of blocks to 1/3 or less” and “adjusting the number of blocks to 1/6 or less” are the same as “adjusting the number of blocks to 1/2 or less”, and the number of blocks per picture respectively. Is adjusted to 1/3 or less (1600 or less) and 1/6 or less (800 or less). It should be noted that the average number of data per
図11の復号化画像が示すように、Block数を1/2、1/3、1/6と下げるにつれて、復号化画像にBlockノイズ(8×8サイズのBlock形状で画質劣化が見られる現象)が表れてくるものの、その画質は例えば監視用途などに十分実用になる程度に維持される。 As shown in the decoded image of FIG. 11, as the number of blocks is reduced to 1/2, 1/3, and 1/6, the decoded image has a block noise (a phenomenon in which image quality deterioration is observed in an 8 × 8 size block shape). ) Appears, but the image quality is maintained at such a level that it is sufficiently practical for monitoring applications, for example.
この結果は、図12に示す輝度(Y)の画質(PSNR)にも現れている。“Block数を1/6以下に調整”時のBlock数は800個以下であり、“Block数調整なし”時の4380個程度に対し大幅にBlock数が削減しているにもかかわらず、4dB程度しか画質劣化していない。これは、Block数が削減されたことに伴い、削減したBlockの符号化情報の量だけ、他の削減しなかったBlockの符号化情報が多くなるためである。このため、他の削減しなかったBlockに関しては、符号化情報量が増え、その結果画質が向上する。 This result also appears in the image quality (PSNR) of luminance (Y) shown in FIG. The number of blocks when “adjusting the number of blocks to 1/6 or less” is 800 or less, and the number of blocks is 4 dB even though the number of blocks is greatly reduced from about 4380 when “no adjustment of block number” is set. The image quality has deteriorated only to the extent. This is because as the number of Blocks is reduced, the amount of other encoded information of the Block that has not been reduced increases by the amount of the encoded information of the Block that has been reduced. For this reason, the amount of encoded information increases for other blocks that have not been reduced, and as a result, the image quality is improved.
図13に示す平均Qステップ幅にもそのことが現れている。Block数を1/2以下、1/3以下、1/6以下と下げるにつれて、Q114で符号化情報が量子化される際に用いられるQステップ幅の平均値は低下(ステップ幅が縮小)する。つまり、削減しなかったBlockに対する符号化情報量が増えていることがわかる。 This also appears in the average Q step width shown in FIG. As the number of blocks is reduced to 1/2 or less, 1/3 or less, or 1/6 or less, the average value of the Q step width used when the encoded information is quantized in Q114 is decreased (the step width is reduced). . That is, it can be seen that the amount of encoded information for the blocks that have not been reduced has increased.
以上のように、符号化/復号化シミュレーション結果によれば、本発明の演算量調整装置によりBlock数を大幅に削減したとしても、それに伴う画質劣化は実用性を損なうほどのものではない。しかも、以下に説明する事項を行うことにより、ユーザがうける画質劣化の印象をより緩和させることができる。 As described above, according to the encoding / decoding simulation result, even if the number of blocks is greatly reduced by the calculation amount adjustment apparatus of the present invention, the accompanying image quality deterioration is not so much as to impair the practicality. In addition, by performing the items described below, it is possible to further alleviate the impression of image quality degradation experienced by the user.
まず、図11の復号化画像が示すように、本発明の演算量調整装置が符号化情報に含まれるデータ単位を制限することによる画質劣化は、Blockノイズとして現れる。このBlockノイズが特定の位置に連続して現れる、または、人物などの移動物体など、ユーザが注目するような位置に現れる場合、ユーザがうける画質印象は大きく低下してしまう。また、このBlockノイズは削減したBlockの箇所に現れる。 First, as shown in the decoded image in FIG. 11, image quality degradation due to the calculation amount adjustment apparatus of the present invention limiting the data unit included in the encoded information appears as Block noise. When this block noise appears continuously at a specific position, or when it appears at a position that is noticed by the user, such as a moving object such as a person, the image quality impression received by the user is greatly reduced. In addition, this block noise appears at the reduced block.
そこで、実施の形態1で説明したBlock数制御部135の取り除き対象Blockの選択基準に、以下の項目を加える。まず、時間的に前の1ないし複数Pictureにおいて取り除いたBlockが位置に存在するBlockは、取り除き対象Blockから除外する。
Therefore, the following items are added to the selection criteria for the block to be removed by the block
この処理は、Block数制御部135において、時間的に前の1ないし複数Pictureにおいて取り除いたBlockの位置をメモリなどに記録し、この記録をもとに判定すれば簡単に実現することができ、Blockノイズが特定の位置に連続して現れることを防ぐことができる。
This processing can be easily realized if the block
つぎに、動きが大きいBlockは取り除き対象Blockから除外する。ユーザは移動する人物や物体など、動きが多い箇所に注目することが多く、これら動きが大きいBlockを取り除き対象Blockから除外することにより、ユーザが注目するような位置にBlockノイズが現れることを防ぐ。 Next, the block with large movement is removed and excluded from the target block. A user often pays attention to a part with a lot of movement such as a moving person or an object, and by removing a block with a large movement and removing it from the target block, it is possible to prevent a block noise from appearing at a position where the user pays attention. .
この処理は、Block数制御部135において、画像間の動きの情報を用いて動きの多少を判断することにより、簡単に実現できる。画像間の動きの情報はME111が検出する情報を用いることができる。
This process can be easily realized by the block
なお、動きが大きい箇所に限らず、ユーザが注目すると考えられる位置を特定し、その特定された位置に存在するBlockを取り除き対象Blockから除外してもよい。そのような位置は、例えば、画像認識により抽出される人物/物体の位置であり、また、ユーザの視線位置検出の技術を用いて検出される位置である。 It should be noted that not only the location where the movement is large, but also a position that is considered to be noticed by the user may be specified, and the Block existing at the specified position may be removed and excluded from the target Block. Such a position is, for example, a position of a person / object extracted by image recognition, and is a position detected using a technique for detecting a user's gaze position.
つぎに、図12の輝度(Y)の画質(PSNR)が示すように、Block数を1/2以下、1/3以下、1/6以下にするにつれて、画質が時刻に伴い変化するばらつき度合いが大きくなっている。このばらつきが大きいほど、時間的前後の画質の差がユーザに見て取れて、画質印象が悪くなることがある。 Next, as shown by the luminance (Y) image quality (PSNR) in FIG. 12, the degree of variation in which the image quality changes with time as the number of blocks is reduced to 1/2 or less, 1/3 or less, or 1/6 or less. Is getting bigger. As this variation is larger, the difference in image quality before and after time can be seen by the user, and the impression of image quality may worsen.
そこで、画質評価部132において、各Pictureの画質測定とあわせて、画質の時間的なばらつき度合いも測定し、このばらつき度合いが一定値以上となった場合、その旨を、ユーザに通知することにより、目標画質133を高めるようユーザに再設定を促す。又は、並行動作している他の動画像処理システムにおける演算量調整装置、または、他のアプリケーションなどに通知することにより、他の動画像処理システムやアプリケーションが使用する演算資源量を削減させ、本発明の演算量調整装置に用いることができる演算資源量を増加させる。これにより、画質のばらつきによる画質印象の低下を防ぐことができる。
Therefore, the image
なお、以上Block数の制御に関して説明したが、MB数の制御に関しても同様であり、実施の形態2で説明したMB数制御部137の取り除き対象MBの選択基準を、以上に説明した事項に加えることにより、同様の効果が得られることは明らかである。
Although the control of the number of blocks has been described above, the same applies to the control of the number of MBs, and the selection criterion of the removal target MB of the MB
(実施の形態5)
本実施の形態では、実施の形態1から実施の形態4までに説明した演算量調整装置のいくつかの利用上の補足事項について、図14〜図15を用いて説明する。
(Embodiment 5)
In the present embodiment, some supplementary matters for use of the calculation amount adjusting apparatus described in the first to fourth embodiments will be described with reference to FIGS.
まず、本発明の演算量調整装置では、符号化情報のうち、時間的に累積していく符号化誤差を解消する働きを持つ部分について、その部分に含まれるデータ単位を取り除きの対象から除外することを、以下に説明する。 First, in the calculation amount adjustment apparatus of the present invention, a part of coding information that has a function of eliminating coding errors that accumulate in time is excluded from a target to be removed. This will be described below.
MPEGおよびITU−T H.260番台の動画像符号化/復号化方式規格では、順次符号化する原画像101は、I−Picture(Intra Picture、フレーム内符号化画像)、P−Picture(Predictive Picture、片方向動き予測符号化画像)、または、B−Picture(Bi−directional Predictive Picture、両方向動き予測符号化画像)として符号化される。
MPEG and ITU-TH In the standard of the moving picture coding / decoding scheme of the 260 series, the
これらPictureのうちI−Pictureのみは、時間的に冗長な情報を削減させる動き補償予測を用いず符号化される画像である。I−Pictureは、時間的に累積していく符号化誤差を解消するために必要とされ、順次符号化される原画像101は、一定周期に、このI−Pictureとして符号化される。
Of these pictures, only I-pictures are images that are encoded without using motion-compensated prediction that reduces temporally redundant information. The I-Picture is required to eliminate coding errors that accumulate over time, and the
また、I−Pictureと同じく、時間方向に累積していく符号化誤差を解消するために、P−Pictureに含まれる1または複数のSlice14002データ単位のデータ全てをIntra MB(Intra Macro Block、フレーム内符号化マクロブロック)として符号化することもある(以後、これをIntra Sliceと記載する)。Intra MBは、時間的に冗長な情報を削減させる動き補償予測を用いず符号化されるMBである。
Similarly to I-Picture, in order to eliminate coding errors accumulated in the time direction, all data of one or a plurality of
本発明の演算量調整装置は、P−PictureにおけるIntra Slice以外のSlice、およびB−Pictureに含まれるデータ単位(MB、Block、Pixel、係数)のみを取り除き対象として動作し、反面、I−Pictureに含まれるデータ単位、およびP−PictureにおけるIntra Sliceに含まれるデータ単位を取り除きの対象から除外する、つまりそれらに対して動作しない。 The calculation amount adjustment apparatus of the present invention operates only by removing only slices other than Intra Slice in P-Picture and data units (MB, Block, Pixel, coefficient) included in B-Picture, and on the other hand, I-Picture. Are excluded from the objects of removal, that is, they do not operate on them.
これは、本発明の演算量調整装置により、I−PictureおよびIntra SliceにおけるMB14003、Block14004、Pixel、または係数14005が破棄されることにより、累積された符号化誤差を解消する働きが阻害されることを防ぐためである。但し、あえてその働きを弱めてでも符号化部110および復号化部120の演算量を制限させたい場合には、この限りではない。
This is because the operation amount adjustment apparatus of the present invention inhibits the function of eliminating the accumulated coding error by discarding
つぎに、I−Picture、P−Picture、B−Pictureでの符号化時における、演算量の違いおよびその設定について以下に説明する。 Next, a description will be given of the difference in calculation amount and its setting when encoding with I-Picture, P-Picture, and B-Picture.
上記説明したように、I−PictureおよびP−Pictureに含まれるIntra Sliceでは、時間的に冗長な情報を削減させる動き補償予測を用いず符号化されるため、ME111およびMC112は動作しない。また、本発明の演算量調整装置は、これらに対して動作しない場合がある。
As described above, in the intra slice included in the I-Picture and the P-Picture, the
更に、P−PictureおよびB−Pictureでは、動き補償予測時に用いられる動きベクトルの探索範囲や予測方式などの違いにより、ME111およびMC112の演算量がP−PictureおよびB−Pictureで異なる場合がある。この結果、I−Picture、P−Picture、B−pictureでの符号化処理の演算量は、それぞれ異なる場合がある。
Furthermore, in P-Picture and B-Picture, the calculation amounts of ME 111 and
但し、I−PictureおよびP−Pictureに含まれるIntra Slice部分では、時間的に冗長な情報を削減させる動き補償予測を用いないために、本発明の演算量調整装置および方法がこれらに対して動作しない場合において、符号化情報に含まれる1Picture14001あたりのMB14003数およびBlock14004数は固定である。このため、I−PictureおよびP−Pictureに含まれるIntra Slice部分の演算量は、ある一定値である。
However, since the intra slice portion included in I-Picture and P-Picture does not use motion compensation prediction that reduces temporally redundant information, the amount adjustment apparatus and method of the present invention operate on these. If not, the number of
また、P−Pictureに含まれるIntra Slice以外の部分およびB−Pictureでは、ME111およびMC112の演算量の違いはあるが、これらの演算量はそれぞれ予め決められた一定値であり、かつ、本発明の演算量調整装置により演算量がある一定値以下に制限される。このため、P−Pictureに含まれるIntra Slice以外の部分およびB−Pictureの演算量もまた、ある一定値である。
Further, in the portion other than Intra Slice included in P-Picture and B-Picture, there is a difference in the amount of calculation of ME 111 and
また、I−Picture、P−Picture、B−pictureでの符号化処理における演算量はそれぞれ異なるが、それぞれの演算量はある一定値である。 In addition, although the calculation amounts in the encoding processing in I-Picture, P-Picture, and B-Picture are different, each calculation amount is a certain fixed value.
そしてこれら一定値は、ME111の動きベクトルの探索範囲やMC112の予測方式の設定値、および、本発明の演算量調整装置の設定値(残存演算量などの設定)により、予め簡単に設定することができる。
These constant values can be easily set in advance by using the search range of the motion vector of the
そこで、復号化部120において、上記説明したそれぞれ一定量である、I−Pictureが復号化される時の演算量CI_D、P−Pictureが復号化される時の演算量CP_D、B−Pictureが復号化される時の演算量CB_Dはそれぞれ、(式13)に示す関係を満たす値に設定する。
Therefore, in the
MPEGおよびITU−T H.260番台の動画像符号化/復号化方式規格では、図14に示すように、原画像101は予め決められた一定周期で、I−Picture、P−Picture、B−Pictureで符号化されることを繰り返し、この1周期はI−PictureからつぎのI−Pictureまでの期間である。
(式13)において、この1周期について、NIはI−Pictureで符号化/復号化される画像の数、NP P−Pictureで符号化/復号化される画像の数、NBはB−Pictureで符号化/復号化される画像の数、Cpicture_Dは1Picture14001データ単位あたりの復号化部120演算量である。
In (Equation 13), this one period, N I is the number of images to be encoded / decoded number of images to be encoded / decoded in I-Picture, with N P P-Picture, N B is B -The number of pictures to be encoded / decoded with Picture, C picture_D is the amount of computation of the
また、符号化部110において、上記説明したそれぞれ一定量である、I−Pictureが符号化される時の演算量CI_E、P−Pictureが符号化される時の演算量CP_E、B−Pictureが符号化される時の演算量CB_Eはそれぞれ、(式14)に示す関係を満たす値に設定する。
図15に、符号化部110および復号化部120のI−Picture、P−Picture、B−pictureに対する符号化/復号化処理の時間的流れを示す。図15に示すように、(式13)および(式14)の関係を満たす値であれば、とどこおりなく、画像入力、符号化部110の符号化処理、復号化部120の復号化処理、画像出力/表示を行うことができる。
FIG. 15 shows a temporal flow of encoding / decoding processing for I-Picture, P-Picture, and B-picture of the
(実施の形態6)
最後に、本実施の形態では、実施の形態1から実施の形態5で説明した演算量調整装置のより具体的な利用例について、幾つかの利用シーンを示しながら説明する。
(Embodiment 6)
Finally, in the present embodiment, a more specific usage example of the calculation amount adjustment apparatus described in the first to fifth embodiments will be described with some usage scenes.
まず、前の晩など家で映像録画/再生装置において録画した番組を、その映像録画/再生装置で再生するのではなく、その番組の符号化情報を携帯端末などに転送/記憶し、通勤途中など出先で再生するという利用シーンがよく存在する。 First, instead of playing a program recorded on a video recording / playback device at home, such as the night before, by using the video recording / playback device, the encoded information of the program is transferred / stored on a mobile terminal or the like, and commuting There are many usage scenes such as playing on the go.
携帯端末は携帯性を高めるために小型化、低消費電力化する必要があり、その演算能力や記録容量は、映像録画/再生装置などの据え置き型の機器に比べ少ない。このため、映像録画/再生装置の演算能力に適合するように符号化された番組の符号化情報を携帯端末で再生した場合、映像の一部のPicture14001が再生されない(いわゆるコマ落ち)などの不具合が発生してしまう。
A portable terminal needs to be reduced in size and power consumption in order to improve portability, and its calculation capability and recording capacity are less than that of a stationary device such as a video recording / reproducing apparatus. For this reason, when the encoded information of the program encoded so as to conform to the computing capability of the video recording / playback apparatus is played back on the mobile terminal, a part of the
そこで、映像録画/再生装置で録画した番組の符号化情報を一旦復号化し、携帯端末の演算能力に基づいて改めて符号化してから、携帯端末に転送する。 Therefore, the encoded information of the program recorded by the video recording / reproducing apparatus is once decoded, encoded again based on the computing capability of the mobile terminal, and then transferred to the mobile terminal.
そして、この符号化の際、本発明の演算量調整装置を用い、演算資源量測定部131により復号化部120が動作する携帯端末の演算資源量を測定し、それに基づき、目標Block数決定部134およびBlock数制御部135、目標MB数決定部136およびMB数制御部137などが、符号化情報に含まれる1Picture14001データ単位あたりのMB14003データ単位やBlock14004データ単位などの数を制限する。
Then, at the time of encoding, the calculation resource amount of the mobile terminal in which the
これにより、携帯端末に転送される符号化情報は、携帯端末でコマ落ちを起こすことなく完全に再生される。コマ落ちが発生しないということは、その符号化情報には携帯端末で再生不可能な情報が含まれないということであり、符号化情報を記録する携帯端末の少ない記録容量が、その携帯端末で再生不可能な情報により圧迫されることを防ぐことができる。 Thereby, the encoded information transferred to the portable terminal is completely reproduced without dropping frames on the portable terminal. The fact that frames are not dropped means that the encoded information does not include information that cannot be reproduced by the mobile terminal, and the mobile terminal that records the encoded information has a small recording capacity. It is possible to prevent being pressed by information that cannot be reproduced.
つぎに、TV会議など、複数のユーザがお互いの映像をリアルタイムにやりとりする利用シーンもよく存在する。 Next, there are many use scenes where a plurality of users exchange each other's images in real time, such as a TV conference.
この利用シーンにおいて、例えば図16に示すように、ユーザ12001AがPC310Aを用い、かつユーザ12001BがPC310Bを用いてTV会議している途中に、新たにユーザ12001CがPC310Cを用いてTV会議に参加する場合を考える。
In this usage scene, for example, as shown in FIG. 16, while the
ユーザ12001Cが新たにTV開始に参加する場合、PC310Aでは新たに復号化部120CAを起動し、PC310Bでは新たに復号化部120CBを起動し、PC310Cでは新たに復号化部120AC、復号化部120BC、符号化部110Cを起動する必要がある。
When the
先に動作している符号化部及び復号化部が演算資源量の調整機能を持たない場合、これら各PCにおいて新たに起動される符号化部や復号化部が使用する量の演算資源が確保できなければ、ユーザ12001CはTV会議に参加することができない。
If the encoding unit and decoding unit that are operating earlier do not have a function for adjusting the amount of computing resources, the amount of computing resources used by the encoding unit and decoding unit that are newly activated in these PCs is secured. If not, the
そこで、本発明の演算量調整装置を用いて符号化部や復号化部の演算量を調整することにより、ユーザ12001CがTV会議に参加することを可能にする。
Therefore, by adjusting the calculation amount of the encoding unit and the decoding unit using the calculation amount adjustment apparatus of the present invention, the
ユーザ12001CがTV会議に参加する前、図16に実線で示されるように、PC310A、PC310Bにおいて、それぞれ1つの符号化部と1つの復号化部とからなる2組の動画像処理システムが動作している。本発明の演算量調整装置は、これらの動画像処理システムにそれぞれ1つずつ含まれる。
Before the
さらにユーザ12001CがTV会議に参加した状態では、図16に実線及び点線で示されるように、PC310A、PC310B、PC310Cにおいて、それぞれ1つの符号化部と2つの復号化部とからなる3組の動画像処理システムが動作する。本発明の演算量調整装置は、これらの動画像処理システムにそれぞれ1つずつ含まれる。
Further, when the
図16において、この演算量調整装置を実現する演算資源量測定部131、画質評価部132、目標Block数決定部133、Block数制限部135、目標MB数決定部136、MB数制御部137などの図示は省略される。
In FIG. 16, a calculation resource
PC310Aに注目して説明を続ける。ユーザ12001CがTV会議へ参加する際、符号化部110C、復号化部120CA、復号化部120CBからなる動画像処理システムは、この演算量調整装置によって、復号化部120CAが使用する演算資源量がPC310Aで使用可能な演算資源量を超えないように起動され、動作する。
The description will be continued focusing on the
もし、PC310Aにおいて使用可能な演算資源量がまったくないか、または、その量では復号化部120CAが起動できないのであれば、符号化部110Aが使用する演算資源量を下げるべく、符号化部110Aで生成される符号化情報に含まれる目標MB数や目標Block数を下げ、また、復号化部120BAが使用する演算資源量を下げるべく、PC310Bで動作している符号化部110Bで生成される符号化情報に含まれる目標MB数や目標Block数を下げるように、先に動作している動画像処理システムにおける演算量調整装置が働く。
If there is no computational resource amount available in the
符号化部110Aおよび符号化部110Bでは、目標MB数や目標Block数を下げることにより、生成される符号化情報に含まれるMB数やBlock数を低減し、その結果、符号化部110A及び復号化部120BAが使用する演算資源量を低減させる。
The
具体的に、前記演算量調整装置における目標MB数決定部136や目標Block数決定部134が、PC310Aにおいて現在使用可能な演算資源量から復号化部120CAの起動に必要な演算資源量だけ引いた値をPC310Aの残存演算資源量として用いて目標MB数や目標Block数を決定することにより、上記制御を行うことができる。
Specifically, the target MB
なお、目標MB数決定部136や目標Block数決定部134は、ユーザへの通知により目標画質133を下げるようユーザに再設定を促すことによって、結果的に符号化情報に含まれるMB数やBlock数を減少させてもよい。
Note that the target MB
上記制御の結果、PC310Aの残存演算資源量が、復号化部120ACの動作に必要な演算資源量となることで、PC310Aにおいて、符号化部110A、復号化部120BA、復号化部120CAが全て動作可能となる。PC310B、PC310Cにおいても同様である。
As a result of the above control, the remaining computation resource amount of the
また、これら符号化部/復号化部起動後、必要であれば、各符号化部/復号化部の符号化/復号化画像の画質により、これら符号化部/復号化部の演算量をさらに調整してもよい。 Further, after the start of the encoding unit / decoding unit, if necessary, the amount of calculation of the encoding unit / decoding unit is further increased depending on the image quality of the encoded / decoded image of each encoding unit / decoding unit. You may adjust.
例えば、各符号化部/復号化部の符号化/復号化画像の画質をほぼ等しくするのであれば、各PCでの目標画質133を等しい値に設定すれば、この目標画質133、および、画質評価部132が評価した各符号化部/復号化部の符号化/復号化画像の画質に基づいて、本発明の演算量調整装置は、各符号化部/復号化部の符号化/復号化画像の画質がほぼ等しくなるような演算量で、各符号化部/復号化部を動作させる。
For example, if the image quality of the encoded / decoded image of each encoding unit / decoding unit is substantially equal, if the target image quality 133 in each PC is set to an equal value, the target image quality 133 and the image quality Based on the image quality of the encoded / decoded image of each encoding unit / decoding unit evaluated by the
また、TV会議の発言者の符号化/復号化画像の画質を、他の符号化/復号化画像の画質より高くしたいのであれば、同様に、発言者の画像を符号化する符号化部を含む動画像処理システムの目標画質133を他の動画像処理システムの目標画質に比べ高く設定すればよい。これにより、本発明の演算量調整装置は、TV会議の発言者の符号化/復号化画像の画質を、他の符号化/復号化画像の画質に比べ高くなるような演算量で、各符号化部/復号化部を動作させる。 In addition, if the image quality of the encoded / decoded image of the speaker of the video conference is desired to be higher than the image quality of the other encoded / decoded images, similarly, an encoding unit for encoding the image of the speaker is provided. The target image quality 133 of the moving image processing system to be included may be set higher than the target image quality of other moving image processing systems. As a result, the calculation amount adjusting apparatus of the present invention enables each code to have a calculation amount that makes the image quality of the encoded / decoded image of the speaker of the TV conference higher than the image quality of the other encoded / decoded images. Activating the decoder / decoder.
以上、本発明の演算量調整装置のより具体的な利用例について、幾つかの利用シーンを示したが、これに限らず、TV電話、ビデオサーバー、VOD(Video on Demand)、監視システムの映像配信など、1ないし複数の符号化または復号化処理を行う動画像処理システムにおいても、同様に利用することが可能である。 As described above, several usage scenes have been shown for more specific usage examples of the calculation amount adjustment apparatus of the present invention. However, the present invention is not limited to this, and video of a video phone, a video server, a VOD (Video on Demand), and a surveillance system. The same can be applied to a moving image processing system that performs one or a plurality of encoding or decoding processes such as distribution.
本発明に係る演算量調整装置は、例えばTV電話、ビデオサーバー、VOD、監視システムなど、符号化または復号化に利用可能な演算資源量に細かく適応した符号化情報を生成する動画像処理システムに広く利用できる。 The calculation amount adjustment apparatus according to the present invention is a moving image processing system that generates encoded information that is finely adapted to the calculation resource amount that can be used for encoding or decoding, such as a TV phone, a video server, a VOD, and a monitoring system. Widely available.
101 原画像
102 参照画像A
103 参照画像B
104 復号化画像
110 符号化部
111 動き検出部
112 動き補償部
113 離散コサイン変換部
114 量子化部
115 可変長符号化部
116 逆量子化部
117 逆離散コサイン変換部
118 逆動き補償部
120 復号化部
121 可変長復号化部
122 逆量子化部
123 逆離散コサイン変換部
124 逆動き補償部
131 演算資源量測定部
132 画質評価部
133 目標画質
134 目標block数決定部
135 Block数制御部
136 目標MB数決定部
137 MB数制御部
138 目標MB数および目標Block数決定部
139 MB数およびBlock数制御部
101
103 Reference image B
Claims (3)
前記復号化部が使用可能な演算資源量である残存演算資源量を測定する演算資源量測定手段と、 A computing resource amount measuring means for measuring a remaining computing resource amount that is a computing resource amount usable by the decoding unit;
前記測定された残存演算資源量と、前記復号化部で1つのデータ単位を処理するために使用される演算資源量とから、前記復号化部で処理できるデータ単位の上限数を決定し、前記決定された上限数以下で、かつ前記符号化情報で表される画像の画質が予め指定された目標画質に近づくように、前記符号化情報に含まれるデータ単位の目標数である目標データ単位数を決定する目標データ単位数決定手段と、 Determining the upper limit number of data units that can be processed by the decoding unit from the measured amount of remaining computing resources and the calculation resource amount used to process one data unit by the decoding unit; The target data unit number which is the target number of data units included in the encoded information so that the image quality of the image represented by the encoded information is less than the determined upper limit number and approaches the target image quality specified in advance. A target data unit number determining means for determining
前記符号化情報に含まれる前記データ単位の数を、前記目標データ単位数以下に制限するデータ単位数制御手段と、 Data unit number control means for limiting the number of data units included in the encoded information to the target data unit number or less;
を備える演算量調整装置。 A calculation amount adjustment device comprising:
前記符号化部が使用可能な演算資源量である残存演算資源量を算出する演算資源量測定手段と、 A calculation resource amount measuring means for calculating a remaining calculation resource amount that is a calculation resource amount usable by the encoding unit;
前記算出された残存演算資源量と、前記復号化部で1つのデータ単位を処理するために使用される演算資源量とから、前記復号化部で処理できるデータ単位の上限数を決定し、前記決定された上限数以下で、かつ前記符号化情報で表される画像の画質が予め指定された目標画質に近づくように、前記符号化情報に含まれるデータ単位の目標数である目標データ単位数を決定する目標データ単位数決定手段と、 The upper limit number of data units that can be processed by the decoding unit is determined from the calculated remaining calculation resource amount and the calculation resource amount used to process one data unit by the decoding unit, The target data unit number which is the target number of data units included in the encoded information so that the image quality of the image represented by the encoded information is less than the determined upper limit number and approaches the target image quality specified in advance. A target data unit number determining means for determining
前記符号化情報に含まれる前記データ単位の数を、前記目標データ単位数以下に制限するデータ単位数制御手段と、 Data unit number control means for limiting the number of data units included in the encoded information to the target data unit number or less;
を備える演算量調整装置。 A calculation amount adjustment device comprising:
請求項1または2に記載の演算量調整装置。 The calculation amount adjustment apparatus according to claim 1 or 2.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007005760A JP4747109B2 (en) | 2007-01-15 | 2007-01-15 | Calculation amount adjustment device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007005760A JP4747109B2 (en) | 2007-01-15 | 2007-01-15 | Calculation amount adjustment device |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008172688A JP2008172688A (en) | 2008-07-24 |
JP2008172688A5 JP2008172688A5 (en) | 2010-01-21 |
JP4747109B2 true JP4747109B2 (en) | 2011-08-17 |
Family
ID=39700330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007005760A Expired - Fee Related JP4747109B2 (en) | 2007-01-15 | 2007-01-15 | Calculation amount adjustment device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4747109B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7456760B2 (en) * | 2006-09-11 | 2008-11-25 | Apple Inc. | Complexity-aware encoding |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2955561B1 (en) * | 1998-05-29 | 1999-10-04 | 株式会社ディジタル・ビジョン・ラボラトリーズ | Stream communication system and stream transfer control method |
US20050201469A1 (en) * | 2004-03-11 | 2005-09-15 | John Sievers | Method and apparatus for improving the average image refresh rate in a compressed video bitstream |
-
2007
- 2007-01-15 JP JP2007005760A patent/JP4747109B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008172688A (en) | 2008-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7023914B2 (en) | Video encoding apparatus and method | |
JP4187405B2 (en) | Object-based rate control apparatus and method in coding system | |
US8363719B2 (en) | Encoding apparatus, method of controlling thereof, and computer program | |
JP5180294B2 (en) | Buffer-based rate control that utilizes frame complexity, buffer level, and intra-frame location in video encoding | |
TW416218B (en) | Method and apparatus for performing adaptive encoding rate control of a video information stream including 3:2 pull-down video information | |
JP5173409B2 (en) | Encoding device and moving image recording system provided with encoding device | |
JP4221655B2 (en) | Encoding apparatus, encoding method, program, and recording medium | |
JP2002223443A (en) | Transcoding method and transcoder | |
JP3508916B2 (en) | Moving image variable bit rate encoding method and apparatus | |
JP2023063113A (en) | Encoding device and method, and electronic apparatus | |
JP4081727B2 (en) | Image encoding apparatus, image encoding method, recording apparatus, and recording method | |
JP4362794B2 (en) | Video encoding apparatus and method | |
JP4747109B2 (en) | Calculation amount adjustment device | |
JP3858520B2 (en) | Video encoding apparatus and method | |
JPH10108197A (en) | Image coder, image coding control method, and medium storing image coding control program | |
JP4185413B2 (en) | Flicker reduction quantizer, flicker reduction quantization method, and program thereof | |
JP4228739B2 (en) | Encoding apparatus, encoding method, program, and recording medium | |
JP3307367B2 (en) | Variable transfer rate coding device | |
JP3934772B2 (en) | Variable transfer rate encoding method and apparatus | |
JP4186544B2 (en) | Encoding apparatus, encoding method, program, and recording medium | |
JP4273386B2 (en) | Encoding apparatus, encoding method, program, and recording medium | |
JP3922581B2 (en) | Variable transfer rate encoding method and apparatus | |
JP4273385B2 (en) | Encoding apparatus, encoding method, program, and recording medium | |
JPH10290461A (en) | Rate controller and rate control method | |
JP2004120415A (en) | Device and method for converting moving picture data stream |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091126 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091126 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20091126 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20091216 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110407 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110426 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110516 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4747109 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |