JP7495818B2 - Three-dimensional image processing device and program - Google Patents
Three-dimensional image processing device and program Download PDFInfo
- Publication number
- JP7495818B2 JP7495818B2 JP2020098045A JP2020098045A JP7495818B2 JP 7495818 B2 JP7495818 B2 JP 7495818B2 JP 2020098045 A JP2020098045 A JP 2020098045A JP 2020098045 A JP2020098045 A JP 2020098045A JP 7495818 B2 JP7495818 B2 JP 7495818B2
- Authority
- JP
- Japan
- Prior art keywords
- restoration
- dimensional image
- unit
- parameters
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、三次元画像を表現した三次元モデルを処理する三次元画像処理装置及びプログラムに関する。 The present invention relates to a three-dimensional image processing device and a program for processing a three-dimensional model that represents a three-dimensional image.
従来、三次元画像の表現方法として、異なる複数の視点における画像を用いる多視点画像を用いる方法、1以上の視点における画像と1以上の視点からの距離画像(デプスマップ)を用いる方法、三次元形状データとその質感情報とを組み合わせて用いる方法(以下、前記の組み合わせを「三次元モデル」という。)等がある。 Conventional methods for expressing three-dimensional images include a method using multi-view images that use images from multiple different viewpoints, a method using images from one or more viewpoints and a distance image (depth map) from one or more viewpoints, and a method using a combination of three-dimensional shape data and its texture information (hereinafter, the above combinations are referred to as "three-dimensional models").
三次元形状データとしては、楕円体、多面体、円柱、円錐、トーラス等の代表的な幾何形状を組み合わせて表現するプリミティブモデル、ボクセルデータ等のボリュームモデル、三角形メッシュデータ等のサーフェスモデル、ポイントクラウド等の点群モデル、3次元空間上における球体状の濃度分布を組み合わせてその等濃度曲面を表面形状と定義するメタボールモデル、ある視点からの距離画像を用いるデプスマップ、ある2次元平面上の各点に高さ値を定義する高度地図(DEM:Digital Elevation Map)、またはこれらの複数のモデルを組み合わせたもの等が用いられる。 Three-dimensional shape data can be expressed using primitive models that combine typical geometric shapes such as ellipsoids, polyhedrons, cylinders, cones, and tori; volume models such as voxel data; surface models such as triangular mesh data; point clouds and other point group models; metaball models that combine spherical density distributions in three-dimensional space and define the iso-density curved surface as the surface shape; depth maps that use distance images from a certain viewpoint; elevation maps (DEM: Digital Elevation Maps) that define height values for each point on a two-dimensional plane; or combinations of multiple of these models.
質感情報としては、表面色、透過色、テクスチャ(テクスチャマップ)、表面の反射特性、表面上の法線分布(バンプマップ)、表面の粗さ、屈折率、透過率、内部拡散及び偏光特性のうちのいずれかの情報、またはこれらを組み合わせた情報が用いられる。 The texture information used may be any one of the following: surface color, transparent color, texture (texture map), surface reflectance characteristics, normal distribution on the surface (bump map), surface roughness, refractive index, transmittance, internal diffusion, and polarization characteristics, or a combination of these.
三次元モデルは、人工的に数値データを作成することで生成するほか、画像または距離センサ、投光器、偏光フィルタ、カラーフィルタ、分光光度計、コンピュータトモグラフィー等のセンサ、または他の手法を用いて、実在物体の形状を計測して生成することも行われている。 Three-dimensional models are generated by artificially creating numerical data, or by measuring the shape of real objects using sensors such as image or distance sensors, spotlights, polarizing filters, color filters, spectrophotometers, and computer tomography, or other methods.
三次元画像の伝送または蓄積は、前記三次元モデルを適当な形式にフォーマット化し、さらに必要に応じて情報源符号化、通信路符号化またはその両符号化を適用したもの(以下、「符号化三次元モデル」という。)が用いられる。 For the transmission or storage of 3D images, the 3D model is formatted in an appropriate format and, as necessary, source coding, channel coding, or both are applied (hereinafter referred to as the "encoded 3D model").
このほか、多視点画像の符号化方式により異なる視点の画像を符号化する方法を用いることもある。この場合、異なる視点の画像間において予測を行い、前記符号化方式による符号化及び類似の処理を行う。また、これにデプスマップを併用して符号化を行うものもある。 In addition, a method of encoding images from different viewpoints using a multi-viewpoint image encoding method may be used. In this case, prediction is performed between images from different viewpoints, and encoding is performed using the encoding method or a similar process. In some cases, a depth map is used in combination with this method to perform encoding.
伝送または蓄積された符号化三次元モデルを、所望の視点からの二次元画像として鑑賞するには、符号化三次元モデルに通信路復号及び情報源復号を必要に応じて適用して三次元モデルを生成した後、所望の視点において三次元モデルをレンダリングする。これにより、所望の視点からの二次元画像を得ることができる。 To view a transmitted or stored encoded 3D model as a 2D image from a desired viewpoint, channel decoding and source decoding are applied to the encoded 3D model as necessary to generate a 3D model, and then the 3D model is rendered from the desired viewpoint. This allows a 2D image from the desired viewpoint to be obtained.
画像(映像を含む。以下同じ。)の符号化方式には、変換、変換係数の量子化、エントロピー符号化、及び必要に応じて予測を組み合わせた方式がある。この例として、静止画用のJPEG、JPEG2000、動画用のMPEG-1、MPEG-2、H.263、MPEG-4、MPEG-4 Part 10 AVC|H.264、MPEG-H HEVC|H.265、MPEG-I VVC、VC-1、VC-2(Dirac)、VC-3、VC-5、VP3、VP6、VP7、VP9等がある。 Image (including video) coding methods include a combination of transform, quantization of transform coefficients, entropy coding, and prediction as necessary. Examples include JPEG and JPEG2000 for still images, and MPEG-1, MPEG-2, H.263, MPEG-4, MPEG-4 Part 10 AVC|H.264, MPEG-H HEVC|H.265, MPEG-I VVC, VC-1, VC-2 (Dirac), VC-3, VC-5, VP3, VP6, VP7, VP9, etc. for video.
前記の各種符号化方式は、ビットレートを低くするほど(圧縮率を高くするほど)、復号画像の画質劣化が大きくなる性質を有する。低ビットレート時の画像劣化を抑制するため、受信機側に画像復元を行う手段を設け、画質向上を図る技術がある。この画質向上を図る技術としては、雑音除去、エッジ強調、超解像画像復元等が知られている。 The various encoding methods mentioned above have the property that the lower the bit rate (the higher the compression rate), the greater the degradation of the image quality of the decoded image. In order to suppress image degradation at low bit rates, there are techniques that provide image restoration means on the receiver side to improve image quality. Known techniques for improving image quality include noise reduction, edge enhancement, and super-resolution image restoration.
例えば、送信機側において、画像縮小等の画質劣化を伴う手段を符号化に併用し、受信機側において、復号画像に対して超解像画像復元を適用する手法が提案されている(例えば特許文献1を参照)。 For example, a method has been proposed in which the transmitter uses a method that degrades image quality, such as image reduction, in addition to encoding, and the receiver applies super-resolution image restoration to the decoded image (see, for example, Patent Document 1).
また、送信機側において、符号化前の高画質画像または受信機側の画像復元手段よりも高性能な画像復元手段を用いた高画質化画像のいずれかを参照することで、画像復元方法及びパラメータのうち最適なものを算出し、最適な方法またはパラメータを補助情報として送信機側から受信機側へ伝送し、受信機側において、最適な方法またはパラメータを用いて画像復元を行う手法が提案されている(例えば特許文献1及び特許文献2を参照)。
In addition, a method has been proposed in which the transmitter side calculates the optimal image restoration method and parameters by referring to either the high-quality image before encoding or a high-quality image generated using an image restoration means with higher performance than the image restoration means on the receiver side, and transmits the optimal method or parameters as auxiliary information from the transmitter side to the receiver side, and the receiver side performs image restoration using the optimal method or parameters (see, for example,
ここで、送信機側が、実在物体(以下、「被写体」という。)の形状を計測し、三次元モデルを生成して送信し、受信機側が、受信した三次元モデルを用いて、所望の視点から被写体を鑑賞するシステムを想定する。 Here, we consider a system in which the transmitter measures the shape of a real object (hereafter referred to as the "subject"), generates a three-dimensional model and transmits it, and the receiver uses the received three-dimensional model to view the subject from a desired viewpoint.
このようなシステムでは、被写体の形状を計測して三次元モデルを生成する際に、三次元モデルに誤差、欠落、雑音等が生じることがある。 In such systems, when measuring the shape of a subject and generating a 3D model, errors, omissions, noise, etc. may occur in the 3D model.
例えば、計測のために、複数のカメラ画像によるステレオマッチングを採用した場合には、模様の少ない(またはコントラストの低い)被写体では、ステレオマッチングにおいて誤対応を生じ、形状の誤差となることがある。 For example, when using stereo matching with multiple camera images for measurement, subjects with little pattern (or low contrast) may experience erroneous correspondence in the stereo matching, resulting in shape errors.
また、特に被写体が複数ある場合、または被写体に凹部がある場合には、被写体間(または同一被写体の部位間)で隠蔽を生じ、ステレオマッチングにおいて正しい対応付けがなされないことがあり、形状に穴が開いてしまうことがある。 In addition, especially when there are multiple subjects or when the subject has a concave portion, occlusion can occur between subjects (or between parts of the same subject), which can prevent correct correspondence during stereo matching and can result in holes in the shape.
また、被写体が紛らわしい模様を有する場合、またはその付近に紛らわしい模様の物体が存在する場合には、ステレオマッチングにおいて偽の対応付けがなされてしまい、形状が破綻する可能性がある。 In addition, if the subject has a confusing pattern, or if there is an object with a confusing pattern nearby, false correspondences may occur during stereo matching, resulting in a breakdown in the shape.
また、計測のために、赤外光のTOF(Time Of Flight)型の距離センサを用いる場合には、赤外光に対する被写体の反射率が低いときに、計測に失敗し、形状に誤差または穴が生じる可能性がある。 In addition, when using an infrared time-of-flight (TOF) distance sensor for measurement, if the subject has low reflectance to infrared light, the measurement may fail, resulting in errors or holes in the shape.
このような誤差、穴、欠落、雑音または破綻(以下、「誤差等」という)を有する三次元モデルを伝送した場合、三次元モデルの誤差等は、鑑賞時の二次元画像に劣化として表出する。特に、計測時とは異なる視点から被写体を鑑賞した場合に、その劣化が顕著となる傾向がある。 When a 3D model that has such errors, holes, omissions, noise, or failures (hereinafter referred to as "errors, etc.") is transmitted, the errors, etc. in the 3D model will appear as degradation in the 2D image when viewed. In particular, when the subject is viewed from a viewpoint different from that used for measurement, this degradation tends to be noticeable.
3次元モデルの誤差等は、自動処理または手動処理によって事前に修正することが好ましいが、いずれも十分な品質の三次元モデルにまで修正するには、膨大な演算コストまたは手作業が必要となる。このため、3次元モデルは、生放送(ライブ)での映像伝送として用いることができない。 It is preferable to correct errors in 3D models in advance by automatic or manual processing, but in either case, correcting the model to a sufficient quality requires huge computational costs or manual work. For this reason, 3D models cannot be used for live video transmission.
一方で、前述の特許文献1または特許文献2の技術では、画像の符号化及び復号時に生じる劣化を、補助情報によって制御される画像復元手段によって補正し、高画質な復号画像を得ることができる。
On the other hand, in the technology of
しかしながら、この技術は、平面的な(二次元の)動画像を対象としているため、3次元モデルの誤差等を補正する処理に、そのまま適用することができない。また、この技術は、映像符号化に起因する劣化を補正するものであるため、3次元モデルの誤差等に起因する二次元画像の劣化を補正する処理に適用することもできない。 However, because this technology targets flat (two-dimensional) video images, it cannot be applied directly to processes that correct errors in three-dimensional models. In addition, because this technology corrects degradation caused by video encoding, it cannot be applied to processes that correct degradation of two-dimensional images caused by errors in three-dimensional models.
そこで、本発明は前記課題を解決するためになされたものであり、その目的は、三次元画像を伝送または蓄積するシステムにおいて、三次元モデルを所望の視点でレンダリングする際に、レンダリングにより得られる二次元画像の劣化を補正可能な三次元画像処理装置及びプログラムを提供することにある。 The present invention has been made to solve the above problems, and its purpose is to provide a 3D image processing device and program that can correct the degradation of the 2D image obtained by rendering when a 3D model is rendered from a desired viewpoint in a system that transmits or stores 3D images.
前記課題を解決するために、請求項1の三次元画像処理装置は、三次元画像を表現した三次元モデルをレンダリングし、二次元画像を生成する三次元画像処理装置において、予め設定されたレンダリング用パラメータを用いて、前記三次元モデルをレンダリングして前記二次元画像を生成するレンダリング部と、予め設定された復元パラメータを用いて、前記レンダリング部により生成された前記二次元画像に対し劣化を復元するための復元処理を施し、復元二次元画像を生成する二次元画像復元部と、を備えたことを特徴とする。
To solve the above problem, the three-dimensional image processing device of
請求項1の三次元画像処理装置によれば、三次元モデルに誤差等がある場合であっても、その誤差を補正した復元二次元画像を生成することができる。
According to the 3D image processing device of
また、請求項2の三次元画像処理装置は、請求項1に記載の三次元画像処理装置において、前記二次元画像復元部が、前記三次元モデルを出力する外部装置により生成された前記復元パラメータを用いて、前記二次元画像に対し前記復元処理を施し、前記復元二次元画像を生成する、ことを特徴とする。
The three-dimensional image processing device of
請求項2の三次元画像処理装置によれば、三次元モデルに誤差等がある場合であっても、外部装置から伝送または蓄積された復元パラメータを用いて、その誤差を補正した復元二次元画像を生成することができる。
According to the three-dimensional image processing device of
また、請求項3の三次元画像処理装置は、請求項2に記載の三次元画像処理装置において、さらに復号部を備え、前記復号部が、前記外部装置により前記三次元モデルの符号化にて符号化三次元モデルが生成された場合、前記符号化三次元モデルを復号して復号三次元モデルを生成し、前記外部装置により前記復元パラメータの符号化にて符号化復元パラメータが生成された場合、前記符号化復元パラメータを復号して復号復元パラメータを生成し、前記レンダリング部が、予め設定されたレンダリング用パラメータを用いて、前記三次元モデルまたは前記復号部により生成された前記復号三次元モデルをレンダリングして前記二次元画像を生成し、前記二次元画像復元部が、前記復元パラメータまたは前記復号部により生成された前記復号復元パラメータを用いて、前記二次元画像に対し前記復元処理を施し、前記復元二次元画像を生成する、ことを特徴とする。
The three-dimensional image processing device of claim 3 is the three-dimensional image processing device of
請求項3の三次元画像処理装置によれば、外部装置から伝送または蓄積された符号化三次元モデル及び/または符号化復元パラメータが復号され、三次元モデルに誤差等がある場合であっても、その誤差を補正した二次元画像を生成することができる。また、符号化三次元モデルが非可逆符号化により生成されている場合、当該非可逆符号化に起因する三次元モデルの劣化をも補正した二次元画像を生成することができる。 According to the three-dimensional image processing device of claim 3, an encoded three-dimensional model and/or encoded restoration parameters transmitted or stored from an external device are decoded, and even if there is an error in the three-dimensional model, a two-dimensional image in which the error has been corrected can be generated. In addition, if the encoded three-dimensional model has been generated by lossy encoding, a two-dimensional image in which the degradation of the three-dimensional model caused by the lossy encoding has also been corrected can be generated.
また、請求項4の三次元画像処理装置は、請求項3に記載の三次元画像処理装置において、前記二次元画像復元部が、当該三次元画像処理装置が前記復元パラメータまたは前記符号化復元パラメータを入力する際に入力エラーが発生した場合、以前に入力した前記復元パラメータ、または前記復号部により以前に生成された前記復号復元パラメータを用いて、前記二次元画像に対し前記復元処理を施し、前記復元二次元画像を生成し、前記復号部が前記符号化復元パラメータを復号する際に復号エラーが発生した場合、前記復号部により以前に生成された前記復号復元パラメータを用いて、前記二次元画像に対し前記復元処理を施し、前記復元二次元画像を生成する、ことを特徴とする。 The three-dimensional image processing device of claim 4 is characterized in that, in the three-dimensional image processing device of claim 3, the two-dimensional image restoration unit performs the restoration process on the two-dimensional image using the restoration parameters previously input or the decoding restoration parameters previously generated by the decoding unit to generate the restored two-dimensional image if an input error occurs when the three-dimensional image processing device inputs the restoration parameters or the encoding restoration parameters, and performs the restoration process on the two-dimensional image using the decoding restoration parameters previously generated by the decoding unit to generate the restored two-dimensional image if a decoding error occurs when the decoding unit decodes the encoding restoration parameters.
請求項4の三次元画像処理装置によれば、復元パラメータまたは符号化復元パラメータが伝送または蓄積の不具合によって欠落した場合に、以前の復元パラメータまたは符号化復元パラメータを用いて二次元画像を生成することができ、伝送または蓄積の不具合に対する耐性を向上することができる。特に、復元パラメータに関する符号の誤り耐性が三次元モデルに関する符号の誤り耐性よりも低く設定されている場合には、伝送または蓄積の容量を抑えつつ、三次元モデルを入力する確率を向上することができ、伝送帯域(または蓄積容量)の節約が可能となる。 According to the three-dimensional image processing device of claim 4, when the restoration parameters or the coding restoration parameters are lost due to a transmission or storage malfunction, a two-dimensional image can be generated using the previous restoration parameters or the coding restoration parameters, and the resistance to the transmission or storage malfunction can be improved. In particular, when the error resistance of the code related to the restoration parameters is set lower than the error resistance of the code related to the three-dimensional model, the probability of inputting the three-dimensional model can be improved while suppressing the transmission or storage capacity, and the transmission band (or storage capacity) can be saved.
さらに、請求項5の三次元画像処理装置は、三次元画像を表現した三次元モデルのレンダリングにより生成される二次元画像に対し、その劣化を復元するための復元パラメータを生成する三次元画像処理装置において、前記三次元モデルを入力し、予め設定されたレンダリング用パラメータを用いて、前記三次元モデルをレンダリングして前記二次元画像を生成するレンダリング部と、仮の復元パラメータを用いて、前記レンダリング部により生成された前記二次元画像の劣化を復元するための復元処理を行い、復元二次元画像を生成し、前記復元二次元画像と所定の学習用画像との間の誤差が小さくなるように、前記仮の復元パラメータを更新し、所定の終了条件を満たす場合に、更新された前記仮の復元パラメータを前記復元パラメータとして生成する復元パラメータ生成部と、を備え、前記三次元モデル、及び前記復元パラメータ生成部により生成された前記復元パラメータを出力する、ことを特徴とする。 Furthermore, the three-dimensional image processing device of claim 5 is a three-dimensional image processing device that generates restoration parameters for restoring deterioration of a two-dimensional image generated by rendering a three-dimensional model that represents a three-dimensional image, and includes a rendering unit that inputs the three-dimensional model and uses preset rendering parameters to render the three-dimensional model to generate the two-dimensional image, and a restoration parameter generation unit that performs restoration processing to restore deterioration of the two-dimensional image generated by the rendering unit using provisional restoration parameters, generates a restored two-dimensional image, updates the provisional restoration parameters so that an error between the restored two-dimensional image and a predetermined learning image is reduced, and generates the updated provisional restoration parameters as the restoration parameters when a predetermined termination condition is satisfied, and outputs the three-dimensional model and the restoration parameters generated by the restoration parameter generation unit.
請求項5の三次元画像処理装置によれば、三次元モデルに誤差等があるため、そのレンダリング結果たる二次元画像が劣化した場合に、当該劣化を復号側で事後に補正するための復元パラメータを生成することができる。 According to the three-dimensional image processing device of claim 5, when an error or the like exists in a three-dimensional model and the two-dimensional image that is the rendering result is deteriorated, restoration parameters can be generated to correct the deterioration after the fact on the decoding side.
また、請求項6の三次元画像処理装置は、請求項5に記載の三次元画像処理装置において、さらに、前記三次元モデルを入力し、前記三次元モデルに対し情報源符号化、通信路符号化、または前記情報源符号化及び前記通信路符号化を施し、符号化三次元モデルを生成する三次元モデル符号化部と、前記復元パラメータ生成部により生成された前記復元パラメータに対し前記情報源符号化、前記通信路符号化、または前記情報源符号化及び前記通信路符号化を施し、符号化復元パラメータを生成する復元パラメータ符号化部と、を備え、前記三次元モデル符号化部により生成された前記符号化三次元モデル、及び前記復元パラメータ符号化部により生成された前記符号化復元パラメータを出力する、ことを特徴とする。 The three-dimensional image processing device of claim 6 is the three-dimensional image processing device of claim 5, further comprising a three-dimensional model coding unit that inputs the three-dimensional model and applies source coding, channel coding, or the source coding and the channel coding to the three-dimensional model to generate an encoded three-dimensional model, and a restoration parameter coding unit that applies source coding, channel coding, or the source coding and the channel coding to the restoration parameters generated by the restoration parameter generating unit to generate encoded restoration parameters, and is characterized in that it outputs the encoded three-dimensional model generated by the three-dimensional model coding unit and the encoded restoration parameters generated by the restoration parameter coding unit.
請求項6の三次元画像処理装置によれば、情報を圧縮することで、伝送容量(または蓄積容量)を節約することができ、情報に冗長な情報を付加することで、伝送誤り(または蓄積誤り)を補正することができる。 According to the three-dimensional image processing device of claim 6, by compressing information, it is possible to save transmission capacity (or storage capacity), and by adding redundant information to information, it is possible to correct transmission errors (or storage errors).
また、請求項7の三次元画像処理装置は、請求項6に記載の三次元画像処理装置において、さらに、前記三次元モデル符号化部により生成された前記符号化三次元モデルを復号し、復号三次元モデルを生成する三次元モデル復号部を備え、前記レンダリング部が、予め設定されたレンダリング用パラメータを用いて、前記三次元モデル復号部により生成された前記復号三次元モデルをレンダリングし、前記二次元画像を生成する、ことを特徴とする。 The three-dimensional image processing device of claim 7 is the three-dimensional image processing device of claim 6, further comprising a three-dimensional model decoding unit that decodes the encoded three-dimensional model generated by the three-dimensional model encoding unit and generates a decoded three-dimensional model, and the rendering unit renders the decoded three-dimensional model generated by the three-dimensional model decoding unit using preset rendering parameters, and generates the two-dimensional image.
請求項7の三次元画像処理装置によれば、三次元モデルに誤差等があり、さらに符号化に起因する三次元モデルの劣化があるため、そのレンダリング結果たる二次元画像が劣化した場合に、当該劣化を復号側で事後に補正するための復元パラメータを生成することができる。 According to the three-dimensional image processing device of claim 7, when there is an error in the three-dimensional model and further degradation of the three-dimensional model due to encoding, resulting in degradation of the two-dimensional image that is the rendering result, restoration parameters can be generated to correct the degradation afterwards on the decoding side.
また、請求項8の三次元画像処理装置は、請求項5に記載の三次元画像処理装置において、前記復元パラメータを出力する頻度を、前記三次元モデルを入力する頻度よりも低くする、ことを特徴とする。 The three-dimensional image processing device of claim 8 is characterized in that, in the three-dimensional image processing device of claim 5, the frequency of outputting the restoration parameters is set lower than the frequency of inputting the three-dimensional model.
請求項8の三次元画像処理装置によれば、出力される復元パラメータのデータ量が減少するため、三次元モデル及び復元パラメータの伝送または蓄積に必要なビットレートまたは記録容量が少なくて済むようになる。 According to the three-dimensional image processing device of claim 8, the amount of data of the output restoration parameters is reduced, so that the bit rate or recording capacity required for transmitting or storing the three-dimensional model and the restoration parameters can be reduced.
また、請求項9の三次元画像処理装置は、請求項6または7に記載の三次元画像処理装置において、前記符号化復元パラメータを出力する頻度を、前記三次元モデルを入力する頻度よりも低くする、ことを特徴とする。 The 3D image processing device of claim 9 is characterized in that, in the 3D image processing device of claim 6 or 7, the frequency of outputting the encoding and restoration parameters is set lower than the frequency of inputting the 3D model.
請求項9の三次元画像処理装置によれば、出力される符号化復元パラメータのデータ量が減少するため、符号化三次元モデル及び符号化復元パラメータの伝送または蓄積に必要なビットレートまたは記録容量が少なくて済むようになる。 According to the three-dimensional image processing device of claim 9, the amount of data of the encoded and restored parameters is reduced, so that the bit rate or recording capacity required for transmitting or storing the encoded three-dimensional model and the encoded and restored parameters can be reduced.
また、請求項10の三次元画像処理装置は、請求項5から9までのいずれか一項に記載の三次元画像処理装置において、前記復元パラメータ生成部が、前記レンダリング部により生成された前記二次元画像を入力すると共に、前記学習用画像を入力し、前記仮の復元パラメータを用いて、前記二次元画像の劣化を復元するための前記復元処理を行い、第一復元二次元画像を生成し、劣化パラメータを用いて、前記第一復元二次元画像を劣化するための劣化処理を行い、第一劣化二次元画像を生成し、前記劣化パラメータを用いて、前記学習用画像を劣化するための前記劣化処理を行い、第二劣化二次元画像を生成し、前記仮の復元パラメータを用いて、前記第二劣化二次元画像の劣化を復元するための前記復元処理を行い、第二復元二次元画像を生成し、前記二次元画像と前記第一劣化二次元画像との間の誤差、及び前記学習用画像と前記第二復元二次元画像との間の誤差が小さくなるように、前記仮の復元パラメータ及び前記劣化パラメータを更新し、所定の終了条件を満たす場合に、更新された前記仮の復元パラメータを前記復元パラメータとして生成する、ことを特徴とする。 The three-dimensional image processing device of claim 10 is a three-dimensional image processing device according to any one of claims 5 to 9, characterized in that the restoration parameter generation unit inputs the two-dimensional image generated by the rendering unit and the learning image, performs the restoration process to restore the degradation of the two-dimensional image using the provisional restoration parameters, generates a first restored two-dimensional image, performs the degradation process to degrade the first restored two-dimensional image using the degradation parameters, generates a first degraded two-dimensional image, performs the degradation process to degrade the learning image using the degradation parameters, generates a second degraded two-dimensional image, performs the restoration process to restore the degradation of the second degraded two-dimensional image using the provisional restoration parameters, generates a second restored two-dimensional image, updates the provisional restoration parameters and the degradation parameters so that the error between the two-dimensional image and the first degraded two-dimensional image and the error between the learning image and the second restored two-dimensional image are reduced, and generates the updated provisional restoration parameters as the restoration parameters when a predetermined termination condition is satisfied.
請求項10の三次元画像処理装置によれば、入力した三次元モデルと入力した学習用画像とが、必ずしも同じ被写体または条件において取得したものでなくとも、三次元モデルの誤差等に起因する劣化を補正するための復元パラメータを有効に学習することができる。 According to the three-dimensional image processing device of claim 10, even if the input three-dimensional model and the input learning image are not necessarily acquired from the same subject or under the same conditions, restoration parameters for correcting degradation due to errors in the three-dimensional model can be effectively learned.
さらに、請求項11のプログラムは、コンピュータを、請求項1から4までのいずれか一項に記載の三次元画像処理装置として機能させることを特徴とする。
Furthermore, the program of
また、請求項12のプログラムは、コンピュータを、請求項5から10までのいずれか一項に記載の三次元画像処理装置として機能させることを特徴とする。
The program of
以上のように、本発明によれば、三次元画像を伝送または蓄積するシステムにおいて、三次元モデルを所望の視点でレンダリングする際に、レンダリングにより得られる二次元画像の劣化を補正することができる。 As described above, according to the present invention, in a system for transmitting or storing three-dimensional images, when a three-dimensional model is rendered from a desired viewpoint, degradation of the two-dimensional image obtained by rendering can be corrected.
以下、本発明を実施するための形態について図面を用いて詳細に説明する。本発明は、三次元画像を伝送または蓄積するシステムにおいて、三次元モデルのレンダリングにより得られた二次元画像の劣化を抑制するために、三次元モデルに対してその誤差等を直接除外する処理を行うのではなく、レンダリング後の二次元画像に対して処理を行うものである。 The following describes in detail the embodiments of the present invention with reference to the drawings. In a system for transmitting or storing three-dimensional images, the present invention performs processing on the two-dimensional image after rendering, rather than directly removing errors from the three-dimensional model, in order to suppress degradation of the two-dimensional image obtained by rendering the three-dimensional model.
〔復号側の三次元画像処理装置:実施例1〕
まず、実施例1の復号側の三次元画像処理装置(三次元画像復号装置)について説明する。実施例1の復号側の三次元画像処理装置は、三次元モデルをレンダリングすることで生成した二次元画像に対し、予め設定された(事前に調整された)復元パラメータを用いて復元処理を施し、復元二次元画像を生成する例である。
[3D image processing device on the decoding side: Example 1]
First, a description will be given of a 3D image processing device (3D image decoding device) on the decoding side of Example 1. The 3D image processing device on the decoding side of Example 1 is an example in which a 2D image generated by rendering a 3D model is subjected to a restoration process using preset (pre-adjusted) restoration parameters to generate a restored 2D image.
図1は、実施例1の復号側の三次元画像処理装置における構成の一例を示すブロック図であり、図2は、実施例1の復号側の三次元画像処理装置における処理の一例を示すフローチャートである。 FIG. 1 is a block diagram showing an example of the configuration of a 3D image processing device on the decoding side in the first embodiment, and FIG. 2 is a flowchart showing an example of the processing in the 3D image processing device on the decoding side in the first embodiment.
三次元画像処理装置1-1は、三次元モデルに符号化を適用した符号化三次元モデルを、対応する符号化側の三次元画像処理装置(外部装置)から直接入力するか、または図示しないメモリから読み出す。また、三次元画像処理装置1-1は、レンダリングのためのパラメータ(以下、「レンダリング用パラメータ」という。)を入力する。そして、三次元画像処理装置1-1は、符号化三次元モデルを復号し、レンダリング用パラメータを用いて、三次元モデルから二次元画像を復元して出力する。 The 3D image processing device 1-1 either directly inputs an encoded 3D model, which is a 3D model that has been encoded, from a corresponding encoding 3D image processing device (external device) or reads it from a memory (not shown). The 3D image processing device 1-1 also inputs parameters for rendering (hereinafter referred to as "rendering parameters"). The 3D image processing device 1-1 then decodes the encoded 3D model and uses the rendering parameters to reconstruct and output a 2D image from the 3D model.
レンダリング用パラメータとしては、例えば、仮想カメラの視点位置、姿勢角、画角、投影法、露出及び照明(種類、配置及び姿勢)を示すパラメータのうち1以上のパラメータが含まれる。後述する図3に示す実施例2の三次元画像処理装置1-2についても同様である。 The rendering parameters include, for example, one or more of the parameters indicating the viewpoint position, attitude angle, angle of view, projection method, exposure, and lighting (type, arrangement, and attitude) of the virtual camera. The same applies to the three-dimensional image processing device 1-2 of the second embodiment shown in FIG. 3, which will be described later.
この三次元画像処理装置1-1は、三次元モデル復号部11、レンダリング部12、復元パラメータ記憶部13及び二次元画像復元部14を備えている。
This 3D image processing device 1-1 includes a 3D
三次元画像処理装置1-1は、符号化三次元モデル及びレンダリング用パラメータを入力する(ステップS201)。三次元モデル復号部11は、符号化三次元モデルを入力し、符号化三次元モデルを復号することで復号三次元モデルを生成し(ステップS202)、復号三次元モデルをレンダリング部12に出力する。
The 3D image processing device 1-1 receives the encoded 3D model and rendering parameters (step S201). The 3D
三次元モデル復号部11は、後述する図4、図5、図7または図8に示す三次元モデル符号化部31と対をなし、互いに逆の処理または所定の誤差内における近似的な逆の処理を行う。
The 3D
三次元モデル復号部11及び後述する三次元モデル符号化部31が用いる符号化方式は如何なるものであってもよい。例えば、符号化方式として可逆圧縮方式を用いてもよいし、非可逆圧縮方式を用いてもよい。
The encoding method used by the 3D
可逆圧縮方式としては、ランレングス符号化、差分パルス符号変調(DPCM)、ハフマン符号化、算術符号化、またはこれらの組み合わせ等の情報源符号化方式を用いることができる。また、例えば、三次元モデルがデプス画像または高度地図のように、二次元のマップとして表現される場合には、それを画像と見なし、JPEG、JPEG2000等の画像符号化方式による情報源符号化方式にて符号化するようにしてもよい。また、三次元モデルが時々刻々変化する場合には、MPEG-1、MPEG-2、MPEG-4、MPEG-4 Part 10 AVC|H.264、MPEG-H HEVC|H.265、MPEG-I VVC等の映像符号化方式による情報源符号化方式にて符号化するようにしてもよい。 As a lossless compression method, a source coding method such as run-length coding, differential pulse code modulation (DPCM), Huffman coding, arithmetic coding, or a combination of these can be used. Also, for example, if a three-dimensional model is represented as a two-dimensional map, such as a depth image or an altitude map, it may be regarded as an image and coded using a source coding method based on an image coding method such as JPEG or JPEG2000. Also, if the three-dimensional model changes from moment to moment, it may be coded using a source coding method based on a video coding method such as MPEG-1, MPEG-2, MPEG-4, MPEG-4 Part 10 AVC | H.264, MPEG-H HEVC | H.265, MPEG-I VVC, etc.
また、符号化方式は、誤り検出符号化、誤り訂正符号化、暗号符号化等の通信路符号化であってもよいし、情報源符号化と通信路符号化とを併用したものであってもよい。 The coding method may be channel coding such as error detection coding, error correction coding, or encryption coding, or may be a combination of source coding and channel coding.
符号化方式として情報源符号化、通信路符号化またはその両方を用いることで、情報を圧縮し、伝送容量(蓄積容量)を節約することができる。また、情報に冗長な情報を付加することで、伝送誤り(蓄積誤り)を補正することができる。 By using source coding, channel coding, or both as the coding method, it is possible to compress information and save transmission capacity (storage capacity). In addition, by adding redundant information to information, it is possible to correct transmission errors (storage errors).
レンダリング部12は、ユーザにより設定されたレンダリング用パラメータを入力すると共に、三次元モデル復号部11から復号三次元モデルを入力する。レンダリング部12は、レンダリング用パラメータを用いて復号三次元モデルをレンダリングすることで、CG(コンピュータグラフィックス)の二次元画像を生成する(ステップS203)。そして、レンダリング部12は、二次元画像を二次元画像復元部14に出力する。
The
復元パラメータ記憶部13には、二次元画像復元部14の動作を規定するパラメータ(以下、「復元パラメータ」という。)を保持している。復元パラメータは予め設定され、復元パラメータ記憶部13に格納される。復元パラメータは、例えばニューラルネットワークの結合重み係数値及びバイアス値である。
The restoration
二次元画像復元部14は、レンダリング部12から二次元画像を入力すると共に、復元パラメータ記憶部13から復元パラメータを読み出し、復元パラメータを用いて二次元画像に対し、当該二次元画像の劣化を復元するための復元処理を施し、復元二次元画像を生成する(ステップS204)。そして、二次元画像復元部14は、復元二次元画像を出力する(ステップS205)。
The two-dimensional
二次元画像復元部14は、例えば、ニューラルネットワークによって構成することができる。この場合、復元パラメータ記憶部13に保持された復元パラメータは、ニューラルネットワークの各素子に設定される結合重み係数値(及び必要に応じてバイアス値)である。
The two-dimensional
例えば、復元パラメータの具体的な値は、3次元モデルの誤差等に起因する劣化、欠落等を有する二次元画像から、これらの劣化等を補正または補完できるように、事前に調整されているものとする。 For example, the specific values of the restoration parameters are adjusted in advance so that degradation, loss, etc. caused by errors in the 3D model can be corrected or complemented in 2D images that have such degradation, loss, etc.
二次元画像復元部14がニューラルネットワークにより構成される場合、そのネットワーク構成の一部または全部として、畳み込みニューラルネットワークを用いることができる。このような構成とすることにより、画像の局所的な特徴を考慮した画像復元が可能となり、被写体の輪郭形状等を忠実に復元することが可能となる。また、ネットワークの結合が局所的であるため、全結合のネットワークに比べて演算コスト及びハードウェア規模を削減することが可能となる。
When the two-dimensional
また、二次元画像復元部14がニューラルネットワークにより構成される場合、その構造としてオートエンコーダを用いることができる。このような構成とすることにより、画像に含まれる本質的な情報を抜き出し、当該本質的な情報から画像を再構成することで、雑音または劣化のみを除去した画像復元が可能となる。
When the two-dimensional
また、二次元画像復元部14がニューラルネットワークにより構成される場合、その構造として、サイクルガン(CycleGAN)等の敵対的生成ネットワーク(GAN:Generative Adversarial Network)を用いることができる。これにより、復元された画像の写実性を増すことができる。
In addition, when the two-dimensional
以上のように、実施例1の復号側の三次元画像処理装置1-1によれば、レンダリング部12は、レンダリング用パラメータを用いて、符号化三次元モデルが復号された復号三次元モデルをレンダリングすることで、二次元画像を生成する。
As described above, according to the decoding-side 3D image processing device 1-1 of the first embodiment, the
二次元画像復元部14は、予め設定された復元パラメータを用いて、二次元画像に対して復元処理を施し、復元二次元画像を生成する。
The two-dimensional
これにより、三次元モデルに誤差等があり、符号化による劣化があるため、そのレンダリングにより得られた二次元画像が劣化した場合であっても、その劣化を補正した復元二次元画像を得ることができる。したがって、三次元画像を伝送または蓄積するシステムにおいて、三次元モデルを所望の視点でレンダリングする際に、レンダリングにより得られる二次元画像の劣化を補正することができる。 As a result, even if the 2D image obtained by rendering is degraded due to errors in the 3D model and degradation due to encoding, a restored 2D image can be obtained in which the degradation has been corrected. Therefore, in a system for transmitting or storing 3D images, when a 3D model is rendered from a desired viewpoint, degradation of the 2D image obtained by rendering can be corrected.
尚、図1に示した実施例1の復号側の三次元画像処理装置1-1は、三次元モデル復号部11を備えているが、三次元モデル復号部11を備えていなくてもよい。この場合、三次元画像処理装置1-1は、レンダリング部12、復元パラメータ記憶部13及び二次元画像復元部14を備え、符号化されていない三次元モデルを直接入力する。つまり、レンダリング部12は、レンダリング用パラメータを用いて、入力した三次元モデルをレンダリングする。
Note that the 3D image processing device 1-1 on the decoding side in Example 1 shown in FIG. 1 includes a 3D
これにより、三次元モデルに誤差等があるため、三次元モデルのレンダリングにより得られた二次元画像が劣化した場合であっても、その劣化を補正した復元二次元画像を得ることができる。 As a result, even if the 2D image obtained by rendering the 3D model is degraded due to errors in the 3D model, a restored 2D image can be obtained with the degradation corrected.
また、図1に示した実施例1の復号側の三次元画像処理装置1-1が三次元モデル復号部11を備えていない場合、これに対応する符号化側の三次元画像処理装置は、三次元モデルを符号化する必要がない。この場合、符号化側の三次元画像処理装置は、三次元モデルを符号化することなく、そのまま出力する。
In addition, if the decoding-side 3D image processing device 1-1 of the first embodiment shown in FIG. 1 does not include the 3D
〔復号側の三次元画像処理装置:実施例2〕
次に、実施例2の復号側の三次元画像処理装置(三次元画像復号装置)について説明する。実施例2の復号側の三次元画像処理装置は、三次元モデルをレンダリングすることで二次元画像を生成する。そして、三次元画像処理装置は、二次元画像に対し、後述する図5、図7または図8に示す符号化側の三次元画像処理装置3-2a,3-2b,3-2cにより生成され出力された復元パラメータを用いて復元処理を施し、復元二次元画像を生成する例である。
[3D image processing device on the decoding side: Example 2]
Next, a 3D image processing device (3D image decoding device) on the decoding side of the second embodiment will be described. The 3D image processing device on the decoding side of the second embodiment generates a 2D image by rendering a 3D model. The 3D image processing device performs a restoration process on the 2D image using restoration parameters generated and output by the 3D image processing devices 3-2a, 3-2b, and 3-2c on the encoding side shown in FIG. 5, FIG. 7, or FIG. 8 described later, and generates a restored 2D image.
図3は、実施例2の復号側の三次元画像処理装置における構成の一例を示すブロック図である。 Figure 3 is a block diagram showing an example of the configuration of a 3D image processing device on the decoding side in Example 2.
この三次元画像処理装置1-2は、三次元モデル復号部11、レンダリング部12、復元パラメータ記憶部13、二次元画像復元部14及び復元パラメータ復号部15を備えている。
This 3D image processing device 1-2 includes a 3D
図1に示した実施例1の復号側の三次元画像処理装置1-1とこの実施例2の復号側の三次元画像処理装置1-2とを比較すると、両三次元画像処理装置1-1,1-2は、三次元モデル復号部11、レンダリング部12、復元パラメータ記憶部13及び二次元画像復元部14を備えている点で共通する。一方、三次元画像処理装置1-2は、三次元画像処理装置1-1の構成に加えて復元パラメータ復号部15を備えている点で、三次元画像処理装置1-1と相違する。図3において、図1と共通する部分には図1と同一の符号を付し、その詳しい説明は省略する。
Comparing the 3D image processing device 1-1 on the decoding side of the first embodiment shown in FIG. 1 with the 3D image processing device 1-2 on the decoding side of the second embodiment, both 3D image processing devices 1-1 and 1-2 have in common a 3D
三次元画像処理装置1-2は、符号化三次元モデル及び符号化復元パラメータを、対応する符号化側の三次元画像処理装置(外部装置)から直接入力するか、または図示しないメモリから読み出す。また、三次元画像処理装置1-2は、レンダリング用パラメータを入力する。 The 3D image processing device 1-2 inputs the encoded 3D model and the encoded restoration parameters directly from the corresponding encoding side 3D image processing device (external device) or reads them from a memory (not shown). The 3D image processing device 1-2 also inputs rendering parameters.
復元パラメータ復号部15は、後述する図5、図7または図8に示す符号化側の三次元画像処理装置3-2a,3-2b,3-2cにより生成され出力された符号化復元パラメータを入力する。そして、復元パラメータ復号部15は、符号化復元パラメータを復号することで復号復元パラメータを生成し、復元パラメータとして復元パラメータ記憶部13に格納する。
The restoration
復元パラメータ復号部15が入力する符号化復元パラメータは、例えば後述する図5、図7または図8に示す符号化側の三次元画像処理装置3-2a,3-2b,3-2cにおいて、情報源符号化、通信路符号化、またはその両者を適用された形で出力されたパラメータである。
The encoded restoration parameters input to the restoration
復元パラメータ復号部15は、後述する図5、図7または図8に示す復元パラメータ符号化部34と対をなし、互いに逆の処理または所定の誤差内における近似的な逆の処理を行う。
The restoration
復元パラメータ復号部15及び後述する復元パラメータ符号化部34が用いる符号化方式は如何なるものであってもよいが、好ましくは可逆の方式とする。
The encoding method used by the restoration
符号化方式として、例えばランレングス符号化、差分パルス符号変調(DPCM)、ハフマン符号化、算術符号化、またはこれらの組み合わせ等の情報源符号化方式を用いることができる。また、符号化方式として、例えば誤り検出符号化、誤り訂正符号化、暗号符号化等の通信路符号化方式であってもよいし、また、情報源符号化方式と通信路符号化方式とを併用したものであってもよい。 The coding method may be, for example, a source coding method such as run-length coding, differential pulse code modulation (DPCM), Huffman coding, arithmetic coding, or a combination of these. The coding method may also be, for example, a channel coding method such as error detection coding, error correction coding, or encryption coding, or may be a combination of a source coding method and a channel coding method.
符号化方式として情報源符号化、通信路符号化またはその両方を用いることで、情報を圧縮することができる。また、情報に冗長な情報を付加することで、伝送容量(蓄積容量)を節約すると共に、伝送誤り(蓄積誤り)を補正することが可能となる。 By using source coding, channel coding, or both as the coding method, information can be compressed. Also, by adding redundant information to information, it is possible to save transmission capacity (storage capacity) and correct transmission errors (storage errors).
以上のように、実施例2の復号側の三次元画像処理装置1-2によれば、レンダリング部12は、レンダリング用パラメータを用いて、符号化三次元モデルが復号された復号三次元モデルをレンダリングすることで、二次元画像を生成する。
As described above, in the decoding-side 3D image processing device 1-2 of the second embodiment, the
二次元画像復元部14は、符号化復元パラメータが復号された復号復元パラメータを用いて、二次元画像に対して復元処理を施し、復元二次元画像を生成する。
The two-dimensional
つまり、三次元画像処理装置1-2は、後述する図5、図7または図8に示す符号化側の三次元画像処理装置3-2a,3-2b,3-2cにより生成され出力(伝送または蓄積)された復元パラメータを用いて、二次元画像から復元二次元画像を生成する。 In other words, the 3D image processing device 1-2 generates a restored 2D image from a 2D image using restoration parameters generated and output (transmitted or stored) by the encoding-side 3D image processing devices 3-2a, 3-2b, and 3-2c shown in Figures 5, 7, and 8, which will be described later.
これにより、実施例1の復号側の三次元画像処理装置1-1と同様に、三次元画像を伝送または蓄積するシステムにおいて、三次元モデルを所望の視点でレンダリングする際に、レンダリングにより得られる二次元画像の劣化を補正することができる。 As a result, in a system that transmits or stores 3D images, similar to the 3D image processing device 1-1 on the decoding side in Example 1, it is possible to correct the degradation of the 2D image obtained by rendering when rendering a 3D model from a desired viewpoint.
尚、図3に示した実施例2の復号側の三次元画像処理装置1-2は、三次元モデル復号部11及び復元パラメータ復号部15を備えているが、三次元モデル復号部11及び復元パラメータ復号部15を備えていなくてもよい。
Note that the 3D image processing device 1-2 on the decoding side in Example 2 shown in FIG. 3 includes a 3D
この場合、三次元画像処理装置1-2は、レンダリング部12、復元パラメータ記憶部13及び二次元画像復元部14を備え、符号化されていない三次元モデル及び符号化されていない復元パラメータを直接入力する。つまり、レンダリング部12は、レンダリング用パラメータを用いて、入力した三次元モデルをレンダリングし、三次元画像処理装置1-2は、入力した復元パラメータを復元パラメータ記憶部13に格納する。
In this case, the 3D image processing device 1-2 includes a
これにより、三次元モデルに誤差等があるため、三次元モデルのレンダリングにより得られた二次元画像が劣化した場合であっても、その劣化を補正した復元二次元画像を得ることができる。 As a result, even if the 2D image obtained by rendering the 3D model is degraded due to errors in the 3D model, a restored 2D image can be obtained with the degradation corrected.
三次元画像処理装置1-2が三次元モデル復号部11及び復元パラメータ復号部15を備えていない場合には、これに対応する符号化側の三次元画像処理装置は、三次元モデル及び復元パラメータを符号化する必要がない。この場合、符号化側の三次元画像処理装置は、三次元モデル及び復元パラメータを符号化することなく、そのまま出力する。
If the 3D image processing device 1-2 does not have a 3D
また、三次元画像処理装置1-2は、レンダリング部12、復元パラメータ記憶部13、二次元画像復元部14及び復元パラメータ復号部15を備え、三次元モデル復号部11を備えていなくてもよい。
The 3D image processing device 1-2 may also include a
また、三次元画像処理装置1-2は、三次元モデル復号部11、レンダリング部12、復元パラメータ記憶部13及び二次元画像復元部14を備え、復元パラメータ復号部15を備えていなくてもよい。
The 3D image processing device 1-2 may also include a 3D
ところで、三次元画像処理装置1-2の復元パラメータ復号部15は、符号化復元パラメータを入力できない場合があり、また、符号化復元パラメータを入力したとしても、これを復号できない場合もあり得る。このような入力エラーまたは復号エラーが発生した場合、二次元画像復元部14は、復元パラメータ記憶部13から、復元パラメータ復号部15が以前に入力して格納した復元パラメータを読み出し、復元二次元画像を生成する。
However, the restoration
また、三次元画像処理装置1-2が復元パラメータ復号部15を備えておらず、復元パラメータを直接入力する構成において、復元パラメータを入力できない場合(入力エラーが発生した場合)もあり得る。この場合、二次元画像復元部14は、復元パラメータ記憶部13から、当該三次元画像処理装置1-2が以前に入力して格納した復元パラメータを読み出し、復元二次元画像を生成する。
In addition, in a configuration in which the 3D image processing device 1-2 does not include a restoration
これは、対応する符号化側の三次元画像処理装置が符号化復元パラメータまたは復元パラメータを出力しなかった場合(第一のケース)が想定される。また、対応する符号化側の三次元画像処理装置が符号化復元パラメータまたは復元パラメータを出力したが、エラーにより欠落した場合(第二のケース)も想定される。 This is assumed to be the case when the corresponding encoding side 3D image processing device does not output the encoding restoration parameters or restoration parameters (first case). It is also assumed to be the case when the corresponding encoding side 3D image processing device outputs the encoding restoration parameters or restoration parameters but they are missing due to an error (second case).
例えば、符号化三次元モデル及び符号化復元パラメータが多重化され伝送される場合に、第一のケースが想定される。この場合、復号側の三次元画像処理装置1-2は、受信したストリーム(例えばトランスポートストリーム(Transport Stream))に符号化復元パラメータに関するストリーム(Elementary Stream)が存在しないことを示す識別子等を用いて、符号化復元パラメータまたは復元パラメータが出力されなかったとして、入力エラーを判断する。 For example, the first case is assumed when the encoded 3D model and the encoding restoration parameters are multiplexed and transmitted. In this case, the 3D image processing device 1-2 on the decoding side uses an identifier or the like indicating that a stream (Elementary Stream) related to the encoding restoration parameters does not exist in the received stream (e.g., a transport stream) and determines that an input error has occurred, assuming that the encoding restoration parameters or restoration parameters have not been output.
また、符号化三次元モデル及び符号化復元パラメータが別回線で伝送される場合、またはエラー耐性が異なる伝送路符号化方式で伝送される場合に、第一のケースまたは第二のケースが想定される。この場合、例えば対応する符号化側の三次元画像処理装置が符号化復元パラメータを出力していないときに、空のパケット(ヌルパケット)を出力することとし、復号側の三次元画像処理装置1-2は、空のパケットを入力することで、入力エラーを判断する。 The first or second case can be assumed when the encoded 3D model and the encoding and restoration parameters are transmitted over different lines, or when they are transmitted using a transmission line coding method with different error tolerance. In this case, for example, when the corresponding encoding 3D image processing device is not outputting the encoding and restoration parameters, it outputs an empty packet (null packet), and the decoding 3D image processing device 1-2 judges an input error by inputting the empty packet.
第二のケースにおいては、復号側の三次元画像処理装置1-2は、誤り検出符号等を用いることで、誤りが検出されたときに欠落エラーを判断する。また、復号側の三次元画像処理装置1-2は、符号化三次元モデルを入力してから一定時間以内に符号化復元パラメータを入力しないときにタイムアウトとして、入力エラーを判断するようにしてもよい。 In the second case, the 3D image processing device 1-2 on the decoding side determines a missing error when an error is detected by using an error detection code or the like. In addition, the 3D image processing device 1-2 on the decoding side may determine an input error as a timeout when no encoding and restoration parameters are input within a certain time period after inputting the encoded 3D model.
これにより、復元パラメータが伝送または蓄積の不具合によって欠落した場合に、以前の復元パラメータにより二次元画像を復元することが可能となり、伝送または蓄積の不具合に対する耐性を向上することができる。 This makes it possible to restore a two-dimensional image using previous restoration parameters if the restoration parameters are lost due to a transmission or storage malfunction, thereby improving resistance to transmission or storage malfunctions.
特に、復元パラメータに関する符号の誤り耐性が三次元モデルに関する符号の誤り耐性よりも低く設定されている場合には、伝送または蓄積の容量を抑えつつ、三次元モデルを入力する確率を向上することができ、伝送帯域(または蓄積容量)の節約が可能となる。 In particular, when the error tolerance of the code for the restoration parameters is set lower than the error tolerance of the code for the 3D model, it is possible to improve the probability of inputting the 3D model while suppressing the transmission or storage capacity, thereby saving the transmission bandwidth (or storage capacity).
〔符号化側の三次元画像処理装置:実施例1〕
次に、実施例1の符号化側の三次元画像処理装置(三次元画像符号化装置)について説明する。実施例1の符号化側の三次元画像処理装置は、三次元モデルを符号化することで符号化三次元モデルを生成し、符号化三次元モデルを出力する例である。
[Encoding side three-dimensional image processing device: Example 1]
Next, a description will be given of a 3D image processing device (3D image encoding device) on the encoding side of Example 1. The 3D image processing device on the encoding side of Example 1 is an example that generates an encoded 3D model by encoding a 3D model, and outputs the encoded 3D model.
図4は、実施例1の符号化側の三次元画像処理装置における構成の一例を示すブロック図である。この三次元画像処理装置3-1は、三次元モデル符号化部31を備えている。三次元画像処理装置3-1は、図1に示した実施例1の復号側の三次元画像処理装置1-1が三次元モデル復号部11を備えている場合に対応する符号化側の装置である。
FIG. 4 is a block diagram showing an example of the configuration of a 3D image processing device on the encoding side in the first embodiment. This 3D image processing device 3-1 includes a 3D
三次元モデル符号化部31は、図1に示した三次元モデル復号部11と対をなし、互いに同一の符号化方式によって動作するものとする。三次元モデル符号化部31は、後述する三次元モデル化部2から三次元モデルを入力し、三次元モデルを符号化することで符号化三次元モデルを生成し、符号化三次元モデルを出力する。
The three-dimensional
三次元モデル符号化部31により出力された符号化三次元モデルは、対応する図1に示した三次元画像処理装置1-1へ伝送されるか、または図示しないメモリに蓄積される。メモリに蓄積された符号化三次元モデルは、対応する図1に示した三次元画像処理装置1-1により読み出される。
The encoded 3D model output by the 3D
三次元モデル化部2は、例えば図示しないカメラから複数の視点の計測データ(画像)を入力し、複数の視点の画像から三次元モデルを生成し、三次元モデルを三次元画像処理装置3-1へ出力する。
The three-
三次元モデル化部2は、例えば、カメラから複数の画像を入力し、複数の視点の画像から三次元モデルを生成する。この生成には、例えば、一方の視点の画像を複数のブロック(部分画像)に分割し、当該ブロックとの相互相関が最大(または誤差が最小)となる他方の視点の画像上の領域を求めることで視差を算出し、当該視差から奥行き情報を推定するステレオマッチング法を適用することができる。このようにして得られた奥行き情報を前記一方の画像座標に対応付けて画像化することで、デプス画像による三次元モデルが得られる。
The three-
また、三次元モデル化部2は、前記複数の視点の画像からそれぞれ特徴点を抽出し、類似した特徴点同士を対応付け、その画像座標対から三次元座標を得るものであってもよい。この場合、得られた画像対の数の点で構成される点群として、三次元モデルが得られる。尚、前記特徴点の抽出及び対応付けには、例えば、SIFT(Scale-Invariant Feature Transform)を用いることができる。
The three-
さらに、前記点群のうち、近傍にある3個以上(例えば3個)の点を組み合わせて多角形(例えば三角形)群を構成することで、ポリゴンモデルによる三次元モデルを得るようにしてもよい。 Furthermore, three or more (e.g., three) nearby points from the point group may be combined to form a group of polygons (e.g., triangles) to obtain a three-dimensional model using a polygon model.
〔符号化側の三次元画像処理装置:実施例2-1〕
次に、実施例2-1の符号化側の三次元画像処理装置(三次元画像符号化装置)について説明する。実施例2-1の符号化側の三次元画像処理装置は、三次元モデルを符号化することで符号化三次元モデルを生成して出力すると共に、三次元モデルをレンダリングすることで二次元画像を生成し、学習用画像及び二次元画像を用いて復元パラメータを生成して出力する例である。
[Encoding side three-dimensional image processing device: Example 2-1]
Next, a three-dimensional image processing device (three-dimensional image coding device) on the coding side of Example 2-1 will be described. The three-dimensional image processing device on the coding side of Example 2-1 is an example in which a three-dimensional model is coded to generate and output an encoded three-dimensional model, a two-dimensional image is generated by rendering the three-dimensional model, and a restoration parameter is generated and output using a learning image and the two-dimensional image.
図5は、実施例2-1の符号化側の三次元画像処理装置における構成の一例を示すブロック図であり、図6は、実施例2-1の符号化側の三次元画像処理装置における処理の一例を示すフローチャートである。 FIG. 5 is a block diagram showing an example of the configuration of a 3D image processing device on the encoding side in Example 2-1, and FIG. 6 is a flowchart showing an example of the processing in the 3D image processing device on the encoding side in Example 2-1.
この三次元画像処理装置3-2aは、三次元モデル符号化部31、レンダリング部32、復元パラメータ生成部33及び復元パラメータ符号化部34を備えている。復元パラメータ生成部33は、復元パラメータ記憶部41、二次元画像復元部42、誤差評価部43及び復元パラメータ更新部44を備えている。
This 3D image processing device 3-2a includes a 3D
三次元画像処理装置3-2aは、図3に示した実施例2の復号側の三次元画像処理装置1-2が三次元モデル復号部11及び復元パラメータ復号部15を備えている場合に対応する符号化側の装置である。
The three-dimensional image processing device 3-2a is an encoding-side device that corresponds to the case where the decoding-side three-dimensional image processing device 1-2 of the second embodiment shown in FIG. 3 is equipped with a three-dimensional
三次元画像処理装置3-2aは、三次元モデル化部2から三次元モデルを入力すると共に、予め設定されたレンダリング用パラメータを入力し、さらに学習用画像を入力する(ステップS601)。三次元モデル化部2については、図4にて説明済みであるため、ここでは説明を省略する。
The three-dimensional image processing device 3-2a inputs the three-dimensional model from the three-
レンダリング部32は、三次元モデルを入力すると共に、予め設定されたレンダリング用パラメータを入力し、レンダリング用パラメータを用いて三次元モデルをレンダリングすることで、CGの二次元画像を生成する(ステップS602)。そして、レンダリング部32は、二次元画像を復元パラメータ生成部33に出力する。
The
レンダリング用パラメータは、学習用画像の撮影条件に一致することが好ましい。また、レンダリング部32の動作は、図3に示したレンダリング部12と同様のアルゴリズムによって動作することが好ましいが、必ずしも完全に一致するアルゴリズムである必要はない。
It is preferable that the rendering parameters match the shooting conditions of the learning image. In addition, it is preferable that the
復元パラメータ生成部33は、学習用画像を入力すると共に、レンダリング部32から二次元画像を入力する。そして、復元パラメータ生成部33は、仮の復元パラメータを用いて二次元画像から復元二次元画像を求め、学習用画像と復元二次元画像との間の誤差が小さくなるように、仮の復元パラメータを更新する。
The restoration
復元パラメータ生成部33は、所定の終了条件を満たす場合に、更新した仮の復元パラメータを復元パラメータとして、復元パラメータ符号化部34に出力する。
When a predetermined termination condition is satisfied, the restoration
具体的には、復元パラメータ生成部33の復元パラメータ記憶部41には、二次元画像復元部42の動作を規定する仮のパラメータを保持している。仮の復元パラメータは、例えばニューラルネットワークの結合重み係数値及びバイアス値である。
Specifically, the restoration
二次元画像復元部42は、レンダリング部32から二次元画像を入力すると共に、復元パラメータ記憶部41から仮の復元パラメータを読み出し、仮の復元パラメータを用いて二次元画像に対して復元処理を施し、復元二次元画像を生成する(ステップS603)。そして、二次元画像復元部42は、復元二次元画像を誤差評価部43に出力する。
The two-dimensional
二次元画像復元部42は、図3に示した二次元画像復元部14と同様の方式によって実装されるが、それらの具体的な挙動は復元パラメータによって変化するため、挙動まで一致するとは限らない。ただし、同一の復元パラメータを、二次元画像復元部42及び図3に示した二次元画像復元部14に与えた場合には、両二次元画像復元部42,14は、同一の動作をするものとする。
The two-dimensional
例えば、二次元画像復元部42及び二次元画像復元部14がニューラルネットワークにより構成される場合、素子間のネットワークの接続形態(及び活性化関数)が互いに同一の挙動となるものとする。
For example, if the two-dimensional
誤差評価部43は、学習用画像を入力すると共に、二次元画像復元部42から復元二次元画像を入力し、学習用画像と復元二次元画像との間の差異を定量化することで誤差を評価し、誤差値を算出する(ステップS604)。そして、誤差評価部43は、誤差値を復元パラメータ更新部44に出力する。
The
例えば、誤差評価部43は、画素位置毎に、復元二次元画像の画素値から学習用画像の画素値を減算し、減算結果である誤差画像を誤差値として出力するようにしてもよい。また、誤差評価部43は、誤差画像を画像全体に渡って総和した値を、誤差値として出力するようにしてもよい。
For example, the
さらに、誤差評価部43は、誤差画像を画像の部分領域毎に総和して、当該部分領域毎の総和値を誤差値として出力するようにしてもよい。この場合、各部分領域は、互いに重なりを有しても有していなくても構わない。
Furthermore, the
誤差評価部43が算出する誤差値は、例えば絶対値誤差によるものであってもよいし、二乗誤差によるものであってもよい。また、誤差評価部43が誤差値を算出する際に総和演算を行う場合には、誤差値は、絶対値誤差和(SAE:Sum of Absolute Errors)、二乗誤差和(SSE:Sum of Squared Errors)、絶対値誤差の平均値(MAE:Mean Absolute Error)、二乗誤差の平均値の正の平方根(RMSE:Root Mean Squared Error)等によるものであってもよい。
The error value calculated by the
さらに、誤差評価部43は、学習用画像と復元二次元画像との間の構造類似性指標(SSIM:Structural SIMilarity)に基づいて、誤差値を算出するようにしてもよい。例えば、1からSSIM値を減じた値を誤差値とする。
Furthermore, the
また、誤差評価部43は、学習用画像と復元二次元画像との間の交差エントロピーまたは相互相関値に基づいて、誤差値を算出するようにしてもよい。また、誤差評価部43は、算出した複数の誤差値及び前記構造類似性指標等を結合(例えば、線形結合)することで、出力すべき誤差値を求めるようにしてもよい。
The
学習用画像としては、三次元画像処理装置3-2aが入力する三次元モデルが三次元モデル化部2により生成される際に使用した画像を用いるようにしてもよい。例えば、三次元モデルが複数の視点の画像から生成される場合、当該複数の視点の画像のいずれかを学習用画像として用いるようにしてもよい。この場合、視点の画像を撮影した際のカメラ位置及び画角情報は、レンダリング用パラメータとして用いることができる。
As the learning image, the image used when the 3D model input to the 3D image processing device 3-2a is generated by the
また、三次元モデル化部2において使用するセンサまたはカメラとは別に、学習用画像取得用のカメラを設置しておき、当該学習画像取得用カメラにより取得された画像を、学習用画像として用いるようにしてもよい。
In addition, a camera for acquiring learning images may be installed separately from the sensor or camera used in the three-
復元パラメータ更新部44は、誤差評価部43から誤差値を入力し、当該誤差値が小さくなるように、復元パラメータ記憶部41に一時的に格納されている仮の復元パラメータの値を更新する(ステップS605)。そして、復元パラメータ更新部44は、所定の終了条件を満たした場合、仮の復元パラメータを復元パラメータとして復元パラメータ符号化部34に出力する。
The restoration
例えば、復元パラメータ更新部44は、復元パラメータ記憶部41に格納されている仮の復元パラメータを所定量または乱数値(疑似乱数値を含む)だけ変化させることで、誤差値が小さくなる場合には変化後の仮の復元パラメータを採用し、小さくならない場合には変化前の仮の復元パラメータを維持する操作を1回以上実施してもよい。
For example, the restoration
また、復元パラメータ更新部44は、二次元画像復元部42の入出力関係の関数を仮の復元パラメータの各々において偏微分した値(ヤコビアン値)に基づいて、例えば勾配降下法により仮の復元パラメータを更新してもよい。
The restoration
偏微分に基づく手法として二次元画像復元部42にニューラルネットワークを用いた場合には、復元パラメータ更新部44は、誤差値逆伝播法(バックプロパゲーション法)によって仮の復元パラメータを更新してもよい。
When a neural network is used in the two-dimensional
復元パラメータ更新部44は、仮の復元パラメータを更新する繰り返し回数、誤差評価部43から入力する誤差値、またはその両方に基づいて規定される終了条件を満たした場合に、その繰り返し動作を停止し、最後に更新(または最後の直前に更新)した仮の復元パラメータを復元パラメータとして、復元パラメータ符号化部34に出力する。
When a termination condition is met that is defined based on the number of iterations for updating the provisional restoration parameters, the error value input from the
例えば終了条件は、誤差値が所定の値を下回った場合に満たしたと判定され、復元パラメータ更新部44は、最後に更新した仮の復元パラメータを復元パラメータとして出力するようにしてもよい。また、終了条件は、現在の誤差値が以前の誤差値を上回った場合に満たしたと判定され、復元パラメータ更新部44は、最後の直前に更新した仮の復元パラメータを復元パラメータとして出力するようにしてもよい。
For example, the termination condition may be determined to be satisfied when the error value falls below a predetermined value, and the restoration
また、終了条件は、現在の誤差値と以前の誤差値との間の差分が所定値以下となった場合に満たしたと判定され、復元パラメータ更新部44は、最後に更新した仮の復元パラメータまたは最後の直前に更新した仮の復元パラメータを復元パラメータとして出力するようにしてもよい。
The termination condition is determined to be satisfied when the difference between the current error value and the previous error value becomes equal to or less than a predetermined value, and the restoration
また、終了条件は、復元パラメータ更新部44の更新回数が所定の繰り返し回数に達したときに満たしたと判定され、復元パラメータ更新部44は、最後に更新した仮の復元パラメータを復元パラメータとして出力するようにしてもよい。
The termination condition may be determined to be satisfied when the number of updates by the restoration
また、終了条件は、復元パラメータ更新部44の更新回数の条件と、誤差値に基づく条件との間の論理演算(例えば、論理和または論理積)によって判定されるようにしてもよい。
The termination condition may also be determined by a logical operation (e.g., a logical sum or a logical product) between a condition on the number of updates by the restoration
さらに、誤差評価部43は、学習用画像とは異なる検証用画像を学習用画像の代わりに入力し、レンダリング部32は、当該検証用画像に呼応する(対応する)レンダリング用パラメータを使用し、レンダリング部32、二次元画像復元部42及び誤差評価部43を動作させたときの誤差評価部43により出力される誤差値に基づいて、復元パラメータ更新部44が終了条件を判定するようにしてもよい。
Furthermore, the
この場合、検証用画像は終了条件の判定のみに用いられ、仮の復元パラメータの更新には用いない。また、検証用画像の入力に伴う終了条件の判定は、学習用画像による仮の復元パラメータの更新の都度行うようにしてもよいし、学習用画像による復元パラメータの更新を複数回行った場合の複数回の更新毎に行うようにしてもよい。 In this case, the verification image is used only to determine the termination condition, and is not used to update the provisional restoration parameters. Furthermore, the determination of the termination condition associated with the input of the verification image may be performed each time the provisional restoration parameters are updated using the learning image, or may be performed after each update when the restoration parameters are updated multiple times using the learning image.
三次元モデル符号化部31は、図3に示した三次元モデル復号部11と対をなし、互いに同一の符号化方式によって動作するものとする。三次元モデル符号化部31は、三次元モデルを符号化することで符号化三次元モデルを生成し、符号化三次元モデルを出力する(ステップS606)。
The three-dimensional
復元パラメータ符号化部34は、図3に示した復元パラメータ復号部15と対をなし、互いに同一の符号化方式によって動作するものとする。復元パラメータ符号化部34は、復元パラメータ更新部44から復元パラメータを入力し、復元パラメータを符号化することで符号化復元パラメータを生成し、符号化復元パラメータを出力する(ステップS607)。
The restoration
三次元モデル符号化部31により出力された符号化三次元モデル及び復元パラメータ符号化部34により出力された符号化復元パラメータは、対応する図3に示した三次元画像処理装置1-2へ伝送されるか、または図示しないメモリに蓄積される。メモリに蓄積された符号化三次元モデル及び符号化復元パラメータは、対応する図3に示した三次元画像処理装置1-2により読み出される。
The encoded 3D model output by the 3D
以上のように、実施例2-1の符号化側の三次元画像処理装置3-2aによれば、レンダリング部32は、レンダリング用パラメータを用いて三次元モデルをレンダリングすることで、二次元画像を生成する。
As described above, in the encoding-side 3D image processing device 3-2a of Example 2-1, the
復元パラメータ生成部33は、仮の復元パラメータを用いて二次元画像から復元二次元画像を求め、学習用画像と復元二次元画像との間の誤差が小さくなるように、仮の復元パラメータを更新する。そして、復元パラメータ生成部33は、所定の終了条件を満たす場合に、更新した仮の復元パラメータを復元パラメータとして出力する。
The restoration
そして、三次元モデル及び復元パラメータは符号化され、符号化三次元モデル及び符号化復元パラメータとして出力(伝送または蓄積)される。三次元画像処理装置3-2aにより出力された符号化三次元モデル及び符号化復元パラメータを入力する図3に示した実施例2の復号側の三次元画像処理装置1-2は、前述のとおり、復元二次元画像を生成する。 Then, the 3D model and the reconstruction parameters are coded and output (transmitted or stored) as the coded 3D model and the coding reconstruction parameters. The 3D image processing device 1-2 on the decoding side of the second embodiment shown in FIG. 3, which receives the coded 3D model and the coding reconstruction parameters output by the 3D image processing device 3-2a, generates a reconstructed 2D image as described above.
これにより、三次元モデルに誤差等があり、符号化による劣化があるため、三次元モデルのレンダリングにより得られた二次元画像が劣化した場合であっても、その劣化を補正した復元二次元画像を得ることができる。つまり、事後的に復号側が二次元画像の劣化を補正するために、符号化側の三次元画像処理装置3-2aにおいて復元パラメータを生成することができる。 As a result, even if the 2D image obtained by rendering the 3D model is degraded due to errors in the 3D model and degradation due to encoding, a restored 2D image can be obtained in which the degradation has been corrected. In other words, restoration parameters can be generated in the 3D image processing device 3-2a on the encoding side so that the decoding side can subsequently correct the degradation of the 2D image.
したがって、三次元画像を伝送または蓄積するシステムにおいて、三次元モデルを所望の視点でレンダリングする際に、レンダリングにより得られる二次元画像の劣化を補正することができる。 Therefore, in a system that transmits or stores three-dimensional images, when a three-dimensional model is rendered from a desired viewpoint, the degradation of the two-dimensional image obtained by rendering can be corrected.
尚、図5に示した三次元画像処理装置3-2aは、三次元モデル符号化部31及び復元パラメータ符号化部34を備えているが、三次元モデル符号化部31及び復元パラメータ符号化部34を備えていなくてもよい。この場合、三次元画像処理装置3-2aは、レンダリング部32及び復元パラメータ生成部33を備え、符号化されていない三次元モデル及び符号化されていない復元パラメータを直接出力する。つまり、三次元画像処理装置3-2aは、入力した三次元モデルをそのまま出力し、復元パラメータ生成部33の復元パラメータ更新部44は、復元パラメータを出力する。
Note that although the 3D image processing device 3-2a shown in FIG. 5 includes a 3D
また、三次元画像処理装置3-2aは、レンダリング部32、復元パラメータ生成部33及び復元パラメータ符号化部34を備え、三次元モデル符号化部31を備えていなくてもよい。
The three-dimensional image processing device 3-2a may also include a
また、三次元画像処理装置3-2aは、三次元モデル符号化部31、レンダリング部32及び復元パラメータ生成部33を備え、復元パラメータ符号化部34を備えていなくてもよい。
The three-dimensional image processing device 3-2a may also include a three-dimensional
〔符号化側の三次元画像処理装置:実施例2-2〕
次に、実施例2-2の符号化側の三次元画像処理装置(三次元画像符号化装置)について説明する。実施例2-2の符号化側の三次元画像処理装置は、三次元モデルを符号化することで符号化三次元モデルを生成して出力すると共に、符号化三次元モデルを復号し、復号三次元モデルをレンダリングすることで二次元画像を生成し、学習用画像及び二次元画像を用いて復元パラメータを生成して出力する例である。
[Encoding side three-dimensional image processing device: Example 2-2]
Next, a three-dimensional image processing device (three-dimensional image encoding device) on the encoding side of Example 2-2 will be described. The three-dimensional image processing device on the encoding side of Example 2-2 is an example in which a three-dimensional model is encoded to generate and output an encoded three-dimensional model, the encoded three-dimensional model is decoded, the decoded three-dimensional model is rendered to generate a two-dimensional image, and a learning image and the two-dimensional image are used to generate and output restoration parameters.
図7は、実施例2-2の符号化側の三次元画像処理装置における構成の一例を示すブロック図である。 Figure 7 is a block diagram showing an example of the configuration of a 3D image processing device on the encoding side in Example 2-2.
この三次元画像処理装置3-2bは、三次元モデル符号化部31、レンダリング部32、復元パラメータ生成部33、復元パラメータ符号化部34及び三次元モデル復号部35を備えている。復元パラメータ生成部33は、復元パラメータ記憶部41、二次元画像復元部42、誤差評価部43及び復元パラメータ更新部44を備えている。
This 3D image processing device 3-2b includes a 3D
図5に示した実施例2-1の符号化側の三次元画像処理装置3-2aと図7に示す実施例2-2の符号化側の三次元画像処理装置3-2bとを比較すると、両三次元画像処理装置3-2a,3-2bは、三次元モデル符号化部31、レンダリング部32、復元パラメータ生成部33及び復元パラメータ符号化部34を備えている点で共通する。
Comparing the encoding side 3D image processing device 3-2a of Example 2-1 shown in FIG. 5 with the encoding side 3D image processing device 3-2b of Example 2-2 shown in FIG. 7, both 3D image processing devices 3-2a and 3-2b have in common the fact that they are equipped with a 3D
一方、三次元画像処理装置3-2bは、三次元モデル復号部35を備えている点で、三次元モデル復号部35を備えていない三次元画像処理装置3-2aと相違する。図7において、図5と共通する部分には図5と同一の符号を付し、その詳しい説明は省略する。
On the other hand, the 3D image processing device 3-2b differs from the 3D image processing device 3-2a, which does not have a 3D
三次元画像処理装置3-2bは、図5に示した三次元画像処理装置3-2aと同様に、図3に示した実施例2の復号側の三次元画像処理装置1-2が三次元モデル復号部11及び復元パラメータ復号部15を備えている場合に対応する符号化側の装置である。
The three-dimensional image processing device 3-2b is an encoding-side device that corresponds to the case where the decoding-side three-dimensional image processing device 1-2 of the second embodiment shown in FIG. 3 is equipped with a three-dimensional
三次元モデル符号化部31は、符号化三次元モデルを外部へ出力すると共に、三次元モデル復号部35に出力する。
The 3D
三次元モデル復号部35は、三次元モデル符号化部31から符号化三次元モデルを入力し、符号化三次元モデルを復号することで復号三次元モデルを生成し、復号三次元モデルをレンダリング部32に出力する。
The 3D
三次元モデル復号部35は、図3に示した三次元モデル復号部11と同じ符号化方式を用いて処理を行い、互いに同一の入出力関係を有するものとする。
The three-dimensional
尚、三次元モデル符号化部31が局部復号(ローカルデコード)出力を有する場合には、当該出力を三次元モデル復号部35の出力に代えて使用することで、三次元モデル復号部35を省略することができる。すなわち、三次元モデル符号化部31は、局部復号機能を有する場合、局部復号により生成した復号三次元モデルをレンダリング部32に出力する。
When the 3D
また、図5に示した実施例2-1におけるレンダリング部32の動作と、図7に示した実施例2-2におけるレンダリング部32の動作とを比較すると、前者は、原データである三次元モデルを入力するのに対し、後者は、符号化及び復号処理により生成された復号三次元モデルを入力する点で相違し、それ以外は同様である。
In addition, when comparing the operation of the
以上のように、実施例2-2の符号化側の三次元画像処理装置3-2bによれば、三次元モデル復号部35は、三次元モデルが符号化された符号化三次元モデルを復号し、復号三次元モデルを生成する。レンダリング部32は、レンダリング用パラメータを用いて復号三次元モデルをレンダリングすることで、二次元画像を生成する。
As described above, in the encoding-side 3D image processing device 3-2b of Example 2-2, the 3D
復元パラメータ生成部33は、仮の復元パラメータを用いて二次元画像から復元二次元画像を求め、学習用画像と復元二次元画像との間の誤差が小さくなるように、仮の復元パラメータを更新する。そして、復元パラメータ生成部33は、所定の終了条件を満たす場合に、更新した仮の復元パラメータを復元パラメータとして出力する。
The restoration
そして、三次元モデル及び復元パラメータは符号化され、符号化三次元モデル及び符号化復元パラメータとして出力(伝送または蓄積)される。三次元画像処理装置3-2bにより出力された符号化三次元モデル及び符号化復元パラメータを入力する図3に示した実施例2の復号側の三次元画像処理装置1-2は、前述のとおり、復元二次元画像を生成する。 Then, the 3D model and the reconstruction parameters are coded and output (transmitted or stored) as an encoded 3D model and encoded reconstruction parameters. The 3D image processing device 1-2 on the decoding side of the second embodiment shown in FIG. 3, which receives the encoded 3D model and encoded reconstruction parameters output by the 3D image processing device 3-2b, generates a reconstructed 2D image as described above.
これにより、実施例2-1の符号化側の三次元画像処理装置3-2aと同様に、事後的に復号側が二次元画像の劣化を補正するために、符号化側の三次元画像処理装置3-2bにおいて復元パラメータを生成することができる。 As a result, similar to the 3D image processing device 3-2a on the encoding side in Example 2-1, restoration parameters can be generated in the 3D image processing device 3-2b on the encoding side so that the decoding side can correct the degradation of the 2D image afterwards.
したがって、三次元画像を伝送または蓄積するシステムにおいて、三次元モデルを所望の視点でレンダリングする際に、レンダリングにより得られる二次元画像の劣化を補正することができる。 Therefore, in a system that transmits or stores three-dimensional images, when a three-dimensional model is rendered from a desired viewpoint, the degradation of the two-dimensional image obtained by rendering can be corrected.
また、三次元画像処理装置3-2bによれば、三次元モデル符号化部31により三次元モデルに符号化劣化が生じる場合であっても、復元パラメータ生成部33において、当該符号化劣化も含めて復元パラメータの最適化が行われる。このため、特に三次元モデル符号化部31に用いる符号化方式が非可逆(ロッシー)である場合に有効となる。尚、三次元モデル符号化部31に用いる符号化方式が可逆(ロスレス)である場合であっても、復元パラメータに対する悪影響はない。
In addition, according to the three-dimensional image processing device 3-2b, even if the three-dimensional
したがって、三次元モデルの符号化方式が如何なる方式であっても、好適な復元パラメータを得ることができる。三次元モデル符号化部31に用いる符号化方式が非可逆である場合には、三次元モデルに誤差等があり、さらに、非可逆符号化に起因する三次元モデルに劣化があるため、当該三次元モデルをレンダリングすることで得られた二次元画像が劣化している場合であっても、事後的に復号側にてその劣化を補正した復元二次元画像を得るための復元パラメータを生成することができる。
Therefore, suitable restoration parameters can be obtained regardless of the encoding method of the three-dimensional model. If the encoding method used by the three-dimensional
また、三次元モデル符号化部31が局部復号の機能を有する場合には、三次元モデル復号部35が不要となるため、演算コストが増加することはない。
In addition, if the 3D
尚、図7に示した三次元画像処理装置3-2bは、復元パラメータ符号化部34を備えているが、復元パラメータ符号化部34を備えていなくてもよい。この場合、三次元画像処理装置3-2bは、三次元モデル符号化部31、レンダリング部32、復元パラメータ生成部33及び三次元モデル復号部35を備え、符号化されていない復元パラメータを直接出力する。つまり、復元パラメータ生成部33の復元パラメータ更新部44は、復元パラメータを出力する。
Note that although the 3D image processing device 3-2b shown in FIG. 7 includes a restoration
また、三次元画像処理装置3-2bは、三次元モデル符号化部31が符号化三次元モデルを出力するようにしたが、当該三次元画像処理装置3-2bが入力した三次元モデルをそのまま出力するようにしてもよい。
In addition, in the three-dimensional image processing device 3-2b, the three-dimensional
さらに、図5に示した実施例2-1の符号化側の三次元画像処理装置3-2a及び図7に示した実施例2-2の符号化側の三次元画像処理装置3-2bにおいて、三次元画像処理装置3-2aに備えたレンダリング部32、復元パラメータ生成部33及び復元パラメータ符号化部34の処理、及び、三次元画像処理装置3-2bに備えた三次元モデル復号部35、レンダリング部32、復元パラメータ生成部33及び復元パラメータ符号化部34の処理(以下、「復元パラメータ更新等」という。)に伴う動作は、三次元モデルが入力される都度実行されるものであってもよいし、間欠的に実行されるものであってもよい。
Furthermore, in the three-dimensional image processing device 3-2a on the encoding side of Example 2-1 shown in FIG. 5 and the three-dimensional image processing device 3-2b on the encoding side of Example 2-2 shown in FIG. 7, the operations associated with the processing of the
また、当該動作は、三次元画像処理装置3-2a,3-2bに対するユーザの操作に従い、不特定のタイミングで実行されるものであってもよいし、特定または不特定のタイミング(例えば、初回の三次元モデルが入力されたタイミング)において1回のみ実行されるものであってもよい。 Furthermore, the operation may be performed at unspecified timing in accordance with user operations on the 3D image processing devices 3-2a and 3-2b, or may be performed only once at a specific or unspecified timing (for example, when the first 3D model is input).
また、入力される三次元モデルが時系列的なものであり、三次元モデル符号化部31がGOP(Group Of Pictures)構造を有する映像符号化方式に準拠する場合には、当該GOPの間隔(例えば、イントラピクチャまたはイントラスライスのタイミング)において、前記復元パラメータ更新等の動作が実行されるようにしてもよい。後述する図8に示す三次元画像処理装置3-2cについても同様である。
In addition, if the input 3D model is a time-series model and the 3D
また、三次元画像処理装置3-2a,3-2bにおいて、復元パラメータ生成部33に備えた復元パラメータ更新部44により復元パラメータが出力され、復元パラメータ符号化部34により符号化が行われて符号化復元パラメータが出力される実行頻度(すなわち、符号化復元パラメータの出力頻度)は、これ以外の復元パラメータ更新等の実行頻度または三次元モデルの入力頻度(以下、総称して「三次元モデルの入力頻度」という。)と同じであってもよい。また、符号化復元パラメータの出力頻度は、三次元モデルの入力頻度よりも低くてもよい。
In addition, in the three-dimensional image processing devices 3-2a and 3-2b, the restoration parameters are output by the restoration
符号化復元パラメータが出力される実行頻度を低くすることにより、学習量の増加によって復元パラメータを一層精度高く更新することができる一方で、符号化復元パラメータのデータ量が減少するため、総合的な符号量を削減することができる。つまり、三次元モデル及び復元パラメータの伝送または蓄積に必要なビットレートまたは記録容量が少なくて済む。後述する図8に示す三次元画像処理装置3-2cについても同様である。 By reducing the execution frequency at which the encoding and restoration parameters are output, the restoration parameters can be updated with greater precision due to an increase in the amount of learning, while the amount of data for the encoding and restoration parameters is reduced, allowing the overall amount of code to be reduced. In other words, the bit rate or recording capacity required for transmitting or storing the 3D model and the restoration parameters is reduced. The same applies to the 3D image processing device 3-2c shown in Figure 8, which will be described later.
また、三次元画像処理装置3-2a,3-2bの復元パラメータ生成部33に備えた復元パラメータ更新部44は、仮の復元パラメータを更新する際に、事前または最初の学習用画像が入力されるタイミングにおいて、所定の数値系列または乱数値系列(疑似乱数値系列を含む)により初期化を行う。後述する図8に示す三次元画像処理装置3-2cについても同様である。
The restoration
この場合、復元パラメータ更新部44は、学習用画像が入力される都度、または所定数の学習用画像が入力される都度、前記初期化を行うようにしてもよい。また、復元パラメータ更新部44は、三次元画像処理装置3-2a,3-2bに対するユーザの操作に従い、不特定のタイミングで前記初期化を行うようにしてもよい。
In this case, the restoration
また、復元パラメータ更新部44は、事前に入力された学習用画像、三次元モデル及びレンダリング用パラメータを用いて三次元モデル符号化部31等の処理が行われたときの誤差値が小さくなるように復元パラメータを求めておく。そして、復元パラメータ更新部44は、事前に求めておいた復元パラメータを、前記初期化の際の所定の数値系列等として用いるようにしてもよい。この場合、事前に求めた復元パラメータを用いて転移学習を実現することができる。
The restoration
〔符号化側の三次元画像処理装置:実施例2-3〕
次に、実施例2-3の符号化側の三次元画像処理装置(三次元画像符号化装置)について説明する。実施例2-3の符号化側の三次元画像処理装置は、三次元モデルを符号化することで符号化三次元モデルを生成して出力すると共に、符号化三次元モデルを復号し、復号三次元モデルをレンダリングすることで二次元画像を生成し、サイクルガン(CycleGAN)用いて、学習用画像及び二次元画像から復元パラメータを生成して出力する例である。
[Encoding side three-dimensional image processing device: Example 2-3]
Next, a three-dimensional image processing device (three-dimensional image encoding device) on the encoding side of Example 2-3 will be described. The three-dimensional image processing device on the encoding side of Example 2-3 is an example in which a three-dimensional model is encoded to generate and output an encoded three-dimensional model, the encoded three-dimensional model is decoded, and a two-dimensional image is generated by rendering the decoded three-dimensional model, and restoration parameters are generated from a learning image and a two-dimensional image using CycleGAN and output.
図8は、実施例2-3の符号化側の三次元画像処理装置における構成の一例を示すブロック図である。 Figure 8 is a block diagram showing an example of the configuration of a 3D image processing device on the encoding side in Example 2-3.
この三次元画像処理装置3-2cは、三次元モデル符号化部31、レンダリング部32、復元パラメータ生成部37、復元パラメータ符号化部34及び三次元モデル復号部35を備えている。
This 3D image processing device 3-2c includes a 3D
図7に示した実施例2-2の符号化側の三次元画像処理装置3-2bと図8に示す実施例2-3の符号化側の三次元画像処理装置3-2cとを比較すると、両三次元画像処理装置3-2b,3-2cは、三次元モデル符号化部31、レンダリング部32、復元パラメータ符号化部34及び三次元モデル復号部35を備えている点で共通する。
When comparing the encoding side 3D image processing device 3-2b of Example 2-2 shown in FIG. 7 with the encoding side 3D image processing device 3-2c of Example 2-3 shown in FIG. 8, both 3D image processing devices 3-2b and 3-2c have in common the fact that they are equipped with a 3D
一方、三次元画像処理装置3-2cは、復元パラメータ生成部33とは異なる復元パラメータ生成部37を備えている点で、復元パラメータ生成部33を備えている三次元画像処理装置3-2bと相違する。図8において、図7と共通する部分には図7と同一の符号を付し、その詳しい説明は省略する。
On the other hand, the three-dimensional image processing device 3-2c differs from the three-dimensional image processing device 3-2b equipped with the restoration
三次元画像処理装置3-2cは、図5に示した三次元画像処理装置3-2a及び図7に示した三次元画像処理装置3-2bと同様に、図3に示した実施例2の復号側の三次元画像処理装置1-2が三次元モデル復号部11及び復元パラメータ復号部15を備えている場合に対応する符号化側の装置である。
The three-dimensional image processing device 3-2c, like the three-dimensional image processing device 3-2a shown in FIG. 5 and the three-dimensional image processing device 3-2b shown in FIG. 7, is an encoding-side device corresponding to the case where the decoding-side three-dimensional image processing device 1-2 of the second embodiment shown in FIG. 3 is equipped with a three-dimensional
復元パラメータ生成部37は、学習用画像を入力すると共に、レンダリング部32から二次元画像を入力する。復元パラメータ生成部37は、サイクルガンのニューラルネットワークを用いて、仮の復元パラメータを更新し、所定の終了条件を満たす場合に、更新した仮の復元パラメータを復元パラメータとして復元パラメータ符号化部34に出力する。
The restoration
図9は、実施例2-3における復元パラメータ生成部37の構成の一例を示すブロック図であり、図10は、復元パラメータ生成部37の処理の一例を示すフローチャートである。
Figure 9 is a block diagram showing an example of the configuration of the restoration
図5及び図7に示した復元パラメータ生成部33とこの復元パラメータ生成部37とを比較すると、両復元パラメータ生成部33,37は、仮の復元パラメータを更新する点で共通する。一方、復元パラメータ生成部37は、サイクルガンのニューラルネットワークを備え、仮の復元パラメータに加えて劣化パラメータを更新する点で、仮の復元パラメータのみを更新する復元パラメータ生成部33と相違する。
Comparing the restoration
復元パラメータ生成部37は、復元パラメータ記憶部51、劣化パラメータ記憶部52、二次元画像復元部53、二次元画像劣化部54、誤差評価部55,56、復元パラメータ更新部57及び劣化パラメータ更新部58を備えている。二次元画像復元部53及び二次元画像劣化部54は、共に敵対的生成ネットワークを備えている。
The restoration
復元パラメータ記憶部51には、二次元画像復元部53の動作を規定する仮の復元パラメータFPを保持しており、劣化パラメータ記憶部52には、二次元画像劣化部54の動作を規定する劣化パラメータRPを保持している。これらのパラメータは、ニューラルネットワークの結合重み係数値及びバイアス値である。
The restoration
二次元画像復元部53は、レンダリング部32から二次元画像Aを入力すると共に、復元パラメータ記憶部51から仮の復元パラメータFPを読み出す。そして、二次元画像復元部53は、仮の復元パラメータFPを用いて二次元画像Aに対して復元処理を施し、第一の復元二次元画像F1を生成する(ステップS1001)。二次元画像復元部53は、第一の復元二次元画像F1を二次元画像劣化部54に出力する。
The two-dimensional
二次元画像劣化部54は、二次元画像復元部53から第一の復元二次元画像F1を入力すると共に、劣化パラメータ記憶部52から劣化パラメータRPを読み出す。そして、二次元画像劣化部54は、劣化パラメータRPを用いて第一の復元二次元画像F1に対して劣化処理を施し、第一の劣化二次元画像R1を生成する(ステップS1002)。二次元画像劣化部54は、第一の劣化二次元画像R1を誤差評価部55に出力する。
The two-dimensional
この場合の劣化処理は、第一の復元二次元画像F1に対して、三次元モデルにおけるデータの誤差等及び三次元モデル符号化部31による符号化に起因する劣化を模擬し、その結果を第一の劣化二次元画像R1として生成する処理である。
The degradation process in this case is a process in which degradation caused by data errors in the 3D model and encoding by the 3D
誤差評価部55は、レンダリング部32から二次元画像Aを入力すると共に、二次元画像劣化部54から第一の劣化二次元画像R1を入力する。そして、誤差評価部55は、二次元画像Aと第一の劣化二次元画像R1との間の差異を定量化することで誤差を評価し、誤差値e1を算出する(ステップS1003)。誤差評価部55は、誤差値e1を復元パラメータ更新部57及び劣化パラメータ更新部58に出力する。
The
二次元画像劣化部54は、学習用画像Gを入力すると共に、劣化パラメータ記憶部52から劣化パラメータRPを読み出す。そして、二次元画像劣化部54は、劣化パラメータRPを用いて学習用画像Gに対して劣化処理を施し、第二の劣化二次元画像R2を生成する(ステップS1004)。二次元画像劣化部54は、第二の劣化二次元画像R2を二次元画像復元部53に出力する。
The two-dimensional
この場合の劣化処理は、学習用画像Gに対して、三次元モデルにおけるデータの誤差等及び三次元モデル符号化部31の符号化に起因する劣化を模擬し、その結果を第二の劣化二次元画像R2として生成する処理である。
The degradation process in this case is a process in which degradation of the learning image G caused by data errors in the 3D model and by the encoding by the 3D
二次元画像復元部53は、二次元画像劣化部54から第二の劣化二次元画像R2を入力すると共に、復元パラメータ記憶部51から仮の復元パラメータFPを読み出す。そして、二次元画像復元部53は、仮の復元パラメータFPを用いて第二の劣化二次元画像R2に対して復元処理を施し、第二の復元二次元画像F2を生成する(ステップS1005)。二次元画像復元部53は、第二の復元二次元画像F2を誤差評価部56に出力する。
The two-dimensional
誤差評価部56は、学習用画像Gを入力すると共に、二次元画像復元部53から第二の復元二次元画像F2を入力する。そして、誤差評価部56は、学習用画像Gと第二の復元二次元画像F2との間の差異を定量化することで誤差を評価し、誤差値e2を算出する(ステップS1006)。誤差評価部56は、誤差値e2を復元パラメータ更新部57及び劣化パラメータ更新部58に出力する。
The
復元パラメータ更新部57は、誤差評価部55から誤差値e1を入力すると共に、誤差評価部56から誤差値e2を入力する。そして、復元パラメータ更新部57は、誤差値e1,e2が小さくなるように、復元パラメータ記憶部51に一時的に格納されている仮の復元パラメータFPの値を、例えば誤差値逆伝播法により更新する(ステップS1007)。例えば、復元パラメータ更新部57は、誤差値e1が小さくなるように仮の復元パラメータFPを更新する処理と、誤差値e2が小さくなるように仮の復元パラメータFPを更新する処理とを交互に繰り返す。
The restoration
劣化パラメータ更新部58は、誤差評価部55から誤差値e1を入力すると共に、誤差評価部56から誤差値e2を入力する。そして、劣化パラメータ更新部58は、誤差値e1,e2が小さくなるように、劣化パラメータ記憶部52に一時的に格納されている劣化パラメータRPの値を、例えば誤差値逆伝播法により更新する(ステップS1008)。例えば、劣化パラメータ更新部58は、誤差値e1が小さくなるように劣化パラメータRPを更新する処理と、誤差値e2が小さくなるように劣化パラメータRPを更新する処理とを交互に繰り返す。
The degradation
復元パラメータ更新部57及び劣化パラメータ更新部58は、図5及び図7に示した復元パラメータ更新部44と同様に、所定の終了条件を満たす場合に、更新処理を停止する。復元パラメータ更新部57は、更新した仮の復元パラメータFPを復元パラメータPとして復元パラメータ符号化部34に出力する(ステップS1009)。
The restoration
所定の終了条件は、復元パラメータ更新部57及び劣化パラメータ更新部58において同じであってもよいし、異なっていてもよい。所定の終了条件は、例えば誤差値e1,e2の両方またはいずれか一方に基づいて定義してもよいし、所定のしきい値を下回った場合に成立するようにしてもよい。
The predetermined termination condition may be the same or different in the restoration
以上のように、実施例2-3の符号化側の三次元画像処理装置3-2cによれば、三次元モデル復号部35は、三次元モデルが符号化された符号化三次元モデルを復号し、復号三次元モデルを生成する。レンダリング部32は、レンダリング用パラメータを用いて復号三次元モデルをレンダリングすることで、二次元画像を生成する。
As described above, in the 3D image processing device 3-2c on the encoding side of Example 2-3, the 3D
復元パラメータ生成部37は、サイクルガンのニューラルネットワークを用いて、仮の復元パラメータを更新し、所定の終了条件を満たす場合に、更新した仮の復元パラメータを復元パラメータとして出力する。
The restoration
そして、三次元モデル及び復元パラメータは符号化され、符号化三次元モデル及び符号化復元パラメータとして出力(伝送または蓄積)される。三次元画像処理装置3-2cにより出力された符号化三次元モデル及び符号化復元パラメータを入力する図3に示した実施例2の復号側の三次元画像処理装置1-2は、前述のとおり、復元二次元画像を生成する。 Then, the 3D model and the reconstruction parameters are coded and output (transmitted or stored) as an encoded 3D model and encoded reconstruction parameters. The 3D image processing device 1-2 on the decoding side of the second embodiment shown in FIG. 3, which receives the encoded 3D model and encoded reconstruction parameters output by the 3D image processing device 3-2c, generates a reconstructed 2D image as described above.
これにより、実施例2-1,2-2の符号化側の三次元画像処理装置3-2a,3-2bと同様に、三次元画像を伝送または蓄積するシステムにおいて、三次元モデルを所望の視点でレンダリングする際に、レンダリングにより得られる二次元画像の劣化を補正することができる。 As a result, in a system that transmits or stores 3D images, similar to the 3D image processing devices 3-2a and 3-2b on the encoding side in Examples 2-1 and 2-2, it is possible to correct the degradation of the 2D image obtained by rendering when rendering a 3D model from a desired viewpoint in a system that transmits or stores 3D images.
また、三次元画像処理装置3-2cによれば、復元パラメータ生成部37は、サイクルガンのニューラルネットワークを用いるようにした。
In addition, according to the three-dimensional image processing device 3-2c, the restoration
これにより、入力した三次元モデル及び学習用画像が、必ずしも同じ被写体または撮影条件において取得したものでなくとも、三次元モデルにおけるデータの誤差等及び三次元モデル符号化部31に起因する劣化を補正するための復元パラメータを求めることができる。
As a result, even if the input 3D model and learning images are not necessarily acquired from the same subject or under the same shooting conditions, it is possible to obtain restoration parameters for correcting data errors in the 3D model and degradation caused by the 3D
すなわち、図5及び図7に示した三次元画像処理装置3-2a,3-2bでは、三次元モデル及び学習用画像は、同じ被写体及び撮影条件において取得したものである必要があるが、三次元画像処理装置3-2cでは、このような制約はない。つまり、三次元画像処理装置3-2cでは、使い勝手の良い復元パラメータの生成処理を実現することができる。 In other words, in the three-dimensional image processing devices 3-2a and 3-2b shown in Figures 5 and 7, the three-dimensional model and learning images must be acquired from the same subject and under the same shooting conditions, but in the three-dimensional image processing device 3-2c, there is no such restriction. In other words, in the three-dimensional image processing device 3-2c, it is possible to realize a process for generating restoration parameters that is easy to use.
尚、図8に示した三次元画像処理装置3-2cは、復元パラメータ符号化部34を備えているが、復元パラメータ符号化部34を備えていなくてもよい。この場合、三次元画像処理装置3-2cは、三次元モデル符号化部31、レンダリング部32、復元パラメータ生成部37及び三次元モデル復号部35を備え、符号化されていない復元パラメータを直接出力する。つまり、復元パラメータ生成部37の復元パラメータ更新部57は、復元パラメータを出力する。
Note that although the 3D image processing device 3-2c shown in FIG. 8 includes a restoration
また、三次元画像処理装置3-2cは、三次元モデル符号化部31が符号化三次元モデルを出力するようにしたが、当該三次元画像処理装置3-2cが入力した三次元モデルをそのまま出力するようにしてもよい。
In addition, in the three-dimensional image processing device 3-2c, the three-dimensional
また、三次元画像処理装置3-2cは、三次元モデル復号部35を備えているが、三次元モデル復号部35を備えていなくてもよい。この場合、レンダリング部32は、三次元モデルを直接入力する。
The 3D image processing device 3-2c also includes a 3D
以上、実施例1,2,2-1~2-3を挙げて本発明を説明したが、本発明は前記実施例1,2等に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。 The present invention has been described above using Examples 1, 2, and 2-1 to 2-3, but the present invention is not limited to Examples 1 and 2, etc., and can be modified in various ways without departing from the technical concept thereof.
尚、本発明の実施例1による復号側の三次元画像処理装置1-1及び符号化側の三次元画像処理装置3-1のハードウェア構成としては、通常のコンピュータを使用することができる。本発明の実施例2による復号側の三次元画像処理装置1-2、及び実施例2-1~2-3による符号化側の三次元画像処理装置3-2a~3-2cについても同様である。 In addition, a normal computer can be used as the hardware configuration of the three-dimensional image processing device 1-1 on the decoding side and the three-dimensional image processing device 3-1 on the encoding side according to the first embodiment of the present invention. The same applies to the three-dimensional image processing device 1-2 on the decoding side according to the second embodiment of the present invention and the three-dimensional image processing devices 3-2a to 3-2c on the encoding side according to the embodiments 2-1 to 2-3.
三次元画像処理装置1-1,1-2,3-1,3-2a~3-2cは、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。 The three-dimensional image processing devices 1-1, 1-2, 3-1, 3-2a to 3-2c are configured by a computer equipped with a CPU, a volatile storage medium such as RAM, a non-volatile storage medium such as ROM, an interface, etc.
三次元画像処理装置1-1に備えた三次元モデル復号部11、レンダリング部12、復元パラメータ記憶部13及び二次元画像復元部14の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。また、三次元画像処理装置1-2に備えた三次元モデル復号部11、レンダリング部12、復元パラメータ記憶部13、二次元画像復元部14及び復元パラメータ復号部15の各機能も、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
The functions of the three-dimensional
さらに、三次元画像処理装置3-1に備えた三次元モデル符号化部31の機能は、当該機能を記述したプログラムをCPUに実行させることにより実現される。また、三次元画像処理装置3-2aに備えた三次元モデル符号化部31、レンダリング部32、復元パラメータ生成部33及び復元パラメータ符号化部34の各機能も、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
Furthermore, the functions of the three-dimensional
また、三次元画像処理装置3-2bに備えた三次元モデル符号化部31、レンダリング部32、復元パラメータ生成部33、復元パラメータ符号化部34及び三次元モデル復号部35の各機能も、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
Furthermore, the functions of the three-dimensional
また、三次元画像処理装置3-2cに備えた三次元モデル符号化部31、レンダリング部32、復元パラメータ生成部37、復元パラメータ符号化部34及び三次元モデル復号部35の各機能も、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
Furthermore, the functions of the three-dimensional
これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD-ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。 These programs are stored in the storage medium and are read and executed by the CPU. In addition, these programs can be distributed by storing them on storage media such as magnetic disks (floppy disks, hard disks, etc.), optical disks (CD-ROMs, DVDs, etc.), and semiconductor memories, and can also be transmitted and received via a network.
1-1,1-2,3-1,3-2a,3-2b,3-2c 三次元画像処理装置
2 三次元モデル化部
11,35 三次元モデル復号部
12,32 レンダリング部
13,41,51 復元パラメータ記憶部
14,42,53 二次元画像復元部
15 復元パラメータ復号部
31 三次元モデル符号化部
33,36,37 復元パラメータ生成部
34 復元パラメータ符号化部
43,55,56 誤差評価部
44,57 復元パラメータ更新部
52 劣化パラメータ記憶部
54 二次元画像劣化部
58 劣化パラメータ更新部
A 二次元画像
F1 第一の復元二次元画像
F2 第二の復元二次元画像
R1 第一の劣化二次元画像
R2 第二の劣化二次元画像
FP 仮の復元パラメータ
P 復元パラメータ
RP 劣化パラメータ
e1,e2 誤差値
1-1, 1-2, 3-1, 3-2a, 3-2b, 3-2c 3D
Claims (12)
予め設定されたレンダリング用パラメータを用いて、前記三次元モデルをレンダリングして前記二次元画像を生成するレンダリング部と、
予め設定された復元パラメータを用いて、前記レンダリング部により生成された前記二次元画像に対し劣化を復元するための復元処理を施し、復元二次元画像を生成する二次元画像復元部と、
を備えたことを特徴とする三次元画像処理装置。 A three-dimensional image processing device that renders a three-dimensional model representing a three-dimensional image and generates a two-dimensional image,
a rendering unit that renders the three-dimensional model using preset rendering parameters to generate the two-dimensional image;
a two-dimensional image restoration unit that performs a restoration process for restoring deterioration of the two-dimensional image generated by the rendering unit using preset restoration parameters, and generates a restored two-dimensional image;
A three-dimensional image processing device comprising:
前記二次元画像復元部は、
前記三次元モデルを出力する外部装置により生成された前記復元パラメータを用いて、前記二次元画像に対し前記復元処理を施し、前記復元二次元画像を生成する、ことを特徴とする三次元画像処理装置。 2. The three-dimensional image processing device according to claim 1,
The two-dimensional image restoration unit
A three-dimensional image processing apparatus comprising: a processor for processing the two-dimensional image using the restoration parameters generated by an external device that outputs the three-dimensional model; and a processor for processing the two-dimensional image using the restoration parameters generated by an external device that outputs the three-dimensional model; and
さらに復号部を備え、
前記復号部は、
前記外部装置により前記三次元モデルの符号化にて符号化三次元モデルが生成された場合、前記符号化三次元モデルを復号して復号三次元モデルを生成し、
前記外部装置により前記復元パラメータの符号化にて符号化復元パラメータが生成された場合、前記符号化復元パラメータを復号して復号復元パラメータを生成し、
前記レンダリング部は、
予め設定されたレンダリング用パラメータを用いて、前記三次元モデルまたは前記復号部により生成された前記復号三次元モデルをレンダリングして前記二次元画像を生成し、
前記二次元画像復元部は、
前記復元パラメータまたは前記復号部により生成された前記復号復元パラメータを用いて、前記二次元画像に対し前記復元処理を施し、前記復元二次元画像を生成する、ことを特徴とする三次元画像処理装置。 3. The three-dimensional image processing device according to claim 2,
Further comprising a decoding unit,
The decoding unit is
When an encoded three-dimensional model is generated by encoding the three-dimensional model by the external device, the encoded three-dimensional model is decoded to generate a decoded three-dimensional model;
When the external device generates encoded restoration parameters by encoding the restoration parameters, the external device decodes the encoded restoration parameters to generate decoded restoration parameters;
The rendering unit is
using preset rendering parameters, the three-dimensional model or the decoded three-dimensional model generated by the decoding unit to generate the two-dimensional image;
The two-dimensional image restoration unit
a decoding unit that generates a restored two-dimensional image by performing the restoration process on the two-dimensional image using the restoration parameters or the decoded restoration parameters generated by the decoding unit.
前記二次元画像復元部は、
当該三次元画像処理装置が前記復元パラメータまたは前記符号化復元パラメータを入力する際に入力エラーが発生した場合、
以前に入力した前記復元パラメータ、または前記復号部により以前に生成された前記復号復元パラメータを用いて、前記二次元画像に対し前記復元処理を施し、前記復元二次元画像を生成し、
前記復号部が前記符号化復元パラメータを復号する際に復号エラーが発生した場合、
前記復号部により以前に生成された前記復号復元パラメータを用いて、前記二次元画像に対し前記復元処理を施し、前記復元二次元画像を生成する、ことを特徴とする三次元画像処理装置。 4. The three-dimensional image processing device according to claim 3,
The two-dimensional image restoration unit
When an input error occurs when the three-dimensional image processing device inputs the restoration parameters or the encoding restoration parameters,
performing the restoration process on the two-dimensional image using the restoration parameters previously input or the decoded restoration parameters previously generated by the decoding unit to generate the restored two-dimensional image;
When a decoding error occurs when the decoding unit decodes the encoding and decoding parameters,
a decoding unit that performs the restoration process on the two-dimensional image by using the decoded restoration parameters previously generated by the decoding unit, thereby generating the restored two-dimensional image.
前記三次元モデルを入力し、予め設定されたレンダリング用パラメータを用いて、前記三次元モデルをレンダリングして前記二次元画像を生成するレンダリング部と、
仮の復元パラメータを用いて、前記レンダリング部により生成された前記二次元画像の劣化を復元するための復元処理を行い、復元二次元画像を生成し、前記復元二次元画像と所定の学習用画像との間の誤差が小さくなるように、前記仮の復元パラメータを更新し、所定の終了条件を満たす場合に、更新された前記仮の復元パラメータを前記復元パラメータとして生成する復元パラメータ生成部と、を備え、
前記三次元モデル、及び前記復元パラメータ生成部により生成された前記復元パラメータを出力する、ことを特徴とする三次元画像処理装置。 A three-dimensional image processing device generates restoration parameters for restoring degradation of a two-dimensional image generated by rendering a three-dimensional model representing the three-dimensional image, comprising:
a rendering unit that receives the three-dimensional model and renders the three-dimensional model using preset rendering parameters to generate the two-dimensional image;
a restoration parameter generating unit that uses provisional restoration parameters to perform a restoration process for restoring deterioration of the two-dimensional image generated by the rendering unit, generates a restored two-dimensional image, updates the provisional restoration parameters so as to reduce an error between the restored two-dimensional image and a predetermined learning image, and generates the updated provisional restoration parameters as the restoration parameters when a predetermined termination condition is satisfied;
a 3D image processing apparatus which outputs the 3D model and the restoration parameters generated by the restoration parameter generating unit.
さらに、前記三次元モデルを入力し、前記三次元モデルに対し情報源符号化、通信路符号化、または前記情報源符号化及び前記通信路符号化を施し、符号化三次元モデルを生成する三次元モデル符号化部と、
前記復元パラメータ生成部により生成された前記復元パラメータに対し前記情報源符号化、前記通信路符号化、または前記情報源符号化及び前記通信路符号化を施し、符号化復元パラメータを生成する復元パラメータ符号化部と、を備え、
前記三次元モデル符号化部により生成された前記符号化三次元モデル、及び前記復元パラメータ符号化部により生成された前記符号化復元パラメータを出力する、ことを特徴とする三次元画像処理装置。 6. The three-dimensional image processing device according to claim 5,
a three-dimensional model encoding unit that receives the three-dimensional model, performs source encoding, channel encoding, or both the source encoding and the channel encoding on the three-dimensional model, and generates an encoded three-dimensional model;
a restoration parameter coding unit that performs the information source coding, the channel coding, or the information source coding and the channel coding on the restoration parameters generated by the restoration parameter generating unit to generate encoded restoration parameters,
a 3D image processing apparatus which outputs the encoded 3D model generated by the 3D model encoding unit and the encoded restoration parameters generated by the restoration parameter encoding unit.
さらに、前記三次元モデル符号化部により生成された前記符号化三次元モデルを復号し、復号三次元モデルを生成する三次元モデル復号部を備え、
前記レンダリング部は、
予め設定されたレンダリング用パラメータを用いて、前記三次元モデル復号部により生成された前記復号三次元モデルをレンダリングし、前記二次元画像を生成する、ことを特徴とする三次元画像処理装置。 7. The three-dimensional image processing device according to claim 6,
Further, a three-dimensional model decoding unit is provided for decoding the encoded three-dimensional model generated by the three-dimensional model encoding unit to generate a decoded three-dimensional model,
The rendering unit is
2. A 3D image processing apparatus comprising: a 3D image processing unit that generates the 2D image by rendering the decoded 3D model generated by the 3D model decoding unit using preset rendering parameters.
前記復元パラメータを出力する頻度を、前記三次元モデルを入力する頻度よりも低くする、ことを特徴とする三次元画像処理装置。 6. The three-dimensional image processing device according to claim 5,
2. A three-dimensional image processing apparatus comprising: a processor for processing a three-dimensional image; a processor for processing the three-dimensional image;
前記符号化復元パラメータを出力する頻度を、前記三次元モデルを入力する頻度よりも低くする、ことを特徴とする三次元画像処理装置。 8. The three-dimensional image processing device according to claim 6,
2. A three-dimensional image processing apparatus comprising: a processor for processing three-dimensional images, the processor outputting said encoded and restored parameters at a frequency lower than a frequency at which said three-dimensional model is inputted.
前記復元パラメータ生成部は、
前記レンダリング部により生成された前記二次元画像を入力すると共に、前記学習用画像を入力し、
前記仮の復元パラメータを用いて、前記二次元画像の劣化を復元するための前記復元処理を行い、第一復元二次元画像を生成し、劣化パラメータを用いて、前記第一復元二次元画像を劣化するための劣化処理を行い、第一劣化二次元画像を生成し、
前記劣化パラメータを用いて、前記学習用画像を劣化するための前記劣化処理を行い、第二劣化二次元画像を生成し、前記仮の復元パラメータを用いて、前記第二劣化二次元画像の劣化を復元するための前記復元処理を行い、第二復元二次元画像を生成し、
前記二次元画像と前記第一劣化二次元画像との間の誤差、及び前記学習用画像と前記第二復元二次元画像との間の誤差が小さくなるように、前記仮の復元パラメータ及び前記劣化パラメータを更新し、所定の終了条件を満たす場合に、更新された前記仮の復元パラメータを前記復元パラメータとして生成する、ことを特徴とする三次元画像処理装置。 10. The three-dimensional image processing device according to claim 5,
The restoration parameter generation unit
inputting the two-dimensional image generated by the rendering unit and the learning image;
performing the restoration process for restoring degradation of the two-dimensional image using the provisional restoration parameters to generate a first restored two-dimensional image; performing a degradation process for degrading the first restored two-dimensional image using degradation parameters to generate a first degraded two-dimensional image;
performing the degradation process for degrading the learning image using the degradation parameters to generate a second degraded two-dimensional image; performing the restoration process for restoring degradation of the second degraded two-dimensional image using the tentative restoration parameters to generate a second restored two-dimensional image;
A three-dimensional image processing device characterized in that the provisional restoration parameters and the degradation parameters are updated so that an error between the two-dimensional image and the first degraded two-dimensional image, and an error between the learning image and the second restored two-dimensional image are reduced, and when a predetermined termination condition is satisfied, the updated provisional restoration parameters are generated as the restoration parameters.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020098045A JP7495818B2 (en) | 2020-06-04 | 2020-06-04 | Three-dimensional image processing device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020098045A JP7495818B2 (en) | 2020-06-04 | 2020-06-04 | Three-dimensional image processing device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021190970A JP2021190970A (en) | 2021-12-13 |
JP7495818B2 true JP7495818B2 (en) | 2024-06-05 |
Family
ID=78847732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020098045A Active JP7495818B2 (en) | 2020-06-04 | 2020-06-04 | Three-dimensional image processing device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7495818B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023171336A1 (en) * | 2022-03-11 | 2023-09-14 | ソニーグループ株式会社 | Learning method, information processing device, and recording medium |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008300983A (en) | 2007-05-29 | 2008-12-11 | Canon Inc | Head-mounted display apparatus and control method therefor |
WO2019082958A1 (en) | 2017-10-27 | 2019-05-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Three-dimensional model encoding device, three-dimensional model decoding device, three-dimensional model encoding method, and three-dimensional model decoding method |
WO2019107180A1 (en) | 2017-12-01 | 2019-06-06 | ソニー株式会社 | Coding device, coding method, decoding device, and decoding method |
WO2020075252A1 (en) | 2018-10-11 | 2020-04-16 | 三菱電機株式会社 | Information processing device, program, and information processing method |
-
2020
- 2020-06-04 JP JP2020098045A patent/JP7495818B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008300983A (en) | 2007-05-29 | 2008-12-11 | Canon Inc | Head-mounted display apparatus and control method therefor |
WO2019082958A1 (en) | 2017-10-27 | 2019-05-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Three-dimensional model encoding device, three-dimensional model decoding device, three-dimensional model encoding method, and three-dimensional model decoding method |
WO2019107180A1 (en) | 2017-12-01 | 2019-06-06 | ソニー株式会社 | Coding device, coding method, decoding device, and decoding method |
WO2020075252A1 (en) | 2018-10-11 | 2020-04-16 | 三菱電機株式会社 | Information processing device, program, and information processing method |
Also Published As
Publication number | Publication date |
---|---|
JP2021190970A (en) | 2021-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7250952B2 (en) | Method, Apparatus, and Computer Program for Point Cloud Coding | |
KR102184261B1 (en) | How to compress a point cloud | |
CA3136071A1 (en) | Method and apparatus for point cloud coding | |
KR101654777B1 (en) | Apparatus and method for scalable encoding 3d mesh, and apparatus and method for scalable decoding 3d mesh | |
EP2777018A1 (en) | Predictive position encoding | |
EP2777019A1 (en) | Predictive position decoding | |
Tang et al. | Real-time compression and streaming of 4d performances | |
US12217464B2 (en) | Three-dimensional data encoding method and device, and three-dimensional data decoding method and device | |
WO2020012187A1 (en) | Method and system for compressing and decompressing digital three-dimensional point cloud data | |
CN114503553A (en) | Video-based point cloud compression model to world signaling information | |
CN118871952A (en) | V-trellis bitstream structure including syntax elements and decoding process with reconstruction | |
Dricot et al. | Hybrid octree-plane point cloud geometry coding | |
JP7495818B2 (en) | Three-dimensional image processing device and program | |
WO2022131948A1 (en) | Devices and methods for sequential coding for point cloud compression | |
KR20200144401A (en) | Method and apparatus for compressing 3 dimensional data and method and apparatus for reconstructing 3 dimensional data | |
US20230412837A1 (en) | Point cloud data transmission method, point cloud data transmission device, point cloud data reception method, and point cloud data reception device | |
Mao et al. | Learning to predict on octree for scalable point cloud geometry coding | |
JP5024962B2 (en) | Multi-view distance information encoding method, decoding method, encoding device, decoding device, encoding program, decoding program, and computer-readable recording medium | |
JP7529923B2 (en) | Method, apparatus and computer program for boundary loop detection in non-manifold meshes - Patents.com | |
US20220084253A1 (en) | Method and device for compressing three-dimensional data, and method and device for reconstructing three-dimensional data | |
US12267478B2 (en) | Method and device for compressing data representative of a volumetric three-dimensional scene with a view to real-time decompression for online viewing | |
KR20250042069A (en) | Method and apparatus for compressing 3-dimensional volume data | |
US20240040101A1 (en) | Method and device for compressing data representative of a volumetric three-dimensional scene with a view to real-time decompression for online viewing | |
WO2024140683A1 (en) | Coding method, decoding method and electronic device | |
KR20240052425A (en) | Apparatus and method for generating texture map of 3-dimensional mesh |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240501 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240502 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7495818 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |