JP7631291B2 - Information processing system, information processing method, and program - Google Patents
Information processing system, information processing method, and program Download PDFInfo
- Publication number
- JP7631291B2 JP7631291B2 JP2022210579A JP2022210579A JP7631291B2 JP 7631291 B2 JP7631291 B2 JP 7631291B2 JP 2022210579 A JP2022210579 A JP 2022210579A JP 2022210579 A JP2022210579 A JP 2022210579A JP 7631291 B2 JP7631291 B2 JP 7631291B2
- Authority
- JP
- Japan
- Prior art keywords
- virtual
- original image
- image
- virtual image
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 53
- 238000003672 processing method Methods 0.000 title claims description 4
- 239000000284 extract Substances 0.000 claims description 23
- 238000000605 extraction Methods 0.000 claims description 20
- 238000005286 illumination Methods 0.000 claims description 17
- 238000000034 method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 238000009877 rendering Methods 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 9
- 238000013500 data storage Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 241000282472 Canis lupus familiaris Species 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Landscapes
- Processing Or Creating Images (AREA)
- Image Generation (AREA)
Description
本開示は、情報処理システム、情報処理方法及びプログラムに関する。 This disclosure relates to an information processing system, an information processing method, and a program.
物体を示す元画像に対して画像変換を行い、元画像と異なる、前記物体を示す画像を得る技術が知られている。例えば、元画像に対して、回転や拡大・縮小、明るさの変更、色調の変更等の操作を行うことにより、様々な画像を大量に得ることができる。このようにして得られた大量の画像は、例えば、画像認識用の機械学習モデルの学習データとして用いられる(下記特許文献1参照)。
A technique is known in which an original image showing an object is transformed to obtain an image showing the object that is different from the original image. For example, a large number of different images can be obtained by performing operations such as rotating, enlarging/reducing, changing the brightness, or changing the color tone of the original image. The large number of images obtained in this way are used, for example, as training data for a machine learning model for image recognition (see
上記従来技術では、画像変換の態様は限られている。例えば、元画像が示す物体の向きやポーズ、形状、配置を変えることは、上記従来技術では困難である。 The above conventional techniques only allow limited image transformation. For example, it is difficult to change the orientation, pose, shape, or position of an object shown in the original image using the above conventional techniques.
本発明は、上記課題に鑑みてなされたものであって、その目的は、画像変換の態様を拡張する情報処理システム、情報処理方法及びプログラムを提供することにある。 The present invention has been made in consideration of the above problems, and its purpose is to provide an information processing system, information processing method, and program that expand the aspects of image conversion.
本開示に係る情報処理システムは、物体を示す元画像を取得する元画像取得手段と、前記物体を表す3Dモデル、照明データ、及びテクスチャデータに基づいて、仮想視点から見た、前記3Dモデルが配置された仮想空間の様子を示す仮想画像を生成する仮想画像生成手段と、前記元画像から元画像特徴量を抽出するとともに、前記仮想画像から仮想画像特徴量を抽出する特徴抽出手段と、前記元画像特徴量と前記仮想画像特徴量との類似度が大きくなるように、前記照明データのパラメータ及び前記テクスチャデータのパラメータを調整するパラメータ調整手段と、を有する。 The information processing system according to the present disclosure includes an original image acquisition means for acquiring an original image showing an object, a virtual image generation means for generating a virtual image showing the appearance of a virtual space in which the 3D model is placed as seen from a virtual viewpoint based on a 3D model representing the object, lighting data, and texture data, a feature extraction means for extracting original image features from the original image and virtual image features from the virtual image, and a parameter adjustment means for adjusting parameters of the lighting data and parameters of the texture data so as to increase the similarity between the original image features and the virtual image features.
[1.本実施形態の情報処理システムのハードウェア構成]
以下、本開示に係る情報処理システムの実施形態の一例を説明する。図1は、本実施形態の情報処理システム1のハードウェア構成の一例を示す図である。図1に示すように、情報処理システム1は、例えば、サーバコンピュータやパーソナルコンピュータ等のコンピュータであり、制御部11、記憶部12、通信部13、操作部14及び表示部15を含む。なお、図1には、情報処理システム1が1台のコンピュータにより構成される場合を示すが、情報処理システム1は、複数台のコンピュータにより構成されていてもよい。
[1. Hardware configuration of the information processing system according to this embodiment]
An example of an embodiment of an information processing system according to the present disclosure will be described below. Fig. 1 is a diagram showing an example of a hardware configuration of an
制御部11は、少なくとも1つのプロセッサを含む。記憶部12は、RAM等の揮発性メモリと、フラッシュメモリ等の不揮発性メモリと、を含む。通信部13は、有線通信用の通信インタフェースと、無線通信用の通信インタフェースと、の少なくとも一方を含む。操作部14は、キーボード、マウス、又はタッチパネル等の入力デバイスである。表示部15は、液晶ディスプレイ又は有機ELディスプレイ等のディスプレイである。
The
なお、記憶部12に記憶されるプログラムは、ネットワークNを介して供給されてもよい。また、コンピュータ読み取り可能な情報記憶媒体に記憶されたプログラムが、情報記憶媒体を読み取る読取部(例えば、光ディスクドライブやメモリカードスロット)、又は、外部機器とデータの入出力をするための入出力部(例えば、USBポート)を介して供給されてもよい。
The program stored in the
[2.本実施形態の情報処理システムの概要]
以下、本実施形態の情報処理システム1の概要を説明する。図2は、本実施形態の情報処理システム1の処理の概要を示す図である。
2. Overview of the Information Processing System of the Present Embodiment
An overview of the
図2に示すように、本実施形態の情報処理システム1は、元画像OIが示す物体Oの外観と、物体Oを表す3DモデルM、照明データL及びテクスチャデータTに基づいて生成した仮想画像VIが示す物体Oの外観と、の類似度が大きくなるように、照明データL及びテクスチャデータTのパラメータを調整する。元画像OIが示す物体Oの外観と仮想画像VIが示す物体Oの外観との類似度の評価は、具体的には、元画像OIから抽出した元画像特徴量OFと仮想画像VIから抽出した仮想画像特徴量VFとの類似度を評価することにより行われる。なお、本明細書において、「物体Oの外観」は、物体Oの向きやポーズ、形状、配置以外の物体Oの見た目(例えば色や材質感等)を意味するものとする。
2, the
本実施形態の情報処理システム1によれば、上記した照明データL及びテクスチャデータTのパラメータ調整により、元画像OIが示す物体Oの外観を反映した照明データL及びテクスチャデータTを得ることができる。そして、こうして得られた照明データL及びテクスチャデータTを用いて、3DモデルMを種々の条件下でレンダリングすることにより、元画像OIを様々な態様で変換した画像を得ることができる。なお、本明細書において、「変換」の語は広義に用いられる。すなわち、元画像OIを「変換」するとは、物体Oを示す元画像OIに基づいて、元画像OIとは異なる、物体Oを示す画像(以下、「変換画像」という。)を得ることを意味するものとし、元画像OIに対して何らかの操作を行い、元画像OIから直接的に変換画像を得ることのみを意味するものではない。以降、本実施形態の情報処理システム1の詳細について説明する。
According to the
[3.本実施形態の情報処理システムにおいて実現される機能]
以下、図2を参照しつつ、図3に示す本実施形態の情報処理システム1で実現される機能について説明する。
3. Functions realized in the information processing system of this embodiment
Hereinafter, functions realized by the
図3は、本実施形態の情報処理システム1で実現される機能の一例を示す機能ブロック図である。図3に示すように、本実施形態では、元画像記憶部100、3Dモデル記憶部101、照明データ記憶部102、テクスチャデータ記憶部103、特徴抽出器記憶部104、元画像取得部110、仮想画像生成部120、特徴抽出部130、パラメータ調整部140、及び変換画像生成部150が、情報処理システム1で実現される。元画像記憶部100、3Dモデル記憶部101、照明データ記憶部102、テクスチャデータ記憶部103、及び特徴抽出器記憶部104は、記憶部12を主として実現される。元画像取得部110、仮想画像生成部120、特徴抽出部130、パラメータ調整部140、及び変換画像生成部150は、制御部11を主として実現される。
FIG. 3 is a functional block diagram showing an example of functions realized by the
[元画像記憶部]
元画像記憶部100は、元画像OIを記憶する。
[Original image storage section]
The original
図2に示すように、元画像OIは、物体Oを示す画像である。 As shown in Figure 2, the original image OI is an image showing an object O.
物体Oは、一定の形状と大きさを有する物体である。本実施形態では、例として、物体Oは犬である。なお、物体Oは、人や動物、植物等の生物であってもよいし、石や山、建物等の無生物であってもよい。 Object O is an object having a certain shape and size. In this embodiment, as an example, object O is a dog. Note that object O may be a living thing such as a person, animal, or plant, or an inanimate object such as a stone, mountain, or building.
元画像OIは、物体Oの一部又は全部を示す。本実施形態では、元画像OIに物体Oの全部が示されるが、元画像OIは物体Oの一部のみが示されてもよい。また、本実施形態では、元画像OIが示す物体Oは1つであるが、元画像OIが示す物体Oは複数であってもよい。元画像OIが示す物体Oが複数である場合、各物体Oは互いに同じ種類のものであってもよいし、互いに異なる種類のものであってよい。本実施形態の例に即して説明すれば、元画像OIは、犬のほかにも、鳥や木、山等を示してもよい。 The original image OI shows a part or all of the object O. In this embodiment, the original image OI shows the whole of the object O, but the original image OI may show only a part of the object O. Also, in this embodiment, the original image OI shows one object O, but the original image OI may show multiple objects O. When the original image OI shows multiple objects O, the objects O may be of the same type or different types. Explaining based on the example of this embodiment, the original image OI may show birds, trees, mountains, etc. in addition to dogs.
本実施形態では、元画像OIは、現実空間に配置された物体Oの撮影画像である。これにより、現実空間に配置された物体Oの撮影画像から、現実には存在しない形態の物体Oを示す変換画像を得ることができる。一例として、本実施形態の情報処理システム1を用いて、現実空間に配置された新品のネジの撮影画像を変換することにより、現実に存在しない形態の当該ネジを示す変換画像(錆びたネジを示す画像や折れ曲がったネジを示す画像、駆動部が潰れたネジを示す画像等)を得ることができる。このようにして得られた多様な形態のネジを示す変換画像は、例えば不良品検出用の機械学習モデルの学習データとして用いることができる。なお、元画像OIは、現実空間に配置された物体Oの撮影画像に限られず、例えば、手描きの絵画や3Dモデルのレンダリング画像であってもよい。
In this embodiment, the original image OI is a photographed image of an object O placed in real space. This makes it possible to obtain a converted image showing an object O of a shape that does not exist in reality from the photographed image of the object O placed in real space. As an example, by using the
[元画像取得部]
元画像取得部110は、元画像OIを取得する。本実施形態では、元画像OIは、元画像記憶部100に記憶されているので、元画像取得部110は、元画像記憶部100から元画像OIを取得する。なお、元画像OIは、外部の情報記憶媒体又はコンピュータに記憶されていてもよい。この場合、元画像取得部110は、外部の情報記憶媒体又はコンピュータから元画像OIを取得してもよい。
[Original image acquisition section]
The original
[3Dモデル記憶部]
3Dモデル記憶部101は、3DモデルMについてのデータを記憶する。
[3D model storage unit]
The 3D
図2に示すように、3DモデルMは、物体Oを表すモデルである。3DモデルMは、物体Oの立体形状を表す少なくとも1つのポリゴンによって構成される。本実施形態では、3DモデルMは、物体Oの立体形状を表すメッシュデータに相当し、後述のテクスチャデータTを含まないモデルデータに相当する。本実施形態では、3DモデルMはソリッドモデルとするが、3DモデルMはワイヤフレームモデルやサーフェスモデルであってもよい。本実施形態では、3DモデルMは、3D-CAD等の任意の3DCGソフトウェアにより予め作成されているものとする。3DモデルMについてのデータは、3DモデルMのポリゴンを定義する各頂点の3次元座標を示す。本実施形態では、3DモデルMについてのデータは3Dモデル記憶部101に記憶されるが、3DモデルMについてのデータは、外部の情報記憶媒体又はコンピュータに記憶されていてもよい。
2, the 3D model M is a model representing the object O. The 3D model M is composed of at least one polygon that represents the three-dimensional shape of the object O. In this embodiment, the 3D model M corresponds to mesh data that represents the three-dimensional shape of the object O, and corresponds to model data that does not include texture data T, which will be described later. In this embodiment, the 3D model M is a solid model, but the 3D model M may be a wireframe model or a surface model. In this embodiment, the 3D model M is created in advance by any 3DCG software such as 3D-CAD. The data for the 3D model M indicates the three-dimensional coordinates of each vertex that defines the polygon of the 3D model M. In this embodiment, the data for the 3D model M is stored in the 3D
3DモデルMの数は、元画像OIが示す物体Oの数と同数である。本実施形態では、元画像OIが示す物体Oが1つであるため、3DモデルMの数も1つである。 The number of 3D models M is the same as the number of objects O shown in the original image OI. In this embodiment, since the original image OI shows one object O, the number of 3D models M is also one.
ところで、「物体Oを表す」とは、元画像OIが示す物体Oと同位概念の物体の立体形状を表すことを意味し、元画像OIが示す物体Oそのものの立体形状を表すことを必ずしも意味しない。例えば、元画像OIが示す物体Oが「ジョン」と名付けられた個体のビーグル犬である場合、3DモデルMは、元画像OIが示す物体Oと同位概念の物体であるビーグル犬の立体形状を表すものであれば足り、「ジョン」と名付けられた個体のビーグル犬そのものの立体形状を表すものである必要は無い。 By the way, "representing object O" means representing the three-dimensional shape of an object of the same concept as object O shown in original image OI, and does not necessarily mean representing the three-dimensional shape of object O itself shown in original image OI. For example, if object O shown in original image OI is an individual beagle dog named "John", it is sufficient for 3D model M to represent the three-dimensional shape of a beagle dog that is an object of the same concept as object O shown in original image OI, and it does not have to represent the three-dimensional shape of the individual beagle dog named "John" itself.
なお、3DモデルMは、元画像OIが示す物体Oそのものの立体形状を表すものであることが好ましい。これにより、元画像OIが示す物体Oの外観及び形状を高い精度で維持しつつ、元画像OIが示す物体Oの向き、ポーズ、又は位置を変化させた変換画像を得ることができる。 It is preferable that the 3D model M represents the three-dimensional shape of the object O itself shown in the original image OI. This makes it possible to obtain a converted image in which the orientation, pose, or position of the object O shown in the original image OI is changed while maintaining the appearance and shape of the object O shown in the original image OI with high accuracy.
[照明データ記憶部]
照明データ記憶部102は、照明データLを記憶する。
[Lighting data storage unit]
The illumination
照明データLは、3DモデルMに光を照射する光源についてのデータである。具体的には、照明データLは、例えば、光源から照射される光の強度及び色、並びに、後述する仮想空間VSにおける光源の位置及び向きをパラメータとして含む。なお、照明データLが含むパラメータはこれらに限られず、照明データLは、これら以外のパラメータを含んでもよいし、これらのパラメータを含まなくてもよい。光源としては、点光源、線光源、面光源、ボリューム光源等、任意の光源が利用可能である。また、イメージベースドライティングを利用する場合は、現実世界の全方向の光情報をキャプチャした画像が光源として利用されてもよい。 The lighting data L is data about a light source that irradiates the 3D model M. Specifically, the lighting data L includes, for example, the intensity and color of the light irradiated from the light source, as well as the position and orientation of the light source in the virtual space VS described below as parameters. Note that the parameters included in the lighting data L are not limited to these, and the lighting data L may or may not include parameters other than these. Any light source can be used as the light source, such as a point light source, a line light source, a surface light source, or a volume light source. Furthermore, when image-based lighting is used, an image that captures light information in all directions in the real world may be used as the light source.
[テクスチャデータ記憶部]
テクスチャデータ記憶部103は、テクスチャデータTを記憶する。
[Texture data storage unit]
The texture
テクスチャデータTは、3DモデルMの表面に設定されるテクスチャについてのデータである。テクスチャは、質感とも呼ばれ、例えば、物体Oの色、光沢感、透明度、金属感、凹凸等を含む。テクスチャデータTは、具体的には、3DモデルMの表面に設定されるテクスチャを示す画像データである。本実施形態では、テクスチャデータTは、例えば、物体O表面の拡散反射率(アルベド)、法線ベクトル(ノーマル)、鏡面反射率、メタリック、粗さ(ラフネス)、光沢、異方度、透明度等をパラメータとして含む。なお、テクスチャデータTが含むパラメータはこれらに限られず、テクスチャデータTは、これら以外のパラメータを含んでもよいし、これらのパラメータを含まなくてもよい。 The texture data T is data about the texture set on the surface of the 3D model M. Texture is also called texture, and includes, for example, the color, glossiness, transparency, metallic feel, and unevenness of the object O. Specifically, the texture data T is image data indicating the texture set on the surface of the 3D model M. In this embodiment, the texture data T includes, for example, the diffuse reflectance (albedo), normal vector (normal), specular reflectance, metallic, roughness, gloss, anisotropy, transparency, and the like of the surface of the object O as parameters. Note that the parameters included in the texture data T are not limited to these, and the texture data T may include parameters other than these, or may not include these parameters.
[仮想画像生成部]
以下、図4を参照しつつ、仮想画像生成部120の処理を説明する。図4は、仮想画像を生成する様子を示す図である。
[Virtual image generation unit]
The process of the virtual
図2及び図4に示すように、仮想画像生成部120は、3DモデルM、照明データL及びテクスチャデータTに基づいて、仮想視点VVから見た、3DモデルMが配置された仮想空間VSの様子を示す仮想画像VIを生成する。別の言い方をすれば、仮想画像生成部120は、照明データL、テクスチャデータT、及び仮想視点VVをレンダリング条件として、3DモデルMのレンダリング処理を行うということもできる。また、別の言い方をすれば、仮想画像生成部120は、3DモデルM、照明データL及びテクスチャデータTに基づいて、物理ベースレンダリングを行い、レンダリング画像を生成するということもできる。また、別の言い方をすれば、仮想画像生成部120は、元画像OIが示す物体Oに係る新視点画像を生成するということもできる、なお、レンダリング条件は、上記以外に、例えば仮想空間VSの背景画像や、生成する仮想画像VIの解像度・アスペクト比等を含んでもよい。仮想画像VIの生成には、フォワードレンダリング、ディファードレンダリング等の種々の公知のレンダリング手法(レンダリングパイプライン)が利用可能である。
2 and 4, the virtual
仮想空間VSは、仮想的な3次元空間である。仮想空間VSには、互いに直交する3つの座標軸が設定される。これら3つの座標軸は、ワールド座標系の座標軸である。原点は任意の位置であってよく、仮想空間VS内の位置は3次元座標で表される。なお、仮想画像生成部120では、仮想空間VSには背景画像が設定されてもよい。背景画像は、例えば、木や山、空等の風景を示す画像である。
The virtual space VS is a virtual three-dimensional space. Three mutually orthogonal coordinate axes are set in the virtual space VS. These three coordinate axes are the coordinate axes of the world coordinate system. The origin may be any position, and positions in the virtual space VS are expressed in three-dimensional coordinates. Note that the virtual
仮想視点VVは、仮想カメラとも呼ばれるものであり、ビュー座標系の座標軸を定義する。仮想画像生成部120では、仮想視点VVのパラメータ(位置・画角・拡大倍率等)が設定される。
The virtual viewpoint VV is also called a virtual camera, and defines the coordinate axes of the view coordinate system. The
以下、図5を用いて、仮想画像生成部120の詳細な処理を説明する。図5は、複数の仮想視点のそれぞれから見た仮想画像を生成する様子を示す図である。
The detailed processing of the virtual
すなわち、図5に示すように、仮想画像生成部120は、より具体的には、互いに異なる複数の仮想視点VV1,VV2,VV3のそれぞれにそれぞれが対応するとともに、当該仮想視点から見た仮想空間VSの様子を示す複数の仮想画像VI1,VI2,VI3を生成する。なお、本実施形態では、仮想視点の数は3つであるが、仮想視点の数は、これより少なくてもよく、これより多くてもよい。
More specifically, as shown in FIG. 5, the virtual
本実施形態の情報処理システム1は、上記のように、複数の仮想視点VV1,VV2,VV3のそれぞれから見た仮想空間VSの様子を示す仮想画像VIを生成する。すなわち、本実施形態の情報処理システム1は、元画像OIが示す物体Oの外観を、複数の仮想視点VV1,VV2,VV3のそれぞれから見た物体Oの外観に反映させることができる。これにより、後述するように、元画像OIが示す物体Oの向きやポーズ、形状、配置を変えた変換画像において、元画像OIが示す物体Oの外観を好適に保つことができる。
As described above, the
[特徴抽出器記憶部]
特徴抽出器記憶部104は、特徴抽出部130での処理に用いられる特徴抽出器を記憶する。具体的には、特徴抽出器記憶部104は、特徴抽出器のプログラム及びパラメータを記憶する。
[Feature Extractor Storage Unit]
The feature
特徴抽出器は、画像の特徴を抽出する学習済みの機械学習モデルである。特徴抽出器は、後述する第1の中間特徴量及び第2の中間特徴量の抽出に用いられる。本実施形態では、特徴抽出器として、学習済みのCNN(Convolutional Neural Network)から全結合層を除いたものが用いられる。なお、特徴抽出器としては、CNNから全結合層を除いたもの以外にも、学習済みの公知の機械学習モデルが利用可能である。 The feature extractor is a trained machine learning model that extracts image features. The feature extractor is used to extract the first intermediate feature amount and the second intermediate feature amount described below. In this embodiment, a trained CNN (Convolutional Neural Network) without the fully connected layer is used as the feature extractor. Note that, in addition to a CNN without the fully connected layer, a trained, publicly known machine learning model can also be used as the feature extractor.
[特徴抽出部]
特徴抽出部130は、元画像OIから元画像特徴量OFを抽出するとともに、仮想画像VIから仮想画像特徴量VFを抽出する。本実施形態では、特徴抽出部130は、複数の仮想画像VI1,VI2,VI3のそれぞれから、当該仮想画像に対応する仮想画像特徴量VFを抽出する。
[Feature extraction section]
The
具体的には、特徴抽出部130は、元画像OIから第1の中間特徴量を抽出し、第1の中間特徴量から元画像特徴量OFを抽出する。また、特徴抽出部130は、仮想画像VIから第2の中間特徴量を抽出し、第2の中間特徴量から仮想画像特徴量VFを抽出する。特徴抽出部130は、第1の中間特徴量及び第2の中間特徴量を、それぞれ先述の特徴抽出器を用いて抽出する。
Specifically, the
第1の中間特徴量は、元画像OIにおける物体Oの形状及び配置に関する情報を含む。また、第2の中間特徴量は、仮想画像VIにおける物体Oの形状及び配置に関する情報を含む。本実施形態では、学習済みのCNNから全結合層を除いたものを特徴抽出器として用いるので、具体的には、第1の中間特徴量及び第2の中間特徴量は、それぞれ、CNNの畳み込み層から出力される特徴マップである。ここで、特徴マップの数は、フィルタ(カーネル)の数と同数である。 The first intermediate feature includes information about the shape and arrangement of the object O in the original image OI. The second intermediate feature includes information about the shape and arrangement of the object O in the virtual image VI. In this embodiment, a trained CNN excluding the fully connected layer is used as a feature extractor, so specifically, the first intermediate feature and the second intermediate feature are each a feature map output from the convolutional layer of the CNN. Here, the number of feature maps is the same as the number of filters (kernels).
ここで、元画像特徴量OFは、元画像OIの各色の度数分布を示す特徴量である。また、仮想画像特徴量VFは、仮想画像VIの各色の度数分布を示す特徴量である。別の言い方をすれば、元画像特徴量OFは、元画像OIにおける物体Oの形状及び配置に関する情報を含まない特徴量である。また、仮想画像特徴量VFは、仮想画像VIにおける物体Oの形状及び配置に関する情報を含まない特徴量である。本実施形態では、元画像特徴量OF及び仮想画像特徴量VFは、それぞれ、CNN等の学習済みの特徴抽出器から出力可能な特徴量に相当するベクトル表現であってよい。本実施形態では、具体的には、元画像特徴量OF及び仮想画像特徴量VFは、それぞれ、CNNの畳み込み層から出力される特徴マップ同士の相関を計算することによって得られるグラム行列である。このグラム行列は、具体的には、CNNの畳み込み層から出力される特徴マップ同士の内積を計算することによって得られる。画像特徴量は、テクスチャパターンの度数分布をあわせて示す特徴量であってよい。 Here, the original image feature OF is a feature indicating the frequency distribution of each color of the original image OI. The virtual image feature VF is a feature indicating the frequency distribution of each color of the virtual image VI. In other words, the original image feature OF is a feature that does not include information about the shape and arrangement of the object O in the original image OI. The virtual image feature VF is a feature that does not include information about the shape and arrangement of the object O in the virtual image VI. In this embodiment, the original image feature OF and the virtual image feature VF may each be a vector expression equivalent to a feature that can be output from a trained feature extractor such as a CNN. In this embodiment, specifically, the original image feature OF and the virtual image feature VF are each a Gram matrix obtained by calculating the correlation between feature maps output from the convolution layer of the CNN. This Gram matrix is specifically obtained by calculating the inner product of feature maps output from the convolution layer of the CNN. The image feature may also be a feature that indicates the frequency distribution of the texture pattern.
[パラメータ調整部]
パラメータ調整部140は、元画像特徴量OFと仮想画像特徴量VFとの類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。すなわち、パラメータ調整部140は、元画像OIの各色の度数分布を示す特徴量と仮想画像VIの各色の度数分布を示す特徴量との類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。パラメータ調整部140は、元画像OIの配色と仮想画像VIの配色との類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整するということもできる。これにより、本実施形態の情報処理システム1は、元画像OIにおける物体Oの配置と、仮想画像VIにおける物体Oの配置と、が異なっていても、元画像OIが示す物体Oの外観を、変換画像が示す物体Oの外観に的確に反映させることができる。
[Parameter adjustment section]
The
具体的には、パラメータ調整部140は、元画像特徴量OFと仮想画像特徴量VFとに基づいて、損失を計算し、当該損失が小さくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。損失の計算自体は、二乗誤差やクロスエントロピー等の公知の計算方法が利用可能である。また、照明データLのパラメータ及びテクスチャデータTのパラメータの調整自体は、勾配降下法や誤差逆伝播法等の公知のパラメータ調整方法が利用可能である。なお、パラメータ調整部140では、特徴抽出器に係るパラメータ(重み係数やバイアス等)は調整されず固定されたままである。
Specifically, the
本実施形態では、パラメータ調整部140は、元画像特徴量OFと、複数の仮想画像VI1,VI2,VI3のそれぞれに対応する仮想画像特徴量VFと、の類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。具体的には、まず、パラメータ調整部140は、元画像特徴量OFと仮想画像VI1に対応する仮想画像特徴量VFとの類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。次に、パラメータ調整部140は、元画像特徴量OFと仮想画像VI2に対応する仮想画像特徴量VFとの類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。最後に、パラメータ調整部140は、元画像特徴量OFと仮想画像VI3に対応する仮想画像特徴量VFとの類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。
In this embodiment, the
ここで、元画像OIが示す物体Oの向きと、最初にパラメータ調整部140での処理に供される仮想画像特徴量VFに対応する仮想画像VI1が示す物体Oの向きと、は一致していることが好ましい。これにより、照明データLのパラメータ及びテクスチャデータTのパラメータの調整に係る処理負荷が軽減される。
Here, it is preferable that the orientation of the object O indicated by the original image OI coincides with the orientation of the object O indicated by the virtual image VI1 corresponding to the virtual image feature VF that is first subjected to processing by the
なお、パラメータ調整部140は、仮想空間VSに背景画像が設定される場合、照明データLのパラメータ及びテクスチャデータTのパラメータに加え、当該背景画像のパラメータを調整してもよい。
When a background image is set in the virtual space VS, the
なお、上記した特徴抽出部130及びパラメータ調整部140は、例えば、参考文献(Gatys, L.A., Ecker, A.S., Bethge, M.: Image style transfer using convolutional neural networks. In: CVPR. (2016))の記載に従って構成されてもよい。
The
[変換画像生成部]
変換画像生成部150は、3DモデルMと、パラメータ調整部140によりパラメータが調整された照明データL及びテクスチャデータTと、に基づいて、変換画像を生成する。変換画像は、元画像OIのバリエーションであるということもできる。変換画像生成部150で実行される処理の内容は仮想画像生成部120と同様である。
[Converted image generation unit]
The converted
本実施形態の情報処理システム1は、上記のように、パラメータ調整した照明データL及びテクスチャデータTを用いて変換画像を生成する。この変換画像の生成の際に、種々の条件(3DモデルMの位置・ポーズ・形状・向き、仮想視点VVの位置・拡大倍率・画角等)を変化させることによって、様々な変換画像を生成することができる。また、変換画像の生成の際に、照明データLのパラメータやテクスチャデータTのパラメータを更に調整し、照明の位置・明るさや、物体O表面に設定されるテクスチャを変化させることによって、より様々な変換画像を生成することができる。
As described above, the
また、本実施形態の情報処理システム1によれば、上記のような様々な変換画像を大量に生成することが容易となる。このようにして得られた大量の変換画像は、例えば、画像認識用の機械学習モデルの学習データとして利用することができる。
In addition, according to the
なお、本実施形態の情報処理システム1の用途は、上記した変換画像の生成に限られない。例えば、本実施形態の情報処理システム1は、ビデオゲームに登場するゲームオブジェクトの作成に用いることもできる。すなわち、(1)物体Oとしてゲームキャラクターを示す元画像OIが作成される。(2)当該ゲームキャラクターを表す3DモデルM、照明データL、及びテクスチャデータTに基づいて、仮想画像VIが生成される。(3)上記のパラメータ調整を行うことによって、元画像OIの外観を反映させたゲームオブジェクトが得られる。
Note that the use of the
[4.本実施形態の情報処理システムにおいて実行される処理]
最後に、図6及び図7を用い、本実施形態の情報処理システム1において実行される処理について説明する。図6及び図7は、本実施形態の情報処理システム1において実行される処理の一例を示すフロー図である。図6及び図7に示す処理は、制御部11が記憶部12に記憶されたプログラムに従って動作することによって実行される。下記に説明する処理は、図3に示す機能ブロックにより実行される処理の一例である。
4. Processing Executed in the Information Processing System of the Present Embodiment
Finally, the process executed in the
図6に示すように、まず、制御部11は、記憶部12から元画像OIを取得する(S100)。制御部11は、取得した元画像OIから、第1の中間特徴量を抽出する(S101)。制御部11は、更に第1の中間特徴量から元画像特徴量OFを抽出し、抽出した元画像特徴量OFを記憶部12に格納する(S102)。
As shown in FIG. 6, first, the
図7に移り、制御部11は、仮想視点VVを設定する(S103)。具体的には、制御部11は、仮想視点VVの位置・画角・拡大倍率等のパラメータを設定する。次いで、制御部11は、記憶部12から、3DモデルM、照明データL、及びテクスチャデータTを取得し(S104)、これらに基づいて、仮想画像VIを生成する(S105)。
Moving on to FIG. 7, the
制御部11は、生成した仮想画像VIから第2の中間特徴量を抽出する(S106)。記憶部12は、更に第2の中間特徴量から仮想画像特徴量VFを抽出し、抽出した仮想画像特徴量VFを記憶部12に格納する(S107)。制御部11は、記憶部12に格納された元画像特徴量OFと仮想画像特徴量VFとの類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する(S108)。
The
制御部11は、元画像特徴量OFと仮想画像特徴量VFとの類似度が所定の条件を満たしておらず、照明データLのパラメータ及びテクスチャデータTのパラメータの調整を再度繰り返すと判定した場合(S109;N)、S105からS108の処理を再度実行する。具体的には、制御部11は、元画像特徴量OFと仮想画像特徴量VFとに基づいて計算される損失が所定の閾値未満になるまで、照明データLのパラメータ及びテクスチャデータTのパラメータの調整を繰り返す。
When the
一方、制御部11は、元画像特徴量OFと仮想画像特徴量VFとの類似度が所定の条件を満たし、パラメータ調整を終了すると判定した場合(S109;Y)、次いで、仮想視点VVを変えて仮想画像VIを生成するか否かを判定する(S110)。制御部11は、仮想視点VVを変えて仮想画像VIを生成すると判定した場合(S110;N)、S103からS109の処理を再度実行する。具体的には、制御部11は、所定数の仮想視点VVのそれぞれについて、S103からS109の処理を繰り返す。一方、制御部11は、仮想視点VVを変えて仮想画像VIを生成しないと判定した場合(S110;Y)、本処理を終了する。
On the other hand, when the
[5.付記]
例えば、本開示に係る情報処理システムは、下記のような構成も可能である。
[5. Notes]
For example, the information processing system according to the present disclosure may be configured as follows.
(1)
物体を示す元画像を取得する元画像取得手段と、
前記物体を表す3Dモデル、照明データ、及びテクスチャデータに基づいて、仮想視点から見た、前記3Dモデルが配置された仮想空間の様子を示す仮想画像を生成する仮想画像生成手段と、
前記元画像から元画像特徴量を抽出するとともに、前記仮想画像から仮想画像特徴量を抽出する特徴抽出手段と、
前記元画像特徴量と前記仮想画像特徴量との類似度が大きくなるように、前記照明データのパラメータ及び前記テクスチャデータのパラメータを調整するパラメータ調整手段と、
を有する、情報処理システム。
(1)
An original image acquisition means for acquiring an original image showing an object;
a virtual image generating means for generating a virtual image showing an appearance of a virtual space in which the 3D model is placed, as viewed from a virtual viewpoint, based on a 3D model representing the object, lighting data, and texture data;
a feature extraction means for extracting an original image feature from the original image and a virtual image feature from the virtual image;
a parameter adjusting means for adjusting parameters of the illumination data and parameters of the texture data so as to increase a similarity between the original image feature amount and the virtual image feature amount;
An information processing system having the above configuration.
(2)
前記元画像は、現実空間に配置された前記物体の撮影画像である、
(1)に記載の情報処理システム。
(2)
The original image is a photographed image of the object disposed in real space.
An information processing system according to (1).
(3)
前記元画像特徴量は、前記元画像の各色の度数分布を示し、
前記仮想画像特徴量は、前記仮想画像の各色の度数分布を示し、
前記特徴抽出手段は、前記元画像から、前記元画像における前記物体の形状及び配置に関する情報を含む第1の中間特徴量を抽出し、前記第1の中間特徴量から前記元画像特徴量を抽出するとともに、前記仮想画像から、前記仮想画像における前記物体の形状及び配置に関する情報を含む第2の中間特徴量を抽出し、前記第2の中間特徴量から前記仮想画像特徴量を抽出する、
(1)又は(2)に記載の情報処理システム。
(3)
the original image feature amount indicates a frequency distribution of each color of the original image,
the virtual image feature amount indicates a frequency distribution of each color of the virtual image,
the feature extraction means extracts, from the original image, a first intermediate feature amount including information regarding a shape and an arrangement of the object in the original image, and extracts the original image feature amount from the first intermediate feature amount, and also extracts, from the virtual image, a second intermediate feature amount including information regarding a shape and an arrangement of the object in the virtual image, and extracts the virtual image feature amount from the second intermediate feature amount.
An information processing system according to (1) or (2).
(4)
前記仮想画像生成手段は、互いに異なる複数の前記仮想視点のそれぞれにそれぞれが対応するとともに、当該仮想視点から見た前記仮想空間の様子を示す複数の前記仮想画像を生成し、
前記特徴抽出手段は、前記複数の仮想画像のそれぞれから、当該仮想画像に対応する仮想画像特徴量を抽出し、
前記パラメータ調整手段は、前記元画像特徴量と、前記複数の仮想画像のそれぞれに対応する仮想画像特徴量と、の類似度が大きくなるように、前記照明データのパラメータ及び前記テクスチャデータのパラメータを調整する、
(1)から(3)のいずれかに記載の情報処理システム。
(4)
the virtual image generating means generates a plurality of virtual images each corresponding to a plurality of different virtual viewpoints and showing a state of the virtual space as seen from the corresponding virtual viewpoint;
the feature extraction means extracts, from each of the plurality of virtual images, a virtual image feature corresponding to the virtual image;
the parameter adjustment means adjusts the parameters of the illumination data and the parameters of the texture data so as to increase a similarity between the original image feature amount and a virtual image feature amount corresponding to each of the plurality of virtual images.
An information processing system according to any one of (1) to (3).
(5)
前記3Dモデルと、前記パラメータ調整手段によりパラメータが調整された前記照明データ及び前記テクスチャデータと、に基づいて、前記元画像とは異なる、前記物体を示す画像である変換画像を生成する変換画像生成手段を更に有する、
(1)から(4)のいずれかに記載の情報処理システム。
(5)
a converted image generating means for generating a converted image, which is an image showing the object and is different from the original image, based on the 3D model and the lighting data and the texture data whose parameters have been adjusted by the parameter adjusting means;
An information processing system according to any one of (1) to (4).
以上に説明した本実施形態の情報処理システム1によれば、画像変換の態様を拡張することができる。
According to the
1 情報処理システム、N ネットワーク、11 制御部、12 記憶部、13 通信部、14 操作部、15 表示部、100 元画像記憶部、101 3Dモデル記憶部、102 照明データ記憶部、103 テクスチャデータ記憶部、104 特徴抽出器記憶部、110 元画像取得部、120 仮想画像生成部、130 特徴抽出部、140 パラメータ調整部、150 変換画像生成部、OI 元画像、O 物体、M 3Dモデル、L 照明データ、T テクスチャデータ、VI,VI1,VI2,VI3 仮想画像、OF 元画像特徴量、VF 仮想画像特徴量、VV,VV1,VV2,VV3 仮想視点、VS 仮想空間。
1 Information processing system, N Network, 11 Control unit, 12 Memory unit, 13 Communication unit, 14 Operation unit, 15 Display unit, 100 Original image memory unit, 101 3D model memory unit, 102 Lighting data memory unit, 103 Texture data memory unit, 104 Feature extractor memory unit, 110 Original image acquisition unit, 120 Virtual image generation unit, 130 Feature extraction unit, 140 Parameter adjustment unit, 150 Transformed image generation unit, OI Original image, O Object, M 3D model, L Lighting data, T Texture data, VI, VI1, VI2, VI3 Virtual image, OF Original image feature amount, VF Virtual image feature amount, VV, VV1, VV2, VV3 Virtual viewpoint, VS Virtual space.
Claims (7)
前記物体を表す3Dモデル、照明データ、及びテクスチャデータに基づいて、仮想視点から見た、前記3Dモデルが配置された仮想空間の様子を示す仮想画像を生成する仮想画像生成手段と、
前記元画像から元画像特徴量を抽出するとともに、前記仮想画像から仮想画像特徴量を抽出する特徴抽出手段と、
前記元画像特徴量と前記仮想画像特徴量との類似度の大きさを示す損失に基づいて、前記照明データのパラメータを調整するとともに前記テクスチャデータのパラメータを調整するパラメータ調整手段と、
を有する、情報処理システム。 An original image acquisition means for acquiring an original image showing an object;
a virtual image generating means for generating a virtual image showing an appearance of a virtual space in which the 3D model is placed, as viewed from a virtual viewpoint, based on a 3D model representing the object, lighting data, and texture data;
a feature extraction means for extracting an original image feature from the original image and a virtual image feature from the virtual image;
a parameter adjustment means for adjusting a parameter of the illumination data and a parameter of the texture data based on a loss indicating a degree of similarity between the original image feature amount and the virtual image feature amount;
An information processing system having the above configuration.
請求項1に記載の情報処理システム。 The original image is a photographed image of the object disposed in real space.
The information processing system according to claim 1 .
前記仮想画像特徴量は、前記仮想画像の各色の度数分布を示し、
前記特徴抽出手段は、前記元画像から、前記元画像における前記物体の形状及び配置に関する情報を含む第1の中間特徴量を抽出し、前記第1の中間特徴量から前記元画像特徴量を抽出するとともに、前記仮想画像から、前記仮想画像における前記物体の形状及び配置に関する情報を含む第2の中間特徴量を抽出し、前記第2の中間特徴量から前記仮想画像特徴量を抽出する、
請求項1又は2に記載の情報処理システム。 the original image feature amount indicates a frequency distribution of each color of the original image,
the virtual image feature amount indicates a frequency distribution of each color of the virtual image,
the feature extraction means extracts, from the original image, a first intermediate feature amount including information regarding a shape and an arrangement of the object in the original image, and extracts the original image feature amount from the first intermediate feature amount, and also extracts, from the virtual image, a second intermediate feature amount including information regarding a shape and an arrangement of the object in the virtual image, and extracts the virtual image feature amount from the second intermediate feature amount.
3. The information processing system according to claim 1 or 2.
前記特徴抽出手段は、前記複数の仮想画像のそれぞれから、当該仮想画像に対応する仮想画像特徴量を抽出し、
前記パラメータ調整手段は、前記元画像特徴量と、前記複数の仮想画像のそれぞれに対応する仮想画像特徴量と、の類似度が大きくなるように、前記照明データのパラメータ及び前記テクスチャデータのパラメータを調整する、
請求項1又は2に記載の情報処理システム。 the virtual image generating means generates a plurality of virtual images each corresponding to a plurality of different virtual viewpoints and showing a state of the virtual space as seen from the corresponding virtual viewpoint;
the feature extraction means extracts, from each of the plurality of virtual images, a virtual image feature corresponding to the virtual image;
the parameter adjustment means adjusts the parameters of the illumination data and the parameters of the texture data so as to increase a similarity between the original image feature amount and a virtual image feature amount corresponding to each of the plurality of virtual images.
3. The information processing system according to claim 1 or 2.
請求項1又は2に記載の情報処理システム。 a converted image generating means for generating a converted image, which is an image showing the object and is different from the original image, based on the 3D model and the lighting data and the texture data whose parameters have been adjusted by the parameter adjusting means;
3. The information processing system according to claim 1 or 2.
前記物体を表す3Dモデル、照明データ、及びテクスチャデータに基づいて、仮想視点から見た、前記3Dモデルが配置された仮想空間の様子を示す仮想画像を生成する仮想画像生成ステップと、
前記元画像から元画像特徴量を抽出するとともに、前記仮想画像から仮想画像特徴量を抽出する特徴抽出ステップと、
前記元画像特徴量と前記仮想画像特徴量との類似度の大きさを示す損失に基づいて、前記照明データのパラメータを調整するとともに前記テクスチャデータのパラメータを調整するパラメータ調整ステップと、
を有する、情報処理方法。 An original image acquisition step of acquiring an original image showing an object;
a virtual image generating step of generating a virtual image showing an appearance of a virtual space in which the 3D model is placed, as viewed from a virtual viewpoint, based on a 3D model representing the object, lighting data, and texture data;
a feature extraction step of extracting an original image feature from the original image and a virtual image feature from the virtual image;
a parameter adjustment step of adjusting parameters of the illumination data and parameters of the texture data based on a loss indicating a degree of similarity between the original image feature amount and the virtual image feature amount;
An information processing method comprising the steps of:
前記物体を表す3Dモデル、照明データ、及びテクスチャデータに基づいて、仮想視点から見た、前記3Dモデルが配置された仮想空間の様子を示す仮想画像を生成する仮想画像生成手段、
前記元画像から元画像特徴量を抽出するとともに、前記仮想画像から仮想画像特徴量を抽出する特徴抽出手段、
前記元画像特徴量と前記仮想画像特徴量との類似度の大きさを示す損失に基づいて、前記照明データのパラメータを調整するとともに前記テクスチャデータのパラメータを調整するパラメータ調整手段、
としてコンピュータを機能させるためのプログラム。 An original image acquisition means for acquiring an original image showing an object;
a virtual image generating means for generating a virtual image showing an appearance of a virtual space in which the 3D model is placed, as viewed from a virtual viewpoint, based on a 3D model representing the object, lighting data, and texture data;
a feature extraction means for extracting an original image feature from the original image and a virtual image feature from the virtual image;
a parameter adjusting means for adjusting a parameter of the illumination data and a parameter of the texture data based on a loss indicating a degree of similarity between the original image feature amount and the virtual image feature amount;
A program that makes a computer function as a
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022210579A JP7631291B2 (en) | 2022-12-27 | 2022-12-27 | Information processing system, information processing method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022210579A JP7631291B2 (en) | 2022-12-27 | 2022-12-27 | Information processing system, information processing method, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2024093923A JP2024093923A (en) | 2024-07-09 |
| JP7631291B2 true JP7631291B2 (en) | 2025-02-18 |
Family
ID=91805325
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022210579A Active JP7631291B2 (en) | 2022-12-27 | 2022-12-27 | Information processing system, information processing method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7631291B2 (en) |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003141569A (en) | 2001-10-31 | 2003-05-16 | Canon Inc | Information processing method and video composition apparatus |
| US20160148425A1 (en) | 2014-11-25 | 2016-05-26 | Samsung Electronics Co., Ltd. | Method and apparatus for generating personalized 3d face model |
| WO2017038541A1 (en) | 2015-09-03 | 2017-03-09 | ソニー株式会社 | Video processing device, video processing method, and program |
| US20210286977A1 (en) | 2019-02-26 | 2021-09-16 | Tencent Technology (Shenzhen) Company Limited | Computer application method and apparatus for generating three-dimensional face model, computer device, and storage medium |
| CN114820908A (en) | 2022-06-24 | 2022-07-29 | 北京百度网讯科技有限公司 | Virtual image generation method and device, electronic equipment and storage medium |
-
2022
- 2022-12-27 JP JP2022210579A patent/JP7631291B2/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003141569A (en) | 2001-10-31 | 2003-05-16 | Canon Inc | Information processing method and video composition apparatus |
| US20160148425A1 (en) | 2014-11-25 | 2016-05-26 | Samsung Electronics Co., Ltd. | Method and apparatus for generating personalized 3d face model |
| WO2017038541A1 (en) | 2015-09-03 | 2017-03-09 | ソニー株式会社 | Video processing device, video processing method, and program |
| US20210286977A1 (en) | 2019-02-26 | 2021-09-16 | Tencent Technology (Shenzhen) Company Limited | Computer application method and apparatus for generating three-dimensional face model, computer device, and storage medium |
| CN114820908A (en) | 2022-06-24 | 2022-07-29 | 北京百度网讯科技有限公司 | Virtual image generation method and device, electronic equipment and storage medium |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2024093923A (en) | 2024-07-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10789686B2 (en) | Denoising Monte Carlo renderings using machine learning with importance sampling | |
| JP7526412B2 (en) | Method for training a parameter estimation model, apparatus for training a parameter estimation model, device and storage medium | |
| CN115699088B (en) | Generating a three-dimensional object model from a two-dimensional image | |
| CN114746904B (en) | 3D face reconstruction | |
| US11494915B2 (en) | Image processing system, image processing method, and program | |
| CN104508709B (en) | Animate an object with a human body | |
| KR20230096063A (en) | 3D mesh generator based on 2D images | |
| US9519988B2 (en) | Subspace clothing simulation using adaptive bases | |
| CN116580156A (en) | 3D printing model method for text generation based on big data deep learning | |
| CN113112580A (en) | Method, device, equipment and medium for generating virtual image | |
| CN112102480B (en) | Image data processing method, apparatus, device and medium | |
| JP7294788B2 (en) | Classification of 2D images according to the type of 3D placement | |
| US11948274B1 (en) | Deep learned super resolution for feature film production | |
| US10650524B2 (en) | Designing effective inter-pixel information flow for natural image matting | |
| CN116664422B (en) | Image highlight processing method, device, electronic device and readable storage medium | |
| CN118587344B (en) | Indoor design result evaluation method and system based on virtual reality technology | |
| CN116912433B (en) | Three-dimensional model skeleton binding method, device, equipment and storage medium | |
| Liao et al. | Illumination animating and editing in a single picture using scene structure estimation | |
| JP7631291B2 (en) | Information processing system, information processing method, and program | |
| US9665955B1 (en) | Pose-space shape fitting | |
| CN119888024B (en) | Human body posture multi-vision recognition AI training data set automatic generation and identification method based on simulation environment | |
| CN118262034A (en) | System and method for reconstructing an animated three-dimensional human head model from an image | |
| CN116030181A (en) | 3D virtual image generation method and device | |
| He et al. | Computer Vision Driven Film and TV Scene Modeling and Innovation | |
| Sun et al. | A system scheme of 3D object reconstruction from single 2D graphics based on neural networks |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231214 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240917 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241113 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250128 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250205 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7631291 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |