Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7631291B2 - Information processing system, information processing method, and program - Google Patents
[go: Go Back, main page]

JP7631291B2 - Information processing system, information processing method, and program - Google Patents

Information processing system, information processing method, and program Download PDF

Info

Publication number
JP7631291B2
JP7631291B2 JP2022210579A JP2022210579A JP7631291B2 JP 7631291 B2 JP7631291 B2 JP 7631291B2 JP 2022210579 A JP2022210579 A JP 2022210579A JP 2022210579 A JP2022210579 A JP 2022210579A JP 7631291 B2 JP7631291 B2 JP 7631291B2
Authority
JP
Japan
Prior art keywords
virtual
original image
image
virtual image
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022210579A
Other languages
Japanese (ja)
Other versions
JP2024093923A (en
Inventor
ヴィヴェク バルソピア
メナンヅロ ローハス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Group Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Group Inc filed Critical Rakuten Group Inc
Priority to JP2022210579A priority Critical patent/JP7631291B2/en
Publication of JP2024093923A publication Critical patent/JP2024093923A/en
Application granted granted Critical
Publication of JP7631291B2 publication Critical patent/JP7631291B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Generation (AREA)

Description

本開示は、情報処理システム、情報処理方法及びプログラムに関する。 This disclosure relates to an information processing system, an information processing method, and a program.

物体を示す元画像に対して画像変換を行い、元画像と異なる、前記物体を示す画像を得る技術が知られている。例えば、元画像に対して、回転や拡大・縮小、明るさの変更、色調の変更等の操作を行うことにより、様々な画像を大量に得ることができる。このようにして得られた大量の画像は、例えば、画像認識用の機械学習モデルの学習データとして用いられる(下記特許文献1参照)。 A technique is known in which an original image showing an object is transformed to obtain an image showing the object that is different from the original image. For example, a large number of different images can be obtained by performing operations such as rotating, enlarging/reducing, changing the brightness, or changing the color tone of the original image. The large number of images obtained in this way are used, for example, as training data for a machine learning model for image recognition (see Patent Document 1 below).

再表2021/038678公報Re-tabled publication 2021/038678

上記従来技術では、画像変換の態様は限られている。例えば、元画像が示す物体の向きやポーズ、形状、配置を変えることは、上記従来技術では困難である。 The above conventional techniques only allow limited image transformation. For example, it is difficult to change the orientation, pose, shape, or position of an object shown in the original image using the above conventional techniques.

本発明は、上記課題に鑑みてなされたものであって、その目的は、画像変換の態様を拡張する情報処理システム、情報処理方法及びプログラムを提供することにある。 The present invention has been made in consideration of the above problems, and its purpose is to provide an information processing system, information processing method, and program that expand the aspects of image conversion.

本開示に係る情報処理システムは、物体を示す元画像を取得する元画像取得手段と、前記物体を表す3Dモデル、照明データ、及びテクスチャデータに基づいて、仮想視点から見た、前記3Dモデルが配置された仮想空間の様子を示す仮想画像を生成する仮想画像生成手段と、前記元画像から元画像特徴量を抽出するとともに、前記仮想画像から仮想画像特徴量を抽出する特徴抽出手段と、前記元画像特徴量と前記仮想画像特徴量との類似度が大きくなるように、前記照明データのパラメータ及び前記テクスチャデータのパラメータを調整するパラメータ調整手段と、を有する。 The information processing system according to the present disclosure includes an original image acquisition means for acquiring an original image showing an object, a virtual image generation means for generating a virtual image showing the appearance of a virtual space in which the 3D model is placed as seen from a virtual viewpoint based on a 3D model representing the object, lighting data, and texture data, a feature extraction means for extracting original image features from the original image and virtual image features from the virtual image, and a parameter adjustment means for adjusting parameters of the lighting data and parameters of the texture data so as to increase the similarity between the original image features and the virtual image features.

本実施形態の情報処理システムのハードウェア構成の一例を示す図である。FIG. 2 is a diagram illustrating an example of a hardware configuration of the information processing system according to the present embodiment. 本実施形態の情報処理システムの処理の概要を示す図である。FIG. 2 is a diagram illustrating an overview of processing in the information processing system according to the present embodiment. 本実施形態の情報処理システムで実現される機能の一例を示す機能ブロック図である。FIG. 2 is a functional block diagram showing an example of functions realized in the information processing system of the present embodiment. 仮想画像を生成する様子を示す図である。FIG. 13 is a diagram showing how a virtual image is generated. 複数の仮想視点のそれぞれから見た仮想画像を生成する様子を示す図である。FIG. 13 is a diagram showing how virtual images viewed from each of a plurality of virtual viewpoints are generated. 本実施形態の情報処理システムにおいて実行される処理の一例を示すフロー図である。FIG. 2 is a flow chart showing an example of processing executed in the information processing system according to the present embodiment. 本実施形態の情報処理システムにおいて実行される処理の一例を示すフロー図である。FIG. 2 is a flow chart showing an example of processing executed in the information processing system according to the present embodiment.

[1.本実施形態の情報処理システムのハードウェア構成]
以下、本開示に係る情報処理システムの実施形態の一例を説明する。図1は、本実施形態の情報処理システム1のハードウェア構成の一例を示す図である。図1に示すように、情報処理システム1は、例えば、サーバコンピュータやパーソナルコンピュータ等のコンピュータであり、制御部11、記憶部12、通信部13、操作部14及び表示部15を含む。なお、図1には、情報処理システム1が1台のコンピュータにより構成される場合を示すが、情報処理システム1は、複数台のコンピュータにより構成されていてもよい。
[1. Hardware configuration of the information processing system according to this embodiment]
An example of an embodiment of an information processing system according to the present disclosure will be described below. Fig. 1 is a diagram showing an example of a hardware configuration of an information processing system 1 according to the present embodiment. As shown in Fig. 1, the information processing system 1 is a computer such as a server computer or a personal computer, and includes a control unit 11, a storage unit 12, a communication unit 13, an operation unit 14, and a display unit 15. Although Fig. 1 shows a case where the information processing system 1 is configured by one computer, the information processing system 1 may be configured by multiple computers.

制御部11は、少なくとも1つのプロセッサを含む。記憶部12は、RAM等の揮発性メモリと、フラッシュメモリ等の不揮発性メモリと、を含む。通信部13は、有線通信用の通信インタフェースと、無線通信用の通信インタフェースと、の少なくとも一方を含む。操作部14は、キーボード、マウス、又はタッチパネル等の入力デバイスである。表示部15は、液晶ディスプレイ又は有機ELディスプレイ等のディスプレイである。 The control unit 11 includes at least one processor. The storage unit 12 includes a volatile memory such as a RAM and a non-volatile memory such as a flash memory. The communication unit 13 includes at least one of a communication interface for wired communication and a communication interface for wireless communication. The operation unit 14 is an input device such as a keyboard, a mouse, or a touch panel. The display unit 15 is a display such as a liquid crystal display or an organic EL display.

なお、記憶部12に記憶されるプログラムは、ネットワークNを介して供給されてもよい。また、コンピュータ読み取り可能な情報記憶媒体に記憶されたプログラムが、情報記憶媒体を読み取る読取部(例えば、光ディスクドライブやメモリカードスロット)、又は、外部機器とデータの入出力をするための入出力部(例えば、USBポート)を介して供給されてもよい。 The program stored in the storage unit 12 may be supplied via the network N. Also, the program stored in a computer-readable information storage medium may be supplied via a reading unit (e.g., an optical disk drive or a memory card slot) that reads the information storage medium, or an input/output unit (e.g., a USB port) that inputs and outputs data to and from an external device.

[2.本実施形態の情報処理システムの概要]
以下、本実施形態の情報処理システム1の概要を説明する。図2は、本実施形態の情報処理システム1の処理の概要を示す図である。
2. Overview of the Information Processing System of the Present Embodiment
An overview of the information processing system 1 of this embodiment will be described below. Fig. 2 is a diagram showing an overview of the processing of the information processing system 1 of this embodiment.

図2に示すように、本実施形態の情報処理システム1は、元画像OIが示す物体Oの外観と、物体Oを表す3DモデルM、照明データL及びテクスチャデータTに基づいて生成した仮想画像VIが示す物体Oの外観と、の類似度が大きくなるように、照明データL及びテクスチャデータTのパラメータを調整する。元画像OIが示す物体Oの外観と仮想画像VIが示す物体Oの外観との類似度の評価は、具体的には、元画像OIから抽出した元画像特徴量OFと仮想画像VIから抽出した仮想画像特徴量VFとの類似度を評価することにより行われる。なお、本明細書において、「物体Oの外観」は、物体Oの向きやポーズ、形状、配置以外の物体Oの見た目(例えば色や材質感等)を意味するものとする。 2, the information processing system 1 of this embodiment adjusts the parameters of the lighting data L and the texture data T so as to increase the similarity between the appearance of the object O shown in the original image OI and the appearance of the object O shown in the virtual image VI generated based on the 3D model M representing the object O, the lighting data L, and the texture data T. Specifically, the similarity between the appearance of the object O shown in the original image OI and the appearance of the object O shown in the virtual image VI is evaluated by evaluating the similarity between the original image feature OF extracted from the original image OI and the virtual image feature VF extracted from the virtual image VI. In this specification, the "appearance of the object O" refers to the appearance of the object O (e.g., color, texture, etc.) other than the orientation, pose, shape, and arrangement of the object O.

本実施形態の情報処理システム1によれば、上記した照明データL及びテクスチャデータTのパラメータ調整により、元画像OIが示す物体Oの外観を反映した照明データL及びテクスチャデータTを得ることができる。そして、こうして得られた照明データL及びテクスチャデータTを用いて、3DモデルMを種々の条件下でレンダリングすることにより、元画像OIを様々な態様で変換した画像を得ることができる。なお、本明細書において、「変換」の語は広義に用いられる。すなわち、元画像OIを「変換」するとは、物体Oを示す元画像OIに基づいて、元画像OIとは異なる、物体Oを示す画像(以下、「変換画像」という。)を得ることを意味するものとし、元画像OIに対して何らかの操作を行い、元画像OIから直接的に変換画像を得ることのみを意味するものではない。以降、本実施形態の情報処理システム1の詳細について説明する。 According to the information processing system 1 of this embodiment, the lighting data L and texture data T that reflect the appearance of the object O shown in the original image OI can be obtained by adjusting the parameters of the lighting data L and texture data T described above. The lighting data L and texture data T obtained in this way can be used to render the 3D model M under various conditions, thereby obtaining an image in which the original image OI is transformed in various ways. In this specification, the term "transformation" is used in a broad sense. In other words, "transforming" the original image OI means obtaining an image showing the object O that is different from the original image OI (hereinafter referred to as a "transformed image") based on the original image OI showing the object O, and does not only mean performing some operation on the original image OI and obtaining a transformed image directly from the original image OI. Hereinafter, the information processing system 1 of this embodiment will be described in detail.

[3.本実施形態の情報処理システムにおいて実現される機能]
以下、図2を参照しつつ、図3に示す本実施形態の情報処理システム1で実現される機能について説明する。
3. Functions realized in the information processing system of this embodiment
Hereinafter, functions realized by the information processing system 1 of the present embodiment shown in FIG. 3 will be described with reference to FIG.

図3は、本実施形態の情報処理システム1で実現される機能の一例を示す機能ブロック図である。図3に示すように、本実施形態では、元画像記憶部100、3Dモデル記憶部101、照明データ記憶部102、テクスチャデータ記憶部103、特徴抽出器記憶部104、元画像取得部110、仮想画像生成部120、特徴抽出部130、パラメータ調整部140、及び変換画像生成部150が、情報処理システム1で実現される。元画像記憶部100、3Dモデル記憶部101、照明データ記憶部102、テクスチャデータ記憶部103、及び特徴抽出器記憶部104は、記憶部12を主として実現される。元画像取得部110、仮想画像生成部120、特徴抽出部130、パラメータ調整部140、及び変換画像生成部150は、制御部11を主として実現される。 FIG. 3 is a functional block diagram showing an example of functions realized by the information processing system 1 of this embodiment. As shown in FIG. 3, in this embodiment, the original image storage unit 100, the 3D model storage unit 101, the lighting data storage unit 102, the texture data storage unit 103, the feature extractor storage unit 104, the original image acquisition unit 110, the virtual image generation unit 120, the feature extraction unit 130, the parameter adjustment unit 140, and the converted image generation unit 150 are realized by the information processing system 1. The original image storage unit 100, the 3D model storage unit 101, the lighting data storage unit 102, the texture data storage unit 103, and the feature extractor storage unit 104 are realized mainly by the storage unit 12. The original image acquisition unit 110, the virtual image generation unit 120, the feature extraction unit 130, the parameter adjustment unit 140, and the converted image generation unit 150 are realized mainly by the control unit 11.

[元画像記憶部]
元画像記憶部100は、元画像OIを記憶する。
[Original image storage section]
The original image storage unit 100 stores the original image OI.

図2に示すように、元画像OIは、物体Oを示す画像である。 As shown in Figure 2, the original image OI is an image showing an object O.

物体Oは、一定の形状と大きさを有する物体である。本実施形態では、例として、物体Oは犬である。なお、物体Oは、人や動物、植物等の生物であってもよいし、石や山、建物等の無生物であってもよい。 Object O is an object having a certain shape and size. In this embodiment, as an example, object O is a dog. Note that object O may be a living thing such as a person, animal, or plant, or an inanimate object such as a stone, mountain, or building.

元画像OIは、物体Oの一部又は全部を示す。本実施形態では、元画像OIに物体Oの全部が示されるが、元画像OIは物体Oの一部のみが示されてもよい。また、本実施形態では、元画像OIが示す物体Oは1つであるが、元画像OIが示す物体Oは複数であってもよい。元画像OIが示す物体Oが複数である場合、各物体Oは互いに同じ種類のものであってもよいし、互いに異なる種類のものであってよい。本実施形態の例に即して説明すれば、元画像OIは、犬のほかにも、鳥や木、山等を示してもよい。 The original image OI shows a part or all of the object O. In this embodiment, the original image OI shows the whole of the object O, but the original image OI may show only a part of the object O. Also, in this embodiment, the original image OI shows one object O, but the original image OI may show multiple objects O. When the original image OI shows multiple objects O, the objects O may be of the same type or different types. Explaining based on the example of this embodiment, the original image OI may show birds, trees, mountains, etc. in addition to dogs.

本実施形態では、元画像OIは、現実空間に配置された物体Oの撮影画像である。これにより、現実空間に配置された物体Oの撮影画像から、現実には存在しない形態の物体Oを示す変換画像を得ることができる。一例として、本実施形態の情報処理システム1を用いて、現実空間に配置された新品のネジの撮影画像を変換することにより、現実に存在しない形態の当該ネジを示す変換画像(錆びたネジを示す画像や折れ曲がったネジを示す画像、駆動部が潰れたネジを示す画像等)を得ることができる。このようにして得られた多様な形態のネジを示す変換画像は、例えば不良品検出用の機械学習モデルの学習データとして用いることができる。なお、元画像OIは、現実空間に配置された物体Oの撮影画像に限られず、例えば、手描きの絵画や3Dモデルのレンダリング画像であってもよい。 In this embodiment, the original image OI is a photographed image of an object O placed in real space. This makes it possible to obtain a converted image showing an object O of a shape that does not exist in reality from the photographed image of the object O placed in real space. As an example, by using the information processing system 1 of this embodiment to convert a photographed image of a new screw placed in real space, a converted image showing the screw of a shape that does not exist in reality (an image showing a rusty screw, an image showing a bent screw, an image showing a screw with a crushed drive unit, etc.) can be obtained. The converted images showing various shapes of screws obtained in this way can be used, for example, as learning data for a machine learning model for detecting defective products. Note that the original image OI is not limited to a photographed image of an object O placed in real space, and may be, for example, a hand-drawn painting or a rendering image of a 3D model.

[元画像取得部]
元画像取得部110は、元画像OIを取得する。本実施形態では、元画像OIは、元画像記憶部100に記憶されているので、元画像取得部110は、元画像記憶部100から元画像OIを取得する。なお、元画像OIは、外部の情報記憶媒体又はコンピュータに記憶されていてもよい。この場合、元画像取得部110は、外部の情報記憶媒体又はコンピュータから元画像OIを取得してもよい。
[Original image acquisition section]
The original image acquisition unit 110 acquires the original image OI. In this embodiment, the original image OI is stored in the original image storage unit 100, and therefore the original image acquisition unit 110 acquires the original image OI from the original image storage unit 100. Note that the original image OI may be stored in an external information storage medium or a computer. In this case, the original image acquisition unit 110 may acquire the original image OI from the external information storage medium or the computer.

[3Dモデル記憶部]
3Dモデル記憶部101は、3DモデルMについてのデータを記憶する。
[3D model storage unit]
The 3D model storage unit 101 stores data regarding the 3D model M.

図2に示すように、3DモデルMは、物体Oを表すモデルである。3DモデルMは、物体Oの立体形状を表す少なくとも1つのポリゴンによって構成される。本実施形態では、3DモデルMは、物体Oの立体形状を表すメッシュデータに相当し、後述のテクスチャデータTを含まないモデルデータに相当する。本実施形態では、3DモデルMはソリッドモデルとするが、3DモデルMはワイヤフレームモデルやサーフェスモデルであってもよい。本実施形態では、3DモデルMは、3D-CAD等の任意の3DCGソフトウェアにより予め作成されているものとする。3DモデルMについてのデータは、3DモデルMのポリゴンを定義する各頂点の3次元座標を示す。本実施形態では、3DモデルMについてのデータは3Dモデル記憶部101に記憶されるが、3DモデルMについてのデータは、外部の情報記憶媒体又はコンピュータに記憶されていてもよい。 2, the 3D model M is a model representing the object O. The 3D model M is composed of at least one polygon that represents the three-dimensional shape of the object O. In this embodiment, the 3D model M corresponds to mesh data that represents the three-dimensional shape of the object O, and corresponds to model data that does not include texture data T, which will be described later. In this embodiment, the 3D model M is a solid model, but the 3D model M may be a wireframe model or a surface model. In this embodiment, the 3D model M is created in advance by any 3DCG software such as 3D-CAD. The data for the 3D model M indicates the three-dimensional coordinates of each vertex that defines the polygon of the 3D model M. In this embodiment, the data for the 3D model M is stored in the 3D model storage unit 101, but the data for the 3D model M may be stored in an external information storage medium or computer.

3DモデルMの数は、元画像OIが示す物体Oの数と同数である。本実施形態では、元画像OIが示す物体Oが1つであるため、3DモデルMの数も1つである。 The number of 3D models M is the same as the number of objects O shown in the original image OI. In this embodiment, since the original image OI shows one object O, the number of 3D models M is also one.

ところで、「物体Oを表す」とは、元画像OIが示す物体Oと同位概念の物体の立体形状を表すことを意味し、元画像OIが示す物体Oそのものの立体形状を表すことを必ずしも意味しない。例えば、元画像OIが示す物体Oが「ジョン」と名付けられた個体のビーグル犬である場合、3DモデルMは、元画像OIが示す物体Oと同位概念の物体であるビーグル犬の立体形状を表すものであれば足り、「ジョン」と名付けられた個体のビーグル犬そのものの立体形状を表すものである必要は無い。 By the way, "representing object O" means representing the three-dimensional shape of an object of the same concept as object O shown in original image OI, and does not necessarily mean representing the three-dimensional shape of object O itself shown in original image OI. For example, if object O shown in original image OI is an individual beagle dog named "John", it is sufficient for 3D model M to represent the three-dimensional shape of a beagle dog that is an object of the same concept as object O shown in original image OI, and it does not have to represent the three-dimensional shape of the individual beagle dog named "John" itself.

なお、3DモデルMは、元画像OIが示す物体Oそのものの立体形状を表すものであることが好ましい。これにより、元画像OIが示す物体Oの外観及び形状を高い精度で維持しつつ、元画像OIが示す物体Oの向き、ポーズ、又は位置を変化させた変換画像を得ることができる。 It is preferable that the 3D model M represents the three-dimensional shape of the object O itself shown in the original image OI. This makes it possible to obtain a converted image in which the orientation, pose, or position of the object O shown in the original image OI is changed while maintaining the appearance and shape of the object O shown in the original image OI with high accuracy.

[照明データ記憶部]
照明データ記憶部102は、照明データLを記憶する。
[Lighting data storage unit]
The illumination data storage unit 102 stores the illumination data L.

照明データLは、3DモデルMに光を照射する光源についてのデータである。具体的には、照明データLは、例えば、光源から照射される光の強度及び色、並びに、後述する仮想空間VSにおける光源の位置及び向きをパラメータとして含む。なお、照明データLが含むパラメータはこれらに限られず、照明データLは、これら以外のパラメータを含んでもよいし、これらのパラメータを含まなくてもよい。光源としては、点光源、線光源、面光源、ボリューム光源等、任意の光源が利用可能である。また、イメージベースドライティングを利用する場合は、現実世界の全方向の光情報をキャプチャした画像が光源として利用されてもよい。 The lighting data L is data about a light source that irradiates the 3D model M. Specifically, the lighting data L includes, for example, the intensity and color of the light irradiated from the light source, as well as the position and orientation of the light source in the virtual space VS described below as parameters. Note that the parameters included in the lighting data L are not limited to these, and the lighting data L may or may not include parameters other than these. Any light source can be used as the light source, such as a point light source, a line light source, a surface light source, or a volume light source. Furthermore, when image-based lighting is used, an image that captures light information in all directions in the real world may be used as the light source.

[テクスチャデータ記憶部]
テクスチャデータ記憶部103は、テクスチャデータTを記憶する。
[Texture data storage unit]
The texture data storage unit 103 stores the texture data T.

テクスチャデータTは、3DモデルMの表面に設定されるテクスチャについてのデータである。テクスチャは、質感とも呼ばれ、例えば、物体Oの色、光沢感、透明度、金属感、凹凸等を含む。テクスチャデータTは、具体的には、3DモデルMの表面に設定されるテクスチャを示す画像データである。本実施形態では、テクスチャデータTは、例えば、物体O表面の拡散反射率(アルベド)、法線ベクトル(ノーマル)、鏡面反射率、メタリック、粗さ(ラフネス)、光沢、異方度、透明度等をパラメータとして含む。なお、テクスチャデータTが含むパラメータはこれらに限られず、テクスチャデータTは、これら以外のパラメータを含んでもよいし、これらのパラメータを含まなくてもよい。 The texture data T is data about the texture set on the surface of the 3D model M. Texture is also called texture, and includes, for example, the color, glossiness, transparency, metallic feel, and unevenness of the object O. Specifically, the texture data T is image data indicating the texture set on the surface of the 3D model M. In this embodiment, the texture data T includes, for example, the diffuse reflectance (albedo), normal vector (normal), specular reflectance, metallic, roughness, gloss, anisotropy, transparency, and the like of the surface of the object O as parameters. Note that the parameters included in the texture data T are not limited to these, and the texture data T may include parameters other than these, or may not include these parameters.

[仮想画像生成部]
以下、図4を参照しつつ、仮想画像生成部120の処理を説明する。図4は、仮想画像を生成する様子を示す図である。
[Virtual image generation unit]
The process of the virtual image generating unit 120 will be described below with reference to Fig. 4. Fig. 4 is a diagram showing how a virtual image is generated.

図2及び図4に示すように、仮想画像生成部120は、3DモデルM、照明データL及びテクスチャデータTに基づいて、仮想視点VVから見た、3DモデルMが配置された仮想空間VSの様子を示す仮想画像VIを生成する。別の言い方をすれば、仮想画像生成部120は、照明データL、テクスチャデータT、及び仮想視点VVをレンダリング条件として、3DモデルMのレンダリング処理を行うということもできる。また、別の言い方をすれば、仮想画像生成部120は、3DモデルM、照明データL及びテクスチャデータTに基づいて、物理ベースレンダリングを行い、レンダリング画像を生成するということもできる。また、別の言い方をすれば、仮想画像生成部120は、元画像OIが示す物体Oに係る新視点画像を生成するということもできる、なお、レンダリング条件は、上記以外に、例えば仮想空間VSの背景画像や、生成する仮想画像VIの解像度・アスペクト比等を含んでもよい。仮想画像VIの生成には、フォワードレンダリング、ディファードレンダリング等の種々の公知のレンダリング手法(レンダリングパイプライン)が利用可能である。 2 and 4, the virtual image generating unit 120 generates a virtual image VI showing the state of the virtual space VS in which the 3D model M is placed, as seen from the virtual viewpoint VV, based on the 3D model M, the lighting data L, and the texture data T. In other words, the virtual image generating unit 120 can perform a rendering process of the 3D model M with the lighting data L, the texture data T, and the virtual viewpoint VV as rendering conditions. In other words, the virtual image generating unit 120 can perform physically based rendering based on the 3D model M, the lighting data L, and the texture data T to generate a rendering image. In other words, the virtual image generating unit 120 can generate a new viewpoint image related to the object O indicated by the original image OI. In addition to the above, the rendering conditions may include, for example, a background image of the virtual space VS, and the resolution and aspect ratio of the virtual image VI to be generated. Various known rendering methods (rendering pipelines), such as forward rendering and deferred rendering, can be used to generate the virtual image VI.

仮想空間VSは、仮想的な3次元空間である。仮想空間VSには、互いに直交する3つの座標軸が設定される。これら3つの座標軸は、ワールド座標系の座標軸である。原点は任意の位置であってよく、仮想空間VS内の位置は3次元座標で表される。なお、仮想画像生成部120では、仮想空間VSには背景画像が設定されてもよい。背景画像は、例えば、木や山、空等の風景を示す画像である。 The virtual space VS is a virtual three-dimensional space. Three mutually orthogonal coordinate axes are set in the virtual space VS. These three coordinate axes are the coordinate axes of the world coordinate system. The origin may be any position, and positions in the virtual space VS are expressed in three-dimensional coordinates. Note that the virtual image generating unit 120 may set a background image in the virtual space VS. The background image is, for example, an image showing scenery such as trees, mountains, and the sky.

仮想視点VVは、仮想カメラとも呼ばれるものであり、ビュー座標系の座標軸を定義する。仮想画像生成部120では、仮想視点VVのパラメータ(位置・画角・拡大倍率等)が設定される。 The virtual viewpoint VV is also called a virtual camera, and defines the coordinate axes of the view coordinate system. The virtual image generator 120 sets the parameters of the virtual viewpoint VV (position, angle of view, magnification, etc.).

以下、図5を用いて、仮想画像生成部120の詳細な処理を説明する。図5は、複数の仮想視点のそれぞれから見た仮想画像を生成する様子を示す図である。 The detailed processing of the virtual image generating unit 120 will be described below with reference to FIG. 5. FIG. 5 is a diagram showing how virtual images viewed from each of a plurality of virtual viewpoints are generated.

すなわち、図5に示すように、仮想画像生成部120は、より具体的には、互いに異なる複数の仮想視点VV1,VV2,VV3のそれぞれにそれぞれが対応するとともに、当該仮想視点から見た仮想空間VSの様子を示す複数の仮想画像VI1,VI2,VI3を生成する。なお、本実施形態では、仮想視点の数は3つであるが、仮想視点の数は、これより少なくてもよく、これより多くてもよい。 More specifically, as shown in FIG. 5, the virtual image generating unit 120 generates a plurality of virtual images VI1, VI2, and VI3, each of which corresponds to a plurality of different virtual viewpoints VV1, VV2, and VV3, and shows the state of the virtual space VS as seen from the respective virtual viewpoints. Note that, although the number of virtual viewpoints is three in this embodiment, the number of virtual viewpoints may be less than this, or may be more than this.

本実施形態の情報処理システム1は、上記のように、複数の仮想視点VV1,VV2,VV3のそれぞれから見た仮想空間VSの様子を示す仮想画像VIを生成する。すなわち、本実施形態の情報処理システム1は、元画像OIが示す物体Oの外観を、複数の仮想視点VV1,VV2,VV3のそれぞれから見た物体Oの外観に反映させることができる。これにより、後述するように、元画像OIが示す物体Oの向きやポーズ、形状、配置を変えた変換画像において、元画像OIが示す物体Oの外観を好適に保つことができる。 As described above, the information processing system 1 of this embodiment generates a virtual image VI that shows the state of the virtual space VS as seen from each of the multiple virtual viewpoints VV1, VV2, and VV3. That is, the information processing system 1 of this embodiment can reflect the appearance of the object O shown in the original image OI in the appearance of the object O as seen from each of the multiple virtual viewpoints VV1, VV2, and VV3. This makes it possible to favorably maintain the appearance of the object O shown in the original image OI in a converted image in which the orientation, pose, shape, and position of the object O shown in the original image OI are changed, as will be described later.

[特徴抽出器記憶部]
特徴抽出器記憶部104は、特徴抽出部130での処理に用いられる特徴抽出器を記憶する。具体的には、特徴抽出器記憶部104は、特徴抽出器のプログラム及びパラメータを記憶する。
[Feature Extractor Storage Unit]
The feature extractor storage unit 104 stores a feature extractor used in the processing in the feature extraction unit 130. Specifically, the feature extractor storage unit 104 stores the program and parameters of the feature extractor.

特徴抽出器は、画像の特徴を抽出する学習済みの機械学習モデルである。特徴抽出器は、後述する第1の中間特徴量及び第2の中間特徴量の抽出に用いられる。本実施形態では、特徴抽出器として、学習済みのCNN(Convolutional Neural Network)から全結合層を除いたものが用いられる。なお、特徴抽出器としては、CNNから全結合層を除いたもの以外にも、学習済みの公知の機械学習モデルが利用可能である。 The feature extractor is a trained machine learning model that extracts image features. The feature extractor is used to extract the first intermediate feature amount and the second intermediate feature amount described below. In this embodiment, a trained CNN (Convolutional Neural Network) without the fully connected layer is used as the feature extractor. Note that, in addition to a CNN without the fully connected layer, a trained, publicly known machine learning model can also be used as the feature extractor.

[特徴抽出部]
特徴抽出部130は、元画像OIから元画像特徴量OFを抽出するとともに、仮想画像VIから仮想画像特徴量VFを抽出する。本実施形態では、特徴抽出部130は、複数の仮想画像VI1,VI2,VI3のそれぞれから、当該仮想画像に対応する仮想画像特徴量VFを抽出する。
[Feature extraction section]
The feature extraction unit 130 extracts original image feature values OF from the original image OI, and extracts virtual image feature values VF from the virtual image VI. In this embodiment, the feature extraction unit 130 extracts virtual image feature values VF corresponding to each of the multiple virtual images VI1, VI2, and VI3.

具体的には、特徴抽出部130は、元画像OIから第1の中間特徴量を抽出し、第1の中間特徴量から元画像特徴量OFを抽出する。また、特徴抽出部130は、仮想画像VIから第2の中間特徴量を抽出し、第2の中間特徴量から仮想画像特徴量VFを抽出する。特徴抽出部130は、第1の中間特徴量及び第2の中間特徴量を、それぞれ先述の特徴抽出器を用いて抽出する。 Specifically, the feature extraction unit 130 extracts a first intermediate feature from the original image OI, and extracts an original image feature OF from the first intermediate feature. The feature extraction unit 130 also extracts a second intermediate feature from the virtual image VI, and extracts a virtual image feature VF from the second intermediate feature. The feature extraction unit 130 extracts the first intermediate feature and the second intermediate feature using the feature extractor described above.

第1の中間特徴量は、元画像OIにおける物体Oの形状及び配置に関する情報を含む。また、第2の中間特徴量は、仮想画像VIにおける物体Oの形状及び配置に関する情報を含む。本実施形態では、学習済みのCNNから全結合層を除いたものを特徴抽出器として用いるので、具体的には、第1の中間特徴量及び第2の中間特徴量は、それぞれ、CNNの畳み込み層から出力される特徴マップである。ここで、特徴マップの数は、フィルタ(カーネル)の数と同数である。 The first intermediate feature includes information about the shape and arrangement of the object O in the original image OI. The second intermediate feature includes information about the shape and arrangement of the object O in the virtual image VI. In this embodiment, a trained CNN excluding the fully connected layer is used as a feature extractor, so specifically, the first intermediate feature and the second intermediate feature are each a feature map output from the convolutional layer of the CNN. Here, the number of feature maps is the same as the number of filters (kernels).

ここで、元画像特徴量OFは、元画像OIの各色の度数分布を示す特徴量である。また、仮想画像特徴量VFは、仮想画像VIの各色の度数分布を示す特徴量である。別の言い方をすれば、元画像特徴量OFは、元画像OIにおける物体Oの形状及び配置に関する情報を含まない特徴量である。また、仮想画像特徴量VFは、仮想画像VIにおける物体Oの形状及び配置に関する情報を含まない特徴量である。本実施形態では、元画像特徴量OF及び仮想画像特徴量VFは、それぞれ、CNN等の学習済みの特徴抽出器から出力可能な特徴量に相当するベクトル表現であってよい。本実施形態では、具体的には、元画像特徴量OF及び仮想画像特徴量VFは、それぞれ、CNNの畳み込み層から出力される特徴マップ同士の相関を計算することによって得られるグラム行列である。このグラム行列は、具体的には、CNNの畳み込み層から出力される特徴マップ同士の内積を計算することによって得られる。画像特徴量は、テクスチャパターンの度数分布をあわせて示す特徴量であってよい。 Here, the original image feature OF is a feature indicating the frequency distribution of each color of the original image OI. The virtual image feature VF is a feature indicating the frequency distribution of each color of the virtual image VI. In other words, the original image feature OF is a feature that does not include information about the shape and arrangement of the object O in the original image OI. The virtual image feature VF is a feature that does not include information about the shape and arrangement of the object O in the virtual image VI. In this embodiment, the original image feature OF and the virtual image feature VF may each be a vector expression equivalent to a feature that can be output from a trained feature extractor such as a CNN. In this embodiment, specifically, the original image feature OF and the virtual image feature VF are each a Gram matrix obtained by calculating the correlation between feature maps output from the convolution layer of the CNN. This Gram matrix is specifically obtained by calculating the inner product of feature maps output from the convolution layer of the CNN. The image feature may also be a feature that indicates the frequency distribution of the texture pattern.

[パラメータ調整部]
パラメータ調整部140は、元画像特徴量OFと仮想画像特徴量VFとの類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。すなわち、パラメータ調整部140は、元画像OIの各色の度数分布を示す特徴量と仮想画像VIの各色の度数分布を示す特徴量との類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。パラメータ調整部140は、元画像OIの配色と仮想画像VIの配色との類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整するということもできる。これにより、本実施形態の情報処理システム1は、元画像OIにおける物体Oの配置と、仮想画像VIにおける物体Oの配置と、が異なっていても、元画像OIが示す物体Oの外観を、変換画像が示す物体Oの外観に的確に反映させることができる。
[Parameter adjustment section]
The parameter adjustment unit 140 adjusts the parameters of the illumination data L and the parameters of the texture data T so that the similarity between the original image feature OF and the virtual image feature VF increases. That is, the parameter adjustment unit 140 adjusts the parameters of the illumination data L and the parameters of the texture data T so that the similarity between the feature indicating the frequency distribution of each color of the original image OI and the feature indicating the frequency distribution of each color of the virtual image VI increases. It can also be said that the parameter adjustment unit 140 adjusts the parameters of the illumination data L and the parameters of the texture data T so that the similarity between the color scheme of the original image OI and the color scheme of the virtual image VI increases. As a result, the information processing system 1 of this embodiment can accurately reflect the appearance of the object O shown in the original image OI in the appearance of the object O shown in the converted image even if the arrangement of the object O in the original image OI is different from the arrangement of the object O in the virtual image VI.

具体的には、パラメータ調整部140は、元画像特徴量OFと仮想画像特徴量VFとに基づいて、損失を計算し、当該損失が小さくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。損失の計算自体は、二乗誤差やクロスエントロピー等の公知の計算方法が利用可能である。また、照明データLのパラメータ及びテクスチャデータTのパラメータの調整自体は、勾配降下法や誤差逆伝播法等の公知のパラメータ調整方法が利用可能である。なお、パラメータ調整部140では、特徴抽出器に係るパラメータ(重み係数やバイアス等)は調整されず固定されたままである。 Specifically, the parameter adjustment unit 140 calculates the loss based on the original image feature amount OF and the virtual image feature amount VF, and adjusts the parameters of the illumination data L and the parameters of the texture data T so as to reduce the loss. The calculation of the loss itself can use a known calculation method such as squared error or cross entropy. Furthermore, the adjustment of the parameters of the illumination data L and the parameters of the texture data T can use a known parameter adjustment method such as gradient descent or backpropagation. Note that in the parameter adjustment unit 140, the parameters related to the feature extractor (weighting coefficients, bias, etc.) are not adjusted but remain fixed.

本実施形態では、パラメータ調整部140は、元画像特徴量OFと、複数の仮想画像VI1,VI2,VI3のそれぞれに対応する仮想画像特徴量VFと、の類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。具体的には、まず、パラメータ調整部140は、元画像特徴量OFと仮想画像VI1に対応する仮想画像特徴量VFとの類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。次に、パラメータ調整部140は、元画像特徴量OFと仮想画像VI2に対応する仮想画像特徴量VFとの類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。最後に、パラメータ調整部140は、元画像特徴量OFと仮想画像VI3に対応する仮想画像特徴量VFとの類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する。 In this embodiment, the parameter adjustment unit 140 adjusts the parameters of the lighting data L and the parameters of the texture data T so that the similarity between the original image feature OF and the virtual image feature VF corresponding to each of the multiple virtual images VI1, VI2, and VI3 is increased. Specifically, first, the parameter adjustment unit 140 adjusts the parameters of the lighting data L and the parameters of the texture data T so that the similarity between the original image feature OF and the virtual image feature VF corresponding to the virtual image VI1 is increased. Next, the parameter adjustment unit 140 adjusts the parameters of the lighting data L and the parameters of the texture data T so that the similarity between the original image feature OF and the virtual image feature VF corresponding to the virtual image VI2 is increased. Finally, the parameter adjustment unit 140 adjusts the parameters of the lighting data L and the parameters of the texture data T so that the similarity between the original image feature OF and the virtual image feature VF corresponding to the virtual image VI3 is increased.

ここで、元画像OIが示す物体Oの向きと、最初にパラメータ調整部140での処理に供される仮想画像特徴量VFに対応する仮想画像VI1が示す物体Oの向きと、は一致していることが好ましい。これにより、照明データLのパラメータ及びテクスチャデータTのパラメータの調整に係る処理負荷が軽減される。 Here, it is preferable that the orientation of the object O indicated by the original image OI coincides with the orientation of the object O indicated by the virtual image VI1 corresponding to the virtual image feature VF that is first subjected to processing by the parameter adjustment unit 140. This reduces the processing load associated with adjusting the parameters of the illumination data L and the parameters of the texture data T.

なお、パラメータ調整部140は、仮想空間VSに背景画像が設定される場合、照明データLのパラメータ及びテクスチャデータTのパラメータに加え、当該背景画像のパラメータを調整してもよい。 When a background image is set in the virtual space VS, the parameter adjustment unit 140 may adjust the parameters of the background image in addition to the parameters of the lighting data L and the parameters of the texture data T.

なお、上記した特徴抽出部130及びパラメータ調整部140は、例えば、参考文献(Gatys, L.A., Ecker, A.S., Bethge, M.: Image style transfer using convolutional neural networks. In: CVPR. (2016))の記載に従って構成されてもよい。 The feature extraction unit 130 and parameter adjustment unit 140 may be configured, for example, according to the description in the reference (Gatys, L.A., Ecker, A.S., Bethge, M.: Image style transfer using convolutional neural networks. In: CVPR. (2016)).

[変換画像生成部]
変換画像生成部150は、3DモデルMと、パラメータ調整部140によりパラメータが調整された照明データL及びテクスチャデータTと、に基づいて、変換画像を生成する。変換画像は、元画像OIのバリエーションであるということもできる。変換画像生成部150で実行される処理の内容は仮想画像生成部120と同様である。
[Converted image generation unit]
The converted image generating unit 150 generates a converted image based on the 3D model M and the illumination data L and texture data T whose parameters have been adjusted by the parameter adjusting unit 140. The converted image can also be said to be a variation of the original image OI. The content of the processing executed by the converted image generating unit 150 is similar to that of the virtual image generating unit 120.

本実施形態の情報処理システム1は、上記のように、パラメータ調整した照明データL及びテクスチャデータTを用いて変換画像を生成する。この変換画像の生成の際に、種々の条件(3DモデルMの位置・ポーズ・形状・向き、仮想視点VVの位置・拡大倍率・画角等)を変化させることによって、様々な変換画像を生成することができる。また、変換画像の生成の際に、照明データLのパラメータやテクスチャデータTのパラメータを更に調整し、照明の位置・明るさや、物体O表面に設定されるテクスチャを変化させることによって、より様々な変換画像を生成することができる。 As described above, the information processing system 1 of this embodiment generates a converted image using the lighting data L and texture data T whose parameters have been adjusted. When generating this converted image, various conditions (position, pose, shape, and orientation of the 3D model M, position, magnification, and angle of view of the virtual viewpoint VV, etc.) can be changed to generate a variety of converted images. Furthermore, when generating a converted image, the parameters of the lighting data L and the parameters of the texture data T can be further adjusted to change the position and brightness of the lighting and the texture set on the surface of the object O, thereby generating even more diverse converted images.

また、本実施形態の情報処理システム1によれば、上記のような様々な変換画像を大量に生成することが容易となる。このようにして得られた大量の変換画像は、例えば、画像認識用の機械学習モデルの学習データとして利用することができる。 In addition, according to the information processing system 1 of this embodiment, it becomes easy to generate a large number of various converted images as described above. The large number of converted images obtained in this manner can be used, for example, as learning data for a machine learning model for image recognition.

なお、本実施形態の情報処理システム1の用途は、上記した変換画像の生成に限られない。例えば、本実施形態の情報処理システム1は、ビデオゲームに登場するゲームオブジェクトの作成に用いることもできる。すなわち、(1)物体Oとしてゲームキャラクターを示す元画像OIが作成される。(2)当該ゲームキャラクターを表す3DモデルM、照明データL、及びテクスチャデータTに基づいて、仮想画像VIが生成される。(3)上記のパラメータ調整を行うことによって、元画像OIの外観を反映させたゲームオブジェクトが得られる。 Note that the use of the information processing system 1 of this embodiment is not limited to generating the converted image described above. For example, the information processing system 1 of this embodiment can also be used to create game objects that appear in a video game. That is, (1) an original image OI showing a game character as the object O is created. (2) A virtual image VI is generated based on a 3D model M representing the game character, lighting data L, and texture data T. (3) By adjusting the parameters as described above, a game object that reflects the appearance of the original image OI is obtained.

[4.本実施形態の情報処理システムにおいて実行される処理]
最後に、図6及び図7を用い、本実施形態の情報処理システム1において実行される処理について説明する。図6及び図7は、本実施形態の情報処理システム1において実行される処理の一例を示すフロー図である。図6及び図7に示す処理は、制御部11が記憶部12に記憶されたプログラムに従って動作することによって実行される。下記に説明する処理は、図3に示す機能ブロックにより実行される処理の一例である。
4. Processing Executed in the Information Processing System of the Present Embodiment
Finally, the process executed in the information processing system 1 of this embodiment will be described with reference to Fig. 6 and Fig. 7. Fig. 6 and Fig. 7 are flow charts showing an example of the process executed in the information processing system 1 of this embodiment. The process shown in Fig. 6 and Fig. 7 is executed by the control unit 11 operating according to a program stored in the storage unit 12. The process described below is an example of the process executed by the functional blocks shown in Fig. 3.

図6に示すように、まず、制御部11は、記憶部12から元画像OIを取得する(S100)。制御部11は、取得した元画像OIから、第1の中間特徴量を抽出する(S101)。制御部11は、更に第1の中間特徴量から元画像特徴量OFを抽出し、抽出した元画像特徴量OFを記憶部12に格納する(S102)。 As shown in FIG. 6, first, the control unit 11 acquires an original image OI from the storage unit 12 (S100). The control unit 11 extracts a first intermediate feature from the acquired original image OI (S101). The control unit 11 further extracts an original image feature OF from the first intermediate feature, and stores the extracted original image feature OF in the storage unit 12 (S102).

図7に移り、制御部11は、仮想視点VVを設定する(S103)。具体的には、制御部11は、仮想視点VVの位置・画角・拡大倍率等のパラメータを設定する。次いで、制御部11は、記憶部12から、3DモデルM、照明データL、及びテクスチャデータTを取得し(S104)、これらに基づいて、仮想画像VIを生成する(S105)。 Moving on to FIG. 7, the control unit 11 sets a virtual viewpoint VV (S103). Specifically, the control unit 11 sets parameters such as the position, angle of view, and magnification of the virtual viewpoint VV. Next, the control unit 11 acquires a 3D model M, lighting data L, and texture data T from the storage unit 12 (S104), and generates a virtual image VI based on these (S105).

制御部11は、生成した仮想画像VIから第2の中間特徴量を抽出する(S106)。記憶部12は、更に第2の中間特徴量から仮想画像特徴量VFを抽出し、抽出した仮想画像特徴量VFを記憶部12に格納する(S107)。制御部11は、記憶部12に格納された元画像特徴量OFと仮想画像特徴量VFとの類似度が大きくなるように、照明データLのパラメータ及びテクスチャデータTのパラメータを調整する(S108)。 The control unit 11 extracts second intermediate features from the generated virtual image VI (S106). The storage unit 12 further extracts virtual image features VF from the second intermediate features and stores the extracted virtual image features VF in the storage unit 12 (S107). The control unit 11 adjusts the parameters of the lighting data L and the parameters of the texture data T so that the similarity between the original image features OF stored in the storage unit 12 and the virtual image features VF increases (S108).

制御部11は、元画像特徴量OFと仮想画像特徴量VFとの類似度が所定の条件を満たしておらず、照明データLのパラメータ及びテクスチャデータTのパラメータの調整を再度繰り返すと判定した場合(S109;N)、S105からS108の処理を再度実行する。具体的には、制御部11は、元画像特徴量OFと仮想画像特徴量VFとに基づいて計算される損失が所定の閾値未満になるまで、照明データLのパラメータ及びテクスチャデータTのパラメータの調整を繰り返す。 When the control unit 11 determines that the similarity between the original image feature amount OF and the virtual image feature amount VF does not satisfy a predetermined condition and that the adjustment of the parameters of the illumination data L and the parameters of the texture data T should be repeated (S109; N), the control unit 11 executes the processes from S105 to S108 again. Specifically, the control unit 11 repeats the adjustment of the parameters of the illumination data L and the parameters of the texture data T until the loss calculated based on the original image feature amount OF and the virtual image feature amount VF becomes less than a predetermined threshold value.

一方、制御部11は、元画像特徴量OFと仮想画像特徴量VFとの類似度が所定の条件を満たし、パラメータ調整を終了すると判定した場合(S109;Y)、次いで、仮想視点VVを変えて仮想画像VIを生成するか否かを判定する(S110)。制御部11は、仮想視点VVを変えて仮想画像VIを生成すると判定した場合(S110;N)、S103からS109の処理を再度実行する。具体的には、制御部11は、所定数の仮想視点VVのそれぞれについて、S103からS109の処理を繰り返す。一方、制御部11は、仮想視点VVを変えて仮想画像VIを生成しないと判定した場合(S110;Y)、本処理を終了する。 On the other hand, when the control unit 11 determines that the similarity between the original image feature OF and the virtual image feature VF satisfies a predetermined condition and that the parameter adjustment is to be terminated (S109; Y), it then determines whether or not to change the virtual viewpoint VV and generate a virtual image VI (S110). When the control unit 11 determines that the virtual viewpoint VV is changed and a virtual image VI is to be generated (S110; N), it executes the processes from S103 to S109 again. Specifically, the control unit 11 repeats the processes from S103 to S109 for each of a predetermined number of virtual viewpoints VV. On the other hand, when the control unit 11 determines that the virtual viewpoint VV is not changed and a virtual image VI is not to be generated (S110; Y), it terminates this process.

[5.付記]
例えば、本開示に係る情報処理システムは、下記のような構成も可能である。
[5. Notes]
For example, the information processing system according to the present disclosure may be configured as follows.

(1)
物体を示す元画像を取得する元画像取得手段と、
前記物体を表す3Dモデル、照明データ、及びテクスチャデータに基づいて、仮想視点から見た、前記3Dモデルが配置された仮想空間の様子を示す仮想画像を生成する仮想画像生成手段と、
前記元画像から元画像特徴量を抽出するとともに、前記仮想画像から仮想画像特徴量を抽出する特徴抽出手段と、
前記元画像特徴量と前記仮想画像特徴量との類似度が大きくなるように、前記照明データのパラメータ及び前記テクスチャデータのパラメータを調整するパラメータ調整手段と、
を有する、情報処理システム。
(1)
An original image acquisition means for acquiring an original image showing an object;
a virtual image generating means for generating a virtual image showing an appearance of a virtual space in which the 3D model is placed, as viewed from a virtual viewpoint, based on a 3D model representing the object, lighting data, and texture data;
a feature extraction means for extracting an original image feature from the original image and a virtual image feature from the virtual image;
a parameter adjusting means for adjusting parameters of the illumination data and parameters of the texture data so as to increase a similarity between the original image feature amount and the virtual image feature amount;
An information processing system having the above configuration.

(2)
前記元画像は、現実空間に配置された前記物体の撮影画像である、
(1)に記載の情報処理システム。
(2)
The original image is a photographed image of the object disposed in real space.
An information processing system according to (1).

(3)
前記元画像特徴量は、前記元画像の各色の度数分布を示し、
前記仮想画像特徴量は、前記仮想画像の各色の度数分布を示し、
前記特徴抽出手段は、前記元画像から、前記元画像における前記物体の形状及び配置に関する情報を含む第1の中間特徴量を抽出し、前記第1の中間特徴量から前記元画像特徴量を抽出するとともに、前記仮想画像から、前記仮想画像における前記物体の形状及び配置に関する情報を含む第2の中間特徴量を抽出し、前記第2の中間特徴量から前記仮想画像特徴量を抽出する、
(1)又は(2)に記載の情報処理システム。
(3)
the original image feature amount indicates a frequency distribution of each color of the original image,
the virtual image feature amount indicates a frequency distribution of each color of the virtual image,
the feature extraction means extracts, from the original image, a first intermediate feature amount including information regarding a shape and an arrangement of the object in the original image, and extracts the original image feature amount from the first intermediate feature amount, and also extracts, from the virtual image, a second intermediate feature amount including information regarding a shape and an arrangement of the object in the virtual image, and extracts the virtual image feature amount from the second intermediate feature amount.
An information processing system according to (1) or (2).

(4)
前記仮想画像生成手段は、互いに異なる複数の前記仮想視点のそれぞれにそれぞれが対応するとともに、当該仮想視点から見た前記仮想空間の様子を示す複数の前記仮想画像を生成し、
前記特徴抽出手段は、前記複数の仮想画像のそれぞれから、当該仮想画像に対応する仮想画像特徴量を抽出し、
前記パラメータ調整手段は、前記元画像特徴量と、前記複数の仮想画像のそれぞれに対応する仮想画像特徴量と、の類似度が大きくなるように、前記照明データのパラメータ及び前記テクスチャデータのパラメータを調整する、
(1)から(3)のいずれかに記載の情報処理システム。
(4)
the virtual image generating means generates a plurality of virtual images each corresponding to a plurality of different virtual viewpoints and showing a state of the virtual space as seen from the corresponding virtual viewpoint;
the feature extraction means extracts, from each of the plurality of virtual images, a virtual image feature corresponding to the virtual image;
the parameter adjustment means adjusts the parameters of the illumination data and the parameters of the texture data so as to increase a similarity between the original image feature amount and a virtual image feature amount corresponding to each of the plurality of virtual images.
An information processing system according to any one of (1) to (3).

(5)
前記3Dモデルと、前記パラメータ調整手段によりパラメータが調整された前記照明データ及び前記テクスチャデータと、に基づいて、前記元画像とは異なる、前記物体を示す画像である変換画像を生成する変換画像生成手段を更に有する、
(1)から(4)のいずれかに記載の情報処理システム。
(5)
a converted image generating means for generating a converted image, which is an image showing the object and is different from the original image, based on the 3D model and the lighting data and the texture data whose parameters have been adjusted by the parameter adjusting means;
An information processing system according to any one of (1) to (4).

以上に説明した本実施形態の情報処理システム1によれば、画像変換の態様を拡張することができる。 According to the information processing system 1 of this embodiment described above, the image conversion mode can be expanded.

1 情報処理システム、N ネットワーク、11 制御部、12 記憶部、13 通信部、14 操作部、15 表示部、100 元画像記憶部、101 3Dモデル記憶部、102 照明データ記憶部、103 テクスチャデータ記憶部、104 特徴抽出器記憶部、110 元画像取得部、120 仮想画像生成部、130 特徴抽出部、140 パラメータ調整部、150 変換画像生成部、OI 元画像、O 物体、M 3Dモデル、L 照明データ、T テクスチャデータ、VI,VI1,VI2,VI3 仮想画像、OF 元画像特徴量、VF 仮想画像特徴量、VV,VV1,VV2,VV3 仮想視点、VS 仮想空間。

1 Information processing system, N Network, 11 Control unit, 12 Memory unit, 13 Communication unit, 14 Operation unit, 15 Display unit, 100 Original image memory unit, 101 3D model memory unit, 102 Lighting data memory unit, 103 Texture data memory unit, 104 Feature extractor memory unit, 110 Original image acquisition unit, 120 Virtual image generation unit, 130 Feature extraction unit, 140 Parameter adjustment unit, 150 Transformed image generation unit, OI Original image, O Object, M 3D model, L Lighting data, T Texture data, VI, VI1, VI2, VI3 Virtual image, OF Original image feature amount, VF Virtual image feature amount, VV, VV1, VV2, VV3 Virtual viewpoint, VS Virtual space.

Claims (7)

物体を示す元画像を取得する元画像取得手段と、
前記物体を表す3Dモデル、照明データ、及びテクスチャデータに基づいて、仮想視点から見た、前記3Dモデルが配置された仮想空間の様子を示す仮想画像を生成する仮想画像生成手段と、
前記元画像から元画像特徴量を抽出するとともに、前記仮想画像から仮想画像特徴量を抽出する特徴抽出手段と、
前記元画像特徴量と前記仮想画像特徴量との類似度大きさを示す損失に基づいて、前記照明データのパラメータを調整するとともに前記テクスチャデータのパラメータを調整するパラメータ調整手段と、
を有する、情報処理システム。
An original image acquisition means for acquiring an original image showing an object;
a virtual image generating means for generating a virtual image showing an appearance of a virtual space in which the 3D model is placed, as viewed from a virtual viewpoint, based on a 3D model representing the object, lighting data, and texture data;
a feature extraction means for extracting an original image feature from the original image and a virtual image feature from the virtual image;
a parameter adjustment means for adjusting a parameter of the illumination data and a parameter of the texture data based on a loss indicating a degree of similarity between the original image feature amount and the virtual image feature amount;
An information processing system having the above configuration.
前記元画像は、現実空間に配置された前記物体の撮影画像である、
請求項1に記載の情報処理システム。
The original image is a photographed image of the object disposed in real space.
The information processing system according to claim 1 .
前記元画像特徴量は、前記元画像の各色の度数分布を示し、
前記仮想画像特徴量は、前記仮想画像の各色の度数分布を示し、
前記特徴抽出手段は、前記元画像から、前記元画像における前記物体の形状及び配置に関する情報を含む第1の中間特徴量を抽出し、前記第1の中間特徴量から前記元画像特徴量を抽出するとともに、前記仮想画像から、前記仮想画像における前記物体の形状及び配置に関する情報を含む第2の中間特徴量を抽出し、前記第2の中間特徴量から前記仮想画像特徴量を抽出する、
請求項1又は2に記載の情報処理システム。
the original image feature amount indicates a frequency distribution of each color of the original image,
the virtual image feature amount indicates a frequency distribution of each color of the virtual image,
the feature extraction means extracts, from the original image, a first intermediate feature amount including information regarding a shape and an arrangement of the object in the original image, and extracts the original image feature amount from the first intermediate feature amount, and also extracts, from the virtual image, a second intermediate feature amount including information regarding a shape and an arrangement of the object in the virtual image, and extracts the virtual image feature amount from the second intermediate feature amount.
3. The information processing system according to claim 1 or 2.
前記仮想画像生成手段は、互いに異なる複数の前記仮想視点のそれぞれにそれぞれが対応するとともに、当該仮想視点から見た前記仮想空間の様子を示す複数の前記仮想画像を生成し、
前記特徴抽出手段は、前記複数の仮想画像のそれぞれから、当該仮想画像に対応する仮想画像特徴量を抽出し、
前記パラメータ調整手段は、前記元画像特徴量と、前記複数の仮想画像のそれぞれに対応する仮想画像特徴量と、の類似度が大きくなるように、前記照明データのパラメータ及び前記テクスチャデータのパラメータを調整する、
請求項1又は2に記載の情報処理システム。
the virtual image generating means generates a plurality of virtual images each corresponding to a plurality of different virtual viewpoints and showing a state of the virtual space as seen from the corresponding virtual viewpoint;
the feature extraction means extracts, from each of the plurality of virtual images, a virtual image feature corresponding to the virtual image;
the parameter adjustment means adjusts the parameters of the illumination data and the parameters of the texture data so as to increase a similarity between the original image feature amount and a virtual image feature amount corresponding to each of the plurality of virtual images.
3. The information processing system according to claim 1 or 2.
前記3Dモデルと、前記パラメータ調整手段によりパラメータが調整された前記照明データ及び前記テクスチャデータと、に基づいて、前記元画像とは異なる、前記物体を示す画像である変換画像を生成する変換画像生成手段を更に有する、
請求項1又は2に記載の情報処理システム。
a converted image generating means for generating a converted image, which is an image showing the object and is different from the original image, based on the 3D model and the lighting data and the texture data whose parameters have been adjusted by the parameter adjusting means;
3. The information processing system according to claim 1 or 2.
物体を示す元画像を取得する元画像取得ステップと、
前記物体を表す3Dモデル、照明データ、及びテクスチャデータに基づいて、仮想視点から見た、前記3Dモデルが配置された仮想空間の様子を示す仮想画像を生成する仮想画像生成ステップと、
前記元画像から元画像特徴量を抽出するとともに、前記仮想画像から仮想画像特徴量を抽出する特徴抽出ステップと、
前記元画像特徴量と前記仮想画像特徴量との類似度大きさを示す損失に基づいて、前記照明データのパラメータを調整するとともに前記テクスチャデータのパラメータを調整するパラメータ調整ステップと、
を有する、情報処理方法。
An original image acquisition step of acquiring an original image showing an object;
a virtual image generating step of generating a virtual image showing an appearance of a virtual space in which the 3D model is placed, as viewed from a virtual viewpoint, based on a 3D model representing the object, lighting data, and texture data;
a feature extraction step of extracting an original image feature from the original image and a virtual image feature from the virtual image;
a parameter adjustment step of adjusting parameters of the illumination data and parameters of the texture data based on a loss indicating a degree of similarity between the original image feature amount and the virtual image feature amount;
An information processing method comprising the steps of:
物体を示す元画像を取得する元画像取得手段、
前記物体を表す3Dモデル、照明データ、及びテクスチャデータに基づいて、仮想視点から見た、前記3Dモデルが配置された仮想空間の様子を示す仮想画像を生成する仮想画像生成手段、
前記元画像から元画像特徴量を抽出するとともに、前記仮想画像から仮想画像特徴量を抽出する特徴抽出手段、
前記元画像特徴量と前記仮想画像特徴量との類似度大きさを示す損失に基づいて、前記照明データのパラメータを調整するとともに前記テクスチャデータのパラメータを調整するパラメータ調整手段、
としてコンピュータを機能させるためのプログラム。
An original image acquisition means for acquiring an original image showing an object;
a virtual image generating means for generating a virtual image showing an appearance of a virtual space in which the 3D model is placed, as viewed from a virtual viewpoint, based on a 3D model representing the object, lighting data, and texture data;
a feature extraction means for extracting an original image feature from the original image and a virtual image feature from the virtual image;
a parameter adjusting means for adjusting a parameter of the illumination data and a parameter of the texture data based on a loss indicating a degree of similarity between the original image feature amount and the virtual image feature amount;
A program that makes a computer function as a
JP2022210579A 2022-12-27 2022-12-27 Information processing system, information processing method, and program Active JP7631291B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022210579A JP7631291B2 (en) 2022-12-27 2022-12-27 Information processing system, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022210579A JP7631291B2 (en) 2022-12-27 2022-12-27 Information processing system, information processing method, and program

Publications (2)

Publication Number Publication Date
JP2024093923A JP2024093923A (en) 2024-07-09
JP7631291B2 true JP7631291B2 (en) 2025-02-18

Family

ID=91805325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022210579A Active JP7631291B2 (en) 2022-12-27 2022-12-27 Information processing system, information processing method, and program

Country Status (1)

Country Link
JP (1) JP7631291B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003141569A (en) 2001-10-31 2003-05-16 Canon Inc Information processing method and video composition apparatus
US20160148425A1 (en) 2014-11-25 2016-05-26 Samsung Electronics Co., Ltd. Method and apparatus for generating personalized 3d face model
WO2017038541A1 (en) 2015-09-03 2017-03-09 ソニー株式会社 Video processing device, video processing method, and program
US20210286977A1 (en) 2019-02-26 2021-09-16 Tencent Technology (Shenzhen) Company Limited Computer application method and apparatus for generating three-dimensional face model, computer device, and storage medium
CN114820908A (en) 2022-06-24 2022-07-29 北京百度网讯科技有限公司 Virtual image generation method and device, electronic equipment and storage medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003141569A (en) 2001-10-31 2003-05-16 Canon Inc Information processing method and video composition apparatus
US20160148425A1 (en) 2014-11-25 2016-05-26 Samsung Electronics Co., Ltd. Method and apparatus for generating personalized 3d face model
WO2017038541A1 (en) 2015-09-03 2017-03-09 ソニー株式会社 Video processing device, video processing method, and program
US20210286977A1 (en) 2019-02-26 2021-09-16 Tencent Technology (Shenzhen) Company Limited Computer application method and apparatus for generating three-dimensional face model, computer device, and storage medium
CN114820908A (en) 2022-06-24 2022-07-29 北京百度网讯科技有限公司 Virtual image generation method and device, electronic equipment and storage medium

Also Published As

Publication number Publication date
JP2024093923A (en) 2024-07-09

Similar Documents

Publication Publication Date Title
US10789686B2 (en) Denoising Monte Carlo renderings using machine learning with importance sampling
JP7526412B2 (en) Method for training a parameter estimation model, apparatus for training a parameter estimation model, device and storage medium
CN115699088B (en) Generating a three-dimensional object model from a two-dimensional image
CN114746904B (en) 3D face reconstruction
US11494915B2 (en) Image processing system, image processing method, and program
CN104508709B (en) Animate an object with a human body
KR20230096063A (en) 3D mesh generator based on 2D images
US9519988B2 (en) Subspace clothing simulation using adaptive bases
CN116580156A (en) 3D printing model method for text generation based on big data deep learning
CN113112580A (en) Method, device, equipment and medium for generating virtual image
CN112102480B (en) Image data processing method, apparatus, device and medium
JP7294788B2 (en) Classification of 2D images according to the type of 3D placement
US11948274B1 (en) Deep learned super resolution for feature film production
US10650524B2 (en) Designing effective inter-pixel information flow for natural image matting
CN116664422B (en) Image highlight processing method, device, electronic device and readable storage medium
CN118587344B (en) Indoor design result evaluation method and system based on virtual reality technology
CN116912433B (en) Three-dimensional model skeleton binding method, device, equipment and storage medium
Liao et al. Illumination animating and editing in a single picture using scene structure estimation
JP7631291B2 (en) Information processing system, information processing method, and program
US9665955B1 (en) Pose-space shape fitting
CN119888024B (en) Human body posture multi-vision recognition AI training data set automatic generation and identification method based on simulation environment
CN118262034A (en) System and method for reconstructing an animated three-dimensional human head model from an image
CN116030181A (en) 3D virtual image generation method and device
He et al. Computer Vision Driven Film and TV Scene Modeling and Innovation
Sun et al. A system scheme of 3D object reconstruction from single 2D graphics based on neural networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240917

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250205

R150 Certificate of patent or registration of utility model

Ref document number: 7631291

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150