Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7587191B2 - Shape estimation device, shape estimation method, and program - Google Patents
[go: Go Back, main page]

JP7587191B2 - Shape estimation device, shape estimation method, and program - Google Patents

Shape estimation device, shape estimation method, and program Download PDF

Info

Publication number
JP7587191B2
JP7587191B2 JP2023526751A JP2023526751A JP7587191B2 JP 7587191 B2 JP7587191 B2 JP 7587191B2 JP 2023526751 A JP2023526751 A JP 2023526751A JP 2023526751 A JP2023526751 A JP 2023526751A JP 7587191 B2 JP7587191 B2 JP 7587191B2
Authority
JP
Japan
Prior art keywords
image
polarization
refraction
shape
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023526751A
Other languages
Japanese (ja)
Other versions
JPWO2022259457A1 (en
Inventor
裕之 石原
孝之 仲地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2022259457A1 publication Critical patent/JPWO2022259457A1/ja
Application granted granted Critical
Publication of JP7587191B2 publication Critical patent/JP7587191B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B11/00Measuring arrangements characterised by the use of optical techniques
    • G01B11/24Measuring arrangements characterised by the use of optical techniques for measuring contours or curvatures

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Description

本発明は、水面、空気ゆらぎ等の透明な屈折層の3次元形状を画像から推定する形状推定装置、形状推定方法、及びプログラムに関する。 The present invention relates to a shape estimation device, a shape estimation method, and a program for estimating the three-dimensional shape of a transparent refractive layer such as a water surface or air fluctuation from an image.

画像中に映る物体の3次元形状を推定する技術は、ロボットビジョン、拡張現実、自動運転等の分野において特に重要である。 Technology that estimates the three-dimensional shape of objects in images is particularly important in fields such as robot vision, augmented reality, and autonomous driving.

一般的な3次元形状推定では、カメラを複数台用意し、カメラの設置位置の違いに基づく見え方の違いから3次元形状を推定する。この従来の方法は、推定対象が不透明かつ拡散反射面であることを前提にしている。よって、水面のような透明な屈折面の形状を推定することはできない。 In typical 3D shape estimation, multiple cameras are used and the 3D shape is estimated from the difference in appearance due to the difference in the camera's installation position. This conventional method assumes that the estimation target is an opaque, diffuse reflecting surface. Therefore, it is not possible to estimate the shape of a transparent refracting surface such as the surface of water.

このような屈折面を対象にした3次元形状を推定するには、カメラ→屈折面→屈折面の背後にある被写体までの光の伝搬をモデル化する必要がある。しかし、一般に屈折面とその背後にある被写体の双方の3次元形状が未知である。また、屈折のモデルが複雑であるため、見通しの良い最適化問題として定式化することが困難である。 To estimate the 3D shape of such a refractive surface, it is necessary to model the propagation of light from the camera to the refractive surface to the object behind the refractive surface. However, the 3D shapes of both the refractive surface and the object behind it are generally unknown. In addition, because the refraction model is complex, it is difficult to formulate it as a clear optimization problem.

そこで、非特許文献1は、1回の屈折が発生する場面の3次元形状の推定に最低2台のカメラが必要であることを理論的・実験的に開示している。また、非特許文献2は、屈折の有無による背景の見え方の違いを考慮することで1台のカメラで屈折面の3次元形状の推定が可能であることを開示している。また、非特許文献3は、偏光情報を用いた透明な面の3次元形状を推定する方法を開示している。 Non-Patent Document 1 theoretically and experimentally discloses that at least two cameras are required to estimate the three-dimensional shape of a scene where one refraction occurs. Non-Patent Document 2 discloses that it is possible to estimate the three-dimensional shape of a refracting surface with one camera by considering the difference in how the background appears depending on whether or not refraction occurs. Non-Patent Document 3 discloses a method for estimating the three-dimensional shape of a transparent surface using polarization information.

[令和3年6月4日検索]、インターネット<URL: https://www.cs.toronto.edu/~kyros/pubs/08.ijcv.indirect.pdf>[Retrieved June 4, 2021], Internet <URL: https://www.cs.toronto.edu/~kyros/pubs/08.ijcv.indirect.pdf> [令和3年6月4日検索]、インターネット<URL: http://grail.cs.washington.edu/projects/glass-recon/cvpr12_refraction.pdf>[Retrieved June 4, 2021], Internet <URL: http://grail.cs.washington.edu/projects/glass-recon/cvpr12_refraction.pdf> [令和3年6月4日検索]、インターネット<URL: http://www.info.hiroshima-cu.ac.jp/~miyazaki/publication/paper/Miyazaki-PAMI2007.pdf>[Retrieved June 4, 2021], Internet: <URL: http://www.info.hiroshima-cu.ac.jp/~miyazaki/publication/paper/Miyazaki-PAMI2007.pdf>

しかしながら、非特許文献1の方法では、カメラが最低2台必要であり、カメラ間の位置合わせ、時刻同期が必要である。また、非特許文献2では、最適化問題として定式化されるモデルが複雑であり、形状推定に長時間を要し大きな計算コストが必要である。また、非特許文献3では、予め推定対象の大まかな3次元形状が分かっている必要がある。However, the method of Non-Patent Document 1 requires at least two cameras, and requires alignment and time synchronization between the cameras. In addition, in Non-Patent Document 2, the model formulated as an optimization problem is complex, and shape estimation takes a long time and requires high calculation costs. In addition, in Non-Patent Document 3, it is necessary to know the rough three-dimensional shape of the estimation target in advance.

このように従来の技術は、複数のカメラ、大きな計算コスト、3次元形状が既知である等が必要であり、3次元形状を推定する技術として好適なものが無いという課題がある。As such, conventional techniques have the drawback of requiring multiple cameras, high computational costs, and prior knowledge of the 3D shape, and there is no suitable technology for estimating 3D shape.

本発明は、この課題に鑑みてなされたものであり、単一カメラ、低計算量、事前学習データなしで、透明な屈折面の3次元形状の推定が可能な形状推定装置、形状推定方法、及びプログラムを提供することを目的とする。The present invention has been made in consideration of this problem, and aims to provide a shape estimation device, a shape estimation method, and a program capable of estimating the three-dimensional shape of a transparent refractive surface using a single camera, with a low computational effort, and without prior training data.

本発明の一態様に係る形状推定装置は、透明な屈折層が介在しない場合の被写体の第1画像と、前記屈折層が介在する場合の前記被写体の第2画像を撮影する偏光カメラと、前記第1画像と前記第2画像の間に特徴点追跡手法を適用して屈折による幾何学的な見え方の変化を表す特徴量である歪みベクトルを取得する特徴量取得部と、前記第2画像から少なくとも3つの異なる偏光角度にそれぞれ対応する輝度値の組を取得して偏光の特徴量を推定する第1推定部と、偏光の前記特徴量を用いて推定したい前記屈折層の法線ベクトルの候補を2つ推定する第2推定部と、前記歪みベクトルを用いて法線ベクトルの前記候補から1つを選択し、前記屈折層の表面形状を表す屈折面3次元形状情報を生成する屈折面生成部とを備えることを要旨とする。A shape estimation device according to one embodiment of the present invention comprises a polarization camera that captures a first image of a subject when no transparent refractive layer is present and a second image of the subject when the refractive layer is present; a feature acquisition unit that applies a feature point tracking method between the first and second images to acquire a distortion vector, which is a feature representing a change in geometric appearance due to refraction; a first estimation unit that acquires sets of brightness values corresponding to at least three different polarization angles from the second image to estimate polarization features; a second estimation unit that estimates two candidates for the normal vector of the refractive layer to be estimated using the polarization features; and a refractive surface generation unit that uses the distortion vector to select one of the candidates for the normal vector and generate three-dimensional shape information of the refractive surface representing the surface shape of the refractive layer.

また、本発明の一態様に係る屈折面3次元形状推定方法は、上記の屈折面3次元形状推定装置が行う屈折面3次元形状推定方法であって、偏光カメラは、透明な屈折層が介在しない場合の被写体の画像である第1画像と、前記屈折層が介在する場合の前記被写体の画像である第2画像を撮影し、特徴量取得部は、前記第1画像と前記第2画像の間に特徴点追跡手法を適用して屈折による幾何学的な見え方の変化を表す特徴量である歪みベクトルを取得し、第1推定部は、前記第2画像から少なくとも3つの異なる角度と輝度値の組を取得して偏光の特徴量を推定し、第2推定部は、偏光の前記特徴量を用いて推定したい前記屈折層の法線ベクトルの候補を2つ推定し、屈折面生成部は、前記歪みベクトルを用いて法線ベクトルの前記候補から1つを選択し、前記屈折層の表面形状を表す屈折面3次元形状情報を生成することを要旨とする。In addition, a method for estimating the three-dimensional shape of a refraction surface according to one aspect of the present invention is a method for estimating the three-dimensional shape of a refraction surface performed by the above-mentioned three-dimensional shape estimation device of a refraction surface, in which a polarized camera captures a first image which is an image of the subject when a transparent refraction layer is not present and a second image which is an image of the subject when the refraction layer is present, a feature acquisition unit applies a feature point tracking method between the first image and the second image to acquire a distortion vector which is a feature representing a geometric change in appearance due to refraction, a first estimation unit acquires at least three different pairs of angles and brightness values from the second image to estimate polarization features, a second estimation unit estimates two candidates for the normal vector of the refraction layer to be estimated using the polarization features, and a refraction surface generation unit selects one of the candidates for the normal vector using the distortion vector, and generates three-dimensional shape information of the refraction surface representing the surface shape of the refraction layer.

また、本発明の一態様に係るプログラムは、上記の屈折面3次元形状推定装置としてコンピュータを機能させるためのプログラムであることを要旨とする。 In addition, one aspect of the present invention relates to a program for causing a computer to function as the above-mentioned refraction surface three-dimensional shape estimation device.

本発明によれば、単一カメラ、低計算量、事前学習データなしで、透明な屈折面の3次元形状の推定が可能である。 Our invention enables estimation of the 3D shape of transparent refractive surfaces using a single camera, low computational complexity, and without prior training data.

本発明の実施形態に係る形状推定装置の機能構成例を示すブロック図である。1 is a block diagram showing an example of a functional configuration of a shape estimation device according to an embodiment of the present invention. 図1に示す形状推定装置と、被写体と、透明な屈折層との関係を模式的に示す図である。2 is a diagram illustrating a schematic diagram of the relationship between the shape estimation device shown in FIG. 1, a subject, and a transparent refractive layer. 偏光の変化のモデル化を模式的に示す図であり、(a)は法線ベクトルと屈折層で反射される光を示す、(b)は天頂角と偏光度の関係を示す図である。1A and 1B are diagrams showing a model of a change in polarization, in which FIG. 1A shows a normal vector and light reflected by a refractive layer, and FIG. 1B shows a relationship between a zenith angle and a degree of polarization. 方位角と画像の明るさの関係を模式的に示す図である。FIG. 2 is a diagram illustrating a relationship between an azimuth angle and image brightness. 幾何学的変化のモデル化を模式的に示す図である。FIG. 1 is a schematic diagram showing modeling of geometric changes. 屈折面3次元形状情報の例を模式的に示す図である。10A and 10B are diagrams illustrating examples of three-dimensional shape information of a refracting surface. 図1に示す形状推定装置が行う形状推定方法の処理手順を示すフローチャートである。2 is a flowchart showing a processing procedure of a shape estimation method performed by the shape estimation device shown in FIG. 1 . 汎用的なコンピュータシステムの構成例を示すブロック図である。FIG. 1 is a block diagram showing an example of the configuration of a general-purpose computer system.

以下、本発明の実施形態について図面を用いて説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。Hereinafter, an embodiment of the present invention will be described with reference to the drawings. The same reference symbols are used for the same parts in the drawings, and the description will not be repeated.

図1は、本発明の実施形態に係る形状推定装置の機能構成例を示すブロック図である。図1に示す形状推定装置100は、被写体との間に介在する透明な屈折層の3次元形状を推定する装置である。 Figure 1 is a block diagram showing an example of the functional configuration of a shape estimation device according to an embodiment of the present invention. The shape estimation device 100 shown in Figure 1 is a device that estimates the three-dimensional shape of a transparent refractive layer that is interposed between the object and the object.

形状推定装置100は、偏光カメラ10、特徴量取得部20、第1推定部30、第2推定部40、及び屈折面生成部50を備える。偏光カメラ10を除く各機能構成部は、例えばROM、RAM、CPU等からなるコンピュータで実現することができる。その場合、その処理内容はプログラムによって記述される。The shape estimation device 100 includes a polarization camera 10, a feature acquisition unit 20, a first estimation unit 30, a second estimation unit 40, and a refraction surface generation unit 50. Each functional component except for the polarization camera 10 can be realized by a computer including, for example, a ROM, a RAM, a CPU, etc. In this case, the processing contents are described by a program.

偏光カメラ10は一般的な偏光カメラである。偏光カメラ10は、例えば異なる4つの偏光角度の偏光子(偏光フィルタ)が組み込まれている。The polarization camera 10 is a typical polarization camera. The polarization camera 10 incorporates, for example, polarizers (polarizing filters) with four different polarization angles.

偏光カメラ10は、透明な屈折層が介在しない場合の被写体の画像である第1画像と、屈折層が介在する場合の被写体の画像である第2画像を撮影する。透明な屈折層は、水面、空気のゆらぎ層等のことである。The polarized camera 10 captures a first image, which is an image of the subject when no transparent refractive layer is present, and a second image, which is an image of the subject when a refractive layer is present. Transparent refractive layers include the surface of water, a layer of fluctuating air, etc.

特徴量取得部20は、偏光カメラ10で撮影した第1画像と第2画像の間に特徴点追跡手法を適用して屈折による幾何学的な見え方の変化を表す特徴量である歪みベクトルを取得する。特徴点追跡手法は、例えばオプティカルフローである。The feature acquisition unit 20 applies a feature point tracking method between the first and second images captured by the polarization camera 10 to acquire a distortion vector, which is a feature that represents a geometric change in appearance due to refraction. The feature point tracking method is, for example, optical flow.

第1推定部30は、第2画像から少なくとも3つの異なる偏光角度にそれぞれ対応する輝度値の組を取得して偏光の特徴量を推定する。偏光の特徴量は、偏光度(Degree of Polarization)である。詳しくは後述する。The first estimation unit 30 estimates the polarization feature by acquiring a set of luminance values corresponding to at least three different polarization angles from the second image. The polarization feature is the degree of polarization. This will be described in detail later.

第2推定部40は、偏光の特徴量を用いて推定したい屈折層の法線ベクトルの候補を2つ推定する。つまり、偏光の変化の法線ベクトルの候補を2つに絞り込む。The second estimation unit 40 estimates two candidates for the normal vector of the refractive layer to be estimated using the polarization feature. In other words, the candidates for the normal vector of the change in polarization are narrowed down to two.

屈折面生成部50は、歪みベクトルを用いて法線ベクトルの候補から1つを選択し、屈折層の表面形状を表す屈折面3次元形状情報を生成する。法線ベクトルは、第2画像の画素の接線に直交するベクトルである。第2画像の屈折層が映った画素の法線ベクトルから屈折層の表面形状を表す屈折面3次元形状情報を生成することができる。The refraction surface generation unit 50 uses the distortion vector to select one of the normal vector candidates and generates refraction surface three-dimensional shape information representing the surface shape of the refraction layer. The normal vector is a vector that is orthogonal to the tangent of the pixel of the second image. The refraction surface three-dimensional shape information representing the surface shape of the refraction layer can be generated from the normal vector of the pixel in which the refraction layer of the second image is reflected.

図2は、形状推定装置100と、被写体(背景)と、透明な屈折層(推定したい屈折面)との関係を模式的に示す図である。図2は、偏光カメラ10を構成するイメージセンサと偏光フィルタのみを示す。 Figure 2 is a schematic diagram showing the relationship between the shape estimation device 100, the subject (background), and a transparent refractive layer (the refractive surface to be estimated). Figure 2 shows only the image sensor and the polarizing filter that make up the polarization camera 10.

図2に示す短冊形状のイメージセンサは、例えば数百万画素を備えるCMOSイメージセンサである。画像平面上の画素iは、背景から屈折層を通過して来た光を偏光フィルタ越しに受光する。The rectangular image sensor shown in Figure 2 is, for example, a CMOS image sensor with millions of pixels. Pixel i on the image plane receives light that has passed through a refractive layer from the background and is reflected by a polarizing filter.

偏光フィルタは、異なる4つの偏光角度を備えイメージセンサの前に配置される。4つの偏光角度を備えるのは一般的である。 A polarizing filter is placed in front of the image sensor with four different polarization angles. Four polarization angles is common.

形状推定装置100は、入射光の方向を光軸Zとした場合に、画素iの接線に直交するベクトルである法線ベクトルnの方位角φと仰角θを画素i毎に推定して屈折層の表面形状を推定する。以降、形状推定装置100の各機能構成部について説明する。 The shape estimation device 100 estimates the azimuth angle φ and elevation angle θ of a normal vector n i , which is a vector orthogonal to the tangent of pixel i, for each pixel i when the direction of incident light is the optical axis Z c , to estimate the surface shape of the refractive layer. Hereinafter, each functional component of the shape estimation device 100 will be described.

なお、画像平面と偏光フィルタの平面が平行である場合、法線ベクトルnの方位角φと、偏光角度は幾何学的に同じ意味をもつため、以降、方位角と偏光角度を同じ変数φとして説明する。 When the image plane and the plane of the polarizing filter are parallel, the azimuth angle φ of the normal vector n i and the polarization angle have the same geometric meaning, so in the following description, the azimuth angle and the polarization angle will be described as the same variable φ.

(第1推定部)
第1推定部30は、屈折層が介在する場合の被写体の第2画像から少なくとも3つの異なる偏光角度にそれぞれ対応する輝度値の組を取得して偏光の特徴量を推定する。
(First Estimation Unit)
The first estimating unit 30 obtains sets of luminance values corresponding to at least three different polarization angles from a second image of the subject when a refractive layer is present, and estimates polarization features.

偏光角度と輝度値の間に次式に示す関係が成立する。 The following relationship holds between the polarization angle and the brightness value:

Figure 0007587191000001
Figure 0007587191000001

ここで偏光の特徴量はImax,Imin,Ψである。偏光の特徴量は、3つ以上の異なる偏光角度と輝度値の組から推定することができる。 Here, the polarization feature amounts are I max , I min , and Ψ. The polarization feature amounts can be estimated from three or more different pairs of polarization angles and luminance values.

偏光の特徴量Imax,Imin,Ψを用いることで、偏光状態を表すストークスベクトルsは次式で表せる。 Using the polarization feature quantities I max , I min , and Ψ, the Stokes vector s representing the polarization state can be expressed by the following equation.

Figure 0007587191000002
Figure 0007587191000002

ストークスベクトルsの変化は、変化前のストークスベクトルにミュラー行列Mをかけることで表すことができる。つまり、変化前のストークスベクトルをsin、変化後のストークスベクトルをsoutとするとき、sout=M・sinとなる。 The change in the Stokes vector s can be expressed by multiplying the Stokes vector before the change by the Mueller matrix M. In other words, when the Stokes vector before the change is s in and the Stokes vector after the change is s out , s out =M·s in .

Figure 0007587191000003
Figure 0007587191000003

ここでTsはフレネルの透過係数(入射面に水平な成分)、Ttはフレネル透過係数(入射面に垂直な成分)である。 Here, Ts is the Fresnel transmission coefficient (component horizontal to the plane of incidence), and Tt is the Fresnel transmission coefficient (component perpendicular to the plane of incidence).

偏光の変化の度合いを表す偏光度ρ(Degree of Polarization)は次式で表せる。The degree of polarization ρ (Degree of Polarization), which represents the degree of change in polarization, can be expressed by the following equation.

Figure 0007587191000004
Figure 0007587191000004

特にsinが非偏光の場合は次式で表せる。 In particular, when s in is unpolarized, it can be expressed by the following equation.

Figure 0007587191000005
Figure 0007587191000005

式(7)は、一見複雑であるが、単調増加関数であり凸最適化問題として定式化が可能である。よって、法線ベクトルnの仰角θは、偏光度の観測値から一意に推定できる。 Although equation (7) appears complicated at first glance, it is a monotonically increasing function and can be formulated as a convex optimization problem. Therefore, the elevation angle θ of the normal vector n i can be uniquely estimated from the observed value of the degree of polarization.

Figure 0007587191000006
Figure 0007587191000006

図3は、偏光の変化のモデル化を模式的に示す図であり、(a)は法線ベクトルnと屈折層で反射される光を示す、(b)は天頂角と偏光度の関係を示す図である。 FIG. 3 is a diagram showing a model of a change in polarization, in which (a) shows a normal vector n i and light reflected by a refractive layer, and (b) shows the relationship between the zenith angle and the degree of polarization.

図3(a)において、sinは屈折面(屈折層の表面)に入射する光、soutは偏光カメラ10が撮影する光を表す。 In FIG. 3A, sin represents light incident on the refractive surface (surface of the refractive layer), and s out represents light captured by the polarization camera 10.

図3(b)の横軸は天頂角、縦軸は偏光度を表す、図3(b)に示すように仰角θが分かれば偏光度ρは一意に求まる。 The horizontal axis of Figure 3 (b) represents the zenith angle, and the vertical axis represents the degree of polarization. As shown in Figure 3 (b), if the elevation angle θ is known, the degree of polarization ρ can be uniquely determined.

(第2推定部)
第2推定部40は、偏光の特徴量を用いて推定したい屈折層(屈折面(屈折層の表面))の法線ベクトルnの候補を2つ推定する。
(Second Estimation Unit)
The second estimation unit 40 estimates two candidates for the normal vector n i of the refractive layer (refractive surface (surface of the refractive layer)) to be estimated using the polarization feature amount.

画像平面と偏光フィルタの平面が平行である場合、法線ベクトルnの方位角φは偏光角Ψ(輝度値が最大になる偏光角度)と一致する。なお、偏光フィルタを1回転する場合、輝度値が最大に成る角度は2つあるため、180°の曖昧性が残る。 When the image plane and the plane of the polarizing filter are parallel, the azimuth angle φ of the normal vector n i coincides with the polarization angle Ψ (the polarization angle at which the luminance value is maximized). Note that when the polarizing filter is rotated once, there are two angles at which the luminance value is maximized, so there remains an ambiguity of 180°.

図4は、方位角φと輝度値の関係を模式的に示す図である。図4の横軸は方位角φ、縦軸は画像の明るさI(φ)を示す。図4に示すように輝度値I(φ)は、2つの最大値を持つ。 Figure 4 is a diagram showing a schematic diagram of the relationship between the azimuth angle φ and the brightness value. The horizontal axis of Figure 4 shows the azimuth angle φ, and the vertical axis shows the brightness I(φ) of the image. As shown in Figure 4, the brightness value I(φ) has two maximum values.

よって、法線ベクトルnの候補は次の2つに絞られる。 Therefore, the candidates for the normal vector n i are narrowed down to the following two:

Figure 0007587191000007
Figure 0007587191000007

(特徴量取得部)
透明な屈折層が介在しない場合の被写体の第1画像と屈折層が介在する場合の被写体の第2画像の間に特徴点追跡手法を適用して屈折による幾何学的な見え方の変化を表す特徴量である歪みベクトルを取得する。
(Feature acquisition unit)
A feature point tracking technique is applied between a first image of a subject when no transparent refractive layer is present and a second image of the subject when a refractive layer is present to obtain a distortion vector, which is a feature that represents the geometric change in appearance due to refraction.

図5は、幾何学的変化のモデル化を模式的に示す図である。図5に示すvは、偏光カメラ10側の光線空間を表す。μは相対屈折率である。また、vは屈折光の方向ベクトルである。 Fig. 5 is a diagram showing a model of the geometric change. vf in Fig. 5 represents the light space on the side of the polarization camera 10. μ is the relative refractive index. Also, vr is the direction vector of the refracted light.

屈折光の方向ベクトルvは次式で表せる。 The directional vector vr of the refracted light can be expressed by the following equation.

Figure 0007587191000008
Figure 0007587191000008

屈折による幾何学的な見え方の変化を表す特徴量である歪みベクトルΔは次式で表せる。 The distortion vector Δg, which is a feature quantity representing a geometric change in appearance due to refraction, can be expressed by the following equation.

Figure 0007587191000009
Figure 0007587191000009

(屈曲面生成部)
屈折面生成部50は、歪みベクトルΔを用いて法線ベクトルnの候補n ,n から1つを選択し、屈折層の表面形状を表す屈折面3次元形状情報を生成する。
(Bending surface generation unit)
The refraction surface generation unit 50 selects one of the candidates n i + , n i for the normal vector n i using the distortion vector Δ g , and generates three-dimensional shape information of the refraction surface that represents the surface shape of the refraction layer.

屈折面生成部50は、偏光の制約から絞り込んだ法線ベクトルnの候補n ,n より、次式の最適解を解くことで屈折面3次元形状情報を生成する。 The refracting surface generating unit 50 generates 3D shape information of the refracting surface by finding the optimum solution of the following equation from candidates n i + , n i of the normal vector n i narrowed down based on the constraints of polarization.

Figure 0007587191000010
Figure 0007587191000010

式(12)の最適解を解く計算は全ての画素iについて行う。 The calculation to find the optimal solution of equation (12) is performed for all pixels i.

図6は、屈折面3次元形状情報の例を模式的に示す図である。図6に示すように3次元形状情報を生成することができる。 Figure 6 is a diagram showing a schematic example of refracting surface three-dimensional shape information. Three-dimensional shape information can be generated as shown in Figure 6.

(形状推定方法)
図7は、形状推定装置100が行う形状推定方法の処理手順を示すフローチャートである。
(Shape Estimation Method)
FIG. 7 is a flowchart showing the processing steps of the shape estimation method performed by the shape estimation device 100.

先ず偏光カメラ10は、透明な屈折層が介在しない場合の被写体の第1画像と、屈折層が介在する場合の被写体の第2画像を撮影する(ステップS1)。First, the polarized camera 10 captures a first image of the subject when no transparent refractive layer is present, and a second image of the subject when a refractive layer is present (step S1).

次に、第1推定部30は、第2画像から少なくとも3つの異なる偏光角度にそれぞれ対応する輝度値の組を取得して偏光の特徴量Imax,Imin,Ψを推定する(ステップS2)。 Next, the first estimating unit 30 obtains sets of luminance values corresponding to at least three different polarization angles from the second image, and estimates polarization feature amounts I max , I min , and Ψ (step S2).

次に、第2推定部40は、偏光の特徴量を用いて推定したい屈折層の法線ベクトルnの候補を2つ(n ,n )推定する(ステップS3)。 Next, the second estimating unit 40 estimates two candidates (n i + , n i ) for the normal vector n i of the refractive layer to be estimated using the polarization feature amount (step S3).

次に、特徴量取得部20は、第1画像と第2画像の間に特徴点追跡手法を適用して屈折による幾何学的な見え方の変化を表す特徴量である歪みベクトルΔを取得する(ステップS4)。 Next, the feature amount acquiring unit 20 acquires a distortion vector Δg , which is a feature amount representing a geometric change in appearance due to refraction, by applying a feature point tracking method between the first image and the second image (step S4).

次に、屈折面生成部50は、歪みベクトルΔを用いて法線ベクトルnの候補n ,n から1つを選択し、屈折層の表面形状を表す屈折面3次元形状情報を生成する(ステップS5)。ステップS2~S5の処理は全ての画素iについて終了するまで繰り返される(ステップS6のNO)。 Next, the refraction surface generator 50 selects one of the candidates n i + , n i - for the normal vector n i using the distortion vector Δ g , and generates three-dimensional shape information of the refraction surface that represents the surface shape of the refraction layer (step S5). The processes of steps S2 to S5 are repeated until they are completed for all pixels i (NO in step S6).

ステップS2~S5の処理は、各画素に独立に処理されるため並列化が容易である。並列化することでより高速な3次元形状の推定が可能になる。 The processes in steps S2 to S5 are easily parallelized because they are performed independently for each pixel. Parallelization enables faster estimation of 3D shapes.

以上説明したように、本実施形態に係る形状推定装置100は、透明な屈折層が介在しない場合の被写体の第1画像と、屈折層が介在する場合の前記被写体の第2画像を撮影する偏光カメラ10と、第1画像と第2画像の間に特徴点追跡手法を適用して屈折による幾何学的な見え方の変化を表す特徴量である歪みベクトルΔを取得する特徴量取得部20と、第2画像から少なくとも3つの異なる偏光角度にそれぞれ対応する輝度値の組を取得して偏光の特徴量Imax,Imin,Ψを推定する第1推定部30と、偏光の特徴量を用いて推定したい屈折層の法線ベクトルnの候補を2つ(n ,n )推定する第2推定部40と、歪みベクトルΔを用いて法線ベクトルnの候補n ,n から1つを選択し、屈折層の表面形状を表す屈折面3次元形状情報を生成する屈折面生成部50とを備える。 As described above, the shape estimation device 100 according to this embodiment includes a polarization camera 10 that captures a first image of a subject when a transparent refractive layer is not present and a second image of the subject when a refractive layer is present, a feature acquisition unit 20 that applies a feature point tracking method between the first and second images to acquire a distortion vector Δ g, which is a feature representing a geometric change in appearance due to refraction, a first estimation unit 30 that acquires sets of luminance values corresponding to at least three different polarization angles from the second image and estimates polarization feature amounts I max , I min , Ψ, a second estimation unit 40 that estimates two candidates (n i + , n i - ) for the normal vector n i of the refractive layer to be estimated using the polarization feature amounts, and a refraction surface generation unit 50 that uses the distortion vector Δ g to select one of the candidates n i + , n i - for the normal vector n i and generate three-dimensional shape information of the refraction surface representing the surface shape of the refraction layer.

また、本実施形態に係る形状推定方法は、形状推定装置100が行う形状推定方法であって、偏光カメラ10は、透明な屈折層が介在しない場合の被写体の第1画像と、屈折層が介在する場合の被写体の第2画像を撮影し、特徴量取得部20は、第1画像と第2画像の間に特徴点追跡手法を適用して屈折による幾何学的な見え方の変化を表す特徴量である歪みベクトルΔを取得し、第1推定部30は、第2画像から少なくとも3つの異なる偏光角度にそれぞれ対応する輝度値の組を取得して偏光の特徴量Imax,Imin,Ψを推定し、第2推定部40は、偏光の特徴量を用いて推定したい屈折層の法線ベクトルnの候補を2つ(n ,n )推定し、屈折面生成部50は、歪みベクトルΔを用いて法線ベクトルnの候補n ,n から1つを選択し、屈折層の表面形状を表す屈折面3次元形状情報を生成する。 Furthermore, the shape estimation method according to this embodiment is a shape estimation method performed by the shape estimation device 100, in which the polarization camera 10 captures a first image of the subject when no transparent refraction layer is present and a second image of the subject when a refraction layer is present, the feature acquisition unit 20 applies a feature point tracking technique between the first and second images to acquire a distortion vector Δ g which is a feature representing a geometric change in appearance due to refraction, the first estimation unit 30 acquires sets of luminance values corresponding to at least three different polarization angles from the second image to estimate polarization feature amounts I max , I min , and Ψ, the second estimation unit 40 estimates two candidates (n i + , n i − ) for the normal vector n i of the refraction layer to be estimated using the polarization feature amounts, and the refraction surface generation unit 50 selects one of the candidates n i + , n i for the normal vector n i using the distortion vector Δ g to generate three-dimensional shape information of the refraction surface representing the surface shape of the refraction layer.

なお、形状推定装置100は、図8に示す汎用的なコンピュータシステムで実現することができる。例えば、CPU90、メモリ91、ストレージ92、通信部93、入力部94、及び出力部95を備える汎用的なコンピュータシテムにおいて、CPU90がメモリ91上にロードされた所定のプログラムを実行することにより、形状推定装置100の各機能が実現される。所定のプログラムは、HDD、SSD、USBメモリ、CD-ROM、DVD-ROM、MOなどのコンピュータ読取り可能な記録媒体に記録することも、ネットワークを介して配信することもできる。The shape estimation device 100 can be realized by a general-purpose computer system as shown in FIG. 8. For example, in a general-purpose computer system including a CPU 90, a memory 91, a storage 92, a communication unit 93, an input unit 94, and an output unit 95, the CPU 90 executes a predetermined program loaded onto the memory 91, thereby realizing each function of the shape estimation device 100. The predetermined program can be recorded on a computer-readable recording medium such as an HDD, SSD, USB memory, CD-ROM, DVD-ROM, or MO, or can be distributed via a network.

以上説明したように、本実施形態に係る形状推定装置100と形状推定方法は、従来実現できなかった、単一カメラ、低計算量、形状に関する事前知識なし(事前学習データなし)で、透明な屈折面の3次元形状の推定を可能にする。つまり、アプローチとして屈折による光の伝搬経路の幾何学的変化だけでなく、光学的な変化(偏光)を考慮した、モデルを構築することで、単一カメラのみで得られる情報から、屈折面形状の3次元形状に必要な制約を得ることができる。また、凸最適化問題として定式化が可能で、且つ解の探索範囲が狭くなることから、従来技術よりも低計算量で3次元形状の推定が可能になる。As described above, the shape estimation device 100 and shape estimation method according to this embodiment enable the estimation of the three-dimensional shape of a transparent refracting surface with a single camera, low computational complexity, and no prior knowledge of the shape (no prior learning data), which was not possible with the conventional approach. In other words, by constructing a model that takes into account not only the geometric changes in the light propagation path due to refraction, but also optical changes (polarization), the constraints necessary for the three-dimensional shape of the refracting surface shape can be obtained from information obtained with only a single camera. In addition, since it can be formulated as a convex optimization problem and the search range for the solution is narrowed, it becomes possible to estimate the three-dimensional shape with less computational complexity than with conventional technology.

なお、本発明は、ここでは記載していない様々な実施形態等を含む。したがって、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。The present invention includes various embodiments not described herein. Therefore, the technical scope of the present invention is determined only by the invention-specific matters related to the claims that are appropriate from the above description.

10:偏光カメラ
20:特徴量取得部
30:第1推定部
40:第2推定部
50:屈折面生成部
100:形状推定装置
10: Polarization camera 20: Feature acquisition unit 30: First estimation unit 40: Second estimation unit 50: Refraction surface generation unit 100: Shape estimation device

Claims (3)

透明な屈折層が介在しない場合の被写体の第1画像と、前記屈折層が介在する場合の前記被写体の第2画像を撮影する偏光カメラと、
前記第1画像と前記第2画像の間に特徴点追跡手法を適用して屈折による幾何学的な見え方の変化を表す特徴量である歪みベクトルを取得する特徴量取得部と、
前記第2画像から少なくとも3つの異なる偏光角度にそれぞれ対応する輝度値の組を取得して偏光の特徴量を推定する第1推定部と、
偏光の前記特徴量を用いて推定したい前記屈折層の法線ベクトルの候補を2つ推定する第2推定部と、
前記歪みベクトルを用いて法線ベクトルの前記候補から1つを選択し、前記屈折層の表面形状を表す屈折面3次元形状情報を生成する屈折面生成部と
を備える形状推定装置。
a polarized camera that captures a first image of a subject without a transparent refractive layer and a second image of the subject with the refractive layer;
a feature amount acquiring unit that acquires a distortion vector, which is a feature amount that represents a geometric change in appearance due to refraction, by applying a feature point tracking method between the first image and the second image;
a first estimation unit that estimates a polarization feature by acquiring sets of luminance values corresponding to at least three different polarization angles from the second image;
A second estimation unit that estimates two candidates of a normal vector of the refractive layer to be estimated using the feature amount of polarization;
a refraction surface generation unit that uses the distortion vector to select one of the candidates for the normal vector and generates three-dimensional shape information of the refraction surface that represents a surface shape of the refraction layer.
形状推定装置が行う形状推定方法であって、
偏光カメラは、透明な屈折層が介在しない場合の被写体の第1画像と、前記屈折層が介在する場合の前記被写体の第2画像を撮影し、
特徴量取得部は、前記第1画像と前記第2画像の間に特徴点追跡手法を適用して屈折による幾何学的な見え方の変化を表す特徴量である歪みベクトルを取得し、
第1推定部は、前記第2画像から少なくとも3つの異なる偏光角度にそれぞれ対応する輝度値の組を取得して偏光の特徴量を推定し、
第2推定部は、偏光の前記特徴量を用いて推定したい前記屈折層の法線ベクトルの候補を2つ推定し、
屈折面生成部は、前記歪みベクトルを用いて法線ベクトルの前記候補から1つを選択し、前記屈折層の表面形状を表す屈折面3次元形状情報を生成する
形状推定方法。
A shape estimation method performed by a shape estimation device, comprising:
the polarized camera captures a first image of the object without a transparent refractive layer and a second image of the object with the refractive layer;
a feature amount acquiring unit that acquires a distortion vector, which is a feature amount representing a geometric change in appearance due to refraction, by applying a feature point tracking method between the first image and the second image;
a first estimation unit that estimates a polarization feature by acquiring sets of luminance values corresponding to at least three different polarization angles from the second image;
The second estimation unit estimates two candidates of a normal vector of the refractive layer to be estimated using the feature amount of polarization;
a refraction surface generating unit using the distortion vector to select one from the candidates for the normal vector, and generating three-dimensional shape information of the refraction surface representing a surface shape of the refraction layer.
請求項1に記載の形状推定装置としてコンピュータを機能させるためのプログラム。
A program for causing a computer to function as the shape estimation device according to claim 1.
JP2023526751A 2021-06-10 2021-06-10 Shape estimation device, shape estimation method, and program Active JP7587191B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/022095 WO2022259457A1 (en) 2021-06-10 2021-06-10 Shape estimation device, shape estimation method, and program

Publications (2)

Publication Number Publication Date
JPWO2022259457A1 JPWO2022259457A1 (en) 2022-12-15
JP7587191B2 true JP7587191B2 (en) 2024-11-20

Family

ID=84426025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023526751A Active JP7587191B2 (en) 2021-06-10 2021-06-10 Shape estimation device, shape estimation method, and program

Country Status (2)

Country Link
JP (1) JP7587191B2 (en)
WO (1) WO2022259457A1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010279044A (en) 2008-12-25 2010-12-09 Panasonic Corp Image processing apparatus and pseudo-stereoscopic image generation apparatus

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2120007A4 (en) * 2007-02-13 2010-12-01 Panasonic Corp IMAGE PROCESSING SYSTEM, METHOD AND APPARATUS AND IMAGE FORMAT

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010279044A (en) 2008-12-25 2010-12-09 Panasonic Corp Image processing apparatus and pseudo-stereoscopic image generation apparatus

Also Published As

Publication number Publication date
JPWO2022259457A1 (en) 2022-12-15
WO2022259457A1 (en) 2022-12-15

Similar Documents

Publication Publication Date Title
TWI834744B (en) Electronic device and method for disparity estimation using cameras with different fields of view
US10410397B2 (en) Picture presentation method and apparatus
US8405742B2 (en) Processing images having different focus
CN103053154B (en) The auto-focusing of stereoscopic camera
US10260866B2 (en) Methods and apparatus for enhancing depth maps with polarization cues
JP6456156B2 (en) Normal line information generating apparatus, imaging apparatus, normal line information generating method, and normal line information generating program
US9087405B2 (en) Depth map generation using bokeh detection
Lee et al. Automatic upright adjustment of photographs with robust camera calibration
US20180014003A1 (en) Measuring Accuracy of Image Based Depth Sensing Systems
JP6580761B1 (en) Depth acquisition apparatus and method using polarization stereo camera
CN107464280B (en) Matching method and device for user 3D modeling
CN105678308A (en) Image stitching testing method based on illumination direction inconsistency
Taamazyan et al. Shape from mixed polarization
CN111080669A (en) Method and device for image reflection separation
CN107613239B (en) Video communication background display method and device
JP2018005542A (en) Image processing device, imaging apparatus, image processing method, image processing program, and storage medium
JP7587191B2 (en) Shape estimation device, shape estimation method, and program
CN107613228A (en) Adding method and terminal equipment of virtual clothes
CN107592491A (en) Video communication background display method and device
Illgner et al. Lightfield imaging for industrial applications
CN109325912A (en) Reflective separation method and calibration split system based on polarised light light field
JP5086120B2 (en) Depth information acquisition method, depth information acquisition device, program, and recording medium
Li et al. Robust 3D reconstruction from uncalibrated small motion clips
JP6550102B2 (en) Light source direction estimation device
Liu et al. A new stereo matching method for RAW image data based on improved SGBM

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20241008

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241021

R150 Certificate of patent or registration of utility model

Ref document number: 7587191

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350