JP7474083B2 - Method for measuring three-dimensional data of an object, method for generating training data, and training data generating device - Google Patents
Method for measuring three-dimensional data of an object, method for generating training data, and training data generating device Download PDFInfo
- Publication number
- JP7474083B2 JP7474083B2 JP2020046409A JP2020046409A JP7474083B2 JP 7474083 B2 JP7474083 B2 JP 7474083B2 JP 2020046409 A JP2020046409 A JP 2020046409A JP 2020046409 A JP2020046409 A JP 2020046409A JP 7474083 B2 JP7474083 B2 JP 7474083B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- data
- dimensional
- measuring
- dimensional data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Length Measuring Devices By Optical Means (AREA)
- Image Analysis (AREA)
Description
本発明は、対象物3次元データ測定方法、学習データ生成方法および学習データ生成装置に関する。 The present invention relates to a method for measuring three-dimensional data of an object , a method for generating training data, and an apparatus for generating training data.
バラ積みされた複数の対象物(ワーク)をロボットアームにより把持する物体把持システム等において、対象物を撮影した画像からの対象物の種類や位置・姿勢の認識に畳み込みニューラルネットワーク等の人工知能が用いられる場合がある。人工知能を用いたシステムの適正な利用のためには、膨大な数の学習データによる機械学習が不可欠であり、学習データの準備に要するコストは大きなものとなる。 In object gripping systems, where a robot arm grips multiple randomly stacked objects (workpieces), artificial intelligence such as convolutional neural networks may be used to recognize the type, position, and orientation of an object from a photographed image. Machine learning using a huge amount of training data is essential for the proper use of systems that use artificial intelligence, and the cost of preparing the training data is significant.
バラ積みされた複数の対象物を、撮影された画像から正確に認識させるためには、実際の作業台等に置かれた状態に近い画像の学習データを用意しなければならず、対象物の3次元形状データだけでは不十分であり、対象物の表面のテクスチャデータも必要になる。一般には、実際の対象物から測定された3次元形状データやテクスチャデータに加工を施して相当数の学習データを生成している。物体の3次元形状を非接触で精密に計測する手法については、種々の技術が提案されている(特許文献1等を参照)。
In order to accurately recognize multiple randomly piled objects from captured images, it is necessary to prepare learning data of images that are close to how they will actually be placed on a workbench, etc., and 3D shape data of the objects alone is insufficient; texture data of the objects' surfaces is also required. Generally, a considerable amount of learning data is generated by processing 3D shape data and texture data measured from actual objects. Various technologies have been proposed for precisely measuring the 3D shape of objects without contact (see
しかしながら、実際の対象物から光学的な測定によって3次元形状データとテクスチャデータとを取得する場合、対象物が光沢物であったり黒色物体であったりする場合には測定が困難であった。すなわち、対象物が光沢物であったり黒色物体であったりする場合、測定のために照射した光が正常に戻ってこないため、正確な3次元形状の測定が困難である。 However, when obtaining 3D shape data and texture data from an actual object through optical measurement, it is difficult to measure if the object is shiny or black. In other words, if the object is shiny or black, the light emitted for measurement does not return normally, making it difficult to accurately measure the 3D shape.
照射した光を正常に反射させるため、対象物の表面にスプレー等により塗料等を付着させ、色や質感を変える場合があるが、そうした場合には対象物の表面のテクスチャが正確に測定できなくなってしまう。そのため、3次元形状の測定とテクスチャの測定とを別工程で行わなければならず、作業工数が増大するとともに、3次元形状とテクスチャとの位置合わせが煩雑になるという問題があった。 In order to properly reflect the irradiated light, paint or other materials may be sprayed onto the surface of the object to change its color or texture, but in such cases, the texture of the object's surface cannot be measured accurately. This means that the measurement of the 3D shape and the texture must be carried out in separate processes, which increases the number of work steps and makes it difficult to align the 3D shape and texture.
本発明は、上記に鑑みてなされたものであって、3次元形状とテクスチャとを含む対象物3次元データを容易に測定する手法を提供することを目的とする。 The present invention has been made in consideration of the above, and aims to provide a method for easily measuring three-dimensional data of an object, including its three-dimensional shape and texture.
上述した課題を解決し、目的を達成するために、本発明の一態様に係る対象物3次元データ測定方法は、第1の工程と、第2の工程とを備える。前記第1の工程は、可視光よりも波長の短い光の照射を受けると可視光による発光を行い、可視光に対しては無色透明の塗料が塗布された対象物に対し、所定のパターンによる前記可視光よりも波長の短い光の照射を行って、前記対象物を撮影し、撮影された画像から前記対象物の3次元形状を測定する。前記第2の工程は、前記対象物に対し、可視光の照射を行って、前記対象物を撮影し、撮影された画像から前記対象物のテクスチャを測定する。 In order to solve the above-mentioned problems and achieve the object, a method for measuring three-dimensional data of an object according to one aspect of the present invention includes a first step and a second step. In the first step, an object that emits visible light when irradiated with light having a wavelength shorter than that of visible light and is coated with a paint that is colorless and transparent to visible light is irradiated with light having a wavelength shorter than that of visible light in a predetermined pattern, the object is photographed, and the three-dimensional shape of the object is measured from the photographed image. In the second step, the object is irradiated with visible light, the object is photographed, and the texture of the object is measured from the photographed image.
本発明の一態様に係る対象物3次元データ測定方法は、3次元形状とテクスチャとを含む対象物3次元データを容易に測定することができる。 The method for measuring three-dimensional object data according to one aspect of the present invention can easily measure three-dimensional object data including three-dimensional shape and texture.
以下、実施形態に係る対象物3次元データ測定方法、対象物3次元データ測定装置、学習データ生成方法および学習データ生成装置について図面を参照して説明する。なお、この実施形態によりこの発明が限定されるものではない。また、図面における各要素の寸法の関係、各要素の比率などは、現実と異なる場合がある。図面の相互間においても、互いの寸法の関係や比率が異なる部分が含まれている場合がある。また、1つの実施形態や変形例に記載された内容は、原則として他の実施形態や変形例にも同様に適用される。 The object 3D data measuring method, object 3D data measuring device, learning data generating method, and learning data generating device according to the embodiments will be described below with reference to the drawings. Note that the present invention is not limited to these embodiments. Furthermore, the dimensional relationships and ratios of each element in the drawings may differ from reality. The drawings may also include parts with different dimensional relationships and ratios. Furthermore, the contents described in one embodiment or variant apply in principle to other embodiments or variants.
(物体把持システム)
図1は、物体把持システム1の一例を示す外観図である。図1に示す物体把持システム1は、図示しない画像処理装置10と、カメラ20と、ロボットアーム30とを備える。カメラ20は、例えば、ロボットアーム30と、ロボットアーム30が把持する対象物となる、バラ積みされたワーク41、42等との両方を撮影可能な位置に設けられる。カメラ20は、例えば、ロボットアーム30と、ワーク41、42の画像とを撮影し、画像処理装置10に出力する。なお、ロボットアーム30とバラ積みされたワーク41,42等とは別々のカメラで撮影してもよい。カメラ20には、図1に示されるように、例えば公知のステレオカメラ等、複数の画像を撮影できるカメラが用いられる。画像処理装置10は、カメラ20から出力された画像を用いて、ワーク41、42等の位置および姿勢を推定する。画像処理装置10は、推定されたワーク41、42等の位置および姿勢に基づいて、ロボットアーム30の動作を制御する信号を出力する。ロボットアーム30は、画像処理装置10から出力された信号に基づいて、ワーク41、42等を把持する動作を行う。なお、図1においては、複数の異なる種類のワーク41、42等が開示されているが、ワークの種類は1種類であってもよい。ここでは、ワークが1種類である場合について説明する。また、ワーク41、42等は、位置および姿勢が不規則であるように配置されている。図1に示すように、例えば、複数のワークが上面視において重なるように配置されていてもよい。また、ワーク41、42は、対象物の一例である。
(Object Grasping System)
FIG. 1 is an external view showing an example of an
図2は、物体把持システム1の構成の一例を示すブロック図である。図2に示すように、画像処理装置10は、カメラ20およびロボットアーム30と、ネットワークNWを通じて通信可能に接続されている。また、図2に示すように、画像処理装置10は、通信I/F(インターフェース)11と、入力I/F12と、ディスプレイ13と、記憶回路14と、処理回路15とを備える。
Figure 2 is a block diagram showing an example of the configuration of the
通信I/F11は、ネットワークNWを通じた外部装置とのデータ入出力の通信を制御する。例えば、通信I/F11は、ネットワークカードやネットワークアダプタ、NIC(Network Interface Controller)等によって実現され、カメラ20から出力される画像のデータを受信するとともに、ロボットアーム30に出力する信号を送信する。
The communication I/F 11 controls data input/output communication with external devices via the network NW. For example, the communication I/F 11 is realized by a network card, a network adapter, a NIC (Network Interface Controller), etc., and receives image data output from the
入力I/F12は、処理回路15に接続され、画像処理装置10の管理者(不図示)から受け付けた入力操作を電気信号に変換して処理回路15に出力する。例えば、入力I/F12は、スイッチボタン、マウス、キーボード、タッチパネル等である。
The input I/F 12 is connected to the processing circuit 15, converts input operations received from an administrator (not shown) of the
ディスプレイ13は、処理回路15に接続され、処理回路15から出力される各種情報および各種画像データを表示する。例えば、ディスプレイ13は、液晶モニタやCRT(Cathode Ray Tube)モニタ、タッチパネル等によって実現される。 The display 13 is connected to the processing circuit 15 and displays various information and image data output from the processing circuit 15. For example, the display 13 is realized by a liquid crystal monitor, a CRT (Cathode Ray Tube) monitor, a touch panel, etc.
記憶回路14は、例えば、メモリ等の記憶装置により実現される。記憶回路14には、処理回路15により実行される各種のプログラムが記憶されている。また、記憶回路14には、処理回路15により各種のプログラムが実行される際に用いられる各種のデータが一時的に記憶される。記憶回路14は、機械(深層)学習モデル141を有する。さらに、機械(深層)学習モデル141はニューラルネットワーク構造141aと学習パラメータ141bを備えている。ニューラルネットワーク構造141aは、例えば、図5の畳み込みニューラルネットワークb1のような公知のネットワークを応用したもので、後述する図12に示されるネットワーク構造である。学習パラメータ141bは、例えば、畳み込みニューラルネットワークの畳み込みフィルタの重みであり、対象物の位置および姿勢を推定するために学習され、最適化されるパラメータである。ニューラルネットワーク構造141aは、推定部152に備えられていても構わない。なお、本発明における機械(深層)学習モデル141は学習済みモデルを例として説明するが、これに限定されない。なお、以下において、機械(深層)学習モデル141を、単に「学習モデル141」と表記する場合がある。
The memory circuit 14 is realized by, for example, a storage device such as a memory. Various programs executed by the processing circuit 15 are stored in the memory circuit 14. In addition, various data used when the various programs are executed by the processing circuit 15 is temporarily stored in the memory circuit 14. The memory circuit 14 has a machine (deep) learning model 141. Furthermore, the machine (deep) learning model 141 has a
学習モデル141は、カメラ20から出力された画像から、ワークの位置および姿勢を推定する処理に用いられる。学習モデル141は、例えば、複数のワークの位置および姿勢と、当該複数のワークを撮影した画像とを教師データして学習することにより生成される。なお、ここでは、学習モデル141が、例えば、処理回路15により生成されるが、これに限られず、外部のコンピュータにより生成されてもよい。
The learning model 141 is used in a process of estimating the position and orientation of a workpiece from an image output from the
処理回路15は、CPU(Central Processing Unit)等のプロセッサにより実現される。処理回路15は、画像処理装置10全体を制御する。処理回路15は、記憶回路14に記憶された各種のプログラムを読み取り、読み取ったプログラムを実行することで、各種の処理を実行する。例えば、処理回路15は、画像取得部151と、推定部152と、ロボット制御部153とを有することとなる。
The processing circuitry 15 is realized by a processor such as a CPU (Central Processing Unit). The processing circuitry 15 controls the entire
画像取得部151は、例えば、通信I/F11を通じて、バラ積み画像を取得し、推定部152に出力する。画像取得部151は、取得部の一例である。
The
推定部152は、出力されたバラ積み画像を用いて、対象物の位置および姿勢を推定する。推定部152は、例えば、学習モデル141を用いて、対象物の画像に対する推定処理を行い、推定結果をロボット制御部153に出力する。なお、推定部152は、例えば、対象物が配置されるトレイ等の位置および姿勢をさらに推定してもよい。トレイの位置および姿勢を推定する構成については、後に説明する。 The estimation unit 152 estimates the position and orientation of the target object using the outputted bulk image. The estimation unit 152 performs estimation processing on the image of the target object using, for example, the learning model 141, and outputs the estimation result to the robot control unit 153. Note that the estimation unit 152 may further estimate, for example, the position and orientation of a tray or the like on which the target object is placed. The configuration for estimating the position and orientation of the tray will be described later.
ロボット制御部153は、推定された対象物の位置および姿勢に基づいて、ロボットアーム30を制御する信号を生成し、通信I/F11を通じてロボットアーム30に出力する。ロボット制御部153は、例えば、現在のロボットアーム30の位置および姿勢に関する情報を取得する。そして、ロボット制御部153は、現在のロボットアーム30の位置および姿勢と、推定された対象物の位置および姿勢に応じて、ロボットアーム30が対象物を把持する際に移動する軌道を生成する。なお、ロボット制御部153は、トレイ等の位置および姿勢に基づいて、ロボットアーム30が移動する軌道を修正してもよい。
The robot control unit 153 generates a signal to control the
図3は、ロボットアームの制御に関する処理の一例を示す図である。図3に示すように、推定部152は、バラ積み画像から、ターゲットとなる対象物の位置および姿勢を推定する。同様に、推定部152は、バラ積み画像から、対象物が配置されたトレイ等の位置および姿勢を推定してもよい。ロボット制御部153は、推定された対象物およびトレイ等のモデルに基づいて、ロボットアーム30の手先の位置の座標および姿勢を算出し、ロボットアーム30の軌道を生成する。
Figure 3 is a diagram showing an example of processing related to control of a robot arm. As shown in Figure 3, the estimation unit 152 estimates the position and orientation of a target object from the bulk image. Similarly, the estimation unit 152 may estimate the position and orientation of a tray or the like on which the object is placed from the bulk image. The robot control unit 153 calculates the coordinates and orientation of the position of the hand of the
なお、ロボット制御部153は、ロボットアーム30が対象物を把持した後に、把持した対象物を整列させるためのロボットアーム30の動作を制御する信号を、さらに出力してもよい。図4は、ロボットアームの制御に関する処理の別の一例を示す図である。図4に示すように、画像取得部151は、カメラ20により撮影された、ロボットアーム30により把持された対象物を撮影した画像を取得する。推定部152は、ターゲットとなる、ロボットアーム30に把持された対象物の位置および姿勢を推定し、ロボット制御部153に出力する。また、画像取得部151は、カメラ20により撮影された、把持された対象物の移動先となる、整列先のトレイ等の画像をさらに取得してもよい。その際、画像取得部151は、整列先のトレイ等に既に整列された対象物の画像(整列済み画像)をさらに取得する。推定部152は、整列先の画像、または整列済み画像から、整列先となるトレイ等の位置および姿勢、並びに既に整列済みである対象物の位置および姿勢を推定する。そして、ロボット制御部153は、推定された、ロボットアーム30に把持された対象物の位置および姿勢、整列先となるトレイ等の位置および姿勢、並びに既に整列済みである対象物の位置および姿勢に基づいて、ロボットアーム30の手先の位置の座標および姿勢を算出し、対象物を整列させる際のロボットアーム30の軌道を生成する。
In addition, the robot control unit 153 may further output a signal to control the operation of the
次に、推定部152における推定処理について説明する。推定部152は、例えば公知のダウンサンプリング、アップサンプリング、スキップコネクションを持つ物体検出モデルを応用したモデルを用いて、対象物の特徴量を抽出する。図5は、検出モデルの一例を示す図である。図5に示す物体検出モデルにおいて、d1層は、例えばバラ積み画像P1(320×320ピクセル)を畳み込みニューラルネットワークb1を介してダウンサンプリングによって縦横40×40グリッドに区分し、各グリッドについて複数の特徴量(例えば256種類)を算出する。また、d1層より下位の層にあたるd2層は、d1層で区分されたグリッドを、d1層よりも粗く(例えば20×20グリッドに)区分して、各グリッドの特徴量を算出する。同様に、d1層およびd2層よりも下位の層にあたるd3層およびd4層は、d2層で区分されたグリッドを、それぞれより粗く区分する。d4層はアップサンプリングによって、より精細な区分で特徴量を算出し、同時にスキップコネクションs3によりd3層の特徴量と統合してu3層を生成する。スキップコネクションは、単純な加算、特徴量の連結でも良く、d3層の特徴量に対して畳み込みニューラルネットワークのような変換が加えられていても良い。同様にu3層をアップサンプリングして算出した特徴量とd2層の特徴量をスキップコネクションs2により統合してu2層を生成する。さらに同様にu1層を生成する。この結果、u1層においては、d1層と同様に、40×40グリッドに区分された各グリッドの特徴量が算出される。 Next, the estimation process in the estimation unit 152 will be described. The estimation unit 152 extracts the feature amount of the object by using, for example, a model that applies an object detection model having known downsampling, upsampling, and skip connections. FIG. 5 is a diagram showing an example of a detection model. In the object detection model shown in FIG. 5, the d1 layer divides, for example, a bulk pile image P1 (320×320 pixels) into 40×40 grids by downsampling via a convolutional neural network b1, and calculates multiple feature amounts (for example, 256 types) for each grid. In addition, the d2 layer, which is a layer lower than the d1 layer, divides the grid divided in the d1 layer more roughly (for example, into 20×20 grids) and calculates the feature amount of each grid. Similarly, the d3 layer and the d4 layer, which are layers lower than the d1 layer and the d2 layer, divide the grid divided in the d2 layer more roughly, respectively. The d4 layer calculates features in finer divisions by upsampling, and at the same time integrates them with the features of the d3 layer through skip connection s3 to generate the u3 layer. The skip connection may be a simple addition or concatenation of features, or a transformation such as a convolutional neural network may be applied to the features of the d3 layer. Similarly, the u3 layer is upsampled and the calculated features are integrated with the features of the d2 layer through skip connection s2 to generate the u2 layer. The u1 layer is then generated in a similar manner. As a result, in the u1 layer, features of each grid divided into a 40 x 40 grid are calculated, just like in the d1 layer.
図6は、特徴検出層(u1)が出力する特徴マップの一例を示す図である。図6に示す特徴マップの水平方向は、40×40のグリッドに区分されたバラ積み画像P1の水平方向の各グリッドを示し、垂直方向は、垂直方向の各グリッドを示す。また、図6に示す特徴マップの奥行方向は、各グリッドにおける特徴量の要素を示す。 Figure 6 shows an example of a feature map output by the feature detection layer (u1). The horizontal direction of the feature map shown in Figure 6 indicates each horizontal grid of the bulk pile image P1, which is divided into a 40 x 40 grid, and the vertical direction indicates each vertical grid. The depth direction of the feature map shown in Figure 6 indicates the feature element in each grid.
図7は、対象物の位置および姿勢の推定結果の一例を示す図である。図7に示すように、推定部は、対象物の位置を示す2次元座標(Δx,Δy)、対象物の姿勢を示すクオタニオン(qx,qy,qz,qw)、およびクラス分類のスコア(C0,C1,…,Cn)を出力する。なお、ここでは、推定結果として、対象物の位置を示す座標のうち、カメラ20から対象物までの距離を示す深度の値は算出されない。深度の値を算出する構成については、後に説明する。なお、ここで言う深度とは、カメラの光軸に平行なz軸方向における、カメラのz座標から対象物のz座標までの距離をいう。なお、クラス分類のスコアはグリッドごとに出力される値であって、そのグリッドに対象物の中心点が含まれている確率である。例えば、対象物の種類がn種類だった場合に、これに“対象物の中心点が含まれていない確率”を加えてn+1個のクラス分類のスコアが出力される。例えば、対象物となるワークが1種類のみの場合は、2個のクラス分類のスコアが出力される。また、同一グリッド内に複数の対象物が存在する場合、より上に積まれている物体の確率を出力する。
FIG. 7 is a diagram showing an example of the estimation result of the position and orientation of the object. As shown in FIG. 7, the estimation unit outputs two-dimensional coordinates (Δx, Δy) indicating the position of the object, quaternions (qx, qy, qz, qw) indicating the orientation of the object, and class classification scores (C0, C1, ..., Cn). Note that, here, as the estimation result, among the coordinates indicating the position of the object, the depth value indicating the distance from the
図7において、点CはグリッドGxの中心を示し、座標(Δx,Δy)である点ΔCは、例えば、検出された対象物の中心点を示す。すなわち、図7に示す例において、対象物の中心は、グリッドGxの中心点Cから、x軸方向にΔx、y軸方向にΔyだけオフセットしている。 In FIG. 7, point C indicates the center of grid Gx, and point ΔC with coordinates (Δx, Δy) indicates, for example, the center point of a detected object. That is, in the example shown in FIG. 7, the center of the object is offset from center point C of grid Gx by Δx in the x-axis direction and Δy in the y-axis direction.
なお、図7に代えて、図8に示すように対象物の中心以外の任意の点a、b、cを設定し、グリッドGxの中心の点Cからの任意の点a、b、cの座標(Δx1,Δy1、Δz1、Δx2,Δy2、Δz2、x3,Δy3、Δz3)を出力してもよい。なお、任意の点は対象物のどの位置に設定してもよく、1点でも複数の点でも構わない。 Instead of FIG. 7, arbitrary points a, b, and c other than the center of the object may be set as shown in FIG. 8, and the coordinates (Δx1, Δy1, Δz1, Δx2, Δy2, Δz2, x3, Δy3, Δz3) of the arbitrary points a, b, and c from point C at the center of grid Gx may be output. The arbitrary points may be set anywhere on the object, and may be one or multiple points.
なお、対象物の大きさに比してグリッドの区分が粗いと、複数の対象物が一つのグリッドに入ってしまい、各対象物の特徴が交じり合って誤検出するおそれがあるため、ここでは、最終的に生成された精細な(40×40グリッドの)特徴量が算出される特徴抽出層(u1)の出力である特徴マップのみ利用する。 Note that if the grid division is too coarse compared to the size of the object, multiple objects may fall into one grid, causing the features of each object to mix and result in false detection. Therefore, here we only use the feature map, which is the output of the feature extraction layer (u1), from which the fine (40 x 40 grid) features finally generated are calculated.
また、ここでは、例えばステレオカメラを用いて、左右2種類の画像を撮影することにより、カメラ20から対象物までの距離を特定する。図9は、ステレオカメラにより撮影されたバラ積み画像の一例を示す図である。図9に示すように、画像取得部151は、左画像P1Lおよび右画像P1Rの2種類のバラ積み画像を取得する。また、推定部152は、左画像P1Lおよび右画像P1Rの両方に対して、学習モデル141を用いた推定処理を行う。なお、推定処理を行う際に、左画像P1Lに対して用いられる学習パラメータ141bの一部、またはすべてを、右画像P1Rに対する重み付けとして共有してもよい。なお、ステレオカメラではなく、1台のカメラを用い、カメラの位置をずらして、2か所で左右2種の画像に相当する画像を撮影してもよい。
In addition, here, for example, a stereo camera is used to capture two types of left and right images, and the distance from the
そこで、ここでは、推定部152は、左画像P1Lの特徴量と、右画像P1Rの特徴量とを組み合わせたマッチングマップを用いることにより、対象物の誤認識を抑制する。マッチングマップは、各特徴量について、右画像P1Rと左画像P1Lとで特徴量の相関の強弱を示す。すなわち、マッチングマップを用いることにより、各画像における特徴量に着目して、左画像P1Lと右画像P1Rとのマッチングを図ることができる。 Here, the estimation unit 152 suppresses erroneous recognition of objects by using a matching map that combines the features of the left image P1L and the features of the right image P1R. The matching map indicates the strength of correlation between the features of the right image P1R and the left image P1L for each feature. In other words, by using the matching map, it is possible to match the left image P1L and the right image P1R by focusing on the features in each image.
図10は、バラ積み画像とマッチングマップとの関係の一例を示す図である。図10に示すように、左画像P1Lを基準とし、右画像P1Rとの対応をとったマッチングマップMLにおいては、左画像P1Lの対象物W1Lの中心点が含まれるグリッドの特徴量と、右画像P1Rに含まれる特徴量との相関が最も大きいグリッドMLaが強調して表示される。同様に、右画像P1Rを基準とし、左画像P1Lとの対応をとったマッチングマップMRにおいても、右画像P1Rの対象物W1Rの中心点が含まれるグリッドの特徴量と、左画像P1Lに含まれる特徴量との相関が最も大きいグリッドMRaが強調して表示される。また、マッチングマップMLにおいて相関が最も大きいグリッドMLaは、左画像P1Lにおける対象物W1Lが位置するグリッドに対応し、マッチングマップMRにおいて相関が最も大きいグリッドMRaは、右画像P1Rにおける対象物W1Rが位置するグリッドに対応する。これにより、左画像P1Lにおいて対象物W1Lが位置するグリッドと、右画像P1Rにおいて対象物W1Rが位置するグリッドとが一致することを特定できる。すなわち、図9においては、一致するグリッドは、左画像P1LのグリッドG1Lと、右画像P1RのグリッドG1Rである。これにより、左画像P1Lにおける対象物W1LのX座標と、右画像P1Rにおける対象物W1RのX座標とに基づいて、対象物W1に対する視差を特定できるので、カメラ20から対象物W1までの深度zを特定することができる。
Figure 10 is a diagram showing an example of the relationship between a bulk pile image and a matching map. As shown in Figure 10, in the matching map ML, which is based on the left image P1L and corresponds to the right image P1R, the grid MLa that has the highest correlation between the feature amount of the grid including the center point of the object W1L in the left image P1L and the feature amount included in the right image P1R is highlighted. Similarly, in the matching map MR, which is based on the right image P1R and corresponds to the left image P1L, the grid MRa that has the highest correlation between the feature amount of the grid including the center point of the object W1R in the right image P1R and the feature amount included in the left image P1L is highlighted. In addition, the grid MLa with the highest correlation in the matching map ML corresponds to the grid where the object W1L in the left image P1L is located, and the grid MRa with the highest correlation in the matching map MR corresponds to the grid where the object W1R in the right image P1R is located. This makes it possible to determine that the grid on which object W1L is located in the left image P1L matches the grid on which object W1R is located in the right image P1R. That is, in FIG. 9, the matching grids are grid G1L in the left image P1L and grid G1R in the right image P1R. This makes it possible to determine the parallax for object W1 based on the X coordinate of object W1L in the left image P1L and the X coordinate of object W1R in the right image P1R, and therefore the depth z from
図11は、推定処理の一例を示すフローチャートである。また、図12は、推定処理の一例を示す図である。以降、図9~図12を用いて説明する。まず、画像取得部151は、図9に示す左画像P1Lおよび右画像P1Rのように、対象物の左右の各画像を取得する(ステップS201)。次に、推定部152は、左右の各画像の水平方向の各グリッドについて、特徴量を算出する。ここで、上で述べたように、各画像を40×40のグリッドに区分し、各グリッドについて256個の特徴量を算出する場合、各画像の水平方向において、式(1)の左辺第1項および第2項(第1項の行列と第2項の行列の積)に示すような40行40列の行列が得られる。
Fig. 11 is a flowchart showing an example of the estimation process. Fig. 12 is a diagram showing an example of the estimation process. Hereinafter, the description will be given with reference to Figs. 9 to 12. First, the
次に、推定部152は、図12に示す処理mを実行する。まず、推定部152は、例えば、式(1)により、左画像P1Lから抽出した特定の列の特徴量に、右画像P1Rから抽出した同じ列の特徴量を転置したものの行列積を計算する。式(1)において、左辺第1項は、左画像P1Lの特定の列の水平方向における1番目のグリッドにおける各特徴量l11乃至l1nが、それぞれ行方向に並んでいる。一方、式(1)の左辺第2項においては、右画像P1R特定の列の水平方向における1番目のグリッドの各特徴量r11乃至r1nが、それぞれ列方向に並んでいる。すなわち、左辺第2項の行列は、右画像P1Rの特定の列の水平方向にグリッドの各特徴量r11乃至r1mがそれぞれ行方向に並んだ行列を転置したものである。また、式(1)の右辺は、左辺第1項の行列と、左辺第2項の行列の行列積とを計算したものである。式(1)の右辺の1列目は、右画像P1Rから抽出した1グリッド目の特徴量と左画像P1Lから抽出した特定の列の水平方向の各グリッドの特徴量の相関を表し、1行目は、左画像P1Lから抽出した1グリッド目の特徴量と右画像P1Rから抽出した特定の列の水平方向の各グリッドの特徴量の相関を表す。すなわち、式(1)の右辺は、左画像P1Lの各グリッドの特徴量と、右画像P1Rの各グリッドの特徴量との相関マップを示す。なお、式(1)において、添字「m」は各画像の水平方向のグリッドの位置を示し、添え字「n」は各グリッドにおける特徴量の番号を示す。すなわち、mは1~40であり、nは1~256である。 Next, the estimation unit 152 executes the process m shown in FIG. 12. First, the estimation unit 152 calculates the matrix product of the feature amount of a specific column extracted from the left image P1L and the feature amount of the same column extracted from the right image P1R, for example, by using formula (1). In formula (1), the first term on the left side indicates that the feature amounts l11 to l1n in the first grid in the horizontal direction of a specific column of the left image P1L are arranged in the row direction. On the other hand, in the second term on the left side of formula (1), the feature amounts r11 to r1n in the first grid in the horizontal direction of a specific column of the right image P1R are arranged in the column direction. In other words, the matrix in the second term on the left side is a transposition of a matrix in which the feature amounts r11 to r1m of the grid in the horizontal direction of a specific column of the right image P1R are arranged in the row direction. In addition, the right side of formula (1) is a calculation of the matrix product of the matrix in the first term on the left side and the matrix in the second term on the left side. The first column on the right side of equation (1) represents the correlation between the feature amount of the first grid extracted from the right image P1R and the feature amount of each grid in the horizontal direction of a specific column extracted from the left image P1L, and the first row represents the correlation between the feature amount of the first grid extracted from the left image P1L and the feature amount of each grid in the horizontal direction of a specific column extracted from the right image P1R. In other words, the right side of equation (1) represents a correlation map between the feature amount of each grid in the left image P1L and the feature amount of each grid in the right image P1R. Note that in equation (1), the subscript "m" indicates the horizontal grid position of each image, and the subscript "n" indicates the feature number in each grid. In other words, m is 1 to 40, and n is 1 to 256.
次に、推定部152は、算出された相関マップを用いて、行列(1)に示すような左画像P1Lに対する右画像P1RのマッチングマップMLを算出する。左画像P1Lに対する右画像P1RのマッチングマップMLは、例えば、相関マップの行方向に対してSoftmax関数を適用することにより算出される。これにより、水平方向の相関の値を正規化している。つまり、行方向の値をすべて合計すると1になるよう変換している。 Next, the estimation unit 152 uses the calculated correlation map to calculate a matching map ML of the right image P1R for the left image P1L as shown in matrix (1). The matching map ML of the right image P1R for the left image P1L is calculated, for example, by applying the Softmax function to the row direction of the correlation map. This normalizes the correlation value in the horizontal direction. In other words, the values in the row direction are converted so that the sum of all values is 1.
次に、推定部152は、算出されたマッチングマップMLに、例えば、式(2)により、右画像P1Rから抽出された特徴量を畳み込む。式(2)の左辺第1項は、行列(1)を転置したものであり、左辺第2項は、式(1)の左辺第2項の行列である。なお、本発明では、相関を取るための特徴量と、マッチングマップに畳み込むための特徴量とは同じものを用いているが、抽出された特徴量から畳み込みニューラルネットワーク等によって、新たに相関を取るための特徴量と畳み込むための特徴量を別々に生成しても良い。 Next, the estimation unit 152 convolves the feature quantities extracted from the right image P1R into the calculated matching map ML, for example, using equation (2). The first term on the left side of equation (2) is the transposed matrix (1), and the second term on the left side is the matrix of the second term on the left side of equation (1). Note that in the present invention, the feature quantities used for correlation and the feature quantities used for convolution into the matching map are the same, but new feature quantities for correlation and feature quantities for convolution may be generated separately from the extracted feature quantities using a convolutional neural network or the like.
次に、推定部152は式(2)で得られた特徴量を左画像P1Lから抽出された特徴量に連結させて、例え畳み込みニューラルネットワークによって新たな特徴量を生成する。このように、左右の画像の特徴量を統合することにより、位置、姿勢の推定精度が向上する。なお、図12における処理mは複数回繰り返しても良い。 Next, the estimation unit 152 generates new features by linking the features obtained by formula (2) to the features extracted from the left image P1L, for example, by using a convolutional neural network. In this way, by integrating the features of the left and right images, the estimation accuracy of the position and orientation is improved. Note that process m in FIG. 12 may be repeated multiple times.
次に、推定部152はここで得られた特徴量から、例えば畳み込みニューラルネットワークによって位置、姿勢およびクラス分類を推定する。あわせて、推定部152は、算出された相関マップを用いて、行列(2)に示すような右画像P1Rに対する左画像P1LのマッチングマップMRを算出する(ステップS202)。右画像P1Rに対する左画像P1LのマッチングマップMRも、左画像P1Lに対する右画像P1RのマッチングマップMLと同様に、例えば、相関マップの行方向に対してSoftmax関数を適用することにより算出される。 Next, the estimation unit 152 estimates the position, orientation, and class classification from the features obtained here, for example, by using a convolutional neural network. In addition, the estimation unit 152 uses the calculated correlation map to calculate a matching map MR of the left image P1L with respect to the right image P1R as shown in matrix (2) (step S202). The matching map MR of the left image P1L with respect to the right image P1R is also calculated, for example, by applying a Softmax function to the row direction of the correlation map, similar to the matching map ML of the right image P1R with respect to the left image P1L.
次に、推定部152は、算出されたマッチングマップに、例えば、式(3)により、左画像P1Lの特徴量を畳み込む。式(3)の左辺第1項は、行列(2)であり、左辺第2項は、式(1)の左辺第2項の行列の転置前のものである。 Next, the estimation unit 152 convolves the features of the left image P1L into the calculated matching map, for example, using equation (3). The first term on the left side of equation (3) is matrix (2), and the second term on the left side is the matrix of the second term on the left side of equation (1) before transposition.
次に推定部152は、あらかじめ設定しておいた閾値と、左画像P1Lから推定したターゲット(対象物)のクラス分類の推定結果が一番大きいグリッドを選択して比較する(ステップS203)。閾値をこえていなかった場合は、ターゲットが無いとして終了する。閾値をこえていた場合は、そのグリッドに対する右画像P1RとのマッチングマップMLから、一番大きい値のグリッドを選択する(ステップS204)。 The estimation unit 152 then selects and compares a preset threshold with the grid that has the largest estimated result of the class classification of the target (object) estimated from the left image P1L (step S203). If the threshold is not exceeded, it is determined that there is no target and the process ends. If the threshold is exceeded, the grid with the largest value is selected from the matching map ML with the right image P1R for that grid (step S204).
次に、選択したグリッドにおいて、右画像P1Rのターゲットのクラス分類の推定結果とあらかじめ設定しておいた閾値とを比較する(ステップS208)。閾値をこえていた場合は、そのグリッドに対する左画像P1LとのマッチングマップMLから一番大きい値のグリッドを選択する(ステップS209)。閾値を超えていない場合は、左画像P1Lの推定結果から選択したグリッドのクラス分類スコアを0にしてステップS203へ戻る(ステップS207)。 Next, for the selected grid, the estimated result of the class classification of the target in the right image P1R is compared with a preset threshold value (step S208). If the threshold value is exceeded, the grid with the largest value is selected from the matching map ML with the left image P1L for that grid (step S209). If the threshold value is not exceeded, the class classification score of the grid selected from the estimated result of the left image P1L is set to 0 and the process returns to step S203 (step S207).
次に、ステップS209にて選択したマッチングマップMLのグリッドと、ステップS204にて左画像P1Lの推定結果から選択したグリッドが等しいかを比較する(ステップS210)。グリッドが異なる場合は、ステップS204にて左画像P1Lの推定結果から選択したグリッドのクラス分類スコアを0にして、ステップS203のグリッドの選択に戻る(ステップS207)。最終的に、左画像P1Lおよび右画像P1Rで選択したグリッドの位置情報(例えば、図1における水平方向xの値)の検出結果から視差を算出する(ステップS211)。 Next, the grid of the matching map ML selected in step S209 is compared with the grid selected from the estimation result of the left image P1L in step S204 to see if they are equal (step S210). If the grids are different, the class classification score of the grid selected from the estimation result of the left image P1L in step S204 is set to 0, and the process returns to the selection of the grid in step S203 (step S207). Finally, the parallax is calculated from the detection results of the position information (e.g., the horizontal x value in Figure 1) of the grids selected in the left image P1L and the right image P1R (step S211).
次に、ステップS211から算出した視差をもとに、ターゲットの深度を算出する(ステップS212)。なお、複数のターゲットに対して深度を算出する場合は、ステップS211の後、左画像P1Lおよび右画像P1Rの推定結果から選択したグリッドのクラス分類スコアを0にしてからステップS203に戻り、以後、ステップS212までを繰り返せば良い。 Next, the depth of the target is calculated based on the parallax calculated in step S211 (step S212). Note that if the depth is to be calculated for multiple targets, after step S211, the class classification score of the grid selected from the estimation results of the left image P1L and the right image P1R is set to 0, and then the process returns to step S203, and thereafter, steps up to step S212 are repeated.
以上述べたように、画像処理装置10は、取得部と、推定部と、を備える。取得部は、バラ積みされたワークを撮影した第1の画像および第2の画像を取得する。推定部は、第1の画像の特徴量と、第2の画像の特徴量とのマッチングマップを生成し、第1の画像と第2の画像それぞれに対してターゲットとなる各ワークの位置と姿勢とクラス分類スコアを推定し、前記アテンションマップを用いたマッチング結果と位置の推定結果に基づいて、ワーク位置を推定することにより、ステレオカメラからワークまでの深度を算出する。これにより、物体認識における誤検出を抑制できる。
As described above, the
(画像処理の変形例)
以上、物体把持システム1について説明したが、上記の説明内容に限定されるものではなく、その趣旨を逸脱しない限りにおいて種々の変更が可能である。例えば、対象物(ワーク)が1種類である場合について説明したが、これに限られず、画像処理装置10が、複数のワークの種類を検出するような構成であってもよい。また、画像処理装置10は、対象物を検出するだけでなく、対象物が配置されたトレイ等の位置や姿勢をさらに検出してもよい。図13は、変形例に係るトレイを含むバラ積み画像の一例を示す図である。図13に示す例において、画像処理装置10は、対象物が配置されたトレイの位置および姿勢を特定することにより、ロボットアーム30がトレイに衝突しないような軌道を設定することができる。なお、検出する対象であるトレイは、障害物の一例である。画像処理装置10は、トレイ以外のその他の障害物となるものを検出するような構成であってもよい。
(Image Processing Variations)
The
また、画像処理装置10が、例えばバラ積み画像を40×40のグリッドに区分する例について説明したが、これに限られず、より細かな、あるいは、より粗いグリッドに区分して対象物を検出してもよく、また画素単位で推定処理を行ってもよい。これにより、画像処理装置10は、より精度よくカメラと対象物との距離を算出することができる。図14は、変形例に係る位置ずれ推定モデルの一例を示す図である。図14に示すように、画像処理装置10は、左画像P1Lと右画像P1Rのうち、推定位置周辺のグリッドよりもサイズが小さい部分を切り出して結合してもよい。そして、前述した推定処理と同様に推定処理を行い、処理結果に基づいて位置ずれを推定してもよい。
Also, while an example has been described in which the
また、細かな、あるいは、粗いグリッド単位や画素単位で推定処理を行う場合に、前述したのと同様に、左画像P1Lと右画像P1Rとで、それぞれ個別に推定処理を行ってもよい。図15は、変形例に係る位置ずれ推定モデルの別の一例を示す図である。図15に示す例では、画像処理装置10は、左画像P1Lと右画像P1Rとに対し、それぞれ別々に推定処理を行う。この場合においても、画像処理装置10は、前述したのと同様に、それぞれの推定処理を行う際に、左画像P1Lに対する重み付けを、右画像P1Rに対する重み付けと共有してもよい。
When performing estimation processing in fine or coarse grid units or pixel units, estimation processing may be performed separately for the left image P1L and the right image P1R, as described above. FIG. 15 is a diagram showing another example of a position shift estimation model according to a modified example. In the example shown in FIG. 15, the
また、以上述べた推定処理を、バラ積みされたワーク41、42の画像に対してではなく、ロボットアーム30や、ロボットアーム30に保持されたワーク41、42、または整列先に整列されたワーク41、42に対して行ってもよい。
The estimation process described above may also be performed on the
(対象物3次元データの取得および学習)
図16は、対象物3次元データの取得(測定)および学習のためのシステムの構成の一例を示すブロック図である。図16において、処理装置110と3次元データ測定装置140とは、ネットワークNWを通じて通信可能に接続されている。また、処理装置110は、通信I/F(インターフェース)111と、入力I/F112と、ディスプレイ113と、記憶回路114と、処理回路115とを備える。
(Acquisition and learning of 3D data of object)
Fig. 16 is a block diagram showing an example of the configuration of a system for acquiring (measuring) and learning three-dimensional data of an object. In Fig. 16, a
3次元データ測定装置140は、プロジェクタ120およびカメラ130と接続されている。3次元データ測定装置140は、通信I/F141と、入力I/F142と、ディスプレイ143と、記憶回路144と、処理回路145とを備える。
The three-dimensional data measuring device 140 is connected to the
プロジェクタ120は、可視光よりも波長の短い光(例えば、UV(紫外線)光)による所定のパターンの照射(投影)が可能であるとともに、可視光による照明が可能となっている。可視光による照明は、カメラ130がカラーカメラである場合には白色光による照明が行われ、カメラ130がモノクロカメラである場合は赤色光、青色光および緑色光のそれぞれによる照明が行われる。プロジェクタ120とは別に、可視光の照明装置が設けられるのでもよい。カメラ130は、可視光を撮影可能なカラーカメラまたはモノクロカメラである。
処理装置110において、通信I/F111は、ネットワークNWを通じた外部装置とのデータ入出力の通信を制御する。例えば、通信I/F111は、ネットワークカードやネットワークアダプタ、NIC(Network Interface Controller)等によって実現される。
In the
入力I/F112は、処理回路115に接続され、処理装置110の管理者(不図示)から受け付けた入力操作を電気信号に変換して処理回路115に出力する。例えば、入力I/F112は、スイッチボタン、マウス、キーボード、タッチパネル等である。
The input I/
ディスプレイ113は、処理回路115に接続され、処理回路115から出力される各種情報および各種画像データを表示する。例えば、ディスプレイ113は、液晶モニタやCRT(Cathode Ray Tube)モニタ、タッチパネル等によって実現される。 The display 113 is connected to the processing circuit 115 and displays various information and image data output from the processing circuit 115. For example, the display 113 is realized by a liquid crystal monitor, a CRT (Cathode Ray Tube) monitor, a touch panel, etc.
記憶回路114は、例えば、メモリ等の記憶装置により実現される。記憶回路114には、処理回路115により実行される各種のプログラムが記憶されている。また、記憶回路114には、処理回路115により各種のプログラムが実行される際に用いられる各種のデータが一時的に記憶される。記憶回路114は、対象物3次元データ1141と機械(深層)学習モデル1142とを有する。対象物3次元データ1141は、各種の対象物についての、3次元形状データとテクスチャデータとを含む。ここで言うテクスチャデータとは、RGB(Red,Green,Blue)の色データや、質感を表すメタル(反射)、ラフネス(表面粗さ)、透明度などである。また、取得対象となるテクスチャデータとしては、RGBの色データのみでもよいし、色と質感に関するデータのいずれかまたは両者を含むものでもよい。
The memory circuit 114 is realized by, for example, a storage device such as a memory. The memory circuit 114 stores various programs executed by the processing circuit 115. In addition, the memory circuit 114 temporarily stores various data used when the processing circuit 115 executes various programs. The memory circuit 114 has three-dimensional object data 1141 and a machine (deep)
さらに、機械(深層)学習モデル1142はニューラルネットワーク構造1142aと学習パラメータ1142bを備えている。ニューラルネットワーク構造1142aは、例えば、図5の畳み込みニューラルネットワークb1のような公知のネットワークを応用したもので、図12に示されるネットワーク構造である。学習パラメータ1142bは、例えば、畳み込みニューラルネットワークの畳み込みフィルタの重みであり、対象物の位置および姿勢を推定するために学習され、最適化されるパラメータである。
Furthermore, the machine (deep)
機械(深層)学習モデル1142は、物体把持システム1(図1、図2)において、カメラ20(図1、図2)から出力された画像から、ワークの位置および姿勢を推定する処理に用いられる。機械(深層)学習モデル1142は、例えば、複数のワークの位置および姿勢と、当該複数のワークを撮影した画像とを教師データして学習することにより生成される。なお、ここでは、機械(深層)学習モデル1142が、例えば、処理回路115により生成されるが、これに限られず、外部のコンピュータにより生成されてもよい。
The machine (deep)
処理回路115は、CPU(Central Processing Unit)等のプロセッサにより実現される。処理回路115は、処理装置110全体を制御する。処理回路115は、記憶回路114に記憶された各種のプログラムを読み取り、読み取ったプログラムを実行することで、各種の処理を実行する。例えば、処理回路115は、学習部1151と、データ出力部1152とを有することとなる。
The processing circuitry 115 is realized by a processor such as a CPU (Central Processing Unit). The processing circuitry 115 controls the
学習部1151は、対象物3次元データ1141(新たに3次元データ測定装置140により測定されて蓄積されたものと、過去に蓄積されたものとの両者を含む)に基づき、画像生成ソフトウェアによりバラ積みされたワークの画像を生成して機械学習の学習データを作成し、学習データに基づいて機械(深層)学習モデル1142の機械学習を行い、学習パラメータ1142bの更新を行う。
The
データ出力部1152は、操作者の指示または外部からの要求に応じ、記憶回路114に記憶された対象物3次元データ1141や機械(深層)学習モデル1142のデータを出力する。
The
3次元データ測定装置140において、通信I/F141は、ネットワークNWを通じた外部装置とのデータ入出力の通信を制御する。例えば、通信I/F141は、ネットワークカードやネットワークアダプタ、NIC等によって実現される。また、通信I/F141は、HDMI(登録商標)(High-Definition Multimedia Interface)等の規格に従ってプロジェクタ120に出力する制御信号を送信し、プロジェクタ120から状態信号を受信する。また、通信I/F141は、カメラ130に制御信号を送信し、カメラ130から出力される画像のデータを受信する。
In the three-dimensional data measuring device 140, the communication I/F 141 controls data input/output communication with external devices via the network NW. For example, the communication I/F 141 is realized by a network card, a network adapter, a NIC, etc. The communication I/F 141 also transmits control signals to be output to the
入力I/F142は、処理回路145に接続され、3次元データ測定装置140の管理者(不図示)から受け付けた入力操作を電気信号に変換して処理回路145に出力する。例えば、入力I/F142は、スイッチボタン、マウス、キーボード、タッチパネル等である。
The input I/
ディスプレイ143は、処理回路145に接続され、処理回路145から出力される各種情報および各種画像データを表示する。例えば、ディスプレイ143は、液晶モニタやCRTモニタ、タッチパネル等によって実現される。 The display 143 is connected to the processing circuit 145 and displays various information and image data output from the processing circuit 145. For example, the display 143 is realized by an LCD monitor, a CRT monitor, a touch panel, etc.
記憶回路144は、例えば、メモリ等の記憶装置により実現される。記憶回路144には、処理回路145により実行される各種のプログラムが記憶されている。また、記憶回路144には、処理回路145により各種のプログラムが実行される際に用いられる各種のデータが一時的に記憶される。記憶回路144は、対象物3次元データ1441を有する。対象物3次元データ1441は、処理装置110の記憶回路114に記憶される対象物3次元データ1141の一部についての元データであり、通信I/F141、ネットワークNW、処理装置110の通信I/F111を介して記憶回路114に蓄積される。
The
3次元データ測定装置140の処理回路145は、CPU等のプロセッサにより実現される。処理回路145は、3次元データ測定装置140全体を制御する。処理回路145は、記憶回路144に記憶された各種のプログラムを読み取り、読み取ったプログラムを実行することで、各種の処理を実行する。例えば、処理回路145は、対象物3次元データ測定部1451を有することとなる。
The processing circuitry 145 of the three-dimensional data measuring device 140 is realized by a processor such as a CPU. The processing circuitry 145 controls the entire three-dimensional data measuring device 140. The processing circuitry 145 reads various programs stored in the
対象物3次元データ測定部1451は、通信I/F141を通じて、プロジェクタ120およびカメラ130を制御し、カメラ130により撮影された対象物の画像から3次元形状とテクスチャとを計測し、3次元形状データとテクスチャデータとを含む対象物3次元データを取得する。対象物の3次元形状の測定は、例えば、公知の格子法等により、対象物への所定のパターンの照射および撮影により得られた画像に基づいて行われる。対象物の3次元形状の測定は、対象物の姿勢を変更しながら行われる。
Three-dimensional object
図17は、対象物3次元データの取得の処理の一例を示すフローチャートであり、撮影がカラーのカメラ130により行われる場合の処理例である。処理に際しての事前の準備として、対象物に所定の塗料を塗布しておく。所定の塗料としては、可視光よりも波長の短い光(例えば、UV(紫外線)光)の照射を受けると可視光による発光を行い、可視光に対しては無色透明となる蛍光塗料である。これは、インビジブル塗料と呼ぶこともできる。なお、以下では可視光よりも波長の短い光をUV光として説明するが、それに限られない。例えば、2光子励起により可視光よりも波長の短い光を発生させることができ、それをパターン光の照射に用いることができる。
Figure 17 is a flow chart showing an example of the process of acquiring three-dimensional data of an object, and is an example of the process when the image is captured by a
図17において、3次元データ測定装置140は、処理を開始すると、プロジェクタ120により対象物に向けてUVパターンを照射する。そして、プロジェクタ120と所定の位置関係にあるカメラ130により対象物の撮影を行い、撮影された画像に基づいて対象物の3次元形状を算出し、記憶回路に記憶する(ステップS11)。図18は、対象物Wにプロジェクタ120からUVパターンが照射された状態の例を示す図であり、プロジェクタ120からのUV光の照射により対象物Wがインビジブル塗料により所定のパターンで発光し、その状態がカメラ130により撮影される。可視光での発光はインビジブル塗料によるものであるため、対象物Wが光沢物であったり黒色物体であったりしても問題はない。
In FIG. 17, when the three-dimensional data measuring device 140 starts processing, it irradiates a UV pattern toward the object using the
図17に戻り、対象物の3次元形状の算出(ステップS11)は、2つ目以降のUVパターンの照射が行われた後は、以前のUVパターン下で撮影された画像も考慮して行われる。これにより、3次元形状の測定の精度が高められる。また、UVパターンの照射時に撮影だけが行われ、全てのUVパターンについて撮影が完了した後に、撮影された全ての画像に基づいて対象物の3次元形状の算出が行われるようにしてもよい。また、UVパターンの照射および撮影の際にはそのUVパターン下で撮影された画像についてだけの処理が行われ、全てのUVパターンについて撮影が完了した後に、全画像を考慮した算出が行われるようにしてもよい。 Returning to FIG. 17, after the second or subsequent UV patterns have been irradiated, the calculation of the three-dimensional shape of the object (step S11) is performed taking into account the images captured under the previous UV patterns. This improves the accuracy of the measurement of the three-dimensional shape. Alternatively, only image capture may be performed when the UV pattern is irradiated, and after image capture has been completed for all UV patterns, the three-dimensional shape of the object may be calculated based on all the captured images. Alternatively, when the UV pattern is irradiated and captured, processing may be performed only on the images captured under that UV pattern, and after image capture has been completed for all UV patterns, calculation may be performed taking into account all the images.
次いで、3次元データ測定装置140は、所定のUVパターンについて処理が完了したか否か判断し(ステップS12)、完了していないと判断した場合(ステップS12のNo)は、別のUVパターンの照射等(ステップS11)から繰り返す。所定のUVパターンについて処理が完了したと判断した場合(ステップS12のYes)は、次の処理に移行する。 The three-dimensional data measuring device 140 then determines whether processing for the specified UV pattern has been completed (step S12), and if it determines that processing has not been completed (No in step S12), it repeats the process from irradiating another UV pattern (step S11). If it determines that processing for the specified UV pattern has been completed (Yes in step S12), it moves on to the next process.
3次元データ測定装置140は、次の処理として、プロジェクタ120または外部光源により対象物に向けて白色光を照射し、カメラ130により撮影を行い、撮影された画像に基づいてテクスチャを取得して記憶回路に記憶する(ステップS13)。図19は、対象物Wに可視光が照射された状態の例を示す図であり、プロジェクタ120からの白色光の照射により対象物Wのインビジブル塗料は無色透明となり、対象物W本来のテクスチャが表れており、その状態がカメラ130により撮影される。
As the next process, the three-dimensional data measuring device 140 irradiates the object with white light from the
また、UVパターンの照射による撮影から対象物は移動していないと推定できるため、UVパターン下で撮影された画像から取得された対象物の3次元形状とテクスチャとのマッチングは容易に行うことができる。 In addition, since it can be assumed that the object is not moving based on the image captured under the UV pattern, it is easy to match the three-dimensional shape and texture of the object obtained from the image captured under the UV pattern.
次いで、図17に戻り、3次元データ測定装置140は、姿勢変更後の2回目以降の処理において、点群データマッチングを行い、データ更新を行う(ステップS14)。すなわち、3次元データ測定装置140は、以前の処理で取得された対象物の3次元形状のデータと今回の処理で取得された対象物の3次元形状のデータとから、同一の部分と判断できる部分に基づいてデータを連結し、対象物の3次元形状のデータを更新していく。これにより、一方の側からの撮影だけでは捉えられない対象物の3次元形状を取得することができる。 Returning to FIG. 17, the three-dimensional data measuring device 140 performs point cloud data matching and updates the data in the second and subsequent processes after the posture change (step S14). That is, the three-dimensional data measuring device 140 links the data of the three-dimensional shape of the object acquired in the previous process and the data of the three-dimensional shape of the object acquired in the current process based on parts that can be determined to be identical, and updates the data of the three-dimensional shape of the object. This makes it possible to obtain the three-dimensional shape of the object that cannot be captured by photographing only from one side.
次いで、3次元データ測定装置140は、対象物の全ての外観をカバーする所定の姿勢について処理が完了したか否か判断し(ステップS15)、完了していないと判断した場合(ステップS15のNo)は、対象物の姿勢変更を行い(ステップS16)、UVパターンの照射等(ステップS11)から繰り返す。対象物の姿勢変更は操作者の手動によるものであってもよいし、駆動機構によるものであってもよい。3次元データ測定装置140は、所定の姿勢について処理が完了したと判断した場合(ステップS15のYes)は、処理を終了する。 The three-dimensional data measuring device 140 then determines whether processing has been completed for the specified orientations that cover the entire appearance of the object (step S15), and if it determines that processing has not been completed (No in step S15), it changes the orientation of the object (step S16) and repeats the process from irradiation of the UV pattern (step S11). The orientation of the object may be changed manually by an operator or by a drive mechanism. If the three-dimensional data measuring device 140 determines that processing has been completed for the specified orientations (Yes in step S15), it ends the process.
図20は、対象物3次元データの取得の処理の別の一例を示すフローチャートであり、撮影がモノクロのカメラ130により行われる場合の処理例である。処理に際しての事前の準備は前述したものと同様である。
Figure 20 is a flowchart showing another example of the process for acquiring three-dimensional data of an object, and is a processing example in which the image is captured by a
図20において、3次元データ測定装置140は、処理を開始すると、プロジェクタ120により対象物に向けてUVパターンを照射する。そして、プロジェクタ120と所定の位置関係にあるカメラ130により対象物の撮影を行い、撮影された画像に基づいて対象物の3次元形状を算出し、記憶回路に記憶する(ステップS21)。対象物の3次元形状の算出は、2つ目以降のUVパターンの照射が行われた後は、以前のUVパターン下で撮影された画像も考慮して行われる。なお、UVパターンの照射時に撮影だけが行われ、全てのUVパターンについて撮影が完了した後に、撮影された全ての画像に基づいて対象物の3次元形状の算出が行われるようにしてもよい。また、UVパターンの照射および撮影の際にはそのUVパターン下で撮影された画像についてだけの処理が行われ、全てのUVパターンについて撮影が完了した後に、全画像を考慮した算出が行われるようにしてもよい。
In FIG. 20, when the three-dimensional data measuring device 140 starts processing, the
次いで、3次元データ測定装置140は、所定のUVパターンについて処理が完了したか否か判断し(ステップS22)、完了していないと判断した場合(ステップS22のNo)は、別のUVパターンの照射等(ステップS21)から繰り返す。所定のUVパターンについて処理が完了したと判断した場合(ステップS22のYes)は、次の処理に移行する。 The three-dimensional data measuring device 140 then determines whether processing for the specified UV pattern has been completed (step S22), and if it determines that processing has not been completed (No in step S22), it repeats the process from irradiating another UV pattern (step S21). If it determines that processing for the specified UV pattern has been completed (Yes in step S22), it moves on to the next process.
3次元データ測定装置140は、次の処理として、プロジェクタ120または外部光源により対象物に向けて赤色光を照射し、カメラ130により撮影を行い、撮影された画像に基づいてテクスチャの赤色成分を取得して記憶回路に記憶する(ステップS23)。UVパターンの照射による撮影から対象物は移動していないと推定できるため、UVパターン下で撮影された画像から取得された対象物の3次元形状とテクスチャとのマッチングは容易に行うことができる。
As the next process, the three-dimensional data measuring device 140 irradiates the object with red light from the
次いで、3次元データ測定装置140は、プロジェクタ120または外部光源により対象物に向けて青色光を照射し、カメラ130により撮影を行い、撮影された画像に基づいてテクスチャの青色成分を取得して記憶回路に記憶する(ステップS24)。
Next, the three-dimensional data measuring device 140 irradiates the object with blue light from the
次いで、3次元データ測定装置140は、プロジェクタ120または外部光源により対象物に向けて緑色光を照射し、カメラ130により撮影を行い、撮影された画像に基づいてテクスチャの緑色成分を取得して記憶回路に記憶する(ステップS25)。
Next, the three-dimensional data measuring device 140 irradiates the target with green light from the
次いで、3次元データ測定装置140は、姿勢変更後の2回目以降の処理において、点群データマッチングを行い、データ更新を行う(ステップS26)。すなわち、3次元データ測定装置140は、以前の処理で取得された対象物の3次元形状のデータと今回の処理で取得された対象物の3次元形状のデータとから、同一の部分と判断できる部分に基づいてデータを連結し、対象物の3次元形状のデータを更新していく。 Next, in the second or subsequent processing after the posture change, the three-dimensional data measuring device 140 performs point cloud data matching and updates the data (step S26). That is, the three-dimensional data measuring device 140 links the data of the three-dimensional shape of the object acquired in the previous processing and the data of the three-dimensional shape of the object acquired in the current processing based on parts that can be determined to be identical, and updates the data of the three-dimensional shape of the object.
次いで、3次元データ測定装置140は、対象物の全ての外観をカバーする所定の姿勢について処理が完了したか否か判断し(ステップS27)、完了していないと判断した場合(ステップS27のNo)は、対象物の姿勢変更を行い(ステップS28)、UVパターンの照射等(ステップS21)から繰り返す。対象物の姿勢変更は操作者の手動によるものであってもよいし、駆動機構によるものであってもよい。3次元データ測定装置140は、所定の姿勢について処理が完了したと判断した場合(ステップS27のYes)は、処理を終了する。 Then, the three-dimensional data measuring device 140 judges whether the processing has been completed for the specified orientations that cover the entire appearance of the object (step S27), and if it is judged not to be completed (No in step S27), it changes the orientation of the object (step S28) and repeats the process from irradiation of the UV pattern, etc. (step S21). The orientation of the object may be changed manually by the operator or by a drive mechanism. If the three-dimensional data measuring device 140 judges that the processing has been completed for the specified orientations (Yes in step S27), it ends the process.
図21は、学習データの生成および学習処理の一例を示すフローチャートである。以下では、図16に示された処理装置110により学習モデルが生成および更新される場合について説明するが、これに限られず、図示しない他のコンピュータにより行われるものでもよい。
Figure 21 is a flowchart showing an example of the generation of learning data and the learning process. Below, a case where the learning model is generated and updated by the
図21に示すように、処理装置110は、対象物3次元データ1141から所望の対象物の3次元データを取得する(ステップS101)。図22は、対象物の3次元データの一例を示す図である。3次元データを取得することにより、仮想空間上において、ワークの姿勢を任意に変更して配置させることができる。
As shown in FIG. 21, the
次に、図21に戻り、処理装置110は、仮想空間上に、対象物を配置する際の各種条件を設定する(ステップS102)。仮想空間への対象物の配置は、例えば公知の画像生成ソフトウェア等を用いて行うことができる。配置する対象物の数や位置、姿勢などの条件は、画像生成ソフトウェアがランダムに対象物を生成するように設定することも可能だが、これに限らず、処理装置110の管理者が任意に設定してもよい。
Returning to FIG. 21, the
次に、処理装置110は、設定された条件に従い、仮想空間上に対象物を配置する(ステップS103)。次に、処理装置110は、例えば、複数の対象物が配置された仮想空間をキャプチャすることにより、配置された対象物の画像、位置および姿勢を取得する(ステップS104)。ここでは、対象物の位置および姿勢は、例えば3次元座標(x,y,z)により示され、対象物の姿勢は、物体の姿勢または回転状態を表す四元数であるクオタニオン(qx,qy,qz,qw)により示される。
Next, the
図23は、複数の対象物が配置された仮想空間のキャプチャ画像の一例を示す図である。図23に示すように、仮想空間上には、複数の対象物W1aおよびW1bが、それぞれランダムな位置および姿勢にて配置される。また、以下において、ランダムに配置された対象物の画像を、「バラ積み画像」と表記する場合がある。次に、処理装置110は、取得された画像と、配置された対象物の位置および姿勢を記憶回路14に保存する(ステップS105)。さらに、処理装置110は、ステップS102からステップS105をあらかじめ定められた回数繰り返す(ステップS106)。なお、ここで記憶回路114に保存される、上記ステップによって取得された画像と対象物が配置された位置および姿勢との組み合わせを「教師データ」と表記する場合がある。ステップS102からステップS105までの処理を所定の回数繰り返すことにより、学習処理を繰り返し行うために十分な数の教師データが生成される。
23 is a diagram showing an example of a captured image of a virtual space in which multiple objects are arranged. As shown in FIG. 23, multiple objects W1a and W1b are arranged in a virtual space at random positions and orientations. In addition, hereinafter, an image of randomly arranged objects may be referred to as a "randomly piled image". Next, the
そして、処理装置110は、生成された教師データを用いて所定の回数学習処理を行うことにより、ニューラルネットワーク構造1142aにおいて重み付けとして用いられる学習パラメータ1142bを生成し、または更新する(ステップS107)。このように、3次元データが取得された対象物を仮想空間上に配置することにより、学習処理に用いられる、対象物の画像と、位置および姿勢の組み合わせとを含む教師データを、容易に生成することができる。
The
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、その趣旨を逸脱しない限りにおいて種々の変更が可能である。 Although the embodiment of the present invention has been described above, the present invention is not limited to the above embodiment, and various modifications are possible without departing from the spirit of the present invention.
以上のように、実施形態に係る対象物3次元データ測定方法は、可視光よりも波長の短い光の照射を受けると可視光による発光を行い、可視光に対しては無色透明の塗料が塗布された対象物に対し、所定のパターンによる可視光よりも波長の短い光の照射を行って、対象物を撮影し、撮影された画像から対象物の3次元形状を測定する第1の工程と、対象物に対し、可視光の照射を行って、対象物を撮影し、撮影された画像から対象物のテクスチャを測定する第2の工程とを備える。これにより、実際の対象物から3次元形状とテクスチャとを含む対象物3次元データを容易に測定することができる。 As described above, the object 3D data measurement method according to the embodiment includes a first step of irradiating an object coated with a colorless and transparent paint that emits visible light when irradiated with light having a shorter wavelength than visible light in a predetermined pattern, photographing the object, and measuring the 3D shape of the object from the photographed image, and a second step of irradiating the object with visible light, photographing the object, and measuring the texture of the object from the photographed image. This makes it possible to easily measure 3D object data including the 3D shape and texture from the actual object.
また、第1の工程では、対象物の一つの姿勢に対して所定のパターンを複数切り替えて対象物の3次元形状を測定する。これにより、3次元形状の測定の精度を高めることができる。 In addition, in the first process, the three-dimensional shape of the object is measured by switching between multiple predetermined patterns for one posture of the object. This can improve the accuracy of the measurement of the three-dimensional shape.
また、対象物の姿勢を変更し、第1の工程による対象物の3次元形状の測定と第2の工程による対象物のテクスチャの測定とを繰り返し、点群データマッチングによりデータを連結して更新する。これにより、一方の側からの撮影だけでは捉えられない対象物の3次元形状を取得することができる。 In addition, the posture of the object is changed, and the measurement of the object's three-dimensional shape in the first process and the measurement of the object's texture in the second process are repeated, linking and updating the data through point cloud data matching. This makes it possible to obtain the three-dimensional shape of the object that cannot be captured by photographing only from one side.
また、第2の工程では、撮影をカラーカメラで行う場合は白色光の照射と撮影とを行い、撮影をモノクロカメラで行う場合は赤色光、青色光および緑色光のそれぞれの照射と撮影とを行う。これにより、カラーカメラとモノクロカメラとに柔軟に対応することができる。 In addition, in the second step, if the image is captured using a color camera, white light is irradiated and the image is captured, and if the image is captured using a monochrome camera, red light, blue light, and green light are irradiated and the image is captured. This allows for flexible compatibility with both color and monochrome cameras.
また、実施形態に係る対象物3次元データ測定装置は、可視光よりも波長の短い光の照射を受けると可視光による発光を行い、可視光に対しては無色透明の塗料が塗布された対象物に対し、所定のパターンによる可視光よりも波長の短い光の照射を行って、対象物を撮影し、撮影された画像から対象物の3次元形状を測定する第1の処理と、対象物に対し、可視光の照射を行って、対象物を撮影し、撮影された画像から対象物のテクスチャを測定する第1の処理とを処理回路が実行する。これにより、上記の対象物3次元データ測定方法を装置として実現することができる。 In addition, the object 3D data measuring device according to the embodiment emits visible light when irradiated with light having a shorter wavelength than visible light, and the processing circuit executes a first process of irradiating an object coated with a colorless and transparent paint with light having a shorter wavelength than visible light in a predetermined pattern, photographing the object, and measuring the 3D shape of the object from the photographed image, and a second process of irradiating the object with visible light, photographing the object, and measuring the texture of the object from the photographed image. This makes it possible to realize the above-mentioned object 3D data measuring method as a device.
また、実施形態に係る学習データ生成方法は、上記の対象物3次元データ測定方法により得られた対象物3次元データに基づき、画像生成ソフトウェアによりバラ積みされたワークの画像を生成し、機械学習の学習データとする。これにより、学習データの準備に要するコストを低減させることができる。 In addition, the learning data generation method according to the embodiment generates images of randomly piled workpieces using image generation software based on the three-dimensional data of the object obtained by the above-mentioned three-dimensional data measurement method of the object, and uses these images as learning data for machine learning. This reduces the cost required for preparing the learning data.
また、実施形態に係る学習データ生成装置は、上記の対象物3次元データ測定方法により得られた対象物3次元データに基づき、画像生成ソフトウェアによりバラ積みされたワークの画像を生成し、機械学習の学習データとする処理を処理回路が実行する。これにより、上記の学習データ生成方法を装置として実現することができる。 In addition, the learning data generation device according to the embodiment uses image generation software to generate images of randomly piled workpieces based on the three-dimensional data of the object obtained by the above-mentioned method for measuring three-dimensional data of the object, and the processing circuit executes processing to use the images as learning data for machine learning. This allows the above-mentioned learning data generation method to be realized as a device.
また、上記実施の形態により本発明が限定されるものではない。上述した各構成要素を適宜組み合わせて構成したものも本発明に含まれる。また、さらなる効果や変形例は、当業者によって容易に導き出すことができる。よって、本発明のより広範な態様は、上記の実施の形態に限定されるものではなく、様々な変更が可能である。 Furthermore, the present invention is not limited to the above-mentioned embodiment. The present invention also includes configurations in which the above-mentioned components are appropriately combined. Furthermore, further effects and modifications can be easily derived by those skilled in the art. Therefore, the broader aspects of the present invention are not limited to the above-mentioned embodiment, and various modifications are possible.
110 処理装置,114 記憶回路,1141 対象物3次元データ,1142 機械(深層)学習モデル,1142a ニューラルネットワーク構造,1142b 学習パラメータ,115 処理回路,1151 学習部,1152 データ出力部,120 プロジェクタ,130 カメラ,140 3次元データ測定装置,144 記憶回路,1441 対象物3次元データ,145 処理回路,1451 対象物3次元データ測定部,W 対象物 110 Processing device, 114 Memory circuit, 1141 Object 3D data, 1142 Machine (deep) learning model, 1142a Neural network structure, 1142b Learning parameters, 115 Processing circuit, 1151 Learning unit, 1152 Data output unit, 120 Projector, 130 Camera, 140 3D data measuring device, 144 Memory circuit, 1441 Object 3D data, 145 Processing circuit, 1451 Object 3D data measuring unit, W Object
Claims (6)
前記対象物に対し、可視光の照射を行って、前記対象物を撮影し、撮影された画像から前記対象物のテクスチャを測定する第2の工程と、
を備える対象物3次元データ測定方法。 a first step of irradiating a target object, which emits visible light when irradiated with light having a wavelength shorter than that of visible light and is coated with a colorless and transparent paint that is irradiated with light having a wavelength shorter than that of visible light in a predetermined pattern, photographing the target object, and measuring a three-dimensional shape of the target object from the photographed image;
a second step of irradiating the object with visible light, photographing the object, and measuring a texture of the object from the photographed image;
A method for measuring three-dimensional data of an object, comprising:
請求項1に記載の対象物3次元データ測定方法。 In the first step, a three-dimensional shape of the object is measured by switching among a plurality of the predetermined patterns for one posture of the object.
2. The method for measuring three-dimensional data of an object according to claim 1.
請求項1または2に記載の対象物3次元データ測定方法。 changing the posture of the object, repeating the measurement of the three-dimensional shape of the object in the first step and the measurement of the texture of the object in the second step, and linking and updating the data by point cloud data matching;
3. The method for measuring three-dimensional data of an object according to claim 1 or 2.
請求項1~3のいずれか一つに記載の対象物3次元データ測定方法。 In the second step, when the photographing is performed with a color camera, white light is irradiated and photographed, and when the photographing is performed with a monochrome camera, red light, blue light, and green light are irradiated and photographed, respectively.
The method for measuring three-dimensional data of an object according to any one of claims 1 to 3.
学習データ生成方法。 Based on the three-dimensional data of the object obtained by the method for measuring three-dimensional data of the object according to claim 1, an image of the randomly piled workpieces is generated by image generation software, and the generated image is used as learning data for machine learning.
Training data generation method.
学習データ生成装置。 A processing circuit executes a process of generating an image of the randomly piled workpieces using image generation software based on the object three-dimensional data obtained by the object three-dimensional data measuring method according to claim 1, and using the image as learning data for machine learning.
Training data generation device.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020046409A JP7474083B2 (en) | 2020-03-17 | 2020-03-17 | Method for measuring three-dimensional data of an object, method for generating training data, and training data generating device |
| PCT/JP2021/009821 WO2021187316A1 (en) | 2020-03-17 | 2021-03-11 | Object three-dimensional data measurement method, object three-dimensional data measurement device, learning data generation method, and learning data generation device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020046409A JP7474083B2 (en) | 2020-03-17 | 2020-03-17 | Method for measuring three-dimensional data of an object, method for generating training data, and training data generating device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021148493A JP2021148493A (en) | 2021-09-27 |
| JP7474083B2 true JP7474083B2 (en) | 2024-04-24 |
Family
ID=77851186
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020046409A Active JP7474083B2 (en) | 2020-03-17 | 2020-03-17 | Method for measuring three-dimensional data of an object, method for generating training data, and training data generating device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7474083B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7523806B2 (en) * | 2021-11-25 | 2024-07-29 | 株式会社Arcana製作所 | 3D Scanning Method |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002027501A (en) | 2000-07-10 | 2002-01-25 | Fuji Xerox Co Ltd | Three-dimensional image pickup device and method |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6063404A (en) * | 1983-09-17 | 1985-04-11 | Nuclear Fuel Ind Ltd | Shape examining device |
-
2020
- 2020-03-17 JP JP2020046409A patent/JP7474083B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002027501A (en) | 2000-07-10 | 2002-01-25 | Fuji Xerox Co Ltd | Three-dimensional image pickup device and method |
Non-Patent Citations (1)
| Title |
|---|
| YAKAHASHI Kuniyuki, YONEKURA Kenta,Invisible Marker: Automatic Annotation for Object Manipulation,arXiv,Cornell University,2019年09月27日,https://arxiv.org/abs/1909.12493v1 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021148493A (en) | 2021-09-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101650799B1 (en) | Method for the real-time-capable, computer-assisted analysis of an image sequence containing a variable pose | |
| JP4492654B2 (en) | 3D measuring method and 3D measuring apparatus | |
| US10706584B1 (en) | Hand tracking using a passive camera system | |
| JP3624353B2 (en) | Three-dimensional shape measuring method and apparatus | |
| CN112652016A (en) | Point cloud prediction model generation method, pose estimation method and device | |
| CN106413510A (en) | Image processing device and image processing method | |
| WO2010004466A1 (en) | Three dimensional mesh modeling | |
| WO2021085561A1 (en) | Training data generation method | |
| CN112614231B (en) | Information display method and information display system | |
| CN107680125A (en) | The system and method that three-dimensional alignment algorithm is automatically selected in vision system | |
| JP2017144498A (en) | Information processor, control method of information processor, and program | |
| JP2020021212A (en) | Information processing device, information processing method, and program | |
| JP7474083B2 (en) | Method for measuring three-dimensional data of an object, method for generating training data, and training data generating device | |
| JP2002008012A (en) | Method of calculating position and orientation of target object and method of calculating position and orientation of observation camera | |
| JP2009175012A (en) | Measuring device and measuring method | |
| CN114979618A (en) | Measurement system and recording medium having measurement program recorded thereon | |
| JP7319891B2 (en) | Image processing device and image processing method | |
| KR101021015B1 (en) | 3D user interface method | |
| JP7724056B2 (en) | How to generate data for machine learning | |
| WO2021187316A1 (en) | Object three-dimensional data measurement method, object three-dimensional data measurement device, learning data generation method, and learning data generation device | |
| CN119991791A (en) | Method, hardware and application for eliminating mirror reflection interference in VR positioning | |
| US12586242B2 (en) | Method, system, and computer program for recognizing position and attitude of object imaged by camera | |
| JP7356867B2 (en) | gripping device | |
| US12620121B2 (en) | Method of recognizing position and attitude of object, and non-transitory computer-readable storage medium | |
| CN115661247B (en) | Real-time 6DoF algorithm precision measurement method and device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230224 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240109 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240308 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240402 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240412 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7474083 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |