Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6124566B2 - 画像認識方法および画像認識装置 - Google Patents
[go: Go Back, main page]

JP6124566B2 - 画像認識方法および画像認識装置 - Google Patents

画像認識方法および画像認識装置 Download PDF

Info

Publication number
JP6124566B2
JP6124566B2 JP2012260886A JP2012260886A JP6124566B2 JP 6124566 B2 JP6124566 B2 JP 6124566B2 JP 2012260886 A JP2012260886 A JP 2012260886A JP 2012260886 A JP2012260886 A JP 2012260886A JP 6124566 B2 JP6124566 B2 JP 6124566B2
Authority
JP
Japan
Prior art keywords
image
feature
feature point
dog
recognition method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012260886A
Other languages
English (en)
Other versions
JP2014106856A (ja
Inventor
修一 榎田
修一 榎田
俊朗 江島
俊朗 江島
雄大 市野
雄大 市野
央 出口
央 出口
智之 堀内
智之 堀内
寿之 河野
寿之 河野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyushu Institute of Technology NUC
Yaskawa Electric Corp
Original Assignee
Kyushu Institute of Technology NUC
Yaskawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyushu Institute of Technology NUC, Yaskawa Electric Corp filed Critical Kyushu Institute of Technology NUC
Priority to JP2012260886A priority Critical patent/JP6124566B2/ja
Publication of JP2014106856A publication Critical patent/JP2014106856A/ja
Application granted granted Critical
Publication of JP6124566B2 publication Critical patent/JP6124566B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

この発明は、画像認識方法および画像認識装置に関する。
従来、予め登録された登録画像から識別器を作成し、作成された識別器を用いて入力された新規画像の属性を判定して、画像を認識する画像認識方法が知られている(たとえば、特許文献1参照)。上記特許文献1では、予め登録された登録画像(たとえばワークの画像)を部分画像に分解し、部分画像上の任意の2点の輝度差が特徴量として抽出され、登録画像が学習される。そして、学習された登録画像(部分画像)と、入力された新規画像(たとえばワークの画像)の部分画像とのマッチングに基づいて、新規画像の認識(たとえばワークの位置や姿勢の認識)が行われるように構成されている。なお、特徴量として部分画像上の任意の2点の輝度差を用いる場合、この特徴量が部分画像の回転に対して不変でないため、予め登録された登録画像に、光軸(ワークを撮影するレンズに垂直な軸)周りにワークを回転させた画像を含めておく必要がある。
特開2011−22991号公報
しかしながら、上記特許文献1に記載の画像認識方法では、ワークの位置や姿勢を求めるために、光軸周りにワークを回転させた画像(所定の角度毎に回転させたワークの画像)が必要になるため、その分、予め登録された登録画像の数が増大し、入力された新規画像の認識(登録画像と新規画像とのマッチング)に時間がかかるという問題点がある。
この発明は、上記のような課題を解決するためになされたものであり、この発明の1つの目的は、画像の認識に時間がかかるのを抑制することが可能な画像認識方法および画像認識装置を提供することである。
上記目的を達成するために、第1の局面による画像認識方法は、学習画像に対して複数の特徴点を抽出するステップと、抽出された特徴点に対して、回転不変な特徴量を用いて特徴量を算出するステップと、算出された学習画像の特徴点の特徴量に基づいて、特徴点の属性を判定するための識別器を作成するステップと、推定画像に対して複数の特徴点を抽出するステップと、識別器を用いて抽出された推定画像の複数の特徴点の属性を集約して推定対象の位置を判定して、推定画像を認識するステップとを備える。
この第1の局面による画像認識方法では、上記のように、抽出された特徴点に対して、回転不変な特徴量を用いて特徴量を算出するステップを備えることによって、回転不変でない特徴量を用いて特徴点の特徴量が抽出される場合と異なり、所定の角度毎に回転した学習画像を学習する必要がない。すなわち、回転不変でない特徴量に基づいて、特徴点の属性を判定するための識別器を作成する場合と比べて、より少ない学習画像から識別器を作成することができるので、識別器を用いて推定画像の特徴点の属性を判定する際に、推定画像の特徴点とマッチングされる学習画像の特徴点の数を少なくすることができ、その分、計算量を少なくすることができる。その結果、画像の認識に時間がかかるのを抑制することができる。
第2の局面による画像認識装置は、学習画像に対して複数の特徴点を抽出する第1特徴点抽出手段と、抽出された特徴点に対して、回転不変な特徴量を用いて特徴量を算出する特徴量算出手段と、算出された学習画像の特徴点の特徴量に基づいて、特徴点の属性を判定するための識別器を作成する識別器作成手段と、推定画像に対して複数の特徴点を抽出する第2特徴点抽出手段と、識別器を用いて抽出された推定画像の複数の特徴点の属性を集約して推定対象の位置を判定して、推定画像を認識する認識手段とを備える。


この第2の局面による画像認識装置では、上記のように、抽出された特徴点に対して、回転不変な特徴量を用いて特徴量を算出する特徴量算出手段を備えることによって、回転不変でない特徴量を用いて特徴点の特徴量が抽出される場合と異なり、所定の角度毎に回転した学習画像を学習する必要がない。すなわち、回転不変でない特徴量に基づいて、特徴点の属性を判定するための識別器を作成する場合と比べて、より少ない学習画像から識別器を作成することができるので、識別器を用いて推定画像の特徴点の属性を判定する際に、推定画像の特徴点とマッチングされる学習画像の特徴点の数を少なくすることができ、その分、計算量を少なくすることができる。その結果、画像の認識に時間がかかるのを抑制することが可能な画像認識装置を提供することができる。
上記のように構成することによって、画像の認識に時間がかかるのを抑制することができる。
本発明の一実施形態によるロボットシステムの全体図である。 本発明の一実施形態によるロボットシステムのブロック図である。 本発明の一実施形態による画像認識方法の学習時のフロー図である。 本発明の一実施形態による画像認識方法の分類木の概念図である。 本発明の一実施形態による画像認識方法の推定時のフロー図である。 本発明の一実施形態による画像認識方法の推定時の概念図である。 本発明の一実施形態による画像認識方法を用いて行った実験1におけるワークの斜視図である。 本発明の一実施形態による画像認識方法を用いて行った実験1における学習画像を示す図である。 本発明の一実施形態による画像認識方法を用いて行った実験1における推定シーン(バラ積みされたワーク)を示す図である。 本発明の一実施形態による画像認識方法を用いて行った実験1における推定時の投票面(投票結果)を示す図である。 本発明の一実施形態による画像認識方法を用いて行った実験2におけるワークの斜視図である。 本発明の一実施形態による画像認識方法を用いて行った実験2における学習画像(ワークの表面)を示す図である。 本発明の一実施形態による画像認識方法を用いて行った実験2における学習画像(ワークの裏面)を示す図である。 本発明の一実施形態による画像認識方法を用いて行った実験2における推定シーン(バラ積みされたワーク)を示す図である。 本発明の一実施形態による画像認識方法を用いて行った実験2におけるワークの表面の推定時の投票面(投票結果)を示す図である。 本発明の一実施形態による画像認識方法を用いて行った実験2におけるワークの裏面の推定時の投票面(投票結果)を示す図である。
以下、本実施形態を図面に基づいて説明する。
まず、図1および図2を参照して、本実施形態によるロボットシステム100の構成について説明する。
図1および図2に示すように、ロボットシステム100には、ロボット1と、ロボットコントローラ2と、センサユニット(画像センサユニット)3とが設けられている。なお、センサユニット3は、本発明の「画像認識装置」の一例である。
図1に示すように、ロボット1は、基台11と、基台11に取り付けられるロボットアーム12と、ロボットアーム12の先端に取り付けられるエンドエフェクタ13とを備えている。ロボットアーム12は、6自由度を有して構成されている。ロボットアーム12は、複数のアーム構造体を有しており、ロボット1の設置面に対して垂直な回転軸A1まわりにアーム構造体12aが基台11に対して回転可能に連結されている。アーム構造体12bは、回転軸A1に対して垂直な回転軸A2まわりに回転可能にアーム構造体12aに連結されている。アーム構造体12cは、回転軸A2に対して平行な回転軸A3まわりに回転可能にアーム構造体12bに連結されている。アーム構造体12dは、回転軸A3に対して垂直な回転軸A4まわりに回転可能にアーム構造体12cに連結されている。アーム構造体12eは、回転軸A4に対して垂直な回転軸A5まわりに回転可能にアーム構造体12dに連結されている。アーム構造体12fは、回転軸A5に対して垂直な回転軸A6まわりに回転可能にアーム構造体12eに連結されている。なお、ここでいう「平行」「垂直」は、厳密な意味の「平行」および「垂直」だけでなく、「平行」および「垂直」から少しずれているものも含む広い意味である。各回転軸A1〜A6にはそれぞれサーボモータ(関節)が設けられており、各サーボモータは、それぞれの回転位置を検出するエンコーダを有している。各サーボモータは、ロボットコントローラ2に接続されており、ロボットコントローラ2の指令に基づいて各サーボモータが動作するように構成されている。
図2に示すように、センサユニット3には、2次元画像を撮影するカメラ31と、レーザスキャナ32とが設けられている。また、センサユニット3の内部には、画像処理部34およびメモリ35を含むセンサコントローラ33が設けられている。また、センサユニット3は、レーザスキャナ32から、バラ積みされたワーク200(推定対象、図1参照)にレーザ光を照射するとともに、ワーク200から反射される光をカメラ31により撮影することにより、ワーク200の3次元形状を計測するように構成されている。また、センサユニット3は、ワーク200の3次元形状を計測(ワーク200までの距離や、ワーク200の詳細な位置および姿勢の推定)することが可能である一方、本実施形態では、詳細な位置や姿勢の推定の前に、カメラ31により撮影された2次元画像に基づいて、ワーク200(および後述するワーク201、図11参照)の概略の位置の推定が、画像処理部34により、行われるように構成されている。なお、画像処理部34は、「第1特徴点抽出手段」、「特徴量算出手段」、「識別器作成手段」、「第2特徴点抽出手段」および「認識手段」の一例である。また、ワーク200および201は、「推定対象」の一例である。以下では、本実施形態による画像認識方法(ワーク200および201の概略位置の推定方法)について説明する。
(DoGに基づく回転不変な特徴量)
まず、画像認識方法において用いられる回転不変な特徴量について説明する。本実施形態では、回転不変な特徴量としてDoG(Difference−of−Gaussian)が用いられる。以下に、DoG(DoG値)について説明する。まず、任意の特徴点(x,y)において、学習画像I(x,y)に対して、下記の式(1)に示すガウス関数G(u,v,σ)を畳み込むことにより、下記の式(2)に示す平滑化画像L(x,y,σ)が生成される。
Figure 0006124566
次に、2つの平滑化パラメータσおよびσにより得れた2つの平滑化画像の差分画像D(i,j)(x,y)が下記の式(3)により生成される。
Figure 0006124566
そして、上記の式(3)により、σ,σ∈[σ,σ,...,σ]の範囲の∀σ∀σ(σ<σ)において、D(i,j)(x,y)が求められて、下記の式(4)に示される特徴ベクトルV(x,y)の要素とされる。
Figure 0006124566
上記の式(4)に示される特徴ベクトルVは、DoG(DoG値)を要素としている。本実施形態では、DoGは、学習画像および推定シーン(推定画像)における範囲の異なる2つの同心円状の領域のそれぞれの輝度値の合算値の差(上記σおよびσより得れた2つの平滑化画像の差分)であるので、回転不変な特徴量である。なお、特徴ベクトルV(DoG)は、マザーウェーブレット関数(有限の長波形)を用いたウェーブレット特徴量(周波数解析)に似た特徴量である。ウェーブレット特徴量は、解像度と方位とを要素とする一方、DoGは、方位の要素を有しない。しかしながら、特徴ベクトルV(DoG)は、解像度(サイズ)に関して、多くのバリエーション(様々なσについてのD)を有する。このため、下記の特徴ベクトルVの次元数削減の手法を用いることにより、推定対象に適切なサイズの特徴量を選択することが可能となる。
(特徴ベクトルVの次元数削減)
上記の式(4)に示される特徴ベクトルVは、多くのDoG(次元数)を有することにより、特徴ベクトルVの分離能力が向上する。しかしながら、推定対象の推定時(認識時)のDoGの生成に多くの時間が割かれたり、無駄になる(特徴が似ている)DoGが生成される可能性がある。そこで、本実施形態では、DoG(DoG値)を要素とする複数のベクトル(後述するf)を生成し、複数のベクトルの間のハミング距離に基づいて、互いに相関の低いDoG値を選択する(特徴ベクトルVの次元を削減する)とともに、選択したDoG値に基づいて識別器を作成するように構成されている。以下に、特徴ベクトルVの次元数削減手法について詳細に説明する。
まず、特徴ベクトルVを求める上で、最適な要素Dを選択するために、全ての特徴点(学習画像上のn点)における分類性能を比較する必要がある。あるσ,σにおいて、(x,y)∈[(x,y),(x,y),...,(x,y)]の範囲の∀(x,y)に対するD(i,j)(x,y)を要素とするベクトルf(i,j)が、下記の式(5)により新たに定義される。
Figure 0006124566
なお、上記の式(5)において、d(i,j)(x,y)は、上記の式(6)により、D(i,j)(x,y)を2値化したものである。また、上記の式(6)において、Dmed (i,j)は、上記の式(7)により求められる中央値である。なお、f(i,j)は、複数生成される。ここで、f(i,j)の要素であるDは、実数値である。そこで、f(i,j)の要素であるDの中央値を閾値として、各要素Dがこの閾値よりも大きいか否かによって、各要素Dを「0」または「1」に2値化する。これにより、f(i,j)内のbitに「0」と「1」とが等しく存在するようになり、この2値化された要素は、n点の特徴点を2つに分類する上で、適切な情報となる。
次に、最適なf(i,j)の集合であるFを決定するアルゴリズムについて説明する。まず、集合Fの最初の要素f(t=1)が、全てのf(i,j)の中からランダムに選択される。その後、tが、2≦t≦Tmaxを満たす間、以下の処理が逐次的に行われる。具体的には、t番目のfを選択する際には、集合Fに含まれない全てのf(i,j)について、下記の式(8)に示されるH(i,j)が算出される。
Figure 0006124566
ここで、上記の式(8)内の関数ω(f(i,j),f(k,l))は、下記の式(9)で表される。
Figure 0006124566
ここで、d(f(i,j),f(k,l))は、f(i,j)とf(k,l)との間のハミング距離を表す。なお、ハミング距離とは、f(i,j)の要素(「0」または「1」)とf(k,l)の要素(「0」または「1」)との間の異なった要素の数を意味する。そして、全てのH(i,j)の中で、最小値であったH(i,j)の算出元であるf(i,j)(最小値であったH(i,j)に対応するf(i,j))が集合Fの要素として追加される。
上記のアルゴリズムは、未選択の要素Dを有するfの中で、選択された要素Dの群との相関が最も低い要素Dを有するfを、tがTmaxになるまで集合Fに逐次追加していく手法である。選択されたfの各々が異なる情報を有するDにより構成されるため、選択されたf(D)は、無駄のない特徴量となる(同じような特徴を有する特徴量が削減される)と考えられる。
(アンサンブル分類木を用いた推定対象の概略位置推定)
次に、図3〜図6を参照して、アンサンブル分類木を用いた推定対象(認識対象)の概略位置の推定について説明する。
(学習時)
まず、学習時について説明する。本実施形態では、図3のステップS1に示すように、学習画像に対してランダムに特徴点が抽出される。そして、ステップS2において、各々の特徴点において上記の式(4)を用いて回転不変な特徴量であるDoG(DoG値)を用いた特徴量(特徴ベクトルV)が算出される。次に、ステップS3において、上記の式(5)〜(9)を用いて、特徴ベクトルVの次元数削減が行われる。そして、ステップS4において、生成された特徴量(特徴ベクトルV、選択したDoG)を分類基準として、分類木が作成される。分類木の作成手順を以下に説明する。
図4に示すように、まず、ノード(2分木の節点)に格納されている全ての特徴点について、各要素(特徴ベクトルVの要素)ごとの中央値を閾値として、2値化が行われる。すなわち、特徴ベクトルV(下記の式(10)参照)の要素(v(DoG)、式(10)参照)について、各要素が閾値よりも大きいか否かによって、各要素が「0」または「1」に2値化(特徴ベクトルVbin、下記の式(11)参照)される。
Figure 0006124566
Figure 0006124566
次に、任意の距離dが生成されるとともに、任意の距離dと、2値化された特徴ベクトルVbin(上記の式(11)参照)とのハミング距離d(Vbin(x,y),d)が算出される。そして、算出されたハミング距離d(Vbin(x,y),d)と、子ノードの要素数が均等に分類できる閾値dthとの大小比較により、特徴ベクトルVbinの分類が行われる。以上の処理が再帰的に行われることにより、分類木が作成される。また、特徴点の抽出(ステップS1)が、分類木の作成時において毎回行われることにより、本実施形態では、独立性のある分類木が複数作成される。これらの複数の分類木は、アンサンブル分類木と呼ばれる。そして、作成されたアンサンブル分類木を用いることにより、後述する推定対象の位置が推定される。なお、アンサンブル分類木は、本発明の「識別器」の一例である。
(推定時)
本実施形態では、図5に示すように、ステップS11において、推定シーン(推定画像)において、全探査が行われて、特徴点が抽出(図6参照)される。すなわち、推定シーンにおいて、たとえばラスタスキャンが行われるとともに、スキャンされた各点において、特徴ベクトルV(上記の式(4)参照)が算出される。次に、ステップS12において、学習時に作成されたアンサンブル分類木を用いることにより、ステップS11において、抽出された推定シーンの特徴点の特徴量と類似した学習画像の特徴点が、対応点として求められる(ステップS11において抽出された特徴点の属性が判定される、図6参照)。
次に、ステップ13において、本実施形態では、図6に示すように、対応点(属性)に対応する投票面((x,y)平面)上の位置に、投票が行われる。なお、特徴量であるDoGは、回転不変な特徴量であるので、推定シーン中の推定対象の方向を一意に定めることはできない。このため、投票は、投票面に円状に行われる。その結果、投票面に投票が集まっている所(多く投票された場所)に、推定対象(認識対象)が存在していると判断(推定)することが可能となる。
次に、図7〜図16を参照して、本実施形態による画像認識方法の有効性を確認するために行った、バラ積みされた状態のワーク200および201に対して、ワーク200および201の概略の中心位置を推定する実験について説明する。
(実験1)
実験1では、図7に示すように、3つの孔200aを有する平板状のワーク200に対して、ワーク200の概略の中心位置を推定する実験を行った。以下に、学習時の条件について説明する。なお、この条件は、以下に説明する実験2においても同様である。
学習時では、3次元のCADデータに基づいて作成された仮想環境でのワーク200の画像が学習画像として用いられた。図8に示すように、本実施形態では、学習画像は、1つのワーク200を平面上に置いた画像からなる。また、学習画像(および推定シーン、図9参照)は、2次元画像からなる。また、1つの分類木の作成に用いられる学習画像上の特徴点数を、300とした。また、分類木の本数は、16本とした。また、推定時では、256×256pixelsの推定シーンに対して、1pixelごとの全探索は行わずに、4pixelsごとに特徴点を抽出(特徴量を算出)した。すなわち、本実施形態(実験1および2)では、推定シーンの特徴点は、推定シーンの局所画像からなる。
図9は、推定時に用いられたバラ積みされたワーク200の画像である。なお、図9における番号1〜5は、図10に示す投票結果に基づいて、ワーク200の中心位置と推定された場所を示している。また、図10には、アンサンブル分類木によって判定された特徴点の属性に基づいて、投票面上に投票された結果が示されている。具体的には、アンサンブル分類木によって判定された推定シーンの局所画像の属性に基づいて、ワーク200の中心位置が存在すると考えられる位置が投票面上に円状に投票された結果(局所画像ごとの属性に基づく投票の結果)が、等高線によって示されている。図10における数字は、等高線の高さを示している。また、投票面の極大値に対応する位置が、ワーク200の中心位置と推定された。そして、図9では、投票面の極大値に対応する位置が、投票面の極大値の大きさ順(投票順位順)に順位付けられて、上位第1位〜第5位(番号1〜5)まで記載されている。
図9に示すように、投票順位の上位の結果(番号1〜4)は、概ねワーク200の実際の中心位置を正確に推定していることが確認された。すなわち、本実施形態の画像認識方法は、高い精度を有することが確認された。ワーク200は、平らな面を多く有しているので、バラ積みされた状態でもワーク200の姿勢の可能性が限定される(姿勢のバリエーションが比較的少ない)ことや、3つの孔200aを含むという特異な特徴を有していることから、高い精度で推定することができたと考えられる。一方、ワーク200がバラ積みされた面に対して傾いた姿勢を有している場合には、このような姿勢が未学習であるため、推定された中心位置が実際の中心位置とずれる場合があることが確認された。
(実験2)
実験2では、図11に示すように、6つの孔201aを有する平板状のワーク201に対して、ワーク201の概略の中心位置を推定する実験を行った。なお、ワーク201は、図12および図13に示すように、表面と裏面とで、形状が異なる。具体的には、ワーク201の表面は、周期的な凹凸形状を有している一方、裏面は、平らな面を有している。
実験2では、図12および図13に示すように、平面上に置いたワーク201の表面の画像と、裏面の画像とが学習画像として用いられた。
図14は、推定時に用いられたバラ積みされたワーク201の画像である。なお、図14における番号1〜3は、図15および図16に示す投票結果に基づいて、ワーク201の中心位置と推定された場所を示している。なお、投票面は、図15および図16に示すように、ワーク201の表面と、裏面とでそれぞれ用意された。そして、ワーク201の表面の学習画像(図12参照)に基づいてアンサンブル分類木が作成された。また、作成されたアンサンブル分類木によって判定された推定シーンの局所画像の属性に基づいて、ワーク201の表面の中心位置が存在すると考えられる位置が投票面(図15参照)上に円状に投票された。同様に、ワーク201の裏面の学習画像(図13参照)に基づいてアンサンブル分類木が作成された。また、作成されたアンサンブル分類木によって判定された推定シーンの局所画像の属性に基づいて、ワーク201の裏面の中心位置が存在すると考えられる位置が投票面(図16参照)上に円状に投票された。そして、図14では、ワーク201の表面および裏面のそれぞれについて、投票面の極大値に対応する位置が、投票面の極大値の大きさ順(投票順位順)に順位付けられて、上位第1位〜第3位(番号1〜3)まで記載されている。
図14に示すように、概ねワーク201の実際の中心位置が正確に推定されていることが確認された。すなわち、本実施形態の画像認識方法は、表面および裏面の形状が異なるワーク201についても、高い精度を有することが確認された。ワーク201もワーク200と同様に、平らな面を多く有しているので、バラ積みされた状態でもワーク201の姿勢の可能性が限定されることや、6つの孔201aおよび周期的な凹凸を含むという特異な特徴を有していることから、高い精度で推定することができたと考えられる
本実施形態では、上記のように、抽出された特徴点に対して、回転不変な特徴量であるDoGを用いて特徴量を算出することによって、回転不変でない特徴量を用いて特徴点の特徴量が抽出される場合と異なり、所定の角度毎に回転した学習画像を学習する必要がない。すなわち、回転不変でない特徴量に基づいて、特徴点の属性を判定するためのアンサンブル分類木を作成する場合と比べて、より少ない学習画像からアンサンブル分類木を作成することができるので、アンサンブル分類木を用いて推定シーンの特徴点の属性を判定する際に、推定画像の特徴点とマッチングされる学習画像の特徴点の数を少なくすることができ、その分、計算量を少なくすることができる。その結果、画像(推定対象)の認識(推定)に時間がかかるのを抑制することができる。
また、本実施形態では、上記のように、回転不変な特徴量として、学習画像の特徴点に対して、ガウス関数を畳み込むことにより複数の平滑化画像を生成するとともに、生成された複数の平滑化画像のうちの2つの平滑化画像の差分であるDoG値を用いる。これにより、容易に、学習画像から抽出された特徴点に対して回転不変な特徴量を算出することができる。
また、本実施形態では、上記のように、DoG値を、特徴点における範囲の異なる2つの同心円状の領域のそれぞれの輝度値の合算値の差として算出する。これにより、2つの同心円状の領域のそれぞれの輝度値は、回転不変な値であるので、学習画像から抽出された特徴点に対して回転不変な特徴量を算出することができる。
また、本実施形態では、上記のように、複数のDoG値のうち、互いに相関の低いDoG値を選択するとともに、選択したDoG値に基づいて、識別器を作成する。これにより、全てのDoG値を用いて識別器を作成する場合と異なり、識別器を用いて推定シーンの特徴点の属性を判定する際の計算量をより少なくすることができる。その結果、画像の認識に時間がかかるのをより抑制することができる。
また、本実施形態では、上記のように、DoG値を要素とする複数のベクトルfを生成し、複数のベクトルfの間のハミング距離に基づいて、互いに相関の低いDoG値を選択するとともに、選択したDoG値に基づいてアンサンブル分類木を作成する。これにより、互いに相関の低いDoG値が選択されるので、特徴ベクトルVの次元数を効果的に削減することができる。
また、本実施形態では、上記のように、回転不変な特徴量を用いて算出された学習画像の特徴点の特徴量から、特徴点の属性を判定するための分類木を複数有するアンサンブル分類木を作成する。これにより、1つの分類木の判別性能(精度)が比較的低い場合でも、分類木を複数有するアンサンブル分類木により、特徴点の属性の判定性能を高めることができる。
また、本実施形態では、上記のように、アンサンブル分類木により判定された特徴点の属性に基づいて、投票面に円状に投票することによって、推定対象の位置を推定する。これにより、特徴点の特徴量を回転不変な特徴量であるDoGを用いて算出した場合でも、投票を投票面に円状に行って、投票面に投票が集まっている所に推定対象が存在していると判断することにより、容易に、推定対象(ワーク200および201の中心位置)を推定することができる。
また、本実施形態では、上記のように、推定シーンは、バラ積みされた複数のワーク200および201の画像であり、アンサンブル分類木を用いて判定された特徴点の属性に基づいて、投票面に円状に投票することによって、バラ積みされた複数のワーク200および201の中心位置を推定する。これにより、回転不変な特徴量(DoG)に基づいて作成されたアンサンブル分類木により、バラ積みされた複数のワーク200および201の中心位置を迅速に推定することができる。
また、本実施形態では、上記のように、学習画像を、1つのワーク200の画像から構成する。これにより、所定の角度毎に回転させたワークの学習画像を複数用意して、複数の学習画像からアンサンブル分類木を作成する場合と異なり、推定対象の推定(認識)に時間がかかるのを抑制することができる。
また、本実施形態では、上記のように、学習画像および推定シーンを、2次元画像から構成する。これにより、学習画像および推定シーンを3次元画像から構成する場合と異なり、アンサンブル分類木の作成および推定対象の推定を迅速に行うことができる。
また、本実施形態では、上記のように、推定シーンの特徴点を、推定シーンの局所画像から構成する。これにより、推定シーンの全ての点(pixel)において、特徴点の特徴量を算出する場合と異なり、推定対象の認識を迅速に行うことができる。
なお、今回開示された実施形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施形態の説明ではなく特許請求の範囲によって示され、さらに特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれる。
たとえば、上記実施形態では、回転不変な特徴量としてDoG(DoG値)を用いる例を示したが、回転不変な特徴量としてDoG以外の特徴量を用いてもよい。たとえば、推定対象の中心から推定対象のエッジ(輪郭)までの距離を光軸周りに所定の角度間隔で算出するとともに、得られた結果を周波数解析することにより得られる特徴量を、回転不変な特徴量として用いてもよい。
また、上記実施形態では、互いに相関の低いDoG(DoG値)を選択することにより、特徴ベクトルVの次元を削減する例を示したが、特徴ベクトルVの次元を削減しなくてもよい。
また、上記実施形態では、特徴点における範囲の異なる2つの同心円状の領域のそれぞれの輝度値の合算値の差をDoG値とする例を示したが、たとえば、輝度値の平均値の差をDoG値としてもよい。
また、上記実施形態では、識別器としてアンサンブル分類木を用いる例を示したが、アンサンブル分類木以外の識別器(たとえば、1つの分類木や、サポートベクターマシン(SVM)など)を用いてもよい。
また、上記実施形態では、バラ積みされた複数のワークの画像から、ワークの中心位置を推定する例を示したが、バラ積みされた複数のワーク以外の推定対象(写真の中の人物や、航空写真中の所定の建物など)を推定することも可能である。
また、上記実施形態では、平面上に載置された1つのワークの画像(1つのワークの表面と裏面との画像)を学習画像として用いる例を示したが、たとえば、平面上に載置されたワークの画像に加えて、載置面に対して傾斜した状態のワークの画像や、ワークの側面の画像を学習画像として用いてもよい。これにより、様々な姿勢でバラ積みされた複数のワークの推定を精度よく行うことが可能となる。
また、上記実施形態では、センサユニットの画像処理部により、ワークの概略位置の推定が行われる例を示したが、センサユニットの画像処理部以外の部分(たとえば、ロボットコントローラや、別途設けられたパーソナルコンピュータ(PC))によって、ワークの概略位置の推定を行ってもよい。
また、上記実施形態では、ロボットシステムに、上記した画像認識方法を用いる例を示したが、ロボットシステム以外のシステムに上記した画像認識方法を用いてもよい。
3 センサユニット(画像認識装置)
34 画像処理部(第1特徴点抽出手段、特徴量算出手段、識別器作成手段、第2特徴点抽出手段、認識手段)
200、201 ワーク(推定対象)

Claims (12)

  1. 学習画像に対して複数の特徴点を抽出するステップと、
    前記抽出された特徴点に対して、回転不変な特徴量を用いて特徴量を算出するステップと、
    算出された前記学習画像の特徴点の特徴量に基づいて、前記特徴点の属性を判定するための識別器を作成するステップと、
    推定画像に対して複数の特徴点を抽出するステップと、
    前記識別器を用いて前記抽出された推定画像の複数の特徴点の属性を集約して推定対象の位置を判定して、前記推定画像を認識するステップとを備える、画像認識方法。
  2. 前記回転不変な特徴量は、前記学習画像の特徴点に対して、ガウス関数を畳み込むことにより複数の平滑化画像を生成するとともに、生成された前記複数の平滑化画像のうちの2つの平滑化画像の差分であるDoG(Difference−of−Gaussian)値を含む、請求項1に記載の画像認識方法。
  3. 前記DoG値は、前記特徴点における範囲の異なる2つの同心円状の領域のそれぞれの輝度値の合算値の差である、請求項2に記載の画像認識方法。
  4. 前記DoG値は、複数のDoG値を含み、
    前記特徴点の属性を判定するための識別器を作成するステップは、前記複数のDoG値のうち、互いに相関の低いDoG値を選択するとともに、選択した前記DoG値に基づいて、前記識別器を作成するステップを含む、請求項2または3に記載の画像認識方法。
  5. 前記選択したDoG値に基づいて前記識別器を作成するステップは、前記DoG値を要素とする複数のベクトルを生成し、前記複数のベクトルの間のハミング距離に基づいて、互いに相関の低いDoG値を選択するとともに、選択した前記DoG値に基づいて前記識別器を作成するステップを含む、請求項4に記載の画像認識方法。
  6. 前記特徴点の属性を判定するための識別器を作成するステップは、前記回転不変な特徴量を用いて算出された前記学習画像の特徴点の特徴量から、前記特徴点の属性を判定するための分類木を複数有するアンサンブル分類木を作成するステップを含む、請求項1〜5のいずれか1項に記載の画像認識方法。
  7. 前記識別器を用いて前記抽出された学習画像の特徴点の属性を判定して、前記推定画像を認識するステップは、前記識別器に判定された前記特徴点の属性に基づいて、投票面に円状に投票することによって、推定対象の位置を推定するステップを含む、請求項1〜6のいずれか1項に記載の画像認識方法。
  8. 前記推定画像は、バラ積みされた複数のワークの画像を含み、
    前記推定画像の位置を推定するステップは、前記識別器を用いて判定された前記特徴点の属性に基づいて、投票面に円状に投票することによって、前記バラ積みされた複数のワークの中心位置を推定するステップを含む、請求項7に記載の画像認識方法。
  9. 前記学習画像は、1つの前記ワークの画像からなる、請求項8に記載の画像認識方法。
  10. 前記学習画像および前記推定画像は、2次元画像からなる、請求項1〜9のいずれか1項に記載の画像認識方法。
  11. 前記推定画像の特徴点は、前記推定画像の局所画像からなる、請求項1〜10のいずれか1項に記載の画像認識方法。
  12. 学習画像に対して複数の特徴点を抽出する第1特徴点抽出手段と、
    前記抽出された特徴点に対して、回転不変な特徴量を用いて特徴量を算出する特徴量算出手段と、
    算出された前記学習画像の特徴点の特徴量に基づいて、前記特徴点の属性を判定するための識別器を作成する識別器作成手段と、
    推定画像に対して複数の特徴点を抽出する第2特徴点抽出手段と、
    前記識別器を用いて前記抽出された推定画像の複数の特徴点の属性を集約して推定対象の位置を判定して、前記推定画像を認識する認識手段とを備える、画像認識装置。
JP2012260886A 2012-11-29 2012-11-29 画像認識方法および画像認識装置 Expired - Fee Related JP6124566B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012260886A JP6124566B2 (ja) 2012-11-29 2012-11-29 画像認識方法および画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012260886A JP6124566B2 (ja) 2012-11-29 2012-11-29 画像認識方法および画像認識装置

Publications (2)

Publication Number Publication Date
JP2014106856A JP2014106856A (ja) 2014-06-09
JP6124566B2 true JP6124566B2 (ja) 2017-05-10

Family

ID=51028257

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012260886A Expired - Fee Related JP6124566B2 (ja) 2012-11-29 2012-11-29 画像認識方法および画像認識装置

Country Status (1)

Country Link
JP (1) JP6124566B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016081346A1 (en) * 2014-11-21 2016-05-26 Northrup Grumman Systems Corporation System and method for network data characterization
CN105197012B (zh) * 2015-10-10 2017-12-15 广东轻工职业技术学院 一种车辆自动控制方法
JP6588609B2 (ja) * 2018-09-27 2019-10-09 株式会社nittoh 光学装置
CN117372790B (zh) * 2023-12-08 2024-03-08 浙江托普云农科技股份有限公司 植物叶片形状分类的方法、系统及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4720913B2 (ja) * 2009-02-19 2011-07-13 ソニー株式会社 学習装置、学習方法、識別装置、識別方法、及び、プログラム
JP5675214B2 (ja) * 2010-08-18 2015-02-25 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム

Also Published As

Publication number Publication date
JP2014106856A (ja) 2014-06-09

Similar Documents

Publication Publication Date Title
Kang et al. Automatic targetless camera–lidar calibration by aligning edge with gaussian mixture model
US20230418389A1 (en) Information processing device and method, program and recording medium for identifying a gesture of a person from captured image data
JP5328979B2 (ja) 物体認識方法、物体認識装置、自律移動ロボット
JP6125188B2 (ja) 映像処理方法及び装置
US9044858B2 (en) Target object gripping apparatus, method for controlling the same and storage medium
JP6430064B2 (ja) データを位置合わせする方法及びシステム
Sodhi et al. In-field segmentation and identification of plant structures using 3D imaging
JP5726125B2 (ja) 奥行き画像内の物体を検出する方法およびシステム
US8755562B2 (en) Estimation apparatus, control method thereof, and program
Holz et al. Active recognition and manipulation for mobile robot bin picking
JP6172432B2 (ja) 被写体識別装置、被写体識別方法および被写体識別プログラム
JP5297727B2 (ja) ロボット装置及び物体の位置姿勢推定方法
CN106529573A (zh) 一种结合三维点云分割和局部特征匹配的实时物体检测方法
JP2015147256A (ja) ロボット、ロボットシステム、制御装置、及び制御方法
WO2012077287A1 (ja) 姿勢状態推定装置および姿勢状態推定方法
CN110766750A (zh) 一种基于局部轮廓的机械臂视觉伺服目标识别方法
US11480661B2 (en) Determining one or more scanner positions in a point cloud
JP6124566B2 (ja) 画像認識方法および画像認識装置
Kalra et al. Towards co-evaluation of cameras hdr and algorithms for industrial-grade 6dof pose estimation
JP4709668B2 (ja) 3次元物体認識システム
CN114972495A (zh) 针对纯平面结构的物体的抓取方法、装置及计算设备
JP2017091202A (ja) 物体認識方法及び物体認識装置
Yamada et al. Pose estimation of a simple-shaped object based on poseclass using RGBD camera
JP2014174629A (ja) ワークピース認識方法
Sidiropoulos et al. Edge points detection in unorganized point clouds

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20151116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170328

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170404

R150 Certificate of patent or registration of utility model

Ref document number: 6124566

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees