JP5882976B2 - Learning local feature generating apparatus and learning local feature generating method - Google Patents
Learning local feature generating apparatus and learning local feature generating method Download PDFInfo
- Publication number
- JP5882976B2 JP5882976B2 JP2013238396A JP2013238396A JP5882976B2 JP 5882976 B2 JP5882976 B2 JP 5882976B2 JP 2013238396 A JP2013238396 A JP 2013238396A JP 2013238396 A JP2013238396 A JP 2013238396A JP 5882976 B2 JP5882976 B2 JP 5882976B2
- Authority
- JP
- Japan
- Prior art keywords
- feature amount
- learning
- image
- local feature
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
本発明は、画像認識のための学習に用いる局所特徴量を生成する技術に関するものである。 The present invention relates to a technique for generating local feature values used for learning for image recognition.
画像認識のために局所特徴量を用いる技術が提案されている(下記特許文献1)。局所特徴量とは、画像の局所的な特徴を数値化して得られる量であり、通常はベクトル量として表される。局所特徴量を用いることにより、類似画像の検索あるいは同一画像の特定を行うことができる。
A technique using a local feature amount for image recognition has been proposed (
ところで、ある画像から抽出された局所特徴量は、その画像の撮影状態(例えば輝度や解像度の変化など)に特化したものとなっている。すなわち、同一の内容を表す画像であっても、その画像の撮影状態が変化すれば、異なる局所特徴量となることが多い。 By the way, the local feature amount extracted from a certain image is specialized for the shooting state of the image (for example, change in luminance, resolution, etc.). That is, even if the images represent the same content, if the shooting state of the images changes, different local feature amounts are often obtained.
そこで、一つの学習画像に画像変換(例えば輝度や解像度の変更)を行い、得られた変換画像から局所特徴量を抽出することで大量の学習用の局所特徴量を抽出する手法が考えられる(例えば下記特許文献1参照)。例えば、1種類の画像変換を用いた場合でも、異なるパラメータを用いて多数の変換画像を生成した上で、局所特徴量を生成すれば、多くの局所特徴量を得ることができる。画像変換の種類を複数とすれば、さらに局所特徴量を増やすことができる。ただし、この手法では、以下の問題を生じる。
・一般的に、特徴量ベクトルとしてほぼ同一の局所特徴量が複数生成されるので、無駄に記憶域を必要とする。
・1種類の画像変換に対して異なるパラメータにより画像変換を行って多数の変換画像を生成した上で、多数の変換画像から局所特徴量を生成する処理には、多量の計算資源及び時間を要する。
Therefore, a method of extracting a large amount of local feature values for learning by performing image conversion (for example, changing brightness and resolution) on one learning image and extracting local feature values from the obtained converted image is conceivable (see FIG. For example, see
In general, since a plurality of substantially the same local feature quantities are generated as feature quantity vectors, a storage area is uselessly required.
-A large amount of computational resources and time are required for processing to generate local feature amounts from a large number of converted images after generating a large number of converted images by performing image conversion with different parameters for one type of image conversion. .
本発明は、前記した状況に鑑みてなされたものである。本発明の主な目的は、多くの学習用の局所特徴量を簡易かつ迅速に生成することが可能な装置又は方法を提供することである。 The present invention has been made in view of the above situation. A main object of the present invention is to provide an apparatus or method that can easily and quickly generate many local features for learning.
(項目1)
学習画像を用いて学習用の局所特徴量を生成するための装置であって、
前記学習画像を変換して変換画像を生成する画像変換部と、
前記学習画像と前記変換画像とのそれぞれについて、画像の局所的特徴に基づく局所特徴量を取得する特徴量取得部と、
画像空間上の位置がほぼ同一である局所特徴量を特定する特徴量位置判定部と、
前記画像空間上の位置がほぼ同一である局所特徴量のうち、前記学習画像に対応する局所特徴量と、前記変換画像に対応する局所特徴量との間に、特徴量空間上での距離に基づいて補間特徴量を生成する補間特徴量生成部と、
前記補間特徴量を少なくとも用いて学習用の局所特徴量を特定する学習データ特定部と
を備えることを特徴とする、学習用局所特徴量生成装置。
(Item 1)
An apparatus for generating a local feature for learning using a learning image,
An image converter that converts the learning image to generate a converted image;
For each of the learning image and the converted image, a feature amount acquisition unit that acquires a local feature amount based on a local feature of the image;
A feature amount position determination unit that identifies local feature amounts whose positions on the image space are substantially the same;
Among the local feature quantities having substantially the same position in the image space, the distance in the feature quantity space is between the local feature quantity corresponding to the learning image and the local feature quantity corresponding to the converted image. An interpolation feature value generation unit that generates an interpolation feature value based on the
A learning local feature generating apparatus comprising: a learning data specifying unit that specifies a local feature for learning using at least the interpolation feature.
(項目2)
さらに、特徴量集約部を備えており、
前記特徴量集約部は、前記特徴量位置判定部により特定された、画像空間上の位置がほぼ同一である局所特徴量のうち、特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの局所特徴量から代表特徴量を生成し、この代表特徴量により前記既定距離内にある局所特徴量を代表させる構成となっており、
さらに、前記補間特徴量生成部は、前記特徴量集約部において生成された代表特徴量がある場合には、この代表特徴量を前記局所特徴量として、前記補間特徴量を生成する構成となっている
項目1に記載の学習用局所特徴量生成装置。
(Item 2)
Furthermore, it has a feature amount aggregation unit,
The feature amount aggregating unit includes a local feature amount existing within a predetermined distance in the feature amount space among the local feature amounts identified by the feature amount position determining unit and having substantially the same position in the image space. In this case, representative feature amounts are generated from these local feature amounts, and the local feature amounts within the predetermined distance are represented by the representative feature amounts.
Furthermore, when there is a representative feature amount generated by the feature amount aggregation unit, the interpolation feature amount generation unit generates the interpolation feature amount using the representative feature amount as the local feature amount. The learning local feature generating apparatus according to
(項目3)
さらに、特徴量集約部を備えており、
前記特徴量集約部は、前記補間特徴量生成部により生成された補間特徴量に対して特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの補間特徴量及び局所特徴量から代表特徴量を生成する構成となっており、
さらに、前記学習データ特定部は、前記特徴量集約部において生成された代表特徴量がある場合には、この代表特徴量を前記補間特徴量として、前記学習用の局所特徴量を特定する構成となっている
項目1に記載の学習用局所特徴量生成装置。
(Item 3)
Furthermore, it has a feature amount aggregation unit,
The feature amount aggregating unit, when there is a local feature amount existing within a predetermined distance in the feature amount space with respect to the interpolation feature amount generated by the interpolation feature amount generation unit, It is configured to generate representative feature values from feature values,
Further, the learning data specifying unit, when there is a representative feature amount generated in the feature amount aggregating unit, specifies the local feature amount for learning using the representative feature amount as the interpolation feature amount, The learning local feature generating apparatus according to
(項目4)
前記補間特徴量生成部は、特徴量空間上での既定距離ごとに前記補間特徴量を生成する構成となっている
項目1〜3のいずれか1項に記載の学習用局所特徴量生成装置。
(Item 4)
The local feature-value generating device for learning according to any one of
(項目5)
前記学習データ特定部は、前記学習画像から取得された局所特徴量と、前記変換画像から取得された局所特徴量と、これらの局所特徴量に対して特徴量空間上でほぼ同一の局所特徴量とのいずれかを学習用の局所特徴量としてさらに特定する構成となっている
項目1〜4のいずれか1項に記載の学習用局所特徴量生成装置。
(Item 5)
The learning data specifying unit includes a local feature amount acquired from the learning image, a local feature amount acquired from the converted image, and a local feature amount that is substantially the same in the feature amount space for these local feature amounts. The learning local feature-value generating device according to any one of
(項目6)
項目1〜5のいずれか1項に記載の学習用局所特徴量生成装置と、対象画像の認識を行うための認識部とを備えており、
前記認識部は、
前記対象画像に対応する局所特徴量を、前記学習用局所特徴量生成装置で生成された学習用局所特徴量から検索することによって、前記対象画像の認識を行う構成となっている
画像認識装置。
(Item 6)
Comprising the learning local feature generation device according to any one of
The recognition unit
An image recognition device configured to recognize the target image by searching a local feature amount corresponding to the target image from a local feature amount for learning generated by the local feature amount generation device for learning.
(項目7)
学習画像を用いて学習用の局所特徴量を生成するための装置を用いた学習用局所特徴量の生成方法であって、
前記学習画像を変換して変換画像を生成する画像変換ステップと、
前記学習画像と前記変換画像とのそれぞれについて、画像の局所的特徴に基づく局所特徴量を取得する特徴量取得ステップと、
画像空間上の位置がほぼ同一である局所特徴量を特定する特徴量位置判定ステップと、
前記画像空間上の位置がほぼ同一である局所特徴量のうち、前記学習画像に対応する局所特徴量と、前記変換画像に対応する局所特徴量との間に、特徴量空間上での距離に基づいて補間特徴量を生成する補間特徴量生成ステップと、
前記補間特徴量を少なくとも用いて学習用の局所特徴量を特定する学習データ特定ステップと
を備えることを特徴とする生成方法。
(Item 7)
A method for generating a local feature for learning using a device for generating a local feature for learning using a learning image,
An image conversion step of converting the learning image to generate a converted image;
A feature amount acquisition step for acquiring a local feature amount based on a local feature of the image for each of the learning image and the converted image;
A feature amount position determining step for identifying local feature amounts whose positions on the image space are substantially the same;
Among the local feature quantities having substantially the same position in the image space, the distance in the feature quantity space is between the local feature quantity corresponding to the learning image and the local feature quantity corresponding to the converted image. An interpolation feature generation step for generating an interpolation feature based on the basis;
A learning data specifying step of specifying a local feature quantity for learning using at least the interpolation feature quantity.
(項目8)
項目7に記載の各ステップをコンピュータに実行させるためのコンピュータプログラム。
(Item 8)
A computer program for causing a computer to execute each step according to
このコンピュータプログラムは、適宜な記録媒体(例えばCD−ROMやDVDディスクのような光学的な記録媒体、ハードディスクやフレキシブルディスクのような磁気的記録媒体、あるいはMOディスクのような光磁気記録媒体)に格納することができる。このコンピュータプログラムは、インターネットなどの通信回線を介して伝送されることができる。 This computer program is stored in an appropriate recording medium (for example, an optical recording medium such as a CD-ROM or a DVD disk, a magnetic recording medium such as a hard disk or a flexible disk, or a magneto-optical recording medium such as an MO disk). Can be stored. This computer program can be transmitted via a communication line such as the Internet.
本発明によれば、多くの学習用の局所特徴量を、比較的に簡易な手法により迅速に生成することが可能となる。 According to the present invention, it is possible to quickly generate many local feature quantities for learning by a relatively simple method.
(第1実施形態の構成)
本発明の第1実施形態に係る学習用局所特徴量生成装置の構成を、図1を参照しながら説明する。この装置は、学習画像を用いて学習用の局所特徴量を生成するためのものである。
(Configuration of the first embodiment)
The configuration of the learning local feature generating apparatus according to the first embodiment of the present invention will be described with reference to FIG. This apparatus is for generating a local feature amount for learning using a learning image.
本実施形態の装置は、画像変換部1と、特徴量取得部2と、特徴量位置判定部3と、補間特徴量生成部4と、学習データ特定部5とを備えている。さらに、本実施形態の装置は、画像DB6と、特徴量DB7と、画像取得部8と、特徴量集約部9とを追加的な要素として備えている。
The apparatus according to this embodiment includes an
画像変換部1は、学習画像(後述)を変換して変換画像(後述)を生成する構成となっている。
The
特徴量取得部2は、学習画像と変換画像とのそれぞれについて、画像の局所的特徴に基づく局所特徴量を取得する構成となっている。
The feature
特徴量位置判定部3は、画像空間上の位置がほぼ同一である局所特徴量を特定する構成となっている。ここで、画像空間とは、いわゆるピクセル空間あるいはピクセル座標を意味する。2次元画像を前提とすれば、画像空間は、一般的に(x,y)座標系で表されるが、座標系を制限するものではない。
The feature amount
補間特徴量生成部4は、画像空間上の位置がほぼ同一である局所特徴量のうち、学習画像に対応する局所特徴量と、変換画像に対応する局所特徴量との間に、特徴量空間上での距離に基づいて補間特徴量を生成する構成となっている。
The interpolated feature
さらに、本例の補間特徴量生成部4は、後述する特徴量集約部9において生成された代表特徴量がある場合には、この代表特徴量を局所特徴量として、補間特徴量を生成する構成となっている。
Furthermore, when there is a representative feature amount generated by a feature
また、本例の補間特徴量生成部4は、特徴量空間上での既定距離ごとに補間特徴量を生成する構成となっている。
Further, the interpolation feature
学習データ特定部5は、補間特徴量を用いて学習用の局所特徴量を特定する構成となっている。
The learning
さらに、本例の学習データ特定部5は、補間特徴量に加えて、学習画像から取得された局所特徴量と、変換画像から取得された局所特徴量と、これらの局所特徴量に対して特徴量空間上でほぼ同一の局所特徴量とのいずれか又は全てを、学習用の局所特徴量として特定する構成となっている。
Further, the learning
本実施形態の画像DB6は、学習画像となるべき画像群を記録しておくデータベースである。学習画像は、例えば、何らかの商品の画像であるが、画像の種類には特段の制約はない。また、画像は、商品を撮影することによって取得されたものであっても、インターネットなどのネットワーク上から取得されたものでもよい。すなわち、画像の取得経路も特に制約されない。
The
特徴量DB7は、学習データ特定部5によって特定された学習用の局所特徴量を格納するデータベースである。特徴量DB7は、クエリ画像の認識(照合)において使用される。
The
画像取得部8は、画像DB6から学習用の画像を取得する機能要素である。具体的には、画像取得部8は、画像データの入力を受け付けるインタフェースである。
The
特徴量集約部9は、特徴量位置判定部3により特定された、画像空間上の位置がほぼ同一である局所特徴量のうち、特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの局所特徴量から代表特徴量を生成し、この代表特徴量により既定距離内にある局所特徴量を代表させる構成となっている。
The feature
本実施形態の装置の詳細については、後述する動作の説明においてさらに詳しく説明する。 Details of the apparatus of the present embodiment will be described in more detail in the description of operations described later.
(第1実施形態の動作)
つぎに、前記した生成装置を用いて学習用の局所特徴量を生成する方法の一例を、図2〜図3をさらに参照しながら説明する。
(Operation of the first embodiment)
Next, an example of a method for generating a local feature amount for learning using the above-described generation device will be described with further reference to FIGS.
(図2のステップSA−1)
まず、画像取得部8は、画像DB6から、学習画像(すなわち基本画像)101(図3(a)参照)を取得する。なお、図3に示す学習画像101はあくまで一例であり、その内容には特段の制約はない。また、画像取得部8は、画像DB6からではなく、何らかの手段で他の場所から取得した画像を取得して学習画像とすることができる。
(Step SA-1 in FIG. 2)
First, the
また、以降の説明では、1枚の学習画像101を用いた処理について説明するが、複数の学習画像を同時に取得して、以降の処理を並行して行うことも可能である。
Further, in the following description, processing using one
(図2のステップSA−2)
ついで、画像変換部1は、取得した学習画像101を変換して、変換画像102(図3(a)参照)を生成する。ここで、画像変換とは、例えば、輝度変更や解像度変更である。もちろん、アフィン変換のような複雑な変換を行うことも可能である。ただし、本例の手法では、比較的に単純な画像変換を採用した場合でも、後述するように、多数の学習データを生成することができ、したがって、画像変換における処理負担を軽減することが可能となる。なお、図3(a)では、1枚の変換画像102を示しているが、通常は、変換パラメータの変更又は変換の種類の変更により、複数の変換画像を生成して、それらについて以降の手順を実行する。生成する変換画像の枚数には特に制約はない。
(Step SA-2 in FIG. 2)
Next, the
(図2のステップSA−3)
ついで、特徴量取得部2は、学習画像101及び変換画像102のそれぞれについて、画像の局所的特徴に基づく局所特徴量を取得する。局所特徴量の取得方法としては、既存の手法(例えばSIFT)を用いることができるので、これについての詳しい説明は省略する。
(Step SA-3 in FIG. 2)
Next, the feature
さらに、本実施形態の特徴量取得部2は、得られた局所特徴量の、画像空間上における位置を取得する。これにより、特定の局所特徴量と画像空間上における当該特徴量の位置とを対応させることができる。
Furthermore, the feature
(図2のステップSA−4)
ついで、特徴量位置判定部3は、前記した局所特徴量のうちで、画像空間上の位置がほぼ同一である局所特徴量を特定する。図3(a)には、画像空間上の位置がほぼ同一(この例では左足の先端付近)である複数の局所特徴量を、特徴量空間上に配置した例を示す。なお、特徴量は、通常、多次元ベクトルで表現されるが、理解の容易のため、図3では、2次元平面上に特徴量を配置した例を示す。
(Step SA-4 in FIG. 2)
Next, the feature quantity
図3(a)では、学習画像(つまり基本画像)101に対応する局所特徴量1011を白丸で表し、複数の変換画像102…に対応する局所特徴量1021〜1028を黒丸で表している。なお、局所特徴量1021〜1028のうちの一つは、基本的に、1枚の変換画像に対応している。また、図示した局所特徴量の個数はあくまで一例であり、i番目の変換画像に対応する局所特徴量は一般的に符号102iで示されるものとする。
In FIG. 3A, the
なお、「画像空間上の位置がほぼ同一」とは、画像空間上での当該局所特徴量間の距離(例えばピクセル数)が、既定範囲内(例えば2ピクセル以内)であることを意味する。この範囲は例えば実験的に決定することができる。また、前記したピクセル数はあくまで例示であって、それに制約されない。 Note that “the positions in the image space are substantially the same” means that the distance (for example, the number of pixels) between the local feature amounts in the image space is within a predetermined range (for example, within 2 pixels). This range can be determined experimentally, for example. The number of pixels described above is merely an example, and is not limited thereto.
(図2のステップSA−5)
ついで、特徴量集約部9は、画像空間上の位置がほぼ同一である局所特徴量(図3(a)参照)のうち、特徴量空間上において既定距離内に存在する局所特徴量があるかどうかを判定する。ここで、既定距離とは、特徴量空間における、局所特徴量間の距離であり、例えば実験的に決定することができる。
(Step SA-5 in FIG. 2)
Next, the feature
ついで、特徴量集約部9は、特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの局所特徴量から代表特徴量を生成する。例えば、図3(a)の例では、局所特徴量1011及び1021〜1023が既定距離内に存在している。そこで、本例では、これらの特徴量から、代表特徴量1001を生成する(図3(b)参照)。同様に、図3(a)の例では、局所特徴量1024と1025とが既定距離内に存在している。そこで、本例では、これらの特徴量から、代表特徴量1002を生成する(図3(b)参照)。代表特徴量の生成手法としては、例えば
・既定距離内の特徴量のうちの任意の一つを選択する、あるいは
・既定距離内の特徴量の重心(あるいは平均)のベクトルデータを代表として生成する
という手法が考えられる。図示例は後者の手法を用いている。なお、後者の手法において、重心算出に用いる特徴量を何らかの基準で選択することも可能である。
Next, when there are local feature quantities existing within a predetermined distance in the feature quantity space, the feature
このような集約操作を行うことによって、代表特徴量により既定距離内にある局所特徴量を代表させることができる。また、このような集約操作を行うことによって、後述するように、ほぼ同一の補間特徴量の生成を制約することができるという利点がある。 By performing such an aggregation operation, the local feature amount within the predetermined distance can be represented by the representative feature amount. In addition, by performing such an aggregation operation, there is an advantage that generation of substantially the same interpolation feature amount can be restricted as will be described later.
(図2のステップSA−6)
ついで、補間特徴量生成部4は、学習画像に対応する局所特徴量と、変換画像に対応する局所特徴量との間に、特徴量空間上での距離に基づいて補間特徴量を生成する。ただし、本例では、前記したように、学習画像に対応する局所特徴量1011を代表する代表特徴量1001が存在するので、この代表特徴量1001と、他の局所特徴量(本例では、局所特徴量1002、1027、1028)を用いて補間特徴量を生成する構成となっている。なお、局所特徴量1002は、他の二つの局所特徴量1024、1025を代表するものである。
(Step SA-6 in FIG. 2)
Next, the interpolation feature
さらに具体的には、本例の補間特徴量生成部4は、特徴量空間上での既定距離ごとに補間特徴量を生成する。例えば、局所特徴量1001と1002との間に、既定距離ごとに補間特徴量(図3(b)において▲で示す)1101〜1103を生成することができる。なお、この既定距離も、例えば実験的に決定することができる。
More specifically, the interpolation feature
同様にして、局所特徴量1001と1027との間に、補間特徴量1104〜1106を生成し、局所特徴量1001と1028との間に、補間特徴量1107〜1109を生成することができる。 Similarly, interpolation feature amounts 1104 to 1106 can be generated between the local feature amounts 1001 and 1027, and interpolation feature amounts 1107 to 1109 can be generated between the local feature amounts 1001 and 1028.
また、本実施形態の特徴量集約部9は、生成された補間特徴量に対して既定距離内に他の特徴量が存在するかどうかを判定し、存在する場合にはそれらの特徴量を集約する。例えば、図3(b)の例では、生成された補間特徴量1105が、変換画像の局所特徴量1026に対して既定距離内にある。この場合は、これらの特徴量を代表するものとして、代表特徴量1003を生成することができる。
Further, the feature
(図2のステップSA−7)
ついで、学習データ特定部5は、補間特徴量を用いて学習用の局所特徴量を特定する。より具体的には、本実施形態の学習データ特定部は、
・生成された補間特徴量
・変換画像の局所特徴量
・学習画像の局所特徴量
を、学習データとして特定する。
(Step SA-7 in FIG. 2)
Next, the learning
The generated interpolation feature amount, the local feature amount of the converted image, and the local feature amount of the learning image are specified as learning data.
ただし、本例では、これらの局所特徴量に対して特徴量空間上でほぼ同一の局所特徴量が存在する場合(すなわち代表特徴量が存在する場合)は、これらの特徴量に代えて、代表特徴量を、学習用の局所特徴量として特定する。 However, in this example, when there is almost the same local feature quantity in the feature quantity space with respect to these local feature quantities (that is, when a representative feature quantity exists), instead of these feature quantities, a representative feature quantity is used. The feature amount is specified as a local feature amount for learning.
さらに、学習データ特定部5は、特定された特徴量を学習データとして特徴量DB7に格納する。
Further, the learning
画像座標上の他の位置に対応する局所特徴量が存在する場合は、ステップSA−4からの処理を繰り返すことにより、学習データを同様に生成することができる。また、他の学習画像が存在する場合には、ステップSA−1からの処理を繰り返すことにより、学習データを生成することができる。 If there is a local feature amount corresponding to another position on the image coordinates, the learning data can be similarly generated by repeating the processing from step SA-4. When other learning images exist, learning data can be generated by repeating the processing from step SA-1.
本実施形態では、画像座標上で実質的に同じ位置にある局所特徴量を選択し、それらの間で、特徴量空間上での補間によって、学習用の特徴量を生成しているので、学習用特徴量の生成処理が簡便であり、計算資源の使用量を低く抑えることができる。すなわち、もし、多数の変換画像を生成し、それらの変換画像から局所特徴量を逐一抽出する処理を行う場合には、処理に多くの計算資源及び時間を要する。これに対して、前記した手法によれば、少ない変換画像を用いた場合でも、多くの学習用の局所特徴量を生成することができるという利点がある。 In the present embodiment, local feature amounts at substantially the same position on the image coordinates are selected, and learning feature amounts are generated by interpolation between them in the feature amount space. The feature amount generation process is simple, and the amount of calculation resources used can be kept low. That is, if a large number of converted images are generated and a process of extracting local feature amounts from the converted images one by one is performed, the processing requires a lot of calculation resources and time. On the other hand, according to the above-described method, there is an advantage that many local feature quantities for learning can be generated even when a small number of converted images are used.
さらに、本実施形態では、学習画像(つまり基本画像)に対応する特徴量と、変換画像に対応する特徴量との間で、補間特徴量を生成しているので、補間特徴量の有用性ないし品質を高めることができる。仮に、変換画像に対応する特徴量どうしの間で補間特徴量を生成すると、その補間特徴量は、学習画像との関連性が低いので、将来的にクエリ画像を照合する際の有用性が低くなりやすいと考えられる。そこで、本実施形態では、学習画像に対応する特徴量と、変換画像に対応する特徴量との間で、補間特徴量を生成することによって、クエリ画像の照合精度の向上に寄与することができる。つまり、本実施形態の手法では、良質な学習用局所特徴量を効率よく生成できるという利点がある。 Furthermore, in the present embodiment, the interpolation feature amount is generated between the feature amount corresponding to the learning image (that is, the basic image) and the feature amount corresponding to the converted image. Quality can be improved. If an interpolated feature amount is generated between feature amounts corresponding to the converted image, the interpolated feature amount has a low relevance to the learning image, and thus is less useful when collating query images in the future. It seems to be easy to become. Therefore, in the present embodiment, by generating an interpolated feature amount between the feature amount corresponding to the learning image and the feature amount corresponding to the converted image, it is possible to contribute to the improvement of the matching accuracy of the query image. . That is, the method of the present embodiment has an advantage that a high-quality learning local feature can be efficiently generated.
また、本実施形態では、特徴量空間上でほぼ同一とみなせる(つまり既定距離内にある)特徴量をまとめて、代表特徴量を生成し、代表特徴量を用いて補間特徴量を生成している。ここで、代表特徴量を生成せずに、特徴量間で補間特徴量を生成すると、ほぼ同一の補間特徴量が多数生成される可能性があり、その場合は、記憶領域を浪費することになる。これに対して、本実施形態では、代表特徴量を用いて補間特徴量を生成しているので、生成される補間特徴量がほぼ同一となる可能性を減らすことができ、記憶領域の有効利用が可能になる。 Further, in this embodiment, representative feature amounts are generated by collecting feature amounts that can be regarded as substantially the same in the feature amount space (that is, within a predetermined distance), and an interpolation feature amount is generated using the representative feature amount. Yes. Here, if an interpolated feature amount is generated between feature amounts without generating a representative feature amount, a large number of substantially the same interpolated feature amounts may be generated. In this case, a storage area is wasted. Become. On the other hand, in this embodiment, since the interpolation feature value is generated using the representative feature value, it is possible to reduce the possibility that the generated interpolation feature value is substantially the same, and to effectively use the storage area. Is possible.
したがって、本実施形態によれば、少ない計算資源を用いて、迅速に、有効な学習データを生成することが可能になるという利点がある。 Therefore, according to the present embodiment, there is an advantage that effective learning data can be generated quickly using a small number of computing resources.
(第2実施形態)
次に、本発明の第2実施形態に係る学習用局所特徴量生成装置を、図4を参照しながら説明する。なお、この第2実施形態の説明においては、前記した第1実施形態と基本的に共通する機能要素については、同一符号を付すことにより、説明の煩雑を避ける。
(Second Embodiment)
Next, a learning local feature generating apparatus according to a second embodiment of the present invention will be described with reference to FIG. In the description of the second embodiment, functional elements that are basically the same as those of the first embodiment described above are denoted by the same reference numerals, thereby avoiding complicated description.
前記した第1実施形態では、特徴量集約部9が補間特徴量生成部4の上流側に配置され(図1参照)、特徴量を集約(図2のステップSA−5)した後に補間特徴量を生成していた。これに対して、第2実施形態では、特徴量集約部9が補間特徴量生成部4の下流側に配置され(図4参照)、補間特徴量を生成した後に特徴量を集約する。
In the first embodiment described above, the feature
すなわち、本実施形態の特徴量集約部9は、補間特徴量生成部4により生成された補間特徴量に対して特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの補間特徴量及び局所特徴量から代表特徴量を生成する構成となっている。さらに、本例の学習データ特定部5は、特徴量集約部9において生成された代表特徴量がある場合には、この代表特徴量を補間特徴量として、学習用の局所特徴量を特定する構成となっている。
That is, the feature
図5を参照しながら、第2実施形態における学習用局所特徴量の生成方法を説明する。 With reference to FIG. 5, a method for generating a local feature amount for learning in the second embodiment will be described.
(図5のステップSB−1〜SB−4)
これらのステップは、図2のステップSA−1〜SA−4と基本的に同様なので、詳しい説明は省略する。生成される特徴量空間の例を図6(a)に示す。
(Steps SB-1 to SB-4 in FIG. 5)
These steps are basically the same as steps SA-1 to SA-4 in FIG. An example of the generated feature amount space is shown in FIG.
(図5のステップSB−5)
ついで、第2実施形態では、補間特徴量生成部4が、第1実施形態と同様に、補間特徴量を生成する。ただし、第2実施形態では、代表特徴量を生成するよりも前に補間特徴量を生成するので、図6(b)に示すように、距離が近い補間特徴量が多数生成される。なお、図6(b)においても、生成された補間特徴量を▲で示している。
(Step SB-5 in FIG. 5)
Next, in the second embodiment, the interpolation feature
(図5のステップSB−6)
ついで、第2実施形態では、特徴量集約部9が、特徴量の集約を行う。代表特徴量1001〜1003(図6(b)参照)の生成については、前記した第1実施形態と同様である。さらに、第2実施形態では、生成された補間特徴量が他の補間特徴量と近接している場合がある(図6(b)において2点鎖線で囲った特徴量を参照)。その場合には、これらの特徴量を集約して、代表特徴量(図示せず)を生成する。そして、その代表特徴量を、集約された特徴量に代えて用いることができる。
(Step SB-6 in FIG. 5)
Next, in the second embodiment, the feature
以降の処理は、前記した第1実施形態と同様なので、詳しい説明は省略する。 Since the subsequent processing is the same as that of the first embodiment, detailed description thereof is omitted.
また、第2実施形態における前記以外の構成及び利点は、前記した第1実施形態と同様なので、詳しい説明は省略する。 In addition, since the configuration and advantages other than those described above in the second embodiment are the same as those in the first embodiment described above, detailed description thereof is omitted.
(第3実施形態)
次に、本発明の第3実施形態に係る画像認識装置を、図7を参照しながら説明する。なお、この第3実施形態の説明においては、前記した第1実施形態と基本的に共通する機能要素については、同一符号を付すことにより、説明の煩雑を避ける。
(Third embodiment)
Next, an image recognition apparatus according to a third embodiment of the present invention will be described with reference to FIG. In the description of the third embodiment, functional elements that are basically the same as those of the first embodiment described above are denoted by the same reference numerals, thereby avoiding complicated description.
第3実施形態の画像認識装置は、学習部100と認識部200とを備えている。
The image recognition apparatus according to the third embodiment includes a
学習部100は、第1実施形態又は第2実施形態で説明した学習用局所特徴量生成装置に対応する機能要素である。
The
認識部200は、対象画像(いわゆるクエリ画像)の認識を行うための機能要素である。本実施形態の認識部200は、対象画像に対応する局所特徴量を、学習部100で生成された学習用局所特徴量(学習データ)から検索することによって、対象画像の認識を行う構成となっている。このような認識部200の構成としては、既存の認識装置と同様とすることができるので、詳しい説明は省略する。
The
前記した各実施形態の動作は、コンピュータに適宜のコンピュータソフトウエアを組み込むことにより実施することができる。 The operations of the above-described embodiments can be implemented by incorporating appropriate computer software into the computer.
なお、本発明の内容は、前記実施形態に限定されるものではない。本発明は、特許請求の範囲に記載された範囲内において、具体的な構成に対して種々の変更を加えうるものである。 The contents of the present invention are not limited to the above embodiment. In the present invention, various modifications can be made to the specific configuration within the scope of the claims.
例えば、前記した各構成要素は、機能ブロックとして存在していればよく、独立したハードウエアとして存在しなくても良い。また、実装方法としては、ハードウエアを用いてもコンピュータソフトウエアを用いても良い。さらに、本発明における一つの機能要素が複数の機能要素の集合によって実現されても良く、本発明における複数の機能要素が一つの機能要素により実現されても良い。 For example, each component described above may exist as a functional block, and may not exist as independent hardware. As a mounting method, hardware or computer software may be used. Furthermore, one functional element in the present invention may be realized by a set of a plurality of functional elements, and a plurality of functional elements in the present invention may be realized by one functional element.
また、機能要素は、物理的に離間した位置に配置されていてもよい。この場合、機能要素どうしがネットワークにより接続されていても良い。グリッドコンピューティング又はクラウドコンピューティングにより機能を実現し、あるいは機能要素を構成することも可能である。 Moreover, the functional element may be arrange | positioned in the position physically separated. In this case, the functional elements may be connected by a network. It is also possible to realize functions or configure functional elements by grid computing or cloud computing.
1 画像変換部
2 特徴量取得部
3 特徴量位置判定部
4 補間特徴量生成部
5 学習データ特定部
6 画像DB
7 特徴量DB
8 画像取得部
9 特徴量集約部
100 学習部(学習用局所特徴量生成装置)
200 認識部
101 学習画像
102 変換画像
1001〜1003 代表特徴量(局所特徴量)
1011 学習画像に基づく局所特徴量
1021〜1028 変換画像に基づく局所特徴量
1101〜1109 生成された補間特徴量
DESCRIPTION OF
7 Feature DB
8
200
1011 Local feature amount based on learning
Claims (9)
前記学習画像を変換して変換画像を生成する画像変換部と、
前記学習画像と前記変換画像とのそれぞれについて、画像の局所的特徴に基づく局所特徴量を取得する特徴量取得部と、
前記特徴量取得部により取得された前記局所特徴量のうちから、画像空間上での距離が既定範囲内である局所特徴量を特定する特徴量位置判定部と、
前記画像空間上での距離が既定範囲内である局所特徴量のうち、前記学習画像に対応する局所特徴量と、前記変換画像に対応する局所特徴量との間に、特徴量空間上での距離に基づいて補間特徴量を生成する補間特徴量生成部と、
前記補間特徴量を少なくとも用いて学習用の局所特徴量を特定する学習データ特定部と
を備えることを特徴とする、学習用局所特徴量生成装置。 An apparatus for generating a local feature for learning using a learning image,
An image converter that converts the learning image to generate a converted image;
For each of the learning image and the converted image, a feature amount acquisition unit that acquires a local feature amount based on a local feature of the image;
From among the feature acquiring the local feature amount acquired by unit, a feature amount position determining unit that identifies a local feature amount which is within the distance specified range in the image space,
Of distance on the image space of the local feature amount is within a predetermined range, and the local feature amount corresponding to the learning image, between the local feature amount corresponding to the transformed image, on the feature amount space An interpolation feature generating unit that generates an interpolation feature based on the distance;
A learning local feature generating apparatus comprising: a learning data specifying unit that specifies a local feature for learning using at least the interpolation feature.
請求項1に記載の学習用局所特徴量生成装置。 The learning local feature generating apparatus according to claim 1.
前記特徴量集約部は、前記特徴量位置判定部により特定された、画像空間上での距離が既定範囲内である局所特徴量のうち、特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの局所特徴量から代表特徴量を生成し、この代表特徴量により、前記特徴量空間での前記既定距離内にある局所特徴量を代表させる構成となっており、
さらに、前記補間特徴量生成部は、前記特徴量集約部において生成された代表特徴量がある場合には、この代表特徴量を前記局所特徴量として、前記補間特徴量を生成する構成となっている
請求項1又は2に記載の学習用局所特徴量生成装置。 Furthermore, it has a feature amount aggregation unit,
The feature amount aggregating unit, the identified by the feature position determining unit, among distances in image space is local feature quantity is within a predetermined range, local features that are present within a predetermined distance in the feature quantity space If there is, a representative feature amount is generated from these local feature amounts, and the representative feature amount is configured to represent the local feature amount within the predetermined distance in the feature amount space ,
Furthermore, when there is a representative feature amount generated by the feature amount aggregation unit, the interpolation feature amount generation unit generates the interpolation feature amount using the representative feature amount as the local feature amount. The learning local feature generating apparatus according to claim 1 or 2 .
前記特徴量集約部は、前記補間特徴量生成部により生成された補間特徴量に対して特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの補間特徴量及び局所特徴量から代表特徴量を生成する構成となっており、
さらに、前記学習データ特定部は、前記特徴量集約部において生成された代表特徴量がある場合には、この代表特徴量を前記補間特徴量として、前記学習用の局所特徴量を特定する構成となっている
請求項1又は2に記載の学習用局所特徴量生成装置。 Furthermore, it has a feature amount aggregation unit,
The feature amount aggregating unit, when there is a local feature amount existing within a predetermined distance in the feature amount space with respect to the interpolation feature amount generated by the interpolation feature amount generation unit, It is configured to generate representative feature values from feature values,
Further, the learning data specifying unit, when there is a representative feature amount generated in the feature amount aggregating unit, specifies the local feature amount for learning using the representative feature amount as the interpolation feature amount, The learning local feature generating apparatus according to claim 1 or 2 .
請求項1〜4のいずれか1項に記載の学習用局所特徴量生成装置。 The interpolated feature value generating unit, learning local feature amount generating apparatus according to any one of interpolation claims feature amount has a configuration which generates 1 to 4 for each predetermined distance in the feature quantity space .
請求項1〜5のいずれか1項に記載の学習用局所特徴量生成装置。 The learning data specifying unit includes a local feature amount acquired from the learning image, a local feature amount acquired from the converted image, and a distance on the feature amount space with respect to these local feature amounts within a predetermined range. The local feature-value generator for learning according to any one of claims 1 to 5 , wherein the local feature-value is further specified as a local feature-value for learning.
前記認識部は、
前記対象画像に対応する局所特徴量を、前記学習用局所特徴量生成装置で生成された学習用局所特徴量から検索することによって、前記対象画像の認識を行う構成となっている
画像認識装置。 The learning local feature generation device according to any one of claims 1 to 6 , and a recognition unit for recognizing a target image,
The recognition unit
An image recognition device configured to recognize the target image by searching a local feature amount corresponding to the target image from a local feature amount for learning generated by the local feature amount generation device for learning.
前記学習画像を変換して変換画像を生成する画像変換ステップと、
前記学習画像と前記変換画像とのそれぞれについて、画像の局所的特徴に基づく局所特徴量を取得する特徴量取得ステップと、
前記特徴量取得ステップにおいて取得された前記局所特徴量のうちから、画像空間上での距離が既定範囲内である局所特徴量を特定する特徴量位置判定ステップと、
前記画像空間上での距離が既定範囲内である局所特徴量のうち、前記学習画像に対応する局所特徴量と、前記変換画像に対応する局所特徴量との間に、特徴量空間上での距離に基づいて補間特徴量を生成する補間特徴量生成ステップと、
前記補間特徴量を少なくとも用いて学習用の局所特徴量を特定する学習データ特定ステップと
を備えることを特徴とする生成方法。 A method for generating a local feature for learning using a device for generating a local feature for learning using a learning image,
An image conversion step of converting the learning image to generate a converted image;
A feature amount acquisition step for acquiring a local feature amount based on a local feature of the image for each of the learning image and the converted image;
From among the local feature amount obtained in the feature amount obtaining step, the feature amount position determination step of specifying a local feature amount which is within the distance specified range in the image space,
Of distance on the image space of the local feature amount is within a predetermined range, and the local feature amount corresponding to the learning image, between the local feature amount corresponding to the transformed image, on the feature amount space An interpolation feature generation step for generating an interpolation feature based on the distance;
A learning data specifying step of specifying a local feature quantity for learning using at least the interpolation feature quantity.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013238396A JP5882976B2 (en) | 2013-11-19 | 2013-11-19 | Learning local feature generating apparatus and learning local feature generating method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013238396A JP5882976B2 (en) | 2013-11-19 | 2013-11-19 | Learning local feature generating apparatus and learning local feature generating method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2015099453A JP2015099453A (en) | 2015-05-28 |
| JP5882976B2 true JP5882976B2 (en) | 2016-03-09 |
Family
ID=53376039
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013238396A Active JP5882976B2 (en) | 2013-11-19 | 2013-11-19 | Learning local feature generating apparatus and learning local feature generating method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5882976B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6444331B2 (en) * | 2016-03-31 | 2018-12-26 | セコム株式会社 | Object identification device |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5183392B2 (en) * | 2008-09-25 | 2013-04-17 | キヤノン株式会社 | Image processing apparatus, image processing method, and program |
-
2013
- 2013-11-19 JP JP2013238396A patent/JP5882976B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2015099453A (en) | 2015-05-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5183392B2 (en) | Image processing apparatus, image processing method, and program | |
| JP5261501B2 (en) | Permanent visual scene and object recognition | |
| JP6320649B1 (en) | Machine learning device and image recognition device | |
| CN101669117A (en) | Use matching images with shape descriptors | |
| TW201616450A (en) | System and method for selecting point clouds using a brush tool | |
| JP6075294B2 (en) | Image processing system and image processing method | |
| WO2018189962A1 (en) | Object recognition device, object recognition system, and object recognition method | |
| CN109871249B (en) | Remote desktop operation method and device, readable storage medium and terminal equipment | |
| JP5560925B2 (en) | 3D shape search device, 3D shape search method, and program | |
| JP5882976B2 (en) | Learning local feature generating apparatus and learning local feature generating method | |
| CN111753722A (en) | A fingerprint recognition method and device based on feature point type | |
| CN119672766A (en) | Method, storage medium, electronic device and product for detecting hand joints in eyewear equipment | |
| KR102617732B1 (en) | Methods and apparatus for processing image data for machine vision | |
| JP2013054457A (en) | Image processing device, image processing method, and program | |
| JP5602184B2 (en) | Feature value generation apparatus and feature value generation method | |
| KR101359661B1 (en) | conversion system and method for 3D object represented by triangle mesh to 3D object represented by DoSurface | |
| JP2011014052A (en) | Image identifying device, image identifying method, identifier creating device, identifier creating method and imaging system | |
| CN117746433A (en) | Text detection method and device, electronic equipment and storage medium | |
| JP6478301B2 (en) | Image discrimination device, image discrimination method, and program | |
| JP6056354B2 (en) | Image processing apparatus, image processing method, and image processing program | |
| JP6399518B2 (en) | Processing device, processing method, and program | |
| JP6066282B2 (en) | Image processing apparatus, image processing program, and image processing method | |
| KR101692168B1 (en) | Method for Device for Matching Heterogenous Stereo Images | |
| JP6336827B2 (en) | Image search device, image search method, and search system | |
| JP6453618B2 (en) | Calculation apparatus, method and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150828 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150908 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151106 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160126 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160204 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5882976 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |