Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP5882976B2 - Learning local feature generating apparatus and learning local feature generating method - Google Patents
[go: Go Back, main page]

JP5882976B2 - Learning local feature generating apparatus and learning local feature generating method - Google Patents

Learning local feature generating apparatus and learning local feature generating method Download PDF

Info

Publication number
JP5882976B2
JP5882976B2 JP2013238396A JP2013238396A JP5882976B2 JP 5882976 B2 JP5882976 B2 JP 5882976B2 JP 2013238396 A JP2013238396 A JP 2013238396A JP 2013238396 A JP2013238396 A JP 2013238396A JP 5882976 B2 JP5882976 B2 JP 5882976B2
Authority
JP
Japan
Prior art keywords
feature amount
learning
image
local feature
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013238396A
Other languages
Japanese (ja)
Other versions
JP2015099453A (en
Inventor
岩崎 雅二郎
雅二郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2013238396A priority Critical patent/JP5882976B2/en
Publication of JP2015099453A publication Critical patent/JP2015099453A/en
Application granted granted Critical
Publication of JP5882976B2 publication Critical patent/JP5882976B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像認識のための学習に用いる局所特徴量を生成する技術に関するものである。   The present invention relates to a technique for generating local feature values used for learning for image recognition.

画像認識のために局所特徴量を用いる技術が提案されている(下記特許文献1)。局所特徴量とは、画像の局所的な特徴を数値化して得られる量であり、通常はベクトル量として表される。局所特徴量を用いることにより、類似画像の検索あるいは同一画像の特定を行うことができる。   A technique using a local feature amount for image recognition has been proposed (Patent Document 1 below). The local feature amount is an amount obtained by quantifying local features of an image, and is usually expressed as a vector amount. By using local feature amounts, it is possible to search for similar images or specify the same image.

ところで、ある画像から抽出された局所特徴量は、その画像の撮影状態(例えば輝度や解像度の変化など)に特化したものとなっている。すなわち、同一の内容を表す画像であっても、その画像の撮影状態が変化すれば、異なる局所特徴量となることが多い。   By the way, the local feature amount extracted from a certain image is specialized for the shooting state of the image (for example, change in luminance, resolution, etc.). That is, even if the images represent the same content, if the shooting state of the images changes, different local feature amounts are often obtained.

そこで、一つの学習画像に画像変換(例えば輝度や解像度の変更)を行い、得られた変換画像から局所特徴量を抽出することで大量の学習用の局所特徴量を抽出する手法が考えられる(例えば下記特許文献1参照)。例えば、1種類の画像変換を用いた場合でも、異なるパラメータを用いて多数の変換画像を生成した上で、局所特徴量を生成すれば、多くの局所特徴量を得ることができる。画像変換の種類を複数とすれば、さらに局所特徴量を増やすことができる。ただし、この手法では、以下の問題を生じる。
・一般的に、特徴量ベクトルとしてほぼ同一の局所特徴量が複数生成されるので、無駄に記憶域を必要とする。
・1種類の画像変換に対して異なるパラメータにより画像変換を行って多数の変換画像を生成した上で、多数の変換画像から局所特徴量を生成する処理には、多量の計算資源及び時間を要する。
Therefore, a method of extracting a large amount of local feature values for learning by performing image conversion (for example, changing brightness and resolution) on one learning image and extracting local feature values from the obtained converted image is conceivable (see FIG. For example, see Patent Document 1 below). For example, even when one type of image conversion is used, a large number of local feature amounts can be obtained by generating a large number of converted images using different parameters and then generating local feature amounts. If there are a plurality of types of image conversion, the local feature amount can be further increased. However, this method causes the following problems.
In general, since a plurality of substantially the same local feature quantities are generated as feature quantity vectors, a storage area is uselessly required.
-A large amount of computational resources and time are required for processing to generate local feature amounts from a large number of converted images after generating a large number of converted images by performing image conversion with different parameters for one type of image conversion. .

特開2010-079545JP2010-079545

本発明は、前記した状況に鑑みてなされたものである。本発明の主な目的は、多くの学習用の局所特徴量を簡易かつ迅速に生成することが可能な装置又は方法を提供することである。   The present invention has been made in view of the above situation. A main object of the present invention is to provide an apparatus or method that can easily and quickly generate many local features for learning.

(項目1)
学習画像を用いて学習用の局所特徴量を生成するための装置であって、
前記学習画像を変換して変換画像を生成する画像変換部と、
前記学習画像と前記変換画像とのそれぞれについて、画像の局所的特徴に基づく局所特徴量を取得する特徴量取得部と、
画像空間上の位置がほぼ同一である局所特徴量を特定する特徴量位置判定部と、
前記画像空間上の位置がほぼ同一である局所特徴量のうち、前記学習画像に対応する局所特徴量と、前記変換画像に対応する局所特徴量との間に、特徴量空間上での距離に基づいて補間特徴量を生成する補間特徴量生成部と、
前記補間特徴量を少なくとも用いて学習用の局所特徴量を特定する学習データ特定部と
を備えることを特徴とする、学習用局所特徴量生成装置。
(Item 1)
An apparatus for generating a local feature for learning using a learning image,
An image converter that converts the learning image to generate a converted image;
For each of the learning image and the converted image, a feature amount acquisition unit that acquires a local feature amount based on a local feature of the image;
A feature amount position determination unit that identifies local feature amounts whose positions on the image space are substantially the same;
Among the local feature quantities having substantially the same position in the image space, the distance in the feature quantity space is between the local feature quantity corresponding to the learning image and the local feature quantity corresponding to the converted image. An interpolation feature value generation unit that generates an interpolation feature value based on the
A learning local feature generating apparatus comprising: a learning data specifying unit that specifies a local feature for learning using at least the interpolation feature.

(項目2)
さらに、特徴量集約部を備えており、
前記特徴量集約部は、前記特徴量位置判定部により特定された、画像空間上の位置がほぼ同一である局所特徴量のうち、特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの局所特徴量から代表特徴量を生成し、この代表特徴量により前記既定距離内にある局所特徴量を代表させる構成となっており、
さらに、前記補間特徴量生成部は、前記特徴量集約部において生成された代表特徴量がある場合には、この代表特徴量を前記局所特徴量として、前記補間特徴量を生成する構成となっている
項目1に記載の学習用局所特徴量生成装置。
(Item 2)
Furthermore, it has a feature amount aggregation unit,
The feature amount aggregating unit includes a local feature amount existing within a predetermined distance in the feature amount space among the local feature amounts identified by the feature amount position determining unit and having substantially the same position in the image space. In this case, representative feature amounts are generated from these local feature amounts, and the local feature amounts within the predetermined distance are represented by the representative feature amounts.
Furthermore, when there is a representative feature amount generated by the feature amount aggregation unit, the interpolation feature amount generation unit generates the interpolation feature amount using the representative feature amount as the local feature amount. The learning local feature generating apparatus according to Item 1.

(項目3)
さらに、特徴量集約部を備えており、
前記特徴量集約部は、前記補間特徴量生成部により生成された補間特徴量に対して特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの補間特徴量及び局所特徴量から代表特徴量を生成する構成となっており、
さらに、前記学習データ特定部は、前記特徴量集約部において生成された代表特徴量がある場合には、この代表特徴量を前記補間特徴量として、前記学習用の局所特徴量を特定する構成となっている
項目1に記載の学習用局所特徴量生成装置。
(Item 3)
Furthermore, it has a feature amount aggregation unit,
The feature amount aggregating unit, when there is a local feature amount existing within a predetermined distance in the feature amount space with respect to the interpolation feature amount generated by the interpolation feature amount generation unit, It is configured to generate representative feature values from feature values,
Further, the learning data specifying unit, when there is a representative feature amount generated in the feature amount aggregating unit, specifies the local feature amount for learning using the representative feature amount as the interpolation feature amount, The learning local feature generating apparatus according to Item 1.

(項目4)
前記補間特徴量生成部は、特徴量空間上での既定距離ごとに前記補間特徴量を生成する構成となっている
項目1〜3のいずれか1項に記載の学習用局所特徴量生成装置。
(Item 4)
The local feature-value generating device for learning according to any one of items 1 to 3, wherein the interpolation feature-value generating unit is configured to generate the interpolation feature value for each predetermined distance in a feature-value space.

(項目5)
前記学習データ特定部は、前記学習画像から取得された局所特徴量と、前記変換画像から取得された局所特徴量と、これらの局所特徴量に対して特徴量空間上でほぼ同一の局所特徴量とのいずれかを学習用の局所特徴量としてさらに特定する構成となっている
項目1〜4のいずれか1項に記載の学習用局所特徴量生成装置。
(Item 5)
The learning data specifying unit includes a local feature amount acquired from the learning image, a local feature amount acquired from the converted image, and a local feature amount that is substantially the same in the feature amount space for these local feature amounts. The learning local feature-value generating device according to any one of Items 1 to 4, wherein the learning local feature-value generating apparatus is further specified as a local feature-value for learning.

(項目6)
項目1〜5のいずれか1項に記載の学習用局所特徴量生成装置と、対象画像の認識を行うための認識部とを備えており、
前記認識部は、
前記対象画像に対応する局所特徴量を、前記学習用局所特徴量生成装置で生成された学習用局所特徴量から検索することによって、前記対象画像の認識を行う構成となっている
画像認識装置。
(Item 6)
Comprising the learning local feature generation device according to any one of items 1 to 5 and a recognition unit for recognizing a target image;
The recognition unit
An image recognition device configured to recognize the target image by searching a local feature amount corresponding to the target image from a local feature amount for learning generated by the local feature amount generation device for learning.

(項目7)
学習画像を用いて学習用の局所特徴量を生成するための装置を用いた学習用局所特徴量の生成方法であって、
前記学習画像を変換して変換画像を生成する画像変換ステップと、
前記学習画像と前記変換画像とのそれぞれについて、画像の局所的特徴に基づく局所特徴量を取得する特徴量取得ステップと、
画像空間上の位置がほぼ同一である局所特徴量を特定する特徴量位置判定ステップと、
前記画像空間上の位置がほぼ同一である局所特徴量のうち、前記学習画像に対応する局所特徴量と、前記変換画像に対応する局所特徴量との間に、特徴量空間上での距離に基づいて補間特徴量を生成する補間特徴量生成ステップと、
前記補間特徴量を少なくとも用いて学習用の局所特徴量を特定する学習データ特定ステップと
を備えることを特徴とする生成方法。
(Item 7)
A method for generating a local feature for learning using a device for generating a local feature for learning using a learning image,
An image conversion step of converting the learning image to generate a converted image;
A feature amount acquisition step for acquiring a local feature amount based on a local feature of the image for each of the learning image and the converted image;
A feature amount position determining step for identifying local feature amounts whose positions on the image space are substantially the same;
Among the local feature quantities having substantially the same position in the image space, the distance in the feature quantity space is between the local feature quantity corresponding to the learning image and the local feature quantity corresponding to the converted image. An interpolation feature generation step for generating an interpolation feature based on the basis;
A learning data specifying step of specifying a local feature quantity for learning using at least the interpolation feature quantity.

(項目8)
項目7に記載の各ステップをコンピュータに実行させるためのコンピュータプログラム。
(Item 8)
A computer program for causing a computer to execute each step according to item 7.

このコンピュータプログラムは、適宜な記録媒体(例えばCD−ROMやDVDディスクのような光学的な記録媒体、ハードディスクやフレキシブルディスクのような磁気的記録媒体、あるいはMOディスクのような光磁気記録媒体)に格納することができる。このコンピュータプログラムは、インターネットなどの通信回線を介して伝送されることができる。   This computer program is stored in an appropriate recording medium (for example, an optical recording medium such as a CD-ROM or a DVD disk, a magnetic recording medium such as a hard disk or a flexible disk, or a magneto-optical recording medium such as an MO disk). Can be stored. This computer program can be transmitted via a communication line such as the Internet.

本発明によれば、多くの学習用の局所特徴量を、比較的に簡易な手法により迅速に生成することが可能となる。   According to the present invention, it is possible to quickly generate many local feature quantities for learning by a relatively simple method.

本発明の第1実施形態における学習用局所特徴量生成装置の概略を説明するためのブロック図である。It is a block diagram for demonstrating the outline of the local feature-value generator for learning in 1st Embodiment of this invention. 図1の装置を用いて学習用局所特徴量を生成する手順を説明するためのフローチャートである。It is a flowchart for demonstrating the procedure which produces | generates the local feature-value for learning using the apparatus of FIG. 図1の装置を用いて学習用局所特徴量を生成する手順を説明するための説明図である。It is explanatory drawing for demonstrating the procedure which produces | generates the local feature-value for learning using the apparatus of FIG. 本発明の第2実施形態における学習用局所特徴量生成装置の概略を説明するためのブロック図である。It is a block diagram for demonstrating the outline of the local feature-value production | generation apparatus for learning in 2nd Embodiment of this invention. 図4の装置を用いて学習用局所特徴量を生成する手順を説明するためのフローチャートである。It is a flowchart for demonstrating the procedure which produces | generates the local feature-value for learning using the apparatus of FIG. 図4の装置を用いて学習用局所特徴量を生成する手順を説明するための説明図である。It is explanatory drawing for demonstrating the procedure which produces | generates the local feature-value for learning using the apparatus of FIG. 本発明の第3実施形態に係る画像認識装置の概略を示すブロック図である。It is a block diagram which shows the outline of the image recognition apparatus which concerns on 3rd Embodiment of this invention.

(第1実施形態の構成)
本発明の第1実施形態に係る学習用局所特徴量生成装置の構成を、図1を参照しながら説明する。この装置は、学習画像を用いて学習用の局所特徴量を生成するためのものである。
(Configuration of the first embodiment)
The configuration of the learning local feature generating apparatus according to the first embodiment of the present invention will be described with reference to FIG. This apparatus is for generating a local feature amount for learning using a learning image.

本実施形態の装置は、画像変換部1と、特徴量取得部2と、特徴量位置判定部3と、補間特徴量生成部4と、学習データ特定部5とを備えている。さらに、本実施形態の装置は、画像DB6と、特徴量DB7と、画像取得部8と、特徴量集約部9とを追加的な要素として備えている。   The apparatus according to this embodiment includes an image conversion unit 1, a feature amount acquisition unit 2, a feature amount position determination unit 3, an interpolation feature amount generation unit 4, and a learning data specification unit 5. Furthermore, the apparatus according to the present embodiment includes an image DB 6, a feature amount DB 7, an image acquisition unit 8, and a feature amount aggregation unit 9 as additional elements.

画像変換部1は、学習画像(後述)を変換して変換画像(後述)を生成する構成となっている。   The image conversion unit 1 is configured to convert a learning image (described later) to generate a converted image (described later).

特徴量取得部2は、学習画像と変換画像とのそれぞれについて、画像の局所的特徴に基づく局所特徴量を取得する構成となっている。   The feature amount acquisition unit 2 is configured to acquire local feature amounts based on local features of the image for each of the learning image and the converted image.

特徴量位置判定部3は、画像空間上の位置がほぼ同一である局所特徴量を特定する構成となっている。ここで、画像空間とは、いわゆるピクセル空間あるいはピクセル座標を意味する。2次元画像を前提とすれば、画像空間は、一般的に(x,y)座標系で表されるが、座標系を制限するものではない。   The feature amount position determination unit 3 is configured to identify local feature amounts whose positions in the image space are substantially the same. Here, the image space means a so-called pixel space or pixel coordinates. Assuming a two-dimensional image, the image space is generally expressed in the (x, y) coordinate system, but the coordinate system is not limited.

補間特徴量生成部4は、画像空間上の位置がほぼ同一である局所特徴量のうち、学習画像に対応する局所特徴量と、変換画像に対応する局所特徴量との間に、特徴量空間上での距離に基づいて補間特徴量を生成する構成となっている。   The interpolated feature amount generation unit 4 includes a feature amount space between a local feature amount corresponding to the learning image and a local feature amount corresponding to the converted image among local feature amounts having substantially the same position in the image space. The interpolation feature amount is generated based on the above distance.

さらに、本例の補間特徴量生成部4は、後述する特徴量集約部9において生成された代表特徴量がある場合には、この代表特徴量を局所特徴量として、補間特徴量を生成する構成となっている。   Furthermore, when there is a representative feature amount generated by a feature amount aggregating unit 9 described later, the interpolation feature amount generation unit 4 of this example generates an interpolation feature amount using the representative feature amount as a local feature amount. It has become.

また、本例の補間特徴量生成部4は、特徴量空間上での既定距離ごとに補間特徴量を生成する構成となっている。   Further, the interpolation feature value generation unit 4 of this example is configured to generate an interpolation feature value for each predetermined distance in the feature value space.

学習データ特定部5は、補間特徴量を用いて学習用の局所特徴量を特定する構成となっている。   The learning data specifying unit 5 is configured to specify a local feature amount for learning using an interpolation feature amount.

さらに、本例の学習データ特定部5は、補間特徴量に加えて、学習画像から取得された局所特徴量と、変換画像から取得された局所特徴量と、これらの局所特徴量に対して特徴量空間上でほぼ同一の局所特徴量とのいずれか又は全てを、学習用の局所特徴量として特定する構成となっている。   Further, the learning data specifying unit 5 of the present example, in addition to the interpolation feature amount, the local feature amount acquired from the learning image, the local feature amount acquired from the converted image, and features for these local feature amounts The configuration is such that any or all of the local feature values that are substantially the same in the quantity space are specified as local feature values for learning.

本実施形態の画像DB6は、学習画像となるべき画像群を記録しておくデータベースである。学習画像は、例えば、何らかの商品の画像であるが、画像の種類には特段の制約はない。また、画像は、商品を撮影することによって取得されたものであっても、インターネットなどのネットワーク上から取得されたものでもよい。すなわち、画像の取得経路も特に制約されない。   The image DB 6 of this embodiment is a database that records an image group to be a learning image. The learning image is, for example, an image of some product, but there are no particular restrictions on the type of image. Further, the image may be acquired by photographing a product or acquired from a network such as the Internet. That is, the image acquisition path is not particularly limited.

特徴量DB7は、学習データ特定部5によって特定された学習用の局所特徴量を格納するデータベースである。特徴量DB7は、クエリ画像の認識(照合)において使用される。   The feature amount DB 7 is a database that stores local feature amounts for learning specified by the learning data specifying unit 5. The feature amount DB 7 is used in query image recognition (collation).

画像取得部8は、画像DB6から学習用の画像を取得する機能要素である。具体的には、画像取得部8は、画像データの入力を受け付けるインタフェースである。   The image acquisition unit 8 is a functional element that acquires a learning image from the image DB 6. Specifically, the image acquisition unit 8 is an interface that accepts input of image data.

特徴量集約部9は、特徴量位置判定部3により特定された、画像空間上の位置がほぼ同一である局所特徴量のうち、特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの局所特徴量から代表特徴量を生成し、この代表特徴量により既定距離内にある局所特徴量を代表させる構成となっている。   The feature quantity aggregating unit 9 includes local feature quantities that exist within a predetermined distance in the feature quantity space among local feature quantities that are identified by the feature quantity position determination unit 3 and that have substantially the same position in the image space. In this case, representative feature amounts are generated from these local feature amounts, and local feature amounts within a predetermined distance are represented by the representative feature amounts.

本実施形態の装置の詳細については、後述する動作の説明においてさらに詳しく説明する。   Details of the apparatus of the present embodiment will be described in more detail in the description of operations described later.

(第1実施形態の動作)
つぎに、前記した生成装置を用いて学習用の局所特徴量を生成する方法の一例を、図2〜図3をさらに参照しながら説明する。
(Operation of the first embodiment)
Next, an example of a method for generating a local feature amount for learning using the above-described generation device will be described with further reference to FIGS.

(図2のステップSA−1)
まず、画像取得部8は、画像DB6から、学習画像(すなわち基本画像)101(図3(a)参照)を取得する。なお、図3に示す学習画像101はあくまで一例であり、その内容には特段の制約はない。また、画像取得部8は、画像DB6からではなく、何らかの手段で他の場所から取得した画像を取得して学習画像とすることができる。
(Step SA-1 in FIG. 2)
First, the image acquisition unit 8 acquires a learning image (that is, a basic image) 101 (see FIG. 3A) from the image DB 6. Note that the learning image 101 shown in FIG. 3 is merely an example, and there are no particular restrictions on the content thereof. Further, the image acquisition unit 8 can acquire an image acquired from another place by some means, not from the image DB 6, and use it as a learning image.

また、以降の説明では、1枚の学習画像101を用いた処理について説明するが、複数の学習画像を同時に取得して、以降の処理を並行して行うことも可能である。   Further, in the following description, processing using one learning image 101 will be described, but it is also possible to simultaneously acquire a plurality of learning images and perform the subsequent processing in parallel.

(図2のステップSA−2)
ついで、画像変換部1は、取得した学習画像101を変換して、変換画像102(図3(a)参照)を生成する。ここで、画像変換とは、例えば、輝度変更や解像度変更である。もちろん、アフィン変換のような複雑な変換を行うことも可能である。ただし、本例の手法では、比較的に単純な画像変換を採用した場合でも、後述するように、多数の学習データを生成することができ、したがって、画像変換における処理負担を軽減することが可能となる。なお、図3(a)では、1枚の変換画像102を示しているが、通常は、変換パラメータの変更又は変換の種類の変更により、複数の変換画像を生成して、それらについて以降の手順を実行する。生成する変換画像の枚数には特に制約はない。
(Step SA-2 in FIG. 2)
Next, the image conversion unit 1 converts the acquired learning image 101 to generate a converted image 102 (see FIG. 3A). Here, the image conversion is, for example, luminance change or resolution change. Of course, it is also possible to perform complex transformation such as affine transformation. However, with the method of this example, even when a relatively simple image conversion is adopted, as will be described later, a large number of learning data can be generated, and therefore the processing load in the image conversion can be reduced. It becomes. In FIG. 3A, one converted image 102 is shown. Usually, a plurality of converted images are generated by changing the conversion parameter or the type of conversion, and the subsequent procedure is performed for them. Execute. There is no particular limitation on the number of converted images to be generated.

(図2のステップSA−3)
ついで、特徴量取得部2は、学習画像101及び変換画像102のそれぞれについて、画像の局所的特徴に基づく局所特徴量を取得する。局所特徴量の取得方法としては、既存の手法(例えばSIFT)を用いることができるので、これについての詳しい説明は省略する。
(Step SA-3 in FIG. 2)
Next, the feature amount acquisition unit 2 acquires a local feature amount based on the local feature of the image for each of the learning image 101 and the converted image 102. Since an existing method (for example, SIFT) can be used as a local feature acquisition method, detailed description thereof will be omitted.

さらに、本実施形態の特徴量取得部2は、得られた局所特徴量の、画像空間上における位置を取得する。これにより、特定の局所特徴量と画像空間上における当該特徴量の位置とを対応させることができる。   Furthermore, the feature quantity acquisition unit 2 of the present embodiment acquires the position of the obtained local feature quantity in the image space. Thereby, a specific local feature-value and the position of the said feature-value on image space can be matched.

(図2のステップSA−4)
ついで、特徴量位置判定部3は、前記した局所特徴量のうちで、画像空間上の位置がほぼ同一である局所特徴量を特定する。図3(a)には、画像空間上の位置がほぼ同一(この例では左足の先端付近)である複数の局所特徴量を、特徴量空間上に配置した例を示す。なお、特徴量は、通常、多次元ベクトルで表現されるが、理解の容易のため、図3では、2次元平面上に特徴量を配置した例を示す。
(Step SA-4 in FIG. 2)
Next, the feature quantity position determination unit 3 identifies a local feature quantity whose position in the image space is substantially the same among the above-described local feature quantities. FIG. 3A shows an example in which a plurality of local feature amounts having substantially the same position in the image space (in this example, near the tip of the left foot) are arranged in the feature amount space. Note that the feature amount is usually expressed by a multidimensional vector. However, for easy understanding, FIG. 3 shows an example in which the feature amount is arranged on a two-dimensional plane.

図3(a)では、学習画像(つまり基本画像)101に対応する局所特徴量1011を白丸で表し、複数の変換画像102…に対応する局所特徴量1021〜1028を黒丸で表している。なお、局所特徴量1021〜1028のうちの一つは、基本的に、1枚の変換画像に対応している。また、図示した局所特徴量の個数はあくまで一例であり、i番目の変換画像に対応する局所特徴量は一般的に符号102iで示されるものとする。   In FIG. 3A, the local feature amount 1011 corresponding to the learning image (that is, the basic image) 101 is represented by white circles, and the local feature amounts 1021 to 1028 corresponding to the plurality of converted images 102 are represented by black circles. Note that one of the local feature amounts 1021 to 1028 basically corresponds to one converted image. In addition, the number of illustrated local feature amounts is merely an example, and the local feature amount corresponding to the i-th converted image is generally denoted by reference numeral 102i.

なお、「画像空間上の位置がほぼ同一」とは、画像空間上での当該局所特徴量間の距離(例えばピクセル数)が、既定範囲内(例えば2ピクセル以内)であることを意味する。この範囲は例えば実験的に決定することができる。また、前記したピクセル数はあくまで例示であって、それに制約されない。   Note that “the positions in the image space are substantially the same” means that the distance (for example, the number of pixels) between the local feature amounts in the image space is within a predetermined range (for example, within 2 pixels). This range can be determined experimentally, for example. The number of pixels described above is merely an example, and is not limited thereto.

(図2のステップSA−5)
ついで、特徴量集約部9は、画像空間上の位置がほぼ同一である局所特徴量(図3(a)参照)のうち、特徴量空間上において既定距離内に存在する局所特徴量があるかどうかを判定する。ここで、既定距離とは、特徴量空間における、局所特徴量間の距離であり、例えば実験的に決定することができる。
(Step SA-5 in FIG. 2)
Next, the feature amount aggregating unit 9 determines whether there is a local feature amount existing within a predetermined distance in the feature amount space among local feature amounts (see FIG. 3A) whose positions in the image space are substantially the same. Determine if. Here, the predetermined distance is a distance between local feature amounts in the feature amount space, and can be determined experimentally, for example.

ついで、特徴量集約部9は、特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの局所特徴量から代表特徴量を生成する。例えば、図3(a)の例では、局所特徴量1011及び1021〜1023が既定距離内に存在している。そこで、本例では、これらの特徴量から、代表特徴量1001を生成する(図3(b)参照)。同様に、図3(a)の例では、局所特徴量1024と1025とが既定距離内に存在している。そこで、本例では、これらの特徴量から、代表特徴量1002を生成する(図3(b)参照)。代表特徴量の生成手法としては、例えば
・既定距離内の特徴量のうちの任意の一つを選択する、あるいは
・既定距離内の特徴量の重心(あるいは平均)のベクトルデータを代表として生成する
という手法が考えられる。図示例は後者の手法を用いている。なお、後者の手法において、重心算出に用いる特徴量を何らかの基準で選択することも可能である。
Next, when there are local feature quantities existing within a predetermined distance in the feature quantity space, the feature quantity aggregation unit 9 generates a representative feature quantity from these local feature quantities. For example, in the example of FIG. 3A, the local feature amounts 1011 and 1021 to 1023 exist within a predetermined distance. Therefore, in this example, a representative feature quantity 1001 is generated from these feature quantities (see FIG. 3B). Similarly, in the example of FIG. 3A, the local feature quantities 1024 and 1025 exist within a predetermined distance. Therefore, in this example, a representative feature quantity 1002 is generated from these feature quantities (see FIG. 3B). As a representative feature amount generation method, for example, • select any one of feature amounts within a predetermined distance; or • generate vector data of the centroid (or average) of feature amounts within a predetermined distance as a representative. The method can be considered. The illustrated example uses the latter method. In the latter method, it is also possible to select a feature amount used for calculating the center of gravity on some basis.

このような集約操作を行うことによって、代表特徴量により既定距離内にある局所特徴量を代表させることができる。また、このような集約操作を行うことによって、後述するように、ほぼ同一の補間特徴量の生成を制約することができるという利点がある。   By performing such an aggregation operation, the local feature amount within the predetermined distance can be represented by the representative feature amount. In addition, by performing such an aggregation operation, there is an advantage that generation of substantially the same interpolation feature amount can be restricted as will be described later.

(図2のステップSA−6)
ついで、補間特徴量生成部4は、学習画像に対応する局所特徴量と、変換画像に対応する局所特徴量との間に、特徴量空間上での距離に基づいて補間特徴量を生成する。ただし、本例では、前記したように、学習画像に対応する局所特徴量1011を代表する代表特徴量1001が存在するので、この代表特徴量1001と、他の局所特徴量(本例では、局所特徴量1002、1027、1028)を用いて補間特徴量を生成する構成となっている。なお、局所特徴量1002は、他の二つの局所特徴量1024、1025を代表するものである。
(Step SA-6 in FIG. 2)
Next, the interpolation feature value generation unit 4 generates an interpolation feature value based on the distance in the feature value space between the local feature value corresponding to the learning image and the local feature value corresponding to the converted image. However, in this example, as described above, since there is a representative feature amount 1001 representing the local feature amount 1011 corresponding to the learning image, this representative feature amount 1001 and other local feature amounts (in this example, local features) Interpolated feature amounts are generated using feature amounts 1002, 1027, and 1028). Note that the local feature amount 1002 represents the other two local feature amounts 1024 and 1025.

さらに具体的には、本例の補間特徴量生成部4は、特徴量空間上での既定距離ごとに補間特徴量を生成する。例えば、局所特徴量1001と1002との間に、既定距離ごとに補間特徴量(図3(b)において▲で示す)1101〜1103を生成することができる。なお、この既定距離も、例えば実験的に決定することができる。   More specifically, the interpolation feature value generation unit 4 of the present example generates an interpolation feature value for each predetermined distance in the feature value space. For example, interpolation feature amounts (indicated by ▲ in FIG. 3B) 1101-1103 can be generated for each predetermined distance between the local feature amounts 1001 and 1002. This predetermined distance can also be determined experimentally, for example.

同様にして、局所特徴量1001と1027との間に、補間特徴量1104〜1106を生成し、局所特徴量1001と1028との間に、補間特徴量1107〜1109を生成することができる。   Similarly, interpolation feature amounts 1104 to 1106 can be generated between the local feature amounts 1001 and 1027, and interpolation feature amounts 1107 to 1109 can be generated between the local feature amounts 1001 and 1028.

また、本実施形態の特徴量集約部9は、生成された補間特徴量に対して既定距離内に他の特徴量が存在するかどうかを判定し、存在する場合にはそれらの特徴量を集約する。例えば、図3(b)の例では、生成された補間特徴量1105が、変換画像の局所特徴量1026に対して既定距離内にある。この場合は、これらの特徴量を代表するものとして、代表特徴量1003を生成することができる。   Further, the feature amount aggregating unit 9 of the present embodiment determines whether or not other feature amounts exist within a predetermined distance with respect to the generated interpolation feature amount, and if present, collects those feature amounts. To do. For example, in the example of FIG. 3B, the generated interpolation feature quantity 1105 is within a predetermined distance with respect to the local feature quantity 1026 of the converted image. In this case, a representative feature quantity 1003 can be generated as a representative of these feature quantities.

(図2のステップSA−7)
ついで、学習データ特定部5は、補間特徴量を用いて学習用の局所特徴量を特定する。より具体的には、本実施形態の学習データ特定部は、
・生成された補間特徴量
・変換画像の局所特徴量
・学習画像の局所特徴量
を、学習データとして特定する。
(Step SA-7 in FIG. 2)
Next, the learning data specifying unit 5 specifies a local feature amount for learning using the interpolation feature amount. More specifically, the learning data specifying unit of the present embodiment
The generated interpolation feature amount, the local feature amount of the converted image, and the local feature amount of the learning image are specified as learning data.

ただし、本例では、これらの局所特徴量に対して特徴量空間上でほぼ同一の局所特徴量が存在する場合(すなわち代表特徴量が存在する場合)は、これらの特徴量に代えて、代表特徴量を、学習用の局所特徴量として特定する。   However, in this example, when there is almost the same local feature quantity in the feature quantity space with respect to these local feature quantities (that is, when a representative feature quantity exists), instead of these feature quantities, a representative feature quantity is used. The feature amount is specified as a local feature amount for learning.

さらに、学習データ特定部5は、特定された特徴量を学習データとして特徴量DB7に格納する。   Further, the learning data specifying unit 5 stores the specified feature quantity in the feature quantity DB 7 as learning data.

画像座標上の他の位置に対応する局所特徴量が存在する場合は、ステップSA−4からの処理を繰り返すことにより、学習データを同様に生成することができる。また、他の学習画像が存在する場合には、ステップSA−1からの処理を繰り返すことにより、学習データを生成することができる。   If there is a local feature amount corresponding to another position on the image coordinates, the learning data can be similarly generated by repeating the processing from step SA-4. When other learning images exist, learning data can be generated by repeating the processing from step SA-1.

本実施形態では、画像座標上で実質的に同じ位置にある局所特徴量を選択し、それらの間で、特徴量空間上での補間によって、学習用の特徴量を生成しているので、学習用特徴量の生成処理が簡便であり、計算資源の使用量を低く抑えることができる。すなわち、もし、多数の変換画像を生成し、それらの変換画像から局所特徴量を逐一抽出する処理を行う場合には、処理に多くの計算資源及び時間を要する。これに対して、前記した手法によれば、少ない変換画像を用いた場合でも、多くの学習用の局所特徴量を生成することができるという利点がある。   In the present embodiment, local feature amounts at substantially the same position on the image coordinates are selected, and learning feature amounts are generated by interpolation between them in the feature amount space. The feature amount generation process is simple, and the amount of calculation resources used can be kept low. That is, if a large number of converted images are generated and a process of extracting local feature amounts from the converted images one by one is performed, the processing requires a lot of calculation resources and time. On the other hand, according to the above-described method, there is an advantage that many local feature quantities for learning can be generated even when a small number of converted images are used.

さらに、本実施形態では、学習画像(つまり基本画像)に対応する特徴量と、変換画像に対応する特徴量との間で、補間特徴量を生成しているので、補間特徴量の有用性ないし品質を高めることができる。仮に、変換画像に対応する特徴量どうしの間で補間特徴量を生成すると、その補間特徴量は、学習画像との関連性が低いので、将来的にクエリ画像を照合する際の有用性が低くなりやすいと考えられる。そこで、本実施形態では、学習画像に対応する特徴量と、変換画像に対応する特徴量との間で、補間特徴量を生成することによって、クエリ画像の照合精度の向上に寄与することができる。つまり、本実施形態の手法では、良質な学習用局所特徴量を効率よく生成できるという利点がある。   Furthermore, in the present embodiment, the interpolation feature amount is generated between the feature amount corresponding to the learning image (that is, the basic image) and the feature amount corresponding to the converted image. Quality can be improved. If an interpolated feature amount is generated between feature amounts corresponding to the converted image, the interpolated feature amount has a low relevance to the learning image, and thus is less useful when collating query images in the future. It seems to be easy to become. Therefore, in the present embodiment, by generating an interpolated feature amount between the feature amount corresponding to the learning image and the feature amount corresponding to the converted image, it is possible to contribute to the improvement of the matching accuracy of the query image. . That is, the method of the present embodiment has an advantage that a high-quality learning local feature can be efficiently generated.

また、本実施形態では、特徴量空間上でほぼ同一とみなせる(つまり既定距離内にある)特徴量をまとめて、代表特徴量を生成し、代表特徴量を用いて補間特徴量を生成している。ここで、代表特徴量を生成せずに、特徴量間で補間特徴量を生成すると、ほぼ同一の補間特徴量が多数生成される可能性があり、その場合は、記憶領域を浪費することになる。これに対して、本実施形態では、代表特徴量を用いて補間特徴量を生成しているので、生成される補間特徴量がほぼ同一となる可能性を減らすことができ、記憶領域の有効利用が可能になる。   Further, in this embodiment, representative feature amounts are generated by collecting feature amounts that can be regarded as substantially the same in the feature amount space (that is, within a predetermined distance), and an interpolation feature amount is generated using the representative feature amount. Yes. Here, if an interpolated feature amount is generated between feature amounts without generating a representative feature amount, a large number of substantially the same interpolated feature amounts may be generated. In this case, a storage area is wasted. Become. On the other hand, in this embodiment, since the interpolation feature value is generated using the representative feature value, it is possible to reduce the possibility that the generated interpolation feature value is substantially the same, and to effectively use the storage area. Is possible.

したがって、本実施形態によれば、少ない計算資源を用いて、迅速に、有効な学習データを生成することが可能になるという利点がある。   Therefore, according to the present embodiment, there is an advantage that effective learning data can be generated quickly using a small number of computing resources.

(第2実施形態)
次に、本発明の第2実施形態に係る学習用局所特徴量生成装置を、図4を参照しながら説明する。なお、この第2実施形態の説明においては、前記した第1実施形態と基本的に共通する機能要素については、同一符号を付すことにより、説明の煩雑を避ける。
(Second Embodiment)
Next, a learning local feature generating apparatus according to a second embodiment of the present invention will be described with reference to FIG. In the description of the second embodiment, functional elements that are basically the same as those of the first embodiment described above are denoted by the same reference numerals, thereby avoiding complicated description.

前記した第1実施形態では、特徴量集約部9が補間特徴量生成部4の上流側に配置され(図1参照)、特徴量を集約(図2のステップSA−5)した後に補間特徴量を生成していた。これに対して、第2実施形態では、特徴量集約部9が補間特徴量生成部4の下流側に配置され(図4参照)、補間特徴量を生成した後に特徴量を集約する。   In the first embodiment described above, the feature quantity aggregating unit 9 is arranged upstream of the interpolation feature quantity generation unit 4 (see FIG. 1), and after the feature quantities are aggregated (step SA-5 in FIG. 2), the interpolated feature quantity is obtained. Was generated. On the other hand, in the second embodiment, the feature quantity aggregating unit 9 is arranged on the downstream side of the interpolation feature quantity generation unit 4 (see FIG. 4) and aggregates the feature quantities after generating the interpolation feature quantity.

すなわち、本実施形態の特徴量集約部9は、補間特徴量生成部4により生成された補間特徴量に対して特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの補間特徴量及び局所特徴量から代表特徴量を生成する構成となっている。さらに、本例の学習データ特定部5は、特徴量集約部9において生成された代表特徴量がある場合には、この代表特徴量を補間特徴量として、学習用の局所特徴量を特定する構成となっている。   That is, the feature amount aggregating unit 9 of the present embodiment, when there are local feature amounts existing within a predetermined distance in the feature amount space with respect to the interpolation feature amount generated by the interpolation feature amount generating unit 4, The representative feature amount is generated from the interpolation feature amount and the local feature amount. Further, when there is a representative feature amount generated by the feature amount aggregating unit 9, the learning data specifying unit 5 of this example specifies a local feature amount for learning using the representative feature amount as an interpolation feature amount. It has become.

図5を参照しながら、第2実施形態における学習用局所特徴量の生成方法を説明する。   With reference to FIG. 5, a method for generating a local feature amount for learning in the second embodiment will be described.

(図5のステップSB−1〜SB−4)
これらのステップは、図2のステップSA−1〜SA−4と基本的に同様なので、詳しい説明は省略する。生成される特徴量空間の例を図6(a)に示す。
(Steps SB-1 to SB-4 in FIG. 5)
These steps are basically the same as steps SA-1 to SA-4 in FIG. An example of the generated feature amount space is shown in FIG.

(図5のステップSB−5)
ついで、第2実施形態では、補間特徴量生成部4が、第1実施形態と同様に、補間特徴量を生成する。ただし、第2実施形態では、代表特徴量を生成するよりも前に補間特徴量を生成するので、図6(b)に示すように、距離が近い補間特徴量が多数生成される。なお、図6(b)においても、生成された補間特徴量を▲で示している。
(Step SB-5 in FIG. 5)
Next, in the second embodiment, the interpolation feature value generation unit 4 generates an interpolation feature value as in the first embodiment. However, in the second embodiment, since the interpolation feature amount is generated before the representative feature amount is generated, a large number of interpolation feature amounts having close distances are generated as shown in FIG. In FIG. 6B as well, the generated interpolation feature amount is indicated by ▲.

(図5のステップSB−6)
ついで、第2実施形態では、特徴量集約部9が、特徴量の集約を行う。代表特徴量1001〜1003(図6(b)参照)の生成については、前記した第1実施形態と同様である。さらに、第2実施形態では、生成された補間特徴量が他の補間特徴量と近接している場合がある(図6(b)において2点鎖線で囲った特徴量を参照)。その場合には、これらの特徴量を集約して、代表特徴量(図示せず)を生成する。そして、その代表特徴量を、集約された特徴量に代えて用いることができる。
(Step SB-6 in FIG. 5)
Next, in the second embodiment, the feature quantity aggregating unit 9 aggregates feature quantities. The generation of the representative feature amounts 1001 to 1003 (see FIG. 6B) is the same as in the first embodiment described above. Furthermore, in the second embodiment, the generated interpolation feature value may be close to another interpolation feature value (see the feature value surrounded by a two-dot chain line in FIG. 6B). In that case, these feature quantities are aggregated to generate a representative feature quantity (not shown). The representative feature amount can be used in place of the aggregated feature amount.

以降の処理は、前記した第1実施形態と同様なので、詳しい説明は省略する。   Since the subsequent processing is the same as that of the first embodiment, detailed description thereof is omitted.

また、第2実施形態における前記以外の構成及び利点は、前記した第1実施形態と同様なので、詳しい説明は省略する。   In addition, since the configuration and advantages other than those described above in the second embodiment are the same as those in the first embodiment described above, detailed description thereof is omitted.

(第3実施形態)
次に、本発明の第3実施形態に係る画像認識装置を、図7を参照しながら説明する。なお、この第3実施形態の説明においては、前記した第1実施形態と基本的に共通する機能要素については、同一符号を付すことにより、説明の煩雑を避ける。
(Third embodiment)
Next, an image recognition apparatus according to a third embodiment of the present invention will be described with reference to FIG. In the description of the third embodiment, functional elements that are basically the same as those of the first embodiment described above are denoted by the same reference numerals, thereby avoiding complicated description.

第3実施形態の画像認識装置は、学習部100と認識部200とを備えている。   The image recognition apparatus according to the third embodiment includes a learning unit 100 and a recognition unit 200.

学習部100は、第1実施形態又は第2実施形態で説明した学習用局所特徴量生成装置に対応する機能要素である。   The learning unit 100 is a functional element corresponding to the learning local feature generating device described in the first embodiment or the second embodiment.

認識部200は、対象画像(いわゆるクエリ画像)の認識を行うための機能要素である。本実施形態の認識部200は、対象画像に対応する局所特徴量を、学習部100で生成された学習用局所特徴量(学習データ)から検索することによって、対象画像の認識を行う構成となっている。このような認識部200の構成としては、既存の認識装置と同様とすることができるので、詳しい説明は省略する。   The recognition unit 200 is a functional element for recognizing a target image (so-called query image). The recognition unit 200 according to the present embodiment is configured to recognize a target image by searching for a local feature amount corresponding to the target image from a learning local feature amount (learning data) generated by the learning unit 100. ing. Since the configuration of such a recognition unit 200 can be the same as that of an existing recognition device, detailed description thereof is omitted.

前記した各実施形態の動作は、コンピュータに適宜のコンピュータソフトウエアを組み込むことにより実施することができる。   The operations of the above-described embodiments can be implemented by incorporating appropriate computer software into the computer.

なお、本発明の内容は、前記実施形態に限定されるものではない。本発明は、特許請求の範囲に記載された範囲内において、具体的な構成に対して種々の変更を加えうるものである。   The contents of the present invention are not limited to the above embodiment. In the present invention, various modifications can be made to the specific configuration within the scope of the claims.

例えば、前記した各構成要素は、機能ブロックとして存在していればよく、独立したハードウエアとして存在しなくても良い。また、実装方法としては、ハードウエアを用いてもコンピュータソフトウエアを用いても良い。さらに、本発明における一つの機能要素が複数の機能要素の集合によって実現されても良く、本発明における複数の機能要素が一つの機能要素により実現されても良い。   For example, each component described above may exist as a functional block, and may not exist as independent hardware. As a mounting method, hardware or computer software may be used. Furthermore, one functional element in the present invention may be realized by a set of a plurality of functional elements, and a plurality of functional elements in the present invention may be realized by one functional element.

また、機能要素は、物理的に離間した位置に配置されていてもよい。この場合、機能要素どうしがネットワークにより接続されていても良い。グリッドコンピューティング又はクラウドコンピューティングにより機能を実現し、あるいは機能要素を構成することも可能である。   Moreover, the functional element may be arrange | positioned in the position physically separated. In this case, the functional elements may be connected by a network. It is also possible to realize functions or configure functional elements by grid computing or cloud computing.

1 画像変換部
2 特徴量取得部
3 特徴量位置判定部
4 補間特徴量生成部
5 学習データ特定部
6 画像DB
7 特徴量DB
8 画像取得部
9 特徴量集約部
100 学習部(学習用局所特徴量生成装置)
200 認識部
101 学習画像
102 変換画像
1001〜1003 代表特徴量(局所特徴量)
1011 学習画像に基づく局所特徴量
1021〜1028 変換画像に基づく局所特徴量
1101〜1109 生成された補間特徴量
DESCRIPTION OF SYMBOLS 1 Image conversion part 2 Feature-value acquisition part 3 Feature-value position determination part 4 Interpolated feature-value production | generation part 5 Learning data specification part 6 Image DB
7 Feature DB
8 Image acquisition unit 9 Feature amount aggregation unit 100 Learning unit (local feature amount generation device for learning)
200 recognition unit 101 learning image 102 converted image 1001 to 1003 representative feature amount (local feature amount)
1011 Local feature amount based on learning image 1021 to 1028 Local feature amount based on converted image 1101 to 1109 Generated interpolation feature amount

Claims (9)

学習画像を用いて学習用の局所特徴量を生成するための装置であって、
前記学習画像を変換して変換画像を生成する画像変換部と、
前記学習画像と前記変換画像とのそれぞれについて、画像の局所的特徴に基づく局所特徴量を取得する特徴量取得部と、
前記特徴量取得部により取得された前記局所特徴量のうちから、画像空間上距離が既定範囲内である局所特徴量を特定する特徴量位置判定部と、
前記画像空間上距離が既定範囲内である局所特徴量のうち、前記学習画像に対応する局所特徴量と、前記変換画像に対応する局所特徴量との間に、特徴量空間上での距離に基づいて補間特徴量を生成する補間特徴量生成部と、
前記補間特徴量を少なくとも用いて学習用の局所特徴量を特定する学習データ特定部と
を備えることを特徴とする、学習用局所特徴量生成装置。
An apparatus for generating a local feature for learning using a learning image,
An image converter that converts the learning image to generate a converted image;
For each of the learning image and the converted image, a feature amount acquisition unit that acquires a local feature amount based on a local feature of the image;
From among the feature acquiring the local feature amount acquired by unit, a feature amount position determining unit that identifies a local feature amount which is within the distance specified range in the image space,
Of distance on the image space of the local feature amount is within a predetermined range, and the local feature amount corresponding to the learning image, between the local feature amount corresponding to the transformed image, on the feature amount space An interpolation feature generating unit that generates an interpolation feature based on the distance;
A learning local feature generating apparatus comprising: a learning data specifying unit that specifies a local feature for learning using at least the interpolation feature.
前記特徴量取得部は、前記特徴量取得部により取得された前記局所特徴量についての、前記画像空間上での位置をさらに取得する構成となっているThe feature amount acquisition unit is configured to further acquire a position on the image space with respect to the local feature amount acquired by the feature amount acquisition unit.
請求項1に記載の学習用局所特徴量生成装置。  The learning local feature generating apparatus according to claim 1.
さらに、特徴量集約部を備えており、
前記特徴量集約部は、前記特徴量位置判定部により特定された、画像空間上距離が既定範囲内である局所特徴量のうち、特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの局所特徴量から代表特徴量を生成し、この代表特徴量により、前記特徴量空間での前記既定距離内にある局所特徴量を代表させる構成となっており、
さらに、前記補間特徴量生成部は、前記特徴量集約部において生成された代表特徴量がある場合には、この代表特徴量を前記局所特徴量として、前記補間特徴量を生成する構成となっている
請求項1又は2に記載の学習用局所特徴量生成装置。
Furthermore, it has a feature amount aggregation unit,
The feature amount aggregating unit, the identified by the feature position determining unit, among distances in image space is local feature quantity is within a predetermined range, local features that are present within a predetermined distance in the feature quantity space If there is, a representative feature amount is generated from these local feature amounts, and the representative feature amount is configured to represent the local feature amount within the predetermined distance in the feature amount space ,
Furthermore, when there is a representative feature amount generated by the feature amount aggregation unit, the interpolation feature amount generation unit generates the interpolation feature amount using the representative feature amount as the local feature amount. The learning local feature generating apparatus according to claim 1 or 2 .
さらに、特徴量集約部を備えており、
前記特徴量集約部は、前記補間特徴量生成部により生成された補間特徴量に対して特徴量空間上において既定距離内に存在する局所特徴量がある場合には、これらの補間特徴量及び局所特徴量から代表特徴量を生成する構成となっており、
さらに、前記学習データ特定部は、前記特徴量集約部において生成された代表特徴量がある場合には、この代表特徴量を前記補間特徴量として、前記学習用の局所特徴量を特定する構成となっている
請求項1又は2に記載の学習用局所特徴量生成装置。
Furthermore, it has a feature amount aggregation unit,
The feature amount aggregating unit, when there is a local feature amount existing within a predetermined distance in the feature amount space with respect to the interpolation feature amount generated by the interpolation feature amount generation unit, It is configured to generate representative feature values from feature values,
Further, the learning data specifying unit, when there is a representative feature amount generated in the feature amount aggregating unit, specifies the local feature amount for learning using the representative feature amount as the interpolation feature amount, The learning local feature generating apparatus according to claim 1 or 2 .
前記補間特徴量生成部は、特徴量空間上での既定距離ごとに前記補間特徴量を生成する構成となっている
請求項1〜のいずれか1項に記載の学習用局所特徴量生成装置。
The interpolated feature value generating unit, learning local feature amount generating apparatus according to any one of interpolation claims feature amount has a configuration which generates 1 to 4 for each predetermined distance in the feature quantity space .
前記学習データ特定部は、前記学習画像から取得された局所特徴量と、前記変換画像から取得された局所特徴量と、これらの局所特徴量に対して特徴量空間上での距離が既定範囲内である局所特徴量とのいずれかを学習用の局所特徴量としてさらに特定する構成となっている
請求項1〜のいずれか1項に記載の学習用局所特徴量生成装置。
The learning data specifying unit includes a local feature amount acquired from the learning image, a local feature amount acquired from the converted image, and a distance on the feature amount space with respect to these local feature amounts within a predetermined range. The local feature-value generator for learning according to any one of claims 1 to 5 , wherein the local feature-value is further specified as a local feature-value for learning.
請求項1〜のいずれか1項に記載の学習用局所特徴量生成装置と、対象画像の認識を行うための認識部とを備えており、
前記認識部は、
前記対象画像に対応する局所特徴量を、前記学習用局所特徴量生成装置で生成された学習用局所特徴量から検索することによって、前記対象画像の認識を行う構成となっている
画像認識装置。
The learning local feature generation device according to any one of claims 1 to 6 , and a recognition unit for recognizing a target image,
The recognition unit
An image recognition device configured to recognize the target image by searching a local feature amount corresponding to the target image from a local feature amount for learning generated by the local feature amount generation device for learning.
学習画像を用いて学習用の局所特徴量を生成するための装置を用いた学習用局所特徴量の生成方法であって、
前記学習画像を変換して変換画像を生成する画像変換ステップと、
前記学習画像と前記変換画像とのそれぞれについて、画像の局所的特徴に基づく局所特徴量を取得する特徴量取得ステップと、
前記特徴量取得ステップにおいて取得された前記局所特徴量のうちから、画像空間上距離が既定範囲内である局所特徴量を特定する特徴量位置判定ステップと、
前記画像空間上距離が既定範囲内である局所特徴量のうち、前記学習画像に対応する局所特徴量と、前記変換画像に対応する局所特徴量との間に、特徴量空間上での距離に基づいて補間特徴量を生成する補間特徴量生成ステップと、
前記補間特徴量を少なくとも用いて学習用の局所特徴量を特定する学習データ特定ステップと
を備えることを特徴とする生成方法。
A method for generating a local feature for learning using a device for generating a local feature for learning using a learning image,
An image conversion step of converting the learning image to generate a converted image;
A feature amount acquisition step for acquiring a local feature amount based on a local feature of the image for each of the learning image and the converted image;
From among the local feature amount obtained in the feature amount obtaining step, the feature amount position determination step of specifying a local feature amount which is within the distance specified range in the image space,
Of distance on the image space of the local feature amount is within a predetermined range, and the local feature amount corresponding to the learning image, between the local feature amount corresponding to the transformed image, on the feature amount space An interpolation feature generation step for generating an interpolation feature based on the distance;
A learning data specifying step of specifying a local feature quantity for learning using at least the interpolation feature quantity.
請求項に記載の各ステップをコンピュータに実行させるためのコンピュータプログラム。 A computer program for causing a computer to execute each step according to claim 8 .
JP2013238396A 2013-11-19 2013-11-19 Learning local feature generating apparatus and learning local feature generating method Active JP5882976B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013238396A JP5882976B2 (en) 2013-11-19 2013-11-19 Learning local feature generating apparatus and learning local feature generating method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013238396A JP5882976B2 (en) 2013-11-19 2013-11-19 Learning local feature generating apparatus and learning local feature generating method

Publications (2)

Publication Number Publication Date
JP2015099453A JP2015099453A (en) 2015-05-28
JP5882976B2 true JP5882976B2 (en) 2016-03-09

Family

ID=53376039

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013238396A Active JP5882976B2 (en) 2013-11-19 2013-11-19 Learning local feature generating apparatus and learning local feature generating method

Country Status (1)

Country Link
JP (1) JP5882976B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6444331B2 (en) * 2016-03-31 2018-12-26 セコム株式会社 Object identification device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5183392B2 (en) * 2008-09-25 2013-04-17 キヤノン株式会社 Image processing apparatus, image processing method, and program

Also Published As

Publication number Publication date
JP2015099453A (en) 2015-05-28

Similar Documents

Publication Publication Date Title
JP5183392B2 (en) Image processing apparatus, image processing method, and program
JP5261501B2 (en) Permanent visual scene and object recognition
JP6320649B1 (en) Machine learning device and image recognition device
CN101669117A (en) Use matching images with shape descriptors
TW201616450A (en) System and method for selecting point clouds using a brush tool
JP6075294B2 (en) Image processing system and image processing method
WO2018189962A1 (en) Object recognition device, object recognition system, and object recognition method
CN109871249B (en) Remote desktop operation method and device, readable storage medium and terminal equipment
JP5560925B2 (en) 3D shape search device, 3D shape search method, and program
JP5882976B2 (en) Learning local feature generating apparatus and learning local feature generating method
CN111753722A (en) A fingerprint recognition method and device based on feature point type
CN119672766A (en) Method, storage medium, electronic device and product for detecting hand joints in eyewear equipment
KR102617732B1 (en) Methods and apparatus for processing image data for machine vision
JP2013054457A (en) Image processing device, image processing method, and program
JP5602184B2 (en) Feature value generation apparatus and feature value generation method
KR101359661B1 (en) conversion system and method for 3D object represented by triangle mesh to 3D object represented by DoSurface
JP2011014052A (en) Image identifying device, image identifying method, identifier creating device, identifier creating method and imaging system
CN117746433A (en) Text detection method and device, electronic equipment and storage medium
JP6478301B2 (en) Image discrimination device, image discrimination method, and program
JP6056354B2 (en) Image processing apparatus, image processing method, and image processing program
JP6399518B2 (en) Processing device, processing method, and program
JP6066282B2 (en) Image processing apparatus, image processing program, and image processing method
KR101692168B1 (en) Method for Device for Matching Heterogenous Stereo Images
JP6336827B2 (en) Image search device, image search method, and search system
JP6453618B2 (en) Calculation apparatus, method and program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160204

R150 Certificate of patent or registration of utility model

Ref document number: 5882976

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250