JP6989485B2 - Multi-label data learning support device, multi-label data learning support method and multi-label data learning support program - Google Patents
Multi-label data learning support device, multi-label data learning support method and multi-label data learning support program Download PDFInfo
- Publication number
- JP6989485B2 JP6989485B2 JP2018239239A JP2018239239A JP6989485B2 JP 6989485 B2 JP6989485 B2 JP 6989485B2 JP 2018239239 A JP2018239239 A JP 2018239239A JP 2018239239 A JP2018239239 A JP 2018239239A JP 6989485 B2 JP6989485 B2 JP 6989485B2
- Authority
- JP
- Japan
- Prior art keywords
- label
- image data
- related information
- data
- annotation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、マルチラベルデータ学習支援装置、マルチラベルデータ学習支援方法およびマルチラベルデータ学習支援プログラムに関する。 The present invention relates to a multi-label data learning support device, a multi-label data learning support method, and a multi-label data learning support program.
近年、画像認識の分野では機械学習(特に、Deep Learning)を活用したシステムやサービスが増加している。Deep Learning(以下、「DL」と称する。)には、学習用の画像データに正解ラベルを付けて学習する教師あり学習と、正解ラベルを付けずに学習を行う教師なし学習がある。例えば、入力画像に写る物体が「何か」を認識する画像分類問題や画像に写る物体が「正常か異常か」を判断する故障診断、人物画像から年齢を推定するといった回帰問題などをDLで解くためには、教師あり学習を用いることが多い。 In recent years, in the field of image recognition, systems and services utilizing machine learning (especially deep learning) are increasing. Deep learning (hereinafter referred to as "DL") includes supervised learning in which learning is performed by attaching a correct answer label to image data for learning, and unsupervised learning in which learning is performed without a correct answer label. For example, DL can be used to solve image classification problems that recognize "something" about an object in an input image, failure diagnosis that determines whether an object in an image is "normal or abnormal", and regression problems such as estimating age from a person's image. Supervised learning is often used to solve.
教師あり学習は、一般的に学習に用いる画像データが多ければ多い程、学習後に生成する識別器の性能(認識精度、汎化性能など)が向上する。しかし、教師あり学習には、画像データに正解ラベル付けを行う作業(アノテーション)に非常に大きな工数を要するという問題がある。 In supervised learning, the more image data is generally used for learning, the better the performance (recognition accuracy, generalization performance, etc.) of the classifier generated after learning. However, supervised learning has a problem that the work (annotation) of labeling image data with a correct answer requires a very large number of man-hours.
上記問題に対して、特許文献1に記載の技術では、ラベル無し画像データの中から、学習効果の高いデータを抽出し、アノテーション作業者(以下「アノテータ」と称する。)に画像データを提示する能動学習と呼ばれる手法を用いたシステムを提案している。 In response to the above problem, in the technique described in Patent Document 1, data having a high learning effect is extracted from unlabeled image data, and the image data is presented to an annotation worker (hereinafter referred to as "annotator"). We are proposing a system that uses a method called active learning.
具体的には、まず、少量(例えば、数十から数百枚)のラベル付き画像データを用いて識別器を生成し、生成した識別器に大量(例えば、数千から数万枚)のラベル無し画像データを入力して認識処理を行う。次に、認識処理の出力値をもとに計算処理によって学習効果の高い画像データ(例えば、出力値のエントロピーを計算しエントロピーが大きい画像データ)を抽出する。ここでの学習効果の高い画像データとは、識別器が推定した結果が間違っている可能性の高い画像データを意味する。そして、推定した結果が間違っている可能性が高い画像データに、アノテータが正しいラベルを付与し、再度識別器を生成して、徐々に識別器の性能を高めていく能動学習と呼ばれる手法を用いる。 Specifically, first, a classifier is generated using a small amount (for example, tens to hundreds of sheets) of labeled image data, and a large amount (for example, thousands to tens of thousands of sheets) of labels are generated on the generated classifier. None Image data is input and recognition processing is performed. Next, image data having a high learning effect (for example, image data having a large entropy by calculating the entropy of the output value) is extracted by calculation processing based on the output value of the recognition process. The image data having a high learning effect here means the image data in which the result estimated by the discriminator is likely to be incorrect. Then, the annotator assigns the correct label to the image data that is likely to have an incorrect estimation result, generates a classifier again, and uses a method called active learning that gradually improves the performance of the classifier. ..
特許文献1に記載の技術は、単一ラベル(1枚の画像データについて1つの正解ラベル)に対しては、アノテーションの高効率化を見込める。しかしながら、1枚の画像データについて複数の正解ラベルを付与するマルチラベル(例えば、人物の画像に対して、年齢、性別、服装などの複数のラベルを付けること)に対しては、単一ラベル時と比較してアノテーション工数がラベル数分、倍増する。よって、画像データに正解ラベルを付与するアノテータの負担も増加してしまう。 The technique described in Patent Document 1 can be expected to improve the efficiency of annotation for a single label (one correct label for one image data). However, for a multi-label that assigns multiple correct labels to one image data (for example, attaching multiple labels such as age, gender, clothes, etc. to a person's image), a single label is used. Compared with, the man-hours for annotation are doubled by the number of labels. Therefore, the burden on the annotator that assigns the correct label to the image data also increases.
本発明は、上記問題に鑑みてなされたものであり、マルチラベルを持つ画像データへのアノテーション作業量を低減することができる、マルチラベルデータ学習支援装置、マルチラベルデータ学習支援方法およびマルチラベルデータ学習支援プログラムを提供することを課題とする。 The present invention has been made in view of the above problems, and is capable of reducing the amount of annotation work on image data having multi-labels, a multi-label data learning support device, a multi-label data learning support method, and multi-label data. The challenge is to provide a learning support program.
前記課題を達成するため、本発明のマルチラベルデータ学習支援装置は、ラベル付き画像データを記憶するラベル付き画像データDB(DataBase)、ラベル無し画像データを記憶するラベル無し画像データDB、および、複数のラベル間の関係性を示すとともに画像データに付されるマルチラベルの内容の傾向を示すラベル関連情報を記憶するラベル関連情報DBが格納される記憶部と、ラベル付き画像データを取得し、機械学習により識別器を生成する学習部と、生成した識別器を用いてラベル無し画像データに対して、マルチラベルを構成する各ラベルの推論処理を行う推論部と、推論処理で得られたラベル無し画像データについての各ラベルの推論結果と、ラベル関連情報で示されるラベル間の関連性とを比較して異なる場合に、当該ラベル無し画像データをアノテーションを必要とするアノテーション対象画像として選定するアノテーション画像選定部と、選定されたアノテーション対象画像を表示装置に表示させ、当該画像データの正解ラベルの入力を受け付けるアノテーション処理部と、を備えるものとした。 In order to achieve the above object, the multi-label data learning support device of the present invention includes a labeled image data DB (DataBase) for storing labeled image data, an unlabeled image data DB for storing unlabeled image data, and a plurality of unlabeled image data DBs. The storage unit that stores the label-related information DB that stores the label-related information that shows the relationship between the labels and shows the tendency of the contents of the multi-label attached to the image data, and the storage unit that stores the label-related information DB, and the machine that acquires the labeled image data. A learning unit that generates a classifier by learning, a reasoning unit that performs inference processing for each label that constitutes a multi-label for unlabeled image data using the generated classifier, and no label obtained by inference processing. Annotated image that selects the unlabeled image data as the annotation target image that requires annotation when the inference result of each label for the image data and the relationship between the labels indicated by the label-related information are compared and different. It is provided with a selection unit and an annotation processing unit that displays the selected image to be annotated on the display device and accepts the input of the correct answer label of the image data.
本発明によれば、マルチラベルを持つ画像データへのアノテーション作業量を低減する、マルチラベルデータ学習支援装置、マルチラベルデータ学習支援方法およびマルチラベルデータ学習支援プログラムを提供することができる。 According to the present invention, it is possible to provide a multi-label data learning support device, a multi-label data learning support method, and a multi-label data learning support program that reduce the amount of annotation work on image data having multi-labels.
以下、本発明の実施形態(以下、「本実施形態」と称する。)について図面を参照して詳細に説明する。 Hereinafter, embodiments of the present invention (hereinafter referred to as “the present embodiment”) will be described in detail with reference to the drawings.
本実施形態に係るマルチラベルデータ学習支援装置1(後記する、図1参照)は、画像の撮影場所ごとに異なるマルチラベルの「ラベル間の関連性」を、「ラベル関連情報」として定義し、学習効果の高いデータを能動学習するために抽出する際に、ラベル関連情報を活用することにより、マルチラベルを持つ画像データへのアノテーション作業量を低減する。
本実施形態における「ラベル間の関連性」とは、画像を撮影する場所における、撮影対象となる画像データに付されるマルチラベルの内容の「傾向」を意味する。年齢ラベル、性別ラベル、服装ラベルの3種類のマルチラベルを持つ人物画像の例で説明すると、「この場所では、20代(年齢ラベル)の男性(性別ラベル)は、スーツ(服装ラベル)を着ている可能性が高い」、「この場所では、30代(年齢ラベル)でスカート(服装ラベル)をはいている人は、女性(性別ラベル)の可能性が高い」といったように、画像を撮影する場所によって、マルチラベルの内容に傾向が得られることがある。この傾向を事前に「ラベル関連情報」として定義する。
The multi-label data learning support device 1 (described later, see FIG. 1) according to the present embodiment defines the “relationship between labels” of the multi-label, which differs depending on the shooting location of the image, as “label-related information”. By utilizing label-related information when extracting data with a high learning effect for active learning, the amount of annotation work on image data having multiple labels is reduced.
The "relationship between labels" in the present embodiment means the "tendency" of the content of the multi-label attached to the image data to be photographed at the place where the image is photographed. To explain with an example of a person image having three types of multi-labels, age label, gender label, and clothing label, "In this place, a man (gender label) in his twenties (age label) wears a suit (clothing label). "In this place, people in their thirties (age label) who wear skirts (clothes label) are more likely to be women (gender label)." Depending on where you do it, you may find a tendency in the content of the multi-label. This tendency is defined in advance as "label related information".
マルチラベルデータ学習支援装置1では、撮影場所ごとに、上記のラベル関連情報を定義しておき、識別器がラベル無し画像データを推論した際に、例えば、「年齢:20代、性別:男性、服装:作業着」と推論したとすると、「20代男性は、スーツを着ている可能性が高い」という定義した傾向と異なる推論をしているため、このラベル無し画像データに対する推論が間違っている可能性が高くなる。この識別器が推論した結果について、間違っている可能性が高いと判断した画像を抽出し、マルチラベルを持つ画像データへのアノテーションを行う。これにより、マルチラベルデータ学習支援装置1によれば、マルチラベルを持つ画像について能動学習を行い、効率的に識別器の性能を高めることができるため、作業工数を低減することが可能となる。
以下、本実施形態に係るマルチラベルデータ学習支援装置1について、詳細に説明する。
In the multi-label data learning support device 1, the above label-related information is defined for each shooting location, and when the classifier infers the unlabeled image data, for example, "age: 20s, gender: male," If you infer "clothes: work clothes", the inference for this unlabeled image data is incorrect because the inference is different from the defined tendency that "men in their twenties are likely to wear suits". It is more likely that you are there. For the result inferred by this classifier, the image judged to be highly likely to be incorrect is extracted, and the image data having the multi-label is annotated. As a result, according to the multi-label data learning support device 1, active learning can be performed on an image having a multi-label, and the performance of the classifier can be efficiently improved, so that the work man-hours can be reduced.
Hereinafter, the multi-label data learning support device 1 according to the present embodiment will be described in detail.
<マルチラベルデータ学習支援装置>
図1は、本実施形態に係るマルチラベルデータ学習支援装置1の構成を示すブロック図である。
図1に示すように、マルチラベルデータ学習支援装置1は、制御部10、入力部20、出力部30および記憶部40を備えるコンピュータにより構成される。
<Multi-label data learning support device>
FIG. 1 is a block diagram showing a configuration of a multi-label data learning support device 1 according to the present embodiment.
As shown in FIG. 1, the multi-label data learning support device 1 is composed of a computer including a
入力部20は、ネットワーク等を介して情報の送受信(入力)を行うための通信インタフェース(図示省略)や、タッチパネルやキーボード等の入力装置(図示省略)を介して、情報の入力を受け付ける機能を備える。この入力部20への情報の入力は、アノテータ9が視覚的に操作できるようにユーザインタフェース(UI:User Interface)により実現してもよいし、CSVファイルのような媒体で入力できるようにしてもよい。
The
この入力部20は、アノテーション処理部21と、画像データ読込部22と、ラベル関連情報定義部23とを含んで構成される。
アノテーション処理部21は、ラベル無し画像データに対して、アノテータ9等が付与した正解ラベルの情報を受け付けることにより、ラベル付き画像データを生成する。そして、アノテーション処理部21は、生成したラベル付き画像データを、記憶部40内の後記するラベル付き画像データDB(DataBase)41に記憶する。
The
The
画像データ読込部22は、ラベル付き画像データとラベル無し画像データの入力を受け付ける。そして、画像データ読込部22は、ラベル付き画像データを受け付けると、後記するラベル付き画像データ情報410(図2参照)で示される1レコードを生成した上で、そのラベル付き画像データを、記憶部40内のラベル付き画像データDB41に記憶する。また、画像データ読込部22は、ラベル無し画像データを受け付けると、後記するラベル無し画像データ情報420(図3参照)で示される1レコードを生成した上で、そのラベル無し画像データを、記憶部40内のラベル無し画像データDB42に記憶する。
なお、画像データ読込部22は、ラベル付きの画像データおよびラベル無し画像データをアノテータ9の操作により、1枚ずつ受け付けても良いし、ある特定のディレクトリ内に含まれている画像データとして一括で受け付けても良い。
また、画像データ読込部22は、画像データの入力を受け付けると、当該画像データにラベルが付されているか否かを判定する機能を備える。そして、画像データ読込部22は、ラベルが付されている場合には、その画像データをラベル付き画像データとして、ラベル付き画像データDB41に記憶する。また、画像データ読込部22は、ラベルが付されていない場合には、そのデータをラベル無し画像データとして、ラベル無し画像データDB42に記憶する。
The image
The image
Further, the image
ラベル関連情報定義部23は、アノテータ9等から、ラベル間の関連性を示すとともに、撮影対象となる画像データに付されるマルチラベルの内容の「傾向」を示すラベル関連情報、つまり、ラベル間の関連性の定義情報の入力を受け付ける。ラベル関連情報定義部23は、受け付けたラベル関連情報を、記憶部40内のラベル関連情報DB43に記憶する。なお、ラベル関連情報の詳細は、図5を参照して後記する。また、図9〜図11を参照して、ラベル関連情報をアノテータ9等が入力する際に利用するユーザインタフェース(UI)について説明する。
The label-related
出力部30は、ネットワーク等を介して情報の送受信(出力)を行うための通信インタフェース(図示省略)や、モニタ等の表示装置(図示省略)へ情報を出力するインタフェースの機能を備える。
出力部30は、入力部20および制御部10の機能に基づき得られた結果である、識別器111の精度評価結果や、ラベル無し画像データの中からアノテーションを行う画像として選定された画像データ(アノテーション対象画像)、後記するラベル関連情報定義ユーザインタフェース200の画面(図9,図11)、ラベル関連情報履歴確認ユーザインタフェース250の画面(図10)等を、表示装置に表示させる。
The
The
記憶部40は、ハードディスクやフラッシュメモリ、RAM(Random Access Memory)等により構成される。この記憶部40には、ラベル付き画像データDB41、ラベル無し画像データDB42、ラベル関連情報DB43や、その他、マルチラベルデータ学習支援装置1が実行する処理に必要な情報が記憶される。
The
図2は、本実施形態に係るラベル付き画像データDB41に記憶されるラベル付き画像データ情報410のデータ構成例を示す図である。
このラベル付き画像データDB41には、ラベル付き画像データそのもの(撮影画像)とともに、その画像データ毎(1レコード毎)に、当該画像データに関連する情報がラベル付き画像データ情報410として、例えばテーブル形式で格納される(図2参照)。
FIG. 2 is a diagram showing a data configuration example of the labeled image data information 410 stored in the labeled
In the labeled
このラベル付き画像データ情報410には、図2に示すようにそのデータ項目として、撮影場所411、撮影画像保存先パス412、撮影画像に対するマルチラベル(ここでは例として、性別413、年代414、服装(上半身)415、服装(下半身)416の各ラベル)が格納される。
例えば、図2のラベル付き画像データ情報410の1行目(1つ目のレコード)に示すように、画像データの撮影場所411として「A工場」が格納される。画像データの保存先を示す撮影画像保存先パス412として「A_001.jpg」が格納される。画像データに付されるラベル(マルチラベル)のラベル情報として、性別413が「男」、年代414が「30代」、服装(上半身)415が「作業着」、服装(下半身)416が「作業着」のそれぞれの情報が格納される。
As shown in FIG. 2, the labeled image data information 410 includes a
For example, as shown in the first line (first record) of the labeled image data information 410 in FIG. 2, "Factory A" is stored as the
図3は、本実施形態に係るラベル無し画像データDB42に記憶されるラベル無し画像データ情報(推論前)420(420A)のデータ構成例を示す図である。
このラベル無し画像データDB42には、ラベル無し画像データそのもの(撮影画像)とともに、その画像データに関連する情報がラベル無し画像データ情報420として、例えばテーブル形式で格納される(図3参照)。
なお、ラベル無し画像データ情報420は、マルチラベルデータ学習支援装置1の処置に伴い、格納されている状態のデータ項目が異なる。図3では、画像データ読込部22がラベル無し画像データを取得し記憶部40に記憶した段階であり、後記する制御部10(推論部13)による推論処理の前(推論前)の状態を示している。なお、この推論前状態のラベル無し画像データの情報を、図3では符号420Aとして示している。
FIG. 3 is a diagram showing a data configuration example of the unlabeled image data information (before inference) 420 (420A) stored in the unlabeled
In the unlabeled
The unlabeled image data information 420 has different data items in a stored state due to the treatment of the multi-label data learning support device 1. FIG. 3 shows a state before (before inference) the inference processing by the control unit 10 (inference unit 13) described later, which is the stage where the image
図3に示すように、このラベル無し画像データ情報(推論前)420(420A)には、そのデータ項目として、撮影場所421、撮影画像保存先パス422、撮影画像に対するマルチラベル(性別423、年代424、服装(上半身)425、服装(下半身)426の各ラベル)、アノテーション候補427、関連度428が格納される。
撮影場所421、撮影画像保存先パス422、マルチラベル(性別423〜服装(下半身)426)は、図2で示したラベル付き画像データ情報410と同じ内容である。ただし、マルチラベルにおける各ラベルのフィールドは、空欄(「―」)である。アノテーション候補427および関連度428は、ラベル無し画像データの中から、アノテーションを実行するアノテーション画像(後記する「アノテーション対象画像」)を選定する際に必要となるデータ項目であり、詳細は後記する。
As shown in FIG. 3, the unlabeled image data information (before inference) 420 (420A) includes the
The
図1に戻り、制御部10は、マルチラベルデータ学習支援装置1全体の制御を司り、学習部11と、評価部12と、推論部13と、アノテーション画像選定部14とを含んで構成される。
Returning to FIG. 1, the
学習部11は、ラベル付き学習データを用いて、DLなどの機械学習を利用し識別器111を生成する。具体的には、学習部11は、ラベル付き画像データDB41に記憶されたラベル付き画像データの中から所定量の画像データ(例えば、9割の画像データ)を選定し、機械学習により識別器111を生成する。学習部11による、ラベル付き学習データの中からの所定量の学習データの選定は、例えば、ランダムに選定される。
The
評価部12は、学習部11が生成した識別器111の精度評価を行う。具体的には、評価部12は、学習部11が識別器111の生成に利用していないラベル付き画像データを用いて、識別器111の性能が所定の認識精度(目標の認識精度)に達したか否かを判定する。
所定の認識精度の情報は、事前にパラメータファイルなどに記述し記憶部40に記憶しておいてもよいし、マルチラベルデータ学習支援装置1の起動時に入力部20がアノテータ9等からの入力を受け付けて記憶部40に記憶しておいてもよい。
The
Information on the predetermined recognition accuracy may be described in a parameter file or the like in advance and stored in the
推論部13は、評価部12が識別器111の性能について所定の認識精度に達していないと判定した場合に、学習部11が生成した、その時点での識別器111を用いて、ラベル無し画像データDB42に記憶されているすべてのラベル無し画像データの推論処理を行う。
When the
図4は、本実施形態に係るラベル無し画像データDB42に記憶されるラベル無し画像データ情報(推論後)420(420B)のデータ構成例を示す図である。
推論部13は、識別器111を用いて各ラベル無し画像データについて、各ラベル(マルチラベル)の推論(推定)をした結果を、そのラベル無し画像データに対応するレコードのラベル無し画像データ情報として格納する。図4においては、性別423、年代424、服装(上半身)425、服装(下半身)426それぞれのラベルの推論結果がラベル情報として、ラベル無し画像データ情報420に格納される。なお、この推論後状態のラベル無し画像データの情報を、図4では符号420Bとして示している。
FIG. 4 is a diagram showing a data configuration example of the unlabeled image data information (after inference) 420 (420B) stored in the unlabeled
The
図1に戻り、アノテーション画像選定部14は、推論部13がラベル無し画像データの各ラベルについて推論した結果と、ラベル関連情報DB43に記憶されたラベル関連情報430(図5参照)とを用いて、優先的にアノテーションを行う撮影画像(以下、「アノテーション対象画像」と称する。)を選定する。
Returning to FIG. 1, the annotation
まず、アノテーション画像選定部14は、ラベル関連情報DB43を参照し、アノテーション画像の選定に利用するラベル関連情報の読込みを行う。ここで、アノテーション画像選定部14は、ラベル関連情報が未定義であった場合には、ラベル関連情報定義部23を介して、アノテータ9等からのラベル関連情報の入力を受け付ける。なお、このラベル関連情報の定義に関する詳細は、後記する図9〜図11(ラベル関連情報定義ユーザインタフェース、ラベル関連情報履歴確認ユーザインタフェース)を用いて説明する。
First, the annotation
図5は、本実施形態に係るラベル関連情報DB43に記憶されるラベル関連情報430のデータ構成例を示す図である。
このラベル関連情報430は、そのデータ項目として、ID431、撮影場所432、撮影画像に対するマルチラベル(ここでは例として、性別433、年代434、服装(上半身)435、服装(下半身)436の各ラベル)、説明ラベル437、目的ラベル438、関連度439が格納される。
FIG. 5 is a diagram showing a data configuration example of the label-related information 430 stored in the label-related
The label-related information 430 has ID431, a
ID431には、そのラベル関連情報(1レコード)に付されたユニークな識別子が格納される。撮影場所432には、その撮影画像の撮影場所が格納される。性別433、年代434、服装(上半身)435、服装(下半身)436は、マルチラベル(各ラベル)の例である。そして、説明ラベル437(第1ラベル)と目的ラベル438(第2ラベル)とは、以下に示すように、どのラベル同士が関連性を持つかを定義するものである。また、関連度439は、説明ラベル437と目的ラベル438との関連の強さ(例えば、0〜1.0の範囲)を定義するものである。
The
例えば、ID431が「A_001」のレコードで示すように、説明ラベル437を「性別」と「年代」、目的ラベル438を「服装(上半身)」、関連度439を「0.9」として定義した場合、「A_001」のレコードは、「A工場では、20代の男性の9割が服装(上半身)に作業着を着用している」という定義内容となる。また、ID431が「A_005」のレコードのように、説明ラベル437を「年代」「服装(上半身)」「服装(下半身)」、目的ラベル438を「性別」、関連度439を「0.8」として定義した場合、「A_005」のレコードは、「A工場で撮影できる50代で服装(上半身および下半身)がスーツの人物は、8割が男性である」という定義内容となる。なお、関連性のないラベルに関しては、「A_001」のレコードの服装(下半身)436のように、フィールドを空欄(「―」)としてもよい。
For example, as shown in the record of ID431 "A_001", the
一方、アノテーション画像選定部14は、ラベル関連情報430が定義済みだった場合、ラベル関連情報DB43に格納されたラベル関連情報430の中から、アノテーションしようとする画像データと同一の撮影場所432のレコードを抽出する。そして、アノテーション画像選定部14は、推論部13が推論処理した結果と、抽出したラベル関連情報430とを用いて優先的にアノテーションを行うラベル無し画像データ(アノテーション対象画像)を選定する。なお、このアノテーション画像選定部14による、アノテーション対象画像の選定処理については、後記する図7を参照して詳細に説明する。
On the other hand, when the label-related information 430 is defined, the annotation
なお、アノテーション画像選定部14が選定したアノテーション画像は、出力部30により、表示装置等に出力される。そして、アノテータ9等により付与された正解ラベルの情報を受け付け、新たにラベルが付された画像データをラベル付き画像データDB41に格納する。このとき、アノテーション画像として選定されたラベル無し画像データは、ラベル無し画像データDB42から削除される。
マルチラベルデータ学習支援装置1の学習部11は、追加されたラベル付き画像データを含めて、さらに機械学習を行い識別器111を生成することにより識別器111の性能を向上させ、識別器111が所定の認識精度に達するまで上記の処理を繰り返す。
The annotation image selected by the annotation
The
<処理の流れ>
次に、マルチラベルデータ学習支援装置1が実行する処理の流れについて説明する。まず、図6を参照し、全体の流れを説明する。そして、図7を参照して、アノテーション対象画像の選定処理の詳細を説明する。
<Processing flow>
Next, the flow of processing executed by the multi-label data learning support device 1 will be described. First, the entire flow will be described with reference to FIG. Then, the details of the selection process of the annotation target image will be described with reference to FIG. 7.
図6は、本実施形態に係るマルチラベルデータ学習支援装置1が実行する全体の処理の流れを示すフローチャートである。
なお、マルチラベルデータ学習支援装置1の記憶部40には、識別器111の性能を判断するための所定の認識精度(目標の認識精度)の情報が予め記憶されているものとする。
FIG. 6 is a flowchart showing the flow of the entire process executed by the multi-label data learning support device 1 according to the present embodiment.
It is assumed that the
まず、マルチラベルデータ学習支援装置1の画像データ読込部22は、ラベル付き画像データとラベル無し画像データの入力を受け付ける(ステップS1)。そして、画像データ読込部22は、受け付けたラベル付き画像データについて、図2に示すラベル付き画像データ情報410を生成した上で、ラベル付き画像データDB41に格納する。また、画像データ読込部22は、受け付けたラベル無し画像データについて、図3に示すラベル無し画像データ情報(推論前)420(420A)を生成した上で、ラベル無し画像データDB42に格納する。
First, the image
ここでは、例えば、マルチラベルデータ学習支援装置1は、少量(例えば、数十から数百枚)のラベル付き画像データと、大量(例えば、数千から数万枚)のラベル無し画像データとを受け付ける。なお、画像データ読込部22が受け付けた画像データが、すべてラベル無し画像データであった場合には、アノテーション処理部21が、受け付けたラベル無し画像データの中からランダムに画像データを選択し、出力部30に出力することにより、アノテータ9等にアノテーションを実行させ、正解ラベルが付されたレベル付画像データを生成する。
Here, for example, the multi-label data learning support device 1 has a small amount (for example, tens to hundreds of sheets) of labeled image data and a large amount (for example, thousands to tens of thousands of sheets) of unlabeled image data. accept. If the image data received by the image
次に、学習部11は、ラベル付き画像データDB41に記憶されたラベル付き学習データを用いて、DLなどの機械学習により識別器111を生成する(ステップS2)。ここで、学習部11は、ラベル付き画像データの中から所定量(例えば、9割)の学習データをランダムに選定し、機械学習により識別器111を生成する。
Next, the
続いて、評価部12は、学習部11が識別器111の生成に利用していないラベル付き画像データを用いて、識別器111の性能が所定の認識精度(目標の認識精度)以上か否かを判定する(ステップS3)。ここで、識別器111の性能が所定の認識精度(目標の認識精度)以上である場合には(ステップS3→Yes)、識別器111の学習が終了したものとして処理を終える。一方、所定の認識精度に達していない場合には(ステップS3→No)、次のステップS4に進む。
Subsequently, the
ステップS4において、推論部13は、ステップS2において生成された識別器111を用いて、ラベル無し画像データDB42に記憶されているすべての画像データの各ラベルに対する推論処理を実行する。そして、推論部13は、推論結果としての各ラベルの情報を、ラベル無し画像データ情報(推論後)420(420B)(図4参照)に格納する。
In step S4, the
次に、アノテーション画像選定部14は、ラベル関連情報DB43(図1)を参照し、アノテーション画像の選定に利用するラベル関連情報430(図5参照)が定義済みか否かを判定する(ステップS5)。
ここで、アノテーション画像選定部14は、例えば、ラベル関連情報430(図5)の撮影場所432の項目に、ラベル無し画像データ情報420(図4)の撮影場所421と同じ撮影場所が設定されているか等により、定義済みか否かを判定することができる。
Next, the annotation
Here, for example, the annotation
そして、アノテーション画像選定部14は、ラベル関連情報430が定義済みであった場合に(ステップS5→Yes)、定義済みのラベル関連情報を読み込む(ステップS6)。具体的には、アノテーション画像選定部14は、ラベル関連情報DB43に記憶されたラベル関連情報430(図5)の中から、例えば、アノテーションしようとしている画像データと同一の撮影場所432のレコードを、今回利用するラベル関連情報として抽出する。なお、アノテーション画像選定部14は、ラベル関連情報430(図5)で示される情報のうち、ID431の情報を指定する情報を受け取り、今回利用するラベル関連情報としてもよい。
一方、アノテーション画像選定部14は、定義済みでなかった場合には(ステップS5→No)、ラベル関連情報を定義する処理を行う(ステップS7)。なお、ラベル関連情報の定義に関する詳細は後記する(図9〜図11参照)。
Then, when the label-related information 430 is defined (step S5 → Yes), the annotation
On the other hand, if the annotation
次に、アノテーション画像選定部14は、ステップS4において行ったラベル無し画像データに対する各ラベルの推論結果と、定義されたラベル関連情報とを用いて、優先的にアノテーションを行うラベル無し画像データ(アノテーション対象画像)の選定を行う(ステップS8:アノテーション対象画像選定処理)。なお、このアノテーション対象画像選定処理の詳細は、図7を参照して後記する。
Next, the annotation
続いて、アノテーション画像選定部14は、出力部30を介して、選定したアノテーション対象画像を、表示装置に画面表示する(ステップS9)。そして、アノテーション処理部21が、アノテータ9等からの正解ラベルの入力を受け付ける。即ち、選定したアノテーション対象画像についてのアノテーションを実行する(ステップS10)。
Subsequently, the annotation
アノテーション処理部21は、新たに正解ラベルが付与された画像データ(ラベル付き画像データ)を、ラベル付き画像データDB41に追加するとともに、ラベル無し画像データDB42から、当該画像データの情報を削除する(ステップS11)。
このとき、アノテーション処理部21は、ラベル無し画像データ情報(推論後)420(420B)(図4参照)の各ラベルのフィールドに記憶された情報を、図3の推論前の状態に戻すようにリセットしてもよいし、そのまま保持し、推論処理を繰り返す度に上書きしてもよい。
The
At this time, the
続いて、マルチラベルデータ学習支援装置1は、ステップS2に戻り、識別器111の性能が所定の認識精度(目標の認識精度)以上になるまで(ステップS3参照)、上記の処理を繰り返す。
Subsequently, the multi-label data learning support device 1 returns to step S2 and repeats the above processing until the performance of the
<アノテーション対象画像選定処理>
次に、マルチラベルデータ学習支援装置1のアノテーション画像選定部14が実行するアノテーション対象画像選定処理について説明する。なお、このアノテーション対象画像選定処理は、図6のステップS8において実行される処理である。
図7は、本実施形態に係るマルチラベルデータ学習支援装置1のアノテーション画像選定部14が実行するアノテーション対象画像選定処理の流れを示すフローチャートである。
<Annotation target image selection process>
Next, the annotation target image selection process executed by the annotation
FIG. 7 is a flowchart showing the flow of the annotation target image selection process executed by the annotation
まず、アノテーション画像選定部14は、定義したラベル関連情報430(図5)を取得する(ステップS81)。
そして、アノテーション画像選定部14は、ラベル無し画像データDB42からラベル無し画像データを1つ選択する(ステップS82)。
First, the annotation
Then, the annotation
続いて、アノテーション画像選定部14は、選択したラベル無し画像データの推論結果(図4参照)と、定義したラベル関連情報とを比較する、即ち、推論結果が定義したラベル関連情報と異なっているか否かを判定する(ステップS83)。
具体的には、図4に示すラベル無し画像データ情報(推論後)420(420B)の選択したラベル無し画像データのレコードと、図5のラベル関連情報430のレコードとを比較して、説明ラベル437(第1ラベル)のラベル情報は一致するが目的ラベル(第2ラベル)のラベル情報が異なるレコードを探索する。例えば、図4の撮影画像保存先パス422が「A_101.jpg」のレコードは、図5のID431が「A_002」のレコードの説明ラベル(性別、年代)とラベル情報が「性別:男、年代:30代」で一致しているが、目的ラベル(服装(上半身))のラベル情報が異なっている。
Subsequently, the annotation
Specifically, the record of the selected unlabeled image data of the unlabeled image data information (after inference) 420 (420B) shown in FIG. 4 is compared with the record of the label-related information 430 of FIG. Search for records in which the label information of 437 (first label) matches but the label information of the target label (second label) is different. For example, a record whose captured
ステップS83において、ラベル無し画像データ情報(推論後)420(420B)のレコードと、ラベル関連情報430のレコードと比較して、説明ラベル437のラベル情報は一致するが、目的ラベル438のラベル情報が異なるレコードを見つけた場合(ステップS83→Yes)、そのラベル無し画像データを、アノテーション候補画像に決定する(ステップS84)。
なお、アノテーション候補画像に決定されたラベル無し画像データには、図8のラベル無し画像データ情報(アノテーション候補画像決定後)420(420C)に示すように、アノテーション候補427にフラグ(例えば、「YES」)をたてる。また、アノテーション画像選定部14は、ラベル無し画像データ情報(アノテーション候補画像決定後)420(420C)の関連度428の欄に、比較において異なっていると判定されたラベル関連情報430(図5)に記憶された関連度439の値を抽出して格納する。ここでは、図5のID431が「A_002」のレコードにおける関連度439の値「0.9」が、図8の撮影画像保存先パス422が「A_101.jpg」のレコードの関連度428の値「0.9」として格納される。
In step S83, the label information of the
For the unlabeled image data determined as the annotation candidate image, a flag (for example, "YES") is given to the
一方、ステップS83において、該当するレコードが見つからなかった場合には(ステップS83→No)、図8のラベル無し画像データ情報(アノテーション候補画像決定後)420(420C)に示すように、アノテーション候補427のフラグを、例えば「NO」として(フラグをたてずに)、次のステップS85に進む。
On the other hand, if the corresponding record is not found in step S83 (step S83 → No), the
ステップS85において、アノテーション画像選定部14は、ラベル無し画像データDB42に記憶されたラベル無し画像データのすべてを処理したか否かを判定する。そして、まだ処理していないラベル無し画像データがある場合には(ステップS85→No)、ステップS82に戻り、次のラベル無し画像データについて処理を続ける。一方、ラベル無し画像データのすべての処理を終えた場合には(ステップS85→Yes)、ステップS86に進む。
In step S85, the annotation
ステップS86において、アノテーション画像選定部14は、決定したアノテーション候補画像の数が、所定の閾値を超えたか否かを判定する。なお、このアノテーション候補画像の数に関する所定の閾値は、アノテーション処理を実行するラベル無し画像データの数を制限するための閾値であり、予め記憶部40に格納しておく。
そして、所定の閾値を超えていなかった場合に(ステップS86→No)、アノテーション画像選定部14は、アノテーション候補画像のすべてを、アノテーションを実行するアノテーション対象画像に選定し(ステップS87)、処理を終える。
In step S86, the annotation
Then, when the predetermined threshold value is not exceeded (step S86 → No), the annotation
一方、所定の閾値を超えていた場合に(ステップS86→Yes)、アノテーション画像選定部14は、ラベル無し画像データ情報(アノテーション候補画像決定後)420(420C)(図8)を参照し、アノテーション候補427のフラグがたっているラベル無し画像データのレコードの中で、関連度428の値が高い順に所定の閾値に達する数までアノテーション候補画像を、アノテーションを実行するアノテーション対象画像に選定し(ステップS88)、処理を終える。
なお、関連度428の値が高い順に選定する理由は、関連度の値が高い程、説明ラベルと目的ラベルとの関連の強さが強いため、推論結果が定義したラベル関連情報と異なっている場合には、その推論が間違っている可能性が高くなるためである。
On the other hand, when the predetermined threshold is exceeded (step S86 → Yes), the annotation
The reason for selecting in descending order of the
<ユーザインタフェース>
次に、本実施形態に係るマルチラベルデータ学習支援装置1のラベル関連情報定義部23が提供するユーザインタフェース(以下、「UI」と称する。)について説明する。ラベル関連情報定義部23は、ラベル関連情報定義UI200(図9,図11参照)と、ラベル関連情報履歴確認UI250を、出力部30を介して表示装置に表示し、アノテータ9等によりラベル関連情報に関する定義の設定情報の入力を受け付け、ラベル関連情報DB43にラベル関連情報430(図5)として記憶する。
<User interface>
Next, a user interface (hereinafter, referred to as “UI”) provided by the label-related
図9は、本実施形態に係るラベル関連情報定義UI200を例示する図である。アノテータ9は、新規または追加でラベル関連情報の定義を設定する場合に、このラベル関連情報定義UI200を利用する。
FIG. 9 is a diagram illustrating the label-related information definition UI 200 according to the present embodiment. The
まず、アノテータ9は、画像読込(メニュー)201により、ラベル関連情報を定義する撮影場所の撮影画像を選定する。選定した撮影画像は、画像表示領域202に表示される。また、選定した撮影画像の撮影場所は、撮影場所テキストボックス203に表示される。図9では、撮影場所として「A工場」が表示される例を示している。ここで、新規にラベル関連情報を定義する場合には、IDテキストボックス204に、ユニークなIDが自動で表示される。なお、このIDは、ユニークであれば、アノテータ9等が自由に設定してもよい。
First, the
次に、アノテータ9等により行われるラベル関連情報の定義の設定手法を説明する。
ラベル関連情報定義部23は、関連性のあるラベルのラベル情報について、ラベルプルダウン205による選択を受け付ける。図9では性別ラベルにおいて「男性」を選択した例を示している。そして、その選択したラベルが、説明ラベル(「説明」)(第1ラベル)か目的ラベル(「目的」)(第2ラベル)かの選択を、関連種別プルダウン206により受け付ける。この際、説明ラベルと目的ラベルは、それぞれ1項目以上が選択される。
Next, a method for setting the definition of label-related information performed by the
The label-related
次に、アノテータ9により、当該ラベル関連情報の関連度が設定される。関連度の設定は、関連度スライダー207による設定でもよいし、関連度テキストエディタ208による設定でもよい。
Next, the
定義したラベル関連情報は、登録ボタン209が押されることにより、新規にラベル関連情報430(図5)に登録される。なお、登録された情報は、CSVファイルの形式やバイナリファイルのような形式で出力することもできる。
また、出力したラベル関連情報は、ラベル関連情報定義読込(メニュー)210によりファイルを選択することで、ラベル関連情報DB43(図1参照)にロードすることができる。ロードしたラベル関連情報は、履歴(ボタン)211が押されると、図10のラベル関連情報履歴確認UI250として表示でき、ラベル関連情報を一覧で確認することができる。
アノテータ9は、図10のラベル関連情報履歴確認UI250に表示されているラベル関連情報をマウス等で指定(例えば、ID「A_001」のレコードを指定)することにより、図11に示すように、ラベル関連情報定義UI200上で、定義内容の確認や修正を行うことが可能である。
The defined label-related information is newly registered in the label-related information 430 (FIG. 5) by pressing the
Further, the output label-related information can be loaded into the label-related information DB 43 (see FIG. 1) by selecting a file from the label-related information definition read (menu) 210. When the history (button) 211 is pressed, the loaded label-related information can be displayed as the label-related information history confirmation UI 250 in FIG. 10, and the label-related information can be confirmed in a list.
The
このように、アノテータ9は、ラベル関連情報定義UI200により、視覚的に分かりやすく簡易な手法で、ラベル関連情報の入力を行うことができる。よって、アノテータ9によるラベル関連情報の定義に関する負担を減らすことができる。
As described above, the
以上説明したように、本実施形態に係るマルチラベルデータ学習支援装置1、マルチラベルデータ学習支援方法およびマルチラベルデータ学習支援プログラムによれば、画像の撮影場所ごとに異なるマルチラベルの「ラベル間の関連性」をラベル関連情報として事前に定義することにより、能動学習において学習効果の高いデータを抽出する際に、このラベル関連情報を活用しアノテーション対象画像を選定することができる。よって、マルチラベルを持つ画像データにおいても、アノテーションを効率的に行うこと、つまり、アノテーション作業量を低減することが可能となる。 As described above, according to the multi-label data learning support device 1, the multi-label data learning support method, and the multi-label data learning support program according to the present embodiment, the multi-label "between labels" that differs depending on the shooting location of the image. By defining "relevance" in advance as label-related information, it is possible to select an image to be annotated by utilizing this label-related information when extracting data having a high learning effect in active learning. Therefore, it is possible to efficiently perform annotation even in image data having multiple labels, that is, to reduce the amount of annotation work.
なお、本実施形態においては、撮影場所が「A工場」であり、撮影された人物について、「性別」「年代」「服装(上半身)」「服装(下半身)」のマルチラベルを付加する例として説明した。しかし、本発明はこれに限定されず、例えば、工場内の外観検査工程において撮影された物(工業製品や食品等)について、例えば「傷(キズ)の種類」「傷の位置」「汚れ」等に関するマルチラベルを付加するような場合にも用いることができる。このとき、「傷の種類」「傷の位置」「汚れ」等についてのラベル間の関連性と傾向をラベル関連情報として定義しておく。例えば、傷の種類に、線傷、ピンホール、スクラッチ、打痕などがある場合に、「B製品の外観検査ライン(撮影場所)では、線傷(傷の種類)が上部表面(傷の位置)にあると、赤い異物(汚れ)が付着している。」という定義内容で、ラベル関連情報を定義する。このように、撮影対象は人物に限定されるものではなく、様々な物などにマルチラベルを付す際にも、本発明を適用することが可能である。 In this embodiment, the shooting location is "Factory A", and as an example of adding multi-labels of "gender", "age", "clothes (upper body)", and "clothes (lower body)" to the photographed person. explained. However, the present invention is not limited to this, and for example, for an object (industrial product, food, etc.) photographed in a visual inspection process in a factory, for example, "type of scratch (scratch)", "position of scratch", "dirt". It can also be used when adding a multi-label related to the above. At this time, the relationship and tendency between the labels regarding "type of scratch", "position of scratch", "dirt", etc. are defined as label-related information. For example, if the type of scratch includes line scratches, pinholes, scratches, dents, etc., "In the visual inspection line (photographing location) of product B, the line scratches (type of scratches) are on the upper surface (scratch position). ), Red foreign matter (dirt) is attached. ”, The label-related information is defined. As described above, the object to be photographed is not limited to a person, and the present invention can be applied even when a multi-label is attached to various objects and the like.
また、本発明に係るラベル関連情報で定義される「撮影場所」は、工場や商業施設、公園、駅などの場所(エリア)に限定されず、画像に写っている撮影領域が特定されればよく、マルチラベルを付加する対象に応じて、アノテータ9により任意に定義可能である。例えば、店舗内や、店舗の入り口、会議室、製造ラインの一工程(外観検査)、製品の一部分を特定して撮影した領域などを、撮影領域として「撮影場所」に設定することができる。
Further, the "shooting place" defined by the label-related information according to the present invention is not limited to a place (area) such as a factory, a commercial facility, a park, or a station, and if the shooting area shown in the image is specified. Often, it can be arbitrarily defined by the
また、本発明は、一般的なコンピュータのハードウェア資源を、マルチラベルデータ学習支援装置1の各機能として動作させるプログラム(マルチラベルデータ学習支援プログラム)によって実現することもできる。そして、プログラム(マルチラベルデータ学習支援プログラム)は、通信回線を介して配布したり、CD−ROM等の記録媒体に記録して配布したりすることが可能である。 Further, the present invention can also be realized by a program (multi-label data learning support program) that operates the hardware resources of a general computer as each function of the multi-label data learning support device 1. The program (multi-label data learning support program) can be distributed via a communication line, or can be recorded and distributed on a recording medium such as a CD-ROM.
1 マルチラベルデータ学習支援装置
10 制御部
11 学習部
12 評価部
13 推論部
14 アノテーション画像選定部
20 入力部
21 アノテーション処理部
22 画像データ読込部
23 ラベル関連情報定義部
30 出力部
40 記憶部
41 ラベル付き画像データDB
42 ラベル無し画像データDB
43 ラベル関連情報DB
111 識別器
200 ラベル関連情報定義ユーザインタフェース(UI)
250 ラベル関連情報履歴確認ユーザインタフェース(UI)
410 ラベル付き画像データ情報
420 ラベル無し画像データ情報
430 ラベル関連情報
437 説明ラベル(第1ラベル)
438 目的ラベル(第2ラベル)
1 Multi-label data learning
42 Unlabeled image data DB
43 Label-related information DB
111 Discriminator 200 Label Related Information Definition User Interface (UI)
250 Label-related information History confirmation user interface (UI)
410 Labeled image data information 420 Unlabeled image data information 430 Label-related
438 Purpose label (second label)
Claims (5)
ラベル付き画像データを記憶するラベル付き画像データDB(DataBase)、ラベル無し画像データを記憶するラベル無し画像データDB、および、前記複数のラベル間の関係性を示すとともに前記画像データに付されるマルチラベルの内容の傾向を示すラベル関連情報を記憶するラベル関連情報DBが格納される記憶部と、
前記ラベル付き画像データを取得し、機械学習により前記識別器を生成する学習部と、
生成した前記識別器を用いて前記ラベル無し画像データに対して、前記マルチラベルを構成する各ラベルの推論処理を行う推論部と、
前記推論処理で得られた前記ラベル無し画像データについての各ラベルの推論結果と、前記ラベル関連情報で示されるラベル間の関連性とを比較して異なる場合に、当該ラベル無し画像データを、画像データに正解ラベル付けを行う作業であるアノテーションを必要とする画像を示すアノテーション対象画像として選定するアノテーション画像選定部と、
選定された前記アノテーション対象画像を表示装置に表示させ、当該画像データの正解ラベルの入力を受け付け、受け付けた正解ラベルが付された画像データを、前記ラベル付き画像データとして前記ラベル付き画像データDBに記憶するアノテーション処理部と、
を備えることを特徴とするマルチラベルデータ学習支援装置。 It is a multi-label data learning support device that supports learning of a classifier that assigns multi-labels indicating multiple labels to image data.
A labeled image data DB (DataBase) that stores labeled image data, an unlabeled image data DB that stores unlabeled image data, and a multi that shows the relationship between the plurality of labels and is attached to the image data. A storage unit that stores a label-related information DB that stores label-related information that indicates the tendency of the contents of the label, and a storage unit that stores the label-related information DB.
A learning unit that acquires the labeled image data and generates the classifier by machine learning.
An inference unit that performs inference processing for each label constituting the multi-label on the unlabeled image data using the generated discriminator.
When the inference result of each label for the unlabeled image data obtained by the inference processing and the relationship between the labels shown in the label-related information are compared and different, the unlabeled image data is imaged. An annotation image selection unit that selects as an annotation target image that indicates an image that requires annotation, which is the work of labeling data correctly.
The selected image to be annotated is displayed on the display device, the input of the correct answer label of the image data is accepted, and the image data with the accepted correct answer label is stored in the labeled image data DB as the labeled image data. An annotation processing unit to store and
A multi-label data learning support device characterized by being equipped with.
前記アノテーション画像選定部は、前記ラベル無し画像データの前記推論結果として得られた各ラベルの情報の中から前記第1ラベルおよび前記第2ラベルの情報を抽出し、前記ラベル関連情報として記憶された第1ラベルに対応付けた第2ラベルの情報で示されるラベル間の関連性と一致するか否かにより前記比較を行うこと
を特徴とする請求項1に記載のマルチラベルデータ学習支援装置。 The label-related information is provided for each shooting location indicating the shooting area of the image data using the first label and the second label, in which one or more labels are selected from the labels constituting the multi-label. It is information in which the first label and the second label are associated with each other.
The annotation image selection unit extracts the information of the first label and the information of the second label from the information of each label obtained as the inference result of the unlabeled image data, and stores the information as the label-related information. The multi-label data learning support device according to claim 1, wherein the comparison is performed depending on whether or not the relationship between the labels indicated by the information of the second label associated with the first label matches.
を特徴とする請求項2に記載のマルチラベルデータ学習支援装置。 Label-related information that displays an input screen for defining a label corresponding to each of the first label and the second label among the labels constituting the multi-label on the display device and accepts the input of the label-related information. The multi-label data learning support device according to claim 2, further comprising a definition unit.
前記マルチラベルデータ学習支援装置は、
ラベル付き画像データを記憶するラベル付き画像データDB、ラベル無し画像データを記憶するラベル無し画像データDB、および、前記複数のラベル間の関係性を示すとともに前記画像データに付されるマルチラベルの内容の傾向を示すラベル関連情報を記憶するラベル関連情報DBが格納される記憶部を備えており、
前記ラベル付き画像データを取得し、機械学習により前記識別器を生成するステップと、
生成した前記識別器を用いて前記ラベル無し画像データに対して、前記マルチラベルを構成する各ラベルの推論処理を行うステップと、
前記推論処理で得られた前記ラベル無し画像データについての各ラベルの推論結果と、前記ラベル関連情報で示されるラベル間の関連性とを比較して異なる場合に、当該ラベル無し画像データを、画像データに正解ラベル付けを行う作業であるアノテーションを必要とする画像を示すアノテーション対象画像として選定するステップと、
選定された前記アノテーション対象画像を表示装置に表示させ、当該画像データの正解ラベルの入力を受け付け、受け付けた正解ラベルが付された画像データを、前記ラベル付き画像データとして前記ラベル付き画像データDBに記憶するステップと、
を実行することを特徴とするマルチラベルデータ学習支援方法。 It is a multi-label data learning support method of a multi-label data learning support device that supports learning of a classifier that assigns a multi-label indicating a plurality of labels to image data.
The multi-label data learning support device is
A labeled image data DB that stores labeled image data, an unlabeled image data DB that stores unlabeled image data, and the contents of a multi-label attached to the image data while showing the relationship between the plurality of labels. It is provided with a storage unit for storing a label-related information DB that stores label-related information indicating the tendency of the above.
The step of acquiring the labeled image data and generating the classifier by machine learning, and
A step of inferring each label constituting the multi-label on the unlabeled image data using the generated classifier, and
When the inference result of each label for the unlabeled image data obtained by the inference processing and the relationship between the labels shown in the label-related information are compared and different, the unlabeled image data is referred to as an image. The step of selecting an image that requires an annotation, which is the work of labeling the data correctly, as an image to be annotated, and
The selected image to be annotated is displayed on the display device, the input of the correct answer label of the image data is accepted, and the image data with the accepted correct answer label is stored in the labeled image data DB as the labeled image data. Steps to remember and
A multi-label data learning support method characterized by executing.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018239239A JP6989485B2 (en) | 2018-12-21 | 2018-12-21 | Multi-label data learning support device, multi-label data learning support method and multi-label data learning support program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018239239A JP6989485B2 (en) | 2018-12-21 | 2018-12-21 | Multi-label data learning support device, multi-label data learning support method and multi-label data learning support program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020101968A JP2020101968A (en) | 2020-07-02 |
| JP6989485B2 true JP6989485B2 (en) | 2022-01-05 |
Family
ID=71139735
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018239239A Active JP6989485B2 (en) | 2018-12-21 | 2018-12-21 | Multi-label data learning support device, multi-label data learning support method and multi-label data learning support program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6989485B2 (en) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7529514B2 (en) * | 2020-09-30 | 2024-08-06 | 矢崎総業株式会社 | Annotation device, annotation method, and annotation program |
| JP7189922B2 (en) * | 2020-11-27 | 2022-12-14 | ソフトバンク株式会社 | Information processing device, information processing method and information processing program |
| CN112418134B (en) * | 2020-12-01 | 2024-02-27 | 厦门大学 | Multi-stream multi-label pedestrian re-identification method based on pedestrian parsing |
| CN112528610B (en) * | 2020-12-09 | 2023-11-14 | 北京百度网讯科技有限公司 | A data labeling method, device, electronic equipment and storage medium |
| WO2022209836A1 (en) * | 2021-04-01 | 2022-10-06 | 富士フイルム株式会社 | Training data generation device, training data generation method and program, and training device |
| US12367261B1 (en) * | 2021-05-19 | 2025-07-22 | Nvidia Corporation | Extending supervision using machine learning |
| JP7702298B2 (en) * | 2021-08-02 | 2025-07-03 | エヌ・ティ・ティ・コムウェア株式会社 | Data classification system, data classification method, program, and method for evaluating machine learning models |
| US20240331418A1 (en) * | 2021-09-29 | 2024-10-03 | Nec Corporation | Image processing device, image processing method, and recording medium |
| US12525337B2 (en) | 2022-02-09 | 2026-01-13 | Lunit Inc. | Method and apparatus for selecting medical data for annotation |
| WO2025164045A1 (en) * | 2024-01-29 | 2025-08-07 | パナソニックIpマネジメント株式会社 | Image classification system, image classification method, and program |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11170262B2 (en) * | 2015-10-30 | 2021-11-09 | Morpho, Inc. | Training system, training device, method for training, training data creation device, training data creation method, terminal device, and threshold value changing device |
| JP6486853B2 (en) * | 2016-03-07 | 2019-03-20 | 株式会社東芝 | Classification label assignment apparatus, classification label assignment method, and program |
-
2018
- 2018-12-21 JP JP2018239239A patent/JP6989485B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2020101968A (en) | 2020-07-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6989485B2 (en) | Multi-label data learning support device, multi-label data learning support method and multi-label data learning support program | |
| US11823128B2 (en) | Large-scale automated image annotation system | |
| US8416997B2 (en) | Method of person identification using social connections | |
| US10242250B2 (en) | Picture ranking method, and terminal | |
| CN110325983B (en) | Image retrieval device and image retrieval method | |
| US20190244271A1 (en) | Computer Vision and Image Characteristic Search | |
| US9852358B2 (en) | Information processing device, information processing method, and information processing system | |
| JP5077164B2 (en) | Tracking device and tracking method | |
| JP2022003831A (en) | Apparatus, method, and program | |
| US10043300B2 (en) | Image processing apparatus, control method, and record medium for selecting a template for laying out images | |
| US11475500B2 (en) | Device and method for item recommendation based on visual elements | |
| JP7704234B2 (en) | Information processing device, information processing method, and program | |
| Wong et al. | Smartannotator an interactive tool for annotating indoor rgbd images | |
| CN110246011A (en) | Interpretable fashion clothing personalized recommendation method | |
| CN118093902A (en) | Electronic device and method for providing search results | |
| JPWO2020026643A1 (en) | Information processing equipment, information processing methods and information processing programs | |
| CN113474769A (en) | Image retrieval device and supervised data extraction method | |
| US10891580B2 (en) | Service design assistance system and service design assistance method | |
| JP2016057940A (en) | Image processing apparatus and image processing program | |
| CN113297416B (en) | Video data storage method, device, electronic device and readable storage medium | |
| US20120230589A1 (en) | Computer-readable storage medium storing image processing program, image processing method, and image processing device | |
| US11080173B2 (en) | Boundary search test support device and boundary search test support method | |
| US20230333720A1 (en) | Generating presentation information associated with one or more objects depicted in image data for display via a graphical user interface | |
| CN114693918B (en) | Image recognition method and device and computer readable storage medium | |
| JP2020135580A (en) | Retrieval device, retrieval method and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201208 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211020 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211116 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211202 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6989485 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |