JP7618917B2 - Machine learning device, machine learning method, and machine learning program - Google Patents
Machine learning device, machine learning method, and machine learning program Download PDFInfo
- Publication number
- JP7618917B2 JP7618917B2 JP2021010177A JP2021010177A JP7618917B2 JP 7618917 B2 JP7618917 B2 JP 7618917B2 JP 2021010177 A JP2021010177 A JP 2021010177A JP 2021010177 A JP2021010177 A JP 2021010177A JP 7618917 B2 JP7618917 B2 JP 7618917B2
- Authority
- JP
- Japan
- Prior art keywords
- task
- feature map
- learning
- input
- input task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
本発明は、機械学習技術に関する。 The present invention relates to machine learning technology.
人間は長期にわたる経験を通して新しい知識を学習することができ、昔の知識を忘れないように維持することができる。一方、畳み込みニューラルネットワーク(Convolutional Neural Network(CNN))の知識は学習に使用したデータセットに依存しており、データ分布の変化に適応するためにはデータセット全体に対してCNNのパラメータの再学習が必要となる。CNNでは、新しいタスクについて学習していくにつれて、昔のタスクに対する推定精度は低下していく。このようにCNNでは連続学習を行うと新しいタスクの学習中に昔のタスクの学習結果を忘れてしまう致命的忘却(catastrophic forgetting)が避けられない。 Humans are able to learn new knowledge through long-term experience, and are able to retain old knowledge without forgetting it. On the other hand, the knowledge of a Convolutional Neural Network (CNN) depends on the dataset used for training, and in order to adapt to changes in the data distribution, it is necessary to retrain the CNN parameters for the entire dataset. As a CNN learns new tasks, its estimation accuracy for old tasks decreases. Thus, when a CNN performs continuous training, it is unavoidable to suffer from catastrophic forgetting, in which the learning results of old tasks are forgotten while learning a new task.
致命的忘却を回避する手法として、継続学習(incremental learningまたはcontinual learning)が提案されている。継続学習の一つの手法としてPackNetがある。 Incremental learning or continual learning has been proposed as a method to avoid fatal forgetting. One method of continuous learning is PackNet.
特許文献1には、入力された検証用画像と類似する画像にラベルを付与することで教師データを作成し、作成された教師データを用いて教師あり画像分類器を学習させる情報処理システムが開示されている。
継続学習の一つの手法であるPackNetは、致命的忘却問題を回避することができる。しかし、入力データにラベル情報がなければ継続学習に利用することができないという問題があった。また、入力データを学習に用いる頻度を制御しなければ学習に偏りが生じることがある。 PackNet, one method of continuous learning, can avoid the fatal forgetting problem. However, there is a problem in that if the input data does not have label information, it cannot be used for continuous learning. In addition, if the frequency with which the input data is used for learning is not controlled, bias in the learning may occur.
本発明はこうした状況に鑑みてなされたものであり、その目的は、入力データにラベル情報を与え、入力データを学習に用いる頻度を制御することができる機械学習技術を提供することにある。 The present invention was made in light of these circumstances, and its purpose is to provide a machine learning technique that can assign label information to input data and control the frequency with which the input data is used for learning.
上記課題を解決するために、本発明のある態様の機械学習装置は、入力タスクの特徴マップと予め登録されている各タスクの代表特徴マップの類似度を算出し、最も類似度が高いタスクが持つラベルを前記入力タスクに付与する分類部と、前記入力タスクを継続学習に用いるかどうかを決定する制御部と、前記入力タスクを継続学習に用いる場合、ラベルが付与された前記入力タスクを教師データとして継続学習する継続学習部とを含む。 To solve the above problem, a machine learning device according to one embodiment of the present invention includes a classification unit that calculates the similarity between a feature map of an input task and a representative feature map of each task registered in advance, and assigns the label of the most similar task to the input task, a control unit that decides whether to use the input task for continued learning, and a continuous learning unit that, if the input task is to be used for continued learning, performs continuous learning using the labeled input task as training data.
本発明の別の態様は、機械学習方法である。この方法は、入力タスクの特徴マップと予め登録されている各タスクの代表特徴マップの類似度を算出し、最も類似度が高いタスクが持つラベルを前記入力タスクに付与する分類ステップと、前記入力タスクを継続学習に用いるかどうかを決定する制御ステップと、前記入力タスクを継続学習に用いる場合、ラベルが付与された前記入力タスクを教師データとして継続学習する継続学習ステップとを含む。 Another aspect of the present invention is a machine learning method. This method includes a classification step of calculating the similarity between a feature map of an input task and a representative feature map of each task registered in advance, and assigning the label of the task with the highest similarity to the input task, a control step of determining whether or not to use the input task for continued learning, and a continuous learning step of performing continuous learning using the labeled input task as training data if the input task is to be used for continued learning.
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。 In addition, any combination of the above components, and any transformation of the present invention into a method, device, system, recording medium, computer program, etc., are also valid aspects of the present invention.
本発明によれば、入力データにラベル情報を与え、入力データを学習に用いる頻度を制御することができる機械学習技術を提供することができる。 The present invention provides a machine learning technique that can assign label information to input data and control the frequency with which the input data is used for learning.
図1は、実施の形態に係る機械学習装置100の構成図である。機械学習装置100は、入力部10、スクリーニング処理部20、タスク保存部30、継続学習部40、タスクデータベース50、推論部60、および出力部70を含む。
Figure 1 is a configuration diagram of a
入力部10は、ラベルを付与すべきタスクをスクリーニング処理部20に供給し、未知タスクを推論部60に供給する。ここでは、一例としてタスクは画像認識である。たとえば、タスク1は猫の認識、タスク2は犬の認識といった画像における特定の物体の認識である。
The
スクリーニング処理部20は、入力されたタスクの特徴マップをタスクデータベース50に登録されたタスクの代表特徴マップと比較して類似度を算出し、入力されたタスクを最も類似度が高いタスクに分類し、入力されたタスクの類似度をもつタスクが学習に用いられた頻度および類似度の少なくとも一方にもとづいて入力されたタスクを継続学習に利用するかどうかを決定する。
The
入力されたタスクの画像を物体認識モデルであるニューラルネットワークモデルに入力すると特徴マップが出力される。入力画像の特徴マップが例えば猫の特徴マップと類似するならば、入力画像は猫の画像であると認識し、猫というラベルを付与する。 When the input task image is input into a neural network model, which is an object recognition model, a feature map is output. If the feature map of the input image is similar to, for example, the feature map of a cat, the input image is recognized as an image of a cat and is labeled as a cat.
ここで、タスクは、1つの特徴マップだけで物体を認識しているわけではなく、複数の特徴マップを使って物体を認識している。そこで、タスクの複数の特徴マップの平均値などの代表値と入力タスクの特徴マップを比較して類似度を算出する。 Here, the task does not recognize an object using only one feature map, but multiple feature maps. Therefore, the similarity is calculated by comparing a representative value, such as the average value, of the task's multiple feature maps with the feature map of the input task.
類似度は、特徴マップの要素の値の絶対値を比較することによって算出する。たとえば、特徴マップのサイズが256×256の場合、65536個の要素の絶対値を比較する。ここで、閾値を設定する。類似度が閾値を上回ると、二つの特徴マップは重複していると判定される。 The similarity is calculated by comparing the absolute values of the elements of the feature maps. For example, if the size of the feature maps is 256 x 256, the absolute values of 65,536 elements are compared. A threshold is set here. If the similarity exceeds the threshold, the two feature maps are determined to overlap.
特徴マップAの各要素をaij、特徴マップBの各要素をbijとした場合、二つの特徴マップA、B間で同じ位置にある値の絶対値の差を、たとえば次式のd1(A,B)、d2(A,B)、d∞(A,B)、dm(A,B)のように計算する。
上記の説明では、特徴マップの類似度は、二つの特徴マップ間で同じ位置にある値の絶対値の差を計算することによって算出したが、これ以外の方法で類似度を算出してもよい。たとえば、各特徴マップについて、特徴マップ絶対差分和SADを水平方向絶対差分和SAD_Hと垂直方向絶対差分和SAD_Vの和として、SAD=SAD_H+SAD_Vにより求める。特徴マップAの特徴マップ絶対差分和SAD_Aと特徴マップBの特徴マップ絶対差分和SAD_Bの差が閾値より小さいなら、特徴マップAと特徴マップBは重複していると判定してもよい。ここで、説明を簡単にするため、特徴マップのサイズが3×3であるとして、特徴マップの第1行の要素をa1、a2、a3、第2行の要素をa4、a5、a6、第3行の要素をa7、a8、a9とした場合、水平方向絶対差分和SAD_Hと垂直方向絶対差分和SAD_Vは次式で与えられる。
SAD_H=|a1-a2|+|a2-a3|+|a4-a5|+|a5-a6|+|a7-a8|+|a8-a9|
SAD_V=|a1-a4|+|a2-a5|+|a3-a6|+|a4-a7|+|a5-a8|+|a6-a9|
また、別の類似度の算出方法として、ユークリッド距離やコサイン距離の比較を用いてもよい。
In the above description, the similarity between the feature maps is calculated by calculating the difference between the absolute values of values at the same position between the two feature maps, but the similarity may be calculated by other methods. For example, for each feature map, the feature map absolute difference sum SAD is calculated as the sum of the horizontal absolute difference sum SAD_H and the vertical absolute difference sum SAD_V, and SAD = SAD_H + SAD_V is calculated. If the difference between the feature map absolute difference sum SAD_A of the feature map A and the feature map absolute difference sum SAD_B of the feature map B is smaller than a threshold value, the feature maps A and B may be determined to be overlapping. Here, for the sake of simplicity, assuming that the size of the feature map is 3 x 3, the elements of the first row of the feature map are a1, a2, a3, the elements of the second row are a4, a5, a6, and the elements of the third row are a7, a8, a9, the horizontal absolute difference sum SAD_H and the vertical absolute difference sum SAD_V are given by the following formulas.
SAD_H=|a1-a2|+|a2-a3|+|a4-a5|+|a5-a6|+|a7-a8|+|a8-a9|
SAD_V=|a1-a4|+|a2-a5|+|a3-a6|+|a4-a7|+|a5-a8|+|a6-a9|
As another method for calculating the similarity, a comparison of Euclidean distance or cosine distance may be used.
タスク保存部30は、分類された入力タスクによってタスクデータベース50を更新し、頻度および類似度の少なくとも一方にもとづいて、分類された入力タスクを継続学習部40に与えるかどうかを制御する。たとえば、分類された入力タスクの頻度がタスクデータベース50の登録タスクの平均的な頻度未満の場合、または分類された入力タスクの類似度が所定の閾値未満の場合、分類された入力タスクを継続学習に用いるが、分類された入力タスクの頻度が平均的な頻度以上の場合、または分類された入力タスクの類似度が所定の閾値以上の場合、分類された入力タスクを継続学習に用いない。ここで、入力タスクの頻度は、例えば、入力タスクを学習した回数、入力タスクの使用回数をタスクデータベース50に登録された他のタスクの使用回数と比較した場合の相対的な指標などにより、評価される。
The
継続学習部40は、タスク保存部30から分類された入力タスクを受け取った場合、その分類された入力タスクを教師付きデータとして物体認識モデルを継続学習する。
When the
推論部60は、継続学習部40により学習された物体認識モデルを用いて、入力部10から受け取った未知タスクの分類を推論する。出力部70は、推論部60による推論結果を出力する。
The
図2は、図1のスクリーニング処理部20の構成図である。スクリーニング処理部20は、スクリーニング部80および学習制御部90を含む。
Figure 2 is a configuration diagram of the
スクリーニング部80は、タスクデータベース50から読み出された各タスクの代表特徴マップを入力されたタスクの特徴マップと比較し、入力されたタスクを最も類似するタスクに分類し、入力されたタスクにラベル情報を付与する。スクリーニング部80は、入力されたタスクのラベル情報および類似度を学習制御部90に供給し、入力されたタスクの特徴マップをタスク保存部30に供給する。
The
学習制御部90は、入力タスクと同じ類似度をもつタスクが学習された頻度にもとづいて入力されたタスクを継続学習部40に与えるかどうかを決定する。
The
図3は、スクリーニング部80の構成図である。スクリーニング部80は、代表特徴マップ取得部82、特徴マップ変換部84、および分類部86を含む。
Figure 3 is a configuration diagram of the
代表特徴マップ取得部82は、タスクデータベース50から各タスクの代表特徴マップを読み出し、分類部86に供給する。特徴マップ変換部84は、入力されたタスクの特徴マップを計算し、分類部86に供給する。分類部86は、入力されたタスクの特徴マップとタスクデータベース50の各タスクの代表特徴マップの類似度を計算し、入力されたタスクを最も類似度が高いタスクに分類し、入力されたタスクにラベルを付与する。分類部86は、入力されたタスクのラベルと類似度を学習制御部90に、入力されたタスクの特徴マップをタスク保存部30に供給する。
The representative feature
図4は、学習制御部90の構成図である。学習制御部90は、頻度情報取得部92、類似度情報取得部94、および学習頻度制御部96を含む。
Figure 4 is a configuration diagram of the
頻度情報取得部92は、入力されたタスクと同じ類似度を有する同一ラベルのタスクが学習された頻度をタスクデータベース50から取得し、学習頻度制御部96に供給する。類似度情報取得部94は、入力されたタスクの類似度を学習頻度制御部96に供給する。また、頻度情報取得部92は頻度をタスク保存部30に供給し、類似度情報取得部94は類似度をタスク保存部30に供給する。
The frequency
学習頻度制御部96は、頻度および類似度の少なくとも一方にもとづいて入力されたタスクを継続学習に用いるかどうかを決定し、継続学習の有無をタスク保存部30に与える。
The learning
継続学習では、学習データの順番に学習結果が大きく依存し、学習データの与え方に偏りがあれば、結果に大きな影響が出る。学習データの多様性を維持するために、同じ類似度を持つタスクが学習された頻度を計測し、学習データの頻度の分布を均一にする。 In continuous learning, the learning results are highly dependent on the order of the learning data, and any bias in the way the learning data is presented will have a significant impact on the results. To maintain the diversity of the learning data, we measure the frequency with which tasks with the same similarity are learned, and make the frequency distribution of the learning data uniform.
学習頻度制御部96は、入力されたタスクの学習頻度がタスクデータベース50に登録された各タスクの平均的な学習頻度よりも低いか、入力されたタスクの類似度が所定の閾値よりも低い場合、入力されたタスクを継続学習に用いる。これは、学習頻度が低いタスクや類似度が低いタスクは継続学習に積極的に用いることでタスク全体の推論精度を偏りなく向上させることができるからである。
The learning
例えば、猫の画像が学習された頻度が高く、既に猫の認識は十分な精度があるにもかかわらず、入力された猫の画像を再度学習してしまうと、学習に偏りが生じてしまう。そこで十分な学習後には余分な学習を行わないようにすることで他のタスクとの学習の回数を均等にし、致命的忘却の発生リスクを下げる。逆に犬の画像の学習頻度が他のタスクと比べて低い場合、入力された犬の画像を継続学習することで、他のタスクとの学習の回数を均等にする。 For example, if cat images have been learned frequently and cat recognition is already sufficiently accurate, relearning the input cat images will result in biased learning. Therefore, by preventing additional learning after sufficient learning, the number of times learning with other tasks is made equal, lowering the risk of fatal forgetting. Conversely, if the frequency with which dog images are learned is low compared to other tasks, the number of times learning with other tasks is made equal by continuing to learn the input dog images.
図5は、タスク保存部30の構成図である。タスク保存部30は、更新判定部32を含み、タスクデータベース50に登録されたタスクの更新判定を行う。
Figure 5 is a configuration diagram of the
更新判定部32は、特徴マップ、類似度、頻度、および継続学習の有無にもとづいてタスクデータベース50に登録されたタスクを必要に応じて更新する。タスクの学習頻度は類似度毎に格納されており、頻度情報は毎回更新される。タスクの代表特徴マップは、継続学習に与える入力タスクの特徴マップを用いて更新される。継続学習に与えない入力タスクについては無視し、代表特徴マップの更新には用いられない。
The
タスク保存部30は、継続学習の有無を継続学習部40に供給する。継続学習部40は、継続学習の有無を参照して、入力されたタスクを継続学習に利用する場合、入力されたタスクを教師データとして継続学習するが、入力されたタスクを継続学習に利用しない場合、入力されたタスクを無視する。
The
図6は、タスクデータベース50の構成図である。タスクデータベース50には、各タスクの代表特徴マップ52と頻度54が格納されている。ここでタスクの特徴マップの代表値は、たとえばタスクの複数の特徴マップの平均値、中央値、最頻値、最大値、最小値などである。
Figure 6 is a diagram showing the configuration of the
図7は、図1の機械学習装置100による継続学習手順を説明するフローチャートである。
Figure 7 is a flowchart explaining the continuous learning procedure by the
入力部10は、ラベルが不明のタスクを入力し、スクリーニング処理部20に与える(S10)。
The
スクリーニング処理部20において、スクリーニング部80の分類部86は、入力タスクの特徴マップとタスクデータベース50に登録された各タスクの代表特徴マップの類似度にもとづいて入力タスクを分類し、ラベルを付与する(S20)。
In the
スクリーニング処理部20において、学習制御部90の学習頻度制御部96は、入力タスクの頻度および類似度の少なくとも一方にもとづいて入力タスクを継続学習に用いるかどうかを決定する(S30)。
In the
タスク保存部30の更新判定部32は、タスクデータベース50に類似度と関連づけられた頻度を更新するとともに、入力タスクが継続学習に用いられる場合、入力タスクの特徴マップを用いてタスクデータベース50に登録されたタスクの代表特徴マップを更新する(S40)。
The
入力タスクを継続学習に用いる場合(S50のY)、継続学習部40は、ラベルが付与された入力タスクを用いて物体認識モデルを継続学習し(S60)、入力タスクを継続学習に用いない場合(S50のN)、入力タスクを無視し、ステップS70に進む。
If the input task is to be used for continued learning (Y in S50), the continued
まだタスクがある場合(S70のN)、ステップS10に戻り、次のタスクを入力する。タスクが終了の場合(S70のY)、継続学習を終了する。 If there are still tasks (N in S70), return to step S10 and input the next task. If the task is complete (Y in S70), end the continuous learning.
上記の実施の形態で説明した特徴マップについて、図8~図12を参照して詳しく説明する。 The feature map described in the above embodiment will be explained in detail with reference to Figures 8 to 12.
図8は、畳み込みニューラルネットワークの各畳み込み層から出力される特徴マップを説明する図である。本実施の形態において、特徴マップは入力データを畳み込みニューラルネットワークに入力した場合の畳み込み層の出力データのことである。図8に示すように、特徴マップには、各レイヤの畳み込み層の中間的な出力データと、最終レイヤの畳み込み層の最終的な出力データの二種類がある。 Figure 8 is a diagram explaining the feature maps output from each convolutional layer of a convolutional neural network. In this embodiment, the feature map refers to the output data of the convolutional layer when input data is input to the convolutional neural network. As shown in Figure 8, there are two types of feature maps: intermediate output data from the convolutional layers of each layer, and final output data from the convolutional layer of the final layer.
図9は、畳み込みニューラルネットワークの各畳み込み層から出力される特徴マップの連結を説明する図である。入力データの特徴マップを取得する際、最終レイヤの畳み込み層から出力される特徴マップだけでは、見逃される特徴がある。そこで、図9に示すように、適宜必要な中間レイヤの畳み込み層から出力される特徴マップと最終レイヤの畳み込み層から出力される最終特徴マップとを連結して、入力データの特徴マップを作成することがより好ましい。例えば、レイヤ2の特徴マップ2と最終レイヤの最終特徴マップを連結する。レイヤ2の特徴マップ2、レイヤ5の特徴マップ5、および最終レイヤの最終特徴マップを連結する。このように様々な組み合わせがあり、目的によって使い分けることができる。 Figure 9 is a diagram explaining the concatenation of feature maps output from each convolutional layer of a convolutional neural network. When obtaining a feature map of input data, some features may be overlooked if only the feature map output from the convolutional layer of the final layer is used. Therefore, as shown in Figure 9, it is more preferable to create a feature map of the input data by concatenating the feature maps output from the convolutional layers of the intermediate layers as required and the final feature map output from the convolutional layer of the final layer. For example, concatenate feature map 2 of layer 2 and the final feature map of the final layer. Concatenate feature map 2 of layer 2, feature map 5 of layer 5, and the final feature map of the final layer. As shown above, there are various combinations, which can be used depending on the purpose.
図10は、チャネル数の異なる特徴マップを加算して連結した特徴マップを生成する方法を説明する図である。ここでは、チャネル数が64、サイズが256×256の特徴マップ2と、チャネル数が128、サイズが256×256の特徴マップ4とを連結する場合を説明する。チャネル数を統一する、すなわち特徴マップ2のチャネル数を特徴マップ4と同じチャネル数にするために、特徴マップ2の後に畳み込み層を設置する。この畳み込み層の入力チャネル数は64、出力チャネル数は128であり、フィルタのサイズは1×1である。特徴マップ2をこの畳み込み層に入力すると、畳み込み層から出力される新特徴マップ2のサイズは変わらないが、チャネル数は128に変換される。すなわち新特徴マップ2は、チャネル数が128、サイズが256×256になる。チャネル数が統一された新特徴マップ2と特徴マップ4を加算することにより、チャネル数が128、サイズが256×256の連結した特徴マップが生成される。
Figure 10 is a diagram explaining a method for generating a concatenated feature map by adding feature maps with different numbers of channels. Here, a case will be explained in which feature map 2 with 64 channels and size 256 x 256 is concatenated with
図11は、チャネル数とサイズの両方が異なる特徴マップを加算して連結した特徴マップを生成する方法を説明する図である。ここでは、チャネル数が64、サイズが256×256の特徴マップ2と、チャネル数が128、サイズが64×64の特徴マップ4とを連結する場合を説明する。チャネル数を統一する、すなわち特徴マップ2のチャネル数を特徴マップ4と同じチャネル数にするために、特徴マップ2に対してゼロパディングでチャネル数を増やす。これは追加したチャネルの値をゼロで埋めることである。これにより、特徴マップ2のチャネル数は128に変換される。その後、サイズを統一する、すなわち特徴マップ2のサイズを特徴マップ4と同じサイズにするために、特徴マップ2をダウンサンプリングする。これはストライドが4のプーリングをすることにより実現される。プーリングの例として最大値を出力する最大プーリングや平均値を出力する平均プーリングを用いることができ、これらに限らず、他の方法でプーリングしてもよい。これにより、チャネル数が128、サイズが64×64の新特徴マップ2が得られる。チャネル数およびサイズが統一された新特徴マップ2と特徴マップ4を加算することにより、チャネル数が128、サイズが64×64の連結した特徴マップが生成される。なお、特徴マップ2のチャネル数を特徴マップ4と同じチャネル数にするために、図10で説明した特徴マップ2の後に畳み込み層を設置する方法を採用してもよい。
Figure 11 is a diagram explaining a method for generating a feature map by adding and concatenating feature maps with different numbers of channels and sizes. Here, a case will be explained in which a feature map 2 with 64 channels and a size of 256 x 256 is concatenated with a
図12は、特徴マップを結合して連結した特徴マップを生成する方法を説明する図である。ここでは、チャネル数が64、サイズが256×256の特徴マップ2と、チャネル数が128、サイズが64×64の特徴マップ4とを連結する場合を説明する。特徴マップのサイズが異なるため、サイズを統一する、すなわち特徴マップ2のサイズを特徴マップ4と同じサイズにするために、特徴マップ2をダウンサンプリングする。これはストライドが4のプーリングをすることにより実現される。これにより、チャネル数が64、サイズが64×64の新特徴マップ2が得られる。チャネル数が異なり、サイズが同一の新特徴マップ2と特徴マップ4を結合(concatenate)することにより、チャネル数が192、サイズが64×64の連結した特徴マップが生成される。特徴マップは、サイズが同じであれば、チャネル数が異なっていても、3次元テンソルとして結合(concatenate)することができることに留意する。たとえば、特徴マップAの次元が[64×64×64]、特徴マップBの次元が[128×64×64]の場合(ここで特徴マップのサイズを[H×W]とすると、特徴マップの次元は[チャネル数×H×W]で表される)、特徴マップAと特徴マップBを結合する時、サイズH×Wが同じであれば、結合した特徴マップの次元は[(チャネル数A+チャネル数B)×H×W]=[(64+128)×64×64]=[192×64×64]となる。
Figure 12 is a diagram explaining a method of generating a concatenated feature map by combining feature maps. Here, a case will be explained in which a feature map 2 with 64 channels and a size of 256x256 is concatenated with a
図12では、サイズを統一してから特徴マップを結合したが、チャネル数が同一でサイズが異なる特徴マップを結合することも可能である。たとえば、チャネル数が64、サイズが64×64の特徴マップAと、チャネル数が64、サイズが128×64の特徴マップBを結合すると、チャネル数が64、サイズが192×64の連結した特徴マップが生成される。一般に特徴マップのサイズがm×nであり、2つの特徴マップの間でmまたはnのいずれか一方のみが同じ場合、2つの特徴マップを結合することができる。特徴マップAのサイズがm×n1であり、特徴マップBのサイズがm×n2である場合、行を揃えて、特徴マップAの各要素の左に特徴マップBの各要素を並べることにより、サイズがm×(n1+n2)の連結した特徴マップを生成することができる。特徴マップAのサイズがm1×nであり、特徴マップBのサイズがm2×nである場合、列を揃えて、特徴マップAの各要素の下に特徴マップBの各要素を並べることにより、サイズが(m1+m2)×nの連結した特徴マップを生成することができる。 In FIG. 12, the feature maps are combined after unifying the sizes, but it is also possible to combine feature maps with the same number of channels but different sizes. For example, when a feature map A with 64 channels and a size of 64×64 is combined with a feature map B with 64 channels and a size of 128×64, a concatenated feature map with 64 channels and a size of 192×64 is generated. In general, when the size of the feature map is m×n and only one of m or n is the same between the two feature maps, the two feature maps can be combined. When the size of the feature map A is m× n1 and the size of the feature map B is m× n2 , the rows are aligned and each element of the feature map B is arranged to the left of each element of the feature map A, thereby generating a concatenated feature map with a size of m×(n 1 +n 2 ). If feature map A has size m1 x n and feature map B has size m2 x n, then a concatenated feature map of size ( m1 + m2 ) x n can be generated by aligning the columns and arranging each element of feature map B below each element of feature map A.
このようにして連結した入力タスクの特徴マップとあらかじめ登録されている各タスクの代表特徴マップとの類似度を算出する場合、チャネル数とサイズが異なる場合がある。この場合、図10および図11の連結方法で示した2つの方法を用いて、チャネル数とサイズの両方を揃える必要がある。 When calculating the similarity between the feature map of the input task concatenated in this way and the representative feature maps of each task registered in advance, the number of channels and size may differ. In this case, it is necessary to align both the number of channels and size using the two concatenation methods shown in Figures 10 and 11.
以上説明した機械学習装置100の各種の処理は、CPUやメモリ等のハードウェアを用いた装置として実現することができるのは勿論のこと、ROM(リード・オンリ・メモリ)やフラッシュメモリ等に記憶されているファームウェアや、コンピュータ等のソフトウェアによっても実現することができる。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータ等で読み取り可能な記録媒体に記録して提供することも、有線あるいは無線のネットワークを通してサーバと送受信することも、地上波あるいは衛星ディジタル放送のデータ放送として送受信することも可能である。
The various processes of the
以上述べたように、本実施の形態の機械学習装置100によれば、入力タスクに対して特徴マップにもとづいて自動的にラベル付けをすることができる。また、入力タスクの学習頻度または類似度にもとづいて入力タスクを継続学習に用いるかどうかを決定することにより、学習の偏りを抑制し、致命的忘却の発生リスクを低減することができる。
As described above, according to the
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。 The present invention has been described above based on an embodiment. The embodiment is merely an example, and it will be understood by those skilled in the art that various modifications are possible in the combination of each component and each processing process, and that such modifications are also within the scope of the present invention.
10 入力部、 20 スクリーニング処理部、 30 タスク保存部、 32 更新判定部、 40 継続学習部、 50 タスクデータベース、 52 代表特徴マップ、 54 頻度、 60 推論部、 70 出力部、 80 スクリーニング部、 82 代表特徴マップ取得部、 84 特徴マップ変換部、 86 分類部、 90 学習制御部、 92 頻度情報取得部、 94 類似度情報取得部、 96 学習頻度制御部、 100 機械学習装置。 10 Input unit, 20 Screening processing unit, 30 Task storage unit, 32 Update determination unit, 40 Continuous learning unit, 50 Task database, 52 Representative feature map, 54 Frequency, 60 Inference unit, 70 Output unit, 80 Screening unit, 82 Representative feature map acquisition unit, 84 Feature map conversion unit, 86 Classification unit, 90 Learning control unit, 92 Frequency information acquisition unit, 94 Similarity information acquisition unit, 96 Learning frequency control unit, 100 Machine learning device.
Claims (4)
前記入力タスクを継続学習に用いるかどうかを決定する制御部と、
前記入力タスクを継続学習に用いる場合、ラベルが付与された前記入力タスクを教師データとして継続学習する継続学習部とを含み、
前記制御部は、前記入力タスクの特徴マップとの類似度が最も高い代表特徴マップをもつタスクが学習に用いられた頻度にもとづいて前記入力タスクを継続学習に用いるかどうかを決定することを特徴とする機械学習装置。 a classification unit that calculates a similarity between a feature map of an input task and a representative feature map of each task registered in advance, and assigns a label of a task having the highest similarity to the input task;
a control unit that determines whether the input task is to be used for continuous learning;
a continuous learning unit that performs continuous learning using the labeled input task as training data when the input task is used for continuous learning,
The control unit determines whether to use the input task for further learning based on the frequency with which a task having a representative feature map that has the highest similarity to the feature map of the input task has been used for learning .
前記入力タスクを継続学習に用いるかどうかを決定する制御ステップと、
前記入力タスクを継続学習に用いる場合、ラベルが付与された前記入力タスクを教師データとして継続学習する継続学習ステップとを含み、
前記制御ステップは、前記入力タスクの特徴マップとの類似度が最も高い代表特徴マップをもつタスクが学習に用いられた頻度にもとづいて前記入力タスクを継続学習に用いるかどうかを決定することを特徴とするコンピュータが実行する機械学習方法。 a classification step of calculating a similarity between a feature map of an input task and a representative feature map of each task registered in advance, and assigning a label of a task having the highest similarity to the input task;
a control step of determining whether the input task is to be used for further learning;
and a continuous learning step of performing continuous learning using the labeled input task as training data when the input task is used for continuous learning,
A machine learning method executed by a computer, characterized in that the control step determines whether to use the input task for further learning based on the frequency with which a task having a representative feature map that is most similar to the feature map of the input task has been used for learning .
前記入力タスクを継続学習に用いるかどうかを決定する制御ステップと、
前記入力タスクを継続学習に用いる場合、ラベルが付与された前記入力タスクを教師データとして継続学習する継続学習ステップとをコンピュータに実行させ、
前記制御ステップは、前記入力タスクの特徴マップとの類似度が最も高い代表特徴マップをもつタスクが学習に用いられた頻度にもとづいて前記入力タスクを継続学習に用いるかどうかを決定することを特徴とする機械学習プログラム。 a classification step of calculating a similarity between a feature map of an input task and a representative feature map of each task registered in advance, and assigning a label of a task having the highest similarity to the input task;
a control step of determining whether the input task is to be used for further learning;
a continuous learning step of performing continuous learning using the labeled input task as training data when the input task is used for continuous learning ;
A machine learning program characterized in that the control step determines whether to use the input task for continued learning based on the frequency with which a task having a representative feature map that has the highest similarity to the feature map of the input task has been used for learning .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021010177A JP7618917B2 (en) | 2021-01-26 | 2021-01-26 | Machine learning device, machine learning method, and machine learning program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021010177A JP7618917B2 (en) | 2021-01-26 | 2021-01-26 | Machine learning device, machine learning method, and machine learning program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022114065A JP2022114065A (en) | 2022-08-05 |
| JP7618917B2 true JP7618917B2 (en) | 2025-01-22 |
Family
ID=82658424
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021010177A Active JP7618917B2 (en) | 2021-01-26 | 2021-01-26 | Machine learning device, machine learning method, and machine learning program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7618917B2 (en) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011520183A (en) | 2008-04-25 | 2011-07-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Classification of sample data |
| JP2017224184A (en) | 2016-06-16 | 2017-12-21 | 株式会社日立製作所 | Machine learning device |
| WO2019138655A1 (en) | 2018-01-09 | 2019-07-18 | 日本電信電話株式会社 | Model learning device, model learning method, and program |
-
2021
- 2021-01-26 JP JP2021010177A patent/JP7618917B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011520183A (en) | 2008-04-25 | 2011-07-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Classification of sample data |
| JP2017224184A (en) | 2016-06-16 | 2017-12-21 | 株式会社日立製作所 | Machine learning device |
| WO2019138655A1 (en) | 2018-01-09 | 2019-07-18 | 日本電信電話株式会社 | Model learning device, model learning method, and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022114065A (en) | 2022-08-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11620529B2 (en) | Method of continual-learning of data sets and apparatus thereof | |
| US20200279156A1 (en) | Feature fusion for multi-modal machine learning analysis | |
| US20230214724A1 (en) | Removing Undesirable Inferences from a Machine Learning Model | |
| JP6946255B2 (en) | Learning device, estimation device, learning method and program | |
| CN114357221A (en) | Self-supervision active learning method based on image classification | |
| KR102659399B1 (en) | Device and Method for Zero Shot Semantic Segmentation | |
| US20180082179A1 (en) | Systems and methods for deep learning with small training sets | |
| CN115115829B (en) | Medical image segmentation method, device, apparatus, storage medium, and program product | |
| CN114627397A (en) | Behavior recognition model construction method and behavior recognition method | |
| CN117218347B (en) | A Consistent Semantic Segmentation Method and System for Finite Data Based on Decoupled Knowledge Distillation | |
| JPWO2018207334A1 (en) | Image recognition apparatus, image recognition method, and image recognition program | |
| CN114463540A (en) | Segmenting images using neural networks | |
| CN112215298A (en) | Model training method, apparatus, device and readable storage medium | |
| US20200334529A1 (en) | Learning device, learning method, computer program product, and recognition device | |
| US11113606B2 (en) | Learning method, learning device, program, and recording medium | |
| US11526757B2 (en) | Systems and methods for deep learning with small training sets | |
| CN120806158A (en) | Traffic large model construction and decision-making method and device based on multi-mode bidirectional map reasoning | |
| EP4073713A1 (en) | Hyper-opinion classification using a neural network | |
| KR102574457B1 (en) | Device and method for electronic document management based on artificial intelligence | |
| JP7618917B2 (en) | Machine learning device, machine learning method, and machine learning program | |
| CN112733849A (en) | Model training method, image rotation angle correction method and device | |
| US20200226432A1 (en) | Method for classifying a capture taken by a sensor | |
| CN113449860B (en) | Method for configuring a neural network model | |
| JP2021081930A (en) | Learning device, information classification device, and program | |
| US20250157091A1 (en) | Method and device for post-training a machine learning system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231228 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240918 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240924 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241120 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241203 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241216 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7618917 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |