JP7540595B2 - Model learning device, model learning method, and program - Google Patents
Model learning device, model learning method, and program Download PDFInfo
- Publication number
- JP7540595B2 JP7540595B2 JP2023526801A JP2023526801A JP7540595B2 JP 7540595 B2 JP7540595 B2 JP 7540595B2 JP 2023526801 A JP2023526801 A JP 2023526801A JP 2023526801 A JP2023526801 A JP 2023526801A JP 7540595 B2 JP7540595 B2 JP 7540595B2
- Authority
- JP
- Japan
- Prior art keywords
- loss
- data
- risk
- model
- labels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、機械学習技術に関する。 The present invention relates to machine learning technology.
近年、音響イベント検知、画像セグメンテーション、画像認識などの分野において、機械学習が用いられている。機械学習の一般的な手順について、以下説明する。 In recent years, machine learning has been used in fields such as acoustic event detection, image segmentation, and image recognition. The general steps of machine learning are described below.
(1)1つのデータに対してそのデータが属するクラスを示すラベル(正解ラベルという)を1つ付与し、正解ラベルが付与されたデータを生成する。この作業を多くのデータに対して行うことにより、正解ラベルが付与されたデータの集合を生成する。 (1) A label (called a correct label) is assigned to each piece of data, indicating the class to which the data belongs, and data with the correct label is generated. By performing this process on many pieces of data, a set of data with correct labels is generated.
(2)正解ラベルが付与されたデータの集合を用いてモデルを学習する。 (2) Train the model using a set of data with correct labels.
(3)学習済モデルを用いて、入力されたデータが属するクラス(正解クラスという)を推定する。 (3) Using the trained model, the class to which the input data belongs (called the correct class) is estimated.
上記手順に従い生成した学習済モデルを用いた正解クラスの推定において、推定精度を高めようとする場合、より多くの正解ラベルが付与されたデータが必要になる。また、推定対象となる、データが属するクラスの数を増やそうとする場合も、より多くの正解ラベルが付与されたデータが必要になる。しかし、正解ラベルを付与する作業は非常に手間がかかるものであり、正解ラベルが付与されたデータを大量に生成するのは困難である。 When trying to improve the accuracy of correct class estimation using a trained model generated according to the above procedure, data with more correct labels is required. Also, when trying to increase the number of classes to which the data to be estimated belongs, data with more correct labels is required. However, the task of assigning correct labels is very time-consuming, and it is difficult to generate large amounts of data with correct labels.
そこで、非特許文献1では、以下の手順の機械学習を提案している。Therefore, non-patent document 1 proposes the following machine learning procedure.
(1)1つのデータに対してそのデータが属さないクラスを示すラベル(補ラベルという)を1つ付与し、間違ったラベルである補ラベルが付与されたデータを生成する。この作業を多くのデータに対して行うことにより、補ラベルが付与されたデータの集合を生成する。 (1) A label (called a complementary label) is assigned to each piece of data, indicating a class to which the data does not belong, and data is generated that has been assigned the incorrect complementary label. By performing this process on many pieces of data, a set of data that has been assigned complementary labels is generated.
(2)補ラベルが付与されたデータの集合を用いてモデルを学習する。 (2) Train the model using a set of data with complementary labels.
(3)学習済モデルを用いて、入力されたデータが属するクラス(正解クラスという)を推定する。 (3) Using the trained model, the class to which the input data belongs (called the correct class) is estimated.
あるデータに正解ラベルを付与するよりも補ラベルを付与する方が手間がかからないため、より多くのラベルが付与されたデータを生成することができる。また、非特許文献1の手順に従い生成した学習済モデルを用いた正解クラスの推定における推定精度は、一般的な手順に従い生成した学習済モデルを用いた正解クラスの推定における推定精度と同程度である。 Since it is less time-consuming to assign complementary labels to data than to assign correct labels to data, it is possible to generate data with more labels. In addition, the estimation accuracy of the correct class using a trained model generated according to the procedure in Non-Patent Document 1 is comparable to the estimation accuracy of the correct class using a trained model generated according to a general procedure.
非特許文献1の技術では、1つのデータに対してそのデータが属するクラスが1つである問題(以下、多クラス分類問題という)を対象としており、1つのデータに対してそのデータが属するクラスが1つとは限らない(つまり、2つ以上ある場合もある)問題(以下、マルチラベル分類問題という)を扱うことができない。The technology in Non-Patent Document 1 targets problems where a single piece of data belongs to only one class (hereafter referred to as a multi-class classification problem), and cannot handle problems where a single piece of data belongs to more than one class (i.e., there may be two or more classes) (hereafter referred to as a multi-label classification problem).
そこで本発明では、マルチラベル分類問題を対象とする、補ラベルを用いたモデル学習技術を提供することを目的とする。 Therefore, the present invention aims to provide a model learning technology using complementary labels for multi-label classification problems.
本発明の一態様は、1個以上の補ラベルが付与されたデータの集合から、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する学習データ生成部と、前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する第1リスク計算部と、
本発明の一態様は、1個以上の補ラベルが付与されたデータの集合から、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する学習データ生成部と、前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する第1リスク計算部と、
本発明によれば、マルチラベル分類問題を対象とする、補ラベルを用いたモデル学習が可能となる。 According to the present invention, it becomes possible to learn a model using complementary labels for multi-label classification problems.
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。Hereinafter, an embodiment of the present invention will be described in detail. Components having the same functions are given the same numbers, and duplicate explanations will be omitted.
各実施形態の説明に先立って、この明細書における表記方法について説明する。Before describing each embodiment, we will explain the notation used in this specification.
^(キャレット)は上付き添字を表す。例えば、xy^zはyzがxに対する上付き添字であり、xy^zはyzがxに対する下付き添字であることを表す。また、_(アンダースコア)は下付き添字を表す。例えば、xy_zはyzがxに対する上付き添字であり、xy_zはyzがxに対する下付き添字であることを表す。 ^ (caret) represents a superscript. For example, x y^z means that y z is a superscript to x, and x y^z means that y z is a subscript to x. _ (underscore) represents a subscript. For example, x y_z means that y z is a superscript to x, and x y_z means that y z is a subscript to x.
また、ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。 In addition, superscripts such as "^" and "~" for a certain letter x, such as ^x and ~x, should actually be written directly above the "x", but due to the constraints of the description in the specification, they are written as ^x and ~x.
<技術的背景>
本発明の実施形態では、1個以上の補ラベルが付与されたデータを用いてマルチラベル分類問題に対するモデルを学習する。なお、本発明の実施形態を用いて、1個以上の補ラベルが付与されたデータを用いて多クラス分類問題に対するモデルを学習することもできる。
<Technical Background>
In an embodiment of the present invention, a model for a multi-label classification problem is trained using data with one or more supplementary labels. Note that the embodiment of the present invention can also be used to train a model for a multi-class classification problem using data with one or more supplementary labels.
以下、データが属する可能性があるクラス、つまり、データを分類するクラスの数をK、正解ラベルの集合[K]={1, …, K}とする。ここで、正解ラベルとは、クラス1に属すことを示すラベル、…、クラスKに属すことを示すラベルのことであり、それぞれ、1, …, Kで表す。 In the following, the number of classes to which data may belong, i.e., the number of classes into which data is classified, is defined as K, and the set of correct labels is [K] = {1, ..., K}. Here, correct labels are labels indicating that data belongs to class 1, ..., and labels indicating that data belongs to class K, and are represented as 1, ..., K, respectively.
K個の補ラベルを考える。ここで、K個の補ラベルとは、クラス1に属さないことを示すラベル、…、クラスKに属さないことを示すラベルのことであり、それぞれ、-1, …, -Kで表すこととする。また、補ラベルの集合[-K]={-1, …, -K}で表すこととする。 Consider K complementary labels. Here, the K complementary labels are labels indicating that the class does not belong to class 1, ..., and labels indicating that the class does not belong to class K, and are represented as -1 , ..., -K , respectively. The set of complementary labels is represented as [ -K ]={ - 1, ..., -K }.
そして、1以上の補ラベルが付与されたデータについて、本発明の実施形態では、次のように取り扱うこととする。M個の補ラベルが付与されたデータに対して、Mが2以上である場合、当該データから1個の補ラベルが付与されたデータM個生成する。このことを以下で説明する記号を用いて説明すると、“M個の補ラベルが付与されたデータ(xi, (-y1, …, -yM))(ただし、xi∈χ, -y1, …, -yM∈[-K])から、1個の補ラベルが付与されたデータ(xi, -y1), …, (xi, -yM)を生成する”となる。 In the embodiment of the present invention, data to which one or more complementary labels are assigned is handled as follows. For data to which M complementary labels are assigned, where M is 2 or more, M pieces of data to which one complementary label is assigned are generated from the data. This can be explained using the symbols described below as "data (x i , ( -y 1 , ..., -y M )) to which M complementary labels are assigned (where x i ∈χ, -y 1 , ..., -y M ∈[ -K ]) are generated as data (x i , -y 1 ), ..., (x i , -y M ) to which one complementary label is assigned."
以下、正解ラベル学習、補ラベル学習について詳しく説明する。ここで、正解ラベル学習とは、1個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習することをいい、補ラベル学習とは、1個以上の補ラベルが付与されたデータの集合を用いてモデルを学習することをいう。Below, we will explain correct label learning and supplementary label learning in detail. Correct label learning here means learning a model using a set of data to which one or more correct labels have been assigned, and supplementary label learning means learning a model using a set of data to which one or more supplementary labels have been assigned.
[正解ラベル学習]
χをデータの集合、g:χ→RKを決定関数とする。また、gkを決定関数gの第k要素とする。Dをχ×[K]上の分布(ただし、分布Dの確率変数を(X, Y)~Dと表す)、{Pk}k=1
K(ただし、Pk=P(X|Y=k))、{πk}k=1
K(ただし、πk=P(Y=k))、loss:[K]×RK→R+を正解ラベル学習の損失関数とすると、損失関数loss, 分布Dに関する決定関数gのリスクR(g:loss)は、次式で表される。
Let χ be the set of data, g:χ→R K be the decision function, and g k be the k-th element of the decision function g. Let D be the distribution on χ×[K] (where the random variables of distribution D are represented as (X, Y) to D), {P k } k=1 K (where P k =P(X|Y=k)), {π k } k=1 K (where π k =P(Y=k)), and loss:[K]×R K →R + be the loss function for learning correct labels. The loss function loss, the risk R(g:loss) of the decision function g on distribution D, is expressed by the following equation.
(バイナリクロスエントロピー)
[補ラベル学習]
-Dをχ×[-K]上の分布(ただし、分布-Dの確率変数を(X, -Y)~-Dと表す)、{-Pk}k=1
K(ただし、-Pk=P(X|-Y=k))、{-πk}k=1
K(ただし、-πk=P(-Y=k))、-loss:[-K]×RK→R+を補ラベル学習の損失関数とすると、損失関数-loss, 分布-Dに関する決定関数gのリスク-R(g:-loss)は、次式で表される。
Let -D be a distribution on χ×[ -K ] (where the random variable in distribution -D is represented as (X, -Y )~ -D ), { -Pk } k=1K ( where -Pk = P(X| -Y = k )), { -πk } k =1K ( where -πk =P( -Y =k)), and -loss:[ - K]× RK →R + be the loss function for complementary label learning. Then, the loss function -loss , the risk -R (g: -loss ) of the decision function g on distribution -D is expressed by the following equation.
<第1実施形態>
以下、図1~図2を参照してモデル学習装置100について説明する。図1は、モデル学習装置100の構成を示すブロック図である。図2は、モデル学習装置100の動作を示すフローチャートである。図1に示すようにモデル学習装置100は、学習データ生成部110と、第1リスク計算部120と、モデル更新部130と、終了条件判定部140と、記録部190を含む。記録部190は、モデル学習装置100の処理に必要な情報を適宜記録する構成部である。
First Embodiment
Below, the model learning device 100 will be described with reference to Figures 1 and 2. Figure 1 is a block diagram showing the configuration of the model learning device 100. Figure 2 is a flowchart showing the operation of the model learning device 100. As shown in Figure 1, the model learning device 100 includes a learning
図2に従いモデル学習装置100の動作について説明する。The operation of the model learning device 100 will be explained with reference to Figure 2.
S110において、学習データ生成部110は、1個以上の補ラベルが付与されたデータの集合(以下、入力補ラベル付きデータ集合という)から、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する。At S110, the training
S120において、第1リスク計算部120は、S110で生成した学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する。
S130において、モデル更新部130は、S120で計算したリスク-R(g:-loss)を用いて、モデルを更新する。具体的には、モデル更新部130は、リスク-R(g:-loss)を最小化するように、モデルを更新する。音響イベント検知に用いるモデルを学習する場合、モデルは、参考非特許文献1に記載の自己注意機構を備えたDNNモデルとすることができる。また、画像セグメンテーションに用いるモデルを学習する場合、モデルは、参考非特許文献2に記載のクラスアクティベーションマップを備えたDNNモデルとすることができる。
In S120, the first
In S130, the
(参考非特許文献1:Q. Kong et al., “Sound Event Detection of Weakly Labelled Data with CNN-Transformer and Automatic Threshold Optimization,” IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol.28, pp.2450-2460, 2020.)
(参考非特許文献2:Y. Wang et al., “Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation,” CVPR 2020, pp.12275-12284, 2020.)
S140において、終了条件判定部140は、所定の終了条件が満たされる場合には、S130の処理で得られたモデルを学習済みモデルとして処理を終了し、それ以外の場合には、S120の処理に戻る。終了条件には、例えば、モデル更新回数の上限に達したか否かという条件を用いることができる。
(Reference Non-Patent Document 1: Q. Kong et al., “Sound Event Detection of Weakly Labeled Data with CNN-Transformer and Automatic Threshold Optimization,” IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol.28, pp .2450-2460, 2020.)
(Reference Non-Patent Document 2: Y. Wang et al., “Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation,”
In S140, if a predetermined termination condition is satisfied, the termination
(変形例)
上記S110~S140の処理は、以下のようにしてもよい。
(Modification)
The above-mentioned processes in steps S110 to S140 may be carried out as follows.
S110において、学習データ生成部110は、1個以上の補ラベルが付与されたデータの集合(以下、入力補ラベル付きデータ集合という)から、入力補ラベル付きデータ集合の部分集合であるバッチを生成し、当該バッチから、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する。In S110, the training
S120において、第1リスク計算部120は、S110で生成した学習データ集合を用いて、式(1)で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する。
In S120, the first
S130において、モデル更新部130は、S120で計算したリスク-R(g:-loss)を用いて、モデルを更新する。
In S130, the
S140において、終了条件判定部140は、所定の終了条件が満たされる場合には、S130の処理で得られたモデルを学習済みモデルとして処理を終了し、それ以外の場合には、S110の処理に戻る。In S140, if a specified termination condition is satisfied, the termination
本発明の実施形態によれば、マルチラベル分類問題を対象とする、補ラベルを用いたモデル学習が可能となる。補ラベルを付与したデータを用いることにより、より多くのデータを用いた学習が可能となり、学習済みモデルを用いた推定の精度を向上させることやより多くのクラスを対象とする推定が可能となる。 According to an embodiment of the present invention, it is possible to learn a model using a complementary label for a multi-label classification problem. By using data with a complementary label, it is possible to learn using a larger amount of data, thereby improving the accuracy of estimation using a trained model and enabling estimation for a larger number of classes.
<第2実施形態>
以下、図3~図4を参照してモデル学習装置200について説明する。図3は、モデル学習装置200の構成を示すブロック図である。図4は、モデル学習装置200の動作を示すフローチャートである。図3に示すようにモデル学習装置200は、学習データ生成部110と、第1リスク計算部120と、第2リスク計算部220と、第3リスク計算部230と、モデル更新部240と、終了条件判定部140と、記録部190を含む。記録部190は、モデル学習装置200の処理に必要な情報を適宜記録する構成部である。
Second Embodiment
Hereinafter, model learning device 200 will be described with reference to Figs. 3 and 4. Fig. 3 is a block diagram showing the configuration of model learning device 200. Fig. 4 is a flowchart showing the operation of model learning device 200. As shown in Fig. 3, model learning device 200 includes a learning
図4に従いモデル学習装置200の動作について説明する。The operation of the model learning device 200 will be explained with reference to Figure 4.
S110において、学習データ生成部110は、1個以上の補ラベルが付与されたデータの集合(以下、入力補ラベル付きデータ集合という)から、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する。At S110, the training
S120において、第1リスク計算部120は、S110で生成した学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する。
S220において、第2リスク計算部220は、1個以上の正解ラベルが付与されたデータの集合(以下、入力正解ラベル付きデータ集合という)の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する。
In S120, the first
In S220, the second
S230において、第3リスク計算部230は、S120で計算したリスク-R(g:-loss)とS130で計算したリスクR(g:loss)から、R(g)=α-R(g:-loss)+(1-α)(g:loss)(ただし、αは0<α<1を満たす定数)により、リスクR(g)を計算する。
In S230, the third
S240において、モデル更新部240は、S230で計算したリスクR(g)を用いて、モデルを更新する。具体的には、モデル更新部240は、リスクR(g)を最小化するように、モデルを更新する。また、第1実施形態と同様、音響イベント検知に用いるモデルを学習する場合は参考非特許文献1に記載のモデル、画像セグメンテーションに用いるモデルを学習する場合は参考非特許文献2に記載のモデルとすることができる。In S240, the
S140において、終了条件判定部140は、所定の終了条件が満たされる場合には、S240の処理で得られたモデルを学習済みモデルとして処理を終了し、それ以外の場合には、S120の処理、S220の処理に戻る。In S140, if a specified termination condition is satisfied, the termination
(変形例)
上記S110~S140の処理は、以下のようにしてもよい。
(Modification)
The above-mentioned processes in steps S110 to S140 may be carried out as follows.
S110において、学習データ生成部110は、1個以上の補ラベルが付与されたデータの集合(以下、入力補ラベル付きデータ集合という)から、入力補ラベル付きデータ集合の部分集合であるバッチを生成し、当該バッチから、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する。In S110, the training
S120において、第1リスク計算部120は、S110で生成した学習データ集合を用いて、式(2)で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する。
In S120, the first
S220において、第2リスク計算部220は、1個以上の正解ラベルが付与されたデータの集合(以下、入力正解ラベル付きデータ集合という)の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する。In S220, the second
S230において、第3リスク計算部230は、S120で計算したリスク-R(g:-loss)とS130で計算したリスクR(g:loss)から、R(g)=α-R(g:-loss)+(1-α)(g:loss)(ただし、αは0<α<1を満たす定数)により、リスクR(g)を計算する。
In S230, the third
S240において、モデル更新部240は、S230で計算したリスクR(g)を用いて、モデルを更新する。In S240, the
S140において、終了条件判定部140は、所定の終了条件が満たされる場合には、S240の処理で得られたモデルを学習済みモデルとして処理を終了し、それ以外の場合には、S110の処理、S220の処理に戻る。In S140, if a specified termination condition is satisfied, the termination
本発明の実施形態によれば、マルチラベル分類問題を対象とする、補ラベルを用いたモデル学習が可能となる。補ラベルを付与したデータを用いることにより、より多くのデータを用いた学習が可能となり、学習済みモデルを用いた推定の精度を向上させることやより多くのクラスを対象とする推定が可能となる。 According to an embodiment of the present invention, it is possible to learn a model using a complementary label for a multi-label classification problem. By using data with a complementary label, it is possible to learn using a larger amount of data, thereby improving the accuracy of estimation using a trained model and enabling estimation for a larger number of classes.
<補記>
図5は、上述の各装置(つまり、各ノード)を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部2020に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部2010、入力部2030、出力部2040などに動作させることで実施できる。
<Additional Notes>
5 is a diagram showing an example of the functional configuration of a computer that realizes each of the above-mentioned devices (i.e., each node). The processing in each of the above-mentioned devices can be implemented by having the
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。 The device of the present invention, for example as a single hardware entity, has an input section to which a keyboard or the like can be connected, an output section to which an LCD display or the like can be connected, a communication section to which a communication device (for example a communication cable) capable of communicating with the outside of the hardware entity can be connected, a CPU (which may also have a central processing unit, cache memory, registers, etc.), memories such as RAM and ROM, an external storage device such as a hard disk, and buses connecting these input section, output section, communication section, CPU, RAM, ROM, and external storage device so that data can be exchanged between them. If necessary, the hardware entity may also be provided with a device (drive) capable of reading and writing recording media such as a CD-ROM. An example of a physical entity equipped with such hardware resources is a general-purpose computer.
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。The external storage device of the hardware entity stores the programs required to realize the above-mentioned functions and the data required in processing these programs (not limited to an external storage device, but for example the programs may be stored in a ROM, which is a read-only storage device). Data obtained by processing these programs is stored appropriately in RAM, an external storage device, etc.
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成部)を実現する。In a hardware entity, each program stored in an external storage device (or ROM, etc.) and the data required to process each program are loaded into memory as needed, and interpreted, executed, and processed by the CPU as appropriate. As a result, the CPU realizes a specified function (each component represented as the above, ... unit, ... means, etc.).
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。The present invention is not limited to the above-described embodiments, and appropriate modifications can be made without departing from the spirit of the present invention. Furthermore, the processes described in the above embodiments are not limited to being executed chronologically in the order described, but may be executed in parallel or individually depending on the processing capacity of the device executing the processes or as necessary.
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。As mentioned above, when the processing functions of the hardware entities (the devices of the present invention) described in the above embodiments are realized by a computer, the processing contents of the functions that the hardware entities should have are described by a program. Then, by executing this program on a computer, the processing functions of the hardware entities are realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。 The program describing the processing contents can be recorded on a computer-readable recording medium. Examples of computer-readable recording media include magnetic recording devices, optical disks, magneto-optical recording media, and semiconductor memories. Specifically, for example, a hard disk drive, a flexible disk, a magnetic tape, etc. can be used as a magnetic recording device; a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only Memory), a CD-R (Recordable)/RW (ReWritable), etc. can be used as an optical disk; an MO (Magneto-Optical disc) can be used as a magneto-optical recording medium; and an EEP-ROM (Electronically Erasable and Programmable-Read Only Memory) can be used as a semiconductor memory.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program may be distributed, for example, by selling, transferring, lending, etc. portable recording media such as DVDs and CD-ROMs on which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of a server computer and transferring the program from the server computer to other computers via a network.
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。A computer that executes such a program, for example, first stores in its own storage device the program recorded on a portable recording medium or the program transferred from a server computer. Then, when executing a process, the computer reads the program stored in its own storage device and executes the process according to the read program. As another execution form of this program, the computer may read the program directly from the portable recording medium and execute the process according to the program, or may execute the process according to the received program each time a program is transferred from the server computer to this computer. In addition, the server computer may not transfer the program to this computer, but may execute the above-mentioned process by a so-called ASP (Application Service Provider) type service that realizes the processing function only by issuing an execution instruction and obtaining the results. Note that the program in this embodiment includes information used for processing by an electronic computer that is equivalent to a program (such as data that is not a direct command to the computer but has properties that specify the processing of the computer).
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In addition, in this embodiment, a hardware entity is configured by executing a specific program on a computer, but at least a portion of these processing contents may also be realized by hardware.
上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。The foregoing description of the embodiments of the invention has been presented for purposes of illustration and description. It is not intended to be exhaustive or to limit the invention to the precise form disclosed. Modifications and variations are possible in light of the above teachings. The embodiments have been chosen and depicted to provide a best illustration of the principles of the invention and to enable those skilled in the art to utilize the invention in various embodiments and with various modifications as may be suitable for the practical use contemplated. All such modifications and variations are within the scope of the invention as defined by the appended claims interpreted in accordance with the breadth to which they are fairly, legally and equitably entitled.
Claims (4)
前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する第1リスク計算部と、
(ただし、Kはデータを分類するクラスの数、lossは1個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数)
1個以上の正解ラベルが付与されたデータの集合の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する第2リスク計算部と、
リスク-R(g:-loss)とリスクR(g:loss)から、R(g)=α-R(g:-loss)+(1-α)R(g:loss)(ただし、αは0<α<1を満たす定数)により、リスクR(g)を計算する第3リスク計算部と、
リスクR(g)を用いて、モデルを更新するモデル更新部と、
を含むモデル学習装置。 a training data generation unit that generates a set of data to which one complementary label is assigned (hereinafter referred to as a training data set) from a set of data to which one or more complementary labels are assigned;
A first risk calculation unit that calculates a risk - R(g: -loss ) of a decision function g regarding a loss function - loss calculated by the following formula using a batch that is a subset of the learning data set;
(where K is the number of classes into which data is classified, and loss is the loss function used when training a model using a set of data with one or more correct labels.)
A second risk calculation unit that calculates a risk R(g:loss) of a decision function g related to a loss function loss using a batch that is a subset of a set of data to which one or more correct answer labels are assigned;
a third risk calculation unit that calculates risk R(g) from risk - R(g: - loss) and risk R(g:loss) by R(g)=α - R(g: - loss)+(1-α) R (g:loss) (where α is a constant satisfying 0<α<1);
a model updating unit that updates the model using the risk R(g);
A model learning device comprising:
前記モデル学習装置が、前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する第1リスク計算ステップと、
(ただし、Kはデータを分類するクラスの数、lossは1個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数)
前記モデル学習装置が、1個以上の正解ラベルが付与されたデータの集合の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する第2リスク計算ステップと、
前記モデル学習装置が、リスク-R(g:-loss)とリスクR(g:loss)から、R(g)=α-R(g:-loss)+(1-α)R(g:loss)(ただし、αは0<α<1を満たす定数)により、リスクR(g)を計算する第3リスク計算ステップと、
前記モデル学習装置が、リスクR(g)を用いて、モデルを更新するモデル更新ステップと、
を含むモデル学習方法。 a learning data generating step in which the model learning device generates a set of data to which one supplementary label is assigned (hereinafter referred to as a learning data set) from a set of data to which one or more supplementary labels are assigned;
A first risk calculation step in which the model learning device calculates a risk - R(g: -loss ) of a decision function g regarding a loss function - loss calculated by the following formula, using a batch that is a subset of the learning data set;
(where K is the number of classes into which data is classified, and loss is the loss function used when training a model using a set of data with one or more correct labels.)
A second risk calculation step in which the model learning device calculates a risk R(g:loss) of a decision function g related to a loss function loss using a batch that is a subset of a set of data to which one or more correct answer labels are assigned;
a third risk calculation step in which the model learning device calculates a risk R(g) from risk -R (g: -loss ) and risk R(g:loss) by R(g)=α - R(g: -loss )+(1-α) R (g:loss) (where α is a constant satisfying 0<α<1);
a model updating step in which the model learning device updates the model using the risk R(g);
A model training method including:
損失関数lossは、バイナリクロスエントロピーまたはマルチラベルソフトマージンである
ことを特徴とするモデル学習方法。 The model learning method according to claim 2 ,
A model training method characterized in that the loss function is binary cross entropy or multi-label soft margin.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2021/022291 WO2022259517A1 (en) | 2021-06-11 | 2021-06-11 | Model learning device, model learning method, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2022259517A1 JPWO2022259517A1 (en) | 2022-12-15 |
| JP7540595B2 true JP7540595B2 (en) | 2024-08-27 |
Family
ID=84424627
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023526801A Active JP7540595B2 (en) | 2021-06-11 | 2021-06-11 | Model learning device, model learning method, and program |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7540595B2 (en) |
| WO (1) | WO2022259517A1 (en) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004030202A (en) | 2002-06-25 | 2004-01-29 | Fujitsu Ltd | Feature word extraction system |
| CN111540468A (en) | 2020-04-21 | 2020-08-14 | 重庆大学 | ICD automatic coding method and system for visualization of diagnosis reason |
-
2021
- 2021-06-11 JP JP2023526801A patent/JP7540595B2/en active Active
- 2021-06-11 WO PCT/JP2021/022291 patent/WO2022259517A1/en not_active Ceased
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004030202A (en) | 2002-06-25 | 2004-01-29 | Fujitsu Ltd | Feature word extraction system |
| CN111540468A (en) | 2020-04-21 | 2020-08-14 | 重庆大学 | ICD automatic coding method and system for visualization of diagnosis reason |
Non-Patent Citations (2)
| Title |
|---|
| CAO, Yuzhou et al.,"Multi-Complementary and Unlabeled Learning for Arbitrary Losses and Models",arXiv [online],2020年,p. 1-22,[2024年06月13日検索],インターネット<URL:https://arxiv.org/abs/2001.04243v3>,2001.04243v3 |
| ISHIDA, Takashi et al.,"Learning from Complementary Labels",arXiv [online],2017年,[2024年06月13日検索],インターネット<URL:https://arxiv.org/abs/1705.07541v2>,1705.07541v2 |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2022259517A1 (en) | 2022-12-15 |
| JPWO2022259517A1 (en) | 2022-12-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12067571B2 (en) | Systems and methods for generating models for classifying imbalanced data | |
| JP6212216B2 (en) | Weight generation in machine learning | |
| CN110278175A (en) | Graph structure model training, the recognition methods of rubbish account, device and equipment | |
| US20220012625A1 (en) | Unsupervised anomaly detection via supervised methods | |
| JP2017500639A (en) | Weight generation in machine learning | |
| US20230267175A1 (en) | Systems and methods for sample efficient training of machine learning models | |
| US20220076157A1 (en) | Data analysis system using artificial intelligence | |
| US20220083571A1 (en) | Systems and methods for classifying imbalanced data | |
| WO2019159915A1 (en) | Model learning device, model learning method, and program | |
| JP7400841B2 (en) | Optimization function generation device, optimization function generation method, program | |
| JP2022082524A (en) | Method and apparatus for providing information using learning model through machine learning | |
| Ilter et al. | Hybridized artificial neural network classifiers with a novel feature selection procedure based genetic algorithms and information complexity in credit scoring | |
| Krijthe et al. | Projected estimators for robust semi-supervised classification | |
| JP7540595B2 (en) | Model learning device, model learning method, and program | |
| CN115730234A (en) | User behavior prediction method, device, equipment and medium based on artificial intelligence | |
| JP7666655B2 (en) | Model learning device, model learning method, and program | |
| TW202518382A (en) | Method of image enhancement, method of generating deblurred image from blur image, and electronic device | |
| JP7574937B2 (en) | Learning device, learning method, and program | |
| US12423937B2 (en) | Automated data pre-processing for machine learning | |
| US20240028902A1 (en) | Learning apparatus and method | |
| US20230237127A1 (en) | Intelligent adaption for engineered prediction model for a model-based system upgrade | |
| JP7505555B2 (en) | Learning device, learning method, and program | |
| WO2019194128A1 (en) | Model learning device, model learning method, and program | |
| Liu et al. | Evolutionary Voting‐Based Extreme Learning Machines | |
| CN115511105A (en) | Method, apparatus, device, and medium for determining an update gradient of a contrast learning model |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230919 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240618 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240628 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240716 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240729 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7540595 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |