Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7540595B2 - Model learning device, model learning method, and program - Google Patents
[go: Go Back, main page]

JP7540595B2 - Model learning device, model learning method, and program - Google Patents

Model learning device, model learning method, and program Download PDF

Info

Publication number
JP7540595B2
JP7540595B2 JP2023526801A JP2023526801A JP7540595B2 JP 7540595 B2 JP7540595 B2 JP 7540595B2 JP 2023526801 A JP2023526801 A JP 2023526801A JP 2023526801 A JP2023526801 A JP 2023526801A JP 7540595 B2 JP7540595 B2 JP 7540595B2
Authority
JP
Japan
Prior art keywords
loss
data
risk
model
labels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023526801A
Other languages
Japanese (ja)
Other versions
JPWO2022259517A1 (en
Inventor
圭吾 若山
翔一郎 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2022259517A1 publication Critical patent/JPWO2022259517A1/ja
Application granted granted Critical
Publication of JP7540595B2 publication Critical patent/JP7540595B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、機械学習技術に関する。 The present invention relates to machine learning technology.

近年、音響イベント検知、画像セグメンテーション、画像認識などの分野において、機械学習が用いられている。機械学習の一般的な手順について、以下説明する。 In recent years, machine learning has been used in fields such as acoustic event detection, image segmentation, and image recognition. The general steps of machine learning are described below.

(1)1つのデータに対してそのデータが属するクラスを示すラベル(正解ラベルという)を1つ付与し、正解ラベルが付与されたデータを生成する。この作業を多くのデータに対して行うことにより、正解ラベルが付与されたデータの集合を生成する。 (1) A label (called a correct label) is assigned to each piece of data, indicating the class to which the data belongs, and data with the correct label is generated. By performing this process on many pieces of data, a set of data with correct labels is generated.

(2)正解ラベルが付与されたデータの集合を用いてモデルを学習する。 (2) Train the model using a set of data with correct labels.

(3)学習済モデルを用いて、入力されたデータが属するクラス(正解クラスという)を推定する。 (3) Using the trained model, the class to which the input data belongs (called the correct class) is estimated.

上記手順に従い生成した学習済モデルを用いた正解クラスの推定において、推定精度を高めようとする場合、より多くの正解ラベルが付与されたデータが必要になる。また、推定対象となる、データが属するクラスの数を増やそうとする場合も、より多くの正解ラベルが付与されたデータが必要になる。しかし、正解ラベルを付与する作業は非常に手間がかかるものであり、正解ラベルが付与されたデータを大量に生成するのは困難である。 When trying to improve the accuracy of correct class estimation using a trained model generated according to the above procedure, data with more correct labels is required. Also, when trying to increase the number of classes to which the data to be estimated belongs, data with more correct labels is required. However, the task of assigning correct labels is very time-consuming, and it is difficult to generate large amounts of data with correct labels.

そこで、非特許文献1では、以下の手順の機械学習を提案している。Therefore, non-patent document 1 proposes the following machine learning procedure.

(1)1つのデータに対してそのデータが属さないクラスを示すラベル(補ラベルという)を1つ付与し、間違ったラベルである補ラベルが付与されたデータを生成する。この作業を多くのデータに対して行うことにより、補ラベルが付与されたデータの集合を生成する。 (1) A label (called a complementary label) is assigned to each piece of data, indicating a class to which the data does not belong, and data is generated that has been assigned the incorrect complementary label. By performing this process on many pieces of data, a set of data that has been assigned complementary labels is generated.

(2)補ラベルが付与されたデータの集合を用いてモデルを学習する。 (2) Train the model using a set of data with complementary labels.

(3)学習済モデルを用いて、入力されたデータが属するクラス(正解クラスという)を推定する。 (3) Using the trained model, the class to which the input data belongs (called the correct class) is estimated.

あるデータに正解ラベルを付与するよりも補ラベルを付与する方が手間がかからないため、より多くのラベルが付与されたデータを生成することができる。また、非特許文献1の手順に従い生成した学習済モデルを用いた正解クラスの推定における推定精度は、一般的な手順に従い生成した学習済モデルを用いた正解クラスの推定における推定精度と同程度である。 Since it is less time-consuming to assign complementary labels to data than to assign correct labels to data, it is possible to generate data with more labels. In addition, the estimation accuracy of the correct class using a trained model generated according to the procedure in Non-Patent Document 1 is comparable to the estimation accuracy of the correct class using a trained model generated according to a general procedure.

T. Ishida et al., “Complementary-Label Learning for Arbitrary Losses and Models,” ICML 2019, pp.2971-2980, 2019.T. Ishida et al., “Complementary-Label Learning for Arbitrary Losses and Models,” ICML 2019, pp.2971-2980, 2019.

非特許文献1の技術では、1つのデータに対してそのデータが属するクラスが1つである問題(以下、多クラス分類問題という)を対象としており、1つのデータに対してそのデータが属するクラスが1つとは限らない(つまり、2つ以上ある場合もある)問題(以下、マルチラベル分類問題という)を扱うことができない。The technology in Non-Patent Document 1 targets problems where a single piece of data belongs to only one class (hereafter referred to as a multi-class classification problem), and cannot handle problems where a single piece of data belongs to more than one class (i.e., there may be two or more classes) (hereafter referred to as a multi-label classification problem).

そこで本発明では、マルチラベル分類問題を対象とする、補ラベルを用いたモデル学習技術を提供することを目的とする。 Therefore, the present invention aims to provide a model learning technology using complementary labels for multi-label classification problems.

本発明の一態様は、1個以上の補ラベルが付与されたデータの集合から、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する学習データ生成部と、前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する第1リスク計算部と、

Figure 0007540595000001
(ただし、Kはデータを分類するクラスの数、lossは1個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数)、リスク-R(g:-loss)を用いて、モデルを更新するモデル更新部と、を含む。 One aspect of the present invention includes a training data generation unit that generates a set of data to which one supplementary label is assigned (hereinafter referred to as a training data set) from a set of data to which one or more supplementary labels are assigned; and a first risk calculation unit that calculates a risk - R(g: -loss ) of a decision function g related to a loss function - loss, which is calculated by the following formula, using a batch that is a subset of the training data set;
Figure 0007540595000001
(where K is the number of classes into which data is classified, and loss is a loss function used when training a model using a set of data to which one or more correct labels are assigned), and a model update unit that updates the model using risk - R(g: - loss).

本発明の一態様は、1個以上の補ラベルが付与されたデータの集合から、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する学習データ生成部と、前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する第1リスク計算部と、

Figure 0007540595000002
(ただし、Kはデータを分類するクラスの数、lossは1個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数)、1個以上の正解ラベルが付与されたデータの集合の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する第2リスク計算部と、リスク-R(g:-loss)とリスクR(g:loss)から、R(g)=α-R(g:-loss)+(1-α)(g:loss)(ただし、αは0<α<1を満たす定数)により、リスクR(g)を計算する第3リスク計算部と、リスクR(g)を用いて、モデルを更新するモデル更新部と、を含む。 One aspect of the present invention includes a training data generation unit that generates a set of data to which one supplementary label is assigned (hereinafter referred to as a training data set) from a set of data to which one or more supplementary labels are assigned; and a first risk calculation unit that calculates a risk - R(g: -loss ) of a decision function g related to a loss function - loss, which is calculated by the following formula, using a batch that is a subset of the training data set;
Figure 0007540595000002
(where K is the number of classes for classifying data, and loss is a loss function used when training a model using a set of data to which one or more correct labels have been assigned), a second risk calculation unit that calculates a risk R(g:loss) of a decision function g related to the loss function loss using a batch that is a subset of the set of data to which one or more correct labels have been assigned; a third risk calculation unit that calculates a risk R(g) from the risk -R (g: -loss ) and the risk R(g:loss) by R(g)=α - R(g: -loss )+(1-α)(g:loss) (where α is a constant satisfying 0<α<1); and a model update unit that updates the model using the risk R(g).

本発明によれば、マルチラベル分類問題を対象とする、補ラベルを用いたモデル学習が可能となる。 According to the present invention, it becomes possible to learn a model using complementary labels for multi-label classification problems.

モデル学習装置100の構成を示すブロック図である。FIG. 1 is a block diagram showing a configuration of a model learning device 100. モデル学習装置100の動作を示すフローチャートである。4 is a flowchart showing the operation of the model learning device 100. モデル学習装置200の構成を示すブロック図である。FIG. 2 is a block diagram showing a configuration of a model learning device 200. モデル学習装置200の動作を示すフローチャートである。4 is a flowchart showing the operation of the model learning device 200. 本発明の実施形態における各装置を実現するコンピュータの機能構成の一例を示す図である。FIG. 2 is a diagram illustrating an example of a functional configuration of a computer that realizes each device according to an embodiment of the present invention.

以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。Hereinafter, an embodiment of the present invention will be described in detail. Components having the same functions are given the same numbers, and duplicate explanations will be omitted.

各実施形態の説明に先立って、この明細書における表記方法について説明する。Before describing each embodiment, we will explain the notation used in this specification.

^(キャレット)は上付き添字を表す。例えば、xy^zはyzがxに対する上付き添字であり、xy^zはyzがxに対する下付き添字であることを表す。また、_(アンダースコア)は下付き添字を表す。例えば、xy_zはyzがxに対する上付き添字であり、xy_zはyzがxに対する下付き添字であることを表す。 ^ (caret) represents a superscript. For example, x y^z means that y z is a superscript to x, and x y^z means that y z is a subscript to x. _ (underscore) represents a subscript. For example, x y_z means that y z is a superscript to x, and x y_z means that y z is a subscript to x.

また、ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。 In addition, superscripts such as "^" and "~" for a certain letter x, such as ^x and ~x, should actually be written directly above the "x", but due to the constraints of the description in the specification, they are written as ^x and ~x.

<技術的背景>
本発明の実施形態では、1個以上の補ラベルが付与されたデータを用いてマルチラベル分類問題に対するモデルを学習する。なお、本発明の実施形態を用いて、1個以上の補ラベルが付与されたデータを用いて多クラス分類問題に対するモデルを学習することもできる。
<Technical Background>
In an embodiment of the present invention, a model for a multi-label classification problem is trained using data with one or more supplementary labels. Note that the embodiment of the present invention can also be used to train a model for a multi-class classification problem using data with one or more supplementary labels.

以下、データが属する可能性があるクラス、つまり、データを分類するクラスの数をK、正解ラベルの集合[K]={1, …, K}とする。ここで、正解ラベルとは、クラス1に属すことを示すラベル、…、クラスKに属すことを示すラベルのことであり、それぞれ、1, …, Kで表す。 In the following, the number of classes to which data may belong, i.e., the number of classes into which data is classified, is defined as K, and the set of correct labels is [K] = {1, ..., K}. Here, correct labels are labels indicating that data belongs to class 1, ..., and labels indicating that data belongs to class K, and are represented as 1, ..., K, respectively.

K個の補ラベルを考える。ここで、K個の補ラベルとは、クラス1に属さないことを示すラベル、…、クラスKに属さないことを示すラベルのことであり、それぞれ、-1, …, -Kで表すこととする。また、補ラベルの集合[-K]={-1, …, -K}で表すこととする。 Consider K complementary labels. Here, the K complementary labels are labels indicating that the class does not belong to class 1, ..., and labels indicating that the class does not belong to class K, and are represented as -1 , ..., -K , respectively. The set of complementary labels is represented as [ -K ]={ - 1, ..., -K }.

そして、1以上の補ラベルが付与されたデータについて、本発明の実施形態では、次のように取り扱うこととする。M個の補ラベルが付与されたデータに対して、Mが2以上である場合、当該データから1個の補ラベルが付与されたデータM個生成する。このことを以下で説明する記号を用いて説明すると、“M個の補ラベルが付与されたデータ(xi, (-y1, …, -yM))(ただし、xi∈χ, -y1, …, -yM∈[-K])から、1個の補ラベルが付与されたデータ(xi, -y1), …, (xi, -yM)を生成する”となる。 In the embodiment of the present invention, data to which one or more complementary labels are assigned is handled as follows. For data to which M complementary labels are assigned, where M is 2 or more, M pieces of data to which one complementary label is assigned are generated from the data. This can be explained using the symbols described below as "data (x i , ( -y 1 , ..., -y M )) to which M complementary labels are assigned (where x i ∈χ, -y 1 , ..., -y M ∈[ -K ]) are generated as data (x i , -y 1 ), ..., (x i , -y M ) to which one complementary label is assigned."

以下、正解ラベル学習、補ラベル学習について詳しく説明する。ここで、正解ラベル学習とは、1個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習することをいい、補ラベル学習とは、1個以上の補ラベルが付与されたデータの集合を用いてモデルを学習することをいう。Below, we will explain correct label learning and supplementary label learning in detail. Correct label learning here means learning a model using a set of data to which one or more correct labels have been assigned, and supplementary label learning means learning a model using a set of data to which one or more supplementary labels have been assigned.

[正解ラベル学習]
χをデータの集合、g:χ→RKを決定関数とする。また、gkを決定関数gの第k要素とする。Dをχ×[K]上の分布(ただし、分布Dの確率変数を(X, Y)~Dと表す)、{Pk}k=1 K(ただし、Pk=P(X|Y=k))、{πk}k=1 K(ただし、πk=P(Y=k))、loss:[K]×RK→R+を正解ラベル学習の損失関数とすると、損失関数loss, 分布Dに関する決定関数gのリスクR(g:loss)は、次式で表される。

Figure 0007540595000003
また、リスクR(g:loss)は、次式で表すこともできる。
Figure 0007540595000004
マルチラベル分類問題に対するモデルを学習する場合、損失関数lossとして、以下のバイナリクロスエントロピーやマルチラベルソフトマージンを用いることができる。ここで、ykはクラスkが存在する場合は1、それ以外の場合は0を表すものとする。 [Correct label learning]
Let χ be the set of data, g:χ→R K be the decision function, and g k be the k-th element of the decision function g. Let D be the distribution on χ×[K] (where the random variables of distribution D are represented as (X, Y) to D), {P k } k=1 K (where P k =P(X|Y=k)), {π k } k=1 K (where π k =P(Y=k)), and loss:[K]×R K →R + be the loss function for learning correct labels. The loss function loss, the risk R(g:loss) of the decision function g on distribution D, is expressed by the following equation.
Figure 0007540595000003
In addition, the risk R(g:loss) can also be expressed by the following formula:
Figure 0007540595000004
When training a model for a multi-label classification problem, the following binary cross entropy or multi-label soft margin can be used as the loss function, where y k is 1 if class k exists and 0 otherwise.

(バイナリクロスエントロピー)

Figure 0007540595000005
(マルチラベルソフトマージン)
Figure 0007540595000006
なお、多クラス分類問題に対するモデルを学習する場合、損失関数lossとして、ソフトマックスクロスエントロピーを用いることができる。 (Binary Cross Entropy)
Figure 0007540595000005
(Multi-label soft margin)
Figure 0007540595000006
When training a model for a multi-class classification problem, softmax cross entropy can be used as the loss function.

[補ラベル学習]
-Dをχ×[-K]上の分布(ただし、分布-Dの確率変数を(X, -Y)~-Dと表す)、{-Pk}k=1 K(ただし、-Pk=P(X|-Y=k))、{-πk}k=1 K(ただし、-πk=P(-Y=k))、-loss:[-K]×RK→R+を補ラベル学習の損失関数とすると、損失関数-loss, 分布-Dに関する決定関数gのリスク-R(g:-loss)は、次式で表される。

Figure 0007540595000007
また、リスク-R(g:-loss)は、次式で表すこともできる。
Figure 0007540595000008
損失関数-lossは、損失関数lossを用いた次式で計算される。
Figure 0007540595000009
なお、1個以上の正解ラベルが付与されたデータの集合と1個以上の補ラベルが付与されたデータの集合とを用いてモデルを学習することもできる。この場合、決定関数gのリスクR(g)は、次式を用いて計算するとよい。
Figure 0007540595000010
ただし、αは0<α<1を満たす定数である。 [Complementary label learning]
Let -D be a distribution on χ×[ -K ] (where the random variable in distribution -D is represented as (X, -Y )~ -D ), { -Pk } k=1K ( where -Pk = P(X| -Y = k )), { -πk } k =1K ( where -πk =P( -Y =k)), and -loss:[ - K]× RK →R + be the loss function for complementary label learning. Then, the loss function -loss , the risk -R (g: -loss ) of the decision function g on distribution -D is expressed by the following equation.
Figure 0007540595000007
The risk −R (g: −loss ) can also be expressed as follows:
Figure 0007540595000008
The loss function - loss is calculated using the loss function loss as follows:
Figure 0007540595000009
It is also possible to train a model using a set of data to which one or more correct labels have been assigned and a set of data to which one or more complementary labels have been assigned. In this case, the risk R(g) of the decision function g may be calculated using the following formula:
Figure 0007540595000010
Here, α is a constant that satisfies 0<α<1.

<第1実施形態>
以下、図1~図2を参照してモデル学習装置100について説明する。図1は、モデル学習装置100の構成を示すブロック図である。図2は、モデル学習装置100の動作を示すフローチャートである。図1に示すようにモデル学習装置100は、学習データ生成部110と、第1リスク計算部120と、モデル更新部130と、終了条件判定部140と、記録部190を含む。記録部190は、モデル学習装置100の処理に必要な情報を適宜記録する構成部である。
First Embodiment
Below, the model learning device 100 will be described with reference to Figures 1 and 2. Figure 1 is a block diagram showing the configuration of the model learning device 100. Figure 2 is a flowchart showing the operation of the model learning device 100. As shown in Figure 1, the model learning device 100 includes a learning data generation unit 110, a first risk calculation unit 120, a model update unit 130, a termination condition determination unit 140, and a recording unit 190. The recording unit 190 is a component that appropriately records information necessary for the processing of the model learning device 100.

図2に従いモデル学習装置100の動作について説明する。The operation of the model learning device 100 will be explained with reference to Figure 2.

S110において、学習データ生成部110は、1個以上の補ラベルが付与されたデータの集合(以下、入力補ラベル付きデータ集合という)から、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する。At S110, the training data generation unit 110 generates a set of data to which one complementary label has been assigned (hereinafter referred to as a training data set) from a set of data to which one or more complementary labels have been assigned (hereinafter referred to as an input complementary labeled data set).

S120において、第1リスク計算部120は、S110で生成した学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する。

Figure 0007540595000011
(ただし、Kはデータを分類するクラスの数、lossは1個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数)
S130において、モデル更新部130は、S120で計算したリスク-R(g:-loss)を用いて、モデルを更新する。具体的には、モデル更新部130は、リスク-R(g:-loss)を最小化するように、モデルを更新する。音響イベント検知に用いるモデルを学習する場合、モデルは、参考非特許文献1に記載の自己注意機構を備えたDNNモデルとすることができる。また、画像セグメンテーションに用いるモデルを学習する場合、モデルは、参考非特許文献2に記載のクラスアクティベーションマップを備えたDNNモデルとすることができる。 In S120, the first risk calculation unit 120 calculates a risk −R (g:-loss) of a decision function g related to a loss function −loss calculated by the following formula, using a batch which is a subset of the training data set generated in S110.
Figure 0007540595000011
(where K is the number of classes into which data is classified, and loss is the loss function used when training a model using a set of data with one or more correct labels.)
In S130, the model update unit 130 updates the model using the risk - R(g: -loss ) calculated in S120. Specifically, the model update unit 130 updates the model so as to minimize the risk - R(g: -loss ). When training a model for use in acoustic event detection, the model may be a DNN model equipped with a self-attention mechanism as described in Reference Non-Patent Document 1. When training a model for use in image segmentation, the model may be a DNN model equipped with a class activation map as described in Reference Non-Patent Document 2.

(参考非特許文献1:Q. Kong et al., “Sound Event Detection of Weakly Labelled Data with CNN-Transformer and Automatic Threshold Optimization,” IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol.28, pp.2450-2460, 2020.)
(参考非特許文献2:Y. Wang et al., “Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation,” CVPR 2020, pp.12275-12284, 2020.)
S140において、終了条件判定部140は、所定の終了条件が満たされる場合には、S130の処理で得られたモデルを学習済みモデルとして処理を終了し、それ以外の場合には、S120の処理に戻る。終了条件には、例えば、モデル更新回数の上限に達したか否かという条件を用いることができる。
(Reference Non-Patent Document 1: Q. Kong et al., “Sound Event Detection of Weakly Labeled Data with CNN-Transformer and Automatic Threshold Optimization,” IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol.28, pp .2450-2460, 2020.)
(Reference Non-Patent Document 2: Y. Wang et al., “Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation,” CVPR 2020, pp.12275-12284, 2020.)
In S140, if a predetermined termination condition is satisfied, the termination condition determination unit 140 terminates the process by treating the model obtained in the process of S130 as a trained model, and otherwise returns to the process of S120. The termination condition may be, for example, whether or not the upper limit of the number of model updates has been reached.

(変形例)
上記S110~S140の処理は、以下のようにしてもよい。
(Modification)
The above-mentioned processes in steps S110 to S140 may be carried out as follows.

S110において、学習データ生成部110は、1個以上の補ラベルが付与されたデータの集合(以下、入力補ラベル付きデータ集合という)から、入力補ラベル付きデータ集合の部分集合であるバッチを生成し、当該バッチから、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する。In S110, the training data generation unit 110 generates a batch that is a subset of the input labeled data set from a set of data to which one or more complementary labels have been assigned (hereinafter referred to as the input labeled data set), and generates a set of data to which one complementary label has been assigned from the batch (hereinafter referred to as the training data set).

S120において、第1リスク計算部120は、S110で生成した学習データ集合を用いて、式(1)で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する。 In S120, the first risk calculation unit 120 calculates the risk −R (g: -loss ) of the decision function g related to the loss function −loss calculated by the formula (1) using the training data set generated in S110.

S130において、モデル更新部130は、S120で計算したリスク-R(g:-loss)を用いて、モデルを更新する。 In S130, the model update unit 130 updates the model using the risk −R (g: −loss ) calculated in S120.

S140において、終了条件判定部140は、所定の終了条件が満たされる場合には、S130の処理で得られたモデルを学習済みモデルとして処理を終了し、それ以外の場合には、S110の処理に戻る。In S140, if a specified termination condition is satisfied, the termination condition determination unit 140 terminates the processing by treating the model obtained in the processing of S130 as the trained model, and otherwise returns to the processing of S110.

本発明の実施形態によれば、マルチラベル分類問題を対象とする、補ラベルを用いたモデル学習が可能となる。補ラベルを付与したデータを用いることにより、より多くのデータを用いた学習が可能となり、学習済みモデルを用いた推定の精度を向上させることやより多くのクラスを対象とする推定が可能となる。 According to an embodiment of the present invention, it is possible to learn a model using a complementary label for a multi-label classification problem. By using data with a complementary label, it is possible to learn using a larger amount of data, thereby improving the accuracy of estimation using a trained model and enabling estimation for a larger number of classes.

<第2実施形態>
以下、図3~図4を参照してモデル学習装置200について説明する。図3は、モデル学習装置200の構成を示すブロック図である。図4は、モデル学習装置200の動作を示すフローチャートである。図3に示すようにモデル学習装置200は、学習データ生成部110と、第1リスク計算部120と、第2リスク計算部220と、第3リスク計算部230と、モデル更新部240と、終了条件判定部140と、記録部190を含む。記録部190は、モデル学習装置200の処理に必要な情報を適宜記録する構成部である。
Second Embodiment
Hereinafter, model learning device 200 will be described with reference to Figs. 3 and 4. Fig. 3 is a block diagram showing the configuration of model learning device 200. Fig. 4 is a flowchart showing the operation of model learning device 200. As shown in Fig. 3, model learning device 200 includes a learning data generation unit 110, a first risk calculation unit 120, a second risk calculation unit 220, a third risk calculation unit 230, a model update unit 240, a termination condition determination unit 140, and a recording unit 190. Recording unit 190 is a component that appropriately records information necessary for the processing of model learning device 200.

図4に従いモデル学習装置200の動作について説明する。The operation of the model learning device 200 will be explained with reference to Figure 4.

S110において、学習データ生成部110は、1個以上の補ラベルが付与されたデータの集合(以下、入力補ラベル付きデータ集合という)から、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する。At S110, the training data generation unit 110 generates a set of data to which one complementary label has been assigned (hereinafter referred to as a training data set) from a set of data to which one or more complementary labels have been assigned (hereinafter referred to as an input complementary labeled data set).

S120において、第1リスク計算部120は、S110で生成した学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する。

Figure 0007540595000012
(ただし、Kはデータを分類するクラスの数、lossは1個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数)
S220において、第2リスク計算部220は、1個以上の正解ラベルが付与されたデータの集合(以下、入力正解ラベル付きデータ集合という)の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する。 In S120, the first risk calculation unit 120 calculates a risk −R (g:-loss) of a decision function g related to a loss function −loss calculated by the following formula, using a batch which is a subset of the training data set generated in S110.
Figure 0007540595000012
(where K is the number of classes into which data is classified, and loss is the loss function used when training a model using a set of data with one or more correct labels.)
In S220, the second risk calculation unit 220 calculates the risk R(g:loss) of the decision function g related to the loss function loss using a batch that is a subset of a set of data to which one or more correct labels have been assigned (hereinafter referred to as the input correct-labeled data set).

S230において、第3リスク計算部230は、S120で計算したリスク-R(g:-loss)とS130で計算したリスクR(g:loss)から、R(g)=α-R(g:-loss)+(1-α)(g:loss)(ただし、αは0<α<1を満たす定数)により、リスクR(g)を計算する。 In S230, the third risk calculation unit 230 calculates a risk R(g) from the risk -R (g: -loss ) calculated in S120 and the risk R(g:loss) calculated in S130 by R(g)=α - R(g: -loss )+(1-α)(g:loss) (where α is a constant satisfying 0<α<1).

S240において、モデル更新部240は、S230で計算したリスクR(g)を用いて、モデルを更新する。具体的には、モデル更新部240は、リスクR(g)を最小化するように、モデルを更新する。また、第1実施形態と同様、音響イベント検知に用いるモデルを学習する場合は参考非特許文献1に記載のモデル、画像セグメンテーションに用いるモデルを学習する場合は参考非特許文献2に記載のモデルとすることができる。In S240, the model update unit 240 updates the model using the risk R(g) calculated in S230. Specifically, the model update unit 240 updates the model so as to minimize the risk R(g). Also, as in the first embodiment, when training a model to be used for acoustic event detection, the model described in Reference Non-Patent Document 1 can be used, and when training a model to be used for image segmentation, the model described in Reference Non-Patent Document 2 can be used.

S140において、終了条件判定部140は、所定の終了条件が満たされる場合には、S240の処理で得られたモデルを学習済みモデルとして処理を終了し、それ以外の場合には、S120の処理、S220の処理に戻る。In S140, if a specified termination condition is satisfied, the termination condition determination unit 140 terminates the processing by treating the model obtained in the processing of S240 as the trained model, and otherwise returns to the processing of S120 and S220.

(変形例)
上記S110~S140の処理は、以下のようにしてもよい。
(Modification)
The above-mentioned processes in steps S110 to S140 may be carried out as follows.

S110において、学習データ生成部110は、1個以上の補ラベルが付与されたデータの集合(以下、入力補ラベル付きデータ集合という)から、入力補ラベル付きデータ集合の部分集合であるバッチを生成し、当該バッチから、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する。In S110, the training data generation unit 110 generates a batch that is a subset of the input labeled data set from a set of data to which one or more complementary labels have been assigned (hereinafter referred to as the input labeled data set), and generates a set of data to which one complementary label has been assigned (hereinafter referred to as the training data set) from the batch.

S120において、第1リスク計算部120は、S110で生成した学習データ集合を用いて、式(2)で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する。 In S120, the first risk calculation unit 120 calculates the risk −R (g: -loss ) of the decision function g related to the loss function −loss calculated by the formula (2), using the training data set generated in S110.

S220において、第2リスク計算部220は、1個以上の正解ラベルが付与されたデータの集合(以下、入力正解ラベル付きデータ集合という)の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する。In S220, the second risk calculation unit 220 calculates the risk R(g:loss) of the decision function g related to the loss function loss using a batch, which is a subset of a set of data to which one or more correct answer labels have been assigned (hereinafter referred to as the input labeled data set).

S230において、第3リスク計算部230は、S120で計算したリスク-R(g:-loss)とS130で計算したリスクR(g:loss)から、R(g)=α-R(g:-loss)+(1-α)(g:loss)(ただし、αは0<α<1を満たす定数)により、リスクR(g)を計算する。 In S230, the third risk calculation unit 230 calculates a risk R(g) from the risk -R (g: -loss ) calculated in S120 and the risk R(g:loss) calculated in S130 by R(g)=α - R(g: -loss )+(1-α)(g:loss) (where α is a constant satisfying 0<α<1).

S240において、モデル更新部240は、S230で計算したリスクR(g)を用いて、モデルを更新する。In S240, the model update unit 240 updates the model using the risk R(g) calculated in S230.

S140において、終了条件判定部140は、所定の終了条件が満たされる場合には、S240の処理で得られたモデルを学習済みモデルとして処理を終了し、それ以外の場合には、S110の処理、S220の処理に戻る。In S140, if a specified termination condition is satisfied, the termination condition determination unit 140 terminates the processing by treating the model obtained in the processing of S240 as the trained model, and otherwise returns to the processing of S110 and S220.

本発明の実施形態によれば、マルチラベル分類問題を対象とする、補ラベルを用いたモデル学習が可能となる。補ラベルを付与したデータを用いることにより、より多くのデータを用いた学習が可能となり、学習済みモデルを用いた推定の精度を向上させることやより多くのクラスを対象とする推定が可能となる。 According to an embodiment of the present invention, it is possible to learn a model using a complementary label for a multi-label classification problem. By using data with a complementary label, it is possible to learn using a larger amount of data, thereby improving the accuracy of estimation using a trained model and enabling estimation for a larger number of classes.

<補記>
図5は、上述の各装置(つまり、各ノード)を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部2020に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部2010、入力部2030、出力部2040などに動作させることで実施できる。
<Additional Notes>
5 is a diagram showing an example of the functional configuration of a computer that realizes each of the above-mentioned devices (i.e., each node). The processing in each of the above-mentioned devices can be implemented by having the recording unit 2020 load a program for causing the computer to function as each of the above-mentioned devices, and having the control unit 2010, input unit 2030, output unit 2040, etc. operate.

本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。 The device of the present invention, for example as a single hardware entity, has an input section to which a keyboard or the like can be connected, an output section to which an LCD display or the like can be connected, a communication section to which a communication device (for example a communication cable) capable of communicating with the outside of the hardware entity can be connected, a CPU (which may also have a central processing unit, cache memory, registers, etc.), memories such as RAM and ROM, an external storage device such as a hard disk, and buses connecting these input section, output section, communication section, CPU, RAM, ROM, and external storage device so that data can be exchanged between them. If necessary, the hardware entity may also be provided with a device (drive) capable of reading and writing recording media such as a CD-ROM. An example of a physical entity equipped with such hardware resources is a general-purpose computer.

ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。The external storage device of the hardware entity stores the programs required to realize the above-mentioned functions and the data required in processing these programs (not limited to an external storage device, but for example the programs may be stored in a ROM, which is a read-only storage device). Data obtained by processing these programs is stored appropriately in RAM, an external storage device, etc.

ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成部)を実現する。In a hardware entity, each program stored in an external storage device (or ROM, etc.) and the data required to process each program are loaded into memory as needed, and interpreted, executed, and processed by the CPU as appropriate. As a result, the CPU realizes a specified function (each component represented as the above, ... unit, ... means, etc.).

本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。The present invention is not limited to the above-described embodiments, and appropriate modifications can be made without departing from the spirit of the present invention. Furthermore, the processes described in the above embodiments are not limited to being executed chronologically in the order described, but may be executed in parallel or individually depending on the processing capacity of the device executing the processes or as necessary.

既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。As mentioned above, when the processing functions of the hardware entities (the devices of the present invention) described in the above embodiments are realized by a computer, the processing contents of the functions that the hardware entities should have are described by a program. Then, by executing this program on a computer, the processing functions of the hardware entities are realized on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。 The program describing the processing contents can be recorded on a computer-readable recording medium. Examples of computer-readable recording media include magnetic recording devices, optical disks, magneto-optical recording media, and semiconductor memories. Specifically, for example, a hard disk drive, a flexible disk, a magnetic tape, etc. can be used as a magnetic recording device; a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only Memory), a CD-R (Recordable)/RW (ReWritable), etc. can be used as an optical disk; an MO (Magneto-Optical disc) can be used as a magneto-optical recording medium; and an EEP-ROM (Electronically Erasable and Programmable-Read Only Memory) can be used as a semiconductor memory.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program may be distributed, for example, by selling, transferring, lending, etc. portable recording media such as DVDs and CD-ROMs on which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of a server computer and transferring the program from the server computer to other computers via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。A computer that executes such a program, for example, first stores in its own storage device the program recorded on a portable recording medium or the program transferred from a server computer. Then, when executing a process, the computer reads the program stored in its own storage device and executes the process according to the read program. As another execution form of this program, the computer may read the program directly from the portable recording medium and execute the process according to the program, or may execute the process according to the received program each time a program is transferred from the server computer to this computer. In addition, the server computer may not transfer the program to this computer, but may execute the above-mentioned process by a so-called ASP (Application Service Provider) type service that realizes the processing function only by issuing an execution instruction and obtaining the results. Note that the program in this embodiment includes information used for processing by an electronic computer that is equivalent to a program (such as data that is not a direct command to the computer but has properties that specify the processing of the computer).

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In addition, in this embodiment, a hardware entity is configured by executing a specific program on a computer, but at least a portion of these processing contents may also be realized by hardware.

上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。The foregoing description of the embodiments of the invention has been presented for purposes of illustration and description. It is not intended to be exhaustive or to limit the invention to the precise form disclosed. Modifications and variations are possible in light of the above teachings. The embodiments have been chosen and depicted to provide a best illustration of the principles of the invention and to enable those skilled in the art to utilize the invention in various embodiments and with various modifications as may be suitable for the practical use contemplated. All such modifications and variations are within the scope of the invention as defined by the appended claims interpreted in accordance with the breadth to which they are fairly, legally and equitably entitled.

Claims (4)

1個以上の補ラベルが付与されたデータの集合から、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する学習データ生成部と、
前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する第1リスク計算部と、
Figure 0007540595000013

(ただし、Kはデータを分類するクラスの数、lossは1個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数)
1個以上の正解ラベルが付与されたデータの集合の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する第2リスク計算部と、
リスク-R(g:-loss)とリスクR(g:loss)から、R(g)=α-R(g:-loss)+(1-α)R(g:loss)(ただし、αは0<α<1を満たす定数)により、リスクR(g)を計算する第3リスク計算部と、
リスクR(g)を用いて、モデルを更新するモデル更新部と、
を含むモデル学習装置。
a training data generation unit that generates a set of data to which one complementary label is assigned (hereinafter referred to as a training data set) from a set of data to which one or more complementary labels are assigned;
A first risk calculation unit that calculates a risk - R(g: -loss ) of a decision function g regarding a loss function - loss calculated by the following formula using a batch that is a subset of the learning data set;
Figure 0007540595000013

(where K is the number of classes into which data is classified, and loss is the loss function used when training a model using a set of data with one or more correct labels.)
A second risk calculation unit that calculates a risk R(g:loss) of a decision function g related to a loss function loss using a batch that is a subset of a set of data to which one or more correct answer labels are assigned;
a third risk calculation unit that calculates risk R(g) from risk - R(g: - loss) and risk R(g:loss) by R(g)=α - R(g: - loss)+(1-α) R (g:loss) (where α is a constant satisfying 0<α<1);
a model updating unit that updates the model using the risk R(g);
A model learning device comprising:
モデル学習装置が、1個以上の補ラベルが付与されたデータの集合から、1個の補ラベルが付与されたデータの集合(以下、学習データ集合という)を生成する学習データ生成ステップと、
前記モデル学習装置が、前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数-lossに関する決定関数gのリスク-R(g:-loss)を計算する第1リスク計算ステップと、
Figure 0007540595000014

(ただし、Kはデータを分類するクラスの数、lossは1個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数)
前記モデル学習装置が、1個以上の正解ラベルが付与されたデータの集合の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する第2リスク計算ステップと、
前記モデル学習装置が、リスク-R(g:-loss)とリスクR(g:loss)から、R(g)=α-R(g:-loss)+(1-α)R(g:loss)(ただし、αは0<α<1を満たす定数)により、リスクR(g)を計算する第3リスク計算ステップと、
前記モデル学習装置が、リスクR(g)を用いて、モデルを更新するモデル更新ステップと、
を含むモデル学習方法。
a learning data generating step in which the model learning device generates a set of data to which one supplementary label is assigned (hereinafter referred to as a learning data set) from a set of data to which one or more supplementary labels are assigned;
A first risk calculation step in which the model learning device calculates a risk - R(g: -loss ) of a decision function g regarding a loss function - loss calculated by the following formula, using a batch that is a subset of the learning data set;
Figure 0007540595000014

(where K is the number of classes into which data is classified, and loss is the loss function used when training a model using a set of data with one or more correct labels.)
A second risk calculation step in which the model learning device calculates a risk R(g:loss) of a decision function g related to a loss function loss using a batch that is a subset of a set of data to which one or more correct answer labels are assigned;
a third risk calculation step in which the model learning device calculates a risk R(g) from risk -R (g: -loss ) and risk R(g:loss) by R(g)=α - R(g: -loss )+(1-α) R (g:loss) (where α is a constant satisfying 0<α<1);
a model updating step in which the model learning device updates the model using the risk R(g);
A model training method including:
請求項に記載のモデル学習方法であって、
損失関数lossは、バイナリクロスエントロピーまたはマルチラベルソフトマージンである
ことを特徴とするモデル学習方法。
The model learning method according to claim 2 ,
A model training method characterized in that the loss function is binary cross entropy or multi-label soft margin.
請求項2または3に記載のモデル学習方法をコンピュータに実行させるためのプログラム。 A program for causing a computer to execute the model learning method according to claim 2 or 3 .
JP2023526801A 2021-06-11 2021-06-11 Model learning device, model learning method, and program Active JP7540595B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/022291 WO2022259517A1 (en) 2021-06-11 2021-06-11 Model learning device, model learning method, and program

Publications (2)

Publication Number Publication Date
JPWO2022259517A1 JPWO2022259517A1 (en) 2022-12-15
JP7540595B2 true JP7540595B2 (en) 2024-08-27

Family

ID=84424627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023526801A Active JP7540595B2 (en) 2021-06-11 2021-06-11 Model learning device, model learning method, and program

Country Status (2)

Country Link
JP (1) JP7540595B2 (en)
WO (1) WO2022259517A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030202A (en) 2002-06-25 2004-01-29 Fujitsu Ltd Feature word extraction system
CN111540468A (en) 2020-04-21 2020-08-14 重庆大学 ICD automatic coding method and system for visualization of diagnosis reason

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030202A (en) 2002-06-25 2004-01-29 Fujitsu Ltd Feature word extraction system
CN111540468A (en) 2020-04-21 2020-08-14 重庆大学 ICD automatic coding method and system for visualization of diagnosis reason

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CAO, Yuzhou et al.,"Multi-Complementary and Unlabeled Learning for Arbitrary Losses and Models",arXiv [online],2020年,p. 1-22,[2024年06月13日検索],インターネット<URL:https://arxiv.org/abs/2001.04243v3>,2001.04243v3
ISHIDA, Takashi et al.,"Learning from Complementary Labels",arXiv [online],2017年,[2024年06月13日検索],インターネット<URL:https://arxiv.org/abs/1705.07541v2>,1705.07541v2

Also Published As

Publication number Publication date
WO2022259517A1 (en) 2022-12-15
JPWO2022259517A1 (en) 2022-12-15

Similar Documents

Publication Publication Date Title
US12067571B2 (en) Systems and methods for generating models for classifying imbalanced data
JP6212216B2 (en) Weight generation in machine learning
CN110278175A (en) Graph structure model training, the recognition methods of rubbish account, device and equipment
US20220012625A1 (en) Unsupervised anomaly detection via supervised methods
JP2017500639A (en) Weight generation in machine learning
US20230267175A1 (en) Systems and methods for sample efficient training of machine learning models
US20220076157A1 (en) Data analysis system using artificial intelligence
US20220083571A1 (en) Systems and methods for classifying imbalanced data
WO2019159915A1 (en) Model learning device, model learning method, and program
JP7400841B2 (en) Optimization function generation device, optimization function generation method, program
JP2022082524A (en) Method and apparatus for providing information using learning model through machine learning
Ilter et al. Hybridized artificial neural network classifiers with a novel feature selection procedure based genetic algorithms and information complexity in credit scoring
Krijthe et al. Projected estimators for robust semi-supervised classification
JP7540595B2 (en) Model learning device, model learning method, and program
CN115730234A (en) User behavior prediction method, device, equipment and medium based on artificial intelligence
JP7666655B2 (en) Model learning device, model learning method, and program
TW202518382A (en) Method of image enhancement, method of generating deblurred image from blur image, and electronic device
JP7574937B2 (en) Learning device, learning method, and program
US12423937B2 (en) Automated data pre-processing for machine learning
US20240028902A1 (en) Learning apparatus and method
US20230237127A1 (en) Intelligent adaption for engineered prediction model for a model-based system upgrade
JP7505555B2 (en) Learning device, learning method, and program
WO2019194128A1 (en) Model learning device, model learning method, and program
Liu et al. Evolutionary Voting‐Based Extreme Learning Machines
CN115511105A (en) Method, apparatus, device, and medium for determining an update gradient of a contrast learning model

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240729

R150 Certificate of patent or registration of utility model

Ref document number: 7540595

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350