JP7763643B2

JP7763643B2 - 学習装置、ラベル推定装置及びプログラム

Info

Publication number: JP7763643B2
Application number: JP2021192928A
Authority: JP
Inventors: 有希安田
Original assignee: Japan Broadcasting Corp
Current assignee: Japan Broadcasting Corp
Priority date: 2021-09-02
Filing date: 2021-11-29
Publication date: 2025-11-04
Anticipated expiration: 2041-11-29
Also published as: JP2023036503A

Description

本発明は、学習装置、ラベル推定装置及びプログラムに関する。

検索を容易にする等の理由から、ニュースなどの文章にその文章に関連するラベルを付与することが望ましい場合がある。例えば、感染症の影響で株価が変動した会社のニュースであれば、感染症や、株価、ビジネスなどの用語がラベルとして付与される。

特開２０１９－５３７３０号公報

Grigorios, Tsoumakas, Ioannis Katakis, "Multi-Label Classification: An Overview" Ankit Pal, Muru Selvakumar and Malaikannan Sankarasubbu,"MAGNET: Multi-Label Text Classification using Attention-based Graph Neural Network" arXiv:2003.11644v1 Ashutosh Adhikari, Achyudh Ram, Raphael Tang, and Jimmy Lin，"Rethinking Complex Neural Network Architectures for Document Classification" Proceedings of NAACL-HLT 2019, pages 4046-4051

ラベルは１つの文章に１つが付与されれば充分な場合もあるが、文章は複数の言葉で構成される場合が多いので、付与されるラベルが１つでは不十分な場合もある。すなわち、上述の例に示したような、１つの文章に複数のラベルを付与することが望ましい場合もある。しかしながら、文章に付与すべきラベルの数が増えれば増えるほど、ラベルの推定の作業に要する労力は増大してしまう。

上記事情に鑑み、本発明は、ラベルの推定する作業に要する労力の増大を抑制する技術を提供することを目的としている。

本発明の一態様は、文章を示す文章情報と前記文章に付与されるラベルの候補として予め定められた複数のラベルについて前記文章のラベルとして適切である度合を示すラベル適正情報とを含むモデル学習用データを用いた機械学習の方法により、入力された文章情報が示す文章に付与されるべきラベルを推定する数理モデルであるラベル推定モデルを更新するモデル学習部、を備え、前記ラベル適正情報は、前記モデル学習用データの示す文章に対して付与される確率の高さに関する所定の条件を満たすラベルを示す正否情報と、前記文章に付与されるラベルの候補として予め定められた複数の各ラベルのうちの任意の２つの間の共起の確率を示す情報であるラベル共起情報と、に基づいて得られた情報である、学習装置である。

本発明の一態様は、処理対象の文章を示す情報である対象情報を取得する対象取得部と、
文章を示す文章情報と前記文章に付与されるラベルの候補として予め定められた複数のラベルについて前記文章のラベルとして適切である度合を示すラベル適正情報とを含むモデル学習用データを用いた機械学習の方法により、入力された文章情報が示す文章に付与されるべきラベルを推定する数理モデルであるラベル推定モデルを更新するモデル学習部、を備え、前記ラベル適正情報は、前記モデル学習用データの示す文章に対して付与される確率の高さに関する所定の条件を満たすラベルを示す正否情報と、前記文章に付与されるラベルの候補として予め定められた複数の各ラベルのうちの任意の２つの間の共起の確率を示す情報であるラベル共起情報と、に基づいて得られた情報である学習装置が得た、学習済みのラベル推定モデルを用いて、前記文章取得部の取得した対象情報が示す文章に付与されるべきラベルを推定する、推定部と、を備えるラベル推定装置である。

本発明の一態様は、上記の学習装置としてコンピュータを機能させるためのプログラムである。

本発明の一態様は、上記のラベル推定装置としてコンピュータを機能させるためのプログラムである。

本発明により、ラベルの推定する作業に要する労力の増大を抑制する技術を提供することが可能となる。

実施形態のラベル推定システムを説明する説明図。実施形態におけるラベル共起情報の一例を示す図。実施形態におけるラベル適正情報生成処理の一例を説明する図。実施形態における学習装置１のハードウェア構成の一例を示す図。実施形態における制御部１１の構成の一例を示す図。実施形態における学習装置１が実行する処理の流れの一例を示すフローチャート。実施形態におけるラベル推定装置２のハードウェア構成の一例を示す図。実施形態における制御部２１の構成の一例を示す図。実施形態におけるラベル推定装置２が実行する処理の流れの一例を示すフローチャート。実施形態のラベル推定システムを用いた実験結果の一例を示す第１の図。実施形態のラベル推定システムを用いた実験結果の一例を示す第２の図。実施形態のラベル推定システムを用いた実験結果の一例を示す第３の図。変形例における制御部の構成の一例を示す図。

（実施形態）
図１は、実施形態のラベル推定システム１００を説明する説明図である。ラベル推定システム１００は、文章に付与されるべきラベルを推定するシステムである。ラベル推定システム１００は、文章に付与されるべきラベルを推定する数理モデルを機械学習の方法により得る。ラベル推定システム１００は、取得した数理モデルを用いて、入力された文章に付与されるべきラベルを推定する。

より具体的には、数理モデルの取得を終えたラベル推定システム１００は、文章情報が入力された際に、取得した数理モデルを用い、文章情報に基づき文章情報が示す文章に付与されるべきラベルを推定する。文章情報は、文章を示す情報である。より具体的にラベル推定システム１００を説明する。ラベル推定システム１００は、学習装置１とラベル推定装置２とを備える。

学習装置１は、機械学習の方法によりラベル推定モデルを更新することで学習済みラベル推定モデルを得る。ラベル推定モデルは、入力された文章情報に基づき入力された文章情報が示す文章（以下「対象文章」という。）に付与されるべきラベルを推定する数理モデルであって学習に関する所定の終了条件が満たされる前の数理モデルである。

より具体的にはラベル推定モデルが推定する結果は、ラベル適正情報である。ラベル適正情報は、ラベル適正度を、ラベル候補それぞれについて示す情報である。ラベル適正度は、ラベルが対象文章のラベルとして適切である度合である。ラベル候補は、対象文章に付与されるラベルの候補として予め定められた複数の各ラベルである。ラベル候補は、例えば“感染症”、“ビジネス”、“スポーツ”、“株価”等の対象文章に関連付けられ得る用語である。

学習済みラベル推定モデルは、学習に関する所定の終了条件（以下「学習終了条件」という。）が満たされた時点のラベル推定モデルである。学習終了条件は、例えば、学習によるラベル推定モデルの変化が所定の変化より小さいという条件である。学習終了条件は、例えば、学習の回数が所定の回数に達した、という条件であってもよい。

以下、学習装置１が学習済みラベル推定モデルを得る処理をモデル学習処理という。機械学習の方法は、学習済みラベル推定モデルを得ることができればどのような方法であってもよい。機械学習の方法は、例えばＣＮＮ（Convolutional Neural Networks）を用いる方法であってもよいし、ＬＳＴＭ（Long short-term memory）を用いる方法であってもよいし、ＢＥＲＴ（Bidirectional Encoder Representations from Transformers）を用いる方法であってもよい。

学習済みラベル推定モデルを得るための機械学習の方法では、文章情報を説明変数として有するデータが用いられる。説明変数に対応する目的変数は、ラベル適正情報を示す。以下、説明変数として文章情報を有し、目的変数としてラベル適正情報を有するデータを、モデル学習用データという。モデル学習用データは学習済みラベル推定モデルの取得に用いられるデータである。すなわちモデル学習用データはラベル推定モデルの学習に用いられるデータである。以下、モデル学習用データの有するラベル適正情報を教師データという。

＜ラベル適正情報の表現の具体例＞
ラベル適正情報の表現の具体例を説明する。ラベル候補がＮ個（Ｎは自然数）であるとき、ラベル適正情報は、例えばＮ次元のベクトルで表現される。Ｎ次元ベクトルの各要素はＮ個のラベル候補のいずれか１つに対応付けられており、インデックスｎの異なる要素は異なるラベル候補に対応付けられている。ｎは１以上Ｎ以下の自然数である。なお、インデクッスｎは、ラベル候補を区別する指標であり、なおかつ、Ｎ次元ベクトルのｎ番目の要素を示す指標である。以下、説明の簡単のため、ラベル候補がＮ個である場合を例にラベル推定システム１００を説明する。

ラベル適正情報を表現するＮ次元ベクトルの各要素は、対応する各ラベル候補のラベル適正度を示す。ラベル適正度は、例えば０以上１以下の値で示される。このような場合、ラベル適正情報を表現するＮ次元のベクトルの各要素の値は、例えば０に近いほど対応するラベル候補が文章情報の示す文章のラベルとして不適切であることを示す。一方、ラベル適正情報を表現するＮ次元のベクトルの各要素は、例えば値が１に近いほど対応するラベル候補が文章情報の示す文章のラベルとして適切であることを示す。

＜モデル学習処理と損失関数とについて＞
モデル学習処理についてより詳細に説明する。モデル学習処理は、上述したように、モデル学習用データを用いた機械学習の方法により、学習終了条件が満たされるまでラベル推定モデルを更新する処理である。モデル学習処理では、損失関数を用いて計算された損失を小さくするようにラベル推定モデルの更新が行われる。なお損失関数を用いて計算された損失とは損失関数の値であり、例えばラベル推定モデルの出力と教師データとの不一致度を表す値である。

損失関数は、教師データとラベル推定モデルの推定結果との一致度と不一致度とを用いて表現される指標である。損失関数は、例えば以下の式（１）で定義されるバイナリクロスエントロピーであってもよい。

ｙ_ｎは、教師データが示すラベル適正度であってインデクッスｎのラベル候補のラベル適正度を示す。ｙ｛＾｝_ｎは、ラベル推定モデルによって推定されたラベル適正度であってインデクッスｎのラベル候補のラベル適正度を示す。なお、Ａ｛＾｝は、記号Ａにサーカムフレックスが付与された記号を示す。したがって、ｙ｛＾｝_ｎは、記号ｙにサーカムフレックスが付与された記号に下付き文字ｎが付与された記号を意味する。より具体的にはｙ｛＾｝_ｎは以下の式（２）の記号を意味する。

式（１）における以下の式（３）で表現される項は、ラベル推定モデルの推定結果と教師データとが定性的に一致する場合におけるラベル推定モデルの推定結果と教師データとの間の定量的な違いを示す。

式（１）における以下の式（４）で表現される項は、ラベル推定モデルの推定結果と教師データとが定性的に不一致である場合におけるラベル推定モデルの推定結果と教師データとの間の定量的な違いを示す。

なお、損失関数を小さくするよう更新の具体的な一例は、式（１）が示す損失関数を用いて、ラベル推定モデルが不正解ラベル情報を推定する確率を増大させないようにラベル推定モデルを更新する処理である。不正解ラベル情報は、定性的に教師データと不一致なラベル適正情報である。

ラベル推定装置２は、学習装置１が取得した学習済みラベル推定モデルを用いて、入力された文章情報が示す対象文章に付与されるべきラベルを推定する。より具体的には、ラベル推定装置２は、学習装置１が取得した学習済みラベル推定モデルを用いて、入力された文章情報が示す対象文章に対するラベル候補それぞれのラベル適正度を推定する。

＜モデル学習用データが含むラベル適正情報の生成について＞
モデル学習用データが含むラベル適正情報を生成する方法の一例について説明する。ラベル適正情報は、例えば人手又は装置により、正否情報とラベル共起情報とに基づいて生成される。

正否情報は、モデル学習用データが含む文章情報の示す文章に対して付与される確率の高さに関する所定の条件を満たすラベルを示す情報である。すなわち、正否情報は、モデル学習用データの示す文章に対するラベル適正度の高さに関する所定の条件を満たすラベルを示す情報である。ラベル適正度の高さに関する所定の条件（以下「ラベル適正条件」という。）は、例えば、ラベル適正度が最も高い、という条件である。正否情報は、ラベル適正条件を満たすラベルが複数である場合には、複数のラベルを示してもよい。正否情報は、例えば、付与される確率の最も高いラベルに対応する要素の値のみ１であり、他の要素の値が０である、Ｎ次元のベクトルで表現される。以下、説明の簡単のためラベル適正条件が、ラベル適正度が最も高い、という条件である場合を例に、ラベル推定システム１００を説明する。

ラベル共起情報は、Ｎ個のラベル候補のうちの任意の２つのラベル候補の間の共起の確率を示す情報である。共起の確率とは、具体的には、一方のラベル候補が文章中に出現する場合に、他方のラベル候補が文章中に出現する確率である。なお、ラベル共起情報は、同一のラベル候補間の共起の確率を示してもよい。同一のラベル候補間の共起の確率とは自己相関のことなので、同一のラベル候補間の共起の確率は１である。なお、ラベル共起情報は必ずしも同一のラベル候補間の共起の確率を示す必要は無く、このような場合にはラベル共起情報が示す同一のラベル候補間の共起の確率は、例えば０である。

図２は、実施形態におけるラベル共起情報の一例を示す図である。ラベル共起情報は、例えば要素の値が０以上１以下の正定値行列で表現される。図２の例では、縦と横はそれぞれラベル候補を示し、対角成分は自己相関を示す。

図２のラベル共起情報は、より具体的には、ラベル候補の同士のＰＰＭＩ（Positive Pointwise Mutual Information）スコアを示す行列である。なお、ＰＰＭＩスコアは以下の式（５）で定義される。

式（５）において、ｌ_ｎはインデックスｎのラベル候補を示し、ｌ_ｍはインデックスｍのラベル候補を示す。なお、ｍは、１以上Ｎ以下の整数である。ｍはｎと同じ値であってもよいし異なってもよい。Ｃ（ｌ_ｎ）は、予め用意された複数の所定の文章の集合（以下「事前文章集合」という。）におけるインデクッスｎのラベル候補の出現回数を示す。Ｃ（ｌ_ｍ）は、事前文章集合におけるインデクッスｍのラベル候補の出現回数を示す。Ｃ（ｌ_ｎ、ｌｍ）は、事前文章集合におけるインデックスｎのラベル候補とインデクッスｍのラベル候補との共起回数を示す。

以下、正否情報とラベル共起情報とに基づきラベル適正情報を生成する処理を、ラベル適正情報生成処理という。ラベル適正情報生成処理では、例えば、正否情報を表現するベクトルの要素の値が１であるラベル候補について、他のラベル候補が共起する確率がラベル共起情報を用いて取得される処理が実行される。正否情報を表現するベクトルの要素の値が１のラベル候補が複数の場合には、例えば、要素の値が１の複数のラベル候補について他のラベル候補が共起する確率を取得し、他のラベル候補ごとに共起する確率の和が算出される。ラベル適正情報生成処理では次に、シグモイド関数等の独立変数の値を０以上１以下の所定の値に制限する関数を用いて、他のラベル候補の共起する確率を０以上１以下の値に変換する処理が実行される。

ラベル適正情報生成処理では、正否情報を表現するベクトルについて、正否情報を表現するベクトルの値が０であった要素の値が、変換後の値に置き換えられる処理（以下「置き換え処理」という。）が実行される。置き換え処理によって要素の値が変更された正否情報が、ラベル適正情報である。

図３は、実施形態におけるラベル適正情報生成処理の一例を説明する図である。より具体的には、図３は、ラベル共起情報がラベル候補の同士のＰＰＭＩスコアを示す行列（以下「ＰＰＭＩ行列」という。）である場合を例に、ラベル適正情報生成処理の一例を説明する説明図である。

図３は画像Ｇ１～Ｇ５を示す。画像Ｇ１は、正否情報の一例を示す。画像Ｇ１の正否情報は、ラベル候補として、“スポーツ”、“ビジネス”、”健康”、“ワクチン”及び“感染症”の５つを示す。画像Ｇ１は、”ビジネス”と”感染症”とのラベル適正度が最も高いことを示す。図３において、”ビジネス”と”感染症”とは、ラベル適正条件を満たすラベル候補である。

画像Ｇ２は、ＰＰＭＩ行列の一例を示す。画像Ｇ３は、シグモイド関数を示す。画像Ｇ４は、ＰＰＭＩ行列の行のうち、ラベル適正条件を満たす行のベクトル和を得る処理を表す。具体的には、ラベル候補が”ビジネス”のラベル候補と共起する確率を示す行と、ラベル候補が”感染症”のラベル候補と共起する確率を示す行と、のベクトル和を得る処理を表す。画像Ｇ５は、ラベル適正情報の一例を示す。

ラベル適正情報生成処理では、画像Ｇ４が示すように、ＰＰＭＩ行列における正解ラベルとラベル候補との間の共起の確率を示す行（以下「主共起行」という。）を足し合わせる処理が実行される。以下、ＰＰＭＩ行列における主共起行を足し合わせる処理を、足し合わせ処理という。図３の例では、”ビジネス”と“感染症”とがそれぞれ正解ラベルであり、”ビジネス”の行と”感染症”の行とを足し合わせる処理が足し合わせ処理である。正解ラベルとは、正否情報を示すＮ次元ベクトルの要素に対応するラベル候補のうち値が１の要素に対応するラベル候補である。すなわち、正解ラベルとは、ラベル適正条件を満たすラベル候補である。

足し合わせ処理の実行により、正解ラベルと共起しやすい不正解ラベルのＰＰＭＩスコアを不正解ラベルごとに足し合わせることが行われる。足し合わせの結果得られる情報は、例えばＮ次元のベクトルで表現される。図３の例あれば、“ビジネス”と共起しやすい不正解ラベルのＰＰＭＩスコアと”感染症”と共起しやすい不正解ラベルのＰＰＭＩスコアとを足し合わせることが、足し合わせ処理により行われる。

不正解ラベルは、正否情報を示すＮ次元ベクトルの要素に対応するラベル候補のうち値が０の要素に対応するラベル候補である。すなわち、不正解ラベルとは、ラベル候補のうち正解ラベルではないラベル候補である。図３の例では、”スポーツ”、“健康”、”ワクチン”である。

ラベル適正情報生成処理では、次に、足し合わせ処理の実行により得られたＮ次元のベクトル（以下「足し合わせ結果ベクトル」という。）を画像Ｇ３に示すシグモイド関数に入力することにより、足し合わせ結果ベクトルの各要素の値を０以上１以下の値に正規化する処理が実行される。以下、足し合わせ結果ベクトルをシグモイド関数に入力することにより、足し合わせ結果ベクトルの各要素の値を０～１に正規化する処理を、第１正規化処理という。第１正規化処理は以下の式（６）によって定義される。

Ｐ_ｎｍはＰＰＭＩ行列を意味する。σ（・）は、シグモイド関数を表す。

ラベル適正情報生成処理では第１正規化処理の実行後に、得られたスコアＳ_ｎとベクトルｙ_ｎとを足し合わせる処理（以下「平滑化処理」という。）が実行される。ラベル適正情報生成処理では、第１正規化処理の実行後に、以下の式（７）及び（８）によって示される正規化の処理（以下「第２正規化処理」という。）も実行される。

ｐ´_ｎｍはＰＰＭＩ行列Ｐ´におけるｎ行ｍ列目の要素を意味する。ｙ_ｍは、インデックスがｍの正解ラベルとラベル候補との間の共起の確率を示す行を示すベクトルである。ｓ_ｎは、ベクトルである。αは、平滑化の強度を意味するハイパーパラメータ（0以上1以下の係数）である。αは例えば、スケーリングレートと呼称される０以上１以下の係数である。このように、置き換え処理は、足し合わせ処理、第１正規化処理、平滑化処理及び第２正規化処理を含む。このようにして得られたｙ_ｎ´がラベル適正情報の一例である。

図４は、実施形態における学習装置１のハードウェア構成の一例を示す図である。学習装置１は、バスで接続されたＣＰＵ（Central Processing Unit）等のプロセッサ９１とメモリ９２とを備える制御部１１を備え、プログラムを実行する。学習装置１は、プログラムの実行によって制御部１１、入力部１２、通信部１３、記憶部１４及び出力部１５を備える装置として機能する。

より具体的には、プロセッサ９１が記憶部１４に記憶されているプログラムを読み出し、読み出したプログラムをメモリ９２に記憶させる。プロセッサ９１が、メモリ９２に記憶させたプログラムを実行することによって、学習装置１は、制御部１１、入力部１２、通信部１３、記憶部１４及び出力部１５を備える装置として機能する。

制御部１１は、学習装置１が備える各種機能部の動作を制御する。制御部１１は、例えばモデル学習処理を実行する。制御部１１は、例えばラベル適正情報生成処理を実行してもよい。上述したようにラベル適正情報生成処理は、人手で行われてもよいが、装置が実行してもよい。以下、学習装置１がラベル適正情報生成処理を実行する場合を例に、ラベル推定システム１００を説明する。

制御部１１は、例えば出力部１５の動作を制御する。制御部１１は、例えばモデル学習処理の実行により生じた各種情報を記憶部１４に記録する。制御部１１は、例えば得られたラベル適正情報を記憶部１４に記録する。

入力部１２は、マウスやキーボード、タッチパネル等の入力装置を含んで構成される。入力部１２は、これらの入力装置を学習装置１に接続するインタフェースとして構成されてもよい。入力部１２は、学習装置１に対する各種情報の入力を受け付ける。

通信部１３は、学習装置１を外部装置に接続するための通信インタフェースを含んで構成される。通信部１３は、有線又は無線を介して外部装置と通信する。外部装置は、例えば正否情報の送信元の装置である。外部装置は、例えばラベル共起情報の送信元の装置である。外部装置は、例えばモデル学習用データの送信元の装置である。外部装置は、例えばラベル推定装置２である。なお、正否情報、ラベル共起情報及びモデル学習用データのそれぞれは、必ずしも通信部１３を介して入力される必要は無く、入力部１２に入力されてもよい。

記憶部１４は、磁気ハードディスク装置や半導体記憶装置などのコンピュータ読み出し可能な記憶媒体装置を用いて構成される。記憶部１４は学習装置１に関する各種情報を記憶する。記憶部１４は、例えば入力部１２又は通信部１３を介して入力された情報を記憶する。記憶部１４は、例えばモデル学習処理の実行により生じた各種情報を記憶する。記憶部１４は、例えばラベル適正情報を記憶する。記憶部１４は、予めラベル推定モデルを記憶する。記憶部１４は、得られた学習済みラベル推定モデルを記憶してもよい。

出力部１５は、各種情報を出力する。出力部１５は、例えばＣＲＴ（Cathode Ray Tube）ディスプレイや液晶ディスプレイ、有機ＥＬ（Electro-Luminescence）ディスプレイ等の表示装置を含んで構成される。出力部１５は、これらの表示装置を学習装置１に接続するインタフェースとして構成されてもよい。出力部１５は、例えば入力部１２に入力された情報を出力する。出力部１５は、例えばモデル学習処理の実行結果を表示してもよい。出力部１５は、例えばラベル適正情報を表示してもよい。

図５は、実施形態における制御部１１の構成の一例を示す図である。制御部１１は、ラベル適正情報取得部１１０、モデル学習部１２０、記憶制御部１３０、通信制御部１４０及び出力制御部１５０を備える。

ラベル適正情報取得部１１０は、ラベル適正情報を取得する。ラベル適正情報取得部１１０は、入力部１２又は通信部１３に入力された正否情報及びラベル共起情報に基づき、ラベル適正情報生成処理を実行することでラベル適正情報を取得する。

モデル学習部１２０は、ラベル適正情報と、入力部１２又は通信部１３に入力されたモデル学習用データとを用いて、学習終了条件が満たされるまでラベル推定モデルを更新する。すなわち、モデル学習部１２０は、ラベル適正情報と入力部１２又は通信部１３に入力されたモデル学習用データとを用いてモデル学習処理を実行することで学習済みラベル推定モデルを得る。

記憶制御部１３０は、記憶部１４に各種情報を記録する。通信制御部１４０は通信部１３の動作を制御する。出力制御部１５０は、出力部１５の動作を制御する。

図６は、実施形態における学習装置１が実行する処理の流れの一例を示すフローチャートである。ラベル適正情報取得部１１０がラベル適正情報を取得する（ステップＳ１０１）。次に、入力部又は通信部１３にモデル学習用データが入力される（ステップＳ１０２）。次に、モデル学習部１２０が、モデル学習用データが示す文章情報をラベル推定モデルに入力することで、ラベル適正情報を推定する（ステップＳ１０３）。次にモデル学習部１２０が、モデル学習用データの含むラベル適正情報と、ステップＳ１０３の推定結果とに基づき、ラベル推定モデルを更新する（ステップＳ１０４）。次に、モデル学習部１２０が、学習終了条件が満たされたか否かを判定する（ステップＳ１０５）。学習終了条件が満たされた場合（ステップＳ１０５：ＹＥＳ）、処理が終了する。一方、学習終了条件が満たされない場合（ステップＳ１０５：ＮＯ）、ステップＳ１０２の処理に戻る。

学習終了条件が満たされるまで繰り返される、ステップＳ１０２からステップＳ１０５までの処理が、モデル学習処理の一例である。

図７は、実施形態におけるラベル推定装置２のハードウェア構成の一例を示す図である。ラベル推定装置２は、バスで接続されたＣＰＵ等のプロセッサ９３とメモリ９４とを備える制御部２１を備え、プログラムを実行する。ラベル推定装置２は、プログラムの実行によって制御部２１、入力部２２、通信部２３、記憶部２４及び出力部２５を備える装置として機能する。

より具体的には、プロセッサ９３が記憶部２４に記憶されているプログラムを読み出し、読み出したプログラムをメモリ９４に記憶させる。プロセッサ９３が、メモリ９４に記憶させたプログラムを実行することによって、ラベル推定装置２は、制御部２１、入力部２２、通信部２３、記憶部２４及び出力部２５を備える装置として機能する。

制御部２１は、ラベル推定装置２が備える各種機能部の動作を制御する。制御部２１は、例えば学習済みラベル推定モデルを実行する。制御部２１は、例えば出力部２５の動作を制御する。制御部２１は、例えば学習済みラベル推定モデルの実行により生じた各種情報を記憶部２４に記録する。

入力部２２は、マウスやキーボード、タッチパネル等の入力装置を含んで構成される。入力部２２は、これらの入力装置をラベル推定装置２に接続するインタフェースとして構成されてもよい。入力部２２は、ラベル推定装置２に対する各種情報の入力を受け付ける。

通信部２３は、ラベル推定装置２を外部装置に接続するための通信インタフェースを含んで構成される。通信部２３は、有線又は無線を介して外部装置と通信する。外部装置は、例えば文章情報の送信元の装置である。外部装置は、例えば学習装置１である。通信部２３は、学習装置１との通信により、学習済みラベル推定モデルを取得する。なお、文章情報は、必ずしも通信部２３に入力される必要は無く、入力部２２に入力されてもよい。

記憶部２４は、磁気ハードディスク装置や半導体記憶装置などのコンピュータ読み出し可能な記憶媒体装置を用いて構成される。記憶部２４はラベル推定装置２に関する各種情報を記憶する。記憶部２４は、例えば入力部２２又は通信部２３を介して入力された情報を記憶する。記憶部２４は、例えば学習済みラベル推定モデルの実行により生じた各種情報を記憶する。記憶部２４は、学習済みラベル推定モデルを記憶する。

出力部２５は、各種情報を出力する。出力部２５は、例えばＣＲＴディスプレイや液晶ディスプレイ、有機ＥＬディスプレイ等の表示装置を含んで構成される。出力部２５は、これらの表示装置をラベル推定装置２に接続するインタフェースとして構成されてもよい。出力部２５は、例えば入力部２２に入力された情報を出力する。出力部２５は、例えば学習済みラベル推定モデルの実行結果を表示してもよい。

図８は、実施形態における制御部２１の構成の一例を示す図である。制御部２１は、対象取得部２１０、推定部２２０、記憶制御部２３０、通信制御部２４０及び出力制御部２５０を備える。対象取得部２１０は、入力部２２又は通信部２３に入力された文章情報を取得する。

推定部２２０は、対象取得部２１０の取得した文章情報に対して学習済みラベル推定モデルを実行する。推定部２２０は、学習済みラベル推定モデルの実行により、対象取得部２１０の取得した文章情報に対するラベル適正情報を推定する。

記憶制御部２３０は、記憶部２４に各種情報を記録する。通信制御部２４０は通信部２３の動作を制御する。出力制御部２５０は、出力部２５の動作を制御する。

図９は、実施形態におけるラベル推定装置２が実行する処理の流れの一例を示すフローチャートである。対象取得部２１０が、入力部２２又は通信部２３に入力された文章情報を取得する（ステップＳ２０１）。次に推定部２２０が、学習済みラベル推定モデルを実行することで、対象取得部２１０の取得した文章情報に対するラベル適正情報を推定する（ステップＳ２０２）。次に出力制御部２５０が出力部２５の動作を制御して、取得されたラベル適正情報を出力部２５に出力させる（ステップＳ２０３）。

（実験結果）
ここで、ラベル推定システム１００を用いた実験の結果について説明する。実験では、データセットとしてマルチラベル分類で用いられるベンチマークが使用された。具体的には、Reuters-21578と、Arxiv Academic Paper Dataset（AAPD）と、20Newsgroupsと、の３つが用いられた。実験では、機械学習のモデルとして自然言語処理で用いられる機械学習のモデルが用いられた。具体的には、ＢＥＲＴ（Bidirectional Encoder Representations from Transformers）と、Ｂｉ－ＬＳＴＭ（Long Short Term Memory）と、ＣＮＮ（Convolution Neural Network）とが用いられた。実験では、評価指標として、Ｍｉｃｒｏ－ｆ１と、Ｍａｃｒｏ－ｆ１とが用いられた。

図１０は、実施形態のラベル推定システム１００を用いた実験結果の一例を示す第１の図である。図１０における“Method”の欄が“BERT w/ALS”、”LSTM w/ALS”、”CNN w/ALS”である各行は、ラベル推定システム１００を用いた結果を示す。“Method”の欄が”BERT only”、”LSTM only”、”CNN only”である各行は、ラベル適正情報を用いず正否情報を用いて得られた学習済みラベル推定モデルによる推定の結果を示す。

なお、“BERT w/ALS”及び”BERT only”における”BERT”は、実験で用いられた機械学習のモデルがＢＥＲＴであったことを示す。なお、“LSTM w/ALS”及び”LSTM only”における”LSTM”は、実験で用いられた機械学習のモデルがＢｉ－ＬＳＴＭであったことを示す。なお、“CNN w/ALS”及び”CNN only”における”CNN”は、実験で用いられた機械学習のモデルがＣＮＮであったことを示す。

”Rueters-21578”の“Macro-f1”は、用いられたデータセットがReuters-21578の場合におけるMacor-f1の値を示す。”Rueters-21578”の“Micro-f1”は、用いられたデータセットがReuters-21578の場合におけるMicor-f1の値を示す。”AAPD”の“Macro-f1”は、用いられたデータセットがAAPDの場合におけるMacor-f1の値を示す。”AAPD”の“Micro-f1”は、用いられたデータセットがAAPDの場合におけるMicor-f1の値を示す。”20Newsgroups”の”Macro-f1”は、用いられたデータセットが20Newsgroupsの場合におけるMacor-f1の値を示す。”20Newsgroups”の”Micro-f1”は、用いられたデータセットが20Newsgroupsの場合におけるMicor-f1の値を示す。

図１０の結果は、異なるランダムシードで５回実験が行われた結果を示す。図１０における、かっこ内の数値は標準偏差を示す。図１０の結果は、ＣＮＮやＢｉ－ＬＳＴＭ等の特定の機械学習のモデルによらずラベル推定システム１００が高い精度でラベルを推定可能であることを示す。

図１１は、実施形態のラベル推定システム１００を用いた実験結果の一例を示す第２の図である。より具体的には、図１１は、低頻度のラベル候補の推定の精度を実験で評価した結果を示す。なお図１０は、低頻度のラベル候補と低頻度ではないラベル候補との両者の推定の精度を実験で評価した結果を示す。なお、低頻度のラベル候補とは、複数のラベル候補のうち、データセット内の出現回数の順位が中央より下の順位のラベル候補を意味する。

図１１における“Method”の欄が“BERT w/ALS”、”LSTM w/ALS”、”CNN w/ALS”である各行は、ラベル推定システム１００を用いた結果を示す。“Method”の欄が”BERT only”、”LSTM only”、”CNN only”である各行は、ラベル適正情報を用いず正否情報を用いて得られた学習済みラベル推定モデルによる推定の結果を示す。

図１１の結果は、異なるランダムシードで５回実験が行われた結果を示す。図１１における、かっこ内の数値は標準偏差を示す。図１１の結果は、ＣＮＮやＢｉ－ＬＳＴＭ等の特定の機械学習のモデルによらず、低頻度のラベル候補の推定についても、ラベル推定システム１００が高い精度で推定可能であることを示す。

図１２は、実施形態のラベル推定システム１００を用いた実験結果の一例を示す第３の図である。図１２の横軸は、学習回数を示す。図１２の縦軸は、Ｍｉｃｒｏ－ｆ１の値を示す。”CNN only(train)”は、ラベル適正情報を用いず正否情報を用いて得られた学習済みラベル推定モデルによる学習データの推定の結果を示す。”CNN only(valid)”は、ラベル適正情報を用いず正否情報を用いて得られた学習済みラベル推定モデルによる開発データの推定の結果を示す。”CNN with ALS(train)”は、ラベル推定システム１００を用いた学習データの推定の結果を示す。”CNN with ALS(valid)”は、ラベル推定システム１００を用いた開発データの推定の結果を示す。なお、開発データとは、１回の学習ごとのラベル推定システム１００の推定の精度を測定するための実験における学習で用いられる学習データである。

図１２の結果は、ラベル適正情報を用いず正否情報を用いた学習よりも、ラベル推定システム１００の学習の方が、学習の初期段階で過学習を抑制可能であることを示す。

このように構成された実施形態における学習装置１は、ラベル適正情報を用いて学習済みラベル推定モデルを得る。そのため、ラベル適正情報ではなく正否情報だけに基づいて学習済みラベル推定モデルを得る装置よりも多くの付与されるべきラベルを高い精度で推定する数理モデルを得ることができる。その結果、学習装置１は、ラベルの推定する作業に要する労力の増大を抑制することができる。

また、このように構成された実施形態におけるラベル推定装置２は、ラベル適正情報を用いて得られた学習済みラベル推定モデルを用いて、文章に付与されるべきラベルを推定する。そのため、ラベル適正情報ではなく正否情報だけに基づいて得られた学習済みラベル推定モデルを得る装置と比べて、より多くの付与されるべきラベルを高い精度で推定することができる。その結果、ラベル推定装置２は、ラベルの推定する作業に要する労力の増大を抑制することができる。

（変形例）
なお、上述したように、ラベル適正情報は、人手で生成されてもよい。このような場合、入力部１２又は通信部１３には、正否情報及びラベル共起情報に代えてラベル適正情報が入力される。このような場合、ラベル適正情報取得部１１０は、正否情報及びラベル共起情報に基づいてラベル適正情報を取得することに代えて、入力部１２又は通信部１３に入力されたラベル適正情報を取得することを実行する。

出力制御部２５０は、推定部２２０は推定結果のラベル適正情報のうち、予め定められたラベルをジャンルとして出力部２５に出力してもよい。

上述したようにラベル適正情報の示すラベル適正度は、一例として、例えば０以上１以下の値で示される。しかしながらラベル適正度は、必ずしも０以上１以下の値で示される必要は無い。したがって、ラベル適正情報を表現するＮ次元のベクトルの各要素の値は、負の値を含んでもよい。上段の記載でラベル適正情報生成処理の一例を説明したが、そこではシグモイド関数等の独立変数の値を０以上１以下の所定の値に制限する関数を用いる処理を一例として説明した。これは、ラベル適正度が０以上１以下の値で示される場合を例にした処理の一例である。したがって、ラベル適正度が０以上１以下の値でなくてもよい場合には、シグモイド関数等の独立変数の値を０以上１以下の所定の値に制限する関数を用いる処理が行われる必要は無い。

制御部２１は、更に文章類似度推定部２６０と重要語句抽出部２７０とのいずれか一方又は両方を備えてもよい。以下、文章類似度推定部２６０と重要語句抽出部２７０とを備える制御部２１を制御部２１ａという。図１３は、変形例における制御部２１ａの構成の一例を示す図である。制御部２１ａは、文章類似度推定部２６０と重要語句抽出部２７０とを備える点で、制御部２１と異なる。

文章類似度推定部２６０は、２つの文章情報の類似の度合（以下「文章類似度」という。）を推定する。２つの文章情報は少なくとも一方が、対象取得部２１０の取得した文章情報である。したがって、２つの文章情報は、どちらも対象取得部２１０の取得した文章情報であってもよいし、一方が対象取得部２１０の取得した文章情報であって他方が予め記憶部２４に記憶済みの文章情報であってもよい。文章類似度推定部２６０は、２つの文章情報をそれぞれ推定部２２０に入力し、推定部２２０にどちらについてもラベル適正情報を推定させる。文章類似度推定部２６０は、推定部２２０の推定した２つのラベル適正情報に基づき、ラベル適正情報の一致の度合を２つの文章情報の文章類似度として取得する。文章類似度推定部２６０は、例えば、２つのラベル適正情報それぞれに対応する各ベクトルの内積の値を文章類似度として取得する。

文章類似度推定部２６０は、取得した文章類似度が所定の度合以上である場合に、２つの文章情報を類似した文章情報であると判定してもよい。このような場合、出力制御部２５０は、文章類似度推定部２６０によって類似した文章情報であると判定された２つの文章情報の一方又は両方を出力部２５に出力させてもよい。

重要語句抽出部２７０は、日本語自然言語処理オープンソースライブラリのＧｉＮＺＡを用いて、文章情報の示す文章中の重要語句を取得する。出力制御部２５０は、重要語句抽出部２７０の取得した重要語句を出力部２５に出力させてもよい。

なお、学習装置１は、ネットワークを介して通信可能に接続された複数台の情報処理装置を用いて実装されてもよい。この場合、学習装置１が備える各機能部は、複数の情報処理装置に分散して実装されてもよい。

なお、ラベル推定装置２は、ネットワークを介して通信可能に接続された複数台の情報処理装置を用いて実装されてもよい。この場合、ラベル推定装置２が備える各機能部は、複数の情報処理装置に分散して実装されてもよい。

なお、学習装置１と、ラベル推定装置２と、の各機能の全て又は一部は、ＡＳＩＣ（Application Specific Integrated Circuit）やＰＬＤ（Programmable Logic Device）やＦＰＧＡ（Field Programmable Gate Array）等のハードウェアを用いて実現されてもよい。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。プログラムは、電気通信回線を介して送信されてもよい。

なお、対象取得部２１０の取得する文章情報は対象情報の一例である。対象取得部２１０の取得した文章情報の示す文章は処理対象の一例である。

以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

１００…ラベル推定システム、１…学習装置、２…ラベル推定装置、１１…制御部、１２…入力部、１３…通信部、１４…記憶部、１５…出力部、１１０…ラベル適正情報取得部、１２０…モデル学習部、１３０…記憶制御部、１４０…通信制御部、１５０…出力制御部、２１…制御部、２２…入力部、２３…通信部、２４…記憶部、２５…出力部、２１０…対象取得部、２２０…推定部、２３０…記憶制御部、２４０…通信制御部、２５０…出力制御部、９１…プロセッサ、９２…メモリ、９３…プロセッサ、９４…メモリ、２１ａ…制御部、２６０…文章類似度推定部、２７０…重要語句抽出部

Claims

文章を示す文章情報と前記文章に付与されるラベルの候補として予め定められた複数のラベルについて前記文章のラベルとして適切である度合を示すラベル適正情報とを含むモデル学習用データを用いた機械学習の方法により、入力された文章情報が示す文章に付与されるべきラベルを推定する数理モデルであるラベル推定モデルを更新するモデル学習部、
を備え、
前記ラベル適正情報は、前記モデル学習用データの示す文章に対して付与される確率の高さに関する所定の条件を満たすラベルを示す正否情報と、前記文章に付与されるラベルの候補として予め定められた複数の各ラベルのうちの任意の２つの間の共起の確率を示す情報であるラベル共起情報と、に基づいて得られた情報である、
学習装置。
前記所定の条件は、モデル学習用データの示す文章に対して付与される確率が最も高い、という条件である、
請求項１に記載の学習装置。
処理対象の文章を示す情報である対象情報を取得する対象取得部と、
文章を示す文章情報と前記文章に付与されるラベルの候補として予め定められた複数のラベルについて前記文章のラベルとして適切である度合を示すラベル適正情報とを含むモデル学習用データを用いた機械学習の方法により、入力された文章情報が示す文章に付与されるべきラベルを推定する数理モデルであるラベル推定モデルを更新するモデル学習部、を備え、前記ラベル適正情報は、前記モデル学習用データの示す文章に対して付与される確率の高さに関する所定の条件を満たすラベルを示す正否情報と、前記文章に付与されるラベルの候補として予め定められた複数の各ラベルのうちの任意の２つの間の共起の確率を示す情報であるラベル共起情報と、に基づいて得られた情報である学習装置が得た、学習済みのラベル推定モデルを用いて、前記対象取得部の取得した対象情報が示す文章に付与されるべきラベルを推定する、推定部と、
を備えるラベル推定装置。
請求項１又は２に記載の学習装置としてコンピュータを機能させるためのプログラム。
請求項３に記載のラベル推定装置としてコンピュータを機能させるためのプログラム。