Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6947768B2 - Estimator, estimation method and estimation program - Google Patents
[go: Go Back, main page]

JP6947768B2 - Estimator, estimation method and estimation program - Google Patents

Estimator, estimation method and estimation program Download PDF

Info

Publication number
JP6947768B2
JP6947768B2 JP2019032116A JP2019032116A JP6947768B2 JP 6947768 B2 JP6947768 B2 JP 6947768B2 JP 2019032116 A JP2019032116 A JP 2019032116A JP 2019032116 A JP2019032116 A JP 2019032116A JP 6947768 B2 JP6947768 B2 JP 6947768B2
Authority
JP
Japan
Prior art keywords
information
classification
model
target
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019032116A
Other languages
Japanese (ja)
Other versions
JP2020135770A (en
Inventor
孝太 坪内
孝太 坪内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2019032116A priority Critical patent/JP6947768B2/en
Publication of JP2020135770A publication Critical patent/JP2020135770A/en
Application granted granted Critical
Publication of JP6947768B2 publication Critical patent/JP6947768B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、推定装置、推定方法および推定プログラムに関する。 The present invention relates to an estimation device, an estimation method and an estimation program.

近年、多段に接続されたニューロンを有するDNN(Deep Neural Network)等のモデルを利用して言語認識や画像認識等といった各種分類処理を実現する技術が知られている。例えば、このような技術では、所定の入力情報をモデルに入力した際に、その入力情報に対応する出力情報として利用者が所望する出力情報を出力するように、モデルが有するノード間の重み係数(接続係数)を修正することで、入力情報が有する特徴をモデルに学習させる。 In recent years, there have been known techniques for realizing various classification processes such as language recognition and image recognition using a model such as DNN (Deep Neural Network) having neurons connected in multiple stages. For example, in such a technique, when a predetermined input information is input to the model, the weight coefficient between the nodes of the model is output so that the output information desired by the user is output as the output information corresponding to the input information. By modifying (connection coefficient), the model is made to learn the characteristics of the input information.

特開2017−162074号公報Japanese Unexamined Patent Publication No. 2017-162074

しかしながら、上述した学習技術では、モデルがどのような特徴を学習しているかを確認することが難しい場合がある。 However, with the above-mentioned learning technique, it may be difficult to confirm what kind of features the model is learning.

例えば、上述した学習が行われたモデルは、入力情報が有する特徴に応じた出力情報を出力する。しかしながら、このようなモデルは、入力情報が有する特徴のうち、利用者が想定している特徴に応じて出力情報を出力しているのか、利用者が想定していない特徴に応じて出力情報を出力しているのかが不明である。このため、上述した学習が行われたモデルは、利用者が予期しない出力情報を出力してしまう恐れがある。 For example, the trained model described above outputs output information according to the characteristics of the input information. However, among the features of the input information, such a model outputs the output information according to the features assumed by the user, or outputs the output information according to the features not assumed by the user. It is unknown whether it is outputting. Therefore, the model in which the above-mentioned learning is performed may output unexpected output information to the user.

本願は、上記に鑑みてなされたものであって、モデルが学習した特徴を示す情報を提供することを目的とする。 The present application has been made in view of the above, and an object of the present application is to provide information indicating the features learned by the model.

本願に係る推定装置は、分類対象に関する対象情報が入力されると当該分類対象の分類を示す出力情報を出力するモデルにより対象情報から類似する出力情報が出力された複数の分類対象を特定する特定部と、前記特定部により特定された複数の分類対象の対象情報に基づいて、前記モデルが前記分類対象を分類する際の指標を推定する推定部とを有することを特徴とする。 The estimation device according to the present application identifies a plurality of classification targets for which similar output information is output from the target information by a model that outputs output information indicating the classification of the classification target when the target information regarding the classification target is input. It is characterized by having a unit and an estimation unit that estimates an index when the model classifies the classification object based on the target information of a plurality of classification objects specified by the specific unit.

実施形態の一態様によれば、モデルが学習した特徴を示す情報を提供することができる。 According to one aspect of the embodiment, it is possible to provide information indicating the features learned by the model.

図1は、実施形態に係る情報提供装置が実行する推定処理の一例を示す図である。FIG. 1 is a diagram showing an example of estimation processing executed by the information providing device according to the embodiment. 図2は、実施形態に係る情報提供装置が異なるグループの比較結果に基づいて実行する推定処理の一例を示す図である。FIG. 2 is a diagram showing an example of estimation processing executed by the information providing device according to the embodiment based on the comparison result of different groups. 図3は、実施形態に係る情報提供装置の構成例を示す図である。FIG. 3 is a diagram showing a configuration example of the information providing device according to the embodiment. 図4は、実施形態に係る利用者データベースの一例を示す図である。FIG. 4 is a diagram showing an example of a user database according to the embodiment. 図5は、実施形態に係るモデルデータベースの一例を示す図である。FIG. 5 is a diagram showing an example of a model database according to the embodiment. 図6は、実施形態に係る推定処理の流れの一例を示すフローチャートである。FIG. 6 is a flowchart showing an example of the flow of the estimation process according to the embodiment. 図7は、ハードウェア構成の一例を示す図である。FIG. 7 is a diagram showing an example of a hardware configuration.

以下に、本願に係る推定装置、推定方法および推定プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る推定装置、推定方法および推定プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。 Hereinafter, a mode for carrying out the estimation device, the estimation method, and the estimation program according to the present application (hereinafter, referred to as “the embodiment”) will be described in detail with reference to the drawings. Note that this embodiment does not limit the estimation device, estimation method, and estimation program according to the present application. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description will be omitted.

[実施形態]
〔1.情報提供装置の一例について〕
まず、図1を用いて、推定装置の一例として、情報提供装置10の一例について説明する。図1は、実施形態に係る情報提供装置が実行する推定処理の一例を示す図である。なお、図1に示す例では、推定処理の一例として、利用者のサイコグラフィック属性、デモグラフィック属性、検索履歴、購買履歴、若しくは閲覧履歴等、利用者に関する各種の情報である利用者情報から利用者の分類を行うモデルについて、モデルがどのような指標に従って利用者の分類を行うかを推定する処理の流れについて記載したが、実施形態は、これに限定されるものではない。後述する説明で明らかとなるように、情報提供装置10は、利用者以外にも、各種のコンテンツ等といった任意の分類対象について、推定処理を実行することが可能である。
[Embodiment]
[1. About an example of information providing device]
First, an example of the information providing device 10 will be described with reference to FIG. 1 as an example of the estimation device. FIG. 1 is a diagram showing an example of estimation processing executed by the information providing device according to the embodiment. In the example shown in FIG. 1, as an example of the estimation process, it is used from the user information which is various information about the user such as the user's psychographic attribute, demographic attribute, search history, purchase history, or browsing history. Regarding the model for classifying users, the flow of processing for estimating the index according to which index the model classifies users has been described, but the embodiment is not limited to this. As will be clarified in the explanation described later, the information providing device 10 can execute the estimation process for any classification target such as various contents other than the user.

情報提供装置10は、推定処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、情報提供装置10は、各種の事業者が用いる外部端末101、102、201、202とインターネット等のネットワークN(例えば、図6参照)を介して通信可能である。なお、情報提供装置10は、任意の数の外部端末101、102、201、202と通信可能であってよい。 The information providing device 10 is an information processing device that executes estimation processing, and is realized by, for example, a server device, a cloud system, or the like. For example, the information providing device 10 can communicate with external terminals 101, 102, 201, 202 used by various businesses via a network N (for example, see FIG. 6) such as the Internet. The information providing device 10 may be capable of communicating with an arbitrary number of external terminals 101, 102, 201, 202.

外部端末101、102、201、202は、各種の事業者が利用する情報処理装置であり、サーバ装置やクラウドシステム等により実現される。例えば、外部端末101、102(以下、「外部端末100」と記載する場合がある。)は、各種の情報を情報提供装置10へと登録する登録側の事業者が利用する情報処理装置である。また、外部端末201、202(以下、「外部端末200」と記載する場合がある。)は、情報提供装置10から情報の提供を受ける事業者が利用する情報処理装置である。なお、外部端末100は、外部端末200として動作してもよく、外部端末200は、外部端末100として動作してもよい。すなわち、外部端末100、200は、情報提供装置10と異なる事業者により利用される情報処理装置であれば、任意の情報処理装置が採用可能である。 The external terminals 101, 102, 201, and 202 are information processing devices used by various businesses, and are realized by a server device, a cloud system, or the like. For example, the external terminals 101 and 102 (hereinafter, may be referred to as "external terminal 100") are information processing devices used by a business operator on the registration side that registers various types of information in the information providing device 10. .. Further, the external terminals 201 and 202 (hereinafter, may be referred to as "external terminal 200") are information processing devices used by a business operator who receives information from the information providing device 10. The external terminal 100 may operate as the external terminal 200, and the external terminal 200 may operate as the external terminal 100. That is, as the external terminals 100 and 200, any information processing device can be adopted as long as it is an information processing device used by a business operator different from the information providing device 10.

なお、各事業者は、任意の事業に関する事業者であってよい。例えば、各事業者は、自動車や食料品等といった任意の各種商品の製造業であってもよく、これら商品の販売業に関する事業者であってもよい。また、各事業者は、各種サービスの提供を行う事業者であってもよい。 In addition, each business operator may be a business operator related to any business. For example, each business operator may be a manufacturing industry of arbitrary various products such as automobiles and groceries, or may be a business operator related to a sales business of these products. In addition, each business operator may be a business operator that provides various services.

〔1−1.情報提供装置が提供する提供処理について〕
ここで、情報提供装置10が実行する推定処理の説明に先駆けて、情報提供装置10が実行する提供処理の一例について説明する。例えば、情報提供装置10は、各事業者により登録された情報を他の事業者に対して提供する提供処理を実行する。すなわち、情報提供装置10は、各事業者が所有する情報の集約化や共有化を促進する情報共有サービスを提供する。
[1-1. About the provision process provided by the information providing device]
Here, an example of the provision process executed by the information providing device 10 will be described prior to the explanation of the estimation process executed by the information providing device 10. For example, the information providing device 10 executes a providing process of providing information registered by each business operator to another business operator. That is, the information providing device 10 provides an information sharing service that promotes the aggregation and sharing of information owned by each business operator.

以下、提供処理の流れの一例について説明する。例えば、外部端末100は、各種の情報収集技術を用いて、利用者情報の収集を行う(ステップS1)。例えば、外部端末100は、利用者U1の利用者情報である利用者情報#U1や、利用者U2の利用者情報である利用者情報#U2を収集する。なお、外部端末100は、サービスの提供先となる利用者の利用者情報を収集してもよく、各種情報提供サービスを介して収集された利用者情報を収集してもよい。続いて、外部端末100は、利用者情報に基づいた分類を行うモデルの生成を行う(ステップS2)。例えば、外部端末100は、自社事業に供する為、各種任意の分類を行うためのモデルの生成を行う。 Hereinafter, an example of the flow of the provision process will be described. For example, the external terminal 100 collects user information by using various information collecting techniques (step S1). For example, the external terminal 100 collects user information # U1 which is user information of user U1 and user information # U2 which is user information of user U2. The external terminal 100 may collect user information of a user who is a service provider, or may collect user information collected through various information providing services. Subsequently, the external terminal 100 generates a model for classification based on user information (step S2). For example, the external terminal 100 generates a model for performing various arbitrary classifications in order to provide it for its own business.

例えば、外部端末100は、利用者情報を入力した際に事業者が所望する内容の出力情報を出力するように、収集した利用者情報を学習データとして、モデルの学習を行う。例えば、外部端末100は、利用者情報を入力した際に、その利用者情報と対応する利用者に対して自社の広告を提供するか否かを示す出力情報を出力するように、モデルの学習を行ってもよい。また、外部端末100は、所定の種別の利用者情報(例えば、利用者が入力した検索クエリの履歴)を入力した際に、他の種別の利用者情報(例えば、利用者の趣味趣向を示す情報)を出力するように、モデルの学習を行ってもよい。また、外部端末100は、利用者情報を入力した際に、自社の商品に興味を有するか否かを示す出力情報を出力するように、モデルの学習を行ってもよい。すなわち、外部端末100は、分類対象となる利用者に関する情報を入力としたモデルの学習を行うのであれば、任意の目的に用いられるモデルの学習を行ってもよい。 For example, the external terminal 100 learns the model using the collected user information as learning data so as to output the output information of the content desired by the business operator when the user information is input. For example, when the external terminal 100 inputs user information, it learns a model so as to output output information indicating whether or not to provide its own advertisement to the user corresponding to the user information. May be done. Further, when the external terminal 100 inputs the user information of a predetermined type (for example, the history of the search query input by the user), the external terminal 100 indicates the user information of another type (for example, the hobby and taste of the user). The model may be trained so as to output information). Further, the external terminal 100 may learn the model so as to output output information indicating whether or not the user is interested in the company's product when the user information is input. That is, the external terminal 100 may learn the model used for any purpose as long as it learns the model by inputting the information about the user to be classified.

なお、このようなモデルは、例えば、複数のノードを多段に接続した所謂DNN(Deep Neural Network)により実現可能である。例えば、外部端末100は、バックプロパゲーション等といった各種任意の学習手法により、モデルの学習を行うこととなる。また、このようなモデルは、入力された利用者情報が有する特徴に基づいた各種の分類を実行し、実行結果を出力することで、単純な利用者の分類のみならず、利用者に関する情報の推定等といった処理を実現することができる。換言すると、モデルは、利用目的に応じた指標により、入力された情報の分類を行うことで、各種の処理を実現することができる。 It should be noted that such a model can be realized by, for example, a so-called DNN (Deep Neural Network) in which a plurality of nodes are connected in multiple stages. For example, the external terminal 100 learns the model by various arbitrary learning methods such as backpropagation. In addition, such a model executes various classifications based on the characteristics of the input user information and outputs the execution result, so that not only the simple user classification but also the information about the user can be obtained. Processing such as estimation can be realized. In other words, the model can realize various processes by classifying the input information according to the index according to the purpose of use.

続いて、外部端末100は、生成したモデルや利用者情報を情報提供装置10に登録する(ステップS3)。なお、外部端末100は、モデルの生成を行わず、利用者情報のみの登録を行ってもよい。また、外部端末100は、モデルのみの登録を行ってもよい。一方、情報提供装置10は、自装置でも各種の利用者情報を収集する(ステップS4)。立てば、情報提供装置10は、外部端末100を利用する利用者とは異なる情報経路を介して、利用者情報の収集を行う。この結果、情報提供装置10は、外部端末100とは異なる内容の利用者情報を収集することとなる。例えば、情報提供装置10は、外部端末100が収集していなかった種別の情報を収集してもよく、外部端末100と同一の種別の情報を収集してもよい。 Subsequently, the external terminal 100 registers the generated model and user information in the information providing device 10 (step S3). The external terminal 100 may register only the user information without generating the model. Further, the external terminal 100 may register only the model. On the other hand, the information providing device 10 also collects various user information even in its own device (step S4). When standing up, the information providing device 10 collects user information via an information route different from that of the user who uses the external terminal 100. As a result, the information providing device 10 collects user information having contents different from those of the external terminal 100. For example, the information providing device 10 may collect information of a type that was not collected by the external terminal 100, or may collect information of the same type as that of the external terminal 100.

続いて、情報提供装置10は、外部端末200からモデルの利用目的を取得する(ステップS5)。例えば、情報提供装置10は、入力情報と、その入力情報を入力した際にどのような出力情報を出力させたいかを利用目的として取得する。このような場合、情報提供装置10は、利用目的に応じて、利用者情報に基づいた分類を行うモデルの抽出や生成等を行う(ステップS6)。例えば、情報提供装置10は、外部端末100が登録したモデルの中から、利用目的を満たすモデルの抽出を行ってもよく、外部端末100が登録した利用者情報や情報提供装置10が収集した利用者情報から、利用目的を満たすモデルの学習を行ってもよい。また、情報提供装置10は、外部端末100が登録したモデルから新たなモデルの生成を行ってもよい。そして、情報提供装置10は、生成若しくは抽出したモデルを外部端末200に提供する(ステップS7)。 Subsequently, the information providing device 10 acquires the purpose of use of the model from the external terminal 200 (step S5). For example, the information providing device 10 acquires the input information and what kind of output information is desired to be output when the input information is input for the purpose of use. In such a case, the information providing device 10 extracts and generates a model for classification based on the user information according to the purpose of use (step S6). For example, the information providing device 10 may extract a model satisfying the purpose of use from the models registered by the external terminal 100, and the user information registered by the external terminal 100 and the use collected by the information providing device 10. A model that satisfies the purpose of use may be learned from the person information. Further, the information providing device 10 may generate a new model from the model registered by the external terminal 100. Then, the information providing device 10 provides the generated or extracted model to the external terminal 200 (step S7).

なお、情報提供装置10は、外部端末200に対し、外部端末100が収集した利用者情報の提供を行ってもよい。また、情報提供装置10は、利用者情報を統計処理した各種の統計情報を提供する処理を行ってもよい。また、情報提供装置10は、複数の外部端末100が登録した利用者情報、すなわち、複数の事業者がそれぞれ個別に収集した利用者情報を用いてモデルの学習を行ってもよく、これらの利用者情報を提供してもよい。また情報提供装置10は、各利用者情報やモデルの利用に対する対価を外部端末200から受付け、受付けた対価の一部を、利用した利用者情報やモデルを登録した事業者に対して提供してもよい。 The information providing device 10 may provide the user information collected by the external terminal 100 to the external terminal 200. Further, the information providing device 10 may perform a process of providing various statistical information obtained by statistically processing the user information. Further, the information providing device 10 may learn the model by using the user information registered by the plurality of external terminals 100, that is, the user information individually collected by the plurality of businesses, and use these. Person information may be provided. Further, the information providing device 10 receives the consideration for the use of each user information and the model from the external terminal 200, and provides a part of the received consideration to the business operator who registered the used user information and the model. May be good.

このような提供処理により、情報提供装置10は、各事業者が所有する情報の有効活用を実現することができる。また、DNN等に対して利用者情報の特徴を学習させた場合、このような特徴や特徴に基づいた分類処理は、DNNを構成する接続係数の羅列により実演されるため、学習データとして用いた利用者情報の内容を隠ぺいすることができる。この結果、各利用者のプライバシーを保持しつつ、利用者情報の有効利用を促進することができる。 Through such a provision process, the information providing device 10 can realize effective utilization of the information owned by each business operator. Further, when the characteristics of the user information are learned by DNN or the like, the classification process based on such characteristics and characteristics is demonstrated by the enumeration of the connection coefficients constituting the DNN, and thus is used as the learning data. The contents of user information can be hidden. As a result, it is possible to promote the effective use of user information while maintaining the privacy of each user.

〔1−2.モデルについて〕
このように、DNN等のモデルは、特徴に基づいた分類処理が接続係数の羅列により実現されるので、モデルそのものを解析したとしても、モデルがどのような指標に基づいて分類処理を行うのかが明確ではない。このため、利用したいモデルがどのような特徴を学習しているかを確認することが難しい場合がある。このように、モデルがどのような特徴を学習しているのか、モデルがどのような指標に基づいて分類処理を行っているのかが明確ではない場合、利用者の安全に関する利用目的に供することは、困難となる。
[1-2. About the model]
In this way, in a model such as DNN, classification processing based on features is realized by a list of connection coefficients, so even if the model itself is analyzed, what kind of index the model performs classification processing is based on. Not clear. Therefore, it may be difficult to confirm what kind of features the model to be used is learning. In this way, if it is not clear what kind of features the model is learning and what kind of index the model is based on, it can be used for the purpose of use related to user safety. , Will be difficult.

以下、モデルが利用者を分類する際の指標について、具体例を説明する。なお、以下の説明では、分類を行う際の指標を「分類指標」と記載する場合がある。例えば、第1事業者は、利用者情報として、利用者の属性情報を収集するとともに、各利用者が所定の広告を選択したか否かを収集する。そして、第1事業者は、利用者の属性情報をモデルに入力した際に、その利用者が所定のカテゴリに属する広告を選択したか否かを示す出力情報を出力するように、モデルの学習を行う。このような学習処理の結果、第1事業者は、利用者の属性情報に基づいて、所定のカテゴリに属する広告を気に入るか否かの分類処理を実現するモデルを生成することができる。 Hereinafter, specific examples of indicators when the model classifies users will be described. In the following description, the index for classification may be described as "classification index". For example, the first business operator collects user attribute information as user information and collects whether or not each user has selected a predetermined advertisement. Then, the first business operator learns the model so that when the attribute information of the user is input to the model, the output information indicating whether or not the user has selected an advertisement belonging to a predetermined category is output. I do. As a result of such a learning process, the first business operator can generate a model that realizes a classification process of whether or not to like an advertisement belonging to a predetermined category based on the attribute information of the user.

しかしながら、このような学習が行われたモデルは、ルールベースで動作するモデルとは異なり、属性情報の特徴に基づいて、所定のカテゴリに属する広告を気に入るか否かの分類処理を行うこととなる。このため、このモデルをしたい第2事業者は、どのような属性情報を有する利用者を、所定のカテゴリに属する広告を気に入る利用者として分類するかを識別することが困難となる。 However, unlike the model that operates on a rule basis, the model in which such learning is performed is classified based on the characteristics of the attribute information to determine whether or not the advertisement belonging to a predetermined category is liked. .. Therefore, it is difficult for the second business operator who wants to use this model to identify what kind of attribute information the user has to classify the advertisement belonging to the predetermined category as a favorite user.

より具体的な例を説明する。例えば、「ラーメンに関する広告を選択した利用者」の属性情報に「ラーメンが好き」といった情報が多く含まれている場合、モデルは、「ラーメンが好き」といった属性情報を有する利用者を、「ラーメンに関する広告を選択しやすい利用者」に分類するよう学習を行うとも考えられる。しかしながら、例えば、「ラーメンに関する広告を選択した利用者」の属性情報に「ラーメンが好き」といった情報以外にも、「ハンバーガーが好き」といった情報も多く含まれている場合、モデルは、「ハンバーガーが好き」といった属性情報を有する利用者を、「ラーメンに関する広告を選択しやすい利用者」に分類するよう学習を行っている恐れがある。 A more specific example will be described. For example, if the attribute information of "users who have selected advertisements related to ramen" contains a lot of information such as "like ramen", the model refers to users who have attribute information such as "like ramen" as "ramen". It is also conceivable to learn to classify advertisements related to "users who can easily select". However, for example, if the attribute information of "users who have selected advertisements related to ramen" contains a lot of information such as "like hamburger" in addition to information such as "like ramen", the model is "hamburger is". There is a possibility that users who have attribute information such as "like" are learning to be classified as "users who can easily select advertisements related to ramen".

一方で、「ラーメンが好き」といった情報や、「ハンバーガーが好き」といった情報のみを含む属性情報を学習データとして採用した場合、学習データに偏りが生じてしまう。このため、例えば、「ラーメンが好き」といった情報や、「ハンバーガーが好き」といった情報が属性情報に含まれないが、属性情報が「ラーメンに関する広告を選択した利用者」の属性情報と類似する利用者を「ラーメンに関する広告を選択しやすい利用者」に分類することができなくなる。 On the other hand, when attribute information including only information such as "I like ramen" or "I like hamburgers" is adopted as learning data, the learning data is biased. Therefore, for example, information such as "I like ramen" and information such as "I like hamburger" are not included in the attribute information, but the attribute information is similar to the attribute information of "users who selected advertisements related to ramen". It will not be possible to classify people as "users who can easily select advertisements related to ramen."

このように、各事業者や情報提供装置10が生成するモデルは、所定の入力情報が入力された際に、その入力情報が入力された場合に事業者がモデルに出力させたい出力情報を出力する様に学習が行われる。換言すると、モデルは、所定の入力情報が入力された際に利用目的に応じた出力情報を出力するように学習が行われる。このため、モデルは、入力情報が有する特徴に応じて利用目的に応じた分類処理を実行するものの、モデルを利用する利用者が想定している特徴とは異なる特徴に基づいて、分類処理を行っている恐れがある。 In this way, the model generated by each business operator and the information providing device 10 outputs the output information that the business operator wants to output to the model when the predetermined input information is input and the input information is input. Learning is done as if to do. In other words, the model is trained to output output information according to the purpose of use when predetermined input information is input. Therefore, although the model executes the classification process according to the purpose of use according to the characteristics of the input information, the classification process is performed based on the characteristics different from the characteristics assumed by the user who uses the model. There is a risk of

〔1−3.推定処理について〕
そこで、情報提供装置10は、以下の処理を実行することで、学習済のモデルが分類処理を行う際の分類指標を推定する。より具体的には、情報提供装置10は、出力情報の類似性と、利用者情報の類似性とに基づいて、各モデルの分類指標を推定する(ステップS8)。より具体的には、情報提供装置10は、分類対象に関する対象情報が入力されると当該分類対象の分類を示す出力情報を出力するモデルにより対象情報から類似する出力情報が出力された複数の分類対象を特定する。そして、情報提供装置10は、特定された複数の分類対象の対象情報に基づいて、モデルが分類対象を分類する際の指標を推定する。
[1-3. About estimation processing]
Therefore, the information providing device 10 estimates the classification index when the trained model performs the classification processing by executing the following processing. More specifically, the information providing device 10 estimates the classification index of each model based on the similarity of the output information and the similarity of the user information (step S8). More specifically, the information providing device 10 outputs a plurality of classifications in which similar output information is output from the target information by a model that outputs output information indicating the classification of the classification target when the target information regarding the classification target is input. Identify the target. Then, the information providing device 10 estimates an index when the model classifies the classification target based on the target information of the specified plurality of classification targets.

例えば、情報提供装置10は、登録若しくは生成したモデルの中から推定対象となるモデルを選択し、選択したモデルに、各種の利用者情報を入力する。より具体的には、情報提供装置10は、選択したモデルの学習に用いられた利用者情報のみならず、情報提供装置10が独自に収集した利用者情報を含めてモデルに入力する。そして、情報提供装置10は、モデルが出力した出力情報が類似する利用者を類似グループに属する利用者として特定する。すなわち、情報提供装置10は、モデルが同一グループに分類した利用者を特定する。 For example, the information providing device 10 selects a model to be estimated from the registered or generated models, and inputs various user information to the selected model. More specifically, the information providing device 10 inputs not only the user information used for learning the selected model but also the user information independently collected by the information providing device 10 into the model. Then, the information providing device 10 identifies users having similar output information output by the model as users belonging to the similar group. That is, the information providing device 10 identifies the users whose models are classified into the same group.

ここで、同一グループに分類された利用者(以下、「分類利用者」と記載する。)の利用者情報は、少なくとも、モデルが分類利用者を同一のグループに分類した原因となる特徴が、共通性として含まれると考えられる。そこで、情報提供装置10は、分類利用者の利用者情報を参照し、共通する利用者情報を特定する。例えば、情報提供装置10は、分類利用者の利用者属性に共通して含まれる属性や検索履歴等を特定する。そして、情報提供装置10は、特定した属性や検索履歴等を示す情報を、分類指標とする。 Here, the user information of the users classified into the same group (hereinafter, referred to as "classified users") has at least a feature that causes the model to classify the classified users into the same group. It is considered to be included as commonality. Therefore, the information providing device 10 refers to the user information of the classified user and identifies the common user information. For example, the information providing device 10 specifies attributes, search histories, and the like that are commonly included in the user attributes of the classified users. Then, the information providing device 10 uses information indicating the specified attribute, search history, and the like as a classification index.

例えば、情報提供装置10は、分類利用者の利用者情報に、「ラーメンが好き」といった情報が共通して含まれている場合は、モデルの分類指標として、「「ラーメンが好き」な利用者を同じグループに分類しやすいモデル」といった情報を生成する。また、例えば、情報提供装置10は、分類利用者の利用者情報に、「ラーメンが好き」といった情報や「ハンバーガーが好き」といった情報が共通して含まれる場合は、「ラーメンが好き」といった情報を含む分類利用者の割合と、「ハンバーガーが好き」といった情報を含む分類利用者の割合とを特定する。そして、情報提供装置10は、「ハンバーガーが好き」といった情報を含む分類利用者の割合がより多い場合、「「ハンバーガーが好き」な利用者を同じグループに分類しやすいモデル」といった情報を生成する。 For example, when the information providing device 10 includes information such as "I like ramen" in common in the user information of the classification user, the user who "likes ramen" is used as a classification index of the model. Generate information such as "a model that makes it easy to classify into the same group." Further, for example, in the information providing device 10, when the user information of the classified user includes information such as "I like ramen" or "I like hamburger" in common, information such as "I like ramen". Identify the percentage of classified users that include "I like hamburgers" and the percentage of classified users that include information such as "I like hamburgers." Then, when the proportion of classified users including information such as "like hamburgers" is higher, the information providing device 10 generates information such as "a model that makes it easy to classify users who like" hamburgers "into the same group". ..

すなわち、情報提供装置10は、利用者情報のうち、出力情報との相関性が高い利用者情報を特定する。換言すると、情報提供装置10は、分類利用者の利用者情報が異なる内容の共通性を複数有する場合は、モデルによる分類と最も関連性が高いと推定される共通性を特定し、特定した共通性の内容を元に、モデルの分類指標を推定する。 That is, the information providing device 10 identifies the user information having a high correlation with the output information among the user information. In other words, the information providing device 10 identifies and identifies the commonality that is presumed to be most relevant to the classification by the model when the user information of the classification users has a plurality of commonalities of different contents. Estimate the classification index of the model based on the content of sex.

このようにして推定されたモデルの分類指標は、モデルを利用する際に有用な情報として利用することができる。そこで、情報提供装置10は、推定した分類指標を、モデルを利用しようとする事業者に対して提供する(ステップS9)。この結果、情報提供装置10は、利用目的に応じたモデルの選択を容易にするだけではなく、モデルがどのような指標に基づいた分類を行うかを提示することができる。この結果、情報提供装置10は、例えば、モデルを利用する事業者と生成した事業者とが異なる場合、すなわち、モデルを利用する事業者が、モデルがどのような学習データによりどのような学習が行われたかを知らない場合であっても、モデルの利用を促進し、情報共有サービスの利用を促進することができる。 The classification index of the model estimated in this way can be used as useful information when using the model. Therefore, the information providing device 10 provides the estimated classification index to the business operator who intends to use the model (step S9). As a result, the information providing device 10 not only facilitates the selection of the model according to the purpose of use, but can also present what kind of index the model performs the classification based on. As a result, in the information providing device 10, for example, when the business operator using the model and the business operator generating the model are different, that is, the business operator using the model learns what kind of learning data the model is based on. Even if you do not know if it was done, you can promote the use of the model and the use of the information sharing service.

〔1−4.分類指標の推定について〕
ここで、上述した説明では、情報提供装置10は、出力情報が類似する利用者、すなわち、同一のグループに分類された利用者を分類利用者とし、分類利用者の利用者情報に基づいて、分類を行ったモデルの分類指標を推定した。ここで、情報提供装置10は、少なくとも分類利用者の利用者情報を用いて、モデルによる分類結果と相関性が高い利用者情報を特定し、特定した利用者情報から分類指標を推定するのであれば、任意の手法により分類指標の推定を行ってよい。そこで、以下の説明では、情報提供装置10が分類指標を推定する処理のバリエーションについて説明する。
[1-4. About estimation of classification index]
Here, in the above description, the information providing device 10 defines users having similar output information, that is, users classified into the same group as classified users, and based on the user information of the classified users, the information providing device 10 is used. The classification index of the classified model was estimated. Here, the information providing device 10 identifies the user information having a high correlation with the classification result by the model by using at least the user information of the classification user, and estimates the classification index from the specified user information. For example, the classification index may be estimated by any method. Therefore, in the following description, variations of processing in which the information providing device 10 estimates the classification index will be described.

〔1−4−1.分類利用者の類似性に基づいた推定〕
例えば、検索クエリの内容に応じて、利用者が所定の広告を選択するか否かを推定するモデルを学習するには、所定の広告や類似する広告を選択した利用者と、選択していない利用者とが入力した検索クエリの履歴である検索履歴を準備し、広告を選択した利用者の検索履歴を入力した際に、利用者が広告を選択する旨を出力し、広告を選択していない利用者の検索履歴を入力した際に、利用者が広告を選択しない旨を出力するように、モデルの学習を行うこととなる。しかしながら、このような学習の際に、検索履歴以外の利用者情報を入力した場合は、検索履歴以外の利用者情報に基づいて、利用者が広告を選択するか否かを推定するように学習が行われてしまう恐れがある。一方で、検索履歴以外の利用者情報を入力しなかった場合は、分類精度が低下したり、検索履歴が無い利用者の分類ができなくなる恐れがある。このため、モデルを利用する際の分類精度を担保するため、モデルの学習においては、複数種別の利用者情報を入力とした学習が行われる場合が多い。
[1-4-1. Estimate based on the similarity of classification users]
For example, in order to learn a model for estimating whether or not a user selects a predetermined advertisement according to the content of a search query, a user who has selected a predetermined advertisement or a similar advertisement and a user who has not selected the predetermined advertisement are not selected. Prepare the search history which is the history of the search query entered by the user, and when entering the search history of the user who selected the advertisement, output that the user selects the advertisement and select the advertisement. When the search history of a user who does not exist is input, the model is trained so that the user does not select an advertisement. However, when user information other than the search history is input during such learning, learning is made to estimate whether or not the user selects an advertisement based on the user information other than the search history. May be done. On the other hand, if user information other than the search history is not input, the classification accuracy may decrease or users without a search history may not be classified. Therefore, in order to ensure the classification accuracy when using the model, in the learning of the model, learning by inputting a plurality of types of user information is often performed.

そこで、情報提供装置10は、分類利用者の利用者情報が有する共通性に基づいて、モデルが意図しない分類指標を用いているかを推定してもよい。例えば、情報提供装置10は、モデルとして、対象情報のうち所定の種別の情報が有する特徴に応じた出力情報を出力するように学習が行われたモデルにより、類似する出力情報が出力された複数の分類対象を特定し、特定された分類対象の対象情報のうち、所定の種別以外の種別の情報の共通性に基づいて、モデルが分類対象を分類する際の指標を推定してもよい。 Therefore, the information providing device 10 may estimate whether the model uses an unintended classification index based on the commonality of the user information of the classification users. For example, the information providing device 10 may output similar output information by a model trained to output output information according to the characteristics of a predetermined type of information among the target information as a model. The index for classifying the classification target by the model may be estimated based on the commonality of the information of the types other than the predetermined type among the target information of the specified classification target.

例えば、情報提供装置10は、推定対象として特定したモデルを学習する際に学習データとした利用者情報を特定するとともに、利用者情報のうち重視された利用者情報の種別を想定種別として特定する。また、情報提供装置10は、学習データとした利用者情報以外の利用者情報を収集し、収集した利用者情報をモデルに入力することで、分類利用者を特定する。そして、情報提供装置10は、特定した分類利用者の利用者情報のうち、出力情報との相関性が高い利用者情報の種別若しくは種別の組み合わせであって、想定種別とは異なる種別若しくは種別の組み合わせを特定する。 For example, the information providing device 10 specifies the user information as learning data when learning the model specified as the estimation target, and also specifies the type of the user information that is emphasized among the user information as the assumed type. .. Further, the information providing device 10 collects user information other than the user information used as learning data, and inputs the collected user information into the model to identify the classified user. Then, the information providing device 10 is a type or combination of types of user information having a high correlation with the output information among the user information of the specified classified users, and is a type or type combination different from the assumed type. Identify the combination.

例えば、情報提供装置10は、学習データとした利用者情報に、性別、検索履歴、購買履歴が含まれており、かつ、モデルの学習時に検索履歴が重視されている場合、性別、購検索履歴、および購買履歴のそれぞれと出力情報との相関性を特定する。そして、情報提供装置10は、性別と出力情報との相関性、若しくは、購買履歴と出力情報との相関性が、検索履歴の相関性よりも高い場合は、モデルが想定していない特徴を学習している旨や、性別或いは購買履歴の特徴を学習している旨を推定指標として出力してもよい。 For example, in the information providing device 10, when the user information used as learning data includes gender, search history, and purchase history, and the search history is emphasized when learning the model, the gender and purchase search history , And identify the correlation between each of the purchase history and the output information. Then, when the correlation between the gender and the output information or the correlation between the purchase history and the output information is higher than the correlation between the search history, the information providing device 10 learns a feature not assumed by the model. You may output as an estimation index that you are doing this or that you are learning the characteristics of gender or purchase history.

また、情報提供装置10は、複数種別の利用者情報の組み合わせのうち、モデルが分類指標とする組み合わせを特定してもよい。例えば、情報提供装置10は、分類利用者の利用者情報に性別、検索履歴、購買履歴が含まれる場合は、性別と検索履歴との組、性別と購買履歴との組、検索履歴と購買履歴との組、および、性別と検索履歴と購買履歴との組ごとに、出力情報との相関性を特定する。例えば、情報提供装置10は、各属性の組み合わせごとに、各分類利用者の利用者情報同士の類似性と、各分類利用者の出力情報の類似性との相関性(すなわち、各類似性同士の類似性)を示すスコアを算出する。そして、情報提供装置10は、算出したスコアが最も高い組を推定指標として出力してもよい。また、情報提供装置10は、想定種別の組以外の組に、出力情報との相関性が、想定種別の組よりも高い組が存在する場合は、かかる組が推定指標である旨の情報を出力してもよい。 Further, the information providing device 10 may specify a combination of a plurality of types of user information as a classification index by the model. For example, in the information providing device 10, when the user information of the classified user includes gender, search history, and purchase history, the information providing device 10 includes a pair of gender and search history, a pair of gender and purchase history, and a search history and purchase history. The correlation with the output information is specified for each pair of and, and for each pair of gender, search history, and purchase history. For example, the information providing device 10 correlates the similarity between the user information of each classification user and the similarity of the output information of each classification user for each combination of attributes (that is, each similarity). (Similarity) is calculated. Then, the information providing device 10 may output the set having the highest calculated score as an estimation index. Further, when the information providing device 10 has a group other than the set of the assumed type that has a higher correlation with the output information than the set of the assumed type, the information providing device 10 provides information that the set is an estimation index. It may be output.

〔1−4−2.他の利用者との比較に基づいた推定〕
また、情報提供装置10は、あるグループに分類された分類利用者の利用者情報と、他のグループに分類された分類利用者(以下、「比較利用者」と記載する。)の利用者情報との比較結果に基づいて、推定指標を推定してもよい。例えば、情報提供装置10は、モデルにより対象情報から類似する出力情報が出力された分類対象を第1グループとして特定するとともに、対象情報が所定の類似性を有する分類対象を第2グループとして特定する。そして、情報提供装置10は、第1グループに属する分類対象の対象情報と、第2グループに属する分類対象の対象情報との比較に基づいて、モデルが分類対象を分類する際の指標を推定する。
[1-4-2. Estimate based on comparison with other users]
Further, the information providing device 10 provides user information of classified users classified into a certain group and user information of classified users classified into another group (hereinafter, referred to as "comparative users"). The estimation index may be estimated based on the comparison result with. For example, the information providing device 10 specifies a classification target for which similar output information is output from the target information by the model as the first group, and specifies a classification target for which the target information has a predetermined similarity as the second group. .. Then, the information providing device 10 estimates an index when the model classifies the classification target based on the comparison between the target information of the classification target belonging to the first group and the target information of the classification target belonging to the second group. ..

ここで、第2グループに属する分類対象は、対象情報自体の類似性に基づいて分類されていればよい。すなわち、比較対象となる第2グループは、ブラックボックスである推定対象のモデルとは異なり、ホワイトボックス(例えば、ルールベース)であるモデルにより分類されたものであってもよい。より具体的には、情報提供装置10は、第2グループとして、推定対象となるモデルとは異なるモデルであって、対象情報が所定の条件を満たすか否かに応じて分類対象を分類するモデルにより同じグループに分類された分類対象を特定すればよい。ここで、第1グループに分類された分類対象と、第2グループに分類された分類対象とは、重複を有していてもよく、有していなくともよい。 Here, the classification target belonging to the second group may be classified based on the similarity of the target information itself. That is, the second group to be compared may be classified by a model that is a white box (for example, rule-based), unlike the model that is an estimation target that is a black box. More specifically, the information providing device 10 is a model different from the model to be estimated as the second group, and is a model for classifying the classification target according to whether or not the target information satisfies a predetermined condition. It is sufficient to specify the classification target classified into the same group by. Here, the classification target classified into the first group and the classification target classified into the second group may or may not have overlap.

例えば、図2は、実施形態に係る情報提供装置が異なるグループの比較結果に基づいて実行する推定処理の一例を示す図である。例えば、情報提供装置10は、各利用者情報を推定対象となるモデルに入力し、モデルが出力した出力情報が類似する利用者を第1グループ、すなわち、分類利用者のグループとする(ステップS10)。例えば、情報提供装置10は、利用者U1〜U5の利用者情報#U1〜#U5をそれぞれモデルに入力し、出力情報#U1〜#U5を得る。そして、情報提供装置10は、各出力情報#U1〜#U5の類似性を相互に特定し、類似性が高い利用者(例えば、利用者U1、U3、U5)を第1グループとして抽出する。 For example, FIG. 2 is a diagram showing an example of estimation processing executed by the information providing device according to the embodiment based on the comparison result of different groups. For example, the information providing device 10 inputs each user information into a model to be estimated, and sets users having similar output information output by the model as a first group, that is, a group of classified users (step S10). ). For example, the information providing device 10 inputs the user information # U1 to # U5 of the users U1 to U5 into the model, respectively, and obtains the output information # U1 to # U5. Then, the information providing device 10 mutually identifies the similarity of each output information # U1 to # U5, and extracts users having high similarity (for example, users U1, U3, U5) as a first group.

続いて、情報提供装置10は、ルールベースで、利用者情報が類似する利用者を第2グループとする(ステップS11)。例えば、情報提供装置10は、利用者情報#U1〜#U5の中から、所定の種別が同一となる利用者情報を特定し、特定した利用者情報と対応する利用者(例えば、利用者U2、U4、U6)を、比較利用者として特定する。そして、情報提供装置10は、比較利用者を第2グループとする。 Subsequently, the information providing device 10 sets users with similar user information as a second group on a rule basis (step S11). For example, the information providing device 10 specifies user information of the same predetermined type from the user information # U1 to # U5, and the user corresponding to the specified user information (for example, user U2). , U4, U6) are specified as comparative users. Then, the information providing device 10 has a comparative user as a second group.

そして、情報提供装置10は、第1グループの利用者情報と第2グループの利用者情報との比較から、モデルが分類を行う際の分類指標を推定する(ステップS12)。例えば、情報提供装置10は、第1グループの利用者情報#U1、#U3、#U5が有する共通性のうち、第2グループの利用者情報#U2、#U4、#U6が有する共通性と同一の共通性を分類指標としてもよく、異なる共通性を分類指標としてもよい。 Then, the information providing device 10 estimates the classification index when the model classifies from the comparison between the user information of the first group and the user information of the second group (step S12). For example, the information providing device 10 has the commonality of the user information # U2, # U4, and # U6 of the second group among the commonality of the user information # U1, # U3, and # U5 of the first group. The same commonality may be used as a classification index, and different commonalities may be used as a classification index.

なお、情報提供装置10は、第1グループの利用者情報が有する共通性を特定し、特定した共通性に基づいて、第2グループの利用者を特定してもよい。例えば、情報提供装置10は、第1グループの利用者情報の多くに、所定の検索クエリが検索履歴として含まれる場合は、各利用者のうち、所定の検索クエリが検索履歴として含まれる利用者を第2グループとして抽出してもよい。そして、情報提供装置10は、第1グループに属する利用者と第2グループに属する利用者との間に齟齬がある場合や、第1グループに属する利用者の利用者情報と、第2グループに属する利用者の利用者情報との間の共通性が所定の閾値以下となる場合は、第1グループに属する利用者情報が有する共通性のうち、「所定の検索クエリが検索履歴として含まれる」という共通性以外の共通性を推定指標としてもよい。 The information providing device 10 may specify the commonality of the user information of the first group, and specify the users of the second group based on the specified commonality. For example, in the information providing device 10, when a predetermined search query is included in the search history in most of the user information of the first group, the user whose search history includes the predetermined search query among the users. May be extracted as the second group. Then, when the information providing device 10 has a discrepancy between the user belonging to the first group and the user belonging to the second group, or when the user information of the user belonging to the first group and the user information of the user belonging to the first group are combined with the second group. When the commonality with the user information of the user to which the user belongs is equal to or less than a predetermined threshold value, among the commonality of the user information belonging to the first group, "a predetermined search query is included as the search history". A commonality other than the commonality may be used as an estimation index.

〔1−4−3.相関性を用いた推定〕
なお、情報提供装置10は、同一グループに分類された分類対象の対象情報と、モデルが出力する出力情報との相関性に基づいて、モデルが分類対象を分類する際の指標を推定してもよい。例えば、情報提供装置10は、各利用者の利用者情報をモデルに入力し、出力情報を得る。例えば、情報提供装置10は、モデルが出力した値(すなわち、入力された利用者情報と対応する利用者が所定のグループに分類される確度を示す値)を得る。
[1-4-3. Estimate using correlation]
The information providing device 10 may estimate an index when the model classifies the classification target based on the correlation between the target information of the classification target classified in the same group and the output information output by the model. good. For example, the information providing device 10 inputs the user information of each user into the model and obtains the output information. For example, the information providing device 10 obtains a value output by the model (that is, a value indicating the probability that the input user information and the corresponding user are classified into a predetermined group).

続いて、情報提供装置10は、利用者情報に含まれる各種別の情報を所定の手法を用いて数値化する。例えば、情報提供装置10は、性別が男性であれば「0」、女性であれば「1」等、各種別の情報を識別する数値を設定することで、利用者情報を種別ごとの数値に置き換える。続いて、情報提供装置10は、多次元空間上において各種別と、出力情報とのそれぞれを個別の軸方向と対応付け、各種別の数値と出力情報の数値とに対応する多次元空間上の位置をプロットする。そして、情報提供装置10は、このような処理を各利用者ごとに実行し、プロットされた位置に基づいて、各種別のうち、出力情報との相関が高いものを調べてもよい。すなわち、情報提供装置10は、対象情報のうち、出力情報との相関性が所定の条件を満たす情報の種別を、モデルが分類対象を分類する際の指標として推定してもよい。 Subsequently, the information providing device 10 digitizes various types of information included in the user information by using a predetermined method. For example, the information providing device 10 sets a numerical value that identifies various types of information, such as "0" if the gender is male and "1" if the gender is female, so that the user information can be converted into a numerical value for each type. replace. Subsequently, the information providing device 10 associates each type and the output information with individual axial directions in the multidimensional space, and on the multidimensional space corresponding to each type of numerical value and the numerical value of the output information. Plot the position. Then, the information providing device 10 may execute such a process for each user, and based on the plotted positions, may investigate the type having a high correlation with the output information among the various types. That is, the information providing device 10 may estimate the type of target information whose correlation with the output information satisfies a predetermined condition as an index when the model classifies the classification target.

なお、情報提供装置10は、例えば、所定の1つ又は複数の種別と対応する次元を残して多次元空間を投影し、投影後におけるプロット位置が所定の条件を満たすか否か(例えば、出力情報に対して線形的な変化を有しているか、ベルヌーイ分布となっているか否か等)に基づいて、各種別若しくは種別の組と出力情報との間の相関性を推定してもよい。すなわち、情報提供装置10は、モデルが出力する出力情報との相関性が所定の条件を満たす情報の種別の組を、モデルが分類対象を分類する際の指標として推定してもよい。 The information providing device 10 projects, for example, a multidimensional space leaving a dimension corresponding to a predetermined one or a plurality of types, and whether or not the plot position after projection satisfies a predetermined condition (for example, output). The correlation between the output information and the set of each type or type may be estimated based on whether the information has a linear change or whether it has a Bernoulli distribution. That is, the information providing device 10 may estimate a set of information types whose correlation with the output information output by the model satisfies a predetermined condition as an index when the model classifies the classification target.

また、情報提供装置10は、モデルに入力する利用者情報を限定することで、相関の確認を行ってもよい。例えば、情報提供装置10は、利用者情報を参照し、モデルの利用目的と対応する種別の情報が共通する利用者を特定する。例えば、情報提供装置10は、モデルが「メガネをかけている人」とそれ以外の人とを分類する場合、各利用者の中から、「メガネをかけている」という属性を有する利用者を特定する。そして、情報提供装置10は、特定した利用者の利用者情報をモデルに入力し、モデルの出力情報が共通する場合は、モデルの推定指標として「メガネをかけている人」を特定してもよい。 Further, the information providing device 10 may confirm the correlation by limiting the user information to be input to the model. For example, the information providing device 10 refers to user information and identifies a user who has common information of the type corresponding to the purpose of use of the model. For example, when the model classifies "people wearing glasses" and other people, the information providing device 10 selects users who have the attribute of "wearing glasses" from among the users. Identify. Then, the information providing device 10 inputs the user information of the specified user into the model, and if the output information of the model is common, even if the "person wearing glasses" is specified as an estimation index of the model. good.

〔1−4−4.次元毎の指標推定〕
ここで、他クラス分類を行うようにモデルの学習を行った場合等には、モデルがベクトル等の多次元量を出力する場合がある。このような場合、各次元の値がどのような種別の利用者情報に対応しているのかが必ずしも明確ではない。そこで、情報提供装置10は、各次元の値ごとに、利用者情報との相関性を推定してもよい。すなわち、情報提供装置10は、出力情報としてベクトルを出力するモデルにより対象情報から所定の次元の値が同一のベクトルが出力された複数の分類対象を特定し、特定された分類対象の対象情報に基づいて、モデルが出力するベクトルのうち所定の次元の値と対応する指標を推定してもよい。
[1-4-4. Index estimation for each dimension]
Here, when the model is trained so as to perform other class classification, the model may output a multidimensional quantity such as a vector. In such a case, it is not always clear what kind of user information the value of each dimension corresponds to. Therefore, the information providing device 10 may estimate the correlation with the user information for each value of each dimension. That is, the information providing device 10 identifies a plurality of classification targets for which vectors having the same value of a predetermined dimension are output from the target information by a model that outputs a vector as output information, and sets the target information of the specified classification target. Based on this, the index corresponding to the value of a predetermined dimension in the vector output by the model may be estimated.

例えば、情報提供装置10は、各利用者の利用者情報から出力情報となるベクトルを生成し、所定の次元の値が同一となるベクトルと対応する利用者情報を特定する。そして、情報提供装置10は、特定した利用者情報において共通性を有する種別を特定し、特定した種別が、出力情報となるベクトルのうち所定の次元の値と対応する種別であると特定し、特定した種別と所定の次元との対応を示す情報を分類指標としてもよい。また、情報提供装置10は、各次元の組ごとに、利用者情報との相関を求めてもよい。 For example, the information providing device 10 generates a vector to be output information from the user information of each user, and identifies the user information corresponding to the vector having the same value in a predetermined dimension. Then, the information providing device 10 specifies a type having commonality in the specified user information, and identifies that the specified type is a type corresponding to a value of a predetermined dimension in the vector to be output information. Information indicating the correspondence between the specified type and a predetermined dimension may be used as a classification index. Further, the information providing device 10 may obtain a correlation with the user information for each set of each dimension.

〔1−4−5.モデル同士を用いた評価〕
なお、情報提供装置10には、複数の事業者により登録されたモデルが複数登録されることとなる。そこで、情報提供装置10は、それぞれ異なるモデルにより分類された分類利用者の利用者情報同士を比較することで、各モデルの推定指標を推定してもよい。例えば、情報提供装置10は、推定対象となるモデルを用いて分類した第1グループの利用者情報と、他のモデルを用いて分類した第2グループの利用者情報との比較結果に基づいて、推定対象となるモデルの推定指標を特定してもよい。
[1-4-5. Evaluation using models]
A plurality of models registered by a plurality of businesses are registered in the information providing device 10. Therefore, the information providing device 10 may estimate the estimation index of each model by comparing the user information of the classified users classified by different models. For example, the information providing device 10 is based on a comparison result between the user information of the first group classified using the model to be estimated and the user information of the second group classified using another model. The estimation index of the model to be estimated may be specified.

〔2.情報提供装置の構成〕
以下、上記した情報提供装置10が有する機能構成の一例について説明する。図3は、実施形態に係る情報提供装置の構成例を示す図である。図3に示すように、情報提供装置10は、通信部20、記憶部30、および制御部40を有する。
[2. Configuration of information providing device]
Hereinafter, an example of the functional configuration of the information providing device 10 described above will be described. FIG. 3 is a diagram showing a configuration example of the information providing device according to the embodiment. As shown in FIG. 3, the information providing device 10 includes a communication unit 20, a storage unit 30, and a control unit 40.

通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、外部端末100、200との間で情報の送受信を行う。 The communication unit 20 is realized by, for example, a NIC (Network Interface Card) or the like. Then, the communication unit 20 is connected to the network N by wire or wirelessly, and transmits / receives information to / from the external terminals 100 and 200.

記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、利用者データベース31、およびモデルデータベース32を記憶する。以下、図4、図5を用いて、利用者データベース31、およびモデルデータベース32に登録される情報の一例について説明する。 The storage unit 30 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. In addition, the storage unit 30 stores the user database 31 and the model database 32. Hereinafter, an example of information registered in the user database 31 and the model database 32 will be described with reference to FIGS. 4 and 5.

利用者データベース31には、利用者に関する各種の情報が登録される。例えば、図4は、実施形態に係る利用者データベースの一例を示す図である。図4に示した例では、利用者データベース31は、「利用者ID」と「利用者情報」とが対応付けて登録されている。また、利用者データベース31には、「利用者情報」として、「属性情報」、「検索履歴」、および「購買履歴」といった種別の情報が登録されている。なお、利用者データベース31には、図4に示す情報以外にも、例えば、利用者が選択した広告の履歴や、利用者が視聴したコンテンツの履歴等、各種の種別の利用者情報が登録されていてもよく、利用者に関する他の情報が登録されていてもよい。 Various information about the user is registered in the user database 31. For example, FIG. 4 is a diagram showing an example of a user database according to the embodiment. In the example shown in FIG. 4, in the user database 31, "user ID" and "user information" are registered in association with each other. Further, in the user database 31, types of information such as "attribute information", "search history", and "purchase history" are registered as "user information". In addition to the information shown in FIG. 4, various types of user information such as the history of advertisements selected by the user and the history of contents viewed by the user are registered in the user database 31. It may be, and other information about the user may be registered.

ここで、「利用者ID」とは、利用者を識別する識別子である。また、「属性情報」とは、利用者のデモグラフィック属性やサイコグラフィック属性等といった各種の属性情報である。また「検索履歴」とは、利用者が入力した検索クエリの履歴である。また、「購買履歴」とは、利用者が購買した取引対象の履歴である。例えば、図4に示す例では、利用者データベース31には、利用者ID「U1」、属性情報「属性情報#U1」、検索履歴「検索履歴#U1」、および購買履歴「購買履歴#U1」が対応付けて登録されている。このような情報は、利用者ID「U1」が示す利用者の利用者情報として、属性情報「属性情報#U1」が示す属性、検索履歴「検索履歴#U1」が示す検索クエリの履歴、および購買履歴「購買履歴#U1」が示す取引対象の履歴等が登録されている旨を示す。 Here, the "user ID" is an identifier that identifies the user. Further, the "attribute information" is various attribute information such as a user's demographic attribute and psychographic attribute. The "search history" is a history of search queries entered by the user. The "purchase history" is a history of transaction targets purchased by the user. For example, in the example shown in FIG. 4, the user database 31 has the user ID "U1", the attribute information "attribute information # U1", the search history "search history # U1", and the purchase history "purchase history # U1". Are registered in association with each other. Such information is the user information of the user indicated by the user ID "U1", the attribute indicated by the attribute information "attribute information # U1", the history of the search query indicated by the search history "search history # U1", and the history of the search query indicated by the search history "search history # U1". Purchase history Indicates that the transaction target history and the like indicated by "purchase history # U1" are registered.

なお、図4に示す例では、「属性情報#U1」、「検索履歴#U1」、および「購買履歴#U1」といった概念的な値を記載したが、実際には、各種の属性、検索クエリの履歴、および取引対象を示す文字列や数値等といった情報が登録されることとなる。 In the example shown in FIG. 4, conceptual values such as "attribute information # U1", "search history # U1", and "purchase history # U1" are described, but in reality, various attributes and search queries are described. Information such as the history of the transaction and the character string or numerical value indicating the transaction target will be registered.

モデルデータベース32には、モデルに関する各種の情報が登録される。例えば、図5は、実施形態に係るモデルデータベースの一例を示す図である。図5に示した例では、モデルデータベース32は、「モデルID」、「登録者」、「学習データ」、「分類目的」、および「推定指標」といった情報が対応付けて登録されている。なお、モデルデータベース32には、図5に示す情報以外にも、例えば、モデルの登録日時等、モデルに関する各種の情報が登録されていてもよい。また、図5に示す例では、記載を省略したが、モデルデータベース32には、モデルそのもののデータとして、ノードの接続関係や接続係数等といったDNNを構成するデータが登録されることとなる。 Various information about the model is registered in the model database 32. For example, FIG. 5 is a diagram showing an example of a model database according to an embodiment. In the example shown in FIG. 5, in the model database 32, information such as "model ID", "registrant", "learning data", "classification purpose", and "estimated index" are registered in association with each other. In addition to the information shown in FIG. 5, various information related to the model, such as the registration date and time of the model, may be registered in the model database 32. Further, in the example shown in FIG. 5, although the description is omitted, the data constituting the DNN such as the connection relationship of the nodes and the connection coefficient is registered in the model database 32 as the data of the model itself.

ここで、「モデルID」とは、モデルを識別するための識別子である。また、「登録者」とは、モデルを登録した事業者を識別するための識別子である。また、「学習データ」とは、対応付けられた「モデルID」が示すモデルを学習するために用いられた利用者情報や出力情報、すなわち、学習データを示す情報である。また、「分類目的」とは、対応付けられた「モデルID」が示すモデルにより行われる分類の目的を示す情報である。例えば、「分類目的」とは、どのような利用者情報が入力された場合に、どのような出力情報が出力されるように学習が行われたかを示す情報である。なお、「分類情報」は、例えば、学習データのうちどのデータが正例で、どのデータが負例であるかを示す情報であってもよい。また、「推定指標」とは、対応付けられた「モデルID」が示すモデルについて推定された推定指標である。 Here, the "model ID" is an identifier for identifying the model. The "registrant" is an identifier for identifying the business operator who registered the model. Further, the "learning data" is user information or output information used for learning the model indicated by the associated "model ID", that is, information indicating learning data. Further, the "classification purpose" is information indicating the purpose of classification performed by the model indicated by the associated "model ID". For example, the "classification purpose" is information indicating what kind of output information is output when learning is performed when what kind of user information is input. The "classification information" may be, for example, information indicating which data of the learning data is a positive example and which data is a negative example. Further, the "estimated index" is an estimated index estimated for the model indicated by the associated "model ID".

例えば、図5に示す例では、モデルデータベース32には、モデルID「M1」、登録者「事業者#1」、学習データ「学習データ#M1」、分類目的「分類目的#M1」、および推定指標「推定指標#M1」が対応付けて登録されている。このような情報は、モデルID「M1」が示すモデルが、登録者「事業者#1」が示す事業者により登録されたモデルであり、学習データ「学習データ#M1」が示す学習データにより学習が行われた旨を示す。また、このような情報は、モデルID「M1」が示すモデルが、分類目的「分類目的#M1」を目的として学習が行われ、推定された推定指標が「推定指標#M1」である旨を示す。 For example, in the example shown in FIG. 5, the model database 32 contains the model ID “M1”, the registrant “business operator # 1”, the learning data “learning data # M1”, the classification purpose “classification purpose # M1”, and the estimation. The index "estimated index # M1" is registered in association with each other. Such information is a model in which the model indicated by the model ID "M1" is registered by the operator indicated by the registrant "business operator # 1", and is learned by the learning data indicated by the learning data "learning data # M1". Indicates that Further, such information indicates that the model indicated by the model ID "M1" is learned for the purpose of classification purpose "classification purpose # M1" and the estimated estimation index is "estimation index # M1". show.

なお、図5に示す例では、「事業者#1」、「学習データ#M1」、「分類目的#M1」、および「推定指標#M1」といった概念的な値を記載したが、実際には、モデルデータベース32には、事業者を識別するための文字列や数値、学習データを示す情報や学習データとなる利用者情報と対応する出力情報との組、分類目的を示す文字列や、正例もしくは負例となる学習データを示す識別子、推定指標を示す文字列等が登録されることとなる。 In the example shown in FIG. 5, conceptual values such as "business operator # 1", "learning data # M1", "classification purpose # M1", and "estimated index # M1" are described, but in reality, they are described. , The model database 32 contains a character string or numerical value for identifying a business operator, a set of information indicating learning data or user information serving as learning data and corresponding output information, a character string indicating a classification purpose, or a positive value. An identifier indicating learning data as an example or a negative example, a character string indicating an estimation index, and the like will be registered.

図3に戻って説明を続ける。制御部40は、例えば、コントローラ(controller)であり、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報提供装置10内部の記憶装置に記憶されている各種プログラム(通知プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部40は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。 The explanation will be continued by returning to FIG. The control unit 40 is, for example, a controller, and is an example of various programs (notification programs) stored in a storage device inside the information providing device 10 by a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or the like. Is realized by executing RAM as a work area. Further, the control unit 40 is a controller, and is realized by, for example, an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

図3に示すように、制御部40は、受付部41、生成部42、特定部43、推定部44、および提供部45を有する。受付部41は、モデルの登録を受付ける。例えば、受付部41は、外部端末100から事業者が生成したモデル、学習に使用した学習データ、分類目的を受付ける。このような場合、受付部41は、モデルのデータを、事業者を示す情報と、学習データを示す情報と、分類目的とに対応付けてモデルデータベース32に登録する。なお、登録されるモデルは、事業者自らが収集した利用者情報を用いて学習されたものであってもよく、情報提供装置10が管理する利用者情報を用いて事業者が学習を行ったモデルであってもよい。 As shown in FIG. 3, the control unit 40 includes a reception unit 41, a generation unit 42, a specific unit 43, an estimation unit 44, and a providing unit 45. The reception unit 41 accepts model registration. For example, the reception unit 41 receives a model generated by a business operator from an external terminal 100, learning data used for learning, and a classification purpose. In such a case, the reception unit 41 registers the model data in the model database 32 in association with the information indicating the business operator, the information indicating the learning data, and the classification purpose. The model to be registered may be one learned by using the user information collected by the business operator, and the business operator has learned by using the user information managed by the information providing device 10. It may be a model.

また、受付部41は、利用者情報の登録を受付ける。例えば、受付部41は、各種のログサーバ等から利用者情報を取得し、取得した利用者情報を利用者データベース31に登録する。 In addition, the reception unit 41 accepts the registration of user information. For example, the reception unit 41 acquires user information from various log servers and the like, and registers the acquired user information in the user database 31.

生成部42は、モデルの生成を行う。例えば、生成部42は、外部端末200から分類目的を受付けると、モデルデータベース32を参照し、分類目的が一致するモデルを検索する。そして、生成部42は、分類目的が一致するモデルが存在する場合は、検索したモデルを外部端末200に提供する。なお、生成部42は、外部端末200から分類対象となる利用者の利用者情報を受付け、検索したモデルを用いて受付けた利用者情報から利用者の分類を行い、分類結果のみを外部端末200に提供してもよい。すなわち、生成部42は、分類目的が一致するモデルを秘匿したまま、そのモデルを利用した分類処理の結果のみを事業者に対して提供してもよい。また、生成部42は、外部端末200から利用者の指定を受付けた場合、情報提供装置10が管理する利用者情報の中から指定された利用者の利用者情報を特定し、特定した利用者情報をモデルに入力することで、利用者の分類を行ってもよい。 The generation unit 42 generates a model. For example, when the generation unit 42 receives the classification purpose from the external terminal 200, the generation unit 42 refers to the model database 32 and searches for a model having the same classification purpose. Then, when there is a model having the same classification purpose, the generation unit 42 provides the searched model to the external terminal 200. The generation unit 42 receives the user information of the user to be classified from the external terminal 200, classifies the user from the received user information using the searched model, and displays only the classification result in the external terminal 200. May be provided to. That is, the generation unit 42 may provide only the result of the classification process using the model to the business operator while keeping the model having the same classification purpose secret. Further, when the generation unit 42 receives the user's designation from the external terminal 200, the generation unit 42 identifies the user information of the designated user from the user information managed by the information providing device 10, and the specified user. Users may be classified by inputting information into the model.

一方、生成部42は、分類目的が一致するモデルが存在しない場合は、モデルの生成を行う。例えば、生成部42は、分類目的をデータサイテンティスト等、所定のモデル作成者に対して提供し、モデルの学習に用いる利用者情報と、出力情報との組、すなわち、学習データの指定を受付ける。例えば、生成部42は、分類目的が「所定の広告を選択するか否か」である場合は、モデル作成者から、所定の広告を選択した利用者の利用者情報を正例とし、所定の広告を選択していない利用者の利用者情報を負例として受付けることとなる。なお、生成部42は、各種の文字解析技術等を用いて、このような正例と負例とを自動的に選択してもよい。そして、生成部42は、モデルに利用者情報が有する特徴を学習させることで、モデルの生成を行い、生成したモデルをモデルデータベース32に登録する。なお、生成部42は、このようにして生成されたモデルを事業者の利用に供してもよい。 On the other hand, the generation unit 42 generates a model when there is no model having the same classification purpose. For example, the generation unit 42 provides the classification purpose to a predetermined model creator such as a data scientist, and specifies a set of user information and output information used for learning the model, that is, designation of training data. Accept. For example, when the purpose of classification is "whether or not to select a predetermined advertisement", the generation unit 42 uses the user information of the user who has selected the predetermined advertisement from the model creator as a correct example, and determines the predetermined advertisement. User information of users who have not selected advertisements will be accepted as a negative example. The generation unit 42 may automatically select such a positive example and a negative example by using various character analysis techniques and the like. Then, the generation unit 42 generates the model by letting the model learn the characteristics of the user information, and registers the generated model in the model database 32. The generation unit 42 may use the model generated in this way for use by the business operator.

特定部43は、分類対象に関する対象情報が入力されると、入力された分類対象の分類を示す出力情報を出力するモデルにより対象情報から類似する出力情報が出力された複数の分類対象を特定する。例えば、特定部43は、分類対象である利用者に関する対象情報が入力されると分類対象の分類を示す出力情報を出力するモデルにより対象情報から類似する出力情報が出力された複数の利用者を特定する。より具体的には、特定部43は、利用者に関する対象情報として、利用者の属性を示す属性情報又は利用者の行動を示す行動情報が入力されると利用者の分類を示す出力情報を出力するモデルにより、属性情報または行動情報から類似する出力情報が出力された複数の利用者を特定する。 When the target information regarding the classification target is input, the identification unit 43 identifies a plurality of classification targets for which similar output information is output from the target information by a model that outputs output information indicating the classification of the input classification target. .. For example, the specific unit 43 selects a plurality of users for which similar output information is output from the target information by a model that outputs output information indicating the classification of the classification target when the target information regarding the user to be classified is input. Identify. More specifically, the specific unit 43 outputs output information indicating the classification of the user when the attribute information indicating the attribute of the user or the action information indicating the behavior of the user is input as the target information regarding the user. Identify multiple users for whom similar output information is output from attribute information or behavior information.

例えば、特定部43は、所定のタイミングで(例えば、一定期間ごとに)、モデルデータベース32を参照し、推定指標が登録されていないモデルを選択する。このような場合、特定部43は、選択したモデルの学習データ等から、モデルに入力する利用者情報の種別を特定する。そして、特定部43は、利用者データベース31に登録されている利用者情報のうち、特定した種別の情報を選択したモデルに入力することで、各利用者ごとの出力情報を取得する。 For example, the specific unit 43 refers to the model database 32 at a predetermined timing (for example, at regular intervals) and selects a model in which an estimation index is not registered. In such a case, the specifying unit 43 specifies the type of user information to be input to the model from the learning data of the selected model and the like. Then, the specific unit 43 acquires the output information for each user by inputting the specified type of information among the user information registered in the user database 31 into the selected model.

続いて、特定部43は、出力情報同士を比較し、出力情報が類似する利用者、すなわち、モデルにより同じグループに分類された利用者を分類利用者として特定する。例えば、特定部43は、出力情報の差が所定の範囲内に収まる利用者を分類利用者として特定すればよい。すなわち、特定部43は、対象情報のうち所定の種別の情報が有する特徴に応じた出力情報を出力するように学習が行われたモデルにより、類似する出力情報が出力された複数の分類対象を特定することとなる。 Subsequently, the specifying unit 43 compares the output information with each other, and identifies users having similar output information, that is, users classified into the same group by the model as classified users. For example, the identification unit 43 may specify a user whose output information difference is within a predetermined range as a classification user. That is, the specific unit 43 selects a plurality of classification targets to which similar output information is output by a model trained to output output information according to the characteristics of a predetermined type of information among the target information. It will be specified.

なお、特定部43は、モデルにより同じグループに分類された利用者を分類利用者とするのであれば、任意の処理を実行して良い。例えば、特定部43は、出力情報としてベクトルが出力される場合、ベクトル間のユークリッド距離、ハミング距離、コサイン距離等、出力情報が有する任意の類似性を算出し、算出した類似性が所定の範囲内に収まるベクトル群と対応する利用者を分類利用者としてもよい。また、特定部43は、例えば、ベクトルのうち所定の次元の値が所定の範囲内に収まるベクトル群と対応する利用者を分類利用者としてもよい。 Note that the specific unit 43 may execute arbitrary processing as long as the users classified into the same group according to the model are classified users. For example, when a vector is output as output information, the specific unit 43 calculates an arbitrary similarity of the output information such as an Euclidean distance, a Hamming distance, and a cosine distance between the vectors, and the calculated similarity is within a predetermined range. The user corresponding to the vector group that fits within may be a classified user. Further, the specific unit 43 may use, for example, a user corresponding to a vector group in which a value of a predetermined dimension falls within a predetermined range among the vectors as a classification user.

また、特定部43は、異なるグループの利用者情報の比較に基づいて、分類指標を推定する場合は、利用者情報が所定の類似性を有する利用者を比較利用者として特定する。例えば、特定部43は、利用者データベース31を参照し、各利用者の利用者情報を参照する。そして、特定部43は、利用者情報が所定の条件を満たす利用者群を比較利用者として特定する。例えば、特定部43は、分類指標の推定対象となるモデルの分類目的と対応する種別の利用者情報が、分類目的と対応する条件を満たす利用者(例えば、「性別」が「女性」である利用者や、「属性情報」に「ラーメンが好き」が含まれている利用者等)を比較利用者として特定する。すなわち、特定部43は、モデルとは異なるモデルであって、対象情報が所定の条件を満たすか否かに応じて分類対象を分類するモデルにより同じグループに分類された分類対象を特定する。 Further, when estimating the classification index based on the comparison of the user information of different groups, the specifying unit 43 identifies the users whose user information has a predetermined similarity as the comparative user. For example, the specific unit 43 refers to the user database 31 and refers to the user information of each user. Then, the identification unit 43 identifies a group of users whose user information satisfies a predetermined condition as comparative users. For example, in the specific unit 43, the user information of the type corresponding to the classification purpose of the model to be estimated by the classification index is a user who satisfies the condition corresponding to the classification purpose (for example, "gender" is "female"). Identify users and users whose "attribute information" includes "like ramen") as comparative users. That is, the identification unit 43 is a model different from the model, and identifies the classification targets classified into the same group by the model that classifies the classification targets according to whether or not the target information satisfies a predetermined condition.

推定部44は、特定された分類利用者の利用者情報に基づいて、モデルが利用者を分類する際の指標を推定する。すなわち、推定部44は、モデルによって同一のグループに分類された分類対象の対象情報に基づいて、モデルが分類対象を分類する際の指標を推定する。例えば、推定部44は、分類利用者の利用者情報が有する共通性に基づいて、モデルが利用者を分類する際の指標を推定する。例えば、推定部44は、分類利用者の利用者情報を参照し、共通する利用者の割合が所定の閾値を超える情報を特定する。より具体的な例を挙げると、推定部44は、全ての分類利用者の利用者情報に「ラーメンが好き」といった情報が含まれている場合は、「ラーメンが好き」という情報を推定指標とする。 The estimation unit 44 estimates an index when the model classifies the users based on the user information of the identified classification users. That is, the estimation unit 44 estimates an index when the model classifies the classification target based on the target information of the classification target classified into the same group by the model. For example, the estimation unit 44 estimates an index when the model classifies the users based on the commonality of the user information of the classified users. For example, the estimation unit 44 refers to the user information of the classified users and identifies the information in which the ratio of common users exceeds a predetermined threshold value. To give a more specific example, when the user information of all the classified users includes information such as "I like ramen", the estimation unit 44 uses the information "I like ramen" as an estimation index. do.

なお、推定部44は、分類利用者の利用者情報のうち、モデルが特徴を学習した種別以外の種別の情報の共通性に基づいて、分類指標を推定してもよい。例えば、推定部44は、モデルの分類目的から、モデルが特徴を学習したと推定される利用者情報の種別を推定する。例えば、推定部44は、学習データに用いられた利用者情報を特定し、特定した利用者情報に含まれる情報のうち、共通性が最も高い利用者情報の種別を学習種別として特定する。また、推定部44は、分類利用者の利用者情報の種別若しくは種別の組ごとに共通性を算出し、学習種別の共通性よりも高い共通性を有する種別若しくは種別の組が存在するか否かを判定する。そして、推定部44は、学習種別の共通性よりも高い共通性を有する種別若しくは種別の組が存在する場合は、最も共通性が高い種別もしくは種別の組を、推定指標としてもよい。また、推定部44は、学習種別の共通性が最も高い場合は、モデルが分類目的に対して適切な学習が行われたモデルである旨を推定してもよい。 The estimation unit 44 may estimate the classification index based on the commonality of the information of the types other than the type in which the model has learned the characteristics among the user information of the classification users. For example, the estimation unit 44 estimates the type of user information that the model is presumed to have learned the features from the purpose of classifying the model. For example, the estimation unit 44 identifies the user information used in the learning data, and specifies the type of user information having the highest commonality among the information included in the specified user information as the learning type. Further, the estimation unit 44 calculates the commonality for each type or group of types of user information of the classification user, and whether or not there is a type or group of types having a higher commonality than the commonality of the learning types. Is determined. Then, when the estimation unit 44 has a type or a set of types having a commonality higher than the commonality of the learning types, the type or a set of the types having the highest commonality may be used as an estimation index. Further, the estimation unit 44 may estimate that the model is a model in which appropriate learning has been performed for the purpose of classification when the learning types have the highest commonality.

また、推定部44は、分類利用者の利用者情報と比較利用者の利用者情報との比較に基づいて、モデルが分類対象を分類する際の指標を推定してもよい。例えば、推定部44は、分類利用者の利用者情報が有する共通性と、比較利用者の利用者情報が有する共通性とが類似する場合は、比較利用者を特定する際に用いたルールを推定指標としてもよい。また、推定部44は、分類利用者の利用者情報が有する共通性と比較利用者の利用者情報が有する共通性とが類似しない場合は、モデルが分類目的から想定される特徴以外の特徴を学習したと判定してもよい。 Further, the estimation unit 44 may estimate an index when the model classifies the classification target based on the comparison between the user information of the classification user and the user information of the comparison user. For example, when the commonality of the user information of the classified user and the commonality of the user information of the comparative user are similar, the estimation unit 44 uses the rule used when identifying the comparative user. It may be used as an estimation index. Further, when the commonality of the user information of the classification user and the commonality of the user information of the comparison user are not similar, the estimation unit 44 sets a feature other than the feature assumed for the purpose of classification by the model. It may be determined that it has been learned.

また、推定部44は、分類利用者の利用者情報と、出力情報との相関性に基づいて、モデルが分類対象を分類する際の指標を推定してもよい。例えば、推定部44は、分類利用者の各利用者情報や出力情報を数値化し、それぞれ個別の軸方向にプロットし、プロット結果に基づいて、利用者情報のうち、出力情報との相関性が最も高い種別若しくは種別の組を特定してもよい。また、推定部44は、分類利用者の利用者情報と出力情報との相関性を特定するとともに、比較利用者の利用者情報と出力情報との相関性を特定し、特定した相関性の類似性に基づいて、分類指標を推定してもよい。例えば、推定部44は、各相関性が類似しない場合は、モデルが分類目的から想定される特徴以外の特徴を学習したと判定してもよい。 Further, the estimation unit 44 may estimate an index when the model classifies the classification target based on the correlation between the user information of the classification user and the output information. For example, the estimation unit 44 digitizes each user information and output information of the classified users, plots them in individual axial directions, and based on the plot results, the correlation with the output information of the user information is determined. The highest type or set of types may be specified. Further, the estimation unit 44 specifies the correlation between the user information of the classified user and the output information, specifies the correlation between the user information of the comparative user and the output information, and resembles the specified correlation. Classification indicators may be estimated based on gender. For example, if the correlations are not similar, the estimation unit 44 may determine that the model has learned features other than those assumed for the purpose of classification.

また、推定部44は、利用者情報と、出力情報となるベクトルの各次元毎の値をそれぞれ個別の軸方向にプロットすることで、各次元と相関性が高い利用者情報の種別を特定してもよい。また、推定部44は、出力情報となるベクトルの所定の次元と、利用者情報との相関性を特定することで、各次元と対応する利用者情報の種別や種別の組を分類指標として推定してもよい。 Further, the estimation unit 44 identifies the type of user information that has a high correlation with each dimension by plotting the user information and the value of each dimension of the vector that becomes the output information in the individual axial directions. You may. Further, the estimation unit 44 estimates the type and type set of the user information corresponding to each dimension as a classification index by specifying the correlation between the predetermined dimension of the vector to be the output information and the user information. You may.

なお、推定部44は、推定した分類指標を推定指標としてモデルデータベース32に登録することとなる。 The estimation unit 44 will register the estimated classification index as an estimation index in the model database 32.

提供部45は、推定指標を事業者に提供する。例えば、提供部45は、モデルを利用したい事業者に対し、モデルの推定指標を提供してもよい。また、提供部45は、推定指標と分類目的とが対応しない場合は、モデルを生成した事業者に対して、推定指標を提供してもよい。 The providing unit 45 provides the estimation index to the business operator. For example, the providing unit 45 may provide an estimation index of the model to a business operator who wants to use the model. Further, when the estimation index and the classification purpose do not correspond to each other, the providing unit 45 may provide the estimation index to the business operator who generated the model.

〔3.処理手順〕
次に、図6を用いて、実施形態に係る情報提供装置10による推定処理の流れの一例について説明する。図6は、実施形態に係る推定処理の流れの一例を示すフローチャートである。
[3. Processing procedure]
Next, an example of the flow of the estimation process by the information providing device 10 according to the embodiment will be described with reference to FIG. FIG. 6 is a flowchart showing an example of the flow of the estimation process according to the embodiment.

例えば、情報提供装置10は、処理対象となるモデルを選択し(ステップS101)、選択したモデルを用いて、各利用者の利用者情報から出力情報を生成する(ステップS102)。そして、情報提供装置10は、生成した出力情報が類似する利用者を第1グループに属する利用者、すなわち、分類利用者として特定する(ステップS103)。続いて、情報提供装置10は、利用者情報が所定の条件を満たす利用者を第2グループに属する利用者、すなわち、比較利用者として特定する(ステップS104)。そして、情報提供装置10は、第1グループの利用者情報と第2グループの利用者情報との比較結果に基づいて、選択したモデルが利用者情報を分類する際の指標を推定し(ステップS105)、処理を終了する。 For example, the information providing device 10 selects a model to be processed (step S101), and uses the selected model to generate output information from the user information of each user (step S102). Then, the information providing device 10 identifies users having similar generated output information as users belonging to the first group, that is, classified users (step S103). Subsequently, the information providing device 10 identifies a user whose user information satisfies a predetermined condition as a user belonging to the second group, that is, a comparative user (step S104). Then, the information providing device 10 estimates an index when the selected model classifies the user information based on the comparison result between the user information of the first group and the user information of the second group (step S105). ), End the process.

〔4.変形例〕
上述した情報提供装置10は、上記実施形態以外にも種々の異なる形態にて実施されてもよい。そこで、以下では、情報提供装置10の他の実施形態について説明する。
[4. Modification example]
The information providing device 10 described above may be implemented in various different forms other than the above-described embodiment. Therefore, another embodiment of the information providing device 10 will be described below.

〔4−1.適用対象について〕
上述した例では、情報提供装置10は、利用者情報に基づいて、利用者の分類を行うモデルの推定指標を推定した。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、広告の分類や利用者に対して配信される各種コンテンツ等、任意の分類対象の分類を行うモデルについて、上述した推定指標の推定を行ってよい。例えば、情報提供装置10は、広告を分類対象とし、広告の対象となる取引対象の種別、名称、価格、製造者、販売者等を対象情報とし、入力された対象情報からその広告を好む利用者を推定するモデルについて、上述した推定処理を実行してもよい。
[4-1. Applicable target]
In the above example, the information providing device 10 estimates the estimation index of the model for classifying the users based on the user information. However, the embodiment is not limited to this. For example, the information providing device 10 may estimate the above-mentioned estimation index for a model that classifies an arbitrary classification target such as advertisement classification and various contents distributed to users. For example, the information providing device 10 targets an advertisement as a classification target, targets the type, name, price, manufacturer, seller, etc. of the transaction target to be the advertisement, and preferentially uses the advertisement from the input target information. The above-mentioned estimation process may be performed on the model for estimating the person.

また、情報提供装置10は、分類対象と対応する情報を対象情報とし、同一グループに分類された分類対象の対象情報から分類指標を推定するのであれば、任意の数の種別情報を対象情報としてもよく、任意の内容の情報を対象情報としてもよい。例えば、情報提供装置10は、利用者の性別、デモグラフィック属性、サイコグラフィック属性、検索クエリの履歴、各種ネットワーク上の行動履歴、利用者が投稿した情報の履歴である投稿履歴、購買履歴等、利用者に関する任意の情報を利用者情報として採用してもよい。 Further, the information providing device 10 uses the information corresponding to the classification target as the target information, and if the classification index is estimated from the target information of the classification target classified in the same group, an arbitrary number of type information is used as the target information. However, information of arbitrary contents may be used as the target information. For example, the information providing device 10 includes a user's gender, demographic attribute, psychographic attribute, search query history, behavior history on various networks, posting history which is a history of information posted by the user, purchase history, and the like. Arbitrary information about the user may be adopted as the user information.

〔4−2.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[4-2. others〕
Further, among the processes described in the above-described embodiment, all or a part of the processes described as being automatically performed can be manually performed, and conversely, the processes described as being manually performed. It is also possible to automatically perform all or part of the above by a known method. In addition, the processing procedure, specific name, and information including various data and parameters shown in the above document and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of the device is functionally or physically dispersed / physically distributed in any unit according to various loads and usage conditions. Can be integrated and configured.

また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 In addition, the above-described embodiments can be appropriately combined as long as the processing contents do not contradict each other.

〔4−3.プログラム〕
また、上述した実施形態に係る情報提供装置10は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[4-3. program〕
Further, the information providing device 10 according to the above-described embodiment is realized by, for example, a computer 1000 having a configuration as shown in FIG. 7. FIG. 7 is a diagram showing an example of a hardware configuration. The computer 1000 is connected to the output device 1010 and the input device 1020, and the arithmetic unit 1030, the primary storage device 1040, the secondary storage device 1050, the output IF (Interface) 1060, the input IF 1070, and the network IF 1080 are connected by the bus 1090. Has.

演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。 The arithmetic unit 1030 operates based on a program stored in the primary storage device 1040 or the secondary storage device 1050, a program read from the input device 1020, or the like, and executes various processes. The primary storage device 1040 is a memory device that temporarily stores data used by the arithmetic unit 1030 for various calculations, such as a RAM. Further, the secondary storage device 1050 is a storage device in which data used by the calculation device 1030 for various calculations and various databases are registered, such as a ROM (Read Only Memory), an HDD (Hard Disk Drive), and a flash memory. Is realized by.

出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。 The output IF 1060 is an interface for transmitting information to be output to an output device 1010 that outputs various information such as a monitor and a printer. For example, USB (Universal Serial Bus), DVI (Digital Visual Interface), and the like. It is realized by a connector of a standard such as HDMI (registered trademark) (High Definition Multimedia Interface). Further, the input IF 1070 is an interface for receiving information from various input devices 1020 such as a mouse, a keyboard, and a scanner, and is realized by, for example, USB.

なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。 The input device 1020 includes, for example, an optical recording medium such as a CD (Compact Disc), a DVD (Digital Versatile Disc), or a PD (Phase change rewritable Disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), or a tape. It may be a device that reads information from a medium, a magnetic recording medium, a semiconductor memory, or the like. Further, the input device 1020 may be an external storage medium such as a USB memory.

ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。 The network IF1080 receives data from another device via the network N and sends it to the arithmetic unit 1030, and also transmits the data generated by the arithmetic unit 1030 to the other device via the network N.

演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。 The arithmetic unit 1030 controls the output device 1010 and the input device 1020 via the output IF 1060 and the input IF 1070. For example, the arithmetic unit 1030 loads a program from the input device 1020 or the secondary storage device 1050 onto the primary storage device 1040, and executes the loaded program.

例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。 For example, when the computer 1000 functions as the information providing device 10, the arithmetic unit 1030 of the computer 1000 realizes the function of the control unit 40 by executing the program loaded on the primary storage device 1040.

〔5.効果〕
上述してきたように、情報提供装置10は、分類対象に関する対象情報が入力されると入力された分類対象の分類を示す出力情報を出力するモデルにより、対象情報から類似する出力情報が出力された複数の分類対象を特定する。そして、情報提供装置10は、特定された複数の分類対象の対象情報に基づいて、モデルが分類対象を分類する際の指標を推定する。このような処理の結果、情報提供装置10は、モデルが本当に学習した分類指標を推定することができるので、モデルが学習した特徴を示す情報を提供することができる。
[5. effect〕
As described above, the information providing device 10 outputs similar output information from the target information by the model that outputs the output information indicating the classification of the input classification target when the target information regarding the classification target is input. Identify multiple classification targets. Then, the information providing device 10 estimates an index when the model classifies the classification target based on the target information of the specified plurality of classification targets. As a result of such processing, the information providing device 10 can estimate the classification index that the model has really learned, so that it can provide information indicating the characteristics that the model has learned.

また、情報提供装置10は、特定された分類対象に関する対象情報の共通性に基づいて、モデルが分類対象を分類する際の指標を推定する。このため、情報提供装置10は、モデルが特徴を学習した情報を推定することができる。 Further, the information providing device 10 estimates an index when the model classifies the classification target based on the commonality of the target information regarding the specified classification target. Therefore, the information providing device 10 can estimate the information that the model has learned the features.

また、情報提供装置10は、モデルとして、対象情報のうち所定の種別の情報が有する特徴に応じた出力情報を出力するように学習が行われたモデルにより、類似する出力情報が出力された複数の分類対象を特定し、特定された分類対象の対象情報のうち、所定の種別以外の種別の情報の共通性に基づいて、モデルが分類対象を分類する際の指標を推定する。このため、情報提供装置10は、モデルの学習を行った事業者等が想定していない特徴をモデルが学習しているか否かを推定することができる。 Further, the information providing device 10 is a plurality of models to which similar output information is output by a model trained to output output information according to the characteristics of a predetermined type of information among the target information. The index for classifying the classification target by the model is estimated based on the commonality of the information of the types other than the predetermined type among the target information of the specified classification target. Therefore, the information providing device 10 can estimate whether or not the model is learning a feature that is not assumed by the business operator or the like who has learned the model.

また、情報提供装置10は、モデルにより対象情報から類似する出力情報が出力された分類対象を第1グループとして特定するとともに、対象情報が所定の類似性を有する分類対象を第2グループとして特定し、第1グループに属する分類対象の対象情報と、第2グループに属する分類対象の対象情報との比較に基づいて、モデルが分類対象を分類する際の指標を推定する。例えば、情報提供装置10は、第2グループとして、モデルとは異なるモデルであって、対象情報が所定の条件を満たすか否かに応じて分類対象を分類するモデルにより同じグループに分類された分類対象を特定する。このため、情報提供装置10は、より精度よくモデルが学習した特徴を示す情報を提供することができる。 Further, the information providing device 10 specifies the classification target for which similar output information is output from the target information by the model as the first group, and also identifies the classification target for which the target information has a predetermined similarity as the second group. , The index when the model classifies the classification target is estimated based on the comparison between the target information of the classification target belonging to the first group and the target information of the classification target belonging to the second group. For example, the information providing device 10 is a second group, which is a model different from the model, and is classified into the same group by a model that classifies the classification target according to whether or not the target information satisfies a predetermined condition. Identify the target. Therefore, the information providing device 10 can provide information indicating the features learned by the model more accurately.

また、情報提供装置10は、特定された分類対象の対象情報と、モデルが出力する出力情報との相関性に基づいて、モデルが分類対象を分類する際の指標を推定する。例えば、情報提供装置10は、対象情報のうち、出力情報との相関性が所定の条件を満たす情報の種別を、モデルが分類対象を分類する際の指標とする。また、情報提供装置10は、モデルが出力する出力情報との相関性が所定の条件を満たす情報の種別の組を、モデルが分類対象を分類する際の指標とする。このため、情報提供装置10は、モデルが学習した特徴を精度良く推定することができる。 Further, the information providing device 10 estimates an index when the model classifies the classification target based on the correlation between the specified target information of the classification target and the output information output by the model. For example, the information providing device 10 uses, among the target information, the type of information whose correlation with the output information satisfies a predetermined condition as an index when the model classifies the classification target. Further, the information providing device 10 uses a set of information types whose correlation with the output information output by the model satisfies a predetermined condition as an index when the model classifies the classification target. Therefore, the information providing device 10 can accurately estimate the features learned by the model.

また、情報提供装置10は、出力情報としてベクトルを出力するモデルにより対象情報から所定の次元の値が同一のベクトルが出力された複数の分類対象を特定し、特定された分類対象の対象情報に基づいて、モデルが出力するベクトルのうち所定の次元の値と対応する指標を推定する。このため、情報提供装置10は、出力情報となるベクトルの各次元ごとに、対象情報のうちどの対象情報と対応する値であるかを推定することができる。 Further, the information providing device 10 identifies a plurality of classification targets for which vectors having the same value of a predetermined dimension are output from the target information by a model that outputs a vector as output information, and uses the specified classification target information as the target information. Based on this, the index corresponding to the value of a predetermined dimension in the vector output by the model is estimated. Therefore, the information providing device 10 can estimate which target information of the target information corresponds to each dimension of the vector that becomes the output information.

また、情報提供装置10は、分類対象である利用者に関する対象情報が入力されると分類対象の分類を示す出力情報を出力するモデルにより対象情報から類似する出力情報が出力された複数の利用者を特定し、モデルが利用者を分類する際の指標を推定する。例えば、情報提供装置10は、利用者に関する対象情報として、利用者の属性を示す属性情報又は利用者の行動を示す行動情報が入力されると利用者の分類を示す出力情報を出力するモデルにより、属性情報または行動情報から類似する出力情報が出力された複数の利用者を特定する。このため、情報提供装置10は、利用者情報が有するどのような特徴をモデルが学習したかを推定することができる。 Further, the information providing device 10 is a plurality of users for which similar output information is output from the target information by a model that outputs output information indicating the classification of the classification target when the target information regarding the user to be classified is input. And estimate the indicators by which the model classifies users. For example, the information providing device 10 uses a model that outputs output information indicating the classification of the user when the attribute information indicating the attribute of the user or the action information indicating the behavior of the user is input as the target information regarding the user. , Identifies multiple users for whom similar output information is output from attribute information or behavioral information. Therefore, the information providing device 10 can estimate what kind of features the user information has learned by the model.

以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 The embodiments of the present application have been described in detail with reference to the drawings, but this is an example, and various modifications and improvements are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure column of the invention. It is possible to carry out the present invention in other forms described above.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、制御部は、制御手段や制御回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the control unit can be read as a control means or a control circuit.

10 情報提供装置
20 通信部
30 記憶部
31 利用者データベース
32 モデルデータベース
40 制御部
41 受付部
42 生成部
43 特定部
44 推定部
45 提供部
100、200 外部端末
10 Information providing device 20 Communication unit 30 Storage unit 31 User database 32 Model database 40 Control unit 41 Reception unit 42 Generation unit 43 Specific unit 44 Estimating unit 45 Providing unit 100, 200 External terminal

Claims (13)

分類対象に関する対象情報が入力されると当該分類対象の分類を示す出力情報を出力するモデルにより対象情報から類似する出力情報が出力された複数の分類対象を特定する特定部と、
前記特定部により特定された複数の分類対象の対象情報に基づいて、前記モデルが前記分類対象を分類する際の指標を推定する推定部と
を有することを特徴とする推定装置。
When the target information related to the classification target is input, a specific part that identifies a plurality of classification targets for which similar output information is output from the target information by a model that outputs output information indicating the classification of the classification target, and
An estimation device, characterized in that the model has an estimation unit that estimates an index for classifying the classification object based on target information of a plurality of classification objects specified by the specific unit.
前記推定部は、前記特定部により特定された分類対象に関する対象情報の共通性に基づいて、前記モデルが前記分類対象を分類する際の指標を推定する
ことを特徴とする請求項1に記載の推定装置。
The first aspect of claim 1, wherein the estimation unit estimates an index when the model classifies the classification object based on the commonality of target information regarding the classification object specified by the specific unit. Estimator.
前記特定部は、前記モデルとして、前記対象情報のうち所定の種別の情報が有する特徴に応じた出力情報を出力するように学習が行われた前記モデルにより、類似する出力情報が出力された複数の分類対象を特定し、
前記推定部は、前記特定部により特定された分類対象の対象情報のうち、前記所定の種別以外の種別の情報の共通性に基づいて、前記モデルが前記分類対象を分類する際の指標を推定する
ことを特徴とする請求項1または2に記載の推定装置。
The specific unit is a plurality of models to which similar output information is output by the model in which learning is performed so as to output output information according to a feature of a predetermined type of information among the target information. Identify the classification target of
The estimation unit estimates an index when the model classifies the classification target based on the commonality of information of a type other than the predetermined type among the target information of the classification target specified by the specific unit. The estimation device according to claim 1 or 2.
前記特定部は、前記モデルにより前記対象情報から類似する出力情報が出力された分類対象を第1グループとして特定するとともに、前記対象情報が所定の類似性を有する分類対象を第2グループとして特定し、
前記推定部は、前記第1グループに属する分類対象の対象情報と、前記第2グループに属する分類対象の対象情報との比較に基づいて、前記モデルが前記分類対象を分類する際の指標を推定する
ことを特徴とする請求項1に記載の推定装置。
The specific unit specifies a classification target for which similar output information is output from the target information by the model as a first group, and also identifies a classification target for which the target information has a predetermined similarity as a second group. ,
The estimation unit estimates an index when the model classifies the classification target based on the comparison between the target information of the classification target belonging to the first group and the target information of the classification target belonging to the second group. The estimation device according to claim 1, wherein the estimation device is used.
前記特定部は、前記第2グループとして、前記モデルとは異なるモデルであって、対象情報が所定の条件を満たすか否かに応じて前記分類対象を分類するモデルにより同じグループに分類された分類対象を特定する
ことを特徴とする請求項4に記載の推定装置。
As the second group, the specific unit is a model different from the model, and is classified into the same group by a model that classifies the classification target according to whether or not the target information satisfies a predetermined condition. The estimation device according to claim 4, wherein the target is specified.
前記推定部は、前記特定部により特定された分類対象の対象情報と、前記モデルが出力する出力情報との相関性に基づいて、前記モデルが前記分類対象を分類する際の指標を推定する
ことを特徴とする請求項1〜5のうちいずれか1つに記載の推定装置。
The estimation unit estimates an index when the model classifies the classification target based on the correlation between the target information of the classification target specified by the specific unit and the output information output by the model. The estimation device according to any one of claims 1 to 5.
前記推定部は、前記対象情報のうち、前記出力情報との相関性が所定の条件を満たす情報の種別を、前記モデルが前記分類対象を分類する際の指標とする
ことを特徴とする請求項6に記載の推定装置。
The claim is characterized in that the estimation unit uses, among the target information, the type of information whose correlation with the output information satisfies a predetermined condition as an index when the model classifies the classification target. 6. The estimation device according to 6.
前記推定部は、前記モデルが出力する出力情報との相関性が所定の条件を満たす情報の種別の組を、前記モデルが前記分類対象を分類する際の指標とする
ことを特徴とする請求項7に記載の推定装置。
The claim is characterized in that the estimation unit uses a set of information types whose correlation with the output information output by the model satisfies a predetermined condition as an index when the model classifies the classification target. 7. The estimation device according to 7.
前記特定部は、前記出力情報としてベクトルを出力するモデルにより前記対象情報から所定の次元の値が同一のベクトルが出力された複数の分類対象を特定し、
前記推定部は、前記特定部により特定された分類対象の対象情報に基づいて、前記モデルが出力するベクトルのうち前記所定の次元の値と対応する前記指標を推定する
ことを特徴とする請求項1〜8のうちいずれか1つに記載の推定装置。
The specific unit identifies a plurality of classification targets for which vectors having the same value of a predetermined dimension are output from the target information by a model that outputs a vector as the output information.
The claim is characterized in that the estimation unit estimates the index corresponding to the value of the predetermined dimension among the vectors output by the model based on the target information of the classification target specified by the specific unit. The estimation device according to any one of 1 to 8.
前記特定部は、前記分類対象である利用者に関する対象情報が入力されると当該分類対象の分類を示す出力情報を出力する前記モデルにより対象情報から類似する出力情報が出力された複数の利用者を特定し、
前記推定部は、前記モデルが前記利用者を分類する際の指標を推定する
ことを特徴とする請求項1〜9のうちいずれか1つに記載の推定装置。
The specific unit outputs output information indicating the classification of the classification target when the target information regarding the user to be classified is input. A plurality of users for which similar output information is output from the target information by the model. Identify and
The estimation device according to any one of claims 1 to 9, wherein the estimation unit estimates an index when the model classifies the users.
前記特定部は、前記利用者に関する対象情報として、当該利用者の属性を示す属性情報又は当該利用者の行動を示す行動情報が入力されると当該利用者の分類を示す出力情報を出力する前記モデルにより、前記属性情報または前記行動情報から類似する出力情報が出力された複数の利用者を特定する
ことを特徴とする請求項10に記載の推定装置。
When the attribute information indicating the attribute of the user or the action information indicating the behavior of the user is input as the target information regarding the user, the specific unit outputs output information indicating the classification of the user. The estimation device according to claim 10, wherein a plurality of users who have output similar output information from the attribute information or the behavior information are specified by a model.
推定装置が実行する推定方法であって、
分類対象に関する対象情報が入力されると当該分類対象の分類を示す出力情報を出力するモデルにより対象情報から類似する出力情報が出力された複数の分類対象を特定する特定工程と、
前記特定工程により特定された複数の分類対象の対象情報に基づいて、前記モデルが前記分類対象を分類する際の指標を推定する推定工程と
を含むことを特徴とする推定方法。
It is an estimation method performed by the estimation device.
When the target information related to the classification target is input, a specific process for identifying a plurality of classification targets for which similar output information is output from the target information by a model that outputs output information indicating the classification of the classification target, and
An estimation method comprising an estimation step of estimating an index when the model classifies the classification target based on the target information of a plurality of classification targets specified by the specific step.
分類対象に関する対象情報が入力されると当該分類対象の分類を示す出力情報を出力するモデルにより対象情報から類似する出力情報が出力された複数の分類対象を特定する特定手順と、
前記特定手順により特定された複数の分類対象の対象情報に基づいて、前記モデルが前記分類対象を分類する際の指標を推定する推定手順と
をコンピュータに実行させるための推定プログラム。
When the target information related to the classification target is input, the specific procedure for identifying multiple classification targets for which similar output information is output from the target information by the model that outputs the output information indicating the classification of the classification target, and
An estimation program for causing a computer to perform an estimation procedure for estimating an index when the model classifies the classification object based on the target information of a plurality of classification objects specified by the specific procedure.
JP2019032116A 2019-02-25 2019-02-25 Estimator, estimation method and estimation program Active JP6947768B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019032116A JP6947768B2 (en) 2019-02-25 2019-02-25 Estimator, estimation method and estimation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019032116A JP6947768B2 (en) 2019-02-25 2019-02-25 Estimator, estimation method and estimation program

Publications (2)

Publication Number Publication Date
JP2020135770A JP2020135770A (en) 2020-08-31
JP6947768B2 true JP6947768B2 (en) 2021-10-13

Family

ID=72278837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019032116A Active JP6947768B2 (en) 2019-02-25 2019-02-25 Estimator, estimation method and estimation program

Country Status (1)

Country Link
JP (1) JP6947768B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6945708B1 (en) * 2020-10-21 2021-10-06 ヤフー株式会社 Information processing equipment, information processing methods and information processing programs
JP7032595B1 (en) * 2021-05-20 2022-03-08 ヤフー株式会社 Information providers, information processing methods, and programs
JP7032594B1 (en) 2021-05-20 2022-03-08 ヤフー株式会社 Information providers, information processing methods, and programs
JP7778674B2 (en) * 2022-11-18 2025-12-02 Lineヤフー株式会社 Information providing device, information providing method, and information providing program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114531A (en) * 1993-10-14 1995-05-02 Nippon Telegr & Teleph Corp <Ntt> Non-linear system identification method
JP2006221329A (en) * 2005-02-09 2006-08-24 Toshiba Corp Behavior prediction device, behavior prediction method, and behavior prediction program
EP2288987A4 (en) * 2008-06-12 2015-04-01 Guardian Analytics Inc Modeling users for fraud detection and analysis

Also Published As

Publication number Publication date
JP2020135770A (en) 2020-08-31

Similar Documents

Publication Publication Date Title
Shankar et al. An intelligent recommendation system in e-commerce using ensemble learning
JP6947768B2 (en) Estimator, estimation method and estimation program
CN107526850A (en) Social networks friend recommendation method based on multiple personality feature mixed architecture
JP2018045553A (en) Selection device, selection method, and selection program
JP6767342B2 (en) Search device, search method and search program
JP6814115B2 (en) Specific device, specific method and specific program
JP2018045505A (en) Determination device, determination method, and determination program
CN110162711A (en) A kind of resource intelligent recommended method and system based on internet startup disk method
Shambour et al. A trust-based recommender system for personalized restaurants recommendation
Rahim et al. An efficient recommender system algorithm using trust data
JP7127080B2 (en) Determination device, determination method and determination program
Nandan et al. Designing an efficient restaurant recommendation system based on customer review comments by augmenting hybrid filtering techniques
JP6541737B2 (en) Selection apparatus, selection method, selection program, model and learning data
JP6910873B2 (en) Specific device and specific method
JP7419313B2 (en) Information processing device, information processing method, and information processing program
JP6956133B2 (en) model
US11282104B2 (en) Provision device, provision method and non-transitory computer readable storage medium
JP7742375B2 (en) Information processing device, information processing method, and information processing program
CN113781076A (en) Prompting method, device, equipment and readable storage medium
JP7459041B2 (en) Information processing device, information processing method, and information processing program
Srifi et al. A concise survey on content recommendations
JP7434264B2 (en) Information processing device, information processing method, and information processing program
Liao et al. Improved recommendation system using friend relationship in SNS
Vongsingthong et al. Classification of university students' behaviors in sharing information on Facebook
JP6976202B2 (en) Information processing equipment, information processing methods, and information processing programs

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200917

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210813

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210916

R150 Certificate of patent or registration of utility model

Ref document number: 6947768

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250