JP6956133B2 - model - Google Patents
model Download PDFInfo
- Publication number
- JP6956133B2 JP6956133B2 JP2019072876A JP2019072876A JP6956133B2 JP 6956133 B2 JP6956133 B2 JP 6956133B2 JP 2019072876 A JP2019072876 A JP 2019072876A JP 2019072876 A JP2019072876 A JP 2019072876A JP 6956133 B2 JP6956133 B2 JP 6956133B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- providing device
- posted
- candidate
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、モデルに関する。 The present invention relates to a model.
従来、人物や事象等の概念をエンティティとし、エンティティ間の関係性を構造化したナレッジベースと呼ばれる技術が知られている。また、このようなナレッジデータベースを効率的に作成するため、エンティティのクラスタリングを行い、クラスタリングの結果に基づいて、エンティティ間の関係性を更新する技術が知られている。 Conventionally, a technique called a knowledge base has been known in which the concept of a person or an event is used as an entity and the relationship between the entities is structured. Further, in order to efficiently create such a knowledge database, there is known a technique of clustering entities and updating relationships between entities based on the result of clustering.
しかしながら、上述した技術では、新たなエンティティを効率よく追加することができない場合がある。 However, with the above-mentioned technique, it may not be possible to efficiently add a new entity.
例えば、ニュース記事等、インターネット上に投稿されたコンテンツから新たなエンティティ(以下、「新出エンティティ」と記載する。)を抽出するといった手法が考えられる。しかしながら、どのコンテンツにどのような新出エンティティが含まれているかを推定するのは、困難である。 For example, a method of extracting a new entity (hereinafter referred to as "new entity") from the content posted on the Internet such as a news article can be considered. However, it is difficult to estimate what kind of new entity is included in which content.
本願は、上記に鑑みてなされたものであって、新出エンティティの追加を効率化することを目的とする。 The present application has been made in view of the above, and an object of the present application is to streamline the addition of new entities.
本願に係るモデルは、所定の要素に関する投稿情報が入力される入力層と、出力層と、前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第1要素と、前記第1要素と前記第1要素の重みとに基づいて値が算出される第2要素と、を含み、前記入力層に入力された情報に対し、前記出力層以外の各層に属する各要素を前記第1要素として、前記第1要素と前記第1要素の重みとに基づく演算を行うことにより、前記投稿情報が新たな要素に関する投稿情報であるか否かを示す値を前記出力層から出力するよう、コンピュータを機能させることを特徴とする。 The model according to the present application is a first layer that is any of an input layer, an output layer, and a layer from the input layer to the output layer into which post information regarding a predetermined element is input, and belongs to a layer other than the output layer. It includes an element and a second element whose value is calculated based on the first element and the weight of the first element, and belongs to each layer other than the output layer with respect to the information input to the input layer. By performing an operation based on the first element and the weight of the first element with each element as the first element, a value indicating whether or not the posted information is posted information related to a new element is output. It is characterized by making the computer function so that it outputs from the layer.
実施形態の一態様によれば、新出エンティティの追加を効率化することができる。 According to one aspect of the embodiment, the addition of new entities can be streamlined.
以下に、本願に係るモデルを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係るモデルが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Hereinafter, embodiments of the model according to the present (hereinafter referred to as "embodiment".) Will be described in detail with reference to the drawings. It should be understood that model according to the present application is limited by this embodiment. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description is omitted.
[実施形態]
〔1.情報提供装置が提供する処理について〕
まず、図1を用いて、選択装置の一例となる情報提供装置が実行する選択処理の一例について説明する。図1は、実施形態に係る情報提供装置が実行する処理の一例を示す図である。なお、以下の説明では、情報提供装置10が実行する処理として、知識を体系化、組織化した情報が登録されるナレッジデータベースに登録する新たなエンティティを検出するモデルを作成するための学習データの元となるエンティティを選択する選択処理の一例について説明する。
[Embodiment]
[1. About the processing provided by the information providing device]
First, an example of the selection process executed by the information providing device, which is an example of the selection device, will be described with reference to FIG. FIG. 1 is a diagram showing an example of processing executed by the information providing device according to the embodiment. In the following description, as the process executed by the
〔1−1.情報提供装置の概要〕
情報提供装置10は、インターネット等の所定のネットワークN(例えば、図2を参照。)を介して、ログサーバ100、および説明コンテンツサーバ200と通信可能な情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。なお、情報提供装置10は、ネットワークNを介して、任意の数のログサーバ100や説明コンテンツサーバ200と通信可能であってよい。また、情報提供装置10は、例えば、利用者が使用する利用者端末(図示は、省略)からの要求に基づいて、ナレッジデータベースに登録された各種情報の提供を行う機能を有するものとする。
[1-1. Overview of information providing equipment]
The
例えば、利用者端末は、ナレッジデータベースの検索を行う際の検索クエリを情報提供装置10に送信する。このような場合、情報提供装置10は、検索クエリと対応する情報をナレッジデータベースから検索し、検索結果を利用者端末へと提供する。
For example, the user terminal transmits a search query for searching the knowledge database to the
ここで、情報提供装置10が検索するナレッジデータベースについて説明する。ナレッジデータベースには、各種の知識が体系化、組織化された状態で登録されている。例えば、ナレッジデータベースには、登録される要素であるエンティティ(以下、「要素」と記載する場合がある。)と、エンティティ間の関係性を示す情報(以下、「関係情報」と記載する。)とが登録されている。エンティティは、実世界における人物、物体、建築物等の主語となりうる各種の物、職業や国籍等といった属性、各種の状態や事象等、世の中における各種の物事に対応する情報である。また、関係情報は、2つのエンティティ間の関係性を示す情報である。なお、情報提供装置10が有するナレッジデータベースにおける要素(すなわち、ナレッジデータベースに登録されたエンティティ)は、任意の物事や事象と対応していてよい。
Here, the knowledge database searched by the
ログサーバ100は、各種の履歴を保持する情報処理装置であり、サーバ装置やクラウドシステム等により実現される。例えば、ログサーバ100は、インターネットを介した各種の検索を行う際に利用者が入力した検索クエリのログを保持する。例えば、ログサーバ100は、ウェブ検索、路線検索、電子商店街における取引対象の検索、地図検索、コンテンツ検索等、任意の検索における検索クエリのログを保持する。
The
また、ログサーバ100は、インターネット上に投稿された各種のコンテンツである投稿情報を保持する。例えば、ログサーバ100は、ウェブサイト上に投稿されたニュース、ブログ、SNS(Social Networking Service)等を保持する。なお、ログサーバ100は、ニュースを配信するサーバ装置、ブログを管理するサーバ装置、SNSを管理するサーバ装置等によって実現されてもよい。
In addition, the
説明コンテンツサーバ200は、人物、物体、建築物、コンテンツ、事象等、各種の要素を説明する説明コンテンツの管理や配信を行う情報処理装置であり、サーバ装置やクラウドシステム等により実現される。例えば、説明コンテンツサーバ200は、ウィキペディア(登録商標)やインターネットを介した辞書サービス等、ナレッジデータベースにおいて要素となりえる各種の対象を説明するコンテンツである説明コンテンツの管理や配信を行う。
The
〔1−2.選択処理について〕
ここで、ナレッジデータベースに新たな事柄を示す要素を登録する処理を考える。このようなナレッジデータベースに新たな要素(以下、「新出要素」と記載する。)を登録するには、新出要素を示す文字列のみならず、新出要素が他の要素とどのような関係を有するかを示す関係情報が必要となる。このような新出要素や関係情報を効率よくナレッジデータベースに追加するため、ニュース記事等、インターネット上に投稿されたコンテンツから新出要素を抽出するといった手法が考えられる。しかしながら、どのコンテンツにどのような新出要素が含まれているかを判断するのは、困難である。
[1-2. About selection process]
Here, consider the process of registering an element indicating a new matter in the knowledge database. In order to register a new element (hereinafter referred to as "new element") in such a knowledge database, not only the character string indicating the new element but also what kind of new element is different from other elements. Relationship information indicating whether or not they have a relationship is required. In order to efficiently add such new elements and related information to the knowledge database, a method of extracting new elements from contents posted on the Internet such as news articles can be considered. However, it is difficult to determine what kind of new element is included in which content.
そこで、情報提供装置10は、以下の選択処理を実行する。まず、情報提供装置10は、新たな要素の候補である要素候補に関する検索履歴と、要素候補に関する投稿情報とを特定する。続いて、情報提供装置10は、特定された検索履歴と、特定された投稿情報とに基づいて、要素候補のうち、新たな要素に関する情報の特徴をモデルに学習させるための学習データを生成するための要素候補を選択する。
Therefore, the
例えば、ある単語を要素候補とする場合、その単語を含む検索履歴からは、その単語の検索の状況を推定することができる。また、その単語を含む投稿からは、その単語の投稿の状況を推定することができる。このような検索の状況や投稿の状況は、その単語が新出要素を示すか否かの指標となりえる。例えば、その単語が新出要素を示す場合、その単語の検索や投稿は、ある日から突然行われるとも考えられる。そこで、情報提供装置10は、検索履歴が示す検索の状況と、投稿情報が示す投稿の状況とに基づいて、新出要素である可能性が高い要素候補を選択する。
For example, when a word is used as an element candidate, the search status of the word can be estimated from the search history including the word. In addition, the status of posting of the word can be estimated from the posts including the word. The status of such a search or the status of posting can be an index of whether or not the word indicates a new element. For example, if the word indicates a new element, the search or posting of the word may be sudden from one day. Therefore, the
例えば、情報提供装置10は、ある要素候補に関する検索履歴が示す検索の数と、その要素候補に関する投稿履歴が示す投稿情報の数とに基づいて、学習データを生成するための要素候補の選択を行う。例えば、情報提供装置10は、検索の数の変化の内容と、投稿の数の変化の内容とに基づいて、学習データを生成するための要素候補の選択を行う。より具体的な例を挙げると、情報提供装置10は、ある日を境に検索が行われ、かつ、その日を境に投稿が行われるようになった要素候補を学習データを生成するための要素候補として選択する。
For example, the
また、情報提供装置10は、選択処理によって選択された要素候補に基づいて、モデルの学習を行う学習処理を実行する。すなわち、情報提供装置10は、選択された要素候補に関する情報を用いて、新たな要素に関する情報の特徴をモデルに学習させる。例えば、情報提供装置10は、選択された要素候補、選択された要素候補に関する投稿情報、および選択された要素候補と他の要素との関係性を示す関係情報との組を学習データとして生成する。そして、情報提供装置10は、学習データを用いて、モデルの学習を行う。
Further, the
より具体的には、情報提供装置10は、選択された要素候補に関する投稿情報を用いて、投稿情報が新たな要素に関する投稿であるか否かを判定する判定モデルの学習を行う。また、情報提供装置10は、選択された要素候補と、選択された要素候補に関する投稿情報を用いて、投稿情報に含まれる新たな要素を抽出する要素抽出モデルの学習を行う。また、情報提供装置10は、選択された要素候補に関する投稿情報と、選択された要素候補と他の要素との関係性とを用いて、投稿情報に含まれる新たな要素と他の要素との関係性を示す関係情報を抽出する関係推定モデルの学習を行う。例えば、情報提供装置10は、投稿情報から、新出属性との間に所定の関係性を有する他の要素を抽出する複数のモデルであって、それぞれ異なる関係性を有する他の要素を抽出する複数のモデルを学習する。
More specifically, the
また、情報提供装置10は、学習処理によって学習が行われたモデルを用いて、投稿情報から新出要素や関係情報を抽出し、抽出した新出要素や関係情報に基づいて、ナレッジデータベースを更新する更新処理を実行する。
Further, the
〔1−3.情報提供装置が実行する処理の一例について〕
以下、図1を用いて、情報提供装置10が実行する選択処理、学習処理、および更新処理(以下、「各処理」と総称する場合がある。)の一例について説明する。まず、情報提供装置10は、選択処理を実行する。このような選択処理において、情報提供装置10は、まず、所定の期間内に作成された説明コンテンツを説明コンテンツサーバ200から取得する(ステップS1)。
[1-3. About an example of the processing executed by the information providing device]
Hereinafter, an example of a selection process, a learning process, and an update process (hereinafter, may be collectively referred to as “each process”) executed by the
例えば、ある事柄に対して説明コンテンツが新たに登録された場合、その説明コンテンツが説明する事柄は、新出要素となる可能性が高い。そこで、情報提供装置10は、登録されてから経過した日時が所定の期間内(例えば、数か月)となる説明コンテンツを説明コンテンツサーバ200から取得する。
For example, when explanatory content is newly registered for a certain matter, the matter explained by the explanatory content is likely to be a new element. Therefore, the
続いて、情報提供装置10は、説明コンテンツから、新出要素の候補となる要素(以下、「要素候補」と記載する。)と、要素候補と他の要素との関係を示す関係情報とを抽出する(ステップS2)。例えば、図1に示す例では、情報提供装置10は、説明コンテンツを識別する説明コンテンツID(Identifier)が「コンテンツID#1」となる説明コンテンツ「説明コンテンツ#1」であって、登録日時が「日時#1」となる説明コンテンツを取得する。このような場合、情報提供装置10は、説明コンテンツの主題を示すと推定される文字列を要素候補として抽出するとともに、要素候補と他の要素との間の関係性を示す関係情報を説明コンテンツの内容から推定する。すなわち、情報提供装置10は、説明コンテンツが新たに登録された場合は、その説明コンテンツから要素候補を取得する。
Subsequently, the
ここで、情報提供装置10は、形態素解析や意味推定等の各種文章解析技術を用いて、要素候補や関係情報を抽出してよい。また、例えば、説明コンテンツには、説明コンテンツの主題となる事柄がどれであるか、主題となる事柄と他の事柄との間の関係性が何であるかを示す情報(例えば、インフォボックスと呼ばれる情報)が含まれる場合がある。このようなインフォボックスが説明コンテンツに含まれる場合、情報提供装置10は、インフォボックスから要素候補や関係情報を抽出してもよい。
Here, the
また、例えば、情報提供装置10は、説明コンテンツが登録されてから所定の期間内(例えば、1か月)以内にインフォボックスが追加された場合には、かかるインフォボックスに登録された関係情報を要素候補の関係情報として採用してもよい。また、インフォボックスには、要素候補のカテゴリやクラス等といった分類を示す分類情報が含まれる場合がある。このような分類情報がインフォボックスに含まれる場合、情報提供装置10は、要素候補の分類情報をインフォボックスから抽出してもよい。
Further, for example, when the infobox is added within a predetermined period (for example, one month) after the explanatory content is registered, the
このような処理の結果、情報提供装置10は、要素候補と、要素候補と紐付けられる関係情報との組を候補データとして抽出する。例えば、情報提供装置10は、説明コンテンツ#1に、要素候補#1と、要素候補#1と他の第1要素との関係性を示す関係情報#1−1と、要素候補#1と他の第2要素との関係性を示す関係情報#1−2とが含まれている場合、説明コンテンツ#1から、要素候補#1と、関係情報群#1(関係情報#1−1、および関係情報#1−2)とを対応付けた候補データ#1を生成する。なお、情報提供装置10は、候補データ#1に要素候補と紐付けられる分類情報を含めてもよい。
As a result of such processing, the
ここで、新たに説明コンテンツが登録された事柄には、新出要素に関する説明コンテンツ以外にも、例えば、既に存在した他言語の説明コンテンツを日本語に翻訳した説明コンテンツ等、新たな事柄に関する説明コンテンツ以外のコンテンツが含まれる場合がある。そこで、情報提供装置10は、候補データの中から、新出要素の確度が高い要素候補の候補データを選択する。より具体的には、情報提供装置10は、要素候補の検索履歴と、要素候補に関する投稿情報とを取得する(ステップS3)。そして、情報提供装置10は、特定した検索履歴の数と、投稿情報の数とに基づいて、新出要素とする要素候補を選択する。
Here, in addition to the explanation content related to the new element, the matters for which the explanation content is newly registered include explanations related to new matters such as explanation content obtained by translating the explanation content of another language that already exists into Japanese. Content other than content may be included. Therefore, the
例えば、情報提供装置10は、所定の日時における検索履歴と投稿履歴との増加量が所定の条件を満たす要素候補を特定し、特定した要素候補に基づいた学習データを生成する(ステップS4)。より具体的には、情報提供装置10は、説明コンテンツから抽出した複数の要素候補のうち、所定の日時において、検索履歴の数の増加量が所定の閾値を超え、かつ、投稿情報の数の増加量が所定の閾値を超えた要素候補を選択する。
For example, the
例えば、新作の映画を新出要素とする態様について考える。このような新作の映画が発表された場合、その映画のタイトルを検索クエリとする検索の回数は、発表前と比較して、発表後に急増すると考えられる。また、このような新作の映画が発表された場合、新作の映画のタイトルを含むニュースやSNSの数が発表前と比較して、発表後に急増すると考えられる。このため、新出要素を検索クエリとする検索の回数や投稿情報の数は、ある日時を境に急増すると考えられる。また、このような新作の映画が発表された場合、発表してからある程度の期間が経過してから説明コンテンツが生成されることとなる。さらに、小説が映画化されたというような場合には、映画の発表日時よりも前に検索クエリや投稿情報に要素候補が含まれると考えられる。さらに、その映画のタイトルを含む検索クエリの増加と、その映画のタイトルを含む投稿情報の増加とが連動していない場合は、その映画のタイトルとなる文字列と同じ文字列であって、異なる事柄を示す文字列が検索もしくは投稿されていると考えられる。 For example, consider a mode in which a new movie is a new element. When such a new movie is announced, the number of searches using the title of the movie as a search query is expected to increase sharply after the announcement compared to before the announcement. In addition, when such a new movie is announced, it is considered that the number of news and SNS including the title of the new movie will increase sharply after the announcement as compared with before the announcement. For this reason, it is thought that the number of searches and the number of posted information using new elements as search queries will increase sharply after a certain date and time. In addition, when such a new movie is announced, the explanatory content will be generated after a certain period of time has passed since the announcement. Furthermore, if the novel is made into a movie, it is considered that the element candidates are included in the search query and the posted information before the movie announcement date and time. Furthermore, if the increase in search queries that include the movie title and the increase in post information that includes the movie title are not linked, the string is the same as the string that is the title of the movie, but different. It is probable that a character string indicating the matter has been searched or posted.
そこで、情報提供装置10は、要素候補を抽出した説明コンテンツが登録された日時を基準日時とし、基準日時よりも所定の期間だけ前の検索履歴や投稿情報を取得する。例えば、情報提供装置10は、基準日時の過去1年間に入力された検索クエリであって、要素候補を含む検索クエリや、基準日時の過去1年間に投稿された投稿情報であって、要素候補を含む投稿情報を取得する。そこで、情報提供装置10は、説明コンテンツから抽出した要素候補のうち、所定の日時よりも前における検索履歴および投稿情報が存在せず、かつ、所定の日時において検索履歴の数が所定の閾値を超え、かつ、投稿情報の数が所定の閾値を超えた要素候補を選択する。
Therefore, the
例えば、図1に示す例では、要素候補#1を含む検索クエリの数の変遷を各日時ごとに点線でプロットし、要素候補#1を含む投稿情報の数の変遷を各日付ごとに直線でプロットした。図1に示す例では、図1中(A)に示すように、ある日時まで検索クエリおよび投稿情報の数が「0」となり、図1中(B)に示すように、ある日時で検索クエリおよび投稿情報の数が急増している。このように、要素候補#1を含む検索クエリの数および投稿情報の数が、同じ日時に「0」から「1」以上へと変遷した場合は、要素候補#1が新出要素である可能性が高い。このような場合、情報提供装置10は、要素候補#1を学習対象として選択し、要素候補#1の候補データ#1を学習データ#1とする。
For example, in the example shown in FIG. 1, the transition of the number of search queries including the
また、情報提供装置10は、要素候補を含む投稿情報のうち、投稿情報の数が急増した日時に投稿された投稿情報を学習データとして抽出する。例えば、図1に示す例では、情報提供装置10は、要素候補#1を含む投稿情報のうち、投稿情報の数が「0」から「1」以上に変化した日時に投稿された投稿情報群#1を抽出し、抽出した投稿情報群#1を学習データ#1に含める。このような選択処理の結果、情報提供装置10は、新出要素である可能性が高い要素候補と、その要素候補と他の候補との関係性を示す関係情報と、その要素候補を含む投稿情報とを学習データとして取得することができる。
Further, the
ここで、上述した選択処理においては、検索クエリの数および投稿情報の数が、同じ日時に「0」から「1」以上へと変遷した場合は、その日時に投稿された投稿情報を学習データとして抽出した。このように、検索クエリの数および投稿情報の数が「0」から「1」以上へと変遷した日時に投稿された投稿情報は、要素候補を新出要素として説明する投稿情報であると考えられる。 Here, in the above-mentioned selection process, if the number of search queries and the number of posted information change from "0" to "1" or more on the same date and time, the posted information posted on that date and time is learned data. Extracted as. In this way, the posted information posted on the date and time when the number of search queries and the number of posted information changed from "0" to "1" or more is considered to be posted information that explains the element candidate as a new element. Be done.
このように要素候補を新出要素として説明する投稿情報には、要素候補が新出要素であることを示す様な特徴を有する文章が含まれていると考えられる。このため、このような投稿情報の特徴を学習した場合、投稿情報に新出要素が含まれているか否かを推定するモデルを作成することができると考えられる。 It is considered that the posted information for explaining the element candidate as a new element includes a sentence having a feature indicating that the element candidate is a new element. Therefore, when learning the characteristics of such posted information, it is considered possible to create a model for estimating whether or not the posted information contains new elements.
また、要素候補を新出要素として説明する投稿情報には、新出要素である要素候補の文字列が含まれていると考えられる。このため、このような投稿情報の特徴を学習した場合、投稿情報から新出要素と推定される文字列を抽出するモデルを作成することができると考えられる。 Further, it is considered that the post information that explains the element candidate as a new element includes the character string of the element candidate that is the new element. Therefore, when learning the characteristics of such posted information, it is considered possible to create a model for extracting a character string presumed to be a new element from the posted information.
また、要素候補を新出要素として説明する投稿情報には、新出要素である要素候補を説明する文字列、すなわち、新出要素である要素候補と他の要素との関連性を示す文字列が含まれていると考えられる。このため、このような投稿情報の特徴を学習した場合、投稿情報から新出要素と他の要素との関係性を示す関係情報を推定するモデルを作成することができると考えられる。 In addition, the post information that explains the element candidate as a new element includes a character string that explains the element candidate that is the new element, that is, a character string that indicates the relationship between the element candidate that is the new element and other elements. Is considered to be included. Therefore, when learning the characteristics of such posted information, it is considered possible to create a model for estimating the relationship information indicating the relationship between the new element and other elements from the posted information.
そこで、情報提供装置10は、選択処理によって生成された学習データを用いて、投稿情報が新出要素を含むか否かを判定する判定モデル、投稿情報から新出要素を抽出する抽出モデル、および投稿情報から新出要素と他の要素との関係性を示す関係情報を推定する関係推定モデルを学習する(ステップS5)。例えば、情報提供装置10は、学習データ#1に含まれる投稿情報群#1を正解データとし、正解データが有する特徴をモデルに学習させることで、投稿情報が新出要素を示す投稿情報であるか否かを判定する判定モデルを生成する。より具体的な例を挙げると、情報提供装置10は、学習データ#1に含まれる投稿情報群#1を入力した際に、入力された投稿情報に新出要素が含まれる旨を示す情報を出力し、要素候補#1を含む投稿情報であって、投稿情報群#1に含まれない投稿情報を入力した際に、入力された投稿情報に新出要素が含まれない旨を示す情報を出力するように、判定モデルの学習を行う。
Therefore, the
また、情報提供装置10は、要素候補#1と投稿情報群#1とを正解データとし、正解データが有する特徴をモデルに学習させることで、投稿情報から新出要素を抽出する抽出モデルを生成する。より具体的な例を挙げると、情報提供装置10は、投稿情報群#1に含まれる各投稿情報を入力した際に、要素候補#1を示す情報を出力するように、抽出モデルの学習を行う。すなわち、情報提供装置10は、投稿情報群#1を入力データとした際に、出力データが要素候補#1となるように、抽出モデルの学習を行う。
Further, the
また、情報提供装置10は、投稿情報群#1と関係情報群#1とを正解データとし、正解データが有する特徴をモデルに学習させることで、投稿情報から新出要素の関係情報を推定する関係推定モデルを生成する。より具体的な例を挙げると、情報提供装置10は、投稿情報群#1に含まれる各投稿情報を入力した際に、関係情報群#1に含まれる関係情報を推定するように、関係推定モデルの学習を行う。
Further, the
例えば、情報提供装置10は、関係推定モデルとして、投稿情報から、新出要素との間に所定の関係性を有する他の要素を抽出する複数のモデルであって、それぞれ異なる関係性を有する他の要素を抽出する複数のモデルを学習する。例えば、情報提供装置10は、学習データ#1に含まれる各投稿情報から、任意の文章解析技術を用いて、要素候補との間に所定の関係性を有する他の要素を抽出する。
For example, the
例えば、情報提供装置10は、投稿情報が新作映画の説明である場合、出演者の文字列、監督の文字列、配給会社の文字列等を抽出する。そして、情報提供装置10は、例えば、投稿情報を入力した際に、出演者の文字列を抽出するよう第1の関係推定モデルを学習し、投稿情報を入力した際に、監督の文字列を抽出するよう第2の関係推定モデルを学習し、投稿情報を入力した際に、配給会社の文字列を抽出するよう第3の関係推定モデルを学習する。
For example, when the posted information is a description of a new movie, the
ここで、情報提供装置10は、任意の予測モデルを用いて関係推定モデルの学習を行ってよい。例えば、情報提供装置10は、ナレッジベースに登録済みのエンティティと関係情報とに基づいて、関係推定モデルの学習を行ってもよい。より具体的な例を挙げると、情報提供装置10は、投稿情報に含まれる要素であって、要素候補と所定の関係性を有する他の要素がナレッジデータベース中のエンティティである特性を利用し、かかる「他の要素」が人間であるか否か、人間である場合には性別や職業が何であるかをナレッジデータベースから特定する。そして、情報提供装置10は、特定した関係情報と要素候補と要素との間の関係性を関係推定モデルに学習させてもよい。すなわち、情報提供装置10は、投稿情報に含まれる各要素と要素候補との間の関係性を予測する関係推定モデルの学習を行ってもよい。
Here, the
そして、情報提供装置10は、各モデルを用いて更新処理を実行する。すなわち、情報提供装置10は、新出要素を含む投稿情報を特定し、特定情報から新出要素と関係情報を抽出し、抽出した新出要素と関係情報とを用いて、ナレッジデータベースを更新する(ステップS6)。例えば、情報提供装置10は、新たな投稿情報#N1および投稿情報#N2が存在する場合、判定モデルを用いて、各投稿情報#N1、#N2が新出要素を含む投稿情報(以下、「新出投稿」と記載する場合がある。)であるか否かを判定する。そして、情報提供装置10は、投稿情報#N1が新出投稿であると判定された場合は、抽出モデルと関係推定モデルとを用いて、投稿情報#N1から、新出要素や関係情報を抽出する。
Then, the
より具体的には、情報提供装置10は、投稿情報#N1から新出要素を抽出するとともに、新出要素とそれぞれ所定の関係性を有する他の要素とを抽出する。そして、情報提供装置10は、抽出した新出要素と関係情報とを用いて、ナレッジデータベースを更新する。例えば、情報提供装置10は、新出要素をナレッジデータベースに登録するとともに、新出要素と、抽出した他の要素と、新出要素と他の要素との間の関係性を示す関係情報とを対応付けたトリプルの設定を行う。例えば、情報提供装置10は、投稿情報を入力した際に、監督の文字列を抽出するよう学習が行われた関係推定モデルが、投稿情報#N1から監督の文字列を抽出した場合は、抽出モデルが抽出した新出要素と、関係推定モデルが抽出した文字列(すなわち、他の要素)と、要素間の関係を示す関係情報「監督」とを対応付けたトリプルと呼ばれる情報を登録する。
More specifically, the
すなわち、情報提供装置10が更新するナレッジデータベースにおいては、2つのエンティティとエンティティ間の関係性を示す関係情報とからなるトリプルと呼ばれる情報が登録されることにより、各種の知識が体系化されている。換言すると、ナレッジデータベースにおいては、主語(S)となるエンティティと、目的語(O)となるエンティティと、述語(P)となる関係情報とからなるトリプルによって、様々な知識が体系的に表されている。
That is, in the knowledge database updated by the
このように、情報提供装置10は、新たな要素の候補である要素候補に関する検索履歴と、要素候補に関する投稿情報とを特定する。そして、情報提供装置10は、特定された検索履歴の数と、特定された投稿情報の数とに基づいて、要素候補のうち、新たな要素に関する情報の特徴をモデルに学習させるための学習データを生成するための要素候補を選択する。このため、情報提供装置10は、モデルを用いた新出要素の追加を効率化することができる。
In this way, the
〔1−4.モデルについて〕
ここで、情報提供装置10は、任意の形式の判定モデル、抽出モデル、および関係推定モデル(以下、「各モデル」と記載する場合がある。)の学習を行ってよい。例えば、情報提供装置10は、回帰モデル、Bag of words、SVM(Support Vector Machine)やDNN(Deep Neural Network)、CRF(Conditional Random Fields)、LSTM(Long short-term memory)等、任意のモデルが採用可能である。
[1-4. About the model]
Here, the
例えば、上述した学習処理により学習が行われた判定モデルは、所定の要素に関する投稿情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、投稿情報が新たな要素に関する投稿情報であるか否かを示す値を出力層から出力するよう、コンピュータを機能させるためのモデルである。 For example, the determination model in which the training is performed by the above-mentioned learning process is an input layer in which post information relating to a predetermined element is input, an output layer, or any layer from the input layer to the output layer, and is an output layer. The information input to the input layer includes the first element belonging to a layer other than the first element and the second element whose value is calculated based on the weights of the first element and the first element, and the information input to the input layer is other than the output layer. By performing an operation based on the first element and the weight of the first element with each element belonging to each layer as the first element, a value indicating whether or not the posted information is the posted information related to the new element is obtained from the output layer. It is a model for making the computer function to output.
また、例えば、上述した学習処理により学習が行われた抽出モデルは、新たな要素に関する投稿情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、投稿情報に含まれる情報のうち新たな要素を示す情報を示す値を出力層から出力するよう、コンピュータを機能させるためのモデルである。 Further, for example, the extraction model trained by the above-mentioned learning process is an input layer into which post information regarding a new element is input, an output layer, or any layer from the input layer to the output layer. An output layer for information input to the input layer, including a first element belonging to a layer other than the output layer and a second element whose value is calculated based on the weights of the first element and the first element. By performing an operation based on the first element and the weight of the first element with each element belonging to each layer other than the first element as the first element, a value indicating information indicating a new element among the information included in the posted information is output. It is a model for making the computer function so that it outputs from the layer.
また、例えば、上述した学習処理により学習が行われた関係推定モデルは、新たな要素に関する投稿情報が入力される入力層と、出力層と、記入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、投稿情報に含まれる情報のうち新たな要素と他の要素との間の関係性を示す値を出力層から出力するよう、コンピュータを機能させるためのモデルである。 Further, for example, the relationship estimation model trained by the above-mentioned learning process has an input layer in which post information about a new element is input, an output layer, and any layer from the input layer to the output layer. With respect to the information input to the input layer, including the first element belonging to a layer other than the output layer and the second element whose value is calculated based on the weights of the first element and the first element. By performing an operation based on the weights of the first element and the first element with each element belonging to each layer other than the output layer as the first element, a new element and other elements among the information included in the posted information can be obtained. It is a model for making a computer function so that a value indicating the relationship between them is output from the output layer.
ここで、各モデルが「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、各モデルが含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that each model is realized by the regression model shown by "y = a1 * x1 + a2 * x2 + ... + ai * xi". In this case, the first element included in each model corresponds to input data (xi) such as x1 and x2. Further, the weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element corresponds to any node of the input layer, and the second element can be regarded as the node of the output layer.
また、各モデルがDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、各モデルが含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that each model is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in each model corresponds to either the node of the input layer or the intermediate layer. Further, the second element corresponds to a node in the next stage, which is a node to which a value is transmitted from a node corresponding to the first element. Further, the weight of the first element corresponds to a connection coefficient which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.
情報提供装置10は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有する各モデルを用いて、新出要素や関係情報を取得する。具体的には、判定モデルは、投稿情報が入力された場合に、その投稿情報に新出要素が含まれるか否かを示すスコアを出力するように、各種のパラメータ(例えば、接続係数)が設定される。また、抽出モデルは、投稿情報が入力された場合に、その投稿情報から新出要素である可能性が高い文字列等の情報を示す情報を出力するように、各種のパラメータが設定される。また、関係推定モデルは、投稿情報が入力された場合に、その投稿情報が示す新出要素と所定の関係性を有する他の要素を示す情報を出力するように、各種のパラメータが設定される。
The
なお、実施形態に係る各モデルは、所定のモデルにデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。また、情報提供装置10がGAN(Generative Adversarial Networks)を用いた学習処理を行う場合、各モデルは、GANの一部を構成するモデルであってもよい。
Each model according to the embodiment may be a model generated based on a result obtained by repeating input / output of data to a predetermined model. Further, when the
例えば、情報提供装置10は、新たな要素の候補である要素候補のうち、要素候補に関する検索履歴の数と要素候補に関する投稿情報の数とに基づいて選択された要素候補と、要素候補に関する検索履歴と、要素候補と他の要素との間の関係性を示す情報とを含む学習データを用いて、上述した学習を行うことで、各モデルを生成する。なお、情報提供装置10は、いかなる学習アルゴリズムを用いて各を生成してもよい。例えば、情報提供装置10は、ニューラルネットワーク(neural network)、サポートベクターマシン(support vector machine)、クラスタリング、強化学習等の学習アルゴリズムを用いて学習モデルを生成する。一例として、情報提供装置10がニューラルネットワークを用いて各モデルを生成する場合、各モデルは、一以上のニューロンを含む入力層と、一以上のニューロンを含む中間層と、一以上のニューロンを含む出力層とを有する。
For example, the
なお、学習データは、上述した各種のモデルとして情報提供装置10を動作させるデータである。すなわち、学習データは、新出要素の候補である要素候補のうち、要素候補に関する検索履歴の数と要素候補に関する投稿情報の数とに基づいて選択された要素候補と、要素候補に関する検索履歴と、要素候補と他の要素との間の関係性を示す情報とを含みコンピュータを、上述した各種のモデルとして機能させるためのデータである。
The learning data is data for operating the
〔1−5.学習データについて〕
上述した説明では、情報提供装置10は、検索クエリや投稿情報の数が「0」から「1」以上となった日時に投稿された投稿情報を学習データとした。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、検索クエリや投稿情報の数が「0」から「1」以上となった日中に投稿された投稿情報を学習データとしてもよく、検索クエリや投稿情報の数が「0」から「1」以上となった日から所定の日時が経過するまでの間に投稿された投稿情報を学習データとしてもよい。
[1-5. About learning data]
In the above description, the
また、例えば、情報提供装置10は、検索履歴が示す検索の状況や、投稿履歴が示す投稿の状況に基づいて、学習データとする要素候補を選択するのであれば、任意の状況に基づいて、要素候補の選択を行ってよい。例えば、情報提供装置10は、検索履歴や投稿履歴の数が所定の閾値以下となる期間が所定の閾値以上存在し、ある日を境に、検索履歴や投稿履歴の数が所定の閾値以上となった場合は、対応する要素候補を学習データとして選択してもよい。また、情報提供装置10は、検索履歴や投稿履歴が示す検索や投稿の統計的な状況等、任意の状況に基づいて、要素候補の選択を行ってよい。
Further, for example, if the
また、情報提供装置10は、正例のみならず、負例となる学習データを生成してもよい。例えば、情報提供装置10は、ある要素候補についての投稿情報であって、検索クエリや投稿情報の数が「0」から「1」以上となった日に投稿された投稿情報を正例とし、その要素候補についての投稿情報であって、検索クエリや投稿情報の数が「0」から「1」以上となった日から所定の日時が経過した後に投稿された投稿情報を負例とする。そして、情報提供装置10は、正例および負例を用いて、判定モデルの学習を行ってもよい。
Further, the
なお、情報提供装置10は、を作成する際、任意の期間に登録された投稿情報を取得して良い。例えば、情報提供装置10は、過去1年分の投稿情報や検索クエリを取得し、取得した投稿情報や検索クエリを用いて、要素候補が新出要素であるか否かを判定してもよい。
The
また、新出要素が生じてから、新出要素の説明コンテンツが生成されたり、インフォボックスが生成されるまでの期間は、所定の範囲内(例えば、平均で40日)に収まると予測される。そこで、情報提供装置10は、説明コンテンツが生成された若しくはインフォボックスが生成された日時から40日前の投稿情報を取得し、取得した投稿情報を学習データとしてもよい。
In addition, it is predicted that the period from the occurrence of the new element to the generation of the explanatory content of the new element and the generation of the infobox will be within a predetermined range (for example, 40 days on average). .. Therefore, the
〔2.情報提供装置の構成〕
以下、上記した情報提供装置10が有する機能構成の一例について説明する。図2は、実施形態に係る情報提供装置の構成例を示す図である。図2に示すように、情報提供装置10は、通信部20、記憶部30、および制御部40を有する。
[2. Configuration of information providing device]
Hereinafter, an example of the functional configuration of the
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、ログサーバ100や説明コンテンツサーバ200との間で情報の送受信を行う。
The
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、エンティティデータベース31、トリプルデータベース32、検索ログデータベース33、投稿情報データベース34、学習データデータベース35、およびモデルデータベース36(以下、「各データベース31〜36」と総称する場合がある。)を記憶する。
The
以下、図3〜8を用いて、各データベース31〜36に登録される情報の一例を説明する。エンティティデータベース31には、エンティティに関する情報が登録される。例えば、図3は、実施形態に係るエンティティデータベースに登録される情報の一例を示す図である。図3に示すように、エンティティデータベース31には、「エンティティID」、「エンティティ種別」、「ノードID」、「ノード種別」、および「データ」といった項目を有する情報が登録される。
Hereinafter, an example of information registered in each
ここで、「エンティティID」とは、エンティティの識別子である。また、「エンティティ種別」とは、対応付けられた「エンティティID」が示すエンティティの種別を示す情報であり、例えば、エンティティが「人物」を示すエンティティであるか「職業」を示すエンティティであるかといった情報を示す。「ノードID」は、対応付けられた「エンティティID」が示すエンティティと関連するノードの識別子である。「ノード種別」は、対応付けられた「ノードID」が示すノードの種別を示す情報であり、ノードが名前を示すか、写真を示すか、職業を示すか等といった情報である。また、「データ」とは、対応付けられた「ノードID」が示すノードのデータである。 Here, the "entity ID" is an identifier of an entity. Further, the "entity type" is information indicating the type of the entity indicated by the associated "entity ID". For example, whether the entity is an entity indicating a "person" or an entity indicating an "occupation". Information such as is shown. The "node ID" is an identifier of a node associated with the entity indicated by the associated "entity ID". The "node type" is information indicating the type of the node indicated by the associated "node ID", and is information such as whether the node indicates a name, a photograph, an occupation, or the like. Further, the "data" is the data of the node indicated by the associated "node ID".
例えば、図3に示す例では、エンティティID「E11」、エンティティ種別「人物」、ノードID「I111」、ノード種別「名前」、およびデータ「名前#1」が対応付けて登録されている。このような情報は、エンティティID「E11」が示すエンティティ(すなわち、エンティティE11)が「人物」を示すエンティティであり、そのエンティティが示す人物の「名前」を示すノードとしてノードID「I111」が登録されており、その名前が「名前#1」である旨を示す。なお、図1に示す例では、「名前#1」や「写真#1」等といった概念的な値を記載したが、実際には、エンティティデータベース31には、対応付けられたエンティティと対応する人物の名前、写真、生年月日等を示す各種の情報が登録されることとなる。
For example, in the example shown in FIG. 3, the entity ID "E11", the entity type "person", the node ID "I111", the node type "name", and the data "
トリプルデータベース32には、トリプルを示す情報が登録される。例えば、図4は、実施形態に係るトリプルデータベースに登録される情報の一例を示す図である。図4に示す例では、トリプルデータベース32には、「トリプルID」、「関係情報ID」、「種別」、「第1要素」、および「第2要素」といった項目を有する情報が登録される。
Information indicating the triple is registered in the
ここで、「トリプルID」とは、トリプルを識別する識別子である。また、「関係情報ID」とは、トリプルに含まれる関係情報を識別する識別子である。また、「種別」とは、トリプルに含まれるエンティティ間の関係性を示す情報である。また、「第1要素」および「第2要素」とは、対応付けられた「トリプルID」が示すトリプルに含まれるエンティティのエンティティIDである。 Here, the "triple ID" is an identifier that identifies the triple. Further, the "relationship information ID" is an identifier that identifies the relational information included in the triple. Further, the "type" is information indicating the relationship between the entities included in the triple. Further, the "first element" and the "second element" are entity IDs of entities included in the triple indicated by the associated "triple ID".
例えば、図4に示す例では、トリプルID「トリプル#1」、関係情報ID「C1」、種別「職業」、第1要素「E11」、および第2要素「E21」が対応付けて登録されている。このような情報は、トリプルID「トリプル#1」が示すトリプルとして、エンティティE11とエンティティE12と関係情報C1とが対応付けて登録されており、エンティティE21がエンティティE11の職業である旨を示す。
For example, in the example shown in FIG. 4, the triple ID "
検索ログデータベース33には、検索クエリの履歴、すなわち、検索履歴が登録される。例えば、図5は、実施形態に係る検索ログデータベースに登録される情報の一例を示す図である。図5に示すように、検索ログデータベース33には、検索ログを識別する識別子である「検索ログID」、入力された検索クエリを示す「検索クエリ」、および検索が行われた日時を示す「検索日時」といった項目を有する情報が登録される。
The history of search queries, that is, the search history is registered in the
例えば、図5に示す例では、検索ログデータベース33には、検索ログID「検索ログ#1」、検索クエリ「検索クエリ#1」、および検索日時「検索日時#1」といった情報が対応付けて登録されている。このような情報は、検索ログID「検索ログ#1」が示す検索ログの検索クエリが「検索クエリ#1」であり、検索日時が「検索日時#1」であった旨を示す。なお、図5に示す例では、「検索ログ#1」、「検索クエリ#1」、「検索日時#1」といった概念的な値について記載したが、実際には、検索ログデータベース33には、検索ログを識別する数値や文字列、検索クエリとして入力された文字列、検索日時を示す数値等が登録される。
For example, in the example shown in FIG. 5, the
投稿情報データベース34には、投稿情報が登録される。例えば、図6は、実施形態に係る投稿情報データベースに登録される情報の一例を示す図である。図6に示すように、投稿情報データベース34には、投稿情報を識別する識別子である「投稿ログID」、投稿情報の内容を示す「投稿情報」、および投稿情報が投稿された日時を示す「投稿日時」といった項目を有する情報が登録される。
Post information is registered in the
例えば、図6に示す例では、投稿情報データベース34には、投稿ログID「投稿ログ#1」、投稿情報「投稿情報#1」、および投稿日時「投稿日時#1」といった情報が対応付けて登録されている。このような情報は、投稿ログID「投稿ログ#1」が示す投稿情報が「投稿情報#1」であり、投稿日時が「投稿日時#1」であった旨を示す。なお、図6に示す例では、「投稿ログ#1」、「投稿情報#1」、「投稿日時#1」といった概念的な値について記載したが、実際には、投稿情報データベース34には、投稿情報を識別する数値や文字列、投稿情報として入力された文字列、投稿日時を示す数値等が登録される。
For example, in the example shown in FIG. 6, the
学習データデータベース35には、学習データが登録される。例えば、図7は、実施形態に係る学習データデータベースに登録される情報の一例を示す図である。図7に示すように、学習データデータベース35には、学習データを識別する識別子である「学習データID」、学習データに含まれる要素候補である「要素候補」、学習データに含まれる関係情報である「関係情報」、および学習データに含まれる投稿情報である「投稿情報」といった項目を有する情報が登録される。
The learning data is registered in the learning
例えば、図7に示す例では、学習データデータベース35には、学習データID「学習データ#1」、要素候補「要素候補#1」、関係情報「関係情報群#1」、投稿情報「投稿情報群#1」が対応付けて登録されている。このような情報は、学習データID「学習データ#1」が示す学習データとして、「要素候補#1」、「関係情報群#1」、および「投稿情報群#1」が対応付けて登録されている旨を示す。また、このような情報は、「関係情報群#1」として、「要素候補#1」と所定の関係を有する他の要素が「対象要素#1−1」であり、その関係が「関係#1−1」である旨が登録されている旨を示す。また、このような情報は、「投稿情報群#1」として「投稿情報#1−1」や「投稿情報#1−2」が登録されている旨を示す。
For example, in the example shown in FIG. 7, the learning
なお、図7に示す例では、「学習データ#1」、「要素候補#1」、「関係情報#1−1」、「関係#1−1」、「投稿情報#1−1」といった概念的な値について記載したが、実際には、学習データデータベース35には、学習データを識別する数値や文字列、要素候補、関係情報、関係、投稿情報等となる文字列等が登録される。
In the example shown in FIG. 7, concepts such as "learning
モデルデータベース36には、各モデルのデータが登録される。例えば、図8は、実施形態に係るモデルデータベースに登録される情報の一例を示す図である。図8に示すように、モデルデータベース36には、モデルの種別を示す「モデル種別」およびモデルの情報である「モデルデータ」とが対応付けて登録される。
Data of each model is registered in the
例えば、図8に示す例では、モデルデータベース36には、モデル種別「判定モデル」およびモデルデータ「モデルデータ#1」が対応付けて登録されている。このような情報は、「判定モデル」であるモデルの各種パラメータが「モデルデータ#1」である旨を示す。なお、図8に示す例では、「モデルデータ#1」といった概念的な値を記載したが、実際には、ノード間の接続関係や接続係数等といったモデルを構成するために必要な各種の情報が登録される。
For example, in the example shown in FIG. 8, the model type “determination model” and the model data “
図2に戻り、説明を続ける。制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報提供装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
Returning to FIG. 2, the explanation will be continued. The control unit 40 is a controller, and for example, various programs stored in a storage device inside the
図2に示すように、制御部40は、取得部41、特定部42、選択部43、抽出部44、学習部45、および更新部46を有する。取得部41は、要素候補を説明する説明コンテンツが登録された場合は、説明コンテンツから要素候補を取得する。例えば、取得部41は、所定の時間間隔で説明コンテンツサーバ200を参照し、所定の期間内に新たに登録された説明コンテンツを取得する。このような場合、取得部41は、各種の文字解析技術を用いて、説明コンテンツが主題する物事を示すテキストを抽出し、抽出したテキストを要素候補とする。
As shown in FIG. 2, the control unit 40 includes an
特定部42は、新たな要素の候補である要素候補に関する検索履歴と、要素候補に関する投稿情報とを特定する。より具体的には、特定部42は、取得部41により説明コンテンツから取得された要素候補の検索履歴と、要素候補に関する投稿情報とを特定する。例えば、特定部42は、要素候補の投稿情報であって、説明コンテンツが登録されるよりも前の所定の期間内に投稿された投稿情報を特定する。
The
例えば、特定部42は、所定の時間間隔で、ログサーバ100から各種の検索履歴や投稿情報を取得する。そして、特定部42は、取得した検索履歴を検索ログデータベース33に登録し、取得した投稿情報を、投稿情報データベース34に登録しておく。また、特定部42は、取得部41によって要素候補が取得された場合は、検索ログデータベース33を参照し、要素候補を検索クエリとして含む検索ログを特定する。また、特定部42は、取得された要素候補を含む投稿情報を投稿情報データベース34から特定する。
For example, the
ここで、特定部42は、検索履歴や投稿情報を特定する際、検索日時や投稿日時を考慮してもよい。例えば、特定部42は、取得された要素候補の説明コンテンツが登録された日時を特定し、検索履歴や投稿情報のうち、特定した日時よりも前の所定の期間内に検索或いは投稿された検索履歴や投稿情報を特定してもよい。例えば、特定部42は、説明コンテンツの登録日前40日間の投稿情報を特定してもよい。
Here, the
選択部43は、特定された検索履歴と、特定された投稿情報とに基づいて、要素候補のうち、新たな要素に関する情報の特徴をモデルに学習させるための学習データを生成するための要素候補を選択する。例えば、選択部43は、複数の要素候補のうち、所定の日時において、検索履歴の数の増加量が所定の閾値を超え、かつ、投稿情報の数の増加量が所定の閾値を超えた要素候補を選択する。例えば、選択部43は、複数の要素候補のうち、所定の日時よりも前における検索履歴および投稿情報が存在せず、かつ、所定の日時において検索履歴の数が所定の閾値を超え、かつ、投稿情報の数が所定の閾値を超えた要素候補を選択する。 The selection unit 43 is an element candidate for generating learning data for making a model learn the characteristics of information about a new element among the element candidates based on the specified search history and the specified post information. Select. For example, in the selection unit 43, among a plurality of element candidates, an element in which the amount of increase in the number of search histories exceeds a predetermined threshold value and the amount of increase in the number of posted information exceeds a predetermined threshold value at a predetermined date and time. Select a candidate. For example, in the selection unit 43, among the plurality of element candidates, the search history and posting information before the predetermined date and time do not exist, the number of search histories exceeds the predetermined threshold value at the predetermined date and time, and Select element candidates for which the number of posted information exceeds a predetermined threshold.
例えば、図9は、実施形態に係る情報提供装置が学習データの作成対象とする要素候補を選択する処理の一例を示す図である。なお、図9中(A)には、ある要素候補#1を含む検索クエリの数の変遷を各日時ごとに点線でプロットし、要素候補#1を含む投稿情報の数の変遷を各日付ごとに直線でプロットした。また、図9中(B)には、ある要素候補#2を含む検索クエリの数の変遷を各日時ごとに点線でプロットし、要素候補#2を含む投稿情報の数の変遷を各日付ごとに直線でプロットした。
For example, FIG. 9 is a diagram showing an example of a process in which the information providing device according to the embodiment selects an element candidate for which the learning data is to be created. In FIG. 9 (A), the transition of the number of search queries including a certain
例えば、図9中(a)に示す日時において、要素候補#1を含む検索履歴や投稿情報が急に生じており、図9中(a)よりも前の図9中(b)に示す期間においては、要素候補#1を含む検索履歴や投稿情報が存在しない。検索履歴の数や投稿情報の数がこのような変遷を辿る場合、要素候補#1は、新出要素である可能性が高い。そこで、選択部43は、検索履歴および投稿情報が存在しない状態から、所定の日時において検索履歴の数が所定の閾値を超え、かつ、投稿情報の数が所定の閾値を超えた要素候補#1を、学習データの作成対象として選択する。
For example, at the date and time shown in FIG. 9 (a), the search history and posted information including the
一方、図9中(B)に示すように、要素候補#2を含む検索履歴や投稿情報の数は、増減を繰り返しながらも一定量が存在している。ここで、図9中(c)に示す日時において、要素候補#1を含む検索履歴や投稿情報が急増しているものの、図9中(d)に示すように、過去にも要素候補#2を含む検索履歴や投稿情報の数が急増する日時が存在する。検索履歴の数や投稿情報の数がこのような変遷を辿る場合、要素候補#2は、新出要素ではない可能性が高い。具体的な例を挙げると、要素候補#2が小説のタイトルである場合、図9中(d)に示す日時において要素候補#2が話題となり、図9中(c)に示す日時において要素候補#2の小説が映画化されたといった態様が考えられる。このような要素候補#2を学習データとした場合、真に新出要素が含まれる投稿情報を選択することができず、学習データの確度が低下する結果、新出要素の抽出精度が低下する恐れがある。そこで、情報提供装置10は、要素候補#2を学習データの作成対象から除外する。
On the other hand, as shown in FIG. 9B, the number of search histories and posted information including the element candidate # 2 exists in a certain amount while repeatedly increasing and decreasing. Here, at the date and time shown in FIG. 9 (c), the search history and posted information including the
図2に戻り、説明を続ける。抽出部44は、選択部43により選択された要素候補に関する投稿情報のうち、投稿情報や検索情報の数が急増した日時に投稿された投稿情報を学習データとして抽出する。また、抽出部44は、要素候補を説明する説明コンテンツから、要素候補と他の要素との関係性を学習データとして抽出する。例えば、抽出部44は、選択部43が学習データの作成対象とする要素候補を選択した場合、選択した要素候補を含む投稿情報であって、投稿情報や検索情報の数が「0」から「1」以上に増加した日に投稿された投稿情報を抽出する。そして、抽出部44は、要素候補と抽出した投稿情報とを対応付けて学習データデータベース35に登録する。
Returning to FIG. 2, the explanation will be continued. The extraction unit 44 extracts the posted information posted on the date and time when the number of posted information and search information suddenly increases from the posted information related to the element candidates selected by the selection unit 43 as learning data. In addition, the extraction unit 44 extracts the relationship between the element candidate and other elements as learning data from the explanatory content explaining the element candidate. For example, when the selection unit 43 selects the element candidate for which the learning data is to be created, the extraction unit 44 is the post information including the selected element candidate, and the number of the post information and the search information is from "0" to "0". Extract the posted information posted on the day when it increased to 1 "or more. Then, the extraction unit 44 associates the element candidates with the extracted post information and registers them in the learning
また、抽出部44は、要素候補の説明コンテンツにインフォボックスが登録されている場合、かかるインフォボックスから要素候補と他の要素との間の関係性を示す関係情報を抽出する。なお、抽出部44は、文字解析技術や、例えば、説明コンテンツに設定された他の説明コンテンツへのリンク関係等から、要素候補と他の要素との間の関係性を示す関係情報を特定してもよい。そして、抽出部44は、抽出した関係情報を要素候補と対応付けて学習データデータベース35に登録する。
Further, when the infobox is registered in the explanation content of the element candidate, the extraction unit 44 extracts the relationship information indicating the relationship between the element candidate and the other element from the infobox. The extraction unit 44 identifies the relationship information indicating the relationship between the element candidate and the other element from the character analysis technique, for example, the link relationship to the other explanatory content set in the explanatory content, and the like. You may. Then, the extraction unit 44 associates the extracted relationship information with the element candidates and registers them in the learning
学習部45は、選択された要素候補に関する情報を用いて、新たな要素に関する情報の特徴をモデルに学習させる。すなわち、学習部45は、選択部43により選択された要素候補に関する学習データを用いて、各モデルの学習を行う。例えば、学習部45は、選択された要素候補、要素候補に関する投稿情報、および要素候補と他の要素との関係性を学習データとして、学習データが有する各種の特徴を各モデルに学習させる。
The
例えば、学習部45は、学習データの投稿情報を用いて、投稿情報が新たな要素に関する投稿であるか否かを判定する判定モデルの学習を行う。例えば、学習部45は、学習データに含まれる投稿情報を入力した際に、入力された投稿情報に新出要素が含まれる旨を示す情報を出力し、他の投稿情報を入力した際に、入力された投稿情報に新出要素が含まれない旨を示す情報を出力するように、判定モデルの学習を行う。
For example, the
また、例えば、学習部45は、学習データの要素候補と、要素候補に関する投稿情報を用いて、投稿情報に含まれる新たな要素を抽出する要素抽出モデルの学習を行う。例えば、学習部45は、ある学習データの投稿情報を入力した際に、その学習データの要素候補を示す情報を出力するように、抽出モデルの学習を行う。
Further, for example, the
また、例えば、学習部45は、学習データの投稿情報と、その学習データの要素候補と他の要素との関係性とを用いて、投稿情報に含まれる新たな要素と他の要素との関係性を抽出する関係推定モデルの学習を行う。より具体的には、学習部45は、投稿情報から、新たな要素との間に所定の関係性を有する他の要素を抽出する複数のモデルであって、それぞれ異なる関係性を有する他の要素を抽出する複数のモデルを学習する。
Further, for example, the
例えば、学習部45は、関係推定モデルとして、それぞれ異なる関係性と対応付けた複数のモデルを準備する。また、学習部45は、例えば、第1の関係性と対応付けたモデルを学習する場合、学習データデータベース35を参照し、要素候補とその要素候補との間に第1の関係性を有する他の要素とを特定する。そして、学習部45は、第1の関係性と対応付けたモデルに対して投稿情報を入力した際に、特定した他の要素を示す情報出力するように、そのモデルの学習を行う。このような処理を各関係推定モデルについて実行することで、学習部45は、投稿情報から、要素候補と所定の関係性を有する他の要素を抽出するモデル、すなわち、要素候補と他の要素との間の関係性を推定するための関係推定モデルを学習することができる。
For example, the
更新部46は、学習部45によって学習が行われた各モデルを用いて、ナレッジデータベースの更新を行う。例えば、更新部46は、投稿されてから所定の時間が経過していない投稿情報をログサーバ100から取得する。そして、更新部46は、判定モデルを用いて、各投稿情報が新出要素を含むか否かを判定する。
The
また、更新部46は、ある投稿情報に新出要素が含まれると判定モデルが判定した場合は、抽出モデルを用いて、その投稿情報から新出要素を抽出する。すなわち、更新部46は、抽出モデルを用いて、新出要素が含まれると判定された投稿情報から新出要素を示す可能性が高い文字列の抽出を行う。また、更新部46は、関係推定モデルを用いて、新出要素が含まれると判定された投稿情報から、新出要素と所定の関係性を有すると推定される他の要素を抽出する。
Further, when the determination model determines that a certain posted information includes a new element, the
そして、更新部46は、抽出した新出要素と、新出要素と他の要素との関係性を用いて、ナレッジデータベースの更新を行う。例えば、更新部46は、新出要素を示すエンティティをエンティティデータベース31に登録する。また、更新部46は、新出要素と所定の関係性を有する他の要素のエンティティをエンティティデータベース31から特定する。そして、更新部46は、トリプルとして、新出要素のエンティティと、特定した他の要素のエンティティと、その要素を抽出した関係推定モデルと対応する関係(すなわち、「種別」)との組をトリプルとして、トリプルデータベース32に登録する。
Then, the
〔3.情報提供装置が実行する処理の流れの一例〕
続いて、図10を用いて、情報提供装置10が実行する処理の流れについて説明する。図10は、実施形態に係る情報提供装置が実行する処理の流れの一例を示すフローチャートである。
[3. An example of the flow of processing executed by the information providing device]
Subsequently, the flow of processing executed by the
まず、情報提供装置10は、所定の期間内に作成された説明コンテンツを取得する(ステップS101)。続いて、情報提供装置10は、説明コンテンツから要素候補を抽出する(ステップS102)。また、情報提供装置10は、抽出した要素候補に関する検索履歴と投稿履歴とを取得する(ステップS103)。そして、情報提供装置10は、要素候補のうち、所定の日時における検索履歴と投稿履歴との増加量が所定の閾値を超える要素候補を選択する(ステップS104)。
First, the
また、情報提供装置10は、選択した要素候補と、所定の日時に投稿された投稿履歴と、関係情報とを学習データとする(ステップS105)。そして、情報提供装置10は、学習データを用いて、各モデルを学習する(ステップS106)。また、情報提供装置10は、判定モデルを用いて、新出要素を含む投稿情報を特定し(ステップS107)、特定した投稿情報から、抽出モデルと関係推定モデルとを用いて、新出要素と関係情報とを抽出する(ステップS108)。そして、情報提供装置10は、ナレッジデータベースに新出要素と関係情報とを登録し(ステップS109)、処理を終了する。
Further, the
〔4.変形例〕
上記では、情報提供装置10による選択処理、学習処理および更新処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、情報提供装置10が実行する提供処理や選択処理のバリエーションについて説明する。
[4. Modification example]
In the above, an example of the selection process, the learning process, and the update process by the
〔4−1.エンティティの種別について〕
上述した例では、ナレッジデータベースの一例として、人物と人物の職業とを関連付けたトリプルが登録されるナレッジデータベースを示した。しかしながら、実施形態は、これに限定されるものではない。すなわち、情報提供装置10は、任意の物事を示すナレッジデータベースの更新を行ってよい。より具体的には、情報提供装置10は、任意の物事を新出要素として選択し、学習データの生成を行ってよく、任意の物事を新出要素として抽出して良い。
[4-1. About the type of entity]
In the above example, as an example of the knowledge database, a knowledge database in which triples associated with a person and a person's occupation are registered is shown. However, the embodiment is not limited to this. That is, the
〔4−2.装置構成〕
情報提供装置10は、自装置でナレッジデータベースを管理せずともよい。例えば、記憶部30に登録された各データベース31〜36は、外部のストレージサーバに保持されていてもよい。また、情報提供装置10は、検索処理を実現するフロントエンドサーバと、選択処理を実現するバックエンドサーバとで実現されてもよい。このような場合、バックエンドサーバには、図2に示す各41〜46が配置され、フロントエンドサーバには、ナレッジデータベースに検索を行う機能を発揮するための機能構成が配置される。
[4-2. Device configuration〕
The
〔4−3.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[4-3. others〕
Further, among the processes described in the above-described embodiment, all or a part of the processes described as being automatically performed can be manually performed, and conversely, the processes described as being manually performed. It is also possible to automatically perform all or part of the above by a known method. In addition, the processing procedure, specific name, and information including various data and parameters shown in the above document and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the illustrated information.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of the device is functionally or physically dispersed / physically distributed in any unit according to various loads and usage conditions. Can be integrated and configured.
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 In addition, the above-described embodiments can be appropriately combined as long as the processing contents do not contradict each other.
〔4−4.プログラム〕
また、上述した実施形態に係る情報提供装置10は、例えば図11に示すような構成のコンピュータ1000によって実現される。図11は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[4-4. program〕
Further, the
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
The
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
The output IF 1060 is an interface for transmitting information to be output to an
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
The
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
The network IF1080 receives data from another device via the network N and sends it to the
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
The
例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。
For example, when the
〔5.効果〕
上述したように、情報提供装置10は、新たな要素の候補である要素候補に関する検索履歴と、その要素候補に関する投稿情報とを特定する。そして、情報提供装置10は、特定された検索履歴と、特定された投稿情報とに基づいて、要素候補のうち、新たな要素に関する情報の特徴をモデルに学習させるための学習データを生成するための要素候補を選択する。この結果、情報提供装置10は、新出要素に関する情報の特徴をモデルに学習させることができる結果、モデルを用いた新出要素の抽出を実現し、新出エンティティの追加を効率化することができる。
[5. effect〕
As described above, the
例えば、情報提供装置10は、検索履歴が示す検索の状況と、投稿情報が示す投稿の状況とに基づいて、学習データを生成するための要素候補を選択する。また、例えば、情報提供装置10は、検索履歴が示す検索の数と、投稿情報が示す投稿の数とに基づいて、学習データを生成するための要素候補を選択する。このため、情報提供装置10は、新出要素である可能性が高い要素候補を学習データを生成するための要素候補として選択することができる。
For example, the
また、情報提供装置10は、要素候補を説明する説明コンテンツが登録された場合は、その説明コンテンツから要素候補を取得する。そして、情報提供装置10は、要素候補の検索履歴と、その要素候補に関する投稿情報とを特定する。例えば、情報提供装置10は、要素候補の投稿情報であって、説明コンテンツが登録されるよりも前の所定の期間内に投稿された投稿情報を特定する。このため、情報提供装置10は、新出要素の可能性が高い要素候補の中から、学習データの生成対象を選択するので、学習データの確度を向上させることができる。
Further, when the explanatory content for explaining the element candidate is registered, the
また、情報提供装置10は、複数の要素候補のうち、所定の日時において、検索履歴の数の増加量が所定の閾値を超え、かつ、投稿情報の数の増加量が所定の閾値を超えた要素候補を選択する。例えば、情報提供装置10は、複数の要素候補のうち、所定の日時よりも前における検索履歴および投稿情報が存在せず、かつ、その所定の日時において検索履歴の数が所定の閾値を超え、かつ、投稿情報の数が所定の閾値を超えた要素候補を選択する。このため、情報提供装置10は、学習データの確度を向上させることができる。
Further, in the
また、情報提供装置10は、選択された要素候補に関する投稿情報のうち、所定の日時に投稿された投稿情報を学習データとして抽出する。また、情報提供装置10は、選択された要素候補を説明する説明コンテンツから、要素候補と他の要素との関係性を学習データとして抽出する。このため、情報提供装置10は、新出要素を検出するためのモデルの学習を実現する学習データを生成できる。
Further, the
また、情報提供装置10は、選択された要素候補に関する情報を用いて、新たな要素に関する情報の特徴をモデルに学習させる。例えば、情報提供装置10は、要素候補、その要素候補に関する投稿情報、およびその要素候補と他の要素との関係性を学習データとしてモデルに学習させる。例えば、情報提供装置10は、選択された要素候補に関する投稿情報を用いて、投稿情報が新たな要素に関する投稿であるか否かを判定する判定モデルの学習を行う。また、例えば、情報提供装置10は、選択された要素候補と、その要素候補に関する投稿情報を用いて、投稿情報に含まれる新たな要素を抽出する要素抽出モデルの学習を行う。また、例えば、情報提供装置10は、要素候補に関する投稿情報と、その要素候補と他の要素との関係性とを用いて、投稿情報に含まれる新たな要素と他の要素との関係性を抽出する関係推定モデルの学習を行う。より具体的には、情報提供装置10は、関係推定モデルとして、投稿情報から、新たな要素との間に所定の関係性を有する他の要素を抽出する複数のモデルであって、それぞれ異なる関係性を有する他の要素を抽出する複数のモデルを学習する。
Further, the
このような処理の結果、情報提供装置10は、各種の投稿情報から、新出要素を精度良く検出するとともに、新出要素と他の要素との間の関係性を推定することができる。この結果、情報提供装置10は、例えば、ナレッジデータベースが有するトリプルの自動的な更新を実現できる。
As a result of such processing, the
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Although some of the embodiments of the present application have been described in detail with reference to the drawings, these are examples, and various modifications are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure column of the invention. It is possible to practice the present invention in other improved forms.
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、付与部は、特定手段や特定回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the imparting unit can be read as a specific means or a specific circuit.
10 情報提供装置
20 通信部
30 記憶部
31 エンティティデータベース
32 トリプルデータベース
33 検索ログデータベース
34 投稿情報データベース
35 学習データデータベース
36 モデルデータベース
40 制御部
41 取得部
42 特定部
43 選択部
44 抽出部
45 学習部
46 更新部
100 ログサーバ
200 説明コンテンツサーバ
10
Claims (3)
出力層と、
前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第1要素と、
前記第1要素と前記第1要素の重みとに基づいて値が算出される第2要素と、を含み、
前記入力層に入力された情報に対し、前記出力層以外の各層に属する各要素を前記第1要素として、前記第1要素と前記第1要素の重みとに基づく演算を行うことにより、前記投稿情報が新たな要素に関する投稿情報であるか否かを示す値を前記出力層から出力するよう、
コンピュータを機能させるためのモデルであって、
前記第1要素の重みが、新たな要素の候補である要素候補のうち、当該要素候補に関する検索履歴が示す検索の状況と、当該要素候補に関する投稿情報が示す投稿の状況と基づいて選択された要素候補に基づく学習データを用いた学習に基づく
ことを特徴とするモデル。 An input layer where post information about a given element is entered,
Output layer and
A first element that is any layer from the input layer to the output layer and belongs to a layer other than the output layer.
Includes a first element and a second element whose value is calculated based on the weight of the first element.
With respect to the information input to the input layer, each element belonging to each layer other than the output layer is set as the first element, and the post is performed by performing an operation based on the weights of the first element and the first element. So that the output layer outputs a value indicating whether or not the information is posted information about a new element.
It ’s a model for making a computer work .
The weight of the first element is selected based on the search status indicated by the search history for the element candidate and the posting status indicated by the post information regarding the element candidate among the element candidates that are candidates for the new element. Based on learning using learning data based on element candidates
A model that features that.
出力層と、
前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第1要素と、
前記第1要素と前記第1要素の重みとに基づいて値が算出される第2要素と、を含み、
前記入力層に入力された情報に対し、前記出力層以外の各層に属する各要素を前記第1要素として、前記第1要素と前記第1要素の重みとに基づく演算を行うことにより、前記投稿情報に含まれる情報のうち新たな要素を示す情報を示す値を前記出力層から出力するよう、
コンピュータを機能させるためのモデルであって、
前記第1要素の重みが、新たな要素の候補である要素候補のうち、当該要素候補に関する検索履歴が示す検索の状況と、当該要素候補に関する投稿情報が示す投稿の状況と基づいて選択された要素候補に基づく学習データを用いた学習に基づく
ことを特徴とするモデル。 An input layer where post information about new elements is entered,
Output layer and
A first element that is any layer from the input layer to the output layer and belongs to a layer other than the output layer.
Includes a first element and a second element whose value is calculated based on the weight of the first element.
With respect to the information input to the input layer, each element belonging to each layer other than the output layer is set as the first element, and the post is performed by performing an operation based on the weights of the first element and the first element. A value indicating information indicating a new element among the information contained in the information is output from the output layer.
It ’s a model for making a computer work .
The weight of the first element is selected based on the search status indicated by the search history for the element candidate and the posting status indicated by the post information regarding the element candidate among the element candidates that are candidates for the new element. Based on learning using learning data based on element candidates
A model that features that.
出力層と、
前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第1要素と、
前記第1要素と前記第1要素の重みとに基づいて値が算出される第2要素と、を含み、
前記入力層に入力された情報に対し、前記出力層以外の各層に属する各要素を前記第1要素として、前記第1要素と前記第1要素の重みとに基づく演算を行うことにより、前記投稿情報に含まれる情報のうち新たな要素と他の要素との間の関係性を示す値を前記出力層から出力するよう、
コンピュータを機能させるためのモデルであって、
前記第1要素の重みが、新たな要素の候補である要素候補のうち、当該要素候補に関する検索履歴が示す検索の状況と、当該要素候補に関する投稿情報が示す投稿の状況と基づいて選択された要素候補に基づく学習データを用いた学習に基づく
ことを特徴とするモデル。 An input layer where post information about new elements is entered,
Output layer and
A first element that is any layer from the input layer to the output layer and belongs to a layer other than the output layer.
Includes a first element and a second element whose value is calculated based on the weight of the first element.
With respect to the information input to the input layer, each element belonging to each layer other than the output layer is set as the first element, and the post is performed by performing an operation based on the weights of the first element and the first element. Of the information contained in the information, a value indicating the relationship between the new element and another element is output from the output layer.
It ’s a model for making a computer work .
The weight of the first element is selected based on the search status indicated by the search history for the element candidate and the posting status indicated by the post information regarding the element candidate among the element candidates that are candidates for the new element. Based on learning using learning data based on element candidates
A model that features that.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019072876A JP6956133B2 (en) | 2017-09-20 | 2019-04-05 | model |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017180129A JP6541737B2 (en) | 2017-09-20 | 2017-09-20 | Selection apparatus, selection method, selection program, model and learning data |
| JP2019072876A JP6956133B2 (en) | 2017-09-20 | 2019-04-05 | model |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017180129A Division JP6541737B2 (en) | 2017-09-20 | 2017-09-20 | Selection apparatus, selection method, selection program, model and learning data |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2019139790A JP2019139790A (en) | 2019-08-22 |
| JP6956133B2 true JP6956133B2 (en) | 2021-10-27 |
Family
ID=67695421
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019072876A Active JP6956133B2 (en) | 2017-09-20 | 2019-04-05 | model |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6956133B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20220067590A1 (en) * | 2020-08-28 | 2022-03-03 | International Business Machines Corporation | Automatic knowledge graph construction |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007011775A (en) * | 2005-06-30 | 2007-01-18 | Nippon Telegr & Teleph Corp <Ntt> | Dictionary creation device, dictionary creation method, program, and recording medium |
| JP6373767B2 (en) * | 2015-01-26 | 2018-08-15 | Kddi株式会社 | Topic word ranking device, topic word ranking method, and program |
| JP6097429B1 (en) * | 2016-03-31 | 2017-03-15 | 株式会社三菱総合研究所 | Information extraction apparatus, information extraction method, and program |
| JP6088091B1 (en) * | 2016-05-20 | 2017-03-01 | ヤフー株式会社 | Update apparatus, update method, and update program |
-
2019
- 2019-04-05 JP JP2019072876A patent/JP6956133B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2019139790A (en) | 2019-08-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20210224841A1 (en) | Systems and methods for search query refinement | |
| CN110413877A (en) | A kind of resource recommendation method, device and electronic equipment | |
| JP7041299B1 (en) | Information processing equipment, information processing methods and information processing programs | |
| JP6546254B2 (en) | Estimation device, estimation method, and estimation program | |
| CN115344698A (en) | Label processing method, label processing device, computer equipment, storage medium and program product | |
| CN107545075B (en) | Restaurant recommendation method based on online comments and context awareness | |
| CN115659008A (en) | Information pushing system and method for big data information feedback, electronic device and medium | |
| JP2021051391A (en) | Learning device, learning method, and learning program | |
| CN114547416A (en) | Media resource sorting method and electronic equipment | |
| JP2020135770A (en) | Estimator, estimation method and estimation program | |
| JP6541737B2 (en) | Selection apparatus, selection method, selection program, model and learning data | |
| JP6956133B2 (en) | model | |
| JP7273888B2 (en) | Decision device, decision method and decision program | |
| JP2021149681A (en) | Determination device, determination method, and determination program | |
| JP6948425B2 (en) | Judgment device, judgment method and judgment program | |
| KR102731273B1 (en) | Server for analyzing user's interest in products in relation to travel schedule using neural network model and method for operation thereof | |
| CN116340643B (en) | Target recommended adjustment method and device, storage medium, and electronic equipment | |
| JP7044922B1 (en) | Information processing equipment, information processing methods and information processing programs | |
| CN115757747A (en) | Intent recognition method, device, equipment and storage medium | |
| JP2020035072A (en) | Information processing apparatus, information processing method, and information processing program | |
| CN115905682A (en) | A point of interest recommendation method and system | |
| JP2023170924A (en) | Information processing method, information processing device and program | |
| CN116796054A (en) | Resource recommendation methods, devices, electronic equipment and storage media | |
| JP2019021210A (en) | Specification device and specification method | |
| JP2021149682A (en) | Learning device, learning method, and learning program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200309 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210312 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210427 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210628 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210907 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211004 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6956133 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |