JP4307220B2 - Content recommendation target user selection apparatus and method, program, and content recommendation system - Google Patents
Content recommendation target user selection apparatus and method, program, and content recommendation system Download PDFInfo
- Publication number
- JP4307220B2 JP4307220B2 JP2003377206A JP2003377206A JP4307220B2 JP 4307220 B2 JP4307220 B2 JP 4307220B2 JP 2003377206 A JP2003377206 A JP 2003377206A JP 2003377206 A JP2003377206 A JP 2003377206A JP 4307220 B2 JP4307220 B2 JP 4307220B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- keyword
- content
- group
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、あるコンテンツをユーザに推薦する際に、その推薦対象となるユーザ(被推薦ユーザ)を自動的に選出する技術に係わり、特に、利用実績のない新規コンテンツの被推薦ユーザを効率的に選出するのに好適な技術に関するものである。 The present invention relates to a technique for automatically selecting a user (recommended user) to be recommended when recommending a certain content to a user, and in particular, efficiently recommending a recommended user of a new content that has not been used. The present invention relates to a technique suitable for selection.
従来、インターネット等において、あるコンテンツをユーザに推薦する際に、その推薦対象となる被推薦ユーザを自動的に選出する技術としては、例えば、非特許文献1に記載の技術(一般的にcontent-based filteringと呼ばれている)がある。 Conventionally, as a technique for automatically selecting a recommended user to be recommended when recommending a certain content to a user on the Internet or the like, for example, the technique described in Non-Patent Document 1 (generally content- based filtering).
この技術は、あるユーザの嗜好情報と類似している場合に、コンテンツを推薦するものであり、この技術では、被推薦ユーザへのアンケート結果やこれまでのコンテンツ利用実績などから当該被推薦ユーザの嗜好情報を生成し、推薦対象コンテンツの説明文や説明キーワードと、被推薦ユーザの嗜好情報との類似度の大きさから、推薦対象コンテンツを当該被推薦ユーザに推薦するか否かを判別する。 This technology recommends content when it is similar to the preference information of a certain user. In this technology, based on the results of questionnaires to the recommended user and the past use of the content, Preference information is generated, and it is determined whether or not the recommendation target content is recommended to the recommended user based on the degree of similarity between the description text or the description keyword of the recommendation target content and the preference information of the recommended user.
また、例えば、非特許文献2に記載の技術(一般的にcollaborative filtering(協調フィルタリング方式)と呼ばれている)では、複数のユーザの利用履歴を用いて、被推薦ユーザと利用傾向が類似している他のユーザを協調ユーザとして選出し、協調ユーザに利用実績があり、被推薦ユーザに利用実績が無いコンテンツを推薦する。 Further, for example, in the technique described in Non-Patent Document 2 (generally called collaborative filtering (collaborative filtering method)), the usage tendency of a plurality of users is similar to that of the recommended user. Other users who are present are selected as collaborative users, and the collaborative users have a usage record and the recommended users have no usage record.
特許文献1(「レコメンドエンジン、レコメンド方法、レコメンドプログラム」)においては、対象ユーザの協調ユーザを選出し、選出した協調ユーザが利用していて対象ユーザが利用していないコンテンツを対象ユーザに推薦し、推薦できない場合は利用ランキングを表示する技術、すなわち、前記非特許文献2の技術を用いたレコメンド(推薦)技術が記載されている
In Patent Document 1 (“Recommendation Engine, Recommendation Method, Recommendation Program”), a target user's collaborative user is selected, and content that the selected collaborative user uses but the target user does not use is recommended to the target user. In this case, a technique for displaying a usage ranking when recommendation is not possible, that is, a recommendation (recommendation) technique using the technique of Non-Patent
また、特許文献2(「情報推薦サーバ装置」)においては、被推薦ユーザとプロファイルが類似した協調ユーザを選出し、選出した協調ユーザのプロファイルと推薦対象コンテンツとの類似性によって推薦を決定する技術、および、ユーザには複数のプロファイルを持たせ、協調ユーザのプロファイルと類似していないプロファイルを用い、そのプロファイルと推薦対象コンテンツとが類似している場合、当該推薦対象コンテンツを被推薦ユーザに推薦する技術が記載されている。 Patent Document 2 (“Information Recommendation Server Device”) selects a collaborative user whose profile is similar to that of the recommended user, and determines a recommendation based on the similarity between the profile of the selected collaborative user and the recommended content. If the user has a plurality of profiles and uses a profile that is not similar to the profile of the collaborative user, and the profile is similar to the recommendation target content, the recommendation target content is recommended to the recommended user. The technology to do is described.
この特許文献2に記載の技術の特徴は、コンテンツやユーザのプロファイルはベクトルで記述することが可能であるため、協調ユーザが利用したことのないコンテンツであっても、被推薦ユーザに推薦することが可能なことである。この技術では、前記非特許文献1および非特許文献2の両方の技術を用いている。
The feature of the technique described in
しかし、非特許文献1に記載の技術(「content based filtering」)の場合、被推薦ユーザが回答したアンケート結果や利用実績と類似したコンテンツのみが推薦されがちになるとの第1の問題点がある。 However, in the case of the technique described in Non-Patent Document 1 (“content based filtering”), there is a first problem that only content similar to a questionnaire result or usage record answered by the recommended user tends to be recommended. .
また、非特許文献2に記載の技術(「collaborative filtering」)の場合、複数のユーザの利用履歴を用いて、被推薦ユーザと利用傾向が類似している他のユーザを協調ユーザとして選出し、協調ユーザに利用実績があり、被推薦ユーザに利用実績が無いコンテンツを推薦する技術であるため、協調ユーザも利用実績の無いコンテンツは推薦できないとの第2の問題点がある。さらに、誰も利用実績の無い、新しいコンテンツの場合(例えば、新しいコンテンツを一斉に適したユーザに対してリコメンドする場合)は推薦できないといった第3の問題点がある。 In the case of the technique described in Non-Patent Document 2 (“collaborative filtering”), other users who have similar usage trends to the recommended user are selected as cooperative users using the usage histories of a plurality of users. Since this is a technique for recommending content that has been used by a collaborative user and not used by a recommended user, there is a second problem in that content that has not been used by a collaborative user cannot be recommended. Furthermore, there is a third problem in that nobody has a track record of use, and new content cannot be recommended (for example, when new content is recommended to users who are suitable all at once).
また、多くのユーザ中から、ある推薦コンテンツの推薦対象ユーザを選出する場合、前記非特許文献1および非特許文献2のいずれの技術においても、処理量がユーザ数に比例して大きくなる傾向があるという第4の問題点がある。
In addition, when selecting a recommendation target user of a certain recommended content from among many users, the processing amount tends to increase in proportion to the number of users in both the
その結果、特許文献1に記載の技術の場合、前記第2,第3,第4の問題点があり、特許文献2に記載の技術の場合、前記第4の問題点がある。
As a result, the technique described in
解決しようとする問題点は、従来の技術では、(1)被推薦ユーザが回答したアンケート結果や利用実績と類似したコンテンツのみが推薦されがちになる点と、(2)協調ユーザも利用実績の無いコンテンツは推薦できない点、(3)誰も利用実績の無い、新しいコンテンツの場合は推薦できない点、(4)多くのユーザ中から、ある推薦コンテンツの推薦対象ユーザを選出する場合、処理量がユーザ数に比例して大きくなる傾向がある点である。 The problems to be solved are that, in the conventional technology, (1) only content similar to the questionnaire results and usage results answered by the recommended users tends to be recommended, and (2) the cooperative users also have usage results. No content can be recommended, (3) Nobody has a track record of use, new content cannot be recommended, and (4) When selecting recommended users of recommended content from many users, the amount of processing is large. This is a point that tends to increase in proportion to the number of users.
上記目的を達成するため、本発明では、スコア生成手段(スコア生成ブロック2)と学習手段(学習ブロック3)および選出手段(選出ブロック4)の3つの機能を用いてコンテンツの推薦対象ユーザを選出する。 In order to achieve the above object, in the present invention, content recommendation target users are selected using the three functions of score generation means (score generation block 2), learning means (learning block 3) and selection means (selection block 4). To do.
すなわち、図1に示すように、まず、スコア生成ブロック2において、操作情報入力手段2aにより、操作情報10(ユーザの操作履歴やアンケート結果等の情報)を入力し、コンテンツ利用ログ格納部2bで順次にログ情報として記憶し、このログ情報に対して書式変換手段2cによってコンテンツの利用履歴に対する重み付けや正規化、データの書式変換等を実施し、ユーザ毎にコンテンツのメタデータであるキーワードそれぞれに対してスコアが記録されたユーザ・キーワード間スコアデータを生成し、ユーザ・キーワード間スコア格納部2dで記憶装置に格納する。
That is, as shown in FIG. 1, first, in the
次に、学習ブロック3において、キーワード関係グループ抽出手段3aにより、ユーザ・キーワード間スコア格納部2dで格納したユーザ・キーワード間スコアデータを読み込み、関係が得られたキーワードをグループ化して抽出し、その結果をキーワード関係グループ抽出結果格納部3bで記憶装置に格納する。さらに、グループ別ユーザ別スコア算出手段3cにより、キーワード関係グループ抽出結果格納部3bで格納したキーワード関係グループ抽出結果とユーザ・キーワード間スコア格納部2dで格納したユーザ・キーワード間スコアデータを基に、キーワード関係グループ毎に各ユーザのスコアをしかるべき演算を行って算出し、その結果を、グループ別ユーザ別スコア格納部3dにより記憶装置に格納する。
Next, in the
そして、選出ブロック4においては、コンテンツキーワード情報入力手段4aにより、推薦対象コンテンツのメタデータであるキーワードの集合を入力し、ユーザ別スコア算出手段4bにより、キーワード関係グループ抽出結果格納部3bとグループ別ユーザ別スコア格納部3dを参照し、しかるべき演算と処理を行ってユーザ別のスコアを算出する。その後、推薦対象ユーザ情報出力手段4cにより、選出条件(4d)に合致するスコアを有する単数もしくは複数のユーザを推薦対象ユーザ12(被推薦ユーザ)として選出する。
In the
本発明によれば、コンテンツの利用履歴(ユーザの操作履歴やアンケート結果等の情報)を基にして生成した「ユーザ・キーワード間スコアデータ」を基にしてキーワード間で関係があるグループ(キーワード関係グループ)を抽出し、その「キーワード関係グループ」における各ユーザのスコアの大きさからコンテンツの被推薦ユーザの選出を行っている。つまりは、他のユーザの動向を反映した「キーワード関係グループ」を用いてコンテンツの推薦を行っているので、第1の問題点(被推薦ユーザが回答したアンケート結果や利用実績と類似したコンテンツのみが推薦されがちになる)は解決される。 According to the present invention, a group (keyword relationship) having a relationship between keywords based on “user / keyword score data” generated based on content usage history (information such as user operation history and questionnaire results). Group) is extracted, and recommended users of content are selected based on the score of each user in the “keyword related group”. In other words, content recommendation is performed using a “keyword-related group” that reflects the trends of other users, so the first problem (only content similar to the questionnaire results and usage results answered by the recommended user) Is likely to be recommended) is resolved.
また、他のユーザの動向を反映したキーワード関係グループを用いて、コンテンツの被推薦ユーザの選出を行っており、協調ユーザの選出は行わない。そのため、選出した協調ユーザの履歴を基にリコメンドを行うために発生する第2問題点(協調ユーザの利用実績が無いコンテンツは推薦できない)と第3の問題点(誰も利用実績の無い、新しいコンテンツの場合は推薦できない)は解決される。 Moreover, the recommended user of the content is selected using a keyword-related group reflecting the trends of other users, and the cooperative user is not selected. Therefore, the second problem that occurs to make recommendations based on the history of the selected collaborative user (content that does not have a collaborative user's usage record cannot be recommended) and the third problem (nobody has a use record, new It cannot be recommended for content).
また、本発明では、学習ブロック(3)において、予めキーワード関係グループ毎に全ユーザのスコアを算出して保持しており、ユーザそれぞれについて評価する必要がない。すなわち、コンテンツを推薦する対象ユーザ(被推薦ユーザ)を選出する際に行う演算は、予め定めた数のキーワード関係グループとの類似度算出処理である。そのため、非特許文献1に記載の技術(「content based filtering」)のように全ユーザとの類似度の算出演算を行う場合や、非特許文献2に記載の技術(「collaborative filtering」)のように全ユーザに対して類似ユーザの選出処理を行う場合と比較して、ユーザ数が予め定めた数のキーワード関係グループ数より多い場合は、本発明における算出処理量のほうが少なくなる。さらに、本発明ではユーザ数に比例して処理量は大きくならない。その結果、第4の問題点(多くのユーザ中から、ある推薦コンテンツの推薦対象ユーザを選出する場合、処理量がユーザ数に比例して大きくなる傾向がある)は解決される。 In the present invention, in the learning block (3), the scores of all users are calculated and held in advance for each keyword relation group, and it is not necessary to evaluate each user. That is, the calculation performed when selecting a target user (recommended user) who recommends content is a similarity calculation process with a predetermined number of keyword-related groups. Therefore, as in the technique described in Non-Patent Document 1 (“content based filtering”), the calculation of similarity with all users is performed, or the technique described in Non-Patent Document 2 (“collaborative filtering”). When the number of users is larger than the predetermined number of keyword-related groups as compared to the case where similar users are selected for all users, the amount of calculation processing in the present invention is smaller. Furthermore, in the present invention, the amount of processing does not increase in proportion to the number of users. As a result, the fourth problem (when a recommended target user of a recommended content is selected from many users, the processing amount tends to increase in proportion to the number of users) is solved.
以下、図を用いて本発明を実施するための最良の形態例を説明する。 The best mode for carrying out the present invention will be described below with reference to the drawings.
図1は、本発明に係わるコンテンツ推薦対象ユーザ選出装置の構成例を示すブロック図であり、図2は、本発明に係わるコンテンツ推薦対象ユーザ選出装置が組み込まれたコンテンツ推薦システムの構成例を示すブロック図、図3は、図2におけるコンテンツ推薦システムの詳細構成を示すブロック図、図4は、図1におけるスコア生成ブロックの操作情報入力手段により入力される操作情報の具体例を示す説明図、図5は、図1におけるスコア生成ブロックのコンテンツ利用ログ格納部で格納されるコンテンツ利用ログの具体例を示す説明図、図6は、図1におけるスコア生成ブロックの書式変換手段により出力されるユーザ・キーワード間スコアの具体例を示す説明図、図7は、図1における学習ブロックの処理動作例を示すフローチャート、図8は、図1における学習ブロックのキーワード関係グループ抽出手段により抽出されキーワード関係グループ抽出結果格納部で格納されるキーワード関係グループ生成結果の具体例を示す説明図、図9は、図1における学習ブロックのグループ別ユーザ別スコア算出手段により算出されグループ別ユーザ別スコア格納部で格納されるグループ別ユーザ別スコア生成結果の具体例を示す説明図、図10は、図1における選出ブロックの処理動作例を示すフローチャート、図11は、図3におけるコンテンツ推薦システムのコンテンツ配信制御装置に入力される推薦対象コンテンツ情報の具体例を示す説明図、図12は、本発明に係わるコンテンツ推薦対象ユーザ選出装置に入力されるコンテンツキーワード情報の具体例を示す説明図、図13は、図1における選出ブロックの他の処理動作例を示すフローチャートである。 FIG. 1 is a block diagram showing a configuration example of a content recommendation target user selection device according to the present invention, and FIG. 2 shows a configuration example of a content recommendation system incorporating a content recommendation target user selection device according to the present invention. FIG. 3 is a block diagram showing the detailed configuration of the content recommendation system in FIG. 2, FIG. 4 is an explanatory diagram showing a specific example of operation information input by the operation information input means of the score generation block in FIG. FIG. 5 is an explanatory diagram showing a specific example of the content usage log stored in the content usage log storage unit of the score generation block in FIG. 1, and FIG. 6 is a user output by the format conversion means of the score generation block in FIG. An explanatory diagram showing a specific example of the score between keywords, FIG. 7 is a flowchart showing an example of processing operation of the learning block in FIG. FIG. 8 is an explanatory view showing a specific example of the keyword relation group generation result extracted by the keyword relation group extraction means of the learning block in FIG. 1 and stored in the keyword relation group extraction result storage unit, and FIG. FIG. 10 is an explanatory diagram showing a specific example of the group-specific user score generation result calculated by the group-specific user score calculation means of the learning block and stored in the group-specific user score storage unit, FIG. FIG. 11 is an explanatory diagram showing a specific example of recommendation target content information input to the content distribution control device of the content recommendation system in FIG. 3, and FIG. 12 is a content recommendation target user according to the present invention. Explanatory drawing which shows the specific example of the content keyword information input into a selection apparatus, 13 is a flow chart showing another processing operation example of the select block in Figure 1.
まず、図2および図3に基づき、コンテンツ推薦システムについて説明する。図2に示すように、本例のコンテンツ推薦システムは、コンテンツ推薦対象ユーザ選出装置1、コンテンツ配信制御装置20、コンテンツデータベース(図中、「コンテンツDB」と記載)21、ネットワーク22、端末23a〜23cからなる。
First, the content recommendation system will be described with reference to FIGS. As shown in FIG. 2, the content recommendation system of this example includes a content recommendation target
コンテンツ推薦対象ユーザ選出装置1、コンテンツ配信制御装置20、端末23a〜23cのそれぞれは、CPU(Central Processing Unit)や主メモリ、表示装置、入力装置、外部記憶装置等を有するコンピュータ構成からなり、光ディスク駆動装置等を介してCD−ROM等の記憶媒体に記録されたプログラムやデータを外部記憶装置内にインストールした後、この外部記憶装置から主メモリに読み込みCPUで処理することにより、各処理部の機能を実行する。
Each of the content recommendation target
本例のコンテンツ推薦システムは、コンテンツデータベース21に格納されているコンテンツを、コンテンツ配信制御装置20が各端末23a〜23cに送信するものであり、コンテンツ推薦対象ユーザ選出装置1は、コンテンツ配信制御装置20がコンテンツ情報を送信する対象の端末(または推薦対象ユーザ)を選出する。
In the content recommendation system of this example, the content
本例では、コンテンツ推薦対象ユーザ選出装置1とコンテンツ配信制御装置20と被推薦ユーザが利用している端末23a〜23cは、ネットワーク22で接続されている。また、本例では、コンテンツデータベース21はコンテンツ配信制御装置20と接続されている。
In this example, the content recommendation target
尚、本例では、ユーザを識別するユーザIDと端末23a〜23cを識別するIDとは一意に対応付けされており、被推薦ユーザが判明すれば、そのユーザが使用している端末23a〜23cを一意に判別し、その端末23a〜23cに推薦対象コンテンツを推薦できるものとする。
In this example, the user ID for identifying the user and the ID for identifying the
もし、ユーザを識別するユーザIDと端末23a〜23cを識別するIDとが一意に対応付けされていない場合は、別途、ユーザIDとそのユーザが使用している端末23a〜23cを識別するIDとを対応付けたテーブルを用意して、それを参照すればよい。
If the user ID for identifying the user and the ID for identifying the
図3において、図2に示したコンテンツ推薦システムの詳細を示しその動作を説明する。コンテンツ推薦システムは、コンテンツ配信制御装置20がコンテンツデータベース21から推薦対象コンテンツ情報24を取得し、コンテンツ推薦対象ユーザ選出装置1に対して推薦対象コンテンツ情報24のメタデータであるキーワードの集合としてのコンテンツキーワード情報11を送信し、それに対応してコンテンツ推薦対象ユーザ選出装置1から、推薦対象コンテンツ情報24を送信するユーザとして適している被推薦ユーザを特定する推薦対象ユーザ情報12を取得する。
3, details of the content recommendation system shown in FIG. 2 are shown and the operation thereof will be described. In the content recommendation system, the content
そして、コンテンツ配信制御装置20は、コンテンツ推薦対象ユーザ選出装置1から取得した推薦対象ユーザ情報12で特定される推薦対象ユーザ(被推薦ユーザ)が利用している例えば端末23a,23cに対して推薦対象コンテンツ情報24を送信する。
Then, the content
コンテンツ推薦対象ユーザ選出装置1は、スコア生成ブロック2と学習ブロック3および選出ブロック4の各処理機能ブロックを有し、スコア生成ブロック2においては、端末2dから操作情報10(ユーザの操作履歴やコンテンツの利用履歴やアンケート結果等の情報)を随時入力し、学習ブロック3が用いるユーザ・キーワード間スコアデータを生成してユーザ・キーワード間スコア格納部2dで格納する。
The content recommendation target
学習ブロック3においては、スコア生成ブロック2で生成し格納したユーザ・キーワード間スコアデータを読み込み、関連性があるキーワードをグループ化したキーワード関係グループと、そのグループ別にユーザ毎のスコアを記録したグループ別ユーザ別スコアデータを、しかるべき契機で随時生成し、それぞれ、キーワード関係グループ抽出結果格納部3b、グループ別ユーザ別スコア格納部3dで格納する。
In the
選出ブロック4においては、コンテンツ情報入力手段4aにより、コンテンツ配信制御装置20から送信されたコンテンツキーワード情報11を入力し、学習ブロック3におけるキーワード関係グループ抽出結果格納部3bとグループ別ユーザ別スコア格納部3dでの格納内容を参照して、推薦対象ユーザ情報出力手段4cによりしかるべき演算と処理によって推薦対象ユーザ(被推薦ユーザ)を選出し、選出結果を推薦対象ユーザ情報12としてコンテンツ配信制御装置20に対して出力する。
In the
このコンテンツ推薦対象ユーザ選出装置1の詳細を、図1に基づき以下に説明する。図1に示すように、コンテンツ推薦対象ユーザ選出装置1は、スコア生成ブロック2と学習ブロック3および選出ブロック4の各処理機能ブロックを有し、このスコア生成ブロック2は、操作情報入力手段2a、コンテンツ利用ログ格納部2b、書式変換手段2c、ユーザ・キーワード間スコア格納部2dを有し、また、学習ブロック3は、キーワード関係グループ抽出手段3a、キーワード関係グループ抽出結果格納部3b、グループ別ユーザ別スコア算出手段3c、グループ別ユーザ別スコア格納部3dを有し、そして、選出ブロック4は、コンテンツキーワード情報入力手段4a、ユーザ別スコア算出手段4b、推薦対象ユーザ情報出力手段4c、選出条件記憶部(図中「選出条件」と記載)4dを有している。
Details of the content recommendation target
このコンテンツ推薦対象ユーザ選出装置1の各ブロックについて詳細を説明する。スコア生成ブロック2においては、操作情報入力手段2aにより、図4に具体例を示す操作情報10を読み込み、コンテンツ利用ログ格納部2bにおいて、図5に具体例を示す内容のコンテンツ利用ログ情報を記録する。
Details of each block of the content recommendation target
さらに、書式変換手段2cにより、コンテンツ利用ログ格納部2bで記録した図5に例示するコンテンツ利用ログ情報を参照して、コンテンツの利用履歴に対する重み付けや正規化、データの書式変換等を実施し、スコア付け等の処理を行い、ユーザ毎にコンテンツのメタデータであるキーワードそれぞれに対してスコアが記録されたユーザ・キーワード間スコアデータを生成し、ユーザ・キーワード間スコア格納部2dにおいて、図6に具体例を示す内容で記憶装置に格納する。
Further, the format conversion means 2c refers to the content usage log information illustrated in FIG. 5 recorded in the content usage
例えば、書式変換手段2cは、図5に例示するコンテンツ利用ログにおいて、操作内容が「削除」となったキーワードがある場合、図6「ユーザ・キーワード間スコア」の該当ユーザの該当キーワードのスコアを「−10」する。同様に、コンテンツ利用ログにおいて、操作内容が「アイコン保存」となったキーワードがある場合、「ユーザ・キーワード間スコア」の該当ユーザの該当キーワードのスコアを「+10」する。
For example, if there is a keyword whose operation content is “deleted” in the content usage log illustrated in FIG. 5, the
尚、この書式変換手段2cでは、操作情報10の種類や目的に応じて、スコアのつけ方や、変換の手法等をカスタマイズすることができる。
The format conversion means 2c can customize the score assignment method, conversion method, and the like according to the type and purpose of the
また、図5のコンテンツ利用ログにおいて、異なった利用シーンにおいて取得した操作情報10が混在することも考えられる。例えば、あるテレビ番組の視聴履歴における「途中で視聴中断した」情報や、端末上のコンテンツアイコンの操作履歴における「アイコンを削除した」情報、書籍の利用履歴データにおける「10分間アイコンを所持していた」情報などが混在する場合がある。
Further, in the content usage log of FIG. 5,
この場合は、予め書式変換手段2cにおいて、それぞれの利用シーン毎にスコアを定義しておくことで、異なる利用シーンであっても「ユーザ・キーワード間スコア」を生成することができる。例えば、「アイコン保存=+10点」、「アイコン削除=−10点」、「アイコン消滅=−5点」、「a分間アイコン所有=+log10(a)点」、「コンテンツ起動=+20点」、「コンテンツ途中中断=−5点」、「コンテンツ完全利用=+5点」と定義しておく。 In this case, by defining a score for each usage scene in the format conversion means 2c in advance, it is possible to generate a “user-keyword score” even for different usage scenes. For example, “icon save = + 10 points”, “icon deletion = −10 points”, “icon disappearance = −5 points”, “a minute icon ownership = + log 10 (a) points”, “content activation = + 20 points”, “ It is defined that “intermediate content interruption = −5 points” and “content complete use = + 5 points”.
次に、学習ブロック3においては、キーワード関係グループ抽出手段3aにより、ユーザ・キーワード間スコア格納部2dで格納したユーザ・キーワード間スコアデータ(図6参照)を読み込み、関係があるキーワード同士をしかるべき演算を行って抽出し、関係が得られた各キーワードをグループ化し、そのグループにグループID(識別子)を付与し、その結果を、図8に例示する内容で、キーワード関係グループ抽出結果格納部3bにおいて格納する。
Next, in the
さらに、グループ別ユーザ別スコア算出手段3cにより、キーワード関係グループ抽出結果格納部3bで格納したキーワード関係グループ抽出結果とユーザ・キーワード間スコア格納部2dで格納したユーザ・キーワード間スコアデータを基に、キーワード関係グループ毎に各ユーザのスコアをしかるべき演算を行って算出し、その結果を、図9に例示する内容でグループ別ユーザ別スコア格納部3dにおいて格納する。
Furthermore, based on the keyword-related group extraction result stored in the keyword-related group extraction
選出ブロック4においては、コンテンツキーワード情報入力手段4aにより、図2,3におけるコンテンツ配信制御装置20等の外部装置から、図11に例示する推薦対象コンテンツ情報24に対応する図12に例示するコンテンツキーワード集合11を入力し、ユーザ別スコア算出手段4bにより、キーワード関係グループ抽出結果格納部3bとグループ別ユーザ別スコア格納部3dのそれぞれで格納された情報を読み出し、各情報を用いてしかるべき演算と処理を行ってユーザ別のスコアを算出する。
In the
その後、推薦対象ユーザ情報出力手段4cにより、ユーザ別スコア算出手段4bで算出されたスコアが選出条件4dに合致する単数もしくは複数のユーザ(被推薦ユーザ)を選出し、推薦対象ユーザ情報12として、図2,3におけるコンテンツ配信制御装置20等の外部装置に出力する。
Thereafter, the recommendation target user information output means 4c selects one or a plurality of users (recommended users) whose scores calculated by the user-specific score calculation means 4b match the
図4に例示する操作情報では、ユーザID「user-c」のユーザが、そのユーザが使用している端末(23d)上に表示されている「子猫さしあげます」というコンテンツを起動する起動アイコンに対し「保存」操作を15時55分に行った場合の例である。ここでは、「子猫さしあげます」というコンテンツには予め「K1」および「K34」というキーワード(メタデータ)が付与されているとする。 In the operation information illustrated in FIG. 4, the user with the user ID “user-c” uses an activation icon that activates the content “Sick Kitten” displayed on the terminal (23 d) used by the user. In this example, the “save” operation is performed at 15:55. Here, it is assumed that the keywords “K1” and “K34” are preliminarily assigned to the content “I will raise a kitten”.
このような操作情報(10)は、端末(23d)の画面上の操作から取得することが可能である。例えば、端末(23d)の画面上にさまざまなコンテンツを起動するためのアイコンが表示されており、ユーザは必要に応じてそのアイコン押下することでコンテンツを利用したり、アイコンを削除したりフォルダに保存することが可能である場合、そのアイコンに対する操作を操作情報(10)として取得することができる。 Such operation information (10) can be acquired from an operation on the screen of the terminal (23d). For example, icons for activating various contents are displayed on the screen of the terminal (23d), and the user can use the contents by pressing the icons as needed, delete the icons, If it can be saved, the operation for the icon can be acquired as the operation information (10).
また、この操作情報(10)として、視聴履歴、操作履歴、入力履歴、取得履歴、利用履歴、行動履歴といった様々なデータを用いることが可能である。 As the operation information (10), various data such as a viewing history, an operation history, an input history, an acquisition history, a usage history, and an action history can be used.
尚、本例では、操作情報(10)において、コンテンツを説明するためのメタデータであるキーワードが予め付与されており、そのキーワードを用いているが、コンテンツを説明するためのキーワードが付与されておらず、代わりにコンテンツの説明文が付与されている場合は、その説明文に対して形態素解析等を行い当該コンテンツのメタデータであるキーワードを抽出するための別途処理が必要となる。 In this example, in the operation information (10), a keyword that is metadata for explaining the content is assigned in advance, and the keyword is used, but a keyword for explaining the content is assigned. If a description of the content is given instead, a separate process is required to extract a keyword that is metadata of the content by performing morphological analysis on the description.
図5に例示するコンテンツ利用ログは、随時入力した操作情報(10)から、学習ブロック3が利用可能なユーザ・キーワード間スコアデータの生成に必要な項目を抜粋して蓄積したものであり、「時刻」、「ユーザID」、「操作対象キーワード」、「操作内容」の各項目からなる。
The content usage log illustrated in FIG. 5 is an accumulation of excerpts of items necessary for generating score data between users and keywords that can be used by the
図6に例示するユーザ・キーワード間スコアデータは、図1の書式変換手段2cによって、例えば図5に示すコンテンツ利用ログからスコア付け処理を行い、学習ブロック3で参照する形式で保存されたものであり、本例のユーザ・キーワード間スコアデータは、ユーザとキーワードの2次元配列変数であり、ユーザ毎およびキーワード毎にそれぞれにスコア(数値)が記録されている。
The score data between the user and the keyword illustrated in FIG. 6 is stored in a format referred to in the
以下、この図6に示すコンテンツ利用ログに基づく学習ブロック3における処理動作例を、図7に基づき説明する。尚、本図7の例は、キーワード関係グループ抽出手段3aにおけるキーワード関係グループを生成する演算にクラスタリング処理を用いる。
Hereinafter, an example of processing operation in the
このように、キーワード関係グループを生成する演算にクラスタリング処理を用いた場合、キーワード関係グループ抽出手段3aにおいて、まず、ユーザ・キーワード間スコア格納部2dで格納されたユーザ・キーワード間スコアデータを読み込み(ステップS701)、当該ユーザ・キーワード間スコアデータに対するクラスタリング処理を実施してキーワード集合のクラスタを生成する(ステップS702)。そして、生成したキーワード集合のクラスタを、それぞれキーワード関係グループとしてキーワード関係グループ抽出結果格納部3bに渡し格納する(ステップS703)。
As described above, when the clustering process is used for the operation for generating the keyword relation group, the keyword relation
生成されたキーワード関係グループは、例えば、図8に示すように、「グループA={K1,K2,K8}、「グループB={K3,K9,K10,K12,K15}」、…といった具合になる。 For example, as shown in FIG. 8, the generated keyword-related groups are “group A = {K1, K2, K8},“ group B = {K3, K9, K10, K12, K15} ”, and so on. Become.
尚、このクラスタリング処理の際は、生成クラスタ数、データの正規化の有無といったクラスタリング条件を設定ファイルにて記述しておいたり、ハードコーディングによって定義しておくことができる。また、生成されたキーワード関係グループ以外にも、予め登録しておいたキーワード関係グループを用いることも可能である。 In this clustering process, clustering conditions such as the number of generated clusters and the presence / absence of data normalization can be described in a setting file or can be defined by hard coding. In addition to the generated keyword relation group, a keyword relation group registered in advance can be used.
次に、学習ブロック3では、グループ別ユーザ別スコア算出手段3cにより、キーワード関係グループ別にユーザ別のスコアであるグループ別ユーザ別スコアデータを算出する。すなわち、グループ別ユーザ別スコア算出手段3cは、ユーザ・キーワード間スコア格納部2dからユーザ・キーワード間スコアデータを1レコードずつ読み込む(ステップS704)。
Next, in the
例えば、キーワードを「key」、ユーザを「u」,ユーザ・キーワード間スコアデータを「SCORE(key,u)」と表す場合、図6に示すデータを1レコード読み込むと、「SCORE(K1,user-a)=2」、「SCORE(K1,user-b)=−5」、「SCORE(K1,user-c)=2」、「SCORE(K1,user-d)=1」、「SCORE(K1,user-e)=2」、「SCORE(K1,user-f)=0」となる。 For example, when the keyword is “key”, the user is “u”, and the user-keyword score data is “SCORE (key, u)”, when one record of the data shown in FIG. 6 is read, “SCORE (K1, user) -a) = 2 "," SCORE (K1, user-b) =-5 "," SCORE (K1, user-c) = 2 "," SCORE (K1, user-d) = 1 "," SCORE ( K1, user-e) = 2 "and" SCORE (K1, user-f) = 0 ".
さらに、グループ別ユーザ別スコア算出手段3cは、このようにして読み込んだキーワード(key)が、ステップS702で生成してステップS703においてキーワード関係グループ抽出結果格納部3bで格納したキーワード関係グループのいずれかに含まれているかを判別し、keyを含むキーワード関係グループのグループIDである「gr」を取得し、(ステップS705)、そして、キーワード関係グループID「gr」のユーザuの「グループ別ユーザ別スコア」SC(gr,u)に、ステップS704で読み込んだスコアSCORE(key,u)を加算する(「SC(gr,u)=SC(gr,u)+SCORE(key,u)」)(ステップS705)。
Further, the group-specific user score calculation means 3c uses any one of the keyword-related groups generated in step S702 and stored in the keyword-related group extraction
例えば、ステップS702で生成してステップS703においてキーワード関係グループ抽出結果格納部3bで格納したキーワード関係グループが図8に例示するキーワード関係グループであり、ステップS704で、図6に例示するユーザ・キーワード間スコアデータにおける最初の1レコード読み込んだ場合、ステップS704で読み込んだキーワードK1は、図8においてキーワード関係グループAに含まれているため、図9に示すグループ別ユーザ別スコアデータにおけるグループA項目のユーザ毎のスコアにそれぞれキーワードK1の各ユーザのスコアを加算する。
For example, the keyword relation group generated in step S702 and stored in the keyword relation group extraction
この例の場合、グループ別ユーザ別スコアSC(gr,u)の演算は、「SC(グループA,user-a)=SC(グループA,user-a)+2」、「SC(グループA,user-b)=SC(グループA,user-b)−5」、「SC(グループA,user-c)=SC(グループA,user-c)+2」、「SC(グループA,user-d)=SC(グループA,user-d)+1」、「SC(グループA,user-e)=SC(グループA,user-e)+2」、「SC(グループA,user-f)=SC(グループA,user-f)+0」となる。 In this example, the calculation of the group-specific user score SC (gr, u) is “SC (group A, user-a) = SC (group A, user-a) +2”, “SC (group A, user). -b) = SC (group A, user-b) -5 "," SC (group A, user-c) = SC (group A, user-c) +2 "," SC (group A, user-d) " = SC (group A, user-d) +1 "," SC (group A, user-e) = SC (group A, user-e) + 2 "," SC (group A, user-f) = SC (group A, user-f) +0 ".
グループ別ユーザ別スコア算出手段3cでは、ユーザ・キーワード間スコア格納部2dから全てのレコードを読み込み終わった場合は、次のステップS707の処理を行い、、まだの場合は再びステップS704からの処理を繰り返し実行する。尚、この際の分岐条件としては、ユーザ・キーワード間スコア格納部2dからすべてのレコードを読み込み終わった場合以外にも、予め設定しておいた条件に合致した場合なども考えられる。
In the group-by-user score calculation means 3c, when all the records have been read from the user / keyword
ステップS707において、グループ別ユーザ別スコア算出手段3cは、ステップS705で生成したグループ別ユーザ別スコアSC(gr,u)を、グループ別ユーザ別スコア格納部3dに渡して格納する。
In step S707, the group-specific user score calculation means 3c passes the group-specific user score SC (gr, u) generated in step S705 to the group-specific user
図8に示すキーワード関係グループデータは、キーワード関係グループ抽出手段3aにおいて抽出されたキーワード関係グループを記述したデータである。本例のキーワード関係グループデータでは、キーワード関係グループ毎に、そのグループIDと、それぞれグループに含まれるキーワードを記述している。 The keyword relation group data shown in FIG. 8 is data describing the keyword relation group extracted by the keyword relation group extraction means 3a. In the keyword-related group data of this example, for each keyword-related group, the group ID and the keyword included in each group are described.
尚、キーワード関係グループデータとしては、キーワード関係グループ抽出手段3aで抽出したキーワード関係グループ以外に、予め定義しておいたキーワード関係グループも格納することが可能である。例えば、図8に例示するように、キーワード関係グループ抽出手段3aで抽出したキーワード関係グループ以外に、全てのキーワードをグループにした「全キーワード」というキーワード関係グループを、予め登録しておくこともできる。
In addition to the keyword relationship group extracted by the keyword relationship
図9に示すグループ別ユーザ別スコアデータは、キーワード関係グループ抽出手段3aで生成したキーワード関係グループ別に、ユーザそれぞれのスコアを格納したデータであり、ここでは、キーワード関係グループ抽出手段3aで生成されたキーワード関係グループ「グループA」、「グループB」、「グループC」、「グループD」と、すべてのキーワードが含まれる「全キーワード」それぞれにおいて、ユーザ「user-a」、「user-b」、「user-c」、「user-d」、「user-e」、「user-f」のスコアがそれぞれ対応付けて格納されている。
The group-specific user-specific score data shown in FIG. 9 is data in which the score of each user is stored for each keyword-related group generated by the keyword-related
尚、図8の例で説明したように、「全キーワード」は、キーワード関係グループ抽出手段3aで抽出されたキーワード関係グループではなく、別途定義されていたキーワード関係グループである。また、グループ別ユーザ別スコアは、学習ブロック3の実行時は空であり、グループ別ユーザ別スコア算出手段3aにおいてスコアが加算されて生成される。
As described in the example of FIG. 8, “all keywords” is not a keyword relationship group extracted by the keyword relationship
次に、このように学習ブロック3で生成した図8に示すキーワード関係グループデータと図9に示すグループ別ユーザ別スコアデータに基づく選出ブロック4における処理動作例を、図10に基づき説明する。
Next, an example of processing operation in the
まず、コンテンツキーワード情報入力手段4aにおいて、推薦対象のコンテンツのメタデータであるキーワードの集合としてのコンテンツキーワード情報を入力する(ステップS801)。次に、ユーザ別スコア算出手段4bにおいて、キーワード関係グループ抽出結果格納部3bからキーワード関係グループデータを読み込む(ステップS802)。
First, in the content keyword information input means 4a, content keyword information as a set of keywords that is metadata of content to be recommended is input (step S801). Next, the keyword-related
さらに、ユーザ別スコア算出手段4bにおいて、ステップS801で入力したコンテンツキーワード情報と、ステップS802で読み込んだキーワード関係グループデータの各グループとの類似度を所定の算出式を用いて算出する(ステップS803)。類似度はキーワード関係グループのグループgrごとに算出する。
Further, the
類似度の算出式の例としては、「類似度α(gr)=(コンテンツキーワード情報と、キーワード関係グループgrとの両方に含まれるキーワード数)÷(キーワード関係グループgrに含まれるキーワード数)」がある。また、この他にも、コンテンツキーワード情報やキーワード関係グループは、それぞれキーワード集合のため、キーワードベクトルと考えて、キーワードベクトル同士の内積、余弦演算で類似度を求めても良い。 As an example of the similarity calculation formula, “similarity α (gr) = (number of keywords included in both content keyword information and keyword relationship group gr) / ÷ (number of keywords included in keyword relationship group gr)” There is. In addition, since the content keyword information and the keyword relation group are each a set of keywords, the content keyword information and the keyword relation group may be considered as a keyword vector, and the similarity may be obtained by an inner product of the keyword vectors or a cosine calculation.
上述の算出式を用いた場合、例えば、ステップS801で図12に示すコンテンツキーワード情報を入力し、ステップS802で図8に示すキーワード関係グループデータを読み込んだ場合、グループAに属するキーワード数は「3(=K1,K2,K8)」で、図12におけるコンテンツキーワード情報とグループAとの両方に含まれるキーワード数は「0」なので、「類似度α(グループA)=0÷3=0」となる。 When the above calculation formula is used, for example, when the content keyword information shown in FIG. 12 is input in step S801 and the keyword-related group data shown in FIG. 8 is read in step S802, the number of keywords belonging to group A is “3. (= K1, K2, K8) ”and the number of keywords included in both the content keyword information and group A in FIG. 12 is“ 0 ”, so“ similarity α (group A) = 0 ÷ 3 = 0 ”. Become.
同様に、グループBに属するキーワード数は「5(=K3,K9,K10,K12,K15)」、コンテンツキーワード情報とグループBとの両方に含まれるキーワード数は「2(=K3,K15)」なので、「類似度α(グループB)=2÷5=0.4」となり、グループCに属するキーワード数は「2」、コンテンツキーワード情報とグループCとの両方に含まれるキーワード数は「1」なので、「類似度α(グループC)=1÷2=0.5」、グループDに属するキーワード数は「5」、コンテンツキーワード情報とグループDとの両方に含まれるキーワード数は「1」なので、「類似度α(グループD)=1÷5=0.2」となり、全キーワード関係グループに属するキーワード数は「15」、コンテンツキーワード情報と全キーワード関係グループとの両方に含まれるキーワード数は「4」なので、「類似度α(全キーワード)=4÷15=0.267」となる。 Similarly, the number of keywords belonging to group B is “5 (= K3, K9, K10, K12, K15)”, and the number of keywords included in both the content keyword information and group B is “2 (= K3, K15)”. Therefore, “similarity α (group B) = 2 ÷ 5 = 0.4”, the number of keywords belonging to group C is “2”, and the number of keywords included in both the content keyword information and group C is “1”. Therefore, “similarity α (group C) = 1 ÷ 2 = 0.5”, the number of keywords belonging to group D is “5”, and the number of keywords included in both the content keyword information and group D is “1”. , “Similarity α (group D) = 1 ÷ 5 = 0.2”, the number of keywords belonging to all keyword-related groups is “15”, content keyword information and all keywords Number of keywords included in both the engagement groups since "4", and "similarity alpha (total keyword) = 4 ÷ 15 = 0.267".
このようにして類似度を算出した後、ユーザ別スコア算出手段4bは、類似度が一番大きいキーワード関係グループのグループIDを選出する(ステップS804)。上述の例の場合、類似度が一番大きいキーワード関係グループのグループIDは、グループC(類似度=0.5)である。
After calculating the similarity in this way, the
そして、ユーザ別スコア算出手段4bは、グループ別ユーザ別スコア格納部3dで格納したグループ別ユーザ別スコア「SC(グループgr,ユーザu)」を参照して、ステップS804で選出したキーワード関係グループのユーザ別のスコアS(u)を取得する。
Then, the user-specific score calculation means 4b refers to the group-specific user score “SC (group gr, user u)” stored in the group-specific user-specific
例えば、上述の例のように、ステップS804においてグループCが選出された場合、図9におけるグループ別ユーザ別スコアデータからグループCのユーザ別スコアを読み込み、その結果、取得するユーザ別スコアS(u)は、「S(user- a)=SC(グループC,user-a)=−6」、「S(user-b)=SC(グループC,user-b)=+7」、「S(user-c)=SC(グループC,user-c)=−8」、「S(user-d)=SC(グループC,user-d)=+9」、「S(user-e)=SC(グループC,user-e)=−13」、「S(user-f)=SC(グループC,user-f)=−10」となる。 For example, as in the above example, when the group C is selected in step S804, the read user-specific group score C from a group by subscriber score data in Figure 9, so that the user-specific scores S (u to obtain ) “S (user-a) = SC (group C, user-a) = − 6”, “S (user-b) = SC (group C, user-b) = + 7”, “S (user -c) = SC (group C, user-c) =-8 "," S (user-d) = SC (group C, user-d) = + 9 "," S (user-e) = SC (group C, user-e) = − 13 ”and“ S (user-f) = SC (group C, user-f) = − 10 ”.
推薦対象ユーザ情報出力手段4cでは、このようにしてユーザ別スコア算出手段4bで算出されたユーザ別スコアS(u)から、予め選出条件記憶部4dにおいて設定された選出条件を満たしたスコアを有するユーザを選出し(ステップS806)、選出したユーザの識別子(ユーザID)を出力する(ステップS807)。
The recommendation target user
例えば、ステップS805で取得したユーザ別スコアが上述した「S(user-a)=SC(グループC,user-a)=−6」、「S(user-b)=SC(グループC,user-b)=+7」、「S(user-c)=SC(グループC,user-c)=−8」、「S(user-d)=SC(グループC,user-d)=+9」、「S(user-e)=SC(グループC,user-e)=−13」、「S(user-f)=SC(グループC,user-f)=−10」の場合で、選出対象ユーザの設定条件が「スコアが0以上のユーザ」である場合、その選出条件を満たした「user-b」と「user-d」を選出して出力する。 For example, the user-specific scores acquired in step S805 are “S (user-a) = SC (group C, user-a) = − 6” and “S (user-b) = SC (group C, user- b) = + 7 ”,“ S (user-c) = SC (group C, user-c) = − 8 ”,“ S (user-d) = SC (group C, user-d) = + 9 ”,“ In the case of S (user-e) = SC (group C, user-e) = − 13 ”and“ S (user-f) = SC (group C, user-f) = − 10 ”, the selection target user When the setting condition is “user with score of 0 or more”, “user-b” and “user-d” that satisfy the selection condition are selected and output.
尚、選出条件記憶部4dに設定する選出条件は、予めハードコーディングしておいても良い。また、設定ファイルで記述しておいても良い。さらに、選択条件としては、ユーザ数やグループに含まれるキーワード数をはじめとする値を変数とした数式で記述しておいても良い。
The selection conditions set in the selection
図11に示す推薦対象コンテンツ情報は、ユーザに推薦するコンテンツに関する情報を記述しており、本例では、コンテンツ名(「GoGoトラ物語第3話」)やそのコンテンツへアクセスするためのURL(リンク先URL)、そのコンテンツのアイコンのURL(アイコンURL)、さらに、そのコンテンツの内容を表現する単数もしくは複数のキーワード(K3,K4,K13,K15)が登録されている。尚、このような推薦対象コンテンツ情報のキーワードは、そのコンテンツの説明文を形態素解析したものを用いることも可能である。
The recommendation target content information shown in FIG. 11 describes information related to the content recommended to the user. In this example, the content name (“GoGo
図12に示すコンテンツキーワード情報は、図11の推薦対象コンテンツ情報からキーワードだけを取り出した情報であり、「K3,K4,K13,K15」の各キーワードからなる。 The content keyword information shown in FIG. 12 is information obtained by extracting only the keyword from the recommendation target content information shown in FIG. 11, and includes the keywords “K3, K4, K13, K15”.
図1における選出ブロック4の処理動作例としては、図10で示したものに限定されるものではなく、例えば、図13に示す処理動作でも良い。この図13に示す処理動作例は、図10の処理フローにおけるステップS804とステップS805の処理部分のみ、図13におけるステップS1304として別手法にしたものであり、図13におけるステップS1301〜S1303、および、ステップS1305,S1306の処理は、それぞれ、図10におけるステップS801〜S803、および、ステップS806,S807の処理に相当する。以下、その相違するステップS1304の処理部分のみ説明する。
The processing operation example of the
ここで、キーワード関係グループを「gr」、コンテンツキーワード情報とキーワード関係グループgrとの類似度を「α(gr)」、グループ別ユーザ別スコアを「SC(gr,u)」とする。本図13のステップS1304の処理において、ユーザ別スコア「S(u)」は、「S(u)=Σgr{SC(gr,u)×α(gr)}として算出する。この手法を用いることによって、複数のキーワード関係グループの特徴を反映したユーザ選出が可能となる。 Here, it is assumed that the keyword-related group is “gr”, the similarity between the content keyword information and the keyword-related group gr is “α (gr)”, and the group-specific user score is “SC (gr, u)”. 13, the user-specific score “S (u)” is calculated as “S (u) = Σgr {SC (gr, u) × α (gr)}. This method is used. This makes it possible to select users reflecting the characteristics of a plurality of keyword-related groups.
以上、図1〜図13を用いて説明したように、本例では、ネットワークを介して配信するコンテンツの推薦対象となるユーザ(被対象ユーザ)をコンピュータ処理して選出する際、まず、スコア生成ブロック2において、ユーザのコンテンツに対する操作内容と当該コンテンツのメタデータであるキーワード(図4および図5に示す操作情報およびコンテンツ利用ログ情報)に基づき、ユーザ別、かつキーワード別に操作内容に応じたスコアを累計して表(図6に示すユーザ・キーワード間スコア情報)を生成する。
As described above with reference to FIGS. 1 to 13, in this example, when a user (target user) to be recommended for content distributed via a network is selected by computer processing, first, score generation is performed. In
次に、学習ブロック3において、図6に示すユーザ・キーワード間スコア情報に基づき、キーワードをグループ分けすると共に(図8のキーワード関係グループ情報)、この図8のキーワード関係グループ情報と図6のユーザ・キーワード間スコア情報に基づき、グループ別、かつ、ユーザ別に、グループ配下の各キーワードのスコアを累計して表(図9のグループ別ユーザ別スコア情報)を生成する。
Next, in the
そして、選出ブロック4において、推薦対象のコンテンツのメタデータであるキーワード群と図8のキーワード関係グループ情報における各グループのキーワード群との類似度を算出し、例えば、最も類似するキーワード群のグループを特定し、このグループに図9に示すグループ別ユーザ別スコア情報で対応付けられた各ユーザのスコアの内、例えばスコアが一定値以上である等の所定条件に合致するスコアのユーザを求め、求めたユーザを被対象ユーザとして選出する。
Then, in the
このように、本例の構成および処理によれば、全ユーザの利用履歴を基にして生成したキーワード関係グループを用いる協調的な手法を用いたユーザ推薦(リコメンド)を行うので、被推薦ユーザにとって利用実績が無いコンテンツであっても、当該被推薦ユーザへの推薦が可能となる。また、コンテンツをキーワードベクトルとして表現するため、全ユーザの利用実績がない新しいコンテンツであっても、当該ユーザへの推薦が可能となる。さらに、あるコンテンツを、多くのユーザ中から推薦に適したユーザを選出する場合であっても、協調ユーザを選出する必要がなく、コンテンツが属するグループを選択する処理を行うだけなので、処理がユーザ数に関連して大きくならず、高速なユーザ選出処理が可能となる。 As described above, according to the configuration and processing of this example, user recommendation (recommendation) is performed using a collaborative method using a keyword relation group generated based on the usage history of all users. Even content that has not been used can be recommended to the recommended user. In addition, since the content is expressed as a keyword vector, it is possible to recommend new content that has not been used by all users. Furthermore, even when selecting a user suitable for recommendation from a large number of users, there is no need to select a collaborative user and only the process of selecting a group to which the content belongs is performed. The user selection process can be performed at high speed without increasing in relation to the number.
尚、本発明は、図1〜図13を用いて説明した例に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能である。例えば、本例では、キーワード関係グループ抽出手段3aにおける、関係あるキーワード同士をグループ化する手法として、クラスタリング処理手法を用いているが、このクラスタリング手法以外にも、データマイニングの相関ルール抽出手法によってグループを生成する手法等を用いることでも良い。
In addition, this invention is not limited to the example demonstrated using FIGS. 1-13, In the range which does not deviate from the summary, various changes are possible. For example, in this example, a clustering processing technique is used as a technique for grouping related keywords in the keyword relation
1:コンテンツ推薦対象ユーザ選出装置、2:スコア生成ブロック、2a:操作情報入力手段、2b:コンテンツ利用ログ格納部、2c:書式変換手段、2d:ユーザ・キーワード間スコア格納部、3:学習ブロック、3a:キーワード関係グループ抽出手段、3b:キーワード関係グループ抽出結果格納部、3c:グループ別ユーザ別スコア算出手段、3d:グループ別ユーザ別スコア格納部、4:選出ブロック、4a:コンテンツキーワード情報入力手段、4b:ユーザ別スコア算出手段、4c:推薦対象ユーザ情報出力手段、4d:選択条件記憶部、10:操作情報、11:コンテンツキーワード情報、12:推薦対象ユーザ情報、20:コンテンツ配信制御装置、21:コンテンツデータベース(「コンテンツDB」)、22:ネットワーク、23a〜23d:端末、24:推薦対象コンテンツ。
1: content recommendation target user selection device, 2: score generation block, 2a: operation information input means, 2b: content use log storage section, 2c: format conversion means, 2d: score storage section between user and keyword, 3: learning
Claims (9)
ユーザがコンテンツを利用する毎に、該コンテンツのメタデータであるキーワードと当該コンテンツに対するユーザの操作内容およびユーザ識別情報を取得し、各ユーザ別および各キーワード別に各操作内容を対応付けたコンテンツ利用ログ情報を生成して記憶装置に記録する第1の手段と、
上記コンテンツ利用ログ情報における各操作内容に応じたスコアを、記憶装置に記録されている全てのコンテンツ利用ログ情報について求め、求めたスコアを各ユーザ別および各キーワード別に累計し、累計したスコアを各ユーザ別および各キーワード別に対応付けたユーザ・キーワード間スコア情報を生成して記憶装置に記録する第2の手段と、
上記各キーワードを各々の関連を算出してグループに分け、各グループ別に各キーワードを対応付けたキーワード関係グループ情報を生成して記憶装置に登録する第3の手段と、
上記キーワード関係グループ情報および上記ユーザ・キーワード間スコア情報を参照して、各グループ毎に、同じグループ内の各キーワードのそれぞれに対応付けられた各ユーザの累計スコアをさらに累計し、該累計したスコアを各グループ別および各ユーザ別に対応付けたグループ別ユーザ別スコア情報を生成して記憶装置に格納する第4の手段と、
推薦対象のコンテンツのメタデータである1以上のキーワードを取得し、取得したキーワードが含まれる1以上のグループを上記キーワード関係グループ情報を参照して特定し、特定したグループに対応付けられた各ユーザ毎のスコアを上記グループ別ユーザ別スコア情報を参照して求め、特定したグループが複数であれば各ユーザ毎に累計してスコアを求める第5の手段と、
求めたスコアが所定のスコア条件を満たすユーザを、上記推薦対象のコンテンツの推薦対象となるユーザとして選出する第6の手段と
を有することを特徴とするコンテンツ推薦対象ユーザ選出装置。 A content recommendation target user selection device for selecting users who are content recommendation targets,
Each time a user uses a content, a keyword that is metadata of the content, a user operation content and user identification information for the content, and a content usage log in which each operation content is associated with each user and each keyword First means for generating and recording information in a storage device;
A score corresponding to each operation content in the content usage log information is obtained for all content usage log information recorded in the storage device, and the obtained score is accumulated for each user and each keyword, and the accumulated score is Second means for generating user-keyword score information associated with each user and each keyword and recording it in the storage device;
A third means for calculating the respective associations of the keywords to divide them into groups, generating keyword-related group information in which each keyword is associated with each group, and registering the information in a storage device;
Referring to the keyword-related group information and the user-keyword score information, for each group, the cumulative score of each user associated with each keyword in the same group is further accumulated, and the accumulated score A fourth means for generating score information for each group and for each group and for each user and storing them in the storage device;
One or more keywords that are metadata of content to be recommended are acquired, one or more groups including the acquired keywords are specified with reference to the keyword-related group information, and each user associated with the specified group A fifth means for obtaining a score for each user by referring to the group-specific score information for each user and, if there are a plurality of identified groups, for each user,
A content recommendation target user selection device, comprising: a sixth means for selecting a user whose calculated score satisfies a predetermined score condition as a user who is a recommendation target of the recommended content.
ユーザがコンテンツを利用する毎に、該コンテンツのメタデータであるキーワードと当該コンテンツに対するユーザの操作内容およびユーザ識別情報を取得し、各ユーザ別および各キーワード別に各操作内容を対応付けたコンテンツ利用ログ情報を生成して記憶装置に記録する第1の手段と、
上記コンテンツ利用ログ情報における各操作内容に応じたスコアを、記憶装置に記録されている全てのコンテンツ利用ログ情報について求め、求めたスコアを各ユーザ別および各キーワード別に累計し、累計したスコアを各ユーザ別および各キーワード別に対応付けたユーザ・キーワード間スコア情報を生成して記憶装置に記録する第2の手段と、
上記各キーワードを各々の関連を算出してグループに分け、各グループ別に各キーワードを対応付けたキーワード関係グループ情報を生成して記憶装置に登録する第3の手段と、
上記キーワード関係グループ情報および上記ユーザ・キーワード間スコア情報を参照して、各グループ毎に、同じグループ内の各キーワードのそれぞれに対応付けられた各ユーザの累計スコアをさらに累計し、該累計したスコアを各グループ別および各ユーザ別に対応付けたグループ別ユーザ別スコア情報を生成して記憶装置に格納する第4の手段と、
推薦対象のコンテンツのメタデータであるキーワード集合を取得し、取得したキーワード集合に最も類似するキーワード集合のグループを上記キーワード関係グループ情報を参照して特定する第5の手段と、
上記グループ別ユーザ別スコア情報を参照して、上記特定したグループに対応付けられた累計スコアが所定のスコア条件を満たすユーザを、上記推薦対象のコンテンツの推薦対象となるユーザとして選出する第6の手段と
を有することを特徴とするコンテンツ推薦対象ユーザ選出装置。 A content recommendation target user selection device for selecting users who are content recommendation targets,
Each time a user uses a content, a keyword that is metadata of the content, a user operation content and user identification information for the content, and a content usage log in which each operation content is associated with each user and each keyword First means for generating and recording information in a storage device;
A score corresponding to each operation content in the content usage log information is obtained for all content usage log information recorded in the storage device, and the obtained score is accumulated for each user and each keyword, and the accumulated score is Second means for generating user-keyword score information associated with each user and each keyword and recording it in the storage device;
A third means for calculating the respective associations of the keywords to divide them into groups, generating keyword-related group information in which each keyword is associated with each group, and registering the information in a storage device;
Referring to the keyword-related group information and the user-keyword score information, for each group, the cumulative score of each user associated with each keyword in the same group is further accumulated, and the accumulated score A fourth means for generating score information for each group and for each group and for each user and storing them in the storage device;
A fifth means for acquiring a keyword set which is metadata of content to be recommended, and specifying a keyword set group most similar to the acquired keyword set with reference to the keyword-related group information;
A sixth user who refers to the group-specific user score information and selects a user whose cumulative score associated with the specified group satisfies a predetermined score condition as a user who is a recommendation target of the recommended content. And a content recommendation target user selection device.
ユーザがコンテンツを利用する毎に、該コンテンツのメタデータであるキーワードと当該コンテンツに対するユーザの操作内容およびユーザ識別情報を取得し、各ユーザ別および各キーワード別に各操作内容を対応付けたコンテンツ利用ログ情報を生成して記憶装置に記録する第1の手段と、
上記コンテンツ利用ログ情報における各操作内容に応じたスコアを、記憶装置に記録されている全てのコンテンツ利用ログ情報について求め、求めたスコアを各ユーザ別および各キーワード別に累計し、累計したスコアを各ユーザ別および各キーワード別に対応付けたユーザ・キーワード間スコア情報を生成して記憶装置に記録する第2の手段と、
上記各キーワードを各々の関連を算出してグループに分け、各グループ別に各キーワードを対応付けたキーワード関係グループ情報を生成して記憶装置に登録する第3の手段と、
上記キーワード関係グループ情報および上記ユーザ・キーワード間スコア情報を参照して、各グループ毎に、同じグループ内の各キーワードのそれぞれに対応付けられた各ユーザの累計スコアをさらに累計し、該累計したスコアを各グループ別および各ユーザ別に対応付けたグループ別ユーザ別スコア情報を生成して記憶装置に格納する第4の手段と、
推薦対象のコンテンツのメタデータであるキーワード集合を取得し、取得したキーワード集合と上記キーワード関係グループ情報から読み込んだ各グループに含まれるキーワード集合との類似度を各グループ毎に算出し、
算出した各グループ毎の類似度を用いて、上記グループ別ユーザ別スコア情報における当該グループ毎の各ユーザに対応付けられた各スコアに重み付け演算を行い、各ユーザ毎に、重み付けされたスコアの合計を求める第5の手段と、
求めた合計スコアが所定のスコア条件を満たすユーザを、上記推薦対象のコンテンツの推薦対象となるユーザとして選出する第6の手段と
を有することを特徴とするコンテンツ推薦対象ユーザ選出装置。 A content recommendation target user selection device for selecting users who are content recommendation targets,
Each time a user uses a content, a keyword that is metadata of the content, a user operation content and user identification information for the content, and a content usage log in which each operation content is associated with each user and each keyword First means for generating and recording information in a storage device;
A score corresponding to each operation content in the content usage log information is obtained for all content usage log information recorded in the storage device, and the obtained score is accumulated for each user and each keyword, and the accumulated score is Second means for generating user-keyword score information associated with each user and each keyword and recording it in the storage device;
A third means for calculating the respective associations of the keywords to divide them into groups, generating keyword-related group information in which each keyword is associated with each group, and registering the information in a storage device;
Referring to the keyword-related group information and the user-keyword score information, for each group, the cumulative score of each user associated with each keyword in the same group is further accumulated, and the accumulated score A fourth means for generating score information for each group and for each group and for each user and storing them in the storage device;
Obtain a keyword set that is metadata of content to be recommended, calculate the similarity between the acquired keyword set and the keyword set included in each group read from the keyword-related group information for each group,
Using the calculated similarity for each group, a weighting operation is performed on each score associated with each user for each group in the group-specific user score information, and the sum of the weighted scores for each user A fifth means for obtaining
A content recommendation target user selection device comprising: a sixth means for selecting a user whose total score satisfies a predetermined score condition as a user who is a recommendation target of the recommended content.
上記第4の手段は、
上記ユーザ・キーワード間スコア情報に含まれる各ユーザと上記キーワード関係グループ情報に含まれる各グループとを読み込み、それぞれを二次元配列した表を生成し、
上記ユーザ・キーワード間スコア情報を参照して各キーワード毎の各ユーザのスコアを順次に読み込み、読み込む毎に、読み込んだキーワードのグループを上記キーワード関係グループ情報を参照して特定し、
上記表における上記特定したグループおよび上記読み込んだ各ユーザに対応付けて上記読み込んだ各ユーザのスコアを加算して上記グループ別ユーザ別スコア情報を生成することを特徴とするコンテンツ推薦対象ユーザ選出装置。 The content recommendation target user selection device according to any one of claims 1 to 4,
The fourth means is
Read each user included in the user-keyword score information and each group included in the keyword-related group information, and generate a table in which each is two-dimensionally arranged,
Read the score of each user for each keyword sequentially with reference to the user-keyword score information, and each time the read keyword group is identified with reference to the keyword-related group information,
A content recommendation target user selection device, wherein the score information for each group user is generated by adding the score of each read user in association with the specified group and each read user in the table.
請求項1から請求項6のいずれかに記載のコンテンツ推薦対象ユーザ選出装置を具備し、
上記コンテンツを推薦するユーザを上記コンテンツ推薦対象ユーザ選出装置で選出し、選出したユーザを対象として上記コンテンツを推薦することを特徴とするコンテンツ推薦システム。 A content recommendation system for recommending content to a user via a computer network,
The content recommendation target user selection device according to any one of claims 1 to 6, comprising:
A content recommendation system, wherein a user who recommends the content is selected by the content recommendation target user selection device, and the content is recommended for the selected user.
プログラムされたコンピュータの処理実行手順として、
請求項1から請求項6のいずれかに記載のコンテンツ推薦対象ユーザ選出装置における各手段が実行する処理手順を含むことを特徴とするコンテンツ推薦対象ユーザ選出方法。 A content recommendation target user selection method for an apparatus that performs selection of a user to be recommended for content distributed via a network by programmed computer processing,
As a process execution procedure of the programmed computer,
The content recommendation object user selection method characterized by including the process procedure which each means in the content recommendation object user selection apparatus in any one of Claims 1-6 performs .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003377206A JP4307220B2 (en) | 2003-11-06 | 2003-11-06 | Content recommendation target user selection apparatus and method, program, and content recommendation system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003377206A JP4307220B2 (en) | 2003-11-06 | 2003-11-06 | Content recommendation target user selection apparatus and method, program, and content recommendation system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2005141486A JP2005141486A (en) | 2005-06-02 |
| JP4307220B2 true JP4307220B2 (en) | 2009-08-05 |
Family
ID=34688005
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003377206A Expired - Fee Related JP4307220B2 (en) | 2003-11-06 | 2003-11-06 | Content recommendation target user selection apparatus and method, program, and content recommendation system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4307220B2 (en) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4851299B2 (en) * | 2006-10-31 | 2012-01-11 | 富士通株式会社 | Bookmark management device, bookmark management program, and bookmark management method |
| JP2008305055A (en) * | 2007-06-06 | 2008-12-18 | Nippon Telegr & Teleph Corp <Ntt> | SEARCH PROCESSING DEVICE, SEARCH PROCESSING METHOD, SEARCH PROCESSING PROGRAM, AND RECORDING MEDIUM CONTAINING THE PROGRAM |
| JP4869292B2 (en) * | 2008-06-20 | 2012-02-08 | ヤフー株式会社 | Server, method, and program for recommending search keywords |
| KR102053858B1 (en) * | 2018-02-27 | 2019-12-09 | 울산과학기술원 | Method for calculating rating of content |
| CN110795636A (en) * | 2019-11-05 | 2020-02-14 | 南京掌缘信息科技有限公司 | Marriage and love object matching method and device |
| KR102906274B1 (en) * | 2025-01-24 | 2025-12-31 | 생코에듀 주식회사 | Method and apparatus for providing learning information using an artificial intelligence learning model |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1115840A (en) * | 1997-06-23 | 1999-01-22 | N T T Data:Kk | Information presentation support method, information presentation support system, recording medium |
| JP2002108924A (en) * | 2000-09-29 | 2002-04-12 | Dainippon Printing Co Ltd | INFORMATION SELECTION DEVICE AND METHOD, AND INFORMATION PROVIDING DEVICE |
| JP4009940B2 (en) * | 2001-12-21 | 2007-11-21 | 日本電信電話株式会社 | Program selection support information providing service system, server device, terminal device, program selection support information providing method, program, and recording medium |
| JP4471737B2 (en) * | 2003-10-06 | 2010-06-02 | 日本電信電話株式会社 | Grouping condition determining device and method, keyword expansion device and method using the same, content search system, content information providing system and method, and program |
-
2003
- 2003-11-06 JP JP2003377206A patent/JP4307220B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2005141486A (en) | 2005-06-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20220261852A1 (en) | Method and apparatus for creating web content and identifying advertisements for users creating and viewing content | |
| RU2501078C2 (en) | Ranking search results using edit distance and document information | |
| CN108763519A (en) | The recommendation method, apparatus and readable storage medium storing program for executing of reading | |
| US10482142B2 (en) | Information processing device, information processing method, and program | |
| JP2022043273A (en) | Method, apparatus, device, storage medium, and computer program product for generating caption | |
| US20140229487A1 (en) | System and method for user preference augmentation through social network inner-circle knowledge discovery | |
| KR20230114440A (en) | Method, system, and computer program for personalized recommendation based on topic of interest | |
| CN113672758B (en) | Song list generation method, device, medium and computing equipment | |
| Sisodia et al. | Fast prediction of web user browsing behaviours using most interesting patterns | |
| KR101346927B1 (en) | Search device, search method, and computer-readable memory medium for recording search program | |
| CN112825089B (en) | Article recommendation method, device, equipment and storage medium | |
| WO2013168582A1 (en) | Information processing device, information processing method, and program | |
| CN116431904A (en) | User portrait construction method, device, equipment and storage medium | |
| CN110069713A (en) | A kind of personalized recommendation method based on user's context perception | |
| JP4307220B2 (en) | Content recommendation target user selection apparatus and method, program, and content recommendation system | |
| CN117556020A (en) | Intelligent question and answer method, device, equipment and storage medium based on large language model | |
| JP3645431B2 (en) | Information search support device and information search support program storage medium | |
| JP6696270B2 (en) | Information providing server device, program and information providing method | |
| KR20230066853A (en) | Method, system, and computer program to provide place-related recommendation based on taste | |
| CN120162468A (en) | Content processing method, device and electronic device | |
| CN120181931A (en) | A method, device, equipment and medium for generating exclusive posters | |
| CN113139102A (en) | Data processing method, data processing device, nonvolatile storage medium and processor | |
| CN118113933A (en) | Meta-universe data recommendation method and device | |
| JP6310529B1 (en) | SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM | |
| JP4749242B2 (en) | Similar character data search method, server, and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060405 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090206 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090213 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090331 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090428 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090428 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120515 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130515 Year of fee payment: 4 |
|
| LAPS | Cancellation because of no payment of annual fees |