Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4745993B2 - Consciousness system construction device and consciousness system construction program - Google Patents
[go: Go Back, main page]

JP4745993B2 - Consciousness system construction device and consciousness system construction program - Google Patents

Consciousness system construction device and consciousness system construction program Download PDF

Info

Publication number
JP4745993B2
JP4745993B2 JP2007048799A JP2007048799A JP4745993B2 JP 4745993 B2 JP4745993 B2 JP 4745993B2 JP 2007048799 A JP2007048799 A JP 2007048799A JP 2007048799 A JP2007048799 A JP 2007048799A JP 4745993 B2 JP4745993 B2 JP 4745993B2
Authority
JP
Japan
Prior art keywords
interest
ontology
user
approximation
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007048799A
Other languages
Japanese (ja)
Other versions
JP2008210335A (en
Inventor
真 中辻
誠 吉田
美貴 平野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007048799A priority Critical patent/JP4745993B2/en
Publication of JP2008210335A publication Critical patent/JP2008210335A/en
Application granted granted Critical
Publication of JP4745993B2 publication Critical patent/JP4745993B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は意識体系構築装置および意識体系構築プログラムに関し、特に、サービスプロバイダが販売するコンテンツの販売体系(棚割り)に対して、ユーザ嗜好マイニング結果をフィードバックすることで、ユーザ嗜好に沿いつつユーザに分かり易いコンテンツ体系を構築する方法に適用して好適なものである。
なお、棚割りとは、買い物客が見やすく、取りやすく、選びやすいように、用途や機能やデザインや価格帯などのテーマによって多種多様な商品を分類・整理し、互いに関連する商品を効果的に組み合わせて陳列位置を決めることを言う。
The present invention relates to Consciousness System construction equipment you and Consciousness System building program, in particular, the sales system of content for service providers to sell (shelf allocation), by feeding back the user preference mining results, while along the user preference The present invention is suitable for application to a method for constructing a user-friendly content system.
In addition, shelf allocation is a way to classify and organize a wide variety of products according to themes such as purpose, function, design, price range, etc., so that shoppers can easily see, pick and select them, and effectively related products. Saying to determine the display position in combination.

近年、ユーザの興味などのユーザコンテクストを用い、その場その時の状況に沿った適切なコンテンツをネットワークを介してユーザに提供するサービスが注目されている。
また、ユーザの興味対象をインターネット上で発信し、ユーザ間での議論を促進するブログサービスや、互いに友人として承認し合ったユーザ間で興味対象を議論するソーシャル・ネットワークサービスなどが注目されており、このようなサービスを利用するユーザの数や、このようなサービスを利用するサービスが今後ますます拡大すると考えられている。
2. Description of the Related Art In recent years, a service that uses a user context such as a user's interest and provides appropriate content to the user via a network has been attracting attention.
In addition, blog services that promote user discussions on the Internet and promote discussions between users, and social network services that discuss interests among users who have approved each other as friends are attracting attention. It is considered that the number of users who use such services and the services that use such services will increase in the future.

その他にも、AmazonやLast.fmなどユーザによる商品の購買や再生履歴に基づいてユーザの興味対象をユーザプロファイルとして自動構築し、そのユーザプロファイルに基づいて商品の推薦を行うサービスも登場し、ユーザの発信する多様な興味情報に基づく極め細やかな情報提供を行うサービスへの関心も高まっている。
そして、この種の情報流通サービスは、ユーザが自分自身の興味対象を発信し、興味の近いユーザの発信する記事や楽曲情報およびコミュニティにおける議論内容を閲覧することを通じて、各ユーザの興味対象を拡大する基盤となる可能性を持っている。
In addition, Amazon and Last. A service that automatically constructs a user's interest as a user profile based on the purchase and playback history of the product such as fm, and recommends the product based on the user profile has appeared, and various interest information sent by the user There is a growing interest in services that provide extremely detailed information.
And this kind of information distribution service expands the interests of each user by browsing the articles and music information sent by users who are close to interest and the discussion contents in the community. Have the potential to become a foundation.

また、非特許文献1には、ユーザの興味対象としてユーザが興味を持つキーワードだけでなく、そのキーワードの背景となる情報をも保持するユーザプロファイルを自動構築し、そのユーザプロファイルに基づいてブログ検索機能を提供する方法が開示されている。
すなわち、非特許文献1には、ユーザが蓄積した記事を音楽や映画などのサービスプロバイダが与えるサービスオントロジへ分類することで、その記事に対してその話題対象であるインスタンスとインスタンスの背景知識を自動的にタグ付けするオートタギング手法と、ユーザの興味がクラス階層化された興味オントロジをユーザプロファイルとして自動抽出する興味オントロジ生成手法が開示されている。
In Non-Patent Document 1, a user profile that holds not only a keyword that the user is interested in but also information that is the background of the keyword is automatically constructed, and a blog search is performed based on the user profile. A method for providing functionality is disclosed.
That is, in Non-Patent Document 1, by classifying articles accumulated by users into service ontology provided by service providers such as music and movies, the instance subject to the topic and background knowledge of the instances are automatically applied to the article. An auto-tagging method for automatically tagging and an interest ontology generation method for automatically extracting, as a user profile, an interest ontology in which a user's interest is class-hierarchized are disclosed.

そして、興味オントロジ間の近似度を計測し、近似度が高い興味オントロジ間で一部クラス階層が異なるクラスを検出し、そのクラスに属する記事を意外な興味記事としてユーザに推薦することで、ユーザの興味幅を拡大し、他のユーザ間とのコミュニケーションを促進するための検証実験を実際のブログサイト上で実施している。
この方法では、サービスプロバイダが作成する専門的なコンテンツの分類体系(タクソノミと言う)に基づいた網羅的かつ専門的な知識を利用したコンテンツの検索や推薦に有効である。
Then, the degree of approximation between the interest ontology is measured, a class whose class hierarchy is different between the interest ontology with a high degree of approximation is detected, and an article belonging to that class is recommended as an unexpected interesting article to the user. A verification experiment is being conducted on an actual blog site to expand the range of interest and promote communication with other users.
This method is effective for content search and recommendation using exhaustive and specialized knowledge based on a specialized content classification system (referred to as taxonomy) created by a service provider.

一方、ネットワーク上のコンテンツに対してユーザが与えるタグからコンテンツ間の関係を構築するフォークソノミがユーザドリブンなサービスオントロジの構築法として期待されている。フォークソノミは、ユーザの直観に基づいて膨大なコンテンツを体系化できる可能性を持つため、ユーザの意識に沿ったコンテンツの発見に役立つと期待されている。   On the other hand, a folk sonomi that builds a relationship between contents based on tags given by users to contents on a network is expected as a method for constructing a user-driven service ontology. Folk sonomis have the potential to organize a vast amount of content based on the user's intuition, and are expected to help find content that matches the user's consciousness.

なお、フォークソノミとは、写真や映像や文書などのコンテンツの投稿者が、インターネットのウェブサイト上で投稿されているコンテンツなどにタグを自由に追加したり分類したりして検索などのシステムに役立てることを言う。このフォークソノミでは、サイトの作者や管理者自身が閲覧者に関わらせることなくコンテンツの分類作業を行う従来の分類・検索手法と異なり、分類作業が万人に開かれ終わりのないオープンなもので共同作業によることが特徴である。また、タグ(tag)とは、「猫の写真」、「漁業」、「人工知能」などのコンテンツの内容や属性を一言で記述する索引語やキーワードやラベルのようなもので、コンテンツのタグを付けることをタグ付けと言う。
中辻真、三好優、大塚祥広:“ユーザ興味オントロジ抽出によるブログコミュニティ形成手法”,日本データベース学会 Letters,Vol.5,No.1(2006)
In addition, folk sonomi is a system for searching by content contributors such as photos, videos, documents, etc. by freely adding or classifying tags to content posted on Internet websites. Say to help. In this folksonomy, unlike the conventional classification / search method, in which the author or administrator of the site himself / herself classifies the content without involving the viewer, the classification work is open to all people and is an open one that never ends. It is characterized by collaboration. A tag is an index word, keyword, or label that describes the content and attributes of content such as “cat pictures”, “fishery”, and “artificial intelligence” in a single word. Tagging is called tagging.
Makoto Nakatsuji, Yu Miyoshi, Yoshihiro Otsuka: “A Blog Community Formation Method by Extracting User Interest Ontologies”, Database Society of Japan Letters, Vol. 5, no. 1 (2006)

しかしながら、現状のブログサービスにおける情報検索では、GoogleなどのWebページ検索エンジンやRDF Site Summary(RSS)という簡単なメタデータを記述を利用したキーワードベースの検索でしかないため、大量に発信されるブログ記事から自分自身の興味に沿った情報を掲載する記事を適切に選択するのが困難であるという問題があった。   However, the information search in the current blog service is only a keyword-based search using a description such as a Web page search engine such as Google or RDF Site Summary (RSS). There was a problem that it was difficult to properly select an article that posted information according to one's own interest from the article.

すなわち、ユーザはブログ検索を行うたびに、自分自身の興味に即した検索目的語を適切に構成する必要があり、検索キーワードの選択に手間がかかっていた。また、事前に検索対象をある程度把握してないと、キーワード自体を構成することができないため、興味を持つ可能性があるにもかかわらずキーワードを特定できない場合には、情報検索自体ができなくなっていた。   That is, each time a user performs a blog search, the user needs to appropriately configure a search object that matches his or her interests, and it takes time to select a search keyword. In addition, if the search target is not understood to some extent, the keyword itself cannot be configured. If the keyword cannot be specified even though it may be interested, the information search itself cannot be performed. It was.

また、非特許文献1に開示された方法では、サービスプロバイダが作成する専門的なコンテンツの分類体系が採用され、サービスプロバイダにとっては管理し易いが、その分類体系がユーザ自身のイメージする体系と異なっていることから、コンテンツへの直観的なアクセスができないという問題があった。また、このようなコンテンツの分類体系ではユーザからのアクセスの増大があまり見込めないため、コンテンツの売り上げの増大にあまり寄与しないという問題があった。   Further, in the method disclosed in Non-Patent Document 1, a specialized content classification system created by a service provider is adopted, which is easy for the service provider to manage, but the classification system is different from the system imaged by the user himself / herself. Therefore, there was a problem that intuitive access to the content was not possible. In addition, in such a content classification system, since an increase in access from users cannot be expected, there is a problem that it does not contribute much to an increase in sales of content.

また、従来のフォークソノミで得られるタグ間の関係は、同値・背反関係を構築する方法には有効であるが、クラス間の継承関係などの専門的な知識表現のためのオントロジを構築する方法には適してないという問題があった。また、ユーザがタギングしたコンテンツのみが対象とされ、ユーザが把握していないコンテンツについては考慮されないという問題があった。
そこで、本発明の目的は、網羅的かつ専門的な知識を利用したコンテンツ体系を維持しつつ、ユーザの意識が反映された直観的なコンテンツ体系を構築することが可能な意識体系構築装置および意識体系構築プログラムを提供することである。
In addition, the relationship between tags obtained with conventional folk sonomis is effective for constructing equivalence and contradiction relationships, but a method for constructing ontologies for expressing specialized knowledge such as inheritance relationships between classes. There was a problem that was not suitable. In addition, there is a problem that only content tagged by the user is targeted, and content that the user does not grasp is not considered.
It is an object of the present invention, while maintaining the content system that utilizes a comprehensive and specialized knowledge, your consciousness system construction equipment that is capable of building an intuitive content system of consciousness of the user is reflected And provide a system for building awareness systems.

上述した課題を解決するために、請求項1記載の意識体系構築装置によれば、個人の興味情報が概念階層化された興味オントロジ間の近似度を計測することにより、ユーザ間の興味の近似度を計測する近似度計測手段と、興味の近似度が所定の範囲内にあるユーザ間にリンクを張ることで、ユーザネットワークを生成するユーザネットワーク生成手段と、前記ユーザネットワークを分割することにより、前記ユーザの意識を階層化するネットワーク分割手段と、を備えた意識体系構築装置であって、前記ネットワーク分割手段は、ネットワーク分割手法として、集団間のリンクに対する集団内部のリンクの密度の濃さを表すモジュール性が大きくなる指標を示すスコアに基づき、分割するエッジを決定するようにしたNewman法を利用して前記ネットワークの分割を行うようになっており、且つ前記ネットワークの分割を行うにあたり最初に分割するエッジの組み合わせについては前記スコアに関係なくランダムに決定し、決定されたエッジの組み合わせに基づき前記ネットワークに対して1番目の分割を行い、当該1番目の分割により得られたクラスタ集合において、前記各クラスタに所属するユーザの数がある閾値以下の場合には、分割するエッジの組み合わせを異なる組み合わせに変更して再度前記1番目の分割を行って、前記各クラスタに所属するユーザの数が前記閾値以下である間、前記1番目の分割を繰り返し行い、前記1番目の分割により得られたクラスタ集合において、前記所属するユーザの数が前記閾値を超える前記クラスタについてはさらに2番目の分割を行い、且つ前記クラスタに所属するユーザの数が前記閾値以下となるまで前記クラスタに対して前記2番目の分割を繰り返し行うことを特徴とする。
また、請求項2記載の意識体系構築装置によれば、興味情報が概念階層化された雛形オントロジに含まれるクラスまたはインスタンスおよびそれらの上位のクラスを抽出することにより、前記興味オントロジを生成することを特徴とする。
In order to solve the above-described problem, according to the consciousness system construction device according to claim 1, an approximation of interest between users is obtained by measuring an approximation between interest ontologies in which personal interest information is conceptually hierarchized. By dividing the user network by the degree of approximation measuring means for measuring the degree, the user network generating means for generating a user network by establishing a link between the users whose degree of approximation of interest is within a predetermined range, a consciousness system construction apparatus and a network dividing means for layering awareness of the user, the network dividing means, as a network division method, dark density of population internal links to the link of the current Dhamma -out based on the score indicating an index modularity increases representing a is, by using the Newman method so as to determine the split edges It is adapted to perform a division of the network, for the combination of the first splitting edge randomly determined regardless the score Upon and performs the division of the network, to the network based on a combination of the determined edge performs first division for, in due Ri resulting cluster set to the division of the first said, said in the following cases a certain threshold number of users belonging to each cluster, different combinations a combination of split edges I line the first division again to change to, between the number of users belonging to each cluster is less than or equal to the threshold, repeated the first division, obtained Ri I said in the first division in was cluster set further second division for the cluster number of users exceeds the threshold value for the membership Performed, and the number of users belonging to the cluster and performs repeatedly the second division relative to the cluster until equal to or smaller than the threshold value.
According to the consciousness system construction device according to claim 2, the interest ontology is generated by extracting classes or instances included in the template ontology in which the interest information is conceptually hierarchized and classes higher than those classes. It is characterized by.

また、請求項3記載の意識体系構築装置によれば、前記雛形オントロジは前記興味情報として単語が概念階層化されてなり、前記興味オントロジは、前記単語が概念階層化された前記雛形オントロジから、前記個人の興味情報としての単語を含むクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を抽出して形成され、前記近似度計測手段は、前記雛形オントロジに含まれる単語を含むクラスが前記興味オントロジに含まれるかどうかの判定結果に基づいて、前記興味オントロジ間のトポロジの近似度を計測するとともに、前記雛形オントロジに含まれる単語を含むインスタンスが前記興味オントロジに含まれるかどうかの判定結果に基づいて、前記興味オントロジ間のクラスの近似度を計測し、前記トポロジの近似度と前記クラスの近似度に基づいて、前記興味オントロジ間の近似度を計測することを特徴とする。 Further, according to the consciousness system construction device according to claim 3, the template ontology is configured such that words are conceptually hierarchized as the interest information, and the interest ontology is obtained from the template ontology in which the words are conceptually hierarchized. It is formed by extracting a hierarchical structure that contains the class or instance and class of their upper contain words as interesting information of the individual, the degree of approximation measuring means, class containing words included in the model ontology is the based on whether the determination result included in the interest ontology, with measures the degree of approximation topology between the interest ontology, determination instance containing words included in the model ontology of whether contained in the interested ontology Based on the results, measure the closeness of the classes between the ontology of interest, Based on the similarity of the serial class, characterized by measuring the degree of approximation between the interest ontology.

また、請求項4記載の意識体系構築プログラムによれば、ブログエントリに対して形態素解析を適用することにより、前記ブログエントリに含まれる単語を抽出するステップと、興味情報として単語が概念階層化された雛形オントロジを選択するステップと、前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを前記雛形オントロジから抽出するステップと、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを興味オントロジとして前記雛形オントロジから抽出するステップと、前記興味オントロジ間の近似度を計測することにより、ユーザ間の興味の近似度を計測するステップと、前記興味の近似度が所定の範囲内にあるユーザ間にリンクを張ることで、ユーザネットワークを生成するステップと、ネットワーク分割手法として、集団間のリンクに対する集団内部のリンクの密度の濃さを表すモジュール性が大きくなる指標を示すスコアに基づき、分割するエッジを決定するようにしたNewman法を利用して前記ネットワークの分割を行うようになっており、且つ前記ネットワークの分割を行うにあたり最初に分割するエッジの組み合わせについては前記スコアに関係なくランダムに決定し、決定されたエッジの組み合わせに基づき前記ネットワークに対して1番目の分割を行い、当該1番目の分割により得られたクラスタ集合において、前記各クラスタに所属するユーザの数がある閾値以下の場合には、分割するエッジの組み合わせを異なる組み合わせに変更して再度前記1番目の分割を行って、前記各クラスタに所属するユーザの数が前記閾値以下である間、前記1番目の分割を繰り返し行い、前記1番目の分割により得られたクラスタ集合において、前記所属するユーザの数が前記閾値を超える前記クラスタについてはさらに2番目の分割を行い、且つ前記クラスタに所属するユーザの数が前記閾値以下となるまで前記クラスタに対して前記2番目の分割を繰り返し行うことにより、ユーザの意識を階層化するステップとをコンピュータに実行させることを特徴とする。 According to the consciousness system construction program according to claim 4, the morphological analysis is applied to the blog entry to extract the words included in the blog entry, and the words are conceptually hierarchized as the interest information. Selecting a template ontology, extracting a class or instance including a word extracted from the blog entry from the template ontology, and using the extracted class or instance and its higher class as an interest ontology. A step of extracting from a template ontology, a step of measuring the degree of interest between users by measuring the degree of approximation between the interest ontology, and a link between users whose degree of approximation of interest is within a predetermined range To create a user network , As the network division method, based-out to score an indication that modularity is increased which represents the density of the density of population internal links to the link of the current Dhamma, Newman method so as to determine the edges to divide the The network is divided using the network, and the first combination of edges to be divided in dividing the network is determined randomly regardless of the score, and based on the determined combination of edges. performs first division to the network, the I Ri resulting cluster set to the division of the first said, if less than the threshold value with the number of users belonging to each cluster, the combination of the edge to split the performing the first divided again changed to a different combination, belonging to each cluster yOU During the number of it is less than or equal to the threshold, repeated the first divided, said at first by Ri obtained cluster set the division, for the cluster number of users the membership exceeds the threshold further It performs second division, and by the number of users belonging to the cluster repeated the second division relative to the cluster until less than or equal to the threshold, the computer and the step of layering the awareness of the user It is made to perform.

以上説明したように、本発明によれば、雛形オントロジが保有するトポロジを継承させつつ、個人の興味が反映された興味オントロジを生成することが可能となるとともに、興味オントロジ間の近似度が反映されたユーザネットワークを分割することで、サービスプロバイダが作成する雛形オントロジとユーザの意識とをマッピングすることができ、網羅的かつ専門的な知識を利用したコンテンツ体系を維持しつつ、ユーザの意識が反映された直観的なコンテンツ体系を構築することができる。   As described above, according to the present invention, it is possible to generate an interest ontology that reflects an individual's interest while inheriting the topology possessed by the template ontology, and the degree of approximation between the interest ontologies is reflected. By dividing the created user network, it is possible to map the template ontology created by the service provider and the user's consciousness, while maintaining the content system using comprehensive and specialized knowledge, while maintaining the user's consciousness. A reflected intuitive content system can be constructed.

以下、本発明の実施形態に係る意識体系構築装置およびその方法について図面を参照しながら説明する。
図1は、本発明の一実施形態に係る意識体系構築装置が適用されるシステムの概略構成を示すブロック図である。
図1において、サービスプロバイダ1には、ユーザのコンテンツや商品などの購買履歴1bが保持されるとともに、その購買履歴1bに対応したユーザID1aが保持されている。また、ブログ事業者2には、日付入りの記事ページを中心としたブログ2bが保持されるとともに、ブログ2bに対応したユーザID2aが保持されている。なお、ブログ2bはブログエントリごとに保持することができる。ここで、ブログエントリはブログにおける記事の最小単位を表し、日にちごとに設けることができる。
Hereinafter, a consciousness system construction device and method according to an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a schematic configuration of a system to which a consciousness system construction device according to an embodiment of the present invention is applied.
In FIG. 1, the service provider 1 holds a purchase history 1b of user contents and products, and also holds a user ID 1a corresponding to the purchase history 1b. In addition, the blog company 2 holds a blog 2b centered on a dated article page and a user ID 2a corresponding to the blog 2b. The blog 2b can be held for each blog entry. Here, the blog entry represents the minimum unit of articles in the blog, and can be provided for each day.

また、サービスプロバイダ3には、ユーザが蓄積した記事をサービスオントロジへ分類することで、その記事に対してその話題対象であるインスタンスとインスタンスの背景知識がタグ付けされたコンテンツ体系3aが保持されている。
また、ユーザ嗜好抽出手段4には、購買履歴やブログマイニングにて得られた個人の嗜好に関する情報が格納された嗜好知識ベース4aが設けられている。
Further, the service provider 3 classifies the articles accumulated by the user into the service ontology, thereby holding a content system 3a in which the instance that is the subject of the article and the background knowledge of the instance are tagged. Yes.
In addition, the user preference extraction unit 4 is provided with a preference knowledge base 4a in which information related to individual preferences obtained through purchase history and blog mining is stored.

また、嗜好解析エンジン5には、個人の興味情報が概念階層化された興味オントロジ間の近似度を計測することにより、ユーザ間の興味の近似度を計測する近似度計測手段5a、興味の近似度が所定の範囲内にあるユーザ間にリンクを張ることで、ユーザネットワークを生成するネットワーク生成手段5b、ネットワーク生成手段5bにて生成されたユーザネットワークを分割することにより、ユーザの意識を階層化するネットワーク分割手段5cが設けられている。   The preference analysis engine 5 also includes an approximation degree measuring means 5a for measuring an approximation degree of interest between users by measuring an approximation degree between interest ontology in which personal interest information is conceptually hierarchized. By creating a link between users whose degrees are within a predetermined range, the network generation means 5b for generating the user network, and the user network generated by the network generation means 5b are divided to stratify the user's awareness. A network dividing means 5c is provided.

そして、サービスプロバイダ1、3、ブログ事業者2、ユーザ嗜好抽出手段4および嗜好解析エンジン5はインターネットなどのネットワークを介して接続することができる。
そして、嗜好解析エンジン5は、サービスオントロジに基づいてユーザの興味オントロジを構築し、その興味オントロジ間の近似度に基づいて生成されたユーザネットワークを分割することにより、ユーザの意識体系を構築し、その結果としてユーザの意識とサービスオントロジとの間のマッピングを得ることができる。
The service providers 1 and 3, the blog operator 2, the user preference extraction unit 4, and the preference analysis engine 5 can be connected via a network such as the Internet.
Then, the preference analysis engine 5 constructs the user's interest ontology based on the service ontology, constructs the user's consciousness system by dividing the user network generated based on the degree of approximation between the interest ontology, As a result, a mapping between user awareness and service ontology can be obtained.

図2は、本発明の一実施形態に係るユーザの意識とサービスオントロジとの間の関係を示す図である。
図2において、サービスプロバイダ3が音楽に関するサービスをユーザに提供するものとすると、音楽サービスデータベース11aには、コンテンツ体系3aとして音楽に関するサービスオントロジ12を保持することができる。
そして、嗜好解析エンジン5は、サービスオントロジ12aを雛形オントロジとして用いることで、ユーザ14の興味オントロジを構築する。そして、ユーザ14の興味オントロジ間の近似度に基づいてユーザネットワークを生成し、そのユーザネットワークを分割してユーザ14の意識を階層化することで、ユーザ14の意識体系13を構築し、その結果としてユーザ14の意識13a〜13cとサービスオントロジを構成するクラス12a〜12cとの間のマッピングを得ることができる。
FIG. 2 is a diagram illustrating a relationship between user awareness and service ontology according to an embodiment of the present invention.
In FIG. 2, if the service provider 3 provides a service related to music to the user, the music service database 11a can hold a service ontology 12 related to music as the content system 3a.
Then, the preference analysis engine 5 constructs an interest ontology of the user 14 by using the service ontology 12a as a template ontology. Then, a user network is generated based on the degree of approximation between the interest ontologies of the user 14, the user network is divided and the consciousness of the user 14 is hierarchized, and the consciousness system 13 of the user 14 is constructed. As described above, the mapping between the consciousness 13a to 13c of the user 14 and the classes 12a to 12c constituting the service ontology can be obtained.

なお、雛形オントロジとは、個人の興味情報が概念階層化された興味オントロジの雛形である。そして、雛形オントロジは、サービスプロバイダ3側で恣意的に作成することができる。例えば、サービスプロバイダ3が音楽に関するコンテンツ体系3aを保持している場合、音楽に関する雛形オントロジを構築することができる。ここで、ユーザの興味を細やかに表現するために、可能な限り細分化された網羅性の高い雛形オントロジを構築することが好ましい。また、雛形オントロジの実体は、オントロジ記述言語OWLなどのXML言語で記述されたテキストファイル等、クラス・インスタンスツリーをDB上で表現したものである。また、情報の整理の簡単化のため、インスタンスは最下位クラスにのみ分類してもよい。   The template ontology is a template of an interest ontology in which personal interest information is conceptually hierarchized. The template ontology can be arbitrarily created on the service provider 3 side. For example, when the service provider 3 holds a content system 3a related to music, a template ontology related to music can be constructed. Here, in order to express the user's interest in detail, it is preferable to construct a template ontology that is subdivided as much as possible and has high coverage. The entity of the template ontology is a representation of a class / instance tree on the DB, such as a text file described in an XML language such as the ontology description language OWL. In order to simplify the organization of information, instances may be classified only into the lowest class.

これにより、雛形オントロジが保有するトポロジを継承させつつ、個人の興味が反映された興味オントロジを生成することが可能となるとともに、興味オントロジ間の近似度が反映されたユーザネットワークを分割することで、サービスプロバイダ3が作成するサービスオントロジ12aとユーザ14の意識13a〜13cとをマッピングすることができ、網羅的かつ専門的な知識を利用したコンテンツ体系3aを維持しつつ、ユーザ14の意識が反映された直観的なコンテンツ体系3aを構築することができる。   This makes it possible to generate an interest ontology that reflects individual interests while inheriting the topology held by the template ontology, and to divide the user network that reflects the degree of approximation between interest ontologies. The service ontology 12a created by the service provider 3 and the consciousness 13a to 13c of the user 14 can be mapped, and the consciousness of the user 14 is reflected while maintaining the content system 3a using comprehensive and specialized knowledge. It is possible to construct an intuitive content system 3a.

以下、図1の嗜好解析エンジン5の動作についてより詳細に説明する。
図1の嗜好解析エンジン5は、ユーザ嗜好抽出手段4にて抽出された嗜好知識ベース4aと、サービスプロバイダ3が持つコンテンツ体系3aが入力されると、コンテンツ体系3aを構成するサービスオントロジに基づいて記事に対するオートタギングを実施することで、ユーザの興味オントロジを生成することができる。
ここで、嗜好解析エンジン5は、雛形オントロジとしてのサービスオントロジに含まれるクラスまたはインスタンスおよびそれらの上位のクラスを抽出することで、個人の興味情報が概念階層化された興味オントロジを生成することができる。
Hereinafter, the operation of the preference analysis engine 5 in FIG. 1 will be described in more detail.
When the preference knowledge base 4a extracted by the user preference extraction unit 4 and the content system 3a possessed by the service provider 3 are input, the preference analysis engine 5 in FIG. 1 is based on the service ontology constituting the content system 3a. By performing auto-tagging on the article, it is possible to generate a user's interest ontology.
Here, the preference analysis engine 5 may generate an interest ontology in which individual interest information is conceptually hierarchized by extracting classes or instances included in the service ontology as a template ontology and higher classes thereof. it can.

すなわち、嗜好解析エンジン5は、嗜好知識ベース4aとして入力されたブログエントリに対して形態素解析をそれぞれ適用することで、同一ユーザの持つ複数のブログエントリで頻出する形態素を抽出する。そして、ブログエントリで頻出する各形態素を雛形オントロジに適用し、雛形オントロジ内のクラスまたはインスタンスに一致する文字列があるかどうかを調べる。そして、雛形オントロジ内のクラスまたはインスタンスに一致する文字列がある場合、雛形オントロジのルートクラスから、そのクラスまたはインスタンスまでの直接的な子孫クラスおよびインスタンスを興味オントロジとして抽出することができる。   In other words, the preference analysis engine 5 extracts morphemes that frequently appear in a plurality of blog entries of the same user by applying morphological analysis to each blog entry input as the preference knowledge base 4a. Then, each morpheme that frequently appears in the blog entry is applied to the template ontology to check whether there is a character string that matches the class or instance in the template ontology. If there is a character string that matches the class or instance in the template ontology, the direct descendant classes and instances up to that class or instance can be extracted as the interest ontology from the root class of the template ontology.

そして、近似度計測手段5aは、ユーザ14の興味オントロジが生成されると、その興味オントロジ間の近似度を計測することにより、ユーザ14間の興味の近似度を計測する。
ここで、近似度計測手段5aは、ユーザ14の興味オントロジのトポロジを形成するクラス集合間の共起度に基づいて、興味オントロジ間のトポロジの近似度を計測することができる。例えば、近似度計測手段5aは、興味オントロジのクラス集合間の積集合のメンバ数を、雛形オントロジ6のクラス集合のメンバ数で割った値に基づいて、興味オントロジ間のトポロジの近似度を計測することができる。
Then, when the interest ontology of the user 14 is generated, the approximation degree measuring unit 5a measures the degree of interest between the users 14 by measuring the degree of approximation between the interest ontology.
Here, the degree-of-approximation measuring means 5a can measure the degree of approximation of the topology between the interest ontologies based on the co-occurrence degree between the class sets forming the topology of the interest ontology of the user 14. For example, the degree-of-approximation measuring means 5a measures the degree of approximation of the topology between the interest ontology based on the value obtained by dividing the number of members of the intersection set between the classes of interest ontology by the number of members of the class set of the template ontology 6. can do.

また、近似度計測手段5aは、ユーザ14の興味オントロジに含まれるインスタンス集合間の共起度に基づいて、興味オントロジ間のクラスの近似度を計測することができる。例えば、近似度計測手段5aは、興味オントロジのインスタンス集合間の積集合のメンバ数を、雛形オントロジのインスタンス集合のメンバ数で割った値に基づいて、興味オントロジ間のクラスの近似度を計測することができる。そして、近似度計測手段5aは、興味オントロジ間のトポロジの近似度および興味オントロジ間のクラスの近似度を総合的に判断することにより、興味オントロジ間の近似度を計測することができる。   Further, the degree-of-approximation measuring means 5a can measure the degree of approximation of classes between interest ontologies based on the degree of co-occurrence between instance sets included in the user 14's interest ontology. For example, the degree-of-approximation measuring means 5a measures the degree of approximation of the class between the interest ontology based on the value obtained by dividing the number of members of the product set between the instance sets of interest ontology by the number of members of the instance set of template ontology. be able to. Then, the degree-of-approximation measuring means 5a can measure the degree of approximation between the interest ontology by comprehensively determining the degree of approximation of the topology between the interest ontology and the degree of approximation of the class between the interest ontology.

図3は、本発明の一実施形態に係る興味オントロジ間の近似度計測方法を示す図である。なお、以下の説明では、あるオントロジに対する別のオントロジとの間の近似度を計測する場合、前者をソースオントロジ、後者をターゲットオントロジと呼ぶ。
図3において、雛形オントロジOHの“a1”というクラスの直下には、“b1”、“b2”および“b3”というクラスが存在し、“b1”というクラスの直下には、“c1”および“c2”というクラスが存在し、“c1”というクラスの直下には、“d1”および“d2”というクラスが存在しているものとする。また、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在し、“b3”というクラスの直下には、“c5”というクラスが存在しているものとする。
FIG. 3 is a diagram showing a method of measuring the degree of approximation between interest ontology according to an embodiment of the present invention. In the following description, when the degree of approximation between an ontology and another ontology is measured, the former is called a source ontology and the latter is called a target ontology.
In FIG. 3, classes “b1”, “b2”, and “b3” exist immediately below the class “a1” of the template ontology OH, and “c1” and “c1” immediately below the class “b1”. It is assumed that a class called “c2” exists and classes “d1” and “d2” exist immediately below the class called “c1”. Also, it is assumed that classes “c3” and “c4” exist immediately below the class “b2”, and a class “c5” exists immediately below the class “b3”.

また、“d1”というクラスには、“j”および“k”というインスタンスが存在し、“d2”というクラスには、“l”というインスタンスが存在し、“c2”というクラスには、“m”というインスタンスが存在し、“b2”というクラスには、“n”というインスタンスが存在し、“c3”というクラスには、“a”、“e”、“c”、“f”、“b”、“d”および“g”というインスタンスが存在し、“c4”というクラスには、“p”、“g”、“j”および“h”というインスタンスが存在しているものとする。   The class “d1” includes instances “j” and “k”, the class “d2” includes the instance “l”, and the class “c2” includes “m”. "B", the class "b2" has an instance "n", and the class "c3" has "a", "e", "c", "f", "b" ”,“ D ”, and“ g ”exist, and the class“ c4 ”includes instances“ p ”,“ g ”,“ j ”, and“ h ”.

そして、各ユーザのブログエントリに頻出する単語をそれぞれ抽出し、その単語を含むクラスまたはインスタンスおよびそれらの上位の全てのクラスを雛形オントロジOHからそれぞれ抽出することにより、興味オントロジOA、OBが作成されたものとする。
ここで、興味オントロジOAの“a1というクラスの直下には、“b1”および“b2”というクラスが存在し、“b1”というクラスの直下には、“c1”および“c2”というクラスが存在し、“c1”というクラスの直下には、“d1”というクラスが存在し、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在しているものとする。また、“d1”というクラスには、“j”および“k”というインスタンスが存在し、“c2”というクラスには、“m”というインスタンスが存在し、“c3”というクラスには、“a”、“c”、“b”および“d”というインスタンスが存在し、“c4”というクラスには、“q”および“h”というインスタンスが存在しているものとする。
Then, by extracting words frequently appearing in each user's blog entry, and extracting the classes or instances containing the words and all the classes above them from the template ontology OH, interest ontologies OA and OB are created. Shall be.
Here, there are “b1” and “b2” classes immediately below the “a1” class of the interest ontology OA, and “c1” and “c2” classes immediately below the “b1” class. It is assumed that a class “d1” exists immediately below the class “c1”, and a class “c3” and “c4” exist immediately below the class “b2”. , The class “d1” includes instances “j” and “k”, the class “c2” includes the instance “m”, and the class “c3” includes “a”. , “C”, “b”, and “d” exist, and the class “c4” includes instances “q” and “h”.

また、興味オントロジOBの“a1”というクラスの直下には、“b1”、“b2”および“b3”というクラスが存在し、“b1”というクラスの直下には、“c1”というクラスが存在し、“c1”というクラスの直下には、“d1”というクラスが存在し、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在しているものとする。また、“d2”というクラスには、“l”というインスタンスが存在し、“b2”というクラスには、“n”というインスタンスが存在し、“c3”というクラスには、“a”、“c”、“e”および“f”というインスタンスが存在し、“c4”というクラスには、“p”および“j”というインスタンスが存在しているものとする。   In addition, classes “b1”, “b2”, and “b3” exist immediately below the class “a1” of the interest ontology OB, and a class “c1” exists immediately below the class “b1”. Assume that a class “d1” exists immediately below the class “c1”, and a class “c3” and “c4” exist immediately below the class “b2”. The class “d2” has an instance “l”, the class “b2” has an instance “n”, and the class “c3” has “a” and “c”. ”,“ E ”, and“ f ”exist, and“ c4 ”class includes“ p ”and“ j ”.

そして、雛形オントロジOHおよび興味オントロジOA、OB間で末端クラスを除く共通クラスを分析し、共通クラスを親クラスとした親子クラスからなるトポロジを抽出する。なお、図3の例では、末端クラスは、“d1”、“d2”、“c3”および“c4”とする。この結果、雛形オントロジOHおよび興味オントロジOA、OB間において、クラス“a1”を親クラスとした子クラス集合G1、クラス“b1”を親クラスとした子クラス集合G2、クラス“c1”を親クラスとした子クラス集合G3、クラス“b2”を親クラスとした子クラス集合G4、クラス“b3”を親クラスとした子クラス集合G5を抽出することができる。   Then, the common class excluding the terminal class is analyzed between the template ontology OH and the interest ontology OA and OB, and the topology composed of the parent and child classes with the common class as the parent class is extracted. In the example of FIG. 3, the end classes are “d1”, “d2”, “c3”, and “c4”. As a result, a child class set G1 having the class “a1” as the parent class, a child class set G2 having the class “b1” as the parent class, and the class “c1” being the parent class between the template ontology OH and the interest ontologies OA and OB. Child class set G3, child class set G4 having class “b2” as a parent class, and child class set G5 having class “b3” as a parent class can be extracted.

なお、この共通クラスの分析は、同じクラスIDが雛形オントロジOHおよび興味オントロジOA、OB間に存在するかということだけを確認すればよい。このため、クラスの名前属性やインスタンス集合プロパティなどの近似度を計測する必要がなくなり、クラス間の対応関係を正確に維持しつつ、計算量を減らすことができる。
次に、興味オントロジOA、OB間で各トポロジを形成する子クラス集合X、Y間の近似度を深さ優先で計算する。ここで、雛形オントロジOHを構成するクラスの子クラスの集合をZとすると、子クラス集合X、Y間の近似度は、|X∩Y|/|Z|にて求めることができる。そして、各トポロジの子クラス集合間の近似度を足し合わせることにより、興味オントロジOA、OB間でのトポロジの近似度Sを計測することができる。
The analysis of the common class only needs to confirm whether the same class ID exists between the template ontology OH and the interest ontologies OA and OB. For this reason, it is not necessary to measure the degree of approximation of class name attributes, instance set properties, etc., and the amount of calculation can be reduced while maintaining the correspondence between classes accurately.
Next, the degree of approximation between the child class sets X and Y forming each topology between the interest ontology OA and OB is calculated with depth priority. Here, if the set of child classes of the classes constituting the template ontology OH is Z, the degree of approximation between the child class sets X and Y can be obtained by | X∩Y | / | Z |. By adding the approximation degree between the child class set for each topology, it is possible to measure the degree of approximation S T interested ontology OA, between OB topology.

例えば、子クラス集合G1において、雛形オントロジOHには“b1”、“b2”および“b3”という子クラスが含まれているので、子クラス集合G1における雛形オントロジOHの子クラス集合のメンバ数は3となる。また、子クラス集合G1において、興味オントロジOAには“b1”および“b2”という子クラスが含まれ、興味オントロジOBには“b1”、“b2”および“b3”という子クラスが含まれているので、興味オントロジOA、OBに共通に含まれている子クラスは“b1”およびb2”だけとなり、子クラス集合G1における興味オントロジOA、OBの子クラス集合の積集合のメンバ数は2となる。この結果、興味オントロジOA、OBの子クラス集合G1間における近似度は2/3となる。   For example, in the child class set G1, since the template ontology OH includes child classes “b1”, “b2”, and “b3”, the number of members of the child class set of the template ontology OH in the child class set G1 is 3 In the child class set G1, the interest ontology OA includes child classes “b1” and “b2”, and the interest ontology OB includes child classes “b1”, “b2”, and “b3”. Therefore, the child classes that are commonly included in the interest ontologies OA and OB are only “b1” and b2 ”, and the number of members of the product set of the child class sets of the interest ontologies OA and OB in the child class set G1 is 2. As a result, the degree of approximation between the child class sets G1 of the interest ontologies OA and OB is 2/3.

同様に、興味オントロジOA、OBの子クラス集合G2間における近似度は1/2、子クラス集合G3間における近似度は0/2、子クラス集合G4間における近似度は2/2となる。この結果、興味オントロジOA、OB間でのトポロジの近似度Sは2/3+1/2+0/2+2/2となる。
なお、興味オントロジOA、OB間でのトポロジの近似度の計算でも、雛形オントロジOHから割り振られたクラスIDを参照し、雛形オントロジOHの接続形態に沿ったものが興味オントロジOA、OB間に存在するかということだけを確認すればよい。例えば、興味オントロジOA、OBにおけるa1−b1−c1という接続形態は雛形オントロジOHの接続形態と同じであるかどうかは、“a1”、“b1”および“c1”というクラスが興味オントロジOA、OBにて保持されているかどうかということを確認するだけで判断することができる。
Similarly, the degree of approximation between child class sets G2 of interest ontology OA and OB is 1/2, the degree of approximation between child class sets G3 is 0/2, and the degree of approximation between child class sets G4 is 2/2. As a result, interest ontology OA, similarity S T topology between OB becomes 2/3 + 1/2 + 0/2 + 2/2.
In the calculation of the approximate degree of topology between the interest ontologies OA and OB, the class ID assigned from the template ontology OH is referred to, and the one along the connection form of the template ontology OH exists between the interest ontologies OA and OB. You only have to confirm whether you want to do it. For example, whether or not the connection form a1-b1-c1 in the interest ontology OA, OB is the same as the connection form of the template ontology OH depends on whether the classes “a1”, “b1”, and “c1” are in the interest ontology OA, OB. It can be determined simply by confirming whether or not it is held at.

このため、興味オントロジOA、OB間のトポロジの一致度を確認するために、興味オントロジOA、OBが持つクラスIDを調べるだけでよく、対応クラスを起点として、上下クラスにさらに対応クラスがあるかを調べる必要がなくなり、興味オントロジOA、OB間でのトポロジの近似度の計算量を減らすことができる。
次に、興味オントロジOA、OBの共通クラス間の近似度を計算する。ここで、興味オントロジOA、OBの共通クラス間の近似度を計算する場合、クラスに所属するインスタンス集合を用いることができる。すなわち、あるクラスC1において、ソースオントロジのインスタンス集合をx、ターゲットオントロジのインスタンス集合をy、雛形オントロジOHのインスタンス集合をzとすると、興味オントロジOA、OBの共通クラス間の近似度は、|x∩y|/|z|にて求めることができる。そして、共通クラス間の近似度を足し合わせることにより、興味オントロジOA、OBのクラス間の近似度Sを計測することができる。
For this reason, in order to check the degree of coincidence of the topology between the interest ontologies OA and OB, it is only necessary to check the class ID of the interest ontologies OA and OB. Therefore, it is possible to reduce the calculation amount of the degree of approximation of the topology between the interest ontologies OA and OB.
Next, the degree of approximation between the common classes of interest ontology OA and OB is calculated. Here, when calculating the degree of approximation between the common classes of the interest ontologies OA and OB, an instance set belonging to the class can be used. That is, in a certain class C1, assuming that the instance set of the source ontology is x, the instance set of the target ontology is y, and the instance set of the template ontology OH is z, the degree of approximation between the common classes of the interest ontology OA and OB is | x ∩y | / | z |. By adding the degree of approximation between the common class, it is possible to measure the degree of approximation S C between interest ontology OA, the OB classes.

例えば、興味オントロジOA、OB間の共通クラス“b2”において、興味オントロジOAの共通クラス“b2”におけるインスタンス集合G6には、インスタンス“n”が存在し、興味オントロジOBの共通クラス“b2”におけるインスタンス集合G6には、インスタンス“n”が存在し、雛形オントロジOHの共通クラス“b2”にはインスタンス“n”が存在している。この結果、雛形オントロジOHの共通クラス“b2”のインスタンスのメンバ数は1、興味オントロジOA、OBのインスタンス集合G6の積集合のメンバ数は1となり、“b2”という共通クラス間の近似度は1/1となる。   For example, in the common class “b2” between the interest ontologies OA and OB, the instance set G6 in the common class “b2” of the interest ontology OA includes the instance “n”, and the common class “b2” of the interest ontology OB An instance “n” exists in the instance set G6, and an instance “n” exists in the common class “b2” of the template ontology OH. As a result, the number of members of the common class “b2” of the template ontology OH is 1, the number of members of the product set of the instance set G6 of the interest ontologies OA and OB is 1, and the degree of approximation between the common classes “b2” is 1/1.

また、興味オントロジOA、OB間の共通クラス“c2”において、興味オントロジOAの共通クラス“c2”におけるインスタンス集合G7には、インスタンス“a”、“c”、“b”および“d”が存在し、興味オントロジOBの共通クラス“c3”におけるインスタンス集合G7には、インスタンス“a”、“c”、“e”および“f”が存在し、雛形オントロジOHの共通クラス“c3”にはインスタンス“a”、“e”、“c”、“f”、“b”、“d”および“g”が存在している。   Further, in the common class “c2” between the interest ontology OA and OB, the instance set G7 in the common class “c2” of the interest ontology OA includes instances “a”, “c”, “b”, and “d”. In the instance set G7 in the common class “c3” of the interest ontology OB, instances “a”, “c”, “e”, and “f” exist, and in the common class “c3” of the template ontology OH “A”, “e”, “c”, “f”, “b”, “d”, and “g” exist.

この結果、雛形オントロジOHの共通クラス“c3”のインスタンスのメンバ数は7、興味オントロジOA、OBのインスタンス集合G7の積集合のメンバ数は2となり、“c3”という共通クラス間の近似度は2/7となる。
従って、興味オントロジOA、OBのクラス間の近似度Sは1/1+2/7となる。
なお、興味オントロジOA、OBの共通クラス間の近似度の計算でも、雛形オントロジOHから割り振られたインスタンスIDが興味オントロジOA、OB間に存在するかということだけを確認すればよい。このため、興味オントロジOA、OBのクラス間の近似度を計算するために、インスタンスの名前の一致性などによるインスタンスの対応関係を予め確認する必要がなくなり、計算量を減らすことができる。
As a result, the number of members of the common class “c3” of the template ontology OH is 7, the number of members of the product set of the instance set G7 of the interest ontologies OA and OB is 2, and the degree of approximation between the common classes “c3” is 2/7.
Therefore, the degree of approximation S C between interest ontology OA, the OB class is 1/1 + 2/7.
In the calculation of the degree of approximation between the common classes of the interest ontology OA and OB, it is only necessary to confirm whether or not the instance ID allocated from the template ontology OH exists between the interest ontology OA and OB. For this reason, in order to calculate the degree of approximation between the classes of interest ontology OA and OB, it is not necessary to confirm in advance the correspondence between instances based on the consistency of the names of instances, and the amount of calculation can be reduced.

そして、興味オントロジOA、OBにおけるトポロジの近似度Sおよびクラス間の近似度Sが求まると、トポロジとクラスに対する重要度に応じた評価関数f(X)を用いることにより、以下の(1)式にて興味オントロジOA、OB間の近似度S(AB)を与えることができる。
(AB)=S+f(S) ・・・(1)
これにより、雛形オントロジOHの持つクラス特性を継承させつつ興味オントロジOA、OBを構築することが可能となるとともに、インスタンス集合間の共起度を興味オントロジOA、OB間の近似度の計測に直接用いることができ、計算量を抑制しつつ、個人の嗜好に適合した興味オントロジOA、OBを適正に抽出することが可能となるとともに、興味オントロジOA、OBが雛形オントロジOHの持つドメインの知識を保有しているかの相対的な尺度として利用することができ、そのドメインに対する知識を多く持つユーザを有効的に絞り込むことができる。
The interest ontology OA, the similarity S C between the degree of approximation S T and class topology in OB is determined, by using an evaluation function f (X) corresponding to the importance for the topology and class, the following (1 ), The degree of approximation S O (AB) between the ontology OA and OB of interest can be given.
S O (AB) = S T + f (S C ) (1)
This makes it possible to construct the interest ontology OA and OB while inheriting the class characteristics of the template ontology OH, and directly measure the degree of co-occurrence between instance sets in the degree of approximation between the interest ontology OA and OB. It is possible to appropriately extract interest ontologies OA and OB adapted to individual preferences while suppressing the amount of calculation, and at the same time, the knowledge ontologies OA and OB have knowledge of the domain of the template ontology OH. It can be used as a relative measure of possession, and users who have a lot of knowledge about the domain can be effectively narrowed down.

また、興味オントロジOA、OBにおけるトポロジの近似度Sを計測する場合、雛形オントロジのクラス集合のメンバ数を基準として、興味オントロジOA、OB間のトポロジの近似度を計測することにより、興味オントロジOA、OBのクラス集合のメンバ数が増大した場合においても、興味オントロジOA、OB間のトポロジの近似度が小さくなることを防止することができ、クラスが豊富にあるという意味で知識量の多い興味オントロジOA、OBとの近似度を大きくすることができる。 Also, when measuring the degree of approximation S T topology interest ontology OA, the OB, based on the number of members of the class set stationery ontology interest ontology OA, by measuring the degree of approximation topology between OB, interest ontology Even when the number of members of the class set of OA and OB increases, it is possible to prevent the degree of approximation of the topology between the interest ontology OA and OB from being reduced, and there is a large amount of knowledge in the sense that there are abundant classes. The degree of approximation with the interest ontology OA, OB can be increased.

図4は本発明の一実施形態に係る興味オントロジ間の近似度計測方法の優位性を示す図である。
図4において、オントロジOCでは、図3のオントロジOBの“b3”というクラスがないものとする。この場合、オントロジOBでは、“b1”、“b2”および“b3”という子クラスが子クラス集合G1に含まれ、オントロジOCでは、“b1”および“b2”という子クラスが子クラス集合G1に含まれるにもかかわらず、興味オントロジOA、OCの子クラス集合G1間における近似度は、興味オントロジOA、OBの子クラス集合G1間における近似度と同様に2/3となる。
FIG. 4 is a diagram illustrating the superiority of the method for measuring the degree of approximation between interest ontology according to an embodiment of the present invention.
In FIG. 4, in ontology OC, it is assumed that there is no class “b3” in ontology OB in FIG. In this case, in ontology OB, child classes “b1”, “b2”, and “b3” are included in child class set G1, and in ontology OC, child classes “b1” and “b2” are included in child class set G1. Although it is included, the degree of approximation between the child class sets G1 of the interest ontologies OA and OC is 2/3, similar to the degree of approximation between the child class sets G1 of the interest ontologies OA and OB.

この結果、オントロジOCでは、図3のオントロジOBの“b3”というクラスがないにもかかわらず、興味オントロジOA、OC間の近似度が興味オントロジOA、OB間の近似度よりも大きくなることを防止することができ、クラスが豊富にあるという意味で知識量の多い興味オントロジとの近似度が相対的に小さくなることを防止することができる。   As a result, in the ontology OC, although there is no class “b3” of the ontology OB in FIG. 3, the degree of approximation between the interested ontology OA and OC is larger than the degree of approximation between the interested ontology OA and OB. The degree of approximation with an interest ontology having a large amount of knowledge can be prevented from becoming relatively small in the sense that there are abundant classes.

次に、図1において、近似度計測手段5aにてユーザ14の興味オントロジ間の近似度が計測されると、ネットワーク生成手段5bは、興味の近似度が所定の範囲内にあるユーザ14間にリンクを張ることで、ユーザネットワークを生成する。
すなわち、ネットワーク生成手段5bは、興味オントロジ間の近似度が近いユーザ集合が共有するインスタンス集合は、ユーザ集合の意識を反映しているとみなし、そのようなインスタンス集合を抽出する。そのため、(1)式を適用することで、ユーザiから見たユーザjの近似度S(ij)を求め、X>S(ij)>Yという条件を満たす場合、ユーザi、j間の興味が近いとして、ユーザi、j間で関係を構築する。そして、図5に示すように、ユーザi、jをノードに対応させ、興味が近いユーザi、j間にリンクを張ることで、ユーザネットワークを生成する。
Next, in FIG. 1, when the degree of approximation between the interest ontologies of the users 14 is measured by the degree-of-approximation measuring means 5 a, the network generation means 5 b reads between the users 14 whose interest degrees of interest are within a predetermined range. Create a user network by creating a link.
That is, the network generation unit 5b considers that the instance set shared by the user sets having similar approximations between the interest ontologies reflects the consciousness of the user set, and extracts such instance sets. Therefore, by applying equation (1), the degree of approximation S (ij) of the user j viewed from the user i is obtained, and when the condition X> S (ij)> Y is satisfied, the interest between the users i and j As a result, a relationship is established between users i and j. Then, as shown in FIG. 5, a user network is generated by associating the users i and j with the nodes and establishing a link between the users i and j with close interest.

ここで、S(ij)が非常に大きなユーザは、興味の幅が広過ぎるユーザである。このため、興味が近いユーザi、j間にリンクを張る場合、X>S(ij)という条件を設定することで、興味の幅が広過ぎるユーザを除去することができ、ネットワーク分割が阻害されるのを防止することができる。
なお、ユーザi、j間で関係を構築する場合、ユーザiから見て上位Z(Zは正の整数)人のユーザ間にのみリンクを張るようにしてもよい。
次に、図1において、ネットワーク生成手段5bにてユーザネットワークが生成されると、ネットワーク分割手段5cは、ネットワーク生成手段5bにて生成されたユーザネットワークを分割することにより、ユーザの意識を階層化する。
Here, a user with a very large S (ij) is a user who has a wide range of interest. For this reason, when a link is established between users i and j with close interest, by setting the condition X> S (ij), it is possible to remove users who have a wide range of interests and inhibit network division. Can be prevented.
Note that, when a relationship is established between the users i and j, a link may be established only between users of the top Z (Z is a positive integer) viewed from the user i.
Next, in FIG. 1, when the user network is generated by the network generation unit 5b, the network dividing unit 5c divides the user network generated by the network generation unit 5b, thereby layering the user's consciousness. To do.

図6は、本発明の一実施形態に係るユーザネットワークを分割化する方法を示す図である。
図6において、図1のネットワーク生成手段5bにてユーザA〜Jについてのユーザネットワークが生成されたものとすると、ネットワーク分割手段5cは、そのユーザネットワークを分割することにより、ユーザA〜Jの意識が階層化されたユーザ集合Q1〜Q3を生成する。
ここで、ユーザネットワークを分割する方法として、“Newman,M.E.J.:Fast algorithm for detecting community structure in networks(2003)”に記載されているように、集団間のリンクに対する集団内部のリンクの密度の濃さに基づいて評価することができる。そして、この度合いをモジュール性Qという値で定義している。
FIG. 6 is a diagram illustrating a method for dividing a user network according to an embodiment of the present invention.
In FIG. 6, assuming that the user networks for the users A to J are generated by the network generation unit 5 b of FIG. 1, the network dividing unit 5 c divides the user network so that the consciousness of the users A to J is obtained. Generates user sets Q1 to Q3 which are hierarchized.
Here, as a method of dividing the user network, as described in “Newman, MEJ: Fast algorithm for detecting community structure in networks (2003)”, a link inside a group with respect to a link between groups. It can be evaluated based on the density of the density. This degree is defined by a value called modularity Q.

ここで、上記の文献に記載されている手法で分割された後に生成されるユーザ集合に所属するユーザの数のばらつきが大きかったり、各ユーザ集合に所属するユーザの数が少な過ぎる場合、適正なユーザ集合の階層を得ることができない。すなわち、上記の文献に記載されている手法では、最初に分割するエッジを決める時に、結合後にモジュール性Qが大きくなる指標を示すスコアΔQが同じ値のエッジの組み合わせが複数ある場合、エッジの組み合わせがランダムに決められる。このため、上記の文献に記載されている手法で分割された後に生成されるユーザ集合に所属するユーザの数のばらつきが大きくなり、ジャンル体系が深すぎる部分と浅すぎる部分とに分かれることになることから、ユーザ集合の階層が扱い難くなる。 Here, if the variation in the number of users belonging to the user set generated after being divided by the method described in the above literature is large or the number of users belonging to each user set is too small, The user set hierarchy cannot be obtained. That is, in the method described in the above document, when determining the edge to be divided first, if there are a plurality of combinations of edges having the same value of the score ΔQ indicating the index that increases the modularity Q after the combination, the combination of edges Is decided at random. For this reason, the variation of the number of users belonging to the user set generated after being divided by the method described in the above literature becomes large, and the genre system is divided into a part that is too deep and a part that is too shallow. This makes it difficult to handle the hierarchy of user sets.

そこで、ネットワーク分割手段5は、最初に分割するエッジの組み合わせはランダムに決定する。そして、それにより最終的に最初に分割されるクラスタ(集合)において、2番目以降に分割されるクラスタに所属するユーザの数がある閾値θを越える場合にのみ分割を許可し、2番目以降に分割されるクラスタに所属するユーザの数が閾値θ以下の場合に最初に分割するエッジの組み合わせを変更することができる。 Therefore, the network dividing unit 5c randomly determines a combination of edges to be divided first. Then, in the cluster (set) that is finally divided first, the division is permitted only when the number of users belonging to the second and later divided clusters exceeds a certain threshold θ, and the second and later When the number of users belonging to the cluster to be divided is equal to or smaller than the threshold θ, the combination of edges to be divided first can be changed.

そして、1番目に分割されたクラスタは、そこに所属するユーザの数が非常に大きい場合が多く、細やかなユーザ集合とならないと考えられるため、閾値θ以下になるまで分割を繰り返すことができる。そして、このように分割されたクラスタを一意識に沿ったアーチスト集合とすることができる。これにより、分割されたクラスタに所属するユーザの数のばらつきを抑え、階層化された意識の粒度を均等化することができる。   The first divided cluster often has a very large number of users belonging to the cluster, and is considered not to be a fine user set. Therefore, the division can be repeated until the cluster is below the threshold θ. And the cluster divided | segmented in this way can be made into the artist set along one consciousness. Thereby, variation in the number of users belonging to the divided clusters can be suppressed, and the granularity of the hierarchical awareness can be equalized.

なお、分割を複数回繰り返しても、閾値θを超えるクラスタが生成されない場合、パラメータX、Zを小さくすることで、ユーザネットワーク内のリンクの数を抑え、分割可能なようにユーザネットワークを整えることができる。
そして、ネットワーク生成手段5bは、ユーザの数が閾値θを超える分割されたクラスタを、閾値θを変更して再分割し、ユーザ14の意識13a〜13cの階層化を図ることができる。
そして、嗜好解析エンジン5は、階層化されたユーザ14の意識13a〜13cをユーザ嗜好マイニング結果としてサービスプロバイダ3が保持するコンテンツ体系3aにフィードバックすることができる。
If a cluster exceeding the threshold θ is not generated even if the division is repeated a plurality of times, the number of links in the user network is reduced by reducing the parameters X and Z, and the user network is arranged so that the division is possible. Can do.
Then, the network generation unit 5b can re-divide the divided cluster in which the number of users exceeds the threshold θ by changing the threshold θ, and can hierarchize the consciousness 13a to 13c of the user 14.
The preference analysis engine 5 can feed back the hierarchical consciousness 13a to 13c of the user 14 to the content system 3a held by the service provider 3 as a user preference mining result.

これにより、ユーザ14の嗜好に沿ったユーザ14にとって分かり易いコンテンツ体系3aを再構築することが可能となるとともに、サービスプロバイダ3が望む網羅的かつ専門的なコンテンツ体系3aとの間のマッピングを得ることができる。このため、ユーザ14は、直観的にコンテンツを発見することができ、自分の興味に沿った商品を効率よく発見することが可能となる。また、サービスプロバイダ3は、自分が管理しやすいコンテンツ体系3aを維持したまま商品を管理することができ、ユーザ14の興味の動向をマーケティングし易くなるとともに、コンテンツ体系3aへのユーザ14からのアクセスを促進させることを可能として、商品の販売を促進することが可能となる。   As a result, it is possible to reconstruct the content system 3a that is easy to understand for the user 14 according to the preference of the user 14, and obtain a mapping between the comprehensive and specialized content system 3a desired by the service provider 3. be able to. For this reason, the user 14 can discover content intuitively, and can efficiently discover a product in line with his / her interest. In addition, the service provider 3 can manage the product while maintaining the content system 3a that is easy to manage, making it easier to market the trend of interest of the user 14, and accessing the content system 3a from the user 14 It is possible to promote the sales of the product.

図7は、本発明の一実施形態に係る興味オントロジの近似性を利用したコミュニティ形成方法を示す図である。
図7において、各ユーザA、BのブログエントリPA、PBを雛形オントロジに対してそれぞれ分類することにより、各ユーザA、Bの興味オントロジKA、KBがそれぞれ生成されたものとする(ステップS1)。そして、各ユーザA、Bの興味オントロジKA、KB間の近似度を計測し(ステップS2)、近似度の高い興味オントロジKA、KB間で共起するクラスやインスタンスを分析することで、トポロジが異なるにも関わらず興味を持つ可能性が高い情報を他のユーザのエントリを介して意外な情報としてユーザに推奨することができる(ステップS3)。
FIG. 7 is a diagram illustrating a community formation method using the approximation of interest ontology according to an embodiment of the present invention.
In FIG. 7, it is assumed that the blog entries PA and PB of the users A and B are classified with respect to the template ontology, thereby generating the interest ontologies KA and KB of the users A and B, respectively (step S1). . Then, the degree of approximation between the interest ontologies KA and KB of the users A and B is measured (step S2), and the topologies are analyzed by analyzing classes and instances that co-occur between the interest ontologies KA and KB having a high degree of approximation. Although it is different, information that is highly likely to be interesting can be recommended to the user as unexpected information through the other user's entry (step S3).

例えば、各ユーザA、Bの興味オントロジKA、KB間の近似度を計測することにより、“Madchester”などのクラスや“Happy Mondays”などのインスタンスに興味を持つユーザは、“Glasgow”というクラスや“Teenage Fanclub”というインスタンスにも興味を持つ可能性が高いことが判る。
また、このような興味オントロジKA、KBをブログに適用することで、単純なキーワード検索ではなく、興味オントロジKA、KB間の近似度に基づく意外なエントリ推薦によるコミュニティの形成を支援することができ、ユーザの興味を自然に広げることができる(ステップS4)。
For example, by measuring the degree of approximation between the interest ontologies KA and KB of each user A and B, a user who is interested in a class such as “Madchester” or an instance such as “Happy Mondays” can have a class “Glasgow” It can be seen that there is a high possibility of being interested in an instance of “Teenage Fanclub”.
Moreover, by applying such interest ontologies KA and KB to a blog, it is possible to support the formation of a community based on an unexpected entry recommendation based on the degree of approximation between the interest ontologies KA and KB rather than a simple keyword search. The user's interest can be naturally expanded (step S4).

なお、近似度計測手段5a、ネットワーク生成手段5bおよびネットワーク分割手段5cは、これらの手段で行われる処理を遂行させる命令が記述されたプログラムをコンピュータに実行させることにより実現することができる。
そして、このプログラムをCD−ROMなどの記憶媒体に記憶しておけば、嗜好解析エンジン5のコンピュータに記憶媒体を装着し、そのプログラムをコンピュータにインストールすることにより、近似度計測手段5a、ネットワーク生成手段5bおよびネットワーク分割手段5cで行われる処理を実現することができる。また、このプログラムをネットワークを介してダウンロードすることにより、このプログラムを容易に普及させることができる。
The approximation degree measuring unit 5a, the network generating unit 5b, and the network dividing unit 5c can be realized by causing a computer to execute a program in which an instruction for performing processing performed by these units is described.
Then, if this program is stored in a storage medium such as a CD-ROM, the degree-of-approximation measuring means 5a, network generation is performed by installing the storage medium in the computer of the preference analysis engine 5 and installing the program in the computer. The processing performed by the means 5b and the network dividing means 5c can be realized. Moreover, this program can be easily spread by downloading this program via a network.

また、近似度計測手段5a、ネットワーク生成手段5bおよびネットワーク分割手段5cで行われる処理を遂行させる命令が記述されたプログラムをコンピュータに実行させる場合、スタンドアロン型コンピュータで実行させるようにしてもよく、ネットワークに接続された複数のコンピュータに分散処理させるようにしてもよい。   Further, when a computer executes a program in which an instruction for executing the processing performed by the approximation degree measuring unit 5a, the network generating unit 5b, and the network dividing unit 5c is executed, it may be executed by a stand-alone computer. A plurality of computers connected to the computer may be distributed.

本発明は、網羅的かつ専門的な知識を利用したコンテンツ体系を維持しつつ、ユーザの意識が反映された直観的なコンテンツ体系を構築することができ、サービスプロバイダによる商品管理の効率性を損なうことなく、サービスプロバイダが保持するコンテンツ体系へのユーザからのアクセスを促進することができ、商品の販売を増大させることができる。   The present invention can construct an intuitive content system that reflects the user's consciousness while maintaining a content system that uses comprehensive and specialized knowledge, and impairs the efficiency of product management by a service provider. Therefore, it is possible to promote the user's access to the content system held by the service provider, and increase the sales of the product.

本発明の一実施形態に係る意識体系構築装置が適用されるシステムの概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the system with which the consciousness system construction | assembly apparatus which concerns on one Embodiment of this invention is applied. 本発明の一実施形態に係るユーザの意識とサービスオントロジとの間の関係を示す図である。It is a figure which shows the relationship between a user's consciousness and service ontology concerning one Embodiment of this invention. 本発明の一実施形態に係る興味オントロジ間の近似度計測方法を示す図である。It is a figure which shows the approximation degree measuring method between the interest ontology concerning one Embodiment of this invention. 本発明の一実施形態に係る興味オントロジ間の近似度計測方法の優位性を示す図である。It is a figure which shows the predominance of the approximation degree measuring method between interest ontology concerning one Embodiment of this invention. 本発明の一実施形態に係るユーザ間の興味関係をネットワーク化する方法を示す図である。It is a figure which shows the method of networking the interest relationship between the users based on one Embodiment of this invention. 本発明の一実施形態に係るユーザネットワークを分割化する方法を示す図である。FIG. 3 is a diagram illustrating a method for dividing a user network according to an exemplary embodiment of the present invention. 本発明の一実施形態に係る興味オントロジの近似性を利用したコミュニティ形成方法を示す図である。It is a figure which shows the community formation method using the approximation of the interest ontology which concerns on one Embodiment of this invention.

符号の説明Explanation of symbols

1、3 サービスプロバイダ
1a、2a ユーザID
1b 購買履歴
2 ブログ事業者
2b ブログ
3a コンテンツ体系
4 ユーザ嗜好抽出手段
4a 嗜好知識ベース
5 嗜好解析エンジン
5a 近似度計測手段
5b ネットワーク生成手段
5c ネットワーク分割手段
1, 3 Service provider 1a, 2a User ID
1b purchase history 2 blog operator 2b blog 3a content system 4 user preference extraction means 4a preference knowledge base 5 preference analysis engine 5a approximation measure means 5b network generation means 5c network division means

Claims (4)

個人の興味情報が概念階層化された興味オントロジ間の近似度を計測することにより、ユーザ間の興味の近似度を計測する近似度計測手段と、
興味の近似度が所定の範囲内にあるユーザ間にリンクを張ることで、ユーザネットワークを生成するユーザネットワーク生成手段と、
前記ユーザネットワークを分割することにより、前記ユーザの意識を階層化するネットワーク分割手段と、を備えた意識体系構築装置であって、
前記ネットワーク分割手段は、ネットワーク分割手法として、集団間のリンクに対する集団内部のリンクの密度の濃さを表すモジュール性が大きくなる指標を示すスコアに基づき、分割するエッジを決定するようにしたNewman法を利用して前記ネットワークの分割を行うようになっており、且つ前記ネットワークの分割を行うにあたり最初に分割するエッジの組み合わせについては前記スコアに関係なくランダムに決定し、決定されたエッジの組み合わせに基づき前記ネットワークに対して1番目の分割を行い、当該1番目の分割により得られたクラスタ集合において、前記各クラスタに所属するユーザの数がある閾値以下の場合には、分割するエッジの組み合わせを異なる組み合わせに変更して再度前記1番目の分割を行って、前記各クラスタに所属するユーザの数が前記閾値以下である間、前記1番目の分割を繰り返し行い、
前記1番目の分割により得られたクラスタ集合において、前記所属するユーザの数が前記閾値を超える前記クラスタについてはさらに2番目の分割を行い、且つ前記クラスタに所属するユーザの数が前記閾値以下となるまで前記クラスタに対して前記2番目の分割を繰り返し行うことを特徴とする意識体系構築装置。
Approximation degree measuring means for measuring an approximation degree of interest between users by measuring an approximation degree between interest ontology in which personal interest information is conceptually hierarchized;
User network generation means for generating a user network by establishing a link between users whose interests are in a predetermined range; and
A network division unit that divides the user's consciousness by dividing the user network, and a consciousness system construction device comprising:
The network splitting means and the network division method, based-out to score an indication that modularity is increased which represents the density of the density of population internal links to the link of the current Dhamma, to determine the dividing edges The newman method is used to divide the network, and the combination of edges to be divided first in dividing the network is determined randomly regardless of the score. performs first division to the network based on a combination of edges, in the resulting cluster aggregate that in the first division, if: there is a number of user thresholds belonging to each cluster, wherein the combination of the divided edges again changed to a different combination I 1 th row split, the During the number of users is less than or equal to the threshold value belonging to the cluster, it repeated the first divided,
Wherein the first by Ri obtained cluster set the division, the number of affiliated user performs a further second division for the clusters that exceed the threshold, number the threshold value of the user and belonging to the cluster A consciousness system construction device, characterized in that the second division is repeatedly performed on the cluster until:
興味情報が概念階層化された雛形オントロジに含まれるクラスまたはインスタンスおよびそれらの上位のクラスを抽出することにより、前記興味オントロジを生成することを特徴とする請求項1記載の意識体系構築装置。   The consciousness system construction device according to claim 1, wherein the interest ontology is generated by extracting classes or instances included in the template ontology in which the interest information is conceptually hierarchized and higher classes thereof. 前記雛形オントロジは前記興味情報として単語が概念階層化されてなり、前記興味オントロジは、前記単語が概念階層化された前記雛形オントロジから、前記個人の興味情報としての単語を含むクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を抽出して形成され、
前記近似度計測手段は、前記雛形オントロジに含まれる単語を含むクラスが前記興味オントロジに含まれるかどうかの判定結果に基づいて、前記興味オントロジ間のトポロジの近似度を計測するとともに、前記雛形オントロジに含まれる単語を含むインスタンスが前記興味オントロジに含まれるかどうかの判定結果に基づいて、前記興味オントロジ間のクラスの近似度を計測し、前記トポロジの近似度と前記クラスの近似度に基づいて、前記興味オントロジ間の近似度を計測することを特徴とする請求項記載の意識体系構築装置。
The template ontology is formed by conceptually hierarchizing words as the interest information, and the interest ontology includes classes or instances including words as the personal interest information from the template ontology in which the words are hierarchized conceptually, and those It is formed by extracting a hierarchical structure that includes classes above
The degree-of-approximation measuring means measures the degree of topology approximation between the interest ontologies based on a determination result of whether or not a class including a word included in the template ontology is included in the interest ontology, and Based on the determination result of whether or not an instance including the word included in the interest ontology is included in the interest ontology, the degree of approximation of the class between the interest ontologies is measured, and based on the degree of approximation of the topology and the degree of approximation of the class The consciousness system construction device according to claim 2 , wherein the degree of approximation between the interest ontology is measured.
ブログエントリに対して形態素解析を適用することにより、前記ブログエントリに含まれる単語を抽出するステップと、
興味情報として単語が概念階層化された雛形オントロジを選択するステップと、
前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを前記雛形オントロジから抽出するステップと、
前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを興味オントロジとして前記雛形オントロジから抽出するステップと、
前記興味オントロジ間の近似度を計測することにより、ユーザ間の興味の近似度を計測するステップと、
前記興味の近似度が所定の範囲内にあるユーザ間にリンクを張ることで、ユーザネットワークを生成するステップと、
ネットワーク分割手法として、集団間のリンクに対する集団内部のリンクの密度の濃さを表すモジュール性が大きくなる指標を示すスコアに基づき、分割するエッジを決定するようにしたNewman法を利用して前記ネットワークの分割を行うようになっており、且つ前記ネットワークの分割を行うにあたり最初に分割するエッジの組み合わせについては前記スコアに関係なくランダムに決定し、決定されたエッジの組み合わせに基づき前記ネットワークに対して1番目の分割を行い、当該1番目の分割により得られたクラスタ集合において、前記各クラスタに所属するユーザの数がある閾値以下の場合には、分割するエッジの組み合わせを異なる組み合わせに変更して再度前記1番目の分割を行って、前記各クラスタに所属するユーザの数が前記閾値以下である間、前記1番目の分割を繰り返し行い、
前記1番目の分割により得られたクラスタ集合において、前記所属するユーザの数が前記閾値を超える前記クラスタについてはさらに2番目の分割を行い、且つ前記クラスタに所属するユーザの数が前記閾値以下となるまで前記クラスタに対して前記2番目の分割を繰り返し行うことにより、ユーザの意識を階層化するステップとをコンピュータに実行させることを特徴とする意識体系構築プログラム。
Extracting words contained in the blog entry by applying morphological analysis to the blog entry;
Selecting a template ontology in which words are hierarchized as interest information;
Extracting from the template ontology a class or instance containing words extracted from the blog entry;
Extracting the extracted classes or instances and their superior classes as interest ontology from the template ontology;
Measuring the degree of interest between users by measuring the degree of approximation between the interest ontology; and
Creating a user network by creating a link between users whose approximation of interest is within a predetermined range; and
As the network division method,-out based on the score indicating an index modularity increases which represents the density of the density of population internal links to the link of the current Dhamma, use Newman method which is adapted to determine the split edges Then, the network is divided, and the combination of edges to be divided first in dividing the network is determined randomly regardless of the score, and based on the determined combination of edges, performs first division to the network, the I Ri resulting cluster set to the division of the first said, said in the following cases a certain threshold number of users belonging to each cluster, the combination of split edges different said combination again to change by performing a first division of users belonging to each cluster While BUSY is below the threshold, it repeated the first divided,
Wherein the first by Ri obtained cluster set the division, the number of affiliated user performs a further second division for the clusters that exceed the threshold, number the threshold value of the user and belonging to the cluster A consciousness system construction program characterized by causing a computer to execute a step of hierarchizing user consciousness by repeatedly performing the second division on the cluster until:
JP2007048799A 2007-02-28 2007-02-28 Consciousness system construction device and consciousness system construction program Active JP4745993B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007048799A JP4745993B2 (en) 2007-02-28 2007-02-28 Consciousness system construction device and consciousness system construction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007048799A JP4745993B2 (en) 2007-02-28 2007-02-28 Consciousness system construction device and consciousness system construction program

Publications (2)

Publication Number Publication Date
JP2008210335A JP2008210335A (en) 2008-09-11
JP4745993B2 true JP4745993B2 (en) 2011-08-10

Family

ID=39786550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007048799A Active JP4745993B2 (en) 2007-02-28 2007-02-28 Consciousness system construction device and consciousness system construction program

Country Status (1)

Country Link
JP (1) JP4745993B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5320307B2 (en) * 2010-01-06 2013-10-23 日本電信電話株式会社 Interest information recommendation device, interest information recommendation method, and interest information recommendation program
US20130282727A1 (en) * 2011-01-12 2013-10-24 Nec Corporation Unexpectedness determination system, unexpectedness determination method and program
US9836517B2 (en) * 2013-10-07 2017-12-05 Facebook, Inc. Systems and methods for mapping and routing based on clustering

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143517A (en) * 1996-11-13 1998-05-29 Fuji Xerox Co Ltd Document generation device
JP2001014349A (en) * 1999-06-28 2001-01-19 Nippon Telegr & Teleph Corp <Ntt> Rating system for collaborative information filtering
JP3880534B2 (en) * 2003-04-02 2007-02-14 輝一 金沢 Document classification method and document classification program

Also Published As

Publication number Publication date
JP2008210335A (en) 2008-09-11

Similar Documents

Publication Publication Date Title
JP5154975B2 (en) Interest system graph forming apparatus, interest system graph forming method, and interest system graph forming program
Amato et al. Multimedia summarization using social media content
Shafiq et al. On personalizing Web search using social network analysis
Shao et al. Personalized travel recommendation based on sentiment-aware multimodal topic model
Amato et al. Multimedia social network modeling: a proposal
CN104866557B (en) A kind of personalized instant learning theoretical based on constructive learning supports System and method for
US20140101557A1 (en) Valence graph tool for custom network maps
JP5320307B2 (en) Interest information recommendation device, interest information recommendation method, and interest information recommendation program
Lalithsena et al. Automatic domain identification for linked open data
Ibba et al. Hashtag of Instagram: From Folksonomy to Complex Network.
Magnani et al. Conversation retrieval for microblogging sites
Yager et al. Looking for like-minded individuals in social networks using tagging and e fuzzy sets
Zarrinkalam et al. User interest prediction over future unobserved topics on social networks
WO2024123876A1 (en) Analyzing social media data to identify markers of coordinated movements, using stance detection, and using clustering techniques
US20160188595A1 (en) Semantic Network Establishing System and Establishing Method Thereof
Sun et al. How we collaborate: characterizing, modeling and predicting scientific collaborations
JP4745993B2 (en) Consciousness system construction device and consciousness system construction program
Eda et al. The effectiveness of latent semantic analysis for building up a bottom-up taxonomy from folksonomy tags
Desolda Enhancing workspace composition by exploiting linked open data as a polymorphic data source
Kavitha et al. Tourism recommendation using social media profiles
Liu et al. Macro-scale mobile app market analysis using customized hierarchical categorization
Held et al. Exploring publication networks with a local cohesion-maximizing algorithm
KR20140135100A (en) Method for providing program using semantic mashup technology
Bianchini et al. The role of developers’ social relationships in improving service selection
JP5439261B2 (en) Clustering apparatus, clustering method, and clustering program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081224

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090501

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090501

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110510

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110512

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4745993

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350