JP6895167B2 - Utility value estimator and program - Google Patents
Utility value estimator and program Download PDFInfo
- Publication number
- JP6895167B2 JP6895167B2 JP2017129141A JP2017129141A JP6895167B2 JP 6895167 B2 JP6895167 B2 JP 6895167B2 JP 2017129141 A JP2017129141 A JP 2017129141A JP 2017129141 A JP2017129141 A JP 2017129141A JP 6895167 B2 JP6895167 B2 JP 6895167B2
- Authority
- JP
- Japan
- Prior art keywords
- issue
- utility value
- user
- utterance text
- issues
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、効用値推定装置及びプログラムに係り、特に、発話テキスト(例えば、投稿テキスト)についてユーザにとっての効用値を推定するための効用値推定装置及びプログラムに関する。 The present invention relates to a utility value estimated instrumentation置及beauty program, spoken text (e.g., post text) about the utility value estimated instrumentation置及beauty program for estimating the utility value for the user for.
従来技術として、非特許文献1では、以下の手順で投稿意見から効用情報の抽出を行っている。 As a prior art, in Non-Patent Document 1, utility information is extracted from submitted opinions by the following procedure.
まず、名詞と名詞句(名詞が連続する句)を論点ととらえ、形態素解析エンジンのMeCabを用いて、論点を抽出する。次に、抽出した論点をクラスタリングするために、word2vecに Wikipedia(R)の日本語コーパスから単語ベクトルを学習させ、論点に対する単語ベクトルを得て、k-meansを用いてクラスタリングを実施し、論点集合を抽出する。ユーザごとの論点集合に対する重要度を算出する。論点集合に対する重要度の抽出手法は、論点の共起ネットワークを作成し、ページランクアルゴリズムにより各論点の重要度を算出する。その後、論点集合に属する論点の重要度の合計を計算し、算出した効用値は 0.0〜1.0に正規化する。 First, a noun and a noun phrase (a phrase in which nouns are continuous) are regarded as issues, and the issues are extracted using MeCab, a morphological analysis engine. Next, in order to cluster the extracted issues, let word2vec learn the word vector from the Japanese corpus of Wikipedia (R), obtain the word vector for the issue, perform clustering using k-means, and set the issues. Is extracted. Calculate the importance to the issue set for each user. The method of extracting the importance to the issue set creates a co-occurrence network of the issues and calculates the importance of each issue by the PageRank algorithm. After that, the total importance of the issues belonging to the issue set is calculated, and the calculated utility value is normalized to 0.0 to 1.0.
しかし、上記非特許文献1に記載の技術では、論点集合の抽出とユーザの効用値推定に対して以下の問題点がある。 However, the technique described in Non-Patent Document 1 has the following problems with respect to the extraction of the issue set and the estimation of the utility value of the user.
第一に、論点集合を自動抽出する際に、論点を単語ベクトルで表現し、k-meansクラスタリングを用いているため、得られた論点集合は、類似したベクトルを持つ論点の集合となる。そのため、同じ話題を指す単語でも、異なる論点群に分類されてしまう可能性が高い。 First, when the issue set is automatically extracted, the issue is expressed by a word vector and k-means clustering is used. Therefore, the obtained issue set is a set of issues having similar vectors. Therefore, even words that refer to the same topic are likely to be classified into different issues.
第二に、ユーザの効用値を投稿意見から推定する際に、ユーザの感情を考慮していない。そのため、ユーザにとって否定的である内容を持つ意見が高い効用値になってしまうことがある。 Second, the user's emotions are not taken into consideration when estimating the user's utility value from the posted opinion. Therefore, an opinion having a content that is negative to the user may have a high utility value.
本発明では、上記問題点を解決するために成されたものであり、ユーザにとっての効用値を精度良く推定することができる効用値推定装置及びプログラムを提供することを目的とする。 The present invention has been made to solve the above problems, and an object of the present invention is to provide a utility value estimation device and a program capable of accurately estimating a utility value for a user.
また、ユーザにとっての効用値を精度良く推定するための論点集合の重要度を算出することができる論点集合重要度算出装置及びプログラムを提供することを目的とする。 Another object of the present invention is to provide an issue set importance calculation device and a program capable of calculating the importance of an issue set for accurately estimating a utility value for a user.
上記目的を達成するために、本発明の効用値推定装置は、評価対象の発話テキストについて、対象ユーザにとっての選好度合いを示す効用値を推定する効用値推定装置であって、評価対象の発話テキストから、予め定められた条件を満たす名詞を、論点として抽出する論点抽出部と、前記論点抽出部によって抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、前記分類された論点集合毎に定められた、前記対象ユーザにとっての前記論点集合の重要度とに基づいて、前記評価対象の発話テキストについての前記対象ユーザの効用値を推定する効用値推定部と、を含んで構成されている。 In order to achieve the above object, the utility value estimation device of the present invention is a utility value estimation device that estimates the utility value indicating the degree of preference for the target user with respect to the utterance text to be evaluated, and is the utterance text to be evaluated. From the above, whether the issue extraction unit that extracts a nomenclature satisfying a predetermined condition as an issue or the issue extracted by the issue extraction unit belongs to the issue set classified according to the latent topic model is described above. A utility value estimation unit that estimates the utility value of the target user for the spoken text to be evaluated based on the importance of the issue set to the target user, which is determined for each classified issue set. Is configured to include.
本発明の論点集合重要度算出装置は、複数のユーザによる複数の発話テキストから、予め定められた条件を満たす名詞を、論点として複数抽出する論点抽出部と、前記論点抽出部によって抽出された複数の論点に基づいて、潜在トピックモデルに応じた複数の論点集合に分類する論点集合分類部と、前記ユーザの各々について、前記ユーザによる発話テキストから抽出された論点の各々が、前記分類された論点集合の何れに属するかに基づいて、前記分類された論点集合毎に、前記ユーザにとっての前記論点集合の重要度を算出する重要度算出部と、を含んで構成されている。 The issue set importance calculation device of the present invention includes an issue extraction unit that extracts a plurality of nomenclature satisfying predetermined conditions from a plurality of utterance texts by a plurality of users as issues, and a plurality of issues extracted by the issue extraction unit. Based on the issues of, the issue set classification unit that classifies into a plurality of issue sets according to the latent topic model, and for each of the users, each of the issues extracted from the utterance text by the user is the classified issue. For each of the classified issue sets based on which of the sets it belongs to, an importance calculation unit for calculating the importance of the issue set to the user is included.
また、本発明のプログラムは、コンピュータを、上記の効用値推定装置、又は論点集合重要度算出装置を構成する各部として機能させるためのプログラムである。 Further, the program of the present invention is a program for making a computer function as each part constituting the above-mentioned utility value estimation device or issue set importance calculation device.
以上説明したように、本発明の効用値推定装置、及びプログラムによれば、評価対象の発話テキストから抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、前記分類された論点集合毎に定められた、前記対象ユーザにとっての前記論点集合の重要度とに基づいて、前記評価対象の発話テキストについての前記対象ユーザの効用値を推定することにより、ユーザにとっての効用値を精度良く推定することができる。 As described above, according to the utility value estimation device and the program of the present invention, which of the issue sets classified according to the latent topic model belongs to the issues extracted from the utterance text to be evaluated, as described above. By estimating the utility value of the target user for the utterance text to be evaluated based on the importance of the issue set to the target user, which is determined for each classified issue set, the user can use it. The utility value can be estimated accurately.
また、本発明の論点集合重要度算出装置、及びプログラムによれば、複数のユーザによる複数の発話テキストから抽出された複数の論点に基づいて、潜在トピックモデルに応じた複数の論点集合に分類し、前記ユーザの各々について、前記ユーザによる発話テキストから抽出された論点の各々が、前記分類された論点集合の何れに属するかに基づいて、前記分類された論点集合毎に、前記ユーザにとっての前記論点集合の重要度を算出することにより、ユーザにとっての効用値を精度良く推定するための論点集合の重要度を算出することができる。 Further, according to the issue set importance calculation device and the program of the present invention, it is classified into a plurality of issue sets according to the latent topic model based on a plurality of issues extracted from a plurality of utterance texts by a plurality of users. For each of the users, for each of the classified issue sets, for each of the classified issue sets, for the user, based on which of the classified issue sets each of the issues extracted from the utterance text by the user belongs. By calculating the importance of the issue set, it is possible to calculate the importance of the issue set for accurately estimating the utility value for the user.
以下、図面を参照して本発明の実施形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[第1の実施の形態]
<第1の実施形態に係る効用値推定装置の構成>
次に、第1の実施形態に係る効用値推定装置の構成について説明する。図1に示すように、本実施形態に係る効用値推定装置100は、CPUと、RAMと、後述する論点集合重要度算出処理ルーチン及び効用値推定処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この効用値推定装置100は、機能的には図1に示すように、入力部10、演算部20、及び出力部50を含んで構成されている。
[First Embodiment]
<Structure of utility value estimation device according to the first embodiment>
Next, the configuration of the utility value estimation device according to the first embodiment will be described. As shown in FIG. 1, the utility
入力部10は、複数のユーザの各々についての意見を表す複数の発話テキスト(例えば、投稿テキスト)を受け付け、後述する意見データベース22に格納する。
The
また、入力部10は、効用値の算出対象となる意見を表す発話テキストを受け付ける。
Further, the
演算部20は、意見データベース22と、論点抽出部24と、論点集合分類部26と、トピックモデル記憶部28と、分類結果記憶部30と、重要度算出部32と、効用値パラメータ記憶部34と、論点抽出部36と、論点分類部38と、効用値算出部40とを含んで構成される。
The
意見データベース22は、複数のユーザの各々についての意見を表す複数の発話テキストを記憶している。
The
論点抽出部24は、意見データベース22に記憶されている複数のユーザによる複数の発話テキストから、予め定められた条件を満たす名詞を、論点として複数抽出する。
The issue point extraction unit 24 extracts a plurality of nouns satisfying predetermined conditions as issues from a plurality of utterance texts stored in the
具体的には、発話テキストを形態素解析により、予め定められた条件を満たす名詞を論点として抽出する。形態素解析とは、テキストを単語(形態素)ごとに区切り品詞を特定する自然言語処理の技術の1つである。例えば、MeCab(非特許文献2)を用いて実現すればよい。本実施の形態では、以下の条件(1)〜(4)を満たす名詞を論点として抽出する。 Specifically, the utterance text is extracted by morphological analysis as a noun that satisfies a predetermined condition. Morphological analysis is one of the techniques of natural language processing in which text is separated for each word (morpheme) and part of speech is specified. For example, it may be realized by using MeCab (Non-Patent Document 2). In the present embodiment, nouns satisfying the following conditions (1) to (4) are extracted as issues.
(1)数詞は抽出しない。
(2)平仮名のみの名詞は抽出しない。
(3)接頭詞は名詞として扱う。
(4)1文字のみの名詞は抽出しない。
(1) Numerals are not extracted.
(2) Nouns with only hiragana are not extracted.
(3) Prefixes are treated as nouns.
(4) Nouns with only one letter are not extracted.
上記の処理をユーザごとに行い、各ユーザの論点としてまとめる。 The above process is performed for each user and summarized as an issue for each user.
[非特許文献2] 工藤拓, 山本薫, 松本裕治. “Conditional Random Fields を用いた日本語形態素解析.” 情報処理学会研究報告自然言語処理(NL), 2004. [Non-Patent Document 2] Taku Kudo, Kaoru Yamamoto, Yuji Matsumoto. “Japanese Morphological Analysis Using Conditional Random Fields.” Research Report of the Information Processing Society Natural Language Processing (NL), 2004.
論点集合分類部26は、論点抽出部36によって抽出された複数の論点と、トピックモデル記憶部28に記憶されているトピックモデルと、に基づいて、潜在トピックモデルに応じた複数の論点集合を、論点の分類として生成し、分類結果記憶部30に格納する。
The issue set
具体的には、抽出した複数の論点をトピックモデルにより各トピックに分類し、各トピックについて当該トピックに分類された論点からなる論点集合を抽出する。トピックモデルとは、複数の文書から、文書中の単語のトピックを統計的に推定するモデルである。文書中の単語は独立して出現するものではなく、潜在的にトピックを持ち、同じトピックは同じ文書中に出現しやすいという仮定のもと提案されている。トピックモデルの手法としては、例えば、LDA(Latent Dirichlet Allocation)(非特許文献3)を用いればよい。 Specifically, a plurality of extracted issues are classified into each topic by a topic model, and a set of issues consisting of the issues classified into the topic is extracted for each topic. The topic model is a model that statistically estimates the topic of a word in a document from a plurality of documents. Words in a document do not appear independently, but have potential topics, and are proposed under the assumption that the same topic is likely to appear in the same document. As a topic model method, for example, LDA (Latent Dirichlet Allocation) (Non-Patent Document 3) may be used.
[非特許文献3] David M. Blei, Andrew Y. Ng, Michael I. Jordan. “Latent Dirichlet Allocation”. Journal of Machine Learning Research 3 (2003) 993-1022. [Non-Patent Document 3] David M. Blei, Andrew Y. Ng, Michael I. Jordan. “Latent Dirichlet Allocation”. Journal of Machine Learning Research 3 (2003) 993-1022.
重要度算出部32は、ユーザの各々について、当該ユーザによる発話テキストから抽出された論点の各々が、分類された論点集合の何れに属するかに基づいて、分類された論点集合毎に、当該ユーザにとっての論点集合の重要度を算出し、効用値パラメータ記憶部34に格納する。
For each user, the
具体的には、ユーザの、各論点集合に対する重要度を以下の方法で算出する。 Specifically, the importance of the user to each set of issues is calculated by the following method.
(ア)図2に示すように、論点の共起ネットワークを作成する。共起ネットワークとは、同じ発話テキストに2つの論点が同時に出現しているかを示す無向グラフである。2つのノードが繋がっているとき、そのノードの論点語は同じ文中に出現していることを示す。 (A) As shown in Fig. 2, a co-occurrence network of issues is created. A co-occurrence network is an undirected graph showing whether two issues appear at the same time in the same utterance text. When two nodes are connected, it indicates that the issue words of that node appear in the same sentence.
(イ)共起ネットワークの各ノードの重要度を求める。各ノード(論点語)の重要度を、例えば、ページランクアルゴリズム(非特許文献4)によって求める(図3参照)。 (B) Find the importance of each node in the co-occurrence network. The importance of each node (issue word) is determined by, for example, a PageRank algorithm (Non-Patent Document 4) (see FIG. 3).
[非特許文献4] Lawrence Page, Sergey Brin, Rajeev Motwani, Terry Winograd. “The PageRank Citation Ranking: Bringing Order to the Web”. Stanford Digital Libraries Working Paper, 1998. [Non-Patent Document 4] Lawrence Page, Sergey Brin, Rajeev Motwani, Terry Winograd. “The PageRank Citation Ranking: Bringing Order to the Web”. Stanford Digital Libraries Working Paper, 1998.
(ウ)論点集合に含まれる論点の重要度の平均値を求める。例えば、ページランクアルゴリズムによって算出したユーザiの各ノードnに対する重要度Vi,n を用いて、以下の式でユーザiの論点集合Nに対する重要度Ii,Nを求める。 (C) Find the average value of the importance of the issues included in the issue set. For example, using the importance V i, n for each node n of the user i calculated by the PageRank algorithm, the importance I i, N for the issue set N of the user i is obtained by the following equation.
論点抽出部36は、効用値の算出対象となる意見を表す発話テキストから、論点抽出部24と同様に、予め定められた条件を満たす名詞の各々を、論点として抽出する。
The issue
論点分類部38は、論点抽出部36によって抽出された論点の各々が、分類結果記憶部30に格納されている論点集合の何れに属するかを判断し、抽出された論点の各々を、論点集合のいずれかに分類する。
The
効用値算出部40は、論点抽出部36によって抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部34に記憶された、論点集合毎に定められた、対象ユーザにとっての論点集合の重要度に基づいて、評価対象の発話テキストについての対象ユーザの効用値を推定する。
The utility
具体的には、対象ユーザiの、評価対象の発話テキストoに対する効用値Ui,oを算出する。ユーザiの論点集合N に対する重要度Ii,Nを用いて、効用値Ui,oは、以下の式で計算される。 Specifically, the utility values U i and o of the target user i for the utterance text o to be evaluated are calculated. Using the importance I i, N for the issue set N of user i, the utility values U i, o are calculated by the following equation.
ただし、issuesは、評価対象の発話テキストから抽出された論点の集合を表わし、f(n)は、論点nが属する論点集合を表わす。 However, issues represents a set of issues extracted from the utterance text to be evaluated, and f (n) represents a set of issues to which the issue n belongs.
そして、以下の式を用いて、推定した効用値を、0.0〜1.0 の間に正規化する。 Then, the estimated utility value is normalized between 0.0 and 1.0 using the following formula.
ただし、Uoは、正規化対象とする効用値であり、Umin、Umaxは、予め定められた効用値の最小値及び最大値である。ここでは、重要度が高い論点集合に言及する意見ほど、当該ユーザから見て効用値(満足の度合い)が高いと仮定している。 However, U o is the utility value to be normalized, and U min and U max are the minimum and maximum values of the predetermined utility value. Here, it is assumed that the more important the opinion refers to the set of issues, the higher the utility value (degree of satisfaction) from the user's point of view.
最終的に算出した値を意見oに対する、ユーザiの推定した効用値とし、出力部50により出力する。
The finally calculated value is used as the utility value estimated by the user i for the opinion o, and is output by the
<第1の実施形態に係る効用値推定装置の作用>
次に、第1の実施形態に係る効用値推定装置100の作用について説明する。まず、複数のユーザの各々についての意見を表す複数の発話テキスト(例えば、投稿テキスト)を受け付けると、効用値推定装置100は、意見データベース22に格納する。そして、効用値推定装置100によって図4に示す論点集合重要度算出処理ルーチンを実行する。
<Operation of utility value estimation device according to the first embodiment>
Next, the operation of the utility
まず、ステップS100で、論点抽出部24は、意見データベース22に記憶されている複数のユーザによる複数の発話テキストから、予め定められた条件を満たす名詞を、論点として複数抽出する。
First, in step S100, the issue point extraction unit 24 extracts a plurality of nouns satisfying predetermined conditions as issues from a plurality of utterance texts stored in the
次に、ステップS102で、論点集合分類部26は、上記ステップS100で抽出された複数の論点と、トピックモデル記憶部28に記憶されているトピックモデルに基づいて、複数の論点集合を、論点の分類として生成し、分類結果記憶部30に格納する。
Next, in step S102, the issue set
次に、ステップS104で、重要度算出部32は、ユーザの各々について、当該ユーザによる発話テキストから抽出された論点の各々が、分類された論点集合の何れに属するかに基づいて、分類された論点集合毎に、当該ユーザにとっての論点集合の重要度を算出し、効用値パラメータ記憶部34に格納し、論点集合重要度算出処理ルーチンを終了する。
Next, in step S104, the
また、効用値の算出対象となる意見を表す発話テキストを受け付けると、効用値推定装置100によって図5に示す効用値推定処理ルーチンを実行する。
Further, when the utterance text expressing the opinion to be calculated of the utility value is received, the utility
まず、ステップS110で、論点抽出部36は、効用値の算出対象となる意見を表す発話テキストから、予め定められた条件を満たす名詞の各々を、論点として抽出する。
First, in step S110, the issue
次に、ステップS112で、論点分類部38は、上記ステップS110で抽出された論点の各々が、分類結果記憶部30に格納されている論点集合の何れに属するかを判断し、抽出された論点の各々を、論点集合のいずれかに分類する。
Next, in step S112, the
ステップS114では、効用値算出部40は、上記ステップS110で抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部34に記憶された、論点集合毎に定められた、対象ユーザにとっての論点集合の重要度とに基づいて、算出対象の発話テキストについての対象ユーザの効用値を推定し、出力部50により出力して、効用値推定処理ルーチンを終了する。
In step S114, the utility
以上説明したように、第1の実施形態に係る効用値推定装置によれば、評価対象の発話テキストから抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、分類された論点集合毎に定められた、対象ユーザにとっての論点集合の重要度とに基づいて、評価対象の発話テキストについての対象ユーザの効用値を推定することにより、ユーザにとっての効用値を精度良く推定することができる。 As described above, according to the utility value estimation device according to the first embodiment, which of the issue sets classified according to the latent topic model belongs to the issues extracted from the utterance text to be evaluated. The utility value for the user is accurate by estimating the utility value of the target user for the utterance text to be evaluated based on the importance of the issue set for the target user, which is determined for each classified issue set. It can be estimated well.
また、複数のユーザによる複数の発話テキストから抽出された複数の論点に基づいて、潜在トピックモデルに応じた複数の論点集合を、論点の分類として生成し、ユーザの各々について、ユーザによる発話テキストから抽出された論点の各々が、分類された論点集合の何れに属するかに基づいて、分類された論点集合毎に、ユーザにとっての論点集合の重要度を算出することにより、ユーザにとっての効用値を精度良く推定するための論点集合の重要度を算出することができる。 In addition, based on a plurality of issues extracted from a plurality of utterance texts by a plurality of users, a set of a plurality of issues according to a latent topic model is generated as a classification of the issues, and for each user, from the utterance text by the user. The utility value for the user is calculated by calculating the importance of the issue set for the user for each classified issue set based on which of the classified issue sets each of the extracted issues belongs to. It is possible to calculate the importance of a set of issues for accurate estimation.
また、議論掲示板などの意見をWeb上に表明するソーシャルメディアにおいて、投稿意見に対する各ユーザの重要性や好みを数値化した効用値を自動的に推定することができる。 In addition, in social media such as discussion boards that express opinions on the Web, it is possible to automatically estimate the utility value that quantifies the importance and preference of each user with respect to the posted opinion.
また、従来技術の問題点である同じ話題を指す単語でも異なる論点群に分類されてしまう点を、すべてのユーザの意見から論点を抽出し、トピック推定により論点集合(関連した名詞の集合)に自動分類することで解決した。 In addition, the point that words that point to the same topic, which is a problem of the conventional technology, is classified into different problem groups, is extracted from the opinions of all users and converted into a problem set (set of related nouns) by topic estimation. It was solved by automatic classification.
[第2の実施の形態]
次に、第2の実施の形態に係る効用値推定装置について説明する。なお、第1の実施の形態と同様の処理については、同一符号を付して説明を省略する。
[Second Embodiment]
Next, the utility value estimation device according to the second embodiment will be described. The same processing as in the first embodiment is designated by the same reference numerals and the description thereof will be omitted.
第2の実施の形態では、論点集合を有する発話テキストの極性を考慮して効用値を推定している点が、第1の実施の形態と異なっている。 The second embodiment is different from the first embodiment in that the utility value is estimated in consideration of the polarity of the utterance text having the issue set.
<第2の実施形態に係る効用値推定装置の構成>
次に、第2の実施形態に係る効用値推定装置の構成について説明する。図6に示すように、第2の実施形態に係る効用値推定装置200は、機能的には入力部10と、演算部220と、出力部50を含んで構成されている。
<Structure of utility value estimation device according to the second embodiment>
Next, the configuration of the utility value estimation device according to the second embodiment will be described. As shown in FIG. 6, the utility
演算部220は、意見データベース22と、論点抽出部24と、論点集合分類部26と、トピックモデル記憶部28と、分類結果記憶部30と、重要度算出部32と、極性判定部232と、効用値パラメータ記憶部234と、論点抽出部36と、論点分類部38と、効用値算出部240とを含んで構成される。
The
極性判定部232は、ユーザの各々について、当該ユーザによる発話テキストの係り受け解析結果と、極性が予め付与された単語とに基づいて、分類された論点集合毎に、当該ユーザにとっての論点集合を有する発話テキストの極性を判定し、効用値パラメータ記憶部234に格納する。
The
具体的には、ユーザの論点集合に対する極性が陽性 (positive) のとき、ユーザはその論点集合に対して肯定的であり、陰性(negative) のとき否定的であるとする。 Specifically, when the polarity of the user's issue set is positive, the user is positive for the issue set, and when it is negative, it is negative.
論点集合に対する極性を判定するには、まず係り受け解析により論点に対する極性を求める。係り受け解析とは、テキスト中の2つの文節同士の修飾・被修飾関係を解析する技術である。例えば、係り受け解析エンジンとして、CaboCha(非特許文献5)を用いればよい。 To determine the polarity with respect to the issue set, first determine the polarity with respect to the issue by dependency analysis. Dependency analysis is a technique for analyzing the modified / modified relationship between two clauses in a text. For example, CaboCha (Non-Patent Document 5) may be used as the dependency analysis engine.
[非特許文献5] 工藤拓, 松本裕治. “Support Vector Machine による日本語係り受け解析”. 電子情報通信学会技術研究報告, 2000. [Non-Patent Document 5] Taku Kudo, Yuji Matsumoto. “Japanese Dependency Analysis by Support Vector Machine”. Technical Report of the Society of Electronics, Information and Communication Engineers, 2000.
そして、名詞に係る語に極性語がある場合、その極性が名詞に対する極性であると仮定し、論点に対する極性を求める手順を次に示す。 Then, if there is a polar word in the word related to the noun, it is assumed that the polarity is the polarity for the noun, and the procedure for finding the polarity for the issue is shown below.
(ア)文を係り受け解析し、木構造を作成する。
(イ)ツリーを幅優先探索により各文節へ移動する。
(ウ)文節に論点が含まれる場合、その論点の極性を求める。
(エ)文節に否定要素が含まれる場合は、極性を反転させる。また、二重否定が検出された場合は、テンプレートマッチングにより極性を決定する。
(A) Create a tree structure by intercepting and analyzing sentences.
(B) Move the tree to each clause by breadth-first search.
(C) If the clause contains an issue, find the polarity of the issue.
(D) If the clause contains a negative element, the polarity is reversed. If double negation is detected, the polarity is determined by template matching.
図7に示す例文「私の飼っている猫は,愛想が悪いときもあるけれど基本的には可愛い。」に含まれる名詞「猫」に対する極性を求める場合について説明する。まず、この文章を係り受け解析により木構造を作成する。次に、親文節「可愛い」から幅優先探索により各文節へ移動し、文節に論点(名詞)が含まれているかどうかを調べる。文節「猫は、」には名詞「猫」が含まれているため、この文節の親文節をさかのぼる。さかのぼった先に極性が予め定められた極性語「可愛い」が含まれる文節「可愛い。」を発見し、この極性語「可愛い」の極性を「猫」に対する極性とする。極性判定には日本語アプレザイル評価表現辞書を用いる(非特許文献6)。 The case of finding the polarity for the noun "cat" included in the example sentence "My cat is sometimes unfriendly but basically cute" shown in FIG. 7 will be described. First, a tree structure is created by dependency analysis of this sentence. Next, move from the parent phrase "kawaii" to each phrase by breadth-first search, and check whether the phrase contains an issue (noun). Since the phrase "cat is" contains the noun "cat", it goes back to the parent phrase of this phrase. We found a phrase "cute" that includes the polar word "cute" whose polarity is predetermined, and let the polarity of this polar word "cute" be the polarity with respect to "cat". A Japanese appreciation evaluation expression dictionary is used for polarity determination (Non-Patent Document 6).
[非特許文献6] 佐野大樹. “日本語アプレザイル評価表現辞書―態度評価編― JAppraisal 辞書ver1.0“ 言語資源協会発行, 2011. [Non-Patent Document 6] Daiki Sano. "Japanese Appraisal Evaluation Expression Dictionary-Attitude Evaluation-JAppraisal Dictionary ver1.0" Published by Language Resources Association, 2011.
positiveの場合1とし、negativeの場合−1とするため、「可愛い」の極性はpositiveであることから、ユーザiの論点「猫」の極性値pi,nは+1とする。また、「可愛い猫」のように名詞の子文節が極性語である場合も探索対象とする (図8参照)。 Since the polarity of "cute" is positive because it is set to 1 in the case of positive and -1 in the case of negative, the polarity values p i and n of the issue "cat" of user i are set to +1. Also, when the child clause of the noun is a polar word such as "cute cat", it is also searched (see Fig. 8).
そして、ユーザiの論点集合Nに対する極性Pi,N を次の式で求める。 Then, the polarities P i and N with respect to the issue set N of the user i are obtained by the following equation.
ただし、論点集合Nに含まれる論点nの極性値を、pi,nとする。上記の式により、論点集合Nに含まれる論点nの極性値pi,nの合計が0以上のとき、ユーザiの論点集合Nに対する極性Pi,Nを+1とし、負のとき−1とする。 However, the polarity values of the issues n included in the issue set N are p i and n . According to the above equation, when the sum of the polar values p i and n of the issues n included in the issue set N is 0 or more, the polarities P i and N with respect to the issue set N of the user i are set to +1 and when they are negative, they are -1. To do.
また、論点nを含む文節に否定要素が含まれる場合は、極性値を反転させる。ここで、文中において否定を表す表現のことを否定要素と呼ぶ。否定表現を判定する方法として、本発明の実施の形態では、以下の(1)〜(3)に示す3種類を否定要素と定め、あらかじめ、リストに登録しておき、各文節とマッチングさせることで判定する。 If the clause containing the issue n contains a negative element, the polarity value is inverted. Here, the expression expressing negation in a sentence is called a negation element. As a method for determining a negative expression, in the embodiment of the present invention, the following three types shown in (1) to (3) are defined as negative elements, registered in a list in advance, and matched with each clause. Judge with.
(1)否定辞を否定要素とする。例えば、助動詞「ない」と「ず」、接尾辞「ない」、接頭辞「非」、「不」、「無」、「未」、「反」、「異」が、否定辞である。 (1) Negative words are used as negative elements. For example, the auxiliary verbs "not" and "zu", the suffix "not", the prefix "non", "not", "nothing", "not", "anti", and "different" are negative words.
(2)非存在の内容語を否定要素とする。例えば、形容詞「ない」、名詞「なし」が、非存在の内容語である。 (2) Non-existent content words are used as negative elements. For example, the adjective "not" and the noun "none" are non-existent content words.
(3)否定を表す複合辞を否定要素とする。例えば、「のではない」、「わけではない」、「わけにはいかない」などが、否定を表す複合辞である。 (3) A compound word representing negation is used as a negation element. For example, "not", "not", "cannot be", etc. are compound words that express negation.
また、二重否定に関しては以下の表のようなテンプレートを作成し、それらと適合した場合に対応する基盤的な意味に応じて、極性値を反転あるいは反転させない。 In addition, regarding double negation, create a template as shown in the table below, and do not invert or invert the polarity value according to the basic meaning corresponding to the case where it is matched with them.
効用値算出部240は、論点抽出部36によって抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部234に記憶された、論点集合毎に定められた、対象ユーザにとっての論点集合の重要度と、対象ユーザにとっての論点集合を有する発話テキストの極性と、に基づいて、評価対象の発話テキストについての対象ユーザの効用値を推定する。
The utility
具体的には、対象ユーザiの、評価対象の発話テキストoに対する効用値Ui,oを算出する。ユーザiの論点集合f(n)に対する重要度 Ii,f(n)と、ユーザiの論点集合f(n)に対する極性Pi,f(n)を用いて、効用値Ui,oは、以下の式で計算される。 Specifically, the utility values U i and o of the target user i for the utterance text o to be evaluated are calculated. Using the importance I i, f (n) for the issue set f (n) of the user i and the polarities P i, f (n) for the issue set f (n) of the user i, the utility values U i, o are , Calculated by the following formula.
ただし、issuesは、評価対象の発話テキストから抽出された論点の集合を表わし、f(n)は、論点nが属する論点集合を表わす。 However, issues represents a set of issues extracted from the utterance text to be evaluated, and f (n) represents a set of issues to which the issue n belongs.
また、評価対象の発話テキストoにおいて、論点nを含む文節に否定要素が含まれる場合は、極性Pi,f(n)を反転させて、上記式を計算する。また、評価対象の発話テキストoにおいて、論点nを含む文節に二重否定を含む場合には、当該二重否定に対応する基盤的な意味に応じて、極性Pi,f(n)を反転あるいは反転させないで、上記式を計算する。 Further, in the utterance text o to be evaluated, when the clause including the issue n contains a negative element, the polarities P i and f (n) are inverted and the above equation is calculated. In addition, in the utterance text o to be evaluated, when the clause containing the issue n includes a double negation, the polarities P i and f (n) are reversed according to the basic meaning corresponding to the double negation. Alternatively, the above equation is calculated without inversion.
そして、推定した効用値を、0.0〜1.0 の間に以下の式で正規化する。 Then, the estimated utility value is normalized between 0.0 and 1.0 by the following formula.
ここで、重要度が高く、かつ、肯定的な論点集合に言及する意見ほど、当該ユーザから見て効用値(満足度合い)が高いと仮定している。 Here, it is assumed that the opinion that refers to a set of issues that are more important and affirmative has a higher utility value (satisfaction) from the user's point of view.
最終的に算出した値を意見oに対する、ユーザiの推定した効用値とし、出力部50により出力する。
The finally calculated value is used as the utility value estimated by the user i for the opinion o, and is output by the
<第2の実施形態に係る効用値推定装置の作用>
次に、第2の実施形態に係る効用値推定装置200の作用について説明する。なお、第1の実施の形態と同様の処理については、同一符号を付して詳細な説明を省略する。
<Operation of utility value estimation device according to the second embodiment>
Next, the operation of the utility
第2の実施形態における論点集合重要度算出処理ルーチンを、図9を用いて説明する。 The issue set importance calculation processing routine in the second embodiment will be described with reference to FIG.
まず、ステップS100で、論点抽出部24は、意見データベース22に記憶されている複数のユーザによる複数の発話テキストから、予め定められた条件を満たす名詞を、論点として複数抽出する。
First, in step S100, the issue point extraction unit 24 extracts a plurality of nouns satisfying predetermined conditions as issues from a plurality of utterance texts stored in the
次に、ステップS102で、論点集合分類部26は、上記ステップS100で抽出された複数の論点と、トピックモデル記憶部28に記憶されているトピックモデルと、に基づいて、潜在トピックモデルに応じた複数の論点集合を、論点の分類として生成し、分類結果記憶部30に格納する。
Next, in step S102, the issue set
ステップS200で、極性判定部232は、ユーザの各々について、当該ユーザによる発話テキストの係り受け解析結果と、極性が予め付与された単語とに基づいて、分類された論点集合毎に、当該ユーザにとっての論点集合を有する発話テキストの極性を判定し、効用値パラメータ記憶部234に格納する。
In step S200, the
次に、ステップS104で、重要度算出部32は、ユーザの各々について、当該ユーザによる発話テキストから抽出された論点の各々が、分類された論点集合の何れに属するかに基づいて、分類された論点集合毎に、当該ユーザにとっての論点集合の重要度を算出し、効用値パラメータ記憶部234に格納し、論点集合重要度算出処理ルーチンを終了する。
Next, in step S104, the
また、効用値の算出対象となる意見を表す発話テキストを受け付けると、効用値推定装置200によって、上記図5に示す効用値推定処理ルーチンと同様の処理ルーチンを実行する。
Further, when the utterance text expressing the opinion to be calculated of the utility value is received, the utility
このとき、ステップS114では、効用値算出部240は、上記ステップS110で抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部234に記憶された、論点集合毎に定められた、対象ユーザにとっての論点集合の重要度、及び対象ユーザにとっての論点集合を有する発話テキストの極性とに基づいて、算出対象の発話テキストについての対象ユーザの効用値を推定する。
At this time, in step S114, the utility
以上説明したように、第2の実施形態に係る効用値推定装置によれば、評価対象の発話テキストから抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、分類された論点集合毎に定められた、対象ユーザにとっての論点集合の重要度及び論点集合を有する発話テキストの極性とに基づいて、評価対象の発話テキストについての対象ユーザの効用値を推定することにより、ユーザにとっての効用値を精度良く推定することができる。 As described above, according to the utility value estimation device according to the second embodiment, which of the issue sets classified according to the latent topic model belongs to the issues extracted from the utterance text to be evaluated. To estimate the utility value of the target user for the utterance text to be evaluated based on the importance of the issue set to the target user and the polarity of the utterance text having the issue set determined for each classified issue set. Therefore, the utility value for the user can be estimated with high accuracy.
また、複数のユーザによる複数の発話テキストから抽出された複数の論点に基づいて、潜在トピックモデルに応じた複数の論点集合に分類し、ユーザの各々について、ユーザによる発話テキストから抽出された論点の各々が、分類された論点集合の何れに属するかと、ユーザによる発話テキストの係り受け解析結果と、極性が予め付与された単語とに基づいて、分類された論点集合毎に、ユーザにとっての論点集合を有する発話テキストの極性を判定することにより、ユーザにとっての効用値を精度良く推定するための論点集合を有する発話テキストの極性を判定することができる。 In addition, based on a plurality of issues extracted from a plurality of utterance texts by a plurality of users, the issues are classified into a plurality of issue sets according to a latent topic model, and for each user, the issues extracted from the utterance texts by the users are classified. Based on which of the classified issue sets each belongs to, the result of the dependency analysis of the utterance text by the user, and the word to which the polarity is given in advance, each of the classified issue sets is the issue set for the user. By determining the polarity of the utterance text having the above, it is possible to determine the polarity of the utterance text having a set of issues for accurately estimating the utility value for the user.
また、従来技術の問題点であるユーザにとって否定的である内容を持つ意見が高い効用値になってしまう点を、各単語が肯定的か否定的かを表す極性が予め定められた極性語を用いて、論点集合を有する発話テキストの極性を判定し、ユーザの投稿意見に対する極性を、効用値推定の際に導入することで解決した。 In addition, a polar word with a predetermined polarity that indicates whether each word is positive or negative is used to indicate that an opinion having a content that is negative to the user, which is a problem of the prior art, has a high utility value. It was solved by determining the polarity of the utterance text having a set of issues and introducing the polarity to the user's posted opinion when estimating the utility value.
[第3の実施の形態]
次に、第3の実施の形態に係る効用値推定装置について説明する。なお、第1の実施の形態、第2の実施の形態と同様の処理については、同一符号を付して説明を省略する。
[Third Embodiment]
Next, the utility value estimation device according to the third embodiment will be described. The same processes as those in the first embodiment and the second embodiment are designated by the same reference numerals, and the description thereof will be omitted.
第3の実施の形態では、複数のユーザにおける合意案候補を、複数のユーザの意見を表す複数の発話テキストから抽出し、可視化している点が、第2の実施の形態と異なっている。 The third embodiment is different from the second embodiment in that the consensus proposal candidates in the plurality of users are extracted from the plurality of utterance texts expressing the opinions of the plurality of users and visualized.
<第3の実施形態に係る効用値推定装置の構成>
次に、第3の実施形態に係る効用値推定装置の構成について説明する。図10に示すように、第3の実施形態に係る効用値推定装置300は、機能的には入力部10と、演算部320と、出力部50を含んで構成されている。
<Structure of utility value estimation device according to the third embodiment>
Next, the configuration of the utility value estimation device according to the third embodiment will be described. As shown in FIG. 10, the utility
演算部320は、意見データベース22と、論点抽出部24と、論点集合分類部26と、トピックモデル記憶部28と、分類結果記憶部30と、重要度算出部32と、極性判定部232と、効用値パラメータ記憶部234と、論点抽出部36と、論点分類部38と、効用値算出部240と、合意案抽出部342と、可視化部344とを含んで構成される。
The
入力部10は、複数のユーザの各々についての意見を表す複数の発話テキスト(例えば、投稿テキスト)を受け付け、後述する意見データベース22に格納する。
The
また、入力部10は、効用値の算出対象となる、複数のユーザの各々についての意見を表す複数の発話テキストを受け付ける。
Further, the
論点抽出部36は、効用値の算出対象となる意見を表す複数の発話テキストの各々から、予め定められた条件を満たす名詞の各々を、論点として抽出する。
The issue
論点分類部38は、効用値の算出対象となる意見を表す複数の発話テキストの各々について、論点抽出部36によって抽出された論点の各々が、分類結果記憶部30に格納されている論点集合の何れに属するかを判断し、抽出された論点の各々を、論点集合のいずれかに分類する。
In the
効用値算出部240は、効用値の算出対象となる意見を表す複数の発話テキストの各々について、ユーザ毎に、論点抽出部36によって抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部234に記憶された、論点集合毎に定められた、当該ユーザにとっての論点集合の重要度及び当該ユーザにとっての論点集合を有する発話テキストの極性と、に基づいて、当該算出対象の発話テキストについての当該ユーザの効用値を推定する。
The utility
合意案抽出部342は、複数のユーザの各々及び効用値の算出対象の複数の発話テキストの各々に対して推定された効用値に基づいて、効用値の算出対象となる意見を表す複数の発話テキストから、複数のユーザの間での合意案としての発話テキスト候補を抽出する。
The consensus
具体的には、複数のユーザから主要なユーザを選出し、2人1組のペアを作成し、ユーザのペア毎に、当該ユーザのペア間の合意案候補を抽出する。交渉問題において、一方の交渉者の効用値を小さくしなければ、もう一方の効用値を上げることができない状態がパレート最適と言われており、パレート最適となる発話テキストが、交渉における重要な合意案候補となる。 Specifically, a main user is selected from a plurality of users, a pair of two people is created, and a consensus proposal candidate between the pair of users is extracted for each pair of users. In negotiation issues, it is said that Pareto optimality is the state in which the utility value of one negotiator cannot be increased unless the utility value of the other negotiator is reduced. Become a candidate.
そこで、ユーザのペアにおいて互いが合意できる意見を表す発話テキスト(合意案候補)として、ユーザのペアについて求められた効用値から得られる、パレート最適な発話テキストを求める(図11参照)。 Therefore, as an utterance text (a candidate for an agreement) expressing an opinion that can be agreed upon by a pair of users, a Pareto optimal utterance text obtained from the utility value obtained for the pair of users is obtained (see FIG. 11).
可視化部344は、合意案として抽出された発話テキストと、当該発話テキストが表す意見に合意する2以上のユーザの各々との間を結んだグラフ構造を生成して出力部50により提示する。
The
具体的には、ユーザのペアについて抽出されたパレート最適な意見を表す発話テキストを、以下に説明するように、複数のユーザにおける議論の合意案候補として可視化する(図12参照)。 Specifically, the utterance text that expresses the Pareto optimal opinion extracted for the pair of users is visualized as a consensus candidate for discussion among a plurality of users (see FIG. 12).
まず、各ペアの合意案候補を同一画面に表示する。そして、合意案候補の各々について、当該合意案候補と、当該合意案候補に合意する2以上のユーザの各々との間をエッジで結んだグラフ構造を生成して提示する。このとき、ユーザを外部ノード、意見を表す発話テキストを内部ノードとし、各ユーザが合意案候補に合意したかをエッジとしてグラフ描画を行う。 First, the candidate agreements for each pair are displayed on the same screen. Then, for each of the draft agreement candidates, a graph structure is generated and presented in which the candidate agreement proposal and each of the two or more users who agree with the candidate agreement proposal are connected by an edge. At this time, the user is set as an external node, the utterance text expressing an opinion is set as an internal node, and the graph is drawn with whether or not each user agrees with the consensus proposal candidate as an edge.
また、多くのユーザのペアが合意案候補に選んだ意見を表す発話テキストは大きく表示する。また、意見を表す発話テキストは冒頭の数文字のみ表記し、クリックすることで、全文とユーザ名(投稿者名)を表示するようにする。 In addition, the utterance text that expresses the opinion that many pairs of users have selected as consensus candidates is displayed in large size. In addition, the utterance text expressing the opinion should be written only in the first few letters, and the full text and the user name (poster name) should be displayed by clicking.
また、できるだけ多くのユーザが合意する合意案候補を提示するようにしてもよい。この場合には、例えば、投稿数の多い上位10名を主要ユーザとして選出し、2人1組のペアを作成する。すなわち、10C2=45ペアを作成する。そして、各ペアのパレート最適な意見を表す発話テキストを合意案候補として求める。そして、合意案候補ごとに、合意したペア数を0〜1の値となるように正規化し、正規化されたペア数が0.1以上となる合意案候補を、多くのペアが合意案候補に選んだ意見を表す発話テキストとして求め、議論全体の合意案候補としてグラフ描画を行う。 In addition, as many users as possible may present a consensus proposal that is agreed upon. In this case, for example, the top 10 people with the most posts are selected as the main users, and a pair of two people is created. That is, 10 C 2 = 45 pairs are created. Then, the utterance text expressing the Pareto optimal opinion of each pair is sought as a candidate for the agreement. Then, for each consensus candidate, the number of agreed pairs is normalized so as to have a value of 0 to 1, and many pairs are consensus candidates for which the normalized number of pairs is 0.1 or more. Ask for it as an utterance text that expresses the opinion selected in, and draw a graph as a candidate for a consensus proposal for the entire discussion.
<第3の実施形態に係る効用値推定装置の作用>
次に、第3の実施形態に係る効用値推定装置300の作用について説明する。なお、第1の実施の形態及び第2の実施の形態と同様の処理については、同一符号を付して詳細な説明を省略する。
<Operation of utility value estimation device according to the third embodiment>
Next, the operation of the utility
まず、効用値推定装置300は、上記図9に示す論点集合重要度算出処理ルーチンと同様の処理ルーチンを実行する。
First, the utility
また、効用値の算出対象となる意見を表す複数の発話テキストを受け付けると、効用値推定装置300によって、複数の発話テキストの各々に対し、上記図5に示す効用値推定処理ルーチンと同様の処理ルーチンを繰り返し実行する。
Further, when a plurality of utterance texts expressing opinions for which the utility value is to be calculated are received, the utility
このとき、ステップS114では、効用値算出部240は、複数のユーザ毎に、上記ステップS110で抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部234に記憶された、論点集合毎に定められた、当該ユーザにとっての論点集合の重要度、及び当該ユーザにとっての論点集合を有する発話テキストの極性とに基づいて、効用値の算出対象の発話テキストについての当該ユーザの効用値を推定する。
At this time, in step S114, the utility
そして、効用値推定装置300によって、図13に示す合意案可視化処理ルーチンを実行する。
Then, the utility
まず、ステップS300において、当該ユーザのペアについて発話テキストの各々について求められた効用値に基づいて、パレート最適な発話テキストを、合意案候補として抽出する。 First, in step S300, the Pareto-optimal utterance text is extracted as a consensus proposal candidate based on the utility value obtained for each of the utterance texts for the pair of users.
ステップS302では、ユーザの全てのペアについて、上記ステップS300の処理が終了したか否かを判定し、上記ステップS300の処理が終了していないペアが存在する場合には、上記ステップS300へ戻り、当該ペアについて合意案候補を抽出する。一方、ユーザの全てのペアについて、上記ステップS300の処理が終了した場合には、ステップS304へ移行する。 In step S302, it is determined whether or not the processing of step S300 has been completed for all the pairs of users, and if there is a pair for which the processing of step S300 has not been completed, the process returns to step S300. Extract potential agreements for the pair. On the other hand, when the process of step S300 is completed for all the pairs of users, the process proceeds to step S304.
ステップS304では、ユーザの全てのペアについて抽出された合意案候補に基づいて、合意案候補として抽出された発話テキストと、当該発話テキストが表す意見に合意する2以上のユーザの各々との間をエッジで結んだグラフ構造を生成して出力部50により提示し、合意案可視化処理ルーチンを終了する。
In step S304, based on the agreement proposal candidates extracted for all pairs of users, the utterance text extracted as the agreement proposal candidate and each of the two or more users who agree with the opinion expressed by the utterance text are separated from each other. The graph structure connected by the edges is generated and presented by the
以上説明したように、第3の実施形態に係る効用値推定装置によれば、ユーザのペア毎に、発話テキストの各々について求められた効用値に基づいて、パレート最適な発話テキストを、合意案候補として抽出し、合意案候補を可視化することで、複数のユーザでの適切な合意案に導くことができる。 As described above, according to the utility value estimation device according to the third embodiment, the Pareto optimal utterance text is agreed for each pair of users based on the utility value obtained for each of the utterance texts. By extracting as candidates and visualizing the consensus proposal candidates, it is possible to lead to an appropriate consensus proposal by a plurality of users.
[第4の実施の形態]
次に、第4の実施の形態に係る効用値推定装置について説明する。なお、第1の実施の形態、第2の実施の形態と同様の処理については、同一符号を付して説明を省略する。
[Fourth Embodiment]
Next, the utility value estimation device according to the fourth embodiment will be described. The same processes as those in the first embodiment and the second embodiment are designated by the same reference numerals, and the description thereof will be omitted.
第4の実施の形態では、複数の仮想ユーザにおける効用値を推定して、総合評価値を算出している点が、第2の実施の形態と異なっている。 The fourth embodiment is different from the second embodiment in that the utility value for a plurality of virtual users is estimated and the comprehensive evaluation value is calculated.
<第4の実施形態に係る効用値推定装置の構成>
次に、第4の実施形態に係る効用値推定装置の構成について説明する。図14に示すように、第4の実施形態に係る効用値推定装置400は、機能的には入力部10と、演算部420と、出力部50を含んで構成されている。
<Structure of utility value estimation device according to the fourth embodiment>
Next, the configuration of the utility value estimation device according to the fourth embodiment will be described. As shown in FIG. 14, the utility
演算部420は、意見データベース22と、論点抽出部24と、論点集合分類部26と、トピックモデル記憶部28と、分類結果記憶部30と、重要度算出部32と、極性判定部232と、効用値パラメータ記憶部234と、論点抽出部36と、論点分類部38と、効用値算出部240と、総合評価部442とを含んで構成される。
The
入力部10は、複数のユーザの各々についての意見を表す複数の発話テキスト(例えば、投稿テキスト)を受け付け、後述する意見データベース22に格納する。
The
また、入力部10は、効用値の算出対象となる意見を表す発話テキストを受け付ける。
Further, the
効用値パラメータ記憶部234には、ユーザの各々について、分類された論点集合毎に、当該ユーザにとっての重要度、及び当該ユーザにとっての論点集合を有する発話テキストの極性が記憶されている。ここでのユーザの各々を、仮想ユーザとして用いることにより、以降において、効用値の算出対象となる意見を表す発話テキストを評価する。
The utility value
論点抽出部36は、効用値の算出対象となる意見を表す発話テキストから、予め定められた条件を満たす名詞の各々を、論点として抽出する。
The issue
論点分類部38は、効用値の算出対象となる意見を表す発話テキストについて、論点抽出部36によって抽出された論点の各々が、分類結果記憶部30に格納されている論点集合の何れに属するかを判断し、抽出された論点の各々を、論点集合のいずれかに分類する。
The
効用値算出部240は、効用値の算出対象となる意見を表す発話テキストについて、仮想ユーザ毎に、論点抽出部36によって抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部234に記憶された、論点集合毎に定められた、当該仮想ユーザにとっての論点集合の重要度、及び当該仮想ユーザにとっての論点集合を有する発話テキストの極性と、に基づいて、算出対象の発話テキストについての当該仮想ユーザの効用値を推定する。
The utility
総合評価部442は、算出対象の発話テキストについて仮想ユーザ毎に推定された効用値に基づいて、発話テキストについて総合評価値を算出する。例えば、仮想ユーザ毎に推定された効用値の合計値又は平均値を、総合評価値として算出し、出力部50により出力する。
The
<第4の実施形態に係る効用値推定装置の作用>
次に、第4の実施形態に係る効用値推定装置400の作用について説明する。なお、第1の実施の形態及び第2の実施の形態と同様の処理については、同一符号を付して詳細な説明を省略する。
<Operation of utility value estimation device according to the fourth embodiment>
Next, the operation of the utility
まず、効用値推定装置400は、上記図9に示す論点集合重要度算出処理ルーチンと同様の処理ルーチンを実行する。
First, the utility
また、効用値の算出対象となる意見を表す発話テキストを受け付けると、効用値推定装置400によって、図15に示す効用値推定処理ルーチンを実行する。
Further, when the utterance text expressing the opinion to be calculated of the utility value is received, the utility
まず、ステップS110で、論点抽出部36は、効用値の算出対象となる意見を表す発話テキストから、予め定められた条件を満たす名詞の各々を、論点として抽出する。
First, in step S110, the issue
次に、ステップS112で、論点分類部38は、上記ステップS110で抽出された論点の各々が、分類結果記憶部30に格納されている論点集合の何れに属するかを判断し、抽出された論点の各々を、論点集合のいずれかに分類する。
Next, in step S112, the
ステップS400では、効用値算出部240は、複数の仮想ユーザ毎に、上記ステップS110で抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部234に記憶された、論点集合毎に定められた、当該仮想ユーザにとっての論点集合の重要度、及び当該仮想ユーザにとっての論点集合を有する発話テキストの極性とに基づいて、効用値の算出対象の発話テキストについての当該仮想ユーザの効用値を推定する。
In step S400, the utility
そして、ステップS402では、総合評価部442は、算出対象の発話テキストについて仮想ユーザ毎に推定された効用値に基づいて、発話テキストについて総合評価値を算出し、出力部50により出力し、効用値推定処理ルーチンを終了する。
Then, in step S402, the
以上説明したように、第4の実施形態に係る効用値推定装置によれば、複数の仮想ユーザについて推定した効用値から自動的に投稿意見などに対して評価を行うことができる。また、重要な意見を自動的に抽出することも可能である。 As described above, according to the utility value estimation device according to the fourth embodiment, it is possible to automatically evaluate the posted opinion or the like from the utility values estimated for a plurality of virtual users. It is also possible to automatically extract important opinions.
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.
例えば、上記の実施形態においては、論点集合の重要度の算出や極性の判定と共に、効用値の算出を、効用値推定装置で実現する場合を例に説明したが、これに限定されるものではなく、論点集合の重要度の算出や極性の判定と、効用値の算出とを、論点集合重要度算出装置と効用値推定装置という別々の装置で実現するようにしてもよい。この場合には、論点集合重要度算出装置は、意見データベース22と、論点抽出部24と、論点集合分類部26と、トピックモデル記憶部28と、分類結果記憶部30と、重要度算出部32と、効用値パラメータ記憶部34又は234と、を備えていればよい。また、効用値推定装置は、効用値パラメータ記憶部34又は234と、論点抽出部36と、論点分類部38と、効用値算出部40又は240とを備えていればよい。
For example, in the above embodiment, the case where the calculation of the utility value is realized by the utility value estimation device together with the calculation of the importance of the issue set and the determination of the polarity has been described as an example, but the present invention is not limited to this. Instead, the calculation of the importance of the issue set, the determination of the polarity, and the calculation of the utility value may be realized by separate devices such as the issue set importance calculation device and the utility value estimation device. In this case, the issue set importance calculation device includes the
また、論点集合分類部26による処理が、外部装置によって行われ、潜在トピックモデルに応じた複数の論点集合が、当該外部装置より効用値推定装置に入力されてもよい。
Further, the processing by the issue set
また、上記第3の実施の形態、第4の実施の形態において、上記第1の実施の形態のように、極性を考慮せずに、効用値を推定するようにしてもよい。 Further, in the third embodiment and the fourth embodiment, the utility value may be estimated without considering the polarity as in the first embodiment.
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。 Further, in the specification of the present application, the program has been described as an embodiment in which the program is pre-installed, but the program can be stored in a computer-readable recording medium and provided, or provided via a network. It is also possible to do.
10 入力部
20、220、320、420 演算部
22 意見データベース
24、36 論点抽出部
26 論点集合分類部
28 トピックモデル記憶部
30 分類結果記憶部
32 重要度算出部
34、234 効用値パラメータ記憶部
38 論点分類部
40、240 効用値算出部
50 出力部
100、200、300、400 効用値推定装置
232 極性判定部
342 合意案抽出部
344 可視化部
442 総合評価部
10
Claims (4)
評価対象の発話テキストから、名詞を、論点として抽出する論点抽出部と、
前記論点抽出部によって抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、前記分類された論点集合毎に定められた、前記対象ユーザにとっての前記論点集合の重要度とに基づいて、前記評価対象の発話テキストについての前記対象ユーザの効用値を推定する効用値推定部と、
可視化部と、
を含み、
前記対象ユーザは、複数の対象ユーザであって、
前記評価対象の発話テキストは、複数の評価対象の発話テキストであって、
前記効用値推定部は、前記複数の対象ユーザの各々及び前記複数の評価対象の発話テキストの各々に対し、前記分類された論点集合毎及び前記対象ユーザ毎に定められた、前記対象ユーザにとっての前記論点集合の重要度を用いて、前記評価対象の発話テキストについての前記対象ユーザの効用値を推定し、
前記可視化部は、前記複数の対象ユーザの各々及び前記複数の評価対象の発話テキストの各々に対して推定された前記効用値に基づいて、2以上の対象ユーザの間で合意する発話テキスト候補を抽出し、抽出された発話テキスト候補と、発話テキスト候補に合意する2以上の対象ユーザの各々との間を結んだグラフ構造を生成して出力部により提示する
効用値推定装置。 It is a utility value estimation device that estimates the utility value indicating the degree of preference for the target user for the utterance text to be evaluated.
An issue extraction unit that extracts nouns as issues from the utterance text to be evaluated,
Which of the issue sets classified according to the latent topic model belongs to the issues extracted by the issue extraction unit, and the importance of the issue set for the target user, which is determined for each classified issue set. A utility value estimation unit that estimates the utility value of the target user for the utterance text to be evaluated based on the degree and
Visualization part and
Including
The target user is a plurality of target users,
The utterance text to be evaluated is a plurality of utterance texts to be evaluated.
The utility value estimation unit is defined for each of the plurality of target users and each of the utterance texts of the plurality of evaluation targets for each of the classified issue sets and for each of the target users. Using the importance of the issue set, the utility value of the target user for the utterance text to be evaluated is estimated.
The visualization unit selects utterance text candidates agreed between two or more target users based on the utility values estimated for each of the plurality of target users and each of the plurality of evaluation target utterance texts. A utility value estimation device that generates a graph structure that connects the extracted utterance text candidates and each of two or more target users who agree with the utterance text candidates and presents them by the output unit.
評価対象の発話テキストから、名詞を、論点として抽出する論点抽出部と、
前記論点抽出部によって抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、前記分類された論点集合毎に定められた、前記対象ユーザにとっての前記論点集合の重要度とに基づいて、前記評価対象の発話テキストについての前記対象ユーザの効用値を推定する効用値推定部と、
総合評価部と、
を含み、
前記対象ユーザは、複数の仮想ユーザであって、
前記効用値推定部は、前記複数の仮想ユーザの各々に対し、前記分類された論点集合毎及び前記仮想ユーザ毎に定められた、前記仮想ユーザにとっての前記論点集合の重要度を用いて、前記評価対象の発話テキストについての前記仮想ユーザの効用値を推定し、
前記総合評価部は、前記複数の仮想ユーザの各々に対して推定された前記効用値に基づいて、前記評価対象の発話テキストについて総合評価値を算出する
効用値推定装置。 It is a utility value estimation device that estimates the utility value indicating the degree of preference for the target user for the utterance text to be evaluated.
An issue extraction unit that extracts nouns as issues from the utterance text to be evaluated,
Which of the issue sets classified according to the latent topic model belongs to the issues extracted by the issue extraction unit, and the importance of the issue set for the target user, which is determined for each classified issue set. A utility value estimation unit that estimates the utility value of the target user for the utterance text to be evaluated based on the degree and
Comprehensive evaluation department and
Including
The target user is a plurality of virtual users.
The utility value estimation unit uses the importance of the issue set for the virtual user, which is determined for each of the classified issue sets and for each virtual user, for each of the plurality of virtual users. Estimate the utility value of the virtual user for the utterance text to be evaluated,
The comprehensive evaluation unit is a utility value estimation device that calculates a comprehensive evaluation value for the utterance text to be evaluated based on the utility value estimated for each of the plurality of virtual users.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017129141A JP6895167B2 (en) | 2017-06-30 | 2017-06-30 | Utility value estimator and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017129141A JP6895167B2 (en) | 2017-06-30 | 2017-06-30 | Utility value estimator and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2019012444A JP2019012444A (en) | 2019-01-24 |
| JP6895167B2 true JP6895167B2 (en) | 2021-06-30 |
Family
ID=65228015
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017129141A Active JP6895167B2 (en) | 2017-06-30 | 2017-06-30 | Utility value estimator and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6895167B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20220292559A1 (en) * | 2019-08-22 | 2022-09-15 | Nec Corporation | Order-receiving-side negotiation device, order-receiving-side negotiation method, and order-receiving-side negotiation program |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5588938B2 (en) * | 2011-07-26 | 2014-09-10 | 日本電信電話株式会社 | Item recommendation apparatus, method and program |
| JP6405704B2 (en) * | 2014-05-26 | 2018-10-17 | ソニー株式会社 | Information processing apparatus, information processing method, and program |
| JP2016136355A (en) * | 2015-01-23 | 2016-07-28 | ソニー株式会社 | Information processing apparatus, information processing method, and program |
-
2017
- 2017-06-30 JP JP2017129141A patent/JP6895167B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2019012444A (en) | 2019-01-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Bonta et al. | A comprehensive study on lexicon based approaches for sentiment analysis | |
| Sunilkumar et al. | A survey on semantic similarity | |
| CN111221962B (en) | Text emotion analysis method based on new word expansion and complex sentence pattern expansion | |
| Montejo-Ráez et al. | Ranked wordnet graph for sentiment polarity classification in twitter | |
| CN107862087B (en) | Emotion analysis method and device based on big data and deep learning and storage medium | |
| Diamantini et al. | A negation handling technique for sentiment analysis | |
| CN107220352A (en) | The method and apparatus that comment collection of illustrative plates is built based on artificial intelligence | |
| US20190370274A1 (en) | Analysis Method Using Graph Theory, Analysis Program, and Analysis System | |
| CN105205699A (en) | User label and hotel label matching method and device based on hotel comments | |
| Nair et al. | SentiMa-sentiment extraction for Malayalam | |
| CN105843796A (en) | Microblog emotional tendency analysis method and device | |
| Mozafari et al. | Emotion detection by using similarity techniques | |
| Ojokoh et al. | A feature–opinion extraction approach to opinion mining | |
| Chinsha et al. | Aspect based opinion mining from restaurant reviews | |
| Nguyen et al. | Aspect-based sentiment analysis using tree kernel based relation extraction | |
| Nyaung et al. | Feature Based Summarizing and Ranking from Customer Reviews | |
| CN112711666B (en) | Futures label extraction method and device | |
| Canales et al. | Exploiting a bootstrapping approach for automatic annotation of emotions in texts | |
| Hussain et al. | A technique for perceiving abusive bangla comments | |
| Kaptein | Learning to Analyze Relevancy and Polarity of Tweets. | |
| JP6895167B2 (en) | Utility value estimator and program | |
| Nandan et al. | Sentiment Analysis of Twitter Classification by Applying Hybrid-Based Techniques | |
| CN110399595B (en) | Text information labeling method and related device | |
| Hanmastiana et al. | Classification of public opinion on social media twitter concerning the education in Indonesia using the K-nearest neighbors (K-NN) algorithm and K-fold cross validation | |
| Axhiu et al. | Aspect-term Extraction from Albanian Reviews with Topic Modeling Techniques |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20170718 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200207 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201118 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201201 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210125 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210309 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210406 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210525 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210531 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6895167 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |