JP6987003B2 - Text mining methods, text mining programs, and text mining equipment - Google Patents
Text mining methods, text mining programs, and text mining equipment Download PDFInfo
- Publication number
- JP6987003B2 JP6987003B2 JP2018052074A JP2018052074A JP6987003B2 JP 6987003 B2 JP6987003 B2 JP 6987003B2 JP 2018052074 A JP2018052074 A JP 2018052074A JP 2018052074 A JP2018052074 A JP 2018052074A JP 6987003 B2 JP6987003 B2 JP 6987003B2
- Authority
- JP
- Japan
- Prior art keywords
- occurrence
- word
- screen
- text data
- occurrence network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Creation or modification of classes or clusters
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
Description
本発明は、テキストマイニングに関し、特に、単語の共起ネットワークを含む画面を表示するテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置に関する。 The present invention relates to text mining, and more particularly to a text mining method for displaying a screen including a co-occurrence network of words, a text mining program, and a text mining device.
近年、自由記述されたテキストデータを分析し、分析結果から有用な情報を求めるテキストマイニングが注目されている。テキストマイニングでは、例えば、分析対象のテキストデータから単語を抽出し、単語の出現頻度や出現傾向などを解析することにより、情報を求める。 In recent years, text mining, which analyzes freely described text data and seeks useful information from the analysis results, has attracted attention. In text mining, for example, words are extracted from the text data to be analyzed, and information is obtained by analyzing the appearance frequency and appearance tendency of the words.
自由記述されたテキストデータを分析するときには、分析者は、初期段階では対象を主観的に選択するのではなく、テキストデータの全体像を把握する必要がある。このため、分析者は、テキストデータに含まれる単語の共起ネットワークを用いることがある。 When analyzing freely written text data, the analyst needs to get an overall picture of the text data rather than subjectively selecting the target at the initial stage. For this reason, the analyst may use a co-occurrence network of words contained in the text data.
図19は、共起ネットワークの例を示す図である。共起ネットワークは、テキストデータから同じ文に含まれることが多い単語のペアを抽出し、その結果を無向グラフで表現したものである。分析対象のテキストデータにおいて単語Waと単語Wbが同じ文に含まれることが多い場合、共起ネットワークには、単語Waに対応するノード、単語Wbに対応するノード、および、両者を接続するエッジが含まれる。図19に示す共起ネットワークは、「スタッフ」に対応するノード、「対応」に対応するノード、および、両者を接続するエッジを含んでいる。図19に示す共起ネットワークを見れば、分析対象のテキストデータでは「スタッフ」と「対応」が同じ文に含まれることが多いことが分かる。 FIG. 19 is a diagram showing an example of a co-occurrence network. The co-occurrence network extracts a pair of words that are often included in the same sentence from text data, and expresses the result in an undirected graph. When the word Wa and the word Wb are often included in the same sentence in the text data to be analyzed, the co-occurrence network has a node corresponding to the word Wa, a node corresponding to the word Wb, and an edge connecting the two. included. The co-occurrence network shown in FIG. 19 includes a node corresponding to "staff", a node corresponding to "correspondence", and an edge connecting both. Looking at the co-occurrence network shown in FIG. 19, it can be seen that in the text data to be analyzed, "staff" and "correspondence" are often included in the same sentence.
一般に、共起ネットワークは、指定されたテキストデータの全体に基づき生成される。以下、このような共起ネットワークを「全体共起ネットワーク」という。分析者は、自分が立てた仮説や分析目的に応じて全体共起ネットワークから注目すべき単語(以下、注目語という)を複数個選択し、注目語を考慮して以降の分析を行う。 Generally, co-occurrence networks are generated based on the entire specified text data. Hereinafter, such a co-occurrence network is referred to as a "whole co-occurrence network". The analyst selects a plurality of notable words (hereinafter referred to as notable words) from the whole co-occurrence network according to the hypothesis and the analysis purpose set by the analyst, and performs the subsequent analysis in consideration of the notable words.
分析者は、注目語を選択するときに、選択した注目語が分析目的などに適しているか否かを判断するために、注目語を含む文の中で注目語がどのように使われているかを考察する。このため、分析者は、指定されたテキストデータのうち注目語を含む文からなるテキストデータ(以下、限定テキストデータという)に基づく共起ネットワークを用いることがある。なお、ここで言う「注目語を含む文」は、注目語を含む単一の文を意味する場合だけでなく、注目語を含む文を包含する段落など、ブロック単位に分割された複数の文(文の集合)を意味する場合がある。以下、このような共起ネットワークを「限定共起ネットワーク」という。分析者は、限定共起ネットワークを用いることにより、限定テキストデータの内容を把握することができる。分析者は、すべての注目語を選択するまで、全体共起ネットワークと限定共起ネットワークを繰り返し参照する。 When an analyst selects a attention word, how the attention word is used in a sentence containing the attention word in order to determine whether or not the selected attention word is suitable for an analysis purpose or the like. Consider. For this reason, the analyst may use a co-occurrence network based on text data (hereinafter referred to as limited text data) consisting of sentences including a word of interest in the designated text data. The "sentence including the attention word" here means not only a single sentence including the attention word but also a plurality of sentences divided into block units such as a paragraph containing the sentence including the attention word. May mean (a set of sentences). Hereinafter, such a co-occurrence network is referred to as a "limited co-occurrence network". The analyst can grasp the content of the limited text data by using the limited co-occurrence network. The analyst repeatedly references the whole co-occurrence network and the limited co-occurrence network until all the words of interest are selected.
以下、テキストデータに含まれる単語の共起ネットワークを生成し、生成した共起ネットワークを含む画面を表示するテキストマイニング装置について考える。特許文献1には、複数の文書のそれぞれについて全体共起ネットワークを生成し、生成した複数の全体共起ネットワークを含む画面を表示するドキュメントデータベース表示装置が記載されている。この表示装置は、複数の全体共起ネットワークの中から利用者が入力した単語を検索し、検索した単語を画面内で強調表示する。
Hereinafter, a text mining device that generates a co-occurrence network of words included in text data and displays a screen including the generated co-occurrence network will be considered.
従来のテキストマイニング装置は、指定されたテキストデータの全体に基づき共起ネットワークを生成する。したがって、従来のテキストマイニング装置によれば、全体共起ネットワークを含む画面を容易に表示することができる。 A conventional text mining device creates a co-occurrence network based on the entire specified text data. Therefore, according to the conventional text mining device, the screen including the whole co-occurrence network can be easily displayed.
一方、従来のテキストマイニング装置を用いて限定共起ネットワークを含む画面を表示するときには、分析者は煩雑な操作を行う必要がある。具体的には、分析者は、全体共起ネットワークの中から1個の注目語を選択するたびに、指定されたテキストデータに基づき限定テキストデータを生成し、生成した限定テキストデータをテキストマイニング装置に与える必要がある。また、分析者は、注目語を選択するときに、全体共起ネットワークと限定共起ネットワークの両方を参照する。このため、テキストマイニング装置は、全体共起ネットワークの画像データと限定共起ネットワークの画像データの両方を保存する必要がある。しかし、多くの共起ネットワークを生成した場合、画像データの保存と管理が困難になる。 On the other hand, when displaying a screen including a limited co-occurrence network using a conventional text mining device, the analyst needs to perform complicated operations. Specifically, each time the analyst selects one noteworthy word from the whole co-occurrence network, the analyst generates limited text data based on the specified text data, and the generated limited text data is used as a text mining device. Need to be given to. Also, the analyst refers to both the global co-occurrence network and the limited co-occurrence network when selecting the term of interest. Therefore, the text mining device needs to store both the image data of the whole co-occurrence network and the image data of the limited co-occurrence network. However, when many co-occurrence networks are generated, it becomes difficult to store and manage image data.
それ故に、本発明は、注目語を指定したときの共起ネットワークを含む画面を簡単な操作で表示できるテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置を提供することを目的とする。 Therefore, it is an object of the present invention to provide a text mining method, a text mining program, and a text mining device capable of displaying a screen including a co-occurrence network when a word of interest is specified by a simple operation.
本発明の第1の局面は、テキストデータの分析結果を含む画面を表示するテキストマイニング方法であって、
テキストデータから単語を抽出するステップと、
前記単語について共起行列を生成するステップと、
前記共起行列に基づき共起ネットワークを生成するステップと、
前記共起ネットワークを含む画面を表示するステップとを備え、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語を抽出するステップは前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列を生成するステップは前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワークを生成するステップは前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面を表示するステップは前記第2共起ネットワークを含む第2画面を表示することを特徴とする。
The first aspect of the present invention is a text mining method for displaying a screen including an analysis result of text data.
Steps to extract words from text data,
Steps to generate a co-occurrence matrix for the word,
Steps to generate a co-occurrence network based on the co-occurrence matrix,
A step of displaying a screen including the co-occurrence network is provided.
When an instruction to specify a word of interest is input in the first screen including the first co-occurrence network based on the entire specified text data, the step of extracting the word is described in the specified text data. In the step of extracting the word from the limited text data including the part including the word of interest and generating the co-occurrence matrix, a second co-occurrence matrix is generated for the word using the limited text data, and the co-occurrence network is generated. The generation step is characterized in that a second co-occurrence network is generated based on the second co-occurrence matrix, and the step of displaying the screen is characterized in displaying a second screen including the second co-occurrence network.
本発明の第2の局面は、本発明の第1の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The second aspect of the present invention is the first aspect of the present invention.
By selecting one or more nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction to specify the word corresponding to the node as the attention word is input. It is characterized by that.
本発明の第3の局面は、本発明の第1の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1個のノードを続けて選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The third aspect of the present invention is the first aspect of the present invention.
By continuously selecting one node included in the first co-occurrence network in the first screen, an instruction for designating the word corresponding to the node as the attention word is input. ..
本発明の第4の局面は、本発明の第1の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1本のエッジを続けて選択することにより、前記エッジに接続された2個のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The fourth aspect of the present invention is the first aspect of the present invention.
By continuously selecting one edge included in the first co-occurrence network in the first screen, an instruction to specify a word corresponding to two nodes connected to the edge as the attention word is given. It is characterized by being input.
本発明の第5の局面は、本発明の第1の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、前記エッジに接続された複数のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The fifth aspect of the present invention is the first aspect of the present invention.
By selecting one or more edges included in the first co-occurrence network in the first screen and selecting start analysis, the word corresponding to the plurality of nodes connected to the edge is referred to as the attention word. It is characterized in that the instruction specified as is input.
本発明の第6の局面は、本発明の第1の局面において、
複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面を表示するステップは、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする。
The sixth aspect of the present invention is the first aspect of the present invention.
When a merge instruction is input in a second screen including a plurality of second co-occurrence networks, the step of displaying the screen is characterized in that the plurality of second co-occurrence networks are displayed in a tab format. ..
本発明の第7の局面は、本発明の第6の局面において、
前記第2画面内で一の第2共起ネットワークを掴んで他の第2共起ネットワーク内で離すことにより、前記併合指示が入力されることを特徴とする。
The seventh aspect of the present invention is the sixth aspect of the present invention.
It is characterized in that the merge instruction is input by grasping one second co-occurrence network in the second screen and separating it in another second co-occurrence network.
本発明の第8の局面は、本発明の第1の局面において、
前記限定テキストデータは、前記指定されたテキストデータのうち前記注目語を含む文からなることを特徴とする。
The eighth aspect of the present invention is the first aspect of the present invention.
The limited text data is characterized by consisting of a sentence including the word of interest in the designated text data.
本発明の第9の局面は、本発明の第8の局面において、
複数の注目語が指定されたときの前記限定テキストデータは、前記指定されたテキストデータのうち前記複数の注目語のすべてを含む文からなることを特徴とする。
The ninth aspect of the present invention is the eighth aspect of the present invention.
The limited text data when a plurality of attention words are designated is characterized by comprising a sentence including all of the plurality of attention words among the designated text data.
本発明の第10の局面は、本発明の第8の局面において、
複数の注目語が指定されたときの前記限定テキストデータは、前記指定されたテキストデータのうち前記複数の注目語のいずれかを含む文からなることを特徴とする。
The tenth aspect of the present invention is the eighth aspect of the present invention.
The limited text data when a plurality of attention words are designated is characterized by comprising a sentence including any one of the plurality of attention words among the designated text data.
本発明の第11の局面は、本発明の第1の局面において、
前記共起行列を生成するステップは、Jaccard係数を要素とする共起行列を生成することを特徴とする。
The eleventh aspect of the present invention is the first aspect of the present invention.
The step of generating the co-occurrence matrix is characterized in that a co-occurrence matrix having a Jaccard coefficient as an element is generated.
本発明の第12の局面は、テキストデータの分析結果を含む画面を表示するためのテキストマイニングプログラムであって、
テキストデータから単語を抽出するステップと、
前記単語について共起行列を生成するステップと、
前記共起行列に基づき共起ネットワークを生成するステップと、
前記共起ネットワークを含む画面を表示するステップとをコンピュータにCPUがメモリを利用して実行させ、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語を抽出するステップは前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列を生成するステップは前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワークを生成するステップは前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面を表示するステップは前記第2共起ネットワークを含む第2画面を表示することを特徴とする。
The twelfth aspect of the present invention is a text mining program for displaying a screen including an analysis result of text data.
Steps to extract words from text data,
Steps to generate a co-occurrence matrix for the word,
Steps to generate a co-occurrence network based on the co-occurrence matrix,
The CPU causes the computer to execute the step of displaying the screen including the co-occurrence network by using the memory.
When an instruction to specify a word of interest is input in the first screen including the first co-occurrence network based on the entire specified text data, the step of extracting the word is described in the specified text data. In the step of extracting the word from the limited text data including the part including the word of interest and generating the co-occurrence matrix, a second co-occurrence matrix is generated for the word using the limited text data, and the co-occurrence network is generated. The generation step is characterized in that a second co-occurrence network is generated based on the second co-occurrence matrix, and the step of displaying the screen is characterized in displaying a second screen including the second co-occurrence network.
本発明の第13の局面は、本発明の第12の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The thirteenth aspect of the present invention is the twelfth aspect of the present invention.
By selecting one or more nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction to specify the word corresponding to the node as the attention word is input. It is characterized by that.
本発明の第14の局面は、本発明の第12の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1個のノードを続けて選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The fourteenth aspect of the present invention is the twelfth aspect of the present invention.
By continuously selecting one node included in the first co-occurrence network in the first screen, an instruction for designating the word corresponding to the node as the attention word is input. ..
本発明の第15の局面は、本発明の第12の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1本のエッジを続けて選択することにより、前記エッジに接続された2個のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The fifteenth aspect of the present invention is the twelfth aspect of the present invention.
By continuously selecting one edge included in the first co-occurrence network in the first screen, an instruction to specify a word corresponding to two nodes connected to the edge as the attention word is given. It is characterized by being input.
本発明の第16の局面は、本発明の第12の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、前記エッジに接続された複数のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The sixteenth aspect of the present invention is the twelfth aspect of the present invention.
By selecting one or more edges included in the first co-occurrence network in the first screen and selecting start analysis, the word corresponding to the plurality of nodes connected to the edge is referred to as the attention word. It is characterized in that the instruction specified as is input.
本発明の第17の局面は、本発明の第12の局面において、
複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面を表示するステップは、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする。
The seventeenth aspect of the present invention is the twelfth aspect of the present invention.
When a merge instruction is input in a second screen including a plurality of second co-occurrence networks, the step of displaying the screen is characterized in that the plurality of second co-occurrence networks are displayed in a tab format. ..
本発明の第18の局面は、本発明の第17の局面において、
前記第2画面内で一の第2共起ネットワークを掴んで他の第2共起ネットワーク内で離すことにより、前記併合指示が入力されることを特徴とする。
The eighteenth aspect of the present invention is the seventeenth aspect of the present invention.
It is characterized in that the merge instruction is input by grasping one second co-occurrence network in the second screen and separating it in another second co-occurrence network.
本発明の第19の局面は、テキストデータの分析結果を含む画面を表示するテキストマイニング装置であって、
テキストデータから単語を抽出する単語抽出部と、
前記単語について共起行列を生成する共起行列生成部と、
前記共起行列に基づき共起ネットワークを生成する共起ネットワーク生成部と、
前記共起ネットワークを含む画面を表示する画面表示部とを備え、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語抽出部は前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列生成部は前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワーク生成部は前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面表示部は前記第2共起ネットワークを含む第2画面を表示することを特徴とする。
A nineteenth aspect of the present invention is a text mining device that displays a screen containing analysis results of text data.
A word extractor that extracts words from text data,
A co-occurrence matrix generator that generates a co-occurrence matrix for the word,
A co-occurrence network generation unit that generates a co-occurrence network based on the co-occurrence matrix,
It is provided with a screen display unit that displays a screen including the co-occurrence network.
When an instruction to specify a attention word is input in the first screen including the first co-occurrence network based on the entire specified text data, the word extraction unit uses the attention word in the specified text data. The word is extracted from the limited text data including the portion including, the co-occurrence matrix generation unit generates a second co-occurrence matrix using the limited text data for the word, and the co-occurrence network generation unit generates the first. A second co-occurrence network is generated based on the two co-occurrence matrix, and the screen display unit displays a second screen including the second co-occurrence network.
本発明の第20の局面は、本発明の第19の局面において、
複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面表示部は、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする。
The twentieth aspect of the present invention is the nineteenth aspect of the present invention.
When a merge instruction is input in a second screen including a plurality of second co-occurrence networks, the screen display unit is characterized in that the plurality of second co-occurrence networks are displayed in a tab format.
上記第1、第12または第19の局面によれば、指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、指定されたテキストデータのうち注目語を含む部分に基づく第2共起ネットワークを含む第2画面が表示される。したがって、注目語を指定したときの共起ネットワークを含む画面を簡単な操作で表示することができる。 According to the first, twelfth or nineteenth aspect described above, when an instruction to specify a word of interest is input in the first screen including the first co-occurrence network based on the entire specified text data, the designation is made. A second screen including a second co-occurrence network based on the portion of the text data that contains the word of interest is displayed. Therefore, the screen including the co-occurrence network when the attention word is specified can be displayed by a simple operation.
上記第2または第13の局面によれば、第1画面内で1個または複数のノードと分析開始を選択することにより、1個または複数の注目語を指定する指示を簡単な操作で入力し、1個または複数の注目語を指定したときの共起ネットワークを含む画面を表示することができる。 According to the second or thirteenth aspect, the instruction to specify one or more attention words is input by a simple operation by selecting one or more nodes and the analysis start in the first screen. It is possible to display a screen including a co-occurrence network when one or more attention words are specified.
上記第3または第14の局面によれば、第1画面内で1個のノードを続けて選択することにより、1個の注目語を指定する指示を簡単な操作で入力し、1個の注目語を指定したときの共起ネットワークを含む画面を表示することができる。 According to the third or fourteenth aspect, by continuously selecting one node in the first screen, an instruction to specify one attention word is input by a simple operation, and one attention is given. A screen containing the co-occurrence network when a word is specified can be displayed.
上記第4または第15の局面によれば、第1画面内で1本のエッジを続けて選択することにより、2個の注目語を指定する指示を簡単な操作で入力し、2個の注目語を指定したときの共起ネットワークを含む画面を表示することができる。 According to the fourth or fifteenth aspect, by continuously selecting one edge in the first screen, an instruction to specify two attention words is input by a simple operation, and two attentions are given. A screen containing the co-occurrence network when a word is specified can be displayed.
上記第5または第16の局面によれば、第1画面内で1本または複数のエッジと分析開始を選択することにより、複数の注目語を指定する指示を簡単な操作で入力し、複数の注目語を指定したときの共起ネットワークを含む画面を表示することができる。 According to the fifth or sixteenth aspect, by selecting one or more edges and the start of analysis in the first screen, instructions for designating a plurality of attention words can be input by a simple operation, and a plurality of edges can be input. It is possible to display a screen including the co-occurrence network when the attention word is specified.
上記第6、第17または第20の局面によれば、併合指示が入力されたときに複数の第2共起ネットワークをタブ形式で表示することにより、複数の第2共起ネットワークをコンパクトに表示することができる。 According to the sixth, 17th, or twentieth aspect, the plurality of second co-occurrence networks are displayed compactly by displaying the plurality of second co-occurrence networks in a tab format when the merge instruction is input. can do.
上記第7または第18の局面によれば、第2画面内で第2共起ネットワークを掴んで離すことにより、併合指示を簡単な操作で入力し、複数の第2共起ネットワークをコンパクトに表示することができる。 According to the seventh or eighteenth aspect, by grasping and releasing the second co-occurrence network in the second screen, a merge instruction can be input with a simple operation, and a plurality of second co-occurrence networks can be displayed compactly. can do.
上記第8の局面によれば、注目語を指定する指示が入力されたときに、指定されたテキストデータを文単位で分けて限定テキストデータを求め、求めた限定テキストデータに基づく第2共起ネットワークを含む画面を表示することができる。 According to the eighth aspect, when the instruction to specify the attention word is input, the specified text data is divided into sentence units to obtain the limited text data, and the second co-occurrence based on the obtained limited text data. A screen including the network can be displayed.
上記第9または第10の局面によれば、複数の注目語についてAND処理またはOR処理を行ったときの第2共起ネットワークを含む画面を表示することができる。 According to the ninth or tenth aspect, it is possible to display a screen including the second co-occurrence network when AND processing or OR processing is performed on a plurality of notable words.
上記第11の局面によれば、Jaccard係数を要素とする共起行列を生成することにより、テキストデータに含まれる単語の共起性を好適に分析することができる。 According to the eleventh aspect, the co-occurrence of words contained in the text data can be suitably analyzed by generating a co-occurrence matrix having a Jaccard coefficient as an element.
以下、図面を参照して、本発明の実施形態に係るテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置について説明する。本実施形態に係るテキストマイニング方法は、典型的にはコンピュータを用いて実行される。本実施形態に係るテキストマイニングプログラムは、コンピュータを用いてテキストマイニング方法を実施するためのプログラムである。本実施形態に係るテキストマイニング装置は、典型的にはコンピュータを用いて構成される。テキストマイニングプログラムを実行するコンピュータは、テキストマイニング装置として機能する。 Hereinafter, the text mining method, the text mining program, and the text mining apparatus according to the embodiment of the present invention will be described with reference to the drawings. The text mining method according to the present embodiment is typically performed using a computer. The text mining program according to the present embodiment is a program for implementing a text mining method using a computer. The text mining device according to the present embodiment is typically configured by using a computer. The computer that executes the text mining program functions as a text mining device.
図1は、本発明の実施形態に係るテキストマイニング装置の構成を示すブロック図である。図1に示すテキストマイニング装置10は、指示入力部11、テキストデータ記憶部12、単語抽出部13、共起行列生成部14、共起ネットワーク生成部15、および、画面表示部16を備えている。テキストマイニング装置10は、テキストデータ記憶部12に記憶されたテキストデータに基づきテキストデータの分析結果として共起ネットワークを生成し、生成した共起ネットワークを含む画面を表示する。
FIG. 1 is a block diagram showing a configuration of a text mining device according to an embodiment of the present invention. The
テキストマイニング装置10の動作の概要は、以下のとおりである。指示入力部11には、利用者(テキストデータの分析者)からの指示が入力される。テキストデータ記憶部12は、自由記述された1以上のテキストデータを記憶している。単語抽出部13は、テキストデータ記憶部12から指定されたテキストデータを読み出し、読み出したテキストデータに対して形態素解析を行うことにより、テキストデータから単語を抽出する。共起行列生成部14は、単語抽出部13で抽出された単語について共起行列を生成する。共起ネットワーク生成部15は、共起行列生成部14で生成された共起行列に基づき共起ネットワークを生成する。画面表示部16は、共起ネットワーク生成部15で生成された共起ネットワークを含む画面を表示する。
The outline of the operation of the
利用者は、指示入力部11を用いて、分析対象のテキストデータを指定する指示、注目語を指定する指示などを入力する。単語抽出部13、共起ネットワーク生成部15、および、画面表示部16は、利用者からの指示に従い、共起ネットワークを含む画面を表示するための動作を行う。テキストデータを指定する指示が入力されたときには、指定されたテキストデータの全体に基づく全体共起ネットワークが生成され、全体共起ネットワークを含む画面が表示される。全体共起ネットワークを含む画面内で注目語を指定する指示が入力されたときには、指定されたテキストデータのうち注目語を含む文に基づく限定共起ネットワークが生成され、限定共起ネットワークを含む画面が表示される。
The user inputs an instruction for designating the text data to be analyzed, an instruction for designating a word of interest, and the like by using the
図2は、テキストマイニング装置10として機能するコンピュータの構成を示すブロック図である。図2に示すコンピュータ20は、CPU21、メインメモリ22、記憶部23、入力部24、表示部25、通信部26、および、記録媒体読み取り部27を備えている。メインメモリ22には、例えば、DRAMが使用される。記憶部23には、例えば、ハードディスクやソリッドステートドライブが使用される。入力部24には、例えば、キーボード28やマウス29が含まれる。表示部25には、例えば、液晶ディスプレイが使用される。通信部26は、有線通信または無線通信のインターフェイス回路である。記録媒体読み取り部27は、プログラムなどを記憶した記録媒体30のインターフェイス回路である。記録媒体30には、例えば、CD−ROM、DVD−ROM、USBメモリなどの非一過性の記録媒体が使用される。
FIG. 2 is a block diagram showing a configuration of a computer functioning as a
コンピュータ20がテキストマイニングプログラム31を実行する場合、記憶部23は、テキストマイニングプログラム31とテキストデータ32を記憶する。テキストマイニングプログラム31とテキストデータ32は、例えば、サーバや他のコンピュータから通信部26を用いて受信したものでもよく、記録媒体30から記録媒体読み取り部27を用いて読み出したものでもよい。
When the
テキストマイニングプログラム31を実行するときには、テキストマイニングプログラム31とテキストデータ32はメインメモリ22に複写転送される。CPU21は、メインメモリ22を作業用メモリとして利用して、メインメモリ22に記憶されたテキストマイニングプログラム31を実行することにより、テキストデータ32から単語を抽出する処理、抽出した単語について共起行列を生成する処理、生成した共起行列に基づき共起ネットワークを生成する処理、生成した共起ネットワークを含む画面を表示する処理などを行う。このときコンピュータ20は、テキストマイニング装置10として機能する。なお、以上に述べたコンピュータ20の構成は一例に過ぎず、任意のコンピュータを用いてテキストマイニング装置10を構成することができる。
When the
図3は、テキストマイニング装置10の動作を示すフローチャートである。図3に示す動作を行う前に、テキストデータ記憶部12は自由記述された1以上のテキストデータを記憶している。各テキストデータは、複数の文を含んでいる。テキストマイニング装置10は、テキストデータ記憶部12に記憶されたテキストデータのうちで利用者が指定したテキストデータに対して処理を行う。
FIG. 3 is a flowchart showing the operation of the
図3において、指示入力部11は、まず利用者からテキストデータを指定する指示を受け取る(ステップS101)。このとき、指示入力部11は、テキストデータを指定する指示に加えて、共起行列の基準値(詳細は後述)を設定する指示、AND処理とOR処理(詳細は後述)を切り替える指示、共起ネットワークの表示態様の詳細を設定する指示などを受け取ってもよい。受け取った指示は、テキストマイニング装置10の各部に対して出力される。
In FIG. 3, the
次に、単語抽出部13は、テキストデータ記憶部12から指定されたテキストデータを読み出す(ステップS102)。次に、単語抽出部13は、ステップS102で読み出したテキストデータに対して形態素解析を行うことにより、読み出したテキストデータから単語を抽出する(ステップS103)。このとき、単語抽出部13は、読み出したテキストデータから、後の分析で必要となる単語だけを抽出する。次に、共起行列生成部14は、ステップS103で抽出された単語について、ステップS102で読み出されたテキストデータを用いて共起行列を生成する(ステップS104)。
Next, the
図4は、共起行列生成部14で生成された共起行列の例を示す図である。共起行列の要素は、単語のペアについて求めたJaccard係数である。分析対象のテキストデータについて、単語Waを含む文の集合をA、単語Wbを含む文の集合をBとする。単語のペア(Wa,Wb)についてのJaccard係数K(Wa,Wb)は、次式(1)で与えられる。
K(Wa,Wb)=|A∩B|/|A∪B| …(1)
ただし、式(1)において、記号∩は積集合を求める演算を表し、記号∪は和集合を求める演算を表し、|S|は集合Sに含まれる要素の個数を表す。
FIG. 4 is a diagram showing an example of a co-occurrence matrix generated by the co-occurrence
K (Wa, Wb) = | A∩B | / | A∪B |… (1)
However, in the equation (1), the symbol ∩ represents an operation for obtaining an intersection, the symbol ∪ represents an operation for obtaining a union, and | S | represents the number of elements included in the set S.
共起行列生成部14は、ステップS104において、ステップS102で読み出されたテキストデータの全体から抽出された単語のペアのすべてについてJaccard係数を求め、求めたJaccard係数を要素とする共起行列を生成する。共起行列の行および列は、ステップS102で読み出されたテキストデータの全体から抽出された単語の種類に対応する。読み出されたテキストデータの全体からn種類の単語が抽出されたとき、ステップS104で生成される共起行列は、対角要素がすべて1であるn行n列の対称行列である。
In step S104, the co-occurrence
なお、共起行列生成部14は、テキストデータを文以外の単位で分けてJaccard係数を求めてもよい。例えば、共起行列生成部14は、単語Waを含む段落の集合をA、単語Wbを含む段落の集合をBとして、式(1)に従いJaccard係数を求めてもよい。また、テキストデータに含まれる文が日付を有する場合には、共起行列生成部14は、テキストデータを同じ日付を有する文からなる複数の部分に分け、単語Waを含む部分の集合をA、単語Wbを含む部分の集合をBとして、式(1)に従いJaccard係数を求めてもよい。また、共起行列生成部14は、単語の共起性を示す他の値(例えば、Simpson係数やコサイン距離など)を要素として含む共起行列を生成してもよい。
The co-occurrence
次に、共起ネットワーク生成部15は、ステップS104で生成された共起行列に基づき、全体共起ネットワークを生成する(ステップS105)。次に、画面表示部16は、ステップS105で生成された全体共起ネットワークを含む画面を表示する(ステップS106)。図5は、ステップS106で表示される、全体共起ネットワークを含むウインドウの例を示す図である。図5に示すウインドウ41は、全体共起ネットワーク51と分析ボタン61を含んでいる。分析ボタン61は、分析開始を指示するために設けられる。
Next, the co-occurrence
共起ネットワーク生成部15は、共起行列の基準値(以下、Vとする)を有している。基準値Vは、予め決定された値でもよく、指示入力部11を用いて利用者から設定された値でもよい。ステップS104で生成された共起行列において、単語Waに対応する行に含まれるJaccard係数K(Wa,*)の最大値が基準値V以上である場合、共起ネットワーク生成部15は単語Waに対応するノード(単語Waと記載したノード)を全体共起ネットワークに含める。また、ステップS104で生成された共起行列において、単語のペア(Wa,Wb)に係るJaccard係数K(Wa,Wb)が基準値V以上である場合、共起ネットワーク生成部15は単語Waに対応するノードと単語Wbに対応するノードとを接続するエッジを全体共起ネットワークに含める。
The co-occurrence
図5に示す全体共起ネットワーク51では、出現頻度が大きい単語に対応するノードは大きく表示されている。共起ネットワークを含む画面を表示するときに、Jaccard係数K(Wa,Wb)が大きいときに、単語Waに対応するノードと単語Wbに対応するノードとを接続するエッジを太く表示してもよい。また、Jaccard係数に応じて、エッジの色を切り替えてもよく、エッジの太さと色の両方を切り替えてもよい。共起ネットワークは、エッジを介して到達可能な複数の部分に分けられる。共起ネットワークを含む画面を表示するときに、各部分に含まれる複数のノードを各部分に割り当てた色で表示してもよい。なお、共起ネットワークに含まれるノードとエッジの位置に意味はない。
In the
次に、指示入力部11は、利用者から注目語を指定する指示を受け取る(ステップS111)。ステップS111を実行するときには、全体共起ネットワークを含む画面が表示されている。利用者は、マウス29を操作して、全体共起ネットワークの要素を選択することにより、注目語を指定する指示を入力する。なお、利用者は、指示を入力するときに、マウス29に代えてキーボード28を用いてもよく、表示画面に直接触れるなどの操作を行ってもよい。以下、ステップS111を実行するときに、図5に示すウインドウ41を含む画面が表示されているとする。
Next, the
図6〜図11は、それぞれ、ウインドウ41内で注目語を指定する第1〜第6の操作を示す図である。図6〜図11において、吹き出しは操作の手順を示し、白い矢印はマウスカーソル62の移動を示す。吹き出しおよび矢印は、実際の画面には表示されない。以下、マウスカーソル62が表示画面内のある要素の上にあるときにマウス29のボタンをクリック(ダブルクリック)することを「要素をクリック(ダブルクリック)する」という。
6 to 11 are diagrams showing the first to sixth operations for designating a word of interest in the
図6に示すように、利用者は、ウインドウ41内でまず注目語として指定する単語(ここでは「露天風呂」)に対応するノードをクリックし(1回目のクリック)、次に分析ボタン61をクリックする(2回目のクリック)。この操作により、1回目にクリックされたノードに対応する単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる1個のノードを選択し、分析開始を選択することにより、1個の注目語を指定する指示が入力される。
As shown in FIG. 6, the user first clicks the node corresponding to the word (here, “open-air bath”) specified as the word of interest in the window 41 (first click), and then clicks the
図7に示すように、利用者は、ウインドウ41内で注目語として指定する単語(ここでは「露天風呂」)に対応するノードをダブルクリックする。この操作により、ダブルクリックされたノードに対応する単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる1個のノードを続けて選択することにより、1個の注目語を指定する指示が入力される。
As shown in FIG. 7, the user double-clicks the node corresponding to the word designated as the attention word (here, “open-air bath”) in the
図8に示すように、利用者は、ウインドウ41内でまず注目語として指定する単語(ここでは「露天風呂」)に対応するノードをクリックし(1回目のクリック)、次に注目語として指定する別の単語(ここでは「値段」)に対応するノードをクリックし(2回目のクリック)、最後に分析ボタン61をクリックする(最後のクリック)。この操作により、1回目と2回目にクリックされたノードに対応する2個の単語が注目語として指定される。利用者は、ウインドウ41内でp個(pは3以上の整数)のノードを順にクリックし、最後に分析ボタン61をクリックしてもよい。この操作により、p個のノードに対応するp個の単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる複数のノードを選択し、分析開始を選択することにより、複数の注目語を指定する指示が入力される。
As shown in FIG. 8, the user first clicks the node corresponding to the word designated as the attention word (here, “open-air bath”) in the window 41 (first click), and then designates it as the attention word. Click the node corresponding to another word (here, "price") (second click), and finally click the analysis button 61 (last click). By this operation, the two words corresponding to the nodes clicked the first time and the second time are designated as the words of interest. The user may click p nodes (p is an integer of 3 or more) in order in the
図9に示すように、利用者は、ウインドウ41内で注目語として指定する2個の単語(ここでは「露天風呂」と「階段」)に対応する2個のノードを接続するエッジをダブルクリックする。これにより、ダブルクリックされたエッジに接続された2個のノードに対応する2個の単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる1個のエッジを続けて選択することにより、2個の注目語を指定する指示が入力される。
As shown in FIG. 9, the user double-clicks the edge connecting the two nodes corresponding to the two words (here, "open-air bath" and "stairs") specified as the words of interest in the
図10に示すように、利用者は、ウインドウ41内でまず注目語として指定する2個の単語(ここでは「露天風呂」と「階段」)に対応する2個のノードを接続するエッジをクリックし(1回目のクリック)、次に分析ボタン61をクリックする(2回目のクリック)。これにより、1回目にクリックされたエッジに接続された2個のノードに対応する2個の単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる1個のエッジを選択し、分析開始を選択することにより、2個の注目語を指定する指示が入力される。
As shown in FIG. 10, the user first clicks on the edge connecting the two nodes corresponding to the two words (here, "open-air bath" and "stairs") designated as the attention words in the
図11に示すように、利用者は、ウインドウ41内でまず注目語として指定する2個の単語(ここでは「露天風呂」と「階段」)に対応する2個のノードを接続するエッジをクリックし(1回目のクリック)、次に注目語として指定する別の2個の単語(ここでは「値段」と「考える」)に対応する2個のノードを接続するエッジをクリックし(2回目のクリック)、最後に分析ボタン61をクリックする(最後のクリック)。この操作により、1回目と2回目にクリックされた2個のエッジに接続された4個のノードに対応する4個の単語が注目語として指定される。利用者は、ウインドウ41内でq本(qは3以上の整数)のエッジを順にクリックし、最後に分析ボタン61をクリックしてもよい。この操作により、q本のエッジに接続された2q個のノードに対応する2q個の単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる複数のエッジを選択し、分析開始を選択することにより、複数の注目語を指定する指示が入力される。
As shown in FIG. 11, the user first clicks on the edge connecting the two nodes corresponding to the two words (here, "open-air bath" and "stairs") designated as the attention words in the
指示入力部11は、ステップS111において、注目語を指定する指示に加えて、共起行列の基準値を設定する指示、AND処理とOR処理を切り替える指示、共起ネットワークの表示態様の詳細を設定する指示などを受け取ってもよい。受け取った指示は、テキストマイニング装置10の各部に対して出力される。
In step S111, the
次に、単語抽出部13は、ステップS102で読み出したテキストデータからステップS111で指定された注目語を含む文を抽出することにより、注目語を含む文からなる限定テキストデータを求める(ステップS112)。
Next, the
単語抽出部13は、複数の注目語が指定された場合にAND処理とOR処理のうちいずれを行うかを示すフラグを有している。フラグの値は、予め決定された値でもよく、指示入力部11を用いて利用者から設定された値でもよい。フラグがAND処理を示す場合、単語抽出部13は、読み出したテキストデータから指定された複数の注目語のすべてを含む文を抽出することにより、限定テキストデータを求める。フラグがOR処理を示す場合、単語抽出部13は、読み出したテキストデータから指定されたいずれかの注目語を含む文を抽出することにより、限定テキストデータを求める。
The
次に、単語抽出部13は、ステップS112で求めた限定テキストデータに対して形態素解析を行うことにより、限定テキストデータから単語を抽出する(ステップS113)。次に、共起行列生成部14は、ステップS113で抽出された単語について、ステップS112で求められた限定テキストデータを用いて共起行列を生成する(ステップS114)。次に、共起ネットワーク生成部15は、ステップS114で生成された共起行列に基づき、限定共起ネットワークを生成する(ステップS115)。なお、ステップS103〜S105とステップS113〜S115の間では、処理対象は異なるが、処理内容は同じである。
Next, the
一般に、ステップS112で求められた限定テキストデータから抽出される単語の種類は、ステップS102で読み出されたテキストデータから抽出される単語の種類よりも少ない。ステップS114で生成された共起行列は、ステップS104で生成された共起行列とは異なる。ステップS115で生成された限定共起ネットワークは、ステップS105で生成された全体共起ネットワークとは異なる。 Generally, the types of words extracted from the limited text data obtained in step S112 are smaller than the types of words extracted from the text data read in step S102. The co-occurrence matrix generated in step S114 is different from the co-occurrence matrix generated in step S104. The limited co-occurrence network generated in step S115 is different from the whole co-occurrence network generated in step S105.
次に、画面表示部16は、ステップS115で生成された限定共起ネットワークを含む画面を表示する(ステップS116)。図12および図13は、ステップS116で表示される、限定共起ネットワークを含むウインドウの例を示す図である。図12に示すウインドウ42は、1個の注目語(ここでは「露天風呂」)を指定したときの限定共起ネットワーク52を含んでいる。図13に示すウインドウ43は、2個の注目語(ここでは「露天風呂」と「浴場」)を指定したときの限定共起ネットワーク53を含んでいる。
Next, the
図14および図15は、テキストマイニング装置10の表示画面の例を示す図である。画面表示部16は、全体共起ネットワークを含むウインドウと限定共起ネットワークを含むウインドウとを重ねずに並べて表示してもよく、両者を重ねて表示してもよい。図14に示す画面71では、全体共起ネットワーク51を含むウインドウ41と限定共起ネットワーク52を含むウインドウ42とは、重ねずに並べて表示されている。利用者は、画面71において、全体共起ネットワーク51と限定共起ネットワーク52を同時に見ることができる。図15に示す画面72では、限定共起ネットワーク52を含むウインドウ42は、全体共起ネットワーク51を含むウインドウ41に重ねて表示されている。利用者は、画面72において、全体共起ネットワーク51と限定共起ネットワーク52を切り替えて見ることができる。
14 and 15 are diagrams showing an example of a display screen of the
次に、指示入力部11は、利用者から指示を受け取る(ステップS121)。次に、テキストマイニング装置10は、ステップS121で受け取った指示が注目語を指定する指示か否かを判断する(ステップS122)。ステップS122でYesの場合、テキストマイニング装置10の制御はステップS112へ進む。この場合、ステップS121で指定された注目語についてステップS112〜S116が実行され、ステップS121で指定された注目語を含む文からなる限定テキストデータに基づく限定共起ネットワークを含む画面が表示される。
Next, the
図16は、テキストマイニング装置10の表示画面の例を示す図である。図16に示す画面73では、全体共起ネットワーク51を含むウインドウ41と限定共起ネットワーク52を含むウインドウ42とに重ねて、注目語として「浴場」を指定したときの限定共起ネットワーク54を含むウインドウ44が表示されている。画面73は、ステップS111で「露天風呂」を注目語として指定し、ステップS121で「浴場」を注目語として指定したときに表示される。利用者は、画面73において、全体共起ネットワーク51と限定共起ネットワーク52、54を切り替えて見ることができる。
FIG. 16 is a diagram showing an example of a display screen of the
ステップS122でNoの場合、テキストマイニング装置10の制御はステップS123へ進む。この場合、ステップS121で受け取った指示は、例えば、ウインドウを移動させる指示、ウインドウを非表示にする指示、ウインドウを閉じる指示、ウインドウを併合する指示などである。利用者は、全体共起ネットワークと限定共起ネットワークを含む画面が表示されているときに指示入力部11を操作することにより、これらの指示を入力する。画面表示部16は、ステップS121で受け取った指示に従い、更新後の画面を表示する(ステップS123)。その後、テキストマイニング装置10の制御は、ステップS121へ進む。
If No in step S122, the control of the
図17は、ウインドウを併合する操作を示す図である。図17に示す画面74には、「露天風呂」を注目語として指定したときの限定共起ネットワーク52を含むウインドウ42と、「浴場」を注目語として指定したときの限定共起ネットワーク54を含むウインドウ44とが表示されている。利用者は、画面74において、2個の限定共起ネットワーク52、54を同時に見ることができる。
FIG. 17 is a diagram showing an operation of merging windows. The
図17に示すハッチング付き矢印は、マウス29のボタンが押された状態でマウスカーソル62が移動したことを示す。この矢印は、実際の画面には表示されない。利用者は、画面74内で限定共起ネットワーク52を掴んで限定共起ネットワーク54内で離す操作(ドロップ操作)を行う。より詳細には、利用者は、マウスカーソル62がウインドウ42内にあるときにマウス29のボタンを押し、マウス29のボタンを押したままでマウスカーソル62をウインドウ44内まで移動させて、マウスカーソル62がウインドウ44内にあるときにマウス29のボタンを離す。この操作により、ウインドウを併合する指示が入力される。
The hatched arrow shown in FIG. 17 indicates that the
図18は、図17に示す操作を行った後の表示画面を示す図である。図18に示す画面75には、複数の限定共起ネットワークをタブ形式で表示するウインドウ45が表示されている。図18では、「露天風呂」と記載したタブ64が選択され、ウインドウ45には「露天風呂」を注目語として指定したときの限定共起ネットワーク52が表示されている。「浴場」と記載したタブ63が選択されたときには、ウインドウ45には図17に示す限定共起ネットワーク54が表示される。
FIG. 18 is a diagram showing a display screen after performing the operation shown in FIG. On the
利用者がウインドウ45内の閉じるボタン(×印)をクリックしたときに、ウインドウ45は閉じる。利用者がタブ63内の閉じるボタンをクリックしたときには、タブ63は表示されなくなる。利用者がタブ64内の閉じるボタンをクリックしたときには、タブ64は表示されなくなり、ウインドウ45には限定共起ネットワーク54が表示される。
When the user clicks the close button (x mark) in the
以上に示すように、本実施形態に係るテキストマイニング方法は、テキストデータから単語を抽出するステップ(ステップS102、S103、S112、S113)と、抽出した単語について共起行列を生成するステップ(ステップS104、S114)と、生成した共起行列に基づき共起ネットワークを生成するステップ(ステップS105、S115)と、共起ネットワークを含む画面を表示するステップ(ステップS106、S116)とを備えている。指定されたテキストデータの全体に基づく第1共起ネットワーク(全体共起ネットワーク51)を含む第1画面(ウインドウ41を含む画面)内で注目語を指定する指示が入力されたときに、単語を抽出するステップ(ステップS112、S113)は指定されたテキストデータのうち注目語を含む部分(注目語を含む文)からなる限定テキストデータから単語を抽出し、共起行列を生成するステップ(ステップS114)は抽出した単語について限定テキストデータを用いて第2共起行列を生成し、共起ネットワークを生成するステップ(ステップS115)は第2共起行列に基づき第2共起ネットワーク(限定共起ネットワーク52〜54)を生成し、画面を表示するステップ(ステップS116)は第2共起ネットワークを含む第2画面(ウインドウ42〜45を含む画面)を表示する。このように本実施形態に係るテキストマイニング方法では、指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、指定されたテキストデータのうち注目語を含む部分に基づく第2共起ネットワークを含む第2画面が表示される。したがって、注目語を指定したときの共起ネットワークを含む画面を簡単な操作で表示することができる。
As described above, in the text mining method according to the present embodiment, a step of extracting words from text data (steps S102, S103, S112, S113) and a step of generating a co-occurrence matrix for the extracted words (step S104). , S114), a step of generating a co-occurrence network based on the generated co-occurrence matrix (steps S105 and S115), and a step of displaying a screen including the co-occurrence network (steps S106 and S116). When an instruction to specify a word of interest is input in the first screen (screen including the window 41) including the first co-occurrence network (total co-occurrence network 51) based on the entire specified text data, the word is input. The extraction step (steps S112 and S113) is a step (step S114) of extracting a word from the limited text data consisting of a portion including the attention word (sentence including the attention word) in the designated text data and generating a co-occurrence matrix. ) Generates a second co-occurrence matrix using limited text data for the extracted word, and the step of generating a co-occurrence network (step S115) is a second co-occurrence network (limited co-occurrence network) based on the second co-occurrence matrix. The step of generating 52 to 54) and displaying the screen (step S116) displays the second screen (
また、第1画面内で第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、ノードに対応する単語を注目語として指定する指示が入力される(図6、図8)。このように第1画面内で1個または複数のノードと分析開始を選択することにより、1個または複数の注目語を指定する指示を簡単な操作で入力し、1個または複数の注目語を指定したときの共起ネットワークを含む画面を表示することができる。また、第1画面内で第1共起ネットワークに含まれる1個のノードを続けて選択することにより、ノードに対応する単語を注目語として指定する指示が入力される(図7)。このように第1画面内で1個のノードを続けて選択することにより、1個の注目語を指定する指示を簡単な操作で入力し、1個の注目語を指定したときの共起ネットワークを含む画面を表示することができる。 In addition, by selecting one or more nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction to specify the word corresponding to the node as the word of interest is input (). 6 and 8). By selecting one or more nodes and start analysis in the first screen in this way, you can easily enter instructions to specify one or more attention words, and one or more attention words can be selected. A screen including the co-occurrence network at the specified time can be displayed. Further, by continuously selecting one node included in the first co-occurrence network in the first screen, an instruction to specify the word corresponding to the node as the word of interest is input (FIG. 7). By selecting in this way continues to one of the nodes in the first screen, co-occurrence network when inputs an instruction to specify one noteworthy by a simple operation, specifying one noteworthy Can display screens that include.
また、第1画面内で第1共起ネットワークに含まれる1本のエッジを続けて選択することにより、エッジに接続された2個のノードに対応する単語を注目語として指定する指示が入力される(図9)。このように第1画面内で1本のエッジを続けて選択することにより、2個の注目語を指定する指示を簡単な操作で入力し、2個の注目語を指定したときの共起ネットワークを含む画面を表示することができる。また、第1画面内で第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、エッジに接続された複数のノードに対応する単語を注目語として指定する指示が入力される(図10、図11)。このように第1画面内で1本または複数のエッジと分析開始を選択することにより、複数の注目語を指定する指示を簡単な操作で入力し、複数の注目語を指定したときの共起ネットワークを含む画面を表示することができる。
In addition, by continuously selecting one edge included in the first co-occurrence network in the first screen, an instruction to specify the word corresponding to the two nodes connected to the edge as the word of interest is input. (Fig. 9). By continuously selecting one edge in the first screen in this way, an instruction to specify two attention words can be input with a simple operation, and a co-occurrence network when two attention words are specified. Can display screens that include. Also, by selecting one or more edges included in the first co-occurrence network in the first screen and selecting start analysis, the words corresponding to the multiple nodes connected to the edges are specified as the words of interest. Instructions to be input are input (FIGS. 10 and 11). By selecting one or more edges and the start of analysis in the first screen in this way, an instruction to specify multiple attention words can be input with a simple operation, and co-occurrence when multiple attention words are specified. You can display a screen that includes the network.
また、複数の第2共起ネットワーク(限定共起ネットワーク52、54)を含む第2画面(画面74)内で併合指示が入力されたときに(図17)、画面を表示するステップは、複数の第2共起ネットワークをタブ形式で表示する(図18)。これにより、複数の第2共起ネットワークをコンパクトに表示することができる。また、第2画面内で一の第2共起ネットワーク(限定共起ネットワーク52)を掴んで他の第2共起ネットワーク(限定共起ネットワーク54)内で離すことにより、併合指示が入力される。したがって、併合指示を簡単な操作で入力し、複数の第2共起ネットワークをコンパクトに表示することができる。
Further, when the merge instruction is input in the second screen (screen 74) including the plurality of second co-occurrence networks (
限定テキストデータは、指定されたテキストデータのうち注目語を含む文から構成されていてもよい。この場合、注目語を指定する指示が入力されたときに、指定されたテキストデータを文単位で分けて限定テキストデータを求め、求めた限定テキストデータに基づく第2共起ネットワークを含む画面を表示することができる。複数の注目語が指定されたときの限定テキストデータは、指定されたテキストデータのうち複数の注目語のすべてを含む文から構成されていてもよい。この場合、複数の注目語についてAND処理を行ったときの第2共起ネットワークを含む画面を表示することができる。複数の注目語が指定されたときの限定テキストデータは、指定されたテキストデータのうち複数の注目語のいずれかを含む文から構成されていてもよい。この場合、複数の注目語についてOR処理を行ったときの第2共起ネットワークを含む画面を表示することができる。また、共起行列を生成するステップは、Jaccard係数を要素とする共起行列を生成する。したがって、テキストデータに含まれる単語の共起性を好適に分析することができる。 The limited text data may be composed of sentences including the word of interest in the designated text data. In this case, when an instruction to specify a word of interest is input, the specified text data is divided into sentence units to obtain limited text data, and a screen including the second co-occurrence network based on the obtained limited text data is displayed. can do. The limited text data when a plurality of attention words are specified may be composed of a sentence including all of the plurality of attention words in the specified text data. In this case, it is possible to display a screen including the second co-occurrence network when AND processing is performed on a plurality of attention words. The limited text data when a plurality of attention words are specified may be composed of a sentence including any one of the plurality of attention words among the specified text data. In this case, it is possible to display a screen including the second co-occurrence network when OR processing is performed on a plurality of attention words. Further, the step of generating a co-occurrence matrix generates a co-occurrence matrix having a Jaccard coefficient as an element. Therefore, the co-occurrence of words contained in the text data can be suitably analyzed.
本実施形態に係るテキストマイニング装置10およびテキストマイニングプログラム31は、上記のテキストマイニング方法と同様の特徴を有し、同様の効果を奏する。本実施形態に係るテキストマイニング方法、テキストマイニング装置10、および、テキストマイニングプログラム31によれば、注目語を指定したときの共起ネットワークを含む画面を簡単な操作で表示することができる。
The
10…テキストマイニング装置
11…指示入力部
12…テキストデータ記憶部
13…単語抽出部
14…共起行列生成部
15…共起ネットワーク生成部
16…画面表示部
20…コンピュータ
21…CPU
22…メインメモリ
29…マウス
30…記録媒体
31…テキストマイニングプログラム
32…テキストデータ
41〜45…ウインドウ
51…全体共起ネットワーク
52〜54…限定共起ネットワーク
61…分析ボタン
62…マウスカーソル
63〜64…タブ
71〜75…画面
10 ...
22 ...
Claims (20)
テキストデータから単語を抽出するステップと、
前記単語について共起行列を生成するステップと、
前記共起行列に基づき共起ネットワークを生成するステップと、
前記共起ネットワークを含む画面を表示するステップとを備え、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語を抽出するステップは前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列を生成するステップは前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワークを生成するステップは前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面を表示するステップは前記第2共起ネットワークを含む第2画面を表示することを特徴とする、テキストマイニング方法。 It is a text mining method that displays a screen containing the analysis results of text data.
Steps to extract words from text data,
Steps to generate a co-occurrence matrix for the word,
Steps to generate a co-occurrence network based on the co-occurrence matrix,
A step of displaying a screen including the co-occurrence network is provided.
When an instruction to specify a word of interest is input in the first screen including the first co-occurrence network based on the entire specified text data, the step of extracting the word is the step of the specified text data. In the step of extracting the word from the limited text data including the part including the word of interest and generating the co-occurrence matrix, a second co-occurrence matrix is generated for the word using the limited text data, and the co-occurrence network is formed. The generation step generates a second co-occurrence network based on the second co-occurrence matrix, and the step of displaying the screen displays a second screen including the second co-occurrence network. Text mining. Method.
テキストデータから単語を抽出するステップと、
前記単語について共起行列を生成するステップと、
前記共起行列に基づき共起ネットワークを生成するステップと、
前記共起ネットワークを含む画面を表示するステップとをコンピュータにCPUがメモリを利用して実行させ、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語を抽出するステップは前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列を生成するステップは前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワークを生成するステップは前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面を表示するステップは前記第2共起ネットワークを含む第2画面を表示することを特徴とする、テキストマイニングプログラム。 A text mining program for displaying screens containing analysis results of text data.
Steps to extract words from text data,
Steps to generate a co-occurrence matrix for the word,
Steps to generate a co-occurrence network based on the co-occurrence matrix,
The CPU causes the computer to execute the step of displaying the screen including the co-occurrence network by using the memory.
When an instruction to specify a word of interest is input in the first screen including the first co-occurrence network based on the entire specified text data, the step of extracting the word is the step of the specified text data. In the step of extracting the word from the limited text data including the part including the word of interest and generating the co-occurrence matrix, a second co-occurrence matrix is generated for the word using the limited text data, and the co-occurrence network is formed. The generation step generates a second co-occurrence network based on the second co-occurrence matrix, and the step of displaying the screen displays a second screen including the second co-occurrence network. Text mining. program.
テキストデータから単語を抽出する単語抽出部と、
前記単語について共起行列を生成する共起行列生成部と、
前記共起行列に基づき共起ネットワークを生成する共起ネットワーク生成部と、
前記共起ネットワークを含む画面を表示する画面表示部とを備え、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語抽出部は前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列生成部は前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワーク生成部は前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面表示部は前記第2共起ネットワークを含む第2画面を表示することを特徴とする、テキストマイニング装置。 A text mining device that displays a screen containing the analysis results of text data.
A word extractor that extracts words from text data,
A co-occurrence matrix generator that generates a co-occurrence matrix for the word,
A co-occurrence network generation unit that generates a co-occurrence network based on the co-occurrence matrix,
It is provided with a screen display unit that displays a screen including the co-occurrence network.
When an instruction to specify a noteworthy word is input in the first screen including the first co-occurrence network based on the entire designated text data, the word extraction unit uses the designated text data to indicate the noteworthy word. The word is extracted from the limited text data including the portion including, the co-occurrence matrix generation unit generates a second co-occurrence matrix using the limited text data for the word, and the co-occurrence network generation unit generates the first co-occurrence network. A text mining device, characterized in that a second co-occurrence network is generated based on a two co-occurrence matrix, and the screen display unit displays a second screen including the second co-occurrence network.
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018052074A JP6987003B2 (en) | 2018-03-20 | 2018-03-20 | Text mining methods, text mining programs, and text mining equipment |
| KR1020190013093A KR102162779B1 (en) | 2018-03-20 | 2019-01-31 | Text mining method, text mining program and text mining apparatus |
| CN201910096738.5A CN110309290B (en) | 2018-03-20 | 2019-01-31 | Text mining method, text mining program, and text mining device |
| TW108106540A TWI703457B (en) | 2018-03-20 | 2019-02-26 | Text exploration method, text exploration program and text exploration device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018052074A JP6987003B2 (en) | 2018-03-20 | 2018-03-20 | Text mining methods, text mining programs, and text mining equipment |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2019164593A JP2019164593A (en) | 2019-09-26 |
| JP2019164593A5 JP2019164593A5 (en) | 2021-02-18 |
| JP6987003B2 true JP6987003B2 (en) | 2021-12-22 |
Family
ID=68065531
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018052074A Active JP6987003B2 (en) | 2018-03-20 | 2018-03-20 | Text mining methods, text mining programs, and text mining equipment |
Country Status (4)
| Country | Link |
|---|---|
| JP (1) | JP6987003B2 (en) |
| KR (1) | KR102162779B1 (en) |
| CN (1) | CN110309290B (en) |
| TW (1) | TWI703457B (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2024148802A (en) * | 2023-04-06 | 2024-10-18 | 株式会社日立製作所 | Proposal support device, proposal support method, and proposal support program |
Family Cites Families (24)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2806867B2 (en) * | 1995-03-13 | 1998-09-30 | 株式会社トレンディ | Document database construction method, display method, and display device |
| JPH10283367A (en) * | 1997-04-09 | 1998-10-23 | Mitsubishi Electric Corp | Hypermedia device |
| JP4404323B2 (en) * | 1999-02-05 | 2010-01-27 | 経済産業大臣 | Thesaurus browsing system and method |
| JP5059282B2 (en) * | 2003-10-14 | 2012-10-24 | ソニー株式会社 | Information providing system, information providing server, user terminal device, content display device, computer program, and content display method |
| JP2006215936A (en) * | 2005-02-07 | 2006-08-17 | Hitachi Ltd | Search system and search method |
| JP2007193380A (en) * | 2006-01-16 | 2007-08-02 | So-Net Entertainment Corp | Information processing apparatus, information processing method, and computer program |
| JP5534167B2 (en) * | 2009-12-16 | 2014-06-25 | 日本電気株式会社 | Graph creation device, graph creation method, and graph creation program |
| JP5331723B2 (en) * | 2010-02-05 | 2013-10-30 | 株式会社エヌ・ティ・ティ・データ | Feature word extraction device, feature word extraction method, and feature word extraction program |
| US20120066628A1 (en) * | 2010-09-09 | 2012-03-15 | Microsoft Corporation | Drag-able tabs |
| JP2014085992A (en) * | 2012-10-26 | 2014-05-12 | Hitachi Ltd | Document recognition support device, document recognition support method and document recognition support program |
| JP5903376B2 (en) * | 2012-12-11 | 2016-04-13 | 日本電信電話株式会社 | Information recommendation device, information recommendation method, and information recommendation program |
| US9177104B2 (en) * | 2013-03-29 | 2015-11-03 | Case Western Reserve University | Discriminatively weighted multi-scale local binary patterns |
| KR101512084B1 (en) * | 2013-11-15 | 2015-04-17 | 한국과학기술원 | Web search system for providing 3 dimensional web search interface based virtual reality and method thereof |
| JP6287192B2 (en) * | 2013-12-26 | 2018-03-07 | キヤノンマーケティングジャパン株式会社 | Information processing apparatus, information processing method, and program |
| WO2016027372A1 (en) * | 2014-08-22 | 2016-02-25 | 株式会社日立製作所 | Autopoietic information processing system and method |
| JP6280859B2 (en) * | 2014-11-20 | 2018-02-14 | 日本電信電話株式会社 | Behavior network information extraction apparatus, behavior network information extraction method, and behavior network information extraction program |
| CN104375989A (en) * | 2014-12-01 | 2015-02-25 | 国家电网公司 | Natural language text keyword association network construction system |
| JP6524790B2 (en) * | 2015-05-14 | 2019-06-05 | 富士ゼロックス株式会社 | INFORMATION PROCESSING APPARATUS AND INFORMATION PROCESSING PROGRAM |
| JPWO2017061253A1 (en) * | 2015-10-09 | 2018-08-16 | アイビーリサーチ株式会社 | Display control apparatus, display control method, and display control program |
| TWM523901U (en) * | 2016-01-04 | 2016-06-11 | 信義房屋仲介股份有限公司 | Search engine device for performing semantic keyword analysis |
| US9710544B1 (en) * | 2016-05-19 | 2017-07-18 | Quid, Inc. | Pivoting from a graph of semantic similarity of documents to a derivative graph of relationships between entities mentioned in the documents |
| CN107766318B (en) * | 2016-08-17 | 2021-03-16 | 北京金山安全软件有限公司 | Keyword extraction method and device and electronic equipment |
| CN107193803B (en) * | 2017-05-26 | 2020-07-10 | 北京东方科诺科技发展有限公司 | A semantic-based task-specific text keyword extraction method |
| CN107451120B (en) * | 2017-08-01 | 2020-10-30 | 中国人民解放军火箭军工程大学 | A content conflict detection method and system for public text intelligence |
-
2018
- 2018-03-20 JP JP2018052074A patent/JP6987003B2/en active Active
-
2019
- 2019-01-31 CN CN201910096738.5A patent/CN110309290B/en active Active
- 2019-01-31 KR KR1020190013093A patent/KR102162779B1/en active Active
- 2019-02-26 TW TW108106540A patent/TWI703457B/en active
Also Published As
| Publication number | Publication date |
|---|---|
| KR20190110428A (en) | 2019-09-30 |
| CN110309290B (en) | 2023-06-06 |
| CN110309290A (en) | 2019-10-08 |
| KR102162779B1 (en) | 2020-10-07 |
| TWI703457B (en) | 2020-09-01 |
| JP2019164593A (en) | 2019-09-26 |
| TW201945958A (en) | 2019-12-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8810576B2 (en) | Manipulation and management of links and nodes in large graphs | |
| US12229643B2 (en) | Teaching data extending device, teaching data extending method, and program | |
| JP5023176B2 (en) | Feature word extraction apparatus and program | |
| JP6529698B2 (en) | Data analyzer and data analysis method | |
| JP6987003B2 (en) | Text mining methods, text mining programs, and text mining equipment | |
| KR102180487B1 (en) | Text mining method, text mining program, and text mining device | |
| JP7078429B2 (en) | Text mining methods, text mining programs, and text mining equipment | |
| JP2023062471A (en) | Display control program, display control method, and information processing device | |
| JP6434435B2 (en) | Information processing apparatus, operation support method, and operation support program | |
| US20220413682A1 (en) | Methods, apparatuses, and computer-readable media for enhancing digital pathology platform | |
| JP2009134378A (en) | Document group presentation device and document group presentation program | |
| JP2015022438A (en) | Report creation support device, method thereof, and program | |
| JP6696119B2 (en) | Conversion device, conversion method, and conversion program | |
| CN104243201A (en) | Method and system for storing topological graph corresponding to network equipment test case | |
| JP6657799B2 (en) | Graphic processing apparatus, graphic processing method, and graphic processing program | |
| JP5202598B2 (en) | Workflow management device and workflow management program | |
| JP5634209B2 (en) | Search index creation system, document search system, index creation method, document search method and program | |
| JP2006039811A (en) | Document management program, document management method and document management device | |
| JP2010092230A (en) | Program for retrieving graphic symbol for apparatus or device | |
| JP2026046635A (en) | Document analysis method, document analysis apparatus, document analysis program, and computer-readable storage medium storing the document analysis program. | |
| WO2016184360A1 (en) | Data object deleting method and device | |
| JP6261218B2 (en) | Display processing device, display processing method and program, and image classification device | |
| JP4728878B2 (en) | Time series analysis support system, time series analysis support method, and time series analysis support program | |
| WO2024090367A1 (en) | Information processing method, computer program, and information processing device | |
| JP2007272517A (en) | Micro scenario data analysis system and micro scenario data analysis program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201218 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210105 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211112 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211124 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211130 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6987003 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |