Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6987003B2 - Text mining methods, text mining programs, and text mining equipment - Google Patents
[go: Go Back, main page]

JP6987003B2 - Text mining methods, text mining programs, and text mining equipment - Google Patents

Text mining methods, text mining programs, and text mining equipment Download PDF

Info

Publication number
JP6987003B2
JP6987003B2 JP2018052074A JP2018052074A JP6987003B2 JP 6987003 B2 JP6987003 B2 JP 6987003B2 JP 2018052074 A JP2018052074 A JP 2018052074A JP 2018052074 A JP2018052074 A JP 2018052074A JP 6987003 B2 JP6987003 B2 JP 6987003B2
Authority
JP
Japan
Prior art keywords
occurrence
word
screen
text data
occurrence network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018052074A
Other languages
Japanese (ja)
Other versions
JP2019164593A5 (en
JP2019164593A (en
Inventor
未希 柿ノ木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Original Assignee
Screen Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP2018052074A priority Critical patent/JP6987003B2/en
Priority to KR1020190013093A priority patent/KR102162779B1/en
Priority to CN201910096738.5A priority patent/CN110309290B/en
Priority to TW108106540A priority patent/TWI703457B/en
Publication of JP2019164593A publication Critical patent/JP2019164593A/en
Publication of JP2019164593A5 publication Critical patent/JP2019164593A5/ja
Application granted granted Critical
Publication of JP6987003B2 publication Critical patent/JP6987003B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Creation or modification of classes or clusters
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)

Description

本発明は、テキストマイニングに関し、特に、単語の共起ネットワークを含む画面を表示するテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置に関する。 The present invention relates to text mining, and more particularly to a text mining method for displaying a screen including a co-occurrence network of words, a text mining program, and a text mining device.

近年、自由記述されたテキストデータを分析し、分析結果から有用な情報を求めるテキストマイニングが注目されている。テキストマイニングでは、例えば、分析対象のテキストデータから単語を抽出し、単語の出現頻度や出現傾向などを解析することにより、情報を求める。 In recent years, text mining, which analyzes freely described text data and seeks useful information from the analysis results, has attracted attention. In text mining, for example, words are extracted from the text data to be analyzed, and information is obtained by analyzing the appearance frequency and appearance tendency of the words.

自由記述されたテキストデータを分析するときには、分析者は、初期段階では対象を主観的に選択するのではなく、テキストデータの全体像を把握する必要がある。このため、分析者は、テキストデータに含まれる単語の共起ネットワークを用いることがある。 When analyzing freely written text data, the analyst needs to get an overall picture of the text data rather than subjectively selecting the target at the initial stage. For this reason, the analyst may use a co-occurrence network of words contained in the text data.

図19は、共起ネットワークの例を示す図である。共起ネットワークは、テキストデータから同じ文に含まれることが多い単語のペアを抽出し、その結果を無向グラフで表現したものである。分析対象のテキストデータにおいて単語Waと単語Wbが同じ文に含まれることが多い場合、共起ネットワークには、単語Waに対応するノード、単語Wbに対応するノード、および、両者を接続するエッジが含まれる。図19に示す共起ネットワークは、「スタッフ」に対応するノード、「対応」に対応するノード、および、両者を接続するエッジを含んでいる。図19に示す共起ネットワークを見れば、分析対象のテキストデータでは「スタッフ」と「対応」が同じ文に含まれることが多いことが分かる。 FIG. 19 is a diagram showing an example of a co-occurrence network. The co-occurrence network extracts a pair of words that are often included in the same sentence from text data, and expresses the result in an undirected graph. When the word Wa and the word Wb are often included in the same sentence in the text data to be analyzed, the co-occurrence network has a node corresponding to the word Wa, a node corresponding to the word Wb, and an edge connecting the two. included. The co-occurrence network shown in FIG. 19 includes a node corresponding to "staff", a node corresponding to "correspondence", and an edge connecting both. Looking at the co-occurrence network shown in FIG. 19, it can be seen that in the text data to be analyzed, "staff" and "correspondence" are often included in the same sentence.

一般に、共起ネットワークは、指定されたテキストデータの全体に基づき生成される。以下、このような共起ネットワークを「全体共起ネットワーク」という。分析者は、自分が立てた仮説や分析目的に応じて全体共起ネットワークから注目すべき単語(以下、注目語という)を複数個選択し、注目語を考慮して以降の分析を行う。 Generally, co-occurrence networks are generated based on the entire specified text data. Hereinafter, such a co-occurrence network is referred to as a "whole co-occurrence network". The analyst selects a plurality of notable words (hereinafter referred to as notable words) from the whole co-occurrence network according to the hypothesis and the analysis purpose set by the analyst, and performs the subsequent analysis in consideration of the notable words.

分析者は、注目語を選択するときに、選択した注目語が分析目的などに適しているか否かを判断するために、注目語を含む文の中で注目語がどのように使われているかを考察する。このため、分析者は、指定されたテキストデータのうち注目語を含む文からなるテキストデータ(以下、限定テキストデータという)に基づく共起ネットワークを用いることがある。なお、ここで言う「注目語を含む文」は、注目語を含む単一の文を意味する場合だけでなく、注目語を含む文を包含する段落など、ブロック単位に分割された複数の文(文の集合)を意味する場合がある。以下、このような共起ネットワークを「限定共起ネットワーク」という。分析者は、限定共起ネットワークを用いることにより、限定テキストデータの内容を把握することができる。分析者は、すべての注目語を選択するまで、全体共起ネットワークと限定共起ネットワークを繰り返し参照する。 When an analyst selects a attention word, how the attention word is used in a sentence containing the attention word in order to determine whether or not the selected attention word is suitable for an analysis purpose or the like. Consider. For this reason, the analyst may use a co-occurrence network based on text data (hereinafter referred to as limited text data) consisting of sentences including a word of interest in the designated text data. The "sentence including the attention word" here means not only a single sentence including the attention word but also a plurality of sentences divided into block units such as a paragraph containing the sentence including the attention word. May mean (a set of sentences). Hereinafter, such a co-occurrence network is referred to as a "limited co-occurrence network". The analyst can grasp the content of the limited text data by using the limited co-occurrence network. The analyst repeatedly references the whole co-occurrence network and the limited co-occurrence network until all the words of interest are selected.

以下、テキストデータに含まれる単語の共起ネットワークを生成し、生成した共起ネットワークを含む画面を表示するテキストマイニング装置について考える。特許文献1には、複数の文書のそれぞれについて全体共起ネットワークを生成し、生成した複数の全体共起ネットワークを含む画面を表示するドキュメントデータベース表示装置が記載されている。この表示装置は、複数の全体共起ネットワークの中から利用者が入力した単語を検索し、検索した単語を画面内で強調表示する。 Hereinafter, a text mining device that generates a co-occurrence network of words included in text data and displays a screen including the generated co-occurrence network will be considered. Patent Document 1 describes a document database display device that generates a total co-occurrence network for each of a plurality of documents and displays a screen including the generated total co-occurrence network. This display device searches for a word input by the user from a plurality of co-occurrence networks, and highlights the searched word on the screen.

特開平8−314980号公報Japanese Unexamined Patent Publication No. 8-314980

従来のテキストマイニング装置は、指定されたテキストデータの全体に基づき共起ネットワークを生成する。したがって、従来のテキストマイニング装置によれば、全体共起ネットワークを含む画面を容易に表示することができる。 A conventional text mining device creates a co-occurrence network based on the entire specified text data. Therefore, according to the conventional text mining device, the screen including the whole co-occurrence network can be easily displayed.

一方、従来のテキストマイニング装置を用いて限定共起ネットワークを含む画面を表示するときには、分析者は煩雑な操作を行う必要がある。具体的には、分析者は、全体共起ネットワークの中から1個の注目語を選択するたびに、指定されたテキストデータに基づき限定テキストデータを生成し、生成した限定テキストデータをテキストマイニング装置に与える必要がある。また、分析者は、注目語を選択するときに、全体共起ネットワークと限定共起ネットワークの両方を参照する。このため、テキストマイニング装置は、全体共起ネットワークの画像データと限定共起ネットワークの画像データの両方を保存する必要がある。しかし、多くの共起ネットワークを生成した場合、画像データの保存と管理が困難になる。 On the other hand, when displaying a screen including a limited co-occurrence network using a conventional text mining device, the analyst needs to perform complicated operations. Specifically, each time the analyst selects one noteworthy word from the whole co-occurrence network, the analyst generates limited text data based on the specified text data, and the generated limited text data is used as a text mining device. Need to be given to. Also, the analyst refers to both the global co-occurrence network and the limited co-occurrence network when selecting the term of interest. Therefore, the text mining device needs to store both the image data of the whole co-occurrence network and the image data of the limited co-occurrence network. However, when many co-occurrence networks are generated, it becomes difficult to store and manage image data.

それ故に、本発明は、注目語を指定したときの共起ネットワークを含む画面を簡単な操作で表示できるテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置を提供することを目的とする。 Therefore, it is an object of the present invention to provide a text mining method, a text mining program, and a text mining device capable of displaying a screen including a co-occurrence network when a word of interest is specified by a simple operation.

本発明の第1の局面は、テキストデータの分析結果を含む画面を表示するテキストマイニング方法であって、
テキストデータから単語を抽出するステップと、
前記単語について共起行列を生成するステップと、
前記共起行列に基づき共起ネットワークを生成するステップと、
前記共起ネットワークを含む画面を表示するステップとを備え、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語を抽出するステップは前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列を生成するステップは前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワークを生成するステップは前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面を表示するステップは前記第2共起ネットワークを含む第2画面を表示することを特徴とする。
The first aspect of the present invention is a text mining method for displaying a screen including an analysis result of text data.
Steps to extract words from text data,
Steps to generate a co-occurrence matrix for the word,
Steps to generate a co-occurrence network based on the co-occurrence matrix,
A step of displaying a screen including the co-occurrence network is provided.
When an instruction to specify a word of interest is input in the first screen including the first co-occurrence network based on the entire specified text data, the step of extracting the word is described in the specified text data. In the step of extracting the word from the limited text data including the part including the word of interest and generating the co-occurrence matrix, a second co-occurrence matrix is generated for the word using the limited text data, and the co-occurrence network is generated. The generation step is characterized in that a second co-occurrence network is generated based on the second co-occurrence matrix, and the step of displaying the screen is characterized in displaying a second screen including the second co-occurrence network.

本発明の第2の局面は、本発明の第1の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The second aspect of the present invention is the first aspect of the present invention.
By selecting one or more nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction to specify the word corresponding to the node as the attention word is input. It is characterized by that.

本発明の第3の局面は、本発明の第1の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1個のノードを続けて選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The third aspect of the present invention is the first aspect of the present invention.
By continuously selecting one node included in the first co-occurrence network in the first screen, an instruction for designating the word corresponding to the node as the attention word is input. ..

本発明の第4の局面は、本発明の第1の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1本のエッジを続けて選択することにより、前記エッジに接続された2個のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The fourth aspect of the present invention is the first aspect of the present invention.
By continuously selecting one edge included in the first co-occurrence network in the first screen, an instruction to specify a word corresponding to two nodes connected to the edge as the attention word is given. It is characterized by being input.

本発明の第5の局面は、本発明の第1の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、前記エッジに接続された複数のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The fifth aspect of the present invention is the first aspect of the present invention.
By selecting one or more edges included in the first co-occurrence network in the first screen and selecting start analysis, the word corresponding to the plurality of nodes connected to the edge is referred to as the attention word. It is characterized in that the instruction specified as is input.

本発明の第6の局面は、本発明の第1の局面において、
複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面を表示するステップは、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする。
The sixth aspect of the present invention is the first aspect of the present invention.
When a merge instruction is input in a second screen including a plurality of second co-occurrence networks, the step of displaying the screen is characterized in that the plurality of second co-occurrence networks are displayed in a tab format. ..

本発明の第7の局面は、本発明の第6の局面において、
前記第2画面内で一の第2共起ネットワークを掴んで他の第2共起ネットワーク内で離すことにより、前記併合指示が入力されることを特徴とする。
The seventh aspect of the present invention is the sixth aspect of the present invention.
It is characterized in that the merge instruction is input by grasping one second co-occurrence network in the second screen and separating it in another second co-occurrence network.

本発明の第8の局面は、本発明の第1の局面において、
前記限定テキストデータは、前記指定されたテキストデータのうち前記注目語を含む文からなることを特徴とする。
The eighth aspect of the present invention is the first aspect of the present invention.
The limited text data is characterized by consisting of a sentence including the word of interest in the designated text data.

本発明の第9の局面は、本発明の第8の局面において、
複数の注目語が指定されたときの前記限定テキストデータは、前記指定されたテキストデータのうち前記複数の注目語のすべてを含む文からなることを特徴とする。
The ninth aspect of the present invention is the eighth aspect of the present invention.
The limited text data when a plurality of attention words are designated is characterized by comprising a sentence including all of the plurality of attention words among the designated text data.

本発明の第10の局面は、本発明の第8の局面において、
複数の注目語が指定されたときの前記限定テキストデータは、前記指定されたテキストデータのうち前記複数の注目語のいずれかを含む文からなることを特徴とする。
The tenth aspect of the present invention is the eighth aspect of the present invention.
The limited text data when a plurality of attention words are designated is characterized by comprising a sentence including any one of the plurality of attention words among the designated text data.

本発明の第11の局面は、本発明の第1の局面において、
前記共起行列を生成するステップは、Jaccard係数を要素とする共起行列を生成することを特徴とする。
The eleventh aspect of the present invention is the first aspect of the present invention.
The step of generating the co-occurrence matrix is characterized in that a co-occurrence matrix having a Jaccard coefficient as an element is generated.

本発明の第12の局面は、テキストデータの分析結果を含む画面を表示するためのテキストマイニングプログラムであって、
テキストデータから単語を抽出するステップと、
前記単語について共起行列を生成するステップと、
前記共起行列に基づき共起ネットワークを生成するステップと、
前記共起ネットワークを含む画面を表示するステップとをコンピュータにCPUがメモリを利用して実行させ、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語を抽出するステップは前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列を生成するステップは前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワークを生成するステップは前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面を表示するステップは前記第2共起ネットワークを含む第2画面を表示することを特徴とする。
The twelfth aspect of the present invention is a text mining program for displaying a screen including an analysis result of text data.
Steps to extract words from text data,
Steps to generate a co-occurrence matrix for the word,
Steps to generate a co-occurrence network based on the co-occurrence matrix,
The CPU causes the computer to execute the step of displaying the screen including the co-occurrence network by using the memory.
When an instruction to specify a word of interest is input in the first screen including the first co-occurrence network based on the entire specified text data, the step of extracting the word is described in the specified text data. In the step of extracting the word from the limited text data including the part including the word of interest and generating the co-occurrence matrix, a second co-occurrence matrix is generated for the word using the limited text data, and the co-occurrence network is generated. The generation step is characterized in that a second co-occurrence network is generated based on the second co-occurrence matrix, and the step of displaying the screen is characterized in displaying a second screen including the second co-occurrence network.

本発明の第13の局面は、本発明の第12の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The thirteenth aspect of the present invention is the twelfth aspect of the present invention.
By selecting one or more nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction to specify the word corresponding to the node as the attention word is input. It is characterized by that.

本発明の第14の局面は、本発明の第12の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1個のノードを続けて選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The fourteenth aspect of the present invention is the twelfth aspect of the present invention.
By continuously selecting one node included in the first co-occurrence network in the first screen, an instruction for designating the word corresponding to the node as the attention word is input. ..

本発明の第15の局面は、本発明の第12の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1本のエッジを続けて選択することにより、前記エッジに接続された2個のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The fifteenth aspect of the present invention is the twelfth aspect of the present invention.
By continuously selecting one edge included in the first co-occurrence network in the first screen, an instruction to specify a word corresponding to two nodes connected to the edge as the attention word is given. It is characterized by being input.

本発明の第16の局面は、本発明の第12の局面において、
前記第1画面内で前記第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、前記エッジに接続された複数のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする。
The sixteenth aspect of the present invention is the twelfth aspect of the present invention.
By selecting one or more edges included in the first co-occurrence network in the first screen and selecting start analysis, the word corresponding to the plurality of nodes connected to the edge is referred to as the attention word. It is characterized in that the instruction specified as is input.

本発明の第17の局面は、本発明の第12の局面において、
複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面を表示するステップは、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする。
The seventeenth aspect of the present invention is the twelfth aspect of the present invention.
When a merge instruction is input in a second screen including a plurality of second co-occurrence networks, the step of displaying the screen is characterized in that the plurality of second co-occurrence networks are displayed in a tab format. ..

本発明の第18の局面は、本発明の第17の局面において、
前記第2画面内で一の第2共起ネットワークを掴んで他の第2共起ネットワーク内で離すことにより、前記併合指示が入力されることを特徴とする。
The eighteenth aspect of the present invention is the seventeenth aspect of the present invention.
It is characterized in that the merge instruction is input by grasping one second co-occurrence network in the second screen and separating it in another second co-occurrence network.

本発明の第19の局面は、テキストデータの分析結果を含む画面を表示するテキストマイニング装置であって、
テキストデータから単語を抽出する単語抽出部と、
前記単語について共起行列を生成する共起行列生成部と、
前記共起行列に基づき共起ネットワークを生成する共起ネットワーク生成部と、
前記共起ネットワークを含む画面を表示する画面表示部とを備え、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語抽出部は前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列生成部は前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワーク生成部は前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面表示部は前記第2共起ネットワークを含む第2画面を表示することを特徴とする。
A nineteenth aspect of the present invention is a text mining device that displays a screen containing analysis results of text data.
A word extractor that extracts words from text data,
A co-occurrence matrix generator that generates a co-occurrence matrix for the word,
A co-occurrence network generation unit that generates a co-occurrence network based on the co-occurrence matrix,
It is provided with a screen display unit that displays a screen including the co-occurrence network.
When an instruction to specify a attention word is input in the first screen including the first co-occurrence network based on the entire specified text data, the word extraction unit uses the attention word in the specified text data. The word is extracted from the limited text data including the portion including, the co-occurrence matrix generation unit generates a second co-occurrence matrix using the limited text data for the word, and the co-occurrence network generation unit generates the first. A second co-occurrence network is generated based on the two co-occurrence matrix, and the screen display unit displays a second screen including the second co-occurrence network.

本発明の第20の局面は、本発明の第19の局面において、
複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面表示部は、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする。
The twentieth aspect of the present invention is the nineteenth aspect of the present invention.
When a merge instruction is input in a second screen including a plurality of second co-occurrence networks, the screen display unit is characterized in that the plurality of second co-occurrence networks are displayed in a tab format.

上記第1、第12または第19の局面によれば、指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、指定されたテキストデータのうち注目語を含む部分に基づく第2共起ネットワークを含む第2画面が表示される。したがって、注目語を指定したときの共起ネットワークを含む画面を簡単な操作で表示することができる。 According to the first, twelfth or nineteenth aspect described above, when an instruction to specify a word of interest is input in the first screen including the first co-occurrence network based on the entire specified text data, the designation is made. A second screen including a second co-occurrence network based on the portion of the text data that contains the word of interest is displayed. Therefore, the screen including the co-occurrence network when the attention word is specified can be displayed by a simple operation.

上記第2または第13の局面によれば、第1画面内で1個または複数のノードと分析開始を選択することにより、1個または複数の注目語を指定する指示を簡単な操作で入力し、1個または複数の注目語を指定したときの共起ネットワークを含む画面を表示することができる。 According to the second or thirteenth aspect, the instruction to specify one or more attention words is input by a simple operation by selecting one or more nodes and the analysis start in the first screen. It is possible to display a screen including a co-occurrence network when one or more attention words are specified.

上記第3または第14の局面によれば、第1画面内で1個のノード続けて選択することにより、1個の注目語を指定する指示を簡単な操作で入力し、1個の注目語を指定したときの共起ネットワークを含む画面を表示することができる。 According to the third or fourteenth aspect, by continuously selecting one node in the first screen, an instruction to specify one attention word is input by a simple operation, and one attention is given. A screen containing the co-occurrence network when a word is specified can be displayed.

上記第4または第15の局面によれば、第1画面内で1本のエッジを続けて選択することにより、2個の注目語を指定する指示を簡単な操作で入力し、2個の注目語を指定したときの共起ネットワークを含む画面を表示することができる。 According to the fourth or fifteenth aspect, by continuously selecting one edge in the first screen, an instruction to specify two attention words is input by a simple operation, and two attentions are given. A screen containing the co-occurrence network when a word is specified can be displayed.

上記第5または第16の局面によれば、第1画面内で1本または複数のエッジと分析開始を選択することにより、複数の注目語を指定する指示を簡単な操作で入力し、複数の注目語を指定したときの共起ネットワークを含む画面を表示することができる。 According to the fifth or sixteenth aspect, by selecting one or more edges and the start of analysis in the first screen, instructions for designating a plurality of attention words can be input by a simple operation, and a plurality of edges can be input. It is possible to display a screen including the co-occurrence network when the attention word is specified.

上記第6、第17または第20の局面によれば、併合指示が入力されたときに複数の第2共起ネットワークをタブ形式で表示することにより、複数の第2共起ネットワークをコンパクトに表示することができる。 According to the sixth, 17th, or twentieth aspect, the plurality of second co-occurrence networks are displayed compactly by displaying the plurality of second co-occurrence networks in a tab format when the merge instruction is input. can do.

上記第7または第18の局面によれば、第2画面内で第2共起ネットワークを掴んで離すことにより、併合指示を簡単な操作で入力し、複数の第2共起ネットワークをコンパクトに表示することができる。 According to the seventh or eighteenth aspect, by grasping and releasing the second co-occurrence network in the second screen, a merge instruction can be input with a simple operation, and a plurality of second co-occurrence networks can be displayed compactly. can do.

上記第8の局面によれば、注目語を指定する指示が入力されたときに、指定されたテキストデータを文単位で分けて限定テキストデータを求め、求めた限定テキストデータに基づく第2共起ネットワークを含む画面を表示することができる。 According to the eighth aspect, when the instruction to specify the attention word is input, the specified text data is divided into sentence units to obtain the limited text data, and the second co-occurrence based on the obtained limited text data. A screen including the network can be displayed.

上記第9または第10の局面によれば、複数の注目語についてAND処理またはOR処理を行ったときの第2共起ネットワークを含む画面を表示することができる。 According to the ninth or tenth aspect, it is possible to display a screen including the second co-occurrence network when AND processing or OR processing is performed on a plurality of notable words.

上記第11の局面によれば、Jaccard係数を要素とする共起行列を生成することにより、テキストデータに含まれる単語の共起性を好適に分析することができる。 According to the eleventh aspect, the co-occurrence of words contained in the text data can be suitably analyzed by generating a co-occurrence matrix having a Jaccard coefficient as an element.

本発明の実施形態に係るテキストマイニング装置の構成を示すブロック図である。It is a block diagram which shows the structure of the text mining apparatus which concerns on embodiment of this invention. 図1に示すテキストマイニング装置として機能するコンピュータの構成を示すブロック図である。It is a block diagram which shows the structure of the computer which functions as the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置の動作を示すフローチャートである。It is a flowchart which shows the operation of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置で生成される共起行列の例を示す図である。It is a figure which shows the example of the co-occurrence matrix generated by the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置が表示する全体共起ネットワークを含むウインドウの例を示す図である。It is a figure which shows the example of the window including the whole co-occurrence network displayed by the text mining apparatus shown in FIG. 1. 図5に示すウインドウ内で注目語を指定する第1の操作を示す図である。It is a figure which shows the 1st operation which specifies the attention word in the window shown in FIG. 図5に示すウインドウ内で注目語を指定する第2の操作を示す図である。It is a figure which shows the 2nd operation which specifies the attention word in the window shown in FIG. 図5に示すウインドウ内で注目語を指定する第3の操作を示す図である。It is a figure which shows the 3rd operation which specifies the attention word in the window shown in FIG. 図5に示すウインドウ内で注目語を指定する第4の操作を示す図である。It is a figure which shows the 4th operation which specifies the attention word in the window shown in FIG. 図5に示すウインドウ内で注目語を指定する第5の操作を示す図である。It is a figure which shows the 5th operation which specifies the attention word in the window shown in FIG. 図5に示すウインドウ内で注目語を指定する第6の操作を示す図である。It is a figure which shows the 6th operation which specifies the attention word in the window shown in FIG. 図1に示すテキストマイニング装置が表示する限定共起ネットワークを含むウインドウの例を示す図である。It is a figure which shows the example of the window including the limited co-occurrence network displayed by the text mining apparatus shown in FIG. 1. 図1に示すテキストマイニング装置が表示する限定共起ネットワークを含むウインドウの例を示す図である。It is a figure which shows the example of the window including the limited co-occurrence network displayed by the text mining apparatus shown in FIG. 1. 図1に示すテキストマイニング装置の表示画面の例を示す図である。It is a figure which shows the example of the display screen of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置の表示画面の例を示す図である。It is a figure which shows the example of the display screen of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置の表示画面の例を示す図である。It is a figure which shows the example of the display screen of the text mining apparatus shown in FIG. 図1に示すテキストマイニング装置におけるウインドウを併合する操作を示す図である。It is a figure which shows the operation of merging windows in the text mining apparatus shown in FIG. 図17に示す操作を行った後の表示画面を示す図である。It is a figure which shows the display screen after performing the operation shown in FIG. 共起ネットワークの例を示す図である。It is a figure which shows the example of the co-occurrence network.

以下、図面を参照して、本発明の実施形態に係るテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置について説明する。本実施形態に係るテキストマイニング方法は、典型的にはコンピュータを用いて実行される。本実施形態に係るテキストマイニングプログラムは、コンピュータを用いてテキストマイニング方法を実施するためのプログラムである。本実施形態に係るテキストマイニング装置は、典型的にはコンピュータを用いて構成される。テキストマイニングプログラムを実行するコンピュータは、テキストマイニング装置として機能する。 Hereinafter, the text mining method, the text mining program, and the text mining apparatus according to the embodiment of the present invention will be described with reference to the drawings. The text mining method according to the present embodiment is typically performed using a computer. The text mining program according to the present embodiment is a program for implementing a text mining method using a computer. The text mining device according to the present embodiment is typically configured by using a computer. The computer that executes the text mining program functions as a text mining device.

図1は、本発明の実施形態に係るテキストマイニング装置の構成を示すブロック図である。図1に示すテキストマイニング装置10は、指示入力部11、テキストデータ記憶部12、単語抽出部13、共起行列生成部14、共起ネットワーク生成部15、および、画面表示部16を備えている。テキストマイニング装置10は、テキストデータ記憶部12に記憶されたテキストデータに基づきテキストデータの分析結果として共起ネットワークを生成し、生成した共起ネットワークを含む画面を表示する。 FIG. 1 is a block diagram showing a configuration of a text mining device according to an embodiment of the present invention. The text mining device 10 shown in FIG. 1 includes an instruction input unit 11, a text data storage unit 12, a word extraction unit 13, a co-occurrence matrix generation unit 14, a co-occurrence network generation unit 15, and a screen display unit 16. .. The text mining device 10 generates a co-occurrence network as an analysis result of the text data based on the text data stored in the text data storage unit 12, and displays a screen including the generated co-occurrence network.

テキストマイニング装置10の動作の概要は、以下のとおりである。指示入力部11には、利用者(テキストデータの分析者)からの指示が入力される。テキストデータ記憶部12は、自由記述された1以上のテキストデータを記憶している。単語抽出部13は、テキストデータ記憶部12から指定されたテキストデータを読み出し、読み出したテキストデータに対して形態素解析を行うことにより、テキストデータから単語を抽出する。共起行列生成部14は、単語抽出部13で抽出された単語について共起行列を生成する。共起ネットワーク生成部15は、共起行列生成部14で生成された共起行列に基づき共起ネットワークを生成する。画面表示部16は、共起ネットワーク生成部15で生成された共起ネットワークを含む画面を表示する。 The outline of the operation of the text mining device 10 is as follows. Instructions from the user (analyzer of text data) are input to the instruction input unit 11. The text data storage unit 12 stores one or more freely described text data. The word extraction unit 13 reads out the text data designated from the text data storage unit 12, and performs morphological analysis on the read text data to extract words from the text data. The co-occurrence matrix generation unit 14 generates a co-occurrence matrix for the words extracted by the word extraction unit 13. The co-occurrence network generation unit 15 generates a co-occurrence network based on the co-occurrence matrix generated by the co-occurrence matrix generation unit 14. The screen display unit 16 displays a screen including the co-occurrence network generated by the co-occurrence network generation unit 15.

利用者は、指示入力部11を用いて、分析対象のテキストデータを指定する指示、注目語を指定する指示などを入力する。単語抽出部13、共起ネットワーク生成部15、および、画面表示部16は、利用者からの指示に従い、共起ネットワークを含む画面を表示するための動作を行う。テキストデータを指定する指示が入力されたときには、指定されたテキストデータの全体に基づく全体共起ネットワークが生成され、全体共起ネットワークを含む画面が表示される。全体共起ネットワークを含む画面内で注目語を指定する指示が入力されたときには、指定されたテキストデータのうち注目語を含む文に基づく限定共起ネットワークが生成され、限定共起ネットワークを含む画面が表示される。 The user inputs an instruction for designating the text data to be analyzed, an instruction for designating a word of interest, and the like by using the instruction input unit 11. The word extraction unit 13, the co-occurrence network generation unit 15, and the screen display unit 16 perform an operation for displaying a screen including the co-occurrence network according to an instruction from the user. When the instruction to specify the text data is input, the whole co-occurrence network based on the whole of the specified text data is generated, and the screen including the whole co-occurrence network is displayed. When an instruction to specify a noteworthy word is input in the screen including the whole co-occurrence network, a limited co-occurrence network based on the sentence including the noteworthy word in the specified text data is generated, and the screen including the limited co-occurrence network is generated. Is displayed.

図2は、テキストマイニング装置10として機能するコンピュータの構成を示すブロック図である。図2に示すコンピュータ20は、CPU21、メインメモリ22、記憶部23、入力部24、表示部25、通信部26、および、記録媒体読み取り部27を備えている。メインメモリ22には、例えば、DRAMが使用される。記憶部23には、例えば、ハードディスクやソリッドステートドライブが使用される。入力部24には、例えば、キーボード28やマウス29が含まれる。表示部25には、例えば、液晶ディスプレイが使用される。通信部26は、有線通信または無線通信のインターフェイス回路である。記録媒体読み取り部27は、プログラムなどを記憶した記録媒体30のインターフェイス回路である。記録媒体30には、例えば、CD−ROM、DVD−ROM、USBメモリなどの非一過性の記録媒体が使用される。 FIG. 2 is a block diagram showing a configuration of a computer functioning as a text mining device 10. The computer 20 shown in FIG. 2 includes a CPU 21, a main memory 22, a storage unit 23, an input unit 24, a display unit 25, a communication unit 26, and a recording medium reading unit 27. For the main memory 22, for example, DRAM is used. For example, a hard disk or a solid state drive is used for the storage unit 23. The input unit 24 includes, for example, a keyboard 28 and a mouse 29. For the display unit 25, for example, a liquid crystal display is used. The communication unit 26 is an interface circuit for wired communication or wireless communication. The recording medium reading unit 27 is an interface circuit of the recording medium 30 that stores a program or the like. As the recording medium 30, for example, a non-transient recording medium such as a CD-ROM, a DVD-ROM, or a USB memory is used.

コンピュータ20がテキストマイニングプログラム31を実行する場合、記憶部23は、テキストマイニングプログラム31とテキストデータ32を記憶する。テキストマイニングプログラム31とテキストデータ32は、例えば、サーバや他のコンピュータから通信部26を用いて受信したものでもよく、記録媒体30から記録媒体読み取り部27を用いて読み出したものでもよい。 When the computer 20 executes the text mining program 31, the storage unit 23 stores the text mining program 31 and the text data 32. The text mining program 31 and the text data 32 may be, for example, those received from a server or another computer using the communication unit 26, or those read from the recording medium 30 using the recording medium reading unit 27.

テキストマイニングプログラム31を実行するときには、テキストマイニングプログラム31とテキストデータ32はメインメモリ22に複写転送される。CPU21は、メインメモリ22を作業用メモリとして利用して、メインメモリ22に記憶されたテキストマイニングプログラム31を実行することにより、テキストデータ32から単語を抽出する処理、抽出した単語について共起行列を生成する処理、生成した共起行列に基づき共起ネットワークを生成する処理、生成した共起ネットワークを含む画面を表示する処理などを行う。このときコンピュータ20は、テキストマイニング装置10として機能する。なお、以上に述べたコンピュータ20の構成は一例に過ぎず、任意のコンピュータを用いてテキストマイニング装置10を構成することができる。 When the text mining program 31 is executed, the text mining program 31 and the text data 32 are copied and transferred to the main memory 22. The CPU 21 uses the main memory 22 as a working memory, executes a text mining program 31 stored in the main memory 22, processes to extract words from the text data 32, and creates a co-occurrence matrix for the extracted words. The process of generating, the process of generating a co-occurrence network based on the generated co-occurrence matrix, the process of displaying the screen including the generated co-occurrence network, and the like are performed. At this time, the computer 20 functions as a text mining device 10. The configuration of the computer 20 described above is only an example, and the text mining device 10 can be configured by using any computer.

図3は、テキストマイニング装置10の動作を示すフローチャートである。図3に示す動作を行う前に、テキストデータ記憶部12は自由記述された1以上のテキストデータを記憶している。各テキストデータは、複数の文を含んでいる。テキストマイニング装置10は、テキストデータ記憶部12に記憶されたテキストデータのうちで利用者が指定したテキストデータに対して処理を行う。 FIG. 3 is a flowchart showing the operation of the text mining device 10. Before performing the operation shown in FIG. 3, the text data storage unit 12 stores one or more freely described text data. Each text data contains a plurality of sentences. The text mining device 10 processes the text data designated by the user among the text data stored in the text data storage unit 12.

図3において、指示入力部11は、まず利用者からテキストデータを指定する指示を受け取る(ステップS101)。このとき、指示入力部11は、テキストデータを指定する指示に加えて、共起行列の基準値(詳細は後述)を設定する指示、AND処理とOR処理(詳細は後述)を切り替える指示、共起ネットワークの表示態様の詳細を設定する指示などを受け取ってもよい。受け取った指示は、テキストマイニング装置10の各部に対して出力される。 In FIG. 3, the instruction input unit 11 first receives an instruction to specify text data from the user (step S101). At this time, in addition to the instruction for designating the text data, the instruction input unit 11 includes an instruction for setting a reference value of the co-occurrence matrix (details will be described later), an instruction for switching between AND processing and OR processing (details will be described later), and co-occurrence. You may receive an instruction to set the details of the display mode of the origin network. The received instruction is output to each part of the text mining device 10.

次に、単語抽出部13は、テキストデータ記憶部12から指定されたテキストデータを読み出す(ステップS102)。次に、単語抽出部13は、ステップS102で読み出したテキストデータに対して形態素解析を行うことにより、読み出したテキストデータから単語を抽出する(ステップS103)。このとき、単語抽出部13は、読み出したテキストデータから、後の分析で必要となる単語だけを抽出する。次に、共起行列生成部14は、ステップS103で抽出された単語について、ステップS102で読み出されたテキストデータを用いて共起行列を生成する(ステップS104)。 Next, the word extraction unit 13 reads out the designated text data from the text data storage unit 12 (step S102). Next, the word extraction unit 13 extracts words from the read text data by performing morphological analysis on the text data read in step S102 (step S103). At this time, the word extraction unit 13 extracts only the words necessary for the later analysis from the read text data. Next, the co-occurrence matrix generation unit 14 generates a co-occurrence matrix for the words extracted in step S103 using the text data read in step S102 (step S104).

図4は、共起行列生成部14で生成された共起行列の例を示す図である。共起行列の要素は、単語のペアについて求めたJaccard係数である。分析対象のテキストデータについて、単語Waを含む文の集合をA、単語Wbを含む文の集合をBとする。単語のペア(Wa,Wb)についてのJaccard係数K(Wa,Wb)は、次式(1)で与えられる。
K(Wa,Wb)=|A∩B|/|A∪B| …(1)
ただし、式(1)において、記号∩は積集合を求める演算を表し、記号∪は和集合を求める演算を表し、|S|は集合Sに含まれる要素の個数を表す。
FIG. 4 is a diagram showing an example of a co-occurrence matrix generated by the co-occurrence matrix generation unit 14. The element of the co-occurrence matrix is the Jaccard index obtained for a pair of words. For the text data to be analyzed, let A be a set of sentences including the word Wa, and let B be a set of sentences including the word Wb. The Jaccard index K (Wa, Wb) for a word pair (Wa, Wb) is given by the following equation (1).
K (Wa, Wb) = | A∩B | / | A∪B |… (1)
However, in the equation (1), the symbol ∩ represents an operation for obtaining an intersection, the symbol ∪ represents an operation for obtaining a union, and | S | represents the number of elements included in the set S.

共起行列生成部14は、ステップS104において、ステップS102で読み出されたテキストデータの全体から抽出された単語のペアのすべてについてJaccard係数を求め、求めたJaccard係数を要素とする共起行列を生成する。共起行列の行および列は、ステップS102で読み出されたテキストデータの全体から抽出された単語の種類に対応する。読み出されたテキストデータの全体からn種類の単語が抽出されたとき、ステップS104で生成される共起行列は、対角要素がすべて1であるn行n列の対称行列である。 In step S104, the co-occurrence matrix generation unit 14 obtains a Jaccard index for all the word pairs extracted from the entire text data read in step S102, and obtains a co-occurrence matrix having the obtained Jaccard coefficient as an element. Generate. The rows and columns of the co-occurrence matrix correspond to the types of words extracted from the entire text data read in step S102. When n kinds of words are extracted from the whole read text data, the co-occurrence matrix generated in step S104 is an n-row, n-column symmetric matrix having all 1 diagonal elements.

なお、共起行列生成部14は、テキストデータを文以外の単位で分けてJaccard係数を求めてもよい。例えば、共起行列生成部14は、単語Waを含む段落の集合をA、単語Wbを含む段落の集合をBとして、式(1)に従いJaccard係数を求めてもよい。また、テキストデータに含まれる文が日付を有する場合には、共起行列生成部14は、テキストデータを同じ日付を有する文からなる複数の部分に分け、単語Waを含む部分の集合をA、単語Wbを含む部分の集合をBとして、式(1)に従いJaccard係数を求めてもよい。また、共起行列生成部14は、単語の共起性を示す他の値(例えば、Simpson係数やコサイン距離など)を要素として含む共起行列を生成してもよい。 The co-occurrence matrix generation unit 14 may divide the text data into units other than sentences to obtain the Jaccard index. For example, the co-occurrence matrix generation unit 14 may obtain the Jaccard index according to the equation (1), where A is a set of paragraphs containing the word Wa and B is a set of paragraphs containing the word Wb. When the sentence included in the text data has a date, the co-occurrence matrix generation unit 14 divides the text data into a plurality of parts consisting of sentences having the same date, and sets a set of parts including the word Wa as A. The Jaccard index may be obtained according to the equation (1), where B is a set of parts including the word Wb. Further, the co-occurrence matrix generation unit 14 may generate a co-occurrence matrix including other values indicating the co-occurrence of words (for example, Simpson coefficient, cosine distance, etc.) as elements.

次に、共起ネットワーク生成部15は、ステップS104で生成された共起行列に基づき、全体共起ネットワークを生成する(ステップS105)。次に、画面表示部16は、ステップS105で生成された全体共起ネットワークを含む画面を表示する(ステップS106)。図5は、ステップS106で表示される、全体共起ネットワークを含むウインドウの例を示す図である。図5に示すウインドウ41は、全体共起ネットワーク51と分析ボタン61を含んでいる。分析ボタン61は、分析開始を指示するために設けられる。 Next, the co-occurrence network generation unit 15 generates an entire co-occurrence network based on the co-occurrence matrix generated in step S104 (step S105). Next, the screen display unit 16 displays a screen including the entire co-occurrence network generated in step S105 (step S106). FIG. 5 is a diagram showing an example of a window including a whole co-occurrence network displayed in step S106. The window 41 shown in FIG. 5 includes a whole co-occurrence network 51 and an analysis button 61. The analysis button 61 is provided to instruct the start of analysis.

共起ネットワーク生成部15は、共起行列の基準値(以下、Vとする)を有している。基準値Vは、予め決定された値でもよく、指示入力部11を用いて利用者から設定された値でもよい。ステップS104で生成された共起行列において、単語Waに対応する行に含まれるJaccard係数K(Wa,*)の最大値が基準値V以上である場合、共起ネットワーク生成部15は単語Waに対応するノード(単語Waと記載したノード)を全体共起ネットワークに含める。また、ステップS104で生成された共起行列において、単語のペア(Wa,Wb)に係るJaccard係数K(Wa,Wb)が基準値V以上である場合、共起ネットワーク生成部15は単語Waに対応するノードと単語Wbに対応するノードとを接続するエッジを全体共起ネットワークに含める。 The co-occurrence network generation unit 15 has a reference value (hereinafter referred to as V) of the co-occurrence matrix. The reference value V may be a predetermined value or a value set by the user using the instruction input unit 11. In the co-occurrence matrix generated in step S104, when the maximum value of the Jaccard coefficient K (Wa, *) included in the row corresponding to the word Wa is equal to or larger than the reference value V, the co-occurrence network generation unit 15 determines the word Wa. Include the corresponding node (the node described as the word Wa) in the global co-occurrence network. Further, in the co-occurrence matrix generated in step S104, when the Jaccard coefficient K (Wa, Wb) related to the word pair (Wa, Wb) is equal to or more than the reference value V, the co-occurrence network generation unit 15 is assigned to the word Wa. The edge connecting the corresponding node and the node corresponding to the word Wb is included in the whole co-occurrence network.

図5に示す全体共起ネットワーク51では、出現頻度が大きい単語に対応するノードは大きく表示されている。共起ネットワークを含む画面を表示するときに、Jaccard係数K(Wa,Wb)が大きいときに、単語Waに対応するノードと単語Wbに対応するノードとを接続するエッジを太く表示してもよい。また、Jaccard係数に応じて、エッジの色を切り替えてもよく、エッジの太さと色の両方を切り替えてもよい。共起ネットワークは、エッジを介して到達可能な複数の部分に分けられる。共起ネットワークを含む画面を表示するときに、各部分に含まれる複数のノードを各部分に割り当てた色で表示してもよい。なお、共起ネットワークに含まれるノードとエッジの位置に意味はない。 In the general co-occurrence network 51 shown in FIG. 5, the nodes corresponding to the words having a high frequency of appearance are displayed in large size. When displaying a screen including a co-occurrence network, when the Jaccard index K (Wa, Wb) is large, the edge connecting the node corresponding to the word Wa and the node corresponding to the word Wb may be displayed thickly. .. Further, the color of the edge may be switched according to the Jaccard index, or both the thickness and the color of the edge may be switched. The co-occurrence network is divided into multiple parts that can be reached via the edge. When displaying the screen including the co-occurrence network, a plurality of nodes included in each part may be displayed in the color assigned to each part. The positions of the nodes and edges included in the co-occurrence network are meaningless.

次に、指示入力部11は、利用者から注目語を指定する指示を受け取る(ステップS111)。ステップS111を実行するときには、全体共起ネットワークを含む画面が表示されている。利用者は、マウス29を操作して、全体共起ネットワークの要素を選択することにより、注目語を指定する指示を入力する。なお、利用者は、指示を入力するときに、マウス29に代えてキーボード28を用いてもよく、表示画面に直接触れるなどの操作を行ってもよい。以下、ステップS111を実行するときに、図5に示すウインドウ41を含む画面が表示されているとする。 Next, the instruction input unit 11 receives an instruction to specify a word of interest from the user (step S111). When step S111 is executed, a screen including the whole co-occurrence network is displayed. The user inputs an instruction to specify a word of interest by operating the mouse 29 and selecting an element of the whole co-occurrence network. When inputting an instruction, the user may use the keyboard 28 instead of the mouse 29, or may perform an operation such as directly touching the display screen. Hereinafter, it is assumed that the screen including the window 41 shown in FIG. 5 is displayed when the step S111 is executed.

図6〜図11は、それぞれ、ウインドウ41内で注目語を指定する第1〜第6の操作を示す図である。図6〜図11において、吹き出しは操作の手順を示し、白い矢印はマウスカーソル62の移動を示す。吹き出しおよび矢印は、実際の画面には表示されない。以下、マウスカーソル62が表示画面内のある要素の上にあるときにマウス29のボタンをクリック(ダブルクリック)することを「要素をクリック(ダブルクリック)する」という。 6 to 11 are diagrams showing the first to sixth operations for designating a word of interest in the window 41, respectively. In FIGS. 6 to 11, the balloon indicates the operation procedure, and the white arrow indicates the movement of the mouse cursor 62. Callouts and arrows do not appear on the actual screen. Hereinafter, clicking (double-clicking) the button of the mouse 29 when the mouse cursor 62 is on a certain element in the display screen is referred to as "clicking (double-clicking) the element".

図6に示すように、利用者は、ウインドウ41内でまず注目語として指定する単語(ここでは「露天風呂」)に対応するノードをクリックし(1回目のクリック)、次に分析ボタン61をクリックする(2回目のクリック)。この操作により、1回目にクリックされたノードに対応する単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる1個のノードを選択し、分析開始を選択することにより、1個の注目語を指定する指示が入力される。 As shown in FIG. 6, the user first clicks the node corresponding to the word (here, “open-air bath”) specified as the word of interest in the window 41 (first click), and then clicks the analysis button 61. Click (second click). By this operation, the word corresponding to the node clicked for the first time is designated as the word of interest. In this way, by selecting one node included in the whole co-occurrence network in the screen including the whole co-occurrence network and selecting the start of analysis, an instruction to specify one attention word is input.

図7に示すように、利用者は、ウインドウ41内で注目語として指定する単語(ここでは「露天風呂」)に対応するノードをダブルクリックする。この操作により、ダブルクリックされたノードに対応する単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる1個のノードを続けて選択することにより、1個の注目語を指定する指示が入力される。 As shown in FIG. 7, the user double-clicks the node corresponding to the word designated as the attention word (here, “open-air bath”) in the window 41. By this operation, the word corresponding to the double-clicked node is designated as the attention word. In this way, by continuously selecting one node included in the whole co-occurrence network in the screen including the whole co-occurrence network, an instruction to specify one attention word is input.

図8に示すように、利用者は、ウインドウ41内でまず注目語として指定する単語(ここでは「露天風呂」)に対応するノードをクリックし(1回目のクリック)、次に注目語として指定する別の単語(ここでは「値段」)に対応するノードをクリックし(2回目のクリック)、最後に分析ボタン61をクリックする(最後のクリック)。この操作により、1回目と2回目にクリックされたノードに対応する2個の単語が注目語として指定される。利用者は、ウインドウ41内でp個(pは3以上の整数)のノードを順にクリックし、最後に分析ボタン61をクリックしてもよい。この操作により、p個のノードに対応するp個の単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる複数のノードを選択し、分析開始を選択することにより、複数の注目語を指定する指示が入力される。 As shown in FIG. 8, the user first clicks the node corresponding to the word designated as the attention word (here, “open-air bath”) in the window 41 (first click), and then designates it as the attention word. Click the node corresponding to another word (here, "price") (second click), and finally click the analysis button 61 (last click). By this operation, the two words corresponding to the nodes clicked the first time and the second time are designated as the words of interest. The user may click p nodes (p is an integer of 3 or more) in order in the window 41, and finally click the analysis button 61. By this operation, p words corresponding to p nodes are designated as attention words. In this way, by selecting a plurality of nodes included in the global co-occurrence network in the screen including the global co-occurrence network and selecting start analysis, instructions for designating a plurality of attention words are input.

図9に示すように、利用者は、ウインドウ41内で注目語として指定する2個の単語(ここでは「露天風呂」と「階段」)に対応する2個のノードを接続するエッジをダブルクリックする。これにより、ダブルクリックされたエッジに接続された2個のノードに対応する2個の単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる1個のエッジを続けて選択することにより、2個の注目語を指定する指示が入力される。 As shown in FIG. 9, the user double-clicks the edge connecting the two nodes corresponding to the two words (here, "open-air bath" and "stairs") specified as the words of interest in the window 41. do. As a result, the two words corresponding to the two nodes connected to the double-clicked edge are designated as the words of interest. In this way, by continuously selecting one edge included in the whole co-occurrence network in the screen including the whole co-occurrence network, an instruction to specify two attention words is input.

図10に示すように、利用者は、ウインドウ41内でまず注目語として指定する2個の単語(ここでは「露天風呂」と「階段」)に対応する2個のノードを接続するエッジをクリックし(1回目のクリック)、次に分析ボタン61をクリックする(2回目のクリック)。これにより、1回目にクリックされたエッジに接続された2個のノードに対応する2個の単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる1個のエッジを選択し、分析開始を選択することにより、2個の注目語を指定する指示が入力される。 As shown in FIG. 10, the user first clicks on the edge connecting the two nodes corresponding to the two words (here, "open-air bath" and "stairs") designated as the attention words in the window 41. Then click the analysis button 61 (second click). As a result, the two words corresponding to the two nodes connected to the edge clicked the first time are designated as the words of interest. In this way, by selecting one edge included in the whole co-occurrence network in the screen including the whole co-occurrence network and selecting the start of analysis, an instruction to specify two attention words is input.

図11に示すように、利用者は、ウインドウ41内でまず注目語として指定する2個の単語(ここでは「露天風呂」と「階段」)に対応する2個のノードを接続するエッジをクリックし(1回目のクリック)、次に注目語として指定する別の2個の単語(ここでは「値段」と「考える」)に対応する2個のノードを接続するエッジをクリックし(2回目のクリック)、最後に分析ボタン61をクリックする(最後のクリック)。この操作により、1回目と2回目にクリックされた2個のエッジに接続された4個のノードに対応する4個の単語が注目語として指定される。利用者は、ウインドウ41内でq本(qは3以上の整数)のエッジを順にクリックし、最後に分析ボタン61をクリックしてもよい。この操作により、q本のエッジに接続された2q個のノードに対応する2q個の単語が注目語として指定される。このように全体共起ネットワークを含む画面内で全体共起ネットワークに含まれる複数のエッジを選択し、分析開始を選択することにより、複数の注目語を指定する指示が入力される。 As shown in FIG. 11, the user first clicks on the edge connecting the two nodes corresponding to the two words (here, "open-air bath" and "stairs") designated as the attention words in the window 41. (1st click), then click the edge connecting the 2 nodes corresponding to the other 2 words (here "price" and "think") that you specify as the word of interest (2nd click) Click), and finally click the analysis button 61 (last click). By this operation, four words corresponding to the four nodes connected to the two edges clicked the first time and the second time are designated as the words of interest. The user may click q edges (q is an integer of 3 or more) in order in the window 41, and finally click the analysis button 61. By this operation, 2q words corresponding to 2q nodes connected to q edges are designated as attention words. In this way, by selecting a plurality of edges included in the whole co-occurrence network in the screen including the whole co-occurrence network and selecting start analysis, instructions for designating a plurality of attention words are input.

指示入力部11は、ステップS111において、注目語を指定する指示に加えて、共起行列の基準値を設定する指示、AND処理とOR処理を切り替える指示、共起ネットワークの表示態様の詳細を設定する指示などを受け取ってもよい。受け取った指示は、テキストマイニング装置10の各部に対して出力される。 In step S111, the instruction input unit 11 sets, in addition to the instruction to specify the word of interest, an instruction to set a reference value of the co-occurrence matrix, an instruction to switch between AND processing and OR processing, and details of the display mode of the co-occurrence network. You may receive instructions to do so. The received instruction is output to each part of the text mining device 10.

次に、単語抽出部13は、ステップS102で読み出したテキストデータからステップS111で指定された注目語を含む文を抽出することにより、注目語を含む文からなる限定テキストデータを求める(ステップS112)。 Next, the word extraction unit 13 obtains limited text data consisting of sentences including the attention word by extracting a sentence including the attention word specified in step S111 from the text data read in step S102 (step S112). ..

単語抽出部13は、複数の注目語が指定された場合にAND処理とOR処理のうちいずれを行うかを示すフラグを有している。フラグの値は、予め決定された値でもよく、指示入力部11を用いて利用者から設定された値でもよい。フラグがAND処理を示す場合、単語抽出部13は、読み出したテキストデータから指定された複数の注目語のすべてを含む文を抽出することにより、限定テキストデータを求める。フラグがOR処理を示す場合、単語抽出部13は、読み出したテキストデータから指定されたいずれかの注目語を含む文を抽出することにより、限定テキストデータを求める。 The word extraction unit 13 has a flag indicating which of the AND process and the OR process is to be performed when a plurality of noteworthy words are specified. The value of the flag may be a predetermined value or a value set by the user using the instruction input unit 11. When the flag indicates AND processing, the word extraction unit 13 obtains limited text data by extracting a sentence including all of a plurality of designated words of interest from the read text data. When the flag indicates OR processing, the word extraction unit 13 obtains limited text data by extracting a sentence including any of the designated words of interest from the read text data.

次に、単語抽出部13は、ステップS112で求めた限定テキストデータに対して形態素解析を行うことにより、限定テキストデータから単語を抽出する(ステップS113)。次に、共起行列生成部14は、ステップS113で抽出された単語について、ステップS112で求められた限定テキストデータを用いて共起行列を生成する(ステップS114)。次に、共起ネットワーク生成部15は、ステップS114で生成された共起行列に基づき、限定共起ネットワークを生成する(ステップS115)。なお、ステップS103〜S105とステップS113〜S115の間では、処理対象は異なるが、処理内容は同じである。 Next, the word extraction unit 13 extracts words from the limited text data by performing morphological analysis on the limited text data obtained in step S112 (step S113). Next, the co-occurrence matrix generation unit 14 generates a co-occurrence matrix for the words extracted in step S113 using the limited text data obtained in step S112 (step S114). Next, the co-occurrence network generation unit 15 generates a limited co-occurrence network based on the co-occurrence matrix generated in step S114 (step S115). The processing targets are different between steps S103 to S105 and steps S113 to S115, but the processing contents are the same.

一般に、ステップS112で求められた限定テキストデータから抽出される単語の種類は、ステップS102で読み出されたテキストデータから抽出される単語の種類よりも少ない。ステップS114で生成された共起行列は、ステップS104で生成された共起行列とは異なる。ステップS115で生成された限定共起ネットワークは、ステップS105で生成された全体共起ネットワークとは異なる。 Generally, the types of words extracted from the limited text data obtained in step S112 are smaller than the types of words extracted from the text data read in step S102. The co-occurrence matrix generated in step S114 is different from the co-occurrence matrix generated in step S104. The limited co-occurrence network generated in step S115 is different from the whole co-occurrence network generated in step S105.

次に、画面表示部16は、ステップS115で生成された限定共起ネットワークを含む画面を表示する(ステップS116)。図12および図13は、ステップS116で表示される、限定共起ネットワークを含むウインドウの例を示す図である。図12に示すウインドウ42は、1個の注目語(ここでは「露天風呂」)を指定したときの限定共起ネットワーク52を含んでいる。図13に示すウインドウ43は、2個の注目語(ここでは「露天風呂」と「浴場」)を指定したときの限定共起ネットワーク53を含んでいる。 Next, the screen display unit 16 displays a screen including the limited co-occurrence network generated in step S115 (step S116). 12 and 13 are diagrams showing an example of a window containing a limited co-occurrence network displayed in step S116. The window 42 shown in FIG. 12 includes a limited co-occurrence network 52 when one noteworthy word (here, “open-air bath”) is specified. The window 43 shown in FIG. 13 includes a limited co-occurrence network 53 when two notable words (here, “open-air bath” and “bathhouse”) are specified.

図14および図15は、テキストマイニング装置10の表示画面の例を示す図である。画面表示部16は、全体共起ネットワークを含むウインドウと限定共起ネットワークを含むウインドウとを重ねずに並べて表示してもよく、両者を重ねて表示してもよい。図14に示す画面71では、全体共起ネットワーク51を含むウインドウ41と限定共起ネットワーク52を含むウインドウ42とは、重ねずに並べて表示されている。利用者は、画面71において、全体共起ネットワーク51と限定共起ネットワーク52を同時に見ることができる。図15に示す画面72では、限定共起ネットワーク52を含むウインドウ42は、全体共起ネットワーク51を含むウインドウ41に重ねて表示されている。利用者は、画面72において、全体共起ネットワーク51と限定共起ネットワーク52を切り替えて見ることができる。 14 and 15 are diagrams showing an example of a display screen of the text mining device 10. The screen display unit 16 may display the window including the whole co-occurrence network and the window including the limited co-occurrence network side by side without overlapping, or may display both of them in an overlapping manner. In the screen 71 shown in FIG. 14, the window 41 including the whole co-occurrence network 51 and the window 42 including the limited co-occurrence network 52 are displayed side by side without overlapping. The user can see the whole co-occurrence network 51 and the limited co-occurrence network 52 at the same time on the screen 71. In the screen 72 shown in FIG. 15, the window 42 including the limited co-occurrence network 52 is displayed superimposed on the window 41 including the whole co-occurrence network 51. The user can switch between the whole co-occurrence network 51 and the limited co-occurrence network 52 on the screen 72.

次に、指示入力部11は、利用者から指示を受け取る(ステップS121)。次に、テキストマイニング装置10は、ステップS121で受け取った指示が注目語を指定する指示か否かを判断する(ステップS122)。ステップS122でYesの場合、テキストマイニング装置10の制御はステップS112へ進む。この場合、ステップS121で指定された注目語についてステップS112〜S116が実行され、ステップS121で指定された注目語を含む文からなる限定テキストデータに基づく限定共起ネットワークを含む画面が表示される。 Next, the instruction input unit 11 receives an instruction from the user (step S121). Next, the text mining device 10 determines whether or not the instruction received in step S121 is an instruction for designating a word of interest (step S122). If Yes in step S122, the control of the text mining device 10 proceeds to step S112. In this case, steps S112 to S116 are executed for the attention word specified in step S121, and a screen including a limited co-occurrence network based on limited text data consisting of sentences including the attention word specified in step S121 is displayed.

図16は、テキストマイニング装置10の表示画面の例を示す図である。図16に示す画面73では、全体共起ネットワーク51を含むウインドウ41と限定共起ネットワーク52を含むウインドウ42とに重ねて、注目語として「浴場」を指定したときの限定共起ネットワーク54を含むウインドウ44が表示されている。画面73は、ステップS111で「露天風呂」を注目語として指定し、ステップS121で「浴場」を注目語として指定したときに表示される。利用者は、画面73において、全体共起ネットワーク51と限定共起ネットワーク52、54を切り替えて見ることができる。 FIG. 16 is a diagram showing an example of a display screen of the text mining device 10. In the screen 73 shown in FIG. 16, the window 41 including the whole co-occurrence network 51 and the window 42 including the limited co-occurrence network 52 are overlapped with each other, and the limited co-occurrence network 54 when "bath" is designated as a noteworthy word is included. The window 44 is displayed. The screen 73 is displayed when "open-air bath" is designated as a noteworthy word in step S111 and "bathhouse" is designated as a noteworthy word in step S121. The user can switch between the whole co-occurrence network 51 and the limited co-occurrence networks 52 and 54 on the screen 73.

ステップS122でNoの場合、テキストマイニング装置10の制御はステップS123へ進む。この場合、ステップS121で受け取った指示は、例えば、ウインドウを移動させる指示、ウインドウを非表示にする指示、ウインドウを閉じる指示、ウインドウを併合する指示などである。利用者は、全体共起ネットワークと限定共起ネットワークを含む画面が表示されているときに指示入力部11を操作することにより、これらの指示を入力する。画面表示部16は、ステップS121で受け取った指示に従い、更新後の画面を表示する(ステップS123)。その後、テキストマイニング装置10の制御は、ステップS121へ進む。 If No in step S122, the control of the text mining device 10 proceeds to step S123. In this case, the instructions received in step S121 are, for example, an instruction to move the window, an instruction to hide the window, an instruction to close the window, an instruction to merge the windows, and the like. The user inputs these instructions by operating the instruction input unit 11 when the screen including the whole co-occurrence network and the limited co-occurrence network is displayed. The screen display unit 16 displays the updated screen according to the instruction received in step S121 (step S123). After that, the control of the text mining device 10 proceeds to step S121.

図17は、ウインドウを併合する操作を示す図である。図17に示す画面74には、「露天風呂」を注目語として指定したときの限定共起ネットワーク52を含むウインドウ42と、「浴場」を注目語として指定したときの限定共起ネットワーク54を含むウインドウ44とが表示されている。利用者は、画面74において、2個の限定共起ネットワーク52、54を同時に見ることができる。 FIG. 17 is a diagram showing an operation of merging windows. The screen 74 shown in FIG. 17 includes a window 42 including a limited co-occurrence network 52 when "open-air bath" is designated as a noteworthy word, and a limited co-occurrence network 54 when "bathhouse" is designated as a noteworthy word. Window 44 is displayed. The user can simultaneously view the two limited co-occurrence networks 52 and 54 on the screen 74.

図17に示すハッチング付き矢印は、マウス29のボタンが押された状態でマウスカーソル62が移動したことを示す。この矢印は、実際の画面には表示されない。利用者は、画面74内で限定共起ネットワーク52を掴んで限定共起ネットワーク54内で離す操作(ドロップ操作)を行う。より詳細には、利用者は、マウスカーソル62がウインドウ42内にあるときにマウス29のボタンを押し、マウス29のボタンを押したままでマウスカーソル62をウインドウ44内まで移動させて、マウスカーソル62がウインドウ44内にあるときにマウス29のボタンを離す。この操作により、ウインドウを併合する指示が入力される。 The hatched arrow shown in FIG. 17 indicates that the mouse cursor 62 has moved while the button of the mouse 29 is pressed. This arrow does not appear on the actual screen. The user performs an operation (drop operation) of grasping the limited co-occurrence network 52 in the screen 74 and releasing it in the limited co-occurrence network 54. More specifically, the user presses the button of the mouse 29 when the mouse cursor 62 is in the window 42, moves the mouse cursor 62 into the window 44 while holding down the button of the mouse 29, and causes the mouse cursor 62. Release the mouse 29 button when is in the window 44. By this operation, an instruction to merge windows is input.

図18は、図17に示す操作を行った後の表示画面を示す図である。図18に示す画面75には、複数の限定共起ネットワークをタブ形式で表示するウインドウ45が表示されている。図18では、「露天風呂」と記載したタブ64が選択され、ウインドウ45には「露天風呂」を注目語として指定したときの限定共起ネットワーク52が表示されている。「浴場」と記載したタブ63が選択されたときには、ウインドウ45には図17に示す限定共起ネットワーク54が表示される。 FIG. 18 is a diagram showing a display screen after performing the operation shown in FIG. On the screen 75 shown in FIG. 18, a window 45 for displaying a plurality of limited co-occurrence networks in a tab format is displayed. In FIG. 18, the tab 64 described as “open-air bath” is selected, and the window 45 displays the limited co-occurrence network 52 when “open-air bath” is designated as a noteworthy word. When the tab 63 described as "bathhouse" is selected, the window 45 displays the limited co-occurrence network 54 shown in FIG.

利用者がウインドウ45内の閉じるボタン(×印)をクリックしたときに、ウインドウ45は閉じる。利用者がタブ63内の閉じるボタンをクリックしたときには、タブ63は表示されなくなる。利用者がタブ64内の閉じるボタンをクリックしたときには、タブ64は表示されなくなり、ウインドウ45には限定共起ネットワーク54が表示される。 When the user clicks the close button (x mark) in the window 45, the window 45 closes. When the user clicks the close button in the tab 63, the tab 63 disappears. When the user clicks the close button in the tab 64, the tab 64 is not displayed and the limited co-occurrence network 54 is displayed in the window 45.

以上に示すように、本実施形態に係るテキストマイニング方法は、テキストデータから単語を抽出するステップ(ステップS102、S103、S112、S113)と、抽出した単語について共起行列を生成するステップ(ステップS104、S114)と、生成した共起行列に基づき共起ネットワークを生成するステップ(ステップS105、S115)と、共起ネットワークを含む画面を表示するステップ(ステップS106、S116)とを備えている。指定されたテキストデータの全体に基づく第1共起ネットワーク(全体共起ネットワーク51)を含む第1画面(ウインドウ41を含む画面)内で注目語を指定する指示が入力されたときに、単語を抽出するステップ(ステップS112、S113)は指定されたテキストデータのうち注目語を含む部分(注目語を含む文)からなる限定テキストデータから単語を抽出し、共起行列を生成するステップ(ステップS114)は抽出した単語について限定テキストデータを用いて第2共起行列を生成し、共起ネットワークを生成するステップ(ステップS115)は第2共起行列に基づき第2共起ネットワーク(限定共起ネットワーク52〜54)を生成し、画面を表示するステップ(ステップS116)は第2共起ネットワークを含む第2画面(ウインドウ42〜45を含む画面)を表示する。このように本実施形態に係るテキストマイニング方法では、指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、指定されたテキストデータのうち注目語を含む部分に基づく第2共起ネットワークを含む第2画面が表示される。したがって、注目語を指定したときの共起ネットワークを含む画面を簡単な操作で表示することができる。 As described above, in the text mining method according to the present embodiment, a step of extracting words from text data (steps S102, S103, S112, S113) and a step of generating a co-occurrence matrix for the extracted words (step S104). , S114), a step of generating a co-occurrence network based on the generated co-occurrence matrix (steps S105 and S115), and a step of displaying a screen including the co-occurrence network (steps S106 and S116). When an instruction to specify a word of interest is input in the first screen (screen including the window 41) including the first co-occurrence network (total co-occurrence network 51) based on the entire specified text data, the word is input. The extraction step (steps S112 and S113) is a step (step S114) of extracting a word from the limited text data consisting of a portion including the attention word (sentence including the attention word) in the designated text data and generating a co-occurrence matrix. ) Generates a second co-occurrence matrix using limited text data for the extracted word, and the step of generating a co-occurrence network (step S115) is a second co-occurrence network (limited co-occurrence network) based on the second co-occurrence matrix. The step of generating 52 to 54) and displaying the screen (step S116) displays the second screen (screen including windows 42 to 45) including the second co-occurrence network. As described above, in the text mining method according to the present embodiment, the text mining method is designated when an instruction to specify a word of interest is input in the first screen including the first co-occurrence network based on the entire designated text data. The second screen including the second co-occurrence network based on the part of the text data including the word of interest is displayed. Therefore, the screen including the co-occurrence network when the attention word is specified can be displayed by a simple operation.

また、第1画面内で第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、ノードに対応する単語を注目語として指定する指示が入力される(図6、図8)。このように第1画面内で1個または複数のノードと分析開始を選択することにより、1個または複数の注目語を指定する指示を簡単な操作で入力し、1個または複数の注目語を指定したときの共起ネットワークを含む画面を表示することができる。また、第1画面内で第1共起ネットワークに含まれる1個のノードを続けて選択することにより、ノードに対応する単語を注目語として指定する指示が入力される(図7)。このように第1画面内で1個のノード続けて選択することにより、1個の注目語を指定する指示を簡単な操作で入力し、1個の注目語を指定したときの共起ネットワークを含む画面を表示することができる。 In addition, by selecting one or more nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction to specify the word corresponding to the node as the word of interest is input (). 6 and 8). By selecting one or more nodes and start analysis in the first screen in this way, you can easily enter instructions to specify one or more attention words, and one or more attention words can be selected. A screen including the co-occurrence network at the specified time can be displayed. Further, by continuously selecting one node included in the first co-occurrence network in the first screen, an instruction to specify the word corresponding to the node as the word of interest is input (FIG. 7). By selecting in this way continues to one of the nodes in the first screen, co-occurrence network when inputs an instruction to specify one noteworthy by a simple operation, specifying one noteworthy Can display screens that include.

また、第1画面内で第1共起ネットワークに含まれる1本のエッジを続けて選択することにより、エッジに接続された2個のノードに対応する単語を注目語として指定する指示が入力される(図9)。このように第1画面内で1本のエッジを続けて選択することにより、2個の注目語を指定する指示を簡単な操作で入力し、2個の注目語を指定したときの共起ネットワークを含む画面を表示することができる。また、第1画面内で第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、エッジに接続された複数のノードに対応する単語を注目語として指定する指示が入力される(図10、図11)。このように第1画面内で1本または複数のエッジと分析開始を選択することにより、複数の注目語を指定する指示を簡単な操作で入力し、複数の注目語を指定したときの共起ネットワークを含む画面を表示することができる。
In addition, by continuously selecting one edge included in the first co-occurrence network in the first screen, an instruction to specify the word corresponding to the two nodes connected to the edge as the word of interest is input. (Fig. 9). By continuously selecting one edge in the first screen in this way, an instruction to specify two attention words can be input with a simple operation, and a co-occurrence network when two attention words are specified. Can display screens that include. Also, by selecting one or more edges included in the first co-occurrence network in the first screen and selecting start analysis, the words corresponding to the multiple nodes connected to the edges are specified as the words of interest. Instructions to be input are input (FIGS. 10 and 11). By selecting one or more edges and the start of analysis in the first screen in this way, an instruction to specify multiple attention words can be input with a simple operation, and co-occurrence when multiple attention words are specified. You can display a screen that includes the network.

また、複数の第2共起ネットワーク(限定共起ネットワーク52、54)を含む第2画面(画面74)内で併合指示が入力されたときに(図17)、画面を表示するステップは、複数の第2共起ネットワークをタブ形式で表示する(図18)。これにより、複数の第2共起ネットワークをコンパクトに表示することができる。また、第2画面内で一の第2共起ネットワーク(限定共起ネットワーク52)を掴んで他の第2共起ネットワーク(限定共起ネットワーク54)内で離すことにより、併合指示が入力される。したがって、併合指示を簡単な操作で入力し、複数の第2共起ネットワークをコンパクトに表示することができる。 Further, when the merge instruction is input in the second screen (screen 74) including the plurality of second co-occurrence networks (limited co-occurrence networks 52, 54) (FIG. 17), there are a plurality of steps for displaying the screen. The second co-occurrence network of No. 1 is displayed in a tab format (FIG. 18). As a result, a plurality of second co-occurrence networks can be displayed compactly. Further, by grasping one second co-occurrence network (limited co-occurrence network 52) in the second screen and separating it in another second co-occurrence network (limited co-occurrence network 54), a merge instruction is input. .. Therefore, the merge instruction can be input by a simple operation, and a plurality of second co-occurrence networks can be displayed compactly.

限定テキストデータは、指定されたテキストデータのうち注目語を含む文から構成されていてもよい。この場合、注目語を指定する指示が入力されたときに、指定されたテキストデータを文単位で分けて限定テキストデータを求め、求めた限定テキストデータに基づく第2共起ネットワークを含む画面を表示することができる。複数の注目語が指定されたときの限定テキストデータは、指定されたテキストデータのうち複数の注目語のすべてを含む文から構成されていてもよい。この場合、複数の注目語についてAND処理を行ったときの第2共起ネットワークを含む画面を表示することができる。複数の注目語が指定されたときの限定テキストデータは、指定されたテキストデータのうち複数の注目語のいずれかを含む文から構成されていてもよい。この場合、複数の注目語についてOR処理を行ったときの第2共起ネットワークを含む画面を表示することができる。また、共起行列を生成するステップは、Jaccard係数を要素とする共起行列を生成する。したがって、テキストデータに含まれる単語の共起性を好適に分析することができる。 The limited text data may be composed of sentences including the word of interest in the designated text data. In this case, when an instruction to specify a word of interest is input, the specified text data is divided into sentence units to obtain limited text data, and a screen including the second co-occurrence network based on the obtained limited text data is displayed. can do. The limited text data when a plurality of attention words are specified may be composed of a sentence including all of the plurality of attention words in the specified text data. In this case, it is possible to display a screen including the second co-occurrence network when AND processing is performed on a plurality of attention words. The limited text data when a plurality of attention words are specified may be composed of a sentence including any one of the plurality of attention words among the specified text data. In this case, it is possible to display a screen including the second co-occurrence network when OR processing is performed on a plurality of attention words. Further, the step of generating a co-occurrence matrix generates a co-occurrence matrix having a Jaccard coefficient as an element. Therefore, the co-occurrence of words contained in the text data can be suitably analyzed.

本実施形態に係るテキストマイニング装置10およびテキストマイニングプログラム31は、上記のテキストマイニング方法と同様の特徴を有し、同様の効果を奏する。本実施形態に係るテキストマイニング方法、テキストマイニング装置10、および、テキストマイニングプログラム31によれば、注目語を指定したときの共起ネットワークを含む画面を簡単な操作で表示することができる。 The text mining device 10 and the text mining program 31 according to the present embodiment have the same characteristics as the above-mentioned text mining method, and have the same effects. According to the text mining method, the text mining device 10, and the text mining program 31 according to the present embodiment, it is possible to display a screen including a co-occurrence network when a word of interest is specified by a simple operation.

10…テキストマイニング装置
11…指示入力部
12…テキストデータ記憶部
13…単語抽出部
14…共起行列生成部
15…共起ネットワーク生成部
16…画面表示部
20…コンピュータ
21…CPU
22…メインメモリ
29…マウス
30…記録媒体
31…テキストマイニングプログラム
32…テキストデータ
41〜45…ウインドウ
51…全体共起ネットワーク
52〜54…限定共起ネットワーク
61…分析ボタン
62…マウスカーソル
63〜64…タブ
71〜75…画面
10 ... Text mining device 11 ... Instruction input unit 12 ... Text data storage unit 13 ... Word extraction unit 14 ... Co-occurrence matrix generation unit 15 ... Co-occurrence network generation unit 16 ... Screen display unit 20 ... Computer 21 ... CPU
22 ... Main memory 29 ... Mouse 30 ... Recording medium 31 ... Text mining program 32 ... Text data 41-45 ... Window 51 ... Overall co-occurrence network 52-54 ... Limited co-occurrence network 61 ... Analysis button 62 ... Mouse cursor 63-64 … Tab 71-75… screen

Claims (20)

テキストデータの分析結果を含む画面を表示するテキストマイニング方法であって、
テキストデータから単語を抽出するステップと、
前記単語について共起行列を生成するステップと、
前記共起行列に基づき共起ネットワークを生成するステップと、
前記共起ネットワークを含む画面を表示するステップとを備え、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語を抽出するステップは前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列を生成するステップは前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワークを生成するステップは前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面を表示するステップは前記第2共起ネットワークを含む第2画面を表示することを特徴とする、テキストマイニング方法。
It is a text mining method that displays a screen containing the analysis results of text data.
Steps to extract words from text data,
Steps to generate a co-occurrence matrix for the word,
Steps to generate a co-occurrence network based on the co-occurrence matrix,
A step of displaying a screen including the co-occurrence network is provided.
When an instruction to specify a word of interest is input in the first screen including the first co-occurrence network based on the entire specified text data, the step of extracting the word is the step of the specified text data. In the step of extracting the word from the limited text data including the part including the word of interest and generating the co-occurrence matrix, a second co-occurrence matrix is generated for the word using the limited text data, and the co-occurrence network is formed. The generation step generates a second co-occurrence network based on the second co-occurrence matrix, and the step of displaying the screen displays a second screen including the second co-occurrence network. Text mining. Method.
前記第1画面内で前記第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項1に記載のテキストマイニング方法。 By selecting one or more nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction to specify the word corresponding to the node as the attention word is input. The text mining method according to claim 1, wherein the text mining method is characterized by the above. 前記第1画面内で前記第1共起ネットワークに含まれる1個のノードを続けて選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項1に記載のテキストマイニング方法。 By continuously selecting one node included in the first co-occurrence network in the first screen, an instruction for designating the word corresponding to the node as the attention word is input. , The text mining method according to claim 1. 前記第1画面内で前記第1共起ネットワークに含まれる1本のエッジを続けて選択することにより、前記エッジに接続された2個のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項1に記載のテキストマイニング方法。 By continuously selecting one edge included in the first co-occurrence network in the first screen, an instruction to specify a word corresponding to two nodes connected to the edge as the attention word is given. The text mining method according to claim 1, wherein the text mining method is input. 前記第1画面内で前記第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、前記エッジに接続された複数のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項1に記載のテキストマイニング方法。 By selecting one or more edges included in the first co-occurrence network in the first screen and selecting start analysis, the word corresponding to the plurality of nodes connected to the edge is referred to as the attention word. The text mining method according to claim 1, wherein an instruction specified as is input. 複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面を表示するステップは、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする、請求項1に記載のテキストマイニング方法。 When a merge instruction is input in a second screen including a plurality of second co-occurrence networks, the step of displaying the screen is characterized in that the plurality of second co-occurrence networks are displayed in a tab format. , The text mining method according to claim 1. 前記第2画面内で一の第2共起ネットワークを掴んで他の第2共起ネットワーク内で離すことにより、前記併合指示が入力されることを特徴とする、請求項6に記載のテキストマイニング方法。 The text mining according to claim 6, wherein the merge instruction is input by grasping one second co-occurrence network in the second screen and separating it in another second co-occurrence network. Method. 前記限定テキストデータは、前記指定されたテキストデータのうち前記注目語を含む文からなることを特徴とする、請求項1に記載のテキストマイニング方法。 The text mining method according to claim 1, wherein the limited text data is composed of a sentence including the attention word among the designated text data. 複数の注目語が指定されたときの前記限定テキストデータは、前記指定されたテキストデータのうち前記複数の注目語のすべてを含む文からなることを特徴とする、請求項8に記載のテキストマイニング方法。 The text mining according to claim 8, wherein the limited text data when a plurality of attention words are designated comprises a sentence including all of the plurality of attention words among the designated text data. Method. 複数の注目語が指定されたときの前記限定テキストデータは、前記指定されたテキストデータのうち前記複数の注目語のいずれかを含む文からなることを特徴とする、請求項8に記載のテキストマイニング方法。 The text according to claim 8, wherein the limited text data when a plurality of attention words are designated comprises a sentence including any one of the plurality of attention words among the designated text data. Mining method. 前記共起行列を生成するステップは、Jaccard係数を要素とする共起行列を生成することを特徴とする、請求項1に記載のテキストマイニング方法。 The text mining method according to claim 1, wherein the step of generating the co-occurrence matrix is characterized by generating a co-occurrence matrix having a Jaccard coefficient as an element. テキストデータの分析結果を含む画面を表示するためのテキストマイニングプログラムであって、
テキストデータから単語を抽出するステップと、
前記単語について共起行列を生成するステップと、
前記共起行列に基づき共起ネットワークを生成するステップと、
前記共起ネットワークを含む画面を表示するステップとをコンピュータにCPUがメモリを利用して実行させ、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語を抽出するステップは前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列を生成するステップは前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワークを生成するステップは前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面を表示するステップは前記第2共起ネットワークを含む第2画面を表示することを特徴とする、テキストマイニングプログラム。
A text mining program for displaying screens containing analysis results of text data.
Steps to extract words from text data,
Steps to generate a co-occurrence matrix for the word,
Steps to generate a co-occurrence network based on the co-occurrence matrix,
The CPU causes the computer to execute the step of displaying the screen including the co-occurrence network by using the memory.
When an instruction to specify a word of interest is input in the first screen including the first co-occurrence network based on the entire specified text data, the step of extracting the word is the step of the specified text data. In the step of extracting the word from the limited text data including the part including the word of interest and generating the co-occurrence matrix, a second co-occurrence matrix is generated for the word using the limited text data, and the co-occurrence network is formed. The generation step generates a second co-occurrence network based on the second co-occurrence matrix, and the step of displaying the screen displays a second screen including the second co-occurrence network. Text mining. program.
前記第1画面内で前記第1共起ネットワークに含まれる1個または複数のノードを選択し、分析開始を選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項12に記載のテキストマイニングプログラム。 By selecting one or more nodes included in the first co-occurrence network in the first screen and selecting start analysis, an instruction to specify the word corresponding to the node as the attention word is input. The text mining program according to claim 12, wherein the text mining program is characterized in that. 前記第1画面内で前記第1共起ネットワークに含まれる1個のノードを続けて選択することにより、前記ノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項12に記載のテキストマイニングプログラム。 By continuously selecting one node included in the first co-occurrence network in the first screen, an instruction for designating the word corresponding to the node as the attention word is input. , The text mining program according to claim 12. 前記第1画面内で前記第1共起ネットワークに含まれる1本のエッジを続けて選択することにより、前記エッジに接続された2個のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項12に記載のテキストマイニングプログラム。 By continuously selecting one edge included in the first co-occurrence network in the first screen, an instruction to specify a word corresponding to two nodes connected to the edge as the attention word is given. The text mining program according to claim 12, wherein the text mining program is input. 前記第1画面内で前記第1共起ネットワークに含まれる1本または複数のエッジを選択し、分析開始を選択することにより、前記エッジに接続された複数のノードに対応する単語を前記注目語として指定する指示が入力されることを特徴とする、請求項12に記載のテキストマイニングプログラム。 By selecting one or more edges included in the first co-occurrence network in the first screen and selecting start analysis, the word corresponding to the plurality of nodes connected to the edge is referred to as the attention word. 12. The text mining program according to claim 12, wherein an instruction is input. 複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面を表示するステップは、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする、請求項12に記載のテキストマイニングプログラム。 When a merge instruction is input in a second screen including a plurality of second co-occurrence networks, the step of displaying the screen is characterized in that the plurality of second co-occurrence networks are displayed in a tab format. , The text mining program according to claim 12. 前記第2画面内で一の第2共起ネットワークを掴んで他の第2共起ネットワーク内で離すことにより、前記併合指示が入力されることを特徴とする、請求項17に記載のテキストマイニングプログラム。 The text mining according to claim 17, wherein the merge instruction is input by grasping one second co-occurrence network in the second screen and separating it in another second co-occurrence network. program. テキストデータの分析結果を含む画面を表示するテキストマイニング装置であって、
テキストデータから単語を抽出する単語抽出部と、
前記単語について共起行列を生成する共起行列生成部と、
前記共起行列に基づき共起ネットワークを生成する共起ネットワーク生成部と、
前記共起ネットワークを含む画面を表示する画面表示部とを備え、
指定されたテキストデータの全体に基づく第1共起ネットワークを含む第1画面内で注目語を指定する指示が入力されたときに、前記単語抽出部は前記指定されたテキストデータのうち前記注目語を含む部分からなる限定テキストデータから前記単語を抽出し、前記共起行列生成部は前記単語について前記限定テキストデータを用いて第2共起行列を生成し、前記共起ネットワーク生成部は前記第2共起行列に基づき第2共起ネットワークを生成し、前記画面表示部は前記第2共起ネットワークを含む第2画面を表示することを特徴とする、テキストマイニング装置。
A text mining device that displays a screen containing the analysis results of text data.
A word extractor that extracts words from text data,
A co-occurrence matrix generator that generates a co-occurrence matrix for the word,
A co-occurrence network generation unit that generates a co-occurrence network based on the co-occurrence matrix,
It is provided with a screen display unit that displays a screen including the co-occurrence network.
When an instruction to specify a noteworthy word is input in the first screen including the first co-occurrence network based on the entire designated text data, the word extraction unit uses the designated text data to indicate the noteworthy word. The word is extracted from the limited text data including the portion including, the co-occurrence matrix generation unit generates a second co-occurrence matrix using the limited text data for the word, and the co-occurrence network generation unit generates the first co-occurrence network. A text mining device, characterized in that a second co-occurrence network is generated based on a two co-occurrence matrix, and the screen display unit displays a second screen including the second co-occurrence network.
複数の第2共起ネットワークを含む第2画面内で併合指示が入力されたときに、前記画面表示部は、前記複数の第2共起ネットワークをタブ形式で表示することを特徴とする、請求項19に記載のテキストマイニング装置。 When a merge instruction is input in a second screen including a plurality of second co-occurrence networks, the screen display unit displays the plurality of second co-occurrence networks in a tab format. Item 19. The text mining apparatus according to Item 19.
JP2018052074A 2018-03-20 2018-03-20 Text mining methods, text mining programs, and text mining equipment Active JP6987003B2 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2018052074A JP6987003B2 (en) 2018-03-20 2018-03-20 Text mining methods, text mining programs, and text mining equipment
KR1020190013093A KR102162779B1 (en) 2018-03-20 2019-01-31 Text mining method, text mining program and text mining apparatus
CN201910096738.5A CN110309290B (en) 2018-03-20 2019-01-31 Text mining method, text mining program, and text mining device
TW108106540A TWI703457B (en) 2018-03-20 2019-02-26 Text exploration method, text exploration program and text exploration device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018052074A JP6987003B2 (en) 2018-03-20 2018-03-20 Text mining methods, text mining programs, and text mining equipment

Publications (3)

Publication Number Publication Date
JP2019164593A JP2019164593A (en) 2019-09-26
JP2019164593A5 JP2019164593A5 (en) 2021-02-18
JP6987003B2 true JP6987003B2 (en) 2021-12-22

Family

ID=68065531

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018052074A Active JP6987003B2 (en) 2018-03-20 2018-03-20 Text mining methods, text mining programs, and text mining equipment

Country Status (4)

Country Link
JP (1) JP6987003B2 (en)
KR (1) KR102162779B1 (en)
CN (1) CN110309290B (en)
TW (1) TWI703457B (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024148802A (en) * 2023-04-06 2024-10-18 株式会社日立製作所 Proposal support device, proposal support method, and proposal support program

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2806867B2 (en) * 1995-03-13 1998-09-30 株式会社トレンディ Document database construction method, display method, and display device
JPH10283367A (en) * 1997-04-09 1998-10-23 Mitsubishi Electric Corp Hypermedia device
JP4404323B2 (en) * 1999-02-05 2010-01-27 経済産業大臣 Thesaurus browsing system and method
JP5059282B2 (en) * 2003-10-14 2012-10-24 ソニー株式会社 Information providing system, information providing server, user terminal device, content display device, computer program, and content display method
JP2006215936A (en) * 2005-02-07 2006-08-17 Hitachi Ltd Search system and search method
JP2007193380A (en) * 2006-01-16 2007-08-02 So-Net Entertainment Corp Information processing apparatus, information processing method, and computer program
JP5534167B2 (en) * 2009-12-16 2014-06-25 日本電気株式会社 Graph creation device, graph creation method, and graph creation program
JP5331723B2 (en) * 2010-02-05 2013-10-30 株式会社エヌ・ティ・ティ・データ Feature word extraction device, feature word extraction method, and feature word extraction program
US20120066628A1 (en) * 2010-09-09 2012-03-15 Microsoft Corporation Drag-able tabs
JP2014085992A (en) * 2012-10-26 2014-05-12 Hitachi Ltd Document recognition support device, document recognition support method and document recognition support program
JP5903376B2 (en) * 2012-12-11 2016-04-13 日本電信電話株式会社 Information recommendation device, information recommendation method, and information recommendation program
US9177104B2 (en) * 2013-03-29 2015-11-03 Case Western Reserve University Discriminatively weighted multi-scale local binary patterns
KR101512084B1 (en) * 2013-11-15 2015-04-17 한국과학기술원 Web search system for providing 3 dimensional web search interface based virtual reality and method thereof
JP6287192B2 (en) * 2013-12-26 2018-03-07 キヤノンマーケティングジャパン株式会社 Information processing apparatus, information processing method, and program
WO2016027372A1 (en) * 2014-08-22 2016-02-25 株式会社日立製作所 Autopoietic information processing system and method
JP6280859B2 (en) * 2014-11-20 2018-02-14 日本電信電話株式会社 Behavior network information extraction apparatus, behavior network information extraction method, and behavior network information extraction program
CN104375989A (en) * 2014-12-01 2015-02-25 国家电网公司 Natural language text keyword association network construction system
JP6524790B2 (en) * 2015-05-14 2019-06-05 富士ゼロックス株式会社 INFORMATION PROCESSING APPARATUS AND INFORMATION PROCESSING PROGRAM
JPWO2017061253A1 (en) * 2015-10-09 2018-08-16 アイビーリサーチ株式会社 Display control apparatus, display control method, and display control program
TWM523901U (en) * 2016-01-04 2016-06-11 信義房屋仲介股份有限公司 Search engine device for performing semantic keyword analysis
US9710544B1 (en) * 2016-05-19 2017-07-18 Quid, Inc. Pivoting from a graph of semantic similarity of documents to a derivative graph of relationships between entities mentioned in the documents
CN107766318B (en) * 2016-08-17 2021-03-16 北京金山安全软件有限公司 Keyword extraction method and device and electronic equipment
CN107193803B (en) * 2017-05-26 2020-07-10 北京东方科诺科技发展有限公司 A semantic-based task-specific text keyword extraction method
CN107451120B (en) * 2017-08-01 2020-10-30 中国人民解放军火箭军工程大学 A content conflict detection method and system for public text intelligence

Also Published As

Publication number Publication date
KR20190110428A (en) 2019-09-30
CN110309290B (en) 2023-06-06
CN110309290A (en) 2019-10-08
KR102162779B1 (en) 2020-10-07
TWI703457B (en) 2020-09-01
JP2019164593A (en) 2019-09-26
TW201945958A (en) 2019-12-01

Similar Documents

Publication Publication Date Title
US8810576B2 (en) Manipulation and management of links and nodes in large graphs
US12229643B2 (en) Teaching data extending device, teaching data extending method, and program
JP5023176B2 (en) Feature word extraction apparatus and program
JP6529698B2 (en) Data analyzer and data analysis method
JP6987003B2 (en) Text mining methods, text mining programs, and text mining equipment
KR102180487B1 (en) Text mining method, text mining program, and text mining device
JP7078429B2 (en) Text mining methods, text mining programs, and text mining equipment
JP2023062471A (en) Display control program, display control method, and information processing device
JP6434435B2 (en) Information processing apparatus, operation support method, and operation support program
US20220413682A1 (en) Methods, apparatuses, and computer-readable media for enhancing digital pathology platform
JP2009134378A (en) Document group presentation device and document group presentation program
JP2015022438A (en) Report creation support device, method thereof, and program
JP6696119B2 (en) Conversion device, conversion method, and conversion program
CN104243201A (en) Method and system for storing topological graph corresponding to network equipment test case
JP6657799B2 (en) Graphic processing apparatus, graphic processing method, and graphic processing program
JP5202598B2 (en) Workflow management device and workflow management program
JP5634209B2 (en) Search index creation system, document search system, index creation method, document search method and program
JP2006039811A (en) Document management program, document management method and document management device
JP2010092230A (en) Program for retrieving graphic symbol for apparatus or device
JP2026046635A (en) Document analysis method, document analysis apparatus, document analysis program, and computer-readable storage medium storing the document analysis program.
WO2016184360A1 (en) Data object deleting method and device
JP6261218B2 (en) Display processing device, display processing method and program, and image classification device
JP4728878B2 (en) Time series analysis support system, time series analysis support method, and time series analysis support program
WO2024090367A1 (en) Information processing method, computer program, and information processing device
JP2007272517A (en) Micro scenario data analysis system and micro scenario data analysis program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211130

R150 Certificate of patent or registration of utility model

Ref document number: 6987003

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250