JP6635966B2 - Visualization device, visualization method, and program - Google Patents
Visualization device, visualization method, and program Download PDFInfo
- Publication number
- JP6635966B2 JP6635966B2 JP2017063573A JP2017063573A JP6635966B2 JP 6635966 B2 JP6635966 B2 JP 6635966B2 JP 2017063573 A JP2017063573 A JP 2017063573A JP 2017063573 A JP2017063573 A JP 2017063573A JP 6635966 B2 JP6635966 B2 JP 6635966B2
- Authority
- JP
- Japan
- Prior art keywords
- classification
- document
- result
- unit
- sentences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、可視化装置、可視化方法、及びプログラムに関する。 The present invention relates to a visualization device, a visualization method, and a program.
従来、文書(テキスト)が属する分類が多値(3種類以上)の場合に、文書がどの分類に属するかを推定(N値分類の推定)し、最も可能性が高い分類結果を1つ表示する分類判定方法が知られている。例えば、パソコンの故障状況を記述した文書を故障の種類に分類する場合に、分類が「電源」、「HDD(Hard Disc Drive)」、「ディスプレイ」、及び「ファン」であるとき、例えば、「電源を入れても画面に何も表示されない」という文書が入力されると、図17に示すように入力された文書を取得する(ステップS51)。ステップS51で文書が取得されると、N値分類の推定により文書が上記複数の分類の中から「ディスプレイ」という分類に属すると推定する(ステップS52)。ステップS52でN値分類が推定されると、「ディスプレイ」という分類結果を含む結果情報を格納し(ステップS53)、ディスプレイ等に表示する(ステップS54)。N値分類の推定に用いられる分類器としては、SVM(Support Vector Machine)が非常に高い分類性能を持つことが知られている(例えば、非特許文献1参照)。また、分類結果の信頼度を付与し、信頼度とともに1つまたは複数の分類結果を表示する方法もある。 Conventionally, when the classification to which a document (text) belongs is multi-valued (three or more), it is estimated which classification the document belongs to (estimation of N-value classification), and one of the most likely classification results is displayed. There are known classification determination methods. For example, when a document describing a failure state of a personal computer is classified into failure types, when the classification is “power supply”, “HDD (Hard Disc Drive)”, “display”, and “fan”, for example, “ When the document "Nothing is displayed on the screen even when the power is turned on" is input, the input document is acquired as shown in FIG. 17 (step S51). When the document is obtained in step S51, it is estimated that the document belongs to the class "display" from the plurality of classes by estimating the N-value class (step S52). When the N-value classification is estimated in step S52, the result information including the classification result of "display" is stored (step S53) and displayed on a display or the like (step S54). As a classifier used for estimating the N-value classification, it is known that an SVM (Support Vector Machine) has very high classification performance (for example, see Non-Patent Document 1). There is also a method of giving the reliability of the classification result and displaying one or more classification results together with the reliability.
しかしながら、上述のような従来技術によって表示された分類結果を参考にして利用者が分類を確定しようとする際、1つの分類結果のみが表示される場合、分類結果の信頼度が分からないため、利用者が分類結果を採用してよいか判断することが困難な場合がある。また、分類結果が信頼度とともに表示される場合であっても、表示された分類結果の信頼度は分かるが、その分類結果を採用する判断基準(例えば、何パーセントの信頼度なら採用できるのか)を決めることが困難な場合がある。さらに、文書に複数の文が含まれる場合、いずれの文が分類の判定に寄与しているのか判断しかねる場合がある。 However, when the user tries to determine the classification by referring to the classification result displayed by the conventional technology as described above, if only one classification result is displayed, the reliability of the classification result is not known, In some cases, it is difficult for the user to determine whether to adopt the classification result. Even when the classification result is displayed together with the reliability, the reliability of the displayed classification result is known, but a criterion for adopting the classification result (for example, what percentage of reliability can be adopted) It can be difficult to decide. Further, when a document includes a plurality of sentences, it may not be possible to determine which sentence contributes to the classification determination.
したがって、かかる点に鑑みてなされた本発明の目的は、入力された文書の分類結果に対するユーザの判断基準を可視化することである。 Therefore, an object of the present invention made in view of such a point is to visualize a user's criterion for a classification result of an input document.
上記の課題を解決するため、本発明に係る可視化装置は、利用者の操作に基づいて文書を取得する文書取得部と、前記文書を複数の文に分割する分割部と、前記文書及び前記複数の文それぞれが、予め定められた複数の分類それぞれに属するか否かを推定する2値分類推定部と、前記文書及び前記複数の文と、前記文書及び前記複数の文それぞれが前記分類それぞれに属するか否かを示す分類結果とを含む結果情報を表示する表示部と、を備えることを特徴とする。
また、本発明に係る可視化装置は、利用者の操作に基づいて、文書、及び前記文書に対する人手付与分類を取得する文書取得部と、前記文書を複数の文に分割する分割部と、前記文書及び前記複数の文それぞれが、予め定められた複数の分類それぞれに属するか否かを推定する2値分類推定部と、前記文書及び前記複数の文、前記2値分類推定部において推定された分類結果、並びに前記人手付与分類による分類結果を含む結果情報と、該結果情報に含まれる分類結果が、前記推定された分類結果であるか、前記人手付与分類による分類結果であるかを示す情報とを表示する表示部と、を備えることを特徴とする。
In order to solve the above-described problem, a visualization device according to the present invention includes a document acquisition unit that acquires a document based on a user operation, a division unit that divides the document into a plurality of sentences, the document and the plurality of documents. each respective statements, advance the binary classifier estimation unit that estimates whether belonging to each of a plurality of classifications defined, pre-SL document and the plurality of sentences, the document and the plurality of statements, each said classification And a display unit for displaying result information including a classification result indicating whether or not the data belongs to the group.
Further, the visualization device according to the present invention, based on a user operation, a document acquisition unit that acquires a document and a manual assignment classification for the document, a division unit that divides the document into a plurality of sentences, A binary classification estimating unit for estimating whether each of the plurality of sentences belongs to each of a plurality of predetermined classifications, and a classification estimated by the document and the plurality of sentences, the binary classification estimating unit Results, and the result information including the classification result by the manual assignment classification, and the classification result included in the result information is the estimated classification result, or information indicating whether the classification result by the manual assignment classification And a display unit for displaying
また、本発明に係る可視化方法は、文書の分類を推定する可視化装置が実行する可視化方法であって、利用者の操作に基づいて文書を取得するステップと、前記文書を複数の文に分割する分割するステップと、前記文書及び前記複数の文それぞれが、予め定められた複数の分類それぞれに属するか否かを推定するステップと、前記文書及び前記複数の文と、前記文書及び前記複数の文それぞれが前記分類それぞれに属するか否かを示す分類結果とを含む結果情報を表示するステップと、を含むことを特徴とする。
また、本発明に係る可視化方法は、利用者の操作に基づいて、文書、及び前記文書に対する人手付与分類による分類結果を取得するステップと、前記文書を複数の文に分割するステップと、前記文書及び前記複数の文それぞれが、予め定められた複数の分類それぞれに属するか否かを推定するステップと、前記文書及び前記複数の文、前記推定された分類結果、並びに前記人手付与分類による分類結果含む結果情報と、該結果情報に含まれる分類結果が、前記推定された分類結果であるか、前記人手付与分類による分類結果であるかを示す情報と、を含む結果情報を表示するステップと、を含むことを特徴とする。
Further, a visualization method according to the present invention is a visualization method executed by a visualization device for estimating a classification of a document, wherein the step of acquiring a document based on a user operation and the step of dividing the document into a plurality of sentences dividing the document and each of the plurality of statements, estimating whether belonging to each of a plurality of classifications predetermined said document and said plurality of statements, the document and the plurality of sentences each of which comprising the steps of: displaying the result information including the classification result indicating whether belonging to each of the classification.
Further, the visualization method according to the present invention includes a step of acquiring a document and a classification result by a manual assignment classification for the document based on an operation of a user; a step of dividing the document into a plurality of sentences; And a step of estimating whether or not each of the plurality of sentences belongs to each of a plurality of predetermined classifications, and the document and the plurality of sentences, the estimated classification result, and the classification result by the manual assignment classification. Displaying the result information including the result information including, and the classification result included in the result information, the estimated classification result, or information indicating whether the classification result is based on the manual assignment classification, It is characterized by including.
また、本発明に係るプログラムは、コンピュータを、上記可視化装置として機能させるためのプログラム。 Further, a program according to the present invention is a program for causing a computer to function as the visualization device.
本発明によれば、入力された文書の分類結果に対するユーザの判断基準を可視化することができる。 According to the present invention, it is possible to visualize a user's criterion for a classification result of an input document.
[第1の実施形態]
まず、図1を参照して、本発明の第1の実施形態の機能構成について説明する。図1は、第1の実施形態に係る可視化装置1の機能構成図である。
[First Embodiment]
First, the functional configuration of the first embodiment of the present invention will be described with reference to FIG. FIG. 1 is a functional configuration diagram of the visualization device 1 according to the first embodiment.
図1に示すように、可視化装置1は、文書取得部11、2値分類推定部12、格納部13、及び表示部14を備える。
As shown in FIG. 1, the visualization device 1 includes a
文書取得部11は、利用者の操作に基づいて文書を取得する。文書取得部11によって取得される文書は任意であるが、本実施形態では、一例として、利用者は、Webアプリケーションを用いて、図2(a)に示すような画面に「電源を入れても画面に何も表示されない。」という文書を入力し、送信ボタンを押下する。この場合、文書取得部11は入力された文書を取得する。
The
2値分類推定部12は、文書取得部11によって取得された文書が複数の分類それぞれに属するか否かを、学習データに基づいて公知の機械推定の手法により推定する。分類は任意のものであってよいが、本実施形態では、分類の例を「電源」、「HDD」、「ディスプレイ」、及び「ファン」として説明する。
The binary
この場合、2値分類推定部12は、文書取得部11によって取得された文書が「電源」、「HDD」、「ディスプレイ」、及び「ファン」にそれぞれ属するか否かを学習データに基づき推定する。文書が「電源を入れても画面に何も表示されない。」である場合、2値分類推定部12は、学習データに基づいて、文書が「電源」という分類に属する(○)と推定し、「HDD」という分類に属さない(×)と推定し、「ディスプレイ」という分類に属する(○)と推定し、「ファン」という分類に属さない(×)と推定したとする。
In this case, the binary
格納部13は結果情報を格納する。図3に示すように、結果情報には、文書を一意に識別するためのID(Identification)と、文書と、分類結果とが含まれる。分類結果は、上述のように2値分類推定部12によって推定された、該文書が各分類に属する(○)か否か(×)を示す情報である。例えば、格納部13は、ID「A」の「電源を入れても画面に何も表示されない。」という文書に対応して、電源「○」、HDD「×」、ディスプレイ「○」、ファン「×」を分類結果として格納する。
The
表示部14は、格納部13に記憶されている結果情報を表示する。具体的には、表示部14は、文書、及び分類結果をディスプレイ等に表示する。例えば、表示部14は、2値分類推定部12によって推定された分類結果を、図2(b)に示すように、文書は「電源」、「ディスプレイ」という分類に属することを表示する。なお、表示部14は、通信ネットワークを介して結果情報を他の情報処理装置に送信してもよい。
The
続いて、第1の実施形態における可視化装置1の可視化方法について図4に示すシーケンス図を参照して説明する。 Subsequently, a visualization method of the visualization device 1 according to the first embodiment will be described with reference to a sequence diagram shown in FIG.
まず、文書取得部11は、利用者の操作に基づいて文書を取得する(ステップS11)。本実施形態では、文書取得部11は、例えば、「電源を入れても画面に何も表示されない。」という文書を取得する。
First, the
ステップS11で文書が取得されると、2値分類推定部12が文書の2値分類を推定する(ステップS12)。具体的には、2値分類推定部12は、文書が予め定められた分類それぞれに属するか否かを推定する。本実施形態では、例えば、2値分類推定部12は、文書が「電源」という分類に属するか否かを推定する。
When the document is obtained in step S11, the binary
ステップS12で2値分類が推定されると、2値分類推定部12は、全ての分類について推定されたか否かを判定する(ステップS13)。本実施形態の例では、2値分類推定部12は、「電源」、「HDD」、「ディスプレイ」、及び「ファン」の全ての分類について2値分類が推定されたか否かを判定する。
When the binary classification is estimated in step S12, the binary
ステップS13で全ての分類について推定されていない場合には、ステップS12に戻って、2値分類推定部12は、まだ推定されていない分類に文書が属するか推定する。ステップS13で全ての分類について推定されていた場合には、格納部13が分類結果を含む結果情報を格納する(ステップS14)。
If all the classifications have not been estimated in step S13, the process returns to step S12, and the binary
ステップS14で結果情報が格納されると、表示部14が結果情報をディスプレイ等に表示する(ステップS15)。
When the result information is stored in step S14, the
以上のように、第1の実施形態によれば、入力された文書に対して、全ての分類についての分類結果が格納され、表示される。文書が、複数の分類に属する場合は、どちらの分類もありえることを意味し、逆にどの分類にも属さない場合は、決め手に欠けることを意味する。例えば、図3に示す分類結果の場合、「電源を入れても画面に何も表示されない」という文書は、「電源」「ディスプレイ」という分類の両方に属する可能性があることを示している。これにより、入力された文書において過不足の情報を考え、不要な情報は削除し、足りない情報は補うなどして、分類を確定することが可能となる。例えば、図3に示す分類結果の場合、足りない情報として「パソコン本体の電源ランプが点灯しない」を補えば、分類を「電源」に確定することができる。 As described above, according to the first embodiment, the classification results of all the classifications are stored and displayed for the input document. If a document belongs to a plurality of categories, it means that there is any category, and if it does not belong to any category, it means that the document is lacking. For example, in the case of the classification result shown in FIG. 3, it is indicated that a document "Nothing is displayed on the screen even when the power is turned on" may belong to both the classifications "power" and "display". As a result, it is possible to determine the classification by considering excessive or insufficient information in the input document, deleting unnecessary information, and supplementing missing information. For example, in the case of the classification result shown in FIG. 3, if "power lamp of personal computer is not lit" is supplemented as missing information, the classification can be determined to be "power".
[第2の実施形態]
続いて、本発明の第2の実施形態について図面を参照して説明する。
[Second embodiment]
Next, a second embodiment of the present invention will be described with reference to the drawings.
図5に示すように、第2の実施形態に係る可視化装置2は、第1の実施形態に係る可視化装置1と同様に、文書取得部11、2値分類推定部12、格納部13、及び表示部14を備え、さらに分割部15を備える。なお、第1の実施形態における可視化装置1と同様の構成ブロックについては同一の参照符号を付して、適宜、説明を省略する。
As shown in FIG. 5, the
分割部15は、文書取得部11によって取得された文書を分割する。分割部15は、例えば、文書に含まれる文を1文ずつ抽出する。分割部15は、例えば、句点「。」を検索し、文書の最初の文字から、最初の句点以前の文字列を1文として抽出することができる。また、分割部15は、句点より後の文字から次の句点以前の文字列を1文として抽出することができる。また、分割部15は、文書が改行されている場合、改行の前後で文書を分割してもよい。
The dividing
一例として、利用者は、Webアプリケーションを用いて、図6(a)に示すような画面に「動作が非常に遅く、ファンの音がしない。立ち上がらないこともある。」という文書を入力し、送信ボタンを押下する。この場合、文書取得部11は入力された文書を取得する。そして、分割部15は、文書取得部11が取得した文書を、「動作が非常に遅く、ファンの音がしない。」という文と「立ち上がらないこともある。」という文とに分割する。
As an example, the user uses the Web application to input a document “The operation is very slow and the fan does not make a sound. There is a case where the fan does not start up” on a screen as shown in FIG. Press the send button. In this case, the
2値分類推定部12は、分割部15によって分割された各文について、学習データに基づいて、公知の機械推定の手法により2値分類を推定する。上述のように、分割部15によって、「動作が非常に遅く、ファンの音がしない。」という文と「立ち上がらないこともある。」という文に分割された場合、2値分類推定部12は、分割部15によって分割された文がそれぞれ「電源」、「HDD」、「ディスプレイ」、及び「ファン」にそれぞれ属するか否かを推定する。
The binary
具体的には、2値分類推定部12は、「動作が非常に遅く、ファンの音がしない。」という文について、学習データに基づいて、図7に示すように、文が「電源」という分類に属さない(×)と推定し、「HDD」という分類に属さない(×)と推定し、「ディスプレイ」という分類に属さない(×)と推定し、「ファン」という分類に属する(○)と推定したとする。
Specifically, as shown in FIG. 7, based on the learning data, the binary
また、2値分類推定部12は、「立ち上がらないこともある。」という文について、学習データに基づいて、文が「電源」という分類に属する(○)と推定し、「HDD」という分類に属さない(×)と推定し、「ディスプレイ」という分類に属さない(×)と推定し、「ファン」という分類に属さない(×)と推定したとする。
In addition, the binary
さらに、2値分類推定部12は、「動作が非常に遅く、ファンの音がしない。立ち上がらないこともある。」という文書全体について、学習データに基づいて、文書が「電源」という分類に属する(○)と推定し、「HDD」という分類に属さない(×)と推定し、「ディスプレイ」という分類に属さない(×)と推定し、「ファン」という分類に属する(○)と推定したとする。
Further, the binary
格納部13は、結果情報を格納する。図7に示すように、結果情報には、IDと、文書と、分割された各文と、2値分類推定部12によって推定された、各文が各分類に属するか否かを示す分類結果、及び文書全体が各分類に属するか否かを示す分類結果とが含まれる。
The
表示部14は、格納部13に記憶されている結果情報を表示する。具体的には、表示部14は、文書、各文、及び分類結果をディスプレイ等に表示する。例えば、表示部14は、2値分類推定部12によって推定された分類結果を、図6(b)に示すように、文書の全体では「ファン」、「電源」という分類に属し、「動作が非常に遅く、ファンの音がしない。」という文は「ファン」という分類に属し、「立ち上がらないこともある。」という文は「電源」という分類に属することを表示する。なお、表示部14は、通信ネットワークを介して結果情報を他の情報処理装置に送信してもよい。
The
続いて、第2の実施形態における可視化装置2の可視化方法について図8に示すシーケンス図を参照して説明する。
Next, a visualization method of the
まず、文書取得部11は、利用者の操作に基づいて文書を取得する(ステップS21)。例えば、文書取得部11は、利用者が、Webアプリケーションを用いて、図6(a)に示したような画面に「動作が非常に遅く、ファンの音がしない。立ち上がらないこともある。」という文書を入力し、送信ボタンを押下すると、入力された文書を取得する。
First, the
ステップS21で文書が取得されると、分割部15が文書を分割する(ステップS22)。例えば、分割部15は、「動作が非常に遅く、ファンの音がしない。立ち上がらないこともある。」という文書を「動作が非常に遅く、ファンの音がしない。」という文と「立ち上がらないこともある。」という文に分割する。
When the document is obtained in step S21, the dividing
ステップS22で文書が分割されると、2値分類推定部12は分割された文の2値分類を推定する(ステップS23)。具体的には、2値分類推定部12は、分割された文が予め定められた分類に属するか否かを推定する。本実施形態では、例えば、2値分類推定部12は、文書に含まれる「動作が非常に遅く、ファンの音がしない。」という文が「電源」という分類に属するか否かを推定する。
When the document is divided in step S22, the binary
ステップS23で2値分類が推定されると、2値分類推定部12は、全ての分類について推定されたか否かを判定する(ステップS24)。本実施形態の例では、2値分類推定部12は、「電源」、「HDD」、「ディスプレイ」、及び「ファン」の全ての分類についてそれぞれ文書が属するか推定したか否かを判定する。
When the binary classification is estimated in step S23, the binary
ステップS24で全ての分類について文が推定されていない場合には、ステップS23に戻って、2値分類推定部12が、まだ推定されていない分類に文が属するか推定する。ステップS24で全ての分類について文が推定された場合、2値分類推定部12は、分割された全ての文について推定されたか否かを判定する(ステップS25)。本実施形態では、分割された「動作が非常に遅く、ファンの音がしない。」という文と、「立ち上がらないこともある。」という文のいずれについても推定されたか否かを判定する。
If the sentence has not been estimated for all the classes in step S24, the process returns to step S23, and the binary
ステップS25で全ての文について判定がされていた場合、格納部13が分類結果を含む結果情報を格納する(ステップS26)。ステップS25で全ての文について判定がされていなかった場合、ステップS23に戻って、まだ推定されていない文が各分類に属するか否かを判定する。
If all sentences have been determined in step S25, the
ステップS26で結果情報が格納されると、表示部14が結果情報をディスプレイ等に表示する(ステップS27)。例えば、表示部14は、2値分類推定部12によって推定された分類結果を、図6(b)に示したように、文書の全体では「ファン」、「電源」という分類に属し、「動作が非常に遅く、ファンの音がしない。」という文は「ファン」という分類に属し、「立ち上がらないこともある。」という文は「電源」という分類に属することを表示する。
When the result information is stored in step S26, the
以上のように、第2の実施形態によれば、分割部15が、文書を複数の文に分割する。そして、2値分類推定部12は、複数の文それぞれが、分類それぞれに該当するか否かを推定する。そのため、入力された文書に、複数の文が含まれている場合、文ごとに分類結果が格納され、表示される。これにより、文書全体では分類の判断がつかない場合であっても、文ごとに推定された分類結果を参考に、分類を再考することが可能となる。
As described above, according to the second embodiment, the dividing
[第3の実施形態]
続いて、本発明の第3の実施形態について図面を参照して説明する。
[Third Embodiment]
Next, a third embodiment of the present invention will be described with reference to the drawings.
図1に示すように、第3の実施形態に係る可視化装置1は、第1の実施形態と同様に、文書取得部11、2値分類推定部12、格納部13、及び表示部14を備える。なお、構成ブロックは、第1の実施形態と同じであるので、構成ブロックの説明を省略する
As shown in FIG. 1, the visualization device 1 according to the third embodiment includes a
第3の実施形態において、文書取得部11は、文書を取得するとともに、利用者の操作に基づいて該文書に対応する分類(人手付与分類)を取得する。一例として、利用者は、Webアプリケーションを用いて、図9(a)に示すような画面に「立ち上がりが悪い。」という文書を入力し、人手付与分類としての故障分類に「HDD」を入力する。そして、利用者は、送信ボタンを押下する。この場合、文書取得部11は、「立ち上がりが悪い。」という文書を取得し、「HDD」という故障分類を人手付与分類として取得する。
In the third embodiment, the
2値分類推定部12は、取得された文書が各分類に属するか否かを、学習データに基づいて、公知の機械推定の手法により推定する。例えば、2値分類推定部12は、「立ち上がりが悪い。」という文書について、学習データに基づいて、図10に示すように、文書が「電源」という分類に属さない(×)と推定し、「HDD」という分類に属する(○)と推定し、「ディスプレイ」という分類に属さない(×)と推定し、「ファン」という分類に属さない(×)と推定したとする。
The binary
格納部13は結果情報を格納する。図10示すように、結果情報には、IDと、文書と、2値分類推定部12によって推定された機械推定の分類結果と、人手付与分類とが含まれる。例えば、格納部13は、図10示すように、ID「C」の「立ち上がりが悪い」という文書に対応して、「HDD」という人手付与分類を格納する。さらに格納部13は、電源「×」、HDD「○」、ディスプレイ「×」、ファン「×」を機械推定の分類結果として格納する。
The
表示部14は、格納部13に記憶されている結果情報を表示する。具体的には、表示部14は、ディスプレイ等に文書、2値分類推定部12によって推定された機械推定の分類結果、及び人手付与分類を表示する。例えば、表示部14は、2値分類推定部12によって推定された分類結果を、図9(b)に示すように、文書が「HDD」という分類に属すること、及び入力された故障分類(人手付与分類)が「HDD」であることを表示する。なお、表示部14は、通信ネットワークを介して結果情報を他の情報処理装置に送信してもよい。
The
続いて、第3の実施形態における可視化装置3の可視化方法について図11に示すシーケンス図を参照して説明する。 Subsequently, a visualization method of the visualization device 3 according to the third embodiment will be described with reference to a sequence diagram shown in FIG.
まず、文書取得部11は、利用者の操作に基づいて文書及び人手付与分類を取得する(ステップS31)。例えば、利用者の操作により、図9(a)に示すように、「立ち上がりが悪い。」という文書と、「HDD」という人手付与分類とが入力された場合、入力された文書及び人手付与分類を取得する。
First, the
本実施形態で可視化装置3が行う可視化方法のステップS32及びS33の処理は、第1の実施形態のステップS12及びS13の処理と同様である。 The processes in steps S32 and S33 of the visualization method performed by the visualization device 3 in the present embodiment are the same as the processes in steps S12 and S13 in the first embodiment.
ステップS33で全ての分類について文書が推定された場合には、格納部13が結果情報を格納する(ステップS34)。第3の実施形態における結果情報には、第1の実施形態における分類結果に加えて、人手付与分類が含まれる。例えば、格納部13は、図10に示したように、電源「×」、HDD「○」、ディスプレイ「×」、ファン「×」という分類結果と、「HDD」という人手分類とを含む結果情報を格納する。
If the documents are estimated for all the categories in step S33, the
ステップS34で結果情報が格納されると、表示部14が、結果情報をディスプレイ等に表示する(ステップS35)。例えば、表示部14は、図9(b)に示すように、機械学習による判定で「HDD」という分類に属する可能性が高いと判定されたこと、及び入力された故障分類(人手付与分類)が「HDD」であることを表示する。
When the result information is stored in step S34, the
以上のように、第3の実施形態によれば、文書取得部11は、利用者の操作に基づいて文書の人手付与分類をさらに取得する。そして、表示部14は、2値分類推定部12によって推定された分類結果と、人手付与分類とを結果情報として表示する。そのため、利用者は、学習データに基づいて推定された分類結果を認識するとともに、文書を取得した利用者の判断を示す人手付与分類を考慮して、文書の分類を最終的に決定することができる。
As described above, according to the third embodiment, the
[第4の実施形態]
続いて、本発明の第4の実施形態について図面を参照して説明する。
[Fourth embodiment]
Next, a fourth embodiment of the present invention will be described with reference to the drawings.
図5に示すように、第4の実施形態に係る可視化装置2は、第2の実施形態と同様に、文書取得部11、2値分類推定部12、格納部13、表示部14、及び分割部15を備える。なお、構成ブロックは、第2の実施形態と同じであるので、構成ブロックの説明を省略する。
As shown in FIG. 5, the
第4の実施形態において、文書取得部11は、利用者の操作に基づいて文書を取得するとともに、該文書に対応する人手付与分類を取得する。一例として、利用者は、Webアプリケーションを用いて、図12(a)に示すような画面に「立ち上がりが悪い。電源を切って立ち上げても同じ。」という文書を入力し、人手付与分類としての故障分類に「HDD」を入力する。そして、利用者は、送信ボタンを押下する。この場合、文書取得部11は、「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書を取得する。さらに、「HDD」を人手付与分類として取得する。
In the fourth embodiment, the
そして、分割部15は、文書取得部11が取得した文書を「立ち上がりが悪い。」という文と「電源を切って再度立ち上げても同じ。」という文に分割する。
Then, the dividing
また、2値分類推定部12は、分割部15によって分割された各文が各分類に属するか否かを、学習データに基づいて、公知の機械推定の手法により推定する。例えば、2値分類推定部12は、図13に示すように、学習データに基づいて、「立ち上がりが悪い。」という文について、文が「電源」という分類に属さない(×)と推定し、「HDD」という分類に属する(○)と推定し、「ディスプレイ」という分類に属さない(×)と推定し、「ファン」という分類に属さない(×)と推定したとする。
Further, the binary
また、2値分類推定部12は、「電源を切って再度立ち上げても同じ。」という文について、学習データに基づいて文が「電源」という分類に属さない(×)と推定し、「HDD」に属さない(×)と推定し、「ディスプレイ」に属さない(×)と推定し、「ファン」に属さない(×)と推定したとする。また、2値分類推定部12は、「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書全体について、学習データに基づいて文書全体が「電源」という分類に属さない(×)と推定し、「HDD」に属する(○)と推定し、「ディスプレイ」に属さない(×)と推定し、「ファン」に属さない(×)と推定したとする。
In addition, the binary
格納部13は、結果情報を格納する。図13に示すように、結果情報にはIDと、文書と、分割された各文と、2値分類推定部12によって推定された、各文が各分類に属するか否かを示す分類結果、及び文書全体が各分類に属するか否かを示す分類結果と、人手付与分類とが含まれる。
The
上述のように、文書取得部11によって「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書と、「HDD」という人手付与分類とが取得され、2値分類推定部12によって推定された場合に格納部13が格納する結果情報について説明する。格納部13は、図13に示すように、ID「D」の「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書に対応して、人手付与分類である「HDD」、機械推定による分類結果である電源「×」、HDD「○」、ディスプレイ「×」、及びファン「×」を格納する。また、格納部13は、分割された「立ち上がりが悪い。」という文に対応して、電源「×」、HDD「○」、ディスプレイ「×」、ファン「×」を格納する。さらに、格納部13は、分割された「電源を切って再度立ち上げても同じ。」という文に対応して、電源「×」、HDD「×」、ディスプレイ「×」、ファン「×」を格納する。
As described above, the
表示部14は、格納部13に記憶されている結果情報を表示する。具体的には、表示部14は、文書、各文、各文が各分類に属するか否かを示す分類結果、各文を含む文書が各分類に属するか否かを示す分類結果、及び人手付与分類をディスプレイ等に表示する。
The
例えば、表示部14は、図12(b)に示すように、文書全体が機械学習による判定で「HDD」という分類に属する可能性が高いと判定されたこと、及び入力された故障分類(人手付与分類)が「HDD」であることを表示する。さらに表示部14は、分割された「立ち上がりが悪い」という文が「HDD」という分類に属する可能性が高いと判定されたこと、「電源を切って立ち上げても同じ」という文がいずれの分類にも属さない可能性が高いと判定されたことを表示する。なお、表示部14は、通信ネットワークを介して結果情報を他の情報処理装置に送信してもよい。
For example, as illustrated in FIG. 12B, the
続いて、第4の実施形態における可視化装置4の可視化方法について図14に示すシーケンス図を参照して説明する。 Subsequently, a visualization method of the visualization device 4 according to the fourth embodiment will be described with reference to a sequence diagram shown in FIG.
まず、文書取得部11は、利用者の操作に基づいて文書及び人手付与分類を取得する(ステップS41)。例えば、利用者の操作により、図12(a)に示したように、「立ち上がりが悪い。電源を切って立ち上げても同じ。」という文書と、「HDD」という人手付与分類とが入力された場合、入力された文書及び人手付与分類を取得する。
First, the
本実施形態で可視化装置3が行う可視化方法のステップS42からS45の処理は、第2の実施形態のステップS22からS25の処理と同様である。 The processing of steps S42 to S45 of the visualization method performed by the visualization device 3 in the present embodiment is the same as the processing of steps S22 to S25 of the second embodiment.
ステップS45で全ての文について推定された場合には、格納部13が結果情報を格納する(ステップS46)。第4の実施形態における結果情報は、第2の実施形態における分類結果に加えて、人手付与分類が含まれる。例えば、格納部13は、図13に示したような、ID「D」の「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書に対応して、人手付与分類である「HDD」、機械推定による分類結果である電源「×」、HDD「○」、ディスプレイ「×」、及びファン「×」を格納する。また、格納部13は、分割された「立ち上がりが悪い。」という文に対応して、機械推定による分類結果である電源「×」、HDD「○」、ディスプレイ「×」、ファン「×」を格納する。さらに、格納部13は、分割された「電源を切って再度立ち上げても同じ。」という文に対応して、機械推定による分類結果である電源「×」、HDD「×」、ディスプレイ「×」、ファン「×」を格納する。
If all sentences have been estimated in step S45, the
ステップS34で結果情報が格納されると、表示部14が、結果情報をディスプレイ等に表示する(ステップS47)。表示部14は、例えば、図12(b)に示したように、文書全体が機械学習による判定で「HDD」という分類に属する可能性が高いと判定されたこと、及び入力された故障分類(人手付与分類)が「HDD」であることを表示する。さらに表示部14は、分割された「立ち上がりが悪い」という文が「HDD」という分類に属する可能性が高いと判定されたこと、「電源を切って立ち上げても同じ」という文がいずれの分類にも属さない可能性が高いと判定されたことを表示する。
When the result information is stored in step S34, the
以上のように、第4の実施形態によれば、第2の実施形態と同様に、分割部15が、文書を複数の文に分割する。そして、2値分類推定部12は、複数の文それぞれが、分類それぞれに該当するか否かを推定する。そのため、利用者は、文書に含まれる文それぞれが、各分類に該当するかを認識することができる。また、第4の実施形態によれば、第3の実施形態と同様に、文書取得部11は、利用者の操作に基づいて文書の人手付与分類をさらに取得する。そして、表示部14は、2値分類推定部12によって推定された分類と、人手付与分類とを結果情報として表示する。そのため、利用者は、学習データに基づいて推定された分類とともに文書を取得した利用者の判断を示す人手付与分類を認識することができる。したがって利用者が文書の属する分類を最終的に決定するときに、文ごとの分類結果及び人手付与分類の両方を鑑みて総合的な決定を行うことが可能となる。
As described above, according to the fourth embodiment, similarly to the second embodiment, the dividing
[第5の実施形態]
続いて、本発明の第5の実施形態について図面を参照して説明する。
[Fifth Embodiment]
Next, a fifth embodiment of the present invention will be described with reference to the drawings.
図5に示すように、第5の実施形態に係る可視化装置2は、第4の実施形態と同様に、文書取得部11、2値分類推定部12、格納部13、表示部14、及び分割部15を備える。なお、構成ブロックは、第4の実施形態と同じであるので、構成ブロックの説明を省略する。
As shown in FIG. 5, the
第5の実施形態においては、文書取得部11は、複数の文書を取得するとともに、利用者の操作に基づいて各文書に対応する人手付与分類を取得する。例えば、文書取得部11は、「電源を入れても画面に何も表示されない」という文書と、「ディスプレイ」という人手付与分類とを取得する。また、文書取得部11は、「動作が非常に遅く、ファンの音がしない。立ち上がらないこともある。」という文書と、「ファン」という人手付与分類とを取得する。また、文書取得部11は、「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書と、「HDD」という人手付与分類とを取得する。
In the fifth embodiment, the
この場合、2値分類推定部12及び格納部13は、「電源を入れても画面に何も表示されない。」という文書について、第3の実施形態と同様の処理を行う。また、分割部15、2値分類推定部12、及び格納部13は、「動作が非常に遅く、ファンの音がしない。立ち上がらないこともある。」という文書と「立ち上がりが悪い。電源を切って再度立ち上げても同じ。」という文書とについて第4の実施形態と同様の処理を行う。
In this case, the binary
表示部14は、格納部13によって格納されている各文書についての結果情報を合わせてディスプレイ等に表示する。なお、表示部14は、各文書についての結果情報を合わせて、通信ネットワークを介して他の情報処理装置に送信してもよい。
The
第5の実施形態における可視化装置2の可視化方法は、第3の実施形態の可視化方法と第4の実施形態の可視化方法との組合せである。具体的には、文書取得部11は、複数の文書とそれぞれの文書に対応する分類を取得する。文書に1つの文のみが含まれる場合、可視化装置5は、第3の実施形態のステップS32からS34の処理を行う。また、文書に複数の文が含まれる場合、可視化装置2は、第4の実施形態のステップS42からS46の処理を行う。そして、格納部13は、図15に示すように、ステップS34で格納された結果情報と、ステップS46で格納された結果情報とを合わせて格納する。
The visualization method of the
以上のように、第5の実施形態によれば、文書取得部11は、複数の文書と、それぞれの文書に対応する人手付与分類を取得する。そのため、利用者は、複数の文書それぞれについて、学習データに基づいて推定された分類と人手付与分類とを認識することができる。したがって利用者が複数の文書の属する分類を最終的に決定するときに、文書及び各文書に含まれる文それぞれの分類結果及び人手付与分類を鑑みて総合的な決定を行うことが可能となる。
As described above, according to the fifth embodiment, the
また、上述の実施形態では、可視化装置1,2,3,4,5の各機能は、これらの機能を実現する処理内容を記述したプログラムをコンピュータの記憶部に記憶しておき、当該コンピュータのCPUによってこのプログラムを読み出して実行することで実現してもよい。また、プログラムを記録媒体に記録したり、ネットワークを通して提供したりしてもよい。
Further, in the above-described embodiment, each function of the
また、第1の実施形態では、図16に示すように、可視化装置1は、さらに音声認識部16を備えてもよい。音声認識部16は、利用者が発した音声について音声認識処理を行い、文書に変換する。そして、文書取得部11は、音声認識部16によって変換された文書を取得し、上述と同様の処理を行う。これにより、音声で表される情報についても分類を推定することができる。第2〜第5の実施形態についても同様である。
Further, in the first embodiment, as shown in FIG. 16, the visualization device 1 may further include a
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。 Although the above embodiments have been described as representative examples, it will be apparent to those skilled in the art that many changes and substitutions can be made within the spirit and scope of the present invention. Therefore, the present invention should not be construed as being limited by the above-described embodiment, and various modifications and changes can be made without departing from the scope of the claims.
1,2,3,4,5 可視化装置
11 文書取得部
12 2値分類推定部
13 格納部
14 表示部
15 分割部
16 音声認識部
1,2,3,4,5
Claims (5)
前記文書を複数の文に分割する分割部と、
前記文書及び前記複数の文それぞれが、予め定められた複数の分類それぞれに属するか否かを推定する2値分類推定部と、
前記文書及び前記複数の文と、前記文書及び前記複数の文それぞれが前記分類それぞれに属するか否かを示す分類結果とを含む結果情報を表示する表示部と、
を備えることを特徴とする可視化装置。 A document acquisition unit for acquiring a document based on a user operation;
A dividing unit that divides the document into a plurality of sentences;
A binary classification estimating unit that estimates whether the document and the plurality of sentences each belong to each of a plurality of predetermined classifications,
Before SL document and the plurality of sentences, and a display unit in which the document and each of the plurality of statements to display the result information and a classification result indicating whether belonging to each of the classification,
A visualization device comprising:
前記文書を複数の文に分割する分割部と、A dividing unit that divides the document into a plurality of sentences;
前記文書及び前記複数の文それぞれが、予め定められた複数の分類それぞれに属するか否かを推定する2値分類推定部と、A binary classification estimating unit that estimates whether the document and the plurality of sentences each belong to each of a plurality of predetermined classifications,
前記文書及び前記複数の文、前記2値分類推定部において推定された分類結果、並びに前記人手付与分類による分類結果を含む結果情報と、該結果情報に含まれる分類結果が、前記推定された分類結果であるか、前記人手付与分類による分類結果であるかを示す情報とを表示する表示部と、The document and the plurality of sentences, the classification result estimated by the binary classification estimation unit, and the result information including the classification result by the manual assignment classification, and the classification result included in the result information is the estimated classification A display unit that displays the result or information indicating whether the result is a classification result according to the manual assignment classification,
を備えることを特徴とする可視化装置。A visualization device comprising:
利用者の操作に基づいて文書を取得するステップと、
前記文書を複数の文に分割する分割するステップと、
前記文書及び前記複数の文それぞれが、予め定められた複数の分類それぞれに属するか否かを推定するステップと、
前記文書及び前記複数の文と、前記文書及び前記複数の文それぞれが前記分類それぞれに属するか否かを示す分類結果とを含む結果情報を表示するステップと、
を含むことを特徴とする可視化方法。 A visualization method performed by a visualization device that estimates a classification of a document,
Obtaining a document based on a user operation;
Dividing the document into a plurality of sentences;
Estimating whether or not each of the document and the plurality of sentences belongs to each of a plurality of predetermined classifications,
Displaying result information including the document and the plurality of sentences, and a classification result indicating whether each of the document and the plurality of sentences belongs to each of the classifications,
A visualization method comprising:
前記文書を複数の文に分割するステップと、Dividing the document into a plurality of sentences;
前記文書及び前記複数の文それぞれが、予め定められた複数の分類それぞれに属するか否かを推定するステップと、Estimating whether or not each of the document and the plurality of sentences belongs to each of a plurality of predetermined classifications,
前記文書及び前記複数の文、前記推定された分類結果、並びに前記人手付与分類による分類結果含む結果情報と、該結果情報に含まれる分類結果が、前記推定された分類結果であるか、前記人手付与分類による分類結果であるかを示す情報と、を含む結果情報を表示するステップと、The document and the plurality of sentences, the estimated classification result, and the result information including the classification result by the manual assignment classification, and whether the classification result included in the result information is the estimated classification result, Displaying result information including information indicating whether the result is a classification result by the assigned classification;
を含むことを特徴とする可視化方法。A visualization method comprising:
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017063573A JP6635966B2 (en) | 2017-03-28 | 2017-03-28 | Visualization device, visualization method, and program |
| JP2019135628A JP6974751B2 (en) | 2017-03-28 | 2019-07-23 | Visualizers, visualization methods, and programs |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017063573A JP6635966B2 (en) | 2017-03-28 | 2017-03-28 | Visualization device, visualization method, and program |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019135628A Division JP6974751B2 (en) | 2017-03-28 | 2019-07-23 | Visualizers, visualization methods, and programs |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018165942A JP2018165942A (en) | 2018-10-25 |
| JP6635966B2 true JP6635966B2 (en) | 2020-01-29 |
Family
ID=63922937
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017063573A Active JP6635966B2 (en) | 2017-03-28 | 2017-03-28 | Visualization device, visualization method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6635966B2 (en) |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4067603B2 (en) * | 1997-07-27 | 2008-03-26 | 株式会社ジャストシステム | Document classification apparatus, storage medium storing document classification program, and document classification method |
| JP3726263B2 (en) * | 2002-03-01 | 2005-12-14 | ヒューレット・パッカード・カンパニー | Document classification method and apparatus |
| JP2005141476A (en) * | 2003-11-06 | 2005-06-02 | Ricoh Co Ltd | Document management apparatus, program, and recording medium |
| JP2006164028A (en) * | 2004-12-09 | 2006-06-22 | Canon Inc | Window-type display device and method thereof |
| JP2006293767A (en) * | 2005-04-12 | 2006-10-26 | Nomura Research Institute Ltd | Sentence classification apparatus, sentence classification method, and classification dictionary creation apparatus |
| JP2013131075A (en) * | 2011-12-21 | 2013-07-04 | Nippon Telegr & Teleph Corp <Ntt> | Classification model learning method, device, program, and review document classifying method |
| US10331782B2 (en) * | 2014-11-19 | 2019-06-25 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems and methods for automatic identification of potential material facts in documents |
-
2017
- 2017-03-28 JP JP2017063573A patent/JP6635966B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2018165942A (en) | 2018-10-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN108153551B (en) | Method and device for displaying business process page | |
| US20120330662A1 (en) | Input supporting system, method and program | |
| CN104281656B (en) | The method and apparatus of label information are added in the application | |
| US20130035929A1 (en) | Information processing apparatus and method | |
| JP5489660B2 (en) | Image management apparatus, control method thereof, and program | |
| CN104735468A (en) | A method and system for synthesizing images into new videos based on semantic analysis | |
| CN107832469A (en) | A kind of generation method and device of enterprise logo images | |
| US20150278248A1 (en) | Personal Information Management Service System | |
| US20170109339A1 (en) | Application program activation method, user terminal, and server | |
| WO2017080007A1 (en) | Intelligent analysis and processing system of identification code and processing method therefor | |
| CN103365970A (en) | Method and device for automatically acquiring learning material information | |
| US12124683B1 (en) | Content analytics as part of content creation | |
| CN109190019B (en) | User image generation method, electronic equipment and computer storage medium | |
| KR20210086836A (en) | Image data processing method for searching images by text | |
| US20080154922A1 (en) | Information processing apparatus and control method | |
| JP6635966B2 (en) | Visualization device, visualization method, and program | |
| JP6974751B2 (en) | Visualizers, visualization methods, and programs | |
| CN102346771B (en) | Information display method and device | |
| US8705871B2 (en) | Form image managing system and method | |
| CN116740232A (en) | Template processing method, device, equipment and medium | |
| KR102295030B1 (en) | Life tag generation device and method | |
| CN106775810A (en) | The wiring method and device of configuration file in distributed file system | |
| WO2021117483A1 (en) | Information processing device, information processing method, and program | |
| JP7650560B1 (en) | Referral Program, Referral System and Referral Method | |
| JP2010073092A (en) | Information processor and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180507 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190319 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190326 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190516 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190723 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191217 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191217 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6635966 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |