Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6675868B2 - Information processing apparatus, information processing method, and program - Google Patents
[go: Go Back, main page]

JP6675868B2 - Information processing apparatus, information processing method, and program - Google Patents

Information processing apparatus, information processing method, and program Download PDF

Info

Publication number
JP6675868B2
JP6675868B2 JP2015249682A JP2015249682A JP6675868B2 JP 6675868 B2 JP6675868 B2 JP 6675868B2 JP 2015249682 A JP2015249682 A JP 2015249682A JP 2015249682 A JP2015249682 A JP 2015249682A JP 6675868 B2 JP6675868 B2 JP 6675868B2
Authority
JP
Japan
Prior art keywords
post
posts
type
information processing
annotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015249682A
Other languages
Japanese (ja)
Other versions
JP2017117068A (en
JP2017117068A5 (en
Inventor
琢麻 蔵満
琢麻 蔵満
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2015249682A priority Critical patent/JP6675868B2/en
Publication of JP2017117068A publication Critical patent/JP2017117068A/en
Publication of JP2017117068A5 publication Critical patent/JP2017117068A5/ja
Application granted granted Critical
Publication of JP6675868B2 publication Critical patent/JP6675868B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、Twitterなどのマイクロブログから投稿を抽出する技術に関する。   The present invention relates to a technique for extracting a post from a microblog such as Twitter.

Twitterなどのマイクロブログは、いつでも誰でも書き込むことが可能であるため、部分的ではあるものの、世の中の声がテキストデータとしてリアルタイムに集まる場所とみることができる。近年では、速報性が高い情報源としてマイクロブログを活用しているユーザや企業も多い。   Since microblogging such as Twitter can be written by anyone at any time, it can be regarded as a place where the voice of the world gathers as text data in real time, though it is partial. In recent years, there are many users and companies that use microblogging as an information source with high speed reporting.

しかし、人手で確認できる投稿の量には限界があり、日々増加する投稿を全て確認することは困難であるため、非特許文献1に示されるように、投稿の集合に対してなんらかの機械的な処理を施し、全体を俯瞰して評判や話題を抽出する研究が盛んにおこなわれている。   However, there is a limit to the amount of posts that can be manually checked, and it is difficult to check all posts that increase daily. Therefore, as shown in Non-Patent Document 1, some mechanical Research to extract the reputation and topics by performing processing and overlooking the whole is being actively conducted.

例えば、図1に示すように、特定の商品名を含む投稿を抽出し、投稿数の時系列推移を可視化することにより、商品に対してなんらかのイベントが発生したタイミングを把握することができる。また、図2に示すように、投稿中に含まれる各単語の頻度など、統計情報を参照することにより、全ての投稿を読まずとも、どのような話題が数多く発生しているかを大まかに把握できる。   For example, as shown in FIG. 1, by extracting a post including a specific product name and visualizing the time-series transition of the number of posts, it is possible to grasp the timing at which any event has occurred for the product. Also, as shown in FIG. 2, by referring to statistical information such as the frequency of each word included in the post, it is possible to roughly understand what topics are occurring without reading all the posts. it can.

前述の技術を組み合わせ、話題が急増した期間を確認して該当する期間の話題を可視化することが可能となる。しかし、投稿数が急増したすべての期間を人手で調査する作業には非常に手間がかかる。また、イベントが発生した期間においては、拡散された投稿や、イベントに関連する単語が頻出する傾向があり、イベントに関連しない話題や評価を把握しづらくなる問題もある。   By combining the above-described techniques, it is possible to confirm a period in which the topic has increased sharply and visualize the topic in the corresponding period. However, the task of manually investigating all periods during which the number of posts has surged is extremely time-consuming. Also, during the period in which the event occurs, there is a tendency that diffused posts and words related to the event tend to appear frequently, making it difficult to grasp topics and evaluations not related to the event.

グラフが急増・急減した原因分析を分かりやすくする手法として、特許文献1では、イベントの発生を表す単語(「発売」「発表」「開催」「発覚」など)と時間表現とを含む投稿から特定の対象に発生したイベントのスケジュール情報を自動的に抽出し、時系列のグラフ上に注釈付する手法が提案されている。   As a technique for making it easy to understand the cause analysis of the sudden increase / decrease of the graph, Japanese Patent Application Laid-Open Publication No. 2003-216400 specifies from a post including words (eg, “release”, “announcement”, “holding”, “discovery”) and time expressions indicating the occurrence of an event. There has been proposed a method of automatically extracting schedule information of an event that has occurred in a target and annotating the schedule information on a time-series graph.

WO2009/101954WO2009 / 101954

奥村 学、「ソーシャルメディアを対象としたテキストマイニング」電子情報通信学会基礎・境界ソサイエティFundamental Review Vol.6 No.4 pp.285-293, 2013.Okumura Manabu, "Text Mining for Social Media" IEICE Fundamental and Boundary Society Fundamental Review Vol.6 No.4 pp.285-293, 2013. 乾 孝司、他「テキストを対象とした評価情報の分析に関する研究動向」自然言語処理、言語処理学会、2006年7月、Vol.13、No.3、pp.201−241Takashi Inui, et al., "Research Trends in Analysis of Evaluation Information for Text", Natural Language Processing, Japan Society for Language Processing, July 2006, Vol. 13, No. 3, pp. 201-241

特許文献1に示される技術では、各期間において発生しているイベントの一部を時系列グラフ上に提示することが可能にはなるが、提示するイベントに関する投稿が対象の期間中においてどの程度の割合を占めるかを示すことができない。すなわち、提示されているイベント以外の話題が投稿数の急増に寄与している可能性もあることから、システムの利用者はより詳細な分析が必要かどうかを注釈付された情報のみからは判断できず、投稿数が急増した原因分析の労力削減という観点において十分であるとはいえない。   According to the technology disclosed in Patent Document 1, it is possible to present a part of an event occurring in each period on a time-series graph. I can't show you what it is. In other words, since topics other than the event presented may have contributed to the sudden increase in the number of posts, users of the system can determine whether more detailed analysis is necessary based only on the annotated information. It cannot be said that it is enough from the viewpoint of reducing labor for analyzing the cause of the sudden increase in the number of posts.

本発明は、前述の問題点に鑑みてなされたもので、投稿に対して、より詳細な分析作業を必要とするか否かの判断材料をシステム利用者に提供し、システム利用者の作業負荷軽減を図ることを目的とする。   The present invention has been made in view of the above-described problems, and provides a system user with information for determining whether or not a post requires a more detailed analysis work, thereby reducing the workload of the system user. The purpose is to reduce the amount.

前述した課題を解決するための第1の発明は、特定の対象に関する1以上の投稿を抽出する抽出手段と、抽出された各投稿を投稿の種別ごとに集計する集計手段と、投稿の種別ごとの集計情報を表示する表示手段と、を備え、前記投稿の種別には、少なくとも、投稿の拡散を目的とする投稿、特定の対象に関する記事を紹介することを目的とする投稿とを含むことを特徴とする情報処理装置である。
第1の発明によれば、抽出された投稿を、投稿の種別ごとに集計し、投稿の種別ごとの集計情報として表示する。これにより、投稿の種別ごとに集計結果を把握することができるため、投稿に対して、より詳細な分析作業を必要とするか否かの判断材料をシステム利用者に提供し、システム利用者の作業負担軽減を図ることが可能となる。また、抽出された投稿を、投稿の拡散を目的とする投稿特定の対象に関する記事を紹介することを目的とする投稿に分類して分析することが可能となる。
According to a first aspect of the present invention, there is provided an extracting unit for extracting one or more posts related to a specific object, a totaling unit for totalizing the extracted posts for each type of post, and a totaling unit for each type of post. and a display means for displaying the summary information, wherein the post type, at least, include a post for the purpose of diffusion of posts, and a post intended to introduce the articles on a particular subject An information processing apparatus characterized by the following.
According to the first aspect, the extracted posts are totaled for each type of post, and displayed as total information for each type of post. As a result, it is possible to grasp the totaling result for each type of post, so that it is possible to provide the system user with information on whether or not the post requires more detailed analysis work, and to provide the system user with Work burden can be reduced. Further, the extracted posts, it is possible to analyze and classify the post and for the purpose of introducing the articles on posts with a particular subject for the purpose of diffusion of posts.

第1の発明において、前記表示手段は、投稿の種別ごとの投稿数を時系列グラフで表示することが望ましい。このとき、前記時系列グラフに、投稿に関する注釈を付与する注釈付与手段を更に備えることが望ましい。これによって、注釈付きの時系列グラフ上において、投稿の構成(種別)を把握することが容易になり、更に詳細な分析を行う必要があるか否かを判断するための時間を短縮することができる。また、前記注釈の内容は、投稿の種別毎に抽出した話題と当該話題ごとの件数であって、投稿数の多い投稿の種別順に表示したものであることが望ましい。これによって、時系列グラフ上において、主な話題と話題ごとの投稿数を併せて注釈付与することで、投稿数が増えた原因分析が容易となる。 In the first invention, it is preferable that the display unit displays the number of posts for each type of post in a time-series graph. At this time, it is preferable that the time-series graph further includes an annotation means for giving an annotation relating to the post. This makes it easy to grasp the composition (type) of the post on the annotated time-series graph, and to reduce the time for determining whether or not it is necessary to perform more detailed analysis. it can. Further, it is preferable that the contents of the annotation are topics extracted for each type of post and the number of cases for each topic, and are displayed in the order of the type of post having a large number of posts. This makes it easy to analyze the cause of the increase in the number of posts by annotating the main topic and the number of posts for each topic together on the time-series graph.

第2の発明は、特定の対象に関する1以上の投稿を抽出する抽出手段と、抽出された各投稿を投稿の種別ごとに集計する集計手段と、投稿の種別ごとの投稿数を時系列グラフで表示する表示手段と、前記時系列グラフに、投稿に関する注釈を付与する注釈付与手段と、を備え、前記注釈の内容は、投稿の種別毎に抽出した話題と当該話題ごとの件数を表示したものであることを特徴とする情報処理装置である。  According to a second aspect of the present invention, there is provided an extracting unit that extracts one or more posts related to a specific target, a totaling unit that totals each extracted post for each type of post, and a time series graph of the number of posts for each type of post. Display means for displaying, and an annotation means for giving an annotation on a post to the time-series graph, wherein the contents of the annotation show topics extracted for each type of post and the number of cases for each topic. An information processing apparatus characterized in that:
第2の発明によれば、抽出された投稿を、投稿の種別ごとに集計し、投稿の種別ごとの投稿数を時系列グラフで表示し、この時系列グラフに、投稿に関する注釈を付与する。また、注釈の内容は、投稿の種別毎に抽出した話題と当該話題ごとの件数を表示したものとする。これによって、注釈付きの時系列グラフ上において、投稿の種別を把握することが容易になり、更に詳細な分析を行う必要があるか否かを判断するための時間を短縮することができる。また、時系列グラフ上において、主な話題と話題ごとの投稿数を併せて注釈付与することで、投稿数が増えた原因分析が容易となる。  According to the second invention, the extracted posts are totaled for each type of post, the number of posts for each type of post is displayed in a time-series graph, and an annotation regarding the post is given to the time-series graph. It is assumed that the contents of the annotation display the topics extracted for each type of post and the number of cases for each topic. This makes it easy to grasp the type of post on the annotated time-series graph, and it is possible to reduce the time for determining whether or not it is necessary to perform more detailed analysis. Also, by annotating the main topic and the number of posts for each topic together on the time-series graph, it is easy to analyze the cause of the increase in the number of posts.
また、前記注釈の内容は、投稿の種別毎に抽出した話題と当該話題ごとの件数を投稿数の多い投稿の種別順に表示したものであることが望ましい。  In addition, it is desirable that the contents of the annotation are displayed in such a manner that topics extracted for each type of post and the number of cases for each topic are displayed in the order of the type of post having a large number of posts.

また、第1、第2の発明において、投稿数に基づいてイベント発生期間を取得するイベント取得手段を、更に備え、前記注釈付与手段は、前記イベント発生期間に対応した前記時系列グラフ上に注釈を付与することが望ましい。これによって、投稿数が増加するイベント発生期間において投稿の構成(種別)を容易に把握することが可能となる。Further, in the first and second inventions, further comprising an event acquiring means for acquiring an event occurrence period based on the number of posts, wherein the annotating means comprises an annotation on the time-series graph corresponding to the event occurrence period. Is desirably provided. This makes it possible to easily grasp the configuration (type) of the post during the event occurrence period in which the number of posts increases.

の発明は、情報処理装置の抽出手段が、特定の対象に関する1以上の投稿を抽出する抽出ステップと、前記情報処理装置の集計手段が、抽出された各投稿を投稿の種別ごとに集計する集計ステップと、前記情報処理装置の表示手段が、集計した投稿の種別ごとの集計情報を表示する表示ステップと、を含み、前記投稿の種別には、少なくとも、投稿の拡散を目的とする投稿、特定の対象に関する記事を紹介することを目的とする投稿とを含むことを特徴とする情報処理方法である。
第4の発明は、情報処理装置の抽出手段が、特定の対象に関する1以上の投稿を抽出するステップと、情報処理装置の集計手段が、抽出された各投稿を投稿の種別ごとに集計するステップと、情報処理装置の表示手段が、投稿の種別ごとの投稿数を時系列グラフで表示するステップと、情報処理装置の注釈付与手段が、前記時系列グラフに、投稿に関する注釈を付与するステップと、を含み、前記注釈の内容は、投稿の種別毎に抽出した話題と当該話題ごとの件数を表示したものであることを特徴とする情報処理方法である。
According to a third aspect , an extraction step of the information processing device extracts one or more posts related to a specific target, and a tallying unit of the information processing device counts each of the extracted posts for each type of post. And a display step in which the display means of the information processing apparatus displays the total information for each type of post that has been totaled. When an information processing method which comprises a post intended to introduce the articles on a particular subject.
A fourth invention is a step in which the extracting means of the information processing device extracts one or more posts related to a specific object, and the step in which the counting means of the information processing device counts each extracted post for each type of post. A step of displaying the number of posts for each type of post in a time-series graph, and a step of annotating the information processing apparatus annotating the time-series graph with a post-related annotation. , And the content of the annotation is a display of a topic extracted for each type of post and the number of cases for each topic.

の発明は、コンピュータを、特定の対象に関する1以上の投稿を抽出する抽出手段と、抽出された各投稿を投稿の種別ごとに集計する集計手段と、投稿の種別ごとの集計情報を表示する表示手段と、して機能させるためのプログラムであって、前記投稿の種別には、少なくとも、投稿の拡散を目的とする投稿、特定の対象に関する記事を紹介することを目的とする投稿とを含むことを特徴とするプログラムである。
第6の発明は、コンピュータを、特定の対象に関する1以上の投稿を抽出する抽出手段と、抽出された各投稿を投稿の種別ごとに集計する集計手段と、投稿の種別ごとの投稿数を時系列グラフで表示する表示手段と、前記時系列グラフに、投稿に関する注釈を付与する注釈付与手段と、して機能させるためのプログラムであって、前記注釈の内容は、投稿の種別毎に抽出した話題と当該話題ごとの件数を表示したものであることを特徴とするプログラムである。
According to a fifth aspect of the present invention, the computer displays an extracting unit for extracting one or more posts related to a specific target, a totaling unit for totalizing each extracted post for each type of post, and displaying totaling information for each type of post. display means for, in a program for functioning in, wherein the post type, at least, a post for the purpose of diffusion of posts, the posts for the purpose of introducing the articles on a particular subject The program is characterized by including:
According to a sixth aspect of the present invention, there is provided a computer, comprising: an extracting unit that extracts one or more posts related to a specific target; a counting unit that counts each extracted post for each type of post; A program for functioning as display means for displaying in a series graph, and annotation means for giving an annotation about a post to the time series graph, wherein the contents of the annotation are extracted for each type of post. The program is characterized by displaying topics and the number of cases for each topic.

本発明によれば、投稿に対して、より詳細な分析をする必要があるか否かの判断材料をシステム利用者に提供することができるようになる。   ADVANTAGE OF THE INVENTION According to this invention, it becomes possible to provide the system user with information for determining whether or not it is necessary to perform more detailed analysis on a post.

投稿数の時系列推移の可視化例を示す図Diagram showing visualization example of time-series transition of the number of posts 投稿中に含まれる各単語の頻度を示す図Diagram showing the frequency of each word included in the post マイクロブログ分析システム100の機能構成を示す図Diagram showing the functional configuration of the microblog analysis system 100 情報処理装置101のハードウェア構成の一例を示すブロック図FIG. 2 is a block diagram illustrating an example of a hardware configuration of the information processing apparatus 101. 投稿データ120の一例を示す図Diagram showing an example of post data 120 投稿集計データ130の一例を示す図The figure which shows an example of the contribution total data 130 投稿取得処理のフローチャートFlowchart of post acquisition process 投稿集計処理のフローチャートFlowchart of post totaling process 投稿可視化部113が生成した投稿数日別推移グラフの一例を示す図The figure which shows an example of the number-of-posts daily change graph which the post visualization part 113 generated. 投稿可視化部113が生成した時系列グラフの一例を示す図The figure which shows an example of the time series graph which the post visualization part 113 produced | generated. 図10の注釈の全内容を示す図Diagram showing the entire contents of the annotation in FIG.

以下、図面を参照して、本発明の実施形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図4は、本発明の実施形態に係わる情報処理装置101のハードウェア構成の一例を示すブロック図である。
図4において、201はCPUで、システムバス204に接続される各デバイスやコントローラを統括的に制御する。また、ROM203あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input / Output System)やオペレーティングシステムプログラム(以下、OS)や、各サーバ或いは各PCの実行する機能を実現するために必要な各種プログラム等が記憶されている。
FIG. 4 is a block diagram illustrating an example of a hardware configuration of the information processing apparatus 101 according to the embodiment of the present invention.
In FIG. 4, reference numeral 201 denotes a CPU, which comprehensively controls each device and controller connected to the system bus 204. Also, the ROM 203 or the external memory 211 is required to implement a function executed by each server or each PC, such as a basic input / output system (BIOS) or an operating system program (hereinafter, OS), which is a control program of the CPU 201. Various programs and the like are stored.

202はRAMで、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM203あるいは外部メモリ211からRAM202にロードして、該ロードしたプログラムを実行することで各種動作を実現するものである。   Reference numeral 202 denotes a RAM, which functions as a main memory, a work area, and the like for the CPU 201. The CPU 201 implements various operations by loading programs and the like necessary for executing processing from the ROM 203 or the external memory 211 into the RAM 202 and executing the loaded programs.

また、205は入力コントローラで、入力装置209等からの入力を制御する。206はビデオコントローラで、液晶ディスプレイ等のディスプレイ装置210への表示を制御する。なお、ディスプレイ装置は、液晶ディスプレイに限られず、CRTディスプレイなどであっても良い。これらは必要に応じてクライアントが使用するものである。   An input controller 205 controls input from the input device 209 or the like. A video controller 206 controls display on a display device 210 such as a liquid crystal display. The display device is not limited to a liquid crystal display, but may be a CRT display or the like. These are used by the client as needed.

207はメモリコントローラで、ブートプログラム,各種のアプリケーション,フォントデータ,ユーザファイル,編集ファイル,各種データ等を記憶するハードディスク(HD)や、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。
外部メモリ211には、後述するマイクロブログ分析システム100の各機能をCPU201により実行するプログラムが格納されている。このプログラムを汎用のコンピュータにインストールすることによって、本発明に係る情報処理装置101を得ることができる。
A memory controller 207 is connected to a hard disk (HD) for storing a boot program, various applications, font data, user files, edit files, various data, and the like, a flexible disk (FD), or a PCMCIA card slot via an adapter. Access to an external memory 211 such as a compact flash (registered trademark) memory.
The external memory 211 stores a program for causing the CPU 201 to execute each function of the microblog analysis system 100 described later. By installing this program on a general-purpose computer, the information processing apparatus 101 according to the present invention can be obtained.

208は通信I/Fコントローラで、ネットワーク(例えば、図1に示したLAN400)を介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信等が可能である。   A communication I / F controller 208 connects and communicates with an external device via a network (for example, the LAN 400 shown in FIG. 1), and executes communication control processing on the network. For example, communication using TCP / IP is possible.

なお、CPU201は、例えばRAM202内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ装置210上での表示を可能としている。また、CPU201は、ディスプレイ装置210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
ハードウェア上で動作する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM202にロードされることによりCPU201によって実行されるものである。
なお、全ての装置がこれらの構成を備えているわけではなく、必要なものを備えていればよい。
Note that the CPU 201 enables display on the display device 210 by executing, for example, a process of developing (rasterizing) an outline font in a display information area in the RAM 202. Further, the CPU 201 enables a user instruction with a mouse cursor (not shown) on the display device 210.
Various programs operating on the hardware are recorded in the external memory 211 and are executed by the CPU 201 by being loaded into the RAM 202 as needed.
Note that not all devices have these components, and only need to have necessary components.

本発明は、マイクロブログにおいて投稿が急増する際(イベント発生時)には、イベントの情報に関連するWebページのURLが投稿に含まれる可能性が高いことや、マイクロブログユーザの関心を集めた投稿が引用されて拡散されやすいことなど、マイクロブログの性質を利用して話題の抽出、および、可視化を行う。以下、図面を参照して、本発明の実施形態を詳細に説明する。   According to the present invention, when the number of posts on a microblog increases rapidly (when an event occurs), it is highly likely that the URL of a Web page related to the event information is included in the post, and the microblog user's interest has been attracted. Topics are extracted and visualized using the characteristics of microblogging, such as the fact that posts are easily quoted and spread. Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図3は、本発明の実施形態におけるマイクロブログ分析システム100の機能構成を示す図である。
マイクロブログ分析システム100は、投稿取得部111と、投稿集計部112と、投稿可視化部113と、投稿データ120と、投稿集計データ130とを備える。
FIG. 3 is a diagram illustrating a functional configuration of the microblog analysis system 100 according to the embodiment of the present invention.
The microblog analysis system 100 includes a post acquisition unit 111, a post totaling unit 112, a post visualizing unit 113, post data 120, and post total data 130.

投稿取得部111は、マイクロブログから特定の対象に関する投稿を取得し、投稿データ120に格納する。投稿取得部111における投稿取得処理については、後に例を用いて詳しく説明する。   The post acquisition unit 111 acquires a post related to a specific target from the microblog and stores the post in the post data 120. The post acquisition process in the post acquisition unit 111 will be described later in detail using an example.

投稿集計部112は、投稿データ120に保存された投稿を参照し、投稿データの時系列グラフを生成するために必要な各種集計処理を行い、集計結果を投稿集計データ130に格納する。投稿集計部112における集計処理については、後に例を用いて詳しく説明する。   The post totaling unit 112 refers to the post stored in the post data 120, performs various types of total processing required to generate a time-series graph of the post data, and stores the total result in the post total data 130. The tallying process in the posting tallying unit 112 will be described later in detail using an example.

投稿可視化部113は、投稿集計データ130を参照し、投稿データの時系列グラフ生成を行う。時系列グラフの生成方法については、後に例を用いて詳しく説明する。   The post visualization unit 113 generates a time-series graph of the post data with reference to the post total data 130. The method of generating the time series graph will be described in detail later using an example.

図5は、投稿データ120の一例であり、投稿を一意に識別する投稿IDと、投稿日時、投稿文に加え、投稿取得部111が別途付与する記事タイトルと、拡散対象IDとを投稿ごとに保持する。記事タイトル、および、拡散対象IDについては、後の投稿取得処理の説明において詳しく説明する。   FIG. 5 is an example of the post data 120. In addition to a post ID for uniquely identifying a post, a post date and time, and a post, an article title separately given by the post acquisition unit 111 and a diffusion target ID are provided for each post. Hold. The article title and the diffusion target ID will be described in detail later in the description of the post acquisition process.

図6は、投稿集計データ130の一例である。投稿集計データ130は、全投稿集計データ131、記事投稿集計データ132、拡散投稿集計データ133、意見投稿集計データ134から成る。各データの詳細は、後の投稿集計処理の説明において詳しく説明する。   FIG. 6 is an example of the post totaling data 130. The post total data 130 includes total post total data 131, article post total data 132, spread post total data 133, and opinion post total data 134. Details of each data will be described in detail in the description of the post totaling process.

次に、投稿取得部111における投稿取得処理、投稿集計部112における集計処理、投稿可視化部113における時系列グラフの生成方法について、順に例を用いて説明する。   Next, the post acquisition process in the post acquisition unit 111, the tallying process in the post tallying unit 112, and the method of generating the time series graph in the post visualization unit 113 will be described in order using examples.

まず、投稿取得部111における投稿取得処理について、図5、図7を用いて説明する。図7は、本発明の実施形態における投稿取得処理のフローチャートである。以下、図7の処理に従って、「製品A」に関する投稿をマイクロブログから取得する例を示す。   First, the post acquisition process in the post acquisition unit 111 will be described with reference to FIGS. FIG. 7 is a flowchart of the post acquisition process according to the embodiment of the present invention. Hereinafter, an example in which a post about “product A” is acquired from a microblog according to the processing of FIG. 7 will be described.

ステップS101において、情報処理装置101のCPU201(投稿取得部111)は、分析対象である「製品A」を投稿文中に含む投稿をマイクロブログから取得する。以降の処理を説明するため、ここでは下表に示す5件の投稿(投稿A〜投稿E)を含む投稿の集合を取得したものとする。
なお、ステップS101によって、本発明の「マイクロブログから、特定の対象に関する1以上の投稿を抽出する抽出手段」の一例が構成されている。
In step S101, the CPU 201 (post acquisition unit 111) of the information processing apparatus 101 acquires, from the microblog, a post including “product A” to be analyzed in the posted text. In order to explain the subsequent processing, it is assumed here that a set of posts including the five posts (post A to post E) shown in the following table has been acquired.
Note that step S101 constitutes an example of “extraction means for extracting one or more posts related to a specific subject from a microblog” of the present invention.

Figure 0006675868
Figure 0006675868

ステップS101で取得した各投稿に対して、CPU201(投稿取得部111)は、ステップS102〜ステップS107の処理を繰り返し実行する。ステップS102〜ステップS107の処理は、投稿に含まれるURLや、他の投稿を引用した投稿に対して付加情報を取得し、投稿データ120に保存する処理である。   For each post acquired in step S101, the CPU 201 (post acquisition unit 111) repeatedly executes the processes of steps S102 to S107. The processing of steps S102 to S107 is processing of acquiring additional information for a URL included in a post or a post citing another post, and storing the additional information in the post data 120.

まず、ステップS103において、CPU201(投稿取得部111)は、投稿文にURLが含まれるか否かを判定する。CPU201(投稿取得部111)は、投稿文にURLが含まれていれば、処理をステップS104に移行する。例えば、投稿AはURLを投稿文中に含むため、CPU201(投稿取得部111)は、ステップS104の処理を実行する。   First, in step S103, the CPU 201 (post acquisition unit 111) determines whether a URL is included in the posted text. CPU201 (post acquisition part 111) shifts processing to Step S104, when URL is contained in a contribution text. For example, since the post A includes the URL in the post, the CPU 201 (post acquisition unit 111) executes the process of step S104.

ステップS104において、CPU201(投稿取得部111)は、URLが示すWebページのタイトルをインターネット経由で取得する。ここで、取得したタイトルを「記事タイトル」と呼ぶ。なお、投稿文に複数のURLが含まれている場合、CPU201(投稿取得部111)は、すべてのURLに対する記事タイトルを取得する。例えば、投稿Aにおいては、URL「http://zsha.example.com/news/1001.html」に対する記事タイトル「製品Aを今冬発売予定」と、URL「http://zsha.example.com/news/1002.html」に対する記事タイトル「製品Aの性能表」をそれぞれ取得する。   In step S104, the CPU 201 (post acquisition unit 111) acquires the title of the Web page indicated by the URL via the Internet. Here, the acquired title is called an “article title”. When a posted sentence includes a plurality of URLs, the CPU 201 (post acquisition unit 111) acquires article titles for all URLs. For example, in the post A, the article title “Product A will be released this winter” for the URL “http://zsha.example.com/news/1001.html” and the URL “http://zsha.example.com/ news / 1002.html "for each article title" Product A performance table ".

次に、ステップS105において、CPU201(投稿取得部111)は、投稿が他の投稿を引用したものであるかを判定する。CPU201(投稿取得部111)は、投稿が他の投稿を引用したものでれば、処理をステップS106に移行する。例えば、投稿Cは投稿Bを引用した投稿であるため、ステップS106の処理を実行する。ここで、説明を簡略化するため、各投稿が引用した投稿は、マイクロブログから投稿を取得する時点で取得可能な情報として説明する。   Next, in step S105, the CPU 201 (post acquisition unit 111) determines whether or not the post refers to another post. If the post cites another post, the CPU 201 (post acquisition unit 111) shifts the processing to step S106. For example, since the post C is a post citing the post B, the process of step S106 is executed. Here, in order to simplify the explanation, the posts quoted by each post will be described as information that can be obtained at the time of obtaining the post from the microblog.

ステップS106において、CPU201(投稿取得部111)は、引用した投稿の投稿IDを取得する。ここで取得した投稿IDを「拡散対象ID」と呼ぶ。   In step S106, the CPU 201 (post acquisition unit 111) acquires the post ID of the quoted post. The post ID acquired here is called “spread target ID”.

次に、ステップ107において、CPU201(投稿取得部111)は、投稿IDと、投稿日時と、投稿文と、ステップ104で取得した記事タイトルと、ステップ106で取得した拡散対象IDとを、投稿データ120に追加する。ここで、記事タイトルが存在する投稿を「記事投稿」(Web上の記事を紹介することを目的とする投稿)、拡散対象IDが存在する投稿を「拡散投稿」(投稿の拡散を目的とする投稿)、いずれも存在しない投稿を「意見投稿」と呼ぶ。例えば、投稿A、投稿Bは記事投稿、投稿Cは記事投稿かつ拡散投稿、投稿Dは意見投稿、投稿Eは拡散投稿である。   Next, in step 107, the CPU 201 (post acquisition unit 111) stores the post ID, the post date and time, the posted text, the article title acquired in step 104, and the diffusion target ID acquired in step 106 in the post data. Add to 120. Here, a post having an article title is referred to as an "article post" (a post intended to introduce an article on the Web), and a post having a target ID is referred to as a "diffused post" (a purpose of post diffusion). Posts), and posts that do not exist are called "opinion posts." For example, the post A and the post B are article posts, the post C is an article post and diffuse post, the post D is an opinion post, and the post E is a diffuse post.

以上、投稿取得部111における投稿取得処理について、例を用いて説明した。なお、説明の簡略化のため、ステップS105について、各投稿が引用した投稿は、マイクロブログから投稿を取得する時点で取得可能な情報として説明したが、取得不可能な環境においても、投稿文の内容や投稿日時の前後関係により、引用対象の投稿を機械的に取得することが可能である。   The post acquisition process in the post acquisition unit 111 has been described using examples. Note that, for simplification of the description, the post cited by each post has been described as information that can be obtained at the time of obtaining the post from the microblog in step S105. It is possible to mechanically acquire a post to be quoted depending on the context of the content and the posting date and time.

次に、投稿集計部112における投稿集計処理について、図5、図6、図8を用いて説明する。図8は、本発明の実施形態における投稿集計処理のフローチャートである。以下、図8の処理に従って、「製品A」に関する「2015年10月4日」の投稿を集計する例を示す。   Next, the post totaling process in the post totalizing section 112 will be described with reference to FIGS. 5, 6, and 8. FIG. FIG. 8 is a flowchart of the post totaling process in the embodiment of the present invention. Hereinafter, an example in which the postings of “October 4, 2015” regarding “Product A” are totaled according to the processing of FIG.

まず、ステップS201において、情報処理装置101のCPU201(投稿集計部112)は、集計対象期間に投稿された投稿を投稿データから取得する。例えば、集計対象期間が2015年10月4日の1日間である場合、図5の投稿データ120において投稿A、投稿B、投稿C、投稿Dは取得対象であり、投稿Eは取得対象外である。   First, in step S201, the CPU 201 (post counting unit 112) of the information processing apparatus 101 acquires a post posted during the counting target period from the posting data. For example, when the totaling period is one day of October 4, 2015, the posting data 120 in FIG. 5 indicates that posting A, posting B, posting C, and posting D are to be obtained, and posting E is not to be obtained. is there.

次に、ステップS201で取得した各投稿に対して、CPU201(投稿集計部112)は、ステップS202〜ステップS209の処理を繰り返し実行する。ステップS202〜ステップS209の処理は、投稿集計データ130を更新する処理である。   Next, for each post acquired in step S201, the CPU 201 (post totaling unit 112) repeatedly executes the processes of steps S202 to S209. The process of steps S202 to S209 is a process of updating the posted total data 130.

まずステップS203において、CPU201(投稿集計部112)は、投稿データに記事タイトルが存在するか否かを判定する。CPU201(投稿集計部112)は、投稿データに記事タイトルが含まれていれば、処理をステップS204に移行する。   First, in step S203, the CPU 201 (post totaling unit 112) determines whether or not an article title exists in the post data. If the article title is included in the posted data, the CPU 201 (post counting unit 112) shifts the processing to step S204.

ステップS204において、CPU201(投稿集計部112)は、記事投稿集計データ132を更新する。記事投稿集計データ132は、集計対象期間、記事タイトル、投稿数から成る。ここで、投稿数は、各集計期間において各記事タイトルが含まれる投稿の数である。CPU201(投稿集計部112)は、記事投稿集計データ132を参照し、投稿データと同じ集計対象期間・記事タイトルであるレコードが存在すれば、該当するレコードの投稿数に1を加算し、該当するレコードが存在しなければ、投稿数が1である新たなレコードを登録する。   In step S204, the CPU 201 (the post totaling unit 112) updates the post totaling data 132. The article posting total data 132 includes a totaling period, an article title, and the number of posts. Here, the number of posts is the number of posts including each article title in each counting period. The CPU 201 (post counting unit 112) refers to the article posting count data 132, and if there is a record having the same counting target period / article title as the posting data, adds 1 to the number of posts of the corresponding record, and If the record does not exist, a new record with one post is registered.

次にステップS205において、CPU201(投稿集計部112)は、投稿データに拡散対象IDが存在するか否かを判定する。CPU201(投稿集計部112)は、投稿データに拡散対象IDが含まれていれば、処理をステップS206に移行する。   Next, in step S205, the CPU 201 (post totalizing unit 112) determines whether or not the post data has a diffusion target ID. If the post data includes the diffusion target ID, the CPU 201 (post totaling unit 112) shifts the processing to step S206.

ステップS206において、CPU201(投稿集計部112)は、拡散投稿集計データ133を更新する。拡散投稿集計データ133は、集計対象期間、拡散対象ID、投稿数から成る。ここで、投稿数は、各集計期間において各拡散対象IDが含まれる投稿の数である。CPU201(投稿集計部112)は、拡散投稿集計データ133を参照し、投稿データと同じ集計対象期間・拡散対象IDであるレコードが存在すれば、該当するレコードの投稿数に1を加算し、該当するレコードが存在しなければ、投稿数が1である新たなレコードを登録する。   In step S206, the CPU 201 (the post totaling unit 112) updates the diffused post total data 133. The spread posting total data 133 includes a totaling period, a spreading target ID, and the number of posts. Here, the number of posts is the number of posts including each diffusion target ID in each aggregation period. The CPU 201 (post totalizing unit 112) refers to the diffusion totaling data 133, and if there is a record having the same totaling period and diffusion ID as the posting data, adds 1 to the number of postings of the corresponding record, and If there is no record to be registered, a new record with one post is registered.

次にステップS207において、CPU201(投稿集計部112)は、投稿データが意見投稿(記事タイトルも拡散対象IDも存在しない)であるか否かを判定する。CPU201(投稿集計部112)は、投稿データが意見投稿であれば、処理をステップS208に移行する。   Next, in step S207, the CPU 201 (post totalizing unit 112) determines whether or not the post data is an opinion post (no article title or diffusion target ID exists). If the posting data is an opinion posting, the CPU 201 (post summarizing unit 112) shifts the processing to step S208.

ステップS208において、CPU201(投稿集計部112)は、意見投稿集計データ134を更新する。意見投稿集計データ134は、集計対象期間、意見、投稿数から成る。ここで、「意見」は、投稿文から自然言語処理を用いて抽出する文字列である。説明を簡略化するため、ここでは投稿文に含まれる形容詞や動詞を投稿データの意見として取り扱う(形容詞や動詞を抽出することは公知の技術で可能である)。例えば、図5の投稿データ120における投稿Dの投稿文「製品A欲しいな…。性能3倍とかすごい。」から、「欲しい」「すごい」などの形容詞を抽出する。CPU201(投稿集計部112)は、意見投稿集計データ134を参照し、抽出した各意見に対して、同じ集計対象期間のレコードが存在すれば、該当するレコードの投稿数に1を加算し、該当するレコードが存在しなければ、投稿数が1である新たなレコードを登録する。   In step S208, the CPU 201 (post totalizing unit 112) updates the opinion totaling data 134. The opinion posting total data 134 includes a totaling period, opinions, and the number of posts. Here, the “opinion” is a character string extracted from a posted sentence using natural language processing. In order to simplify the explanation, adjectives and verbs included in the posted sentence are treated as opinions of the posted data here (extraction of adjectives and verbs is possible by a known technique). For example, adjectives such as "want" and "great" are extracted from the posted sentence of the post D in the posted data 120 in FIG. The CPU 201 (post totalizing unit 112) refers to the opinion totaling data 134, and if there is a record in the same totaling period for each extracted opinion, adds 1 to the number of posts of the corresponding record, and If there is no record to be registered, a new record with one post is registered.

次にステップS209において、CPU201(投稿集計部112)は、全投稿集計データ131を更新する。全投稿集計データ131は、投稿数、記事投稿数、拡散投稿数、意見投稿数から成る。投稿集計部112は、全投稿集計データ131を参照し、同じ集計対象期間のレコードが存在すれば、該当するレコードにおいて、投稿数に1を加算し、該当するレコードが存在しなければ、投稿数が1である新たなレコードを登録する。また、投稿データが記事投稿であれば記事投稿数に1を加算し、拡散投稿であれば拡散投稿に1を加算し、意見投稿であれば意見投稿数に1を加算する。   Next, in step S209, the CPU 201 (post totalizing unit 112) updates the total post totaling data 131. The total post total data 131 includes the number of posts, the number of article posts, the number of diffused posts, and the number of opinion posts. The post totaling unit 112 refers to the total post total data 131, adds 1 to the number of posts in the corresponding record if there is a record of the same totaling target period, and adds the number of posts if there is no corresponding record. Is registered as a new record. If the post data is an article post, 1 is added to the number of article posts, if it is a diffuse post, 1 is added to the diffuse post, and if it is an opinion post, 1 is added to the number of opinion posts.

以上、投稿集計部112における投稿集計処理について、例を用いて説明した。なお、説明の簡略化のため、ステップS208について、形容詞や動詞の原型を投稿データの意見として取り扱う方法を説明したが、非特許文献2で紹介されるような、評価情報抽出技術の出力結果を用いてもよい。
なお、図7(投稿取得処理)のステップS102〜ステップS107および図8(投稿集計処理)のステップS201〜ステップS209によって、本発明の「抽出された各投稿を投稿の種別ごとに分類し集計する集計手段」「前記集計手段は、抽出された投稿を、少なくとも、投稿の拡散を目的とする投稿と、Web上の記事を紹介することを目的とする投稿と、に分類し集計する」の一例が構成されている。投稿の種別は、拡散投稿かつ記事投稿、拡散投稿を除く記事投稿、記事投稿を除く拡散投稿、意見投稿を含む。
The posting tallying process performed by the posting tallying unit 112 has been described above using examples. For the sake of simplicity, in step S208, a method of treating the prototypes of adjectives and verbs as opinions of the posted data has been described. However, the output result of the evaluation information extraction technology as introduced in Non-Patent Document 2 is described. May be used.
Note that, according to steps S102 to S107 in FIG. 7 (post acquisition processing) and steps S201 to S209 in FIG. 8 (post summarization processing), each extracted post of the present invention is classified and classified according to the type of post. Tallying means "An example of" the tallying means categorizes and counts the extracted posts into at least a post for the purpose of spreading the posts and a post for the purpose of introducing an article on the Web " Is configured. The types of posts include diffuse posts and article posts, article posts excluding diffuse posts, diffuse posts excluding article posts, and opinion posts.

次に、投稿可視化部113における投稿データの可視化方法について、図1、図6、図9、図10を用いて説明する。図9、および、図10は、投稿可視化部113が投稿集計データ130を参照して生成する時系列グラフであり、システムの利用者はWebブラウザなどを通じて当該グラフを閲覧、操作することができる。図11は、図10の注釈の全内容を示した図である。
以下、時系列グラフの構成について説明する。
Next, a method of visualizing post data in post visualization section 113 will be described with reference to FIGS. 1, 6, 9, and 10. FIG. FIG. 9 and FIG. 10 are time-series graphs generated by the post visualization unit 113 with reference to the post totaling data 130. The system user can browse and operate the graphs through a Web browser or the like. FIG. 11 is a diagram showing the entire contents of the annotation of FIG.
Hereinafter, the configuration of the time series graph will be described.

情報処理装置101のCPU201(投稿可視化部113)は、全投稿集計データ131を参照し、集計対象期間ごとの投稿数を、積上げ棒グラフにより可視化する。図9は、投稿可視化部113が生成した製品Aに対する2015年10月の投稿数日別推移グラフである。投稿可視化部113は、拡散投稿を除く記事投稿の投稿、記事投稿かつ拡散投稿の投稿数、記事投稿を除く拡散投稿の投稿数、意見投稿数をそれぞれ別の色で可視化する。なおこれによって、本発明の「投稿の種別ごとの集計情報を表示する表示手段」「前記表示手段は、投稿の種別ごとの投稿数を時系列グラフで表示する」の一例が構成されている。
なお、各投稿数は、全投稿集計データ131が保持する値を用いて、下記の式で算出できる。
The CPU 201 (post visualization unit 113) of the information processing apparatus 101 refers to the total post total data 131, and visualizes the number of posts for each total period by a stacked bar graph. FIG. 9 is a transition graph of the number of posts in October 2015 for the product A generated by the post visualization unit 113. The post visualization unit 113 visualizes the number of posts of article posts excluding diffuse posts, the number of posts of article posts and diffuse posts, the number of posts of diffuse posts excluding article posts, and the number of opinion posts in different colors. This constitutes an example of “display means for displaying total information for each type of post” of the present invention, and “the display means displays the number of posts for each type of post in a time-series graph”.
The number of posts can be calculated by the following formula using the value held by the total post total data 131.

(数1)
α = 記事投稿かつ拡散投稿の投稿数 = (記事投稿数+拡散投稿数+意見投稿数) - 投稿数
拡散投稿をのぞく記事投稿の投稿数 = 記事投稿数 - α
記事投稿をのぞく拡散投稿の投稿数 = 拡散投稿数 - α
意見投稿数 = 意見投稿数
(Equation 1)
α = number of article posts and diffused posts = (number of article posts + number of diffused posts + number of opinion posts)-number of posts Number of article posts excluding diffused posts = number of article posts-α
Number of diffused posts except article posts = Number of diffused posts-α
Number of opinion posts = Number of opinion posts

また、CPU201(投稿可視化部113)は、投稿集計データ130を参照し、システムの利用者によるクリック操作で展開する注釈を時系列グラフ上に付与する。図10は、システムの利用者が、「10月4日」、「10月10日」、「10月20日」における棒グラフをクリックし、それぞれの注釈を展開した後の時系列グラフを表している。なおこれによって、本発明の「前記時系列グラフに、投稿に関する注釈を付与する注釈付与手段」の一例が構成されている。
以下、投稿可視化部113における注釈に記載する内容の取得方法について説明する。
Further, the CPU 201 (post visualization unit 113) refers to the post totaling data 130, and gives an annotation to be developed by a click operation by the user of the system on the time-series graph. FIG. 10 shows a time-series graph after the user of the system clicks on the bar graphs of “October 4”, “October 10”, and “October 20” and expands respective annotations. I have. This constitutes an example of the "annotation means for giving an annotation relating to a post to the time-series graph" of the present invention.
Hereinafter, a method of acquiring the content described in the annotation in the post visualization unit 113 will be described.

注釈は、イベントが発生したと考えられる箇所(イベント発生期間)に付与される。
イベント発生期間とは、具体的には以下の方法により求めることが可能である。
An annotation is given to a place where an event is considered to have occurred (event occurrence period).
The event occurrence period can be specifically obtained by the following method.

まず、CPU201(投稿可視部113)は、分析期間内における単位期間あたりの投稿数を降順でソートし、下位半分の投稿数の平均値を取得する(平常時平均値)。そして、CPU201(投稿可視部113)は、投稿数がN以上かつ平常時平均値のM倍以上である箇所をイベント発生期間と判断する。なおこれによって、本発明の「投稿数に基づいてイベント発生期間を取得するイベント取得手段」の一例が構成されている。   First, the CPU 201 (post visible unit 113) sorts the number of posts per unit period in the analysis period in descending order, and obtains the average value of the number of posts in the lower half (normal average value). Then, the CPU 201 (post visible unit 113) determines that the position where the number of posts is N or more and M times or more the average value in normal times is the event occurrence period. This constitutes an example of the “event acquisition unit that acquires an event occurrence period based on the number of posts” of the present invention.

CPU201(投稿可視化部113)は、各イベント発生期間において、投稿の種別ごとに特徴的な話題を抽出し、投稿数の多い投稿の種別順に抽出した話題を話題ごとの件数付で時系列グラフ上に注釈を付与する。なおこれによって、本発明の「前記注釈付与手段は、前記イベント発生期間に対応した前記時系列グラフ上に注釈を付与する」「前記注釈の内容は、投稿数の多い投稿の種別順に抽出した話題と、当該話題ごとの件数である」の一例が構成されている。
以下、記事投稿、拡散投稿、意見投稿の順に、話題の抽出方法を説明する。
The CPU 201 (post visualization unit 113) extracts characteristic topics for each type of post during each event occurrence period, and extracts the topics extracted in the order of the type of post with the largest number of posts on the time-series graph with the number of cases for each topic. Annotate. By this, according to the present invention, "the annotation means assigns an annotation on the time-series graph corresponding to the event occurrence period""The content of the annotation is a topic extracted in the order of the number of posts with the largest number of posts. And the number of cases for each topic ".
Hereinafter, a topic extraction method will be described in the order of article posting, diffusion posting, and opinion posting.

まず、記事投稿における話題の抽出方法について説明する。CPU201(投稿可視化部113)は、記事投稿集計データ132を参照し、集計対象期間における記事タイトルのうち、投稿数の上位L件を話題として抽出する。(Lは自然数)   First, a method of extracting a topic in article posting will be described. The CPU 201 (post visualization unit 113) refers to the article posting total data 132 and extracts, as a topic, the top L items of the number of posts among the article titles in the totaling period. (L is a natural number)

次に、拡散投稿における話題の抽出方法について説明する。CPU201(投稿可視化部113)は、拡散投稿集計データ133を参照し、集計対象期間における拡散対象IDのうち、投稿数の上位M件を抽出し、各拡散対象IDに対応する投稿を話題として抽出する。(Mは自然数)   Next, a method of extracting a topic in a diffusion posting will be described. The CPU 201 (post visualization unit 113) refers to the diffusion posting total data 133, extracts the top M posts with the number of posts from among the diffusion target IDs in the counting target period, and extracts the post corresponding to each diffusion target ID as a topic. I do. (M is a natural number)

次に、意見投稿における話題の抽出方法について説明する。CPU201(投稿可視化部113)は、意見投稿集計データ134を参照し、集計対象期間における意見のうち、投稿数の上位N件を話題として抽出する。(Nは自然数)   Next, a method of extracting a topic in opinion posting will be described. The CPU 201 (post visualization unit 113) refers to the opinion post total data 134 and extracts, from the opinions in the total period, the top N articles with the number of posts as topics. (N is a natural number)

以上で説明した、投稿可視化部113が出力する注釈付きの時系列グラフを参照することにより、システムの利用者は時系列グラフ上において、集計対象期間における投稿の構成を把握することが容易になり、更に詳細な分析を行う必要があるか否かを判断するための時間を短縮することができる。例えば、図10から、「10月10日に投稿数が急増している原因は、製品Aを紛失したユーザの投稿が拡散されているだけで、製品A自体に問題が発生したわけではない」ことが分かるため、当該期間に関する分析を省略するという判断をすることが可能となる。また、投稿の種別ごとに話題を集約することで、意見投稿のみを分析することが可能となり、イベントとは関係の無い評価(通常時の評判)を分析することが可能となる。   By referring to the annotated time-series graph output by the post visualization unit 113 described above, it becomes easy for the user of the system to grasp the composition of the post in the aggregation target period on the time-series graph. In addition, it is possible to reduce the time for determining whether more detailed analysis needs to be performed. For example, from FIG. 10, “The cause of the sudden increase in the number of posts on October 10 is that only the posts of the user who lost the product A are diffused, and no problem has occurred with the product A itself”. Therefore, it is possible to determine to omit the analysis for the period. Also, by consolidating topics for each type of post, it is possible to analyze only opinion posts, and it is possible to analyze evaluations (reputations at normal times) that are not related to events.

また、「10月4日、10月20日を境に意見投稿数の割合が増加している」ことが分かるため、当該期間に関してより注力して分析する、という判断をすることが可能になる。   In addition, since it is understood that “the ratio of the number of opinion postings increases on October 4 and October 20”, it is possible to determine that the analysis should be performed with more focus on the period. .

以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。   As described above, the embodiment has been described in detail. However, the present invention can take an embodiment as, for example, a system, an apparatus, a method, a program, a storage medium, or the like. The system may be applied to a system including a single device, or may be applied to an apparatus including one device.

なお、上述した各種データの構成及びその内容はこれに限定されるものではなく、用途や目的に応じて、様々な内容で構成されることは言うまでもない。   The configurations and contents of the various data described above are not limited to those described above, and it goes without saying that the various data are configured according to applications and purposes.

また、本発明は、システム或いは装置にプログラムを供給することにとって達成される場合にも適用できることは言うまでもない。この場合、本発明を達成するためのソフトウェアによって表されるプログラムを格納した記録媒体を該システム或いは装置に読み出すことによって、そのシステム或いは装置が、本発明の効果を享受することが可能となる。   Needless to say, the present invention can be applied to a case where the present invention is achieved by supplying a program to a system or an apparatus. In this case, by reading a recording medium storing a program represented by software for achieving the present invention into the system or the apparatus, the system or the apparatus can enjoy the effects of the present invention.

さらに、本発明を達成するためのソフトウェアによって表されるプログラムをネットワーク上のサーバ、データーベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステム或いは装置が、本発明の効果を享受することが可能となる。   Further, by downloading and reading out a program represented by software for achieving the present invention from a server, a database, or the like by a communication program on a network, the system or apparatus can enjoy the effects of the present invention. It becomes possible.

なお、上述した各実施形態及びその変形例を組み合わせた構成もすべて本発明に含まれるものである。   It should be noted that the present invention includes all configurations obtained by combining the above-described embodiments and their modifications.

100…………マイクロブログ分析システム
101…………情報処理装置
111…………投稿取得部
112…………投稿集計部
113…………投稿可視化部
120…………投稿データ
130…………投稿集計データ
131…………全投稿集計データ
132…………記事投稿集計データ
133…………拡散投稿集計データ
134…………意見投稿集計データ
201…………CPU
202…………RAM
203…………ROM
204…………システムバス
209…………入力装置
210…………ディスプレイ装置
211…………外部メモリ
100 Microblog analysis system 101 Information processing device 111 Post acquisition unit 112 Post totaling unit 113 Post visualization unit 120 Post data 130 … Post total data 131… Total post total data 132… Article post total data 133… Diffusion post total data 134… Opinion post total data 201… CPU
202 ...... RAM
203 ...... ROM
204 system bus 209 input device 210 display device 211 external memory

Claims (11)

特定の対象に関する1以上の投稿を抽出する抽出手段と、
抽出された各投稿を投稿の種別ごとに集計する集計手段と、
投稿の種別ごとの集計情報を表示する表示手段と、
を備え、
前記投稿の種別には、少なくとも、投稿の拡散を目的とする投稿、特定の対象に関する記事を紹介することを目的とする投稿とを含む
ことを特徴とする情報処理装置。
Extraction means for extracting one or more posts about a particular subject;
A counting means for counting each extracted post for each type of post;
Display means for displaying total information for each type of post;
With
Wherein the post type, at least, a post for the purpose of diffusion of posts, the information processing apparatus according to claim <br/> include a post intended to introduce the articles on a particular subject.
前記表示手段は、投稿の種別ごとの投稿数を時系列グラフで表示する
ことを特徴とする請求項1に記載の情報処理装置。
The information processing apparatus according to claim 1, wherein the display unit displays the number of posts for each type of post in a time-series graph.
前記時系列グラフに、投稿に関する注釈を付与する注釈付与手段
を更に備えることを特徴とする請求項2に記載の情報処理装置。
The information processing apparatus according to claim 2, further comprising: an annotation providing unit configured to add an annotation related to a post to the time-series graph.
前記注釈の内容は、投稿の種別毎に抽出した話題と当該話題ごとの件数であって、投稿数の多い投稿の種別順に表示したものである
ことを特徴とする請求項に記載の情報処理装置。
4. The information processing according to claim 3 , wherein the contents of the annotation are topics extracted for each type of post and the number of cases for each topic, and are displayed in the order of types of posts having a large number of posts. apparatus.
特定の対象に関する1以上の投稿を抽出する抽出手段と、Extraction means for extracting one or more posts about a particular subject;
抽出された各投稿を投稿の種別ごとに集計する集計手段と、  A counting means for counting each extracted post for each type of post;
投稿の種別ごとの投稿数を時系列グラフで表示する表示手段と、  Display means for displaying the number of posts for each type of post in a time-series graph;
前記時系列グラフに、投稿に関する注釈を付与する注釈付与手段と、  Annotating means for giving an annotation on a post to the time-series graph,
を備え、  With
前記注釈の内容は、投稿の種別毎に抽出した話題と当該話題ごとの件数を表示したものである  The content of the annotation is a display of topics extracted for each type of post and the number of cases for each topic.
ことを特徴とする情報処理装置。  An information processing apparatus characterized by the above-mentioned.
前記注釈の内容は、投稿の種別毎に抽出した話題と当該話題ごとの件数を投稿数の多い投稿の種別順に表示したものであるThe contents of the annotation are the topics extracted for each type of post and the number of cases for each topic are displayed in the order of the type of post with the largest number of posts.
ことを特徴とする請求項5に記載の情報処理装置。  The information processing apparatus according to claim 5, wherein:
投稿数に基づいてイベント発生期間を取得するイベント取得手段を、更に備え、
前記注釈付与手段は、前記イベント発生期間に対応した前記時系列グラフ上に注釈を付与する
ことを特徴とする請求項3乃至6のいずれか1項に記載の情報処理装置。
Further comprising an event acquisition unit for acquiring an event occurrence period based on the number of posts,
The information processing apparatus according to any one of claims 3 to 6, wherein the annotation providing unit adds an annotation on the time-series graph corresponding to the event occurrence period.
情報処理装置の抽出手段が、特定の対象に関する1以上の投稿を抽出する抽出ステップと、
前記情報処理装置の集計手段が、抽出された各投稿を投稿の種別ごとに集計する集計ステップと、
前記情報処理装置の表示手段が、集計した投稿の種別ごとの集計情報を表示する表示ステップと、
を含み、
前記投稿の種別には、少なくとも、投稿の拡散を目的とする投稿、特定の対象に関する記事を紹介することを目的とする投稿とを含む
ことを特徴とする情報処理方法。
An extracting step of extracting one or more posts related to a specific object, by an extracting unit of the information processing device;
A totaling unit of the information processing apparatus, a totalizing step of totalizing each extracted post for each type of post;
A display unit of the information processing device, a display step of displaying total information for each type of post that has been totalized,
Including
Wherein the post type, at least, a post for the purpose of diffusion of posts, the information processing method comprising <br/> include a post intended to introduce the articles on a particular subject.
コンピュータを、
特定の対象に関する1以上の投稿を抽出する抽出手段と、
抽出された各投稿を投稿の種別ごとに集計する集計手段と、
投稿の種別ごとの集計情報を表示する表示手段と、
して機能させるためのプログラムであって、
前記投稿の種別には、少なくとも、投稿の拡散を目的とする投稿、特定の対象に関する記事を紹介することを目的とする投稿とを含む
ことを特徴とするプログラム。
Computer
Extraction means for extracting one or more posts about a particular subject;
A counting means for counting each extracted post for each type of post;
Display means for displaying total information for each type of post;
A program to function as
Wherein the post type, at least, a post for the purpose of diffusion of posts, program characterized <br/> include a post intended to introduce the articles on a particular subject.
情報処理装置の抽出手段が、特定の対象に関する1以上の投稿を抽出するステップと、Extracting means of the information processing apparatus for extracting one or more posts related to a specific object;
情報処理装置の集計手段が、抽出された各投稿を投稿の種別ごとに集計するステップと、  A step in which the counting means of the information processing device counts each extracted post for each type of post;
情報処理装置の表示手段が、投稿の種別ごとの投稿数を時系列グラフで表示するステップと、  A display unit of the information processing apparatus, a step of displaying the number of posts for each type of post in a time-series graph,
情報処理装置の注釈付与手段が、前記時系列グラフに、投稿に関する注釈を付与するステップと、  Annotating means of the information processing device, annotating the time-series graph, annotating a post,
を含み、  Including
前記注釈の内容は、投稿の種別毎に抽出した話題と当該話題ごとの件数を表示したものである  The content of the annotation is a display of topics extracted for each type of post and the number of cases for each topic.
ことを特徴とする情報処理方法。An information processing method, comprising:
コンピュータを、  Computer
特定の対象に関する1以上の投稿を抽出する抽出手段と、  Extraction means for extracting one or more posts about a particular subject;
抽出された各投稿を投稿の種別ごとに集計する集計手段と、  A counting means for counting each extracted post for each type of post;
投稿の種別ごとの投稿数を時系列グラフで表示する表示手段と、  Display means for displaying the number of posts for each type of post in a time-series graph;
前記時系列グラフに、投稿に関する注釈を付与する注釈付与手段と、  Annotating means for giving an annotation on a post to the time-series graph,
して機能させるためのプログラムであって、  A program to function as
前記注釈の内容は、投稿の種別毎に抽出した話題と当該話題ごとの件数を表示したものである  The contents of the annotation indicate topics extracted for each type of post and the number of cases for each topic.
ことを特徴とするプログラム。A program characterized by that:
JP2015249682A 2015-12-22 2015-12-22 Information processing apparatus, information processing method, and program Active JP6675868B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015249682A JP6675868B2 (en) 2015-12-22 2015-12-22 Information processing apparatus, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015249682A JP6675868B2 (en) 2015-12-22 2015-12-22 Information processing apparatus, information processing method, and program

Publications (3)

Publication Number Publication Date
JP2017117068A JP2017117068A (en) 2017-06-29
JP2017117068A5 JP2017117068A5 (en) 2019-02-07
JP6675868B2 true JP6675868B2 (en) 2020-04-08

Family

ID=59234696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015249682A Active JP6675868B2 (en) 2015-12-22 2015-12-22 Information processing apparatus, information processing method, and program

Country Status (1)

Country Link
JP (1) JP6675868B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7048891B2 (en) * 2018-05-28 2022-04-06 キヤノンマーケティングジャパン株式会社 Information processing equipment, information processing systems, control methods, and programs
JP7009719B1 (en) 2021-03-03 2022-01-26 しるし株式会社 Purchasing analysis system, purchasing analysis method, and computer program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005032197A (en) * 2003-07-11 2005-02-03 Nippon Telegr & Teleph Corp <Ntt> Information analysis system and method
JP5656542B2 (en) * 2010-10-06 2015-01-21 株式会社クリップス Word-of-mouth information management system and word-of-mouth information management program
JP2013033375A (en) * 2011-08-02 2013-02-14 Sony Corp Information processing apparatus, information processing method, and program

Also Published As

Publication number Publication date
JP2017117068A (en) 2017-06-29

Similar Documents

Publication Publication Date Title
US11797532B1 (en) Dashboard display using panel templates
US10824682B2 (en) Enhanced online user-interaction tracking and document rendition
Steen Retractions in the scientific literature: is the incidence of research fraud increasing?
Iacob et al. Retrieving and analyzing mobile apps feature requests from online reviews
Shaw et al. Laboratories of oligarchy? How the iron law extends to peer production
Zhang et al. Visual analytics for the big data era-A comparative review of state-of-the-art commercial systems
US8799796B2 (en) System and method for generating graphical dashboards with drill down navigation
AU2020285704A1 (en) System and method for the generation and interactive editing of living documents
EP3718027A2 (en) System and method for the generation and editing of text content in website building systems
Mattila et al. Software visualization today: Systematic literature review
US11947567B2 (en) System and method for computing and managing datasets using hierarchical analytics
TW201514845A (en) Title and body extraction from web page
US20160358274A1 (en) Patent Claims Analysis System and Method
CN113704288A (en) Data display method and device, computer readable medium and electronic equipment
Yang et al. Tutorials on google analytics: how to craft a web analytics report for a library web site
Hillah et al. Petri Nets Repository: a tool to benchmark and debug Petri Net tools
US8843882B1 (en) Systems, methods, and algorithms for software source code analytics and software metadata analysis
CN110333853A (en) Activity card application method, device, equipment and readable storage medium
JP6675868B2 (en) Information processing apparatus, information processing method, and program
US20140297341A1 (en) System and method for forensic analysis and investigation of digital data in digital media device
JP6898542B2 (en) Information processing device, its control method, and program
Bevensee et al. SMAT: The Social Media Analysis Toolkit.
Khan et al. Term-based approach for linking digital news stories
Baur et al. Catching fire: start-ups in the text analytics software industry
Serrano et al. Webtool for the analysis and visualization of the evolution of wiki online communities

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200311

R150 Certificate of patent or registration of utility model

Ref document number: 6675868

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250