Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7488207B2 - Future event estimation system and future event estimation method - Google Patents
[go: Go Back, main page]

JP7488207B2 - Future event estimation system and future event estimation method - Google Patents

Future event estimation system and future event estimation method Download PDF

Info

Publication number
JP7488207B2
JP7488207B2 JP2021024166A JP2021024166A JP7488207B2 JP 7488207 B2 JP7488207 B2 JP 7488207B2 JP 2021024166 A JP2021024166 A JP 2021024166A JP 2021024166 A JP2021024166 A JP 2021024166A JP 7488207 B2 JP7488207 B2 JP 7488207B2
Authority
JP
Japan
Prior art keywords
event
mention
information
future
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021024166A
Other languages
Japanese (ja)
Other versions
JP2022126229A (en
Inventor
皓文 森下
太亮 尾崎
公介 上田
浩康 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2021024166A priority Critical patent/JP7488207B2/en
Publication of JP2022126229A publication Critical patent/JP2022126229A/en
Application granted granted Critical
Publication of JP7488207B2 publication Critical patent/JP7488207B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、将来事象推定システム、および将来事象推定方法に関する。 The present invention relates to a future event estimation system and a future event estimation method.

非特許文献1には、大規模なテキストデータから因果関係等の事態間の関係の知識を自動的に獲得する技術について記載されている。ここで事態とは、行為者が意志的に行う行為とそれ以外の出来事(経験や状態、状態変化等)をいう。また、事態間の関係とは、例えば、「雨が降る」という事象が起きた後は「洗濯物を取り入れる」という事象が起きやすい、といった関係をいう。 Non-Patent Document 1 describes a technology that automatically acquires knowledge of relationships between events, such as causal relationships, from large-scale text data. Here, an event refers to an action that an actor intentionally performs and other occurrences (experiences, states, changes in state, etc.). Furthermore, a relationship between events refers to, for example, a relationship in which the event "putting in the laundry" is likely to occur after the event "it's raining" occurs.

上記技術では、統計的言語処理の発展や人間の行動を記述した文書が大量に入手可能となっていること等の時代背景に鑑み、「~するために~する」のような2つの事態表現の共起パターンを利用してテキストコーパスから事態間の関係の知識の獲得を図る。また、上記技術では、事態を直接的あるいは間接的に指す事態含意名詞を利用することや、実体間関係抽出のための共起パターン獲得技術を事態間関係獲得に応用することを検討することにより、意味的な制限の強い特殊な共起パターンを数多く用意し、知識獲得の精度と規模の両立を図る。 In light of the current trends, such as advances in statistical language processing and the availability of large volumes of documents describing human behavior, the above technology seeks to acquire knowledge of inter-event relationships from text corpora using co-occurrence patterns of two event expressions, such as "doing ~ in order to ~." The above technology also uses event-implying nouns that directly or indirectly refer to events, and considers applying co-occurrence pattern acquisition technology for extracting entity relationships to the acquisition of inter-event relationships, thereby preparing a large number of special co-occurrence patterns with strong semantic restrictions and aiming to achieve both precision and scale in knowledge acquisition.

阿部 修也,乾 健太郎,松本 裕治、「事態含意名詞を用いた事態間関係知識の獲得」、情報処理学会研究報告、社団法人 情報処理学会、2006/11/23、p.95-100Shuya Abe, Kentaro Inui, Yuji Matsumoto, "Acquisition of knowledge of inter-event relations using event-implicative nouns", Information Processing Society of Japan, 2006/11/23, pp.95-100

企業や官公庁等の組織においては、組織が取るべき施策に関する意思決定を適切に行うために、現在起きている事象(以下、「現在事象」と称する。)に基づき、今後現実に起こる可能性のある事象(以下、「将来事象」と称する。)を精度よく予測することが求められる。そして例えば、「日米貿易会談が行われる」という現在事象が起きている場合に「日本が自動車の輸出規制を行う」といった将来事象を事前に予測することができれば、政府であれば「日本全体の景気後退に備えた景気浮上策を考える」といった施策を事前に講じることができ、また、企業であれば「自動車の生産縮小に備えて部品の調達を控える」といった施策を事前に講じることができる。 In order to make appropriate decisions regarding the measures that the organization should take, organizations such as companies and government agencies are required to accurately predict events that may actually occur in the future (hereafter referred to as "future events") based on current events (hereafter referred to as "current events"). For example, if it were possible to predict a future event such as "Japan will impose export restrictions on automobiles" in advance when a current event such as "Japan-U.S. trade talks will be held" is occurring, the government could take measures in advance such as "considering measures to stimulate the economy in preparation for a recession throughout Japan," and companies could take measures in advance such as "holding back on procurement of parts in preparation for reduced automobile production."

ところで、将来事象は、現在事象によって決まるだけなく、現在事象に関連のある事象(以下、「周辺事象」と称する。)によっても変化する。例えば、「1981年の日米貿易会談」という現在事象について「米国の貿易赤字が過剰である」という周辺事象がある場合は「日本が自動車輸出規制をする」という将来事象が予測され、一方、「2018年の日米貿易会談」という現在事象について「米国の関税も問題視されている」という周辺事象がある場合は「米国が自動車への関税を下げる」という将来事象が予測される。 By the way, future events are not only determined by current events, but also change depending on events related to the current event (hereafter referred to as "peripheral events"). For example, if the current event of "Japan-US trade talks in 1981" has the peripheral event of "the US trade deficit is excessive," then the future event of "Japan will impose restrictions on automobile exports" will be predicted. On the other hand, if the current event of "Japan-US trade talks in 2018" has the peripheral event of "US tariffs are also being viewed as problematic," then the future event of "US will lower tariffs on automobiles" will be predicted.

上記の非特許文献1では、動詞句や事態性名詞を事象への言及として取得しているが、事象の周辺事象の記述については捨象している。そのため、例えば、「雨が降ると洗濯物を取り入れる」といった周辺事象に依らずに成立する因果関係については特定することができるが、周辺事象を考慮する必要がある場合は必ずしも精度よく将来事象を予測することができない。 In the above-mentioned non-patent document 1, verb phrases and event nouns are acquired as references to events, but descriptions of events surrounding the event are ignored. Therefore, while it is possible to identify causal relationships that exist without relying on surrounding events, such as "when it rains, the laundry is brought in," it is not necessarily possible to accurately predict future events when surrounding events need to be taken into account.

本発明はこうした背景に基づきなされたものであり、将来事象を精度よく予測することが可能な、将来事象推定システム、および将来事象推定方法を提供することを目的とする。 The present invention has been made against this background, and aims to provide a future event estimation system and a future event estimation method that are capable of predicting future events with high accuracy.

上記目的を達成するための本発明の一つは、将来事象推定システムであって、プロセッサおよびメモリを有する情報処理装置を用いて構成され、文書情報に含まれている事象についての言及である事象関連言及に関する情報である事象関連言及情報を記憶する記憶部と、前記事象関連言及情報から、所定の事象を指定する情報である事象指定情報に関連する言及であるユーザ言及を抽出するユーザ言及抽出部と、前記事象関連言及情報から、前記ユーザ言及が表す事象についての将来の事象に関する言及である将来言及を特定する将来言及特定部と、を備え、前記ユーザ言及抽出部は、前記事象関連言及情報から複数の前記ユーザ言及を抽出し、抽出した複数の前記ユーザ言及を要素とする集合であるユーザ言及集合を生成し、前記将来言及特定部は、前記事象関連言及情報から前記将来言及の候補となる複数の言及を候補として抽出し、抽出した候補を分類することにより得られる集合である複数の将来言及集合を生成し、前記ユーザ言及集合と複数の前記将来言及集合の夫々との間の因果強度を求める
One of the present inventions for achieving the above-mentioned object is a future event inference system, which is configured using an information processing device having a processor and a memory, and includes a memory unit that stores event-related mention information, which is information regarding event-related mentions, which are mentions of events included in document information, a user mention extraction unit that extracts user mentions from the event-related mention information, which are mentions related to event designation information, which is information that designates a specific event, and a future mention identification unit that identifies future mentions from the event- related mention information, which are mentions of future events regarding the event represented by the user mention, wherein the user mention extraction unit extracts a plurality of the user mentions from the event-related mention information and generates a user mention set that is a set whose elements are the extracted plurality of user mentions, and the future mention identification unit extracts a plurality of mentions that are candidates for the future mentions from the event-related mention information as candidates, generates a plurality of future mention sets that are sets obtained by classifying the extracted candidates, and calculates the causal strength between the user mention set and each of the plurality of future mention sets .

尚、上記した以外の課題、構成および効果は、以下の発明を実施するための形態の説明により明らかにされる。 Problems, configurations, and advantages other than those described above will become clear from the description of the embodiment of the invention below.

本発明によれば、将来事象を精度よく予測することができる。 The present invention makes it possible to predict future events with high accuracy.

第1実施形態の将来事象推定システムの概略的な構成を示す図である。1 is a diagram showing a schematic configuration of a future event estimation system according to a first embodiment; 将来事象推定システムの構成に用いる情報処理装置の一例である。1 is an example of an information processing device used in the configuration of a future event estimation system. 文書情報の一例である。1 is an example of document information. 事象関連言及情報の一例である。13 is an example of event-related mention information. 事象指定情報設定画面の一例である。13 is an example of an event specification information setting screen. 将来言及集合と因果強度の一例である。This is an example of future mention sets and causal strength. 将来言及情報生成処理を説明するフローチャートである。13 is a flowchart illustrating a future mention information generating process. 将来事象情報提示画面の一例である。13 is an example of a future event information presentation screen. 第2実施形態の将来事象推定システムの概略的な構成を示す図である。FIG. 11 is a diagram showing a schematic configuration of a future event estimation system according to a second embodiment. 第2実施形態の事象指定情報設定画面の一例である。13 is an example of an event designation information setting screen according to the second embodiment. 第3実施形態の将来事象推定システムが表示する将来事象情報提示画面の一例である。13 is an example of a future event information presentation screen displayed by the future event estimation system of the third embodiment.

以下、本発明の実施形態について図面を参照しつつ詳細に説明する。尚、以下の記載および図面は、本発明を説明するための例示に過ぎず、説明の明確化のため、適宜、省略および簡略化がなされている。本発明は、他の種々の形態でも実施する事が可能である。また、とくに限定しない限り、各構成要素は単数でも複数でも構わない。 The following describes in detail an embodiment of the present invention with reference to the drawings. Note that the following description and drawings are merely examples for explaining the present invention, and have been omitted or simplified as appropriate for clarity of explanation. The present invention can also be implemented in various other forms. Furthermore, unless otherwise specified, each component may be singular or plural.

以下の説明において、同一のまたは類似する構成について同一の符号を付して重複した説明を省略することがある。また、以下の説明において、符号の前に付した「S」の文字は処理ステップの意味である。また、以下の説明における各種情報(データ)は例示するデータ構造以外の方法で表現もしくは管理してもよい。また、以下の説明において、各種の識別情報について説明する際、「識別子」、「ID」等の表現を適宜用いるが、これらについてはお互いに置換可能である。 In the following explanation, the same or similar components may be given the same reference numerals and duplicate explanations may be omitted. In addition, in the following explanation, the letter "S" before a reference numeral denotes a processing step. Furthermore, various information (data) in the following explanation may be expressed or managed in a manner other than the data structure shown as an example. In addition, in the following explanation, when explaining various types of identification information, expressions such as "identifier" and "ID" are used as appropriate, but these are interchangeable.

[第1実施形態]
図1に、第1実施形態として示す情報処理システム(以下、「将来事象推定システム1」と称する。)の概略的な構成を示している。将来事象推定システム1は、一つ以上の情
報処理装置(コンピュータ)を用いて構成される。
[First embodiment]
1 shows a schematic configuration of an information processing system (hereinafter, referred to as a "future event inference system 1") according to a first embodiment. The future event inference system 1 is configured using one or more information processing devices (computers).

将来事象推定システム1は、ユーザや他の情報処理システム等の外部から文書情報を取得し、取得した文書情報から事象に関する言及(以下、「事象関連言及」と称する。)を抽出し、抽出した事象関連言及に関する情報を事象関連言及情報として管理する。事象関連言及情報は、事象関連言及に関連のある事象に関する情報(以下、「周辺事象」と称する。)を含む。 The future event estimation system 1 acquires document information from a user or from an external source such as another information processing system, extracts mentions of events (hereinafter referred to as "event-related mentions") from the acquired document information, and manages information related to the extracted event-related mentions as event-related mention information. The event-related mention information includes information related to events related to the event-related mentions (hereinafter referred to as "peripheral events").

将来事象推定システム1は、ユーザから所定の事象(例えば、現在起きている事象(以下、「現在事象」と称する。))を指定する情報(以下、「事象指定情報」と称する。)の入力を受け付け、受け付けた事象指定情報に関連する言及(以下、「ユーザ言及」と称する。)を事象関連言及情報から抽出する。ユーザは、例えば、企業や官公庁等の組織において事象の分析を担当している者である。 The future event estimation system 1 accepts input of information (hereinafter referred to as "event specification information") that specifies a specific event (e.g., an event that is currently occurring (hereinafter referred to as "current event")) from a user, and extracts mentions (hereinafter referred to as "user mentions") related to the accepted event specification information from the event-related mention information. The user is, for example, a person in charge of analyzing events in an organization such as a company or a government agency.

将来事象推定システム1は、現在事象等のユーザ言及が表わす事象についての将来の事象に関する言及(以下、「将来言及」と称する。)を事象関連言及情報から特定し、特定した将来言及に基づき、将来起きる可能性のある事象(以下、「将来事象」と称する。)に関する情報(以下、「将来事象情報」と称する。)を生成し、生成した将来事象情報をユーザに提供する。 The future event estimation system 1 identifies from the event-related mention information a mention of a future event (hereinafter referred to as a "future mention") regarding an event represented by a user mention of a current event, etc., generates information (hereinafter referred to as "future event information") regarding an event that may occur in the future (hereinafter referred to as a "future event") based on the identified future mention, and provides the generated future event information to the user.

図2に、将来事象推定システム1の構成に用いる情報処理装置のハードウェア構成例を示す。例示する情報処理装置10は、プロセッサ11、主記憶装置12、補助記憶装置13、入力装置14、出力装置15、および通信装置16を備える。尚、例示する情報処理装置10は、その全部または一部が、例えば、クラウドシステムによって提供される仮想サーバのように、仮想化技術やプロセス空間分離技術等を用いて提供される仮想的な情報処理資源を用いて実現されるものであってもよい。また、情報処理装置10によって提供される機能の全部または一部は、例えば、クラウドシステムがAPI(Application Programming Interface)等を介して提供するサービスによって実現してもよい。また、将来
事象推定システム1は、通信可能に接続された複数の情報処理装置10を用いて構成してもよい。
FIG. 2 shows an example of a hardware configuration of an information processing device used in the configuration of the future event estimation system 1. The illustrated information processing device 10 includes a processor 11, a main memory device 12, an auxiliary memory device 13, an input device 14, an output device 15, and a communication device 16. The illustrated information processing device 10 may be realized, in whole or in part, by using virtual information processing resources provided by a virtualization technology or a process space separation technology, such as a virtual server provided by a cloud system. In addition, all or in part of the functions provided by the information processing device 10 may be realized by a service provided by a cloud system via an API (Application Programming Interface), for example. The future event estimation system 1 may be configured by using a plurality of information processing devices 10 connected to each other so as to be able to communicate with each other.

同図において、プロセッサ11は、例えば、CPU(Central Processing Unit)、M
PU(Micro Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit
)、AI(Artificial Intelligence)チップ等を用いて構成されている。
In the figure, the processor 11 is, for example, a CPU (Central Processing Unit),
PU (Micro Processing Unit), GPU (Graphics Processing Unit), FPGA (Field Programmable Gate Array), ASIC (Application Specific Integrated Circuit
), AI (Artificial Intelligence) chips, etc.

主記憶装置12は、プログラムやデータを記憶する装置であり、例えば、ROM(Read
Only Memory)、RAM(Random Access Memory)、不揮発性メモリ(NVRAM(Non Volatile RAM))等である。
The main memory device 12 is a device for storing programs and data, and is, for example, a ROM (Read Only Memory).
Only Memory), RAM (Random Access Memory), NVRAM (Non Volatile RAM), etc.

補助記憶装置13は、例えば、SSD(Solid State Drive)、ハードディスクドライ
ブ、光学式記憶装置(CD(Compact Disc)、DVD(Digital Versatile Disc)等)、ストレージシステム、ICカード、SDカードや光学式記録媒体等の記録媒体の読取/書込装置、クラウドサーバの記憶領域等である。補助記憶装置13には、記録媒体の読取装置や通信装置16を介してプログラムやデータを読み込むことができる。補助記憶装置13に格納(記憶)されているプログラムやデータは主記憶装置12に随時読み込まれる。
The auxiliary storage device 13 is, for example, a solid state drive (SSD), a hard disk drive, an optical storage device (CD (Compact Disc), DVD (Digital Versatile Disc), etc.), a storage system, an IC card, a read/write device for a recording medium such as an SD card or an optical recording medium, a storage area of a cloud server, etc. Programs and data can be read into the auxiliary storage device 13 via a recording medium reader or a communication device 16. The programs and data stored (memorized) in the auxiliary storage device 13 are read into the main storage device 12 as needed.

入力装置14は、外部からの入力を受け付けるインタフェースであり、例えば、キーボード、マウス、タッチパネル、カードリーダ、ペン入力方式のタブレット、音声入力装置等である。 The input device 14 is an interface that accepts input from the outside, and is, for example, a keyboard, a mouse, a touch panel, a card reader, a pen-input tablet, a voice input device, etc.

出力装置15は、処理経過や処理結果等の各種情報を出力するインタフェースである。出力装置15は、例えば、上記の各種情報を可視化する表示装置(液晶モニタ、LCD(Liquid Crystal Display)、グラフィックカード等)、上記の各種情報を音声化する装置(音声出力装置(スピーカ等))、上記の各種情報を文字化する装置(印字装置等)である。尚、例えば、情報処理装置10が通信装置16を介して他の装置との間で情報の入力や出力を行う構成としてもよい。 The output device 15 is an interface that outputs various information such as the progress of processing and the results of processing. The output device 15 is, for example, a display device (liquid crystal monitor, LCD (Liquid Crystal Display), graphic card, etc.) that visualizes the various information described above, a device that converts the various information described above into audio (audio output device (speaker, etc.)), or a device that converts the various information described above into text (printer, etc.). Note that, for example, the information processing device 10 may be configured to input and output information to and from other devices via the communication device 16.

入力装置14および出力装置15は、ユーザとの間で情報の受け付けや情報の提示を行うユーザインタフェースを構成する。 The input device 14 and output device 15 constitute a user interface that accepts information from the user and presents information.

通信装置16は、他の装置との間の通信を実現する装置である。通信装置16は、通信ネットワーク5を介して他の装置との間の通信を実現する、有線方式または無線方式の通信インタフェースであり、例えば、NIC(Network Interface Card)、無線通信モジュール、USBモジュール等である。 The communication device 16 is a device that realizes communication with other devices. The communication device 16 is a wired or wireless communication interface that realizes communication with other devices via the communication network 5, and is, for example, a NIC (Network Interface Card), a wireless communication module, a USB module, etc.

情報処理装置10には、例えば、オペレーティングシステム、ファイルシステム、DBMS(DataBase Management System)(リレーショナルデータベース、NoSQL等)、KVS(Key-Value Store)等が導入されていてもよい。 The information processing device 10 may be equipped with, for example, an operating system, a file system, a DBMS (DataBase Management System) (relational database, NoSQL, etc.), a KVS (Key-Value Store), etc.

将来事象推定システム1が備える各機能は、プロセッサ11が、主記憶装置12に格納されているプログラムを読み出して実行することにより、もしくは、将来事象推定システム1を構成するハードウェア(FPGA、ASIC、AIチップ等)によって実現される。将来事象推定システム1は、前述した各種の情報(データ)を、例えば、データベースのテーブルやファイルシステムが管理するファイルとして記憶する。 Each function of the future event inference system 1 is realized by the processor 11 reading and executing a program stored in the main memory device 12, or by the hardware (FPGA, ASIC, AI chip, etc.) that constitutes the future event inference system 1. The future event inference system 1 stores the various information (data) described above, for example, as a database table or a file managed by a file system.

図1に示すように、将来事象推定システム1は、記憶部110、文書情報取得部120、事象関連言及情報生成部130、事象指定情報受付部140、将来事象推定部150、および将来事象情報生成部160の各機能を備える。 As shown in FIG. 1, the future event inference system 1 includes the functions of a memory unit 110, a document information acquisition unit 120, an event-related mention information generation unit 130, an event specification information reception unit 140, a future event inference unit 150, and a future event information generation unit 160.

上記機能のうち、記憶部110は、文書情報111、事象関連言及情報112、事象指定情報113、ユーザ言及114、将来言及情報115、および将来事象情報116を記憶する。 Of the above functions, the memory unit 110 stores document information 111, event-related mention information 112, event specification information 113, user mentions 114, future mention information 115, and future event information 116.

文書情報取得部120は、文書情報111を取得する。本例では、文書情報111は、テキストデータ型式のデータであるものとする。また、本実施形態では、文書情報111から取得される情報(データ)も原則としてテキストデータとして管理されるものとする。但し、文書情報111や文書情報111から取得される情報(データ)のデータ型式は必ずしも限定されない。これらの情報(データ)は、少なくとも情報処理装置10が取り扱い可能なデータ型式であればよい。 The document information acquisition unit 120 acquires the document information 111. In this example, the document information 111 is assumed to be data in a text data format. Furthermore, in this embodiment, the information (data) acquired from the document information 111 is also managed as text data in principle. However, the data format of the document information 111 and the information (data) acquired from the document information 111 is not necessarily limited. It is sufficient that this information (data) is in a data format that can at least be handled by the information processing device 10.

文書情報取得部120は、文書情報111を、例えば、通信ネットワーク(インターネット、LAN(Local Area Network)、WAN(Wide Area Network)、専用線、公衆通
信網等)を介して他の情報処理装置と通信することにより取得する。また、文書情報取得部120は、文書情報111を、例えば、WebAPI(Web Application Programming Interface)によってユーザから取得する。また、文書情報取得部120は、文書情報1
11を、例えば、RSS(Really Simple Syndication,Rich Site Summary)によるニュース記事配信や、Webクローリングによる自動収集等によって取得する。尚、文書情報取得部120は、ユーザインタフェースを介して、ユーザに文書情報111を編集する機能(文書の執筆時刻等の補足的な情報を追加する機能等)を提供してもよい。
The document information acquisition unit 120 acquires the document information 111 by communicating with another information processing device via, for example, a communication network (the Internet, a local area network (LAN), a wide area network (WAN), a dedicated line, a public communication network, etc.). The document information acquisition unit 120 also acquires the document information 111 from a user via, for example, a Web Application Programming Interface (Web API). The document information acquisition unit 120 also acquires the document information 111 from a user via, for example, a Web Application Programming Interface (Web API).
The document information acquisition unit 120 acquires the document information 111, for example, by distributing news articles using RSS (Really Simple Syndication, Rich Site Summary) or automatically collecting the document information by web crawling. The document information acquisition unit 120 may provide the user with a function for editing the document information 111 (such as a function for adding supplementary information such as the writing time of the document) via a user interface.

図3に文書情報111の一例を示す。例示する文書情報111は、文書ID1111、内容1112、および時間情報1113の各項目を有する一つ以上のエントリ(レコード)を含む。 Figure 3 shows an example of document information 111. The example document information 111 includes one or more entries (records) having the following items: document ID 1111, content 1112, and time information 1113.

文書ID1111には、文書の識別子である文書IDが設定される。文書IDの種類は必ずしも限定されず、例えば、当該文書が記載されている記事のタイトルや書籍の名称、当該文書の所在を表す情報(例えば、URL(Uniform Resource Locator))等でもよい。 A document ID that is an identifier for a document is set in document ID 1111. The type of document ID is not necessarily limited, and may be, for example, the title of an article or book in which the document is written, or information indicating the location of the document (for example, a URL (Uniform Resource Locator)).

内容1112には、当該文書IDで特定される文書の内容(テキストデータ)が設定される。 Content 1112 is set to the content (text data) of the document identified by the document ID.

時間情報1113には、当該文書や当該文書に記述されている情報が発生した時間(日時、時期等)を特定可能な情報(以下、「時間情報」と称する。)が設定される。時間情報1113は、例えば、文書情報111にメタ情報等として付帯する。尚、時間情報は、必ずしも正確に文書が生成された時点を示すものでなくてもよく、少なくとも当該文書に記述されている事象が生じた時期を特定できる情報(執筆日時、雑誌等の書籍への掲載日時や当該書籍の発行日、当該文書がインターネットに公開された日時等)であればよい。 In the time information 1113, information (hereinafter referred to as "time information") that can identify the time (date, time period, etc.) when the document or the information described in the document occurred is set. The time information 1113 is attached to the document information 111, for example, as meta information. Note that the time information does not necessarily need to indicate the exact time when the document was created, but can at least be information that can identify the time when the event described in the document occurred (date and time of writing, date and time of publication in a book such as a magazine, the publication date of the book, date and time when the document was made public on the Internet, etc.).

図1に戻り、事象関連言及情報生成部130は、文書情報111から、事象関連言及を抽出して事象関連言及情報112を生成する。 Returning to FIG. 1, the event-related mention information generation unit 130 extracts event-related mentions from the document information 111 to generate event-related mention information 112.

図4に事象関連言及情報112の一例を示す。例示する事象関連言及情報112は、言及ID1121、事象関連言及情報1122、周辺事象言及1123、時間情報1124、および文書ID1125の各項目からなる一つ以上のエントリ(レコード)を含む。事象関連言及情報112の一つのエントリは一つの事象関連言及に対応する。 Figure 4 shows an example of event-related mention information 112. The illustrated event-related mention information 112 includes one or more entries (records) each consisting of the following items: mention ID 1121, event-related mention information 1122, surrounding event mention 1123, time information 1124, and document ID 1125. One entry of the event-related mention information 112 corresponds to one event-related mention.

上記項目のうち、言及ID1121には、事象関連言及の識別子(以下、「言及ID」と称する。)が設定される。 Of the above items, mention ID 1121 is set to an identifier for an event-related mention (hereinafter referred to as the "mention ID").

事象関連言及情報1122には、事象関連言及が設定される。事象関連言及情報生成部130は、例えば、文書情報111から、述語項構造解析によって特定される述語と特定した熟語(項)を結合した文字列を事象関連言及として抽出する。また、事象関連言及情報生成部130は、例えば、文書情報111から、名詞句や動詞句を特定する等の統語解析によって特定される事象関連言及を抽出する。また、事象関連言及情報生成部130は、例えば、文書情報111から、事前にユーザが登録しておいた語句や当該語句に関連する語句(類似する語句等)を事象関連言及として抽出する。 Event-related mention information 1122 is set with an event-related mention. For example, the event-related mention information generating unit 130 extracts, from the document information 111, a character string combining a predicate identified by predicate-argument structure analysis and an identified phrase (argument) as an event-related mention. The event-related mention information generating unit 130 also extracts, from the document information 111, an event-related mention identified by syntactic analysis such as identifying a noun phrase or a verb phrase. The event-related mention information generating unit 130 also extracts, from the document information 111, a word or phrase registered in advance by the user or a word or phrase related to the word or phrase (such as a similar word or phrase) as an event-related mention.

周辺事象言及1123には、当該事象関連言及の周辺事象に関する言及(以下、「周辺事象言及」と称する。)が設定される。事象関連言及情報生成部130は、例えば、文書情報111から、事象関連言及を含む文書に含まれている他の語句を選択することにより周辺事象を抽出する。事象関連言及情報生成部130は、上記選択を、例えば、頻度の多いものを優先して選択する方法や、TF-IDF(Term Frequency - Inverse Document Frequency)値の高いもの(重要度の高いもの)から上位n件を選択する方法等により行
う。また、事象関連言及情報生成部130は、上記選択を、例えば、文書情報111における全ての語句を選択することにより行う。
In the peripheral event mention 1123, a mention related to a peripheral event of the event-related mention (hereinafter, referred to as a "peripheral event mention"). The event-related mention information generating unit 130 extracts peripheral events by, for example, selecting other words and phrases included in the document including the event-related mention from the document information 111. The event-related mention information generating unit 130 performs the above selection by, for example, a method of prioritizing selection of words and phrases with high frequency, or a method of selecting the top n words and phrases with high TF-IDF (Term Frequency - Inverse Document Frequency) values (words with high importance). The event-related mention information generating unit 130 also performs the above selection by, for example, selecting all words and phrases in the document information 111.

時間情報1124には、当該事象関連言及に対応する文書情報111の時間情報1113の内容が設定される。時間情報1124には、言及が含まれている文書情報111や当
該文書情報111に付帯するメタ情報に時間に関する情報が含まれている場合はそれらの情報が設定される。
The content of the time information 1113 of the document information 111 corresponding to the event-related mention is set in the time information 1124. When information related to time is included in the document information 111 including the mention or in meta-information associated with the document information 111, such information is set in the time information 1124.

文書ID1125には、当該事象関連言及の取得元の文書情報111の文書ID1111が設定される。 The document ID 1125 is set to the document ID 1111 of the document information 111 from which the event-related mention was obtained.

図1に戻り、事象指定情報受付部140は、ユーザインタフェースを介してユーザから事象指定情報を受け付ける。 Returning to FIG. 1, the event specification information receiving unit 140 receives event specification information from the user via the user interface.

図5は、事象指定情報受付部140が事象指定情報を受け付ける際にユーザに提示する画面(以下、「事象指定情報設定画面500」と称する。)の一例である。事象指定情報受付部140は、事象指定情報113の入力を事象指定情報設定画面500を介してユーザから受け付ける。事象指定情報設定画面500は、例えば、Webページ等のGUI(Graphical User Interface)によってユーザに提示するようにしてもよい。 Figure 5 is an example of a screen (hereinafter referred to as "event designation information setting screen 500") that the event designation information receiving unit 140 presents to the user when receiving event designation information. The event designation information receiving unit 140 receives input of event designation information 113 from the user via the event designation information setting screen 500. The event designation information setting screen 500 may be presented to the user, for example, by a GUI (Graphical User Interface) such as a web page.

同図に示すように、事象指定情報設定画面500は、事象511、周辺事象512、および時間情報513の各入力項目を有する。また、事象指定情報設定画面500は、検索ボタン520を有する。尚、事象指定情報設定画面500は、例示した入力項目に加え、その他の補足的な情報の入力欄を含んでいてもよい。ユーザが各入力項目に内容を設定して検索ボタン520を操作すると、事象指定情報受付部140は、事象指定情報設定画面500の各入力項目に設定された内容を対応づけた情報(データセット)を事象指定情報113として生成する。 As shown in the figure, the event specification information setting screen 500 has input fields for event 511, peripheral event 512, and time information 513. The event specification information setting screen 500 also has a search button 520. Note that the event specification information setting screen 500 may include input fields for other supplementary information in addition to the input fields shown as examples. When the user sets content in each input field and operates the search button 520, the event specification information receiving unit 140 generates information (dataset) that associates the content set in each input field of the event specification information setting screen 500 as event specification information 113.

図1に戻り、同図に示すように、将来事象推定部150は、ユーザ言及抽出部151と将来言及特定部152を有する。 Returning to FIG. 1, as shown in the figure, the future event estimation unit 150 has a user mention extraction unit 151 and a future mention identification unit 152.

ユーザ言及抽出部151は、事象指定情報受付部140が事象指定情報設定画面500を介して受け付けた事象指定情報113に関連する言及(ユーザ言及114)を事象関連言及情報112から抽出する。また、将来言及特定部152は、ユーザ言及114が表わす事象についての将来の事象に関する言及を事象関連言及情報112から特定して将来言及情報115を生成する。以下、ユーザ言及抽出部151および将来言及特定部152の各機能について詳述する。 The user mention extraction unit 151 extracts mentions (user mentions 114) related to the event designation information 113 received by the event designation information receiving unit 140 via the event designation information setting screen 500 from the event-related mention information 112. The future mention identification unit 152 also identifies mentions of future events about the event represented by the user mention 114 from the event-related mention information 112 to generate future mention information 115. The functions of the user mention extraction unit 151 and the future mention identification unit 152 are described in detail below.

まずユーザ言及抽出部151について説明する。ユーザ言及抽出部151は、事象指定情報113に関連する言及を事象関連言及情報112から抽出し、次式で示すユーザ言及集合Q(ユーザ言及114)を生成する。

Figure 0007488207000001
First, a description will be given of the user mention extraction unit 151. The user mention extraction unit 151 extracts mentions related to the event designation information 113 from the event-related mention information 112, and generates a user mention set Q (user mentions 114) expressed by the following formula.
Figure 0007488207000001

例えば、ユーザ言及抽出部151は、事象指定情報113と事象関連言及情報112の各言及miとの間の類似度Siを求め、求めた類似度Siが高いものから所定数の言及(も
しくは予め設定した閾値を超えている言及)を事象関連言及情報112から抽出してユーザ言及集合Qの要素とする。
For example, the user mention extraction unit 151 calculates the similarity S i between the event designation information 113 and each mention m i in the event-related mention information 112, and extracts a predetermined number of mentions (or mentions exceeding a preset threshold) from the event-related mention information 112 based on the calculated similarity S i , and sets these as elements of the user mention set Q.

上記類似度Siの計算方法は必ずしも限定されないが、例えば、ユーザ言及抽出部15
1は、事象指定情報113の各項目のうちのいずれの項目を用いるか、類似度の尺度としてどのような尺度を用いるか等の違いにより、以下に例示する方法で上記類似度Siを求
める。
The method of calculating the similarity S i is not necessarily limited. For example,
The similarity S i is calculated by the following method, which will be exemplified below, depending on which item of the event specification information 113 is used, what scale is used as the scale of similarity, etc.

例えば、ユーザ言及抽出部151は、事象関連言及の文字列と言及mi中の文字列につ
いて、文字列の類似性に基づく類似度である文字列類似度Sを適用することにより類似度Siを求める。文字列類似度Sは、例えば、文字列aと文字列bの距離、d(文字列a,文字列b)、および文字列を入力として文字列長を返す関数Lを用いて次式から求める。

Figure 0007488207000002
For example, the user mention extraction unit 151 calculates the similarity S i between the string in the event-related mention and the string in the mention m i by applying the string similarity S, which is a similarity based on the similarity of strings. The string similarity S is calculated from the following formula using, for example, the distance between strings a and b, d (string a, string b), and a function L that takes a string as input and returns the string length.
Figure 0007488207000002

ユーザ言及抽出部151は、求めた文字列類似度Sを用いて、例えば、次式から類似度Siを求める。

Figure 0007488207000003
The user mention extraction unit 151 uses the obtained string similarity S to obtain a similarity S i , for example, from the following formula.
Figure 0007488207000003

また、例えば、ユーザ言及抽出部151は、周辺事象を表す文字列とユーザ言及mi
の周辺事象言及の文字列とに基づき次式から類似度Siを求める。

Figure 0007488207000004
Furthermore, for example, the user mention extraction unit 151 calculates the similarity S i based on the character string representing the peripheral event and the character string of the peripheral event mention in the user mention m i using the following formula.
Figure 0007488207000004

また、例えば、ユーザ言及抽出部151は、事象指定情報113の時間情報と言及mi
で特定される時間情報との時間の近さを表す時刻類似度Stを適用することにより類似度
iを求める。時刻類似度Stは、例えば、入力時刻t_1とt_2に対して日数単位の時刻の差分を計算する関数dtと、適当な日数定数τを用いて次式で表わすことができる。

Figure 0007488207000005
In addition, for example, the user mention extraction unit 151 extracts the time information and the mention m i
The similarity S i is calculated by applying the time similarity S t , which indicates the closeness in time to the time information specified by ...
Figure 0007488207000005

ユーザ言及抽出部151は、時刻類似度Stを用いて、例えば、次式から類似度Siを求める。

Figure 0007488207000006
The user mention extraction unit 151 uses the time similarity S t to calculate the similarity S i from, for example, the following formula.
Figure 0007488207000006

尚、ユーザ言及抽出部151が、以上に示した類似度Siの算出方法のうちの2つ以上
を組み合わせて類似度を求めるようにしてもよい。その場合、例えば、各方法で求めた類似度Siを重み付け和を求める等して求めた値を最終的な類似度とする。
The user mention extraction unit 151 may calculate the similarity by combining two or more of the above-described methods for calculating the similarity S. In this case, for example, the similarity S calculated by each method may be weighted and summed to obtain the final similarity.

続いて、図1に示した将来言及特定部152について説明する。将来言及特定部152は、ユーザ言及抽出部151によって生成されたユーザ言及集合Q(ユーザ言及114)を用いて、事象関連言及情報112の中から、同一の将来事象を指示するであろう言及群を抽出して次式で示す将来言及集合Fを生成する。

Figure 0007488207000007
Next, the future mention identification unit 152 shown in Fig. 1 will be described. The future mention identification unit 152 uses the user mention set Q (user mentions 114) generated by the user mention extraction unit 151 to extract a group of mentions that are likely to indicate the same future event from the event-related mention information 112, and generates a future mention set F shown in the following formula.
Figure 0007488207000007

また、将来言及特定部152は、将来言及集合Fが指示する将来事象とユーザ言及集合Qが指示する事象との因果関係の強さ(以下、「因果強度スコアS(F, Q)」と称す
る。)を求める。そして、将来言及特定部152は、将来言及集合Fと因果強度スコアS(F, Q)とに基づき将来言及情報115を生成する。
The future mention identification unit 152 also determines the strength of the causal relationship (hereinafter referred to as the "causal strength score S(F,Q)") between the future event indicated by the future mention set F and the event indicated by the user mention set Q. Then, the future mention identification unit 152 generates future mention information 115 based on the future mention set F and the causal strength score S(F,Q).

図6は将来言及情報115の一例である。同図に示すように、将来言及情報115は、将来言及集合ID1151、将来言及ID1152、および因果強度1153の各項目を有する一つ以上のエントリ(レコード)で構成される。将来言及情報115のエントリの一つは、一つの将来言及集合Fに対応する。 Figure 6 is an example of future mention information 115. As shown in the figure, future mention information 115 is composed of one or more entries (records) having each of the fields of future mention set ID 1151, future mention ID 1152, and causal strength 1153. One entry of future mention information 115 corresponds to one future mention set F.

上記項目のうち、将来言及集合ID1151には、将来言及集合Fの識別子(以下、「将来言及集合ID」と称する。)が設定される。将来言及ID1152には、当該将来言及集合Fの要素である言及の言及IDが設定される。因果強度1153には、将来言及集合Fが指示する事象とユーザ言及集合Qが指示する事象との間の因果強度スコアS(F,
Q)が設定される。
Of the above items, the future mention set ID 1151 is set with an identifier of the future mention set F (hereinafter, referred to as the "future mention set ID"). The future mention ID 1152 is set with a mention ID of a mention that is an element of the future mention set F. The causal strength 1153 is set with a causal strength score S(F,
Q) is set.

図7は、将来言及特定部152が行う処理(以下、「将来言及情報生成処理S700」と称する。)を説明するフローチャートである。以下、同図とともに将来言及情報生成処理S700について説明する。 Figure 7 is a flowchart explaining the process performed by the future mention identification unit 152 (hereinafter referred to as "future mention information generation process S700"). The future mention information generation process S700 will be explained below with reference to this figure.

まず、将来言及特定部152は、事象関連言及情報112から将来言及の候補となる言及を候補として抽出する(S711)。例えば、将来言及特定部152は、事象関連言及情報112の全ての言及を候補として抽出する。また、例えば、将来言及特定部152は、事象関連言及情報112から、ユーザ言及集合Qの要素(ユーザ言及)の取得元の文書と同一の文書IDを有する(取得元として対応付けられている)言及を候補として抽出する。 First, the future mention identification unit 152 extracts mentions that are candidates for future mentions from the event-related mention information 112 as candidates (S711). For example, the future mention identification unit 152 extracts all mentions in the event-related mention information 112 as candidates. Also, for example, the future mention identification unit 152 extracts mentions that have the same document ID (associated as the source) as the document from which the elements (user mentions) of the user mention set Q were obtained, from the event-related mention information 112, as candidates.

続いて、将来言及特定部152は、抽出した候補について同一または類似の事象を表していると推定される言及を特定し、特定した言及を要素とする将来言及集合を生成する(S712)。例えば、将来言及特定部152は、抽出した候補を、言及文字列間の文字列類似度Sに関する類似度行列を用いて、スペクトラルクラスタリングのような類似度行列に基づくクラスタリング手法を用いることにより、同一または類似の事象を表わしていると推定される複数のクラスタに分類し、分類により得られた各クラスタを将来言及集合Fとして複数の将来言及集合Fを生成する。 Next, the future mention identification unit 152 identifies mentions that are estimated to represent the same or similar events for the extracted candidates, and generates a future mention set with the identified mentions as elements (S712). For example, the future mention identification unit 152 classifies the extracted candidates into multiple clusters that are estimated to represent the same or similar events by using a similarity matrix related to the string similarity S between the mention strings and a clustering method based on a similarity matrix such as spectral clustering, and generates multiple future mention sets F with each cluster obtained by classification as a future mention set F.

続いて、将来言及特定部152は、生成した複数の将来言及集合Fの夫々が指示する事象と事象指定情報113によって表現される事象との間の因果強度スコアS(F, Q)
を求める(S713)。例えば、将来言及特定部152は、将来言及集合Fとユーザ言及集合Qとについて文書間点自己相互情報量(PMI(Pointwise Mutual Information))
を求めて因果強度スコアS(F, Q)とする。

Figure 0007488207000008
Next, the future mention identification unit 152 calculates a causal strength score S(F,Q) between the events indicated by each of the generated multiple future mention sets F and the events represented by the event designation information 113.
For example, the future mention identification unit 152 calculates the inter-document pointwise mutual information (PMI) between the future mention set F and the user mention set Q (S713).
is calculated and used as the causal strength score S(F,Q).
Figure 0007488207000008

続いて、将来言及特定部152は、以上のようにして生成した情報に基づき、将来言及情報115を生成する(S714)。 Next, the future mention identification unit 152 generates future mention information 115 based on the information generated as described above (S714).

図1に戻り、同図に示す将来事象情報生成部160は、以上のようにして将来事象推定部150により生成された将来言及情報115に基づき、将来事象情報116を生成し、生成した将来事象情報116の内容をユーザに提示する。 Returning to FIG. 1, the future event information generation unit 160 shown in the figure generates future event information 116 based on the future mention information 115 generated by the future event estimation unit 150 as described above, and presents the contents of the generated future event information 116 to the user.

図8に、将来事象情報生成部160が、将来事象情報116の内容をユーザに提示する
際に出力装置15を介して表示する画面(以下、「将来事象情報提示画面800」と称する。)の一例を示す。将来事象情報生成部160は、例えば、将来事象情報提示画面800をWebページとしてユーザに提示する。尚、将来事象情報提示画面800は、事象指定情報設定画面500と共通の画面としてもよい。
8 shows an example of a screen (hereinafter referred to as a "future event information presentation screen 800") that the future event information generating unit 160 displays via the output device 15 when presenting the contents of the future event information 116 to the user. The future event information generating unit 160 presents the future event information presentation screen 800 to the user as a Web page, for example. The future event information presentation screen 800 may be a common screen with the event designation information setting screen 500.

例示する将来事象情報提示画面800では、因果強度1153が大きい方から順に、将来言及集合F毎に、将来言及集合Fの要素(将来言及)を表示している。ユーザは、将来事象情報提示画面800を参照することで、入力した事象指定情報に対応する将来事象を、起きる可能性の高さを示す優先順位とともに把握することができる。 In the illustrated future event information presentation screen 800, the elements (future mentions) of the future mention set F are displayed for each future mention set F in descending order of causal strength 1153. By referring to the future event information presentation screen 800, the user can grasp the future events corresponding to the input event specification information, along with a priority order indicating the likelihood of occurrence.

尚、ユーザ言及集合Qは、事象指定情報113に関連するとして事象関連言及情報112から抽出された言及を要素とするので、因果強度スコアS(F, Q)には、ユーザ言
及集合Qと将来言及集合Fとの時間(各集合の要素の時間情報)の類似性も反映される。即ち、両者に時間差がある場合は因果強度スコアS(F, Q)が小さくなり、ユーザ言
及に対して時間差の大きな情報が将来言及として抽出されてしまうのを防ぐことができ、将来事象の推定精度を高めることができる。
In addition, since the user mention set Q has elements that are mentions extracted from the event-related mention information 112 as being related to the event designation information 113, the causal strength score S(F,Q) also reflects the similarity in time (time information of the elements of each set) between the user mention set Q and the future mention set F. In other words, if there is a time difference between the two, the causal strength score S(F,Q) becomes smaller, and it is possible to prevent information with a large time difference from the user mention from being extracted as a future mention, thereby improving the estimation accuracy of the future event.

[第2実施形態]
図9に第2実施形態として示す将来事象推定システム1の概略的な構成を示している。第2実施形態の将来事象推定システム1の構成は、第1実施形態の将来事象推定システム1と基本的に共通するが、第2実施形態の将来事象推定システム1は、更に事象指定情報提示部135と事象指定情報候補抽出部170を有し、また、記憶部110が、事象指定情報候補情報117を更に記憶する点で第1実施形態の将来事象推定システム1と構成が異なる。
[Second embodiment]
9 shows a schematic configuration of a future event inference system 1 shown as the second embodiment. The configuration of the future event inference system 1 of the second embodiment is basically the same as that of the future event inference system 1 of the first embodiment, but the future event inference system 1 of the second embodiment further includes an event designating information presenting unit 135 and an event designating information candidate extracting unit 170, and the storage unit 110 further stores event designating information candidate information 117.

事象指定情報提示部135は、事象指定情報受付部140が事象指定情報113をユーザから受け付ける際、出力装置15に事象指定情報候補情報117から取得される情報を事象指定情報113の候補として選択可能な状態で提示する。これによりユーザは、第1実施形態のように事象指定情報設定画面500を介して事象指定情報113の内容を逐一設定する必要がなく、事象指定情報113を効率よく入力することができる。尚、上記候補は、例えば、ユーザから受け付けたキーワードによって事象指定情報候補情報117から抽出した情報としてもよい。また、上記候補は、事象指定情報候補情報117から取得される全ての情報としてもよい。 When the event designation information receiving unit 140 receives the event designation information 113 from the user, the event designation information presentation unit 135 presents on the output device 15 information acquired from the event designation information candidate information 117 in a selectable state as a candidate for the event designation information 113. This eliminates the need for the user to set the contents of the event designation information 113 one by one via the event designation information setting screen 500 as in the first embodiment, and allows the user to efficiently input the event designation information 113. Note that the above candidates may be, for example, information extracted from the event designation information candidate information 117 using a keyword received from the user. The above candidates may also be all information acquired from the event designation information candidate information 117.

事象指定情報候補抽出部170は、例えば、事象関連言及情報112に基づき事象指定情報候補情報117を生成する。事象指定情報候補情報117を事象関連言及情報112に基づき生成することで、将来事象推定部150は精度よく事象指定情報113の候補となる言及を生成することができる。事象指定情報候補情報117は、例えば、事象関連言及情報112と共通でもよい。また、事象指定情報候補抽出部170が、例えば、ユーザから受け付けた情報に基づき事象指定情報候補情報117を生成してもよい。 The event designation information candidate extraction unit 170 generates the event designation information candidate information 117 based on, for example, the event-related mention information 112. By generating the event designation information candidate information 117 based on the event-related mention information 112, the future event estimation unit 150 can accurately generate mentions that are candidates for the event designation information 113. The event designation information candidate information 117 may be common to the event-related mention information 112, for example. In addition, the event designation information candidate extraction unit 170 may generate the event designation information candidate information 117 based on, for example, information received from a user.

図10に、第2実施形態の将来事象推定システム1の事象指定情報受付部140がユーザに提示する事象指定情報設定画面500の一例を示す。例示する事象指定情報設定画面500には、事象指定情報候補情報117から取得される複数の情報(事象511、周辺事象512、および時間情報513の各項目と検索ボタン520からなる複数のセット)が事象指定情報113の候補として一覧表示されている。ユーザが、選択しようとする情報の検索ボタン520を操作すると、将来事象推定部150が、対応する事象指定情報113に基づき将来言及情報115を生成する。続いて、将来事象情報生成部160が、将来事象情報116を生成し、生成した将来事象情報116に基づき将来事象情報提示画面800を生成してユーザに提示する。 Figure 10 shows an example of an event designation information setting screen 500 presented to the user by the event designation information receiving unit 140 of the future event inference system 1 of the second embodiment. In the illustrated event designation information setting screen 500, a plurality of pieces of information (multiple sets consisting of the items of event 511, surrounding event 512, and time information 513 and a search button 520) acquired from the event designation information candidate information 117 are displayed as candidates for the event designation information 113. When the user operates the search button 520 for the information to be selected, the future event inference unit 150 generates future mention information 115 based on the corresponding event designation information 113. Next, the future event information generation unit 160 generates future event information 116, and generates a future event information presentation screen 800 based on the generated future event information 116 to present to the user.

[第3実施形態]
第3実施形態の将来事象推定システム1は、第1実施形態の将来事象推定システム1と基本的に構成は共通するが、第3実施形態の将来事象推定システム1は、将来事象情報生成部160が、将来事象情報提示画面800に将来言及集合Fを表示する際、各将来言及集合Fにおける代表的な将来言及を強調表示する点で第1実施形態の将来事象推定システム1と構成が異なる。
[Third embodiment]
The future event inference system 1 of the third embodiment basically has the same configuration as the future event inference system 1 of the first embodiment. However, the future event inference system 1 of the third embodiment differs in configuration from the future event inference system 1 of the first embodiment in that when the future event information generation unit 160 displays the future mention set F on the future event information presentation screen 800, it highlights representative future mentions in each future mention set F.

将来事象情報生成部160は、例えば、各将来言及集合Fについて、夫々の言及のうち夫々の時間情報から特定される時間(日時、時期等)が最も早い言及を代表的な将来言及として特定する。また、将来事象情報生成部160は、例えば、各将来言及集合Fについて、夫々の各言及のうち同じ将来言及集合Fに属する他の各言及との類似度の総和が最も大きい言及を代表的な将来言及として特定する。その場合、類似度は、例えば、言及中の言及文字列や周辺事象文字列同士に対して文字列類似度Sを適用する、あるいは時間情報同士に対して時刻類似度Stを適用する等により求める。 For example, the future event information generating unit 160 identifies as a representative future mention a mention having the earliest time (date, time, etc.) identified from each time information among the respective mentions for each future mention set F. In addition, for example, the future event information generating unit 160 identifies as a representative future mention a mention having the largest sum of similarities with other mentions belonging to the same future mention set F among the respective mentions for each future mention set F. In this case, the similarity is obtained, for example, by applying string similarity S to the mention strings or surrounding event strings in the mention, or by applying time similarity S t to the time information.

図11に、第3実施形態の将来事象推定システム1(将来事象情報生成部160)が表示する将来事象情報提示画面800の一例を示す。同図に示すように、将来事象情報生成部160は、各将来言及集合Fについて、夫々の将来言及のうち代表的な将来言及を太字とすることにより他の将来言及と区別して表示している。このように代表的な将来言及が強調表示されることで、ユーザは精度よく将来事象を把握することができる。 Figure 11 shows an example of a future event information presentation screen 800 displayed by the future event estimation system 1 (future event information generation unit 160) of the third embodiment. As shown in the figure, the future event information generation unit 160 displays the most representative future mentions among the future mentions for each future mention set F in bold, thereby distinguishing them from the other future mentions. By highlighting the most representative future mentions in this way, the user can accurately grasp the future events.

以上、本発明の一実施形態について説明したが、本発明は上記の実施形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。例えば、上記の実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、上記実施形態の構成の一部について、他の構成の追加や削除、置換をすることが可能である。 Although one embodiment of the present invention has been described above, it goes without saying that the present invention is not limited to the above embodiment and can be modified in various ways without departing from the spirit of the invention. For example, the above embodiment has been described in detail to clearly explain the present invention, and is not necessarily limited to having all of the configurations described. In addition, it is possible to add, delete, or replace part of the configuration of the above embodiment with other configurations.

また、上記の各構成、機能部、処理部、処理手段等は、それらの一部または全部を、例えば、集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記録装置、
ICカード、SDカード、DVD等の記録媒体に置くことができる。
In addition, the above-mentioned configurations, functional units, processing units, processing means, etc. may be realized in part or in whole by hardware, for example, by designing them as integrated circuits. In addition, the above-mentioned configurations, functions, etc. may be realized in software by a processor interpreting and executing a program that realizes each function. Information such as the program, table, file, etc. that realizes each function can be stored in a storage device such as a memory, a hard disk, or an SSD (Solid State Drive),
It can be placed on a recording medium such as an IC card, an SD card, or a DVD.

また、以上に説明した各情報処理装置の各種機能部、各種処理部、各種データベースの配置形態は一例に過ぎない。各種機能部、各種処理部、各種データベースの配置形態は、これらの装置が備えるハードウェアやソフトウェアの性能、処理効率、通信効率等の観点から最適な配置形態に変更し得る。 Furthermore, the layout of the various functional units, various processing units, and various databases of each information processing device described above is merely an example. The layout of the various functional units, various processing units, and various databases can be changed to an optimal layout in terms of the performance, processing efficiency, communication efficiency, etc. of the hardware and software equipped in these devices.

また、前述した各種のデータを格納するデータベースの構成(スキーマ(Schema)等)は、リソースの効率的な利用、処理効率向上、アクセス効率向上、検索効率向上等の観点から柔軟に変更し得る。 In addition, the configuration (schema, etc.) of the database that stores the various types of data mentioned above can be flexibly changed from the perspective of efficient use of resources, improved processing efficiency, improved access efficiency, improved search efficiency, etc.

1 将来事象推定システム、110 記憶部、111 文書情報、112 事象関連言及情報、113 事象指定情報、114 ユーザ言及、115 将来言及情報、116 将来事象情報、117 事象指定情報候補情報、120 文書情報取得部、130 事象関連言及情報生成部、135 事象指定情報提示部、140 事象指定情報受付部、150
将来事象推定部、151 ユーザ言及抽出部、152 将来言及特定部、160 将来
事象情報生成部、170 事象指定情報候補抽出部、500 事象指定情報設定画面、S700 将来言及情報生成処理、800 将来事象情報提示画面
1 Future event estimation system, 110 Storage unit, 111 Document information, 112 Event-related mention information, 113 Event designation information, 114 User mention, 115 Future mention information, 116 Future event information, 117 Event designation information candidate information, 120 Document information acquisition unit, 130 Event-related mention information generation unit, 135 Event designation information presentation unit, 140 Event designation information reception unit, 150
Future event estimation unit, 151 user mention extraction unit, 152 future mention identification unit, 160 future event information generation unit, 170 event designation information candidate extraction unit, 500 event designation information setting screen, S700 future mention information generation process, 800 future event information presentation screen

Claims (14)

プロセッサおよびメモリを有する情報処理装置を用いて構成され、
文書情報に含まれている事象についての言及である事象関連言及に関する情報である事象関連言及情報を記憶する記憶部と、
前記事象関連言及情報から、所定の事象を指定する情報である事象指定情報に関連する言及であるユーザ言及を抽出するユーザ言及抽出部と、
前記事象関連言及情報から、前記ユーザ言及が表す事象についての将来の事象に関する言及である将来言及を特定する将来言及特定部と、
を備え
前記ユーザ言及抽出部は、前記事象関連言及情報から複数の前記ユーザ言及を抽出し、抽出した複数の前記ユーザ言及を要素とする集合であるユーザ言及集合を生成し、
前記将来言及特定部は、前記事象関連言及情報から前記将来言及の候補となる複数の言及を候補として抽出し、抽出した候補を分類することにより得られる集合である複数の将来言及集合を生成し、前記ユーザ言及集合と複数の前記将来言及集合の夫々との間の因果強度を求める、
将来事象推定システム。
The information processing device includes a processor and a memory.
A storage unit that stores event-related mention information, which is information related to an event-related mention that is a mention of an event included in document information;
a user mention extraction unit that extracts user mentions, which are mentions related to event designation information, which is information designating a predetermined event, from the event-related mention information;
a future mention identification unit that identifies a future mention, which is a mention regarding a future event regarding the event represented by the user mention, from the event-related mention information;
Equipped with
The user mention extraction unit extracts a plurality of the user mentions from the event-related mention information, and generates a user mention set that is a set including the extracted plurality of the user mentions as elements;
The future mention identification unit extracts a plurality of mentions that are candidates for the future mention from the event-related mention information as candidates, generates a plurality of future mention sets that are sets obtained by classifying the extracted candidates, and calculates a causal strength between the user mention set and each of the plurality of future mention sets.
Future event estimation system.
請求項1に記載の将来事象推定システムであって、
前記事象関連言及情報は、ある事象と当該事象に関連のある事象である周辺事象についての言及である周辺事象言及を含み、
前記将来言及特定部は、前記周辺事象言及との類似性に基づき、前記ユーザ言及が表す事象に類似する事象に関する言及を前記事象関連言及情報から前記将来言及として特定する、
将来事象推定システム。
2. The future event estimation system according to claim 1,
The event-related mention information includes a peripheral event mention, which is a mention of a certain event and a peripheral event that is an event related to the certain event;
The future mention identification unit identifies, as the future mention, a mention regarding an event similar to the event represented by the user mention, from the event-related mention information, based on a similarity to the peripheral event mention.
Future event estimation system.
請求項1に記載の将来事象推定システムであって、
前記事象関連言及情報は、前記事象関連言及が表す事象が生じた時間を示す情報である時間情報を含み、
前記将来言及特定部は、前記時間情報との類似性に基づき、前記ユーザ言及が表す事象に類似する事象に関する言及を前記事象関連言及情報から前記将来言及として特定する、
将来事象推定システム。
2. The future event estimation system according to claim 1,
the event-related mention information includes time information that is information indicating a time when the event represented by the event-related mention occurred;
the future mention identification unit identifies, as the future mention, a mention regarding an event similar to the event represented by the user mention from the event-related mention information, based on a similarity with the time information;
Future event estimation system.
請求項に記載の将来事象推定システムであって、
前記因果強度の強い前記将来言及集合の内容を優先してユーザインタフェースに出力する将来事象情報生成部、
を更に備える、将来事象推定システム。
2. The future event estimation system according to claim 1 ,
a future event information generation unit that outputs the contents of the future mention set having a high causal strength to a user interface with priority;
The future event estimation system further comprises:
請求項に記載の将来事象推定システムであって、
前記将来事象情報生成部は、前記将来言及集合の夫々について代表となる言及を特定し、特定した前記言及を強調してユーザインタフェースに出力する、
将来事象推定システム。
5. The future event estimation system according to claim 4 ,
The future event information generation unit identifies a representative mention for each of the future mention sets, and outputs the identified mention to a user interface in an emphasized manner.
Future event estimation system.
請求項に記載の将来事象推定システムであって、
前記事象関連言及情報は、前記事象関連言及が表す事象が生じた時間を示す情報である時間情報を含み、
前記将来事象情報生成部は、前記将来言及集合に属する言及のうち時間情報から特定される時間が最も早いものを当該将来言及集合の代表として特定する、
将来事象推定システム。
6. The future event estimation system according to claim 5 ,
the event-related mention information includes time information that is information indicating a time when the event represented by the event-related mention occurred;
the future event information generation unit identifies, among the mentions belonging to the future mention set, a mention that has the earliest time identified from time information as a representative of the future mention set;
Future event estimation system.
請求項に記載の将来事象推定システムであって、
前記将来事象情報生成部は、前記将来言及集合の言及のうち当該将来言及集合に属する他の要素との類似度が最大の言及を当該将来言及集合の代表として特定する、
将来事象推定システム。
6. The future event estimation system according to claim 5 ,
The future event information generation unit identifies, from among the mentions in the future mention set, a mention having a maximum similarity to other elements belonging to the future mention set as a representative of the future mention set.
Future event estimation system.
請求項1に記載の将来事象推定システムであって、
前記文書情報を取得する文書情報取得部と、
前記文書情報について自然言語処理を行うことにより前記事象関連言及情報を生成する事象関連言及情報生成部と、
を更に備える、将来事象推定システム。
2. The future event estimation system according to claim 1,
a document information acquisition unit for acquiring the document information;
an event-related mention information generating unit that generates the event-related mention information by performing natural language processing on the document information;
The future event estimation system further comprises:
請求項に記載の将来事象推定システムであって、
前記自然言語処理は、述語構造解析及び統語解析のうちの少なくともいずれかによる処理である、
将来事象推定システム。
9. A future event estimation system according to claim 8 ,
The natural language processing is processing by at least one of predicate structure analysis and syntactic analysis.
Future event estimation system.
請求項1に記載の将来事象推定システムであって、
前記事象指定情報の入力をユーザインタフェースを介してユーザから受け付ける事象指定情報受付部、
を更に備える、将来事象推定システム。
2. The future event estimation system according to claim 1,
an event designation information receiving unit that receives an input of the event designation information from a user via a user interface;
The future event estimation system further comprises:
請求項10に記載の将来事象推定システムであって、
前記事象関連言及情報から前記事象指定情報の候補となる情報を抽出する事象指定情報候補抽出部と、
前記事象指定情報受付部が前記事象指定情報の入力を受け付ける際に前記候補となる情報を選択可能な状態でユーザインタフェースを介してユーザに提示する事象指定情報提示部と、
を更に備える、将来事象推定システム。
The future event estimation system according to claim 10 ,
an event designation information candidate extraction unit that extracts information that is a candidate for the event designation information from the event-related mention information;
an event designation information presentation unit that presents the candidate information to a user via a user interface in a selectable state when the event designation information reception unit receives an input of the event designation information;
The future event estimation system further comprises:
プロセッサおよびメモリを有する情報処理装置が、
文書情報に含まれている事象についての言及である事象関連言及に関する情報である事象関連言及情報を記憶するステップと、
前記事象関連言及情報から、所定の事象を指定する情報である事象指定情報に関連する言及であるユーザ言及を抽出するステップと、
前記事象関連言及情報から、前記ユーザ言及が表す事象についての将来の事象に関する言及である将来言及を特定するステップと、
前記事象関連言及情報から複数の前記ユーザ言及を抽出し、抽出した複数の前記ユーザ言及を要素とする集合であるユーザ言及集合を生成するステップと、
前記事象関連言及情報から前記将来言及の候補となる複数の言及を候補として抽出し、抽出した候補を分類することにより得られる集合である複数の将来言及集合を生成し、前記ユーザ言及集合と複数の前記将来言及集合の夫々との間の因果強度を求めるステップと、
を実行する、将来事象推定方法。
An information processing device having a processor and a memory,
A step of storing event-related mention information, which is information regarding an event-related mention that is a mention of an event included in the document information;
A step of extracting user mentions, which are mentions related to event designation information, which is information designating a predetermined event, from the event-related mention information;
Identifying a future mention from the event-related mention information, the future mention being a mention of a future event regarding the event represented by the user mention;
extracting a plurality of the user mentions from the event-related mention information, and generating a user mention set that is a set having the extracted plurality of the user mentions as elements;
extracting a plurality of references that are candidates for the future reference from the event-related reference information as candidates, generating a plurality of future reference sets that are sets obtained by classifying the extracted candidates, and determining a causal strength between the user reference set and each of the plurality of future reference sets;
A method for estimating future events.
請求項12に記載の将来事象推定方法であって、
前記事象関連言及情報は、ある事象と当該事象に関連のある事象である周辺事象についての言及である周辺事象言及を含み、
前記情報処理装置が、前記周辺事象言及との類似性に基づき、前記ユーザ言及が表す事象に類似する事象に関する言及を前記事象関連言及情報から前記将来言及として特定するステップ、
を更に実行する、将来事象推定方法。
A method for estimating a future event according to claim 12 , comprising:
The event-related mention information includes a peripheral event mention, which is a mention of a certain event and a peripheral event that is an event related to the certain event;
a step of the information processing device identifying a mention of an event similar to the event represented by the user mention as the future mention from the event-related mention information based on a similarity to the peripheral event mention;
The method for estimating future events further comprises:
請求項12に記載の将来事象推定方法であって、
前記事象関連言及情報は、前記事象関連言及が表す事象が生じた時間を示す情報である
時間情報を含み、
前記情報処理装置が、前記時間情報との類似性に基づき、前記ユーザ言及が表す事象に類似する事象に関する言及を前記事象関連言及情報から前記将来言及として特定するステップ、
を更に実行する、将来事象推定方法。
A method for estimating a future event according to claim 12 , comprising:
the event-related mention information includes time information that is information indicating a time when the event represented by the event-related mention occurred;
a step of identifying a mention of an event similar to the event represented by the user mention as the future mention from the event-related mention information based on a similarity with the time information by the information processing device;
The method for estimating future events further comprises:
JP2021024166A 2021-02-18 2021-02-18 Future event estimation system and future event estimation method Active JP7488207B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021024166A JP7488207B2 (en) 2021-02-18 2021-02-18 Future event estimation system and future event estimation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021024166A JP7488207B2 (en) 2021-02-18 2021-02-18 Future event estimation system and future event estimation method

Publications (2)

Publication Number Publication Date
JP2022126229A JP2022126229A (en) 2022-08-30
JP7488207B2 true JP7488207B2 (en) 2024-05-21

Family

ID=83058891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021024166A Active JP7488207B2 (en) 2021-02-18 2021-02-18 Future event estimation system and future event estimation method

Country Status (1)

Country Link
JP (1) JP7488207B2 (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007537546A (en) 2004-05-12 2007-12-20 レイセオン・カンパニー Event warning system and method
US20080040321A1 (en) 2006-08-11 2008-02-14 Yahoo! Inc. Techniques for searching future events
JP2008203964A (en) 2007-02-16 2008-09-04 Nec Corp Causal relationship analysis apparatus, causal relationship analysis method, and program
JP2008282222A (en) 2007-05-10 2008-11-20 Internatl Business Mach Corp <Ibm> Future technology tend prediction support device, method, program and method for providing future technology tend prediciton support service
JP2009059323A (en) 2007-09-04 2009-03-19 Omron Corp Knowledge generation system
JP2019128925A (en) 2018-01-26 2019-08-01 株式会社日立製作所 Event presentation system and event presentation device
JP2020024689A (en) 2018-07-26 2020-02-13 株式会社xenodata lab. Causal relationship extraction system and causal relationship extraction program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9953080B1 (en) * 2013-04-05 2018-04-24 Hrl Laboratories, Llc Social media data mining for early detection of newsworthy civil unrest events

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007537546A (en) 2004-05-12 2007-12-20 レイセオン・カンパニー Event warning system and method
US20080040321A1 (en) 2006-08-11 2008-02-14 Yahoo! Inc. Techniques for searching future events
JP2008203964A (en) 2007-02-16 2008-09-04 Nec Corp Causal relationship analysis apparatus, causal relationship analysis method, and program
JP2008282222A (en) 2007-05-10 2008-11-20 Internatl Business Mach Corp <Ibm> Future technology tend prediction support device, method, program and method for providing future technology tend prediciton support service
JP2009059323A (en) 2007-09-04 2009-03-19 Omron Corp Knowledge generation system
JP2019128925A (en) 2018-01-26 2019-08-01 株式会社日立製作所 Event presentation system and event presentation device
JP2020024689A (en) 2018-07-26 2020-02-13 株式会社xenodata lab. Causal relationship extraction system and causal relationship extraction program

Also Published As

Publication number Publication date
JP2022126229A (en) 2022-08-30

Similar Documents

Publication Publication Date Title
CN109992645B (en) Data management system and method based on text data
US9864741B2 (en) Automated collective term and phrase index
JP5512489B2 (en) File management apparatus and file management method
Al-Subaihin et al. Empirical comparison of text-based mobile apps similarity measurement techniques
JP2005122295A (en) Relationship diagram creation program, relationship diagram creation method, and relationship diagram creation device
US11361030B2 (en) Positive/negative facet identification in similar documents to search context
KR102046692B1 (en) Method and System for Entity summarization based on multilingual projected entity space
CN113722472B (en) Technical literature information extraction method, system and storage medium
CN116595173A (en) Data processing method, device, equipment and storage medium for policy information management
JP6409071B2 (en) Sentence sorting method and calculator
WO2022176236A1 (en) Research perspective presentation system and research perspective presentation method
Ise Integration and analysis of unstructured data for decision making: Text analytics approach
Prathyusha et al. Normalization methods for multiple sources of data
Benny et al. Hadoop framework for entity resolution within high velocity streams
Arshad et al. Next generation data analytics: text mining in library practice and research
JP7488207B2 (en) Future event estimation system and future event estimation method
Maiya et al. Exploratory analysis of highly heterogeneous document collections
US20160085850A1 (en) Knowledge brokering and knowledge campaigns
JP2021068082A (en) File recommendation system, file recommendation program, file recommendation method, and file recommendation device
Charles et al. Data Quality Assessment in Europeana: Metrics for Multilinguality.
Ma et al. Api prober–a tool for analyzing web api features and clustering web apis
Bogen et al. Redeye: A digital library for forensic document triage
JP2022090209A (en) Account analysis system, and account analysis method
JP2022050011A (en) Information processing device and program
Rajdho et al. Plugging Text Processing and Mining in a Cloud Computing Framework

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240430

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240509

R150 Certificate of patent or registration of utility model

Ref document number: 7488207

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150