JP7536558B2 - Document information extraction device and document information extraction method - Google Patents
Document information extraction device and document information extraction method Download PDFInfo
- Publication number
- JP7536558B2 JP7536558B2 JP2020148544A JP2020148544A JP7536558B2 JP 7536558 B2 JP7536558 B2 JP 7536558B2 JP 2020148544 A JP2020148544 A JP 2020148544A JP 2020148544 A JP2020148544 A JP 2020148544A JP 7536558 B2 JP7536558 B2 JP 7536558B2
- Authority
- JP
- Japan
- Prior art keywords
- document information
- document
- information
- progress
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、文書情報抽出装置及び文書情報抽出方法に関し、入力文書の文書解析を経てユーザに適切な情報を抽出する文書情報抽出装置及び文書情報抽出方法に適用して好適なものである。 The present invention relates to a document information extraction device and a document information extraction method, and is suitable for use in a document information extraction device and a document information extraction method that extracts information appropriate for a user through document analysis of an input document.
従来、企業の営業担当者は、顧客に対する営業活動の記録を営業日報などの文書で記録するとともに、営業活動の進捗度合いや打ち合わせ状況に応じて、以降の営業活動において顧客に提案する推奨情報(例えば商品)を考案する必要があった。このときどのような推奨情報を提供するかによって営業結果は大きく変わるため、推奨情報を効率的に選択できる技術への期待があった。 Traditionally, corporate sales representatives have had to record sales activities with customers in documents such as daily sales reports, and also devise recommended information (e.g. products) to propose to customers in subsequent sales activities depending on the progress of sales activities and meeting situations. Sales results can vary greatly depending on the type of recommended information provided, so there was hope for technology that could efficiently select recommended information.
例えば特許文献1には、ユーザが帳票を作成する際に、帳票のレイアウトなどのユーザ入力情報から、参考になり得る帳票文書を提案する情報処理装置及び方法が記載されている。特許文献1に記載された情報処理装置では、ユーザ入力情報と、予め登録されている他の帳票の属性情報とを比較して、推奨する帳票を選択することにより、ユーザが想像していない、もしくはユーザの期待以上となる参考帳票の提案を可能にする。
For example,
ところで、例えば、商品あるいはサービスを提供する企業において、商品あるいはサービスの売込みを担当する従業員(以下、営業担当者と称する)が、それまでの営業活動の結果に基づいて、顧客に提案するに相応しい商品あるいはサービスを選択する場合、一般的に、顧客に提案すべき商品あるいはサービスは、営業活動の履歴や進捗具合に対応して変化する。具体的には例えば、顧客との打ち合わせが好感触であった場合は、前回の営業活動時に提案した商品あるいはサービスの類似案件を多く提案することが好適である一方、打ち合わせが難航している場合は、目新しさを優先した商品あるいはサービスを提案することに需要がある。しかし、上述した特許文献1などに開示された従来技術では、時系列で変化する入力情報における進捗状況を鑑みて、ユーザに推奨する出力情報を決定することができない、という課題があった。
For example, in a company that provides products or services, when an employee in charge of selling the products or services (hereinafter referred to as a salesperson) selects a product or service suitable for proposal to a customer based on the results of sales activities up to that point, the product or service to be proposed to the customer generally changes in response to the history and progress of sales activities. Specifically, for example, if a meeting with a customer goes well, it is preferable to propose many products or services similar to those proposed in the previous sales activity, whereas if the meeting is not going well, there is a demand for proposing products or services that prioritize novelty. However, the conventional technology disclosed in the above-mentioned
また、特許文献1に開示された技術は、帳票情報の入力から参考となる帳票情報を出力する技術であり、入力情報の文書種と出力結果(参考帳票)の文書種とが異なる場合には適用できないという課題もあった。例えば、営業担当者が、自分が行った営業活動に関する情報(以下、営業報告書と称する)を入力し、顧客に提案するに相応しい商品あるいはサービスの情報を製品カタログ文書などから選択して出力する場合、営業報告書と製品カタログ文書との属性情報は全く異なるため、それぞれの属性情報を比較しても、推奨するアイテムを選択することができなかった。
The technology disclosed in
本発明は以上の点を考慮してなされたもので、時系列で変化する入力情報における進捗状況を考慮して、好適な推奨情報を抽出することが可能な文書情報抽出装置及び文書情報抽出方法を提案しようとするものである。 The present invention has been made in consideration of the above points, and aims to propose a document information extraction device and document information extraction method that can extract suitable recommended information by taking into account the progress of input information that changes over time.
かかる課題を解決するため本発明においては、同一の案件において時系列で記録される活動記録の文書解析を行って推奨アイテムを提案する文書情報抽出装置であって、前記活動記録が登録された第1文書情報と、前記第1文書情報とは異なる文書種で構成されており、前記推奨アイテムの候補に関する文書データが登録された第2文書情報と、を格納する記憶部と、前記第1文書情報の前記活動記録に含まれる、進捗状況を示唆するキーワードに基づいて、前記活動記録の進捗状況を、複数段階の進捗カテゴリの何れかに分類する進捗判定部と、前記第1文書情報から関連する固有表現を構成する第1関連語を抽出し、当該抽出した第1関連語をまとめた第1関連語情報を生成する第1文書処理部と、前記第2文書情報から関連する固有表現を構成する第2関連語を抽出し、当該抽出した第2関連語をまとめた第2関連語情報を生成する第2文書処理部と、前記進捗判定部によって分類された前記進捗カテゴリに応じた推奨アイテムの選出条件と、共通する関連語で前記第1関連語情報と前記第2関連語情報とを接続することによって前記第1文書情報と前記第2文書情報とを連携した関連語連携の結果とに基づいて、前記第1文書情報の前記活動記録に含まれる第1関連語に直接的又は間接的に接続された第2関連語を有する推奨アイテムを前記推奨アイテムの候補の中から選出して出力するアイテム処理部と、を備える文書情報抽出装置が提供される。 In order to solve such problems, the present invention provides a document information extraction device that proposes recommended items by performing document analysis of activity records recorded in chronological order for the same case, the document information extraction device including a storage unit that stores first document information in which the activity records are registered and second document information that is composed of a document type different from that of the first document information and in which document data relating to candidates for the recommended items are registered , a progress determination unit that classifies the progress status of the activity records into one of a plurality of progress categories based on keywords that indicate the progress status and are included in the activity records of the first document information, and a progress determination unit that extracts first related words that constitute related named entities from the first document information and generates first related word information that compiles the extracted first related words. a second document processing unit that extracts second related words that constitute related named entities from the second document information and generates second related word information that compiles the extracted second related words; and an item processing unit that selects and outputs recommended items having second related words that are directly or indirectly connected to first related words included in the activity record of the first document information from among candidates for recommended items based on a selection condition for recommended items corresponding to the progress category classified by the progress determination unit and a result of related word linkage that links the first document information and the second document information by connecting the first related word information and the second related word information with a common related word .
また、かかる課題を解決するため本発明においては、同一の案件において時系列で記録される活動記録の文書解析を行って推奨アイテムを提案する文書情報抽出装置による文書情報抽出方法であって、前記活動記録を第1文書情報に登録する第1文書情報記憶ステップと、前記推奨アイテムの候補に関する文書データを、前記第1文書情報とは異なる文書種で構成されている第2文書情報に登録する第2文書情報記憶ステップと、前記第1文書情報の前記活動記録に含まれる、進捗状況を示唆するキーワードに基づいて、当該活動記録の進捗状況を、複数段階の進捗カテゴリの何れかに分類する進捗判定ステップと、前記第1文書情報から関連する固有表現を構成する第1関連語を抽出し、当該抽出した第1関連語をまとめた第1関連語情報を生成する第1文書処理ステップと、前記第2文書情報から関連する固有表現を構成する第2関連語を抽出し、当該抽出した第2関連語をまとめた第2関連語情報を生成する第2文書処理ステップと、前記第1文書処理ステップ及び前記第2文書処理ステップの実行後、アイテム処理ステップにおいて、前記進捗判定ステップによって分類された前記進捗カテゴリに応じた推奨アイテムの選出条件と、共通する関連語で前記第1関連語情報と前記第2関連語情報とを接続することによって前記第1文書情報と前記第2文書情報とを連携した関連語連携の結果に基づいて、前記第1文書情報の前記活動記録に含まれる第1関連語に直接的又は間接的に接続された第2関連語を有する推奨アイテムを前記推奨アイテムの候補の中から選出して出力するステップと、を備える文書情報抽出方法が提供される。 In order to solve the above problem, the present invention provides a document information extraction method for a document information extraction device that proposes recommended items by performing document analysis on activity records recorded in chronological order for the same case, the method including a first document information storage step of registering the activity records in first document information, a second document information storage step of registering document data related to the recommended item candidates in second document information composed of a document type different from that of the first document information, a progress determination step of classifying the progress status of the activity records into one of a plurality of progress categories based on a keyword that suggests the progress status and that is included in the activity records of the first document information, and a first document processing step of extracting first related words that constitute related named entities from the first document information and generating first related word information that compiles the extracted first related words. a second document processing step of extracting second related words constituting related named entities from the second document information and generating second related word information compiling the extracted second related words; and after the first document processing step and the second document processing step are executed , in an item processing step, selecting and outputting from among candidates for recommended items, recommended items having second related words directly or indirectly connected to first related words included in the activity record of the first document information, based on a selection condition for recommended items corresponding to the progress category classified by the progress determination step and a result of related word linkage in which the first document information and the second document information are linked by connecting the first related word information and the second related word information with a common related word .
本発明によれば、時系列で変化する入力情報における進捗状況を考慮して、好適な推奨情報を抽出することができる。 According to the present invention, it is possible to extract suitable recommended information by taking into account the progress of input information that changes over time.
以下、図面を参照にしつつ、本発明の実施形態について説明する。なお、以下の記載および図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略および簡略化がなされている。また、本発明は、他の種々の形態でも実施する事が可能である。とくに限定しない限り、各構成要素は単数でも複数でも構わない。 Hereinafter, an embodiment of the present invention will be described with reference to the drawings. Note that the following description and drawings are merely examples for explaining the present invention, and some parts have been omitted or simplified as appropriate for clarity of explanation. The present invention can also be implemented in various other forms. Unless otherwise specified, each component may be singular or plural.
以下の説明において、符号の前に付した「S」の文字は処理ステップの意味である。また、以下の説明では「表」、「情報」という表現にて各種情報(データ)を説明するが、各種情報は、これら以外のデータ構造で表現されていてもよい。また、識別情報について説明する際、「識別子」、「ID」等の表現を適宜用いるが、これらについてはお互いに置換可能である。 In the following explanation, the letter "S" before a symbol indicates a processing step. In addition, in the following explanation, various information (data) will be explained using the expressions "table" and "information", but the various information may be expressed using data structures other than these. In addition, when explaining identification information, expressions such as "identifier" and "ID" will be used as appropriate, but these are interchangeable.
また、以下の説明において、「文書」と記載した場合、文書をテキストデータ等の所定の形式で電子化したデータを意味する。また、以下の説明において、「単語」と記載した場合、情報処理装置(文書情報抽出装置)によって抽出された固有表現を意味する。また、以下の説明において、固有表現とは、人名や地名など、特定の物事を指す単語の総称である。例えば、「技術者」や「東京都」はそれぞれ、「人」や「場所」についての固有表現である。また、この場合における固有表現の分類先である「人」や「場所」のことを「カテゴリ」と称する。 In the following explanation, the term "document" refers to data that has been digitized from a document in a specified format, such as text data. In the following explanation, the term "word" refers to a named entity extracted by an information processing device (document information extraction device). In the following explanation, a named entity is a general term for words that refer to specific things, such as people's names or place names. For example, "engineer" and "Tokyo" are named entities for "people" and "places," respectively. In this case, the "people" and "places" into which named entities are classified are referred to as "categories."
(1)構成
図1は、本発明の一実施形態に係る文書情報抽出装置1の機能構成例を示すブロック図である。文書情報抽出装置1は、2種の文書情報(第1文書情報111,第2文書情報113)からそれぞれ抽出される固有表現から、関連性のある単語セットを格納した関連語辞書をそれぞれ作成し、関連語辞書同士を連携することで2種の文書情報を連携させる。また、文書情報抽出装置1は、時系列で入力される、履歴や進捗等の内容を含む文書情報について、予め設定した進捗カテゴリ情報(進捗カテゴリ表117)に基づき分類し、進捗カテゴリに応じたアイテム適合度を算出し、最適なアイテムを推薦する。
(1) Configuration Fig. 1 is a block diagram showing an example of the functional configuration of a document
図1に示すように、文書情報抽出装置1は、記憶部110、第1文書処理部120、第2文書処理部130、及びアイテム処理部140を備える。
As shown in FIG. 1, the document
記憶部110は、第1文書情報111、第1関連語情報112、第2文書情報113、第2関連語情報114、及びレコメンド履歴情報115を記憶する。記憶部110は、例えば、DBMS(DataBase Management System)が提供するデータベースのテーブルや、ファイルシステムが提供するファイルとして、これらの情報(データ)を記憶する。
The
第1文書情報111及び第2文書情報113は、固有表現の抽出元となる複数の文書を含む。第1文書情報111及び第2文書情報113の内容は必ずしも限定されず、例えば、第1文書情報111及び第2文書情報113は、ユーザが入力したものでもよいし、インターネット等の通信ネットワークを介して取得される情報でもよい。
The
詳細は図3を参照しながら後述するが、第1文書情報111には、営業担当者によって入力される入力情報(例えば営業関連文書)が格納される。また、詳細は図6を参照しながら後述するが、第2文書情報113には、推奨アイテム(レコメンドアイテム)としてアイテム処理部140によってユーザに提案される出力情報の抽出元となる情報(例えば製品カタログ文書)が格納される。なお、本実施形態に係る文書情報抽出装置1は、入力情報を含む第1文書情報111と出力情報を含む第2文書情報113との文書の種別(文書種)が異なる場合であっても、入力情報に含まれる固有表現に基づいて、適切な出力情報を提案することを特徴の1つとするが、第1文書情報111及び第2文書情報113の文書種は、必ずしも異種である必要はなく、例えば第1文書情報111及び第2文書情報113が、ともに営業報告書であってもよい。但し、少なくとも第1文書情報111は、活動の進捗状況を示唆する情報を取得可能なことが必要であり、例えば、同一の営業活動において複数日の複数の営業日報を保有し、営業活動が順調や難航といった情報が取得可能な記載が含まれているものとする。
The
第1関連語情報112は、第1文書処理部120によって抽出された関連語、及び第1文書情報111に含まれる文書を活動進捗で分類するための進捗分類情報であり、第1関連語表116、及び進捗カテゴリ表117を含む。
The first
第2関連語情報114は、第2文書処理部130によって抽出された関連語情報であり、第2関連語表118を含む。
The second
レコメンド履歴情報115は、アイテム処理部140で提案されたアイテムへのアクセス具合(評価値の指標)を格納する。アクセス度合には例えば、アイテム処理部140で提案されたアイテムに対して、ユーザが実際に選択や閲覧を行った結果が反映され、レコメンド履歴情報115では、アイテムの評価値として保持される。また。レコメンド履歴情報には、案件ごとに以前の営業活動で提案したアイテム(レコメンドアイテム)の履歴が蓄積された「レコメンド提案履歴」も保持される。
The
第1文書処理部120は、固有表現特徴量抽出部121、学習推論部122、関連語表生成部123、及び進捗カテゴリ生成部124を有して構成される。固有表現特徴量抽出部121は、第1文書情報111の文書に形態素解析を実行して固有表現及び特徴量を抽出するとともに、抽出した固有表現をカテゴリに分類する。学習推論部122は、機械学習モデルによる推論モデルの学習を行う。関連語表生成部123は、学習推論部122によって学習された推論モデルを用いて、固有表現特徴量抽出部121によって抽出された固有表現の中から、関連する固有表現をまとめた第1関連語表116を生成する。進捗カテゴリ生成部124は、進捗カテゴリ表117に基づいて、第1文書情報111の文書中に含まれる活動進捗のキーワードに応じて、当該文書を複数のカテゴリに分けることにより、進捗状況を判定する。
The first
第2文書処理部130は、固有表現特徴量抽出部131、学習推論部132、及び関連語表生成部133を有して構成される。固有表現特徴量抽出部131は、第2文書情報113の文書に形態素解析を実行して固有表現及び特徴量を抽出するとともに、抽出した固有表現をカテゴリに分類する。学習推論部132は、機械学習モデルによる推論モデルの学習を行う。関連語表生成部133は、上記推論モデルにより、固有表現特徴量抽出部131によって抽出された固有表現の中から、関連する固有表現をまとめた第2関連語表118を生成する。
The second
アイテム処理部140は、適合度算出部141、アイテム推薦部、及びアイテム出力部を有して構成される。適合度算出部141は、第1関連語表116、第2関連語表118、及びレコメンド履歴情報115に基づいて、第1文書情報111に含まれる指定の文書と、第2関連語情報114に含まれるアイテムの適合度とを算出する。アイテム推薦部142は、上記アイテムの適合度に基づいて、推薦するアイテムを選択し、アイテム出力部143にてユーザに選択したアイテムを提案することで、アイテム推薦を実現する。また、アイテム処理部140は、提案したアイテムに対するユーザの利用履歴(検索回数や参考になったボタンを押した回数など)を取得し、レコメンド履歴情報115を更新する。
The
図2は、文書情報抽出装置1の実現に用いる情報処理装置10のハードウェア構成例を示すブロック図である。
Figure 2 is a block diagram showing an example of the hardware configuration of an
図2に例示した情報処理装置10は、プロセッサ11、主記憶装置12、補助記憶装置13、入力装置14、出力装置15、及び通信装置16を備える。なお、文書情報抽出装置1の実現に用いられる情報処理装置10は、その全部または一部が、例えば、クラウドシステムによって提供される仮想サーバのように、仮想化技術やプロセス空間分離技術等を用いて提供される仮想的な情報処理資源を用いて実現されるものであってもよい。また、情報処理装置10によって提供される機能の全部または一部は、例えば、クラウドシステムがAPI(Application Programming Interface)等を介して提供するサービスによって実現されてもよい。また、文書情報抽出装置1は、通信可能に接続された複数の情報処理装置10を用いて構成されてもよい。
The
図2において、プロセッサ11は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)、AI(Artificial Intelligence)チップ等を用いて構成される。
In FIG. 2, the
主記憶装置12は、プログラムやデータを記憶する装置であり、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、不揮発性メモリ(NVRAM(Non Volatile RAM))等である。
The
補助記憶装置13は、例えば、ハードディスクドライブ、SSD(Solid State Drive)、光学式記憶装置(CD(Compact Disc)、DVD(Digital Versatile Disc)等)、ストレージシステム、ICカード、SDカードや光学式記録媒体等の記録媒体の読取/書込装置、クラウドサーバの記憶領域等である。補助記憶装置13には、記録媒体の読取装置や通信装置16を介して、プログラムやデータを読み込むことができる。補助記憶装置13に格納(記憶)されているプログラムやデータは、主記憶装置12に随時読み込まれる。
The
入力装置14は、外部からの入力を受け付けるインタフェースであり、例えば、キーボード、マウス、タッチパネル、カードリーダ、ペン入力方式のタブレット、音声入力装置等である。
The
出力装置15は、処理経過や処理結果等の各種情報を出力するインタフェースである。出力装置15は、例えば、上記の各種情報を可視化する表示装置(液晶モニタ、LCD(Liquid Crystal Display)、グラフィックカード等)、上記の各種情報を音声化する装置(音声出力装置(スピーカ等))、上記の各種情報を文字化する装置(印字装置等)である。別例として、情報処理装置10が通信装置16を介して他の装置との間で情報の入力や出力を行う構成としてもよい。
The
なお、入力装置14及び出力装置15は、ユーザとの間で情報の受付や提示を行うユーザインタフェースを構成する。
The
通信装置16は、他の装置との間の通信を実現する装置である。通信装置16は、通信ネットワーク(インターネット、LAN(Local Area Network)、WAN(Wide Area Network)、専用線、公衆通信網棟)を介した他の装置との間の通信を実現する、有線方式または無線方式の通信インタフェースであり、例えば、NIC(Network Interface Card)、無線通信モジュール、USBモジュール等である。
The
また、情報処理装置10には、例えば、オペレーティングシステム、ファイルシステム、DBMS(DataBase Management System)(リレーショナルデータベース、NoSQL等)、KVS(Key-Value Store)等が導入されていてもよい。
In addition, the
そして、文書情報抽出装置1が備える機能構成のうち、第1文書処理部120、第2文書処理部130、及びアイテム処理部140による機能は、図2に示した情報処理装置10において、プロセッサ11が、主記憶装置12に格納されているプログラムを読み出して実行することにより、もしくは、これらの装置を構成するハードウェア(FPGA、ASIC、AIチップ等)によって実現される。また、文書情報抽出装置1が備える機能構成のうち記憶部110による機能は、対象となる各種の情報(データ)を例えばデータベースのテーブルやファイルシステムが管理するファイルとして、主記憶装置12や補助記憶装置13(外部記憶装置でもよい)に記憶することによって実現される。
Among the functional components of the document
(2)各種情報
続いて、文書情報抽出装置1の記憶部110に記憶される各種情報について説明する。
(2) Various Information Next, various information stored in the
図3は、第1文書情報111の一例である。図3に例示した第1文書情報111は、企業の情報処理システムに蓄積された社内文書であって、同一の営業案件に対して異なる活動日に複数回の営業活動を行った事例に関する営業関連文書である。
Figure 3 is an example of the
図3に示すように、第1文書情報111は、対象とする営業案件(対象案件)ごとに、当該案件に関する情報(例えば、案件名、需要先、受注元、金額規模、案件概要等)を管理する情報である。図3の第1文書情報111には、それぞれの活動日における営業活動の記録である営業日報111a、111b,111cが1つのグループで管理されている。なお、以降の説明では、各営業日報111a~111cを第1文書情報111における最小単位の文書とするため、各営業日報111a~111cを第1文書情報111a~111cと表記することがある。第1文書処理部120は、これら第1文書情報111における最小単位の文書(第1文書情報111a~111c)から、所定の固有表現を抽出し、抽出した固有表現の中から関連する固有表現を組み合わせて第1関連語表116を生成(作成)する。
As shown in FIG. 3, the
図4は、第1関連語情報112に含まれる第1関連語表116のイメージを説明するための図である。前述したように、第1関連語表116は、第1文書処理部120によって生成(作成)される。より詳しく説明すると、まず、第1文書処理部120の固有表現特徴量抽出部121が、第1文書情報111の文書(第1文書情報111a~111c)から、所定の固有表現(具体的には例えば、「人手作業」、「作業員」、「作業時間」、「自動化」、「半導体製造」、「検討開始」、「深堀り」、「難航」、「齟齬」等)を抽出する。そして、第1文書処理部120の関連語表生成部123が、学習推論部122によって学習された推論モデルを用いて、上記抽出された固有表現の中から関連する固有表現をまとめることにより、第1関連語表116を生成する。
Figure 4 is a diagram for explaining an image of the first related word table 116 included in the first
上記のようにして生成された第1関連語表116は、対象とする第1文書情報111a~111cにおいて、類似の使い方をされる固有表現の組み合わせ(同義語関係)や、同一文内に頻繁に現れる固有表現の組み合わせ(共起語関係)などを総称した「関連語辞書」に相当する。図4に示したネットワークグラフ1161は、第1文書情報111aにおいて第1関連語表116(関連語辞書)に含まれる関連語をネットワークグラフ上に展開したものである。ネットワークグラフ1161によれば、第1文書情報111aに使用された固有表現の関連性が、視覚的に認識し易い形態で表される。
The first related word table 116 generated as described above corresponds to a "related word dictionary" which collectively refers to combinations of named entities that are used similarly (synonym relationships) and combinations of named entities that frequently appear in the same sentence (co-occurrence relationships) in the target
図5は、第1関連語情報112に含まれる進捗カテゴリ表117の一例である。図5に例示した進捗カテゴリ表117は、カテゴリ名1171、レコメンド優先ルール1172、及びキーワード1173の項目を有して構成される。上記各項目及びその内容は、第1文書情報111中の文書(第1文書情報111a~111c)をカテゴリ分類するために、予めユーザが任意の基準で設定する。
Figure 5 is an example of a progress category table 117 included in the first
例えば、カテゴリ名1171には、分類先となる各カテゴリの名称が設定され、図5の場合は「開始」、「順調」、「難航」、「深堀り」等のカテゴリ名が登録されている。なお、カテゴリの分類数や分類境界に制限はないが、第1文書情報111に含まれる前文書が、進捗カテゴリ表117において何れかのカテゴリ(カテゴリ名1171)に該当することを必要とする。
For example, the name of each category into which the document will be classified is set in
また、レコメンド優先ルール1172には、各カテゴリにおいて、どのような属性のアイテムを優先して推奨(レコメンド)するかというルールが指定される。図5にも示したように、各カテゴリに対応するレコメンド優先ルール1172は、1つに限定されることはなく、対応するカテゴリの特性を考慮して、任意の種類のルールを、任意の内容で設定することができる。
The
また、キーワード1173には、第1文書情報111(厳密には第1文書情報111a~111c)を進捗カテゴリ生成部124によって各カテゴリに自動分類できるようにするために、各カテゴリに対応する進捗情報を示唆する語句(キーワード)が設定される。前述したように、第1文書処理部120の進捗カテゴリ生成部124は、進捗カテゴリ表117に基づいて、第1文書情報111の各文書(第1文書情報111a~111c)の進捗状況を分類する。このとき、進捗カテゴリ生成部124は、第1文書情報111内の各文書においてキーワード1173に登録されているキーワードが含まれている場合に、当該文書を対応するカテゴリに自動分類する。なお、図5にも示したように、カテゴリごとに設定されるキーワードの数に制限はないが、複数のカテゴリに重複するキーワードを設定することは禁止される。
In addition, in the
図6は、第2文書情報113の一例である。図6に例示した第2文書情報113は、企業の情報処理システムに蓄積された社内文書であって、当該企業が販売(提供)する複数の製品について、製品ごとに詳細な内容を記述した製品カタログ文書である。各製品の製品カタログ文書として、図6には、第2文書情報113a,113bが例示されている。
Figure 6 is an example of
第2文書処理部130は、これら第2文書情報113における最小単位の文書(第2文書情報113a,113b)から、所定の固有表現を抽出し、抽出した固有表現の中から関連する固有表現を組み合わせて第2関連語表118を生成(作成)する。但し、第1文書処理部120が第1文書情報111から第1関連語表116を生成する手法とは異なる点として、第2文書処理部130による第2関連語表118の生成では、第2文書情報113a,113bのうちから進捗情報を取得する必要はない。
The second
図7は、第2関連語情報114に含まれる第2関連語表118のイメージを説明するための図である。前述したように、第2関連語表118は、第2文書処理部130によって生成(作成)される。より詳しく説明すると、まず、第2文書処理部130の固有表現特徴量抽出部131が、第2文書情報113の文書(第2文書情報113a,113b)から、所定の固有表現(具体的には例えば、「リモート化」、「センサー」、「稼働状態」、「無線通信」、「現場」、「リアルタイム」、「従業員」、「生産性」、「オフィス」等)を抽出する。そして、第2文書処理部130の関連語表生成部133が、学習推論部132によって学習された推論モデルを用いて、上記抽出された固有表現の中から関連する固有表現をまとめることにより、第2関連語表118を生成する。
7 is a diagram for explaining an image of the second related word table 118 included in the second
上記のようにして生成された第2関連語表118は、対象とする第2文書情報113a,113bにおいて、類似の使い方をされる固有表現の組み合わせ(同義語関係)や、同一文内に頻繁に現れる固有表現の組み合わせ(共起語関係)などを総称した「関連語辞書」に相当する。図7に示したネットワークグラフ1181は、第2文書情報113aにおいて第2関連語表118(関連語辞書)に含まれる関連語をネットワークグラフ上に展開したものである。ネットワークグラフ1181によれば、第2文書情報113aに使用された固有表現の関連性が、視覚的に認識し易い形態で表される。
The second related word table 118 generated as described above corresponds to a "related word dictionary" which collectively refers to combinations of named entities that are used similarly (synonym relationships) and combinations of named entities that frequently appear in the same sentence (co-occurrence relationships) in the target
(3)異種文書間の関連語連携
文書情報抽出装置1のアイテム処理部140は、入力情報である第1文書情報111と、出力情報の候補となる第2文書情報113との間で関連語句を連携させて、入力情報に含まれる進捗状況を考慮して、ユーザに提案する推奨情報の候補(レコメンド候補)を選出する。なお、本実施形態では、第1文書情報111と第2文書情報113とが異なる文書種である場合にも、文書間の関連語句を連携させることができる。以下では、この異種文書間の関連語の連携に基づくレコメンド候補の選出イメージについて説明する。
(3) Linking Related Words Between Different Documents The
図8は、異種文書間の関連語連携のイメージを説明するための図である。図8に示すネットワークグラフ210は、第1文書情報111a及び第2文書情報113aのそれぞれにおける関連語をネットワークグラフ化して、両者に共通する関連語(共通項)を接続して構成したものである。
Figure 8 is a diagram for explaining the concept of linking related words between different documents. The network graph 210 shown in Figure 8 is constructed by forming a network graph of related words in each of the
具体的には、図8に示すネットワークグラフ210のうち、主に左側に示されたネットワークグラフ211は、第1関連語表116に基づく第1文書情報111aの関連語を示すネットワークグラフであり(図4のネットワークグラフ1161と同様)、主に右側に示されたネットワークグラフ212は、第2関連語表118に基づく第2文書情報113aの関連語のネットワークグラフである(図7のネットワークグラフ1181と同様)。図8のネットワークグラフ210によれば、「働き方」及び「IoT」という語句が第1文書情報111a及び第2文書情報113aの双方に共通する関連語(共通項)であることから、これらの共通項でネットワークグラフ211とネットワークグラフ212とを接続することができる。
Specifically, in the network graph 210 shown in FIG. 8, the network graph 211 shown mainly on the left side is a network graph showing related words of the
このとき、第1文書情報111aの文中に含まれる「人手作業」という語句から、「人手作業-自動化-IoT-リモート化」という経路と「人手作業-作業員-働き方-作業効率-一括管理-リモート化」という経路の2通りの経路で「リモート化」という語句に到達することができる。この結果、アイテム処理部140は、「リモート化」という語句を文中に含む第2文書情報113aをレコメンド候補として選出することができる。このように、文書情報抽出装置1のアイテム処理部140は、異種文書である第1文書情報111aと第2文書情報113aとの間で、関連語の連携を行って、レコメンド候補を選出することができる。
At this time, the phrase "remote work" can be reached from the phrase "manual work" contained in the sentence of the
図9は、図8に示した異種文書間の関連語連携を表形式で説明する図である。図9に示された関連語連携表220は、「人手作業」から「リモート化」に到達する関連語の経緯について、図8で説明した「人手作業-自動化-IoT-リモート化」という第1の経路と「人手作業-作業員-働き方-作業効率-一括管理-リモート化」という第2の経路とを表にまとめたものである。図9によれば、第1の経路では、第1文書情報111aに記載されている「人手作業」から3単語の関連語で「リモート化」のレコメンド候補を選出することができる一方、第2の経路では、「人手作業」から「リモート化」のレコメンド候補を選出するために5単語の関連語が必要であることが分かる。
Figure 9 is a diagram explaining the related word linkage between the different documents shown in Figure 8 in the form of a table. The related word linkage table 220 shown in Figure 9 is a table summarizing the process of related words from "manual work" to "remote work" in the first route of "manual work - automation - IoT - remote work" explained in Figure 8 and the second route of "manual work - worker - work style - work efficiency - centralized management - remote work". According to Figure 9, it can be seen that in the first route, a recommendation candidate for "remote work" can be selected from "manual work" written in the
図10は、レコメンド候補算出表230の一例を示す図である。レコメンド候補算出表230は、異種文書間の関連語連携において、レコメンド候補を選出するまでに必要な関連語の数を距離を基準に表した表である。 Figure 10 is a diagram showing an example of a recommendation candidate calculation table 230. The recommendation candidate calculation table 230 is a table that shows the number of related words required to select a recommendation candidate in related word linkage between different documents, based on distance.
例えば図10のレコメンド候補算出表230は、第1文書情報111aを入力情報としたときに、第1文書情報111aに含まれる「人手作業」という語句に対して、第2文書情報113に含まれる複数の製品名231のレコメンド候補がどの程度の距離で何通り連携するか(接続個数232)と、さらに、その接続個数と距離とを掛け合わせた値の合計値(スコア233)とを表している。
For example, when the
ここで、一般には、入力情報に含まれる語句(例えば「人手作業」)とレコメンド候補に含まれる語句(例えば「リモート化」)との距離が近い(すなわち多くの関連語を必要としない)連携であるほど、当該レコメンド候補は入力情報との関連性が大きい製品であるといえる。一方、入力情報に含まれる語句とレコメンド候補に含まれる語句との距離が遠い(すなわち多くの関連語を必要とする)連携であるほど、当該レコメンド候補は一見して入力情報との関連性がない製品といえる。しかし、一見して関連性がなさそうなレコメンド候補であっても、多くの経路で接続(多くの接続個数で連携)されていれば、ユーザにレコメンド提案する価値が高く、意外性の大きい製品であるといえる。 Generally speaking, the closer the link between the words in the input information (e.g., "manual work") and the words in the recommendation candidate (e.g., "remote operation") (i.e., the less related words required), the more related the recommendation candidate is to the input information. On the other hand, the farther the link between the words in the input information and the words in the recommendation candidate (i.e., the more related words required), the more the recommendation candidate appears to be a product that is not related to the input information at first glance. However, even if a recommendation candidate appears to be unrelated at first glance, if it is connected through many routes (connected through a large number of connections), it is highly worth recommending to users and is a product that is highly unexpected.
上記の観点から、レコメンド候補算出表230では、接続個数と距離とを掛けた値の合計値をスコア233として計算することにより、関連性が小さい製品であっても、スコア233が大きければ、レコメンド提案する価値が高い意外性の高い製品であると判断することができる。例えば、図10のレコメンド候補算出表230の場合、最短で「距離#1」で接続可能な「省エネ」という製品は、関連性の大きいレコメンド候補と判断することができる。一方、最短で「距離#4」でしか接続できない「AI導入」という製品は、関連性が小さいレコメンド候補である。しかし、製品「AI導入」は、「距離#4」及び「距離#5」で接続可能であることから高いスコア値「9」を有するため、例えばスコア値「8」の製品「リモート化」よりも、意外性の大きなレコメンド価値の高い製品であると判断することができる。
From the above viewpoint, in the recommendation candidate calculation table 230, by calculating the total value of the product of the number of connections and the distance as the
以上に説明したように、本実施形態では、異種文書間の関連語連携であっても、レコメンド候補算出表230を用いて、異種文書間の関連語連携で接続できた個数と、接続までに要した単語間の距離とを考慮することにより、レコメンド候補のアイテムを選出する際に、関連性(もしくは意外性)に基づく優先順位を設定することができる。 As described above, in this embodiment, even in the case of related word linkage between different documents, the recommendation candidate calculation table 230 is used to take into consideration the number of items that can be connected through related word linkage between different documents and the distance between words required to connect them, making it possible to set priorities based on relevance (or unexpectedness) when selecting recommendation candidate items.
(4)レコメンド算出処理
ユーザがレコメンドしてほしいアイテムは、営業活動の進捗具合に応じて、時々刻々と変化する。そこで、以下では、本実施形態に係る文書情報抽出装置1が、営業活動の進捗に応じてレコメンドアイテムを提案するレコメンド算出処理について説明する。
(4) Recommendation Calculation Process The items that a user wants to be recommended change from moment to moment depending on the progress of sales activities. Therefore, hereinafter, a recommendation calculation process in which the document
本説明では、第1文書情報111に含まれる文書(第1文書情報111a~111c等)の何れかを入力情報とし、レコメンド算出処理の実行によって、第2文書情報113に含まれる各文書(例えば第2文書情報113a,113b等)のうちから、複数のレコメンド候補が優先度合いを付けて選出されることにより、好適なレコメンドアイテムがユーザに提案される。なお、以下の処理の開始時には、第1文書情報111(第1文書情報111aを含む)に基づく第1関連語情報112、及び第2文書情報113(第2文書情報113aを含む)に基づく第2関連語情報114が既に生成されているものとする。
In this description, one of the documents (such as the
図11は、レコメンド算出処理の処理手順例を示すフローチャートである。レコメンド算出処理はアイテム処理部140によって実行される。なお、レコメンド算出処理は、例えば、文書情報抽出装置1が、第1文書情報111からの情報抽出の実行を要求するユーザ操作を受け付けたときに開始される(以後、情報抽出元とされる第1文書情報111を、抽出対象の第1文書情報111と称する)。より具体的には、レコメンド算出処理は、図15に示す活動報告登録画面240のレコメンド実行確認ボタン245が押下されたときに、ステップS110の処理が実行され、図16に示すレコメンド確認画面250のレコメンド実行ボタン253が押下されたときに、ステップS120以降の処理が実行される。
FIG. 11 is a flowchart showing an example of the processing procedure of the recommendation calculation process. The recommendation calculation process is executed by the
図11によればまず、アイテム処理部140の適合度算出部141が、レコメンド候補算出表230を作成する(ステップS110)。レコメンド候補算出表230については図10で詳述した通りである。また、レコメンド候補算出表230は、後述する関連性優先指定処理で用いられるため、レコメンド候補算出表230を作成する処理は、図12に示す関連性優先指定処理のなか(例えばステップS112とステップS113の間)で実行されるとしてもよい。
According to FIG. 11, first, the
次に、適合度算出部141は、進捗カテゴリ表117及びレコメンド候補算出表230を用いて、入力情報とされる第1文書情報111(例えば営業日報)に対する関連性(もしくは意外性)に基づいてレコメンド候補とするアイテムを選別する関連性優先指定処理を実行する(ステップS120)。関連性優先指定処理の詳細な処理手順は、図12を参照しながら後述する。
Next, the
次に、適合度算出部141は、進捗カテゴリ表117及びレコメンド履歴情報115を用いて、アイテムのアクセス度合い(評価値)に基づいてレコメンド候補とするアイテムを選別する評価値優先指定処理を実行する(ステップS130)。評価値優先指定処理の詳細な処理手順は、図13を参照しながら後述する。
Next, the
次に、適合度算出部141は、進捗カテゴリ表117及びレコメンド履歴情報115を用いて、同一案件の営業活動においてレコメンド済みのアイテムであるか否かに基づいてレコメンド候補とするアイテムを選別する過去提案優先指定処理を実行する(ステップS140)。過去提案優先指定処理の詳細な処理手順は、図14を参照しながら後述する。
Next, the
なお、ステップS120~S140の各処理の実行順序は図11の例に限定されず、適宜入れ替えてもよい。 Note that the order in which steps S120 to S140 are executed is not limited to the example in FIG. 11 and may be changed as appropriate.
続いて、アイテム推薦部142が、ステップS120~S140の各優先指定処理の実行結果を踏まえて、レコメンドアイテムの優先順位を決定する(ステップS150)。詳しくは、ステップS150においてアイテム推薦部142は、ステップS120~S140の各優先指定処理で指定されたレコメンド候補の選出条件に基づいて、第2文書情報113に含まれる各アイテムを選別して優先順位を付し、優先順位が上位のアイテムから順に、図16で後述するレコメンド確認画面250のレコメンド結果欄254に表示可能なアイテム数の分だけを、ユーザに提案するレコメンド候補として決定する。
Then, the
次いで、アイテム出力部143が、ステップS150で決定された優先順位を反映する形態で、レコメンド確認画面250のレコメンド結果欄254にレコメンド候補(レコメンドアイテム)を表示し(ステップS160)、レコメンド算出処理が終了する。
Next, the
図12は、関連性優先指定処理の処理手順例を示すフローチャートである。前述したように、関連性優先指定処理は、図11のステップS120の処理であって、アイテム処理部140の適合度算出部141によって実行される。
Figure 12 is a flowchart showing an example of the processing procedure for the relatedness priority designation process. As described above, the relatedness priority designation process is the process of step S120 in Figure 11, and is executed by the
図12によればまず、適合度算出部141は、進捗カテゴリ表117の情報を参照し、抽出対象の第1文書情報111のカテゴリに対応するレコード(進捗カテゴリ情報)を取得する(ステップS121)。
According to FIG. 12, first, the
次に、適合度算出部141は、ステップS121で取得した進捗カテゴリ情報のレコメンド優先ルール1172において、抽出対象の第1文書情報111とレコメンドアイテムとの関連性(または意外性)に関する指定がなされているか否かを判定する(ステップS122)。具体的には、適合度算出部141は、対象のレコメンド優先ルール1172において、図5で例示された分類(A)について有意な指定内容が記載されている場合に、抽出対象の第1文書情報111とレコメンドアイテムとの関連性(または意外性)に関する指定がなされていると判定することができる。レコメンドアイテムとの関連性(または意外性)に関する指定がなされている場合は(ステップS122のYES)、ステップS123に進む。一方、レコメンドアイテムとの関連性(または意外性)に関する指定がなされていない場合は(ステップS122のNO)、関連性または意外性に基づくレコメンド候補の選出条件の指定を行うことなく、関連性優先指定処理を終了する。
Next, the
ステップS123では、適合度算出部141は、対象のレコメンド優先ルール1172に「関連性を優先する」と同義の内容の指定がされているか否かを判定する。
In step S123, the
ステップS123において「関連性を優先する」と同義の内容の指定がされている場合(ステップS123のYES)、適合度算出部141は、関連性の高いアイテムを優先してレコメンド候補にするという選出条件を指定し(ステップS124)、関連性優先指定処理を終了する。ステップS124の処理を詳しく説明すると、適合度算出部141は、例えば、レコメンド候補算出表230を参照し、レコメンド候補とされる複数のアイテム(例えば製品)に対して、関連性の高い(大きい)アイテムからフラグを付ける等して優先度を設定することにより、レコメンド候補の選出条件に関連性の高さを関連付けることができる。
If a specification equivalent to "prioritize relevance" is made in step S123 (YES in step S123), the
一方、ステップS123において「関連性を優先する」と同義の内容の指定がされていない場合、言い換えれば「意外性を優先する」と同義の内容の指定がされている場合には(ステップS123のNO)、適合度算出部141は、意外性の高いアイテムを優先してレコメンド候補にするという選出条件を指定し(ステップS125)、関連性優先指定処理を終了する。ステップS125の処理を詳しく説明すると、適合度算出部141は、例えば、レコメンド候補算出表230を参照し、レコメンド候補とされる複数のアイテム(例えば製品)に対して、意外性の高い(大きい)アイテムからフラグを付ける等して優先度を設定することにより、レコメンド候補の選出条件に意外性の高さを関連付けることができる。
On the other hand, if no content equivalent to "prioritize relevance" is specified in step S123, in other words if a content equivalent to "prioritize unexpectedness" is specified (NO in step S123), the
図13は、評価値優先指定処理の処理手順例を示すフローチャートである。前述したように、評価値優先指定処理は、図11のステップS130の処理であって、アイテム処理部140の適合度算出部141によって実行される。
Figure 13 is a flowchart showing an example of the processing procedure for the evaluation value priority designation process. As described above, the evaluation value priority designation process is the process of step S130 in Figure 11, and is executed by the
図13によればまず、適合度算出部141は、進捗カテゴリ表117の情報を参照し、抽出対象の第1文書情報111のカテゴリに対応するレコード(進捗カテゴリ情報)を取得する(ステップS131)。次に、適合度算出部141は、レコメンド履歴情報115を取得する(ステップS132)。
According to FIG. 13, first, the
次に、適合度算出部141は、ステップS131で取得した進捗カテゴリ情報のレコメンド優先ルール1172において、レコメンドアイテムの評価値に関する指定がなされているか否かを判定する(ステップS133)。具体的には、適合度算出部141は、対象のレコメンド優先ルール1172において、図5で例示された分類(B)について有意な指定内容が記載されている場合に、レコメンドアイテムの評価値に関する指定がなされていると判定することができる。レコメンドアイテムの評価値に関する指定がなされている場合は(ステップS133のYES)、ステップS134に進む。一方、レコメンドアイテムの評価値に関する指定がなされていない場合は(ステップS133のNO)、評価値に基づくレコメンド候補の選出条件の指定を行うことなく、評価値優先指定処理を終了する。
Next, the
ステップS134では、適合度算出部141は、対象のレコメンド優先ルール1172に「高評価を優先する」と同義の内容の指定がされているか否かを判定する。
In step S134, the
ステップS134において「高評価を優先する」と同義の内容の指定がされている場合(ステップS134のYES)、適合度算出部141は、レコメンド履歴情報115に含まれるアイテムごとの評価値に基づいて、評価値の高いアイテムを優先してレコメンド候補にするという選出条件を指定し(ステップS135)、評価値優先指定処理を終了する。ここで、レコメンド履歴情報115に含まれるアイテムの評価値は、当該アイテムのレコメンド状況によって変化する値であって、具体的には例えば、当該アイテムがユーザによって検索された回数や、過去に当該アイテムがレコメンドされた際にユーザから「参考になった」旨のボタンが押下された回数等に基づいて決定される。すなわち、評価値が高いアイテムは、推奨された場合に有用な(評価が高い)アイテムであることを意味する。したがって、ステップS135において適合度算出部141は、例えば、レコメンド履歴情報115を参照し、レコメンド候補とされる複数のアイテム(例えば製品)に対して、評価値の高いアイテムからフラグを付ける等して優先度を設定することにより、レコメンド候補の選出条件に評価値の高さを関連付けることができる。
If a content equivalent to "give priority to high ratings" is specified in step S134 (YES in step S134), the
一方、ステップS134において「高評価を優先する」と同義の内容の指定がされていない場合、言い換えれば「低評価を優先する」と同義の内容の指定がされている場合には(ステップS134のNO)、適合度算出部141は、評価値の低いアイテムを優先してレコメンド候補にするという選出条件を指定し(ステップS136)、評価値優先指定処理を終了する。ステップS136のより具体的な処理については、ステップS135とは逆の基準で優先度を設定すればよいことから、詳細な説明を省略する。
On the other hand, if no specification equivalent to "give priority to high ratings" has been made in step S134, in other words, if a specification equivalent to "give priority to low ratings" has been made (NO in step S134), the
図14は、過去提案優先指定処理の処理手順例を示すフローチャートである。前述したように、過去提案優先指定処理は、図11のステップS140の処理であって、アイテム処理部140の適合度算出部141によって実行される。
Figure 14 is a flowchart showing an example of the processing procedure for the past proposal priority designation process. As described above, the past proposal priority designation process is the process of step S140 in Figure 11, and is executed by the
図14によればまず、適合度算出部141は、進捗カテゴリ表117の情報を参照し、抽出対象の第1文書情報111のカテゴリに対応するレコード(進捗カテゴリ情報)を取得する(ステップS141)。次に、適合度算出部141は、レコメンド履歴情報115を取得する(ステップS142)。
According to FIG. 14, first, the
次に、適合度算出部141は、ステップS141で取得した進捗カテゴリ情報のレコメンド優先ルール1172において、レコメンドアイテムの過去提案に関する指定がなされているか否かを判定する(ステップS143)。具体的には、適合度算出部141は、対象のレコメンド優先ルール1172において、図5で例示された分類(C)について有意な指定内容が記載されている場合に、レコメンドアイテムの過去提案に関する指定がなされていると判定することができる。レコメンドアイテムの過去提案に関する指定がなされている場合は(ステップS143のYES)、ステップS144に進む。一方、レコメンドアイテムの過去提案に関する指定がなされていない場合は(ステップS143のNO)、過去提案に基づくレコメンド候補の選出条件の指定を行うことなく、過去提案優先指定処理を終了する。
Next, the
ステップS144では、適合度算出部141は、対象のレコメンド優先ルール1172に「未提案のアイテムを優先する」と同義の内容の指定がされているか否かを判定する。
In step S144, the
ステップS144において「未提案のアイテムを優先する」と同義の内容の指定がされている場合(ステップS144のYES)、適合度算出部141は、レコメンド履歴情報115に含まれるレコメンド提案履歴を参照し、本案件に関するレコメンド提案履歴に記録されていない未提案のアイテムを優先してレコメンド候補にするという選出条件を指定し(ステップS145)、過去提案優先指定処理を終了する。ここで、レコメンド履歴情報115に含まれるレコメンド提案履歴は、案件ごとに以前の営業活動で提案したアイテム(レコメンドアイテム)の履歴が蓄積された情報である。すなわち、本案件のレコメンド提案履歴に記録されていないアイテムは、本案件の過去の営業活動で提案されたことがない未提案のアイテムであることを意味する。したがって、ステップS145において適合度算出部141は、例えば、レコメンド履歴情報115に含まれる本案件のレコメンド提案履歴に記録されていないアイテムにフラグを付ける等して優先度を設定することにより、レコメンド候補の選出条件に過去提案の有無を関連付けることができる。
If a specification equivalent to "give priority to unproposed items" is made in step S144 (YES in step S144), the
一方、ステップS144において「未提案のアイテムを優先する」と同義の内容の指定がされていない場合、例えば「提案済みのアイテムを優先する」と同義の内容の指定がされている場合には(ステップS144のNO)、適合度算出部141は、レコメンド履歴情報115に含まれるレコメンド提案履歴を参照し、本案件に関するレコメンド提案履歴に記録されている提案済みのアイテムを優先してレコメンド候補にするという選出条件を指定し(ステップS146)、評価値優先指定処理を終了する。ステップS146のより具体的な処理については、ステップS145とは逆の基準で優先度を設定すればよいことから、詳細な説明を省略する。
On the other hand, if a specification equivalent to "give priority to unproposed items" is not made in step S144, for example, if a specification equivalent to "give priority to proposed items" is made (NO in step S144), the
(5)出力画面例
以下では、本実施形態に係る文書情報抽出装置1において、営業日報を登録したり、登録した営業日報に対するレコメンドアイテムの選定を実行したりする際に表示される出力画面について、具体例を挙げて説明する。
(5) Example of Output Screen In the following, a specific example of the output screen that is displayed when registering a daily sales report or selecting recommended items for the registered daily sales report in the document
図15は、活動報告登録画面240の一例である。活動報告登録画面240は、入力情報となる営業日報をユーザが第1文書情報111に登録する際に、出力装置15を介してユーザに提示される画面の一例であって、例えば入力装置14を介してユーザから操作可能なGUI(Graphical User Interface)で実現される。
Figure 15 is an example of an activity report registration screen 240. The activity report registration screen 240 is an example of a screen presented to the user via the
図15に示したように、活動報告登録画面240は、営業活動の案件名を選択可能な選択欄241、営業日報を文書情報抽出装置1にアップロードするためのアップロードボタン242、案件を登録するための案件登録ボタン243、選択欄241で選択された案件における営業活動の一覧情報を表示する活動一覧情報欄244、及び、レコメンドアイテムの選出を実行するためのレコメンド実行確認ボタン245、を含んで構成される。
As shown in FIG. 15, the activity report registration screen 240 includes a selection field 241 in which the name of the sales activity case can be selected, an upload button 242 for uploading the daily sales report to the document
活動報告登録画面240では、まず、選択欄241において、登録したい営業日報が属する営業活動の案件をユーザが選択することにより、選択した案件における営業活動の一覧情報が活動一覧情報欄244に表示される。図15の例では、「XX製鉄〇×工場のスマート化」という案件が選択されている。 On the activity report registration screen 240, the user first selects in the selection field 241 the sales activity case to which the daily sales report to be registered belongs, and a list of sales activities for the selected case is displayed in the activity list information field 244. In the example of FIG. 15, the case "Smartification of XX Steel's XX Factory" has been selected.
次に、アップロードボタン242が押下されると、例えばファイル選択画面が表示され、ユーザが予め記入しておいた営業日報がアップロードの対象として選択可能となり、ファイル選択画面で所望の営業日報のファイルを選択する操作が行われることによって、当該営業日報が文書情報抽出装置1にアップロードされる。
Next, when the upload button 242 is pressed, for example, a file selection screen is displayed, and the daily sales report that the user has entered in advance can be selected as the item to be uploaded. By selecting the desired daily sales report file on the file selection screen, the daily sales report is uploaded to the document
そして、案件登録ボタン243が押下されると、アップロードされた営業日報が、選択中の案件の活動報告書として第1文書情報111に登録される。図15の例では、「XX製鉄案件6」というタイトルの営業日報が「XX製鉄〇×工場のスマート化」という案件に登録される。
When the case registration button 243 is pressed, the uploaded daily sales report is registered in the
前述したように、活動一覧情報欄244には、選択欄241で選択した案件における営業活動の一覧情報が表示されている。活動一覧情報欄244内の「活動履歴」欄には、当該案件に登録済みの営業日報に関する情報が表示されており、何れかの営業日報をユーザが選択することができる。図15の例では、タイトル「XX製鉄案件6」の営業日報が選択されている。 As described above, the activity list information field 244 displays a list of sales activities for the case selected in the selection field 241. The "Activity History" field in the activity list information field 244 displays information about the sales daily reports registered for the case, and the user can select one of the sales daily reports. In the example of Figure 15, the sales daily report with the title "XX Steelworks Case 6" has been selected.
そして、活動一覧情報欄244で何れかの営業日報が選択された状態でレコメンド実行確認ボタン245が押下されると、選択中の営業日報を入力情報として、アイテム処理部140が呼び出される。このとき、呼び出されたアイテム処理部140(アイテム出力部143)は、前述したレコメンド算出処理を行って入力情報とされた営業日報から最適なレコメンドを出力するための確認用画面として、レコメンド確認画面250を出力装置15に表示する。図15の例でレコメンド実行確認ボタン245が押下された場合には、タイトル「XX製鉄案件6」の営業日報に対するレコメンド実行について、レコメンド確認画面250が表示される。
When the recommendation execution confirmation button 245 is pressed with any of the daily sales reports selected in the activity list information field 244, the
図16は、レコメンド確認画面250の一例である。レコメンド確認画面250は、図15に例示した活動報告登録画面240においてレコメンド実行確認ボタン245が押下された場合に、出力装置15を介してユーザに提示される画面の一例であって、例えば入力装置14を介してユーザから操作可能なGUI(Graphical User Interface)で実現される。
Figure 16 is an example of a recommendation confirmation screen 250. The recommendation confirmation screen 250 is an example of a screen presented to the user via the
図16に示したように、レコメンド確認画面250は、選択中の営業日報のレコメンドに関する情報を表示する情報欄251、レコメンド優先ルールを手動で切り換えるためのルール変更ボタン252、レコメンド算出処理を実行させるためのレコメンド実行ボタン253、レコメンド結果を表示するレコメンド結果欄254、及びレコメンド結果欄254に表示されたレコメンドアイテムのうち、ユーザが気に入った(または気になった)アイテムを選択するためのレコメンドアイテム選択ボタン255、を含んで構成される。 As shown in FIG. 16, the recommendation confirmation screen 250 includes an information field 251 that displays information about the recommendations for the selected daily sales report, a rule change button 252 for manually switching the recommendation priority rules, a recommendation execution button 253 for executing the recommendation calculation process, a recommendation result field 254 that displays the recommendation results, and a recommendation item selection button 255 for selecting an item that the user likes (or is interested in) from among the recommended items displayed in the recommendation result field 254.
レコメンド確認画面250において、情報欄251には、選択中の営業日報に対して適合度算出部141が進捗カテゴリ表117を参照して文書解析を行った結果が自動表示される。具体的には、情報欄251には、選択中の営業日報のタイトル「XX製鉄案件6」、当該営業日報が該当する「難航」の進捗カテゴリ(図5のカテゴリ名1171参照)、及び当該進捗カテゴリに対応するレコメンド優先ルール(図5のレコメンド優先ルール1172参照)が表示される。
In the recommendation confirmation screen 250, the information field 251 automatically displays the results of the
また、ルール変更ボタン252は、進捗カテゴリの自動分類に応じて情報欄251に表示されたレコメンド優先ルールを、ユーザの希望に応じて手動で変更するために用意されており、「変更」と表示されたルール変更ボタン252が押下された場合には、進捗カテゴリに対応して規定されたレコメンド優先ルールを、ユーザが任意のレコメンド優先ルールに変更する操作を行うことができる。また、レコメンド優先ルールが一旦変更された後は、ルール変更ボタン252は、例えば図16に示したように「戻る」という表示が行われ、この「戻る」と表示されたルール変更ボタン252が押下された場合には、規定のレコメンド優先ルールに戻す等の処理が行われるとしてもよい。 The rule change button 252 is provided to manually change the recommendation priority rule displayed in the information column 251 according to the automatic classification of the progress category according to the user's wishes, and when the rule change button 252 displaying "Change" is pressed, the user can perform an operation to change the recommendation priority rule defined corresponding to the progress category to a recommendation priority rule of his/her choice. After the recommendation priority rule has been changed once, the rule change button 252 may display "Back" as shown in FIG. 16, for example, and when the rule change button 252 displaying "Back" is pressed, a process such as returning to the defined recommendation priority rule may be performed.
そして、レコメンド実行ボタン253が押下されると、情報欄251に表示されたレコメンド優先ルールに基づいて、アイテム処理部140(適合度算出部141、アイテム推薦部142、アイテム出力部143)によってレコメンド算出処理が実行され、上記レコメンド優先ルールに準拠して選出されたレコメンドアイテムがレコメンド結果欄254に表示される。なお、アイテム処理部140は、レコメンド結果欄254に表示された複数のレコメンドアイテムのそれぞれについて、レコメンド履歴情報115に含まれるレコメンド提案履歴を更新する。
When the recommendation execution button 253 is pressed, the item processing unit 140 (
図16のレコメンド結果欄254には、情報欄251に表示されたレコメンド優先ルールに準拠したレコメンド優先順位に従って選出された複数のレコメンドアイテム(本例では製品名)がグラフ表示によって可視化されている。より詳細には、グラフの縦軸には、レコメンド優先度が上位のアイテムが「オススメ度」の高さによって可視化され、グラフの横軸には、選択中の営業日報(入力情報)の文書との関連性が大きいアイテム(もしくは意外性の大きいアイテム)が、関連性(もしくは意外性)の度合いの大きさ順に並べて表示される。 In the recommendation result column 254 of FIG. 16, multiple recommended items (product names in this example) selected according to the recommendation priority order that complies with the recommendation priority rules displayed in the information column 251 are visualized in a graph. In more detail, the vertical axis of the graph visualizes items with higher recommendation priority according to their "recommended level," and the horizontal axis of the graph displays items that are highly related to the selected daily sales report (input information) document (or items that are highly unexpected) in order of the degree of relatedness (or unexpectedness).
図16の場合、選択された「XX製鉄案件6」の営業日報が該当する進捗カテゴリは「難航」であり、一般には意外性の大きい製品の提案が有効と考えられる。ここで、レコメンド結果欄254に表示された最も意外性の大きいアイテムは「働き方改革製品」であるが、その「オススメ度」は上位2番目に留まっている。一方、「リモート化製品」は、意外性の大きさは3番目であるものの、最も高い「オススメ度」を示すアイテムとなっており、総合的には最も有効なレコメンドアイテムであることが示される。なお、「リモート化製品」の「オススメ度」が高くなった理由としては、「(B)履歴情報の利用方法」のレコメンド優先ルールで設定された「高評価アイテム優先」に基づく影響が大きいと考えられる。また、上述した「働き方改革製品」は、次点の「オススメ度」であることから、このアイテムも有効なレコメンドアイテムと考えてよい。 In the case of FIG. 16, the progress category to which the selected daily sales report of "XX Steel Project 6" corresponds is "Difficult", and generally, it is considered effective to propose a product that is highly unexpected. Here, the most unexpected item displayed in the recommendation result column 254 is "Work Style Reform Product", but its "Recommendation Level" is only in the top two. On the other hand, "Remote Product" is the third most unexpected item, but is the item with the highest "Recommendation Level", and is shown to be the most effective recommended item overall. The reason why the "Recommendation Level" of "Remote Product" is high is thought to be largely due to the influence of "Highly Rated Item Priority" set in the recommendation priority rule of "(B) How to Use History Information". In addition, since the above-mentioned "Work Style Reform Product" has the second highest "Recommendation Level", this item can also be considered to be an effective recommended item.
また、レコメンド結果欄254に表示された各レコメンドアイテムに設けられたレコメンドアイテム選択ボタン255は、対応アイテムをユーザが気に入った(または気になった)場合に押下されることにより、対象アイテムに対する評価値の向上に寄与する。具体的には例えば、レコメンドアイテム選択ボタン255が押下されるごとに、アイテム処理部140が、レコメンド履歴情報115に含まれる対象アイテムの評価値を所定ポイントだけ上乗せしたり、レコメンドアイテム選択ボタン255が押下されると、「参考になった」旨のボタンが表示される別のウインドウを展開し、「参考になった」旨のボタンが押下されたときに、アイテム処理部140が、レコメンド履歴情報115に含まれる対象アイテムの評価値を所定ポイントだけ上乗せしたりすることができる。また例えば、レコメンドアイテム選択ボタン255が押下された場合には、対象のレコメンドアイテムの詳細情報を表示するようにして、その表示期間(閲覧時間)の長さに応じて、アイテム処理部140が、レコメンド履歴情報115に含まれる対象アイテムの評価値を上乗せする等してもよい。また、レコメンド履歴情報115に含まれる各アイテムの評価値は、常に増加するだけに限定されず、例えば表示履歴が追加されても閲覧されなかった場合には減点する等の減少処理を行うようにしてもよい。
In addition, the recommended item selection button 255 provided for each recommended item displayed in the recommendation result column 254 is pressed when the user likes (or is interested in) the corresponding item, thereby contributing to an improvement in the evaluation value of the target item. Specifically, for example, each time the recommended item selection button 255 is pressed, the
何れにしても、アイテム処理部140は、レコメンドアイテム選択ボタン255に対するユーザ操作に基づいて、レコメンド履歴情報115に含まれる各アイテムの評価値を変化・更新することにより、以降に実行されるレコメンド算出処理において、評価値優先指定処理(図11のステップS130、図13参照)によるレコメンド候補の選出条件の指定に最新の評価値を反映させることができる。その結果、文書情報抽出装置1は、ユーザの好みや選択傾向を反映した評価値を条件に加えて、より好適な推奨情報を抽出することができる。
In any case, the
以上に説明したように、本実施形態に係る文書情報抽出装置1によれば、用途や記載内容が異なる2種以上の文書(第1文書情報111、第2文書情報113)間で、関連語抽出技術により情報連携を可能にする。そして、時系列で入力される入力文書(第1文書情報111)から営業活動などの進捗情報が取得できる文書データの場合、入力文書における活動の進捗に応じた最適なレコメンドアイテムを提案可能となる。
As described above, the document
また、入力文書である第1文書情報111と、レコメンド対象である第2文書情報113が、表記内容や用途が全く異なる異種文書であっても、本実施形態に係る文書情報抽出装置1によれば、関連語抽出技術により情報連携が可能になることから、入力情報に含まれる進捗状況を考慮して、好適な推奨情報(レコメンドアイテム)を抽出し、提案することが可能となる。具体的には例えば、営業担当者が作成した営業報告書から営業活動の履歴や進捗を把握し、最適なアイテムを製品カタログ文書から容易に検索することが可能となる。
Even if the
以上、本発明の一実施形態について説明したが、本発明は上記の実施形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。例えば、上記の実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、上記実施形態の構成の一部について、他の構成の追加や削除、置換をすることが可能である。具体的には例えば、上記の実施形態では、ユーザに推奨されるレコメンドアイテムの候補情報を含む第2文書情報113について、製品カタログ文書を例に挙げて説明したが、本発明の第2文書情報113は製品カタログ文書に限定されるものではなく、例えば、ナレッジ、特許、論文等、文書形式の様々な文書にも適用可能である。
Although one embodiment of the present invention has been described above, the present invention is not limited to the above embodiment, and it goes without saying that various modifications can be made without departing from the gist of the present invention. For example, the above embodiment has been described in detail to clearly explain the present invention, and is not necessarily limited to having all of the configurations described. In addition, it is possible to add, delete, or replace some of the configurations of the above embodiment with other configurations. Specifically, for example, in the above embodiment, the
また、上記の各構成、機能部、処理部、処理手段等は、それらの一部または全部を、例えば、集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記録装置、ICカード、SDカード、DVD等の記録媒体に置くことができる。 Furthermore, the above-mentioned configurations, functional units, processing units, processing means, etc. may be realized in part or in whole in hardware, for example by designing them as integrated circuits. Furthermore, the above-mentioned configurations, functions, etc. may be realized in software by a processor interpreting and executing a program that realizes each function. Information on the programs, tables, files, etc. that realize each function can be stored in a memory, a hard disk, a recording device such as an SSD (Solid State Drive), an IC card, an SD card, a DVD, or other recording media.
また、以上に説明した各情報処理装置の各種機能部、各種処理部、各種データベースの配置形態は一例に過ぎない。各種機能部、各種処理部、各種データベースの配置形態は、これらの装置が備えるハードウェアやソフトウェアの性能、処理効率、通信効率等の観点から最適な配置形態に変更し得る。 Furthermore, the layout of the various functional units, various processing units, and various databases of each information processing device described above is merely an example. The layout of the various functional units, various processing units, and various databases can be changed to an optimal layout in terms of the performance, processing efficiency, communication efficiency, etc. of the hardware and software equipped in these devices.
また、前述した各種のデータを格納するデータベースの構成(スキーマ(Schema)等)は、リソースの効率的な利用、処理効率向上、アクセス効率向上、検索効率向上等の観点から柔軟に変更し得る。 In addition, the configuration (schema, etc.) of the database that stores the various types of data mentioned above can be flexibly changed from the perspective of efficient use of resources, improved processing efficiency, improved access efficiency, improved search efficiency, etc.
また、図面において制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実施には殆ど全ての構成が相互に接続されていると考えてもよい。 In addition, the control lines and information lines shown in the drawings are those that are considered necessary for explanation, and not all control lines and information lines on the product are necessarily shown. In implementation, it can be assumed that almost all components are interconnected.
1 文書情報抽出装置
10 情報処理装置
11 プロセッサ
12 主記憶装置
13 補助記憶装置
14 入力装置
15 出力装置
16 通信装置
110 記憶部
111 第1文書情報
112 第1関連語情報
113 第2文書情報
114 第2関連語情報
115 レコメンド履歴情報
116 第1関連語表
117 進捗カテゴリ表
118 第2関連語表
120 第1文書処理部
121 固有表現特徴量抽出部
122 学習推論部
123 関連語表生成部
124 進捗カテゴリ生成部
130 第2文書処理部
131 固有表現特徴量抽出部
132 学習推論部
133 関連語表生成部
140 アイテム処理部
141 適合度算出部
142 アイテム推薦部
143 アイテム出力部
210 ネットワークグラフ
220 関連語連携表
230 レコメンド候補算出表
240 活動報告登録画面
250 レコメンド確認画面
1 Document
Claims (12)
前記活動記録が登録された第1文書情報と、前記第1文書情報とは異なる文書種で構成されており、前記推奨アイテムの候補に関する文書データが登録された第2文書情報と、を格納する記憶部と、
前記第1文書情報の前記活動記録に含まれる、進捗状況を示唆するキーワードに基づいて、前記活動記録の進捗状況を、複数段階の進捗カテゴリの何れかに分類する進捗判定部と、
前記第1文書情報から関連する固有表現を構成する第1関連語を抽出し、当該抽出した第1関連語をまとめた第1関連語情報を生成する第1文書処理部と、
前記第2文書情報から関連する固有表現を構成する第2関連語を抽出し、当該抽出した第2関連語をまとめた第2関連語情報を生成する第2文書処理部と、
前記進捗判定部によって分類された前記進捗カテゴリに応じた推奨アイテムの選出条件と、共通する関連語で前記第1関連語情報と前記第2関連語情報とを接続することによって前記第1文書情報と前記第2文書情報とを連携した関連語連携の結果とに基づいて、前記第1文書情報の前記活動記録に含まれる第1関連語に直接的又は間接的に接続された第2関連語を有する推奨アイテムを前記推奨アイテムの候補の中から選出して出力するアイテム処理部と、
を備えることを特徴とする文書情報抽出装置。 A document information extraction device that proposes recommended items by performing document analysis on activity records that are recorded in chronological order for the same case,
a storage unit that stores first document information in which the activity record is registered, and second document information that is configured in a document type different from that of the first document information and in which document data related to the candidate recommended items is registered;
a progress determination unit that classifies the progress status of the activity record into one of a plurality of progress categories based on a keyword that indicates a progress status and is included in the activity record of the first document information;
a first document processing unit that extracts first related terms constituting related named entities from the first document information and generates first related term information that compiles the extracted first related terms;
a second document processing unit that extracts second related terms constituting related named entities from the second document information and generates second related term information that compiles the extracted second related terms;
an item processing unit that selects and outputs, from among the recommended item candidates, a recommended item having a second related word that is directly or indirectly connected to a first related word included in the activity record of the first document information, based on a selection condition for a recommended item according to the progress category classified by the progress determination unit and a result of related word linkage in which the first document information and the second document information are linked by connecting the first related word information and the second related word information with a common related word;
A document information extraction device comprising:
前記進捗判定部は、前記第1文書情報に含まれる各前記活動記録から前記キーワードを抽出し、当該抽出したキーワードに基づいて、各前記活動記録の進捗状況を前記複数段階の進捗カテゴリの何れかに分類する
ことを特徴とする請求項1に記載の文書情報抽出装置。 a predetermined keyword corresponding to each of a plurality of progress categories representing the progress status is determined in advance;
The document information extraction device according to claim 1, characterized in that the progress determination unit extracts the keywords from each of the activity records included in the first document information, and classifies the progress status of each of the activity records into one of the multiple progress categories based on the extracted keywords.
前記アイテム処理部は、前記進捗判定部によって分類された前記進捗カテゴリに対応する前記優先ルールに応じた選出条件を指定し、前記推奨アイテムの候補から前記推奨アイテムを選出する
ことを特徴とする請求項2に記載の文書情報抽出装置。 a predetermined priority rule is prepared in advance, which specifies what attributes of the recommended items should be preferentially recommended for each of the multiple stages of progress categories;
The document information extraction device according to claim 2 , wherein the item processing unit specifies a selection condition according to the priority rule corresponding to the progress category classified by the progress determination unit, and selects the recommended item from the candidate recommended items.
ことを特徴とする請求項3に記載の文書情報抽出装置。 The document information extraction device according to claim 3, characterized in that the priority rules can be changed in response to a user operation, and when the user operation is performed, the item processing unit specifies selection conditions in accordance with the changed priority rules and selects the recommended items from the candidate recommended items.
前記優先ルールに前記関連性優先指定が含まれる場合、前記アイテム処理部は、
前記活動記録に含まれる前記第1関連語と前記第2文書情報に含まれる前記第2関連語との、前記関連語連携における距離に基づいて、当該第2関連語を有する前記推奨アイテムの候補の前記関連性を判断し、
前記判断の結果に基づいて、前記選出における前記推奨アイテムの各候補の優先度を設定する
ことを特徴とする請求項3に記載の文書情報抽出装置。 The priority rule may include a relevance priority designation that specifies that the relevance to the activity record is reflected in the selection conditions of the recommended items,
When the priority rule includes the relevance priority designation, the item processing unit:
determining the relevance of the recommended item candidate having the second related term based on a distance in the related term linkage between the first related term included in the activity record and the second related term included in the second document information;
The document information extraction device according to claim 3 , further comprising: setting a priority of each of the candidates for the recommended items in the selection based on a result of the judgment.
前記優先ルールに前記意外性優先指定が含まれる場合、前記アイテム処理部は、
前記活動記録に含まれる前記第1関連語と前記第2文書情報に含まれる前記第2関連語との、前記関連語連携における距離及び接続数に基づいて、当該第2関連語を有する前記推奨アイテムの候補の前記意外性を判断し、
前記判断の結果に基づいて、前記選出における前記推奨アイテムの各候補の優先度を設定する
ことを特徴とする請求項3に記載の文書情報抽出装置。 The priority rule may include a surprise priority designation that designates that the surprise of the activity record is reflected in the selection conditions of the recommended items,
When the priority rule includes the unexpectedness priority designation, the item processing unit:
determining the unexpectedness of the recommended item candidate having the second related term based on a distance and a number of connections in the related term linkage between the first related term included in the activity record and the second related term included in the second document information;
The document information extraction device according to claim 3 , further comprising: setting a priority of each of the candidates for the recommended items in the selection based on a result of the judgment.
前記優先ルールには、前記案件における出力履歴の有無を当該案件における前記推奨アイテムの選出条件に反映することを指定する過去提案優先指定を含めることができ、
前記優先ルールに前記過去提案優先指定が含まれる場合、前記アイテム処理部は、前記レコメンド履歴情報における記録の有無に基づいて、前記選出における前記推奨アイテムの各候補の優先度を設定する
ことを特徴とする請求項3に記載の文書情報抽出装置。 The storage unit further stores recommendation history information in which information about the past recommended items of the job selected by the item processing unit is recorded,
The priority rule may include a past proposal priority specification that specifies that the presence or absence of an output history of the item is reflected in the selection conditions of the recommended items for the item,
The document information extraction device according to claim 3, characterized in that, when the priority rule includes the past proposal priority designation, the item processing unit sets a priority of each candidate of the recommended items in the selection based on whether or not it is recorded in the recommendation history information.
前記優先ルールには、前記評価値を前記推奨アイテムの選出条件に反映することを指定する評価値優先指定を含めることができ、
前記優先ルールに前記評価値優先指定が含まれる場合、前記アイテム処理部は、前記レコメンド履歴情報における前記評価値に基づいて、前記選出における前記推奨アイテムの各候補の優先度を設定する
ことを特徴とする請求項7に記載の文書情報抽出装置。 The recommendation history information holds an evaluation value calculated by a predetermined method based on a user's access results for each of the past recommended items of the case selected by the item processing unit, and
The priority rule may include an evaluation value priority specification that specifies that the evaluation value is to be reflected in a selection condition for the recommended item,
The document information extraction device according to claim 7, characterized in that, when the priority rule includes the evaluation value priority specification, the item processing unit sets a priority of each candidate of the recommended items in the selection based on the evaluation value in the recommendation history information.
前記活動記録を第1文書情報に登録する第1文書情報記憶ステップと、
前記推奨アイテムの候補に関する文書データを、前記第1文書情報とは異なる文書種で構成されている第2文書情報に登録する第2文書情報記憶ステップと、
前記第1文書情報の前記活動記録に含まれる、進捗状況を示唆するキーワードに基づいて、当該活動記録の進捗状況を、複数段階の進捗カテゴリの何れかに分類する進捗判定ステップと、
前記第1文書情報から関連する固有表現を構成する第1関連語を抽出し、当該抽出した第1関連語をまとめた第1関連語情報を生成する第1文書処理ステップと、
前記第2文書情報から関連する固有表現を構成する第2関連語を抽出し、当該抽出した第2関連語をまとめた第2関連語情報を生成する第2文書処理ステップと、
前記第1文書処理ステップ及び前記第2文書処理ステップの実行後、アイテム処理ステップにおいて、前記進捗判定ステップによって分類された前記進捗カテゴリに応じた推奨アイテムの選出条件と、共通する関連語で前記第1関連語情報と前記第2関連語情報とを接続することによって前記第1文書情報と前記第2文書情報とを連携した関連語連携の結果とに基づいて、前記第1文書情報の前記活動記録に含まれる第1関連語に直接的又は間接的に接続された第2関連語を有する推奨アイテムを前記推奨アイテムの候補の中から選出して出力するステップと、
を備えることを特徴とする文書情報抽出方法。 A document information extraction method for a document information extraction device that performs document analysis of activity records recorded in chronological order for the same case to propose recommended items, comprising:
a first document information storage step of registering the activity record in first document information;
a second document information storage step of registering document data related to the candidate recommended items in second document information composed of a document type different from that of the first document information;
a progress determination step of classifying the progress of the activity record into one of a plurality of progress categories based on a keyword suggesting the progress, the keyword being included in the activity record of the first document information;
a first document processing step of extracting first related terms constituting related named entities from the first document information and generating first related term information that compiles the extracted first related terms;
a second document processing step of extracting second related terms constituting related named entities from the second document information and generating second related term information that compiles the extracted second related terms;
After the first document processing step and the second document processing step are executed , in an item processing step, a step of selecting and outputting, from among the recommended item candidates, a recommended item having a second related word directly or indirectly connected to a first related word included in the activity record of the first document information, based on a selection condition for a recommended item corresponding to the progress category classified in the progress determination step and a result of related word linkage in which the first document information and the second document information are linked by connecting the first related word information and the second related word information with a common related word ;
A document information extraction method comprising:
前記進捗判定ステップでは、前記第1文書情報に含まれる各前記活動記録から前記キーワードを抽出し、当該抽出したキーワードに基づいて、各前記活動記録の進捗状況を前記複数段階の進捗カテゴリの何れかに分類する
ことを特徴とする請求項9に記載の文書情報抽出方法。 a predetermined keyword corresponding to each of a plurality of progress categories representing the progress status is determined in advance;
The document information extraction method according to claim 9, characterized in that in the progress determination step, the keywords are extracted from each of the activity records included in the first document information, and the progress status of each of the activity records is classified into one of the multiple progress categories based on the extracted keywords.
前記アイテム処理ステップでは、前記進捗判定ステップで分類された前記進捗カテゴリに対応する前記優先ルールに応じた選出条件を指定し、前記推奨アイテムの候補から前記推奨アイテムを選出する
ことを特徴とする請求項10に記載の文書情報抽出方法。 a predetermined priority rule is prepared in advance, which specifies what attributes of the recommended items should be preferentially recommended for each of the multiple stages of progress categories;
The document information extraction method according to claim 10, characterized in that in the item processing step, a selection condition according to the priority rule corresponding to the progress category classified in the progress determination step is specified, and the recommended item is selected from the candidate recommended items.
ことを特徴とする請求項11に記載の文書情報抽出方法。 The document information extraction method according to claim 11, characterized in that the priority rules can be changed in response to a user operation, and when the user operation is performed, in the item processing step, selection conditions are specified in accordance with the changed priority rules, and the recommended items are selected from the candidate recommended items.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020148544A JP7536558B2 (en) | 2020-09-03 | 2020-09-03 | Document information extraction device and document information extraction method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020148544A JP7536558B2 (en) | 2020-09-03 | 2020-09-03 | Document information extraction device and document information extraction method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022042882A JP2022042882A (en) | 2022-03-15 |
| JP7536558B2 true JP7536558B2 (en) | 2024-08-20 |
Family
ID=80641554
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020148544A Active JP7536558B2 (en) | 2020-09-03 | 2020-09-03 | Document information extraction device and document information extraction method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7536558B2 (en) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2023182172A (en) * | 2022-06-14 | 2023-12-26 | 日本電信電話株式会社 | Information recommendation system, information recommendation method, and information recommendation program |
| CN115907275B (en) * | 2023-01-05 | 2023-06-16 | 希维科技(广州)有限公司 | Method for generating equipment recommendation information based on product characteristics and electronic equipment |
| JP2024099884A (en) * | 2023-01-13 | 2024-07-26 | 株式会社三井E&S | Natural language processing system, program and natural language processing method |
| JP2024134372A (en) | 2023-03-20 | 2024-10-03 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and information processing program |
| JP2024134373A (en) | 2023-03-20 | 2024-10-03 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and information processing program |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20070203785A1 (en) | 2000-10-23 | 2007-08-30 | Thompson Keith T | Method of assisting a sales representative in selling |
| JP2008152641A (en) | 2006-12-19 | 2008-07-03 | Toyota Central R&D Labs Inc | Similar example sentence search device |
| WO2010026900A1 (en) | 2008-09-03 | 2010-03-11 | 日本電気株式会社 | Relationship detector, relationship detection method, and recording medium |
| WO2013145162A1 (en) | 2012-03-28 | 2013-10-03 | 株式会社日立システムズ | Application development sales support system |
| JP2013239132A (en) | 2012-05-17 | 2013-11-28 | Nippon Hoso Kyokai <Nhk> | Similarity computation device, similar program search device, and program therefor |
| JP2018106690A (en) | 2016-12-27 | 2018-07-05 | キヤノンマーケティングジャパン株式会社 | Information processing apparatus, method for controlling information processing apparatus, and program |
| JP2019008530A (en) | 2017-06-23 | 2019-01-17 | 株式会社日立製作所 | Business activity assisting system, business activity assisting method and business activity assisting program |
-
2020
- 2020-09-03 JP JP2020148544A patent/JP7536558B2/en active Active
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20070203785A1 (en) | 2000-10-23 | 2007-08-30 | Thompson Keith T | Method of assisting a sales representative in selling |
| JP2008152641A (en) | 2006-12-19 | 2008-07-03 | Toyota Central R&D Labs Inc | Similar example sentence search device |
| WO2010026900A1 (en) | 2008-09-03 | 2010-03-11 | 日本電気株式会社 | Relationship detector, relationship detection method, and recording medium |
| WO2013145162A1 (en) | 2012-03-28 | 2013-10-03 | 株式会社日立システムズ | Application development sales support system |
| JP2013239132A (en) | 2012-05-17 | 2013-11-28 | Nippon Hoso Kyokai <Nhk> | Similarity computation device, similar program search device, and program therefor |
| JP2018106690A (en) | 2016-12-27 | 2018-07-05 | キヤノンマーケティングジャパン株式会社 | Information processing apparatus, method for controlling information processing apparatus, and program |
| JP2019008530A (en) | 2017-06-23 | 2019-01-17 | 株式会社日立製作所 | Business activity assisting system, business activity assisting method and business activity assisting program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022042882A (en) | 2022-03-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7536558B2 (en) | Document information extraction device and document information extraction method | |
| US12197505B2 (en) | Data preparation using semantic roles | |
| Scaffidi et al. | Red Opal: product-feature scoring from reviews | |
| US9477729B2 (en) | Domain based keyword search | |
| US20100094844A1 (en) | Deduction of analytic context based on text and semantic layer | |
| JP7065718B2 (en) | Judgment support device and judgment support method | |
| WO1999046698A1 (en) | Document processor and recording medium | |
| JP5836893B2 (en) | File management apparatus, file management method, and program | |
| JP2016099741A (en) | Information extraction support apparatus, method and program | |
| JP2020201819A (en) | Business matching support device and business matching support method | |
| US20210342344A1 (en) | Weighed Order Decision Making with Visual Representation | |
| JP7457392B2 (en) | Document processing method, document processing program, and information processing device | |
| JP6120607B2 (en) | Requirement detection apparatus and requirement detection program | |
| JP7685921B2 (en) | Information processing system, information processing method, and information processing program | |
| JP2005128872A (en) | Document retrieving system and document retrieving program | |
| US11514060B2 (en) | Support system, storage medium, and method for presenting relationships of items | |
| Shafie et al. | Review of the Lazada application on Google Play Store: Sentiment Analysis | |
| JP6506839B2 (en) | Dissatisfied information processing device and system | |
| JP2021193537A (en) | Business matching support device and method | |
| JP2021043491A (en) | Analytical equipment, analysis method and program | |
| JP2009032118A (en) | Information structuring device, information structuring method, and program | |
| JP4287464B2 (en) | System infrastructure configuration development support system and support method | |
| JP7273293B2 (en) | Information processing device, control method, program | |
| JP5458058B2 (en) | Product name identity determination device and product name identity determination program | |
| JP4146067B2 (en) | Document search system and document search method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230206 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231025 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231128 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240126 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240416 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240603 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240716 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240807 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7536558 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |