Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7536558B2 - Document information extraction device and document information extraction method - Google Patents
[go: Go Back, main page]

JP7536558B2 - Document information extraction device and document information extraction method - Google Patents

Document information extraction device and document information extraction method Download PDF

Info

Publication number
JP7536558B2
JP7536558B2 JP2020148544A JP2020148544A JP7536558B2 JP 7536558 B2 JP7536558 B2 JP 7536558B2 JP 2020148544 A JP2020148544 A JP 2020148544A JP 2020148544 A JP2020148544 A JP 2020148544A JP 7536558 B2 JP7536558 B2 JP 7536558B2
Authority
JP
Japan
Prior art keywords
document information
document
information
progress
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020148544A
Other languages
Japanese (ja)
Other versions
JP2022042882A (en
Inventor
大羽 加藤
美智子 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2020148544A priority Critical patent/JP7536558B2/en
Publication of JP2022042882A publication Critical patent/JP2022042882A/en
Application granted granted Critical
Publication of JP7536558B2 publication Critical patent/JP7536558B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文書情報抽出装置及び文書情報抽出方法に関し、入力文書の文書解析を経てユーザに適切な情報を抽出する文書情報抽出装置及び文書情報抽出方法に適用して好適なものである。 The present invention relates to a document information extraction device and a document information extraction method, and is suitable for use in a document information extraction device and a document information extraction method that extracts information appropriate for a user through document analysis of an input document.

従来、企業の営業担当者は、顧客に対する営業活動の記録を営業日報などの文書で記録するとともに、営業活動の進捗度合いや打ち合わせ状況に応じて、以降の営業活動において顧客に提案する推奨情報(例えば商品)を考案する必要があった。このときどのような推奨情報を提供するかによって営業結果は大きく変わるため、推奨情報を効率的に選択できる技術への期待があった。 Traditionally, corporate sales representatives have had to record sales activities with customers in documents such as daily sales reports, and also devise recommended information (e.g. products) to propose to customers in subsequent sales activities depending on the progress of sales activities and meeting situations. Sales results can vary greatly depending on the type of recommended information provided, so there was hope for technology that could efficiently select recommended information.

例えば特許文献1には、ユーザが帳票を作成する際に、帳票のレイアウトなどのユーザ入力情報から、参考になり得る帳票文書を提案する情報処理装置及び方法が記載されている。特許文献1に記載された情報処理装置では、ユーザ入力情報と、予め登録されている他の帳票の属性情報とを比較して、推奨する帳票を選択することにより、ユーザが想像していない、もしくはユーザの期待以上となる参考帳票の提案を可能にする。 For example, Patent Document 1 describes an information processing device and method that, when a user creates a form, suggests a form document that may be useful as a reference based on user-input information such as the form layout. The information processing device described in Patent Document 1 compares the user-input information with attribute information of other forms registered in advance, and selects a recommended form, making it possible to suggest reference forms that the user has not imagined or that exceed the user's expectations.

特開2013-025726号公報JP 2013-025726 A

ところで、例えば、商品あるいはサービスを提供する企業において、商品あるいはサービスの売込みを担当する従業員(以下、営業担当者と称する)が、それまでの営業活動の結果に基づいて、顧客に提案するに相応しい商品あるいはサービスを選択する場合、一般的に、顧客に提案すべき商品あるいはサービスは、営業活動の履歴や進捗具合に対応して変化する。具体的には例えば、顧客との打ち合わせが好感触であった場合は、前回の営業活動時に提案した商品あるいはサービスの類似案件を多く提案することが好適である一方、打ち合わせが難航している場合は、目新しさを優先した商品あるいはサービスを提案することに需要がある。しかし、上述した特許文献1などに開示された従来技術では、時系列で変化する入力情報における進捗状況を鑑みて、ユーザに推奨する出力情報を決定することができない、という課題があった。 For example, in a company that provides products or services, when an employee in charge of selling the products or services (hereinafter referred to as a salesperson) selects a product or service suitable for proposal to a customer based on the results of sales activities up to that point, the product or service to be proposed to the customer generally changes in response to the history and progress of sales activities. Specifically, for example, if a meeting with a customer goes well, it is preferable to propose many products or services similar to those proposed in the previous sales activity, whereas if the meeting is not going well, there is a demand for proposing products or services that prioritize novelty. However, the conventional technology disclosed in the above-mentioned Patent Document 1 and the like has a problem in that it is not possible to determine output information to be recommended to the user in consideration of the progress of input information that changes over time.

また、特許文献1に開示された技術は、帳票情報の入力から参考となる帳票情報を出力する技術であり、入力情報の文書種と出力結果(参考帳票)の文書種とが異なる場合には適用できないという課題もあった。例えば、営業担当者が、自分が行った営業活動に関する情報(以下、営業報告書と称する)を入力し、顧客に提案するに相応しい商品あるいはサービスの情報を製品カタログ文書などから選択して出力する場合、営業報告書と製品カタログ文書との属性情報は全く異なるため、それぞれの属性情報を比較しても、推奨するアイテムを選択することができなかった。 The technology disclosed in Patent Document 1 is a technology for inputting form information and outputting reference form information, but it has the problem of being inapplicable when the document type of the input information and the document type of the output result (reference form) are different. For example, when a salesperson inputs information about his/her sales activities (hereinafter referred to as a sales report) and selects and outputs information about products or services suitable for proposing to a customer from a product catalog document, the attribute information in the sales report and the product catalog document are completely different, so that even if the attribute information of each is compared, it is not possible to select a recommended item.

本発明は以上の点を考慮してなされたもので、時系列で変化する入力情報における進捗状況を考慮して、好適な推奨情報を抽出することが可能な文書情報抽出装置及び文書情報抽出方法を提案しようとするものである。 The present invention has been made in consideration of the above points, and aims to propose a document information extraction device and document information extraction method that can extract suitable recommended information by taking into account the progress of input information that changes over time.

かかる課題を解決するため本発明においては、同一の案件において時系列で記録される活動記録の文書解析を行って推奨アイテムを提案する文書情報抽出装置であって、前記活動記録が登録された第1文書情報と、前記第1文書情報とは異なる文書種で構成されており、前記推奨アイテムの候補に関する文書データが登録された第2文書情報と、を格納する記憶部と、前記第1文書情報の前記活動記録に含まれる、進捗状況を示唆するキーワードに基づいて、前記活動記録の進捗状況を、複数段階の進捗カテゴリの何れかに分類する進捗判定部と、前記第1文書情報から関連する固有表現を構成する第1関連語を抽出し、当該抽出した第1関連語をまとめた第1関連語情報を生成する第1文書処理部と、前記第2文書情報から関連する固有表現を構成する第2関連語を抽出し、当該抽出した第2関連語をまとめた第2関連語情報を生成する第2文書処理部と、前記進捗判定部によって分類された前記進捗カテゴリに応じた推奨アイテムの選出条件と、共通する関連語で前記第1関連語情報と前記第2関連語情報とを接続することによって前記第1文書情報と前記第2文書情報とを連携した関連語連携の結果とに基づいて、前記第1文書情報の前記活動記録に含まれる第1関連語に直接的又は間接的に接続された第2関連語を有する推奨アイテムを前記推奨アイテムの候補の中から選出して出力するアイテム処理部と、を備える文書情報抽出装置が提供される。 In order to solve such problems, the present invention provides a document information extraction device that proposes recommended items by performing document analysis of activity records recorded in chronological order for the same case, the document information extraction device including a storage unit that stores first document information in which the activity records are registered and second document information that is composed of a document type different from that of the first document information and in which document data relating to candidates for the recommended items are registered , a progress determination unit that classifies the progress status of the activity records into one of a plurality of progress categories based on keywords that indicate the progress status and are included in the activity records of the first document information, and a progress determination unit that extracts first related words that constitute related named entities from the first document information and generates first related word information that compiles the extracted first related words. a second document processing unit that extracts second related words that constitute related named entities from the second document information and generates second related word information that compiles the extracted second related words; and an item processing unit that selects and outputs recommended items having second related words that are directly or indirectly connected to first related words included in the activity record of the first document information from among candidates for recommended items based on a selection condition for recommended items corresponding to the progress category classified by the progress determination unit and a result of related word linkage that links the first document information and the second document information by connecting the first related word information and the second related word information with a common related word .

また、かかる課題を解決するため本発明においては、同一の案件において時系列で記録される活動記録の文書解析を行って推奨アイテムを提案する文書情報抽出装置による文書情報抽出方法であって、前記活動記録を第1文書情報に登録する第1文書情報記憶ステップと、前記推奨アイテムの候補に関する文書データを、前記第1文書情報とは異なる文書種で構成されている第2文書情報に登録する第2文書情報記憶ステップと、前記第1文書情報の前記活動記録に含まれる、進捗状況を示唆するキーワードに基づいて、当該活動記録の進捗状況を、複数段階の進捗カテゴリの何れかに分類する進捗判定ステップと、前記第1文書情報から関連する固有表現を構成する第1関連語を抽出し、当該抽出した第1関連語をまとめた第1関連語情報を生成する第1文書処理ステップと、前記第2文書情報から関連する固有表現を構成する第2関連語を抽出し、当該抽出した第2関連語をまとめた第2関連語情報を生成する第2文書処理ステップと、前記第1文書処理ステップ及び前記第2文書処理ステップの実行後、アイテム処理ステップにおいて、前記進捗判定ステップによって分類された前記進捗カテゴリに応じた推奨アイテムの選出条件と、共通する関連語で前記第1関連語情報と前記第2関連語情報とを接続することによって前記第1文書情報と前記第2文書情報とを連携した関連語連携の結果に基づいて、前記第1文書情報の前記活動記録に含まれる第1関連語に直接的又は間接的に接続された第2関連語を有する推奨アイテムを前記推奨アイテムの候補の中から選出して出力するステップと、を備える文書情報抽出方法が提供される。 In order to solve the above problem, the present invention provides a document information extraction method for a document information extraction device that proposes recommended items by performing document analysis on activity records recorded in chronological order for the same case, the method including a first document information storage step of registering the activity records in first document information, a second document information storage step of registering document data related to the recommended item candidates in second document information composed of a document type different from that of the first document information, a progress determination step of classifying the progress status of the activity records into one of a plurality of progress categories based on a keyword that suggests the progress status and that is included in the activity records of the first document information, and a first document processing step of extracting first related words that constitute related named entities from the first document information and generating first related word information that compiles the extracted first related words. a second document processing step of extracting second related words constituting related named entities from the second document information and generating second related word information compiling the extracted second related words; and after the first document processing step and the second document processing step are executed , in an item processing step, selecting and outputting from among candidates for recommended items, recommended items having second related words directly or indirectly connected to first related words included in the activity record of the first document information, based on a selection condition for recommended items corresponding to the progress category classified by the progress determination step and a result of related word linkage in which the first document information and the second document information are linked by connecting the first related word information and the second related word information with a common related word .

本発明によれば、時系列で変化する入力情報における進捗状況を考慮して、好適な推奨情報を抽出することができる。 According to the present invention, it is possible to extract suitable recommended information by taking into account the progress of input information that changes over time.

本発明の一実施形態に係る文書情報抽出装置1の機能構成例を示すブロック図である。1 is a block diagram showing an example of a functional configuration of a document information extraction device 1 according to an embodiment of the present invention. 文書情報抽出装置1の実現に用いる情報処理装置10のハードウェア構成例を示すブロック図である。1 is a block diagram showing an example of a hardware configuration of an information processing device 10 used to realize a document information extraction device 1. FIG. 第1文書情報111の一例である。1 is an example of first document information 111. 第1関連語情報112に含まれる第1関連語表116のイメージを説明するための図である。10 is a diagram for explaining an image of a first related word table 116 included in first related word information 112. FIG. 第1関連語情報112に含まれる進捗カテゴリ表117の一例である。13 is an example of a progress category table 117 included in first related word information 112. 第2文書情報113の一例である。13 is an example of second document information 113. 第2関連語情報114に含まれる第2関連語表118のイメージを説明するための図である。13 is a diagram for explaining an image of a second related word table 118 included in second related word information 114. FIG. 異種文書間の関連語連携のイメージを説明するための図である。FIG. 1 is a diagram for explaining an image of related word linkage between different documents. 図8に示した異種文書間の関連語連携を表形式で説明する図である。9 is a diagram for explaining, in a table format, the related word linkage between the different kinds of documents shown in FIG. 8 . レコメンド候補算出表230の一例を示す図である。FIG. 2 is a diagram showing an example of a recommendation candidate calculation table 230. レコメンド算出処理の処理手順例を示すフローチャートである。13 is a flowchart illustrating an example of a processing procedure for a recommendation calculation process. 関連性優先指定処理の処理手順例を示すフローチャートである。13 is a flowchart showing an example of a processing procedure for a relationship priority designation process. 評価値優先指定処理の処理手順例を示すフローチャートである。13 is a flowchart showing an example of a processing procedure for evaluation value priority designation processing. 過去提案優先指定処理の処理手順例を示すフローチャートである。13 is a flowchart showing an example of a processing procedure for a past proposal prioritization process. 活動報告登録画面240の一例である。13 is an example of an activity report registration screen 240. レコメンド確認画面250の一例である。2 is an example of a recommendation confirmation screen 250.

以下、図面を参照にしつつ、本発明の実施形態について説明する。なお、以下の記載および図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略および簡略化がなされている。また、本発明は、他の種々の形態でも実施する事が可能である。とくに限定しない限り、各構成要素は単数でも複数でも構わない。 Hereinafter, an embodiment of the present invention will be described with reference to the drawings. Note that the following description and drawings are merely examples for explaining the present invention, and some parts have been omitted or simplified as appropriate for clarity of explanation. The present invention can also be implemented in various other forms. Unless otherwise specified, each component may be singular or plural.

以下の説明において、符号の前に付した「S」の文字は処理ステップの意味である。また、以下の説明では「表」、「情報」という表現にて各種情報(データ)を説明するが、各種情報は、これら以外のデータ構造で表現されていてもよい。また、識別情報について説明する際、「識別子」、「ID」等の表現を適宜用いるが、これらについてはお互いに置換可能である。 In the following explanation, the letter "S" before a symbol indicates a processing step. In addition, in the following explanation, various information (data) will be explained using the expressions "table" and "information", but the various information may be expressed using data structures other than these. In addition, when explaining identification information, expressions such as "identifier" and "ID" will be used as appropriate, but these are interchangeable.

また、以下の説明において、「文書」と記載した場合、文書をテキストデータ等の所定の形式で電子化したデータを意味する。また、以下の説明において、「単語」と記載した場合、情報処理装置(文書情報抽出装置)によって抽出された固有表現を意味する。また、以下の説明において、固有表現とは、人名や地名など、特定の物事を指す単語の総称である。例えば、「技術者」や「東京都」はそれぞれ、「人」や「場所」についての固有表現である。また、この場合における固有表現の分類先である「人」や「場所」のことを「カテゴリ」と称する。 In the following explanation, the term "document" refers to data that has been digitized from a document in a specified format, such as text data. In the following explanation, the term "word" refers to a named entity extracted by an information processing device (document information extraction device). In the following explanation, a named entity is a general term for words that refer to specific things, such as people's names or place names. For example, "engineer" and "Tokyo" are named entities for "people" and "places," respectively. In this case, the "people" and "places" into which named entities are classified are referred to as "categories."

(1)構成
図1は、本発明の一実施形態に係る文書情報抽出装置1の機能構成例を示すブロック図である。文書情報抽出装置1は、2種の文書情報(第1文書情報111,第2文書情報113)からそれぞれ抽出される固有表現から、関連性のある単語セットを格納した関連語辞書をそれぞれ作成し、関連語辞書同士を連携することで2種の文書情報を連携させる。また、文書情報抽出装置1は、時系列で入力される、履歴や進捗等の内容を含む文書情報について、予め設定した進捗カテゴリ情報(進捗カテゴリ表117)に基づき分類し、進捗カテゴリに応じたアイテム適合度を算出し、最適なアイテムを推薦する。
(1) Configuration Fig. 1 is a block diagram showing an example of the functional configuration of a document information extraction device 1 according to an embodiment of the present invention. The document information extraction device 1 creates anonymity dictionaries storing related word sets from named entities extracted from two types of document information (first document information 111, second document information 113), and links the two types of document information by linking the anonymity dictionaries. The document information extraction device 1 also classifies document information including history, progress, etc., input in chronological order, based on preset progress category information (progress category table 117), calculates item suitability according to the progress category, and recommends optimal items.

図1に示すように、文書情報抽出装置1は、記憶部110、第1文書処理部120、第2文書処理部130、及びアイテム処理部140を備える。 As shown in FIG. 1, the document information extraction device 1 includes a memory unit 110, a first document processing unit 120, a second document processing unit 130, and an item processing unit 140.

記憶部110は、第1文書情報111、第1関連語情報112、第2文書情報113、第2関連語情報114、及びレコメンド履歴情報115を記憶する。記憶部110は、例えば、DBMS(DataBase Management System)が提供するデータベースのテーブルや、ファイルシステムが提供するファイルとして、これらの情報(データ)を記憶する。 The storage unit 110 stores first document information 111, first related word information 112, second document information 113, second related word information 114, and recommendation history information 115. The storage unit 110 stores this information (data), for example, as a database table provided by a DBMS (DataBase Management System) or as a file provided by a file system.

第1文書情報111及び第2文書情報113は、固有表現の抽出元となる複数の文書を含む。第1文書情報111及び第2文書情報113の内容は必ずしも限定されず、例えば、第1文書情報111及び第2文書情報113は、ユーザが入力したものでもよいし、インターネット等の通信ネットワークを介して取得される情報でもよい。 The first document information 111 and the second document information 113 include multiple documents from which named entities are extracted. The contents of the first document information 111 and the second document information 113 are not necessarily limited; for example, the first document information 111 and the second document information 113 may be information input by a user or information obtained via a communication network such as the Internet.

詳細は図3を参照しながら後述するが、第1文書情報111には、営業担当者によって入力される入力情報(例えば営業関連文書)が格納される。また、詳細は図6を参照しながら後述するが、第2文書情報113には、推奨アイテム(レコメンドアイテム)としてアイテム処理部140によってユーザに提案される出力情報の抽出元となる情報(例えば製品カタログ文書)が格納される。なお、本実施形態に係る文書情報抽出装置1は、入力情報を含む第1文書情報111と出力情報を含む第2文書情報113との文書の種別(文書種)が異なる場合であっても、入力情報に含まれる固有表現に基づいて、適切な出力情報を提案することを特徴の1つとするが、第1文書情報111及び第2文書情報113の文書種は、必ずしも異種である必要はなく、例えば第1文書情報111及び第2文書情報113が、ともに営業報告書であってもよい。但し、少なくとも第1文書情報111は、活動の進捗状況を示唆する情報を取得可能なことが必要であり、例えば、同一の営業活動において複数日の複数の営業日報を保有し、営業活動が順調や難航といった情報が取得可能な記載が含まれているものとする。 The first document information 111 stores input information (e.g., sales-related documents) entered by a sales representative, as will be described in detail later with reference to FIG. 3. The second document information 113 stores information (e.g., product catalog documents) from which output information is extracted and which is proposed to the user by the item processing unit 140 as a recommended item (recommended item), as will be described in detail later with reference to FIG. 6. Note that the document information extraction device 1 according to this embodiment has a feature of proposing appropriate output information based on named entities contained in the input information, even if the document types (document types) of the first document information 111 including the input information and the second document information 113 including the output information are different. However, the document types of the first document information 111 and the second document information 113 do not necessarily have to be different. For example, the first document information 111 and the second document information 113 may both be sales reports. However, the first document information 111 must at least be capable of acquiring information that indicates the progress of the activity; for example, it must contain multiple sales daily reports for multiple days for the same sales activity, and contain descriptions that can acquire information such as whether the sales activity is going well or difficult.

第1関連語情報112は、第1文書処理部120によって抽出された関連語、及び第1文書情報111に含まれる文書を活動進捗で分類するための進捗分類情報であり、第1関連語表116、及び進捗カテゴリ表117を含む。 The first related word information 112 is progress classification information for classifying the related words extracted by the first document processing unit 120 and the documents included in the first document information 111 by activity progress, and includes a first related word table 116 and a progress category table 117.

第2関連語情報114は、第2文書処理部130によって抽出された関連語情報であり、第2関連語表118を含む。 The second related word information 114 is related word information extracted by the second document processing unit 130 and includes a second related word table 118.

レコメンド履歴情報115は、アイテム処理部140で提案されたアイテムへのアクセス具合(評価値の指標)を格納する。アクセス度合には例えば、アイテム処理部140で提案されたアイテムに対して、ユーザが実際に選択や閲覧を行った結果が反映され、レコメンド履歴情報115では、アイテムの評価値として保持される。また。レコメンド履歴情報には、案件ごとに以前の営業活動で提案したアイテム(レコメンドアイテム)の履歴が蓄積された「レコメンド提案履歴」も保持される。 The recommendation history information 115 stores the degree of access (an index of evaluation value) to items proposed by the item processing unit 140. The degree of access reflects, for example, the results of a user's actual selection or viewing of an item proposed by the item processing unit 140, and is stored in the recommendation history information 115 as the evaluation value of the item. In addition, the recommendation history information also stores a "recommendation proposal history" that accumulates the history of items proposed in previous sales activities (recommended items) for each case.

第1文書処理部120は、固有表現特徴量抽出部121、学習推論部122、関連語表生成部123、及び進捗カテゴリ生成部124を有して構成される。固有表現特徴量抽出部121は、第1文書情報111の文書に形態素解析を実行して固有表現及び特徴量を抽出するとともに、抽出した固有表現をカテゴリに分類する。学習推論部122は、機械学習モデルによる推論モデルの学習を行う。関連語表生成部123は、学習推論部122によって学習された推論モデルを用いて、固有表現特徴量抽出部121によって抽出された固有表現の中から、関連する固有表現をまとめた第1関連語表116を生成する。進捗カテゴリ生成部124は、進捗カテゴリ表117に基づいて、第1文書情報111の文書中に含まれる活動進捗のキーワードに応じて、当該文書を複数のカテゴリに分けることにより、進捗状況を判定する。 The first document processing unit 120 is configured to include a named entity feature extraction unit 121, a learning inference unit 122, an associated word table generation unit 123, and a progress category generation unit 124. The named entity feature extraction unit 121 performs morphological analysis on the document of the first document information 111 to extract named entities and features, and classifies the extracted named entities into categories. The learning inference unit 122 trains an inference model using a machine learning model. The associated word table generation unit 123 uses the inference model trained by the learning inference unit 122 to generate a first associated word table 116 that compiles associated named entities from among the named entities extracted by the named entity feature extraction unit 121. The progress category generation unit 124 classifies the document of the first document information 111 into multiple categories based on the progress category table 117 according to activity progress keywords contained in the document, thereby determining the progress status.

第2文書処理部130は、固有表現特徴量抽出部131、学習推論部132、及び関連語表生成部133を有して構成される。固有表現特徴量抽出部131は、第2文書情報113の文書に形態素解析を実行して固有表現及び特徴量を抽出するとともに、抽出した固有表現をカテゴリに分類する。学習推論部132は、機械学習モデルによる推論モデルの学習を行う。関連語表生成部133は、上記推論モデルにより、固有表現特徴量抽出部131によって抽出された固有表現の中から、関連する固有表現をまとめた第2関連語表118を生成する。 The second document processing unit 130 is composed of a named entity feature extraction unit 131, a learning inference unit 132, and a related word table generation unit 133. The named entity feature extraction unit 131 performs morphological analysis on the documents of the second document information 113 to extract named entities and features, and classifies the extracted named entities into categories. The learning inference unit 132 trains an inference model using a machine learning model. The related word table generation unit 133 uses the inference model to generate a second related word table 118 that compiles related named entities from among the named entities extracted by the named entity feature extraction unit 131.

アイテム処理部140は、適合度算出部141、アイテム推薦部、及びアイテム出力部を有して構成される。適合度算出部141は、第1関連語表116、第2関連語表118、及びレコメンド履歴情報115に基づいて、第1文書情報111に含まれる指定の文書と、第2関連語情報114に含まれるアイテムの適合度とを算出する。アイテム推薦部142は、上記アイテムの適合度に基づいて、推薦するアイテムを選択し、アイテム出力部143にてユーザに選択したアイテムを提案することで、アイテム推薦を実現する。また、アイテム処理部140は、提案したアイテムに対するユーザの利用履歴(検索回数や参考になったボタンを押した回数など)を取得し、レコメンド履歴情報115を更新する。 The item processing unit 140 is configured to include a compatibility calculation unit 141, an item recommendation unit, and an item output unit. The compatibility calculation unit 141 calculates the compatibility between a specified document included in the first document information 111 and an item included in the second related word information 114 based on the first related word table 116, the second related word table 118, and the recommendation history information 115. The item recommendation unit 142 selects an item to recommend based on the compatibility of the above items, and proposes the selected item to the user via the item output unit 143, thereby realizing item recommendation. In addition, the item processing unit 140 obtains the user's usage history for the proposed item (such as the number of searches and the number of times a helpful button was pressed) and updates the recommendation history information 115.

図2は、文書情報抽出装置1の実現に用いる情報処理装置10のハードウェア構成例を示すブロック図である。 Figure 2 is a block diagram showing an example of the hardware configuration of an information processing device 10 used to realize the document information extraction device 1.

図2に例示した情報処理装置10は、プロセッサ11、主記憶装置12、補助記憶装置13、入力装置14、出力装置15、及び通信装置16を備える。なお、文書情報抽出装置1の実現に用いられる情報処理装置10は、その全部または一部が、例えば、クラウドシステムによって提供される仮想サーバのように、仮想化技術やプロセス空間分離技術等を用いて提供される仮想的な情報処理資源を用いて実現されるものであってもよい。また、情報処理装置10によって提供される機能の全部または一部は、例えば、クラウドシステムがAPI(Application Programming Interface)等を介して提供するサービスによって実現されてもよい。また、文書情報抽出装置1は、通信可能に接続された複数の情報処理装置10を用いて構成されてもよい。 The information processing device 10 illustrated in FIG. 2 includes a processor 11, a main memory device 12, an auxiliary memory device 13, an input device 14, an output device 15, and a communication device 16. The information processing device 10 used to realize the document information extraction device 1 may be realized in whole or in part using virtual information processing resources provided using virtualization technology, process space separation technology, or the like, such as a virtual server provided by a cloud system. In addition, all or in part of the functions provided by the information processing device 10 may be realized by a service provided by the cloud system via an API (Application Programming Interface), for example. In addition, the document information extraction device 1 may be configured using multiple information processing devices 10 connected to each other so as to be able to communicate with each other.

図2において、プロセッサ11は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)、AI(Artificial Intelligence)チップ等を用いて構成される。 In FIG. 2, the processor 11 is configured using, for example, a CPU (Central Processing Unit), an MPU (Micro Processing Unit), a GPU (Graphics Processing Unit), an FPGA (Field Programmable Gate Array), an ASIC (Application Specific Integrated Circuit), an AI (Artificial Intelligence) chip, etc.

主記憶装置12は、プログラムやデータを記憶する装置であり、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、不揮発性メモリ(NVRAM(Non Volatile RAM))等である。 The main memory device 12 is a device that stores programs and data, and is, for example, a read only memory (ROM), a random access memory (RAM), or a non-volatile memory (NVRAM (Non Volatile RAM)).

補助記憶装置13は、例えば、ハードディスクドライブ、SSD(Solid State Drive)、光学式記憶装置(CD(Compact Disc)、DVD(Digital Versatile Disc)等)、ストレージシステム、ICカード、SDカードや光学式記録媒体等の記録媒体の読取/書込装置、クラウドサーバの記憶領域等である。補助記憶装置13には、記録媒体の読取装置や通信装置16を介して、プログラムやデータを読み込むことができる。補助記憶装置13に格納(記憶)されているプログラムやデータは、主記憶装置12に随時読み込まれる。 The auxiliary storage device 13 is, for example, a hard disk drive, an SSD (Solid State Drive), an optical storage device (CD (Compact Disc), DVD (Digital Versatile Disc), etc.), a storage system, an IC card, a read/write device for a recording medium such as an SD card or an optical recording medium, a storage area of a cloud server, etc. Programs and data can be read into the auxiliary storage device 13 via a recording medium reader or a communication device 16. The programs and data stored (memorized) in the auxiliary storage device 13 are read into the main storage device 12 as needed.

入力装置14は、外部からの入力を受け付けるインタフェースであり、例えば、キーボード、マウス、タッチパネル、カードリーダ、ペン入力方式のタブレット、音声入力装置等である。 The input device 14 is an interface that accepts input from the outside, and is, for example, a keyboard, a mouse, a touch panel, a card reader, a pen-input tablet, a voice input device, etc.

出力装置15は、処理経過や処理結果等の各種情報を出力するインタフェースである。出力装置15は、例えば、上記の各種情報を可視化する表示装置(液晶モニタ、LCD(Liquid Crystal Display)、グラフィックカード等)、上記の各種情報を音声化する装置(音声出力装置(スピーカ等))、上記の各種情報を文字化する装置(印字装置等)である。別例として、情報処理装置10が通信装置16を介して他の装置との間で情報の入力や出力を行う構成としてもよい。 The output device 15 is an interface that outputs various information such as the progress of processing and the results of processing. The output device 15 is, for example, a display device (liquid crystal monitor, LCD (Liquid Crystal Display), graphic card, etc.) that visualizes the various information described above, a device that converts the various information described above into audio (audio output device (speaker, etc.)), or a device that converts the various information described above into text (printer, etc.). As another example, the information processing device 10 may be configured to input and output information to and from other devices via the communication device 16.

なお、入力装置14及び出力装置15は、ユーザとの間で情報の受付や提示を行うユーザインタフェースを構成する。 The input device 14 and the output device 15 constitute a user interface that receives and presents information to and from the user.

通信装置16は、他の装置との間の通信を実現する装置である。通信装置16は、通信ネットワーク(インターネット、LAN(Local Area Network)、WAN(Wide Area Network)、専用線、公衆通信網棟)を介した他の装置との間の通信を実現する、有線方式または無線方式の通信インタフェースであり、例えば、NIC(Network Interface Card)、無線通信モジュール、USBモジュール等である。 The communication device 16 is a device that realizes communication with other devices. The communication device 16 is a wired or wireless communication interface that realizes communication with other devices via a communication network (Internet, LAN (Local Area Network), WAN (Wide Area Network), dedicated line, public communication network building), and is, for example, a NIC (Network Interface Card), a wireless communication module, a USB module, etc.

また、情報処理装置10には、例えば、オペレーティングシステム、ファイルシステム、DBMS(DataBase Management System)(リレーショナルデータベース、NoSQL等)、KVS(Key-Value Store)等が導入されていてもよい。 In addition, the information processing device 10 may be equipped with, for example, an operating system, a file system, a DBMS (DataBase Management System) (relational database, NoSQL, etc.), a KVS (Key-Value Store), etc.

そして、文書情報抽出装置1が備える機能構成のうち、第1文書処理部120、第2文書処理部130、及びアイテム処理部140による機能は、図2に示した情報処理装置10において、プロセッサ11が、主記憶装置12に格納されているプログラムを読み出して実行することにより、もしくは、これらの装置を構成するハードウェア(FPGA、ASIC、AIチップ等)によって実現される。また、文書情報抽出装置1が備える機能構成のうち記憶部110による機能は、対象となる各種の情報(データ)を例えばデータベースのテーブルやファイルシステムが管理するファイルとして、主記憶装置12や補助記憶装置13(外部記憶装置でもよい)に記憶することによって実現される。 Among the functional components of the document information extraction device 1, the functions of the first document processing unit 120, the second document processing unit 130, and the item processing unit 140 are realized by the processor 11 reading and executing a program stored in the main memory device 12 in the information processing device 10 shown in FIG. 2, or by the hardware (FPGA, ASIC, AI chip, etc.) that constitutes these devices. Also, among the functional components of the document information extraction device 1, the function of the memory unit 110 is realized by storing various target information (data) in the main memory device 12 or the auxiliary memory device 13 (which may be an external memory device) as, for example, a database table or a file managed by a file system.

(2)各種情報
続いて、文書情報抽出装置1の記憶部110に記憶される各種情報について説明する。
(2) Various Information Next, various information stored in the storage unit 110 of the document information extraction device 1 will be described.

図3は、第1文書情報111の一例である。図3に例示した第1文書情報111は、企業の情報処理システムに蓄積された社内文書であって、同一の営業案件に対して異なる活動日に複数回の営業活動を行った事例に関する営業関連文書である。 Figure 3 is an example of the first document information 111. The first document information 111 illustrated in Figure 3 is an internal document stored in a company's information processing system, and is a sales-related document regarding a case in which multiple sales activities were carried out on different activity days for the same sales case.

図3に示すように、第1文書情報111は、対象とする営業案件(対象案件)ごとに、当該案件に関する情報(例えば、案件名、需要先、受注元、金額規模、案件概要等)を管理する情報である。図3の第1文書情報111には、それぞれの活動日における営業活動の記録である営業日報111a、111b,111cが1つのグループで管理されている。なお、以降の説明では、各営業日報111a~111cを第1文書情報111における最小単位の文書とするため、各営業日報111a~111cを第1文書情報111a~111cと表記することがある。第1文書処理部120は、これら第1文書情報111における最小単位の文書(第1文書情報111a~111c)から、所定の固有表現を抽出し、抽出した固有表現の中から関連する固有表現を組み合わせて第1関連語表116を生成(作成)する。 As shown in FIG. 3, the first document information 111 is information that manages information about each sales case (target case) (e.g., case name, demand source, order source, amount, case overview, etc.). In the first document information 111 in FIG. 3, sales daily reports 111a, 111b, and 111c, which are records of sales activities on each activity day, are managed as one group. In the following explanation, each sales daily report 111a to 111c is sometimes referred to as first document information 111a to 111c because each sales daily report 111a to 111c is the smallest unit document in the first document information 111. The first document processing unit 120 extracts specified named entities from these smallest unit documents in the first document information 111 (first document information 111a to 111c), and generates (creates) the first related word table 116 by combining related named entities from the extracted named entities.

図4は、第1関連語情報112に含まれる第1関連語表116のイメージを説明するための図である。前述したように、第1関連語表116は、第1文書処理部120によって生成(作成)される。より詳しく説明すると、まず、第1文書処理部120の固有表現特徴量抽出部121が、第1文書情報111の文書(第1文書情報111a~111c)から、所定の固有表現(具体的には例えば、「人手作業」、「作業員」、「作業時間」、「自動化」、「半導体製造」、「検討開始」、「深堀り」、「難航」、「齟齬」等)を抽出する。そして、第1文書処理部120の関連語表生成部123が、学習推論部122によって学習された推論モデルを用いて、上記抽出された固有表現の中から関連する固有表現をまとめることにより、第1関連語表116を生成する。 Figure 4 is a diagram for explaining an image of the first related word table 116 included in the first related word information 112. As described above, the first related word table 116 is generated (created) by the first document processing unit 120. To explain in more detail, first, the named entity feature extraction unit 121 of the first document processing unit 120 extracts predetermined named entities (specifically, for example, "manual work", "worker", "work time", "automation", "semiconductor manufacturing", "start of review", "deep dive", "difficulty", "discrepancy", etc.) from the documents of the first document information 111 (first document information 111a to 111c). Then, the related word table generation unit 123 of the first document processing unit 120 uses the inference model learned by the learning inference unit 122 to compile related named entities from the extracted named entities, thereby generating the first related word table 116.

上記のようにして生成された第1関連語表116は、対象とする第1文書情報111a~111cにおいて、類似の使い方をされる固有表現の組み合わせ(同義語関係)や、同一文内に頻繁に現れる固有表現の組み合わせ(共起語関係)などを総称した「関連語辞書」に相当する。図4に示したネットワークグラフ1161は、第1文書情報111aにおいて第1関連語表116(関連語辞書)に含まれる関連語をネットワークグラフ上に展開したものである。ネットワークグラフ1161によれば、第1文書情報111aに使用された固有表現の関連性が、視覚的に認識し易い形態で表される。 The first related word table 116 generated as described above corresponds to a "related word dictionary" which collectively refers to combinations of named entities that are used similarly (synonym relationships) and combinations of named entities that frequently appear in the same sentence (co-occurrence relationships) in the target first document information 111a to 111c. The network graph 1161 shown in FIG. 4 is a network graph in which the related words contained in the first related word table 116 (related word dictionary) in the first document information 111a are expanded. According to the network graph 1161, the relevance of the named entities used in the first document information 111a is represented in a form that is easy to visually recognize.

図5は、第1関連語情報112に含まれる進捗カテゴリ表117の一例である。図5に例示した進捗カテゴリ表117は、カテゴリ名1171、レコメンド優先ルール1172、及びキーワード1173の項目を有して構成される。上記各項目及びその内容は、第1文書情報111中の文書(第1文書情報111a~111c)をカテゴリ分類するために、予めユーザが任意の基準で設定する。 Figure 5 is an example of a progress category table 117 included in the first related word information 112. The progress category table 117 illustrated in Figure 5 is configured with items of category name 1171, recommendation priority rule 1172, and keyword 1173. Each of the above items and their contents are set in advance by the user according to arbitrary criteria in order to categorize the documents in the first document information 111 (first document information 111a to 111c).

例えば、カテゴリ名1171には、分類先となる各カテゴリの名称が設定され、図5の場合は「開始」、「順調」、「難航」、「深堀り」等のカテゴリ名が登録されている。なお、カテゴリの分類数や分類境界に制限はないが、第1文書情報111に含まれる前文書が、進捗カテゴリ表117において何れかのカテゴリ(カテゴリ名1171)に該当することを必要とする。 For example, the name of each category into which the document will be classified is set in category name 1171, and in the case of FIG. 5, category names such as "Start", "Smooth", "Difficult", and "Digging deeper" are registered. Note that there is no limit to the number of categories or classification boundaries, but the previous document included in the first document information 111 must fall into one of the categories (category name 1171) in the progress category table 117.

また、レコメンド優先ルール1172には、各カテゴリにおいて、どのような属性のアイテムを優先して推奨(レコメンド)するかというルールが指定される。図5にも示したように、各カテゴリに対応するレコメンド優先ルール1172は、1つに限定されることはなく、対応するカテゴリの特性を考慮して、任意の種類のルールを、任意の内容で設定することができる。 The recommendation priority rules 1172 also specify rules for what attributes of items are to be given priority for recommendation in each category. As shown in FIG. 5, the recommendation priority rules 1172 corresponding to each category are not limited to one, and any type of rule with any content can be set, taking into account the characteristics of the corresponding category.

また、キーワード1173には、第1文書情報111(厳密には第1文書情報111a~111c)を進捗カテゴリ生成部124によって各カテゴリに自動分類できるようにするために、各カテゴリに対応する進捗情報を示唆する語句(キーワード)が設定される。前述したように、第1文書処理部120の進捗カテゴリ生成部124は、進捗カテゴリ表117に基づいて、第1文書情報111の各文書(第1文書情報111a~111c)の進捗状況を分類する。このとき、進捗カテゴリ生成部124は、第1文書情報111内の各文書においてキーワード1173に登録されているキーワードが含まれている場合に、当該文書を対応するカテゴリに自動分類する。なお、図5にも示したように、カテゴリごとに設定されるキーワードの数に制限はないが、複数のカテゴリに重複するキーワードを設定することは禁止される。 In addition, in the keyword 1173, a phrase (keyword) suggesting progress information corresponding to each category is set so that the first document information 111 (strictly speaking, the first document information 111a to 111c) can be automatically classified into each category by the progress category generation unit 124. As described above, the progress category generation unit 124 of the first document processing unit 120 classifies the progress status of each document (first document information 111a to 111c) of the first document information 111 based on the progress category table 117. At this time, if a keyword registered in the keyword 1173 is included in each document in the first document information 111, the progress category generation unit 124 automatically classifies the document into the corresponding category. Note that, as shown in FIG. 5, there is no limit to the number of keywords set for each category, but it is prohibited to set duplicate keywords in multiple categories.

図6は、第2文書情報113の一例である。図6に例示した第2文書情報113は、企業の情報処理システムに蓄積された社内文書であって、当該企業が販売(提供)する複数の製品について、製品ごとに詳細な内容を記述した製品カタログ文書である。各製品の製品カタログ文書として、図6には、第2文書情報113a,113bが例示されている。 Figure 6 is an example of second document information 113. The second document information 113 illustrated in Figure 6 is an internal document stored in a company's information processing system, and is a product catalog document that describes the detailed contents of each of multiple products sold (provided) by the company. Figure 6 illustrates second document information 113a and 113b as product catalog documents for each product.

第2文書処理部130は、これら第2文書情報113における最小単位の文書(第2文書情報113a,113b)から、所定の固有表現を抽出し、抽出した固有表現の中から関連する固有表現を組み合わせて第2関連語表118を生成(作成)する。但し、第1文書処理部120が第1文書情報111から第1関連語表116を生成する手法とは異なる点として、第2文書処理部130による第2関連語表118の生成では、第2文書情報113a,113bのうちから進捗情報を取得する必要はない。 The second document processing unit 130 extracts predetermined named entities from the smallest unit documents (second document information 113a, 113b) in the second document information 113, and generates (creates) the second related word table 118 by combining related named entities from among the extracted named entities. However, this method differs from the method in which the first document processing unit 120 generates the first related word table 116 from the first document information 111 in that the generation of the second related word table 118 by the second document processing unit 130 does not require the acquisition of progress information from the second document information 113a, 113b.

図7は、第2関連語情報114に含まれる第2関連語表118のイメージを説明するための図である。前述したように、第2関連語表118は、第2文書処理部130によって生成(作成)される。より詳しく説明すると、まず、第2文書処理部130の固有表現特徴量抽出部131が、第2文書情報113の文書(第2文書情報113a,113b)から、所定の固有表現(具体的には例えば、「リモート化」、「センサー」、「稼働状態」、「無線通信」、「現場」、「リアルタイム」、「従業員」、「生産性」、「オフィス」等)を抽出する。そして、第2文書処理部130の関連語表生成部133が、学習推論部132によって学習された推論モデルを用いて、上記抽出された固有表現の中から関連する固有表現をまとめることにより、第2関連語表118を生成する。 7 is a diagram for explaining an image of the second related word table 118 included in the second related word information 114. As described above, the second related word table 118 is generated (created) by the second document processing unit 130. To explain in more detail, first, the named entity feature quantity extraction unit 131 of the second document processing unit 130 extracts predetermined named entities (specifically, for example, "remote", "sensor", "operating state", "wireless communication", "site", "real time", "employee", "productivity", "office", etc.) from the documents of the second document information 113 (second document information 113a, 113b). Then, the related word table generation unit 133 of the second document processing unit 130 uses the inference model learned by the learning inference unit 132 to compile related named entities from the extracted named entities, thereby generating the second related word table 118.

上記のようにして生成された第2関連語表118は、対象とする第2文書情報113a,113bにおいて、類似の使い方をされる固有表現の組み合わせ(同義語関係)や、同一文内に頻繁に現れる固有表現の組み合わせ(共起語関係)などを総称した「関連語辞書」に相当する。図7に示したネットワークグラフ1181は、第2文書情報113aにおいて第2関連語表118(関連語辞書)に含まれる関連語をネットワークグラフ上に展開したものである。ネットワークグラフ1181によれば、第2文書情報113aに使用された固有表現の関連性が、視覚的に認識し易い形態で表される。 The second related word table 118 generated as described above corresponds to a "related word dictionary" which collectively refers to combinations of named entities that are used similarly (synonym relationships) and combinations of named entities that frequently appear in the same sentence (co-occurrence relationships) in the target second document information 113a and 113b. The network graph 1181 shown in FIG. 7 is a network graph in which the related words contained in the second related word table 118 (related word dictionary) in the second document information 113a are expanded. According to the network graph 1181, the relevance of the named entities used in the second document information 113a is represented in a form that is easy to visually recognize.

(3)異種文書間の関連語連携
文書情報抽出装置1のアイテム処理部140は、入力情報である第1文書情報111と、出力情報の候補となる第2文書情報113との間で関連語句を連携させて、入力情報に含まれる進捗状況を考慮して、ユーザに提案する推奨情報の候補(レコメンド候補)を選出する。なお、本実施形態では、第1文書情報111と第2文書情報113とが異なる文書種である場合にも、文書間の関連語句を連携させることができる。以下では、この異種文書間の関連語の連携に基づくレコメンド候補の選出イメージについて説明する。
(3) Linking Related Words Between Different Documents The item processing unit 140 of the document information extraction device 1 links related words between the first document information 111, which is input information, and the second document information 113, which is a candidate for output information, and selects candidates for recommended information (recommendation candidates) to be proposed to the user, taking into consideration the progress status included in the input information. Note that in this embodiment, even when the first document information 111 and the second document information 113 are different document types, related words between the documents can be linked. Below, an image of selecting recommendation candidates based on the linking of related words between different documents will be described.

図8は、異種文書間の関連語連携のイメージを説明するための図である。図8に示すネットワークグラフ210は、第1文書情報111a及び第2文書情報113aのそれぞれにおける関連語をネットワークグラフ化して、両者に共通する関連語(共通項)を接続して構成したものである。 Figure 8 is a diagram for explaining the concept of linking related words between different documents. The network graph 210 shown in Figure 8 is constructed by forming a network graph of related words in each of the first document information 111a and the second document information 113a, and connecting related words (common terms) common to both.

具体的には、図8に示すネットワークグラフ210のうち、主に左側に示されたネットワークグラフ211は、第1関連語表116に基づく第1文書情報111aの関連語を示すネットワークグラフであり(図4のネットワークグラフ1161と同様)、主に右側に示されたネットワークグラフ212は、第2関連語表118に基づく第2文書情報113aの関連語のネットワークグラフである(図7のネットワークグラフ1181と同様)。図8のネットワークグラフ210によれば、「働き方」及び「IoT」という語句が第1文書情報111a及び第2文書情報113aの双方に共通する関連語(共通項)であることから、これらの共通項でネットワークグラフ211とネットワークグラフ212とを接続することができる。 Specifically, in the network graph 210 shown in FIG. 8, the network graph 211 shown mainly on the left side is a network graph showing related words of the first document information 111a based on the first related word table 116 (similar to the network graph 1161 in FIG. 4), and the network graph 212 shown mainly on the right side is a network graph of related words of the second document information 113a based on the second related word table 118 (similar to the network graph 1181 in FIG. 7). According to the network graph 210 in FIG. 8, the words "work style" and "IoT" are related words (common terms) common to both the first document information 111a and the second document information 113a, and therefore the network graphs 211 and 212 can be connected by these common terms.

このとき、第1文書情報111aの文中に含まれる「人手作業」という語句から、「人手作業-自動化-IoT-リモート化」という経路と「人手作業-作業員-働き方-作業効率-一括管理-リモート化」という経路の2通りの経路で「リモート化」という語句に到達することができる。この結果、アイテム処理部140は、「リモート化」という語句を文中に含む第2文書情報113aをレコメンド候補として選出することができる。このように、文書情報抽出装置1のアイテム処理部140は、異種文書である第1文書情報111aと第2文書情報113aとの間で、関連語の連携を行って、レコメンド候補を選出することができる。 At this time, the phrase "remote work" can be reached from the phrase "manual work" contained in the sentence of the first document information 111a via two routes: "manual work - automation - IoT - remote work" and "manual work - worker - work style - work efficiency - centralized management - remote work". As a result, the item processing unit 140 can select the second document information 113a containing the phrase "remote work" in the sentence as a recommendation candidate. In this way, the item processing unit 140 of the document information extraction device 1 can link related words between the first document information 111a and the second document information 113a, which are heterogeneous documents, to select recommendation candidates.

図9は、図8に示した異種文書間の関連語連携を表形式で説明する図である。図9に示された関連語連携表220は、「人手作業」から「リモート化」に到達する関連語の経緯について、図8で説明した「人手作業-自動化-IoT-リモート化」という第1の経路と「人手作業-作業員-働き方-作業効率-一括管理-リモート化」という第2の経路とを表にまとめたものである。図9によれば、第1の経路では、第1文書情報111aに記載されている「人手作業」から3単語の関連語で「リモート化」のレコメンド候補を選出することができる一方、第2の経路では、「人手作業」から「リモート化」のレコメンド候補を選出するために5単語の関連語が必要であることが分かる。 Figure 9 is a diagram explaining the related word linkage between the different documents shown in Figure 8 in the form of a table. The related word linkage table 220 shown in Figure 9 is a table summarizing the process of related words from "manual work" to "remote work" in the first route of "manual work - automation - IoT - remote work" explained in Figure 8 and the second route of "manual work - worker - work style - work efficiency - centralized management - remote work". According to Figure 9, it can be seen that in the first route, a recommendation candidate for "remote work" can be selected from "manual work" written in the first document information 111a with three related words, while in the second route, five related words are required to select a recommendation candidate for "remote work" from "manual work".

図10は、レコメンド候補算出表230の一例を示す図である。レコメンド候補算出表230は、異種文書間の関連語連携において、レコメンド候補を選出するまでに必要な関連語の数を距離を基準に表した表である。 Figure 10 is a diagram showing an example of a recommendation candidate calculation table 230. The recommendation candidate calculation table 230 is a table that shows the number of related words required to select a recommendation candidate in related word linkage between different documents, based on distance.

例えば図10のレコメンド候補算出表230は、第1文書情報111aを入力情報としたときに、第1文書情報111aに含まれる「人手作業」という語句に対して、第2文書情報113に含まれる複数の製品名231のレコメンド候補がどの程度の距離で何通り連携するか(接続個数232)と、さらに、その接続個数と距離とを掛け合わせた値の合計値(スコア233)とを表している。 For example, when the first document information 111a is used as input information, the recommendation candidate calculation table 230 in FIG. 10 shows how many ways the recommendation candidates for multiple product names 231 included in the second document information 113 are linked to the term "manual work" included in the first document information 111a (number of connections 232) and the total value (score 233) of the product of the number of connections and the distance.

ここで、一般には、入力情報に含まれる語句(例えば「人手作業」)とレコメンド候補に含まれる語句(例えば「リモート化」)との距離が近い(すなわち多くの関連語を必要としない)連携であるほど、当該レコメンド候補は入力情報との関連性が大きい製品であるといえる。一方、入力情報に含まれる語句とレコメンド候補に含まれる語句との距離が遠い(すなわち多くの関連語を必要とする)連携であるほど、当該レコメンド候補は一見して入力情報との関連性がない製品といえる。しかし、一見して関連性がなさそうなレコメンド候補であっても、多くの経路で接続(多くの接続個数で連携)されていれば、ユーザにレコメンド提案する価値が高く、意外性の大きい製品であるといえる。 Generally speaking, the closer the link between the words in the input information (e.g., "manual work") and the words in the recommendation candidate (e.g., "remote operation") (i.e., the less related words required), the more related the recommendation candidate is to the input information. On the other hand, the farther the link between the words in the input information and the words in the recommendation candidate (i.e., the more related words required), the more the recommendation candidate appears to be a product that is not related to the input information at first glance. However, even if a recommendation candidate appears to be unrelated at first glance, if it is connected through many routes (connected through a large number of connections), it is highly worth recommending to users and is a product that is highly unexpected.

上記の観点から、レコメンド候補算出表230では、接続個数と距離とを掛けた値の合計値をスコア233として計算することにより、関連性が小さい製品であっても、スコア233が大きければ、レコメンド提案する価値が高い意外性の高い製品であると判断することができる。例えば、図10のレコメンド候補算出表230の場合、最短で「距離#1」で接続可能な「省エネ」という製品は、関連性の大きいレコメンド候補と判断することができる。一方、最短で「距離#4」でしか接続できない「AI導入」という製品は、関連性が小さいレコメンド候補である。しかし、製品「AI導入」は、「距離#4」及び「距離#5」で接続可能であることから高いスコア値「9」を有するため、例えばスコア値「8」の製品「リモート化」よりも、意外性の大きなレコメンド価値の高い製品であると判断することができる。 From the above viewpoint, in the recommendation candidate calculation table 230, by calculating the total value of the product of the number of connections and the distance as the score 233, even if the product has a low relevance, if the score 233 is high, it can be determined that the product is highly unexpected and worth recommending. For example, in the case of the recommendation candidate calculation table 230 of FIG. 10, a product called "energy saving" that can be connected at the shortest distance of "distance #1" can be determined to be a highly relevant recommendation candidate. On the other hand, a product called "AI introduction" that can only be connected at the shortest distance of "distance #4" is a recommendation candidate with a low relevance. However, since the product "AI introduction" can be connected at "distance #4" and "distance #5", it has a high score value of "9", and therefore can be determined to be a product with a high relevance and a high recommendation value, for example, compared to the product "remote operation" with a score value of "8".

以上に説明したように、本実施形態では、異種文書間の関連語連携であっても、レコメンド候補算出表230を用いて、異種文書間の関連語連携で接続できた個数と、接続までに要した単語間の距離とを考慮することにより、レコメンド候補のアイテムを選出する際に、関連性(もしくは意外性)に基づく優先順位を設定することができる。 As described above, in this embodiment, even in the case of related word linkage between different documents, the recommendation candidate calculation table 230 is used to take into consideration the number of items that can be connected through related word linkage between different documents and the distance between words required to connect them, making it possible to set priorities based on relevance (or unexpectedness) when selecting recommendation candidate items.

(4)レコメンド算出処理
ユーザがレコメンドしてほしいアイテムは、営業活動の進捗具合に応じて、時々刻々と変化する。そこで、以下では、本実施形態に係る文書情報抽出装置1が、営業活動の進捗に応じてレコメンドアイテムを提案するレコメンド算出処理について説明する。
(4) Recommendation Calculation Process The items that a user wants to be recommended change from moment to moment depending on the progress of sales activities. Therefore, hereinafter, a recommendation calculation process in which the document information extraction device 1 according to the present embodiment proposes recommended items depending on the progress of sales activities will be described.

本説明では、第1文書情報111に含まれる文書(第1文書情報111a~111c等)の何れかを入力情報とし、レコメンド算出処理の実行によって、第2文書情報113に含まれる各文書(例えば第2文書情報113a,113b等)のうちから、複数のレコメンド候補が優先度合いを付けて選出されることにより、好適なレコメンドアイテムがユーザに提案される。なお、以下の処理の開始時には、第1文書情報111(第1文書情報111aを含む)に基づく第1関連語情報112、及び第2文書情報113(第2文書情報113aを含む)に基づく第2関連語情報114が既に生成されているものとする。 In this description, one of the documents (such as the first document information 111a to 111c) included in the first document information 111 is used as input information, and a recommendation calculation process is executed to select multiple recommendation candidates from each document (such as the second document information 113a, 113b, etc.) included in the second document information 113 with a priority order, thereby proposing suitable recommended items to the user. Note that it is assumed that the first related word information 112 based on the first document information 111 (including the first document information 111a) and the second related word information 114 based on the second document information 113 (including the second document information 113a) have already been generated when the following process begins.

図11は、レコメンド算出処理の処理手順例を示すフローチャートである。レコメンド算出処理はアイテム処理部140によって実行される。なお、レコメンド算出処理は、例えば、文書情報抽出装置1が、第1文書情報111からの情報抽出の実行を要求するユーザ操作を受け付けたときに開始される(以後、情報抽出元とされる第1文書情報111を、抽出対象の第1文書情報111と称する)。より具体的には、レコメンド算出処理は、図15に示す活動報告登録画面240のレコメンド実行確認ボタン245が押下されたときに、ステップS110の処理が実行され、図16に示すレコメンド確認画面250のレコメンド実行ボタン253が押下されたときに、ステップS120以降の処理が実行される。 FIG. 11 is a flowchart showing an example of the processing procedure of the recommendation calculation process. The recommendation calculation process is executed by the item processing unit 140. The recommendation calculation process is started, for example, when the document information extraction device 1 receives a user operation requesting the execution of information extraction from the first document information 111 (hereinafter, the first document information 111 from which information is extracted is referred to as the first document information 111 to be extracted). More specifically, in the recommendation calculation process, when the recommendation execution confirmation button 245 on the activity report registration screen 240 shown in FIG. 15 is pressed, the processing of step S110 is executed, and when the recommendation execution button 253 on the recommendation confirmation screen 250 shown in FIG. 16 is pressed, the processing from step S120 onward is executed.

図11によればまず、アイテム処理部140の適合度算出部141が、レコメンド候補算出表230を作成する(ステップS110)。レコメンド候補算出表230については図10で詳述した通りである。また、レコメンド候補算出表230は、後述する関連性優先指定処理で用いられるため、レコメンド候補算出表230を作成する処理は、図12に示す関連性優先指定処理のなか(例えばステップS112とステップS113の間)で実行されるとしてもよい。 According to FIG. 11, first, the compatibility calculation unit 141 of the item processing unit 140 creates the recommendation candidate calculation table 230 (step S110). The recommendation candidate calculation table 230 is as described in detail in FIG. 10. In addition, since the recommendation candidate calculation table 230 is used in the relevance priority designation process described below, the process of creating the recommendation candidate calculation table 230 may be executed during the relevance priority designation process shown in FIG. 12 (for example, between steps S112 and S113).

次に、適合度算出部141は、進捗カテゴリ表117及びレコメンド候補算出表230を用いて、入力情報とされる第1文書情報111(例えば営業日報)に対する関連性(もしくは意外性)に基づいてレコメンド候補とするアイテムを選別する関連性優先指定処理を実行する(ステップS120)。関連性優先指定処理の詳細な処理手順は、図12を参照しながら後述する。 Next, the compatibility calculation unit 141 executes a relevance priority designation process using the progress category table 117 and the recommendation candidate calculation table 230 to select items to be recommendation candidates based on their relevance (or unexpectedness) to the first document information 111 (e.g., a sales daily report) that is the input information (step S120). The detailed processing procedure of the relevance priority designation process will be described later with reference to FIG. 12.

次に、適合度算出部141は、進捗カテゴリ表117及びレコメンド履歴情報115を用いて、アイテムのアクセス度合い(評価値)に基づいてレコメンド候補とするアイテムを選別する評価値優先指定処理を実行する(ステップS130)。評価値優先指定処理の詳細な処理手順は、図13を参照しながら後述する。 Next, the compatibility calculation unit 141 executes an evaluation value priority designation process that uses the progress category table 117 and the recommendation history information 115 to select items to be recommended candidates based on the access level (evaluation value) of the items (step S130). The detailed processing procedure of the evaluation value priority designation process will be described later with reference to FIG. 13.

次に、適合度算出部141は、進捗カテゴリ表117及びレコメンド履歴情報115を用いて、同一案件の営業活動においてレコメンド済みのアイテムであるか否かに基づいてレコメンド候補とするアイテムを選別する過去提案優先指定処理を実行する(ステップS140)。過去提案優先指定処理の詳細な処理手順は、図14を参照しながら後述する。 Next, the compatibility calculation unit 141 executes a past proposal priority designation process that uses the progress category table 117 and the recommendation history information 115 to select items to be recommended candidates based on whether or not the items have been recommended in the sales activities of the same case (step S140). The detailed processing procedure of the past proposal priority designation process will be described later with reference to FIG. 14.

なお、ステップS120~S140の各処理の実行順序は図11の例に限定されず、適宜入れ替えてもよい。 Note that the order in which steps S120 to S140 are executed is not limited to the example in FIG. 11 and may be changed as appropriate.

続いて、アイテム推薦部142が、ステップS120~S140の各優先指定処理の実行結果を踏まえて、レコメンドアイテムの優先順位を決定する(ステップS150)。詳しくは、ステップS150においてアイテム推薦部142は、ステップS120~S140の各優先指定処理で指定されたレコメンド候補の選出条件に基づいて、第2文書情報113に含まれる各アイテムを選別して優先順位を付し、優先順位が上位のアイテムから順に、図16で後述するレコメンド確認画面250のレコメンド結果欄254に表示可能なアイテム数の分だけを、ユーザに提案するレコメンド候補として決定する。 Then, the item recommendation unit 142 determines the priority order of the recommended items based on the execution results of each priority designation process of steps S120 to S140 (step S150). In detail, in step S150, the item recommendation unit 142 selects and prioritizes each item included in the second document information 113 based on the selection conditions for the recommended candidates specified in each priority designation process of steps S120 to S140, and determines, starting from the item with the highest priority, as many items as can be displayed in the recommendation result column 254 of the recommendation confirmation screen 250 described later in FIG. 16 as recommendation candidates to be proposed to the user.

次いで、アイテム出力部143が、ステップS150で決定された優先順位を反映する形態で、レコメンド確認画面250のレコメンド結果欄254にレコメンド候補(レコメンドアイテム)を表示し(ステップS160)、レコメンド算出処理が終了する。 Next, the item output unit 143 displays the recommendation candidates (recommended items) in the recommendation result column 254 of the recommendation confirmation screen 250 in a form that reflects the priority order determined in step S150 (step S160), and the recommendation calculation process ends.

図12は、関連性優先指定処理の処理手順例を示すフローチャートである。前述したように、関連性優先指定処理は、図11のステップS120の処理であって、アイテム処理部140の適合度算出部141によって実行される。 Figure 12 is a flowchart showing an example of the processing procedure for the relatedness priority designation process. As described above, the relatedness priority designation process is the process of step S120 in Figure 11, and is executed by the compatibility calculation unit 141 of the item processing unit 140.

図12によればまず、適合度算出部141は、進捗カテゴリ表117の情報を参照し、抽出対象の第1文書情報111のカテゴリに対応するレコード(進捗カテゴリ情報)を取得する(ステップS121)。 According to FIG. 12, first, the compatibility calculation unit 141 refers to the information in the progress category table 117 and obtains a record (progress category information) corresponding to the category of the first document information 111 to be extracted (step S121).

次に、適合度算出部141は、ステップS121で取得した進捗カテゴリ情報のレコメンド優先ルール1172において、抽出対象の第1文書情報111とレコメンドアイテムとの関連性(または意外性)に関する指定がなされているか否かを判定する(ステップS122)。具体的には、適合度算出部141は、対象のレコメンド優先ルール1172において、図5で例示された分類(A)について有意な指定内容が記載されている場合に、抽出対象の第1文書情報111とレコメンドアイテムとの関連性(または意外性)に関する指定がなされていると判定することができる。レコメンドアイテムとの関連性(または意外性)に関する指定がなされている場合は(ステップS122のYES)、ステップS123に進む。一方、レコメンドアイテムとの関連性(または意外性)に関する指定がなされていない場合は(ステップS122のNO)、関連性または意外性に基づくレコメンド候補の選出条件の指定を行うことなく、関連性優先指定処理を終了する。 Next, the compatibility calculation unit 141 determines whether or not the recommendation priority rule 1172 of the progress category information acquired in step S121 specifies the relevance (or unexpectedness) between the first document information 111 to be extracted and the recommended item (step S122). Specifically, when the target recommendation priority rule 1172 describes a significant specification for the classification (A) illustrated in FIG. 5, the compatibility calculation unit 141 can determine that the relevance (or unexpectedness) between the first document information 111 to be extracted and the recommended item is specified. If the relevance (or unexpectedness) with the recommended item is specified (YES in step S122), proceed to step S123. On the other hand, if the relevance (or unexpectedness) with the recommended item is not specified (NO in step S122), the relevance priority specification process is terminated without specifying the selection conditions for the recommendation candidates based on relevance or unexpectedness.

ステップS123では、適合度算出部141は、対象のレコメンド優先ルール1172に「関連性を優先する」と同義の内容の指定がされているか否かを判定する。 In step S123, the compatibility calculation unit 141 determines whether the target recommendation priority rule 1172 specifies content equivalent to "prioritize relevance."

ステップS123において「関連性を優先する」と同義の内容の指定がされている場合(ステップS123のYES)、適合度算出部141は、関連性の高いアイテムを優先してレコメンド候補にするという選出条件を指定し(ステップS124)、関連性優先指定処理を終了する。ステップS124の処理を詳しく説明すると、適合度算出部141は、例えば、レコメンド候補算出表230を参照し、レコメンド候補とされる複数のアイテム(例えば製品)に対して、関連性の高い(大きい)アイテムからフラグを付ける等して優先度を設定することにより、レコメンド候補の選出条件に関連性の高さを関連付けることができる。 If a specification equivalent to "prioritize relevance" is made in step S123 (YES in step S123), the compatibility calculation unit 141 specifies a selection condition that prioritizes highly relevant items as recommendation candidates (step S124), and ends the relevance priority specification process. To explain the process of step S124 in detail, the compatibility calculation unit 141 can associate the degree of relevance with the selection conditions for recommendation candidates by, for example, referring to the recommendation candidate calculation table 230 and setting priorities for multiple items (e.g., products) that are to be recommended candidates, such as by attaching flags to items with high (large) relevance.

一方、ステップS123において「関連性を優先する」と同義の内容の指定がされていない場合、言い換えれば「意外性を優先する」と同義の内容の指定がされている場合には(ステップS123のNO)、適合度算出部141は、意外性の高いアイテムを優先してレコメンド候補にするという選出条件を指定し(ステップS125)、関連性優先指定処理を終了する。ステップS125の処理を詳しく説明すると、適合度算出部141は、例えば、レコメンド候補算出表230を参照し、レコメンド候補とされる複数のアイテム(例えば製品)に対して、意外性の高い(大きい)アイテムからフラグを付ける等して優先度を設定することにより、レコメンド候補の選出条件に意外性の高さを関連付けることができる。 On the other hand, if no content equivalent to "prioritize relevance" is specified in step S123, in other words if a content equivalent to "prioritize unexpectedness" is specified (NO in step S123), the compatibility calculation unit 141 specifies a selection condition that prioritizes highly unexpected items as recommendation candidates (step S125), and ends the relevance priority specification process. To explain the process of step S125 in detail, the compatibility calculation unit 141 can associate the degree of unexpectedness with the selection conditions for recommendation candidates by, for example, referring to the recommendation candidate calculation table 230 and setting priorities for multiple items (e.g., products) that are to be recommended candidates, such as by attaching a flag to items that are more unexpected (larger).

図13は、評価値優先指定処理の処理手順例を示すフローチャートである。前述したように、評価値優先指定処理は、図11のステップS130の処理であって、アイテム処理部140の適合度算出部141によって実行される。 Figure 13 is a flowchart showing an example of the processing procedure for the evaluation value priority designation process. As described above, the evaluation value priority designation process is the process of step S130 in Figure 11, and is executed by the compatibility calculation unit 141 of the item processing unit 140.

図13によればまず、適合度算出部141は、進捗カテゴリ表117の情報を参照し、抽出対象の第1文書情報111のカテゴリに対応するレコード(進捗カテゴリ情報)を取得する(ステップS131)。次に、適合度算出部141は、レコメンド履歴情報115を取得する(ステップS132)。 According to FIG. 13, first, the compatibility calculation unit 141 refers to the information in the progress category table 117 and acquires a record (progress category information) corresponding to the category of the first document information 111 to be extracted (step S131). Next, the compatibility calculation unit 141 acquires the recommendation history information 115 (step S132).

次に、適合度算出部141は、ステップS131で取得した進捗カテゴリ情報のレコメンド優先ルール1172において、レコメンドアイテムの評価値に関する指定がなされているか否かを判定する(ステップS133)。具体的には、適合度算出部141は、対象のレコメンド優先ルール1172において、図5で例示された分類(B)について有意な指定内容が記載されている場合に、レコメンドアイテムの評価値に関する指定がなされていると判定することができる。レコメンドアイテムの評価値に関する指定がなされている場合は(ステップS133のYES)、ステップS134に進む。一方、レコメンドアイテムの評価値に関する指定がなされていない場合は(ステップS133のNO)、評価値に基づくレコメンド候補の選出条件の指定を行うことなく、評価値優先指定処理を終了する。 Next, the compatibility calculation unit 141 determines whether or not the evaluation value of the recommended item is specified in the recommendation priority rule 1172 of the progress category information acquired in step S131 (step S133). Specifically, the compatibility calculation unit 141 can determine that the evaluation value of the recommended item is specified when the target recommendation priority rule 1172 contains significant specification content for the category (B) illustrated in FIG. 5. If the evaluation value of the recommended item is specified (YES in step S133), the process proceeds to step S134. On the other hand, if the evaluation value of the recommended item is not specified (NO in step S133), the evaluation value priority specification process is terminated without specifying the selection conditions for the recommendation candidates based on the evaluation value.

ステップS134では、適合度算出部141は、対象のレコメンド優先ルール1172に「高評価を優先する」と同義の内容の指定がされているか否かを判定する。 In step S134, the compatibility calculation unit 141 determines whether the target recommendation priority rule 1172 specifies content equivalent to "give priority to highly rated items."

ステップS134において「高評価を優先する」と同義の内容の指定がされている場合(ステップS134のYES)、適合度算出部141は、レコメンド履歴情報115に含まれるアイテムごとの評価値に基づいて、評価値の高いアイテムを優先してレコメンド候補にするという選出条件を指定し(ステップS135)、評価値優先指定処理を終了する。ここで、レコメンド履歴情報115に含まれるアイテムの評価値は、当該アイテムのレコメンド状況によって変化する値であって、具体的には例えば、当該アイテムがユーザによって検索された回数や、過去に当該アイテムがレコメンドされた際にユーザから「参考になった」旨のボタンが押下された回数等に基づいて決定される。すなわち、評価値が高いアイテムは、推奨された場合に有用な(評価が高い)アイテムであることを意味する。したがって、ステップS135において適合度算出部141は、例えば、レコメンド履歴情報115を参照し、レコメンド候補とされる複数のアイテム(例えば製品)に対して、評価値の高いアイテムからフラグを付ける等して優先度を設定することにより、レコメンド候補の選出条件に評価値の高さを関連付けることができる。 If a content equivalent to "give priority to high ratings" is specified in step S134 (YES in step S134), the compatibility calculation unit 141 specifies a selection condition that prioritizes items with high ratings as recommendation candidates based on the rating value of each item included in the recommendation history information 115 (step S135), and ends the rating value priority specification process. Here, the rating value of an item included in the recommendation history information 115 is a value that changes depending on the recommendation status of the item, and is determined based on, for example, the number of times the item has been searched for by a user or the number of times the user pressed the "helpful" button when the item was recommended in the past. In other words, an item with a high rating value means that it is a useful (highly rated) item when recommended. Therefore, in step S135, the compatibility calculation unit 141 can, for example, refer to the recommendation history information 115 and set priorities for multiple items (e.g., products) that are to be recommendation candidates by attaching flags to items with higher evaluation values, thereby associating the high evaluation values with the selection criteria for recommendation candidates.

一方、ステップS134において「高評価を優先する」と同義の内容の指定がされていない場合、言い換えれば「低評価を優先する」と同義の内容の指定がされている場合には(ステップS134のNO)、適合度算出部141は、評価値の低いアイテムを優先してレコメンド候補にするという選出条件を指定し(ステップS136)、評価値優先指定処理を終了する。ステップS136のより具体的な処理については、ステップS135とは逆の基準で優先度を設定すればよいことから、詳細な説明を省略する。 On the other hand, if no specification equivalent to "give priority to high ratings" has been made in step S134, in other words, if a specification equivalent to "give priority to low ratings" has been made (NO in step S134), the compatibility calculation unit 141 specifies a selection condition that prioritizes items with low rating values as recommendation candidates (step S136), and ends the rating value priority specification process. A detailed explanation of the specific process of step S136 will be omitted, since it is sufficient to set priorities using the opposite criteria to those in step S135.

図14は、過去提案優先指定処理の処理手順例を示すフローチャートである。前述したように、過去提案優先指定処理は、図11のステップS140の処理であって、アイテム処理部140の適合度算出部141によって実行される。 Figure 14 is a flowchart showing an example of the processing procedure for the past proposal priority designation process. As described above, the past proposal priority designation process is the process of step S140 in Figure 11, and is executed by the compatibility calculation unit 141 of the item processing unit 140.

図14によればまず、適合度算出部141は、進捗カテゴリ表117の情報を参照し、抽出対象の第1文書情報111のカテゴリに対応するレコード(進捗カテゴリ情報)を取得する(ステップS141)。次に、適合度算出部141は、レコメンド履歴情報115を取得する(ステップS142)。 According to FIG. 14, first, the compatibility calculation unit 141 refers to the information in the progress category table 117 and acquires a record (progress category information) corresponding to the category of the first document information 111 to be extracted (step S141). Next, the compatibility calculation unit 141 acquires the recommendation history information 115 (step S142).

次に、適合度算出部141は、ステップS141で取得した進捗カテゴリ情報のレコメンド優先ルール1172において、レコメンドアイテムの過去提案に関する指定がなされているか否かを判定する(ステップS143)。具体的には、適合度算出部141は、対象のレコメンド優先ルール1172において、図5で例示された分類(C)について有意な指定内容が記載されている場合に、レコメンドアイテムの過去提案に関する指定がなされていると判定することができる。レコメンドアイテムの過去提案に関する指定がなされている場合は(ステップS143のYES)、ステップS144に進む。一方、レコメンドアイテムの過去提案に関する指定がなされていない場合は(ステップS143のNO)、過去提案に基づくレコメンド候補の選出条件の指定を行うことなく、過去提案優先指定処理を終了する。 Next, the compatibility calculation unit 141 determines whether or not the recommendation priority rule 1172 of the progress category information acquired in step S141 specifies the past proposal of the recommended item (step S143). Specifically, the compatibility calculation unit 141 can determine that the past proposal of the recommended item is specified when the target recommendation priority rule 1172 describes significant specification content for the category (C) illustrated in FIG. 5. If the past proposal of the recommended item is specified (YES in step S143), the process proceeds to step S144. On the other hand, if the past proposal of the recommended item is not specified (NO in step S143), the past proposal priority specification process is terminated without specifying the selection conditions for the recommendation candidates based on the past proposals.

ステップS144では、適合度算出部141は、対象のレコメンド優先ルール1172に「未提案のアイテムを優先する」と同義の内容の指定がされているか否かを判定する。 In step S144, the compatibility calculation unit 141 determines whether the target recommendation priority rule 1172 specifies content equivalent to "give priority to unproposed items."

ステップS144において「未提案のアイテムを優先する」と同義の内容の指定がされている場合(ステップS144のYES)、適合度算出部141は、レコメンド履歴情報115に含まれるレコメンド提案履歴を参照し、本案件に関するレコメンド提案履歴に記録されていない未提案のアイテムを優先してレコメンド候補にするという選出条件を指定し(ステップS145)、過去提案優先指定処理を終了する。ここで、レコメンド履歴情報115に含まれるレコメンド提案履歴は、案件ごとに以前の営業活動で提案したアイテム(レコメンドアイテム)の履歴が蓄積された情報である。すなわち、本案件のレコメンド提案履歴に記録されていないアイテムは、本案件の過去の営業活動で提案されたことがない未提案のアイテムであることを意味する。したがって、ステップS145において適合度算出部141は、例えば、レコメンド履歴情報115に含まれる本案件のレコメンド提案履歴に記録されていないアイテムにフラグを付ける等して優先度を設定することにより、レコメンド候補の選出条件に過去提案の有無を関連付けることができる。 If a specification equivalent to "give priority to unproposed items" is made in step S144 (YES in step S144), the compatibility calculation unit 141 refers to the recommendation proposal history included in the recommendation history information 115, specifies a selection condition that prioritizes unproposed items that are not recorded in the recommendation proposal history for this case as recommendation candidates (step S145), and terminates the past proposal priority specification process. Here, the recommendation proposal history included in the recommendation history information 115 is information that accumulates the history of items (recommended items) proposed in previous sales activities for each case. In other words, items that are not recorded in the recommendation proposal history for this case are unproposed items that have never been proposed in past sales activities for this case. Therefore, in step S145, the compatibility calculation unit 141 can associate the presence or absence of past proposals with the selection conditions for recommendation candidates by, for example, setting a priority by flagging items that are not recorded in the recommendation proposal history of the subject case, which is included in the recommendation history information 115.

一方、ステップS144において「未提案のアイテムを優先する」と同義の内容の指定がされていない場合、例えば「提案済みのアイテムを優先する」と同義の内容の指定がされている場合には(ステップS144のNO)、適合度算出部141は、レコメンド履歴情報115に含まれるレコメンド提案履歴を参照し、本案件に関するレコメンド提案履歴に記録されている提案済みのアイテムを優先してレコメンド候補にするという選出条件を指定し(ステップS146)、評価値優先指定処理を終了する。ステップS146のより具体的な処理については、ステップS145とは逆の基準で優先度を設定すればよいことから、詳細な説明を省略する。 On the other hand, if a specification equivalent to "give priority to unproposed items" is not made in step S144, for example, if a specification equivalent to "give priority to proposed items" is made (NO in step S144), the compatibility calculation unit 141 refers to the recommendation proposal history included in the recommendation history information 115, specifies a selection condition that the proposed items recorded in the recommendation proposal history for this case are given priority as recommendation candidates (step S146), and ends the evaluation value priority specification process. A detailed explanation of the more specific process of step S146 is omitted, since it is sufficient to set the priority based on the opposite criteria to step S145.

(5)出力画面例
以下では、本実施形態に係る文書情報抽出装置1において、営業日報を登録したり、登録した営業日報に対するレコメンドアイテムの選定を実行したりする際に表示される出力画面について、具体例を挙げて説明する。
(5) Example of Output Screen In the following, a specific example of the output screen that is displayed when registering a daily sales report or selecting recommended items for the registered daily sales report in the document information extraction device 1 according to this embodiment will be described.

図15は、活動報告登録画面240の一例である。活動報告登録画面240は、入力情報となる営業日報をユーザが第1文書情報111に登録する際に、出力装置15を介してユーザに提示される画面の一例であって、例えば入力装置14を介してユーザから操作可能なGUI(Graphical User Interface)で実現される。 Figure 15 is an example of an activity report registration screen 240. The activity report registration screen 240 is an example of a screen presented to the user via the output device 15 when the user registers the daily sales report, which is input information, in the first document information 111, and is realized, for example, by a GUI (Graphical User Interface) that can be operated by the user via the input device 14.

図15に示したように、活動報告登録画面240は、営業活動の案件名を選択可能な選択欄241、営業日報を文書情報抽出装置1にアップロードするためのアップロードボタン242、案件を登録するための案件登録ボタン243、選択欄241で選択された案件における営業活動の一覧情報を表示する活動一覧情報欄244、及び、レコメンドアイテムの選出を実行するためのレコメンド実行確認ボタン245、を含んで構成される。 As shown in FIG. 15, the activity report registration screen 240 includes a selection field 241 in which the name of the sales activity case can be selected, an upload button 242 for uploading the daily sales report to the document information extraction device 1, a case registration button 243 for registering the case, an activity list information field 244 for displaying a list of sales activities for the case selected in the selection field 241, and a recommendation execution confirmation button 245 for selecting recommended items.

活動報告登録画面240では、まず、選択欄241において、登録したい営業日報が属する営業活動の案件をユーザが選択することにより、選択した案件における営業活動の一覧情報が活動一覧情報欄244に表示される。図15の例では、「XX製鉄〇×工場のスマート化」という案件が選択されている。 On the activity report registration screen 240, the user first selects in the selection field 241 the sales activity case to which the daily sales report to be registered belongs, and a list of sales activities for the selected case is displayed in the activity list information field 244. In the example of FIG. 15, the case "Smartification of XX Steel's XX Factory" has been selected.

次に、アップロードボタン242が押下されると、例えばファイル選択画面が表示され、ユーザが予め記入しておいた営業日報がアップロードの対象として選択可能となり、ファイル選択画面で所望の営業日報のファイルを選択する操作が行われることによって、当該営業日報が文書情報抽出装置1にアップロードされる。 Next, when the upload button 242 is pressed, for example, a file selection screen is displayed, and the daily sales report that the user has entered in advance can be selected as the item to be uploaded. By selecting the desired daily sales report file on the file selection screen, the daily sales report is uploaded to the document information extraction device 1.

そして、案件登録ボタン243が押下されると、アップロードされた営業日報が、選択中の案件の活動報告書として第1文書情報111に登録される。図15の例では、「XX製鉄案件6」というタイトルの営業日報が「XX製鉄〇×工場のスマート化」という案件に登録される。 When the case registration button 243 is pressed, the uploaded daily sales report is registered in the first document information 111 as an activity report for the selected case. In the example of FIG. 15, the daily sales report titled "XX Steel Works Case 6" is registered in the case "Smartification of XX Steel Works XX Factory."

前述したように、活動一覧情報欄244には、選択欄241で選択した案件における営業活動の一覧情報が表示されている。活動一覧情報欄244内の「活動履歴」欄には、当該案件に登録済みの営業日報に関する情報が表示されており、何れかの営業日報をユーザが選択することができる。図15の例では、タイトル「XX製鉄案件6」の営業日報が選択されている。 As described above, the activity list information field 244 displays a list of sales activities for the case selected in the selection field 241. The "Activity History" field in the activity list information field 244 displays information about the sales daily reports registered for the case, and the user can select one of the sales daily reports. In the example of Figure 15, the sales daily report with the title "XX Steelworks Case 6" has been selected.

そして、活動一覧情報欄244で何れかの営業日報が選択された状態でレコメンド実行確認ボタン245が押下されると、選択中の営業日報を入力情報として、アイテム処理部140が呼び出される。このとき、呼び出されたアイテム処理部140(アイテム出力部143)は、前述したレコメンド算出処理を行って入力情報とされた営業日報から最適なレコメンドを出力するための確認用画面として、レコメンド確認画面250を出力装置15に表示する。図15の例でレコメンド実行確認ボタン245が押下された場合には、タイトル「XX製鉄案件6」の営業日報に対するレコメンド実行について、レコメンド確認画面250が表示される。 When the recommendation execution confirmation button 245 is pressed with any of the daily sales reports selected in the activity list information field 244, the item processing unit 140 is called with the selected daily sales report as input information. At this time, the called item processing unit 140 (item output unit 143) displays a recommendation confirmation screen 250 on the output device 15 as a confirmation screen for performing the recommendation calculation process described above and outputting an optimal recommendation from the daily sales report that has been used as input information. In the example of Figure 15, when the recommendation execution confirmation button 245 is pressed, the recommendation confirmation screen 250 is displayed regarding the execution of a recommendation for the daily sales report with the title "XX Steelmaking Project 6".

図16は、レコメンド確認画面250の一例である。レコメンド確認画面250は、図15に例示した活動報告登録画面240においてレコメンド実行確認ボタン245が押下された場合に、出力装置15を介してユーザに提示される画面の一例であって、例えば入力装置14を介してユーザから操作可能なGUI(Graphical User Interface)で実現される。 Figure 16 is an example of a recommendation confirmation screen 250. The recommendation confirmation screen 250 is an example of a screen presented to the user via the output device 15 when the recommendation execution confirmation button 245 is pressed on the activity report registration screen 240 illustrated in Figure 15, and is realized, for example, by a GUI (Graphical User Interface) that can be operated by the user via the input device 14.

図16に示したように、レコメンド確認画面250は、選択中の営業日報のレコメンドに関する情報を表示する情報欄251、レコメンド優先ルールを手動で切り換えるためのルール変更ボタン252、レコメンド算出処理を実行させるためのレコメンド実行ボタン253、レコメンド結果を表示するレコメンド結果欄254、及びレコメンド結果欄254に表示されたレコメンドアイテムのうち、ユーザが気に入った(または気になった)アイテムを選択するためのレコメンドアイテム選択ボタン255、を含んで構成される。 As shown in FIG. 16, the recommendation confirmation screen 250 includes an information field 251 that displays information about the recommendations for the selected daily sales report, a rule change button 252 for manually switching the recommendation priority rules, a recommendation execution button 253 for executing the recommendation calculation process, a recommendation result field 254 that displays the recommendation results, and a recommendation item selection button 255 for selecting an item that the user likes (or is interested in) from among the recommended items displayed in the recommendation result field 254.

レコメンド確認画面250において、情報欄251には、選択中の営業日報に対して適合度算出部141が進捗カテゴリ表117を参照して文書解析を行った結果が自動表示される。具体的には、情報欄251には、選択中の営業日報のタイトル「XX製鉄案件6」、当該営業日報が該当する「難航」の進捗カテゴリ(図5のカテゴリ名1171参照)、及び当該進捗カテゴリに対応するレコメンド優先ルール(図5のレコメンド優先ルール1172参照)が表示される。 In the recommendation confirmation screen 250, the information field 251 automatically displays the results of the compatibility calculation unit 141 performing document analysis on the selected daily sales report by referring to the progress category table 117. Specifically, the information field 251 displays the title of the selected daily sales report, "XX Steelworks Project 6," the progress category of "Difficulty" to which the daily sales report falls (see category name 1171 in FIG. 5), and the recommendation priority rule corresponding to that progress category (see recommendation priority rule 1172 in FIG. 5).

また、ルール変更ボタン252は、進捗カテゴリの自動分類に応じて情報欄251に表示されたレコメンド優先ルールを、ユーザの希望に応じて手動で変更するために用意されており、「変更」と表示されたルール変更ボタン252が押下された場合には、進捗カテゴリに対応して規定されたレコメンド優先ルールを、ユーザが任意のレコメンド優先ルールに変更する操作を行うことができる。また、レコメンド優先ルールが一旦変更された後は、ルール変更ボタン252は、例えば図16に示したように「戻る」という表示が行われ、この「戻る」と表示されたルール変更ボタン252が押下された場合には、規定のレコメンド優先ルールに戻す等の処理が行われるとしてもよい。 The rule change button 252 is provided to manually change the recommendation priority rule displayed in the information column 251 according to the automatic classification of the progress category according to the user's wishes, and when the rule change button 252 displaying "Change" is pressed, the user can perform an operation to change the recommendation priority rule defined corresponding to the progress category to a recommendation priority rule of his/her choice. After the recommendation priority rule has been changed once, the rule change button 252 may display "Back" as shown in FIG. 16, for example, and when the rule change button 252 displaying "Back" is pressed, a process such as returning to the defined recommendation priority rule may be performed.

そして、レコメンド実行ボタン253が押下されると、情報欄251に表示されたレコメンド優先ルールに基づいて、アイテム処理部140(適合度算出部141、アイテム推薦部142、アイテム出力部143)によってレコメンド算出処理が実行され、上記レコメンド優先ルールに準拠して選出されたレコメンドアイテムがレコメンド結果欄254に表示される。なお、アイテム処理部140は、レコメンド結果欄254に表示された複数のレコメンドアイテムのそれぞれについて、レコメンド履歴情報115に含まれるレコメンド提案履歴を更新する。 When the recommendation execution button 253 is pressed, the item processing unit 140 (suitability calculation unit 141, item recommendation unit 142, item output unit 143) executes a recommendation calculation process based on the recommendation priority rules displayed in the information field 251, and the recommended items selected in accordance with the recommendation priority rules are displayed in the recommendation result field 254. The item processing unit 140 updates the recommendation proposal history included in the recommendation history information 115 for each of the multiple recommended items displayed in the recommendation result field 254.

図16のレコメンド結果欄254には、情報欄251に表示されたレコメンド優先ルールに準拠したレコメンド優先順位に従って選出された複数のレコメンドアイテム(本例では製品名)がグラフ表示によって可視化されている。より詳細には、グラフの縦軸には、レコメンド優先度が上位のアイテムが「オススメ度」の高さによって可視化され、グラフの横軸には、選択中の営業日報(入力情報)の文書との関連性が大きいアイテム(もしくは意外性の大きいアイテム)が、関連性(もしくは意外性)の度合いの大きさ順に並べて表示される。 In the recommendation result column 254 of FIG. 16, multiple recommended items (product names in this example) selected according to the recommendation priority order that complies with the recommendation priority rules displayed in the information column 251 are visualized in a graph. In more detail, the vertical axis of the graph visualizes items with higher recommendation priority according to their "recommended level," and the horizontal axis of the graph displays items that are highly related to the selected daily sales report (input information) document (or items that are highly unexpected) in order of the degree of relatedness (or unexpectedness).

図16の場合、選択された「XX製鉄案件6」の営業日報が該当する進捗カテゴリは「難航」であり、一般には意外性の大きい製品の提案が有効と考えられる。ここで、レコメンド結果欄254に表示された最も意外性の大きいアイテムは「働き方改革製品」であるが、その「オススメ度」は上位2番目に留まっている。一方、「リモート化製品」は、意外性の大きさは3番目であるものの、最も高い「オススメ度」を示すアイテムとなっており、総合的には最も有効なレコメンドアイテムであることが示される。なお、「リモート化製品」の「オススメ度」が高くなった理由としては、「(B)履歴情報の利用方法」のレコメンド優先ルールで設定された「高評価アイテム優先」に基づく影響が大きいと考えられる。また、上述した「働き方改革製品」は、次点の「オススメ度」であることから、このアイテムも有効なレコメンドアイテムと考えてよい。 In the case of FIG. 16, the progress category to which the selected daily sales report of "XX Steel Project 6" corresponds is "Difficult", and generally, it is considered effective to propose a product that is highly unexpected. Here, the most unexpected item displayed in the recommendation result column 254 is "Work Style Reform Product", but its "Recommendation Level" is only in the top two. On the other hand, "Remote Product" is the third most unexpected item, but is the item with the highest "Recommendation Level", and is shown to be the most effective recommended item overall. The reason why the "Recommendation Level" of "Remote Product" is high is thought to be largely due to the influence of "Highly Rated Item Priority" set in the recommendation priority rule of "(B) How to Use History Information". In addition, since the above-mentioned "Work Style Reform Product" has the second highest "Recommendation Level", this item can also be considered to be an effective recommended item.

また、レコメンド結果欄254に表示された各レコメンドアイテムに設けられたレコメンドアイテム選択ボタン255は、対応アイテムをユーザが気に入った(または気になった)場合に押下されることにより、対象アイテムに対する評価値の向上に寄与する。具体的には例えば、レコメンドアイテム選択ボタン255が押下されるごとに、アイテム処理部140が、レコメンド履歴情報115に含まれる対象アイテムの評価値を所定ポイントだけ上乗せしたり、レコメンドアイテム選択ボタン255が押下されると、「参考になった」旨のボタンが表示される別のウインドウを展開し、「参考になった」旨のボタンが押下されたときに、アイテム処理部140が、レコメンド履歴情報115に含まれる対象アイテムの評価値を所定ポイントだけ上乗せしたりすることができる。また例えば、レコメンドアイテム選択ボタン255が押下された場合には、対象のレコメンドアイテムの詳細情報を表示するようにして、その表示期間(閲覧時間)の長さに応じて、アイテム処理部140が、レコメンド履歴情報115に含まれる対象アイテムの評価値を上乗せする等してもよい。また、レコメンド履歴情報115に含まれる各アイテムの評価値は、常に増加するだけに限定されず、例えば表示履歴が追加されても閲覧されなかった場合には減点する等の減少処理を行うようにしてもよい。 In addition, the recommended item selection button 255 provided for each recommended item displayed in the recommendation result column 254 is pressed when the user likes (or is interested in) the corresponding item, thereby contributing to an improvement in the evaluation value of the target item. Specifically, for example, each time the recommended item selection button 255 is pressed, the item processing unit 140 can increase the evaluation value of the target item included in the recommendation history information 115 by a predetermined number of points, or when the recommended item selection button 255 is pressed, another window is opened in which a button indicating "helpful" is displayed, and when the button indicating "helpful" is pressed, the item processing unit 140 can increase the evaluation value of the target item included in the recommendation history information 115 by a predetermined number of points. Also, for example, when the recommended item selection button 255 is pressed, detailed information on the target recommended item is displayed, and the item processing unit 140 may add to the evaluation value of the target item included in the recommendation history information 115 depending on the length of the display period (viewing time). Also, the evaluation value of each item included in the recommendation history information 115 is not limited to always increasing, and may be reduced by deducting points if the display history is added but not viewed.

何れにしても、アイテム処理部140は、レコメンドアイテム選択ボタン255に対するユーザ操作に基づいて、レコメンド履歴情報115に含まれる各アイテムの評価値を変化・更新することにより、以降に実行されるレコメンド算出処理において、評価値優先指定処理(図11のステップS130、図13参照)によるレコメンド候補の選出条件の指定に最新の評価値を反映させることができる。その結果、文書情報抽出装置1は、ユーザの好みや選択傾向を反映した評価値を条件に加えて、より好適な推奨情報を抽出することができる。 In any case, the item processing unit 140 changes and updates the evaluation value of each item included in the recommendation history information 115 based on a user operation on the recommended item selection button 255, so that in the recommendation calculation process executed subsequently, the latest evaluation value can be reflected in the specification of the selection conditions for recommendation candidates by the evaluation value priority specification process (step S130 in FIG. 11, see FIG. 13). As a result, the document information extraction device 1 can add evaluation values reflecting the user's preferences and selection tendencies to the conditions and extract more suitable recommended information.

以上に説明したように、本実施形態に係る文書情報抽出装置1によれば、用途や記載内容が異なる2種以上の文書(第1文書情報111、第2文書情報113)間で、関連語抽出技術により情報連携を可能にする。そして、時系列で入力される入力文書(第1文書情報111)から営業活動などの進捗情報が取得できる文書データの場合、入力文書における活動の進捗に応じた最適なレコメンドアイテムを提案可能となる。 As described above, the document information extraction device 1 according to this embodiment enables information linkage between two or more types of documents (first document information 111, second document information 113) with different uses and content by using related word extraction technology. In the case of document data from which progress information on sales activities, etc. can be obtained from an input document (first document information 111) input in chronological order, it becomes possible to propose optimal recommended items according to the progress of activities in the input document.

また、入力文書である第1文書情報111と、レコメンド対象である第2文書情報113が、表記内容や用途が全く異なる異種文書であっても、本実施形態に係る文書情報抽出装置1によれば、関連語抽出技術により情報連携が可能になることから、入力情報に含まれる進捗状況を考慮して、好適な推奨情報(レコメンドアイテム)を抽出し、提案することが可能となる。具体的には例えば、営業担当者が作成した営業報告書から営業活動の履歴や進捗を把握し、最適なアイテムを製品カタログ文書から容易に検索することが可能となる。 Even if the first document information 111, which is the input document, and the second document information 113, which is the target of recommendation, are heterogeneous documents with completely different written contents and uses, the document information extraction device 1 according to this embodiment enables information linkage through related word extraction technology, so that it is possible to extract and propose suitable recommended information (recommended items) taking into account the progress status contained in the input information. Specifically, for example, it is possible to grasp the history and progress of sales activities from sales reports prepared by sales representatives, and easily search for optimal items from product catalog documents.

以上、本発明の一実施形態について説明したが、本発明は上記の実施形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。例えば、上記の実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、上記実施形態の構成の一部について、他の構成の追加や削除、置換をすることが可能である。具体的には例えば、上記の実施形態では、ユーザに推奨されるレコメンドアイテムの候補情報を含む第2文書情報113について、製品カタログ文書を例に挙げて説明したが、本発明の第2文書情報113は製品カタログ文書に限定されるものではなく、例えば、ナレッジ、特許、論文等、文書形式の様々な文書にも適用可能である。 Although one embodiment of the present invention has been described above, the present invention is not limited to the above embodiment, and it goes without saying that various modifications can be made without departing from the gist of the present invention. For example, the above embodiment has been described in detail to clearly explain the present invention, and is not necessarily limited to having all of the configurations described. In addition, it is possible to add, delete, or replace some of the configurations of the above embodiment with other configurations. Specifically, for example, in the above embodiment, the second document information 113 including candidate information of recommended items recommended to the user was described using a product catalog document as an example, but the second document information 113 of the present invention is not limited to a product catalog document, and can be applied to various document formats such as knowledge, patents, and papers.

また、上記の各構成、機能部、処理部、処理手段等は、それらの一部または全部を、例えば、集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記録装置、ICカード、SDカード、DVD等の記録媒体に置くことができる。 Furthermore, the above-mentioned configurations, functional units, processing units, processing means, etc. may be realized in part or in whole in hardware, for example by designing them as integrated circuits. Furthermore, the above-mentioned configurations, functions, etc. may be realized in software by a processor interpreting and executing a program that realizes each function. Information on the programs, tables, files, etc. that realize each function can be stored in a memory, a hard disk, a recording device such as an SSD (Solid State Drive), an IC card, an SD card, a DVD, or other recording media.

また、以上に説明した各情報処理装置の各種機能部、各種処理部、各種データベースの配置形態は一例に過ぎない。各種機能部、各種処理部、各種データベースの配置形態は、これらの装置が備えるハードウェアやソフトウェアの性能、処理効率、通信効率等の観点から最適な配置形態に変更し得る。 Furthermore, the layout of the various functional units, various processing units, and various databases of each information processing device described above is merely an example. The layout of the various functional units, various processing units, and various databases can be changed to an optimal layout in terms of the performance, processing efficiency, communication efficiency, etc. of the hardware and software equipped in these devices.

また、前述した各種のデータを格納するデータベースの構成(スキーマ(Schema)等)は、リソースの効率的な利用、処理効率向上、アクセス効率向上、検索効率向上等の観点から柔軟に変更し得る。 In addition, the configuration (schema, etc.) of the database that stores the various types of data mentioned above can be flexibly changed from the perspective of efficient use of resources, improved processing efficiency, improved access efficiency, improved search efficiency, etc.

また、図面において制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実施には殆ど全ての構成が相互に接続されていると考えてもよい。 In addition, the control lines and information lines shown in the drawings are those that are considered necessary for explanation, and not all control lines and information lines on the product are necessarily shown. In implementation, it can be assumed that almost all components are interconnected.

1 文書情報抽出装置
10 情報処理装置
11 プロセッサ
12 主記憶装置
13 補助記憶装置
14 入力装置
15 出力装置
16 通信装置
110 記憶部
111 第1文書情報
112 第1関連語情報
113 第2文書情報
114 第2関連語情報
115 レコメンド履歴情報
116 第1関連語表
117 進捗カテゴリ表
118 第2関連語表
120 第1文書処理部
121 固有表現特徴量抽出部
122 学習推論部
123 関連語表生成部
124 進捗カテゴリ生成部
130 第2文書処理部
131 固有表現特徴量抽出部
132 学習推論部
133 関連語表生成部
140 アイテム処理部
141 適合度算出部
142 アイテム推薦部
143 アイテム出力部
210 ネットワークグラフ
220 関連語連携表
230 レコメンド候補算出表
240 活動報告登録画面
250 レコメンド確認画面
1 Document information extraction device 10 Information processing device 11 Processor 12 Main memory device 13 Auxiliary memory device 14 Input device 15 Output device 16 Communication device 110 Memory unit 111 First document information 112 First related word information 113 Second document information 114 Second related word information 115 Recommendation history information 116 First related word table 117 Progress category table 118 Second related word table 120 First document processing unit 121 Named entity feature extraction unit 122 Learning inference unit 123 Related word table generation unit 124 Progress category generation unit 130 Second document processing unit 131 Named entity feature extraction unit 132 Learning inference unit 133 Related word table generation unit 140 Item processing unit 141 Compatibility calculation unit 142 Item recommendation unit 143 Item output unit 210 Network graph 220 Related word link table 230 Recommendation candidate calculation table 240 Activity report registration screen 250 Recommendation confirmation screen

Claims (12)

同一の案件において時系列で記録される活動記録の文書解析を行って推奨アイテムを提案する文書情報抽出装置であって、
前記活動記録が登録された第1文書情報と、前記第1文書情報とは異なる文書種で構成されており、前記推奨アイテムの候補に関する文書データが登録された第2文書情報と、を格納する記憶部と、
前記第1文書情報の前記活動記録に含まれる、進捗状況を示唆するキーワードに基づいて、前記活動記録の進捗状況を、複数段階の進捗カテゴリの何れかに分類する進捗判定部と、
前記第1文書情報から関連する固有表現を構成する第1関連語を抽出し、当該抽出した第1関連語をまとめた第1関連語情報を生成する第1文書処理部と、
前記第2文書情報から関連する固有表現を構成する第2関連語を抽出し、当該抽出した第2関連語をまとめた第2関連語情報を生成する第2文書処理部と、
前記進捗判定部によって分類された前記進捗カテゴリに応じた推奨アイテムの選出条件と、共通する関連語で前記第1関連語情報と前記第2関連語情報とを接続することによって前記第1文書情報と前記第2文書情報とを連携した関連語連携の結果に基づいて、前記第1文書情報の前記活動記録に含まれる第1関連語に直接的又は間接的に接続された第2関連語を有する推奨アイテムを前記推奨アイテムの候補の中から選出して出力するアイテム処理部と、
を備えることを特徴とする文書情報抽出装置。
A document information extraction device that proposes recommended items by performing document analysis on activity records that are recorded in chronological order for the same case,
a storage unit that stores first document information in which the activity record is registered, and second document information that is configured in a document type different from that of the first document information and in which document data related to the candidate recommended items is registered;
a progress determination unit that classifies the progress status of the activity record into one of a plurality of progress categories based on a keyword that indicates a progress status and is included in the activity record of the first document information;
a first document processing unit that extracts first related terms constituting related named entities from the first document information and generates first related term information that compiles the extracted first related terms;
a second document processing unit that extracts second related terms constituting related named entities from the second document information and generates second related term information that compiles the extracted second related terms;
an item processing unit that selects and outputs, from among the recommended item candidates, a recommended item having a second related word that is directly or indirectly connected to a first related word included in the activity record of the first document information, based on a selection condition for a recommended item according to the progress category classified by the progress determination unit and a result of related word linkage in which the first document information and the second document information are linked by connecting the first related word information and the second related word information with a common related word;
A document information extraction device comprising:
前記進捗状況を表す複数段階の進捗カテゴリについて、各進捗カテゴリに対応する所定の前記キーワードが予め定められており、
前記進捗判定部は、前記第1文書情報に含まれる各前記活動記録から前記キーワードを抽出し、当該抽出したキーワードに基づいて、各前記活動記録の進捗状況を前記複数段階の進捗カテゴリの何れかに分類する
ことを特徴とする請求項1に記載の文書情報抽出装置。
a predetermined keyword corresponding to each of a plurality of progress categories representing the progress status is determined in advance;
The document information extraction device according to claim 1, characterized in that the progress determination unit extracts the keywords from each of the activity records included in the first document information, and classifies the progress status of each of the activity records into one of the multiple progress categories based on the extracted keywords.
前記複数段階の進捗カテゴリごとにどのような属性の前記推奨アイテムを優先して推奨すべきかが指定されている所定の優先ルールが予め用意され、
前記アイテム処理部は、前記進捗判定部によって分類された前記進捗カテゴリに対応する前記優先ルールに応じた選条件を指定し、前記推奨アイテムの候補から前記推奨アイテムを選出する
ことを特徴とする請求項2に記載の文書情報抽出装置。
a predetermined priority rule is prepared in advance, which specifies what attributes of the recommended items should be preferentially recommended for each of the multiple stages of progress categories;
The document information extraction device according to claim 2 , wherein the item processing unit specifies a selection condition according to the priority rule corresponding to the progress category classified by the progress determination unit, and selects the recommended item from the candidate recommended items.
前記優先ルールはユーザ操作に応じて変更することができ、前記ユーザ操作が行われた場合、前記アイテム処理部は、変更後の前記優先ルールに応じた選条件を指定し、前記推奨アイテムの候補から前記推奨アイテムを選出する
ことを特徴とする請求項3に記載の文書情報抽出装置。
The document information extraction device according to claim 3, characterized in that the priority rules can be changed in response to a user operation, and when the user operation is performed, the item processing unit specifies selection conditions in accordance with the changed priority rules and selects the recommended items from the candidate recommended items.
前記優先ルールには、前記活動記録との関連性を前記推奨アイテムの選出条件に反映することを指定する関連性優先指定を含めることができ、
前記優先ルールに前記関連性優先指定が含まれる場合、前記アイテム処理部は、
前記活動記録に含まれる前記第1関連語と前記第2文書情報に含まれる前記第2関連語との、前記関連語連携における距離に基づいて、当該第2関連語を有する前記推奨アイテムの候補の前記関連性を判断し、
前記判断の結果に基づいて、前記選出における前記推奨アイテムの各候補の優先度を設定する
ことを特徴とする請求項3に記載の文書情報抽出装置。
The priority rule may include a relevance priority designation that specifies that the relevance to the activity record is reflected in the selection conditions of the recommended items,
When the priority rule includes the relevance priority designation, the item processing unit:
determining the relevance of the recommended item candidate having the second related term based on a distance in the related term linkage between the first related term included in the activity record and the second related term included in the second document information;
The document information extraction device according to claim 3 , further comprising: setting a priority of each of the candidates for the recommended items in the selection based on a result of the judgment.
前記優先ルールには、前記活動記録に対する意外性を前記推奨アイテムの選出条件に反映することを指定する意外性優先指定を含めることができ、
前記優先ルールに前記意外性優先指定が含まれる場合、前記アイテム処理部は、
前記活動記録に含まれる前記第1関連語と前記第2文書情報に含まれる前記第2関連語との、前記関連語連携における距離及び接続数に基づいて、当該第2関連語を有する前記推奨アイテムの候補の前記意外性を判断し、
前記判断の結果に基づいて、前記選出における前記推奨アイテムの各候補の優先度を設定する
ことを特徴とする請求項3に記載の文書情報抽出装置。
The priority rule may include a surprise priority designation that designates that the surprise of the activity record is reflected in the selection conditions of the recommended items,
When the priority rule includes the unexpectedness priority designation, the item processing unit:
determining the unexpectedness of the recommended item candidate having the second related term based on a distance and a number of connections in the related term linkage between the first related term included in the activity record and the second related term included in the second document information;
The document information extraction device according to claim 3 , further comprising: setting a priority of each of the candidates for the recommended items in the selection based on a result of the judgment.
前記記憶部には、前記アイテム処理部によって選出された前記案件の過去の前記推奨アイテムに関する情報が記録されたレコメンド履歴情報をさらに格納し、
前記優先ルールには、前記案件における出力履歴の有無を当該案件における前記推奨アイテムの選出条件に反映することを指定する過去提案優先指定を含めることができ、
前記優先ルールに前記過去提案優先指定が含まれる場合、前記アイテム処理部は、前記レコメンド履歴情報における記録の有無に基づいて、前記選出における前記推奨アイテムの各候補の優先度を設定する
ことを特徴とする請求項3に記載の文書情報抽出装置。
The storage unit further stores recommendation history information in which information about the past recommended items of the job selected by the item processing unit is recorded,
The priority rule may include a past proposal priority specification that specifies that the presence or absence of an output history of the item is reflected in the selection conditions of the recommended items for the item,
The document information extraction device according to claim 3, characterized in that, when the priority rule includes the past proposal priority designation, the item processing unit sets a priority of each candidate of the recommended items in the selection based on whether or not it is recorded in the recommendation history information.
前記レコメンド履歴情報には、前記アイテム処理部によって選出された前記案件の過去の前記推奨アイテムのそれぞれについて、ユーザによるアクセス結果に基づいて所定の方法で算出される評価値が保持され、
前記優先ルールには、前記評価値を前記推奨アイテムの選出条件に反映することを指定する評価値優先指定を含めることができ、
前記優先ルールに前記評価値優先指定が含まれる場合、前記アイテム処理部は、前記レコメンド履歴情報における前記評価値に基づいて、前記選出における前記推奨アイテムの各候補の優先度を設定する
ことを特徴とする請求項7に記載の文書情報抽出装置。
The recommendation history information holds an evaluation value calculated by a predetermined method based on a user's access results for each of the past recommended items of the case selected by the item processing unit, and
The priority rule may include an evaluation value priority specification that specifies that the evaluation value is to be reflected in a selection condition for the recommended item,
The document information extraction device according to claim 7, characterized in that, when the priority rule includes the evaluation value priority specification, the item processing unit sets a priority of each candidate of the recommended items in the selection based on the evaluation value in the recommendation history information.
同一の案件において時系列で記録される活動記録の文書解析を行って推奨アイテムを提案する文書情報抽出装置による文書情報抽出方法であって、
前記活動記録を第1文書情報に登録する第1文書情報記憶ステップと、
前記推奨アイテムの候補に関する文書データを、前記第1文書情報とは異なる文書種で構成されている第2文書情報に登録する第2文書情報記憶ステップと、
前記第1文書情報の前記活動記録に含まれる、進捗状況を示唆するキーワードに基づいて、当該活動記録の進捗状況を、複数段階の進捗カテゴリの何れかに分類する進捗判定ステップと、
前記第1文書情報から関連する固有表現を構成する第1関連語を抽出し、当該抽出した第1関連語をまとめた第1関連語情報を生成する第1文書処理ステップと、
前記第2文書情報から関連する固有表現を構成する第2関連語を抽出し、当該抽出した第2関連語をまとめた第2関連語情報を生成する第2文書処理ステップと、
前記第1文書処理ステップ及び前記第2文書処理ステップの実行後、アイテム処理ステップにおいて、前記進捗判定ステップによって分類された前記進捗カテゴリに応じた推奨アイテムの選出条件と、共通する関連語で前記第1関連語情報と前記第2関連語情報とを接続することによって前記第1文書情報と前記第2文書情報とを連携した関連語連携の結果に基づいて、前記第1文書情報の前記活動記録に含まれる第1関連語に直接的又は間接的に接続された第2関連語を有する推奨アイテムを前記推奨アイテムの候補の中から選出して出力するステップと、
を備えることを特徴とする文書情報抽出方法。
A document information extraction method for a document information extraction device that performs document analysis of activity records recorded in chronological order for the same case to propose recommended items, comprising:
a first document information storage step of registering the activity record in first document information;
a second document information storage step of registering document data related to the candidate recommended items in second document information composed of a document type different from that of the first document information;
a progress determination step of classifying the progress of the activity record into one of a plurality of progress categories based on a keyword suggesting the progress, the keyword being included in the activity record of the first document information;
a first document processing step of extracting first related terms constituting related named entities from the first document information and generating first related term information that compiles the extracted first related terms;
a second document processing step of extracting second related terms constituting related named entities from the second document information and generating second related term information that compiles the extracted second related terms;
After the first document processing step and the second document processing step are executed , in an item processing step, a step of selecting and outputting, from among the recommended item candidates, a recommended item having a second related word directly or indirectly connected to a first related word included in the activity record of the first document information, based on a selection condition for a recommended item corresponding to the progress category classified in the progress determination step and a result of related word linkage in which the first document information and the second document information are linked by connecting the first related word information and the second related word information with a common related word ;
A document information extraction method comprising:
前記進捗状況を表す複数段階の進捗カテゴリについて、各進捗カテゴリに対応する所定の前記キーワードが予め定められており、
前記進捗判定ステップでは、前記第1文書情報に含まれる各前記活動記録から前記キーワードを抽出し、当該抽出したキーワードに基づいて、各前記活動記録の進捗状況を前記複数段階の進捗カテゴリの何れかに分類する
ことを特徴とする請求項9に記載の文書情報抽出方法。
a predetermined keyword corresponding to each of a plurality of progress categories representing the progress status is determined in advance;
The document information extraction method according to claim 9, characterized in that in the progress determination step, the keywords are extracted from each of the activity records included in the first document information, and the progress status of each of the activity records is classified into one of the multiple progress categories based on the extracted keywords.
前記複数段階の進捗カテゴリごとにどのような属性の前記推奨アイテムを優先して推奨すべきかが指定されている所定の優先ルールが予め用意され、
前記アイテム処理ステップでは、前記進捗判定ステップで分類された前記進捗カテゴリに対応する前記優先ルールに応じた選条件を指定し、前記推奨アイテムの候補から前記推奨アイテムを選出する
ことを特徴とする請求項10に記載の文書情報抽出方法。
a predetermined priority rule is prepared in advance, which specifies what attributes of the recommended items should be preferentially recommended for each of the multiple stages of progress categories;
The document information extraction method according to claim 10, characterized in that in the item processing step, a selection condition according to the priority rule corresponding to the progress category classified in the progress determination step is specified, and the recommended item is selected from the candidate recommended items.
前記優先ルールはユーザ操作に応じて変更することができ、前記ユーザ操作が行われた場合、前記アイテム処理ステップでは、変更後の前記優先ルールに応じた選条件を指定し、前記推奨アイテムの候補から前記推奨アイテムを選出する
ことを特徴とする請求項11に記載の文書情報抽出方法。
The document information extraction method according to claim 11, characterized in that the priority rules can be changed in response to a user operation, and when the user operation is performed, in the item processing step, selection conditions are specified in accordance with the changed priority rules, and the recommended items are selected from the candidate recommended items.
JP2020148544A 2020-09-03 2020-09-03 Document information extraction device and document information extraction method Active JP7536558B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020148544A JP7536558B2 (en) 2020-09-03 2020-09-03 Document information extraction device and document information extraction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020148544A JP7536558B2 (en) 2020-09-03 2020-09-03 Document information extraction device and document information extraction method

Publications (2)

Publication Number Publication Date
JP2022042882A JP2022042882A (en) 2022-03-15
JP7536558B2 true JP7536558B2 (en) 2024-08-20

Family

ID=80641554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020148544A Active JP7536558B2 (en) 2020-09-03 2020-09-03 Document information extraction device and document information extraction method

Country Status (1)

Country Link
JP (1) JP7536558B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023182172A (en) * 2022-06-14 2023-12-26 日本電信電話株式会社 Information recommendation system, information recommendation method, and information recommendation program
CN115907275B (en) * 2023-01-05 2023-06-16 希维科技(广州)有限公司 Method for generating equipment recommendation information based on product characteristics and electronic equipment
JP2024099884A (en) * 2023-01-13 2024-07-26 株式会社三井E&S Natural language processing system, program and natural language processing method
JP2024134372A (en) 2023-03-20 2024-10-03 富士フイルムビジネスイノベーション株式会社 Information processing device and information processing program
JP2024134373A (en) 2023-03-20 2024-10-03 富士フイルムビジネスイノベーション株式会社 Information processing device and information processing program

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070203785A1 (en) 2000-10-23 2007-08-30 Thompson Keith T Method of assisting a sales representative in selling
JP2008152641A (en) 2006-12-19 2008-07-03 Toyota Central R&D Labs Inc Similar example sentence search device
WO2010026900A1 (en) 2008-09-03 2010-03-11 日本電気株式会社 Relationship detector, relationship detection method, and recording medium
WO2013145162A1 (en) 2012-03-28 2013-10-03 株式会社日立システムズ Application development sales support system
JP2013239132A (en) 2012-05-17 2013-11-28 Nippon Hoso Kyokai <Nhk> Similarity computation device, similar program search device, and program therefor
JP2018106690A (en) 2016-12-27 2018-07-05 キヤノンマーケティングジャパン株式会社 Information processing apparatus, method for controlling information processing apparatus, and program
JP2019008530A (en) 2017-06-23 2019-01-17 株式会社日立製作所 Business activity assisting system, business activity assisting method and business activity assisting program

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070203785A1 (en) 2000-10-23 2007-08-30 Thompson Keith T Method of assisting a sales representative in selling
JP2008152641A (en) 2006-12-19 2008-07-03 Toyota Central R&D Labs Inc Similar example sentence search device
WO2010026900A1 (en) 2008-09-03 2010-03-11 日本電気株式会社 Relationship detector, relationship detection method, and recording medium
WO2013145162A1 (en) 2012-03-28 2013-10-03 株式会社日立システムズ Application development sales support system
JP2013239132A (en) 2012-05-17 2013-11-28 Nippon Hoso Kyokai <Nhk> Similarity computation device, similar program search device, and program therefor
JP2018106690A (en) 2016-12-27 2018-07-05 キヤノンマーケティングジャパン株式会社 Information processing apparatus, method for controlling information processing apparatus, and program
JP2019008530A (en) 2017-06-23 2019-01-17 株式会社日立製作所 Business activity assisting system, business activity assisting method and business activity assisting program

Also Published As

Publication number Publication date
JP2022042882A (en) 2022-03-15

Similar Documents

Publication Publication Date Title
JP7536558B2 (en) Document information extraction device and document information extraction method
US12197505B2 (en) Data preparation using semantic roles
Scaffidi et al. Red Opal: product-feature scoring from reviews
US9477729B2 (en) Domain based keyword search
US20100094844A1 (en) Deduction of analytic context based on text and semantic layer
JP7065718B2 (en) Judgment support device and judgment support method
WO1999046698A1 (en) Document processor and recording medium
JP5836893B2 (en) File management apparatus, file management method, and program
JP2016099741A (en) Information extraction support apparatus, method and program
JP2020201819A (en) Business matching support device and business matching support method
US20210342344A1 (en) Weighed Order Decision Making with Visual Representation
JP7457392B2 (en) Document processing method, document processing program, and information processing device
JP6120607B2 (en) Requirement detection apparatus and requirement detection program
JP7685921B2 (en) Information processing system, information processing method, and information processing program
JP2005128872A (en) Document retrieving system and document retrieving program
US11514060B2 (en) Support system, storage medium, and method for presenting relationships of items
Shafie et al. Review of the Lazada application on Google Play Store: Sentiment Analysis
JP6506839B2 (en) Dissatisfied information processing device and system
JP2021193537A (en) Business matching support device and method
JP2021043491A (en) Analytical equipment, analysis method and program
JP2009032118A (en) Information structuring device, information structuring method, and program
JP4287464B2 (en) System infrastructure configuration development support system and support method
JP7273293B2 (en) Information processing device, control method, program
JP5458058B2 (en) Product name identity determination device and product name identity determination program
JP4146067B2 (en) Document search system and document search method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240807

R150 Certificate of patent or registration of utility model

Ref document number: 7536558

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150