Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7616761B2 - QUESTION ESTIMATION DEVICE, TRAINED MODEL GENERATION DEVICE, QUESTION ESTIMATION METHOD, TRAINED MODEL PRODUCTION METHOD, PROGRAM, AND RECORDING MEDIUM - Google Patents
[go: Go Back, main page]

JP7616761B2 - QUESTION ESTIMATION DEVICE, TRAINED MODEL GENERATION DEVICE, QUESTION ESTIMATION METHOD, TRAINED MODEL PRODUCTION METHOD, PROGRAM, AND RECORDING MEDIUM - Google Patents

QUESTION ESTIMATION DEVICE, TRAINED MODEL GENERATION DEVICE, QUESTION ESTIMATION METHOD, TRAINED MODEL PRODUCTION METHOD, PROGRAM, AND RECORDING MEDIUM Download PDF

Info

Publication number
JP7616761B2
JP7616761B2 JP2020188861A JP2020188861A JP7616761B2 JP 7616761 B2 JP7616761 B2 JP 7616761B2 JP 2020188861 A JP2020188861 A JP 2020188861A JP 2020188861 A JP2020188861 A JP 2020188861A JP 7616761 B2 JP7616761 B2 JP 7616761B2
Authority
JP
Japan
Prior art keywords
sentence
question
data
answer
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020188861A
Other languages
Japanese (ja)
Other versions
JP2022077831A (en
Inventor
尚之 中井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP2020188861A priority Critical patent/JP7616761B2/en
Publication of JP2022077831A publication Critical patent/JP2022077831A/en
Application granted granted Critical
Publication of JP7616761B2 publication Critical patent/JP7616761B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、質問推定装置、学習済みモデル生成装置、質問推定方法、学習済みモデルの生産方法、プログラム及び記録媒体に関する。 The present invention relates to a question estimation device, a trained model generation device, a question estimation method, a trained model production method, a program, and a recording medium.

カスタマからの質問に対応する担当者を支援するため、前記質問に対する回答を自動的に作成し、必要に応じて担当者により回答させる技術が報告されている(例えば、特許文献1等)。 In order to support staff who respond to questions from customers, technology has been reported that automatically creates answers to the questions and allows the staff to answer them as necessary (for example, Patent Document 1, etc.).

特開2004-171479号公報JP 2004-171479 A

しかしながら、複数人のカスタマを1人の担当者が担当する場合、一方のカスタマへの回答を他方のカスタマに誤って送信した事故(誤送信ともいう)が多数発生している。 However, when one person is responsible for multiple customers, there are many cases where a response intended for one customer is mistakenly sent to another customer (also known as mis-sending).

そこで、本発明は、誤送信を未然に防ぐことが可能な質問推定装置、学習済みモデル生成装置、質問推定方法、学習済みモデルの生産方法、プログラム及び記録媒体を提供することを目的とする。 The present invention aims to provide a question estimation device, a trained model generation device, a question estimation method, a trained model production method, a program, and a recording medium that can prevent erroneous transmissions.

前記目的を達成するために、本発明の質問推定装置は、
会話履歴データ取得部、文章タイプ識別部、質問回答表生成部、未送信文章取得部、及び推定質問文章生成部を含み、
前記会話履歴データ取得部は、終了した会話の文字データである会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記文章タイプ識別部は、前記文章データ毎に文章タイプを識別し、
前記文章タイプは、質問タイプと、回答タイプとを含み、
前記質問回答表生成部は、前記識別の結果に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成し、
前記未送信文章取得部は、継続中の会話において、他のユーザへの送信前である未送信回答文章を取得し、
前記推定質問文章生成部は、前記質問回答表及び前記未送信回答文章に基づき、前記未送信回答文章に対応する推定質問文章を生成する、装置である。
In order to achieve the above object, the question estimation device of the present invention comprises:
The system includes a conversation history data acquisition unit, a sentence type identification unit, a question and answer table generation unit, an unsent sentence acquisition unit, and an estimated question sentence generation unit,
the conversation history data acquisition unit acquires conversation history data, which is character data of a completed conversation;
The conversation history data is composed of a plurality of sentence data,
The text type identification unit identifies a text type for each of the text data,
The sentence types include a question type and an answer type,
the question and answer table generating unit generates a question and answer table by linking the sentence data of the question type with the sentence data of the answer type based on a result of the identification;
The unsent text acquisition unit acquires an unsent reply text that has not yet been transmitted to another user in an ongoing conversation,
The estimated question sentence generation unit is a device that generates an estimated question sentence corresponding to the untransmitted answer sentence based on the question and answer table and the untransmitted answer sentence.

本発明の学習済みモデル生成装置は、
データ取得部、及び学習済みモデル生成部を含み、
前記データ取得部は、回答タイプの文章データと紐づけた質問タイプの文章データを教師データとして取得し、
前記学習済みモデル生成部は、前記教師データを用いた機械学習によって、前記回答タイプの文章データを入力した場合に、前記回答タイプの文章データに対応する推定質問文章を生成して出力する第1の学習済みモデルを生成する、装置である。
The trained model generation device of the present invention comprises:
The data acquisition unit and the trained model generation unit are included.
the data acquisition unit acquires question-type sentence data linked to answer-type sentence data as teacher data;
The trained model generation unit is a device that generates a first trained model by machine learning using the teacher data, which generates and outputs an estimated question sentence corresponding to the answer type sentence data when the answer type sentence data is input.

本発明の質問推定方法は、
会話履歴データ取得工程、文章タイプ識別工程、質問回答表生成工程、未送信文章取得工程、及び推定質問文章生成工程を含み、
前記会話履歴データ取得工程は、終了した会話の文字データである会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記文章タイプ識別工程は、前記文章データ毎に文章タイプを識別し、
前記文章タイプは、質問タイプと、回答タイプとを含み、
前記質問回答表生成工程は、前記識別の結果に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成し、
前記未送信文章取得工程は、継続中の会話において、他のユーザへの送信前である未送信回答文章を取得し、
前記推定質問文章生成工程は、前記質問回答表及び前記未送信回答文章に基づき、前記未送信回答文章に対応する推定質問文章を生成する、方法である。
The question estimation method of the present invention includes the steps of:
The method includes a conversation history data acquisition step, a sentence type identification step, a question and answer table generation step, an unsent sentence acquisition step, and an estimated question sentence generation step,
The conversation history data acquisition step acquires conversation history data, which is character data of a completed conversation,
The conversation history data is composed of a plurality of sentence data,
The text type identification step includes identifying a text type for each of the text data,
The sentence types include a question type and an answer type,
the question and answer table generating step links the sentence data of the question type with the sentence data of the answer type based on a result of the identification to generate a question and answer table;
The unsent text acquisition step includes acquiring an unsent reply text that has not yet been transmitted to another user in an ongoing conversation,
The estimated question sentence generating step is a method of generating an estimated question sentence corresponding to the untransmitted answer sentence based on the question and answer table and the untransmitted answer sentence.

本発明の学習済みモデルの生産方法は、
データ取得工程、及び学習済みモデル生成工程を含み、
前記データ取得工程は、回答タイプの文章データと紐づけた質問タイプの文章データを教師データとして取得し、
前記学習済みモデル生成工程は、前記教師データを用いた機械学習によって、前記回答タイプの文章データを入力した場合に、前記回答タイプの文章データに対応する推定質問文章を生成して出力する第1の学習済みモデルを生成する、生産方法である。
The method for producing a trained model of the present invention includes the steps of:
The method includes a data acquisition process and a trained model generation process.
The data acquisition step includes acquiring question-type sentence data linked to answer-type sentence data as teacher data,
The trained model generation process is a production method for generating a first trained model by machine learning using the training data, which generates and outputs an estimated question sentence corresponding to the answer type of sentence data when the answer type of sentence data is input.

本発明によれば、誤送信を未然に防ぐことができる。 The present invention makes it possible to prevent erroneous transmissions.

図1は、実施形態1の質問推定装置の一例の構成を示すブロック図である。FIG. 1 is a block diagram illustrating a configuration of an example of a question estimation device according to the first embodiment. 図2は、実施形態1の質問推定装置のハードウエア構成の一例を示すブロック図である。FIG. 2 is a block diagram illustrating an example of a hardware configuration of the question estimation device according to the first embodiment. 図3は、実施形態1の質問推定装置における処理の一例を示すフローチャートである。FIG. 3 is a flowchart illustrating an example of a process in the question estimating device of the first embodiment. 図4は、会話履歴データベースの一例を示す図である。FIG. 4 is a diagram showing an example of the conversation history database. 図5は、送信された各文章データの時系列の一例を示す図である。FIG. 5 is a diagram showing an example of a time series of each piece of transmitted document data. 図6は、実施形態1の質問推定装置における質問回答表の生成の一例を示す図である。FIG. 6 is a diagram illustrating an example of generation of a question and answer table in the question estimation device of the first embodiment. 図7(A)は、実施形態2の学習済みモデル生成装置の一例の構成を示すブロック図であり、図7(B)は、前記学習済みモデル生成装置のハードウエア構成の一例を示すブロック図である。FIG. 7(A) is a block diagram showing an example of the configuration of a trained model generation device of embodiment 2, and FIG. 7(B) is a block diagram showing an example of the hardware configuration of the trained model generation device. 図8は、実施形態2の学習済みモデル生成装置における処理の一例を示すフローチャートである。FIG. 8 is a flowchart showing an example of processing in the trained model generation device of the second embodiment. 図9は、実施形態3において、質問文章推定モデルを作成する一例について示す図である。FIG. 9 is a diagram showing an example of creating a question sentence estimation model in the third embodiment. 図10は、実施形態3において、生成した推定質問文章と継続中の会話における送信済み質問文章との類似度を分析する一例を示す図である。FIG. 10 is a diagram showing an example of analyzing the similarity between a generated estimated question sentence and a question sentence already sent in an ongoing conversation in the third embodiment.

本発明の質問推定装置において、例えば、
前記文章タイプ識別部は、不要文識別部、不要文削除部、形態素解析部、及び識別部を含み、
前記不要文識別部は、前記文章データ内の不要文を識別し、
前記不要文削除部は、前記識別した不要文を前記文章データから削除し、
前記形態素解析部は、前記文章データに対して文単位で形態素解析を行い、
前記識別部は、前記形態素解析に基づき、予め設定した文末表現ルールに従って、前記文章データの文章タイプを識別する、という態様であってもよい。
In the question estimation device of the present invention, for example,
the sentence type identification unit includes an unnecessary sentence identification unit, an unnecessary sentence deletion unit, a morphological analysis unit, and an identification unit;
The unnecessary sentence identification unit identifies unnecessary sentences in the text data,
the unnecessary sentence deletion unit deletes the identified unnecessary sentences from the text data;
The morphological analysis unit performs a morphological analysis on the text data on a sentence-by-sentence basis;
The identification unit may identify a sentence type of the sentence data based on the morphological analysis and in accordance with a preset sentence-ending expression rule.

本発明の質問推定装置において、例えば、
前記質問回答表生成部は、下記条件(1)~(3)の少なくとも一方に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成する、という態様であってもよい。
(1)前記回答タイプの文章データに、前記回答タイプの文章データよりも送信時刻の古い前記質問タイプの文章データを紐づける
(2)前記回答タイプの文章データを送信したユーザと異なる他のユーザが送信した前記質問タイプの文章データを紐づける
(3)前記回答タイプの文章データとの紐づけの対象となる前記質問タイプの文章データが複数存在する場合に、前記回答タイプの文章データと前記質問タイプの文章データとの類似度を算出し、前記類似度が高い前記回答タイプの文章データと前記質問タイプの文章データとの組み合わせで紐づける
In the question estimation device of the present invention, for example,
The question and answer table generating unit may generate a question and answer table by linking the sentence data of the question type with the sentence data of the answer type based on at least one of the following conditions (1) to (3):
(1) Linking the answer type text data to the question type text data that was sent earlier than the answer type text data. (2) Linking the question type text data sent by a user other than the user who sent the answer type text data. (3) When there are multiple question type text data to be linked with the answer type text data, calculating the similarity between the answer type text data and the question type text data, and linking the answer type text data and the question type text data with the highest similarity.

本発明の質問推定装置において、例えば、
前記推定質問文章生成部は、質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成し、
前記質問文章推定モデルは、入力された未送信回答文章から前記未送信回答文章に対応する推定質問文章を生成するように学習されたモデルである、という態様であってもよい。
In the question estimation device of the present invention, for example,
the estimated question sentence generation unit inputs the acquired untransmitted answer sentence into a question sentence estimation model to generate an estimated question sentence corresponding to the untransmitted answer sentence;
The question sentence estimation model may be a model trained to generate an estimated question sentence corresponding to an input untransmitted answer sentence from the input untransmitted answer sentence.

本発明の質問推定装置は、例えば、
さらに、学習処理部を含み、
前記学習処理部は、前記質問回答表における前記質問文章を教師データとし、前記質問タイプの文章データと紐づけられている前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築し、
前記推定質問文章生成部は、前記構築した質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成する、という態様であってもよい。
The question estimation device of the present invention, for example,
Further, a learning processing unit is included,
the learning processing unit uses the question sentence in the question and answer table as training data and uses sentence data of the answer type linked to sentence data of the question type as input data to construct the question sentence estimation model through supervised machine learning;
The estimated question sentence generation unit may input the acquired unsent answer sentence to the constructed question sentence estimation model, and generate an estimated question sentence corresponding to the unsent answer sentence.

前記学習処理部を含む態様の本発明の質問推定装置において、例えば、
前記学習処理部は、前記教師付き機械学習を行う前に、入力された文章データをベクトルに変換するように教師なし学習されたベクトル変換学習済みモデルに、前記質問回答表の各文章データを入力して、前記各文章データをベクトルに変換し、且つ
前記ベクトルに変換した前記質問タイプの文章データを教師データとし、前記ベクトルに変換した前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築する、という態様であってもよい。
In the question estimation device of the present invention including the learning processing unit, for example,
The learning processing unit may input each piece of text data in the question and answer list into a vector conversion trained model that has been trained in an unsupervised manner to convert input text data into a vector before performing the supervised machine learning, converting each piece of text data into a vector, and using the text data of the question type converted into the vector as teacher data and the text data of the answer type converted into the vector as input data to construct the question text estimation model by supervised machine learning.

本発明の質問推定装置は、例えば、
さらに、出力部、質問文章取得部、及び類似度分析部を含み、
前記質問文章取得部は、継続中の会話における送信済みであって且つ他のユーザが送信した質問タイプの文章データを取得し、
前記類似度分析部は、前記送信済みの質問タイプの文章データと前記生成した推定質問文章と比較して類似度を分析し、
前記出力部は、前記類似度を出力ずる、という態様であってもよい。
The question estimation device of the present invention, for example,
Further, the apparatus includes an output unit, a question sentence acquisition unit, and a similarity analysis unit,
the question sentence acquisition unit acquires question-type sentence data that has been sent in the ongoing conversation and has been sent by another user,
the similarity analysis unit compares the transmitted sentence data of the question type with the generated estimated question sentence to analyze the similarity;
The output unit may output the degree of similarity.

本発明の学習済みモデル生成装置において、例えば、
前記データ取得部は、会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記学習済みモデル生成部は、さらに、前記会話履歴データを用いた教師なし機械学習によって、前記文章データを入力した場合に、前記文章データをベクトルに変換して出力する第2の学習済みモデルを生成する、という態様であってもよい。
In the trained model generation device of the present invention, for example,
The data acquisition unit acquires conversation history data,
The conversation history data is composed of a plurality of sentence data,
The trained model generation unit may further generate a second trained model by unsupervised machine learning using the conversation history data, which, when input, converts the sentence data into a vector and outputs the sentence data.

本発明の質問推定方法において、例えば、
前記文章タイプ識別工程は、不要文識別工程、不要文削除工程、形態素解析工程、及び識別工程を含み、
前記不要文識別工程は、前記文章データ内の不要文を識別し、
前記不要文削除工程は、前記識別した不要文を前記文章データから削除し、
前記形態素解析工程は、前記文章データに対して文単位で形態素解析を行い、
前記識別工程は、前記形態素解析に基づき、予め設定した文末表現ルールに従って、前記文章データの文章タイプを識別する、という態様であってもよい。
In the question estimation method of the present invention, for example,
The sentence type identification step includes an unnecessary sentence identification step, an unnecessary sentence deletion step, a morphological analysis step, and an identification step,
The unnecessary sentence identification step includes identifying unnecessary sentences in the text data,
the unnecessary sentence deletion step deletes the identified unnecessary sentences from the text data;
The morphological analysis step performs a morphological analysis on the text data on a sentence-by-sentence basis;
The identification step may be performed by identifying a sentence type of the sentence data based on the morphological analysis and in accordance with a preset sentence-ending expression rule.

本発明の質問推定方法において、例えば、
前記質問回答表生成工程は、下記条件(1)~(3)の少なくとも一方に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成する、という態様であってもよい。
(1)前記回答タイプの文章データに、前記回答タイプの文章データよりも送信時刻の古い前記質問タイプの文章データを紐づける
(2)前記回答タイプの文章データを送信したユーザと異なる他のユーザが送信した前記質問タイプの文章データを紐づける
(3)前記回答タイプの文章データとの紐づけの対象となる前記質問タイプの文章データが複数存在する場合に、前記回答タイプの文章データと前記質問タイプの文章データとの類似度を算出し、前記類似度が高い前記回答タイプの文章データと前記質問タイプの文章データとの組み合わせで紐づける
In the question estimation method of the present invention, for example,
The question and answer table generating step may be performed in a mode in which the question type sentence data and the answer type sentence data are linked to generate a question and answer table based on at least one of the following conditions (1) to (3):
(1) Linking the answer type text data to the question type text data that was sent earlier than the answer type text data. (2) Linking the question type text data sent by a user other than the user who sent the answer type text data. (3) When there are multiple question type text data to be linked with the answer type text data, calculating the similarity between the answer type text data and the question type text data, and linking the answer type text data and the question type text data with the highest similarity.

本発明の質問推定方法において、例えば、
前記推定質問文章生成工程は、質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成し、
前記質問文章推定モデルは、入力された未送信回答文章から前記未送信回答文章に対応する推定質問文章を生成するように学習されたモデルである、という態様であってもよい。
In the question estimation method of the present invention, for example,
the estimated question sentence generation step inputs the acquired untransmitted answer sentence into a question sentence estimation model to generate an estimated question sentence corresponding to the untransmitted answer sentence;
The question sentence estimation model may be a model trained to generate an estimated question sentence corresponding to an input untransmitted answer sentence from the input untransmitted answer sentence.

本発明の質問推定方法は、例えば、
さらに、学習処理工程を含み、
前記学習処理工程は、前記質問回答表における前記質問文章を教師データとし、前記質問タイプの文章データと紐づけられている前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築し、
前記推定質問文章生成工程は、前記構築した質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成する、という態様であってもよい。
The question estimation method of the present invention includes, for example,
Further, a learning process is included,
the learning process includes constructing the question sentence estimation model by supervised machine learning using the question sentence in the question and answer table as training data and sentence data of the answer type linked to sentence data of the question type as input data;
The estimated question sentence generating step may be implemented in a manner that the acquired unsent answer sentence is input to the constructed question sentence estimation model to generate an estimated question sentence corresponding to the unsent answer sentence.

前記学習処理工程を含む態様の本発明の質問推定方法において、例えば、
前記学習処理工程は、前記教師付き機械学習を行う前に、入力された文章データをベクトルに変換するように教師なし学習されたベクトル変換学習済みモデルに、前記質問回答表の各文章データを入力して、前記各文章データをベクトルに変換し、且つ
前記ベクトルに変換した前記質問タイプの文章データを教師データとし、前記ベクトルに変換した前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築する、という態様であってもよい。
In the question estimating method of the present invention including the learning process, for example,
The learning process may be such that, before performing the supervised machine learning, each piece of text data in the question and answer list is input into a vector conversion trained model that has been trained in an unsupervised manner to convert input text data into a vector, and each piece of text data is converted into a vector, and the question text estimation model is constructed by supervised machine learning using the text data of the question type converted into the vector as teacher data and the text data of the answer type converted into the vector as input data.

本発明の質問推定方法は、例えば、
さらに、出力工程、質問文章取得工程、及び類似度分析工程を含み、
前記質問文章取得工程は、継続中の会話における送信済みであって且つ他のユーザが送信した質問タイプの文章データを取得し、
前記類似度分析工程は、前記送信済みの質問タイプの文章データと前記生成した推定質問文章と比較して類似度を分析し、
前記出力工程は、前記類似度を出力ずる、という態様であってもよい。
The question estimation method of the present invention includes, for example,
The method further includes an output step, a question sentence acquisition step, and a similarity analysis step,
The question sentence acquisition step acquires question-type sentence data that has been sent in the ongoing conversation and has been sent by another user,
the similarity analysis step compares the transmitted sentence data of the question type with the generated estimated question sentence to analyze the similarity;
The output step may include outputting the similarity.

本発明の学習済みモデルの生産方法において、例えば、
前記データ取得工程は、会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記学習済みモデル生成工程は、さらに、前記会話履歴データを用いた教師なし機械学習によって、前記文章データを入力した場合に、前記文章データをベクトルに変換して出力する第2の学習済みモデルを生成する、という態様であってもよい。
In the method for producing a trained model of the present invention, for example,
The data acquisition step acquires conversation history data,
The conversation history data is composed of a plurality of sentence data,
The trained model generation process may further comprise generating a second trained model by unsupervised machine learning using the conversation history data, which, when input, converts the sentence data into a vector and outputs the vector.

本発明のプログラムは、本発明の方法の各工程を、手順として、コンピュータに実行させるためのプログラムである。 The program of the present invention is a program for causing a computer to execute each step of the method of the present invention as a procedure.

本発明の記録媒体は、本発明のプログラムを記録しているコンピュータ読み取り可能な記録媒体である。 The recording medium of the present invention is a computer-readable recording medium on which the program of the present invention is recorded.

本発明の適用分野は、特に制限されず、会話において、「質問」及び前記質問に対する「回答」の送受信が実行される分野であればよい。なお、本発明において、会話とは、二人以上の話者が話をすることをいう。前記会話は、例えば、チャットやメール等の文字データを用いる形式によって話をする形態でもよいし、通話等の音声データを用いる形式によって話をする形態であってもよい。前記会話は、一方のユーザ(質問者)からの質問の提示から始まり、他方のユーザ(回答者)からの前記質問に対する回答までの一連の流れを1セットとする。前記質問者と前記回答者との関係は、特に制限されないが、例えば、カスタマと担当者、生徒と教師、選手とコーチ等の関係がある。以下において、前記質問者としてカスタマ、前記回答者として担当者を例に挙げて説明する場合もあるが、これに限定されない。 The application field of the present invention is not particularly limited, and may be any field in which a "question" and an "answer" to the question are transmitted and received in a conversation. In the present invention, a conversation refers to a conversation between two or more speakers. The conversation may be, for example, a conversation using text data such as chat or email, or a conversation using audio data such as a telephone call. The conversation begins with one user (questioner) presenting a question and ends with the other user (answerer) answering the question, and is considered to be one set. The relationship between the questioner and the answerer is not particularly limited, and may be, for example, a relationship between a customer and a person in charge, a student and a teacher, or an athlete and a coach. In the following description, a customer may be used as the questioner and a person in charge as the answerer, but this is not limiting.

次に、本発明の実施形態について図を用いて説明する。本発明は、以下の実施形態には限定されない。以下の各図において、同一部分には、同一符号を付している。また、各実施形態の説明は、特に言及がない限り、互いの説明を援用でき、各実施形態の構成は、特に言及がない限り、組合せ可能である。 Next, an embodiment of the present invention will be described with reference to the drawings. The present invention is not limited to the following embodiment. In each of the drawings, the same parts are given the same reference numerals. Furthermore, the explanations of each embodiment can be mutually incorporated unless otherwise specified, and the configurations of each embodiment can be combined unless otherwise specified.

[実施形態1]
図1は、本実施形態の質問推定装置10の一例の構成を示すブロック図である。図1に示すように、本装置10は、会話履歴データ取得部11、文章タイプ識別部12、質問回答表生成部13、未送信文章取得部14、及び推定質問文章生成部15を含む。本装置10は、例えば、任意の構成として、さらに、出力部16、学習処理部17、質問文章取得部18、及び類似度分析部19を含んでもよい。文章タイプ識別部12は、例えば、不要文識別部121、不要文削除部122、形態素解析部123、及び識別部124を含んでもよい。
[Embodiment 1]
Fig. 1 is a block diagram showing an example of the configuration of a question estimation device 10 of this embodiment. As shown in Fig. 1, the device 10 includes a conversation history data acquisition unit 11, a sentence type identification unit 12, a question and answer table generation unit 13, an unsent sentence acquisition unit 14, and an estimated question sentence generation unit 15. The device 10 may further include, for example, an output unit 16, a learning processing unit 17, a question sentence acquisition unit 18, and a similarity analysis unit 19 as optional components. The sentence type identification unit 12 may include, for example, an unnecessary sentence identification unit 121, an unnecessary sentence deletion unit 122, a morphological analysis unit 123, and an identification unit 124.

本装置10は、例えば、前記各部を含む1つの装置でもよいし、前記各部が、通信回線網を介して接続可能な装置でもよい。また、本装置10は、前記通信回線網を介して、後述する外部装置と接続可能である。前記通信回線網は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。前記通信回線網は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、SAN(Storage Area Network)、DTN(Delay Tolerant Networking)、LPWA(Low Power Wide Area)、L5G(ローカル5G)、等があげられる。無線通信としては、例えば、WiFi(Wireless Fidelity)、Bluetooth(登録商標)、ローカル5G、LPWA等が挙げられる。前記無線通信としては、各装置が直接通信する形態(Ad Hoc通信)、インフラストラクチャ(infrastructure通信)、アクセスポイントを介した間接通信等であってもよい。本装置10は、例えば、システムとしてサーバに組み込まれていてもよい。また、本装置10は、例えば、本発明のプログラムがインストールされたパーソナルコンピュータ(PC、例えば、デスクトップ型、ノート型)、スマートフォン、タブレット端末等であってもよい。さらに、本装置10は、例えば、前記各部のうち少なくとも一つがサーバ上にあり、その他の前記各部が端末上にあるような、クラウドコンピューティングやエッジコンピューティング等の形態であってもよい。 The device 10 may be, for example, a single device including each of the above-mentioned parts, or a device to which each of the above-mentioned parts can be connected via a communication line network. The device 10 may also be connected to an external device described later via the communication line network. The communication line network is not particularly limited and may be a publicly known network, for example, wired or wireless. Examples of the communication line network include the Internet line, WWW (World Wide Web), telephone line, LAN (Local Area Network), SAN (Storage Area Network), DTN (Delay Tolerant Networking), LPWA (Low Power Wide Area), L5G (Local 5G), etc. Examples of wireless communication include WiFi (Wireless Fidelity), Bluetooth (registered trademark), local 5G, and LPWA. The wireless communication may be a form in which each device communicates directly (Ad Hoc communication), infrastructure communication, indirect communication via an access point, and the like. The device 10 may be incorporated into a server as a system. The device 10 may be, for example, a personal computer (PC, for example, desktop type or notebook type) in which the program of the present invention is installed, a smartphone, a tablet terminal, or the like. Furthermore, the device 10 may be in the form of cloud computing or edge computing, for example, in which at least one of the parts is on a server and the other parts are on a terminal.

図2に、本装置10のハードウエア構成のブロック図を例示する。本装置10は、例えば、中央処理装置(CPU、GPU等)101、メモリ102、バス103、記憶装置104、入力装置105、表示装置106、通信デバイス107等を含む。本装置10の各部は、それぞれのインタフェース(I/F)により、バス103を介して相互に接続されている。 Figure 2 shows an example block diagram of the hardware configuration of the device 10. The device 10 includes, for example, a central processing unit (CPU, GPU, etc.) 101, a memory 102, a bus 103, a storage device 104, an input device 105, a display device 106, a communication device 107, etc. Each part of the device 10 is connected to each other via the bus 103 by its respective interface (I/F).

中央処理装置101は、本装置10の全体の制御を担う。本装置10において、中央処理装置101により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、中央処理装置101が、会話履歴データ取得部11、文章タイプ識別部12、質問回答表生成部13、未送信文章取得部14、及び推定質問文章生成部15として機能する。また、中央処理装置101は、例えば、出力部16、学習処理部17、質問文章取得部18、及び類似度分析部19としても機能する。 The central processing unit 101 is responsible for the overall control of the device 10. In the device 10, the central processing unit 101 executes, for example, the program of the present invention and other programs, and also reads and writes various information. Specifically, for example, the central processing unit 101 functions as a conversation history data acquisition unit 11, a sentence type identification unit 12, a question and answer table generation unit 13, an unsent sentence acquisition unit 14, and an estimated question sentence generation unit 15. The central processing unit 101 also functions as, for example, an output unit 16, a learning processing unit 17, a question sentence acquisition unit 18, and a similarity analysis unit 19.

バス103は、例えば、外部装置とも接続できる。前記外部装置は、例えば、外部記憶装置(外部データベース等)、プリンター、外部入力装置、外部表示装置、外部撮像装置等があげられる。本装置10は、例えば、バス103に接続された通信デバイス107により、外部ネットワーク(前記通信回線網)に接続でき、外部ネットワークを介して、他の装置と接続することもできる。また、本装置10は、例えば、図1に示すように、バス103に接続された通信デバイス107により、前記通信回線網を介して、会話履歴データベース100と接続することもできる。 The bus 103 can also be connected to, for example, an external device. Examples of the external device include an external storage device (external database, etc.), a printer, an external input device, an external display device, an external imaging device, etc. The present device 10 can be connected to an external network (the above-mentioned communication line network) by, for example, a communication device 107 connected to the bus 103, and can also be connected to other devices via the external network. The present device 10 can also be connected to a conversation history database 100 via the above-mentioned communication line network by, for example, a communication device 107 connected to the bus 103, as shown in FIG. 1.

メモリ102は、例えば、メインメモリ(主記憶装置)が挙げられる。中央処理装置101が処理を行う際には、例えば、後述する記憶装置104に記憶されている本発明のプログラム等の種々の動作プログラムを、メモリ102が読み込み、中央処理装置101は、メモリ102からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。また、メモリ102は、例えば、ROM(読み出し専用メモリ)であってもよい。 The memory 102 may be, for example, a main memory (primary storage device). When the central processing unit 101 performs processing, the memory 102 reads various operating programs, such as the program of the present invention, stored in the storage device 104 described below, and the central processing unit 101 receives data from the memory 102 and executes the program. The main memory may be, for example, a RAM (random access memory). The memory 102 may also be, for example, a ROM (read only memory).

記憶装置104は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置104には、本発明のプログラムを含む動作プログラムが格納されている。記憶装置104は、例えば、記録媒体と、記録媒体に読み書きするドライブとの組合せであってもよい。前記記録媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリー、メモリーカード等が挙げられる。記憶装置104は、例えば、記録媒体とドライブとが一体化されたハードディスクドライブ(HDD)、及びソリッドステートドライブ(SSD)であってもよい。 The storage device 104 is also referred to as an auxiliary storage device, for example, in contrast to the main memory. As described above, the storage device 104 stores operating programs including the program of the present invention. The storage device 104 may be, for example, a combination of a recording medium and a drive that reads and writes from the recording medium. The recording medium is not particularly limited, and may be, for example, an internal or external type, such as a hard disk drive (HDD), CD-ROM, CD-R, CD-RW, MO, DVD, flash memory, memory card, etc. The storage device 104 may be, for example, a hard disk drive (HDD) in which the recording medium and the drive are integrated, or a solid state drive (SSD).

本装置10において、メモリ102及び記憶装置104は、ユーザのログ情報、並びに、外部データベース(図示せず)から取得した情報を記憶することも可能である。 In the device 10, the memory 102 and storage device 104 can also store user log information as well as information obtained from an external database (not shown).

本装置10は、例えば、さらに、入力装置105、及び表示装置106を含んでもよい。入力装置105は、例えば、タッチパネル、キーボード、マウス等である。表示装置106は、例えば、LEDディスプレイ、液晶ディスプレイ等が挙げられる。 The device 10 may further include, for example, an input device 105 and a display device 106. The input device 105 is, for example, a touch panel, a keyboard, a mouse, etc. The display device 106 is, for example, an LED display, a liquid crystal display, etc.

つぎに、本実施形態の質問推定方法の一例を、図3のフローチャートに基づき説明する。本実施形態の質問推定方法は、例えば、図1の質問推定装置10を用いて、次のように実施する。なお、本実施形態の質問推定方法は、図1の質問推定装置10の使用には限定されない。 Next, an example of the question estimation method of this embodiment will be described with reference to the flowchart in FIG. 3. The question estimation method of this embodiment is implemented as follows, for example, using the question estimation device 10 of FIG. 1. Note that the question estimation method of this embodiment is not limited to use of the question estimation device 10 of FIG. 1.

まず、会話履歴データ取得部11により、終了した会話の文字データである会話履歴データを取得する(S11)。前記会話履歴データは、複数の文章データから構成される。前記会話が音声データを用いる形式によって話をする形態である場合、会話履歴データ取得部11は、例えば、終了した会話の音声データを文字データに変換した会話履歴データを取得してもよい。会話履歴データ取得部11は、例えば、前記通信回線網を介して、前記会話履歴データを格納している会話履歴データベース100から前記会話履歴データを取得してもよい。会話履歴データベース100の一例を図4に示す。図4に示すように、前記会話履歴データは、例えば、前記会話毎にテーブルデータとして記憶されていてもよい。また、前記会話履歴データは、例えば、前記文章データ毎の送信時刻及び送信者に関する送信情報を含んでいてもよい。「終了した会話」とは、すなわち、会話開始のきっかけとなった質問者(カスタマ等)からの質問に対し回答者(担当者等)から回答があった会話を意味する。以下、「終了した会話」を「対応済みの会話」ともいう。会話履歴データベース100は、例えば、対応済みの会話の会話履歴データと対応中の会話(継続中の会話ともいう)の会話履歴データとを識別して格納してもよい。「対応中の会話」とは、すなわち、会話開始のきっかけとなった質問者(カスタマ等)からの質問に対し回答者(担当者等)から回答がない会話を意味する。図4に示す各文章データの時系列を図5に示す。図5に示すように、1人の担当者は、例えば、並行して複数のカスタマと会話をしている。 First, the conversation history data acquisition unit 11 acquires conversation history data, which is character data of a finished conversation (S11). The conversation history data is composed of a plurality of sentence data. When the conversation is in the form of talking using voice data, the conversation history data acquisition unit 11 may acquire conversation history data by converting the voice data of the finished conversation into character data, for example. The conversation history data acquisition unit 11 may acquire the conversation history data from the conversation history database 100 that stores the conversation history data, for example, via the communication line network. An example of the conversation history database 100 is shown in FIG. 4. As shown in FIG. 4, the conversation history data may be stored as table data for each conversation. In addition, the conversation history data may include, for example, transmission information regarding the transmission time and the sender for each sentence data. A "completed conversation" means a conversation in which an answerer (a person in charge, etc.) answers a question from a questioner (a customer, etc.) that triggered the start of the conversation. Hereinafter, a "completed conversation" is also referred to as a "conversation that has been handled." The conversation history database 100 may, for example, distinguish and store conversation history data of conversations that have already been handled and conversation history data of conversations that are currently being handled (also called ongoing conversations). An "ongoing conversation" refers to a conversation in which the answerer (e.g., a person in charge) has not responded to a question from a questioner (e.g., a customer) that triggered the conversation. The time series of each piece of text data shown in FIG. 4 is shown in FIG. 5. As shown in FIG. 5, one person in charge, for example, is having conversations with multiple customers in parallel.

次に、文章タイプ識別部12により、前記文章データ毎に文章タイプを識別する(S12)。 Next, the sentence type identification unit 12 identifies the sentence type for each of the sentence data (S12).

文章タイプ識別部12による処理(前記工程(S12))の一例について具体的に説明する。文章タイプ識別部12は、例えば、不要文識別部121、不要文削除部122、形態素解析部123、及び識別部124を含む。まず、不要文識別部121により、前記文章データ内の不要文を識別する(S121)。具体的には、例えば、「いつもお世話になっております。」や「ありがとうございます。」等の予め設定した文章及び前記予め設定した文章と類似度の高い文章を不要文として識別する。前記類似度は、特に制限されないが、例えば、後述のコサイン類似度を用いることができる。次に、不要文削除部122により、前記識別した不要文を前記文章データから削除する(S122)。次に、形態素解析部123により、前記文章データに対して文単位で形態素解析を行う(S123)。次に、識別部124により、前記形態素解析に基づき、予め設定した文末表現ルールに従って、前記文章データの文章タイプを識別する(S124)。前記文末表現ルールは、文末の表現と前記文章タイプとを紐づけたものであり、任意に設定できる。具体的に、前記質問タイプと紐づけられた前記文末の表現としては、例えば、「・・・ください。」、「・・・をお願いします。」、「・・・は何ですか?」、「・・・起きますか?」等がある。また、前記回答タイプと紐づけられた前記文末の表現としては、例えば、「・・・になります。」、「・・・解決します。」等がある。文章タイプ識別部12は、例えば、前記工程(S121)~(S124)の処理を全ての文章データに対して実行する。 An example of the processing by the sentence type identification unit 12 (step (S12)) will be specifically described. The sentence type identification unit 12 includes, for example, an unnecessary sentence identification unit 121, an unnecessary sentence deletion unit 122, a morphological analysis unit 123, and an identification unit 124. First, the unnecessary sentence identification unit 121 identifies unnecessary sentences in the sentence data (S121). Specifically, for example, preset sentences such as "Thank you for your continued support" and "Thank you" and sentences that are highly similar to the preset sentences are identified as unnecessary sentences. The similarity is not particularly limited, but for example, the cosine similarity described below can be used. Next, the unnecessary sentence deletion unit 122 deletes the identified unnecessary sentences from the sentence data (S122). Next, the morphological analysis unit 123 performs morphological analysis on the sentence data on a sentence-by-sentence basis (S123). Next, the identification unit 124 identifies the sentence type of the sentence data based on the morphological analysis in accordance with preset sentence-ending expression rules (S124). The sentence-ending expression rule associates sentence-ending expressions with the sentence type, and can be set arbitrarily. Specifically, examples of the sentence-ending expressions associated with the question type include "Please...", "Please do...", "What is...?", "Will... happen?", etc. Examples of the sentence-ending expressions associated with the answer type include "It will be...", "It will solve...", etc. The sentence type identification unit 12, for example, executes the processes of steps (S121) to (S124) on all sentence data.

次に、質問回答表生成部13により、前記識別の結果に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成する(S13)。前記質問回答表は、例えば、メモリ102及び記憶装置104に記憶されてもよい。質問回答表生成部13は、例えば、下記条件(1)~(3)の少なくとも一方に基づき、質問回答表を生成してもよい。
(1)前記回答タイプの文章データに、前記回答タイプの文章データよりも送信時刻の古い前記質問タイプの文章データを紐づける
(2)前記回答タイプの文章データを送信したユーザと異なる他のユーザが送信した前記質問タイプの文章データを紐づける
(3)前記回答タイプの文章データとの紐づけの対象となる前記質問タイプの文章データが複数存在する場合に、前記回答タイプの文章データと前記質問タイプの文章データとの類似度を算出し、前記類似度が高い前記回答タイプの文章データと前記質問タイプの文章データとの組み合わせで紐づける
Next, the question and answer table generating unit 13 generates a question and answer table by linking the sentence data of the question type with the sentence data of the answer type based on the result of the identification (S13). The question and answer table may be stored, for example, in the memory 102 and the storage device 104. The question and answer table generating unit 13 may generate the question and answer table based, for example, on at least one of the following conditions (1) to (3):
(1) Linking the answer type text data to the question type text data that was sent earlier than the answer type text data. (2) Linking the question type text data sent by a user other than the user who sent the answer type text data. (3) When there are multiple question type text data to be linked with the answer type text data, calculating the similarity between the answer type text data and the question type text data, and linking the answer type text data and the question type text data with the highest similarity.

図6に、前記質問回答表の生成の一例について示す。図6では、前記会話履歴データにおける各文章データを送信時刻に沿って示している。図6に示す各文章データにおいて、文章タイプ識別部12により質問タイプと識別された文章データは、送信時刻の順に沿って「Qn(nは1以上の整数)」として示し、回答タイプと識別された文章データは、送信時刻の順に沿って「Am(mは1以上の整数)」として示す。回答タイプの文章データA1は、例えば、図6に示すように、質問回答表生成部13により上記条件(1)及び(2)に従い、文章データA1の送信時刻t3よりも前に送信されており、且つ文章データA1の送信者Xとは異なる送信者Yにより送信されている質問タイプの文章データQ2と紐づけられる。回答タイプの文章データA2及びA3も、例えば、文章データA1と同様にして、それぞれ、質問タイプの文章データQ1及びQ3と紐づけられる。このように、回答タイプの文章データは、例えば、複数の質問タイプの文章データと紐づけられてもよい。一方で、例えば、回答タイプの文章データA2及びA3のように、紐づけの対象となる前記質問タイプの文章データが複数存在する場合は、例えば、上記条件(3)に従い、前記類似度を算出し、前記類似度が高い前記回答タイプの文章データと前記質問タイプの文章データとの組み合わせで紐づけてもよい。前記類似度は、特に制限されないが、例えば、コサイン類似度である。具体的に、例えば、前記類似度の算出として、各文章データをベクトル化して、コサイン類似度を算出する手法が用いられる。前記類似度は、前記類似度が高いほど、前記各文章データが類似していることを意味する。具体的に、回答タイプの文章データA2の場合は、例えば、文章データA2と文章データQ1との組み合わせにおける類似度、及び文章データA2と文章データQ3との組み合わせにおける類似度をそれぞれ算出し、前記類似度が高い組み合わせで紐づけを行う。 6 shows an example of the generation of the question and answer table. In FIG. 6, each piece of text data in the conversation history data is shown in order of transmission time. In each piece of text data shown in FIG. 6, text data identified by the text type identification unit 12 as a question type is shown as "Qn (n is an integer of 1 or more)" in order of transmission time, and text data identified as an answer type is shown as "Am (m is an integer of 1 or more)" in order of transmission time. For example, as shown in FIG. 6, the text data A1 of the answer type is linked to the text data Q2 of the question type that was sent before the transmission time t3 of the text data A1 and was sent by the sender Y different from the sender X of the text data A1 by the question and answer table generation unit 13 in accordance with the above conditions (1) and (2). The text data A2 and A3 of the answer type are also linked to the text data Q1 and Q3 of the question type, respectively, in the same manner as the text data A1. In this way, the text data of the answer type may be linked to, for example, multiple text data of the question type. On the other hand, when there are multiple pieces of question-type text data to be linked, such as answer-type text data A2 and A3, the similarity may be calculated according to the above condition (3), and the answer-type text data and the question-type text data with the high similarity may be linked. The similarity is not particularly limited, but may be, for example, cosine similarity. Specifically, for example, the similarity is calculated by vectorizing each piece of text data and calculating the cosine similarity. The higher the similarity, the more similar the pieces of text data are. Specifically, in the case of answer-type text data A2, the similarity in the combination of text data A2 and text data Q1, and the similarity in the combination of text data A2 and text data Q3 are calculated, and the combination with the high similarity is linked.

前記類似度として、コサイン類似度を例に挙げてより具体的に説明する。まず、質問推定装置10は、各文章データに対し形態素解析を行い、前記各文章データを単語単位に分割する。次に、質問推定装置10は、文章データ毎に、各単語の出現回数を算出し、前記文章データを長さが単語の数(語彙数ともいう。前記出現回数のことではない)となるベクトルにする。ここまでの処理を、例えば、文章のベクトル化(エンベデッド化)といい、TF-IDF(Term Frequency-Inverse Document Frequency)等の技術を用いることができる。そして、前記ベクトルを用いて、コサイン類似度を算出する。前記コサイン類似度は、比較する各ベクトルが、同じ方向を向いている程度を表す指標であり、例えば、その値は―1から1の間を取り、1に近いほど同一方向であるといえる。すなわち、前記値が1に近いほど、比較する各文章データの類似度が高いと判断される。 The similarity will be described in more detail by taking cosine similarity as an example. First, the question estimation device 10 performs morphological analysis on each piece of text data and divides each piece of text data into words. Next, the question estimation device 10 calculates the number of occurrences of each word for each piece of text data, and converts the text data into a vector whose length is the number of words (also called vocabulary count, not the number of occurrences). The process up to this point is called, for example, vectorization (embedding) of text, and techniques such as TF-IDF (Term Frequency-Inverse Document Frequency) can be used. Then, the vector is used to calculate cosine similarity. The cosine similarity is an index that indicates the degree to which the vectors to be compared are oriented in the same direction, and for example, its value ranges from -1 to 1, and the closer it is to 1, the more it can be said that the vectors are oriented in the same direction. In other words, the closer the value is to 1, the higher the similarity of the text data to be compared is determined to be.

次に、未送信文章取得部14により、継続中の会話において、他のユーザへの送信前である未送信回答文章を取得する(S14)。未送信文章取得部14は、例えば、前記通信回線網を介して、前記回答者(例えば、担当者等)によって外部入力装置から前記未送信回答文章を取得してもよい。 Next, the unsent text acquisition unit 14 acquires unsent answer texts in the ongoing conversation that have not yet been sent to other users (S14). The unsent text acquisition unit 14 may acquire the unsent answer texts from an external input device by the answerer (e.g., a person in charge, etc.) via the communication line network, for example.

そして、推定質問文章生成部15により、前記質問回答表及び前記未送信回答文章に基づき、前記未送信回答文章に対応する推定質問文章を生成して(S15)、終了する(END)。推定質問文章生成部15は、例えば、質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成してもよい。前記質問文章推定モデルは、入力された未送信回答文章から前記未送信回答文章に対応する推定質問文章を生成するように学習されたモデルである。前記質問文章推定モデルは、例えば、外部から取得してもよいし、本装置10が学習処理部17を含む場合に学習処理部17により構築してもよい。前記質問文章推定モデルは、例えば、未送信回答文章を入力する入力層と、推定質問文章を出力する出力層と、入力層と出力層との間に設けられる少なくとも1層の中間層とを含む。前記質問文章推定モデルは、例えば、人工知能ソフトウェアの一部であるプログラムモジュールであってもよい。前記多層化ネットワークとしては、例えば、ニューラルネットワーク等が挙げられる。前記ニューラルネットワークとしては、例えば、畳み込みニューラルネットワーク(Convolution Neural Network:CNN)等が挙げられる。なお、前記質問文章推定モデルは、前記CNNに限定されず、例えば、CNN以外のニューラルネットワーク、SVM(Support Vector Machine)、ベイジアンネットワーク、回帰木等の他の学習アルゴリズムで構築された学習済みモデルであってもよい。 Then, the estimated question sentence generation unit 15 generates an estimated question sentence corresponding to the unsent answer sentence based on the question and answer table and the unsent answer sentence (S15), and ends (END). The estimated question sentence generation unit 15 may, for example, input the acquired unsent answer sentence into a question sentence estimation model to generate an estimated question sentence corresponding to the unsent answer sentence. The question sentence estimation model is a model that has been trained to generate an estimated question sentence corresponding to the unsent answer sentence from the input unsent answer sentence. The question sentence estimation model may, for example, be acquired from the outside, or may be constructed by the learning processing unit 17 when the device 10 includes a learning processing unit 17. The question sentence estimation model includes, for example, an input layer that inputs the unsent answer sentence, an output layer that outputs the estimated question sentence, and at least one intermediate layer provided between the input layer and the output layer. The question sentence estimation model may, for example, be a program module that is a part of artificial intelligence software. The multi-layered network may, for example, be a neural network. The neural network may be, for example, a convolution neural network (CNN). Note that the question sentence estimation model is not limited to the CNN, and may be, for example, a neural network other than CNN, or a trained model constructed using other learning algorithms such as a support vector machine (SVM), a Bayesian network, or a regression tree.

学習処理部17について説明する。学習処理部17は、前記工程(S13)の後に、前記質問回答表における前記質問文章を教師データとし、前記質問タイプの文章データと紐づけられている前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築する(S17)。前記教師付き機械学習は、例えば、前述と同様に、CNN、SVM、ベイジアンネットワーク、回帰木等を用いた機械学習である。学習処理部17は、例えば、前記教師付き機械学習を行う前に、入力された文章データをベクトルに変換するように教師なし学習されたベクトル変換学習済みモデルに、前記質問回答表の各文章データを入力して、前記各文章データをベクトルに変換してもよい。そして、学習処理部17は、前記ベクトルに変換した前記質問タイプの文章データを教師データとし、前記ベクトルに変換した前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築してもよい。前記ベクトル変換学習済みモデルは、例えば、外部から取得してもよいし、学習処理部17により構築してもよい。すなわち、学習処理部17は、例えば、前記教師なし学習を行う事前学習(Pre-training)のフェーズと、その後に行う教師付き機械学習を行う詳細学習(Fine Tuning)のフェーズとの2つのフェーズで構成されてもよい。具体的に、前記事前学習は、例えば、大量のラベルなし文章データ(会話履歴データの文章データ)から、文中の単語をマスクし、前記マスクした単語を推測する学習を行う処理である。また、具体的に、前記詳細学習は、例えば、前記ベクトル変換学習済みモデルを初期値に利用し、少量のラベル付きデータ(前記質問回答表)を使って再学習させることで、生成する推定質問文章の精度を高める処理である。 The learning processing unit 17 will be described. After the step (S13), the learning processing unit 17 constructs the question sentence estimation model by supervised machine learning using the question sentence in the question and answer table as teacher data and the answer type sentence data linked to the question type sentence data as input data (S17). The supervised machine learning is, for example, machine learning using CNN, SVM, Bayesian network, regression tree, etc., as described above. For example, before performing the supervised machine learning, the learning processing unit 17 may input each sentence data of the question and answer table to a vector conversion trained model that has been trained in an unsupervised manner to convert the input sentence data into a vector, and convert each sentence data into a vector. Then, the learning processing unit 17 may construct the question sentence estimation model by supervised machine learning using the question type sentence data converted into the vector as teacher data and the answer type sentence data converted into the vector as input data. The vector conversion trained model may be obtained, for example, from outside, or may be constructed by the learning processing unit 17. That is, the learning processing unit 17 may be configured with two phases, for example, a pre-training phase in which the unsupervised learning is performed, and a fine tuning phase in which supervised machine learning is performed thereafter. Specifically, the pre-training is, for example, a process of masking words in a sentence from a large amount of unlabeled sentence data (sentence data of conversation history data) and learning to infer the masked words. Also, specifically, the fine tuning is, for example, a process of using the vector conversion trained model as an initial value and re-training using a small amount of labeled data (the question and answer table) to improve the accuracy of the generated estimated question sentence.

また、例えば、前記工程(S15)の後に、出力部16により、生成した前記推定質問文章を出力し(S16)、終了してもよい(END)。出力部16は、例えば、前記通信回線網を介して、外部装置に出力してもよいし、表示装置106に出力してもよい。 For example, after the step (S15), the output unit 16 may output the generated estimated question sentence (S16) and terminate (END). The output unit 16 may output the estimated question sentence to an external device via the communication line network, or may output the estimated question sentence to the display device 106, for example.

さらに、例えば、質問文章取得部18により、継続中の会話における送信済みであって且つ他のユーザが送信した質問タイプの文章データを取得してもよい(S18)。前記工程(S18)を実行するタイミングは、特に制限されない。質問文章取得部18は、例えば、前記継続中の会話における送信済みの文章データを全て取得し、前記取得した文章データを前述と同様にして、文章タイプ識別部12により文章タイプを識別し、前記質問タイプと識別された文章データ(送信済み質問文章ともいう)のみを取得してもよい。 Furthermore, for example, the question sentence acquisition unit 18 may acquire sentence data of a question type that has already been sent in the ongoing conversation and that has been sent by another user (S18). The timing of executing the step (S18) is not particularly limited. For example, the question sentence acquisition unit 18 may acquire all sentence data that has already been sent in the ongoing conversation, identify the sentence type of the acquired sentence data by the sentence type identification unit 12 in the same manner as described above, and acquire only the sentence data identified as the question type (also referred to as the sent question sentence).

前記工程(S18)を実行する場合、前記工程(S15)及び前記工程(S18)の後に、類似度分析部19により、前記送信済みの質問タイプの文章データと前記生成した推定質問文章と比較して類似度を分析する(S19)。前記類似度は、例えば、コサイン類似度を用いることができる。 When the step (S18) is executed, after the steps (S15) and (S18), the similarity analysis unit 19 compares the transmitted question type text data with the generated estimated question text to analyze the similarity (S19). The similarity can be, for example, a cosine similarity.

そして、出力部16により、前記類似度を出力して(S20)、終了する(END)。前記出力は、例えば、前記類似度が予め設定した値以下であれば、前記類似度が低いことを示す警告を出力してもよい。また、出力部16は、例えば、前記類似度が予め設定した値以下であれば、前記未送信回答文書を出力(送信)不可にするように制御可能であってもよい。 Then, the output unit 16 outputs the similarity (S20) and ends the process (END). For example, if the similarity is equal to or lower than a preset value, the output may output a warning indicating that the similarity is low. Furthermore, the output unit 16 may be controllable to disable output (transmission) of the unsent response document if the similarity is equal to or lower than a preset value.

本実施形態によれば、推定質問文章を生成することで、継続中の会話における質問文章と前記推定質問文章との類似性を確認することに活用でき、誤送信を未然に防ぐことができる。また、本実施形態によれば、例えば、類似度を算出することができるため、継続中の会話における質問文章と前記推定質問文章との類似性の確認が容易である。さらに、本実施形態によれば、事前学習(Pre-training)のフェーズと、その後に行う詳細学習(Fine Tuning)のフェーズとの2つのフェーズにより、より精度の高い推定質問文章を生成することができる。 According to this embodiment, by generating an estimated question sentence, it is possible to use the generated question sentence to check the similarity between the question sentence in an ongoing conversation and the estimated question sentence, and to prevent erroneous transmission. Also, according to this embodiment, for example, the similarity can be calculated, so that it is easy to check the similarity between the question sentence in an ongoing conversation and the estimated question sentence. Furthermore, according to this embodiment, it is possible to generate a more accurate estimated question sentence by using two phases: a pre-training phase and a fine tuning phase that is performed after the pre-training phase.

[実施形態2]
図7(A)は、本実施形態の学習済みモデル生成装置20の一例の構成を示すブロック図である。図7(A)に示すように、本装置20は、データ取得部21、及び学習済みモデル生成部22を含む。
[Embodiment 2]
7A is a block diagram showing an example of a configuration of a trained model generation device 20 according to the present embodiment. As shown in FIG. 7A, the device 20 includes a data acquisition unit 21 and a trained model generation unit 22.

本装置20は、例えば、前記各部を含む1つの装置でもよいし、前記各部が、前記通信回線網を介して接続可能な装置でもよい。また、本装置20は、前記通信回線網を介して、前述の外部装置と接続可能である。本装置20は、例えば、システムとしてサーバに組み込まれていてもよい。また、本装置20は、例えば、本発明のプログラムがインストールされたパーソナルコンピュータ(PC、例えば、デスクトップ型、ノート型)、スマートフォン、タブレット端末等であってもよい。さらに、本装置20は、例えば、前記各部のうち少なくとも一つがサーバ上にあり、その他の前記各部が端末上にあるような、クラウドコンピューティングやエッジコンピューティング等の形態であってもよい。 The device 20 may be, for example, a single device including the above-mentioned units, or a device to which the above-mentioned units can be connected via the communication line network. The device 20 may also be connectable to the above-mentioned external device via the communication line network. The device 20 may be, for example, incorporated into a server as a system. The device 20 may also be, for example, a personal computer (PC, for example, desktop type or notebook type) in which the program of the present invention is installed, a smartphone, a tablet terminal, or the like. Furthermore, the device 20 may be in the form of cloud computing or edge computing, for example, in which at least one of the above-mentioned units is on a server and the other units are on a terminal.

図7(B)に、学習済みモデル生成装置20のハードウエア構成のブロック図を例示する。学習済みモデル生成装置20は、例えば、中央処理装置(CPU、GPU等)101、メモリ102、バス103、記憶装置104、入力装置105、表示装置106、通信デバイス107等を含む。学習済みモデル生成装置20のハードウエア構成の各部は、特に言及しない限り、図3に示す質問推定装置10のハードウエア構成の各部の記載を援用できる。 Figure 7 (B) illustrates an example block diagram of the hardware configuration of the trained model generation device 20. The trained model generation device 20 includes, for example, a central processing unit (CPU, GPU, etc.) 101, a memory 102, a bus 103, a storage device 104, an input device 105, a display device 106, a communication device 107, etc. Unless otherwise specified, the descriptions of the respective parts of the hardware configuration of the trained model generation device 20 can be used for the respective parts of the hardware configuration of the question estimation device 10 shown in Figure 3.

中央処理装置101は、例えば、データ取得部21及び学習済みモデル生成部22として機能する。 The central processing unit 101 functions, for example, as a data acquisition unit 21 and a trained model generation unit 22.

メモリ102及び記憶装置104は、本装置20によって生成された学習済みモデルを記憶してもよい。 The memory 102 and storage device 104 may store the trained model generated by the device 20.

つぎに、本実施形態の学習済みモデルの生産方法の一例を、図8のフローチャートに基づき説明する。本実施形態の学習済みモデルの生産方法は、例えば、図7の学習済みモデル生成装置20を用いて、次のように実施する。なお、本実施形態の学習済みモデルの生産方法は、図7の学習済みモデル生成装置20の使用には限定されない。 Next, an example of a method for producing a trained model according to this embodiment will be described with reference to the flowchart of FIG. 8. The method for producing a trained model according to this embodiment is implemented as follows, for example, using the trained model generation device 20 of FIG. 7. Note that the method for producing a trained model according to this embodiment is not limited to the use of the trained model generation device 20 of FIG. 7.

まず、データ取得部21により、回答タイプの文章データと紐づけた質問タイプの文章データを教師データとして取得する(S21)。次に、学習済みモデル生成部22により、前記教師データを用いた機械学習によって、前記回答タイプの文章データを入力した場合に、前記回答タイプの文章データに対応する推定質問文章を生成して出力する第1の学習済みモデルを生成し(S22)、終了する(END)。前記第1の学習済みモデルは、例えば、前記実施形態1記載の質問推定装置10において、質問文章推定モデルとして使用されてもよい。 First, the data acquisition unit 21 acquires question-type sentence data linked to answer-type sentence data as teacher data (S21). Next, the trained model generation unit 22 generates a first trained model by machine learning using the teacher data, which generates and outputs an estimated question sentence corresponding to the answer-type sentence data when the answer-type sentence data is input (S22), and ends (END). The first trained model may be used as a question sentence estimation model in the question estimation device 10 described in the first embodiment, for example.

つまり、本装置20は、機械付き機械学習を行うことで、前記回答タイプの文章データを入力とし、前記推定質問文章を出力とするニューラルネットワークを構築(生成)する、ともいえる。前記ニューラルネットワークとしては、例えば、前述と同様である。前記ニューラルネットワークは、例えば、前記回答タイプの文章データを受け付ける入力層と、前記推定質問文章を出力する出力層と、入力層と出力層との間に設けられる少なくとも1層の中間層とを含んでもよい。 In other words, the device 20 can be said to construct (generate) a neural network that uses the answer type text data as input and outputs the estimated question text by performing machine learning. The neural network may be, for example, the same as described above. The neural network may include, for example, an input layer that accepts the answer type text data, an output layer that outputs the estimated question text, and at least one intermediate layer provided between the input layer and the output layer.

前記入力層は、例えば、前記回答タイプの文章データの入力を受け付ける複数のニューロンを含み、入力された前記回答タイプの文章データを前記中間層に受け渡す。前記中間層は、前記前記回答タイプの文章データの特徴量を抽出する複数のニューロンを含み、抽出した前記特徴量を前記出力層に受け渡す。前記出力層は、推定質問文章を出力する一又は複数のニューロンを含み、前記中間層から出力された前記特徴量に基づいて、前記推定質問文章の生成を行う。 The input layer includes, for example, a plurality of neurons that accept input of sentence data of the answer type, and passes the input sentence data of the answer type to the intermediate layer. The intermediate layer includes a plurality of neurons that extract features of the sentence data of the answer type, and passes the extracted features to the output layer. The output layer includes one or more neurons that output an estimated question sentence, and generates the estimated question sentence based on the features output from the intermediate layer.

前記教師データ及び前記入力される回答タイプの文章データは、例えば、前記機械学習及び第1の学習済みモデルに供される前に形態素解析(自然言語処理(NLP:Natural Language Processing))に供されてもよい。 The teacher data and the input answer-type sentence data may be subjected to, for example, morphological analysis (Natural Language Processing (NLP)) before being subjected to the machine learning and first trained model.

データ取得部21は、例えば、さらに、会話履歴データを取得してもよい。前記会話履歴データは、前述と同様であり、複数の文章データから構成される。そして、学習済みモデル生成部22は、さらに、例えば、前記会話履歴データを用いた教師なし機械学習によって、前記文章データを入力した場合に、前記文章データをベクトルに変換して出力する第2の学習済みモデルを生成してもよい。前記第2の学習済みモデルは、例えば、前記実施形態1記載の質問推定装置10において、ベクトル変換学習済みモデルとして使用されてもよい。すなわち、本装置20は、前記質問文章推定モデルと前記ベクトル変換学習済みモデルの2つの学習済みモデルを生成してもよい。 The data acquisition unit 21 may further acquire conversation history data, for example. The conversation history data is similar to that described above and is composed of a plurality of sentence data. The trained model generation unit 22 may further generate a second trained model that converts the sentence data into a vector and outputs it when the sentence data is input, for example, by unsupervised machine learning using the conversation history data. The second trained model may be used, for example, as a vector conversion trained model in the question estimation device 10 described in the first embodiment. That is, the device 20 may generate two trained models, the question sentence estimation model and the vector conversion trained model.

本実施形態によって生成される第1及び第2の学習済みモデルは、例えば、前記実施形態1記載の質問推定装置10に使用される。これにより、推定質問文章を生成可能であり、誤送信を未然に防ぐことができる。 The first and second trained models generated by this embodiment are used, for example, in the question estimation device 10 described in the first embodiment. This makes it possible to generate estimated question sentences and prevent erroneous transmissions.

[実施形態3]
図9を用いて、質問文章推定モデルを作成する一例について具体的に説明する。
[Embodiment 3]
An example of creating a question sentence estimation model will be specifically described with reference to FIG.

図9は、質問文章推定モデルを作成する一例について示す図である。図9に示すように、質問推定装置10は、質問回答表生成部13により、取得した前記会話履歴データを用いて、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表(QA表)を生成する。一方で、質問推定装置10は、学習処理部17により、取得した前記会話履歴データを用いて、教師なし機械学習を行い(Pre-training)、前記ベクトル変換学習済みモデルを構築する。前記ベクトル変換学習済みモデルは、例えば、前述のように、外部から取得してもよいし、学習済みモデル生成装置20により生成された学習済みモデルを用いてもよい。そして、質問推定装置10は、学習処理部17により、前記QA表における各文章データを入力して、前記各文章データをベクトルに変換する。前記QA表は、例えば、図9に示すように、前記各文章データと前記ベクトルとを紐づけて記憶するデータであってもよい。次に、質問推定装置10は、学習処理部17により、前記QA表における質問タイプの文章データに対し自然言語処理を行い、且つ前記質問タイプの文章データを教師データとし、前記質問タイプの文章データと紐づけられている前記回答タイプの文章データを入力データとして用いて、教師付き機械学習を行い(Fine-tuning)、前記質問文章推定モデルを構築する。前記質問文章推定モデルは、例えば、前述のように、学習済みモデル生成装置20により生成された学習済みモデルを用いてもよい。 9 is a diagram showing an example of creating a question sentence estimation model. As shown in FIG. 9, the question estimation device 10 uses the acquired conversation history data by the question-answer table generation unit 13 to link the question type sentence data with the answer type sentence data to generate a question-answer table (QA table). On the other hand, the question estimation device 10 uses the acquired conversation history data by the learning processing unit 17 to perform unsupervised machine learning (pre-training) and construct the vector conversion trained model. The vector conversion trained model may be obtained from an external source, as described above, or may use a trained model generated by the trained model generation device 20. Then, the question estimation device 10 inputs each piece of sentence data in the QA table by the learning processing unit 17 and converts each piece of sentence data into a vector. The QA table may be, for example, data that links and stores each piece of sentence data with the vector, as shown in FIG. 9. Next, the question estimation device 10 performs natural language processing on the question type sentence data in the QA table using the learning processing unit 17, and performs supervised machine learning (fine-tuning) using the question type sentence data as training data and the answer type sentence data linked to the question type sentence data as input data, thereby constructing the question sentence estimation model. For example, the question sentence estimation model may use a trained model generated by the trained model generation device 20 as described above.

図10を用いて、類似度を出力する一例について具体的に説明する。 An example of outputting similarity will be specifically explained using Figure 10.

図10は、生成した推定質問文章と継続中の会話における送信済み質問文章との類似度を分析する一例について示す図である。図10に示す回答者端末30は、回答者側の会話支援装置であり、例えば、前記質問者及び前記回答者間のやり取り(対話・会話)を行う装置である。回答者端末30のディスプレイ(表示装置)には、例えば、図10に示すように、継続中の会話における複数の文章データが表示される。また、前記ディスプレイには、入力欄が表示されている。前記回答者は、入力装置を用いて前記入力欄内に文章データを入力する。図10において、前記入力欄に入力された文章データは、回答タイプの文章データであるが、質問対応の文章データが入力されてもよい。質問推定装置10は、例えば、未送信文章取得部14により前記入力欄に入力された未送信の文章データを取得して、文章タイプ識別部12により前記入力欄に入力された文章データの文章タイプを識別してもよい。そして、前記入力欄に入力された文章データの文章タイプが回答タイプと識別された場合に、質問推定装置10は、例えば、推定質問文章生成部15による推定質問文章の生成、質問文章取得部18による送信済み回答文章の取得、類似度分析部19による類似度の分析等を実行する。一方で、質問推定装置10は、例えば、回答者端末30から前記類似度の分析に関するリクエストを取得してもよい。具体的に、前記回答タイプの文章データを入力した回答者は、例えば、ディスプレイに表示された「正当性確認」を押下する。そうすると、回答者端末30から質問推定装置10に前記リクエストが送信される。前記リクエストを取得した質問推定装置10は、未送信文章取得部14により、前記入力欄に入力された回答タイプの文章データ(未送信回答文章)を取得する。次に、前述と同様に、質問推定装置10は、推定質問文章生成部15による推定質問文章の生成、質問文章取得部18による送信済み回答文章の取得、類似度分析部19による類似度の分析を実行する。そして、出力部16により、前記未送信回答文章が前記会話に対する送信対象としての確からしさの程度を示す「正当性」として、前記類似度を回答者端末30に出力する。出力された前記類似度(正当性)は、例えば、回答者端末30のディスプレイに表示される。これにより、回答者は、ディスプレイに表示された前記正当性の程度を確認することができ、誤送信の防止につながる。 Figure 10 is a diagram showing an example of analyzing the similarity between the generated estimated question sentence and a sent question sentence in an ongoing conversation. The respondent terminal 30 shown in Figure 10 is a conversation support device on the respondent's side, and is, for example, a device that performs an exchange (dialogue/conversation) between the questioner and the respondent. For example, as shown in Figure 10, a plurality of sentence data in the ongoing conversation is displayed on the display (display device) of the respondent terminal 30. In addition, an input field is displayed on the display. The respondent inputs sentence data into the input field using an input device. In Figure 10, the sentence data input into the input field is answer-type sentence data, but sentence data corresponding to a question may also be input. The question estimation device 10 may, for example, acquire unsent sentence data input into the input field by the unsent sentence acquisition unit 14, and identify the sentence type of the sentence data input into the input field by the sentence type identification unit 12. Then, when the text type of the text data entered in the input field is identified as an answer type, the question estimation device 10 executes, for example, the generation of an estimated question text by the estimated question text generation unit 15, the acquisition of the transmitted answer text by the question text acquisition unit 18, and the analysis of similarity by the similarity analysis unit 19. On the other hand, the question estimation device 10 may acquire a request for the analysis of the similarity from, for example, the answerer terminal 30. Specifically, the answerer who inputs the text data of the answer type presses, for example, "verify validity" displayed on the display. Then, the request is transmitted from the answerer terminal 30 to the question estimation device 10. The question estimation device 10 that has acquired the request acquires the text data of the answer type (untransmitted answer text) entered in the input field by the untransmitted text acquisition unit 14. Next, as described above, the question estimation device 10 executes the generation of an estimated question text by the estimated question text generation unit 15, the acquisition of the transmitted answer text by the question text acquisition unit 18, and the analysis of similarity by the similarity analysis unit 19. Then, the output unit 16 outputs the similarity to the respondent terminal 30 as "legitimacy" indicating the degree of likelihood that the unsent answer sentence is a transmission target for the conversation. The output similarity (legitimacy) is displayed, for example, on the display of the respondent terminal 30. This allows the respondent to check the degree of legitimacy displayed on the display, which helps prevent erroneous transmission.

[実施形態4]
本実施形態のプログラムは、本発明の方法の各工程を、手順として、コンピュータに実行させるためのプログラムである。本発明において、「手順」は、「処理」と読み替えてもよい。また、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されていてもよい。前記記録媒体としては、特に限定されず、例えば、読み出し専用メモリ(ROM)、ハードディスク(HD)、光ディスク等が挙げられる。
[Embodiment 4]
The program of the present embodiment is a program for causing a computer to execute each step of the method of the present invention as a procedure. In the present invention, the "procedure" may be read as "processing." The program of the present embodiment may be recorded, for example, in a computer-readable recording medium. The recording medium is not particularly limited, and examples thereof include a read-only memory (ROM), a hard disk (HD), and an optical disk.

以上、実施形態を参照して本発明を説明したが、本発明は、上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をできる。 The present invention has been described above with reference to the embodiments, but the present invention is not limited to the above embodiments. Various modifications that can be understood by a person skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.

<付記>
上記の実施形態の一部または全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
会話履歴データ取得部、文章タイプ識別部、質問回答表生成部、未送信文章取得部、及び推定質問文章生成部を含み、
前記会話履歴データ取得部は、終了した会話の文字データである会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記文章タイプ識別部は、前記文章データ毎に文章タイプを識別し、
前記文章タイプは、質問タイプと、回答タイプとを含み、
前記質問回答表生成部は、前記識別の結果に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成し、
前記未送信文章取得部は、継続中の会話において、他のユーザへの送信前である未送信回答文章を取得し、
前記推定質問文章生成部は、前記質問回答表及び前記未送信回答文章に基づき、前記未送信回答文章に対応する推定質問文章を生成する、質問推定装置。
(付記2)
前記文章タイプ識別部は、不要文識別部、不要文削除部、形態素解析部、及び識別部を含み、
前記不要文識別部は、前記文章データ内の不要文を識別し、
前記不要文削除部は、前記識別した不要文を前記文章データから削除し、
前記形態素解析部は、前記文章データに対して文単位で形態素解析を行い、
前記識別部は、前記形態素解析に基づき、予め設定した文末表現ルールに従って、前記文章データの文章タイプを識別する、付記1記載の質問推定装置。
(付記3)
前記質問回答表生成部は、下記条件(1)~(3)の少なくとも一方に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成する、付記1又は2記載の質問推定装置。
(1)前記回答タイプの文章データに、前記回答タイプの文章データよりも送信時刻の古い前記質問タイプの文章データを紐づける
(2)前記回答タイプの文章データを送信したユーザと異なる他のユーザが送信した前記質問タイプの文章データを紐づける
(3)前記回答タイプの文章データとの紐づけの対象となる前記質問タイプの文章データが複数存在する場合に、前記回答タイプの文章データと前記質問タイプの文章データとの類似度を算出し、前記類似度が高い前記回答タイプの文章データと前記質問タイプの文章データとの組み合わせで紐づける
(付記4)
前記推定質問文章生成部は、質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成し、
前記質問文章推定モデルは、入力された未送信回答文章から前記未送信回答文章に対応する推定質問文章を生成するように学習されたモデルである、付記1から3のいずれかに記載の質問推定装置。
(付記5)
さらに、学習処理部を含み、
前記学習処理部は、前記質問回答表における前記質問文章を教師データとし、前記質問タイプの文章データと紐づけられている前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築し、
前記推定質問文章生成部は、前記構築した質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成する、付記1から4のいずれかに記載の質問推定装置。
(付記6)
前記学習処理部は、前記教師付き機械学習を行う前に、入力された文章データをベクトルに変換するように教師なし学習されたベクトル変換学習済みモデルに、前記質問回答表の各文章データを入力して、前記各文章データをベクトルに変換し、且つ
前記ベクトルに変換した前記質問タイプの文章データを教師データとし、前記ベクトルに変換した前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築する、付記6記載の質問推定装置。
(付記7)
さらに、出力部、質問文章取得部、及び類似度分析部を含み、
前記質問文章取得部は、継続中の会話における送信済みであって且つ他のユーザが送信した質問タイプの文章データを取得し、
前記類似度分析部は、前記送信済みの質問タイプの文章データと前記生成した推定質問文章と比較して類似度を分析し、
前記出力部は、前記類似度を出力ずる、付記1から6のいずれかに記載の質問推定装置。
(付記8)
データ取得部、及び学習済みモデル生成部を含み、
前記データ取得部は、回答タイプの文章データと紐づけた質問タイプの文章データを教師データとして取得し、
前記学習済みモデル生成部は、前記教師データを用いた機械学習によって、前記回答タイプの文章データを入力した場合に、前記回答タイプの文章データに対応する推定質問文章を生成して出力する第1の学習済みモデルを生成する、学習済みモデル生成装置。
(付記9)
前記データ取得部は、会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記学習済みモデル生成部は、さらに、前記会話履歴データを用いた教師なし機械学習によって、前記文章データを入力した場合に、前記文章データをベクトルに変換して出力する第2の学習済みモデルを生成する、付記8記載の学習済みモデル生成装置。
(付記10)
会話履歴データ取得工程、文章タイプ識別工程、質問回答表生成工程、未送信文章取得工程、及び推定質問文章生成工程を含み、
前記会話履歴データ取得工程は、終了した会話の文字データである会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記文章タイプ識別工程は、前記文章データ毎に文章タイプを識別し、
前記文章タイプは、質問タイプと、回答タイプとを含み、
前記質問回答表生成工程は、前記識別の結果に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成し、
前記未送信文章取得工程は、継続中の会話において、他のユーザへの送信前である未送信回答文章を取得し、
前記推定質問文章生成工程は、前記質問回答表及び前記未送信回答文章に基づき、前記未送信回答文章に対応する推定質問文章を生成する、質問推定方法。
(付記11)
前記文章タイプ識別工程は、不要文識別工程、不要文削除工程、形態素解析工程、及び識別工程を含み、
前記不要文識別工程は、前記文章データ内の不要文を識別し、
前記不要文削除工程は、前記識別した不要文を前記文章データから削除し、
前記形態素解析工程は、前記文章データに対して文単位で形態素解析を行い、
前記識別工程は、前記形態素解析に基づき、予め設定した文末表現ルールに従って、前記文章データの文章タイプを識別する、付記10記載の質問推定方法。
(付記12)
前記質問回答表生成工程は、下記条件(1)~(3)の少なくとも一方に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成する、付記10又は11記載の質問推定方法。
(1)前記回答タイプの文章データに、前記回答タイプの文章データよりも送信時刻の古い前記質問タイプの文章データを紐づける
(2)前記回答タイプの文章データを送信したユーザと異なる他のユーザが送信した前記質問タイプの文章データを紐づける
(3)前記回答タイプの文章データとの紐づけの対象となる前記質問タイプの文章データが複数存在する場合に、前記回答タイプの文章データと前記質問タイプの文章データとの類似度を算出し、前記類似度が高い前記回答タイプの文章データと前記質問タイプの文章データとの組み合わせで紐づける
(付記13)
前記推定質問文章生成工程は、質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成し、
前記質問文章推定モデルは、入力された未送信回答文章から前記未送信回答文章に対応する推定質問文章を生成するように学習されたモデルである、付記10から12のいずれかに記載の質問推定方法。
(付記14)
さらに、学習処理工程を含み、
前記学習処理工程は、前記質問回答表における前記質問文章を教師データとし、前記質問タイプの文章データと紐づけられている前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築し、
前記推定質問文章生成工程は、前記構築した質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成する、付記10から13のいずれかに記載の質問推定方法。
(付記15)
前記学習処理工程は、前記教師付き機械学習を行う前に、入力された文章データをベクトルに変換するように教師なし学習されたベクトル変換学習済みモデルに、前記質問回答表の各文章データを入力して、前記各文章データをベクトルに変換し、且つ
前記ベクトルに変換した前記質問タイプの文章データを教師データとし、前記ベクトルに変換した前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築する、付記14記載の質問推定方法。
(付記16)
さらに、出力工程、質問文章取得工程、及び類似度分析工程を含み、
前記質問文章取得工程は、継続中の会話における送信済みであって且つ他のユーザが送信した質問タイプの文章データを取得し、
前記類似度分析工程は、前記送信済みの質問タイプの文章データと前記生成した推定質問文章と比較して類似度を分析し、
前記出力工程は、前記類似度を出力ずる、付記10から15のいずれかに記載の質問推定方法。
(付記17)
データ取得工程、及び学習済みモデル生成工程を含み、
前記データ取得工程は、回答タイプの文章データと紐づけた質問タイプの文章データを教師データとして取得し、
前記学習済みモデル生成工程は、前記教師データを用いた機械学習によって、前記回答タイプの文章データを入力した場合に、前記回答タイプの文章データに対応する推定質問文章を生成して出力する第1の学習済みモデルを生成する、学習済みモデルの生産方法。
(付記18)
前記データ取得工程は、会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記学習済みモデル生成工程は、さらに、前記会話履歴データを用いた教師なし機械学習によって、前記文章データを入力した場合に、前記文章データをベクトルに変換して出力する第2の学習済みモデルを生成する、付記17記載の学習済みモデルの生産方法。
(付記19)
コンピュータに、会話履歴データ取得手順、文章タイプ識別手順、質問回答表生成手順、未送信文章取得手順、及び推定質問文章生成手順を含む手順を実行させるためのプログラム:
前記会話履歴データ取得手順は、終了した会話の文字データである会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記文章タイプ識別手順は、前記文章データ毎に文章タイプを識別し、
前記文章タイプは、質問タイプと、回答タイプとを含み、
前記質問回答表生成手順は、前記識別の結果に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成し、
前記未送信文章取得手順は、継続中の会話において、他のユーザへの送信前である未送信回答文章を取得し、
前記推定質問文章生成手順は、前記質問回答表及び前記未送信回答文章に基づき、前記未送信回答文章に対応する推定質問文章を生成する。
(付記20)
前記文章タイプ識別手順は、不要文識別手順、不要文削除手順、形態素解析手順、及び識別手順を含み、
前記不要文識別手順は、前記文章データ内の不要文を識別し、
前記不要文削除手順は、前記識別した不要文を前記文章データから削除し、
前記形態素解析手順は、前記文章データに対して文単位で形態素解析を行い、
前記識別手順は、前記形態素解析に基づき、予め設定した文末表現ルールに従って、前記文章データの文章タイプを識別する、付記19記載のプログラム。
(付記21)
前記質問回答表生成手順は、下記条件(1)~(3)の少なくとも一方に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成する、付記19又は20記載のプログラム。
(1)前記回答タイプの文章データに、前記回答タイプの文章データよりも送信時刻の古い前記質問タイプの文章データを紐づける
(2)前記回答タイプの文章データを送信したユーザと異なる他のユーザが送信した前記質問タイプの文章データを紐づける
(3)前記回答タイプの文章データとの紐づけの対象となる前記質問タイプの文章データが複数存在する場合に、前記回答タイプの文章データと前記質問タイプの文章データとの類似度を算出し、前記類似度が高い前記回答タイプの文章データと前記質問タイプの文章データとの組み合わせで紐づける
(付記22)
前記推定質問文章生成手順は、質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成し、
前記質問文章推定モデルは、入力された未送信回答文章から前記未送信回答文章に対応する推定質問文章を生成するように学習されたモデルである、付記19から21のいずれかに記載のプログラム。
(付記23)
さらに、学習処理手順を含み、
前記学習処理手順は、前記質問回答表における前記質問文章を教師データとし、前記質問タイプの文章データと紐づけられている前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築し、
前記推定質問文章生成手順は、前記構築した質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成する、付記19から22のいずれかに記載のプログラム。
(付記24)
前記学習処理手順は、前記教師付き機械学習を行う前に、入力された文章データをベクトルに変換するように教師なし学習されたベクトル変換学習済みモデルに、前記質問回答表の各文章データを入力して、前記各文章データをベクトルに変換し、且つ
前記ベクトルに変換した前記質問タイプの文章データを教師データとし、前記ベクトルに変換した前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築する、付記23記載のプログラム。
(付記25)
さらに、出力手順、質問文章取得手順、及び類似度分析手順を含み、
前記質問文章取得手順は、継続中の会話における送信済みであって且つ他のユーザが送信した質問タイプの文章データを取得し、
前記類似度分析手順は、前記送信済みの質問タイプの文章データと前記生成した推定質問文章と比較して類似度を分析し、
前記出力手順は、前記類似度を出力ずる、付記19から24のいずれかに記載のプログラム。
(付記26)
コンピュータに、データ取得手順、及び学習済みモデル生成手順を含む手順を実行させるためのプログラム:
前記データ取得手順は、回答タイプの文章データと紐づけた質問タイプの文章データを教師データとして取得し、
前記学習済みモデル生成手順は、前記教師データを用いた機械学習によって、前記回答タイプの文章データを入力した場合に、前記回答タイプの文章データに対応する推定質問文章を生成して出力する第1の学習済みモデルを生成する。
(付記27)
前記データ取得手順は、会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記学習済みモデル生成手順は、さらに、前記会話履歴データを用いた教師なし機械学習によって、前記文章データを入力した場合に、前記文章データをベクトルに変換して出力する第2の学習済みモデルを生成する、付記26記載のプログラム。
(付記28)
付記19から27のいずれかに記載のプログラムを記録しているコンピュータ読み取り可能な記録媒体。
<Additional Notes>
Some or all of the above embodiments may be described as follows, but are not limited to the following:
(Appendix 1)
The system includes a conversation history data acquisition unit, a sentence type identification unit, a question and answer table generation unit, an unsent sentence acquisition unit, and an estimated question sentence generation unit,
the conversation history data acquisition unit acquires conversation history data, which is character data of a completed conversation;
The conversation history data is composed of a plurality of sentence data,
The text type identification unit identifies a text type for each of the text data,
The sentence types include a question type and an answer type,
the question and answer table generating unit generates a question and answer table by linking the sentence data of the question type with the sentence data of the answer type based on a result of the identification;
The unsent text acquisition unit acquires an unsent reply text that has not yet been transmitted to another user in an ongoing conversation,
The question estimation device, wherein the estimated question sentence generation unit generates an estimated question sentence corresponding to the untransmitted answer sentence based on the question and answer table and the untransmitted answer sentence.
(Appendix 2)
the sentence type identification unit includes an unnecessary sentence identification unit, an unnecessary sentence deletion unit, a morphological analysis unit, and an identification unit;
The unnecessary sentence identification unit identifies unnecessary sentences in the text data,
the unnecessary sentence deletion unit deletes the identified unnecessary sentences from the text data;
The morphological analysis unit performs a morphological analysis on the text data on a sentence-by-sentence basis;
The question prediction device according to claim 1, wherein the identification unit identifies a sentence type of the sentence data based on the morphological analysis and in accordance with a preset sentence-ending expression rule.
(Appendix 3)
3. The question estimation device according to claim 1, wherein the question and answer table generation unit generates a question and answer table by linking the sentence data of the question type with the sentence data of the answer type based on at least one of the following conditions (1) to (3):
(1) Linking the answer type text data to the question type text data that was sent earlier than the answer type text data. (2) Linking the question type text data sent by a user other than the user who sent the answer type text data. (3) When there are multiple pieces of question type text data to be linked with the answer type text data, calculating the similarity between the answer type text data and the question type text data, and linking the answer type text data and the question type text data with the highest similarity (Appendix 4).
the estimated question sentence generation unit inputs the acquired untransmitted answer sentence into a question sentence estimation model to generate an estimated question sentence corresponding to the untransmitted answer sentence;
4. The question estimation device according to claim 1, wherein the question sentence estimation model is a model trained to generate an estimated question sentence corresponding to an input untransmitted answer sentence from the input untransmitted answer sentence.
(Appendix 5)
Further, a learning processing unit is included,
the learning processing unit uses the question sentence in the question and answer table as teacher data and uses sentence data of the answer type linked to sentence data of the question type as input data to construct the question sentence estimation model through supervised machine learning;
5. The question estimation device according to claim 1, wherein the estimated question sentence generation unit inputs the acquired unsent answer sentence into the constructed question sentence estimation model to generate an estimated question sentence corresponding to the unsent answer sentence.
(Appendix 6)
the learning processing unit inputs each piece of text data in the question and answer list into a vector conversion trained model that has been trained in an unsupervised manner to convert input text data into a vector before performing the supervised machine learning, converts each piece of text data into a vector, and uses the text data of the question type converted into the vector as supervised data and the text data of the answer type converted into the vector as input data to construct the question text estimation model by supervised machine learning.
(Appendix 7)
Further, the apparatus includes an output unit, a question sentence acquisition unit, and a similarity analysis unit,
the question sentence acquisition unit acquires question-type sentence data that has been sent in the ongoing conversation and has been sent by another user,
the similarity analysis unit compares the transmitted sentence data of the question type with the generated estimated question sentence to analyze the similarity;
7. The question estimation device according to claim 1, wherein the output unit outputs the similarity.
(Appendix 8)
The data acquisition unit and the trained model generation unit are included.
the data acquisition unit acquires question-type sentence data linked to answer-type sentence data as teacher data;
The trained model generation unit is a trained model generation device that generates a first trained model by machine learning using the teacher data, which generates and outputs an estimated question sentence corresponding to the answer type sentence data when the answer type sentence data is input.
(Appendix 9)
The data acquisition unit acquires conversation history data,
The conversation history data is composed of a plurality of sentence data,
The trained model generation device of claim 8, wherein the trained model generation unit further generates a second trained model by unsupervised machine learning using the conversation history data, which, when input, converts the sentence data into a vector and outputs the sentence data.
(Appendix 10)
The method includes a conversation history data acquisition step, a sentence type identification step, a question and answer table generation step, an unsent sentence acquisition step, and an estimated question sentence generation step,
The conversation history data acquisition step acquires conversation history data, which is character data of a completed conversation,
The conversation history data is composed of a plurality of sentence data,
The text type identification step includes identifying a text type for each of the text data,
The sentence types include a question type and an answer type,
the question and answer table generating step links the sentence data of the question type with the sentence data of the answer type based on a result of the identification to generate a question and answer table;
The unsent text acquisition step includes acquiring an unsent reply text that has not yet been transmitted to another user in an ongoing conversation,
The question estimating method includes generating an estimated question sentence corresponding to the untransmitted answer sentence based on the question and answer table and the untransmitted answer sentence, in the estimated question sentence generating step.
(Appendix 11)
The sentence type identification step includes an unnecessary sentence identification step, an unnecessary sentence deletion step, a morphological analysis step, and an identification step,
The unnecessary sentence identification step includes identifying unnecessary sentences in the text data,
the unnecessary sentence deletion step deletes the identified unnecessary sentences from the text data;
The morphological analysis step performs a morphological analysis on the text data on a sentence-by-sentence basis;
The question estimating method according to claim 10, wherein the identifying step identifies a sentence type of the sentence data based on the morphological analysis and in accordance with a preset sentence-ending expression rule.
(Appendix 12)
12. The question estimating method according to claim 10, wherein the question and answer table generating step generates a question and answer table by linking the sentence data of the question type with the sentence data of the answer type based on at least one of the following conditions (1) to (3):
(1) Linking the answer type text data to the question type text data that was sent earlier than the answer type text data. (2) Linking the question type text data sent by a user other than the user who sent the answer type text data. (3) When there are multiple pieces of question type text data to be linked with the answer type text data, calculating the similarity between the answer type text data and the question type text data, and linking the answer type text data and the question type text data that have the highest similarity (Appendix 13).
the estimated question sentence generation step inputs the acquired untransmitted answer sentence into a question sentence estimation model to generate an estimated question sentence corresponding to the untransmitted answer sentence;
The question estimation method according to any one of appendices 10 to 12, wherein the question sentence estimation model is a model trained to generate an estimated question sentence corresponding to an input unsent answer sentence from the input unsent answer sentence.
(Appendix 14)
Further, a learning process is included,
the learning process includes constructing the question sentence estimation model by supervised machine learning using the question sentence in the question and answer table as training data and sentence data of the answer type linked to sentence data of the question type as input data;
The question estimating method according to any one of Appendices 10 to 13, wherein the estimated question sentence generating step inputs the acquired unsent answer sentence into the constructed question sentence estimation model to generate an estimated question sentence corresponding to the unsent answer sentence.
(Appendix 15)
The question estimation method according to claim 14, wherein the learning process step inputs each piece of text data in the question and answer list into a vector conversion trained model that has been trained in an unsupervised manner to convert input text data into a vector before performing the supervised machine learning, converts each piece of text data into a vector, and uses the text data of the question type converted into the vector as teacher data and the text data of the answer type converted into the vector as input data to construct the question text estimation model by supervised machine learning.
(Appendix 16)
The method further includes an output step, a question sentence acquisition step, and a similarity analysis step,
The question sentence acquisition step acquires question-type sentence data that has been sent in the ongoing conversation and has been sent by another user,
the similarity analysis step compares the transmitted sentence data of the question type with the generated estimated question sentence to analyze the similarity;
16. The question estimating method according to any one of appendices 10 to 15, wherein the outputting step outputs the similarity.
(Appendix 17)
The method includes a data acquisition process and a trained model generation process.
The data acquisition step includes acquiring question-type sentence data linked to answer-type sentence data as teacher data,
The trained model generation process is a trained model production method that generates a first trained model by machine learning using the training data, which generates and outputs an estimated question sentence corresponding to the answer type sentence data when the answer type sentence data is input.
(Appendix 18)
The data acquisition step acquires conversation history data,
The conversation history data is composed of a plurality of sentence data,
The trained model generation process further generates a second trained model by unsupervised machine learning using the conversation history data, which converts the sentence data into a vector and outputs the sentence data when the sentence data is input.
(Appendix 19)
A program for causing a computer to execute steps including a conversation history data acquisition step, a sentence type identification step, a question and answer table generation step, an unsent sentence acquisition step, and an estimated question sentence generation step:
The conversation history data acquisition step acquires conversation history data, which is character data of a completed conversation;
The conversation history data is composed of a plurality of sentence data,
The text type identification step includes identifying a text type for each of the text data;
The sentence types include a question type and an answer type,
the step of generating a question and answer table includes linking the sentence data of the question type with the sentence data of the answer type based on a result of the identification to generate a question and answer table;
The unsent text acquisition step includes acquiring an unsent reply text that has not yet been transmitted to another user in an ongoing conversation;
The estimated question sentence generating step generates an estimated question sentence corresponding to the untransmitted answer sentence based on the question and answer table and the untransmitted answer sentence.
(Appendix 20)
The sentence type identification step includes an unnecessary sentence identification step, an unnecessary sentence deletion step, a morphological analysis step, and a classification step;
The unnecessary sentence identification step includes identifying unnecessary sentences in the text data;
the unnecessary sentence deletion step deletes the identified unnecessary sentences from the sentence data;
The morphological analysis step performs a morphological analysis on the text data on a sentence-by-sentence basis;
20. The program according to claim 19, wherein the identification step identifies a sentence type of the sentence data based on the morphological analysis and in accordance with a preset sentence-ending expression rule.
(Appendix 21)
The program according to claim 19 or 20, wherein the question and answer table generating step generates a question and answer table by linking the sentence data of the question type with the sentence data of the answer type based on at least one of the following conditions (1) to (3):
(1) Linking the answer type text data to the question type text data that was sent earlier than the answer type text data. (2) Linking the question type text data sent by a user other than the user who sent the answer type text data. (3) When there are multiple pieces of question type text data to be linked with the answer type text data, calculating the similarity between the answer type text data and the question type text data, and linking the answer type text data and the question type text data with the highest similarity (Appendix 22).
the estimated question sentence generation step inputs the acquired untransmitted answer sentence into a question sentence estimation model to generate an estimated question sentence corresponding to the untransmitted answer sentence;
A program described in any one of appendices 19 to 21, wherein the question sentence estimation model is a model trained to generate an estimated question sentence corresponding to an input unsent answer sentence from the input unsent answer sentence.
(Appendix 23)
Further, a learning procedure is included,
the learning process step includes constructing the question sentence estimation model by supervised machine learning using the question sentence in the question and answer table as training data and sentence data of the answer type linked to sentence data of the question type as input data;
The program according to any one of Appendices 19 to 22, wherein the estimated question sentence generation step inputs the acquired unsent answer sentence into the constructed question sentence estimation model to generate an estimated question sentence corresponding to the unsent answer sentence.
(Appendix 24)
The program described in Appendix 23, wherein the learning process procedure includes inputting each piece of sentence data in the question and answer list into a vector conversion trained model that has been trained in an unsupervised manner to convert input sentence data into a vector before performing the supervised machine learning, converting each piece of sentence data into a vector, and using the sentence data of the question type converted into the vector as teacher data and the sentence data of the answer type converted into the vector as input data to construct the question sentence estimation model by supervised machine learning.
(Appendix 25)
Further, the method includes an output step, a question sentence acquisition step, and a similarity analysis step,
The question sentence acquisition step acquires question-type sentence data that has been sent in the ongoing conversation and has been sent by another user,
the similarity analysis step compares the transmitted question type sentence data with the generated estimated question sentence to analyze the similarity;
25. The program according to any one of appendices 19 to 24, wherein the output step outputs the similarity.
(Appendix 26)
A program for causing a computer to execute a procedure including a data acquisition procedure and a trained model generation procedure:
The data acquisition step includes acquiring question-type sentence data linked to answer-type sentence data as training data;
The trained model generation procedure generates, through machine learning using the training data, a first trained model that, when inputted with the answer type of sentence data, generates and outputs an estimated question sentence corresponding to the answer type of sentence data.
(Appendix 27)
The data acquisition step acquires conversation history data;
The conversation history data is composed of a plurality of sentence data,
The program described in Appendix 26, wherein the trained model generation procedure further generates a second trained model by unsupervised machine learning using the conversation history data, which, when the sentence data is input, converts the sentence data into a vector and outputs it.
(Appendix 28)
A computer-readable recording medium having a program according to any one of appendices 19 to 27 recorded thereon.

本発明によれば、回答の誤送信を未然に防ぐことができる。このため、本発明は、複数人のカスタマからの質問に対し、回答者として1人の担当者が担当(回答)する場合において特に有用である。 The present invention can prevent erroneous sending of answers. Therefore, the present invention is particularly useful in cases where one person answers questions from multiple customers.

10 質問推定装置
11 会話履歴データ取得部
12 文章タイプ識別部
13 質問回答表生成部
14 未送信文章取得部
15 推定質問文章生成部
16 出力部
17 学習処理部
18 質問文章取得部
19 類似度分析部
20 学習済みモデル生成装置
21 データ取得部
22 学習済みモデル生成部
100 会話履歴データベース
101 中央処理装置
102 メモリ
103 バス
104 記憶装置
105 入力装置
106 表示装置
107 通信デバイス
10 Question estimation device 11 Conversation history data acquisition unit 12 Sentence type identification unit 13 Question and answer table generation unit 14 Untransmitted sentence acquisition unit 15 Estimated question sentence generation unit 16 Output unit 17 Learning processing unit 18 Question sentence acquisition unit 19 Similarity analysis unit 20 Trained model generation device 21 Data acquisition unit 22 Trained model generation unit 100 Conversation history database 101 Central processing unit 102 Memory 103 Bus 104 Storage device 105 Input device 106 Display device 107 Communication device

Claims (10)

会話履歴データ取得部、文章タイプ識別部、質問回答表生成部、未送信文章取得部、及び推定質問文章生成部を含み、
前記会話履歴データ取得部は、終了した会話の文字データである会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記文章タイプ識別部は、前記文章データ毎に文章タイプを識別し、
前記文章タイプは、質問タイプと、回答タイプとを含み、
前記質問回答表生成部は、前記識別の結果に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成し、
前記未送信文章取得部は、継続中の会話において、他のユーザへの送信前である未送信回答文章を取得し、
前記推定質問文章生成部は、前記質問回答表及び前記未送信回答文章に基づき、前記未送信回答文章に対応する推定質問文章を生成する、質問推定装置。
The system includes a conversation history data acquisition unit, a sentence type identification unit, a question and answer table generation unit, an unsent sentence acquisition unit, and an estimated question sentence generation unit,
the conversation history data acquisition unit acquires conversation history data, which is character data of a completed conversation;
The conversation history data is composed of a plurality of sentence data,
The text type identification unit identifies a text type for each of the text data,
The sentence types include a question type and an answer type,
the question and answer table generating unit generates a question and answer table by linking the sentence data of the question type with the sentence data of the answer type based on a result of the identification;
The unsent text acquisition unit acquires an unsent reply text that has not yet been transmitted to another user in an ongoing conversation,
The question estimation device, wherein the estimated question sentence generation unit generates an estimated question sentence corresponding to the untransmitted answer sentence based on the question and answer table and the untransmitted answer sentence.
前記文章タイプ識別部は、不要文識別部、不要文削除部、形態素解析部、及び識別部を含み、
前記不要文識別部は、前記文章データ内の不要文を識別し、
前記不要文削除部は、前記識別した不要文を前記文章データから削除し、
前記形態素解析部は、前記文章データに対して文単位で形態素解析を行い、
前記識別部は、前記形態素解析に基づき、予め設定した文末表現ルールに従って、前記文章データの文章タイプを識別する、請求項1記載の質問推定装置。
the sentence type identification unit includes an unnecessary sentence identification unit, an unnecessary sentence deletion unit, a morphological analysis unit, and an identification unit;
The unnecessary sentence identification unit identifies unnecessary sentences in the text data,
the unnecessary sentence deletion unit deletes the identified unnecessary sentences from the text data;
The morphological analysis unit performs a morphological analysis on the text data on a sentence-by-sentence basis;
The question prediction device according to claim 1 , wherein the identification unit identifies a sentence type of the sentence data based on the morphological analysis and in accordance with a preset sentence-ending expression rule.
前記推定質問文章生成部は、質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成し、
前記質問文章推定モデルは、入力された未送信回答文章から前記未送信回答文章に対応する推定質問文章を生成するように学習されたモデルである、請求項1又は2記載の質問推定装置。
the estimated question sentence generation unit inputs the acquired untransmitted answer sentence into a question sentence estimation model to generate an estimated question sentence corresponding to the untransmitted answer sentence;
The question estimation device according to claim 1 , wherein the question sentence estimation model is a model trained to generate an estimated question sentence corresponding to an input untransmitted answer sentence from the input untransmitted answer sentence.
さらに、学習処理部を含み、
前記学習処理部は、前記質問回答表における前記質問タイプの文章データを教師データとし、前記質問タイプの文章データと紐づけられている前記回答タイプの文章データを入力データとして、教師付き機械学習により前記質問文章推定モデルを構築し、
前記推定質問文章生成部は、前記構築した質問文章推定モデルに、取得した前記未送信回答文章を入力して、前記未送信回答文章に対応する推定質問文章を生成する、請求項記載の質問推定装置。
Further, a learning processing unit is included,
the learning processing unit uses sentence data of the question type in the question and answer table as teacher data and sentence data of the answer type linked to the sentence data of the question type as input data to construct the question sentence estimation model through supervised machine learning;
The question estimation device according to claim 3 , wherein the estimated question sentence generation unit inputs the acquired untransmitted answer sentence to the constructed question sentence estimation model to generate an estimated question sentence corresponding to the untransmitted answer sentence.
さらに、出力部、質問文章取得部、及び類似度分析部を含み、
前記質問文章取得部は、継続中の会話における送信済みであって且つ他のユーザが送信した質問タイプの文章データを取得し、
前記類似度分析部は、前記送信済みの質問タイプの文章データと前記生成した推定質問文章と比較して類似度を分析し、
前記出力部は、前記類似度を出力ずる、請求項1から4のいずれか一項に記載の質問推定装置。
Further, the apparatus includes an output unit, a question sentence acquisition unit, and a similarity analysis unit,
the question sentence acquisition unit acquires question-type sentence data that has been sent in the ongoing conversation and has been sent by another user,
the similarity analysis unit compares the transmitted sentence data of the question type with the generated estimated question sentence to analyze the similarity;
The question estimation device according to claim 1 , wherein the output unit outputs the similarity.
データ取得部、及び学習済みモデル生成部を含み、
前記データ取得部は、回答タイプの文章データと紐づけた質問タイプの文章データを教師データとして取得し、
前記学習済みモデル生成部は、前記教師データを用いた機械学習によって、前記回答タイプの文章データを入力した場合に、前記回答タイプの文章データに対応する推定質問文章を生成して出力する第1の学習済みモデルを生成する、学習済みモデル生成装置。
The data acquisition unit and the trained model generation unit are included.
the data acquisition unit acquires question-type sentence data linked to answer-type sentence data as teacher data;
The trained model generation unit is a trained model generation device that generates a first trained model by machine learning using the teacher data, which generates and outputs an estimated question sentence corresponding to the answer type sentence data when the answer type sentence data is input.
会話履歴データ取得工程、文章タイプ識別工程、質問回答表生成工程、未送信文章取得工程、及び推定質問文章生成工程を含み、
前記会話履歴データ取得工程は、終了した会話の文字データである会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記文章タイプ識別工程は、前記文章データ毎に文章タイプを識別し、
前記文章タイプは、質問タイプと、回答タイプとを含み、
前記質問回答表生成工程は、前記識別の結果に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成し、
前記未送信文章取得工程は、継続中の会話において、他のユーザへの送信前である未送信回答文章を取得し、
前記推定質問文章生成工程は、前記質問回答表及び前記未送信回答文章に基づき、前記未送信回答文章に対応する推定質問文章を生成する、
各工程がコンピュータにより実行される質問推定方法。
The method includes a conversation history data acquisition step, a sentence type identification step, a question and answer table generation step, an unsent sentence acquisition step, and an estimated question sentence generation step,
The conversation history data acquisition step acquires conversation history data, which is character data of a completed conversation,
The conversation history data is composed of a plurality of sentence data,
The text type identification step includes identifying a text type for each of the text data,
The sentence types include a question type and an answer type,
the question and answer table generating step links the sentence data of the question type with the sentence data of the answer type based on a result of the identification to generate a question and answer table;
The unsent text acquisition step includes acquiring an unsent reply text that has not yet been transmitted to another user in an ongoing conversation,
the estimated question sentence generating step generates an estimated question sentence corresponding to the untransmitted answer sentence based on the question and answer table and the untransmitted answer sentence.
A method of query estimation in which each step is carried out by a computer .
データ取得工程、及び学習済みモデル生成工程を含み、
前記データ取得工程は、回答タイプの文章データと紐づけた質問タイプの文章データを教師データとして取得し、
前記学習済みモデル生成工程は、前記教師データを用いた機械学習によって、前記回答タイプの文章データを入力した場合に、前記回答タイプの文章データに対応する推定質問文章を生成して出力する第1の学習済みモデルを生成する、学習済みモデルの生産方法。
The method includes a data acquisition process and a trained model generation process.
The data acquisition step includes acquiring question-type sentence data linked to answer-type sentence data as teacher data,
The trained model generation process is a trained model production method that generates a first trained model by machine learning using the training data, which generates and outputs an estimated question sentence corresponding to the answer type sentence data when the answer type sentence data is input.
コンピュータに、会話履歴データ取得手順、文章タイプ識別手順、質問回答表生成手順、未送信文章取得手順、及び推定質問文章生成手順を含む手順を実行させるためのプログラム:
前記会話履歴データ取得手順は、終了した会話の文字データである会話履歴データを取得し、
前記会話履歴データは、複数の文章データから構成され、
前記文章タイプ識別手順は、前記文章データ毎に文章タイプを識別し、
前記文章タイプは、質問タイプと、回答タイプとを含み、
前記質問回答表生成手順は、前記識別の結果に基づき、前記質問タイプの文章データと前記回答タイプの文章データとを紐づけて質問回答表を生成し、
前記未送信文章取得手順は、継続中の会話において、他のユーザへの送信前である未送信回答文章を取得し、
前記推定質問文章生成手順は、前記質問回答表及び前記未送信回答文章に基づき、前記未送信回答文章に対応する推定質問文章を生成する。
A program for causing a computer to execute steps including a conversation history data acquisition step, a sentence type identification step, a question and answer table generation step, an unsent sentence acquisition step, and an estimated question sentence generation step:
The conversation history data acquisition step acquires conversation history data, which is character data of a completed conversation;
The conversation history data is composed of a plurality of sentence data,
The text type identification step includes identifying a text type for each of the text data;
The sentence types include a question type and an answer type,
the step of generating a question and answer table includes linking the sentence data of the question type with the sentence data of the answer type based on a result of the identification to generate a question and answer table;
The unsent text acquisition step includes acquiring an unsent reply text that has not yet been transmitted to another user in an ongoing conversation;
The estimated question sentence generating step generates an estimated question sentence corresponding to the untransmitted answer sentence based on the question and answer table and the untransmitted answer sentence.
コンピュータに、データ取得手順、及び学習済みモデル生成手順を含む手順を実行させるためのプログラム:
前記データ取得手順は、回答タイプの文章データと紐づけた質問タイプの文章データを教師データとして取得し、
前記学習済みモデル生成手順は、前記教師データを用いた機械学習によって、前記回答タイプの文章データを入力した場合に、前記回答タイプの文章データに対応する推定質問文章を生成して出力する第1の学習済みモデルを生成する。
A program for causing a computer to execute a procedure including a data acquisition procedure and a trained model generation procedure:
The data acquisition step includes acquiring question-type sentence data linked to answer-type sentence data as teacher data;
The trained model generation procedure generates a first trained model by machine learning using the training data, which, when inputted, generates and outputs an estimated question sentence corresponding to the answer type sentence data.
JP2020188861A 2020-11-12 2020-11-12 QUESTION ESTIMATION DEVICE, TRAINED MODEL GENERATION DEVICE, QUESTION ESTIMATION METHOD, TRAINED MODEL PRODUCTION METHOD, PROGRAM, AND RECORDING MEDIUM Active JP7616761B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020188861A JP7616761B2 (en) 2020-11-12 2020-11-12 QUESTION ESTIMATION DEVICE, TRAINED MODEL GENERATION DEVICE, QUESTION ESTIMATION METHOD, TRAINED MODEL PRODUCTION METHOD, PROGRAM, AND RECORDING MEDIUM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020188861A JP7616761B2 (en) 2020-11-12 2020-11-12 QUESTION ESTIMATION DEVICE, TRAINED MODEL GENERATION DEVICE, QUESTION ESTIMATION METHOD, TRAINED MODEL PRODUCTION METHOD, PROGRAM, AND RECORDING MEDIUM

Publications (2)

Publication Number Publication Date
JP2022077831A JP2022077831A (en) 2022-05-24
JP7616761B2 true JP7616761B2 (en) 2025-01-17

Family

ID=81706896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020188861A Active JP7616761B2 (en) 2020-11-12 2020-11-12 QUESTION ESTIMATION DEVICE, TRAINED MODEL GENERATION DEVICE, QUESTION ESTIMATION METHOD, TRAINED MODEL PRODUCTION METHOD, PROGRAM, AND RECORDING MEDIUM

Country Status (1)

Country Link
JP (1) JP7616761B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024155046A (en) 2023-04-20 2024-10-31 株式会社SoVa Information processing system, information processing method, and program
JP2025059089A (en) * 2023-09-28 2025-04-09 ソフトバンクグループ株式会社 system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010066950A (en) 2008-09-10 2010-03-25 Fujitsu Ltd Question estimation method and program
US20170351962A1 (en) 2016-06-02 2017-12-07 International Business Machines Corporation Predicting user question in question and answer system
WO2019052261A1 (en) 2017-09-18 2019-03-21 京东方科技集团股份有限公司 Method for question answering service, question answering system and storage medium
JP2020071679A (en) 2018-10-31 2020-05-07 株式会社リクルート System, method, and program for assisting in response to question

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010066950A (en) 2008-09-10 2010-03-25 Fujitsu Ltd Question estimation method and program
US20170351962A1 (en) 2016-06-02 2017-12-07 International Business Machines Corporation Predicting user question in question and answer system
WO2019052261A1 (en) 2017-09-18 2019-03-21 京东方科技集团股份有限公司 Method for question answering service, question answering system and storage medium
JP2020071679A (en) 2018-10-31 2020-05-07 株式会社リクルート System, method, and program for assisting in response to question

Also Published As

Publication number Publication date
JP2022077831A (en) 2022-05-24

Similar Documents

Publication Publication Date Title
US11823061B2 (en) Systems and methods for continual updating of response generation by an artificial intelligence chatbot
Bilquise et al. Emotionally intelligent chatbots: A systematic literature review
US10827024B1 (en) Realtime bandwidth-based communication for assistant systems
US12314675B2 (en) System and method for a cognitive conversation service
US20210232762A1 (en) Architectures for natural language processing
CN111694937B (en) Interview method, device, computer equipment and storage medium based on artificial intelligence
US10592607B2 (en) Iterative alternating neural attention for machine reading
WO2022095380A1 (en) Ai-based virtual interaction model generation method and apparatus, computer device and storage medium
WO2021114841A1 (en) User report generating method and terminal device
US20200272791A1 (en) Systems and methods for automated conversations with a transactional assistant
CN110795913A (en) Text encoding method and device, storage medium and terminal
US20230130308A1 (en) Automated response engine and flow configured to exchange responsive communication data via an omnichannel electronic communication channel independent of data source
CN111709223B (en) Bert-based sentence vector generation method, device and electronic equipment
US20240428052A1 (en) Methods and systems for training medical machine-learning models
Lee et al. Deep representation learning for affective speech signal analysis and processing: Preventing unwanted signal disparities
WO2022034922A1 (en) System, program and method for questionnaire surveys
US11907673B1 (en) Enhancing chatbot recognition of user intent through graph analysis
CN114357964A (en) Subjective question scoring method, model training method, computer device, and storage medium
JP7616761B2 (en) QUESTION ESTIMATION DEVICE, TRAINED MODEL GENERATION DEVICE, QUESTION ESTIMATION METHOD, TRAINED MODEL PRODUCTION METHOD, PROGRAM, AND RECORDING MEDIUM
CN114138947A (en) Text processing method and device
CN120671796A (en) Intelligent knowledge base management method and system based on AI
CN118520091A (en) Multi-mode intelligent question-answering robot and construction method thereof
US12236944B2 (en) Systems and methods to improve trust in conversations with deep learning models
CN119513237A (en) Prompt word generation method, prompt word-based dialogue method and related device
US20250299667A1 (en) System and method for data visualization on spatial computing device based on cascading machine learning approach

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231004

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20241001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20241203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241226

R150 Certificate of patent or registration of utility model

Ref document number: 7616761

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150