JP7614738B2 - 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム - Google Patents
検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム Download PDFInfo
- Publication number
- JP7614738B2 JP7614738B2 JP2020085091A JP2020085091A JP7614738B2 JP 7614738 B2 JP7614738 B2 JP 7614738B2 JP 2020085091 A JP2020085091 A JP 2020085091A JP 2020085091 A JP2020085091 A JP 2020085091A JP 7614738 B2 JP7614738 B2 JP 7614738B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- question
- questions
- documents
- answer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、実施形態の質問回答予測システムの構成例を示すブロック図である。実施形態の質問回答予測システム1は、未知の質問文を受け付けた場合に、当該質問に含まれる単語を用いて文献を検索し、検索した文献を用いて回答を予測し、予測した回答を提供するサービスを提供するためのWebシステムやアプリケーションシステムである。
上述した質問回答予測システムは、まず、サービス提供サーバ200が、端末装置100から質問文を受け付ける(ステップS100)。次に、サービス提供サーバ200は、特徴語生成部400に質問文を提供する。特徴語生成部400は、質問文を単語に分割することで質問語を生成し、質問語に基づく特徴語を生成する(ステップS102)。サービス提供サーバ200は、生成された特徴語を取得する。
以上説明したように、実施形態の質問回答予測システム1によれば、質問を入力し、質問に含まれる単語に基づいて文献を検索する検索部(例えば全文検索サーバ300)と、検索部により検索された文献に基づく情報を入力し、質問に対する回答を予測した結果を出力する予測モデル(例えば機械読解モデル510)を有する予測部(例えば機械読解部500)と、備える、検索装置(例えばサービス提供サーバ200、全文検索サーバ300および機械読解部500)を実現することができる。この検索装置において、予測モデルは、例えば、学習用質問、学習用回答、および前記学習用回答を含む学習用文献を含むセットを学習データとして学習したモデルである。
実施形態の質問回答予測システム1によれば、質問、質問の回答、および回答を含む文献を第1学習データとして学習し、未知の質問および文献を入力した場合に回答を出力する予測モデル(例えば機械読解モデル510)を生成する第1の学習部(例えば学習処理部610)と、第1学習データのうち質問および質問に関連する特徴語を学習データとして学習し、未知の質問を入力した場合に、当該未知の質問に関連する特徴語を出力する特徴語生成モデル(例えば特徴語生成モデル410)を生成する第2の学習部(例えば学習処理部600)と、を備える学習装置(例えば学習処理部600と学習処理部610との組み合わせ)と、特徴語生成モデルを有し、未知の質問を入力した場合に、当該未知の質問に関連する特徴語を生成する特徴語生成部(例えば特徴語生成部400)と、未知の質問に含まれる単語に基づいて文献を検索する処理と、および特徴語生成部により生成された特徴語に基づいて文献を検索する処理とを実行する検索部(例えば全文検索サーバ300)と、予測モデルを有し、検索部により検索された文献に基づく情報を入力し、未知の質問に対する回答を予測した結果を出力する予測部(例えば機械読解部500)と、を備える、検索装置(例えば全文検索サーバ300と特徴語生成部400と機械読解部500との組み合わせ)と、を備える、質問回答予測システムを実現することができる。
実施形態の質問回答予測システム1によれば、質問、質問の回答、および回答を含む文献を第1学習データとして学習し、未知の質問および文献を入力した場合に回答を出力する予測モデルを生成するステップと、第1学習データのうち質問および質問に関連する特徴語を学習データとして学習し、未知の質問を入力した場合に、当該未知の質問に関連する特徴語を出力する特徴語生成モデルを生成するステップと、特徴語生成モデルを用いて、未知の質問を入力した場合に、当該未知の質問に関連する特徴語を生成するステップと、未知の質問に含まれる単語に基づいて文献を検索する処理と、および特徴語生成部により生成された特徴語に基づいて文献を検索する処理とを実行するステップと、予測モデルを用いて、検索された文献に基づく情報を入力し、未知の質問に対する回答を予測した結果を出力するステップと、を有する、質問回答予測方法を実現することができる。
質問回答予測システム1によれば、高い精度で質問に対する回答を出力することができることができる。すなわち、質問回答予測システム1によれば、ユーザの質問に対して単純な文字列等の一致に基づく文献の検索結果ではなく、質問から検索した文献に含まれる文字列のうち回答の確率の高い情報を、回答の結果として提供することができる。この結果、質問回答予測システム1によれば、質問の文脈を考慮した回答を提供することができる。
この質問回答予測システム1によれば、更に高い精度で質問に対する回答を出力することができることができる。すなわち、質問回答予測システム1によれば、質問に含まれる単語から検索した文献が存在しても当該文献に回答が含まれなくても、特徴語から検索した文献から回答を取得することができる。また、質問回答予測システム1によれば、ユーザの質問から検索した文献に正解となる回答を含んでいない場合でも、特徴語から検索した文献に正解となる回答を含んでいる場合に、質問に対して正解となる回答を提供することができる。
この質問回答予測システム1によれば、更に高い精度で質問に対する回答を出力することができる。すなわち、質問回答予測システム1によれば、質問ならびに特徴語に基づく文献から抽出した複数の回答候補のスコアを比較することで、多数の回答候補から回答の確率の高い情報を提供することができる。
Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置などに格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。
100 端末装置
110 ブラウザ
200 サービス提供サーバ
210 ジョブ管理部
220 結果提供部
230、240 ジョブキュー
300 全文検索サーバ
310 文献データベース
400 特徴語生成部
410 特徴語生成モデル
500 機械読解部
510 機械読解モデル
600、610 学習処理部
Claims (9)
- 学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを有し、当該生成モデルを用いて、入力される質問に対応する特徴語を生成する特徴語生成部と、
入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、前記特徴語生成部により生成された特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行する検索部と、
学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを有し、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力する機械読解部と、
入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを前記機械読解部から取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力する予測部と、
を備える、検索装置。 - 前記予測部は、前記機械読解モデルにより出力された、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補と、当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補とが同じである場合において、当該同じ回答候補のそれぞれの尤度を示すスコアが閾値を超える場合、当該同じ回答候補同士のスコアを合計する、
請求項1に記載の検索装置。 - 学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成する第1の学習部と、
学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成する第2の学習部と、を備える、
学習装置。 - 学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成する第1の学習部と、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成する第2の学習部と、を備える、学習装置と、
前記生成モデルを有し、当該生成モデルを用いて、入力される質問に対応する特徴語を生成する特徴語生成部と、入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、前記特徴語生成部により生成された特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行する検索部と、前記機械読解モデルを有し、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力する機械読解部と、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを前記機械読解部から取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力する予測部と、を備える、検索装置と、
を備える、質問回答予測システム。 - 学習装置が、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成するステップと、
前記学習装置が、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成するステップと、
検索装置が、前記生成モデルを用いて、入力される質問に対応する特徴語を生成するステップと、
前記検索装置が、入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、前記特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行するステップと、
前記検索装置が、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するステップと、
前記検索装置が、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力するステップと、
を有する、質問回答予測方法。 - 検索装置が、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを有し、当該生成モデルを用いて、入力される質問に対応する特徴語を生成するステップと、
前記検索装置が、入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、生成された特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行するステップと、
前記検索装置が、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを有し、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するステップと、
前記検索装置が、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力するステップと、
を有する、検索方法。 - 検索装置のコンピュータに、
学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを有し、当該生成モデルを用いて、入力される質問に対応する特徴語を生成するステップと、
入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、生成された特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行するステップと、
学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを有し、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するステップと、
入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力するステップと、
を実行させる、プログラム。 - 学習装置が、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成するステップと、
前記学習装置が、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成するステップと、
を有する、学習方法。 - 学習装置のコンピュータに、
学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成するステップと、
前記学習装置が、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成するステップと、
を実行させる、プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020085091A JP7614738B2 (ja) | 2020-05-14 | 2020-05-14 | 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020085091A JP7614738B2 (ja) | 2020-05-14 | 2020-05-14 | 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021179827A JP2021179827A (ja) | 2021-11-18 |
| JP7614738B2 true JP7614738B2 (ja) | 2025-01-16 |
Family
ID=78511578
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020085091A Active JP7614738B2 (ja) | 2020-05-14 | 2020-05-14 | 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7614738B2 (ja) |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014120053A (ja) | 2012-12-18 | 2014-06-30 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、方法、及びプログラム |
| JP2016164708A (ja) | 2015-03-06 | 2016-09-08 | 国立研究開発法人情報通信研究機構 | 含意ペア拡張装置、そのためのコンピュータプログラム、及び質問応答システム |
| JP2018041494A (ja) | 2017-11-02 | 2018-03-15 | ヤフー株式会社 | 制御装置、制御方法および制御プログラム |
| WO2019106965A1 (ja) | 2017-12-01 | 2019-06-06 | 日本電信電話株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| JP2019149145A (ja) | 2018-02-27 | 2019-09-05 | 株式会社 ミックウェア | 情報検索システム |
-
2020
- 2020-05-14 JP JP2020085091A patent/JP7614738B2/ja active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014120053A (ja) | 2012-12-18 | 2014-06-30 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、方法、及びプログラム |
| JP2016164708A (ja) | 2015-03-06 | 2016-09-08 | 国立研究開発法人情報通信研究機構 | 含意ペア拡張装置、そのためのコンピュータプログラム、及び質問応答システム |
| JP2018041494A (ja) | 2017-11-02 | 2018-03-15 | ヤフー株式会社 | 制御装置、制御方法および制御プログラム |
| WO2019106965A1 (ja) | 2017-12-01 | 2019-06-06 | 日本電信電話株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| JP2019149145A (ja) | 2018-02-27 | 2019-09-05 | 株式会社 ミックウェア | 情報検索システム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021179827A (ja) | 2021-11-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5475795B2 (ja) | カスタム言語モデル | |
| CN109299228B (zh) | 计算机执行的文本风险预测方法及装置 | |
| US20200349450A1 (en) | Projection neural networks | |
| JP6848091B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
| JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
| CN117795527A (zh) | 使用自回归语言模型神经网络评估输出序列 | |
| US20220391765A1 (en) | Systems and Methods for Semi-Supervised Active Learning | |
| JP7259935B2 (ja) | 情報処理システム、情報処理方法およびプログラム | |
| US20240144049A1 (en) | Computerized question answering based on evidence chains | |
| US12554930B2 (en) | Transformer-based text encoder for passage retrieval | |
| JP6230987B2 (ja) | 言語モデル作成装置、言語モデル作成方法、プログラム、および記録媒体 | |
| WO2022079826A1 (ja) | 学習装置、情報処理装置、学習方法、情報処理方法及びプログラム | |
| CN114841471A (zh) | 知识点预测方法、装置、电子设备和存储介质 | |
| JP6145562B2 (ja) | 情報構造化システム及び情報構造化方法 | |
| US12032614B2 (en) | Multiclass classification with diversified precision and recall weightings | |
| CN113239697B (zh) | 实体识别模型训练方法、装置、计算机设备及存储介质 | |
| JP7614738B2 (ja) | 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム | |
| JP7556269B2 (ja) | 推論プログラム及び推論方法 | |
| CN114003701A (zh) | 智能问答处理方法、装置、计算机设备和存储介质 | |
| WO2019192122A1 (zh) | 文档主题参数提取方法、产品推荐方法、设备及存储介质 | |
| Binay et al. | Fake news detection: Traditional vs. contemporary machine learning approaches | |
| CN112307738A (zh) | 用于处理文本的方法和装置 | |
| CN117112858A (zh) | 基于关联规则挖掘的对象筛选方法、处理器及存储介质 | |
| JP2023544560A (ja) | 文字認識における制約条件を強制するためのシステムおよび方法 | |
| CN117033566B (zh) | 答案抽取方法、装置、计算机设备、存储介质和产品 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230301 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240117 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240213 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240403 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240716 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240903 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240924 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241121 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241203 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241227 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7614738 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |