Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7614738B2 - 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム - Google Patents
[go: Go Back, main page]

JP7614738B2 - 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム - Google Patents

検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム Download PDF

Info

Publication number
JP7614738B2
JP7614738B2 JP2020085091A JP2020085091A JP7614738B2 JP 7614738 B2 JP7614738 B2 JP 7614738B2 JP 2020085091 A JP2020085091 A JP 2020085091A JP 2020085091 A JP2020085091 A JP 2020085091A JP 7614738 B2 JP7614738 B2 JP 7614738B2
Authority
JP
Japan
Prior art keywords
learning
question
questions
documents
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020085091A
Other languages
English (en)
Other versions
JP2021179827A (ja
Inventor
隆人 小柳
小太郎 山本
健太郎 鈴木
涼 君塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Comware Corp
Original Assignee
NTT Comware Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Comware Corp filed Critical NTT Comware Corp
Priority to JP2020085091A priority Critical patent/JP7614738B2/ja
Publication of JP2021179827A publication Critical patent/JP2021179827A/ja
Application granted granted Critical
Publication of JP7614738B2 publication Critical patent/JP7614738B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラムに関する。
従来より、質問に対して回答を得るための技術として、「全文検索技術」と「機械読解技術」とが知られている。全文検索技術は、質問中の単語の、文書中の出現頻度に基づいて、質問にマッチする文書を検索する技術である。機械読解技術は、質問、回答、および文献のセットを学習データとして学習し、質問が入力された場合に回答が含まれる文献中の区間を出力する技術である。
全文検索技術を用いた文書検索装置は、例えば、特許文献1に記載されている。この文書検索装置は、ユーザによって入力された検索条件に基づいて、文書データベースに記憶されている複数の文書に対する全文検索を行い、検索条件に一致する複数の文書を抽出する。
機械読解技術を用いた回答学習装置は、例えば、特許文献2に記載されている。この回答学習装置は、入力された文章及び質問文に基づいて、当該文章における当該質問文に対する回答の根拠となる範囲を推定するための予め学習された読解モデルを用いて、当該範囲の始端及び終端を推定する機械読解部を備える。
特開2019-89634号公報 特開2020-061173号公報
全文検索技術は多数の文献から所望の文献を抽出する技術であるが、全文検索技術により抽出した文献中に質問の回答が含まれている場合でも、当該文献を抽出した理由は当該文献中に質問中の単語が存在しただけであり、その他の理由を提示することができない。
機械読解技術は、質問、文献および回答を学習データとして学習するので、学習データに質問および文献が存在する場合には、文献中で質問の回答に対応した区間を抽出することができる。しかし、ユーザの質問に対する回答を含む文献が無い場合、回答を得ることができない。
本発明は、上記の課題に鑑みてなされたものであって、高い精度で質問に対する回答を出力することができる検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラムを提供することを目的としている。
(1)本発明の一態様は、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを有し、当該生成モデルを用いて、入力される質問に対応する特徴語を生成する特徴語生成部と、入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、前記特徴語生成部により生成された特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行する検索部と、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを有し、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力する機械読解部と、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを前記機械読解部から取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力する予測部と、を備える、検索装置である。
)本発明の一態様は、上記の検索装置であって、前記予測部は、前記機械読解モデルにより出力された、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補と、当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補とが同じである場合において、当該同じ回答候補のそれぞれの尤度を示すスコアが閾値を超える場合、当該同じ回答候補同士のスコアを合計してよい。
(3)本発明の一態様は、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成する第1の学習部と、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成する第2の学習部と、を備える、学習装置である。
(4)本発明の一態様は、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成する第1の学習部と、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成する第2の学習部と、を備える、学習装置と、前記生成モデルを有し、当該生成モデルを用いて、入力される質問に対応する特徴語を生成する特徴語生成部と、入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、前記特徴語生成部により生成された特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行する検索部と、前記機械読解モデルを有し、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力する機械読解部と、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを前記機械読解部から取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力する予測部と、を備える、検索装置と、を備える、質問回答予測システムである。
(5)本発明の一態様は、学習装置が、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成するステップと、前記学習装置が、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成するステップと、検索装置が、前記生成モデルを用いて、入力される質問に対応する特徴語を生成するステップと、前記検索装置が、入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、前記特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行するステップと、前記検索装置が、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するステップと、前記検索装置が、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力するステップと、を有する、質問回答予測方法である。
(6)本発明の一態様は、検索装置が、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを有し、当該生成モデルを用いて、入力される質問に対応する特徴語を生成するステップと、前記検索装置が、入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、生成された特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行するステップと、前記検索装置が、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを有し、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するステップと、前記検索装置が、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力するステップと、を有する、検索方法である。
(7)本発明の一態様は、検索装置のコンピュータに、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを有し、当該生成モデルを用いて、入力される質問に対応する特徴語を生成するステップと、入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、生成された特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行するステップと、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを有し、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するステップと、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力するステップと、を実行させる、プログラムである。
(8)本発明の一態様は、学習装置が、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成するステップと、前記学習装置が、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成するステップと、を有する、学習方法である。
(9)本発明の一態様は、学習装置のコンピュータに、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成するステップと、前記学習装置が、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成するステップと、を実行させる、プログラムである。
本発明の一態様によれば、高い精度で質問に対する回答を出力することができる。
実施形態の質問回答予測システムの構成例を示すブロック図である。 実施形態の特徴語生成モデルの学習処理を説明するためのブロック図である。 実施形態の特徴語生成モデルの構成の一例を示すブロック図である。 実施形態の機械読解モデルの学習処理を説明するためのブロック図である。 実施形態の機械読解モデルの構成の一例を示すブロック図である。 実施形態の質問回答予測システムにおける処理手順の一例を示すフローチャートである。 実施形態の質問回答予測システムにおける処理手順の一例を示すブロック図である。
以下、本発明を適用した検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラムを、図面を参照して説明する。
<質問回答予測システムの構成>
図1は、実施形態の質問回答予測システムの構成例を示すブロック図である。実施形態の質問回答予測システム1は、未知の質問文を受け付けた場合に、当該質問に含まれる単語を用いて文献を検索し、検索した文献を用いて回答を予測し、予測した回答を提供するサービスを提供するためのWebシステムやアプリケーションシステムである。
質問回答予測システム1は、例えば、一または複数の端末装置100と、サービス提供サーバ200と、ジョブキュー230および240と、全文検索サーバ300と、文献データベース310と、特徴語生成部400と、特徴語生成モデル410と、機械読解部500と、機械読解モデル510とを備える。質問回答予測システム1における端末装置100、サービス提供サーバ200、ジョブキュー230および240、全文検索サーバ300、文献データベース310、特徴語生成部400、特徴語生成モデル410、機械読解部500、および機械読解モデル510は、例えば、通信ネットワークに接続され、NIC(Network Interface Card)や無線通信モジュールなどの通信インターフェースを備える(図1では不図示)。通信ネットワークは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、セルラー網、Wifi(登録商標)などを含んでよい。
端末装置100は、例えば、表示部、操作部、およびCPU等を備えたパーソナルコンピュータやスマートフォン等のコンピュータである。端末装置100は、コンテンツの表示や操作内容の受け付け、および情報の送受信等を行うためにブラウザ110を備える。端末装置100は、ブラウザ110に限らず、アプリケーションプログラムなどのUA(User Agent)を起動してよい。UAは、例えば、サービス提供サーバ200が提供するサービスを受けるためのアプリケーションである。端末装置100は、UAとしてのアプリケーションを利用して、サービス提供サーバ200から受信したコンテンツを用いて表示処理や操作の受け付け処理などを行う。実施形態の端末装置100は、ユーザの操作に基づく質問文を含む要求をサービス提供サーバ200に提供し、サービス提供サーバ200から質問文に対する回答を含む応答を受け付ける。
サービス提供サーバ200は、端末装置100からの要求に応じ、質問文に対する回答を提供するサービスを実現するサーバ装置である。サービス提供サーバ200は、例えば、ジョブ管理部210と、結果提供部220とを備える。ジョブ管理部210および結果提供部220といった機能部は、例えばCPU(Central Processing Unit)等のプロセッサがプログラムメモリに格納されたプログラムを実行することにより実現される。また、これらの機能部のうち一部または全部は、GPU(Graphics Procesing Unit)やTPU(Tensor Procesing、Unit)など高速に機械学習処理(行列計算処理)を計算できるプロセッサや、GPUやTPUなどのプロセッサの組み合わせ、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、またはFPGA(Field-Programmable Gate Array)等のハードウェアにより実現されてもよいし、ソフトウェアとハードウェアが協働することで実現されてもよい。
ジョブ管理部210は、端末装置100からの要求に応じて、特徴語生成処理のジョブおよび機械読解処理のジョブを管理する。ジョブ管理部210は、端末装置100から質問文を受け付けた場合に、特徴語生成処理のジョブをジョブキュー230に登録する。ジョブ管理部210は、機械読解処理の対象となる文書をジョブキュー240に登録する。結果提供部220は、処理結果としての回答を含む応答を端末装置100に提供する。なお、ジョブキュー230は、特徴語生成部400内の記憶部で構成されてよいが、サービス提供サーバ200内の記憶部で構成されてもよい。ジョブキュー240は、機械読解部500内の記憶部で構成されてよいが、サービス提供サーバ200内の記憶部で構成されてもよい。
特徴語生成部400は、サービス提供サーバ200から受け付けた質問文を単語に分割することで複数の質問語を生成し、各質問語を用いて特徴語を生成する特徴語生成処理を行う。特徴語生成部400は、例えば、CPU等のプロセッサであり、特徴語生成モデル410を実行することにより、特徴語生成処理を実現する。特徴語生成モデル410は、特徴語生成処理を実現するための各種のパラメータにより表現される。なお、プロセッサにはGPUまたはTPUなどの高速に行列計算処理を実行できるプロセッサの組み合わせが含まれてもよい。
全文検索サーバ300は、サービス提供サーバ200の要求に応じて、全文検索処理を実行するサーバ装置である。全文検索サーバ300は、サービス提供サーバ200から受け付けた質問文を単語(以下、質問語とも記載する。)に分割し、分割された単語群用いて全文検索処理を行う。全文検索処理は、文献データベース310に登録された文献に質問語と合致する単語が含まれるかを検索し、質問語と合致する単語を含む文献を抽出する処理である。文献データベース310は、多数の文献データが格納されたデータベースである。文献データベース310は、例えば、データベース管理等を行う処理部、HDD(Hard Disc Drive)、SSD(Solid State Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory),ROM(Read Only Memory),またはRAM(Random Access Memory)等により実現される。
機械読解部500は、サービス提供サーバ200から受け付けた質問文を構成する複数の質問語、文献を用いて機械読解処理を行う。機械読解部500は、例えば、CPU等のプロセッサであり、機械読解モデル510を実行することにより、機械読解処理を実現する。機械読解モデル510は、機械読解処理を実現するための各種のパラメータにより表現される。機械読解部500は、機械読解処理の処理結果として、質問に対する回答候補およびスコアをサービス提供サーバ200に供給する。回答候補およびスコアは、結果提供部220により所定の処理が施されて端末装置100に提供される。
図2は、実施形態の特徴語生成モデルの学習処理を説明するためのブロック図である。特徴語生成モデル410は、機械読解モデル510を学習するために用いられる機械読解用学習データのうち、質問文と例えば後述の学習処理部600により文献から抽出される特徴語を用いて学習される。特徴語生成モデル410の学習処理は、まず、特徴語生成モデル410に質問文を入力し、特徴語生成モデル410から当該質問文に対応する所定の特徴語を出力するように特徴語生成モデル410における処理パラメータを学習する。
学習処理部600は、例えば以下のステップで処理を行う。(1)学習処理部600は、例えば質問文と検索対象文献すべてについて単語と出現回数とのインデックスを作成する。(2)学習処理部600は、作成したインデックスを用いて質問文と、質問文とペアになる回答を含む文献に対し、文献を特徴づける単語を、特徴語として抽出する。文献を特徴づける単語である特徴語は、全文献に対し、対象文献のBM25スコアが高くなる単語群である。(3)学習処理部600は、上記ステップにより獲得した質問文と対応する特徴語のペアに対し、質問文を入力し例えばBM25スコアにおける上位10件の単語を特徴語として出力するように特徴語生成モデル410の処理パラメータを学習する。学習処理部600は、上記の(2)および(3)を学習用データの全質問文と文献のペアに対して1回もしくは複数回、特徴語生成モデル410の出力の誤差が収束するまで繰り返す。
図3は、実施形態の特徴語生成モデルの構成の一例を示すブロック図である。特徴語生成モデル410は、例えば、入力層、中間層、および出力層を備え、各層が複数のノードを持つ多層ニューラルネットワークである。学習処理部600は、多層ニューラルネットワークにおける単語の埋め込み、注意、活性化関数、誤差関数、および勾配降下アルゴリズム、重み係数、および重み行列といった処理パラメータを更新することで、質問文に対応した特徴語を出力するように学習する。なお、実施形態における特徴語生成モデル410は多層ニューラルネットワークであるが、これに限定されず、他の機械学習モデルであってよい。さらに、特徴語生成モデル410は、質問文から特徴語を生成可能なモデルであれば、機械学習モデルに限定しない。
図4は、実施形態の機械読解モデルの学習処理を説明するためのブロック図である。機械読解モデル510は、質問、当該質問の回答を含む文献、および回答のセットを複数含む機械読解処理用学習データを用いて学習される。回答は、例えば、文献中における区間を示す情報である。機械読解モデル510の学習処理は、まず、機械読解モデル510に質問および文献を入力し、機械読解モデル510から当該質問および文献に対応する回答を出力するように機械読解モデル510における処理パラメータを学習する。
図5は、実施形態の機械読解モデルの構成の一例を示すブロック図である。機械読解モデル510は、例えば入力層、中間層、および出力層を備え、各層が複数のノードを持つ多層ニューラルネットワークである。学習処理部610は、多層ニューラルネットワークにおける単語の埋め込み、注意、活性化関数、誤差関数、及び勾配降下アルゴリズム、重み係数、および重み行列といった処理パラメータを更新することで、質問文に対応した特徴語を出力するように学習する。なお、実施形態における機械読解モデル510は多層ニューラルネットワークであるが、これに限定されず、他の機械学習モデルであってよい。さらに、機械読解モデル510は、質問文と文献から文献中に存在する質問文の回答となる箇所を出力可能なモデルであれば機械学習モデルに限定しない。
機械読解モデル510の出力層は、文献中に含まれる回答を示す区間を評価するためのスコアを出力することが可能なノードであればよい。文献中に含まれる回答を示す区間を評価するためのスコアは、例えば、すべての区間の値が0~1の所定範囲に収まり、他の区間との総和が考慮されない値で表される。このスコアは、例えば、区間同士の絶対的な尤度を示す値と読み替えてよい。この出力層に適用された活性化関数は、例えばSigmoid(シグモイド)関数と呼ばれる。機械読解モデル510は、例えば、複数の文献を用いて複数の区間が抽出された場合に、Sigmoid関数を用いて区間およびスコアを出力する。複数の文献を用いて複数の区間が抽出された場合とは、例えば、質問語から全文検索処理により取得された文献Aから機械読解処理により区間Aが抽出され、特徴語から全文検索処理により取得された文献Bから機械読解処理により区間Bが抽出されることである。これにより、サービス提供サーバ200は、異なる文献A,Bであっても、区間Aのスコアと区間Bのスコアとを比較して順位付けをすることができる。
図6は、実施形態の質問回答予測システムにおける処理手順の一例を示すフローチャートである。図7は、実施形態の質問回答予測システムにおける処理手順の一例を示すブロック図である。
上述した質問回答予測システムは、まず、サービス提供サーバ200が、端末装置100から質問文を受け付ける(ステップS100)。次に、サービス提供サーバ200は、特徴語生成部400に質問文を提供する。特徴語生成部400は、質問文を単語に分割することで質問語を生成し、質問語に基づく特徴語を生成する(ステップS102)。サービス提供サーバ200は、生成された特徴語を取得する。
次にサービス提供サーバ200は、質問語および特徴語を全文検索サーバ300に提供する。全文検索サーバ300は、質問語を用いた全文検索処理、および特徴語を用いた全文検索処理を実行する(ステップS104)。サービス提供サーバ200は、質問語を用いた全文検索処理の結果としての文献、および特徴語を用いた全文検索処理の結果としての文献を取得する。
次にサービス提供サーバ200は、取得した文献を機械読解処理の処理単位の長さを持つ文書に分割し(ステップS106)、機械読解部500は、各文書について機械読解処理を実行する(ステップS108)。サービス提供サーバ200は、各質問に対応する文書から取得した回答候補および当該回答候補のスコアを取得する。
次にサービス提供サーバ200は、機械読解部500から取得した回答候補およびスコアに基づいて、処理結果としての回答を生成する(ステップS110)。このとき、サービス提供サーバ200は、回答候補間におけるスコアの比較に基づいて回答を出力する。具体的に、サービス提供サーバ200は、回答候補が同じである場合において、当該同じ回答候補のそれぞれのスコアが閾値を超える場合、当該同じ回答候補同士のスコアを合計する。
ここで、別々の文献から同一の回答が出力された場合に、正解である可能性を高くすることができる。しかし、機械読解モデル510が出力したスコアの値を考慮せずにスコアを加算すると頻出の単語等でスコアが低い多数の回答が出力された場合に、回答が正解である精度が低下してしまう。また、スコアの範囲に負値を含めた場合に、加算することでスコアが減少する可能性がある。そこで、サービス提供サーバ200は、スコアの加算対象を限定するために閾値を設定し、閾値を超えるスコアを持つ回答候補同士のスコアを加算する。サービス提供サーバ200は、加算されないスコアを持つ回答候補が複数存在する場合、複数の回答候補のスコアのうちで最大値のスコアを、当該回答候補のスコアとして決定する。
サービス提供サーバ200は、複数の回答候補をスコアでランキングする。サービス提供サーバ200は、スコアが大きい方の回答候補から降順に回答候補を並べた情報を結果として生成し(ステップS110)、生成した情報を端末装置100に提供する(ステップS112)。
なお、実施形態の質問回答予測システム1は、回答を含む文献の文字情報を端末装置100により表示させ、ユーザの操作に基づく回答を用いて機械読解モデル510のための学習処理を行ってよい。
<実施形態の効果>
以上説明したように、実施形態の質問回答予測システム1によれば、質問を入力し、質問に含まれる単語に基づいて文献を検索する検索部(例えば全文検索サーバ300)と、検索部により検索された文献に基づく情報を入力し、質問に対する回答を予測した結果を出力する予測モデル(例えば機械読解モデル510)を有する予測部(例えば機械読解部500)と、備える、検索装置(例えばサービス提供サーバ200、全文検索サーバ300および機械読解部500)を実現することができる。この検索装置において、予測モデルは、例えば、学習用質問、学習用回答、および前記学習用回答を含む学習用文献を含むセットを学習データとして学習したモデルである。
実施形態の質問回答予測システム1によれば、質問、質問の回答、および回答を含む文献を第1学習データとして学習し、未知の質問および文献を入力した場合に回答を出力する予測モデル(例えば機械読解モデル510)を生成する第1の学習部(例えば学習処理部610)と、第1学習データのうち質問および質問に関連する特徴語を学習データとして学習し、未知の質問を入力した場合に、当該未知の質問に関連する特徴語を出力する特徴語生成モデル(例えば特徴語生成モデル410)を生成する第2の学習部(例えば学習処理部600)と、を備える学習装置(例えば学習処理部600と学習処理部610との組み合わせ)と、特徴語生成モデルを有し、未知の質問を入力した場合に、当該未知の質問に関連する特徴語を生成する特徴語生成部(例えば特徴語生成部400)と、未知の質問に含まれる単語に基づいて文献を検索する処理と、および特徴語生成部により生成された特徴語に基づいて文献を検索する処理とを実行する検索部(例えば全文検索サーバ300)と、予測モデルを有し、検索部により検索された文献に基づく情報を入力し、未知の質問に対する回答を予測した結果を出力する予測部(例えば機械読解部500)と、を備える、検索装置(例えば全文検索サーバ300と特徴語生成部400と機械読解部500との組み合わせ)と、を備える、質問回答予測システムを実現することができる。
実施形態の質問回答予測システム1によれば、質問、質問の回答、および回答を含む文献を第1学習データとして学習し、未知の質問および文献を入力した場合に回答を出力する予測モデルを生成するステップと、第1学習データのうち質問および質問に関連する特徴語を学習データとして学習し、未知の質問を入力した場合に、当該未知の質問に関連する特徴語を出力する特徴語生成モデルを生成するステップと、特徴語生成モデルを用いて、未知の質問を入力した場合に、当該未知の質問に関連する特徴語を生成するステップと、未知の質問に含まれる単語に基づいて文献を検索する処理と、および特徴語生成部により生成された特徴語に基づいて文献を検索する処理とを実行するステップと、予測モデルを用いて、検索された文献に基づく情報を入力し、未知の質問に対する回答を予測した結果を出力するステップと、を有する、質問回答予測方法を実現することができる。
質問回答予測システム1によれば、高い精度で質問に対する回答を出力することができることができる。すなわち、質問回答予測システム1によれば、ユーザの質問に対して単純な文字列等の一致に基づく文献の検索結果ではなく、質問から検索した文献に含まれる文字列のうち回答の確率の高い情報を、回答の結果として提供することができる。この結果、質問回答予測システム1によれば、質問の文脈を考慮した回答を提供することができる。
実施形態の質問回答予測システム1によれば、質問に含まれる単語を入力し、当該質問に関連する特徴語を生成する生成モデルを有する特徴語生成部(例えば特徴語生成部400)を備え、検索部により、質問に含まれる単語に基づいて文献を検索する処理と、および特徴語生成部により生成された特徴語に基づいて文献を検索する処理とを実行することができる。生成モデルは、例えば、学習データに含まれる学習用質問を入力し、入力した学習用質問に関連する特徴語を出力するように学習されたモデルである。
この質問回答予測システム1によれば、更に高い精度で質問に対する回答を出力することができることができる。すなわち、質問回答予測システム1によれば、質問に含まれる単語から検索した文献が存在しても当該文献に回答が含まれなくても、特徴語から検索した文献から回答を取得することができる。また、質問回答予測システム1によれば、ユーザの質問から検索した文献に正解となる回答を含んでいない場合でも、特徴語から検索した文献に正解となる回答を含んでいる場合に、質問に対して正解となる回答を提供することができる。
実施形態の質問回答予測システム1によれば、予測モデルにより、結果の元となる情報である一または複数の回答候補、および当該一または複数の回答候補のスコアを出力する出力層を備え、予測部により、質問に含まれる単語に基づく文献中の回答候補およびスコア、特徴語に基づく文献中の回答候補およびスコアを出力し、回答候補間における前記スコアの比較に基づいて結果を出力することができる。また、実施形態の質問回答予測システム1によれば、予測モデルにより、結果の元となる情報である一または複数の回答候補、および当該一または複数の回答候補のスコアであって一または複数のスコアの上限および下限が設定されかつ総和が所定値に調整されないスコアを出力する出力層を備え、予測部により、質問に含まれる単語に基づく文献中の回答候補およびスコア、特徴語に基づく文献中の回答候補およびスコアを出力し、回答候補間における前記スコアの比較に基づいて結果を出力することができる。
この質問回答予測システム1によれば、更に高い精度で質問に対する回答を出力することができる。すなわち、質問回答予測システム1によれば、質問ならびに特徴語に基づく文献から抽出した複数の回答候補のスコアを比較することで、多数の回答候補から回答の確率の高い情報を提供することができる。
質問回答予測システム1によれば、予測部により、予測モデルにより出力された回答候補が同じである場合において、当該同じ回答候補のそれぞれのスコアが閾値を超える場合、当該同じ回答候補同士のスコアを合計することができる。これにより、質問回答予測システム1によれば、複数の文献で、回答の確率が低い多数の回答候補が出力された場合でも、ユーザに提供する回答の精度が低くなることを抑制することができる。具体的には、多くの文献に出現する情報であるが、質問の文脈とはあまり合致しない情報等を回答として提供することを抑制することができる。
なお、各実施形態および変形例について説明したが、一例であってこれらに限られず、例えば、各実施形態や各変形例のうちのいずれかや、各実施形態の一部や各変形例の一部を、他の1または複数の実施形態や他の1または複数の変形例と組み合わせて本発明の一態様を実現させてもよい。
なお、本実施形態における個体推定装置100の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムを、コンピュータシステムに読み込ませ、実行することにより、端末装置100、サービス提供サーバ200、全文検索サーバ300、特徴語生成部400、機械読解部500に係る上述した種々の処理を行ってもよい。
なお、ここでいう「コンピュータシステム」とは、OSや周辺機器などのハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリなどの書き込み可能な不揮発性メモリ、CD-ROMなどの可搬媒体、コンピュータシステムに内蔵されるハードディスクなどの記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネットなどのネットワークや電話回線などの通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic
Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置などに格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。
ここで、プログラムを伝送する「伝送媒体」は、インターネットなどのネットワーク(通信網)や電話回線などの通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計なども含まれる。
1 質問回答予測システム
100 端末装置
110 ブラウザ
200 サービス提供サーバ
210 ジョブ管理部
220 結果提供部
230、240 ジョブキュー
300 全文検索サーバ
310 文献データベース
400 特徴語生成部
410 特徴語生成モデル
500 機械読解部
510 機械読解モデル
600、610 学習処理部

Claims (9)

  1. 学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを有し、当該生成モデルを用いて、入力される質問に対応する特徴語を生成する特徴語生成部と、
    入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、前記特徴語生成部により生成された特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行する検索部と、
    学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを有し、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力する機械読解部と、
    入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを前記機械読解部から取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力する予測部と、
    を備える、検索装置。
  2. 前記予測部は、前記機械読解モデルにより出力された、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補と、当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補とが同じである場合において、当該同じ回答候補のそれぞれの尤度を示すスコアが閾値を超える場合、当該同じ回答候補同士のスコアを合計する、
    請求項1に記載の検索装置。
  3. 学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成する第1の学習部と、
    学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成する第2の学習部と、を備える、
    学習装置。
  4. 学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成する第1の学習部と、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成する第2の学習部と、を備える、学習装置と、
    前記生成モデルを有し、当該生成モデルを用いて、入力される質問に対応する特徴語を生成する特徴語生成部と、入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、前記特徴語生成部により生成された特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行する検索部と、前記機械読解モデルを有し、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力する機械読解部と、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを前記機械読解部から取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力する予測部と、を備える、検索装置と、
    を備える、質問回答予測システム。
  5. 学習装置が、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成するステップと、
    前記学習装置が、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成するステップと、
    検索装置が、前記生成モデルを用いて、入力される質問に対応する特徴語を生成するステップと、
    前記検索装置が、入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、前記特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行するステップと、
    前記検索装置が、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するステップと、
    前記検索装置が、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力するステップと、
    を有する、質問回答予測方法。
  6. 検索装置が、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを有し、当該生成モデルを用いて、入力される質問に対応する特徴語を生成するステップと、
    前記検索装置が、入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、生成された特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行するステップと、
    前記検索装置が、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを有し、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するステップと、
    前記検索装置が、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力するステップと、
    を有する、検索方法。
  7. 検索装置のコンピュータに、
    学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを有し、当該生成モデルを用いて、入力される質問に対応する特徴語を生成するステップと、
    入力される前記質問に含まれる単語に基づいて当該単語に合致する単語を含む文献を文献データベースから検索する処理と、生成された特徴語に基づいて当該特徴語に合致する単語を含む文献を前記文献データベースから検索する処理とを実行するステップと、
    学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを有し、前記機械読解モデルを用いて、入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するステップと、
    入力される前記質問と当該質問に含まれる単語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコア、および当該質問と当該質問に対応する特徴語に基づいて検索された文献とに対応する回答候補および当該回答候補の尤度を示すスコアを取得し、各回答候補の尤度を示すスコアの比較に基づいて当該質問に対する回答を予測した結果を出力するステップと、
    を実行させる、プログラム。
  8. 学習装置が、学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成するステップと、
    前記学習装置が、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成するステップと、
    を有する、学習方法。
  9. 学習装置のコンピュータに、
    学習用質問と当該学習用質問に対する学習用回答を含む学習用文献を特徴づける単語である特徴語とのセットを学習データとして、前記学習用質問に対応する特徴語を生成するように学習した生成モデルを生成するステップと、
    前記学習装置が、学習用質問、当該学習用質問に対する学習用回答を含む学習用文献、および当該学習用回答のセットを学習データとして、当該学習用質問と当該学習用文献とに対応する回答候補および当該回答候補の尤度を示すスコアを出力するように学習した機械読解モデルを生成するステップと、
    を実行させる、プログラム。
JP2020085091A 2020-05-14 2020-05-14 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム Active JP7614738B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020085091A JP7614738B2 (ja) 2020-05-14 2020-05-14 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020085091A JP7614738B2 (ja) 2020-05-14 2020-05-14 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2021179827A JP2021179827A (ja) 2021-11-18
JP7614738B2 true JP7614738B2 (ja) 2025-01-16

Family

ID=78511578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020085091A Active JP7614738B2 (ja) 2020-05-14 2020-05-14 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP7614738B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014120053A (ja) 2012-12-18 2014-06-30 Nippon Telegr & Teleph Corp <Ntt> 質問応答装置、方法、及びプログラム
JP2016164708A (ja) 2015-03-06 2016-09-08 国立研究開発法人情報通信研究機構 含意ペア拡張装置、そのためのコンピュータプログラム、及び質問応答システム
JP2018041494A (ja) 2017-11-02 2018-03-15 ヤフー株式会社 制御装置、制御方法および制御プログラム
WO2019106965A1 (ja) 2017-12-01 2019-06-06 日本電信電話株式会社 情報処理装置、情報処理方法、及びプログラム
JP2019149145A (ja) 2018-02-27 2019-09-05 株式会社 ミックウェア 情報検索システム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014120053A (ja) 2012-12-18 2014-06-30 Nippon Telegr & Teleph Corp <Ntt> 質問応答装置、方法、及びプログラム
JP2016164708A (ja) 2015-03-06 2016-09-08 国立研究開発法人情報通信研究機構 含意ペア拡張装置、そのためのコンピュータプログラム、及び質問応答システム
JP2018041494A (ja) 2017-11-02 2018-03-15 ヤフー株式会社 制御装置、制御方法および制御プログラム
WO2019106965A1 (ja) 2017-12-01 2019-06-06 日本電信電話株式会社 情報処理装置、情報処理方法、及びプログラム
JP2019149145A (ja) 2018-02-27 2019-09-05 株式会社 ミックウェア 情報検索システム

Also Published As

Publication number Publication date
JP2021179827A (ja) 2021-11-18

Similar Documents

Publication Publication Date Title
JP5475795B2 (ja) カスタム言語モデル
CN109299228B (zh) 计算机执行的文本风险预测方法及装置
US20200349450A1 (en) Projection neural networks
JP6848091B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP5710581B2 (ja) 質問応答装置、方法、及びプログラム
CN117795527A (zh) 使用自回归语言模型神经网络评估输出序列
US20220391765A1 (en) Systems and Methods for Semi-Supervised Active Learning
JP7259935B2 (ja) 情報処理システム、情報処理方法およびプログラム
US20240144049A1 (en) Computerized question answering based on evidence chains
US12554930B2 (en) Transformer-based text encoder for passage retrieval
JP6230987B2 (ja) 言語モデル作成装置、言語モデル作成方法、プログラム、および記録媒体
WO2022079826A1 (ja) 学習装置、情報処理装置、学習方法、情報処理方法及びプログラム
CN114841471A (zh) 知识点预测方法、装置、电子设备和存储介质
JP6145562B2 (ja) 情報構造化システム及び情報構造化方法
US12032614B2 (en) Multiclass classification with diversified precision and recall weightings
CN113239697B (zh) 实体识别模型训练方法、装置、计算机设备及存储介质
JP7614738B2 (ja) 検索装置および検索方法、学習装置および学習方法、質問回答予測システムおよび質問回答予測方法、並びにプログラム
JP7556269B2 (ja) 推論プログラム及び推論方法
CN114003701A (zh) 智能问答处理方法、装置、计算机设备和存储介质
WO2019192122A1 (zh) 文档主题参数提取方法、产品推荐方法、设备及存储介质
Binay et al. Fake news detection: Traditional vs. contemporary machine learning approaches
CN112307738A (zh) 用于处理文本的方法和装置
CN117112858A (zh) 基于关联规则挖掘的对象筛选方法、处理器及存储介质
JP2023544560A (ja) 文字認識における制約条件を強制するためのシステムおよび方法
CN117033566B (zh) 答案抽取方法、装置、计算机设备、存储介质和产品

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240716

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20241203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241227

R150 Certificate of patent or registration of utility model

Ref document number: 7614738

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350