Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7614705B2 - Information processing system, information processing method, and program - Google Patents
[go: Go Back, main page]

JP7614705B2 - Information processing system, information processing method, and program - Google Patents

Information processing system, information processing method, and program Download PDF

Info

Publication number
JP7614705B2
JP7614705B2 JP2020218459A JP2020218459A JP7614705B2 JP 7614705 B2 JP7614705 B2 JP 7614705B2 JP 2020218459 A JP2020218459 A JP 2020218459A JP 2020218459 A JP2020218459 A JP 2020218459A JP 7614705 B2 JP7614705 B2 JP 7614705B2
Authority
JP
Japan
Prior art keywords
search
target data
document
search target
selection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020218459A
Other languages
Japanese (ja)
Other versions
JP2022103681A5 (en
JP2022103681A (en
Inventor
琢麻 蔵満
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2020218459A priority Critical patent/JP7614705B2/en
Publication of JP2022103681A publication Critical patent/JP2022103681A/en
Publication of JP2022103681A5 publication Critical patent/JP2022103681A5/ja
Application granted granted Critical
Publication of JP7614705B2 publication Critical patent/JP7614705B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理システム、情報処理方法、プログラムに関する。 The present invention relates to an information processing system, an information processing method, and a program.

企業内に電子化された文書が増えるにつれ、業務上必要な文書を効率的に検索するための文書検索システムの重要性が高まっている。ここで、文書検索システムは、ユーザが入力した検索条件に関連する文書集合をユーザに提示するものである。当該システムにおいて、ユーザは必ずしも一度の検索で目的の文書を取得できるとは限らず、入力した検索条件に関する文書が大量にヒットするケースも少なくない。このような場合、ユーザは追加のキーワードを検索条件に含めるなどして、検索結果を絞り込む作業を繰り返し実施することになるが、検索結果を絞り込むための適切なキーワードが思いつかず、必要な文書を見つけるまでに多くの時間を費やすことがある。 As the number of digitized documents within a company increases, the importance of document search systems for efficiently searching for documents required for business is growing. A document search system presents a user with a collection of documents related to the search criteria entered by the user. In such a system, the user cannot always obtain the desired document with a single search, and there are many cases where a large number of documents related to the entered search criteria are hit. In such cases, the user will repeatedly try to narrow down the search results by adding additional keywords to the search criteria, but they may not be able to think of the appropriate keywords to narrow down the search results and will spend a lot of time before finding the document they need.

適切な検索条件を作成することが難しい一方で、検索結果として提示される文書について、ユーザが欲している文書(以下、適合文書)であるか、欲していない文書(以下、非適合文書)であるかどうかを判断することは比較的容易である。この性質を利用し、検索結果に対するユーザの評価をもとに検索性能の改善を図る「適合フィードバック」と呼ばれる手法が研究されている(非特許文献1)。 While it is difficult to create appropriate search criteria, it is relatively easy to determine whether the documents presented as search results are what the user wants (hereafter, relevant documents) or not (hereafter, non-relevant documents). Taking advantage of this property, a method called "relevance feedback" is being researched that aims to improve search performance based on users' evaluations of search results (Non-Patent Document 1).

非特許文献1には、適合フィードバックの代表的な手法であるRocchioアルゴリズムに加え、関係学習を用いたアルゴリズムについて言及されている。 In addition to the Rocchio algorithm, a representative method of relevance feedback, Non-Patent Document 1 mentions an algorithm that uses relational learning.

特許文献1には、適合フィードバックを行う際、複数の文書について適合文書/非適合文書の判定を行うユーザの負荷が大きい問題に着目し、1つの適合文書を指定した場合においても適切なフィードバックが得られるように関連度の計算方法を工夫する方法が記載されている。当該手法は、検索結果上位の文書を擬似的な適合文書として取り扱うことで検索条件に対する関連語の抽出、および、検索条件の拡張を行う。 Patent Document 1 focuses on the problem of the heavy burden placed on users when determining whether multiple documents are relevant or not when providing relevance feedback, and describes a method of calculating relevance that is devised so that appropriate feedback can be obtained even when a single relevant document is specified. This method extracts words related to the search criteria and expands the search criteria by treating documents that appear at the top of the search results as pseudo-relevant documents.

山田 誠二, 小野田 崇 (2003). 適合フィードバックによる文書検索 日本化学会情報化学部会誌, 21 巻 (2003) 2 号, 32Seiji Yamada, Takashi Onoda (2003). Document Retrieval by Relevance Feedback Journal of the Department of Chemistry and Information Science, Chemical Society of Japan, Vol. 21 (2003) No. 2, 32

特開2004-178421号公報JP 2004-178421 A

非特許文献1に記載があるように、適合フィードバックは、ユーザが複数の適合文書、非適合文書を評価することを前提とした手法が多い。検索の用途にもよるが、ユーザが検索するたびに複数の文書について適合性を評価することは非常に手間がかかる。この問題を解決するため、特許文献1に記載のように、検索結果上位の文書を擬似的な適合文書として取り扱う方法も考えられるが、検索結果上位の文書の大半が非適合文書の場合、逆に検索精度を低下させてしまう可能性がある。また、非適合文書の評価に比べて、適合文書を選択することは比較的難しいという問題もある。 As described in Non-Patent Document 1, many relevance feedback techniques are based on the assumption that the user will evaluate multiple relevant and non-relevant documents. Although it depends on the purpose of the search, it can be very time-consuming for the user to evaluate the relevance of multiple documents every time they perform a search. To solve this problem, one possible method is to treat the top documents in the search results as pseudo-relevant documents, as described in Patent Document 1. However, if the majority of the top documents in the search results are non-relevant documents, this could actually reduce search accuracy. Another problem is that selecting relevant documents is relatively difficult compared to evaluating non-relevant documents.

そこで、本発明は、ユーザが所望する文書へ到達しやすくする検索システムを提供することを目的とする。 The present invention aims to provide a search system that makes it easier for users to find the documents they want.

本発明の情報処理システムは、ユーザから受け付けた検索リクエストに基づき検索された文書に対して、ユーザからフィードバックを受け付ける受付手段と、前記受付手段により受け付けたフィードバックの内容に基づき、検索された文書の検索スコアの調整を行う調整手段と、前記調整手段により調整された検索スコアに基づき、検索結果を表示する表示手段と、を備えることを特徴とする。 The information processing system of the present invention is characterized by comprising: a receiving means for receiving feedback from a user regarding documents searched based on a search request received from the user; an adjustment means for adjusting the search score of the searched document based on the content of the feedback received by the receiving means; and a display means for displaying the search results based on the search score adjusted by the adjustment means.

本発明によれば、ユーザが所望する文書へ到達しやすくする検索システムを提供することが可能になる。 The present invention makes it possible to provide a search system that makes it easier for users to find the documents they want.

本発明の実施形態における、文書検索システムのシステム構成の一例を示す図である。1 is a diagram illustrating an example of a system configuration of a document search system according to an embodiment of the present invention. 本発明の実施形態における、文書検索システムのハードウェア構成の一例を示すブロック図である。1 is a block diagram showing an example of a hardware configuration of a document search system according to an embodiment of the present invention. 本発明の実施形態における、文書DBの一例を示す図である。FIG. 4 is a diagram illustrating an example of a document DB in the embodiment of the present invention. 本発明の実施形態における、文書別、キーワード別のtf-idf値一覧の一例である。13 is an example of a list of tf-idf values by document and by keyword in the embodiment of the present invention. 本発明の実施形態における、検索結果の一例を示す図である。FIG. 11 is a diagram showing an example of a search result in the embodiment of the present invention. 本発明の実施形態における、特徴語付き検索結果の一例を示す図である。FIG. 11 is a diagram showing an example of a search result with characteristic words in the embodiment of the present invention. 本発明の実施形態における、ユーザインターフェースの一例を示す図である。FIG. 4 is a diagram illustrating an example of a user interface in the embodiment of the present invention. 本発明の実施形態における、検索スコア調整処理の一例を示すフローチャートである。11 is a flowchart illustrating an example of a search score adjustment process in the embodiment of the present invention. 本発明の実施形態における、適合文書に関するスコア調整ルールの一例を示す図である。FIG. 11 is a diagram illustrating an example of a score adjustment rule for relevant documents in the embodiment of the present invention. 本発明の実施形態における、非適合文書に関するスコア調整ルールの一例を示す図である。FIG. 11 is a diagram illustrating an example of a score adjustment rule for non-relevant documents in the embodiment of the present invention. 本発明の実施形態における、ユーザインターフェースの一例を示す図である。FIG. 4 is a diagram illustrating an example of a user interface in the embodiment of the present invention. 本発明の実施形態における、ユーザインターフェースの一例を示す図である。FIG. 4 is a diagram illustrating an example of a user interface in the embodiment of the present invention. 本発明の実施形態における、ユーザインターフェースの一例を示す図である。FIG. 4 is a diagram illustrating an example of a user interface in the embodiment of the present invention. 本発明の実施形態における、検索処理の全体像を示すフローチャートである。1 is a flowchart showing an overview of a search process in an embodiment of the present invention.

以下、図面を参照して、本発明の実施形態を詳細に説明する。 The following describes an embodiment of the present invention in detail with reference to the drawings.

図1は、本発明の実施形態における文書検索システム(情報処理システム)のシステム構成の一例を示す図である。 Figure 1 is a diagram showing an example of the system configuration of a document search system (information processing system) in an embodiment of the present invention.

文書検索システム100は、文書登録装置110、文書DB120、文書検索装置130、クライアント端末から成る。 The document search system 100 consists of a document registration device 110, a document DB 120, a document search device 130, and a client terminal.

文書登録装置110は、ユーザの検索対象とする文書を登録するための装置であり、文書受信部111、キーワード抽出部112、文書登録処理部113から成る。 The document registration device 110 is a device for registering documents to be searched by users, and is composed of a document receiving unit 111, a keyword extraction unit 112, and a document registration processing unit 113.

文書受信部111は、登録対象の文書を受け付けるための装置である。ユーザはクライアント端末のWebブラウザなどを通じて任意の文書を文書受信部111に送信できる。あるいは、クローラが機械的に文書を収集して送信するような構成をとってもよい。 The document receiving unit 111 is a device for accepting documents to be registered. A user can send any document to the document receiving unit 111 via a web browser on a client terminal. Alternatively, a crawler may be configured to mechanically collect and send documents.

キーワード抽出部112は、文書受信部111が受け付けた文書から、当該文書における特徴語の候補となるキーワードとその出現頻度を抽出するための装置である。特徴語の詳細については後述する。キーワード抽出部112におけるキーワード抽出処理は、公知の形態素解析技術を用いる。ここで、抽出する形態素は、検索システムの用途に応じて、固有名詞などの特定の品詞に限定してもよい。また、形態素解析を使用せずに、事前に定めたパターンに一致する文字列をキーワードとして抽出してもよい。 The keyword extraction unit 112 is a device for extracting keywords that are candidates for characteristic words in a document received by the document receiving unit 111, and the frequency of their occurrence. Details of characteristic words will be described later. The keyword extraction process in the keyword extraction unit 112 uses a known morphological analysis technique. Here, the morphemes to be extracted may be limited to specific parts of speech, such as proper nouns, depending on the purpose of the search system. Also, character strings that match a predetermined pattern may be extracted as keywords without using morphological analysis.

文書登録処理部113は、文書受信部111で受け付けた文書と、キーワード抽出部112において抽出したキーワードとを紐づけて、文書DB120へ格納する装置である。 The document registration processing unit 113 is a device that links the document received by the document receiving unit 111 with the keywords extracted by the keyword extraction unit 112 and stores them in the document DB 120.

図3は文書DB120の一例である。文書DB120は、文書を一意に識別するための文書ID121、および、キーワード抽出部112が抽出した値を格納するキーワード:出現頻度122を項目として備える。例えば、文書DB120のレコード123について、文書IDは「文書1」であり、キーワードは「A」、「B」、「C」、「G」の4つで、各キーワードの文書1内における出現頻度は、それぞれ「3」、「1」、「2」、「1」である。なお、本アイデアを説明するための最小限の構成として、前述の2項目を例示しているが、文書のタイトルや、文書の所在を示すURLなど、検索システムとして利用する項目を追加で備えてもよい。 Figure 3 is an example of document DB 120. Document DB 120 has fields for document ID 121 for uniquely identifying a document, and keyword: occurrence frequency 122 for storing values extracted by keyword extraction unit 112. For example, for record 123 in document DB 120, the document ID is "Document 1", there are four keywords, "A", "B", "C", and "G", and the occurrence frequency of each keyword in document 1 is "3", "1", "2", and "1", respectively. Note that the above two fields are shown as a minimum configuration for explaining this idea, but additional fields for use as a search system, such as the document title and a URL indicating the location of the document, may be included.

図1に戻って、文書検索装置130は、検索処理部131、特徴語抽出部132、検索結果出力処理部133から成る。 Returning to FIG. 1, the document search device 130 consists of a search processing unit 131, a feature word extraction unit 132, and a search result output processing unit 133.

検索処理部131は、ユーザからの検索リクエストを受け付け、文書DBからリクエストに応じた文書を検索する装置であり、検索リクエストに関連のある文書をスコア順に取得する機能を備える。効率的な検索処理を実現するためには、文書登録処理部113において、公知の技術である転置インデックスを作成して検索時に用いればよい。本発明における、ユーザが選択した適合文書、および、非適合文書を用いた検索スコアの調整処理についても、この検索処理部131が実施する。検索スコアの調整処理については、後に例を用いて詳しく説明する。 The search processing unit 131 is a device that receives search requests from a user and searches the document DB for documents that correspond to the requests, and has a function of retrieving documents related to the search request in order of score. To achieve efficient search processing, the document registration processing unit 113 can create a transposed index, which is a known technique, and use it during searching. The search processing unit 131 also performs the search score adjustment process of the present invention using matching documents and non-matching documents selected by the user. The search score adjustment process will be explained in detail later using an example.

特徴語抽出部132は、検索処理部131が取得した検索結果の各文書について、文書DB120から、文書ごとの特徴的なキーワード(特徴語)を選出する装置である。特徴語の選出は、単語の特徴量を表す指標の1つであるtf-idfを用いることで実現できる。 The characteristic word extraction unit 132 is a device that selects characteristic keywords (characteristic words) for each document from the document DB 120 for each document in the search results obtained by the search processing unit 131. The selection of characteristic words can be achieved by using tf-idf, which is one of the indices that represent the characteristic amount of a word.

図4は、文書DB120における、各文書のキーワードごとのtf-idf値を表している。例えば、文書1における特徴語を2つ選出する場合は、文書1におけるtf-idf値の高い順に「C」、「B」を特徴語として抽出することが可能である。tf-idf値を用いた特徴語の取得方法はあくまでも一例であり、他の手法を用いて取得してもよい。 Figure 4 shows the tf-idf values for each keyword in each document in document DB 120. For example, when selecting two feature words in document 1, it is possible to extract "C" and "B" as feature words in descending order of tf-idf value in document 1. The method of obtaining feature words using tf-idf values is merely one example, and other methods may be used to obtain feature words.

検索結果出力処理部133は、検索処理部131で得た検索結果、および、特徴語抽出部132で得た特徴語を、検索リクエストを送信したクライアントに返却する装置である。文書検索システム100のユーザは、Webブラウザなどを通じて、検索結果、および、文書ごとの特徴語を確認することができる。 The search result output processing unit 133 is a device that returns the search results obtained by the search processing unit 131 and the characteristic words obtained by the characteristic word extraction unit 132 to the client that sent the search request. A user of the document search system 100 can check the search results and the characteristic words for each document through a web browser or the like.

図2は、本発明の実施形態におけるクライアント端末、文書検索システム100として用いることが可能な情報処理装置のハードウェア構成の一例を示すブロック図である。 Figure 2 is a block diagram showing an example of the hardware configuration of an information processing device that can be used as a client terminal or document search system 100 in an embodiment of the present invention.

図2に示すように、情報処理装置は、システムバス200を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、記憶装置204、入力コントローラ205、音声コントローラ206、ビデオコントローラ207、メモリコントローラ208、よび通信I/Fコントローラ209が接続される。 As shown in FIG. 2, the information processing device is connected to a CPU (Central Processing Unit) 201, a ROM (Read Only Memory) 202, a RAM (Random Access Memory) 203, a storage device 204, an input controller 205, an audio controller 206, a video controller 207, a memory controller 208, and a communication I/F controller 209 via a system bus 200.

CPU201は、システムバス200に接続される各デバイスやコントローラを統括的に制御する。 The CPU 201 provides overall control over each device and controller connected to the system bus 200.

ROM202あるいは外部メモリ213は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。 The ROM 202 or external memory 213 holds the BIOS (Basic Input/Output System) and OS (Operating System), which are control programs executed by the CPU 201, computer-readable and executable programs for implementing this information processing method, and various necessary data (including data tables).

RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ213からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。 RAM 203 functions as the main memory, work area, etc. of CPU 201. CPU 201 loads programs and the like required for executing processing from ROM 202 or external memory 213 into RAM 203, and executes the loaded programs to realize various operations.

入力コントローラ205は、キーボード210や不図示のマウス等のポインティングデバイス等の入力装置からの入力を制御する。入力装置がタッチパネルの場合、ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でタッチ)することにより、各種の指示を行うことができることとする。 The input controller 205 controls input from input devices such as a keyboard 210 and a pointing device such as a mouse (not shown). If the input device is a touch panel, the user can give various instructions by pressing (touching with a finger, etc.) icons, cursors, or buttons displayed on the touch panel.

また、タッチパネルは、マルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。 The touch panel may also be a touch panel capable of detecting positions touched by multiple fingers, such as a multi-touch screen.

ビデオコントローラ207は、ディスプレイ212などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作を受け付け可能な装置については、入力装置も提供する。 The video controller 207 controls the display on an external output device such as a display 212. The display is also intended to include the display of a notebook computer integrated into the main body. Note that the external output device is not limited to a display, and may be, for example, a projector. In addition, for devices capable of accepting the aforementioned touch operations, an input device is also provided.

なおビデオコントローラ207は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。 The video controller 207 can control a video memory (VRAM) for display control, and can use part of the RAM 203 as a video memory area, or can provide a separate dedicated video memory.

メモリコントローラ208は、外部メモリ213へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。 The memory controller 208 controls access to the external memory 213. The external memory can be an external storage device (hard disk) that stores the boot program, various applications, font data, user files, edit files, and various data, a flexible disk (FD), or a compact flash (registered trademark) memory connected to a PCMCIA card slot via an adapter.

通信I/Fコントローラ209は、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の4G回線、5G回線等を用いた通信が可能である。 The communication I/F controller 209 connects and communicates with external devices via a network, and executes communication control processing on the network. For example, communication using TCP/IP, telephone lines such as ISDN, and 4G and 5G lines for mobile phones are possible.

尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ212上での表示を可能としている。また、CPU201は、ディスプレイ212上の不図示のマウスカーソル等でのユーザ指示を可能とする。 The CPU 201 can display the outline font on the display 212 by, for example, executing a process of expanding (rasterizing) the outline font in a display information area in the RAM 203. The CPU 201 can also allow the user to give instructions using a mouse cursor (not shown) on the display 212.

まず、図14のフローチャートを用いて、本発明の処理の全体像を説明する。 First, we will explain the overall process of the present invention using the flowchart in Figure 14.

ステップS1401では、クライアント端末を介してユーザから検索リクエストを受け付ける。 In step S1401, a search request is received from a user via a client terminal.

ステップS1402では、ステップS1401で受け付けた検索リクエストに基づき、検索処理部131が文書DBからリクエストに応じた文書を検索する。 In step S1402, based on the search request received in step S1401, the search processing unit 131 searches the document DB for a document that meets the request.

ステップS1403では、ステップS1402における検索処理の結果をクライアント端末に表示する。検索結果が表示された画面の一例を図7に示す。 In step S1403, the results of the search process in step S1402 are displayed on the client terminal. An example of a screen displaying the search results is shown in FIG. 7.

ステップS1404では、ユーザから検索結果に対するフィードバックを受け付けたか判定し、フィードバックを受け付けた場合(ステップS1404:YES)は、処理をステップS1405に移行する。 In step S1404, it is determined whether feedback on the search results has been received from the user, and if feedback has been received (step S1404: YES), the process proceeds to step S1405.

ステップS1405では、ユーザから受け付けたフィードバックの内容に従い、検索スコアの調整を行う。検索スコアの調整処理の詳細は、図8のフローチャートを用いて後述する。 In step S1405, the search score is adjusted according to the feedback received from the user. Details of the search score adjustment process will be described later using the flowchart in FIG. 8.

ステップS1406では、ステップS1405において調整された検索スコアに基づく検索結果画面をクライアント端末に表示する。調整後の画面の例を図11、図12、図13に示す。 In step S1406, a search result screen based on the search score adjusted in step S1405 is displayed on the client terminal. Examples of the adjusted screen are shown in Figures 11, 12, and 13.

図11等に示す通り、調整後の画面においても、さらにフィードバックを受け付けることが可能であり、フィードバックを受け付けた場合は、再びステップS1405、S1406の処理を実行する。 As shown in FIG. 11 etc., it is possible to receive further feedback on the screen after adjustment, and if feedback is received, the processing of steps S1405 and S1406 is executed again.

次に図5~図13を用いて、本発明の実施形態における検索スコアの調整処理について説明する。 Next, the search score adjustment process in an embodiment of the present invention will be explained using Figures 5 to 13.

図5は、ステップS1401において、ユーザから検索条件としてキーワード「A」を含む文書を検索する旨のリクエストを受け付けた場合に、検索処理部131が取得する検索結果の一例を示した図である。検索結果500は、文書ID501と、検索条件との関連度を表すスコア502を含む要素の配列であり、スコア502の値に降順でソートしたものである。例えば、検索結果500の要素503は、文書IDが「文書1」、スコアが「0.029」である。ここで、説明を簡略化するため、検索条件に含まれるキーワードのtf-idf値の合計をスコアとして、スコアの高い順に上位3件を表示する例を示したが、BM25などの公知のアルゴリズムを用いてもよい。また、取得する検索結果の数も、検索結果を描画するユーザインターフェースに合わせて増減させてもよい。 Figure 5 shows an example of a search result acquired by the search processing unit 131 when a request to search for documents containing keyword "A" as a search condition is received from the user in step S1401. The search result 500 is an array of elements including a document ID 501 and a score 502 indicating the degree of relevance to the search condition, and is sorted in descending order by the value of the score 502. For example, element 503 of the search result 500 has a document ID of "Document 1" and a score of "0.029". Here, in order to simplify the explanation, an example is shown in which the sum of the tf-idf values of the keywords included in the search condition is used as the score, and the top three results are displayed in descending order of score, but a known algorithm such as BM25 may be used. The number of search results acquired may also be increased or decreased according to the user interface that displays the search results.

図6は、検索結果500の各文書に対して特徴語抽出部132が抽出した特徴語を付与した結果の一例である。説明を簡略化するため、特徴語の抽出方法は、tf-idf値の高い順に2つ抽出する方法を例示するが、公知の文書分類技術により自動的に分類した文書のカテゴリとしてもよいし、あらかじめ定めたルールに従って抽出してもよい。また、ユーザインターフェースに合わせて取得する数を増減させてもよい。また、各文書に関する特徴語を事前に計算しておき、文書DB120と紐づけて保存しておく、あるいは、検索処理実行時において取得した特徴語を一定時間キャッシュしておく、など、特徴語の取得処理について高速化を行う工夫を施してもよい。 Figure 6 shows an example of the result of adding feature words extracted by the feature word extraction unit 132 to each document in the search results 500. To simplify the explanation, the method of extracting feature words is exemplified by extracting two in descending order of tf-idf value, but the feature words may be categories of documents automatically classified using known document classification technology, or may be extracted according to predetermined rules. The number of feature words to be acquired may be increased or decreased according to the user interface. Furthermore, the feature words for each document may be calculated in advance and stored in association with the document DB 120, or the feature words acquired during the search process may be cached for a certain period of time, or other measures may be taken to speed up the process of acquiring feature words.

図7は、ステップS1403において、検索結果出力処理部133がクライアント端末のブラウザに表示するユーザインターフェースの一例である。ユーザインターフェース700は、検索条件入力フォーム701と、検索結果サマリ702に加え、検索結果の文書ごとに特徴語601を表示する領域と、ユーザが文書の適合、非適合をシステムにフィードバックするためのインターフェースとして、スコアUPボタン703、スコアDOWNボタン704とを備えることを特徴とする。図7は、検索条件としてキーワード「A」を含む文書の検索が行われた後の状態を示しており、検索結果サマリ702は、キーワードAを含む文書は全部で6件あり、そのうち、スコアの上位3件が画面上に表示されていることを表している。 Figure 7 is an example of a user interface that the search result output processing unit 133 displays on the browser of the client terminal in step S1403. The user interface 700 is characterized by having a search condition input form 701, a search result summary 702, an area for displaying characteristic words 601 for each document in the search result, and a score up button 703 and a score down button 704 as interfaces for the user to provide feedback to the system on the suitability or non-suitability of documents. Figure 7 shows the state after a search for documents containing keyword "A" as a search condition has been performed, and the search result summary 702 indicates that there are a total of six documents containing keyword A, of which the top three with the highest scores are displayed on the screen.

特徴語601は、後述の検索スコア調整処理において使用する値であるが、特徴語を表示することで、文書が適合文書であるか非適合文書であるか、ユーザの判断を容易にする効果がある。なお、各文書の情報として、文書のタイトルや、検索条件のキーワード周辺のテキストなど、検索結果をより分かりやすくするために表示する情報を追加して表示してもよい。 The characteristic words 601 are values used in the search score adjustment process described below, and displaying the characteristic words has the effect of making it easier for the user to determine whether a document is a relevant document or a non-relevant document. Note that information about each document may also be displayed, such as the document title and text surrounding the keywords in the search criteria, to make the search results easier to understand.

ユーザは、スコアUPボタン703を押下することにより、システムに当該文書が適合文書である旨をフィードバックすることができる。また、スコアDOWNボタン704を押下することにより、システムに当該文書が非適合文書である旨をフィードバックすることができる。 By pressing the score up button 703, the user can provide feedback to the system that the document is a matching document. By pressing the score down button 704, the user can provide feedback to the system that the document is a non-matching document.

次に、図8を用いて、ステップS1405の処理の詳細を説明する。 Next, the details of the processing in step S1405 will be explained using FIG. 8.

図8は、文書検索システム100のCPU201が所定の制御プログラムを読み出して実行する処理であり、検索処理部131における検索スコアの調整処理を示すフローチャートである。ステップS801~ステップS805において、検索条件にマッチした各文書の検索スコアを調整する処理を行う。 Figure 8 is a flow chart showing the process in which the CPU 201 of the document search system 100 reads and executes a specific control program, and which illustrates the process of adjusting the search score in the search processing unit 131. In steps S801 to S805, the process of adjusting the search score of each document that matches the search criteria is performed.

まず、ステップS802、ステップS803において、ユーザから適合文書とフィードバックを受けた各文書について、適合文書に関するスコア調整ルールに従い、各文書の検索スコアを調整する。 First, in steps S802 and S803, for each document that has been given feedback from the user as a relevant document, the search score of each document is adjusted according to the score adjustment rules for relevant documents.

図9は適合文書に関する検索スコアの調整ルールの一例である。適合文書に関するスコア調整ルール900は、複数のルールを定義可能であり、各ルールは、適用順901、スコア調整条件902、スコア調整値903を値としてもつ。すべてのルールを適用順に評価し、評価対象の文書がスコア調整条件902に該当する場合、スコア調整値に記載の値を用いて検索スコアを更新する。具体例については後述する。 Figure 9 shows an example of a search score adjustment rule for matching documents. Multiple rules can be defined as score adjustment rules 900 for matching documents, and each rule has application order 901, score adjustment conditions 902, and score adjustment value 903 as values. All rules are evaluated in the order of application, and if the document to be evaluated satisfies score adjustment conditions 902, the search score is updated using the value specified in the score adjustment value. Specific examples will be described later.

図8に戻って、ステップS804、ステップS805において、ユーザから非適合文書とフィードバックを受けた各文書について、非適合文書に関するスコア調整ルールに従い、各文書の検索スコアを調整する。 Returning to FIG. 8, in steps S804 and S805, for each document that has been given feedback from the user as a non-relevant document, the search score of each document is adjusted according to the score adjustment rules for non-relevant documents.

図10は非適合文書に関する検索スコアの調整ルールの一例である。非適合文書に関するスコア調整ルール1000は、適合文書に関するスコア調整ルール900と同様に、複数のルールを定義可能であり、各ルールは、適用順1001、スコア調整条件1002、スコア調整値1003を値としてもつ。すべてのルールを適用順に評価し、評価対象の文書がスコア調整条件1002に該当する場合、スコア調整値に記載の値を用いて検索スコアを更新する。 Figure 10 shows an example of a search score adjustment rule for non-relevant documents. Similar to the score adjustment rule 900 for relevant documents, the score adjustment rule 1000 for non-relevant documents allows multiple rules to be defined, and each rule has an application order 1001, a score adjustment condition 1002, and a score adjustment value 1003 as values. All rules are evaluated in the order of application, and if the document to be evaluated satisfies the score adjustment condition 1002, the search score is updated using the value specified in the score adjustment value.

以下、前述の例を用いて、さらに詳しく説明する。図7におけるユーザインターフェース700の状態において、ユーザが文書1のスコアDOWNボタンを押下した(文書1を非適合文書として指定した)場合、検索処理部131は、文書1を非適合文書として検索スコアの調整に用いる。文書1の特徴語は「C」、「B」である。非適合文書に関するスコア調整ルール1000より、特徴語を30%以上、すなわち、キーワード「C」、「B」の少なくともいずれかを含む文書(文書1、文書4、文書6)の検索スコアを0.5倍し、さらに、特徴語を70%以上、すなわち、キーワード「C」、「B」の両方を含む文書(文書1、文書6)の検索スコアについてはさらに0.5倍する。 The above-mentioned example will be used for further detailed explanation below. In the state of the user interface 700 in FIG. 7, when the user presses the score DOWN button for document 1 (designating document 1 as a non-relevant document), the search processing unit 131 uses document 1 as a non-relevant document for adjusting the search score. The characteristic words of document 1 are "C" and "B". According to the score adjustment rule 1000 for non-relevant documents, the search scores of documents (documents 1, 4, and 6) that contain 30% or more characteristic words, i.e., at least one of the keywords "C" and "B", are multiplied by 0.5, and the search scores of documents (documents 1 and 6) that contain 70% or more characteristic words, i.e., both keywords "C" and "B", are further multiplied by 0.5.

図11は、ステップS1406においてクライアント端末に表示される、非適合文書1による検索スコアの調整が行われた後のユーザインターフェース700である。ユーザが適合文書、または、非適合文書として指定した文書が存在する場合、検索結果出力処理部133は、ユーザインターフェース700に、ユーザが指定した文書によってスコアの調整が行われていることを示すスコア調整ラベル750を表示する。スコア調整ラベル750は、適合文書、または、非適合文書を示すラベル751と、文書ラベル752と、解除ボタン753からなる。ユーザは、解除ボタン753を押下することで、当該文書をフィードバックの対象から解除することができる。 Figure 11 shows the user interface 700 displayed on the client terminal in step S1406 after the search score has been adjusted by non-matching document 1. If there is a document designated by the user as a matching document or a non-matching document, the search result output processing unit 133 displays a score adjustment label 750 in the user interface 700, indicating that the score has been adjusted by the document designated by the user. The score adjustment label 750 consists of a label 751 indicating the matching document or non-matching document, a document label 752, and a release button 753. The user can release the document from the feedback target by pressing the release button 753.

本発明のユーザインターフェース700を用いると、ユーザはスコア調整後の検索結果を見ながら、さらに適合文書・非適合文書のフィードバックを実施することが可能である。図11におけるユーザインターフェース700の状態において、ユーザが文書5のスコアUPボタンを押下した(文書5を適合文書として指定した)場合、検索処理部131は、文書1を非適合文書、文書5を適合文書として検索スコアの調整に用いる。文書5の特徴語は「F」、「E」である。適合文書に関するスコア調整ルール900より、特徴語を30%以上、すなわち、キーワード「F」、「E」の少なくともいずれかを含む文書(文書2、文書3、文書5、文書7)の検索スコアを2倍し、さらに、特徴語を70%以上、すなわち、キーワード「F」、「E」の両方を含む文書(文書5、文書7)の検索スコアについてはさらに2倍する。 By using the user interface 700 of the present invention, the user can further provide feedback on the relevant and non-relevant documents while viewing the search results after the score adjustment. In the state of the user interface 700 in FIG. 11, when the user presses the score up button for document 5 (designating document 5 as a relevant document), the search processing unit 131 adjusts the search score by treating document 1 as a non-relevant document and document 5 as a relevant document. The characteristic words of document 5 are "F" and "E". According to the score adjustment rule 900 for relevant documents, the search scores of documents (documents 2, 3, 5, and 7) that contain 30% or more of the characteristic words, i.e., at least one of the keywords "F" and "E", are doubled, and the search scores of documents (documents 5 and 7) that contain 70% or more of the characteristic words, i.e., both of the keywords "F" and "E" are doubled.

図12は、図11の状態から、非適合文書1、および、適合文書5による検索スコアの調整が行われた後のユーザインターフェース700である。文書1が非適合文書としてスコアの調整に用いられていることを表すスコア調整ラベル750に加え、文書5が適合文書としてスコアの調整に用いられていることを表すスコア調整ラベル760をそれぞれ表示する。このように、スコア調整ラベルは、ユーザが指定した文書に対応するものをすべて表示する。図12において、検索結果として表示されている文書は「文書5」、「文書7」、「文書2」であり、フィードバックを行う前の文書集合とは異なるものが出現している。 Figure 12 shows the user interface 700 after search scores have been adjusted from the state shown in Figure 11 using non-relevant document 1 and relevant document 5. In addition to score adjustment label 750, which indicates that document 1 is being used to adjust its score as a non-relevant document, score adjustment label 760, which indicates that document 5 is being used to adjust its score as a relevant document, is displayed. In this way, all score adjustment labels that correspond to the documents specified by the user are displayed. In Figure 12, the documents displayed as search results are "Document 5," "Document 7," and "Document 2," which are different from the document set before feedback was provided.

以上で説明したように、本発明は、ユーザによる適合フィードバックによって検索条件自体を拡張するのではなく、ユーザが選択した適合文書に類似する文書についてはスコアを向上させ、ユーザが選択した非適合文書に類似する文書のスコアを減少させることで、検索結果として出力する文書集合の拡張や縮小は行わず、検索結果として表示する順番の調整を行うことを特徴とする。 As described above, the present invention is characterized by the fact that it does not expand the search criteria themselves through relevance feedback from the user, but rather improves the scores of documents similar to relevant documents selected by the user and decreases the scores of documents similar to non-relevant documents selected by the user, thereby adjusting the order in which the search results are displayed without expanding or reducing the set of documents output as search results.

このように、適合フィードバックによる影響をスコアの調整のみにとどめることにより、ユーザが判定した文書から望ましくない特徴が抽出された場合においても、検索条件と関係のない文書が検索結果として追加されることがなくなる。ユーザは、提示された検索結果に含まれる文書について、適合文書、または、非適合文書を1つ選択するという簡単な操作を繰り返すことによって、探したい文書を探索することが可能になる。 本発明を用いることで、ユーザは適合文書・非適合文書を1つずつ対話的に選択するという簡易な操作によって、検索結果の上位に出現する文書を、自身が所望する文書に近づけることが可能になることを示した。 In this way, by limiting the effect of relevance feedback to score adjustments only, documents unrelated to the search criteria will not be added to the search results even if undesirable features are extracted from the documents determined by the user. The user can search for the document they are looking for by repeating the simple operation of selecting one relevant or non-relevant document from the documents included in the presented search results. We have shown that by using this invention, the user can bring the documents appearing at the top of the search results closer to the documents they desire, through the simple operation of interactively selecting one relevant and one non-relevant document at a time.

上記で説明した、適合文書に関するスコア調整ルール900、および、非適合文書に関するスコア調整ルール1000を用いたスコアの調整は、フィードバックされた文書と類似する文書のスコアを調整することに相当する。説明を簡略化するため、スコア調整条件については特徴語の含有率を用いる簡単なものとしたが、文書の類似度を評価する方法として、文書をベクトル化してベクトル間の距離を算出する手法を用いてもよいし、文書のカテゴリを推定し、同一カテゴリに所属する文書を類似文書と見做してもよい。また、スコア調整値においても、定数倍や定数値の加算を定義するのみならず、検索結果のスコアを用いて動的に調整(非適合文書として指定された文書について検索結果の上位から除外する程度のスコア調整(例えばスコアをゼロにする等)を行うなど)する方法をとってもよい。スコア調整ルールは複数定義可能であるため、これら複数の手法を組み合わせてもよい。 The score adjustment using the score adjustment rule 900 for relevant documents and the score adjustment rule 1000 for non-relevant documents described above corresponds to adjusting the scores of documents similar to the fed back document. To simplify the explanation, the score adjustment condition is a simple one using the content rate of feature words, but a method of evaluating the similarity of documents may be used that vectorizes documents and calculates the distance between vectors, or a method of estimating the category of documents and considering documents belonging to the same category as similar documents. In addition, the score adjustment value may not only be defined by multiplying a constant value or adding a constant value, but may also be dynamically adjusted using the score of the search results (such as performing score adjustment to the extent that documents designated as non-relevant documents are excluded from the top of the search results (for example, by setting the score to zero)). Since multiple score adjustment rules can be defined, these multiple methods may be combined.

スコア調整ラベルは、ユーザがフィードバックした文書を検索過程で明確にするためのものである。どのようなスコア調整が行われているかをユーザが把握しやすくするために、図13に示すように、スコア調整ラベルへのホバー操作やクリック操作によって、特徴語などの文書のサマリを表示する機能を設けてもよい。文書のカテゴリを推定している場合、当該情報も表示することが考えられる。 The score adjustment labels are intended to clarify documents for which the user has provided feedback during the search process. To make it easier for the user to understand what kind of score adjustment has been performed, a function may be provided that displays a summary of the document, including feature words, by hovering or clicking on the score adjustment label, as shown in Figure 13. If the document category has been estimated, this information may also be displayed.

本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。 The present invention can be embodied, for example, as a system, device, method, program, or recording medium. Specifically, it may be applied to a system made up of multiple devices, or to a device made up of a single device.

また、本発明におけるプログラムは、図8、図14に示すフローチャートの処理方法をコンピュータが実行可能なプログラムであり、本発明の記憶媒体は図8、図14の処理方法をコンピュータが実行可能なプログラムが記憶されている。なお、本発明におけるプログラムは図8、図14の各装置の処理方法ごとのプログラムであってもよい。 The program of the present invention is a program that enables a computer to execute the processing methods of the flowcharts shown in Figures 8 and 14, and the storage medium of the present invention stores a program that enables a computer to execute the processing methods of Figures 8 and 14. The program of the present invention may be a program for each processing method of each device in Figures 8 and 14.

以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。 As described above, it goes without saying that the object of the present invention can be achieved by supplying a recording medium on which a program that realizes the functions of the above-mentioned embodiments is recorded to a system or device, and having the computer (or CPU or MPU) of that system or device read and execute the program stored on the recording medium.

この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。 In this case, the program read from the recording medium itself realizes the novel functions of the present invention, and the recording medium on which the program is recorded constitutes the present invention.

プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、CD-R、DVD-ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることが出来る。 Recording media for supplying the program may include, for example, a flexible disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a DVD-ROM, a magnetic tape, a non-volatile memory card, a ROM, an EEPROM, a silicon disk, etc.

また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Furthermore, it goes without saying that not only are the functions of the above-mentioned embodiments realized by the computer executing a program it has read, but also that the functions of the above-mentioned embodiments can be realized by an operating system (OS) or the like running on the computer carrying out some or all of the actual processing based on the instructions of the program.

さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Furthermore, it goes without saying that this also includes cases where a program read from a recording medium is written into a memory provided on a function expansion board inserted into a computer or a function expansion unit connected to a computer, and then a CPU or the like provided on the function expansion board or function expansion unit performs some or all of the actual processing based on the instructions of the program code, thereby realizing the functions of the above-mentioned embodiments.

また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。 The present invention may be applied to a system made up of multiple devices, or to a device made up of a single device. Needless to say, the present invention can also be applied to cases where the effects of the present invention are achieved by supplying a program to a system or device. In this case, the effects of the present invention can be enjoyed by reading a recording medium that stores a program for achieving the present invention into the system or device.

さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。 Furthermore, by downloading and reading a program for achieving the present invention from a server, database, etc. on a network using a communication program, the system or device can enjoy the effects of the present invention. Note that the present invention also includes configurations that combine the above-mentioned embodiments and their variations.

100 文書検索システム(情報処理システム)
110 文書登録装置
120 文書DB
130 文書検索装置
100 Document search system (information processing system)
110 Document registration device 120 Document DB
130 Document Search Device

Claims (6)

ユーザから受け付けた検索リクエストに係る検索条件により検索された検索対象データを、当該検索条件との関連度である検索スコアの順に表示するよう制御する表示制御手段と、
前記ユーザから受け付けた検索リクエストに係る検索条件により検索された検索対象データに対して、ユーザから検索結果としての適否の選択を受け付ける受付手段と、
前記受付手段により受け付けた選択の内容に従い、当該検索対象データに係る前記検索スコアを調整する制御手段と、
を備え、
前記制御手段は、前記適否の選択を受け付けていない検索対象データである非選択検索対象データのうち、前記適否の選択を受け付けた検索対象データを特徴づける複数のキーワードと前記非選択検索対象データを特徴づける複数のキーワードとが所定の割合以上に一致している前記非選択検索対象データについても、前記受付手段により受け付けた選択の内容に従い検索スコアを調整し、
前記表示制御手段は、さらに、前記制御手段により調整された検索スコアの順に、前記検索された検索対象データを表示するよう制御することを特徴とする情報処理システム。
a display control means for controlling display of search target data searched for using search criteria related to a search request received from a user in order of a search score, which is a degree of relevance to the search criteria;
a receiving means for receiving from the user a selection as to suitability of the search result for the search target data searched based on the search criteria related to the search request received from the user;
a control means for adjusting the search score related to the search target data in accordance with the selection received by the receiving means;
Equipped with
The control means adjusts the search score of non-selected search target data, which is search target data for which the selection of suitability has not been accepted, in accordance with the content of the selection accepted by the acceptance means, for the non-selected search target data in which a plurality of keywords characterizing the search target data for which the selection of suitability has been accepted matches a plurality of keywords characterizing the non-selected search target data at a predetermined rate or more ;
The information processing system further comprises: a display control means for controlling display of the searched search target data in order of the search score adjusted by the control means.
前記受付手段は、検索結果としての適否の選択を検索対象データ毎に受け付けることを特徴とする請求項1に記載の情報処理システム。 The information processing system according to claim 1, characterized in that the accepting means accepts a selection of suitability of the search results for each piece of search target data. 前記表示制御手段は、前記検索対象データ毎に、前記検索結果としての適否の選択を受け付けるボタンを表示するよう制御し、
前記受付手段は、ユーザから当該ボタンに対する操作を受け付けることで、検索結果としての適否の選択を受け付けることを特徴とする請求項に記載の情報処理システム。
the display control means controls to display a button for accepting a selection of suitability of the search result for each of the search target data;
3. The information processing system according to claim 2 , wherein the accepting unit accepts a selection of suitability as a search result by accepting an operation on the button from a user.
前記検索対象データは、文書データであることを特徴とする請求項1乃至のいずれか1項に記載の情報処理システム。 4. The information processing system according to claim 1, wherein the search target data is document data. 情報処理システムの表示制御手段が、ユーザから受け付けた検索リクエストに係る検索条件により検索された検索対象データを、当該検索条件との関連度である検索スコアの順に表示するよう制御する表示制御工程と、
前記情報処理システムの受付手段が、前記ユーザから受け付けた検索リクエストに係る検索条件により検索された検索対象データに対して、ユーザから検索結果としての適否の選択を受け付ける受付工程と、
前記情報処理システムの制御手段が、前記受付工程により受け付けた選択の内容に基づき、当該検索対象データに係る前記検索スコアを調整し、
前記適否の選択を受け付けていない検索対象データである非選択検索対象データのうち、前記適否の選択を受け付けた検索対象データを特徴づける複数のキーワードと前記非選択検索対象データを特徴づける複数のキーワードとが所定の割合以上に一致している前記非選択検索対象データについても、前記受付工程により受け付けた選択の内容に従い検索スコアを調整する制御工程と、
前記情報処理システムの表示制御手段が、前記制御工程により調整された検索スコアの順に、前記検索された検索対象データを表示するよう制御する第2の表示制御工程と、
を備えることを特徴とする情報処理方法。
a display control step of controlling a display control means of the information processing system to display search target data searched for using search criteria related to a search request received from a user in order of a search score, which is a degree of relevance to the search criteria;
a receiving step in which a receiving means of the information processing system receives from a user a selection of suitability of search results for search target data searched based on search conditions related to the search request received from the user;
A control means of the information processing system adjusts the search score related to the search target data based on the content of the selection accepted in the accepting step;
a control step of adjusting the search score of non-selected search target data, which is search target data for which the selection of suitability has not been accepted, in accordance with the content of the selection accepted in the accepting step, for the non-selected search target data in which a plurality of keywords characterizing the search target data for which the selection of suitability has been accepted matches a plurality of keywords characterizing the non-selected search target data at a predetermined rate or more ;
a second display control step of controlling a display control means of the information processing system to display the searched search target data in the order of the search scores adjusted by the control step;
An information processing method comprising:
コンピュータを、請求項1乃至のいずれか1項に記載の各手段として機能させるため
のプログラム。
A program for causing a computer to function as each of the means according to any one of claims 1 to 4 .
JP2020218459A 2020-12-28 2020-12-28 Information processing system, information processing method, and program Active JP7614705B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020218459A JP7614705B2 (en) 2020-12-28 2020-12-28 Information processing system, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020218459A JP7614705B2 (en) 2020-12-28 2020-12-28 Information processing system, information processing method, and program

Publications (3)

Publication Number Publication Date
JP2022103681A JP2022103681A (en) 2022-07-08
JP2022103681A5 JP2022103681A5 (en) 2022-07-19
JP7614705B2 true JP7614705B2 (en) 2025-01-16

Family

ID=82279500

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020218459A Active JP7614705B2 (en) 2020-12-28 2020-12-28 Information processing system, information processing method, and program

Country Status (1)

Country Link
JP (1) JP7614705B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2026018924A1 (en) * 2024-07-18 2026-01-22 セトラスホールディングス株式会社 Information search system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000242647A (en) 1999-02-12 2000-09-08 Internatl Business Mach Corp <Ibm> Method and system for retrieving related information
WO2011010434A1 (en) 2009-07-23 2011-01-27 日本電気株式会社 Information presentation system, information presentation method and storage medium

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4636734B2 (en) * 2001-06-04 2011-02-23 Kddi株式会社 INFORMATION SEARCH SYSTEM, INFORMATION SEARCH METHOD, INFORMATION SEARCH PROGRAM, RECORDING MEDIUM RECORDING INFORMATION SEARCH PROGRAM, OUTPUT INFORMATION SELECTION DEVICE, OUTPUT INFORMATION SELECTION METHOD, OUTPUT INFORMATION SELECTION PROGRAM, AND RECORDING MEDIUM RECORDING OUTPUT INFORMATION SELECTION PROGRAM
US9069843B2 (en) * 2010-09-30 2015-06-30 International Business Machines Corporation Iterative refinement of search results based on user feedback

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000242647A (en) 1999-02-12 2000-09-08 Internatl Business Mach Corp <Ibm> Method and system for retrieving related information
WO2011010434A1 (en) 2009-07-23 2011-01-27 日本電気株式会社 Information presentation system, information presentation method and storage medium

Also Published As

Publication number Publication date
JP2022103681A (en) 2022-07-08

Similar Documents

Publication Publication Date Title
US7769771B2 (en) Searching a document using relevance feedback
US20080215548A1 (en) Information search method and system
CN109960721B (en) Constructing content based on multiple compression of source content
JP4049317B2 (en) Search support apparatus and program
KR101624420B1 (en) Method and System for searching using Related Keywords of Searching object
JP7670951B2 (en) Information processing device, information processing method, and program
JP7614705B2 (en) Information processing system, information processing method, and program
JP7626924B2 (en) Information processing system, information processing method, and program
JP7174268B2 (en) Information processing system, information processing device, information processing method, program
JP7477744B2 (en) Information processing device, control method, and program
JP7545061B2 (en) Information processing system, information processing method, and program
JP2024021725A (en) Information processing device, information processing method, program
JP6867579B2 (en) Information processing equipment, information processing system, its control method and program
JP4289891B2 (en) Information search device, information search method and program
JP4749242B2 (en) Similar character data search method, server, and program
JP2009146013A (en) Content search method, apparatus, and program
JP2005258910A (en) Hierarchical keyword extraction apparatus, method, and program
JP7587171B2 (en) Information processing device, control method, and program
JP2023056462A (en) Information processing device, control method, program
JP4871650B2 (en) Method, server, and program for transmitting item data
JP7284371B2 (en) Information processing device, information processing method, and program
JP2018085021A (en) Information processing apparatus, information processing system, control method thereof, and program
JP7464814B2 (en) Information processing device, control method, and program
JP2026022976A (en) Information processing system, information processing method, and program
JP2008203997A (en) Document search apparatus and program

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220707

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230727

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240209

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20240304

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20240322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20241225

R150 Certificate of patent or registration of utility model

Ref document number: 7614705

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150