Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4163671B2 - Information retrieval system having database operation management support function and database operation management method - Google Patents
[go: Go Back, main page]

JP4163671B2 - Information retrieval system having database operation management support function and database operation management method - Google Patents

Information retrieval system having database operation management support function and database operation management method Download PDF

Info

Publication number
JP4163671B2
JP4163671B2 JP2004284672A JP2004284672A JP4163671B2 JP 4163671 B2 JP4163671 B2 JP 4163671B2 JP 2004284672 A JP2004284672 A JP 2004284672A JP 2004284672 A JP2004284672 A JP 2004284672A JP 4163671 B2 JP4163671 B2 JP 4163671B2
Authority
JP
Japan
Prior art keywords
evaluation
information
database
databases
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004284672A
Other languages
Japanese (ja)
Other versions
JP2006099426A (en
Inventor
麻理子 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2004284672A priority Critical patent/JP4163671B2/en
Publication of JP2006099426A publication Critical patent/JP2006099426A/en
Application granted granted Critical
Publication of JP4163671B2 publication Critical patent/JP4163671B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、異なるデータソースから収集された情報が登録された複数のデータベースを対象とする情報検索が可能な情報検索システムに係り、特に当該データベースの運用管理に好適なデータベース運用管理支援機能を有する情報検索システム及びデータベース運用管理方法に関する。   The present invention relates to an information search system capable of performing an information search for a plurality of databases in which information collected from different data sources is registered, and particularly has a database operation management support function suitable for operation management of the database. The present invention relates to an information retrieval system and a database operation management method.

近年、知識情報の共有支援を図るための知識共有システムが開発されている。この知識共有システムは、個人のノウハウなどの知識情報をデータベース(知識データベース)に蓄積して管理するためのものである。また、知識共有システムと自然言語検索などの検索機能とを組み合わせることで、データベースに蓄積された知識情報の効率的な活用を実現する情報検索システムも開発されている。   In recent years, knowledge sharing systems for supporting sharing of knowledge information have been developed. This knowledge sharing system is for accumulating and managing knowledge information such as personal know-how in a database (knowledge database). In addition, an information search system that realizes efficient use of knowledge information stored in a database by combining a knowledge sharing system and a search function such as natural language search has been developed.

知識共有システムを含む情報検索システムでは、知識情報をいかに効率よく収集するかが重要なポイントとなる。そこで最近の情報検索システムでは、収集モジュールが、外部データソース(インターネット上や社内のイントラネット上にある情報など)を収集し、収集した情報をデータベースに蓄積するのが一般的である(例えば、特許文献1参照)。   In an information retrieval system including a knowledge sharing system, how to efficiently collect knowledge information is an important point. Therefore, in recent information retrieval systems, it is common for the collection module to collect external data sources (such as information on the Internet or in-house intranets) and store the collected information in a database (for example, patents). Reference 1).

また、この種の情報検索システムでは、データソースが多岐に渡る場合には、データソース毎に、それぞれ1つのデータベースを割り当てる運用が適用されることが多い。このような運用は、管理者(管理ユーザ)の操作に基づいて運用管理クライアント(運用管理クライアント端末)によって行われる。また、情報検索システムは、データベースに蓄積された情報をユーザから利用可能なように検索サーバを有している。検索サーバは、ユーザの操作に従って検索クライアント(検索クライアント端末)から指定されたデータベースに対して検索条件に従って検索を行い、検索結果を検索クライアントを介してユーザに提示する。ユーザは、検索サーバからの検索結果を参照する。   In this type of information search system, when there are a wide variety of data sources, an operation of allocating one database for each data source is often applied. Such an operation is performed by an operation management client (operation management client terminal) based on an operation of an administrator (management user). The information search system has a search server so that information stored in the database can be used by the user. The search server searches the database specified by the search client (search client terminal) according to the user's operation according to the search condition, and presents the search result to the user via the search client. The user refers to the search result from the search server.

ところで、データソースが多岐に渡るということは、様々な知識情報を収集できる反面、運用管理クライアントを介しての管理者によるシステムの運用管理という観点からは、管理対象となるデータベースの個数の増加を招くことを意味する。この場合、これらのデータベースを管理者が効率的に管理することは困難となる。   By the way, the wide range of data sources means that various knowledge information can be collected. However, from the viewpoint of system operation management by the administrator via the operation management client, the number of databases to be managed is increased. It means inviting. In this case, it is difficult for an administrator to efficiently manage these databases.

また、収集モジュールによって自動的に大量に収集されてくるデータの中には、ユーザにとって不要なものも大量に含まれる。しかし、管理者が、ユーザにとって不要なものを判別することは困難となる。   Further, the data automatically collected in a large amount by the collecting module includes a large amount of data unnecessary for the user. However, it is difficult for the administrator to determine what is unnecessary for the user.

一方、検索結果である情報(検索結果一覧から選択された情報)を検索クライアントを介してユーザに提示した際に、その情報に対するユーザの評価を入力させることで、その情報に対するユーザの評価を取得して、データベース内の情報毎に対応するユーザ評価情報を保存することが提案されている(例えば、特許文献2参照)。この特許文献2には、検索結果一覧、或は検索結果一覧から選択された情報をユーザに提示する際に、その情報に対応するユーザ評価情報を併せて提示することが記載されている。また特許文献2には、検索された情報の順位付けに対応するユーザ評価情報を用いることも記載されている。
特開2003−303197号公報(段落0008、段落0010) 特開2002−41524号公報(段落0009乃至0012、段落0033,段落0034、段落0040、段落0041、図8)
On the other hand, when the information that is the search result (information selected from the search result list) is presented to the user via the search client, the user's evaluation for the information is obtained by inputting the user's evaluation for the information. Thus, it has been proposed to store user evaluation information corresponding to each piece of information in the database (see, for example, Patent Document 2). This Patent Document 2 describes that when a search result list or information selected from the search result list is presented to a user, user evaluation information corresponding to the information is also presented. Patent Document 2 also describes the use of user evaluation information corresponding to the ranking of searched information.
JP 2003-303197 A (paragraph 0008, paragraph 0010) JP 2002-41524 A (paragraphs 0009 to 0012, paragraph 0033, paragraph 0034, paragraph 0040, paragraph 0041, FIG. 8)

上述した情報検索システムにおいて、複数のデータソースを対象に、そのデータソースから対応するデータベースに知識情報を収集する処理が頻繁に行われる場合には、管理者が有用性を管理しなければならない情報の件数が膨大となる。この場合、これらのデータベースを運用管理クライアントが効率的に管理することは困難であり、またユーザにとって不要なデータベースを判別することも困難である。   In the information search system described above, information that must be managed by an administrator when knowledge data is frequently collected from a plurality of data sources to a corresponding database. The number of cases becomes enormous. In this case, it is difficult for the operation management client to efficiently manage these databases, and it is also difficult to determine a database unnecessary for the user.

そこで、この判別に、特許文献2に記載された、各データベース内の登録情報毎のユーザ評価情報を利用することが考えられる。しかし、この情報毎のユーザ評価情報を利用するには、管理者は各データベース内の全ての登録情報をチェックしなければならず、運用管理のコストが増加するという問題がある。しかも、データベース内の登録情報が多くなると、ユーザから参照される回数の少ない情報も増加する。このような情報については、ユーザの評価の回数も少なくなるため、ユーザ評価情報自体の信頼性の点で問題がある。したがって管理者が、データベース内の登録情報毎のユーザ評価情報を単に利用して、登録情報毎に有用性を評価するだけでは、対応するデータベースがユーザにとって不要であるかを判別することは困難である。   Therefore, it is conceivable to use user evaluation information for each registered information in each database described in Patent Document 2 for this determination. However, in order to use the user evaluation information for each information, the administrator has to check all the registration information in each database, and there is a problem that the cost of operation management increases. Moreover, as the registration information in the database increases, information that is less frequently referenced by the user also increases. Such information has a problem in terms of reliability of the user evaluation information itself because the number of evaluations by the user is reduced. Therefore, it is difficult for an administrator to determine whether a corresponding database is unnecessary for a user simply by using user evaluation information for each registered information in the database and evaluating the usefulness for each registered information. is there.

本発明は上記事情を考慮してなされたものでその目的は、管理者が各データベース内の全ての情報の有用度を個々にチェックしなくても、有効に利用されているデータベースを容易に判別できる、データベース運用管理支援機能を有する情報検索システム及びデータベース運用管理方法を提供することにある。   The present invention has been made in consideration of the above circumstances, and its purpose is to easily determine the database that is effectively used without the administrator checking the usefulness of all information in each database individually. Another object of the present invention is to provide an information search system and database operation management method having a database operation management support function.

本発明の1つの観点に係るデータベース運用管理支援機能を有する情報検索システムは、異なるデータソースから収集された情報が登録された複数のデータベースと、ユーザからの検索要求で指定された検索条件に従って前記複数のデータベースの少なくとも1つから当該検索条件に合致するデータを検索して、その検索結果を前記ユーザに提示する検索サーバと、前記検索サーバによる検索の履歴を含む、前記複数のデータベース各々の利用状況の履歴を保存するログ保存手段と、前記ログ保存手段に保存されている前記複数のデータベース各々の利用状況の履歴に基づいて、前記複数のデータベース各々の利用状況の統計情報を生成し、当該統計情報に基づいて前記複数のデータベース各々の利用状況を評価する統計・評価手段と、前記統計・評価手段による前記複数のデータベース各々の利用状況の評価結果を管理者に提示するデータベース情報提示手段とを具備し、前記統計・評価手段は、データベース毎に、複数種の評価項目の各々について前記統計情報に基づく評価ポイントを得るとともに、得られた各評価ポイントに基づいてデータベース毎の評価値を算出する手段を具備し、前記評価値は、評価項目毎に、当該評価項目の評価ポイントに応じた重み係数と、当該データベースの文書数に全データベースの平均文書数の対数を乗じて得られる値とを乗算して得られる値を、評価項目毎に加算して得られる値であることを特徴とする。 An information search system having a database operation management support function according to one aspect of the present invention includes a plurality of databases in which information collected from different data sources is registered, and a search condition specified in a search request from a user. Searching data that matches the search condition from at least one of a plurality of databases, and presenting the search results to the user, and using each of the plurality of databases, including a history of searches by the search server Log storage means for storing a history of status, and based on the usage status history of each of the plurality of databases stored in the log storage means, generating statistical information on the usage status of each of the plurality of databases, Statistics / evaluation means for evaluating the usage status of each of the plurality of databases based on statistical information; Comprising a database information presenting means for presenting the evaluation results of a plurality of databases each usage by meter and evaluation unit to the administrator, the statistical and evaluation unit, for each database, for each of a plurality of types of evaluation items Obtaining evaluation points based on the statistical information, and means for calculating an evaluation value for each database based on the obtained evaluation points, the evaluation value is an evaluation point of the evaluation item for each evaluation item The value obtained by multiplying the value obtained by multiplying the corresponding weighting factor and the value obtained by multiplying the number of documents in the database by the logarithm of the average number of documents in all databases for each evaluation item. Features.

このような構成においては、検索サーバによる検索の履歴を含む、複数のデータベース各々の利用状況の履歴がログ保存手段に保存される。統計・評価手段は、このログ保存手段に保存されている、複数のデータベース各々の利用状況の履歴に基づいて、当該複数のデータベース各々の利用状況の統計情報を生成する。統計・評価手段は、この複数のデータベース各々の利用状況の統計情報に基づいて、当該複数のデータベース各々の利用状況を評価する。この評価結果は、データベース情報提示手段によって管理者に提示される。これにより管理者は、複数のデータベース各々における全ての登録情報をチェックしなくても、提示された複数のデータベース各々の利用状況の評価結果から、当該複数のデータベースのいずれが有効に利用されており、いずれが有効に利用されていないか容易に判別できる。よって、運用管理コストを削減することが可能となる。ここで、評価結果は、有効に利用されているデータベースの順、或は有効に利用されていないデータベースの順など、順位付けされた一覧として提示される構成とすると良い。この際、評価値を付すと良い。   In such a configuration, the usage history of each of the plurality of databases, including the search history by the search server, is stored in the log storage means. The statistics / evaluation unit generates statistical information on the usage status of each of the plurality of databases based on the history of usage status of each of the plurality of databases stored in the log storage unit. The statistics / evaluation means evaluates the usage status of each of the plurality of databases based on the statistical information of the usage status of each of the plurality of databases. This evaluation result is presented to the administrator by the database information presenting means. As a result, the administrator can effectively use any one of the plurality of databases based on the evaluation result of the usage situation of each of the plurality of databases presented without checking all the registration information in each of the plurality of databases. , It is easy to determine which is not being used effectively. Therefore, the operation management cost can be reduced. Here, the evaluation result may be configured to be presented as an ordered list such as the order of databases that are used effectively or the order of databases that are not used effectively. At this time, an evaluation value may be given.

また、ログ保存手段に保存される上記複数のデータベース各々の利用状況の履歴が、当該複数のデータベース各々における登録情報毎の履歴であって、検索条件に合致したか否かを示す検索ヒット有無情報、更新の有無を示す更新有無情報、検索条件に合致する程度を表すスコア、検索された情報がユーザによって選択されて参照されたか否かを示すアクセス有無情報、及びユーザによって参照された情報に対する当該ユーザの評価を示す評価情報のうちから選択された複数の履歴を含む構成を適用すると良い。この構成において、上記検索ヒット有無情報に対応する検索頻度、上記更新有無情報に対応する更新頻度、上記スコア、上記アクセス有無情報に対応するアクセス頻度、及び上記評価情報に対応するユーザ評価を含む複数の評価項目のうち、上記選択された複数の履歴に対応する評価項目の中から、管理者によって選択指定された少なくとも1つの評価項目を上記統計・評価手段が受け付けて、ログ保存手段に保存されている上記複数のデータベース各々の利用状況の履歴のうち、当該指定された評価項目に対応する情報に基づいて、当該指定された評価項目に関する上記複数のデータベース各々の利用状況の統計情報を生成し、当該統計情報に基づいて上記複数のデータベース各々の利用状況を評価するならば、検索頻度が高いデータベース、更新頻度が高い情報が多く登録されているデータベース、検索で高いスコアとなる情報が多く登録されているデータベース、評価の高い情報が多く登録されているデータベースなど、管理者の意図した評価項目に沿ったデータベース利用状況の評価結果を提示することが可能となる。   Search history information indicating whether or not the usage history history of each of the plurality of databases stored in the log storage means is a history for each registered information in each of the plurality of databases and matches the search condition. Update presence / absence information indicating the presence / absence of update, a score indicating the degree of matching with the search condition, access presence / absence information indicating whether or not the searched information is selected and referred to by the user, and the information referred to by the user A configuration including a plurality of histories selected from the evaluation information indicating the user's evaluation may be applied. In this configuration, a plurality of information including a search frequency corresponding to the search hit presence information, an update frequency corresponding to the update presence information, the score, an access frequency corresponding to the access presence information, and a user evaluation corresponding to the evaluation information Among the evaluation items, at least one evaluation item selected and designated by the administrator from among the evaluation items corresponding to the plurality of selected histories is received by the statistics / evaluation unit and stored in the log storage unit Based on the information corresponding to the designated evaluation item in the usage history of each of the plurality of databases, statistical information on the usage situation of each of the plurality of databases related to the designated evaluation item is generated. If the usage status of each of the plurality of databases is evaluated based on the statistical information, a database with a high search frequency is used. Evaluation items intended by the administrator, such as databases with a lot of information that is frequently updated, databases with a lot of information that gives high scores in searches, databases with a lot of information with high evaluations, etc. It is possible to present the evaluation result of the database usage situation along the way.

また、上記複数のデータベース各々の利用状況の評価結果が時間軸方向の変化の傾向を表すように、当該複数のデータベース各々の利用状況が評価される構成とするならば、例えばアクセス頻度が高くなっている、或はアクセス頻度が低くなっているなど、データベース各々の利用状況の評価結果に、時系列的な変化を反映させることができる。   Further, if the usage status of each of the plurality of databases is evaluated so that the evaluation result of the usage status of each of the plurality of databases represents a tendency of change in the time axis direction, for example, the access frequency increases. A change in time series can be reflected in the evaluation result of the usage status of each database, such as the access frequency is low or the access frequency is low.

本発明によれば、検索の履歴を含む、複数のデータベース各々の利用状況の履歴に基づいて、当該複数のデータベース各々の利用状況の統計情報を生成し、その複数のデータベース各々の利用状況の統計情報に基づいて、当該複数のデータベース各々の利用状況を評価して、その評価結果を管理者に提示することにより、管理者が各データベース内の全ての情報の有用度を個々にチェックしなくても、有効に利用されているデータベースを容易に判別でき、運用管理のコストを削減することができる。   According to the present invention, based on the usage history of each of the plurality of databases including the search history, the usage status statistical information of each of the plurality of databases is generated, and the usage status statistics of each of the plurality of databases are generated. Based on the information, the usage situation of each of the plurality of databases is evaluated, and the evaluation result is presented to the administrator so that the administrator does not individually check the usefulness of all the information in each database. However, it is possible to easily determine the database that is effectively used, and to reduce the cost of operation management.

以下、本発明の実施の形態につき図面を参照して説明する。
[第1の実施形態]
図1は本発明の第1の実施形態に係る情報検索システムの構成を示すブロック図である。図1に示す情報検索システムは、複数のデータベース、例えば2つのデータベース11A(#A),11B(#B)と、収集モジュール12A,12Bと、複数の検索クライアント(検索クライアント端末)13と、検索サーバ14と、統計・評価モジュール15と、統計・評価ログデータベース16と、データベース情報提示モジュール17と、運用管理クライアント(運用管理クライアント端末)18とから構成される。収集モジュール12A,12B、検索サーバ14、統計・評価モジュール15、及びデータベース情報提示モジュール17は、専用のプログラムを計算機(サーバ計算機)が読み取り実行することにより実現される。このプログラムは、計算機で読み取り可能な記憶媒体に予め格納して頒布可能である。また、このプログラムが、ネットワークを介してダウンロード(頒布)されても構わない。
Embodiments of the present invention will be described below with reference to the drawings.
[First Embodiment]
FIG. 1 is a block diagram showing a configuration of an information search system according to the first embodiment of the present invention. The information search system shown in FIG. 1 includes a plurality of databases, for example, two databases 11A (#A) and 11B (#B), collection modules 12A and 12B, a plurality of search clients (search client terminals) 13, and a search The server 14 includes a statistics / evaluation module 15, a statistics / evaluation log database 16, a database information presentation module 17, and an operation management client (operation management client terminal) 18. The collection modules 12A and 12B, the search server 14, the statistics / evaluation module 15, and the database information presentation module 17 are realized by a computer (server computer) reading and executing a dedicated program. This program can be stored in advance in a computer-readable storage medium and distributed. Further, this program may be downloaded (distributed) via a network.

以下、図1の情報検索システムにおける動作を、図2のシーケンスチャートを参照して説明する。データベース11A,11Bは、それぞれ異なる外部データソース21A,21B(インターネット上や社内のイントラネット上にある情報のソース)に対応して設けられ、対応する外部データソースから収集された情報を蓄積するのに用いられる。外部データソース21Aは例えばインターネット上に存在し、外部データソース21Bは例えば社内のイントラネット上に存在するものとする。また、インターネット上の予め定められた複数のWebサーバをそれぞれ外部データソースとして、当該Webサーバ毎にデータベースが用意される構成とすることも可能である。なお、説明を簡略化するために、外部データソース21A,21Bから収集される情報が文書情報であるものとする。   Hereinafter, the operation in the information search system of FIG. 1 will be described with reference to the sequence chart of FIG. The databases 11A and 11B are provided corresponding to different external data sources 21A and 21B (sources of information on the Internet or an intranet in the company), respectively, and accumulate information collected from the corresponding external data sources. Used. It is assumed that the external data source 21A exists on the Internet, for example, and the external data source 21B exists on the company intranet, for example. It is also possible to employ a configuration in which a database is prepared for each Web server using a plurality of predetermined Web servers on the Internet as external data sources. In order to simplify the description, it is assumed that information collected from the external data sources 21A and 21B is document information.

収集モジュール12i(i=A,B)は、外部データソース21iから文書情報を収集して、その収集された文書情報をデータベース11iに登録する(ステップS1)。収集モジュール12iは、既にデータベース11iに登録済みの文書情報に対応する文書情報を収集した場合、新たに収集された文書情報が、登録済みの文書情報の更新された情報(つまり更新文書)であるかを判定する。この判定は、文書情報のサイズまたは更新日時を比較することで行われる。収集モジュール12iは、新たに収集された文書情報が、更新された情報である場合、既登録の文書情報を当該新たに収集された文書情報で更新する。また、収集モジュール12iは、データベース11i内の既登録の文書情報が更新されたことを検索サーバ14に通知する(ステップS2)。また、既にデータベース11iに登録済みの文書情報が、外部データソース21iに存在しない場合、収集モジュール12iは、当該登録済みの文書情報をデータベース11iから削除する。   The collection module 12i (i = A, B) collects document information from the external data source 21i, and registers the collected document information in the database 11i (step S1). When the collection module 12i collects document information corresponding to document information already registered in the database 11i, the newly collected document information is updated information of the registered document information (that is, an updated document). Determine whether. This determination is made by comparing the size or update date / time of the document information. When the newly collected document information is updated information, the collection module 12i updates the already registered document information with the newly collected document information. In addition, the collection module 12i notifies the search server 14 that the registered document information in the database 11i has been updated (step S2). If document information already registered in the database 11i does not exist in the external data source 21i, the collection module 12i deletes the registered document information from the database 11i.

検索サーバ14は、収集モジュール12iによるデータベース11iへの文書情報収集が完了すると、当該データベース11iの文書毎の更新の有無を示す情報をデータベース11iのデータベース名と共に統計・評価モジュール15に通知する(ステップS3)。統計・評価モジュール15は、検索サーバ14から通知された更新の有無を示す情報をログ情報として、その時点における日時を示す日時情報を付して、統計・評価ログデータベース16内の後述するログ情報テーブル160に保存する(ステップS4)。   When the collection module 12i completes the collection of the document information in the database 11i, the search server 14 notifies the statistics / evaluation module 15 of information indicating whether or not each document in the database 11i is updated together with the database name of the database 11i (Step S14). S3). The statistics / evaluation module 15 uses the information notified from the search server 14 indicating the presence / absence of update as log information, attaches date / time information indicating the date / time at that time, and logs information described later in the statistics / evaluation log database 16 Save in the table 160 (step S4).

検索クライアント13は、ユーザの操作に応じて検索サーバ14に対して検索を要求する(ステップS5)。検索サーバ14は、検索クライアント13からの検索要求に応じ、当該検索要求で指定されたデータベース11i(iはAまたはB)を対象に当該検索要求で指定された検索条件に従う検索処理を行う(ステップS6)。この検索処理では、検索サーバ14は、データベース11iに登録されている文書毎に、検索条件に合致する程度を表すスコアを算出する。検索サーバ14は、算出された文書毎のスコアを、以下に述べる検索結果テーブル140内の当該文書に対応するスコアフィールドに保持する。   The search client 13 requests the search server 14 to perform a search according to a user operation (step S5). In response to the search request from the search client 13, the search server 14 performs a search process according to the search condition specified in the search request for the database 11i (i is A or B) specified in the search request (step S6). In this search process, the search server 14 calculates a score representing the degree of matching with the search condition for each document registered in the database 11i. The search server 14 stores the calculated score for each document in a score field corresponding to the document in the search result table 140 described below.

図3は、検索結果テーブル140のデータ構造例を示す。検索結果テーブル140は、データベース11A,11B毎で、且つ当該データベース11A,11Bに登録されている各文書毎に、検索でのヒットの有無を保持する検索ヒットフィールド、検索条件に合致する程度を表すスコア(検索条件に対して検索した文書の適合率)を保持するスコアフィールド及びアクセス(参照)の有無を保持するアクセスフィールドを有する。検索ヒットフィールドは、対応する文書が検索された場合に検索有りを示す状態に設定される。また、スコアフィールドには、ユーザからの検索要求に応じて実行される検索処理で算出された対応する文書のスコアが保持される。また、アクセスフィールドは、対応する文書がアクセス(参照)された場合にアクセス有りを示す状態に設定される。   FIG. 3 shows an exemplary data structure of the search result table 140. The search result table 140 represents a search hit field that holds the presence or absence of a hit in the search for each of the databases 11A and 11B and for each document registered in the databases 11A and 11B, and the degree of matching with the search conditions. It has a score field that holds a score (the relevance ratio of a document searched for a search condition) and an access field that holds the presence or absence of access (reference). The search hit field is set to a state indicating that there is a search when the corresponding document is searched. The score field holds the score of the corresponding document calculated by the search process executed in response to the search request from the user. The access field is set to a state indicating that there is an access when the corresponding document is accessed (referenced).

検索結果テーブル140はまた、データベース11A,11B毎で、且つ当該データベース11A,11Bに登録されている各文書毎に、ユーザ評価結果を保持するための「役に立つ」評価フィールド及び「役に立たない」評価フィールドを有する。「役に立つ」評価フィールドは、対応する文書が役に立つとユーザに評価された場合に、その旨を示す状態に設定される。同様に、「役に立たない」評価フィールドは、対応する文書が役に立たないとユーザに評価された場合に、その旨を示す状態に設定される。なお、検索結果テーブル140の枠組みは、データベースの増減、データベース内の文書の増減に応じて変化する。   The search result table 140 also includes a “useful” evaluation field and a “useless” evaluation field for holding user evaluation results for each of the databases 11A and 11B and for each document registered in the databases 11A and 11B. Have The “useful” evaluation field is set to a state indicating that when the user evaluates that the corresponding document is useful. Similarly, the “useless” evaluation field is set to a state indicating that when the user evaluates that the corresponding document is useless. Note that the framework of the search result table 140 changes according to the increase / decrease in the database and the increase / decrease in the documents in the database.

検索サーバ14は、データベース11iに登録されている文書毎にスコアを算出すると、検索条件に合致(ヒット)した文書、例えば予め定められた閾値を超えるスコアの文書について、検索結果テーブル140内の当該文書に対応する検索ヒットフィールドを、検索有りを示す状態に設定する。   When the search server 14 calculates a score for each document registered in the database 11i, a document that matches (hits) the search condition, for example, a document with a score exceeding a predetermined threshold value, is stored in the search result table 140. The search hit field corresponding to the document is set to a state indicating that there is a search.

検索サーバ14は、検索条件に合致(ヒット)した文書の一覧(検索文書一覧)を含む検索結果を検索クライアント13に送信する(ステップS7)。この検索文書一覧は、検索条件に合致した各文書の文書名(タイトル名)と文書の要約とを含む。検索文書一覧中の文書(文書名)の並び順は対応するスコアの大きい順となっている。   The search server 14 transmits a search result including a list (search document list) of documents that match (hit) the search condition to the search client 13 (step S7). This search document list includes the document name (title name) of each document that meets the search condition and the document summary. The order of the documents (document names) in the search document list is the descending order of the corresponding scores.

検索サーバ14から検索クライアント13に検索結果が送信されると、当該検索クライアント13の表示モニタに、上記検索文書一覧を含む検索結果画面が表示される。この検索文書一覧から、ユーザが所望の文書の文書名を選択する操作を行うと、検索クライアント13から検索サーバ14に文書の参照要求(アクセス要求)が送信される(ステップS8)。この参照要求に応じて、検索サーバ14は、選択された文書名の文書情報をデータベース11iから取り出して検索クライアント13に送信する(ステップS9)。すると、検索クライアント13の表示モニタに、ユーザが選択した文書情報を含む文書閲覧画面が表示される。これによりユーザは、この文書閲覧画面上で自身が選択した文書情報を参照することができる。   When a search result is transmitted from the search server 14 to the search client 13, a search result screen including the search document list is displayed on the display monitor of the search client 13. When the user performs an operation of selecting a document name of a desired document from the search document list, a document reference request (access request) is transmitted from the search client 13 to the search server 14 (step S8). In response to this reference request, the search server 14 retrieves the document information of the selected document name from the database 11i and transmits it to the search client 13 (step S9). Then, a document browsing screen including the document information selected by the user is displayed on the display monitor of the search client 13. As a result, the user can refer to the document information selected by the user on the document browsing screen.

検索サーバ14は、ユーザによって検索結果文書一覧から選択された文書を検索クライアント13に送信すると、検索結果テーブル140内の当該文書に対応するアクセスフィールドを、アクセス(参照)有りを示す状態に設定する。   When the search server 14 transmits a document selected from the search result document list by the user to the search client 13, the search server 14 sets the access field corresponding to the document in the search result table 140 to a state indicating presence of access (reference). .

検索クライアント13の表示モニタに表示される文書閲覧画面には、前記特許文献2に記載されているように、ユーザの評価を入力するための評価入力領域が確保されている。この評価入力領域には、評価種類入力用のラジオボタンが配置されている。ここでは、説明を簡略化するために、評価種類入力用のラジオボタンが、文書閲覧画面に表示された文書情報(つまりユーザによって参照された文書情報)が役に立つことを入力するのに用いられるラジオボタンと、当該文書情報が役に立たないことを入力するのに用いられるラジオボタンとの2種であるものとする。この例は、2段階の評価値の中から、1つをユーザに選択させる構成と等価である。なお、3段階以上の評価値の中から、1つをユーザに選択させる構成であっても構わない。   On the document browsing screen displayed on the display monitor of the search client 13, as described in Patent Document 2, an evaluation input area for inputting a user's evaluation is secured. In this evaluation input area, radio buttons for inputting an evaluation type are arranged. Here, in order to simplify the explanation, the radio button for inputting the evaluation type is a radio used to input that the document information displayed on the document browsing screen (that is, the document information referred to by the user) is useful. Assume that there are two types of buttons: a button and a radio button used to input that the document information is useless. This example is equivalent to a configuration in which the user selects one of two evaluation values. In addition, you may be the structure which makes a user select one from the evaluation value of three steps or more.

さてユーザは、文書閲覧画面が表示されると、当該文書閲覧画面の評価入力領域に配置された2種のラジオボタンのいずれか一方を選択することで、当該文書閲覧画面に表示された文書情報(つまりユーザが参照した文書情報)に対して、そのラジオボタンに固有の評価を付けることができる。この評価付けの結果、つまり「役に立つ」ことを示す評価が入力されたか、或は「役に立たない」ことを示す評価が入力されたかは、検索クライアント13から検索サーバ14に通知される(ステップS10)。なお、2種のラジオボタンのいずれも選択しないことで、上記文書情報に対して、「役に立つ」または「役に立たない」のいずれでもないとの評価を付けることもできる。   Now, when the document browsing screen is displayed, the user selects one of the two types of radio buttons arranged in the evaluation input area of the document browsing screen, thereby displaying the document information displayed on the document browsing screen. A specific evaluation can be given to the radio button with respect to (that is, document information referred to by the user). As a result of this evaluation, that is, whether the evaluation indicating “useful” or the evaluation indicating “useless” is input, the search client 13 notifies the search server 14 (step S10). . Note that by selecting neither of the two types of radio buttons, it is possible to give an evaluation that the document information is neither “useful” nor “useless”.

検索サーバ14は、「役に立つ」ことを示す評価が入力された場合であれば、検索結果テーブル140内の、「役に立つ」と評価された文書情報に対応する「役に立つ」評価フィールドを、「役に立つ」と評価された旨を示す状態に設定する。同様に、「役に立たない」ことを示す評価が入力された場合であれば、検索サーバ14は、検索結果テーブル140内の、「役に立たない」と評価された文書情報に対応する「役に立たない」評価フィールドを、「役に立たない」と評価された旨を示す状態に設定する。   If an evaluation indicating “useful” is input, the search server 14 sets the “useful” evaluation field corresponding to the document information evaluated as “useful” in the search result table 140 to “useful”. Is set to a state indicating that it has been evaluated. Similarly, if an evaluation indicating “useless” is input, the search server 14 evaluates the “useless” evaluation corresponding to the document information evaluated as “useless” in the search result table 140. The field is set to a state indicating that it has been evaluated as “useless”.

検索サーバ14は、例えば1つの検索条件に対応する一連の検索処理が終了する毎に、その時点における検索結果テーブル140の情報を統計・評価モジュール15に送信する(ステップS11)。そして、統計・評価モジュール15が検索結果テーブル140の情報を正常に受信すると、検索サーバ14は当該検索サーバ14内の検索結果テーブル140の各フィールドの状態を初期化する。   For example, every time a series of search processes corresponding to one search condition is completed, the search server 14 transmits information of the search result table 140 at that time to the statistics / evaluation module 15 (step S11). When the statistics / evaluation module 15 normally receives the information of the search result table 140, the search server 14 initializes the state of each field of the search result table 140 in the search server 14.

統計・評価モジュール15は、検索サーバ14から送信された検索結果テーブル140の情報を受信すると、その情報をログ情報として、その時点における日時を示す日時情報を付して、統計・評価ログデータベース16内の以下に述べるログ情報テーブル160に保存する(ステップS12)。   When receiving the information of the search result table 140 transmitted from the search server 14, the statistics / evaluation module 15 uses the information as log information, attaches date / time information indicating the date / time at that time, and adds the statistics / evaluation log database 16. In the log information table 160 described below (step S12).

図4は、ログ情報テーブル160のデータ構造例を示す。ログ情報テーブル160のデータ構造は、図3の検索結果テーブル140とほぼ同様である。ここでは、説明を簡略化するために、検索サーバ14から統計・評価ログデータベース16に、データベース11iの文書毎の更新の有無を示す情報、または検索結果テーブル140の情報が送信される毎に、ログ情報テーブル160が統計・評価ログデータベース16内に生成されるものとする。つまり、本実施形態では、ログ情報テーブル160の列が時系列順に統計・評価ログデータベース16に蓄積される。ログ情報テーブル160が検索結果テーブル140と相違するのは、更新の有無を保持する更新フィールドを有する点である。   FIG. 4 shows an exemplary data structure of the log information table 160. The data structure of the log information table 160 is almost the same as that of the search result table 140 of FIG. Here, in order to simplify the description, every time information indicating whether or not each document in the database 11i is updated or information in the search result table 140 is transmitted from the search server 14 to the statistics / evaluation log database 16, It is assumed that the log information table 160 is generated in the statistics / evaluation log database 16. That is, in this embodiment, the columns of the log information table 160 are accumulated in the statistics / evaluation log database 16 in time series order. The log information table 160 is different from the search result table 140 in that it has an update field for holding the presence / absence of update.

さて運用管理クライアント18は、管理者の操作によりデータベース評価情報の提示が要求されると、データベース情報提示モジュール17に対して、データベース評価情報の提示要求を通知する(ステップS13)。ここでは、運用管理クライアント18は、管理者からデータベース評価情報の提示が要求された場合に、管理者に対して、評価項目と、評価期間(評価の対象期間)の指定を促すメッセージを表示する。これにより管理者は、評価項目と、評価期間を指定することが可能である。   Now, when the presentation of database evaluation information is requested by the operation of the administrator, the operation management client 18 notifies the database information presentation module 17 of a request for presentation of database evaluation information (step S13). Here, the operation management client 18 displays a message prompting the administrator to specify an evaluation item and an evaluation period (an evaluation target period) when the administrator requests presentation of database evaluation information. . Thereby, the administrator can specify the evaluation item and the evaluation period.

データベース情報提示モジュール17は、運用管理クライアント18からの提示要求を受け付けると、統計・評価モジュール15に対してデータベース評価要求を通知する(ステップS14)。このデータベース評価要求は、指定された評価項目と評価期間の情報を含むものとする。統計・評価モジュール15は、データベース情報提示モジュール17からのデータベース評価要求を受け付けると、当該評価要求で指定された評価項目について、その評価項目毎の評価ポイントを用いて、データベース11i毎の評価値Riを算出する(ステップS15)。本実施形態で適用される評価項目は、「役に立つ」、「役に立たない」、「検索頻度が高い」、「検索頻度が低い」、「更新頻度が高い」、「更新頻度が低い」、「スコアが高い」、「スコアが低い」、「アクセス頻度が高い」及び「アクセス頻度が低い」の10項目であり、この中から1つまたは複数の項目を選択的に指定することが可能である。なお、以上の10項目の一部は必ずしも用意されていなくても良い。逆に、データベース11iに対する情報の「登録頻度が高い」及び「登録頻度が低い」と、データベース11iからの情報の「削除頻度が高い」及び「削除頻度が低い」の各評価項目を加えることも可能である。そのためには、収集モジュール12iによる情報収集時において、上述の文書毎の更新の有無を示す情報の他に、データベース11iに新たに登録された文書の情報、或はデータベース11iから削除された文書の情報を、統計・評価モジュール15に通知する必要がある。   Upon receiving the presentation request from the operation management client 18, the database information presentation module 17 notifies the statistics / evaluation module 15 of the database evaluation request (step S14). This database evaluation request includes information on designated evaluation items and evaluation periods. When the statistics / evaluation module 15 receives the database evaluation request from the database information presentation module 17, the evaluation value Ri for each database 11i is used for the evaluation item specified in the evaluation request, using the evaluation point for each evaluation item. Is calculated (step S15). Evaluation items applied in the present embodiment are “useful”, “useless”, “high search frequency”, “low search frequency”, “high update frequency”, “low update frequency”, “score” 10 items of “High”, “Low score”, “High access frequency”, and “Low access frequency”, and one or a plurality of items can be selectively designated. Note that some of the above 10 items are not necessarily prepared. Conversely, the evaluation items “high registration frequency” and “low registration frequency” of information on the database 11i and “high deletion frequency” and “low deletion frequency” of information from the database 11i may be added. Is possible. For this purpose, at the time of collecting information by the collecting module 12i, in addition to the information indicating whether or not each document has been updated, information on a document newly registered in the database 11i or information on a document deleted from the database 11i. It is necessary to notify the statistics / evaluation module 15 of the information.

以下、データベース11i毎の評価値Riの算出について説明する。まず統計・評価モジュール15は、指定評価期間におけるログ情報であるログ情報テーブル160の列を先頭から順に読み込む。もし、指定評価項目が「役に立つ」であるならば、統計・評価モジュール15は、ログ情報テーブル160の「役に立つ」評価フィールドを参照して、各データベース11iの文書毎に、指定の評価期間において当該文書が「役に立つ」と評価された回数をカウントする。このカウント値を、データベース11iの全文書について累計すると、評価項目「役に立つ」に関する当該データベース11iの評価ポイント(統計情報)を取得できる。   Hereinafter, calculation of the evaluation value Ri for each database 11i will be described. First, the statistics / evaluation module 15 reads the columns of the log information table 160 that is log information in the designated evaluation period in order from the top. If the designated evaluation item is “useful”, the statistic / evaluation module 15 refers to the “useful” evaluation field of the log information table 160, and for each document in each database 11 i, in the designated evaluation period. Count the number of times a document has been evaluated as “useful”. When this count value is accumulated for all documents in the database 11i, the evaluation points (statistical information) of the database 11i regarding the evaluation item “useful” can be acquired.

同様に、指定評価項目が「役に立たない」であるならば、統計・評価モジュール15は、ログ情報テーブル160の「役に立たない」評価フィールドを参照して、各データベース11iの文書毎に、指定の評価期間において当該文書が「役に立たない」と評価された回数をカウントする。このカウント値を、データベース11iの全文書について累計すると、評価項目「役に立たない」に関する当該データベース11iの評価ポイントを取得できる。   Similarly, if the designated evaluation item is “useless”, the statistic / evaluation module 15 refers to the “useless” evaluation field of the log information table 160 and designates the designated evaluation for each document in each database 11i. Count the number of times the document has been evaluated as “useless” during the period. By accumulating this count value for all the documents in the database 11i, the evaluation point of the database 11i regarding the evaluation item “useless” can be acquired.

次に、指定評価項目が「検索頻度が高い」または「検索頻度が低い」であるならば、統計・評価モジュール15は、ログ情報テーブル160の検索ヒットフィールドを参照して、1回の検索毎に、各データベース11iについて、検索頻度が高いか、または検索頻度が低いかを判定する。ここでは、データベース11i内の総文書数に対する1回の検索でのヒット文書の割合が第1の閾値以上であるならば、データベース11iの検索頻度が高いと判定される。また、ヒット文書の割合が第1の閾値未満であるならば、データベース11iの検索頻度が低いと判定される。そして、データベース11iの検索頻度が高いと判定される毎に、「検索頻度が高い」評価ポイントを1インクリメントする動作を、指定評価期間におけるログ情報テーブル160の列について実行する。これにより、評価項目「検索頻度が高い」に関する当該データベース11iの評価ポイントを取得できる。同様に、データベース11iの検索頻度が低いと判定される毎に、「検索頻度が低い」評価ポイントを1インクリメントする動作を、指定評価期間におけるログ情報テーブル160の列について実行する。これにより、評価項目「検索頻度が低い」に関する当該データベース11iの評価ポイントを取得できる。   Next, if the designated evaluation item is “high search frequency” or “low search frequency”, the statistics / evaluation module 15 refers to the search hit field of the log information table 160 for each search. In addition, for each database 11i, it is determined whether the search frequency is high or the search frequency is low. Here, if the ratio of hit documents in one search with respect to the total number of documents in the database 11i is equal to or greater than the first threshold, it is determined that the search frequency of the database 11i is high. If the ratio of hit documents is less than the first threshold, it is determined that the search frequency of the database 11i is low. Then, every time it is determined that the search frequency of the database 11i is high, the operation of incrementing the evaluation point “high search frequency” by 1 is executed for the column of the log information table 160 in the designated evaluation period. Thereby, the evaluation point of the said database 11i regarding evaluation item "search frequency is high" can be acquired. Similarly, every time it is determined that the search frequency of the database 11i is low, the operation of incrementing the evaluation point “low search frequency” by 1 is executed for the column of the log information table 160 in the designated evaluation period. Thereby, the evaluation point of the said database 11i regarding evaluation item "search frequency is low" can be acquired.

次に、指定評価項目が「更新頻度が高い」または「更新頻度が低い」であるならば、統計・評価モジュール15は、情報収集が行われた際のログ情報テーブル160の更新フィールドを参照して、各データベース11iの文書毎に、指定の評価期間において当該文書が更新された回数(更新回数)をカウントする。そして統計・評価モジュール15は、指定の評価期間における更新回数が平均更新回数以上である文書を検出する毎に、対応するデータベース11iの「更新頻度が高い」ことを示す評価ポイントを1インクリメントする。これにより、評価項目「更新頻度が高い」に関する当該データベース11iの評価ポイントを取得できる。平均更新回数には、データベース11i内の文書毎の更新回数の総和を、データベース11i内で1度でも更新された文書の総数で除した値が用いられる。また統計・評価モジュール15は、指定の評価期間における更新回数が平均更新回数未満である文書を検出する毎に、対応するデータベース11iの「更新頻度が低い」ことを示す評価ポイントを1インクリメントする。これにより、評価項目「更新頻度が低い」に関する当該データベース11iの評価ポイントを取得できる。   Next, if the designated evaluation item is “update frequency is high” or “update frequency is low”, the statistics / evaluation module 15 refers to the update field of the log information table 160 when information is collected. Thus, for each document in each database 11i, the number of times the document has been updated in the designated evaluation period (number of updates) is counted. Each time the statistical / evaluation module 15 detects a document whose number of updates in the specified evaluation period is equal to or greater than the average number of updates, the statistics / evaluation module 15 increments the evaluation point indicating that the update frequency is high in the corresponding database 11i by one. Thereby, the evaluation point of the said database 11i regarding evaluation item "update frequency is high" can be acquired. As the average number of updates, a value obtained by dividing the total number of updates for each document in the database 11i by the total number of documents updated even once in the database 11i is used. Further, each time the statistical / evaluation module 15 detects a document whose number of updates in the specified evaluation period is less than the average number of updates, the statistics / evaluation module 15 increments the evaluation point indicating that the update frequency is low in the corresponding database 11i by one. Thereby, the evaluation point of the said database 11i regarding evaluation item "update frequency is low" can be acquired.

次に、指定評価項目が「スコアが高い」または「スコアが低い」であるならば、統計・評価モジュール15は、ログ情報テーブル160のスコアフィールドを参照して、各データベース11iの文書毎に、指定の評価期間において当該文書が第2の閾値以上のスコアとなった回数または第2の閾値未満のスコアとなった回数をカウントする。このカウント値を、データベース11iの全文書について累計すると、評価項目「スコアが高い」または「スコアが低い」に関する当該データベース11iの評価ポイントを取得できる。   Next, if the designated evaluation item is “score is high” or “score is low”, the statistic / evaluation module 15 refers to the score field of the log information table 160 for each document in each database 11i. The number of times that the document has a score equal to or higher than the second threshold in the designated evaluation period is counted. By accumulating the count values for all the documents in the database 11i, the evaluation points of the database 11i regarding the evaluation item “score is high” or “score is low” can be acquired.

次に、指定評価項目が「アクセス頻度が高い」または「アクセス頻度が低い」であるならば、統計・評価モジュール15は、情報収集が行われた際のログ情報テーブル160のアクセスフィールドを参照して、各データベース11iの文書毎に、指定の評価期間において当該文書がアクセス(参照)された回数(アクセス回数)をカウントする。そして統計・評価モジュール15は、指定の評価期間におけるアクセス回数が平均アクセス回数以上である文書を検出する毎に、対応するデータベース11iの「アクセス頻度が高い」ことを示す評価ポイントを1インクリメントする。これにより、評価項目「アクセス頻度が高い」に関する当該データベース11iの評価ポイントを取得できる。平均アクセス回数には、データベース11i内の文書毎のアクセス回数の総和を、データベース11i内で1度でもアクセスされた文書の総数で除した値が用いられる。また統計・評価モジュール15は、指定の評価期間におけるアクセス回数が平均アクセス回数未満である文書を検出する毎に、対応するデータベース11iの「アクセス頻度が低い」ことを示す評価ポイントを1インクリメントする。これにより、評価項目「アクセス頻度が低い」に関する当該データベース11iの評価ポイントを取得できる。   Next, when the designated evaluation item is “access frequency is high” or “access frequency is low”, the statistics / evaluation module 15 refers to the access field of the log information table 160 when information is collected. Thus, for each document in each database 11i, the number of times the document is accessed (referenced) in the designated evaluation period (number of accesses) is counted. Each time the statistics / evaluation module 15 detects a document whose number of accesses in the specified evaluation period is equal to or greater than the average number of accesses, the statistics / evaluation module 15 increments the evaluation point indicating that the access frequency is high in the corresponding database 11i by one. Thereby, the evaluation point of the said database 11i regarding evaluation item "access frequency is high" can be acquired. For the average access count, a value obtained by dividing the total access count for each document in the database 11i by the total number of documents accessed even once in the database 11i is used. Further, each time the statistical / evaluation module 15 detects a document whose access count in the specified evaluation period is less than the average access count, the statistics / evaluation module 15 increments an evaluation point indicating “access frequency is low” in the corresponding database 11 i by one. Thereby, the evaluation point of the said database 11i regarding evaluation item "access frequency is low" can be acquired.

統計・評価モジュール15は、データベース11i(i=A,B)毎に、指定の評価項目について評価ポイントを取得すると、その評価ポイントに基づいて、データベース11i毎の評価値(統計評価値)Riを算出する。この評価値Riは、次式(1)
Ri=W1f1+W2f2+W3f3…+Wnfn (1)
で表される。ここで、nは適用する評価項目の個数である。本実施例において、n=4であり、W1f1、W2f2、W3f3及びWnfn(=W4f4)は、それぞれ、「アクセス頻度が高い」、「アクセス頻度が低い」、「役に立つ」及び「役に立たない」の各評価項目毎の評価値を表し、W1,W2,W3,W4は、それぞれ対応する評価項目の重みを表す。
When the statistics / evaluation module 15 obtains evaluation points for the designated evaluation item for each database 11i (i = A, B), the evaluation value (statistical evaluation value) Ri for each database 11i is obtained based on the evaluation points. calculate. This evaluation value Ri is given by the following formula (1)
Ri = W1f1 + W2f2 + W3f3... + Wnfn (1)
It is represented by Here, n is the number of evaluation items to be applied. In this embodiment, n = 4, and W1f1, W2f2, W3f3 and Wnfn (= W4f4) are “high access frequency”, “low access frequency”, “useful”, and “useless”, respectively. The evaluation value for each evaluation item is represented, and W1, W2, W3, and W4 represent the weights of the corresponding evaluation items.

式(1)において、fnは、
fn=データベース11iの文書数×log(全データベースの平均文書数) (2)
で表される。また、重みW1,W2,W3,W4をWで代表させると、重みWは
W=(評価ポイント×評価係数)/f(x) (3)
で表される。ここでf(x)は全データベースに対して正規化した文書数、例えば1データベースの平均文書数を表す。また、評価係数は、評価項目に固有の値である。
In the formula (1), fn is
fn = number of documents in database 11i × log (average number of documents in all databases) (2)
It is represented by If the weights W1, W2, W3, and W4 are represented by W, the weight W is W = (evaluation point × evaluation coefficient) / f (x) (3)
It is represented by Here, f (x) represents the number of documents normalized with respect to all databases, for example, the average number of documents in one database. The evaluation coefficient is a value specific to the evaluation item.

図5は、本実施形態で適用される10種類の評価項目と、その評価項目毎に予め定められた評価係数の一例を示す。   FIG. 5 shows an example of 10 types of evaluation items applied in the present embodiment and evaluation coefficients predetermined for each evaluation item.

統計・評価モジュール15は、上述のようにして算出されたデータベース11i毎の評価値Riをデータベース情報提示モジュール17に送信する(ステップS16)。データベース情報提示モジュール17は、統計・評価モジュール15によって送信されたデータベース11i毎の評価値Riを受信すると、当該データベース11i毎の評価値Riを運用管理クライアント18を介して管理者に提示する(ステップS17)。このとき、データベース11i毎の評価値Riを、評価値の高い順または低い順にソートして提示するならば、管理者は各データベース11iが有効に利用されている順位または有効に利用されていない順位を簡単に視認できる。また、評価値の高い順または低い順のいずれで提示するかは、管理者から指定可能とすると良い。このデータベース11i毎の評価値Ri、つまりデータベース11i毎の利用状況の統計的な評価結果から、運用管理クライアント18のユーザである管理者は、有効に利用されているデータベース、或は有効に利用されていないデータベースを判別することができる。データベース11i毎の評価値Riは、有効に利用されていないデータベースを削除するときの目安となる。これにより、運用管理のコストを削減できる。   The statistics / evaluation module 15 transmits the evaluation value Ri for each database 11i calculated as described above to the database information presentation module 17 (step S16). Upon receiving the evaluation value Ri for each database 11i transmitted by the statistics / evaluation module 15, the database information presentation module 17 presents the evaluation value Ri for each database 11i to the administrator via the operation management client 18 (step S17). At this time, if the evaluation values Ri for each database 11i are sorted and presented in the order of high or low evaluation value, the administrator ranks the databases 11i that are used effectively or ranks that are not used effectively. Is easily visible. Also, it is preferable that the administrator can specify whether the evaluation values are presented in order of high or low. From the evaluation value Ri for each database 11i, that is, the statistical evaluation result of the usage situation for each database 11i, the administrator who is the user of the operation management client 18 is the database that is used effectively or is used effectively. Can determine which database is not. The evaluation value Ri for each database 11i is a measure for deleting a database that is not being used effectively. Thereby, the cost of operation management can be reduced.

勿論、データベース情報提示モジュール17または運用管理クライアント18がデータベース11i毎の評価値Riを閾値と比較することで、有効に利用されているデータベース、或は有効に利用されていないデータベースを自動判別することも可能である。   Of course, the database information presentation module 17 or the operation management client 18 automatically determines the database that is used effectively or the database that is not used effectively by comparing the evaluation value Ri for each database 11i with a threshold value. Is also possible.

明らかなように、上述の例では、「アクセス頻度が高い」評価値及び「役に立つ」評価値がより高く、「アクセス頻度が低い」評価値及び「役に立たない」評価値の絶対値がより低いデータベース11iほど、評価値Riは高くなる。   As is apparent, in the above-described example, a database having a higher “access frequency” evaluation value and a “useful” evaluation value, and a lower absolute value of a “less access” evaluation value and a “useless” evaluation value. The evaluation value Ri increases as 11i increases.

上記第1の実施形態では、データベース11iの評価値Riの算出に、評価項目として、「アクセス頻度が高い」、「アクセス頻度が低い」、「役に立つ」及び「役に立たない」の4種が適用されている。しかし、図4に示す任意の評価項目を単独で、或は複数組み合わせて用いることもできる。例えば、運用管理クライアント18から、評価項目として「スコアが高い」が指定された場合、つまり「スコアが高いデータが多いデータベース」に対する評価順の提示が指定された場合、統計・評価モジュール15では、「スコアが高い」のみに着目して、データベース11i毎の評価値Riが算出される。このデータベース11i毎の評価値Riは、統計・評価ログデータベース16によって運用管理クライアント18に提示される。これにより管理者は、「スコアが高いデータが多いデータベース」の観点で評価された、データベース11i毎の評価結果(評価値Ri)から、有効に利用されているデータベースを判別することができる。また、評価項目として、例えば「アクセス頻度が高い」、「アクセス頻度が低い」、「更新頻度が高い」及び「更新頻度が低い」を適用して、データベース11i毎の評価値Riを算出するならば、アクセス頻度が低く、且つ更新頻度が低い(つまり古い文書が多い)データベースを削除するときの目安とすることができる。   In the first embodiment, four types of evaluation items “high access frequency”, “low access frequency”, “useful”, and “useless” are applied to the calculation of the evaluation value Ri of the database 11i. ing. However, the arbitrary evaluation items shown in FIG. 4 can be used alone or in combination. For example, when “high score” is designated as the evaluation item from the operation management client 18, that is, when presentation of evaluation order for “database with many data having high scores” is designated, the statistics / evaluation module 15 Focusing on only “high score”, the evaluation value Ri for each database 11i is calculated. The evaluation value Ri for each database 11 i is presented to the operation management client 18 by the statistics / evaluation log database 16. Thereby, the administrator can discriminate the database that is used effectively from the evaluation result (evaluation value Ri) for each database 11i evaluated from the viewpoint of "a database with many data with high scores". Further, when the evaluation value Ri for each database 11i is calculated by applying, for example, “high access frequency”, “low access frequency”, “high update frequency”, and “low update frequency” as evaluation items. For example, it can be used as a guideline for deleting a database with low access frequency and low update frequency (that is, many old documents).

また上記第1の実施形態では、運用管理クライアント18からの要求に応じて、データベース情報提示モジュール17から運用管理クライアント18に、データベース11i毎の評価値Riが送信される構成を適用している。しかし、予め運用管理クライアント18から指定された評価項目を適用して、予め定められたタイミング毎に、例えば一定期間毎に、各データベース11iの評価値Riを統計・評価モジュール15が算出することにより、データベース情報提示モジュール17から運用管理クライアント18に、データベース11i毎の評価値Riが定期的に送信される構成とすることもできる。   In the first embodiment, a configuration in which the evaluation value Ri for each database 11 i is transmitted from the database information presentation module 17 to the operation management client 18 in response to a request from the operation management client 18 is applied. However, the statistical / evaluation module 15 calculates the evaluation value Ri of each database 11i by applying the evaluation items designated in advance by the operation management client 18 at predetermined timings, for example, at regular intervals. The evaluation value Ri for each database 11i can be periodically transmitted from the database information presentation module 17 to the operation management client 18.

また上記第1の実施形態では、評価値Riの算出に用いられるログ情報の期間(評価期間)が運用管理クライアント18から指定可能なようになっている。この評価期間の指定の意義について以下に説明する。例えば、データベース11iが構築されてから現在までの「全期間」におけるログ情報に基づく評価値Riと、当該全期間内の「ある特定の期間」におけるログ情報に基づく評価値Riとは異なる。   Further, in the first embodiment, the period (evaluation period) of log information used for calculating the evaluation value Ri can be designated from the operation management client 18. The significance of designation of this evaluation period will be described below. For example, the evaluation value Ri based on the log information in “all periods” from when the database 11i is constructed to the present is different from the evaluation value Ri based on the log information in “a specific period” within the entire period.

そこで上記第1の実施形態では、ログ情報の時間軸方向の変化の傾向を考慮して評価値Riが算出される。ここでは、あるデータベース11iに対して「役に立つ」に対する評価値Riを算出することを想定する。   Therefore, in the first embodiment, the evaluation value Ri is calculated in consideration of the tendency of the log information to change in the time axis direction. Here, it is assumed that an evaluation value Ri for “useful” is calculated for a certain database 11i.

まず、データベース11iが作成されてから現在までのX年間(Xは例えば2以上の整数)に「役に立つ」と評価された文書数が3000件であり、X年間のうちの最近の1年間で「役に立つ」と評価された文書数が2000件、全データベースに対して正規化した文書数(例えば1データベースの平均文書数)が2000であったものとする。   First, the number of documents evaluated as “useful” in the X years (X is an integer of 2 or more, for example) from the creation of the database 11i to the present is 3,000. Assume that the number of documents evaluated as “useful” is 2000, and the number of documents normalized to all databases (for example, the average number of documents in one database) is 2000.

この場合、時間軸方向の変化の傾向を考慮しないと、評価値Riは
Ri =(「役に立つ」と評価された文書数3000×「役に立つ」の評価係数3)
/全データベースに対して正規化した文書数2000
=4.5
となる。
In this case, if the change tendency in the time axis direction is not taken into consideration, the evaluation value Ri is Ri = (the number of documents evaluated as “useful” 3000 × evaluation coefficient 3 of “useful”)
/ 2000 documents normalized to all databases
= 4.5
It becomes.

一方、時間軸方向の変化の傾向を考慮して、X年間のうちの最近の1年間に着目すると、
Ri =(「役に立つ」と評価された文書数2000×「役に立つ」の評価係数3)
/全データベースに対して正規化した文書数2000
=3
となる。
On the other hand, considering the trend of change in the time axis direction, focusing on the most recent year of X years,
Ri = (the number of documents evaluated as “useful” 2000 × evaluation coefficient 3 of “useful”)
/ 2000 documents normalized to all databases
= 3
It becomes.

この違いは、最近の1年間は、データベース11iに登録された文書は、「役に立つ」と評価される度合いが、それ以前に比べて減少する傾向にあることを表している。   This difference indicates that the degree that documents registered in the database 11i are evaluated as “useful” tends to decrease compared to before that in the last one year.

ここで、時間軸方向の変化の傾向を考慮して、評価期間を「ある特定の期間」に限定することの利点について述べる。
まず、図1中のデータベース11A,11Bに登録されている文書の数が同一であり、アクセス頻度に関し、それぞれ
データベース11A:過去1年前まではアクセス頻度が高い
データベース11B:過去1年前まではアクセス頻度が低いが、最近の1年間はアクセス頻度が高い
のような傾向があるものとする。
Here, the advantages of limiting the evaluation period to “a specific period” in consideration of the tendency of change in the time axis direction will be described.
First, the number of documents registered in the databases 11A and 11B in FIG. 1 is the same, and the access frequency is high. Database 11A: Access frequency is high until one year ago Database 11B: Until the past one year It is assumed that the access frequency is low, but there is a tendency that the access frequency is high in the recent one year.

ここで、時間軸方向の変化の傾向を考慮しないで、データベース11A,11Bが作成されてから現在までの期間における当該データベース11A,11Bの評価値RA,RBを算出した結果、
データベース11Aの評価値RA =5
データベース11Bの評価値RB =4
が取得されたものとする。この場合、評価値RA>評価値RBのため、データベース11Aの方が有効なデータベースとして判断されることになる。
Here, as a result of calculating the evaluation values RA and RB of the databases 11A and 11B in the period from the creation of the databases 11A and 11B to the present without considering the change tendency in the time axis direction,
Evaluation value RA of database 11A = 5
Evaluation value RB = 4 of database 11B
Is acquired. In this case, since the evaluation value RA> the evaluation value RB, the database 11A is determined as a more effective database.

しかし、管理者によっては、データベース11A,11Bが作成されてから現在までの期間の評価値よりも、最近1年間の評価値からアクセス頻度が高いデータベースを判別した方が有効であると考えられる。そこで、最近の1年間を評価期間として評価値RA及びRBを算出した結果、上述の傾向から、例えば
データベース11Aの評価値RA =4.2
データベース11Bの評価値RB =4.8
となったものとする。この場合、最近の1年間に絞って評価した場合には、データベース11Bの方が有効であるという結果が得られる。このように、管理者の操作に応じて運用管理クライアント18から評価期間を指定可能とすることで、管理者毎に、より有効なデータベースを使い分けることができるようになる。なお、1年単位、或は半年単位など、一定期間毎の評価値を算出して、その評価値の変化の傾向を管理者に提示することも可能である。
However, depending on the administrator, it may be more effective to discriminate a database having a high access frequency from the evaluation values of the last one year than the evaluation values in the period from the creation of the databases 11A and 11B to the present. Therefore, as a result of calculating the evaluation values RA and RB with the latest one year as the evaluation period, the evaluation value RA of the database 11A, for example, is 4.2 from the above tendency.
Evaluation value RB of database 11B = 4.8
Suppose that In this case, when the evaluation is focused on the latest one year, a result that the database 11B is more effective is obtained. Thus, by making it possible to designate the evaluation period from the operation management client 18 in accordance with the operation of the administrator, it becomes possible to use a more effective database for each administrator. It is also possible to calculate an evaluation value for each fixed period, such as a year unit or a half year unit, and present the change tendency of the evaluation value to the administrator.

[第2の実施形態]
上記第1の実施形態では、データベース11i毎の評価値Riがデータベース情報提示モジュール17によって運用管理クライアント18を介して管理者に提示される。管理者は、提示されたデータベース11i毎の評価値Riを、有効に利用されていないデータベースを削除するときの目安とすることができる。しかし、データベース11i毎の評価値Riを管理者に提示する代わりに、データベース11i毎の評価値Riから、データベースの自動更新頻度を変更する構成とすることも可能である。
[Second Embodiment]
In the first embodiment, the evaluation value Ri for each database 11 i is presented to the administrator by the database information presentation module 17 via the operation management client 18. The administrator can use the presented evaluation value Ri for each database 11i as a guideline when deleting a database that is not being used effectively. However, instead of presenting the evaluation value Ri for each database 11i to the administrator, it is possible to change the automatic update frequency of the database from the evaluation value Ri for each database 11i.

そこで、データベースの自動更新を実現する本発明の第2の実施形態について図面を参照して説明する。図6は本発明の第2の実施形態に係る情報検索システムの構成を示すブロック図である。図6において、図1と等価な構成要素には同一符号を付してある。   Therefore, a second embodiment of the present invention that realizes automatic database update will be described with reference to the drawings. FIG. 6 is a block diagram showing a configuration of an information search system according to the second embodiment of the present invention. In FIG. 6, components equivalent to those in FIG.

図6のシステムが、図1のシステムと異なる主要な点は、データベース情報提示モジュール17及び運用管理クライアント18に代えて、自動更新モジュール19が用いられている点にある。この自動更新モジュール19は、統計・評価モジュール15によって算出されるデータベース11i毎の評価値Riから、当該データベース11i毎の収集モジュール12iによる情報の自動収集条件、例えば自動更新頻度(自動収集頻度)を決定(変更)する。そのために自動更新モジュール19は、データベース11i毎の評価値Riを統計・評価モジュール15から受信する。そして自動更新モジュール19は、データベース11i毎の評価値Riから、例えばアクセス頻度が低いデータベースに対しては自動更新頻度を減らし、アクセス頻度の高いデータベースに対しては自動更新頻度を増やすように、収集モジュール12A及び12Bを制御する。これにより、検索クライアント13のユーザは常に最新の有効なデータを検索することができ、運用管理のコストをより一層削減できる。この他に、アクセス頻度の高低に応じて、収集対象(収集範囲)を広げる、或は収集対象を狭めるように、収集モジュール12A及び12Bを制御することも可能である。   6 is different from the system of FIG. 1 in that an automatic update module 19 is used in place of the database information presentation module 17 and the operation management client 18. The automatic update module 19 calculates an automatic collection condition of information by the collection module 12i for each database 11i, for example, an automatic update frequency (automatic collection frequency) from the evaluation value Ri for each database 11i calculated by the statistics / evaluation module 15. Decide (change). For this purpose, the automatic update module 19 receives an evaluation value Ri for each database 11 i from the statistics / evaluation module 15. Then, the automatic update module 19 collects from the evaluation value Ri for each database 11i so as to reduce the automatic update frequency for a database with low access frequency, for example, and increase the automatic update frequency for a database with high access frequency. Controls modules 12A and 12B. Thus, the user of the search client 13 can always search for the latest valid data, and the operation management cost can be further reduced. In addition, it is also possible to control the collection modules 12A and 12B so that the collection target (collection range) is expanded or the collection target is narrowed according to the access frequency.

また、図6のシステムに、図1に示したデータベース情報提示モジュール17及び運用管理クライアント18を追加して、データベース11i毎の評価値Riをデータベース情報提示モジュール17によって運用管理クライアント18を介して管理者に提示するようにしても構わない。   Further, the database information presentation module 17 and the operation management client 18 shown in FIG. 1 are added to the system of FIG. 6, and the evaluation value Ri for each database 11 i is managed by the database information presentation module 17 via the operation management client 18. You may make it show to a person.

なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。   Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Further, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, you may combine suitably the component covering different embodiment.

本発明の第1の実施形態に係る情報検索システムの構成を示すブロック図。1 is a block diagram showing a configuration of an information search system according to a first embodiment of the present invention. 同実施形態における動作の手順を示すシーケンスチャート。The sequence chart which shows the procedure of the operation | movement in the embodiment. 図1中の検索結果テーブル140のデータ構造例を示す図。The figure which shows the data structure example of the search result table 140 in FIG. 図1中のログ情報テーブル160のデータ構造例を示す図。The figure which shows the example of a data structure of the log information table 160 in FIG. 同実施形態で適用される10種類の評価項目と、その評価項目毎に予め定められた評価係数の一例を示す図。The figure which shows an example of 10 types of evaluation items applied in the embodiment, and an evaluation coefficient predetermined for each evaluation item. 本発明の第2の実施形態に係る情報検索システムの構成を示すブロック図。The block diagram which shows the structure of the information search system which concerns on the 2nd Embodiment of this invention.

符号の説明Explanation of symbols

11A,11B…データベース、12A,12B…収集モジュール、13…検索クライアント、14…検索サーバ、15…統計・評価モジュール、16…統計・評価ログデータベース(ログ保存手段)、17…データベース情報提示モジュール、18…運用管理クライアント、19…自動更新モジュール、21A,21B…外部データソース、140…検索結果テーブル、160…ログ情報テーブル。   11A, 11B ... database, 12A, 12B ... collection module, 13 ... search client, 14 ... search server, 15 ... statistics / evaluation module, 16 ... statistics / evaluation log database (log storage means), 17 ... database information presentation module, 18 ... Operation management client, 19 ... Automatic update module, 21A, 21B ... External data source, 140 ... Search result table, 160 ... Log information table.

Claims (10)

異なるデータソースから収集された情報が登録された複数のデータベースと、
ユーザからの検索要求で指定された検索条件に従って前記複数のデータベースの少なくとも1つから当該検索条件に合致するデータを検索して、その検索結果を前記ユーザに提示する検索サーバと、
前記検索サーバによる検索の履歴を含む、前記複数のデータベース各々の利用状況の履歴を保存するログ保存手段と、
前記ログ保存手段に保存されている前記複数のデータベース各々の利用状況の履歴に基づいて、前記複数のデータベース各々の利用状況の統計情報を生成し、当該統計情報に基づいて前記複数のデータベース各々の利用状況を評価する統計・評価手段と、
前記統計・評価手段による前記複数のデータベース各々の利用状況の評価結果を管理者に提示するデータベース情報提示手段とを具備し、
前記統計・評価手段は、データベース毎に、複数種の評価項目の各々について前記統計情報に基づく評価ポイントを得るとともに、得られた各評価ポイントに基づいてデータベース毎の評価値を算出する手段を具備し、
前記評価値は、評価項目毎に、当該評価項目の評価ポイントに応じた重み係数と、当該データベースの文書数に全データベースの平均文書数の対数を乗じて得られる値とを乗算して得られる値を、評価項目毎に加算して得られる値であることを特徴とするデータベース運用管理支援機能を有する情報検索システム。
Multiple databases with information collected from different data sources,
A search server that searches for data matching the search condition from at least one of the plurality of databases according to the search condition specified in the search request from the user, and presents the search result to the user;
Log storage means for storing a history of usage of each of the plurality of databases, including a history of searches by the search server;
Based on the history of the usage status of each of the plurality of databases stored in the log storage means, generates statistical information on the usage status of each of the plurality of databases, and based on the statistical information, Statistics / evaluation means to evaluate usage,
Database information presenting means for presenting an evaluation result of the usage status of each of the plurality of databases by the statistics / evaluation means to an administrator ;
The statistics / evaluation means includes means for obtaining an evaluation point based on the statistical information for each of a plurality of types of evaluation items for each database and calculating an evaluation value for each database based on the obtained evaluation points. And
The evaluation value is obtained by multiplying, for each evaluation item, a weight coefficient corresponding to the evaluation point of the evaluation item and a value obtained by multiplying the number of documents in the database by the logarithm of the average number of documents in all databases. An information search system having a database operation management support function, characterized in that a value is obtained by adding a value for each evaluation item .
前記ログ保存手段に保存される前記複数のデータベース各々の利用状況の履歴は、当該複数のデータベース各々における登録情報毎の履歴であって、検索条件に合致したか否かを示す検索ヒット有無情報、更新の有無を示す更新有無情報、検索条件に合致する程度を表すスコア、検索された情報がユーザによって選択されて参照されたか否かを示すアクセス有無情報、及びユーザによって参照された情報に対する当該ユーザの評価を示す評価情報のうちから選択された複数の履歴を含み、
前記統計・評価手段は、前記検索ヒット有無情報に対応する検索頻度、前記更新有無情報に対応する更新頻度、前記スコア、前記アクセス有無情報に対応するアクセス頻度、及び前記評価情報に対応するユーザ評価を含む複数の評価項目のうち、前記選択された複数の履歴に対応する評価項目の中から、管理者によって選択指定された少なくとも1つの評価項目を受け付けて、前記複数のデータベース各々の利用状況の履歴のうち、当該指定された評価項目に対応する情報に基づいて、当該指定された評価項目に関する前記複数のデータベース各々の利用状況の統計情報を生成し、当該統計情報に基づいて前記複数のデータベース各々の利用状況を評価する
ことを特徴とする請求項1記載のデータベース運用管理支援機能を有する情報検索システム。
The usage history history of each of the plurality of databases stored in the log storage means is a history for each registered information in each of the plurality of databases, and search hit presence / absence information indicating whether or not a search condition is satisfied, Update presence / absence information indicating the presence / absence of update, a score indicating the degree of matching with the search condition, access presence / absence information indicating whether or not the searched information is selected and referred to by the user, and the user referred to by the user Including multiple histories selected from the evaluation information indicating the evaluation of
The statistics / evaluation means includes a search frequency corresponding to the search hit presence information, an update frequency corresponding to the update presence information, the score, an access frequency corresponding to the access presence information, and a user evaluation corresponding to the evaluation information And receiving at least one evaluation item selected and designated by an administrator from among the evaluation items corresponding to the selected plurality of histories. Based on the information corresponding to the designated evaluation item in the history, the usage information of each of the plurality of databases related to the designated evaluation item is generated, and the plurality of databases is generated based on the statistical information. The information retrieval system having a database operation management support function according to claim 1, wherein each usage situation is evaluated. Stem.
前記統計・評価手段は、前記複数のデータベース各々の利用状況の評価結果が時間軸方向の変化の傾向を表すように、前記複数のデータベース各々の利用状況を評価することを特徴とする請求項1記載のデータベース運用管理支援機能を有する情報検索システム。   2. The statistics / evaluation unit evaluates the usage status of each of the plurality of databases so that the evaluation result of the usage status of each of the plurality of databases represents a tendency of change in a time axis direction. An information search system having the described database operation management support function. 前記統計・評価手段による前記複数のデータベース各々の利用状況の評価結果に基づいて、前記複数のデータベースのうち評価の低いデータベースを自動的に削除する自動削除手段を更に具備することを特徴とする請求項1記載のデータベース運用管理支援機能を有する情報検索システム。   The system further comprises an automatic deletion unit that automatically deletes a database having a low evaluation among the plurality of databases based on an evaluation result of a usage situation of each of the plurality of databases by the statistics / evaluation unit. An information retrieval system having the database operation management support function according to Item 1. 前記統計・評価手段による前記複数のデータベース各々の利用状況の評価結果に基づいて、前記複数のデータベースのうち評価の低いデータベースを削除することを管理者に促す手段を更に具備することを特徴とする請求項1記載のデータベース運用管理支援機能を有する情報検索システム。 The system further comprises means for urging an administrator to delete a database having a low evaluation from the plurality of databases based on the evaluation result of the usage status of each of the plurality of databases by the statistics / evaluation means. An information retrieval system having the database operation management support function according to claim 1 . 設定された情報収集条件に従って、前記異なるデータソースから情報を収集し、その収集された情報を当該データソースに対応する前記データベースに登録する情報収集手段と、
前記統計・評価手段による前記複数のデータベース各々の利用状況の評価結果に基づいて、前記情報収集条件を変更する自動更新手段と
を更に具備することを特徴とする請求項1記載のデータベース運用管理支援機能を有する情報検索システム。
Information collecting means for collecting information from the different data sources according to set information collecting conditions and registering the collected information in the database corresponding to the data sources;
2. The database operation management support according to claim 1 , further comprising: an automatic update unit that changes the information collection condition based on an evaluation result of a usage situation of each of the plurality of databases by the statistics / evaluation unit. Information retrieval system with functions.
設定された情報収集条件に従って、前記異なるデータソースから情報を収集し、その収集された情報を当該データソースに対応する前記データベースに登録する情報収集手段と、
前記統計・評価手段による前記複数のデータベース各々の利用状況の評価結果に基づいて、前記情報収集条件の変更を管理者に促す手段と
を具備することを特徴とする請求項1記載のデータベース運用管理支援機能を有する情報検索システム。
Information collecting means for collecting information from the different data sources according to set information collecting conditions and registering the collected information in the database corresponding to the data sources;
The database operation management according to claim 1 , further comprising means for prompting an administrator to change the information collection condition based on an evaluation result of the usage status of each of the plurality of databases by the statistics / evaluation means. An information retrieval system having a support function.
異なるデータソースから収集された情報が登録された複数のデータベースと、
ユーザからの検索要求で指定された検索条件に従って前記複数のデータベースの少なくとも1つから当該検索条件に合致するデータを検索して、その検索結果を前記ユーザに提示する検索サーバと、
前記検索サーバによる検索の履歴を含む、前記複数のデータベース各々の利用状況の履歴を保存するログ保存手段と、
前記ログ保存手段に保存されている前記複数のデータベース各々の利用状況の履歴に基づいて、前記複数のデータベース各々の利用状況の統計情報を生成し、当該統計情報に基づいて前記複数のデータベース各々の利用状況を評価する統計・評価手段と、
設定された情報収集条件に従って、前記異なるデータソースから情報を収集し、その収集された情報を当該データソースに対応する前記データベースに登録する情報収集手段と、
前記統計・評価手段による前記複数のデータベース各々の利用状況の評価結果に基づいて、前記情報収集条件を変更する自動更新手段と
を具備し、
前記統計・評価手段は、データベース毎に、複数種の評価項目の各々について前記統計情報に基づく評価ポイントを得るとともに、得られた各評価ポイントに基づいてデータベース毎の評価値を算出する手段を具備し、
前記評価値は、評価項目毎に、当該評価項目の評価ポイントに応じた重み係数と、当該データベースの文書数に全データベースの平均文書数の対数を乗じて得られる値とを乗算して得られる値を、評価項目毎に加算して得られる値であることを特徴とするデータベース運用管理支援機能を有する情報検索システム。
Multiple databases with information collected from different data sources,
A search server that searches for data matching the search condition from at least one of the plurality of databases according to the search condition specified in the search request from the user, and presents the search result to the user;
Log storage means for storing a history of usage of each of the plurality of databases, including a history of searches by the search server;
Based on the history of the usage status of each of the plurality of databases stored in the log storage means, generates statistical information on the usage status of each of the plurality of databases, and based on the statistical information, Statistics / evaluation means to evaluate usage,
Information collecting means for collecting information from the different data sources according to set information collecting conditions and registering the collected information in the database corresponding to the data sources;
Automatic update means for changing the information collection condition based on the evaluation results of the usage status of each of the plurality of databases by the statistics / evaluation means ,
The statistics / evaluation means includes means for obtaining an evaluation point based on the statistical information for each of a plurality of types of evaluation items for each database and calculating an evaluation value for each database based on the obtained evaluation points. And
The evaluation value is obtained by multiplying, for each evaluation item, a weight coefficient corresponding to the evaluation point of the evaluation item and a value obtained by multiplying the number of documents in the database by the logarithm of the average number of documents in all databases. An information search system having a database operation management support function, characterized in that a value is obtained by adding a value for each evaluation item .
ユーザからの検索要求で指定された検索条件に従って、異なるデータソースから収集された情報が登録された複数のデータベースの少なくとも1つから当該検索条件に合致するデータを検索して、その検索結果を前記ユーザに提示する情報検索システムにおいて、前記複数のデータベースの運用を管理するデータベース運用管理方法であって、
統計・評価手段が、前記ユーザからの検索要求で指定された検索条件に従う検索の都度、当該検索で取得される情報を当該検索の対象となった前記データベースの利用状況の履歴の一部としてログ保存手段に保存するステップと、
前記統計・評価手段が、前記ログ保存手段に保存されている前記複数のデータベース各々の利用状況の履歴に基づいて、前記複数のデータベース各々の利用状況の統計情報を生成するステップと、
前記統計・評価手段が、生成された前記複数のデータベース各々の利用状況の統計情報に基づいて前記複数のデータベース各々の利用状況を評価するステップと、
データベース情報提示手段が、前記複数のデータベース各々の利用状況の評価結果を管理者に提示するステップと
を具備し、
前記統計・評価手段が評価するステップは、データベース毎に、複数種の評価項目の各々について前記統計情報に基づく評価ポイントを得るとともに、得られた各評価ポイントに基づいてデータベース毎の評価値を算出するステップを具備し、
前記評価値は、評価項目毎に、当該評価項目の評価ポイントに応じた重み係数と、当該データベースの文書数に全データベースの平均文書数の対数を乗じて得られる値とを乗算して得られる値を、評価項目毎に加算して得られる値であることを特徴とするデータベース運用管理方法。
In accordance with a search condition specified by a search request from a user, data that matches the search condition is searched from at least one of a plurality of databases in which information collected from different data sources is registered, and the search result is In an information search system presented to a user, a database operation management method for managing operations of the plurality of databases,
Each time the search according to the search condition specified by the search request from the user is performed by the statistics / evaluation means, the information acquired by the search is logged as a part of the history of the usage status of the database subjected to the search. Storing in the storage means;
The statistical / evaluation means , based on a history of usage status of each of the plurality of databases stored in the log storage means, generating statistical information of usage status of each of the plurality of databases;
The statistic / evaluation means evaluating the usage status of each of the plurality of databases based on the generated statistical information of the usage status of each of the plurality of databases;
Database information presenting means comprising the step of presenting to the administrator the evaluation results of the usage status of each of the plurality of databases ,
The step of evaluating by the statistical / evaluation means obtains an evaluation point based on the statistical information for each of a plurality of types of evaluation items for each database, and calculates an evaluation value for each database based on the obtained evaluation points. Comprising the steps of:
The evaluation value is obtained by multiplying, for each evaluation item, a weight coefficient corresponding to the evaluation point of the evaluation item and a value obtained by multiplying the number of documents in the database by the logarithm of the average number of documents in all databases. A database operation management method characterized by being a value obtained by adding a value for each evaluation item .
前記複数のデータベース各々の利用状況の履歴は、当該複数のデータベース各々における登録情報毎の履歴であって、検索条件に合致したか否かを示す検索ヒット有無情報、検索条件に合致する程度を表すスコア、検索された情報がユーザによって選択されて参照されたか否かを示すアクセス有無情報、及びユーザによって参照された情報に対する当該ユーザの評価を示す評価情報のうちから選択された複数の履歴を含み、
前記検索ヒット有無情報に対応する検索頻度、前記スコア、前記アクセス有無情報に対応するアクセス頻度、及び前記評価情報に対応するユーザ評価を含む複数の評価項目のうち、前記選択された複数の履歴に対応する評価項目の中から、少なくとも1つの評価項目が管理者によって選択指定された場合に、当該指定された評価項目に対応する情報に基づいて、当該指定された評価項目に関する前記複数のデータベース各々の利用状況の統計情報が生成されて、当該統計情報に基づいて前記複数のデータベース各々の利用状況が評価される
ことを特徴とする請求項9記載のデータベース運用管理方法。
The usage history history of each of the plurality of databases is a history for each registered information in each of the plurality of databases, and represents search hit presence / absence information indicating whether or not the search condition is met, and the degree of matching to the search condition. Including a plurality of histories selected from the score, the access presence / absence information indicating whether or not the searched information is selected and referred to by the user, and the evaluation information indicating the user's evaluation with respect to the information referred to by the user ,
Among the plurality of evaluation items including the search frequency corresponding to the search hit presence / absence information, the score, the access frequency corresponding to the access presence / absence information, and the user evaluation corresponding to the evaluation information, When at least one evaluation item is selected and specified by the administrator from among the corresponding evaluation items, each of the plurality of databases related to the specified evaluation item based on information corresponding to the specified evaluation item The database operation management method according to claim 9, wherein statistical information on the usage status of the database is generated, and usage status of each of the plurality of databases is evaluated based on the statistical information.
JP2004284672A 2004-09-29 2004-09-29 Information retrieval system having database operation management support function and database operation management method Expired - Fee Related JP4163671B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004284672A JP4163671B2 (en) 2004-09-29 2004-09-29 Information retrieval system having database operation management support function and database operation management method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004284672A JP4163671B2 (en) 2004-09-29 2004-09-29 Information retrieval system having database operation management support function and database operation management method

Publications (2)

Publication Number Publication Date
JP2006099426A JP2006099426A (en) 2006-04-13
JP4163671B2 true JP4163671B2 (en) 2008-10-08

Family

ID=36239172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004284672A Expired - Fee Related JP4163671B2 (en) 2004-09-29 2004-09-29 Information retrieval system having database operation management support function and database operation management method

Country Status (1)

Country Link
JP (1) JP4163671B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5830895B2 (en) * 2011-03-29 2015-12-09 日本電気株式会社 Information search system, search server, information search method and program
JP6617499B2 (en) * 2015-09-29 2019-12-11 日本電気株式会社 Information processing apparatus, electronic whiteboard search method, and program
JP6871799B2 (en) * 2017-04-28 2021-05-12 キヤノンマーケティングジャパン株式会社 Information processing equipment, information processing system, its control method and program

Also Published As

Publication number Publication date
JP2006099426A (en) 2006-04-13

Similar Documents

Publication Publication Date Title
US8140541B2 (en) Time-weighted scoring system and method
US20220365966A1 (en) System and method for providing content to users based on interactions by similar other users
JP5673336B2 (en) Information processing method, display method, information processing apparatus, display apparatus, information processing program, display program
US7747612B2 (en) Indication of exclusive items in a result set
US8645390B1 (en) Reordering search query results in accordance with search context specific predicted performance functions
US20060173556A1 (en) Methods and apparatus for using user gender and/or age group to improve the organization of documents retrieved in response to a search query
JP2008146412A (en) Network management system, network management program, and network management method
US20180032614A1 (en) System And Method For Compiling Search Results Using Information Regarding Length Of Time Users Spend Interacting With Individual Search Results
JP4453437B2 (en) Search keyword ranking method, apparatus and program
JP2012113544A (en) Restaurant recommendation system
US20120130974A1 (en) Search engine for ranking a set of pages returned as search results from a search query
JP5296745B2 (en) Query suggestion providing apparatus and method
JP5488031B2 (en) Search device
JP4163671B2 (en) Information retrieval system having database operation management support function and database operation management method
JP4759600B2 (en) Text search device, text search method, text search program and recording medium thereof
JP2004272492A (en) Method for retrieving/displaying web site
US10394826B1 (en) System and methods for searching query data
JP2006092023A (en) Document control computer program, document control device and method
JP2003108594A (en) Information retrieval apparatus and method
JP2007213200A (en) Information processor having file search function, and program, method, and system for changing file search result priority
JP5663742B2 (en) Image search server and image information management method for image search server
JP4528203B2 (en) File search method, file search device, and file search program
US20060007477A1 (en) Storage medium storing computer program for presenting document registrant, document registrant presenting method, and document management apparatus
JP5813560B2 (en) Search condition presentation device, method, and program
JP5519406B2 (en) Server apparatus, genre score calculation method, and program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080722

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080724

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130801

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees