JP4163671B2 - Information retrieval system having database operation management support function and database operation management method - Google Patents
Information retrieval system having database operation management support function and database operation management method Download PDFInfo
- Publication number
- JP4163671B2 JP4163671B2 JP2004284672A JP2004284672A JP4163671B2 JP 4163671 B2 JP4163671 B2 JP 4163671B2 JP 2004284672 A JP2004284672 A JP 2004284672A JP 2004284672 A JP2004284672 A JP 2004284672A JP 4163671 B2 JP4163671 B2 JP 4163671B2
- Authority
- JP
- Japan
- Prior art keywords
- evaluation
- information
- database
- databases
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、異なるデータソースから収集された情報が登録された複数のデータベースを対象とする情報検索が可能な情報検索システムに係り、特に当該データベースの運用管理に好適なデータベース運用管理支援機能を有する情報検索システム及びデータベース運用管理方法に関する。 The present invention relates to an information search system capable of performing an information search for a plurality of databases in which information collected from different data sources is registered, and particularly has a database operation management support function suitable for operation management of the database. The present invention relates to an information retrieval system and a database operation management method.
近年、知識情報の共有支援を図るための知識共有システムが開発されている。この知識共有システムは、個人のノウハウなどの知識情報をデータベース(知識データベース)に蓄積して管理するためのものである。また、知識共有システムと自然言語検索などの検索機能とを組み合わせることで、データベースに蓄積された知識情報の効率的な活用を実現する情報検索システムも開発されている。 In recent years, knowledge sharing systems for supporting sharing of knowledge information have been developed. This knowledge sharing system is for accumulating and managing knowledge information such as personal know-how in a database (knowledge database). In addition, an information search system that realizes efficient use of knowledge information stored in a database by combining a knowledge sharing system and a search function such as natural language search has been developed.
知識共有システムを含む情報検索システムでは、知識情報をいかに効率よく収集するかが重要なポイントとなる。そこで最近の情報検索システムでは、収集モジュールが、外部データソース(インターネット上や社内のイントラネット上にある情報など)を収集し、収集した情報をデータベースに蓄積するのが一般的である(例えば、特許文献1参照)。 In an information retrieval system including a knowledge sharing system, how to efficiently collect knowledge information is an important point. Therefore, in recent information retrieval systems, it is common for the collection module to collect external data sources (such as information on the Internet or in-house intranets) and store the collected information in a database (for example, patents). Reference 1).
また、この種の情報検索システムでは、データソースが多岐に渡る場合には、データソース毎に、それぞれ1つのデータベースを割り当てる運用が適用されることが多い。このような運用は、管理者(管理ユーザ)の操作に基づいて運用管理クライアント(運用管理クライアント端末)によって行われる。また、情報検索システムは、データベースに蓄積された情報をユーザから利用可能なように検索サーバを有している。検索サーバは、ユーザの操作に従って検索クライアント(検索クライアント端末)から指定されたデータベースに対して検索条件に従って検索を行い、検索結果を検索クライアントを介してユーザに提示する。ユーザは、検索サーバからの検索結果を参照する。 In this type of information search system, when there are a wide variety of data sources, an operation of allocating one database for each data source is often applied. Such an operation is performed by an operation management client (operation management client terminal) based on an operation of an administrator (management user). The information search system has a search server so that information stored in the database can be used by the user. The search server searches the database specified by the search client (search client terminal) according to the user's operation according to the search condition, and presents the search result to the user via the search client. The user refers to the search result from the search server.
ところで、データソースが多岐に渡るということは、様々な知識情報を収集できる反面、運用管理クライアントを介しての管理者によるシステムの運用管理という観点からは、管理対象となるデータベースの個数の増加を招くことを意味する。この場合、これらのデータベースを管理者が効率的に管理することは困難となる。 By the way, the wide range of data sources means that various knowledge information can be collected. However, from the viewpoint of system operation management by the administrator via the operation management client, the number of databases to be managed is increased. It means inviting. In this case, it is difficult for an administrator to efficiently manage these databases.
また、収集モジュールによって自動的に大量に収集されてくるデータの中には、ユーザにとって不要なものも大量に含まれる。しかし、管理者が、ユーザにとって不要なものを判別することは困難となる。 Further, the data automatically collected in a large amount by the collecting module includes a large amount of data unnecessary for the user. However, it is difficult for the administrator to determine what is unnecessary for the user.
一方、検索結果である情報(検索結果一覧から選択された情報)を検索クライアントを介してユーザに提示した際に、その情報に対するユーザの評価を入力させることで、その情報に対するユーザの評価を取得して、データベース内の情報毎に対応するユーザ評価情報を保存することが提案されている(例えば、特許文献2参照)。この特許文献2には、検索結果一覧、或は検索結果一覧から選択された情報をユーザに提示する際に、その情報に対応するユーザ評価情報を併せて提示することが記載されている。また特許文献2には、検索された情報の順位付けに対応するユーザ評価情報を用いることも記載されている。
上述した情報検索システムにおいて、複数のデータソースを対象に、そのデータソースから対応するデータベースに知識情報を収集する処理が頻繁に行われる場合には、管理者が有用性を管理しなければならない情報の件数が膨大となる。この場合、これらのデータベースを運用管理クライアントが効率的に管理することは困難であり、またユーザにとって不要なデータベースを判別することも困難である。 In the information search system described above, information that must be managed by an administrator when knowledge data is frequently collected from a plurality of data sources to a corresponding database. The number of cases becomes enormous. In this case, it is difficult for the operation management client to efficiently manage these databases, and it is also difficult to determine a database unnecessary for the user.
そこで、この判別に、特許文献2に記載された、各データベース内の登録情報毎のユーザ評価情報を利用することが考えられる。しかし、この情報毎のユーザ評価情報を利用するには、管理者は各データベース内の全ての登録情報をチェックしなければならず、運用管理のコストが増加するという問題がある。しかも、データベース内の登録情報が多くなると、ユーザから参照される回数の少ない情報も増加する。このような情報については、ユーザの評価の回数も少なくなるため、ユーザ評価情報自体の信頼性の点で問題がある。したがって管理者が、データベース内の登録情報毎のユーザ評価情報を単に利用して、登録情報毎に有用性を評価するだけでは、対応するデータベースがユーザにとって不要であるかを判別することは困難である。
Therefore, it is conceivable to use user evaluation information for each registered information in each database described in
本発明は上記事情を考慮してなされたものでその目的は、管理者が各データベース内の全ての情報の有用度を個々にチェックしなくても、有効に利用されているデータベースを容易に判別できる、データベース運用管理支援機能を有する情報検索システム及びデータベース運用管理方法を提供することにある。 The present invention has been made in consideration of the above circumstances, and its purpose is to easily determine the database that is effectively used without the administrator checking the usefulness of all information in each database individually. Another object of the present invention is to provide an information search system and database operation management method having a database operation management support function.
本発明の1つの観点に係るデータベース運用管理支援機能を有する情報検索システムは、異なるデータソースから収集された情報が登録された複数のデータベースと、ユーザからの検索要求で指定された検索条件に従って前記複数のデータベースの少なくとも1つから当該検索条件に合致するデータを検索して、その検索結果を前記ユーザに提示する検索サーバと、前記検索サーバによる検索の履歴を含む、前記複数のデータベース各々の利用状況の履歴を保存するログ保存手段と、前記ログ保存手段に保存されている前記複数のデータベース各々の利用状況の履歴に基づいて、前記複数のデータベース各々の利用状況の統計情報を生成し、当該統計情報に基づいて前記複数のデータベース各々の利用状況を評価する統計・評価手段と、前記統計・評価手段による前記複数のデータベース各々の利用状況の評価結果を管理者に提示するデータベース情報提示手段とを具備し、前記統計・評価手段は、データベース毎に、複数種の評価項目の各々について前記統計情報に基づく評価ポイントを得るとともに、得られた各評価ポイントに基づいてデータベース毎の評価値を算出する手段を具備し、前記評価値は、評価項目毎に、当該評価項目の評価ポイントに応じた重み係数と、当該データベースの文書数に全データベースの平均文書数の対数を乗じて得られる値とを乗算して得られる値を、評価項目毎に加算して得られる値であることを特徴とする。 An information search system having a database operation management support function according to one aspect of the present invention includes a plurality of databases in which information collected from different data sources is registered, and a search condition specified in a search request from a user. Searching data that matches the search condition from at least one of a plurality of databases, and presenting the search results to the user, and using each of the plurality of databases, including a history of searches by the search server Log storage means for storing a history of status, and based on the usage status history of each of the plurality of databases stored in the log storage means, generating statistical information on the usage status of each of the plurality of databases, Statistics / evaluation means for evaluating the usage status of each of the plurality of databases based on statistical information; Comprising a database information presenting means for presenting the evaluation results of a plurality of databases each usage by meter and evaluation unit to the administrator, the statistical and evaluation unit, for each database, for each of a plurality of types of evaluation items Obtaining evaluation points based on the statistical information, and means for calculating an evaluation value for each database based on the obtained evaluation points, the evaluation value is an evaluation point of the evaluation item for each evaluation item The value obtained by multiplying the value obtained by multiplying the corresponding weighting factor and the value obtained by multiplying the number of documents in the database by the logarithm of the average number of documents in all databases for each evaluation item. Features.
このような構成においては、検索サーバによる検索の履歴を含む、複数のデータベース各々の利用状況の履歴がログ保存手段に保存される。統計・評価手段は、このログ保存手段に保存されている、複数のデータベース各々の利用状況の履歴に基づいて、当該複数のデータベース各々の利用状況の統計情報を生成する。統計・評価手段は、この複数のデータベース各々の利用状況の統計情報に基づいて、当該複数のデータベース各々の利用状況を評価する。この評価結果は、データベース情報提示手段によって管理者に提示される。これにより管理者は、複数のデータベース各々における全ての登録情報をチェックしなくても、提示された複数のデータベース各々の利用状況の評価結果から、当該複数のデータベースのいずれが有効に利用されており、いずれが有効に利用されていないか容易に判別できる。よって、運用管理コストを削減することが可能となる。ここで、評価結果は、有効に利用されているデータベースの順、或は有効に利用されていないデータベースの順など、順位付けされた一覧として提示される構成とすると良い。この際、評価値を付すと良い。 In such a configuration, the usage history of each of the plurality of databases, including the search history by the search server, is stored in the log storage means. The statistics / evaluation unit generates statistical information on the usage status of each of the plurality of databases based on the history of usage status of each of the plurality of databases stored in the log storage unit. The statistics / evaluation means evaluates the usage status of each of the plurality of databases based on the statistical information of the usage status of each of the plurality of databases. This evaluation result is presented to the administrator by the database information presenting means. As a result, the administrator can effectively use any one of the plurality of databases based on the evaluation result of the usage situation of each of the plurality of databases presented without checking all the registration information in each of the plurality of databases. , It is easy to determine which is not being used effectively. Therefore, the operation management cost can be reduced. Here, the evaluation result may be configured to be presented as an ordered list such as the order of databases that are used effectively or the order of databases that are not used effectively. At this time, an evaluation value may be given.
また、ログ保存手段に保存される上記複数のデータベース各々の利用状況の履歴が、当該複数のデータベース各々における登録情報毎の履歴であって、検索条件に合致したか否かを示す検索ヒット有無情報、更新の有無を示す更新有無情報、検索条件に合致する程度を表すスコア、検索された情報がユーザによって選択されて参照されたか否かを示すアクセス有無情報、及びユーザによって参照された情報に対する当該ユーザの評価を示す評価情報のうちから選択された複数の履歴を含む構成を適用すると良い。この構成において、上記検索ヒット有無情報に対応する検索頻度、上記更新有無情報に対応する更新頻度、上記スコア、上記アクセス有無情報に対応するアクセス頻度、及び上記評価情報に対応するユーザ評価を含む複数の評価項目のうち、上記選択された複数の履歴に対応する評価項目の中から、管理者によって選択指定された少なくとも1つの評価項目を上記統計・評価手段が受け付けて、ログ保存手段に保存されている上記複数のデータベース各々の利用状況の履歴のうち、当該指定された評価項目に対応する情報に基づいて、当該指定された評価項目に関する上記複数のデータベース各々の利用状況の統計情報を生成し、当該統計情報に基づいて上記複数のデータベース各々の利用状況を評価するならば、検索頻度が高いデータベース、更新頻度が高い情報が多く登録されているデータベース、検索で高いスコアとなる情報が多く登録されているデータベース、評価の高い情報が多く登録されているデータベースなど、管理者の意図した評価項目に沿ったデータベース利用状況の評価結果を提示することが可能となる。 Search history information indicating whether or not the usage history history of each of the plurality of databases stored in the log storage means is a history for each registered information in each of the plurality of databases and matches the search condition. Update presence / absence information indicating the presence / absence of update, a score indicating the degree of matching with the search condition, access presence / absence information indicating whether or not the searched information is selected and referred to by the user, and the information referred to by the user A configuration including a plurality of histories selected from the evaluation information indicating the user's evaluation may be applied. In this configuration, a plurality of information including a search frequency corresponding to the search hit presence information, an update frequency corresponding to the update presence information, the score, an access frequency corresponding to the access presence information, and a user evaluation corresponding to the evaluation information Among the evaluation items, at least one evaluation item selected and designated by the administrator from among the evaluation items corresponding to the plurality of selected histories is received by the statistics / evaluation unit and stored in the log storage unit Based on the information corresponding to the designated evaluation item in the usage history of each of the plurality of databases, statistical information on the usage situation of each of the plurality of databases related to the designated evaluation item is generated. If the usage status of each of the plurality of databases is evaluated based on the statistical information, a database with a high search frequency is used. Evaluation items intended by the administrator, such as databases with a lot of information that is frequently updated, databases with a lot of information that gives high scores in searches, databases with a lot of information with high evaluations, etc. It is possible to present the evaluation result of the database usage situation along the way.
また、上記複数のデータベース各々の利用状況の評価結果が時間軸方向の変化の傾向を表すように、当該複数のデータベース各々の利用状況が評価される構成とするならば、例えばアクセス頻度が高くなっている、或はアクセス頻度が低くなっているなど、データベース各々の利用状況の評価結果に、時系列的な変化を反映させることができる。 Further, if the usage status of each of the plurality of databases is evaluated so that the evaluation result of the usage status of each of the plurality of databases represents a tendency of change in the time axis direction, for example, the access frequency increases. A change in time series can be reflected in the evaluation result of the usage status of each database, such as the access frequency is low or the access frequency is low.
本発明によれば、検索の履歴を含む、複数のデータベース各々の利用状況の履歴に基づいて、当該複数のデータベース各々の利用状況の統計情報を生成し、その複数のデータベース各々の利用状況の統計情報に基づいて、当該複数のデータベース各々の利用状況を評価して、その評価結果を管理者に提示することにより、管理者が各データベース内の全ての情報の有用度を個々にチェックしなくても、有効に利用されているデータベースを容易に判別でき、運用管理のコストを削減することができる。 According to the present invention, based on the usage history of each of the plurality of databases including the search history, the usage status statistical information of each of the plurality of databases is generated, and the usage status statistics of each of the plurality of databases are generated. Based on the information, the usage situation of each of the plurality of databases is evaluated, and the evaluation result is presented to the administrator so that the administrator does not individually check the usefulness of all the information in each database. However, it is possible to easily determine the database that is effectively used, and to reduce the cost of operation management.
以下、本発明の実施の形態につき図面を参照して説明する。
[第1の実施形態]
図1は本発明の第1の実施形態に係る情報検索システムの構成を示すブロック図である。図1に示す情報検索システムは、複数のデータベース、例えば2つのデータベース11A(#A),11B(#B)と、収集モジュール12A,12Bと、複数の検索クライアント(検索クライアント端末)13と、検索サーバ14と、統計・評価モジュール15と、統計・評価ログデータベース16と、データベース情報提示モジュール17と、運用管理クライアント(運用管理クライアント端末)18とから構成される。収集モジュール12A,12B、検索サーバ14、統計・評価モジュール15、及びデータベース情報提示モジュール17は、専用のプログラムを計算機(サーバ計算機)が読み取り実行することにより実現される。このプログラムは、計算機で読み取り可能な記憶媒体に予め格納して頒布可能である。また、このプログラムが、ネットワークを介してダウンロード(頒布)されても構わない。
Embodiments of the present invention will be described below with reference to the drawings.
[First Embodiment]
FIG. 1 is a block diagram showing a configuration of an information search system according to the first embodiment of the present invention. The information search system shown in FIG. 1 includes a plurality of databases, for example, two
以下、図1の情報検索システムにおける動作を、図2のシーケンスチャートを参照して説明する。データベース11A,11Bは、それぞれ異なる外部データソース21A,21B(インターネット上や社内のイントラネット上にある情報のソース)に対応して設けられ、対応する外部データソースから収集された情報を蓄積するのに用いられる。外部データソース21Aは例えばインターネット上に存在し、外部データソース21Bは例えば社内のイントラネット上に存在するものとする。また、インターネット上の予め定められた複数のWebサーバをそれぞれ外部データソースとして、当該Webサーバ毎にデータベースが用意される構成とすることも可能である。なお、説明を簡略化するために、外部データソース21A,21Bから収集される情報が文書情報であるものとする。
Hereinafter, the operation in the information search system of FIG. 1 will be described with reference to the sequence chart of FIG. The
収集モジュール12i(i=A,B)は、外部データソース21iから文書情報を収集して、その収集された文書情報をデータベース11iに登録する(ステップS1)。収集モジュール12iは、既にデータベース11iに登録済みの文書情報に対応する文書情報を収集した場合、新たに収集された文書情報が、登録済みの文書情報の更新された情報(つまり更新文書)であるかを判定する。この判定は、文書情報のサイズまたは更新日時を比較することで行われる。収集モジュール12iは、新たに収集された文書情報が、更新された情報である場合、既登録の文書情報を当該新たに収集された文書情報で更新する。また、収集モジュール12iは、データベース11i内の既登録の文書情報が更新されたことを検索サーバ14に通知する(ステップS2)。また、既にデータベース11iに登録済みの文書情報が、外部データソース21iに存在しない場合、収集モジュール12iは、当該登録済みの文書情報をデータベース11iから削除する。
The
検索サーバ14は、収集モジュール12iによるデータベース11iへの文書情報収集が完了すると、当該データベース11iの文書毎の更新の有無を示す情報をデータベース11iのデータベース名と共に統計・評価モジュール15に通知する(ステップS3)。統計・評価モジュール15は、検索サーバ14から通知された更新の有無を示す情報をログ情報として、その時点における日時を示す日時情報を付して、統計・評価ログデータベース16内の後述するログ情報テーブル160に保存する(ステップS4)。
When the
検索クライアント13は、ユーザの操作に応じて検索サーバ14に対して検索を要求する(ステップS5)。検索サーバ14は、検索クライアント13からの検索要求に応じ、当該検索要求で指定されたデータベース11i(iはAまたはB)を対象に当該検索要求で指定された検索条件に従う検索処理を行う(ステップS6)。この検索処理では、検索サーバ14は、データベース11iに登録されている文書毎に、検索条件に合致する程度を表すスコアを算出する。検索サーバ14は、算出された文書毎のスコアを、以下に述べる検索結果テーブル140内の当該文書に対応するスコアフィールドに保持する。
The
図3は、検索結果テーブル140のデータ構造例を示す。検索結果テーブル140は、データベース11A,11B毎で、且つ当該データベース11A,11Bに登録されている各文書毎に、検索でのヒットの有無を保持する検索ヒットフィールド、検索条件に合致する程度を表すスコア(検索条件に対して検索した文書の適合率)を保持するスコアフィールド及びアクセス(参照)の有無を保持するアクセスフィールドを有する。検索ヒットフィールドは、対応する文書が検索された場合に検索有りを示す状態に設定される。また、スコアフィールドには、ユーザからの検索要求に応じて実行される検索処理で算出された対応する文書のスコアが保持される。また、アクセスフィールドは、対応する文書がアクセス(参照)された場合にアクセス有りを示す状態に設定される。
FIG. 3 shows an exemplary data structure of the search result table 140. The search result table 140 represents a search hit field that holds the presence or absence of a hit in the search for each of the
検索結果テーブル140はまた、データベース11A,11B毎で、且つ当該データベース11A,11Bに登録されている各文書毎に、ユーザ評価結果を保持するための「役に立つ」評価フィールド及び「役に立たない」評価フィールドを有する。「役に立つ」評価フィールドは、対応する文書が役に立つとユーザに評価された場合に、その旨を示す状態に設定される。同様に、「役に立たない」評価フィールドは、対応する文書が役に立たないとユーザに評価された場合に、その旨を示す状態に設定される。なお、検索結果テーブル140の枠組みは、データベースの増減、データベース内の文書の増減に応じて変化する。
The search result table 140 also includes a “useful” evaluation field and a “useless” evaluation field for holding user evaluation results for each of the
検索サーバ14は、データベース11iに登録されている文書毎にスコアを算出すると、検索条件に合致(ヒット)した文書、例えば予め定められた閾値を超えるスコアの文書について、検索結果テーブル140内の当該文書に対応する検索ヒットフィールドを、検索有りを示す状態に設定する。
When the
検索サーバ14は、検索条件に合致(ヒット)した文書の一覧(検索文書一覧)を含む検索結果を検索クライアント13に送信する(ステップS7)。この検索文書一覧は、検索条件に合致した各文書の文書名(タイトル名)と文書の要約とを含む。検索文書一覧中の文書(文書名)の並び順は対応するスコアの大きい順となっている。
The
検索サーバ14から検索クライアント13に検索結果が送信されると、当該検索クライアント13の表示モニタに、上記検索文書一覧を含む検索結果画面が表示される。この検索文書一覧から、ユーザが所望の文書の文書名を選択する操作を行うと、検索クライアント13から検索サーバ14に文書の参照要求(アクセス要求)が送信される(ステップS8)。この参照要求に応じて、検索サーバ14は、選択された文書名の文書情報をデータベース11iから取り出して検索クライアント13に送信する(ステップS9)。すると、検索クライアント13の表示モニタに、ユーザが選択した文書情報を含む文書閲覧画面が表示される。これによりユーザは、この文書閲覧画面上で自身が選択した文書情報を参照することができる。
When a search result is transmitted from the
検索サーバ14は、ユーザによって検索結果文書一覧から選択された文書を検索クライアント13に送信すると、検索結果テーブル140内の当該文書に対応するアクセスフィールドを、アクセス(参照)有りを示す状態に設定する。
When the
検索クライアント13の表示モニタに表示される文書閲覧画面には、前記特許文献2に記載されているように、ユーザの評価を入力するための評価入力領域が確保されている。この評価入力領域には、評価種類入力用のラジオボタンが配置されている。ここでは、説明を簡略化するために、評価種類入力用のラジオボタンが、文書閲覧画面に表示された文書情報(つまりユーザによって参照された文書情報)が役に立つことを入力するのに用いられるラジオボタンと、当該文書情報が役に立たないことを入力するのに用いられるラジオボタンとの2種であるものとする。この例は、2段階の評価値の中から、1つをユーザに選択させる構成と等価である。なお、3段階以上の評価値の中から、1つをユーザに選択させる構成であっても構わない。
On the document browsing screen displayed on the display monitor of the
さてユーザは、文書閲覧画面が表示されると、当該文書閲覧画面の評価入力領域に配置された2種のラジオボタンのいずれか一方を選択することで、当該文書閲覧画面に表示された文書情報(つまりユーザが参照した文書情報)に対して、そのラジオボタンに固有の評価を付けることができる。この評価付けの結果、つまり「役に立つ」ことを示す評価が入力されたか、或は「役に立たない」ことを示す評価が入力されたかは、検索クライアント13から検索サーバ14に通知される(ステップS10)。なお、2種のラジオボタンのいずれも選択しないことで、上記文書情報に対して、「役に立つ」または「役に立たない」のいずれでもないとの評価を付けることもできる。
Now, when the document browsing screen is displayed, the user selects one of the two types of radio buttons arranged in the evaluation input area of the document browsing screen, thereby displaying the document information displayed on the document browsing screen. A specific evaluation can be given to the radio button with respect to (that is, document information referred to by the user). As a result of this evaluation, that is, whether the evaluation indicating “useful” or the evaluation indicating “useless” is input, the
検索サーバ14は、「役に立つ」ことを示す評価が入力された場合であれば、検索結果テーブル140内の、「役に立つ」と評価された文書情報に対応する「役に立つ」評価フィールドを、「役に立つ」と評価された旨を示す状態に設定する。同様に、「役に立たない」ことを示す評価が入力された場合であれば、検索サーバ14は、検索結果テーブル140内の、「役に立たない」と評価された文書情報に対応する「役に立たない」評価フィールドを、「役に立たない」と評価された旨を示す状態に設定する。
If an evaluation indicating “useful” is input, the
検索サーバ14は、例えば1つの検索条件に対応する一連の検索処理が終了する毎に、その時点における検索結果テーブル140の情報を統計・評価モジュール15に送信する(ステップS11)。そして、統計・評価モジュール15が検索結果テーブル140の情報を正常に受信すると、検索サーバ14は当該検索サーバ14内の検索結果テーブル140の各フィールドの状態を初期化する。
For example, every time a series of search processes corresponding to one search condition is completed, the
統計・評価モジュール15は、検索サーバ14から送信された検索結果テーブル140の情報を受信すると、その情報をログ情報として、その時点における日時を示す日時情報を付して、統計・評価ログデータベース16内の以下に述べるログ情報テーブル160に保存する(ステップS12)。
When receiving the information of the search result table 140 transmitted from the
図4は、ログ情報テーブル160のデータ構造例を示す。ログ情報テーブル160のデータ構造は、図3の検索結果テーブル140とほぼ同様である。ここでは、説明を簡略化するために、検索サーバ14から統計・評価ログデータベース16に、データベース11iの文書毎の更新の有無を示す情報、または検索結果テーブル140の情報が送信される毎に、ログ情報テーブル160が統計・評価ログデータベース16内に生成されるものとする。つまり、本実施形態では、ログ情報テーブル160の列が時系列順に統計・評価ログデータベース16に蓄積される。ログ情報テーブル160が検索結果テーブル140と相違するのは、更新の有無を保持する更新フィールドを有する点である。
FIG. 4 shows an exemplary data structure of the log information table 160. The data structure of the log information table 160 is almost the same as that of the search result table 140 of FIG. Here, in order to simplify the description, every time information indicating whether or not each document in the database 11i is updated or information in the search result table 140 is transmitted from the
さて運用管理クライアント18は、管理者の操作によりデータベース評価情報の提示が要求されると、データベース情報提示モジュール17に対して、データベース評価情報の提示要求を通知する(ステップS13)。ここでは、運用管理クライアント18は、管理者からデータベース評価情報の提示が要求された場合に、管理者に対して、評価項目と、評価期間(評価の対象期間)の指定を促すメッセージを表示する。これにより管理者は、評価項目と、評価期間を指定することが可能である。
Now, when the presentation of database evaluation information is requested by the operation of the administrator, the
データベース情報提示モジュール17は、運用管理クライアント18からの提示要求を受け付けると、統計・評価モジュール15に対してデータベース評価要求を通知する(ステップS14)。このデータベース評価要求は、指定された評価項目と評価期間の情報を含むものとする。統計・評価モジュール15は、データベース情報提示モジュール17からのデータベース評価要求を受け付けると、当該評価要求で指定された評価項目について、その評価項目毎の評価ポイントを用いて、データベース11i毎の評価値Riを算出する(ステップS15)。本実施形態で適用される評価項目は、「役に立つ」、「役に立たない」、「検索頻度が高い」、「検索頻度が低い」、「更新頻度が高い」、「更新頻度が低い」、「スコアが高い」、「スコアが低い」、「アクセス頻度が高い」及び「アクセス頻度が低い」の10項目であり、この中から1つまたは複数の項目を選択的に指定することが可能である。なお、以上の10項目の一部は必ずしも用意されていなくても良い。逆に、データベース11iに対する情報の「登録頻度が高い」及び「登録頻度が低い」と、データベース11iからの情報の「削除頻度が高い」及び「削除頻度が低い」の各評価項目を加えることも可能である。そのためには、収集モジュール12iによる情報収集時において、上述の文書毎の更新の有無を示す情報の他に、データベース11iに新たに登録された文書の情報、或はデータベース11iから削除された文書の情報を、統計・評価モジュール15に通知する必要がある。
Upon receiving the presentation request from the
以下、データベース11i毎の評価値Riの算出について説明する。まず統計・評価モジュール15は、指定評価期間におけるログ情報であるログ情報テーブル160の列を先頭から順に読み込む。もし、指定評価項目が「役に立つ」であるならば、統計・評価モジュール15は、ログ情報テーブル160の「役に立つ」評価フィールドを参照して、各データベース11iの文書毎に、指定の評価期間において当該文書が「役に立つ」と評価された回数をカウントする。このカウント値を、データベース11iの全文書について累計すると、評価項目「役に立つ」に関する当該データベース11iの評価ポイント(統計情報)を取得できる。
Hereinafter, calculation of the evaluation value Ri for each database 11i will be described. First, the statistics /
同様に、指定評価項目が「役に立たない」であるならば、統計・評価モジュール15は、ログ情報テーブル160の「役に立たない」評価フィールドを参照して、各データベース11iの文書毎に、指定の評価期間において当該文書が「役に立たない」と評価された回数をカウントする。このカウント値を、データベース11iの全文書について累計すると、評価項目「役に立たない」に関する当該データベース11iの評価ポイントを取得できる。
Similarly, if the designated evaluation item is “useless”, the statistic /
次に、指定評価項目が「検索頻度が高い」または「検索頻度が低い」であるならば、統計・評価モジュール15は、ログ情報テーブル160の検索ヒットフィールドを参照して、1回の検索毎に、各データベース11iについて、検索頻度が高いか、または検索頻度が低いかを判定する。ここでは、データベース11i内の総文書数に対する1回の検索でのヒット文書の割合が第1の閾値以上であるならば、データベース11iの検索頻度が高いと判定される。また、ヒット文書の割合が第1の閾値未満であるならば、データベース11iの検索頻度が低いと判定される。そして、データベース11iの検索頻度が高いと判定される毎に、「検索頻度が高い」評価ポイントを1インクリメントする動作を、指定評価期間におけるログ情報テーブル160の列について実行する。これにより、評価項目「検索頻度が高い」に関する当該データベース11iの評価ポイントを取得できる。同様に、データベース11iの検索頻度が低いと判定される毎に、「検索頻度が低い」評価ポイントを1インクリメントする動作を、指定評価期間におけるログ情報テーブル160の列について実行する。これにより、評価項目「検索頻度が低い」に関する当該データベース11iの評価ポイントを取得できる。
Next, if the designated evaluation item is “high search frequency” or “low search frequency”, the statistics /
次に、指定評価項目が「更新頻度が高い」または「更新頻度が低い」であるならば、統計・評価モジュール15は、情報収集が行われた際のログ情報テーブル160の更新フィールドを参照して、各データベース11iの文書毎に、指定の評価期間において当該文書が更新された回数(更新回数)をカウントする。そして統計・評価モジュール15は、指定の評価期間における更新回数が平均更新回数以上である文書を検出する毎に、対応するデータベース11iの「更新頻度が高い」ことを示す評価ポイントを1インクリメントする。これにより、評価項目「更新頻度が高い」に関する当該データベース11iの評価ポイントを取得できる。平均更新回数には、データベース11i内の文書毎の更新回数の総和を、データベース11i内で1度でも更新された文書の総数で除した値が用いられる。また統計・評価モジュール15は、指定の評価期間における更新回数が平均更新回数未満である文書を検出する毎に、対応するデータベース11iの「更新頻度が低い」ことを示す評価ポイントを1インクリメントする。これにより、評価項目「更新頻度が低い」に関する当該データベース11iの評価ポイントを取得できる。
Next, if the designated evaluation item is “update frequency is high” or “update frequency is low”, the statistics /
次に、指定評価項目が「スコアが高い」または「スコアが低い」であるならば、統計・評価モジュール15は、ログ情報テーブル160のスコアフィールドを参照して、各データベース11iの文書毎に、指定の評価期間において当該文書が第2の閾値以上のスコアとなった回数または第2の閾値未満のスコアとなった回数をカウントする。このカウント値を、データベース11iの全文書について累計すると、評価項目「スコアが高い」または「スコアが低い」に関する当該データベース11iの評価ポイントを取得できる。
Next, if the designated evaluation item is “score is high” or “score is low”, the statistic /
次に、指定評価項目が「アクセス頻度が高い」または「アクセス頻度が低い」であるならば、統計・評価モジュール15は、情報収集が行われた際のログ情報テーブル160のアクセスフィールドを参照して、各データベース11iの文書毎に、指定の評価期間において当該文書がアクセス(参照)された回数(アクセス回数)をカウントする。そして統計・評価モジュール15は、指定の評価期間におけるアクセス回数が平均アクセス回数以上である文書を検出する毎に、対応するデータベース11iの「アクセス頻度が高い」ことを示す評価ポイントを1インクリメントする。これにより、評価項目「アクセス頻度が高い」に関する当該データベース11iの評価ポイントを取得できる。平均アクセス回数には、データベース11i内の文書毎のアクセス回数の総和を、データベース11i内で1度でもアクセスされた文書の総数で除した値が用いられる。また統計・評価モジュール15は、指定の評価期間におけるアクセス回数が平均アクセス回数未満である文書を検出する毎に、対応するデータベース11iの「アクセス頻度が低い」ことを示す評価ポイントを1インクリメントする。これにより、評価項目「アクセス頻度が低い」に関する当該データベース11iの評価ポイントを取得できる。
Next, when the designated evaluation item is “access frequency is high” or “access frequency is low”, the statistics /
統計・評価モジュール15は、データベース11i(i=A,B)毎に、指定の評価項目について評価ポイントを取得すると、その評価ポイントに基づいて、データベース11i毎の評価値(統計評価値)Riを算出する。この評価値Riは、次式(1)
Ri=W1f1+W2f2+W3f3…+Wnfn (1)
で表される。ここで、nは適用する評価項目の個数である。本実施例において、n=4であり、W1f1、W2f2、W3f3及びWnfn(=W4f4)は、それぞれ、「アクセス頻度が高い」、「アクセス頻度が低い」、「役に立つ」及び「役に立たない」の各評価項目毎の評価値を表し、W1,W2,W3,W4は、それぞれ対応する評価項目の重みを表す。
When the statistics /
Ri = W1f1 + W2f2 + W3f3... + Wnfn (1)
It is represented by Here, n is the number of evaluation items to be applied. In this embodiment, n = 4, and W1f1, W2f2, W3f3 and Wnfn (= W4f4) are “high access frequency”, “low access frequency”, “useful”, and “useless”, respectively. The evaluation value for each evaluation item is represented, and W1, W2, W3, and W4 represent the weights of the corresponding evaluation items.
式(1)において、fnは、
fn=データベース11iの文書数×log(全データベースの平均文書数) (2)
で表される。また、重みW1,W2,W3,W4をWで代表させると、重みWは
W=(評価ポイント×評価係数)/f(x) (3)
で表される。ここでf(x)は全データベースに対して正規化した文書数、例えば1データベースの平均文書数を表す。また、評価係数は、評価項目に固有の値である。
In the formula (1), fn is
fn = number of documents in database 11i × log (average number of documents in all databases) (2)
It is represented by If the weights W1, W2, W3, and W4 are represented by W, the weight W is W = (evaluation point × evaluation coefficient) / f (x) (3)
It is represented by Here, f (x) represents the number of documents normalized with respect to all databases, for example, the average number of documents in one database. The evaluation coefficient is a value specific to the evaluation item.
図5は、本実施形態で適用される10種類の評価項目と、その評価項目毎に予め定められた評価係数の一例を示す。 FIG. 5 shows an example of 10 types of evaluation items applied in the present embodiment and evaluation coefficients predetermined for each evaluation item.
統計・評価モジュール15は、上述のようにして算出されたデータベース11i毎の評価値Riをデータベース情報提示モジュール17に送信する(ステップS16)。データベース情報提示モジュール17は、統計・評価モジュール15によって送信されたデータベース11i毎の評価値Riを受信すると、当該データベース11i毎の評価値Riを運用管理クライアント18を介して管理者に提示する(ステップS17)。このとき、データベース11i毎の評価値Riを、評価値の高い順または低い順にソートして提示するならば、管理者は各データベース11iが有効に利用されている順位または有効に利用されていない順位を簡単に視認できる。また、評価値の高い順または低い順のいずれで提示するかは、管理者から指定可能とすると良い。このデータベース11i毎の評価値Ri、つまりデータベース11i毎の利用状況の統計的な評価結果から、運用管理クライアント18のユーザである管理者は、有効に利用されているデータベース、或は有効に利用されていないデータベースを判別することができる。データベース11i毎の評価値Riは、有効に利用されていないデータベースを削除するときの目安となる。これにより、運用管理のコストを削減できる。
The statistics /
勿論、データベース情報提示モジュール17または運用管理クライアント18がデータベース11i毎の評価値Riを閾値と比較することで、有効に利用されているデータベース、或は有効に利用されていないデータベースを自動判別することも可能である。
Of course, the database
明らかなように、上述の例では、「アクセス頻度が高い」評価値及び「役に立つ」評価値がより高く、「アクセス頻度が低い」評価値及び「役に立たない」評価値の絶対値がより低いデータベース11iほど、評価値Riは高くなる。 As is apparent, in the above-described example, a database having a higher “access frequency” evaluation value and a “useful” evaluation value, and a lower absolute value of a “less access” evaluation value and a “useless” evaluation value. The evaluation value Ri increases as 11i increases.
上記第1の実施形態では、データベース11iの評価値Riの算出に、評価項目として、「アクセス頻度が高い」、「アクセス頻度が低い」、「役に立つ」及び「役に立たない」の4種が適用されている。しかし、図4に示す任意の評価項目を単独で、或は複数組み合わせて用いることもできる。例えば、運用管理クライアント18から、評価項目として「スコアが高い」が指定された場合、つまり「スコアが高いデータが多いデータベース」に対する評価順の提示が指定された場合、統計・評価モジュール15では、「スコアが高い」のみに着目して、データベース11i毎の評価値Riが算出される。このデータベース11i毎の評価値Riは、統計・評価ログデータベース16によって運用管理クライアント18に提示される。これにより管理者は、「スコアが高いデータが多いデータベース」の観点で評価された、データベース11i毎の評価結果(評価値Ri)から、有効に利用されているデータベースを判別することができる。また、評価項目として、例えば「アクセス頻度が高い」、「アクセス頻度が低い」、「更新頻度が高い」及び「更新頻度が低い」を適用して、データベース11i毎の評価値Riを算出するならば、アクセス頻度が低く、且つ更新頻度が低い(つまり古い文書が多い)データベースを削除するときの目安とすることができる。
In the first embodiment, four types of evaluation items “high access frequency”, “low access frequency”, “useful”, and “useless” are applied to the calculation of the evaluation value Ri of the database 11i. ing. However, the arbitrary evaluation items shown in FIG. 4 can be used alone or in combination. For example, when “high score” is designated as the evaluation item from the
また上記第1の実施形態では、運用管理クライアント18からの要求に応じて、データベース情報提示モジュール17から運用管理クライアント18に、データベース11i毎の評価値Riが送信される構成を適用している。しかし、予め運用管理クライアント18から指定された評価項目を適用して、予め定められたタイミング毎に、例えば一定期間毎に、各データベース11iの評価値Riを統計・評価モジュール15が算出することにより、データベース情報提示モジュール17から運用管理クライアント18に、データベース11i毎の評価値Riが定期的に送信される構成とすることもできる。
In the first embodiment, a configuration in which the evaluation value Ri for each database 11 i is transmitted from the database
また上記第1の実施形態では、評価値Riの算出に用いられるログ情報の期間(評価期間)が運用管理クライアント18から指定可能なようになっている。この評価期間の指定の意義について以下に説明する。例えば、データベース11iが構築されてから現在までの「全期間」におけるログ情報に基づく評価値Riと、当該全期間内の「ある特定の期間」におけるログ情報に基づく評価値Riとは異なる。
Further, in the first embodiment, the period (evaluation period) of log information used for calculating the evaluation value Ri can be designated from the
そこで上記第1の実施形態では、ログ情報の時間軸方向の変化の傾向を考慮して評価値Riが算出される。ここでは、あるデータベース11iに対して「役に立つ」に対する評価値Riを算出することを想定する。 Therefore, in the first embodiment, the evaluation value Ri is calculated in consideration of the tendency of the log information to change in the time axis direction. Here, it is assumed that an evaluation value Ri for “useful” is calculated for a certain database 11i.
まず、データベース11iが作成されてから現在までのX年間(Xは例えば2以上の整数)に「役に立つ」と評価された文書数が3000件であり、X年間のうちの最近の1年間で「役に立つ」と評価された文書数が2000件、全データベースに対して正規化した文書数(例えば1データベースの平均文書数)が2000であったものとする。 First, the number of documents evaluated as “useful” in the X years (X is an integer of 2 or more, for example) from the creation of the database 11i to the present is 3,000. Assume that the number of documents evaluated as “useful” is 2000, and the number of documents normalized to all databases (for example, the average number of documents in one database) is 2000.
この場合、時間軸方向の変化の傾向を考慮しないと、評価値Riは
Ri =(「役に立つ」と評価された文書数3000×「役に立つ」の評価係数3)
/全データベースに対して正規化した文書数2000
=4.5
となる。
In this case, if the change tendency in the time axis direction is not taken into consideration, the evaluation value Ri is Ri = (the number of documents evaluated as “useful” 3000 ×
/ 2000 documents normalized to all databases
= 4.5
It becomes.
一方、時間軸方向の変化の傾向を考慮して、X年間のうちの最近の1年間に着目すると、
Ri =(「役に立つ」と評価された文書数2000×「役に立つ」の評価係数3)
/全データベースに対して正規化した文書数2000
=3
となる。
On the other hand, considering the trend of change in the time axis direction, focusing on the most recent year of X years,
Ri = (the number of documents evaluated as “useful” 2000 ×
/ 2000 documents normalized to all databases
= 3
It becomes.
この違いは、最近の1年間は、データベース11iに登録された文書は、「役に立つ」と評価される度合いが、それ以前に比べて減少する傾向にあることを表している。 This difference indicates that the degree that documents registered in the database 11i are evaluated as “useful” tends to decrease compared to before that in the last one year.
ここで、時間軸方向の変化の傾向を考慮して、評価期間を「ある特定の期間」に限定することの利点について述べる。
まず、図1中のデータベース11A,11Bに登録されている文書の数が同一であり、アクセス頻度に関し、それぞれ
データベース11A:過去1年前まではアクセス頻度が高い
データベース11B:過去1年前まではアクセス頻度が低いが、最近の1年間はアクセス頻度が高い
のような傾向があるものとする。
Here, the advantages of limiting the evaluation period to “a specific period” in consideration of the tendency of change in the time axis direction will be described.
First, the number of documents registered in the
ここで、時間軸方向の変化の傾向を考慮しないで、データベース11A,11Bが作成されてから現在までの期間における当該データベース11A,11Bの評価値RA,RBを算出した結果、
データベース11Aの評価値RA =5
データベース11Bの評価値RB =4
が取得されたものとする。この場合、評価値RA>評価値RBのため、データベース11Aの方が有効なデータベースとして判断されることになる。
Here, as a result of calculating the evaluation values RA and RB of the
Evaluation value RA of
Evaluation value RB = 4 of
Is acquired. In this case, since the evaluation value RA> the evaluation value RB, the
しかし、管理者によっては、データベース11A,11Bが作成されてから現在までの期間の評価値よりも、最近1年間の評価値からアクセス頻度が高いデータベースを判別した方が有効であると考えられる。そこで、最近の1年間を評価期間として評価値RA及びRBを算出した結果、上述の傾向から、例えば
データベース11Aの評価値RA =4.2
データベース11Bの評価値RB =4.8
となったものとする。この場合、最近の1年間に絞って評価した場合には、データベース11Bの方が有効であるという結果が得られる。このように、管理者の操作に応じて運用管理クライアント18から評価期間を指定可能とすることで、管理者毎に、より有効なデータベースを使い分けることができるようになる。なお、1年単位、或は半年単位など、一定期間毎の評価値を算出して、その評価値の変化の傾向を管理者に提示することも可能である。
However, depending on the administrator, it may be more effective to discriminate a database having a high access frequency from the evaluation values of the last one year than the evaluation values in the period from the creation of the
Evaluation value RB of
Suppose that In this case, when the evaluation is focused on the latest one year, a result that the
[第2の実施形態]
上記第1の実施形態では、データベース11i毎の評価値Riがデータベース情報提示モジュール17によって運用管理クライアント18を介して管理者に提示される。管理者は、提示されたデータベース11i毎の評価値Riを、有効に利用されていないデータベースを削除するときの目安とすることができる。しかし、データベース11i毎の評価値Riを管理者に提示する代わりに、データベース11i毎の評価値Riから、データベースの自動更新頻度を変更する構成とすることも可能である。
[Second Embodiment]
In the first embodiment, the evaluation value Ri for each database 11 i is presented to the administrator by the database
そこで、データベースの自動更新を実現する本発明の第2の実施形態について図面を参照して説明する。図6は本発明の第2の実施形態に係る情報検索システムの構成を示すブロック図である。図6において、図1と等価な構成要素には同一符号を付してある。 Therefore, a second embodiment of the present invention that realizes automatic database update will be described with reference to the drawings. FIG. 6 is a block diagram showing a configuration of an information search system according to the second embodiment of the present invention. In FIG. 6, components equivalent to those in FIG.
図6のシステムが、図1のシステムと異なる主要な点は、データベース情報提示モジュール17及び運用管理クライアント18に代えて、自動更新モジュール19が用いられている点にある。この自動更新モジュール19は、統計・評価モジュール15によって算出されるデータベース11i毎の評価値Riから、当該データベース11i毎の収集モジュール12iによる情報の自動収集条件、例えば自動更新頻度(自動収集頻度)を決定(変更)する。そのために自動更新モジュール19は、データベース11i毎の評価値Riを統計・評価モジュール15から受信する。そして自動更新モジュール19は、データベース11i毎の評価値Riから、例えばアクセス頻度が低いデータベースに対しては自動更新頻度を減らし、アクセス頻度の高いデータベースに対しては自動更新頻度を増やすように、収集モジュール12A及び12Bを制御する。これにより、検索クライアント13のユーザは常に最新の有効なデータを検索することができ、運用管理のコストをより一層削減できる。この他に、アクセス頻度の高低に応じて、収集対象(収集範囲)を広げる、或は収集対象を狭めるように、収集モジュール12A及び12Bを制御することも可能である。
6 is different from the system of FIG. 1 in that an
また、図6のシステムに、図1に示したデータベース情報提示モジュール17及び運用管理クライアント18を追加して、データベース11i毎の評価値Riをデータベース情報提示モジュール17によって運用管理クライアント18を介して管理者に提示するようにしても構わない。
Further, the database
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。 Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Further, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, you may combine suitably the component covering different embodiment.
11A,11B…データベース、12A,12B…収集モジュール、13…検索クライアント、14…検索サーバ、15…統計・評価モジュール、16…統計・評価ログデータベース(ログ保存手段)、17…データベース情報提示モジュール、18…運用管理クライアント、19…自動更新モジュール、21A,21B…外部データソース、140…検索結果テーブル、160…ログ情報テーブル。 11A, 11B ... database, 12A, 12B ... collection module, 13 ... search client, 14 ... search server, 15 ... statistics / evaluation module, 16 ... statistics / evaluation log database (log storage means), 17 ... database information presentation module, 18 ... Operation management client, 19 ... Automatic update module, 21A, 21B ... External data source, 140 ... Search result table, 160 ... Log information table.
Claims (10)
ユーザからの検索要求で指定された検索条件に従って前記複数のデータベースの少なくとも1つから当該検索条件に合致するデータを検索して、その検索結果を前記ユーザに提示する検索サーバと、
前記検索サーバによる検索の履歴を含む、前記複数のデータベース各々の利用状況の履歴を保存するログ保存手段と、
前記ログ保存手段に保存されている前記複数のデータベース各々の利用状況の履歴に基づいて、前記複数のデータベース各々の利用状況の統計情報を生成し、当該統計情報に基づいて前記複数のデータベース各々の利用状況を評価する統計・評価手段と、
前記統計・評価手段による前記複数のデータベース各々の利用状況の評価結果を管理者に提示するデータベース情報提示手段とを具備し、
前記統計・評価手段は、データベース毎に、複数種の評価項目の各々について前記統計情報に基づく評価ポイントを得るとともに、得られた各評価ポイントに基づいてデータベース毎の評価値を算出する手段を具備し、
前記評価値は、評価項目毎に、当該評価項目の評価ポイントに応じた重み係数と、当該データベースの文書数に全データベースの平均文書数の対数を乗じて得られる値とを乗算して得られる値を、評価項目毎に加算して得られる値であることを特徴とするデータベース運用管理支援機能を有する情報検索システム。 Multiple databases with information collected from different data sources,
A search server that searches for data matching the search condition from at least one of the plurality of databases according to the search condition specified in the search request from the user, and presents the search result to the user;
Log storage means for storing a history of usage of each of the plurality of databases, including a history of searches by the search server;
Based on the history of the usage status of each of the plurality of databases stored in the log storage means, generates statistical information on the usage status of each of the plurality of databases, and based on the statistical information, Statistics / evaluation means to evaluate usage,
Database information presenting means for presenting an evaluation result of the usage status of each of the plurality of databases by the statistics / evaluation means to an administrator ;
The statistics / evaluation means includes means for obtaining an evaluation point based on the statistical information for each of a plurality of types of evaluation items for each database and calculating an evaluation value for each database based on the obtained evaluation points. And
The evaluation value is obtained by multiplying, for each evaluation item, a weight coefficient corresponding to the evaluation point of the evaluation item and a value obtained by multiplying the number of documents in the database by the logarithm of the average number of documents in all databases. An information search system having a database operation management support function, characterized in that a value is obtained by adding a value for each evaluation item .
前記統計・評価手段は、前記検索ヒット有無情報に対応する検索頻度、前記更新有無情報に対応する更新頻度、前記スコア、前記アクセス有無情報に対応するアクセス頻度、及び前記評価情報に対応するユーザ評価を含む複数の評価項目のうち、前記選択された複数の履歴に対応する評価項目の中から、管理者によって選択指定された少なくとも1つの評価項目を受け付けて、前記複数のデータベース各々の利用状況の履歴のうち、当該指定された評価項目に対応する情報に基づいて、当該指定された評価項目に関する前記複数のデータベース各々の利用状況の統計情報を生成し、当該統計情報に基づいて前記複数のデータベース各々の利用状況を評価する
ことを特徴とする請求項1記載のデータベース運用管理支援機能を有する情報検索システム。 The usage history history of each of the plurality of databases stored in the log storage means is a history for each registered information in each of the plurality of databases, and search hit presence / absence information indicating whether or not a search condition is satisfied, Update presence / absence information indicating the presence / absence of update, a score indicating the degree of matching with the search condition, access presence / absence information indicating whether or not the searched information is selected and referred to by the user, and the user referred to by the user Including multiple histories selected from the evaluation information indicating the evaluation of
The statistics / evaluation means includes a search frequency corresponding to the search hit presence information, an update frequency corresponding to the update presence information, the score, an access frequency corresponding to the access presence information, and a user evaluation corresponding to the evaluation information And receiving at least one evaluation item selected and designated by an administrator from among the evaluation items corresponding to the selected plurality of histories. Based on the information corresponding to the designated evaluation item in the history, the usage information of each of the plurality of databases related to the designated evaluation item is generated, and the plurality of databases is generated based on the statistical information. The information retrieval system having a database operation management support function according to claim 1, wherein each usage situation is evaluated. Stem.
前記統計・評価手段による前記複数のデータベース各々の利用状況の評価結果に基づいて、前記情報収集条件を変更する自動更新手段と
を更に具備することを特徴とする請求項1記載のデータベース運用管理支援機能を有する情報検索システム。 Information collecting means for collecting information from the different data sources according to set information collecting conditions and registering the collected information in the database corresponding to the data sources;
2. The database operation management support according to claim 1 , further comprising: an automatic update unit that changes the information collection condition based on an evaluation result of a usage situation of each of the plurality of databases by the statistics / evaluation unit. Information retrieval system with functions.
前記統計・評価手段による前記複数のデータベース各々の利用状況の評価結果に基づいて、前記情報収集条件の変更を管理者に促す手段と
を具備することを特徴とする請求項1記載のデータベース運用管理支援機能を有する情報検索システム。 Information collecting means for collecting information from the different data sources according to set information collecting conditions and registering the collected information in the database corresponding to the data sources;
The database operation management according to claim 1 , further comprising means for prompting an administrator to change the information collection condition based on an evaluation result of the usage status of each of the plurality of databases by the statistics / evaluation means. An information retrieval system having a support function.
ユーザからの検索要求で指定された検索条件に従って前記複数のデータベースの少なくとも1つから当該検索条件に合致するデータを検索して、その検索結果を前記ユーザに提示する検索サーバと、
前記検索サーバによる検索の履歴を含む、前記複数のデータベース各々の利用状況の履歴を保存するログ保存手段と、
前記ログ保存手段に保存されている前記複数のデータベース各々の利用状況の履歴に基づいて、前記複数のデータベース各々の利用状況の統計情報を生成し、当該統計情報に基づいて前記複数のデータベース各々の利用状況を評価する統計・評価手段と、
設定された情報収集条件に従って、前記異なるデータソースから情報を収集し、その収集された情報を当該データソースに対応する前記データベースに登録する情報収集手段と、
前記統計・評価手段による前記複数のデータベース各々の利用状況の評価結果に基づいて、前記情報収集条件を変更する自動更新手段と
を具備し、
前記統計・評価手段は、データベース毎に、複数種の評価項目の各々について前記統計情報に基づく評価ポイントを得るとともに、得られた各評価ポイントに基づいてデータベース毎の評価値を算出する手段を具備し、
前記評価値は、評価項目毎に、当該評価項目の評価ポイントに応じた重み係数と、当該データベースの文書数に全データベースの平均文書数の対数を乗じて得られる値とを乗算して得られる値を、評価項目毎に加算して得られる値であることを特徴とするデータベース運用管理支援機能を有する情報検索システム。 Multiple databases with information collected from different data sources,
A search server that searches for data matching the search condition from at least one of the plurality of databases according to the search condition specified in the search request from the user, and presents the search result to the user;
Log storage means for storing a history of usage of each of the plurality of databases, including a history of searches by the search server;
Based on the history of the usage status of each of the plurality of databases stored in the log storage means, generates statistical information on the usage status of each of the plurality of databases, and based on the statistical information, Statistics / evaluation means to evaluate usage,
Information collecting means for collecting information from the different data sources according to set information collecting conditions and registering the collected information in the database corresponding to the data sources;
Automatic update means for changing the information collection condition based on the evaluation results of the usage status of each of the plurality of databases by the statistics / evaluation means ,
The statistics / evaluation means includes means for obtaining an evaluation point based on the statistical information for each of a plurality of types of evaluation items for each database and calculating an evaluation value for each database based on the obtained evaluation points. And
The evaluation value is obtained by multiplying, for each evaluation item, a weight coefficient corresponding to the evaluation point of the evaluation item and a value obtained by multiplying the number of documents in the database by the logarithm of the average number of documents in all databases. An information search system having a database operation management support function, characterized in that a value is obtained by adding a value for each evaluation item .
統計・評価手段が、前記ユーザからの検索要求で指定された検索条件に従う検索の都度、当該検索で取得される情報を当該検索の対象となった前記データベースの利用状況の履歴の一部としてログ保存手段に保存するステップと、
前記統計・評価手段が、前記ログ保存手段に保存されている前記複数のデータベース各々の利用状況の履歴に基づいて、前記複数のデータベース各々の利用状況の統計情報を生成するステップと、
前記統計・評価手段が、生成された前記複数のデータベース各々の利用状況の統計情報に基づいて前記複数のデータベース各々の利用状況を評価するステップと、
データベース情報提示手段が、前記複数のデータベース各々の利用状況の評価結果を管理者に提示するステップと
を具備し、
前記統計・評価手段が評価するステップは、データベース毎に、複数種の評価項目の各々について前記統計情報に基づく評価ポイントを得るとともに、得られた各評価ポイントに基づいてデータベース毎の評価値を算出するステップを具備し、
前記評価値は、評価項目毎に、当該評価項目の評価ポイントに応じた重み係数と、当該データベースの文書数に全データベースの平均文書数の対数を乗じて得られる値とを乗算して得られる値を、評価項目毎に加算して得られる値であることを特徴とするデータベース運用管理方法。 In accordance with a search condition specified by a search request from a user, data that matches the search condition is searched from at least one of a plurality of databases in which information collected from different data sources is registered, and the search result is In an information search system presented to a user, a database operation management method for managing operations of the plurality of databases,
Each time the search according to the search condition specified by the search request from the user is performed by the statistics / evaluation means, the information acquired by the search is logged as a part of the history of the usage status of the database subjected to the search. Storing in the storage means;
The statistical / evaluation means , based on a history of usage status of each of the plurality of databases stored in the log storage means, generating statistical information of usage status of each of the plurality of databases;
The statistic / evaluation means evaluating the usage status of each of the plurality of databases based on the generated statistical information of the usage status of each of the plurality of databases;
Database information presenting means comprising the step of presenting to the administrator the evaluation results of the usage status of each of the plurality of databases ,
The step of evaluating by the statistical / evaluation means obtains an evaluation point based on the statistical information for each of a plurality of types of evaluation items for each database, and calculates an evaluation value for each database based on the obtained evaluation points. Comprising the steps of:
The evaluation value is obtained by multiplying, for each evaluation item, a weight coefficient corresponding to the evaluation point of the evaluation item and a value obtained by multiplying the number of documents in the database by the logarithm of the average number of documents in all databases. A database operation management method characterized by being a value obtained by adding a value for each evaluation item .
前記検索ヒット有無情報に対応する検索頻度、前記スコア、前記アクセス有無情報に対応するアクセス頻度、及び前記評価情報に対応するユーザ評価を含む複数の評価項目のうち、前記選択された複数の履歴に対応する評価項目の中から、少なくとも1つの評価項目が管理者によって選択指定された場合に、当該指定された評価項目に対応する情報に基づいて、当該指定された評価項目に関する前記複数のデータベース各々の利用状況の統計情報が生成されて、当該統計情報に基づいて前記複数のデータベース各々の利用状況が評価される
ことを特徴とする請求項9記載のデータベース運用管理方法。 The usage history history of each of the plurality of databases is a history for each registered information in each of the plurality of databases, and represents search hit presence / absence information indicating whether or not the search condition is met, and the degree of matching to the search condition. Including a plurality of histories selected from the score, the access presence / absence information indicating whether or not the searched information is selected and referred to by the user, and the evaluation information indicating the user's evaluation with respect to the information referred to by the user ,
Among the plurality of evaluation items including the search frequency corresponding to the search hit presence / absence information, the score, the access frequency corresponding to the access presence / absence information, and the user evaluation corresponding to the evaluation information, When at least one evaluation item is selected and specified by the administrator from among the corresponding evaluation items, each of the plurality of databases related to the specified evaluation item based on information corresponding to the specified evaluation item The database operation management method according to claim 9, wherein statistical information on the usage status of the database is generated, and usage status of each of the plurality of databases is evaluated based on the statistical information.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004284672A JP4163671B2 (en) | 2004-09-29 | 2004-09-29 | Information retrieval system having database operation management support function and database operation management method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004284672A JP4163671B2 (en) | 2004-09-29 | 2004-09-29 | Information retrieval system having database operation management support function and database operation management method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006099426A JP2006099426A (en) | 2006-04-13 |
| JP4163671B2 true JP4163671B2 (en) | 2008-10-08 |
Family
ID=36239172
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004284672A Expired - Fee Related JP4163671B2 (en) | 2004-09-29 | 2004-09-29 | Information retrieval system having database operation management support function and database operation management method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4163671B2 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5830895B2 (en) * | 2011-03-29 | 2015-12-09 | 日本電気株式会社 | Information search system, search server, information search method and program |
| JP6617499B2 (en) * | 2015-09-29 | 2019-12-11 | 日本電気株式会社 | Information processing apparatus, electronic whiteboard search method, and program |
| JP6871799B2 (en) * | 2017-04-28 | 2021-05-12 | キヤノンマーケティングジャパン株式会社 | Information processing equipment, information processing system, its control method and program |
-
2004
- 2004-09-29 JP JP2004284672A patent/JP4163671B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2006099426A (en) | 2006-04-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8140541B2 (en) | Time-weighted scoring system and method | |
| US20220365966A1 (en) | System and method for providing content to users based on interactions by similar other users | |
| JP5673336B2 (en) | Information processing method, display method, information processing apparatus, display apparatus, information processing program, display program | |
| US7747612B2 (en) | Indication of exclusive items in a result set | |
| US8645390B1 (en) | Reordering search query results in accordance with search context specific predicted performance functions | |
| US20060173556A1 (en) | Methods and apparatus for using user gender and/or age group to improve the organization of documents retrieved in response to a search query | |
| JP2008146412A (en) | Network management system, network management program, and network management method | |
| US20180032614A1 (en) | System And Method For Compiling Search Results Using Information Regarding Length Of Time Users Spend Interacting With Individual Search Results | |
| JP4453437B2 (en) | Search keyword ranking method, apparatus and program | |
| JP2012113544A (en) | Restaurant recommendation system | |
| US20120130974A1 (en) | Search engine for ranking a set of pages returned as search results from a search query | |
| JP5296745B2 (en) | Query suggestion providing apparatus and method | |
| JP5488031B2 (en) | Search device | |
| JP4163671B2 (en) | Information retrieval system having database operation management support function and database operation management method | |
| JP4759600B2 (en) | Text search device, text search method, text search program and recording medium thereof | |
| JP2004272492A (en) | Method for retrieving/displaying web site | |
| US10394826B1 (en) | System and methods for searching query data | |
| JP2006092023A (en) | Document control computer program, document control device and method | |
| JP2003108594A (en) | Information retrieval apparatus and method | |
| JP2007213200A (en) | Information processor having file search function, and program, method, and system for changing file search result priority | |
| JP5663742B2 (en) | Image search server and image information management method for image search server | |
| JP4528203B2 (en) | File search method, file search device, and file search program | |
| US20060007477A1 (en) | Storage medium storing computer program for presenting document registrant, document registrant presenting method, and document management apparatus | |
| JP5813560B2 (en) | Search condition presentation device, method, and program | |
| JP5519406B2 (en) | Server apparatus, genre score calculation method, and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071120 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071127 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080128 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080722 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080724 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110801 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120801 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120801 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130801 Year of fee payment: 5 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| LAPS | Cancellation because of no payment of annual fees |