JP4636734B2 - 情報検索システム、情報検索方法、情報検索プログラム、情報検索プログラムを記録した記録媒体、出力情報選択装置、出力情報選択方法、出力情報選択プログラム及び出力情報選択プログラムを記録した記録媒体 - Google Patents
情報検索システム、情報検索方法、情報検索プログラム、情報検索プログラムを記録した記録媒体、出力情報選択装置、出力情報選択方法、出力情報選択プログラム及び出力情報選択プログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP4636734B2 JP4636734B2 JP2001168547A JP2001168547A JP4636734B2 JP 4636734 B2 JP4636734 B2 JP 4636734B2 JP 2001168547 A JP2001168547 A JP 2001168547A JP 2001168547 A JP2001168547 A JP 2001168547A JP 4636734 B2 JP4636734 B2 JP 4636734B2
- Authority
- JP
- Japan
- Prior art keywords
- target information
- search target
- feature vector
- search
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、情報検索システム、情報検索方法、情報検索プログラム、情報検索プログラムを記録した記録媒体、出力情報選択装置、出力情報選択方法、出力情報選択プログラム及び出力情報選択プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
ユーザがインターネット上で文書検索し、あるいは特定の場所に設置されている文書データベースにアクセスして文書検索する場合、クリエーとして自分の必要としている文書内容を記述したテキストデータを入力し、あるいは自分の必要としている文書のモデルとなる既存の文書のテキストデータを入力し、検索指令を与えると、検索エンジン側で、クリエーとして入力された文書のテキストデータに類似するテキストデータを持つ文書を抽出してユーザに提示する情報検索システムが知られている。
【0003】
このような情報検索システムでは、例えば、tf*idfに代表されるベクトル空間モデルを利用する。これは、多数の文書のテキストデータを分析して特徴ベクトルを求めてデータベースに登録しておき、ユーザが入力したテキストデータの特徴ベクトルを求め、すでにデータベースに登録されている特徴ベクトル群から類似する特徴ベクトルを抽出し、それらの抽出された特徴ベクトルを持つ文書を検索結果としてユーザに提示するものである。
【0004】
上記のtf*idfは、文書のテキストデータ中の各単語の出現頻度に、他の検索対象文書のテキストデータ中の出現頻度を考慮した重みを加えた特徴量である。単語に対する重みwt は、次のような式1によって表わされる。
【0005】
【数1】
ここで、Nは検索対象文書数、ft は単語tを含む文書数である。
【0006】
文書のテキストデータの特徴ベクトルの各要素wd,t は、次のように計算される。
【0007】
【数2】
ここで、fd,t は、文書dのテキストデータ中の単語tの出現頻度である。
【0008】
また、特徴量をベクトルで表した文書間の類似度を求める尺度としては、例えば、コサイン係数(Cosine coefficient)がある。このコサイン係数では、2つのベクトルx,y間の類似度sim(x,y)を次の数3式で表す。
【0009】
【数3】
そして、従来の情報検索システムでは、ユーザのクエリーとしてのテキストデータの特徴ベクトルとの類似度が所定のしきい値よりも高い特徴ベクトルを持つ文書を抽出し、図12に示すように類似度の高いものから順に並べる形式で検索結果を提示していた。
【0010】
図12に示した類似度順の検索結果をベクトル空間に模式的に表わすと、図13のようになる。つまり、クエリーQの特徴ベクトルと、しきい値以内の高い類似度を持つ文書A〜Eそれぞれの特徴ベクトルとの空間位置関係は図13のように表わされるのである。この図13において、クエリーQに対してしきい値内で類似度が高い順番は、クエリーQに対する距離尺度がA<D<B<C<EであることからA,D,B,C,Eである。
【0011】
なお、文書の特徴ベクトルで表すモデルとしては、tf*idf以外に、例えば、「Automatic Text Processing The Transformation, Analysis, and Retrieval of Information by Computer Gerard Salton」に示されるように、Term-discrimination ValueやProbabilistic Term Weighting等、様々なモデルがある。
【0012】
また、類似度を求めるための尺度としても、上のCosine coefficient以外にも、上に例示した文献に示されているように、Inner product、Dice coefficient、Jaccard coefficient等、様々な距離尺度がある。
【0013】
【発明が解決しようとする課題】
このような従来の情報検索システムでは、次のような問題点があった。図13に示したように、しきい値以内にある類似度の高い文書A〜Eではあっても、クエリーQに対してそれらの特徴ベクトルの方向はまちまちである。ところが、通常、検索結果は図12に示すように類似度の高い順に表示されるだけであるため、ユーザはクエリーQに一番近い文書Aを展開して読んでみたところ、自分の求めている内容であることが分かったとしても、次には文書AとはクエリーQに対する向きが反対である、類似度が2番目に高い文書Dを開くことになる。その次にはまた、クエリーQに対して文書Dとは方向がほぼ正反対であるが、文書Aとは特徴ベクトルが近い、類似度が3番目の文書Bを開く。そしてその次は、これらの文書とは全く方向が異なる文書Cを開くことになる。
【0014】
しかしながら、現実には、ユーザにとっては、例えば、類似度が一番高い文書Aを開いてみたところ、内容的に自分の求めている文書と関連性が高ければ、次には特徴ベクトルの方向として、2番目に類似度が高いが、クエリーQに対して特徴ベクトルが1番目の文書Aとは反対を向く文書Dを開くよりも、文書Aと同方向を向く特徴ベクトルを持つ文書Bを開く方が望ましい。
【0015】
しかし、従来は特徴ベクトルの方向を考慮せずに単純に類似度の順に展開するだけであったので、このようなユーザの要求に応えることはできず、ユーザが必要としている内容の文書を見出すまでに手間がかかる問題点があった。
【0016】
本発明は、このような従来の問題点に鑑みてなされたもので、類似度検索結果からユーザが必要としている情報の閲覧が可能な限り無駄なく行える技術を提供することを目的とする。
【0017】
【課題を解決するための手段】
請求項1の発明の情報検索システムは、ユーザの入力するクエリーを受け付けるクエリー入力部と、このクエリー入力部の受け付けたクエリーから特徴ベクトルを作成する特徴ベクトル作成部と、多数の検索対象情報のインデックス、内容を表すデータ及び特徴ベクトルデータを登録している情報データベースと、前記特徴ベクトル作成部で作成されたクエリーの特徴ベクトルと前記情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す類似度演算部と、この類似度演算部の取り出したデータを保存する検索結果保持部と、前記類似度演算部の取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する検索結果出力部と、前記検索結果出力部の出力している検索結果に対するユーザの適/不適の判断入力を受け付け、(1)適入力の場合には、前記検索結果保持部に対して、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補として前記検索結果出力部によって出力させ、(2)不適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記検索結果保持部の保持している検索対象情報を検索し、該当する検索対象情報があればその内容を次候補として前記検索結果出力部によって出力させるフィードバック処理部とを備えたものである。
【0018】
請求項2の発明の情報検索システムは、ユーザの入力するクエリーを受け付けるクエリー入力部と、このクエリー入力部の受け付けたクエリーから特徴ベクトルを作成する特徴ベクトル作成部と、多数の検索対象情報のインデックス、内容を表すデータ及び特徴ベクトルデータを登録している情報データベースと、前記特徴ベクトル作成部で作成されたクエリーの特徴ベクトルと前記情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す類似度演算部と、この類似度演算部の取り出したデータを保存する検索結果保持部と、前記類似度演算部が求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記検索結果保持部に保持しているすべての検索対象情報を網羅するまで繰り返して決定木を作成する決定木作成部と、前記類似度演算部の取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する検索結果出力部と、前記検索結果出力部の出力している検索結果に対するユーザの適/不適の判断入力を受け付け、前記決定木作成部の作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を前記検索結果出力部によって出力させるフィードバック処理部とを備えたものである。
【0019】
請求項3の発明の情報検索システムは、ユーザの入力するクエリーを受け付けるクエリー入力部と、このクエリー入力部の受け付けたクエリーから特徴ベクトルを作成する特徴ベクトル作成部と、多数の検索対象情報のインデックス、内容を表すデータ及び特徴ベクトルデータを登録している情報データベースと、前記特徴ベクトル作成部で作成されたクエリーの特徴ベクトルと前記情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す類似度演算部と、この類似度演算部の取り出したデータを保存する検索結果保持部と、前記類似度演算部が求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、(2)不適入力の場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記検索結果保持部に保持している検索対象情報群について所定段階まで繰り返して決定木を作成する決定木作成部と、前記類似度演算部の取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する検索結果出力部と、前記検索結果出力部の出力している検索結果に対するユーザの適/不適の判断入力を受け付け、前記決定木作成部の作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を前記検索結果出力部によって出力させ、かつ前記決定木作成部に対して、既存の決定木を成長させる条件に至ったならば前記決定木作成部に決定木を所定段階だけ成長させる指示を与えるフィードバック処理部とを備えたものである。
【0020】
請求項4の発明は、請求項1〜3の情報検索システムにおいて、前記クエリー及び検索対象情報はテキストデータであることを特徴とするものである。
【0021】
請求項5の発明の情報検索方法は、クエリー入力部がユーザの入力するクエリーを受け付けるステップ1と、特徴ベクトル作成部が前記受け付けたクエリーから特徴ベクトルを作成するステップ2と、前記特徴ベクトル作成部で作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を類似度演算部が演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出すステップ3と、ステップ3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを検索結果出力部が出力するステップ4と、ステップ4で出力している検索結果に対するユーザの適/不適の判断入力をフィードバック処理部が受け付け、(1)適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記ステップ3で取り出した検索対象情報の中を検索し、該当する検索対象情報があればその内容を次候補として出力し、(2)不適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記ステップ3で取り出した検索対象情報の中を検索し、該当する検索対象情報があればその内容を次候補として出力するステップ5とを有するものである。
【0022】
請求項6の発明の情報検索方法は、クエリー入力部がユーザの入力するクエリーを受け付けるステップ1と、特徴ベクトル作成部が前記受け付けたクエリーから特徴ベクトルを作成するステップ2と、前記特徴ベクトル作成部で作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出すステップ3と、
ステップ3で求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、ステップ3で取り出した検索対象情報のすべてを網羅するまで繰り返して決定木を作成するステップ4と、
ステップ3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力するステップ5と、ステップ5で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、ステップ4で作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を出力させるステップ6とを有するものである。
【0023】
請求項7の発明の情報検索方法は、クエリー入力部がユーザの入力するクエリーを受け付けるステップ1と、特徴ベクトル作成部が前記受け付けたクエリーから特徴ベクトルを作成するステップ2と、作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出すステップ3と、ステップ3で求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、ステップ3で取り出した検索対象情報について所定段階まで繰り返して決定木を作成するステップ4と、ステップ3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力するステップ5と、ステップ5で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、ステップ4で作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を出力し、かつステップ4で作成した決定木を成長させる条件に至ったならば当該決定木を所定段階だけ成長させるステップ6とを有するものである。
【0024】
請求項8の発明は、請求項5〜7の情報検索方法において、前記クエリー及び検索対象情報はテキストデータであることを特徴とするものである。
【0025】
請求項9の発明の情報検索プログラムは、ユーザの入力するクエリーを受け付ける処理1と、受け付けたクエリーから特徴ベクトルを作成する処理2と、作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す処理3と、処理3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する処理4と、処理4で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、(1)適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記処理3で取り出した検索対象情報の中を検索し、該当する検索対象情報があればその内容を次候補として出力し、(2)不適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記処理3で取り出した検索対象情報の中を検索し、該当する検索対象情報があればその内容を次候補として出力する処理5とをコンピュータに実行させるものである。
【0026】
請求項10の発明の情報検索プログラムは、ユーザの入力するクエリーを受け付ける処理1と、受け付けたクエリーから特徴ベクトルを作成する処理2と、作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す処理3と、処理3で求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、処理3で取り出した検索対象情報のすべてを網羅するまで繰り返して決定木を作成する処理4と、処理3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する処理5と、処理5で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、処理4で作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を出力させる処理6とをコンピュータに実行させるものである。
【0027】
請求項11の発明の情報検索プログラムは、ユーザの入力するクエリーを受け付ける処理1と、受け付けたクエリーから特徴ベクトルを作成する処理2と、作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す処理3と、処理3で求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、処理3で取り出した検索対象情報について所定段階まで繰り返して決定木を作成する処理4と、処理3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する処理5と、処理5で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、処理4で作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を出力し、かつ処理4で作成した決定木を成長させる条件に至ったならば当該決定木を所定段階だけ成長させる処理6とをコンピュータに実行させるものである。
【0028】
請求項12の発明は、請求項9〜11の情報検索プログラムにおいて、前記クエリー及び検索対象情報はテキストデータであることを特徴とするものである。
【0029】
請求項13の発明の記録媒体は、ユーザの入力するクエリーを受け付ける処理1と、
受け付けたクエリーから特徴ベクトルを作成する処理2と、作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す処理3と、処理3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する処理4と、処理4で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、(1)適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記処理3で取り出した検索対象情報の中を検索し、該当する検索対象情報があればその内容を次候補として出力し、(2)不適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記処理3で取り出した検索対象情報の中を検索し、該当する検索対象情報があればその内容を次候補として出力する処理5とをコンピュータに実行させる情報検索プログラムを記録したものである。
【0030】
請求項14の発明の記録媒体は、ユーザの入力するクエリーを受け付ける処理1と、受け付けたクエリーから特徴ベクトルを作成する処理2と、作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す処理3と、処理3で求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、処理3で取り出した検索対象情報のすべてを網羅するまで繰り返して決定木を作成する処理4と、処理3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する処理5と、処理5で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、処理4で作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を出力させる処理6とをコンピュータに実行させる情報検索プログラムを記録したものである。
【0031】
請求項15の発明の記録媒体は、ユーザの入力するクエリーを受け付ける処理1と、受け付けたクエリーから特徴ベクトルを作成する処理2と、作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す処理3と、処理3で求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、処理3で取り出した検索対象情報について所定段階まで繰り返して決定木を作成する処理4と、処理3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する処理5と、処理5で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、処理4で作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を出力し、かつ処理4で作成した決定木を成長させる条件に至ったならば当該決定木を所定段階だけ成長させる処理6とをコンピュータに実行させる情報検索プログラムを記録したものである。
【0032】
請求項16の発明は、請求項13〜15の記録媒体において、前記クエリー及び検索対象情報はテキストデータであることを特徴とするものである。
【0033】
請求項17の発明の出力情報選択装置は、一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する特徴データ保持部と、前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する表示情報出力部と、前記出力された検索対象情報に対して、ユーザの適/不適の判断入力を受け付けるフィードバック受付部と、(1)前記ユーザの判断入力が適である場合には、前記表示情報出力部が現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を前記表示情報出力部に出力させ、(2)前記ユーザの判断入力が不適である場合には、前記表示情報出力部が現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を前記表示情報出力部に出力させる出力情報選択部とを備えたものである。
【0034】
請求項18の発明の出力情報選択装置は、一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する特徴データ保持部と、前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する表示情報出力部と、前記特徴データ保持部に保持されている一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記特徴データ保持部に保持されているすべての検索対象情報を網羅するまで繰り返して決定木を作成する決定木作成部と、前記表示情報出力部が出力している検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木作成部の作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を前記表示情報出力部によって出力させるフィードバック処理部とを備えたものである。
【0035】
請求項19の発明の出力情報選択装置は、一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する特徴データ保持部と、前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する表示情報出力部と、前記特徴データ保持部に保持されている一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記特徴データ保持部に保持されている検索対象情報群について所定段階まで繰り返して決定木を作成する決定木作成部と、前記表示情報出力部が出力している検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木作成部の作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を前記表示情報出力部によって出力させると共に、前記決定木作成部に対して、既存の決定木を成長させる条件に至ったならば前記決定木作成部に決定木を所定段階だけ成長させる指示を与えるフィードバック処理部とを備えたものである。
【0036】
請求項20の発明の出力情報選択方法は、特徴データ保持部が一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持するステップ1と、表示情報出力部が前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力するステップ2と、フィードバック受付部が現在出力中の検索対象情報に対して、ユーザの適/不適の判断入力を受け付け、(1)前記ユーザの判断入力が適である場合には、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を出力し、(2)前記ユーザの判断入力が不適である場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を出力するステップ3とを有するものである。
【0037】
請求項21の発明の出力情報選択方法は、特徴データ保持部が一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持するステップ1と、表示情報出力部が前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力するステップ2と、フィードバック受付部が前記一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記一群の検索対象情報のすべてを網羅するまで繰り返して決定木を作成するステップ3と、現在出力中の検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を出力するステップ4とを有するものである。
【0038】
請求項22の発明の出力情報選択方法は、特徴データ保持部が一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持するステップ1と、表示情報出力部が前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力するステップ2と、フィードバック受付部が前記一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記一群の検索対象情報について所定段階まで繰り返して決定木を作成するステップ3と、現在出力中の検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を出力すると共に、既存の決定木を成長させる条件に至ったならば前記決定木を所定段階だけ成長させるステップ4とを有するものである。
【0039】
請求項23の発明の出力情報選択プログラムは、一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する処理1と、前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する処理2と、現在出力中の検索対象情報に対して、ユーザの適/不適の判断入力を受け付け、(1)前記ユーザの判断入力が適である場合には、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を出力し、(2)前記ユーザの判断入力が不適である場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を出力する処理3とをコンピュータに実行させるものである。
【0040】
請求項24の発明の出力情報選択プログラムは、一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する処理1と、前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する処理2と、前記一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記一群の検索対象情報のすべてを網羅するまで繰り返して決定木を作成する処理3と、現在出力中の検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を出力する処理4とをコンピュータに実行させるものである。
【0041】
請求項25の発明の出力情報選択プログラムは、一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する処理1と、前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する処理2と、前記一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記一群の検索対象情報について所定段階まで繰り返して決定木を作成する処理3と、現在出力中の検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を出力すると共に、既存の決定木を成長させる条件に至ったならば前記決定木を所定段階だけ成長させる処理4とをコンピュータに実行させるものである。
【0042】
請求項26の発明の記録媒体は、一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する処理1と、前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する処理2と、現在出力中の検索対象情報に対して、ユーザの適/不適の判断入力を受け付け、(1)前記ユーザの判断入力が適である場合には、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を出力し、(2)前記ユーザの判断入力が不適である場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を出力する処理3とを実行する出力情報選択プログラムを記録したものである。
【0043】
請求項27の発明の記録媒体は、一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する処理1と、前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する処理2と、前記一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記一群の検索対象情報のすべてを網羅するまで繰り返して決定木を作成する処理3と、現在出力中の検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を出力する処理4とを実行する出力情報選択プログラムを記録したものである。
【0044】
請求項28の発明の記録媒体は、一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する処理1と、前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する処理2と、前記一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記一群の検索対象情報について所定段階まで繰り返して決定木を作成する処理3と、現在出力中の検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を出力すると共に、既存の決定木を成長させる条件に至ったならば前記決定木を所定段階だけ成長させる処理4とを実行する出力情報選択プログラムを記録したものである。
【0045】
【発明の実施の形態】
以下、本発明の実施の形態を図に基づいて詳説する。本発明の特徴は、特徴ベクトルに基づき類似度検索を行って得られた文書群を、それらの持つ特徴ベクトルの方向を考慮して分類し、検索結果として提示されている文書群からユーザが1つの文書を開いた場合に、その内容に関してユーザの満足度(つまり、ユーザが求めていた内容の文書であるか否か)をYES,NOによって入力させ、ユーザの満足度に応じて次に展開する文書をコンピュータ側で自動的に選択して提示するようにすることにより、類似度の高低を基本としながらも特徴ベクトルの方向性も考慮し、ユーザの求めている情報に即した検索結果を順次展開できるようにすることである。
【0046】
図1は、本発明の情報検索システムの機能的な構成を示している。この情報検索システムは、コンピュータシステムで構成され、若しくは複数台のコンピュータをケーブルで接続するネットワークシステムで構成される。本システムは、機能的な構成要素として、ユーザが自分の必要とする内容を表現するテキストデータ、又は自分の必要とする内容を含む文書のテキストデータをクエリーとして入力するクエリー入力部1、このクエリー入力部1から入力されたテキストデータから特徴ベクトルを作成する特徴ベクトル作成部2、保存されている多数の文書のインデックス、テキストデータ、各文書ごとの特徴ベクトルデータが格納されている文書データベース3、特徴ベクトル作成部2で作成されたクエリーの特徴ベクトルと文書データベース3に登録されている文書ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ文書を特定し、それらのインデックス、テキストデータ及び特徴ベクトルを取り出す類似度演算部4、この類似度演算部4の取り出したデータを保存する検索結果保持部5を備えている。
【0047】
本システムはまた、類似度演算部4が取り出した類似度の高い文書群のインデックスやテキストデータを表示し、必要に応じて印字出力する検索結果出力部7、ユーザによる検索結果に対するフィードバック操作を受け付け、対応する処理を検索結果保持部5に対して与えるフィードバック処理部8を備えている。
【0048】
次に、上記の構成の情報検索システムによる情報検索方法について、図2を用いて説明する。この情報検索システムでは、ユーザがクエリー入力部1により、自分の必要とする内容を表現するテキストデータ、又は自分の必要とする内容を含む文書のテキストデータをクエリーとして入力すると(ステップS1)、特徴ベクトル作成部2が、入力されたクリエーのテキストデータから特徴ベクトルを作成する(ステップS3)。この特徴ベクトルの作成は、従来から広く利用されている数1式、数2式を用いるtf*idfによる。なお、特徴ベクトルの作成方法は、従来例で列挙した他の方法であってもよい
次に、類似度演算部4により、文書データベース3に保存されている多数の文書それぞれの特徴ベクトルと特徴ベクトル作成部2で作成されたクエリーの特徴ベクトルとの類似度を前述の数3式を用いて演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ文書を特定し、それらのインデックス、テキストデータ及び特徴ベクトルを取り出し(ステップS5)、検索結果のデータとして検索結果保持部5に一時保存する(ステップS7)。なお、類似度の演算も、従来例で列挙した他の方法であってもよい。
【0049】
こうして得られた検索結果に対して、検索結果出力部7はクエリーに対して類似度が一番高い特徴ベクトルを持つ文書の内容を表す情報を表示する(ステップS9)。なお、この文書内容を表す情報には、文書のタイトル、著者名、発行年月日、概要を含む。また、ユーザの指定により文書のテキストデータすべてを展開表示させることもできる。
【0050】
この文書の内容の表示に対して、ユーザがUIデバイス(例えば、キーボードや、マウスのようなポインティングデバイス)により自分の求めていた内容の文書であるか(YES)否か(NO)の判断を入力すると、フィードバック処理部8がこの判断入力を受け付けて、次のYES/NOのいずれかの処理を行う(ステップS11)。
【0051】
ユーザが、最初に提示された文書の内容について、自分の求めていた内容であると判断し、YESを入力した場合、フィードバック処理部8は検索結果保持部5に対して、現在出力中の文書の特徴ベクトルに類似度が最も高い特徴ベクトルを持つ文書を検索し、該当する文書があればその内容を検索結果出力部7によって表示させる(ステップS13,S19,S21)。
【0052】
ユーザが、最初に提示された文書の内容について、自分の求めていた内容ではないと判断し、ステップS11でNOを入力した場合、フィードバック処理部8は、クエリーの特徴ベクトルに対して現在出力中の文書の持つ特徴ベクトルと反対向きになる仮想ベクトルを算定し(ステップS15)、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ文書を検索結果保持部5に保持されている文書群から抽出し、その文書内容を検索結果出力部7に表示させる(ステップS17〜S21)。
【0053】
こうして、ステップS21で二番目に表示させた文書の内容について、ユーザはUIデバイスによってYES/NOの判断を入力すれば、ステップS11〜S21の処理を繰り返す。三番目以降の文書について同様である。そして、検索結果保持部5に該当する特徴ベクトルを持つ文書がなくなれば検索結果の出力を終了する(ステップS19でNOに分岐)。
【0054】
以上の情報検索方法による検索結果の出力形態を、図3〜図5を用いて説明する。類似度演算部4による類似度演算結果として得られた文書群は、従来と同様に図12に示すものであったとする。つまり、クエリーQに対して、類似度がしきい値を超える特徴ベクトルを持つ文書が類似度の高い順に、A,D,B,C,Eであったとする。そして、各文書の特徴ベクトルは図示したように種々の方向を向いているものとする。
【0055】
最初の検索結果表示では、図3に示すように、クエリーQに対して類似度が一番高い文書Aについて、その内容を表示する。そして、ユーザがYES/NOの判断入力を行えるように、「関係あり(適)」、「関係なし(不適)」の選択ボタン11,12を表示する。
【0056】
そして、ユーザが文書Aの内容を確認し、自分の求めていた内容のものであるため「関係あり」のボタン11を操作すれば、続いて、図13においてこの文書Aの特徴ベクトルに対して類似度が最も高い特徴ベクトルを持つ文書を検索結果の文書群の中から検索し、文書Bを抽出する。そして図4の(a)に示すように、抽出した文書Bの内容を表示する。
【0057】
ここで反対に、ユーザが文書Aの内容を確認し、「関係なし」のボタン12を操作すれば、上述したように、類似度の基準とした文書であるクエリーQに対して、文書Aの特徴ベクトルと正反対の方向の仮想ベクトルA′を次の数4式によって求める。
【0058】
【数4】
ここで、αはあらかじめ与えられた定数である。
【0059】
この仮想ベクトルA′は、図5に示すようにクエリーQに対して、文書Aの特徴ベクトルと正反対の向きにある。
【0060】
そしてこの仮想ベクトルA′を用いて、これに最も近い特徴ベクトルを持つ文書を検索して文書Dを抽出し、その文書Dの内容を図4(b)に示すように表示する。
【0061】
以下も同様に、例えば、図4(a)の文書Bの内容を表示している状態でユーザが「関係あり」のボタンを操作し、あるいは同図(b)の文書Dの内容を表示している状態でユーザが「関係あり」のボタン操作をすれば、文書B、文書Dの特徴ベクトルに類似度が最も高い特徴ベクトルを持つ文書を検索結果の文書群の中から抽出する。
【0062】
逆に、例えば、図4(a)の文書Bの内容を表示している状態でユーザが「関係なし」のボタンを操作した場合には、この文書Bを導き出した1回前の文書Aの特徴ベクトルに対して、文書Bの特徴ベクトルと反対方向の仮想ベクトルB′を数4式によって求め、この仮想ベクトルB′に対して類似度が最も高い特徴ベクトルを持つ文書を検索する。これにより、文書Dが抽出され、その内容が表示されることになる。
【0063】
以下、同様の方法により、ユーザの判断入力を反映し、ユーザにとって必要とする内容に近い内容を持つ文書群を優先的に順次に提示することができることになる。
【0064】
なお、図1に示すシステムにおいて、用いるコンピュータの性能により、クエリー入力部1〜類似度演算部4はサーバ側の機能とし、これにLANやインターネットその他のネットワークで接続されたクライアント側に検索結果保持部5、検索結果出力部7、フィードバック処理部8を設けるシステム構成にすることができる。あるいは、クエリー入力部1〜検索結果保持部5はサーバ側の機能とし、これにLANやインターネットその他のネットワークで接続されたクライアント側に検索結果出力部7とフィードバック処理部8を設けるシステム構成にすることもできる。
【0065】
次に、本発明の第2の実施の形態の情報検索システムを、図6を用いて説明する。第2の実施の形態の情報検索システムは、機能的な構成要素として、図1に示した第1の実施の形態のシステムと同様のクエリー入力部1、特徴ベクトル作成部2、文書データベース3、類似度演算部4、検索結果保持部5、検索結果出力部7及びフィードバック処理部8を備えている。そして本実施の形態のシステムはさらに、検索結果保持部5に保存されている文書ごとの特徴ベクトルに基づいて、後述する論理演算によって決定木を作成し、その作成した決定木データを検索結果保持部5に保持させる決定木作成部6を備えている。
【0066】
次に、上記の構成の第2の実施の形態の情報検索システムによる情報検索方法について、図7のフローチャートを用いて説明する。この情報検索システムでも、図2に示した第1の実施の形態のシステムと同様に、ユーザが自分の必要とする内容を表現するテキストデータ、又は自分の必要とする内容を含む文書のテキストデータをクエリーとして入力すると(ステップS1)、入力されたクリエーのテキストデータから特徴ベクトルを作成する(ステップS3)。そして、文書データベース3に保存されている多数の文書それぞれの特徴ベクトルとクエリーの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ文書を特定し、それらのインデックス、テキストデータ及び特徴ベクトルを取り出し(ステップS5)、検索結果のデータとして検索結果保持部5に一時保存する(ステップS7)。
【0067】
こうして得られた検索結果に対して、本実施の形態の特徴である決定木作成部6が、後述する処理により図8に示すような決定木を作成して検索結果保持部5に保持させる(ステップS8)。そして、検索結果出力部7はクエリーに対して類似度が一番高い特徴ベクトルを持つ文書の内容を表す情報を表示する(ステップS9)。
【0068】
この文書の内容の表示に対して、ユーザがUIデバイスにより自分の求めていた内容の文書であるか(YES)否か(NO)の判断を入力すると、フィードバック処理部8がこの判断入力を受け付けて、次のYES/NOのいずれかの処理を行う(ステップS11)。
【0069】
ユーザが、最初に提示された文書の内容について、自分の求めていた内容であると判断し、YESを入力した場合、フィードバック処理部8は検索結果保持部5に保持されている決定木を参照し、現在出力中の文書に対してYESの場合に移行する次の文書を特定し、その内容を検索結果出力部7によって表示させる(ステップS12,S16,S18)。
【0070】
ユーザが、最初に提示された文書の内容について、自分の求めていた内容ではないと判断し、ステップS11でNOを入力した場合、フィードバック処理部8は検索結果保持部5に保持されている決定木を参照し、現在出力中の文書に対してNOの場合に移行する次の文書を特定し、その内容を検索結果出力部7によって表示させる(ステップS14,S16,S18)。
【0071】
こうして、ステップS18で二番目に表示させた文書の内容について、ユーザはUIデバイスによってYES/NOの判断を入力すれば、ステップS11〜S18の処理を繰り返す。三番目以降の文書について同様である。そして、検索結果保持部5に該当する文書がなくなれば検索結果の出力を終了する(ステップS16でNOに分岐)。
【0072】
次に、決定木作成部6による決定木の作成処理について、図8の決定木例を用いて説明する。クエリーの特徴ベクトルQに対して、しきい値内の類似度を持つ特徴ベクトル群A〜Eが検索されたとする。クエリーQに対する類似度はクエリーQとの距離が近いほど類似度が高いものとし、ベクトル方向は、クエリーQに対する相対的な位置として示してある。
【0073】
決定木作成部6は、類似度演算部4が求めた類似度の高い特徴ベクトルA〜Eに対して、最も類似度の高い特徴ベクトルAから始め、その内容がユーザに受け入れられるとした場合にYES、受け入れられないとした場合にNOに分岐する。
【0074】
そして、YESに分岐する場合には、特徴ベクトルAに類似度が最も高い特徴ベクトルBを持つ文書を、特徴ベクトルAを持つ文書の次に出力する文書とする。一方、特徴ベクトルAの文書からNOに分岐する場合には、上述したようにクエリーQを基準にして、特徴ベクトルAと反対方向の仮想ベクトルA′を想定し、この仮想ベクトルA′に対して最も近い位置の特徴ベクトルDの文書を次に表示する文書と決定する。そして、同様にして特徴ベクトルごとにYES,NOに分岐して順次、出力するベクトルを検索結果のベクトル群から抽出してゆき、図8に示すような決定木を作成する。
【0075】
これにより、ユーザがクエリーQに対して検索された文書群の中から順次内容を確認していく場合、フィードバック処理部8は、決定木作成部6が作成し、検索結果保持部5に保持されている図8に示す決定木の情報を参照して、次のように検索結果の文書を展開していく。
【0076】
まず最初に、クエリーQに最も近い特徴ベクトルを持つ文書としてAを出力する。これに対してユーザがNOと判断操作をすれば、フィードバック処理部8は、次に特徴ベクトルDの文書を検索結果出力部7に出力させる。この特徴ベクトルDの文書に対しても、ユーザがNOと判断操作をすれば、次に特徴ベクトルCの文書を出力させる。そして、特徴ベクトルCの文書に対してはYESであれば、次に特徴ベクトルBの文書を出力させる。そして最後に、特徴ベクトルのEの文書を出力させるのである。
【0077】
なお、決定木作成部6による決定木の作成処理を一般的に示したものが図9のフローチャートである。最初に入力したクエリーQの対してしきい値内の類似度の特徴ベクトルを持つ文書群を検索しておき、その文書群の中で、図9のフローチャートの処理を繰り返し、決定木を作成しておくのである。
【0078】
この第2の実施の形態によれば、特に高速処理が可能なサーバを備えたシステムにあっては、クライアントとしてこのサーバにアクセスして検索サービスを受けるユーザは、自身のクライアントマシンが高速処理能力を備えていないものであっても検索結果を優先度の高いものから順次、高速で閲覧することができるようになる。
【0079】
次に、本発明の第3の実施の形態の情報検索システムを、図10のフローチャート及び図11の動作説明図を用いて説明する。第3の実施の形態の情報検索システムの機能的な構成は、図6に示した第2の実施の形態のものと共通である。ただし、決定木作成部6は類似度演算部4が抽出した文書群すべてに対して、図8に示すような決定木を作成するのではなく、ユーザの判定入力に応じて、所定段ずつ決定木を成長させていくことを特徴とする。
【0080】
すなわち、類似度演算部4がクエリーQに対して求めたしきい値内の特徴ベクトルを持つ文書群が図13に示したものであった場合、決定木作成部6は最初に、図11(a)に示すように、例えば3段階(この段数は特定されることはなく、2段まででもよいし、検索結果の文書数が多ければ4段以上であってもよい)までの決定木を作成する(ステップS31)。
【0081】
そして、ユーザが第1段階の文書Aの内容に対して関係あり(YES)と判断すれば(ステップS33〜S37)、文書展開の方向性がほぼ定まるので、図11(b)のように決定木を成長させる(ステップS39,S41,S43)。そして、文書Aの特徴ベクトルに対して最短距離の特徴ベクトルを持つ文書Bを抽出して出力する(ステップS45,S35)。
【0082】
なお、ステップS41で、決定木を成長させる条件は、例えば、検索結果としての文書群の中に未提示のものが残っているが、現段階までの決定木では末端の文書まで到達した場合、1段あるいはあらかじめ取り決めた適数段の候補文書を提示するごとに決定木を1段階あるいは適数段ずつ成長させる。この進段の条件は、例えば、1段階あるいは適数段階の文書が提示された場合等にあらかじめ決定しておくことができる。
【0083】
この第3の実施の形態によれば、ユーザの判定をフィードバックし、展開される可能性の高い系統についてだけ決定木を作成することになるので、無駄な演算処理を軽減することができ、サーバの演算負荷を軽減することができる。
【0084】
なお、上記の各実施の形態では、検索サービスと演算処理をすべてサーバマシンで実行することにしたが、例えば、決定木作成部6も含め、検索結果保持部5〜フィードバック処理部8の処理機能の全部あるいは一部をクライアントマシン側に設け、サーバマシン側とはネットワークで接続する構成にすることもできる。
【0085】
また、図6に示すシステムにおいて、用いるコンピュータの性能により、クエリー入力部1〜類似度演算部4はサーバ側の機能とし、これにLANやインターネットその他のネットワークで接続されたクライアント側に検索結果保持部5、決定木作成部6、検索結果出力部7、フィードバック処理部8を設けるシステム構成にすることができる。あるいは、クエリー入力部1〜決定木作成部5はサーバ側の機能とし、これにLANやインターネットその他のネットワークで接続されたクライアント側に検索結果出力部7とフィードバック処理部8を設けるシステム構成にすることもできる。
【0086】
なお、本発明は上記の各実施の形態の情報検索システムの処理機能を実現するプログラム、またそのプログラムを記録したコンピュータ読取り可能な記録媒体、さらには当該プログラムをコンピュータに組み込むことによりコンピュータシステムが実行する情報検索方法をも技術的範囲とする。
【0087】
さらにまた、上記の各実施の形態ではテキストデータをベースにした文書情報検索について例示したが、これに限らず、文書情報として内容が表現された音楽、映画、画像情報の検索にも適用することができる。また、音楽情報、画像情報に関して、そのデータを特徴ベクトル化してデータベースに登録し、またそれらのインデックス、タイトル、著作者、発行人、販社等のテキストデータも共に登録しておき、クエリーとして音楽情報、画像情報を表現するデータを直接入力して特徴ベクトル化し、特徴ベクトル間の類似度が高い音楽情報、画像情報を抽出し、それらの音楽情報、又は画像情報のデータ、特徴ベクトル、インデックス、タイトル等をデータベースから取り出すようにすれば、上記の各実施の形態と同様の決定木による検索が可能である。
【0088】
【発明の効果】
以上のように、本発明によれば、ユーザが入力するクエリーに対して特徴ベクトルの類似度がしきい値よりも高い情報群を抽出し、そのうち類似度が最も高い特徴ベクトルを持つ情報の内容をまず提示し、ユーザがその情報を適(YES)と判断すればその情報の特徴ベクトルと類似度が高い特徴ベクトルを持つ情報を次に提示し、逆にその情報を不適(NO)と判断すれば、特徴ベクトルと反対向きの仮想ベクトルを用い、これに類似度が高い特徴ベクトルを持つ情報を次に提示させるという手順を、以降、順次繰り返し、ユーザの求めている情報を予測して優先的に提示するので、ユーザの必要としている情報と類似度が高い情報が多数にのぼる場合でも、提示されている1つの情報に対するユーザの適/不適の内容判定に対応して、ユーザが必要としている内容の情報を自動的に選択して順次提示していくことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の情報検索システムの機能構成を示すブロック図。
【図2】上記の実施の形態による検索処理及び検索結果出力処理のフローチャート。
【図3】上記の実施の形態による検索処理結果の表示例の説明図。
【図4】上記の実施の形態による検索結果の表示出力の遷移を示す説明図。
【図5】上記の実施の形態による検索処理出力処理の説明図。
【図6】本発明の第2の実施の形態の情報検索システムの機能構成を示すブロック図。
【図7】上記の実施の形態の検索処理及び検索結果出力処理のフローチャート。
【図8】上記の実施の形態による検索結果に対する決定木作成処理の説明図。
【図9】上記の実施の形態による検索結果に対する決定木作成処理のフローチャート。
【図10】本発明の第3の実施の形態の情報検索システムによる検索結果に対する決定木作成処理のフローチャート。
【図11】上記の実施の形態による検索結果に対する決定木作成処理の説明図。
【図12】従来例の類似度に基づく検索処理結果の出力例を示す説明図。
【図13】従来例の類似度に基づく検索処理の説明図。
【符号の説明】
1 クエリー入力部
2 特徴ベクトル作成部
3 文書データベース
4 類似度演算部
5 検索結果保持部
6 決定木作成部
7 検索結果出力部
8 フィードバック処理部
Claims (28)
- ユーザの入力するクエリーを受け付けるクエリー入力部と、
このクエリー入力部の受け付けたクエリーから特徴ベクトルを作成する特徴ベクトル作成部と、
多数の検索対象情報のインデックス、内容を表すデータ及び特徴ベクトルデータを登録している情報データベースと、
前記特徴ベクトル作成部で作成されたクエリーの特徴ベクトルと前記情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す類似度演算部と、
この類似度演算部の取り出したデータを保存する検索結果保持部と、前記類似度演算部の取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する検索結果出力部と、
前記検索結果出力部の出力している検索結果に対するユーザの適/不適の判断入力を受け付け、(1)適入力の場合には、前記検索結果保持部に対して、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補として前記検索結果出力部によって出力させ、(2)不適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記検索結果保持部の保持している検索対象情報を検索し、該当する検索対象情報があればその内容を次候補として前記検索結果出力部によって出力させるフィードバック処理部と
を備えて成る情報検索システム。 - ユーザの入力するクエリーを受け付けるクエリー入力部と、
このクエリー入力部の受け付けたクエリーから特徴ベクトルを作成する特徴ベクトル作成部と、
多数の検索対象情報のインデックス、内容を表すデータ及び特徴ベクトルデータを登録している情報データベースと、
前記特徴ベクトル作成部で作成されたクエリーの特徴ベクトルと前記情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す類似度演算部と、
この類似度演算部の取り出したデータを保存する検索結果保持部と、
前記類似度演算部が求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記検索結果保持部に保持しているすべての検索対象情報を網羅するまで繰り返して決定木を作成する決定木作成部と、
前記類似度演算部の取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する検索結果出力部と、前記検索結果出力部の出力している検索結果に対するユーザの適/不適の判断入力を受け付け、前記決定木作成部の作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を前記検索結果出力部によって出力させるフィードバック処理部とを備えて成る情報検索システム。 - ユーザの入力するクエリーを受け付けるクエリー入力部と、
このクエリー入力部の受け付けたクエリーから特徴ベクトルを作成する特徴ベクトル作成部と、
多数の検索対象情報のインデックス、内容を表すデータ及び特徴ベクトルデータを登録している情報データベースと、
前記特徴ベクトル作成部で作成されたクエリーの特徴ベクトルと前記情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す類似度演算部と、
この類似度演算部の取り出したデータを保存する検索結果保持部と、前記類似度演算部が求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、
(2)不適入力の場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記検索結果保持部に保持している検索対象情報群について所定段階まで繰り返して決定木を作成する決定木作成部と、
前記類似度演算部の取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する検索結果出力部と、前記検索結果出力部の出力している検索結果に対するユーザの適/不適の判断入力を受け付け、前記決定木作成部の作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を前記検索結果出力部によって出力させ、かつ前記決定木作成部に対して、既存の決定木を成長させる条件に至ったならば前記決定木作成部に決定木を所定段階だけ成長させる指示を与えるフィードバック処理部とを備えて成る情報検索システム。 - 前記クエリー及び検索対象情報はテキストデータであることを特徴とする請求項1〜3のいずれかに記載の情報検索システム。
- クエリー入力部がユーザの入力するクエリーを受け付けるステップ1と、
特徴ベクトル作成部が前記受け付けたクエリーから特徴ベクトルを作成するステップ2と、
前記特徴ベクトル作成部で作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を類似度演算部が演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出すステップ3と、
ステップ3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを検索結果出力部が出力するステップ4と、
ステップ4で出力している検索結果に対するユーザの適/不適の判断入力をフィードバック処理部が受け付け、(1)適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記ステップ3で取り出した検索対象情報の中を検索し、該当する検索対象情報があればその内容を次候補として出力し、(2)不適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記ステップ3で取り出した検索対象情報の中を検索し、該当する検索対象情報があればその内容を次候補として出力するステップ5とを有する情報検索方法。 - クエリー入力部がユーザの入力するクエリーを受け付けるステップ1と、
特徴ベクトル作成部が前記受け付けたクエリーから特徴ベクトルを作成するステップ2と、
前記特徴ベクトル作成部で作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出すステップ3と、
ステップ3で求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、ステップ3で取り出した検索対象情報のすべてを網羅するまで繰り返して決定木を作成するステップ4と、
ステップ3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力するステップ5と、
ステップ5で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、ステップ4で作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を出力させるステップ6とを有する情報検索方法。 - クエリー入力部がユーザの入力するクエリーを受け付けるステップ1と、
特徴ベクトル作成部が前記受け付けたクエリーから特徴ベクトルを作成するステップ2と、
作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出すステップ3と、
ステップ3で求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、ステップ3で取り出した検索対象情報について所定段階まで繰り返して決定木を作成するステップ4と、
ステップ3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力するステップ5と、
ステップ5で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、ステップ4で作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を出力し、かつステップ4で作成した決定木を成長させる条件に至ったならば当該決定木を所定段階だけ成長させるステップ6とを有する情報検索方法。 - 前記クエリー及び検索対象情報はテキストデータであることを特徴とする請求項5〜7のいずれかに記載の情報検索方法。
- ユーザの入力するクエリーを受け付ける処理1と、
受け付けたクエリーから特徴ベクトルを作成する処理2と、
作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す処理3と、
処理3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する処理4と、
処理4で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、(1)適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記処理3で取り出した検索対象情報の中を検索し、該当する検索対象情報があればその内容を次候補として出力し、
(2)不適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記処理3で取り出した検索対象情報の中を検索し、該当する検索対象情報があればその内容を次候補として出力する処理5とをコンピュータに実行させる情報検索プログラム。 - ユーザの入力するクエリーを受け付ける処理1と、
受け付けたクエリーから特徴ベクトルを作成する処理2と、
作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す処理3と、
処理3で求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、処理3で取り出した検索対象情報のすべてを網羅するまで繰り返して決定木を作成する処理4と、
処理3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する処理5と、
処理5で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、処理4で作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を出力させる処理6とをコンピュータに実行させる情報検索プログラム。 - ユーザの入力するクエリーを受け付ける処理1と、
受け付けたクエリーから特徴ベクトルを作成する処理2と、
作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す処理3と、
処理3で求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、処理3で取り出した検索対象情報について所定段階まで繰り返して決定木を作成する処理4と、
処理3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する処理5と、
処理5で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、処理4で作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を出力し、かつ処理4で作成した決定木を成長させる条件に至ったならば当該決定木を所定段階だけ成長させる処理6と
をコンピュータに実行させる情報検索プログラム。 - 前記クエリー及び検索対象情報はテキストデータであることを特徴とする請求項9〜11のいずれかに記載の情報検索プログラム。
- ユーザの入力するクエリーを受け付ける処理1と、
受け付けたクエリーから特徴ベクトルを作成する処理2と、
作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す処理3と、
処理3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する処理4と、
処理4で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、(1)適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記処理3で取り出した検索対象情報の中を検索し、該当する検索対象情報があればその内容を次候補として出力し、(2)不適入力の場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記処理3で取り出した検索対象情報の中を検索し、該当する検索対象情報があればその内容を次候補として出力する処理5と
を実行する情報検索プログラムを記録したコンピュータ読取り可能な記録媒体。 - ユーザの入力するクエリーを受け付ける処理1と、
受け付けたクエリーから特徴ベクトルを作成する処理2と、
作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す処理3と、
処理3で求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、処理3で取り出した検索対象情報のすべてを網羅するまで繰り返して決定木を作成する処理4と、
処理3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する処理5と、
処理5で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、処理4で作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を出力させる処理6と
を実行する情報検索プログラムを記録したコンピュータ読取り可能な記録媒体。 - ユーザの入力するクエリーを受け付ける処理1と、
受け付けたクエリーから特徴ベクトルを作成する処理2と、
作成されたクエリーの特徴ベクトルと、情報データベースに登録されている検索対象情報ごとの特徴ベクトルとの類似度を演算し、所定のしきい値よりも高い類似度を示す特徴ベクトルを持つ検索対象情報を特定し、それらのインデックス、内容を表すデータ及び特徴ベクトルデータを取り出す処理3と、
処理3で求めた類似度の高い特徴ベクトル群に対して、最も類似度の高い特徴ベクトルから始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であればクエリーの特徴ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、処理3で取り出した検索対象情報について所定段階まで繰り返して決定木を作成する処理4と、
処理3で取り出した検索対象情報の1つについてそのインデックス、内容を示すデータを出力する処理5と、
処理5で出力している検索結果に対するユーザの適/不適の判断入力を受け付け、処理4で作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を出力し、かつ処理4で作成した決定木を成長させる条件に至ったならば当該決定木を所定段階だけ成長させる処理6と
を実行する情報検索プログラムを記録したコンピュータ読取り可能な記録媒体。 - 前記クエリー及び検索対象情報はテキストデータであることを特徴とする請求項13〜15のいずれかに記載の情報検索プログラムを記録したコンピュータ読取り可能な記録媒体。
- 一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する特徴データ保持部と、
前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する表示情報出力部と、
前記出力された検索対象情報に対して、ユーザの適/不適の判断入力を受け付けるフィードバック受付部と、
(1)前記ユーザの判断入力が適である場合には、前記表示情報出力部が現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を前記表示情報出力部に出力させ、(2)前記ユーザの判断入力が不適である場合には、前記表示情報出力部が現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を前記表示情報出力部に出力させる出力情報選択部とを備えて成る出力情報選択装置。 - 一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する特徴データ保持部と、
前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する表示情報出力部と、
前記特徴データ保持部に保持されている一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記特徴データ保持部に保持されているすべての検索対象情報を網羅するまで繰り返して決定木を作成する決定木作成部と、前記表示情報出力部が出力している検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木作成部の作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を前記表示情報出力部によって出力させるフィードバック処理部とを備えて成る出力情報選択装置。 - 一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する特徴データ保持部と、
前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する表示情報出力部と、
前記特徴データ保持部に保持されている一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記特徴データ保持部に保持されている検索対象情報群について所定段階まで繰り返して決定木を作成する決定木作成部と、
前記表示情報出力部が出力している検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木作成部の作成した決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を前記表示情報出力部によって出力させると共に、前記決定木作成部に対して、既存の決定木を成長させる条件に至ったならば前記決定木作成部に決定木を所定段階だけ成長させる指示を与えるフィードバック処理部とを備えて成る出力情報選択装置。 - 特徴データ保持部が一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持するステップ1と、
表示情報出力部が前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力するステップ2と、
フィードバック受付部が現在出力中の検索対象情報に対して、ユーザの適/不適の判断入力を受け付け、(1)前記ユーザの判断入力が適である場合には、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を出力し、(2)前記ユーザの判断入力が不適である場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を出力するステップ3とを有する出力情報選択方法。 - 特徴データ保持部が一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持するステップ1と、
表示情報出力部が前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力するステップ2と、
フィードバック受付部が前記一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記一群の検索対象情報のすべてを網羅するまで繰り返して決定木を作成するステップ3と、現在出力中の検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を出力するステップ4とを有する出力情報選択方法。 - 特徴データ保持部が一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持するステップ1と、
表示情報出力部が前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力するステップ2と、
フィードバック受付部が前記一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記一群の検索対象情報について所定段階まで繰り返して決定木を作成するステップ3と、
現在出力中の検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を出力すると共に、既存の決定木を成長させる条件に至ったならば前記決定木を所定段階だけ成長させるステップ4とを有する出力情報選択方法。 - 一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する処理1と、
前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する処理2と、
現在出力中の検索対象情報に対して、ユーザの適/不適の判断入力を受け付け、(1)前記ユーザの判断入力が適である場合には、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を出力し、(2)前記ユーザの判断入力が不適である場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を出力する処理3とをコンピュータに実行させる出力情報選択プログラム。 - 一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する処理1と、
前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する処理2と、
前記一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記一群の検索対象情報のすべてを網羅するまで繰り返して決定木を作成する処理3と、
現在出力中の検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を出力する処理4とをコンピュータに実行させる出力情報選択プログラム。 - 一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する処理1と、
前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する処理2と、
前記一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記一群の検索対象情報について所定段階まで繰り返して決定木を作成する処理3と、
現在出力中の検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を出力すると共に、既存の決定木を成長させる条件に至ったならば前記決定木を所定段階だけ成長させる処理4とをコンピュータに実行させる出力情報選択プログラム。 - 一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する処理1と、
前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する処理2と、
現在出力中の検索対象情報に対して、ユーザの適/不適の判断入力を受け付け、(1)前記ユーザの判断入力が適である場合には、現在出力中の検索対象情報の持つ特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を出力し、(2)前記ユーザの判断入力が不適である場合には、現在出力中の検索対象情報の持つ特徴ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば予め与えられている基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報がないか前記一群の検索対象情報を検索し、該当する検索対象情報があればその内容を表現する情報を出力する処理3とを実行する出力情報選択プログラムを記録したコンピュータ読取り可能な記録媒体。 - 一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する処理1と、
前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する処理2と、
前記一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記一群の検索対象情報のすべてを網羅するまで繰り返して決定木を作成する処理3と、
現在出力中の検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を出力する処理4とを実行する出力情報選択プログラムを記録したコンピュータ読取り可能な記録媒体。 - 一群の検索対象情報それぞれの内容を表現する情報と共に特徴ベクトルデータを保持する処理1と、
前記一群の検索対象情報の中から指定された検索対象情報の内容を表現する情報を出力する処理2と、
前記一群の検索対象情報に対して、あらかじめ与えられている基準ベクトルと最も類似度の高い特徴ベクトルを持つ検索対象情報から始め、その内容がユーザに受け入れられるとした場合に適、受け入れられないとした場合に不適に分岐し、適に分岐する場合には、当該特徴ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を次候補の検索対象情報とし、前記特徴ベクトルから不適に分岐する場合には、不適とした検索対象情報の持つ特徴ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差と、仮想ベクトルと初段の検索であれば前記基準ベクトル、2段目以降の検索であれば前段で出力した特徴ベクトルの差が反対向きになる仮想ベクトルを算定し、この仮想ベクトルに類似度が最も高い特徴ベクトルを持つ他の検索対象情報を検索し、該当する検索対象情報があればその内容を次候補の検索対象情報とする処理を、前記一群の検索対象情報について所定段階まで繰り返して決定木を作成する処理3と、
現在出力中の検索対象情報に対するユーザの適/不適の判断入力を受け付け、前記決定木に基づいて次に出力すべき検索対象情報を特定し、該当する検索対象情報の内容を表現する情報を出力すると共に、既存の決定木を成長させる条件に至ったならば前記決定木を所定段階だけ成長させる処理4とを実行する出力情報選択プログラムを記録したコンピュータ読取り可能な記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001168547A JP4636734B2 (ja) | 2001-06-04 | 2001-06-04 | 情報検索システム、情報検索方法、情報検索プログラム、情報検索プログラムを記録した記録媒体、出力情報選択装置、出力情報選択方法、出力情報選択プログラム及び出力情報選択プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001168547A JP4636734B2 (ja) | 2001-06-04 | 2001-06-04 | 情報検索システム、情報検索方法、情報検索プログラム、情報検索プログラムを記録した記録媒体、出力情報選択装置、出力情報選択方法、出力情報選択プログラム及び出力情報選択プログラムを記録した記録媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2002366577A JP2002366577A (ja) | 2002-12-20 |
| JP4636734B2 true JP4636734B2 (ja) | 2011-02-23 |
Family
ID=19010759
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001168547A Expired - Fee Related JP4636734B2 (ja) | 2001-06-04 | 2001-06-04 | 情報検索システム、情報検索方法、情報検索プログラム、情報検索プログラムを記録した記録媒体、出力情報選択装置、出力情報選択方法、出力情報選択プログラム及び出力情報選択プログラムを記録した記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4636734B2 (ja) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009301447A (ja) * | 2008-06-17 | 2009-12-24 | Nec Corp | 情報処理装置 |
| JP5533272B2 (ja) * | 2010-05-28 | 2014-06-25 | 日本電気株式会社 | データ出力装置、データ出力方法およびデータ出力プログラム |
| JP6009317B2 (ja) * | 2012-10-31 | 2016-10-19 | Kddi株式会社 | スキル評価方法および装置 |
| JP7614705B2 (ja) * | 2020-12-28 | 2025-01-16 | キヤノンマーケティングジャパン株式会社 | 情報処理システム、情報処理方法、プログラム |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08106474A (ja) * | 1994-10-07 | 1996-04-23 | Hitachi Ltd | 類似例文検索結果表示方法及び装置 |
| JP2773682B2 (ja) * | 1995-05-26 | 1998-07-09 | 日本電気株式会社 | 適合フィードバック装置 |
| JP3664834B2 (ja) * | 1997-02-13 | 2005-06-29 | 三菱電機株式会社 | 類似検索装置 |
| JP3686802B2 (ja) * | 1999-11-08 | 2005-08-24 | 日本電信電話株式会社 | データベース検索方法、装置、およびデータベース検索プログラムを記録した記録媒体 |
-
2001
- 2001-06-04 JP JP2001168547A patent/JP4636734B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2002366577A (ja) | 2002-12-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3760057B2 (ja) | 複数文書データベースを対象とした文書検索方法および文書検索サービス | |
| JP2005122295A (ja) | 関係図作成プログラム、関係図作成方法、および関係図作成装置 | |
| US20090307217A1 (en) | Method, Device and System for Processing, Browsing and Searching an Electronic Documents | |
| JP5513860B2 (ja) | 文書装飾支援システムおよび文書装飾支援方法 | |
| JP2004341753A (ja) | 検索支援装置、検索支援方法、およびプログラム | |
| JP3384016B2 (ja) | 文書編集管理装置 | |
| JP3178421B2 (ja) | テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JP3864235B2 (ja) | 情報検索システムおよび情報検索プログラム | |
| JP4636734B2 (ja) | 情報検索システム、情報検索方法、情報検索プログラム、情報検索プログラムを記録した記録媒体、出力情報選択装置、出力情報選択方法、出力情報選択プログラム及び出力情報選択プログラムを記録した記録媒体 | |
| JP4194680B2 (ja) | データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体 | |
| JP2001188802A (ja) | 情報検索装置及び情報検索方法 | |
| JP2002073681A (ja) | 類似文書検索方法および装置および、類似文書検索方法のためのプログラムが記録された記憶媒体 | |
| JP2011100208A (ja) | 行動推定装置、行動推定方法および行動推定プログラム | |
| JP2000148780A (ja) | 文書検索方法、装置および文書検索プログラムを記録した記録媒体 | |
| JPH1131156A (ja) | 文書検索装置及び方法 | |
| JP2002197115A (ja) | 評価基準データを用いたウェブページ検索方法及び記憶媒体 | |
| JPH1166078A (ja) | 検索要求具体化方法及び装置及び検索要求具体化プログラムを格納した記憶媒体 | |
| JP3059710B1 (ja) | 情報検索システム、データベース管理装置、データベース管理方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JPH10334109A (ja) | 検索利用者支援装置 | |
| CN113051289A (zh) | 法条检索方法、装置、设备及存储介质 | |
| JP2004234582A (ja) | 辞書構築方法,システム及び画面 | |
| JP2006195667A (ja) | 構造化文書検索装置、構造化文書検索方法、及び構造化文書検索プログラム | |
| JP2001249935A (ja) | 文書ダイジェスト作成方法、文書検索装置および記録媒体 | |
| JP2002117043A (ja) | 文書検索装置、文書検索方法およびその方法を実施するためのプログラムを記録した記録媒体 | |
| JP3578045B2 (ja) | 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080304 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100715 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100728 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100924 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101117 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101122 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131203 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |