Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP2735866B2 - How to search database data - Google Patents
[go: Go Back, main page]

JP2735866B2 - How to search database data - Google Patents

How to search database data

Info

Publication number
JP2735866B2
JP2735866B2 JP1067692A JP6769289A JP2735866B2 JP 2735866 B2 JP2735866 B2 JP 2735866B2 JP 1067692 A JP1067692 A JP 1067692A JP 6769289 A JP6769289 A JP 6769289A JP 2735866 B2 JP2735866 B2 JP 2735866B2
Authority
JP
Japan
Prior art keywords
classification
image
data
keyword
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1067692A
Other languages
Japanese (ja)
Other versions
JPH02247778A (en
Inventor
正啓 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK filed Critical Nippon Hoso Kyokai NHK
Priority to JP1067692A priority Critical patent/JP2735866B2/en
Publication of JPH02247778A publication Critical patent/JPH02247778A/en
Application granted granted Critical
Publication of JP2735866B2 publication Critical patent/JP2735866B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、複数の記憶データ、例えば、画像データを
キーワード検索するデータベースのデータ検索方法に関
する。
DETAILED DESCRIPTION OF THE INVENTION [Industrial Application Field] The present invention relates to a data search method of a database for searching a plurality of stored data, for example, image data by a keyword.

[発明の概要] 本発明は、キーワード検索により得られるデータのキ
ーワード列が類似していることに着目し、キーワード検
索結果の中の1つのデータとして、これに類似したデー
タをキーワード検索結果の中からモデル検索し、そのモ
デル検索により得られたデータ相互のキーワード列の距
離計算を行って、データ全体を、キーワード列が特に類
似するデータ群に自動的に分類する。さらには、分類さ
れたデータ群のキーワード列とキーデータのキーワード
列との距離計算を実行し、距離計算結果、すなわち、類
似度に応じて優先順を定めるようにしたので、従来では
必要であった人間による検索結果の分類処理が不要とな
る。さらには、優先順毎に上記データ群のキーワード列
を文字の画像形態で出力するようにしたので、検索者は
自動分類の基になったキーワードを確認することがで
き、次回のキーワード検索に用いることができる。
[Summary of the Invention] The present invention focuses on the fact that keyword strings of data obtained by a keyword search are similar, and as data in the keyword search result, sets similar data in the keyword search result. , And the distance between keyword strings of the data obtained by the model search is calculated, and the entire data is automatically classified into a data group in which the keyword strings are particularly similar. Furthermore, the distance between the keyword string of the classified data group and the key string of the key data is calculated, and the priority is determined according to the distance calculation result, that is, the similarity, which is conventionally required. This eliminates the need for classification processing of search results by a human. Furthermore, the keyword string of the data group is output in the form of a character image for each priority order, so that the searcher can confirm the keyword based on the automatic classification and use the keyword for the next keyword search. be able to.

[従来の技術] 従来、放送などにおいて広い分野の多種類の画像を記
憶しておく画像データベースのための検索方式として
は、一般的にキーワード検索方式が知られている。その
他、データベースに記憶されたデータの中から検索の手
がかりとなるデータと類似するデータを検索するベクト
ル型検索モデルによる検索方法も知られている。
[Related Art] Conventionally, a keyword search method is generally known as a search method for an image database that stores various types of images in a wide field such as broadcasting. In addition, a search method using a vector-type search model for searching data stored in a database for data similar to a search clue is also known.

上記キーワード検索方法では、1枚の画像を記憶する
時に、その内容に対応した複数の言葉、すなわち、キー
ワードを画像データに付加し、索引付けしておく。次
に、このキーワードを手がかりにデータベースの中に記
憶された複数の画像データの中から必要な画像データを
検索する。このようなキーワード検索方式は一元的な画
像データの分類に比べ画像に対する表現力が大きく、1
枚の画像に対しても多くの見方ができる多様な画像を扱
うデータベースに適している。
In the above keyword search method, when one image is stored, a plurality of words corresponding to the contents, that is, keywords are added to the image data and indexed. Next, necessary image data is searched from a plurality of image data stored in the database based on the keyword. Such a keyword search method has a large expressive power for an image as compared with the unified classification of image data.
It is suitable for a database that handles a variety of images that can be viewed from a number of images.

上記ベクトル型検索モデルによる検索方式は、文献検
索を行うデータベースシステムに適用されることが多
い。この方式ではデータベースシステムに記憶する各デ
ータに、キーワードを付与すると共にそのデータに付与
されたキーワードのそれぞれに重み付けを行う。次に、
検索の手がかりをキーワードの重みを要素とするベクト
ルで表し、検索に際しては検索の手がかりとなるベクト
ルと、データベースの中の各データのキーワードの重み
を要素とするベクトルとの間の類似度を計算し、次に、
計算された各データに対応する類似度をそのデータの検
索質問に対する適合度として表わす。この適合度の大き
さの順に検索結果を出力する。このように検索結果を検
索質問との適合度でランクづけることにより、効率的な
検索が可能となる。
The search method based on the vector-type search model is often applied to a database system for performing document search. In this method, a keyword is assigned to each data stored in the database system, and each keyword assigned to the data is weighted. next,
A search cue is represented by a vector having a keyword weight as an element. At the time of a search, a similarity between a vector having a search cue and a vector having a keyword weight of each data element in a database as an element is calculated. ,next,
The calculated degree of similarity corresponding to each piece of data is expressed as the degree of relevance of the data to the search query. The search results are output in the order of the degree of matching. In this way, by ranking the search results according to the degree of relevance to the search question, an efficient search can be performed.

[発明が解決しようとする課題] しかしながら、キーワード検索方式では、該当するキ
ーワードを有するデータ全てを出力するので、検索結果
の個数を所定量に限定したいときには、その、検索の意
図をキーワードの論理的な組分せで適確に表現する必要
がある。さらに、検索の際に使用可能なキーワード個数
が限定されるときなど、適確な表現を得るためにはキー
ワードの論理的な組合せを変えて検索操作を繰り返す検
索試行が必要になる。加えて検索者がキーワードに対す
る知識が不足している場合には、この検索試行の効率が
非常に悪くなる欠点が従来のキーワード検索方式の画像
検索方法にはあった。
[Problem to be Solved by the Invention] However, in the keyword search method, all data having a corresponding keyword is output. Therefore, when it is desired to limit the number of search results to a predetermined amount, the intention of the search is determined by the logical It is necessary to express accurately with proper composition. Furthermore, when the number of keywords that can be used in a search is limited, in order to obtain an accurate expression, it is necessary to repeat a search operation by changing a logical combination of keywords. In addition, when the searcher lacks knowledge of the keyword, the conventional keyword search method has a disadvantage that the efficiency of the search trial becomes very poor.

一方、ベクトル型検索モデルによる検索方式を画像デ
ータベースに対して適用すれば、上記キーワード検索に
よる検索試行の課程で得られた中間的な検索結果に含ま
れる画像の中で、もっとも検索の意図に近い画像のキー
ワード列を用いてこのキーワード列に類似した画像を検
索する。このため、検索試行の効率を上げることができ
る。しかし、放送局などで撮影画像を記憶し、後に画像
検索を行う場合、ベクトル型検索モデルによる検索方式
を用いても、検索結果として得られる類似画像は非常に
多数であり、かつ、それらの画像にも多くの種類が含ま
れている。
On the other hand, if the search method based on the vector-based search model is applied to the image database, among the images included in the intermediate search results obtained in the course of the search trial by the keyword search, the image closest to the search intention is obtained. An image similar to the keyword string is searched using the keyword string of the image. For this reason, the efficiency of the search trial can be increased. However, when a photographed image is stored in a broadcast station or the like and an image search is performed later, even if a search method based on a vector-type search model is used, a large number of similar images can be obtained as a search result, and these images are also obtained. There are also many types.

具体的には検索された各画像は、重みの高いキーワー
ドは一致しているが、重みの低いキーワードは異なって
いることが多い。このため類似度の順序による検索結果
の整理方法だけでは検索を十分に整理しきれないという
欠点があった。このため、ベクトル型検索モデルによる
検索方法では、検索結果が把握しにくくなり、逆に、検
索試行の効率が低下するという問題が生じていた。
Specifically, in each searched image, a keyword with a high weight matches, but a keyword with a low weight often differs. For this reason, there is a drawback that the search cannot be sufficiently organized only by the method of organizing the search results in the order of the similarity. For this reason, in the search method using the vector-type search model, it has been difficult to grasp the search result, and conversely, the efficiency of the search trial has been reduced.

そこで、本発明の目的は、このような不具合を解消
し、ベクトル型検索モデルにより検索された検索結果
を、分類し、その分類結果について優先順位を定めるこ
とが可能なデータベースのデータ検索方法を提供するこ
とにある。
Therefore, an object of the present invention is to provide a data retrieval method for a database that can solve such a problem, classify search results searched by a vector-type search model, and determine the priority of the classified results. Is to do.

[課題を解決するための手段] このような目的を達成するために、本発明の第1形態
は予め記憶された複数のデータをキーワード検索し、当
該キーワード検索により得られる検索結果の中の1つの
データをキーデータとして選択し、検索結果の中からキ
ーデータのキーワード列と類似するデータをモデル検索
するデータベースのデータ検索方法であって、当該モデ
ル検索により得られた各データ相互のキーワード列につ
いての距離計算を実行し、当該距離計算の結果が所定値
以下となるデータを統合することにより複数の第1のデ
ータ群を作成し、当該作成された複数の第1データ群相
互のキーワード列についての距離計算を実行し、当該距
離計算の結果が所定値以下となる第1データ群を統合す
ることにより複数の第2データ群を作成して、モデル検
索により得られたデータを複数の第2のデータ群に分類
し、当該分類された複数の第2のデータ群の各々のキー
ワード列とキーデータのキーワード列との距離計算を実
行し、当該距離計算の結果に応じて分類された複数のデ
ータ群の優先順位を定めることを特徴とする。
[Means for Solving the Problems] In order to achieve such an object, the first embodiment of the present invention performs a keyword search on a plurality of data stored in advance, and selects one of search results obtained by the keyword search. A data search method for a database that selects two data as key data and performs a model search for data similar to the keyword string of the key data from the search results. Is performed, and a plurality of first data groups are created by integrating data for which the result of the distance calculation is equal to or less than a predetermined value. Is performed, and a plurality of second data groups are created by integrating the first data groups in which the result of the distance calculation is equal to or smaller than a predetermined value. Classifying the data obtained by the model search into a plurality of second data groups, and performing a distance calculation between each of the classified keyword strings of the plurality of classified second data groups and the keyword string of the key data; The priorities of a plurality of data groups classified according to the result of the distance calculation are determined.

本発明の第2形態は複数の第2データ群の各々に含ま
れるキーワード列を、文字を表わす画像の形態で優先順
位に従って出力することを特徴とする。
A second aspect of the present invention is characterized in that a keyword string included in each of the plurality of second data groups is output in the form of an image representing a character according to a priority order.

[作 用] 本発明は、キーワード検索により得られるデータのキ
ーワード列が類似していることに着目し、キーワード検
索結果の中の1つのデータをキーデータとして、これに
類似したデータをキーワード検索結果の中からモデル検
索し、そのモデル検索により得られたデータ相互のキー
ワード列の距離計算を行って、データ全体を、キーワー
ド列が特に類似するデータ群に自動的に分類する。さら
には、分類されたデータ群のキーワード列とキーデータ
のキーワード列との距離計算を実行し、距離計算結果、
すなわち、類似度に応じて優先順を定めるようにしたの
で、従来では必要であった人間による検索結果の分類処
理が不要となる。さらには、優先順毎に上記データ群の
キーワード列を文字の画像形態で出力するようにしたの
で、検索者は自動分類の基になったキーワードを確認す
ることができ、次回のキーワード検索に用いることがで
きる。
[Operation] The present invention focuses on the fact that the keyword strings of the data obtained by the keyword search are similar. One of the data in the keyword search result is used as key data, and similar data is used as the keyword search result. , A distance between keyword strings of data obtained by the model search is calculated, and the entire data is automatically classified into a data group in which the keyword strings are particularly similar. Further, a distance calculation is performed between the keyword column of the classified data group and the keyword column of the key data, and the distance calculation result,
That is, since the priority order is determined according to the similarity, the classification process of the search result by a human, which is conventionally required, becomes unnecessary. Furthermore, the keyword string of the data group is output in the form of a character image for each priority order, so that the searcher can confirm the keyword based on the automatic classification and use the keyword for the next keyword search. be able to.

[実施例] 以下、図面を参照して本発明の実施例を詳細に説明す
る。
[Example] Hereinafter, an example of the present invention will be described in detail with reference to the drawings.

本発明の説明に先立って、本発明を適用した画像検索
システムのシステム構成を、第2図を参照して説明す
る。
Prior to the description of the present invention, a system configuration of an image search system to which the present invention is applied will be described with reference to FIG.

第2図において、画像検索システムは、ホストコンピ
ュータ1,キーワード検索部2,類似画像検索部3,フレーム
メモリ4,画像表示装置5,記憶装置6,および画像分類部11
により主に構成されている。
2, the image search system includes a host computer 1, a keyword search unit 2, a similar image search unit 3, a frame memory 4, an image display device 5, a storage device 6, and an image classification unit 11.
It is mainly composed of

次に、上述の構成各部の機能について説明する。 Next, the function of each of the components described above will be described.

ホストコンピュータ1は各構成部を動作制御すると共
に、画像検索結果および画像検索結果の分類結果をフレ
ームメモリ4を介して画像表示装置5に表示する。
The host computer 1 controls the operation of each component and displays an image search result and a classification result of the image search result on the image display device 5 via the frame memory 4.

キーワード検索部2は、記憶装置6に格納された画像
データを、キーワードを基に検索して、キーワードが合
致する画像データを抽出する。
The keyword search unit 2 searches the image data stored in the storage device 6 based on the keyword, and extracts image data that matches the keyword.

類似画像検索部3は、検索の基(キー)となる画像デ
ータのキーワード列と各画像データに付与されたキーワ
ード列との距離計算を行い、しきい値以下となる画像デ
ータを抽出する。
The similar image search unit 3 calculates a distance between a keyword sequence of image data serving as a search base (key) and a keyword sequence assigned to each image data, and extracts image data having a threshold or less.

フレームメモリ4は画像表示装置5に表示すべき情
報、例えば、検索された画像データおよび後述の分類各
文字列を優先順に記憶する。
The frame memory 4 stores information to be displayed on the image display device 5, for example, retrieved image data and classified character strings described below in order of priority.

記憶装置6には画像キーワード番号行列ファイル(PK
行列ファイルと呼する)8,キーワードファイル9および
画像データファイル10を記憶する領域が設けられてい
る。
An image keyword number matrix file (PK
An area for storing a matrix file (referred to as a matrix file) 8, a keyword file 9 and an image data file 10 is provided.

画像キーワード番号行列ファイル8は、第3図に示す
ように、記憶画像データの画像番号毎に、その画像デー
タに予め付与されたキーワード番号が記憶されている。
As shown in FIG. 3, the image keyword number matrix file 8 stores, for each image number of the stored image data, a keyword number previously assigned to the image data.

キーワードファイル9には、第4図に示すように検索
に用いられるキーワードとなる文字列とその番号および
そのキーワードの重みを示す数値が記憶されている。
As shown in FIG. 4, the keyword file 9 stores a character string serving as a keyword used in the search, its number, and a numerical value indicating the weight of the keyword.

画像データファイル10には画像番号と共に、例えば、
1画面分の画像データが格納されている。
In the image data file 10, together with the image number, for example,
One screen of image data is stored.

本発明に関わる画像分類部11は、キーワード検索部2
および類似画像検索部3により検索された複数の検索結
果を後述の手法を用いて自動的に分類する。
The image classification unit 11 according to the present invention includes a keyword search unit 2
A plurality of search results searched by the similar image search unit 3 are automatically classified using a method described later.

第1図は第2図に示す画像分類部11の回路構成を示
す。
FIG. 1 shows a circuit configuration of the image classification unit 11 shown in FIG.

第1図において、画像分類部11は入力バッファ12,初
期分類回路13,分類統合回路15,分類順位決定回路17,分
類名生成回路19,画像ベクトル生成回路21,分類ベクトル
生成回路22およびベクトル距離計算回路23によって構成
される。この内、初期分類回路13,分類統合回路15,分類
順位決定回路17は内部バス24を介して画像ベクトル生成
回路21,分類ベクトル生成回路22,ベクトル距離計算回路
23に接続している。画像ベクトル生成回路21,分類ベク
トル生成回路22,ベクトル距離計算回路23,分類名生成回
路19は、バス7を介して記憶装置6と接続し、記憶装置
6に格納された画像キーワード番号行列ファイル8,キー
ワードファイル9の記憶データを参照して後述の処理を
行う。
In FIG. 1, an image classification unit 11 includes an input buffer 12, an initial classification circuit 13, a classification integration circuit 15, a classification order determination circuit 17, a classification name generation circuit 19, an image vector generation circuit 21, a classification vector generation circuit 22, and a vector distance. It is constituted by a calculation circuit 23. Of these, the initial classification circuit 13, the classification integration circuit 15, and the classification order determination circuit 17 are connected to the image vector generation circuit 21, the classification vector generation circuit 22, the vector distance calculation circuit via the internal bus 24.
Connected to 23. The image vector generation circuit 21, the classification vector generation circuit 22, the vector distance calculation circuit 23, and the classification name generation circuit 19 are connected to the storage device 6 via the bus 7, and the image keyword number matrix file 8 stored in the storage device 6 , A process described later is performed with reference to the storage data of the keyword file 9.

なお、上述の回路13,15,17,19,21,22,23はそれぞれ、
演算プロセッサや論理演算回路を用いればよい。
The above circuits 13, 15, 17, 19, 21, 22, 23 are respectively
An arithmetic processor or a logical operation circuit may be used.

第1図に示す画像分類部11の回路動作を説明する。 The circuit operation of the image classification unit 11 shown in FIG. 1 will be described.

類似画像検索部3により、例えば、画像番号“2",
“5",“7",“9",“15",“23",“24",“31",“33"の計9
つの類似画像番号が検索結果として得られ、入力バッフ
ァ12には第5図に示すように、検索結果の個数“9"およ
び類似画像番号(以下、類似画像番号配列27と呼する)
が格納される。
By the similar image search unit 3, for example, the image number “2”,
“5”, “7”, “9”, “15”, “23”, “24”, “31”, “33” total 9
Two similar image numbers are obtained as search results, and the number of search results “9” and similar image numbers (hereinafter, referred to as similar image number array 27) are stored in the input buffer 12, as shown in FIG.
Is stored.

次に、初期分類回路13は、第6図に示す以下の制御手
順を実行して、入力バッファ12に記憶された類似画像番
号配列27を初期分類する。
Next, the initial classification circuit 13 performs the following control procedure shown in FIG. 6 to initially classify the similar image number array 27 stored in the input buffer 12.

ステップS10) 入力バッファ12から類似画像番号配列2
7を読取ると共に、距離しきい値dthを類似画像検索部3
から受信する。この距離しきい値dthは、類似画像検索
部3において実行された類似画像番号の抽出に用いられ
た距離しきい値であり、本実施例では数値0.6を用い
る。
Step S10) Similar image number array 2 from input buffer 12
7 is read, and the distance threshold d th is set to the similar image search unit 3.
Receive from. The distance threshold value d th is a distance threshold value used for extracting a similar image number executed in the similar image search unit 3, and a numerical value of 0.6 is used in this embodiment.

ステップS11) 分類しきい値cthを距離しきい値dth
ら次式に従って求める。
Step S11) The classification threshold value c th is obtained from the distance threshold value d th according to the following equation.

cth=μ×dth ……(1) ここで、μは0≦μ≦1の予め定めた定数で例え
ば、μ=0.55とする。
c th = μ × d th (1) Here, μ is a predetermined constant of 0 ≦ μ ≦ 1 and, for example, μ = 0.55.

ステップS12) 類似画像番号配列27に含まれる画像番
号に対応する各画像どうしの距離を画像距離計算回路14
により計算し、類似画像間距離行列Dを求める。
Step S12) The image distance calculation circuit 14 calculates the distance between the images corresponding to the image numbers included in the similar image number array 27.
To obtain a distance matrix D between similar images.

このために、画像距離計算回路14はベクトル距離計
算回路23に類似画像番号配列27を送り、下記(2)式の
計算を実行させる。
For this purpose, the image distance calculation circuit 14 sends the similar image number array 27 to the vector distance calculation circuit 23 to execute the calculation of the following equation (2).

dAB=1−WAB/(WAA×WBB0.5 ……(2) dAB:ベクトルA、B間の距離 WAB:A、Bに共通に含まれるキーワード要素に
対応する重み要素の自乗和 WAA:Aの重み要素の自乗和 WBB:Bの重み要素の自乗和 ここで、ベクトルA,Bには、画像ベクトル(第8図
参照)が用いられる。画像ベクトルは各画像番号の画像
が有するキーワード要素および重み要素により構成され
る。
d AB = 1−W AB / (W AA × W BB ) 0.5 ... (2) d AB : distance between vectors A and B W AB : weight element corresponding to a keyword element commonly included in A and B Square sum W AA : Square sum of weight elements of A W BB : Square sum of weight elements of B Here, the vectors A and B are image vectors (see FIG. 8). The image vector is composed of a keyword element and a weight element of the image of each image number.

画像ベクトル生成回路21では、類似画像番号配列27
の中の2つの画像番号を選択し、その画像番号を基にPK
行列ファイル8およびキーワードファイル9から画像番
号と対応するキーワード要素および重み要素を読み出し
て画像ベクトルを生成する。
In the image vector generation circuit 21, the similar image number array 27
Select the two image numbers in, and PK based on the image numbers
A keyword element and a weight element corresponding to an image number are read from the matrix file 8 and the keyword file 9 to generate an image vector.

次に、画像ベクトル生成回路21により作成されたベク
トルA,Bを用いて上記(1)式の計算がベクトル距離計
算回路23により行われる。続いてベクトル距離計算回路
23は、類似画像番号配列27の中の画像番号の組み合せを
変えて、上述と同様の手順で画像相互の距離を計算す
る。
Next, using the vectors A and B created by the image vector generation circuit 21, the calculation of the above equation (1) is performed by the vector distance calculation circuit 23. Next, the vector distance calculation circuit
23 changes the combination of the image numbers in the similar image number array 27 and calculates the distance between the images in the same procedure as described above.

このようにして得られた各距離計算結果dijが類似画
像距離行列Dの要素となる。
Each distance calculation result dij thus obtained is an element of the similar image distance matrix D.

ステップS13) 類似画像距離間行列Dの各要素dijをス
テップS11において算出された分類しきい値cthと比較
し、その比較結果rijを要素とした類似画像間関連行列
Rを求める。ここで、 dij>cthの時 rij=0 dij≦cthの時 rij=1 ……(3) ステップS14) 類似画像間関連行列Rのグラフ表現の
極大完全部分グラフに対応した類似画像番号の部分集合
C1,…,CNを、例えば、C.BronとJ.Kerboschによる文献Co
mmunications of ACM.Vol.16.No.9(1973)p.577のアル
ゴリズムに従って求める。本実施例では同じ部分集合に
含まれる画像間に対応した類似画像間関連行列Rの要素
rijがすべて“1"になる、すなわち、類似している画像
の画像番号の部分集合を抽出する。
Step S13) Each element dij of the similar image distance matrix D is compared with the classification threshold value c th calculated in step S11, and a similar image relation matrix R using the comparison result rij as an element is obtained. Here, when d ij > c th , r ij = 0 When d ij ≦ c th , r ij = 1 (3) Step S14) The maximum complete partial graph of the graph expression of the similar image relation matrix R is supported. Subset of similar image numbers
C 1 ,…, C N are described, for example, in the literature Co by C. Bron and J. Kerbosch.
Determined according to the algorithm of mmunications of ACM.Vol.16.No.9 (1973) p.577. In the present embodiment, the elements of the similar image relation matrix R corresponding to the images included in the same subset
r ij becomes “1”, that is, a subset of image numbers of similar images is extracted.

上記部分集合C1,…,CNから第9図に示すような各部
分集合に含まれる画像番号を要素とする分類画像番号配
列28を生成し、分類統合回路15へ入力する。以上の計算
課程で得られる各行列の一例を第7図に示す。
From the subsets C 1 ,..., C N , a classification image number array 28 is generated as shown in FIG. An example of each matrix obtained in the above calculation process is shown in FIG.

分類統合回路15では、第10図に示す制御手順を実行
し、以下に説明するステップS21〜ステップS24の処理に
より部分集合C1,…,CNの統合を行う。
Classification integration circuit 15 executes the control procedure shown in FIG. 10, the subset C 1 by the processing in step S21~ step S24 to be described below, ..., performs integration of C N.

すなわち、 ステップS20) 距離しきい値dthおよび分類番号配列28
を入力する。
That is, Step S20) Distance threshold d th and classification number array 28
Enter

ステップS21) 分類しきい値cthを、距離しきい値dth
を用いて(1)式に従って求める。
Step S21) Change the classification threshold value c th to the distance threshold value d th
Is obtained in accordance with equation (1).

ステップS22) 分類画像番号配列28に含まれる分類ど
うしの距離と分類ベクトルを分類距離計算回路16(第1
図参照)によって計算する。具体的には、分類距離計算
回路16は、分類ベクトル生成回路22へ分類画像番号配列
28の各分類に属する画像の画像番号を送り、分類ベクト
ル生成回路22に分類ベクトルを生成させる。第12図に具
体例を示す分類ベクトルはその分類に含まれる画像番号
と対応した画像ベクトルの和である。分類ベクトル生成
回路22の指示する画像番号に基いて画像ベクトル生成回
路21により画像ベクトルを生成した後、生成された画像
ベクトルに基き、分類ベクトルを生成する(第11図参
照)。
Step S22) The distance between the classifications and the classification vector included in the classification image number array 28 are calculated by the classification distance calculation circuit 16 (first
Calculate according to the figure). Specifically, the classification distance calculation circuit 16 sends the classification image number array to the classification vector generation circuit 22.
The image number of the image belonging to each classification of 28 is sent, and the classification vector generation circuit 22 generates a classification vector. The classification vector of the specific example shown in FIG. 12 is the sum of the image vectors corresponding to the image numbers included in the classification. After an image vector is generated by the image vector generation circuit 21 based on the image number specified by the classification vector generation circuit 22, a classification vector is generated based on the generated image vector (see FIG. 11).

分類毎に生成された分類ベクトルの集合を分類ベク
トル配列30と称する。分類距離計算回路16は生成された
分類ベクトルを順次ベクトル距離計算回路23へ送り、分
類ベクトル相互の距離計算を指示する。この指示に応じ
て、ベクトル距離計算回路23では画像ベクトルの距離計
算(ステップS12)のときと同様に(2)式により分類
ベクトル相互の距離計算を行う。次に、計算結果の中の
最小値Cdminを抽出し、その最小値Cdminを与える分類番
号の組(c1,c2)を検出する。
A set of classification vectors generated for each classification is referred to as a classification vector array 30. The classification distance calculation circuit 16 sequentially sends the generated classification vectors to the vector distance calculation circuit 23, and instructs the calculation of the distance between the classification vectors. In response to this instruction, the vector distance calculation circuit 23 calculates the distance between the classification vectors according to the equation (2) as in the case of calculating the distance between image vectors (step S12). Next, the minimum value Cdmin in the calculation result is extracted, and a set of classification numbers (c 1 , c 2 ) that gives the minimum value Cdmin is detected.

ステップS23) 次に分類距離の最小値cdminとしきい値
cthを比較する。
Step S23) Next, the minimum classification distance cdmin and threshold
Compare c th .

cdmin≧cthのとき、 分類同士の類似度は低い、すなわち、分類処理が終
了したと判断し、分類画像番号配列28を分類画像番号配
列29(第14図参照)として、分類ベクトル配列30ととも
に分類順位決定回路17へ入力する。
When cd min ≧ c th , the similarity between the classifications is low, that is, it is determined that the classification processing has been completed, and the classification image number array 28 is changed to the classification image number array 29 (see FIG. 14), and the classification vector array 30 Is input to the classification order determination circuit 17.

なお、第14図は分類画像番号配列29の構成内容を示
し、第14図において符号29−1は分類番号,符号29−2
は分類画像番号配列29に含まれる画像数を示す。符号29
−3は分類画像番号配列29に含まれる画像番号を示す。
FIG. 14 shows the contents of the classification image number array 29. In FIG. 14, reference numeral 29-1 denotes a classification number, and reference numeral 29-2.
Indicates the number of images included in the classification image number array 29. Code 29
-3 indicates an image number included in the classification image number array 29.

cdmin<cthのとき、 次のステップS24へ進む。When cd min <c th, the process proceeds to the next step S24.

ステップS24) 分類画像番号配列28の中の分類番号c1,
c2の分類に属する画像番号集合どうしの和集合Cを求め
分類の統合を行う。次に、分類画像番号配列28から分類
番号c1,c2に対応する分類を削除して分類番号を更新す
る。更新後の分類画像番号配列28の末尾に先の和集合C
を新たな分類として追加する。このようにして得られた
分類画像配列を新たな分類画像番号配列28として、ステ
ップS22へ戻り、距離最小値cdminがcthよりも大きくな
るまで上述のステップS22〜S24の手順を繰り返す。
Step S24) The classification number c 1 in the classification image number array 28,
c. The union C of the image number sets belonging to the classification of 2 is obtained to integrate the classifications. Next, the classification corresponding to the classification numbers c 1 and c 2 is deleted from the classification image number array 28 to update the classification number. The union C at the end of the updated classified image number array 28
Is added as a new classification. The classification image array obtained in this manner is used as a new classification image number array 28, and the process returns to step S22, and the above-described steps S22 to S24 are repeated until the minimum distance cdmin becomes larger than c th .

以上の手順を分類統合回路15で繰り返すことにより、
初期分類回路で初期的に分類された分類結果の中の類似
する分類結果を統合した分類の画像データ群が自動的に
生成される。分類順位決定回路17では、分類統合回路15
から出力の分類ベクトル配列30の各分類ベクトルと、キ
ー画像番号25(不図示)に対応する画像の画像ベクトル
の距離を画像分類距離計算回路18によって計算する。す
なわち、画像分類距離計算回路18は、キー画像番号25を
画像ベクトル生成回路21へ送り、キー画像番号25の画像
ベクトルを得て、この画像ベクトルと分類ベクトル配列
30の分類ベクトルを順次ベクトル距離計算回路23へ送
り、キー画像と各分類に対応する分類ベクトルとの距離
を求める。
By repeating the above procedure in the classification integration circuit 15,
An image data group of a classification in which similar classification results among the classification results initially classified by the initial classification circuit are integrated is automatically generated. In the classification order determination circuit 17, the classification integration circuit 15
Then, the distance between each classification vector of the classification vector array 30 output from and the image vector of the image corresponding to the key image number 25 (not shown) is calculated by the image classification distance calculation circuit 18. That is, the image classification distance calculation circuit 18 sends the key image number 25 to the image vector generation circuit 21, obtains the image vector of the key image number 25, and
The 30 classification vectors are sequentially sent to the vector distance calculation circuit 23 to determine the distance between the key image and the classification vector corresponding to each classification.

次に、距離の小さい分類ほど優先順位が高いと考え、
この優先順に分類画像番号配列29,分類ベクトル配列30
の分類を分類順位決定回路17で並べ換える。並び換え結
果は、それぞれが分類画像番号配列31(第15図参照),
分類ベクトル配列32(第16図参照)として出力される。
Next, we consider that the smaller the distance, the higher the priority.
Classification image number array 29, classification vector array 30
Are sorted by the sorting order determination circuit 17. The rearrangement results are classified image number array 31 (see FIG. 15),
It is output as a classification vector array 32 (see FIG. 16).

なお、第15図は分類画像番号配列31の構成内容を示
し、第15図において符号31−1は分類番号、符号31−2
は画像番号の画像数、符号31−3は分類画像配列31に含
まれる画像番号を示す。
FIG. 15 shows the configuration of the classification image number array 31. In FIG. 15, reference numeral 31-1 denotes a classification number, and reference numeral 31-2.
Denotes the number of images of the image number, and reference numeral 31-3 denotes an image number included in the classified image array 31.

第16図は分類ベクトル配列32の構成内容を示し、第16
図において、符号32−1は分類番号、符号32−2は要素
の個数を示す。符号32−3は分類ベクトル配列32に含ま
れるキーワード番号、符号32−3はキーワード番号の重
みを示す。
FIG. 16 shows the configuration of the classification vector array 32.
In the figure, reference numeral 32-1 indicates a classification number, and reference numeral 32-2 indicates the number of elements. Reference numeral 32-3 indicates a keyword number included in the classification vector array 32, and reference numeral 32-3 indicates the weight of the keyword number.

分類名生成回路19は、分類順位決定回路17からの分類
ベクトル配列32を入力する。次に分類名生成回路19は分
類ベクトル配列32の各部類に対応した分類ベクトルの重
み要素の内でもっと大きいものの1/n以上の大きさで、
かつ、最も大きいものからm番目までの重みを持つ要素
を選択する。次に分類名生成回路19は選択した要素に対
応するキーワード要素のキーワード番号のキーワード文
字列を記憶装置6内のキーワードファイル9からバス7
を介して読み出し、キーワード文字列を分類毎に集めた
分類名キーワードの各文字を表わす画像を配列した文字
列配列33(第17図参照)として出力する。ここでn,mは
整数の定数で、例えばn=2,m=3とする。
The classification name generation circuit 19 receives the classification vector array 32 from the classification order determination circuit 17. Next, the classification name generation circuit 19 has a size of 1 / n or more of the larger ones among the weight elements of the classification vectors corresponding to each class of the classification vector array 32,
In addition, the element having the weight from the largest to the m-th is selected. Next, the classification name generating circuit 19 outputs a keyword character string of the keyword number of the keyword element corresponding to the selected element from the keyword file 9 in the storage device 6 to the bus 7.
And outputs the keyword character strings as a character string array 33 (see FIG. 17) in which images representing the characters of the classification name keywords, which are collected for each classification, are arranged. Here, n and m are integer constants, for example, n = 2 and m = 3.

なお、第17図は分類名キーワード文字列配列33の内容
の一例を示し、第17図において符号33−1は分類番号、
符号33−2は要素、符号33−3は要素を構成するキーワ
ード列を示す。
FIG. 17 shows an example of the contents of the classification name keyword character string array 33. In FIG. 17, reference numeral 33-1 denotes a classification number,
Reference numeral 33-2 denotes an element, and reference numeral 33-3 denotes a keyword string constituting the element.

[発明の効果] 本発明は、キーワード検索により得られるデータのキ
ーワード列が類似していることに着目し、キーワード検
索結果の中の1つのデータをキーデータとして、これに
類似したデータをキーワード検索結果の中からモデル検
索し、そのモデル検索により得られたデータ相互のキー
ワード列の距離計算を行って、データ全体を、キーワー
ド列が特に類似するデータ群に自動的に分類する。さら
には、分類されたデータ群のキーワード列とキーデータ
のキーワード列との距離計算を実行し、距離計算結果、
すなわち、類似度に応じて優先順を定めるようにしたの
で、従来では必要であった人間による検索結果の分類処
理が不要となる。さらには、優先順毎に上記データ群の
キーワード列を文字の画像形態で出力するようにしたの
で、検索者は自動分類の基になったキーワードを確認す
ることができ、次回のキーワード検索に用いることがで
きる。
[Effects of the Invention] The present invention focuses on the fact that keyword strings of data obtained by a keyword search are similar, and uses one piece of data in a keyword search result as key data, and searches data similar to this as a keyword search. A model search is performed from the results, and the distance between keyword strings of data obtained by the model search is calculated, and the entire data is automatically classified into a data group in which the keyword strings are particularly similar. Further, a distance calculation is performed between the keyword column of the classified data group and the keyword column of the key data, and the distance calculation result,
That is, since the priority order is determined according to the similarity, the classification process of the search result by a human, which is conventionally required, becomes unnecessary. Furthermore, the keyword string of the data group is output in the form of a character image for each priority order, so that the searcher can confirm the keyword based on the automatic classification and use the keyword for the next keyword search. be able to.

【図面の簡単な説明】[Brief description of the drawings]

第1図は第2図に示す画像分類部11の回路構成を示すブ
ロック図、 第2図は本発明実施例のシステム構成を示すブロック
図、 第3図は本発明実施例の画像キーワード番号行列ファイ
ル8の内容を示す説明図、 第4図は本発明実施例のキーワードファイル9の内容を
示す説明図、 第5図は本発明実施例の類似画像番号配列27の内容を示
す説明図、 第6図は第1図に示す初期分類回路13の処理手順を示す
フローチャート、 第7図は第1図に示す初期分類回路13の処理内容を示す
説明図、 第8図は本発明実施例の画像ベクトルの内容を示す説明
図、 第9図は本発明実施例の分類画像番号配列28の内容を示
す説明図、 第10図は第1図に示す分類統合回路15の処理手順を示す
フローチャート、 第11図は第1図に示す分類ベクトル生成回路22の分類ベ
クトル生成手順を示す説明図、 第12図は本発明実施例の分類ベクトルの内容を示す説明
図、 第13図は本発明実施例の分類ベクトル配列30の内容を示
す説明図、 第14図は本発明実施例の分類画像番号配列29の内容を示
す説明図、 第15図は本発明実施例の分類画像番号配列31の内容を示
す説明図、 第16図は本発明実施例の分類ベクトル配列32の内容を示
す説明図、 第17図は本発明実施例の分類名キーワード文字列配列33
の内容を示す説明図である。 1……ホストコンピュータ、 3……類似画像検索部、 6……記憶装置、 8……画像キーワード番号行列(PK行列)ファイル、 9……キーワードファイル、 10……画像データファイル、 11……画像分類部、 12……入力バッファ、 13……初期分類回路、 15……分類統合回路、 17……分類順位決定回路、 19……分類名生成回路、 20……出力バッファ。
FIG. 1 is a block diagram showing a circuit configuration of the image classification unit 11 shown in FIG. 2, FIG. 2 is a block diagram showing a system configuration of the embodiment of the present invention, and FIG. 3 is an image keyword number matrix of the embodiment of the present invention. FIG. 4 is an explanatory diagram showing the contents of the keyword file 9 of the embodiment of the present invention, FIG. 5 is an explanatory diagram showing the contents of the similar image number array 27 of the embodiment of the present invention, 6 is a flowchart showing the processing procedure of the initial classification circuit 13 shown in FIG. 1, FIG. 7 is an explanatory diagram showing the processing contents of the initial classification circuit 13 shown in FIG. 1, and FIG. 8 is an image of the embodiment of the present invention. FIG. 9 is an explanatory diagram showing the contents of the vector, FIG. 9 is an explanatory diagram showing the contents of the classification image number array 28 according to the embodiment of the present invention, FIG. 10 is a flowchart showing the processing procedure of the classification integration circuit 15 shown in FIG. FIG. 11 shows the classification vector of the classification vector generation circuit 22 shown in FIG. FIG. 12 is an explanatory diagram showing the contents of the classification vector of the embodiment of the present invention. FIG. 13 is an explanatory diagram showing the contents of the classification vector array 30 of the embodiment of the present invention. FIG. 15 is an explanatory diagram showing the contents of the classification image number array 29 of the embodiment of the present invention. FIG. 15 is an explanatory diagram showing the contents of the classification image number array 31 of the embodiment of the present invention. FIG. 16 is a classification vector array of the embodiment of the present invention. FIG. 17 is an explanatory diagram showing the contents of 32. FIG. 17 is a classification name keyword character string array 33 according to the embodiment of the present invention.
It is an explanatory view showing the contents of. 1 Host computer 3 Similar image search unit 6 Storage device 8 Image keyword number matrix (PK matrix) file 9 Keyword file 10 Image data file 11 Image Classification unit, 12: Input buffer, 13: Initial classification circuit, 15: Classification integration circuit, 17: Classification order determination circuit, 19: Classification name generation circuit, 20: Output buffer

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】予め記憶された複数のデータをキーワード
検索し、当該キーワード検索により得られる検索結果の
中の1つのデータをキーデータとして選択し、前記検索
結果の中から前記キーデータのキーワード列と類似する
データをモデル検索するデータベースのデータ検索方法
であって、 当該モデル検索により得られた各データ相互のキーワー
ド列についての距離計算を実行し、 当該距離計算の結果が所定値以下となるデータを統合す
ることにより複数の第1のデータ群を作成し、 当該作成された複数の第1データ群相互のキーワード列
についての距離計算を実行し、 当該距離計算の結果が所定値以下となる第1データ群を
統合することにより複数の第2データ群を作成して、前
記モデル検索により得られたデータを前記複数の第2デ
ータ群に分類し、 当該分類された複数の第2データ群の各々のキーワード
列と前記キーデータのキーワード列との距離計算を実行
し、 当該距離計算の結果に応じて前記分類された複数のデー
タ群の優先順位を定めることを特徴とするデータベース
のデータ検索方法。
1. A keyword search for a plurality of data stored in advance, one of search results obtained by the keyword search is selected as key data, and a keyword string of the key data is selected from the search results. A data search method for a database that searches for a model similar to that of a database, in which a distance calculation is performed for a keyword string of each data obtained by the model search, and the result of the distance calculation is equal to or less than a predetermined value. To create a plurality of first data groups, perform a distance calculation for the created keyword strings between the plurality of first data groups, and perform a distance calculation where the result of the distance calculation is equal to or less than a predetermined value. A plurality of second data groups are created by integrating one data group, and the data obtained by the model search is stored in the plurality of second data groups. And performing a distance calculation between each of the keyword strings of the plurality of classified second data groups and the keyword string of the key data. According to a result of the distance calculation, the plurality of classified data groups are classified. A method for retrieving data from a database, wherein priorities of data groups are determined.
【請求項2】請求項1に記載のデータベースのデータ検
索方法において、 前記複数の第2データ群の各々に含まれるキーワード列
を、文字を表わす画像の形態で前記優先順位に従って出
力することを特徴とするデータベースのデータ検索方
法。
2. The data retrieval method for a database according to claim 1, wherein a keyword string included in each of the plurality of second data groups is output in the form of an image representing a character in accordance with the priority order. The database data retrieval method to be used.
JP1067692A 1989-03-22 1989-03-22 How to search database data Expired - Fee Related JP2735866B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1067692A JP2735866B2 (en) 1989-03-22 1989-03-22 How to search database data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1067692A JP2735866B2 (en) 1989-03-22 1989-03-22 How to search database data

Publications (2)

Publication Number Publication Date
JPH02247778A JPH02247778A (en) 1990-10-03
JP2735866B2 true JP2735866B2 (en) 1998-04-02

Family

ID=13352280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1067692A Expired - Fee Related JP2735866B2 (en) 1989-03-22 1989-03-22 How to search database data

Country Status (1)

Country Link
JP (1) JP2735866B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0675999A (en) * 1992-07-06 1994-03-18 Nec Corp Device for displaying data base resemblance retrieval solution
JP3325326B2 (en) * 1993-02-26 2002-09-17 株式会社東芝 Electronic filing equipment
JPH1063685A (en) * 1996-08-19 1998-03-06 Nec Corp Information retrieving system
US20170273666A1 (en) * 2014-09-24 2017-09-28 Jiajiu Yang Method for storing ultrasonic scan image and ultrasonic device

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5750297B2 (en) 2011-04-19 2015-07-15 日本メクトロン株式会社 Substrate assembly and lighting device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5750297B2 (en) 2011-04-19 2015-07-15 日本メクトロン株式会社 Substrate assembly and lighting device

Also Published As

Publication number Publication date
JPH02247778A (en) 1990-10-03

Similar Documents

Publication Publication Date Title
JP3225912B2 (en) Information retrieval apparatus, method and recording medium
JP3781696B2 (en) Image search method and search device
JP3087694B2 (en) Information retrieval device and machine-readable recording medium recording program
JP3849279B2 (en) Index creation method and search method
CN102968465B (en) Network information service platform and the search service method based on this platform thereof
US20050060290A1 (en) Automatic query routing and rank configuration for search queries in an information retrieval system
CN109829104A (en) Pseudo-linear filter model information search method and system based on semantic similarity
CN118551086B (en) A Distributed Multimodal Data Retrieval Method and System Based on Knowledge Graph and Vector Matching
JPH07160731A (en) Image retrieval method and apparatus thereof
JP2002197096A (en) Method and system for generating general text summary of document
JPH021057A (en) Document retrieving device
US20070073759A1 (en) Methods and systems for joining database tables using indexing data structures
JP2735866B2 (en) How to search database data
JP2985805B2 (en) Information retrieval device
JPH021059A (en) Associative retrieving system
JPH05225238A (en) Data base retrieval system
JPH10301937A (en) Neighborhood search method in multidimensional vector space and recording medium for the program
CN119027694B (en) Image retrieval method, medium and device based on local feature enhancement and re-ranking
JP2859771B2 (en) Similarity search method and apparatus using dynamic concept dictionary
Bovey et al. An algorithm for weighted searching on a Boolean system
RU2266560C1 (en) Method utilized to search for information in poly-topic arrays of unorganized texts
Westenberg et al. Mixed-method identifications
JP2004310199A (en) Document classification method and document classification program
JPH11134364A (en) Systematic knowledge analysis method and apparatus, and classification method and apparatus
Goker et al. Towards an adaptive information retrieval system

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees