JP6949449B2 - Data search system and data search program - Google Patents
Data search system and data search program Download PDFInfo
- Publication number
- JP6949449B2 JP6949449B2 JP2018171603A JP2018171603A JP6949449B2 JP 6949449 B2 JP6949449 B2 JP 6949449B2 JP 2018171603 A JP2018171603 A JP 2018171603A JP 2018171603 A JP2018171603 A JP 2018171603A JP 6949449 B2 JP6949449 B2 JP 6949449B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- search
- file
- database
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
この発明は、データ検索システム及びデータ検索用プログラムに関するものである。 The present invention relates to a data search system and a data search program.
従来、大量データを擁するリレーショナルデータベースなどのデータベースシステムにおいて曖昧検索を行う場合には、極めて多くの時間を要するという問題があった。 Conventionally, there has been a problem that an extremely large amount of time is required when performing an ambiguous search in a database system such as a relational database having a large amount of data.
特許文献1には、全文検索エンジンとRDB(リレーショナルデータベース)を用いて高速検索前処理の状態情報を用いることで、検索時間を短縮することができる文書検索装置が開示されている。 Patent Document 1 discloses a document search device capable of shortening the search time by using the state information of high-speed search preprocessing using a full-text search engine and an RDB (relational database).
具体的には、複数の文書とフォルダに対し、パターンマッチング部と全文検索部とを備えて、検索対象の種類と状態とを判断して、上記パターンマッチング部と全文検索部とのいずれかにより検索を行うというものである。この特許文献1の発明は、パターンマッチング部は即時検索可能であるが検索時間がかかるというという特徴があり、全文検索部は登録に時間がかかるが検索時間が高速であるという特徴があることに鑑み、これらを切換えてそれぞれを有利な場面で使用するものである。 Specifically, a pattern matching unit and a full-text search unit are provided for a plurality of documents and folders, the type and state of the search target are determined, and either the pattern matching unit or the full-text search unit is used. It is a search. The invention of Patent Document 1 is characterized in that the pattern matching unit can be searched immediately but the search time is long, and the full-text search unit is characterized in that the registration takes time but the search time is high. In view of this, these are switched and each is used in an advantageous situation.
特許文献2には、複数のクライアントと通信可能な全文検索エンジンは文書登録時に全文検索エンジンが文書へのアクセス権を有するクライアントの識別符号(ユーザID)に制御文字(例えば区切り文字)を付加した文字列を上記文書と共に格納すること、また、全文検索エンジンは文書へのアクセス要求時に検索語に対して上記アクセス要求したクライアントの識別符号に上記制御文字を付与した文字列を追加して全文検索を実行することが、開示されている。 In Patent Document 2, a full-text search engine capable of communicating with a plurality of clients adds a control character (for example, a delimiter) to the identification code (user ID) of the client to which the full-text search engine has the right to access the document at the time of document registration. The character string is stored together with the above document, and the full-text search engine adds the character string in which the above control character is added to the identification code of the client who requested the access to the search term when the document is requested to access the document and performs a full-text search. Is disclosed.
更に上記特許文献2の発明では、全文検索エンジンが、文書本体とは別に当該文書の属性値を格納するカラムを有しており、全文検索エンジンは、文書登録時にクライアントの識別符号と制御文字とからなる文字列を文書の属性値としてカラムに格納し、文書へのアクセス要求時に前記アクセス要求したクライアントの識別符号に制御文字を付与した文字列を上記カラムに対する検索語として全文検索する。以上により、全文検索と共にアクセス制御が同時にできることになる、というものである。 Further, in the invention of Patent Document 2, the full-text search engine has a column for storing the attribute value of the document separately from the document body, and the full-text search engine uses the identification code and the control character of the client at the time of document registration. A character string consisting of is stored in a column as an attribute value of a document, and a character string in which a control character is added to the identification code of the client requested to access the document is searched in full text as a search term for the column. As a result, access control can be performed at the same time as full-text search.
また、特許文献3には、金融情報検索システムとして、各銘柄について記載された文書データを保持する文書DBを所定タイミングでクローリングして全文検索用の文書インデックスを作成するクローラを備える検索エンジンが開示されている。この検索エンジンは更に、営業端末から受け付けた検索要求に対して文書インデックスからマッチする文書データに係るレコードのうち、上位の所定の件数を検索結果として応答する検索処理部を有しており、営業端末から受け付けた検索要求においてキーワードの指定がなされていない場合に、検索エンジンによる検索ではなく、文書DBに対して直接に検索処理を行うDB検索部を有するというものである。 Further, Patent Document 3 discloses a search engine including a crawler that creates a document index for full-text search by crawling a document DB holding document data describing each issue at a predetermined timing as a financial information retrieval system. Has been done. This search engine further has a search processing unit that responds as a search result to a predetermined number of high-ranking records related to document data matching from the document index in response to a search request received from a sales terminal. It has a DB search unit that directly performs a search process on a document DB instead of a search by a search engine when a keyword is not specified in the search request received from the terminal.
上記特許文献3の発明によれば、検索エンジンによる検索の際にキーワードが指定されていない場合においても、検索結果に対するソートの条件で上位の所定件数に入り得るデータが漏れずに表示されるようになる、という効果を奏することになる。 According to the invention of Patent Document 3, even when a keyword is not specified at the time of a search by a search engine, data that can be included in a predetermined number of high-ranking items under the sorting conditions for the search result is displayed without omission. It will have the effect of becoming.
更に、特許文献4には、入力部によって入力されたユーザ指定の検索キーワードのデータ構造上の特徴(データ型等)を解析するデータ型解析部と、リレーショナルデータベースに格納されている検索の対象となるテーブルの各カラムのうち、上記解析された検索キーワードのデータ構造上の特徴(データ型等)に合致するカラムを、上記検索対象列として検出する検索対象列検出部とを備える検索対象列決定装置が開示されている。 Further, Patent Document 4 includes a data type analysis unit that analyzes data structure features (data types, etc.) of a user-specified search keyword input by the input unit, and a search target stored in a relational database. A search target column determination including a search target column detection unit that detects a column that matches the data structure characteristics (data type, etc.) of the analyzed search keyword as the search target column among the columns of the table. The device is disclosed.
上記特許文献4の発明は、検索キーワードのデータ構造上の特徴から全文検索の対象とすべきカラムを動的に絞ることにより、全文検索時の応答性能を向上させるというものである。 The invention of Patent Document 4 is to improve the response performance at the time of full-text search by dynamically narrowing down the columns to be the target of full-text search based on the data structure characteristics of the search keyword.
本発明は、上記のような検索システムより以上に高速な検索を可能とするデータ検索システム及びデータ検索用プログラムを提供することを目的とする。 An object of the present invention is to provide a data search system and a data search program that enable a faster search than the above-mentioned search system.
本発明に係るデータ検索システムは、1単位の管理対象データのテーブルが複数テーブル蓄積されたデータベースと、前記データベースの前記複数テーブルの全てを検索情報で検索し、前記管理対象データの1単位であるテーブルを全て特定し、特定された全てのテーブルについてのユニークな値を主キー情報として、この主キー情報に該当テーブルの内容データ中の検索対象情報を属性情報として帰属させた第1のインデックステーブルを作成し、この第1のインデックステーブルをまとめた第1のインデックスファイルを生成する第1のクローラ収集手段と、検索すべきキーワードが与えられると、前記第1のインデックスファイルを検索して、当該キーワードに対応するデータを備える第1のインデックステーブルを検出してこの第1のインデックステーブルの主キー情報を求める主キー情報取得手段と、前記主キー情報取得手段が求めた主キー情報に基づき前記データベースを検索し、得られた該当テーブルから前記キーワードに対応するデータを取り出すデータベース検索手段と、情報を表示する表示手段と、前記データベース検索手段が取り出したデータに基づく表示を前記表示手段に行う表示制御手段とを具備することを特徴とする。
The data search system according to the present invention searches for a database in which a plurality of tables of managed data in one unit are accumulated and all of the plurality of tables in the database with search information, and is one unit of the managed data. A first index table in which all the tables are specified, unique values for all the specified tables are used as the primary key information, and the search target information in the content data of the corresponding table is assigned to this primary key information as attribute information. Is given, and a first crawler collecting means for generating a first index file that summarizes the first index table and a keyword to be searched are given, the first index file is searched and the relevant first index file is searched. The primary key information acquisition means for detecting the first index table having data corresponding to the keyword and obtaining the primary key information of the first index table, and the primary key information obtained by the primary key information acquisition means. A database search means for searching a database and extracting data corresponding to the keyword from the obtained corresponding table, a display means for displaying information, and a display for displaying based on the data extracted by the database search means on the display means. It is characterized by having a control means.
以下添付図面を参照して、本発明に係るデータ検索システム及びデータ検索用プログラムの実施形態を説明する。各図において、同一の構成要素には同一の符号を付して重複する説明を省略する。図1には、本発明に係るデータ検索システムの実施形態の構成図が示されている。実施形態に係るデータ検索システムは、種々のデータが蓄積されたデータベース300と、このデータベース300の全ての文の検索を行う全文検索エンジン500とが備えられている。データベース300としては、例えばリレーショナルデータベースを採用することができる。
Hereinafter, embodiments of the data search system and the data search program according to the present invention will be described with reference to the accompanying drawings. In each figure, the same components are designated by the same reference numerals, and duplicate description will be omitted. FIG. 1 shows a configuration diagram of an embodiment of a data retrieval system according to the present invention. The data search system according to the embodiment includes a
ここでは、データベース300が蓄積している管理対象データが商品カタログのデータであり、例えば、図2に示されるように1単位の管理対象データのテーブルD11、D12、D13、・・・、D1nが蓄積されている。1つのテーブルについては、ユニークな値に対し、必要な項目が複数配置された構造を有する。本実施形態では、ユニークな値はテーブルの先頭に配置されている商品番号であり、各テーブルD11、D12、D13、・・・、D1nには、項目のデータとして、「商品名」、「商品名カナ」、「荷姿」、「取扱開始日」、「取扱終了日」、・・・と並んでいる。なお、項目内のデータの並び順は、例示に過ぎない。
Here, the managed data accumulated in the
全文検索エンジン500には、第1のクローラ収集手段503が備えられている。第1のクローラ収集手段503は、上記データベース300を検索し、上記管理対象データの1単位であるテーブルを特定し、特定された全てのテーブルについてのユニークな値を主キー情報として、この主キー情報に該当テーブルの内容データ中の検索対象情報を属性情報として帰属させた第1のインデックステーブルを作成し、この第1のインデックステーブルをまとめた第1のインデックスファイル501を生成するものである。
The full-
既に説明したように、データベース300のテーブルD11には、商品番号と、項目のデータとして、「商品名」、「商品名カナ」、「荷姿」、「取扱開始日」、「取扱終了日」、・・・が記憶されているので、第1のクローラ収集手段503は上記「商品名」、「商品名カナ」、「荷姿」、「取扱開始日」、「取扱終了日」、・・・というデータから、SQL(Structured Query Language)で指定した検索対象情報に該当する文字列の項目(カラム)の情報を検索して、帰属情報として帰属させて第1のインデックステーブルを作成する。
As already explained, in the table D11 of the
図3に、テーブルD11から第1のインデックステーブルD41を作成する過程を示す。ここでは、SQLにより指定された検索対象情報に「商品番号」「商品名」「商品カナ」が該当したことを示す。テーブルD12〜D1nについても同様に検索が行われ、SQLにより指定された検索対象情報に該当する情報が項目(カラム)に含まれていたテーブルに対応してインデックステーブルが作成される。従って、テーブルD11〜D1nの全てについてインデックステーブルが作成される訳ではない。例えば、テーブルD12には、SQLにより指定された検索対象情報の「商品番号」「商品名」「商品カナ」が含まれていないので、このテーブルに対応するインデックステーブルは作成されない。以上のようにして作成された幾つかのインデックステーブルが全て1つにまとめられて第1のインデックスファイル501とされる。
FIG. 3 shows a process of creating the first index table D41 from the table D11. Here, it is shown that the "product number", "product name", and "product kana" correspond to the search target information specified by SQL. The same search is performed for the tables D12 to D1n, and an index table is created corresponding to the table in which the information corresponding to the search target information specified by SQL is included in the item (column). Therefore, index tables are not created for all of the tables D11 to D1n. For example, since the table D12 does not include the "product number", "product name", and "product kana" of the search target information specified by SQL, the index table corresponding to this table is not created. The several index tables created as described above are all combined into one to be the
本実施形態では、データベース300のデータのディレクトリ配下の添付ファイルが蓄積されたファイル装置400が設けられている。例えば、ファイル装置400中の1つの添付ファイルD21は図4に示すようであり、図2に示したテーブルD11のディレクトリ配下の添付ファイルである。そして、添付ファイルD21のユニークな値は、テーブルD11のディレクトリ配下を示すためにテーブルD11と同じ「商品番号」に対し、この添付ファイルD21にユニークな「連番」が付加されたものとなっている。添付ファイルD21には、上記ユニークな値である「商品番号_連番」以外に、この商品番号に対応付けられているパンフレットや取扱説明書などのデータが保存されている。ファイル装置400には、この添付ファイルD21と同様に複数の添付ファイルが蓄積されており、その添付ファイルにユニークな「商品番号_連番」と共に、この商品番号に対応付けられているパンフレットや取扱説明書などのデータが保存されている。この添付ファイルはそれぞれ、データベース300が蓄積しているテーブルD11、D12、D13、・・・、D1nのディレクトリ配下として記憶されている。なお、添付ファイルは、テーブルD11、D12、D13、・・・、D1nの全てに必ずしも対応付けられているものではなく、添付ファイルが対応付けられていないテーブルも存在する。また、添付ファイルの識別子であるユニークな識別情報である「商品番号_連番」には、「連番」となっていることからも明らかな通り、データベース300中の1つのテーブルに対して複数の添付ファイルが存在していても良く、この場合は「連番」の部分は「01」、「02」、・・・となる。
In the present embodiment, the file device 400 in which the attached files under the data directory of the
全文検索エンジン500には、第2のクローラ収集手段504が備えられている。第2のクローラ収集手段504は、上記ファイル装置400内を検索して、ユニークな値を識別情報に該当添付ファイルの上記所要データを帰属させた第2のインデックステーブルを作成し、この第2のインデックステーブルをまとめた第2のインデックスファイル502を生成するものである。
The full-
既に説明したように、ファイル装置400には、添付ファイルD21・・・等が蓄積されており、その添付ファイルにユニークな「商品番号_連番」と共に、この商品番号に対応付けられているパンフレットや取扱説明書などのデータが保存されている。第2のクローラ収集手段504は、「商品番号_連番」に対応付けられているパンフレットや取扱説明書などのデータから、SQL(Structured Query Language)で指定された検索対象情報に該当する文字列のデータを帰属情報として帰属させて第2のインデックステーブルを作成する。このSQL(Structured Query Language)で指定された検索対象情報は、第1のインデックステーブルを作成するときに用いた検索対象情報と異なっても良い。上記第1のクローラ収集手段503及び上記第2のクローラ収集手段504は、形態素解析とN−Gramのいずれかにより検索を行う構成とすることができる。 As described above, the file device 400 stores attached files D21, etc., and the attached file has a unique "product number_serial number" and a pamphlet associated with this product number. And data such as instruction manuals are saved. The second crawler collecting means 504 is a character string corresponding to the search target information specified in SQL (Structured Query Language) from data such as a brochure or an instruction manual associated with "product number_serial number". A second index table is created by assigning the data of. The search target information specified in this SQL (Structured Query Language) may be different from the search target information used when creating the first index table. The first crawler collecting means 503 and the second crawler collecting means 504 can be configured to perform a search by either morphological analysis or N-Gram.
図5には、ファイル装置400の添付ファイルD21から第2のインデックステーブルD42を作成する過程を示す。ここでは、SQLにより指定された検索対象情報は、パンフレットや取扱説明書などのデータが該当したことを示す。第2のインデックステーブルD42は、添付ファイルD21のユニークな値である「商品番号_連番」を識別情報とし、この識別情報に該当添付ファイルのSQLにより指定された検索対象情報に該当したパンフレットや取扱説明書などのデータを帰属させた第2のインデックステーブルを作成する。ファイル装置400中の添付ファイルD21以外の図示しない添付ファイルについても同様に検索が行われ、SQLにより指定された検索対象情報に該当するデータがヒットした場合には、この添付ファイルの識別情報である「商品番号_連番」に対応してインデックステーブルが作成される。SQLにより指定された検索対象情報に該当するデータがヒットしない場合には、インデックステーブルは作成されない。従って、ファイル装置400内の全ての添付ファイルについてインデックステーブルが作成される訳ではない。以上のようにして作成された幾つかのインデックステーブルが全て1つにまとめられて第2のインデックスファイル502とされる。
FIG. 5 shows a process of creating a second index table D42 from the attached file D21 of the file device 400. Here, the search target information specified by SQL indicates that data such as a pamphlet or an instruction manual is applicable. The second index table D42 uses "item number_serial number", which is a unique value of the attached file D21, as identification information, and the pamphlet or the pamphlet corresponding to the search target information specified by the SQL of the attached file corresponding to this identification information. Create a second index table to which data such as instruction manuals are assigned. The same search is performed for the attached file (not shown) other than the attached file D21 in the file device 400, and when the data corresponding to the search target information specified by the SQL hits, it is the identification information of this attached file. An index table is created corresponding to "Product number_Sequential number". If the data corresponding to the search target information specified by SQL is not hit, the index table is not created. Therefore, the index table is not created for all the attached files in the file device 400. The several index tables created as described above are all combined into one to form a
本実施形態では、本検索装置200が設けられる。本検索装置200の「本」の意味は、全文検索エンジン500によっても検索が行われるため、本来的な検索要求が到来してからの検索が、この本検索装置200において行われることを示すものである。この本検索装置200には、検索端末101から検索要求とキーワードが与えられる。検索端末101としては、ネットワーク等により接続されるパーソナルコンピュータやワークステーション、携帯電話機やスマートフォン等の移動携帯端末などを採用することができる。
In this embodiment, the
本検索装置200には、主キー情報取得手段205とデータベース検索手段201とが備えられている。主キー情報取得手段205は、検索すべきキーワードが与えられると、上記第1のインデックスファイル501を検索して、当該キーワードに対応するデータを備える第1のインデックステーブルを検出してこの第1のインデックステーブルの主キー情報を求めるものである。具体的は、主キー情報取得手段205は、全文検索エンジン500へ検索要求を与えて第1のインデックスファイル501の検索を行わせ、主キー情報を得るものである。第1のインデックスファイル501には、「商品番号」を主キー情報とし、属性情報が属する第1のインデックステーブルが複数格納されているので、この第1のインデックステーブル全てについてキーワードを用いて検索を行い、該当するキーワードが含まれる第1のインデックステーブルを求めて、その主キー情報である「商品番号」を求める。従って、全文検索エンジン500による第1のインデックスファイル501の検索が終了すると、幾つかの主キー情報である「商品番号」が求まっているか、キーワードにヒットする属性情報が無かったために、「商品番号」が求まっていないかである。この情報は上記主キー情報取得手段205へ送られる。
The
データベース検索手段201は、上記主キー情報取得手段205が求めた主キー情報に基づき上記データベース300を検索し、得られた該当テーブルから上記キーワードに対応するデータを取り出すものである。つまり、データベース検索手段201が主キー情報に基づき上記データベース300を検索するとき、該当のデータが存在しているデータベース300のテーブルへと高速に確実に行き着くので、このテーブルからキーワードに対応する所望のデータを取り出すことができる。
The database search means 201 searches the
本検索装置200には、表示制御手段206が設けられている。上記データベース検索手段201により得られたデータは、表示制御手段206へ送られる。表示制御手段206は、上記データベース検索手段201が取り出したデータに基づく表示を検索端末101に送って、その表示手段において表示を行うようにする。
The
表示制御手段206には、表示データ加工手段203と表示処理手段204が設けられている。表示データ加工手段203は、上記データベース検索手段201により得られたたデータ(キーワードに対応してヒットしたデータ)を検索端末101に一覧表示するデータとして加工する処理を行う。表示処理手段204は、上記加工されたデータを検索端末101の表示手段(LED等の表示器)に表示可能な表示データとして送出する。
The display control means 206 is provided with a display data processing means 203 and a display processing means 204. The display data processing means 203 processes the data (data hit corresponding to the keyword) obtained by the database search means 201 as data to be displayed in a list on the
更に、本検索装置200には、識別情報取得手段207と添付ファイル検索手段202とが備えられている。識別情報取得手段207は、検索すべきキーワードが与えられると、上記第2のインデックスファイル502を検索して、当該キーワードに対応するデータを備える第2のインデックステーブルを検出してこの第2のインデックステーブルの識別情報を求めるものである。具体的には、識別情報取得手段207は、全文検索エンジン500へ検索要求を与えて第2のインデックスファイル502を検索させて、識別情報を得るものである。第2のインデックスファイル502には、「商品番号_連番」を識別情報とし、パンフレットや取扱説明書などのデータを帰属させた第2のインデックステーブルが複数格納されているので、この第2のインデックステーブル全てについてキーワードを用いて検索を行い、該当するキーワードが含まれる第2のインデックステーブルを求めて、その識別情報である「商品番号_連番」を求める。従って、全文検索エンジン500による第2のインデックスファイル502の検索が終了すると、幾つかの識別情報である「商品番号_連番」が求まっているか、キーワードにヒットするデータを有する第2のインデックステーブルが無かったために、「商品番号_連番」が求まっていないかである。この情報は上記識別情報取得手段207へ送られる。
Further, the
添付ファイル検索手段202は、上記識別情報取得手段207が求めた識別情報に基づき上記ファイル装置400を検索し、得られた該当添付ファイルから上記キーワードに対応するデータを取り出すものである。つまり、添付ファイル検索手段202が求めた識別情報に基づき上記ファイル装置400を検索するとき、該当するデータが存在しているファイル装置400のテーブルへと高速に確実に行き着くので、このテーブルからキーワードに対応する所望のデータを取り出すことができる。 The attached file search means 202 searches the file device 400 based on the identification information obtained by the identification information acquisition means 207, and extracts data corresponding to the keyword from the obtained attached file. That is, when the file device 400 is searched based on the identification information obtained by the attached file search means 202, the table of the file device 400 in which the corresponding data exists can be reliably reached at high speed. The corresponding desired data can be retrieved.
このようにして取り出されたデータは、表示制御手段206へ送られ、表示制御手段206は、上記データベース検索手段201が取り出したデータに基づく表示を検索端末101に送って、その表示手段において表示を行うようにする。
The data extracted in this way is sent to the display control means 206, and the display control means 206 sends a display based on the data extracted by the database search means 201 to the
上記添付ファイル検索手段202が取り出したデータについて、表示データ加工手段203は、上記データベース検索手段201により得られたデータと共に加工を行う。例えば、検索端末101に一覧表示するデータ内に、添付ファイル検索手段202が取り出したパンフレットや取扱説明書などのデータを最小限個別に含ませて加工する処理を行う。表示処理手段204は、上記加工されたデータを検索端末101の表示手段(LED等の表示器)に表示可能な表示データとして送出する。
The display data processing means 203 processes the data extracted by the attached file search means 202 together with the data obtained by the database search means 201. For example, the data displayed in the list on the
以上のような構成において、上記第1のクローラ収集手段503は、任意の時刻に処理を行うことができる。例えば、午前0時からの6時間中において1分間隔で処理を行うことができる。また、第2のクローラ収集手段504についても、上記と同様に任意の時刻に処理を行うことができる。 In the above configuration, the first crawler collecting means 503 can perform processing at an arbitrary time. For example, processing can be performed at 1-minute intervals during 6 hours from midnight. Further, the second crawler collecting means 504 can also be processed at an arbitrary time in the same manner as described above.
上記のように、第1のクローラ収集手段503により第1のインデックスファイル501に第1のインデックステーブルが収集されており、第2のクローラ収集手段504により第2のインデックスファイル502に第2のインデックステーブルが収集されている。このときに、検索端末101からキーワードの検索要求がされると、図6に示すフローチャートに示すような処理が行われる。
As described above, the first crawler collecting means 503 collects the first index table in the
検索端末101からキーワードの検索要求がされると、検索処理が開始される。検索端末101から与えられたキーワードに基づき第1のインデックスファイル501に対する検索を行い、該当する第1のインデックステーブルにおける主キー情報である「商品番号」を取得して、内部メモリテーブルA(図1)へ格納する(S11)。
When a keyword search request is made from the
次に、検索端末101から与えられたキーワードに基づき第2のインデックスファイル502に対する検索を行い、該当する第2のインデックステーブルにおける識別情報である「商品番号_連番」を取得して、「商品番号」部分のみを内部メモリテーブルB(図1)へ格納する(S12)。
Next, the
次に、内部メモリテーブルAの主キー情報と内部メモリテーブルBの論理和を作成し、内部メモリテーブルC(図1)に格納する(S13)。つまり、同じ「商品番号」があれば1つとする。このようにして、データベース300とファイル装置400を曖昧検索し、一致した主キー情報(「商品番号」)を高速に得ることができる。次に、内部メモリテーブルCの主キー情報のみを用いてデータベース300へアクセスし、得られた該当テーブルから上記キーワードに対応するデータを取り出すものである(S14:データベース検索手段201)。
Next, the primary key information of the internal memory table A and the logical sum of the internal memory table B are created and stored in the internal memory table C (FIG. 1) (S13). In other words, if there is the same "product number", it will be one. In this way, the
上記で取り出されたデータを加工して(S15:表示データ加工手段203)、検索端末101へ送って表示手段へ表示する(S16:表示処理手段204)。
The data extracted above is processed (S15: display data processing means 203), sent to the
上記表示制御手段206は、上記添付ファイル検索手段が取り出したデータがない場合には、上記データベース検索手段が取り出したデータのみに基づく表示を前記表示手段に行うことができる。また、上記表示制御手段206は、上記データベース検索手段201が取り出したデータ及び上記添付ファイル検索手段202が取り出したデータがない場合には、検索結果が得られないことの表示を上記表示手段に行うことができる。 When the display control means 206 does not have the data retrieved by the attached file search means, the display control means 206 can display the display means based only on the data retrieved by the database search means. Further, the display control means 206 displays to the display means that a search result cannot be obtained when there is no data retrieved by the database search means 201 and data retrieved by the attached file search means 202. be able to.
なお、本実施形態では、識別情報である「商品番号_連番」を用いてファイル装置400を検索してデータを得る処理を行わないが、内部メモリテーブルBの情報を用いてファイル装置400から添付ファイル検索手段202による検索を行って、得られたデータを表示データ加工手段203が加工して一覧表示する情報としてまとめても良い。これにより、この情報を用いファイル装置400へアクセスし対応するパンフレットや取扱説明書などのデータをダウンロードして表示することが可能となる。 In the present embodiment, the process of searching the file device 400 using the identification information "product number_serial number" to obtain data is not performed, but the information in the internal memory table B is used from the file device 400. The search may be performed by the attached file search means 202, and the obtained data may be summarized as information to be processed and displayed as a list by the display data processing means 203. This makes it possible to access the file device 400 using this information and download and display the corresponding data such as pamphlets and instruction manuals.
上記の構成に対し本実施形態は、データベース検索手段201が第1のインデックスファイル501の検索結果である主キー情報を用いるのではなく、主キー情報取得手段205の処理の処理を行わずに直接にデータベース300をSQLによって検索する構成を採ることはない。即ち、このような構成によると、検索端末101からのキーワードで列項目である「商品番号」、「商品名」、「商品名カナ」をそれぞれ前方後方中間一致の条件により検索する必要が生じ、データベースシステムとしては負荷が大きくレスポンスの悪いものとなる。検索キーワードによる検索が、データベース300における複数テーブルに跨るようなものである場合には、直接にデータベース300を検索するためのSQLが非常に複雑となることから、この点においても上記構成を本実施形態では採用していないことが理解できる。
In contrast to the above configuration, in the present embodiment, the database search means 201 does not use the primary key information that is the search result of the
以上のように本実施形態によれば、データベース及び全文検索エンジンに特殊・特別な変形・加工を加えることなく、データベースの各テーブルに分散する項目(カラム)を検索対象項目にした曖昧処理により、目的のデータを効率良く高速に検索できる効果(本実施形態の効果という)を奏する。 As described above, according to the present embodiment, the items (columns) distributed in each table of the database are set as the search target items by the ambiguous processing without adding special / special transformation / processing to the database and the full-text search engine. It has the effect of being able to search for the target data efficiently and at high speed (referred to as the effect of this embodiment).
なお、上記の実施形態は、添付ファイルが存在する場合の構成であるが、添付ファイルが無く、ファイル装置400を備えない構成を採用することができる。この場合には、ファイル装置400以外に、第2のクローラ収集手段504、第2のインデックスファイル502、識別情報取得手段207、添付ファイル検索手段202は不要である。この場合においても、上記実施形態の効果と同じ効果を得ることが可能である。
Although the above embodiment is a configuration when an attached file exists, it is possible to adopt a configuration in which there is no attached file and the file device 400 is not provided. In this case, in addition to the file device 400, the second crawler collecting means 504, the
101 検索端末
200 本検索装置
201 データベース検索手段
202 添付ファイル検索手段
203 表示データ加工手段
204 表示処理手段
205 主キー情報取得手段
206 表示制御手段
207 識別情報取得手段
300 データベース
400 ファイル装置
500 全文検索エンジン
501 第1のインデックスファイル
502 第2のインデックスファイル
503 第1のクローラ収集手段
504 第2のクローラ収集手段
101
Claims (14)
前記データベースの前記複数テーブルの全てを検索情報で検索し、前記管理対象データの1単位であるテーブルを全て特定し、特定された全てのテーブルについてのユニークな値を主キー情報として、この主キー情報に該当テーブルの内容データ中の検索対象情報を属性情報として帰属させた第1のインデックステーブルを作成し、この第1のインデックステーブルをまとめた第1のインデックスファイルを生成する第1のクローラ収集手段と、
検索すべきキーワードが与えられると、前記第1のインデックスファイルを検索して、当該キーワードに対応するデータを備える第1のインデックステーブルを検出してこの第1のインデックステーブルの主キー情報を求める主キー情報取得手段と、
前記主キー情報取得手段が求めた主キー情報に基づき前記データベースを検索し、得られた該当テーブルから前記キーワードに対応するデータを取り出すデータベース検索手段と、
情報を表示する表示手段と、
前記データベース検索手段が取り出したデータに基づく表示を前記表示手段に行う表示制御手段と
を具備することを特徴とするデータ検索システム。 A database in which multiple tables of managed data of one unit are accumulated, and
All of the plurality of tables in the database are searched by the search information, all the tables which are one unit of the managed data are specified, and the unique values for all the specified tables are used as the primary key information, and this primary key is used. First crawler collection that creates a first index table to which the search target information in the content data of the corresponding table is assigned to the information as attribute information, and generates a first index file that summarizes this first index table. Means and
When a keyword to be searched is given, the main index file is searched, the first index table having the data corresponding to the keyword is detected, and the primary key information of the first index table is obtained. Key information acquisition method and
A database search means that searches the database based on the primary key information obtained by the primary key information acquisition means and extracts data corresponding to the keyword from the obtained corresponding table.
Display means for displaying information and
A data search system comprising: a display control means for displaying the data taken out by the database search means on the display means.
前記ファイル装置内を検索して前記添付ファイルの所要データをクローラ収集して、ユニークな値を識別情報に該当添付ファイルの前記所要データを帰属させた第2のインデックステーブルを作成し、この第2のインデックステーブルをまとめた第2のインデックスファイルを生成する第2のクローラ収集手段と、
検索すべきキーワードが与えられると、前記第2のインデックスファイルを検索して、当該キーワードに対応するデータを備える第2のインデックステーブルを検出してこの第2のインデックステーブルの識別情報を求める識別情報取得手段と、
前記識別情報取得手段が求めた識別情報に基づき前記ファイル装置を検索し、得られた該当添付ファイルから前記キーワードに対応するデータを取り出す添付ファイル検索手段と
を具備し、
前記表示手段は、前記添付ファイル検索手段が取り出したデータに基づく表示を前記表示手段に行うことを特徴とする請求項1に記載のデータ検索システム。 A file device in which attachments under the data directory of the database table are stored, and
A second index table is created by searching the file device, collecting the required data of the attached file by a crawler, and assigning the required data of the attached file to the identification information with a unique value. A second crawler collection means that generates a second index file that summarizes the index table of
When a keyword to be searched is given, the second index file is searched, a second index table having data corresponding to the keyword is detected, and identification information for obtaining identification information of the second index table is obtained. Acquisition method and
It is provided with an attachment file search means for searching the file device based on the identification information obtained by the identification information acquisition means and extracting data corresponding to the keyword from the obtained corresponding attachment file.
The data search system according to claim 1, wherein the display means displays the display means based on the data taken out by the attached file search means.
前記データベースの前記複数テーブルの全てを検索情報で検索し、前記管理対象データの1単位であるテーブルを全て特定し、特定された全てのテーブルについてのユニークな値を主キー情報として、この主キー情報に該当テーブルの内容データ中の検索対象情報を属性情報として帰属させた第1のインデックステーブルを作成し、この第1のインデックステーブルをまとめた第1のインデックスファイルを生成する第1のクローラ収集手段、
検索すべきキーワードが与えられると、前記第1のインデックスファイルを検索して、当該キーワードに対応するデータを備える第1のインデックステーブルを検出してこの第1のインデックステーブルの主キー情報を求める主キー情報取得手段、
前記主キー情報取得手段が求めた主キー情報に基づき前記データベースを検索し、得られた該当テーブルから前記キーワードに対応するデータを取り出すデータベース検索手段、
前記データベース検索手段が取り出したデータに基づく表示を表示手段に行う表示制御手段
として機能させることを特徴とするデータ検索用プログラム。 A computer with a data search system that searches for data in a database in which multiple tables of managed data per unit are stored.
All of the plurality of tables in the database are searched by the search information, all the tables which are one unit of the managed data are specified, and the unique values for all the specified tables are used as the primary key information, and this primary key is used. First crawler collection that creates a first index table to which the search target information in the content data of the corresponding table is assigned to the information as attribute information, and generates a first index file that summarizes this first index table. means,
When a keyword to be searched is given, the main index file is searched, the first index table having the data corresponding to the keyword is detected, and the primary key information of the first index table is obtained. Key information acquisition method,
A database search means that searches the database based on the primary key information obtained by the primary key information acquisition means and extracts data corresponding to the keyword from the obtained corresponding table.
A data search program characterized in that the display means functions as a display control means for displaying data based on the data retrieved by the database search means.
前記データベースのテーブルのデータのディレクトリ配下の添付ファイルが蓄積されたファイル装置内を検索して前記添付ファイルの所要データをクローラ収集して、ユニークな値を識別情報に該当添付ファイルの前記所要データを帰属させた第2のインデックステーブルを作成し、この第2のインデックステーブルをまとめた第2のインデックスファイルを生成する第2のクローラ収集手段、
検索すべきキーワードが与えられると、前記第2のインデックスファイルを検索して、当該キーワードに対応するデータを備える第2のインデックステーブルを検出してこの第2のインデックステーブルの識別情報を求める識別情報取得手段、
前記識別情報取得手段が求めた識別情報に基づき前記ファイル装置を検索し、得られた該当添付ファイルから前記キーワードに対応するデータを取り出す添付ファイル検索手段
として機能させ、
前記コンピュータを前記表示制御手段として、前記添付ファイル検索手段が取り出したデータに基づく表示を前記表示手段に行うように機能させることを特徴とする請求項8に記載のデータ検索用プログラム。 Further, the computer
Search the file device where the attached files under the data directory of the database table are stored, collect the required data of the attached file by crawler, and use the unique value as the identification information. A second crawler collecting means that creates a second index table to which it is assigned and generates a second index file that summarizes the second index table.
When a keyword to be searched is given, the second index file is searched, a second index table having data corresponding to the keyword is detected, and identification information for obtaining identification information of the second index table is obtained. Acquisition method,
The file device is searched based on the identification information obtained by the identification information acquisition means, and the file device is made to function as an attachment search means for extracting data corresponding to the keyword from the obtained attached file.
The data search program according to claim 8, wherein the computer is used as the display control means to cause the display means to perform a display based on the data taken out by the attached file search means.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018171603A JP6949449B2 (en) | 2018-09-13 | 2018-09-13 | Data search system and data search program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018171603A JP6949449B2 (en) | 2018-09-13 | 2018-09-13 | Data search system and data search program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020042722A JP2020042722A (en) | 2020-03-19 |
| JP6949449B2 true JP6949449B2 (en) | 2021-10-13 |
Family
ID=69799404
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018171603A Expired - Fee Related JP6949449B2 (en) | 2018-09-13 | 2018-09-13 | Data search system and data search program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6949449B2 (en) |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000029898A (en) * | 1998-07-14 | 2000-01-28 | Hitachi Ltd | SQL generation system |
| JP4861078B2 (en) * | 2006-06-30 | 2012-01-25 | 富士通株式会社 | Index creation program, index creation device, and index creation method |
| JP5617551B2 (en) * | 2010-11-15 | 2014-11-05 | 株式会社リコー | Information search system, information collection device, information search device, information collection method, program, and recording medium |
| JP2012212212A (en) * | 2011-03-30 | 2012-11-01 | Mitsubishi Electric Corp | Data retrieval device, data retrieval method and program |
| JP5597623B2 (en) * | 2011-12-02 | 2014-10-01 | 株式会社日立システムズ | Database processing method |
| JP2014013541A (en) * | 2012-07-05 | 2014-01-23 | Sony Corp | Information processing device, information processing method, program, and information processing system |
| US9563678B2 (en) * | 2013-03-04 | 2017-02-07 | Avaya Inc. | Systems and methods for indexing and searching reporting data |
| JP6155906B2 (en) * | 2013-07-01 | 2017-07-05 | 株式会社リコー | Information processing apparatus, second information processing apparatus, communication terminal, communication system, program |
| KR101656750B1 (en) * | 2016-02-26 | 2016-09-23 | 주식회사 아미크 | Method and apparatus for archiving and searching database with index information |
-
2018
- 2018-09-13 JP JP2018171603A patent/JP6949449B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2020042722A (en) | 2020-03-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101450358B1 (en) | Searching structured geographical data | |
| US8527491B2 (en) | Expanded text excerpts | |
| CA2583042C (en) | Providing information relating to a document | |
| US20090198693A1 (en) | Method and apparatus for ordering items within datasets | |
| US8296279B1 (en) | Identifying results through substring searching | |
| CN101136027B (en) | System and method for database indexing, searching and data retrieval | |
| KR101892067B1 (en) | Method for storing and searching of text logdata based relational database | |
| JP2011517492A (en) | System, method and / or apparatus for sorting search results | |
| WO2006076805A1 (en) | Method and apparatus for ordering items within datasets | |
| WO2001075640A2 (en) | Method and system for gathering, organizing, and displaying information from data searches | |
| US20200042510A1 (en) | Method and device for correlating multiple tables in a database environment | |
| US8423885B1 (en) | Updating search engine document index based on calculated age of changed portions in a document | |
| CN111400323B (en) | Data retrieval method, system, equipment and storage medium | |
| US20070239692A1 (en) | Logo or image based search engine for presenting search results | |
| WO2008070565A1 (en) | Adaptive help system and user interface | |
| JP2003173280A (en) | Database generation device, database generation method, and database generation program | |
| JP2013016176A (en) | Method and apparatus for performing search for article content at a plurality of content sites | |
| KR100296500B1 (en) | An Intelligent Goods Comparison And Search Engine For Internet Shpping Mall | |
| JP6949449B2 (en) | Data search system and data search program | |
| CN103164491B (en) | The method and apparatus of a kind of data processing and retrieval | |
| KR101103671B1 (en) | Method, system and computer readable recording medium for extracting and providing the most suitable image dynamically in response to user request | |
| WO2009107148A1 (en) | Metadata extraction from naturally hierarchical information sources | |
| US20150046437A1 (en) | Search Method | |
| JP2005056223A (en) | Text data retrieval system, method therefor and its program | |
| JP2008065417A (en) | Associative word group search device, system, and content match type advertisement system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200221 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210105 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201225 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210308 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210921 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210921 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6949449 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |