JP4385697B2 - 概念検索方法およびシステム - Google Patents
概念検索方法およびシステム Download PDFInfo
- Publication number
- JP4385697B2 JP4385697B2 JP2003330940A JP2003330940A JP4385697B2 JP 4385697 B2 JP4385697 B2 JP 4385697B2 JP 2003330940 A JP2003330940 A JP 2003330940A JP 2003330940 A JP2003330940 A JP 2003330940A JP 4385697 B2 JP4385697 B2 JP 4385697B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- document
- search
- concept
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
非特許文献1は各分類項目のキーワードの出現回数と、各文書のキーワードの出現回数を比較して最も近い分類項目に分類することによりクラスタリング(自動分類)を行う技術について触れられている。
2)ユーザに必要な情報かどうかを的確に判断させる手段
従来技術においては2)の手段として、特徴タームの取捨選択、および重みの調整があるが、周辺情報の欠落した特徴タームのみで、ユーザの所望する情報かどうかを判断するのは困難な場合がある。
31000:特徴ターム抽出部、32000:類似度算出部、
33000:文分解部、34000:クラスタリング部、35000:重要文抽出部、
36000:出力画面データ生成部、37000:文書DB、38000:文書情報DB、40000:種文書
Claims (4)
- クライアント装置とネットワークを介して接続され、検索条件として文書を入力して類似文書を検索するサーバ型の概念検索装置の概念検索方法であって、
前記概念検索装置が、
前記検索条件として、前記クライアント装置から入力され当該概念検索装置に送信された文書を、前記概念検索装置が有する作業用記憶領域に読み込み、
前記作業記憶領域の前記文書の特徴となるキーワードと各々の前記キーワードの出現回数を抽出し、
前記作業記憶領域の前記文書を個々の文に分解し、
分解した前記個々の文を前記概念検索装置が有する文群格納領域にコピーし、
前記キーワードと前記出現回数および前記文群格納領域の前記分解した個々の文から、複数の前記キーワードからなるキーワード群と前記キーワード群の各々に対応する複数の前記文との対応付けをし、
前記キーワード群と、前記キーワード群に対応付けられた複数の前記文および前記出現回数から、前記各文の重要度を算出し、
算出した前記重要度から最も高い値を示す前記文を重要文として、前記キーワード群の各々に対応する複数の前記文から前記キーワード群対応に抽出し、
前記キーワード群の各々と前記キーワード群対応に抽出した前記重要文とを、前記クライアント装置へ送信し、
前記クライアント装置において前記概念記憶装置から受信した複数の重要文が当該クライント装置の画面に表示された後で、前記クライアント装置から、当該クライアント装置において選択された1つの重要文が、当該概念検索装置に検索処理用として通知され、
前記選択された前記重要文に対応づく前記キーワード群と前記キーワード群の重みを用いて、当該概念検索装置に接続される文書DBに電子化文書として格納される文書の概念検索処理を行い、及び
前記概念検索処理の処理結果を前記クライアント装置へ送信することを特徴とするサーバ型の概念検索装置の概念検索方法。 - 前記文書を各文に分解する方法において、分解した文の長さが予め定めた一定長を超える場合は一定長を超えないよう更に複数の文に分解し、または分解した文の長さが予め定めた一定長を超えない場合は一定長を超えるように複数の文を結合し、そのいずれかを選択することで前記文書を分解することを特徴とする請求項1記載のサーバ型の概念検索装置の概念検索方法。
- 前記各文の重要度を算出する方法において、更に、
前記1つのキーワード群および前記1つのキーワード群に対応付けられた複数の前記文より、前記1つのキーワード群に対応付けられた各キーワードのユニーク度を算出する方法と、
前記各文における前記キーワードの出現頻度と前記ユニーク度の積を算出する方法を加え、
前記キーワードの出現頻度と前記ユニーク度の積から、前記各文の重要度を算出することを特徴とする、請求項1記載のサーバ型の概念検索装置の概念検索方法。 - クライアント装置とネットワークを介して接続され、検索条件として文書を入力して類似文書を検索するサーバ型の概念検索装置であって、
前記検索条件として、前記クライアント装置から入力され当該概念検索装置に送信された文書を、前記概念検索装置が有する作業用記憶領域に読み込む手段と、
前記作業記憶領域の前記文書の特徴となるキーワードと各々の前記キーワードの出現回数を抽出する手段と、
前記作業記憶領域の前記文書を個々の文に分解する手段と、
分解した前記個々の文を前記概念検索装置が有する文群格納領域にコピーする手段と、
前記キーワードと前記出現回数および前記文群格納領域の前記分解した個々の文から、複数の前記キーワードからなるキーワード群と前記キーワード群の各々に対応する複数の前記文との対応付けする手段と、
前記キーワード群と、前記キーワード群に対応付けられた複数の前記文および前記出現回数から、前記各文の重要度を算出する手段と、
算出した前記重要度から最も高い値を示す前記文を重要文として、前記キーワード群の各々に対応する複数の前記文から前記キーワード群対応に抽出する手段と、
前記キーワード群の各々と前記キーワード群対応に抽出した前記重要文とを前記クライアント装置へ送信する手段と、
前記クライアント装置において前記概念記憶装置から受信した複数の重要文が当該クライント装置の画面に表示された後で、前記クライアント装置から、当該クライアント装置において選択された1つの重要文が、当該概念検索装置に検索処理用として通知される手段と、
前記選択された前記重要文に対応づく前記キーワード群と前記キーワード群の重みを用いて、当該概念検索装置に接続される文書DBに電子化文書として格納される文書の概念検索処理を行う手段と、及び
前記概念検索処理の処理結果を前記クライアント装置へ送信する手段を有することを特徴とするサーバ型の概念検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003330940A JP4385697B2 (ja) | 2003-09-24 | 2003-09-24 | 概念検索方法およびシステム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003330940A JP4385697B2 (ja) | 2003-09-24 | 2003-09-24 | 概念検索方法およびシステム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2005099972A JP2005099972A (ja) | 2005-04-14 |
| JP4385697B2 true JP4385697B2 (ja) | 2009-12-16 |
Family
ID=34459723
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003330940A Expired - Fee Related JP4385697B2 (ja) | 2003-09-24 | 2003-09-24 | 概念検索方法およびシステム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4385697B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012216239A (ja) * | 2012-07-12 | 2012-11-08 | Toshiba Corp | 情報処理装置、プログラムおよび情報検索方法 |
| US11087085B2 (en) * | 2017-09-18 | 2021-08-10 | Tata Consultancy Services Limited | Method and system for inferential data mining |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4073989B2 (ja) * | 1997-12-09 | 2008-04-09 | 株式会社東芝 | 自然言語検索入力装置 |
| JP2002222210A (ja) * | 2001-01-25 | 2002-08-09 | Hitachi Ltd | 文書検索システム、文書検索方法及び検索サーバ |
| JP2002228575A (ja) * | 2001-02-01 | 2002-08-14 | Asahi Eng Co Ltd | タンク鋼板の腐食診断システム |
| JP4129132B2 (ja) * | 2001-03-30 | 2008-08-06 | 株式会社ジャストシステム | 検索結果提示装置、検索結果提示方法、及び検索結果提示プログラム |
| JP2003108584A (ja) * | 2001-09-28 | 2003-04-11 | Casio Comput Co Ltd | 情報検索システム及びプログラム |
-
2003
- 2003-09-24 JP JP2003330940A patent/JP4385697B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2005099972A (ja) | 2005-04-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN102576358B (zh) | 单词对取得装置、单词对取得方法及其程序 | |
| US8290975B2 (en) | Graph-based keyword expansion | |
| Varma et al. | IIIT Hyderabad at TAC 2009. | |
| US20070185859A1 (en) | Novel systems and methods for performing contextual information retrieval | |
| US20040002849A1 (en) | System and method for automatic retrieval of example sentences based upon weighted editing distance | |
| US10019492B2 (en) | Stop word identification method and apparatus | |
| US20110270815A1 (en) | Extracting structured data from web queries | |
| US7822752B2 (en) | Efficient retrieval algorithm by query term discrimination | |
| JP2005302042A (ja) | マルチセンスクエリについての関連語提案 | |
| CN113934910A (zh) | 一种自动优化、更新的主题库构建方法,及热点事件实时更新方法 | |
| Krishnaveni et al. | Automatic text summarization by local scoring and ranking for improving coherence | |
| JP2005301856A (ja) | 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置 | |
| CN103226601B (zh) | 一种图片搜索的方法和装置 | |
| JP2010198142A (ja) | 文書中に含まれる語句がカテゴリ別に配属されるデータベースの作成装置、データベースの作成方法、および、データベースの作成プログラム | |
| JP3921837B2 (ja) | 情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法 | |
| US20040010556A1 (en) | Electronic document information expansion apparatus, electronic document information expansion method , electronic document information expansion program, and recording medium which records electronic document information expansion program | |
| JP4212347B2 (ja) | 文書検索装置、プログラムおよび記録媒体 | |
| JP4385697B2 (ja) | 概念検索方法およびシステム | |
| JPH1145257A (ja) | Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JP2010055164A (ja) | 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体 | |
| Moumtzidou et al. | Discovery of environmental nodes in the web | |
| JP2009211429A (ja) | 情報提供方法、情報提供装置、情報提供プログラム、および該プログラムをコンピュータに記録した記録媒体 | |
| US20070239735A1 (en) | Systems and methods for predicting if a query is a name | |
| CN111159393B (zh) | 一种基于lda和d2v进行摘要抽取的文本生成方法 | |
| JP2006227823A (ja) | 情報処理装置及びその制御方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051006 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060421 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090119 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090127 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090325 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090609 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090805 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090908 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090921 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121009 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121009 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131009 Year of fee payment: 4 |
|
| LAPS | Cancellation because of no payment of annual fees |