JP5772437B2 - データ構造抽出プログラム及びデータ構造抽出装置 - Google Patents
データ構造抽出プログラム及びデータ構造抽出装置 Download PDFInfo
- Publication number
- JP5772437B2 JP5772437B2 JP2011205729A JP2011205729A JP5772437B2 JP 5772437 B2 JP5772437 B2 JP 5772437B2 JP 2011205729 A JP2011205729 A JP 2011205729A JP 2011205729 A JP2011205729 A JP 2011205729A JP 5772437 B2 JP5772437 B2 JP 5772437B2
- Authority
- JP
- Japan
- Prior art keywords
- support
- pattern
- common
- output
- data structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000605 extraction Methods 0.000 title claims description 60
- 230000006870 function Effects 0.000 claims description 3
- 239000013598 vector Substances 0.000 description 44
- 238000010586 diagram Methods 0.000 description 16
- 238000000034 method Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 6
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 206010052428 Wound Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 238000009098 adjuvant therapy Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000012567 medical material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
複数のサポートから予め定めた閾値以上の頻度で出現するパターンを複数種類抽出する抽出手段と、
前記抽出手段が第1の閾値を用いて抽出したパターンを有するサポートの集合のそれぞれにおいて、互いに有するパターンが類似するサポートの集合のすべてに共通するサポートが存在し、当該互いに有するパターンが類似するサポートの集合において当該共通するサポート以外のサポートを有さないサポートの集合が存在しない場合、前記共通するサポートの数を第2の閾値として設定する設定手段と、
前記抽出手段が第1の閾値を用いて抽出したパターンを有するサポートの集合のそれぞれにおいて、当該互いに有するパターンが類似するサポートの集合のすべてに共通するサポートが存在し、当該互いに有するパターンが類似するサポートの集合において当該共通するサポート以外のサポートを有さないサポートの集合が存在する場合、当該共通するサポート以外のサポートを有さないサポートの集合のパターンを出力すべきパターンであると判断する出力判断手段と、
前記出力判断手段が出力すべきパターンであると判断したパターンと、前記設定手段が対象としたサポートから前記第2の閾値以上の頻度で前記抽出手段により抽出されるパターンを出力する出力手段として機能させるデータ構造抽出プログラム。
前記抽出手段が第1の閾値を用いて抽出したパターンを有するサポートの集合のそれぞれにおいて、互いに有するパターンが類似するサポートの集合のすべてに共通するサポートが存在し、当該互いに有するパターンが類似するサポートの集合において当該共通するサポート以外のサポートを有さないサポートの集合が存在しない場合、前記共通するサポートの数を第2の閾値として設定する設定手段と、
前記抽出手段が第1の閾値を用いて抽出したパターンを有するサポートの集合のそれぞれにおいて、当該互いに有するパターンが類似するサポートの集合のすべてに共通するサポートが存在し、当該互いに有するパターンが類似するサポートの集合において当該共通するサポート以外のサポートを有さないサポートの集合が存在する場合、当該共通するサポート以外のサポートを有さないサポートの集合のパターンを出力すべきパターンであると判断する出力判断手段と、
前記出力判断手段が出力すべきパターンであると判断したパターンと、前記設定手段が対象としたサポートから前記第2の閾値以上の頻度で前記抽出手段により抽出されるパターンを出力する出力手段とを有するデータ構造抽出装置。
図1は、本発明の実施の形態に係るデータ構造抽出装置の構成の一例を示す図である。
以下に、データ構造抽出装置の動作例を各図を参照しつつ、(1)パターン抽出動作、(2)サポート分類動作、(3)パターン出力動作に分けて説明する。
まず、パターン抽出手段100は、記憶部11のDPCデータ111からパターンを抽出する対象となる複数のサポートを取得する(S1)。
次に、サポートベクトル生成手段101は、パターン抽出手段100が抽出したパターン21及び22のそれぞれについてサポートの集合をベクトル化してサポートベクトルを生成する(S4)。
図10は、データ構造抽出装置のパターン出力動作の一例を示すフローチャートである。また、図7(a)〜(c)は、サポートベクトル分類手段がマッピングした表及び出力手段107が出力する出力内容の一例を示す概略図である。
図11(a)及び(b)は、データ構造抽出装置1によって抽出されるパターンの一例を示す概略図である。
なお、本発明は、上記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。例えば、本発明はDPCデータ111にのみ適用されるものではなく、木構造を代表とする任意のデータ構造を有するデータの集合であれば同様に適用することができる。
10 制御部
11 記憶部
20 Fファイル
21 Eファイル
22 日時データ
100 パターン抽出手段
101 サポートベクトル生成手段
102 サポートベクトル分類手段
103 共通サポート計算手段
104 閾値設定手段
105 パターン再抽出手段
106 出力判断手段
107 出力手段
110 データ構造抽出プログラム
111 DPCデータ
112 閾値情報
Claims (2)
- コンピュータを、
複数のサポートから予め定めた閾値以上の頻度で出現するパターンを複数種類抽出する抽出手段と、
前記抽出手段が第1の閾値を用いて抽出したパターンを有するサポートの集合のそれぞれにおいて、互いに有するパターンが類似するサポートの集合のすべてに共通するサポートが存在し、当該互いに有するパターンが類似するサポートの集合において当該共通するサポート以外のサポートを有さないサポートの集合が存在しない場合、前記共通するサポートの数を第2の閾値として設定する設定手段と、
前記抽出手段が第1の閾値を用いて抽出したパターンを有するサポートの集合のそれぞれにおいて、当該互いに有するパターンが類似するサポートの集合のすべてに共通するサポートが存在し、当該互いに有するパターンが類似するサポートの集合において当該共通するサポート以外のサポートを有さないサポートの集合が存在する場合、当該共通するサポート以外のサポートを有さないサポートの集合のパターンを出力すべきパターンであると判断する出力判断手段と、
前記出力判断手段が出力すべきパターンであると判断したパターンと、前記設定手段が対象としたサポートから前記第2の閾値以上の頻度で前記抽出手段により抽出されるパターンを出力する出力手段として機能させるデータ構造抽出プログラム。 - 複数のサポートから予め定めた閾値以上の頻度で出現するパターンを複数種類抽出する抽出手段と、
前記抽出手段が第1の閾値を用いて抽出したパターンを有するサポートの集合のそれぞれにおいて、互いに有するパターンが類似するサポートの集合のすべてに共通するサポートが存在し、当該互いに有するパターンが類似するサポートの集合において当該共通するサポート以外のサポートを有さないサポートの集合が存在しない場合、前記共通するサポートの数を第2の閾値として設定する設定手段と、
前記抽出手段が第1の閾値を用いて抽出したパターンを有するサポートの集合のそれぞれにおいて、当該互いに有するパターンが類似するサポートの集合のすべてに共通するサポートが存在し、当該互いに有するパターンが類似するサポートの集合において当該共通するサポート以外のサポートを有さないサポートの集合が存在する場合、当該共通するサポート以外のサポートを有さないサポートの集合のパターンを出力すべきパターンであると判断する出力判断手段と、
前記出力判断手段が出力すべきパターンであると判断したパターンと、前記設定手段が対象としたサポートから前記第2の閾値以上の頻度で前記抽出手段により抽出されるパターンを出力する出力手段とを有するデータ構造抽出装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011205729A JP5772437B2 (ja) | 2011-09-21 | 2011-09-21 | データ構造抽出プログラム及びデータ構造抽出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011205729A JP5772437B2 (ja) | 2011-09-21 | 2011-09-21 | データ構造抽出プログラム及びデータ構造抽出装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2013069025A JP2013069025A (ja) | 2013-04-18 |
| JP5772437B2 true JP5772437B2 (ja) | 2015-09-02 |
Family
ID=48474691
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011205729A Expired - Fee Related JP5772437B2 (ja) | 2011-09-21 | 2011-09-21 | データ構造抽出プログラム及びデータ構造抽出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5772437B2 (ja) |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7584100B2 (en) * | 2004-06-30 | 2009-09-01 | Microsoft Corporation | Method and system for clustering using generalized sentence patterns |
| JP4957656B2 (ja) * | 2008-06-11 | 2012-06-20 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
| JP5471372B2 (ja) * | 2009-12-01 | 2014-04-16 | 富士ゼロックス株式会社 | プログラム及び情報処理システム |
-
2011
- 2011-09-21 JP JP2011205729A patent/JP5772437B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2013069025A (ja) | 2013-04-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Lee et al. | Likelihood reinstates Archaeopteryx as a primitive bird | |
| US20090299977A1 (en) | Method for Automatic Labeling of Unstructured Data Fragments From Electronic Medical Records | |
| Chatterjee | Phylogeny and biogeography of gibbons: a dispersal-vicariance analysis | |
| Petrich et al. | Factors predicting survival in peripheral T‐cell lymphoma in the USA: a population‐based analysis of 8802 patients in the modern era | |
| Jai-Andaloussi et al. | Medical content based image retrieval by using the Hadoop framework | |
| CN110570928A (zh) | 一种基于HBase和ozone的医疗影像文件存取方法 | |
| Edeki et al. | Comparative study of data mining and statistical learning techniques for prediction of cancer survivability | |
| Hu et al. | Shrinkage Clustering: a fast and size-constrained clustering algorithm for biomedical applications | |
| JP5772437B2 (ja) | データ構造抽出プログラム及びデータ構造抽出装置 | |
| Supeleto et al. | Phylogenomic analyses reveal a rare new genus of wasp (Hymenoptera, Ichneumonidae, Cryptinae) from the Brazilian Atlantic Forest | |
| Hosner et al. | Phylogeny and diversification of the gallopheasants (Aves: Galliformes): testing roles of sexual selection and environmental niche divergence | |
| Dunn et al. | A cloud-based pipeline for analysis of FHIR and long-read data | |
| JP5652332B2 (ja) | データ構造比較プログラム及びデータ構造比較装置 | |
| Alon et al. | Using domain based latent personal analysis of B cell clone diversity patterns to identify novel relationships between the B cell clone populations in different tissues | |
| JP2006236151A (ja) | 機能性生体分子設計方法 | |
| Setubal et al. | Advances in bioinformatics and computational biology | |
| Karlsson | Order in the random forest | |
| Thapa et al. | A new graph database system for multi-omics data integration and mining complex biological information | |
| JP7628576B2 (ja) | 分析支援サーバ、分析支援方法及びプログラム | |
| Wallner et al. | Machine learning–based identification of prognostic factors for surgical management in patients with NOS sarcoma | |
| Ordidge et al. | Simple Sequence Repeat (SSR) Fingerprint data for apples from the National Fruit Collection as used in Ordidge et al PLOS One 2018 | |
| US20240338407A1 (en) | Information processing apparatus, method, and program | |
| Diaz | Predicting mortality with percent predicted and z-scores of FEV1: not an EZ task | |
| Kamal et al. | Disease Symptoms Analysis Using Data Mining Techniques to Predict Diabetes Risk. | |
| Wais | Knowledge discovery of heart disease using Association rules Algorithm (apply on Ahmed Gasim hospital) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140822 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150302 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150317 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150508 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150615 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5772437 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |