JP7628926B2 - Information processing device, information processing method, and information processing program - Google Patents
Information processing device, information processing method, and information processing program Download PDFInfo
- Publication number
- JP7628926B2 JP7628926B2 JP2021162675A JP2021162675A JP7628926B2 JP 7628926 B2 JP7628926 B2 JP 7628926B2 JP 2021162675 A JP2021162675 A JP 2021162675A JP 2021162675 A JP2021162675 A JP 2021162675A JP 7628926 B2 JP7628926 B2 JP 7628926B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- time series
- change
- series data
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Complex Calculations (AREA)
Description
本発明は、経時データを対象とした情報処理装置、情報処理方法および情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program for time-series data.
機械学習などを用いる情報処理において、学習に用いる多数の学習データから外れ値を除去する前処理が重要と考えられている。これは、学習データに外れ値が含まれている場合、学習結果が意図しないものとなったり、学習効率低下の原因となったりする可能性があるためである。 In information processing using machine learning and other methods, preprocessing to remove outliers from the large amount of training data used for learning is considered important. This is because if the training data contains outliers, the learning results may be unintended or the learning efficiency may decrease.
外れ値除去の方法は、学習データがある一時点の情報を表す横断データの場合と、時間軸に沿った時系列データの場合で異なる。横断データの場合、スミルノフ・グラブス検定やホテリング理論などが知られている。これらの方法は、データの平均や分散をパラメータとしており、時刻毎にデータのパラメータが動的に変化する時系列データに適用することは困難である。 Methods for removing outliers differ depending on whether the training data is cross-sectional data that represents information at a single point in time, or time-series data along a time axis. For cross-sectional data, the Smirnoff-Grubbs test and Hotelling's theory are well known. These methods use the mean and variance of the data as parameters, making it difficult to apply them to time-series data, where the parameters of the data change dynamically from time to time.
時系列データに対する外れ値とは、(1)ある一つの時系列サンプルの中で、異常な値を呈す時刻が存在する場合と、(2)ある一時刻における多数の時系列サンプルの中で、特異なサンプルが存在する場合とがある。 An outlier in time series data can be (1) a time within a single time series sample that exhibits an abnormal value, or (2) an unusual sample within multiple time series samples at a single time.
上記(1)の外れ値に対して、特開2008-117381号公報(特許文献1)は、最適なモデル化を行うことが可能な時系列データ解析装置を実現することを目的とした時系列データ解析装置を開示する。この装置はサンプル内の元の値と時系列で平滑化した値の差分をとることでサンプル内の異常値を検出する。 Regarding the outliers in (1) above, Japanese Patent Application Laid-Open No. 2008-117381 (Patent Document 1) discloses a time series data analysis device that aims to realize a time series data analysis device capable of optimal modeling. This device detects abnormal values in a sample by taking the difference between the original value in the sample and the value smoothed in the time series.
上記(2)の外れ値に対して、国際公開第2016/116961号(特許文献2)は、時系列信号が異常を示し始めた時刻をより正確に求めるための情報処理装置を開示する。この装置は、あらかじめ設定した正常データの上限下限に基づいて異常を検知する。 For the outliers in (2) above, WO 2016/116961 (Patent Document 2) discloses an information processing device for more accurately determining the time when a time series signal begins to show an abnormality. This device detects an abnormality based on upper and lower limits of normal data that are set in advance.
しかしながら、いずれの外れ値除去方法を用いても、ある一つの時系列データが時間軸に沿って呈した変化を、学習データに含まれるその他のサンプルと比較して相対的に評価することはできない。加えて、時系列データの観測時点数が少ない場合、時系列データの平滑化や、自己回帰モデルなどの統計モデルによる表現が困難となる。 However, no matter which outlier removal method is used, it is not possible to evaluate the changes that a given piece of time series data exhibits along the time axis in comparison with other samples included in the training data. In addition, when the number of observation points in the time series data is small, it becomes difficult to smooth the time series data or express it using a statistical model such as an autoregressive model.
本明細書では、観測時点数の少ない時系列データを経時データと呼ぶこととする。本発明は、機械学習などの学習に用いる多数の経時学習データの中から、他のサンプルと比較した場合の各時刻の特異性とサンプル内変動の特異性の双方を確認する外れ値除去を特徴とする情報処理の実現を目的とする。 In this specification, time-series data with a small number of observation time points is referred to as longitudinal data. The present invention aims to realize information processing characterized by outlier removal from a large amount of longitudinal learning data used for learning such as machine learning, which confirms both the uniqueness of each time point compared to other samples and the uniqueness of intra-sample variation.
本願において開示される発明の一側面となる情報処理装置は、プログラムを実行するプロセッサと、前記プログラムを保持する記憶デバイスと、を有し、前記記憶デバイスは、各々が2以上の時点のデータを含む複数の時系列データを保持し、前記プロセッサは、前記複数の時系列データの各々について、時間に対する変化率を計算し、前記変化率の分布を所定の確率分布と比較し、前記所定の確率分布からの前記変化率の逸脱の程度が特異データ判定のための条件を満たす前記時系列データを特異データと判定することによって、前記複数の時系列データの前記変化率を相対的に評価し、特異データと判定された前記時系列データの数又は割合が所定の条件を満たすように、前記特異データ判定のための条件を変更しながら、特異データと判定された前記時系列データを除いた前記複数の時系列データの前記変化率の分布と前記所定の確率分布とを比較し、前記所定の確率分布からの前記変化率の逸脱の程度が前記特異データ判定のための条件を満たす前記時系列データを特異データと判定する処理を繰り返し実行することを特徴とする。 An information processing apparatus according to one aspect of the invention disclosed in the present application includes a processor that executes a program and a storage device that stores the program, the storage device stores a plurality of time series data, each of which includes data at two or more points in time, the processor calculates a rate of change with respect to time for each of the plurality of time series data, compares a distribution of the rate of change with a predetermined probability distribution, and determines, as peculiar data, the time series data for which a degree of deviation of the rate of change from the predetermined probability distribution satisfies a condition for peculiar data determination , thereby relatively evaluating the rate of change of the plurality of time series data, compares the distribution of the rate of change of the plurality of time series data excluding the time series data determined to be peculiar data with the predetermined probability distribution while changing the condition for peculiar data determination so that the number or a ratio of the time series data determined to be peculiar data satisfies the predetermined condition, and determines, as peculiar data, the time series data for which a degree of deviation of the rate of change from the predetermined probability distribution satisfies the condition for peculiar data determination .
本発明の代表的な実施の形態によれば、機械学習などに用いる経時学習データから、各サンプルの時間軸に沿った変化率に基づいてサンプル同士を相対的に評価し、特異なサンプルを抽出することができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。 According to a representative embodiment of the present invention, samples can be relatively evaluated based on the rate of change of each sample along the time axis from time-course learning data used in machine learning and the like, and unique samples can be extracted. Problems, configurations, and effects other than those described above will be made clear through the explanation of the following examples.
以下、添付図面を用いて本発明にかかる情報処理装置について説明する。本明細書では、生命保険の引受査定における保険金支払リスク予測のための、特異データ除去を目的とした情報処理の例を示す。引受査定では、保険加入申込者が告知した情報(以下、告知情報)に基づき、将来の保険金支払リスクが査定され、保険加入の承認または謝絶が決定される。告知情報は、健康診断の検査結果、問診、既往歴等を含む。 The information processing device according to the present invention will be described below with reference to the attached drawings. In this specification, an example of information processing aimed at removing anomalous data for predicting insurance payment risk in underwriting assessment of life insurance is shown. In the underwriting assessment, the future insurance payment risk is assessed based on information notified by the insurance applicant (hereinafter, notified information), and a decision is made as to whether to approve or reject the insurance application. The notified information includes the results of a health checkup, a medical interview, medical history, etc.
<情報処理装置のハードウェア構成例>
図1は、本発明の実施例に係る情報処理装置のハードウェア構成の一例を示すブロック図である。
<Example of hardware configuration of information processing device>
FIG. 1 is a block diagram showing an example of a hardware configuration of an information processing apparatus according to an embodiment of the present invention.
情報処理装置100は、プロセッサ101と、記憶デバイス102と、入力デバイス103と、出力デバイス104と、通信インターフェース(通信IF)105と、を有する。プロセッサ101、記憶デバイス102、入力デバイス103、出力デバイス104、および通信IF105は、バス106により接続される。プロセッサ101は、情報処理装置100を制御する。記憶デバイス102は、プロセッサ101の作業エリアとなる。また、記憶デバイス102は、各種プログラムおよびデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス102としては、たとえば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリがある。入力デバイス103は、データを入力する。入力デバイス103としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナがある。出力デバイス104は、データを出力する。出力デバイス104としては、たとえば、ディスプレイ、プリンタがある。通信IF105は、ネットワーク(図示省略)と接続し、データを送受信する。
The
<情報処理装置100の機能的構成例>
図2は、本発明の実施例に係る情報処理装置100の機能的構成の一例を示すブロック図である。
<Example of functional configuration of
FIG. 2 is a block diagram showing an example of a functional configuration of the
情報処理装置100は、入力部201と、データクレンジング部202と、データ分類部203と、経時変化率算出部204と、特異サンプル除外部205と、出力部206と、を有する。データクレンジング部202、データ分類部203、経時変化率算出部204、および特異サンプル除外部205は、具体的には、たとえば、図1に示した記憶デバイス102に記憶されたプログラムをプロセッサ101に実行させることによって実現される。
The
また、情報処理装置100は、告知情報300と、非連続値データ400と、連続値データ500と、変化率データ600と、を記憶デバイス102に記憶する。告知情報300は、あらかじめ情報処理装置100に記憶されていてもよく、情報処理装置100と通信可能な他のコンピュータから取得してもよい。まず、入力部201に入力される告知情報300について詳細に説明する。
The
図3は、本発明の実施例に係る告知情報300の記憶内容の一例を示す説明図である。
Figure 3 is an explanatory diagram showing an example of the stored contents of
告知情報300は、契約希望者が告知した保険契約に必要な情報であり、分析対象データとなる。告知情報300は、告知基本情報310と、健診結果320と、問診結果330と、既往歴340と、を有する。告知基本情報310は、契約希望者の告知に関する基本情報である。告知基本情報310は、氏名ID311と、生年月日312と、年齢313と、を含む。
The
氏名ID311は、契約希望者を一意に特定する識別情報である。生年月日312は、契約希望者が生まれた年月日である。図3の氏名ID311が「0001」の契約希望者の3つのエントリは、当該契約希望者の過去3年分の分析対象データを示す。年齢313は、契約希望者の生年月日312から起算した年単位の経過年数である。後述する例において、氏名ID311が「0001」の契約希望者の3つのエントリについて、年齢313が「47」を時系列の1年目、「48」を時系列の2年目、「49」を時系列の3年目とする。
健診結果320は、契約希望者が受けた健康診断の結果である。健診結果320は、体重321と、BMI(Body Mass Index)322と、収縮期血圧323と、拡張期血圧324と、空腹時血糖325と、を含む。体重321は、契約希望者の体の重さである。BMI322は、人間の肥満度を表す体格指数であり、体重/(身長2)で算出される。BMI322は、その値が小さくなるほど痩せており、大きくなるほど太っていることを示す。
The
収縮期血圧323は、心臓から大動脈へ血液を送り出す状態において、心臓の収縮で押し出された血液によって大動脈の血管壁にかかる圧力である。拡張期血圧324は、心臓へ血液が戻る状態において、心臓の拡張で大動脈から心臓に血液が流入し大動脈の血液量が減少することで低下した大動脈の血管壁にかかる圧力である。空腹時血糖325は、空腹の状態で測定された血糖値である。
問診結果330は、契約希望者が受けた問診の結果である。問診結果330は、喫煙習慣331と、飲酒習慣332と、運動習慣333と、を含む。喫煙習慣331は、契約希望者の喫煙の有無、頻度および喫煙量である。飲酒習慣332は、契約希望者の飲酒の有無、頻度および飲酒量である。運動習慣333は、契約希望者の運動の有無、頻度および運動量である。
既往歴340は、契約希望者が既に受信または入院した履歴である。既往歴340は、高血圧症受診歴341と、高血圧症入院歴342と、糖尿病受診歴343と、を含む。高血圧症受診歴341は、契約希望者が高血圧症に関して受診した履歴である。高血圧症入院歴342は、契約希望者が高血圧症に関して入院した履歴である。糖尿病受診歴343は、契約希望者が糖尿病に関して受診した履歴である。
再び図2を参照する。データクレンジング部202は、入力部201から出力された告知情報300からノイズとなるサンプルを抽出し、ノイズの除去を行う。これによって、特異データ除去の高精度化、および、その後の保険金支払いリスク予測の予測精度向上を図ることができる。ノイズサンプルの種類には、欠損データおよびデータ誤入力などがあり、それぞれサンプルの削除および修正を行うことでクレンジングを実現する。
Referring again to FIG. 2. The
データ分類部203は、データクレンジング部202から出力されたクレンジング済みの告知情報300に対し、データ型に基づいて連続値データ500と非連続値データ400とに分割する。連続値データ500には、体重321およびBMI322などが分類される。また、非連続値データ400には、喫煙習慣331といった二値データ、および、飲酒習慣332といったカテゴリデータが分類される。これによって、データ型を踏まえた処理が可能となり、特異データ除去の高精度化を実現する。
The
図4および図5は、それぞれ、本発明の実施例に係る非連続値データ400および連続値データ500の一例を示す説明図である。
Figures 4 and 5 are explanatory diagrams showing examples of
非連続値データ400は、告知情報300の部分集合であり、連続値型のデータ以外のデータを含む。例えば図3に示す告知情報300からは、「なし」「週1回」または「週2回」などのいずれに該当するかを示すカテゴリデータである喫煙習慣331、飲酒習慣332および運動習慣など、ならびに、「あり」または「なし」の二値データである高血圧症受診歴341、高血圧症入院歴および糖尿病受診歴343を含む非連続値データ400が、氏名ID311と対応付けられて、非連続値データ400が生成される。
The
連続値データ500は、告知情報300の部分集合であり、氏名ID311と対応づけられた、体重321、BMI322、収縮期血圧323、拡張期血圧324および空腹時血糖325などの連続値型のデータを含む。
The
連続値データ500は、本実施例の情報処理装置100による評価の対象となる時系列データの集合である。例えば、各人物について複数の時点で観測された各項目(例えば体重、BMI等)のデータが一つの時系列データである。ただし、本実施例における時系列データの観測時点数は、限定はされないものの、例えば2以上、高々10程度など、一般的な時系列データで想定されるものと比較して少ないことが想定される。このような時系列データを経時データと記載してもよい。
The
再び図2を参照する。経時変化率算出部204は、連続値データ500の各項目に対し、時間経過に応じた変化率を算出する。ここで、連続値データ500に含まれる時点数をnとし、各時刻をt(1、2、・・・、T)とする。また、連続値データ500にM種類の連続値データがふくまれていたとすると、例えば、氏名ID311が0001のサンプルの時刻tにおける任意の連続値変数はV(0001,t,m)と表すことができる。ここで、mは、1からMまでのいずれかの値であり、例えば体重、BMIといった連続値データの項目を識別する。
Referring again to FIG. 2, the time-dependent change
経時変化率算出部204では、時刻t=2以降の、前時刻からの変化率Uを、V(0001,2,m)からV(0001,T,m)まで算出する。時刻tにおける変化率Uは次のような数式で表すことが出来る。
The time-dependent change
U(0001,t,m)=100×(V(0001,t,m) - V(0001,t-1,m))/V(0001,t-1,m) U(0001,t,m)=100×(V(0001,t,m) - V(0001,t-1,m))/V(0001,t-1,m)
算出された変化率は、変化率データ600に格納される。本実施例では、連続値データ500の時間変化を変化率で表したが、前時刻からの変化量、または、2時刻前からの変化率など、任意の方法で時間変化を表現することで時間変化を定量化することができる。
The calculated rate of change is stored in the rate of
図6は、本発明の実施例に係る変化率データ600の一例を示す説明図である。
Figure 6 is an explanatory diagram showing an example of
変化率データ600は、各契約希望者を識別する氏名ID601と、各契約希望者の各時刻の連続値データの変化率と、を含む。図6には、例として、氏名ID601が0001のサンプルおよび0002の、項目mの連続値データのサンプルの、時刻2における変化率602、時刻T-1における変化率603および時刻Tにおける変化率604を示す。
The
特異サンプル除外部205は、経時変化率算出部204で算出した変化率Uを変化率データ600から呼び出し、各サンプルが他のサンプルと比較して特異な変化を呈するサンプルか否かを判別し、あるサンプルの時間変化が特異である場合そのサンプルを告知情報300から除外する。
The peculiar
特異サンプル除外部205は、全サンプルの変化率Uが正規分布に従うと仮定した場合、変化率Uの分布と正規分布を比較して正規分布から逸脱したサンプルを抽出し、出力部206を通して表示する。変化率Uの分布と正規分布の比較には、例えば、QQ(Quantile-Quantile)プロットを用いる。QQプロットとは、変化率Uの分位数に対応する正規分布の理論的な分位点をプロットすることにより、変化率Uが正規分布に従うかどうかを視覚的に確認する手法として知られている。
If it is assumed that the change rates U of all samples follow a normal distribution, the peculiar
QQプロットにおいて、プロットされた分位点を滑らかにつなげた線が直線となった場合、変化率Uは完全な正規分布に従うと判定することが出来る。反対に、プロットされた分位点を直線で近似したとき、直線から逸脱した点は正規分布からの外れ値と判断することができる。特異サンプル除外部205は、QQプロットの信頼区間を複数の信頼係数に基づいて算出し、任意の信頼区間から逸脱するサンプルを特異サンプルとして除外する。これによって、その後の保険金支払いリスク予測の予測精度向上を図ることができる。
In a QQ plot, if the line smoothly connecting the plotted quantiles forms a straight line, it can be determined that the rate of change U follows a perfect normal distribution. Conversely, when the plotted quantiles are approximated by a straight line, points that deviate from the straight line can be determined to be outliers from the normal distribution. The peculiar
特異サンプル除外部205における自動的な特異サンプル抽出方法の一例として、除外サンプル抽出率または抽出数があらかじめ指定した値に達するまで繰り返し処理を行う方法がある。具体的には、特異サンプル除外部205は、0.999など信頼係数の十分大きな信頼区間を算出し、信頼区間から逸脱するサンプルを抽出する。このようにして抽出したサンプルの抽出率または抽出数が予め指定した値に達した場合は処理を終了し、そうでない場合信頼係数を小さくし、再度信頼区間から逸脱するサンプルを抽出する。この処理を繰り返し、抽出率または抽出数が予め指定した値に達した時点で処理を終了する。
One example of an automatic method of extracting peculiar samples in the peculiar
あるいは、特異サンプル除外部205は、正規分布からの逸脱量が最大となるサンプルを除外して、残りのサンプルの変化率Uの分布とそれが従う正規分布とを比較して、そこで正規分布からの逸脱量が最大となるサンプルを除外する、という処理を繰り返してもよい。この繰り返しは、除外サンプル抽出率または抽出数があらかじめ指定した値に達するまで行われてもよいし、正規分布からの逸脱量が所定の範囲内に収まるまで(例えば所定の信頼係数の信頼区間から逸脱するサンプルがなくなるまで)行われてもよい。
Alternatively, the peculiar
特異サンプル除外部205は、QQプロットを出力部206に表示し、情報処理装置100のユーザの目視によって特異サンプルを抽出し、除外することもできる。また、本実施例は変化率Uが正規分布に従うと仮定したが、これは一例であり、正規分布に限らず、任意の確率分布を仮定してQQプロットを描画する方法を採用してもよい。任意の確率分布を予め指定することが困難な場合は、多数の確率分布候補を用意し、繰り返し処理によって除外サンプル抽出率または抽出数が最も小さくなる(すなわち変化率Uの逸脱の程度が最も小さい)確率分布を探索する方法を採用してもよい。
The peculiar
さらに、QQプロットではなく、ヒストグラムをゆーあの目視で確認して特異サンプルを抽出し除外する方法も考えられる。特異サンプル除外部205で処理する変化率Uの集合は、M種類の項目に対し同一時刻ごとの時間変化で分割して処理することも、時刻を無視し同一時間幅の時間変化でまとめて処理することも可能である。
In addition, instead of using a QQ plot, a method can be considered in which peculiar samples are extracted and removed by visually checking the histogram. The set of change rates U processed by the peculiar
<画面例>
図7は、本発明の実施例に係る入出力画面の一例を示す説明図である。
<Screen example>
FIG. 7 is an explanatory diagram showing an example of an input/output screen according to an embodiment of the present invention.
入出力画面700は、情報処理装置100の出力デバイス104の一例であるディスプレイ、または、情報処理装置100と通信可能な他のコンピュータ(図示省略)のディスプレイに表示される。
The input/
入出力画面700は、告知情報読込みボタン701と、処理項目選択プルダウン705と、信頼係数選択バー708と処理実行ボタン710と、実行結果表示領域800とを含む。告知情報300は、ユーザが告知情報読込みボタン701を操作したときに読み込まれてもよい。あるいは、ユーザが告知情報入力ボタン702を操作したときに、情報処理装置100が告知情報入力画面(図示省略)を表示し、ユーザが入力デバイス103によって告知情報を入力することもできる。
The input/
図8は、本発明の実施例に係る実行結果画面の一例を示す説明図である。 Figure 8 is an explanatory diagram showing an example of an execution result screen related to an embodiment of the present invention.
実行結果表示領域800は、特異サンプル除外部205で描画したQQプロットを表示するプロット画面801と、抽出された特異サンプルの氏名IDを表示する特異サンプルID画面802と、を含む。
The execution
プロット画面801は、縦軸に変化率Uの分位を、横軸に正規分布の理論的な分位を表し、変化率Uをプロットした点を黒丸で表す。変化率Uが正確に正規分布に従う場合、黒丸は全て太実線上にプロットされる。細実線は複数の信頼係数に基づいて算出された信頼区間を表す。特異サンプルID画面802は、信頼係数選択バー708によって指定された信頼係数に基づいて算出された信頼区間から逸脱するサンプルを列挙する画面である。
The
また、上述した実施例では、生命保険の引受査定における保険金支払リスク予測を例にあげて説明したが、例えば企業の財務分析にも適用可能である。この場合、告知情報300に替えて有価証券報告書に記載されたデータまたは当該データから算出される指標データが評価の対象となる。一般に、本発明は、多数の時系列データの集合であって、個々の時系列データの観測時点数が少ない場合に、それらの時系列データから特異なサンプル(外れ値)を抽出するために適用することができる。
In addition, while the above-mentioned embodiment has been described using the example of insurance payment risk prediction in life insurance underwriting assessment, the present invention can also be applied to, for example, corporate financial analysis. In this case, the data described in the securities report or index data calculated from said data is used for evaluation instead of the
また、上述した実施例の情報処理装置100の機能は、API(Application Programming Interface)を介して提供されてもよい。例えば、情報処理装置100は、通信IF105に接続されたネットワークを経由して告知情報300を受信すると、それを記憶デバイス102に記憶し、図2に示す処理を実行して、特異サンプルが除外された告知情報と、図7および図8に示す情報を表示するために必要なデータとを、ネットワークを経由して出力してもよい。
Furthermore, the functions of the
また、本発明の実施形態のシステムは次のように構成されてもよい。 The system of the present invention may also be configured as follows:
(1)情報処理装置(例えば情報処理装置100)であって、プログラムを実行するプロセッサ(例えばプロセッサ101)と、プログラムを保持する記憶デバイス(例えば記憶デバイス102)と、を有し、記憶デバイスは、各々が2以上の時点のデータを含む複数の時系列データ(例えば連続値データ500)を保持し、プロセッサは、複数の時系列データの各々について、時間に対する変化率を計算し(例えば経時変化率算出部204の処理)、複数の時系列データの変化率を相対的に評価する(例えば特異サンプル除外部205の処理)。 (1) An information processing device (e.g., information processing device 100) having a processor (e.g., processor 101) that executes a program and a storage device (e.g., storage device 102) that stores the program, the storage device stores multiple time series data (e.g., continuous value data 500) each including data from two or more points in time, and the processor calculates the rate of change over time for each of the multiple time series data (e.g., processing by the time-varying change rate calculation unit 204) and relatively evaluates the rates of change of the multiple time series data (e.g., processing by the unusual sample exclusion unit 205).
これによって、機械学習などに用いる経時学習データから、各サンプルの時間軸に沿った変化率に基づいてサンプル同士を相対的に評価することができる。 This makes it possible to evaluate samples relative to each other based on the rate of change of each sample over time, using longitudinal learning data used in machine learning and other applications.
(2)上記(1)において、プロセッサは、変化率の分布を所定の確率分布と比較し、所定の確率分布からの変化率の逸脱の程度が特異データ判定のための条件を満たす時系列データを特異データと判定することによって、複数の時系列データの変化率を相対的に評価する(例えば特異サンプル除外部205の処理)。 (2) In the above (1), the processor compares the distribution of the change rates with a predetermined probability distribution, and determines that time series data whose degree of deviation of the change rate from the predetermined probability distribution satisfies the condition for determining peculiar data is peculiar data, thereby relatively evaluating the change rates of multiple time series data (e.g., processing by the peculiar sample exclusion unit 205).
これによって、機械学習などに用いる経時学習データから、各サンプルの時間軸に沿った変化率に基づいてサンプル同士を相対的に評価し、特異なサンプルを抽出することができる。 This makes it possible to extract peculiar samples from longitudinal learning data used in machine learning and other applications by evaluating samples relative to each other based on the rate of change of each sample over time.
(3)上記(2)において、プロセッサは、所定の確率分布からの変化率の逸脱の程度が最も大きい時系列データを特異データと判定する。 (3) In the above (2), the processor determines that the time series data having the highest deviation in rate of change from a predetermined probability distribution is anomalous data.
これによって、機械学習などに用いる経時学習データから、特異なサンプルを適切に除外することができる。 This makes it possible to properly remove anomalous samples from longitudinal training data used in machine learning and other applications.
(4)上記(3)において、プロセッサは、特異データと判定された時系列データを除いた複数の時系列データの変化率の分布と所定の確率分布とを比較し、所定の確率分布からの変化率の逸脱の程度が最も大きい時系列データを特異データと判定する処理を、特異データと判定された時系列データの数又は割合が所定の条件を満たすか、又は、所定の確率分布からの変化率の逸脱の程度が所定の範囲内となるまで繰り返し実行する。 (4) In the above (3), the processor compares the distribution of the rates of change of multiple time series data excluding the time series data determined to be peculiar data with a predetermined probability distribution, and determines the time series data whose rate of change deviates most from the predetermined probability distribution as peculiar data. This process is repeated until the number or proportion of time series data determined to be peculiar data satisfies a predetermined condition or the degree of deviation of the rate of change from the predetermined probability distribution falls within a predetermined range.
これによって、機械学習などに用いる経時学習データから、特異なサンプルを適切に除外することができる。 This makes it possible to properly remove anomalous samples from longitudinal training data used in machine learning and other applications.
(5)上記(2)において、プロセッサは、特異データと判定された時系列データの数又は割合が所定の条件を満たすように、特異データ判定のための条件を変更しながら、特異データと判定された時系列データを除いた複数の時系列データの変化率の分布と所定の確率分布とを比較し、所定の確率分布からの変化率の逸脱の程度が特異データ判定のための条件を満たす時系列データを特異データと判定する処理を繰り返し実行する。 (5) In the above (2), the processor repeatedly executes a process of comparing the distribution of the change rates of the multiple time series data excluding the time series data determined to be peculiar data with a predetermined probability distribution while changing the conditions for determining peculiar data so that the number or proportion of time series data determined to be peculiar data satisfies the predetermined condition, and determining as peculiar data the time series data whose degree of deviation of the change rate from the predetermined probability distribution satisfies the condition for determining peculiar data.
これによって、機械学習などに用いる経時学習データから、特異なサンプルを適切に除外することができる。 This makes it possible to properly remove anomalous samples from longitudinal training data used in machine learning and other applications.
(6)上記(2)において、プロセッサは、変化率の分布がそれぞれ異なる確率分布モデルに基づくと仮定することによって複数の確率分布を生成し、変化率の分布を、複数の確率分布と比較し、変化率の逸脱の程度が最も小さい確率分布を、特異データ判定のための比較の対象である所定の確率分布として決定する。 (6) In the above (2), the processor generates multiple probability distributions by assuming that the distributions of the change rates are based on different probability distribution models, compares the distribution of the change rates with the multiple probability distributions, and determines the probability distribution with the smallest degree of deviation of the change rates as the predetermined probability distribution to be compared for determining peculiar data.
これによって、機械学習などに用いる経時学習データから、特異なサンプルを適切に除外することができる。 This makes it possible to properly remove anomalous samples from longitudinal training data used in machine learning and other applications.
(7)上記(2)において、所定の確率分布は、変化率の分布が従うと仮定する所定の確率分布モデルに基づく分布(例えば正規分布及びその他の分布)であり、 (7) In (2) above, the predetermined probability distribution is a distribution based on a predetermined probability distribution model that the distribution of the rate of change is assumed to follow (e.g., normal distribution and other distributions),
プロセッサは、変化率が所定の確率分布の所定の信頼係数に対応する信頼区間から外れる時系列データを特異データと判定する。 The processor determines that time series data whose rate of change falls outside a confidence interval corresponding to a predetermined confidence coefficient of a predetermined probability distribution is anomalous data.
これによって、機械学習などに用いる経時学習データから、特異なサンプルを適切に除外することができる。 This makes it possible to properly remove anomalous samples from longitudinal training data used in machine learning and other applications.
(8)上記(7)において、プロセッサは、特異データと判定された時系列データの数又は割合が所定の条件を満たすように、信頼係数を変更しながら、特異データと判定された時系列データを除いた複数の時系列データの変化率の分布と所定の確率分布とを比較し、変化率が信頼区間から外れる時系列データを特異データと判定する処理を繰り返し実行する。 (8) In the above (7), the processor repeatedly performs a process of comparing the distribution of the change rates of the multiple time series data excluding the time series data determined to be peculiar data with a predetermined probability distribution while changing the reliability coefficient so that the number or proportion of time series data determined to be peculiar data satisfies a predetermined condition, and determining that the time series data whose change rate falls outside the reliability interval is peculiar data.
これによって、機械学習などに用いる経時学習データから、特異なサンプルを適切に除外することができる。 This makes it possible to properly remove anomalous samples from longitudinal training data used in machine learning and other applications.
(9)上記(2)において、情報処理装置は出力デバイスをさらに有し、出力デバイスは、変化率の分布と所定の確率分布とに基づくQuantile-Quantileプロットを表示する。 (9) In the above (2), the information processing device further has an output device, and the output device displays a quantile-quantile plot based on the distribution of the change rate and a predetermined probability distribution.
これによって、特異データの存在を視覚的に確認しやすくなる。 This makes it easier to visually check for the presence of anomalous data.
なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加、削除、または置換をしてもよい。 The present invention is not limited to the above-described embodiments, but includes various modified examples and equivalent configurations within the spirit of the appended claims. For example, the above-described embodiments have been described in detail to clearly explain the present invention, and the present invention is not necessarily limited to having all of the configurations described. Furthermore, a portion of the configuration of one embodiment may be replaced with the configuration of another embodiment. Furthermore, the configuration of another embodiment may be added to the configuration of one embodiment. Furthermore, other configurations may be added, deleted, or replaced with part of the configuration of each embodiment.
また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサ101がそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。
Furthermore, each of the configurations, functions, processing units, processing means, etc. described above may be realized in part or in whole in hardware, for example by designing them as integrated circuits, or may be realized in software by having the
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、IC(Integrated Circuit)カード、SDカード、DVD(Digital Versatile Disc)の計算機読み取り可能な非一時的データ記録媒体に格納することができる。 Information such as programs, tables, and files that realize each function can be stored in a storage device such as a memory, hard disk, or SSD (Solid State Drive), or in a computer-readable non-transitory data recording medium such as an IC (Integrated Circuit) card, SD card, or DVD (Digital Versatile Disc).
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。 In addition, the control lines and information lines shown are those considered necessary for explanation, and do not necessarily represent all control lines and information lines necessary for implementation. In reality, it is safe to assume that almost all components are interconnected.
100 情報処理装置
101 プロセッサ
102 記憶デバイス
202 データクレンジング部
203 データ分類部
204 経時変化率算出部
205 特異サンプル除外部
300 告知情報
400 非連続値データ
500 連続値データ
600 変化率データ
100
Claims (6)
プログラムを実行するプロセッサと、前記プログラムを保持する記憶デバイスと、を有し、
前記記憶デバイスは、各々が2以上の時点のデータを含む複数の時系列データを保持し、
前記プロセッサは、
前記複数の時系列データの各々について、時間に対する変化率を計算し、
前記変化率の分布を所定の確率分布と比較し、
前記所定の確率分布からの前記変化率の逸脱の程度が特異データ判定のための条件を満たす前記時系列データを特異データと判定することによって、前記複数の時系列データの前記変化率を相対的に評価し、
特異データと判定された前記時系列データの数又は割合が所定の条件を満たすように、前記特異データ判定のための条件を変更しながら、特異データと判定された前記時系列データを除いた前記複数の時系列データの前記変化率の分布と前記所定の確率分布とを比較し、前記所定の確率分布からの前記変化率の逸脱の程度が前記特異データ判定のための条件を満たす前記時系列データを特異データと判定する処理を繰り返し実行することを特徴とする情報処理装置。 An information processing device,
A processor for executing a program and a storage device for storing the program,
the storage device holds a plurality of time series data each including data at two or more points in time;
The processor,
Calculating a rate of change over time for each of the plurality of time series data;
comparing the distribution of rates of change to a predetermined probability distribution;
Relatively evaluating the change rates of the plurality of time series data by determining, as peculiar data, that the degree of deviation of the change rate from the predetermined probability distribution satisfies a condition for peculiar data determination ;
an information processing apparatus which repeatedly executes a process of comparing a distribution of the change rates of the plurality of time series data excluding the time series data determined to be peculiar data with the predetermined probability distribution while changing a condition for the peculiar data determination so that the number or a ratio of the time series data determined to be peculiar data satisfies a predetermined condition, and determining, as peculiar data, the time series data whose degree of deviation of the change rate from the predetermined probability distribution satisfies the condition for the peculiar data determination .
前記プロセッサは、The processor,
前記変化率の分布がそれぞれ異なる確率分布モデルに基づくと仮定することによって複数の確率分布を生成し、generating a plurality of probability distributions by assuming that the distributions of the rates of change are based on different probability distribution models;
前記変化率の分布を、前記複数の確率分布と比較し、comparing the distribution of the rate of change to the plurality of probability distributions;
前記変化率の逸脱の程度が最も小さい前記確率分布を、前記特異データ判定のための比較の対象である前記所定の確率分布として決定することを特徴とする情報処理装置。determining, as the predetermined probability distribution to be compared for determining whether data is anomalous, the probability distribution having the smallest degree of deviation from the rate of change.
プログラムを実行するプロセッサと、前記プログラムを保持する記憶デバイスと、を有し、A processor for executing a program and a storage device for storing the program,
前記記憶デバイスは、各々が2以上の時点のデータを含む複数の時系列データを保持し、the storage device holds a plurality of time series data each including data at two or more points in time;
前記プロセッサは、The processor,
前記複数の時系列データの各々について、時間に対する変化率を計算し、Calculating a rate of change over time for each of the plurality of time series data;
前記変化率の分布を所定の確率分布と比較し、comparing the distribution of rates of change to a predetermined probability distribution;
前記所定の確率分布からの前記変化率の逸脱の程度が特異データ判定のための条件を満たす前記時系列データを特異データと判定することによって、前記複数の時系列データの前記変化率を相対的に評価し、Relatively evaluating the change rates of the plurality of time series data by determining, as peculiar data, that the degree of deviation of the change rate from the predetermined probability distribution satisfies a condition for peculiar data determination;
前記所定の確率分布は、前記変化率の分布が従うと仮定する所定の確率分布モデルに基づく分布であり、the predetermined probability distribution is a distribution based on a predetermined probability distribution model which the distribution of the change rate is assumed to follow;
前記プロセッサは、前記変化率が前記所定の確率分布の所定の信頼係数に対応する信頼区間から外れる前記時系列データを特異データと判定し、The processor determines, as anomalous data, the time series data in which the rate of change falls outside a confidence interval corresponding to a predetermined confidence coefficient of the predetermined probability distribution;
特異データと判定された前記時系列データの数又は割合が所定の条件を満たすように、前記信頼係数を変更しながら、特異データと判定された前記時系列データを除いた前記複数の時系列データの前記変化率の分布と前記所定の確率分布とを比較し、前記変化率が前記信頼区間から外れる前記時系列データを特異データと判定する処理を繰り返し実行することを特徴とする情報処理装置。an information processing apparatus which repeatedly executes a process of comparing a distribution of the change rates of the plurality of time series data excluding the time series data determined to be peculiar data with the predetermined probability distribution while changing the reliability coefficient so that the number or ratio of the time series data determined to be peculiar data satisfies a predetermined condition, and determining that the time series data whose change rate falls outside the reliability interval is peculiar data.
出力デバイスをさらに有し、further comprising an output device;
前記出力デバイスは、前記変化率の分布と前記所定の確率分布とに基づくQuantile-Quantileプロットを表示することを特徴とする情報処理装置。The information processing apparatus according to claim 1, wherein the output device displays a quantile-quantile plot based on the distribution of the change rates and the predetermined probability distribution.
前記情報処理装置は、プログラムを実行するプロセッサと、前記プログラムを保持する記憶デバイスと、を有し、The information processing device includes a processor that executes a program and a storage device that stores the program;
前記記憶デバイスは、各々が2以上の時点のデータを含む複数の時系列データを保持し、the storage device holds a plurality of time series data each including data at two or more points in time;
前記情報処理方法は、The information processing method includes:
前記プロセッサが、前記複数の時系列データの各々について、時間に対する変化率を計算する手順と、A step of the processor calculating a rate of change with respect to time for each of the plurality of time series data;
前記プロセッサが、前記変化率の分布を所定の確率分布と比較する手順と、the processor comparing the distribution of the rate of change to a predetermined probability distribution;
前記プロセッサが、前記所定の確率分布からの前記変化率の逸脱の程度が特異データ判定のための条件を満たす前記時系列データを特異データと判定することによって、前記複数の時系列データの前記変化率を相対的に評価する手順と、を含み、a step of relatively evaluating the change rates of the plurality of time series data by determining, by the processor, that the time series data is peculiar data when the degree of deviation of the change rate from the predetermined probability distribution satisfies a condition for peculiar data determination, and
前記複数の時系列データの前記変化率を相対的に評価する手順において、前記プロセッサは、特異データと判定された前記時系列データの数又は割合が所定の条件を満たすように、前記特異データ判定のための条件を変更しながら、特異データと判定された前記時系列データを除いた前記複数の時系列データの前記変化率の分布と前記所定の確率分布とを比較し、前記所定の確率分布からの前記変化率の逸脱の程度が前記特異データ判定のための条件を満たす前記時系列データを特異データと判定する処理を繰り返し実行することを特徴とする情報処理方法。an information processing method comprising: a step of relatively evaluating the change rates of the plurality of time series data; a step of repeatedly executing a process of comparing a distribution of the change rates of the plurality of time series data excluding the time series data determined to be peculiar data with the predetermined probability distribution while changing a condition for the peculiar data determination so that a number or a ratio of the time series data determined to be peculiar data satisfies a predetermined condition; and determining, as peculiar data, the time series data whose degree of deviation of the change rate from the predetermined probability distribution satisfies the condition for the peculiar data determination.
前記情報処理装置は、前記情報処理プログラムを実行するプロセッサと、前記情報処理プログラムを保持する記憶デバイスと、を有し、the information processing device includes a processor that executes the information processing program and a storage device that stores the information processing program;
前記記憶デバイスは、各々が2以上の時点のデータを含む複数の時系列データを保持し、the storage device holds a plurality of time series data each including data at two or more points in time;
前記情報処理プログラムは、The information processing program includes:
前記複数の時系列データの各々について、時間に対する変化率を計算する手順と、calculating a rate of change over time for each of the plurality of time series data;
前記変化率の分布を所定の確率分布と比較する手順と、comparing said distribution of rates of change to a predetermined probability distribution;
前記所定の確率分布からの前記変化率の逸脱の程度が特異データ判定のための条件を満たす前記時系列データを特異データと判定することによって、前記複数の時系列データの前記変化率を相対的に評価する手順と、を前記プロセッサに実行させ、a step of relatively evaluating the change rates of the plurality of time series data by determining, as peculiar data, the time series data whose degree of deviation of the change rate from the predetermined probability distribution satisfies a condition for peculiar data determination;
前記複数の時系列データの前記変化率を相対的に評価する手順において、前記情報処理プログラムは、特異データと判定された前記時系列データの数又は割合が所定の条件を満たすように、前記特異データ判定のための条件を変更しながら、特異データと判定された前記時系列データを除いた前記複数の時系列データの前記変化率の分布と前記所定の確率分布とを比較し、前記所定の確率分布からの前記変化率の逸脱の程度が前記特異データ判定のための条件を満たす前記時系列データを特異データと判定する処理を繰り返し実行させることを特徴とする情報処理プログラム。the step of relatively evaluating the change rates of the plurality of time series data, the information processing program repeatedly executes a process of comparing a distribution of the change rates of the plurality of time series data excluding the time series data determined to be peculiar data with the predetermined probability distribution while changing a condition for the peculiar data determination so that a number or a ratio of the time series data determined to be peculiar data satisfies a predetermined condition, and determining, as peculiar data, the time series data whose degree of deviation of the change rate from the predetermined probability distribution satisfies the condition for the peculiar data determination.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021162675A JP7628926B2 (en) | 2021-10-01 | 2021-10-01 | Information processing device, information processing method, and information processing program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021162675A JP7628926B2 (en) | 2021-10-01 | 2021-10-01 | Information processing device, information processing method, and information processing program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023053565A JP2023053565A (en) | 2023-04-13 |
| JP7628926B2 true JP7628926B2 (en) | 2025-02-12 |
Family
ID=85873496
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021162675A Active JP7628926B2 (en) | 2021-10-01 | 2021-10-01 | Information processing device, information processing method, and information processing program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7628926B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7713278B1 (en) * | 2025-03-31 | 2025-07-25 | IoYou株式会社 | Information processing device, information processing method, and information processing program |
Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010250769A (en) | 2009-04-20 | 2010-11-04 | Mitsubishi Electric Corp | Analysis result visualization apparatus, analysis result visualization method, and analysis result visualization program |
| JP2013205894A (en) | 2012-03-27 | 2013-10-07 | Oki Electric Ind Co Ltd | Abnormality detection device, program, and abnormality detection method |
| CN111046084A (en) | 2019-12-18 | 2020-04-21 | 重庆大学 | An association rule mining method for multivariate time series monitoring data |
| WO2020188696A1 (en) | 2019-03-18 | 2020-09-24 | 三菱電機株式会社 | Abnormality detection device, and abnormality detection method |
| JP2020536380A (en) | 2017-10-05 | 2020-12-10 | アプライド マテリアルズ インコーポレイテッドApplied Materials,Incorporated | Anomaly detection and classification |
| JP2021005191A (en) | 2019-06-26 | 2021-01-14 | 株式会社日立製作所 | Generation device, generation method, and generation program |
| WO2021064192A1 (en) | 2019-10-03 | 2021-04-08 | Koninklijke Philips N.V. | Monitoring performance of a predictive computer-implemented model |
| JP2021111034A (en) | 2020-01-08 | 2021-08-02 | 富士通株式会社 | Abnormality detection program, abnormality detection method, and information processing device |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH064789A (en) * | 1992-06-22 | 1994-01-14 | Hitachi Ltd | Method and device for monitoring abnormality of equipment |
-
2021
- 2021-10-01 JP JP2021162675A patent/JP7628926B2/en active Active
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010250769A (en) | 2009-04-20 | 2010-11-04 | Mitsubishi Electric Corp | Analysis result visualization apparatus, analysis result visualization method, and analysis result visualization program |
| JP2013205894A (en) | 2012-03-27 | 2013-10-07 | Oki Electric Ind Co Ltd | Abnormality detection device, program, and abnormality detection method |
| JP2020536380A (en) | 2017-10-05 | 2020-12-10 | アプライド マテリアルズ インコーポレイテッドApplied Materials,Incorporated | Anomaly detection and classification |
| WO2020188696A1 (en) | 2019-03-18 | 2020-09-24 | 三菱電機株式会社 | Abnormality detection device, and abnormality detection method |
| JP2021005191A (en) | 2019-06-26 | 2021-01-14 | 株式会社日立製作所 | Generation device, generation method, and generation program |
| WO2021064192A1 (en) | 2019-10-03 | 2021-04-08 | Koninklijke Philips N.V. | Monitoring performance of a predictive computer-implemented model |
| CN111046084A (en) | 2019-12-18 | 2020-04-21 | 重庆大学 | An association rule mining method for multivariate time series monitoring data |
| JP2021111034A (en) | 2020-01-08 | 2021-08-02 | 富士通株式会社 | Abnormality detection program, abnormality detection method, and information processing device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023053565A (en) | 2023-04-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7830489B2 (en) | Clinical endpoint determination system and method | |
| US8554580B2 (en) | Automated management of medical data using expert knowledge and applied complexity science for risk assessment and diagnoses | |
| EP2755154A2 (en) | Information processing apparatus, generating method, medical diagnosis support apparatus, and medical diagnosis support method | |
| Kodete et al. | Robust heart disease prediction: A hybrid approach to feature selection and model building | |
| Selvan et al. | [Retracted] An Image Processing Approach for Detection of Prenatal Heart Disease | |
| JP6379199B2 (en) | Data analysis apparatus, data analysis apparatus control method, and data analysis apparatus control program | |
| KR20180044739A (en) | Method and apparatus for optimizing rule using deep learning | |
| US20210295999A1 (en) | Patient state prediction apparatus, patient state prediction method, and patient state prediction program | |
| JP2021189585A (en) | Prediction device, prediction method, and prediction program | |
| JP7628926B2 (en) | Information processing device, information processing method, and information processing program | |
| JP2020135489A (en) | Healthcare data analyzer and healthcare data analysis method | |
| Sari et al. | Performance Analysis of Resampling and Ensemble Learning Methods on Diabetes Detection as Imbalanced Dataset | |
| TWI790479B (en) | Physiological status evaluation method and physiological status evaluation device | |
| Sinha et al. | CARDPSoML: Comparative approach to analyze and predict cardiovascular disease based on medical report data and feature fusion approach | |
| CN120473187A (en) | Liver function prediction method, device, electronic device and medium | |
| JP7245125B2 (en) | Generation device, generation method, and generation program | |
| WO2016121053A1 (en) | Computer system and graphical model management method | |
| Nisha et al. | Interpretable Machine Learning Models for Assisting Clinicians in the Analysis of Physiological Data. | |
| US20160239757A1 (en) | Chronological change prediction system | |
| Russell et al. | Machine learning for surgical risk assessment decision systems | |
| Brahimi et al. | Enhanced K-Nearest Neighbors for Smart Cardiovascular Disease Prediction in IoT System. | |
| Ali et al. | Predicting diabetes in libya using ai: A case study | |
| JP7778312B2 (en) | Verification device, verification method, and verification program | |
| Dermawan et al. | Multiclass Classification of Hypertension Severity Using Deep Learning: Modeling and Performance Evaluation of a Multilayer Perceptron Model | |
| Shwetabh et al. | A Pharmacy System Integrated with A Machine Learning Algorithm for Cardiovascular Disease Prediction |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240221 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241031 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241203 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250108 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250128 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250130 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7628926 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |